Nếu không có thuật toán AI đề xuất nội dung này, các video ngắn với nội dung kích thích của TikTok sẽ khó phổ biến trên toàn thế giới như hiện nay.
TikTok giống như một cơn bão gây nghiện càn quét toàn cầu. Cùng với hàng tỷ người dùng trẻ cuốn theo cơn bão này, các mạng xã hội khổng lồ trên toàn cầu cũng phải chạy theo cơn bão do các clip ngắn trên TikTok gây ra. Nhưng cho đến thời điểm hiện tại, có vẻ như vẫn chưa ai có thể lặp lại cơn sốt gây nghiện mà TikTok đã tạo ra trong thời gian qua.
Đó là bởi các công ty đối thủ mới chỉ sao chép TikTok trong việc tạo ra các video ngắn, nhưng làm thế nào để người dùng “nghiện” lại là một câu chuyện hoàn toàn khác. Bí mật nằm ở thuật toán đề xuất nội dung cho người dùng. Nhưng vào tháng 9 gần đây, trong một động thái khiến nhiều người bất ngờ, Bytedance, công ty mẹ của TikTok, đã công bố thiết kế cho hệ thống đề xuất nội dung được sử dụng trong ứng dụng phổ biến này.
Đây là một phần trong nỗ lực của Bytedance nhằm biến hệ thống đề xuất nội dung này thành dịch vụ đăng ký đám mây dành cho khách hàng doanh nghiệp. Nhờ đó, thế giới có cái nhìn rõ ràng hơn về cách TikTok gây “nghiện” cho người dùng trên toàn cầu.
Monolith: Hệ thống AI đề xuất nội dung của TikTok
Trong khi thuật toán của Facebook dựa trên “biểu đồ xã hội” của người dùng hoặc mức độ tương tác của họ với những người khác, để đề xuất nội dung tương tự nhằm giữ chân người dùng. , thuật toán đề xuất của TikTok tập trung vào tương tác của người dùng với chính nội dung, được đặt tên là hệ thống Monolith.
Nhìn chung, kiến trúc của Monolith tuân theo thiết lập phân tán của TensorFlow – thư viện phần mềm nguồn mở của Google dành cho máy học và trí tuệ nhân tạo, được tạo ra để đào tạo học sâu. mạng lưới thần kinh nhân tạo.
Đối với Monolith, quá trình huấn luyện được chia thành 2 giai đoạn: huấn luyện sơ bộ (Batch Training) với dữ liệu đầu vào cho hệ thống và các thông số cơ bản. Những dữ liệu này được lấy từ các thông tin như cài đặt ngôn ngữ, quốc gia hoặc loại thiết bị.
Nhưng một phần quan trọng khác là lựa chọn ban đầu của người dùng đối với chủ đề video mà họ quan tâm. Từ những chủ đề này, TikTok cung cấp nhiều loại nội dung có liên quan như nhau – từ bài đăng của người dùng mới đến nội dung từ những người có ảnh hưởng.
Sau đó, hệ thống sẽ phân tích phản hồi của người dùng đối với nội dung đề xuất và đánh giá chất lượng của nội dung đó dựa trên các thông số bao gồm: số lượt thích, lượt xem, thời gian xem, số lượt bình luận, lượt đăng lại, lượt chia sẻ, lượt tăng người theo dõi, v.v. top 10% có số điểm cao nhất sẽ được ưu tiên hiển thị.
Nhưng không dừng lại ở đó, hệ thống Monolith còn trải qua quá trình đào tạo trực tuyến với dữ liệu liên tục được cung cấp theo thời gian thực. Sau khi một mô hình được xây dựng dựa trên dữ liệu đầu vào từ giai đoạn đào tạo sơ bộ, nó sẽ được cập nhật liên tục dựa trên dữ liệu đầu vào theo thời gian thực. Các thông số phản hồi của người dùng cũng được cập nhật và đồng bộ theo thời gian thực nên hệ thống có tác động gần như ngay lập tức đến người dùng.
Để đổi lấy khả năng đào tạo liên tục ở tốc độ cao, hệ thống Monolith được TikTok thiết kế với tỷ lệ lỗi cao hơn (fault Tolerance) – hay nói cách khác hãng chấp nhận giảm độ chính xác trong mô hình. cấu hình sao cho các tham số được đồng bộ hóa liên tục nhanh hơn, với băng thông mạng lớn hơn và kết quả thời gian thực đáng tin cậy hơn.
Tương tự như thuật toán đề xuất của Facebook, tương tác của người dùng với nội dung được đánh giá thông qua các hành vi khi thích, chia sẻ hoặc bình luận dưới một video. Nhưng yếu tố then chốt trong thuật toán của TikTok là thời gian người dùng xem video. Điều này được thể hiện trong chính tài liệu do TikTok xuất bản:
“ID chỉ dành ít thời gian (có video gợi ý) sẽ góp phần cải thiện chất lượng mô hình rất ítngoài các ID “có thời hạn sử dụng dài hiếm khi đóng góp vào mô hình hiện tại khi nhiều trong số chúng không bao giờ được truy cập. Điều này có thể là do người dùng không còn hoạt động hoặc video ngắn đã lỗi thời.”
Tuy các hành vi của người dùng như thích, chia sẻ, bình luận không phải lúc nào cũng xuất hiện trong mọi video đề xuất nên thời lượng xem video vẫn được TikTok coi là yếu tố chính để đánh giá mức độ của video. sở thích của người dùng cho video đó.
Hậu quả của thiết kế gây nghiện cho người dùng
Trên thực tế, mọi nền tảng truyền thông xã hội đều được thiết kế để giữ chân người dùng càng lâu càng tốt. Nhưng có thể thấy thuật toán đề xuất của TikTok được thiết kế để tập trung vào phản ứng của người dùng đối với nội dung hiển thị – thay vì dựa vào tương tác của người dùng như Facebook.
Điều này kéo theo một hệ quả khác của hệ thống gợi ý nội dung của TikTok cho người dùng: đó là duy trì tương tác của người dùng bằng cách “gây nghiện” cho họ. Còn cách nào tốt hơn để kéo dài thời gian xem video và tương tác với người dùng hơn là đề xuất nội dung kích thích chất hóa học dopamine trong não – một hợp chất được giải phóng mỗi khi bạn nhận được thứ gì đó kích hoạt phản ứng của mình. vui thích.
Trên thực tế, thiết kế giữ chân người dùng của TikTok tương tự như của YouTube. Nhưng điểm khác biệt nằm ở thiết kế giao diện của hai ứng dụng này. Mặc dù YouTube ban đầu được dành cho người dùng máy tính để bàn, nhưng sau đó, nó được thiết kế cho điện thoại thông minh, vì vậy các video dài với giao diện mặc định chỉ chiếm một phần màn hình để chừa không gian cho các đề xuất video khác. .
Còn với TikTok, các video rất ngắn, giao diện mặc định chiếm trọn màn hình điện thoại, thu hút mọi sự chú ý của người dùng. Với nội dung liên tục kích thích sự chú ý trong thời gian ngắn, chuỗi video liên tục như vậy có thể hút hết sự chú ý của người dùng, gần như thực sự “gây nghiện” khi khiến họ không thể rời mắt. từ màn hình điện thoại.
Việc theo đuổi càng gây nghiện cho người dùng sẽ không chỉ tạo ra những video có hình ảnh, âm thanh ngày càng hấp dẫn mà còn dẫn đến nhiều nội dung “rác” hoặc gây tranh cãi trong cộng đồng. Khi thu hút được nhiều tương tác, hệ thống đề xuất của TikTok sẽ nhanh chóng đưa nó lên đầu nội dung ưu tiên hiển thị và lan truyền rộng rãi đến những người dùng khác – bất kể họ là ai hay mối quan hệ của họ. tâm là gì.
Mặc dù TikTok thường xuyên phải gỡ bỏ một số lượng lớn video vi phạm “Tiêu chuẩn cộng đồng” của mình. Chỉ riêng trong quý 2 năm 2022, TikTok cho biết họ đã xóa 113 triệu video vi phạm. Đây là mức tăng khủng khi trong 6 tháng cuối năm 2019, số lượng video bị xóa khỏi nền tảng này chỉ là 49 triệu. Số lượng video bị xóa cho thấy tốc độ phát triển của nội dung rác trên nền tảng này lớn đến mức nào. Hơn nữa, con số này chưa bao gồm vô số nội dung spam khác chưa được phát hiện và loại bỏ trước khi được phát tán rộng rãi trên nền tảng.
Link nguồn: https://cafebiz.vn/ben-trong-thuat-toan-cua-tiktok-nguoi-dung-bi-gay-nghien-nhu-the-nao-176221210095142058.chn