18/4/2025 –
Dịch từ Pandaily https://pandaily.com/p/douyins-algorithm-transparency-drive

Trong một động thái mang tính đột phá đối với ngành công nghệ Trung Quốc, Douyin (phiên bản TikTok tại Trung Quốc) đã lần đầu tiên công khai chi tiết về thuật toán đề xuất của mình. Vào cuối tháng 3/2025, Douyin đã ra mắt một trang web mới mang tên “Trung tâm An toàn và Tin cậy” (95152.douyin.com), nơi công khai các nguyên tắc hoạt động của thuật toán, chính sách kiểm duyệt nội dung và cơ chế đảm bảo an toàn cho người dùng.

Chủ tịch Douyin – Hàn Thượng Hữu (Han Shangyou) – đã giới thiệu sáng kiến này tại một diễn đàn, xem đây là một phần trong 10 biện pháp nhằm minh bạch hóa nền tảng và kêu gọi sự giám sát từ công chúng. Báo cáo này tổng hợp thông tin từ các nguồn tiếng Trung – bao gồm bài viết minh bạch của chính Douyin – để giải thích cách thức hoạt động của hệ thống đề xuất của Douyin, cách nền tảng xử lý các mối lo ngại như “bong bóng lọc”, quyền riêng tư dữ liệu, và thậm chí là tin đồn giám sát. Đây là những thông tin hiếm hoi từ nội bộ Trung Quốc, hé lộ bí mật đằng sau một trong những ứng dụng có ảnh hưởng nhất thế giới.


Mở màn: Trung tâm An toàn và Tin cậy của Douyin

Trang web mới của Douyin đánh dấu lần đầu tiên công ty hé lộ “hộp đen” thuật toán của mình trước công chúng. Trang web – lấy theo số điện thoại đường dây nóng 95152 – đã được đưa vào hoạt động thử nghiệm và được công bố trong một sự kiện tại Bắc Kinh vào ngày 15/4.

Tại sự kiện, các quan chức Douyin đã giới thiệu các mục nội dung trên website, giải đáp những câu hỏi nóng về thuật toán và quản trị nền tảng. Họ nhấn mạnh rằng thuật toán đề xuất không phải là phép màu, mà là bộ lọc thông tin hiệu quả được vận hành bởi AI và máy học, luôn có sự kiểm soát của con người và chính sách đi kèm.

Thông điệp rõ ràng là: thuật toán có thể được thiết kế, hiểu được và cải tiến – nó không phải là thứ bí ẩn không thể đụng đến. Việc công khai hoạt động nội bộ nhằm tái xây dựng niềm tin người dùng và tạo hình mẫu minh bạch trong ngành. Douyin cũng khẳng định sẽ tiếp nhận ý kiến đóng góp từ người dùng thông qua trung tâm này và cả đường dây nóng riêng dành cho thuật toán – cho thấy nền tảng sẵn sàng đón nhận sự giám sát và phản hồi công khai.


Thuật toán đề xuất của Douyin hoạt động như thế nào

Về cốt lõi, hệ thống đề xuất của Douyin học hỏi từ hành vi người dùng. Mỗi lần bạn xem, thích, chia sẻ hoặc bỏ qua một video, bạn đang cung cấp tín hiệu cho thuật toán.

Douyin giải thích rằng mô hình AI của họ phân tích hành vi của người dùng – như lượt nhấp, lượt xem, lượt thích, chia sẻ, đánh dấu yêu thích – để xây dựng mô hình dự đoán cá nhân. Dựa trên tương tác trong quá khứ, đặc điểm của video, và ngữ cảnh, hệ thống dự đoán loại nội dung mà bạn sẽ tương tác nhiều nhất

.

Không giống như các hệ thống cũ từng dựa nhiều vào gắn thẻ thủ công, thuật toán hiện tại ít dùng nhãn hoặc phân loại nội dung thủ công, thay vào đó dùng mạng nơ-ron sâu để đánh giá nội dung và hành vi trực tiếp, từ đó tính toán “giá trị” tổng thể mà người dùng nhận được khi xem một video.

Nói cách khác, AI của Douyin không dựa vào biên tập viên hay quy tắc cố định, mà là máy học tự động gợi ý nội dung phù hợp nhất.


Mô hình học sâu tiên tiến

Douyin tiết lộ họ sử dụng các mô hình deep learning hiện đại như:

  • Wide & Deep Model (phổ biến bởi Google): kết hợp ghi nhớ các sở thích cũ và khái quát hóa cho nội dung mới.
  • Two-Tower Model (Mô hình hai trụ): giúp giai đoạn “truy xuất” (recall) tốt hơn, bằng cách học riêng biệt biểu diễn của người dùng và video, rồi ghép nối chúng.

Các mô hình này giúp Douyin sàng lọc hàng triệu video và đề xuất những nội dung phù hợp với từng người dùng một cách nhanh chóng và chính xác.


Chấm điểm video: Quy tắc ưu tiên đề xuất

Làm thế nào để Douyin chọn video tiếp theo để hiển thị cho bạn?

Douyin mô tả công thức ưu tiên đề xuất như sau:
Xác suất người dùng thực hiện hành động × Trọng số giá trị hành động = Điểm ưu tiên của video

Nghĩa là thuật toán dự đoán bạn sẽ làm gì với video đó (xem hết, thích, chia sẻ…), rồi nhân với mức độ “giá trị” của hành động đó. Video có điểm cao hơn sẽ được ưu tiên đẩy lên feed.

Douyin cũng nhấn mạnh rằng: thuật toán chỉ dự đoán hành vi người dùng, không đánh giá đúng/sai hay chất lượng nội dung. Mọi thứ đều là mô hình thống kê hành vi, không phải “AI hiểu nội dung như con người”.


Tín hiệu từ hành vi người dùng

Thuật toán của Douyin theo dõi rất nhiều dạng hành vi, ví dụ:

  • Thích hay không thích video
  • Theo dõi người đăng
  • Đánh dấu video yêu thích
  • Chia sẻ video
  • Bình luận hoặc chỉ bấm vào phần bình luận
  • Xem hết hay chỉ xem một phần
  • Tìm kiếm lại video hoặc xem lại sau

Mỗi hành vi này được gán trọng số dương hoặc âm, ví dụ:

  • Xem hết video = tín hiệu tích cực
  • Bấm “Không quan tâm” = tín hiệu tiêu cực
  • Lượt thích mạnh hơn không phản ứng gì

Quan trọng hơn, hệ thống cập nhật gần như theo thời gian thực – từng phút. Mỗi hành vi của bạn đều giúp thuật toán tái học hỏi và điều chỉnh đề xuất liên tục.


Hệ thống đa mục tiêu: Cân bằng giữa tương tác, chất lượng và đa dạng

Một điểm nhấn trong báo cáo minh bạch là: Douyin hiện tối ưu thuật toán theo nhiều mục tiêu, không còn chỉ tập trung vào tỷ lệ xem hết video như trước đây.

Ban đầu, khi video chỉ dài 15 giây, thuật toán tối ưu theo tỷ lệ hoàn thành video. Nhưng khi nội dung trở nên phong phú hơn (video dài, giáo dục, vlog…), Douyin đã chuyển sang hệ thống đa mục tiêu (multi-objective learning).

Các mục tiêu có thể bao gồm:

  • Tương tác ngắn hạn (click, thích)
  • Sự hài lòng dài hạn của người dùng
  • Chất lượng nội dung
  • Sự đa dạng nội dung

Douyin cho rằng cách tiếp cận này tạo ra một “win-win” cho tất cả: người dùng, nhà sáng tạo nội dung, nền tảng và cả xã hội.