Khung hệ thống gợi ý hiển thị

Hệ thống gợi ý hiển thị trang chủ tùy biến theo từng cá nhân của Tmall bao gồm 3 cấu phần
(1) Recall module : Sẽ ưu tiên những thằng top ngành hàng liên quan nhất tới những sản phẩm mà bạn có nhu cầu ( click , xem nhiều, cho vào giỏ hàng)
(2) Sorting module: Tập trung vào những sản phẩm có tỉ lệ Click cao (CTR tốt)

(3) Mechanism module : Kiểm soát, cân bằng trafic , tối ưu hóa trải nghiệm người dùng, thay đổi thuật toán hiển thị và xắp xếp.

Phần 2 này sẽ nói kĩ Recall Module : ranki2i CF và Graph Embedding

The Recall Module


Ranki2i ( item to item collaborative filtering) Hệ thống gợi ý sản phẩm i2i được biết đến là thuật toán được sử dụng rộng rãi nhất. Nó tính toán điểm giống nhau giữa các sản phẩm dựa trên tần suất mà cả 2 sản phẩm được click đồng thời để thu được bảng i2i. Sau đó hệ thống sẽ truy vấn bảng i2i dựa trên hành vi của người dùng để mở rộng các sản phẩm khác mà người dùng quan tâm. Mặc dù thuật toán i2i-CF đơn giản tuy nhiên nó phải được tối ưu dựa trên rất nhiều dữ liệu thực tế và xóa được các dữ liệu nhiễu ví dụ đơn hàng ảo, traffic ảo, xác định khoảng thời gian hợp lý để xác định độ tương đồng cũng như việc suy giảm liên quan theo thời gian. Và đặc biệt chỉ xem xét các cặp sản phẩm cùng danh mục, chuẩn hóa có thể tối ưu hóa thuật toán i2i-CF
Hệ thống sẽ nhân các sự giống nhau (simscore) giữa các sản phẩm bằng tỷ lệ click mục tiêu. Sản phẩm sẽ được hiển thị khi mà sản phẩm đó có điểm giống nhau ( simscore ) đạt trong bảng i2i. Do đó bảng i2i không chỉ xem xét đồng thời CTR đồng thời của cả 2 sản phẩm mà còn xem xét cả CTR khi sản phẩm được hiển thị qua recall
Dựa trên dữ liệu CTR khủng khiếp của sàn và dữ liệu về CTR trong trang chủ, hệ thống có thể tính toán được bảng Ranki2i và lấy đó làm lõi cơ bản cho hệ thống truy suất. Khi người dùng truy cập vào trang chủ Tmall thì hệ thống cơ bán sẽ truy suất vào hệ thống Ali Basic Feature server (ABFS) và sử dụng bảng Ranki2i để lôi ra sản phẩm mà người dùng quan tâm đến
I2i CF tính toán sự giống nhau giữa 2 sản phẩm dựa trên tần xuất cả 2 sản phẩm được click cùng lúc. Nó vừa đơn giản lại hiệu quả cao cho việc xác định sự giống nhau và sự tương quan giữa việc người dùng click vào sản phẩm và các sản phẩm phù hợp của chúng. Ngày nay nó trở thành thuật toán recall được sử dụng rộng rãi nhất. Tuy nhiên thuật toán I2i CF, những sản phẩm gợi ý dựa duy nhất trên lịch sử hành vi của người dùng, không dựa trên khía cạnh thông tin chi tiết sản phẩm . Do đó, kết quả gợi ý sản phẩm sẽ rất yếu khoản khả năng mở rộng khám phá và đặc biệt không hiệu quả với các sản phẩm Longtail ( volume nhỏ bán ít / thị trường ngách ) . Hệ thống gợi ý sản phẩm chỉ cung cấp số lượng hạn chế những sản phẩm có điểm số liện quan cao dẫn đến bị hạn chế việc phát triển bền vững toàn hệ thống với hàng tỷ sản phẩm. Để giải quyết vấn đề này hệ thống có thêm thuật toán S3 graph embedding và Thuật toán MIND.

Graph Embedding

Graph Embedding là một công nghệ máy học chiếu các mạng phức tạo sang không gian đơn giản hơn. Thông thường công nghệ này sẽ vector hóa các nút mạng đảm bảo độ tương đồng của chúng gần với sự tương đồng của dữ liệu , cấu trúc liên hết
Thuật toán S3 Graph Embedding sẽ xây dựng hàng trăm tỷ những kết nối dựa trên hàng tỷ người dùng click vào hảng tỷ sản phẩm. Thuật toán còn sử dụng công nghệ tái tạo lại hành vi của người dùng cùng với việc đọc thông tin sản phẩm dần dần sẽ cải thiện khả năng máy học và có thể cố gắng vector hóa tất cả các sản phẩm trên cùng một nền tảng đo lường được. Vecsto này được sử dụng trực tiếp trong thuật toán I2i- CF để tính độ tương đồng của sản phẩm. Tuy nhiên không giống như thuật toán I2i CF cổ điển, thuật toán S3 Graph embedding có thể tính toán được độ giống nhau của sản phẩm mà không yêu cầu các nhấp chuột click đồng thời của 2 sản phẩm. và nó cũng có thêm các thông tin phụ để xử lý tốt hơn Long tail Product và những sản phẩm Cold-Start product
Dựa trên nền tảng Behemoth X2Vec, chúng tôi sử dụng dữ liệu CTR và thông tin bên sản phẩm trên mạng để xây dựng quá trình nhúng của tất cả các sản phẩm, tính toán biểu đồ nhúng bảng i2i và triển khai bảng trên công cụ cơ bản. Khi người dùng truy cập trang chủ Tmall, công cụ cơ bản truy xuất trình kích hoạt của người dùng từ ABFS và truy vấn biểu đồ nhúng bảng i2i để gọi lại các sản phẩm mà người dùng quan tâm.

Link phần 1: https://vuminhtra.com/thuong-mai-dien-tu/p1-he-thong-goi-y-hien-thi-trang-chu-hoat-dong-nhu-the-nao-tren-tmall-9-2019/
Hóng tiếp P3-P5

————-

Trà Bô, 2021

Khi share bài viết bạn nhớ cần post link nguồn và nhắn vào Zalo này -> https://zalo.me/g/ojjwlw410