Ban đầu, DSS được xem như một hệ thống tương tác máy tính, hỗ trợ người dùng trong việc sử dụng dữ liệu và các mô hình để giải quyết những vấn đề phức tạp, không có cấu trúc.. o Đưa ra n
Trang 1ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
TRUNG TÂM PHÁT TRIỂN CÔNG NGHỆ THÔNG TIN
BÁO CÁO MÔN HỌC
HỆ HỖ TRỢ RA QUYẾT ĐỊNH
Đề tài
HỆ THỐNG GỢI Ý CỦA NETFLIX TRONG
DỮ LIỆU LỚN
Giảng viên hướng dẫn: Nguyễn Hồ Duy Trí
Danh sách nhóm sinh viên thực hiện:
1 Tống Minh Sang – MSSV: 23410183
2 Mai Văn Quân – MSSV: 23410179
3 Huỳnh Nhật Khánh – MSSV: 23410160
Trang 2CHƯƠNG I MỞ ĐẦU
Hiện nay, nước ta đang tích cực ứng dụng những thành tựu của Công nghệ thông tin vào đời sống Các công nghệ như Internet, Trí tuệ nhân tạo, Hệ chuyên gia, và Cơ sở dữ liệu đã và đang mang lại những lợi ích to lớn cho xã hội Tuy nhiên, có những ứng dụng mới, cần nhận được sự quan tâm và đóng góp của cộng đồng, tiêu biểu là Hệ trợ giúp quyết định (DSS) Người tiên phong trong lĩnh vực này là nhà khoa học máy tính Scott-Morton từ những năm 1970 Ban đầu, DSS được xem như một hệ thống tương tác máy tính, hỗ trợ người dùng trong việc sử dụng dữ liệu và các mô hình để giải quyết những vấn đề phức tạp, không có cấu trúc
DSS ban đầu được phát triển và ứng dụng vào hầu hết các lĩnh vực của cuộc sống, ngày càng trở thành một “trợ lý máy tính” với các đặc tính quý báu như chính xác, tốc độ tính toán nhanh, khả năng ghi nhớ lớn, trung thành và không biết mệt mỏi Những đặc tính này đặc biệt phù hợp với một xã hội hiện đại đầy biến động
Nhận thức được tầm quan trọng của việc ra quyết định và sự phát triển mạnh mẽ của công nghệ, DSS đã được phát triển để giúp các doanh nghiệp đưa ra các quyết định hiệu quả hơn, góp phần tối đa hóa lợi nhuận
Với lý do đó, nhóm chúng em đã chọn đề tài “Ứng dụng công cụ hỗ trợ ra quyết định trong kinh doanh cửa hàng gà rán của công ty cổ phần Barun Vina” nhằm nghiên cứu cách thức hoạt động của hệ hỗ trợ ra quyết định trong thực tiễn và đánh giá tính khả thi của hệ thống này Từ đó, chúng em mong muốn tạo ra cơ sở hỗ trợ cho các đồ án và công việc cần áp dụng DSS một cách hiệu quả
Trang 3Mục lục
CHƯƠNG I MỞ ĐẦU 2
CHƯƠNG II CÁC KHÁI NIỆM CƠ BẢN VỀ HỆ THỐNG GỢI Ý (RECOMMENDATION SYSTEM) 7
CHƯƠNG III PHƯƠNG PHÁP GỢI Ý CỦA NETFLIX 11
CHƯƠNG IV QUY TRÌNH HOẠT ĐỘNG CỦA HỆ THỐNG GỢI Ý NETFLIX 15
CHƯƠNG V CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN HỆ THỐNG GỢI Ý CỦA NETFLIX .18
CHƯƠNG VI ĐÁNH GIÁ VÀ TỐI ƯU HÓA HỆ THỐNG GỢI Ý 20
CHƯƠNG VII NHỮNG XU HƯỚNG MỚI TRONG CÔNG NGHỆ GỢI Ý 22
CHƯƠNG VIII KẾT LUẬN 25
CHƯƠNG IX TÀI LIỆU THAM KHẢO 26
Trang 4LỜI CẢM ƠN
Trước hết, em xin gửi lời cảm ơn chân thành đến các thầy cô, những người đã tạo điều kiện để em thực hiện đề tài này Đây là cơ hội quý báu để em và các bạn sinh viên khoa Công nghệ Thông tin có dịp vận dụng những kiến thức đã học vào thực tế.
Em xin chân thành cảm ơn sự hỗ trợ tận tình từ trường Đại học Công nghệ Thông tin, đặc biệt là thầy Nguyễn Hồ Duy Trí, người đã nhiệt tình hướng dẫn và hỗ trợ nhóm em trong suốt quá trình thực hiện đề tài.
Em cũng xin gửi lời cảm ơn sâu sắc đến các bạn đã hết lòng giúp đỡ, góp ý và đóng góp những nhận xét quý báu trong suốt thời gian em hoàn thành đề tài này.
Dù đã nỗ lực tìm tòi và học hỏi, nhưng những thiếu sót vẫn có thể không tránh khỏi, rất mong nhận được ý kiến đóng góp của thầy và bạn bè để em hoàn thiện hơn.
Một lần nữa, xin chân thành cảm ơn thầy và các bạn!
TP Hồ Chí Minh, tháng 11 năm 2024.
Trang 5CHƯƠNG I: GIỚI THIỆU
1.1 Tổng quan về Netflix
Giới thiệu chung về Netflix:
o Netflix là một dịch vụ phát trực tuyến (streaming service) phổ biến, cung cấp các
bộ phim, chương trình truyền hình, tài liệu và nội dung gốc Người dùng có thể truy cập Netflix từ nhiều thiết bị như TV thông minh, máy tính, điện thoại di động, máy tính bảng, và thiết bị phát trực tuyến khác
o Được thành lập vào năm 1997 bởi Reed Hastings và Marc Randolph tại
California, Netflix ban đầu là một dịch vụ cho thuê DVD qua bưu điện, nhưng đãchuyển mình thành một nền tảng streaming vào năm 2007, khi lần đầu tiên cho phép người dùng xem các chương trình truyền hình và phim trực tuyến
o Ngày nay, Netflix có hơn 200 triệu người đăng ký toàn cầu và là một trong những công ty công nghệ lớn nhất thế giới, với một bộ sưu tập nội dung phong phú và hệ thống gợi ý mạnh mẽ, giúp cá nhân hóa trải nghiệm của người dùng
Mục tiêu của Netflix:
o Netflix không chỉ cung cấp dịch vụ giải trí mà còn chú trọng vào việc mang đến cho người dùng những gợi ý nội dung phù hợp, giúp họ tìm thấy chương trình và phim mà họ sẽ yêu thích, từ đó giữ chân người dùng và tối ưu hóa trải nghiệm người dùng
1.2 Tầm quan trọng của hệ thống gợi ý trong dịch vụ Netflix
Lý do hệ thống gợi ý quan trọng đối với Netflix:
o Với số lượng nội dung khổng lồ trên nền tảng (hàng nghìn bộ phim, chương trìnhtruyền hình, tài liệu, và các series gốc), người dùng dễ bị choáng ngợp bởi sự đa dạng và không biết chọn gì tiếp theo Hệ thống gợi ý của Netflix giúp giải quyết vấn đề này bằng cách cá nhân hóa các đề xuất dựa trên sở thích và hành vi của người dùng
o Tối ưu hóa trải nghiệm người dùng: Các hệ thống gợi ý đóng vai trò quan
trọng trong việc tạo ra một trải nghiệm người dùng mượt mà, giúp người dùng tiết kiệm thời gian tìm kiếm nội dung, đồng thời cải thiện sự hài lòng và khả năngquay lại sử dụng dịch vụ
o Duy trì và gia tăng số lượng người dùng: Các gợi ý chính xác và phù hợp giúp
giảm tỷ lệ người dùng hủy dịch vụ (churn rate), qua đó giúp Netflix giữ chân khách hàng và gia tăng sự trung thành của người dùng
o Khả năng tối ưu hóa các chiến lược marketing: Hệ thống gợi ý cũng giúp
Netflix phân tích hành vi người dùng để tối ưu hóa các chiến lược quảng cáo và tiếp thị nội dung
Thách thức đối với hệ thống gợi ý của Netflix:
o Với số lượng người dùng lớn và đa dạng, việc tạo ra các gợi ý cá nhân hóa cho từng người dùng, dựa trên lịch sử xem, đánh giá và hành vi, đòi hỏi một hệ thốngcực kỳ tinh vi và thông minh
Trang 6o Một thách thức khác là làm sao để duy trì sự mới mẻ và không gây nhàm chán cho người dùng, mặc dù hệ thống gợi ý đã biết được sở thích của họ.
1.3 Mục tiêu và mục đích của báo cáo
Mục tiêu của báo cáo:
o Mục tiêu của báo cáo này là phân tích và làm rõ cách thức hoạt động của hệ thống gợi ý của Netflix, từ những công nghệ cơ bản đến các thuật toán và mô hình học máy (machine learning) được sử dụng để cá nhân hóa các gợi ý
o Báo cáo cũng sẽ tìm hiểu về cách mà Netflix sử dụng dữ liệu người dùng và các
kỹ thuật phân tích để tạo ra một trải nghiệm người dùng tối ưu và duy trì sự hài lòng lâu dài
Mục đích:
o Cung cấp cái nhìn sâu sắc về cách thức hoạt động của hệ thống gợi ý của Netflix
và những tác động của nó đối với người dùng và công ty
o Đưa ra những phân tích về các phương pháp gợi ý được Netflix áp dụng, đồng thời thảo luận về những thách thức và cơ hội trong việc cải tiến hệ thống gợi ý đểđáp ứng nhu cầu ngày càng cao của người dùng
Trang 7CHƯƠNG II CÁC KHÁI NIỆM CƠ BẢN VỀ HỆ THỐNG
GỢI Ý (RECOMMENDATION SYSTEM)
2.1 Định nghĩa và vai trò của hệ thống gợi ý
Hệ thống gợi ý là gì?
o Hệ thống gợi ý (Recommendation System) là một công cụ dùng để dự đoán và
cung cấp các sản phẩm, dịch vụ, hay nội dung phù hợp cho người dùng, dựa trên
sở thích, hành vi, hoặc các thông tin liên quan đến người dùng và sản phẩm
o Hệ thống gợi ý có thể sử dụng các thuật toán phân tích dữ liệu và học máy (machine learning) để tạo ra các đề xuất cá nhân hóa, nhằm cải thiện trải nghiệm người dùng
Vai trò của hệ thống gợi ý:
o Cải thiện trải nghiệm người dùng: Các hệ thống gợi ý giúp người dùng khám
phá nội dung phù hợp với sở thích cá nhân mà họ có thể không tìm thấy một cáchthủ công
o Tăng tính tương tác và sự hài lòng của người dùng: Hệ thống gợi ý cá nhân
hóa giúp người dùng cảm thấy được chú ý và phục vụ một cách tốt nhất, từ đó tăng cường sự hài lòng và giữ chân khách hàng
o Tăng doanh thu và tối ưu hóa dịch vụ: Các hệ thống gợi ý không chỉ làm tăng
sự hài lòng của người dùng mà còn giúp các công ty tối ưu hóa các chiến lược tiếp thị và quảng bá sản phẩm
2.2 Các loại hệ thống gợi ý
Hệ thống gợi ý có thể được phân loại theo nhiều cách khác nhau, nhưng phổ biến nhất là dựa vào cách chúng hoạt động và các thuật toán mà chúng sử dụng Sau đây là ba loại hệ thống gợi ý phổ biến:
2.2.1 Hệ thống gợi ý dựa trên nội dung (Content-based filtering)
Khái niệm:
o Hệ thống gợi ý dựa trên nội dung sử dụng các đặc điểm của sản phẩm hoặc nội dung (chẳng hạn như thể loại phim, diễn viên, đạo diễn) để tìm kiếm và gợi ý cácsản phẩm tương tự mà người dùng có thể thích
Cách hoạt động:
o Phân tích nội dung của các sản phẩm đã được người dùng tương tác (chẳng hạn như phim đã xem) và tìm các đặc điểm chung (như thể loại, mô tả) để gợi ý các sản phẩm khác có cùng đặc điểm
o Ví dụ: Nếu người dùng thích các bộ phim hành động, hệ thống có thể gợi ý các
bộ phim hành động khác
Ưu điểm:
o Không cần nhiều dữ liệu người dùng, chỉ cần dữ liệu mô tả sản phẩm
o Dễ dàng hiểu và triển khai
Nhược điểm:
o Không thể đề xuất những sản phẩm mới hoặc ít thông tin
o Thiếu tính sáng tạo và đổi mới trong các đề xuất (chỉ dựa vào sở thích đã biết)
Trang 82.2.2 Hệ thống gợi ý dựa trên cộng đồng (Collaborative filtering)
Khái niệm:
o Hệ thống gợi ý dựa trên cộng đồng sử dụng hành vi và sự tương tác của người dùng khác để dự đoán sở thích của người dùng Phương pháp này không quan tâm đến nội dung của sản phẩm mà chỉ tập trung vào dữ liệu hành vi của người dùng
Cách hoạt động:
o User-based Collaborative Filtering: Gợi ý các sản phẩm mà người dùng tương
tự (có hành vi xem giống nhau) đã thích hoặc đánh giá cao
o Item-based Collaborative Filtering: Gợi ý các sản phẩm có sự tương tự cao với
những sản phẩm mà người dùng đã thích trong quá khứ
o Cần có một lượng lớn dữ liệu người dùng để hệ thống có thể hoạt động hiệu quả
o Vấn đề "Cold Start": Khó khăn trong việc gợi ý cho người dùng mới hoặc sản phẩm mới không có dữ liệu
2.2.3 Hệ thống gợi ý kết hợp (Hybrid Systems)
Khái niệm:
o Hệ thống gợi ý kết hợp là sự kết hợp của các phương pháp khác nhau (như content-based filtering và collaborative filtering) để tận dụng ưu điểm và khắc phục nhược điểm của từng phương pháp
Cách hoạt động:
Trang 9o Hệ thống sử dụng cả dữ liệu về người dùng và nội dung sản phẩm để đưa ra các
đề xuất chính xác hơn Ví dụ, hệ thống có thể sử dụng phương pháp collaborativefiltering để tìm những người dùng có sở thích giống nhau và sau đó sử dụng content-based filtering để gợi ý sản phẩm tương tự dựa trên mô tả sản phẩm
Ưu điểm:
o Khắc phục được nhiều nhược điểm của các phương pháp đơn lẻ
o Cải thiện độ chính xác của các đề xuất
Nhược điểm:
o Phức tạp hơn trong việc triển khai và tính toán
2.3 Các thuật toán cơ bản trong hệ thống gợi ý
Để xây dựng các hệ thống gợi ý, người ta sử dụng một số thuật toán học máy cơ bản, trong đó phổ biến nhất là:
2.3.1 Matrix Factorization (Phân tích ma trận)
Đây là một kỹ thuật mạnh mẽ thường được sử dụng trong các hệ thống gợi ý
collaborative filtering Nó cố gắng giảm số lượng chiều trong dữ liệu để phát hiện các mối quan hệ tiềm ẩn giữa người dùng và các sản phẩm
Một ví dụ điển hình của phương pháp này là Singular Value Decomposition (SVD).
2.3.2 K-means Clustering
Phương pháp phân cụm này giúp phân nhóm người dùng hoặc sản phẩm có đặc điểm tương tự nhau, từ đó đưa ra các gợi ý dựa trên các nhóm này
Trang 102.3.3 Nearest Neighbors
Thuật toán K-Nearest Neighbors (KNN) được sử dụng để tìm kiếm các sản phẩm hoặc
người dùng tương tự nhất dựa trên các đặc điểm đã biết (chẳng hạn như điểm đánh giá hoặc lịch sử xem)
2.4 Các yếu tố ảnh hưởng đến chất lượng hệ thống gợi ý
Dữ liệu người dùng: Hệ thống gợi ý hoạt động tốt khi có đủ dữ liệu từ người dùng, bao
gồm hành vi xem, đánh giá sản phẩm, và các tương tác khác
Trang 11 Sự đa dạng và phong phú của dữ liệu sản phẩm: Sự phong phú trong các đặc điểm của
sản phẩm sẽ giúp hệ thống gợi ý dễ dàng phân loại và đưa ra những gợi ý chính xác hơn
Tính cá nhân hóa: Mức độ cá nhân hóa của hệ thống gợi ý có thể ảnh hưởng trực tiếp
đến hiệu quả và sự hài lòng của người dùng
CHƯƠNG III PHƯƠNG PHÁP GỢI Ý CỦA NETFLIX
3.1 Tổng quan về hệ thống gợi ý của Netflix
Netflix sử dụng một hệ thống gợi ý mạnh mẽ để cung cấp các đề xuất phim, chương trình truyền hình và nội dung khác cho người dùng Hệ thống gợi ý này là yếu tố quan trọng trong chiến lược giữ chân khách hàng, giúp nâng cao trải nghiệm người dùng và tối ưu hóa việc khám phá nội dung.
Mục tiêu của hệ thống gợi ý Netflix:
o Tăng mức độ hài lòng của người dùng bằng cách đưa ra các gợi ý cá nhân hóa, giúp người dùng dễ dàng tìm thấy các chương trình phù hợp với sở thích của họ
o Duy trì và giảm tỷ lệ người dùng hủy dịch vụ (churn rate) bằng cách cung cấp những đề xuất chính xác, làm tăng thời gian sử dụng và mức độ gắn kết của người dùng
Đặc điểm nổi bật của hệ thống gợi ý của Netflix:
o Cá nhân hóa mạnh mẽ: Hệ thống gợi ý dựa vào hành vi người dùng để đưa ra
các gợi ý, bao gồm lịch sử xem, đánh giá, và các loại nội dung đã được yêu thích trước đó
o Đề xuất ngẫu nhiên và đa dạng: Bên cạnh việc gợi ý các nội dung tương tự, hệ
thống còn khám phá các thể loại và nội dung mới để người dùng có thể tìm thấy các bộ phim và chương trình ít nổi bật nhưng thú vị
3.2 Các phương pháp gợi ý của Netflix
Netflix kết hợp nhiều phương pháp gợi ý khác nhau để cung cấp các đề xuất tối ưu cho
người dùng Các phương pháp chính mà Netflix sử dụng bao gồm Collaborative
Filtering (Lọc hợp tác), Content-Based Filtering (Lọc dựa trên nội dung) , và
Hybrid Systems (Phương pháp lai).
3.2.1 Collaborative Filtering (Lọc hợp tác)
Khái niệm:
o Phương pháp Collaborative Filtering dựa trên hành vi và sự tương tác của người dùng để đưa ra các gợi ý Thay vì tập trung vào nội dung sản phẩm, phương phápnày sử dụng dữ liệu từ người dùng khác để tìm ra những sản phẩm mà người dùng có thể thích
Cách hoạt động:
Trang 12o User-based Collaborative Filtering: So sánh người dùng với những người dùng
khác có hành vi tương tự (chẳng hạn như xem phim giống nhau) và đưa ra các gợi ý dựa trên những sản phẩm mà những người dùng tương tự đã thích
o Item-based Collaborative Filtering: So sánh các sản phẩm với nhau để tìm ra
những sản phẩm có sự tương tự cao Sau đó, hệ thống sẽ đề xuất các sản phẩm có
sự tương tự cao với những sản phẩm mà người dùng đã xem trước đó
Ưu điểm:
o Không cần phân tích nội dung chi tiết của sản phẩm
o Có thể phát hiện các xu hướng ẩn và những đề xuất bất ngờ mà người dùng có thể thích
Nhược điểm:
o Vấn đề Cold Start: Khó khăn khi hệ thống phải đưa ra gợi ý cho người dùng
mới hoặc sản phẩm mới không có đủ dữ liệu
o Lượng dữ liệu người dùng: Phải có đủ dữ liệu người dùng để phương pháp này
hoạt động hiệu quả
3.2.2 Content-Based Filtering (Lọc dựa trên nội dung)
Khái niệm:
o Phương pháp Content-Based Filtering dựa vào đặc điểm nội dung của sản phẩm
để đưa ra các gợi ý Ví dụ, nếu người dùng đã xem một bộ phim hành động, hệ thống sẽ đề xuất các bộ phim hành động khác
Cách hoạt động:
o Hệ thống phân tích các đặc điểm của nội dung (như thể loại, đạo diễn, diễn viên, năm sản xuất) và so sánh chúng với các sản phẩm khác mà người dùng đã xem hoặc thích
Trang 13o Các đề xuất có thể bị giới hạn trong các thể loại mà người dùng đã tương tác nhiều.
3.2.3 Hybrid Systems (Hệ thống kết hợp)
Khái niệm:
o Hệ thống kết hợp là sự kết hợp của các phương pháp Collaborative Filtering và Content-Based Filtering Điều này giúp tận dụng ưu điểm của cả hai phương pháp và giảm bớt các nhược điểm của từng phương pháp riêng lẻ
Cách hoạt động:
o Hệ thống gợi ý của Netflix sử dụng Hybrid Systems để kết hợp dữ liệu về hành
vi người dùng và các đặc điểm của nội dung sản phẩm Điều này giúp hệ thống đưa ra các gợi ý chính xác hơn, đồng thời khai thác được cả thông tin về người dùng và sản phẩm
Ưu điểm:
o Kết hợp được các phương pháp và cung cấp các đề xuất chính xác hơn
o Giảm thiểu vấn đề Cold Start và tăng khả năng dự đoán cho người dùng mới
Nhược điểm:
o Phức tạp hơn trong việc triển khai và tính toán
3.3 Thuật toán Matrix Factorization
Khái niệm:
o Matrix Factorization là một kỹ thuật mạnh mẽ trong Collaborative Filtering,
đặc biệt là với dữ liệu thưa thớt (sparse data), như dữ liệu người dùng đánh giá phim Thuật toán này phân tích ma trận các đánh giá của người dùng và tìm ra