1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Báo cáo môn học hệ hỗ trợ ra quyết Định Đề tài hệ thống gợi Ý của netflix trong dữ liệu lớn

26 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Hệ thống gợi ý của netflix trong dữ liệu lớn
Tác giả Tống Minh Sang, Mai Văn Quân, Huỳnh Nhật Khánh
Người hướng dẫn Nguyễn Hồ Duy Trí
Trường học Đại học Quốc gia TP.Hồ Chí Minh
Chuyên ngành Công nghệ thông tin
Thể loại báo cáo
Năm xuất bản 2024
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 26
Dung lượng 1,44 MB

Nội dung

Ban đầu, DSS được xem như một hệ thống tương tác máy tính, hỗ trợ người dùng trong việc sử dụng dữ liệu và các mô hình để giải quyết những vấn đề phức tạp, không có cấu trúc.. o Đưa ra n

Trang 1

ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

TRUNG TÂM PHÁT TRIỂN CÔNG NGHỆ THÔNG TIN

BÁO CÁO MÔN HỌC

HỆ HỖ TRỢ RA QUYẾT ĐỊNH

Đề tài

HỆ THỐNG GỢI Ý CỦA NETFLIX TRONG

DỮ LIỆU LỚN

Giảng viên hướng dẫn: Nguyễn Hồ Duy Trí

Danh sách nhóm sinh viên thực hiện:

1 Tống Minh Sang – MSSV: 23410183

2 Mai Văn Quân – MSSV: 23410179

3 Huỳnh Nhật Khánh – MSSV: 23410160

Trang 2

CHƯƠNG I MỞ ĐẦU

Hiện nay, nước ta đang tích cực ứng dụng những thành tựu của Công nghệ thông tin vào đời sống Các công nghệ như Internet, Trí tuệ nhân tạo, Hệ chuyên gia, và Cơ sở dữ liệu đã và đang mang lại những lợi ích to lớn cho xã hội Tuy nhiên, có những ứng dụng mới, cần nhận được sự quan tâm và đóng góp của cộng đồng, tiêu biểu là Hệ trợ giúp quyết định (DSS) Người tiên phong trong lĩnh vực này là nhà khoa học máy tính Scott-Morton từ những năm 1970 Ban đầu, DSS được xem như một hệ thống tương tác máy tính, hỗ trợ người dùng trong việc sử dụng dữ liệu và các mô hình để giải quyết những vấn đề phức tạp, không có cấu trúc

DSS ban đầu được phát triển và ứng dụng vào hầu hết các lĩnh vực của cuộc sống, ngày càng trở thành một “trợ lý máy tính” với các đặc tính quý báu như chính xác, tốc độ tính toán nhanh, khả năng ghi nhớ lớn, trung thành và không biết mệt mỏi Những đặc tính này đặc biệt phù hợp với một xã hội hiện đại đầy biến động

Nhận thức được tầm quan trọng của việc ra quyết định và sự phát triển mạnh mẽ của công nghệ, DSS đã được phát triển để giúp các doanh nghiệp đưa ra các quyết định hiệu quả hơn, góp phần tối đa hóa lợi nhuận

Với lý do đó, nhóm chúng em đã chọn đề tài “Ứng dụng công cụ hỗ trợ ra quyết định trong kinh doanh cửa hàng gà rán của công ty cổ phần Barun Vina” nhằm nghiên cứu cách thức hoạt động của hệ hỗ trợ ra quyết định trong thực tiễn và đánh giá tính khả thi của hệ thống này Từ đó, chúng em mong muốn tạo ra cơ sở hỗ trợ cho các đồ án và công việc cần áp dụng DSS một cách hiệu quả

Trang 3

Mục lục

CHƯƠNG I MỞ ĐẦU 2

CHƯƠNG II CÁC KHÁI NIỆM CƠ BẢN VỀ HỆ THỐNG GỢI Ý (RECOMMENDATION SYSTEM) 7

CHƯƠNG III PHƯƠNG PHÁP GỢI Ý CỦA NETFLIX 11

CHƯƠNG IV QUY TRÌNH HOẠT ĐỘNG CỦA HỆ THỐNG GỢI Ý NETFLIX 15

CHƯƠNG V CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN HỆ THỐNG GỢI Ý CỦA NETFLIX .18

CHƯƠNG VI ĐÁNH GIÁ VÀ TỐI ƯU HÓA HỆ THỐNG GỢI Ý 20

CHƯƠNG VII NHỮNG XU HƯỚNG MỚI TRONG CÔNG NGHỆ GỢI Ý 22

CHƯƠNG VIII KẾT LUẬN 25

CHƯƠNG IX TÀI LIỆU THAM KHẢO 26

Trang 4

LỜI CẢM ƠN

Trước hết, em xin gửi lời cảm ơn chân thành đến các thầy cô, những người đã tạo điều kiện để em thực hiện đề tài này Đây là cơ hội quý báu để em và các bạn sinh viên khoa Công nghệ Thông tin có dịp vận dụng những kiến thức đã học vào thực tế.

Em xin chân thành cảm ơn sự hỗ trợ tận tình từ trường Đại học Công nghệ Thông tin, đặc biệt là thầy Nguyễn Hồ Duy Trí, người đã nhiệt tình hướng dẫn và hỗ trợ nhóm em trong suốt quá trình thực hiện đề tài.

Em cũng xin gửi lời cảm ơn sâu sắc đến các bạn đã hết lòng giúp đỡ, góp ý và đóng góp những nhận xét quý báu trong suốt thời gian em hoàn thành đề tài này.

Dù đã nỗ lực tìm tòi và học hỏi, nhưng những thiếu sót vẫn có thể không tránh khỏi, rất mong nhận được ý kiến đóng góp của thầy và bạn bè để em hoàn thiện hơn.

Một lần nữa, xin chân thành cảm ơn thầy và các bạn!

TP Hồ Chí Minh, tháng 11 năm 2024.

Trang 5

CHƯƠNG I: GIỚI THIỆU

1.1 Tổng quan về Netflix

Giới thiệu chung về Netflix:

o Netflix là một dịch vụ phát trực tuyến (streaming service) phổ biến, cung cấp các

bộ phim, chương trình truyền hình, tài liệu và nội dung gốc Người dùng có thể truy cập Netflix từ nhiều thiết bị như TV thông minh, máy tính, điện thoại di động, máy tính bảng, và thiết bị phát trực tuyến khác

o Được thành lập vào năm 1997 bởi Reed Hastings và Marc Randolph tại

California, Netflix ban đầu là một dịch vụ cho thuê DVD qua bưu điện, nhưng đãchuyển mình thành một nền tảng streaming vào năm 2007, khi lần đầu tiên cho phép người dùng xem các chương trình truyền hình và phim trực tuyến

o Ngày nay, Netflix có hơn 200 triệu người đăng ký toàn cầu và là một trong những công ty công nghệ lớn nhất thế giới, với một bộ sưu tập nội dung phong phú và hệ thống gợi ý mạnh mẽ, giúp cá nhân hóa trải nghiệm của người dùng

Mục tiêu của Netflix:

o Netflix không chỉ cung cấp dịch vụ giải trí mà còn chú trọng vào việc mang đến cho người dùng những gợi ý nội dung phù hợp, giúp họ tìm thấy chương trình và phim mà họ sẽ yêu thích, từ đó giữ chân người dùng và tối ưu hóa trải nghiệm người dùng

1.2 Tầm quan trọng của hệ thống gợi ý trong dịch vụ Netflix

Lý do hệ thống gợi ý quan trọng đối với Netflix:

o Với số lượng nội dung khổng lồ trên nền tảng (hàng nghìn bộ phim, chương trìnhtruyền hình, tài liệu, và các series gốc), người dùng dễ bị choáng ngợp bởi sự đa dạng và không biết chọn gì tiếp theo Hệ thống gợi ý của Netflix giúp giải quyết vấn đề này bằng cách cá nhân hóa các đề xuất dựa trên sở thích và hành vi của người dùng

o Tối ưu hóa trải nghiệm người dùng: Các hệ thống gợi ý đóng vai trò quan

trọng trong việc tạo ra một trải nghiệm người dùng mượt mà, giúp người dùng tiết kiệm thời gian tìm kiếm nội dung, đồng thời cải thiện sự hài lòng và khả năngquay lại sử dụng dịch vụ

o Duy trì và gia tăng số lượng người dùng: Các gợi ý chính xác và phù hợp giúp

giảm tỷ lệ người dùng hủy dịch vụ (churn rate), qua đó giúp Netflix giữ chân khách hàng và gia tăng sự trung thành của người dùng

o Khả năng tối ưu hóa các chiến lược marketing: Hệ thống gợi ý cũng giúp

Netflix phân tích hành vi người dùng để tối ưu hóa các chiến lược quảng cáo và tiếp thị nội dung

Thách thức đối với hệ thống gợi ý của Netflix:

o Với số lượng người dùng lớn và đa dạng, việc tạo ra các gợi ý cá nhân hóa cho từng người dùng, dựa trên lịch sử xem, đánh giá và hành vi, đòi hỏi một hệ thốngcực kỳ tinh vi và thông minh

Trang 6

o Một thách thức khác là làm sao để duy trì sự mới mẻ và không gây nhàm chán cho người dùng, mặc dù hệ thống gợi ý đã biết được sở thích của họ.

1.3 Mục tiêu và mục đích của báo cáo

Mục tiêu của báo cáo:

o Mục tiêu của báo cáo này là phân tích và làm rõ cách thức hoạt động của hệ thống gợi ý của Netflix, từ những công nghệ cơ bản đến các thuật toán và mô hình học máy (machine learning) được sử dụng để cá nhân hóa các gợi ý

o Báo cáo cũng sẽ tìm hiểu về cách mà Netflix sử dụng dữ liệu người dùng và các

kỹ thuật phân tích để tạo ra một trải nghiệm người dùng tối ưu và duy trì sự hài lòng lâu dài

Mục đích:

o Cung cấp cái nhìn sâu sắc về cách thức hoạt động của hệ thống gợi ý của Netflix

và những tác động của nó đối với người dùng và công ty

o Đưa ra những phân tích về các phương pháp gợi ý được Netflix áp dụng, đồng thời thảo luận về những thách thức và cơ hội trong việc cải tiến hệ thống gợi ý đểđáp ứng nhu cầu ngày càng cao của người dùng

Trang 7

CHƯƠNG II CÁC KHÁI NIỆM CƠ BẢN VỀ HỆ THỐNG

GỢI Ý (RECOMMENDATION SYSTEM)

2.1 Định nghĩa và vai trò của hệ thống gợi ý

Hệ thống gợi ý là gì?

o Hệ thống gợi ý (Recommendation System) là một công cụ dùng để dự đoán và

cung cấp các sản phẩm, dịch vụ, hay nội dung phù hợp cho người dùng, dựa trên

sở thích, hành vi, hoặc các thông tin liên quan đến người dùng và sản phẩm

o Hệ thống gợi ý có thể sử dụng các thuật toán phân tích dữ liệu và học máy (machine learning) để tạo ra các đề xuất cá nhân hóa, nhằm cải thiện trải nghiệm người dùng

Vai trò của hệ thống gợi ý:

o Cải thiện trải nghiệm người dùng: Các hệ thống gợi ý giúp người dùng khám

phá nội dung phù hợp với sở thích cá nhân mà họ có thể không tìm thấy một cáchthủ công

o Tăng tính tương tác và sự hài lòng của người dùng: Hệ thống gợi ý cá nhân

hóa giúp người dùng cảm thấy được chú ý và phục vụ một cách tốt nhất, từ đó tăng cường sự hài lòng và giữ chân khách hàng

o Tăng doanh thu và tối ưu hóa dịch vụ: Các hệ thống gợi ý không chỉ làm tăng

sự hài lòng của người dùng mà còn giúp các công ty tối ưu hóa các chiến lược tiếp thị và quảng bá sản phẩm

2.2 Các loại hệ thống gợi ý

Hệ thống gợi ý có thể được phân loại theo nhiều cách khác nhau, nhưng phổ biến nhất là dựa vào cách chúng hoạt động và các thuật toán mà chúng sử dụng Sau đây là ba loại hệ thống gợi ý phổ biến:

2.2.1 Hệ thống gợi ý dựa trên nội dung (Content-based filtering)

Khái niệm:

o Hệ thống gợi ý dựa trên nội dung sử dụng các đặc điểm của sản phẩm hoặc nội dung (chẳng hạn như thể loại phim, diễn viên, đạo diễn) để tìm kiếm và gợi ý cácsản phẩm tương tự mà người dùng có thể thích

Cách hoạt động:

o Phân tích nội dung của các sản phẩm đã được người dùng tương tác (chẳng hạn như phim đã xem) và tìm các đặc điểm chung (như thể loại, mô tả) để gợi ý các sản phẩm khác có cùng đặc điểm

o Ví dụ: Nếu người dùng thích các bộ phim hành động, hệ thống có thể gợi ý các

bộ phim hành động khác

Ưu điểm:

o Không cần nhiều dữ liệu người dùng, chỉ cần dữ liệu mô tả sản phẩm

o Dễ dàng hiểu và triển khai

Nhược điểm:

o Không thể đề xuất những sản phẩm mới hoặc ít thông tin

o Thiếu tính sáng tạo và đổi mới trong các đề xuất (chỉ dựa vào sở thích đã biết)

Trang 8

2.2.2 Hệ thống gợi ý dựa trên cộng đồng (Collaborative filtering)

Khái niệm:

o Hệ thống gợi ý dựa trên cộng đồng sử dụng hành vi và sự tương tác của người dùng khác để dự đoán sở thích của người dùng Phương pháp này không quan tâm đến nội dung của sản phẩm mà chỉ tập trung vào dữ liệu hành vi của người dùng

Cách hoạt động:

o User-based Collaborative Filtering: Gợi ý các sản phẩm mà người dùng tương

tự (có hành vi xem giống nhau) đã thích hoặc đánh giá cao

o Item-based Collaborative Filtering: Gợi ý các sản phẩm có sự tương tự cao với

những sản phẩm mà người dùng đã thích trong quá khứ

o Cần có một lượng lớn dữ liệu người dùng để hệ thống có thể hoạt động hiệu quả

o Vấn đề "Cold Start": Khó khăn trong việc gợi ý cho người dùng mới hoặc sản phẩm mới không có dữ liệu

2.2.3 Hệ thống gợi ý kết hợp (Hybrid Systems)

Khái niệm:

o Hệ thống gợi ý kết hợp là sự kết hợp của các phương pháp khác nhau (như content-based filtering và collaborative filtering) để tận dụng ưu điểm và khắc phục nhược điểm của từng phương pháp

Cách hoạt động:

Trang 9

o Hệ thống sử dụng cả dữ liệu về người dùng và nội dung sản phẩm để đưa ra các

đề xuất chính xác hơn Ví dụ, hệ thống có thể sử dụng phương pháp collaborativefiltering để tìm những người dùng có sở thích giống nhau và sau đó sử dụng content-based filtering để gợi ý sản phẩm tương tự dựa trên mô tả sản phẩm

Ưu điểm:

o Khắc phục được nhiều nhược điểm của các phương pháp đơn lẻ

o Cải thiện độ chính xác của các đề xuất

Nhược điểm:

o Phức tạp hơn trong việc triển khai và tính toán

2.3 Các thuật toán cơ bản trong hệ thống gợi ý

Để xây dựng các hệ thống gợi ý, người ta sử dụng một số thuật toán học máy cơ bản, trong đó phổ biến nhất là:

2.3.1 Matrix Factorization (Phân tích ma trận)

 Đây là một kỹ thuật mạnh mẽ thường được sử dụng trong các hệ thống gợi ý

collaborative filtering Nó cố gắng giảm số lượng chiều trong dữ liệu để phát hiện các mối quan hệ tiềm ẩn giữa người dùng và các sản phẩm

Một ví dụ điển hình của phương pháp này là Singular Value Decomposition (SVD).

2.3.2 K-means Clustering

 Phương pháp phân cụm này giúp phân nhóm người dùng hoặc sản phẩm có đặc điểm tương tự nhau, từ đó đưa ra các gợi ý dựa trên các nhóm này

Trang 10

2.3.3 Nearest Neighbors

Thuật toán K-Nearest Neighbors (KNN) được sử dụng để tìm kiếm các sản phẩm hoặc

người dùng tương tự nhất dựa trên các đặc điểm đã biết (chẳng hạn như điểm đánh giá hoặc lịch sử xem)

2.4 Các yếu tố ảnh hưởng đến chất lượng hệ thống gợi ý

Dữ liệu người dùng: Hệ thống gợi ý hoạt động tốt khi có đủ dữ liệu từ người dùng, bao

gồm hành vi xem, đánh giá sản phẩm, và các tương tác khác

Trang 11

Sự đa dạng và phong phú của dữ liệu sản phẩm: Sự phong phú trong các đặc điểm của

sản phẩm sẽ giúp hệ thống gợi ý dễ dàng phân loại và đưa ra những gợi ý chính xác hơn

Tính cá nhân hóa: Mức độ cá nhân hóa của hệ thống gợi ý có thể ảnh hưởng trực tiếp

đến hiệu quả và sự hài lòng của người dùng

CHƯƠNG III PHƯƠNG PHÁP GỢI Ý CỦA NETFLIX

3.1 Tổng quan về hệ thống gợi ý của Netflix

Netflix sử dụng một hệ thống gợi ý mạnh mẽ để cung cấp các đề xuất phim, chương trình truyền hình và nội dung khác cho người dùng Hệ thống gợi ý này là yếu tố quan trọng trong chiến lược giữ chân khách hàng, giúp nâng cao trải nghiệm người dùng và tối ưu hóa việc khám phá nội dung.

Mục tiêu của hệ thống gợi ý Netflix:

o Tăng mức độ hài lòng của người dùng bằng cách đưa ra các gợi ý cá nhân hóa, giúp người dùng dễ dàng tìm thấy các chương trình phù hợp với sở thích của họ

o Duy trì và giảm tỷ lệ người dùng hủy dịch vụ (churn rate) bằng cách cung cấp những đề xuất chính xác, làm tăng thời gian sử dụng và mức độ gắn kết của người dùng

Đặc điểm nổi bật của hệ thống gợi ý của Netflix:

o Cá nhân hóa mạnh mẽ: Hệ thống gợi ý dựa vào hành vi người dùng để đưa ra

các gợi ý, bao gồm lịch sử xem, đánh giá, và các loại nội dung đã được yêu thích trước đó

o Đề xuất ngẫu nhiên và đa dạng: Bên cạnh việc gợi ý các nội dung tương tự, hệ

thống còn khám phá các thể loại và nội dung mới để người dùng có thể tìm thấy các bộ phim và chương trình ít nổi bật nhưng thú vị

3.2 Các phương pháp gợi ý của Netflix

Netflix kết hợp nhiều phương pháp gợi ý khác nhau để cung cấp các đề xuất tối ưu cho

người dùng Các phương pháp chính mà Netflix sử dụng bao gồm Collaborative

Filtering (Lọc hợp tác), Content-Based Filtering (Lọc dựa trên nội dung) , và

Hybrid Systems (Phương pháp lai).

3.2.1 Collaborative Filtering (Lọc hợp tác)

Khái niệm:

o Phương pháp Collaborative Filtering dựa trên hành vi và sự tương tác của người dùng để đưa ra các gợi ý Thay vì tập trung vào nội dung sản phẩm, phương phápnày sử dụng dữ liệu từ người dùng khác để tìm ra những sản phẩm mà người dùng có thể thích

Cách hoạt động:

Trang 12

o User-based Collaborative Filtering: So sánh người dùng với những người dùng

khác có hành vi tương tự (chẳng hạn như xem phim giống nhau) và đưa ra các gợi ý dựa trên những sản phẩm mà những người dùng tương tự đã thích

o Item-based Collaborative Filtering: So sánh các sản phẩm với nhau để tìm ra

những sản phẩm có sự tương tự cao Sau đó, hệ thống sẽ đề xuất các sản phẩm có

sự tương tự cao với những sản phẩm mà người dùng đã xem trước đó

Ưu điểm:

o Không cần phân tích nội dung chi tiết của sản phẩm

o Có thể phát hiện các xu hướng ẩn và những đề xuất bất ngờ mà người dùng có thể thích

Nhược điểm:

o Vấn đề Cold Start: Khó khăn khi hệ thống phải đưa ra gợi ý cho người dùng

mới hoặc sản phẩm mới không có đủ dữ liệu

o Lượng dữ liệu người dùng: Phải có đủ dữ liệu người dùng để phương pháp này

hoạt động hiệu quả

3.2.2 Content-Based Filtering (Lọc dựa trên nội dung)

Khái niệm:

o Phương pháp Content-Based Filtering dựa vào đặc điểm nội dung của sản phẩm

để đưa ra các gợi ý Ví dụ, nếu người dùng đã xem một bộ phim hành động, hệ thống sẽ đề xuất các bộ phim hành động khác

Cách hoạt động:

o Hệ thống phân tích các đặc điểm của nội dung (như thể loại, đạo diễn, diễn viên, năm sản xuất) và so sánh chúng với các sản phẩm khác mà người dùng đã xem hoặc thích

Trang 13

o Các đề xuất có thể bị giới hạn trong các thể loại mà người dùng đã tương tác nhiều.

3.2.3 Hybrid Systems (Hệ thống kết hợp)

Khái niệm:

o Hệ thống kết hợp là sự kết hợp của các phương pháp Collaborative Filtering và Content-Based Filtering Điều này giúp tận dụng ưu điểm của cả hai phương pháp và giảm bớt các nhược điểm của từng phương pháp riêng lẻ

Cách hoạt động:

o Hệ thống gợi ý của Netflix sử dụng Hybrid Systems để kết hợp dữ liệu về hành

vi người dùng và các đặc điểm của nội dung sản phẩm Điều này giúp hệ thống đưa ra các gợi ý chính xác hơn, đồng thời khai thác được cả thông tin về người dùng và sản phẩm

Ưu điểm:

o Kết hợp được các phương pháp và cung cấp các đề xuất chính xác hơn

o Giảm thiểu vấn đề Cold Start và tăng khả năng dự đoán cho người dùng mới

Nhược điểm:

o Phức tạp hơn trong việc triển khai và tính toán

3.3 Thuật toán Matrix Factorization

Khái niệm:

o Matrix Factorization là một kỹ thuật mạnh mẽ trong Collaborative Filtering,

đặc biệt là với dữ liệu thưa thớt (sparse data), như dữ liệu người dùng đánh giá phim Thuật toán này phân tích ma trận các đánh giá của người dùng và tìm ra

Ngày đăng: 24/12/2024, 16:07

w