ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN TRUNG TÂM PHÁT TRIỂN CÔNG NGHỆ THÔNG TIN BÁO CÁO MÔN HỌC HỆ HỖ TRỢ RA QUYẾT ĐỊNH Đề tài HỆ THỐNG GỢI Ý CỦA NETFLIX TRON
Trang 1ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
TRUNG TÂM PHÁT TRIỂN CÔNG NGHỆ THÔNG TIN
BÁO CÁO MÔN HỌC
HỆ HỖ TRỢ RA QUYẾT ĐỊNH
Đề tài
HỆ THỐNG GỢI Ý CỦA NETFLIX
TRONG DỮ LIỆU LỚN
Giảng viên hướng dẫn: Nguyễn Hồ Duy Trí
Danh sách nhóm sinh viên thực hiện:
1 Huỳnh Nhật Khánh – MSSV: 23410160 2.
3.
Mục lục
CHƯƠNG I MỞ ĐẦU 2
Trang 2CHƯƠNG II TỔNG QUAN VỀ HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH
(DSS) 3
CHƯƠNG III HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH LÀ GÌ? 5
CHƯƠNG IV DỮ LIỆU LỚN (BIG DATA) 5
CHƯƠNG V ỨNG DỤNG CỦA DSS NETFLIX 6
CHƯƠNG VI CÁCH HOẠT ĐỘNG CỦA HỆ THỐNG ĐỀ XUẤT 7
CHƯƠNG VII CÁC ĐỀ XUẤT KHUYẾN NGHỊ 9
CHƯƠNG VIII LỢI ÍCH CỦA HỆ THỐNG DSS 11
CHƯƠNG IX KẾT LUẬN 13
CHƯƠNG I MỞ ĐẦU
1 Giới thiệu về DSS (Decision Support System): Hệ hỗ trợ quyết định
(tiếng Anh: Decision Support System, viết tắt: DSS) được thiết kế với mục đích rõ ràng là trợ giúp các hoạt động ra quyết định Hệ thống này có rất nhiều ưu điểm nổi trội, cung cấp cho người dùng những thông tin hữu ích một cách linh hoạt
2 Mục tiêu của báo cáo
Lý do chọn nghiên cứu DSS
Hệ thống hỗ trợ ra quyết định (Decision Support System - DSS) là một trong những công nghệ quan trọng giúp nâng cao khả năng quản lý và ra quyết định trong các tổ chức hiện đại DSS hỗ trợ người dùng bằng cách cung cấp thông tin chi tiết, công cụ phân tích và giao diện tương tác để xử lý dữ liệu phức tạp Việc nghiên cứu DSS có ý nghĩa lớn nhằm tối ưu hóa quy trình quản lý, gia tăng hiệu quả kinh doanh và cải thiện chất lượng ra quyết định
Các mục tiêu chính của nghiên cứu DSS bao gồm:
Phân tích cơ cấu của DSS:
Nghiên cứu cấu trúc của một hệ thống hỗ trợ ra quyết định, bao gồm ba thành phần chính: cơ sở dữ liệu, công cụ phân tích và giao diện người dùng Hiểu rõ mối liên hệ giữa các thành phần này giúp xây dựng và triển khai các
hệ thống DSS phù hợp với nhu cầu thực tế
Lợi ích của DSS:
DSS giúp tổ chức ra quyết định nhanh hơn và chính xác hơn bằng cách cung cấp các phân tích chi tiết, dự báo xu hướng và kịch bản "nếu-thì" Giảm thiểu
Trang 3sai sót trong quyết định do chủ quan và thiếu thông tin Cải thiện khả năng cạnh tranh thông qua việc khai thác hiệu quả nguồn dữ liệu và tài nguyên
Các thách thức khi áp dụng DSS vào thực tiễn:
Tính phức tạp trong thiết kế và triển khai: Đòi hỏi kỹ năng công
nghệ và hiểu biết sâu sắc về quy trình kinh doanh để xây dựng hệ thống phù hợp
Chi phí đầu tư: Phát triển và triển khai một hệ thống DSS hiệu quả
thường yêu cầu nguồn vốn lớn và thời gian đầu tư
Khả năng thích ứng của người dùng: Đòi hỏi việc đào tạo và
chuyển đổi tư duy từ cách thức ra quyết định truyền thống sang sử dụng công cụ kỹ thuật số
Bảo mật dữ liệu: Cần đảm bảo rằng hệ thống không chỉ hiệu quả mà
còn an toàn trước các mối đe dọa an ninh mạng
CHƯƠNG II TỔNG QUAN VỀ HỆ THỐNG HỖ TRỢ
RA QUYẾT ĐỊNH (DSS)
1 Khái niệm và phân loại
Hệ hỗ trợ quyết định trong tiếng Anh gọi là Decision Support System, viết tắt là DSS
Hệ hỗ trợ quyết định (DSS) là một chương trình vi tính được sử dụng để hỗ trợ đưa ra các quyết định, phán đoán và chiều hướng hành động của một tổ chức hoặc một doanh nghiệp. DSS sẽ sàng lọc và phân tích lượng dữ liệu khổng lồ, tổng hợp thông tin một cách toàn diện mà có thể được sử dụng để giải quyết các vấn đề và trong quá trình ra quyết định
Thông tin thường được sử dụng bởi DSS gồm doanh thu mục tiêu, số liệu bán hàng từ các khoảng thời gian khác nhau và dữ liệu kiểm kê hoặc những hoạt động liên quan khác
Một DSS sẽ tập hợp và phân tích dữ liệu, tổng hợp nó để tạo ra các báo cáo thông tin tổng quát Theo cách này, là một ứng dụng thông tin, DSS khác với những ứng dụng hoạt động thông thường chỉ có chức năng là thu thập dữ liệu
DSS có thể được máy tính hóa hoàn toàn hoặc được điều khiển bởi con
người Trong một số trường hợp, nó có thể kết hợp cả hai Các hệ thống lí tưởng sẽ phân tích thông tin và thực sự đưa ra quyết định cho người dùng Ít nhất chúng cho phép người dùng đưa ra quyết định sáng suốt hơn với tốc độ nhanh hơn
Trang 4Sơ đồ hệ hỗ trợ quyết định Nguồn: Giáo trình Quản trị kinh doanh, NXB Đại học Kinh tế quốc dân
2 Sử dụng hệ hỗ trợ quyết định
DSS có thể được sử dụng bởi quản trị vận hành và các phòng kế hoạch khác trong một tổ chức để biên soạn thông tin và dữ liệu, sau đó tổng hợp nó thành tin tức Trên thực tế, hệ thống này chủ yếu được sử dụng bởi quản lí cấp trung đến cấp cao hơn
3 Đặc điểm của hệ hỗ trợ quyết định
Mục đích chính của việc sử dụng DSS là trình bày thông tin cho khách hàng một cách dễ hiểu Một DSS rất hữu ích vì nó có thể được lập trình để tạo nhiều loại báo cáo, tất cả dựa trên thông số kĩ thuật của người dùng
Khi công nghệ tiếp tục phát triển, phân tích dữ liệu không còn giới hạn trong những chiếc máy tính lớn, cồng kềnh Vì DSS về cơ bản là một ứng dụng, nó
có thể được tải trên hầu hết các hệ thống máy tính, cho dù trên máy tính bàn hay máy tính xách tay Một số ứng dụng DSS cũng có sẵn trên các thiết bị di động
Tính linh hoạt của hệ hỗ trợ quyết định cực kì có lợi cho những người dùng thường xuyên phải di chuyển Điều này mang lại cho họ cơ hội nhận được thông tin chất lượng mọi lúc mọi nơi, cung cấp khả năng đưa ra quyết định tốt nhất cho công ty và khách hàng của họ khi đang di chuyển hoặc thậm chí ngay tại chỗ
Trang 54 Cấu trúc của DSS
- Trình bày cấu trúc cơ bản của một DSS: cơ sở dữ liệu, hệ thống quản lý mô hình, giao diện người dùng, và các công cụ phân tích
5 Công nghệ hỗ trợ DSS hiện nay
- Các công nghệ phổ biến trong xây dựng DSS như Big Data, Machine
Learning, hệ thống phân tích dữ liệu thời gian thực
CHƯƠNG III HỆ THỐNG HỖ TRỢ RA QUYẾT
ĐỊNH LÀ GÌ?
- Định nghĩa DSS: DSS là một hệ thống phần mềm hoặc phần cứng được
thiết kế để hỗ trợ quá trình ra quyết định trong các tổ chức và doanh nghiệp DSS cung cấp các công cụ, dữ liệu và phân tích thông tin để giúp người sử dụng đưa ra quyết định thông minh và hiệu quả
- Vai trò: Tối ưu hóa các lựa chọn, cá nhân hóa trải nghiệm người dùng,
giảm tình trạng quá tải thông tin
1 Phân tích và xử lý dữ liệu: DSS có khả năng xử lý khối lượng dữ liệu
lớn, phân tích các mô hình và xu hướng để hỗ trợ ra quyết định Điều này đặc biệt quan trọng trong bối cảnh dữ liệu lớn (Big Data), khi dữ liệu đến từ nhiều nguồn khác nhau
Trang 62 Giảm tình trạng quá tải thông tin: DSS giúp người dùng tập trung vào
những thông tin quan trọng và cần thiết nhất Các hệ thống này có thể lọc và sắp xếp dữ liệu để loại bỏ thông tin không liên quan, giúp người dùng không
bị choáng ngợp
3 Cá nhân hóa đề xuất: DSS có thể tùy chỉnh và đề xuất các giải pháp
hoặc lựa chọn phù hợp với từng cá nhân Điều này có thể thấy rõ trong các công cụ đề xuất của các nền tảng như Netflix, Amazon, giúp cải thiện trải nghiệm người dùng thông qua cá nhân hóa
4 Tăng tính chính xác và hiệu quả: DSS giúp giảm thiểu các quyết định
dựa trên cảm tính, thay vào đó đưa ra các lựa chọn dựa trên dữ liệu và mô hình phân tích Điều này dẫn đến việc ra quyết định chính xác hơn, hiệu quả hơn, đồng thời giúp các tổ chức tối ưu hóa các nguồn lực của mình
5 Tự động hóa quy trình ra quyết định: DSS có thể tự động hóa nhiều
phần trong quy trình, như xử lý và phân tích dữ liệu, dự đoán xu hướng và tạo báo cáo Điều này giúp tiết kiệm thời gian và công sức của người ra quyết định
6 Hỗ trợ dự báo và quản lý rủi ro: DSS giúp các tổ chức dự báo những
thay đổi và rủi ro tiềm ẩn bằng cách phân tích dữ liệu quá khứ và hiện tại
Từ đó, họ có thể lập kế hoạch ứng phó hoặc phòng ngừa các rủi ro
CHƯƠNG IV DỮ LIỆU LỚN (BIG DATA)
Dữ liệu lớn là gì?
Các tập dữ liệu khổng lồ chứa nhiều thông tin khác nhau, từ mạng xã hội, hành vi người dùng, đến dữ liệu cảm biến.Dữ liệu lớn (Big Data) là một thuật ngữ đề cập đến việc xử lý một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được Dữ liệu lớn bao gồm việc phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư
Vai trò của dữ liệu lớn trong DSS: Cho phép DSS phân tích xu hướng, dự
đoán hành vi và đưa ra các quyết định chính xác
1 Nguồn dữ liệu phong phú và đa dạng: Dữ liệu lớn mang đến một lượng
thông tin khổng lồ từ nhiều nguồn khác nhau như mạng xã hội, giao dịch kinh doanh, thiết bị IoT, và cảm biến Điều này cung cấp cho DSS nền tảng thông tin phong phú, từ đó tạo ra các phân tích toàn diện hơn
2 Cải thiện độ chính xác của dự báo và quyết định: Khối lượng dữ liệu
lớn cho phép DSS phân tích các xu hướng, hành vi người dùng và mối quan
Trang 7hệ trong dữ liệu một cách chi tiết Với nhiều dữ liệu hơn, DSS có thể đưa ra các dự báo chính xác hơn về những thay đổi hoặc rủi ro trong tương lai
3 Tăng cường khả năng cá nhân hóa: Dữ liệu lớn cho phép DSS hiểu sâu
hơn về thói quen, sở thích và hành vi của từng người dùng Điều này giúp các
hệ thống DSS, như các công cụ đề xuất, đưa ra các gợi ý cá nhân hóa, ví dụ như gợi ý phim và sản phẩm, để cải thiện trải nghiệm người dùng
4 Phân tích thời gian thực: Dữ liệu lớn kết hợp với các công nghệ xử lý dữ
liệu thời gian thực giúp DSS có thể đưa ra các quyết định kịp thời Điều này rất quan trọng trong các lĩnh vực như tài chính, an ninh mạng và quản lý chuỗi cung ứng, nơi các quyết định nhanh chóng có thể tạo nên sự khác biệt lớn
5 Tăng cường khả năng phát hiện xu hướng và mẫu: Với lượng dữ liệu
phong phú, DSS có thể dễ dàng nhận ra các xu hướng và mẫu mới xuất hiện trong dữ liệu Điều này giúp các tổ chức đưa ra những quyết định chiến lược, dựa trên sự hiểu biết sâu rộng về thị trường hoặc hành vi khách hàng
6 Hỗ trợ quản lý và giảm thiểu rủi ro: Dữ liệu lớn giúp DSS phân tích và
đánh giá các yếu tố rủi ro, từ đó đưa ra các quyết định để giảm thiểu rủi ro hoặc đối phó với các tình huống bất ngờ
7 Tối ưu hóa quy trình kinh doanh và ra quyết định: Dữ liệu lớn cung
cấp thông tin giúp DSS đánh giá và tối ưu hóa hiệu quả hoạt động của các quy trình Các tổ chức có thể cải thiện các hoạt động sản xuất, quản lý tài nguyên và tiếp thị dựa trên những thông tin từ phân tích dữ liệu lớn
CHƯƠNG V ỨNG DỤNG CỦA DSS NETFLIX
Công cụ đề xuất của Netflix: Dựa vào học máy để phân tích thói quen
người dùng và cung cấp đề xuất phim phù hợp
Cá nhân hóa trải nghiệm: Tự động hóa gợi ý phim dựa trên sở thích, giúp
người dùng dễ dàng chọn lựa giữa hàng ngàn tùy chọn
1 Công cụ đề xuất cá nhân hóa: Netflix sử dụng DSS để thu thập và phân
tích hành vi người dùng như lịch sử xem phim, thời gian xem, loại nội dung yêu thích và phản hồi của người dùng (như đánh giá và lượt thích) Hệ thống DSS này sau đó phân tích dữ liệu và đưa ra các đề xuất phù hợp, giúp người dùng nhanh chóng tìm thấy nội dung phù hợp với sở thích cá nhân của họ
2 Phân tích xu hướng và tối ưu hóa nội dung: Netflix sử dụng DSS để
phân tích các xu hướng xem phim và phát hiện sự thay đổi trong sở thích của người dùng theo thời gian hoặc theo khu vực địa lý Bằng cách này, Netflix
có thể tối ưu hóa danh mục nội dung để đáp ứng sở thích của từng nhóm
Trang 8người dùng Các quyết định về sản xuất hoặc mua lại các bộ phim và chương trình truyền hình mới cũng được hỗ trợ bởi các phân tích dữ liệu này
3 Cá nhân hóa hình ảnh xem trước: Một trong những yếu tố mà DSS hỗ
trợ là tạo ra hình ảnh thu hút người xem bằng cách hiển thị các khung hình khác nhau của cùng một bộ phim cho từng người dùng khác nhau Nếu người dùng thích phim hành động, Netflix sẽ chọn những cảnh hành động làm ảnh đại diện cho bộ phim Ngược lại, với người dùng yêu thích hài kịch, hình ảnh đại diện sẽ là cảnh hài hước DSS phân tích sở thích của người dùng và tự động điều chỉnh các hình ảnh này để tối đa hóa lượt xem
4 Tối ưu hóa trải nghiệm người dùng: DSS tại Netflix liên tục theo dõi
và phân tích cách người dùng tương tác với giao diện, từ đó đưa ra các điều chỉnh giúp trải nghiệm người dùng tốt hơn Ví dụ, DSS có thể đề xuất thay đổi cách sắp xếp nội dung hoặc thiết kế của ứng dụng để giúp người dùng dễ dàng tìm thấy nội dung hơn và giữ chân người dùng lâu hơn
5 Phân tích dữ liệu lớn để quản lý hạ tầng: Netflix sử dụng DSS để theo
dõi và tối ưu hóa hiệu suất máy chủ và mạng lưới phát trực tuyến Hệ thống này giúp Netflix đảm bảo rằng dữ liệu được truyền tải mượt mà và đáp ứng tốt ở bất kỳ vị trí nào, ngay cả trong thời gian cao điểm
6 Dự đoán sở thích nội dung tương lai: Với dữ liệu lớn từ người dùng,
DSS tại Netflix có thể dự đoán xu hướng nội dung trong tương lai Điều này giúp Netflix chuẩn bị và lập kế hoạch sản xuất, đầu tư vào các nội dung mà
hệ thống dự đoán sẽ phổ biến, đồng thời giảm thiểu rủi ro thất bại trong các
dự án phim mới
CHƯƠNG VI CÁCH HOẠT ĐỘNG CỦA HỆ THỐNG
ĐỀ XUẤT
Thu thập Dữ liệu Người Dùng
Trang 9 Dữ liệu Người Dùng: Bao gồm lịch sử duyệt, xem, đánh giá, phản
hồi, thời gian xem và cả nội dung đã tìm kiếm Một số hệ thống còn thu thập thông tin từ mạng xã hội hoặc dữ liệu nhân khẩu học của người dùng
Dữ liệu Nội Dung: Các đặc điểm của sản phẩm hoặc nội dung, chẳng
hạn như thể loại, diễn viên, đạo diễn, tác giả, năm phát hành, và các
mô tả chi tiết khác
Hệ thống sử dụng dữ liệu này để xây dựng hồ sơ sở thích và hành vi của từng người dùng Dữ liệu càng phong phú và chi tiết, hệ thống càng có khả năng đưa ra gợi ý chính xác
2 Phân Tích Dữ Liệu và Xây Dựng Hồ Sơ Người Dùng
Xây dựng hồ sơ người dùng (User Profile): Hệ thống tạo hồ sơ
người dùng bằng cách phân tích các dữ liệu đã thu thập Hồ sơ này phản ánh sở thích cá nhân, thói quen và xu hướng xem của từng người dùng
Xây dựng hồ sơ nội dung (Item Profile): Đặc điểm và thuộc tính
của các nội dung, sản phẩm, hoặc dịch vụ sẽ được phân tích và lưu lại
Ví dụ, nếu một người dùng thường xuyên xem phim hành động và khoa học viễn tưởng, hồ sơ người dùng sẽ ghi nhận rằng họ có xu hướng thích các thể loại này
3 Áp Dụng Các Phương Pháp Đề Xuất
Các phương pháp đề xuất thường sử dụng bao gồm:
Dựa trên nội dung (Content-Based Filtering): So sánh hồ sơ người
dùng với hồ sơ nội dung Hệ thống sẽ gợi ý những nội dung có các đặc điểm giống với nội dung mà người dùng yêu thích
Dựa trên cộng tác (Collaborative Filtering): Sử dụng dữ liệu từ
hành vi của người dùng khác có sở thích tương tự Nếu người dùng A
và B có xu hướng thích các phim giống nhau, hệ thống sẽ gợi ý cho người dùng A những phim mà người dùng B đã xem và ngược lại
Phương pháp lai ghép (Hybrid Recommendation System): Kết
hợp các phương pháp trên để tăng tính chính xác và cá nhân hóa Ví
dụ, Netflix sử dụng cả phương pháp dựa trên nội dung và cộng tác để đưa ra các đề xuất phù hợp nhất cho người dùng
4 Dự Đoán Sở Thích và Đưa Ra Đề Xuất
Trang 10 Mô hình hóa và dự đoán: Hệ thống sử dụng các mô hình học máy để
tính toán xác suất rằng người dùng sẽ thích hoặc không thích một nội dung cụ thể Dựa vào các đặc điểm của người dùng và nội dung, hệ thống sẽ xác định các nội dung có khả năng được người dùng đón nhận nhất
Tạo danh sách gợi ý: Hệ thống sắp xếp các đề xuất dựa trên mức độ
phù hợp và hiển thị cho người dùng một danh sách các nội dung gợi ý
5 Tối Ưu Hóa và Cập Nhật Liên Tục
Cập nhật liên tục: Hệ thống đề xuất phải được cập nhật liên tục dựa
trên dữ liệu người dùng mới Khi người dùng thay đổi sở thích hoặc có
xu hướng mới, hệ thống cần điều chỉnh đề xuất để phù hợp hơn
Học từ phản hồi người dùng: Một số hệ thống đề xuất có thể nhận
phản hồi từ người dùng thông qua các đánh giá hoặc thời gian xem, giúp cải thiện độ chính xác của các đề xuất trong tương lai
6 Cá Nhân Hóa Trải Nghiệm
Hệ thống đề xuất không chỉ gợi ý các nội dung mới mà còn sắp xếp các yếu
tố giao diện, như hình ảnh xem trước và các mục được ưu tiên Ví dụ, Netflix hiển thị các hình ảnh thu nhỏ (thumbnail) khác nhau cho các người dùng khác nhau, tùy theo sở thích của họ
- Ma trận tiện ích: Dự đoán sở thích người dùng dựa trên phim đã xem và đánh giá trước đó
- Ví dụ: Người dùng Fatima thích phim kinh dị, hệ thống sẽ đề xuất phim tương tự; Maya thích phim hài, sẽ được gợi ý các phim nhẹ nhàng hơn
CHƯƠNG VII CÁC ĐỀ XUẤT KHUYẾN NGHỊ
- Phương pháp biên tập: Đề xuất dựa trên xu hướng chung hoặc người dùng
cụ thể (không phù hợp với quy mô lớn)
- Phương pháp cá nhân hóa (Machine Learning): Đề xuất dựa trên dữ liệu lớn
và học máy, như cách Netflix cá nhân hóa các gợi ý phim
1 Phương pháp dựa trên nội dung (Content-Based Filtering)
Cách thức hoạt động: Phương pháp này dựa vào đặc điểm của nội
dung, như thể loại, diễn viên, đạo diễn, hoặc các mô tả liên quan đến phim và chương trình truyền hình