(Tiểu luận) đồ án tốt nghiệp đại học đề tài phát triển và đánh giá các mô hình học máy trong hệ thống gợi ý

93 4 0
(Tiểu luận) đồ án tốt nghiệp đại học đề tài phát triển và đánh giá các mô hình học máy trong hệ thống gợi ý

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN ĐIỆN TỬ - VIỄN THÔNG ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC Đề tài: PHÁT TRIỂN VÀ ĐÁNH GIÁ CÁC MƠ HÌNH HỌC MÁY TRONG HỆ THỐNG GỢI Ý Sinh viên thực hiện: HOÀNG ANH Lớp ĐT10 – K64 Giảng viên hướng dẫn: TS DƯƠNG TẤN NGHĨA Hà Nội, 8-2023 ĐẠI HỌC BÁCH KHOA HÀ NỘI TRƯỜNG ĐIỆN – ĐIỆN TỬ ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC Đề tài: PHÁT TRIỂN VÀ ĐÁNH GIÁ CÁC MƠ HÌNH HỌC MÁY TRONG HỆ THỐNG GỢI Ý Sinh viên thực hiện: HOÀNG ANH Lớp ĐT10 – K64 Giảng viên hướng dẫn: TS DƯƠNG TẤN NGHĨA Cán phản biện: Hà Nội, 8-2023 ĐÁNH GIÁ QUYỂN ĐỒ ÁN TỐT NGHIỆP (Dùng cho cán phản biện) Giảng viên đánh giá: Họ tên sinh viên: MSSV: Tên đồ án: Chọn mức điểm phù hợp cho sinh viên trình bày theo tiêu chí đây: Rất (1); Kém (2); Đạt (3); Giỏi (4); Xuất sắc (5) Có kết hợp lý thuyết thực hành (20) Nêu rõ tính cấp thiết quan trọng đề tài, vấn đề giả thuyết (bao gồm mục đích tính phù hợp) phạm vi ứng dụng đồ án Cập nhật kết nghiên cứu gần (trong nước/quốc tế) 5 Nêu rõ chi tiết phương pháp nghiên cứu/giải vấn đề Có kết mơ phỏng/thưc nghiệm trình bày rõ ràng kết đạt 5 5 5 Có khả phân tích đánh giá kết (15) Kế hoạch làm việc rõ ràng bao gồm mục tiêu phương pháp thực dựa kết nghiên cứu lý thuyết cách có hệ thống Kết trình bày cách logic dễ hiểu, tất kết phân tích đánh giá thỏa đáng Trong phần kết luận, tác giả rõ khác biệt (nếu có) kết đạt mục tiêu ban đầu đề đồng thời cung cấp lập luận để đề xuất hướng giải thực tương lai Kỹ viết đồ án (10) Đồ án trình bày mẫu quy định với cấu trúc chương logic đẹp mắt (bảng biểu, hình ảnh rõ ràng, có tiêu đề, đánh số thứ tự giải thích hay đề cập đến đồ án, có lề, dấu cách sau dấu chấm, dấu phẩy v.v), có mở đầu chương kết luận chương, có liệt kê tài liệu tham khảo có trích dẫn quy định Kỹ viết xuất sắc (cấu trúc câu chuẩn, văn phong khoa học, lập luận logic có sở, từ vựng sử dụng phù hợp v.v.) Thành tựu nghiên cứu khoa học (5) (chọn trường hợp) Có báo khoa học đăng chấp nhận đăng/đạt giải SVNC khoa 10a học giải cấp Viện trở lên/các giải thưởng khoa học (quốc tế/trong nước) từ giải trở lên/ Có đăng ký phát minh sáng chế 10b Được báo cáo hội đồng cấp Viện hội nghị sinh viên nghiên cứu khoa học không đạt giải từ giải trở lên/Đạt giải khuyến khích kỳ thi quốc gia quốc tế khác chun ngành TI contest 10c Khơng có thành tích nghiên cứu khoa học Điểm tổng Điểm tổng quy đổi thang 10 /50 Nhận xét khác cán phản biện Ngày: … / … / 20… Người nhận xét (Ký ghi rõ họ tên) LỜI NÓI ĐẦU Sau khóa luận tốt nghiệp Hồng Anh – 20192682, lớp Điện tử 10 – K64 Với đề tài “Phát triển đánh giá mơ hình học máy hệ thống gợi ý” với mục đích nghiên cứu, tìm hiểu, phát triển, đánh giá mơ hình toán “Recommendation System” – RS Em xin chân thành cảm ơn thầy cô giáo trường Điện - Điện Tử Viện Điện Tử - Viễn Thông truyền thụ em kiến thức, giúp em có sở lý thuyết vững vàng tạo nhiều điều kiện giúp em suốt trình học tập Và đặc biệt em xin gửi lời cảm ơn chân thành đến TS Dương Tấn Nghĩa trường Điện - Điện tử người trực tiếp hướng dẫn em suốt q trình làm khố luận Do thời gian làm khóa luận hạn chế, khả thân cịn nhiều thiếu sót Kính mong thầy lượng thứ góp ý để em hồn thành tốt khóa luận tốt nghiệp LỜI CAM ĐOAN Tơi Hồng Anh, mã số sinh viên 20192682, sinh viên lớp Điện tử 10, khóa 64 Người hướng dẫn TS Dương Tấn Nghĩa Tơi xin cam đoan tồn nội dung trình bày đồ án Phát triển đánh giá mơ hình học máy hệ thống gợi ý kết trình tìm hiểu nghiên cứu Các liệu nêu đồ án hoàn toàn trung thực, phản ánh kết đo đạc thực tế Mọi thông tin trích dẫn tuân thủ quy định sở hữu trí tuệ; tài liệu tham khảo liệt kê rõ ràng Tơi xin chịu hồn tồn trách nhiệm với nội dung viết đồ án Hà nội, ngày 01 tháng 08 năm 2023 Người cam đoan Hoàng Anh MỤC LỤC DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT ii DANH MỤC HÌNH VẼ iv DANH MỤC BẢNG BIỂU .v CHƯƠNG TỔNG QUAN VỀ HỆ THỐNG GỢI Ý 1.1 Hệ thống gợi ý .1 1.1.1 Các khái niệm chung 1.1.2 Xây dựng hệ thống gợi ý 1.1.3 Khó khăn việc xây dựng hệ thống gợi ý .4 1.1.4 Hai dạng toán chủ yếu RS 1.2 Các kỹ thuật RS 1.2.1 Kỹ thuật lọc dựa nội dung (Content-based Filtering) .7 1.2.2 Kỹ thuật lọc cộng tác (CF) 12 1.2.3 Kỹ thuật Phân rã Ma trận (MF) 14 1.2.4 Kỹ thuật phân cụm K-Nearest Neighbors (kNN) 15 1.2.5 Kỹ thuật hệ thống gợi ý lai (Hybrid Recommendation Systems) 18 1.2.6 Kỹ thuật khơng cá nhân hóa (non-personalization) .20 1.3 Các kiến trúc học sâu (Deep Learning) hệ thống gợi ý 21 1.3.1 Tổng quan DL 21 1.3.2 Mô hình Restricted Bolzmann Machine (RBM) 22 1.3.3 Mơ hình Auto-Encoder 24 1.4 Giải toán Dữ liệu lớn (Big Data) 26 1.4.1 Hadoop 26 1.4.2 Apache Spark .28 1.4.3 So sánh Spark Hadoop 31 CHƯƠNG ÁP DỤNG CÁC THUẬT TOÁN 32 2.1 Bộ liệu 32 2.1.1 Bộ liệu Movielens 100k 32 2.1.2 Bộ liệu Movielens 1M 33 2.2 Thông số đánh giá 34 2.2.1 RMSE MAE 34 2.2.2 Hit Rate (HR) .34 2.2.3 Average Reciprocal Hit Rate (ARHR) 34 2.2.4 Cumulative Hit Rate (cHR) 35 2.2.5 Coverage 35 2.2.6 Diversity .35 2.3 Thực nghiệm .36 2.3.1 Môi trường 36 2.3.2 Đối tượng đánh giá 36 2.4 Các mơ hình thực nghiệm 38 2.4.1 kNN 38 2.4.2 SVD SVD++ 44 2.4.3 RBM .48 2.4.4 Auto-Encoder cho RS 51 2.4.5 Hybrid RS 53 2.5 Đánh giá kết 55 2.5.1 Đánh giá thuật toán 55 2.5.2 Đánh giá tổng hợp 58 2.6 Thực nghiệm Pyspark 61 KẾT LUẬN 64 Kết luận chung 64 Hướng phát triển .64 TÀI LIỆU THAM KHẢO 65

Ngày đăng: 28/09/2023, 20:30

Tài liệu cùng người dùng

Tài liệu liên quan