1. Trang chủ
  2. » Cao đẳng - Đại học

Xây dựng hệ thống đánh giá và khuyến nghị khách sạn

54 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 54
Dung lượng 1,91 MB

Nội dung

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM TẠ QUANG TIẾN NGƠ HÀ THẾ VĨ KHĨA LUẬN TỐT NGHIỆP XÂY DỰNG HỆ THỐNG ĐÁNH GIÁ VÀ KHUYẾN NGHỊ KHÁCH SẠN Building a hotel recommendation and rating system KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM TP HỒ CHÍ MINH, 2021 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM TẠ QUANG TIẾN - 17521129 NGÔ HÀ THẾ VĨ - 17521255 KHÓA LUẬN TỐT NGHIỆP XÂY DỰNG HỆ THỐNG ĐÁNH GIÁ VÀ KHUYẾN NGHỊ KHÁCH SẠN Building a hotel recommendation and rating system KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM GIẢNG VIÊN HƯỚNG DẪN THS NGUYỄN THỊ THANH TRÚC TS NGUYỄN HÀ GIANG TP HỒ CHÍ MINH, 2021 THƠNG TIN HỘI ĐỒNG CHẤM KHÓA LUẬN TỐT NGHIỆP Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số …………………… ngày ………………… Hiệu trưởng Trường Đại học Công nghệ Thông tin … - Chủ tịch … - Thư ký … - Ủy viên … - Ủy viên ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ HƯỚNG DẪN) Tên khóa luận: XÂY DỰNG HỆ THỐNG ĐÁNH GIÁ VÀ KHUYẾN NGHỊ KHÁCH SẠN Nhóm SV thực hiện: Cán hướng dẫn: Tạ Quang Tiến 17521129 ThS Nguyễn Thị Thanh Trúc Ngô Hà Thế Vĩ 17521255 TS Nguyễn Hà Giang Đánh giá Khóa luận Về báo cáo: Số trang Số bảng số liệu Số tài liệu tham khảo Số chương Số hình vẽ Sản phẩm Một số nhận xét hình thức báo cáo: …………………………………………………………………………………………… …………………………………………………………………………………………… Về nội dung nghiên cứu: …………………………………………………………………………………………… …………………………………………………………………………………………… Về chương trình ứng dụng: …………………………………………………………………………………………… …………………………………………………………………………………………… Về thái độ làm việc sinh viên: …………………………………………………………………………………………… …………………………………………………………………………………………… Đánh giá chung: …………………………………………………………………………………………… …………………………………………………………………………………………… Điểm sinh viên: Tạ Quang Tiến :……… /10 Ngô Hà Thế Vĩ :……… /10 Người nhận xét (Ký tên ghi rõ họ tên) ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỊA Xà HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ PHẢN BIỆN) Tên khóa luận: XÂY DỰNG HỆ THỐNG ĐÁNH GIÁ VÀ KHUYẾN NGHỊ KHÁCH SẠN Nhóm SV thực hiện: Cán phản biện: Tạ Quang Tiến 17521129 Ngô Hà Thế Vĩ 17521255 Đánh giá Khóa luận Về báo cáo: Số trang Số bảng số liệu Số tài liệu tham khảo Số chương Số hình vẽ Sản phẩm Một số nhận xét hình thức báo cáo: …………………………………………………………………………………………… …………………………………………………………………………………………… Về nội dung nghiên cứu: …………………………………………………………………………………………… …………………………………………………………………………………………… Về chương trình ứng dụng: …………………………………………………………………………………………… …………………………………………………………………………………………… Về thái độ làm việc sinh viên: …………………………………………………………………………………………… …………………………………………………………………………………………… Đánh giá chung: …………………………………………………………………………………………… …………………………………………………………………………………………… Điểm sinh viên: Tạ Quang Tiến :……… /10 Ngô Hà Thế Vĩ :……… /10 Người nhận xét (Ký tên ghi rõ họ tên) LỜI CẢM ƠN Khóa luận tốt nghiệp với đề tài “Xây dựng hệ thống đánh giá khuyến nghị khách sạn” kết tinh cho q trình nỗ lực khơng ngừng việc tìm tịi, học hỏi chúng em suốt quãng thời gian học tập rèn luyện khoa Công nghệ phần mềm trường Đại học Công nghệ Thông tin – ĐHQG TP.HCM Thể khả thân việc áp dụng kiến thức chuyên môn vào giải tốn thực tế Trong q trình thực khóa luận, chúng em nhận hướng dẫn tận tình từ q thầy cơ, giúp đỡ hỗ trợ từ gia đình bạn bè Qua đó, chúng em xin gửi lời cảm ơn chân thành đến: Ban Giám hiệu trường Đại học Cơng nghệ Thơng tin – ĐHQG TP.HCM tạo điều kiện sở vật chất với hệ thống thư viện đại, đa dạng loại sách, tài liệu thuận lợi cho việc tìm kiếm, nghiên cứu thơng tin Chúng em xin gửi lời cảm ơn sâu sắc tới Ths Nguyễn Thị Thanh Trúc TS Nguyễn Hà Giang, người trực tiếp hướng dẫn, bảo, giúp đỡ chúng em lúc khó khăn, đưa lời khun bổ ích để khóa luận hồn thành tiến độ đáp ứng yêu cầu đề ban đầu Cuối cùng, chúng em xin gửi lời cảm ơn đến gia đình, tất thầy khoa, bạn bè bên cạnh để động viên đóng góp ý kiến q trình hồn thành khóa luận Trong q trình làm khóa luận chúng em khơng tránh khỏi sai sót, chúng em kính mong nhận dẫn góp ý q thầy để khóa luận hồn thiện Thành phố Hồ Chí Minh, 24 tháng 12 năm 2021 Sinh viên TẠ QUANG TIẾN NGÔ HÀ THẾ VĨ ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN ĐỀ CƯƠNG CHI TIẾT TÊN ĐỀ TÀI: Xây dựng hệ thống đánh giá khuyến nghị khách sạn Cán hướng dẫn: TS Nguyễn Hà Giang, ThS Nguyễn Thị Thanh Trúc Thời gian thực hiện: Từ ngày 06/09/2021 đến ngày 27/12/2021 Sinh viên thực hiện: Tạ Quang Tiến – 17521129 Ngô Hà Thế Vĩ – 17521255 Nội dung đề tài: Mục tiêu đề tài 1.1 Bối cảnh chọn đề tài Xã hội ngày phát triển, người hàng ngày phải đối mặt với guồng quay sống Những áp lực làm dần quên nhu cầu nghỉ ngơi thiết yếu thân Sẽ thật tuyệt vời tạm đặt thiết bị điện tử xuống, bỏ bớt vài điều kế hoạch, thực cảm nhận khoảnh khắc tận hưởng chuyến du lịch hay kỳ nghỉ nghĩa giúp ta phần giảm bớt căng thẳng sống hàng ngày Bên cạnh việc lên kế hoạch cho chuyến du lịch, việc lựa chọn địa điểm nghỉ chân phần quan trọng Sau chuyến dài, tất người cần nơi nghỉ ngơi để đảm bảo sức khỏe Khách sạn nơi người nghỉ ngơi, ăn uống, thời gian tiếp sức cho chơi ngày hôm sau Như vậy, khách sạn có vấn đề việc nghỉ ngơi người kỳ nghỉ bạn bị ảnh hưởng nhiều Vậy vấn đề đặt làm để ta tìm nơi nghỉ ngơi ưng ý, thoải mái cho chuyến mình? Một hệ thống hỗ trợ tìm kiếm, đề xuất khách sạn với đánh giá hữu ích giải pháp để có lựa chọn nhìn tổng quát nơi mà nghỉ ngơi suốt chuyến du lịch 1.2 Mục tiêu đề tài Ứng dụng khuyến nghị đánh giá khách sạn thực dựa mục tiêu cụ thể sau: Thứ nghiên cứu cơng nghệ lập trình như: Lập trình ứng dụng đa tảng với Flutter Firebase Bên cạnh thực nghiên cứu tìm hiểu phương pháp cào liệu để thu thập xây dựng hệ thống khuyến nghị khách sạn Nghiên cứu thực hóa thuật tốn khuyến nghị khách sạn, cụ thể Content-based Collaborative Thứ hai phát triển ứng dụng có tính thực tiễn cao, có khả triển khai ứng dụng vào thực tế, giúp khách du lịch tìm kiếm lựa chọn chỗ phù hợp cách khách quan, dễ dàng tiện lợi 1.3 Khảo sát ứng dụng tương tự liên quan - Booking: Ứng dụng tìm kiếm đặt phịng du lịch, hỗ trợ tốn, tìm kiếm khách sạn với lọc đa dạng giúp dễ dàng thuận tiện việc lựa chọn Tích hợp đồ định vị vào ứng dụng Hỗ trợ dịch vụ đặt thuê xe, đặt vé máy bay đến điểm du lịch - Gotrip: Ứng dụng đặt phòng du lịch tự túc với tính quản lý khách sạn, đặt phòng thống kê doanh thu Bên cạnh hỗ trợ gợi ý khách sạn thơng qua phân tích cảm xúc bình luận, phản hồi 1.4 Đối tượng đề tài - Người dùng ngồi nước có nhu cầu tìm khách sạn/homestay du lịch Việt Nam - Phạm vi: Việt Nam 1.5 Nhiệm vụ đề tài - Tìm hiểu ứng dụng hỗ trợ tìm kiếm khách sạn thực tế - Tìm hiểu cách xây dựng ứng dụng đa tảng với Flutter - Xây dựng thành cơng ứng dụng có tích hợp hệ thống hỗ trợ khuyến nghị khách 10 - Thứ nhất, nhờ người dùng rate sản phẩm (items) Ví dụ Shopee nhờ người dùng rate sản phẩm họ cách gửi mail nhắc nhở nhiều lần sau đơn hàng tới trạng thái Đã nhận hàng Tuy nhiên, cách tiếp cận có vài hạn chế thường người dùng rate sản phẩm Và có, đánh giá thiên lệch người sẵn sàng rate - Thứ hai, dựa hành vi người dùng (users) like, mua, xem, … item Thường với cách xây dựng ma trận với thành phần 0, với thể người dùng thích sản phẩm, thể chưa có thơng tin Trong trường hợp này, khơng có nghĩa thấp 1, có nghĩa người dùng chưa cung cấp thơng tin Chúng ta xây dựng ma trận với giá trị cao thông qua thời gian số lượt mà người dùng xem sản phẩm Đơi khi, nút dislike mang lại lợi ích định cho hệ thống, lúc gán giá trị tương ứng -1 chẳng hạn 4.1.1.2 Similarity Metrics (Các số tương tự) Sau biểu diễn rating thành Utility Matrix, cột (user) vector với độ dài số lượng item Để dự đốn u0 có thích i2 hay khơng (hình 4.1), ta tìm user có sở thích gần giống với u0, từ dựa đánh giá user gần giống i2 để dự đốn u0 có thích i2 hay khơng Bài tốn đưa dạng xác định mức độ tương tự vector với vector cho Có cách để tính mức độ tương tự chủ yếu sau: - Cosine Similarity - Euclidian Distance - Dot Product - Pearson Similarity Ứng dụng The Reverie Stay sử dụng phương pháp tính độ tương tự Cosine Similarity 40 4.1.1.2.1 Cosine Similarity Hình 4.2 - Cosine Similarity Cosine Similarity phương pháp tính mức độ tương tự hai vector việc tính cosin góc hai vector Cơng thức: similarity(�1, �2) = Trong đó: �1 �2 �1 �2 = � �=1 �1� � �=1 �1� × × �2� � �=1 �2� - u1, u2 vector tương ứng với users 1, - �1 , �2 tích vô hướng vector u1, u2 - �1 �2 độ dài vector u1, u2 Độ similarity hai vector số đoạn [-1, 1] Cosin góc nghĩa góc hai vector 0, thể hai vector hồn tồn tương tự Cosin góc -1 thể hai vector hoàn toàn trái ngược Do đó, hai users tương tự similarity hai vector cao ngược lại 41 Hình 4.3 - Sự tương đồng hai vector 4.1.1.3 Root Mean Squared Error (RMSE) Sử dụng RootMean Squared Error để đánh giá hiệu thuật toán, RMSE tính cơng thức: RMSE = ����� �, �, � ∈ ����� ��� − ��� Trong đó: - ����� : tập kiểm tra - ��� : dự đoán người dùng u item i tập kiểm tra - ��� : dự đoán người dùng u item i theo thuật toán gợi 4.1.2 Phương pháp Các bước thực bao gồm: - Chuẩn bị liệu - Tìm hiểu thuật tốn - Cài đặt thuật tốn, chạy liệu test - Tính RMSE thuật toán so sánh, đánh giá 42 4.1.2.1 Chuẩn bị liệu Bộ liệu sử dụng: MovieLens 100K Dataset công bố năm 1998 GroupLens, bao gồm 100 000 ratings từ 943 users cho 1682 phim Các file cần quan tâm: - u.data: Chứa toàn ratings 943 users cho 1682 movies Mỗi user rate 20 movies - ua.base, ua.test, ub.base, ub.test: hai tập liệu cho training, cho test - u.user: Chứa thông tin users, bao gồm: id, tuổi, giới tính, nghề nghiệp, zipcode (vùng miền), thơng tin ảnh hưởng tới sở thích users Tuy nhiên không sử dụng thông tin này, trừ thông tin id để xác định user khác - u.genre: Chứa tên 19 thể loại phim Các thể loại bao gồm: unknown, Action, Adventure, Animation, Children's, Comedy, Crime, Documentary, Drama, Fantasy, Film-Noir, Horror, Musical, Mystery, Romance, Sci-Fi, Thriller, War, Western - u.item: thông tin phim Trong dịng có id phim, tên phim, ngày phát hành, link imdb, số nhị phân 0, phía cuối để phim thuộc thể loại 19 thể loại cho u.genre Một phim thuộc nhiều thể loại khác Thông tin thể loại dùng để xây dựng item profiles 4.1.2.2 Content-based Recommender System Trong hệ thống content-based, tức dựa nội dung item, cần xây dựng hộ sơ (profile) cho item Profile biểu diễn dạng toán học feature vector Trong trường hợp đơn giản, feature vector trực tiếp trích xuất từ item Các bước thực hiện: - Đọc liệu items - Xây dựng item profiles - Tìm mơ hình cho user 43 Đọc liệu items: đọc liệu items từ file u.item, liệu train từ ua.base, liệu test từ ua.test Hình 4.5 - Kết load liệu Content-based Xây dựng item profile: Vì dựa thể loại phim để xây dựng profile nên quan tâm tới 19 giá trị nhị phân cuối item Sau đó, xây dựng feature vector cho item dựa ma trận thể loại phim feature TF – IDF Hình 4.6 – Ví dụ feature vector item Mỗi hàng tương ứng với feature vector phim Kết dự đoán: Dự đoán rating cho user có id 100, kết dự đốn là: Hình 4.7 – Kết dự đốn theo Content – based Tính tốn RMSE cho tập liệu train liêu test, kết là: Hình 4.8 – RMSE Content – based 4.1.2.3 Neighborhood - based Recommendation System Neighborhood – based hai phương pháp phổ biển Collaborative Filtering Ý tưởng xác định mức độ quan tâm user tới item dựa users khác gần giống với user Việc gần giống users xác định thơng qua mức độ quan tâm 44 users tới items khác mà hệ thống biết Ví dụ, A B thích phim Cơ bé lọ lem, tức rate phim Đồng thời biết A thích phim Hoa Mộc Lan, nhiều khả B thích phim Ở đây, hệ thống gợi ý Neighborhood – based Collaborative Filtering hai câu hỏi quan trọng là: - Làm xác định mức độ giống users? - Khi xác định users gần giống rồi, làm dự đoán mức độ quan tâm user lên item? Việc xác định mức độ quan tâm user tới item dựa mức độ quan tâm users tương tự tới item cịn gọi User – user Collaborative Filtering Có hướng tiếp cận khác Item – item Collaborative Filtering Trong hướng tiếp cận này, thay xác định giống users, hệ thống xác định giống item Từ đó, hệ thống gợi ý items gần giống với items mà user có mức độ quan tâm cao Hình 4.9 – Bảng số user u rate cho item i Giả sử có user từ u0 đến u6 item từ �0 đến �4 , số vng thể số mà user rate cho item với giá trị cao thể mức độ quan tâm cao Các dấu hỏi chấm giá trị mà hệ thống cần phải tìm Đặt mức độ giống user �� , �� sim(�� , ��) Quan sát qua ta nhận thấy �0 , �1 thích �0 , �1 , �2 khơng thích �3 , �4 cho Điều ngược lại xảy user cịn lại Vì vậy, similarity function tốt cần đảm bảo: 45 sim(�0 , �1 ) > sim(�0 , �� ), ∀� > Từ đó, để xác định mức độ quan tâm �0 lên �2 , nên dựa hành vi �1 lên sản phẩm Vì �1 thích �2 nên hệ thống cần gợi ý �2 cho �0 Câu hỏi đặt là: hàm số similarity tốt? Để đo similarity user, cách thường làm xây dựng feature vector cho user áp dụng hàm có khả đo similarity vector Chú ý việc feature vector khác với việc xây dựng item profile Content-based System Các vector xây dựng trực tiếp dựa utility matrix không dùng liệu ngồi item profile Với user, thơng tin mà biết rating mà user thực hiện, tức cột tương ứng user thường rate số lượng nhỏ item Cách khắc phục cách đó, ta giúp hệ thống điền giá trị cho việc điền không làm ảnh hưởng nhiều tới giống vector Việc điền phục vụ cho việc tính similarity khơng phải suy luận giá trị cuối Vậy dấu ‘?’ nên thay giá trị để hạn chế việc sai lệch nhiều? Một lựa chọn nghĩ tới thay dấu ‘?’ giá trị ‘0’ Điều khơng thực tốt giá trị ‘0’ tương ứng với mức độ quan tâm thấp Một giá trị an tồn 2.5 trung bình cộng 0, mức thấp nhất, 5, mức cao Tuy nhiên, giá trị có hạn chế user dễ tính khó tính Với user dễ tính, thích tương ứng với sao, khơng thích chút, chẳng hạn Việc chọn giá trị 2.5 khiến cho item lại negative user Điều ngược lại xảy với user khó tính cho cho item họ thích cho item họ khơng thích Để giải vấn đề này, ta chọn giá trị trung bình cộng rating mà user tương ứng thực Việc tránh việc user q khó tính q dễ tính, tức lúc có item mà user thích so với item khác 46 Các bước thực hiện: - Xây dựng Utility Matrix ban đầu (Hình 4.10 a) - Chuẩn hóa Utility Matrix (Hình 4.10 b) - Xây dựng User Similarity Matrix (Hình 4.10 c) - Dự đốn rating (normalized) cịn thiếu (Hình 4.10 d) - Ví dụ cách dự đoán normalized rating u1 cho i1 - Dự đốn rating (denormalized) cịn thiếu (Hình 4.10 f) Hình 4.10 – Mơ tả bước thực User – user Collaborative Filtering Xây dựng Utility Matrix ban đầu: Đọc liệu items từ file u.item, liệu train từ ub.base, liệu test từ ub.test Thứ tự cột dòng liệu user_id, item_id, rating Chuẩn hóa liệu: Hàng cuối Hình 4.10 a) giá trị trung bình rating cho user Giá trị cao tương ứng với user dễ tính ngược lại Khi tiếp tục trừ từ rating giá trị thay giá trị chưa biết 0, ta ma trận chuẩn hố Hình 4.10 b) Đây bước quan trọng vì: 47 - Việc trừ trung bình cộng cột khiến cột có giá trị dương âm Những giá trị dương tương ứng với việc user thích item, giá trị âm tương ứng với việc user khơng thích item Những giá trị tương ứng với việc chưa xác định liệu user có thích item hay không - Về mặt kỹ thuật, số chiều Utility Matrix lớn với hàng triệu users items, lưu toàn giá trị ma trận khả cao khơng đủ nhớ Quan sát thấy số lượng ratings biết trước thường số nhỏ so với kích thước Utility Matrix, tốt lưu ma trận dạng sparse matrix, tức lưu giá trị khác khơng vị trí chúng Vì vậy, tốt hết, dấu ‘?’ nên thay giá trị “0”, tức chưa xác định liệu user có thích item hay khơng Việc khơng tối ưu nhớ mà việc tính tốn Similarity Matrix sau hiệu Xây dựng User Similarity Matrix: Áp dụng phương pháp tính độ tương tự Cosine Similarity, tính độ tương tự user vector Hình 4.10 b) ta ma trận User similarity matrix S Hình 4.10 c) User similarity matrix S ma trận đối xứng cos hàm chẵn, user A giống user B điều ngược lại Các ô màu xanh đường chéo cos góc vector nó, tức cos(0) = Khi tính tốn bước sau, ta không cần quan tâm tới giá trị Tiếp tục quan sát vector hàng tương ứng với u0, u1, u2 ta thấy vài điều thú vị: - �0 gần với �1 �5 (độ giống dương) user lại Việc similarity cao �0 �1 dễ hiểu có xu hướng quan tâm tới �0 , �1 , �2 item lại Việc �0 gần với �5 đầu vơ lý �5 đánh giá thấp item mà �0 đánh giá cao; nhiên nhìn vào ma trận chuẩn hố hình b), ta thấy điều hợp lý Vì item mà cung cấp thông tin �1 với giá trị tương ứng tích cực - �1 gần với �0 xa user lại - �2 gần với �3 , �4 , �5 , �6 xa user cịn lại 48 Dự đốn rating (normalized) cịn thiếu: Cơng thức phổ biến sử dụng để dự đoán rating u cho i là: ��, � = �� ∈ � (�, �) ��, �� �� ∈ � (�, �) × ���(�, �� ) ���(�, �� ) Trong đó: N(u,i) tập hợp k users neighborhood (có similarity cao nhất) u mà rated i Ví dụ: Tính normalize rating u1 cho i1 cho hình e) với số nearest neighbors k = Các bước thực sau: - Xác định user rate i1, u0, u3, u5 - Xác định similarity u1 user này, ta nhận 0.83, -0.40, 0.23 Hai (k = 2) giá trị lớn 0.83 -0.23 tương ứng với u0 u5 - Xác định normalized rating u0 u5 cho i1, ta thu giá trị 0.75 0.5 - Dự đoán kết quả: ��1 , �1 = 0.83 × 0.75 + (−0.23) × 0.5 0.83 + −0.23 ≈ 0.48 Dự đốn rating (denormalized) cịn thiếu: Việc quy đổi giá trị ratings chuẩn hoá thang thực cách cộng cột ma trận Hình 4.10 d) với giá trị rating trung bình user tính Hình 4.10 a) Kết dự đốn: Hình 4.11 – Kết dự đoán theo Neighborhood – based Collaborative Filtering Tính tốn RMSE cho tập liệu train liêu test, kết là: Hình 4.12 – RMSE Neighborhood – based Collaborative Filtering 49 4.2 Đánh giá 4.2.1 So sánh kết Trên liệu MoviesLens100K, với liệu train từ file ua.base liệu test từ ua.test RMSE training RMSE test Content - based Neighborhood - based 0.9165913297713748 0.7314707613553664 1.250369415208095 0.9951981100882598 Bảng 4.1 – So sánh kết RMSE 4.2.2 Nhận xét Ưu điểm Content - based - Không cần liệu user khác - Có thể gợi ý item mới, item không phổ biến chỉdựa feature vector Neighborhood - based - Đưa gợi ý xác hơndo sử dụng liệu rating từ nhiều user khác - Có thể hoạt động với nhiều loại item khác - Khó để tìm feature cho item - Khơng gợi ý item ngồi user profile - Không khai thác liệu rating user khác - Cần số lượng đủ user hệ thống để tìm gợi ý phù hợp - Utility matrix (ma trận rating) thường thưa thớt dẫn đến khó khăn việc tìm users rate item - Không gợi ý item chưa có rating (item mới) - Có xu hướng gợi ý item phổ biến Nhược điểm Bảng 4.2 – Nhận xét Content – based Neighborhood – based 50 4.3 Áp dụng vào The Reverie Stay 51 Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết đạt - Hiểu biết Flutter, Python áp dụng Firebase, Selenium vào dự án thực tế - Hiểu Machine Learning thuật toán tư vấn, gợi ý khách sạn: Content – based Collaborative Filtering Áp dụng thuật toán vào ứng dụng đánh giá gợi ý khách sạn - Xây dựng ứng dụng đánh giá gợi ý khách sạn có giao diện trực quan, phù hợp với nhu cầu đối tượng người dùng Người dùng xem, tìm kiếm, đánh giá tiêu chuẩn, chia sẻ trải nghiệm bình luận viết khách sạn, địa điểm du lịch - Xây dựng website có giao diện trực quan giúp cho quản trị viên quản lý hệ thống, khách sạn viết chia sẻ hệ thống - Tập trung phát triển tính gợi ý, giới thiệu khách sạn phù hợp, tạo điều kiện thuận lợi cho người dùng - Đảm bảo tính bảo mật thơng tin nhạy cảm người dùng, tạo cảm giác an toàn cho người sử dụng 5.2 Ưu điểm - Hoàn thành ứng dụng khuyến nghị đánh giá khách sạn hoạt động đa tảng đạt mục tiêu đề ban đầu - Tích hợp tính hỗ trợ người dùng khuyến nghị đánh giá khách sạn - Ứng dụng có giao diện đẹp mắt, dễ sử dụng, tạo tâm lý thoải mái hút người sử dụng - Ứng dụng triển khai nghiệm thu thành công máy thật - Đảm bảo tính bảo mật thơng tin nhạy cảm người dùng, tạo cảm giác an toàn, tin cậy 52 5.3 Nhược điểm - Tối ưu code chưa tốt nên tốc độ tương tác ứng dụng chậm - Chưa phát triển tính xác thực qua email, số điện thoại - Chưa tích hợp lọc tìm kiếm chi tiết để người dùng dễ dàng lựa chọn khách sạn phù hợp - Chưa phát triển giao diện web dành cho người dùng - Hệ thống gợi ý đơn giản chưa thực hiệu với trường hợp chưa có liệu 5.4 Hướng phát triển - Xây dựng chức cịn thiếu, hồn thiện chức có - Tối ưu hóa code để tăng tốc độ tương tác - Tối ưu hóa sở liệu hợp lý - Tối ưu hóa hệ thống gợi ý Bổ sung thêm số gợi ý cho người dùng dựa lịch sử tìm kiếm, lịch sử đánh giá… - Phát triển giao diện web phía người dùng để dễ dàng sử dụng ứng dụng nhiều loại thiết bị 53 TÀI LIỆU THAM KHẢO TÀI LIỆU TIẾNG ANH [1] Abhijit Roy “Introduction To Recommender Systems- 1: Content-Based Filtering And Collaborative Filtering” 2020 [Online] Available: https://hub.packtpub.com/how-to-build-a-cold-start-friendly-content-based recommender-using-apache-spark-sql/ [2] “Flutter - Beautiful native apps in record time” [Online] Available: https://flutter.dev/ TÀI LIỆU TIẾNG VIỆT [1] “Machine Learning bản” [Online] Available: https://machinelearningcoban.com/ 54 ... thập xây dựng hệ thống khuyến nghị khách sạn Nghiên cứu thực hóa thuật toán 20 khuyến nghị khách sạn, cụ thể Content-based Collaborative Xây dựng không gian chia sẻ, đánh giá khách sạn dành cho khách. .. chuột hệ thống tin tức Google News 35% sản phẩm bán hệ thống thương mại điện tử Amazon nhờ vào hệ thống khuyến nghị Hệ thống khuyến nghị thường xây dựng tự động dựa hồ sơ (profile) người dùng Hệ thống. .. hỗ trợ tìm kiếm khách sạn thực tế - Tìm hiểu cách xây dựng ứng dụng đa tảng với Flutter - Xây dựng thành cơng ứng dụng có tích hợp hệ thống hỗ trợ khuyến nghị khách 10 sạn Hệ thống đạt hiệu tốt:

Ngày đăng: 24/01/2022, 22:10

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w