Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 62 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
62
Dung lượng
157,23 KB
Nội dung
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỊA Xà HỘI CHỦ NGHĨA VIỆT NAM Do - Hạnh Phúc Độc Lập - Tự TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP CỦA CÁN BỘ HƯỚNG DẪN) Tên khóa luận: HỆ THỐNG KHUYẾN NGHỊ DU LỊCH Nhóm SV thực hiện: Cán hướng dẫn: Phan Ngọc Quý Đánh giá Khóa luận Nguyễn Minh Trí Về 15520706 15520924 Nguyễn Hà Giang TS báo cáo: ThS Nguyễn Thị Thanh Trúc Số trang _ Số chương Số bảng số liệu _ Số hình vẽ Số tài liệu tham khảo _ Sản phẩm • Một số nhận xét hình thức báo cáo: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Về nội dung nghiên cứu: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Về chương trình ứng dụng: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Về thái độ làm việc sinh viên: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Đánh giá chung: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Điểm sinh viên: Phan Ngọc Quý :……… /10 Nguyễn Minh Trí :……… /10 Người nhận xét (Ký tên ghi rõ họ tên) CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM ĐẠI QUỐC TP HỒ MINH HỌC GIA CHÍ Do - Hạnh Phúc Độc Lập - Tự TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP PHẢN BIỆN) (CỦA CÁN BỘ Tên khóa luận: HỆ THỐNG KHUYẾN NGHỊ DU LỊCH Nhóm SV thực hiện: Cán phản biện: Phan Ngọc Q Nguyễn Minh Trí Đánh giá Khóa luận 15520706 15520924 Về báo cáo: Số trang _ Số chương _ Số bảng số liệu _ Số hình vẽ _ Số tài liệu tham khảo _ Sản phẩm _ • Một số nhận xét hình thức báo cáo: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Về nội dung nghiên cứu: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Về chương trình ứng dụng: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Về thái độ làm việc sinh viên: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Đánh giá chung: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Điểm sinh viên: Phan Ngọc Quý : ……… /10 Nguyễn Minh Trí :……… /10 Người nhận xét (Ký tên ghi rõ họ tên) CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM Độc Lập - Tự ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Do - Hạnh Phúc TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THÔNG TIN TP HCM, ngày 15 tháng 06 năm 2020 ĐỀ CƯƠNG CHI TIẾT TÊN ĐỀ TÀI: Hệ thống khuyến nghị du lịch Travel recommender system Cán hướng dẫn: TS Nguyễn Hà giang - ThS Nguyễn Thị Thanh Trúc Thời gian thực hiện: Từ ngày 13/04/2020 đến ngày 13/08/2020 Sinh viên thực hiện: Phan Ngọc Quý – 15520706 Nguyễn Minh Trí – 15520924 Nội dung đề tài: Mục tiêu : Hệ thống khuyến nghị du lịch hỗ trợ người dùng chọn địa điểm cho chuyến du lịch, địa điểm du lịch đề xuất dựa sở thích, nhu cầu người dùng Cở sở để đánh giá sở thích nhu cầu người dùng hệ thống thói quen, lịch sử tìm kiếm web họ Tuy nhiên, trường hợp kết nối internet lịch sử tìm kiếm web không đầy đủ, dự án sử dụng cách tiếp cận, đánh giá dựa bảng câu hỏi khảo sát Phạm vi: Phạm vi địa lý: Dữ liệu địa điểm du lịch khuyến nghị giới hạn khu vực Châu Á Phạm vi chức năng: ▪ Khả thu thập liệu điểm tham quan từ nguồn liệu đáng tin cậy ( Trip Advisor) ▪ Phân tích, thiết kế liệu điểm tham quan thu thập để xây dựng thành sở liệu hệ thống ▪ Sử dụng Web API để thu thập thơng tin từ lịch sử tìm kiếm người dùng ▪ Xây dựng mơ hình để phân tích, so sánh tương đồng liệu tìm kiếm người dùng so với danh mục điểm du lịch hệ thống ▪ Xây dựng thuật tốn tìm kiếm để tìm xếp hạng thành phố, điểm du lịch phù hợp ▪ Xây dựng GUI sử dụng cho máy tính để bàn máy tính cá nhân Đối tượng sử dụng: Người có nhu cầu du lịch Đối tượng thường tập trung từ độ tuổi 20 trở lên Người có máy tính để bàn máy tính cá nhân Phương pháp thực hiện: Làm việc nhóm thành viên, nghiên cứu, sử dụng công cụ, công nghệ sau để xây dựng hệ thống: ▪ Xây dựng hệ thống khuyến nghị sử dụng ngôn ngữ Python ▪ Trip Advisor Web API để thu thập liệu thành phố, điểm du lịch Phần lớn thời gian làm việc nhóm nhà, tuần liên lạc với giáo viên lần để trình bày kết quả, nghe nhận xét từ giáo viên nhóm khác đưa kế hoạch Bắt đầu vào 13/4/2020 kết thúc vào tháng năm 2020 Giai đoạn Thời gian Công việc Giai đoạn 1: Khảo sát, nghiên cứu 13/4 /2020 – 3/5/2020 - Lựa chọn đề tài - Phát biểu toán - Xác định yêu cầu, phạm vi, tính cho hệ thống - Khám phá xác định thành phố,địa điểm du lịch cho việc thu thập liệu - Tìm hiểu cơng nghệ, cơng cụ sử dụng để xây dựng hệ thống Giai đoạn 2: Khai thác liệu & Xử lý 3/5/2020 – 31/5/2020 - Thu thập liệu thành phố, điểm du lịch từ nguồn web - Phân tích cấu trúc lại liệu thu thập để xử lý thêm Xây dựng mơ hình để dự đốn sở thích du lịch người dùng dựa thói quen duyệt web - Tiến hành khảo sát để xác định yếu tố ảnh hưởng đến sở thích người dùng xây dựng mơ hình - Thu thập, xử lý tệp liệu tranning hệ thống Giai đoạn 3: Phát triển ứng dụng Tháng 6/2020 – 12/7/2020 - Xây dựng mơ hình nâng cao để dự đốn sở thích du lịch người dùng dựa thói quen duyệt web từ kết khảo sát - Phát triển thuật tốn tìm kiếm thành phố, điểm đủ lịch phù hợp với sở thích người dùng từ liệu có Danh sách thuật ngữ từ lịch sử tim kiếm điểm tham quan theo danh mục nhóm lại Danh mục du lịch dự đoán hàng đầu Thành phố khuyến nghị Chế độ dự đoán Sử dụng Nhấn nút để xem phương thức offline khuyến nghị thành phố Hinh 9: Giao diện khuyến nghị thành công thơng qua lịch sử duyệt web 49 Hinh 10: Ví dụ danh sách hoạt động nhấn chọn menu tab 4.3.3 Màn hình chế độ offline Chế độ ngoại tuyến kích hoạt thơng qua điều kiện: Ứng dụng phát khơng có truy cập internet 50 Ứng dụng hoàn thành phân tích lịch sử trinh duyệt khơng đủ liệu Người dùng chọn phương pháp thử Dùng thử ngoại tuyến Người dùng yêu cầu tra lời danh sách ngắn câu hỏi ban thân cách qua tab bên trái giao diện người dùng Menu chọn bang câu hỏi để lấy thơng tin Hinh 11: Màn hinh chế độ offline 51 Hinh 12: Màn hinh danh sách câu hỏi 52 CHƯƠNG KẾT QUẢ THỰC NGHIỆM Trong chương đánh giá kết hiệu suất hệ thống khuyến nghị thực Mơ hình xử lý liệu lịch sử duyệt web nhằm phân loại website vào danh mục du lịch phù hợp mơ hình NB với mục TF-IDF sử dụng để thực dự đốn sở thích du lịch người dùng Độ xác dự đốn phụ thuộc nhiều vào tập liệu huấn luyện sử dụng Hiện mơ hình xây dựng dựa số website phân loại thủ cơng theo nhóm liệt kê Bảng No Attraction Categories Website Count Food & Drinks 91 Shopping 60 Outdoor Activities 46 Museums 56 Spa & Wellness 64 Nightlife 61 Nature 52 Sights and Landmarks 55 None 17 Total: 502 Bang 3: Danh sách số lượng website sử dụng tập liệu đào tạo Bên cạnh danh mục du lịch xác định trước, nhóm thêm danh mục None để phục vụ đào tạo hệ thống xác định website không thuộc danh mục 53 Với dataset có tỷ lệ ���������������� ���������������� �������� ����������������= 20, 80 sử dụng state = 8, độ xác mơ hình 84,2% Kết cho thấy mơ hình đào tạo đầy đủ để nhận phương sai lớn chủ đề phụ chủ đề Các báo cáo phân loại liệt kê Bảng No Attraction Precision Recall F1-score Support Categories Food & Drinks 0.6757 1.000 0.8065 25 Shopping 0.8571 0.5455 0.6667 11 Outdoor Activities 1.0000 0.6667 0.8000 Museums 0.9000 0.7500 0.8182 12 Spa & Wellness 1.000 0.8333 0.9091 18 Nightlife 0.9231 0.9231 0.9231 13 Nature 1.000 0.8571 0.9231 Sights and 0.9091 0.9091 0.9091 11 0.000 0.000 0.000 0.8416 101 Landmarks None Accuracy: Macro avg: 0.8072 0.7205 0.7506 101 Weighted avg: 0.8626 0.8416 0.8370 101 Bang 4: Báo cáo phân loại cho tập liệu đào tạo Trong trường hợp chúng em, thước đo tương đồng phù hợp dùng Khoảng cách Euclid hai vector chọn định nghĩa Dựa vào bảng , danh mục Food & Drink xuất nhiều kết phân loại tích cực khơng (recall cao, precision thấp), danh mục Outdoor 54 Activities Shopping dự đốn (recall thấp, precision cao) Đây số lượng token danh mục du lịch Shopping có 4,623 tokens, cịn Food & Drink có tới 8.789 tokens Điều làm cho danh mục Food & Drink có khả định nhiều Trong tương lai mở rộng hệ thống, vấn đề giải cách them nhiều mẫu vào dataset để tăng số lương token danh mục Nhìn chung, việc xác đinh hồ sơ du lịch người dùng coi hoạt động đầy đủ dựa phản hồi thu thập qua thử nghiệm 55 CHƯƠNG KẾT LUẬN 6.1 Tổng kết Nhìn chung, việc xác đinh hồ sơ du lịch người dùng coi hoạt động đầy đủ dựa phản hồi thu thập qua thử nghiệm Ở khóa luận này, tốn Hệ thống khuyến nghị du lịch thực thành cơng Trong q trình tìm hiểu, thực vày kiểm nghiệm kết nhóm thực lại, dựa theo phân tích tìm hiểu mơ hình, nhóm có thêm nhiều kiếm thức, như: • Hiểu phát biểu toán Hệ thống khuyến nghị du lịch khác biệt so với hệ thống hành khác • Kiến thức lập máy học • Kỹ thuật khai thác liệu • Mơ hình Nạve Bayesian cho xử lý ngơn ngữ tự nhiên • Kỹ thuật tìm kiếm thỏa mãn ràng buộc 6.2 Khó khăn thuận lợi Tuy nhóm cịn phải đối mặt với khó khăn suốt trinh thực khóa luận Trước hết lựa chọn đề tài cho khóa luận, nhóm tốn nhiều thời gian để tìm nghiên cứu ứng dụng công nghệ thông tin ngày rộng, việc tìm vấn đề cụ thể, có khả thực thi chung chung; định hướng cho đề cương tìm hiểu, đề tài mới, lại đòi hỏi kiến thức tảng lĩnh vực trí tuệ nhân tạo kỹ thuật lập trình Python, nhóm bắt đầu số khơng Máy móc, thiết bị phần cứng để xử lý lượng lớn liệu địi hỏi cấu hình đủ mạnh, tốc độ xử lý nhanh; Kinh nghiệm lập trình sửa lỗi máy học nhóm chưa có nên gặp lỗi thực mơ hình chiếm nhiều thời gian nhóm Dù khó khăn, thách thức mà nhóm đối mặt nhiều đổi lại hỗ trợ nhiệt tình từ Giảng viên hướng dẫn Thầy, cô định hướng tìm hiểu, phân 56 tích khía cạnh tốn, vấn đề mắc phải để tìm hướng giải giúp cho nhóm đẩy nhanh việc nghiên cứu hai mơ-đun tốn 6.3 Hướng phát triển Danh sách điểm tham quan điểm đến giới hạn châu Á, mở rộng sở liệu điển tham quan quốc gia khác giới Độ xác kết khuyến nghị có cải thiện cách sử dụng mơ hình khác để dự đốn, chẳng hạn Support Vector Machine(SVM) Ngoài ra, thu thập thơng tin người dùng từ tảng truyền thông xã hội Facebook Twitter Bằng cách khai thác liệu đó, việc phân tích dự đốn u thích người dùng chủ đề cụ thể hiểu rõ nhiều Nhóm có hướng đến tảng di động đường tuyệt vời để phát triển hệ thống Các tảng có lợi có sẵn gần 24/7người dùng, thu nhiều nội dung so với máy tính để bàn, máy tinh cá nhân 57 58 ... quan Hệ thống khuyến nghị du lịch hệ thống giúp đưa gợi ý kế hoạch chuyến địa điểm du lịch cho phù hợp với người dùng, có yếu tố ảnh hưởng lớn đến định thực chuyến du lịch tới họ Ở số hệ thống khuyến. .. tích đưa kết khuyến nghị phù hợp Khóa luận hướng tới việc thực lại hệ thống khuyến nghị du lịch thông minh dựa việc thu thập lịch sử tìm kiếm web người dùng để phân tích sở thích du lịch họ Kết... liệu, báo, kỹ trình bày nội dung 18 TĨM TẮT KHĨA LUẬN Mục tiêu đề tài • Hệ thống khuyến nghị du lịch hỗ trợ người dùng chọn địa điểm cho chuyến du lịch, địa điểm du lịch đề xuất dựa sở thích,