khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

58 23 0
khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM PHAN NGỌC Q NGUYỄN MINH TRÍ KHĨA LUẬN TỐT NGHIỆP HỆ THỐNG KHUYẾN NGHỊ DU LỊCH TRAVEL RECOMMENDER SYSTEM KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM TP HỒ CHÍ MINH, 2020 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM PHAN NGỌC QUÝ – 15520706 NGUYỄN MINH TRÍ - 15520924 KHÓA LUẬN TỐT NGHIỆP HỆ THỐNG KHUYẾN NGHỊ DU LỊCH TRAVEL RECOMMENDER SYSTEM KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM GIẢNG VIÊN HƯỚNG DẪN TS NGUYỄN HÀ GIANG THS NGUYỄN THỊ THANH TRÚC TP HỒ CHÍ MINH, 2020 DANH SÁCH HỘI ĐỒNG BẢO VỆ KHÓA LUẬN Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số …………………… ngày ………………… Hiệu trưởng Trường Đại học Công nghệ Thông tin ………………………………………… – Chủ tịch ………………………………………… – Thư ký ………………………………………… – Ủy viên ………………………………………… – Ủy viên ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ HƯỚNG DẪN) Tên khóa luận: HỆ THỐNG KHUYẾN NGHỊ DU LỊCH Cán hướng dẫn: Nhóm SV thực hiện: Phan Ngọc Quý 15520706 TS Nguyễn Hà Giang Nguyễn Minh Trí 15520924 ThS Nguyễn Thị Thanh Trúc Đánh giá Khóa luận Về báo cáo: Số trang _ Số chương Số bảng số liệu _ Số hình vẽ Số tài liệu tham khảo _ Sản phẩm • Một số nhận xét hình thức báo cáo: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Về nội dung nghiên cứu: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Về chương trình ứng dụng: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Về thái độ làm việc sinh viên: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Đánh giá chung: ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… ……………………………………………………………………………………………………… Điểm sinh viên: Phan Ngọc Quý :……… /10 Nguyễn Minh Trí :……… /10 Người nhận xét (Ký tên ghi rõ họ tên) ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ PHẢN BIỆN) Tên khóa luận: HỆ THỐNG KHUYẾN NGHỊ DU LỊCH Nhóm SV thực hiện: Cán phản biện: Phan Ngọc Quý 15520706 Nguyễn Minh Trí 15520924 Đánh giá Khóa luận Về báo cáo: Số trang _ Số chương _ Số bảng số liệu _ Số hình vẽ _ Số tài liệu tham khảo _ Sản phẩm _ • Một số nhận xét hình thức báo cáo: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Về nội dung nghiên cứu: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Về chương trình ứng dụng: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Về thái độ làm việc sinh viên: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Đánh giá chung: …………………………………………………………………………………… …………………………………………………………………………………… …………………………………………………………………………………… Điểm sinh viên: Phan Ngọc Quý :……… /10 Nguyễn Minh Trí :……… /10 Người nhận xét (Ký tên ghi rõ họ tên) ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày 15 tháng 06 năm 2020 ĐỀ CƯƠNG CHI TIẾT TÊN ĐỀ TÀI: Hệ thống khuyến nghị du lịch Travel recommender system Cán hướng dẫn: TS Nguyễn Hà giang - ThS Nguyễn Thị Thanh Trúc Thời gian thực hiện: Từ ngày 13/04/2020 đến ngày 13/08/2020 Sinh viên thực hiện: Phan Ngọc Quý – 15520706 Nguyễn Minh Trí – 15520924 Nội dung đề tài: Mục tiêu : Hệ thống khuyến nghị du lịch hỗ trợ người dùng chọn địa điểm cho chuyến du lịch, địa điểm du lịch đề xuất dựa sở thích, nhu cầu người dùng Cở sở để đánh giá sở thích nhu cầu người dùng hệ thống thói quen, lịch sử tìm kiếm web họ Tuy nhiên, trường hợp khơng có kết nối internet lịch sử tìm kiếm web khơng đầy đủ, dự án sử dụng cách tiếp cận, đánh giá dựa bảng câu hỏi khảo sát Phạm vi: Phạm vi địa lý: Dữ liệu địa điểm du lịch khuyến nghị giới hạn khu vực Châu Á Phạm vi chức năng: ▪ Khả thu thập liệu điểm tham quan từ nguồn liệu đáng tin cậy ( Trip Advisor) ▪ Phân tích, thiết kế liệu điểm tham quan thu thập để xây dựng thành sở liệu hệ thống ▪ Sử dụng Web API để thu thập thông tin từ lịch sử tìm kiếm người dùng ▪ Xây dựng mơ hình để phân tích, so sánh tương đồng liệu tìm kiếm người dùng so với danh mục điểm du lịch hệ thống ▪ Xây dựng thuật tốn tìm kiếm để tìm xếp hạng thành phố, điểm du lịch phù hợp ▪ Xây dựng GUI sử dụng cho máy tính để bàn máy tính cá nhân Đối tượng sử dụng: Người có nhu cầu du lịch Đối tượng thường tập trung từ độ tuổi 20 trở lên Người có máy tính để bàn máy tính cá nhân Phương pháp thực hiện: Làm việc nhóm thành viên, nghiên cứu, sử dụng công cụ, công nghệ sau để xây dựng hệ thống: ▪ Xây dựng hệ thống khuyến nghị sử dụng ngôn ngữ Python ▪ Trip Advisor Web API để thu thập liệu thành phố, điểm du lịch ▪ Orange3 Excel để phân tích liệu ▪ PyKE (Python Knowledge Engine) cho lập trình logic ▪ TKinker để phát triển GUI Kế hoạch thực hiện: Phần lớn thời gian làm việc nhóm nhà, tuần liên lạc với giáo viên lần để trình bày kết quả, nghe nhận xét từ giáo viên nhóm khác đưa kế hoạch Bắt đầu vào 13/4/2020 kết thúc vào tháng năm 2020 Giai đoạn Giai đoạn 1: Khảo sát, nghiên cứu Thời gian 13/4 /2020 – 3/5/2020 Công việc - Lựa chọn đề tài - Phát biểu toán - Xác định yêu cầu, phạm vi, tính cho hệ thống - Khám phá xác định thành phố,địa điểm du lịch cho việc thu thập liệu - Tìm hiểu cơng nghệ, cơng cụ sử dụng để xây dựng hệ thống Giai đoạn 2: Khai thác liệu & Xử lý 3/5/2020 – 31/5/2020 - Thu thập liệu thành phố, điểm du lịch từ nguồn web - Phân tích cấu trúc lại liệu thu thập để xử lý thêm - Xây dựng mơ hình để dự đốn sở thích du lịch người dùng dựa thói quen duyệt web - Tiến hành khảo sát để xác định yếu tố ảnh hưởng đến sở thích người dùng xây dựng mơ hình - Thu thập, xử lý tệp liệu tranning hệ thống - Xây dựng mơ hình nâng cao để dự đốn sở thích du lịch người dùng dựa thói quen duyệt web từ kết khảo sát - Phát triển thuật tốn tìm kiếm thành phố, điểm đủ lịch phù hợp với sở thích người dùng từ liệu có Giai đoạn 3: Phát Tháng 6/2020 – triển ứng dụng 12/7/2020 4.2 Attraction search Mục tiêu mơ-đun tìm thành phố phù hợp với sở thích thể loại du lịch người dùng Phương pháp tiếp cận gồm phần, mô tả bên 4.2.1 Attraction database Xây dựng sở liệu điểm tham quan quốc gia toàn giới Với yêu cầu này, TripAdvisor lựa chọn sử dụng lý sau: - Cở sở liệu TripAdvisor lớn, phong phú - Có entries xếp hạng theo mức độ phổ biến với nhiều đánh giá người dùng - Cung cấp hỗ trợ API6 cho phép thu thập liệu Tổng cộng có 125.000 điểm tham quan nhà hàng khắp Châu Á thu thập xử lý thành sở liệu điểm tham quan cho hệ thống Sau xử lý liệu điểm tham quan thu thập thành file CSV lưu trữ thông tin cần thiết cho điểm đến bao gồm: Tên cột Ý nghĩa country Tên đất nước điểm tham quan city Tên thành phố điểm tham quan name Tên điểm tham quan category Phân loại điểm đến, gồm loại nêu Bảng raw_ranking Xếp hạng du khách bình chọn, từ đến ranking_position Xếp hạng phổ biến so với điểm tham quan khác thành phố photo_url Hình ảnh điểm tham quan (nếu có) TripAdvisor API: third-party API host RapidApi.com 44 web_url Website điểm tham quan (nếu có) description Mơ tả điểm tham quan (nếu có) Bả ng 2: Mô tả thông tin điểm tham quan 4.2.2 City characteristics Trước tìm thành phố phù hợp với hồ sơ du lịch người dùng, đặc điểm du lịch thành phố phải xác định Nó tương ứng với attraction categories nêu Bảng Sự bật attraction categories cho thành phố phản ánh qua intracity score, tính sau: 𝑖𝑛𝑡𝑟𝑎𝑐𝑖𝑡𝑦 𝑠𝑐𝑜𝑟𝑒 = 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑎𝑐𝑡𝑖𝑣𝑖𝑡𝑖𝑒𝑠 𝑤𝑖𝑡ℎ 𝑟𝑎𝑤 𝑟𝑎𝑛𝑘𝑖𝑛𝑔 𝑎𝑏𝑜𝑣𝑒 𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑 𝑡𝑜𝑡𝑎𝑙 𝑎𝑐𝑡𝑖𝑣𝑖𝑡𝑖𝑒𝑠 Ví dụ : Trong 100 điểm đến thuộc loại “shopping” Tokyo, 20 số có điểm xếp hạng 4.0 Vậy, intracity score “shopping” 20/100 = 0.2 Xét thành phố nhỏ Đà Nẵng, giả sử intracity score “shopping” tương tự 0.2 có 2/10 điểm đến có xếp hạng 4.0 Mặc dù điểm số giống hệt cho hai thành phố, Tokyo cung cấp nhiều đa dạng lựa chọn điểm mua sắm Do để phân biệt bật “shopping” họ , intercity score xuất hiện: 𝑖𝑛𝑡𝑒𝑟𝑐𝑖𝑡𝑦 𝑠𝑐𝑜𝑟𝑒 = 𝑡𝑜𝑡𝑎𝑙 𝑎𝑐𝑡𝑖𝑣𝑖𝑡𝑖𝑒𝑠 − 𝑚𝑖𝑛𝑖𝑚𝑢𝑚 𝑡𝑜𝑡𝑎𝑙 𝑎𝑐𝑡𝑖𝑣𝑖𝑡𝑖𝑒𝑠 𝑚𝑎𝑥𝑖𝑚𝑢𝑚 𝑡𝑜𝑡𝑎𝑙 𝑎𝑐𝑡𝑖𝑣𝑖𝑡𝑖𝑒𝑠 − 𝑚𝑖𝑛𝑖𝑚𝑢𝑚 𝑡𝑜𝑡𝑎𝑙 𝑎𝑐𝑡𝑖𝑣𝑖𝑡𝑖𝑒𝑠 Ví dụ: Thống kế tổng số điểm đến “shopping” Beijing, Đà Nẵng Taipei 210, 57 164, suy intercity score Taipei cho “shopping” là: 164 − 57 = 0.7 210 − 57 Trong Đà Nẵng có điểm intercity core 45 Nói chung , intracity score nói lên bật danh mục du lịch khác thành phố intercity score nói lên phong phú danh mục du lịch lên tất thành phố sở liệu Sự ảnh hưởng hai điểm số kết hợp thành điểm tổng thể định nghĩa tổ hợp tuyến tính lồi hai điểm số phương trình 𝑐𝑎𝑡𝑒𝑔𝑜𝑟𝑦 𝑠𝑐𝑜𝑟𝑒 = 𝑤𝑒𝑖𝑔ℎ𝑡 𝑥 𝑖𝑛𝑡𝑟𝑎𝑐𝑖𝑡𝑦 𝑠𝑐𝑜𝑟𝑒 + (1 − 𝑤𝑒𝑖𝑔ℎ𝑡 ) 𝑥 𝑖𝑛𝑡𝑒𝑟𝑐𝑖𝑡𝑦 𝑠𝑐𝑜𝑟𝑒 Hình bên cho thấy ví dụ cách tính intracity score cho danh mục du lịch ba thành phố Trong thành phố, danh mục du lịch sau xếp hạng theo điểm Trong tính tốn, nhằm nhấn mạnh lớn tính phân loại bật thành phố cách gán weight 0.8 Hình 6: Xếp hạng danh mục du lịch cho thành phố dựa điểm 4.2.3 Matching city search Giả sử dựa kết hồ sơ người dùng, xế hạng ba loại du lịch hàng đầu An là: Shopping Food & Drink Nightlife Trong số ba thành phố Hình 7, đâu nơi tốt phù hợp với sở thích du lịch An? Một cách để trả lời câu hỏi so sánh mức độ yêu thích A xếp hạng danh mục bật thành phố cách sử dụng 46 số biện pháp tính tốn độ tương tự Biện pháp thơng dụng - Cosine similarity, khơng phù hợp bối cảnh nhóm em đề bỏ qua khác biệt độ lớn hai vecter so sánh Ví dụ: Giả sử xếp hạng Shopping, Food & Drink, Nightlife xếp hạng (1, 2, 3) (2, 4, 6) tương ứng cho Bangkok Đà Nẵng Quá rõ ràng Bangkok phù hợp với sở thích du lịch An, Cosine lại cho kết cho thành phố so sánh với hồ sơ du lịch Trong trường hợp chúng em, thước đo tương đồng phù hợp dùng Khoảng cách Euclid hai vector chọn định nghĩa Kết tính tốn ln khoảng từ đến 1, giá trị lớn tương đồng hai vector gần 𝑠𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 𝑚𝑒𝑎𝑠𝑢𝑟𝑒 = 1 + ||𝑣 ⃗⃗⃗⃗⃗⃗⃗⃗⃗ 𝑣𝑐𝑖𝑡𝑦 || 𝑢𝑠𝑒𝑟 − ⃗⃗⃗⃗⃗⃗⃗⃗ Ví dụ: Điểm tương đồng dựa xếp hạng danh mục du lịch – order core (xem Hình 7) Beijing tính sau: 𝑜𝑟𝑑𝑒𝑟 𝑠𝑐𝑜𝑟𝑒 = 1 + √(1 − 5)2 + (2 − 4)2 + (3 − 3)2 = 0.183 Trong trường hợp hai thành phố có order core nhau, thành phố với điểm số tổng thể tốt chọn Nghĩa là, điểm số hoàn hảo danh mục du lịch đạt Xem xét Beijing , điểm số Shopping, Food & Drink, Nightlife tương ứng (0,539, 0,584, 0,7) Khoảng cách tiến tới giá trị hoàn hảo (1, 1, 1) – magnitude score tính tốn phép tính similarity measure 𝑚𝑎𝑔𝑛𝑖𝑡𝑢𝑑𝑒 𝑠𝑐𝑜𝑟𝑒 = = 0.592 + √(1 − 0.539)2 + (1 − 0.584)2 + (1 − 0.7)2 Order score magnitude score tính tốn cho thành phố cịn lại tóm tắt hình 47 Hình 7: Selection score & ranking thành phố Tổng thể lại, selection score lấy trung bình order score magnitude score, sử dụng để xếp hạng thành phố phù hợp Thành phố có thứ hạng cao chọn phù hợp với hồ sơ du lịch người dùng Trong ví dụ đưa ra, Taipei phù hợp với sở thích An 4.3 Giao diện hệ thống 4.3.1 Màn hình chờ phân tích lịch sử duyệt web Nếu hệ thống phát người dùng trực tuyến có đủ thơng tin lịch sử duyệt để dự đốn, hình tải hiển thị Hình Hiển thị số lượng mục tìm kiếm tìm thấy ước tính thời gian cần thiết để hồn thành phân tích Chọn nút Skip để kết thúc phân tích sớm Lưu ý: kết thúc sớm làm giảm tính xác dự Hình 8: Màn hình loading hệ thống phân tích lịch sử duyệt web đốn 48 4.3.2 Màn hình kết khuyết nghị Sau hồn thành phân tích có liệu khuyến nghị phù hợp Các menu điều hướng Phân loại thuật ngữ từ lịch sử tìm kiếm Danh sách điểm tham quan theo Danh mục du lịch danh mục dự đoán hàng đầu nhóm lại Thành phố khuyến nghị Chế độ dự đoán Sử dụng phương thức Nhấn nút để xem offline khuyến nghị thành phố Hình 9: Giao diện khuyến nghị thành công thông qua lịch sử duyệt web 49 Hình 10: Ví dụ danh sách hoạt động nhấn chọn menu tab 4.3.3 Màn hình chế độ offline Chế độ ngoại tuyến kích hoạt thơng qua điều kiện: Ứng dụng phát khơng có truy cập internet 50 Ứng dụng hồn thành phân tích lịch sử trình duyệt không đủ liệu Người dùng chọn phương pháp thử Dùng thử ngoại tuyến Người dùng yêu cầu trả lời danh sách ngắn câu hỏi thân cách qua tab bên trái giao diện người dùng Menu chọn bảng câu hỏi để lấy thơng tin Hình 11: Màn hình chế độ offline 51 Hình 12: Màn hình danh sách câu hỏi 52 CHƯƠNG KẾT QUẢ THỰC NGHIỆM Trong chương đánh giá kết hiệu suất hệ thống khuyến nghị thực Mơ hình xử lý liệu lịch sử duyệt web nhằm phân loại website vào danh mục du lịch phù hợp mơ hình NB với mục TF-IDF sử dụng để thực dự đoán sở thích du lịch người dùng Độ xác dự đoán phụ thuộc nhiều vào tập liệu huấn luyện sử dụng Hiện mơ hình xây dựng dựa số website phân loại thủ cơng theo nhóm liệt kê Bảng No Attraction Categories Website Count Food & Drinks 91 Shopping 60 Outdoor Activities 46 Museums 56 Spa & Wellness 64 Nightlife 61 Nature 52 Sights and Landmarks 55 None 17 Total: 502 Bả ng 3: Danh sách số lượng website sử dụng tập liệu đào tạo Bên cạnh danh mục du lịch xác định trước, nhóm thêm danh mục None để phục vụ đào tạo hệ thống xác định website không thuộc danh mục 53 Với dataset có tỷ lệ 𝑡𝑟𝑎𝑛𝑛𝑖𝑛𝑔 𝑑𝑎𝑡𝑎𝑠𝑒𝑡𝑠 𝑡𝑒𝑠𝑡 𝑑𝑎𝑡𝑎𝑠𝑒𝑡𝑠 = 80 20 , sử dụng state = 8, độ xác mơ hình 84,2% Kết cho thấy mơ hình đào tạo đầy đủ để nhận phương sai lớn chủ đề phụ chủ đề Các báo cáo phân loại liệt kê Bảng No Attraction Precision Recall F1-score Support Categories Food & Drinks 0.6757 1.000 0.8065 25 Shopping 0.8571 0.5455 0.6667 11 Outdoor Activities 1.0000 0.6667 0.8000 Museums 0.9000 0.7500 0.8182 12 Spa & Wellness 1.000 0.8333 0.9091 18 Nightlife 0.9231 0.9231 0.9231 13 Nature 1.000 0.8571 0.9231 Sights and 0.9091 0.9091 0.9091 11 0.000 0.000 0.000 0.8416 101 Landmarks None Accuracy: Macro avg: 0.8072 0.7205 0.7506 101 Weighted avg: 0.8626 0.8416 0.8370 101 Bả ng 4: Báo cáo phân loại cho tập liệu đào tạo Trong trường hợp chúng em, thước đo tương đồng phù hợp dùng Khoảng cách Euclid hai vector chọn định nghĩa Dựa vào bảng , danh mục Food & Drink xuất nhiều kết phân loại tích cực khơng (recall cao, precision thấp), danh mục Outdoor 54 Activities Shopping dự đốn (recall thấp, precision cao) Đây số lượng token danh mục du lịch Shopping có 4,623 tokens, cịn Food & Drink có tới 8.789 tokens Điều làm cho danh mục Food & Drink có khả định nhiều Trong tương lai mở rộng hệ thống, vấn đề giải cách them nhiều mẫu vào dataset để tăng số lương token danh mục Nhìn chung, việc xác đinh hồ sơ du lịch người dùng coi hoạt động đầy đủ dựa phản hồi thu thập qua thử nghiệm 55 CHƯƠNG KẾT LUẬN 6.1 Tổng kết Nhìn chung, việc xác đinh hồ sơ du lịch người dùng coi hoạt động đầy đủ dựa phản hồi thu thập qua thử nghiệm Ở khóa luận này, toán Hệ thống khuyến nghị du lịch thực thành cơng Trong q trình tìm hiểu, thực vày kiểm nghiệm kết nhóm thực lại, dựa theo phân tích tìm hiểu mơ hình, nhóm có thêm nhiều kiếm thức, như: • Hiểu phát biểu tốn Hệ thống khuyến nghị du lịch khác biệt so với hệ thống hành khác • Kiến thức lập máy học • Kỹ thuật khai thác liệu • Mơ hình Nạve Bayesian cho xử lý ngơn ngữ tự nhiên • Kỹ thuật tìm kiếm thỏa mãn ràng buộc 6.2 Khó khăn thuận lợi Tuy nhóm cịn phải đối mặt với khó khăn suốt trinh thực khóa luận Trước hết lựa chọn đề tài cho khóa luận, nhóm tốn nhiều thời gian để tìm nghiên cứu ứng dụng công nghệ thông tin ngày rộng, việc tìm vấn đề cụ thể, có khả thực thi chung chung; định hướng cho đề cương tìm hiểu, đề tài mới, lại đòi hỏi kiến thức tảng lĩnh vực trí tuệ nhân tạo kỹ thuật lập trình Python, nhóm bắt đầu số khơng Máy móc, thiết bị phần cứng để xử lý lượng lớn liệu địi hỏi cấu hình đủ mạnh, tốc độ xử lý nhanh; Kinh nghiệm lập trình sửa lỗi máy học nhóm chưa có nên gặp lỗi thực mơ hình chiếm nhiều thời gian nhóm Dù khó khăn, thách thức mà nhóm đối mặt nhiều đổi lại hỗ trợ nhiệt tình từ Giảng viên hướng dẫn Thầy, định hướng tìm hiểu, phân 56 tích khía cạnh tốn, vấn đề mắc phải để tìm hướng giải giúp cho nhóm đẩy nhanh việc nghiên cứu hai mơ-đun tốn 6.3 Hướng phát triển Danh sách điểm tham quan điểm đến giới hạn châu Á, mở rộng sở liệu điển tham quan quốc gia khác giới Độ xác kết khuyến nghị có cải thiện cách sử dụng mơ hình khác để dự đốn, chẳng hạn Support Vector Machine(SVM) Ngồi ra, thu thập thông tin người dùng từ tảng truyền thông xã hội Facebook Twitter Bằng cách khai thác liệu đó, việc phân tích dự đốn u thích người dùng chủ đề cụ thể hiểu rõ nhiều Nhóm có hướng đến tảng di động đường tuyệt vời để phát triển hệ thống Các tảng có lợi có sẵn gần 24/7người dùng, thu nhiều nội dung so với máy tính để bàn, máy tinh cá nhân 57 58 ... quan Hệ thống khuyến nghị du lịch hệ thống giúp đưa gợi ý kế hoạch chuyến địa điểm du lịch cho phù hợp với người dùng, có yếu tố ảnh hưởng lớn đến định thực chuyến du lịch tới họ Ở số hệ thống khuyến. .. Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ PHẢN BIỆN) Tên khóa luận: HỆ THỐNG KHUYẾN NGHỊ DU LỊCH Nhóm SV thực hiện: Cán phản... tích đưa kết khuyến nghị phù hợp Khóa luận hướng tới việc thực lại hệ thống khuyến nghị du lịch thông minh dựa việc thu thập lịch sử tìm kiếm web người dùng để phân tích sở thích du lịch họ Kết

Ngày đăng: 05/09/2021, 20:48

Hình ảnh liên quan

- Xây dựng mơ hình để dự đốn sở thích du lịch của người dùng dựa  trên thĩi quen duyệt web - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

y.

dựng mơ hình để dự đốn sở thích du lịch của người dùng dựa trên thĩi quen duyệt web Xem tại trang 10 của tài liệu.
Hình 1: Sơ đồ phân khúc thị trường - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

Hình 1.

Sơ đồ phân khúc thị trường Xem tại trang 21 của tài liệu.
Luồng xử lý của tồn hệ thống được minh họa trong Hình 5ở trên. Chương này tĩm tắt các tính năng và quy trình làm việc của từng hệ thống phụ - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

u.

ồng xử lý của tồn hệ thống được minh họa trong Hình 5ở trên. Chương này tĩm tắt các tính năng và quy trình làm việc của từng hệ thống phụ Xem tại trang 39 của tài liệu.
Thuật tốn Nạve Bayesian (NB) đã được chọn cho mơ hình này do nĩ tương đối dễ dàng cho đào tạo cũng như dễ dàng phát triển cho mục đích NLP - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

hu.

ật tốn Nạve Bayesian (NB) đã được chọn cho mơ hình này do nĩ tương đối dễ dàng cho đào tạo cũng như dễ dàng phát triển cho mục đích NLP Xem tại trang 42 của tài liệu.
category Phân loại điểm đến, gồm 8 loại nêu ở Bảng 1 raw_ranking  Xếp hạng do du khách bình chọn, từ 0 đến 5  - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

category.

Phân loại điểm đến, gồm 8 loại nêu ở Bảng 1 raw_ranking Xếp hạng do du khách bình chọn, từ 0 đến 5 Xem tại trang 44 của tài liệu.
Hình bên dưới cho thấy một ví dụ về cách tính intracity score cho 8 danh mục du lịch trên ba thành phố - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

Hình b.

ên dưới cho thấy một ví dụ về cách tính intracity score cho 8 danh mục du lịch trên ba thành phố Xem tại trang 46 của tài liệu.
4.3.1 Màn hình chờ phân tích lịch sử duyệt web - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

4.3.1.

Màn hình chờ phân tích lịch sử duyệt web Xem tại trang 48 của tài liệu.
4.3.2 Màn hình kết quả khuyết nghị - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

4.3.2.

Màn hình kết quả khuyết nghị Xem tại trang 49 của tài liệu.
4.3.3 Màn hình chế độ offline - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

4.3.3.

Màn hình chế độ offline Xem tại trang 50 của tài liệu.
Hình 11: Màn hình chế độ offline - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

i.

̀nh 11: Màn hình chế độ offline Xem tại trang 51 của tài liệu.
Dựa vào bảng này, danh mục Food & Drink xuất hiện rất nhiều kết quả phân loại tích cực khơng đúng (recall cao,  precision thấp), trong khi danh mục Outdoor  - khóa luận tốt nghiệp hệ THỐNG KHUYẾN NGHỊ DU LỊCH

a.

vào bảng này, danh mục Food & Drink xuất hiện rất nhiều kết quả phân loại tích cực khơng đúng (recall cao, precision thấp), trong khi danh mục Outdoor Xem tại trang 54 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan