1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng hệ thống chatbot sử dụng google bert trong lĩnh vực du lịch việt nam

102 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH ∞0∞ TRẦN DUY LUÂN XÂY DỰNG HỆ THỐNG CHATBOT SỬ DỤNG GOOGLE BERT TRONG LĨNH VỰC DU LỊCH VIỆT NAM Tai Lieu Chat Luong Chuyên ngành: Khoa học máy tính Mã số chuyên ngành: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Giảng viên hướng dẫn: PGS.TS ĐỖ PHÚC TP HỒ CHÍ MINH, NĂM 2021 TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH KHOA ĐÀO TẠO SAU ĐẠI HỌC CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc GIẤY XÁC NHẬN Tôi tên là: Trần Duy Luân Ngày sinh: 13/11/1994 Nơi sinh: TP.HCM Chuyên ngành: Khoa học máy tính Mã học viên: 1784801010025 Tôi đồng ý cung cấp toàn văn thông tin luận văn tốt nghiệp hợp lệ quyền cho Thư viện trường đại học Mở Thành phố Hồ Chí Minh Thư viện trường đại học Mở Thành phố Hồ Chí Minh kết nối toàn văn thông tin luận văn tốt nghiệp vào hệ thống thông tin khoa học Sở Khoa học Cơng nghệ Thành phố Hồ Chí Minh Ký tên (Ghi rõ họ tên) iii CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc Ý KIẾN CHO PHÉP BẢO VỆ LUẬN VĂN THẠC SĨ CỦA GIẢNG VIÊN HƯỚNG DẪN Giảng viên hướng dẫn: PGS.TS Đỗ Phúc Học viên thực hiện: Trần Duy Luân Lớp: MCOM017B Ngày sinh: 13/11/1994 Nơi sinh: Thành phố Hồ Chí Minh Tên đề tài: Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam Ý kiến giáo viên hướng dẫn việc cho phép học viên Trần Duy Luân bảo vệ luận văn trước Hội đồng: Học viên Trần Duy Luận hoàn tất công việc giao Tôi đồng ý cho học viên phép bảo vệ Kính đề nghị nhà trường xem xét Thành phố Hồ Chí Minh, ngày 02 tháng 08 năm 2021 Người nhận xét PGS.TS Đỗ Phúc iv LỜI CAM ĐOAN Tôi cam đoan luận văn “Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam” nghiên cứu tơi Ngoại trừ tài liệu tham khảo trích dẫn luận văn này, tơi cam đoan tồn phần hay phần nhỏ luận văn này chưa công bố sử dụng để nhận cấp nơi khác Khơng có sản phẩm/nghiên cứu người khác sử dụng luận văn này mà khơng trích dẫn theo quy định Luận văn này chưa nộp để nhận cấp trường đại học sở đào tạo khác Tp Hồ Chí Minh, ngày 02 tháng 08 năm 2021 TÁC GIẢ LUẬN VĂN Trần Duy Luân v LỜI CẢM ƠN Trước tiên, xin chân thành gửi lời cám ơn đến trường Đại học Mở Thành phố Hồ Chí Minh tạo điều kiện cho thực đề tài “Xây dựng Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam” Đặc biệt hơn, muốn gửi lời cảm ơn đến PGS TS Đỗ Phúc, người hướng dẫn xuyên suốt thời gian thực đề tài Trong trình thực đề tài, kiến thức khả thân có giới hạn, nên chắn khơng tránh khỏi nhiều sai sót Vì vậy, kính mong đóng góp thầy ngành Khoa học máy tính nhằm giúp đề tài hồn thiện Xin trân trọng cảm ơn vi TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH KHOA SAU ĐẠI HỌC ¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯ TÓM TẮT LUẬN VĂN (Dùng cho học viên người hướng dẫn) Đề tài: “Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam” Ngành: Khoa học máy tính Học viên: Trần Duy Luân Người hướng dẫn: PGS TS Đỗ Phúc Mã số: 1784801010025 NỘI DUNG TÓM TẮT Trải qua nhiều thập kỷ, ứng dụng Chatbot phát triển mạnh mẽ và giúp ích nhiều cho xã hội loài người Nhờ vào việc tích hợp cơng nghệ Trí tuệ nhân tạo nên Chatbot có khả giao tiếp với người và thay người thực số công việc định Hiện nay, Chatbot và áp dụng rộng rãi nhiều lĩnh vực khác nhau, du lịch số Hiện ứng dụng Chatbot dành cho du lịch nhiều, nhiên hầu hết chưa hỗ trợ tiếng Việt tốt, vì mà tác giả đề xuất đề tài “Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam” Hệ thống mà tác giả xây dựng dựa kiến thức đồ thị tri thức, liệu thu thập dựa sơ đồ mạng ba và lưu trữ dạng đồ thị tri thức qua phần mềm quản trị Neo4j Bên cạnh đó, tác giả nghiên cứu kỹ thuật hỏi đáp ngôn ngữ tự nhiên, xử lý ngôn ngữ tự nhiên thông qua thư viện UnderTheSea sử dụng phương pháp BERT để tìm kiếm câu trả lời Đề tài này bao gồm chương: vii Chương 1: Mở đầu giới thiệu đề tài Chương 2: Tởng quan trí tuệ nhân tạo và phương pháp xử lý ngôn ngữ tự nhiên Chương 3: Tổng quan đồ thị tri thức Chương 4: Xây dựng hệ thống Chatbot Hệ thống này xây dựng để hỏi đáp tiếng Việt, và trước mắt xử lý câu hỏi du lịch thành phố Hồ Chi Minh thông qua giao diện web Hướng phát triển đề tài này xây dựng hệ thống Chatbot cao cấp với câu hỏi phức tạp và có áp dụng cho lĩnh vực khác ngoài du lịch TP.Hồ Chí Minh, ngày 02 tháng 08 năm 2021 NGƯỜI HƯỚNG DẪN HỌC VIÊN PGS TS Đỗ Phúc Trần Duy Luân viii HO CHI MINH CITY OPEN UNIVERSITY POST-GRADUATE FACULTY ¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯ TÓM TẮT LUẬN VĂN (TIẾNG ANH) THESIS SUMMARY (For students and instructors) Subject: “Building a Chatbot using Google BERT regarding to Vietnam tourism” Major: Computer Science Student: Luan Tran Duy Instructor: Assoc Pro Ph.D Do Phuc Student code: 1784801010025 SUMMARY CONTENT Over the decades, Chatbot applications have developed very strongly and have greatly helped human society Thanks to the integration of Artificial Intelligence technology, Chatbot has the ability to communicate with humans and can replace humans to perform certain tasks Currently, Chatbot has been widely applied in many different fields, and tourism is one of them Currently, there are many Chatbot applications for tourism, but most of them still not support Vietnamese well, therefore, the author proposed the topic “Building a Chatbot using Google BERT regarding to Vietnam tourism” The system that the author builds is based on knowledge of knowledge graphs, the data is collected based on network diagrams of triplets and stored in the form of knowledge graphs via Neo4j management software In addition, the author researches on natural language questioning and answering techniques, natural language processing through the UnderTheSea library as well as using BERT method to search for answers This thesis consists of chapters: ix Chapter 1: Thesis introduction Chapter 2: Overview of Artificial Intelligence and Natural Language Processing methods Chapter 3: Overview of Knowledge graph Chapter 4: Building the Chatbot system This system is built to answer questions in Vietnamese, and in the immediate future, it handles questions regarding tourism in Ho Chi Minh City through a web interface The future development of the Chatbot will be a more advanced Chatbot system with more complex questions and can be applied to other fields besides tourism Ho Chi Minh City, August 2nd, 2021 INSTRUCTOR STUDENT Assoc Pro Ph.D Do Phuc Luan Tran Duy x MỤC LỤC Trang LỜI CAM ĐOAN v LỜI CẢM ƠN vi TÓM TẮT LUẬN VĂN vii TÓM TẮT LUẬN VĂN (TIẾNG ANH) ix MỤC LỤC xi DANH MỤC HÌNH ẢNH xiv DANH MỤC BẢNG xvi DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT xvii Chương 1: MỞ ĐẦU 1.1 Giới thiệu 1.2 Mục tiêu đề tài 1.3 Phạm vi và đối tượng nghiên cứu 1.4 Nội dung thực 1.5 Phương pháp thực 1.6 Ý nghĩa đề tài Chương 2: TỔNG QUAN VỀ TRÍ TUỆ NHÂN TẠO VÀ CÁC PHƯƠNG PHÁP XỬ LÝ NGÔN NGỮ TỰ NHIÊN 2.1 Đôi nét AI 2.1.1 Khái lược 2.1.2 Lịch sử phát triển 2.1.3 Ứng dụng AI xi VIII Một số dữ liệu về những hoạt động đồ thị tri thức Hoạt động Thuộc tính Giá trị Saigon Water Bus địa Tôn Đức Thắng, P Bến Nghé, Quận 1, Thành phố Hồ Chí Minh Saigon Water Bus hoạt động 08:00 - 19:30 Saigon Water Bus điện thoại 1900 636830 Saigon Water Bus mô hình Xe bt đường thuỷ Saigon Water Bus thích hợp Tham quan thành phố địa 210 Điện Biên Phủ, Phường 7, Quận 3, Thành phố Hồ Chí Minh hoạt động 08:00 - 18:00 điện thoại 091 367 44 12 mơ hình Xe bt tham quan thích hợp Tham quan thành phố Xe buýt tầng Hopon Hop-off Xe buýt tầng Hopon Hop-off Xe buýt tầng Hopon Hop-off Xe buýt tầng Hopon Hop-off Xe buýt tầng Hopon Hop-off 72 74 TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH KHOA ĐÀO TẠO SAU ĐẠI HỌC CỘNG HOÀ Xà HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc Thành phố Hồ Chí Minh, ngày 09 tháng 09 năm 2021 BIÊN BẢN HỘI ĐỒNG CHẤM LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH Căn Quyết định số 1643/QĐ-ĐHM, ngày 12 tháng 08 năm 2021 Hiệu trưởng Trường Đại học Mở Thành phố Hồ Chí Minh việc thành lập Hội đồng chấm và phản biện luận văn thạc sĩ chuyên ngành Khoa học máy tính, Hội đồng tiến hành chấm luận văn thạc sĩ cho học viên vào Tối ngày 09 tháng 09 năm 2021, Phòng 106 , 97 Võ Văn Tần, P.6, Q.3, TP HCM I Học viên: HỌ TÊN LUẬN VĂN GVHD KHÓA Trần Duy Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam PGS TS Đỗ Phúc 2017 Luân II Thành viên hội đồng chấm: thành viên - Chủ tịch Hội đồng: TS GVCC Lê Xuân Trường - Phản biện 1: PGS TS Nguyễn Hòa - Phản biện 2: TS Phạm Văn Chung - Ủy viên: TS Nguyễn Tiến Đạt - Thư ký: TS Trương Hoàng Vinh Số thành viên có mặt: Số thành viên vắng mặt: Kết thúc buổi bảo vệ luận văn ngày 9/9/21, Sau tổng kết phiếu đánh giá luận văn thạc sĩ, Hội đồng thống kết đánh giá luận văn cho học viên cụ thể sau: 75 III Kết quả đánh giá luận văn: Điểm trung bình số Điểm trung bình chữ 7.96 Bảy Chín Sáu IV Ý kiến hội đồng: - Phần thực nghiệm có hạn chế, 100 câu, đề xuất phải tăng thêm lên hàng ngàn câu để phản ánh độ xác thực tế hệ thống -Các công thức là chụp màn hình và khơng quản lý Ví dụ trang 25, 27 -Các hình 3.1, 3.2 cần tự vẽ lại -Tài liệu tham khảo cách trích dẫn chưa theo format V Thời hạn nộp luận văn chỉnh sửa theo yêu cầu HĐ: 01 tuần kể từ ngày bảo vệ luận văn Họ và Tên: Chủ tịch: Ký tên: GVCC TS Lê Xuân Trường Phản biện1: PGS TS Nguyễn Hòa Phản biện2: TS Phạm Văn Chung Ủy viên: TS Nguyễn Tiến Đạt Thư ký: TS Trương Hoàng Vinh * Cán kiểm tra đối chiếu phiếu điểm ký tên xác nhận: 76 TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH KHOA ĐÀO TẠO SAU ĐẠI HỌC CỘNG HOÀ Xà HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHẬN XÉT LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH KHMT (Nhận xét Chủ tịch/Ủy viên/Thư ký) Học viên: Trần Duy Luân Lớp: ……………… Tên đề tài: Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam Giảng viên hướng dẫn: PGS TS Đỗ Phúc Người nhận xét: TS Trương Hoàng Vinh NỘI DUNG NHẬN XÉT I PHẦN NHẬN XÉT: Về tính cấp thiết, ý nghĩa khoa học thực tiễn đề tài: Đề tài có ý nghĩa thực tiễn có tính khoa học Về độ tin cậy phù hợp đề tài (trong nêu rõ không trùng lặp đề tài, phù hợp tên đề tài với nội dung, nội dung với chuyên ngành đào tạo;độ tin cậy tính đại phương pháp nghiên cứu…) Đề tài có dựa số tài liệu tham khảo năm gần Ưu điểm và nhược điểm về nội dung, kết cấu hình thức luận văn 3.1 Ưu điểm Có tính thực tế 3.2 Hạn chế -Phần thực nghiệm có hạn chế, 100 câu, đề xuất phải tăng thêm lên hàng ngàn câu để phản ánh độ xác thực tế hệ thống -Các công thức chụp màn hình và không quản lý Ví dụ trang 25, 27 -Các hình 3.1, 3.2 cần tự vẽ lại -Tài liệu tham khảo cách trích dẫn chưa theo format II PHẦN CÂU HỎI (Nếu có) 77 III KẾT LUẬN (cần khẳng định mức độ đáp ứng yêu cầu luận văn cao học) Đáp ứng luận văn cao học Thành phố Hồ Chí Minh, ngày tháng năm 2021 NGƯỜI NHẬN XÉT (ký ghi rõ họ tên) TS Trương Hoàng Vinh 78 TRƯỜNG ĐẠI HỌC MỞ CỘNG HOÀ Xà HỘI CHỦ NGHĨA VIỆT NAM THÀNH PHỐ HỒ CHÍ MINH Độc lập - Tự - Hạnh phúc KHOA ĐÀO TẠO SAU ĐẠI HỌC NHẬN XÉT LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH ……Khoa Học Máy Tính…… (Nhận xét Ủy viên) Học viên: ……Trần Duy Luân……… Lớp: …2018…… Tên đề tài: XÂY DỰNG HỆ THỐNG CHATBOT SỬ DỤNG GOOGLE BERT TRONG LĨNH VỰC DU LỊCH VIỆT NAM Giảng viên hướng dẫn: ……PGS TS Đỗ Phúc……… Người nhận xét: ……TS Nguyễn Tiến Đạt………… NỘI DUNG NHẬN XÉT I PHẦN NHẬN XÉT: Về tính cấp thiết, ý nghĩa khoa học thực tiễn đề tài: ➢ Đề tài có tính thực tiễn: phục vụ cho dịch vụ du lịch TpHCM ➢ Đề tài có ý nghĩa khoa học: dựa vào kết nghiên cứu để xây dựng hệ thống hỏi đáp du lịch cụ thể ➢ Có khả ứng dụng vào đơn vị dịch vụ du lịch, website, diểm hướng dẫn,… Về độ tin cậy phù hợp đề tài (trong nêu rõ khơng trùng lặp đề tài, phù hợp tên đề tài với nội dung, nội dung với chuyên ngành đào tạo;độ tin cậy tính đại phương pháp nghiên cứu…) ➢ Đề tài không trùng lặp chép ➢ Nội dung tác giả tìm hiểu, trình bày thử nghiệm hoàn toàn phù hợp với tên đề tài, phú hợp chuyên ngành đào tạo ➢ Phạm vi nghiên cứu, phương pháp nghiên cứu nội dung thực đạt yêu cầu Ưu điểm và nhược điểm về nội dung, kết cấu hình thức luận văn 3.1 Ưu điểm ➢ Luận văn trình bày rõ ràng, nội dung súc tích và theo đề cương nghiên cứu vạch ➢ Tác giả đánh giá khách quan kết nghiên cứu thực nghiệm ➢ Tác giả trình bày ưu/nhược kết nghiên cứu đưa nguyên nhân dẫn đến hạn chế kết thực nghiệm 79 ➢ Các lý thuyết tham khảo đượx tác giả tìm hiểu vận dụng phù hợp, tài liệu tham khảo phần lớn kết NCKH gần 3.2 Hạn chế ➢ Các hình vẽ nên có tính minh họa cụ thể với đoạn văn diễn giải (ví dụ hình 3.5 3.6 cần thể Hà Nội với VN, Bitexco với chiều cao thay hình khơng liên quan) ➢ Lưu ý phần ghi tài liệu tham khảo ➢ Bộ liệu thuộc tính tảm mạn nên đánh giá kết khó khách quan Nên cần có liệu mà đồ thị tri thức phức tạp để thử nghiệm ➢ Ví dụ Hồng Phát bán hủ tíu Nam Vang, giá 100 ngàn, đường Võ Văn Tần, ăn kèm há cảo Alo Bếp bán hủ tíu Nam Vang, giá 75 ngàn, đường CMT8 với “Hủ tíu Nam Vang”, “há cảo” là node đồ thị, tương tự “Võ văn Tần”, “CMT8” là node đồ thị II PHẦN CÂU HỎI: ➢ Tình khách du lịch có định danh hồn tồn khơng có khái niệm loại node Ví dụ “Trần Hưng Đạo” là: tên đường, tên trường, tên tượng đài thì xử lý sao? ➢ Có khả xử lý câu hỏi tởng qt thay câu hỏi cụ thể Ví dụ thay hỏi Tháp Bitexco cao bao nhiêu? Tháp Bitexco mở cửa vào nào? Tháp Bitexco có tầng? hỏi Cho biết thông tin tháp Bitexco? ➢ Có khả “dẫn dắt” câu trả lời Ví dụ “Tháp nào cao TpHCM” thì câu trả lời gợi ý thêm số tịa nhà khác “Tháp Bitexco đâu:” câu trả lời là đường Hải Triều gợi ý số thơng tin liên quan đường Hải Triều (nhà hàng, pub, shopping,…) ➢ Các cụm từ đồng nghĩa: Nhà thờ Đức Bà thành lập/xây dựng/xuất hiện/có/ nào? ➢ Các câu hỏi đảo ngữ: Ai xây tháp Bitexco/Tháp Bitexco xây ➢ Vấn đề phân tích câu hỏi liệu có hồn thiện hay chấp nhận câu hỏi có mức độ đơn giản? Nếu chấp nhận (hiểu xử lý) câu hỏi đơn giản thì nêu ưu điể hệ thống chatbot so với hệ thống giao tiếp truyền thống thực đơn, chọn lựa, tìm kiếm, III KẾT LUẬN (cần khẳng định mức độ đáp ứng yêu cầu luận văn cao học) Đề tài đạt yêu cầu luận văn Thạc Sĩ ngành Khoa Học Máy Tính 80 Thành phố Hồ Chí Minh, ngày 09 tháng 09 năm 2021 NGƯỜI NHẬN XÉT (ký ghi rõ họ tên) Nguyễn Tiến Đạt 81 TRƯỜNG ĐẠI HỌC MỞ CỘNG HOÀ Xà HỘI CHỦ NGHĨA VIỆT NAM THÀNH PHỐ HỒ CHÍ MINH Độc lập - Tự - Hạnh phúc KHOA ĐÀO TẠO SAU ĐẠI HỌC NHẬN XÉT PHẢN BIỆN LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH Học viên: Trần Duy Luân Tên đề tài: Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam Giảng viên hướng dẫn: PGS.TS Đỗ Phúc Người phản biện: PGS.TS Nguyễn Hòa NỘI DUNG NHẬN XÉT I PHẦN NHẬN XÉT: Về tính cấp thiết, ý nghĩa khoa học thực tiễn đề tài: Các hệ thống Chatbot công cụ hỗ trợ tương tác thời gian thực ngôn ngữ tự nhiên nhiều lĩnh vực kinh tế, kỹ thuật và đời sống xã hội Đề tài “Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam.” là có ý nghĩa khoa học cấp thiết ứng dụng thực tế liên quan đến du lịch Việt Nam Về độ tin cậy phù hợp đề tài (trong nêu rõ khơng trùng lặp đề tài, phù hợp tên đề tài với nội dung, nội dung với chuyên ngành đào tạo;độ tin cậy tính đại phương pháp nghiên cứu…) Nội dung nghiên cứu và tên đề tài phù hợp với chun ngành đào tạo Khoa học Máy tính Khơng có trùng lặp tên nội dung đề tài với tên nội dung đề tài nghiên cứu công bố Phương pháp nghiên cứu dựa việc xem xét, đánh giá ưu điểm hạn chế nghiên cứu hướng công bố để đề xuất mơ hình, cơng cụ kỹ thuật phù hợp Phương pháp đủ tin cậy Ưu điểm và nhược điểm về nội dung, kết cấu hình thức luận văn 3.1 Ưu điểm Luận văn giới thiệu số kỹ thuật lĩnh vực AI xử lý ngôn ngữ tự nhiên là tảng lý thuyết công nghệ cho hệ thống Chatbot Luận văn khảo sát số hệ thống Chatbot Apple Siri (2011), Google Now (2012), Amazon Alexa (2014), Microsoft Cortana (2014), Google Assistant (2016) Facebook Messenger (2016) Trên sở luận văn sử dụng mơ hình CSDL đồ thị tri thức để biểu diễn thực thể, đối tượng, thuộc tính mối quan hệ chúng 82 lĩnh vực du lịch Việt Nam dựa phần mềm Neo4j là hệ quản trị CSDL đồ thị tri thức, kết hợp với biểu diễn mã hóa hai chiều BERT để rút trích thơng tin truy vấn phát triển Chatbot tương tác tiếng Việt Kết đề tài luận văn là phần mềm Chatbot ngôn ngữ tự nhiên lĩnh vực du lịch Việt Nam 3.2 Hạn chế Luận văn khảo sát số nghiên cứu loại chưa nêu rõ ưu điểm hạn chế nghiên cứu để làm động lực cho đề tài luận văn Luận văn dừng lại mức sử dụng công cụ Neo4j là hệ quản trị CSDL kết hợp với biểu diễn mã hóa hai chiều BERT để thực phần mềm Chatbot Phần mềm Chatbot đơn giản, khả tương tác và độ xác thơng thơng tin trả cịn thấp Số tài liệu tham khảo cịn ít, nhiều tài liệu tham khảo không qui cách, thiếu thông tin, thiếu nơi xuất số trang II PHẦN CÂU HỎI (Nếu có) Nêu rõ khác biệt và tương đồng mơ hình đồ thị tri thức mơ hình semantic web? III KẾT LUẬN (cần khẳng định mức độ đáp ứng yêu cầu luận văn cao học; luận văn đưa Hội đồng chấm luận văn hay không) Luận văn đáp ứng yêu cầu luận văn cao học Luận văn đưa Hội đồng chấm luận văn TP.HCM, ngày 05 tháng 09 năm 2021 NGƯỜI NHẬN XÉT (ký ghi rõ họ tên) PGS.TS Nguyễn Hòa 83 TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH KHOA ĐÀO TẠO SAU ĐẠI HỌC CỘNG HOÀ Xà HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHẬN XÉT PHẢN BIỆN LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH Học viên: TRẦN DUY LUÂN Lớp: MCOM017B Tên đề tài: XÂY DỰNG HỆ THỐNG CHATBOT SỬ DỤNG GOOGLE BERT TRONG LĨNH VỰC DU LỊCH VIỆT NAM Giảng viên hướng dẫn: PGS.TS Đỗ Phúc Người phản biện: TS Phạm văn Chung NỘI DUNG NHẬN XÉT I PHẦN NHẬN XÉT: Về tính cấp thiết, ý nghĩa khoa học thực tiễn đề tài: - - - - Cơng nghệ Chatbot trí tuệ nhân tạo có khả giao tiếp với người thay người thực số công việc số lãnh vực định, có du lịch ứng dụng Chatbot nhiều Hướng tiếp cận luận văn là dựa đồ thị tri thức, liệu thu thập dựa sơ đồ mạng phần mềm quản trị Neo4j Luận văn đóng góp cơng tác nghiên cứu kỹ thuật hỏi đáp ngôn ngữ tự nhiên Xử lý ngôn ngữ tự nhiên thông qua thư viện UnderTheSea c ng sử dụng phương pháp ERT để t m kiếm câu trả lời Thực việc xử lý câu hỏi du lịch thành phố Hồ Chi Minh thơng qua giao diện web Nội dung luận văn là: Xây dựng hệ thống Chatbot hỏi đáp tiếng Việt, khối lượng câu hỏi đáp liên quan đến l nh vực du lịch Việt Nam Đánh giá điểm mạnh, điểm yếu, để có hướng mở rộng đề tài sau Đề tài đóng góp việc phát triển ứng dụng Chatbot dùng ngôn ngữ tiếng Việt, thiết kế giao diện trực quan tảng web Nó có ý ngh a thực tiễn Về độ tin cậy phù hợp đề tài (trong nêu rõ khơng trùng lặp đề tài, phù hợp tên đề tài với nội dung, nội dung với chuyên ngành đào tạo;độ tin cậy tính đại phương pháp nghiên cứu…) - Nghiên cứu số khái niệm lý thuyết, hoạt động liên quan đến Chatbot, Google BERT thuật toán hỏi đáp nay, Xây dựng hệ thống Chatbot ngơn ngữ lập tr nh Python, tích hợp công nghệ oogle ERT 84 - Chatbot Xây dựng lược đồ tri thức chứa liệu liên quan đến du lịch Việt Nam va liên kết với Chatbot Phát triển Chatbot dạng API để dễ dàng sử dụng từ tảng khác như: web form, mobile application, v.v Đề tài khơng có trùng lắp với công tr nh công bố Nội dung luận văn phù hợp với tên đề tài c ng chuyên ngành khoa học máy tính Ưu điểm và nhược điểm về nội dung, kết cấu hình thức luận văn 3.1 Ưu điểm - - Luận văn tham khảo 13 công tr nh tạp chí đáng tin cậy, 11 công tr nh công bố năm trở lại Có phần đánh giá và phân tích kết phần thực nghiệm kỹ thuật mà luận văn sử dụng Kết cấu, bố cục luận rõ dàng dễ đọc, chương phân chia hợp lý 3.2 Hạn chế Có hình ảnh khơng phải trắng đen, cần phải in cứng có màu tài liệu[7] có tham khảo khơng? Đánh số lại mục tham khảo theo yêu cầu nhà trường Hiện mục đánh số khơng liên tục Ví dụ tài liệu [6] đứng sau tài liệu [8] II PHẦN CẦU HỎI (Nếu có) ……………………………………………………………………………………… ……………………………………………………………………………………… III KẾT LUẬN (cần khẳng định mức độ đáp ứng yêu cầu luận văn cao học; luận văn đưa Hội đồng chấm luận văn hay không) Luận văn đạt kết luận văn thạc sĩ ngành khoa học máy tính Thành phố Hồ Chí Minh, ngày 08 tháng năm 2021 NGƯỜI NHẬN XÉT (ký ghi rõ họ tên) Phạm văn Chung 85 TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH HỘI ĐỒNG CHẤM LUẬN VĂN THẠC SĨ CỘNG HOÀ Xà HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BIÊN BẢN ĐIỀU CHỈNH THEO GÓP Ý CỦA HỘI ĐỒNG (Bảo vệ ngày 09 tháng 09 năm 2021) Tên Học viên: Trần Duy Luân Tên Đề Tài: Xây dựng hệ thống Chatbot sử dụng Google BERT lĩnh vực du lịch Việt Nam Những điều cần chỉnh sửa theo góp ý Hội Đồng STT Nội dung Trang, mục Phần thực nghiệm có Trang 58 Những điều đã chỉnh sửa Nội dung đã chỉnh sửa Đã chỉnh sửa thực hạn chế, 100 nghiệm lên thành 1.000 câu, đề xuất phải tăng câu Trang, mục Trang 58 thêm lên hàng ngàn câu để phản ánh độ xác thực tế hệ thống Các cơng thức là không quản lý Trang 38 Đã vẽ lại hình 3.1 và 3.2 Trang 38 Trang 62 Đã chỉnh sửa tài liệu tham khảo và cách trích dẫn Trang 62 tự vẽ lại Tài liệu tham khảo và Trang 25 27 chụp màn hình và Các hình 3.1, 3.2 cần Trang 25 27 Đã viết lại cơng thức cách trích dẫn chưa theo format 86 Nhận xét HĐ Nhận xét GVHD Tên học viên Lê Xuân Trường PGS TS Đỗ Phúc Trần Duy Luân 87

Ngày đăng: 04/10/2023, 01:37

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w