Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 61 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
61
Dung lượng
5,74 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC Xây dựng Chatbot tư vấn hướng dẫn tự chăm sóc sức khỏe nhà với bệnh nhân nhiễm/nghi nhiễm virus SARS-CoV-2 NGÀNH: KHOA HỌC MÁY TÍNH HỘI ĐỒNG: KHOA HỌC MÁY TÍNH 11 GVHD: PGS TS Quản Thành Thơ ThS Mai Đức Trung GVPB: ThS Lê Đình Thuận SVTH1: Bùi Trần Cơng Minh - 1813060 SVTH2: Đồn Quang Chính - 1810685 TP HỒ CHÍ MINH, THÁNG 5/2022 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Lời cam đoan Chúng xin cam đoan rằng, luận văn tốt nghiệp "Xây dựng Chatbot tư vấn triệu chứng hướng dẫn tự chăm sóc sức khỏe nhà với bệnh nhân nhiễm/nghi nhiễm virus SARS-CoV-2" công trình nghiên cứu chúng tơi hướng dẫn thầy PGS TS Quản Thành Thơ, xuất phát từ nhu cầu thực tiễn đại dịch covid-19 diễn gây ảnh hưởng lớn tới sống nguyện vọng tìm hiểu thân chúng tơi Ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, nội dung trình bày luận văn kết nghiên cứu thực kết luận văn chưa cơng bố trước hình thức TP Hồ Chí Minh, ngày tháng năm Nhóm tác giả Bùi Trần Cơng Minh Luận văn tốt nghiệp - Năm học 2021-2022 Đồn Quang Chính Trang 1/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Lời cảm ơn Chúng tơi xin cảm ơn PGS TS Quản Thành Thơ tận tình giúp đỡ chúng tơi q trình thực đề tài Sự nhiệt tình lời động viên, dẫn góp ý vơ giá thầy giúp chúng tơi hồn thành tốt luận văn tốt nghiệp Chúng xin cảm ơn TS Nguyễn Như Vinh anh chị sinh viên đến từ trường Đại học Y Dược thành phố Hồ Chí Minh nhiệt tình giúp đỡ nhóm việc gán nhãn, thu thập liệu góp ý q trình thực đề tài Luận văn tốt nghiệp - Năm học 2021-2022 Trang 2/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Tóm tắt Hiện với phát triển kỹ thuật Trí Tuệ Nhân Tạo (Artificial Intelligence), hệ thống Chatbot thơng minh thu hút nhiều ý tính hiệu chúng việc thay người nhiều lĩnh vực Trong lĩnh vực y tế, ứng dụng Chatbot quan tâm lĩnh vực có nhu cầu lớn từ cộng đồng địi hỏi nhân lực có trình độ định tham gia tư vấn Để xây dựng Chatbot phục vụ người dân hiệu lĩnh vực y tế, thách thức cần phải giải bao gồm: (i) tích hợp kiến thức y tế chuyên ngành vào sở tri thức Chatbot; (ii) huấn luyện cho Chatbot giao tiếp hiệu với người ngôn ngữ tự nhiên Trong đề tài này, giải vấn đề phương pháp học máy tiên tiến để xây dựng Chatbot tư vấn cho người dùng vấn đề y tế liên quan đến triệu chứng hậu Covid Đây vấn đề cấp thiết có tính ứng dụng cao TPHCM nói riêng Việt Nam nói chung sau phần khống chế đại dịch Covid-19 Hệ thống Chatbot trình triển khai thử nghiệm Đại học Y dược TPHCM ghi nhận phản hồi tích cực từ người dùng Luận văn nhóm trình bày Hội nghị Khoa học cơng nghệ lần thứ 15: Hướng tới mạng lưới bác sĩ gia đình thơng minh tổ chức Đại học Y khoa Phạm Ngọc Thạch Luận văn tốt nghiệp - Năm học 2021-2022 Trang 3/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Mục lục Danh sách hình vẽ Danh sách bảng biểu Giới thiệu 1.1 Đặt vấn đề 1.2 Ví dụ minh họa 1.3 Mục tiêu đề tài 1.3.1 Mục tiêu 1.3.2 Các giai đoạn thực 1.4 Tổng quan báo cáo Kiến thức tảng 2.1 Chatbot 2.2 Giao thức Websocket 2.3 Intent 2.4 Entity 2.5 Thuật toán Support Vector Machine (SVM) 2.6 Thuật Toán K-Nearest Neighbors (KNN) 2.7 Mơ Hình Transformer 2.7.1 Tổng quan mơ hình 2.7.2 Cơ chế Self-Attention 2.7.3 Multi-Head Attention 2.7.4 Mã hố vị trí (Positional Encoding) 2.8 Mơ Hình Bert 2.8.1 Tổng quan 2.8.2 Kiến trúc 2.8.3 Huấn luyện BERT 2.8.3.1 Masked Language Model (MLM) 2.8.3.2 Next Sentence Prediction (NSP) 2.8.3.3 Phương pháp Fine-tuning BERT 2.8.4 RoBERTa 2.8.5 PhoBERT 2.9 Hệ thống TODS 2.9.1 Khối Natural Language Understanding (NLU) 2.9.2 Khối Dialogue Manager (DM) 2.9.3 Khối Natural Language Generation (NLG) 9 10 10 10 10 11 12 12 14 14 15 15 17 17 17 18 19 20 21 21 21 21 21 22 23 24 25 26 27 27 28 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Cơng nghệ sử dụng 3.1 Ngơn ngữ lập trình 3.1.1 Python 3.1.2 Javascript 3.2 Framework Library 3.2.1 React 3.2.2 FastAPI 3.2.3 Botkit 3.3 Công cụ 3.3.1 Google Colab 3.3.2 MongoDB - Mongo Atlas 3.3.3 Heroku Thiết kế thực hệ thống 4.1 Tổng quan kiến trúc chức 4.1.1 Định nghĩa intent, entity cho Chatbot 4.1.2 Các yêu cầu hệ thống 4.1.3 Kiến trúc 4.1.3.1 Natural Language Understanding 4.1.3.2 Dialogue Manager 4.1.3.3 Natural Language Generation 4.1.4 Các khó khăn 4.2 Lưu trữ liệu truy vấn 4.2.1 Thu thập liệu 4.2.2 Xây dựng sở liệu hệ thống 4.2.3 Xử lí truy vấn liệu 4.3 Huấn luyện mơ hình 4.3.1 Mơ hình SVM thứ 4.3.2 Mơ hình SVM thứ hai 4.3.3 Mô hình Named Entity Recognition 4.3.4 Mơ hình KNN tìm kiếm câu hỏi gần với tin dùng 4.3.5 Huấn luyện lại mơ hình Chatbot với liệu 4.4 Kết thực Chatbot nhắn người 29 29 29 30 30 30 31 31 32 32 32 33 34 34 34 36 37 37 38 38 39 39 39 41 42 45 46 47 49 52 54 54 Tổng kết 57 5.1 Các công việc đạt 57 5.2 Các hạn chế 57 5.3 Mục tiêu phát triển 58 Tài liệu tham khảo Luận văn tốt nghiệp - Năm học 2021-2022 58 Trang 5/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Danh sách hình vẽ 1.1 1.2 Thống kê số ca mắc covid tháng năm 2022 Ví dụ minh hoạ đoạn hội thoại tư vấn Chatbot 10 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 Cách thức hoạt động Chatbot Kiến trúc mô hình khái qt hóa (Generative model)[11] Kiến trúc mơ hình truy vấn (Retrieval-based model)[11] Mô tả siêu phẳng phân tách tập liệu[10] Mô tả đường phân chia tốt tập liệu[10] Thuật toán KNN[9] Kiến trúc Transformer[15] Ví dụ attention transformer[16] Mô tả bước tính ma trận attention[16] Positional Encoding kiến trúc Transformer[15] Mô tả q trình add vector thể vị trí vào vector Embedding[13] Kiến trúc Masked LM[3] Mơ tả input cho tốn Next Sentence Prediction[3] BERT nhiều loại toán xử lí ngơn ngữ tự nhiên khác nhau[12] Trích từ paper RoBERTa[4] Hiệu mơ hình với tập data NER NLI[6] Kiến trúc hệ thống TODs[5] 12 13 13 16 16 17 18 18 19 20 21 22 23 24 25 25 26 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 Ngơn ngữ lập trình Python Ngơn ngữ lập trình Javascript Reactjs FastAPI Botkit Google Colab MongoDB Heroku 29 30 31 31 32 32 33 33 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 Kiến trúc tổng thể Chatbot Kiến trúc khối NLU Kiến trúc khối Dialogue Policy Kiến trúc khối NLG Trang web tư vấn covid: https://www.icliniq.com/qa/covid-19 Chi tiết hội thoại tư vấn covid Dữ liệu phản hồi cho kịch tư vấn triệu chứng Dữ liệu phản hồi cho kịch tư vấn thông tin chung Các siêu tham số tốt sau sử dụng RandomizedSearchCV 37 37 38 39 40 40 41 42 46 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính 4.10 4.11 4.12 4.13 4.14 4.15 4.16 4.17 4.18 4.19 4.20 4.21 4.22 4.23 4.24 4.25 4.26 4.27 Dữ liệu huấn luyện mơ hình thứ Kết huấn luyện mơ hình thứ Các siêu tham số tốt sau sử dụng RandomizedSearchCV Dữ liệu huấn luyện mô hình thứ hai Kết huấn luyện mơ hình thứ hai Kịch chẩn đoán khả nhiễm bệnh Dữ liệu thu thập từ VinAI[14] Kiến trúc mơ hình phobert cho tốn NER Quá trình training theo micro-f1-score Quá trình training theo Cross-entropy loss Kết mô hình Ví dụ tập data mẫu Ví dụ phản hồi mơ hình KNN Ví dụ liệu hội thoại lưu trữ sở liệu Kịch cung cấp thông tin liên hệ Kịch cung cấp thông tin số ca nhiễm Kịch tư vấn khả nhiễm bệnh Kịch cung cấp thông tin chung Luận văn tốt nghiệp - Năm học 2021-2022 46 47 47 48 48 49 50 50 51 51 52 52 53 54 55 55 56 56 Trang 7/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Danh sách bảng biểu 1.1 Tổng quan báo cáo 11 2.1 2.2 Các kiện WebSocket 14 Các phương thức WebSocket 14 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Chương Giới thiệu 1.1 Đặt vấn đề Trong hai năm vừa qua Việt Nam hay cụ thể Thành phố Hồ Chí Minh đối mặt với tình trạng dịch bệnh Covid hồnh hành Số ca nhiễm liên tục tăng cao dẫn đến tải, thiếu nhân y tế hỗ trợ tư vấn điều trị cho bệnh nhân Ngồi ra, thơng tin chủng biến thể, loại thuốc, vắc xin, sách cập nhật thay đổi liên tục gây hoang mang người dân quyền việc chống dịch tiếp cận, chọn lọc thơng tin liên quan đại dịch Hình 1.1: Thống kê số ca mắc covid tháng năm 2022 Từ vấn đề cấp bách trên, muốn xây dựng hệ thống hội thoại tự động cung cấp thơng tin thống, đồng thời có khả chẩn đốn khả nhiễm bệnh dựa vào số thông tin bệnh nhân Qua mong muốn giúp đỡ, giảm tải áp lực lên đội ngũ y bác sĩ tuyến đầu chống dịch nguồn cung cấp thơng tin nhanh chóng, xác kịp thời đến người dân TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính 4.3.1 Mơ hình SVM thứ Mơ hình SVM thứ chúng tơi dùng để phân loại ý định nêu Mục 4.1.1 mơ hình tốt với siêu tham số sau: Hình 4.9: Các siêu tham số tốt sau sử dụng RandomizedSearchCV Thống kê liệu Hình 4.10: Dữ liệu huấn luyện mơ hình thứ Luận văn tốt nghiệp - Năm học 2021-2022 Trang 46/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Kết huấn luyện Hình 4.11: Kết huấn luyện mơ hình thứ Từ kết hình thấy SVM hoạt động tốt với tập liệu 4.3.2 Mơ hình SVM thứ hai Chúng tơi tiến hành sử dụng RandomizedSearchCV tìm mơ hình tốt với siêu tham số sau: Hình 4.12: Các siêu tham số tốt sau sử dụng RandomizedSearchCV Mơ hình thứ hai sử dụng để phân loại cụ thể câu hỏi người dùng hướng theo kịch định sẵn Mơ hình sử dụng mơ hình thứ phân loại câu người dùng request Luận văn tốt nghiệp - Năm học 2021-2022 Trang 47/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Thống kê liệu Hình 4.13: Dữ liệu huấn luyện mơ hình thứ hai Kết huấn luyện Hình 4.14: Kết huấn luyện mơ hình thứ hai Sau mơ hình thứ phân loại hướng Chatbot đến kịch định nghĩa sẵn từ dự đoán hành động (actions) cho Chatbot Một số luồng mà Chatbot thực thi sau: • contact: Chatbot tiến hành hỏi lại địa người dùng để đưa thông tin số liên lạc khu vực Tránh để lần trả q nhiều thơng tin cho người dùng • current_number: giống contact, luồng thực thi Chatbot hỏi khu vực cụ thể mà người dùng muốn biết thông tin số ca nhiễm để cung cấp cách cụ thể • information: phân loại sub_intent vào luồng Chatbot thực thi theo kịch cung cấp thơng tin chúng tơi trình bày mục 4.3.4 • diagnostic: kịch mà chúng tơi hướng đến, Chatbot tiến hành hỏi đáp để nắm bắt số thông tin người dùng Từ đưa Luận văn tốt nghiệp - Năm học 2021-2022 Trang 48/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính chẩn đốn khả nhiễm bệnh người dùng Sau tham khảo nhận góp ý chúng tơi xây dựng thể q trình chẩn đốn sau: Hình 4.15: Kịch chẩn đốn khả nhiễm bệnh 4.3.3 Mơ hình Named Entity Recognition Để Chatbot trả lời cho câu hỏi kịch sơ đồ cần nhận dạng entity Do liệu cịn nên nhóm sử dụng liệu 35000 entity 10 ngàn câu VinAI gán nhãn NER sẵn Luận văn tốt nghiệp - Năm học 2021-2022 Trang 49/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Hình 4.16: Dữ liệu thu thập từ VinAI[14] Với PhoBERT, nhóm fine tune cách thêm layer softmax sau output model PhoBert, hàm loss Cross-Entropy làm tiêu chuẩn training với thuật toán tối ưu Adam, nhóm tiến hành fine-tuning với learning rate 5.e-5 , batch size 32 Nhóm áp dụng early stopping để tránh overfitting cho liệu, trình training dừng lại 15 epoch Hình 4.17: Kiến trúc mơ hình phobert cho toán NER Kết huấn luyện thể bảng theo micro-f1-score( số Luận văn tốt nghiệp - Năm học 2021-2022 Trang 50/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính lượng entity tập liệu khơng cần bằng): Hình 4.18: Q trình training theo micro-f1-score Hình 4.19: Quá trình training theo Cross-entropy loss Luận văn tốt nghiệp - Năm học 2021-2022 Trang 51/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Kết huấn luyện Hình 4.20: Kết mơ hình 4.3.4 Mơ hình KNN tìm kiếm câu hỏi gần với tin nhắn người dùng Dựa vào lượng data mà thu thập hình đây, chúng tơi nhận thấy lượng thông tin mà người dùng muốn hỏi tương đối lớn đa dạng, với lượng data có cịn khiêm tốn nên việc phân chia kịch để cung cấp đầy đủ xác thơng tin cho người dùng khơng khả thi Hình 4.21: Ví dụ tập data mẫu Vì nên chúng tơi sử dụng KNN để đáp ứng cách tối ưu mong muốn người dùng với tập data có Luận văn tốt nghiệp - Năm học 2021-2022 Trang 52/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Hướng thực hiện: • B1: Thu thập liệu câu hỏi tạo tập câu trả lời tương ứng với câu hỏi • B2: Sử dụng KNN để học theo tập liệu sẵn có • B3: Khi người dùng nhắn câu hỏi vào sử dụng KNN theo khoảng cách cosine để tìm database K câu hỏi gần giống với câu người dùng • B4: So sánh khoảng cách câu với threshold (ở chúng tơi quy định 0.85) – Nếu khoảng cách đến câu tìm lớn khoảng này, tức độ giống lớn Chatbot lấy câu trả lời tương ứng với câu trả lời cho người dùng – Cịn khoảng cách nhỏ threshold Chatbot liệt kê câu hỏi xem câu hỏi cụ thể người dùng có giống khơng tiến hành trả lời cho người dùng Hình 4.22: Ví dụ phản hồi mơ hình KNN Như kết nhận hình 4.22 nhận thấy số hạn chế sử dụng cách tiếp cận sau: • Khơng thể nắm bắt hết tất câu hỏi người dùng • Những câu gợi ý câu có sẵn DB gặp câu hỏi "lạ" Chatbot dẫn đến gợi ý sai • Một vấn đề thông tin mà thay đổi thường xun địi hỏi database câu trả lời phải cập nhật thường xuyên gây tốn thời gian công sức Luận văn tốt nghiệp - Năm học 2021-2022 Trang 53/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính 4.3.5 Huấn luyện lại mơ hình Chatbot với liệu Sau đưa vào thử nghiệm chúng tơi tiếp tục thu thập liệu từ hội thoại thực tế lưu sở liệu dạng sau: Hình 4.23: Ví dụ liệu hội thoại lưu trữ sở liệu Dữ liệu sau đánh giá kiểm tra lại độ xác Sau liệu cộng với nguồn liệu (bộ liệu thêm vào tùy theo diễn biến đại dịch, nhu cầu hậu covid, ) đưa vào huấn luyện cho Chatbot để Chatbot cải thiện đáp ứng với nhu cầu thông tin đại dịch 4.4 Kết thực Chatbot Giao diện Chatbot thực tảng web gồm phần: phần giao diện người dùng (UI) web phần backend xử lý phần hội thoại hiên thực với framework Botkit Phần UI phần backend giao tiếp với qua giao thức WebSocket (Mục 2.2) Khi người dùng gửi tin nhắn cho Chatbot, tin nhắn gửi qua API tới backend tin nhắn xử lý theo luồng thực thi mô tả mục 4.1.3 trả phản hồi cho người dùng Luận văn tốt nghiệp - Năm học 2021-2022 Trang 54/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Một số ví dụ kịch hội thoại Hình 4.24: Kịch cung cấp thơng tin liên hệ Hình 4.25: Kịch cung cấp thông tin số ca nhiễm Luận văn tốt nghiệp - Năm học 2021-2022 Trang 55/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Hình 4.26: Kịch tư vấn khả nhiễm bệnh Hình 4.27: Kịch cung cấp thơng tin chung Luận văn tốt nghiệp - Năm học 2021-2022 Trang 56/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Chương Tổng kết Trong chương này, nhóm chúng tơi nêu lên tổng kết trình thực Luận văn, bao gồm nhìn nhận kết cơng việc làm được, hạn chế bước phát triển tương lai đề tài 5.1 Các công việc đạt Trong trình thực luận văn tốt nghiệp, đạt số kết sau: • Xây dựng hồn thiện hệ thống Chatbot hỗ trợ cho bệnh nhân nhiễm/nghi nhiễm sau khỏi bệnh • Áp dụng kiến thức học máy, học sâu vào hệ thống • Hệ thống nắm bắt tốt ý định thơng tin người dùng • Hệ thống đưa thông tin chứng thực nhờ hỗ trợ nhóm sinh viên Trường Đại học Y Dược TPHCM Ngoài ra, hướng dẫn hỗ trợ PGS TS Quản Thành Thơ, đề tài nhóm trình bày Hội nghị Khoa học Kinh tế Y tế IX, Hội nghị quốc tế Y học gia đình III, Hội nghị quốc tế ứng dụng công nghệ thông tin Y tế II diễn Trường Đại học Y khoa Phạm Ngọc Thạch vào ngày 05 - 06 tháng năm 2022 Đề tài trình bày với tên gọi "Chatbot thơng minh hỗ trợ tư vấn hậu Covid sử dụng học máy" 5.2 Các hạn chế Trong trình thử nghiệm hệ thống chúng tơi nhận thấy cịn số hạn chế sau: • Mơ hình KNN để đưa gợi ý số câu tương tự với câu hỏi người dùng đơi mắc sai sót sở liệu khơng có câu hỏi tương tự • Một số dạng câu bị viết sai tả Chatbot gặp khó khăn để nắm bắt ý định bệnh nhân 57 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính 5.3 Mục tiêu phát triển • Tích hợp vào số tảng facebook, để thử nghiệm rộng rãi • Xây dựng quy trình chuẩn đốn bệnh theo giai đoạn thời gian định • Hướng xây dụng Chatbot cách tổng quát để dễ dàng áp dụng vào loại bệnh khác • Mở rộng thêm nguồn liệu dùng cho tư vấn Luận văn tốt nghiệp - Năm học 2021-2022 Trang 58/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Tài liệu tham khảo [1] Hongshen Chen, Xiaorui Liu, Dawei Yin, and Jiliang Tang “A Survey on Dialogue Systems: Recent Advances and New Frontiers” In: CoRR abs/1711.01731 (2017) arXiv: 1711.01731 url: http://arxiv.org/abs/1711.01731 [2] Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova “BERT: Pretraining of Deep Bidirectional Transformers for Language Understanding” In: CoRR abs/1810.04805 (2018) arXiv: 1810.04805 url: http://arxiv.org/abs/1810 04805 [3] Rani Horev BERT: State of the Art NLP Model, Explained 13/03/2021 url: https://www.kdnuggets.com/2018/12/bert-sota-nlp-model-explained.html [4] Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, and Veselin Stoyanov RoBERTa: A Robustly Optimized BERT Pretraining Approach cite arxiv:1907.11692 2019 url: http : //arxiv.org/abs/1907.11692 [5] Pham Nam Tổng quan Chatbot 2021 url: https://viblo.asia/p/tongquan-ve-chatbot-yMnKMByaZ7P [6] Dat Quoc Nguyen and Anh Tuan Nguyen “PhoBERT: Pre-trained language models for Vietnamese” In: Findings of the Association for Computational Linguistics: EMNLP 2020 2020, pp 1037–1042 url: https://arxiv.org/pdf/2003.00744 pdf [7] Dat Quoc Nguyen, Dai Quoc Nguyen, Thanh Vu, Mark Dras, and Mark Johnson “A Fast and Accurate Vietnamese Word Segmenter” In: Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018) 2018, pp 2582–2587 url: https://arxiv.org/pdf/1709.06307.pdf [8] Rico Sennrich, Barry Haddow, and Alexandra Birch Neural Machine Translation of Rare Words with Subword Units 2015 doi: 10.48550/ARXIV.1508.07909 url: https://arxiv.org/abs/1508.07909 [9] Nour Al-Rahman Al-Serw K-nearest Neighbor: The maths behind it, how it works and an example 2021 url: https : / / medium com / analytics - vidhya / k nearest- neighbor- the- maths- behind- it- how- it- works- and- an- examplef1de1208546c [10] Support Vector Machine 2017 url: https://machinelearningcoban.com/2017/ 04/09/smv/ [11] Pavel Surmenok “Chatbot Architecture” In: (2016) url: http : / / pavel surmenok.com/2016/09/11/chatbot-architecture/ [12] Ehsan Taher, Seyed Abbas Hoseini, and Mehrnoush Shamsfard “Beheshti-NER: Persian named entity recognition Using BERT” In: (Sept 2019) 59 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trường Đại Học Bách Khoa TP Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính [13] Trí tuệ nhân tạo Minh họa Transformer 13/03/2021 url: https : / / trituenhantao.io/tin-tuc/minh-hoa-transformer/ [14] Dat Quoc Nguyen Thinh Hung Truong Mai Hoang Dao “COVID-19 Named Entity Recognition for Vietnamese” In: CoRR abs/1706.03762 (2021) arXiv: 1706.03762 url: https://arxiv.org/abs/2104.03879 [15] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Lukasz Kaiser, and Illia Polosukhin “Attention Is All You Need” In: CoRR abs/1706.03762 (2017) arXiv: 1706.03762 url: http://arxiv.org/abs/ 1706.03762 [16] Jesse Vig Visualizing Attention in Transformer-Based Language Representation Models 2019 doi: 10 48550 / ARXIV 1904 02679 url: https : / / arxiv org / abs/1904.02679 [17] Alex Wang, Amanpreet Singh, Julian Michael, Felix Hill, Omer Levy, and Samuel R Bowman “GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding” In: CoRR abs/1804.07461 (2018) arXiv: 1804.07461 url: http://arxiv.org/abs/1804.07461 Luận văn tốt nghiệp - Năm học 2021-2022 Trang 60/60 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat ... luận văn tốt nghiệp "Xây dựng Chatbot tư vấn triệu chứng hướng dẫn tự chăm sóc sức khỏe nhà với bệnh nhân nhiễm/ nghi nhiễm virus SARS-CoV-2" cơng trình nghiên cứu hướng dẫn thầy PGS TS Quản Thành... thức Chatbot; (ii) huấn luyện cho Chatbot giao tiếp hiệu với người ngôn ngữ tự nhiên Trong đề tài này, giải vấn đề phương pháp học máy tiên tiến để xây dựng Chatbot tư vấn cho người dùng vấn đề... tháng năm 2022 Từ vấn đề cấp bách trên, muốn xây dựng hệ thống hội thoại tự động cung cấp thơng tin thống, đồng thời có khả chẩn đốn khả nhiễm bệnh dựa vào số thông tin bệnh nhân Qua mong muốn