1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu

68 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 3,27 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÙI NGỌC QUANG NGHIÊN CỨU VÀ XÂY DỰNG CHATBOT TƯ VẤN NGƯỜI DÙNG TRONG Y TẾ DA LIỄU LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI – 2022 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÙI NGỌC QUANG NGHIÊN CỨU VÀ XÂY DỰNG CHATBOT TƯ VẤN NGƯỜI DÙNG TRONG Y TẾ DA LIỄU Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 18025038 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THƠNG TIN HÀ NỘI – 2022 LỜI CAM ĐOAN Tơi xin cam đoan nội dung trình bày luận văn “Nghiên cứu xây dựng chatbot tư vấn người dùng y tế da liễu” nghiên cứu, tìm hiểu phát triển dẫn dắt TS Nguyễn Văn Vinh Luận văn không chép từ tài liệu, cơng trình nghiên cứu người khác mà không ghi rõ tài liệu tham khảo Tất tham khảo từ nghiên cứu liên quan nêu nguồn gốc cách rõ ràng từ danh mục tài liệu tham khảo luận văn Tôi xin chịu trách nhiệm lời cam đoan Hà nội, ngày tháng năm 2022 LỜI CẢM ƠN Tôi xin gửi lời cảm ơn tới thầy cô trường đại học Công Nghệ, Đại học Quốc Gia Hà Nội tận tình giảng dạy truyền đạt kiến thức suốt khóa cao học vừa qua Tơi xin gửi lời cảm ơn đến thầy cô môn Kỹ Thuật Phần Mềm khoa Công Nghệ Thông Tin mang lại cho kiến thức vơ q giá bổ ích trình học tập trường Đặc biệt xin chân thành cảm ơn thầy giáo, TS Nguyễn Văn Vinh, người định hướng, giúp đỡ, trực tiếp hướng dẫn tận tình bảo tơi suốt q trình nghiên cứu, xây dựng hồn thiện luận văn Tơi xin cảm ơn tới gia đình, người thân, đồng nghiệp bạn bè thường xuyên quan tâm, động viên, chia sẻ kinh nghiệm, cung cấp tài liệu hữu ích thời gian học tập, nghiên cứu suốt trình thực luận văn tốt nghiệp Hà Nội, ngày tháng năm 2022 MỤC LỤC LỜI CẢM ƠN DANH MỤC CÁC BẢNG DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ MỞ ĐẦU Động lực nghiên cứu Mục tiêu luận văn Cấu trúc luận văn 10 CHƯƠNG : GIỚI THIỆU TỔNG QUAN HỆ THỐNG CHATBOT 11 1.1 Giới thiệu 11 1.2 Kiến trúc hệ thống Chatbot theo hướng mục tiêu 13 1.2.1 Hiểu ngôn ngữ tự nhiên 14 1.2.2 Quản lý hội thoại 18 1.2.3 Sinh ngôn ngữ tự nhiên 19 CHƯƠNG : CÁC KỸ THUẬT SỬ DỤNG TRONG CHATBOT 22 2.1 Mạng hồi quy RNN 22 2.1.1 RNN hai chiều 23 2.1.2 RNN (hai chiều) sâu 23 2.2 Mạng nhớ dài-ngắn LSTM 24 2.2.1 Vấn đề phụ thuộc xa 24 2.2.2 Kiến trúc mạng LSTM 25 2.2.3 Ý tưởng cốt lõi LSTM 27 2.3 Mơ hình nhúng từ 30 2.3.1 Phương pháp Véc tơ hóa dựa tần số xuất 30 2.3.2 Phương pháp Véc tơ hóa dựa vào dự đốn 34 2.4 Mơ hình BERT 36 2.4.1 Mơ hình Fine-tuning BERT 36 2.4.2 Mơ hình ngơn ngữ che giấu (Masked ML) 38 2.4.3 Dự đoán câu 39 2.4.4 Các kiến trúc mơ hình BERT 41 2.5 Mơ hình PhoBERT 41 2.6 Tổng quan Rasa 42 2.6.1 Các thành phần Rasa 43 2.6.2 Kiến trúc Rasa 44 CHƯƠNG : XÂY DỰNG ỨNG DỤNG CHATBOT TƯ VẤN NGƯỜI DÙNG TRONG Y TẾ DA LIỄU 45 3.1 Xây dựng liệu 45 3.1.1 Xây dựng Ý Định 45 3.1.2 Xây dựng loại Entity Slot 46 3.1.3 Xây dựng Câu trả lời cho Bot 46 3.1.4 Xây dựng Khung kịch Quy tắc 47 3.2 Cải tiến nhận dạng ý định tên riêng sử dụng PhoBERT 48 3.3 Áp dụng Rasa xây dựng chatbot ngành Y Tế da liễu 48 3.4 Cài đặt Rasa 50 3.5 Phân tích thiết kế hệ thống 52 3.6 Kết thực nghiệm 54 3.6.1 Môi trường thực nghiệm 55 3.6.2 Phương pháp đánh giá 55 3.6.3 Thực nghiệm 56 3.8 Đánh giá 60 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 63 PHỤ LỤC 64 DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT Từ viết tắt Từ chuẩn Diễn giải AI Artificial Intelligence Trí tuệ nhân tạo NLG Natural Language Generation Natural Language Processing Natural Language Understanding Machine Learning Thành phần sinh ngôn ngữ Named Entity Recognition Artificial Nerual Network Continuous Bag of Words Convolution Neural Network Conditional Random Fields Nhận dạng thực thể DM Dialogue Management Quản lý hội thoại DNN Deep Neural Networks Mô hình học máy DTS Dialogue State Tracking Theo dõi trạng thái hội thoại FSA Finite State Automata Mơ hình dựa máy trạng thái hữu hạn FSM Finite State Machine Máy trạng thái hữu hạn GLAD Global-Locally SelfAttentive Dialogue State Tracker Trình theo dõi trạng thái đối thoại tồn cục-cục HMM Hiden Markov Models Mơ hình Markov ẩn LSTM Long short-term memory Mạng cải tiến để giải vấn đề phụ thuộc dài POS Part Of Speech Gán nhãn từ loại NLP NLU ML NER ANN CBOW CNN CRF Xử lý ngôn ngữ tự nhiên Hiểu ngôn ngữ tự nhiên Học máy, máy có khả học tập Mạng Nơron nhân tạo Mơ hình dự đốn từ mục tiêu dựa vào từ ngữ cảnh xung quanh Mạng Nơron tích chập Mơ hình xác xuất trường điều kiện ngẫu nhiên RNN SVM Recurrent Neural Mạng Nơron hồi quy Network Véc tơ Support Machine Máy véc tơ hỗ trợ Phương pháp phân tích suy biến BPE Singular Value Decomposition Masked Language Model Byte Pair Encoding Seq2Seq Sequence to sequence Từ chuỗi sang chuỗi BERT Bidirectional Encoder Representation from Transformer Mơ hình biểu diễn từ theo hai chiều SVD MLM Mơ hình ngơn ngữ che giấu Cặp mã hóa Byte DANH MỤC CÁC BẢNG Bảng 1.1 Bảng trích xuất thực thể câu 17 Bảng 1.2 Ví dụ khung hội thoại với người dùng 19 Bảng 2.1 Ví dụ ma trận đồng xuất 32 Bảng 3.1 Bảng kết xác định ý định 56 Bảng 3.2 Bảng kết nhận dạng thực thể 56 Bảng 3.3 Bảng mô tả số lần thử nghiệm với người dùng 57 Bảng 3.4 Bảng hội thoại với chatbot sau lần thử nghiệm cuối 58 DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ Hình 1.1 Ảnh minh họa Chatbot [1] 11 Hình 1.2 Các thành phần Chatbot [1] 13 Hình 1.3 Kiến trúc hệ thống phân lớp ý định 15 Hình 1.4 Phương pháp sinh ngơn ngữ class-based[2] 20 Hình 1.5 Phương pháp sinh ngôn ngữ Phrase-based[2] 21 Hình 2.1 Mạng Nơ-ron hồi quy RNN [2] 22 Hình 2.2 Mạng RNN hai chiều [16] 23 Hình 2.3 Mạng RNN (hai chiều) sâu [16] 24 Hình 2.4 RNN phụ thuộc short-term [5] 25 Hình 2.5 RNN phụ thuộc long-term [4] 25 Hình 2.6 Các mô-đun lặp mạng RNN chứa lớp [4] 26 Hình 2.7 Các mơ-đun lặp mạng LSTM chứa bốn lớp [4] 26 Hình 2.8 Tế bào trạng thái LSTM giống băng truyền [4] 27 Hình 2.9 Cổng trạng thái LSTM [4] 28 Hình 2.10 LSTM focus f [4] 28 Hình 2.11 LSTM focus i [4] 29 Hình 2.12 LSTM focus C [4] 29 Hình 2.13 LSTM focus O [4] 30 Hình 2.14 Mơ hình CBOW với đầu vào [3] 34 Hình 2.15 Mơ hình Skip-gram [3] 35 Hình 2.16 Tồn tiến trình huấn luyện trước tinh chỉnh BERT [10] 37 Hình 2.17 Sơ đồ kiến trúc BERT cho tác vụ Masked ML [10] 38 Hình 2.18 Sơ đồ kiến trúc mơ hình BERT cho tác vụ NSP [10] 40 Hình 2.19 Minh họa PhoBERT[13] 41 Hình 2.20 Các thành phần Rasa [12] 43 Hình 2.21 Kiến trúc Rasa [12] 44 Hình 3.1 Kiến trúc mơ hình PhoBERT 48 Hình 3.2 Cấu trúc hệ thống chatbot ngành Y Tế da liễu 49 Hình 3.3 Biểu đồ cung cấp thơng tin chatbot 52 Hình 3.4 Sequence Diagram cho hành động hỏi thông tin bệnh 53 Hình 3.5 Sequence Diagram cho hành động hỏi thông tin thuốc 54 Hình 3.6 Mơ tả cách số đánh giá mơ hình huấn luyện 55 Hình 3-7 Ma trận ước lượng nhầm lẫn xây dựng liệu intent 57 Hình 3-8 Biểu đồ độ tin cậy cho dự đoán 58 MỞ ĐẦU Theo dòng chảy cách mạng 4.0, trí tuệ nhân tạo ngày phổ biến ứng dụng rộng rãi lĩnh vực sống Các công ty lớn phát triển tảng sử dụng để thiết kế tương tác AI đàm thoại trợ lý giọng nói trợ lý ảo, tích hợp với tảng trò chuyện khác nhau, Trợ lý Google1, Siri2, IBM Watson Assistant3, v.v ứng dụng phát triển mạnh mẽ chatbot Sự phát triển tự động hóa thúc đẩy cách mạng chatbot toàn cầu Những tiến AI thúc đẩy đổi chatbot Các số liệu thống kê chatbot cho thấy tình trạng tốc độ phát triển thâm nhập tồn cầu nó:  Cụ thể, giá trị thị trường chatbot mức 17,17 tỷ đô la vào năm 2020 Con số dự kiến tăng lên số khổng lồ 102,29 tỷ đô la vào năm 2026, với tốc độ tăng 34,75% giai đoạn 2021-2026 (Juniper Research 2021)  Người ta ước tính tiết kiệm chi phí từ việc sử dụng chatbots ngân hàng đạt 7,3 tỷ la tồn cầu vào năm 2023, tăng so với ước tính năm 2019 209 triệu đô la (Nghiên cứu Juniper, 2021)  Ứng dụng nhắn tin có tỷ người dùng hoạt động tháng (HubSpot)  Các quốc gia có số lượng người dùng chatbot nhiều Mỹ (36%), Ấn Độ (11%) Đức (4%) (Collect.chat, 2021)  24% doanh nghiệp, 15% công ty quy mô vừa 16% doanh nghiệp nhỏ sử dụng chatbots (Spiceworks, 2021) Sự xuất chatbots mang lại nhiều khả khác nhau, bao gồm việc áp dụng AI tiên tiến để hỗ trợ người Với việc công nghệ phát triển khơng ngừng mong đợi hiệu mà chatbot đem lại tăng trưởng năm tới chatbot trở thành kênh kỹ thuật số lựa chọn tương lai Động lực nghiên cứu Hiện giới có hệ thống Sensely 4, Việt Nam có hệ thống Hedima, FPT.AI Conversation ứng dụng phổ biến mạnh mẽ hỗ trợ giải đáp người dùng ngành Y không tập trung lĩnh vực bệnh lý cụ thể, luận văn giải đáp chuyên sâu Y tế da liễu Tìm hiểu kỹ thuật xử lý ngơn https://cloud.google.com/dialogflow https://www.apple.com/siri/ https://www.ibm.com/products/watson-assistant https://sensely.com/ 3.5 Phân tích thiết kế hệ thống Hình 3.3 Biểu đồ cung cấp thông tin chatbot Hệ thống bao gồm ba phạm vi kiến thức cung cấp sau:  Chức giao tiếp với người dùng chào hỏi, giới thiệu, đưa nhận xét với chatbot  Chức hỏi bệnh lý: giúp người dùng hỏi thông tin liên quan đến bệnh : triệu chứng, nguyên nhân, chẩn đoán, cách điều trị biến chứng…  Chức hỏi thông tin thuốc: cung cấp cho người dùng thông tin bổ ích thuốc như: giới thiệu, tác dụng, cách dùng, tác dụng phụ, chống định… thuốc 52 Sequence Diagram cho hành động hỏi thơng tin bệnh: Hình 3.4 Sequence Diagram cho hành động hỏi thông tin bệnh Quá trình tương tác người dùng chatbot yêu cầu kiểm tra liệu thơng tin có xác hay không trước xử lý trả lại thông tin cho người dùng 53 Sequence Diagram cho hành động hỏi thơng tin thuốc: Hình 3.5 Sequence Diagram cho hành động hỏi thông tin thuốc Trong chức hỏi thông tin thuốc, tên thuốc kiểm tra danh mục thuốc ngành da liễu, nhập sai hệ thống yêu cầu nhập lại, sau trả kết cho người dùng 3.6 Kết thực nghiệm Để tiến hành thử nghiệm ứng dụng ta cần xây dựng môi trường thực nghiệm, phương pháp đánh giá mô hình bước tiến hành thực nghiệm khác 54 3.6.1 Môi trường thực nghiệm Môi trường tiến hành thử nghiệm sau: - Hệ điều hành: Window Server 2012, 64 bit, Ram 16Gb - Database: SQL Server 2012 Mơ hình huấn luyện: vinai/phobert-base Python: 3.7.0 PyTorch 1.1.0+ (hoặc TensorFlow 2.0+) - Rasa: 3.5 3.6.2 Phương pháp đánh giá Để đánh giá mơ hình tốn xác định ý định tên riêng NLU dựa ba số liệu: 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑃 𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑁 𝐹1 = 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝑅𝑒𝑐𝑎𝑙𝑙 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 + 𝑅𝑒𝑐𝑎𝑙𝑙 Hình 3.6 Mơ tả cách số đánh giá mơ hình huấn luyện Precision – tỷ lệ lấy ra, Cân nhắc tập liệu kiểm sốt xem có liệu mơ hình phán đốn Recall – tỷ lệ lấy đúng, Chỉ số gọi độ bao phủ, tức xét xem mơ hình tìm có khả tổng quát hóa Từ hai yếu tố độ chuẩn xác độ bao phủ người ta đặt số khác gọi F1-Score F1-Score: Đây gọi bình qn điều hịa(harmonic mean) tiêu chuẩn Precision Recall Nó có khuynh hướng lấy giá trị gần với giá trị bé 55 hai giá trị Precision Recall song song có giá trị lớn hai giá trị Precision Recall lớn Chính F1-Score thể cách khách quan mơ hình học máy 3.6.3 Thực nghiệm Thử nghiệm 1: So sánh mơ hình sử dụng toán xác định ý định thực thể Trong thử nghiệm luận văn, với toán xác định ý định ý định tên riêng hệ thống sử dụng ba mơ hình sau: WhitespaceTokenizer: mơ hình tách token dựa vào khoảng trắng ký tự không hiển thị ConveRT: mơ hình mã hóa câu để xác định ý định người dùng CustomPhoBERT: mơ hình sử dụng PhoBert để cải tiến chất lượng nhận dạng ý định tên riêng Kết thể bảng Bảng 3.1 Bảng kết xác định ý định Thuật toán WhitespaceTokenizer ConveRT CustomPhoBERT Precision Recall 0.78 0.83 0.86 F1-Score 0.78 0.81 0.87 0.78 0.82 0.86 Bảng 3.2 Bảng kết nhận dạng thực thể Thuật toán Precision WhitespaceTokenizer ConveRT CustomPhoBERT Recall 0,84 0,89 0,91 F1-Score 0,76 0,78 0,83 0,79 0,82 0,86 Từ kết ta thấy mô hình CustomPhoBERT thực tốt việc xác định ý định lẫn thực thể người dùng Thử nghiệm 2: Tiến hành thử nghiệm câu ngẫu nhiên để đánh giá kết cuối người dùng Sau lựa chọn mơ hình đào tạo CustomPhoBERT tối ưu kết thực thử nghiệm ngẫu nhiên 100 câu với chatbot ta kết sau lần thử sau: 56 Bảng 3.3 Bảng mô tả số lần thử nghiệm với người dùng Lần thử nghiệm Số câu 54/100 65/100 75/100 86/100 89/100 Độ xác 54% 65% 75% 86% 89% Sau thử nghiệm lần cuối với 100 câu độ xác chatbot đạt khoảng 89% Đối với câu hỏi mã bot chưa đào tạo hệ thống đưa số câu lựa chọn để điều hướng người dùng sang kịch khác mà bot đáp ứng Hình 3-7 Ma trận ước lượng nhầm lẫn xây dựng liệu intent 57 Ma trận nhầm lẫn cho thấy ý định bị nhầm lẫn với ý định khác Bất kỳ mẫu dự đốn khơng xác ghi lại lưu lại để gỡ lỗi dễ dàng Hình 3-8 Biểu đồ độ tin cậy cho dự đoán Biểu đồ giúp ta hình dung độ tin cậy cho tất dự đoán, với dự đoán sai hiển thị màu xanh lam màu đỏ tương ứng Việc cải thiện chất lượng liệu đào tạo bạn di chuyển biểu đồ màu xanh lam lên biểu đồ biểu đồ màu đỏ xuống biểu đồ Nó giúp giảm số lượng biểu đồ màu đỏ Dưới đoạn hội thoại với chatbot sau lần thử nghiệm cuối cùng: Bảng 3.4 Bảng hội thoại với chatbot sau lần thử nghiệm cuối STT Người dùng Xin chào Bot Chào mừng bạn đến với Leskin Chatbot 58 Bạn hỗ trợ gì? Tơi Leskin Bot Chuyên gia hỗ trợ bệnh da liễu Bạn cung cấp thông tin bệnh triệu chứng để hệ thống đưa lời khuyên cho bạn! Tôi muốn tư vấn bệnh? Trước tiên, Bạn vui lòng cung cấp họ tên? Bùi Ngọc Quang Bạn năm tuổi? Tôi 40 tuổi Hệ thống ghi nhận họ tên bạn Bùi Ngọc Quang / 40 tuổi Bạn vui lòng cho biết bệnh gặp gì? Bệnh ze na Tên bệnh khơng có danh mục bệnh liên quan da liễu Vui lòng nhập lại? Bệnh zona Bạn vui lòng cung cấp thêm triệu chứng gặp? ban đỏ, mụn nước, Hệ thống ghi nhận bệnh bạn "bệnh zona" với triệu chứng bọng nước tập " ban đỏ, mụn nước, bọng nước tập trung thành đám " trung thành đám Bạn muốn biết thêm thông tin khác bệnh sau?  Tổng quan bệnh  Cách điều trị  Các biến chứng  Cách phòng bệnh Tổng quan bệnh Bệnh zona hay herpes zoster bệnh nhiễm trùng da với biểu ban đỏ, mụn nước, bọng nước tập trung thành đám 10 Cách điều trị 11 Tôi cần tư vấn thuốc? naomycin 12 Uống acyclovir: thuốc kháng virus có tác dụng nhanh lành vết thương, giảm số tổn thương giảm đau sau zona Thuốc nên dùng sớm, tốt vòng 72 đầu Bạn vui lòng cung cấp tên thuốc gì? Tên thuốc khơng tồn danh mục thuốc Vui lòng nhập lại? 59 13 neomycin 14 Tác dụng 15 Cách dùng 16 Tác dụng phụ 17 Chống định 18 19 Cám ơn Tạm biệt 3.8 Đánh giá Neomycin thường phối hợp với số kháng sinh khác polymixin B, bacitracin, colistin, gramicidin, corticoid dexametason thuốc dùng Bạn muốn biết thêm thông tin khác thuốc sau?  Tác dụng  Cách dùng  Tác dụng phụ  Chống định Neomycin có tác dụng với phần lớn vi khuẩn Gram âm Gram dương gây nên nhiễm khuẩn da Liều uống: g/lần giờ, liên tục giờ; sau 1g/lần giờ, ngày trước phẫu thuật… Dùng uống với liều cao: Buồn nôn, nơn, tiêu chảy, độc thận, độc với thính giác dùng liều điều trị Uống kéo dài gây hội chứng hấp thu bội nhiễm… Neomycin chống định với trường hợp mẫn với neomycin với aminoglycoside… Khơng có bạn Cảm ơn bạn liên hệ OK, tạm biệt bạn Từ kết thực nghiệm rút số đánh sau:  Xác định ý định có ý nghĩa quan trọng chatbot Đối với tốn miền đóng cần xác định rõ ràng ý định, xây dựng tập liệu đủ lớn, gán nhãn tiến hành huấn luyện  Xây dựng liệu, huấn luyện cho bot với kịch cần thiết độ xác cao chatbot  Chatbot ứng dụng AI có khả đáp ứng tốt với kịch dựng sẵn, huấn luyện Đối với kịch nằm ngồi kịch dựng sẵn, điều hướng người dùng câu mặc định giao diện menu để người dùng lựa chọn  Việc xác định phản hồi đa ý định thực việc kết hợp ý định với 60  Qua tốn thử nghiệm thấy áp dụng chatbot cho việc hỗ trợ người dùng ngành y tế da liễu khả thi, có tính thực tiễn cao, áp dụng thực tiễn Tuy nhiên, trình thực gặp phải thách thức bổ sung bao gồm: - Vấn đề thứ vấn đề đồng tham chiếu (coreference) Trong nói viết, thơng thường thường dùng cách gọi rút gọn cho đối tượng mà đề cập trước Ví dụ tiếng Việt, người nói viết dùng đại từ xưng hô khác từ lóng theo vùng miền,… Nếu khơng có thơng tin ngữ cảnh phân tích đồng tham chiếu, khó để chatbot biết từ tham chiếu đến đối tượng Việc không xác định đối tượng mà từ thay tham chiếu đến khiến chatbot hiểu khơng xác câu hội thoại người dùng Thách thức rõ ràng đoạn hội thoại dài - Vấn đề thứ hai để giảm bớt công sức làm liệu phát triển chatbot Theo cách tiếp cận trên, phát triển ứng dụng chatbot, ta cần gán nhãn liệu huấn luyện cho phân lớp ý định nhận dạng thực thể tên gọi Trong miền ứng dụng phức tạp ngành y tế, công sức để tạo liệu đắt đỏ Vì thế, việc phát triển phương pháp để tận dụng nguồn liệu sẵn có doanh nghiệp để giảm lượng liệu cần gán nhãn, đảm bảo độ xác mơ hình xử lý ngôn ngữ tự nhiên cần thiết - Sự đa dạng cách người nhập thông điệp người dùng khiến ta khó hiểu ý định họ Chatbot phải có khả xử lý câu dài ngắn, bong bóng trị chuyện có nội dung dài so với nhiều lần gửi ngắn - Con người ngẫu nhiên hành vi người dùng điều khiển cảm xúc tâm trạng; người dùng nhanh chóng thay đổi ý định họ Sau yêu cầu gợi ý ban đầu, họ chuyển sang muốn đưa lệnh Cơng nghệ chatbot phải có khả thích ứng hiểu yếu tố ngẫu nhiên tự phát 61 KẾT LUẬN Sau tìm hiểu thực luận văn “Xây dựng chatbot tư vấn người dùng ngành y tế da liễu” tơi hồn thành đề tài đạt kết sau:  Tìm hiểu tổng quan tốn quy trình xây dựng chatbot để giải theo hướng tiếp cận miền đóng, cụ thể nghiệp vụ y tế da liễu  Nắm kiến thức bao gồm kiến trúc nhiệm vụ thành phần, thuật toán kỹ thuật sử dụng chatbot như: o Mạng nhớ dài-ngắn (Long Short Term Memory networks) o Mơ hình Word embeddings o Mơ hình BERT PhoBERT áp dụng cho Tiếng Việt  Xây dựng liệu thử nghiệm chuyên ngành da liễu lĩnh vực y tế cho toán chatbot  Nghiên cứu ứng dụng Framework Rasa, tối ưu hóa thuật tốn áp dụng framework Tạo mơ hình huấn luyện riêng để xác định ý định người dùng, chỉnh sửa thêm hành động người dùng tương tác với bot Đồng thời sử dụng PhoBert để cải tiến chất lượng toán xác định ý định nhận dạng thực thể tên  Xây dựng ứng dụng chatbot tích hợp website để tương tác với người dùng cách trực quan dễ dàng sử dụng Định hướng nghiên cứu tiếp theo:  Chuẩn đốn bệnh thơng qua hình ảnh kết hợp với triệu chứng cho thơng tin bệnh xác  Hỗ trợ người dùng qua giọng nói, tích hợp giọng nói sang văn văn sang giọng nói cho bot, người dùng sử dụng tiện  Xây dựng nhiều kịch tính cho chatbot đặt lịch khám chữa bệnh, lựa chọn bác sỹ khám nhà,…  Huấn luyện chatbot trả lời linh hoạt thông minh thông qua việc mở rộng xây dựng cải tiến sở liệu hệ thống trở nên tối ưu hơn, đa dạng 62 TÀI LIỆU THAM KHẢO R J Williams “Simple statistical gradient-following algorithms for connectionist reinforcement learning Machine learning”, 8(3-4):229–256, 2012 X Zhou, D Dong, H Wu, S Zhao, D Yu, H Tian, X Liu, and R Yan Multiview response selection for human-computer conversation In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, pages 372–381, 2016 L Bahl, P Brown, P De Souza, and R Mercer “Maximum mutual information estimation of hidden markov model parameters for speech recognition” In Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP’86., volume 11, pages 49–52 IEEE, 2006 A Graves Long short-term memory Neural Computation, 9(8):1735, 1997 Naoaki Okazaki, “CRFsuite: A fast implementation of Conditional Random Fields (CRFs)”, 2011 T.-H Wen, M Gasic, P.-H Su, D Vandyke, and S Young In “Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing”, pages 1711–1721, Lisbon, Portugal, September 2015 Zhiheng Huang, Wei Xu, Kai Yu, “Bidirectional LSTM-CRF Models for Sequence Tagging”, On arxiv, 2015 Jurafsky, D., & Martin, “Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition”, Chapter 24 “Dialogue and Conversational Agents” Ming-Wei Chang “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding” Version 2, 2019 10 A Jiao, “An intelligent chatbot system based on entity extraction using RASA NLU and neural network,” J Phys Conf Ser., vol 1487, p 012014, 2020 11 Rasa Community, “Memoization Policy with max history”, 2021 12 PhoBERT, “Pre-trained language models for Vietnamese”, 2020 13 Hongshen Chen, Xiaorui Liu, Dawei Yin, Jiliang Tang “A Survey on Dialogue Systems: Recent Advances and New Frontiers” , On arxiv, Version 3, 2018 63 14 PGS.TS Nguyễn Thị Xuyên, “Hướng dẫn chẩn đoán điều trị bệnh da liễu", Số 75/QĐ-BYT, 2015 15 Sepp Hochreiter, Jürgen Schmidhuber “Long Short-term Memory”, 1997 16 Denny Britz, “Recurrent Neural Networks Tutorial” , 2015 PHỤ LỤC 64 65 66 ... CHƯƠNG : X? ?Y DỰNG ỨNG DỤNG CHATBOT TƯ VẤN NGƯỜI DÙNG TRONG Y TẾ DA LIỄU 45 3.1 X? ?y dựng liệu 45 3.1.1 X? ?y dựng Ý Định 45 3.1.2 X? ?y dựng loại Entity Slot ... b? ?y luận văn ? ?Nghiên cứu x? ?y dựng chatbot tư vấn người dùng y tế da liễu? ?? nghiên cứu, tìm hiểu phát triển dẫn dắt TS Nguyễn Văn Vinh Luận văn không chép từ tài liệu, cơng trình nghiên cứu người. .. đến người dùng dạng phản hồi 44 CHƯƠNG 3: X? ?Y DỰNG ỨNG DỤNG CHATBOT TƯ VẤN NGƯỜI DÙNG TRONG Y TẾ DA LIỄU Để có ứng dụng chatbot hiệu trải nghiệm người dùng thú vị, chatbot phải thiết kế để tạo tư? ?ng

Ngày đăng: 03/10/2022, 10:58

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. R. J. Williams. “Simple statistical gradient-following algorithms for connectionist reinforcement learning. Machine learning”, 8(3-4):229–256, 2012 Sách, tạp chí
Tiêu đề: Simple statistical gradient-following algorithms for connectionist reinforcement learning. Machine learning
3. L. Bahl, P. Brown, P. De Souza, and R. Mercer. “Maximum mutual information estimation of hidden markov model parameters for speech recognition”. In Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP’86., volume 11, pages 49–52. IEEE, 2006 Sách, tạp chí
Tiêu đề: Maximum mutual information estimation of hidden markov model parameters for speech recognition
5. Naoaki Okazaki, “CRFsuite: A fast implementation of Conditional Random Fields (CRFs)”, 2011 Sách, tạp chí
Tiêu đề: CRFsuite: A fast implementation of Conditional Random Fields (CRFs)
6. T.-H. Wen, M. Gasic, P.-H. Su, D. Vandyke, and S. Young. In “Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing”, pages 1711–1721, Lisbon, Portugal, September 2015 Sách, tạp chí
Tiêu đề: Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing
7. Zhiheng Huang, Wei Xu, Kai Yu, “Bidirectional LSTM-CRF Models for Sequence Tagging”, On arxiv, 2015 Sách, tạp chí
Tiêu đề: Bidirectional LSTM-CRF Models for Sequence Tagging
8. Jurafsky, D., & Martin, “Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition”, Chapter 24. “Dialogue and Conversational Agents” Sách, tạp chí
Tiêu đề: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition”, Chapter 24. “Dialogue and Conversational Agents
9. Ming-Wei Chang “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding” Version 2, 2019 Sách, tạp chí
Tiêu đề: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
10. A. Jiao, “An intelligent chatbot system based on entity extraction using RASA NLU and neural network,” J. Phys. Conf. Ser., vol. 1487, p. 012014, 2020 Sách, tạp chí
Tiêu đề: An intelligent chatbot system based on entity extraction using RASA NLU and neural network
13. Hongshen Chen, Xiaorui Liu, Dawei Yin, Jiliang Tang “A Survey on Dialogue Systems: Recent Advances and New Frontiers” , On arxiv, Version 3, 2018 Sách, tạp chí
Tiêu đề: A Survey on Dialogue Systems: Recent Advances and New Frontiers
2. X. Zhou, D. Dong, H. Wu, S. Zhao, D. Yu, H. Tian, X. Liu, and R. Yan. Multi- view response selection for human-computer conversation. In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, pages 372–381, 2016 Khác
4. A. Graves. Long short-term memory. Neural Computation, 9(8):1735, 1997 Khác

HÌNH ẢNH LIÊN QUAN

Mơ hình xác xuất trường điều kiện ngẫu nhiên  - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
h ình xác xuất trường điều kiện ngẫu nhiên (Trang 7)
Mơ hình dự đoán từ mục tiêu dựa vào các từ ngữ cảnh xung quanh  - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
h ình dự đoán từ mục tiêu dựa vào các từ ngữ cảnh xung quanh (Trang 7)
Hình 1.1 Ảnh minh họa Chatbot [1] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 1.1 Ảnh minh họa Chatbot [1] (Trang 13)
Hình 1.2 Các thành phần cơ bản của Chatbot [1] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 1.2 Các thành phần cơ bản của Chatbot [1] (Trang 15)
Mô hình học máy cho bài tốn phân lớp ý định người dùng: - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
h ình học máy cho bài tốn phân lớp ý định người dùng: (Trang 17)
1.2.3.2. Class-based NLG - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
1.2.3.2. Class-based NLG (Trang 22)
Hình 1.5 Phương pháp sinh ngôn ngữ Phrase-based[2] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 1.5 Phương pháp sinh ngôn ngữ Phrase-based[2] (Trang 23)
Hình 2.1 Mạng Nơ-ron hồi quy RNN [2] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.1 Mạng Nơ-ron hồi quy RNN [2] (Trang 24)
Hình 2.3 Mạng RNN (hai chiều) sâu [16] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.3 Mạng RNN (hai chiều) sâu [16] (Trang 26)
Hình 2.5 RNN phụ thuộc long-term [4] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.5 RNN phụ thuộc long-term [4] (Trang 27)
Hình 2.4 RNN phụ thuộc short-term [5] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.4 RNN phụ thuộc short-term [5] (Trang 27)
Hình 2.7 Các mô-đun lặp của mạng LSTM chứa bốn lớp [4] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.7 Các mô-đun lặp của mạng LSTM chứa bốn lớp [4] (Trang 28)
Hình 2.6 Các mơ-đun lặp của mạng RNN chứa một lớp [4] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.6 Các mơ-đun lặp của mạng RNN chứa một lớp [4] (Trang 28)
27 Là các lớp ẩn của mạng nơ-ron  - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
27 Là các lớp ẩn của mạng nơ-ron (Trang 29)
Hình 2.8 Tế bào trạng thái LSTM giống như một băng truyền [4] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.8 Tế bào trạng thái LSTM giống như một băng truyền [4] (Trang 29)
huấn luyện có thể tinh chỉnh được. Ta sẽ thêm vào kiến trúc mô hình một lớp đầu ra để tùy biến theo tác vụ huấn luyện - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
hu ấn luyện có thể tinh chỉnh được. Ta sẽ thêm vào kiến trúc mô hình một lớp đầu ra để tùy biến theo tác vụ huấn luyện (Trang 39)
Hình 2.18 Sơ đồ kiến trúc mơ hình BERT cho tác vụ NSP [10] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.18 Sơ đồ kiến trúc mơ hình BERT cho tác vụ NSP [10] (Trang 42)
2.4.4. Các kiến trúc mơ hình BERT - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
2.4.4. Các kiến trúc mơ hình BERT (Trang 43)
Hình 2.20 Các thành phần chính trong Rasa [12] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.20 Các thành phần chính trong Rasa [12] (Trang 45)
Hình 2.21 Kiến trúc của Rasa [12] - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 2.21 Kiến trúc của Rasa [12] (Trang 46)
Hình 3.1 Kiến trúc mơ hình PhoBERT - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 3.1 Kiến trúc mơ hình PhoBERT (Trang 50)
- intent: hoi_thong_tin_benh   - action: thong_tin_benh_form  - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
intent hoi_thong_tin_benh - action: thong_tin_benh_form (Trang 50)
Hình 3.2 Cấu trúc hệ thống chatbot trong ngàn hY Tế da liễu - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 3.2 Cấu trúc hệ thống chatbot trong ngàn hY Tế da liễu (Trang 51)
Hình 3.3 Biểu đồ cung cấp thông tin của chatbot - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 3.3 Biểu đồ cung cấp thông tin của chatbot (Trang 54)
Hình 3.4 Sequence Diagram cho hành động hỏi thơng tin bệnh - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 3.4 Sequence Diagram cho hành động hỏi thơng tin bệnh (Trang 55)
Hình 3.5 Sequence Diagram cho hành động hỏi thông tin thuốc - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 3.5 Sequence Diagram cho hành động hỏi thông tin thuốc (Trang 56)
- Mơ hình huấn luyện: vinai/phobert-base - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
h ình huấn luyện: vinai/phobert-base (Trang 57)
Hình 3-7 Ma trận ước lượng nhầm lẫn xây dựng dữ liệu intent - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 3 7 Ma trận ước lượng nhầm lẫn xây dựng dữ liệu intent (Trang 59)
Hình 3-8 Biểu đồ độ tin cậy cho các dự đoán - Nghiên cứu và xây dựng chatbot tư vấn người dùng trong y tế da liễu
Hình 3 8 Biểu đồ độ tin cậy cho các dự đoán (Trang 60)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w