Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 66 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
66
Dung lượng
1,99 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Ứng dụng học sâu hệ thống Chatbot hỗ trợ chăm sóc khách hàng ĐINH HUY TUẤN tuandh.ttud@gmail.com Ngành: Tốn Tin Giảng viên hướng dẫn: TS.LÊ CHÍ NGỌC Viện: Chữ kí GVHD Tốn ứng dụng Tin học HÀ NỘI, 05/2021 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN Lời cảm ơn Tác giả xin gửi lời cảm ơn trân trọng tới TS Lê Chí Ngọc, người trực tiếp hướng dẫn tác giả nhiệt tình, chu đáo, động viên mặt tinh thần để tác giả hồn thành luận văn Tác giả xin trân trọng cảm ơn Viện Toán Ứng dụng Tin học, Phòng đào tạo Bộ phận quản lý đào tạo sau đại học, Trường Đại học Bách Khoa Hà Nội tạo điều kiện thuận lợi để tác giả hoàn thành luận văn Cuối cùng, tác giả xin gửi lời cảm ơn tới gia đình, người thân bạn bè động viên giúp đỡ tác giả suốt trình thực đề tài LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN Tóm tắt nội dung luận văn Những năm gần đây, Chatbot nghiên cứu phát triển với tốc độ chóng mặt trung tâm nghiên cứu, trường đại học, học viện, doanh nghiệp ứng dụng nhiều lĩnh vực Cùng với phát triển lĩnh vực học sâu, chatbot ngày linh hoạt việc hiểu ngôn ngữ đưa phản hồi môt cách xác Trong nội dung luận văn, tác giả tập trung vào xây dựng Chatbot miền cụ thể lĩnh vực tài với ngơn ngữ Tiếng Việt Tác giả đề xuất phương pháp tích hợp mơ hình học sâu xử lý ngơn ngữ tự nhiên vào thành phẩn hiểu ngôn ngữ thành phần quản lý hội thoại Chatbot Kết thực nghiệm cho thấy việc áp dụng mơ hình học sâu miền cụ thể cải thiện độ xác, qua làm tăng chất lượng cho Chatbot Kết mà luận văn thu làm tiền đề cho việc phát triển Chatbot trở lên hiệu áp dụng vào thực tế nhiều lĩnh vực khác y tế, giáo dục, thương mại, Từ khóa: Deep learning, Natural Language Understanding, Dialog management, Intent Detection, Slot Filling Hà Nội, ngày 14 tháng 05 năm 2021 Giáo viên hướng dẫn HỌC VIÊN Kí ghi rõ họ tên Kí ghi rõ họ tên Mục lục MỞ 1.1 1.2 1.3 ĐẦU Lý lựa chọn đề tài Mục tiêu đề tài Phạm vi cấu trúc đề tài 1.3.1 Mục tiêu nhiệm vụ 1.3.2 Đối tượng phạm vi nghiên cứu 1.3.3 Ý nghĩa khoa học thực tiễn 1.3.4 Bố cục luận văn CƠ SỞ LÝ THUYẾT 2.1 Phương pháp học sâu 2.1.1 Mạng neural 2.1.2 Một số mơ hình mạng neural 2.2 Xử lý ngôn ngữ tự nhiên 2.2.1 Tổng quan 2.2.2 Một số khái niệm 2.2.3 Quy trình xử lý ngơn ngữ tự nhiên 2.2.4 Các ứng dụng xử lý ngôn ngữ tự nhiên 2.3 Tổng quan hệ thống chatbot 2.3.1 Khái niệm 2.3.2 Các mơ hình Chatbot 2.3.3 Phân loại Chatbot 2.3.4 Một số phương pháp xây dựng Chatbot 2.3.5 Các vấn đề phát triển hệ thống Chatbot MƠ HÌNH ĐỀ XUẤT 3.1 Xây dựng kiến trúc chatbot 3.2 Bài toán xác định ý định người dùng 3.2.1 Các phương pháp biểu diễn từ 3.2.2 Mơ hình ngơn ngữ 9 10 12 12 12 12 13 14 14 14 15 20 20 21 21 22 24 24 24 25 25 26 28 28 29 30 31 LUẬN VĂN THẠC SĨ 3.3 3.4 3.5 ĐINH HUY TUẤN 3.2.3 Thuật toán phân lớp ý định Bài tốn trích rút thông tin 3.3.1 Các mơ hình gán nhãn chuỗi (sequence labeling) 3.3.2 Hidden Markov Model 3.3.3 Conditional Random Field Bài toán quản lý hội thoại 3.4.1 Mơ hình máy trạng thái hữu hạn FSA 3.4.2 Mơ hình Frame-based Bài tốn sinh ngơn ngữ 3.5.1 Template-Base 3.5.2 Plan-based 3.5.3 Class-based 33 36 37 37 38 39 39 40 41 41 42 43 DỮ LIỆU VÀ HỆ THỐNG 44 4.1 Giới thiệu mã nguồn mở RASA 44 4.1.1 Kiến trúc tổng thể 44 4.1.2 Luồng xử lý 45 4.1.3 Mơ hình xác định ý định trích rút thông tin song song (Dual Intent Entity Transformer) 46 4.1.4 Mơ hình Transformer Embedding Dialogue 47 4.2 Xây dựng liệu 49 4.2.1 Quá trình thu thập liệu 49 4.2.2 Mô tả chức 49 4.2.3 Xây dựng liệu NLU 50 4.2.4 Xây dựng câu trả lời 53 4.2.5 Xây dựng liệu kịch 53 4.3 Cấu hình cài đặt 54 4.3.1 Xây dựng Word2Vec cho lĩnh vực tài 54 4.3.2 Cài đặt NLU Tiếng Việt cho RASA 54 4.3.3 Cấu hình pipeline cho RASA 55 4.4 Kết mơ hình 57 4.4.1 Phương pháp đánh giá 57 4.4.2 Đánh giá mơ hình 57 4.4.3 Kết chạy thực nghiệm Chatbot 60 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 62 5.1 Kết luận 62 5.2 Hướng phát triển 62 Danh sách hình vẽ 1.1 1.2 Kiến trúc hệ thống Contact Center Kiến trúc hệ thống tích hợp chatbot 11 12 2.1 2.2 2.3 2.4 2.5 Cấu trúc neural nhân tạo Kiến trúc mạng CNN với lọc F stride S Max pooling average pooling Kiến trúc mạng RNN Kiến trúc hệ thống phân lớp ý định 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 15 18 19 20 26 Các bước xử lý pipeline NLU Các cách biểu diễn từ Mơ hình encoder Mơ hình Transformer Mơ hình HMM Mô hình máy trạng thái hữu hạn FSA Phương pháp sinh ngôn ngữ dựa tập mẫu câu Phương pháp sinh ngôn ngữ Plan-based Phương pháp sinh ngôn ngữ Class-based trả lời 29 30 32 36 38 40 42 42 43 Kiến trúc tổng thể RASA Quy trình xử lý tin nhắn Mơ hình high-level DIET Mô hình kiến trúc mạng DIET Mơ hình Transformer Embedding Dialogue Q trình thu thâp liệu Mô tả chức Chatbot Ví dụ liệu ý định Đặt lệnh Ví dụ câu trả lời RASA Ví dụ liệu kịch Cấu hình Pipeline cho word2vec Cấu hình Pipeline cho PhoBERT 44 45 46 47 48 49 50 52 53 54 56 56 LUẬN VĂN THẠC SĨ 4.13 4.14 4.15 4.16 4.17 ĐINH HUY TUẤN Cấu hình Pipeline cho Dialog management Kết thực nghiệm toán xác định ý định Ma trận Confussion toán xác định ý định Chạy thực nghiệm với chức Đặt lệnh Chạy thực nghiệm với chức khác 57 58 59 60 61 Danh sách bảng 3.1 Dữ liệu frame-base cho nghiệp vụ mở tài khoản 41 4.1 4.2 4.3 4.4 4.5 Thống kê mô tả chi tiết liệu ý định người dùng Thống kê mô tả chi tiết liệu thực thể Danh mục thực thể cho chức chatbot Kết thực nghiệm toán xác định ý định Kết thực nghiệm toán trích rút thơng tin 51 51 52 58 58 Bảng kí hiệu từ ngữ viết tắt Từ viết tắt Ý nghĩa DIET Mơ hình phân loại ý định thực thể đồng thời TED Mơ hình Transformer quản lý hội thoại HMM Hidden Markov model, Mơ hình Markov ẩn CRF Condidtional Random Field, Mơ hình trường điều kiện ngẫu nhiên CNN Convolution Neural Network, Mạng neural tích chập RNN Recurent Neural Network, Mạng neural hồi tiếp LSTM Long-short Term Memory, Mạng nhớ dài-ngắn ANN Artificial Neural Network, Mạng neural nhân tạo BERT Mơ hình biểu diễn từ hai chiều NLU Hệ thống hiểu ngôn ngữ tự nhiên CHƯƠNG MỞ ĐẦU 1.1 Lý lựa chọn đề tài Những năm gần đây, ngành công nghệ thông tin lĩnh vực máy học phát triển nhanh ứng dụng rộng rãi Trong đó, Chatbot nghiên cứu phát triển với tốc độ chóng mặt trung tâm nghiên cứu, trường đại học, học viện, doanh nghiệp ứng dụng nhiều lĩnh vực Chatbot ứng dụng phần mềm dùng hệ thống thảo luận trực tuyến văn văn chuyển thành giọng nói, thay thảo luận trực tiếp với người dùng thật Theo cách tương tác với người dùng, chatbot thường chia thành hai loại: âm tin nhắn Các chatbot thiết kế phức tạp dựa tảng xử lý ngơn ngữ tự nhiên, có nhiều hệ thống khác đơn giản cách quét từ khóa đầu vào, sau trả lời với từ khóa phù hợp mẫu từ ngữ tương tự sở liệu Có nhiều cơng cụ thư viện hỗ trợ cho Chatbot như: Dialogflow, Wit.ai, IBM Waston Service, RASA , hay tiếng Việt có FPT.AI Các cơng cụ, thư viện hầu hết áp dụng công nghệ học máy, học sâu, để nâng cao khả giao tiếp chương trình Chatbot Để chương trình Chatbot thực giao tiếp cần có kênh tảng điện tốn đám mây Google Assistant Amazon Alexa, ứng dụng tin nhắn Facebook Messenger, WeChat thông qua ứng dụng trang web tổ chức riêng lẻ Chatbot sử dụng nhiều ứng dụng khác việc chăm sóc khách hàng (cung cấp thơng tin sản phẩm, đưa thông tin gợi ý, giải đáp thắc mắc, ) Chatbot giúp tối ưu hóa suất, giảm thiểu chi phí chăm sóc khách hàng, chăm sóc sức khỏe, đời sống người Hiện nay, nhà đầu tư người dùng sản phẩm tài tìm hiểu thơng tin dịch vụ tài thơng qua cơng cụ tìm kiếm thông tin internet thông tin từ công ty tài Tuy nhiên thơng tin hữu ích thiết thực với người dùng hạn chế, khách hàng phải nhiều thời gian việc tìm hiểu thơng tin Cùng với đó, cách kênh chăm sóc khách hàng cơng ty tài có lượng hữu hạn nhân viên trực tổng LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN Chức Dữ liệu mẫu Số lượng Đặt lệnh Đặt lệnh đầu tư 6043 Số dư cổ phiếu Tơi cịn cổ phiếu 601 Khuyến nghị Nên mua cp ko 1221 Đăng ký Đăng ký sử dụng chatbot 433 Báo không đặt lệnh Tôi đặt lệnh đầu tư 671 Đăng nhập vào tài khoản t 944 Trạng thái lệnh Trạng thái lệnh tơi có 1327 Hủy đăng ký Hủy sử dụng AI Smart 805 Hủy lệnh hủy tất lệnh 789 Trạng thái tỉ lệ Check trạng thái tài khoản 754 Số dư chứng khoán Xem hộ số dư tiền vs? 1988 Chuyển tiền Chuyển tiền vào tài khoản 2312 Rút tiền Mình muốn rút tiền với 1312 Hướng dẫn sử dụng Điều khoản sử dụng 1532 Thông tin cổ phiếu giá TBC nào? 920 Tạo tạo tài khoản chứng khoán 3578 Bảng 4.1: Thống kê mô tả chi tiết liệu ý định người dùng Đối với tốn trích rút thơng tin người dùng, bao gồm loại thực thể: Lệnh, Cổ phiếu, Số lượng, Giá Loại thực thể Lệnh chủ yếu từ liên quan đồng nghĩa với mua bán loại thực thể Cổ phiếu lại đa dạng hơn, mã cổ phiếu tên công ty Khác với hai loại thực thể trên, thực thể lại Số lượng Giá chủ yếu viết dạng số có quy tắc riêng Số lượng mẫu loại thực thể khoảng từ 4722 đến 9926, cho thấy loại liệu không cân Chi tiết liệu huấn luyện cho tốn trích rút thông tin người dùng: Loại thực thể Dữ liệu mẫu Số lượng Lệnh Đặt lệnh [bán](trading_type) 5358 Mã Cổ phiếu Mua mã [SSI](stock_id) 9926 Số lượng mua [100](stock_quantity) cp 5590 Giá mua cp giá [30.5](stock_price) 4722 Bảng 4.2: Thống kê mô tả chi tiết liệu thực thể Về mối quan hệ loại Ý định loại Thực thể, số loại Ý định lại bao gồm Thực thể, số khác lại khơng có Thực 51 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN thể Có thể thấy loại Thực thể Mã cổ phiếu phân bố nhiều trong Thực thể (nằm loại Ý định) Danh mục thực thể cho chức chi tiết sau: Chức Thực thể Đặt lệnh Lệnh, Mã cổ phiếu, Số lượng, Giá Số dư cổ phiếu Mã cổ phiếu Khuyến nghị Mã cổ phiếu Đăng ký - Báo không đặt lệnh - Đăng nhập - Trạng thái lệnh Lệnh, Mã cổ phiếu, Số lượng, Giá Hủy đăng ký - Hủy lệnh Lệnh, Mã cổ phiếu, Số lượng, Giá Trạng thái tỉ lệ Mã cổ phiếu Số dư chứng khoán Mã cổ phiếu Chuyển tiền - Rút tiền - Hướng dẫn sử dụng - Thông tin cổ phiếu Mã cổ phiếu Tạo - Bảng 4.3: Danh mục thực thể cho chức chatbot Trong RASA, liệu lưu định dạng Markdown, ví dụ trường hợp ý định Đặt lệnh: Hình 4.8: Ví dụ liệu ý định Đặt lệnh 52 LUẬN VĂN THẠC SĨ 4.2.4 ĐINH HUY TUẤN Xây dựng câu trả lời Phải xây dựng cho bot hệ thống câu trả lời mẫu (template) cho câu hỏi người dùng Tuy nhiên, ta xây dựng câu trả lời cho bot thông qua action Hành động thứ bot chạy để đáp ứng yêu cầu người dùng Đây thành phần cung cấp thông tin trả lời người dùng dựa vào intent, entity, slot liệu lấy từ hệ thống khác qua API Ví dụ câu trả lời RASA: Hình 4.9: Ví dụ câu trả lời RASA Có loại hành động rasa core: • Defaul actions: hành động lắng nghe người dùng, restart lại hội thoại trả lời mặc định không phân loại ý định người dùng • Utter actions: tập template mẫu xây dựng cho bot • Custom actions: Khi tập câu trả lời mẫu không đáp ứng câu hỏi người dùng cần kết từ nguồn liệu khác action tuỳ biến sử dụng, đến hàm lớp action 4.2.5 Xây dựng liệu kịch Đối với việc xậy dựng kịch (dữ liệu huấn luyện cho thành phần Dialog management), kết hợp liệu chạy thực tế liệu tự sinh từ luật nhằm điều hướng người dùng vào hội thoại • Story: Kịch thu thập từ liệu thực tế, thường bao gồm nhiều biến thể đa dạng Việc thêm vào liệu thực tế cần thiết cho huấn luyện Chatbot, mang lại linh hoạt hành động Chatbot • Rule: Cũng liệu thực tế đa dạng, nên nhằm tránh cho việc Chatbot trả lời khơng trọng tâm, Rule giúp cho Chatbot thực 53 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN hành động cách có quy luật, ví dụ sau ý định Xin chào Bot thực chào lại Ví dụ trường hợp liệu kịch lưu RASA: Hình 4.10: Ví dụ liệu kịch 4.3 4.3.1 Cấu hình cài đặt Xây dựng Word2Vec cho lĩnh vực tài Nhằm tăng tính chun mơn hóa cho Chatbot lĩnh vực, cụ thể lĩnh vực tài chính, nghiên cứu tơi áp dụng phương pháp sử dụng word embedding tài huấn luyện theo mơ hình Word2Vec Trước tiên, sử dụng thư viện Scrapy Python để crawl liệu từ trang báo tài như: CafeF, ndh.vn, VnEconomy, Tổng khối lượng liệu lĩnh vực tài 1.3GB Sau đó, tơi sử dụng thư viện Gensim Python để huấn luyện lượng liệu này, huấn luyện theo mơ hình Word2Vec Mơ hình sau tích hợp vào thư viện xử lý ngơn ngữ tự nhiên Spacy, cách để tích hợp vào mã nguồn mở RASA sau 4.3.2 Cài đặt NLU Tiếng Việt cho RASA Hiện tại, RASA cấu hình trước vài NLU pipeline cho ngôn ngữ Tiếng Anh Tensorflow-based pipeline CONVERT-based pipeline, cho đa ngôn ngữ BERT-based pipeline Tuy nhiên, mã nguồn mở RASA chưa hỗ trợ pipeline hoàn tồn cho ngơn ngữ Tiếng Việt nên cần phải cài đặt NLU Tiếng Việt trước áp dụng liệu để huấn luyện Mơ hình thiết kế NLU pipeline RASA cho phép 54 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN ta thay sửa thành phần pipline đó, dẫn đến việc ta tích hợp cách thay thành phần tokeninzer thành phần sinh embedding vector sang Tiếng Việt Trong nghiên cứu này, việc cài đặt NLU Tiếng Việt cho RASA tiến hành thử nghiệm trường hợp: • Tích hợp Tokenizer Tiếng Việt Pyvi embedding vector dùng Word2Vec Tiếng Việt xây dựng trước • Tích hợp Tokenizer embedding vector sử dụng PhoBERT 4.3.3 Cấu hình pipeline cho RASA Dựa theo hai hướng tích hợp trên, ta cấu hình pipeline cho RASA sau: • Tokenizer Pyvi + Word2Vec: Ngơn ngữ xử lý: Tiếng Việt - Tokenizer: ViSpacyTokenizer - class viết nhằm tích hợp thư viện Tokenizer Tiếng Việt Pyvi - Featurizer: Bao gồm thành phần mặc định RASA RegexFeaturizer, CountVectorsFeaturizer, LexicalFeaturizer Ngoài cịn có thêm thành phần ViSpacyFeaturizer - thành phần lấy feature từ Word2Vec Tiếng Việt Các feature sau lấy tổng hợp lại trước đưa vào mơ hình DIET - DIETClassifier: Là class để thực thi mơ hình DIET - huấn luyện ý định người dùng trích rút thơng tin lúc 55 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN Hình 4.11: Cấu hình Pipeline cho word2vec • PhoBERT Với cấu hình này, việc Tokenizer đảm nhiệm PhobertTokenizer, việc lấy feature đảm nhiệm PhobertFeaturizer Các thành phần khác tương tự với cấu hình Hình 4.12: Cấu hình Pipeline cho PhoBERT Việc cấu hình cho Dialog management hai pipeline nhau, áp dụng thành phần sau: - FormPolicy: áp dụng phương pháp Frame-base - MappingPolicy MemoryPolicy: áp dụng phương pháp History-base - TEDPolicy: áp dụng mơ hình TED để dự đoán hành động 56 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN Hình 4.13: Cấu hình Pipeline cho Dialog management 4.4 4.4.1 Kết mơ hình Phương pháp đánh giá Phương pháp phù hợp để đánh giá mơ hình phân loại tập liệu cân sử dụng F1 Score F1 Score trung bình điều hịa precision recall Do đại diện việc đánh gía độ xác đồng thời precision recall F1 = precision− + recall− Trong đó: true positive total predicted positive true positive recall = total actual positive precision = Do đặc thù liệu cho toán Chatbot số lượng mẫu (k-shot) số lượng lớp (n-way) lại tương đối nhiều N-way K-shot đề cập đến số nhãn k liệu huấn luyện nhãn N viết tắt số nhãn, K số lượng liệu huấn luyện Phương pháp học One-Shot Learning Few-Shot Learning có nhãn vài nhãn (ít tổng số nhãn) Các ý tưởng chuyển đổi liệu chia sẻ kiến thức Như để đánh giá mơ hình có khả tổng qt hay không, ta tiến hành thử nghiệm loại bỏ lượng phần trăm định (0%, 25%, 50%, 75%) liệu khỏi tập huấn luyện, giữ nguyên số lượng tập đánh giá 4.4.2 Đánh giá mơ hình Việc đánh giá hiệu hai pipeline tiến hành qua bước sau: Chia tập liệu thành tập huấn luyện tập đánh giá với tỉ lệ 80:20 57 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN Loại bỏ lượng phần trăm định (0%, 25%, 50%, 75%) liệu khỏi tập huấn luyện Huấn luyện mơ hình ứng với pipeline với tập huấn luyện vừa thu Đánh giá mơ hình với tập đánh giá Lần thử nghiệm Pipeline Word2Vec Pipeline PhoBERT 0% loại bỏ 91.7 % 90.8% 25% loại bỏ 91.7% 90.5% 50% loại bỏ 91.6% 90.3% 75% loại bỏ 89.9% 87.2% Bảng 4.4: Kết thực nghiệm tốn xác định ý định Hình 4.14: Kết thực nghiệm toán xác định ý định Loại Entity Pipeline Word2Vec Pipeline PhoBERT trading_type 93.7 % 93.2% stocks_quantity 98.6% 97.5% stocks_cost 98.6% 98.1% stocks_id 92.4% 92.2% Bảng 4.5: Kết thực nghiệm tốn trích rút thông tin 58 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN Với bảng biểu đồ trên, ta thấy mơ hình ứng với pipeline cho kết f1-score cao (ở mức 87%), pipeline với mơ hình Word2Vec Tài cho kết nhỉnh so với mơ hình PhoBERT (cao khoảng từ 1-2%) Ở mức loại bỏ 75% liệu, ta thấy có sụt giảm đáng kể f1-score, mơ hình (sụt giảm từ 1-3%) Hình 4.15: Ma trận Confussion toán xác định ý định 59 LUẬN VĂN THẠC SĨ 4.4.3 ĐINH HUY TUẤN Kết chạy thực nghiệm Chatbot Hệ thống chatbot với liệu huấn luyện kịch hội thoại, xây dựng slot, thực thể giúp cho chatbot lấy thơng tin từ phía người dùng Chatbot xác định ý định người dùng để thông qua actions lập trình thực hành động đặt lệnh chứng khốn, tra cứu thơng tin tài khoản, đăng ký/hủy đăng ký dịch vụ Dưới kết kiểm nghiệm thiết kế chatbot hỗ trợ bán hàng WidgetChat - nhúng vào trang web Hình 4.16: Chạy thực nghiệm với chức Đặt lệnh 60 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN Hình 4.17: Chạy thực nghiệm với chức khác 61 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết luận Bài luận văn làm rõ số vấn đề chatbot ứng dụng học sâu việc nâng cao chất lượng chatbot Nội dung khoá luận tìm hiểu số kiến thức bao gồm cấu trúc nhiệm vụ thành phần chatbot, số thuật toán học sâu áp dụng vào việc xây dựng chatbot Dựa vào xây dựng hệ thống chatbot giải toán hỗ trợ người dùng nhiều lĩnh vực khác Quá trình tìm hiểu xây dựng hệ thống chăm sóc khách hàng lĩnh vực tài đạt số kết sau: Thứ nhất, nắm mơ hình, thành phần cách thức hoạt động, bước xử lý hệ thống chatbot, số thuật toán phương pháp xử lý liệu chatbot Từ kiến thức đó, xây dựng bot theo bât mơ hình nào, phương pháp phù hợp tuỳ vào yêu cầu toán cụ thể Thứ hai hoàn thiện việc xây dựng liệu đào tạo cho chatbot lĩnh vực tài Q trình xây dựng liệu có kinh nghiệm xử lý gán nhãn liệu để tránh nhập nhằng từ ngữ Từ đó, mang lại liệu mang lại độ xác cao cho hệ thống Thứ ba việc áp dụng mã nguồn mở RASA vào trình xây dựng hệ thống chatbot tiếp cận số phương pháp thuật toán lĩnh vực học sâu áp dụng cho chatbot Thứ tư hoàn thành việc áp dụng word embedding Tiếng Việt vào tảng RASA, qua giúp Chatbot cải thiện chất lượng ngôn ngữ Tiếng Việt, đặc biệt lĩnh vực tài 5.2 Hướng phát triển Ứng dụng Chatbot luận văn sản phẩm demo tiền đề cho phát triển số bot áp dụng cho toán thực tế lĩnh vực y tế, 62 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN du lịch, giáo dục Định hướng nghiên cứu tiếp theo: • Kết hợp với app website • Tích hợp hỗ trợ nhận diện giọng nói • Xây dựng bot mang tính cảm xúc • Xây dựng chức khác cho bot: phân tích cảm xúc, tóm tắt hội thoại, 63 LUẬN VĂN THẠC SĨ ĐINH HUY TUẤN TÀI LIỆU THAM KHẢO [1] M B Open-source Library for Coversational AI (distributed under Apache v2 license) , May 29, 2019 [2] Tom Bocklisch, "Conversational AI with Rasa NLU & Rasa Core," 2018 [3] B T a S Y Matthew Henderson, Word-Based Dialog State Tracking with Recurrent Neural Networks, 2014 [4] Allen.J, Natural Language Understanding Benjamin Cummings, Menlo Park, CA [5] Dat Quoc Nguyen and Anh Tuan Nguyen “PhoBERT: Pre-trained language models for Vietnamese” In: Findings of the Association for Computational Linguistics: EMNLP 2020 2020, pp 1037–1042 [6] Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova 2019 BERT: Pre-training of deep bidirectional transformers for language understanding In Proceedings of NAACL-HLT, pages 4171–4186 [7] Christopher M Bishop, Pattern Recognition and Machine Learning, 2006 [8] Tanja Bunk, Daksh Varshneya1y, Vladimir Vlasov1z, Alan Nicholx, DIET: Lightweight Language Understanding for Dialogue Systems Rasa [9] Aston Zhang, Zachary C Lipton, Mu Li, and Alexander J Smola, Dive into Deep Learning, 2020 [10] Srini Janarthanam, Hands-On Chatbots and Conversational UI Development, 2020 [11] Farookh Khadeer Hussain, Ebtesam Almansor Survey on Intelligent Chatbots: State-of-the-Art and Future Research Directions, January 2020 [12] Li Deng, Yang Liu, Deep Learning in Natural Language Processing, Springer Publishing Company, 2018 64 [13] Ian Goodfellow, Yoshua Bengio and Aaron Courville Deep Learing, MIT Press, 2016 [14] Vladimir Vlasov, Johannes E M Mosig, and Alan Nichol Dialogue Transformers, Rasa, 2019 [15] Đinh Điền, Giáo trình xử lý ngơn ngữ tự nhiên, Đại học Khoa Học Tự Nhiên Tp.HCM, 12/2004 ... tài "Ứng dụng học sâu hệ thống chatbot hỗ trợ chăm sóc khách hàng" làm đề tài luận văn 1.2 Mục tiêu đề tài Hệ thống chatbot hỗ trợ tư vấn tài chăm sóc khách hàng hệ thống nhằm cung cấp chức chatbot. .. thoại hệ thống giao dịch chứng khoán chuẩn bị Phạm vi nghiên cứu xây dựng thực nghiệm hệ thống chatbot thay nhân viên chăm sóc khách hàng việc hỗ trợ người dùng sử dụng hệ thống giao dịch chứng... trúc hệ thống tích hợp chatbot 1.3 1.3.1 Phạm vi cấu trúc đề tài Mục tiêu nhiệm vụ Ứng dụng mã nguồn mở Rasa để xây dựng thử nghiệm hệ thống chatbot hỗ trợ chăm sóc khách hàng cho cơng ty chứng