Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN ĐẮC NAM
HỆ THỐNG TỰ ĐỘNG PHÂN LUỒNG CÂU HỎI VÀ
GIẢI ĐÁP YÊU CẦU TRỰC TUYẾN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội – 2017
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN ĐẮC NAM
HỆ THỐNG TỰ ĐỘNG PHÂN LUỒNG CÂU HỎI VÀ
GIẢI ĐÁP YÊU CẦU TRỰC TUYẾN
Ngành: Công nghệ thông tin
Chuyên ngành: Kỹ thuật phần mềm
Mã số: 60480103
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS Phạm Ngọc Hùng
TS Trần Quốc Long
Hà Nội – 2017
Trang 31 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất
Trang 42 LỜI CẢM ƠN Lời cảm ơn trân trọng đầu tiên em muốn dành tới các thầy cô Trường Đại học Công Nghệ, Đại học Quốc Gia Hà Nội đã tận tình giảng dạy và truyền đạt kiến thức trong suốt khóa học cao học vừa qua Em cũng xin gửi lời cảm ơn tới các thầy cô trong bộ môn Kỹ thuật phần mềm cũng như khoa Công nghệ thông tin
Đặc biệt em xin chân thành cảm ơn hai thầy PGS TS Phạm Ngọc Hùng
và TS Trần Quốc Long, đã dìu dắt và hướng dẫn em trong suốt quá trình làm luận văn, sự chỉ bảo và định hướng của thầy giúp em tự tin nghiên cứu những vấn
đề mới và giải quyết bài toán một cách khoa học
Em xin trân trọng cảm ơn Ban giám hiệu và các thầy cô Trường Đại học Công nghệ, Đại học Quốc Gia Hà Nội đã tạo các điều kiện cho em được học tập
và làm khóa luận một cách thuận lợi
Xin được cảm ơn Trung tâm Quản lý Chất lượng – Trường Đại học Công nghiệp Hà Nội đã tạo mọi điều kiện để tôi được đi học và hoàn thành tốt khoá học
Mặc dù đã cố gắng rất nhiều, nhưng chắc chắn trong quá trình học tập cũng như luận văn không khỏi những thiếu sót Em rất mong được sự thông cảm và chỉ bảo tận tình của các thầy cô và các bạn
Hà Nội, Ngày tháng năm 2017
Nguyễn Đắc Nam
Trang 53 MỤC LỤC
LỜI CAM ĐOAN 1
LỜI CẢM ƠN 2
MỤC LỤC 3
DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT 5
DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ 6
GIỚI THIỆU CHUNG 7
CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TRẢ LỜI TỰ ĐỘNG 11
1.1 Hệ thống trả lời tự động 11
1.2 Tình hình nghiên cứu trong và ngoài nước 14
1.3 Phân loại các mô hình trả lời tự động 16
CHƯƠNG 2: CƠ SỞ MẠNG NƠ-RON NHÂN TẠO 22
2.1 Kiến trúc mạng nơ-ron nhân tạo 22
2.2 Hoạt động của mạng nơ-ron nhân tạo 24
2.3 Mạng nơ-ron tái phát và ứng dụng 28
CHƯƠNG 3: ỨNG DỤNG MÔ HÌNH MẠNG NƠ-RON VÀO TRẢ LỜI TỰ ĐỘNG 33
3.1 Phát sinh ngôn ngữ trả lời tự động 33
3.2 Mô hình chuỗi tuần tự liên tiếp 35
3.3 Mô hình trả lời tự động 37
3.4 Một số đặc điểm khi xây dựng hệ thống trả lời tự động 38
3.4.1 Phụ thuộc bối cảnh 38
3.4.2 Kết hợp tính cách 39
3.5 Các vấn đề khó khăn khi trả lời tự động bằng Tiếng Việt 39
3.5.1 Đặc điểm ngữ âm 39
3.5.2 Đặc điểm từ vựng: 40
3.5.3 Đặc điểm ngữ pháp 40
Trang 64 CHƯƠNG 4: XÂY DỰNG HỆ THỐNG TRAO ĐỔI THÔNG TIN TRỰC TUYẾN GIỮA SINH VIÊN VỚI NHÀ TRƯỜNG TẠI TRƯỜNG ĐẠI HỌC
CÔNG NGHIỆP HÀ NỘI 42
4.1 Lựa chọn bài toán 42
4.2 Quy trình trao đổi thông tin (hỏi đáp trực tuyến) giữa HSSV với Nhà trường tại Trường Đại học Công nghiệp Hà Nội 43
4.2.1 Quy trình áp dụng 43
4.2.2 Mô tả quy trình áp dụng 44
4.3 Kiến trúc ứng dụng 48
4.4 Cài đặt hệ thống 50
4.4.1 Mô hình cài đặt 50
4.4.2 Môi trường cài đặt 52
4.4.3 Công cụ cài đặt 54
4.5 Kết quả đạt được 54
4.5.1 Một số kết quả 54
4.5.2 Hiệu năng 56
KẾT LUẬN 58
TÀI LIỆU THAM KHẢO 60
Trang 75 DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT STT Ký hiệu,
viết tắt
nhân tạo
4 LSTM Long short-term memory network
phát
Trang 86 DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ Hình 1.1: Mô hình chuỗi sinh
Hình 1.2 Các bước chung của hệ thống trả lời tự động
Hình 2.1: Kiến trúc mạng nơ-ron nhân tạo
Hình 2.2: Quá trình xử lý thông tin của một mạng nơ-ron nhân tạo Hình 2.3: Ứng dụng RNN trong máy dịch
Hình 2.4: Ứng dụng RNN phát sinh mô tả cho ảnh
Hình 2.5: Mạng RNN hai chiều
Hình 2.6: Mạng RNN nhiều tầng
Hình 3.1: Mô hình phát sinh văn bản
Hình 3.2: Quá trình huấn luyện và phát sinh văn bản
Hình 3.3: Mô hình chuỗi liên tiếp (chuỗi sang chuỗi) seq2seq Hình 3.4: Mô hình đối thoại seq2seq
Trang 97 GIỚI THIỆU CHUNG Hiện tại việc tiếp nhận, giải quyết và trả lời câu hỏi thắc mắc hoặc yêu cầu của người dùng như (Hệ thống hỏi đáp Q&A và giải quyết thắc mắc): của khách hàng trong hoạt động thương mại, của người dân trong thủ tục hành chính, của học sinh - sinh viên trong hoạt động đào tạo của các trường đại học - cao đẳng
là rất lớn Các hoạt động tiếp nhận câu hỏi và trả lời câu hỏi hiện nay đều là hoạt động mang tính thủ công mà chưa có công cụ nào trợ giúp Việc tiếp nhận và xử
lý còn chậm, thiếu chính xác và chưa công khai minh bạch Các câu hỏi và yêu cầu của người dùng thì đi vào nhiều lĩnh vực và thuộc nhiều đối tượng trả lời khác nhau, việc lựa chọn đúng đối tượng trả lời gây khó khăn và hiểu nhầm cho người dùng dẫn đến các câu hỏi và yêu cầu thường không được trả lời thỏa đáng
Cho đến nay các hệ thống trực tuyến đã giải quyết được những yêu cầu tiện lợi hơn Ví dụ như mua sắm trên mạng: người sử dụng có thể truy cập vào một địa chỉ và có thể mua sắm được nhiều mặt hàng của nhiều đơn vị sản xuất (Ví dụ amazon, lazada) Yêu cầu của người mua hàng được các website này phân tích và đưa ra các đề nghị sản phẩm hợp lý với người mua hàng nhờ vào các hệ thống trí tuệ nhân tạo (AI) và học máy (ML) giúp cải thiện doanh thu bán hàng đáng kể và
là thành phần không thể thiếu trong các website bán hàng ngày nay
Do vậy hệ thống phân luồng và trả lời tự động rất thiết thực trong bối cảnh hiện nay
1 Tính cấp thiết của bài toán trả lời tự động
Trong bối cảnh mạng xã hội và các website mua sắm đang ngày càng trở nên rất phổ biến như hiện nay, con người cũng tăng nhu cầu kết nối với con người thông qua mạng xã hội, vào bất kỳ thời gian nào và ở bất cứ nơi đâu Sẽ thật tốt hơn nếu có một hệ thống tự động thông minh hỗ trợ con người bằng cách trò chuyện, có khả năng nhắc nhở, có thể giải đáp mọi thắc mắc chỉ trong thời gian ngắn nhất
Trang 108 Khái niệm về trợ lý ảo, chatbot, hay hệ thống trả lời tự động đang là chủ đề nóng, khi các công ty lớn như Microsoft (Cortana), Google (Google Assistant), Facebook (M), Apple (Siri), Samsung (Viv) đã giới thiệu các trợ lý ảo của mình,
là các hệ thống trả lời tự động Chính thức vào cuộc chơi chatbot, với mong muốn tạo ra một trợ lý ảo thực sự thông minh tồn tại trong hệ sinh thái trong các sản phẩm của mình Gần đây nhất Microsoft đã tạo ra Microsoft Chat Framework cho phép các nhà phát triển tạo ra các chatbot trên nền tảng Web và Skype, hay Facebook cũng phát hành F8 SDK cho phép nhà phát triển tích hợp vào Messenger
Và không chỉ các ông lớn trong giới công nghệ, các công ty khởi nghiệp mới cũng đang cố gắng tạo ra các dịch vụ nhằm thay đổi cách khách hàng tương tác bằng các giải pháp trợ lý ảo Nhằm trợ giúp người dùng, khách hàng của mình
có những trải nghiệm tốt nhất về sản phẩm và cách cung cấp dịch vụ Nổi bật nhất trong đó phải kể đến các ứng dụng tích hợp trợ lý ảo như wit.ai, x.ai, reply.ai trên nền tảng Messenger của Facebook
Ở trong nước, một số công ty như Quản lý Hồ sơ y tế điện tử ERM.,JSC và Vietcare đã phát triển tạo ra hệ thống trả lời tự động về kiến thức y khoa, hỏi đáp
về sức khỏe thông tin y tế, hay RiveHub, Subiz, … cũng đang cố gắng tạo ra cho mình một hệ thống hỗ trợ, chăm sóc khách hàng và bán hàng tự động
Rất nhiều công ty khác đang có hi vọng phát triển các trợ lý ảo có thể hiểu được ngôn ngữ tự nhiên của con người, có thể trả lời tự động và tương tác được với con người một cách tự nhiên Nhiều người cho rằng việc sử dụng kỹ thuật xử
lý ngôn ngữ tự nhiên NLP và các kỹ thuật học sâu Deep Learning để làm tăng được chất lượng và hiệu quả của hệ thống Nhưng từ lý thuyết đến thực tế là cả một chặng đường dài, bằng cách nào đó, con người có thể tích hợp trí tuệ nhân tạo (AI) vào các sản phẩm công nghiệp của mình
Như vậy, hệ thống trả lời tự động có những nhiệm vụ và vai trò quan trọng,
có thể trợ giúp được con người rất nhiều trong rất nhiều lĩnh vực: y tế, giáo dục,
Trang 11Luận văn đầy đủ ở file: Luận văn full