1. Trang chủ
  2. » Luận Văn - Báo Cáo

HỆ THỐNG TRẢ LỜI TỰ ĐỘNG CHUYÊN NGÀNH PHẬT HỌC - Full 10 điểm

14 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Xây Dựng Hệ Thống Trả Lời Tự Động Chuyên Ngành Phật Học
Tác giả Nguyễn Hoàng Đạt
Người hướng dẫn TS. Ngô Hồ Anh Khôi
Trường học Trường Đại Học Nam Cần Thơ
Chuyên ngành Công Nghệ Thông Tin
Thể loại Đồ Án Thực Tập
Năm xuất bản 2021
Thành phố Cần Thơ
Định dạng
Số trang 14
Dung lượng 210,17 KB

Nội dung

TRƯ Ờ NG Đ Ạ I H Ọ C NAM C Ầ N THƠ KHOA K Ỹ THU Ậ T – CÔNG NGH Ệ   NGUY Ễ N HOÀNG Đ Ạ T 176899 NGHIÊN C Ứ U XÂY D Ự NG H Ệ TH Ố NG TR Ả L Ờ I T Ự Đ Ộ NG CHUYÊN NGÀNH PH Ậ T H Ọ C Đ Ồ ÁN TH Ự C T Ậ P Ngành Công ngh ệ Thông tin Mã s ố Ngành: 7480201 C ầ n Thơ, tháng 05 năm 2021 T RƯ Ờ NG Đ Ạ I H Ọ C NAM C Ầ N THƠ KHOA K Ỹ THU Ậ T – CÔNG NGH Ệ NGUY Ễ N HOÀNG Đ Ạ T MSSV: 176 8 9 9 NGHIÊN C Ứ U XÂY D Ự NG H Ệ TH Ố NG TR Ả L Ờ I T Ự Đ Ộ NG CHUYÊN NGÀNH PH Ậ T H Ọ C Đ Ồ ÁN TH Ự C T Ậ P Ngành Công N gh ệ Thông T in Mã s ố Ngành: 7480201 GI Ả NG VIÊN HƯ Ớ NG D Ẫ N T S NGÔ H Ồ ANH KH ÔI C ầ n Thơ, tháng 05 năm 2021 CH Ấ P THU Ậ N C Ủ A H Ộ I Đ Ồ NG Đ ồ án th ự c t ậ p “ N ghiên c ứ u xây d ự ng h ệ th ố ng tr ả l ờ i t ự đ ộ ng chuyên ngành ph ậ t h ọ c ”, do sinh viên Nguy ễ n Hoàng Đ ạ t dư ớ i s ự hư ớ ng d ẫ n c ủ a T S Ngô H ồ Anh Khôi Đ ồ án đã đư ợ c báo cáo và H ộ i đ ồ ng ch ấ m khóa lu ậ n thông qu a ngày … tháng … nă m 202 1 Ủ y viên Thư ký ---------------------------------------- ------------------------------------ GHI CH Ứ C DANH, H Ọ , TÊN GHI CH Ứ C DANH, H Ọ , TÊN Ph ả n bi ệ n 1 Ph ả n bi ệ n 2 ----- - ---------------------------------- ------------------------------------ GHI CH Ứ C DANH, H Ọ , TÊN GHI CH Ứ C DANH, H Ọ , TÊN Cán b ộ hư ớ ng d ẫ n Ch ủ t ị ch h ộ i đ ồ ng ----- - ---------------------------------- ------------------------------------ -- GHI CH Ứ C DANH, H Ọ , TÊN GHI CH Ứ C DANH, H Ọ , TÊN i L Ờ I C Ả M ƠN Tôi xin chân th ành g ử i l ờ i c ả m ơn đ ế n TS Ngô H ồ Anh Khôi - Gi ả ng viên Trư ờ ng Đ ạ i h ọ c Nam C ầ n Thơ đã nhi ệ t tình hư ớ ng d ẫ n trong su ố t th ờ i gia n làm đ ề tài th ự c t ậ p t ố t nghi ệ p Th ầ y là ngư ờ i đã t ạ o ra r ấ t nhi ề u đi ề u ki ệ n thu ậ n l ợ i và cho em nh ữ ng l ờ i khuyên quý báu nh ằ m gi úp chúng em hoàn thành t ố t đ ề tài th ự c t ậ p t ố t nghi ệ p này Xin g ử i l ờ i c ả m ơn chân thành đ ế n th ầ y cô giáo trong Trư ờ ng Đ ạ i h ọ c N am C ầ n Thơ nói chung và các th ầ y cô trong B ộ môn Công ngh ệ thông tin nói riêng đã nhi ệ t tình gi ả ng d ạ y, truy ề n đ ạ t nh ữ ng ki ế n th ứ c uyên thâm và t ạ o cho em nhi ề u đi ề u ki ệ n đ ể giúp đ ỡ trong su ố t quá trình theo h ọ c t ạ i trư ờ ng nh ữ ng năm h ọ c qua, giúp em có đ ư ợ c nh ữ ng cơ s ở lý thuy ế t v ữ ng vàng đ ể có th ể th ự c hi ệ n đ ề tài ngày hôm nay L ờ i cu ố i, em xin chân thành tha thi ế t g ử i l ờ i c ả m ơn đ ế n b ạ n bè và gia đình, đã luôn quan tâm, t ạ o đi ề u ki ệ n khi em c ầ n, giúp đ ỡ , ủ ng h ộ và đ ộ ng viên em trong quá trình h ọ c t ậ p và h oàn thành đ ồ án th ự c t ậ p t ố t nghi ệ p Xin chân t hành c ả m ơn! C ầ n Thơ, ngày … tháng … năm 2021 Sinh viên th ự c hi ệ n ii L Ờ I CAM ĐOAN Tôi xin cam k ế t r ằ ng đây là m ộ t s ả n ph ẩ m hoàn toàn do quá trình h ọ c t ậ p và v ậ n d ụ ng ki ế n th ứ c đã đư ợ c h ọ c t ạ i Trư ờ ng Đ ạ i h ọ c Nam C ầ n Thơ đ ể hoàn thành s ả n ph ẩ m c ủ a riêng c ủ a mình trong khuôn kh ổ c ủ a đ ề tài V ề hình th ứ c, nh ữ ng k ế t lu ậ n đư ợ c trình bày trong đ ồ án th ự c t ậ p này là hoàn toàn trung th ự c C ầ n Thơ, ngày … tháng … năm 2021 Sinh viên th ự c hi ệ n iii NH Ậ N XÉT C Ủ A GIÁO VIÊN HƯ Ớ NG D Ẫ N ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· ································ ································ ································ ··· C ầ n Thơ, Ngày… tháng… năm 2021 Giáo viên hư ớ ng d ẫ n (Ký tên) T S Ngô H ồ Anh Khôi iv NH Ậ N XÉT C Ủ A GIÁO VIÊN PH Ả N BI Ệ N ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· ································ ································ ································ ····· C ầ n Thơ, Ngày… t háng … năm 202 1 Giáo viên ph ả n bi ệ n (Ký tên) ThS Hu ỳ nh Bá l ộ c v M Ụ C L Ụ C L Ờ I C Ả M ƠN i L Ờ I CAM ĐOAN ii NH Ậ N XÉT C Ủ A GIÁO VIÊN HƯ Ớ NG D Ẫ N iii NH Ậ N XÉT C Ủ A GIÁO VIÊN PH Ả N BI Ệ N iv M Ụ C L Ụ C v DANH M Ụ C B Ả NG ix D ANH M Ụ C HÌNH x DANH M Ụ C T Ừ VI Ế T T Ắ T xi TÓM T Ắ T xii CHƯƠNG 1 GI Ớ I THI Ệ U 1 1 1 T ổ ng quan v ề cơ quan th ự c t ậ p 1 1 1 1 Thông tin v ề công ty 1 1 1 2 Tr ụ s ở chính 1 1 1 3 Ngư ờ i đ ạ i di ệ n theo pháp lu ậ t: 1 1 1 4 Thông tin li ệ n h ệ 1 1 1 5 Ngành ngh ề kinh doanh 2 1 1 6 S ả n ph ẩ m và d ị ch v ụ đang kinh doanh 3 1 2 Gi ớ i thi ệ u c hung 8 1 2 1 Đ ặ t v ấ n đ ề nghiên c ứ u 8 1 2 2 M ụ c tiêu nghiên c ứ u 8 1 2 3 Ph ạ m vi nghiên c ứ u 8 1 2 4 Ph ạ m vi đ ề tài 9 1 2 5 Hư ớ ng g ả i quy ế t 9 1 2 6 B ố c ụ c 10 CHƯƠNG 2 CƠ S Ở LÝ LU Ậ N VÀ PHƯƠNG PHÁP NGHIÊN C Ứ U 11 2 1 Các cơ s ở nghiên c ứ u 11 2 1 1 Trí tu ệ nhân t ạ o 11 vi 2 1 2 X ử lý ngôn ng ữ t ự nhiên 24 2 2 Phương pháp nghiên c ứ u 27 2 2 1 Phương pháp nghiên c ứ u lý thuy ế t 27 2 2 2 P hương pháp nghiên c ứ u th ự c nghi ệ m 27 2 2 3 Phương pháp đi ề u tra 28 2 3 Gi ớ i thi ệ u v ề gi ả i Conditional Random Field 28 2 3 1 Gi ớ i thi ệ u chung 28 2 3 2 Mô t ả 28 2 3 3 Bi ế n th ể 29 2 4 Gi ớ i thi ệ u v ề ngôn ng ữ Python 29 CHƯƠNG 3 GI Ả I THU Ậ T CRF VÀ CÁC CHI Ế N LƯ Ợ C ÁP D Ụ NG 33 3 1 Trích xu ấ t tính năng văn b ả n và tài li ệ u 33 3 1 1 Mã hóa 33 3 1 2 Ngưng t ừ 33 3 1 3 Vi ế t hoa 33 3 1 4 Ti ế ng lóng và t ừ vi ế t t ắ c 34 3 1 5 Lo ạ i b ỏ ti ế ng ồ n 34 3 1 6 S ử a chính t ả 34 3 1 7 G ố c 34 3 1 8 B ổ sung 34 3 1 9 Word2Vec 35 3 1 10 Vectơ toàn c ầ u cho bi ể u di ễ n t ừ (GloVe) 35 3 1 11 Trìn h bày t ừ ng ữ theo ng ữ c ả nh 35 3 1 12 FastText 37 3 1 13 T ầ n su ấ t k ỳ h ạ n 37 3 1 14 T ầ n su ấ t tài li ệ u ngh ị ch đ ả o thu ậ t ng ữ 37 3 2 Gi ả m kích thư ớ c 38 3 3 K ỹ thu ậ t phân lo ạ i văn b ả n 38 vii 3 3 1 Thúc đ ẩ y 39 3 3 2 Đóng bao 39 3 3 3 M ạ ng th ầ n kinh sâu 41 3 3 4 M ạ ng th ầ n kin h tái di ễ n (RNN) 41 3 3 5 M ạ ng th ầ n kinh h ợ p pháp (CNN) 42 3 3 6 M ạ ng th ầ n kinh chuy ể n đ ổ i l ặ p l ạ i (RCNN) 42 3 3 7 H ọ c sâu đa mô hình ng ẫ u nhiên (RMDL) 42 3 3 8 H ọ c sâu phân c ấ p cho văn b ả n (HDLTex) 43 3 4 Đánh giá 43 3 5 Văn b ả n và b ộ d ữ li ệ u tài li ệ u 44 3 6 Ứ ng d ụ ng phân lo ạ i văn b ả n 45 3 7 H ỗ tr ợ phân lo ạ i văn b ả n 46 CHƯƠNG 4 MÔ HÌNH H Ệ TH Ố NG 48 4 1 T ổ ng quan 48 4 1 1 Khái quát 48 4 1 2 Sơ lư ợ c l ị ch s ử phát tri ể n 48 4 1 3 Ki ế n trúc chung c ủ a h ệ th ố ng h ỏ i đáp 48 4 1 4 M ộ t s ố v ấ n đ ề quan tâm khi thi ế t k ế h ệ th ố ng h ỏ i đáp 50 4 1 5 Các yêu c ầ u c ủ a h ệ th ố ng h ỏ i đáp 50 4 2 Ti ề n x ử lý và phân lo ạ i câu h ỏ i 50 4 2 1 Ti ề n x ử lý d ữ li ệ u 50 4 2 2 Phân lo ạ i câu h ỏ i 52 4 3 Xây d ự ng mô hình h ệ th ố ng 55 4 3 1 L ự a ch ọ n mô hình và thu ậ t toán 55 4 3 2 Mô hình ki ế n trúc h ệ th ố ng 56 4 3 3 Cài đ ặ t 58 CHƯƠNG 5 K Ế T QU Ả NGHIÊN C Ứ U 59 5 1 H ệ th ố ng 59 viii 5 1 1 Thao tác v ớ i b ộ d ữ li ệ u chuyên ngành ph ậ t h ọ c 59 5 1 2 Giao di ệ n h ệ th ố ng chương trình 60 5 2 Hư ớ ng d ẫ n cài đ ặ t 62 5 3 Hư ớ ng d ẫ n s ử d ụ ng 63 5 3 1 Thêm d ữ li ệ u 63 5 3 2 Th ự c thi chương trình 64 CHƯƠNG 6 K Ế T LU Ậ N 67 TÀI LI Ệ U THAM KH Ả O 68 ix D ANH M Ụ C B Ả NG B ả ng 1 1 B ả ng ngành ngh ề kinh doanh 2 B ả ng 1 2 B ả ng s ả n ph ẩ m ph ầ n m ề m 3 B ả ng 1 3 B ả ng d ị ch v ụ 7 x D ANH M Ụ C H ÌNH Hình 3 1 Trí tu ệ nhân t ạ o 11 Hình 3 2 Cách th ứ c ho ạ t đ ộ ng c ủ a Chatbots 15 Hình 3 3 Tương tác gi ữ a ngư ờ i dùng v ớ i ELIZA 16 Hình 4 1 H ệ th ố ng tìm ki ế m thông tin IR 48 Hình 4 2 Ki ế n trúc chung h ệ th ố ng h ỏ i đáp 49 Hình 4 3 Mô hình ho ạ t đ ộ ng h ệ th ố ng 56 Hình 4 4 Giai đo ạ n phân tích câu h ỏ i 56 Hình 4 5 Ti ế n trình phân l ớ p 57 H ình 4 6 Ti ế n trình tìm ki ế m câu h ỏ i 57 Hình 4 7 Ti ế n trình tìm ki ế m câu tr ả l ờ i 57 Hình 4 8 Ti ế n trình tìm ki ế m câu h ỏ i đ ế n chuyên g ia 57 Hình 5 1 Giao di ệ n chính c ủ a chương trình dà nh cho ngư ờ i dùng 60 Hình 5 2 Giao di ệ n chính dành cho qu ả n tr ị viên 60 Hình 5 3 Menu thêm d ữ li ệ u 61 Hì nh 5 4 Giao di ệ n ch ọ n t ệ p d ữ li ệ u c ầ n thêm vào h ệ th ố ng 61 Hình 5 5 Giao di ệ n ch ọ n thư m ụ c ch ứ a các t ệ p d ữ li ệ u c ầ n thêm vào h ệ th ố ng 62 Hình 5 6 T ệ p TraLoiTuDongPhatHoc exe 62 Hình 5 7 C ử a s ổ m ớ i cài đ ặ t 62 Hình 5 8 Bi ể u tư ợ ng ch ạ y chương trình ở Desktop 63 Hình 5 9 T ệ p ch ạ y chương trình trong thư m ụ c đã cài đ ặ t 63 Hình 5 10 Menu “Thêm d ữ li ệ u” 63 Hình 5 11 Giao di ệ n ch ọ n đư ờ ng d ẫ n c ủ a t ệ p d ữ li ệ u c ầ n thêm vào 64 Hình 5 12 Giao di ệ n chính c ủ a form ngư ờ i dùng 65 Hình 5 13 Giao di ệ n sau khi th ự c thi 65 Hình 5 1 4 Giao di ệ n c ủ a nhân viên khi ngư ờ i dùng g ử i yêu c ầ u 66 Hình 5 15 Giao di ệ n ngư ờ i dùng sao khi nhân viên ph ả n h ồ i 66 xi DANH M Ụ C T Ừ VI Ế T T Ắ T TNHH Trách nhi ệ m h ữ u h ạ n CSDL Cơ s ở d ữ li ệ u NLP Natural Language Processing HOG Histogram o f Oriented Gradients OCR Optical Character Recognition

Trang 1

TRƯỜNG ĐẠI HỌC NAM CẦN THƠ KHOA KỸ THUẬT – CÔNG NGHỆ



NGUYỄN HOÀNG ĐẠT

176899

NGHIÊN CỨU XÂY DỰNG HỆ THỐNG TRẢ LỜI TỰ ĐỘNG CHUYÊN NGÀNH PHẬT HỌC

ĐỒ ÁN THỰC TẬP Ngành Công nghệ Thông tin

Mã số Ngành: 7480201

Cần Thơ, tháng 05 năm 2021

Trang 2

TRƯỜNG ĐẠI HỌC NAM CẦN THƠ

NGUYỄN HOÀNG ĐẠT MSSV: 176899

NGHIÊN CỨU XÂY DỰNG HỆ THỐNG TRẢ LỜI TỰ ĐỘNG CHUYÊN NGÀNH PHẬT HỌC

ĐỒ ÁN THỰC TẬP Ngành Công Nghệ Thông Tin

Mã số Ngành: 7480201

GIẢNG VIÊN HƯỚNG DẪN

TS NGÔ HỒ ANH KHÔI

Cần Thơ, tháng 05 năm 2021

Trang 3

CHẤP THUẬN CỦA HỘI ĐỒNG

Đồ án thực tập “Nghiên cứu xây dựng hệ thống trả lời tự động chuyên ngành phật học”, do sinh viên Nguyễn Hoàng Đạt dưới sự hướng dẫn của TS Ngô Hồ Anh Khôi Đồ án đã được báo cáo và Hội đồng chấm khóa luận thông qua ngày… tháng… năm 2021

Ủy viên Thư ký

- -

GHI CHỨC DANH, HỌ, TÊN GHI CHỨC DANH, HỌ, TÊN

Phản biện 1 Phản biện 2

-GHI CHỨC DANH, HỌ, TÊN GHI CHỨC DANH, HỌ, TÊN

Cán bộ hướng dẫn Chủ tịch hội đồng

- -

GHI CHỨC DANH, HỌ, TÊN GHI CHỨC DANH, HỌ, TÊN

Trang 4

i

LỜI CẢM ƠN

Tôi xin chân thành gửi lời cảm ơn đến TS Ngô Hồ Anh Khôi - Giảng viên Trường Đại học Nam Cần Thơ đã nhiệt tình hướng dẫn trong suốt thời gian làm đề tài thực tập tốt nghiệp Thầy là người đã tạo ra rất nhiều điều kiện thuận lợi và cho

em những lời khuyên quý báu nhằm giúp chúng em hoàn thành tốt đề tài thực tập tốt nghiệp này

Xin gửi lời cảm ơn chân thành đến thầy cô giáo trong Trường Đại học Nam Cần Thơ nói chung và các thầy cô trong Bộ môn Công nghệ thông tin nói riêng đã nhiệt tình giảng dạy, truyền đạt những kiến thức uyên thâm và tạo cho em nhiều điều kiện để giúp đỡ trong suốt quá trình theo học tại trường những năm học qua, giúp em

có được những cơ sở lý thuyết vững vàng để có thể thực hiện đề tài ngày hôm nay

Lời cuối, em xin chân thành tha thiết gửi lời cảm ơn đến bạn bè và gia đình,

đã luôn quan tâm, tạo điều kiện khi em cần, giúp đỡ, ủng hộ và động viên em trong quá trình học tập và hoàn thành đồ án thực tập tốt nghiệp

Xin chân thành cảm ơn! Cần Thơ, ngày … tháng … năm 2021

Sinh viên thực hiện

Trang 5

ii

LỜI CAM ĐOAN

Tôi xin cam kết rằng đây là một sản phẩm hoàn toàn do quá trình học tập và vận dụng kiến thức đã được học tại Trường Đại học Nam Cần Thơ để hoàn thành sản phẩm của riêng của mình trong khuôn khổ của đề tài Về hình thức, những kết luận được trình bày trong đồ án thực tập này là hoàn toàn trung thực

Cần Thơ, ngày … tháng … năm 2021

Sinh viên thực hiện

Trang 6

iii

NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN

···

···

···

···

···

···

···

···

···

···

···

···

···

···

···

···

···

···

Cần Thơ, Ngày… tháng… năm 2021

Giáo viên hướng dẫn

(Ký tên)

TS Ngô Hồ Anh Khôi

Trang 7

iv

NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN

···

···

···

···

···

···

···

···

···

···

···

···

···

···

···

···

···

···

Cần Thơ, Ngày….tháng… năm 2021

Giáo viên phản biện

(Ký tên)

ThS Huỳnh Bá lộc

Trang 8

v

MỤC LỤC

LỜI CẢM ƠN i

LỜI CAM ĐOAN ii

NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN iii

NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN iv

MỤC LỤC v

DANH MỤC BẢNG ix

DANH MỤC HÌNH x

DANH MỤC TỪ VIẾT TẮT xi

TÓM TẮT xii

CHƯƠNG 1 GIỚI THIỆU 1

1.1 Tổng quan về cơ quan thực tập 1

1.1.1 Thông tin về công ty 1

1.1.2 Trụ sở chính 1

1.1.3 Người đại diện theo pháp luật: 1

1.1.4 Thông tin liện hệ 1

1.1.5 Ngành nghề kinh doanh 2

1.1.6 Sản phẩm và dịch vụ đang kinh doanh 3

1.2 Giới thiệu chung 8

1.2.1 Đặt vấn đề nghiên cứu 8

1.2.2 Mục tiêu nghiên cứu 8

1.2.3 Phạm vi nghiên cứu 8

1.2.4 Phạm vi đề tài 9

1.2.5 Hướng gải quyết 9

1.2.6 Bố cục 10

CHƯƠNG 2 CƠ SỞ LÝ LUẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU 11

2.1 Các cơ sở nghiên cứu 11

2.1.1 Trí tuệ nhân tạo 11

Trang 9

vi

2.1.2 Xử lý ngôn ngữ tự nhiên 24

2.2 Phương pháp nghiên cứu 27

2.2.1 Phương pháp nghiên cứu lý thuyết 27

2.2.2 Phương pháp nghiên cứu thực nghiệm 27

2.2.3 Phương pháp điều tra 28

2.3 Giới thiệu về giải Conditional Random Field 28

2.3.1 Giới thiệu chung 28

2.3.2 Mô tả 28

2.3.3 Biến thể 29

2.4 Giới thiệu về ngôn ngữ Python 29

CHƯƠNG 3 GIẢI THUẬT CRF VÀ CÁC CHIẾN LƯỢC ÁP DỤNG 33

3.1 Trích xuất tính năng văn bản và tài liệu 33

3.1.1 Mã hóa 33

3.1.2 Ngưng từ 33

3.1.3 Viết hoa 33

3.1.4 Tiếng lóng và từ viết tắc 34

3.1.5 Loại bỏ tiếng ồn 34

3.1.6 Sửa chính tả 34

3.1.7 Gốc 34

3.1.8 Bổ sung 34

3.1.9 Word2Vec 35

3.1.10 Vectơ toàn cầu cho biểu diễn từ (GloVe) 35

3.1.11 Trình bày từ ngữ theo ngữ cảnh 35

3.1.12 FastText 37

3.1.13 Tần suất kỳ hạn 37

3.1.14 Tần suất tài liệu nghịch đảo thuật ngữ 37

3.2 Giảm kích thước 38

3.3 Kỹ thuật phân loại văn bản 38

Trang 10

vii

3.3.1 Thúc đẩy 39

3.3.2 Đóng bao 39

3.3.3 Mạng thần kinh sâu 41

3.3.4 Mạng thần kinh tái diễn (RNN) 41

3.3.5 Mạng thần kinh hợp pháp (CNN) 42

3.3.6 Mạng thần kinh chuyển đổi lặp lại (RCNN) 42

3.3.7 Học sâu đa mô hình ngẫu nhiên (RMDL) 42

3.3.8 Học sâu phân cấp cho văn bản (HDLTex) 43

3.4 Đánh giá 43

3.5 Văn bản và bộ dữ liệu tài liệu 44

3.6 Ứng dụng phân loại văn bản 45

3.7 Hỗ trợ phân loại văn bản 46

CHƯƠNG 4 MÔ HÌNH HỆ THỐNG 48

4.1 Tổng quan 48

4.1.1 Khái quát 48

4.1.2 Sơ lược lịch sử phát triển 48

4.1.3 Kiến trúc chung của hệ thống hỏi đáp 48

4.1.4 Một số vấn đề quan tâm khi thiết kế hệ thống hỏi đáp 50

4.1.5 Các yêu cầu của hệ thống hỏi đáp 50

4.2 Tiền xử lý và phân loại câu hỏi 50

4.2.1 Tiền xử lý dữ liệu 50

4.2.2 Phân loại câu hỏi 52

4.3 Xây dựng mô hình hệ thống 55

4.3.1 Lựa chọn mô hình và thuật toán 55

4.3.2 Mô hình kiến trúc hệ thống 56

4.3.3 Cài đặt 58

CHƯƠNG 5 KẾT QUẢ NGHIÊN CỨU 59

5.1 Hệ thống 59

Trang 11

viii

5.1.1 Thao tác với bộ dữ liệu chuyên ngành phật học 59

5.1.2 Giao diện hệ thống chương trình 60

5.2 Hướng dẫn cài đặt 62

5.3 Hướng dẫn sử dụng 63

5.3.1 Thêm dữ liệu 63

5.3.2 Thực thi chương trình 64

CHƯƠNG 6 KẾT LUẬN 67

TÀI LIỆU THAM KHẢO 68

Trang 12

ix

DANH MỤC BẢNG

Bảng 1.1 Bảng ngành nghề kinh doanh 2 Bảng 1.2 Bảng sản phẩm phần mềm 3 Bảng 1.3 Bảng dịch vụ 7

Trang 13

x

DANH MỤC HÌNH

Hình 3.1 Trí tuệ nhân tạo 11

Hình 3.2 Cách thức hoạt động của Chatbots 15

Hình 3.3 Tương tác giữa người dùng với ELIZA 16

Hình 4.1 Hệ thống tìm kiếm thông tin IR 48

Hình 4.2 Kiến trúc chung hệ thống hỏi đáp 49

Hình 4.3 Mô hình hoạt động hệ thống 56

Hình 4.4 Giai đoạn phân tích câu hỏi 56

Hình 4.5 Tiến trình phân lớp 57

Hình 4.6 Tiến trình tìm kiếm câu hỏi 57

Hình 4.7 Tiến trình tìm kiếm câu trả lời 57

Hình 4.8 Tiến trình tìm kiếm câu hỏi đến chuyên gia 57

Hình 5.1 Giao diện chính của chương trình dành cho người dùng 60

Hình 5.2 Giao diện chính dành cho quản trị viên 60

Hình 5.3 Menu thêm dữ liệu 61

Hình 5.4 Giao diện chọn tệp dữ liệu cần thêm vào hệ thống 61

Hình 5.5 Giao diện chọn thư mục chứa các tệp dữ liệu cần thêm vào hệ thống62 Hình 5.6 Tệp TraLoiTuDongPhatHoc.exe 62

Hình 5.7 Cửa sổ mới cài đặt 62

Hình 5.8 Biểu tượng chạy chương trình ở Desktop 63

Hình 5.9 Tệp chạy chương trình trong thư mục đã cài đặt 63

Hình 5.10 Menu “Thêm dữ liệu” 63

Hình 5.11 Giao diện chọn đường dẫn của tệp dữ liệu cần thêm vào 64

Hình 5.12 Giao diện chính của form người dùng 65

Hình 5.13 Giao diện sau khi thực thi 65

Hình 5.14 Giao diện của nhân viên khi người dùng gửi yêu cầu 66

Hình 5.15 Giao diện người dùng sao khi nhân viên phản hồi 66

Trang 14

xi

DANH MỤC TỪ VIẾT TẮT

Ngày đăng: 26/02/2024, 04:05

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w