Trực quan hóa kết quả test trên 4 tập dữ liệu

Một phần của tài liệu LUẬN văn THẠC sĩ ôn THIỆN tài NHẬN DẠNG CHỮ BA NA TRÊN văn bản HÌNH ẢNH (Trang 64 - 70)

0 20 40 60 80 100 120 140 160 SỐ TỪ ĐÚNG ĐỘ CHÍNH XÁC SỐ TỪ ĐÚNG ĐỘ CHÍNH XÁC Số lượng

kí tự OCR THÔ HEURISTIC

KẾT QUẢ SO SÁNH OCR THÔ VÀ HEURISTIC

Bảng chữ cái tiếng BaNa chữ in hoa (size 14 ) Bảng chữ cái tiếng BaNa (size 12)

Bảng chữ cái tiếng BaNa (size 14) Bảng chữ cái tiếng BaNa (size 16)

84.31% 84.71% 49.76% 65.54% 15.69% 15.29% 50.24% 34.46% 0.00% 10.00% 20.00% 30.00% 40.00% 50.00% 60.00% 70.00% 80.00% 90.00%

FILE SỬ THI BANA FILE TỪ ĐIỂN Kriem

BANA

FILE SCAN BANA FILE PHONG TỤC BANA

KẾT QUẢ TEST TRÊN 4 TẬP DỮ LIỆU

65

Từ hình 4.8 biểu đồ trục quan hóa kết quả test trên bốn tập dữ liệu. Tơi nhận thấy tập dữ liệu sử thi BaNa và tập dữ liệu từ điển Kriem BaNa đạt đƣợc độ chính xác trên 84%, còn hai tập dữ liệu còn lại là: dữ liệu Phong tục BaNa và dữ liệu Scan BaNa lần lƣợt đạt độ chính xác là: trên 65% và gần 50%.

4.6. Một số hạn chế của mô hình

 Kết quả đạt đƣợc còn phụ thuộc vào dữ liệu hình ảnh thu thập có chất lƣợng chƣa đƣợc tốt.

 Kết quả đạt đƣợc còn phụ thuộc vào dữ liệu hình ảnh thu thập có chất lƣợng chƣa đƣợc tốt.

 Size chữ quá nhỏ hay quá to cũng sẽ làm ảnh hƣởng đến kết quả đầu ra

 Để nhận diện bảng chữ cái Bana đƣợc tốt cịn phụ thuộc vào mơ hình LSTM trong OCR

 Kết quả nhận diện bảng chữ cái Bana in hoa chỉ đạt 68% là do kết quả đánh giá WER

TÓM TẮT C ƢƠNG 4

Với chƣơng 3, sau khi thực hiện mơ hình đề tài, thì chƣơng 4 này, tơi sẽ bắt đầu tiến hành thực nghiệm và đánh giá đề tài thông qua các bƣớc:

- Thực hiện xử lý hình ảnh

- Thực hiện OCR

- Nhận dạng đặc điểm các lỗi ký tự lặp đi lặp lại - Thực nghiệm sửa lỗi ký tự

- Đánh giá kết quả đạt đƣợc - Một số hạn chế của mơ hình

66

C ƢƠNG 5: ẾT LUẬN VÀ KIẾN NGHỊ 5.1. Kết luận

Trong nghiên cứu đề tài này, tôi đã hiện thực đƣợc việc xây dựng một mơ hình nhận dạng văn bản hình ảnh tiếng Ba Na thơng qua việc áp dụng kĩ thuật Học Sâu (Deep Learning) kết hợp với thuật toán sửa những lỗi lặp đi lặp lại theo hƣớng logic. Dựa trên ý tƣởng từ mơ hình này, tơi áp dụng thêm nhiều phƣơng pháp bổ trợ với sự sáng tạo cá nhân nhằm mang tính phù hợp và đạt hiệu quả tốt nhất cho việc nhận dạng và sửa lỗi chính tả trên cuốn từ điển tiếng Bơhnar Kriêm do Sở Khoa học và Cơng nghệ (Ủy ban nhân dân tỉnh Bình Định) và Viện Ngôn ngữ học (Viện Khoa học xã hội Ba Na Nam) hợp tác thực hiện, sổ tay phƣơng ngữ Tiếng Ba Na do Sở Giáo Dục và Đào Tạo Gia Lai biên soạn Y JIL-H’MER – ĐINH VĂN HẢI – ĐINH VĂN KHOA. Việc thực nghiệm sửa lỗi trên chính cuốn từ điển này mang tính ứng dụng cao khi góp phần lƣu giữ và bảo tồn văn bản số cho từ ngữ tiếng Ba Na cũng nhƣ góp phần làm nên một nghiên cứu hiện đại vào chính ngơn ngữ dân tộc thiểu số quốc gia. Thơng q đó giúp tơi thêm tự hào và hiểu sâu sắc hơn về sự phong phú của tiếng Ba Na. Tuy chƣa đem lại hiệu suất tốt nhất trong thời gian thực hiện đề tài lần này, nhƣng với những kết quả hiện có thì hƣớng tiếp cận này mang tính khả thi trong việc phát triển khả năng sửa lỗi nhằm giúp bảo tồn văn hóa dân tộc nƣớc nhà.

5.2. ƣớng mở rộng đề tài

Ngoài những cơng việc đã đƣợc hiện thực trong mơ hình đề xuất, tôi tin rằng những hƣớng mở rộng sau sẽ đem lại những kết quả đầy hứa hẹn cho các nghiên cứu trong tƣơng lai:

Mơ hình sửa lỗi này có thể kết hợp thêm với mơ hình ngơn ngữ và sửa lỗi tiếng Ba Na tự động để tạo ra nhiều trƣờng hợp ứng viên nhằm tối ƣu việc sửa lỗi chính tả cho tiếng Ba Na.

67

Mở rộng về tính ứng dụng thì sau khi sửa đƣợc bộ từ điển này, có thể lấy làm dữ liệu huấn luyện để sửa cho những bộ từ điển khác vì có tính tƣơng đồng trong mặt ngữ nghĩa câu cú.

TÓM TẮT C ƢƠNG 5

Sau khi, thực nghiệm và đánh giá ở chƣơng 4. Ở chƣơng 5, tôi xin kết luận đề tài và kiến nghị hƣớng phát triển mở rộng đề tài.

68

DANH MỤC TÀI LIỆU THAM KHẢO

[1]. KHADIJA EL GAJOUI, FADOUA ATAA ALLAH, MOHAMMED

OUMSIS. “Training TESSERACT Tool for Amazigh OCR”. Internet:

https://www.researchgate.net/publication/277142272_Training_TESSERACT_Tool _for_Amazigh_OCR

[2]. T. Pham, X. Pham and P. Le-Hong. (2017) “On the use of machine

translation-based approaches for vietnamese diacritic restoration,” 2017

International Conference on Asian Language Processing (IALP),

Singapore, pp. 272-275.

[3]. C. Olah. (2015) “Understanding lstm networks,” [Online].

Available: http://colah. github.io/posts/2015-08-Understanding-LSTMs/.

[4]. Wikipedia, “Ngƣời Ba Na”

Internet: https://vi.wikipedia.org/wiki/Ng%C6%B0%E1%BB%9Di_Ba_Na.

[5]. TRẦN LÊ TÚY PHƢỢNG, “Dân ca dân nhạc VN – Dân ca

Bahnar/Ba Na”.

Internet: https://cvdvn.net/2015/07/27/dan-ca-dan-nhac-vn-dan-ca-bahnarba-na/

[6]. Wikipedia, “Optical character recognition.”

Internet: https://en.wikipedia.org/wiki/Optical_character_recognition, Oct. 18, 2020. [7]. F. Zelic, A. Sable. “A comprehensive guide to OCR with Tesseract, OpenCV and Python.”

69

[8]. Joseph Howse. “OpenCV Computer Vision with Python”

Internet: https://fr.scribd.com/book/253052074/OpenCV-Computer-Vision-with-

Python

[9]. D E N N Y B R I T Z . “ Recurrent Neural Networks Tutorial, Part 1 – Introduction to RNNs”

Internet:

https://wwwwildmlcom.translate.goog/2015/09/recurrentneuralnetworkstutorialpart1 introductiotornns/?_x_tr_sch=http&_x_tr_sl=en&_x_tr_tl=vi&_x_tr_hl=vi&_x_tr_p to=nui,op,sc

[10]. C. Olah. “Understanding lstm networks.”

Internet: http://colah.github.io/posts/2015-08-Understanding-LSTMs/, 2020.

[11]. Afshine Amidi và Shervine Amidi Dịch bởi Phạm Hồng Vinh và Đàm

Minh Tiến “Mạng neural tích chập cheatsheet”. Internet:

https://stanford.edu/~shervine/l/vi/teaching/cs230/cheatsheetconvolutionalneural- networks

[12]. Quoc Pham. “Tìm Hiểu Convolutional Neural Networks Cho Phân

Loại Ảnh”

Internet: https://pbcquoc.github.io/cnn/

[13]. Võ Huỳnh Trâm và Trần Ngân Bình, “CHƢƠNG 4: TÌM KIẾM

HEURISTIC” Internet:

https://www.academia.edu/10292262/Ch%C6%B0%C6%A1ng_4_T%C3%ACm_ki %E1%BA%BFm_Heuristic

70

[14]. Wikipedia. “Levenshtein distance.”

Internet: https://en.wikipedia.org/wiki/Levenshtein_distance, Dec. 20, 2020.

[15]. Aditi Mithal – “Optical Character Recognition Tool” - April 18th, 2017

[16]. Chirag Patel, Atul Patel, Dharmendra Patel – “Optical Character

Một phần của tài liệu LUẬN văn THẠC sĩ ôn THIỆN tài NHẬN DẠNG CHỮ BA NA TRÊN văn bản HÌNH ẢNH (Trang 64 - 70)

Tải bản đầy đủ (PDF)

(70 trang)