Chƣơng 4 THỰC NGHIỆM, ĐÁNH GIÁ
4.3. Hƣớng cải tiến và nghiên cứu tiếp
Như đã được trình bày ở chương 4, nghiên cứu của chúng tôi do chỉ thực hiện trong thời gian có giới hạn, do đó còn nhiều kỹ thuật của Tiền xử lý chưa được áp dụng. Tiếp tục nghiên cứu về các kỹ thuật này và đưa vào áp dụng là cần thiết, nhằm nâng cao độ chính xác của bài toán nhận dạng.
Từ những kết quả đạt được từ thực nghiệm, chúng tôi nhận thấy còn một số vấn đề cần tiếp tục được nghiên cứu và cải tiến, nhằm giúp cho bài toán tiền xử lý được hoàn thiện như sau:
Thuật toán nhị phân hóa ảnh chỉ mới được thực nghiệm với ảnh chụp từ bản in nền trắng hoặc xám, với các thử nghiệm với các bản khắc ở các đình chùa, miếu mạo, kết quả nhị phân hóa không còn chính xác. Do đó với kỹ thuật nhị phân hóa, cần tiếp tục nghiên cứu để xây dựng thuật toán nhị phân cho các ngữ cảnh này.
Với thuật toán phát hiện và xử lý nghiêng, cũng như tách chữ, hiện đang bị ảnh hưởng bởi nhiễu từ các bước trước. Do đó bài toán xử lý nhiễu cần được nghiên cứu và tiếp tục xây dựng, nhằm tăng độ chính xác cho các bước xử lý tiếp theo.
Thuật toán tách chữ nhìn chung đã tách được chữ, tuy nhiên, chữ tách được chưa thực sự chuẩn, và với trường hợp các chữ nằm sát nhau, thuật toán chưa thực sự có kết quả tốt. Do đó cần tiếp tục nghiên cứu để cải tiến, nhằm tìm ra phương pháp có thể áp dụng cho trường hợp các chữ nằm sát nhau, hay cho môt số trường hợp các chữ không còn theo hàng, hay cột. Tách theo hàng trước, tiếp theo tách theo cột có thể là một ý tưởng cho trường hợp này.
Tổng kết chƣơng 4
Trong chương 4, chúng tôi đã trình bày chi tiết quá trình thực nghiệm cài đặt chương trình nhận dạng trên thiết bị di động sử dụng hệ điều hành Android. Sau khi tiến hành cài đặt, chúng tôi đã trình bày về các kết quả thu được, và đưa ra các nhận xét cho các kết quả tương ứng. Ở phần cuối chương dựa trên các kết quả thử nghiệm, và kiến thức nghiên cứu được, chúng tôi đưa ra các hướng nghiên cứu tiếp theo cho bài toán tiền xử lý chữ Nôm, nhằm nâng cao tính chính xác cho bài toán nhận dạng.
KẾT LUẬN
Luận văn đã tìm hiểu các kiến thức về chữ Nôm – một di sản văn hóa của dân tộc. Từ đó đi đến vấn đề tính cấp thiết của bài toán nhận dạng chữ Nôm. Luận văn cũng đã tìm hiểu, và trình bày về bài toán nhận dạng ký tự quang học nói chung, và bài toán nhận dạng chữ Nôm nói riêng.
Từ những kết quả nghiên cứu đã có của nhóm nghiên cứu chữ Nôm LES-Nôm, luận văn đã xây dựng hoàn chỉnh hệ thống nhận dạng trên thiết bị di động với mô hình client-server.
Để hoàn chỉnh bài toán nhận dạng trên thiết bị di động, tiền xử lý chữ Nôm trên thiết bị di động vẫn là bài toán chưa được thực hiện cụ thể trước đó. Do đó, luận văn đã thực hiện xây dựng được ứng dụng tiền xử lý trên thiết bị Android giúp đưa bài toán nhận dạng trên thiết bị di động, trở nên hoàn chỉnh.
Tuy nhiên, với thời gian nghiên cứu có giới hạn, nên kết quả nghiên cứu chỉ mới dừng lại ở một số kỹ thuật tiền xử lý cơ bản, mà chưa áp dụng tất cả các kỹ thuật có thể. Do đó kết quả vẫn còn một số bước cần được cải tiến như: xử lý nhiễu, nhị phân hóa ảnh cho trường hợp ảnh chụp từ bản khắc ở đình, chùa..
TÀI LIỆU THAM KHẢO
Tiếng việt
1. Trần Nguyên Hoàng (2013), Nhận dạng chữ Nôm bằng mạng nơ-ron, Luận văn Thạc sĩ, Đại học Công Nghệ, Đại học Quốc Gia Hà Nội
2. Phạm Văn Huởng, Trần Minh Tuấn, Nguyễn Thị Ngọc Hương, Bùi Thị Hồng Hạnh, Lê Hồng Trang, Vũ Thanh Nhân, Trương Anh Hoàng, Vũ Quang Dũng, Nguyễn Ngọc Bình (2008), ―Một số phương pháp nhận dạng chữ Nôm‖, Hội thảo Khoa học Quốc gia Lần thứ IV về CNTT-TT (ICT.rda‟2008), Hà Nội.
3. Đoàn Ánh Loan, (2009), “Báo cáo đề dẫn - Hội thảo nghiên cứu Hán Nôm và vấn đề văn hóa dân tộc”
4. Hoàng Thư Ngân (2011), Hai bước ngoặt trong lịch sữ văn hóa Việt, Chuyên đề, Đại học văn hóa Hà Nội
5. Trần Nghi Phú (2013), Luận văn Thạc Sĩ, Đại học Công Nghệ, Đại học Quốc Gia Hà Nội
6. Nguyễn Triệu Tuấn (2013), Trích chọn đặc trưng trong nhận dạng chữ Nôm, Luận văn thạc sĩ, Đại học Công nghệ - Đại học quốc gia Hà Nội, Hà Nội
Tiếng Anh
7. d'Albe, E. E. F. (1 July 1914). "On a Type-Reading Optophone". Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences 90 (619): 373–375. doi:10.1098/rspa.1914.0061
8. Yasser Alginahi (2010), Taibah University, Kingdom of Saudi Arabia, Preprocessing Techniques in Character Recognition
9. Andrew Greensted (2010), Otsu Thresholding – The Lab Book Pages (an online collection of electronic information)
10. Hamid Reza Boveiri, Shushtar Branch (2010), On Pattern Classification Using Statistical Moments, Faculty Member, Sama College, Islamic Azad University
11. Wojciech Bieniecki, Szymon Grabowski and Wojciech Rozenberg (2007), Image Preprocessing for Improving OCR Accuracy
12. Sahoo, P.; Soltani, S. & Wong, A. (1988). A Survey of Thresholding Techniques, Computer Vision Graphics Image Processing, Vol. 41, pp. 233-260.
13. Pritpal Singh, Sumit Budhiraja, (IJERA) ISSN: 2248-9622 Vol. 1, Issue 4, pp. 1736-1739, Feature Extraction and Classification Techniques in O.C.R. Systems for Handwritten Gurmukhi Script – A Survey
14. Schantz, Herbert F. (1982). The history of OCR, optical character recognition. [Manchester Center, Vt.]: Recognition Technologies Users Association. ISBN 9780943072012
15. Pham Ngoc Thanh (2012), Techniques for Nom Character Processing and Recognition in Android Environment, Bachelor Thesis, Vietnam national University, Hanoi University, University of Engineering and Technology.