1. Trang chủ
  2. » Luận Văn - Báo Cáo

Các phương pháp tiền xử lý trong nhận dạng chữ Nôm trên thiết bị di động

57 986 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 57
Dung lượng 3,03 MB

Nội dung

Tôi xin cam đoan luận văn thạc sĩ “Các phương pháp tiền xử lý trong nhận dạng chữ Nôm trên thiết bị di động” là công trình nghiên cứu của riêng tôi cùng với sự hướng dẫn của TS.. Động

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Hà Nội – 2014

Trang 2

LỜI CAM ĐOAN

Tôi là Nguyễn Văn Bách, học viên cao học K18, chuyên ngành Kỹ thuật phần

mềm, khoá 2011-2013 Tôi xin cam đoan luận văn thạc sĩ “Các phương pháp tiền xử

lý trong nhận dạng chữ Nôm trên thiết bị di động” là công trình nghiên cứu của riêng

tôi cùng với sự hướng dẫn của TS Lê Quang Minh và PGS.TS Nguyễn Ngọc Bình Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác

Tất cả những tham khảo từ các nghiên cứu liên quan đều được nêu nguồn gốc một cách rõ ràng từ danh mục tài liệu tham khảo của luận văn Trong luận văn, không

có việc sao chép tài liệu, công trình nghiên cứu của người khác mà không chỉ rõ về tài liệu tham khảo

Tác giả

Nguyễn Văn Bách

Trang 3

LỜI CẢM ƠN

Lời đầu tiên, em xin chân thành cám ơn các thầy cô giáo, các cán bộ của Trường Đại học Công Nghệ - Đại học Quốc Gia Hà Nội đã ân cần dạy dỗ, chỉ bảo và định hướng cho em trong suốt 3 năm học vừa qua, truyền đạt cho chúng em những kiến thức quý báu góp phần quan trọng để xây dựng và định hướng cho con đường sự nghiệp của mình

Em xin chân thành cám ơn PGS TS Nguyễn Ngọc Bình, thầy đã giải thích và truyền cảm hứng cho chúng em, giúp chúng em hiểu được vai trò của CNTT trong bài toán bảo toàn chữ Nôm Thầy cũng thường xuyên góp ý và tạo mọi điều kiện để em có thể hoàn thành được luận văn này Em xin cám ơn thầy

Em xin chân thành cám ơn TS Lê Quang Minh, thầy đã dành nhiều thời gian chỉ dẫn, góp ý, giúp em định hướng phương pháp nghiên cứu và tạo mọi điều kiện tốt nhất

để em có thể hoàn thành luận văn này Em xin cám ơn thầy

Để hoàn thành luận văn này, sự giúp đỡ và định hướng, góp ý thường xuyên của các thành viên nhóm nghiên cứu LES – trường Đại học Công Nghệ đặc biệt là NCS Phạm Văn Hưởng đóng một vai trò vô cùng quan trọng Em xin gửi lời cám ơn chân thành đến nhóm nghiên cứu

Cuối cùng em cũng xin gửi lời cám ơn đến gia đình và bạn bè em, những người

đã luôn bên cạnh, động viên, và tạo mọi điều kiện tốt nhất cho em để có thể hoàn thành khóa học cũng như đề tài nghiên cứu

Tác giả Nguyễn Văn Bách

Trang 4

MỤC LỤC

Chương 1 NHẬN DẠNG CHỮ NÔM 6

2.1 Nhận dạng ký tự quang học (OCR) 6

2.2 Bài toán nhận dạng chữ Nôm của nhóm LES-Nôm 8

2.3 Mô hình nhận dạng trên thiết bị di động 10

Tổng kết chương 1 11

Chương 2 TIỀN XỬ LÝ 12

2.1 Tính quan trọng của tiền xử lý 12

2.2 Mục tiêu của tiền xử lý trong bài toán nhận dạng 12

2.3 Các kỹ thuật tiền xử lý trong OCR 13

Tổng kết chương 2 23

Chương 3 TIỀN XỬ LÝ CHỮ NÔM TRÊN DI ĐỘNG 25

3.1 Mô hình nhận dạng trên di động 25

3.2 Các phương pháp tiền xử lý áp dụng, đề xuất 26

Tổng kết chương 3 36

Chương 4 THỰC NGHIỆM, ĐÁNH GIÁ 36

4.1 Xây dựng mô hình nhận dạng client-server 36

4.2 Kết quả đạt được 42

4.3 Hướng cải tiến và nghiên cứu tiếp 48

Tổng kết chương 4 48

KẾT LUẬN 49

TÀI LIỆU THAM KHẢO 50

DANH MỤC BẢNG BIỂU Bảng 1 Các giá trị phương sai

28 Bảng 2 Kết quả thực nghiệm và đánh giá

46 DANH MỤC HÌNH VẼ Hình 1 Teseract OCR trên Android

7 Hình 2 Mô hình nhận dạng chữ Nôm

9 Hình 3 Mô hình nhận dạng client-server

10

Trang 6

Hình 25 Loại bỏ điểm lùi

Trang 7

MỞ ĐẦU

1 Tính cấp thiết

Chữ Nôm là một di sản văn hóa dân tộc Chữ Nôm ra đời có ý nghĩa hết sức lớn lao, đánh dấu bước phát triển của nền văn hóa dân tộc, ý thức tự cường và khẳng định vai trò, địa vị của Tiếng Việt

Lâu nay nghiên cứu Hán Nôm là việc làm hết sức có ý nghĩa đối với sự nghiệp tìm hiểu tri thức văn hóa của con người Việt Nam; là cầu nối của quá khứ với hiện tại

và tương lai Tìm hiểu nghiên cứu, khai tác thư tịch, di tích, văn hóa lịch sử, con người xưa để xây dựng nền văn hóa mới, tạo cơ hội cho người Việt Nam hiện tại và mai sau tiếp cận, lĩnh hội và thưởng thức những giá trị văn hóa Việt Nam, góp phần giữ vững bản sắc dân tộc và có thể hòa nhập với thế giới, vượt qua những thử thách lớn lao, phức tạp của thời đại [3]

Nghiên cứu Hán Nôm vì thế gắn liền và làm rạng ngời nền văn hóa dân tộc, khẳng định bản sắc riêng biệt của dân tộc Để góp phần đưa các tác phẩm chữ Nôm đến gần hơn, dễ dàng tiếp cận hơn, ứng dụng Công Nghệ Thông Tin là một trong những cách tiếp cận Một trong những nhiệm vụ được đặt ra cho Công Nghệ Thông Tin là xây dựng bộ ứng dụng nhận dạng chữ Nôm

Bên cạnh đó, hiện nay hầu hết các quốc gia đã có thể xây dựng bộ ứng dụng nhận dạng ngôn ngữ chữ viết của họ, do đó vấn đề xây dựng bộ ứng dụng nhận dạng chữ Nôm càng trở nên cấp thiết hơn

2 Chữ Nôm – Quốc âm

Chữ Nôm (chữ Nôm: 字字·字·字) là tên gọi cách viết biểu ý trong thời cổ đại và trung đại của Tiếng Việt, có một thời kỳ dài được xem là ngôn ngữ quốc gia (quốc ngữ), gọi là Quốc Âm

Theo các nhà nghiên cứu, chữ Nôm xuất hiện ở Việt Nam dựa trên cơ sở chữ Hán của người Trung Quốc và âm Hán-Việt đã hình thành một cách có hệ thống ở Việt Nam Dần dần, có những chữ Hán không ghi được âm Hán-Việt nên các chữ Nôm được sáng tạo ra để ghi âm tiếng Việt, tạo thành các văn tự Nôm

Chữ Nôm hình thành và phát triển khoảng từ thế kỷ X đến đầu thế kỷ XX (về thời điểm chữ Nôm ra đời vẫn còn nhiều tranh cãi) Cứ liệu sớm nhất về chữ Nôm là bản khắc trên quả chuông Vân Bản năm 1076, thời nhà Lý, thế kỷ XI Ban đầu chữ Nôm thường dùng để ghi tên người, tên đất, nhưng càng về sau, chữ Nôm càng trở nên phổ biến và tìm thấy ý nghĩa trong đời sống văn hóa của Người Việt Tuy nhiên, chữ

Trang 8

Nôm chưa bao giờ được các triều đại phong kiến coi là ngôn ngữ chính thống trên phương diện nhà nước, trừ nhà Hồ đầu thế kỷ XV (1400-1407), nhà Tây Sơn cuối thế

kỷ XVII (1788-1802), với số năm ít ỏi, đã từng có xu hướng sử dụng chữ Nôm trong các văn bản hành chính Sau khi Việt Nam thoát khỏi ách đô hộ của phương Bắc vào năm 939, chữ Nôm được hoàn chỉnh dần dần và chỉ đến thế kỷ XIII – XV mới được dùng nhiều trong văn chương

Ban đầu khi mới xuất hiện, chữ Nôm thuần túy mượn chữ Hán y nguyên để ghi

âm tiếng Việt cổ Phép đó gọi là “giả tá” Dần dần phép ghép hai chữ Hán lại với nhau, một phần gợi âm, một phần gợi ý được dùng ngày càng nhiều và có hệ thống hơn Phép này gọi là “hài thanh” để cấu tạo chữ mới Kể từ thời Lê về sau số lượng sáng tác bằng chữ Nôm tăng dần trong suốt 500 năm từ thế kỷ XIV đến thế kỷ XX Dồi dào nhất là các áng thi văn có tính cách cảm hứng, tiêu khiển và nặng phần tình cảm Những tác phẩm Nôm này rất đa dạng: từ Hàn luật (thơ Nôm (tiếng Việt) theo luật Đường), đến văn tế, truyện thơ lục bát, song thất lục bát, phú, hát nói, tuồng, chèo

Văn Nôm đã diễn tả đầy đủ mọi tình cảm của dân tộc Việt, khi thì hào hùng, khi thì bi

ai; khi thì trang nghiêm, khi thì bỡn cợt

Chữ Nôm có gốc rễ từ chữ Hán, do đó nguyên tắc và phương pháp cấu tạo chữ

tự nhiên cũng có chổ giống hoặc tương tự Nhưng chữ Nôm lại có chổ độc đáo riêng của nó

Tuy nhiên nhờ mang nhiều nét tương đồng, bài toán nhận dạng chữ Nôm có thể tham khảo được những phương pháp nhận dạng đả được áp dụng cho chữ Trung Quốc

So sánh với chữ Latinh, cấu tạo chữ Nôm có nhiều nét khác biệt Do đó phương pháp xử lý cũng mang tính đặc thù hơn Chữ Nôm thường được viết gióng hàng, gióng cột, do đó việc tách chữ có phần đơn gian hơn chữ latinh Tuy nhiên các hàng chữ Nôm thường bố cục cách xa nhau hơn so với chữ Latinh, do đó bài toán xử lý nghiêng

có một số khó khăn hơn

Động lực nghiên cứu nhận dạng chữ Nôm

Mặc dù lịch sử hình thành chữ Nôm còn không ít vấn đề cần làm sáng tỏ, nhưng

về ý nghĩa của sự ra đời của chữ Nôm, các nhà nghiên cứu đều thống nhất nhận định

rằng: trong suốt quãng thời gian tồn tại, chữ Nôm là công cụ duy nhất, hoàn toàn Việt

Nam, ghi lại lịch sử, văn hóa của dân tộc Việt Chữ Nôm ra đời bắt nguồn từ ý thức

phản vệ của dân tộc chống lại xu hướng Hán hóa của người phương Bắc, khẳng định tinh thần dân tộc của người Việt Sự hình thành và phát triển của chữ Nôm, dù nói gì đi chăng nữa, cũng mang đậm tính thuần Việt ở chỗ nó đi lên từ đòi hỏi của đời sống Việt, nó được cư dân Việt Nam chấp nhận trong nền văn hóa của mình mà không cần một “sắc lệnh” nào từ giới cầm quyền [4]

Trang 9

Sự hình thành và phát triển của chữ Nôm là bước ngoặt thứ nhất trong lịch sử ngôn ngữ văn tự của người Việt và cũng là một bước ngoặt trong lịch sử văn hóa Việt Nam, đáp ứng đòi hỏi của việc trực tiếp ghi chép hoặc diễn đạt lời ăn tiếng nói cùng tâm tư, suy nghĩ và tình cảm của bản than người Việt

Chữ Nôm đã tạo nên những thành tựu rực rỡ, làm phong phú kho tàng văn hóa Việt Nam, điều mà trước đó chữ Hán trên đất Việt không hề có được Hơn nữa, cái đặc

sắc của bước ngoặt này là: nó do chính con người Việt Nam tạo ra và phát triển từ sức

sống của dân tộc, từ sâu thẳm của bản sắc văn hóa đã được tạo dựng ngàn năm của chính mình Có lẽ vì vậy, con người Việt Nam cùng với chữ Nôm là những con người

thuần Việt hơn bao giờ hết Chữ Nôm đã góp phần to lớn trong việc giữ gìn và phát huy bản sắc của dân tộc Việt Nam trên con đường tự khẳng định mình vậy

Những ý nghĩa to lớn trên của chữ Nôm là động lực của những nghiên cứu nhằm đưa chữ Nôm trở nên có thể nắm bắt được bởi thế hệ hiện tại, những người không được học, đào tạo và sử dụng chữ Nôm

3 Tình hình nghiên cứu

Hiện nay liên quan đến chữ Nôm đã có nhiều nhóm nghiên cứu thực hiện, cả trên lĩnh vực ngôn ngữ học và ứng dụng Công Nghệ Thông Tin Một trong những thành tựu đầu tiên là việc hình thành từ điển chữ Nôm, xây dựng các kho chữ Nôm được số hóa, số hóa và dịch các tài liệu, tác phẩm chữ Nôm như Truyện Kiều (Nguyễn Du) của Hán Nôm Foundation Tiếp tới sau những nổ lực trong thời gian dài, chữ Nôm

đã được xác lập vị trí trong bộ ký tự thế giới Unicode và ISO 10646, trong đó có 5067

ký tự trùng hình với chữ Trung Quốc, 4232 chữ thuần Nôm và hiện đang đề nghị đưa vào thêm 2200 chữ Kế tiếp bước đi đó, nhiều bộ font Nôm, bộ gõ chữ Nôm đã được xây dựng Và một trong những bước đi tiếp của lộ trình trên là xây dựng ứng dụng nhận dạng ký tự quang học Nôm (OCR-Nôm) [5]

Liên quan đến nhận dạng chữ Nôm, nhóm nghiên cứu LES Nôm (Laboratory of Embeded System) của trường Đại học Công Nghệ - ĐHQG Hà Nội cũng đã có một số nghiên cứu và đạt được thành quả nhất định Các nghiên cứu chủ yếu tập trung nghiên cứu, xây dựng các Engine nhận dạng, để xây dựng ứng dụng nhận dạng chạy trên PC với đầu vào là ảnh của 1 chữ, chưa triển khai nhận dạng bằng Camera trên nền tảng di động

4 Đối tƣợng và phạm vi nghiên cứu

Chúng tôi tập trung nhận dạng bài toán nhận dạng chữ Nôm dựa trên những nghiên cứu đã có của nhóm nghiên cứu LES Nôm nhằm xây dựng một phần mềm nhận

Trang 10

dạng hoàn chỉnh có chức năng chụp hình chữ Nôm, nhận dạng và đưa ra nghĩa Tiếng Việt

Hệ thống nhận dạng ký tự quang học (OCR – optical character recognition) nói chung và hệ thống nhận dạng chữ Nôm nói riêng bao gồm 4 thành phần chính: tiền xử

lý, trích chọn đặc trưng, nhận dạng, hậu xử lý Luận văn dựa trên ứng dụng nhận dạng trên PC trong “Nhận dạng chữ Nôm bằng mạng Nơ ron” của Trần Nguyên Hoàng [1] được thực hiện với kho mẫu NOM-DB0 chứa 495 chữ Nôm, để xây dựng hệ thống nhận dạng chữ Nôm hoàn chỉnh Ứng dụng nhận dạng trên PC yêu cầu đầu vào là ảnh nhị phân của một chữ Nôm, do đó để hoàn chỉnh hệ thống nhận dạng trên thiết bị di động, với đầu vào là ảnh chụp sử dụng Camera, đầu ra là nghĩa Tiếng Việt của chữ Nôm, đề tài tập trung nghiên cứu các phương pháp tiền xử lý cần áp dụng

5 Mục đích và nhiệm vụ nghiên cứu

Đề tài tập trung hoàn chỉnh hệ thống nhận dạng, nhằm cụ thể hóa bài toán nhận dạng trên thiết bị di dộng dựa trên ứng dụng nhận dạng trên PC hiện có của LES-Nôm xây dựng Hệ thống được xây dựng dựa trên mô hình Client-Server Client ứng dụng trên điện thoại thông minh chạy hệ điều hành Android, thực hiện việc chụp hình chữ Nôm, tiền xử lý ảnh chụp được, gửi ảnh chữ Nôm lên Server và nhận về và hiển thị kết quả nhận dạng

Trong bước tiền xử lý, đề tài thực hiện tìm hiểu, và cài đặt thuật toán nhị phân hóa ảnh, đề xuất thuật toán phát hiện và xử lý nghiêng của ảnh và phân đoạn, tách chữ Sau đó tiến hành thực nghiệm, phân tích kết quả đạt được, đề xuất các hướng nghiên cứu tiếp theo nhằm cải tiến tiếp

Để đạt được mục tiêu trên, chúng tôi đã tiến hành tìm hiểu, từ đó làm rỏ, và đề xuất phương pháp tiền xử lý trong bài toán nhận dạng chữ Nôm Luận văn tập trung tìm hiểu các vấn đề chính sau:

 Xây dựng hệ thống theo mô hình client-server

 Phương pháp nhị phân hóa ảnh

 Phương pháp phát hiện, và xử lý nghiêng ảnh chụp các ký từ bằng camera có thiết bị di động

 Phương pháp tách rời các chữ từ ảnh chụp được

Như được trình bày trong chương 2, các phương pháp trên chưa bao hàm hết tất

cả các phương pháp áp dụng trong tiền xử lý Nhưng do thời gian hạn chế, chúng tôi chỉ tìm hiểu những phương pháp cốt yếu nhất để có thể hoàn chỉnh hệ thống nhận dạng trên Android

Trang 11

6 Những nội dung nghiên cứu

Chúng tôi tìm hiểu nghiên cứu về bài toán tiền xử lý trong nhận dạng ký tự quang học nhằm mục đích xây dựng ứng dụng nhận dạng chữ Nôm trên thiết bị di động Để tiến hành nghiên cứu và đánh giá, chúng tôi sử dụng kết quả nghiên cứu - ứng dụng nhậng dạng trên PC của nhóm LES-Nôm được tiến hành trên bộ dữ liệu Nôm-DB0 Trên cơ sở các kiến thức tìm hiểu được, và ứng dụng nhận dạng hiện có, tiến hành xây dựng hệ thống Chúng tôi áp dụng thuật toán xác định ngưỡng toàn cục Otsu để nhị phân hóa ảnh chụp được, đề xuất thuật toán phát hiện và xử lý nghiêng dựa trên ý tưởng của Wojciech Biniecki, Szymon Grabowski & Wojciech Rozenberg

[11], dựa trên đặc điểm viết gióng hàng, gióng cột của chữ Nôm đề xuất thuật toán tách chữ đơn giản, từ đó xây dựng ứng dụng nhận dạng hoàn chỉnh trên thiết bị Android

7 Kết cấu luận văn

Luận văn được chia làm 4 chương Trong chương 1, chúng tôi trình bày về bài toán nhận dạng ký tự quang học nói chung, và nhận dạng chữ Nôm nói riêng Tiếp đó, trong chương 2, chúng tôi trình bày về Tiền xử lý trong bài toán nhận dạng – mục tiêu nghiên cứu của đề tài Trong chương 3, chúng tôi đi sâu trình bày về các thuật toán mà chúng tôi sẽ sử dụng trong bước tiền xử lý nhận dạng chữ Nôm: thuật toán xác định ngưỡng toàn cục Otsu, thuật toán phát hiện và xử lý nghiêng và thuật toán tách chữ Ở chương cuối, chúng tôi trình bày về thực nghiệm xây dựng hệ thống, các kết quả đạt được và phân tích về những hạn chế của chương trình, từ đó đề xuất hướng nghiên cứu tiếp theo nhằm cải tiến hệ thống

Trang 12

Chương 1 NHẬN DẠNG CHỮ NÔM 2.1 Nhận dạng ký tự quang học (OCR)

OCR – viết tắt của “Optical Character Recognition” là tiến trình chuyển các ảnh được scan hoặc chụp của các ký tự (in hoặc viết tay) sang các dạng mà máy tính có thể hiểu được [13] OCR là một bài toán con của bài toán nhận dạng mẫu (Pattern recognition) [10] Mặc dù công việc nghiên cứu học thuật vẫn tiếp tục, một phần công việc của OCR đã chuyển sang ứng dụng trong thực tế với các kỹ thuật đã được chứng minh

OCR được sử dụng rộng rãi trong nhập dữ liệu từ đầu vào có nguồn gốc là các tài liệu giấy như hộ chiếu, hóa đơn , hay số hóa các tài liệu in từ đó giúp cho việc lưu trữ, chỉnh sửa, tìm kiếm trở nên tiện lợi và hiệu quả

Lịch sử phát triển của OCR

Ban đầu các nghiên cứu OCR nhằm giải quyết hai vấn đề chính: mở rộng khả năng của điện báo và tạo ra các thiết bị đọc nhằm hổ trợ người mù [14]

Vào năm 1914, Emanuel Goldberg đã tạo ra một chiếc máy có thể đọc các ký tự

và chuyển chúng sang mã điện tín Cũng trong thời gian này, Edmund Fournier d’Abe

đã tạo ra Optophone – một thiết bị quét cầm tay có thể tạo ra các âm thanh tương ứng với các ký tự khi quét qua trang giấy in [7]

Vào những năm cuối thập niên 1920 đến thập niên 1930, Emanuel Goldberge đã tạo một máy được gọi là “Statical Machine” để tìm các microfilm sử dụng một hệ thống nhận dạng mã quang học Vào năm 1931, ông đã được trao sáng chế USA số 1.838.389 cho phát minh này

Vào năm 1974, Ray Kurweil thành lập công ty Kurzweil Computer Products và tiếp tục xây dựng omni-font OCR có khả năng nhận dạng các ký tự in ở bất kỳ loại font nào Ông xác định rằng những ứng dụng tốt nhất của công nghệ này phải được sử dụng để tạo ra các máy đọc cho người mù, nhằm giúp người mù có thể hiểu được các tài liệu in Vào năm 1978, Kurzwei Computer Products bắt đầu bán các sản phẩm thương mại

Vào thập niên 2000, OCR đã được xây dựng và trở thành dịch vụ trực tuyến (WebOCR), trong điện toán đám mây, và trong các ứng dụng di động trên các điện thoại thông minh

Trang 13

Hình 1 Teseract OCR trên Android

Đã có nhiều các sản phẩm thương mại cho các hệ thống OCR nhận dạng các loại ký tự, bao gồm chữ Latinh, Kirin, Ả rập, Do Thái, Trung Quốc, Nhật Bản, Hàn Quốc, Ấn độ…

Nguyên tắc hoạt động của OCR

Về nguyên tắc hoạt động, quá trình xử lý OCR thường gồm 4 bước chính

 Xác định ngưỡng (threadhoding): ảnh gốc (ảnh có mầu hoặc ảnh xám) được chuyển sang dạng nhị phân (đen – trắng) bằng cách tìm ra một ngưỡng (threadhold) mầu đề phân biệt giữa nền và cảnh

 Giảm nhiễu (noise reduction): ảnh khi được chụp hoặc scan có thể gặp phải một số lỗi khách quan, dẫn đến bị nghiêng, hay xuất hiện các điểm đen… Để tăng độ chính xác cho bước nhận dạng, bước giảm nhiễu giúp loại bỏ các nhiễu này Có nhiều kỹ thuật được sử dụng nhằm giảm nhiễu cho ảnh gốc, nối các điểm ảnh gần nhau lại hoặc loại bỏ các điểm ảnh tách biệt nhằm làm mịn các đường biên là một ví dụ

 Phân đoạn: Bước phân đoạn thực hiện việc chia ảnh thành các phần khác nhau như: phần chứa chữ và phần không chứa chữ, các câu trong 1 đoạn văn hoặc các từ trong một chữ

Trang 14

 Chuẩn hóa (normalization): sau khi được phân đoạn, các ký tự được chuẩn hóa để có cùng kích thước (như 32x32 hoặc 64x64) nhằm chuẩn hóa đầu vào cho các bước xử lý tiếp theo

Hậu xử lý

Bước hậu xử lý thực hiện việc cải thiện độ chính xác của bước nhận dạng Ví dụ như sử dụng một bộ từ điển, kiểm tra xem từ nhận dạng có trong từ điển hoặc gần giống với từ nào đó không, nhằm cải thiện độ chính xác của kết quả nhận dạng

Tóm lại, OCR đã được ứng dụng nhận dạng trong rất nhiều ngôn ngữ, cả chữ Latinh cũng như chữ tượng hình, chữ in cũng như chữ viết tay Tuy nhiên ở Việt Nam, ứng dụng OCR để nhận dạng chữ Nôm thì hiện nay vẫn chưa có nhiều nghiên cứu

2.2 Bài toán nhận dạng chữ Nôm của nhóm LES-Nôm

Bài toán nhận dạng chữ Nôm là một bài toán con của bài toán nhận dạng ký tự quang học với đối tượng nhận dạng là các tài liệu chữ Nôm Về cơ bản, phương pháp nhận dạng chữ Nôm của nhóm LES-Nôm được tiến hành như bài toán OCR cơ bản, bao gồm các bước [5]:

Trang 15

Hình 2 Mô hình nhận dạng chữ Nôm

Tài liệu chữ Nôm cần được nhận dạng có thể dạng văn bản in, hoặc được chụp

từ các văn bản được bảo tồn Các tài liệu này có thể ở dạng scan (.pdf, jpg) hoặc là ảnh chụp (bitmap)

Các tài liệu này do bị ảnh hưởng bởi các yếu tố môi trường như tài liệu bị cũ, chất lượng kém, góc chụp không chính diện, thẳng đứng, không đủ độ sáng… nên xuất hiện một số nhiễu Để có thể tiến hành nhận dạng được, các tài liệu cần qua bước

“1.Tiền xử lý” nhằm loại bỏ các nhiễu, phân đoạn, tách ra các chữ riêng rẽ và chuẩn hóa kích thước chữ

Sau khi đã có ảnh chữ đã được chuẩn hóa, các ảnh chữ Nôm sẽ được trích chọn

ra các đặc trưng để lấy ra tập các đặc trưng của chữ (“2 Trích chọn đặc trưng”)

Tập các đặc trưng này sẽ được huấn luyện và đưa vào cơ sở dữ liệu nhằm làm

cơ sở cho bước nhận dạng (“3.Huấn luyện”)

Ở bước “4.Nhận dạng”, từ đặc trưng của chữ Nôm, chữ Nôm sẽ được nhận dạng

áp dụng một số thuật toán sử dụng CSDL nhận dạng

Cuối cùng, nhằm nâng cao độ chính xác của nhận dạng, kết quả của nhận dạng

có thể không là một kết quả, dựa vào bộ từ điển việc lựa chọn kết quả đúng được quyết

Tài liệu scan/

Mã Unicode

Tài liệu đả nhận dạng (.txt, doc)

Trang 16

định Ngoài ra, để có thể hiểu được ý nghĩa của chữ Nôm, ở bước “5.Hậu xử lý”, một

số phương pháp dịch sẽ được áp dụng

Các phương pháp nhận dạng chữ Nôm khác nhau thường khác nhau ở các bước

“2.Trích chọn đặc trưng”, “3.Huấn luyện” và bước “4.Nhận dạng” Trong đó tùy thuộc vào phương pháp huấn luyện và nhận dạng mà các phương pháp trích chọn đặc trưng được lựa chọn nhằm tối ưu cho kết quả nhận dạng

Hiện tại ứng dụng nhận dạng chữ Nôm đã đạt được một số kết quả nhất định trên bộ chữ nôm NOM-DB0 với 495 chữ Trong luận văn “Nhận dạng chữ Nôm bằng máy Vector hổ trợ (SVM)” của Trần Nghi Phú thực hiện trên bộ chữ NOM-DB0 với

495 chữ đã cho độ chính xác 96%

Tuy nhiên các ứng dụng nhận dạng chỉ đều là ứng dụng PC, bước tiền xử lý chưa được nghiên cứu và cài đặt, do đó đầu vào yêu cầu là ảnh đen trắng (đã nhị phân hóa) của một chữ

Trong nghiên cứu về tiền xử lý của Phạm Ngọc Thành [15], tác giả đã tiến hành nghiên cứu và so sánh một số thuật toán trong tiền xử lý như nhị phân hóa ảnh, lọc nhiễu, phát hiện và xử lý nghiêng Tuy nhiên, kết quả nghiên cứu được tiến hành khi chương trình nhận dạng chữ Nôm chưa được hoàn chỉnh, do đó hệ thống chưa được xây dựng hoàn chỉnh mới dừng lại ở so sánh các thuật toán có sẵn

2.3 Mô hình nhận dạng trên thiết bị di động

Để hiện thực hóa bài toán nhận dạng trên thiết bị di động, chúng tôi sử dụng ứng dụng nhận dạng trên PC của nhóm nghiên cứu LES-Nôm để tiến hành xây dựng

hệ thống Hệ thống hoạt động dựa trên mô hình client-server:

Hình 3 Mô hình nhận dạng client-server

Client

Ảnh bitmap của chữ

Nghĩa Tiếng Việt của chữ

Trang 17

Chữ Nôm sẽ được chụp từ điện thoại thông minh (Android), sau đó ảnh chụp được tiến hành tiền xử lý, các chữ được tách ra riêng rẽ Sau đó, ảnh bitmap của từng chữ sẻ được gửi lên Server để nhận dạng Ứng dụng nhận dạng của nhóm LES-Nôm, được chuyển đổi từ ứng dụng PC thành một Web Service, cung cấp dịch vụ nhận dạng chữ Nôm, với đầu vào là ảnh bitmap của chữ, và đầu ra là nghĩa được nhận dạng của chữ Sau khi ảnh bitmap của chữ được nhận dạng, nghĩa của chữ sẽ được gửi trả về cho client

Giao thức được sử dụng để gửi yêu cầu lên Server và nhận phản hồi từ Server của Client là giao thức SOAP 1.1 (Simple Object Access Protocol 1.1)

Trang 18

Chương 2 TIỀN XỬ LÝ

2.1 Tính quan trọng của tiền xử lý

Độ chính xác của một hệ thống OCR bị ảnh hưởng bởi rất nhiều nhân tố, có thể

kể đến là các nhân tố sau:

 Chất lượng của máy scan: máy scan có chất lượng càng cao, ảnh scan sẽ

có chất lượng càng tốt, do đó ảnh sẽ ít bị nhiễu hơn, do đó kết quả nhận dạng sẽ chính xác hơn

 Độ phân giải được scan: độ phân giải của máy càng cao, các đặc trưng của chữ được scan sẽ được giữ lại càng nhiều, giúp cho độ chính xác của

hệ thống nhận dạng trở nên cao hơn

 Loại tài liệu: nhận dạng một mẫu chữ in được đánh giá là đơn giản, và ít phức tạp hơn là nhận dạng chữ viết tay

 Chất lượng giấy: chất lượng giấy in càng tốt, số lượng nhiễu khi được scan sẽ càng được giảm thiểu

 Font được sử dụng: font chữ rõ ràng giúp cho quá trình nhận dạng được chính xác hơn

 Độ phức tạp của ngôn ngữ: một ngôn ngữ phức tạp, đòi hỏi hệ thống nhận dạng phải được thử nghiệm trên bộ dữ liệu lớn hơn, làm cho việc nghiên cứu trở nên khó khăn hơn, do đó độ chính xác trở nên khó khăn hơn

Từ các nhân tố trên, chúng tôi nhận thấy hầu hết (4/6 nhân tố) các nhân tố ảnh hưởng đến chất lượng của hệ thống OCR đều có thể được cải tiến bởi bước tiền xử trong hệ thống, cho thấy Tiền xử lý là một phần rất quan trọng trong bài toán nhận dạng

2.2 Mục tiêu của tiền xử lý trong bài toán nhận dạng

Mục đích của bước tiền xử lý là để xử lý các nhân tố ảnh hưởng đến chất lượng của OCR (được nêu ở mục 3.1), nhằm:

 Giúp hệ thống OCR đạt được kết quả nhận dạng với độ chính xác cao

 Giúp hệ thống OCR chạy ổn định bằng cách nâng cao độ chính xác của ảnh, khử nhiễu, nhị phân hóa ảnh, phát hiện và xử lý nghiêng, phân trang, tách chữ, chuẩn hóa ký tự và các kỹ thuật hình học

Trang 19

2.3 Các kỹ thuật tiền xử lý trong OCR

Trong OCR, hầu hết các ứng dụng sử dụng ảnh nhị phân hoặc ảnh xám, vì xử lý ảnh mầu yêu cầu mức độ tính toán cao Những ảnh này có thể chứa nhiễu gây khó khăn cho việc tách chữ từ tài liệu nếu không thực hiện một số bước tiền xử lý

Kết quả mong muốn của tiền xử lý là ảnh nhị phân chỉ chứa từ cần nhận dạng

Để đạt được kết quả trên thì cần thực hiện một số kỹ thuật sau trong bước tiền xử lý: 

Áp dụng một số kỹ thuật nâng cao chất lượng ảnh để khử nhiễu, làm đúng

 Áp dụng các kỹ thuậtphân trang, tách chữ để tách thành các chữ riêng rẽ

 Áp dụng các kỹ thuật về hình thái nhằm cải tiến chất lượng của các ký

tự (ví dụ như làm mịn nét chữ)

2.2.1 Các kỹ thuật nâng cao chất lượng ảnh

Các kỹ thuật nâng cao chất lượng ảnh được chia thành hai loại xử lý theo điểm

I(x,y) là giá trị của điểm ảnh ở ảnh gốc

O(x,y) là giá trị sau khi đã được nâng cao

T là hàm chuyển đổi

Một số kỹ thuật xử lý điểm:

 Thay đổi độ tương phản

 Nhị phân hóa toàn cục

 Xử lý histogram

 Biến đổi Logarit

 Biến đổi theo luật năng lượng

Trang 20

a Thay đổi độ tương phản

Độ tương phản là tỷ số độ chói (độ chói – là đại lượng chỉ mức độ sáng của vật bức xạ ánh sáng, phản xạ ánh sáng, hoặc cho ánh sáng đi qua) của thành phần (vùng) sáng nhất so với độ chói của thành phần vùng tối nhất Hay nói một cách đơn giản, độ tương phản là sự khác biệt giữa hai màu đen và trắng

Độ tương phản của ảnh phụ thuộc vào chất lượng của cảm biết trên thiết bị chụp, hoặc những cài đặt của người dùng khi tiến hành chụp Do đó, điều chỉnh độ tương phản của ảnh chụp nhằm giải quyết những khó khăn khi nhận dạng là cần thiết

Ý tưởng là thay đổi dải động của các mức xám ở trong ảnh Một kỹ thuật có thể được áp dụng được gọi là ánh xạ tuyến tính Công thức dưới đây thực hiện kéo giản giá trị các điểm ảnh của một bức ảnh có độ tương phản thấp hoặc cao bằng cách mở

rộng mức động trên toàn phổ của ảnh từ 0 đến (L-1):

O1 tương ứng với 0

O2 tương ứng với số mức mong muốn (L-1 = 255)

I1, I2 cung cấp các giá trị nhỏ nhất và lớn nhất của mức xám đưa vào

Dạng đơn giản nhất của xử lý là thay đổi độ sáng của một bức ảnh bằng cách thêm một giá trị lệch b vào tất cả các điểm ảnh b > 0 sẽ tăng độ sáng, b < 0 sẽ làm giảm độ sáng

Tương tự một nhân tố tích lũy a có thể được sử dụng thay một độ lệch a

Với 0 < a < 1, sẽ làm ảnh tối hơn; a > 1 sẽ làm ảnh sáng hơn Kết hợp cả hai độ lệch và độ lệch tích lủy:

b Nhị phân toàn cục

Nhị phân hóa ảnh là tiến trình tách thông tin (các đối tượng) của một bức ảnh ra khỏi nền (background), do đó, nhị phân hóa ảnh thường được áp dụng cho các tài liệu xám, hoặc bức ảnh scan có màu Nhị phân hóa có thể được chia làm hai loại chính: toàn cục và cục bộ

Các phương pháp nhị phân toàn cục chọn một giá trị ngưỡng cho toàn bộ ảnh Giá trị này được chọn thường dựa trên dự đoán của mức nền từ cường độ histogram của ảnh, vì vậy nó được xếp vào nhóm xử lý điểm

Bên cạnh đó, nhị phân cục bộ xác định các giá trị khác nhau cho các vùng ảnh khác nhau

Trang 21

Có rất nhiều thuật toán để xác định ngưỡng toàn cục (đến hàng trăm) Các phương pháp xác định ngưỡng toàn cục được sử dụng để tự động chuyển một bức ảnh xám sang ảnh nhị phân Các bức ảnh này được xem là có 2 loại điểm ảnh: điểm ảnh là

nền và điển ảnh là nội dung Mục đích của phương pháp xác định ngưỡng toàn cục là

tự động xác định giá trị ngưỡng, T, với những điểm ảnh có giá trị nhỏ hơn hoặc bằng T

sẽ được xem là điểm ảnh nội dung, và lớn hơn được coi là nền

Phương pháp đơn giản nhất là chọn giá trị trung bình của tất cả các điểm ảnh của ảnh gốc Phương pháp này không hiệu quả với ảnh có những điểm ảnh được phân

bố không đều

Một phương pháp phức tạp hơn là tạo một histogram của phân bố điểm ảnh trên ảnh và sử dụng các điểm “thung lũng” (điểm thấp nhất trên đồ thị histogram) là

ngưỡng Phương pháp này cho rằng có một số giá trị trung bình cho nền và các điểm

nội dung Nhưng các giá trị thực tế lại có một số thay đổi xung quanh các giá trị trung

bình này Tuy nhiên, phương pháp này yêu cầu tính toán nhiều, và độ thị histogram của ảnh có thể không được có các điểm “thung lũng” rõ ràng, do đó thường gây khó khăn cho việc xác định ngưỡng

Một phương pháp khác khá đơn giản, không yêu cầu nhiều kiến thức đặc biệt về ảnh là phương pháp lặp

Thủ tục lặp như sau:

 Bước 1: chọn một giá trị ngưỡng T (ngẫu nhiên)

 Bước 2: phân vùng ảnh, sử dụng T, thành nền và nội dung

 Bước 3: tính toán trung bình của mỗi vùng, u1 và u2 cho vùng R1 và R2

 Bước 4: tính toán giá trị ngưỡng mới

 Bước 5: lặp bước (2 – 5) đến khi giá trị ngưỡng mới trùng với giá trị trước đó

Các so sánh cho thấy phương pháp Otsu cho kết quả tốt nhất về hiệu năng (Sahoo etal., 1988, Otsu, 1979) Phương pháp của Otsu là một trong những kỹ thuật được sử dụng rộng rãi trong bài toán chuyển từ ảnh xám sang ảnh nhị phân Phương

pháp Otsu tìm ngưỡng mà làm cho sự thay đổi giữa các nền và nội dung là nhỏ nhất

Chúng tôi sẽ trình bày chi tiết về phương pháp này trong chương sau

c Xử lý histogram

Xử lý histogram được sử dụng trong nâng cao chất lượng ảnh và có thể có ích trong nén ảnh và xử lý phân đoạn ảnh Một histogram là đồ thị tần số ở mỗi mức xám xuất hiện từ 0 (đen) đến 255 (trắng) Nâng cao chất lượng ảnh bằng xử lý histogram có

Trang 22

thể cho phép cải tiến độ chi tiết, và cũng có thể giúp xử lý hình học khác như phân đoạn

d Biến đổi Logarit

Công thức của biến đổi logarit là:

Trong đó c là một hằng số, r ≥ 0

Biến đổi này ánh xạ một khoảng hẹp các giá trị xám ở mức thấp trong ảnh sang một khoảng rộng hơn và ngược lại

e Biến đổi luật năng lượng

Các biến đổi của luật năng lượng có công thức chung như sau:

Trong đó c và γ là các hằng số dương, ɛ là một giá trị bù mà thường bị bỏ qua vì

nó gây ra bởi những thay đổi lúc hiển thị Do đó:

a Lọc mịn (low-pass filter)

Lọc trung bình và lọc trung độ (mean filter) là một trong những phương pháp đơn giản và trực giác trong các phương pháp làm mịn ảnh Ví dụ, giảm số lượng các thay đổi cường độ của một điểm ảnh với điểm kế tiếp Nó thường được dùng để giảm nhiễu ở trong ảnh

Nhìn chung, lọc trung độ hoạt động như một bộ lọc tần số thấp, do đó làm giảm cường độ các biến đổi về không gian ảnh

Ý tưởng của lọc trung độ là thay thế mỗi điểm ảnh bằng giá trị trung bình của các hàng xóm của nó (bao hàm cả nó) Điều này gây ra một hiệu ứng loại bỏ các giá trị điểm ảnh mà giá trị của nó không thể hiện các điểm phụ cận nó

Trang 23

Lọc trung độ thường được xem như một bộ lọc chập Giống như các bộ lọc chập khác, nó cũng dựa trên một nhân (kernel), biểu diễn hình dạng và kích thước của các hàng xóm được lấy mẫu khi tính toán trung bình Thông thường 1 ma trận 3x3 được sữ dụng

Hình 4 Bộ lọc trung bình

Hình 5 Bộ lọc không trung bình

b Lọc sắc (hight-pass filter)

Lọc mài sắc được sử dụng để nhấn mạnh các chi tiết tốt của ảnh Các điểm có

độ tương phản cao có thể được phát hiện bằng cách tính toán những cường độ khác nhau trong một vùng của ảnh Trọng số của mặt nạ là cả dương và âm

Khi được áp dụng trên một vùng với sự thay đổi chậm của các mức xám, kết quả của phép chập có thể gần bằng 0 Khi mức xám thay đổi nhanh, kết quả sẻ là một

số lớn

c Lọc trung vị (median filter)

Một toán tử không tuyến tính hay được dùng là trung vị, một hình thức đặc biệt của low-pass filter Lọc trung vị sắp xếp tất cả các giá trị điểm ảnh của một vùng ảnh (3x3, 5x5, 7x7,…), thay thế các điểm ảnh trung tâm bởi giá trị trung vị

Lọc trung vị có tác dụng loại bỏ những nhiễu xung như nhiễu muỗi, thường xuất hiện ngẫu nhiên các điểm ảnh trắng đen

Hình 6 Lọc trung vị

Trang 24

Sắp xếp các giá trị trong vùng lựa chọn ta được (100, 115, 119, 120, 121, 122,

125, 134, 145), do đó, giá trị trung vị là 121

d Lọc tối đa (maximum filter)

Lọc tối đa được định nghĩa là tối đa giá trị tất cả các điểm ảnh trong một vùng ảnh Bộ lọc này tốt cho việc tìm kiếm điểm sáng nhất trong một ảnh

e Lọc tối thiểu (minimum filter)

Lọc tối thiểu nâng cao các giá trị tối của ảnh, do đó các điểm ảnh tối nhất sẽ là giá trị của điểm ảnh ở trung tâm cửa sổ

Histogram của các ảnh này có nhiều đỉnh, gây ra khó khăn cho kỹ thuật xác định ngưỡng toàn cục

Các thuật toán xác định ngưỡng cục bộ được xây dựng trong các tài liệu chủ yếu cho các ứng dụng đặc biệt, và hầu hết không có kết quả tốt trên các ứng dụng khác nhau Nguyên nhân có thể là do các giá trị ngưỡng trên và ngưỡng dưới phụ thuộc vào

độ tương phản và độ sáng của ảnh

2.2.1.3 Khử nhiễu

Những tiến bộ trong kỹ thuật ngày nay đã tạo ra những thiết bị chụp ảnh với những cải tiến tốt Tuy nhiên trong một số trường hợp, nhiễu ảnh vẫn xuất hiện Ảnh chụp từ máy ảnh có thể bị nhiễu bởi rất nhiều nguồn nhiễu như bóng, hay mất tập trung

Tiến trình loại bỏ nhiễu trong ảnh được gọi là khử nhiễu

Trong ảnh xám, người ta dùng lọc trung vị và lọc trung độ hoặc lọc mờ Gaussian để loại bỏ các điểm nhiễu Lọc mờ Gausian và các phương pháp lọc trung bình là những lựa chọn tốt để tăng độ mịn cho ảnh

Trang 25

Các nghiên cứu cho thấy, hầu hết các phương pháp xử lý nghiêng cho những độ chính xác khác nhau trong những trường hợp khác nhau [8] Vì vậy việc lựa chọn kỹ thuật nào cho phát hiện và xử lý nghiêng là tùy thuộc vào ứng dụng, cũng như loại ảnh muốn sử dụng

2.2.3 Phân trang

Sau khi nâng cao chất lượng ảnh, khử nhiễu, phát hiện và xử lý nghiêng, bước tiếp theo là thực hiện phân trang nhằm tách chữ ra khỏi ảnh Kết quả của bước này là ảnh của chỉ chữ được tách ra

Các phương pháp phân trang có thể được chia làm 3 nhóm chính: trên xuống, dưới lên và các kỹ thuật lai

Các phương pháp trên xuống, đệ quy chia các vùng lớn trong tài liệu thành các vùng nhỏ hơn Việc phân trang dừng lại khi các tiêu chuẩn được đáp ứng

Bên cạnh đó, các phương pháp dưới lên bắt đầu bằng nhóm các điểm ảnh được quan tâm, sau đó kết hợp cúng thành các khối lớn hơn hoặc kết nối các thành phần, như các ký tự mà sau đó được nhóm thành các từ, các đường hoặc khối chữ

Các phương pháp lai là kết hợp của 2 phương pháp trên xuống và dưới lên

2.2.5 Chuẩn hóa kích thước ảnh

Kết quả của phân đoạn ký tự cung cấp những ký tự được tách biệt Sau đó các ảnh này được chuẩn hóa thành các kích thước xác định, được quyết định dựa trên ứng dụng và kỹ thuật sử dụng ở bước trích chọn đặc trưng và nhận dạng

Trang 26

2.2.6 Xử lý hình thái học

Các kết quả của bước phân đoạn và xử lý nhiễu có thể gây ra một số điểm ảnh

bị xóa đi tạo ra các lỗ trên một số vùng của ảnh Những lổ lớn, có thể làm cho ký tự bị chia thành nhiều ký tự hoặc nhiều phần Điều này gây khó khăn cho việc nhận dạng

Xử lý hình thái học được sử dụng để giải quyết vấn đề này Các kỹ thuật có hiệu quả bao gồm như ăn mòn (erosion), giản nở (dilation), mở và đóng, phác thảo

(outlining), làm mỏng và lấy khung xương Những kỹ thuật này chỉ hoạt động trên ảnh nhị phân

Có hai kỹ thuật chung cho ăn mòn và giản nở là: sử dụng ngưỡng là kỹ thuật mặt nạ

Kỹ thuật ngưỡng xem ở các hàng xóm của một điểm ảnh và thay đổi giá trị của

nó nếu sự khác nhau của các điểm ảnh hàng xóm vượt quá một ngưỡng nào đó

Ví dụ, nếu số các điểm ảnh zero trong các hàng xóm của một điểm ảnh vượt quá

một tham số ngưỡng a thì điểm đó sẽ bị đặt thành zero khi thực hiện ăn mòn

Hình 7Ăn mòn

a - ảnh gốc, b - ảnh sau khi bị xói mòn

Ngược lại, nếu các điểm ảnh tiếp đến của một điểm ảnh zero vượt quá một ngưỡng nào đó, thì giá trị của điểm zero sẽ được gán

Trang 27

Hình 8 Giản nở

a - ảnh gốc, b - ảnh sau khi được giản nở

Kỹ thuật mặt nạ nhân một mảng nxn (3x3, 5x5, …) của 1 và 0 vào một ảnh đầu vào để làm xói mòn hoặc giản nở ảnh đầu vào

Ví dụ làm giản nở ảnh với ma trận (3x3):

0 0 0

1 1 1

0 0 0

Ta có kết quả như sau:

Hình 9 Giản nở theo chiều ngang

a - ảnh gốc, b - ảnh sau khi giản nở

2.2.6.2 Mở và đóng

Mở và đóng là các toán tử hình thái được thay đổi từ các hoạt động xói mòn và giản nở, thường được áp dụng cho các ảnh nhị phân

Ảnh hưởng của kỹ thuật này về cơ bản cũng tương tự như xói mòn, nó cũng xóa

bỏ một số điểm ảnh nền từ cạnh của vùng các điểm ảnh nền Tuy nhiên mức độ ít hơn

Hình 10 Mở

Ngày đăng: 15/07/2015, 08:51

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
3. Đoàn Ánh Loan, (2009), “Báo cáo đề dẫn - Hội thảo nghiên cứu Hán Nôm và vấn đề văn hóa dân tộc” Sách, tạp chí
Tiêu đề: Báo cáo đề dẫn - Hội thảo nghiên cứu Hán Nôm và vấn đề văn hóa dân tộc
Tác giả: Đoàn Ánh Loan
Năm: 2009
7. d'Albe, E. E. F. (1 July 1914). "On a Type-Reading Optophone". Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences 90 (619): 373– Sách, tạp chí
Tiêu đề: On a Type-Reading Optophone
1. Trần Nguyên Hoàng (2013), Nhận dạng chữ Nôm bằng mạng nơ-ron, Luận văn Thạc sĩ, Đại học Công Nghệ, Đại học Quốc Gia Hà Nội Khác
2. Phạm Văn Huởng, Trần Minh Tuấn, Nguyễn Thị Ngọc Hương, Bùi Thị Khác
4. Hoàng Thư Ngân (2011), Hai bước ngoặt trong lịch sữ văn hóa Việt, Chuyên đề, Đại học văn hóa Hà Nội Khác
5. Trần Nghi Phú (2013), Luận văn Thạc Sĩ, Đại học Công Nghệ, Đại học Quốc Gia Hà Nội Khác
6. Nguyễn Triệu Tuấn (2013), Trích chọn đặc trưng trong nhận dạng chữ Nôm, Luận văn thạc sĩ, Đại học Công nghệ - Đại học quốc gia Hà Nội, Hà NộiTiếng Anh Khác
8. Yasser Alginahi (2010), Taibah University, Kingdom of Saudi Arabia, Preprocessing Techniques in Character Recognition Khác
9. Andrew Greensted (2010), Otsu Thresholding – The Lab Book Pages (an online collection of electronic information) Khác
10. Hamid Reza Boveiri, Shushtar Branch (2010), On Pattern Classification Khác
12. Sahoo, P.; Soltani, S. &amp; Wong, A. (1988). A Survey of Thresholding Techniques, Computer Vision Graphics Image Processing, Vol. 41, pp. 233-260 Khác
13. Pritpal Singh, Sumit Budhiraja, (IJERA) ISSN: 2248-9622 Vol. 1, Issue 4, pp Khác
14. Schantz, Herbert F. (1982). The history of OCR, optical character recognition. [Manchester Center, Vt.]: Recognition Technologies Users Association. ISBN 9780943072012 Khác
15. Pham Ngoc Thanh (2012), Techniques for Nom Character Processing and Recognition in Android Environment, Bachelor Thesis, Vietnam national University, Hanoi University, University of Engineering and Technology Khác

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w