Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 53 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
53
Dung lượng
1,07 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG -o0o - ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ THÔNG TIN HẢI PHÒNG 2013 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG -o0o - TÌM HIỂU MỘT SỐ PHƢƠNG PHÁP TRÍCH CHỌN ĐẶC TRƢNG CHO NHẬN DẠNG CHỮ VIẾT ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Cơng nghệ Thơng tin HẢI PHÒNG - 2013 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG -o0o - TÌM HIỂU MỘT SỐ PHƢƠNG PHÁP TRÍCH CHỌN ĐẶC TRƢNG CHO NHẬN DẠNG CHỮ VIẾT ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ Thông tin Giáo viên hƣớng dẫn: PGS TS Ngô Quốc Tạo Sinh viên thực hiện: Nguyễn Sơn Hà Mã số sinh viên: 1351010034 HẢI PHÒNG - 2013 BỘ GIÁO DỤC VÀ ĐÀO TẠO CỘNG HÒA XA HỘI CHỦ NGHĨA VIỆT NAM TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG Độc lập - Tự - Hạnh phúc -o0o - NHIỆM VỤ THIẾT KẾ TỐT NGHIỆP Sinh viên: Nguyễn Sơn Hà Lớp: CT1301 Mã SV: 1351010034 Ngành: Cơng nghệ Thơng tin Tên đề tài:Tìm hiểu số phƣơng pháp trích chọn đặc trƣng cho nhận dạng chữ viết NHIỆM VỤ ĐỀ TÀI Nội dung yêu cầu cần giải nhiệm vụ đề tài tốt nghiệp a Nội dung - Giới thiệu trích chọn đặc trƣng:Đặc trƣng bất biến,khả khơi phục - Trích chọn đặc trƣng từ ảnh đa cấp xám:Đối sánh mẫu,mẫu biến dạng,biến đổi ảnh Unitar,bất biến hình học,bất biến Zenite - Trích chọn đặc trƣng từ ảnh nhị phân:Đối sánh mẫu,mẫu biến dạng,biến đổi ảnh Unitar,bất biến hình học - Trích chọn đặc trƣng từ biên ảnh:Chiếu nghiêng,tách vùng,xấp xỉ đƣờng cong,mơ tả Fourier - Trích chọn đặc trƣng từ biểu diễn véc tơ: Đối sánh mẫu,mẫu biến dạng,đặc trƣng rời rạc,biểu diễn đồ thị,biểu diễn Fourier b Các yêu cầu cần giải - Hiểu nội dung trích chọn đặc trƣng theo đối sánh - Viết xong đồ án - Cài đặt thử nghiệm chƣơng trình trích đặc trƣng CÁN BỘ HƢỚNG DẪN ĐỀ TÀI TỐT NGHIỆP Ngƣời hƣớng dẫn thứ nhất: Họ tên: Ngơ Quốc Tạo Học hàm, học vị: Phó giáo sƣ Tiến sĩ Cơ quan công tác: Viện Công nghệ thông tin,Viện Hàn Lâm Khoa học Công nghệ Viêt Nam Nội dung hƣớng dẫn: Ngƣời hƣớng dẫn thứ hai: Họ tên: Học hàm, học vị: Cơ quan công tác: Nội dung hƣớng dẫn: Đề tài tốt nghiệp đƣợc giao ngày….tháng….năm 2013 Yêu cầu phải hoàn thành trƣớc ngày….tháng….năm 2013 Đã nhận nhiệm vụ: Đ.T.T.N Đã nhận nhiệm vụ: Đ.T.T.N Sinh viên Cán hƣớng dẫn Đ.T.T.N Nguyễn Sơn Hà PGS TS Ngơ Quốc Tạo Hải Phịng, ngày tháng .năm 2013 HIỆU TRƢỞNG GS.TS.NGƯT Trần Hữu Nghị Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phịng PHẦN NHẬN XÉT TĨM TẮT CỦA CÁN BỘ HƢỚNG DẪN Tinh thần thái độ sinh viên trình làm đề tài tốt nghiệp: Đánh giá chất lƣợng đề tài tốt nghiệp (so với nội dung yêu cầu đề nhiệm vụ đề tài tốt nghiệp) Cho điểm cán hƣớng dẫn: (Điểm ghi số chữ) Ngày .tháng .năm 2013 Cán hƣớng dẫn (Ký, ghi rõ họ tên) Nguyễn Sơn Hà - CT1301 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng PHẦN NHẬN XÉT ĐÁNH GIÁ CỦA CÁN BỘ CHẤM PHẢN BIỆN ĐỀ TÀI TỐT NGHIỆP Đánh giá chất lƣợng đề tài tốt nghiệp (về mặt nhƣ sở lý luận, thuyết minh chƣơng trình, giá trị thực tế) Cho điểm cán phản biện (Điểm ghi số chữ) Ngày .tháng .năm 2013 Cán chấm phản biện (Ký, ghi rõ họ tên) Nguyễn Sơn Hà - CT1301 LỜI CẢM ƠN Trƣớc tiên em xin đƣợc bày tỏ trân trọng lòng biết ơn thầy giáo PGS.TS Ngơ Quốc Tạo- Trƣởng phịng Nhận dạng Cơng nghệ tri thức,Viện Công nghệ thông tin,Viện Hàn Lâm Khoa Học Công nghệ Việt Nam Trong suốt thời gian làm đồ án tốt nghiệp, thầy dành nhiều thời gian q báu để tận tình bảo, hƣớng dẫn, định hƣớng cho em thực đồ án Em xin đƣợc cảm ơn thầy cô giáo Trƣờng Đại học Dân lập Hải phòng giảng dạy trình học tập, thực hành, làm tập, giúp em hiểu thấu đáo nội dung học tập hạn chế cần khắc phục việc học tập, nghiên cứu thực đồ án Em xin cảm ơn bạn bè thành viên gia đình tạo điều kiện tốt nhất, động viên, cổ vũ suốt trình học tập đồ án tốt nghiệp Do thời gian kiến thức có hạn nên khơng tránh khỏi thiếu sót định Em mong nhận đƣợc đóng góp q báu thầy cơ! Em xin chân thành cảm ơn! Hải Phòng, ngày tháng năm 2013 Sinh viên Nguyễn Sơn Hà Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng MỤC LỤC LỜI CÁM ƠN DANH MỤC HÌNH DANH MỤC CÁC KÝ HIỆU, CỤM TỪ VIẾT TẮT PHẦN MỞ ĐẦU TÓM TẮT ĐỀ TÀI CHƢƠNG TỔNG QUAN VỀ CHỮ VIẾT VÀ LÝ THUYẾT NHẬN DẠNG 1.1 GIỚI THIỆU 1.2 MƠ HÌNH TỔNG QT CỦA MỘT HỆ NHẬN DẠNG CHỮ VIẾT TAY 1.2.1 Tiền xử lý 1.2.2 Khối tách chữ : 13 1.2.3 Trích chọn đặc trƣng: 14 1.2.4 Huấn luyện nhận dạng : 14 1.2.5 Hậu xử lý : 14 1.3 CÁC PHƢƠNG PHÁP NHẬN DẠNG CHỮ VIẾT TAY 15 1.3.1 Đối sánh mẫu: 15 1.3.2 Phƣơng pháp tiếp cận cấu trúc: 16 1.3.3 Mạng nơ ron 17 1.3.4 Mơ hình Markov ẩn (HMM - Hidden Markov Model) : 20 1.3.5 Máy véc tơ tựa (SVM) : 21 1.3.6 Kết hợp kỹ thuật nhận dạng : 23 1.3.7 Kết luận 24 CHƢƠNG 2: TỔNG QUAN VỀ TRÍCH CHỌN ĐẶC TRƢNG VÀ MỘT SỐ PHƢƠNG PHÁP TRÍCH CHỌN ĐẶC TRƢNG TRONG NHẬN DẠNG CHỮ VIẾT 25 2.1 Trích chọn đặc trƣng 25 2.1.1 Biến đổi toàn cục khai triển chuỗi 25 2.1.2 Đặc trƣng thống kê 26 2.1.3 Đặc trƣng hình học hình thái 27 2.2 Đặc trƣng bất biến 28 2.3 Khả khôi phục 29 2.4 Trích chọn đặc trƣng từ ảnh đa cấp xám 29 2.4.1 Giới thiệu 29 2.4.2 Đối sánh mẫu 30 2.4.3 Mẫu biến dạng 30 Nguyễn Sơn Hà - CT1301 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng 2.4.2 Đối sánh mẫu Chúng ta không nhận thức đƣợc hệ thống OCR sử dụng mẫu phù hợp với hình ảnh xám Tuy nhiên, kể từ mẫu phù hợp hình ảnh chuẩn kỹ thuật xử lý, bao gồm hoàn chỉnh Trong mẫu phù hợp với bƣớc tính khai thác đƣợc bỏ hồn tồn hình ảnh đƣợc sử dụng nhƣ "vector" Trong giai đoạn công nhận, biện pháp mẫu TJ hình ảnh Z đƣợc tính tốn Các thơng số Tk, có biện pháp tƣơng tự cao nhất, xác định tƣơng đồng quy định ngƣỡng, sau hình ảnh đƣợc gán nhãn lớp k Ngƣợc lại, nhân vật cịn lại khơng đƣợc phân loại Trong trƣờng hợp biện pháp đồng dạng, mẫu T k có biện pháp đồng dạng thấp đƣợc xác định dƣới mức quy định, đối tƣợng đƣợc dán lớp nhãn k 2.4.3 Mẫu biến dạng Mẫu biến dạng đƣợc sử dụng rộng rãi nhiều công nhận đối tƣợng Các mẫu đƣợc sử dụng xƣơng nhân vật Nó khơng phải rõ ràng cách vị trí ban đầu mẫu đƣợc chọn Nếu tất vị trí có hình ảnh đƣợc xét xử, thời gian tính tốn đƣợc ngăn cấm 2.4.4 Biến đổi ảnh Unitar Trong mẫu phù hợp, tất điểm ảnh hình ảnh xám đƣợc sử dụng nhƣ biến đổi Unitar để hình ảnh giảm số lƣợng tính bảo quản hầu hết thơng tin hình dạng Trong khoảng thời gian chuyển đổi, điểm ảnh đƣợc xếp điểm ảnh với mức cao đƣợc sử dụng nhƣ tính Biến đổi Unitar phải đƣợc áp dụng để có đƣợc ƣớc tính phƣơng sai điểm ảnh khơng gian chuyển đổi Các tính đƣợc lấy từ biến đổi Unitar không bất biến , hình ảnh đầu vào phải đƣợc luân chuyển đến định hƣớng tiêu chuẩn xoay ký tự xảy Hơn nữa, hình ảnh đầu vào có đƣợc xác kích thƣớc tƣơng tự , đó, rộng tái lấy mẫu cần thiết kích thƣớc khác đơn biến đổi không chiếu sáng bất biến , nhƣng Fourier chuyển đổi hình ảnh giá trị gốc tỷ lệ thuận với giá trị điểm ảnh trung bình đầu vào hình ảnh , tính bị xóa để có đƣợc sang Ness bất biến Cho tất biến đổi đơn , nghịch đảo chuyển đổi tồn , hình ảnh nhân vật ban đầu đƣợc xây dựng lại Nguyễn Sơn Hà - CT1301 30 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng 2.4.5 Bất biến Zenite Zernike khoảnh khắc đƣợc sử dụng số tác giả cho nhận dạng ký tự nhị phân rắn ký tự 2.5 Trích chọn đặc trƣng từ ảnh nhị phân: 2.5.1 Giới thiệu Một ảnh raster nhị phân thu đƣợc toàn cầu binarization địa phƣơng thích nghi đầu vào hình ảnh xám Trong nhiều trƣờng hợp ,các phân đoạn đối tƣợng thực đơn giản cách cách ly thành phần đƣợc kết nối Tuy nhiên , cho hình ảnh khó khăn, số đối tƣợng chạm vào chồng chéo đối tƣợng in khác khác Một vấn đề khác xảy đối tƣợng đƣợc phân mảnh thành hai nhiều thành phần đƣợc kết nối, vấn đề đƣợc giảm nhẹ phần cách chọn phƣơng pháp thích nghi tốt , nhƣng Trier Taxt tốt phƣơng pháp binarization địa phƣơng thích ứng cịn khơng dẫn đến đối tƣợng bị lập hồn tồn Phƣơng pháp phân đoạn đối tƣợng cảm động Westall Narasimha ,Fujisawa điều tra Tuy nhiên , phƣơng pháp giả định đối tƣợng xuất chuỗi nội dung có định hƣớng đƣợc biết đến Trong đồ thủy văn) , ví dụ, số đối tƣợng chạm vào chồng chéo lên đƣờng , ký tự liên lạc từ dòng văn Một phƣơng pháp dựa xám đƣợc tích hợp phân khúc Phƣơng pháp cho tốt hiệu suất, kể từ thông tin thu đƣợc topo - bƣớc phân tích đồ họa đƣợc sử dụng phân chia ảnh nhị phân Bƣớc phân khúc xử lý xoay đối tƣợng đối tƣợng chạm vào từ văn khác dây Đại diện raster nhị phân đối tƣợng đơn giản hóa đại diện xám chức chụp ảnh Z ( x, y) có hai giá trị ( nói , 1) thay , nói 256 giá trị màu xám cấp có nghĩa tất phƣơng pháp phát triển cho màu xám - đại diện quy mô đƣợc áp dụng cho nhị phân rắn raster đại diện tốt Vì , khơng lặp lại mơ tả đầy đủ phƣơng pháp , nhƣng chỉ đơn giản hóa tính tốn volved cho phƣơng pháp khai thác tính Nói chung , bất biến để chiếu sáng khơng phù hợp , nhƣng invariances khác Một ảnh nhị phân rắn đƣợc chuyển đổi sang khác quan đại diện , chẳng hạn nhƣ đƣờng viền ngồi char phận cơng tác , cấu hình đƣờng viền , xƣơng tính đƣợc chiết xuất từ đại diện tốt Với mục đích thiết kế Nguyễn Sơn Hà - CT1301 31 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng OCR hệ thống , mục tiêu việc chuyển đổi để bảo vệ thơng tin liên quan hình loại bỏ số thông tin không cần thiết 2.5.2 Biến đổi ảnh Unitar NIST dựa hình thức hệ thống nhận dạng tay-in sử dụng Karhunen-Loeve chuyển đổi để trích xuất tính từ đại diện raster nhị phân Hiệu tuyên bố đƣợc tốt, hệ thống OCR có sẵn phạm vi cơng cộng 2.5.3 Bất biến hình học Một hình ảnh nhị phân đƣợc coi trƣờng hợp đặc biệt hình ảnh màu xám cấp với Z (x, y) = cho điểm ảnh in ấn Z (zi, Yl) = cho điểm ảnh 2.6 Trích chọn đặc trƣng từ biên ảnh: 2.6.1 Giới thiệu Đƣờng cong đƣờng viền bên khép kín ảnh đƣờng cong tuyến tính piecewise khép kín qua trung tâm tất điểm ảnh mà bốn kết nối đến bên khơng có điểm ảnh khác Sau đƣờng cong, điểm ảnh đƣợc truy cập trong, nói, ngƣợc kim đồng hồ trật tự đƣờng cong truy cập vào điểm ảnh cạnh hai lần địa điểm mà đối tƣợng rộng điểm ảnh dòng phận đƣờng thẳng từ tâm điểm ảnh tới láng giêng 2.6.2 Tách vùng Kimura Shridhar đƣợc sử dụng phân vùng đƣờng viền đƣờng cong Trong khu vực, phân đoạn đƣờng đồng mức đƣợc- tween pixel lân cận đƣợc nhóm lại theo định hƣớng: ngang (0 °), thẳng đứng (90 °) hai đƣờng chéo định hƣớng (45, 135 °) Số đoạn đƣờng định hƣớng đƣợc tính Takahashi đƣợc sử dụng biểu đồ định hƣớng từ khu vực, nhƣng sử dụng theo chiều dọc, ngang đƣờng chéo lát nhƣ khu vực thêm vào bên đƣờng viền thực biểu đồ Hơn nữa, Takahashi xác định điểm cong cao dọc theo hai đƣờng viền bên bên Đối với điểm, giá trị độ cong, tiếp tuyến đƣờng viền vị trí khu, điểm đƣợc trích xuất thời gian mạng lƣới thƣờng xuyên đƣợc sử dụng nhƣ khu vực Khi đƣờng cong đƣờng viền gần với biên giới khu vực, thay đổi nhỏ đƣờng viền cong dẫn đến thay đổi lớn khai thác tính Họ cố gắng để bù đắp cho điều cách sử dụng biên giới mờ Điểm gần biên giới khu vực cho Nguyễn Sơn Hà - CT1301 32 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng giá trị thành viên mờ để hai bốn khu vực thành viên mờ giá trị số tiền cho 2.6.3 Xấp xỉ đƣờng cong: Trên đƣờng viền nhân vật bên áp gần đƣờng cong hai điểm dừng với chức Sau , hai Đƣờng cong thông số đƣờng cong đƣợc sử dụng nhƣ tính Xấp xỉ đƣờng cong đƣờng viền bên với đƣờng cong spline, mà sau đƣợc làm nhẵn trơn spline đƣờng cong đƣợc chia thành phần M -chiều dài đƣờng cong Đối với phần , độ cong trung bình đƣợc tính cơng thức xác định Ngoài ra, khoảng cách từ arithme - tic nghĩa điểm uốn cong để N nhƣ điểm khoảng cách đƣờng viền đƣợc đo cách nhân rộng spline đƣờng cong xấp xỉ nhân vật để tiêu - kích thƣớc Sở NN & PTNT trƣớc tính đƣợc đánh giá , tính trở thành kích thƣớc bất biến Các tính dịch bất biến tự nhiên, nhƣng phụ thuộc vào quay 2.6.4 Mô tả Fourier: Trƣớc Kuhl ,Giardina Lin Hwang, mô tả Fourier khác đƣợc phát triển Zahn ,Roskies Granlund .Trong Zahn Roskies ,các góc cạnh khác nhau-là nghiệm 2.7 Trích chọn đặc trƣng từ biểu diễn véc tơ: 2.7.1 Giới thiệu Một số lƣợng áp đảo thuật toán mỏng tồn số nghiên cứu đánh giá gần cho manh mối để họ giá trị bất lợi Nhiệm vụ quyền thƣờng liên quan đến thỏa hiệp , muốn điểm ảnh rộng xƣơng tám kết nối với chi nhánh giả nút di dời , số loại mạnh mẽ để luân chuyển tiếng ồn đồng thời nhanh chóng dễ dàng thực thuật toán mỏng dƣờng nhƣ ứng cử viên tốt, thực việc phức tạp Một biểu đồ đối tƣợng đƣợc bắt nguồn từ xƣơng xấp xỉ với số đƣờng thẳng phân đoạn điểm giao Vịng cung đƣợc sử dụng cho phần cong xƣơng Nguyễn Sơn Hà - CT1301 33 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phịng Phƣơng pháp hữu ích chí tốt có sẵn phƣơng pháp khơng thể bảo tồn hình dạng phận làm việc hình ảnh 2.7.2 Đối sánh mẫu Mẫu phù hợp dạng tinh khiết khơng phù hợp cho xƣơng đối tƣợngvật, nhỏ 2.7.3 Mẫu biến dạng Mẫu biến dạng đƣợc sử dụng Burr Wakahara công nhận nhân vật skel - etons Trong cách tiếp cận Wakahara , mẫu de - hình thành số bƣớc nhỏ , đƣợc gọi affine địa phƣơng biến đổi ( LAT ) để phù hợp với mơ hình đầu vào ứng cử viên Số lƣợng kiểu chuyển đổi trƣớc trận đấu thu đƣợc đƣợc sử dụng nhƣ không giống - biện pháp ity mẫu đầu vào mẫu 2.7.4 Đặc trƣng rời rạc Từ nhân vật mỏng , tính sau đƣợc trích xuất: < 1,82 s số lƣợng vịng , số lƣợng T- khớp , số lƣợng X - khớp , số lƣợng uốn cong điểm, chiều rộng chiều cao tỷ lệ kèm theo hình chữ nhật ;sự diện dấu chấm bị cô lập , tổng số lƣợng thiết bị đầu cuối số lƣợng thiết bị đầu cuối bốn hƣớng N , S , W E , số lƣợng bán vòng tròn bốn hƣớng , số lƣợng giao cắt theo chiều dọc trục ngang , tƣơng ứng, trục đặt trung tâm lực hấp dẫn Ngƣời ta sử dụng giao cắt với nhiều chồng dịng nhƣ tính , thực tế , điều đƣợc thực đầu OCR hệ thống , tl ) Tuy nhiên , tính làm khơng dẫn đến hệ thống nhận dạng mạnh mẽ , nhƣ số lƣợng dịng chồng đƣợc tăng lên, tính kết mạnh mẽ với thay đổi phông chữ ( dùng cho máy ký tự in ) biến đổi hình dạng nhân vật văn phong cách (ký tự viết tay ) 2.7.5 Biểu diễn Fourier Các phƣơng pháp mô tả Fourier cho đƣờng nét nhân vật sử dụng cho xƣơng nhân vật đồ thị nhân vật , kể từ xƣơng đồ thị đƣợc qua để tạo thành đƣờng cong đóng cửa ,nhấn mạnh biểu đồ nhân vật với hai dòng kết thúc , khơng có nút khơng có vịng, , đồ thị với nút giao vịng, tất mơ tả có giá trị khác không Nguyễn Sơn Hà - CT1301 34 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phịng Các đặc tính cho phép quay kích thƣớc bất biến tính đƣợc tìm thấy , trƣờng hợp nhân vật mà xảy đƣợc khác loại với có đƣợc vector tính khác Giải pháp trƣớc phân loại đồ thị ký tự vào ba loại sau sử dụng phân loại riêng cho loại Nguyễn Sơn Hà - CT1301 35 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phịng CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM 3.1 Giới thiệu Trong luận văn hạn chế mặt thời gian độ phức tạp nhận dạng chữ viết tay tiếng Việt hạn chế mô nhận dạng ký tự viết tay tiếng Việt rời rạc trực tuyến Các ký tự tiếng Việt gồm ký tự không dấu {A, B, C, D, Đ, E, G, H, I, K, L, M, N, O, P, Q, R, S, T, U, V, X, Y} ký tự có dấu {Ă, Â, À, Ả, Ã, Á, Ạ, Ằ, Ẳ, Ẵ, Ắ, Ặ, Ầ, Ẩ, Ẫ, Ấ, Ậ, Ê, È, Ẻ, Ẽ, É, Ẹ, Ề, Ể, Ễ, Ế, Ệ, Ì, Ỉ, Ĩ, Í, Ị, Ơ, Ơ, Õ, Ỏ, Õ, Ó, Ọ, Ồ, Ổ, Ỗ, Ố, Ộ, Ờ, Ở, Ỡ, Ớ, Ợ, Ƣ, Ù, Ủ, Ũ, Ö, Ụ, Ừ, Ử, Ữ, Ứ, Ự, Ỳ, Ỷ, Ỹ, Ý, Ỳ} Chƣơng trình nhận dạng ký tự viết tay ngƣời sử dụng vẽ chúng, chức tƣơng tự nhƣ nhận dạng ký tự viết tay sử dụng thiết bị cầm tay PDA (Personal Digital Assistant ) Chƣơng trình gồm giao diện đơn giản cho phép ngƣời sử dụng dùng chuột vẽ ký tự cần nhận dạng tiến hành nhận dạng Khi vẽ ký tự có hình chữ nhật xung quanh ký tự đó.Mục đích hình chữ nhật để cắt khoảng trắng không liên quan đến ký tự làm cho chƣơng trình có khả khơng cần quan tâm đến vị trí ký tự đƣợc viết Ta vẽ ký tự giữa, trên, dƣới hay vị trí khác nhƣng chƣơng trình có khả nhận dạng Các bƣớc giải tốn sử dụng trích chọn đặc trƣng nhận dạng chữ viết: - Xây dựng giao diện vẽ - Xử lý liệu (phân tích ảnh) - Xây dựng Chƣơng trình - Nhận dạng chữ viết 3.2 Xây dựng giao diện vẽ - Xây dựng giao diện đồ họa, cho phép ngƣời sử dụng dùng chuột vẽ ký tự cần nhận dạng Nguyễn Sơn Hà - CT1301 36 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phịng - Tìm giới hạn trên, giới hạn dƣới, trái, phải ký tự sau đƣợc vẽ - Cắt bỏ tất khoảng trắng xung quanh ký tự đƣợc vẽ thu đƣợc ảnh có hồn tồn ký tự Nhƣ quy xử lý ảnh có ký tự, không quan tâm ký tự đƣợc vẽ vị trí nào: bên hay dƣới, bên trái hay bên phải Hình 2.2 Quá trình tìm giới hạn ký tự - Thực lấy mẫu xuống ảnh ký tự cách ánh xạ ký tự vào lƣới có kích thƣớc 10*10 Bằng cách ta quy ký tự kích thƣớc cố định, nhƣ khơng cần quan tâm đến kích thƣớc ký tự đƣợc vẽ vào to hay nhỏ Hình 2.3 Quá trình lấy mẫu xuống 3.3 Xử lý liệu (phân tích ảnh) Q trình phân tích ảnh q trình tìm đặc tính ký tự.Các điểm ảnh giá trị đầu vào cho trình huấn luyện q trình kiểm tra Q trình phân tích dựa việc nhận dạng từ ảnh ngƣời sử dụng vẽ vào Nguyễn Sơn Hà - CT1301 37 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng phƣơng pháp tìm điểm đen RGB(0,0,0) điểm trắng RGB(255,255,255) Kết thu đƣợc ma trận điểm ảnh Sau ma trận đƣợc ánh xạ thành vector đầu vào có kích thƣớc 100 phần tử.Trƣớc đƣa vào mạng vector đƣợc xử lý làm điểm ảnh thành vector gồm phần tử 0.5 -0.5 Hình 2.4 Quá trình ánh xạ từ ma trận điểm sang ma trận giá trị - Ký tự: Chứa chữ mẫu dùng để trích chọn - Giá trị: Lƣu trữ giá trị chữ mẫu dùng để trích chọn - Nhận dạng: Vùng để vẽ chữ lên - Tập mẫu: Chứa chữ mẫu dùng để trích chọn - Tải mẫu: Tải tập chữ mẫu tạo sẵn file: TapMau.xml - Thêm chữ: Ghi lại tập chữ mẫu vào file: TapMau.xml - Trích chọn đặc trƣng:Trích chọn đặc trƣng trọng số vùng chữ viết - Xóa chữ: Xóa chữ mẫu đƣợc chọn khỏi file TapMau.xml - Nhận dạng: Nhận dạng chữ vẽ vào - Thơng tin: Giới thiệu sơ chƣơng trình Chúng ta tải tập chữ từ file tạo sẵn TapMau.xml cách nhấn nút “Tải mẫu” tự nhập mẫu để trích chọn cách vẽ chữ vào vùng vẽ ký tự nhấn “Thêm chữ”, có hộp thoại nhắc bạn đánh vào chữ tƣơng ứng để nhận dạng chữ tƣơng ứng với chữ vừa vẽ Nguyễn Sơn Hà - CT1301 38 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng Sau nhập xong tập mẫu nhấn nút “Trích chọn đặc trƣng” Q trình trích chọn hồn thành, thực nhận dạng chữ cách vẽ chữ nhấn “Nhận dạng” Khi chữ đƣợc hiển thị lƣới kích thƣớc 10*10 Có thể xóa chữ xóa mẫu tập mẫu cách chọn chữ cần xóa nhấn nút “Xóa chữ” 3.4 Kết nhận dạng - Để nhận dạng chữ ta vẽ chữ cần nhận dạng vào vùng vẽ chữ (vùng chữ nhật màu trắng, bên dƣới phần “Nhận dạng”) - Ký tự đồng thời đƣợc hiển thị lƣới kích 10*10 (vùng vng màu xanh, bên phải giao diện chƣơng trình) - Nhấn nút nhận dạng - Chữ nhận dạng tƣơng ứng với chữ cần nhận dạng đƣợc vẽ đƣợc hiển thị hình 3.5 Đánh giá, nhận xét Chƣơng trình nhận dạng với độ xác cao.Nếu chữ nhận dạng chƣa đƣợc xác ta thêm mẫu trích chọn lại cho chữ đến nhận dạng đƣợc chữ xác Nếu chữ gần giống nhận dạng dễ lẫn sang trích chọn ta thêm mẫu tƣơng ứng với chữ đến đạt đƣợc tỷ lệ nhận dạng cao Chƣơng trình nhận dạng xác với chữ khơng dấu đến 96%, chữ có dấu độ xác lớn 85%.Đối với chữ có dấu độ xác giảm so với trƣờng hợp khơng có dấu trƣờng hợp chữ khác ít, nên số lƣợng mẫu trích chọn cho các chữ có dấu cần nhiều Để nhận dạng đƣợc nhiều kiểu viết khác tập mẫu cho chữ phải có nhiều dạng phong phú, tƣơng ứng với cách viết mà ngƣời sử dụng viết Q trình huấn luyện giải đƣợc khía cạnh phức tạp tốn nhận dạng chữ viết tay đa dạng chữ viết tay, đặc biệt chữ viết tay tiếng Việt Nhƣ chƣơng trình minh họa cho nhận dạng chữ viết tay tiếng Việt trực tuyến đạt đƣợc mục tiêu toán phức đặt Nghiên cứu trích chọn đặc trƣng hƣớng nghiên cứu cịn mẻ có nhiều hứa hẹn Nguyễn Sơn Hà - CT1301 39 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng Với hƣớng tiếp cận áp dụng cho giải toán nhận dạng chữ viết tay tiếng Việt trực tuyến vốn phức tạp đặc điểm: - Chữ viết tay trực tuyến phải thêm phần tạo giao diện để vẽ chữ, so với việc nhập đầu vào file ảnh chữ viết tay - Chữ viết tay hình dạng chữ phong phú đa dạng phụ thuộc nhiều vào ngƣời viết, ngƣời có cách viết khác - Chữ viết tay tiếng Việt có số lƣợng lớn, lớn nhiều so với chữ theo chuẩn khác Ví dụ: chuẩn tiếng Việt có 89 ký tự gồm ký tự khơng dấu có dấu, chuẩn tiếng Anh gồm 26 ký tự không dấu Mặt khác ký tự lại giống nên dễ nhầm lẫn trình nhận dạng Nhƣ giải toán phải đáp ứng đƣợc yêu cầu: - Giải đƣợc phức tạp việc xử lý liệu đầu vào - Giải đƣợc việc xử lý khối lƣợng liệu lớn - Giải đƣợc độ chuẩn xác trình nhận dạng - Giải đƣợc mức độ tổng quát, đa dạng, phong phú q trình xây dựng trích chọn để đạt đƣợc độ xác cao nhận dạng Chƣơng trình thử nghiệm đƣợc xây dựng ngôn ngữ C# sử dụng Visual Studio 2012 Nguyễn Sơn Hà - CT1301 40 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng Một số giao diện chƣơng trình Hình 2.5.Giao diện chƣơng trình Hình 2.6.Giao diện chƣơng trình sau nhận dạng chữ viết xong Nguyễn Sơn Hà - CT1301 41 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phịng Hình 2.7.Giao diện thêm chữ viết Hình 2.8 Giá trị vùng đƣợc nhận dạng Nguyễn Sơn Hà - CT1301 42 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phòng KẾT LUẬN A Kết đạt đƣợc: Trong trình nghiên cứu hoàn thành báo cáo đồ án tốt nghiệp “Tìm hiểu số phƣơng pháp trích chọn đặc trƣng cho nhận dạng chữ viết”, em thu nhận đƣợc thêm nhiều kiến thức nhận thấy trích chọn đặc trƣng cho nhận dạng chữ viết lĩnh vực rộng lớn đƣợc ứng dụng mạnh mẽ Hơn cịn nhiều vấn đề mà cần khám phá Trong đề tài em cố gắng tìm hiểu nghiên cứu tổng quan lý thuyết nhận dạng chữ viết phƣơng pháp trích chọn đặc trƣng cho việc nhận dạng chữ viết Cài đặt thử nghiệm chƣơng trình trích đặc trƣng cho việc nhận dạng chữ không dấu Do thời gian thực hạn chế kiến thức hạn chế nên em nghiên cứu đƣợc số lý thuyết trích chọn đặc trƣng Còn nhiều lý thuyết nhƣ kỹ thuật em chƣa tìm hiểu, khai thác ứng dụng vào toán thực tế Mặc dù cố gắng, song lực trình độ có hạn nên trình thực thực tập em khơng tránh khỏi thiếu sót Kính mong thầy cô bạn quan tâm giúp đỡ bảo để chƣơng trình em hồn thiện B Hƣớng phát triển tƣơng lai Trong thời gian tới em cố gắng tiếp tục nghiên cứu, tìm hiểu thêm số kiến thức trích chọn đặc trƣng cho việc nhận dạng chữ viết nói riêng lý thuyết nhận dạng nói chung Nguyễn Sơn Hà - CT1301 43 Đồ án tốt nghiệp Trƣờng ĐH Dân Lập Hải Phịng TÀI LIỆU THAM KHẢO Tiếng Việt [1] Hồng Kiếm, Nguyễn Hồng Sơn, Đào Minh Sơn, “Ứng dụng mạng nơron nhân tạo hệ thống xử lý biểu mẫu tự động”, Kỷ yếu hội nghị kỷ niệm 25 năm thành lập Viện Công nghệ Thông tin, 2001, tr 560-567 [2] Bùi Minh Trí, “Quy hoạch tốn học”, Nhà xuất Khoa học kỹ thuật, Hà nội, 2006 [3] Lê Hoài Bắc, Lê Hoàng Thái, “Neural Network & Genetic Algorithm in Application to Handwritten Character Recognition”, Tạp chí Tin học Điều khiển học, Tập 17, số 4, 2001, tr 57-65 [4] Nguyễn Thị Thanh Tân, Ngô Quốc Tạo, “Một cấu trúc mạng nơ ron thích hợp cho việc nhận dạng chữ số viết tay”, Kỷ yếu hội thảo FAIR03, NXB KH&KT Hà Nội, 2004, tr 200-210 [5] Nguyễn Thị Thanh Tân, Lƣơng Chi Mai, “Phƣơng pháp nhận dạng từ viết tay dựa mơ hình mạng nơ ron kết hợp với thống kê từ vựng”, Tạp chí Tin học Điều khiển học, Tập 22, số 2, 2006, tr 141-154 [5.1] Phạm Anh Phƣơng, Ngô Quốc Tạo, Lƣơng Chi Mai, “Ứng dụng SVM cho toán phân lớp nhận dạng”, Kỷ yếu Hội thảo khoa học Quốc gia lần thứ ba nghiên cứu, phát triển ứng dụng Công nghệ thông tin Truyền thông (ICT.rda’06), nhà xuất Khoa học Kỹ thuật, Hà nội, trang 393-400, 2021/05/2006 [5.2] Phạm Anh Phƣơng, Ngô Quốc Tạo, Lƣơng Chi Mai, “Trích chọn đặc trƣng wavelet Haar kết hợp với SVM cho việc nhận dạng chữ viết tay tiếng Việt”, Tạp chí Cơng nghệ Thơng tin Truyền thơng, ISSN 0866-7039, kỳ 3, số 20, 10-2008, tr 36-42 [5.3] Phạm Anh Phƣơng, “Áp dụng số chiến lƣợc SVM đa lớp cho toán nhận dạng chữ viết tay hạn chế”, Tạp chí khoa học Đại học Huế, ISSN 18591388, số 45, 2008, tr 109-118 [5.4] Nguyễn Thị Thanh Tân, Lƣơng Chi Mai, “Phƣơng pháp nhận dạng từ viết tay dựa mơ hình mạng nơ ron kết hợp với thống kê từ vựng”, Tạp chí Tin học Điều khiển học, Tập 22, số 2, 2006, tr 141-154 Tiếng Anh [6] ivind Due Trier, Anil K.Jain, Feature Extraction methods for character recognition:Survey,Pattern Recognition 29(4):641-662(1996) [7] Mark S, Nixon Alberto S Aguado, Feature Extraction & Image Processing,2 nd Edition from Mark Nixon, Alberto S Aguato ISBN-9780080556727, 2002 Nguyễn Sơn Hà - CT1301 44