1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu phương pháp phân đoạn tách nét của chữ viết tay hạn chế

48 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 48
Dung lượng 879,85 KB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG -o0o - TÌM HIỂU PHƢƠNG PHÁP PHÂN ĐOẠN TÁCH CÁC NÉT CỦA CHỮ VIẾT TAY HẠN CHẾ ĐỒ ÁN TỐT NGHIỆP HỆ ĐẠI HỌC CHÍNH QUY Ngành: Cơng nghệ thơng tin HẢI PHÒNG - 2012 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG -o0o - TÌM HIỂU PHƢƠNG PHÁP PHÂN ĐOẠN TÁCH CÁC NÉT CỦA CHỮ VIẾT TAY HẠN CHẾ ĐỒ ÁN TỐT NGHIỆP HỆ ĐẠI HỌC CHÍNH QUY Ngành: Công nghệ thông tin Sinh viên thực hiện: Trần Văn Tuấn Giáo viên hướng dẫn: PGS.TS Ngô Quốc Tạo Mã số sinh viên : 111159 HẢI PHÒNG – 2012 BỘ GIÁO DỤC VÀ ĐÀO TẠO CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG Độc lập – Tự – Hạnh phúc -o0o - NHIỆM VỤ THIẾT KẾ TỐT NGHIỆP Sinh viên: Trần Văn Tuấn Mã số: 111159 Lớp: CT1201 Nghành: Công nghệ thông tin Tên đề tài: Tìm hiểu phương pháp phân đoạn tách nét chữ viết tay hạn chế NHIỆM VỤ ĐỀ TÀI Nội dung yêu cầu cần giải nhiệm vụ đề tài tốt nghiệp a Nội dung: Tìm hiểu giai đoạn hệ thống nhận dạng chữ viết tay Đi sâu vào phương pháp tách nét chữ viết tay offline Nghiên cứu công cụ tiền xử lý trợ giúp cho tách nét chữ viết tay Tìm hiểu phương pháp làm mảnh ảnh Cài đặt chương trình thử nghiệm tách nét viết b Các yêu cầu cần giải Hiu c m s khái niệm xử lý ảnh Tìm hiểu phương pháp cộng, trừ ảnh Tìm hiểu phương pháp chuyển ảnh thành ảnh đa cấp xám Tìm hiểu phương pháp phân đoạn ảnh, lấy ngưỡng ảnh Tìm hiểu phương pháp làm mảnh ảnh Tìm điểm ngã ảnh Tách đoạn chữ viêt tay Cài đặt chng trỡnh th nghim Các số liệu cần thiết để thiết kế, tính toán Địa điểm thực tập CÁN BỘ HƢỚNG DẪN ĐỀ TÀI TỐT NGHIỆP Ngƣời hƣớng dẫn thứ nhất: Họ tên: Ngô Quốc Tạo Học hàm, học vị: PGS TS Cơ quan công tác: Viện Công Nghệ Thông Tin, Viện Khoa Học Và Công Nghệ Việt Nam Nội dung hướng dẫn: Tìm hiểu phương pháp phân đoạn tách nét chữ viết tay hạn chế Ngƣời hƣớng dẫn thứ hai: Họ tên: ………………………………………………………………………… Học vị, học hàm: ………………………………………………………………… Cơ quan công tác: ………………………………………………………………… Nội dung hướng dẫn: ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… ……………………………………………………………………………………… Đề tài tốt nghiệp giao ngày…… tháng…… năm 2012 Yêu cầu phải hoàn thành trước ngày ……tháng……năm 2012 Đã nhận nhiêm vụ: Đ.T.T.N Sinh viên Đã nhận nhiệm vụ: Đ.T.T.N Cán hướng dẫn Đ.T.T.N Hải Phòng, ngày….tháng….năm 2012 HIỆU TRƯỞNG GS TS NGƢT Trần Hữu Nghị PHẦN NHẬN XÉT TÓM TẮT CỦA CÁN BỘ HƢỚNG DẪN Tinh thần thái độ sinh viên trình làm đề tài tốt nghiệp: ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… …………………………………………………………………………… Đánh giá chất lượng đề tài tốt nghiệp (so với nội dung yêu cầu đề đề tài tốt nghiệp ) ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… ……………………………………………………………………………… …………………………………………………………………………… Cho điểm cán hướng dẫn: (Điểm ghi số chữ) ……………………………………………………………………………… …………………………………………………………………………… Ngày….tháng……năm 2012 Cán hướng dẫn (Ký, ghi rõ họ tên) PHẦN NHẬN XÉT ĐÁNH GIÁ CỦA CÁN BỘ CHẤM PHẢN BIỆN ĐỀ TÀI TỐT NGHIỆP Đánh giá chất lƣợng đề tài tốt nghiệp (về mặt nhƣ sở lý thuyết, thuyết minh chƣơng trình, giá trị thực tế,…) Cho điểm cán phản biện (Điểm ghi số chữ) Ngày…….tháng… năm 2012 Cán chấm phản biện (Ký, ghi rõ họ tên) LỜI CẢM ƠN Để hoàn thành đồ án này, em xin tỏ lòng biết ơn sâu sắc đến PGS.TS Ngơ Quốc Tạo, tận tình hƣớng dẫn em suốt trình làm đồ án tốt nghiệp Em xin chân thành cảm ơn quý Thầy, Cô khoa Công Nghệ Thông Tin trƣờng Đại Học Dân Lập Hải Phịng tận tình truyền đạt kiến thức suốt năm em học tập trƣờng Với vốn kiến thức đƣợc tiếp thu q trình học khơng tảng cho trình nghiên cứu đồ án mà cịn hành trang q báu để em bƣớc vào đời cách vững tự tin Em thầm biết ơn ủng hộ gia đình, bạn bè – ngƣời thân u ln chỗ dựa vững cho em Cuối cùng, em xin kính chúc q Thầy, Cơ gia đình dồi sức khỏe thành công nghiệp cao quý Hải Phòng, ngày 21 tháng 11 năm 2012 Sinh viên thực Trần Văn Tuấn MỤC LỤC LỜI CẢM ƠN LỜI NÓI ĐẦU 11 CHƢƠNG I GIỚI THIỆU 12 CHƢƠNG II Cơ sở lý thuyết giai đoạn tiền xử lý ảnh ký tự 13 I Lọc mịn ảnh: 13 II Nhị phân ảnh: 13 III Đánh nhãn thành phần liên thông: 15 Tách liên thông kĩ thuật đệ quy: 15 Giải thuật cải tiến: 16 IV Chuẩn kích thước: 18 V Lấp khoảng trống ảnh phép đóng morphology: 18 Một số định nghĩa: 18 Phép giãn : 19 Phép co : 19 Phép đóng: 19 VI Lấy đường biên làm trơn đường biên: 20 Phát biên: 20 Dò biên mã hóa đường biên: 21 Xác định hướng điểm biên (Freeman code): 21 Làm trơn đường biên: 22 VII Phương pháp chuyển ảnh RGB thành ảnh đa cấp xám 24 VIII Phân đoạn ảnh lấy ngưỡng ảnh 26 Phân đoạn (hay phân vùng) 26 Các hướng tiếp cận phân đoạn ảnh 26 Một số phương pháp phân đoạn cụ thể 26 Lấy ngưỡng (phân ngưỡng) 27 10 Phương pháp làm mảnh ảnh 29 CHƢƠNG III: RÚT ĐẶC TRƢNG 31 Giới thiệu đặc trưng hướng: 31 2.Chia ô: 31 Đặc trưng hướng đường biên: 32 CHƢƠNG IV : ĐIỂM NGÃ VÀ PHƢƠNG PHÁP PHÂN ĐOẠN TÁCH NÉT DỰA TRÊN ĐIỂM NGÃ BA 33 1.Các khái niêm 33 ) Xác định láng giềng điểm ảnh 36 3.Điểm ngã ba : 38 Phân đoạn tách nét dựa vào điểm ngã ba 39 CHƢƠNG V : CHƢƠNG TRÌNH VÀ MỘT SỐ KẾT QUẢ 42 THỬ NGHIỆM 42 TÀI LIỆU THAM KHẢO 48 34 Một Q ảnh P gọi 8_liên thông (hay 4_liên thông) cặp điểm x.y Q tồn 8_đường (hoặc 4_đường đi) từ x đến y phù hợp với điểm Q Trong trường hợp này, Q gọi 8_thành phần (hoặc 4_thành phần) P 1.3) Điểm biên Các điểm ảnh có láng giềng trắng gọi điểm biên Có loại biên liên kết liên kết Hình điểm biên liên kết 1.4) Điểm Các điểm đen mà điểm biên gọi điểm ảnh 1.5) Điểm cuối Một điểm đen thỏa mãn điều kiện b(P)= coi điểm cuối Điều kiện số tác giả đưa với dạng khác : p giữ lại có điểm đen phối hợp bên N(P), điều kiện áp dụng sau hai vòng lặp , bị bỏ qua hồn tồn để tránh nhánh giả Phần lớn khác thuật toán điều kiện đảm bảo tính liên thơng Điều kiên định nghĩa theo thuật ngữ số giao, số liên thông, điểm ảnh đơn 35 1.6) Số giao Có hai định nghĩa số giao điểm ảnh Theo Rutovitz, số giao số lần biến đổi từ điểm trắng sang điểm đen ngược lại các điểm ảnh N(P) đặt theo thứ tự ngược chiều kim đồng hồ Hilditch lại định nghĩa số giao số lần nhảy từ điểm trắng sang điểm đen điểm đặt thứ tự cắt góc kề đen 4_láng giềng Có thể thấy , định nghĩa , điểm ảnh có 8_láng giềng đen có số giao 0, điểm ảnh bị lập Nếu XH(p) = việc xóa p khơng làm thay đổi tính 8_liên thơng mẫu 1.7) Số liên thơng Ta tính số 8_liên thông theo định nghĩa : Nc8 = i ( x 2i-1- ( x 2i-1 x 2i x 2i+1)) Với x phủ định x, mặt khác với số 4_liên thông : 4 Nc = i (x2i-1-(x2i-1.x2i.x2i+1)) Các điểm ảnh giữ lại (khi Nc8 (p)>1) để khơng làm tính liên thơng Các điểm ảnh xóa lại thường gọi đơn, điểm ảnh biên không bị cô lập p đơn N(p) có thành phần đen, điều tương đương với XH(p)=1 Các điểm ảnh với số liên thông Nc8(p) lớn thuộc vào loại điểm ảnh bội Chúng bao gồm điểm cuối nhánh, nét vẽ có độ dày điểm ảnh, điểm ảnh qui cho xương dựa tiêu chuẩn liên thông 36 ) Xác định láng giềng điểm ảnh Để xác định điểm ngã ba ta cần tìm tất điểm có nhiều láng giềng Dưới phần code demo để xác định láng giềng điểm ảnh : void IMAGE::LangGieng(char*pCot,struct LangGieng_8 type=DEN){ unsigned char next; pixel->nhomBienDen_8=0; pixel->nhomBien_4=0; pixel->nhomBienDen_4=0; pixel->langGieng_8=0; pixel->langGiengDen_8=0; pixel->langGieng_4=0; pixel->langGiengDen_4=0; for(unsigned char i=0;i=0&&pCot[bien[i].dpos]==type ||typelangGieng_8++; if( (i&01)==1)// i le pixel->langGieng_4++; }//if if(pCot[bien[i].dpos]==DEN) { pixel->langGiengDen_8++; if( (i&01)==1) *pixel,int 37 pixel->langGiengDen_4++; }//if // tinh nhom bien lien thong_4 if(typenhomBien_4++; } Else { if((pCot[bien[i].dpos]==DEN||pCot[bien[i].dpos]==type)&&pCot[bien[i+1] dpos]==TRANG) pixel->nhomBien_4++; } // tinh nhomBienDen_4 lien thong if((pCot[bien[i].dpos]==DEN)&&pCot[bien[i+1].dpos]!=DEN) pixel->nhomBienDen_4++; // tinh nhom bien lien thong_8 diem den if((i&01)==0&&pCot[bien[i].dpos]!=DEN) continue;// trang o goc if((i&01)==1&&pCot[bien[i+1].dpos]!=DEN) next=2; else next=1; if(pCot[bien[i].dpos]==DEN&&pCot[bien[i+next].dpos]!=DEN ||pCot[bien[i].dpos]!=DEN&&pCot[bien[i+next].dpos]==DEN 38 ) pixel->nhomBienDen_8++; }//of for // hieu chinh lai nhomBien_4 if(pixel->nhomBien_4==0) { if( type=0&&(pCot[1]==DEN||pCot[1]==type) ) pixel->nhomBien_4=8;// xung quanh toan diem DEN }// of if // hieu chinh lai nhomBienDen_4 if(pixel->nhomBienDen_4==0&&pCot[1]==DEN) // xung quanh toan diem DEN pixel->nhomBienDen_4=8; // xac dinh tinh lien thong if(pixel->nhomBienDen_8==0&&pCot[1]!=DEN||pixel>nhomBienDen_8>2) pixel->lienThong=0;// khong lien thong else pixel->lienThong=1;//lien thong return; } 3.Điểm ngã ba: Được định nghĩa điểm giao nhau, điểm pixel có nhiều điểm lân cận, đường dẫn phân khúc định nghĩa theo điểm giao Trong giai đoạn phân khúc, kỹ thuật tách ngã ba dựa định phân đoạn đầy đủ chuỗi chữ, số kết nối.Sử dụng giá trị mờ đặc trưng kết hợp đầy đủ phân đoạn cô lập phân đoạn (sáp nhập hồn thành phân đoạn) từ phân đoạn nhỏ.Các kết nối không mong muốn nằm phân khúc nhỏ xương ký tự 39 Ở giai đoạn tách ký tự, tất phân đoạn kết hợp với phân đoạn nhỏ để tạo phác thảo kết nối khác nhau.Để nhận đặc điểm cá nhân chuỗi ký tự, phác thảo xây dựng thành hình ảnh ký tự đầu vào, sau sử dụng đầu vào cho hệ thống nhận dạng ký tự Hình 3.1 Điểm ngã phân khúc ký tự Phân đoạn tách nét dựa vào điểm ngã ba Khi xem xét ký tự đưa vào phân đoạn, gần khơng thể phân đoạn thành phần ký tự xương ảnh Điều khả có kết dính hai chữ số nhân vật khác chuỗi Do đó, giai đoạn phân đoạn đề xuất cơng việc bao gồm hai giai đoạn cụ thể là, phân khúc giai đoạn ban đầu phân chia tổng số pha Trong phân khúc ban đầu, hình ảnh ký tự đầu vào trải qua xác định điểm ngã ba phân đoạn dựa vào Trong nghiên cứu tìm thấy rằng, ban đầu phân khúc khơng hồn chỉnh kết nối điểm khơng tiếp giáp phân khúc xương Như ví dụ hình ảnh 3.1 trên, ký tự viết tay xương khơng tách thành "âm tính nghiêng" hai "Ngang Lines" điểm khơng ngã ba kết nối Để bù đắp cho điều này, thuật toán phân đoạn riêng biệt sử dụng với phân khúc dựa quy tắc phương pháp tiếp cận Để hiểu rõ thuật tốn ta cần tìm hiểu số định nghĩa: 40 Định nghĩa : Một điểm khởi điểm pixel xương ký tự mà qua xương bắt đầu khởi điểm có hai mặt khởi điểm điểm khởi nhỏ Định nghĩa 2: Một điểm khởi đầu điểm khởi đầu xác định trước bắt đầu traversal thông qua xương Định nghĩa 3: Một điểm khởi nhỏ điểm khởi đầu xác định qua xương Định nghĩa 4: hướng traversal hướng từ điểm ảnh pixel truy cập traversal Định nghĩa 5: Một điểm cuối điểm pixel khu vực tương quan, khơng có điểm ảnh lân cận đến thăm Sau tìm thấy tất điểm khởi lớn, điểm giao nhau, thuật toán bắt đầu ngang qua xương ký tự kết dính, khởi điểm danh sách điểm khởi.Trong trình tách ban đầu này, phân đoạn xác định đường traversal dựa danh sách điểm giao Một traversal đạt đến điểm đường giao nhau, điểm kết thúc, mà điểm pixel khơng có điểm ảnh lân cận để thăm tiếp theo, tập trung chuyển sang khởi động nhỏ xác định điểm hàng đợi khởi điểm nhỏ Sau đó, thuật tốn bắt đầu qua đường ghé thăm thường xuyên xương cách bắt đầu với điểm khởi nhỏ hàng đợi khởi điểm nhỏ.Trong tranversal này, thuật toán phân đoạn đường truy cập đến ngã ba điểm điểm kết thúc thành đoạn ban đầu Quá trình nêu tiếp tục với tất khởi điểm chưa ghé thăm hàng đợi khởi điểm chính, tất đường có liên quan khu vực truy cập ghé thăm thường xuyên Dưới thuật toán : 41 void IMAGE::CutThin(int MaxX,int MaxY,Pixel* storeXY,Pixel *storeWhite) { char *pCot,*pDong,*pPic; long j,i; int count=0; int ccount=0; char k; // chi so vong for int index=0; if(!hPic) return; pPic=(char*)hPic; if(!pPic) return; for(j=1,pDong=pPic+1+MaxX;j

Ngày đăng: 06/04/2021, 18:27

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] “Nhập môn xử lý ảnh số”, Lương Mạnh Bá – Nguyễn Thanh Thủy, Nhà xuất bản Khoa Học Kỹ Thuật, 1999 Sách, tạp chí
Tiêu đề: Nhập môn xử lý ảnh số
Nhà XB: Nhà xuất bản Khoa Học Kỹ Thuật
[2] “ Nhận dạng chữ viết tay rời tiếng Việt”, luận án thạc sĩ, Phạm Đại Xuân, Đại học Khoa Học Tự Nhiên TPHCM Sách, tạp chí
Tiêu đề: Nhận dạng chữ viết tay rời tiếng Việt
[3] Galaxy Bansal Dharamveer Sharma, Isolated Handwritten Words Segmentation Techniques in Gurmukhi Script, ©2010 International Journal of Computer Applications (0975 - 8887), Volume 1 – No. 24 Khác
[4] Dharam Veer Sharma and Gurpreet Singh Lehal, An Iterative Algorithm for Segmentation of Isolated Handwritten Words in Gurmukhi Script, The 18th International Conference on Pattern Recognition (ICPR'06) Khác
[5] A Junction Based Segmentation Algorithm for Offline Handwritten Connected Character Segmentation of UKS Jayarathna GEMDC Bandara Department of Statistics and Computer Science, Faculty of Science, University of Peradeniya, Sri Lanka Khác
[6] Segmentation of Arabic Handwriting based on both Contour and Skeleton Segmentation Safwan Wshah, Zhixin Shi and Venu Govindaraju Department of Computer Science and Engineering University at Buffalo, Amherst, NY, USA Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w