Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 82 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
82
Dung lượng
1,01 MB
Nội dung
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ ĐẠI HỌC THÁI NGUN TRƢỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THƠNG TRẦN THỊ HIẾU LOGIC MỜ ỨNG DỤNG TRONG BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Ngun, năm 2013 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ ĐẠI HỌC THÁI NGUN TRƢỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THƠNG TRẦN THỊ HIẾU LOGIC MỜ ỨNG DỤNG TRONG BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY Chun ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: TS. Vũ Vinh Quang Thái Ngun, năm 2013 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ LỜI CẢM ƠN Trước hết, tơi xin chân thành gửi lời TS. Quang, người đã tận tình hướng dẫn và tạo mọi điều kiện cho tơi trong q trình làm luận văn tốt nghiệp. Tơi xin chân thành cảm ơn các thầy, cơ giáo trong T , Viện cơng nghệ thơng tin thuộc Viện khoa học và Cộng nghệ Việt Nam. Các thầy, cơ ln giúp đỡ, tạo điều kiện cho tơi trong q trình học tập và làm luận văn tốt nghiêp. Tơi gửi lời cảm ơn đến các bạn đồng nghiệp, những người thân và bạn bè đã động viên, giúp đỡ và đóng góp nhiều ý kiến q báu cho tơi trong q trình học tập cũng như khi làm luận văn tốt nghiệp. Trong khoảng thời gian ngắn, với kiến thức của bản thân còn hạn chế nên luận văn khơng tránh khỏi những thiếu sót về mặt khoa học, tơi rất mong nhận được những đóng góp ý kiến của các Thầy, cơ giáo cùng bạn bè để luận văn được hồn chỉnh hơn. Xin trân trọng cảm ơn! , tháng 7 năm 2013 Học viên Trần Thị Hiếu Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ C Trang Chƣơng 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 2 1.1. Các khái niệm cơ bản 2 1.2. Các phép tốn trên tập mờ 4 1.2.1. Phép giao 4 1.2.2. Phép hợp 5 1.2.3. Phép phủ định 7 1.3. Suy luận mờ 8 1.3.1. Ngun lý suy rộng và quan hệ mờ 8 1.3.2. Luật mờ 10 1.4. Điều khiển mờ (Fuzzy Control) 16 1.5. Nhận dạng mờ (Fuzzy Pattern Recornition) 19 1.5.1. Bài tốn nhận dạng 19 1.5.2. Phân nhóm và vai trò trong thực tế 20 Chƣơng 2 LÝ THUYẾT NHẬN DẠNG ẢNH 21 2.1. Các khái niệm cơ bản 21 2.1.1. Khái niệm ảnh số 21 2.1.2. Phân loại ảnh số 21 2.1.3. Khái niệm mức xám đồ 22 2.2. Lý thuyết nhận dạng ảnh 22 2.2.1. Lý thuyết xử lý ảnh 2D 22 2.2.2. Nâng cao chất lượng ảnh 27 2.2.3. Phân loại ảnh và tìm biên ảnh 36 2.2.4. Quy trình nhận dạng ảnh 37 Chƣơng 3 BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 43 3.1. Mơ hình bài tốn 43 3.2 Các bước tiến hành bài tốn nhận dạng chữ viết 44 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 3.2.1 Thu nhận các mẫu dữ liệu 44 3.2.2 Tách mẫu và chuẩn hố. 46 3.2.3 Xây dựng thư viện mẫu cho các ký tự 46 3.2.4 Hệ suy luận học cho bài tốn nhận dạng chữ viết tay 46 KẾT LUẬN 53 TÀI LIỆU THAM KHẢO 54 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ DANH MỤC HÌNH ẢNH Trang Hình 1.1: Một số hàm liên thuộc cơ bản 3 Hình 1.2 : Đồ thị minh hoạ ngun lý suy rộng mờ 9 Hình 1.3: Hàm liên thuộc của biến ngơn ngữ T(tuổi) 11 Hình 1.4: Mơ hình suy luận mờ với một luật-một tiên đề 14 Hình 1.5: Mơ hình suy luận mờ một luật-nhiều tiền đề 14 Hình 1.6 : Mơ hình suy luận mờ hai luật hai tiên đề 15 Hình 1.7: Cấu trúc cơ bản của bộ điều khiển mờ 16 Hình 1.8: Cấu trúc cơ bản của hệ chun gia 17 Hình 1.9: Q trình nhận dạng 19 Hình 2.1 : Tốn tử tuyến tính 24 Hình 2.2: Mặt nạ bộ lọc tuyến tính 33 25 Hình 2.3 : Tốn tử điểm ảnh 26 Hình 2.4: Mơ hình nhiễu 27 Hình 2.5: Lọc ngược khơi phục ảnh ngun gốc. 29 Hình 1.6: Một số các mặt nạ khơng gian trung bình 33 Hình 2.7: Mặt nạ lọc thơng thấp 33 Hình 2.8: Cửa sổ lọc giả trung vị 34 Hình 2.9: Phương pháp lưới 39 Hình 2.10: Phương pháp cung 40 Hình 2.11: Biểu diễn mẫu bằng tập kí hiệu 42 Hình 3.1 : Các cơng đoạn của bài tốn nhận dạng ảnh 44 Hình 3.2 : Ba mẫu chữ cần đọc 47 Hình 3.3 : Ký tự cần nhận dạng 47 Hình 3.4: Giao diện chương trình nhận dạng 48 Hình 3.5: Vẽ chữ cần nhận dạng. 49 Hình 3.6: Kết quả nhận dạng sau khi vẽ chữ. 49 Hình 3.7: Mở file ảnh ký tự cần nhận dạng. 50 Hình 3.8: Giao diện sau khi mở file ảnh ký tự. 51 Hình 3.9: Kết quả sau khi nhận dạng ảnh ký tự 51 Hình 3.10: Ghi ký tự ra file ảnh 52 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 1 LỜI MỞ ĐẦU Cơng nghệ tri thức là chun ngành tích hợp tri thức con người với các hệ thống máy tính. Các đặc tính tiêu biểu của các hệ thống dựa trên tri thức thể hiện ở việc xử lí chuyển trạng thái chứ khơng dựa vào thể hiện cứng nhắc của trạng thái. Các quyết định về các xử lí dữ liệu cũng là một phần tri thức của hệ thống. Lúc đó người ta đề cập nhiều đến tri thức thủ tục. Để giải vấn đề người ta tăng cường các thủ tục suy diễn với cơ chế kết hợp các luật với các lập luận logic. Lập luận logic dùng để rút ra kết luận từ các sự kiện xem là đúng đắn. Ở các giai đoạn trước, việc truyền đạt cho máy ln cần thiết phải đảm bảo tính chính xác và duy nhất, điều này làm cho các thao tác của máy trở nên khơ cứng và tạo ra một khoảng cách rất xa giữa người và máy về “độ thơng minh” trong việc giải quyết các bài tốn kỹ thuật cũng như trong cuộc sống hàng ngày. Hai lĩnh vực quan trọng phải kể đến là lý thuyết về mạng nơron và logic mờ, chúng là chìa khố để tạo ra các hệ thống kỹ thuật vừa đảm bảo tính xác và nhanh chóng trong vận hành, vừa có khả năng học từ các mẫu dữ liệu thống kê, lại có khả năng thơng minh và mềm hố trong q trình ra quyết định. Đối với các cán bộ kỹ thuật trong ngành Điện tử viễn thơng, lý thuyết về xử lý tín hiệu trong đó có tín hiệu hình ảnh là những kiến thức khơng thể thiếu. Nhận dạng ảnh, đặc biệt là nhận dạng ký tự cũng là một mảng đề tài đáng quan tâm. Việc nhận dạng ký tự nhất là với chữ viết tay sẽ tiết kiệm rất nhiều thời gian cho viêc nhập và lưu trữ dữ liệu. Ý thức được vấn đề trên, tơi xin hồn thành luận văn tốt nghiệp với đề tài “Logic mờ ứng dụng trong bài tốn nhận dạng chữ viết tay”. Nội dung đề tài gồm những vấn đề sau: Chƣơng 1: Logic mờ và bài tốn nhận dạng chữ viết tay. Chƣơng 2: Lý thuyết mờ và ứng dụng. Chƣơng 3: Bài tốn nhận dạng chữ viết tay . Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 2 Chƣơng 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY Trong chương 1, luận văn đề cập đến các vấn đề sau: Một số khái niệm về logic mờ như: Các phép tốn trên tập mờ, Suy Luận Mờ, Điều khiển mờ (Fuzz Control), Nhận dạng mờ (Fuzzy Pattern Recornition), mơ hình của bài tốn nhận dang. Trong chương này, luận văn đã tham khao một số tài liệu sau: [3], [4] , [6] và [7]. 1.1. Các khái niệm cơ bản Cơ sở của logic mờ là việc ánh xạ từ các biến x đầu vào thuộc tập A thành các biến y đầu ra thuộc tập B. Nói cách khác, giá trị x=a khơng được xác định rõ là có thuộc hay khơng thuộc tập B, và khái niệm mờ được đưa ra để làm nền tảng cho logic mờ và điều khiển mờ sau này. Cơ chế cơ bản của logic mờ sau này có dạng là tập hợp các trạng thái nếu… thì hay còn gọi là những quy luật. Tập mờ được coi là phần mở rộng của tập kinh điển. Nếu X là một khơng gian nền (một tập nền) và những phần tử của nó được biểu thị bằng x, thì một tập mờ A trong X được xác định bởi một cặp các giá trị: ,A x x x X Với 01 A x (1.1) Trong đó µ A (x) được gọi là hàm liên thuộc của x trong A - viết tắt là MF (Membership Function). Nó khơng còn là hàm hai giá trị như đối với tập kinh điển nữa, mà là một hàm với một tập các giá trị hay còn gọi là một ánh xạ. Tức là, hàm liên thuộc ánh xạ mỗi một phần tử của X tới một giả trị liên thuộc trong khoảng [0,1]. Như vậy, kiến trúc của một tập mờ phụ thuộc vào hai yếu tố: khơng gian nền và hàm liên thuộc phù hợp. Sự đặc biệt của hàm thuộc là nó mang tính chủ quan với ý nghĩa là với cùng định nghĩa một khái niệm nhưng với mỗi người khác nhau thì hàm thuộc có thể xây được xây dựng khác nhau. Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 3 Các hàm liên thuộc được xây dựng từ những hàm cơ bản như: Kết nối hành vi, hàm bậc nhất, hình thang, hình tam giác, hàm phân bố Gaussian, đường cong xichma, đường cong đa thức bậc hai và bậc ba. Hình 1.1 dưới đây mơ tả một vài dạng hàm thuộc cơ bản: 0 20 40 60 80 100 0 0.2 0.4 0.6 0.8 1 Do phu thuoc (a)MF hinh tam giac 0 20 40 60 80 100 0 0.2 0.4 0.6 0.8 1 Do phu thuoc (b) MF hinh thang 0 20 40 60 80 100 0 0.2 0.4 0.6 0.8 1 Do phu thuoc (c) MF Gaussian 0 20 40 60 80 100 0 0.2 0.4 0.6 0.8 1 Do phu thuoc (d) MF Generalized Bell Hình 1.1: Một số hàm liên thuộc cơ bản Có rất nhiều sự lựa chọn rộng rãi để chúng ta có thể lựa chọn hàm liên thuộc ưa thích. Ngồi 11 hàm liên thuộc ra, bộ cơng cụ logic mờ trong MATLAB cũng cho phép chúng ta tạo hàm liên thuộc của chình mình nếu chúng ta nhận thấy các hàm liên thuộc được định nghĩa sẵn là chưa đủ. Nhưng với những hàm liên thuộc ngoại lai này, khơng có nghĩa là chắc chắn sẽ đưa ra được một hệ thống đầu ra mờ hồn hảo. Để biểu diễn một tập mờ, tùy thuộc vào khơng gian nền và hàm liên thuộc là rời rạc hay liên tục mà ta có các cách biểu diễn như sau: i ( ) / ( ) / A i i xX A X xx A xx NÕu X lµ tËp hỵp c¸c ®èi t-ỵng rêi r¹c NÕu X lµ kh«ng gian liªn tơc (1.2) Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 4 1.2. Các phép tốn trên tập mờ Tương tự như các tập kinh diển, những phép tốn cơ bản trên tập mờ là phép hợp, phép giao và phép phủ định cũng được định nghĩa thơng qua hàm liên thuộc. 1.2.1. Phép giao Phép giao là một trong mấy phép tốn logic cơ bản nhất. Nó cũng là cơ sở định nghĩa phép giao của hai tập mờ. Chúng ta cần xem xét các tiên đề sau: v(P 1 OR P 2 ) chỉ phụ thuộc vào v(P 1 ), v(P 2 ). Nếu v(P 1 ) = 1, thì v(P 1 OR P 2 ) = v(P 2 ), với mọi mệnh đề P 2 Giao hốn: v(P 1 OR P 2 ) = v(P 2 OR P 1 ) Nếu v(P 1 ) )()( 21 PP vv thì )()( 3221 PPPP ANDvANDv với mọi mệnh đề P 3. Kết hợp: v(P 1 AND (P 2 AND P 3 )) = v((P 1 AND P 2 ) AND P 3 ) Điểm giao nhau của hai tập mờ A và B được xác định tổng qt bởi một ánh xạ nhị phân T, tập hợp của hai hàm liên thuộc sẽ là như sau: , A B A B x T x x (1.3) Điểm giao nhau của những phép tốn mờ thường được coi như những phép tốn tiêu chuẩn T (tiêu chuẩn tam giác), ta có những u cầu cơ bản sau: Tốn hạng chuẩn T là một ánh xạ bậc hai T(•) thỏa mãn: Đường biên: T(0,0) = 0; T(a,1) = T(a,1) = a (1.4) Đơn điệu: T(a,b) T(c,d) nếu a c và d d (1.5) Giao hốn: T(a,b) = T(b,a) (1.6) Kết hợp: T(a, T(b,c)) = T(T(a,b),c) (1.7) u cầu đầu tiên tác động một cách khái qt tới những tập xoắn. u cầu thứ hai làm giảm những giá trị liên thuộc trong A hoặc B, khơng thể đưa ra kết quả làm tăng giá trị liên thuộc ở điểm giao A, B. u cầu thứ ba chỉ ra rằng thứ tự của tốn hạng bên trong tập mờ là khơng khác nhau. Cuối cùng, u cầu thứ tư cho phép chúng ta đưa ra điểm giao nhau của bất kỳ phần tử nào của tập ở bên trong thứ tự của từng cặp. [...]... giải mờ (a defuzzifier) Nếu đầu ra sau cơng đoạn giải mờ khơng phải là một tín hiệu điều khiển (thường gọi là tín hiệu điều chỉnh) thì chúng ta có mơt hệ quyết định dựa trên cơ sở logic mờ Mơ tơ Suy diễn Mờ hóa Đối tượng Giải mờ Cơ sở luật mờ Hình 1.7: Cấu trúc cơ bản của bộ điều khiển mờ Ứng dụng Ứng dụng đầu tiên của điều khiển mờ phải kể đến của nhóm Mandani và Assilian năm 1974 Từ đấy phạm vi ứng dụng. .. khó xác định Một nhận xét cũng nên để ý là tính mờ khơng chỉ trong khơng gian dữ liệu mà còn nằm trong khơng gian các đặc tả và trong các thuật tốn phân lớp 1.5.2 Phân nhóm và vai trò trong thực tế Hiện nay các chun gia đang nghiên cứu về nhận dạng mờ có thể chia theo 4 nhóm đề tài chính: - Nhận dạng tĩnh các đối tượng 3 chiều, có mầu - Nhận dạng động các đối tượng 3 chiều có mầu - Nhận dạng theo cơng... 1981, Pedrrycz năm 1990 hay là Bezdek và Pal năm 1992), và đã ứng dụng thành cơng trong xử lý ảnh (nhận dạng chữ viết tay) , nhận dạng tiếng nói, robot thơng minh, nhận dạng các đối tượng hình học… Dữ liệu Thu gọn số chiều Biến đổi Thuật tốn quyết định Kết quả Khơng gian pattern Khơng gian đặc tả Khơng gian phân lớp Hình 1.9: Q trình nhận dạng Bây giờ ta nói thêm về một số khái niệm : - Dữ liệu (data)... lý suy rộng mờ Hình 1.2 minh họa ngun lý suy rộng mờ Đồ thị dưới cùng biểu diễn tập mờ A, đồ thị phía trên bên trái biểu thị hàm y = f(x) và đồ thị bên phải là tập mờ B tạo thành qua ngun lý suy rộng 1.3.1.2 Quan hệ mờ Quan hệ hai ngơi mờ là một tập mờ trong khơng gian X Y ánh xạ mỗi phần tử thuộc khơng gian này vào một mức độ phụ thuộc giữa 0 và 1 nó có ứng dụng rất lớn trong điều khiển mờ và ra quyết... bắt và phân tích tri thức - Về các hệ mờ EDFRAME/CADIAG- IV, 1996, Fuzzy KBWean, 1998 và Fuzzy-ARDS 1999 đang sử dụng tại Viên cộng hồ Áo Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 19 1.5 Nhận dạng mờ (Fuzzy Pattern Recornition) 1.5.1 Bài tốn nhận dạng Nhiều thơng tin hằng ngày chúng ta cần thu nhận và xử lý nhiều khi có hình dạng phức tạp Bộ mơn nhận dạng cung cấp cho chúng ta một số phương... Intelligence) sử dụng các trí thức chun biệt để giải quyết bài tốn ở giai đoạn dùng các chun gia- con người Chúng phát triển vào những năm 1970 và được ứng dụng trong khá nhiều lĩnh vực Ngày nay đối với hệ chun gia thì thực chất hiểu là các hệ thống trong đó có sử dụng Cơng nghệ hệ chun gia (Expert System Techology) bao gồm các ngơn ngữ hệ chun gia chun dụng, các chư ng trình và cả các phần cứng được thiết... Cấu trúc luật Một luật nếu-thì mờ (còn gọi là luật mờ, phép kéo theo mờ, hoặc câu điều kiện mờ) thường có dạng: IF THEN Trong đó A,B là các giá trị ngơn ngữ được xác định bởi các tập mờ trong khơng gian nền X và Y Thơng thường “x là A” được gọi là tiên đề hay giả thuyết, còn “y là B” được gọi là kết quả hay kết luận Các ví dụ của luật nếu-thì mờ rộng khắp trong các diễn giải ngơn ngữ... 9.1 8.7 http://lrc.tnu.edu.vn/ 21 Chƣơng 2 LÝ THUYẾT NHẬN DẠNG ẢNH Trong chư ng 2, luận văn đề cập tới những vấn đề sau: Các khái niệm cơ bản bao gồm: Khái niệm ảnh số, Phân loại ảnh số, Khái niệm mức xám đồ Lý thuyết nhận dạng ảnh gồm: Lý thuyết xử lý ảnh 2D, Nâng cao chất lượng ảnh, Phân loại ảnh và tìm biên ảnh, Lý thuyết nhận dạng ảnh Trong chư ng này, luận văn đã tham khao một số tài liệu [1]... cấu trúc chính và một số nét cơ bản của hình dạng đó Cách tiếp cận chính với các bài tốn nhận dạng là: Phân lớp tuyến tính, tiếp cận thống kê, lý thuyết mờ, các perceptrons, phân lớp cơ sở tri thức dựa vào kỹ thuật của trí tuệ nhân tạo Nghĩ tới việc tiếp cận lý thuyết mờ là hồn tồn tự nhiên vì hình dạng quan sát được, các thơng tin nhận được thường rất mờ Một số kết quả đã được cơng bố (ví dụ: Bezdek... một quan hệ hai ngơi mờ trong khơng gian X Y Quan hệ hai ngơi mờ thường được mơ tả dưới các dạng sau: x gần với y (x,y là các số) x phụ thuộc vào y (x,y là các sự kiện) x và y giống nhau(x,y là người vật…) Nếu x lớn thì y nhỏ Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 10 Cách diễn giải cuối “nếu x là A thì y là B” được lặp lại thường xun trong hệ suy luận mờ Quan hệ mờ trong các khơng gian . tài Logic mờ ứng dụng trong bài tốn nhận dạng chữ viết tay . Nội dung đề tài gồm những vấn đề sau: Chƣơng 1: Logic mờ và bài tốn nhận dạng chữ viết tay. Chƣơng 2: Lý thuyết mờ và ứng dụng. . dụng. Chƣơng 3: Bài tốn nhận dạng chữ viết tay . Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 2 Chƣơng 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY Trong chư ng 1, luận văn. biên ảnh 36 2.2.4. Quy trình nhận dạng ảnh 37 Chƣơng 3 BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 43 3.1. Mơ hình bài tốn 43 3.2 Các bước tiến hành bài tốn nhận dạng chữ viết 44 Số hóa bởi Trung tâm