TRONG BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Ngun, năm 2013
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
ĐẠI HỌC THÁI NGUN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THƠNG
Trang 2TRẦN THỊ HIẾU
LOGIC MỜ ỨNG DỤNG
TRONG BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY
Chun ngành: Khoa học máy tính Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS Vũ Vinh Quang
Thái Ngun, năm 2013
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ LỜI CẢM ƠN
Trước hết, tơi xin chân thành gửi lời TS
Quang, người đã tận tình hướng dẫn và tạo mọi điều kiện cho tơi trong q trình làm luận văn tốt nghiệp
Tơi xin chân thành cảm ơn các thầy, cơ giáo trong T, Viện cơng nghệ thơng tin thuộc Viện khoa học
và Cộng nghệ Việt Nam Các thầy, cơ ln giúp đỡ, tạo điều kiện cho tơi trong q trình học tập và làm luận văn tốt nghiêp
Tơi gửi lời cảm ơn đến các bạn đồng nghiệp, những người thân và bạn bè đã động viên, giúp đỡ và đóng góp nhiều ý kiến q báu cho tơi trong q trình học tập cũng như khi làm luận văn tốt nghiệp
Trong khoảng thời gian ngắn, với kiến thức của bản thân còn hạn chế nên
luận văn khơng tránh khỏi những thiếu sót về mặt khoa học, tơi rất mong nhận được những đóng góp ý kiến của các Thầy, cơ giáo cùng bạn bè để luận văn được hồn chỉnh hơn
Xin trân trọng cảm ơn! , tháng 7 năm 2013
Trang 3Học viên Trần Thị Hiếu
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ C
Trang
Chương 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 2 1.1 Các khái niệm cơ bản 2
1.2 Các phép tốn trên tập mờ 4 1.2.1 Phép giao 4
1.2.2 Phép hợp 5 1.2.3 Phép phủ định 7 1.3 Suy luận mờ 8
1.3.1 Ngun lý suy rộng và quan hệ mờ 8 1.3.2 Luật mờ 10
1.4 Điều khiển mờ (Fuzzy Control) 16
1.5 Nhận dạng mờ (Fuzzy Pattern Recornition) 19 1.5.1 Bài tốn nhận dạng 19
1.5.2 Phân nhóm và vai trò trong thực tế 20 Chương 2 LÝ THUYẾT NHẬN DẠNG ẢNH 21 2.1 Các khái niệm cơ bản 21
2.1.1 Khái niệm ảnh số 21 2.1.2 Phân loại ảnh số 21 2.1.3 Khái niệm mức xám đồ 22 2.2 Lý thuyết nhận dạng ảnh 22 2.2.1 Lý thuyết xử lý ảnh 2D 22 2.2.2 Nâng cao chất lượng ảnh 27 2.2.3 Phân loại ảnh và tìm biên ảnh 36 2.2.4 Quy trình nhận dạng ảnh 37
Chương 3 BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 43 3.1 Mơ hình bài tốn 43
3.2 Các bước tiến hành bài tốn nhận dạng chữ viết 44 Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 3.2.1 Thu nhận các mẫu dữ liệu 44
3.2.2 Tách mẫu và chuẩn hố 46
3.2.3 Xây dựng thư viện mẫu cho các ký tự 46
3.2.4 Hệ suy luận học cho bài tốn nhận dạng chữ viết tay 46 KẾT LUẬN 53
TÀI LIỆU THAM KHẢO 54
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ DANH MỤC HÌNH ẢNH
Trang
Hình 1.1: Một số hàm liên thuộc cơ bản 3
Hình 1.2 : Đồ thị minh hoạ ngun lý suy rộng mờ 9 Hình 1.3: Hàm liên thuộc của biến ngơn ngữ T(tuổi) 11 Hình 1.4: Mơ hình suy luận mờ với một luật-một tiên đề 14 Hình 1.5: Mơ hình suy luận mờ một luật-nhiều tiền đề 14 Hình 1.6 : Mơ hình suy luận mờ hai luật hai tiên đề 15
Trang 4Hình 1.7: Cấu trúc cơ bản của bộ điều khiển mờ 16 Hình 1.8: Cấu trúc cơ bản của hệ chun gia 17 Hình 1.9: Q trình nhận dạng 19
Hình 2.1 : Tốn tử tuyến tính 24 Hình 2.2: Mặt nạ bộ lọc tuyến tính 33
25
Hình 2.3 : Tốn tử điểm ảnh 26 Hình 2.4: Mơ hình nhiễu 27
Hình 2.5: Lọc ngược khơi phục ảnh ngun gốc 29 Hình 1.6: Một số các mặt nạ khơng gian trung bình 33 Hình 2.7: Mặt nạ lọc thơng thấp 33
Hình 2.8: Cửa sổ lọc giả trung vị 34 Hình 2.9: Phương pháp lưới 39 Hình 2.10: Phương pháp cung 40
Hình 2.11: Biểu diễn mẫu bằng tập kí hiệu 42
Hình 3.1 : Các cơng đoạn của bài tốn nhận dạng ảnh 44 Hình 3.2 : Ba mẫu chữ cần đọc 47
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 1
LỜI MỞ ĐẦU
Cơng nghệ tri thức là chun ngành tích hợp tri thức con người với các hệ
thống máy tính Các đặc tính tiêu biểu của các hệ thống dựa trên tri thức thể hiện ở việc xử lí chuyển trạng thái chứ khơng dựa vào thể hiện cứng nhắc của trạng thái Các quyết định về các xử lí dữ liệu cũng là một phần tri thức của hệ thống Lúc đó người ta đề cập nhiều đến tri thức thủ tục
Để giải vấn đề người ta tăng cường các thủ tục suy diễn với cơ chế kết hợp các luật với các lập luận logic Lập luận logic dùng để rút ra kết luận từ các sự kiện xem là đúng đắn
Ở các giai đoạn trước, việc truyền đạt cho máy ln cần thiết phải đảm bảo tính chính xác và duy nhất, điều này làm cho các thao tác của máy trở nên khơ cứng và tạo ra một khoảng cách rất xa giữa người và máy về “độ thơng minh” trong việc giải quyết các bài tốn kỹ thuật cũng như trong cuộc sống hàng ngày
Hai lĩnh vực quan trọng phải kể đến là lý thuyết về mạng nơron và logic mờ, chúng là chìa khố để tạo ra các hệ thống kỹ thuật vừa đảm bảo tính xác và nhanh chóng trong vận hành, vừa có khả năng học từ các mẫu dữ liệu thống kê, lại có khả năng thơng minh và mềm hố trong q trình ra quyết định
Đối với các cán bộ kỹ thuật trong ngành Điện tử viễn thơng, lý thuyết về xử lý tín hiệu trong đó có tín hiệu hình ảnh là những kiến thức khơng thể thiếu Nhận dạng ảnh, đặc biệt là nhận dạng ký tự cũng là một mảng đề tài đáng quan tâm Việc nhận dạng ký tự nhất là với chữ viết tay sẽ tiết kiệm rất nhiều thời gian cho viêc nhập và lưu trữ dữ liệu
Ý thức được vấn đề trên, tơi xin hồn thành luận văn tốt nghiệp với đề tài “Logic mờ ứng dụng trong bài tốn nhận dạng chữ viết tay” Nội dung đề tài gồm những vấn đề sau:
Chương 1: Logic mờ và bài tốn nhận dạng chữ viết tay Chương 2: Lý thuyết mờ và ứng dụng
Chương 3: Bài tốn nhận dạng chữ viết tay
Trang 5Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 2
Chương 1
LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY
Trong chương 1, luận văn đề cập đến các vấn đề sau: Một số khái niệm về logic mờ như: Các phép tốn trên tập mờ, Suy Luận Mờ, Điều khiển mờ (Fuzz Control), Nhận dạng mờ (Fuzzy Pattern Recornition), mơ hình của bài tốn nhận dang Trong chương này, luận văn đã tham khao một số tài liệu sau: [3], [4] , [6] và [7]
1.1 Các khái niệm cơ bản
Cơ sở của logic mờ là việc ánh xạ từ các biến x đầu vào thuộc tập A thành các biến y đầu ra thuộc tập B
Nói cách khác, giá trị x=a khơng được xác định rõ là có thuộc hay khơng
thuộc tập B, và khái niệm mờ được đưa ra để làm nền tảng cho logic mờ và điều khiển mờ sau này
Cơ chế cơ bản của logic mờ sau này có dạng là tập hợp các trạng thái nếu… thì hay còn gọi là những quy luật
Tập mờ được coi là phần mở rộng của tập kinh điển Nếu X là một khơng
gian nền (một tập nền) và những phần tử của nó được biểu thị bằng x, thì một tập mờ A trong X được xác định bởi một cặp các giá trị:
,A x x x XVới 01Ax(1.1) Trong đó µA
(x) được gọi là hàm liên thuộc của x trong A - viết tắt là MF
(Membership Function) Nó khơng còn là hàm hai giá trị như đối với tập kinh điển nữa, mà là một hàm với một tập các giá trị hay còn gọi là một ánh xạ Tức là, hàm liên thuộc ánh xạ mỗi một phần tử của X tới một giả trị liên thuộc trong khoảng [0,1]
Như vậy, kiến trúc của một tập mờ phụ thuộc vào hai yếu tố: khơng gian nền
và hàm liên thuộc phù hợp Sự đặc biệt của hàm thuộc là nó mang tính chủ quan với ý nghĩa là với cùng định nghĩa một khái niệm nhưng với mỗi người khác nhau thì hàm thuộc có thể xây được xây dựng khác nhau
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 3
Các hàm liên thuộc được xây dựng từ những hàm cơ bản như: Kết nối hành vi, hàm bậc nhất, hình thang, hình tam giác, hàm phân bố Gaussian, đường cong xichma, đường cong đa thức bậc hai và bậc ba Hình 1.1 dưới đây mơ tả một vài dạng hàm thuộc cơ bản:
0 20 40 60 80 1000
Do phu thuoc(a)MF hinh tam giac0 20 40 60 80 1000
0.2
Trang 6Do phu thuoc(b) MF hinh thang0 20 40 60 80 1000
Do phu thuoc(c) MF Gaussian0 20 40 60 80 1000
Do phu thuoc
(d) MF Generalized Bell
Hỡnh 1.1: Một số hàm liờn thuộc cơ bản
Cú rất nhiều sự lựa chọn rộng rói để chỳng ta cú thể lựa chọn hàm liờn thuộc ưa thớch Ngồi 11 hàm liờn thuộc ra, bộ cơng cụ logic mờ trong MATLAB cũng cho phộp chỳng ta tạo hàm liờn thuộc của chỡnh mỡnh nếu chỳng ta nhận thấy cỏc hàm liờn thuộc được định nghĩa sẵn là chưa đủ Nhưng với những hàm liờn thuộc ngoại lai này, khơng cú nghĩa là chắc chắn sẽ đưa ra được một hệ thống đầu ra mờ hồn hảo
Để biểu diễn một tập mờ, tựy thuộc vào khơng gian nền và hàm liờn thuộc là rời rạc hay liờn tục mà ta cú cỏc cỏch biểu diễn như sau:
i( ) /( ) /A i ixXAXxxAxx
Nếu X là tập hỵp các đối t-ỵng rời rạc Nếu X là không gian liên tơc
Phộp giao là một trong mấy phộp tốn logic cơ bản nhất Nú cũng là cơ sở
Trang 7định nghĩa phép giao của hai tập mờ Chúng ta cần xem xét các tiên đề sau: v(P
1OR P2
) chỉ phụ thuộc vào v(P1
), v(P2) Nếu v(P1
) = 1, thì v(P1
OR P2) = v(P2
), với mọi mệnh đề P2
Giao hốn: v(P1
OR P2) = v(P2OR P1) Nếu v(P1) )()(21PPvvthì )()(3221PPPPANDvANDvvới mọi mệnh đề P3.
Kết hợp: v(P1
AND (P2AND P3)) = v((P1AND P2) AND P3)
Điểm giao nhau của hai tập mờ A và B được xác định tổng qt bởi một
Trang 8ánh xạ nhị phân T, tập hợp của hai hàm liên thuộc sẽ là như sau: ,
A B A Bx T x x(1.3)
Điểm giao nhau của những phép tốn mờ thường được coi như những phép tốn tiêu chuẩn T (tiêu chuẩn tam giác), ta có những u cầu cơ bản sau: Tốn hạng chuẩn T là một ánh xạ bậc hai T(•) thỏa mãn:
Đường biên: T(0,0) = 0; T(a,1) = T(a,1) = a (1.4) Đơn điệu: T(a,b) T(c,d) nếu a c và d d (1.5) Giao hốn: T(a,b) = T(b,a) (1.6)
Kết hợp: T(a, T(b,c)) = T(T(a,b),c) (1.7)
u cầu đầu tiên tác động một cách khái qt tới những tập xoắn u cầu
thứ hai làm giảm những giá trị liên thuộc trong A hoặc B, khơng thể đưa ra kết quả làm tăng giá trị liên thuộc ở điểm giao A, B u cầu thứ ba chỉ ra rằng thứ tự của tốn hạng bên trong tập mờ là khơng khác nhau Cuối cùng, u cầu thứ tư cho phép chúng ta đưa ra điểm giao nhau của bất kỳ phần tử nào của tập ở bên trong thứ tự của từng cặp
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 5
Trên cơ sở đó, người ta thường sử dụng một số phép tốn giao thỏa mãn chuẩn T-norm như sau:
Min (Zadeh 1965): T(x,y) = min(x,y) (1.8) Dạng tích: T(x,y) = xy (1.9)
Chuẩn Lukasiewicz: T(x,y) = max{x + y – 1,0} (1.10) Min nilpotent:
min , 1T,0 1x y x yxyxy(1.11)
T chuẩn yếu nhất: min , max , =1,
0 max , 1x y x yZ x yxy(1.12)
Định lý 1 (Ling 1965) Một T-chuẩn T liên tục và Archimed khi và chỉ khi có một hàm
, liên tục, giảm chặt với f(1)=0 sao cho: 1
,T x y f f x f y
Trang 9Ở đây f(-1)
tựa ngược của f xác định bởi: f(-1)
(x)= f-1
(x) nếu x<f(0), và f
(φ(x).φ(y)) với mọi x,y [0,1] 1.2.2 Phép hợp
Giống như phép giao, phép hợp hay tốn tử logic OR thơng thường cần thoả mãn các tiên đề sau:
v(P1OR P2
) chỉ phụ thuộc vào v(P1
) và v(P2) Nếu v(P1
)=0 thì v(P1
OR P2)= v(P2
) với mọi mệnh đề P2
Giao hốn: v(P1
OR P2)= v(P2OR P1) Nếu v(P1) v(P2) thì v(P1OR P3) v(P2OR P3
) với bất kỳ P
Trang 103 nào
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 6
Kết hợp: v(P1
OR (P2OR P3)) = v((P1OR P2) OR P3)
Giống như điểm giao nhau mờ, phép tốn kết hợp phép mờ được xác định khái qt bằng một ánh xạ nhị phân S
µA B(x) = S[µA(x), µB
(x)] (1.13)
Những tốn hạng kết hợp mờ này thường được coi như những tốn hạng khơng tiêu chuẩn T(hoặc tiêu chuẩn S), chúng phải thỏa mãn những u cầu cơ bản sau: Tốn hạng khơng tiêu chuẩn T(hoặc tiêu chuẩn S) là một ánh xạ bậc hai S(•) thỏa mãn:
Đường biên: S(1,1) = 1; S(a,0) = s(0,a) = a (1.14) Đơn điệu: S(a,b) S(c,d) nếu a c và b d (1.15) Giao hốn: S(a,b) = S(b,a) (1.16)
1 min , 0x y x yxyxy(1.22)
Định lý biểu diễn
*Định nghĩa 2 : Cho S là T- đối chuẩn, khi ấy:
- S gọi là liên tục nếu đó là hàm liên tục trên miền xác định - S là Archimed nếu S(x,y) > x với mỗi 0 < x < 1
- S gọi là chặt nếu S là hàm tăng tại mỗi điểm (x,y) (0,1)2
Trang 11
*Định lý 2: S là T - đối chuẩn liên tục và Archimed khi và chỉ khi có một hàm liên tục, tăng chặt g: [0,1] [0, ] với g(0)=0, sao cho:
,S x y g g x g ymax , 1 S,1 1x y x yxyxy
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 7
Ở đây g(-1)
tựa hàm ngược g-1
của hàm g cho bởi biểu thức : g
(x) với x < g(1), còn g(-1)
Điều kiện biên: N(0) = 1 và N(1) = 0 Đơn điệu: N(A) N(B) nếu A B Chúng ta có một số tiên đề:
Hàm phủ định N(A) là phủ định chặt nếu nó là hàm liên tục và giảm chặt Hàm phủ định là mạnh nếu nó chặt và thoả mãn N(N(A))=A
Trên cơ sở đó, người ta thường sử dụng một số phép tốn phủ định như sau : Zadeh: N(x) = 1- x (1.23)
Sugeno: sxxxNS11)((1.24) Yager: Nw
(x) = (1-xw
)
Trang 121/w(1.25)
Định lý biểu diễn: Tìm các biểu diễn khác nhau của một tốn tử có thể là “thói
quen tốn học” Song chúng sẽ trở nên rất có ích khi chúng ta cần tìm những lớp mới trong vùng đang làm việc nhưng có thêm những tính chất mong muốn nào đó *Định nghĩa 3: Hàm φ: [a,b] gọi là một tự động cấu (automorphism) của đoạn [a,b] nếu nó là hàm liên tục, tăng chặt và φ(a)=a, φ(b)=b
*Định lý 4: (Ovchinnikov,Rouben,1991), Hàm N: [0,1] [0,1] là hàm phủ định mạnh khi có một tự đồng cấu φ của đoạn [0,1] sao cho:
1N x N x x
*Định lý 5: (Fodor 1993) Hàm n: [0,1] [0,1] là hàm phủ định chặt khi và chỉ khi có hai phép tự đồng cấu ψ,φ sao cho n(x)=ψ(1-φ(x))
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 8
1.3 Suy luận mờ
1.3.1 Ngun lý suy rộng và quan hệ mờ 1.3.1.1 Ngun lý suy rộng
Ngun lý suy rộng là một khái niệm cơ bản của lý thuyết mờ nhằm cung
cấp thuật tốn chung cho việc mở rộng các miền rõ của các phương trình tốn học thành các miền mờ Thuật tốn này sẽ tạo ra từ một ánh xạ trung điểm của một hàm f thành một ánh xạ giữa các tập mờ Đặc biệt hơn, giả sử f là một hàm số từ khơng gian X vào khơng gian Y và A là một tập mờ trên X được định nghĩa bởi:
A= µA(x1)/ x1 + µA(x2)/ x2 + … + µA(xn)/ xn
Ngun lý này suy rộng phát biểu rằng ảnh của tập mờ A dưới ánh xạ f là tập mờ B thỏa mãn như sau:
B = f(a) = µA
(x1)/ y1 + µA(x2)/ y2
Trang 13+ … + µA(xn)/ yn (1.26) Với yi= f(xi
), i= 1…n
Nói cách khác, tập mờ B có thể được xác định thơng qua các giá trị của hàm f tại x
1, x2,…, xn
Nếu f là ánh xạ nhiều - một thì tồn tại x1
, x2X, x1 x2 mà f(x1) = f(x2
)= y* , y* Y Trong trường hợp này mức độ phụ thuộc của B tại y = y* là mức độ phụ thuộc lớn nhất của A tại x=x
1 và x=x2
do vậy ta có: ))((max)()(
1xyAyfxB(1.27)
Tổng qt hơn giả sử hàm f là một ánh xạ tử khơng gian n chiều X1
x X2x … Xnx và A1, A2,… A1
Trang 14là n tập mờ trong X1
,X2,…Xn
thì ngun lý suy rộng phát
biểu rằng tập mờ B qua ánh xạ f là: oy
inn)(fneu 0
)(fneu )(minmax1-
),, ,)(,, ,(2121(1.28)
1-Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 9
-2 0 2-3-2-10123XYy = f(x)-2 0 200.20.40.60.81X
Do phu thuocA
0 0.5 1-3-2-10123
Do phu thuocY
Hình 1.2 : Đồ thị minh hoạ ngun lý suy rộng mờ
Trang 15Hình 1.2 minh họa ngun lý suy rộng mờ Đồ thị dưới cùng biểu diễn tập
mờ A, đồ thị phía trên bên trái biểu thị hàm y = f(x) và đồ thị bên phải là tập mờ B tạo thành qua ngun lý suy rộng
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/ 10
Cách diễn giải cuối “nếu x là A thì y là B” được lặp lại thường xun trong
hệ suy luận mờ Quan hệ mờ trong các khơng gian khác nhau có thể được kết hợp thơng qua phép hợp thành Có rất nhiều phép hợp thành khác nhau được sử dụng trong quan hệ mờ, nổi tiếng nhất là luật hợp thành max-min được phát minh bởi Zadeh
Gọi R1và R2
là hai quan hệ mờ trong khơng gian YX
và YX, luật hợp
thành Max-min của R1
và R2
là một tập mờ được xác định bởi: R
1º R2
={(x,z), max min[µR1
(x,y), µR2
(y,z)]| x X, y Y, z Z} (1.30) Hoặc tương đương µ
R1º R2
Trang 16(x,z) = max min [µR1
(x,y), µR2(y,z)] = ),(),(21zyyxRRy(1.31)
Với cách hiểu rằng và đại diện cho phép tốn Max và Min Khi R1
và R2
được biểu diễn dưới dạng ma trận, phép tính tốn R1
º R2
Kết hợp: R º (S º T) = (R º S) º T Phân phối với phép hợp: R º(S
T) = (R ºS)
(R ºT)
Phân phối với phép giao: R º(S
T) = (R ºS)
(R ºT)
Đơn điệu: S T => R º S R º T
Mặc dù luật hợp thành Max-Min được sử dụng rất rộng rãi nhưng nó khơng dễ dàng và chủ động trong các q trình kiểm tra tốn học, vì vậy luật hợp thành Max-Prod được đưa ra như là một cải tiến của luật hợp thành Max-Min: ),().,(minmax),(
2121RzyyxzxRRyoR(1.32)
1.3.2 Luật mờ
1.3.2.1 Biến ngơn ngữ
Một biến ngơn ngữ được đặc trưng bởi tập 5 yếu tố (x,T(x),X,G,M) trong đó
x là tên của biến; T(x) là tập hợp các thuật ngữ của x, nó là các giá trị ngơn ngữ hay thuật ngữ ngơn ngữ; X là khơng gian nền; G là luật cú pháp tạo ra các thuật ngữ Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
11