Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/2 Chương 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY Trong chương 1, luận văn đề cập đến các vấn đề sau: Một số khái niệm về logic
Trang 1Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THƠNG
TRẦN THỊ HIẾU
LOGIC MỜ ỨNG DỤNG TRONG BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên, năm 2013
Trang 2Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THƠNG
TRẦN THỊ HIẾU
LOGIC MỜ ỨNG DỤNG TRONG BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS Vũ Vinh Quang
Thái Nguyên, năm 2013
Trang 3Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
LỜI CẢM ƠN
Trước hết, tơi xin chân thành gửi lời TS
Quang, người đã tận tình hướng dẫn và tạo mọi điều kiện cho tơi trong quá trình làm luận
văn tốt nghiệp
Tơi xin chân thành cảm ơn các thầy, cơ giáo trong T
, Viện cơng nghệ thơng tin thuộc Viện khoa học
và Cộng nghệ Việt Nam Các thầy, cơ luơn giúp đỡ, tạo điều kiện cho tơi trong quá trình học tập và làm luận văn tốt nghiêp
Tơi gửi lời cảm ơn đến các bạn đồng nghiệp, những người thân và bạn bè đã động viên, giúp đỡ và đĩng gĩp nhiều ý kiến quý báu cho tơi trong quá trình học tập cũng như khi làm luận văn tốt nghiệp
Trong khoảng thời gian ngắn, với kiến thức của bản thân cịn hạn chế nên luận văn khơng tránh khỏi những thiếu sĩt về mặt khoa học, tơi rất mong nhận được những đĩng gĩp ý kiến của các Thầy, cơ giáo cùng bạn bè để luận văn được hồn chỉnh hơn
Xin trân trọng cảm ơn!
, tháng 7 năm 2013 Học viên
Trần Thị Hiếu
Trang 4Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
C
Trang Chương 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 2
1.1 Các khái niệm cơ bản 2
1.2 Các phép tốn trên tập mờ 4
1.2.1 Phép giao 4
1.2.2 Phép hợp 5
1.2.3 Phép phủ định 7
1.3 Suy luận mờ 8
1.3.1 Nguyên lý suy rộng và quan hệ mờ 8
1.3.2 Luật mờ 10
1.4 Điều khiển mờ (Fuzzy Control) 16
1.5 Nhận dạng mờ (Fuzzy Pattern Recornition) 19
1.5.1 Bài tốn nhận dạng 19
1.5.2 Phân nhĩm và vai trị trong thực tế 20
Chương 2 LÝ THUYẾT NHẬN DẠNG ẢNH 21
2.1 Các khái niệm cơ bản 21
2.1.1 Khái niệm ảnh số 21
2.1.2 Phân loại ảnh số 21
2.1.3 Khái niệm mức xám đồ 22
2.2 Lý thuyết nhận dạng ảnh 22
2.2.1 Lý thuyết xử lý ảnh 2D 22
2.2.2 Nâng cao chất lượng ảnh 27
2.2.3 Phân loại ảnh và tìm biên ảnh 36
2.2.4 Quy trình nhận dạng ảnh 37
Chương 3 BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 43
3.1 Mơ hình bài tốn 43
3.2 Các bước tiến hành bài tốn nhận dạng chữ viết 44
Trang 5Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
3.2.1 Thu nhận các mẫu dữ liệu 44
3.2.2 Tách mẫu và chuẩn hố 46
3.2.3 Xây dựng thư viện mẫu cho các ký tự 46
3.2.4 Hệ suy luận học cho bài tốn nhận dạng chữ viết tay 46
KẾT LUẬN 53
TÀI LIỆU THAM KHẢO 54
Trang 6Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
DANH MỤC HÌNH ẢNH
Trang
Hình 1.1: Một số hàm liên thuộc cơ bản 3
Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ 9
Hình 1.3: Hàm liên thuộc của biến ngơn ngữ T(tuổi) 11
Hình 1.4: Mơ hình suy luận mờ với một luật-một tiên đề 14
Hình 1.5: Mơ hình suy luận mờ một luật-nhiều tiền đề 14
Hình 1.6 : Mơ hình suy luận mờ hai luật hai tiên đề 15
Hình 1.7: Cấu trúc cơ bản của bộ điều khiển mờ 16
Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia 17
Hình 1.9: Quá trình nhận dạng 19
Hình 2.1 : Tốn tử tuyến tính 24
Hình 2.2: Mặt nạ bộ lọc tuyến tính 3 3 25
Hình 2.3 : Tốn tử điểm ảnh 26
Hình 2.4: Mơ hình nhiễu 27
Hình 2.5: Lọc ngược khơi phục ảnh nguyên gốc 29
Hình 1.6: Một số các mặt nạ khơng gian trung bình 33
Hình 2.7: Mặt nạ lọc thơng thấp 33
Hình 2.8: Cửa sổ lọc giả trung vị 34
Hình 2.9: Phương pháp lưới 39
Hình 2.10: Phương pháp cung 40
Hình 2.11: Biểu diễn mẫu bằng tập kí hiệu 42
Hình 3.1 : Các cơng đoạn của bài tốn nhận dạng ảnh 44
Hình 3.2 : Ba mẫu chữ cần đọc 47
Hình 3.3 : Ký tự cần nhận dạng 47
Hình 3.4: Giao diện chương trình nhận dạng 48
Hình 3.5: Vẽ chữ cần nhận dạng 49
Hình 3.6: Kết quả nhận dạng sau khi vẽ chữ 49
Hình 3.7: Mở file ảnh ký tự cần nhận dạng 50
Hình 3.8: Giao diện sau khi mở file ảnh ký tự 51
Hình 3.9: Kết quả sau khi nhận dạng ảnh ký tự 51
Hình 3.10: Ghi ký tự ra file ảnh 52
Trang 7Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
1
LỜI MỞ ĐẦU
Cơng nghệ tri thức là chuyên ngành tích hợp tri thức con người với các hệ thống máy tính Các đặc tính tiêu biểu của các hệ thống dựa trên tri thức thể hiện ở việc xử lí chuyển trạng thái chứ khơng dựa vào thể hiện cứng nhắc của trạng thái Các quyết định về các xử lí dữ liệu cũng là một phần tri thức của hệ thống Lúc đĩ người ta đề cập nhiều đến tri thức thủ tục
Để giải vấn đề người ta tăng cường các thủ tục suy diễn với cơ chế kết hợp các luật với các lập luận logic Lập luận logic dùng để rút ra kết luận từ các sự kiện xem là đúng đắn
Ở các giai đoạn trước, việc truyền đạt cho máy luơn cần thiết phải đảm bảo tính chính xác và duy nhất, điều này làm cho các thao tác của máy trở nên khơ cứng và tạo ra một khoảng cách rất xa giữa người và máy về “độ thơng minh” trong việc giải quyết các bài tốn kỹ thuật cũng như trong cuộc sống hàng ngày
Hai lĩnh vực quan trọng phải kể đến là lý thuyết về mạng nơron và logic mờ, chúng là chìa khố để tạo ra các hệ thống kỹ thuật vừa đảm bảo tính xác và nhanh chĩng trong vận hành, vừa cĩ khả năng học từ các mẫu dữ liệu thống kê, lại cĩ khả năng thơng minh và mềm hố trong quá trình ra quyết định
Đối với các cán bộ kỹ thuật trong ngành Điện tử viễn thơng, lý thuyết về xử
lý tín hiệu trong đĩ cĩ tín hiệu hình ảnh là những kiến thức khơng thể thiếu Nhận dạng ảnh, đặc biệt là nhận dạng ký tự cũng là một mảng đề tài đáng quan tâm Việc nhận dạng ký tự nhất là với chữ viết tay sẽ tiết kiệm rất nhiều thời gian cho viêc nhập và lưu trữ dữ liệu
Ý thức được vấn đề trên, tơi xin hồn thành luận văn tốt nghiệp với đề tài
“Logic mờ ứng dụng trong bài tốn nhận dạng chữ viết tay” Nội dung đề tài
Trang 8Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
2
Chương 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY
Trong chương 1, luận văn đề cập đến các vấn đề sau: Một số khái niệm về logic mờ như: Các phép tốn trên tập mờ, Suy Luận Mờ, Điều khiển mờ (Fuzz Control), Nhận dạng mờ (Fuzzy Pattern Recornition), mơ hình của bài tốn nhận dang Trong chương
này, luận văn đã tham khao một số tài liệu sau: [3], [4] , [6] và [7]
1.1 Các khái niệm cơ bản
Cơ sở của logic mờ là việc ánh xạ từ các biến x đầu vào thuộc tập A thành các biến y đầu ra thuộc tập B
Nĩi cách khác, giá trị x=a khơng được xác định rõ là cĩ thuộc hay khơng thuộc tập B, và khái niệm mờ được đưa ra để làm nền tảng cho logic mờ và điều khiển mờ sau này
Cơ chế cơ bản của logic mờ sau này cĩ dạng là tập hợp các trạng thái nếu… thì hay cịn gọi là những quy luật
Tập mờ được coi là phần mở rộng của tập kinh điển Nếu X là một khơng gian nền (một tập nền) và những phần tử của nĩ được biểu thị bằng x, thì một tập
mờ A trong X được xác định bởi một cặp các giá trị:
,
Trong đĩ µA(x) được gọi là hàm liên thuộc của x trong A - viết tắt là MF (Membership Function) Nĩ khơng cịn là hàm hai giá trị như đối với tập kinh điển nữa, mà là một hàm với một tập các giá trị hay cịn gọi là một ánh xạ Tức
là, hàm liên thuộc ánh xạ mỗi một phần tử của X tới một giả trị liên thuộc trong khoảng [0,1]
Như vậy, kiến trúc của một tập mờ phụ thuộc vào hai yếu tố: khơng gian nền
và hàm liên thuộc phù hợp Sự đặc biệt của hàm thuộc là nĩ mang tính chủ quan với
ý nghĩa là với cùng định nghĩa một khái niệm nhưng với mỗi người khác nhau thì hàm thuộc cĩ thể xây được xây dựng khác nhau
Trang 9Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/
3
Cỏc hàm liờn thuộc được xõy dựng từ những hàm cơ bản như: Kết nối hành
vi, hàm bậc nhất, hỡnh thang, hỡnh tam giỏc, hàm phõn bố Gaussian, đường cong xichma, đường cong đa thức bậc hai và bậc ba Hỡnh 1.1 dưới đõy mụ tả một vài dạng hàm thuộc cơ bản:
0 0.2 0.4 0.6 0.8 1
Hỡnh 1.1: Một số hàm liờn thuộc cơ bản
Cú rất nhiều sự lựa chọn rộng rói để chỳng ta cú thể lựa chọn hàm liờn thuộc
ưa thớch Ngoài 11 hàm liờn thuộc ra, bộ cụng cụ logic mờ trong MATLAB cũng cho phộp chỳng ta tạo hàm liờn thuộc của chỡnh mỡnh nếu chỳng ta nhận thấy cỏc hàm liờn thuộc được định nghĩa sẵn là chưa đủ Nhưng với những hàm liờn thuộc ngoại lai này, khụng cú nghĩa là chắc chắn sẽ đưa ra được một hệ thống đầu ra mờ hoàn hảo
Để biểu diễn một tập mờ, tựy thuộc vào khụng gian nền và hàm liờn thuộc là rời rạc hay liờn tục mà ta cú cỏc cỏch biểu diễn như sau:
i
( ) /( ) /
A i i
x X
A X
A
Nếu X là tập hợp các đối t-ợng rời rạc
Trang 10Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
Kết hợp: v(P1 AND (P2 AND P3)) = v((P1 AND P2) AND P3)
Điểm giao nhau của hai tập mờ A và B được xác định tổng quát bởi một ánh xạ nhị phân T, tập hợp của hai hàm liên thuộc sẽ là như sau:
,
Điểm giao nhau của những phép tốn mờ thường được coi như những phép tốn tiêu chuẩn T (tiêu chuẩn tam giác), ta cĩ những yêu cầu cơ bản sau:
Tốn hạng chuẩn T là một ánh xạ bậc hai T(•) thỏa mãn:
Đường biên: T(0,0) = 0; T(a,1) = T(a,1) = a (1.4)
Đơn điệu: T(a,b) T(c,d) nếu a c và d d (1.5)
Giao hốn: T(a,b) = T(b,a) (1.6)
Kết hợp: T(a, T(b,c)) = T(T(a,b),c) (1.7)
Yêu cầu đầu tiên tác động một cách khái quát tới những tập xoắn Yêu cầu thứ hai làm giảm những giá trị liên thuộc trong A hoặc B, khơng thể đưa ra kết quả làm tăng giá trị liên thuộc ở điểm giao A, B Yêu cầu thứ ba chỉ ra rằng thứ tự của tốn hạng bên trong tập mờ là khơng khác nhau Cuối cùng, yêu cầu thứ tư cho phép chúng ta đưa ra điểm giao nhau của bất kỳ phần tử nào của tập ở bên trong thứ tự của từng cặp
Trang 11Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
Chuẩn Lukasiewicz: T(x,y) = max{x + y – 1,0} (1.10)
Min nilpotent: T , min , 1
a Một hàm T-chuẩn T gọi là liên tục nếu T là hàm liên tục trên [0,1]2
b Hàm T gọi là Archimed nếu T(x,x) < x với mọi 0<x<1
c Hàm T gọi là chặt nếu T tăng chặt trên (0,1)2
Định lý 1 (Ling 1965) Một T-chuẩn T liên tục và Archimed khi và chỉ khi cĩ một hàm f : 0,1 0, , liên tục, giảm chặt với f(1)=0 sao cho:
T x y, f 1 f x f y
Ở đây f(-1) tựa ngược của f xác định bởi: f(-1)
(x)= f-1(x) nếu x<f(0), và
f(-1)(x)=0 trong các trường hợp khác
Định lý 2 (Schweizer and Sklar 1983) T là một T-chuẩn liên tục và chặt khi
và chỉ khi tồn tại một tự đồng cấu φ của đoạn [0,1] sao cho
T(x,y)= φ-1(φ(x).φ(y)) với mọi x,y [0,1]
Trang 12Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
Đường biên: S(1,1) = 1; S(a,0) = s(0,a) = a (1.14)
Đơn điệu: S(a,b) S(c,d) nếu a c và b d (1.15)
Giao hốn: S(a,b) = S(b,a) (1.16)
*Định nghĩa 2 : Cho S là T- đối chuẩn, khi ấy:
- S gọi là liên tục nếu đĩ là hàm liên tục trên miền xác định
- S là Archimed nếu S(x,y) > x với mỗi 0 < x < 1
- S gọi là chặt nếu S là hàm tăng tại mỗi điểm (x,y) (0,1)2
*Định lý 2: S là T - đối chuẩn liên tục và Archimed khi và chỉ khi cĩ một hàm liên tục, tăng chặt g: [0,1] [0, ] với g(0)=0, sao cho:
1,
Trang 13Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
7
Ở đây g(-1)
tựa hàm ngược g-1 của hàm g cho bởi biểu thức :
g(-1)(x)=g-1(x) với x < g(1), cịn g(-1)(x)=1, trong các trường hợp khác
*Định lý 3: Mỗi T- đối chuẩn S liên tục là chặt khi và chỉ khi cĩ một tự đồng cấu φ: [0,1] [0,1] sao cho:
Điều kiện biên: N(0) = 1 và N(1) = 0
Đơn điệu: N(A) N(B) nếu A B
N S
1
1)
Yager: N w (x) = (1-x w ) 1/w (1.25)
Định lý biểu diễn: Tìm các biểu diễn khác nhau của một tốn tử cĩ thể là “thĩi quen tốn học” Song chúng sẽ trở nên rất cĩ ích khi chúng ta cần tìm những lớp mới trong vùng đang làm việc nhưng cĩ thêm những tính chất mong muốn nào đĩ
*Định nghĩa 3: Hàm φ: [a,b] gọi là một tự động cấu (automorphism) của đoạn [a,b] nếu nĩ là hàm liên tục, tăng chặt và φ(a)=a, φ(b)=b
*Định lý 4: (Ovchinnikov,Rouben,1991), Hàm N: [0,1] [0,1] là hàm phủ định mạnh khi cĩ một tự đồng cấu φ của đoạn [0,1] sao cho:
1
1
*Định lý 5: (Fodor 1993) Hàm n: [0,1] [0,1] là hàm phủ định chặt khi và chỉ khi cĩ hai phép tự đồng cấu ψ,φ sao cho n(x)=ψ(1-φ(x))
Trang 14Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
8
1.3 Suy luận mờ
1.3.1 Nguyên lý suy rộng và quan hệ mờ
1.3.1.1 Nguyên lý suy rộng
Nguyên lý suy rộng là một khái niệm cơ bản của lý thuyết mờ nhằm cung cấp thuật tốn chung cho việc mở rộng các miền rõ của các phương trình tốn học thành các miền mờ Thuật tốn này sẽ tạo ra từ một ánh xạ trung điểm của một hàm
f thành một ánh xạ giữa các tập mờ Đặc biệt hơn, giả sử f là một hàm số từ khơng gian X vào khơng gian Y và A là một tập mờ trên X được định nghĩa bởi:
A= µ A (x 1 )/ x 1 + µ A (x 2 )/ x 2 + … + µ A (x n )/ x n
Nguyên lý này suy rộng phát biểu rằng ảnh của tập mờ A dưới ánh xạ f là tập
mờ B thỏa mãn như sau:
Với y i = f(x i ), i= 1…n
Nĩi cách khác, tập mờ B cĩ thể được xác định thơng qua các giá trị của hàm
f tại x 1 , x 2 ,…, x n Nếu f là ánh xạ nhiều - một thì tồn tại x 1 , x 2 X, x 1 x 2 mà f(x 1 ) =
độ phụ thuộc lớn nhất của A tại x=x1 và x=x2 do vậy ta cĩ:
)) ( ( max )
(
) (
y f x
Tổng quát hơn giả sử hàm f là một ánh xạ tử khơng gian n chiều X1 x X2 x
biểu rằng tập mờ B qua ánh xạ f là:
o y
o y
x i A i x
x x x x x B
i n
n
) ( f neu
0 ) ( f neu ) ( min max 1 -1 -) , ,
, )( , ,
,
(1.28)
Trang 15Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
9
-3 -2 -1 0 1 2 3
Do phu thuoc
B
Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ
Hình 1.2 minh họa nguyên lý suy rộng mờ Đồ thị dưới cùng biểu diễn tập
mờ A, đồ thị phía trên bên trái biểu thị hàm y = f(x) và đồ thị bên phải là tập mờ B tạo thành qua nguyên lý suy rộng
1.3.1.2 Quan hệ mờ
Quan hệ hai ngơi mờ là một tập mờ trong khơng gian X Yánh xạ mỗi phần
tử thuộc khơng gian này vào một mức độ phụ thuộc giữa 0 và 1 nĩ cĩ ứng dụng rất lớn trong điều khiển mờ và ra quyết định
Cho X và Y là hai khơng gian nền thì:
là một quan hệ hai ngơi mờ trong khơng gian X Y
Quan hệ hai ngơi mờ thường được mơ tả dưới các dạng sau:
x gần với y (x,y là các số)
x phụ thuộc vào y (x,y là các sự kiện)
x và y giống nhau(x,y là người vật…)
Nếu x lớn thì y nhỏ
Trang 16Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
10
Cách diễn giải cuối “nếu x là A thì y là B” được lặp lại thường xuyên trong
hệ suy luận mờ Quan hệ mờ trong các khơng gian khác nhau cĩ thể được kết hợp thơng qua phép hợp thành Cĩ rất nhiều phép hợp thành khác nhau được sử dụng trong quan hệ mờ, nổi tiếng nhất là luật hợp thành max-min được phát minh bởi Zadeh
Gọi R1 và R2 là hai quan hệ mờ trong khơng gian X Y và X Y , luật hợp thành Max-min của R1 và R2 là một tập mờ được xác định bởi:
Hoặc tương đương
µ R1º R2 (x,z) = max min [µ R1 (x,y), µ R2 (y,z)] = y R1(x,y) R2(y,z)
(1.31)
Với cách hiểu rằng và đại diện cho phép tốn Max và Min Khi R1 và
R2 được biểu diễn dưới dạng ma trận, phép tính tốn R1º R2 gần giống như phép nhân ma trận ngoại trừ phép x và + được thay thế bằng phép và đĩ chính là lý
do để ta gọi là luật hợp thành Max-Min
Dưới đây là một số tính chất chung của quan hệ mờ hai ngơi và phép hợp thành Max-Min, với R,S,T là các quan hệ hai ngơi trên khơng gian X Y, Y Z, Z W:
Kết hợp: R º (S º T) = (R º S) º T Phân phối với phép hợp: R º(S T) = (R ºS) (R ºT)
Phân phối với phép giao: R º(S T) = (R ºS) (R ºT)
Đơn điệu: S T => R º S R º T
Mặc dù luật hợp thành Max-Min được sử dụng rất rộng rãi nhưng nĩ khơng
dễ dàng và chủ động trong các quá trình kiểm tra tốn học, vì vậy luật hợp thành Max-Prod được đưa ra như là một cải tiến của luật hợp thành Max-Min:
R1oR 2(x,z) maxymin R1(x,y). R2(y,z)
(1.32)
1.3.2 Luật mờ
1.3.2.1 Biến ngơn ngữ
Một biến ngơn ngữ được đặc trưng bởi tập 5 yếu tố (x,T(x),X,G,M) trong đĩ
x là tên của biến; T(x) là tập hợp các thuật ngữ của x, nĩ là các giá trị ngơn ngữ hay thuật ngữ ngơn ngữ; X là khơng gian nền; G là luật cú pháp tạo ra các thuật ngữ
Trang 17Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
Hình 1.3: Hàm liên thuộc của biến ngơn ngữ T(tuổi)
Mỗi thuật ngữ trong T(tuổi) được đặc trưng bởi một tập mờ trong khơng gian nền X=[0,100] Thơng thường chúng ta dùng “tuổi trẻ” để gán giá trị “trẻ” cho biến tuổi Ngược lại khi tuổi được xem như là giá trị số chúng ta sử dụng phương trình
“tuổi=20” Luật cú pháp nĩi lên cách mà giá trị ngơn ngữ trong tập thuật ngữ T(tuổi) được gán Luật ngữ nghĩa xác định hàm thuộc của mỗi giá trị ngơn ngữ trong tập thuật ngữ Từ ví dụ trên ta thấy, tập các thuật ngữ bao gồm một vài thuật ngữ chính (trẻ, trung niên, già) được biến đổi bới các phép phủ định (khơng), các trạng từ (rất, hơn, khá ) và các liên từ ( và, hoặc)
1.3.2.2 Cấu trúc luật
Một luật nếu-thì mờ (cịn gọi là luật mờ, phép kéo theo mờ, hoặc câu điều kiện mờ) thường cĩ dạng:
IF <X là A> THEN <Y là B>
Trong đĩ A,B là các giá trị ngơn ngữ được xác định bởi các tập mờ trong khơng gian nền X và Y Thơng thường “x là A” được gọi là tiên đề hay giả thuyết, cịn “y là B” được gọi là kết quả hay kết luận Các ví dụ của luật nếu-thì mờ rộng khắp trong các diễn giải ngơn ngữ hàng ngày như:
Nếu áp suất cao thì thể tích nhỏ
Trang 18Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
12
Nếu đường trơn thì việc lái xe rất nguy hiểm
Nếu quả cà chua màu đỏ thì nĩ chín
Luật nếu-thì mờ thường được viết tắt dưới dạng A =>B miêu tả quan hệ giữa hai biến x và y, điều này cho thấy rằng luật nếu-thì mờ xác định một quan hệ hai ngơi R trên khơng gian tích XxY
Nĩi chung cĩ hai cách diễn dịch luật mờ A =>B Nếu ta diễn dịch
Trong đĩ *~ là phép tốn T-norm
Ngược lại nếu A=> B được diễn dịch là A kéo theo B thì phương trình cĩ thể được viết dưới 4 cơng thức khác nhau như sau:
Mặc dù 4 cơng thức trên cĩ hình thức khác nhau nhưng chúng đều trở về
dạng các định quen thuộc R = A B = A B khi A và B là hai giá trị logic Dựa
trên hai cách diễn dịch và các phép tốn T-chuẩn và S chuẩn, một số phương pháp hiệu quả được thành lập để tính tốn quan hệ mờ R = A B Tất cả các phương pháp này đề sử dụng phép kéo theo
Phép kéo theo (Implication) là một hàm số I:[0,1]2
[0,1] thỏa mãn các điều kiện sau:
Nếu x z thì I(x,y) I(z,y) với mọi y [0,1]
Nếu y u thì I(x,y) I(x,u) với mọi x [0,1]
Trang 19Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
13
Dạng kéo theo thứ nhất: IS1(x,y) = S(n(x),y) (1.38)
Dạng kéo theo thứ hai: IS2 = S(T(x,y),n(x)) (1.39)
Giả thiết 1 (sự kiện): x là A
Giả thiết 2 (luật): Nếu x là A thì y là B
Suy diễn (kết luận): y là B
Tuy nhiên, trong suy diễn của con người, luật modus ponens được sử dụng theo cách thức xấp xỉ điều này được minh họa như sau :
Giả thiết 1 (sự kiện): x là A’
Giả thiết 2 (luật): Nếu x là A thì y là B
Suy diễn (kết luận): y là B’
Trong đĩ A’ gần với A và B’ gần với B Khi A, B, A’, B’ là các tập mờ trên các khơng gian nền tương ứng thì thuật tốn trên được gọi là suy luận xấp xỉ hay suy diễn mờ Sử dụng luật hợp thành mờ đã nêu ở trên ta cĩ thể thành lập thuật tốn suy diễn mờ như sau:
Gọi A, A’ và B là các tập mờ trên khơng gian X, X và Y Giả thiết phép kéo theo mờ A B được diễn giải như một quan hệ mờ trên khơng gian XxY thì tập mờ
B suy ra từ “ x là A” và luật mờ “nếu x là A thì y là B” được xác định bởi:
hay tương đương:
Các trường hợp cĩ thể cĩ của phép suy diễn mờ bao gồm:
Trang 20Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
14
1.4.3.1 Suy diễn với một luật với một tiên đề
Hình 1.4: Mơ hình suy luận mờ với một luật-một tiên đề
Đây là trường hợp đơn giản nhất như đã được minh họa ở trên Biến đổi ta cĩ:
A
1.4.3.2 Suy luận một luật với nhiều tiên đề
Một luật nếu … thì mờ với hai tiên đề thường được viết dưới dạng: “nếu x là
A và y là B thì z là C” và được minh họa như sau :
Giả thiết 1 (sự kiện): x là A’ và y là B’
Giả thiết 2 (luật): Nếu x là A và y là B thì z là C
Suy diễn (kết luận): z là C’
Luật mờ trong giả thiết 2 cĩ thể đưa về dạng : AxB C từ đĩ ta tính được:
)()
()()]
()([)]
()([
)]
()()([)]
()([)
(
2 1 ,
' '
' '
'
z w
w z y
y x
x
z y
x y
x z
C C
B B
y A
A x
C B
A B
A y x
Hình 1.5: Mơ hình suy luận mờ một luật-nhiều tiền đề
Trang 21Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
15
Ta lại cĩ:
)()
(
)()()()
()()
(
) ( ' )
( '
' '
, '
y y
z y
x y
x z
C B o B C
A o A
C B
A B
A y x C
(1.45)
Từ cơng thức trên ta thấy rằng, kết quả C’ cĩ thể được xem như giao của 2 biểu thức C1’ = A’ º(A C) và C2’ = B’ º(B C) Mỗi một biểu thức liên quan đến phép suy diễn mờ trong trường hợp một luật mờ và 1 tiêu đề đã xét ở trên
1.4.3.3 Nhiều luật mờ với nhiều tiên đề
Sự suy diễn của luật mờ phức hợp được tiến hành như hợp của các quan hệ
mờ tương ứng với luật mờ Do vậy ta cĩ:
Giả thiết 1 ( Sự kiện ): x là A’ và y là B’
Giả thiết 2 ( Luật ): nếu x là A1 và y là B1 thì z là C1
Giả thiết 3 ( Luật ): nếu x là A2 và y là B2 thì z là C2
Suy diễn ( kết luận ): z là C’
Chúng ta cĩ thể sử dụng suy diễn mờ được trình bày trong hình vẽ 1.7 dưới đây như một thuật tốn suy luận để tìm được kết quả của tập mờ đầu ra C’
Hình 1.6 : Mơ hình suy luận mờ hai luật hai tiên đề
Để xác định thuật tốn suy diễn mờ, gọi R1 A1xB1 C1và R2 A2xB2 C2
Do phép hợp thành Max-Min º cĩ tính chất phân phối với phép nên:
Trang 22Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
Cơ sở luật mờ
Suy diễn
tượng
Trang 23Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
17
Trong số những ứng dụng thực sự thành cơng trong thực tiễn cịn phải nhắc đến bộ FLC dùng trong quản lý sân bay (Clymer,1992) các hệ thống điều khiển đường sắt và hệ thống cần cẩu Container (Yasunobu và Miyamoto,1985) một ứng dụng rất hay của điều khiển mờ là hệ điều khiển “The Camera Tracking Control Systems” của Nasa 1992,…
Chúng ta cũng khơng thể khơng nhắc tới các máy mĩc được dùng trong gia đình dùng FLC đang bán trên thị trường thế giới: Máy điều hồ nhiệt độ - Mishubitshi, máy giặt Hitachi, các Video Camera của Sanyo, T4i Camera Cannon- Máy hút bụi lị sấy của Microware Ovent- Toshiba…
Các hệ chuyên gia mờ (Fuzzy Expert Systems)
Các hệ chuyên gia (Expert System) là một nhánh của bộ mơn Trí tuệ nhân tạo (Artifical Intelligence) sử dụng các trí thức chuyên biệt để giải quyết bài tốn ở giai đoạn dùng các chuyên gia- con người Chúng phát triển vào những năm 1970
và được ứng dụng trong khá nhiều lĩnh vực Ngày nay đối với hệ chuyên gia thì
thực chất hiểu là các hệ thống trong đĩ cĩ sử dụng Cơng nghệ hệ chuyên gia
(Expert System Techology) bao gồm các ngơn ngữ hệ chuyên gia chuyên dụng, các
chương trình và cả các phần cứng được thiết kế nhằm vận hành và phát triển hệ chuyên gia
Hiện nay trong các sách báo người ta thường dùng từ đồng nghĩa là “Hệ
chuyên gia trên cơ sở tri thức” (Knowledge- Based Expert System) Sau đây là cấu
trúc cơ bản của hệ chuyên gia:
Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia
Lý thuyết mờ và logic mờ cĩ nhiều ưu điểm trong biểu diễn tri thức của các chuyên gia Cho nên việc đưa các luật mờ và đặc biệt là biến ngơn ngữ và hàm
Người
dùng
Giao diện Đối thoại Điều chỉnh tri thức
Cơ sở tri thức
Mơ tơ suy diễn
Trang 24Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
18
thuộc đã xuất hiện khá sớm Các hệ chuyên gia trình bày dưới đây đã sử dụng các luật mờ (fuzzy rules)
Tên/ tác giả/ năm Lĩnh vực
CADIAG-2, Adlassnig et al.,1985 Y (internal medicine)
EMERGE, Hudson, Cohen, 1988 Phân tích đau ngực
ESP, Zlmmermann, 1989 Kế hoạch mức chiến lược
FAULT, Whalen et al., 1987 Kế tốn
OPAL, Bensana et al., 1988 Lập lịch cơng tác
Thực tiễn đã dẫn tới cần phối hợp tốt hơn hai loại cơng nghệ này, đĩ là nhu cầu về nghiên cứu các hệ chuyên gia mờ (fuzzy expert systems) Những nghiên cứu sau đây là ví dụ:
- FESS- một hệ chuyên gia mờ tái sử dụng, Hall và Kandell, 1993
- Hệ chuyên gia mờ cĩ mục đích tổng quát, Schneider và Kandel, 1994
- Những khung cho hệ chuyên gia mờ, Umano, Hatono và Tamura (fuzzy expert systems shells), 1994
- Cơng trình của Whalen và Schott, 1992 Tạo ra mạng suy diễn ngơn ngữ
mờ ( Fuzzy linguistic interence network generator)
Chúng ta khơng khĩ khăn khi chỉ ra các ứng dụng thực tiễn của hệ chuyên gia mờ Sau đây là một vài ví dụ:
- Von Altrorck và Krause đã phát triển hệ chuyên gia mờ giành cho cơng nghiệp ơtơ của MecrCedes-Benz của Cộng hồ liên bang Đức,1994
- Hệ Emerge của Hudsson và Cohen 1992 là hệ chuyên gia y học trên cơ sở các luật mờ trợ giúp cho phịng cấp cứu và đưa ra lời chỉ dẫn về kiểm tra các hiện tượng đau
- Hệ EAR của Lĩpez de Mántaras et al, dành cho việc chuẩn đốn y học, cịn hệ FLING của Whalen và Schott năm 1992 thì trợ giúp cho việc nắm bắt và phân tích tri thức
- Về các hệ mờ EDFRAME/CADIAG- IV, 1996, Fuzzy KBWean, 1998 và Fuzzy-ARDS 1999 đang sử dụng tại Viên cộng hồ Áo
Trang 25Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
lý thuyết mờ, các perceptrons, phân lớp cơ sở tri thức dựa vào kỹ thuật của trí tuệ nhân tạo
Nghĩ tới việc tiếp cận lý thuyết mờ là hồn tồn tự nhiên vì hình dạng quan sát được, các thơng tin nhận được thường rất mờ Một số kết quả đã được cơng bố (ví dụ: Bezdek năm 1981, Pedrrycz năm 1990 hay là Bezdek và Pal năm 1992), và
đã ứng dụng thành cơng trong xử lý ảnh (nhận dạng chữ viết tay), nhận dạng tiếng
nĩi, robot thơng minh, nhận dạng các đối tượng hình học…
Hình 1.9: Quá trình nhận dạng
Bây giờ ta nĩi thêm về một số khái niệm :
- Dữ liệu (data) thu được từ quá trình vật lý hoặc là các hiện tượng Dữ liệu (theo nghĩa rộng) cĩ thể ở dạng định tính định lượng, dạng số, hình, hay một đoạn văn, ngơn ngữ hay tổ hợp các dạng trên
- Khơng gian các dáng (Pattern Space) cịn được gọi là cấu trúc (Structure) đĩ
là tập các dáng vẻ, kiểu dáng, trong đĩ thơng tin được tổ chức sao cho chúng cĩ thể gĩp phần phát hiện mối liên hệ giữa các biến Nĩi chung số chiều của khơng gian các dáng cần ít hơn số chiều của khơng gian dữ liệu
Dữ liệu Biến đổi Thu gọn số chiều Thuật tốn quyết định Kết quả
Khơng gian pattern
Trang 26Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
20
- Khơng gian các đặc tả (Feature Space) là khơng gian nằm giữa khơng gian
dữ liệu và khơng gian phân lớp Nĩi chung số chiều của khơng gian đặc tả phải ít hơn nhiều số chiều khơng gian dữ liệu Vấn đề khĩ khăn là chọn những đặc tả nào cho đủ phản ánh những nét quan trọng nhất của đối tượng Khơng gian phân lớp dĩ nhiên phải chứa được các lớp mà người nghiên cứu muốn phân Tuy nhiên thực chất
cĩ bao nhiêu lớp phân biệt thì nhiều khi ngay từ đầu cũng khĩ xác định
Một nhận xét cũng nên để ý là tính mờ khơng chỉ trong khơng gian dữ liệu
mà cịn nằm trong khơng gian các đặc tả và trong các thuật tốn phân lớp
1.5.2 Phân nhĩm và vai trị trong thực tế
Hiện nay các chuyên gia đang nghiên cứu về nhận dạng mờ cĩ thể chia theo
4 nhĩm đề tài chính:
- Nhận dạng tĩnh các đối tượng 3 chiều, cĩ mầu
- Nhận dạng động các đối tượng 3 chiều cĩ mầu
- Nhận dạng theo cơng nghệ hiển thị (Visual Ricogition) các đối tượng 3 chiều cĩ màu
- Nhận dạng động các biểu hiện của con người(Human Expressions)
Ai cũng hiểu được tầm quan trọng của các vấn đề nhận dạng các đối tượng động 3 chiều trong quốc phịng an ninh, ngành viễn thám Nhưng ngay đối với ngành dân sự độ quan trọng của đề tài này cũng được phản ảnh qua bảng tổng kết sau cuộc thăm dị ý kiến của hơn 200 chuyên gia hang đầu về cơng nghệ mờ được tiến hành (1989) bởi 2 giáo sư A Ishakawwa và T.L Willson (Các con số ghi trong bảng tính theo % của các ý kiến )
Đề tài Độ quan trọng
Cao Trung Bình Thấp
1 Nhận dạng tĩnh dùng cơng nghệ mờ
- Các hệ robot sản xuất dùng cơng nghệ hiển thị
-Các hệ theo dõi tự động dùng cơng nghệ hiển thị
- Các hệ vận tải robot dùng cơng nghệ hiển thị
2.Nhận dạng động dùng cơng nghệ mờ
-Các hệ robot sản xuất dùng cơng nghệ hiển thị
-Các hệ theo dõi tự động dùng cơng nghệ hiển thị
84.0 80.8 42.9
81.8 78.3
16.0 19.2 47.6
9.1 13.0
0
0 9.5 9.1 8.7
Trang 27Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
2.1 Các khái niệm cơ bản
2.1.1 Khái niệm ảnh số
Ảnh trong thực tế là một ảnh liên tục về khơng gian và giá trị cường độ sáng
Để cĩ thể xử lý ảnh bằng máy tính người ta cần thiết phải số hố ảnh Trong quá trình số hố, ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thơng qua quá trình lấy mẫu (rời rạc hố về khơng gian) và lượng hố thành phần giá trị mà về nguyên tắc bằng mắt thường khơng phân biệt được hai điểm gần nhau Một ảnh sẽ là một tập hợp các phần tử ảnh (Picture Element) hay cịn gọi là Pixel
Như vậy, ảnh số là một tập hợp các điểm ảnh Khi được số hố, nĩ thường được biểu diễn bởi một mảng hai chiều I(n,p) với n là số dịng và p là số cột Ta nĩi ảnh gồm n x p Pixels Người ta thường ký hiệu I(x,y) để chỉ một pixel I chính là giá trị cường độ ánh sáng của điểm ảnh tại Pixel đĩ Thường giá trị n chọn bằng p và bằng 256 Ảnh cĩ thể được biểu diễn với các độ phân giải khác nhau Một pixel cĩ thể được lưu trữ trên 1, 4, 8 hay 24 bit tuỳ thuộc vào cường độ sáng cần phân biệt của ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đĩ
2.1.2 Phân loại ảnh số
Người ta thường chia ảnh số ra làm ba loại chính là:
Ảnh đen trắng: mỗi phần tử ảnh nhận một trong hai giá trị tương ứng với hai mức sáng đen và trắng (cịn gọi là ảnh nhị phân)
Ảnh xám (ảnh đa mức xám): Các phần tử ảnh chứa thơng số về cường độ ánh đã được mã hố thành N mức(8, 256 hoặc nhiều hơn) tương ứng với 3 bit, 8 bit
Trang 28Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
8 bit, 16 bit hoặc 24 bit để mã hố
Như vậy ảnh mầu là ảnh mang thơng tin về đối tượng đầy đủ nhất so với ảnh đen trắng và ảnh xám Tuy nhiên tất cả cách biểu diễn này đều chỉ là sự mơ phỏng
hệ màu trong tự nhiên Thực tế thì một ảnh màu được phân biệt qua 3 thuộc tính là
độ chĩi (Brighness), sắc thái màu (Hue), và độ bão hồ (Saturation) Tuy nhiên với khả năng cảm nhận của mắt người thì cách biểu diễn ảnh dưới dạng cấu trúc 3 màu RBG chất lượng ảnh thu được cĩ thể chấp nhận được
( thường N= 255) Trục tung y biểu diễn số điểm ảnh trong ảnh ứng với mức xám tương
ứng trên trục hồnh Như vậy ta cĩ thể biểu diễn mức xám đồ bằng hàm y=f(x) với f(x) là một hàm rời rạc cĩ giá trị bằng số điểm ảnh trong ảnh cĩ mức xám x
tử ảnh g[m,n], như vậy ở đây ta đã áp dụng lý thuyết xử lý tín hiệu số trong một khơng gian hai chiều thay vì khơng gian một chiều như thơng thường
Trang 29Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
23
Một hệ thống xử lý ảnh sẽ tiếp nhận ảnh số g[m,n] và đưa ra ảnh đã được xử
lý g’[m,n] Trên phương diện xử lý tín hiệu số thì chức năng của hệ thống này sẽ được đặc trưng bằng hàm truyền đạt H của nĩ Ta cĩ thể thể hiện mối quan hệ này như sau:
'[ , ] ( [ , ])
Đối với khơng gian 2D ta cũng cĩ các cách tiếp cận khác nhau để khảo sát hệ thống Cách thứ nhất cĩ thể khảo sát trực tiếp trên miền khơng gian điểm ảnh [m,n] Những tác động của hàm truyền H sẽ được tính tốn trực tiếp với các điểm ảnh Một số cơng cụ cơ bản thường được sử dụng là tốn tử điểm ảnh, tích chập hay các bộ lọc
Cách tiếp cận thứ hai của hệ thống xử lý số 2D là biến đổi tín hiệu sang một miền khơng gian khác và thực hiện khảo sát trong miền khơng gian đĩ Sau khi khảo sát xong ở miền khơng gian này ta lại biến đổi ngược để đưa tín hiệu về miền khơng gian điểm ảnh Việc biến đổi tín hiệu sang xử lý ở một miền khơng gian khác là nhằm làm nổi bật các đặc tính của tín hiệu nhằm làm cho việc phân tích và xử lý thuận tiện hơn.Trong lý thuyết xử lý tín hiệu số ta cĩ thể thực hiện biến đổi về miền khơng gian thời gian hay miền khơng gian tần số nhằm thực hiện các xử lý thích hợp
Dưới đây chúng ta sẽ tiến hành xem xét một số các khái niệm cơ bản trong một hệ thống xử lý số tín hiệu hai chiều
2.2.1.1 Khảo sát trực tiếp trong miền khơng gian điểm ảnh
Đáp ứng xung:
Tương tự như trong khơng gian một chiều, trong khơng gian 2D ta cũng cĩ khái niệm về xung đơn vị như sau Xung đơn vị δ[m,n] được định nghĩa theo cơng thức:
0nm, khi 0
0n0,m khi 1
, n
m
(2.2) Đáp ứng xung của một hệ thống chính là tín hiệu đầu ra khi tín hiệu đầu vào
là xung đơn vị Như vậy đáp ứng xung h[m,n] của hệ thống cĩ thể định nghĩa như sau:
Trang 30Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
24
Với một dịch chuyển [α,β] ta cĩ đáp ứng xung h[m,n; α,β] (được gọi là hàm
phân tán điểm- PSF: Point Spread Function) như sau:
Tích chập trong miền khơng gian tuyến tính bất biến thể hiện mối quan hệ
đầu ra, đầu vào của hệ thống và đáp ứng xung h[m,n] được cho bởi cơng thức sau:
Trang 31Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
25
Tích chập hai ma trận h[m,n] với g[m,n] cho ma trận g’[m,n] Kích thước của ma trận g’[m,n] là P Q với P= M+K – L cịn Q = N+L-1
mn mo
n n
pq po
q q
f f
f
f f
f
f f
f
h h h
g g
g g
g g
1
11 10
0
01 00
33 32 31
23 22 21
13 12 11
p1
1
11 10
0
01 00
*h h
h h
h h
g
g
g
số bộ lọc với mục đích tách các chi tiết của ảnh để xử lý riêng
Trong miền khơng gian điểm ảnh, bộ lọc thường sử dụng là một mặt nạ di chuyển khắp mặt phẳng ảnh Tâm của cửa sổ mặt nạ sẽ là điểm chịu tác động lọc, giá trị của các điểm lân cận trong mặt nạ sẽ cĩ ảnh hưởng đến giá trị ra của điểm trung tâm Tùy theo quan hệ giá trị ra của điểm trung tâm với giá trị của các điểm lân cận mà ta chia thành hai bộ lọc tuyến tính và phi tuyến
+ Lọc tuyến tính:
Điểm trung tâm của mặt nạ sẽ cĩ giá trị bằng tổng số trọng số của các điểm thuộc mặt nạ ( bao gồm giá trị của chính bản thân nĩ) Tổng này là một tổ hợp tuyến tính của các điểm lân cận Chính vì thế mà nĩ được gọi là lọc tuyến tính Giả sử ta xét một mặt nạ lọc 3 3
W1 W2 W3 W4 W5 W6 W7 W8 W9
Hình 2.2: Mặt nạ bộ lọc tuyến tính 3 3
Điểm trung tâm của mặt nạ p 5 sẽ được tính tốn theo cơng thức sau:
P 5 =W 1 P 1 + W 2 P 2 + W 3 P 3 + W 4 P 4 + W 5 P 5 + W 6 P 6 + W 7 P 7 + W 8 P 8 + W 9 P 9 (2.8)
Trang 32Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
26
Ở đây, các giá trị P1….P9 là các giá trị của các điểm ảnh nằm trong vùng ma trận 3 3hiện thời, W1 … W9 là giá trị các trọng số của các phần tử trong bộ lọc + Lọc phi tuyến:
Bộ lọc phi tuyến cũng tương tự bộ lọc tuyến tính Tuy nhiên đối với lọc phi tuyến thì giá trị ra của điểm trung tâm khơng phải là tổ hợp tuyến tính của các điểm lân cận mà nĩ biểu diễn bởi một hàm phi tuyến
Tốn tử điểm ảnh:
Phần trên đã xét một số các phép biến đổi tác động lên khơng gian điểm ảnh nhằm biến đổi ảnh Bây giờ ta sẽ xét đến phép biến đổi tác động lên từng điểm ảnh để biến đổi giá trị cường độ của nĩ Hàm biến đổi như vậy gọi là hàm tốn tử điểm ảnh
Tác động của tốn tử điểm ảnh cĩ thể được mơ tả như sau: Giả sử giá trị
cường độ sáng của điểm ảnh ban đầu g[m,n] là u và giá trị cường độ sáng của điểm ảnh sau khi biến đổi g’[m,n] là v và gọi hàm tốn tử điểm ảnh là T thì:
Với N là số mức cường độ sáng của ảnh trước khi biến đổi g[m,n] Hàm T cĩ thể là một hàm tuyến tính hoặc phi tuyến
Tốn tử điểm ảnh cĩ thể coi như hoạt động giống như một bản tra LUT (look
up table) với N cột tra Nĩ thực hiện phép biến đổi nhanh giữa các giá trị u và các giá trị v mà khơng cần phải tính tốn Tương ứng với mỗi giá trị u vào sẽ cĩ một giá trị v ra Điều này làm cho quá trình biến đổi ảnh nhanh hơn rất nhiều
Trang 33Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
27
2.2.1.2 Thực hiện phép biến đổi khơng gia
Phép biến đổi khơng gian như trên đã nĩi là nhằm đưa tín hiệu biểu diễn sang một vùng khơng gian mới mà tại khơng gian đĩ các đặc trưng của tín hiệu sẽ thể hiện rõ hơn và bởi vậy mà giúp cho quá trình xử lý thuận tiện hơn
Trong kỹ thuật xử lý ảnh, ta thường dùng phép biến đổi Fourier để đưa tín hiệu ảnh về miền khơng gian tần số Sau khi xử lý ta lại dùng biến đổi Fourier ngược để đưa tín hiệu quay về khơng gian điểm ảnh Hai phép biến đổi Fourier thường được sử dụng nhiều là biến đổi Fourier rời rạc và biến đổi Fourier nhanh
2.2.2 Nâng cao chất lƣợng ảnh
2.2.2.1.Khơi phục ảnh
Nhiễu và mơ hình nhiễu:
Ảnh được coi là một miền đồng nhất về mức xám, tức là các điểm ảnh lân cận cĩ sự biến đổi liên tục về mức xám.Như vậy sau quá trình số hĩa thì trong mỗi cửa sổ đang xét các điểm ảnh đều cĩ giá trị gần bằng như nhau Thực tế quan sát cĩ điểm ảnh cĩ giá trị khác hơn nhiều so với các điểm ảnh khác Đĩ chính là nhiễu Như vậy, nhiễu trong ảnh số được xem như là sự dịch chuyển đột ngột của tín hiệu thu nhận trên một khoảng cách nhỏ
g(x,y)
Tín hiệu nhiễu η(x,y)
Tín hiệu ảnh g’(x,y)
Trang 34Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
28
+ Mơ hình rời rạc:
Trên cơ sở mơ hình nhiễu liên tục, ta cĩ thể xây dựng một mơ hình nhiễu rời
rạc tương ứng với ảnh số Khi đĩ g(x,y) sẽ chuyển thành ảnh rời rạc g[m,n], ảnh liên
tục g’(x,y) sẽ chuyển thành ma trận điểm ảnh g’[m,n] và nhiễu cũng phân bố rời rạc
tại các điểm ảnh η[m,n] Giả sử H là hàm tuyến tính bất biến trong phạm vi M N(
Các tín hiệu nhiễu thường được chia thành các loại chính như sau:
Nhiễu do thiết bị thu nhận ảnh là loại nhiễu gây ra do giới hạn nhiễu xạ và
quang sai của thấu kính, nhiễu do bộ phận cảm quang, ảnh mờ nhịe do ống kính,
nhiễu do rung động trong quá trình thu nhận
Nhiễu ngẫu nhiên độc lập là các loại nhiễu gây ra do ảnh hưởng của mơi
trường xung quanh, do ảnh hưởng của khí quyển
Nhiễu do vật quan sát Đây là nhiễu gây ra do bề mặt của bản thân vật cĩ độ
nhám gồ ghề Chính nhiễu này gây hiện tượng tán xạ của các tia đơn sắc và sinh ra
hiện tượng nhiễu lốm đốm
Thường người ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất biến
vì cĩ nhiều cơng cụ tuyến tính cĩ thể giải quyết vấn đề khơi phục ảnh hơn là các
cơng cụ phi tuyến Việc xử lý nhiễu bằng cách xấp xỉ tuyến tính cũng giúp cho cơng
việc dễ dàng hơn trong trường hợp dùng cách biến đổi phi tuyến
Các kỹ thuật lọc nhiễu
+ Lọc nhiễu tuyến tính
Trong phần này chúng ta sẽ xét hai kỹ thuật lọc tuyến tính hay sử dụng là lọc
ngược và lọc giả ngược
► Lọc ngược (inverse filter):
Trang 35Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
Nếu dùng biến đổi Fourier ta cĩ:
] , [
] , [ ] , [
] , [ ] , [
'
v u H
v u N v u H
v u G v u
G với N[u,v] là nhiễu ước lượng (2.13) Nếu H[u,v] = 0 hoặc khá nhỏ thì hệ thống khơi phục sẽ khơng ổn định (hàm
Tuy bộ lọc ngược cĩ khả năng ngăn nhiễu do hệ thống nhận ảnh gây ra khá tốt nhưng việc thiết kế bộ lọc này lại là khá phức tạp
► Lọc giả ngược (Pseudoinverse filter):
Kỹ thuật lọc này khắc phục được nhược điểm của kỹ thuật lọc ngược là làm
cho hàm H T [u,v] luơn xác định:
Trang 36Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
30
1 khi H[u,v]
[ , ] [ , ]
0 khi H[u,v]
Với ε là một giá trị cho trước
Trong trường hợp ảnh nguyên gốc g[m,n] chuyển động tịnh tiến theo phương
x và y sinh ra hiện tượng nhịe ảnh thì H T
[u,v] sẽ được xác định theo các thơng số
chuyển động, và lọc giả ngược cĩ khả năng khơi phục được ảnh nhịe này
+ Lọc nhiễu lốm đốm:
Ta đã biết nhiễu lốm đốm gây ra do tính chất gồ ghề của bề mặt vật thể gây
ra hiện tượng tán xạ các tia đơn sắc Phần này ta sẽ nghiên cứu một kỹ thuật lọc nhiễu lốm đốm là kỹ thuật trung bình thống kê sử dụng bộ lọc đồng cầu
Kỹ thuật lọc nhiễu trung bình thống kê tiến hành thống kê các cường độ sáng của đối tượng ảnh bị nhiễu lốm đốm bằng N lần thu nhận độc lập và lấy trung bình các cường độ đĩ
Ta giả thiết hệ thống chỉ cĩ nhiễu lốm đốm và nhiễu này cĩ thể coi như tổng
vơ hạn các pha độc lập và đồng nhất Ta cĩ thể biểu diễn nhiễu lốm đốm như sau:
1
Với aR và a1 là các biến ngẫu nhiên độc lập phân bố theo Gauss, ứng với mỗi
tọa độ [m,n] thì trị trung bình bằng 0 với phương sai ζ2 Ta cĩ cường độ s:
2 2 1
m g g
nm,g,N
1nm,
1
N 1 i i '
(2.17) Trong đĩ sN[m,n] là trị trung bình thống kê của trường cường độ nhiễu lốm đốm + Lọc đồng cầu:
Nếu lấy logarit cơ số 2 của biểu thức 1.17 ta thu được:
Trang 37Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
Đặt w n m n, log g m n z m n n , , log g m n, , n m n, log sn m n, thì ta
cĩ mơ hình quan sát cĩ nhiễu lốm đốm như sau:
Trong cơng thức 1.19 thì ηn[m,n] là nhiễu trắng dừng.Với n >=2 thì η n [m,n]
cĩ thể mơ tả gắn với nhiễu ngẫu nhiên Gauss với mật độ phổ được định nghĩa như sau:
N
/1
6/)
,(
2 2 2 1
► Tăng cường độ tương phản
Độ tương phản đánh giá mức độ chênh lệch cường độ sáng của các đối tượng ảnh so với nền tức là đánh giá sự nổi bật của các đối tượng trong ảnh so với nền Ảnh cĩ tương phản thấp là do điều kiện chiếu sáng kém hoặc do tính khơng tuyến tính của bộ cảm nhận
Tăng cường độ tương phản là việc biến đổi biên độ ảnh đầu vào bằng hàm tuyến tính hay phi tuyến để thu được biên độ ra lớn hơn Trong quá trình thu nhận mẫu phục vụ cho bài tốn nhận dạng chữ ta cần thực hiện việc tăng cường độ tương phản của ảnh để làm nổi bật phần chữ trên nền phần giấy
Một ví dụ về tăng cường độ tương phản bằng hàm tuyến tính cho bởi cơng thức sau:
N
u b V b) - (u
b
u a V a) - (u
a u 0
u f(u)
T(u)
b
a v
(2.21)
Trang 38Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
32
Trong đĩ N là số lượng mức xám thường là 256, các hệ số α, β, γ xác định độ tương phản tương đối Tuỳ theo giá trị của ba hệ số α, β, γ mà ta cĩ một số trường hợp cụ thể như sau:
► Tách nhiễu và phân ngưỡng
Trong trường hợp ta biết khoảng biên độ tín hiệu ảnh vào (dải mức xám), ta
cĩ thể dùng kỹ thuật tách nhiễu để lấy riêng khoảng biên độ này ra như vậy sẽ loại được các phần nhiễu ở ngồi khoảng đĩ
Ví dụ, giả thiết ta biết khoảng biên độ ảnh vào nằm trong khoảng [a,b] thì việc tách nhiễu cĩ thể coi là trường hợp tăng độ tương phản với α = γ và β 0
N u b 1 - N
b u a
a
u 0 0
v
(2.22) Như vậy sau khi biến đổi khoảng biên độ [a,b] đã tách riêng ra cịn các khoảng khác được chuyển về 0 hoặc N-1 do đĩ ta cĩ thể tách khoảng biên độ [a,b] một cách dễ dàng
Trường hợp đặc biệt, nếu a = b = threshold ( ngưỡng )thì đầu vào sẽ chỉ cịn
hai mức xám là 0 và N-1 Trường hợp này gọi là sự phân ngưỡng Phân ngưỡng dùng để chuyển đổi ảnh xám sang ảnh nhị phân Kỹ thuật này dùng trong bài tốn nhận dạng chữ viết nhằm mục đích tạo mẫu ảnh nhị phân
Sử dụng tốn tử khơng gian :
Ta cĩ thể sử dụng một số bộ lọc khơng gian (tốn tử khơng gian) để loại bỏ một số loại nhiễu trong ảnh
► Lọc nhiễu khơng gian trung bình
Trang 39Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
33
Trong kỹ thuật này ta sử dụng một cửa sổ lọc rà khắp mặt phẳng ảnh Cửa sổ này thường cĩ kích thước Giá trị mức xám của điểm ảnh trung tâm bộ lọc sẽ được thay thế bằng trung bình cĩ trọng số giá trị các mức xám của các điểm thuộc cửa sổ
bộ lọc Cĩ thể mơt tả phương trình biến đổi của bộ lọc như sau:
Với h[k,l] là các giá trị trọng số và cũng là giá trị của mặt nạ bộ lọc, u[m,n]
là các giá trị của mặt phẳng đầu vào Với việc lấy trung bình như vậy, nhiễu sẽ giảm đáng kể
Thường dùng các mặt nạ khơng gian trung bình như sau:
Hình 1.6: Một số các mặt nạ khơng gian trung bình
(Khi ta áp dụng mặt nạ như vậy thì giá trị mức xám của điểm ảnh sau lọc nhiễu là trung bình cộng của các giá trị trọng số trong mặt nạ Do vậy khi dùng mặt
nạ lọc 3 3thì ta phải tính tổng các phần tử rồi nhân với
Trang 40Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/
34
► Lọc Gaussian:
Mặt nạ bộ lọc Gaussian được xây dựng từ hàm Gaussian:
2 2 2
1
22
Thuật tốn tính tốn cho bộ lọc trung vị cĩ thể được mơ tả như sau:
+) Sắp xếp các phần tử ảnh thuộc cửa sổ theo thứ tự tăng dần hoặc giảm dần +) Chọn ra phần tử trung vị (chính là phần tử cĩ chỉ số n2/2+1) và thay giá trị trung tâm cửa sổ bằng giá trị này Các phần tử khác giữ nguyên giá trị
Cĩ thể cửa sổ lọc trung vị dạng chữ thập để thay thế cho mặt nạ hình vuơng Mặt nạ loại này thì kết quả thu được sẽ khả quan hơn mặt nạ hình vuơng