1. Trang chủ
  2. » Luận Văn - Báo Cáo

Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay

82 873 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 82
Dung lượng 1,01 MB

Nội dung

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/2 Chương 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY Trong chương 1, luận văn đề cập đến các vấn đề sau: Một số khái niệm về logic

Trang 1

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THƠNG

TRẦN THỊ HIẾU

LOGIC MỜ ỨNG DỤNG TRONG BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên, năm 2013

Trang 2

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THƠNG

TRẦN THỊ HIẾU

LOGIC MỜ ỨNG DỤNG TRONG BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: TS Vũ Vinh Quang

Thái Nguyên, năm 2013

Trang 3

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

LỜI CẢM ƠN

Trước hết, tơi xin chân thành gửi lời TS

Quang, người đã tận tình hướng dẫn và tạo mọi điều kiện cho tơi trong quá trình làm luận

văn tốt nghiệp

Tơi xin chân thành cảm ơn các thầy, cơ giáo trong T

, Viện cơng nghệ thơng tin thuộc Viện khoa học

và Cộng nghệ Việt Nam Các thầy, cơ luơn giúp đỡ, tạo điều kiện cho tơi trong quá trình học tập và làm luận văn tốt nghiêp

Tơi gửi lời cảm ơn đến các bạn đồng nghiệp, những người thân và bạn bè đã động viên, giúp đỡ và đĩng gĩp nhiều ý kiến quý báu cho tơi trong quá trình học tập cũng như khi làm luận văn tốt nghiệp

Trong khoảng thời gian ngắn, với kiến thức của bản thân cịn hạn chế nên luận văn khơng tránh khỏi những thiếu sĩt về mặt khoa học, tơi rất mong nhận được những đĩng gĩp ý kiến của các Thầy, cơ giáo cùng bạn bè để luận văn được hồn chỉnh hơn

Xin trân trọng cảm ơn!

, tháng 7 năm 2013 Học viên

Trần Thị Hiếu

Trang 4

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

C

Trang Chương 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 2

1.1 Các khái niệm cơ bản 2

1.2 Các phép tốn trên tập mờ 4

1.2.1 Phép giao 4

1.2.2 Phép hợp 5

1.2.3 Phép phủ định 7

1.3 Suy luận mờ 8

1.3.1 Nguyên lý suy rộng và quan hệ mờ 8

1.3.2 Luật mờ 10

1.4 Điều khiển mờ (Fuzzy Control) 16

1.5 Nhận dạng mờ (Fuzzy Pattern Recornition) 19

1.5.1 Bài tốn nhận dạng 19

1.5.2 Phân nhĩm và vai trị trong thực tế 20

Chương 2 LÝ THUYẾT NHẬN DẠNG ẢNH 21

2.1 Các khái niệm cơ bản 21

2.1.1 Khái niệm ảnh số 21

2.1.2 Phân loại ảnh số 21

2.1.3 Khái niệm mức xám đồ 22

2.2 Lý thuyết nhận dạng ảnh 22

2.2.1 Lý thuyết xử lý ảnh 2D 22

2.2.2 Nâng cao chất lượng ảnh 27

2.2.3 Phân loại ảnh và tìm biên ảnh 36

2.2.4 Quy trình nhận dạng ảnh 37

Chương 3 BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY 43

3.1 Mơ hình bài tốn 43

3.2 Các bước tiến hành bài tốn nhận dạng chữ viết 44

Trang 5

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

3.2.1 Thu nhận các mẫu dữ liệu 44

3.2.2 Tách mẫu và chuẩn hố 46

3.2.3 Xây dựng thư viện mẫu cho các ký tự 46

3.2.4 Hệ suy luận học cho bài tốn nhận dạng chữ viết tay 46

KẾT LUẬN 53

TÀI LIỆU THAM KHẢO 54

Trang 6

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

DANH MỤC HÌNH ẢNH

Trang

Hình 1.1: Một số hàm liên thuộc cơ bản 3

Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ 9

Hình 1.3: Hàm liên thuộc của biến ngơn ngữ T(tuổi) 11

Hình 1.4: Mơ hình suy luận mờ với một luật-một tiên đề 14

Hình 1.5: Mơ hình suy luận mờ một luật-nhiều tiền đề 14

Hình 1.6 : Mơ hình suy luận mờ hai luật hai tiên đề 15

Hình 1.7: Cấu trúc cơ bản của bộ điều khiển mờ 16

Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia 17

Hình 1.9: Quá trình nhận dạng 19

Hình 2.1 : Tốn tử tuyến tính 24

Hình 2.2: Mặt nạ bộ lọc tuyến tính 3 3 25

Hình 2.3 : Tốn tử điểm ảnh 26

Hình 2.4: Mơ hình nhiễu 27

Hình 2.5: Lọc ngược khơi phục ảnh nguyên gốc 29

Hình 1.6: Một số các mặt nạ khơng gian trung bình 33

Hình 2.7: Mặt nạ lọc thơng thấp 33

Hình 2.8: Cửa sổ lọc giả trung vị 34

Hình 2.9: Phương pháp lưới 39

Hình 2.10: Phương pháp cung 40

Hình 2.11: Biểu diễn mẫu bằng tập kí hiệu 42

Hình 3.1 : Các cơng đoạn của bài tốn nhận dạng ảnh 44

Hình 3.2 : Ba mẫu chữ cần đọc 47

Hình 3.3 : Ký tự cần nhận dạng 47

Hình 3.4: Giao diện chương trình nhận dạng 48

Hình 3.5: Vẽ chữ cần nhận dạng 49

Hình 3.6: Kết quả nhận dạng sau khi vẽ chữ 49

Hình 3.7: Mở file ảnh ký tự cần nhận dạng 50

Hình 3.8: Giao diện sau khi mở file ảnh ký tự 51

Hình 3.9: Kết quả sau khi nhận dạng ảnh ký tự 51

Hình 3.10: Ghi ký tự ra file ảnh 52

Trang 7

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

1

LỜI MỞ ĐẦU

Cơng nghệ tri thức là chuyên ngành tích hợp tri thức con người với các hệ thống máy tính Các đặc tính tiêu biểu của các hệ thống dựa trên tri thức thể hiện ở việc xử lí chuyển trạng thái chứ khơng dựa vào thể hiện cứng nhắc của trạng thái Các quyết định về các xử lí dữ liệu cũng là một phần tri thức của hệ thống Lúc đĩ người ta đề cập nhiều đến tri thức thủ tục

Để giải vấn đề người ta tăng cường các thủ tục suy diễn với cơ chế kết hợp các luật với các lập luận logic Lập luận logic dùng để rút ra kết luận từ các sự kiện xem là đúng đắn

Ở các giai đoạn trước, việc truyền đạt cho máy luơn cần thiết phải đảm bảo tính chính xác và duy nhất, điều này làm cho các thao tác của máy trở nên khơ cứng và tạo ra một khoảng cách rất xa giữa người và máy về “độ thơng minh” trong việc giải quyết các bài tốn kỹ thuật cũng như trong cuộc sống hàng ngày

Hai lĩnh vực quan trọng phải kể đến là lý thuyết về mạng nơron và logic mờ, chúng là chìa khố để tạo ra các hệ thống kỹ thuật vừa đảm bảo tính xác và nhanh chĩng trong vận hành, vừa cĩ khả năng học từ các mẫu dữ liệu thống kê, lại cĩ khả năng thơng minh và mềm hố trong quá trình ra quyết định

Đối với các cán bộ kỹ thuật trong ngành Điện tử viễn thơng, lý thuyết về xử

lý tín hiệu trong đĩ cĩ tín hiệu hình ảnh là những kiến thức khơng thể thiếu Nhận dạng ảnh, đặc biệt là nhận dạng ký tự cũng là một mảng đề tài đáng quan tâm Việc nhận dạng ký tự nhất là với chữ viết tay sẽ tiết kiệm rất nhiều thời gian cho viêc nhập và lưu trữ dữ liệu

Ý thức được vấn đề trên, tơi xin hồn thành luận văn tốt nghiệp với đề tài

“Logic mờ ứng dụng trong bài tốn nhận dạng chữ viết tay” Nội dung đề tài

Trang 8

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

2

Chương 1 LOGIC MỜ VÀ BÀI TỐN NHẬN DẠNG CHỮ VIẾT TAY

Trong chương 1, luận văn đề cập đến các vấn đề sau: Một số khái niệm về logic mờ như: Các phép tốn trên tập mờ, Suy Luận Mờ, Điều khiển mờ (Fuzz Control), Nhận dạng mờ (Fuzzy Pattern Recornition), mơ hình của bài tốn nhận dang Trong chương

này, luận văn đã tham khao một số tài liệu sau: [3], [4] , [6] và [7]

1.1 Các khái niệm cơ bản

Cơ sở của logic mờ là việc ánh xạ từ các biến x đầu vào thuộc tập A thành các biến y đầu ra thuộc tập B

Nĩi cách khác, giá trị x=a khơng được xác định rõ là cĩ thuộc hay khơng thuộc tập B, và khái niệm mờ được đưa ra để làm nền tảng cho logic mờ và điều khiển mờ sau này

Cơ chế cơ bản của logic mờ sau này cĩ dạng là tập hợp các trạng thái nếu… thì hay cịn gọi là những quy luật

Tập mờ được coi là phần mở rộng của tập kinh điển Nếu X là một khơng gian nền (một tập nền) và những phần tử của nĩ được biểu thị bằng x, thì một tập

mờ A trong X được xác định bởi một cặp các giá trị:

,

Trong đĩ µA(x) được gọi là hàm liên thuộc của x trong A - viết tắt là MF (Membership Function) Nĩ khơng cịn là hàm hai giá trị như đối với tập kinh điển nữa, mà là một hàm với một tập các giá trị hay cịn gọi là một ánh xạ Tức

là, hàm liên thuộc ánh xạ mỗi một phần tử của X tới một giả trị liên thuộc trong khoảng [0,1]

Như vậy, kiến trúc của một tập mờ phụ thuộc vào hai yếu tố: khơng gian nền

và hàm liên thuộc phù hợp Sự đặc biệt của hàm thuộc là nĩ mang tính chủ quan với

ý nghĩa là với cùng định nghĩa một khái niệm nhưng với mỗi người khác nhau thì hàm thuộc cĩ thể xây được xây dựng khác nhau

Trang 9

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/

3

Cỏc hàm liờn thuộc được xõy dựng từ những hàm cơ bản như: Kết nối hành

vi, hàm bậc nhất, hỡnh thang, hỡnh tam giỏc, hàm phõn bố Gaussian, đường cong xichma, đường cong đa thức bậc hai và bậc ba Hỡnh 1.1 dưới đõy mụ tả một vài dạng hàm thuộc cơ bản:

0 0.2 0.4 0.6 0.8 1

Hỡnh 1.1: Một số hàm liờn thuộc cơ bản

Cú rất nhiều sự lựa chọn rộng rói để chỳng ta cú thể lựa chọn hàm liờn thuộc

ưa thớch Ngoài 11 hàm liờn thuộc ra, bộ cụng cụ logic mờ trong MATLAB cũng cho phộp chỳng ta tạo hàm liờn thuộc của chỡnh mỡnh nếu chỳng ta nhận thấy cỏc hàm liờn thuộc được định nghĩa sẵn là chưa đủ Nhưng với những hàm liờn thuộc ngoại lai này, khụng cú nghĩa là chắc chắn sẽ đưa ra được một hệ thống đầu ra mờ hoàn hảo

Để biểu diễn một tập mờ, tựy thuộc vào khụng gian nền và hàm liờn thuộc là rời rạc hay liờn tục mà ta cú cỏc cỏch biểu diễn như sau:

i

( ) /( ) /

A i i

x X

A X

A

Nếu X là tập hợp các đối t-ợng rời rạc

Trang 10

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

Kết hợp: v(P1 AND (P2 AND P3)) = v((P1 AND P2) AND P3)

Điểm giao nhau của hai tập mờ A và B được xác định tổng quát bởi một ánh xạ nhị phân T, tập hợp của hai hàm liên thuộc sẽ là như sau:

,

Điểm giao nhau của những phép tốn mờ thường được coi như những phép tốn tiêu chuẩn T (tiêu chuẩn tam giác), ta cĩ những yêu cầu cơ bản sau:

Tốn hạng chuẩn T là một ánh xạ bậc hai T(•) thỏa mãn:

Đường biên: T(0,0) = 0; T(a,1) = T(a,1) = a (1.4)

Đơn điệu: T(a,b) T(c,d) nếu a c và d d (1.5)

Giao hốn: T(a,b) = T(b,a) (1.6)

Kết hợp: T(a, T(b,c)) = T(T(a,b),c) (1.7)

Yêu cầu đầu tiên tác động một cách khái quát tới những tập xoắn Yêu cầu thứ hai làm giảm những giá trị liên thuộc trong A hoặc B, khơng thể đưa ra kết quả làm tăng giá trị liên thuộc ở điểm giao A, B Yêu cầu thứ ba chỉ ra rằng thứ tự của tốn hạng bên trong tập mờ là khơng khác nhau Cuối cùng, yêu cầu thứ tư cho phép chúng ta đưa ra điểm giao nhau của bất kỳ phần tử nào của tập ở bên trong thứ tự của từng cặp

Trang 11

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

Chuẩn Lukasiewicz: T(x,y) = max{x + y – 1,0} (1.10)

Min nilpotent: T , min , 1

a Một hàm T-chuẩn T gọi là liên tục nếu T là hàm liên tục trên [0,1]2

b Hàm T gọi là Archimed nếu T(x,x) < x với mọi 0<x<1

c Hàm T gọi là chặt nếu T tăng chặt trên (0,1)2

Định lý 1 (Ling 1965) Một T-chuẩn T liên tục và Archimed khi và chỉ khi cĩ một hàm f : 0,1 0, , liên tục, giảm chặt với f(1)=0 sao cho:

T x y, f 1 f x f y

Ở đây f(-1) tựa ngược của f xác định bởi: f(-1)

(x)= f-1(x) nếu x<f(0), và

f(-1)(x)=0 trong các trường hợp khác

Định lý 2 (Schweizer and Sklar 1983) T là một T-chuẩn liên tục và chặt khi

và chỉ khi tồn tại một tự đồng cấu φ của đoạn [0,1] sao cho

T(x,y)= φ-1(φ(x).φ(y)) với mọi x,y [0,1]

Trang 12

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

Đường biên: S(1,1) = 1; S(a,0) = s(0,a) = a (1.14)

Đơn điệu: S(a,b) S(c,d) nếu a c và b d (1.15)

Giao hốn: S(a,b) = S(b,a) (1.16)

*Định nghĩa 2 : Cho S là T- đối chuẩn, khi ấy:

- S gọi là liên tục nếu đĩ là hàm liên tục trên miền xác định

- S là Archimed nếu S(x,y) > x với mỗi 0 < x < 1

- S gọi là chặt nếu S là hàm tăng tại mỗi điểm (x,y) (0,1)2

*Định lý 2: S là T - đối chuẩn liên tục và Archimed khi và chỉ khi cĩ một hàm liên tục, tăng chặt g: [0,1] [0, ] với g(0)=0, sao cho:

1,

Trang 13

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

7

Ở đây g(-1)

tựa hàm ngược g-1 của hàm g cho bởi biểu thức :

g(-1)(x)=g-1(x) với x < g(1), cịn g(-1)(x)=1, trong các trường hợp khác

*Định lý 3: Mỗi T- đối chuẩn S liên tục là chặt khi và chỉ khi cĩ một tự đồng cấu φ: [0,1] [0,1] sao cho:

Điều kiện biên: N(0) = 1 và N(1) = 0

Đơn điệu: N(A) N(B) nếu A B

N S

1

1)

Yager: N w (x) = (1-x w ) 1/w (1.25)

Định lý biểu diễn: Tìm các biểu diễn khác nhau của một tốn tử cĩ thể là “thĩi quen tốn học” Song chúng sẽ trở nên rất cĩ ích khi chúng ta cần tìm những lớp mới trong vùng đang làm việc nhưng cĩ thêm những tính chất mong muốn nào đĩ

*Định nghĩa 3: Hàm φ: [a,b] gọi là một tự động cấu (automorphism) của đoạn [a,b] nếu nĩ là hàm liên tục, tăng chặt và φ(a)=a, φ(b)=b

*Định lý 4: (Ovchinnikov,Rouben,1991), Hàm N: [0,1] [0,1] là hàm phủ định mạnh khi cĩ một tự đồng cấu φ của đoạn [0,1] sao cho:

1

1

*Định lý 5: (Fodor 1993) Hàm n: [0,1] [0,1] là hàm phủ định chặt khi và chỉ khi cĩ hai phép tự đồng cấu ψ,φ sao cho n(x)=ψ(1-φ(x))

Trang 14

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

8

1.3 Suy luận mờ

1.3.1 Nguyên lý suy rộng và quan hệ mờ

1.3.1.1 Nguyên lý suy rộng

Nguyên lý suy rộng là một khái niệm cơ bản của lý thuyết mờ nhằm cung cấp thuật tốn chung cho việc mở rộng các miền rõ của các phương trình tốn học thành các miền mờ Thuật tốn này sẽ tạo ra từ một ánh xạ trung điểm của một hàm

f thành một ánh xạ giữa các tập mờ Đặc biệt hơn, giả sử f là một hàm số từ khơng gian X vào khơng gian Y và A là một tập mờ trên X được định nghĩa bởi:

A= µ A (x 1 )/ x 1 + µ A (x 2 )/ x 2 + … + µ A (x n )/ x n

Nguyên lý này suy rộng phát biểu rằng ảnh của tập mờ A dưới ánh xạ f là tập

mờ B thỏa mãn như sau:

Với y i = f(x i ), i= 1…n

Nĩi cách khác, tập mờ B cĩ thể được xác định thơng qua các giá trị của hàm

f tại x 1 , x 2 ,…, x n Nếu f là ánh xạ nhiều - một thì tồn tại x 1 , x 2 X, x 1 x 2 mà f(x 1 ) =

độ phụ thuộc lớn nhất của A tại x=x1 và x=x2 do vậy ta cĩ:

)) ( ( max )

(

) (

y f x

Tổng quát hơn giả sử hàm f là một ánh xạ tử khơng gian n chiều X1 x X2 x

biểu rằng tập mờ B qua ánh xạ f là:

o y

o y

x i A i x

x x x x x B

i n

n

) ( f neu

0 ) ( f neu ) ( min max 1 -1 -) , ,

, )( , ,

,

(1.28)

Trang 15

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

9

-3 -2 -1 0 1 2 3

Do phu thuoc

B

Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ

Hình 1.2 minh họa nguyên lý suy rộng mờ Đồ thị dưới cùng biểu diễn tập

mờ A, đồ thị phía trên bên trái biểu thị hàm y = f(x) và đồ thị bên phải là tập mờ B tạo thành qua nguyên lý suy rộng

1.3.1.2 Quan hệ mờ

Quan hệ hai ngơi mờ là một tập mờ trong khơng gian X Yánh xạ mỗi phần

tử thuộc khơng gian này vào một mức độ phụ thuộc giữa 0 và 1 nĩ cĩ ứng dụng rất lớn trong điều khiển mờ và ra quyết định

Cho X và Y là hai khơng gian nền thì:

là một quan hệ hai ngơi mờ trong khơng gian X Y

Quan hệ hai ngơi mờ thường được mơ tả dưới các dạng sau:

x gần với y (x,y là các số)

x phụ thuộc vào y (x,y là các sự kiện)

x và y giống nhau(x,y là người vật…)

Nếu x lớn thì y nhỏ

Trang 16

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

10

Cách diễn giải cuối “nếu x là A thì y là B” được lặp lại thường xuyên trong

hệ suy luận mờ Quan hệ mờ trong các khơng gian khác nhau cĩ thể được kết hợp thơng qua phép hợp thành Cĩ rất nhiều phép hợp thành khác nhau được sử dụng trong quan hệ mờ, nổi tiếng nhất là luật hợp thành max-min được phát minh bởi Zadeh

Gọi R1 và R2 là hai quan hệ mờ trong khơng gian X YX Y , luật hợp thành Max-min của R1 và R2 là một tập mờ được xác định bởi:

Hoặc tương đương

µ R1º R2 (x,z) = max min [µ R1 (x,y), µ R2 (y,z)] = y R1(x,y) R2(y,z)

(1.31)

Với cách hiểu rằng và đại diện cho phép tốn Max và Min Khi R1 và

R2 được biểu diễn dưới dạng ma trận, phép tính tốn R1º R2 gần giống như phép nhân ma trận ngoại trừ phép x và + được thay thế bằng phép và đĩ chính là lý

do để ta gọi là luật hợp thành Max-Min

Dưới đây là một số tính chất chung của quan hệ mờ hai ngơi và phép hợp thành Max-Min, với R,S,T là các quan hệ hai ngơi trên khơng gian X Y, Y Z, Z W:

Kết hợp: R º (S º T) = (R º S) º T Phân phối với phép hợp: R º(S T) = (R ºS) (R ºT)

Phân phối với phép giao: R º(S T) = (R ºS) (R ºT)

Đơn điệu: S T => R º S R º T

Mặc dù luật hợp thành Max-Min được sử dụng rất rộng rãi nhưng nĩ khơng

dễ dàng và chủ động trong các quá trình kiểm tra tốn học, vì vậy luật hợp thành Max-Prod được đưa ra như là một cải tiến của luật hợp thành Max-Min:

R1oR 2(x,z) maxymin R1(x,y). R2(y,z)

(1.32)

1.3.2 Luật mờ

1.3.2.1 Biến ngơn ngữ

Một biến ngơn ngữ được đặc trưng bởi tập 5 yếu tố (x,T(x),X,G,M) trong đĩ

x là tên của biến; T(x) là tập hợp các thuật ngữ của x, nĩ là các giá trị ngơn ngữ hay thuật ngữ ngơn ngữ; X là khơng gian nền; G là luật cú pháp tạo ra các thuật ngữ

Trang 17

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

Hình 1.3: Hàm liên thuộc của biến ngơn ngữ T(tuổi)

Mỗi thuật ngữ trong T(tuổi) được đặc trưng bởi một tập mờ trong khơng gian nền X=[0,100] Thơng thường chúng ta dùng “tuổi trẻ” để gán giá trị “trẻ” cho biến tuổi Ngược lại khi tuổi được xem như là giá trị số chúng ta sử dụng phương trình

“tuổi=20” Luật cú pháp nĩi lên cách mà giá trị ngơn ngữ trong tập thuật ngữ T(tuổi) được gán Luật ngữ nghĩa xác định hàm thuộc của mỗi giá trị ngơn ngữ trong tập thuật ngữ Từ ví dụ trên ta thấy, tập các thuật ngữ bao gồm một vài thuật ngữ chính (trẻ, trung niên, già) được biến đổi bới các phép phủ định (khơng), các trạng từ (rất, hơn, khá ) và các liên từ ( và, hoặc)

1.3.2.2 Cấu trúc luật

Một luật nếu-thì mờ (cịn gọi là luật mờ, phép kéo theo mờ, hoặc câu điều kiện mờ) thường cĩ dạng:

IF <X là A> THEN <Y là B>

Trong đĩ A,B là các giá trị ngơn ngữ được xác định bởi các tập mờ trong khơng gian nền X và Y Thơng thường “x là A” được gọi là tiên đề hay giả thuyết, cịn “y là B” được gọi là kết quả hay kết luận Các ví dụ của luật nếu-thì mờ rộng khắp trong các diễn giải ngơn ngữ hàng ngày như:

Nếu áp suất cao thì thể tích nhỏ

Trang 18

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

12

Nếu đường trơn thì việc lái xe rất nguy hiểm

Nếu quả cà chua màu đỏ thì nĩ chín

Luật nếu-thì mờ thường được viết tắt dưới dạng A =>B miêu tả quan hệ giữa hai biến x và y, điều này cho thấy rằng luật nếu-thì mờ xác định một quan hệ hai ngơi R trên khơng gian tích XxY

Nĩi chung cĩ hai cách diễn dịch luật mờ A =>B Nếu ta diễn dịch

Trong đĩ *~ là phép tốn T-norm

Ngược lại nếu A=> B được diễn dịch là A kéo theo B thì phương trình cĩ thể được viết dưới 4 cơng thức khác nhau như sau:

Mặc dù 4 cơng thức trên cĩ hình thức khác nhau nhưng chúng đều trở về

dạng các định quen thuộc R = A B = A B khi A và B là hai giá trị logic Dựa

trên hai cách diễn dịch và các phép tốn T-chuẩn và S chuẩn, một số phương pháp hiệu quả được thành lập để tính tốn quan hệ mờ R = A B Tất cả các phương pháp này đề sử dụng phép kéo theo

Phép kéo theo (Implication) là một hàm số I:[0,1]2

[0,1] thỏa mãn các điều kiện sau:

Nếu x z thì I(x,y) I(z,y) với mọi y [0,1]

Nếu y u thì I(x,y) I(x,u) với mọi x [0,1]

Trang 19

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

13

Dạng kéo theo thứ nhất: IS1(x,y) = S(n(x),y) (1.38)

Dạng kéo theo thứ hai: IS2 = S(T(x,y),n(x)) (1.39)

Giả thiết 1 (sự kiện): x là A

Giả thiết 2 (luật): Nếu x là A thì y là B

Suy diễn (kết luận): y là B

Tuy nhiên, trong suy diễn của con người, luật modus ponens được sử dụng theo cách thức xấp xỉ điều này được minh họa như sau :

Giả thiết 1 (sự kiện): x là A’

Giả thiết 2 (luật): Nếu x là A thì y là B

Suy diễn (kết luận): y là B’

Trong đĩ A’ gần với A và B’ gần với B Khi A, B, A’, B’ là các tập mờ trên các khơng gian nền tương ứng thì thuật tốn trên được gọi là suy luận xấp xỉ hay suy diễn mờ Sử dụng luật hợp thành mờ đã nêu ở trên ta cĩ thể thành lập thuật tốn suy diễn mờ như sau:

Gọi A, A’ và B là các tập mờ trên khơng gian X, X và Y Giả thiết phép kéo theo mờ A B được diễn giải như một quan hệ mờ trên khơng gian XxY thì tập mờ

B suy ra từ “ x là A” và luật mờ “nếu x là A thì y là B” được xác định bởi:

hay tương đương:

Các trường hợp cĩ thể cĩ của phép suy diễn mờ bao gồm:

Trang 20

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

14

1.4.3.1 Suy diễn với một luật với một tiên đề

Hình 1.4: Mơ hình suy luận mờ với một luật-một tiên đề

Đây là trường hợp đơn giản nhất như đã được minh họa ở trên Biến đổi ta cĩ:

A

1.4.3.2 Suy luận một luật với nhiều tiên đề

Một luật nếu … thì mờ với hai tiên đề thường được viết dưới dạng: “nếu x là

A và y là B thì z là C” và được minh họa như sau :

Giả thiết 1 (sự kiện): x là A’ và y là B’

Giả thiết 2 (luật): Nếu x là A và y là B thì z là C

Suy diễn (kết luận): z là C’

Luật mờ trong giả thiết 2 cĩ thể đưa về dạng : AxB C từ đĩ ta tính được:

)()

()()]

()([)]

()([

)]

()()([)]

()([)

(

2 1 ,

' '

' '

'

z w

w z y

y x

x

z y

x y

x z

C C

B B

y A

A x

C B

A B

A y x

Hình 1.5: Mơ hình suy luận mờ một luật-nhiều tiền đề

Trang 21

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

15

Ta lại cĩ:

)()

(

)()()()

()()

(

) ( ' )

( '

' '

, '

y y

z y

x y

x z

C B o B C

A o A

C B

A B

A y x C

(1.45)

Từ cơng thức trên ta thấy rằng, kết quả C’ cĩ thể được xem như giao của 2 biểu thức C1’ = A’ º(A C) và C2’ = B’ º(B C) Mỗi một biểu thức liên quan đến phép suy diễn mờ trong trường hợp một luật mờ và 1 tiêu đề đã xét ở trên

1.4.3.3 Nhiều luật mờ với nhiều tiên đề

Sự suy diễn của luật mờ phức hợp được tiến hành như hợp của các quan hệ

mờ tương ứng với luật mờ Do vậy ta cĩ:

Giả thiết 1 ( Sự kiện ): x là A’ và y là B’

Giả thiết 2 ( Luật ): nếu x là A1 và y là B1 thì z là C1

Giả thiết 3 ( Luật ): nếu x là A2 và y là B2 thì z là C2

Suy diễn ( kết luận ): z là C’

Chúng ta cĩ thể sử dụng suy diễn mờ được trình bày trong hình vẽ 1.7 dưới đây như một thuật tốn suy luận để tìm được kết quả của tập mờ đầu ra C’

Hình 1.6 : Mơ hình suy luận mờ hai luật hai tiên đề

Để xác định thuật tốn suy diễn mờ, gọi R1 A1xB1 C1và R2 A2xB2 C2

Do phép hợp thành Max-Min º cĩ tính chất phân phối với phép nên:

Trang 22

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

Cơ sở luật mờ

Suy diễn

tượng

Trang 23

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

17

Trong số những ứng dụng thực sự thành cơng trong thực tiễn cịn phải nhắc đến bộ FLC dùng trong quản lý sân bay (Clymer,1992) các hệ thống điều khiển đường sắt và hệ thống cần cẩu Container (Yasunobu và Miyamoto,1985) một ứng dụng rất hay của điều khiển mờ là hệ điều khiển “The Camera Tracking Control Systems” của Nasa 1992,…

Chúng ta cũng khơng thể khơng nhắc tới các máy mĩc được dùng trong gia đình dùng FLC đang bán trên thị trường thế giới: Máy điều hồ nhiệt độ - Mishubitshi, máy giặt Hitachi, các Video Camera của Sanyo, T4i Camera Cannon- Máy hút bụi lị sấy của Microware Ovent- Toshiba…

Các hệ chuyên gia mờ (Fuzzy Expert Systems)

Các hệ chuyên gia (Expert System) là một nhánh của bộ mơn Trí tuệ nhân tạo (Artifical Intelligence) sử dụng các trí thức chuyên biệt để giải quyết bài tốn ở giai đoạn dùng các chuyên gia- con người Chúng phát triển vào những năm 1970

và được ứng dụng trong khá nhiều lĩnh vực Ngày nay đối với hệ chuyên gia thì

thực chất hiểu là các hệ thống trong đĩ cĩ sử dụng Cơng nghệ hệ chuyên gia

(Expert System Techology) bao gồm các ngơn ngữ hệ chuyên gia chuyên dụng, các

chương trình và cả các phần cứng được thiết kế nhằm vận hành và phát triển hệ chuyên gia

Hiện nay trong các sách báo người ta thường dùng từ đồng nghĩa là “Hệ

chuyên gia trên cơ sở tri thức” (Knowledge- Based Expert System) Sau đây là cấu

trúc cơ bản của hệ chuyên gia:

Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia

Lý thuyết mờ và logic mờ cĩ nhiều ưu điểm trong biểu diễn tri thức của các chuyên gia Cho nên việc đưa các luật mờ và đặc biệt là biến ngơn ngữ và hàm

Người

dùng

Giao diện Đối thoại Điều chỉnh tri thức

Cơ sở tri thức

Mơ tơ suy diễn

Trang 24

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

18

thuộc đã xuất hiện khá sớm Các hệ chuyên gia trình bày dưới đây đã sử dụng các luật mờ (fuzzy rules)

Tên/ tác giả/ năm Lĩnh vực

CADIAG-2, Adlassnig et al.,1985 Y (internal medicine)

EMERGE, Hudson, Cohen, 1988 Phân tích đau ngực

ESP, Zlmmermann, 1989 Kế hoạch mức chiến lược

FAULT, Whalen et al., 1987 Kế tốn

OPAL, Bensana et al., 1988 Lập lịch cơng tác

Thực tiễn đã dẫn tới cần phối hợp tốt hơn hai loại cơng nghệ này, đĩ là nhu cầu về nghiên cứu các hệ chuyên gia mờ (fuzzy expert systems) Những nghiên cứu sau đây là ví dụ:

- FESS- một hệ chuyên gia mờ tái sử dụng, Hall và Kandell, 1993

- Hệ chuyên gia mờ cĩ mục đích tổng quát, Schneider và Kandel, 1994

- Những khung cho hệ chuyên gia mờ, Umano, Hatono và Tamura (fuzzy expert systems shells), 1994

- Cơng trình của Whalen và Schott, 1992 Tạo ra mạng suy diễn ngơn ngữ

mờ ( Fuzzy linguistic interence network generator)

Chúng ta khơng khĩ khăn khi chỉ ra các ứng dụng thực tiễn của hệ chuyên gia mờ Sau đây là một vài ví dụ:

- Von Altrorck và Krause đã phát triển hệ chuyên gia mờ giành cho cơng nghiệp ơtơ của MecrCedes-Benz của Cộng hồ liên bang Đức,1994

- Hệ Emerge của Hudsson và Cohen 1992 là hệ chuyên gia y học trên cơ sở các luật mờ trợ giúp cho phịng cấp cứu và đưa ra lời chỉ dẫn về kiểm tra các hiện tượng đau

- Hệ EAR của Lĩpez de Mántaras et al, dành cho việc chuẩn đốn y học, cịn hệ FLING của Whalen và Schott năm 1992 thì trợ giúp cho việc nắm bắt và phân tích tri thức

- Về các hệ mờ EDFRAME/CADIAG- IV, 1996, Fuzzy KBWean, 1998 và Fuzzy-ARDS 1999 đang sử dụng tại Viên cộng hồ Áo

Trang 25

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

lý thuyết mờ, các perceptrons, phân lớp cơ sở tri thức dựa vào kỹ thuật của trí tuệ nhân tạo

Nghĩ tới việc tiếp cận lý thuyết mờ là hồn tồn tự nhiên vì hình dạng quan sát được, các thơng tin nhận được thường rất mờ Một số kết quả đã được cơng bố (ví dụ: Bezdek năm 1981, Pedrrycz năm 1990 hay là Bezdek và Pal năm 1992), và

đã ứng dụng thành cơng trong xử lý ảnh (nhận dạng chữ viết tay), nhận dạng tiếng

nĩi, robot thơng minh, nhận dạng các đối tượng hình học…

Hình 1.9: Quá trình nhận dạng

Bây giờ ta nĩi thêm về một số khái niệm :

- Dữ liệu (data) thu được từ quá trình vật lý hoặc là các hiện tượng Dữ liệu (theo nghĩa rộng) cĩ thể ở dạng định tính định lượng, dạng số, hình, hay một đoạn văn, ngơn ngữ hay tổ hợp các dạng trên

- Khơng gian các dáng (Pattern Space) cịn được gọi là cấu trúc (Structure) đĩ

là tập các dáng vẻ, kiểu dáng, trong đĩ thơng tin được tổ chức sao cho chúng cĩ thể gĩp phần phát hiện mối liên hệ giữa các biến Nĩi chung số chiều của khơng gian các dáng cần ít hơn số chiều của khơng gian dữ liệu

Dữ liệu Biến đổi Thu gọn số chiều Thuật tốn quyết định Kết quả

Khơng gian pattern

Trang 26

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

20

- Khơng gian các đặc tả (Feature Space) là khơng gian nằm giữa khơng gian

dữ liệu và khơng gian phân lớp Nĩi chung số chiều của khơng gian đặc tả phải ít hơn nhiều số chiều khơng gian dữ liệu Vấn đề khĩ khăn là chọn những đặc tả nào cho đủ phản ánh những nét quan trọng nhất của đối tượng Khơng gian phân lớp dĩ nhiên phải chứa được các lớp mà người nghiên cứu muốn phân Tuy nhiên thực chất

cĩ bao nhiêu lớp phân biệt thì nhiều khi ngay từ đầu cũng khĩ xác định

Một nhận xét cũng nên để ý là tính mờ khơng chỉ trong khơng gian dữ liệu

mà cịn nằm trong khơng gian các đặc tả và trong các thuật tốn phân lớp

1.5.2 Phân nhĩm và vai trị trong thực tế

Hiện nay các chuyên gia đang nghiên cứu về nhận dạng mờ cĩ thể chia theo

4 nhĩm đề tài chính:

- Nhận dạng tĩnh các đối tượng 3 chiều, cĩ mầu

- Nhận dạng động các đối tượng 3 chiều cĩ mầu

- Nhận dạng theo cơng nghệ hiển thị (Visual Ricogition) các đối tượng 3 chiều cĩ màu

- Nhận dạng động các biểu hiện của con người(Human Expressions)

Ai cũng hiểu được tầm quan trọng của các vấn đề nhận dạng các đối tượng động 3 chiều trong quốc phịng an ninh, ngành viễn thám Nhưng ngay đối với ngành dân sự độ quan trọng của đề tài này cũng được phản ảnh qua bảng tổng kết sau cuộc thăm dị ý kiến của hơn 200 chuyên gia hang đầu về cơng nghệ mờ được tiến hành (1989) bởi 2 giáo sư A Ishakawwa và T.L Willson (Các con số ghi trong bảng tính theo % của các ý kiến )

Đề tài Độ quan trọng

Cao Trung Bình Thấp

1 Nhận dạng tĩnh dùng cơng nghệ mờ

- Các hệ robot sản xuất dùng cơng nghệ hiển thị

-Các hệ theo dõi tự động dùng cơng nghệ hiển thị

- Các hệ vận tải robot dùng cơng nghệ hiển thị

2.Nhận dạng động dùng cơng nghệ mờ

-Các hệ robot sản xuất dùng cơng nghệ hiển thị

-Các hệ theo dõi tự động dùng cơng nghệ hiển thị

84.0 80.8 42.9

81.8 78.3

16.0 19.2 47.6

9.1 13.0

0

0 9.5 9.1 8.7

Trang 27

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

2.1 Các khái niệm cơ bản

2.1.1 Khái niệm ảnh số

Ảnh trong thực tế là một ảnh liên tục về khơng gian và giá trị cường độ sáng

Để cĩ thể xử lý ảnh bằng máy tính người ta cần thiết phải số hố ảnh Trong quá trình số hố, ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thơng qua quá trình lấy mẫu (rời rạc hố về khơng gian) và lượng hố thành phần giá trị mà về nguyên tắc bằng mắt thường khơng phân biệt được hai điểm gần nhau Một ảnh sẽ là một tập hợp các phần tử ảnh (Picture Element) hay cịn gọi là Pixel

Như vậy, ảnh số là một tập hợp các điểm ảnh Khi được số hố, nĩ thường được biểu diễn bởi một mảng hai chiều I(n,p) với n là số dịng và p là số cột Ta nĩi ảnh gồm n x p Pixels Người ta thường ký hiệu I(x,y) để chỉ một pixel I chính là giá trị cường độ ánh sáng của điểm ảnh tại Pixel đĩ Thường giá trị n chọn bằng p và bằng 256 Ảnh cĩ thể được biểu diễn với các độ phân giải khác nhau Một pixel cĩ thể được lưu trữ trên 1, 4, 8 hay 24 bit tuỳ thuộc vào cường độ sáng cần phân biệt của ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đĩ

2.1.2 Phân loại ảnh số

Người ta thường chia ảnh số ra làm ba loại chính là:

Ảnh đen trắng: mỗi phần tử ảnh nhận một trong hai giá trị tương ứng với hai mức sáng đen và trắng (cịn gọi là ảnh nhị phân)

Ảnh xám (ảnh đa mức xám): Các phần tử ảnh chứa thơng số về cường độ ánh đã được mã hố thành N mức(8, 256 hoặc nhiều hơn) tương ứng với 3 bit, 8 bit

Trang 28

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

8 bit, 16 bit hoặc 24 bit để mã hố

Như vậy ảnh mầu là ảnh mang thơng tin về đối tượng đầy đủ nhất so với ảnh đen trắng và ảnh xám Tuy nhiên tất cả cách biểu diễn này đều chỉ là sự mơ phỏng

hệ màu trong tự nhiên Thực tế thì một ảnh màu được phân biệt qua 3 thuộc tính là

độ chĩi (Brighness), sắc thái màu (Hue), và độ bão hồ (Saturation) Tuy nhiên với khả năng cảm nhận của mắt người thì cách biểu diễn ảnh dưới dạng cấu trúc 3 màu RBG chất lượng ảnh thu được cĩ thể chấp nhận được

( thường N= 255) Trục tung y biểu diễn số điểm ảnh trong ảnh ứng với mức xám tương

ứng trên trục hồnh Như vậy ta cĩ thể biểu diễn mức xám đồ bằng hàm y=f(x) với f(x) là một hàm rời rạc cĩ giá trị bằng số điểm ảnh trong ảnh cĩ mức xám x

tử ảnh g[m,n], như vậy ở đây ta đã áp dụng lý thuyết xử lý tín hiệu số trong một khơng gian hai chiều thay vì khơng gian một chiều như thơng thường

Trang 29

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

23

Một hệ thống xử lý ảnh sẽ tiếp nhận ảnh số g[m,n] và đưa ra ảnh đã được xử

lý g’[m,n] Trên phương diện xử lý tín hiệu số thì chức năng của hệ thống này sẽ được đặc trưng bằng hàm truyền đạt H của nĩ Ta cĩ thể thể hiện mối quan hệ này như sau:

'[ , ] ( [ , ])

Đối với khơng gian 2D ta cũng cĩ các cách tiếp cận khác nhau để khảo sát hệ thống Cách thứ nhất cĩ thể khảo sát trực tiếp trên miền khơng gian điểm ảnh [m,n] Những tác động của hàm truyền H sẽ được tính tốn trực tiếp với các điểm ảnh Một số cơng cụ cơ bản thường được sử dụng là tốn tử điểm ảnh, tích chập hay các bộ lọc

Cách tiếp cận thứ hai của hệ thống xử lý số 2D là biến đổi tín hiệu sang một miền khơng gian khác và thực hiện khảo sát trong miền khơng gian đĩ Sau khi khảo sát xong ở miền khơng gian này ta lại biến đổi ngược để đưa tín hiệu về miền khơng gian điểm ảnh Việc biến đổi tín hiệu sang xử lý ở một miền khơng gian khác là nhằm làm nổi bật các đặc tính của tín hiệu nhằm làm cho việc phân tích và xử lý thuận tiện hơn.Trong lý thuyết xử lý tín hiệu số ta cĩ thể thực hiện biến đổi về miền khơng gian thời gian hay miền khơng gian tần số nhằm thực hiện các xử lý thích hợp

Dưới đây chúng ta sẽ tiến hành xem xét một số các khái niệm cơ bản trong một hệ thống xử lý số tín hiệu hai chiều

2.2.1.1 Khảo sát trực tiếp trong miền khơng gian điểm ảnh

Đáp ứng xung:

Tương tự như trong khơng gian một chiều, trong khơng gian 2D ta cũng cĩ khái niệm về xung đơn vị như sau Xung đơn vị δ[m,n] được định nghĩa theo cơng thức:

0nm, khi 0

0n0,m khi 1

, n

m

(2.2) Đáp ứng xung của một hệ thống chính là tín hiệu đầu ra khi tín hiệu đầu vào

là xung đơn vị Như vậy đáp ứng xung h[m,n] của hệ thống cĩ thể định nghĩa như sau:

Trang 30

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

24

Với một dịch chuyển [α,β] ta cĩ đáp ứng xung h[m,n; α,β] (được gọi là hàm

phân tán điểm- PSF: Point Spread Function) như sau:

Tích chập trong miền khơng gian tuyến tính bất biến thể hiện mối quan hệ

đầu ra, đầu vào của hệ thống và đáp ứng xung h[m,n] được cho bởi cơng thức sau:

Trang 31

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

25

Tích chập hai ma trận h[m,n] với g[m,n] cho ma trận g’[m,n] Kích thước của ma trận g’[m,n] là P Q với P= M+K – L cịn Q = N+L-1

mn mo

n n

pq po

q q

f f

f

f f

f

f f

f

h h h

g g

g g

g g

1

11 10

0

01 00

33 32 31

23 22 21

13 12 11

p1

1

11 10

0

01 00

*h h

h h

h h

g

g

g

số bộ lọc với mục đích tách các chi tiết của ảnh để xử lý riêng

Trong miền khơng gian điểm ảnh, bộ lọc thường sử dụng là một mặt nạ di chuyển khắp mặt phẳng ảnh Tâm của cửa sổ mặt nạ sẽ là điểm chịu tác động lọc, giá trị của các điểm lân cận trong mặt nạ sẽ cĩ ảnh hưởng đến giá trị ra của điểm trung tâm Tùy theo quan hệ giá trị ra của điểm trung tâm với giá trị của các điểm lân cận mà ta chia thành hai bộ lọc tuyến tính và phi tuyến

+ Lọc tuyến tính:

Điểm trung tâm của mặt nạ sẽ cĩ giá trị bằng tổng số trọng số của các điểm thuộc mặt nạ ( bao gồm giá trị của chính bản thân nĩ) Tổng này là một tổ hợp tuyến tính của các điểm lân cận Chính vì thế mà nĩ được gọi là lọc tuyến tính Giả sử ta xét một mặt nạ lọc 3 3

W1 W2 W3 W4 W5 W6 W7 W8 W9

Hình 2.2: Mặt nạ bộ lọc tuyến tính 3 3

Điểm trung tâm của mặt nạ p 5 sẽ được tính tốn theo cơng thức sau:

P 5 =W 1 P 1 + W 2 P 2 + W 3 P 3 + W 4 P 4 + W 5 P 5 + W 6 P 6 + W 7 P 7 + W 8 P 8 + W 9 P 9 (2.8)

Trang 32

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

26

Ở đây, các giá trị P1….P9 là các giá trị của các điểm ảnh nằm trong vùng ma trận 3 3hiện thời, W1 … W9 là giá trị các trọng số của các phần tử trong bộ lọc + Lọc phi tuyến:

Bộ lọc phi tuyến cũng tương tự bộ lọc tuyến tính Tuy nhiên đối với lọc phi tuyến thì giá trị ra của điểm trung tâm khơng phải là tổ hợp tuyến tính của các điểm lân cận mà nĩ biểu diễn bởi một hàm phi tuyến

Tốn tử điểm ảnh:

Phần trên đã xét một số các phép biến đổi tác động lên khơng gian điểm ảnh nhằm biến đổi ảnh Bây giờ ta sẽ xét đến phép biến đổi tác động lên từng điểm ảnh để biến đổi giá trị cường độ của nĩ Hàm biến đổi như vậy gọi là hàm tốn tử điểm ảnh

Tác động của tốn tử điểm ảnh cĩ thể được mơ tả như sau: Giả sử giá trị

cường độ sáng của điểm ảnh ban đầu g[m,n] là u và giá trị cường độ sáng của điểm ảnh sau khi biến đổi g’[m,n] là v và gọi hàm tốn tử điểm ảnh là T thì:

Với N là số mức cường độ sáng của ảnh trước khi biến đổi g[m,n] Hàm T cĩ thể là một hàm tuyến tính hoặc phi tuyến

Tốn tử điểm ảnh cĩ thể coi như hoạt động giống như một bản tra LUT (look

up table) với N cột tra Nĩ thực hiện phép biến đổi nhanh giữa các giá trị u và các giá trị v mà khơng cần phải tính tốn Tương ứng với mỗi giá trị u vào sẽ cĩ một giá trị v ra Điều này làm cho quá trình biến đổi ảnh nhanh hơn rất nhiều

Trang 33

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

27

2.2.1.2 Thực hiện phép biến đổi khơng gia

Phép biến đổi khơng gian như trên đã nĩi là nhằm đưa tín hiệu biểu diễn sang một vùng khơng gian mới mà tại khơng gian đĩ các đặc trưng của tín hiệu sẽ thể hiện rõ hơn và bởi vậy mà giúp cho quá trình xử lý thuận tiện hơn

Trong kỹ thuật xử lý ảnh, ta thường dùng phép biến đổi Fourier để đưa tín hiệu ảnh về miền khơng gian tần số Sau khi xử lý ta lại dùng biến đổi Fourier ngược để đưa tín hiệu quay về khơng gian điểm ảnh Hai phép biến đổi Fourier thường được sử dụng nhiều là biến đổi Fourier rời rạc và biến đổi Fourier nhanh

2.2.2 Nâng cao chất lƣợng ảnh

2.2.2.1.Khơi phục ảnh

Nhiễu và mơ hình nhiễu:

Ảnh được coi là một miền đồng nhất về mức xám, tức là các điểm ảnh lân cận cĩ sự biến đổi liên tục về mức xám.Như vậy sau quá trình số hĩa thì trong mỗi cửa sổ đang xét các điểm ảnh đều cĩ giá trị gần bằng như nhau Thực tế quan sát cĩ điểm ảnh cĩ giá trị khác hơn nhiều so với các điểm ảnh khác Đĩ chính là nhiễu Như vậy, nhiễu trong ảnh số được xem như là sự dịch chuyển đột ngột của tín hiệu thu nhận trên một khoảng cách nhỏ

g(x,y)

Tín hiệu nhiễu η(x,y)

Tín hiệu ảnh g’(x,y)

Trang 34

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

28

+ Mơ hình rời rạc:

Trên cơ sở mơ hình nhiễu liên tục, ta cĩ thể xây dựng một mơ hình nhiễu rời

rạc tương ứng với ảnh số Khi đĩ g(x,y) sẽ chuyển thành ảnh rời rạc g[m,n], ảnh liên

tục g’(x,y) sẽ chuyển thành ma trận điểm ảnh g’[m,n] và nhiễu cũng phân bố rời rạc

tại các điểm ảnh η[m,n] Giả sử H là hàm tuyến tính bất biến trong phạm vi M N(

Các tín hiệu nhiễu thường được chia thành các loại chính như sau:

Nhiễu do thiết bị thu nhận ảnh là loại nhiễu gây ra do giới hạn nhiễu xạ và

quang sai của thấu kính, nhiễu do bộ phận cảm quang, ảnh mờ nhịe do ống kính,

nhiễu do rung động trong quá trình thu nhận

Nhiễu ngẫu nhiên độc lập là các loại nhiễu gây ra do ảnh hưởng của mơi

trường xung quanh, do ảnh hưởng của khí quyển

Nhiễu do vật quan sát Đây là nhiễu gây ra do bề mặt của bản thân vật cĩ độ

nhám gồ ghề Chính nhiễu này gây hiện tượng tán xạ của các tia đơn sắc và sinh ra

hiện tượng nhiễu lốm đốm

Thường người ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất biến

vì cĩ nhiều cơng cụ tuyến tính cĩ thể giải quyết vấn đề khơi phục ảnh hơn là các

cơng cụ phi tuyến Việc xử lý nhiễu bằng cách xấp xỉ tuyến tính cũng giúp cho cơng

việc dễ dàng hơn trong trường hợp dùng cách biến đổi phi tuyến

Các kỹ thuật lọc nhiễu

+ Lọc nhiễu tuyến tính

Trong phần này chúng ta sẽ xét hai kỹ thuật lọc tuyến tính hay sử dụng là lọc

ngược và lọc giả ngược

► Lọc ngược (inverse filter):

Trang 35

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

Nếu dùng biến đổi Fourier ta cĩ:

] , [

] , [ ] , [

] , [ ] , [

'

v u H

v u N v u H

v u G v u

G với N[u,v] là nhiễu ước lượng (2.13) Nếu H[u,v] = 0 hoặc khá nhỏ thì hệ thống khơi phục sẽ khơng ổn định (hàm

Tuy bộ lọc ngược cĩ khả năng ngăn nhiễu do hệ thống nhận ảnh gây ra khá tốt nhưng việc thiết kế bộ lọc này lại là khá phức tạp

► Lọc giả ngược (Pseudoinverse filter):

Kỹ thuật lọc này khắc phục được nhược điểm của kỹ thuật lọc ngược là làm

cho hàm H T [u,v] luơn xác định:

Trang 36

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

30

1 khi H[u,v]

[ , ] [ , ]

0 khi H[u,v]

Với ε là một giá trị cho trước

Trong trường hợp ảnh nguyên gốc g[m,n] chuyển động tịnh tiến theo phương

x và y sinh ra hiện tượng nhịe ảnh thì H T

[u,v] sẽ được xác định theo các thơng số

chuyển động, và lọc giả ngược cĩ khả năng khơi phục được ảnh nhịe này

+ Lọc nhiễu lốm đốm:

Ta đã biết nhiễu lốm đốm gây ra do tính chất gồ ghề của bề mặt vật thể gây

ra hiện tượng tán xạ các tia đơn sắc Phần này ta sẽ nghiên cứu một kỹ thuật lọc nhiễu lốm đốm là kỹ thuật trung bình thống kê sử dụng bộ lọc đồng cầu

Kỹ thuật lọc nhiễu trung bình thống kê tiến hành thống kê các cường độ sáng của đối tượng ảnh bị nhiễu lốm đốm bằng N lần thu nhận độc lập và lấy trung bình các cường độ đĩ

Ta giả thiết hệ thống chỉ cĩ nhiễu lốm đốm và nhiễu này cĩ thể coi như tổng

vơ hạn các pha độc lập và đồng nhất Ta cĩ thể biểu diễn nhiễu lốm đốm như sau:

1

Với aR và a1 là các biến ngẫu nhiên độc lập phân bố theo Gauss, ứng với mỗi

tọa độ [m,n] thì trị trung bình bằng 0 với phương sai ζ2 Ta cĩ cường độ s:

2 2 1

m g g

nm,g,N

1nm,

1

N 1 i i '

(2.17) Trong đĩ sN[m,n] là trị trung bình thống kê của trường cường độ nhiễu lốm đốm + Lọc đồng cầu:

Nếu lấy logarit cơ số 2 của biểu thức 1.17 ta thu được:

Trang 37

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

Đặt w n m n, log g m n z m n n , , log g m n, , n m n, log sn m n, thì ta

cĩ mơ hình quan sát cĩ nhiễu lốm đốm như sau:

Trong cơng thức 1.19 thì ηn[m,n] là nhiễu trắng dừng.Với n >=2 thì η n [m,n]

cĩ thể mơ tả gắn với nhiễu ngẫu nhiên Gauss với mật độ phổ được định nghĩa như sau:

N

/1

6/)

,(

2 2 2 1

► Tăng cường độ tương phản

Độ tương phản đánh giá mức độ chênh lệch cường độ sáng của các đối tượng ảnh so với nền tức là đánh giá sự nổi bật của các đối tượng trong ảnh so với nền Ảnh cĩ tương phản thấp là do điều kiện chiếu sáng kém hoặc do tính khơng tuyến tính của bộ cảm nhận

Tăng cường độ tương phản là việc biến đổi biên độ ảnh đầu vào bằng hàm tuyến tính hay phi tuyến để thu được biên độ ra lớn hơn Trong quá trình thu nhận mẫu phục vụ cho bài tốn nhận dạng chữ ta cần thực hiện việc tăng cường độ tương phản của ảnh để làm nổi bật phần chữ trên nền phần giấy

Một ví dụ về tăng cường độ tương phản bằng hàm tuyến tính cho bởi cơng thức sau:

N

u b V b) - (u

b

u a V a) - (u

a u 0

u f(u)

T(u)

b

a v

(2.21)

Trang 38

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

32

Trong đĩ N là số lượng mức xám thường là 256, các hệ số α, β, γ xác định độ tương phản tương đối Tuỳ theo giá trị của ba hệ số α, β, γ mà ta cĩ một số trường hợp cụ thể như sau:

► Tách nhiễu và phân ngưỡng

Trong trường hợp ta biết khoảng biên độ tín hiệu ảnh vào (dải mức xám), ta

cĩ thể dùng kỹ thuật tách nhiễu để lấy riêng khoảng biên độ này ra như vậy sẽ loại được các phần nhiễu ở ngồi khoảng đĩ

Ví dụ, giả thiết ta biết khoảng biên độ ảnh vào nằm trong khoảng [a,b] thì việc tách nhiễu cĩ thể coi là trường hợp tăng độ tương phản với α = γ và β 0

N u b 1 - N

b u a

a

u 0 0

v

(2.22) Như vậy sau khi biến đổi khoảng biên độ [a,b] đã tách riêng ra cịn các khoảng khác được chuyển về 0 hoặc N-1 do đĩ ta cĩ thể tách khoảng biên độ [a,b] một cách dễ dàng

Trường hợp đặc biệt, nếu a = b = threshold ( ngưỡng )thì đầu vào sẽ chỉ cịn

hai mức xám là 0 và N-1 Trường hợp này gọi là sự phân ngưỡng Phân ngưỡng dùng để chuyển đổi ảnh xám sang ảnh nhị phân Kỹ thuật này dùng trong bài tốn nhận dạng chữ viết nhằm mục đích tạo mẫu ảnh nhị phân

Sử dụng tốn tử khơng gian :

Ta cĩ thể sử dụng một số bộ lọc khơng gian (tốn tử khơng gian) để loại bỏ một số loại nhiễu trong ảnh

► Lọc nhiễu khơng gian trung bình

Trang 39

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

33

Trong kỹ thuật này ta sử dụng một cửa sổ lọc rà khắp mặt phẳng ảnh Cửa sổ này thường cĩ kích thước Giá trị mức xám của điểm ảnh trung tâm bộ lọc sẽ được thay thế bằng trung bình cĩ trọng số giá trị các mức xám của các điểm thuộc cửa sổ

bộ lọc Cĩ thể mơt tả phương trình biến đổi của bộ lọc như sau:

Với h[k,l] là các giá trị trọng số và cũng là giá trị của mặt nạ bộ lọc, u[m,n]

là các giá trị của mặt phẳng đầu vào Với việc lấy trung bình như vậy, nhiễu sẽ giảm đáng kể

Thường dùng các mặt nạ khơng gian trung bình như sau:

Hình 1.6: Một số các mặt nạ khơng gian trung bình

(Khi ta áp dụng mặt nạ như vậy thì giá trị mức xám của điểm ảnh sau lọc nhiễu là trung bình cộng của các giá trị trọng số trong mặt nạ Do vậy khi dùng mặt

nạ lọc 3 3thì ta phải tính tổng các phần tử rồi nhân với

Trang 40

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/

34

► Lọc Gaussian:

Mặt nạ bộ lọc Gaussian được xây dựng từ hàm Gaussian:

2 2 2

1

22

Thuật tốn tính tốn cho bộ lọc trung vị cĩ thể được mơ tả như sau:

+) Sắp xếp các phần tử ảnh thuộc cửa sổ theo thứ tự tăng dần hoặc giảm dần +) Chọn ra phần tử trung vị (chính là phần tử cĩ chỉ số n2/2+1) và thay giá trị trung tâm cửa sổ bằng giá trị này Các phần tử khác giữ nguyên giá trị

Cĩ thể cửa sổ lọc trung vị dạng chữ thập để thay thế cho mặt nạ hình vuơng Mặt nạ loại này thì kết quả thu được sẽ khả quan hơn mặt nạ hình vuơng

Ngày đăng: 19/11/2014, 19:57

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Một số hàm liên thuộc cơ bản - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.1 Một số hàm liên thuộc cơ bản (Trang 9)
Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.2 Đồ thị minh hoạ nguyên lý suy rộng mờ (Trang 15)
Hình 1.3: Hàm liên thuộc của biến ngôn ngữ T(tuổi) - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.3 Hàm liên thuộc của biến ngôn ngữ T(tuổi) (Trang 17)
Hình 1.5: Mô hình suy luận mờ một luật-nhiều tiền đề - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.5 Mô hình suy luận mờ một luật-nhiều tiền đề (Trang 20)
Hình 1.4: Mô hình suy luận mờ với một luật-một tiên đề - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.4 Mô hình suy luận mờ với một luật-một tiên đề (Trang 20)
Hình 1.6 : Mô hình suy luận mờ hai luật hai tiên đề - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.6 Mô hình suy luận mờ hai luật hai tiên đề (Trang 21)
Với C 1 ’, C 2 ’ là tập mờ được suy diễn từ luật 1 và 2. Hình vẽ 2.7 cho thấy về  mặt hình học thuật toán suy diễn mờ với luật phức hợp và nhiều tiền đề - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
i C 1 ’, C 2 ’ là tập mờ được suy diễn từ luật 1 và 2. Hình vẽ 2.7 cho thấy về mặt hình học thuật toán suy diễn mờ với luật phức hợp và nhiều tiền đề (Trang 22)
Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.8 Cấu trúc cơ bản của hệ chuyên gia (Trang 23)
Hình 1.9: Quá trình nhận dạng - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.9 Quá trình nhận dạng (Trang 25)
Hình 2.1 : Toán tử tuyến tính - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 2.1 Toán tử tuyến tính (Trang 30)
Hình 2.2: Mặt nạ bộ lọc tuyến tính  3 3 Điểm trung tâm của mặt nạ p 5  sẽ được tính toán theo công thức sau: - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 2.2 Mặt nạ bộ lọc tuyến tính 3 3 Điểm trung tâm của mặt nạ p 5 sẽ được tính toán theo công thức sau: (Trang 31)
Hình 2.3 : Toán tử điểm ảnh - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 2.3 Toán tử điểm ảnh (Trang 32)
Hình 2.4: Mô hình nhiễu - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 2.4 Mô hình nhiễu (Trang 33)
Hình 2.5: Lọc ngƣợc khôi phục ảnh nguyên gốc. - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 2.5 Lọc ngƣợc khôi phục ảnh nguyên gốc (Trang 35)
Hình 1.6: Một số các mặt nạ không gian trung bình - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 1.6 Một số các mặt nạ không gian trung bình (Trang 39)
Hình 2.7: Mặt nạ lọc thông thấp - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 2.7 Mặt nạ lọc thông thấp (Trang 39)
Hình 2.8: Cửa sổ lọc giả trung vị - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 2.8 Cửa sổ lọc giả trung vị (Trang 40)
Hình 2.11: Biểu diễn mẫu bằng tập kí hiệu - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 2.11 Biểu diễn mẫu bằng tập kí hiệu (Trang 48)
Hình 3.1 : Các công đoạn của bài toán nhận dạng ảnh - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 3.1 Các công đoạn của bài toán nhận dạng ảnh (Trang 50)
Hình 3.4: Giao diện chương trình nhận dạng - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 3.4 Giao diện chương trình nhận dạng (Trang 54)
Hình 3.5: Vẽ chữ cần nhận dạng. - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 3.5 Vẽ chữ cần nhận dạng (Trang 55)
Hình 3.6: Kết quả nhận dạng sau khi vẽ chữ. - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 3.6 Kết quả nhận dạng sau khi vẽ chữ (Trang 55)
Hình 3.7: Mở file ảnh ký tự cần nhận dạng. - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 3.7 Mở file ảnh ký tự cần nhận dạng (Trang 56)
Hình 3.8: Giao diện sau khi mở file ảnh ký tự. - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 3.8 Giao diện sau khi mở file ảnh ký tự (Trang 57)
Hình 3.9: Kết quả sau khi nhận dạng ảnh ký tự - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 3.9 Kết quả sau khi nhận dạng ảnh ký tự (Trang 57)
Hình 3.10: Ghi ký tự ra file ảnh - Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay
Hình 3.10 Ghi ký tự ra file ảnh (Trang 58)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w