Ứng dụng logic mờ trong nhận dạng chữ số viết tay bằng thuật toán phân chùm mờ c-Means

MỤC LỤC

Quá trình ra quyết định (hàm quyết định) Quá trình ra quyết định (decision) là tìm ra một luật trên

Nếu khoảng cách nhỏ hơn một ngưỡng nào đó ta coi hai đối tượng so sánh là giống nhau và gộp chúng vào một lớp. Lý thuyết xác suất có điều kiện đã được Bayesian nghiên cứu và chúng ta có thể áp dụng lý thuyết này để phân biệt đối tượng.

Sơ đồ tổng quan của hệ thống nhận dạng

Giá trị τ không thể đạt 100% vì có sự tồn tại sai số tự nhiên đối với những đối tượng sát biên và trên thực tế các đối tượng quan sát thu nhận là luôn luôn bị tác động bởi nhiễu. Thông thường để đánh giá hệ thống τ, hệ thống yêu cầu một tập các đối tượng quan sát để thử và đánh giá chất lượng đối tượng quan sát được nhận dạng khác với tập các đối tượng để học.

Một số thuật toán nhận dạng mờ

Các thuật toán phân hoạch

Một trong những thuật toán được sử dụng nhiều trong kỹ thuật nhận dạng mờ là thuật toán phân chùm mờ c-Means, tiếp theo chúng ta sẽ làm quen với thuật toán này. Đến đây một câu hỏi lý thú đặt ra là trong các phương án c-phõn hoạch rừ cho n mẫu dữ liệu, ta cú thể chọn ra c-phõn hoạch rừ nào thực sự tốt trong khụng gian phõn hoạch Mc?. Trong vớ dụ vừa nờu ra trong số 15 phương ỏn 2-phõn hoạch rừ cho 5 mẫu dữ liệu phương án phân lớp nào là tốt nhất?.

Một trong các tiêu chí thường được sử dụng trong các thuật toán là công thức tính tổng bình phương độ lệch khoảng cách Euclid. Ta thấy rằng khi giải quyết bài toán bằng phương pháp HCM có những điểm có thể thuộc vào lớp nào cũng được.

Thuật toán nhận dạng chữ số hai mức xám Bài toán điển hình trong nhận dạng mẫu như giới thiệu ở

Như vậy ta có thể dùng khái niệm nội tích và ngoại tích của vector mờ trong bài toán nhận dạng mẫu. Trong khi các vector được định nghĩa trên một tập không gian nền hữu hạn đếm được thì các tập mờ có thể được sử dụng để nói đến các tập có giá trị vô hạn. Trong các bài toán nhận dạng mẫu, thông thường ta phải so sánh mẫu cần nhận dạng với một số mẫu đã biết.

Một phương pháp được áp dụng phổ biến là đem so sánh mẫu cần nhận dạng với mỗi mẫu đã biết từng cặp một để xác định giá trị mức độ tiệm cận của mỗi cặp. Mẫu đã biết mà có giá trị mức độ tiệm cận lớn nhất sẽ là mẫu mà mẫu cần nhận dạng giống nhất theo nghĩa cực đại.

Thuật toán nhận dạng chữ số đa mức xám

Cho trước một chữ số chuẩn mi xác định bởi hàm thuộc àM(mi) trong phương trỡnh (3.36) và mẫu dữ liệu cần nhận dạng được biểu diễn bằng àD(dj) trong phương trỡnh (3.37). Ta đi xây dựng mô hình thuật toán mờ để nhận dạng được mẫu dữ liệu này. Ta định nghĩa hai phép tính θM lấy max và θm lấy min dưới đây dùng cho thuật toán:. Chúng ta định nghĩa. Kết quả của phép tính trên tạo ra một ma trận kích thước 256 x 256 với phép tính mờ ∨ được áp dụng theo cách tương tự trong phép nhân ma trận. Chú ý là trong θM chuyển vị của một toán hạng đối với toán hạng kia là có tính chất giao hoán tức là:. Tương tự đối với θM chúng ta định nghĩa:. Các phép toán mờ ở trên áp dụng cho các vector hàm thuộc cũng được áp dụng cho trường hợp khi mà các toán hạng là các chữ số chuẩn trong từ điển. Trong trường hợp đặc biệt này phép toán ∧ trở thành phép AND logic và phép tính ∨ trở thành phép tính OR logic trong thuật toán Boolean. Giá trị sử dụng của logic mờ sẽ bị giới hạn đáng kể nếu ta chỉ hạn chế sử dụng trong ba phép tính mờ ∧, ∨ và  này, các biến mờ ài, àj cũng cú thể được thực hiện trờn cỏc phộp tớnh khác. Bằng việc mở rộng khái niệm các hàm của các biến mờ, lý thuyết tập mờ có thể trở thành một công cụ mạnh trong thiết kế một hệ thống nhận dạng hữu hiệu. Ta sử dụng θM[] và θm[] để tạo thành các hàm hợp của các biến mờ. Tương ứng chúng ta gọi hiệu của hai ma trận này là ma trận nhân, ký hiệu:. Các phần tử trong ma trận nhân có thể được mô tả theo các hàm thuộc. Nói cách khác, phép toán này thuộc bộ từ điển. Phép toán quan hệ này thực ra là phép toán Boolean và là trường hợp đặc biệt của hàm hợp các biến mờ. Giả sử phép toán quan hệ trên được thực hiện giữa các vector hàm thuộc của các mẫu dữ liệu cần nhận dạng và các chữ số chuẩn. Điều này dẫn đến một ma trận như sau:. Để minh họa ta có ví dụ:. Khai triển phương trình ta được:. Do đó ta có thể kết luận. Ta nhận thấy rằng giá trị các phần tử của ma trận nhân ). Giá trị của các phần tử ngoài đường chéo của ma trận nhân chính là lấy độ lệch tương quan của giá trị hàm thuộc của một điểm ảnh với tất cả các điểm ảnh khác của ma trận ảnh, trừ điểm ảnh có vị trí tương ứng. Căn cứ vào các nhận xét trên ta thấy rằng có thể dùng các giá trị của ma trận nhân phục vụ cho việc đối sánh giữa các mẫu cần nhận dạng và chữ số chuẩn từ việc đánh giá các giá trị này có thể đưa ra một quyết định khá chắc chắn cho việc nhận dạng mẫy chữ số.

Thuật toán giải quyết nhận dạng: Tư tưởng xây dựng thuật toán ở đây là đánh giá độ tương quan giữa mẫu cần nhận dạng với các chữ số chuẩn trong từ điển dữ liệu thông qua các giá trị của ma trận nhân. Cho dù khái niệm thiết kế kỹ thuật nhận dạng mờ này khác với kỹ thuật nhận dạng mờ bằng phương pháp ma trận nhân, nhưng các công cụ toán học cơ sở được sử dụng ở hai kỹ thuật nhận dạng mờ giống nhau. Bài toán đặt ra ở đây là giả sử ta có một dữ liệu cần nhận dạng được mụ tả bởi một vector hàm thuộc àD(dj) và một bộ từ điển chữ số chuẩn, hãy sử dụng các phép toán mờ cũng như các phép toán Boolean để nhận ra mẫu dữ liệu đó là ký chữ số nào trong bộ từ điển.

Bài toán nhận dạng ở đây được giải quyết dựa trên nhận xét sau: nếu ta xếp chồng ảnh chữ số số "2" và phần bù của nó thì ta sẽ được một hình mầu đen hay có nghĩa là tổng các giá trị hàm thuộc của nó sẽ có giá trị lớn nhất.

Xây dựng ứng dụng

Không gian biểu diễn đối tượng

Qúa trình học

DataFile lưu tên file dữ liệu của mẫu, PictureFile lưu tên file ảnh của mẫu này. Bài toán học : Mỗi một mẫu đưa vào sẽ được chia thành các ô với R_grid cột và H_grid hàng sử dụng hàm GetPixel để lấy giá trị màu của điểm ảnh. Nếu giá trị này khác giá trị nền thì được coi là điểm ảnh thuộc chữ số, như vậy mỗi ô lưới sẽ có nhiều điểm ảnh và ta có thể đặt một ngưỡng lọc ví dụ nếu số điểm ảnh thuộc chữ số trong ô > k thì giá trị ô được tính =1 ngược lại = 0.

Xác định vùng ảnh chữ số thật sự bằng cách tìm biên trên, dưới, trái, phải của ảnh. Bước 3: Lưu trữ mẫu này thành file dữ liệu trong thư mục của chữ số được học với tên file là một số nguyên ngẫu nhiên và đảm bảo rằng file này chưa tồn tại trước đó.

Qúa trình nhận dạng và ra quyết định

Trên đây là các bước tiến hành nhận dạng trường hợp một đối tượng, với trường hợp nhiều đối tượng ta làm tương tự cho từng đối tượng sau đó thêm một bước nữa là chọn ra đối tượng có δ nhỏ nhất.

1 Những điều đã đạt được

Lý thuyết tập mờ vốn là một công cụ hiệu quả để ra quyết định vì vậy ta có thể ứng dụng nó vào bài toán nhận dạng chữ số. Nội dung của tiểu luận này là ứng dụng lý thuyết tập mờ xây dựng kỹ thuật nhận dạng mờ áp dụng trong bài toán nhận dạng chữ số. Nhận dạng chữ (chữ in và chữ viết tay) là một trong những vấn đề nhận dạng ảnh nhằm mục đích tự động hoá quá trình thu nhận các thông tin dạng chữ.

Cách thức thu thập thông tin bằng phương pháp nhận dạng tự động chữ viết mang nhiều ý nghĩa thực tiễn. Có thể kể ra đây một số ứng dụng dựa trên khả năng nhận dạng chữ đã được nghiên cứu và đưa vào sử dụng như: tự động đọc văn bản chữ in, hệ thống kiểm tra các thông số ghi trên sản phẩm, hệ thống số liệu hoá bản đồ, hệ thống tự động phân loại các thư từ và bưu kiện, hệ thống thống kê tự động các phiếu điều tra v.v.

2 Những vấn đề tồn tại