Hiện nay có nhiều phương pháp thiết kế nhằm thu được các mẫu phục vụ cho việc xử lý trên mạng CNN. Ta có thể chia các phương pháp thiết kế mẫu theo cách thức thực hiện. Cách chia này chỉ là tương đối vì một số kỹ thuật cũng có những phần giao nhau.
a. Sử dụng các mặt nạ trong kỹ thuật xử lý ảnh truyền thống
Dùng các mặt nạ đã được sử dụng, kiểm nghiệm trong quá trình xử lý ảnh trên máy tính số như các mẫu lọc trung bình (average), các mẫu co ảnh (erosion), dãn ảnh (dilation), ... Trong mạng CNN mặt nạ này được sử dụng làm ma trận cho phép thực hiện các phép biến đổi tương đương.
EDGE: Mẫu dò biên nhị phân
0 0 0 -1 -1 -1
A 0 1 0 B -1 8 -1 Z = -1
EDGEGRAY: mẫu xác định dải biên màu xám 0 0 0 -1 -1 -1 A 0 2 0 B -1 8 -1 Z = -0.5 0 0 0 -1 -1 -1 B sử dụng mặt nạ Laplace. b. Phương pháp hệ thống dùng bảng logic
Đây là phương pháp xác định các mẫu không liên kết cho các ứng dụng xử lý ảnh nhị phân. Bảng logic được mã hoá với các giá trị {0, 1} tức là trắng và đen, ngoài ra chúng ta cũng còn có thể mã hoá dữ liệu nhị phân là TRUE(1), FALSE(-1) và DON'T CARE(0). Khi thiết kế các mẫu CNN để thực hiện một hàm logic Fk ( . ) đã cho, chúng ta thường sử dụng các mẫu không liên kết được mã hoá và diễn tả như sau:
0 0 0 w-1,-1 w-1,0 w-1,1
A 0 a00 0 0 Bk w0,-1 w0,0 w0,1 Z (*)
0 0 0 w1,-1 w1,0 w1,1
Trong quá trình thiết kế chúng ta bắt đầu với các hàm logic 9 giá trị Fk (u1, u2,…, u9) mà giá trị khởi tạo khác không theo quy ước
u9 u8 u7
u6 u5 u4
u3 u2 u1
hoặc với bảng logic. Kết quả của thiết kế là một mẫu vô tính không liên kết với các thông số a0,0, b1, b2, b3,...,b9, z
Trong đó các bi theo (*) và do mạng CNN là lọai không liên kết nên a0,0 = 1. Bảng logic xây dựng gồm 29 trường hợp (tổ hợp của 9 giá trị u vào). Bắt đầu từ cửa sổ 0 tới 511. Trên hình 5 từ trái sang phải, từ trên xuống dưới là các cửa sổ 0, 1, 2, 16, 124, 186, 403.
Hình 3.9. Một số cửa sổ bảng logic
Hình 3.10. a) Ảnh đầu vào b) Ảnh đầu ra yêu cầu
Trên hình 5 từ trái sang phải, từ trên xuống dưới là các cửa sổ 0, 1, 2, 16, 124, 186, 403. Ví dụ: Giả sử chúng ta có một ảnh nhị phân với các đường có độ rộng 1 pixel. Hãy thực hiện tác vụ bằng CNN để tìm các các vị trí của các đường giao nhau 45 hoặc 90 độ.
Phía trái là ảnh đầu vào, phía phải là ảnh đầu ra. Hàm này là tổng của tích các minterm giá trị của F(.) mà tại đó giá trị =1. Chúng ta sử dụng mạng CNN không liên kết với a0,0 =1, z = - 8. Mẫu B được tìm như sau:
Xem trên hình 3.5 cửa sổ bảng logic cho giao nhau giữa 2 đường vuông góc (số 1) là cửa sổ 186. Giao nhau giữa đường ngang và đường chéo (số 3) là cửa cử sổ 124. Giữa đường đứng và các đường chéo (số 2 và số 4) là các cửa sổ 214 và 403.
Ta có: mẫu B cho các cửa sổ
-1 1 -1 -1 -1 1 -1 1 1 1 1 -1
1 1 1 1 1 1 -1 1 -1 -1 1 -1
-1 1 -1 1 -1 -1 1 1 -1 -1 1 1
cửa sổ 186 cửa sổ 124 cửa sổ 214 cửa sổ 403
Các mẫu A và z là:
-1 1 -1
A = 1 1 1 Z =-8
-1 1 -1
c. Phân tích hoạt động của CNN để tìm ra mẫu
Theo phương pháp này để tìm ra một tập mẫu trước hết cần phảỉ phân tích mô tả hoạt động của mẫu đó thành các tác vụ chi tiết – Các luật cục bộ (local rule) sau đó
dựa vào phương trình trạng thái và đồ thị quan hệ giữa biến trạng thái và đạo hàm bậc nhất của nó (đồ thị DP) để xác định mẫu.
d. Kỹ thuật thiết kế fuzzy
Lý thuyết tập mờ và logic mờ ( fuzzy sets and fuzzy logic) do giáo sư Lofti Zadeh công bố năm 1965. Lôgic mờ được thiết kế để làm việc với các sự kiện không chính xác. Mặc dù không được các hầu hết cộng đồng nghiên cứu ủng hộ trong phát triển lý thuyết, logic mờ vẫn được áp dụng và có nhiều thành công trong thực tiễn như trong hệ thống điện ô tô, máy điều hoà nhiệt độ, thang máy, máy giặt, máy rửa bát, các bộ lọc ngôn ngữ, xử lý ảnh số, ... Logic mờ cũng được áp dụng trong thiết kế các mẫu phục vụ cho các tác vụ CNN.
e Thiết kế mẫu dùng giải thuật di truyền
Thuật giải di truyền (Genetic algorithms - GA) có đặc điểm thích hợp với những bài toán dạng tối ưu. Bản chất của giải thuật di truyền là một giải thuật tìm kiếm ngẫu nhiên có định hướng (hàm thích nghi). Thuật gen có khả năng kiểm tra hết mọi trường hợp có thể của bài toán, nhưng đó là một sự kiểm tra ngẫu nhiên và có định hướng; khác với phương pháp vét cạn tất cả các trường hợp. Có thể xem thuật gen như là một phương pháp khám phá. Thuật giải di truyền không quan tâm đến nội dung của bài toán mà chỉ cần quan tâm đến vấn đề cần giải quyết của bài toán. Vì GA là một giải thuật ngẫu nhiên nên nếu có thể xác định được hàm phân bố ngẫu nhiên của bài toán thì việc giải quyết bài toán sẽ dễ dàng hơn. Các giải thuật leo đồi, luyện thép cũng đã được áp dụng để tìm kiếm mẫu. Tuy nhiên giải thuật di truyền không phải khi nào cũng cho kết quả tối ưu và giá thành tính toán đắt (Số lượng phép tính lớn). Mặc dù vậy do là một kỹ thuật tìm kiếm giải pháp dựa trên việc mô phỏng quá trình tiến hoá của tự nhiên nên hiện nay kỹ thuật này vẫn được các nhà nghiên cứu CNN áp dụng để tìm kiếm, thiết kế mẫu. Trong hội nghị quốc tế về CNN 8-2006 tại Thổ Nhĩ Kỳ vừa qua kỹ thuật này vẫn được ứng dụng trong một số báo cáo.
f. Phương pháp thiết kế mẫu trực tiếp
Đây là phương pháp dùng thiết kế mẫu cho xử lý ảnh nhị phân được Ákos Zarándy đề xuất. Phương pháp này được sử dụng để thiết kế mẫu khi nhiệm vụ yêu cầu đã được xác định chính xác. Các mẫu tìm được có thể là loại cho mạng CNN ghép cặp hoặc không ghép cặp. Trình tự tiến hành thiết kế mẫu theo phương pháp trực tiếp theo 4 bước như trong hình 3.11.
Định hình dạng mẫu
Tạo hệ thống quy luật quan hệ
Giải hệ thống quy luật quan hệ
Chọn mẫu mạnh nhất
Hình 3.11. Sơ đồ các bước thiết kế mẫu theo phương pháp trực tiếp.