Nếu biểu diễn hình dạng đối tượng dựa trên thơng tin đường bao thì cần phải dị và đi dọc theo biên ảnh. Nếu biểu diễn hình dạng dựa trên vùng diện tích ảnh mà đối tượng chiếm chỗ thì cần phải phân đoạn ảnh trong một vài vùng đồng nhất.
Đối với các đối tượng có hình dạng đơn giản như hình trịn, hình vng, hình tam giác,…thì ta sẽ dễ dàng dùng các nét đặc trưng đơn giản để mơ tả hình dạng của đối tượng đó. Tuy nhiên, vì đối tượng cá khi bơi trong nước có rất nhiều hình dạng phức tạp, do đó các nét đặc trưng đơn giản khơng đủ để mơ tả mà địi hỏi phải sử dụng các phương pháp phức tạp hơn.
Phương pháp lưới:
Phương pháp này sử dụng một lưới vng chuẩn trùm lên đối tượng. Khi đó, số lượng điểm cắt của mỗi nan lưới dọc và ngang với đối tượng sẽ là đặc trưng của đối tượng đang xét. Bên cạnh đó, số lượng mắt lưới vng trùm lên đối tượng theo chiều dọc và ngang cũng được dùng làm đặc trưng của đối tượng. Mỗi đường dọc và ngang của lưới sẽ được gán cho mỗi trọng số nhất định.
Phương pháp cung:
Phương pháp này sử dụng một lưới hình vành khăn với các nan lưới tạo thành vòng tròn đồng tâm để trùm lên đối tượng. Bằng cách sử dụng lưới hình vành khăn này, phương pháp cung có thể loại bỏ sự ảnh hưởng của hướng đối tượng trong phương pháp lưới. Tâm của các vịng trịn do các nan lưới tạo ra chính là điểm trung tâm hay chính là điểm trọng tâm của đối tượng mà ta cần xác định trước tiên. Từ điểm trung tâm, vẽ các bán kính chuẩn chia đều các đường trịn thành các cung. Khi đó, số lượng điểm cắt với đối tượng dọc theo bán kính sẽ là đặc trưng của đối tượng. Giống như phương pháp lưới, số lượng cung phủ lên đối tượng xét trong một
hình vành khăn là một đặc trưng. Mỗi bán kình và các hình vành khăn sẽ được gán một trọng số.
Hai phương pháp trên đều dựa trên cơ sở dữ liệu dạng lưới. Một cách tiếp cận khác là tiến hành chuyển đổi dữ liệu dạng lưới sang dạng vector. Khi xử lý trên cơ sở dữ liệu vector có nhiều ưu điểm hơn. Việc chuyển đổi từ dạng dữ liệu dạng lưới sang dạng biểu diễn vector thường thực hiện theo 2 hướng sau: [14]
Tìm đường bao của đối tượng và biểu diễn. Tim khung xương của đối tượng và biểu diễn.
Phương pháp biểu diễn vector bằng chuỗi Fourier [14]
Trong phương pháp này, đường bao hay khung xương của đối tượng sẽ được biểu diễn thành dạng đa giác khép kín. Tìm điểm khởi đầu để bắt đầu việc đi dọc theo đường biên của đa giác theo chiều kim đồng hồ. Sự thay đổi tương đối về góc
∆𝜙 của các cạnh đa giác sẽ được lần lượt tính tốn và biểu diễn như một hàm của độ dài đường đi ℓ kể từ điểm khởi đầu. Tức là hàm 𝜙(ℓ) sẽ biểu diễn sự chênh lệch về góc so với hướng bắt đầu của một cạnh mà vị trí cạnh đó được xác định theo độ dài đường đi trong độ dài tổng cộng của đa giác. Vì đa giác khép kín nên 𝜙(ℓ) ứng với ℓ = L sẽ bằng 2π.
Khi ta tiêu chuẩn hóa độ dài đường đi ℓ trong khoảng (0, L) bằng biến t trong khoảng (0, 2π) và góc chênh lệch có giá trị bằng 0 tại 2π thì thu được hàm tiêu
chuẩn 𝜙(t).
𝜙′(𝑡) = 𝜙 (𝐿𝑡 2𝜋) + 𝑡
(2.18)
Hàm 𝜙′(𝑡) là 1 hàm tuần hồn. Vì vậy, ta có thể biểu diễn nó dưới dạng
Fourier:
𝜙′(𝑡) = 𝜇0+ ∑ 𝐴𝑛
∞
𝑛=0
cos (𝑛𝑡 − 𝛼𝑛) (2.19)
Có thể tính tốn các hệ số biên độ 𝐴𝑛 và dịch pha 𝛼𝑛trực tiếp từ đa giác với đỉnh như sau:
𝜇0 = −𝜋 −1 𝐿∑ 𝑙𝑘∆𝜙 ∞ 𝑘=1 (2.20) 𝛼𝑛 = − 1 𝑛𝜋∑ ∆𝜙 𝜕∞ 𝑘=𝑙 𝑠𝑖𝑛2𝜋𝑛𝑙𝑘 𝐿 = 𝐴𝑛𝑠𝑖𝑛𝛼𝑛 (2.21) 𝑏𝑛 = − 1 𝑛𝜋∑ ∆𝜙 𝜕∞ 𝑘=𝑙 𝑐𝑜𝑠2𝜋𝑛𝑙𝑘 𝐿 = 𝐴𝑛𝑐𝑜𝑠𝛼𝑛 (2.22) Với: 𝑙𝑘 = ∑ ∆𝑙𝑖 𝑘 𝑘=𝑙 (2.23) Trong đó: ∆𝑙𝑖 là độ dài cạnh thứ i
∆𝜙 là độ lệch góc tương đối tại đỉnh thứ i
𝐴𝑛 và 𝛼𝑛 chính là tọa độ cực 𝑎𝑛 và 𝑏𝑛. Cả 2 thông số này đều không phụ thuộc vào độ lớn của đối tượng. Mặt khác, 𝐴𝑛 không phụ thuộc vào hướng của đối tượng, còn
𝛼𝑛 vẫn phụ thuộc vào sự lựa chọn điểm khởi đầu.
Việc tiêu chuẩn hóa hàm 𝜙(t) thành hàm 𝜙′(𝑡) là loại trừ được sự phụ thuộc
vào tỷ lệ của đối tượng. Giá trị góc lệch 𝜙′(𝑡) được xem như góc tiếp tuyến tại
điểm khởi đầu cho nên sẽ bất biến với việc xoay của đối tượng.
Kết quả của q trình trích chọn đặc trưng cho một đối tượng theo phương pháp này là một tập bao gồm R giá trị của hàm 𝜙′(𝑡) với bước tính:
∆= 2𝜋(𝑅 − 1) (2.24)
Các giá trị này được xem là các thành phần của vector biểu diễn mẫu vector đặc trưng 𝑃 = (𝑝1, 𝑝2, … . , 𝑝𝑛). Như vậy, không gian mẫu sẽ có R chiều.
2.3.6. Nhận dạng ảnh
Nhận dạng ảnh là giai đoạn cuối của hệ thống xử lý ảnh. Nhận dạng là tìm ra quy luật và các thuật tốn để có thể gắn đối tượng vào một lớp hay nói một cách khác là gán cho đối tượng một tên. Có ba cách để thực hiện việc nhận dạng ảnh:
Nhận dạng dựa vào phân hoạch không gian. Nhận dạng dựa vào cấu trúc.
Nhận dạng dựa vào kỹ thuật mạng nơ-ron.
Trong đề tài này, tác giả sử dụng kỹ thuật mạng nơ-ron để nhận dạng ảnh cá và ảnh tạp.
Chương 3
LÝ THUYẾT MẠNG THẦN KINH NHÂN TẠO
3.1. Mơ hình nơ-ron nhân tạo
Mạng thần kinh nhân tạo (mạng nơ-ron nhân tạo) là mơ hình tốn học đơn giản của bộ não con người, bản chất mạng thần kinh nhân tạo là mạng tính tốn phân bố song song. Trái với các mơ hình tính tốn thơng thường, hầu hết các mạng thần kinh phải được huấn luyện trước khi sử dụng.
Năm 1944, Mc.Culloch và Pits đã đề ra cấu trúc cơ bản của một nơ-ron trong mơ hình mạng nơ-ron nhân tạo để từ đó có thể xây dựng một mơ hình nơ-ron nhân tạo giống với hệ nơ-ron của con người.