Trích đặc trưng của đối tượng

Chương 2 : LÝ THUYẾT XỬ LÝ ẢNH

2.3. Nội dung lý thuyết xử lý ảnh dùng trong đề tài

2.3.5. Trích đặc trưng của đối tượng

Trích đặc trưng của đối tượng là trích rút ra được các thuộc tính đặc trưng riêng của đối tượng trong vùng ảnh được tách ra. Sau đó, mỗi đặc tính của đối tượng sẽ được mô tả bằng giá trị số. Tập hợp các giá trị này tạo thành các vector mô tả mẫu.

Việc trích chọn các đặc điểm đạt hiệu quả sẽ giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính tốn nhanh và dung lượng nhớ lưu trữ giảm xuống.

Một số phương pháp trích đặc trưng ảnh:

- Phương pháp trích chọn đặc trưng theo màu sắc. - Phương pháp trích chọn đặc trưng theo kết cấu. - Phương pháp trích chọn đặc trưng theo hình dạng.

Trong đề tài này, tác giả sử dụng phương pháp trích đặc trưng ảnh theo hình dạng của đối tượng. Với phương pháp này thì việc biểu diễn hình dạng của đối tượng trong ảnh được chia thành hai kiểu: theo đường bao (biên) và theo vùng diện tích mà đối tượng chiếm chỗ.

Hình 2.5 Biễu diễn hình dạng theo đường bao và theo vùng

Nếu biểu diễn hình dạng đối tượng dựa trên thơng tin đường bao thì cần phải

dị và đi dọc theo biên ảnh. Nếu biểu diễn hình dạng dựa trên vùng diện tích ảnh mà đối tượng chiếm chỗ thì cần phải phân đoạn ảnh trong một vài vùng đồng nhất.

Đối với các đối tượng có hình dạng đơn giản như hình trịn, hình vng, hình tam giác,…thì ta sẽ dễ dàng dùng các nét đặc trưng đơn giản để mơ tả hình dạng của đối tượng đó. Tuy nhiên, vì đối tượng cá khi bơi trong nước có rất nhiều hình dạng phức tạp, do đó các nét đặc trưng đơn giản khơng đủ để mơ tả mà địi hỏi phải sử dụng các phương pháp phức tạp hơn.

Phương pháp lưới:

Phương pháp này sử dụng một lưới vng chuẩn trùm lên đối tượng. Khi đó,

số lượng điểm cắt của mỗi nan lưới dọc và ngang với đối tượng sẽ là đặc trưng của đối tượng đang xét. Bên cạnh đó, số lượng mắt lưới vng trùm lên đối tượng theo chiều dọc và ngang cũng được dùng làm đặc trưng của đối tượng. Mỗi đường dọc và ngang của lưới sẽ được gán cho mỗi trọng số nhất định.

Phương pháp cung:

Phương pháp này sử dụng một lưới hình vành khăn với các nan lưới tạo

thành vòng tròn đồng tâm để trùm lên đối tượng. Bằng cách sử dụng lưới hình vành khăn này, phương pháp cung có thể loại bỏ sự ảnh hưởng của hướng đối tượng trong phương pháp lưới. Tâm của các vịng trịn do các nan lưới tạo ra chính là điểm trung tâm hay chính là điểm trọng tâm của đối tượng mà ta cần xác định trước tiên. Từ điểm trung tâm, vẽ các bán kính chuẩn chia đều các đường trịn thành các cung. Khi đó, số lượng điểm cắt với đối tượng dọc theo bán kính sẽ là đặc trưng của đối tượng. Giống như phương pháp lưới, số lượng cung phủ lên đối tượng xét trong một

hình vành khăn là một đặc trưng. Mỗi bán kình và các hình vành khăn sẽ được gán một trọng số.

Hai phương pháp trên đều dựa trên cơ sở dữ liệu dạng lưới. Một cách tiếp cận khác là tiến hành chuyển đổi dữ liệu dạng lưới sang dạng vector. Khi xử lý trên cơ sở dữ liệu vector có nhiều ưu điểm hơn. Việc chuyển đổi từ dạng dữ liệu dạng lưới sang dạng biểu diễn vector thường thực hiện theo 2 hướng sau: [14]

 Tìm đường bao của đối tượng và biểu diễn.

 Tim khung xương của đối tượng và biểu diễn.

Phương pháp biểu diễn vector bằng chuỗi Fourier [14]

Trong phương pháp này, đường bao hay khung xương của đối tượng sẽ được biểu diễn thành dạng đa giác khép kín. Tìm điểm khởi đầu để bắt đầu việc đi dọc theo đường biên của đa giác theo chiều kim đồng hồ. Sự thay đổi tương đối về góc

∆𝜙 của các cạnh đa giác sẽ được lần lượt tính tốn và biểu diễn như một hàm của độ

dài đường đi ℓ kể từ điểm khởi đầu. Tức là hàm 𝜙(ℓ) sẽ biểu diễn sự chênh lệch về góc so với hướng bắt đầu của một cạnh mà vị trí cạnh đó được xác định theo độ dài đường đi trong độ dài tổng cộng của đa giác. Vì đa giác khép kín nên 𝜙(ℓ) ứng với ℓ = L sẽ bằng 2π.

Khi ta tiêu chuẩn hóa độ dài đường đi ℓ trong khoảng (0, L) bằng biến t trong

khoảng (0, 2π) và góc chênh lệch có giá trị bằng 0 tại 2π thì thu được hàm tiêu

chuẩn 𝜙(t).

𝜙′(𝑡) = 𝜙 (𝐿𝑡 2𝜋) + 𝑡

(2.18)

Hàm 𝜙′(𝑡) là 1 hàm tuần hồn. Vì vậy, ta có thể biểu diễn nó dưới dạng Fourier:

𝜙′(𝑡) = 𝜇0+ ∑ 𝐴𝑛

∞

𝑛=0

cos (𝑛𝑡 − 𝛼𝑛) (2.19)

Có thể tính tốn các hệ số biên độ 𝐴𝑛 và dịch pha 𝛼𝑛trực tiếp từ đa giác với

26 𝜇0 = −𝜋 −1 𝐿∑ 𝑙𝑘∆𝜙 ∞ 𝑘=1 (2.20) 𝛼𝑛 = − 1 𝑛𝜋∑ ∆𝜙 𝜕∞ 𝑘=𝑙 𝑠𝑖𝑛2𝜋𝑛𝑙𝑘 𝐿 = 𝐴𝑛𝑠𝑖𝑛𝛼𝑛 (2.21) 𝑏𝑛 = − 1 𝑛𝜋∑ ∆𝜙 𝜕∞ 𝑘=𝑙 𝑐𝑜𝑠2𝜋𝑛𝑙𝑘 𝐿 = 𝐴𝑛𝑐𝑜𝑠𝛼𝑛 (2.22) Với: 𝑙𝑘 = ∑ ∆𝑙𝑖 𝑘 𝑘=𝑙 (2.23) Trong đó: ∆𝑙𝑖 là độ dài cạnh thứ i

∆𝜙 là độ lệch góc tương đối tại đỉnh thứ i

𝐴𝑛 và 𝛼𝑛 chính là tọa độ cực 𝑎𝑛 và 𝑏𝑛. Cả 2 thông số này đều không phụ thuộc vào

độ lớn của đối tượng. Mặt khác, 𝐴𝑛 không phụ thuộc vào hướng của đối tượng, còn

𝛼𝑛 vẫn phụ thuộc vào sự lựa chọn điểm khởi đầu.

Việc tiêu chuẩn hóa hàm 𝜙(t) thành hàm 𝜙′(𝑡) là loại trừ được sự phụ thuộc

vào tỷ lệ của đối tượng. Giá trị góc lệch 𝜙′(𝑡) được xem như góc tiếp tuyến tại điểm khởi đầu cho nên sẽ bất biến với việc xoay của đối tượng.

Kết quả của q trình trích chọn đặc trưng cho một đối tượng theo phương

pháp này là một tập bao gồm R giá trị của hàm 𝜙′(𝑡) với bước tính:

∆= 2𝜋(𝑅 − 1) (2.24)

Các giá trị này được xem là các thành phần của vector biểu diễn mẫu vector

Tăng độ tương phản của ảnh

Phân đoạn ảnh (phân vùng ảnh)