Tính độ dốc (Gradient)

Một phần của tài liệu Ứng dụng dobot magician trong hệ thống phân loại sản phẩm (Trang 30 - 33)

Trong xử lý ảnh, độ dốc được nói đến ở đây chính là độ dốc về mức sáng, hay nói cách khác chính là sự thay đổi các giá trị pixel trong ảnh. Vùng ảnh trơn thì các pixel trong vùng ảnh đó sẽ có giá trị xấp xỉ gần bằng nhau, vì vậy khi tính toán đạo hàm sẽ gần bằng 0 tức không có biến thiên giá trị mức sáng. Điều này có nghĩa là độ dốc của các pixel trong vùng ảnh trơn gần như bằng 0.

Đạo hàm dương tại một pixel thể hiện biến thiên mức sáng đang ở chiều hướng đi lên, ngược lại đạo hàm âm cho biết biến thiên mức sáng đang có chiều hướng giảm dần. Tóm lại, Gradient của ảnh chính là đạo hàm ảnh, được thực hiện bằng hai phép nhân chập ảnh gốc với hai chiều, tương ứng với các toán tử lấy đạo hàm theo hai hướng Ox và Oy.

𝐺𝑥= [−1 0 1] 𝐺𝑦= [1 0 −1]𝑇 (T: phép chuyển vị)

14

Khoa ĐT CLC – ĐHSPKT TP.HCM

Nếu ta có một ảnh đầu vào là I, ta sẽ có 2 ảnh đạo hàm riêng theo 2 hướng đó là:

Ix = I*Gx Iy = I*Gy (2)

Khi đó, ta tính được Gradient bao gồm hai thành phần cường độ và hướng theo công thức:

Cường độ: |G| = √Ix2+ Iy2 (3) Hướng: θ = atan(𝐼𝑥

𝐼𝑦) (4)

Ví dụ: Giả sử ta có một điểm ảnh như sau:

Hình 2. 14 Trích chọn một điểm ảnh Áp dụng công thức (2), (3) và (4) ở trên, ta có: 𝐼𝑥 = I*𝐺𝑥 = [56 𝑥 94]*[ −1 0 1 ] = [38] 𝐼𝑦 = I*𝐺𝑦 = [ 93 𝑦 55 ]*[1 0 −1] = [38] |𝐺| = √𝐼𝑥2+ 𝐼𝑦2 = √382+ 382 ≈ 53.74 θ = atan(𝐼𝑥 𝐼𝑦) = atan(38 38) ≈ 2.33

Đối với ảnh màu, Gradient của ba kênh RGB được xét đến, độ lớn của Gradient tại một điểm ảnh là giá trị lớn nhất của cường độ Gradient ba kênh và góc là góc tương ứng với Gradient lớn nhất.

15

Khoa ĐT CLC – ĐHSPKT TP.HCM

Hình 2. 15 Ảnh mờ (trái) - Ảnh mật độ độ dốc Gradient (phải)

Kết quả sau khi xử lý cho ra gần như mong đợi. Tuy nhiên, ta có thể thấy rằng trong hình 2.15 bên phải có một số cạnh dày và một số cạnh khác thì mỏng dẫn đến tình trạng không đồng đều nhau, phương pháp NMS ở mục 2.3.3 sẽ giúp ta giảm thiểu được điều này.

Ảnh đạo hàm 𝐺𝑥 và 𝐺𝑦 là ma trận thì kết quả ảnh đạo hàm G cũng sẽ là ma trận, mỗi pixel trên ma trận này thể hiện độ lớn của biến đổi mức sáng ở vị trí tương ứng trên ảnh gốc. Tương tự, ma trận hướng cũng sẽ có cùng kích thước, mỗi pixel trên ma trận này sẽ thể hiện góc (hướng cạnh).

Nếu góc Gradient là 00 thì cạnh trên ảnh sẽ là một đường thẳng đứng vuông góc với hướng Gradient. Khi tính toán, giá trị hướng Gradient sẽ nằm trong đoạn giá trị từ [-1800, 1800], ta không giữ nguyên các góc này mà sẽ gom về 4 ô chứa đại diện cho 4 hướng: ngang 00, chéo bên phải 450, dọc 900 và chéo bên trái 1350.

16

Khoa ĐT CLC – ĐHSPKT TP.HCM

Một phần của tài liệu Ứng dụng dobot magician trong hệ thống phân loại sản phẩm (Trang 30 - 33)