Quét cửa số lọc lên các thành phần của ảnh sốc; điền các giá tri vào cửa số lọc

Một phần của tài liệu Khóa luận tốt nghiệp Hệ thống thông tin: Xây dựng hệ thống phát hiện và phân loại bệnh trên lá cây bằng kỹ thuật xử lý ảnh (Trang 23 - 41)

TÓM TÁT KHÓA LUẬN

Chương 2. CƠ SỞ LÝ THUYET

1. Quét cửa số lọc lên các thành phần của ảnh sốc; điền các giá tri vào cửa số lọc

2. Xử lý các thành phan trong cửa số lọc

3. Sắp xếp theo thứ tự các thành phần

4. Lưu lại thành phần trung vị, gán giá trị cho điểm ảnh đầu ra

2.1.1.1.2. Bộ lọc Gaussian

Bộ loc Gaussian, được xem là một phương pháp lam mo min giống như hiệu ứng hình ảnh được đặt dưới lớp màn trong suốt bị mờ. Nó được sử dụng để giảm nhiễu và mức độ chỉ tiết (không mong muốn) của ảnh. Trong hình ảnh, tần số liên quan đến sự chuyên đổi đột ngột hơn về độ sáng hoặc mau sắc. Hơn nữa nhiễu thường được nhúng trong đải cao của phổ (một cách biéu hiện tín hiệu trong miền tần số) [7]. Xét trên miền tần số, Gaussian sẽ giảm thành phan tan số cao (thường là nhiễu) trong ảnh và chỉ giữ lại thành phần tần số thấp. Nó tương tự như bộ lọc trung vị, nhưng nó

sử dụng một ma trận khác thé hién hinh dang cua ham Gauss.

2.1.1.1.3. Bộ loc Variance

Bang cách phân chia các điểm ảnh thành các ma trận sau đó tính phương sai va

so sánh với ngưỡng giá trị, nếu giá trị điểm ảnh lớn hơn giá trị ngưỡng ta xác định điểm ảnh thuộc vùng ảnh. Ngược lại nếu giá trị điểm ảnh nhỏ hơn giá trị ngưỡng ta

xác định điêm ảnh thuộc vùng

11

2.1.1.2. Bộ lọc xác định kết cấu Gabor

Bộ loc Gabor được đặt tên theo Dennis Gabor là bộ lọc nhạy cảm định hướng,

được sử dụng dé phân tích kết cấu. Bộ lọc gabor có khả năng phân tích hình ảnh tương tự hệ thống thị giác con người. Các bước chính của phương pháp này bao gồm chuẩn hóa ảnh, ước lượng hướng vân cục bộ, ước lượng tần số vân cục bộ, tạo các

vùng mặt nạ và lọc gabor.

Trong xử lý hình ảnh, quá trình trích xuất đặc điểm của bộ lọc gabor bắt đầu bang việc áp dụng bộ lọc gabor hai chiều cho từng hình riêng lẻ. Quá trình này tuân theo nguyên lý bất định của bộ lọc gabor, trong đó tích của độ phân giải và thời gian phải lớn hơn một hằng số.

Kết quả của bộ lọc là một hình ảnh. Từ hình ảnh này hai đặc điểm được trích xuất bao gồm entropy và energy. [8]

2.1.2. Téng quan về phân đoạn ảnh

Phân đoạn anh là phương pháp dé chia bức ảnh thành các vùng khác nhau. Mỗi vùng thể hiện cho một đối tượng mà ta quan tâm tới ví như phần bị bệnh của lá. Mỗi vùng của ảnh sẽ được gán nhãn, các vùng có chung nhãn sẽ có đặc tính giống nhau như: màu sắc, kết câu hay là ý nghĩa thể hiện. Nó là một công cụ có giá trị trong nhiều lĩnh vực. Các kỹ thuật thường dùng để phân đoạn hình ảnh là: giá trị ngưỡng, phân

cụm, mạng nơ-ron nhân tạo.

2.1.2.1. Phân đoạn dựa trên khu vực

Phân đoạn dựa trên khu vực được thực hiện bang cách chon ngưỡng phân định

để phân biệt các vùng riêng biệt trong ảnh. Một ví dụ của các phân đoạn này là thuật toán Barbedo dùng dé phân đoạn anh lá bị bệnh sẽ được giới thiệu chi tiết ở phần 2.4. Bằng cách phân tích biểu đồ tần suất của ảnh thuật toán sẽ xác định ngưỡng phân định. Nếu giá trị điểm ảnh lớn hơn ngưỡng phân định có nghĩa là điểm ảnh đó thuộc

về vùng lá khỏe mạnh và ngược lại điêm ảnh thuộc vùng lá bi bệnh.

12

2.1.2.2. Phan đoạn phát hiện cạnh

Phân đoạn phát hiện cạnh xác định tập điểm ảnh mà tại điểm ảnh đó xảy ra sự thay đôi đột ngột về cường độ sáng không liên tục của hình ảnh, dé phát hiện các cạnh

và từ đó xác định ranh giới của đối tượng.

2.1.2.3. Phân đoạn dựa trên phân cụm

Phân đoạn dựa trên phân cụm sẽ phân đoạn ảnh thành các vùng bằng cách chia điểm ảnh thành các cụm. Một trong những cách thường được sử dụng nhất dé phân loại lá bị bệnh là gom cụm theo màu sắc với thuật toán K-means. Được trình bày trong phan 1.2 “Khảo sát các công trình liên quan”.

2.2. Toán tử Erosion

La một trong hai toán tử hình thái học căn bản. Toán tử này sử dụng một phan

tử câu trúc đê làm giảm kích thước của các đôi tượng trong ảnh.

Phần tử cấu trúc là một hình khối được định nghĩa sẵn dé kiểm tra ảnh có thỏa mãn một tính chất nào đó. Phần tử cấu trúc là một ma trận chỉ chứa giá trị 0 và 1. Một điểm ở trong ma trận sẽ được chọn làm điểm sốc để có thực hiện các phép tính. Ví

dụ với một phan tử câu trúc S như sau:

Hình 2.3 Phân tử câu trúc

Toán tử erosion có công thức:

AOB ={zeElIB,c=A} (2.1)

Trong đó:

e A: là ảnh nhị phân đầu vào.

e B: là phan tử cấu trúc

13

e z: là vector.

e E: là mặt phăng Euclid chứa A.

e Bz: là sự dịch chuyền của B theo véc-tơ z.

Giả sử có một ảnh nhị phân I được biéu diễn ở dạng ma trận như sau:

1 2 3 4

1

2

3

4

Hình 2.4 Ảnh nhị phân I

Khi áp dung erosion, với ảnh gốc là I và sử dụng cau trúc phân tử S, ta đặt điểm gốc của cau trúc phân tử lên từng điểm ảnh trên I. Nếu một điểm ảnh của I và các điểm ảnh lân cận ứng với chứa S, điểm ảnh đó sẽ là 1 ở ảnh kết quả. Ngược lại, điểm anh

đó sẽ được chuyên thành 0 ở ảnh kết quả. Tiếp theo, lặp lại quá trình với từng điểm ảnh cua I. Ví dụ: áp dụng toán tử erosion tại điểm I(1,1) như sau, do điểm vùng lân cận I(1,1) chỉ có 2 phần tử nên điểm ảnh sẽ chuyền thành 0 ở ảnh kết quả. Áp dụng tại điểm I(2,2), do vùng từ I(1,2) tới I(3,2) có giá trị giống S nên tại ảnh kết quả có

giá trị là 1.

14

Hình 2.6 Ap dung erosion tại điểm

12,2)

Hình 2.5 Áp dụng erosion tại điểm 11,1)

Hình 2.7 Kết quả sau khi sử dụng erosion

=>

I T

Hình 2.8 Ảnh nhị phân sau khi áp dụng erosion

Ngoài áp dụng cho ảnh nhị phân, erosion có thé áp dụng cho ảnh xám dé giảm kích thước của đối tượng trong ảnh.

15

2.3. Các không gian màu thông dụng

2.3.1. RGB

Với ảnh ở không gian màu RGB, mỗi điểm ảnh bao gồm 3 chỉ số:

e R- Red là hệ số màu đỏ.

e G- Green là hệ số màu xanh lá.

e B- Blue là hệ số màu xanh dương.

Mau sắc của mỗi điểm ảnh sẽ được tinh dựa trên 3 kênh màu. Ngoài ra, độ sáng tối của ảnh cũng ảnh hưởng đến 3 kênh màu. Khi quan sát ảnh của cùng một vật thê ở điều kiện ánh sáng khác nhau ta sẽ thấy điều này. Ví dụ như hình sau:

Hình 2.9: Các kênh trong không gian mau RGB được thé hiện riêng biệt ở dang ảnh

xám?

Khi nhìn vào kênh màu B (Blue), với trường hợp khối rubik ở điều kiện sáng kém thì những miếng rubik màu xanh dương và màu trắng có màu giống nhau, nhưng các

mảng màu này lại khác nhau với điêu kiện sáng tôt do kênh màu bị ảnh hưởng với độ

? https://learnopencv.com/color-spaces-in-opencv-cpp-python/

16

sáng của môi trường chụp ảnh. Chính vì sự không thống nhất này khiến cho việc thực hiện phân loại màu ở không gian RGB cho kết quả không tốt.

2.3.2. LAB

Với anh thuộc không gian mau LAB, mỗi điểm anh bao gồm 3 chỉ số:

e L- Lightness là độ sáng của điểm ảnh có giá trị từ 0 đến 100.

e A là hệ số màu có giá trị từ màu xanh lá đến màu đỏ. Với giá trị âm, màu được

thé hiện sẽ nghiêng về màu xanh. Ngược lại, khi có giá trị dương màu thé hiện

sẽ nghiêng về màu đỏ.

e B là hệ số màu từ màu xanh da trời đến màu vàng.

Hệ màu LAB khác biệt với hệ màu RGB. Với hệ màu RGB, thông tin về màu sắc sẽ được chia thành ba kênh khác biệt nhưng đồng thời cả ba kênh màu cũng mang thông tin độ sáng hay tối của điểm ảnh. Còn hệ màu LAB, thông tin về độ sáng được lưu ở kênh L tách biệt với hai kênh màu còn lại. Điều này mang lại các đặc điểm không gian màu LAB là gần giống với mắt của con người nên nó không bị phụ thuộc vào thiết bị chụp ảnh hay thiết bị hiển thị. Vi dụ như sau:

17

Hình 2.10: Các kênh trong không gian màu LAB được thê hiện riêng biệt ở dạng

ảnh xám 3

So sánh Hình 2.9 và Hình 2.10. Với ảnh ở không gian màu RGB, màu sắc trên ở các kênh màu bị ảnh hưởng ở điều kiện sang khác nhau do đó sẽ khó đề thực hiện tính toán với các ảnh do màu sắc bị ảnh hưởng nhiều. Còn với ảnh ở không gian màu LAB, trong điều kiện sáng khác nhau thì màu sắc không bi thay đổi nhiều ở hai kênh màu A và B. Do đó, khi thực hiện phân đoạn ảnh dựa trên màu sắc trên không gian

màu này sẽ cho kêt quả chính xác hơn.

2.3.3. HSV

Mỗi điểm ảnh trong không gian màu HSV bao gồm ba chỉ số:

e H-—Hue: hệ số màu. Có giá trị từ 0 — 360. Màu sắc trong hệ màu được thể

hiện bằng 1 vòng tròn với mỗi giá trị là 1 màu.

e S— Saturation: hệ số là độ đậm của màu. Khi S = 0 thì màu sẽ có màu trắng

vì lúc này màu nhạt đến mức ta ko thấy được, khi S = 100 thì màu sẽ có màu tương ứng ở độ sáng cao nhất. Khi S giảm từ 100 đến 0 thì màu sẽ nhạt dần.

3 https://learnopencv.com/color-spaces-in-opencv-cpp-python/

18

e V-—Value: hệ số chỉ độ sáng của màu. Có giá trị từ 0 — 100. Khi V bang 0 thì

màu chuyên thành màu đen ( kế cả khi S = 0), khi V bằng 100, màu sắc sẽ có

mau vốn có của nó.

So với không gian màu LAB va RGB, HSV chỉ lưu thông tin màu trên một kênh mau

cho nên giống như không gian màu LAB, kênh màu H của không gian màu HSV

cũng ít bị ảnh hưởng bởi độ sáng của môi trường xung quanh.

Vì vay, không gian màu LAB va HSV thường được dùng dé phân đoạn anh.

2.4. Thuật toán phan đoạn ảnh của Barbedo

Thuật toán Barbedo [5] phân đoạn anh thông qua việc xây dựng và xử lý biểu

đồ tần suất trên kênh màu H của không gian mau HSV và kênh màu A của không gian màu LAB đề tìm ngưỡng phân định đề xác định vùng lá bị bệnh và vùng lá khỏe

mạnh trên ảnh.

Đa số các bước trong thuật toán đều được thực hiện tự động ngoại trừ bước cuối cùng

là người dùng sẽ chọn anh có kết quả phân đoạn tốt hon dé làm kết quả. Thuật toán bao gồm các bước sau:

Tách lấy kênh

màu H

Điều chỉnh độ

sáng

Chuyển ảnh sang

không gian màu HSV)

Anh đã Tăng độ tu

Anh dau vào ang độ tương

Xóa viên lá

ơ pa phản của ảnh

Tách lây kênh

Chuyén ảnh sang màu A

không gian màu LAB

Phân tích Histogram đề tìm giá tri threshold

Xây dựng

Histogram Phan doan anh

Người dùng chon

Hình 2.11 Các bước thực hiện của thuật toán Barbedo

19

2.4.1. Dữ liệu đầu vào

Các ảnh gốc là ảnh chụp từ máy ảnh kỹ thuật số ở không gian mau RGB. Vi thuật toán sẽ sử dụng biéu đồ tần suất của ảnh dé xác định giá trị ngưỡng phân định. Nên tốt nhất ảnh chỉ có phần lá và phần nền được chuyên thành màu đen.

Hình 2.12 Dữ liệu đầu vào của thuật toán Barbedo

2.4.2. Xóa viền lá

Bước đầu tiên của thuật toán là xóa các điềm ảnh thuộc về viền lá bằng cách sử dụng toán tử erosion với ma trận có kích thước là 5x5. Các điểm ảnh bị xóa do các điểm ảnh này có thể gây hưởng đến ngưỡng phân định tìm được khi phân tích biểu

đô tân suât của các điêm ảnh.

Việc xóa các diém ảnh ở viên lá có thê xóa luôn vào phân bị bệnh của lá. Nhung sô

lượng các điểm ảnh bị xóa đi không nhiều nên sẽ ít ảnh hưởng tới kết quả phân đoạn.

2.4.3... Chuyến đổi ảnh sang các không gian màu HSV va LAB

Ảnh sau khi được xóa viền lá sẽ được chuyên sang 2 không gian màu HSV và LAB và đồng thời các giá trị của điểm ảnh được chuyên sang từ khoảng từ 0 đến 1. Khi biểu diễn kênh màu dưới dạng ảnh xám màu sắc trong khoảng từ 0 đến 1 sẽ thay

đôi từ màu den sang mau trang.

Đôi với kênh mau H, các diém ảnh có giá tri thuộc vê 10% ảnh có giá tri cao nhat

được thay đổi giá trị bằng với điểm ảnh có giá trị cao nhất không thuộc vào nhóm

20

trên. Bước này là cân thiệt đê xử lý các sai sô có thê xảy ra trong quá trình chuyên đôi không gian màu. Các bước sau, cả hai kênh màu sẽ được xử lý giông nhau và kêt quả xử lý sẽ được hiên thị dưới dạng ảnh xám do hiện tại chỉ còn lại một kênh màu.

2.4.4. Tăng độ tương phản của ảnh

Đề tăng độ tương phản của ảnh, mỗi giá trị trong kênh màu sẽ được áp dụng

công thức sau:

_ Pi —min(P) (2.2)

d.,= max(P) —min(P)

Với:

e i,j: là chỉ số của điểm ảnh.

e @Q:1akénh mau sau khi được tăng độ tương phản.

e P: là kênh màu gốc.

e min(P): là giá trị thấp nhất của điểm anh của kênh màu gốc.

e max(P): là giá trị cao nhât của diém ảnh của kênh mau gôc.

Sau khi tăng độ tương phản, giá trị trong mỗi kênh màu sẽ được phân tán đều ra trong khoảng từ 0 đến 1. Với kênh màu H, phan bị bệnh của lá sẽ có giá trị tại điểm ảnh thấp hơn là phần khỏe mạnh của lá nên sau khi tăng độ tương phản phần bị bệnh của

lá sẽ có màu tối hơn phần khỏe mạnh cua lá. Kênh mau A thì ngược lại với kênh màu

H, phần bị bệnh của lá có giá tri tại điểm ảnh lớn hơn vùng lá khỏe mạnh nên sau khi tăng độ tương phản thì phần bị bệnh của lá sẽ có màu sáng hơn phần khỏe mạnh của

lá. Vì sự trái ngược của hai kênh màu, dé có thé sử dụng chung phương pháp để tìm

ngưỡng phân định thì kênh màu A sau khi đã tăng độ tương phản sẽ được đảo ngược

giá trị điểm ảnh lại bằng cách:

A,,=l-A,, (2.3)

Trong đó:

e i, j: là chỉ sô của diém anh.

21

° A‘. j: là kênh mau A sau khi dao ngược.

° A. ¡: là kênh mau A sau khi tăng độ tương phản.

Kết quả sau khi tăng độ tương phản được thê hiện trong hai hình sau:

(a) (b)

Hình 2.13 (a) là ảnh của kênh màu H trước khi tăng độ tương phản, (b) là ảnh sau

khi tăng độ tương phản

tăng độ tương phản và đảo ngược giá trị các điểm ảnh

22

2.4.5. Xác định ngưỡng phân định và phân đoạn anh

Thuật toán của Barbedo chia các điểm ảnh trong kênh màu vào 100 giỏ. Nhãn của mỗi giỏ là giá trị cao nhất trong giỏ đó nếu nhãn của giỏ đó là “B=0.1” thì giỏ đó chứa tông số những điểm ảnh có giá trị từ 0 đến 0.01, giỏ có nhãn B=0.02 có giá tri

là tong số điểm ảnh có giá trị năm từ 0.01 đến 0.02. Những vùng bị bệnh của lá thường đậm hơn những vùng lá không bị bệnh và trong ảnh xám thì giá trị điểm ảnh càng thấp thì màu thể hiện càng tối nên những diém ảnh thể hiện vùng bệnh sẽ tạo các đỉnh

về phía bên trái của histogram. Phần không bị bệnh của lá có màu xanh sẽ nằm ở bên

phải.

2000

1750 4

1500 +

1250 4

1000 4

750 4

500 250

Ngưỡng phân định được xác định theo các bước sau:

e©_ Bước 1: Tìm thùng có giá trị cao nhất, chỉ số của thùng cao nhất gọi là B và

giá trị của thùng đó là V.

e Bước 2: Nếu B <= 0.4 thì R là nhãn của thùng có giá trị lớn hơn 0.2V. Ngược

lại, R là nhãn của thùng có giá trị lớn hơn 0.5V.(B lá số nguyên) e_ Bước 3: Ngưỡng phân định tốt nhất dé phân tách phan lá khỏe mạnh và phan

bị bệnh là T=R .2

23

Sau khi có ngưỡng phân định, ta kiểm tra mỗi kênh màu tương ứng của ảnh nếu giá trị tại kênh màu tương ứng lớn hơn T ta chuyên điểm ảnh đó thành màu đen.

2.5. Téng quan vé Gray Level Co-occurrence Matrix

Ma trận mức xám đồng hiện (GLCM) là một phương pháp được sử dụng để phân tích kết cấu. Phân loại kết cấu sử dụng một giá trị gọi là giá trị đồng nhất (homogeneity). Giá trị đồng nhất được tính cho mọi điểm ảnh hién thị trong ảnh. Sau khi tính toán các giá tri đồng nhất một ma trận các giá trị được tạo ra. [9] Từ ma trận, thông qua các bước tính toán các chỉ số từ ma trận, GLCM thực hiện trích xuất các đặc điểm trong ảnh.

Cụ thể quá trình trích xuất đặc trưng được thực hiện như sau. GLCM kiểm tra mối quan hệ không gian giữa các điểm ảnh, đồng thời xác định tần suất xuất hiện của một

tổ hợp điểm ảnh theo một hướng 0 và khoảng cách d nhất định. Mỗi hình ảnh được lượng tử (xấp xi giá trị) thành 16 mức xám (0 - 15) và 4 hướng 0 = 0, 45°, 900 , 135° với d = 1. Với mỗi GLCM, năm đặc điểm trích xuất đặc trưng bao gồm energy, entropy, contrast, homogeneity, correlation. Như vậy, có 20 trích xuất đặc trưng cho mỗi hình ảnh. Mỗi trích xuất đặc trưng được chuẩn hóa trong khoảng từ 0 đến 1 trước khi chuyên đến bộ phân loại. [10]

24

Một phần của tài liệu Khóa luận tốt nghiệp Hệ thống thông tin: Xây dựng hệ thống phát hiện và phân loại bệnh trên lá cây bằng kỹ thuật xử lý ảnh (Trang 23 - 41)

Tải bản đầy đủ (PDF)

(63 trang)