Tìm hiểu ứng dụng phương pháp lọc Canny để phát hiện và tách biên. Đánh giá thực nghiệm và so sánh với các phương pháp khácTìm hiểu ứng dụng phương pháp lọc Canny để phát hiện và tách biên. Đánh giá thực nghiệm và so sánh với các phương pháp khác Tìm hiểu ứng dụng phương pháp lọc Canny để phát hiện và tách biên. Đánh giá thực nghiệm và so sánh với các phương pháp khácTìm hiểu ứng dụng phương pháp lọc Canny để phát hiện và tách biên. Đánh giá thực nghiệm và so sánh với các phương pháp khác
Trang 1KHOA CÔNG NGHỆ THÔNG TIN
BÀI TẬP LỚP NHẬP MÔN XỬ LÍ ẢNH
Nhóm 3:
Tìm hiểu ứng dụng phương pháp lọc Canny để phát hiện và tách biên Đánh giá thực nghiệm hiệu quả của phương pháp lọc Canny so với các
phương pháp lọc Prewitt
Giảng viên hướng dẫn : Đỗ Bảo Sơn Sinh viên thực hiện : Tạ Văn Quân Lưu Đức Huy
Vũ Trung Hiếu Lớp : 65DCHT23
Hệ : Đại học chính quy
Hà Nội, 09-2017
Trang 2LỜI MỞ ĐẦU 2
CÁC KHÁI NIỆM CƠ BẢN 3
PHẦN 1 : CÁC BƯỚC TÁCH BIÊN BẰNG PHƯƠNG PHÁP CANNY 4
1.1.Cơ sở lý thuyết của thuật toán 4
1.1.1 Nguyên lý của thuật toán 4
1.1.2 Nội dung của thuật toán 4
1.2.Các bước tiến hành phương pháp Canny 6
PHẦN 2: ĐÁNH GIÁ THỰC NGHIỆM, SO SÁNH PHƯƠNG PHÁP LỌC CANNY SO VỚI CÁC PHƯƠNG PHÁP PREWITT 11
2.1 Đánh giá thực nghiệm phương pháp lọc Canny 11
2.2 So sánh Canny với Sobel 13
Trang 3LỜI MỞ ĐẦU
Xử lý ảnh là một lĩnh vực đang được quan tâm và đã trở thành một môn học chuyên ngành của sinh viên hệ kĩ sư, hệ cử nhân ngành công nghệ thông tin, cũng như những ngành kĩ thuật khác trong các trường đại học kĩ thuật Xử lý ảnh có liên quan đến nhiều ngành khác như: Hệ thống tin học, lý thuyết thông tin, lý thuyết thống kê, trí tuệ nhân tạo, nhận dạng, tách biên v.v…Xử lý ảnh nghiên cứu tất cả những gì liên quan đến việc thao tác trên ảnh như: Biểu diễn ảnh, thu nhận ảnh, tăng cường và khôi phục ảnh nhằm thu được ảnh như mong muốn Mỗi vấn đề đều cần có những xử lý về thuật toán tại mỗi điếm ảnh hay phần tử ảnh Việc tìm hiểu giúp chúng ta hiểu sâu hơn về cơ chế, nguyên tắc xử lý ảnh, điều chỉnh màu, độ sáng tối, độ tương phản,…làm cho hình ảnh đẹp và nghệ thuật hơn
Một trong những vấn đề trọng tâm nghiên cứu của lĩnh vực thị giác máy là biên và các thao tác trên nó vì các kĩ thuật phân đoạn ảnh chủ yếu dựa vào biên Trong các phương pháp phát hiện bên hiện nay thì phương pháp Canny là phương pháp hiệu quả và đã được xây dựng thành công nghệ gồm quy trình 4 bước Báo cáo này làm rõ và so sánh phương pháp Canny với phương pháp Sobel
Để đạt được thành công, em cần sự góp ý của thầy và các bạn
Em xin chân thành cảm ơn!
Trang 4CÁC KHÁI NI M C B N ỆM CƠ BẢN Ơ BẢN ẢN
Biên ảnh: Biên ảnh là những điểm mà tại đó cường độ sáng của ảnh liên tục
có bước nhảy hoặc biến thiên nhanh Một điểm ảnh có thể coi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám Tập hợp các điểm biên tạo thành đường biên (edge) hay đường bao (boundary) của ảnh
Vùng ảnh: là tập tất cả những điểm ảnh thuộc về một đối tượng trong ảnh.
Ranh giới giữa các vùng ảnh gọi là biên ảnh và các đường biên khép kín cho phép xác định vùng ảnh
Các phương pháp phát hiện biên: trực tiếp và gián tiếp
Trực tiếp: Phương pháp này nhằm làm nổi biên dựa vào sự biến
thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient Nếu lấy đạo hàm bậc hai ta có phương pháp Laplace Hai kỹ thuật trên gọi là phương pháp dò biên cục bộ Phương pháp dò biên trực tiếp khá hiệu quả và ít chịu ảnh hưởng của nhiễu
Gián tiếp: nếu bằng cách nào đấy ta phân được ảnh thành các vùng
thì đường phân cách giữa các vùng đó chính là biên Nói cách khác, việc xác định đường biên của ảnh được thực hiện từ ảnh đã được phân vùng Việc phân vùng ảnh thường dựa vào kết cấu (texture) bề mặt của ảnh Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên độ sáng khá nhỏ
Quy trình phát hiện biên trực tiếp:
B1: Khử nhiễu ảnh: Vì ảnh thu nhận được thường có nhiễu nên bước đầu tiên là phải khử nhiễu
B2: Làm nổi biên bởi các toán tử đạo hàm
B3: Định vị biên Vì các kỹ thuật làm nổi biên có tác dụng phụ là tăng nhiễu, do vậy sẽ có một số biên giả xuất hiện cần phải loại bỏ
B4: Liên kết và trích chọn biên
Trong giới hạn tìm hiểu của đề tài, ta nghiên cứu hai phương pháp phát hiện biên trực tiếp là phát hiện biên theo phương pháp Canny
Trang 5PHẦN 1 : CÁC BƯỚC TÁCH BIÊN BẰNG PHƯƠNG PHÁP
CANNY 1.1 C s lý thuy t c a thu t toán ơ sở lý thuyết của thuật toán ở lý thuyết của thuật toán ết của thuật toán ủa thuật toán ật toán
1.1.1 Nguyên lý c a thu t toán ủa thuật toán ật toán
Kỹ thuật phát hiện biên theo phương pháp Canny là phương pháp phát hiện biên trực tiếp rất hiệu quả áp dụng cho loại ảnh nhiễu Phương pháp này do Canny ở phòng thí nghiệm MIT khởi xướng năm 1986 Canny đã đưa ra tập hợp các mục tiêu của một phương pháp phát hiện biên và đưa ra một phương pháp tối ưu để thực hiện các mục tiêu đó Phương pháp này gọi là phương pháp Canny
Canny đưa ra 3 điểm chính mà một phương pháp phát hiện biên phải xác định được, đó là:
Tỉ lệ sai thấp: Nghĩa là phải tìm ra tất cả các biên và không có đường biên nào bị bỏ sót
Các điểm biên phải được xác định chính xác: Khoảng cách giữa các điểm biên được tìm thấy trong giải thuật và biên trong thực tế phải càng nhỏ càng tốt
Đáp ứng điểm đơn biên: Không được phép chỉ ra nhiều biên trong khi chỉ có một biên tồn tại
Bản chất của thuật toán Canny là biểu diễn theo toán học 3 tiêu chuẩn đó và
cố gắng tìm ra giải pháp tối ưu cho những mục đích này Canny đã giả thiết rằng nhiễu trong ảnh tuân theo phân bố Gauss, đồng thời ông cũng cho rằng một phương pháp tìm biên thực chất là một bộ lọc nhân xoắn (chập) có khả năng làm mịn nhiễu và định vị được cạnh Vấn đề là làm sao để có một bộ lọc tối ưu nhất
1.1.2 N i dung c a thu t toán ội dung của thuật toán ủa thuật toán ật toán
Về mặt một chiều, đáp ứng của bộ lọc f với biên G được tính bởi tích phân chập:
Dưới đây là việc xây dựng một bộ lọc tối ưu f được xấp xỉ bằng đạo hàm
Bộ lọc f được giả thiết f=0 ngoài đoạn (-w, w) Ba ràng buộc trên tương ứng với ba điều kiện như sau:
Trang 6Trong đó:
SNR (tỉ lệ sai): nhằm tìm một hàm f(x) phản đối xứng sao cho tỉ số giữa tín hiệu và nhiễu là cực đại
Các giá trị Localization: đại diện cho nghịch đảo chênh lệch mức xám giữa các điểm trong cùng một biên và càng lớn càng tốt
Xzc: ràng buộc này nhằm hạn chế điểm cực trị cục bộ với mục đích cung cấp chỉ một đường biên
Canny cố gắng tìm ra bộ lọc f làm cực đại tích SNR* Localization Nhưng
cuối cùng thì một sự xấp xỉ có hiệu quả của f lại chính là đạo hàm bậc nhất của hàm Gauss Nhắc lại hàm Gauss có dạng như sau:
Đạo hàm bậc nhất của Gaussian theo x của G(x):
Hàm Gaussian trong không gian hai chiều có dạng như sau:
Trang 7Khi đó G có đạo hàm theo cả hai hướng x và y Sự xấp xỉ với bộ lọc tối ưu của thuật toán phát hiện biên Canny chính là G’ và do vậy, bằng phép nhân xoắn ảnh vào với G’ ta thu được ảnh E đã được tách biên ngay cả trong trường hợp ảnh có nhiều nhiễu
Phép nhân xoắn thực hiện một cách dễ dàng trong khi việc tính toán khá phức tạp, nhất là nhân xoắn với mảng hai chiều Tuy nhiên một phép nhân xoắn với mảng hai chiều Gauss có thể được chia thành hai phép nhân xoắn với mặt nạ Gauss một chiều Việc vi phân cũng có thể được thực hiện bằng phép nhân xoắn
ở mảng một chiều tạo nên hai ảnh: ảnh một là việc nhân xoắn thành phần của x với mảng một chiều, ảnh hai là việc nhân xoắn thành phần của y
1.2 Các b ước tiến hành phương pháp Canny c ti n hành ph ết của thuật toán ươ sở lý thuyết của thuật toán ng pháp Canny
Bước thứ nhất: Tiến hành làm trơn ảnh
b c này chúng ta ti n hành nhân nh v i b l c Gauss
Ở bước này chúng ta tiến hành nhân ảnh với bộ lọc Gauss ước này chúng ta tiến hành nhân ảnh với bộ lọc Gauss ến hành nhân ảnh với bộ lọc Gauss ảnh với bộ lọc Gauss ớc này chúng ta tiến hành nhân ảnh với bộ lọc Gauss ộ lọc Gauss ọc Gauss Sau khi ti n ến hành nhân ảnh với bộ lọc Gauss hành nhân ch p chúng ta có đ u ra là d li u nh S đã đập chúng ta có đầu ra là dữ liệu ảnh S đã được nhân chập ầu ra là dữ liệu ảnh S đã được nhân chập ữ liệu ảnh S đã được nhân chập ệu ảnh S đã được nhân chập ảnh với bộ lọc Gauss ược nhân chập.c nhân ch p.ập chúng ta có đầu ra là dữ liệu ảnh S đã được nhân chập
Bước thứ hai: Đạo hàm kết quả ở bước 1
Sau khi làm trơn ảnh ở bước 1 (nhân ảnh với bộ lọc Gauss) ta tiến hành đạo hàm bậc nhất kết quả đó Kết quả đạo hàm S là đạo hàm của tích ảnh I và hàm Gauss(x,y) Điều này tương ứng với đạo hàm của hàm Gauss sau đó nhân với ảnh I
Với:
Như vậy, kết quả ảnh bước hai chính là sự tổng hợp của đạo hàm của Gauss theo hướng x nhân với ảnh I và đạo hàm của Gauss theo hướng y nhân với ảnh I Nghĩa là ta có thể đạo hàm hàm Gauss theo hai hướng rồi mới tiến hành nhân xoắn với ảnh thay vì nhân xoắn ảnh với hàm Gauss rồi mới đạo hàm
Trang 8Hình 1 Đạo hàm Gauss theo hai hướng x và y
Như vậy, cách thức thực hiện bước thứ hai như sau:
Sau khi tiến hành nhân xoắn ảnh I với bộ lọc Gauss ở bước 1 ta có một ảnh mới S được làm trơn Tiến hành thực hiện bước hai bằng cách lấy đạo hàm ảnh mới đó theo hai hướng x và y rồi tổng hợp lại kết quả
Như đã biết, phương pháp Gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm, đó chính là phương pháp đạo hàm bậc nhất Chính vì vậy
ta có thể thực hiện việc đạo hàm ở bước hai bằng cách nhân ảnh kết quả S ở bước một với các mặt nạ trong phương pháp Gradient dựa theo các toán tử như Sobel, Pixel Difference
Ở đây ta tiến hành nhân xoắn ảnh S với hai mặt nạ của phương pháp Sobel theo hai hướng x và y như sau:
Trang 9
Sau khi tiến hành nhân xoắn ảnh theo hai hướng x và y ta được hai ảnh theo hai hướng là Sx và Sy, ta tiến hành tổng hợp hai kết quả đó để cho ra kết quả cuối cùng S’:
Hướng của biên θ như sau:
Ảnh S’ tìm được là kết quả của bước thứ hai
Bước thứ ba: Tiến hành “Non- maximum Suppression”
Tức là loại bỏ một số cạnh dư thừa: Đới với mỗi điểm ảnh trên ảnh S’ ta tiến hành so sánh giá trị của điểm đó với giá trị của hai điểm lân cận Hai điểm lân cận này là hai điểm nằm trên đường thẳng chứa hướng của đường biên θ
Giả sử ta có điểm biên đang xét là tại vị trí (x,y), ta có 8 điểm biên lân cận điểm biên này như hình dưới:
Hình 2 Hình mô tả các điểm biên lân cận
Trang 10hướng của đường biên θ≤22.5 hoặc θ≥157.5 thì đặt giá trị của θ=0 và khi đó hai điểm biên lân cận điểm biên này tại vị trí (x+1, y) và (x-1, y)
Tương tự, ta có kết quả 2 điểm biên lân cận theo các hướng biên khác nhau như bảng dưới đây:
Ta tiến hành thực hiện:
Tại mỗi điểm ảnh, ta tiến hành tính toán hướng của đường biên, sau đó so sánh kết quả đó tìm ra hai điểm biên lân cận
So sánh giá trị điểm ảnh đang xét với hai điểm biên lân cận trên:
Nếu điểm ảnh này là lớn nhất thì giữ lại điểm biên này (đánh dấu điểm biên này), ngược lại nếu nó nhỏ hơn một trong hai điểm biên lân cận thì điểm biên này bị loại đi (cho giá trị điểm biên này bằng 0)
Ta được kết quả ảnh sau khi đã loại đi một số điểm biên không phù hợp Lúc này số lượng biên trên ảnh nhìn thấy sẽ ít đi
Bước thứ tư: Tiến hành áp dụng ngưỡng
Sau khi tiến hành bước 3 ta tiến hành áp dụng ngưỡng: sử dụng hai ngưỡng
là ngưỡng cao Th và ngưỡng thấp Tl
Những điểm biên được đánh dấu (không bị loại) ta tiếp tục tiến hành áp dụng ngưỡng cao và ngưỡng thấp:
Xét điểm ảnh I tại vị trí (x,y)
So sánh I(x,y) với hai ngưỡng Th và Tl
Nếu I(x,y) ≥ Th: Đánh dấu và giữ lại điểm biên này (đặt giá trị bằng1)
Nếu I(x,y) <Tl: Loại bỏ điểm biên này (đặt giá trị bằng 0)
Nếu Tl ≤ I(x,y) <Th: Ta tiến hành so sánh giá trị I(x,y) với giá trị
Trang 11Nếu một trong 8 điểm lân cận có giá trị >Th: Tiến hành đánh dấu
và giữ lại điểm biên này
Ngược lại, loại bỏ điểm biên này (đặt giá trị bằng 0)
Trang 12PHÁP PREWITT 2.1 Đánh giá th c nghi m ph ực nghiệm phương pháp lọc Canny ệm phương pháp lọc Canny ươ sở lý thuyết của thuật toán ng pháp l c Canny ọc Canny
Phương pháp Canny được sử dụng rất nhiều trong các ứng dụng của xử lý ảnh do đây là phương pháp có khả năng loại bỏ nhiễu rất tốt
Ở đây ta đánh giá phương pháp Canny với độ lệch chuẩn σ khác nhau và các ngưỡng khác nhau:
Khi ta thay đổi σ, ngưỡng cao và ngưỡng thấp vẫn giữ nguyên: Th=100 và
Tl=30, ta có kết quả (σ=0,8 1 1,4)
Qua kết quả ở trên ta có một số nhận xét sau:
Khi ta thay đổi độ lệch tiêu chuẩn σ thì ảnh kết quả cũng thay đổi Ảnh kết quả (b), (c), (d) với độ lệch tiêu chuẩn tương ứng là 0,8; 1,0; 1,4 cho ra các điểm biên khác nhau Ảnh (b) có số lượng biên cao nhất, còn ảnh (d) có số lượng điểm biên thấp
Trang 13 Càng tăng độ lớn của độ lệch chuẩn thì số lượng các điểm biên xác định được ngày càng giảm Nghĩa là đối với ảnh có nhiều nhiễu thì càng tăng độ lệch chuẩn thì số lượng điểm nhiễu cũng giảm đi, khi đó chỉ những biên rõ nét mới phát hiện ra
Hình 2.2: Phát hiện biên với Canny ngưỡng thay đổi, σ=1
Còn khi thay đổi ngưỡng thấp và ngưỡng cao (giữ nguyên σ) thì số lượng biên được phát hiện cũng thay đổi Do các điểm ảnh có giá trị nhỏ hơn ngưỡng thấp thì loại điểm đó và lớn hơn ngưỡng cao thì xác định đó là điểm biên (giữa
2 ngưỡng còn tùy thuộc vào các điểm lân cận) Nên ta thấy:
Khi ngưỡng thấp và ngưỡng cao đều thấp thì số lượng biên phát hiện ra rất nhiều
Khi cả hai ngưỡng đều cao thì số lượng điểm biên phát hiện được là rất ít, chỉ những điểm có mức xám cao mới có thể thành biên
Khi ngưỡng rất thấp và ngưỡng rất cao, tức là khoảng cách giữa hai ngưỡng là lớn thì điểm biên phụ thuộc vào các điểm lân cận
Trang 142.2 So sánh phương pháp phát hiện biên ( phương pháp Gadient, phương pháp Paplace, phương pháp Canny)
Sau đây là đánh giá tổng hợp về các phương pháp phát hiện biên: Để so sánh sự khác nhau giữa các phương pháp phát hiện biên, chúng ta sử dụng kết quả của phương pháp phát Sobel đại diện cho phương pháp đạo hàm bậc nhất,
sử dụng kết quả của Eight-neighbor Laplace đại diện cho phương pháp phát hiện biên Laplace (phương pháp đạo hàm bậc hai) và sử dụng σ =1,4; Th=100, Tl=50 đại diện cho phương pháp Canny Từ các kết quả thu được ở hình trên, ta
có một số nhận định về các phương pháp phát hiện biên như sau:
Đối với ảnh không nhiễu: Cả ba phương pháp đều cho kết quả tốt Song
phương pháp phát hiện biên Sobel cho biên rõ nét nhưng lớn, còn phương pháp Laplace cho kết quả rõ nét, biên mảnh
Riêng phương pháp Canny do quá trình làm trơn ảnh nên từ một ảnh không nhiễu, các biên mờ bớt đi và to ra Do vậy biên ảnh trong phương pháp Canny lớn nhưng lại không đầy đủ Đối với loại ảnh này khi tìm biên nên áp dụng phương pháp Laplace, tiếp đến là phương pháp đạo hàm bậc nhất (Sobel, Kirsh, Prewitt ) Không nên sử dụng phương pháp Canny trong trường hợp này
Đối với ảnh có nhiều cạnh: Khi phát hi n biên, các c nh không quanệu ảnh S đã được nhân chập ạnh không quan
tr ng nên đọc Gauss ược nhân chập.c lo i b ạnh không quan ỏ
đây, phỞ bước này chúng ta tiến hành nhân ảnh với bộ lọc Gauss ương pháp Sobel vẫn phát hiện được biên nhưng các biênng pháp Sobel v n phát hi n đẫn phát hiện được biên nhưng các biên ệu ảnh S đã được nhân chập ược nhân chập.c biên nh ng các biênư
m , không được nhân chập.c rõ nét, do trong nh có nh ng vùng có m c xám th p,ảnh với bộ lọc Gauss ữ liệu ảnh S đã được nhân chập ức xám thấp, ấp,
s thay đ i gi a các m c xám nh ự thay đổi giữa các mức xám nhỏ ổi giữa các mức xám nhỏ ữ liệu ảnh S đã được nhân chập ức xám thấp, ỏ
Chính vì v y mà nh qua phập chúng ta có đầu ra là dữ liệu ảnh S đã được nhân chập ảnh với bộ lọc Gauss ương pháp Sobel vẫn phát hiện được biên nhưng các biênng pháp Laplace cho k t qu rõ nétến hành nhân ảnh với bộ lọc Gauss ảnh với bộ lọc Gauss
h n (do phơng pháp Sobel vẫn phát hiện được biên nhưng các biên ương pháp Sobel vẫn phát hiện được biên nhưng các biênng pháp này s d ng phử dụng phương pháp đạo hàm bậc hai, các ụng phương pháp đạo hàm bậc hai, các ương pháp Sobel vẫn phát hiện được biên nhưng các biênng pháp đ o hàm b c hai, cácạnh không quan ập chúng ta có đầu ra là dữ liệu ảnh S đã được nhân chập
đi m biên là các đi m c t không) Tuy v y do nh có r t nhi u đi mắt không) Tuy vậy do ảnh có rất nhiều điểm ập chúng ta có đầu ra là dữ liệu ảnh S đã được nhân chập ảnh với bộ lọc Gauss ấp, ều điểm biên nh nên các biên nh trên qua phỏ ảnh với bộ lọc Gauss ở trên qua phương pháp này rất nhiều và ương pháp Sobel vẫn phát hiện được biên nhưng các biênng pháp này r t nhi u vàấp, ều điểm
r i, chúng ta nên lo i b các đi m biên th a.ối, chúng ta nên loại bỏ các điểm biên thừa ạnh không quan ỏ ừa
Còn đ i v i phối, chúng ta nên loại bỏ các điểm biên thừa ớc này chúng ta tiến hành nhân ảnh với bộ lọc Gauss ương pháp Sobel vẫn phát hiện được biên nhưng các biênng pháp Canny, do quá trình “Non-maximum Suppression” và do quá trình áp d ng ngụng phương pháp đạo hàm bậc hai, các ưỡng mà các điểm biên phụ bịng mà các đi m biên ph bụng phương pháp đạo hàm bậc hai, các ị
lo i b t đi, các biên chính đạnh không quan ớc này chúng ta tiến hành nhân ảnh với bộ lọc Gauss ược nhân chập.c gi l i nên biên rõ nét h n ữ liệu ảnh S đã được nhân chập ạnh không quan ơng pháp Sobel vẫn phát hiện được biên nhưng các biên
Đ i v i nh có nhi u có m c xám nh , s bi n thiên các m c xám làối, chúng ta nên loại bỏ các điểm biên thừa ớc này chúng ta tiến hành nhân ảnh với bộ lọc Gauss ảnh với bộ lọc Gauss ều điểm ức xám thấp, ỏ ự thay đổi giữa các mức xám nhỏ ến hành nhân ảnh với bộ lọc Gauss ức xám thấp,