Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên Công nghệ, Tập 31, Số (2015) 1-7 So sánh số phương pháp phát biên Nguyễn Vĩnh An* Bộ Thông tin Truyền thông, 18 Nguyễn Du, Hà Nội, Việt Nam Nhận ngày 18 tháng năm 2014 Chỉnh sửa ngày 20 tháng năm 2014; Chấp nhận đăng ngày 28 tháng năm 2015 Tóm tắt: Phát biên ảnh nhiệm vụ quan trọng xử lý ảnh Nhận dạng ảnh dùng máy tính liên quan tới việc nhận dạng phân loại đối tượng ảnh phát biên công cụ quan trọng Phát biên làm giảm cách đáng kể khối lượng liệu cần xử lý loại bỏ thông tin không cần thiết đảm bảo thuộc tính quan trọng cấu trúc ảnh Có nhiều kỹ thuật phát biên sử dụng, kỹ thuật thường làm việc cách có hiệu cao loại đường biên cụ thể Trong báo này, tác giả tiến hành so sánh số kỹ thuật phát biên thơng dụng thơng qua thuật tốn lập trình MATLAB Từ khóa: Canny, Laplacian of Gaussian (LOG), Sobel, Prewitt, Robert Giới thiệu chung* trình bày [4] Trong tác giả so sánh số phương pháp phát biên sử dụng phổ biến thông qua matlab toolbox viết chương trình MATLAB 7.0 để tiến hành so sánh định tính định lượng Bố cục báo gồm phần sau: Trong phần liệt kê số dạng đường biên Phần trình bày sở lý luận số phương pháp phát biên thông dụng Phần so sánh hiệu phương pháp phát biên cuối phần kết luận Phát biên công cụ quan trọng xử lý ảnh số Nó làm giảm cách đáng kể khối lượng liệu cần tính tốn, giữ lại số thơng tin cần thiết đồng thời bảo toàn cấu trúc quan trọng ảnh Trong [1] phát biên dùng mathematical morphology so sánh với số phương pháp phát biên Các tác giả [2] tiến hành so sánh số phương pháp phát biên áp dụng cho số ảnh có nội dung khác Độ nhạy phương pháp phát biên tác động nhiễu so sánh [3] Phát biên thông qua việc xử lý pixels dùng ma trận, đạo hàm riêng, convolution Một số kiểu đường biên Đường biên nơi mà điểm ảnh lân cận có cường độ thay đổi mạnh cách đột ngột Một số kiểu đường biên hay gặp thực tế minh họa hình _ * ĐT.: 84- 913508067 Email: annv@pvu.edu.vn N.V An / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên Công nghệ, Tập 31, Số (2015) 1-7 (b) (a)) (d) (c) Hình Một số kiểu đường biên thông dụng (a) Biên dạng nhảy bậc; (b) Biên dốc; (c) Biên dạng xung vng; (d) Biên dạng hình nón Các phương pháp phát biên chập (convolution) ảnh cần nghiên cứu f ( x, y ) lọc 2D (filter) h( x, y ) thường gọi mặt nạ (mask) Các phương pháp phát biên truyền thống thường dựa kết phép tích +∞ +∞ h ( x, y ) * f ( x, y ) = ∫ ∫ h(k , k ) f ( x − k , y − k )dk dk 2 (1) − k2 ) (2) −∞ −∞ Nếu h(x,y) f(x,y) có dạng rời rạc cơng thức (1) viết lại thành h(n1 , n2 ) * f (n1 , n2 ) = ∞ ∞ ∑ ∑ h( k , k ) f ( n − k , n k1 =−∞ k2 =−∞ 1 Trên thực tế người ta hay dùng h(n1 , n2 ) ma trận [ × ] sau: h(0,1) h(1,1) ⎞ ⎛ h(−1,1) ⎜ ⎟ h = ⎜ h(−1, 0) h(0, 0) h(1, 0) ⎟ ⎜ ⎟ ⎝ h(−1, −1) h(0, −1) h(1, −1) ⎠ Cấu trúc giá trị toán tử phát biên xác định hướng đặc trưng mà toán tử (3) nhạy cảm với biên Có số tốn tử thích hợp cho đường biên có hướng nằm ngang, N.V An / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên Công nghệ, Tập 31, Số (2015) 1-7 số tốn tử lại thích hợp cho việc tìm kiếm biên dạng thẳng đứng hay theo hướng đường chéo Có nhiều phương pháp phát biên áp dụng, nhiên ta phân thành hai nhóm phát biên dùng Gradient phương pháp Laplacian Phương pháp phát biên dùng Gradient (sử dụng toán tử Roberts, Prewitt, Sobel, Canny) dựa vào tính giá trị cực đại cực tiểu đạo hàm bậc ảnh Phương pháp Laplacian tìm kiếm điểm có giá trị lấy đạo hàm bậc hai ảnh (Mars-Hildreth) convolution ảnh mặt nạ ta nhận gradient theo chiều đứng chiều ngang Gx, Gy Toán tử Sobel có dạng hình Hình Tốn tử Sobel 3.1.2 Toán tử Prewitt 3.1 Phương pháp Gradient Đạo hàm bậc theo hướng ngang dọc tính theo (4) ⎡ ∂f ⎤ ⎡ Gx ⎤ ⎢ ∂x ⎥ Δf = ⎢ ⎥ = ⎢ ⎥ ⎣G y ⎦ ⎢ ∂f ⎥ ⎢⎣ ∂y ⎥⎦ (4) Biên độ gradient vector hay độ lớn tổng cộng giá trị đạo hàm nằm biên kết hợp hai giá trị theo công thức (5) Δf = Δf = Gx2 + G y2 (5) Hướng gradient vector xác định theo ⎛ Gy ⎞ angle of ∇f = tan −1 ⎜ ⎟ ⎝ Gx ⎠ Phương pháp Prewitt gần giống với Sobel Đây phương pháp lâu đời nhất, cổ điển Toán tử Prewitt mơ tả hình (6) Hướng biên vng góc với hướng gradient vector Hình 3.Tốn tử Prewitt 3.1.3 Tốn tử Robert Tương tự Sobel, ta tính đường biên ngang dọc cách riêng rẽ dùng mặt nạ hình 4, sau tổng hợp lại đường biên thực ảnh Tuy nhiên mặt nạ Robert nhỏ nên kết bị ảnh hưởng nhiều nhiễu 3.1.1 Toán tử Sobel Trên thực tế Sobel sử dụng hai mặt nạ có kích thước [3 x 3] mặt nạ đơn giản quay mặt nạ góc 900 hình Các mặt nạ thiết kế để tím đường biên theo chiều đứng chiều ngang cách tốt Khi thực phép Hình Tốn tử Roberts 4 N.V An / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên Công nghệ, Tập 31, Số (2015) 1-7 3.1.4 Phương pháp Canny Phương pháp sử dụng hai mức ngưỡng cao thấp Ban đầu ta dùng mức ngưỡng cao để tìm điểm bắt đầu biên, sau xác định hướng phát triển biên dựa vào điểm ảnh liên tiếp có giá trị lớn mức ngưỡng thấp Ta loại bỏ điểm có giá trị nhỏ mức ngưỡng thấp Các đường biên yếu chọn chúng liên kết với đường biên khỏe Phương pháp Canny bao gồm bước sau: Bước Trước hết dùng lọc Gaussian (3.4) để làm mịn ảnh ⎛ x ⎞ G ' ( x) = ⎜ − ⎟ e ⎝ σ ⎠ ⎛ x2 −⎜ ⎜ 2σ ⎝ ⎞ ⎟⎟ ⎠ (7) Bước Sau tính tốn gradient (8) (9) đường biên ảnh làm mịn ⎛ x2 + y2 ⎞ ⎟ 2σ ⎟⎠ ⎛ j ⎞ −⎜⎜ C x [ x, y ] = − ⎜ ⎟ e ⎝ ⎝σ ⎠ ⎛ i C y [ x, y ] = − ⎜ ⎝σ ⎛ x2 + y2 ⎞ ⎟ 2σ ⎟⎠ ⎞ −⎜⎜⎝ ⎟e ⎠ (8) (9) Bước Tiếp theo loại bỏ điểm cực đại Bước Bước cuối loại bỏ giá trị nhỏ mức ngưỡng Phương pháp hẳn phương pháp khác bị tác động nhiễu cho khả phát biên yếu Nhược điểm phương pháp chọn ngưỡng thấp tạo biên không đúng, ngược lại chọn ngưỡng q cao nhiều thơng tin quan trọng biên bị loại bỏ Căn vào mức ngưỡng xác định trước, ta định điểm thuộc biên thực không thuộc biên Nếu mức ngưỡng thấp, số đường biên phát nhiều (nhưng kèm theo nhiễu số đường biên giả xuất nhiều) Ngược lại ta đặt mức ngưỡng cao, ta bị đường biên mờ đường biên bị đứt đoạn Phương pháp Canny có ưu điểm sau: • Cực đại hóa tỷ số tín hiệu nhiễu làm cho việc phát biên thực xác • Đạt độ xác cao đường biên thực • Làm giảm đến mức tối thiểu số điểm nằm đường biên nhằm tạo đường biên mỏng, rõ 3.2 Laplacian of Gaussian (LOG) Dùng phương pháp gradient cho kết ảnh nhận có cấu trúc khơng rõ nét tạo nên đường biên dày, không sắc nét Để nhận đường biên mỏng rõ nét, ta phải tiến hành bước xử lý loại bỏ điểm cực trị (nonmaximum suppression) đồng thời áp dụng kỹ thuật liên kết biên (edge linking) Ngồi ta cịn gặp phải vấn đề làm để xác định mức ngướng cách xác Việc chọn giá trị ngưỡng phụ thuộc nhiều vào nội dung ảnh Nếu ta tăng gấp đơi kích thước ảnh mà không thay đổi giá trị cường độ điểm ảnh, ta nhận gradients bị suy giảm nửa Mặt khác kích thước mặt nạ (masks) ảnh hưởng nhiều đến giá trị gradients ảnh Phương pháp gradient thích hợp cho vùng ảnh độ tương phản thay đổi có tính nhảy bậc, điều gây khó khăn cho phát đường thẳng Để khắc phục nhược điểm ta thường dùng đạo hàm bậc hai Phương pháp Laplacian cho phép xác định đường biên dựa N.V An / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên Công nghệ, Tập 31, Số (2015) 1-7 vào giá trị đạo hàm bậc hai ảnh Laplacian ảnh điểm I(x,y) tính theo (10): L ( x, y ) = ∂2I ∂2 I + ∂x ∂y (10) Laplacian kết hợp với lọc làm mịn ảnh để tìm biên [5] Xét công thức sau: h( r ) = −e − r2 2σ (11) Ở r = x + y độ lệch chuẩn (standard deviation) Nếu thực phép tích chập hàm với ảnh cần tìm biên, kết ảnh bị mờ đi, mức độ mờ phụ thuộc vào giá trị Laplacian h tức đạo hàm bậc hai h theo r là: ⎡ r − σ ⎤ − 2rσ22 ∇2h( r ) = − ⎢ ⎥e ⎣ σ ⎦ (12) Hàm thường gọi Laplacian of a Gaussian (LoG) (11) có dạng Gaussian Trong phương pháp này, lọc Gaussian kết hợp với Laplacian cho phép hiển thị vùng ảnh có cường độ thay đổi nhanh làm tăng hiệu phát biên Nó cho phép làm việc với diện tích rộng xung quanh điểm ảnh nghiên cứu nhằm phát xác vị trí đường biên Nhược điểm phương pháp không xác định hướng biên sử dụng hai lọc Laplacian khác có dạng hình 5 Kết thực nghiệm Ta tiến hành so sánh hiệu phát biên áp dụng toán tử nêu dùng MATLAB Chất lượng phát biên đánh giá thơng qua tiêu chí sai số trung bình bình phương (MSE) tỷ số tín hiệu/nhiễu (PSNR) a) Sai số trung bình bình phương MSE đánh giá mức độ sai khác biên nhận tính tốn biên thực thơng qua cơng thức: MSE = MN M N ∑∑ ( f (i, j ) − f i =1 j =1 (i , j ) ) RMSE = MSE (13) Với f1 (i, j ) f (i, j ) điểm ảnh biên theo tính tốn biên thực b) Tỷ số tín hiệu/nhiễu tính theo cơng thức PSNR = 10log ( 2552 / MSE ) (14) a Kết tính tốn ảnh “moon.jpg” “Lena.jpg” cho bảng bảng Bảng So sánh MSE PSNR ảnh mặt trăng (moon.jpg) STT Phương pháp Sobel Prewitt Canny LoG MSE 9.9033e+003 9.9035e+003 9.8804e+003 9.8881e+003 PSNR 8.1730 8.1729 8.1830 8.1797 Bảng So sánh MSE PSNR ảnh cô gái Lena (Lena.jpg) Hình Tốn tử Laplacian STT Phương pháp Sobel Prewitt Canny LoG MSE 1.1028e+004 1.1028e+004 1.1017e+004 1.1022e+004 PSNR 7.7058 7.7058 7.7103 7.7081 N.V An / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên Công nghệ, Tập 31, Số (2015) 1-7 Qua số liệu bảng bảng thấy phương pháp Canny cho kết MSE có giá trị nhỏ PSNR cho giá trị lớn so với phương pháp khác Hình hình cho ta kết áp dụng toán tử nêu cho hai ảnh có nội dung khác Ta thấy Original phương pháp Canny cho phép đầy đủ biên có ảnh Phương pháp LoG cho ta thấy rõ đường thảng thuộc biên, đồng thời số MSE PSNR đạt tương đối tốt Prewitt Canny Sobel LoG Hình Kết phát biên sử dụng toán tử Prewitt, Sobel, Canny LoG cho ảnh “moon.jpg” Original Prewitt Sobel Canny LoG Hình Kết phát biên sử dụng toán tử Prewitt, Sobel, Canny LoG cho ảnh “Lena.jpg” N.V An / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên Cơng nghệ, Tập 31, Số (2015) 1-7 Tài liệu tham khảo Kết luận Bài báo phân tích so sánh số phương pháp phát biên dùng Gradients phương pháp Laplacian Mỗi phương pháp có ưu điểm định Tuy nhiên, tùy thuộc vào tính chất phức tạp nội dung ảnh, phương pháp có nhược điểm khó khắc phục Phương pháp Canny cho độ méo MSE nhỏ sử dụng lọc Gaussian tỷ số PSNR tốt sử dụng nhiều mức ngưỡng Dùng Laplacian cho kết tốt trường hợp đường biên thẳng Tuy nhiên chưa có phương pháp thỏa mãn tốt tiêu chí độ chống nhiễu, phát xác vị trí đường biên thực, không tạo ảnh phức tạp mà thể đầy đủ đặc điểm quan trọng ảnh Do việc tìm kiếm phương pháp phải tiếp tục nghiên cứu [1] Beant Kaur, Anil Garg, Comparative study of different edge detection techniques, International journal of Engineering Science and Technology (IJEST), vol 3, No March 2011 [2] Raman Maini and Dr Himanshu Aggarwai, Study and Comparison of various Image Edge Detection Techniques, International journal of Image Processing, Volume 3, Issue [3] Bindu Bansal, Jasbir Singh Saini, Vipan Bansal and Gurjit Kaur, “Comparison of various edge detection techniques”, Journal of Information and Operations Management, Vol 3, Issue 1, 2012, pp 103-106 [4] John Schmeelk, AC2011-279: “Edge Detectors in Image Processing”, American Society for Engineering Education Annual Conference and Exposition, 26-29 June 2011, Vancouver, BC, Canada, [5] Rafael C Gonzalez and Richard E Woods, “Digital Image Processing”, 2nd edition, PrenticeHall,Inc, 2002 Comparison of Edge Detection Techniques Nguyễn Vĩnh An Ministry of Information and Communications, 18 Nguyễn Du, Hanoi, Vietnam Abstract: Image Edge detection is very important in image processing since computer vision involves the identification and classification of objects in an image Image Edge detection reduces significantly the amount of data and filters out the useless information while preserving all important structural properties of an image There are many edge detection techniques available, each of them is designed to be sensitive to a certain type of edges This paper compares several popular techniques for edge detection in image processing using MATLAB Keywords: Canny, Laplacian of Gaussian (LOG), Sobel, Prewitt, Robert ... Tập 31, Số (2015) 1-7 (b) (a)) (d) (c) Hình Một số kiểu đường biên thông dụng (a) Biên dạng nhảy bậc; (b) Biên dốc; (c) Biên dạng xung vuông; (d) Biên dạng hình nón Các phương pháp phát biên chập... nhiên Công nghệ, Tập 31, Số (2015) 1-7 Tài liệu tham khảo Kết luận Bài báo phân tích so sánh số phương pháp phát biên dùng Gradients phương pháp Laplacian Mỗi phương pháp có ưu điểm định Tuy... Original phương pháp Canny cho phép đầy đủ biên có ảnh Phương pháp LoG cho ta thấy rõ đường thảng thuộc biên, đồng thời số MSE PSNR đạt tương đối tốt Prewitt Canny Sobel LoG Hình Kết phát biên sử