Biểu diễn dựa trên kỹ thuật xử lý tín hiệu

Một phần của tài liệu Nghiên cứu một số kỹ thuật phát hiện đối tượng ảnh dựa vào kết cấu và ứng dụng (Trang 42)

Phƣơng pháp dựa vào kỹ thuật xử lý tín hiệu phân tích nội dung tần số của ảnh. Một số kỹ thuật nhƣ lọc miền không gian, mặt lạ Law và các mặt lạ (Mask) khác nhau đƣợc thiết kế cho việc dò biên là các kỹ thuật điển hình nhằm vào việc phân tích thông tin tần số. Một số lớp bộ lọc không gian khác là các moment tƣơng ứng với lọc ảnh sử dụng tập các mặt lạ không gian. Các ảnh sau khi lọc đƣợc sử dụng nhƣ các đặc trƣng kết cấu [18, 19]. Các đặc trƣng dựa vào moment thƣờng đƣợc sử dụng trong các ứng dụng phân đoạn kết cấu (xem 1.1.2). Việc biến đổi Fourier (Fourier transform) với các phụ thuộc lẫn nhau giữa các điểm ảnh về mặt không gian đƣợc sử dụng bằng cách kết hợp với các chức năng cửa sổ hay mặt lạ cũng thƣờng xuyên đƣợc sử dụng trong các ứng dụng tạo hình dạng từ kết cấu (xem 1.1.2).

Với các ứng dụng phân tích kết cấu đa độ phân giải (Multiresolution), các biến đổi dạng sóng (Wavelet Transform) là các kỹ thuật thƣờng hay sử dụng với các hàm cửa sổ có thay đổi về độ rộng theo những thay đổi về tần số [20]. Nếu hàm cửa sổ là hàm Gaussian thì biến đổi đƣợc gọi là biến đổi Gabor, lọcc Gabor hai chiều là một phƣơng pháp rất hay đƣợc dùng trong các phƣơng pháp phân loại kết cấu [5]. Bộ lọc Gabor rất nhạy cảm với các hƣớng và tần số riêng biệt. Theo phƣơng pháp này và một số phƣơng pháp về lọc không gian/lọc tần số- không gian khác (với hàm cửa sổ là các dạng khác nhau dựa vào Gaussian), đặc trƣng mô tả kết cấu đƣợc trích rút từ các ảnh đã lọc với một khối lọc. Mỗi khối có các giá trị tần số khác nhau. Với nhiều hƣớng và nhiều tỷ lệ cho đa độ phân giải, số chiều trong đặc trƣng kết cấu có thể rất lớn. Việc giảm số chiều có thể đƣợc xử lý bằng cách chỉ lấy những dải có năng lƣợng cao. Thêm vào đó việc

thiết kế một bộ lọc tối ƣu để có thể bao bọc không gian tần số cũng là một cách để giảm số chiều dƣ thừa trong đặc trƣng kết cấu.

Dƣới đây sẽ giới thiệu một số phƣơng pháp biểu diễn kết cấu dựa trên kỹ thuật xử lý tín hiệu số thƣờng gặp trong các hệ thống và đƣợc mô tả khá chi tiết trong các tài liệu đã công bố cũng nhƣ thƣờng đựoc sử dụng để làm cơ sở so sánh hiệu quả của các đặc trƣng kết cấu khác nhau[18,19,21].

 Gabor Filter:

Bộ lọc Gabor đƣợc sử dụng khá rộng rãi để trích chọn đặc điểm của ảnh số, đặc biệt là các đặc điểm kết cấu. Lọc Gabor đƣợc coi là tối ƣu xét về khả năng tối thiểu hoá những sự không chắc chắn liên kết trong không gian và tần số và thƣờng đƣợc sử dụng nhƣ là bộ phát hiện hƣớng và phát hiện biên điều hƣớng đƣợc. Có nhiều cách tiếp cận để phát hiện các đặc điểm kết cấu dựa vào bộ lọc Gabor. Ý tƣởng chính của việc sử dụng bộ lọc Gabor để trích chọn các đặc điểm kết cấu đƣợc thực hiện nhƣ sau:

Một hàm lọc Gabor hai chiều g(x,y) đƣợc định nghĩa là:

jWx y x y x g y x y x      2( ) 2 1 exp[ 2 1 ) , ( 2 2 2 2    

Trong đó x, y là độ lệch tiêu chuẩn của đƣờng bao Gauss dọc theo hƣớng xy. Từ đó có thể thu đƣợc các bộ lọc Gabor bằng cách kéo dãn và quay hàm lọc Gabor g(x,y) theo công thức:

gmn(x,y )= a-mg(x',y') x' = a-m(xcos + ysin) y' = a-m(-xsin + ycos

Trong đó a>1,  = n/K, n = 0, 1, ..., K-1m = 0, 1, ..., S-1. KS là số hƣớng và số tỷ lệ co giãn. Hệ số co giãn a-m đƣợc đƣa vào để đảm bảo năng lƣợng độc lập với m. Cho trƣớc một ảnh I(x,y) thì biến đổi Gabor của nó đƣợc định nghĩa theo công thức tính nhƣ sau:

1 1 1 1 * ) , ( ) , ( ) , (x y I x y g x x y y dxdy Wmn  mn  

Ở đây dấu * thể hiện liên hợp phức. Sau đó trung vị mn và độ lệch tiêu chuẩn mn của biên độ của Wmn(x,y) là :

f = [00, 00,..., mn, mn, , S-1 K-1, S-1K-1]

có thể đƣợc sử dụng để biểu diễn các đặc điểm của một kết cấu thuần nhất.

 Wavelet Transform

Cũng giống nhƣ phƣơng pháp lọc Gabor, phƣơng pháp biến đổi dạng sóng là cách phân tích và phân loại áp dụng cho các kết cấu nhiều chiều. Biến đổi dạng sóng phân tích một tín hiệu thành một họ các hàm cơ sở mn(x) bằng cách dịch chuyển và co giãn một hàm gốc (x), tức là:

mn(x) = 2-m/2(2-mx - n)

Trong đó mn là tham số co giãn và tham số dịch chuyển. Một tín hiệu

f(x) có thể đƣợc biểu diễn dƣới dạng:

  n m mn mn x c x f , ) ( ) ( 

Việc tính toán các biến đổi dạng sóng của các tín hiệu hai chiều có liên quan tới quá trình lọc đệ qui và lấy mẫu lại. Ở mỗi mức thì tín hiệu đƣợc phân tích thành 4 dải tần số con là LL, LH, HL và HH, trong đó L ký hiệu cho tần số thấp và H ký hiệu cho tần số cao.

Hai dạng biến đổi dạng sóng chủ yếu đƣợc dùng trong phân tích kết cấu ảnh là biến đổi dạng sóng theo kiểu hình hình chóp (PWT) và biến đổi dạng sóng theo kiểu hình cây (TWT).

PWT phân tích một cách đệ qui dải tần số LL, tuy nhiên đối với một số loại kết cấu thì những thông tin quan trọng nhất thƣờng xuất hiện ở các kênh tần số trung bình. Để khắc phục nhƣợc điểm này của PWT thì TWT còn có thể phân tích ở các dải tần số khác nhƣ LH, HL hoặc HH nếu cần.

Sau quá trình phân tích, có thể xây dựng các vector đặc trƣng bằng cách sử dụng trung vị và độ lệch chuẩn của phân bố năng lƣợng của mỗi dải tần con (Sub-band) tại mỗi mức đệ qui.

Khi thực hiện phân tích mức thì PWT cho kết quả là một vector đặc trƣng có 3×4×2 thành phần. Đối với TWT, vector đặc trƣng phụ thuộc vào thứ tự phân tích các dải tần số con. Có thể xây dựng đƣợc một cây phân tích cố định bằng cách phân tích tuần tự các dải tần LL, LH và HH, kết quả cho ra sẽ là một vector đặc trƣng có 52×2 thành phần.

Lƣu ý là trong ví dụ này thì vector đặc trƣng kết quả của phân tích PWT chỉ là tập con của vector do phân tích TWT sinh ra. Ngoài ra qua so sánh sự khác nhau của vector đặc trƣng thu đƣợc khi sử dụng các phƣơng pháp biến đổi dạng sóng khác nhau, ngƣời ta thấy rằng việc lựa chọn bộ lọc dạng sóng không ảnh hƣởng lớn lắm đến các phân tích kết cấu ảnh.

* Một số nghiên cứu so sánh giữa các phƣơng pháp Nhƣ đã nêu ở phần các phần trƣớc về các phƣơng pháp biểu diễn kết cấu, việc đánh giá phƣơng pháp biểu diễn nào là tối ƣu cho toàn bộ các loại kết cấu và sự đa dạng của các ứng dụng sử dụng thông tin kết cấu là không thể. Rất nhiều các nghiên cứu trong những năm gần đây đƣợc tiến hành để đánh giá các biểu diễn đặc trƣng kết cấu cho từng loại ứng dụng cụ thể. Trong [23], ứng dụng của việc sử dụng thông tin kết cấu cho công việc giám sát chất lƣợng bề mặt thép tấm cho việc bảo dƣỡng và thay thế các công trình xây dựng (cầu sắt, nhà cao tầng,..những nơi mà rất khó để có thể quan sát một cách trực tiếp) đƣợc đánh giá là một thành tố quan trọng góp phần tạo nên thành công của các ứng dụng loại này.

Trong các ứng dụng này yêu cầu các phân tích chính xác về thứ hạng hay độ hao mòn của các kết cấu thép tấm phải đƣợc phân tích chính xác hơn là những ảnh mẫu đƣợc chụp và xem bởi mắt thƣờng (do ảnh hƣởng của các yếu tố nhƣ độ sáng, độ chói,.. ). Và từ đó các quyết định về việc bảo dƣỡng công trình sẽ đƣợc quyết định bởi hệ thống phát hiện đối tƣợng. Có ba phƣơng pháp biểu diễn kết cấu đƣợc phân tích và đánh giá bằng thực nghiệm. Phƣơng pháp thông kê với ma trận đồng xuất hiện, phƣơng pháp dựa vào mô hình với MRF và một phƣơng pháp dựa vào histogram của ảnh.

Các phƣơng pháp này đƣợc sử dụng để thể hiện kết cấu đặc trƣng của ảnh và sử dụng bộ phân loại K lân cận gần nhất để phân loại phát thứ hạng chất lƣợng thép. Ảnh bề mặt thép đƣợc đánh giá bởi con ngƣời (chuyên gia) theo thứ hạng về chất lƣợng (ISO 8501-1; 1988) để so sánh độ chính xác của hệ thống. Với 79,36% phân loại đúng dựa trên phân loại K lân cận gần nhất, hai phƣơng pháp biểu diễn đặc trƣng dựa vào kết cấu là ma trận đồng xuất hiện và MRF đƣợc xem là chấp nhận đƣợc để thể hiện cho biểu diễn đặc trƣng của kết cấu.

Trong [24] việc đánh giá các đặc trƣng kết cấu đƣợc thực hiện dựa trên các phƣơng pháp đánh giá cho tổng hợp kết cấu và phân loại kết cấu. Các phƣơng pháp này ít nhiều liên qan đến việc xác định lỗi của phân tích kết cấu. Trong ứng dụng phân loại địa hình, với 54 ảnh vệ tinh và 9 lớp kết cấu. Tác giả đã chỉ ra rằng với các đặc trƣng kết cấu đơn (không kết hợp giữa các phƣơng pháp biểu diễn đặc trƣng khác và cả các phƣơng pháp biểu diễn kết cấu khác) các phƣơng pháp thông kê với bậc cao hơn 2 sẽ có độ chính xác cao nhất trong thí nghiệm (80%). Cũng theo đánh giá của nghiên cứu này, một thử nghiệm đƣợc tiến hành để phân loại mây cho ảnh vệ tinh. Nghiên cứu sử dụng dựa trên các ảnh vệ tinh mà mây đƣợc phân ra thành các loại mây thấp (86 mẫu), hỗn tạp (87 mẫu), mây nhỏ (46 mẫu), mây tích mƣa (24 mẫu). Hai thí nghiệm đƣợc tiến hành là phân loại vào tất cả các lớp và chỉ phân loại vào vào 3 lớp đầu tiên. Hai thí nghiệm này sử dụng 45 các đặc trƣng kết cấu về phổ nhƣ trung bình, độ lệnh chuẩn, và các đặc trƣng dựa vào tần số tích lũy. Với bộ phân loại lân cận gần nhất sử dụng độ đo khoảng cách Fisher thí nghiệm phân loại ra 4 lớp thực hiện

đúng với 91% số trƣờng hợp, thí nghiệm còn lại đúng với 98%. Tác giả đƣa ra kết luận với các đặc trƣng kết cấu dạng mây vệ tinh thì biểu diễn thông tin dƣới dạng phổ (phƣơng pháp dựa vào xử lý tín hiẹu số) là tối ƣu hơn cả.

Trong [24] một so sánh giải thuật kết cấu khác nhau bao gồm phƣơng pháp phụ thuộc mức xám không gian (SGLDM) hay ma trận đồng xuất hiện, phƣơng pháp loạt dài mức xám (GLRLM), phƣơng pháp khác nhau mức xám (GLDM) và phƣơng pháp về phổ lũy thừa (PSM) đƣợc xem nhƣ là các phƣơng pháp biểu diễn kết cấu. Phƣơng pháp đánh giá ở đây khác với các phƣơng pháp khác. Nó không đi vào so sánh hiệu suất của việc nhận dạng đối tƣợng ảnh theo các biểu diễn kết cấu khác nhau nhƣ các phƣơng pháp trên. Thay vào đó nó đi vào đánh giá lƣợng thông tin ngữ cảnh của kết cấu trong một giải thuật. Kết luận đƣợc đánh giá là SGLDM không phân biệt mạnh giữa các cặp kết cấu riêng lẻ ở một khoảng cách nào đó. Năm độ đo đƣợc trích chọn từ ma trận đông xuất hiện không chứa những thông tin ngữ cảnh kết cấu quan trọng trong ma trận đó. Với GLRLM không phân biệt đƣợc kết cấu Markov với kết cấu quay 180 độ. Cũng giống nhƣ GLDM và PSM, GLRLM rất nhạy cảm với nhiễu. Kết luận rút ra từ thí nghiệm là SGLDM là phƣơng pháp hữu dụng chung nhất cho đại đa số các phƣơng pháp biểu diễn đối với các loại kết cấu khác nhau. Thí nghiệm khác cũng đƣợc thực hiện trong cùng nghiên cứu phân tích kết cấu nói trên với việc so sánh hai cách tiếp cận thống kê và có cấu trúc. Kết luận đƣa ra là phƣơng pháp ma trận đồng khả năng, phƣơng pháp dựa vào toán tử không gian LBP và phƣơng pháp dựa vào mô hình Fractal là các phƣơng pháp cho độ chính xác tƣơng đối ổn định đi cùng với nó là số chiều của không gian vector đặc trƣng thấp, tiết kiệm đƣợc nhiều chi phí tính toán hơn.

Tóm lại, cũng nhƣ việc khó định nghĩa thế nào là kết cấu. Ngƣời ta không thể đƣa ra một kết luận chính xác là biểu diễn kết cấu nhƣ thế nào là tối ƣu cho trƣờng hợp tổng thể. Các đánh giá phần lớn mang tính thực nghiệm và tùy vào độ phức tạp của ứng dụng khác nhau ngƣời ta sẽ có cách biểu diễn kết cấu phù hợp cho ứng dụng đó, cũng nhƣ thể hiện của chính bản thân kết cấu. Số chiều của các vector đặc trƣng phải không quá lớn để có thể xử lý cho ứng dụng. Đôi khi điều

này phải thực hiện bằng cách bỏ đi các biểu diễn kết cấu có thể tốt hơn về lý thuyết. Thông thƣờng các kết cấu ngẫu nhiên sẽ thích hợp hơn với cách biểu diễn thống kê. Các kết cấu dạng động nhƣ mây, khói... sẽ thích hợp để biểu diễn theo các phƣơng pháp dựa vào xử lý tín hiệu. Trong các ứng dụng thực tế, các thông tin kết cấu thƣờng phải kết hợp với các thông tin khác (nếu có thể) để thu đƣợc độ chính xác cao hơn cho các hệ thống phát hiện đối tƣợng.

CHƯƠNG 3: ỨNG DỤNG

Một phần của tài liệu Nghiên cứu một số kỹ thuật phát hiện đối tượng ảnh dựa vào kết cấu và ứng dụng (Trang 42)