Hình ảnh nhị phân B4

Một phần của tài liệu Nghiên cứu phát hiện một số đối tượng trong ảnh viễn thám (Trang 31)

2.1.4. Kết quả hình ảnh cường độ của các tuyến đường cao tốc có xe cộ

Để có được hình ảnh cường độ cuối cùng Final_Image, đường cao tốc có xe cộ, chỉ các pixel có giá trị 1 trong B4 được xem xét. Nếu một pixel có giá trị 1

(trắng) trong B4, thì cường độ của pixel tương ứng trongảnh thử nghiệm gốc M1 được sao chép vào Final_Image. Bằng cách này, các đường cao tốc được phát hiện có xe cộ sẽđược sao chép từ M1 sang Final_Image bằng B4. Hình 2.11 cho thấy hình ảnh kết quả thu được bằng thuật toán “Phát hiện đường cao tốc có xe cộ”. Thuật tốn như sau:

[hàng cột trang] = size [B4]; fori = 1: hàng,

forj = 1: cột,

if B4 [i, j] == 1

Final_Image [i, j] = M1 [i, j]; else Final_Image [i, j] = 0; end; end; end; Hình 2.11. Đường cao tốc có xe cộ

Trong Hình 2.11, khu vực được đánh dấu bằng hình chữ nhật màu đỏ khơng phải là một phần của đường cao tốc và nó làcũng khơng phải là một phương tiện. Khu vực được đánh dấu là một vòng tròn màu đen được tạo thành bởi đường cao tốc trong hình ảnh B3. Trong khi điềncác lỗ đen với màu trắng để phát hiện xe, vịng lặp cũng được lấp đầy. Vì vịng lặp là màu trắnglỗ hổng trong hình ảnh B4, nó đã được phát hiện trong hình ảnh kết quả.

Sau đây là code chính áp dụng để tính tốn B1 trong Matlab phiên bản 2013a để phát hiện các đường cao tốc.

2.2. Phát hiện xe từ hình ảnh viễn thám

Mục đích của nghiên cứu này là phát triển các thuật toán hiệu quả để phát hiện tự động, phân loạivà đếm số lượng xe từ ảnh vệ tinh độ phân giải cao. Các hình ảnh được sử dụng cho dự án này là 1-m ảnh panchromatic từ vệ tinh IKONOS. Hai thuật tốn Phân đoạn Hình ảnh khác nhau,dựa trên Nhiều ngưỡng và Ngưỡng Otsu, được phát triển để phát hiện phương tiện. Nhữngthuật toán đã được thử nghiệm trên một số hình ảnh và kết quả được phân tích để xác định thuật tốn nàocho kết quả tốt hơn trong điều kiện nào.

RGB = imread ( 'NutGiaoPhapVanCT1A2.jpg' ); If=imfinfo('NutGiaoPhapVanCT1A2.jpg' ); figure imshow (RGB); M1 = rgb2gray(RGB); figure imshow(M1) a=If.Height; M2=imresize(M1,[a 1]); for i=1:a M2(i)= mean2(M1(:,i)); end figure %grid on imhist(M1); T=(mean(M2)+max(M2))/2; %T=mean(M2); %tao anh nhi phân

B1=M1; for i=1:a for j=1:If.Width if M1(i,j)< T B1(i,j)=0; else %if M1(i,j)>150 % B1(i,j)=0; %else B1(i,j)=255; % end end end end figure imshow(B1);

Trong Phần2.2.1, chúng tôi cung cấp một đánh giá các nghiên cứu, đề cập đến một số tác giả đã và đang làm việctrong các dự án tương tự. Phần2.2.2 giải thích chi tiết về hai thuật tốn được sử dụng cho phương tiệnsự phát hiện. Nó cũng giải thích cách thức phân loại và đếm các phương tiện được thực hiện. Mục2.2.3trình bày kết quả của cả hai thuật tốn trên một số hình ảnh thử nghiệm. Trong phần 3,4 là kết luận về kết quả.

2.2.1 Đặt vấn đề

Trong tài liệu, một số tác giả đã đề xuất các cách tiếp cận khác nhau để phát hiện ô tô, hầu hếtchúng bằng cách sử dụng hình ảnh trên khơng. Ví dụ trong [4], [9] các tác giả đề xuất một cách tiếp cận để phát hiện và đếmô tơ sử dụng hình ảnh trên khơng từ cảnh đơ thị. Họ đề xuất một mơ hình ơ tơ 3D để phát hiện vàđếm xe. Trong [10] hình ảnh từ trên khơng của chế độ xem dọc của các khu vực đô thị được sử dụng và cách tiếp cậnphát hiện ơ tơ dựa trên một mơ hình ơ tơ chung (hình dạng của ranh giới của ơ tơ và ranh giới phía trướckính chắn gió), sau đó mơ hình ơ tơ được sử dụng để dự đốn xem các hình dạng được phát hiện trong hình ảnh có phải là ơ tơ hay khơng. Trong[11] một chiếc xe được mơ phỏng như một hình chữ nhật có nhiều kích thước và phép tích chập với các mặt nạ cạnh được sử dụng đểtrích bốn cạnh của ranh giới hình chữ nhật. Trong [12] một mơ hình được tạo ra bằng hình ảnh ví dụ về ơ tơvà số liệu thống kê của chúng được ghi lại dưới dạng vectơ; sau đó bằng cách tính tốn vector đặc trưng từ các vùng hình ảnh vàkiểm tra chúng so với số liệu thống kê của các mơ hình ơ tơ, các phương tiện được phát hiện. Trong [13] các tác giả trích vànhóm các đặc điểm hình ảnh để xây dựng các cấu trúc tương tự như một mơ hình ơ tơ.Mục tiêu của cơng việc này là phát triển các thuật toán hiệu quả để phát hiện, phân loại vàđếm phương tiện trên đường cao tốc bằng ảnh vệ tinh độ phân giải cao. Vì trọng tâm của chúng tơi là đường cao tốccảnh chứ không phải khu vực đô thị phức tạp, cách tiếp cận của chúng tơi đơn giản hơn nhiều, nó dựa trên cường độ giá trị xámvà ngưỡng, nó khơng sử dụng bất kỳ kiểu xe ô tô nào. Dữ liệu được sử dụng cho dự án này là 1 hình ảnh tồn sắc từ vệ tinh IKONOS và các kỹ thuật xử lý hình ảnh được sử dụng chothực hiện thuật toán. Thuật toán được chia thành hai phần. Phần đầu phát hiện xe sáng và sử dụng hai phương pháp Nhiều ngưỡng và Ngưỡng Otsu. Phần thứ hai phát hiện bóng tốiphương tiện dựa trên phương pháp Otsu. Phần mềm MATLAB ™ được sử dụng

để triển khaicác thuật tốn. Các hình ảnh thử nghiệm thu được từ các trang web trong tài liệu tham khảo [6] [7] [8].

2.2.2 Thuật toán phát hiện, phân loại và đếm phương tiện

Như chúng tôi đã đề cập trong Phần1.4.1, việc phát hiện các phương tiện trong một hình ảnh được thực hiện bằng cách trích xuấtcác đối tượng tiền cảnh. Chia hình ảnh thành tiền cảnh và hậu cảnh được gọi là Phân đoạn hình

ảnh.Việc phân đoạn hình ảnh đạt được bằng cách sử dụng các thuộc tính chung của

các pixel. Trong cơng trình nghiên cứu này,thuộc tính cường độ của pixel được sử dụng trong việc phát triển các thuật toán phân đoạn ảnh.

Các thuật toán phân đoạn hình ảnh thường dựa trên một trong hai thuộc tính cơ bản củagiá trị cường độ: gián đoạn và tương tự. Trong tiêu chí đầu tiên, hình ảnh được phân vùng khi cóthay đổi đột ngột về cường độ của các pixel lân cận, chẳng hạn như các cạnh trong hình ảnh. Trong tiêu chí thứ hai,hình ảnh được phân vùng thành các vùng tương tự nhau theo một số điều kiện xác định trước [3]. Trong nàydự án chúng tơi đã sử dụng tiêu chí thứ hai, tức là sự tương đồng trong việc phát triển các thuật tốn Phân đoạn hình ảnh.

2.2.2.1 Kỹ thuật lập ngưỡng

Ngưỡng là một trong những phương pháp mạnh mẽ được sử dụng để phân đoạn hình ảnh. Nó hữu ích trongphân biệt tiền cảnh (đối tượng quan tâm) với hậu cảnh. Trong nhiều trường hợp, cường độ hình ảnh cónhiều mức độ xám khác nhau cho tiền cảnh và hậu cảnh [3]. Những hình ảnh như vậy thường cóbiểu đồ hai mơ thức như hình 2.9.

Các điểm ảnh có cường độ nhỏ hơn T (giá trị ngưỡng) thuộc về nền và các điểm ảnh cócường độ lớn hơn T thuộc đối tượng (hoặc ngược lại). Để trích xuất các đối tượng, hình ảnh cường độf (x, y) được chuyển đổi sang một hình ảnh nhị phân g(x, y) bằng cách sử dụng T. Đối với một pixel tại một điểm (x, y), nếu cường độ f (x, y)> T, sau đó nó được coi là một Pixel đối tượng khác Pixel nền. Hình ảnh

ngưỡng được xác định là (x, y) = 1 nếu f (x, y)> T, g (x, y) = 0 nếu f (x, y) <T.

Do đó, các pixel có nhãn 1 tương ứng với các đối tượng và các pixel có nhãn 0 tương ứng với nền.

2.2.2.2 Nhiều ngưỡng

Trường hợp lý tưởng là biểu đồ hình dạng hai phương thức, nhưng những biểu đồ như vậy thường khơng có sẵn trong thực tếcác ứng dụng. Nói chung, một hình ảnh cường độ phải được chia thành nhiều phạm vi phụ để thực hiệntạo ngưỡng, nhưng các phạm vi này thường chồng chéo nhau và điều này gây khó khăn cho việc lập ngưỡng.Trong dự án này, các hình ảnh được sử dụng để phát hiện phương tiện hiển thị một biểu đồ được thể hiện trong hình2.10. Từ hình này, chúng ta có thể thấy rằng hai đỉnh được xác định rõ ràng. Đỉnh bên trái(mặt tối) đại diện cho nền. Đỉnh ở bên phải (phía sáng) đại diện cho pixel củatiền cảnh (xe cộ). Lưu ý rằng biểu đồ thể hiện một vùng chồng chéo giữa nềnvà pixel nền trước. Sự chồng chéo này có nghĩa là một số đối tượng hoặc vùng nền nhưvạch kẻ làn đường có cường độ tương tự như vật thể phía trước (xe cộ). Do đó, chỉ để phát hiện các phương tiện,nhiều ngưỡng được sử dụng. Phần2.2.2.3 và2.2.2.4 mô tả các thủ tục được tuân theo để tính tốn các giá trị ngưỡng khác nhau và cách chúng được sử dụng để phát hiện các phương tiện.

Để đạt được mục tiêu phát hiện tất cả các phương tiện trên hình ảnh thử nghiệm, chúng tơi đã chiathuật tốn gồm hai phần:

 Phát hiện các phương tiện sáng so với nền.

 Phát hiện các phương tiện giao thơng tối so với nền.

Hình2.11 đưa ra một ví dụ về phương tiện tối và sáng trong ảnh thử nghiệm. Trong những điều sau đây, cả hai phần đều được giải thích chi tiết.

Hình 2.11. Phương tiện sáng và tối

2.2.2.3 Phát hiện các phương tiện sáng

Hai phương pháp khác nhau được đề xuất để xác định các phương tiện sáng:

Nhiều ngưỡng

Phân cụm theo phương pháp Otsu

Phương pháp nhiều ngưỡng

Bằng cách phân tích một số hình ảnh mẫu trong cơ sở dữ liệu, chúng tơi có thể nói rằng các giá trị cường độcủa các phương tiện sáng lớn hơn cường độ của nền và đơi khi có một vùngnơi chúng chồng lên nhau. Do chồng chéo, một số đối tượng hoặc khu vực trên đường, chẳng hạn như điểm đánh dấu làn đườngvà dải phân cách trên đường có thể có giá trị cường độ tương tự như cường độ của một số phương tiện giao thông sáng. Cũng thế,mỗi phương tiện sáng có thể khơng có cùng dải cường độ do điều kiện khí quyển và màu sắccủa các phương tiện. Do đó, chỉ để xác định các phương tiện và tránh phát hiện các đối tượng không liên quan như làn đườngđánh dấu, ba ngưỡng khác nhau T1, T2, và T3 được sử dụng.

Tính tốn các giá trị ngưỡng

Trong MATLAB, một hình ảnh cường độ có thể được lưu trữ trong một ma trận hai chiều. Cho ma trận này là M1.Mỗi phần tử của ma trận M1 tương ứng với

cường độ của mỗi pixel của ảnh. Ma trận một cộtM2 được hình thành bằng cách sử dụng M1. Mỗi hàng của M2 chứa cường độ lớn nhất của hàng tương ứng làcường độ của M1. Chúng tôi biết rằng trong một hình ảnh cường độ cao, trên đường cao tốc, các phương tiện sáng cómức cường độ hơn bất kỳ đối tượng nào khác. Do đó, chúng tơi đang xem xét cường độ tối đa trong mỗi hàngcủa M2 để tính tốn ba

//M2 được tính bằng cách sử dụng M1 M2:

for mỗi hàng i trong M1

M2 [i] = Maximum_intensity [M1, i]

T1, T2 và T3 được tính bằng cách sử dụng M2

T1: T1 = Mean [M2] T2:T2 = Min [M2]

T3:T3 = Trung bình [T1, T2]

Các ngưỡng T1, T2 và T3 được sử dụng để chuyển đổi hình ảnh thử nghiệm thành ba hình ảnh nhị phân khác nhauImage1, Image2 và Image3. Đối với một pixel ở tọa độ (x, y), nếu cường độ I (x, y)> T, thì nó làđược coi là Pixel đối tượng (1)

khác Pixel nền (0). Hình ảnh nhị phân được định nghĩa là: Hình ảnh (x, y) = 1 nếu f (x, y)> T

= 0 nếu f (x, y) <T.

Hình2.2.4 cho thấy một đường cao tốc ở Oklahoma. Để phát hiện các phương tiện bằng cách sử dụngtrước tiên, người dùng chọn một khu vực quan tâm. Vùng quan tâm này có hình chữ nhật,được chọn bằng cách sử dụng chuột và chỉ nên chứa một chiều trên đường cao tốc. Nếu đường cao tốc đang nghiên cứukhơng nằm dọc hoặc ngang trên hình ảnh, người dùng nên xoay hình ảnh trước để dễ dànglựa chọn khu vực đang nghiên cứu. Ngoài ra, nếu khu vực đã chọn của đường cao tốc có chứa hai chiều, các yếu tốchẳng hạn như dải phân cách, biển báo, ...., sẽ ảnh hưởng đến kết quả của thuật tốn. Do đó để có được kết quả tốt hơn, khu vực đang nghiên cứu được chọn theo cách mà nó chỉ chứa đường cao tốc một chiều. Lựa chọnnên tránh các vai đường và đường dốc, các khu vực được nghiên cứu chỉ nên cóđường cao tốc với các phương tiện. Hình2.12 cho thấy một ví dụ về việc lựa chọn một khu vực đang nghiên cứu. Điều nàyvùng được đánh dấu trong Hình2.13 Đường một chiều được chọn có mười phương tiện (sáng) và khơng có xe xe cộ(tối).

Hình2.12. Đường cao tốc ở Oklahoma

Hình2.13. Một chiều được chọn

Bằng cách áp dụng thuật toán Nhiều ngưỡng trong trường hợp thử nghiệm. Hình2.14 cho thấy ba hình ảnh nhị phân Image1, Image2 và Image3thu được bằng cách sử dụng các ngưỡng này.

Hình2.14. Hình ảnh nhị phân thu được bằng cách sử dụng T1, T2 và T3

Giảm phát hiện các đối tượng không liên quan như vạch kẻ làn đường và dải phân cách đường

Từ ví dụ này (Hình2.14), chúng ta có thể thấy rằng mỗi ngưỡng phát hiện một số hoặc tất cả các phương tiện trongkhu vực đang được nghiên cứu, nhưng các điểm đánh dấu làn đường và dải phân cách đường được phát hiện bởi một số giá trị ngưỡng quá (do sự chồng chéo về cường độ của tiền cảnh và hậu cảnh). Để tránh

hoặc giảm phát hiện các đối tượng không liên quan như vạch kẻ làn đường và dải phân cách, các phép tốn logic được thực hiện giữa các hình ảnh nhị phân. Đối với trường hợp phát hiện xe sáng, kết quả tốt nhất là lấy các đối tượng chung từ các cặp ảnh nhị phân được tạo bởi các ngưỡng T1, T2 và T3. Điều nàycó nghĩa là, các đối

tượng chung từ các cặp: (Image1, Image2), (Image2, Image3) và (Image1, Image3) là Lấy. Chúng ta có thể quan sát từ Hình2.14 rằng Hình 1 chứa một số phương tiện, Hình 2 chứa tất cả các phương tiện và cả các vạch kẻ làn đường, dải phân cách, .... và Image3 chứa tất cả các phương tiện có mặt trong hình ảnh thử nghiệm. Để phát hiện tất cả các phương tiện sáng và để giảm việc phát hiện các đối tượng không liên quan, Phép tốn LOGICAL AND được thực hiện để trích xuất các đối tượng chung giữa các ảnh nhị phân. Bởi áp dụng phép toán AND trên ba tổ hợp ảnh nhị phân, ba ảnh nhị phân mới: New_Image1, New_Image2 và New_Image3, được hình thành như trong Hình2.15.

New_Image1 = bitwiseAND [Image1, Image2] New_Image2 = bitwiseAND [Image2, Image3] New_Image3 = bitwiseAND [Image1, Image3]

Hình2.15. Các đối tượng chung được lấy từ các cặp ảnh nhị phân

Phát hiện tất cả các phương tiện trên hình ảnh thử nghiệm

Các hình ảnh kết quả New_Image1, New_Image2 và New_Image3 thu được sauloại bỏ các đối tượng không liên quan sẽ chỉ chứa các phương tiện. Mỗi hình ảnh nhị phân này có thể chứa một số hoặc tất cả các phương tiện. Ba hình ảnh này được

thêm vào để có được một hình ảnh duy nhất với tất cả các phương tiện. Việc bổ sung hình ảnh đạt được bằng cách sử dụng thao tác LOGICAL OR.

Từ Hình2.15, chúng ta có thể thấy rằng New_Image1 chứa một số phương tiện, New_Image2cũng chứa một số phương tiện và New_Image3 chứa tất cả các phương tiện. Hình2.16 cho thấykết quả cuối cùng, nghĩa là, tất cả các phương tiện sáng được phát hiện bởi Thuật toán phát hiện phương tiện nhiều ngưỡng.

Final_Result = bitwiseOR (New_Image1, New_Image2, New_Image3)

Hình2.16. Các phương tiện sáng được phát hiện bằng kỹ thuật nhiều ngưỡng

Ngưỡng Otsu

Ngưỡng Otsu [14] sử dụng khả năng phân tách lớp và tối đa hóa phương sai giữa các lớp để tìmgiá trị ngưỡng tối ưu k *. Giá trị ngưỡng này được sử dụng để trích xuất các đối tượng từ nền của chúng.MATLAB tích hợp sẵn chức năng đánh giá ngưỡng Otsu k *. Áp dụng trực tiếp ngưỡng Otsuđối với hình ảnh thử nghiệm, sẽ phát hiện ra các phương tiện sáng sủa, nhưng cũng có một số vạch kẻ làn đường và dải phân cách đườngcó mặt trên các tuyến đường cao tốc. Để giảm bớt vấn đề về vạch kẻ làn đường và dải phân cách đường, một quy trình xử lý trướcbước được áp dụng đầu tiên. Bước tiền xử lý liên quan đến việc áp dụng hoạt động vùng lân cận trượt đểhình ảnh thử nghiệm. Hoạt động vùng lân cận trượt bao gồm việc gán cho từng pixel của hình ảnh thử nghiệm,cường độ tối đa của vùng lân cận của nó (đây là một vùng hình chữ nhật có 3 x 3 pixel, là trung tâmpixel cái đang được xử lý bởi hoạt động).

Toán tử Vùng lân cận Trượt:

f = inline ('max (x (:))');

slide_image = nlfilter (test_image, [3 3], f);

nlfilter (test_image, [3 3], f) áp dụng hàm 'f' cho mỗi khối trượt 3 x 3 của ảnh

thử nghiệm.

Toán tửvùng lân cận trượt : Hàm vùng lân cận trượt là một hoạt động được

thực hiệnpixel tại một thời điểm, với giá trị của bất kỳ pixel nhất định nào trong hình ảnh đầu ra được xác định bởi ứng dụngcủa một hàm đối với các giá trị của vùng lân cận pixel đầu vào tương ứng. Vùng lân cận của pixel là một số tập hợp

pixel, được xác định bởi vị trí của chúng so với pixel đó, được gọi là pixel trung tâm. Cácvùng lân cận là một khối hình chữ nhật và khi người dùng di chuyển từ phần tử này sang phần tử tiếp theo trong ma trận hình ảnh,khối lân cận trượt theo

Một phần của tài liệu Nghiên cứu phát hiện một số đối tượng trong ảnh viễn thám (Trang 31)

Tải bản đầy đủ (PDF)

(83 trang)