Phân loại lớp phủ từ dữ liệu ảnh vệ tinh dựa trên phương pháp phân cụm phổ

7 11 0
Phân loại lớp phủ từ dữ liệu ảnh vệ tinh dựa trên phương pháp phân cụm phổ

Đang tải... (xem toàn văn)

Thông tin tài liệu

Với ưu điểm là diện tích phủ rộng, dữ liệu ảnh phong phú, thời gian chụp lặp lại tại một khu vực có thể trong vài ngày, không tốn nhiều thời gian, công sức cũng như chi phí so với các [r]

(1)

PHÂN LOẠI LỚP PHỦ TỪ DỮ LIỆU ẢNH VỆ TINH DỰA TRÊN PHƯƠNG PHÁP PHÂN CỤM PHỔ

Mai Đình Sinh1*, Đinh Văn Hội2,3

Tóm tắt: Phân cụm ảnh tìm cấu trúc nhóm có đặc tính tương đồng để tạo thành cụm Có nhiều phương pháp phân cụm khác hầu hết đều chiến lược dựa vào khác màu sắc để phân chia điểm ảnh cụm Do tính chất phức tạp liệu ảnh vệ tinh thông tin ảnh thường bị chồng lấp hình dạng phức tạp đối tượng ảnh, đó, việc sử dụng phương pháp truyền thống tổ hợp màu, phân ngưỡng,… có ưu điểm dễ cài đặt có độ xác thấp Phân cụm phổ phương pháp phân cụm dựa lý thuyết đồ thị, có khả phân loại tốt liệu mà có cấu trúc hình dạng phức tạp liệu ảnh vệ tinh Do yêu cầu tác chiến nay, người huy cần phải có thơng tin tức thời hình thái khu vực tác chiến để có phương án bố trí cơng sự, trận địa hợp lý Bài báo giải vấn đề phân loại nhanh lớp phủ ảnh vệ tinh dựa phương pháp phân cụm phổ phục vụ công tác ngụy trang

Từ khóa: Phân cụm phổ, Ảnh vệ tinh, Fuzzy c-means, Phân loại lớp phủ 1 ĐẶT VẤN ĐỀ

Viễn thám lĩnh vực khoa học giúp thu thập thông tin đối tượng bề mặt trái đất mà không cần tiếp xúc trực tiếp với chúng, nguyên lý viễn thám đặc trưng phản xạ hay xạ đối tượng tự nhiên tương ứng với giải phổ khác [2] Ảnh viễn thám có ưu điểm phủ trùm khu vực rộng lớn, liệu ảnh cập nhật thường xuyên số loại ảnh vệ tinh cung cấp miễn phí mạng internet Dữ liệu ảnh vệ tinh khó phân cụm cách hiệu chồng lấp hình thù phức tạp đối tượng ảnh [3]

Hơn nữa, lựa chọn thuật toán phân cụm phụ thuộc vào liệu khám phá, chất lượng lời giải phân cụm bị ảnh hưởng độ đo sử dụng để đánh giá tương tự (khoảng cách) điểm ảnh Cho đến nay, có nhiều cơng trình nghiên cứu tốn phân loại đối tượng ảnh vệ tinh với nhiều phương pháp khác [5, 7] Những nghiên cứu nước phân loại lớp phủ ảnh vệ tinh cho thấy, phương pháp sử dụng ảnh viễn thám để thành lập đồ trạng lớp phủ đất có hiệu lớn Với ưu điểm diện tích phủ rộng, liệu ảnh phong phú, thời gian chụp lặp lại khu vực vài ngày, không tốn nhiều thời gian, công sức chi phí so với phương pháp khác, cơng nghệ viễn thám sử dụng hiệu xây dựng đồ trạng lớp phủ phạm vi rộng lớn cách nhanh chóng, nhằm hỗ trợ người huy lập phương án ngụy trang hợp lý, giảm thiểu thương vong người vũ khí trang bị

Đối với vùng mà ranh giới khơng rõ ràng kết phân loại thuật tốn thống kê truyền thống thường khơng đảm bảo thời gian kinh phí, chí khơng phân loại với khu vực rừng núi hiểm trở, vậy, kết phân loại lớp phủ thường có độ xác thấp Phương pháp sử dụng ảnh vệ tinh kết hợp với số liệu đo đạc thực địa có độ xác cao chi phí xây dựng đồ lớp phủ lớn tốn nhiều thời gian đáp ứng tức thời điều kiện tác chiến

(2)

Công nghệ thơng tin & Cơ sở tốn học cho tin học

hiểm trở, cơng việc đo đạc khó thực được, lý để tác giả thực nghiên cứu

Trong báo này, tác giả đề xuất phương pháp phân loại lớp phủ từ liệu ảnh vệ tinh Landsat dựa thuật toán phân cụm phổ Để đánh giá hiệu độ xác phương pháp đề xuất, sử dụng số số sử dụng phổ biến để đánh giá chất lượng kết phân cụm với số thuật toán phân cụm phổ biến k-Means, iso-data, fuzzy c-means Bài báo gồm phần chính, Phần đặt vấn đề; Phần sở lý thuyết phương pháp giải quyết; Phần thực nghiệm Phần kết luận

2 CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP GIẢI QUYẾT 2.1 Cơ sở lý thuyết

Phân cụm phổ phương pháp phát cấu trúc nhóm tập liệu, dựa việc xem xét điểm liệu nút đồ thị liên thông, phương pháp giới thiệu lần Donath, Hoffman [10] Fiedler [8] Coi tập liệu biểu diễn liệu ảnh vệ tinh đa phổ x x1, 2, ,xn Các cụm phát dựa độ đo mức độ tương tự cấu trúc cụm khoảng cách Eulidean không gian màu [4] Giả sử ta có tập liệu n điểm ảnh X { ,x x1 2, ,xn}, ta đo độ tương tự cặp điểm ảnh x xi, j ký hiệu ma trận tương tự tương ứng S ( )sij nxn, ma trận cho thấy mức độ tương đồng điểm ảnh Trong phân cụm phổ giá trị biểu thị mức độ tương tự điểm ảnh thường tính dựa hàm Gaussian:

2

ij

(x ,x ) exp d i j

s

 

  

 

Với  tham số người dùng định nghĩa, giá trị  tối ưu giá trị mà cho kết phân cụm tốt d x x( ,i j) khoảng cách không gian màu hai điểm ảnh x xi, j Giả sử ta coi tập liệu đồ thị vô hướng

( , )

GX S X tập đỉnh (điểm ảnh) S tập cạnh Khi đó,

ij ( )nxn

Ss ma trận trọng số đồ thị, sij 0 hai đỉnh x xi, j không liên thông sij sji G đồ thị vô hướng [9]

Xây dựng ma trận đường chéo D với giá trị di miêu tả trọng số nút độ

thị: i ( , )

j

d s i j với j tương ứng số đỉnh kề với đỉnh i

Xây dựng ma trận Laplace từ ma trận S ma trận D trên: L D1/ 2SD1/

 , ma

trận sử dụng để trích xuất k cụm việc tìm k véc tơ riêng với k giá trị riêng lớn

Các bước thực thuật toán phân cụm phổ (SC):

1 Tham chiếu tập liệu ban đầu vào không gian Rn

2 Định nghĩa ma trận kề S, sử dụng hàm Gaussian: S { }sij

3 Xây dựng đồ thị Laplacian L từ ma trận kề S: LD1/ 2SD1/

(3)

5 Lựa chọn k véc tơ riêng v ii, 1, ,k tương ứng với k giá trị riêng lớn

, 1, ,

i i k

  định nghĩa không gian k chiều

6 Phân cụm tập liệu không gian k chiều thành k cụm

Thuật tốn chuyển đổi khơng gian liệu ban đầu vào không gian liệu k chiều (k số cụm cần phải phân loại) Do tính chất đồ thị Laplace, thay đổi biểu diễn làm tăng khả phân cụm liệu, đến mức cụm phát dễ dàng biểu diễn Và sử dụng thuật tốn phân cụm thơng thường thuật toán k-Means để phát cụm biểu diễn

2.2 Áp dụng phương pháp phân cụm phổ phân loại lớp phủ ảnh vệ tinh

2.2.1 Dữ liệu ảnh vệ tinh

Ảnh viễn thám (ảnh vệ tinh): ảnh số thể vật thể bề mặt trái đất thu nhận cảm biến đặt vệ tinh Nguyên lý viễn thám đặc trưng phản xạ hay xạ đối tượng tự nhiên tương ứng với giải phổ khác Kết việc giải đốn lớp thơng tin phụ thuộc nhiều vào hiểu biết mối tương quan đặc trưng phản xạ phổ với chất, trạng thái đối tượng tự nhiên Những thông tin đặc trưng phản xạ phổ đối tượng tự nhiên cho phép nhà chuyên môn chọn kênh ảnh tối ưu, chứa nhiều thông tin đối tượng nghiên cứu, đồng thời sở để phân tích nghiên cứu tính chất đối tượng, tiến tới phân loại chúng

Dữ liệu ảnh vệ tinh thường có nhiều kênh ảnh khác tương ứng với bước sóng phản xạ phổ khác đối tượng mặt đất Trong số đó, kênh đỏ cận hồng ngoại (kênh 3, ảnh Landsat TM, ETM+; kênh 4, ảnh Landsat 8) sử dụng để tính số thực vật (NDVI) [5] theo cơng thức sau:

NIR RED

NIR RED

NDVI  

 

 

 (1)

Trong đó, ρNIR, ρRED phản xạ phổ kênh cận hồng ngoại đỏ

Chỉ số thực vật có giá trị từ -1 đến +1, giá trị NDVI cao cho biết khu vực có nhiều thực vật Tuy nhiên, số NDVI tính toán kênh ảnh số nhiều kênh ảnh ảnh vệ tinh, đó, số không phản ảnh hết thông tin bề mặt đất Thông thường người dùng phải sử dụng kết hợp số với phương pháp khác trích chọn ảnh, đo đạc ngồi thực địa,… Các phương pháp thường tốn nhiều thời gian, đặc biệt khu vực rừng núi, địa hình hiểm trở Vì vậy, nhóm tác giả đề xuất phương pháp sử dụng số thực vật NDVI với với kênh ảnh đa phổ ảnh Landsat để phân loại tự động đối tượng lớp phủ ảnh vệ tinh

2.2.2 Phân loại lớp phủ ảnh vệ tinh

Để áp dụng phương pháp phân cụm phổ vào phân loại ảnh vệ tinh, cần phải chuyển liệu ảnh vệ tinh thành liệu đầu vào theo cấu trúc thuật toán phân cụm phổ Giả sử ảnh vệ tinh Landsat có b kênh ảnh, nghiên cứu này, nhóm tác giả bổ sung thêm liệu ảnh số NDVI kênh, vậy, liệu dùng để phân loại gồm có

1

b kênh ảnh Với bổ sung thêm thơng tin lớp phủ thực vật giúp việc phân loại lớp phủ thực vật tăng cường độ xác

(4)

Cơng nghệ thơng tin & Cơ sở tốn học cho tin học

xây dựng đồ thị vô hướng mà điểm đối tượng xi, xây dựng ma trận tương tự theo phương pháp trình bày trên, đặt S ma trận trọng số nó:

2

ij

(x ,x ) exp d i j

s

 

  

 

(2) Tính ma trận Laplace L tìm k véc tơ riêng có giá trị riêng lớn

1, 2, , k

   ma trận L:

1/ 1/

L DSD

 (3) Đặt ERnxk ma trận gồm cột véc tơ  1, 2, ,k, với i0, ,n, đặt

k i

yR véc tơ tương ứng với hàng thứ i E Lúc này, tập liệu ban đầu không gian b1 chuyển không gian Y ( )yi i1, ,nRk toán ban đầu trở thành toán phân cụm tập liệu Y

Để phân cụm liệu tập Y ( )yi i1, ,nRk có nhiều phương pháp khác từ phân cụm rõ đơn k-Means phát triển đến thuật toán phân cụm mờ loại Fuzzy c-Means (FCM) James C.Bezdek (1984) [6], đặc điểm liệu ảnh vệ tinh phức tạp sơ với ảnh màu thơng thường, vậy, tác giả lựa chọn thuật tốn FCM để phân cụm tập liệu Y nhằm tăng cường hiệu phân loại lớp phủ Bài toán phân cụm FCM tốn tìm độ thuộc uij nhằm tối thiểu hóa hàm mục tiêu:

2 ij 1

( , ) ,1

n k

m ij

i j

J U v u d m

 

     (4) Trong đó:

+ dij yicj khoảng cách theo thước đo Euclide mẫu liệu yi với trọng tâm cụm thứ cj,j 1, ,k

+ uij[0,1] bậc hay độ thuộc liệu mẫu yi với cụm thứ cj, j1, ,k + C [ , ,c1 ck] ma trận biểu diễn giá trị tâm cụm

Thuật toán FCM cung cấp trình lặp qua lại phương trình hàm thuộc:

1

1

1 / ,1 ,1

k m

ij

l il

ij

d d

u l k i n

 

 

 

      (5) Và trọng tâm cụm:

1

( ) / ( ) ,1

n n

m m

ij i ij

i i

j u y u

c j k

 

(5)

phần tử uij ma trận phân hoạch U Phép lặp dừng max{ J(t 1) J( )t }

  

trong  chuẩn kết thúc nằm khoảng [0,1] t số bước lặp

Phương pháp đề xuất gồm bước chính, bước sử dụng phân cụm phổ để chuyển tập liệu ban đầu X sang tập liệu Y không gian bước sử dụng thuật toán FCM để phân cụm tập liệu Y

Đầu vào: Dữ liệu ảnh vệ tinh, số cụm k khởi tạo trọng tâm C [ , ,c1 ck], tham số mờ m điều kiện dừng 

Đầu ra: Bản đồ lớp phủ đất với k lớp phủ tô màu chồng lên

Hình 1. Sơ đồ phương pháp phân loại lớp phủ từ liệu ảnh vệ tinh

Chi tiết bước thực thuật toán phân cụm phổ mờ (FSC) sau: Bước 1: Tính giá trị NDVI theo cơng thức (1)

Bước 2: Tham chiếu kênh ảnh liệu ban đầu giá trị số NDVI vào không gian Rb1: X { ,x x1 2, ,xn}

Bước 3: Xây dựng ma trận trọng số S ( )sij nxn theo công thức (2)

Bước 4: Xây dựng đồ thị Laplacian L từ ma trận kề S ma trận đường chéo D theo (3)

Bước 5: Tìm giá trị riêng theo công thức Lvv

Bước 6: Lựa chọn k véc tơ riêng v ii, 1, ,k tương ứng với k giá trị riêng lớn

, 1, ,

i i k

(6)

Cơng nghệ thơng tin & Cơ sở tốn học cho tin học

Bước 8: Cập nhật trọng tâm c ii, 1, ,k theo (6)

Bước 9: Tính giá trị hàm thuộc J kiểm tra điều kiện dừng

( 1) ( )

ax{ t t }

m J  J  , thỏa mãn chuyển sang bước 10, ngược lại quay lại bước

Bước 10: Đưa kết phân cụm A A1, 2, ,Ak với Aj {i|yic }j , đánh giá độ xác, gán màu cho lớp hiển thị kết

Chi tiết sơ đồ phương pháp tác giả đề xuất thể hình 2.2.3 Đánh giá kết phân cụm

Để đánh giá chất lượng cụm sau phân phân, sử dụng số sai số trung bình bình phương MSE (Mean Squared Error index) [1] số chất lượng hình ảnh IQI (Image Quality Index) [11] Với X   xix x1, 2, ,xNvà Y   yiy y1, 2, ,yN

tương ứng ảnh ban đầu ảnh kết sau phân cụm - Chỉ số MSE tính theo công thức:

2

1

( , ) (x y )

N

i i

i

MSE x y

N

   (7) Giá trị MSE nhỏ chất lượng cụm sau phân loại tốt

- Chỉ số IQI tính theo cơng thức sau:

2 2 4 ( )( ) xy x y x y IQI x y       (8) Với 1 1 , N N i i i i

x x y y

NN

    , 2

1 (x ) N x i i x N       , 2 1 (y ) N y i i y N       1

(x )(y )

N

xy i i

i x y N     

  Giá trị tốt yixi, giá trị

nhất -1 xảy yi 2xxi với i1,N, N số điểm ảnh

3 THỰC NGHIỆM 3.1 Thực nghiệm

a) b)

(7)

Trong thực nghiệm 1, liệu ảnh viễn thám Landsat chụp năm 2016 sử dụng để phân tích thành lập đồ thảm phủ Tọa độ từ 104° 47' 8.7541" E, 19° 29' 1.3803" N đến 105° 31' 35.7251" E, 19° 09' 32.6510" N, với diện tích 941,28 km2 Dữ liệu ảnh vệ tinh phân loại theo đối tượng lớp phủ, bao gồm: mặt nước (1); Đất trống, đất (2); Đồng cỏ, bụi (3); Rừng nghèo (4); Rừng trồng, rừng tái sinh (5); Rừng tự nhiên (6)

Hình ảnh màu RGB khu vực nghiên cứu ảnh kết sau phân loại, hình 2b thấy khu vực có tập trung phía Đơng phía Nam huyện Quỳ Hợp, khu vực rừng rậm tập trung nhiều khu vực đồi núi phía Bắc phía Tây Số liệu cụ thể lớp phủ thể bảng

Bảng 1. Số liệu lớp phủ năm 2016 huyện Quỳ Hợp

STT Tên đối tượng Màu sắc Số pixel Phần

trăm

Diện tích (km2)

1 Sơng ngịi, ao hồ 33.951 3,240% 30,499

2 Đất trống, đất xây dựng 252.338 24,082% 226,680

3 Đồng cỏ, thực vật thưa 263.122 25,111% 236,367

4 Cây gỗ thấp 208.419 19,891% 187,227

5 Rừng trồng 174.337 16,638% 156,610

6 Thực vật dày, lâu năm 115.658 11,038% 103,898

Bảng 2. Chỉ số đánh giá chất lượng phân loại khu vực Quỳ Hợp

STT Chỉ số k-Means Iso-data FCM FSC

1 MSE 5,9821 3,6724 1,1893 0,1876

2 IQI -0.1237 0,3768 0,5652 0,7871

Bảng số đánh giá kết phân loại thuật toán k-Means, Iso-data, FCM FSC Số liệu bảng cho thấy kết phân loại thuật toán FSC cho kết tốt với giá trị số MSE IQI 0,1876 0,7871 Trong đó, thuật tốn phân cụm mờ FCM cho kết tốt thuật toán Iso-data k-Means, thuật toán k-Means cho kết phân loại với số MSE IQI 5,9821 -0,1237

3.2 Thực nghiệm

Thực nghiệm với liệu ảnh viễn thám Landsat chụp năm 2014 khu vực huyện Bảo Lâm – Lâm Đồng Tọa độ từ 107° 04' 21.7560" E, 11° 56' 32.3488" N 108° 22' 40.0897" E, 11° 20' 22.1085" N, với diện tích 1465 km2 Dữ liệu ảnh vệ tinh phân loại theo đối tượng lớp phủ, bao gồm: mặt nước (1); Đất trống, đất (2); Đồng cỏ, bụi (3); Rừng nghèo (4); Rừng trồng, rừng tái sinh (5); Rừng tự nhiên (6)

a) b)

Ngày đăng: 01/04/2021, 14:18

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan