2.2.1.1. Phương pháp phân loại ảnh viễn thám
2.2.1.1.1. Các nguyên tắc phân loại ảnh
a. Đặc trƣng phản xạ phổ
Các thông tin về ảnh viễn thám có liên quan trực tiếp đến năng lƣợng phản xạ từ các đối tƣợng tự nhiên trên mặt đất, nên việc nghiên cứu các đặc trƣng phản xạ phổ của các đối tƣợng tự nhiên đóng vai trò hết sức quan trọng. Những thông tin về đặc trƣng phản xạ phổ của các đối tƣợng tự nhiên sẽ cho phép các nhà nghiên cứu lựa chọn các kênh ảnh tối ƣu, chứa nhiều thông tin về đối tƣợng nghiên cứu nhất, đồng thời cũng là cơ sở để phân tích nghiên cứu các tính chất của đối tƣợng và phân tách chúng.
33
Đặc tính phản xạ phổ của các đối tƣợng tự nhiên phụ thuộc vào nhiều yếu tố của ngoại cảnh cũng nhƣ bản thân các đối tƣợng đó. Do đó, các đối tƣợng khác nhau sẽ có khả năng phản xạ phổ khác nhau (Hình 2.1).
Trong từng nhóm đối tƣợng nhƣ đất, nƣớc, thực vật. Mỗi nhóm có đặc điểm phản xạ phổ chung, ví dụ: nhóm thực vật phản xạ mạnh từ kênh đỏ trong dải nhìn thấy, nƣớc bị hấp thụ từ kênh đỏ. Tuy nhiên từng đối tƣợng cụ thể khả năng phản xạ phổ khác nhau. Ví dụ, trong nhóm đất, các loại đất phụ thuộc vào bản chất hóa lý của đất, hàm lƣợng hữu cơ, thành phần cơ giới. Khi tính chất của đối tƣợng thay đổi thì đƣờng cong phổ phản xạ cũng bị biến đổi theo. Trong một vài trƣờng hợp nhất định, khả năng phản xạ của các đối tƣợng khác nhau lại giống nhau. Khi đó, chúng ta rất khó hoặc không thể phân biệt đƣợc các đối tƣợng này, nghĩa là bị lẫn. Đây là một trong những hạn chế của ảnh vệ tinh. Vì vậy, thông tin do các dữ liệu viễn thám cung cấp cần phải đi kèm với một số thông tin khác để chính xác hoá bản chất của đối tƣợng. [5]
b. Dữ liệu ảnh vệ tinh
Trong luận văn này, học viên sử dụng 3 loại ảnh Landsat (1989, 1995), SPOT (2003, 2007) và ALOS (2010). Thông tin chi tiết của ảnh đƣợc sử dụng trong đề tài:
Bảng 2.1. Thông tin ảnh viễn thám sử dụng trong đề tài
Series Thời gian Giờ chụp Bands Resolution Góc chụp
Landsat 23/11/1989 7 30m SUN_ELEVATION = 41 SUN_AZIMUTH = 144
Landsat 1995 6 30m SUN_AZIMUTH = 113.5595985 SUN_ELEVATION = 62.4103122 SPOT 23/12/2003 3:25:11 4 10m Sun Azimut = 152.944420 Sun Elevation= 41.208165 SPOT 08/01/2007 3:18:47 4 20m không có thông tin
ALOS 09/11/2010 4 10m
Sun Azimuth = 156.25 SunElevation =
34 c. Các kênh chỉ số dùng để phân loại
Các kênh chỉ số đƣợc dùng để hỗ trợ cho việc tách chiết các đối tƣợng trên ảnh viễn thám tốt hơn. Ngoài việc sử dụng các kênh phổ thì chúng tôi còn sử dụng thêm các kênh chỉ số để phân loại cả hai ảnh Landsat TM, ETM và ảnh Spot 5. Các kênh chỉ số này đƣợc tính từ các kênh phổ của ảnh viễn thám.
Chỉ số thực vật: NDVI Công thức tính chỉ số thực vật đều dựa vào đặc trƣng phản xạ phổ của thực vật ở dải sóng màu đỏ và dải cận hồng ngoại. Bởi tại các dải sóng này thực vật phản xạ rất mạnh.
NDVI (Normalized Difference Vegetation Index): NIR R R NIR NDVI [41]
Trong đó: NIR là phản xạ vùng cận hồng ngoại, R là phản xạ vùng sóng đỏ. Giá trị NDVI dao động trong khoảng [-1, 1]
Chỉ số nước: LSWI (Land Surface Water Index). Sử dụng chỉ số này để tách chiết đối tƣợng nƣớc cho ảnh Landsat TM và ETM.
5 5 B G B G LSWI [29]
Hai chỉ số này dùng đƣợc cho cả ảnh Landsat, ảnh Spot và Alos.
2.2.1.1.2. Phân loại đi ̣nh hướng đối tượng
a. Phƣơng pháp phân loại định hƣớng đối tƣợng (ĐHĐT)
Phƣơng pháp phân loa ̣i truyền thống dƣ̣a trên các điểm ảnh (pixel) đƣợc coi là có hiệu quả đối với nhƣ̃ng ảnh viễn thám có đô ̣ phân giải thấp và trung bình nhƣ Landsat và Spot. Tuy nhiên, khi xử lý các ảnh có độ phân giải không gian cao và rất cao nhƣ Quickbird , WorldView, GeoEyes thì phƣơng pháp này có sự hạn chế do mối quan hê ̣ tỷ lệ nghịch giữa đô ̣ phân giải không gian và đô ̣ phân giải phổ [26, 21, 28, 44]. Kết quả phân loa ̣i bằng pixel bị giảm rõ rệt khi thử nghiệm trên các ảnh vệ tinh có đô ̣ phân giả i không gian cao, bởi các kênh ảnh này chứa thông tin phổ phản xạ trong dải sóng rộng làm cho giá trị phổ của các đối tƣợng khác biệt trên thực tế lại tƣơng đối gần nhau nhƣ: đất trống và bãi cát khô ở giữa sông hay các vùng đất xây dựng [28, 44].
35
Phân loa ̣i ĐHĐT đƣợc phát triển tƣ̀ nhƣ̃ng năm 1970, với những ƣu thế rõ rệt so với phân tích dƣ̣a trên pixel . Phƣơng pháp này không chỉ dƣ̣a vào đă ̣c điểm phổ phản xạ của đối tƣợng phân loại mà còn sƣ̉ du ̣ng nhƣ̃ng thông tin khác nhƣ cấu trúc , kích thƣớc và hình dạng [26, 31, 33]. Ngoài ra, sự phát triển của công nghệ tính toán đã góp phần làm hoàn thiện hơn phƣơng pháp này qua khả năng tích hợp với các dữ liệu chuyên đề cũng nhƣ kiến thức chuyên gia [24, 27, 42,44] (mô hình số đô ̣ cao, bản đồ địa chất, bản đồ thổ nhƣỡng, bản đồ sử dụng đất…[28].
Quá trình phân loa ̣i ĐHĐT bắt đầu từ viê ̣c phân mảnh ảnh thành các đoạn ảnh (segment) thông qua thuật toán gộp các pixel lân cận có mƣ́c đô ̣ đồng nhất về đă ̣c điểm phổ và về phân bố không gian [27, 38] mà mắt ngƣời có thể nhận biết đƣơ ̣c. Đối tƣợng ảnh (object) là đơn vị nhỏ nhất trong ảnh , mỗi đối tƣợng là mô ̣t nhóm các pixel tƣơng tự về kích thƣớc , hình dạng, mối quan hê ̣ sinh thái và đi ̣a lý của các đối tƣợng trên ảnh và các đối tƣợng này ở thƣ̣c tế [22].
Do khả năng tích hợp các thông tin chuyên đề và kiến thức chuyên gia , phƣơng pháp phân loa ̣i ĐHĐT còn đƣợc go ̣i là phân loa ̣i dƣ̣a trên tri thƣ́c , và các lớp phân loại đƣợc nhâ ̣n biết theo quy tắc p hân cấp. Ở những mức phân loại đơn giản, ngƣời ta có thể sử dụng thuâ ̣t toán Maximum likelihood và Nearest neighbor [34]. Tuy nhiên, ở các mức phân loại phức tạp (cấp cao hơn ), các thông tin về mối quan hê ̣ không gian đƣợc bổ sung bên cạnh giá trị phổ của các pixel [27].
Các thông số để phân loại ĐHĐT bao gồm : đặc trƣng phổ của dữ liệu viễn thám; tỷ lệ phân đoạn ảnh phù hợp [31]; mối quan hệ của các đoạn ảnh với xung quanh (context); mối liên hệ có tính phân cấp giữa các đối tƣợng ; tính bất định (uncertainty) của các dữ liệu viễn thám , dữ liệu chuyên đề và khái niệm mờ (fuzzy concept). Tùy theo đặc điểm hiện trạng sử dụng đất của khu vực nghiên cứu và mục đích của từng đề tài mà các yếu tố này có đƣợc xem xét một cách đầy đủ về mặt phƣơng pháp luận và thử nghiệm phân loại hay không?
b. Phân bâ ̣c đối tƣợng
Quá trình phân loại bao gồm các bƣớc xác định đối tƣợng ở các cấp bậc khác nhau. Ví dụ: lớp cây trồng đƣợc xác đi ̣nh bao gồm h ai phụ lớp: lúa và màu; phụ lớp
36
màu lại chia thành các phụ lớp cấp 2 là ngô và đậu tƣơng, v.v... Việc liên kết các đối tƣợng theo cấp bậc rất cần thiết khi phân loại ảnh ở nhiều đô ̣ phân giải khác nhau [22]. Cách phân chia nhƣ vậy đảm bảo mỗi đối tƣợng đƣợc phân loại theo một thuật toán khác nhau nhƣng các đối tƣợng ở nhiều cấp bậc khác nhau của nhóm nhóm vẫn kế thừa các đặc trƣng chung của nhóm đó . Hệ thống cấp bậc này đƣơ ̣c sắp xếp theo mô ̣t ma ̣ng lƣới có cấu trúc chă ̣t chẽ.
Hình 2.2. Sơ đồ phân cấp bậc các đối tượng trên ảnh
Cấu trúc của viê ̣c phân bâ ̣c phải đảm bảo theo hai quy tắc sau :
- Đƣờng bao của đối tƣợng bậc cao phải theo đƣờng bao của các đối tƣợng bậ c thấp hơn.
- Đối tƣợng bậc thấp hơn bị phân mảnh trong phạm vi đƣờng bao của các đối tƣơ ̣ng bâ ̣c cao hơn.
Trên nhƣ̃ng dƣ̃ liê ̣u khác nhau thì mƣ́c đô ̣ phân cấp đối tƣợng cũng khác nhau. Hình dạng của đối tƣợng dựa trên sự tập hợp của các đối tƣợng phụ [22].
c. So sánh phƣơng pháp phân loa ̣i đi ̣nh hƣớng đối tƣợng và phân loại dựa trên pixel
Những công trình nghiên cứu gần đây đã cho thấy phƣơng pháp phân loa ̣i đi ̣nh hƣớng đối tƣợng có đô ̣ chính xác cao hơn phƣơng pháp ph ân loa ̣i ảnh bằng pixel khi áp dụng cho ảnh vê ̣ tinh đa đô ̣ phân giải [21, 28, 31, 34, 44, 46, 47, 48]. Đối với phân loa ̣i lớp phủ và sử dụng đất ở các khu vực có nhi ều đối tƣợng mặt đất phức tạp và manh mún nhƣ vùng đô thi ̣ - ven đô Việt Nam, phƣơng pháp phân loa ̣i
37
ĐHĐT đƣa ra các kết quả đáng khích lệ trên ảnh vệ tinh có đô ̣ phân giải không gian cao nhƣ Spot 5 [26].
Một số nghiên cứu cụ thể có thể dẫn chứng nhƣ khi so sánh độ chính xác giữa hai phƣơng pháp phân loại trên ảnh có độ phân giải trung bình là Aster cho khu vực núi Đông Bắc của dãy Helan, Trung Quốc, độ chính xác tổng quát của phân loại dựa trên pixel là 46,48%, trong khi phân loại ĐHĐT là 83,25% [48], so sánh cho vùng Đông Bắc của miền Nam Australia cũng chỉ ra rằng phân loại bằng phƣơng pháp ĐHĐT độ chính xác 78% so với phƣơng pháp dựa trên pixel là 69,14% [46], hay cho ảnh Landsat ở các vùng đồng bằng, thung lũng có độ chính xác trên 85% bằng phƣơng pháp ĐHĐT [30, 32, 33, 37], ảnh Spot có độ chính xác lên tới trên 90% cho khu vực đô thị [26, 27]. Tƣơng tự nhƣ vậy, so sánh hai phƣơng pháp phân loại trên với ảnh có độ phân giải cao nhƣ IKONOS [17, 33], ảnh hàng không [44] ở các khu vực có vị trí khác nhau trên Thế giới cho thấy phân loại ĐHĐT có độ chính xác trên 80%, cao hơn nhiều so với dựa trên pixel, thông qua sai số tổng quát và chỉ số Kappa.
Có thể nói, việc phân loại bằng phƣơng pháp ĐHĐT cho ảnh có độ phân giải trung bình và cao nhƣ Landsat ETM, Spot 5 và ALOS kết hợp sử dụng nhiều lớp chuyên đề nên đã tăng độ chính xác cao hơn nhiều so với phƣơng pháp thống kê pixel truyền thống [28].
Dựa trên các phân tích và tổng quan nghiên cứu nói trên, học viên đã lựa chọn phƣơng pháp định hƣớng đối tƣợng cho phân loại ảnh Landsat TM, Spot 5 và ALOS trên khu vực nghiên cứu là huyện Giao Thủy.
Phần này của luận văn đề cập tới các bƣớc trong quá trình phân loại ảnh vệ tinh bằng phƣơng pháp ĐHĐT, kiểm chứng kết quả phân loại ảnh bằng bản đồ sử dụng đất và bằng kết quả thực địa.
2.2.1.1.3. Các bước trong quá trình Phân loại ảnh vệ tinh bằng phương pháp định hướng đối tượng
38
Việc xác định hệ thống phân loại là công việc đầu tiên rất quan trọng khi áp dụng viễn thám để xây dựng bản đồ sử dụng đất cũng nhƣ bản đồ lớp phủ. Hệ thống bảng chú giải phân loại cần phải phù hợp với khả năng cung cấp thông tin của dữ liệu viễn thám [9]. Thiết lập chú giải không chỉ dựa vào các đối tƣợng nhìn thấy trên ảnh, mà còn phụ thuộc vào rất nhiều các yếu tố khác: độ phân giải của ảnh viễn thám, tính chất mùa vụ, thời gian chụp của vệ tinh, những kiến thức hiểu biết về địa phƣơng, …
Với nguồn dữ liệu hiện có và những hiểu biết về địa phƣơng học viên xây dựng bảng chú giải cho xây dựng bản đồ lớp phủ gồm 10 loại đối tƣợng: đất trồng lúa, mặt nƣớc, khu dân cƣ, đất trống, đất trồng cói, NTTS, rừng phi lao, rừng ngập mặn, ruộng muối, đất trồng màu.
Bảng 2.2. Một số đối tượng chú giải
TT Đối tƣợng Mẫu Ảnh thực địa
1 Mặt nƣớc (sông suối + ao hồ) 2 Đất dân cƣ (khu công nghiệp + dân cƣ + đang xây dựng) 3 Đất nông nghiệp (đất lúa + hoa màu) 4 Đất trống (bãi cát ven và giữa sông)
39
b. Quy trình phân loại ảnh
Các bƣớc tiến hành xử lý dữ liệu phục vụ cho việc nghiên cứu đƣợc thực hiện trình tự theo sơ đồ bên dƣới:
Hình 2.3. Sơ đồ quy trình phân loại ảnh
Bƣớc 1: Nắn chỉnh hình học
Nắn chỉnh hình học đƣợc tiến hành nhằm loại bớt các méo hình học gây ra trong quá trình chụp ảnh và đƣa ảnh về hệ toạ độ VN 2000. Các ảnh vệ tinh và bản đồ sử dụng đất huyện Giao Thủy tỷ lệ 1/25.000 đƣợc nắn chỉnh về hệ tọa độ VN- 2000 theo bản đồ địa hình tỷ lệ 1/10.000. Các ảnh Landsat TM và ETM chỉ cần chuyển từ hệ tọa độ WGS-84 sang hệ tọa độ VN-2000. Còn ảnh Spot 5 thì phải chọn điểm khống chế để nắn. Việc lấy các điểm khống chế ảnh có ảnh hƣởng quan trọng đến độ chính xác của phép nắn. Các điểm khống chế đƣợc chọn phải thoả mãn yêu cầu sau:
Ảnh Landsat 1989, 1995 Ảnh Spot5 2003, 2007 Bản đồ SDĐ Bản đồ lớp phủ Sử dụng các kênh chỉ số Bản đồ địa hình Nắn chỉnh hình học Hệ tọa độ VN-2000
Cắt ảnh khu vực nghiên cứu
Phân loại hƣớng đối tƣợng
Kết quả phân loại độ chính xác Kiểm tra Alos 2010
40
- Đƣợc rải đều trên toàn bộ phạm vi ảnh nắn. Điều này làm giảm sai số cho phép nắn. Tại khu vực không có điểm khống chế hay điểm khống chế ít, sai số sẽ lớn hơn.
- Các điểm khống chế phải dễ nhận biết trên ảnh và bản đồ, phải là các yếu tố ít thay đổi của địa hình hay địa vật.
Ảnh vệ tinh khu vực huyện Giao Thủy đƣợc nắn bằng các điểm khống chế đƣợc chọn trên bản đồ địa hình tỷ lệ 1:25000. Ở tỷ lệ này các điểm khống chế có thể lấy chính xác và tƣơng đối rõ ràng. Các điểm khống chế đƣợc chọn là các điểm giao giữa các đƣờng, ruộng,... Bậc nắn đƣợc chọn là bậc 1, phƣơng pháp nội suy “nearest neighbour”, yêu cầu sai số trung phƣơng không vƣợt quá 1pixel.
Bƣớc 2: Cắt ảnh khu vực nghiên cứu
Ảnh vệ tinh đƣợc cắt theo ranh giới của khu vực nghiên cứu là huyện Giao Thủy, tỉnh Nam Định. Ảnh đƣợc trộn màu theo các cách khác nhau sao cho các đối tƣợng trên ảnh đƣợc hiển thị một các rõ nhất.
a b
41 e
Hình 2.4. Các ảnh vệ tinh sử dụng trong luận văn
a- Landsat TM năm 1989, b- Landsat TM năm 1995, c- Spot năm 2003, d- Spot 5 năm 2007, e – Alos năm 2010
Bƣớc 3: Phân loại theo phƣơng pháp Định hƣớng đối tƣợng
- Phân đoạn ảnh:
Phân đoạn ảnh thực chất là gộp nhóm những pixel cạnh nhau có những đặc điểm tƣơng tự nhau về thông tin phổ và không gian [17, 19]. Phân đoạn ảnh đƣợc thực hiện dựa trên việc lựa chọn các trọng số về hình dạng (shape), màu sắc (color), độ chặt (compactness), độ trơn (smoothness). Ngoài ra, tham số tỷ lệ (scale parameter) là một thông số quan trọng có tác động trực tiếp tới kích thƣớc của mỗi đối tƣợng ảnh. Tùy thuộc vào các loại ảnh vệ tinh khác nhau mà các tham số này thay đổi. Chất lƣợng của việc phân loại ảnh phụ thuộc trực tiếp vào chất lƣợng của việc phân đoạn ảnh [2,12].
Quá trình phân đoạn ảnh đƣợc thực hiện trên phần mềm eCognition 8.64 theo các thông số sau: ảnh Spot5, thông số tỷ lệ: 15, hình dạng: 0,7 và độ chặt: 0,3; với ảnh Landsat TM và ETM, thông số tỷ lệ: 5, tỷ lệ: 0,5 và độ chặt: 0,2; với ảnh ALOS thông số tỉ lệ 15, hình dạng 0.7 độ chặt 0.3.
42
* Năm 1989, ảnh Landsat:
Hình 2.5. Quá trình phân loại ảnh Landsat năm 1989
Đất nông nghiệp Chƣa PL Ruộng muối lẫn đất trống Phân mảnh Phân loại đất nông nghiệp Đất nông nghiệp Khu dân cƣ Hiệu chỉnh Chƣa phân loại Phân mảnh Phân loại lớp hoa màu Phân mảnh ảnh Phân loại lớp mặt nƣớc Lớp mặt