CHƯƠNG 1:TỔNG QUAN VỀ PHƯƠNG PHÁP VIỄN THÁM VÀ MÔ HÌNH DỰ BÁO BIẾN ĐỘNG SỬ DỤNG ĐẤT
1.3. Tổng quan các phương pháp phân loại sử dụng đất bằng ảnh viễn thám . 15
Phương pháp phân loại không giám sát là phương pháp phận loại các đối tượng trên ảnh dựa trên nguyên lý phân chia các pixel trong dữ liệu chỉ dựa trên duy nhất các số liệu thống kê về giá trị độ sáng (giá trị phổ) của các pixel trong các kênh phổ. Khác với phương pháp phân loại có giám sát, phân loại không giám sát không cần phải có một tập mẫu các lớp được xác định từ trước.Phương pháp phân loại không giám sát có 02 kỹ thuật, bao gồm:
a. Phân loại IsoData.
Phương phápphân loại Isodata sẽ tính toán cách thức phân lớp trong không gian dữ liệu, sau đó nhóm đi nhóm lại các pixel bằng kỹ thuật khoảng cách tối thiểu ( Minimun distance ). Mỗi lần nhóm lại các lớp này sẽ tính toán lại cách thức phân lớp và phân loại lại các pixel theo cách thức phân lớp mới quá trình này sẽ tiếp tục lặp đi lặp lại đến khi số các pixel trong mỗi lớp nhỏ hơn ngưỡng thay đổi pixel đã trọn hoặc đạt tối đa số lần lắp đi lặp lại đó.
Phương pháp này được áp dụng trong trường hợp ta không biết hoặc không quen với những đối tượng xuất hiện trên ảnh. Nó cũng phần nào loại trừ được những sai số chủ quan của con người.
b. Phân loại K-Means.
Phân loại K-Means tính toán các các giá trị trung bình lớp ban đầu được phân bố đều trong không gian dữ liệu, sau đó tiến hành nhóm dần các pixel thành lớp gần nhất sử dụng kỹ thuật khoảng cách ngắn nhất. Mỗi lần tính lặp lại các giá trị trung bình lớp và phân lớp lại các pixel với các giá trị trung bình mới.
Tất cả các pixel được phân loại thành các lớp gần nhất trừ khi người sử dụng ấn định một độ lệch trung bình mới hoặc một ngưỡng khoảng cách mới. Trong trường hợp này, một số pixel có thể không được phân loại. Quá trình cứ tiếp tục cho đến khi số lượng các pixel trong mỗi lớp thay đổi mà vẫn nhỏ hơn ngưỡng
thay đổi đã chọn hoặc vẫn nhỏ hơn số lần tính lặp tối đa.
1.3.2. Phương pháp phân loại có giám sát
Phân loại có giám sát (supervised )là phương pháp phân loại dựa trên một tập các pixel mẫu (ROI) đã được người sử dụng xác địnhtừ trước. Dựa vào tập mẫu này, máy tính được “lập trình” để xác định những pixel có cùng một số đặc trưng về phổ, trên cơ sở đó để phân loại chúng.
Trong phương pháp phân loại có giám sát, một số thuật toán phân loại sau đây thường được sử dụng:
a. Phân loại hình hộp (Parallelpiped Classification).
Đầu tiên, chương trình tính vector giá trị trung bình cho tất cả các kênh phổ sẽ phân loại, ứng với mỗi lớp mẫu đã chọn. Sau đó, các pixel được so sánh và gán vào lớp mà giá trị của nó nằm trong khoảng [ngưỡng thấp, ngưỡng cao] của độ lệch chuẩn so với vector trung bình. Nếu giá trị pixel nằm trong nhiều lớp, phần mềm phân loại sẽ gán pixel vào lớp cuối cùng mà nó phù hợp. Nếu pixel không nằm trong một trong các khoảng giá trị đó, nó sẽ được gán vào lớp chưa phân loại.
Phương pháp này thực hiện rất nhanh, đơn giản nhưng kết quả có độ chính xác không cao. Nó có thể được dùng khi tiến hành phân loại sơ bộ ban đầu.
b. Phân loại theo khoảng cách nhỏ nhất (Minimum distance Classification) Đầu tiên, tính vector trung bình của mỗi mẫu phân loại và khoảng cách Ơclit (Euclid) đo được giữa pixel chưa được phân loại tới các vector giá trị trung bình đó. Sau đó, pixel sẽ được gán tới lớp có khoảng cách nhỏ nhất. Về mặt lý thuyết mà nói, theo phương pháp này, mọi pixel đều được phân loại. Tuy nhiên, người phân tích cũng có thể sử dụng độ lệch chuẩn hoặc đưa ra một ngưỡng giới hạn nhất định về khoảng cách để phân loại các pixel.
Đây cũng là một phương pháp phân loại khá nhanh, giá trị phổ của pixel gần với giá trị phổ trung bình của mẫu. Tuy nhiên, phương pháp này cũng chưa thật chính xác và không cân nhắc đến sự biến thiên của các lớp phân loại.
c.Phân loại hàm xác suất cực đại (Maximum Likelihood Classification) Phương pháp này sẽ coi mỗi lớp trong mỗi kênh phổ có sự phân bố chuẩn.
Các pixel sẽ được phân loại vào lớp mà nó có xác xuất cao nhất. Việc tính toán không chỉ dựa vào giá trị khoảng cách mà còn dựa vào cả xu thế biến thiên độ sáng trong mỗi lớp. Nếu người phân tích không đặt ra một ngưỡng về xác suất thì toàn bộ các pixel đều được phân loại. Nếu xác suất nhỏ hơn ngưỡng được đặt ra, pixel sẽ không được phân loại.
Đây là một phương pháp phân loại chính xác nhưng mất nhiều thời gian tính toán và phụ thuộc vao sự phân bố chuẩn của dữ liệu.
d. Phân loại theo khoảng cách Mahalanobis(MahalanobisDistance)
Phương pháp này cũng tương tự như phương pháp hàm xác suất cực đại nhưng giả thiết rằng tất cả các hiệp phương sai (covariances) lớp là bằng nhau và do đó là phương pháp nhanh hơn. Tất cả các pixel được phân loại vào các lớp gần nhất trừ khi người phân tích chỉ định một ngưỡng khoảng cách.
e. Phân loại theo thuật toán góc quang phổ (SpectralAngle Mapper-SAM) Đây là phương pháp phân loại dựa trên cơ sở vật lý, sử dụng góc n-chiều để khớp các pixel với phổ tham chiếu. Thuật toán xác định sự tương đồng về phổ giữa hai dải phổ bằng cách tính toán các góc phổ và coi chúng như là những vector trong không gian với thứ nguyên bằng với số thứ tự của các kênh phổ. Kỹ thuật này, khi được sử dụng với các dữ liệu phổ phản xạ đã hiệu chỉnh, sẽ ít bị ảnh hưởng của sự chiếu sáng và hiệu ứng albedo. Các phổ thành phần ứng với các lớp mẫu dùng trong phân loại SAM có thể là file ASCII, thư viện phổ, hoặc do người sử dụng có thể lấy chúng trực tiếp từ một ảnh. SAM so sánh góc giữa vector phổ thành phần mẫu với mỗi vector pixel trong không gian n-chiều. Các góc nhỏ hơn sẽ biểu diễn cho những phổ gần hơn với phổ tham chiếu. Các pixel có góc nhỏ hơn ngưỡng lớn nhất được chỉ định (đơn vị: radian) sẽ không được phân loại.
Phân loại SAM áp dụng cho dữ liệu phản xạ. Tuy nhiên, nếu người sử dụng dùng dữ liệu phát xạ, sai số thường không đáng kể.
f. Phân loại mã nhị phân (Binary Encoding Classification).
Kỹ thuật phân loại mã nhị phân sẽ mã hóa dữ liệu và phổ thành phần mẫu ứng với các lớp dùng trong phân loại thành các giá trị 0 và 1 tùy thuộc vào dải phổ đó nằm vào phía sau hay phía trước giá trị trung bình phổ. Một hàm loại trừ sẽ so sánh mỗi phổ tham chiếu đã mã hóa với phổ của pixel đã mã hóa và tạo ra ảnh phân loại. Tất cả các pixel sẽ được phân loại, trừ khi người sử dụng chỉ định một ngưỡng tối thiểu để so khớp dữ liệu.
1.3.3. Đánh giá và lựa chọn phương pháp phân loại sử dụng đất áp dụng cho khu vực nghiên cứu
Để đánh giá hiệu quả của cả hai phương pháp phân loại có giám sát và phân loại không giám sát, một số nghiên cứu đã chỉ ra rằng phân loại có giám sát sẽ có hiệu quả hơn phân loại không có giám sát [Guerra và nnk al,. 2010]. Độ chính xác của việc phân loại không giám sát thường thấp và có thể gây nhầm lẫn trong kết quả phân loại [Richards và Jia,. 2006]; trong khi các kết quả sử dụng phân loại có giám sát lại có độ chính xác cao, tin cậy và phù hợp với mẫu ảnh phân loại được định nghĩa ban đầu [Xiong Liu,. 2002; Guerra và nnk al,. 2010].
Tuy nhiên, bản thân trong phương pháp phân loại có giám sát cũng có rất nhiều các thuật toán khác nhau được áp dụng; các thuật toán sẽ cho kết quả có độ tin cậy khác nhau. Để đánh giá sự khác biệt này, hai nhà khoa học Parumal và Akgün đã thử nghiệm các kỹ thuật phân loại ảnh khác nhau khi sử dụng ảnh của Landsat 7 ETM [Akgün,. 2004; Perumal, 2010]. Ngoài ra, trong nghiên cứu này, chúng tôi cũng đã thử nghiệm trên một khu vực nhỏ của tỉnh Bình Dương nhằm xác nhận độ chính xác phân loại của các kỹ thuật nói trên khi sử dụng ảnh Landsat7 ETM+ đối với khu vực chúng tôi dự định sẽ nghiên cứu.
Trong số các thuật toán được thử nghiệm, kết quả cho thấy rằng thuật toán Phân loại hàm xác suất cực đại (Maximum likelihood) cho kết quả phân loại có độ tin cậy tốt và ổn định.
Việc phân tích các ưu, nhược điểm và độ tin cậy cho cả hai phương pháp phân loại (có giám sát và không có giám sát) và các ước tính về độ chính xác của thuật toán phân loại có giám sát cho thấy thuật toán Maximum Likelihood phù hợp hơn với đề tài nghiên cứu của chúng tôi. Vì vậy, trong nghiên cứu này, chúng tôi chọn phương pháp phân loại có giám sát với thuật toán Maximum Likelihood (ML) để phân loại sử dụng đất của tỉnh Bình Dương.