Đánh giá độchính xác phân loại trong phƣơng pháp viễn thám

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phát hiện các đứt gãy địa chất lưu vực sông cả rào nậy trên cơ sở phân tích tài liệu ảnh viễn thám (Trang 27 - 30)

CHƢƠNG 1 : VIỄN THÁM TRONG NGHIÊN CỨU ĐỊA LÝ –ĐỊA CHẤT

1.3. Đánh giá độchính xác phân loại trong phƣơng pháp viễn thám

Phân loại đa phổ là quá trình tách gộp thơng tin dựa trên các tính chất phổ khơng gian và thời gian của đối tƣợng. Phân loại đa phổ để chiết tách thông tin cần thiết phục vụ cho việc đánh giá các đối tƣợng hay xây dựng các bản đồ chuyên đề là khâu then chốt của việc khai thác các tƣ liệu viễn thám. Đánh giá độ chính xác trong q trình phân loại là vấn đề đang đƣợc các nhà nghiên cứu viễn thám đặc biệt chú ý. Ngày nay chƣa có phƣơng pháp nào đơn giản và chuẩn mực đƣợc chấp nhận đại trà để xác định độ chính xác khi phân loại. Có hai phƣơng pháp đƣợc sử dụng phổ biến nhất để đánh giá độ chính xác việc phân loại ảnh đa phổ. Cả hai đều so sánh các kết quả thu đƣợc từ các phân loại bằng so sánh với đặc tính ”đã biết” của các đối tƣợng trên mặt đất trong các vùng thử nghiệm từ các tài liệu tham khảo. Các khu vực thử nghiệm đƣợc đại diện điển hình bằng một hoặc nhiều các khu vực thử nghiệm đồng nhất cho ngƣời giải đoán lựa chọn hay các khu vực thử nghiệm hoặc các pixel đƣợc chọn một cách ngẫu nhiên.

1.3.1. Phương pháp thứ nhất

Ta đã biết cách sử dụng một bảng ngẫu nhiên làm công cụ đánh giá độ chính xác phân loại của khu vực lấy mẫu. Cần hiểu là phƣơng thức này chỉ nêu ra các số liệu thống kê lấy ra từ các khu vực mẫu có thể sử dụng tốt để phân loại các khu vực đó. Nếu kết quả tốt thì điều đó chứng tỏ khu vực mẫu là đồng nhất và cách phân loại đang sử dụng có thể phục vụ tốt trong các khu vực mẫu. Điều này giúp ích trong q trình chọn lọc bộ mẫu nhƣng nó ít chỉ ra yếu tố đƣợc phân loại ra sao trên khu vực khác.

Các khu vực thử nghiệm là những khu vực có lớp phủ thực vật trên mặt đất đại diện đồng nhất khác và rộng hơn các vùng mẫu, chúng thƣờng đƣợc bố trí trong giai đoạn lấy mẫu để phân loại có kiểm định bằng cách chọn thêm các vùng mẫu dự

trữ nhiều hơn so với yêu cầu để nghiên cứu xây dựng thống kê phân loại. Khi đó một phần của chúng có thể đƣợc giữ lại để đánh giá độ chính xác sau khi phân loại và lại dùng một bảng ngẫu nhiên để biểu thị kết quả. Độ chính xác thu đƣợc trong các khu vực này biểu thị gần đúng chất lƣợng phân loại trên toàn bộ khu vực đó. Tuy nhiên, vì đồng nhất nên các diện tích thử nghiệm có thể khơng đƣa ra độ chính xác phân loại cho từng pixel ảnh riêng biệt của sự biến động.

Một phƣơng pháp có thể dùng để đánh giá độ chính xác là so sánh kết quả phân loại lớp phủ mặt đất tại mỗi pixel trên ảnh với tài liệu tham khảo.

1.3.2. Phương pháp thứ hai

Việc lấy mẫu một cách ngẫu nhiên sẽ khắc phục đƣợc các nhƣợc điểm trên nhƣng nó bị ảnh hƣởng do số lƣợng vùng mẫu có hạn. Trƣớc hết do việc thu thập tài liệu tham khảo cho các vùng mẫu đại diện cho các điểm phân bố ngẫu nhiên thƣờng rất khó khăn và tốn kém bởi vì việc đi lại và tiếp cận đối tƣợng lấy mẫu. Mặt khác, giá trị của việc lấy mẫu ngẫu nhiên phụ thuộc vào khả năng thu thập thông tin các tài liệu tham khảo. Để khắc phục nhƣợc điểm này là chỉ nên lấy mẫu tại những pixel mà đặc điểm nhận dạng chúng không bị ảnh hƣởng của việc thu thập thông tin.

Khi chọn các pixel thử nghiệm vừa phải ngẫu nhiên nhƣng lại phải đại diện về mặt địa lý cho tập hợp dữ liệu phân tích. Việc chọn mẫu ngẫu nhiên phải theo các lớp mà tại đó mỗi loại đối tƣợng có thể xem là một lớp đƣợc sử dụng. Ngồi ra, khi thiết kế vùng mẫu cần phải chú ý đến diện tích khu vực tiến hành nghiên cứu và các đối tƣợng chính trên đó cần phân loại.

Một cách phổ biến để thực hiện việc lấy mẫu ngẫu nhiên là chồng các dữ liệu kết quả phân loại trên một lƣới ô vuông sau đó sẽ chọn ngẫu nhiên các ơ thử nghiệm. Các đối tƣợng trên mặt đất hiện có đƣợc xác định thơng qua việc kiểm tra ngoài thực địa hoặc các nguồn tài liệu khác và so sánh với các dữ liệu đã phân loại. Sau đó sẽ ghi lại kết quả vào trong một bảng ngẫu nhiên.

Trong việc xác định độ chính xác phân loại, điều quan trọng khơng chỉ nêu lên tỷ lệ các pixel đƣợc phân loại đúng mà còn cần xác định mức độ sai sót của từng loại một.

Để xác định mức độ sai sót ta dùng chỉ tiêu Kappa. Chỉ tiêu Kappa này có giá trị từ 0 đến 1 và biểu thị sự giảm theo tỷ lệ sai số đƣợc thực hiện bằng một yếu tố phân loại hồn tồn ngẫu nhiên. Do đó, giá trị 0,75 sẽ chỉ ra rằng các yếu tố phân loại đã tránh đƣợc 75% các sai số mà một q trình hồn tồn ngẫu nhiên có thể sinh ra.

Ngồi ra, kích thƣớc của vùng mẫu cũng cần đƣợc cân nhắc cẩn thận trong việc xây dựng và giải thích độ chính xác phân loại. Để đánh giá độ chính xác trung bình của một loại với sai số 5% cần phải có nhiều hơn 250 pixel thử nghiệm. Khi số lƣợng pixel thử nghiệm đƣợc lấy mẫu ít hơn thì độchính xác sẽ bị giảm đáng kể. Tóm lại, số lƣợng các điểm cần lấy mẫu phụ thuộc vào quy trình lấy mẫu đƣợc tiến hành, độ chính xác của việc ƣớc tính, số lƣợng pixel co mặt trong một chủng loại và độ chính xác mà phân loại yêu cầu.

Đồng thời, khi đánh giá độ chính xác phân loại cần chú ý đến hai vấn đề:

Thứ nhất là chất lƣợng của bất kỳ việc đánh giá độ chính xác nào cũng chỉ

đạt yêu cầu khi thông tin đƣợc sử dụng để thiết lập loại đối tƣợng trên mặt đất là có thực có mặt trong vùng thử nghiệm. Với chừng mực nào đó, sai số ƣớc lƣợng có mặt trong tài liệu tham khảo phải đƣợc đƣa vào q trình đánh giá độ chính xác.

Thứ hai là quy trình đánh giá độ chính xác phải đƣợc thiết kế sao cho phản

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phát hiện các đứt gãy địa chất lưu vực sông cả rào nậy trên cơ sở phân tích tài liệu ảnh viễn thám (Trang 27 - 30)

Tải bản đầy đủ (PDF)

(69 trang)