d. đời sống dân cư
4.3.5. Phân loại ảnh
Có nhiều phương pháp phân loại có kiểm ựịnh với ảnh vệ tinh. Phương pháp ựược lựa chọn trong ựề tài là Maximum Likelihood (phân loại hàm xác suất cực ựại). Phương pháp này coi số liệu thống kê của mỗi lớp trong mỗi kênh ảnh ựược phân tán một cách thông thường và có tắnh ựến khả năng một pixel thuộc một lớp nhất ựịnh. Nếu không chọn một ngưỡng xác suất thì phải phân loại tất cả các pixel. Mỗi pixel ựược gán cho một lớp có ựộ xác suất cao nhất. Theo phương pháp này các band phổ có sự phân bố chuẩn và các pixel sẽ ựược phân loại vào lớp mà nó có xác suất cao nhất. đây là phương pháp phân loại có tắnh chắnh xác cao nhưng lại mất nhiều thời gian tắnh toán và phụ thuộc sự phân bố chuẩn của dữ liệu.
Các bước tiến hành phân loại như sau:
- định nghĩa các lớp: Trên cơ sở tư liệu ảnh có ựược kết hợp với nghiên cứu ựặc ựiểm lớp phủ theo mùa cũng như căn cứ vào quá trình khảo sát thực ựịa ở khu vực nghiên cứu tôi chọn ựược 7 lớp phân loại là: ựất trồng lúa, ựất trồng cây lâu năm, ựất trồng cây hàng năm, ựất chưa sử dụng, ựất sông suối, ựất mặt nước và ựất lâm nghiệp.
- Lựa chọn các ựặc tắnh: Các ựặc tắnh ở ựây bao gồm ựặc tắnh về phổ và ựặc tắnh cấu trúc. Việc lựa chọn này có ý nghĩa quan trọng, nó cho phép tách biệt các lớp ựối tượng với nhau.
- Chọn vùng mẫu: Việc chọn vùng mẫu có tắnh chất quyết ựịnh tới kết quả phân loại. để ựảm bảo ựộ chắnh xác khi lựa chọn vùng mẫu phải chú ý các yêu cầu sau:
+ Số lượng các vùng lấy mẫu của mỗi loại ựối tượng cần phải phù hợp. Số lượng vùng mẫu quá ắt sẽ không ựảm bảo ựộ chắnh xác, không ựại diện ựược hết các loại ựất trong khu vực nghiên cứu, ngược lại nếu nhiều quá sẽ làm tăng khối lượng tắnh toán lên rất nhiều ựôi khi làm nhiễu kết quả tắnh toán.
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 60 + Diện tắch các vùng lấy mẫu ựủ lớn, ựồng thời các vùng mẫu không ựược nằm gần ranh giới giữa các lớp ựối tượng với nhau.
+ Vùng mẫu ựược chọn phải ựặc trưng cho ựối tượng phân loại và phân bố ựều trên khu vực nghiên cứu.
+ Tắnh toán chỉ số thống kê vùng mẫu: Sau khi chọn mẫu xong tiến hành tắnh toán chỉ số thống kê vùng mẫu và sự khác biệt giữa các mẫu.
Mỗi mẫu phân loại sẽ ựược tắnh toán ựể so sánh sự khác biệt với các mẫu còn lại theo phương pháp phân tắch Compute ROI Separability. Nếu
cặp giá trị nằm trong khoảng 1,9 ựến 2,0 chứng tỏ có sự khác biệt tốt, nếu từ 1,0 ựến 1, 9 thì nên chọn lại ựể có sự khác biệt tốt hơn, nếu nhỏ hơn 1 thì gộp hai lớp ựể tránh nhầm lẫn.
- Phân loại ảnh theo phương pháp xác suất cực ựại, sử dụng công cụ
Classification\Supervised\Maximum Likelihood
* Các công ựoạn thực hiện:
(1). Xây dựng tệp mẫu tại vùng nghiên cứu: Sử dụng công cụ Basic Tools\Region of Interest\ROI tool ựể chọn vùng mẫu trên ảnh. Lần lượt
chọn mẫu cho 7 loại ựất ựã xác ựịnh.
Bảng 4.6: Mô tả các loại ựất
TT Loại ựất Mô tả
1 đất trồng lúa đất trồng lúa nước
2 đất trồng cây lâu năm đất cây ăn quả, ựất cây công nghiệp lâu năm 3 đất trồng cây hàng năm
khác đất cây ựậu ựỗ, sắn, ngô Ầ
4 đất mặt nước đất có mặt nước chuyên dùng, ao, hồ 5 đất sông suối đất sông suối
6 đất lâm nghiệp đất có rừng tự nhiên, ựất có rừng trồng 7 đất chưa sử dụng đất hiện ựang không ựược sử dụng, ựất trồng
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 61
Bảng 4.7: Tập mẫu giải ựoán ảnh vệ tinh ựược sử dụng
Loại ựất Ảnh 2004 Ảnh 2009 Ảnh thực ựịa đất trồng lúa đất cây lâu năm đất cây hàng năm khác đất mặt nước đất sông suối đất lâm nghiệp đất chưa sử dụng
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 62
Hình 4.16: Các mẫu loại hình sử dụng ựất ựược lấy trên ảnh Ea Nuôl năm 2004
Hình 4.17: Các mẫu loại hình sử dụng ựất ựược lấy trên ảnh Ea Nuôl năm 2009
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 63 để so sánh, ựánh giá sự khác biệt giữa các mẫu, ựảm bảo ựộ chắnh xác của việc chọn mẫu, chọn công cụ Options\ Compute Roi Separability trong hộp thoại ROI Tool, ta ựược kết quả thể hiện trên hộp thoại ROI Separability Report.
Hình 4.18: Bảng so sánh sự khác biệt mẫu trên ảnh Ea Nuôl năm 2004
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 64 Dựa trên kết quả so sánh sự khác biệt mẫu ựược thể hiện ở 2 bản trên, nhận thấy sự khác biệt giữa các mẫu ựược chọn của ảnh Ea Nuôl ở 2 thời ựiểm ựều khá tốt, do ựó 2 tập mẫu này ựược chọn ựể giải ựoán ảnh ở hai thời ựiểm 2004 và 2009.
(2).Phân loại ảnh: Sử dụng công cụ
Classification\Supervised\Maximum Likelihood (phân loại ảnh theo hàm xác suất cực ựại) ựể phân loại. Kết quả ta có ựược ảnh Ea Nuôl 2004 và 2009 ựã ựược phân loại, tuy nhiên 2 ảnh này chưa hoàn chỉnh, còn tồn tại nhiều pixel lẻ tẻ hoặc pixel bị phân loại nhầm lẫn gây nhiễu ảnh, do ựó cần sử dụng công cụ Classification\Post Classification\Majority\Minority Analysic ựể lọc nhiễu. Cuối cùng ựược 2 ảnh sau phân loại ựã ựược lọc nhiễu:
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 65
Hình 4.21: Kết quả phân loại ảnh Ea Nuôl năm 2009 ựã ựược lọc nhiễu
(3). đánh giá ựộ chắnh xác kết quả phân loại ảnh:
để kiểm tra và ựánh giá ựộ chắnh xác kết quả phân loại thì phương pháp chắnh xác và hiệu quả nhất là kiểm tra thực ựịa. Mẫu kiểm tra thực ựịa không ựược trùng vị trắ với mẫu ựã sử dụng khi phân loại và ựảm bảo phân bố ựều trên khu vực nghiên cứu.
độ chắnh xác phân loại ảnh không những phụ thuộc vào ựộ chắnh xác các vùng mẫu mà còn phụ thuộc vào mật ựộ và sự phân bố các ô mẫu. độ chắnh xác của các mẫu giám ựịnh và của ảnh phân loại ựược thể hiện bằng ma trận sai số.
Ma trận này thể hiện sai số nhầm lẫn sang lớp khác (ựược thể hiện theo hàng) và sai số do bỏ sót của lớp mẫu (ựược thể hiện theo cột). Do vậy ựể
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 66 ựánh giá hai nguồn sai số này có hai ựộ chắnh xác phân loại tương ứng: ựộ chắnh xác phân loại có tắnh ựến sai số nhầm lẫn (do sai số nhầm lẫn gây nên) và ựộ chắnh xác phân loại có tắnh ựến sai số bỏ sót (do sai số bỏ sót gây nên). độ chắnh xác phân loại ựược tắnh bằng tổng số pixel phân loại ựúng trên tổng số pixel của toàn bộ mẫu. độ chắnh xác phân loại ảnh không những phụ thuộc vào ựộ chắnh xác các vùng mẫu mà còn phụ thuộc vào mật ựộ và sự phân bố các ô mẫu.
để ựánh giá tắnh chất của các sai sót phạm phải trong quá trình phân loại người ta dựa vào chỉ số Kappa (κ), chỉ số này nằm trong phạm vi từ 0 ựến 1 và biểu thị sự giảm theo tỷ lệ về sai số ựược thực hiện bằng một yếu tố phân loại hoàn toàn ngẫu nhiên.
Chỉ số κ ựược tắnh theo công thức sau:
∑ ∑ ∑ = + + = = + + − − = r i i i r i r i i i ii x x N x x x N 1 2 1 1 ) . ( ) . ( κ Trong ựó:
N: Tổng số pixel lấy mẫu r: Số lớp ựối tượng phân loại xii: Số pixel ựúng trong lớp thứ 1 xi+: Tổng pixel lớp thứ i của mẫu
x+i: Tổng pixel của lớp thứ i sau phân loại.
Sau khi phân loại ảnh bằng phần mềm ENVI sử dụng công cụ
Classification\Post Classification\Confusion Matrix\Using Ground Truth ROIs ựể ựánh giá ựộ chắnh xác kết quả phân loại. Kết quả cụ thể như sau:
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 67
Bảng 4.8: Ma trận sai số phân loại ảnh xã Ea Nuôl năm 2004
đơn vị tắnh: Pixel
Loại ựất (1) (2) (3) (4) (5) (6) (7) Tổng hàng
đất lâm nghiệp (1) 3829 0 510 0 0 0 0 4339
đất mặt nước (2) 0 709 0 21 20 0 0 750
đất cây lâu năm (3) 60 14 5649 0 9 0 0 5732
đất sông suối (4) 0 173 0 1544 0 0 0 1717
đất cây hàng năm khác (5) 0 0 14 0 5270 0 7 5291
đất lúa (6) 0 0 0 0 0 786 9 795
đất chưa sử dụng (7) 0 0 0 0 40 3 833 876
Tổng cột 3889 896 6173 1565 5339 789 849 19500
Bảng 4.9: Bảng ựánh giá ựộ chắnh xác phân loại ảnh xã Ea Nuôl 2004
độ chắnh xác phân loại có tắnh ựến sai số nhầm lẫn độ chắnh xác phân loại có tắnh ựến sai số bỏ sót Loại ựất Sai số nhầm lẫn (%) (pixel) (%) Sai số bỏ sót ( %) (pixel) (%) đất lâm nghiệp (1) 11,75 3829/4339 88,25 1,54 3829/3889 98,46 đất mặt nước (2) 5,47 709/750 94,53 20,87 709/896 79,13
đất cây lâu năm (3) 1,45 5649/5732 98,55 8,49 5649/6173 91,51
đất sông suối (4) 10,08 1544/1717 89,92 1,34 1544/1565 98,66
đất cây hàng năm khác (5) 0,40 5270/5291 99,60 1,29 5270/5339 98,71
đất lúa (6) 1,13 786/795 98,87 0,38 786/789 99,62
đất chưa sử dụng (7) 4,91 833/876 95,09 1,88 833/849 98,12
độ chắnh xác
phân loại 18620/19500 (pixel) 95,49%
Kappa 0,94
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 68
Bảng 4.10: Ma trận sai số phân loại ảnh xã Ea Nuôl năm 2009
đơn vị tắnh: Pixel
Loại ựất (1) (2) (3) (4) (5) (6) (7) Tổng hàng
đất lâm nghiệp (1) 1234 0 6 0 0 0 0 1240
đất mặt nước (2) 0 1419 0 7 0 0 0 1426
đất cây lâu năm (3) 0 1 5193 0 0 0 0 5194
đất sông suối (4) 0 0 0 1137 0 0 0 1137
đất cây hàng năm khác (5) 0 0 0 0 3798 7 0 3805
đất lúa (6) 0 0 0 0 1 419 0 420
đất chưa sử dụng (7) 0 0 106 0 26 0 358 490
Tổng cột 1234 1420 5305 1144 3825 426 358 13712
Bảng 4.11: Bảng ựánh giá ựộ chắnh xác phân loại ảnh xã Ea Nuôl 2009
độ chắnh xác phân loại có tắnh ựến sai số nhầm lẫn độ chắnh xác phân loại có tắnh ựến sai số bỏ sót Loại ựất Sai số nhầm lẫn (%) (pixel) (%) Sai số bỏ sót ( %) (pixel) (%) đất lâm nghiệp (1) 0,48 1234/1240 99,52 0,00 1234/1234 100,00 đất mặt nước (2) 0,49 1419/1426 99,51 0,07 1419/1420 99,93
đất cây lâu năm (3) 0,02 5193/5194 99,98 2,11 5193/5305 97,89
đất sông suối (4) 0,00 1137/1137 100,00 0,61 1137/1144 99,39
đất cây hàng năm khác (5) 0,18 3798/3805 99,82 0,71 3798/3825 99,29
đất lúa (6) 0,24 419/420 99,76 1,64 419/426 98,36
đất chưa sử dụng (7) 26,94 358/490 73,06 0,00 358/358 100,00
độ chắnh xác
phân loại 13558/13712 (pixel) 98,88%
Kappa 0,99
độ chắnh xác bản ựồ năm 2004 xã Ea Nuôl: 98,88 %
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 69 - Các số liệu trên ựường chéo tô ựậm là số pixel phân loại ựúng tương ứng của các loại ựất, các số còn lại trong các hàng là số pixel phân loại nhầm sang loại ựất khác.
- Tổng hàng là tổng số pixel phân loại ựúng và số pixel phân loại nhầm của các loại ựất có trong tệp mẫu.
- Tổng cột là tổng số pixel từng loại ựất sau phân loại bao gồm số pixel phân loại ựúng và số pixel bỏ sót.
- Sai số nhầm lẫn khi phân loại bằng tỷ số giữa số pixel phân loại nhầm sang các loại ựất khác và tổng số pixel có trong tệp mẫu.
- Sai số bỏ sót khi phân loại bằng tỷ số giữa số pixel bỏ sót do sự phân loại nhầm lẫn từ các loại ựất khác và tổng số pixel của loại ựất sau phân loại.
độ chắnh xác phân loại ựược tắnh bằng tổng số pixel phân loại ựúng trên tổng số pixel của toàn bộ mẫu.
(4). Chuyển kết quả phân loại sang dạng vector:
để biên tập và thành lập bản ựồ hiện trạng, từ kết quả phân loại ảnh ta phải chuyển kết quả phân loại sang dạng Vector. Hai ảnh vệ tinh năm 2004 và 2009 sau khi phân loại ựược chuyển sang dạng Vector sẽ ựược lưu ở ựịnh dạng file: EN-04-VT.evf và EN-09-VT.evf.
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 70
Hình 4.22: Kết quả phân loại ảnh Ea Nuôl năm 2004 ở dạng Vector
Trường đại học Nông nghiệp Hà Nội Ờ Luận văn thạc sĩ khoa học nông nghiệp ẦẦẦẦẦẦẦẦ 71