5. Cấu trúc của luận văn
2.3. Các phƣơng pháp nghiên cứu
2.3.1. Phƣơng pháp chiết tách thông tin lòng sông từ ảnh viễn thám Landsat
Lòng sông khi luận giải ảnh viễn thám được quan niệm là nằm trong giới hạn đường bờ nước tại thời điểm chụp ảnh (phân biệt giữa ranh giới nước và đất, nước và thực vật). Do độ phân giải của ảnh nghiên cứu là không cao (30 m) nên quy ước phần mép nước thu được là đường bờ của sông. Như vậy, bản chất của nghiên cứu chiết tách lòng sông từ ảnh viễn thám chính là chiết tách thông tin đường nước xuất hiện liên tục trên bề mặt ảnh.
26
Việc tính toán và lấy thông tin về đối tượng nước nói chung và lòng sông nói riêng trên ảnh viễn thám là vô cùng quan trọng do được ứng dụng trong nhiều lĩnh vực [31], [13]. Từ khi dữ liệu ảnh viễn thám Landsat được sử dụng năm 1972, một số nghiên cứu về việc chiết tách thông tin đối tượng nước trên dữ liệu ảnh viễn thám Landsat ETM, TM hoặc MSS đã được đưa ra. Có thể kế đến nghiên cứu của Smith năm 1997 đã đưa ra phương pháp sử dụng dữ liệu ảnh viễn thám Landsat MSS sử dụng ảnh kênh 7 để phân biệt các vùng nước xung quanh vùng đất khô hoặc thực vật. Năm 1989, Bennett đã sử dụng kỹ thuật tạo ảnh cắt lớp (density slicing) trên kênh 7 của ảnh Landsat MSS để lập bản đồ vùng ngập nước ở phía Tây Griffith nước Úc. Một số nghiên cứu khác đã thành công khi sử dụng các phương pháp phân loại có kiểm định và phân loại không kiểm định trên dữ liệu ảnh viễn thám đa phổ để chiết tách thông tin nước [27], [25].
Qua các nghiên cứu nêu trên, có thể thấy rằng để chiết tách được thông tin lòng sông từ ảnh Landsat cần dựa vào hai yêu tố quan trọng bao gồm: đặc trưng phản xạ phổ của đối tượng nước trên ảnh Landsat và đặc trưng màu ứng với từng khoảng bước sóng trên ảnh Landsat.
Về khả năng phản xạ phổ của nước: trên kênh hồng ngoại và cận hồng ngoại của ảnh Landsat, đường bờ nước được phát hiện rất dễ dàng. Điều này là do trong điều kiện tự nhiên, mặt nước sẽ hấp thụ rất mạnh năng lượng ở dải cận hồng ngoại và hồng ngoại, do vậy, năng lượng phản xạ sẽ rất ít. Vì khả năng phản xạ phổ của nước ở dải sóng dài khá nhỏ, nên việc sử dụng các kênh sóng dài để chụp cho ta khả năng đoán đọc thủy văn, ao hồ... các phản xạ của đối tượng nước trong các vùng hồng ngoại là rất nhỏ, trong khi đối tượng đất và thực vật thì ngược lại - hấp thụ ít và phản xạ nhiều hơn [18]. Do đó, để chiết tách được thông tin nước từ ảnh viễn thám Landsat, cần phải tìm ra sự liên kết đặc biệt giữa các kênh ảnh khác nhau liên quan tới đối tượng nước, lựa chọn một số kênh ảnh phù hợp sau đó xử lý đặt ngưỡng giá trị để chiết tách lấy vùng nước. Khả năng phản xạ phổ của nước cũng như các đối tượng chính khác bao gồm thực vật, và đất trên các kênh ảnh Landsat ETM, TM được thể hiện qua hình 2-6 dưới đây:
27
Hình 2-6:Phản xạ phổ của các đối tƣợng trên các kênh ảnh Landsat ETM, TM
(Chú giải hình 2-6: reflection: phản xạ; wavelength: bước sóng, water: nước, vegatation: thực vật, soil: đất; visible: nhìn thấy; NIR: cận hồng ngoại; intermediate infared: hồng ngoại trung)
Trong dữ liệu ảnh Landsat ETM, TM, chúng ta có thể nhận ra đối tượng nước và các đối tượng khác phân biệt với nhau bằng những khác biệt trong phản xạ của từng kênh ảnh. Trong 6 kênh màu của ảnh Landsat, kênh hồng ngoại (kênh 5) được ứng dụng cho việc chiết tách thông tin giữa đất và nước tốt nhất [25] do kênh 5 chỉ ra một sự tương phản mạnh về ranh giới giữa đất và nước do hấp thụ mạnh năng lượng hồng ngoại của nước (thậm chí cả với nước đục) và phản xạ mạnh hồng ngoại của thảm thực vật. Các biểu đồ phổ của kênh 5 luôn hiển thị một đường cong nhọn sắc nét do phản xạ rất nhỏ của nước và phản xạ cao của thảm thực vật và đất [16]. Khi các giá trị phản xạ được thể hiện, ta sẽ thấy các vị trí mô tả đối tượng nước có giá trị thấp và các đối tượng đất và đất chứa thực vật có giá trị cao hơn. Bảng 2-1 dưới đây thể hiện các đặc trưng của ảnh Landsat ETM, TM:
28
Bảng 2-1: Đặc trƣng của ảnh Landsat ETM, TM
Stt Kênh Bƣớc sóng Phổ màu Độ phân giải (m)
1 1 0,45 – 0,52 Lam (Blue) 30
2 2 0,52 – 0,60 Lục (Green) 30
3 3 0,63 – 0,69 Đỏ (Red) 30
4 4 0,76 – 0,90 Cận hồng ngoại (Near IR) 30 5 5 1,55 – 1,75 Hồng ngoại sóng ngắn (SWIR) 30
6 6 10,40 – 12,50 Hồng ngoại nhiệt (Thermal IR) 120 (TM) 60 (ETM+) 7 7 2,08 – 2,35 Hồng ngoại sóng ngắn (SWIR) 30
Từ các luận giải trên, với mục đích chiết xuất ranh giới giữa nước và đất, nước và thực vật, kênh 5 (b5) của ảnh Landsat ETM, TM được kết hợp với kênh 2 (b2) để tạo ảnh tỷ số (b5/b2). Giá trị phổ trên ảnh tỉ số nhỏ hơn 1 cho thông tin về giá trị nước và lớn hơn 1 cho thông tin về giá trị đất (thường là vùng ven biển). Ảnh tỉ số b5/b2 được sử dụng tốt nhất khi đối tượng đất không bao gồm thảm thực vật. Để có thể xử lý tách thông tin của nước với cả hai đối tượng đất và thực vật, chúng tôi đã nghiên cứu để kế thừa công thức lập ảnh tỉ số (b5+b7)/b2 theo phương pháp của Winasor và S. Budhiman [35]
(a)
(b)
Hình 2-7:
29
Qua thống kê về các giá trị phổ trên các kênh ảnh trên ảnh gốc qua Bảng 2-2 và trên ảnh tỉ số qua Bảng 2-3, trên ảnh tỉ số (b5+b7)/b2 thu được ta có các giá trị phổ có sự tập trung cao, 95% các giá trị phổ tập trung trong vùng giá trị [0,3; 6] với độ lệch chuẩn là 0,8727 (chi tiết hình 2-8)
Bảng 2-2: Thống kê giá trị phổ ảnh trên các kênh ảnh của ảnh Landsat 1990 (a)
Stt Kênh ảnh Min Max Mean Độ lệch chuẩn
1 Band 1 0 145 29,58059 31,917394 2 Band 2 0 88 12,62959 13,958598 3 Band 3 0 139 12,92067 15,782882 4 Band 4 0 168 32,95767 37,217922 5 Band 5 0 209 32,53316 38,561721 6 Band 6 0 158 60,58417 64,602583 7 Band 7 0 165 11,53312 15,505484
Bảng 2-3: Thống kê giá trị phổ trên ảnh tỉ số (b5+b7)/b2 của ảnh Landsat năm 1990 (b)
Stt Kênh ảnh Min Max Mean Độ lệch chuẩn
1 Band 1 0,0351 7,6452 3,4088 0,8727
Hình 2-8: Phân bố giá trị phổ ảnh trên ảnh tỉ số (b5+b7)/b2 của ảnh Landsat 1990
Dựa vào sự khác biệt của ngưỡng giá trị đối tượng nước so với các đối tượng khác, trên dữ liệu ảnh tỉ số thu được, sử dụng phương pháp phân ngưỡng cho kênh
30
ảnh tỉ số để tạo các lát cắt giá trị (density slice) nhằm chiết tách thông tin về đối tượng nước trên ảnh (Hình 2-10).
Do tính chất ảnh ở các thời kỳ là giống nhau, phương pháp trên cũng được sử dụng cho dữ liệu ảnh ở các mốc thời gian khác, tuy nhiên giá trị phân ngưỡng để chiết tách thông tin đối tượng nước ở mỗi thời kỳ là khác nhau do sự khác biệt về giá trị phản xạ phổ. Hình 2-9: Ảnh tỉ số 1990 (b5+b7)/b2 Hình 2-10: Đối tƣợng nƣớc đƣợc chiết tách từ ảnh tỉ số 1990 miền giá trị phổ [0,17; 0,96]
Các ảnh tỉ số sau khi phân ngưỡng ở định dạng raster được chuyển đổi sang dạng vector và được xử lý để chiết xuất dữ liệu lòng sông ở dạng Polygon bằng công cụ ArcGis.
2.3.2. Phƣơng pháp đánh giá biến động sạt lở, bồi tụ của bờ sông
Các dữ liệu về lòng sông thu được từ bước trên tiếp tục được xử lý để tạo các bộ dữ liệu về đường bờ trái và phải ở mỗi thời kỳ. Luận văn đã áp dụng linh hoạt phương pháp tính toán của Theiler năm 2008 [33] được mô tả qua hình 2-11 dưới đây để tính toán biến động bồi tụ và sạt lở bờ sông.
Cơ sở khoa học của phương pháp này là xây dựng các đường cắt ngang (transect) vuông góc cắt tất cả các đường bờ (river bank) theo các khoảng cách được lựa chọn (transect spacing) từ một đường cơ sở (baseline). Trên cơ sở thông
31
tin dữ liệu của các điểm giao giữa đường transect và đường bờ lịch sử, số liệu thống kê sẽ được lưu trữ để tính toán. Quá trình ghi nhận và xử lý dữ liệu được hỗ trợ bằng công cụ mở rộng DSAS của phần mềm ArcGis.
Hình 2-11: Mô tả về các đối tƣợng trong phƣơng pháp của Theiler
(Chú giải hình 2-11: baseline: đường cơ sở; riverbank: bờ sông; transect: đường cắt ngang; transect length: độ dài đường cắt ngang; trasect spacing: khoảng cách giữa hai đường cắt ngang liền kề nhau).
Các đường cơ sở của mỗi hệ thống bờ sông được xây dựng trên cơ sở tạo một vùng đệm từ lòng sông cơ sở (lòng sông cổ nhất trong giai đoạn nghiên cứu). Từ đường baseline, các đường cắt ngang transect được thiết lập theo các thông số tùy chọn, hướng của các transect tùy thuộc vào việc lựa chọn vị trí của đường baseline.
Một số trường hợp cụ thể ảnh hưởng tới độ chính xác trong xác định biến động đường bờ:
- Trường hợp khi đường transect cắt một đường bờ tại nhiều hơn một điểm như trong hình 2-12, để thống nhất các dữ liệu thống kê thu được, thông tin về điểm giao gần nhất sẽ được lựa chọn là dữ liệu để tính toán.
32
(a) (b)
Hình 2-12: Mô tả giao nhau giữa đƣờng transect và đƣờng bờ
(dữ liệu trong trường hợp (a) sẽ được sử dụng để tính toán thống kê)
- Trong trường hợp đường transect giao với các cung nhọn của đường baseline như ở hình 2-13, cần định hướng cho các transect để tìm giao điểm chính xác với đường bờ. Để giải quyết vấn đề này, một đường đệm baseline sẽ được tạm thời tạo ra trên cơ sở làm mịn các đường baseline ban đầu như trong hình 2-14.
(a) (b)
Hình 2-13: Transect giao với đƣờng cơ sở tại cung nhọn (a) (dữ liệu trong trường hợp (b) sẽ được sử dụng để tính toán thống kê)
trước khi làm mịn (b) sau khi làm mịn
Hình 2-14: Đƣờng đệm baseline mới đƣợc tạo ra
(dữ liệu trong trường hợp (b) sẽ được sử dụng để tính toán thống kê)
Với dữ liệu thông tin thu được về điểm giao giữa các đường transect và đường bờ các năm, tốc độ biến động đường bờ trong lịch sử được tính toán qua
33
khoảng cách (Dn) giữa hai điểm bất kỳ trong hai giai đoạn và khoảng thời gian T giữa hai giai đoạn. Sử dụng công thức (4) của Appeaning Addo, năm 2008 [12]:
R1 = Dn/T (4) Trong đó:
R1 (m/year) là tốc độ biến đổi đường bờ.
Dn (m) là khoảng cách giữa hai đường bờ của 2 giai đoạn T1 và T2. T là khoảng thời gian giữa hai giai đoạn (T= T2 – T1) (years).
2.3.3. Phƣơng pháp tính toán biến động bằng so sánh sau phân loại
Bản chất của phương pháp tính toán biến động bằng so sánh sau phân loại là chồng ghép hai bản đồ hiện trạng để xây dựng bản đồ biến động. Các bản đồ hiện trạng có thể thực hiện dưới dạng bản đồ raster hoặc vector.
Quy trình nghiên cứu biến động theo phương pháp này có thể tóm tắt như hình 2-15 dưới đây:
Hình 2-15: Quy trình phƣơng pháp tính biến động bằng so sánh sau phân loại
Sau khi ảnh vệ tinh được nắn chỉnh hình học sẽ tiến hành phân loại độc lập để tạo thành hai bản đồ. Hai bản đồ này được so sánh bằng cách so sánh pixel tạo thành ma trận biến động.
Theo R. Jensen (1996) ưu điểm của phương pháp này cho biết sự thay đổi từ “cái gì” sang “cái gì” và chúng ta cũng có thể sử dụng các bản đồ hiện trạng đã được thành lập trước đó. Nhược điểm của phương pháp này là phải phân loại độc lập các ảnh viễn thám nên độ chính xác phụ thuộc vào độ chính xác của từng phép phân loại [21].
34
2.3.4. Phƣơng pháp phân loại ảnh viễn thám dựa trên thuật toán K-means
Phân loại ảnh là quá trình tách gộp thông tin dựa trên các tính chất phổ, không gian và thời gian. Phân loại thường được biểu diễn bởi tập hợp các kênh ảnh và quá trình này là gán từng pixel trên ảnh vào các lớp khác nhau, dựa trên đặc tính thống kê của các giá trị độ xám của từng pixel.
Trong nghiên cứu này, chúng tôi thực hiện phân loại ảnh áp dụng thuật toán K-means do MacQueen đưa ra năm 1967 [26]. Thuật toán này giúp phân loại/nhóm cụm n đối tượng thành k nhóm dựa trên đặc tính/thuộc tính của đối tượng (k n nguyên, dương). Sơ đồ của thuật toán K-means được thể hiện ở hình 2-16:
Hình 2-16: Sơ đồ của thuật toán K-means (MacQueen)
Về nguyên lý, có n đối tượng, mỗi đối tượng có m thuộc tính, ta phân chia được các đối tượng thành k nhóm dựa trên các thuộc tính của đối tượng bằng việc áp dụng thuật toán này. Coi mỗi thuộc tính của đối tượng như một toạ độ của không gian m chiều và biểu diễn đối tượng như một điểm của không gian m chiều. Phương thức phân loại/nhóm dữ liệu thực hiện dựa trên khoảng cách Euclidean nhỏ nhất giữa đối tượng đến phần tử trung tâm của các nhóm.
35
Phần tử trung tâm của nhóm được xác định bằng giá trị trung bình các phần tử trong nhóm [22].
- Khoảng cách Euclidean
ai=(xi1, xi2,... xim) i=1..n - đối tượng thứ i cần phân phân loại cj=(xj1, xj2,... xjm) j=1..k - phần tử trung tâm nhóm j
Khoảng cách Euclidean từ đối tượng ai đến phần tử trung tâm nhóm j cj được tính toán dựa trên công thức:
(5)
Trong đó: ji - khoảng cách Euclidean từ ai đến cj
xis - thuộc tính thứ s của đối tượng ai
xjs - thuộc tính thứ s của phần tử trung tâm cj
- Phần tử trung tâm
k phần tử trung tâm (k nhóm) ban đầu được chọn ngẫu nhiên, sau mỗi lần nhóm các đối tượng vào các nhóm, phần tử trung tâm được tính toán lại.
Clusteri = {a1, a2,.... an} – Nhóm thứ i Trong đó: i=1..k, k số cluster
j= 1..m, m số thuộc tính
t là số phần tử hiện có của nhóm thứ i xsj là thuộc tính thứ j của phần tử s s=1..t cij là toạ độ thứ j của phần tử trung tâm nhóm i;
36
2.3.5. Đánh giá độ chính xác kết quả sau phân loại của các thời kỳ
Bản đồ lớp phủ được thành lập từ ảnh viễn thám luôn luôn chứa một số loại sai số do các nhân tố từ công nghệ phân loại đến phương pháp thu nhận ảnh. Do đó ta cần phải tiến hành đánh giá độ chính xác sau phân loại của các bản đồ kết quả đó. Kết quả độ chính xác có thể đạt hoặc không đạt tùy theo mục đích của người sử dụng và ứng dụng tiếp theo của bản đồ. Mức độ chính xác cũng có thể được chấp nhận với một mục đích cụ thể nào đó nhưng lại không được chấp nhận vào mục đích khác.
Phương pháp thông dụng nhất để đánh giá độ chính xác sau phân loại là sử dụng ma trận sai số hay còn gọi là ma trận nhầm lẫn hoặc bảng ngẫu nhiên. Ma trận sai số là một ma trận vuông trong đó số hàng và số cột tương ứng với số loại lớp phủ mà ta đã đưa ra. Số hàng trong ma trận biểu diễn thông tin viễn thám thu được từ bản đồ hiện trạng trong khi đó số cột biểu diễn dữ liệu tham khảo thu được trong quá trình khảo sát thực địa. Từ bảng đó cung cấp cho ta các chỉ số đo lường của việc tính toán độ chính xác như độ chính xác phân loại trung bình, phần trăm của sai số bỏ sót và sai số nhầm lẫn, hệ số Kappa- chỉ số để đánh giá ảnh hưởng của sự ngẫu nhiên.
Sai số bỏ sót là phần trăm của các pixel mà lẽ ra nên nằm trong các lớp đã đưa ra nhưng trên thực tế lại không có. Sai số do nhầm lẫn chỉ ra các pixel mà nằm trong các lớp đã đưa ra trong khi thực tế chúng lại thuộc về các lớp khác. Các giá trị đó dựa trên các mẫu trong khi kiểm tra lỗi pixel của các lớp phủ không xác định mà được so sánh để phân loại trong bản đồ. Sai số do nhầm lẫn và do bỏ sót cũng có thể biểu diễn trong các thuật ngữ độ chính xác của người sử dụng và độ chính xác của người làm bản đồ. Độ chính xác của người sử dụng biểu diễn khả năng