Tên đối tượng Ký hiệu Giá trị trung bình theo kênh ảnh
BLUE GREEN RED NIR
Sông Hồng SH 115.590 133.025 148.690 81.425 Nhà NHA 153.795 146.045 168.445 203.655 Đường Duong 146.760 157.315 176.216 201.840 Thực vật TV 93.083 130.667 141.733 337.883 Đất Dat 143.537 145.204 156.593 246.574 Mây May 274.329 284.600 311.471 333.964 Nước lục địa NLD 78.530 103.155 136.450 78.275 Bóng đổ tòa nhà BD 124.000 140.333 171.750 135.083 Từ Bảng 4.2 này sẽ thiết lập được biểu đồ giá trị theo các kênh ảnh như sau (xem Hình 4.2) :
Hình 4.3 Biểu đồ giá trịđiểm ảnh tại 4 kênh ảnh của ảnh VNREDSat-1
0 50 100 150 200 250 300 350 400
Blue Green Red Nir
SH NHA Duong TV Dat May NLD BN Giá tr ị đi ể m ả nh Kênh ảnh VNREDSat-1
4.2.5 Phân tích đặc điểm phổ của thông tin nước:
Trong kênh cận hồng ngoại, nước hấp thụ nhiều năng lượng hơn tại các kênh nhìn thấy. Kênh nhìn thấy gồm Kênh 1 (BLUE), Kênh 2 (GREEN), Kênh 3 (RED), kênh cận hồng ngoại - Kênh 4 (NIR). Điều này có nghĩa rằng hệ số phản xạ của nước tại kênh cận hồng ngoại thấp hơn hệ số phản xạ của nước tại các kênh nhìn thấy.
Trong khi đó, thực vật và đất hấp thụ năng lượng ít nhưng phản xạ lại lớn hơn. Dựa
trên đặc điểm này, chúng ta thấy được sự khác biệt của nước đối với các thành phần khác tại kênh cận hồng ngoại - Kênh 4. Bởi vậy, chúng ta sẽ thiết lập đường ranh giới
để trích xuất thông tin thông tin nước tại Kênh 4 (NIR) này để đảm bảo được tính chính xác cao nhất.
Hình 4.3 biểu diễn đường giá trị phản xạ của thực vật, đất, nước theo phổđối với
ảnh Landsat TM [25]. Ta thấy đồ thị hệ số phản xạ của nước bị hấp thụ mạnh tại bước sóng từ 0.6 đến 0.7m, trong khi đó hệ số phản xạ của thực vật lại tăng mạnh ở dải
bước sóng này. Đối với ảnh VNREDSat-1 cũng tương tựnhư vậy.
Hình 4.4 Giá trị phản xạ của đất, nước, thực vật trên ảnh Lansat TM
Thông thường trong thành phố còn có các tòa nhà cao tầng và một số cây cổ thụ
có tán lá rộng thì bóng đổ của tòa nhà hoặc bóng đổ của cây cổ thụ sẽảnh hưởng đến kết quả trích xuất thông tin nước. Thông tin nước có thể lẫn với một ít thông tin bóng
đổ tòa nhà hoặc bóng đổ thực vật. Tuy nhiên, những gì được thể hiện trên ảnh đa phổ
VNREDSat-1 chụp ở khu vực Hà Nội là rất khó để phát hiện được bóng đổ tòa nhà và gần như không thể phát hiện ra bóng đổ thực vật. Điều này có thểđược lý giải rằng độ
phân giải không gian (10 m) của ảnh đa phổ VNREDSat-1 rất khó để phân biệt bằng mắt thường về bóng đổ tòa nhà và không thể phát hiện bóng đổ thực vật chụp tại khu vực nghiên cứu, mặt khác có thể do diện tích lãnh thổ Việt nam nhỏ nên trong khoảng thời gian vệ tinh bay qua lãnh thổ Việt nam thường vào thời điểm buổi trưa (đứng bóng) nên bóng đổ tòa nhà xuất hiện trên ảnh là rất ít và bóng đổ thực vật thì quá nhỏ để có thể phân biệt được ( diện tích bóng đổ thực vật < 100 m2= 1 pixel vuông).
Từ Hình 4.3, chúng ta thấy rằng giá trị bức xạ của nước Sông Hồng, Nước lục
phổ ở Kênh 1, Kênh 2 trong khi Kênh 4 thì chúng có giá trị giống nhau. Tương tự, mây và thực vật có giá trị gần nhau ở Kênh 4 nhưng tại Kênh 1, 2, 3 lại khác nhau.
4.2.6 Phân tích đặc điểm không gian của thông tin nước:
Các đặc điểm không gian chính bao gồm kích thước, hình dạng, cấu trúc và vị trí. Có sự khác biệt về đặc điểm của các loại thông tin nước, chẳng hạn dòng sông, hồ tự
nhiên, hồ nhân tạo, ao. Hình dạng của các thông tin nước này là khác nhau. Dòng sông
thường có hình như một con đường, hồ chứa nước (đập) thường có một cạnh thẳng, diện tích của hồ thường lớn hơn, các ao thường có hình tứ giác. Chúng ta cần có sự
hiểu biết về vấn đềnày để phân biệt được các loại thông tin nước khác nhau.
4.2.7 Phân biệt Nước lục địa và bóng đổ tòa nhà bằng cách phân biệt đặc điểm không gian của nước và bóng đổ không gian của nước và bóng đổ
Thông tin nước và bóng đổ tòa nhà thường có các đặc điểm tương đồng với nhau, vì vậy chúng thường hay bị lẫn vào nhau. Quan sát Hình 4.3 chúng ta thấy rằng đường giá trị qua các kênh ảnh của thông tin nước và bóng đổ tòa nhà gần như nhau, đặc biệt tại Kênh 1, Kênh 2, Kênh 3 giá trị đối tượng bóng đổ tòa nhà rất gần với giá trị của
nước Sông Hồng, tuy nhiên tại Kênh 4 có sự phân biệt rõ hơn giữa thông tin nước và
bóng đổ. Mặt khác, diện tích bóng đổ tòa nhà thường nhỏhơn diện tích Nước lục địa, ngoại trừ một số ao nhỏ. Vì vậy, qua khảo sát thực tế và kiểm tra thực nghiệm, chúng ta thiết lập đường giới hạn là giá trị 22.000 (m2) để phân biệt diện tích của Nước lục
địa có diện tích lớn và Nước lục địa có diện tích nhỏ mà có thể lẫn một ít bóng đổ. Con sốnày được đại diện cho diện tích bóng đổ tòa nhà lớn nhất mà có thể bị lẫn với thông
tin nước. Chẳng hạn, nếu kích thước bóng đổ tòa nhà có dạng hình chữ nhật thì kích
thước của nó là 100 m (chiều rộng) × 220 m (chiều dài) = 22.000m2. Nước lục địa
được hiểu là tất cảthông tin nước nằm trong đất liền, thuộc cảnh nghiên cứu. Nước lục
địa khác với nước dòng sông hoặc nước đại dương. Sự cần thiết phân biệt Nước lục
địa với thành phần nước khác nhằm mục đích khoanh vùng tạo điều kiện thuận lợi cho việc trích xuất nước trong lục địa đạt hiệu quả cao nhất.
Sau khi trích xuất được thông tin nước có diện tích lớn, vẫn còn lại một ít thông
tin bóng đổ tòa nhà, bóng đổ thực vật lẫn vào trong thông tin nước đã được trích xuất. Dựa trên việc phân tích hình dạng góc của đối tượng, các thông tin nước này thường có góc hình tròn, hình bán nguyệt hoặc hình dạng phức hợp. Một số ít ao có 4 cạnh, còn bóng đổ tòa nhà thường có các cạnh song song. Vì vậy, chúng ta có thểtách được
bóng đổ tòa nhà và một sốthông tin nước còn lại dựa vào phân tích chỉ số hình.
Chỉ số hình được thiết lập theo công thức (3.1) vì đặc điểm của công thức này chỉ đơn thuần kiểm tra cấu trúc của các cụm dữ liệu trên ảnh thuộc hình dạng nào. Thực vậy, công thức này đã được áp dụng để tính chỉ số hình các cụm dữ liệu điểm ảnh trong quá trình trích xuất thông tin nước của ảnh VNREDSat-1 đạt độ tin cậy cao.
4.3 Xây dựng thuật toán tựđộng trích xuất thông tin nước bằng cây quyết định 4.3.1 Mô tả thuật toán: 4.3.1 Mô tả thuật toán:
Từthông tin đã phân tích ở trên, chúng ta tiến hành xây dựng thuật toán tự động trích xuất thông tin nước bằng cây quyết định như sau. Đầu tiên cần thiết lập các
đường giới hạn (ngưỡng) gồm d1, d2, d5, d4 và d5.
Bước 1. Đọc ảnh vệ tinh VNREDSat-1
Bước 2. Kiểm tra nếu giá trị Kênh 4 (NIR) < 141(d1 = 141) (4.3) thì trích xuất thông tin được Nước lục địa và nước Sông Hồng nhưng vẫn còn lẫn một sốbóng đổ tòa nhà. Trong đó, ngưỡng d1 được thực hiện theo công thức (4.4) như sau:
d1 = (GT(Max(SH, HT, NLD) + GT(Min(Nha, Duong, TV, Dat, May))/2 (4.4)
với GT là giá trị đọc được tại Kênh 4. Max là giá trị lớn nhất đọc được tại các đối
tượng SH, HT, NLD. Min là giá trị nhỏ nhất đọc được tại các đối tượng Nha, Duong, TV, Dat, May.
Căn cứ vào Bảng 4.2, chúng ta thấy rằng tại Kênh 4 này thông tin nước Sông Hồng,
Nước lục địa thì giá trị của nước Sông Hồng là lớn nhất (81.425) và đối tượng khác
thông tin nước gần nhất chính là đối tượng Đường có giá trị (201.840). Vì vậy, ngưỡng
để phân biệt các thông tin nước với các đối tượng khác không phải là nước sẽ là d1. Giá trị d1 được thiết lập do lấy giá trị trung bình của tổng 2 giá trị tại Kênh 4 của đối
tượng Sông Hồng (81) và đối tượng Đường (201). Kết quả được tính như sau: d1 = (81.425 + 201.84)/2 = 141.6 (4.5.1). Ngoài ra, ngưỡng thông tin nước mà thí nghiệm
thu được có giá trị trong khoảng [62 134], có nghĩa Max(thông tin nước) = 134 < d1 (4.5.2). Mặt khác Min(đối tượng khác thông tin nước) = Min(Đường) = 141 (4.5.3). Vì vậy, từ (4.5.1), (4.5.2), (4.5.3) ta suy ra d1 = 141 hay nói cách khác với giá trị d1 = 141 thỏa mãn điều kiện (4.5.1), (4.5.2), (4.5.3).
Bước 3. Kiểm tra nếu giá trị Kênh 4 (NIR) < d1 và Kênh 1 (BLUE) > 97(d2 = (GT(NLD) + GT(SH))/2 = (78.53+ 115.6)/2 = 97) thì trích xuất thông tin được nước Sông Hồng. Công thức (4.6) dùng để tính d2 được thiết lập như sau:
d2 = (GT(NLD) + GT(SH))/2 (4.6)
Bước 4. Nếu giá trị Kênh 4 (NIR) < d1 và giá trị Kênh 1 (BLUE) <= d2(4.7) thì trích xuất thông tin được Nước lục địa và lẫn một ít bóng đổ tòa nhà.
Bước 5. Tính toán tất cả diện tích các cụm dữ liệu thông tin nước đã trích xuất được ở Bước 4. Nếu diện tích của cụm dữ liệu nào > 22.000 m2(d3 = 22.000) (4.7) thì trích xuất thông tin được Nước lục địa có diện tích lớn. Giá trị d3 được tính là diện tích lớn nhất của bóng đổ tòa nhà thể hiện được trên ảnh vệ tinh mà có thể lẫn với
thông tin nước. Giá trị này được thiết lập dựa trên khảo sát thực tế tại khu vực nghiên cứu, đối chiếu với giá trịmà Cao Kai đưa ra để lựa chọn.
Bước 6. Tính toán chỉ số hình đối với các cụm dữ liệu nào có diện tích nhỏ hơn hoặc bằng d3 (lẫn nước và bóng đổ). Nếu chỉ số hình M nằm trong khoảng 0.13 đến 0.23 (d4) và TB_NIR > 108 (d5) thì trích xuất được thông tin bóng đổ tòa nhà, với d4 được tính theo công thức (4.8) và d5 được tính theo công thức (4.9):
d4 = [0.13, 0.23] (4.8) d5 = TB_NIR(GT(BD) + Max(GT(SH), GT(NLD)))/2 = 108 (4.9)
(d5 = (135.1 + 81.4)/2 = 108 )
Giá trị d4 này sử dụng kết quả nghiên cứu của Cao Kai vì bản chất chỉ là tính chỉ số
hình để phân biệt hình dạng nên có thể áp dụng cho tất cả loại ảnh vệ tinh nghiên cứu, d5 là giá trung bình đọc được tại Kênh 4 (NIR) của đối tượng bóng đổ (BD) và giá trị
lớn nhất của thông tin nước gồm Sông Hồng (SH) và nước lục địa (NLD).
Bước 7. Tổng hợp dữ liệu nước sau khi loại bỏ các thành phần không phải là nước để
xuất ra tệp dữ liệu thông tin nước và lưu trữ lên máy tính.
Thông thường, các ngưỡng này được lấy là giá trị trung bình của hai đối tượng cần phân biệt với nhau mà có vị trí gần nhau nhất. Tuy nhiên, việc xác định giá trị này cũng có thể mềm dẻo hơn, kết hợp với thực nghiệm, kết hợp với giá trị ngưỡng của đối
tượng đó nằm trong khoảng nào để quyết định lựa chọn sao cho việc trích xuất đối
tượng đó đạt kết quả tốt nhất.
Ví dụ, đểtách đối tượng Mây, dựa vào Bảng 4.2 chúng ta thấy tại Kênh 3 (RED) có khoảng cách từMây đến Đường là lớn nhất và bằng 311.471 - 176.216 = 135.3, lớn
hơn khoảng cách giữa đối tượng Mây và nước Sông Hồng tại Kênh 1 (127) và lớn hơn
khoảng cách giữa đối tượng Mây và Đường tại Kênh 2 (121) nên ta chọn tách ở Kênh 3(RED) sẽ có hiệu quả nhất. Vì vậy, ngưỡng đểtách đối tượng Mây với các đối tượng khác là d(Mây) > (311.471 + 176.216)/2 = 243.8. Tương tựnhư vậy đối với các trường hợp khác. Giả sử để tách Thực vật ta chọn trích xuất tại 2 kênh, trong đó tại kênh 4 (NIR) sẽ kiểm tra điều kiện d_1((Thực vật) > (GT(Đất) + GT(TV))/2 = (337.8 + 246.6)/2 = 292, kết hợp với điền kiện tại Kênh 3 (RED) với d_2(Thực vật) <
(GT(Đường) + GT(TV))/2 = 144 sẽ trích xuất được Thực vật. Để đảm bảo việc tách hiệu quả, có thể phải kết hợp tách dữ liệu trên nhiều kênh ảnh khác nhau, tùy thuộc
vào biên độ giá trị của đối tượng cần tách với giá trị của đối tượng gần kề nhất với nó
có đủđộ lớn để phân biệt được giữa chúng hay không.
4.3.2 Xây dựng sơ đồ khối trích xuất thông tin nước từảnh vệ tinh VNREDSat-1
Từ kết quả phân tích các bước trên, chúng ta thiết lập được sơ đồ khối trích xuất
Hình 4.5 Sơ đồ khối trích xuất thông tin nước từảnh vệ tinh VNREDSat-1
4.3.3 Tính diện tích, chu vi các đối tượng cần xét
Sau khi thông tin nước đã được trích xuất nhưng vẫn còn lẫn với một ít bóng đổ
tòa nhà, chúng ta cần tính toán chỉ số hình để loại bỏ tối đa các thành phần tạp này. Để
tính toán chỉ số hình cần tính được diện tích và chu vi của các đối tượng cần xét.
Ảnh VNRedsat
Nir < d1
Nước, bóng đổ Thông tin khác
Sông Hồng
Blue > d2
Nước lục địa, bóng đổ tòa nhà
DT > d3 Nước lục địa ( diện tích lớn) Nước lục địa ( diện tích nhỏ) Bóng đổ tòa nhà d4 > M > d5 Ao, một ít Nước lục địa ( cùng hình dạng) Bóng đổ tòa nhà
Thông tin nước
T F
T F
T F
F T
Lưu ảnh VNRedsat nước 141
97
22000
0.13
Thuật toán tính diện tích của đối tượng:
Ý tưởng:
Để tính được diện tích của đối tượng, cần đếm số các điểm ảnh thuộc cụm dữ
liệu cần xét rồi nhân với kích thước điểm ảnh.
Mô tả thuật toán:
Bước 1. Duyệt toàn bộ ma trận điểm ảnh của ảnh thông tin nước (ma trận thông
tin Nước lục địa có diện tích < diện tích bóng đổ tòa nhà) để đánh chỉ số phân cụm.
Sau bước này, sẽ tạo ra các cụmthông tin nước còn lẫn một ít bóng đổ.
Bước 2. Tính diện tích cụm bằng cách đếm các điểm ảnh trong mỗi cụm rồi nhân với kích thước của điểm ảnh.
Thuật toán tính chu vi của đối tượng:
Ý tưởng:
Để tính được chu vi của cụm phải duyệt qua tất cả các điểm ảnh của cụm, tìm
được các điểm ảnh thuộc đường biên của cụm, cộng độ dài của đường biên này theo mép ngoài sẽ tính được chu vi của cụm.
Mô tả thuật toán:
Bước 1: Duyệt toàn bộ ma trận điểm ảnh của ảnh thông tin nước (ma trận thông tin Nước lục địa có diện tích < diện tích bóng đổ tòa nhà) để đánh chỉ số phân cụm.
Sau bước này, sẽ tạo ra các cụmthông tin nước và còn lẫn một ít bóng đổ.
Bước 2: Tại mỗi điểm ảnh đang xét, lựa chọn đi tiếp 4 hướng kế cận
Bước 3: Nếu vị trí điểm ảnh đi tiếp là chưa được xét và nằm trong phạm vi của
cụm thì so sánh giá trị của nó với giá trị ban đầu.
Bước 4: Nếu phép so sánh tại Bước 3 là Sai ( hai điểm ảnh khác giá trị ) thì nó là
điểm ảnh kề điểm ảnh thuộc cụm đang xét và nếu vị trí này chưa được duyệt qua thì
tăng biến đếm chu vi lên 1 đơn vị, ngược lại bỏ qua.
Bước 5: Nếu đi bốn hướng mà gặp đường biên của ảnh thì bỏ qua cụm này (vì không thể xác định được cụm dữ liệu có điểm ảnh nằm biên thuộc hình gì).
Bước 6: Quay lại Bước 2 cho đến khi không còn đường đi nữa thì thuật toán
dừng lại, trả về giá trị chu vi của đối tượng
Để giải quyết được bài toán này, chúng ta áp dụng thuật toán tìm kiếm theo chiều
điểm ảnh thuộc biên của đối tượng nhằm mục đích tính chu vi của cụm đó hoặc đếm các điểm ảnh để tính diện tích của cụm.
Giả sử điểm đang xét là Ei,j, xung quanh điểm này sẽ có 8 hướng để đi tiếp, các điểm này là A, B, C D, F, G, H, I hoặc 4 hướng khác là B, D, H, F. Tùy theo từng đặc điểm bài toán mà chúng ta cần xác định duyệt 4 hướng hay 8 hướng. Đối với bài toán này, chúng ta sử dụng cách duyệt 4 hướng kế cận để tiện cho việc tính chu vi đối tượng(xem Bảng 4.3).