Trong giai đoạn tiền xử lý ảnh đối với ảnh viễn thám ở đây, chúng ta phải thực hiện các phƣơng pháp để tăng cƣờng và khôi phục ảnh. Tăng cƣờng ảnh là nhằm hoàn thiện các đặc tính của ảnh nhƣ:
- Lọc nhiễu, hay làm trơn ảnh,
- Tăng độ tƣơng phản, điều chỉnh mức xám của ảnh, - Làm nổi biên ảnh.
Khôi phục ảnh là phục hồi ảnh gốc so với ảnh thu thập đƣợc bị biến dạng. Nói cách khác, khôi phục ảnh là các kỹ thuật cải thiện chất lƣợng những ảnh ghi đảm bảo gần đƣợc nhƣ ảnh thật khi ảnh bị méo. Để khôi phục ảnh có kết quả, điều cần thiết là phải biết đƣợc các nguyên nhân, các hàm (hay dạng) gây ra biến dạng ảnh. Các nguyên nhân biến dạng thƣờng do: Đầu thu ảnh chất lƣợng kém, do môi trƣờng, ánh sáng, hiện trƣờng, khí quyển, nhiễu xung và do chất lƣợng.
2.2.1. Khử sương mù
Đối với ảnh vệ tinh thì một trong những vấn đề chính gây nhiễu ảnh đó là sƣơng mù, việc khử sƣơng mù đối với ảnh vệ tinh là một trong những việc rất quan trọng. Trong [23] tác giả đề xuất một phƣơng pháp khử sƣơng mù đơn giản đó là dò tìm điểm tối, đây là phƣơng pháp hiệu quả để loại bỏ sƣơng mù trong ảnh có sƣơng mù. Điểm tối là điểm ảnh trong ảnh không bị ảnh hƣởng bởi sƣơng mù với giá trị trong tất cả các kênh màu RGB gần với không. Với phƣơng pháp này, thuật toán đề xuất có thể ƣớc lƣợng một cách hiệu quả độ dày sƣơng mù và tìm lại một cảnh không bị ảnh hƣởng bởi sƣơng mù là một cách rõ ràng thậm chí cả khi đối tƣợng cảnh vốn tƣơng tự với ánh sáng không khí trên một vùng rộng. Ngoài ra, thuật toán ở đây nhanh và với chất lƣợng khử sƣơng mù tốt.
2.2.2. Tăng cường ảnh
Sau khi khử sƣơng mù, vấn đề tiếp theo đó là nâng cao chất lƣợng của ảnh vệ tinh (hay gọi là tăng cƣờng ảnh). Theo [5] các kĩ thuật tăng cƣờng ảnh chia làm ba loại. Một là, họ các kĩ thuật histogram mà tiêu biểu là cân bằng histogram và đặc tả histogram. Hai là, họ các kỹ thuật dựa trên tiếp cận logic mờ. Ba là, các kĩ thuật
Hình 2.2.Hình: Ảnh trái là ảnh sƣơng mù đầu vào, Phải là kết quả khử sƣơng mù
tăng cƣờng dựa trên tối ƣu. Trong phạm vi luận văn, sử dụng phƣơng pháp tăng cƣờng ảnh viễn thám dựa trên cân bằng histogram.
Ý tƣởng: Tìm một phép biến đổi phi tuyến g=T(f) áp dụng cho mỗi pixel của ảnh f(x,y), để cho g(x,y) phân bố đều.
Phƣơng pháp trải qua các bƣớc nhƣ sau:
Bƣớc 1: Tính số lần xuất hiện pixel i trong hình ảnh px(i)= ni 0 ≤ i < L
Trong đó L là số mức xám trong hình ảnh (thƣờng là 256) Bƣớc 2: Tính hàm phân phối tích lũy cdf(i)
cdfx(i)= ∑
Bƣớc 3: Tính lại mức xám của ảnh y sau khi cân bằng histogram từ ảnh x y(i)= (
)
Trong đó M*N là số ảnh của điểm ảnh
2.3. Phân đoạn ảnh
Phân đoạn ảnh là quá trình hòa nhập các điểm ảnh có các đặc tính tƣơng tự vào cùng một nhóm. Ảnh phân đoạn do đó là hợp của các nhóm phân biệt, tại đó các điểm ảnh của các vùng đồng nhất đƣợc kết hợp đến cùng nhóm.
Sau khi tiền xử lý, sử dụng thuật toán K-means là một trong những phƣơng pháp học máy không giám sát đơn giản mà giải quyết về vấn đề phân đoạn nổi tiếng [9]. K-means là thuật toán K-mean là thuật toán rất quan trọng và đƣợc sử dụng phổ biến trong kỹ thuật phân cụm với khả năng cài đặt dễ dàng và độ phức tạp tuyến tính. Tƣ tƣởng chính của thuật toán K-mean là tìm cách phân nhóm các đối tƣợng đã cho vào K cụm (K là số các cụm đƣợc xác định trƣớc, K nguyên dƣơng) sao cho tổng bình phƣơng khoảng cách giữa các đối tƣợng đến tâm nhóm là nhỏ nhất.
Bài toán phân cụm dữ liệu bằng thuật toán K-means được trình bày như sau:
Cho tập các điểm D={x1, x2,....,xn},
Trong đó xi=(xi1,xi2,...,xir) là một vector có r chiều trong không gian Rr, và r là một thuộc tính của tập dữ liệu D.
Giải thuật K-mean phân cụm dữ liệu dựa trên khoảng cách Euclid nhỏ nhất giữa đối tƣợng đến phần tử trung tâm của các nhóm
Khoảng cách Euclid:
Ta giả sử nhƣ sau:
xi= (xi1,xi2,...,xir) là đối tƣợng thứ i cần phân loại (i=1..n). cj= (cj1,cj2,...,cjr) là phần tử trung tâm nhóm j (j=1..r)
Trong đó:
ij là khoảng cách Euclid từ ai đến cj xis là thuộc tính thứ s của đối tƣợng xi
xjs là thuộc tính thứ s của phần tử trung tâm cj.
Phần tử trung tâm của nhóm đƣợc xác định bằng giá trị trung bình của các phần tử trong nhóm.
Phần tử trung tâm:
Chọn ngẫu nhiên k phần tử trung tâm (k nhóm), sau mỗi lần gom nhóm các đối trƣợng, phần tử trung tâm đƣợc tính toán lại.
Clusteri{x1,x2,...,xt} – nhóm thứ i
i=1...k, k số nhóm cần phân cụm; j=1...r, r số thuộc tính. t: số phần tử hiện của của nhóm thứ i;
xsj: thuộc tnhs thứ j của phần tử s, s=1..t; cij: tọa độ thứ j của phần tử trung tâm nhóm i;
Giải thuật K-means:
1. Chọn ngẫu nhiên K tâm (center) của K cụm (cluster).
2. Tính toán khoảng cách từ tâm tới tất cả các đối tƣợng (thƣờng dùng khoảng cách Euclid).
3. Nhóm đối tƣợng vào các nhóm gần nhất dựa trên khoảng cách.
5. Lặp lại bƣớc 2, 3, 4 cho tới khi hội tụ.
Trong nghiên cứu này, chúng tôi chọn số cụm K=5; đối tƣợng phân cụm chính là giá trị điểm ảnh (pixels); nhƣ vậy việc phân đoạn ảnh dựa trên phân cụm màu của các điểm ảnh.
2.4. Phát hiện đám cháy sử dụng ảnh MODIS
Trong luận văn sử dụng phƣơng pháp phát hiện điểm cháy đƣợc Giglio và cộng sự phát triển năm 2003 [12], thuật toán là một cải tiến dựa trên thuật toán phát hiện điểm cháy gốc của Kuafman et al năm1998 [14]
Ảnh MODIS đƣợc cung cấp dƣới định dạng HDF file, trong mỗi file chứa nhiều băng của ảnh MODIS và ảnh sản phẩm của chúng.Tuy nhiên, việc phát hiện điểm nóng/cháy sẽ chỉ sử dụng một số băng này
Băng 21 và băng 22: Cảm biến MODIS thu đƣợc 2 kênh 4-µm là kênh 21 và kênh 22 tƣơng ứng với băng 21 và băng 22 ở trên. Cả 2 kênh kể trên đều đƣợc sử dụng trong giải thuật phát hiện điểm cháy từ ảnh MODIS. Trong đó kênh 21 sẽ bão hòa ở nhiệt độ 500k (giá trị điểm ảnh tại vị trí có nhiệt độ sáng vƣợt quá 500K sẽ coi nhƣ không có giá trị); kênh 22 sẽ bão hòa nếu nhiệt độ sáng vƣợt quá ngƣỡng 331K. Do nhiệt độ bão hòa thấp hơn, ảnh của kênh 22 sẽ ít bị nhiễu và có it lỗi lƣợng tử hơn. Những ƣu điểm này khiến cho dữ liệu điểm ảnh của kênh 22 sẽ đƣợc sử dụng bất kì khi nào có thể. Trong một vài trƣờng hợp, khi dữ liệu của kênh 22 bị mất, hoặc không thu đƣợc giá trị, nó sẽ đƣợc thay thế bằng dữ liệu thu đƣợc từ kênh 21. Do đó, ta sẽ chỉ sử dụng kí hiệu T4 để thay cho nhiệt độ sáng thu đƣợc từ ảnh
MODIS 4-µm. Cƣờng độ bức xạ của 2 kênh này lần lƣợt là 0.65 và 0.86
Băng 31: đƣợc tính toán từ kênh 11-µm (băng 31) bão hòa khi nhiệt độ sáng đạt 400 K đối với Terra MODIS và 340K đối với Aqua MODIS. Nhiệt độ sáng của băng 31 đƣợc kí hiệu bằng T11 và cƣờng độ bức xạ là 2.1
Mục đích của thuật toán là nhận diện những điểm ảnh mà một hoặc nhiều đám cháy đang hoạt động tại thời điểm vệ tinh đi qua; những điểm ảnh này đƣợc gọi là “điểm cháy”.
2.4.1. Phát hiện điểm cháy tiềm tàng.
Mục đích của giải thuật là phát hiện những điểm ảnh mà tại đó có một hoặc nhiều đám cháy đang diễn ra tại thời điểm mà vệ tinh thu đƣợc ảnh. Những điểm ảnh nhƣ vậy sẽ đƣợc coi là điểm nóng/cháy.Việc xác định xem một điểm ảnh có phải là điểm nóng/cháy hay không về cơ bản sẽ dựa trên việc gia tăng đột của nhiệt độ sáng của kênh 4-µm so với kênh 11-µm. Tuy nhiên, việc đƣa ra kết luận một điểm có phải là điểm nóng/cháy hay không lại không đơn giản nhƣ vây. Giải thuật đƣợc áp dụng vào việc xác định điểm nóng/cháy cũng đồng thời phân loại các điểm ảnh thành các lớp: không có dữ liệu, mây, nƣớc, không phải điểm cháy, điểm cháy, hoặc không xác định đƣợc. Những điểm ảnh không mang dữ liệu hợp lệ ngay lập tức sẽ đƣợc đƣa vào nhóm lỗi dữ liệu. Những điểm ảnh đƣợc phân loại là nƣớc và mây ở trên sẽ đƣợc đƣa vào các nhóm nƣớc và mây tƣơng ứng. Các công đoạn về sau của giải thuật sẽ chỉ xét đến những điểm ảnh còn lại.
Giải thuật phát hiện điểm nóng/cháy, một bộ phân lớp sơ bộ đƣợc áp dụng để loại bỏ những điểm rõ ràng không phải là điểm nóng/cháy, và giữ lại những điểm có khả năng gọi là điểm nóng/cháy tiềm tàng. Qua thực nghiệm, ta rút ra đƣợc những điểm đƣợc coi là điểm cháy tiềm tàng nếu nó thỏa mãn những điều kiện sau:
ρ0.86 <0.3 ,T4 > 310 K và ∆T> 10K (điểm cháy ban ngày)
ρ0.86 <0.3 ,T4 > 305 K và ∆T> 10K (điểm cháy ban đêm) trong đó ∆T = T4 - T11
Những điểm ảnh nào không trải qua những test sơ bộ trên sẽ đƣợc phân loại là không cháy.
2.4.2. Ngưỡng xác định điểm nóng/cháy
Trong giải thuật này những điểm đƣợc coi là điểm cháy/nóng ngay lập tức nếu nó thỏa mãn:
T4> 360 K (điểm ảnh ban ngày) hoặc
(1)
T4> 320 K (điểm ảnh ban đêm)
Mặc dù ngƣỡng ban ngày cao, ƣu điểm của nó là đủ để loại bỏ các điểm chói sáng, nếu không báo động sai do ánh sáng phản chiếu có thể gây ra. Điểm ảnh ban đêm là những điểm có góc chiếu mặt trời ≥ 85o
2.4.3. Đặc tả nền điểm cháy
Năng lƣợng bức xạ của một điểm cháy tiềm tàng đƣợc ƣớc lƣợng thông qua các điểm ảnh lân cận với điểm cháy tiềm tàng. Để thực hiện điều này, các điểm ảnh đƣợc gọi là hợp lệ nằm trong một cửa sổ có tâm là điểm cháy tiềm tàng đƣợc xem xét. Điểm ảnh hợp lệ là (1) những điểm có các quan sát khả dụng, (2) nằm trên mặt đất, (3) không bị che bởi mây và (4) không phải điểm cháy nền. Điểm cháy nền định nghĩa là những điểm có T4 >325 K và ∆T>20 K đối với ban ngày và T4 >310 K và ∆T>10 K đối với ban đêm.
Cửa sổ này sẽ bắt đầu từ kích thƣớc 3x3 bao quanh một điểm cháy/nóng tiềm tàng (các điểm cháy/nóng tiềm tàng là kết quả của chuyên đề II.3.1).Cửa sổ này sẽ tăng cho đến khi ít nhất 25% số điểm ảnh trong cửa sổ là hợp lệ, và số điểm ảnh hợp lệ không nhỏ hơn 8, hoặc tăng đến kích thƣớc cực đại là 21x21.Trong bƣớc này, việc xử lý hiệu ứng “bowtie” của ảnh MODIS cũng đƣợc áp dụng.Việc cửa sổ 21x21 pixel đƣợc áp dụng đảm bảo rằng vùng đƣợc xét nằm trong khu vực xấp xỉ 20km quanh điểm nóng/cháy tiềm tàng.
Những điểm hợp lệ trong cửa sổ sẽ đƣợc đếm và kí hiệu bằng NV. Bên cạnh
đó những điểm cháy nền (Nf) và những điểm nƣớc (Nw) cũng đƣợc đếm trong cửa sổ.
Nếu nhƣ số điểm ảnh hợp lệ đếm đƣợc thỏa mãn, ta tiếp tục tính toán một vài con số thống kê sử dụng những con số này nhƣ trung bình chung (̅), trung bình độ
lệch tuyệt đối(δ4) cho ảnh MODIS 4-µm; và tính những thông số tƣơng tự cho ảnh
MODIS 11-µm là ̅̅̅̅ và δ4; và dộ chênh lệch nhiệt giữa kênh 4-µm và 11-µm là ̅̅̅̅
và δ∆T. Hai thông số cuối dùng đƣợc dùng để loại bỏ những cảnh báo sai đƣợc tính
từ những điểm cháy nền đƣợc kí hiệu là ̅ và . Những thông số này sẽ đƣợc sử
dụng ở trong việc kiểm tra ngữ cảnh
2.4.4. Kiểm tra dựa vào ngữ cảnh
Nếu nhƣ đặc tả nền thành công (số lƣợng điểm ảnh lân cận đủ lớn), một số kiểm tra ngƣỡng theo ngữ cảnh đƣợc sử dụng để phát hiện đám cháy. Những bộ lọc ngƣỡng này sẽ tìm kiếm những đặc điểm nổi trội của điểm cháy của nhiệt độ sáng trên băng 4-µm (T4) và sự khác biệt giữa băng 4- và 11-µm (∆T) thu đƣợc một cách
ổn định từ điềm nền không cháy. Các kiểm tra này nhƣ sau:
∆T > ̅̅̅̅ + 3.5 δ∆T (2)
∆T > ̅̅̅̅ + 6 K (3)
T4>̅ + 3 δ4 (4)
T11>̅̅̅̅ + δ11 – 4 K (5)
> 5 K (6)
Ba điều kiện đầu tiên cô lập những điểm cháy/nóng khỏi những điểm không cháy nền. Tham số 3.5 ở (2) lớn hơn so với tham số 3 ở (4) để điều chỉnh cho tự tƣơng quan từng phần giữa băng 4- và 11-µm. Điều kiện (5), giới hạn dùng với những điểm ảnh ngày, dùng để loại bỏ những điểm ảnh mây đối lƣu. Những điểm
ảnh này thƣờng bức xạ nhiệt cao ở kênh 4-µm (do việc phản xạ mặt trời) nhƣng lại yếu ở kênh nhiệt 11-µm. Nó cũng giúp giảm thiểu những lỗi cảnh báo sai ở điểm
không đƣợc phát hiện trong cửa sổ. Tuy nhiên, bất kỳ bộ lọc nào sử dụng δ11 đều phải đối mặt với việc loại bỏ một lƣợng lớn những điểm nóng/cháy, do những điểm nóng/cháy này sẽ làm gia tăng sự thay đổi nền rõ rệt. Ví dụ: ở một bề mặt đất nền bình thƣờng δ11 ~ 1 K, trong khi đó những vùng phủ đất trải trên một khu vực cháy rừng rộng sẽ có δ11 thƣờng xuyên vƣợt ngƣỡng 20 K. Vì lý do đó, test (6) đƣợc đƣa vào để loại bỏ test (5) trong trƣờng hợp cửa sổ nền chứa một đám cháy lớn. Điều kiện này đƣợc nhận biết bởi sự gia tăng cao của . Sự xuất hiện của những điểm cháy nền làm cho những con số thống kê này gia tăng đáng kể.
2.4.5. Phát hiện điểm cháy tạm thời.
Với những điểm ảnh đêm thì có thể dễ dàng đƣa ra quyết định, những điểm ảnh ngày sẽ phải trải qua 3 bƣớc loại bỏ cảnh báo sai nữa: chói sáng mặt trời, bề mặt sa mạc, đƣờng bờ biển.
Những điểm ảnh ban ngày sẽ đƣợc phân loại là điểm cháy nếu nó thỏa mãn (2)(3)(4) và (5) hoặc (6); trong khi đó những điểm ảnh ban đêm sẽ đƣợc coi là điểm cháy nếu nó thỏa mãn (2)(3)(4).Các điểm còn lại sẽ đƣợc phân loại là điểm không cháy.
Ta có tóm tắt sau:
Điểm ảnh ban ngày đƣợc coi là điểm cháy nếu: (1) Thỏa mãn
Hoặc
(2) (3) (4) thỏa mãn và [(5) hoặc (6) thỏa mãn Điểm cháy ban đêm đƣợc coi là điểm cháy nếu:
(1) Thỏa mãn Hoặc
Với những điểm ảnh không vƣợt qua đƣợc bƣớc phân loại nền sẽ chỉ áp dụng (1). Nếu tiếp tục không vƣợt qua đƣợc (1), điểm ảnh đó sẽ đƣợc phân loại là không khả dụng, hay là giải thuật không thể xác định đƣợc loại của điểm ảnh.
2.4.6. Loại bỏ ánh sáng phản chiếu
Ánh sáng mặt trời chiếu trên nƣớc, đất ẩm, mây và trong một vài trƣờng hợp đặc biệt có thể gây ra việc xác định điểm cháy sai. Ánh nắng phản chiếu đƣợc loại bỏ dựa trên phƣơng pháp của Giglio et al [11] bằng cách sử dụng θg là góc giữa vector chiếu từ bề mặt lên vệ tinh và tia phản xạ tự nhiên.
cosθg = cos θv cos θs - sin θvsin θscosφ
Trong đó, θv là góc nhìn và θs là góc thiên đỉnh và φ là góc phƣơng vị tƣơng đối. Tại đây, ta tiến hành đếm số điểm ảnh là nƣớc trong số 8 điểm xung quanh điểm đang xét (Naw). Sau đó tiến hành tính toán những thông số sau:
θg < 20 (7)
θg < 80 và ρ0.65 > 0.1 và ρ0.86> 0.2 và
ρ2.1> 0.12
(8)
θg < 120 và (Naw + Nw) > 0 (9)
Nếu nhƣ một trong số 3 điều kiện trên thỏa mãn, thì điểm nóng/cháy đang xét sẽ bị coi là điểm chói sáng mặt trời và ngƣợc lại đƣợc coi là không cháy. Điều kiện (7) sẽ loại bỏ tất cả những điểm ảnh nào nằm trong vùng bị chói sáng mạnh Điều kiện (8) ít nghiêm ngặt hơn, sẽ tìm kiếm sự phù hợp ở các băng khác nhau về các đặc tính của chói sáng mặt trời. Điều kiện (9), loại bỏ những điểm cháy tạm thời đƣợc tìm thấy gần khu vực có nƣớc và gần cùng có chói sáng mặt trời.
2.4.7. Loại bỏ cảnh báo sai ở đường biên sa mạc
Để loại bỏ những cảnh báo sai trên đƣờng biên sa mạc, một giải thuật để xác định những trƣờng hợp mà ở đó điểm cháy nền bị loại là những điểm ảnh thuộc