Tiến trình thực hiện fusion

Trước tiên, ta chọn các ảnh MODIS được tải từ trang web http://earthobservatory.nasa.gov. Các ảnh được lựa chọn theo từng chủ đề chẳng hạn: giám sát cháy rừng, động đất, thời tiết, lũ lụt.

Ảnh được chọn cho thực nghiệm này là ảnh trong hình 7.3.

Chương trình mô phỏng sử dụng trộn ba ảnh vào để thực hiện cả hai cấu trúc của fusion là cấu trúc thứ bậc và cấu trúc tổng hợp. Các ảnh vào phải có cùng kích thước để việc xác định fusion chính xác hơn. Trong trường hợp các ảnh không cùng kích thước, phải cắt bỏ bớt dòng hay cột đối với các ảnh có kích thước lớn hơn, hoặc tăng dòng hay cột đối với ảnh có kích thước nhỏ hơn, sao cho các ảnh có kích thước bằng nhau trước khi trộn ảnh. Điều này dẫn đến việc ảnh sẽ không còn chính xác để fusion. Đó là lý do tại sao phải chọn ảnh có kích thước bằng nhau.

7.3.2 Chuyển ảnh màu thành ảnh xám

Đơn vị tế bào của ảnh số là pixel. Tùy theo mỗi định dạng là ảnh màu hay ảnh xám mà từng pixel có thông số khác nhau. Đối với ảnh màu từng pixel sẽ mang thông tin của ba màu cơ bản tạo ra bản màu đó là đỏ (R), xanh lá (G) và xanh biển (B). Trong mỗi pixel của ảnh màu, ba màu cơ bản R, G và B được bố trí sát nhau và có cường độ sáng khác nhau. Thông thường, mỗi màu cơ bản được biểu diễn bằng tám bit tương ứng 256 mức độ màu khác nhau. Như vậy mỗi pixel sẽ có 28x3 = 224 màu (khoảng 16.78 triệu màu). Đối với ảnh xám, thông thường mỗi pixel mang thông tin của 256 mức xám (tương ứng với tám bit), ảnh xám hoàn toàn có thể tái hiện đầy đủ cấu trúc của một ảnh màu tương ứng thông qua tám mặt phẳng bit theo độ xám.

Trong hầu hết quá trình xử lý ảnh, các nhà nghiên cứu chủ yếu chỉ quan tâm đến cấu trúc của ảnh và bỏ qua ảnh hưởng của yếu tố màu sắc. Do đó bước chuyển từảnh màu thành ảnh xám là một công đoạn phổ biến trong các quá trình xử lý ảnh, vì nó làm tăng tốc độ xử lý và giảm mức độ phức tạp của các thuật toán trên ảnh.

Công thức chuyển các thông số giá trị màu của một pixel thành mức xám tương ứng theo công thức (7.1):

B G

R C C

G=α. +β. +δ. (7.1)

trong đó các giá trị CR, CG, và CB lần lượt là các mức độ màu đỏ, xanh lá và xanh biển của pixel màu. Các hệ số α, β, δ là các giá trị thay đổi tùy thuộc hệ màu. Xem

ảnh nguồn như một mảng hai chiều, duyệt qua từng pixel phần tử của mảng để thu được ảnh xám.

Do vậy, với các vấn đềđược đề cập ở trên, chương trình mô phỏng sẽ chuyển các ảnh vào thành ảnh xám như trong hình 7.3b trước khi tiến hành các bước tiếp theo.

7.3.3 Làm mờảnh vào

Việc làm mờ ảnh là nhờ vào hàm Gaussian, phương pháp làm mờ này giống như hiệu ứng hình ảnh được đặt dưới một lớp màn trong suốt bị mờ. Trong toán học việc ứng dụng phương pháp mờ Gaussian cho một hình cũng chính là tính tích chập hình đó với hàm Gaussian. Vì biến đổi Fourier của một Gaussian sẽ tạo ra một Gaussian khác cho nên nếu xét trên miền tần số thì phương pháp này sẽ làm giảm các thành phần có tần số cao trong hình, tức là sử dụng bộ lọc thông thấp để lọc tần số cao và giữ lại các thành phần tần số thấp. Phương trình hàm Gaussian dùng trong không gian một chiều và hai chiều được mô tả thông qua hai công thức (7.2) và (7.3) tương ứng. Một chiều: 2 2 2 2 1 ) ( σ πσ x e x G = − (7.2) Hai chiều: 2 2 2 2 2 1 ) , ( σ πσ y x e y x G + − = (7.3)

trong đó, x và y là tọa độ theo hai trục đứng và ngang, σ là phương sai chuẩn của phân tán Gaussian hay là giá trị quyết định độ lệch giữa các điểm trên bề mặt Gaussian. Trong không gian hai chiều, công thức này tạo ra những đường viền là những đường tròn đồng tâm, tuân theo logic phân tán Gaussian từ điểm trung tâm. Giá trị từ hệ thống phân tán này sẽđược sử dụng để xây dựng một ma trận tích chập dùng tính toán phép tích chập với hình ảnh gốc. Giá trị mới của mỗi pixel sau khi tính tích chập với Kernel đại diện cho hàm Gaussian có thể coi là trung bình cường độ mức xám của các pixel xung quanh nó. Ta thấy rằng giá trị cường độ mức xám của phần tử trung tâm Kernel tương ứng với pixel đang xét là lớn nhất, giá trị này sẽ

nhỏ hơn đối với các phần tử tương ứng với những pixel kế cận một cách đối xứng và tỉ lệ thuận với khoảng cách của phần tử này với trung tâm. Tính chất này giúp giữ lại đường viền và biên cũng như làm mờ một cách đồng bộ hơn so với các phương pháp khác. Trong lý thuyết, hàm Gaussian tại mỗi điểm trên hình là khác 0. Điều này có nghĩa là Gaussian Kernel nên có kích thước bằng với hình ảnh và giá trị tại mỗi phần tử luôn khác 0. Tuy nhiên trong thực hành, do việc tính toán dựa trên việc xác định rời rạc về tính xấp xỉ cho nên giá trị của các phần tử trên bề mặt Gaussian ở khoảng cách lớn hơn 3σ so với trung tâm gần như không đáng kể. Do vậy, các phân tán Gaussian ngoài bán kính này sẽ bị bỏ qua, đó cũng là lý do mà thông thường Gaussian Kernel có kích thước giới hạn 3, 5, 7, … Khoảng cách giữa hai điểm gần nhau trong Gaussian Kernel là σ. Với những gì đã trình bày ở trên cũng đã nhắc tới bề mặt ma trận Gaussian, đó chính là hiện thực hóa của hàm Gaussian trong thực nghiệm. Hàm Gaussian được áp dụng vào ảnh thông qua phép tích chập giữa ma trận Gaussian và ma trận điểm ảnh 2 chiều.

Bảng 7.1 là tọa độ vị trí được làm mờ của ba ảnh vào. Hình 7.4 là mô phỏng của ảnh được làm mờ trong thực nghiệm. Phần bị mờđược khoanh vùng bằng các ô vuông. Bảng 7.1: Bảng chọn vị trí kích thước làm mờảnh vào Trục x (1-720) Trục y (1-480) Ảnh mờ x1 x2 y1 y2 Ảnh 1 100 250 120 240 Ảnh 2 270 450 100 220 Ảnh 3 500 620 300 400

Hình 7.4: Mô tả ba ảnh ngõ vào được làm mờ: (a): ảnh gốc, (b): ảnh mờ ngõ vào 1, (c): ảnh mờ ngõ vào 2 và (d): ảnh mờ ngõ vào 3

7.3.4Cộng nhiễu vào ảnh

Chương trình sử dụng hàm cộng nhiễu sau: g = imnoise(f, type, parameters), trong đó f là ảnh ở ngõ vào, type là loại nhiễu sẽđược cộng vào ảnh f và parameters là các thông số liên quan đến loại nhiễu được cộng vào. Hàm imnoise chuyển đổi ảnh ngõ vào sang kiểu double trong phạm vi [0,1] trước khi cộng nhiễu vào nó. Điều này phải được chú ý khi chỉ định các thông số nhiễu. Ví dụ, để cộng nhiễu Gaussian với trung bình 64 và phương sai 400 vào một ảnh kiểu unit8 thì phải thay đổi giá trị trung bình thành 64/255 và phương sai thành 400/255 để đưa vào ngõ vào của hàm imnoise. Có nhiều loại nhiễu khác nhau tác động vào các bức ảnh, mỗi loại sẽ có những biểu hiện khác nhau. Trước tiên, để cộng nhiễu vào một bức ảnh ta sử dụng hàm imnoise với cú pháp như trên. Như vậy, nhiễu sẽ cộng vào ảnh f, trong đó d là mật độ nhiễu (nghĩa là phần trăm diện tích của ảnh chứa các giá trị nhiễu). Ngoài ra, tạo ra nhiễu ngẫu nhiên không gian cần phải có một hàm phân bố cụ thể. Thông thường, chương trình cần phải có khả năng tạo ra các loại nhiễu và các thông số không có trong hàm imnoise. Các giá trị của nhiễu không gian là các con số ngẫu

nhiên, chúng được miêu tả bởi một hàm mật độ xác suất hoặc một cách tương đương bởi hàm phân bố tích lũy tương ứng. Sự tạo ra số ngẫu nhiên cho các loại phân bố được chú trọng tuân theo một vài quy luật khá đơn giản từ lý thuyết xác suất. Nhiều bộ tạo số ngẫu nhiên tạo ra các số ngẫu nhiên với một hàm phân bố tích lũy trong khoảng (0,1).

Các bước tạo nhiễu, chẳng hạn nhiễu Gaussian như sau: - Bước 1: Chuyển đổi ảnh màu RGB sang ảnh mức xám. - Bước 2: Tạo ma trận nhiễu Gauss.

- Bước 3: Tạo hàm tán xạđiểm ảnh (Point Spread function - PSF) từ ma trận nhiễu Gauss. Trong công việc xử lý ảnh có một khái niệm là hàm tán xạ điểm ảnh PSF. Khái niệm này tương tự như là đáp xung trong những tín hiệu một chiều. Tín hiệu vào sẽ được nhân chập với PSF để thu được tín hiệu ở đầu ra. PSF có thể biểu diễn dưới dạng ma trận và có thể coi là các mặt nạ. Giả sử mặt nạ này lướt qua tất cả các điểm trên ảnh gốc, và điểm chịu tác động là điểm nằm ở trung tâm mặt nạ này. Một hàm PSF rất phổ biến đó là hàm Gaussian. Mặt nạ Gauss là mặt nạ hình vuông.

7.3.5 Quá trình lọc nhiễu

Dựa vào lý thuyết đã trình bày trong chương 5, quá trình lọc nhiễu được chia ra làm 2 trường hợp. Trường hợp thứ nhất là lọc nhiễu ảnh ngõ vào trước khi fusion. Trường hợp thứ hai là lọc nhiễu ảnh sau khi fusion. Quá trình lọc được thực hiện thông qua 3 loại lọc: lọc nhiễu Gaussian sử dụng bộ lọc Wiener, lọc nhiễu muối tiêu sử dụng bộ lọc Median và lọc nhiễu speckle sử dụng bộ lọc Rank.

Mô hình của fusion nhiều bộ cảm ứng

Đánh giá khách quan sự đáp ứng fusion