1. Trang chủ
  2. » Luận Văn - Báo Cáo

(LUẬN văn THẠC sĩ) nghiên cứu và đánh giá các phương pháp nội suy ảnh viễn thám cho bài toán phân loại lớp phủ đô thị tại việt nam luận văn ths máy tính 604801

63 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 63
Dung lượng 1,96 MB

Cấu trúc

  • 1. CHƯƠNG I. TỔNG QUAN (12)
    • 1.1.1. Nguyên lý thu nhận dữ liệu viễn thám (12)
    • 1.1.2 Phân loại viễn thám (14)
    • 1.1.3 Các đặc trưng cơ bản của ảnh viễn thám (15)
    • 1.1.4 Một số loại dữ liệu viễn thám nghiên cứu trong luận văn (17)
    • 1.1.5 Một số vấn đề trong tiền xử lý dữ liệu ảnh vệ tinh (20)
    • 1.2 Bài toán phân loại lớp phủ đô thị ở Việt Nam và các vấn đề trong tiền xử lý dữ liệu ảnh đầu vào (22)
      • 1.2.1 Dữ liệu đầu vào trong bài toán phân loại lớp phủ đô thị tại Việt Nam (23)
      • 1.2.2 Các vấn đề trong tiền xử lý ảnh bài toán phân loại lớp phủ đô thị tại Việt (24)
    • 1.3. Bài toán nghiên cứu đặt ra trong luận văn (25)
      • 1.3.1 Một số nghiên cứu về phương pháp nội suy (25)
      • 1.3.2 Bài toán nghiên cứu (27)
      • 1.3.3 Ý nghĩa khoa học (28)
      • 1.3.4 Ý nghĩa thực tiễn (28)
    • 1.4. Kết luận (28)
  • 2. Chương 2 CÁC PHƯƠNG PHÁP NỘI SUY ẢNH (30)
    • 2.1 Các khái niệm trong nội suy ảnh (30)
      • 2.1.1 Điểm ảnh (30)
      • 2.1.2 Mức xám của ảnh (30)
      • 2.1.3 Độ phân giải điểm ảnh (30)
      • 2.1.4 Quan hệ giữa các điểm ảnh (31)
      • 2.1.5 Khoảng cách giữa các điểm ảnh (32)
      • 2.1.6 Khái niệm tái chia mẫu ảnh (Image Resampling) (32)
      • 2.1.7 Khái niệm nội suy ảnh (33)
    • 2.2 Một số vấn đề trong nội suy ảnh (34)
    • 2.3 Một số phương pháp nội suy ảnh (35)
      • 2.3.1 Nội suy láng giềng gần nhất - Nearest Neighbor Interpolation (35)
      • 2.3.2 Nội suy song tuyến tính - Bilinear Interpolation (37)
      • 2.3.3 Nội suy xoắn bậc ba – Cubic Convolution (Bicubic) (38)
    • 2.4 Các chỉ số đánh giá, so sánh chất lượng ảnh (39)
      • 2.4.1 Sai số bình phương trung bình (MSE) (39)
      • 2.4.2 Tỷ số tín hiệu cực đại/ nhiễu (PSNR) (40)
      • 2.4.3 So sánh sự tương đồng cấu trúc (SSIM) (40)
  • 3. Chương MÔ HÌNH THỰC NGHIỆM ĐÁNH GIÁ TÁC ĐỘNG CỦA PHƯƠNG PHÁP NỘI SUY ẢNH VỆ TINH (0)
    • 3.1 Lựa chọn công cụ trong thực nghiệm (42)
    • 3.2 Thực nghiệm đánh giá tác động của các phương pháp nội suy với ảnh vệ tinh ánh sáng ban đêm DMSP–OLS 2013 và ảnh vệ tinh bề mặt không thấm nước ISA 2010 (43)
      • 3.2.1. Trích xuất dữ liệu khu vực Việt Nam (44)
      • 3.2.2 Thực nghiệm và đánh giá kết quả (44)
    • 3.3. Đánh giá tác động của các kỹ thuật nội suy trong tiền xử lý dữ liệu ảnh viễn thám đến kết quả bài toán phân loại lớp phủ đô thị tại Việt Nam (51)
      • 3.3.1 Tính toán ngưỡng phân lớp và thực nghiệm (52)
      • 3.3.2 Kết quả (56)
  • KẾT LUẬN (58)
  • TÀI LIỆU THAM KHẢO (60)

Nội dung

CHƯƠNG I TỔNG QUAN

Nguyên lý thu nhận dữ liệu viễn thám

Viễn thám là công nghệ được sử dụng để xác định và nhận diện đối tượng cũng như các điều kiện môi trường dựa trên những đặc trưng riêng của phản xạ và bức xạ.

Sóng điện từ phản xạ và bức xạ từ vật thể cung cấp thông tin quan trọng về đặc tính của đối tượng Ảnh viễn thám ghi lại năng lượng bức xạ tại các bước sóng cụ thể, cho phép thu thập dữ liệu về các vật thể Việc đo lường và phân tích năng lượng phản xạ từ ảnh viễn thám giúp tách biệt thông tin hữu ích về các loại lớp phủ mặt đất khác nhau, nhờ vào sự tương tác giữa bức xạ điện từ và vật thể.

Hình 1.1 Sơ đồ hệ thống viễn thám

Hệ thống viễn thám bao gồm bảy yếu tố chính, bắt đầu với nguồn năng lượng hay nguồn chiếu sáng, thường là bức xạ mặt trời, cung cấp năng lượng cho đối tượng mục tiêu Tiếp theo, sự bức xạ và khí quyển đóng vai trò quan trọng khi năng lượng di chuyển từ nguồn phát đến đối tượng, tương tác với lớp khí quyển Khi năng lượng xuyên qua khí quyển và tiếp xúc với mục tiêu, sự tương tác này phụ thuộc vào đặc tính của đối tượng và sóng điện từ, dẫn đến sự phản xạ hay bức xạ khác nhau từ các đối tượng Cuối cùng, bộ cảm biến ghi lại năng lượng sóng điện từ do các vật thể phản xạ hoặc bức xạ, cho phép thu thập dữ liệu quan trọng cho phân tích viễn thám.

Bộ cảm biến, bao gồm máy chụp ảnh và máy quét, được gắn trên các vật mang như máy bay, khinh khí cầu, tàu con thoi hoặc vệ tinh Dữ liệu ghi nhận từ bộ cảm biến sẽ được truyền đến trạm thu nhận và xử lý, nơi dữ liệu được chuyển đổi thành ảnh dưới dạng hardcopy hoặc ảnh kỹ thuật số Hình ảnh thu nhận sẽ được giải đoán và phân tích bằng các chương trình tự động hoặc kinh nghiệm của chuyên gia để trích xuất thông tin về đối tượng mục tiêu Các thông tin này giúp hiểu rõ hơn về đối tượng mục tiêu và đưa ra các ứng dụng giải quyết vấn đề cụ thể.

Phân loại viễn thám

a Phân loại theo nguồn tín hiệu

Viễn thám chủ động là phương pháp thu thập dữ liệu từ xa, trong đó nguồn năng lượng được cung cấp từ các thiết bị nhân tạo, thường là máy phát được lắp đặt trên các phương tiện bay Các hệ thống như Radar và Lidar là những ví dụ tiêu biểu cho viễn thám chủ động, sử dụng tia sáng phát ra từ chính chúng để thực hiện quá trình quan sát và thu thập thông tin.

 Viễn thám bị động (passive): nguồn phát bức xạ là mặt trời hoặc từ các vật chất tự nhiên [7] b Phân loại theo đặc điểm quỹ đạo

Căn cứ vào đặc điểm quỹ đạo vệ tinh, có thể chia ra hai nhóm vệ tinh là:

Vệ tinh địa tĩnh là loại vệ tinh có tốc độ quay tương đương với tốc độ quay của Trái Đất trong một ngày đêm, cho phép vệ tinh giữ vị trí cố định so với bề mặt trái đất.

 Vệ tinh quỹ đạo cực (hay gần cực) là vệ tinh có quỹ đạo nghiêng một góc gần

90° so với mặt phẳng xích đạo của trái đất [7] Góc nghiêng đó gần như không đổi trong suốt quá trình hoạt động

Tốc độ quay của vệ tinh được thiết kế khác biệt so với tốc độ quay của trái đất, nhằm đảm bảo thời gian thu ảnh trên mỗi khu vực trùng với giờ địa phương và thời gian thu lặp lại cố định cho từng vệ tinh Mặc dù vệ tinh quỹ đạo không thể quan sát liên tục như vệ tinh tĩnh, nhưng với độ cao gần trái đất, chúng cung cấp thông tin chi tiết hơn.

Các tham số quỹ đạo như độ cao và góc nghiêng của hai loại vệ tinh được xác định dựa trên các yếu tố quan trắc, cơ học quỹ đạo và nghiên cứu kỹ thuật Ngoài ra, vệ tinh cũng được phân loại theo bước sóng.

 Viễn thám trong dải sóng nhìn thấy (𝜆 = 0,4 ÷ 0,7𝜇𝑚)và hồng ngoại (𝜆 = 0,7 ÷ 3𝜇𝑚) sử dụng nguồn năng lượng chủ yếu là bức xạ mặt trời

Viễn thám hồng ngoại nhiệt (𝜆 = 3 ÷ 4𝜇𝑚) là phương pháp ghi nhận bức xạ nhiệt trong dải sóng hồng ngoại từ 3 đến 14 μm Do cường độ bức xạ nhiệt yếu và bị hấp thụ mạnh bởi khí quyển, việc thu thập tín hiệu nhiệt yêu cầu thiết bị quét nhiệt có độ nhạy cao.

 Viễn thám siêu cao tần: Viễn thám siêu cao tần sử dụng bức xạ siêu cao tần có bước sóng từ một đến vài chục centimet.

Các đặc trưng cơ bản của ảnh viễn thám

1.1.3.1 Khái niệm ảnh số Ảnh số được biểu diễn bởi một mảng hai chiều tập hợp hữu hạn các điểm ảnh (pixel) có cùng kích thước với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật.Mỗi điểm ảnh được xác định bởi toạ độ hàng (m), cột (n) và giá trị mức xám (g) [8].Toạ độ hàng và cột của mỗi pixel đều là các số nguyên

Độ phân giải của ảnh được xác định bởi số điểm ảnh, với ảnh có độ phân giải cao sẽ thể hiện rõ nét các đặc điểm, giúp hình ảnh trở nên thực và sắc nét hơn.

1.1.3.2 Khái niệm ảnh vệ tinh Ảnh vệ tinh hay còn gọi là ảnh viễn thám thường được lưu dưới dạng ảnh số, trong đó năng lượng sóng phản xạ (theo vùng phổ đã được xác định trước) từ các vị trí tương ứng trên mặt đất, được bộ cảm biến thu nhận và chuyển thành tín hiệu số xác định giá trị độ sáng của mỗi pixel Ứng với các giá trị này, mỗi pixel sẽ có độ sáng khác nhau thay đổi từ đen đến trắng để cung cấp thông tin về các vật thể Tùy chọn vào kênh phổ được sử dụng, ảnh vệ tinh được ghi lại theo những dải phổ khác nhau (từ cực tím đến sóng radio) nên người ta gọi là dữ liệu đa phổ, đa kênh, đa băng tần hoặc nhiều lớp

1.1.3.3 Độ phân giải không gian Độ phân giải không gian cho ta biết diện tích nhỏ nhất trên mặt đất mà bộ cảm có thể phân biệt được Ảnh có độ phân giải không gian càng cao khi có kích thước của pixel càng nhỏ Độ phân giải không gian cũng được gọi là độ phân giải mặt đất khi hình chiếu của một pixel tương ứng với một đơn vị chia mẫu trên mặt đất Ví dụ khi nói rằng ảnh vệ tinh có kích thước pixcel là 20 x 20m có nghĩa là một pixcel trên ảnh tương ứng với diện tích 20x20m trên mặt đất [9] Độ phân giải không gian của một ảnh vệ tinh được quyết định bởi hai thông số góc nhìn FOV và góc nhìn tức thì IFOV – được thiết kế sẵn cho mỗi đầu thu

Thông số FOV (Field of View) cho biết phạm vi không gian mà đầu thu có khả năng nhận sóng điện từ từ đối tượng Vệ tinh với góc nhìn lớn sẽ thu được hình ảnh rộng hơn, cho phép quan sát một khu vực lớn hơn.

Thông số IFOV (Instantaneous Field of View) xác định phạm vi không gian mà đầu thu vệ tinh có khả năng nhận sóng điện từ tại một độ cao và thời điểm cụ thể Đầu thu không thể phát hiện các đối tượng nhỏ hơn trong góc nhìn IFOV, và khu vực mà nó thu nhận trên mặt đất quyết định độ phân giải không gian tối đa Các giá trị bức xạ của đối tượng trong góc nhìn IFOV tại cùng một thời điểm được ghi nhận như một điểm ảnh Góc IFOV càng nhỏ thì khả năng phân biệt các đối tượng trong không gian càng cao, dẫn đến giá trị pixel nhỏ hơn và phạm vi ảnh ghi nhận hẹp hơn.

Hình 1.2: Minh họa thông số FOV và IFOV

1.1.3.4 Độ phân giải quang phổ

Các đối tượng dưới mặt đất phản xạ các bước sóng điện từ khác nhau, dẫn đến việc các đối tượng cùng lớp có phổ (độ đen) khác nhau trong các băng phổ khác nhau Ngoài ra, các đối tượng thuộc các lớp khác nhau cũng sẽ có phổ khác biệt trên cùng một băng phổ.

Không phải tất cả các sóng điện từ đều được sử dụng trong thu nhận ảnh viễn thám Mỗi loại đầu thu được thiết kế đặc biệt để thu nhận sóng điện từ trong những khoảng bước sóng nhất định, tùy thuộc vào mục đích thu thập thông tin Các khoảng bước sóng này được gọi là các kênh ảnh.

Ảnh chụp đối tượng trên các kênh khác nhau sẽ mang lại thông tin khác nhau Việc thu thập ảnh từ nhiều kênh sẽ cung cấp nhiều thông tin hơn về đối tượng Số lượng kênh ảnh được gọi là độ phân giải phổ, và độ phân giải phổ càng cao thì thông tin thu thập từ đối tượng càng phong phú.

1.1.3.5 Độ phân giải bức xạ Độ phân giải bức xạ của ảnh được định nghĩa là sự thay đổi nhỏ nhất về độ xám có thể phát hiện được bởi bộ thu, thể hiện độ nhạy tuyến tính của bộ cảm biến trong khả năng phân biệt sự thay đổi nhỏ nhất của cường độ phản xạ sóng từ các vật thể Theo lý thuyết độ phân giải bức xạ của hệ thống viễn thám phụ thuộc vào tỷ số giữa tín hiệu và nhiễu Tuy nhiên, trên thực tế độ phân giải bức xạ của ảnh số được xác định bởi số bậc được sử dụng để biểu diễn giá trị độ xám của mỗi pixel [9] Hiện nay, người ta sử dụng 8bit (256 bậc) để biểu thị giá trị độ xám của mỗi pixel Ảnh có độ phân giải bức xạ càng cao thì sử dụng càng nhiều bậc để biểu diễn giá trị độ xám của pixel và cho phép phân biệt được những thay đổi nhỏ hơn về độ xám của các đối tượng

1.1.3.6 Độ phân giải thời gian

Vệ tinh viễn thám hoạt động trên quỹ đạo và chụp ảnh Trái đất, với thời gian quay lại chụp lại vùng đã chụp phụ thuộc vào quỹ đạo, thường mất từ vài ngày đến vài tuần Khoảng thời gian này được gọi là độ phân giải thời gian của ảnh vệ tinh, giúp cung cấp thông tin chính xác và giải quyết các vấn đề liên quan đến sự biến động của khu vực nghiên cứu.

Một số loại dữ liệu viễn thám nghiên cứu trong luận văn

Từ những năm 1970, lực lượng không quân của Hoa Kỳ đã vận hành chương trình Phòng thủ Vệ tinh khí tượng (Defense Meteorological Satellite Program - DMSP): có

18 vệ tinh quỹ đạo cực có khả năng quan sát mây và các hiện tượng thời tiết khác trong bước sóng hồng ngoại và ánh sáng nhìn thấy Đặc biệt, vào năm 1973, vệ tinh DMSP đã được trang bị hệ thống OLS (DMSP Operational Linescan System), cho phép quan sát Trái Đất ngay cả vào ban đêm.

Vệ tinh DMSP-OLS là hệ thống vệ tinh quỹ đạo cực, hoạt động ở độ cao 850 km và có thời gian quỹ đạo khoảng 101 phút Mục tiêu chính của các vệ tinh này là thu thập dữ liệu liên quan đến bầu khí quyển, đại dương và môi trường mặt trời-địa vật lý của Trái Đất.

Hệ thống OLS là một máy đo phóng xạ dao động, có khả năng theo dõi sự phân bố và nhiệt độ của đám mây hai lần mỗi ngày, vào ban ngày và ban đêm Hệ thống này sử dụng hai dải phổ, bao gồm bước sóng nhìn thấy và hồng ngoại nhiệt, và được trang bị hai kính thiên văn cùng một ống quang tử (PMT) PMT có khả năng phát hiện bức xạ trong vùng bước sóng VIS và hồng ngoại gần từ 0.47-0.95 𝜇𝑚, ngay cả trong điều kiện ánh sáng rất yếu, giúp tạo ra hình ảnh ánh sáng ban đêm.

Vệ tinh DMSP-OLS là một máy quét bức xạ với hai dải quang phổ VIS và TIR, có độ phân giải 2,7km và độ rộng quét 3000km Dải quang phổ VIS ghi nhận bức xạ nhìn thấy và cận hồng ngoại, với độ rộng tối đa 0.58 - 0.91 µm, trong khi dải TIR có độ rộng 10,3-12,9 µm Vệ tinh cung cấp dữ liệu toàn cầu bốn lần mỗi ngày vào các thời điểm bình minh, ban ngày, hoàng hôn và ban đêm, với thời gian chụp ảnh ban đêm là 19:30 Để tăng cường khả năng ghi nhận vào ban đêm, dải phổ VIS sử dụng ống quang tử PMT, chuyển đổi photon thành dòng điện và khuếch đại hàng triệu lần, cho phép phát hiện các nguồn sáng, đám mây, ánh đèn thành phố, khí cháy và ngọn lửa.

Dữ liệu DMSP-OLS được tính trung bình theo khối 5×5 và ảnh được lượng tử hóa với 6 bit Thông số kỹ thuật của vệ tinh DMSP-OLS được trình bày trong bảng 1.1.

Bảng 1.1Một số thông số của vệ tinh DMSP-OLS [12]

Quỹ đạo Vệ tinh quỹ đạo cực, độ cao khoảng

850km, nghiêng 98,8 độ, chu kì quỹ đạo

102 phút Độ rộng của giải quét (Swath) 3000km

Thời điểm chụp ban đêm ~19:30

Tớn hiệu ỏnh sỏng yếu Toàn sắc từ 0.5 - 0.9 àm Vùng phủ trên mặt đất 5km*5km tại điểm thấp nhất Cỏc dải quang phổ khỏc Hồng ngoại nhiệt (10 àm)

Sự bão hòa Phổ biến ở lõi đô thị

Giới hạn phát hiện ánh sáng yếu nhất ~5E-10 Watts/cm2/sr

Hiệu chỉnh Không cho hình ảnh với ánh sáng yếu

Vào giữa năm 1992, Cục Quản lý Đại dương và Khí quyển Quốc gia (NOAA) đã thiết lập kho lưu trữ kỹ thuật số cho chương trình DMSP tại Trung tâm Dữ liệu Địa Vật lý Quốc gia (NGDC) Việc này cho phép sản xuất hình ảnh kỹ thuật số DMSP-OLS bằng cách kết hợp các dải thu hẹp từ các quỹ đạo thu được tại những thời điểm khác nhau.

NGDC đã phát triển một phương pháp hiệu quả để thu thập, chỉnh sửa và tổng hợp một lượng lớn ảnh ban đêm từ DMSP-OLS Phương pháp này sử dụng chuỗi thời gian để phân biệt giữa ánh sáng nhân tạo ổn định từ các thành phố, thị trấn và cơ sở công nghiệp với ánh sáng tạm thời như lửa, pháo sáng và tia sét Đồng thời, dữ liệu nhiễu do mây phủ cũng được loại bỏ để đảm bảo độ chính xác của hình ảnh.

Các ảnh tổng hợp có độ phân giải 30 giây cung (~1000𝑚) Được tổng hợp theo năm (từ năm 1992 – 2013, khi hệ thống DMSP- OLS dừng hoạt động)

Dữ liệu ảnh ánh sáng ban đêm DMSP-OLS do NOAA tổng hợp đã nâng cao khả năng tiếp cận và nghiên cứu, đặc biệt trong việc ứng dụng vào các nghiên cứu đô thị.

Một số các ứng dụng nghiên cứu sử dụng dữ liệu ảnh vệ tinh DMSP-OLS

Dữ liệu ánh sáng ban đêm DMSP-OLS có thể ước tính và cập nhật thông tin nhân khẩu học cũng như kinh tế xã hội của các quốc gia, từ đó nâng cao độ chính xác cho cơ sở dữ liệu dân số toàn cầu trong Dự án Dân số Toàn cầu của LandScan (Dobson và cộng sự, 2000).

Dữ liệu ánh sáng ban đêm từ DMSP-OLS có mối liên hệ chặt chẽ với tổng sản phẩm quốc nội (GDP) và mức tiêu thụ điện năng, từ đó giúp xác định mức độ phát triển kinh tế của một quốc gia Ngoài ra, dữ liệu này còn có thể được sử dụng như công cụ để đo lường khí thải nhà kính, đặc biệt là CO2, ở mức cao.

1.1.4.2 Dữ liệu ảnh bề mặt không thấm nước ISA

Bộ dữ liệu vệ tinh về bề mặt không thấm nước (Impervious Surface Area - ISA) năm 2010 do NOAA phát triển, bao gồm các bề mặt như đường xá, bãi đỗ xe, tòa nhà, lối đi bộ và vỉa hè Dữ liệu ISA có giá trị quan trọng trong việc quản lý và quy hoạch đô thị, hỗ trợ xây dựng cơ sở hạ tầng và phát triển đô thị bền vững, đồng thời cũng hữu ích cho quản lý môi trường, chẳng hạn như đánh giá chất lượng nước và khí thải.

Phương pháp xây dựng bộ dữ liệu ISA năm 2010 được cải tiến từ phiên bản dữ liệu năm 2000-01, nhằm phục vụ cho khu vực bề mặt không thấm nước tại Hoa Kỳ Quá trình xây dựng bộ dữ liệu ISA bắt đầu với việc thu thập các đầu vào quan trọng.

Ảnh vệ tinh ánh sáng ban đêm DMSP/OLS được xây dựng trên lưới 30 giây cung với độ phân giải không gian khoảng 1km Dữ liệu này được thu thập và tổng hợp theo năm dương lịch bởi Trung tâm Dữ liệu Địa Vật lý Quốc gia (NGDC), thông qua việc loại bỏ các giá trị nhiễu và lấy giá trị trung bình.

Dữ liệu LandScan 2004 là bộ dữ liệu ước tính phân bố dân cư, được tổng hợp bởi Phòng thí nghiệm Quốc gia Oak Ridge thuộc Bộ Năng lượng Hoa Kỳ.

Dữ liệu được hiệu chỉnh theo lưới với độ phân giải không gian 1km, trong đó dữ liệu ISA được ước lượng qua phương trình hồi quy tuyến tính Chỉ những ô lưới có mật độ dân số từ 3 trở lên được đưa vào hồi quy, trong khi các khu vực sân bay, khu vực có mật độ dân số cao (trên 3000/km²) và khu vực có ánh sáng cực sáng (DN lớn hơn 800) bị loại trừ khỏi quá trình này Phương trình hồi quy được sử dụng để phân tích dữ liệu.

% bề mặt không thấm nước=0.0795 (radiance) + 0.00868 (population count)

Một số vấn đề trong tiền xử lý dữ liệu ảnh vệ tinh

Quá trình tiền xử lý dữ liệu ảnh vệ tinh thường bao gồm các bước chính: Hiệu chỉnh ảnh, biến đổi ảnh và phân loại hình ảnh

Hình 1.3: Các bước xử lý ảnh vệ tinh thông thường

Hiệu chỉnh ảnh là quá trình quan trọng để khắc phục các lỗi hình ảnh trong ảnh chụp vệ tinh, do nhiều yếu tố như bộ cảm biến, vật mang, bầu khí quyển, thời tiết và mây che phủ Mục tiêu chính của việc này là sửa chữa các sai sót trong quá trình thu thập dữ liệu, giúp giảm thiểu các sai lệch trong cấp độ xám của ảnh Những sai lệch này có thể ảnh hưởng nghiêm trọng đến quá trình phân tích, diễn giải và trích xuất dữ liệu từ ảnh vệ tinh.

Phục hồi hình ảnh là quá trình chỉnh sửa các lỗi như sọc viền và mất dữ liệu theo dải, thường xảy ra do sự cố với bộ cảm biến hoặc lỗi trong quá trình lưu trữ dữ liệu, dẫn đến việc mất thông tin của một dòng pixel.

 Hiệu chỉnh bức xạ: quá trình sử dụng các công thức để chuyển đổi giá trị số (DN) của ảnh thành giá trị phản xạ

 Hiệu chỉnh khí quyển: loại bỏ các hiệu ứng do khí quyển gây ra (tán xạ, hấp thụ)

Hiệu chỉnh hình học là quá trình quan trọng để khắc phục lỗi méo hình học của ảnh vệ tinh, do các yếu tố như đặc tính của bộ cảm, vật mang và sự quay của trái đất gây ra Lỗi này thường dẫn đến sai lệch về vị trí và tỷ lệ giữa tọa độ ảnh và thực tế Để thực hiện hiệu chỉnh hình học, cần lựa chọn lưới chiếu, mô hình phù hợp và áp dụng các phương pháp nắn chỉnh ảnh thông qua nội suy.

 Mosaic: quá trình kết hợp nhiều ảnh thành 1 ảnh duy nhất

Biến đổi hình ảnh là quá trình nâng cao chất lượng hình ảnh bằng cách cải thiện độ phân giải và tăng cường độ tương phản, giúp tạo ra hình ảnh sắc nét hơn Ngoài ra, việc chuyển đổi hệ tọa độ và nén dữ liệu cũng rất quan trọng để phục vụ các bài toán thực tế, từ đó tạo ra bản đồ chuyên đề hoặc cơ sở dữ liệu hiệu quả.

 Phân loại hình ảnh: sử dụng các phương pháp phân lớp, phân đoạn, gắn nhãn, học máy, kết hợp

Các phương pháp nội suy ảnh đóng vai trò quan trọng trong việc hiệu chỉnh hình học ảnh vệ tinh và tăng cường độ phân giải, từ đó nâng cao chất lượng hình ảnh phục vụ cho phân tích và giải đoán Trong bối cảnh nguồn dữ liệu ảnh vệ tinh có độ phân giải cao thường có chi phí cao, việc sử dụng các phương pháp nội suy để tái chia mẫu từ dữ liệu vệ tinh có độ phân giải thấp (thường miễn phí hoặc giá rẻ) không chỉ cải thiện chất lượng hình ảnh mà còn mang lại nhiều lợi ích kinh tế.

Trong các bài toán thực tế, việc sử dụng dữ liệu vệ tinh với nhiều nguồn và độ phân giải khác nhau là rất quan trọng Áp dụng quá trình nội suy ảnh để đồng nhất độ phân giải là cần thiết nhằm giải quyết hiệu quả các vấn đề đặt ra.

Bài toán phân loại lớp phủ đô thị ở Việt Nam và các vấn đề trong tiền xử lý dữ liệu ảnh đầu vào

dữ liệu ảnh đầu vào

Quá trình đô thị hóa nhanh chóng và sự gia tăng dân số đã tạo ra những tác động sâu rộng đến nhiều khía cạnh ở hầu hết các tỉnh thành Việt Nam, đặc biệt là tại các thành phố lớn và các trung tâm văn hóa, chính trị, kinh tế, xã hội của đất nước.

Quá trình đô thị hóa không chỉ thúc đẩy tăng trưởng kinh tế và chuyển dịch cơ cấu lao động, mà còn làm thay đổi phân bố dân cư Tuy nhiên, đô thị hóa cũng mang lại những tác động tiêu cực như ô nhiễm môi trường và gia tăng tệ nạn xã hội.

Theo dõi sự biến động lớp phủ đô thị là cần thiết cho các cơ quan quản lý nhằm giám sát và định hướng phát triển phù hợp Bản đồ phân loại lớp phủ đô thị giúp mô tả đặc điểm tăng trưởng và phát triển kinh tế của các quốc gia, đồng thời hỗ trợ giám sát môi trường, dự đoán tốc độ tăng dân số, điện năng tiêu thụ và tổng sản phẩm quốc nội (GDP), từ đó góp phần vào quy hoạch thành phố hiệu quả.

Trên toàn cầu, nhiều dự án và nghiên cứu đã ứng dụng dữ liệu viễn thám và dữ liệu dân số để xây dựng bản đồ lớp phủ đô thị.

Nghiên cứu của Alimujiang Kasimu và Ryutaro Tateishi năm 2010 đã sử dụng phương pháp phân loại lớp phủ toàn cầu (GLCMNO) và biểu đồ kỹ thuật số (DCW) để phân tích lớp phủ đô thị và tác động của nó lên lớp phủ mặt đất tại Trung Quốc.

Nghiên cứu của Alimujiang KASIMU và Ryutaro TATEISHI năm 2008 đã áp dụng phương pháp GLCMNO để lập bản đồ đô thị toàn cầu, sử dụng dữ liệu đầu vào từ bản đồ mật độ dân số, ảnh ánh sáng ban đêm DMSP-OLS và ảnh MODIS-NDVI Nghiên cứu này đã tiến hành xác nhận và so sánh với các bản đồ đô thị hiện có, đồng thời đối chiếu với các dữ liệu như Landsat ETM+, DMSP, DCW, MOD12Q1, GLC2000 và GRUMP.

Nghiên cứu của Dengsheng Lu và Qihao Weng vào năm 2006 đã sử dụng dữ liệu bề mặt không thấm nước để phân loại lớp phủ đô thị tại quận Marion, thành phố Indianapolis, Indiana, Hoa Kỳ.

Tại Việt Nam, còn khá ít nghiên cứu về phân loại đô thị sử dụng dữ liệu vệ tinh với phạm vi hạn chế, chẳng hạn như:

Nghiên cứu của Trần Thị Vân tại Viện Tài Nguyên Môi Trường, ĐHQG HCM năm 2006 đã phân tích mối quan hệ giữa nhiệt độ bề mặt và các loại phủ đất tại thành phố Hồ Chí Minh, sử dụng cảm biến hồng ngoại nhiệt để thu thập dữ liệu.

 Nghiên cứu ứng dụng ảnh vệ tinh trong khảo sát sử dụng đất ở thành phố Đà Nẵng vởi Trần Thị An, Vũ Anh Tuấn,2008 [27]

Tối ưu hóa độ phân giải không gian của hình ảnh là yếu tố quan trọng trong việc phát hiện dạng đô thị, đặc biệt trong nghiên cứu tại Pháp và Việt Nam, với khu vực Đà Nẵng được làm ví dụ Nghiên cứu của Thi Dong-Binh Tran, Anne Puissant, Dominique Badariotti và Christiane Weber (2011) nhấn mạnh tầm quan trọng của việc cải thiện độ phân giải để nâng cao hiệu quả phân tích đô thị.

Phạm Tuấn Dũng đã nghiên cứu và trình bày phương pháp GLCMNO (Global Land Cover by National Mapping Organizations) mở rộng để phân loại lớp phủ đô thị tại Việt Nam, nhằm cải thiện và tối ưu hóa cho phù hợp với thực trạng đất nước Nghiên cứu này được giới thiệu tại Hội nghị Quốc tế lần thứ 8 KSE (Knowledge and Systems Engineering) và đã cho ra kết quả bản đồ lớp phủ đô thị cho hai năm 2008 và 2015, mang lại nhiều ý nghĩa quan trọng trong khoa học và thực tiễn hiện nay.

Phương pháp GLCMNO mở rộng đã định nghĩa lớp phủ đô thị tại Việt Nam, trong đó khu vực đô thị được xác định có mật độ dân cư tối thiểu 2000 người/km2 Các yếu tố như tỷ lệ bề mặt không thấm nước và ánh sáng ban đêm được sử dụng làm tiêu chí phân loại, trong khi lớp thực vật và bề mặt nước không được tính là đô thị.

Phương pháp này xác định lại các ngưỡng phân lớp cho các chỉ số ánh sáng ban đêm, chỉ số thực vật, mật độ dân số và tỉ lệ bề mặt không thấm nước Việc tính toán ngưỡng được thực hiện dựa trên một tập mẫu điểm ảnh, với số lượng pixel mẫu của mỗi lớp (trừ lớp đô thị) được xác định theo phần trăm của các lớp trong phương pháp GLCMNO Lớp đô thị được ưu tiên cao hơn trong việc xác định ngưỡng, trong khi ngưỡng mật độ dân số được căn cứ vào hệ thống phân loại đô thị tại Việt Nam.

1.2.1 Dữ liệu đầu vào trong bài toán phân loại lớp phủ đô thị tại Việt Nam

Bài toán sử dụng năm loại dữ liệu ảnh vệ tinh đầu vào, bao gồm bản đồ mật độ dân số, dữ liệu ảnh vệ tinh ánh sáng ban đêm, chỉ số thực vật NDVI, ảnh vệ tinh bề mặt không thấm nước và ảnh vệ tinh bề mặt chứa nước.

Bảng 1.2 Dữ liệu sử dụng trong bài toán phân lo ại lớp phủ đô thị Việt Nam theo phương pháp GLCMNO mở rộng

Dữ liệu Tên viết tắt Độ phân giải không gian Độ phân giải thời gian

Bản đồ mật độ dân số Worldpop 100m 2009

Dữ liệu ảnh vệ tinh ánh sáng ban DMSP-OLS 1km 2008 đêm NPP-VIIRS/

Dữ liệu vệ tinh chỉ số thực vật MOD13Q1 250m 2008

Dữ liệu vệ tinh bề mặt không thấm nước

EstISA 1km 2010 Ảnh vệ tinh bề mặt chứa nước MOD44W 250m

1.2.2 Các vấn đề trong tiền xử lý ảnh bài toán phân loại lớp phủ đô thị tại Việt Nam Đầu vào bài toán phân loại lớp phủ đô thị ở Việt Nam là năm dữ liệu ảnh vệ tinh khác nhau về nguồn ảnh và độ phân giải Do đó, để đưa ra được bản đồ phân loại lớp phủ đô thị độ phân giải 500m, ta cần có quá trình tiền xử lý ảnh đầu vào, đưa ảnh về cùng độ phân giải 500m

Việc điều chỉnh độ phân giải không gian của ảnh yêu cầu quá trình tái chia mẫu (Resampling) để đảm bảo thông tin ảnh không bị mất và sai số dữ liệu được giữ ở mức thấp.

Hình 1.4: Quy trình tiền xử lý dữ liệu bài toán phân loại lớp phủ đô thị Việt Nam theo phương pháp GLCMNO mở rộng

Bài toán nghiên cứu đặt ra trong luận văn

1.3.1 Một số nghiên cứu về phương pháp nội suy

Luận văn được phát triển dựa trên nền tảng các nghiên cứu, bài báo khoa học trong nước và quốc tế về các phương pháp nội suy ảnh như:

Các nghiên cứu trên thế giới

Nghiên cứu của Jency Titus và Sebastian Geroge (2013) đã so sánh các phương pháp nội suy trên dữ liệu ảnh vệ tinh, bao gồm nội suy láng giềng gần nhất, song tuyến tính và nội suy xoắn bậc ba Thực nghiệm được thực hiện với hai ảnh vệ tinh có kích thước khác nhau, tiến hành nội suy và đánh giá kết quả bằng mắt thường cũng như thời gian thực hiện thuật toán Kết quả cho thấy phương pháp nội suy song tuyến tính có thời gian thực hiện nhanh nhất, trong khi phương pháp nội suy xoắn bậc ba có thời gian thực hiện chậm nhất nhưng mang lại chất lượng ảnh tốt nhất theo đánh giá trực quan.

Năm 2013, Dr S Santhosh Baboo và M Renuka Devi đã phân tích các phương pháp tái chia mẫu ảnh tại quận Coimbatore, so sánh nội suy láng giềng gần nhất, song tuyến tính và nội suy xoắn bậc ba, kết luận rằng nội suy xoắn bậc ba mang lại chất lượng ảnh tốt nhất theo đánh giá bằng mắt thường Cùng năm, Vaishali Patel và Giáo sư Kinjal Mistree đã đánh giá các phương pháp nội suy trong việc cải thiện chất lượng ảnh, so sánh các phương pháp không thích ứng như láng giềng gần nhất, song tuyến tính và xoắn bậc ba với các phương pháp thích ứng như NEDI, DDT và ICBI Kết quả so sánh dựa trên chỉ số PSNR cho thấy nội suy xoắn bậc ba vượt trội hơn so với các phương pháp còn lại.

Năm 2013, Ranjeet Roy, Maninder Pal và Tarun Gulati đã nghiên cứu các phương pháp nội suy để phóng to ảnh kỹ thuật số, bao gồm bộ lọc lý tưởng, nội suy láng giềng gần nhất, B-splines, Cubic Splines và nội suy ảnh hai chiều Họ đã tiến hành so sánh và đánh giá hai ảnh CT cắt lớp đầu và xương cổ bằng các kỹ thuật nội suy khác nhau, sử dụng chỉ số PSNR để so sánh ảnh sau nội suy với ảnh đối chiếu Kết quả cho thấy phương pháp nội suy láng giềng gần nhất mang lại hiệu quả tốt hơn so với nội suy song tuyến tính và các phương pháp khác.

Dianyuan Han (2013) đã thực hiện một nghiên cứu so sánh các phương pháp nội suy ảnh, bao gồm nội suy láng giềng gần nhất, nội suy song tuyến tính, nội suy xoắn bậc ba và nội suy Cubic B-Spline Nghiên cứu tiến hành bằng cách giảm độ phân giải của một bức ảnh xuống 1/2 và sau đó áp dụng các kỹ thuật nội suy để tăng độ phân giải trở lại như ban đầu Kết quả được so sánh với ảnh gốc dựa trên hai khía cạnh: chủ quan (so sánh bằng mắt thường) và khách quan thông qua chỉ số tín hiệu nhiễu SNR Kết quả cho thấy phương pháp nội suy xoắn bậc ba mang lại hiệu quả tốt nhất.

Tại Việt Nam, cũng đã có một số đề tài nghiên cứu về các phương pháp nội suy như:

Luận văn Thạc sĩ “Nội suy ảnh và ứng dụng” của Nguyễn Thị Nguyệt tại Đại học Thái Nguyên năm 2009 nghiên cứu về xử lý ảnh và các kỹ thuật nội suy như nội suy láng giềng gần nhất, nội suy tam giác, nội suy song khối, nội suy tuyến tính, song tuyến tính, và tam tuyến tính Bài luận cũng trình bày hai ứng dụng chính của nội suy ảnh: tạo ra hình ảnh trung gian từ một ảnh nguồn và một ảnh đích, cho phép tạo ra các khung ảnh liên tục để tạo thành một file video; và ứng dụng nội suy trong việc nắn chỉnh hình ảnh.

Luận văn Thạc sĩ của Nguyễn Văn Hạt tại Học viện Công Nghệ Bưu Chính Viễn Thông năm 2012 nghiên cứu về xử lý ảnh và các kỹ thuật nội suy, bao gồm nội suy dựa vào các điểm láng giềng, nội suy tuyến tính, và nội suy sử dụng hàm cơ sở bán kính Các kỹ thuật nội suy cụ thể được đề cập như nội suy láng giềng xem xét lại, nội suy dựa trên dẫn xuất hình ảnh thứ 2, và nội suy tự nhiên Luận văn cũng trình bày ứng dụng của các kỹ thuật này trong việc biểu diễn khuôn mặt 3D ở trạng thái cân bằng và trạng thái tâm lý mục tiêu.

Nghiên cứu của Phan Thị San Hà và Lê Minh Sơn về việc ứng dụng phương pháp nội suy Kriging để khảo sát sự phân bố của tầng đất yếu thuộc tuổi Holocene tại khu vực nội thành Thành phố Hồ Chí Minh đã được công bố trên Tạp chí phát triển Khoa học và Công Nghệ năm 2007 Nghiên cứu này cung cấp cái nhìn sâu sắc về đặc điểm địa chất của khu vực, góp phần vào việc quản lý và phát triển bền vững đô thị.

Dựa trên các nghiên cứu trong và ngoài nước, bài viết này trình bày quy trình tiền xử lý dữ liệu ảnh vệ tinh ánh sáng ban đêm DMSP và ảnh vệ tinh bề mặt không thấm nước ISA, nhằm phục vụ cho việc phân loại lớp phủ đô thị tại Việt Nam bằng phương pháp GLCMNO mở rộng.

Câu hỏi đặt ra đối với luận văn bao gồm:

 Có những phương pháp nội suy ảnh vệ tinh nào?

 Các phương pháp nội suy ảnh có tác động như thế nào đối với ảnh vệ tinh?

Các phương pháp nội suy ảnh đa dạng được áp dụng cho dữ liệu ảnh vệ tinh ánh sáng ban đêm DMSP-OLS và ảnh vệ tinh bề mặt không thấm nước ISA Mỗi phương pháp có ngưỡng phân lớp riêng, ảnh hưởng đến quá trình phân loại lớp phủ đô thị Việc hiểu rõ sự khác biệt này là cần thiết để nâng cao độ chính xác trong phân tích và ứng dụng dữ liệu vệ tinh trong nghiên cứu đô thị.

 Phương pháp nội suy ảnh vệ tinh nào phù hợp nhất cho bài toán phân loại lớp phủ đô thị?

Luận văn này tập trung vào việc nghiên cứu và đánh giá các phương pháp nội suy ảnh vệ tinh, với mục tiêu tìm ra phương pháp tối ưu cho bài toán phân loại lớp phủ đô thị.

Cụ thể, luận văn tiến hành:

Ảnh vệ tinh là một công cụ quan trọng trong việc thu thập dữ liệu về trái đất, với các đặc trưng cơ bản như độ phân giải, độ chính xác và khả năng phân tích Một số loại dữ liệu vệ tinh nổi bật bao gồm ảnh vệ tinh ánh sáng ban đêm DMSP-OLS, giúp theo dõi hoạt động con người và sự phát triển đô thị, và ảnh vệ tinh bề mặt không thấm nước EstISA, cung cấp thông tin về tình trạng đất và quản lý tài nguyên nước.

Tái chia mẫu ảnh và các phương pháp nội suy ảnh là những kỹ thuật quan trọng giúp nâng cao độ phân giải của ảnh vệ tinh Bài viết sẽ khám phá các vấn đề thường gặp trong quá trình nội suy ảnh, đồng thời đưa ra các chỉ số đánh giá và so sánh chất lượng ảnh để người đọc có cái nhìn tổng quan về hiệu quả của các phương pháp này.

Bài viết so sánh và đánh giá tác động của ba phương pháp nội suy ảnh phổ biến: nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba, áp dụng cho ảnh vệ tinh Nghiên cứu được thực hiện thông qua thực nghiệm trên ảnh vệ tinh ánh sáng ban đêm DMSP-OLS, nhằm xác định hiệu quả của từng phương pháp trong việc cải thiện chất lượng hình ảnh.

2013 và ảnh vệ tinh bề mặt không thấm nước ISA 2010 có cùng độ phân giải 1km

Trong quá trình tiền xử lý dữ liệu cho bài toán phân loại lớp phủ đô thị tại Việt Nam, cần áp dụng các phương pháp nội suy khác nhau Việc tính toán lại ngưỡng phân lớp phù hợp với từng phương pháp nội suy ảnh là rất quan trọng Bài viết sẽ so sánh, đánh giá và đề xuất phương pháp nội suy ảnh vệ tinh tối ưu nhất cho bài toán này.

Việc nghiên cứu và đánh giá hiệu quả của các phương pháp nội suy ảnh viễn thám mang ý nghĩa về mặt khoa học:

Dữ liệu ảnh vệ tinh ánh sáng ban đêm DMSP/OLS (NOAA, 1992-2013) và ảnh vệ tinh bề mặt không thấm nước EstISA (bộ dữ liệu duy nhất trên thế giới, NOAA, 2010) với độ phân giải 1km đã được ứng dụng rộng rãi trong nhiều nghiên cứu Tuy nhiên, do độ phân giải không cao, các bài toán thực tế thường yêu cầu tăng độ phân giải ảnh Việc tìm hiểu các phương pháp nội suy phù hợp là cần thiết để đảm bảo quá trình này không làm mất đi thông tin quan trọng của ảnh.

Kết luận

Chương 1 của luận văn trình bày khái quát về viễn thám, các đặc trưng cơ bản của ảnh viễn thám Bài toán phân loại lớp phủ đô thị tại Việt Nam theo phương pháp GLCMNO mở rộng với các vấn đề đặt ra trong bước tiền xử lý dữ liệu Đưa ra bài toán đặt ra đối với luận văn: Nghiên cứu và đánh giá các phương pháp nội suy ảnh viễn thám cho bài toán phân loại lới phủ đô thị tại Việt Nam Mục đích và ý nghĩa khoa học, ý nghĩa thực tiễn của bài toán

Trong Chương 2, luận văn sẽ trình bày khái niệm và đặc điểm của nội suy ảnh, cùng với các phương pháp nội suy phổ biến như nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba Bên cạnh đó, sẽ có phần tìm hiểu về các chỉ số đánh giá chất lượng ảnh sau nội suy, bao gồm chỉ số sai số bình phương trung bình (MSE), chỉ số tín hiệu cực đại trên nhiễu (PSNR) và chỉ số so sánh sự tương đồng cấu trúc (SSIM) Chương 3 sẽ tập trung vào quá trình thực nghiệm và đánh giá kết quả.

Chương 2 CÁC PHƯƠNG PHÁP NỘI SUY ẢNH

Các khái niệm trong nội suy ảnh

2.1.1 Điểm ảnh Ảnh trong thực tế là một ảnh liên lục về không gian và về giá trị độ sáng Để có thể xử lý ảnh bằng máy tính cần có quá trình số hóa ảnh giúp biển đổi tín hiệu liên tục thành rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa thành phần giá trị (rời rạc hóa biên độ giá trị) Trong quá trình này người ta sử dụng khái niệm điểm ảnh [4] Điểm ảnh (Pixel Element) là một phần tử của ảnh số có toạ độ (x, y) có giá trị độ xám hoặc màu nhất định Một ảnh bao gồm tập hợp các điểm ảnh có kích thước và khoảng cách được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Ảnh khi được số hoá, nó thường được biểu diễn bởi mảng hai chiều hay ma trận hai chiều I(n,p): mỗi phần tử có một giá trị nguyên hoặc là một véctơ cấu trúc màu, n dòng và p cột Người ta thường ký hiệu I(x,y) để chỉ một điểm ảnh

Mức xám của điểm ảnh phản ánh cường độ sáng được gán giá trị số qua quá trình lượng tử hóa Ảnh có đa mức xám được biểu diễn dưới dạng ma trận hai chiều, trong đó mỗi phần tử (điểm ảnh) thể hiện mức xám tại vị trí cụ thể (x,y).

Mã hóa hình ảnh thường sử dụng các mức như 16, 32 hay 64, nhưng mã hóa 256 mức là phổ biến nhất do lý do kỹ thuật Với 256 mức, mỗi pixel được mã hóa bằng 8 bit, vì 2^8 = 256 (bao gồm các giá trị từ 0 đến 255).

2.1.3 Độ phân giải điểm ảnh Độ phân giải là mật độ điểm ảnh hiển thị trên một ảnh số Trong đó, khoảng cách giữa các điểm ảnh phải được đảm bảo sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bố chính là độ phân giải, và được phân bố theo trục x, y trong không gian hai chiều [6]

Hình 2.1Minh họa ảnh có độ phân giải tăng dần

2.1.4 Quan hệ giữa các điểm ảnh

Một ảnh số có thể được mô tả bằng hàm f(x, y), trong đó tập con các điểm ảnh được ký hiệu là S Các điểm ảnh này có mối quan hệ với nhau thông qua các kiểu quan hệ lân cận, bao gồm quan hệ 4 điểm láng giềng và 8 điểm láng giềng Cụ thể, điểm 4 láng giềng của điểm ảnh P(i,j) bao gồm các điểm lân cận gần nhất theo chiều đứng và ngang, tương ứng với 4 hướng chính: Đông, Tây, Nam và Bắc.

Các điểm 4 láng giềng theo cột và hàng của điểm P(i,j) là N4(P) = {(i-1, j); (i+1, j); (i, j-1); (i, j+1)}

Hình 2.2: Minh họa bốn điểm láng giềng theo chiều đứng và ngang của điểm

Các điểm 4 láng giềng theo đường chéo của điểm P(i,j) (Có thể coi lân cận chéo là 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc là: N D (P) = (i+1, j+1), (i+1, j-1), (i-1, j+1), (i-1, j-1) }

Hình 2.3: Minh họa bốn điểm láng giềng theo đường chéo của điểm P(i,j)

Các điểm 8 láng giềng của điểm P(i,j): N8= N4(P) ND(P)

Hình 2.4:Minh họa tám điểm láng giềng của P(i,j)

2.1.5 Khoảng cách giữa các điểm ảnh

Khoảng cách D(p,q) giữa hai điểm ảnh p toạ độ (x,y), q toạ độ (s,t) là hàm khoảng cách (Distance) hoặc Metric nếu [1]:

1 D(p,q) ≥ 0 với D(p,q)=0 nếu và chỉ nếu p=q

3 D(p,z) ≤ D(p,q) + D(q,z) Z là một điểm ảnh khác

Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y) và q(s,t) được định nghĩa như sau:

Khoảng cách khối: Khoảng cách D4(p,q) được gọi là khoảng cách khối đồ thị (City- Block Distance) và được xác định như sau:

Khoảng cách D8(p,q) còn gọi là khoảng cách bàn cờ (Ches-Board Distance) giữa điểm ảnh p,q được xác định như sau:

Hai điểm ảnh bất kỳ được gọi là láng giềng 4 nếu chúng có khoảng cách D4=1 từ mỗi điểm ảnh

Hai điểm ảnh được coi là láng giềng 8 nếu khoảng cách giữa chúng là D8 = 1 Việc xác định khoảng cách giữa các điểm ảnh giúp chúng ta nhận diện được các điểm ảnh láng giềng.

2.1.6 Khái niệm tái chia mẫu ảnh (Image Resampling) Ảnh số bao gồm một lưới hình chữ nhật của các điểm ảnh đều nhau.Mỗi điểm ảnh có tọa độ và mức xám (màu) riêng Tái chia mẫu ảnh là quá trình sửa dụng các kỹ thuật toán học để tạo ra các phiên bản mới của hình ảnh với độ phân giải điểm ảnh khác nhau Mỗi điểm ảnh được tạo ra sau quá trình tái chia mẫu thông qua hệ tọa độ cơ sở, được gán một giá trị mới (cường độ, cấp độ xám,…) dựa trên giá trị cấp độ xám của các điểm ản ban đầu

Sự khác nhau giữa quá trình tái chia mẫu ảnh và thay đổi kích thước ảnh (Image Resizing)

Thay đổi kích thước ảnh (resize) là quá trình điều chỉnh kích thước của hình ảnh mà không làm thay đổi số điểm ảnh (pixel) trong bức ảnh, đồng nghĩa với việc độ phân giải của ảnh vẫn được giữ nguyên.

 Tái chia mẫu ảnh (resampling): Thay đổi và làm ảnh hưởng đến số lượng điểm ảnh (thêm hoặc bớt các pixel) Làm thay đổi độ phân giải của ảnh

Tái chia mẫu gồm hai quá trình: tăng độ phân giải ảnh (upsampling) và giảm độ phân giải của ảnh của ảnh (downsampling)

Tăng độ phân giải ảnh (upsampling) là quá trình tăng số lượng điểm ảnh trong hình ảnh, dẫn đến kích thước của từng điểm ảnh giảm và giúp hình ảnh trở nên mịn màng hơn Quá trình này thường áp dụng các phương pháp nội suy ảnh để đạt được kết quả tốt nhất.

Giảm độ phân giải ảnh (downsampling) là quá trình làm giảm số lượng điểm ảnh bằng cách thay thế một nhóm điểm ảnh bằng một điểm ảnh đơn, dẫn đến kích thước điểm ảnh tăng lên Kết quả là ảnh trở nên thô và mờ hơn so với ảnh gốc.

2.1.7 Khái niệm nội suy ảnh

Nội suy là kỹ thuật dùng để ước lượng giá trị của các điểm dữ liệu chưa được xác định trong một tập hợp rời rạc, nơi có một số điểm dữ liệu đã biết.

Trong lĩnh vực khoa học kỹ thuật, việc thu thập dữ liệu mẫu thực nghiệm giúp xác định một số điểm dữ liệu có giá trị Những điểm này đại diện cho một hàm số của biến độc lập với giới hạn giá trị nhất định Do đó, chúng ta thường cần nội suy hoặc ước tính giá trị của hàm số cho các giá trị trung gian của biến độc lập.

Nội suy ảnh là quá trình ước lượng giá trị màu sắc của điểm ảnh mới dựa trên các điểm ảnh gần kề, giúp tạo ra hình ảnh mịn màng hơn so với bản gốc Kỹ thuật này khai thác mối quan hệ không gian giữa các điểm ảnh, cho thấy rằng những điểm gần nhau có đặc điểm tương đồng hơn Nội suy được áp dụng trong xử lý ảnh số để cải thiện chất lượng hình ảnh, bao gồm việc bóp méo, nắn chỉnh, lấp lỗ hổng và tăng độ phân giải.

Hình 2.5: Minh họa quá trình nội suy

Kỹ thuật nội suy đóng vai trò quan trọng trong tiền xử lý ảnh vệ tinh, giúp cải thiện chất lượng ảnh bị ảnh hưởng bởi nhiễu từ thời tiết, vật mang và bộ cảm Phương pháp này được sử dụng để nắn chỉnh hình học của ảnh, từ đó nâng cao độ chính xác và độ rõ nét của hình ảnh vệ tinh.

Xử lý ảnh bị méo hình học và khôi phục dữ liệu bị mất do hiện tượng line dropout là rất quan trọng, đặc biệt đối với các ảnh vệ tinh có độ phân giải thấp Quá trình nội suy ảnh giúp cải thiện chất lượng hình ảnh, từ đó nâng cao độ chính xác trong giải đoán và phân tích.

Hình 2.6: Minh họa việc sử dụng phương pháp nội suy trong nắn chỉnh ảnh

Một số vấn đề trong nội suy ảnh

Khi phóng to ảnh, quá trình nội suy chỉ thêm điểm ảnh (pixel) vào bức ảnh mà không tạo ra dữ liệu mới Điều này có nghĩa là thông tin của bức ảnh được phân bố qua nhiều điểm ảnh hơn, khiến cho bức ảnh nội suy không giống như bức ảnh gốc Nội suy giúp khắc phục hiện tượng răng cưa và làm mịn hình ảnh, nhưng không giữ nguyên trạng thái ban đầu của bức ảnh.

Nội suy khắc phục hiện tượng răng cưa

Răng cưa là thuật ngữ chỉ các đường thẳng hoặc đường cong không mượt mà, mà thay vào đó là dạng răng cưa Trong ảnh kỹ thuật số, mỗi bức ảnh được cấu thành từ các điểm ảnh, dẫn đến việc các đường thẳng và đường cong không thực sự hoàn hảo mà là mô hình răng cưa do các điểm ảnh tạo ra.

Hiện tượng răng cưa thường khó nhận thấy trong các ảnh nhỏ, nhưng khi phóng to, nó trở nên rõ nét hơn.

Nội suy là phương pháp tăng cường số lượng điểm ảnh từ các điểm ảnh gốc, giúp làm mịn ảnh và khắc phục hiện tượng răng cưa thường gặp khi phóng to hình ảnh.

Nội suy có thể làm mất độ sắc nét của ảnh, đặc biệt đối với những bức ảnh có giá trị màu thay đổi liên tục và rõ rệt Quá trình nội suy gia tăng số lượng điểm ảnh, tạo ra hiệu ứng mịn màng hơn, nhưng đồng thời cũng làm giảm độ sắc nét do các điểm ảnh mới được tính toán trung bình từ các điểm ảnh xung quanh.

Hình 2.6: Ví dụ phương pháp nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba làm mất độ sắc nét của ảnh

Nội suy không sinh ra hình ảnh thực sự tự nhiên

Các phương pháp nội suy có thể tạo ra hình ảnh không tự nhiên khi đánh giá bằng mắt thường, đặc biệt khi áp dụng trong các kỹ thuật chỉnh sửa hình ảnh làm thay đổi điểm nhìn hoặc tư thế của vật thể Kết quả là, những biến đổi hình ảnh ba chiều đơn giản như chuyển dịch hoặc xoay chiều trở nên vô cùng khó khăn.

Một số phương pháp nội suy ảnh

2.3.1 Nội suy láng giềng gần nhất - Nearest Neighbor Interpolation

Nội suy láng giềng gần nhất là phương pháp nội suy đơn giản và phổ biến, trong đó điểm ảnh mới được xác định bằng cách lấy giá trị của điểm ảnh gốc gần nhất mà không xem xét các giá trị của các điểm lân cận khác Khoảng cách giữa hai điểm thường được đo bằng khoảng cách Euclid hoặc khoảng cách Minkowski với k = 2.

Hình 2.7: Minh họa nội suy láng giềng gần nhất Hàm nhân của phương pháp nội suy láng giềng gần nhất [29]:

Trong đó, x là khoảng cách giữa điểm nội suy và điểm lưới

Ví dụ điểm ảnh (u,v) với bốn điểm láng giềng ( i, j ) , ( i, j + 1) , ( i+ 1, j ) và ( i+ 1,j +

1) và các giá trị f(i, j ) , f( i, j + 1) , f( i+ 1, j ), f( i+ 1,j + 1) Khoảng cách giữa (u,v) và ( i, j ) , ( i, j + 1) , ( i+ 1, j ), ( i+ 1,j + 1) sẽ được tính toán, giá trị tại(u,v) sẽ được gán bằng giá trị mức xám của điểm gần nó nhất

Hình 2.8 Minh họa việc tính toán điểm ảnh mới (u,v) bằng phương pháp nội suy láng giềng gần nhất

Nội suy láng giềng gần nhất có thời gian xử lý nhanh chóng, nhưng có thể gây ra hiệu ứng răng cưa khi hình ảnh được phóng lớn Phương pháp này thường được áp dụng trong các tình huống mà thời gian tính toán là yếu tố quan trọng hơn độ chính xác.

2.3.2 Nội suy song tuyến tính - Bilinear Interpolation

Nội suy song tuyến (Bilinear interpolation) là phương pháp mở rộng của nội suy tuyến tính, sử dụng bốn điểm ảnh gần nhất để tính giá trị cho điểm ảnh mới Giá trị điểm nội suy được xác định bằng cách tính trung bình có trọng số của bốn điểm này, với trọng số dựa trên khoảng cách giữa điểm cần nội suy và các điểm lân cận.

Hình 2.9: Minh họa nội suy song tuyến tính Hàm toán học của phương pháp nội suy song tuyến tính[29]:

0 1 ≤ |𝑥| (2.5) Trong đó, x là khoảng cách giữa điểm nội suy và điểm lưới Để tính giá trị tại điểm ảnh mới P(x,y) biết bốn điểm gần nhất là Q11 = (x1, y1), Q12 (x1, y2), Q21 = (x2, y1), and Q22 = (x2, y2)

Hình 2.10: Nội suy song tuyến tính cho điểm P(x,y)

Bước 1: Nội suy tuyến tính giá trị tại điểm R 1 và R 2 f(R 1 ) ≈ 𝑥 2 −𝑥

2 −𝑥 1 𝑓(𝑄 22 ) 𝑣ớ𝑖 𝑅 2 = (𝑥, 𝑦 2 ) (2.7) Bước 2: Từ hai điểm R1 và R2, nội suy tuyến tính giá trị tại điểm P f(𝑃) ≈ 𝑦 2 −𝑦

Nội suy song tuyến tính có độ phức tạp cao hơn so với nội suy láng giềng gần nhất, nhưng lại giảm thiểu sự biến dạng hình ảnh khi phóng to và làm mờ đường viền Phương pháp này cung cấp hiệu quả thị giác tốt hơn, mang lại hình ảnh sắc nét và mượt mà hơn so với nội suy láng giềng gần nhất.

2.3.3 Nội suy xoắn bậc ba – Cubic Convolution (Bicubic)

Nội suy xoắn bậc ba là phương pháp tính toán giá trị của điểm ảnh mới dựa trên giá trị trung bình của 16 điểm ảnh gốc gần nhất (4 x 4)

Hình 2.11: Minh họa nội suy xoắn bậc ba Hàm toán học của phương pháp nội suy xoắn bậc ba [29]:

Trong đó, x là khoảng cách giữa điểm nội suy và điểm lưới Để tính toán điểm nội suy P’ từ 8 điểm ban đầu P(1,1), P(1,2),…P(4,4) Theo chiều ngang của lưới ta:

Theo chiều dọc của lưới, điểm P’ được tính nội suy từ 4 điểm P’(1), P’(2), P’(3), P’(4)[15] Việc tính toán được mô tả như hình 2.11 dưới đây

Hình 2.12: Mô tả việc tính toán trong nội suy xoắn bậc ba

Phương pháp nội suy xoắn bậc ba là một kỹ thuật tiêu tốn nhiều thời gian và bộ nhớ khi xử lý, thường được áp dụng trong các tình huống không yêu cầu tính toán nhanh chóng Kỹ thuật này được sử dụng phổ biến trong các phần mềm xử lý ảnh như Photoshop và After Effects.

Các chỉ số đánh giá, so sánh chất lượng ảnh

2.4.1 Sai số bình phương trung bình (MSE)

Sai số bình phương trung bình (MSE) là một khái niệm quan trọng trong thống kê, được sử dụng để đánh giá chất lượng của các ước lượng và yếu tố dự báo MSE đo lường độ chính xác của một hàm toán học trong việc lập bản đồ mẫu dữ liệu của một tham số dân số, cũng như trong việc phân tích các giá trị của các biến ngẫu nhiên Chỉ số MSE được tính bằng cách lấy trung bình của bình phương các sai số, tức là chênh lệch giữa các ước lượng và giá trị thực tế.

Chỉ số MSE (Mean Squared Error) được sử dụng để đánh giá độ sai khác giữa các điểm ảnh của ảnh sau khi xử lý và ảnh gốc Công thức tính MSE giúp xác định mức độ chính xác và hiệu quả của quá trình xử lý ảnh.

 Trong đó x( i ,j) là ảnh so sánh, y( i,j) là ảnh sau chỉnh sửa hoặc tái cấu trúc

 Các chỉ số pixel 1≤ i ≤ M và 1≤ j ≤ N, cỡ ảnh N×M pixel và n bit/pixel

2.4.2 Tỷ số tín hiệu cực đại/ nhiễu (PSNR) PSNR (Peak Signal to Noise Ratio) –là chỉ số dùng để tính tỉ lệ giữa giá trị năng lượng tối đa của một tín hiệu và năng lượng nhiễu ảnh hướng đến độ chính xác của thông tin PSNR được sử dụng để đo chất lượng tín hiệu khôi phục của các thuật toán nén có mất mát dữ liêu (lossy compression) như nén ảnh Tín hiệu trong trường hợp này là dữ liệu gốc, và nhiễu là các lỗi xuất hiện khi nén

Tỷ số tín hiệu đỉnh trên nhiễu giữa hai ảnh Được đo bằng đơn vị decibels(dB) Chỉ số PSRN được tính toán như sau [18]:

Sai số bình phương trung bình (MSE) được định nghĩa là giá trị trung bình của các sai số bình phương giữa hai ảnh Giá trị tối đa của pixel trên ảnh (MAX I) là 255 khi các pixel được biểu diễn bằng 8 bits, và trong trường hợp tổng quát, MAX I là 2^B - 1, với B là số bits sử dụng để biểu diễn ảnh Đơn vị của tỷ số tín hiệu trên nhiễu đỉnh (PSNR) là Decibel (dB) Khi PSNR đạt giá trị trên @ dB, sự khác biệt giữa hai ảnh trở nên khó phân biệt bằng mắt thường, và giá trị PSNR càng cao thì hai ảnh so sánh càng giống nhau.

Chỉ số PSNR là một biện pháp phổ biến trong đánh giá chất lượng hình ảnh, tuy nhiên, nó không phải là phương pháp lý tưởng nhất Điều này là do cường độ tín hiệu được tính toán chỉ là ước tính, không phản ánh chính xác tín hiệu thực tế của hình ảnh Hơn nữa, đôi khi chỉ số này không tương thích với cách mà con người nhận thức hình ảnh.

2.4.3 So sánh sự tương đồng cấu trúc (SSIM)

Khác với các chỉ số như MSE và PSNR, chỉ số SSIM đánh giá chất lượng hình ảnh thông qua sự so sánh sự khác biệt giữa các pixel SSIM dựa trên hệ thống thị giác của con người (HVS), giúp phản ánh chính xác hơn cảm nhận của mắt người về hình ảnh.

SSIM (Chỉ số Tương đồng Cấu trúc) là một công cụ dùng để so sánh sự tương đồng giữa hai hình ảnh dựa trên thông tin về cấp độ xám, độ tương phản và cấu trúc Giá trị của SSIM nằm trong khoảng [-1, 1], trong đó khi SSIM = 1, hai hình ảnh so sánh hoàn toàn giống nhau.

Chỉ số SSIM được tính toán theo công thức dưới đây [33]:

 𝑥̅ là trung bình của ảnh x, 𝑦̅ là trung bình của ảnh y

 σ x , σ y là độ lệch chuẩn giữa các hình ảnh sau nội suy và ảnh so sánh

 C1, C2 là hằng số dương được lựa chọn theo kinh nghiệm chuyên gia

SSIM (Structural Similarity Index) là một trong những phương pháp phổ biến nhất trong xử lý hình ảnh Nó được áp dụng rộng rãi, chẳng hạn như trong bộ giải mã H.264 codec x.264 và trong nhận dạng giọng nói, cũng như trong các thuật toán nén.

SSIM, mặc dù vượt trội hơn MSE, vẫn có những hạn chế nhất định Chẳng hạn, biến thể cơ bản của SSIM không hoạt động hiệu quả khi các hình ảnh bị dịch chuyển, thu phóng hoặc xoay, ngay cả khi chất lượng của chúng tương đồng với hình ảnh tham chiếu Vấn đề này đã được nghiên cứu một phần bởi Complex Wavelet SSIM (CW-SSIM) [Wang và Simoncelli, 2005] Bản chất của SSIM là so sánh các tín hiệu theo phương pháp điểm ảnh, vì vậy nó vẫn giữ được sự tương đồng với MSE.

Chương MÔ HÌNH THỰC NGHIỆM ĐÁNH GIÁ TÁC ĐỘNG CỦA PHƯƠNG PHÁP NỘI SUY ẢNH VỆ TINH

Lựa chọn công cụ trong thực nghiệm

ArcGIS Desktop (Phần mềm ArcGIS 10.2 của ESRI) là công cụ mạnh mẽ trong hệ thống thông tin địa lý (GIS), được thiết kế để làm việc với bản đồ và thông tin địa lý đa dạng Phần mềm này hỗ trợ nhiều tiện ích mở rộng (Extensions), mỗi tiện ích phục vụ cho các chức năng chuyên biệt như phân tích không gian, phân tích 3D, phân tích mạng, và thống kê không gian, giúp người dùng hiển thị, truy vấn, tích hợp và phân tích dữ liệu không gian kết hợp với dữ liệu thuộc tính Ngoài ra, ArcGIS có khả năng đọc khoảng 300 định dạng dữ liệu khác nhau, bao gồm shapefile, geodatabase, AutoCad, Raster và Coverage.

Hiện nay, ArcGIS được áp dụng phổ biến trong các lĩnh vực của Hệ thống thông tin địa lý, bao gồm quản lý kinh tế, tài nguyên thiên nhiên, và dự báo các biến động môi trường.

Python 2.7, được phát triển bởi Guido Van Rossum vào cuối những năm 80 và đầu 90 tại Viện toán-tin Hà Lan, kế thừa nhiều ngôn ngữ như ABC, Module-3, C, C++, và Unix Shell Ngôn ngữ này cung cấp các thư viện hỗ trợ xử lý và so sánh ảnh, mang lại nhiều tiện ích cho lập trình viên.

Python có nhiều ưu điểm như:

 Cú pháp đơn giản giúp cho người lập trình dễ dàng đọc và tìm hiểu

 Python có tốc độ xử lý nhanh hơn so với ngôn ngữ PHP

 Chế độ tương tác cho phép người lập trình thử nghiệm tương tác sửa lỗi của các đoạn mã

 Thư viện có tiêu chuẩn cao, Python có khối cơ sở dữ liệu khá lớn nhằm cung cấp giao diện cho tất cả các CSDL thương mại lớn

 Python được biên dịch và chạy trên tất cả các nền tảng lớn hiện nay

Các công cụ xử lý dữ liệu ảnh viễn thám cho phép người dùng làm việc với số lượng lớn và dung lượng ảnh đa dạng, đồng thời hỗ trợ nhiều định dạng ảnh khác nhau.

 ENVI có công cụ xử lý ảnh đa dạng dựa như công cụ xử lý hình học, công cụ phân tích phổ, công cụ phân tích dữ liệu,…

 Có thể kết nối trực tiếp với phần mềm ArcGIS cho phép dễ dàng tích hợp kết quả phân tích ảnh vào cơ sở dữ liệu,…

Thực nghiệm đánh giá tác động của các phương pháp nội suy với ảnh vệ tinh ánh sáng ban đêm DMSP–OLS 2013 và ảnh vệ tinh bề mặt không thấm nước ISA 2010

Ảnh vệ tinh ánh sáng ban đêm DMSP-OLS do NOAA tổng hợp từ năm 1992 đến 2013, khi vệ tinh DMSP ngừng hoạt động Bên cạnh đó, ảnh vệ tinh bề mặt không thấm nước EstISA, cũng được NOAA tổng hợp vào năm 2010, là bộ ảnh vệ tinh bề mặt không thấm nước toàn cầu duy nhất hiện nay.

Luận văn tiến hành thực nghiệm với hai loại ảnh vệ tinh: ảnh vệ tinh ánh sáng ban đêm DMSP-OLS năm 2013 và ảnh vệ tinh bề mặt không thấm nước EstISA 2010 Mục tiêu là đánh giá tác động của quá trình nội suy ảnh đối với hai loại dữ liệu này, với độ phân giải ban đầu của cả hai ảnh gốc là 1km.

Quá trình nghiên cứu tại Việt Nam đã áp dụng các phương pháp nội suy như láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba để nâng cao độ phân giải ảnh từ 1km xuống 500m Sau đó, ảnh được giảm độ phân giải từ 500m về 1km bằng cách lấy giá trị trung bình các điểm ảnh (Mean) Kết quả ảnh sau khi xử lý được so sánh với ảnh gốc ban đầu thông qua các chỉ số đánh giá như MSE, PSRN và SSIM, với chu trình đánh giá được minh họa trong hình 3.1.

Hình 3.1: Chu trình thực nghiệm các phương pháp nội suy ảnh với ảnh DMSP và ảnh ISA

3.2.1 Trích xuất dữ liệu khu vực Việt Nam Ảnh ánh sáng ban đêm DMSP – OLS (F18 satellite) năm 2013 được tải miễn phí tại:https://ngdc.noaa.gov/eog/dmsp/downloadV4composites.html Ảnh bề mặt không thấm nước ISA năm 2010 được tải miễn phí tại: https://ngdc.noaa.gov/eog/dmsp/download_global_isa.html

Hai ảnh được trích xuất khu vực nghiên cứu Việt Nam và đưa về cùng hệ tọa độ WGS84

Các bước tiền xử lý dữ liệu sử dụng công cụ Arcgis:

 Các ảnh được trích xuất khu vực nghiên cứu Việt Nam sử dụng Shapefile:

Toolboxes -> Systems Toolboxes -> Spatial Analyst Tools -> Extraction -> Extract by Mask

 Đưa về cùng hệ quy chiếu địa lý WGS84 – UTM zone 49 sử dụng công cụ:

Toolboxes ->Data Management Tool -> Projections and Transformations –> Raster -> Project Raster-> Projected Coordinate Systems

3.2.2 Thực nghiệm và đánh giá kết quả

Thực nghiệm tăng độ phân giải ảnh bằng các phương pháp nội suy như láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba Sau khi nội suy, giảm độ phân giải ảnh bằng phương pháp tính trung bình (Mean) Tất cả các quy trình được thực hiện thông qua lập trình Python.

Bảng 3.1 Một số hàm và thư viện sử dụng

STT Thư viện Hàm Ý nghĩa

1 ArcPy: là một gói cung cấp các công cụ tính toán, phân tích dữ liệu địa lý, chuyển đổi, quản lý dữ liệu

Resample_management (in_raster, out_raster, {cell_size}, {resampling_type})

2 Scikit_image: gói thư viện tập hợp các hàm giúp so sánh chất lượng ảnh skimage.measure.compare_mse (im1, im2)

Tính toán, so sánh 2 ảnh theo chỉ số MSE skimage.measure.compare_psnr (im_true, im_test):

The Peak Signal-to-Noise Ratio (PSNR) is calculated between two images using the skimage.measure.compare_ssim function This function takes several parameters, including X and Y as the input images, win_size for the window size, gradient for gradient computation, data_range for the range of data values, multichannel for multi-channel images, gaussian_weights for applying Gaussian weights, full to return the full SSIM image, and dynamic_range for defining the dynamic range of the images.

Tính chỉ số tương đồng cấu trúc SSIM giữa 2 ảnh

GDAL là một gói thư viện cung cấp các công cụ lập trình và thao tác với dữ liệu không gian địa lý Thư viện này bao gồm hai phần chính: GDAL, dùng để xử lý dữ liệu raster, và OGR, dùng để xử lý dữ liệu vector.

Numpy Gói thư viện cung cấp các đối tượng và phương thức để làm việc với mảng nhiều chiều và các phép toán đại số

Sau khi xử lý, từ mỗi ảnh vệ tinh DMSP và ISA có độ phân giải 1km, chúng tôi đã thu được 03 ảnh kết quả tương ứng với quá trình nội suy, bao gồm nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba để tăng độ phân giải, cùng với việc giảm độ phân giải bằng phương pháp lấy giá trị trung bình Ba ảnh kết quả này sẽ được so sánh với ảnh gốc ban đầu nhằm đánh giá tác động của quá trình nội suy đối với chất lượng ảnh.

Kết quả nghiên cứu cho thấy rằng, cả hai loại dữ liệu ảnh vệ tinh DMSP và ISA, việc tăng độ phân giải bằng phương pháp nội suy láng giềng gần nhất và giảm độ phân giải bằng cách tính giá trị trung bình không làm thay đổi chất lượng ảnh Ảnh kết quả thu được hoàn toàn giống với ảnh gốc, với chỉ số so sánh MSE=none và SSIM=1.

Phương pháp nội suy xoắn bậc ba cho ảnh vệ tinh ISA cho kết quả tốt hơn so với phương pháp nội suy song tuyến tính, với các chỉ số MSE là 0.00037, PSNR 4.2565, và SSIM 0.9963, trong khi các chỉ số của phương pháp song tuyến tính là MSE 0.00093, PSNR 0.2691, và SSIM 0.9907 Kết quả này được minh họa qua biểu đồ 3.1 và 3.2.

Phương pháp nội suy xoắn bậc ba trên ảnh vệ tinh DMSP cho kết quả tốt hơn so với nội suy song tuyến tính, với các chỉ số MSE là 0.0085, PSNR đạt 0.704 và SSIM là 0.9634, trong khi đó, phương pháp song tuyến tính có MSE là 0.0089, PSNR 0.5043 và SSIM 0.9615.

Kết quả được biểu diễn bằng biểu đồ 3.3 và biểu đồ 3.4 dưới đây

Biểu đồ 3.1 So sánh tác động của các phương pháp nội suy với ảnh EstISA theo chỉ số SSIM

Biểu đồ 3.2: So sánh tác động các phương pháp nội suy với ảnh EstISA theo chỉ số MSE – PSNR

Nearest -Mean Bilinear- Mean Bicubic-Mean

Nearest -Mean Bilinear -Mean Bicubic - Mean

Biểu đồ 3.3: So sánh tác động của các phương pháp nội suy với ảnh DMSP-OLS theo chỉ số SSIM

Biểu đồ 3.4: So sánh tác động các phương pháp nội suy với ảnh DMSP-OLS theo chỉ số MSE, PSNR

Nearest-Mean Bilinear-Mean Bicubic-Mean

Nearest -Mean Bilinear -Mean Bicubic -Mean

Bảng 3.2 trình bày đánh giá trực quan các ảnh sau khi thực hiện nội suy Ảnh sử dụng phương pháp nội suy láng giềng gần nhất cho thấy hiện tượng răng cưa rõ ràng, kèm theo độ mờ và không sắc nét Trong khi đó, khi áp dụng phương pháp nội suy song tuyến tính, hiện tượng răng cưa đã được cải thiện đáng kể, tạo ra hình ảnh mịn màng hơn Các ảnh trích xuất từ khu vực Hà Nội, sử dụng dữ liệu DMSP/OLS 2013 với độ phân giải 500m, cho thấy sự khác biệt rõ rệt giữa hai phương pháp nội suy.

Hiện tượng răng cưa trong hình ảnh đã được cải thiện, cho ra những bức ảnh mịn màng và rõ nét hơn Cụ thể, hình ảnh trích xuất từ khu vực Hà Nội sử dụng dữ liệu DMSP/OLS năm 2013 với độ phân giải 500m đã áp dụng phương pháp nội suy xoắn bậc ba Ngược lại, hình ảnh trích xuất từ khu vực Hà Nội sử dụng dữ liệu bề mặt không thấm nước ISA năm 2010 vẫn gặp phải hiện tượng răng cưa, dẫn đến hình ảnh mờ và không sắc nét, với cùng độ phân giải 500m và phương pháp nội suy láng giềng gần nhất.

Hiện tượng răng cưa đã được cải thiện đáng kể so với phương pháp nội suy láng giềng gần nhất, mang lại hình ảnh rõ nét hơn Cụ thể, ảnh trích xuất khu vực Hà Nội về bề mặt không thấm nước ISA 2010 với độ phân giải 500m sử dụng nội suy song tuyến tính cho thấy sự giảm thiểu hiện tượng răng cưa Đồng thời, việc áp dụng nội suy xoắn bậc ba cũng giúp tạo ra những bức ảnh mịn màng và sắc nét hơn cho cùng khu vực.

Đánh giá tác động của các kỹ thuật nội suy trong tiền xử lý dữ liệu ảnh viễn thám đến kết quả bài toán phân loại lớp phủ đô thị tại Việt Nam

Để đánh giá hiệu quả của quá trình nội suy trong bài toán phân loại lớp phủ đô thị tại Việt Nam theo phương pháp GLCMNO mở rộng, các dữ liệu đầu vào bao gồm bản đồ mật độ dân số năm 2015, dữ liệu ảnh vệ tinh ánh sáng ban đêm DMSP-OLS năm 2013, ảnh vệ tinh bề mặt không thấm nước EstISA 2010, ảnh vệ tinh chỉ số thực vật MOD13Q1 năm 2015 và ảnh vệ tinh bề mặt chứa nước Dữ liệu được lựa chọn được mô tả chi tiết trong bảng 3.3.

Bảng 3.3 Dữ liệu đầu vào bài toán phân loại lớp phủ đô thị theo phương pháp

Dữ liệu Tên viết tắt Độ phân giải không gian

Bản đồ mật độ dân số Download: http://www.worldpop.org.uk

Dữ liệu vệ tinh ánh sáng ban đêm Download: https://ngdc.noaa.gov/eog/dmsp/downlo adV4composites.html

Dữ liệu vệ tinh bề mặt không thấm nước Download: https://ngdc.noaa.gov/eog/dmsp/downlo ad_global_isa.html

Dữ liệu vệ tinh chỉ số thực vật NDVI Download:http://earthexplorer.usgs.gov/

MOD13Q1 250m 2015 Ảnh vệ tinh bề mặt chứa nước Download: https://lpdaac.usgs.gov/data_access/

Các ảnh vệ tinh cần qua quá trình tiền xử lý dữ liệu, đưa về cùng độ phân giải 500m:

Dữ liệu vệ tinh ánh sáng ban đêm DMSP/OLS năm 2013 và dữ liệu vệ tinh bề mặt không thấm nước ISA năm 2010 (độ phân giải 1km) đã được cải thiện độ phân giải thông qua các phương pháp nội suy như nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba.

 Dữ liệu bản đồ mật độ dân số (độ phân giải 100m) được giảm chất lượng ảnh bằng phương pháp tính tổng SUM

 Dữ liệu vệ tinh chỉ số thực vật (độ phân giải 250m) được giảm chất lượng ảnh bằng phương pháp tính trung bình MEAN

 Dữ liệu ảnh bề mặt chứa nước (độ phân giải 250m) được giảm chất lượng ảnh bằng phương pháp tính phần đông Majority

Quy trình phân loại lớp phủ đô thị bao gồm việc xây dựng bản đồ cơ sở từ dữ liệu bản đồ dân số Bản đồ lớp phủ đô thị được xác định bằng cách loại bỏ các khu vực có chỉ số ánh sáng ban đêm và chỉ số bề mặt không thấm nước thấp hơn ngưỡng phân lớp Đồng thời, các khu vực có chỉ số thực vật cao hơn ngưỡng và các khu vực chứa bề mặt nước cũng bị loại trừ.

Chu trình bài toán phân loại lớp phủ đô thị tại Việt Nam được thực hiện theo phương pháp GLCMNO mở rộng, sử dụng các kỹ thuật nội suy ảnh để tiền xử lý dữ liệu từ ảnh vệ tinh DMSP và ISA.

3.3.1 Tính toán ngưỡng phân lớp và thực nghiệm

Ngưỡng phân lớp là giá trị quan trọng dùng để phân tách dữ liệu thành các lớp khác nhau Trong bài toán phân loại lớp phủ đô thị bằng phương pháp GLCMNO mở rộng, ngưỡng phân lớp giúp phân chia dữ liệu thành hai lớp: đô thị và không đô thị Để xác định ngưỡng phân lớp, cần xây dựng hai tập dữ liệu: tập dữ liệu học và tập dữ liệu kiểm tra.

Trên lưới có độ phân giải 500 mét, quá trình thực nghiệm tiến hành khoanh vùng 100 đa giác ngẫu nhiên tại Việt Nam để xác định các điểm đô thị Các điểm không thuộc lớp đô thị như khu vực đất trống, rừng, nước và đất canh tác được chọn ngẫu nhiên trên toàn lãnh thổ Để đảm bảo độ chính xác, các điểm này được kiểm tra đối chiếu với dữ liệu ảnh có độ phân giải cao từ Google Earth và Landsat ETM+.

Tập dữ liệu học được tạo ra bao gồm 425 điểm thuộc lớp đô thị và 839 điểm thuộc các lớp khác như rừng, đất trống, và khu vực chứa nước Tập dữ liệu kiểm tra cũng đã được xây dựng để đánh giá hiệu quả.

193 điểm thuộc lớp đô thị và 200 điểm thuộc các lớp khác

Từ tập dữ liệu học, chúng ta xác định ngưỡng cho dữ liệu ảnh ánh sáng ban đêm DMSP-OLS và ảnh bề mặt không thấm nước EstISA, áp dụng cho từng phương pháp nội suy ảnh.

Dữ liệu ảnh ánh sáng ban đêm DMSP-OLS 2013 được lượng tử hóa với 6 bit, cho phép mỗi điểm ảnh có 64 giá trị từ 0 đến 63 Để xác định ngưỡng phân lớp cho các phương pháp nội suy ảnh, ba ảnh vệ tinh DMSP-OLS với độ phân giải 500m, được xử lý qua các phương pháp nội suy gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba, được sử dụng cùng với tập dữ liệu học Thuật toán sẽ chạy các giá trị điểm ảnh từ 0 đến 63 để tìm ra giá trị ngưỡng phân lớp tối ưu, giúp phân chia dữ liệu học thành hai lớp: đô thị và không đô thị.

Kết quả cho thấy đối với dữ liệu ảnh vệ tinh DMSP-OLS, ngưỡng phân lớp là

Trong nghiên cứu về ba phương pháp nội suy ảnh, kết quả cho thấy tổng số điểm phân lớp chính xác là tương đương nhau, với phương pháp nội suy láng giềng gần nhất đạt 1239/1264 điểm học, phương pháp nội suy tuyến tính đạt 1240/1264 điểm học và phương pháp nội suy xoắn bậc ba đạt 1239/1264 điểm học.

Dữ liệu ảnh vệ tinh bề mặt không thấm nước EstISA 2010 cho thấy tỷ lệ phần trăm bề mặt không thấm nước trên tổng diện tích, với giá trị điểm ảnh dao động từ 0% đến 100% Kết quả phân tích cho thấy ngưỡng phân lớp là 3 cho cả ba phương pháp nội suy ảnh Sự khác biệt nằm ở số lượng điểm phân lớp chính xác, cụ thể là 1233/1264 điểm cho phương pháp nội suy láng giềng gần nhất, và 1234/1264 điểm cho cả phương pháp nội suy tuyến tính và xoắn bậc ba.

Biểu đồ Histogram thể hiện ngưỡng phân lớp của hai loại dữ liệu ảnh vệ tinh, bao gồm ảnh vệ tinh ánh sáng ban đêm DMSP-OLS và ảnh vệ tinh bề mặt không thấm nước ISA, như được mô tả trong bảng.

3.4 và bảng 3.5 Trong đó, biểu đồ Histogram là biểu đồ biểu diễn số điểm ảnh và giá trị của điểm ảnh Biểu đồ là 1 khung chữ nhật, với 2 chiều Chiều ngang là giá trị điểm ảnh được biểu diễn, chiều dọc là số lượng điểm ảnh có giá trị tương ứng với giá trị ở chiều ngang của biểu đồ

Bảng 3.4: Bảng lược đồ Histogram tính ngưỡng cho từng phương pháp nội suy ảnh đối với dữ liệu ảnh vệ tinh ánh sáng ban đêm DMSP-OLS 2013

Phương pháp nội suy ảnh

Lược đồ Histogram Ngưỡng Tổng số điểm phân lớp chính xác

Nội suy láng giềng gần nhất

Nội suy song tuyến tính

Nội suy xoắn bậc ba

Bảng 3.5 Bảng lược đồ Histogram tính ngưỡng cho từng phương pháp nội suy ảnh đối với dữ liệu ảnh vệ tinh bề mặt không thấm nước EstISA 2010

Phương pháp nội suy ảnh

Lược đồ Histogram Ngưỡng Tổng số điểm phân lớp chính xác

Nội suy láng giềng gần nhất

Nội suy song tuyến tính

Nội suy xoắn bậc ba

Ngưỡng phân lớp đối với dữ liệu bản đồ mật độ dân số là 500; với dữ liệu chỉ số thực vật NDVI là 0.62; với bề mặt chứa nước là 1

Quá trình phân lớp phủ đô thị tại Việt Nam sẽ loại bỏ các khu vực có mật độ dân số dưới 500 người, chỉ số ánh sáng ban đêm thấp hơn 22, và chỉ số bề mặt không thấm nước dưới ba Đồng thời, các khu vực có chỉ số thực vật lớn hơn 0.62 và chứa bề mặt nước cũng sẽ không được tính vào khu vực đô thị.

Sau quá trình phân lớp, chúng tôi đã tạo ra 09 bản đồ phân loại lớp phủ đô thị, sử dụng tổ hợp các phương pháp nội suy từ ảnh tiền xử lý dữ liệu vệ tinh DMSP-OLS và ISA Những bản đồ này sẽ được so sánh với tập dữ liệu kiểm tra để đánh giá độ chính xác và hiệu quả của phương pháp phân loại.

Ngày đăng: 17/12/2023, 01:59

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN