Mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và hệ thông tin địa lý cho Việt Nam

MỤC LỤC

Mục tiêu nghiên cứu

- Lựa chọn được mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và hệ thông tin địa lý cho khu vực phía tây tỉnh Nghệ An.

Cơ sở tài liệu thực hiện luận án

Dữ liệu về các điểm cháy ở khu vực thực nghiệm (khai thác từ cơ sở dữ liệu Firewatch của Cục Kiểm lâm, Bộ Nông nghiệp và Phát triển nông thôn) và các CSDL quốc tế;.

TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU

Đặc điểm về tài nguyên rừng ở Việt Nam

Những cây có chứa hóa chất quý hiếm như cây Tô hạp (Altingia sp.) có nhựa thơm phân bố ở vùng núi Tây Bắc và Trung bộ; cây Gió bầu (Aquilaria agalocha) sinh ra trầm hương, phân bố từ Nghệ tỉnh đến Ninh Thuận, Bình Thuận; cây Dầu rái (Dipterocarpus) cho gỗ và cho dầu nhựa. Một số địa phương còn tính diện tích cây công nghiệp dài ngày vào độ che phủ rừng, trong khi đó diện tích các cây công nghiệp dài ngày này không mang tính bền vững, không có tính đa dạng sinh học cũng như không hiệu quả trong chống mưa lũ.

Hiện trạng cháy rừng ở Việt Nam .1 Khái niệm cơ bản về cháy rừng

    Theo Tổ chức Nông lương thế giới (FAO): ‘cháy rừng là sự xuất hiện và lan truyền của những đám cháy trong rừng mà không nằm trong sự kiểm soát của con người; gây nên những tổn thất nhiều mặt về tài nguyên, của cải và môi trường’ (FAO, 1999). Cháy rừng thường xảy ra ở các địa phương tập trung nhiều rừng và rừng trồng các loại cây dễ cháy như: rừng thông, rừng tre nứa, rừng bạch đàn, rừng khộp, rừng tràm, rừng phi lao…, trong đó Hà Tĩnh, Nghệ An, Hà Giang, Sơn La, Yên Bái, Quảng Trị, Bình Định, Bình Thuận… là những địa phương thường xuyên xảy ra cháy rừng với thiệt hại lớn.

    Nguyên nhân gây cháy rừng ở Việt Nam

    Gần đây, hệ thống vệ tinh Sentinel của Cơ quan Hàng không vũ trụ Châu Âu (ESA) với nhiều thế hệ vệ tinh khác nhau, từ các vệ tinh radar (Sentinel 1) đến vệ tinh quang học (Sentinel 2 MSI) cung cấp ảnh viễn thám ở độ phân giải không gian cao hơn (lên đến 10m), thời gian cập nhật ngắn đã được sử dụng hiệu quả và rộng rãi trên thế giới trong lĩnh vực tài nguyên, môi trường. Trên hình 1.6 thể hiện hình ảnh cháy rừng ở California (Mỹ) nhìn từ ảnh vệ tinh Sentinel 2. Do có độ phân giải không gian cao, có thể nhận thấy, các khu vực đang xảy ra cháy được phân biệt rất rõ trên ảnh Sentinel 2 ở tổ hợp màu tự nhiên so với sử dụng ảnh Landsat. Việc phát hiện sớm các khu vực cháy rừng cho phép đánh giá ảnh hưởng cũng như dự báo nguy cơ lan tràn của lửa rừng, giúp ứng phó hiệu quả hơn với cháy rừng. Ngoài các dữ liệu vệ tinh với độ phân giải trung bình như Landsat, Sentinel, có thể kể đến một số loại dữ liệu viễn thám miễn phí khác như ảnh MODIS, ảnh Planet.. Ảnh MODIS được thu nhận từ hai hệ thống vệ tinh chính, bao gồm: MODIS Terra và MODIS Aqua. Mặc dù độ phân giải không gian khôngm).

    Tổng quan tình hình nghiên cứu trong và ngoài nước .1 Trên thế giới

      Các kỹ thuật hồi quy như hồi quy đa biến (multiple regression) (Oliveira et al., 2012), hồi quy logistic (Pourghasemi, 2015), hồi quy trọng số địa lý (geographically weighted regression - GWR) (Fernandez et al., 2012), kỹ thuật khai phá dữ liệu (data mining) (Arpaci et al., 2014) cũng được sử dụng để xây dựng các mô hình dự báo nguy cơ cháy rừng trên cơ sở đánh giá mối quan hệ giữa các yếu tố tự nhiên, xã hội và khả năng xảy ra cháy. Trên cơ sở phương pháp chuyên gia và phân tích các yếu tố ảnh hưởng đến quá trình cháy rừng tại huyện Sơn Động (Bắc Giang), các tác giả đã lựa chọn và đề xuất các chỉ tiêu đầu vào cho mô hình phân loại thảm thực vật rừng dễ cháy, bao gồm nhóm các yếu tố tự nhiên (thảm thực vật, độ dốc, hướng sườn, lượng mưa trung bình tháng, nhiệt độ trung bình ngày) và nhóm các yếu tố xã hội (khoảng cách từ các khu dân cư đến rừng, khoảng cách từ đất canh tác nương rẫy đến rừng) (Phạm Minh Hải, Vũ Ngọc Phan, 2018).

      Luận giải những vấn đề cần nghiên cứu

      Ngoài các nghiên cứu liên quan đến xây dựng mô hình dự báo nguy cơ cháy rừng, dữ liệu viễn thám và GIS cũng được sử dụng trong nhiều nghiên cứu phục vụ xây dựng các mô hình tài nguyên - môi trường khác nhau như phát hiện và giám sát cháy ngầm ở bể than Quảng Ninh (Nguyễn Tiến Thành, 2021), giám sát hệ thực vật ngập nước (Nguyễn Văn Hùng, 2022), xác định thông tin bốc thoát hơi nước bề mặt (Lê Hùng Chiến, 2022). Các nghiên cứu trong nước mặc dù đã thử nghiệm với nhiều mô hình khác nhau, trong đó đã áp dụng các kỹ thuật trí tuệ nhân tạo trong xử lý dữ liệu viễn thám và GIS nhằm nâng cao độ chính xác trong dự báo nguy cơ cháy rừng, một số nghiên cứu đã xây dựng được WebGIS hỗ trợ cảnh báo cháy rừng, tuy nhiên các công trình này chưa quan tâm nghiên cứu xử lý các dữ liệu không gian này trên các nền tảng mở.

      Tiểu kết chương 1

      Ngoài ra, dữ liệu các điểm cháy cũng được sử dụng trong đánh giá độ chính xác của các mô hình dự báo nguy cơ cháy rừng trên cơ sở phân tích sự phù hợp giữa các điểm cháy và phân bố không gian các khu vực có nguy cơ cháy khác nhau (xác định từ mô hình dự báo). Các kết quả nhận được trong chương 1 cho thấy sự cần thiết phải nghiên cứu ứng dụng các kỹ thuật học máy nhằm nâng cao độ chính xác của các mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS.

      CƠ SỞ KHOA HỌC XÂY DỰNG MÔ HÌNH DỰ BÁO NGUY CƠ CHÁY RỪNG TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG TIN ĐỊA LÝ

      Đặc điểm khu vực nghiên cứu

      Nghệ An là một đầu mối giao thông quan trọng của cả nước, có mạng lưới giao thông phát triển và đa dạng, bao gồm hệ thống đường bộ, đường sắt, đường sông, sân bay và cảng biển, được hình thành và phân bố khá hợp lý theo các vùng dân cư và các trung tâm hành chính, kinh tế. Đặc điểm này càng thể hiện rõ nét ở khu vực phía tây Nghệ An khi diện tích rừng nguyên sinh chỉ còn chiếm tỉ lệ rất ít (tập trung ở các khu bảo tồn thiên nhiên, vườn quốc gia), trong khi rừng thứ sinh nghèo kiệt và rừng trồng chiếm phần lớn diện tích rừng, và đây là loại rừng rất dễ xảy ra cháy.

      Tổng quan chung về dữ liệu phục vụ xây dựng mô hình dự báo nguy cơ cháy rừng Xây dựng dữ liệu cho mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS là

      Bên cạnh yếu tố tự nhiên, cháy rừng còn bắt nguồn từ các hoạt động xã hội và các hoạt động sản xuất của con người như đốt rừng làm nương rẫy, đốt quang thực bì, đốt rác trong vườn cạnh khu rừng trồng, hun khói để lấy mật ong. Cấu trúc dữ liệu của các lớp thông tin đầu vào trong mô hình dự báo nguy cơ cháy rừng được chuẩn hóa và lưu trữ dưới dạng vector và raster để thuận tiện khi thực hiện các phép phân tích không gian trong môi trường GIS.

      Các lớp thông tin thành phần và phương pháp xây dựng cơ sở dữ liệu thành phần a) Thông tin lớp phủ thực vật

      Hiện nay, có nhiều chỉ số độ ẩm đất khác nhau được sử dụng phổ biến trong đánh giá mức độ ẩm bề mặt như chỉ số TVDI (Temperature Vegetation Dryness Index), NDDI (Normalized Difference Drought Index), LSWI (Land Surface Water Index), NMDI (Normalized Multi- band Drought Index), SMI (Soil Moisture Index)..Các chỉ số độ ẩm này được xây dựng trên cơ sở sử dụng các kênh ở dải sóng hồng ngoại và hồng ngoại sóng ngắn, một số chỉ số sử dụng thêm thông tin nhiệt độ bề mặt chiết tách từ các kênh hồng ngoại nhiệt (Wang and Qu, 2007). Nhiệt độ bề mặt có thể được xác định bằng cách sử dụng các kênh hồng ngoại nhiệt ảnh viễn thám như Landsat, Aster, MODIS..So với các phương pháp nghiên cứu truyền thống, việc sử dụng dữ liệu viễn thám hồng ngoại nhiệt cho phép chiết tách nhanh thông tin nhiệt độ bề mặt ở một khu vực rộng lớn, kể cả thông tin nhiệt độ bề mặt trong quá khứ.

      Nhóm các lớp thông tin được xây dựng từ hệ thông tin địa lý

      Hiện nay, có nhiều nguồn dữ liệu DEM toàn cầu được cung cấp miễn phí với độ phân giải không gian cao, hỗ trợ hiệu quả cho các mục đích khác nhau, từ quản lý tài nguyên, môi trường, phát triển kinh tế - xã hội và đảm bảo quốc phòng - an ninh. Sứ mệnh địa hình tàu con thoi (SRTM) là dữ liệu DEM toàn cầu với độ phân giải không gian 30m được thực hiện bởi Cơ quan hàng không vũ trụ Mỹ (NASA) thông qua kỹ thuật radar giao thoa (InSAR) trên tàu con thoi Endeavour.

      Phương pháp xử lý dữ liệu trên nền tảng Google Earth Engine

      Bên cạnh đó, GEE cho phép người sử dụng có thể chủ động xây dựng các công cụ chạy trên nền tảng GEE, giúp xử lý nhanh dữ liệu viễn thám phục vụ các mục đích cụ thể, trong đó có dự báo nguy cơ cháy rừng. Như vậy, có thể nhận định, việc sử dụng các nền tảng địa không gian mở như GEE là một tiếp cận phù hợp và hiệu quả cho các bài toán xử lý dữ liệu viễn thám đa thời gian, giúp nâng cao hiệu quả sử dụng các nguồn dữ liệu viễn thám miễn phí, hỗ trợ tốt hơn công tác cảnh báo sớm và dự báo nguy cơ cháy rừng.

      Nghiên cứu lựa chọn mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và hệ thông tin địa lý

        Trong mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS trên cơ sở phương pháp phân tích thứ bậc AHP, ứng với mỗi chỉ tiêu (yếu tố ảnh hưởng đến khả năng xảy ra cháy rừng) sẽ xây dựng một lớp thông tin chuyên đề GIS, tiến hành tổng hợp và chồng xếp các lớp thông tin, tích hợp các trọng số đánh giá và phân loại theo cấp độ ảnh hưởng phù hợp để thành lập bản đồ dự báo nguy cơ cháy rừng. Thuật toán cây phân loại và hồi quy (CART - Classification and Regression Trees) là một kỹ thuật học máy có giám sát được sử dụng phổ biến để dự đoán biến mục tiêu định tính (cartegorical target variable), tạo cây phân loại hoặc biến mục tiêu liên tục (continuous target variable), tạo ra cây hồi quy.

        Tiểu kết chương 2

        Tại bước này, bản đồ dự báo nguy cơ cháy rừng khu vực nghiên cứu được xây dựng trên cơ sở mô hình dự báo được lựa chọn ở bước 5, trong đó nguy cơ xảy ra cháy rừng được chia thành 5 cấp: rất thấp, thấp, trung bình, cao và rất cao. Trong chương 2, đề xuất được sơ đồ quy trình công nghệ xây dựng mô hình dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS, làm cơ sở để tiến hành thực nghiệm trong chương 3.

        THỰC NGHIỆM DỰ BÁO NGUY CƠ CHÁY RỪNG KHU VỰC PHÍA TÂY TỈNH NGHỆ AN TỪ DỮ LIỆU VIỄN THÁM VÀ HỆ THÔNG TIN

        Đặc điểm dữ liệu sử dụng .1 Dữ liệu viễn thám

        Kết quả xác định chỉ số thực vật NDVI khu vực phía tây tỉnh Nghệ An từ ảnh Sentinel 2 MSI được trình bày trên hình 3.4, trong đó giá trị chỉ số NDVI đạt được trong khoảng từ -0.742 đến 0.802, chỉ số NDVI càng cao thể hiện các khu vực có lớp phủ thực vật càng dày và tươi tốt. Dữ liệu về mật độ dân số thu thập từ cơ sở dữ liệu WorldPop và dữ liệu về khí hậu (lượng mưa trung bình tháng, tốc độ gió) thu thập từ cơ sở dữ liệu WorldClim được sử dụng để xây dựng các lớp thông tin chuyên đề cho mô hình dự báo nguy cơ cháy rừng.

        Hình 3.14 trình bày kết quả xây dựng lớp thông tin về tốc độ gió khu vực phía tây tỉnh Nghệ An từ CSDL WorldClim, trong đó tốc độ gió nằm trong khoảng từ 1,5 đến 2,9 m/s
        Hình 3.14 trình bày kết quả xây dựng lớp thông tin về tốc độ gió khu vực phía tây tỉnh Nghệ An từ CSDL WorldClim, trong đó tốc độ gió nằm trong khoảng từ 1,5 đến 2,9 m/s

        Kết quả xây dựng bản đồ dự báo nguy cơ cháy rừng từ dữ liệu viễn thám và GIS .1 Kết quả dự báo nguy cơ cháy rừng bằng kỹ thuật AHP

          Tương tự như với các thuật toán học máy RF và SVM, để dự báo nguy cơ cháy rừng khu vực phía tây tỉnh Nghệ An bằng thuật toán CART trên cơ sở 9 lớp dữ liệu đầu và và dữ liệu các điểm cháy, trong luận án nghiên cứu sinh đã thử nghiệm với các giá trị tham số maxNodes khác nhau, ứng với số lượng nút lá tối đa trên mỗi cây quyết định. + Với thuật toán CART: Với phương án sử dụng tham số maxNodes bằng 5 (CART5) (Hình 3.23), phần lớn các điểm cháy và không cháy phân bố ở các khu vực có cấp độ dự báo cháy. Kết quả nhận được khi sử dụng thuật toán CART cũng tương tự như với thuật toán SVM, khi kết quả dự báo nguy cơ cháy rừng phân bố cục bộ thành các mảng lớn dẫn đến phần lớn các điểm cháy và không cháy phân bố cục bộ ở các khu vực cấp độ dự báo cháy. + Với phương án sử dụng kỹ thuật AHP: Nhìn chung, kết quả dự báo nguy cơ cháy rừng bằng kỹ thuật phân tích thứ bậc AHP trên cơ sở 9 lớp dữ liệu đầu vào có độ chính xác thấp hơn vo với các thuật toán học máy, đặc biệt là so với phương án sử dụng thuật toán RF. Kết quả dự báo nguy cơ. b) Đánh giá dựa trên đường cong ROC.

          Hình có AUC là 1 có thể phân loại chính xác hoàn toàn các điểm dữ liệu vào đúng các lớp.
          Hình có AUC là 1 có thể phân loại chính xác hoàn toàn các điểm dữ liệu vào đúng các lớp.