CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU
2.5. Các phương pháp nghiên cứu chính
2.5.5. Phương pháp mô hình hóa phân bố
Từ bộ số liệu các điểm ghi nhận của Thỏ vằn Trường Sơn, để giảm thiểu vấn đề tương quan không gian làm giảm khả năng dự báo của mô hình, gói tiện ích spThin [9] trong phần mềm R đã được dùng để lọc các điểm ghi nhận trong phạm vi 10 km, và đã tạo ra bộ số liệu các điểm ghi nhận gồm 27 điểm từ 33 điểm ban đầu.
Các biến môi trường được sử dụng để chạy mô hình là các biến sinh khí hậu với độ phân giải tốt nhất (30 arcsec) được tải từ cơ sở dữ liệu WorldClim. Có tổng cộng 19 biến sinh khí hậu, mỗi biến đại diện cho một yếu tố sinh khí hậu [40]. Các biến đó bao gồm:
* BIO1 = Nhiệt độ trung bình năm
* BIO2 = Khoảng nhiệt độ trung bình tháng
* BIO3 = Nhiệt độ ổn đinh
* BIO4 = Mức thay đổi nhiệt độ theo mùa
* BIO5 = Nhiệt độ cao nhất của tháng nóng nhất
41
* BIO6 = Nhiệt độ thấp nhất của tháng lạnh nhất
* BIO7 = Khoảng nhiệt độ trung bình năm
* BIO8 = Nhiệt độ trung bình của mùa mưa
* BIO9 = Nhiệt độ trung bình của mùa khô
* BIO10 = Nhiệt độ trung bình của mùa nóng
* BIO11 = Nhiệt độ trung bình của mùa lạnh
* BIO12 = Lượng mưa trung bình năm
* BIO13 = Lượng mưa của tháng mưa nhiều nhất
* BIO14 = Lượng mưa của tháng mưa ít nhất
* BIO15 = Mức thay đổi lượng mưa theo mùa
* BIO16 = Lượng mưa của mùa mưa
* BIO17 = Lượng mưa của mùa khô
* BIO18 = Lượng mưa của mùa nóng
* BIO19 = Lượng mưa của mùa lạnh
Các điểm xuất hiện được sử dụng để tạo ranh giới nghiên cứu theo nguyên lý đa giác tối thiểu. Từ đa giác tối thiểu được tạo ra, công cụ tạo vùng đệm trong ArcGIS được sử dụng để tạo ra ranh giới nghiên cứu có khoảng cách 0,7 độ so với đa giác tối thiểu. Tất cả 19 biến được hiển thị xuống ranh giới nghiên cứu bằng ArcGIS, và chuyển sang tệp số để chạy mô hình. Để giảm thiểu mức độ phức tạp của mô hình nhằm tăng khả năng dự báo cho điều kiện môi trường trong tương lai, 19 biến môi trường đã được chạy phân tích jackknife để đo mức độ quan trọng của các biến, với từng biến một bị loại bỏ trong mỗi lần chạy [12, 31]. Đồng thời, hệ số tương quan Pearson cũng được tính cho từng cặp biến một bằng phần mềm ENMTools, với giá trị r càng lớn nghĩa là cặp biến đó có tính tương quan càng cao, để nhận diện những
42
cặp biến có độ tương quan cao quá mức (r ≥ |0,75|), và kết quả từ phân tích jackknife, cũng như đặc tính sinh thái đã biết của loài, đã được sử dụng để giảm 19 biến ban đầu xuống còn 6 biến [86]. Sáu biến cuối cùng bao gồm Mức thay đổi nhiệt độ theo mùa, Nhiệt độ trung bình của mùa mưa, Nhiệt độ trung bình của mùa khô, Mức thay đổi lượng mưa theo mùa, Lượng mưa của mùa nóng, Lượng mưa của mùa lạnh.
Chạy mô hình
Mô hình phân bố loài được xây dựng sử dụng phần mềm Maxent phiên bản 3.4.1 [66]. Maxent không yêu cầu dữ liệu về điểm không ghi nhận của loài, và có khả năng xây dựng mô hình phân bố tương đối tốt kể cả khi loài có ít điểm ghi nhận [29, 64]. Giá trị regularization multiplier được chọn bằng cách chạy nhiều mô hình với các tùy chỉnh giống nhau, chỉ khác ở giá trị multiplier được thay đổi từ 0,5 đến 10 với bước nhảy là 0,5 cho mỗi lần chạy, và mô hình có giá trị AUC tốt nhất sẽ được chọn [12]. Giá trị AUC thay đổi từ 0,5 với mô hình không có khả năng dự đoán (hay nói cách khác, khả năng dự đoán không khác đoán ngẫu nhiên) cho tới 1,0 cho mô hình có khả năng dự báo hoàn toàn chuẩn [28, 31]. Sau khi chạy, giá trị regularization multiplier có giá trị bằng 3,0 đã được chọn cho việc chạy mô hình.
Các tham số khác như ngưỡng hội tụ, loại lớp, … được chọn theo khuyến nghị từ những người phát triển ra phần mềm Maxent [67].
Phương pháp xây dựng mô hình chính là phương pháp jackknife, được thực hiện theo hướng dẫn của Pearson và cs. (2007), và là phương pháp đã được chứng minh là hiệu quả cho những loài có số điểm ghi nhận hạn chế [64]. Theo phương pháp này, sẽ có n mô hình được tạo ra, với n = số điểm ghi nhận, và trong mỗi lần chạy, một điểm ghi nhận ngẫu nhiên sẽ được loại bỏ từ bộ số liệu, và mô hình được xây dựng dựa trên n – 1 điểm còn lại. Độ chính xác và hợp lý của mô hình được đánh giá dựa trên khả năng của mô hình có dự báo được điểm đã được loại ra từ trước hay không.
43
Đánh giá mô hình
Để đánh giá mô hình và lựa chọn mô hình tốt nhất, ENMTools được sử dụng để tính chỉ số AICc (Chỉ số thông tin Akaike đã điều chỉnh), vốn được coi là hiệu quả cho mô hình có dưới 30 điểm xuất hiện. AUC, AICc (Hình 6), và mức loại bỏ được dùng song song với nhau để đánh giá và lựa chọn mô hình [86]. Sau khi lựa chọn xong, ngưỡng xuất hiện 10% được sử dụng để phân biệt giữa vùng thích hợp và không thích hợp đối với loài [54, 88].
Hình 6. Minh họa giá trị AICs dùng để lựa chọn mô hình Dự báo phân bố cho tương lai
Để đánh giá khả năng thay đổi phân bố của Thỏ vằn Trường Sơn trong tương lai, mô hình tốt nhất đã được dùng để chạy lại với các biến sinh khí hậu ở năm 2050 với độ phân giải 30 arcsecond ở cơ sở dữ liệu WorldClim [40]. Cả mức phát thải thấp nhất (RCP 2,6) và cao nhất (RCP 8,5) ở hai mô hình hoàn lưu toàn cầu là BCC-
44
CSM1-1 and MIROC5 được sử dụng để đánh giá ảnh hưởng của các kịch bản phát thải khí nhà kính khác nhau.
Sau khi tất cả các mô hình đã chạy xong, phần mềm ArcGIS được sử dụng để thành lập các bản đồ tương ứng.
Tổng hợp khung nghiên cứu của luận văn được trình bày ở Hình 7.
Hình 7. Biểu đồ khung nghiên cứu của luận văn
45