Mô hình hóa các biến động của lớp phủ không chỉ giới hạn trong một loại mô hình, cũng không chỉ trong một lĩnh vực nghiên cứu. Chúng tôi sẽ trình bày ở đây các mô hình thường được sử dụng (Maestripieri and Paegelow 2013):
Mô hình ngẫu nhiên. Đó là các mô hình xác suất rời rạc không phát triển liên tục theo thời gian mà có các bước thời gian rời rạc. Ví dụ bao gồm chuỗi Markov và mô hình tế bào tự động. Sau đó, hệ thống đa tác nhân (multi-agents) (Ferber 2006) giúp có thể nắm bắt và biểu diễn các hệ thống phức tạp và năng động bằng cách mô hình hóa các cá nhân, hành vi và tương tác của chúng. Cuối cùng, các mô hình thống kê-thực nghiệm được sử dụng rộng rãi để dự đoán động thái thực vật (Perry and Millington 2008). Các loại mô hình này cho phép dự đoán và hình dung các động lực
sử dụng đất dựa trên các mối quan hệ được định lượng theo thực nghiệm giữa các động lực này và các yếu tố giải thích của chúng (Verburg, Soepboer et al. 2002).
Ngoài ra, người lập mô hình phải tích hợp số lượng (tính bằng pixel) của các thay đổi cho mỗi năm mô phỏng (Takada, Miyamoto et al. 2010). Đây là trường hợp của mô hình CLUE (Conversion of Land Use and its Effects) (Verburg, Soepboer et al. 2002).
Ngoài ra, các mô hình thống kê-thực nghiệm khác như CA-Markov, Land Change
Modeler sử dụng chuỗi Markov để ước tính số lượng thay đổi. Hơn nữa, một số mô hình này được gọi là hybrid vì chúng kết hợp hai hoặc nhiều mô hình.
Trong nghiên đề tài này, các mô hình ngẫu nhiên và các mô hình thống kê-thực nghiệm bao gồm Markov, Mạng tự động (Cellular Automata-CA) và Land Change Modeler (LCM) được sử dụng đề dự báo lớp phủ trong lưu vực sông Nhật Lệ - Kiến Giang, tỉnh Quảng Bình.
2.2.1.1. Mô hình Markov a. Khái nhiệm
Chuỗi Markov: Trong toán học, một chuỗi Markov đặt theo tên nhà toán học người Nga Andrei Andreyevich Markov, là một quá trình ngẫu nhiên theo thời gian với tính chất Markov.
Xích Markov là một dãy X1, X2, X3,... gồm các biến ngẫu nhiên. Tập tất cả các giá trị có thể có của các biến này được gọi là không gian trạng thái S, giá trị của Xn là trạng thái của quá trình (hệ) tại thời điểm n. Nếu việc xác định (dự đoán) phân bố xác
25 suất có điều kiện của Xn+1 khi cho biết các trạng thái quá khứ là một hàm chỉ phụ thuộc Xn thì: P(Xn+1=x|X0,X1,X2,…Xn)=P(Xn+1=x|Xn)
Trong đó: x là một trạng thái nào đó của quá trình (x thuộc không gian trạng thái S).
Đó là thuộc tính Markov.
Một cách đơn giản để hình dung một kiểu chuỗi Markov cụ thể là qua một ôtômat hữu hạn (finite state machine). Nếu hệ ở trạng thái y tại thời điểm n thì xác suất
mà hệ sẽ chuyển tới trạng thái x tại thời điểm n+1 không phụ thuộc vào giá trị của thời điểm n mà chỉ phụ thuộc vào trạng thái hiện tại y. Do đó, tại thời điểm n bất kỳ, một xích Markov hữu hạn có thể được biểu diễn bằng một ma trận xác suất, trong đó phần
tử x, y có giá trị bằng P(Xn+1=x|Xn=y) và độc lập với chỉ số thời gian n (nghĩa là để xác định trạng thái kế tiếp, ta không cần biết đang ở thời điểm nào mà chỉ cần biết trạng thái ở thời điểm đó là gì). Các loại xích Markov hữu hạn rời rạc này còn có thể được biểu diễn bằng đồ thị có hướng, trong đó các cung được gắn nhãn bằng xác suất chuyển từ trạng thái tại đỉnh (vertex) đầu sang trạng thái tại đỉnh cuối của cung đó.
Các xích Markov có liên quan tới chuyển động Brown và Tổng hợp ergodic, hai chủ đề quan trọng của vật lý trong những năm đầu của thế kỷ 20, nhưng Markov có vẻ phải tham gia vào quá trình phát triển của toán học, còn gọi là sự mở rộng của luật số lớn cho các sự kiện độc lập.
b. Ứng dụng của Markov
Các hệ thống Markovian xuất hiện nhiều trong vật lí, đặc biệt là cơ học thống
kê, bất cứ khi nào xác suất được dùng để biểu diễn các chi tiết chưa được biết hay chưa được mô hình hóa của một hệ thống, nếu nó có thể giả định rằng thời gian là bất biến và không có mối liên hệ trong quá khứ cần nghĩ đến mà không bao gồm sự miêu
tả trạng thái. Xích Markov có thể dùng để mô hình hóa nhiều quá trình trong lí thuyết hàng đợi và thống kê. Bài báo nổi tiếng của Claude Shannon năm 1948 “A mathematical theory of communication”, là một bước trong việc tạo ra lãnh vực lí thuyết thông tin, mở ra bằng cách giới thiệu khái niệm của entropy thông qua mô hình
hóa Markov của ngôn ngữ tiếng Anh. Mỗi mô hình đã lý tưởng hóa có thể nắm bắt được nhiều hệ thống được thống kê điều đặn. Thậm chí không cần miêu tả đầy đủ cấu trúc, giống như là những mô hình tín hiệu, hiệu quả trong việc giải mã dữ liệu thông
qua kỹ thuật viết code entropy. Nó cũng hiệu quả trong việc ước lượng trạng thái và xác định mẫu. Hệ thống điện thoại di động trên thế giới dùng giải thuật Viterbi để sửa
lỗi, trong khi các mô hình Markov ẩn (với xác suất chuyển đổi Markov ban đầu là không được biết và phải được ước lượng từ dữ liệu) được dùng rất nhiều trong nhận dạng tiếng nói và trong tin sinh học, chẳng hạn để mã hóa vùng/dự đoán gene.
26 Trong ngành quản lý đất đai: người ta còn ứng dụng GIS, RS và chuỗi Markov
vào phân tích sự thay đổi sử dụng đất, từ đó dự báo được tình hình sử dụng đất trong giai đoạn kế tiếp.
Ngoài ra Chuỗi Markov có rất nhiều ứng dụng như: Các hệ thống Markov xuất hiện nhiều trong vật lí, đặc biệt là cơ học thống kê. Chuỗi Markov có thể dùng để mô hình hóa nhiều quá trình trong lí thuyết hàng đợi và thống kê. PageRank của một trang web dùng bởi Google được định nghĩa bằng một chuỗi Markov. Chuỗi Markov cũng có nhiều ứng dụng trong mô hình sinh học, đặc biệt là trong tiến trình dân số. Một ứng dụng của chuỗi Markov gần đây là ở thống kê địa chất. Chuỗi Markov cũng có thể ứng dụng trong nhiều trò game. Trong ngành quản lý đất đai: người ta còn ứng dụng GIS, RS và chuỗi Markov vào phân tích sự thay đổi sử dụng đất, là ứng dụng mà đề tài nghiên cứu đáng hướng đến.
2.2.1.2. Mạng tự động (Cellutar Automata-CA) a. Khái niệm
Von Neumann and Ulam là những người đầu tiên đưa ra khái niệm về mạng tự động vào năm 1940 trong lĩnh vực khoa học máy tính. Hiện nay, khái niệm này được ứng dụng rộng rãi trong nhiều ngành khoa học như Vật lý, Toán học, GIS, Viễn thám,… Việc tích hợp mạng tự động và GIS đã tạo nên khả năng ứng dụng lớn và rộng rãi hơn, do khắc phục được các hạn chế trong việc mô hình hóa sự thay đổi cảnh quan theo thời gian của công nghệ GIS. Các hạn chế đó là: hạn chế khả năng đưa ra các mô hình đọng lực không gian, hạn chế trong tích hợp chiều thời gian vào các mô hình.
Mạng tự động có thể cung cấp động cơ phân tích, nhằm cung cấp một khung mềm dẻo cho việc lập trình và chạy mô hình động lực không gian khi được tích hợp với GIS.
Mạng tự động bao gồm 5 nhân tố chính:
- Không gian Raster (Cell Space): được tạo nên bởi một tập hợp các raster đơn lẻ.
- Tình trạng Cell (Cell States): Tình trạng của một cell có thể thêt hiện gia strị không gian như các loại hình sử dụng đất khác nhau.
- Bước thời gian (Time steps): Một mạng tự động sẽ tham gia vào tần suất xuất iện với các bước thời gian khác nhau. Tại mỗi bước thời gian, các cell sẽ được cập nhật gía trị dựa trên các quy luật chuyển tiếp.
- Quy luật chuyển tiếp (Transition rules): Quy luật là cốt lõi của mạng tự động. Một quy luật chuyển tiếp thường quy định tình trạng của cell trước và sau khi được cập nhật dựa trên điều kiện của tình trạng của các cell xung quanh.
27 - Cell xung quanh: Mỗi cell có 2 cell xung quanh – mạng tự động 1 chiều. Với mạng tự động 2 chiều, có 2 cách thức để định nghĩa các cell xung quanh. Von Eumann cho rằng có 4 cell xung quanh, còn Moore cho rằng có 8 cell xung quanh.
b. Ứng dụng của mạng tự động trong đánh giá biến động sử dụng đất
Một mô hình thường là kết quả của việc tìm hiểu mối quan hệ phức tạp trên
thực tế. Một mô hình thường là kết quả kiểm chứng mối quan hệ giữa hai hoặc nhiều hơn dãy số liệu. Mô hình còn được dùng để tìm hiểu và lý giải tại sao và bằng cách nào những dữ liệu đó tương tác với nhau hoặc lý giải cách thức các mối quan hệ nhằm góp phần hiểu rõ hơn thế giới thực và các hệ thống nhỏ hơn nằm trong khu vực.
Hiện trạng sử dụng đất phụ thuộc vào 3 nhân tố chính: Chất lượng và đặc điểm thổ nhưỡng; Tác động của các loại hình trên hoạt động sử dụng đất xung quanh; Nhu cầu sử dụng đất đối với một hoạt động kinh tế-xã hội cụ thể.
Với việc ứng dụng mạng tự động trong mô hình hóa biến động sử dụng đất có một số khó khăn: i) Mỗi raster trong mạng đều không có thuộc tính. Tất cả các cell đều
có giá trị như nhau và chúng được gán thuộc tính bởi các cell nằm xung quanh. Số lượng cell xung quanh phụ thuộc vào mạng tự động là 1 hay 2 chiều. ii) Trong một mạng tự động truyền thống, bất cứ một cell nào cũng đều phải trả qua quá trình chuyển đổi thông qua quy luật chuyển tiếp. Vì vậy, giá trị của cell là tự nhiên, trong khi đó, đối với hiện trạng sử dụng đất, giá trị của một cell được quy định cụ thể.
Do các mô hình là kết quả của quá trình khái quát thế giới thật, vì vậy khi mô
hình hóa cần phải giới hạn một số điều kiện biên. Một cách tổng quát, có thể định nghĩa hiện trạng sử dụng đất như một hàm số của nhiều biến như sau: Δ L = Δ L1 + Δ L2 + Δ L3 +… (1.2)
Trong đó: Δ L: tổng thay đổi của các loại hình sử dụng đất L1, L2,…: thay đổi của các loại hình sử dụng đất tương ứng
Một điều cần lưu ý là những thay đổi về hiện trạng sử dụng đất không chỉ là thay đổi vô hướng,nó gồm những giái trị kèm theo đổi. Về mặt lý thuyết, mỗi loại hình sử dụng đất thay đổi có thể biểu thị bằng một hàm số của nhiều biến số khác nhau.
Δ L1 = F(x1,x2,x3,..) (1.3)
Trong đó: L1: sự thay đổi của loại hình sử dụng đất thứ 1 X1,X2,..: các nhân tố (tỷ lệ gia tăng dân số, chính sách,..).
Những nhân tố nêu trên không chỉ có tác động tới loại hình sử dụng đất đang đánh giá mà còn ảnh hưởng tới các loại hình sử dụng đất khác.
28
2.2.1.3. Mô hình Land change modeler (LCM)
Mô đun tổng hợp được sử dụng cho việc phân tích, dự báo các thay đổi sử dụng đất, đánh giá các yếu tố ảnh hưởng đến đa dạng sinh học và quy hoạch lãnh thổ (Eastman, Van Fossen et al. 2005). Việc mô hình hóa biến động sử dụng đất sử dụng mô đun LCM đòi hỏi phải có hai bản đồ hiện trạng sử dụng đất tương ứng với hai thời điểm khác nhau T1 và T2; các bản đồ này được sử dụng như là dữ liệu đầu vào để phân tích các thay đổi sử dụng đất trong quá khứ, giúp cho việc nắm bắt các thông tin về sự tăng, giảm và các vùng chuyển đổi của các loại sử dụng đất khác nhau (Mishra,
Rai et al. 2014). Mô đun này cũng định lượng được những thay đổi sử dụng đất trong giai đoạn T1 và T2 (Mishra, Rai et al. 2014). Mô đun LCM cho phép dự báo sự biến động sử dụng đất với một, hai hoặc nhiều lớp sử dụng đất cùng một lúc trên cơ sở của quá trình chuyển đổi tiềm năng (khả năng chuyển đổi), mỗi quá trình chuyển đổi được mô hình hóa bằng một hàm hồi quy logistic hoặc mạng thần kinh đa lớp (Eastman, Van Fossen et al. 2005). Nếu lựa chọn thuật toán thích hợp với mục tiêu đặt ra, các bản đồ dự báo biến động sử dụng đất có thể có độ chính xác cao hơn 70% (Yirsaw, Wu et al. 2017) và cho phép trực tiếp xuất ra bản đồ dự báo sử dụng đất với các tên và số lượng lớp như các bản đồ hiện trạng đầu vào.
Quy trình lập bản đồ dự báo biến động sử dụng đất dựa trên mô hình LCM được tóm tắt ở sơ đồ hình 3, theo quy trình, trước tiên quá trình biến động sử dụng đất được xác định dựa trên việc phân tích đa thời gian của các bản đồ hiện trạng sử dụng đất; tiếp theo, các yếu tố thực sự có ảnh hưởng (các biến giải thích) đến sự biến động trên được đánh giá và xác định. Lịch sử biến động sử dụng đất và các nguồn thông tin mô tả các biến giải thích được tích hợp vào mô hình LCM để xây dựng các kịch bản sử dụng đất với thuật toán hồi quy logistic (Logistic Regression, viết tắt là LogReg) hoặc
mạng thần kinh đa lớp (Multi-Layer Perceptron, viết tắt là PMC) sau đó áp dụng chuỗi Markov để lập bản đồ dự báo sử dụng đất ở một thời điểm hiện tại nhằm hiệu chỉnh mô hình; kế tiếp là tiến hành đánh giá kết quả hiệu chỉnh mô hình bằng cách so sánh bản đồ dự báo sử dụng đất với bản đồ tài liệu ở cùng thời điểm; cuối cùng là xây dựng các kịch bản sử dụng đất trong ngắn hạn, trung hạn và dài hạn.