A (5 polygon) B (3 polygon) C (14 polygon)
1.5.3. Phân tích mẫu điểm
Điểm là hình thức phân bố rất phổ biến trong tự nhiên đặc biệt là trong thực tế của công tác nghiên cứu, quản lý tài nguyên, môi tr−ờng. Trong phân tích điểm, toàn bộ các điểm đ−ợc phân tích xử lý chứ không phải chỉ có phân tích cho từng điểm riêng biệt.
Vì điểm là đối t−ợng có kích th−ớc bằng 0 nên việc đo đạc về điểm th−ờng là đo các thông số sự phân bố, mật độ và xác định vị trí của điểm. Diện tích của điểm th−ờng không đ−ợc đo mặc dù chúng chiếm một diện tích nhất định trên bản đồ. Thông th−ờng những thông số định l−ợng về các điểm đ−ợc coi là bằng nhau.
Về sự phân bố của các điểm, các thông số sau th−ờng đ−ợc tính đến nh−: tần số xuất hiện, mật độ, vị trí hình hoạ, độ lệch không gian và sự sắp xếp không gian. Những nghiên cứu về điểm phần lớn dựa vào các nguyên tắc của thống kê mô tả.
Tần số là số điểm xuất hiện trên bản đồ. Đây là thông số đầu tiên hay đ−ợc đo về phân bố điểm. Nếu thông số này đ−ợc đo trong nhiều thời gian thì các số liệu đ−ợc áp dụng về quá trình tiến triển của điểm hay của tập hợp điểm. Nếu diện tích vùng nghiên cứu là khác nhau thì thông số đ−ợc so sánh là mật độ điểm theo một đơn vị diện tích.
Thuộc tính hình học của điểm cần đ−ợc xác định, đó là vị trí trung tâm và độ lệch của điểm so với trung tâm của vùng tập trung.
- Vị trí tâm điểm: xác định bằng toạ độ x, y.
- Độ lệch đo giá trị độ lệch chuẩn so với giá trị trung bình.
Cần chú ý rằng trong tr−ờng hợp giá trị độ phân tán lớn thì các trung tâm về mặt hình học không nhất thiết đúng là nơi độ h−ớng tâm cao, hình mô tả cho các dạng phân bố điểm khác nhau.
A b c d
Hình 41. Mô tả cho các dạng phân bố điểm khác nhau
Độ phân tán có thể đ−ợc tính theo trục X hay Y tuỳ theo các giá trị độ lệch chuẩn mà hình dạng phân bố của các điểm có thể là hình kéo dài, elip hoặc phân tán.
phân b ố đều, tập trun g ph ân bố ph ân tán p hân bố n gẫu n hiên
Để tính hệ số gần gũi thì cho một điểm gần nhất cần đ−ợc phát hiện và đa đạc khoảng cách tới điểm đó.
Nếu gọi di là khoảng cách từ một điểm gần nhất thì giá trị:
Ad = (∑i di)/n là giá trị khoảng cách trung bình gần nhất của mẫu điểm với n là tổng số điểm trong vùng nghiên cứu.
Mỗi điểm đ−ợc xác định bằng toạ độ và khoảng cách đ−ợc đo trực tiếp trên bản đồ. Nh− vậy khi Ad nhỏ thì các điểm là gần nhau hơn.
Trong tr−ờng hợp phân bố ngẫu nhiên, có thể áp dụng công thức sau để tính khoảng cách trung bình giữa các điểm:
n A Ed 2 1 = ở đây: A là diện tích bản đồ. n: là số điểm
Ed là khoảng cách trung bình giữa các điểm. Có thể áp dụng để tính cho mọi sự phân bố. Trong phân bố đều, hai điểm liền kề có thể chồng lên nhau và khi đó khoảng cách là 0.
Hệ số láng giềng gần nhất đ−ợc tính nh− sau:
Ed Ad NNI =
Giá trị NNI giữa hai khái niệm giao động từ 0 - 2,1491
Khi toàn bộ các điểm mẫu rơi vào một vị trí thì khi đó Ad = 0, NNI = 0
Trong tr−ờng hợp phân bố phân tán, khoảng cách giữa các điểm tăng lên, lúc đó Ad là cực đại và NNI đạt tới 2,1491. Khi NNI = 1, mẫu đ−ợc coi là có phân tán ngẫu nhiên và lúc đó Ad = Ed.
Nhìn chung, nếu NNI có giá trị nhỏ thì đặc tr−ng cho phân tán theo nhóm đều, ở bảng trên, các giá trị NNI của 3 nhóm là: Nhóm A có NNI = 0,41, nhóm B = 2,03, nhóm C = 1,08.
Với các kiểu phân bố nói trên, độ lệch chuẩn đ−ợc tính nh− sau: Z = (Ad - Ed) δAd
Z: độ lệch chuẩn của nhóm
δ: độ lệch chuẩn của Ad n là số điểm
Phân tích theo nguyên lý chia 4 (quadrat) và nguyên lý Poisson
Phân tích theo nguyên tắc chia 4 là ph−ơng pháp đ−a phân bố mẫu vào bản đồ có chia thành các ô nhàm mục đích xác định sự phân bố. Cơ sở của nguyên tắc là dựa vào sự xuất hiện tần số trong các ô chứ không dựa vào khoảng cách tách biệt. Các ô có thể khác nhaua về kích th−ớc và hình dạng, có thể đặt ngoài hoặc trong bản đồ. Có nhiều cách phân tích khác nhau. Một ph−ơng pháp là đặt ô l−ới vào trong bản đồ và đếm các điểm xuất hiện trong từng ô rồi phân loại các ô dựa theo tần số xuất hiện của các điểm trong đó. Để phân tích một cách có hiệu quả thì số điểm xuất hiện trong một lớp ít nhất phải là 5 điểm. Nếu trong các ô đã chia số điểm xuất hiện ít hơn 5 (chẳng hạn 1, 2, 3, 4) thì phải gộp các ô đó thành một lớp với nguyên tắc số điểm trong một lớp phải lớn hơn hoặc bằng 5.
Đối với mỗi lớp, tần số quan trắc đ−ợc trong một số ô đ−ợc qui định là Qi với i là lớp thứ i, xác xuất xuất hiện trong mỗi ô đ−ợc tính theo phân bố Poisson
!) ) ( x e x P ẽ λ λ − =
x là tần số trong ô (đếm trong ô)
λ là tần số giả định cho ô chuẩn
e (số e) là cơ số cua logarit tự nhiên = 2,718282 Tần số phân bố giả định đ−ợc tính cho mối lớp i là Ei x2 = ∑ i (0i - Ei)2Ei
Với x2 có giá trị nhỏ hơn số thống kê trong bảng thì theo lý thuyết, đó sẽ là mẫu phân bố ngẫu nhiên. Ví dụ sau sẽ minh hoạ cho nội dung trên:
A b c
phân bố phân t án phân bố ngẫu nhiên phân bố nhóm
Hình 43. Sự phân bố ngẫu nhiêncủa các điểm
Có 3 mẫu với 3 kiểu phân bố khác nhau (A: phân tán, B: ngẫu nhiên, C: nhóm) đ−ợc chia thành các ô nhỏ theo kết quả có 36 ô. Kết quả tính đ−ợc cho lớp A nh− sau: Căn cứ vào kết quả tình thì mức phân bố tự do của các lớp tính đ−ợc cho lớp A là:
x2 = 0,23 - 3,96 - 3,15 = 7,34
Giá trị này > ∑x nên phân bố này không phải là phân bố ngẫu nhiên. T−ơng tự ta tính đ−ợc các giá trị của x2 cho lớp B và C và đ−a ra đ−ợc kết quả về sự phân bố của B là ngẫu nhiên còn C thì không phải là ngẫu nhiên.
Tự liên kết không gian (Spatial Antocorrelation)
Phân tích mẫu điểm theo phân bố poisson cũng có những hạn chế vì ph−ơng pháp này chỉ căn cứ vào tần số xuất hiện đếm đ−ợc, song lại không quan tâm đến sự phân bố của các ô phần t−, vì thế quan hệ không gian không đ−ợc xết đến.
Hình 44. Mô hình phân bố không gian
Trong ví dụ mô phỏng ở trên, 2 kiểm phân bố hoàn toàn khác nhau song không đ−ợc xét đến. Vì vậy phải áp dụng một ph−ơng pháp khác để nghiên cứu quan hệ không gian giữa các đối t−ợng, dựa trên nguyên tắc là xem xét ảnh h−ởng của các đối t−ợng ở những vùng liền kề nhau.
Trong việc nghiên cứu mỗi quan hệ, những tác động ảnh h−ởng đến sự phân bố của các lớp nằm liền kề nhau đ−ợc xem nh− tác động đến xu h−ớng phân bố toàn bộ các điểm theo từng nhóm.
Một khi có sự cạnh tranh giữa các đối t−ợng chiếm −u thế của quá trình phân bố trong không gian, nghĩa là có tình trạng một đối t−ợng tồn tại theo xu thế loại bỏ các đối t−ợng khác ở xung quanh mình, thì sự phân bố đó thể hiện sự phân bố phân tán song lại có quan hệ không gian chặt. Nếu không có xu h−ớng làm tan hoặc đẩy lùi trật tự không gian cũ thì sự phân bố đó là ngẫu nhiên và không có quan hệ không gian.
Để tính mối quan hệ đó, hệ số hay đ−ợc sử dụng là hệ số Morans (Moran 1948, Cliff và Ord 1981): ∑ ∑ ∑ − − − = 2 ) ( ) )( ( x xi i So x xj x xi ij j i n I δ ở đây: So = ∑ i ∑j δịj
Giá trị dự kiến và độ lệch đ−ợc tính nh− sau:
1) ) 1 ( ) 1 ( =− n− − E ) 1 ( 3 2 1 2 2 2 2 − + − = n So So nS S n I ở đây: S1 = (1/2) ∑ i ∑j (δij - δij )2 S2 = ∑i (∑i δij - Ejδji)2
n là số đơn vị địa lý - hay là số điểm
δij: hệ số liên hệ không gian giữa điểm thứ i và thứ j Xi: tần số phân bố không gian
So: tổng số cặp có trong quan hệ không gian
Giá trị hệ số i th−ờng thay đổi từ -1 đến 1. Nếu giá trị i là d−ơng là lớn (<= 1) thì phân bố theo nhóm nếu i là <= 0 thì phân bố là phân tán. Khi i = 0 thì không có quan hệ và khi đó phân bố là ngẫu nhiên.
Hai ví dụ nêu trong hình trên không có sự khác biệt nếu dùng hệ số poisson, song nếu dùng hệ số i của Morans thì sẽ tính đ−ợc i = -95 cho hình bên trái vì đó là phân bố theo nhóm và quan hệ đó là chặt. Còn cho hình bên phải, i có giá trị - 2,1, đó là đặc tr−ng cho phân bố phân tán.
Một việc cần chú ý trong việc tính quan hệ không gian là độ chính xác của việc tính toàn còn phụ thuộc vào độ phân giải của các ô đ−ợc chia ra. Trong một số tr−ờng hợp hệ số i không thể áp dụng cho việc tính với phân bố của điểm. Trong khi nghiên cứu, cần có sự so sánh giữa hệ số i với các hệ số khác nh− hệ số gần gũi NNI (Nearest Neighborn Index) hoặc giá trị thống kê Poisson, từ đó có thể đ−a ra những kết luận phù hợp.
Lấy mẫu các đối t−ợng điểm
Việc lấy mẫu là rất quan trọng trong phân tích mẫu điểm, đặc biệt là khi t− liệu có khối l−ợng lớn. Nếu thuộc tính không gian có thể khai thác đ−ợc từ một mẫu thì không nhất thiết phải xử lý toàn bộ các đối t−ợng và thông th−ờng điều đó khó thực hiện vì không thể lấ toàn bộ mẫu. Chẳng hạn để xác định độ cao địa hình, phải đo theo các điểm lựa chọn chứ không thể đo độ cảo ở khắp mọi nơi. Một trong những ứng dụng quan trọng khác của việc lấy mẫu không gian là sự ngoại suy trong xử lý không gian. Về mặt lý thuyết, phải lựa chọn ph−ơng pháp ngoại suy thích hợp đối với từng hệ thống mẫu. Vì vậy trong lấy mẫu có nhiều ph−ơng pháp khác nhau.
Lấy mẫu phi không gian: là việc lấy mẫu không có tham khoả các hợp phần không gian. Ví dụ: trong marketing, có thể chào hàng một cách bất kỳ theo số điện thoại ở danh bạ mà không cần tham khảo bản đồ. Tuy nhiên các mẫu này vẫn đ−ợc sử dụng trong xử lý không gian.
Lấy mẫu không gian: HTTĐL sẽ trở nên có hiệu quả cao nếu xử lý một hệ thống mẫu đ−ợc lấy theo nguyên tắc không gian, nghĩa là có sự tham khảo các yếu tố địa lý khi lấy mẫu. Ví dụ: nếu điều tra về hộ trong vùng ngoại ô, có thể sử dụng tài liệu điều tra theo các tuyến, sau đó lựa chon ngẫu nhiên 10% chủ hộ trong mỗi tuyến để phỏng vấn. Nh− vậy kết quả sẽ sát thực tế hơn là việc lựa chọn ngẫu nhiên theo số điện thoại cứ cách 10 số lại hỏi 1 số.
Số l−ợng điểm lấy mẫu có thể là ngẫu nhiên. Trong tr−ờng hợp toàn bộ các điểm đều có các giá trị ID riêng và khi đó việc lấy mẫu vẫn đ−ợc coi là phi không gian vì việc xử lý sẽ không tham khảo yếu tố hình học.
Song song với việc lấy mẫu trên, một mẫu ngẫu nhiên có thể đ−ợc lấy riêng biệt bằng cách xác định toạ độ của từng điểm rồi đ−a lên bản đồ, sau đó lựa chọn các mẫu theo từng ph−ơng thức. Ví dụ khi lấy mẫu theo vòng tròn với bán kính nhất định. Tr−ờng hợp đó chỉ lấy các điểm ở trong vòng tròn hoặc lấy theo vùng đệm của đ−ờng, của điểm.
Việc lấy mẫu phi không gian hoặc không gian có thể đ−ợc thực hiện một cách ngẫu nhiên hoặc có hệ thống. Trong tr−ờng hợp lấy mẫu hệ thống thì sự phân bố điểm không thể là ngẫu nhiên. Ví dụ: muốn nghiên cứu điều kiện xã hội ở vùng ngoại ô, một tập mẫu gồm 1000 hộ đ−ợc phỏng vấn từ 200 tuyến điều tra. Đối với mỗi tuyến việc điều tra có thể là ngẫu nhiên, song đối với toàn vùng thì sự phân bố các điểm số liệu đó không đ−ợc coi là ngẫu nhiên mà có thể là phân bố theo nhóm.
Tổ hợp không gian: trong phân tích mẫu điểm phân tích tổ hợp không gian là phân tích mối quan hệ giữa cá yếu tố điểm và một loạt các yếu tố khác. Trong tổ hợp không gian, các điểm phải đ−ợc giới hạn trong các yếu tố polygon để tiện so sánh đánh giá, ví dụ nghiên cứu bằng các kỹ thuật giật lùi (Regression Techniques), các b−ớc tiến hành cụ thể nh− sau:
B−ớc đầu tiên là xác định các đơn vị địa lý, các đơn vị này đ−ợc chia theo các hệ thống chú giải thích hợp.
Khoảng cách giữa các điểm.
B−ớc thứ ba: phân loại các nhóm điểm căn cứ vào các thông số phân tích đ−ợc.
B−ớc thứ năm: phân tích kết quả chồng xếp và tính toán dự báo.
B−ớc cuối cùng: kiểm tra đánh giá kết quả phân tích và kết quả dự báo. Phân tích phân bố điểm trong HTTĐL là quá trình quan trắc sự phân bố theo nguyên tắc thống kê, kiểm tra sự sắp xếp trong không gian của các đối t−ợng điểm và phân tích đặc điểm phân tích đặc điểm phân bố không gian của các mẫu điểm bằng ph−ơng pháp xử lý thông kê mối quan hệ không gian. Ngoài ra, trong nghiên cứu về điểm, HTTĐL cũng yêu cầu việc lựa chọn và lấy mẫu điểm theo những nguyên tắc phù hợp với các yêu cầu xử lý không gian.
Bài tập
1 - Căn cứ theo bảng sau so sánh các mẫu không gian dựa theo hệ số gần gũi (NNIS) a b 1 5 3 7 6 2 4 2 1 3 5 4 6 7 a b 1 5 3 7 6 2 4 2 1 3 5 4 6 7
2 - Xác định xem 3 kiểu phân bố ở phía d−ới sơ đồ sau là kết quả của phân bố ngẫu nhiên hay không - sử dụng phân tích chia 4 của poisson để phân tích.
3 - Tính hệ số Marran cho 3 kiểu phân bố điểm thể hienẹ trong ph−ơng trình trên (của câu 2), so sánh các giá trị.
4 - Số hoá các điểm phân bố trong hình d−ới, xác định toạ độ x và y của các điểm (sử dụng chức năng addxy) trong ARC/INFO để tạo toạ độ. Tr−ờng hợp không có toạ độ thì đ−a tạo độ t−ơng đối thay thế. Trên cơ sở toạ độ, xác định giá trị thống kê của trung tâm điểm và độ lệch chuẩn cho toạ độ x và y và mô tả mẫu phân bố không gian. Tính toán hệ số NNIS của phân bố.