Dữ liệu phi không gian
Dữ liệu phi không gian hay cịn g ọi là thu ộc tính (Non - Spatial Data hay Attribute) (trả lời cho câu h ỏi nó là cái gì?) là nh ững mơ t ả về đặc tính, đặc điểm và các hiện tượng xảy ra tại các vị trí địa lý xác định. Một trong các chức năng đặc biệt của công ngh ệ GIS
“ Ứng dụng GIS và thu ật toán nội suy dự báo mức độ ơ nhi ễm khơng khí Tp. HCM trong t ương lai”
là kh ả năng của nó trong vi ệc liên kết và x ử lý đồng thời giữa dữ liệu bản đồ và d ữ liệu thuộc tính. Thơng th ường hệ thống thơng tin địa lý có 4 lo ại số liệu thuộc tính:
- Đặc tính của đối tượng: liên kết chặt chẽ với các thông tin khơng gian có th ể thực hiện SQL (Structure Query Language) và phân tích.
- Số liệu hiện tượng, tham khảo địa lý: miêu tả những thông tin, các hoạt động thuộc vị trí xácđịnh.
- Chỉ số địa lý: tên, địa chỉ, khối, phương hướng định vị, …liên quan đến cácđối tượng địa lý.
- Quan hệ giữa cácđối tượng trong không gian, có th ể đơn giản hoặc phức tạp (sự liên kết, khoảng tương thích, mối quan hệ đồ hình giữa cácđối tượng).
2.2.2. Phân tích h ồi quy
Đây là m ột phương pháp thống kê mà giá ịtrkỳ vọng của một hay nhiều biến ngẫu nhiênđược dự đoán dựa vào điều kiện của các biến ngẫu nhiên đ(ã tính tốn) khác. Phân tích hồi qui khơng ch ỉ là trùng kh ớp đường cong (lựa chọn một đường cong mà v ừa khớp nhất với một tập điểm dữ liệu); nó cịn ph ải trùng khớp với một mơ hình v ới các thành phần ngẫu nhiên và xácđịnh (deterministic and stochastic components). Thành ph ần xác
định được gọi là b ộ dự đoán predictor() và thành ph ần ngẫu nhiênđược gọi là ph ần sai số (error term).
Khi quan sát bộ số liệu thì thấy các ốs liệu đo đạc được có chi ều hướng tăng theo từng năm, rất thuận tiện cho sử dụng phân tích h ồi quy tuyến tính.
Hồi quy tuyến tính
Hồi quy tuyến tính là m ột trường hợp rất phổ biến trong thực tế, mơ hình h ồi quy tuyến tính đơn giản có d ạng :
“ Ứng dụng GIS và thu ật toán nội suy dự báo mức độ ơ nhi ễm khơng khí Tp. HCM trong t ương lai”
Trong đó:
Yi : Giá trị của biến phụ thuộc y trong lần quan sát thứ i Xi: Giá trị của biến độc lập x trong lần quan sát thứ i ei: Sai số ngẫu nhiên của lần quan sát thứ i
A: Là giá trị trung bình của biến phụ thuộc Y khi biến độc lập X thay đổi 1 đơn vị B: Là thông s ố diễn tả độ dốc của đường hồi qui của tập hợp chính, hay B diễn tả sự thay đổi của giá trị trung bình của biến phụ thuộc Y khi biến độc lập X thay đổi 1 đơn vị.
Phương trình hồi quy tuyến tính đơn giản của mẫu
Chúng ta có thể ước lượng các tham ốs (A,B) của phương trình hồi qui tuyến tính đơn giản của tập hợp chính bằng cách ửs dụng số liệu của mẫu ngẫu nhiên thu thập được. Dựa vào s ố liệu của mẫu ta có ph ương trình hồi qui tuyến tính đơn giản của mẫu.
Ŷ= a + bX
Trong đó:
Ŷ là ước lượng của giá trị trung bình của Y đối với biến X đã bi ết a: là ước lượng của A
b: là ước lượng của B
Bằng phương pháp bình phương cực tiểu, người ta chứng minh được rằng a, b là nh ững ước lượng không ch ệch và v ững của A,B.
2.2.3. Thuật toán nội suya. Nguyên lý nội suy a. Nguyên lý nội suy
Nội suy không gian Xây d ựng tập giá trị cácđiểm chưa biết từ tập điểm đã bi ết trên miền bao đóng c ủa tập giá trị đã bi ết bằng một phương pháp hay một hàm tốn học nào đó được xem như là quá trình nội suy. (Theo giáo trình thực hành phân tích khơng gian -
“ Ứng dụng GIS và thu ật toán nội suy dự báo mức độ ơ nhi ễm khơng khí Tp. HCM trong t ương lai”
b. Phân lo ại thuật toán nội suy
Hiện nay trên thế giới có r ất nhiều thuật tốn nội suy, mỗi thuật tốn nội suy thì có những điểm mạnh riêng. Các thuậ tốn nội suy có th ể được phân lo ại:
- Nội suy điểm / Nội suy bề mặt.
- Nội suy toàn di ện / Nội suy địa phương (Trong trường hợp những hàm đường cong đơn giản hoặc độ khớp của bề mặt được xácđịnh, nội suy đó được xem là n ội suy tồn di ện. Và trong tr ường hợp khác, mức độ khớp của các mẫu quan sát chiếm tỉ lệ nhỏ trong khu vực thì nội suy đó được gọi là n ội suy địa phương ).
- Nội suy chính xác / Nội suy gần đúng ( Khi đường cong hoặc bề mặt khớp với tất cả các mẫu dữ liệu quan sát, nội suy đó được xem là n ội suy chính xác. Trong trường hợp đường cong nội suy hay bề mặt nội suy khơng đi qua tất cả các mẫu quan sát vì một số sai số , nội suy này được gọi là n ội suy gần đúng).
Dữ liệu về thông tin ch ất lượng khơng khí được thu thập dưới dạng điểm, phép nội suy sử dụng là N ội suy điểm. Trong đó l ại phân lo ại thành các phép ộni suy chính xác và gần đúng. Đề tài ứng dụng phép nội suy IDW:
Nội suy IDW
Là m ột trong những kỹ thuật phổ biến nhất được sử dụng để nội suy cácđiểm phân tán. Phương pháp IDW dựa trên giả định rằng bề mặt nội suy bị ảnh hưởng nhiều nhất bởi những điểm gần đó và ít b ởi cácđiểm xa hơn. Phương pháp IDW xácđịnh các giáị trcell bằng cách tính trung bình các giáị ctrủa cácđiểm mẫu trong vùng lân c ận của mỗi cell.
“ Ứng dụng GIS và thu ật toán nội suy dự báo mức độ ơ nhi ễm khơng khí Tp. HCM trong t ương lai”
- Cơng th ức nội suy:
Trong đó d ij là kho ảng cách không gian giữa 2 điểm thứ i và th ứ j, số mũ p càng cao thì mức độ ảnh hưởng của cácđiểm ở xa càng th ấp và m ột số xem như không đáng kể, thông th ường p = 2.
Hinh 2.2: Mối quan hệ giữ sự ảnh hưởng và kho ảng cách
- Bán kính tìm kiếm (Search Radius)
Đặc trưng của bề mặt nội suy cịn ch ịu ảnh hưởng của bán kính tìm kiếm. Bán kính này gi ới hạn số lượng điểm mẫu được sử dụng để tính cell được nội suy.
- Có hai lo ại bán kính tìm kiếm : cố định (fixed) và bi ến đổi (variable).
+ Fixed search radius
Là bán kính với một số lượng điểm mẫu nhỏ nhất và m ột khoảng cách xácđịnh. Khi số lượng điểm mẫu khơng đủ trong bán kính này thì nó sẽ tự động nới rộng ra chừng nào đủ số điểm mẫu bé nhất có th ể.
“ Ứng dụng GIS và thu ật toán nội suy dự báo mức độ ơ nhi ễm khơng khí Tp. HCM trong t ương lai”
Số lượng cácđiểm mẫu cố định và kho ảng cách tìm kiếm lớn nhất. Bán kính biến thiên tìm cácđiểm mẫu gần nhất với khoảng cách tìm kiếm lớn nhất cho đến khi số lượng điểm thu được đầy đủ. Nếu số lượng điểm mẫu phải thu được khơng đủ bên trong khoảng cách tìm kiếm lớn nhất thì chỉ có nh ững điểm mẫu thu được là được dùng cho nội suy.