Đo đạc các t− liệu thuộc tính

Một phần của tài liệu HỆ THỐNG THÔNG TIN ĐỊA LÝ - GEOGRAPHICAL INFORMATION SYSTEM docx (Trang 32 - 36)

Trong cả việc lập bản đồ số và phân tích định h−ớng của các hiện t−ợng và đối t−ợng không gian thì các đối t−ợng (hoặc đơn vị địa lý) đều phải đ−ợc định l−ợng hoá và đ−ợc xử lý theo các giá trị đo đạc. Việc đo các dữ liệu thuộc tính phụ thuộc vào tính chất mà có thể đánh giá đ−ợc và khả năng tài liệu cho phép. Việc đo đạc các tài liệu thuộc tính đ−ợc chia ra các mức sau: có tồn tại trên danh nghĩa (niminal), thông th−ờng (ordinal), khoảng cách biệt (interval) và tỉ số (ratio).

Đo đạc các mức độ (levels)

Đo mức độ danh nghĩa (normal): là sự đo đạc về tính chất và chủng loại. Ví dụ: tên đất n−ớc sinh ra, màu, nơi sinh, địa bàn có quyền bầu cử (ví dụ ở Mỹ). Tính chất này chỉ mang tính chất đặt tên theo thứ tự mà không có thuộc tính nào về khoảng cách hay về bản chất. Ví dụ: thứ tự đặt tên theo vần ABC nghĩa là A tốt hơn B. Cách đặt tên có thể là theo vần hoặc theo thứ tự. Trong tr−ờng hợp đặt tên theo số thứ tự thì giá trị số đó không thể đ−ợc dùng để tính toán.

Đo mức độ thứ hạng (ordinal): là xác định ý nghĩa trong khái niệm của một trật tự mà ở đó mỗi một chỉ tiêu có giá trị đồng nhất khi so sánh với các chỉ tiêu khác. Ví dụ: một ng−ời nào đó có thể nằm trong trật tự phân chia về nghề nghiệp hoặc vị trí xã hội nh−: công nhân, trí thức, nông dân ... tầng lớp nghèo, trung bình hay giàu (về mức độ thu nhập). Trong tr−ờng hợp đó, tầng lớp trung bình phải ở thứ hạng cao hơn nghèo và thấp hơn giàu.

Khi áp dụng đo đạc mức độ thứ hạng có thể xác định thuộc tính (code) theo a b c hoặc theo trật tự số, nh−ng mức độ của sự khác biệt giữa các thứ hạng thì không đ−ợc làm rõ về định l−ợng. Vì vậy, trật tự các số hạng không thể dùng để tính toán về mặt toán học mà chỉ xác định về mối quan hệ. Ví dụ : bảng độ cứng của các khoáng vật hay cấp bão, cấp động đất là các minh hoạ t−ơng đối rõ của sự đo đạc và phân chia về số hạng.

Đo khoảng cách biệt (interval)

Việc đo đạc khoảng cách biệt là xác định về trật tự và khoảng cách giữa các chỉ tiêu, khoảng cách giữa các chỉ tiêu là ổn định và bằng nhau về đơn vị. Ví dụ điển hình của sự phân chia này là thang nhiệt độ Census (cả nhiệt độ Ken vin). Trong đó, khoảng khác giữa 50o và 49o là bằng với khoảng khác nhau giữa 49o

và 48o. (Tất nhiên 50o thì không có khái niệm là ấm hơn 25o hai lần).

Một tính chất khác nhau trong việc đo khoảng cách biệt là không có giá trị của điểm khởi đầu. Ví dụ: 0oC là xác định nhiệt độ của điểm đóng băng nh−ng không có nghĩa là ở 0oC là hết nhiệt.

Nói tóm lại, việc đo khoảng cách biệt cho pháp xác định sự khác nhau giữa các hiện t−ợng nh−ng không có nghĩa về sự khác biệt biên độ (ví dụ, bão cấp 2 không có nghĩa là mạnh hơn gấp 2 lần bão cấp 6 hay kim cứng (độ cứng 10) không có nghiã là cứng hơn thạch cao (độ cứng 2) là 5 lần.

Đo đạc tỷ số: đo đạc tỉ số thì đầy đủ tính chất của việc đo khoảng cách biệt, có thêm một thuộc tính là giá trị 0 đ−ợc xác định bởi đồ thị. Ví dụ, khi đo khoảng cách tự nhiên, không cách 0 đ−ợc hiểu là sẽ không có khoảng cách giữa hai đối t−ợng. Khoảng cách này đ−ợc xác định rõ và một điểm giá trị 0 cũng có ý nghĩa tỷ số đã đ−ợc tính. Cụ thể hơn về ý nghĩa đó là khi ta nói 10 km có khoảng cách gấp hai lần 5 km.

Một ví dụ khác là khi tính trọng số cho một đơn vị đo khi trọng số bằng 0 nghĩa là không có trọng số. Nó có ý nghĩa khi nói 10km3 nặng gấp 2 lần 5m 3 . Trong kinh tế, trọng số thể hiện cho sự thu nhập mặc dù đơn vị tiền tệ tính có thể khác nhau. Khi đó, định l−ợng về ý nghĩa hoàn toàn đ−ợc xác định.

Sự h−ớng tâm và sự phân tán (central tendency and disperion): xác định sự h−ớng tâm hay phân tán là nội dung quan trọng nhất của xử lý thống kế các hiện t−ợng, trong thống kê, sự h−ớng tâm thể hiện một tr−ờng (trend) của sự phân bố. Trong khi đó, sự phân tán thể hiện độ phân tán so với mức phân bố (tendency) trung tâm.

Ví dụ khi tính toán tổng thu nhập khi so sánh giữa hai nhóm dân tộc giá trị trung bình là một giá trị thống kê ở mức h−ớng tâm giá trị đó có thể đ−ợc sử dụng làm chỉ thị cho mức tổng thu nhập, từ đó có thể so sánh thu nhập của hai nhóm với nhau, khi đó mức độ phân tán cho biết giá trị trung bình.

Với những giá trị khác nhau đo đ−ợc ở tỷ lệ thông dụng, sự h−ớng tâm đ−ợc xác định bởi giá trị mode, đó là lớp giá trị có tần số phân bố cao nhất. Ví dụ: một khu vực có 3 dân tộc sinh sống là đân tộc A chiếm 30%, dân tộc chiếm 60% và dân tộc C chiếm 10%. Tr−ờng hợp đó, mode của khu vực là B vì có số dân đông nhất. Trong tr−ờng hợp đó mode thể hiện sự h−ớng tâm cũng là B nếu nh− sự phân bố là ngẫu nhiên, tần số của mode nhóm đ−ợc xác định là f mode và sự phân tán ở tỷ lệ đo thông dụng đ−ợc tính bởi tỷ số khác biệt (variation ration).

V = 1 - (f mode/N)

ở đây: V là tỷ số khác biệt

N là tổng số phân bố

Giá trị nhỏ hơn của sự phân tán thể hiện cho tr−ờng hợp h−ớng tâm nhiều và mode là chỉ thị tốt hơn cho tr−ờng phân bố. Nếu nh− một nhóm dân tộc chiếm nhiều hơn 80% tổng số dân trong vùng thì tỷ số sự khác biệt là 0,2. Nếu dân tộc chiếm đa số song cũng chỉ đạt 80% tổng số dân thì tr−ờng hợp đó tỉ số phân tán là 0,6.

Mức tập trung của việc đo sự khác biệt về thứ hạng đ−ợc tính bởi giá trị trung bình, đó là tr−ờng hợp có sự tập trung ở giữa (nghĩa là có một số giá trị cao hơn hoặc thấp hơn giá trị trung bình). Vì sự khác biệt đ−ợc đo ở tỷ lệ về thứ hạng nên toàn bộ các tr−ờng hợp có thể phân bố dạng phân nhánh, có nhấnh nằm ở thứ hạng cao hoặc tháp hơn giá trị trung bình. Tr−ờng hợp đó giá trị trung bình sẽ rơi chính xác vào khoảng giữa của tập hợp. Ví dụ nếu có 15 ng−ời lớn th−ợc về nhánh đi xuống ở một tầng lớp trong xã hội thì tr−ờng hợp thứ 8 là thuộc về giá trị trung bình của vùng phân bố này. Khi đó giá trị trung bình cho biết một điều là nếu có một ng−ời thuộc về thứ hạng cao hơn thì có thể vẫn thuộc về thì

có thể vẫn thuộc về tầng lớp đó hoặc cao hơn. Còn những ng−ời ở thấp hơn thứ hạng thì vẫn có thể thuộc về tầng lớp đó hoặc ở thấp hơn.

Sự phân tán của sự khác biệt về thứ hạng đ−ợc tính theo tỷ lệ thập phân, với sự khác biệt giá trị giữa định và đáy của phân vị thứ 10. Ví dụ: điều tra sự phân tán về −u thế cuộc sống của 50 thành phố, thứ hạng khác biệt xây dựng theo tỉ lệ từ 1 -10, khi đó 10 sẽ là −u thế cao nhất. Nếu nh− có 5 thành phố có −u thế nhất thì nó có thể nằm ở thứ hạng là 8 thuộc về phần đỉnh của thứ hạng 1 - 10, còn lại là 45 thành phố sẽ nằm ở phần đáy của thứ hạng và có giá trị là 3, và nh− vậy sự khác biệt (phân tán) sẽ là 5 (khác biệt giữa 3 và 5). Ng−ợc lại, việc điều tra cho thấy có 5 thành phố thuộc về thứ hạng 6, còn lại 45 thành phố thuộc thứ hạng 4 thì sự phân tán chỉ là 2. Nói tóm lại, giá trị thứ hạng của sự khác biệt là thể hiện mức độ của sự khác biệt và thứ hạng đó đ−ợc dùng ở tỷ lệ thập phân. Sự tập trung của cả việc đo về khoảng khác biệt (interval) hay tỉ số (ratio) đều đ−ợc tính toán theo giá trị trung bình:

NZ Z

Z = ∑ i

ở đây: Zi là tr−ờng hợp phân bố thứ i trong vùng phân bố.

Σi là tổng các giá trị Z trong vùng phân bố N tổng các phân bố

Sự phân tán so với giá trị trung bình đ−ợc tính bằng độ khác biệt hay ph−ơng sai (variance) hay độ lệch tiêu chuẩn (Standard Deviation).

( ) N Zi ∑ = −Σ2 2 σ

ở đây: σ là ph−ơng sai

Σ là độ lệch chuẩn

Độ lệch chuẩn lớn hơn thì sự phân tán cũng cao hơn còn nếu độ lệch nhỏ thì sự tập trung cao hơn. (adsbygoogle = window.adsbygoogle || []).push({});

Trong nhiều tr−ờng hợp, giá trị trung bình và độ lệch tiêu chuẩn của nhiều phép đo có thể không thích hớp cho việc xử lý các hiện t−ợng không gian khi mà trọng số không gian cần đ−ợc tính đến. Ví dụ, trong một phân bố mà các đơn vị địa lý khác nhau về kích th−ớc thì giá trị trung bình chỉ là chỉ thị tốt cho yếu tố kích th−ớc là có trọng số rất lớn. Trong tr−ờng hợp này, sự tập trung có thể đ−ợc tính toán theo khái niệm giá trị trung bình đ−ợc điều chỉnh theo vùng (area - adjusted mean):

∑∑ ∑ = Σ i i A A Z

ở đây: Ai là vùng của đơn vị thứ i, và độ lệch điều chỉnh theo vùng đ−ợc tính nh− sau: ∑ ∑ −Σ = i i i A Z A 2 2 ( ) σ

Sự h−ớng tâm và phân tán là các thông số cơ bản nhất của việc thống kê để mô tả một sự phân bố cuả bất kỳ một hiện t−ợng không gian nào. Chúng cũng đ−ợc dùng để so sánh các mẫu không gian của sự phân bố các yếu tố khác nhau với mục đích phân biệt sự khác nhau ảnh h−ởng đến mỗi yếu tố. Sự thống kê mang tính mô tả cũng đ−ợc sử dụng để phân tích sự thay đổi trong việc phân bố của

một hiện t−ợng để hiểu tốt hơn và phân tích đ−ợc rõ ràng những sự sắp xếp phân bố không gian.

Ví dụ sau thể hiện sự phân bố không gian của 3 loài chim với sự h−ớng tâm và phân tán khác nhau. Sự phân bố là ở kích th−ớc giống nhau và hình dạng địa lý giống nhau. Nh− vậy, sự phân bố đ−ợc tổ chức thành ô l−ới với kích th−ớc 5 x 5 ô. Các ô đánh dấu đen là có sự phân bố chim, còn ô trắng là không có. Sự h−ớng tâm thể hiện vị trí tập trung trung bình của các loài.

1 21 1 3 3 4 4 5 5 2 A 1 2 3 4 5 1 2 3 4 5 1 3 4 5 2 1 3 4 5 2 B C

Hình 17. Ví dụ về sự phân bố không gian

Nhóm A xuất hiện tập trung ở góc trên bên trái. Giá trị trung bình tính toán của toạ độ x và y là (2,2), còn nhóm B và C có giá trị trung bình ở toạ độ là (3,3). Nh− vậy nhóm chim A có sự h−ớng tâm khác với nhóm B và C, còn nhóm B và C có sự h−ớng tâm giống nhau. Độ lệch của sự phân bố không gian đ−ợc tính bằng độ lệch tiêu chuẩn. Nhóm A và B tuy có sự h−ớng tâm khác nhau nh−ng lại có độ lệch tiêu chuẩn với toạ độ của x và y là 0.83 và 0.83. Nói cách khác, ph−ơng thức hai nhóm A và B là có sự phân tán quanh giá trị trung bình giống nhau. Còn nhóm C, mặc dù có cùng giá trị h−ớng tâm với nhóm B song có sự phân tán rộng hơn, vì khi tính độ lệch chuẩn của nhóm C với x và y là 1.63 và 1.63. Giá trị đó thể hiện sự phân tán của nhóm C bằng hai lần của 2 nhóm kia. Nói cách khác, nếu giá trị độ lệch lớn thì ph−ơng thức phân bố là kém tập trung xung quanh trung tâm.

Tóm lại, phần này giải thích và trình bày cách tính định l−ợng các giá trị về vị

trí và thuộc tính của các đối t−ợng không gian. Trong thực tế bản đồ là sự thể hiện 2 chiều và vị trí của bất kỳ một đối t−ợng nào cũng đ−ợc xác định bằng cặp toạ độ x và y. Tuy nhiên việc chuyển vị trí từ hình cầu với 3 kích th−ớc sang mặt phẳng nằm ngang có 2 kích th−ớc luôn luôn là vấn đề gặp sai số trong việc xử lý phép chiếu. Các phân tích không gian nhất thiết phải chú ý đến các tính chất của ph−ơng pháp chiếu đ−ợc sử dụng trong những dữ liệu gốc. Các giá trị toạ độ luôn khác nhau giữa các hệ thống toạ độ, ở Mỹ và một số n−ớc Tây âu hay sử dụng hệ l−ới chiếu UTM hay Gausse. Một khi hệ toạ độ đ−ợc chọn chuẩn xác thì mọi phép tính trong xử lý không gian có thể đ−ợc áp dụng bằng các phép toán trong các phần mềm GIS (ví dụ tính độ dài, diện tích polygon). Để bổ sung cho việc đo đạc t− liệu về vị trí các phân tích không gian yêu cầu việc xử lý các dữ liệu thứ hạng và dạng tỉ số. Viêc thống kê giá trị h−ớng tâm và phân tán phải căn cứ vào tỉ lệ đo đạc hay trả lời với các câu hỏi khác nhau. Giá trị h−ớng tâm và phân tán đ−ợc xử lý bằng mode và tỉ số.

Bài tập

Đổi vị trí của một điểm ở vĩ độ 45o Bắc và kinh độ 171o Tây sang hệ toạ độ UTM với giả thiết Trái đất là hình cầu thực.

Mô tả hệ toạ độ UTM cho một điểm góc toạ độ 496 000 m h−ớng Đông, 20 000 m h−ớng Bắc, vùng 5 có sử dụng phốip hợp kinh độ, vĩ độ và mét.

Dùng ph−ơng pháp hình thang tính diện tích của Polygon d−ới đây (hoặc vẽ tay).

Tính toạ độ x, y cho các điểm nối tạo nên Polygon. Tính độ dài của mỗi segment và chu vi của Polygon.

Với các thông tin về các Polygon trong bảng sau, hãy tính sự h−ớng tâm và phân tán của mỗi đơn vị sử dụng đất.

Một phần của tài liệu HỆ THỐNG THÔNG TIN ĐỊA LÝ - GEOGRAPHICAL INFORMATION SYSTEM docx (Trang 32 - 36)