HỆ THỐNG THÔNG TIN ĐỊA LÝ GEOGRAPHICAL INFORMATION SYSTEM Các kỹ thuật phân tích không gian (spatial analytical technicques) có nhiệm vụ phân tích theo trật tự và tổ hợp không gian của các hiện tượng hoặc các yếu tố (tự nhiên - kinh tế - xã hội). Mối liên quan đó được cụ thể bằng trật tự không gian địa lý, nghĩa là mọi hiện tượng và tính chất của các yếu tố cần phải được bản đồ hóa. Bản đồ là cách trình bày cụ thể nhất trong không gian hai chiều các tính chất, vị trí, mối liên hệ và trật tự trong không gian của các đối tượng hoặc hiện tượng cần nghiên cứu. Tuy nhiên do có nhiều cách trình bày bản đồ khác nhau nên dẫn đến sự khó khăn trong việc xử lý mối quan hệ không gian giữa các lớp thông tin. Trong hơn một thập kỷ qua, hệ thống thông tin địa lý đã được phát triển mạnh mẽ và ngày càng thêm hoàn thiện. Với những ưu thế của mình, hệ thông tin địa lý- geographical information system ( HTTĐL) là một môi trường có khả năng quản lý hệ thống cơ sở dữ liệu và xử lý chính xác các lớp thông tin trong mối quan hệ không gian giữa chúng. HTTĐL có khả năng bổ sung, đo đạc và tự động tính toán chính xác về mặt định lượng các thông tin trên bản đồ, cùng các thuộc tính của chúng, đồng thời có thể đưa ra các tính toán dự báo. I.CÁC KHÁI NIỆM CƠ BẢN VỀ HTTĐL I.1.Định nghĩa Hệ thông tin địa lý (HTTĐL)- Geographical information system ( GIS) là một tổ chức tổng thể của bốn hợp phần: phần cứng máy tính, phần mềm, tư liệu địa lý và người điều hành được thiết kế hoạt động một cách có hiệu quả nhằm tiếp nhận, lưu trữ, điều khiển, phân tích và hiển thị toàn bộ các dạng dữ liệu địa lý. HTTĐL có mục tiêu đầu tiên là xử lý hệ thống dữ liệu trong môi trường không gian địa lý. (Viện nghiên cứu môi trường Mỹ - 1994). Một định nghĩa khác có tính chất giải thích, hỗ trợ là: HTTĐL là một hệ thống máy tính có chức nănng lưu trữ và liên kết các dữ liệu địa lý với các đặc tính của bản đồ dạng đồ họa, từ đó cho môt khả năng rộng lớn về việc xử lý thông tin, hiển thị thông tin và cho ra các
Trang 1HỆ THỐNG THÔNG TIN ĐỊA LÝ
Các kỹ thuật phân tích không gian (spatial analytical technicques) có nhiệm
vụ phân tích theo trật tự và tổ hợp không gian của các hiện tượng hoặc các yếu tố (tự nhiên - kinh tế - xã hội) Mối liên quan đó được cụ thể bằng trật tự không gian địa lý, nghĩa là mọi hiện tượng và tính chất của các yếu tố cần phải được bản đồ hóa
Bản đồ là cách trình bày cụ thể nhất trong không gian hai chiều các tính chất,
vị trí, mối liên hệ và trật tự trong không gian của các đối tượng hoặc hiện tượng cần nghiên cứu Tuy nhiên do có nhiều cách trình bày bản đồ khác nhau nên dẫn đến sự khó khăn trong việc xử lý mối quan hệ không gian giữa các lớp thông tin Trong hơn một thập kỷ qua, hệ thống thông tin địa lý đã được phát triển mạnh mẽ và ngày càng thêm hoàn thiện Với những ưu thế của mình, hệ thông tin địa lý- geographical information system ( HTTĐL) là một môi trường có khả năng quản lý hệ thống cơ sở dữ liệu và xử lý chính xác các lớp thông tin trong mối quan
hệ không gian giữa chúng HTTĐL có khả năng bổ sung, đo đạc và tự động tính toán chính xác về mặt định lượng các thông tin trên bản đồ, cùng các thuộc tính của chúng, đồng thời có thể đưa ra các tính toán dự báo
I.CÁC KHÁI NIỆM CƠ BẢN VỀ HTTĐL
I.1.Định nghĩa
Hệ thông tin địa lý (HTTĐL)- Geographical information system ( GIS) là một tổ chức tổng thể của bốn hợp phần: phần cứng máy tính, phần mềm, tư liệu địa lý và người điều hành được thiết kế hoạt động một cách có hiệu quả nhằm tiếp nhận, lưu trữ, điều khiển, phân tích và hiển thị toàn bộ các dạng dữ liệu địa lý HTTĐL có mục tiêu đầu tiên là xử lý hệ thống dữ liệu trong môi trường không gian địa lý (Viện nghiên cứu môi trường Mỹ - 1994)
Một định nghĩa khác có tính chất giải thích, hỗ trợ là: HTTĐL là một hệ thống máy tính có chức nănng lưu trữ và liên kết các dữ liệu địa lý với các đặc tính của bản đồ dạng đồ họa, từ đó cho môt khả năng rộng lớn về việc xử lý thông tin, hiển thị thông tin và cho ra các sản phẩm bản đồ, các kết quả xử lý cùng các mô hình (antenucci 1991)
Một con đường hoặc con sông, con suối thường được biểu diễn bằng các yếu
tố đường, mặc dù trong thực tế có thể đo được cả độ rộng và chiều dài của chúng
Trang 2trên bản đồ Các đối tượng tự nhiên thường được thể hiện bằng các đường, cung, vùng, điểm, tuỳ theo các đặc trưng cụ thể mà chúng được thể hiện theo các hình mẫu cụ thể
Hình 1 Mô tả một số khái niệm vector nguồn
Một số khái niệm chính được cụ thể trong định nghĩa này như sau:
• Đường (line): là các đối tượng có một kích thước
• Đoạn thẳng (line segment): là đường nối trực tiếp giữa hai điểm
• Đường gấp khúc: là các đọan thẳng nối liên tục, có thể khác hướng song không có điểm nối hoặc có thể điểm nối ở một phía (phải hoặc trái) Đường gấp khúc có thể cắt qua chính nó hoặc cắt các đường khác
• Cung (area) là một đoạn tập hợp các điểm tạo nên một dạng đường cong
mà đường cong đó được xác định bằng một hàm toán
• Đoạn nối (link) là đối tượng có một kích thước nối giữa hai nút Đoạn nối cũng được hiểu là đường gờ (edges) hay đường viền
• Đoạn nối trực tiếp : là đoạn nối giữa hai nút với một hướng nhất định
• Dây xích (chain): là sự nối liên tục của các đoạn thẳng không cắt nhau hoặc giữa các cung với các nút ở cuối mỗi cung Các nút có thể nằm ở bên phải hay bên trái là không bắt buộc
Trang 3• Vùng: là đặc điểm thể hiện hai kích thước cả vị trí và diện tích, là đối tượng xác định về mặt ranh giới, liên tục và có hai kích thước Nó có thể bao gồm
cả phần bên hoặc không
vệ tinh, ảnh máy bay, bản đồ giấy (dạng analog) Kỹ thuật hiện đại về viễn thám
và HTTĐL có khả năng cung cấp thông tin không gian bao gồm các thuộc tính địa
lý, khuôn dạng dữ liệu, tỷ lệ bản đồ và các số liệu đo đạc Việc tích hợp các tư liệu địa lý từ nhiều nguồn khác nhau là đặc điểm cơ bản của một phần mềm HTTĐL Thông thường, tư liệu không gian được trình bày dưới dạng các bản đồ giấy với các thông tin chi tiết được tổ chức ở một file riêng Các tư liệu đó không đáp ứng được các nhu cầu hiện nay về tư liệu không gian là vì những lý do sau:
- Đòi hỏi không gian lưu trữ rất lớn, tra cứu khó khăn Để nhập và khai thác dữ liệu, nhất thiết phải liên kết được với các thông tin địa lý trên bản đồ và các dữ liệu thuộc tính khác được lưu trữ riêng biệt và điều này trở nên rất khó khăn với hình thức lưu trữ dạng kho hoặc thư viện
- Các khuôn dạng lưu trữ truyền thống thường không tương thích với các tiêu chuẩn dữ liệu hiện nay Thay thế cho các dữ liệu dạng truyền thống, hiện nay
Trang 4tư liệu dạng số với một khối lượng rất lớn có thể được lưu trữ trong các đĩa CD, tương ứng với những khối lượng rất lớn của tư liệu analoge Tư liệu số còn cho khả năng xử lý tự động trên máy tính
Như vậy, HTTĐL là sự phát triển đặc biệt để sử dụng công nghệ và nghệ thuật máy tính trong việc xử lý tư liệu không gian dạng số
Người điều hành
Vì HTTĐL là một hệ thống tổng hợp của nhiều công việc kỹ thuật, do đó đòi hỏi người điều hành phải được đào tạo và có kinh nghiệm trong nhiều lĩnh vực Người điều hành là một phần không thể thiếu được của HTTĐL Hơn nữa sự phát triển không ngừng của các kỹ thuật phần cứng và phần mềm đòi hỏi người điều hành phải luôn được đào tạo Những yêu cầu cơ bản về người điều hành bao gồm các vấn đề sau:
Có kiến thức cơ bản về địa lý, bản đồ, máy tính và công nghệ thông tin:
- Việc đào tạo cơ bản về địa lý cung cấp khả năng khai thác các đặc điểm không gian (spatical process) và các quá trình không gian, đồng thời phát hiện được mối quan hệ không gian giữa các hợp phần
- Bản đồ học cung cấp các hiểu biết về thiết kế bản đồ, lập bản đồ (ví dụ: Lưới chiếu bản đồ, hệ thống tọa độ, các mẫu ký tự trên bản đồ và các kỹ thuật in ấn)
- Khoa học về máy tính và thông tin cung cấp các kiến thức cơ bản về phần cứng máy tính và vận hành thông thạo các chương trình liên kết phần cứng
- Có kinh nghiệm trong việc sử dụng các phần mềm HTTĐL: việc đào tạo các phần mềm chủ yếu thường tập trung vào việc xử lý HTTĐL, lập trình cơ bản, quản lý cơ sở dữ liệu và một số công việc khác có liên quan đến tích hợp thông tin
- Có hiểu biết nhuần nhuyễn về dữ liệu: hiểu về nguồn dữ liệu, nội dung và
độ chính xác của dữ liệu, tỷ lệ bản đồ nguyên thủy và các số liệu đo đạc của tập dữ liệu, cấu trúc của dữ liệu
- Có khả năng phân tích không gian Yêu cầu được đào tạo về các phương pháp xử lý thống kê và xử lý định tính trong địa lý, việc đào tạo cho người xử lý
có thể lựa chọn phương pháp tốt nhất để phân tích và áp dụng nhằm đưa ra kết quả tốt nhất
Trang 5Các yêu cầu trên là cần thiết đối với người điều hành HTTĐL Các huấn luyện chi tiết sẽ tùy thuộc nội dung và mục tiêu cũng như khả năng của máy tính và phần mềm để lực chọn những chương trình đào tạo thích hợp
Phần cứng (máy tính và thiết bị ngoại vi)
• Phần cứng của một HTTĐL bao gồm các hợp phần sau: Bộ xử lý trung tâm (CPU), thiết bị nhập dữ liệu, lưu dữ liệu và thiết bị xuất dữ liệu
• Bộ xử lý trung tâm (central processing unit - CPU): hệ thống điều khiển,
bộ nhớ, tốc độ xử lý là những yếu tố quan trọng nhất của CPU Hiện nay xử lý HTTĐL trên nền unix là hệ thống có đủ các chức năng nhất, trong khi với máy CP thì HTTĐL có những chức năng hạn chế hơn Các hệ xử lý GIS trước đây, phần lớn đều chạy trong trạm Unix Trạm Unix cho phép lưu trữ cơ sở dữ liệu lớn và nhiều chức năng xử lý khác nhau Tất nhiên với sự trợ giúp của window NT thì PC cũng có thể so sánh được với hệ unix Ví dụ điểm hình về một hệ thống có hiệu quả là một hệ Unix nhỏ có cài đặt phần mềm ARC/INFO để quản lý và vận hành HTTĐL Hiện nay, các hệ thống xử lý liên tục được nâng cấp và khoảng cách giữa trạm Unix và PC càng hẹp dần
• Nhập, lưu dữ và xuất dữ liệu: các thiết bị ngoại vi phục vụ cho việc nhập
dữ liệu là: Bàn số hoá, máy quét để chuyển đổi dữ liệu analoge thành dạng số Hoặc đọc băng và đĩa CD - ROM có nhiệm vụ lấy thông tin hiện có trong băng và đĩa Các phương tiện thông dụng là ổ đĩa cứng, ổ đọc băng, ổ đĩa quang có thể ghi
và xoá dữ liệu Thiết bị xuất dữ liệu bao gồm máy in đen trắng và màu, báo cáo, kết quả phân tích, máy in kim (plotter) Hiện nay, với sự phát triển của công nghệ tin học và điện tử, đặc biệt là khi có thiết bị mạng cho phép san sẻ các chức năng
và trao đổi giữa những người sử dụng và càng tạo điều kiện cho HTTĐL phát triển
Phần mềm
Một hệ thống phần mềm xử lý HTTĐL yêu cầu phải có hai chức năng sau: tự động hoá bản đồ và quản lý cơ sở dữ liệu Sự phát triển kỹ thuật HTTĐL hiện đại liên quan đến sự phát triển của hai hợp phần này
• Tự động hoá bản đồ: bản đồ học là môn khoa học, nghệ thuật và kỹ thuật thành lập bản đồ Do đó, tự động hoá bản đồ là thành lập bản đồ với sự trợ giúp của máy tính Một bản đồ là sự thể hiện bằng đồ họa của mối quan hệ không gian
và các hình dạng (Pobinson và NNK, 1984) và mỗi một bản đồ là sự mô hình hoá thực tế theo những tỷ lệ nhất định Mô hình đó yêu cầu biến đổi các số liệu ghi bản
Trang 6đồ thành bản đồ và gồm các công đoạn sau: Lựa chọn, phân loại, làm đơn giản hóa
và tạo mẫu ký tự (Den - 1990)
Máy tính trợ giúp cho bản đồ học ở nhiều phương diện như sau:
Trước hết, bản đồ trong máy tính là dạng số nên dễ dàng chỉnh sửa và việc chỉnh lý đó tốn ít công sức hơn so với việc không có sự trợ giúp của máy tính Mặc dù việc số hóa có thể dẫn đến nhiều lỗi và làm giảm độ chính xác, song các lỗi đó có thể sửa dễ dàng nếu phát hiện được Khi đó, bản đồ sẽ được hoàn thiện
và lượng thông tin sẽ được nâng lên Đặc biệt, việc bổ sung thông tin cho bản đồ cũng dễ dàng thực hiện được
Thứ hai, quá trình tạo chú giải và các chỉ dẫn lên bản đồ được thao tác với tốc độ nhanh nên giá thành thấp Việc lựa chọn, phân loại và làm đơn giản hóa các đặc điểm bản đồ cũng được thực hiện một cách khoa học Quá trình thiết kế và khái quát hóa bản đồ cũng được lập trình và tạo nên các chức năng cụ thể của phần mềm Kết quả như mong muốn có thể đạt được bởi nhiều cán bộ bản đồ hoặc do chính một cán bộ bản đồ làm trong nhiều thời gian khác nhau
Thứ ba, thiết kế bản đồ có thể được hoàn thiện hơn qua việc thử và chỉnh sửa lỗi Kích thước, hình dạng hoặc vị trí của chữ hoặc ký hiệu trên bản đồ có thể dễ dàng được thay đổi và đưa về vị trí chính xác như mong muốn
• Quản lý dữ liệu: chức năng thứ hai của phần mềm HTTĐL là hệ thống quản lý dữ liệu (data base management system DBMS) Hệ thống TTĐL phải có khả năng điều khiển các dạng khác nhau của dữ liệu địa lý đồng thời có thể quản
lý hiệu quả một khối lượng lớn dữ liệu với một trật tự rõ ràng Một yếu tố rất quan trọng của phần mềm HTTĐL là cho khả năng liên kết hệ thống giữa việc tự động hóa bản đồ và quản lý cơ sở dữ liệu Các tài liệu mô tả cho một vị trí bất kỳ, có thể liên hệ một cách hệ thống với vị trí không gian của chúng Sự liên kết đó là một ưu thế nổi bật của việc vận hành HTTĐL:
Thứ nhất: các tài liệu liệu thuộc tính nhất thiết phải được thể hiện trên những chi tiết của bản đồ Ví dụ số liệu về dân số của một thành phố cũng được gọi ra một cách tự động mà không cần phải có một sự tra cứu nào khác Đối với bản đồ học thì công việc tra cứu thường phải làm độc lập, không thực hiện tự động được Ngoài ra việc bổ sung số liệu cũng đòi hỏi phải được cập nhật thường xuyên nên chỉ HTTĐL mới có thể đáp ứng được đầy đủ
Thứ hai: sự thay đổi về những chi tiết bản đồ nhất thiết phải phù hợp với sự thay đổi về tự nhiên thuộc tính Ví dụ, sự thay đổi về diện tích đô thị về số liệu
Trang 7phải tương xứng với sự thay đổi về đường ranh giới thành phố Khi thay đổi ranh giới thì số liệu tính toán về diện tích cũng tự động được thay đổi
II.CÁC CHỨC NĂNG CỦA PHẦN MỀM HTTĐL
Một phần mềm HTTĐL các các chức năng cơ bản như sau: nhập dữ liệu, lưu trữ dữ liệu, điều khiển dữ liệu, hiển thị dữ liệu theo cơ sở địa lý và đưa ra những quyết định (decision making) (Calkins và Tomlinson 1997) Có thể khái quát về các chức năng đó như sau:
• Nhập và bổ sung dữ liệu (entry and updating): Một trong những chức năng quan trọng của HTTĐL là nhập và bổ sung dữ liệu mà công việc đó không tiến hành riêng rẽ Bất kỳ một hệ thống nào cũng phải cho phép nhập và bổ sung
dữ liệu, nếu không có chức năng đó thì không được xem là một HTTĐL vì chức năng đó là một yêu cầu bắt buộc phải có
• Việc nhập và bổ sung dữ liệu phải cho phép sử dụng nguồn tự liệu dưới dạng số hoặc dạng analog Dạng tư liệu không gian như bản đồ giây hoặc ảnh vệ tinh, ảnh máy bay phải được chuyển thành dạng số và các nguồn tư liệu số khác cũng phải chuyển đổi được để tương thích với cơ sở dữ liệu trong hệ thống đang
sử dụng
• Chuyển đổi dữ liệu: chuyển đổi dữ liệu là một chức năng rất gần với việc nhập và bổ sung dữ liệu Nhiều phần mềm thương mại cố gắng giữ độc quyền bằng cách hạn chế đưa các khuôn dạng dữ liệu theo loại phổ cập Tuy nhiên người
sử dụng phải lựa chọn để hạn chế việc phải số hóa thêm những tài liệu hiện đang
có ở dạng số Trong thực tế, cùng một tư liệu nhưng có thể tồn tại ở nhiều khuôn dạng khác nhau Vì vậy, đối với tư liệu quốc gia, không thể chỉ lưu giữ ở một dạng thuộc tính riêng biệt mà cần thiết phải lưu giữ ở nhiều khuôn dạng có tích chất phổ biến để sử dụng được trong nhiều ứng dụng khác nhau Như vậy, một phần mềm HTTĐL cần phải có chức năng nhập và chuyển đổi nhiều khuôn dạng dữ liệu khác nhau
• Lưu giữ tư liệu: Một chức năng quan trọng của HTTĐL là lưu giữ và tổ chức cơ sở dữ liệu do sự đa dạng và với một khối lượng lớn của dữ liệu không gian: đa dạng về thuộc tính, về khuôn dạng, về đơn vị đo, về tỷ lệ bản đồ Hai yêu cầu cơ bản trong việc lưu trữ dữ liệu là: thứ nhất là phải tổ chức nguồn dữ liệu sao cho đảm bảo độ chính xác và không mất thông tin, thứ hai là các tài liệu cho cùng một khu vực song các dữ liệu lại khác nhau về tỷ lệ, về đơn vị đo thì phải được định vị chính xác và chuyển đổi một cách hệ thống để có thể xử lý hiệu quả
Trang 8• Điều khiển dữ liệu (data manipulation): Do nhiều HTTĐL hoạt động đòi hỏi tư liệu không gian phải được lựa chọn với một chỉ tiêu nhất định được phân loại theo một phương thức riêng, tổng hợp thành những đặc điểm riêng của hệ thống, do đó HTTĐL phải đảm nhiệm được chức năng điều khiển thông tin không gian Khả năng điều khỉển cho phép phân tích, phân loại và tạo lập các đặc điểm bản đồ thông qua các dữ liệu thuộc tính và thuộc tính địa lý được nhập vào hệ thống Các thuộc tính khác nhau có thể được tổng hợp, nắm bắt một cách riêng biệt và những sự khác biệt có thể được xác định, được tính toán và được can thiệp, biến đổi
• Trình bày và hiển thị: Đây cũng là một chức năng bắt buộc phải có của một HTTĐL Không gian dưới dạng tài liệu nguyên thủy hay tài liệu được xử lý cần được hiển thị dưới các khuôn dạng như: chữ và số (text), dạng bảng biểu (tabular) hoặc dạng bản đồ Các tính toán chung và kết quả phân tích được lưu giữ
ở dạng chữ và số để dễ dàng in ra hoặc trao đổi giữa các lỗ phần mềm khác nhau Các dữ liệu thuộc tính có thể được lưu ở dạng bảng biểu hoặc các dạng cố định khác Bản đồ được thiết kế để hiển thị trên màn hình hoặc lưu dưới dạng điểm (plot file) để in Như vậy, hiển thị và in ra là những chức năng rất cần thiết của một HTTĐL
• Phân tích không gian: Trước đây, chỉ có 5 chức năng mô tả ở trên là được tập trung, phát triển bởi những người xây dựng HTTĐL Chức năng thứ sáu là phân tích không gian được phát triển một cách thần kỳ dựa vào sự tiến bộ của công nghệ và nó trở nên thực sự hữu ích cho người ứng dụng Những định nghĩa
về HTTĐL trước đây đã trở thành thực tiễn trên cơ sở ứng dụng trực tiếp chức năng phân tích không gian Theo quan điểm hiện nay thì chức năng đó cần thiết phải có đối với một hệ thống được gọi là HTTĐL Tất nhiên các chức năng có thể khác nhau đối với từng hệ thống song đối với một một hệ thống TTĐL sử dụng tư liệu bản đồ thì chức năng đó là băt buộc Với một hệ thống như vậy thì các mô tả bằng lời có thể tổ chức thành các tham số riêng, các mô hình giải thích, dự báo đều
có thẻ thực hiện trong chức năng xử lý không gian
II.1.Sử dụng HTTĐL cho phân tích không gian
Phân tích không gian HTTĐL Bao gồm ba hoạt động chính: Giải quyết các câu hỏi về thuộc tính, các câu hỏi về phân tích không gian và tạo nên tập dữ liệu mới từ cơ sở dữ liệu ban đầu Mục tiêu của việc phân tích không gian là từ việc giải quyết các câu hỏi đơn giản về các hiện tượng, các vấn đề trong không gian, đi
Trang 9đến tập hợp thành các thuộc tính của một hay nhiều lớp và phân tích được sự liên quan giữa các dữ liệu ban đầu
Trong ứng dụng của HTTĐL, các đặc điểm và thuộc tính về không gian là rất phổ biến Câu hỏi về thuộc tính (attribute query) có chứa đựng cả tích chất thông tin về không gian Ví dụ: Trong cơ sở dữ liệu của một hành phố, ở đó mỗi mảng bản đồ đều có Code thuộc tính về sử dụng đất, một bảng thuộc tính đơn giản có thể yêu cầu liệt kê toàn bộ các mảng của các loại hình sử dụng đất có trong bản đồ Bảng thuộc tính đó có thể tạo được mà không hề có sự tham khảo về các mảng trên bản đồ Vì không có thông tin không gian đòi hỏi trả lời cho câu hỏi này nên bảng đó được xem như là bảng thuộc tính (attribute query) Trong ví dụ này, toàn
bộ bảng thuộc tính có các Code của sử dụng đất đã được xác định Các thông tin khác có thể được tạo nên ví dụ như số mảng đơn vị (parcel) của loại hình sử dụng đất này, hoặc tổng diện tích của loại hình sử dụng đất này ở trong thành phố Tất nhiên những bài toán xử lý thông tin cho một lớp là cần thiết, song trong ứng dụng, việc xử lý thông tin của nhiều lớp cũng là công việc rất quan trọng và đòi hỏi nhiều công sức trong lập trình Ví dụ gảii bài toán về 2 lớp không gian về tính toán diện tích của các loại hình sử dụng đất theo các cấp độ dốc khác nhau Những bài toán đó đặt ra đối với nhiều nội dung ứng dụng khác nhau mà những phần mềm chuyên tự động hóa bản đồ hay quản lý dữ liệu không đáp ứng được Tất nhiên do mục đích của HTTĐL là tập trung vào xử lý không gian, nên một số chức năng của việc tự động hóa bản đồ hoặc tính toán thống kê chuyên đề thì có thể HTTĐL không đáp ứng được
II.2.Một số vấn đề cơ bản trong xử lý không gian
• Xử lý thông tin trong một lớp: giải quyết các vấn đề về thuộc tính các đơn
vị trong một lớp, đo đạc các giá trị, phân tích sự liên quan giữa các đơn vị trong một lớp bản đồ Ví dụ xác định tên, tính diện tích, chu vi của từng khoanh vi bản
đồ, xác định khoảng cách, tạo các vùng ảnh hưởng (buffer zone)
• Xử lý thông tin nhiều lớp: chồng xếp hai hoặc nhiều lớp thông tin cho phép tạo ra nhiều đơn vị bản đồ mới trên cơ sở làm chi tiết hoá thông tin của từng phần trong một đơn vị bản đồ Ví dụ hai lớp thực vật và đất khi chồng xếp sẽ cho bản đồ thực vật phân bố trên các loại đất khác nhau
• Xử lý không gian: có thể có rất nhiều lớp thông tin mà xử lý không gian cần phải tính toán được mối quan hệ giữa chúng
Trang 10• Phân tích các mẫu điểm: một số đối tượng tự nhiên hoặc hiện tượng tự nhiên có sự phân bố bằng các điểm tập trung theo các quy luật nhất định Ví dụ: phân bố của các đồng cỏ, hệ thống các điểm bố sụt cactor, phân bố của các loài động vật, thực vật quý hiếm Trong xử lý không gian, sự phân bố về những điểm
đó cần được nhận diện và phân loại
• Phân tích mạng: thiết lập một mạng hữu ích giữa các diện có sự phân bố khác nhau là một trong những chức năng xử lý không gian: ví dụ tạo tuyến xe bus gần nhất nối các điểm đón khách trong thành phố, mở một hệ thống đường nối giữa các khu dân cư, thiết kế một tuyến đường ống dẫn dầu Tất nhiên khi thiết
kế cụ thể lại phải bổ sung bằng một số thông tin khác nhau, ví dụ: địa hình, sử dụng đất…
• Phân tích, xử lý theo ô lưới (grid analysis) Bài toán xử lý ô lưới rất phong phú, nó có thể ứng dụng cho nhiều ngành: ví dụ tính toán lan truyền ô nhiễm, lập các đường đẳng trị, dự báo cháy rừng…
• Phân tích xử lý nhiều lớp thông tin theo điều kiện Đây là chức năng phức tạp và đa dạng nhất của xử lý không gian Nhiều bài toán được áp dụng để biến đổi lớp thông tin ban đầu thành một hay nhiều lớp thông tin mới: ví dụ tính độ dốc, hướng dốc, tính mật độ, bài toán boolean, bài toán logic, các phép phân chia, tính căn bản đồ, những lớp thông tin mới
• Vùng bên trong là phần không bao gồm đường biên Polygon là diện tích
có vùng bên trong, một đường viền bên ngoài, không có điểm giao cắt ở bên trong
và không có khoanh vi nào khác ở phía trong Polygon phức tạp: là polygon có một hoặc nhiều khoanh vi khác ở bên trong
• Có hai khái niệm được sử dụng bổ sung cho định nghĩa trên đó là pixels
và ô lưới đơn vị (grid cells) Pixel là đơn vị hình ảnh có hai kích thước, nó là đơn
vị nhỏ nhất của hình ảnh không thể chia nhỏ được Ô lưới đơn vị là đối tượng có hai kích thước, thể hiện một yếu tố của một bề mặt có cấu trúc đều đặn bởi chúng Những khái niệm nêu ở trên là do bản đồ số của Mỹ đưa ra (National comitee for digital colorgaphic data standars - NCDCDS) Các khái niệm đó có thể được gọi khác đi,tùy theo sự thiết kế về tên gọi trong từng hệ thống phần mềm HTTĐL
II.3.Các yếu tố cơ bản của thông tin không gian
Việc phân tích trật tự và tổ hợp không gian yêu cầu phải có ba thuộc tính cơ bản sau: vị trí (location), dữ liệu thuộc tính (attribute data) và tính chất hình học (topology)
Trang 11• Vị trí: là tính chất quan trọng mà mỗi đối tượng không gian phải có Vị trí được xác định bởi tọa độ X và Y trên mặt phẳng ngang (caitesian)
• Dữ liệu thuộc tính: Cung cấp nhiều thông tin quan trọng về tính chát của đối tượng được nghiên cứu Ví dụ bản đồ có các đặc điểm thì bảng thuộc tính phải nêu được tích chất các đặc điểm đó, ví dụ: giống cột điện hay hố nước với các thông tin cụ thể cho từng loại
• Dữ liệu hình học: được định nghĩa là mối quan hệ không gian giữa các yếu tố bản đồ Trong trường hợp các polygon, có những polygon lại nằm trong ranh giới của một polygon khác Với các yếu tố đường có, những đường tạo nên bởi hai đoạn thẳng (segment) nối với nhau trực tiếp hoặc nối gián tiếp qua một đoạn thẳng thứ ba, hoặc hai đoạn thẳng hoàn toàn không nối với nhau Với các điểm, các điểm có thể ở cách nhau những khoảng cách khác nhau
• Nhìn chung, vị trí và dữ liệu thuộc tính là tương đối dễ hiểu, song đặc điểm hình học thì hơi khó hình dung hơn Có một số khái niệm và thuộc tính như sau:
• Tiếp giáp (adjacency): hai polygon ở liền nhau thì được gọi là tiếp giáp với nhau Khái niệm tiếp giáp được sử dụng khi phân tích sự liên quan của những yếu tố ở liền kề nhau Ví dụ: giá của một miếng đất sẽ cao hơn giá trung bình của vùng nếu như vùng đất đó nằm liền kề với công viên hoặc khu thương mại
• Chứa đựng (containment): biểu thị một yếu tố nào đó nằm trong rang giới của một polygon Mối quan hệ này cũng quan trọng khi phân tích mối liên quan giữa hai kiểu đối tượng Ví dụ: một mảnh đất nằm trong vùng ngập lụt có thể phải mua bảo hiểm với giá cao hơn
• Tiếp nối (connectivity): thể hiện cho hai đoạn thẳng được nối với nhau Khái niệm tiếp nối được xem xét cho việc phân tích giao thông, tuyến đi để có thể tìm ra phương án mở tuyến tốt nhất
• Giao nhau (intersection): được xem là một dạng phức tạp trong mối quan
hệ không gian của các yếu tố polygon Giao cắt đối với polygon nghĩa là hai polygon có cùng chung một vùng, vùng này có tính chất thuộc về cả hai polygon Khi xử lý chồng xếp bản đồ thì vùng giao nhau không cần xem xét đến các tính chất hình học Tuy nhiên thông dụng nhất là các vùng được bố trí tách biệt nhau trong cơ sở dữ liệu
Tóm lại, 3 yếu tố: vị trí, dữ liệu thuộc tính và đặc điểm của dữ liệu là rất quan trọng trong xử lý không gian Tự động hóa bản đồ sẽ giúp ích cho việc trình
Trang 12bày và tổ chức dữ liệu không gian Trong xử lý không gian, tổng hợp các đặc điểm
về mối liên hệ không gian giữa các yếu tố bản đồ được xử lý bởi HTTĐL và nó cung cấp khả năng xử lý đồng thời cả ba yếu tố Các đối tượng không gian được
trình bày dưới dạng đặc điểm về đường, điểm, hoặc polygon Mỗi một đặc điểm
lại được thể hiện tập trung vào một số yêu cầu về mặt cơ sở dữ liệu
II.4.Tổ chức dữ liệu không gian của HTTĐL
Trong một HTTĐL điển hình, các đối tượng không gian được liên kết để nghiên cứu các hiện tượng thì nhất thiết phải được trình bày dưới dạng bản đồ với mục đích thiết lập được mối liên quan không gian giữa chúng Cả vị trí và thuộc tính được xử lý thông qua một loạt các chương trình trong HTTĐL Yêu cầu đầu tiên để việc tạo lập dữ liệu một cách có hiệu quả là các đối tượng được thể hiện ở
ba yếu tố cơ bản là: điểm (point), đường (line) và vùng (area hay polygon) Theo quan điểm của tổ chức quốc gia Mỹ về dữ liệu bản đồ số thì các yếu tố đó được giải thích như sau
Điểm: là đối tượng có kích thước bằng 0 về mặt hình học Do đó các đối tượng điểm chỉ dùng để xác định vị trí Điểm không có ý nghĩa trong việc
đo về kích thước Mặc dù trên bản đồ, các điểm được biểu thị bằng kích thước khác nhau nhưng diện tích của các điểm là không có ý nghĩa thực
tế Một số khái niệm về "điểm" như sau:
- Điểm thực tế (entity point): dùng để xác định vị trí của các đối tượng dạng điểm như: các toà nhà, các cột Trường hợp đó, xác định chính xác vị trí của các điểm là điều rất quan trọng
- Điểm chỉ tên (label point) được sử dụng để hiển thị một tập hợp chữ viết cho các đối tượng bản đồ Đối với những điểm nào thì độ chính xác của vị trí phụ thuộc vào quan niệm bản đồ học Nghĩa là vị trí các điểm chỉ tên cho các đối tượng trên bản đồ được xác định sao cho không có sự lẫn lộn với nhau
- Điểm có diện tích (area point) dùng để xã định một vị trí có thông tin về diện tích Ví dụ có thể dùng điểm để thể hiện vị trí một quốc gia và độ lớn của điểm chứa đựng thông tin về đất nước đó
- Điểm giao nhau (node) thể hiện vị trí một diện với các dấu hiệu về hình học, ví dụ: nơi giao nhau hoặc điểm cuối của các yếu tố đường
Các thông tin về điểm các một kích thước trong phân tích không gian mặc dù chúng thể hiện cho các đối tượng có hai kích thước ở trên bản đồ Ví dụ: một điểm biểu thị cho 1 giếng, một điểm biểu thị cho một cột Mặc dù diện tích mà giếng
Trang 13chiếm khác với diện tích của cột chiếm Trong một bản đồ thì không thể nêu được diện tích mà giếng hoặc cột chiếm trên thực tế - do tỷ lệ bản đó không đáp ứng Trong phân tích không gian, diện tích giữa các điểm là không tính (trừ trường hợp các điểm có diện tích, lúc đó điểm đã trở thành vùng)
• Tính chất của điểm: đây là dạng đơn giản nhất của các đối tượng không
gian
Khi nói về dữ liệu điểm, phải nói đến số lượng điểm tối thiểu cho một cơ sở
dữ liệu điểm Nhìn chung, các yếu tố tối thiểu cho một cơ sở dữ liệu điểm là những thuộc tính về toạ độ,ngoài ra, các tính chất khác của điểm được mô tả trong hàm sau:
Pi: ( X, Y, Z1 Z2 Z3 …Z.m)
Ở đây:
i là Code xác định của mõi điểm ( identification Code -ID)
X, Y toạ độ của đIểm, được xác định theo toạ độ phẳng (x, y trong mặt phẳng cartesian)
Z 1,Z2… Z m các đặc trưng khác của điểm
Vì điểm có kích thước bằng không (= 0) nên nó không có khoảng trống ở giữa, song nó phải có thuộc tính về mặt hình học, đó là toạ độ Thông tin về mối liên quan giữa các điểmcó thể xác định bằng công thức toán học Trong trường hợp có nhiều điểm thì khoảng cach giữa các đIểm được xác định bởi vị trí của các điểm đó với nhau
Đường: đường là các yếu tố có một kích thước và thể hiện cả vị trí và
hướng Độ dài là dấu hiệu đo đạc về kích thước của đối tượng đường Mặc dù các yếu tố đường thường có không gian hai kích thước trên bản
đồ nhưng độ rộng của đường là không được xem xét đến trong tính toán hướng của bản đồ
Tính chất của đường: Đường được hiểu là tập hợp của rất nhiều điểm Mỗi
đường đều có thể chia thành nhiều đoạn thẳng và mmỗi đoạn được xác dịnh bởi hai điểm ở hai đầu Để cấu tạo nên yếu tố hình học của đưòng thì yếu tố cơ bản là hướng của đường Ngoài ra, còn một yếu tố khác, đó là sự tiếp nối giữa các đường
Để hiểu sự tiếp nối đó, ta có thể hình dung tới một đoạn thẳng nối giữa một điểm này với một điểm khác
Như vậy, các yếu tố cơ bản của mỗi đường gồm có:
Trang 14Lj: (P1, P2, …Pn, Z1, Z2…Zm, H1…Hq)
ở đây: j Code của đường ( ID)
P1 điểm thứ 1
Pn điểm thứ n
Z1 thuộc tính của đoạn thứ 1
Zn thuộc tính của đoạn thứ n
Hq - Code ID của đoạn thứ q được nối trong thứ tự của đường (1… n) là hướng của đường từ 1 đến n của đường
Vùng: (area) hoặc (polygone)
Vùng là khái niệm phức tạp nhất trong 3 loại yếu tố không gian của cấu trúc vector Vùng được hiểu là một diện tích giới hạn bởi một đường khép kín và phần bên trong đó có những tính chất cụ thể
Cáctính chất của polygon:Polygone dược xác định bởi một loạt các đường
vạch định ranh giới Thêm vào đó, polygone là yếu tố có 2 kích thước Mỗi polygone được xác định bởi một diện tích nhất định Vì polygone không có hình dạng và kích thước nhất định, nên mối quan hệ không gian sẽ khó xác định nếu không có những thuộc tính được làm rõ Hai polygone có thể nằm tách biệt với nhau, hoặc kề nhau, hoặc cái nọ nằm trong cái kia
Trong trường hợp nằm tách biệt hẳn so với nhau thì lại có khả năng chúng được nối với nhau bằng polygone thứ ba
Yêu cầu về thuộctính của polygone bao gồm:
G K (L 1…L n, Z1… Zm ú1…úr,ử1…ửs,ệ1…ệt)
xác định ranh giới của polygone G
Z n xác định giá trị của thuộc tính thứ n
ú1…úr thể hiện một hoặc nhiều polygone kết nối với nhau tạo nên
ử1…ửs xác định có 1 hay nhiều polygone chứa trong polygone K
ệ1…ệt xác định có một hay nhiều polygone nằm trong polygone K
Các thông tin hình học bổ sung khác còn có thể là càn thiết đối với các polygone phức tạp.nhiều thông tin hình học có thể được bổ sung ngay trong những thông tin về đường hoặc được làm đơn giản hoá đi Ví dụ: hai polygone nằm liền
Trang 15kề thì phải có thêm thông tin về một đoạn thẳng chung ở giữa làm biên giới giữ hai polygone
II.5.CÁC MÔ HÌNH CẤU TRÚC CƠ SỞ DỮ LIỆU
II.5.1.Khái quát chung
Tư liệu (data) được hiểu như những sự hiện diện đã được kiểm tra về thế giới thực (Graeme F Borinam Carter) Thông tin là tư liệu được tổ chức theo những mẫu thể hiện nhằm dễ dàng tìm kiếm và khai thác
Tư liệu không gian phải được trình bày và lưu trữ một cách riêng biệt trong nưhngx không gian của HTTĐL Ví dụ: đường, điểm, vùng, bề mặt … phải được lưu trữ độc lập cùng các thuộc tính của chúng tạo thành những file dữ liệu không gian hoặc phi không gian
Cơ sở dữ liệu ( CSDL) là toàn bộ những thông tin cần thiết về đối tượng được lưu giữ dưới dạng số CSDL có thể là không gian hoặc phi không gian Hệ thống quản lý CSDL (Database management System - DBMS) là tập hợp một số chức năng của phần mềm để lưu giữ, bổ sung và thể hiện dữ liệu Các hệ thống quản lý cơ sở dữ liệu phi không gian hoặc không gian thường tách biệt nhau Cũng
có một số phần mềm tổ chức kết hợp để quản lý cả hai dạng dữ liệu hoặc cung cấp khả năng liên kết với các phần mềm CSDL khác Chương trình này sẽ tập trung giới thiệu các cấu trúc dữ liệu chính là cấu trúc phân nhánh, chia nhỏ và cấu trúc mạng Ngoài ra, các dữ liệu thuộc tính phi không gian trong mối liên hệ với các thuộc tính không gian cũng được đề cập đến Cấu trúc dữ liệu không gian là sự tổ chức tư liệu không gian dưới một khuôn dạng phù hợp với máy tính Cấu trúc của
dữ liệu phải được tổ chức để có sự liên hệ giữa các mô hình dữ liệu và các khuôn dạng (format) dữ liệu Thực tế, giữa khái niệm mô hình và cấu trúc dữ liệu ít có sự phân biệt Tuy nhiên khái niệm mô hình được sử dụng ở phạm vi nguyên lý từ khái quát đến cụ thể, còn cấu trúc là khái niệm mang tính chất kỹ thuật và minh hoạ một cách hệ thống về bản chất và sự liên hệ giữa các thành phần của CSDL Cấu trúc của dữ liệu Raster được sử dụng rộng rãi trong hệ xử lý ảnh và xử
lý TTDL - raster, còn cấu trúc của dữ liệu vertor được sử dụng nhiều trong các hệ CAD (Computer Aided Decizion - Máy tính thiết kế trợ giúp), hoặc trong HTTĐL vertor với những khả năng mạnh về bản đồ Trong thực tế áp dụng nhiều HTTD có
cả hai hệ thống cấu trúc dạng Raster và Vertor để có thể sử dụng một cách linh hoạt và giao diện với nhau để đáp ứng cho những nhiệm vụ cần giải quyết Những
sự giao diện đó được thể hiện cụ thể với việc xử lý một hệ thống dữ liệu mẫu điểm
Trang 16là: có bảng thuộc tính về tính chất và toạ độ các điểm, có khả năng nội suy thuộc tính mẫu thành các file Raster; có khả năng tạo file vertor và contour của các trường thuộc tính đã được nội suy; có khả năng tạo các mặt phẳng hình học và các
mô hình không gian với dữ liệu Raster hoặc Vertor Tuy nhiên do không phải là những HTTĐL chuyên đề mà các HTTĐL tổng hợp thường có một số ưu thế và những hạn chế nhất định
II.5.2.Cấu trúc dữ liệu Raster
Raster được hiểu là ô hình vuông có kích thước nhất định gọi là cell hoặc pixell (picture element), cấu trúc Raster là cấu trúc hình ảnh Mỗi ô vuông có chứa thông tin về một đối tượng hay một sự hợp phần của đối tượng Vị trí của đối tượng được xác định bởi vị trí của các ô vuong theo trật tự hàng và cột Cấu trúc
dữ liệu Raster đơn giản nhất là cấu trúc dạng bảng, ở đó có chứa các thông tin về toạ độ và thuộc tính phi không gian Thông tin về vị trí được thể hiện ở toạ độ theo hàng và cột, tính theo trật tự sắp xếp của dữ liệu Trường hợp có nhiều tính chất thì có thể gọi là thông tin nhiều chiều Bảng thuộc tính hai chiều của đối tượng được gọi là bảng một chiều hay còn gọi là bảng thuộc tính Raster mở rộng (expanded Raster table) Cấu trúc Raster đầy đủ là cấu trúc có đầy đủ số lượng các pixell sắp xếp theo những vị trí xác định Cấu trúc Raster rất tiện lợicho việc áp dụng các chức nằng xử lý không gian dựa trên nguyên tắc chồng xếp thông tin nhiều lớp Các đặc điểm không gian là có thông tin về địa lý, nghĩa là chúng có thể được trình bày trên bất cứ một bản đồ nào của một hệ toạ độ đã biết Cấu trúc Raster yêu cầu mỗi một đặc điểm phải được trình bày thành dạng đơn vị hình ảnh (picture elemarts pixel) Trong trường hợp này một bản đồ được phân chia thành nhiều pixels, mỗi pixel có vị trí theo hàng và cột Một điểm nhỏ nhất được trình bày bởi một pixel đơn lẻ và nó chiếm một diện tích bằng kích thước của một pixel
Trang 170 1 2 3 4 5 6
6 5 4 3 2 1
6 5 4 3 2 1
0 1 2 3 4 5 6
Hình 3 Một đường có thể tổ chức trong cấu trúc Vector (A) và Raster (B)
Một đường trong cấu trúc Raster là một loạt cácpixel nối với nhau và một polygon là một đám (cluster) của các pixel có cùng một giá trị
Sau đây là những ưu điểm cơ bản của cấu trúc Raster:
• Đơn giản và dễ tham khảo
• Việc chồng xếp các lớp bản đồ được thực hiện một cách thuận tiện đưa đến kết quả
• Đối với mô hình không gian, các đơn vị địa lý được xác định trong cấu trúc Raster, bao gồm hình dạng và kích thước Như vậy trong kết quả mối quan hệ giữa các pixel là ổn định và dễ dàng vẽ ra được
• Dễ thiết lập một bề mặt liên tục bằng phương pháp nội suy
• Đa số các tư liệu không gian thường được ghi ở dạng Raster như ảnh vệ tinh, ảnh máy bay chụp quét Thông thường các tư liệu Raster đó dẽ dàng nhập trực tiếp mà không cần một sự thay đổi nào
Những nhược điểm của cấu trúc dữ liệu Raster:
• Tài liệu thường bị tình trạng quá tải, làm tốn nhiều phần của bộ nhớ trong máy tính Trong rất nhiều trường hợp, các yếu tố bản đồ không nhất thiết phải được gắn thuộc tính (code hoá) thành các ô lưới đặc trưng Trong cấu trúc dữ liệu Raster, những vùng rất rộng lớn có đặc điểm giống nhau được tồn tại một cách ngẫu nhiên với một giá trị nào đó và là tập hợp của rất nhiều ô lưới Trong khi đó khi thể hiện về độ dốc thì ở vùng có độ dốc tương đối giống nhau, cấu trúc raster vẫn thể hiện sự khác nhau do kích thước của các pixel tạo nên đường gồ ghề
Trang 18• Mối quan hệ về hình học giữa các yếu tố không gian thì khó vẽvà khó thiết lập được, ví dụ với hai bản đồ được xác định bằng hàng, cột thì mối liên hệ hình học giữa các đặc điểm của hai bản đồ đó là rất khó xác định
• Các bản đồ Raster thường thô và kém vẻ đẹp hơn so với bản đồ vẽ bằng đường nét thanh của cấu trúc Vector Trong bản đồ Raster, các yếu tố đường, sông, … ranh giới thường được biểu hiện bằng các pixel nên có dạng răng cưa
• Việc chuyển đổi các thuộc tính không gian của cấu trúc Raster thì dễ bị nhiễu Ví dụ một con đường khi quay đi một góc nào đó rồi quay lại đúng góc đó nhưng nó có thể bị biến đổi so với hình dạng ban đầu
• Đối với phân tích không gian, hạn chế nhất của cấu trúc Raster là độ chính xác thường thấp so với mong muốn (ví dụ khi tính độ day của một đoạn thẳng sai số thường lớn hơn so với đo trực tiếp) Đây là điều khó tránh khỏi vì kích thước tính được liên quan đến kích thước của các pixel và vị trí của một đoạn thẳng hay của một điểm cũng được xác định tuỳ thuộc kích thước của pixel.Đây cũng là một điểm cần lưu ý trong khi thể hiện bản đồ dạng Raster ( hình 4 )
Hình 4 Mô phỏng cách thể hiện các khoanh vi theo cấu trúc Raster
II.5.3.Cấu trúc dữ liệu dạng Vector
Như phàn trên đã giới thiệu,trong cấu trúc dữ liệu dạng Vector, các đối tượng không gianđược trình bày bằng một loạt các Vector Trong khái niệm toán học, một Vector được thể hiện bằng một điểm xuất phát (starting point) với toạ độ X và
Y đã cho, một hướng (direction) nghĩa là có một góc nào đó theo hướng đông, tây, nam, bắc và một độ dài (length) Một điểm được thể hiện bởi một Vector bị thoái
Trang 19hoá (degenerate) với cả hướng và độ dài của nó đều bằng 0 Trong trường hợp này điểm cũng không có cả diện tích
Một đường được thể hiện bởi sự lặp lại của các Vector, mà các Vector này là các đoạn thẳng vì chiều rộng của các Vector cũng không được xác định nên về ý nghĩa không gian, đường chỉ có một kích thước, đó là độ dài
Một polygon được thể hiện bở một loạt các Vector tạo nên một vùng khép kín và diện tích của vùng đó có thể đo được
Hiình 5 cấu trúc dữ liệu vecter Những ưu điểm của cấu trúc Vector:
• Ít trường hợp tư liệu bị đầy chặt bộ nhớ trong máy tính vì tổ chức dữ liệu Vector thường ở dạng nén, vì có thể chứa được một lượng dữ liệu Vector rất lớn trong tư liệu không gian
• Các đối tượng riêng biệt được thể hiện một cách rõ ràng và liên tục bằng những đường nét rõ ràng
• Các yếu tố không gian về mặt hình học thì dễ dàng được xác định
• Có độ chính xác cao trong việc tính toán và xử lý các yếu tố không gian
Nhược điểm:
Trang 20• Nhược điểm lớn nhất của cấu trúc dữ liệu Vector là xử lý chồng xếp các lớp bản đồ rất khó thực hiện được, ngay cả những việc chồng xếp rất đơn giản của
dữ liệu Raster
Ví dụ: Để xác định một điểm nằm trong một polygon không thì ở cấu trúc Raster rất đơn giản khi biết vị trí của điểm theo hàng hay cột Trong khi đó ở cấu trúc Vector thì phải có một sự tính toán rất phức tạp
- Hình bên trái dễ dàng xác định vị trí pixel B ở hàng 7 và cột số 8 hình bên phải các polygon A, B, C, D được xác định bởi một loạt các toạ độ
Hình 6 So sánh giữa cấu trúc Raster và Vector
- Rất phức tạp Để xác định một điểm có toạ độ 8,4 (theo toạ độ phẳng) (tương ứng với điểm B ở hình bên trái có toạ độ hàng 7 cột 8) thì việc tính toán là rất phức tạp mới xác định được điểm đó nằm ở polygon nào
II.4.Mô hình cấu trúc dữ liệu cung và điểm nút (area-node)
Một mô hình dữ liệu là một cấu trúc cớ bản của dữ liệu được thiết kế để sao cho việc khai thác và xử lý là thuận tiện nhất
Mô hình cung và điểm nút (are-node) là môhình do cục thống kê của Mỹ thiết kế theo các file dữ liệu địa lý từ năm 1980 Trên cơ sở mô hình này, các đường phố và yếu tố dạng tuyến khác của nước Mỹ cũng được tổ chức theo hệ thống file dữ dạng có hai thuộc tính độc lập về cung và điểm nối (dual independence map encoding - DIME) (are-node Model- mô hình cung điểm nối) Theo mô hình này, các cung tạo nên phần lớn các đơn vị cơ bản trên bản đồ Khái niệm về cung (area) ở đây khác với khái niệm về cung ở trong hội bản đồ của Mỹ quy định ở đây mỗi một cung bao gồm hai điểm nút: điểm đầu và điểm cuối Giữa các điểm nối và cung có thể không có hoặc có các giao điểm của các cung khác Hình dạng và độ dài của cung được xác định bởi vị trí của các điểm nối và các
Trang 21giao điểm (vertice hoặc vertex) Một điểm nối khác với giao điểm về tính chất hình học Cụ thể: một điểm nối thì có toạ độ x và y và thuộc tính hình học, còn giao điểm (vertex) thì chỉ có toạ độ x và y mà không có thuộc tính (hình 7)
Hình 7 Cấu trúc một polygon đơn giản trong mô hình cung và điểm nối
Trên hình 3 có 4 polygon 101, 102, 103 và 104, các polygon được xác định bởi 7 cung (are) từ 33-39 Mỗi cung có một điểm nối là điểm đầu và điểm cuối Những cung thẳng là không có giao điểm còn những cung gấp khúc là có một hoặc nhiều giao điểm (vertex) Một điểm quan trọng cần lưu ý về mô hình cung - điểm nối là một cung luôn được xác định bởi một điểm nối
Hướng của một cung được hiểu một cách đặc biệt trong thứ tự của các điểm nối, đó là điểm đầu và điểm cuối Với một hướngđã biết thì hai phía (phải và trái) của cung cũng được xác định Những thông tin về một cung bao gồm:
Thuộc tính (ID) của cung
Thuộc tính (ID) của điểm nối đầu
Thuộc tính (ID) của điểm nối cuối
Thuộc tính (ID) của polygon bên trái của cung
Toạ độ x, y của điểm nối đầu
Toạ độ x, y của điểm nối cuối
Toạ độ của tất cả giao điểm
Ngoài ra trường (field) bao gồm độ dài của một cung cũng được xác định Điểm nối có ý nghĩa về mặt hình học là nó thể hiện sự tiếp nối giữa hai yếu
tố mô hình cung - điểm nối (area-node), một điểm được thể hiện bằng một yếu tố đường bị thiếu hụt (degenerate) với điểm nối đầu trùng lên điểm nối cuối và không
có điểm giao cắt ở giữa
Trang 22Như vậy, một điểm được thể hiện bằng một điểm nối (node) vì điểm nối đầu
và điểm nối cuối là giống nhau Đối với polygon như đã nêu ở trên thì mỗi polygon là bao gồm tập hợp các cung và điểm nối Để xác định mối quan hệ không gian của polygon thì mọi điểm giao cắt phải được xácđịnh bằng một điểm nối
Ưu thế cơ bản của mô hình cung cầu - điểm nối là luôn có thuộc tính không gian và như vậy mức độ chính xác sẽ rất cao, đồng thời dễ xác định được mối quan hệ không gian của các yếu tố Ví dụ sự tiếp giáp của hai polygon hay pplygon này nằm trong polygon kia và cách đơn giản là xem ở bảng thống kê các cung mà chúng ta tạo nên 2 polygon đó Trong bảng thống kê nếu có một cung nào
đó là một phần của cả hai polygon thì 2 polygon đó là nằm liền kề nhau
Phần mềm ERIS ARC/INFO là phần mềm điển hình có tổ chức vector theo
mô hình cung- điểm nối và nó tự động tính và thống kê các thuộc tính của cung, điểm nối, từ đó dễ dàng cho việc tính toán và xử lý các mô hình không gian
Trong ARC/INFO, có hai dạng bảng thống kêlà bảng thống kê thuộc tính của các polygon (polygon attribute table - PAT) và bảng thống kê thuộc tính của các cung are attribute table – AAT
Bảng 1 bảng thuộc tính của polygon PAT
T- node điểm cuối
I- Poly P bên trái P-Poly P bên phải Length độ dài
1 38 3 1 2 1,1 51
2 33 4 3 5 1,0 40
3 35 4 1 3 2,1 50
Trang 234 37 2 2 4 2,2 33
5 36 1 5 2 4,1 20
6 39 5 3 2 1,0 93
7 34 4 5 1 2,1 93 Trên bảng PAT, mọi tính chất chi tiết của polygon đều được tính và thống
kê, các chi tiết đó gọi là coverage
Polygon thứ nhất (#-ID: 1)được gọi là polygone tổng hợp (universe polygone), nó thể hiện một vùng tổng hợp tất cả các polygon có bên trong và có diện tích được quy định là âm và có giá ttrị tuyệt đối bằng tổng diện tích của các polygon bên trong Các polygon tiếp theo được gắn các thuộc tính và các giá trị: chu vi, diện tích mà được tính tự động khi các tính chất chi tiết được thiết lập Bảng AAT mỗi cung được xác định bởi cả số thứ tự và thuộc tính của cung, thuộc tính của điểm đầu, điểm cuối và thuộc tính của các polygone ở bên phải, bên trái của cung Và các polygon này cũng chính là các polygone ở trong bảng PAT
Ví dụ: polygone số 3 trong bảng AAT có số thứ tự là 3 và thuộc tính là 102 t0 bảng PAT
Cả 3 yếu tố quan trọng của vector về tính chất hình học (topology) là tính chất nối tiếp (adracency), tính chất chứa đựng (containment) và tính chất nối (conectivity) là những yếu tố rất quan trọng và là vấn đề cốt lõi của mô hình cung
- điểm nối (are - node) Các yếu tố này sẽ giúp người phân tích xác định rõ được tính chất của các yếu tố trong bản đồ
Ví dụ: để xác định hai polygon có tiếp giáp nhau hay không, người phân tích chỉ cần xem các cung xác định nên hai polygon đó, nếu có một cung nào cùng tính chất thì nó chính là vị trí tiếp giáp của hai polygon Trong bảng TAB, hai polygon
có số 102 và 103 được tiếp giáp nhau bởi cung số 33 trong bảng AAT
Để xác định tính chất chứa đựng, cách xác định cũng như vậy Muốn xác định polygon A được chứa bởi polygon B hay không thì trước hết phải xác định các cung tạo nên polygon A và thuộc tính của cả hai bên các cung, nếu như xác định thấy A luôn ở mọi phía của cung thì A nhất thiết phải được chứa trong B Ví
dụ cung số 37 trong hình 3 xác định nên polygon số 101, một phía của cung luôn
là polygon số 104 thì nhất thiết polygon số 101 phải được chứa trong polygon số
104 Trong trường hợp một polygon lớn chứa nhiều polygon nhỏ bên trong cũng xác định một cách tương tự
Trang 24Tính chất tiếp nối của một cung được xác định từ thuộc tính của điểm đầu (F)
và điểm cuối (T) trong bảng AAT Hai cung được xem là nối trực tiếp một khi có chung điểm nối Ví dụ trong bảng, cung 33, 38 và 39 là có chung một điểm nối số 3.F Trong khi đó cung số 37 là không được nối với một điểm nào cả vì nó chỉ có một điểm nối riêng của nó (số 2) tạo nên polygon thứ 4 có thuộc tính là 101
Ví dụ trên là ví dụ cho một sự ưu điểm của mô hình cung - điểm nối, nó xác định mối liên hệ hình học của các yếu tố và điều rất quan trọng trong xử lý không gian Mặt khác, vị trí (toạ độ x, y) của mỗi một điểm nối, điểm giao cắt cũng được xác định các thuộc tính đó cũng được thống kê rõ ràng trong bảng PAT và AAT giúp cho người phân tích dễ dàng xử lý các thông tin Trong thực tế, các tư liệu không gian là rất phức tạp, mô hình are-node là công cụ hữu hiệu cho việc xử lý Hiện nay các phần mềm ERSI-ARC/INF và INTERGRAPH được xây dựng theo
mô hình này, Trong khi đó, phần mềm MAP/ INFO không được xây dựng theo mô hình cung-điểm nên giao diện giữa chúng không tương thích
Tóm lại: nội dung phần này nhằm giới thiệu tập trung vào tư liệu không gian,
đó là cơ sở cho việc xử lý HTTĐL Công việc thống kê thuần tuý thì không cần phải có các dữ liệu không gian, sự phân tích không gian thì lại rất cấn các thông số
đó, đặc biệt là các thông số về địa lý và bản đồ
Các đối tượng không gian có thể được trình bày dưới các dạng khac nhau là đường, điểm và polygon Các yếu tố cơ bản của chúng cần được xác định đó là vị trí, thuộc tính và tính chất hình học
Việc tổ chức các yếu tố này ở hai dạng cấu trúc Raster và polygon là khác nhau Nhìn chung vị trí và thuộc tính thì được tổ chức tương đối giống nhau trongcả hai dạng cấu trúc dữ liệu, song tính chất không gian thì hết sức khác nhau Trong xử lý không gian, các thông tin quan trọng nhất về hình học và tính chất tiếp giáp, chứa đựng và nối tiếp, cấu trúc Raster có hạn chế cơ bản là không thể hiện được mối quan hệ không gian Thay vào đó, cấu trúc Vector và đặc biệt là cấu trúc cung- điểm nối có ưu điểm là cung cấp đầy đủ các thông tin thuộc tính của điểm, đường và vùng nên nó giúp cho việc xử lý không gian được rõ ràng và hiệu quả
II.5.Mô hình mạng (network model)
Trong mô hình mạng , các cung trở thành mạng được thể hiện trong mạng giao thông (đường sắt, đường bộ, đường không), mạng lưới điện , mạng thông tin
Trang 25, mạng ống gas, ống nước Các điểm nối trở thành các điểm nối, điểm dừng hoặc điểm giữa của mạng giống như hệ thống chạc 3 hoặc hệ thống van một cổng dẫn Các điểm đó là nơi để dừng hoặc tiêp nhận các đối tượng hoặc đưa ra các đối tượng cần lưu thông , tương tự các điểm dừng xe, bến đổ, nơi chuyển tải Trung tâm của mạng là nơi chuyển tải nguồn cung cấp hoặc là nơi có những hoạt động có tính chất cung ứng cho mạng như: siêu thị, bệnh viện, sân bay, trường học… ở qui
mô lớn hơn trung tâm có thể là cả một thành phố cung cấp , chuyển tải cho cả một vùng rộng lớn Như vậy điểm liên hệ trong mạng là những đầu mối và các đường dẫn và mối liên hệ đó có hướng nhất định theo các điểm quay - đổi chiều Tóm lại những tính chất như đường nối , điểm nối , các điểm dừng , các trung tâm và các điểm quay là những thông tin thuộc tính của mô hình mạng cơ sở dữ liệu vector Còn một tính chất khác của mạng là sự cản trở (tương tự điện trở của mạch điện)
Sự cản trở bởi khối lượng thông tin được truyền và thời gian truyền tải Sự cản trở
có liên quan đến nhiều yếu tố của mạng, đồng thời có liên quan đến cả năng lượng truyền Trong mạng của HTTDL với dữ liệu vector , những yếu tố quan trọng ảnh hưởng đến sự liên kết trong mạng đó là yếu tố hình học và sự nối tiép Ngoài ra các thuộc tính khác của đối tượng cũng phải được bố trí hợp lý cho từng mạng
II.7.Chuyển đổi khuôn dạng dữ liệu
Trong xử lý HTTĐL, ngoài việc chuyển đổi khuôn dạng dữ liệu (format) với các phần mềm khác thì một trong những chức năng quan trọng cần thiết là chuyển đổi từ vector sang Raster và ngược lại Chức năng này cho phép sử dụng một cách linh hoạt những lớp thông tin có sẵn trong CSDL hoặc các lớp thông tin mới tạo nên để đưa vào xử lý nhanh chóng trong hệ thống
Chuyển đổi dữ liệu thanhf Raster (Raster hoá) (Rasterisation hay Rasterising) là quá trình chuyển đổi dữ liệu từ cơ sở pixel sang dạng vector Công việc này rất cần thiết cho nhiều mục đích, Khi mà các đường contour của vector cần thiết được xử lý phối hợp với tài liệu Raster
Để Raster hoá cần thiết phải tạo lưới với độ phân giải (kích thước pixel) thích hợp lên toàn bộ bản đồ và tính gia trị pixel bằng việc lựa chọn các vùng mẫu tại nơi giao nhau của các đường vector hoặc nơi tiếp giáp của các polygon, từ đó gắn giá trị các pixel tại nơi tiếp giáp, sao cho nó phân biệt hẳn với các pixel ở xung quanh Nếu vector hoá với độ phân giải thấp thì sẽ làm giảm độ chính xác của bản đồ đôi khi làm rối các đường contour
Trang 26Nguyên nhân của việc làm rối, sai lệch các đường là do lựa chọn độ phân giải không thích hợp hoặc chọn vùng mẫu của lưới chưa đúng vị trí Tuy nhiên, trong thực tế áp dụng các chức năng này đã có sẵn trong các phần mềm nên khi áp dụng người sử dụng ít phải can thiệp và khi cần thiết thì thao tác; quan trọng là xác định độ phân giải và vị trí các ô lưới
Chuyển dữ liệu Raster thành vector (vector hoá) có nhiều phương pháp vector hoá Công việc này chỉ thực hiện một khi tài liệu gốc có ở dạng Raster (ví
dụ như ảnh vệ tinh hoặc các bản đồ nội suy) trong quá trình phân tích lại đòi hỏi ở dạng vector Vector hoá chỉ thực hiện được một khi chiều rộng của dải pixel được xác định và có đường nối giữa các pixel đó với nhau Vector hoá là một quá trình
xử lý tỉ mỉ, nó đòi hỏi phải có sự xem xét và điều khiển quá trình xử lý, đặc biệt là
ở những chổ tiếp nối Trong quá trình hai việc phải làm là: tẩy sạch rìa của các đối tượng có chức năng tạo nên đường biên giới Kết quả là các đối tượng này trông sắc nét dạng răng cưa vuông Quá trình tẩy rửa được thực hiện theo chiều kim đồng hồ Quá trình tẩy cũng cho phép bổ sung các toạ độ của các pixel một cách
rõ ràng để phục vụ cho việc định vị các đường vector được lập
Hình 8 chuyển đổi Raster và véctơ
Nối các pixel bằng đường chạy qua chúng Đây là quá trình xử lý đơn giản giống như việc số hoá Quá trình này được thực hiện lần lượt, khi gặp vị trí có sự chuyển thành nhiều hướng thì đó là các điểm Quá trình này có sự can thiệp của người điều hành thì kết quả sẽ tốt hơn Cũng cần lưu ý rằng chức năng vector hoá chỉ nên áp dụng một khi cần thiết
Trang 27Tóm lại, những phần trên này đã tập trung giới thiệu để cung cấp một cách nhìn rõ ràng về vấn đề cơ sở dữ liệu hình thành trong máy tính Chúng ta cũng đã nêu khái quát những đặc điểm của hai dạng dữ liệu cơ bản là Raster và vector, đồng thời cũng giới thiệu về hai khái niệm quan trọng khác của HTTĐL là mạng
và các bề mặt
Do dữ liệu Raster thường chiếm khối lượng lớn nên cần thiết phải có các phương pháp nén dữ liệu Có một số khái niệm nén số liệu phổ biến như sau
- Mã hoá chạy theo dòng ( run lengh code)
- Mã hoá theo chuỗi mắt xích ( chain codes)
- Mã hoá theo khối ( bloch codes )
- Mã hoá theo cách chia thành 4 ô nhỏ (quadtrees )
Nếu so sánh thì độ chính xác của dữ liệu vector cao hơn Raster Tuy nhiên
dù sao khái niệm độ chính xác của các đối tượng trong HTTĐL vẫn chỉ là tương đối Trong quá trình xử lý theo mô hình không gian thì sự phối hợp giữa hai dạng
tư liệu là điều cần thiết và là tất nhiên
Tóm tắt chung
Phần này đã tập trung giới thiệu để cung cấp một cách nhìn rõ ràng về vấn
đề cơ sở dữ liệu hình thành trong máy tính Trong đó, đã nêu khái quát những đặc điểm của hai dạng dữ liệu cơ bản là Raster và vector Do dữ liệu Raster thường chiếm khối lượng lớn nên cần thiết phải có các phương pháp nén dữ liệu
Nếu so sánh thì độ chính xác của dữ liệu vector cao hơn Raster, tuy nhiên dù sao khái niệm độ chính xác của các đối tượng trong HTTDL vẫn chỉ là tương đối Trong quá trình xử lý theo mô hình không gian thì sự phối hợp giữa hai dạng tư liệu là điều cần thiết và là tất nhiên.Thông thường , các mô hình xử lý tư liệu thường là không gian hai chiều hoặc 3 chiều Trong tương lai, để theo dỏi diễn biến của các đối tượng thì phải xử lý theo đa thời gian và dự báo - đó là khái niệm
về chiều không gian thứ 4 của mô hình xử lý HTTDL
III.TÍNH CHẤT ĐỊNH LƯỢNG CỦA PHÂN TÍCH KHÔNG GIAN
Ba yếu tố của thông tin không gian là: vị trí, thuộc tính và tính chất hình học
có những vai trò khác nhau trong phân tích không gian Thông thường, những nghiên cứu đầu tiên là tập trung vào các thuộc tính của dữ liệu Về sau, hướng cần nghiên cứu là thiết lập mô hình để giải thích sự phân bố của các hiện tượng hoặc
Trang 28các yếu tố tự nhiên trong mối quan hệ không gian nghĩa là phải xác định mối quan
hệ về vị trí và thuộc tính của chúng
Mỗi một yếu tố không gian đều chiếm một vị trí nhất định trên bề mặt trái đầt Vì vậy muốn thể hiện một đối tượng nào đó lên bản đồ, nhất thiết phải được đặt trong một hệ thống toạ độ qui định Độ chính xác của vị trí tuỳ thuộc vào hệ thống toạ độ sử dụng và phương thức tổ chức của các đối tượng lên bản đồ Bên canh đó, việc xử lý không gian thường có tham khảo, sử dụng nhiều nguồn tư liệu với các hệ thống toạ độ khác nhau, vì vậy độ chính xác của xử lý còn tuỳ thuộc vào khả năng chuyển đổi giữa các hệ thống toạ độ đó
Một số yêu cầu cơ bản về định lượng của việc phân tích không gian
Hệ thống toạ độ sử dụng phải tiện lợi cho quá trình tổ chức dữ liệu và xử lý HTTĐL Khi xử lý nhiều nguồn dữ liệu với các hệ toạ độ khác nhau thì hệ thống phần mềm phải có khả năng chuyển đổi toạ độ một cách đa dạng
Vì HTTĐL thường sử dụng nhiều nguồn tư liệu ở các hệ thống toạ độ khác nhau, phần mềm phải có khả năng thiết lập và chuyển đổi toạ độ vào hệ thống thường được sử dụng HTTĐL phải cho phép những người sử dụng khác nhau có thể chuyển đổi toạ độ của dữ liệu nguồn về một hệ thống toạ độ chuyên để được
sử dụng với từng chuyên ngành, khi đó phải có các hàm toán chuyển đổi tọa độ Việc đo đạc vị trí là bước đầu tiên của xử lý không gian và điều cốt yếu là phải thể hiện được vị trí của bất kỳ một đối tượng nào trong hệ thống toạ độ sử dụng sử dụng xác định hệ thống tọa độ là hết sức quan trọng vì nó giúp cho việc xác định tính chất và các thuộc tính về vị trí của dữ liệu
Một trong những hệ thống toạ độ rất quan trọng cho việc xử lý không gian cũng như cho việc vẽ bản đồ là toạ độ lưới (grid system) và hệ thống này được chấp nhận một cách rộng rãi và có giá trị tham khảo cho toàn bộ các hệ toạ độ khác Ngoài ra còn sử dụng hệ toạ dộ UTM (Universal Transverse Mercator projection)
III.1.hệ thống của toạ độ lưới-hay tọa độ địa lý
III.1.1 Toạ độ địa lý
Trong hệ thống toạ độ lưới, vị trí của một nơi trên bề mặt trái đất được xác định vào khoảng cách đến xích đạo và đường kinh tuyến chính Phương Bắc địa lý (cực Bắc) được xác định là điểm cuối phía Bắc của trục quay trái đất và tương tự như vậy điểm Nam là điểm cuối trục quay trái đất Xích đạo là nơi tập hợp các điểm tạo nên là cơ sở để đo vị trí của các điểm ở hai hướng Đông và Tây Nửa
Trang 29bán cầu phía đông của kinh tuyến chính, còn phần Tây bán cầu là ở phía Tây Kinh
độ của một điểm bất kỳ được đo bởi khoảng cách góc giữa xích đạo và điểm thứ hai tương ứng có cùng vĩ độ và nằm ở kinh tuyến chính
(N)
0 0 Kinh tuyÕn chÝnh
Hình 9 các đường kinh tuyến, vĩ tuyến trong hệ toạ độ lưới
Việc xác định hướng Đông hay Tây tuỳ thuộc vào vị trí điểm nằm ở bán cầu nào Vì kinh độ và vĩ độ được xác định trên cơ sở của hệ thống lưới và việc đo đạc được thực hiện trên hình cầu thay vì đo trên mặt phẳng Như vậy, mỗi một ô được xác định bỏi một cặp kinh tuyến và một cặp vĩ tuyến với một bề mặt cong Toạ độ dựa trên kinh độ và vĩ độ phải được chuyển đổi về một lưới chiếu bản đồ Tóm lại lưới địa lý là lưới được chiều từ dạng mặt cầu lên một mặt phẳng để tạo lập nên bản đồ Dưới dây là hai mối liên hệ quan trọng về mối quan hệ không gian của kinh độ và vĩ độ
Khoảng cách 1o của vĩ độ được xem là hằng số mặc dù trong thực tế khoảng cách đó là khác nhau tuỳ thuộc vào vĩ độ Trong khi đó khoảng cách 1o của kinh
độ là khác nhau khi ở các vĩ tuyến khác nhau
Khoảng cách 1o kinh độ là khác nhau so với khoảng cách 1o vĩ độ và khác nhau giữa hai điểm nằm cách nhau mặc dù ở trên cùng kinh tuyến Do có sự không nhất quán trong việc đó giữa kinh độ và vĩ độ mà việc đo khoảng cách dựa theo kinh độ và vĩ độ không áp dụng chung được trong xử lý không gian
Hệ thống lưới địa lý thường được dùng để tham khảo chung về vĩ trí trên bề mặt trái đấi: vì hệ thống này xác định ví trí trên bề mặt cầu hơn là trên bề mặt phẳng và một đặc điểm chính của hệ thống là sự khác biệt với việc thể hiển một vị trí với hai chiều Do đó trong việc áp dụng chính xác thì vị trí phải được chuyển đổi về hệ thống toạ độ phẳng hai chiều Ba vấn đề quan trọng trong việc thể hiện một hệ thống toạ độ là xác định hướng bản đồ, tỉ lệ bản đồ và lưới chiếu bản đồ
III.1.2.Định hướng bản đồ
Trang 30Khi đã xác định hệ thống toạ độ, công việc đầu tiên là định hướng bản đồ Thông thường chỉ thị định hướng cho bản đồ là mũi tên chỉ hướng bắc Đối với bản đồ địa chất của Mỹ, thông thường có 3 hướng Bắc Hướng Bắc thực (đúng), hướng Bắc tư tưởng và hướng Bắc của lưới Hướng Bắc thực là chỉ đúng về hướng cực Bắc của Trái đất Hướng Bắc tư tưởng là xác định theo kim của nam châm Hướng Bắc của lưới là đường thẳng đứng chỉ tới điểm cuối cùng của lưới chiếu ô (Grid) Thông thường, trục thẳng đứng của một hệ thống toạ độ chính là cùng với hướng Bắc của lưới Vì vậy, hướng Bắc của lưới có thể khác nhau tại từng phần của Trái đất, nên đối với một hệ toạ độ khác thì cần hiểu rằng đó chỉ là hướng Bắc của hệ toạ độ mà thôi
Tỉ lệ bản đồ: tỉ lệ bản đồ được xác định bằng tỉ số giữa một đơn vị độ dài trên bản đồ với khoảng cách thực, tương ứng trên thực tế bản đồ có thể xác định theo 3 cách: bằng lới thuyết minh, bằng toán học hoặc bằng biểu đồ
• Xác định bằng lời ,ví dụ : 1 cm bản đồ tương ứng với 1000m thực tế hay 1
dữ liệu, độ phân giải của phần mềm (nghĩa là sự xác định về sai khác trong khái niệm, số nguyên hay điểm thị sai (floating point) hoặc mức độ chính xác của điểm thị sai là bậc 1 và 2
Trang 31Cực Nam
Xích đạo
Kinh tuyến
Vĩ tuyến
Hỡnh 10 Cỏc yếu tố chớnh của trỏi đất
Vĩ tuyến là những vựng trũn bất kỳ trờn bề mặt trỏi đất và song song với xớch đạo Như vậy số lượng vĩ tuyến là vụ cựng mà mỗi điểm trờn mặt đất đều rơi chớnh xỏc vào một điểm đú Kinh tuyến là một vựng trũn tưởng tượng trờn bề mặt trỏi đất và chia đụi quả đất thành hai phần bằng nhau và nú chạy qua cả cực Bắc và cực Nam của Trỏi đất Như vậy số lượng kinh tuyến là vụ cựng nhiều Kinh tuyến
và vĩ tuyến luụn vuụng gúc với nhau và gúc giao của chỳng luụn là 90o Kinh tuyến chớnh được quy định một cỏch ngẫu nhiờn là kinh tuyến đi qua đài quan trắc thiờn văn Greenwich ở Anh
Xớch đạo được sử dụng như một đường vĩ tuyến cơ sở để xỏc định hai hướng Bắc và Nam và nú cú giỏ trị là 0o. Vĩ độ của một điểm bất kỳ được đo bằng khoảng cỏch gúc (angular distance) giữa điểm đú và xớch đạo và nú xỏc định cho một gúc giữa đường thẳng nối từ điểm đú tới tõm Trỏi đất và đường thẳng từ tõm Trỏi đất đến một điểm cú cựng kinh độ và năm trờn đường xớch đạo Như vậy một điểm nằm trờn bỏn cầu phớa Bắc mà cú vĩ độ là 900 thỡ chớnh là điểm cực Bắc Tương tự như vậy ở Nam bỏn cầu là điểm cực Nam của Trỏi đất Kinh tuyến cú giỏ trị 0 được sử dụng và những vấn đề khỏc Tất cả sẽ trở nờn bằng nhau khi mà độ chớnh xỏc về tư liệu vị trớ là một hàm của tỉ lệ bản đồ Nhỡn chung, cỏc bản đồ tỉ lệ lớn hơn thường cú độ chớnh xỏc lớn hơn
Tỉ lện bản đồ ảnh hưởng tới sự đo đạc của việc thống kờ khụng gian do đú phải phõn tớch kỹ cỏc kết quả thống kờ
Mặc dự tỉ lệ bản đồ thể hiện cho một bản đồ tiờu chuẩn, song trong thực tế thỡ tỉ lệ bản đồ lại khỏc nhau tuỳ thuộc vào vị trớ của nú ỏ trong lưới chiếu Vớ dụ khoảng cỏch của hai điểm ở gần cực thỡ khỏc với khoảng cỏch của hai điểm đú nếu
nú thuộc về vĩ độ cao hơn mặc dự trong bản đồ thỡ khoảng cỏch đú được thể hiện gần bằng nhau Sự sai lệch đú sẽ ảnh hưởng nhiều khi thực hiện ở bản đồ tỉ lệ lớn,
do vậy khụng thể sử dụng những dấu hiệu phõn tớch ở bản đồ nhỏ ỏp dụng cho bản
Trang 32đồ tỉ lệ lớn, do vậy không thể sử dụng nhưng dấu hiệu phân tích ở bản đồ nhỏ áp dụng cho bản đồ tỉ lệ lớn Trong thực tế, để phân tích không gian cho nghiên cứu địa hình ở tỉ lệ nhỏ với một vùng rộng lớn thì những sai lệch của việc đo đạc có thể rất lớn và cần phải được cân nhắc khi xử lý
III.1.3.Các lưới chiếu bản đồ
Các phân tích không gian yêu cầu có sự chuyển đổi các đặc điểm trên bề mặt cầu của Trái đất thành hệ thống toạ độ hai chiều Phép chiếu bản đồ cung cấp khả năng chuyển tư liệu vị trí từ mặt cầu sang bề mặt phát triển Developed Surface và một bề mặt phát triển đó có thể được trình bày thành một bề mặt phẳng hoàn toàn Mặc dù nều mặt cầu được chia thành rất nhiều mẩu nhỏ thì mỗi mảnh vẫn còn lưu giữ được phần cong của mặt cầu nguyên thuỷ Do đó, nhiệm vụ của bản đồ học là chuyển đổi một cách hệ thống tài liệu vị trí từ mặt cầu sàng bề mặt phát triển Rất nhiều lưới chiếu bản đồ có khả năng đó, nhưng tất cả đều bị sai lệch ở một trong các yếu tố: hình dạng, diện tích, khoảng cách và hướng Một lưới chiếu bản đồ tối ưu đối với một phép chiếu nào đó thì phụ thuộc vào việc có độ chính xác cần thiết và kích thước của vùng nghiên cứu (bản đồ) Ngoài ra còn một số yếu tố khác Mỗi lưới chiếu có một quá trình chuyển đổi riêng và có những đặc điểm riêng Có 4 phương pháp chiếu cơ bản là chiếu theo phương vị (azimuthal), chiếu hình trụ (cylindrical), chiếu hình nón và chiếu hình trụ giả (Psedu-cylindrical)
Lưới chiếu phương vị: có đặc điểm là sử dụng một nguốn sáng từ trung tâm
hình cầu chiếu vào các đường kinh vĩ tuyến thì hình chiếu của kinh vĩ tuyến lên mặt phẳng nằm ngang vuông góc sẽ là lưới chiếu phương vị thông thường, hình chiếu đó là những vòng tròn đồgn tâm và các đường kính giao nhau tại tâm, nguồn sáng có thể là khác nhau tạo nên các lưới khác nhau và nếu khoảng cách nguồn sáng là xa vô cực thì lưới chiếu Bắc bán cầu và Nam bán cầu lên bề mặt tiếp tuyến
là trùng nhau, khí đó gọi là "lưới chiếu phương vị tập thể" (Stereo graphic Projection)
Trang 33Hình 11 Lưới chiếu phương vị
Hệ chiếu hình lăng trụ: là lưới chiếu để chuyển các đường kinh vĩ tuyến từ
mặt cầu lên bề mặt một hình trụ đứng, hình trụ này phủ lên hình cầu với vùng tròn tiếp tuyến hoặc cắt qua hình cầu bởi những vòng tròn đồng tâm Khi phát triển bề mặt hình trụ này thành mặt phẳng thì tạo nên một hệ toạ độ có 2 kích thước, khí đó
bề mặt hình trụ chuyển thành hình chữ nhât
Hình 12.Lưới chiếu hình trụ triển khai thành mặt phẳng với các ô hình chữ nhật
Hệ chiếu hình nón là hệ chiếu che phủ lên hình cầu hoặc cắt qua nó bởi một
hình tháp nón chuyển thành dạng hình nón cụt (hình 13)
Hình 13 Triển khai của lưới chiếu hình trụ
Hệ lưới chiếu UTM (Universal Transverse Mecator) của Mỹ là sử dụng hệ lưới chiếu hình nón Ngoài ra còn một hệ lưới chiếu khác gọi là hệ chiếu giả hình
Trang 34trụ, nó không thật sự lưới chiếu hình lăng trụ nhưng có cơ sở toán học tương tự như hệ chiếu hình lăng trụ
Tóm lại: Các hệ chiếu bản đồ có 3 thuộc tính không gian cơ bản là: bằng
nhau về diện tích vùng chiếu, sự nhất quán về lưới chiếu và các thuộc tính khác như góc, hình dạng và mối quan hệ của các yếu tố là ổn định
Diện tích và quan hệ góc là những thuộc tính rất quan trọng của bản đồ Song một lưới chiếu thì không đảm bảo được cả hai tính chất đó Nghĩa là một hình chiếu có cùng diện tích thì luôn có quan hệ khác nhau về góc giữa các đối tượng
và ngược lại nếu quan hệ về góc giống nhau thì diện tích lại khác nhau
Về dạng khác của lưới chiếu là loại lưới chiếu tạo nên sự ổn định hoặc không
ổn định về diện tích song thường có sự bố trí tương đối hợp lý giữa hai tính chất diện tích và quan hệ về góc Sự bằng nhau và ổn định là hai thuộc tính có tính chất toàn cầu về lưới chiếu Có một số lưới chiếu được áp dụng mang tính địa phương mà không áp dụng được cho mọi nơi trên một tờ bản đồ Thông thường các lưới chiếu này áp dụng cho lập bản đồ tỉ lệ lớn tại một số vị trí cụ thể
Một ví dụ khác là lưới chiếu phương vị với khoảng cách bằng nhau (azimural equidistant projection) thể hiện khoảng cách giữa một điểm ở trung tâm của lưới chiếu và các điểm khác trên bản đồ Trong trường hợp này, các khoảng cách bằng nhau đó không thể áp dụng cho bất kỳ một cặp điểm nào khác mà phân bố theo nguyên tắc khác
Hệ toạ độ lưới địa lý là không phải hệ Cartesian vì hai lý do sau: trước hết hệ toạ độ lưới là dựa theo bề mặt cầu và nó không phải là có hai kích thước (hai chiều)
Thứ hai, mặc dù kinh tuyến và vĩ tuyến là vuông góc với nhau nhưng khoảng cách từ kinh tuyến đến vị tuyến là luôn khác nhau Nghĩa là khoảng cách 1o của kinh độ thì không phải là luôn bằng khoảng cách 1o của vĩ độ Vì vậy hệ thống toạ
độ lưới thường không phù hợp cho việc tạo lập toạ độ trong xử lý không gian Trong khi đó, hệ thống toạ độ UTM (Universal Transver Mercator) lại được sử dụng rộng rãi trong HTTĐL do đó khắc phục được những hạn chế của hệ toạ độ lưới
Hệ lưới chiếu UTM (Universal Transver Mercator)
Hệ lưới chiếu UTM có cơ sở là phép chiếu Mercator do cục địa chất Mỹ xây dựng đầu tiên cho một loạt các bản đồ ở vùng vĩ độ 7,5 phút, có phối hợp kiểm tra
Trang 35bằng hệ thống đo đạc nổi toàn năng theo cực (Universal Polar Stereographic - UPS)
Trong phép chiếu Mercator đã được dùng từ lâu trong hàng hải thì các đường tạo lưới có bản chạy dọc theo kinh tuyến Vì độ lệch tăng dần theo khoảng cách đến kinh tuyến chuẩn Phép chiếu Mercator chuyển đổi chỉ dùng có hiệu quả trong vùng gần với kinh tuyến chính Vì vậy, toàn bộ trái đất được chia thành nhiều vùng hẹp thuộc phía Bắc và Nam Trong mỗi vùng thì sự sai lệch về toạ độ là nhỏ nhất
Theo nguyên tắc đó, hệ UTM được tổ chức thành các vùng tính từ Đông sang Tây, mỗi vùng rộng 6o theo kinh độ Như vậy toàn bộ trái đất bao gồm 60 vòng Tỉ
lệ được thể hiện dọc theo 2 kinh tuyến ở phía Đông và phía Tây của kinh tuyến Trung tâm có độ ổn định là 0,966
60 vùng của hệ UTM bắt đầu từ đường đánh dấu quốc tế International Date Line (IDL) hay là kinh độ 180o căn cứ vào đồ thị vùng thứ nhất (vùng 1) bao phủ một dải giữa kinh độ nghĩa hoàn hảo khi áp dụng trong một vùng (zone)
168W 162W 156W Bắc
Nam
174W 180W
84Bắc
Xích đạo
80Nam
Hình 14 Hệ toạ độ UTM
Toạ độ của mỗi một vùng phải được tham khảo một cách độc lập Ví dụ: toạ
độ ở vùng 11 thì không thể dùng để tham khảo cho vùng 12 hay vùng khác Khoảng cách hướng đông được xác định là khoảng cách từ đường trung tâm của vùng, có giá trị bằng với giá trị của trục nằm ngang trong hệ toạ độ Carsterian Đường trung tâm được thiết kế cho việc đo chuẩn về hướng Đông là 500 000m Với đó, các điểm nằm trong vùng đều giá trị dương Nếu khoảng cách 1 điểm về hướng Tây lớn hơn 500 000 mét so với đường trung tâm thì điểm đó phải thuộc về vùng kế tiếp Một giá trị hướng đông nếu nhỏ hơn 500 000 mét thì nó thể hiện một vị trí ở phía Tây của đường trung tâm Toàn bộ các trường hợp, giá trị
Trang 36hướng đông đều là dương và nhỏ hơn 1 000 000 mét, vì cùng một vùng Nói cách khác, chiều dài nằm ngang thực tế của một vùng là rộng nhất ở vùng xích đạo và
nó trở nên rất hẹp khi chuyển dần về phía cực
Khoảng cách hưởng Bắc: được đo theo hướng Bắc - Nam, nó có giá trị bằng trục Y (thẳng đứng) trong toạ độ Castersian Tại bán cầu Bắc, xích đạo được xác định là đường 0m Toàn bộ các vị trí trên bán cầu Bắc sẽ có giá trị là khoảng cách
về hướng Bắc bằng khoảng cách đến xích đạo, ở bán cầu Nam, cực Nam được xác định là có giá trị khoảng cách về hướng Bắc là 0 và xích đạo có giá trị hướng Bắc
là 10 000 000 mét
Hệ toạ độ UTM thực tế về bản chất là hệ Castersian vì đơn vị mét là đơn vị tiêu chuẩn để đo Nói tóm lại: một đơn vị khoảng cách trên trục X thì bằng một đơn vị khoảng cách trên trục Y và khoảng cách về hướng Đông và khoảng cách về hướng Bắc được đo theo hai hướng vuông góc với nhau Tất nhiên, có một hạn chế chính của hệ UTM là nó không thể áp dụng cho những vùng cắt chéo nghĩa là một khi diện tích nghiên cứu lại nằm ở hai vùng khác nhau thì hệ UTM nhất thiết phải được chuyển sang hệ lưới chiếu khác để phân tích
Phần lớn các phần mềm GIS đều có chức năng toạ và chuyển đổi hệ lưới chiếu và hệ lưới chiếu GRID được dùng rộng rãi để thể hiện bề mặt trái đất, người phân tích có thể chuyển đổi hệ UTM của 2 vùng liền kề nhau sang kinh độ, vĩ độ của hệ lưới chiếu GRID Trường hợp đó thì toàn bộ bản đồ lại phải được xử lý ở
hệ toạ độ khác để phân tích về hệ GRID cũng không phải hệ Cartesian
Một ưu điểm khác đặc biệt quan trọng của hệ UTM cho phân tích không gian theo tỉ lệ của địa hình là các vùng của UTM được tổ chức theo hình chữ nhật mặc
dù trong thực tế nó không phải là hình chữ nhật Nguyên nhân là do khoảng cách Đông - Tây là khác nhau và đoạn dài của 1o kinh độ luôn khác nhau từ chỗ này sang chỗ khác Về tập thể, hệ UTM là chỉ có hiệu quả ở trong dải từ 81o Bắc đến
84o Nam Ngoài vùng đó thì hệ chiếu cực toàn năng lập thể được sử dụng thay cho UTM Một điểm lưu ý là toạ độ của vùng cắt chéo thì không thể sử dụng chung được
Hệ toạ độ phẳng quốc gia:
Hệ toạ độ phẳng quốc gia thường được xây dựng để dùng riêng cho mỗi quốc gia Hệ toạ độ phẳng được dùng như một tài liệu lịch sử để quản lý đất đai
Hệ toạ độ này không thích hợp cho việc nghiên cứu mang tính khuvực hoặc một vùng rộng lớn vì trong thực tế, mỗi quốc gia lại sử dụng một hệ lưới chiếu riêng Các nước nằm theo hướng Đông - Tây thì hãy sử dụng hệ lưới chiếu chuyển đổi
Trang 37Mercator, trong khi đó các nước năm theo hướng Nam Bắc lại sử dụng hệ lưới chiếu hình nón khối Lambert Mỗi nước lại chia thành nhiều vùng nhỏ để giảm thiểu những sai số ưu thế của hệ toạ độ phảng quốc gia là sử dụng đơn vị đo riêng
Ví dụ ở Mỹ và Anh thì dùng foot (hay feet), inch (1 foot = 12 inch, 1 yard = 3 feet,
1 mile = 5280 feet)
Nhiều nước thì sử dụng hệ mét vì hệ đơn vị này thông dụng hơn khi đo khoảng cách Tuy nhiên, đo đạc để lập hệ toạ độ phẳng quốc gia đôi khi gây nhiều khó khăn cho xử lý không gian ở tỉ lệ khu vực Lý do không chỉ vì sự chuyển đổi các đơn vị đó mà việc chuyển hệ toạ độ từ hệ lưới chiếu này sang hệ lưới chiếu khác đòi hởi những quá trình tính toán phức tạp, đặc biệt là trong trường hợp các
vị trí khác nhau lại được xác định theo các hệ toạ độ khác nhau
III.4.Các phép đo đạc cơ bản về các đối tượng không gian
III.4.1.Đo đạc các giá trị thuộc tính
Với việc thành lập một hệ toạ độ, mỗi đối tượng điểm cần phải được trình bày bởi một cặp giá trị toạ độ x và y Để tiện sử dụng, trong phần này Pi được trình bày cho điểm thứ i trong một thuộc tính (coverage) và vị trí của một điểm được xác định bởi (xi, yi) Đối tượng đường: được thể hiện bằng trật tự của các điểm Trong lập bản đồ số, các đường cong được chia nhỏ thành hàng loạt các đoạn thẳng Tính chất của đường cong sẽ phụ thuộc vào số lượng điểm, nghĩa là phụ thuộc vào số lượng đoạn thẳng được chia ra Khi số lượng đoạn thẳng tăng lên thì đường sẽ gần giống đường cong hơn Một đường thẳng được xác định bởi hai điểm nối đầu và cuỗi Như vậy, một đường Li được trình bày bởi một loạt các điểm PiS nghĩa là Li (P1, P2, P3… Pn) với n là số lượng điểm xác định lên đường
Li Một vùng cũng được trình bày bằng cách tương tự với các đường là tập hợp các đoạn segment thẳng Trong trường hợp đó thì một đường tròn không thể quan niệm là một vòng tròn Thay vào đó đường tròn là tập hợp rất nhiều đoạn thẳng bằng nhau và chúng tạo nên một vùng có hinhf dạng là tròn Căn cứ vào đó, một Polygon Gi được trình bày dưới dạng là Gi (L1, L2, … Lm) với m là số lượng đoạn thẳng được chia ra để tạo nên polygon
Một khi các đối tượng không gian được xác định thì việc đo đạc hình học cơ bản được áp dụng để thực hiện việc đo đạc và tính toán
Khoảng cách giữa hai điểm trong bề mặt Cartesian (bề mặt thuỷ chuẩn) được xác định bởi khoảng cachs Ơclit (Euclidean Distance) Hình vẽ sau minh hoạ cho việc tính khoảng cách giữa hai điểm có toạ độ là (1,4) và (4,2)
Trang 38P1(1,4)
D1,2 4
Khoảng cách Ơclit là khoảng cách của một đoạn thẳng nối giữa hai điểm trên một mặt phẳng Trong thực tế, việc đo đạc có thể được thực hiện bằng cách khác
Ví dụ: một phép đo được gọi là đo khoảng cách Manbattan với ý nghĩa như:
"khoảng cách khối phố - city block distance), ở đó áp dụng hệ toạ độ lưới Grid tương tự như các khối phố Khi đó khoảng cách Manbattan được tính theo công thức:
Di,j = (Xi - Xj) - (Yi - Yj) Diện tích của rất nhiều vùng nhỏ tạo nên một polygon thì có thể được tính bằng việc lập một đa giác (trapezoid) từ tất cả các đoàn thẳng đó rồi tính tập hợp cho diện tích của cả polygon
P1
P2
P3
P4 P5
P6 P7
X6 X7
Y1 Y2
Hình 16 Tính diện tích một polygon theo phương pháp đa giác (trapezoid)
Polygon trên tạo nên từ 7 điểm và 7 đoạn thẳng Mỗi đoạn thẳng được xác định bởi hai điểm (điểm nối hoặc điểm giao cắt) Mỗi đoạn thẳng có hai đường
Trang 39thẳng song song với trục Y để xác định các giá trị X cho từng điểm Sẽ có các hình thang (đa giác) được tạo nên bởi các đường thẳng song song đó, đoạn segment và đoạn hình chiếu của chúng trên trục X, khi đó:
2
))(
(
,j i i i i
Y X Y X
7 hình thang sẽ cho diện tích của polygon G (P1 P7)
Tương tự như vậy, nếu ta vẽ tạo thành các tam giác cho toàn bộ các đoạn segment và đưa về hệ toạ độ ban đầu rồi tính tổng diện tích các tam giác thì kết quả cũng là diện tích của cả polygon Hai phương pháp đều có độ chính xác tương
tự như nhau
III.4.2.Đo đạc các tính chất của thuộc tính
Trong cả việc lập bản đồ số và phân tích định hướng của các hiện tượng và đối tượng không gian thì các đối tượng (hoặc đơn vị địa lý) đều phải được định lượng hoá và được xử lý theo các giá trị đo đạc Việc đo các dữ liệu thuộc tính phụ thuộc vào tính chất mà có thể đánh giá được và khả năng tài liệu cho phép Việc
đo đạc các tài liệu thuộc tính được chia ra các mức sau: có tồn tại trên danh nghĩa (niminal), thông thường (ordinal), khoảng cách biệt (interval) và tỉ số (ratio)
Đo đạc các mức độ (levels)
Đo mức độ danh nghĩa (normal): là sự đo đạc về tính chất và chủng loại Ví dụ: tên đất nước sinh ra, màu, nơi sinh, địa bàn có quyền bầu cử (ví dụ ở Mỹ) Tính chất này chỉ mang tính chất đặt tên theo thứ tự mà không có thuộc tính nào
về khoảng cách hay về bản chất Ví dụ: thứ tự đặt tên theo vần ABC nghĩa là A tốt hơn B Cách đặt tên có thể là theo vần hoặc theo thứ tự Trong trường hợp đặt tên theo số thứ tự thì giá trị số đó không thể được dùng để tính toán
Đo mức độ thứ hạng (ordinal): là xác định ý nghĩa trong khái niệm của một trật tự mà ở đó mỗi một chỉ tiêu có giá trị đồng nhất khi so sánh với các chỉ tiêu khác Ví dụ: một người nào đó có thể nằm trong trật tự phân chia về nghề nghiệp hoặc vị trí xã hội như: công nhân, trí thức, nông dân tầng lớp nghèo, trung bình
Trang 40hay giàu (về mức độ thu nhập) Trong trường hợp đó, tầng lớp trung bình phải ở thứ hạng cao hơn nghèo và thấp hơn giàu
Khi áp dụng đo đạc mức độ thứ hạng có thể xác định thuộc tính (code) theo a
b c hoặc theo trật tự số, nhưng mức độ của sự khác biệt giữa các thứ hạng thì không được làm rõ về định lượng Vì vậy, trật tự các số hạng không thể dùng để tính toán về mặt toán học mà chỉ xác định về mối quan hệ Ví dụ : bảng độ cứng của các khoáng vật hay cấp bão, cấp động đất là các minh hoạ tương đối rõ của sự
đo đạc và phân chia về số hạng
Đo khoảng cách biệt (interval)
Việc đo đạc khoảng cách biệt là xác định về trật tự và khoảng cách giữa các chỉ tiêu, khoảng cách giữa các chỉ tiêu là ổn định và bằng nhau về đơn vị Ví dụ điển hình của sự phân chia này là thang nhiệt độ Census (cả nhiệt độ Ken vin) Trong đó, khoảng khác giữa 50o và 49o là bằng với khoảng khác nhau giữa 49o và
48o (Tất nhiên 50o thì không có khái niệm là ấm hơn 25o hai lần)
Một tính chất khác nhau trong việc đo khoảng cách biệt là không có giá trị của điểm khởi đầu Ví dụ: 0oC là xác định nhiệt độ của điểm đóng băng nhưng không có nghĩa là ở 0oC là hết nhiệt
Nói tóm lại, việc đo khoảng cách biệt cho pháp xác định sự khác nhau giữa các hiện tượng nhưng không có nghĩa về sự khác biệt biên độ (ví dụ, bão cấp 2 không có nghĩa là mạnh hơn gấp 2 lần bão cấp 6 hay kim cứng (độ cứng 10) không có nghiã là cứng hơn thạch cao (độ cứng 2) là 5 lần
Đo đạc tỷ số: đo đạc tỉ số thì đầy đủ tính chất của việc đo khoảng cách biệt,
có thêm một thuộc tính là giá trị 0 được xác định bởi đồ thị Ví dụ, khi đo khoảng cách tự nhiên, không cách 0 được hiểu là sẽ không có khoảng cách giữa hai đối tượng Khoảng cách này được xác định rõ và một điểm giá trị 0 cũng có ý nghĩa tỷ
số đã được tính Cụ thể hơn về ý nghĩa đó là khi ta nói 10 km có khoảng cách gấp hai lần 5 km
Một ví dụ khác là khi tính trọng số cho một đơn vị đo khi trọng số bằng 0 nghĩa là không có trọng số Nó có ý nghĩa khi nói 10km3 nặng gấp 2 lần 5m 3 Trong kinh tế, trọng số thể hiện cho sự thu nhập mặc dù đơn vị tiền tệ tính có thể khác nhau Khi đó, định lượng về ý nghĩa hoàn toàn được xác định
• Đo đạc Sự hướng tâm và sự phân tán (central tendency and disperion):
xác định sự hướng tâm hay phân tán là nội dung quan trọng nhất của xử lý thống
kế các hiện tượng, trong thống kê, sự hướng tâm thể hiện một trường (trend) của