Chương 2 : Hệ thông tin địa lý và cơ sở dữ liệu GIS3D
2.2. Cơ sở dữ liệu GIS3D
2.2.1. Khái niệm CSDL
Cơ sở dữ liệu (CSDL) là tồn bộ những thơng tin cần thiết về đối tượng được lưu giữ dưới dạng số. CSDL có thể là không gian hoặc phi không gian. Hệ thống quản lý CSDL (Database management System - DBMS) là tập hợp một số chức năng của phần mềm để lưu giữ, bổ sung và thể hiện dữ liệu . Các hệ thống quản lý cơ sở dữ liệu phi không gian hoặc khơng gian thường tách biệt nhau. Cũng có một số phần mềm tổ chức kết hợp để quản lý cả hai dạng dữ liệu hoặc cung cấp khả năng liên kết với các phần mềm CSDL khác. Chương trình này sẽ tập trung giới thiệu các cấu trúc dữ liệu chính là cấu trúc phân nhánh, chia nhỏ và cấu trúc mạng. Ngoài ra, các dữ liệu thuộc tính phi khơng gian trong mối liên hệ với các thuộc tính khơng gian cũng được đề cập đến. Cấu trúc dữ liệu không gian là sự tổ chức tư liệu không gian dưới một khn dạng phù hợp với máy tính. Cấu trúc của dữ liệu phải được tổ chức để có sự liên hệ giữa các mơ hình dữ liệu và các khuôn dạng (format) dữ liệu. Thực tế, giữa khái niệm mơ hình và cấu trúc dữ liệu ít có sự phân biệt. Tuy nhiên khái niệm mơ hình được sử dụng ở phạm vi nguyên lý từ khái quát đến cụ thể, còn cấu trúc là khái niệm mang tính chất kỹ thuật và minh hoạ một cách hệ thống về bản chất và sự liên hệ giữa các thành phần của CSDL.
2.2.2. Ưu điểm của CSDL
Ưu điểm của CSDL là tối thiểu hóa dư thừa dữ liệu, đảm bảo tính nhất qn và tồn vẹn dữ liệu, truy xuất dữ liệu theo nhiều cách khác nhau, nâng cao chia sẻ dữ liệu, có tính bảo mật và an toàn dữ liệu cao.
Trong GIS khái niệm CSDL có thể hiểu là một tập hợp các dữ liệu ở dạng vector, raster, bảng số liệu, văn bản, hình ảnh, âm thanh, đoạn phim được lưu giữ theo khn dạng nhất định, có cấu trúc chuẩn sao cho các phần mềm máy tính cỏ thể đọc, xử lý phân tích các bài tốn chun đề có mức độ phức tạp khác nhau.
2.2.3. Mơ hình và cấu trúc dữ liệu
2.2.3.1. Mơ hình dữ liệu
- Thành phần khơng gian - Thành phần phi khơng gian - Mã hóa
- Quan hệ Topology
Trong đó, mã khóa là mã số duy nhất cho thực thể, đặc trưng duy nhất cho thực thể. để phân biệt thực thể này với thực thể khác.
Định vị, xác định vị trí thực tể của thực thể trên thực tế, thông thường người ta hay dùng các hệ tọa độ để xác định tọa độ thực thể. Có nhiều hệ tọa độ khác nhau.
Thành phần phi không gian là thành phần chửa số liệu về thuộc tính của thực thể. các thuộc tính này cỏ thể là định lượng hoặc định tính, có các kiểu dữ liệu là ghi danh, chi sổ, khoảng, tỉ lệ.
Dữ liệu không gian được xây dựng trên cơ sở toán học của bản đồ và các lớp thông tin địa kỹ thuật, gồm các loại đối tượng khác nhau của các nhóm thơng tin. Các lớp thơng tin được gắn chỉ số ID cùng tên và hệ thống mã khóa chính, phụ và phương thức truy nhập thông tin, phương thức thiết lập các trường, các minh họa và dẫn giải cho từng loại thông tin phục vụ cho người sử dụng.
2.2.3.2. Cấu trúc hệ thống dữ liệu
Gồm Hồ sơ dữ liệu và Cơ sở dữ liệu
Hồ sơ dữ liệu (Metadata) được xem là ―Dữ liệu về dữ liệu‖ nhằm lưu giữ những thông tin về bản thân dữ liệu. Hồ sơ dữ liệu là một trong những thông tin quan trọng trong ứng dụng GIS. Việc chuyển giao cơ sở dữ liệu GIS sẽ được thực hiện dễ dàng trên cơ sở dữ liệu được gắn liền với hồ sơ dữ liệu. Hiện nay, với sự phát triển mạnh của khoa học kỹ thuật thi việc ứng dụng GIS trong ngành mình là rất cần thiết, nhu cầu trao đổi dữ liệu giữa các ngành vói nhau và trong nội bộ từng ngành là rất lớn, do đó việc xây dựng hồ sơ dữ liệu đã được đặt ra là nhu cầu thiết yếu. Việc xây dựng hồ sơ dữ liệu cần được tiến hành theo tiêu chuẩn nhất định, trong đó lưu ý quy định rõ các thơng tin cần thể hiện và các cách thể hiện các thông
Cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính là cốt lối của GIS. Đe cho dữ liệu GIS được ứng dụng hiệu quả cần phải được tổ chức tốt và có chất lượng tốt. Việc đánh giá chất lượng của dữ liệu GIS được đánh giá trên cơ sở các chuẩn dữ liệu. Việc tuân thủ các chuẩn dữ liệu của một cơ sở dữ liệu GIS là nhằm để đồng bộ các dữ liệu không gian được sừ dụng trong các ứng dụng.
Cơ sở dữ liệu có cấu trúc rất phức tạp, gồm cả các thông tin về vị trí, khả năng liên kết địa hình và thuộc tính các đối tượng. Để thuận tiện trong quá trình truy nhập dữ liệu thì dữ liệu phải được tổ chức theo một dạng cấu trúc nào đó (dạng cấu
trửc phần cẨp. cáu trúc màng, cấu trúc quan hệ). Cho đù dữ liộu được tổ chức theo dọng cầu tnic nào thì khn dạng cổc dữ liệu đều ở dạng vector hay raster và phải tuân thủ nghiêm ngặt các tiêu chuẩn dữ liệu ngay từ khâu đầu khi làm dữ liệu là khâu thiét kẻ và nhập dữ liệu. Việc tuân thủ tốt cổc tiêu chuẩn dữ liệu có ý nghĩa rất quan trọng, bảo đảm độ chỉnh xác dữ liệu sổ và tạo sự thống nhất của dữ liệu, cho phép giải quyểt các bài tốn khơng gian (chồng xếp, phân tích, lựa chọn, đưa ra quyết định...).
2.2.4. Chuẩn thông tin địa lý cơ sở quốc gia
Dừ liệu GIS ngồi việc được tổ chức tốt cịn cần có chất lượng tốt. Chất lượng của dừ liệu GIS được đánh giá bằng các chuẩn dữ liệu.
Chuẩn dữ liệu được xem xét ở những khỉa cạnh sau: - Chuẩn về mơ hình (mơ hình raster hay vector)
- Chuẩn về khơng gian (hệ thống tọa độ; quan hệ không gian v.v...) - Chuẩn về thuộc tính (các thơng tin thuộc tính)
Ở mỗi khỉa cạnh trên, chuẩn của dữ liệu được qui định đầy đủ và chặt chẽ.
2.2.4.1. Yêu cầu chuẩn về mơ hình
Với hai mơ hình dữ liệu GIS chính là raster và vector, cần quan tâm đến các yểu tổ sau trong quá trinh xây dựng chuẩn:
Mơ hình dữ liệu raster sử dụng các điểm ảnh để miêu tả đối tượng. Một đối tượng là một hoặc nhiều điểm ảnh. Các điểm ảnh phân biệt nhau bởi tọa độ (tại tâm điểm ảnh). Các đối tượng phân biệt nhau bởi giá trị (có thể đã được mã hóa) của các điểm ảnh.
- Chuẩn về tọa độ: dữ liệu raster cũng cần có tọa độ như bất kỳ dữ liệu địa lý nào khác. Tọa độ của dữ liệu raster cũng tuân thủ các qui tắc về lưới chiếu.
- Chuẩn về độ chi tiết thơng tin - Kích thước pixel (điểm ảnh): cho phép miêu tả chi tiết đối tượng. Kích thước pixel càng nhỏ thì đổi tượng được miêu tả càng chi tiết.
- Chuẩn về thuộc tính - giá trị pixel: được sử dụng để miêu tả về đối tượng. Giá trị pixel có thể là số hoặc một chuỗi ký tự (tùy thuộc vào khả năng của phần mềm xử lý). Giá trị này trực tiếp miêu tả đổi tượng hay thơng qua một hệ thổng mã hóa.
*/Với mơ hình dữ liệu vector:
Dữ liệu vector sử dụng điểm, đường và polygon (vùng) để miêu tả hình dáng các đổi tượng. Thông tin về đối tượng được ghi trong một bảng thuộc tính đi kèm. Bảng thuộc tính này cỏ thể có nhiều trường (cột), mỗi trường ghi một loại thông tin khác nhau ở các dạng khác nhau (ký tự, sổ nguyên, thập phân, sổ thực). Dữ liệu vector cần tuân theo cảc tiêu chuẩn sau đây:
- Chuẩn về tọa độ: dữ liệu vector cần có tọa độ được chiếu theo một lưới chiéu nào đỏ như hệ tọa độ địa lỷ.
- Chuẩn về quan hệ không gian: các đối tượng điểm, đường, vùng được lưu trừ trong dừ liệu vector cần tuân thù theo quan hệ khơng gian. Theo đó, hai đường được nổi với nhau bởi một nút, các polygon phải được đảm bảo khép kín ở các nút nơi các đường ranh giới của chúng nối với nhau; các polygon liền kề nhau chỉ cỏ chung một đường biên duy nhất.
- Chuẩn về thuộc tính: thuộc tính đối tượng trong một trường phải đồng nhất về kiểu (ký tự, số nguyên v.v...).
2.2.4.2. Yêu cầu chuẩn về không gian
Chuẩn về không gian được bao gồm chuẩn về cách thể hiện đối tượng trong không gian và chuẩn về quan hệ khơng gian giữa các đối tượng đó. Cách thức thể hiện đối tượng được xây dựng trong từng dự án cụ thể, phụ thuộc chính vào tỷ lệ bản đồ (với dữ liệu số, là tỷ lệ gốc của thông tin). Chuẩn về quan hệ không gian (topology) cần được tuân thủ nghiêm ngặt. Đây là những chuẩn công nghiệp và đã được xây dựng ừong các phần mềm GIS thương mại (như ArcGIS). Sử dụng các phần mềm này để tạo dữ liệu và kiểm tra chuẩn về quan hệ không gian là cách tốt nhất để tuân thủ chuẩn.
Trên bản đồ hàng hải người ta thể hiện lưới tọa độ địa lý (lưới kinh, vĩ tuyến) chứ không thể hiện lưới tọa độ ô vuông (lưới kilômet).