Đối tượng đường (Line): về mặt lý thuyết đƣờng là tập hợp vô số các điểm liên
tiếp mô tả các đối tƣợng địa lí dạng tuyến. Trong cấu trúc dữ liệu Vector thƣờng mô tả đƣờng là tập hợp các cung, mỗi cung là tập hợp của các đoạn thẳng nhỏ nối giữa các điểm kề nhau đã đƣợc chọn. Số liệu định vị của các yếu tố đƣờng đƣợc lƣu trong máy tính dƣới dạng tập hợp các cặp tọa độ, trong đó các cặp tọa độ đặc trƣng cho điểm thuộc đƣờng đó. Với một đƣờng thẳng ta có thể lƣu giữ tọa độ của hai điểm đầu và cuối, nhƣng với một đƣờng cong số lƣợng điểm lƣu trữ rất lớn. Muốn giảm bớt số lƣợng ô nhớ khi lƣu trữ đƣờng cong thì đoạn thẳng giữa các điểm lƣu trữ có thể sắp đặt lại theo các dạng của cung cong. Khi đó phải chỉ ra cách tạo dựng đƣờng cùng các đặc điểm đƣợc lƣu trữ, phải chỉ rõ các kiểu đƣờng. Đối với từng kiểu đƣờng có nhiều nét chung nhau cần đặt ra những quy tắc lƣu trữ hợp lí. Đối tƣợng đƣờng có các đặc điểm
- Là một dãy các cặp tọa độ
- Một đƣờng thẳng bắt đầu và kết thúc bởi nút
- Các đƣờng thẳng nối với nhau và cắt nhau tại một nút
- Hình dạng của đƣờng thẳng đƣợc định nghĩa bởi các đỉnh (vertices) - Độ dài chính xác bằng các cặp tọa độ
Đối tượng vùng (Polygon): vùng hay còn gọi là miền có thể coi là tập hợp vơ
số điểm đƣợc giới hạn bởi một đƣờng khép kín. Các đối tƣợng địa lí có diện tích và đóng kín bởi đối tƣợng đƣờng đƣợc gọi là đối tƣợng vùng (polygon). Số liệu định vị của yếu tố vùng đƣợc xác định bởi đƣờng bao của vùng.
Hình 1.12 Dữ liệu vector đƣợc biểu thị dƣới dạng vùng
Nói chung khơng có sự khác biệt giữa việc lƣu trữ số liệu định vị của yếu tố đƣờng và yếu tố vùng, cả hai đều lƣu trữ dƣới dạng tập hợp các điểm của một đƣờng. Nhƣng có thể nhận biết rõ ràng nếu chỉ ra số liệu định vị kèm theo kiểu yếu tố đƣợc hiển thị (điểm, đƣờng, vùng). Đƣờng bao của một vùng là khép kín (tức là điểm đầu và điểm cuối trùng nhau). Ngƣợc lại một đƣờng khép kín khơng phải trong trƣờng hợp nào cũng phản ánh một vùng (ví dụ, đƣờng bình độ khơng là yếu tố vùng). Trong thực tế các yếu tố vùng nằm kề nhau (có bờ ngăn chung), để giảm việc lãng phí bộ nhớ do lƣu trữ các cạnh chung hai lần, ngƣời ta chỉ tiến hành lƣu trữ mỗi cạnh một lần, đồng thời cung cấp cho từng vùng những thông tin về cạnh thuộc nó. Đối tƣợng vùng có đặc điểm sau :
- Vùng đƣợc mô tả bằng tập các đƣờng và điểm nhãn (Label) - Một hoặc nhiều đƣờng định nghĩa đƣờng bao của vùng
- Một điểm nhãn nằm trong vùng để mô tả, xác định cho mỗi một vùng Khi nghiên cứu dữ liệu Vector ta cần quan tâm đến khái niệm Topology.
Topology là khái niệm dùng để xác định các quan hệ không gian giữa các đối
tƣợng địa lí. Topology xác định nhiều mối quan hệ nhƣ kế cận hay trùng khớp của các đối tƣợng địa lí.
Hình 1.13 Quan hệ topology
Các mối quan hệ topology đƣợc xây dựng từ những thành phần đơn giản nhƣ: điểm, đƣờng (tập hợn các điểm đƣợc liên kết lại), vùng (tập hợp các đƣờng đƣơc liên kết). Dữ liệu tọa độ đƣợc loại bỏ, bởi lẽ một đƣờng có thể biểu diễn một đối tƣợng dạng đƣờng, hoặc một phần đƣờng biên của một đối tƣợng vùng, hoặc cả hai. Quan hệ topology có hai mơ hình dữ liệu là dữ liệu Vector Topology và dữ liệu Vector Spaghetti.
Cấu trúc dữ liệu kiểu Vector Topology
Hình 1.14 Yếu tố hình học và topology của dữ liệu vector
Điểm (Point Feature): đƣợc thể hiện nhƣ một Vector có độ dài bằng khơng
và vị trí đƣợc xác định bằng cặp tọa độ (X,Y).
Đƣờng (Line Feature): đơn giản nhất là đƣờng nối giữa hai điểm bất kỳ có
tọa độ (XiYi) và (XjYj). Điểm xuất phát và kết thúc của đƣờng đƣợc gọi là nút. Đƣờng phức tạp hơn là đƣờng cong hoặc đƣờng gấp khúc. Các đƣờng này đƣợc tạo nên bằng các đoạn thẳng nhỏ, các đoạn thẳng nhỏ này đƣợc nối với nhau tại các đỉnh.
Vùng (Polygon Feature): đƣợc thể hiện là một đa giác khép kín bởi các
đƣờng. Vùng là tổ hợp của đƣờng khép kín tạo nên tọa độ của vùng tại ranh giới vùng, chính tọa độ của các điểm nằm trên các đƣờng hình thành nên vùng.
Hình 1.16 Cấu trúc dữ liệu topology (dạng vùng)
Hình 1.17 Cấu trúc dữ liệu topology (nút, đƣờng, vùng)
Cấu trúc dữ liệu Vector Spaghetti
Đơn vị cơ sở là các cặp tọa độ trên một khơng gian địa lí xác định. Do đó mỗi đối tƣợng điểm đƣợc xác định bằng một cặp tọa độ (x,y); mỗi đối tƣợng đƣờng đƣợc biểu diễn bằng một chuỗi những cặp tọa độ (xiyi); mỗi đối tƣợng vùng đƣợc biểu diễn bằng một chuỗi những cặp tọa độ (xiyi) với điểm đầu và cuối trùng nhau.
Hình 1.18 Minh họa dữ liệu Vector Spaghetti
Đặc điểm: Cấu trúc Spaghetti không ghi nhận đặc trƣng kề nhau của hai vùng
kề nhau, nghĩa là tại hai vùng kề nhau sẽ có cạnh chung, cạnh chung của hai vùng kề nhau là hai cạnh độc lập.
1.2.3 Cơ sở dữ liệu thuộc tính
Cơ sở dữ liệu thuộc tính hay cịn gọi là cơ sở dữ liệu phi không gian là cơ sở dữ liệu phản ánh tính chất của các đối tƣợng khác nhau. Ví dụ, các thơng tin về chủ
đất, chất lƣợng đất, thể loại đất … là những dữ liệu thuộc tính. Dữ liệu thuộc tính đƣợc sắp xếp theo hàng và cột, mỗi hàng bao gồm nhiều loại thông tin về một đối tƣợng nào đó nhƣ tên, diện tích …. Mỗi loại thơng tin khác nhau này gọi là một trƣờng, mỗi trƣờng đƣợc sắp xếp tƣơng ứng với một cột. Việc sắp xếp dữ liệu thuộc tính thành bảng gồm các hàng với các cột nhƣ trên rất thuận lợi cho quá trình tìm kiếm, cập nhật, sắp xếp dữ liệu thuộc tính.
Hình 1.19 Cơ sở dữ liệu thuộc tính
Ngồi những đặc điểm nhƣ trên, dữ liệu thuộc tính có thể bao gồm các hình thức trình bày chuẩn của mỗi yếu tố (màu sắc, lực nét, kiểu đƣờng …) nhằm giúp cho q trình sử dụng các kí hiệu và dụng cụ vẽ đƣợc thuận tiện. Điều này đặc biệt có lợi để hiển thị dữ liệu đồ họa có hiệu quả và nhanh chóng. Dữ liệu thuộc tính có thể đƣợc đƣa vào trực tiếp từ các bảng dữ liệu, các tệp văn bản hoặc thu nhận từ các phần mềm khác nhau.
Có 4 loại dữ liệu thuộc tính:
- Đặc tính của đối tƣợng: liên kết chặt chẽ với các thông tin đồ thị, các dữ liệu này đƣợc xử lý theo ngôn ngữ hỏi đáp cấu trúc (SQL – Structured Query Language) và phân tích. Chúng đƣợc liên kết với các hình ảnh đồ thị thơng qua các chỉ số xác định chung, thơng thƣờng gọi là mã địa lí và đƣợc lƣu trữ trong cả hai mảng đồ thị và phi đồ thị. GIS cịn có thể xử lý các thơng tin thuộc tính riêng rẽ và tạo ra các bản đồ chuyên đề trên cơ sở các giá trị thuộc tính.
- Dữ liệu tham khảo địa lí: Mơ tả các sự kiện hoặc các hiện tƣợng xảy ra tại một vị trí nhất định. Khơng giống các thơng tin đặc tính, chúng khơng mơ tả về bản thân các hình ảnh trên bản đồ, thay vào đó chúng mơ tả các danh mục hoặc các hoạt động nhƣ cho phép xây dựng các khu công nghiệp mới, nghiên cứu y tế, báo cáo hiểm họa môi trƣờng, … liên quan đến các vị trí địa lí xác định.
- Chỉ số địa lí: là các chỉ số về tên, địa chỉ, khối, phƣơng hƣớng định vị … liên quan đến các đối tƣợng địa lí, đƣợc lƣu trữ trong hệ thơng tin địa lí để chọn, liên kết và tra cứu dữ liệu trên cơ sở vị trí địa lí mà chúng đã đƣợc mơ tả bằng các chỉ số địa lí xác định. Một chỉ số địa lí có thể bao gồm nhiều bộ xác định cho các thực thể sử dụng từ các cơ quan khác nhau.
- Quan hệ không gian giữa các đối tƣợng: rất quan trọng cho các chức năng xử lý của hệ thông tin địa lý. Các mối quan hệ này có thể đơn giản hay phức tạp nhƣ sự liên kết, khoảng cách tƣơng thích, mối quan hệ topology giữa các đối tƣợng.
1.3 Tổng quan về cấu trúc cơ sở dữ liệu nền địa lý
Cơ sở dữ liệu nền địa lý là một hệ thống những dữ liệu mà các hệ thông tin địa lý trong cùng một địa bàn (vùng quản lý) đều cần đến và có thể sử dụng chung.
Cơ sở dữ liệu nền = ∩ Cơ sở dữ liệu chuyên ngành
Sau khi cơ sở dữ liệu nền địa lý đƣợc xây dựng một cách chuẩn mực, các hệ thống cơ sở dữ liệu khơng gian chun ngành có thể phát triển độc lập mà khơng cần theo trình tự các nhóm chuyên ngành tài nguyên thiên nhiên, môi trƣờng, hạ tầng kỹ thuật, địa chính, kinh tế - xã hội.
Hình 1.20 Cơ sở dữ liệu nền trong mối quan hệ với dữ liệu bản đồ chuyên đề Hầu hết các chuyên gia trên thế giới đều cho rằng dữ liệu nền địa lý gồm 8 lớp Hầu hết các chuyên gia trên thế giới đều cho rằng dữ liệu nền địa lý gồm 8 lớp Cơ sở toán học
Dân cƣ
Địa giới hành chính và ranh giới
Thơng tin đất đai và thơng tin địa chính Cơ sở hạ tầng giao thông
Thủy hệ và các đối tƣợng có liên quan Thực vật
Mạng trắc địa
Hiện nay, đối tƣợng nền địa lý rất đƣợc quan tâm, chúng có thể ảnh hƣởng nhất định đến chất lƣợng cơ sở dữ liệu địa hình, địa chính hoặc một cơ sở dữ liệu đặc trƣng chuyên ngành nào đó. Cơ sở dữ liệu nền địa lý tạo điều kiện để cơ sở dữ liệu khơng gian của các chun ngành có thể đƣợc xây dựng đồng thời. Cơ sở dữ liệu nền địa lý cịn là mơi trƣờng để liên thơng, tích hợp dữ liệu của các chuyên ngành khác nhau.
Cơ sở toán học: Cơ sở toán học của bản đồ bao gồm: phép chiếu, bố cục, tỷ lệ
và cơ sở trắc địa. Đối với bản đồ nhiều mảnh thì cịn bao gồm cả sự phân mảnh và đánh số các mảnh.
Thủy hệ và các đối tượng có liên quan:
- Hệ thống sơng ngịi, kênh mƣơng
- Đối tƣợng liên quan: bãi bùn, cát, bãi san hơ, bãi đá, dịng chảy, trạm thủy văn, đập giữ nƣớc, bờ dốc tự nhiên, kè đá, đê …
- Đƣờng đẳng sâu, đƣờng độ sâu. - Ghi chú các đối tƣợng thủy hệ
Dân cư
- Khu phố, nhà độc lập - Đƣờng dây điện, tƣờng vây
- Các đối tƣợng kinh tế - văn hóa – xã hội (nhà máy, bệnh viên, trƣờng học, đài tƣởng niệm …)
- Ranh giới khu dân cƣ
- Ghi chú các điểm dân cƣ, tên thuyết minh …
Đường giao thơng và các đối tượng có liên quan
- Hệ thống đƣờng giao thông các cấp, đƣờng sắt
- Các đối tƣợng liên quan: cầu, cống, phà, đò, sân bay, nhà ga, ... - Các loại ghi chú: tên đƣờng, tính chất cầu ….
Dáng đất và chất đất
- Đƣờng bình độ (đƣờng bình độ cái, cơ bản, nửa khoảng, phụ, vẽ nháp) - Điểm độ cao (độ cao khống chế, độ cao thƣờng, ...)
- Các loại khe rãnh, sƣờn dốc, vách đá sụt lở, bãi đá, đá độc lập, bãi cát khơ, hang động, gị, hố, địa hình bậc thang …
- Các loại ghi chú: ghi chú điểm độ cao, ghi chú đƣờng bình độ …
Địa giới hành chính và ranh giới: Địa giới hành chính các cấp (xác định,
không xác định); mốc và số hiệu mốc biên giới; ranh giới khu cấm; ghi chú tên hành chính ranh giới …
Thực vật
- Các loại thực vật: Rừng tự nhiên, rừng trồng, cây công nghiệp, cây ăn quả, cây bụi, cỏ, cói, lau, sậy, hoa màu …
- Ranh giới thực vật: Ghi chú tính chất cây …
Trên dữ liệu bản đồ số, các nội dung đƣợc chia thành 7 nhóm lớp: Cơ sở tốn học, Thủy hệ, Dân cƣ, Giao thơng, Địa hình, Ranh giới, Thực vật. Các yếu tố thuộc một nhóm lớp đƣợc thể hiện trong một tệp tin riêng. Trong mỗi tệp tin, yếu tố nội dung đƣợc chia thành các lớp theo quy định.
CHƢƠNG 2
THIẾT KẾ CƠ SỞ DỮ LIỆU THÔNG TIN ĐỊA LÝ 2.1 Tổ chức cơ sở dữ liệu trong ArcGis
2.1.1 Geodatabase – Cơ sở dữ liệu địa lý
Trong những năm gần đây, hai xu hƣớng nổi bật đã tác động sâu sắc và làm thay đổi việc lƣu trữ và quản lý dữ liệu GIS. Đó là dung lƣợng lƣu trữ dữ liệu mở rộng nhanh chóng và đang tiếp tục tăng lên một cách đáng kể. Thứ hai là việc ứng dụng các cơ sở dữ liệu GIS phân tán ngày một tăng. Cơ sở dữ liệu phân tán là nguồn dữ liệu cho những ngƣời sử dụng có thể truy cập tới các vị trí lƣu trữ thơng qua mạng. Nguyên nhân chính cho việc nghiên cứu, ra đời cách lƣu trữ và quản lý dữ liệu mới là nhằm đem lại cho ngƣời sử dụng một hệ thống quản lý dữ liệu hiệu quả nhất. Chính vì vậy, phần mềm ArcGIS đã thiết kế mơ hình cơ sở dữ liệu GIS Geodatabase nhằm cung cấp các công cụ dùng để triển khai xây dựng và quản lý một hệ thông tin địa lý thông minh.
2.1.1.1 Khái niệm Geodatabase
ESRI sử dụng khái niệm Geodatabase – cơ sở dữ liệu địa lý – là nhân của mơ hình thơng tin địa lý và sử dụng để tổ chức dữ liệu GIS trong các lớp chuyên đề và biểu diễn không gian.
Geodatabase là một cơ sở dữ liệu chứa dữ liệu thuộc tính, dữ liệu khơng gian và quan hệ tồn tại giữa chúng. Có thể nói Geodatabase cịn là một cơ sở dữ liệu địa lý hƣớng đối tƣợng và đƣợc quản lý thông qua một chuẩn Hệ quản trị cơ sở dữ liệu. Vì vây, các thực thi trên đối tƣợng trong Geodatabase chính là các luật chuẩn hóa, liên kết và quan hệ topology.
Về mặt chức năng, Geodatabase là một mơ hình dữ liệu biểu diễn thơng tin địa lý sử dụng công nghệ cơ sở dữ liệu quan hệ chuẩn. Geodatabase hỗ trợ việc lƣu trữ và quản lý thông tin địa lý trong các bảng hệ thống cơ sở dữ liệu quan hệ nhờ kết nối ArcSDE.
Hình 2.1 Geodatabase trong ArcGIS
Có hai mơ hình Geodatabase: Mơ hình Geodatabase một ngƣời dùng (Personal Geodatabase) và mơ hình Geodatabase nhiều ngƣời dùng (Enterprise Geodatabase).
- Personal Geodatabase: Mơ hình sử dụng hệ quản trị cơ sở dữ liệu Access để lƣu trữ dữ liệu khơng gian và thuộc tính.
- Enterprise Geodatabase: Mơ hình sử dụng hệ quản trị cơ sở dữ liệu nhiều ngƣời dùng nhƣ Oracle, SQL Server, DB2, Postgres... để lƣu trữ dữ liệu.
Hình 2.2 Mơ hình cơ sở dữ liệu khơng gian của ESRI
2.1.1.2 Cấu trúc Geodatabase
Một Geodatabase là một tập lƣu trữ dữ liệu địa lý. Tất cả các thành phần trong Geodatabase đƣợc quản lý trong các bảng DBMS chuẩn và sử dụng kiểu dữ liệu SQL chuẩn. Dƣới đây là một số thành phần có cấu trúc trong một Geodatabase sử dụng để phát triển mơ hình dữ liệu địa lý:
Thành phần trong
Geodatabase Biểu tƣợng Mô tả
Tập dữ liệu đối tƣợng địa lý
(Feature Dataset)
Là một tập chứa các feature class, các topology và các đối tƣợng mạng liên kết có cùng tham chiếu không gian
Lớp đối tƣợng (Feature Class)
Là một bảng chứa một trƣờng “shape” xác định dạng hình học điểm, đƣờng, vùng cho các đối tƣợng địa lý. Mỗi hàng là một đối tƣợng địa lý
Bảng (Table) Là một tập các hàng với các trƣờng giống nhau.
Các lớp đối tƣợng địa lý là các bảng đƣợc xác định với trƣờng “shape”
Lớp quan hệ (Relationship class)
Là lớp liên kết đối tƣợng trọng một lớp đối tƣợng địa lý với đối tƣợng trong một lớp đối tƣợng địa lý khác. Thông thƣờng, các lớp quan hệ có các trƣờng do ngƣời sử dụng định nghĩa
Topology (Topology) Bao gồm các luật thống nhất về hình học giữa
các đối tƣợng địa lý Mạng hình học
(Geometric network)
Bao gồm các luật cho phép quan rlys kết nối giữa các đối tƣợng địa lý