6. Bố cục đề tài, luận văn
3.2. Giải pháp kỹ thuật, công nghệ quản lý tích hợp và đa chiều của hai cơ sở dữ
dữ liệu LIS và GIS
3.2.1. Giải pháp chuyển đổi các hệ thống bản đồ về hệ thống bản đồ nền địa hình
Theo mô hình thiết kế cơ sở dữ liệu tích hợp thì cơ sở dữ liệu địa hình thủy văn cơ bản vùng đồng bằng sông Cửu Long (ĐH-TVCB ĐBSCL) là nền, sau đó được tích hợp
27
với các cơ sở dữ liệu chuyên đề như đất đai, môi trường. Vì vậy giải pháp chuyển đổi các hệ thống bản đồ để tích hợp trong một hệ thống thống nhất được xem xét như sau: + Chuyển đổi các lớp thông tin bản đồ ở các hệ thống tọa độ khác nhau về một hệ
thống chung, chuyển hệ thống bản đồ chuyên đề đang ở các hệ tọa độ khác nhau về hệ tọa độ của cơ sở dữ liệu nền. Cụ thể ở đây là chuyển đổi các lớp thông tin cơ sở dữ liệu đất đai về hệ tọa độ VN-2000 quốc gia của cơ sở dữ liệu ĐH-TVCB ĐBSCL. Công cụ để chuyển đổi tọa độ có thể sử dụng các công cụ phần mềm hiện có (phần mềm của Cục Công nghệ Thông tin - CIREN, phần mềm của Cục Đo đạc và Bản đồ Việt Nam), hoặc sử dụng các công cụ nắn bản đồ theo các điểm địa vật (MGE của Intergraph).
+ Thay đổi hệ tọa độ của các lớp thông tin chuyên đề về hệ tọa độ của cơ sở dữ liệu nền khi hoạt động trong một môi trường phần mềm, bản chất hệ tọa độ trong cơ sở dữ liệu được lưu trữ không thay đổi. Cách này trong GIS thường được gọi là On the fly projection. Phần lớn các phần mềm GIS hiện tại đều cho phép thực hiện chức năng này như MapInfo, ArcGIS.
Đánh giá ưu, nhược điểm của từng phương pháp như sau:
+ Chuyển đổi về một hệ thống tọa độ chung: Đảm bảo tính đồng nhất của toàn bộ cơ sở dữ liệu tích hợp. Dữ liệu khi chuyển đổi có thể được xử lý (nắn chỉnh lại) để đảm bảo tính chính xác hơn về mặt vị trí giữa các lớp thông tin. Việc sử dụng và khai thác cơ sở dữ liệu đơn giản, dễ dàng. Nhược điểm là các lớp thông tin chuyên đề đã chuyển đổi tọa độ sau đó nếu được xử lý, cập nhật sẽ phải thực hiện trên hệ thống tọa độ mới, ảnh hưởng rất nhiều đến tích chất chuyên ngành của dữ liệu, và dữ liệu này sẽ không được coi là dữ liệu gốc mà chỉ là dữ liệu dẫn xuất.
+ Thay đổi hệ tọa độ On the fly Projection: Ưu điểm của giải pháp này là sử dụng dễ dàng, cho phép tích hợp rất nhanh chóng dữ liệu từ nhiều nguồn khác nhau không phải xử lý việc nắn, chuyển, bảo toàn được dữ liệu gốc. Nhược điểm của giải pháp này là độ chính xác vị trí không cao, ảnh hưởng đến việc phân tích xử lý dữ liệu. Các chức năng phân tích xử lý không gian cũng bị hạn chế.
28
Đề tài, luận văn sử dụng phương án 2 trong công tác xây dựng cơ sở dữ liệu tích hợp, mô hình của cơ sở dữ liệu như sau:
Hình 3.1. Tích hợp các thành phần của cơ sở dữ liệu
Cơ sở dữ liệu tích hợp gồm 3 cơ sở dữ liệu thành phần:
- Cơ sở dữ liệu địa hình thủy văn cơ bản: Đây là cơ sở dữ liệu có tính nền làm cơ sở (khung - framework) để trình bày các lớp thông tin bản đồ khác khau.
- Cơ sở dữ liệu đất đai: Gồm bản đồ địa chính, hồ sơ địa chính, các bản đồ chuyên đề khác về đất đai. Các lớp thông tin bản đồ sẽ được lưu trữ trong cơ sở dữ liệu đất đai theo đúng hệ quy chiếu của hệ thống bản đồ đã được quy định (theo hệ tọa độ
29
địa phương) và quản lý bằng các phần mềm hệ thống thông tin đất đai. Tuy nhiên, để có thể tích hợp với cơ sở dữ liệu địa hình thủy văn nền, lớp bản đồ này sẽ được hiển thị trên nền các lớp thông tin của cơ sở dữ liệu địa hình thủy văn bằng phương pháp thay đổi hệ tọa độ “On the fly Projection” thông qua các phần mềm ArcGIS.
- Cơ sở dữ liệu tài nguyên môi trường: Các lớp thông tin bản đồ Tài nguyên và Môi trường sẽ được xây dựng trên nền của cơ sở dữ liệu địa hình thủy văn (theo hệ tọa độ của cơ sở dữ liệu địa hình thủy văn) và quản lý bằng các phân hệ phần mềm Tài nguyên và Môi trường. Các tài liệu về Tài nguyên và Môi trường trước đây sẽ được chuyển đổi về tọa độ của cơ sở dữ liệu địa hình thủy văn bằng phương pháp nắn tọa độ.
3.2.2. Giải pháp tích hợp các lớp thông tin khác nhau thông qua các dữ liệu thuộc tính thuộc tính
Mối liên kết giữa các lớp thông tin không gian ngoài vị trí không gian, còn có các mối liên kết dựa trên những thông tin thuộc tính mô tả tính chất, sự ràng buộc về quản lý: ví dụ như về mặt quản lý lãnh thổ theo địa giới hành chính, địa danh, tên địa vật…
Đề tài, luận văn xem xét một số khả năng liên kết qua các thông tin thuộc tính có thể được sử dụng để kết nối giữa cơ sở dữ liệu đất đai và cơ sở dữ liệu ĐH-TVCB ĐBSCL như sau:
* Qua mã địa giới hành chính: xã, huyện, tỉnh.
Với các thông tin của cơ sở dữ liệu địa chính, bản đồ hiện trạng sử dụng đất, các yếu tố cơ bản đều được quản lý theo đơn vị hành chính. Vì vậy giải pháp sử dụng mã của đơn vị hành chính để liên kết giữa cơ sở dữ liệu ĐH-TVCB ĐBSCL và cơ sở dữ liệu đất đai là hợp lý. Tuy nhiên, mối liên kết này không có tính cân bằng giữa hai chiều. Các đối tượng của cơ sở dữ liệu ĐH-TVCB ĐBSCL, phần lớn được quản lý theo vị trí địa lý, không giới hạn bởi địa giới hành chính nên khó khăn hơn trong việc liên kết ngược lại.
* Qua địa danh
Địa danh là một yếu tố có vừa thể hiện giữa quản lý hành chính và vị trí địa lý. Thông thường, địa danh không được thể hiện tường minh trong cơ sở dữ liệu đất đai.
30
Trong hệ thống bản đồ địa chính, địa danh có thể thể hiện dưới dạng thông tin xứ đồng (hoặc địa chỉ) của thửa đất, còn hồ sơ địa chính thể hiện địa chỉ của chủ sử dụng đất.
Sự liên kết này khá lỏng lẻo và không nhất quán, do địa danh có thể trùng nhau. Tuy nhiên nếu kết hợp giữa địa danh và mã đơn vị hành chính xã, mối liên kết này sẽ đem lại chính xác cao hơn.
* Qua tên địa vật:
Sự liên kết giữa cơ sở dữ liệu ĐH-TVCB ĐBSCL và cơ sở dữ liệu đất đai có thể sử dụng qua tên các đối tượng địa lý. Tuy nhiên để có thể liên kết được, đòi hỏi các đối tượng địa lý trong các cơ sở dữ liệu khác nhau đều cùng một mã hoặc tên. Các đối tượng địa lý có thể được sử dụng tạo liên kết thông dụng nhất là tên các đối tượng địa lý thuộc giao thông, thủy văn.
* Quản lý thông tin liên kết và thông tin mô tả (metadata)
Giải pháp công nghệ sử dụng phần mềm ArcGIS Catalog hoặc phần mềm mã nguồn mở GeoNetwork Opensource.
3.2.3. Giải pháp tích hợp các thông tin theo thời gian
Trong GIS, mô hình cơ sở dữ liệu không gian (spatial model) theo thời gian (time series) đã được nghiên cứu. Cụ thể trong với ArcGIS, một mô hình dữ liệu không gian quản lý các dữ liệu không gian theo chuỗi thời gian đã được xây dựng để mô tả hệ thống thu thập dữ liệu theo thời gian là mô hình ArcHydro. ArcHydro là mô hình cụ thể mô tả quản lý các thông tin về lưu vực, hệ thống mạng sông, các trạm đo đạc thu thập số liệu về mực nước… phục vụ công tác giải các bài toán về lũ lụt. Mô hình này cũng đã được ứng dụng thử nghiệm trong dự án “Xây dựng hệ thống thông tin địa hình - thủy văn cơ bản phục vụ phòng chống lũ lụt và phát triển kinh tế xã hội vùng đồng bằng sông Cửu Long” để tích hợp hệ thống thông tin địa lý (GIS) và hệ thống thông tin thủy văn (HIS).
Ý tưởng mô hình được xây dựng một cơ sở dữ liệu không gian có thêm thành phần chuỗi thời gian là sử dụng để mô tả thông tin trong một hình khối 3 chiều với các trục: biến số, không gian, và thời gian. Trục X mô tả những gì đã được ghi lại một đối
31
tượng cụ thể nào đó dưới dạng 1 biến số, trục không gian mô tả nơi mà nó đã được ghi lại và trục thời gian mô tả khi nó được ghi lại. Một điểm trong khối lập phương biến số - không gian - thời gian đại diện cho một giá trị đo lường của một đối tượng tại một thời điểm nào đó và mặt phẳng cắt qua khối cung cấp cho một tập các phép đo theo chuỗi thời gian của một đối tượng. Sử dụng mô hình khái niệm này, người ta có thể trích xuất một loạt các bộ dữ liệu theo chuỗi thời gian bằng cách chỉ chọn một phần của khối lập phương biến số - không gian - thời gian.
Hình 3.2. Mô hình chuỗi thời gian
Mô hình khái niệm của chuỗi thời gian trong GIS cung cấp một mô hình chung mà có thể được áp dụng để giải quyết nhiều vấn đề khi tích hợp không gian và thời gian trong một hệ thống GIS. Ví dụ như dữ liệu chuỗi thời gian được phổ biến trong hệ thống thông tin thủy văn (HIS) là thông tin thủy văn trong cơ sở dữ liệu.
Trong một cơ sở dữ liệu GIS, có 3 dạng dữ liệu có thể được thu thập theo thời gian như sau: TSDateTime FeatureID TSType TSValue TSType Table Feature Class (point, line, area)
32
Dữ liệu thuộc tính
Dữ liệu đối tượng địa lý dạng vector
Dữ liệu ảnh hoặc đối tượng địa lý dạng raster
Time Series Feature Series
Raster Series Attribute Series Time V ar ia b le y t x
Hình 3.3. Mô hình tích hợp thông tin theo chuỗi thời gian
Để mô tả các dữ liệu theo chuỗi thời gian, trong mô hình sẽ bổ xung thêm một biến số (variable type) và có kiểu là chuỗi thời gian (time series type). Biến số mô tả những gì một tập hợp các phép đo theo thời gian và kiểu chuỗi thời gian mô tả cách thông tin này được lưu trữ trong cơ sở dữ liệu không gian. Theo mô hình phân cấp (hierarchical model), loại biến ở trên được mô tả là kiểu chuỗi thời gian và cho phép biến có thể lưu giữ bất kỳ các loại chuỗi thời gian. Ví dụ, ta có thể lưu trữ biến "lượng mưa trung bình hàng tháng" như là một dạng kiểu số liệu chuỗi thời gian, là được gán cho các đối tượng kiểu thuộc tính, vector hoặc raster. Sau đây là thiết kế cụ thể cho việc đối tượng địa lý được gán thông tin về chuỗi thời gian.
Khái niệm “Kiểu chuỗi thời gian - time series type” : Là mô tả cho một dãy các bản ghi được ghi nhận các giá trị theo thời gian và được đánh theo 3 trường là giá trị, chỉ số và thời gian (TSValue, TSTypeID, TSDateTime). Kiểu chuỗi thời gian sẽ không
33
quan hệ trực tiếp với các thông tin không gian, nhưng nó có thể liên kết với các đối tượng không gian qua 1 bảng trung gian. Một tập các bản ghi về chuỗi không gian có thể được liên kết đến một hoặc nhiều các đối tượng không gian trong quan hệ một - nhiều giữa các bản ghi chuỗi thời gian và các đối tượng không gian. Bảng trung gian là cần thiết để loại trừ quan hệ nhiều - nhiều giữa thông tin chuỗi thời gian và các đối tượng không gian (theo lý thuyết cơ sở dữ liệu quan hệ).
* Bảng thuộc tính theo chuỗi thời gian
Đây là bảng (table) để liên kết giữa các thông tin theo chuỗi thời gian với các đối tượng địa lý (Theo chỉ số đối tượng - FeatureID), bao gồm các bản ghi dữ liệu theo chuỗi thời gian được lập chỉ mục (index) theo các trường của biến (tức là TSValue và TSTypeID), thời gian (TSDateTime) và không gian (FeatureID). Bảng được thiết kế để lưu trữ các đối tượng không gian tĩnh với các dữ liệu thuộc tính theo thời gian. Thiết kế này có thể sử dụng để lưu trữ các điểm quan sát tại các địa điểm cố định như dòng chảy, chất lượng nước .v.v. tại các đối tượng địa lý như trạm đo. Một đối tượng không gian có thể liên quan đến một hoặc nhiều bản ghi chuỗi thời gian, nhưng một giá trị theo thời gian chỉ được liên quan đến một đối tượng. Như vậy, đối tượng không gian và chuỗi thời gian có liên hệ trong một mối quan hệ một-nhiều (1- n).
Hình 3.4. Bảng thuộc tính theo chuỗi thời gian
Feature Class (HydroID)
Attribute Series Table (FeatureID)
34
* Đối tượng raster theo chuỗi thời gian
Đối tượng kiểu raster chuỗi thời gian (Raster series time series type) phản ánh 1 tập các đối tượng raster được đánh chỉ số theo biến số (TSTypeID) và thời gian (TSDateTime). Các đối tượng raster được thu thập và lưu trữ trong thư mục ảnh (Raster Catalog) và có 2 trường chỉ số là TSTypeID và TSDateTime. Sử dụng đối tượng raster theo chuỗi thời gian, các đối tượng không gian được thu thập liên tục theo các vòng lặp về thời gian. Ví dụ như bản đồ về lượng mưa trung bình, ảnh vệ tinh có thể được lưu trữ là một tập các file raster và chúng được lưu trữ trong một thư mục raster (Raster Catalog).
Hình 3.5. Đối tượng raster theo chuỗi thời gian
* Đối tượng vector theo chuỗi thời gian
Đối tượng kiểu vector chuỗi thời gian (Feature Series time series type) phản ánh một tập các đối tượng không gian dưới dạng vector (điểm, đường, vùng) có sự thay đổi về các thông tin không gian (hình dạng, kích thước ...) theo thời gian, được tổ chức lập chỉ mục theo biến số (TSValue and TSTypeID), thời gian (TSDateTime) và vị trí phụ thuộc thời gian (shape). Các đối tượng raster được thu thập và lưu trữ trong thư mục
35
ảnh (Raster Catalog) và có 2 trường chỉ số là TSTypeID và TSDateTime. Các đối tượng vector theo chuỗi thời gian được thiết kế để lưu trữ các đối tượng không gian có sự thay đổi về hình dạng hoặc vị trí theo thời gian. Ví dụ các đối tượng như vậy là vùng ngập lũ theo từng giờ, phản ảnh bằng một chuỗi các đối tượng vector dạng vùng. Kiểu
“Vị trí phụ thuộc thời gian (shape)” mô tả về vị trí và giới hạn của các đối tượng không gian bị biến đổi theo thời gian. Các đối tượng thuộc ”Đối tượng vector theo chuỗi thời gian” là duy nhất vì kiểu chuỗi thời gian đã chứa 1 đối tượng dạng vùng.
3.3. Phần mềm ứng dụng
3.3.1. Phần mềm TichHop_DBSCL quản lý tích hợp cơ sở dữ liệu đất đai và cơ
sở dữ liệu ĐH-TVCB
3.3.1.1. Giải pháp công nghệ
Giải pháp xây dựng cơ sở dữ liệu và vận hành phần mềm TichHop_DBSCL như sau:
- Chuyển đổi các lớp thông tin bản đồ ở các hệ thống tọa độ khác nhau về một hệ thống chung, chuyển hệ thống bản đồ chuyên đề đang ở các hệ tọa độ khác nhau về hệ tọa độ của cơ sở dữ liệu nền.
- Tích hợp các lớp thông tin khác nhau thông qua các dữ liệu thuộc tính: mã đơn vị hành chính, hệ thống đường giao thông, thủy văn …
- Xác định và cập nhật các nội dung thông tin cần thiết để liên kết, tích hợp giữa các lớp thông tin của hai cơ sở dữ liệu, các thông tin mô tả (Metadata) cần có.
- Công cụ quản lý thông tin liên kết và thông tin mô tả (Metadata) gắn với nội dung của cơ sở dữ liệu: Chuẩn hóa, tạo và kiểm tra tính đúng đắn của thông tin.
- Công cụ tìm kiếm, khám phá dữ liệu (Geospatial data discovery) dựa trên thông tin liên kết và thông tin mô tả (metadata).
3.3.1.2. Chức năng quản lý tích hợp cơ sở dữ liệu trong một hệ thống thống nhất theo mô hình cơ sở dữ liệu không gian (GeoDatabase) nhất theo mô hình cơ sở dữ liệu không gian (GeoDatabase)
Cơ sở dữ liệu tích hợp được quản lý bằng mô đun ArcCatalog của phần mềm ArcGIS với hệ quản trị cơ sở dữ liệu SQL Server 2005.
36
Các lớp thông tin của từng cơ sở dữ liệu thành phần được lưu trữ và quản lý bằng các feature. Các cơ sở dữ liệu thành phần có thể được lưu trữ dưới các hệ tọa độ