Cơ sở dữ liệu địa lý là sự tích hợp giữa cơ sở dữ liệu không gian địa lý và cơ sở dữ liệu thuộc tính. Quy trình thiết kế một mơ hình CSDL địa lý được thực hiện theo tiến trình chung thiết kế một mơ hình CSDL quan hệ và có sự phối hợp phân tích thuộc tính hình học khơng gian và mối quan hệ đối tượng không gian địa lý để đảm bảo đồng thời ngun lý của hai loại mơ hình CSDL. Quy trình thiết kế được thực hiện qua các bước sau:
Bước 1: Mơ hình hóa khái niệm (Conceptual model) từ thế giới thưc. Ở mức này cần phát hiện ra các khối chức năng cơ bản mô tả hoạt động của thế giới thực.
Bước 2:
- Định nghĩa các đối tượng: mơ hình hóa các đối tượng địa lý (define objects and relationship). Ở mức này xác định rõ các đối tượng trong mơ hình khơng gian, xác định rõ danh mục các đối tượng trong từng lớp thông tin, mơ tả đối tượng, xác định các thuộc tính mơ tả, miền giá trị các thuộc tính, dạng biểu thị của chúng và các quan hệ của chúng.
- Lựa chọn biểu thị cho các đối tượng địa lý (selectgeographic representation). Ở mức này xây dựng cách biểu thị các đối tượng (features) bằng các dạng hình học cơ bản như điểm, đường, vùng, hoặc mơ hình rasters, topo, TIN... cho thuộc tính hình học; cấu trúc bảng dữ liệu thơng tin thuộc tính phi khơng gian.
- Kết quả: Đưa ra lược đồ cơ sở dữ liệu phục vụ cho giai đoạn thiết kế vật lý tiếp theo. Kết hợp với các nhà chuyên môn kiểm tra phần thông tin các yếu tố chuyên đề và miền xác định của các thơng tin đó.
Bước 3:
- Xây dựng cấu trúc từng lớp dữ liệu bao gồm cấu trúc dữ liệu thuộc tính khơng gian, cấu trúc dữ liệu thuộc tính (phi khơng gian) với các quy định chi tiết về biểu thị hình học, bảng thơng tin thuộc tính với các trường, kiểu, kích thước và quan hệ liên kết.
- Kết quả: Đưa ra mơ hình cơ sở dữ liệu địa lý trong đó quy định cụ thể, chi tiết nội dung, cấu trúc từng chủ đề, từng lớp thông tin.
2.2.1. Nội dung của cơ sở dữ liệu địa lý cấp tỉnh
Trên cơ sở khảo sát, phân tích, tổng hợp đặc điểm địa lý Việt Nam và chức năng các sở, ban, ngành và áp bảng phân loại đối tượng địa lý do Bộ Tài nguyên và Môi trường ban hành để thiết lập nội dung của cơ sở dữ liệu địa lý cấp tỉnh. Về cơ bản cơ sở dữ liệu địa lý cấp tỉnh cần chứa đựng những nội dung sau:
+ Dữ liệu nền mô tả các đặc trưng về bề mặt tự nhiên lãnh thổ, địa danh và sự phân chia hành chính các cấp.
+ Dữ liệu chuyên đề mô tả sâu về các vấn đề, các lĩnh vực nghiên cứu của các ngành gồm:
- Địa chất - Khoáng sản - Địa chất thủy văn - Khí hậu - Thủy văn - Thổ nhưỡng - Thảm thực vật - Môi trường - Dân cư - Nông nghiệp - Công nghiệp - Giao thông vận tải - Bưu chính - Viễn thơng - Thương mại
- Giáo dục - Y tế
- Văn hoá - Thể thao - Du lịch
Trên thực tế, nội dung CSDL địa lý của từng tỉnh được xây dựng phụ thuộc vào đặc điểm địa lý hệ thông tin địa lý tự nhiên, tài nguyên, kinh tế-xã hội và nguồn tài liệu hiện có của từng tỉnh. Vì vậy trong luận văn này chỉ đề xuất khung nội dung
CSDL nền địa lý cấp tỉnh nói chung, làm cơ sở đảm bảo tính thống nhất, và tạo điều kiện thuận lợi
a. Thiết lập danh mục đối tượng địa lý
Như đã trình bày ở trên, mơ hình cơ sở dữ liệu nền địa lý được xây dựng chung cho cấp tỉnh nên danh mục đối tượng địa lý với vai trò làm nền chung vừa phản ánh đúng, toàn diện địa lý trên toàn lãnh thổ Việt Nam nhằm đảm bảo tính hệ thống, thống nhất trên toàn quốc khi áp dụng cho từng đơn vị hành chính cụ thể.
Các đối tượng địa lý trong danh mục đã lựa chọn cần được phân loại, sắp xếp theo một nguyên tắc nhất định dựa trên đặc điểm đối tượng địa lý, cách thức tác động chúng và mối quan hệ giữa các chuyên ngành trong quá trình sử dụng chúng nhằm nâng cao hiệu quả sử dụng.
Để đảm bảo tính thống nhất trong cơ sở dữ liệu, cần thiết nghiên cứu mã hóa tên loại đối tượng địa lý. Việc mã hóa tên loại đối tượng địa lý đúng đắn, khoa học không chỉ đảm bảo tính thống nhất của dữ liệu mà cịn tối ưu hóa dữ liệu, tránh mất mát dữ liệu.
* Phân loại đối tượng địa lý
Việc chia nhóm đối tượng địa lý nhằm phục vụ cho việc tổ chức quản lý đối tượng địa lý trong cơ sở dữ liệu địa lý và quá trình tra cứu, tìm kiếm thông tin sau này của các cơ quan quản lý nhà nước ở địa phương cũng như trung ương được thuận lợi.
Trên cơ sở danh mục đối tượng địa lý và danh mục thuộc tính đã được lập, thực hiện phân nhóm đối tượng địa lý theo nguyên tắc sau:
- Mỗi loại đối tượng địa lý hoặc một số loại đối tượng địa lý cùng phản ánh một khía cạnh của nền địa lý được xếp vào một phân nhóm; các đối tượng địa lý, các phân nhóm đối tượng địa lý trong mối quan hệ qua lại với nhau phản ánh các khía cạnh khác nhau của một mặt nào đó của địa lý khu vực được xếp vào một nhóm đối tượng.
- Các loại đối tượng địa lý được sắp xếp vào các nhóm phải đảm bảo đáp ứng tổ chức quản lý đối tượng địa lý theo cấu trúc không gian trong các phần mềm ứng dụng về GIS hiện nay và nguyên tắc của cơ sở dữ liệu quan hệ đồng thời thuận lợi cho quá trình khai thác sử dụng chung của các cơ quan cấp tỉnh.
- Qua quá trình thống kê, phân tích và tổng hợp kết quả phân tích các đối tượng địa lý trong mối quan hệ qua lại với nhau, đưa ra kết quả phân nhóm đối tượng địa lý trong cơ sở dữ liệu địa lý phục vụ xây dựng hệ thống thông tin địa lý cấp tỉnh bao gồm các nhóm sau:
1- Nhóm các đối tượng phản ánh mạng lưới điểm gốc làm cơ sở đo vẽ, biểu thị các đối tượng địa lý trong hệ quy chiếu và hệ tọa độ quốc gia (gọi tắt là nhóm cơ sở đo đạc) bao gồm các điểm đo đạc cơ sở quốc gia và điểm đo đạc cơ sở chuyên dụng.
2- Nhóm các đối tượng phản ánh chủ quyền lãnh thổ, phạm vi hành chính các cấp (gọi tắt là nhóm địa giới hành chính) bao gồm đường ranh giới phân định phạm vi quản lý của đơn vị hành chính các cấp, địa phận hành chính các cấp.
3- Nhóm các đối tượng phản ánh đặc điểm trên bề mặt địa hình khu vực (gọi tắt là nhóm địa hình) bao gồm các đối tượng thể hiện độ cao, các đặc trưng của bề mặt địa hình.
4- Nhóm các đối tượng phản ánh đặc điểm hệ thống thủy văn của khu vực (gọi tắt là nhóm thủy hệ) bao gồm hệ thống dòng chảy mặt, mặt nước tĩnh và các đối tượng liên quan.
5- Nhóm các đối tượng phản ánh đặc điểm hệ thống giao thông trong địa bàn tỉnh (gọi tắt là nhóm giao thơng) bao gồm mạng lưới đường giao thơng và các cơng trình giao thơng như sân bay, bến cảng, cầu, phà, đèo, …
6- Nhóm các đối tượng phản ánh phân bố, đặc điểm dân cư trong địa bàn tỉnh (gọi tắt là nhóm dân cư) bao gồm các vùng dân cư thành thị và vùng dân cư nơng thơn. 7- Nhóm các đối tượng phản ánh phân bố, đặc điểm căn bản của các cơng trình cơ sở hạ tầng phục vụ đời sống sinh hoạt, lao động sản xuất trên địa bàn tỉnh (gọi tắt là nhóm cơng trình hạ tầng): bao gồm các cơng trình cơng cộng, giáo dục đào tạo, thương mại, du lịch, bưu chính viễn thơng…
8- Nhóm các đối tượng phản ánh đặc điểm lớp phủ bề mặt tỉnh (gọi tắt là nhóm phủ bề mặt) bao gồm các khu vực có thực phủ chiếm đa số trong các khu dân cư, khu vực có rừng...
* Mã tên kiểu đối tượng địa lý:
Mã tên kiểu đối tượng phải đạt được các mục tiêu sau:
- Đơn giản, ngắn gọn, đầy đủ, mở: số lượng ký tự cho mỗi mã vừa đủ để mỗi loại đối tượng có một mã duy nhất và cho phép mở rộng danh sách mã loại đối tượng trong từng nhóm đối tượng nhưng không dư thừa ký tự để tránh tăng dung lượng dữ liệu.
- Tính thống nhất: tên mỗi loại đối tượng được mã hóa theo quy ước chung phù hợp với hệ thống phân nhóm đối tượng địa lý.
- Tính duy nhất: mỗi loại đối tượng phải có và chỉ có một mã duy nhất.
- Tính pháp lý: đối với loại đối tượng địa lý đã có trong danh mục địa lý quốc gia thì sử dụng mã đối tượng đã được cơng bố đó, bên cạnh đó cịn có các danh mục địa lý khác được công bố (cụ thể là mã đơn vị hành chính, mã loại đất theo mục đích sử dụng).
+ Quy tắc gán mã tên kiểu đối tượng địa lý cụ thể như sau: [2]
Mã tên kiểu đối tượng địa lý có 4 ký tự, gồm 2 chữ cái Latinh (trừ chữ F, J, W, Z) và 2 chữ số Ả rập, trong đó:
- Ký tự thứ nhất là chữ cái Latinh viết hoa thay cho tên chủ đề dữ liệu, lần lượt từ chữ A đến chữ U (không sử dụng chữ F, J, W, Z) trong bộ chữ cái Latinh theo thứ tự của thứ tự chủ đề dữ liệu.
- Ký tự thứ hai là chữ cái Latinh viết hoa thay cho tên nhóm trong từng chủ đề dữ liệu, lần lượt từ chữ A đến chữ U (không sử dụng chữ F, J, W, Z) theo thứ tự của nhóm đối tượng địa lý trong từng chủ đề dữ liệu.
ký tự tiếp theo
- Hai (2) là hai chữ số Ả rập, bắt đầu từ 01 lần lượt theo thứ tự của tên kiểu đối tượng trong mỗi nhóm đối tượng.
+ Mã tên kiểu đối tượng địa lý:
Để đạt được các mục tiêu của mã hóa tên kiểu đối tượng địa lý đã nêu ở trên, việc mã tên đối tượng địa lý được bắt đầu mã từ tên nhóm loại đối tượng địa lý đến mã tên phân nhóm đối tượng địa lý trong từng nhóm và cuối cùng là mã loại đối tượng địa lý trong từng phân nhóm.
b. Thiết lập danh mục thơng tin thuộc tính đối tượng địa lý
Ngồi sự khác biệt nhau về vị trí địa lý, mỗi đối tượng địa lý đều có những đặc tính riêng tạo nên sự khác biệt giữa đối tượng này với đối tượng khác. Thông tin về mỗi đối tượng địa lý trước hết là tên riêng của chúng. Đặc tính của mỗi đối tượng bao gồm đặc điểm bên ngoài và đặc tính bên trong của chúng. Đặc điểm bên ngồi thường dễ nhận biết, thông tin chi tiết về các đặc tính bên trong của đối tượng thường ở dạng số liệu chỉ có thể có tại các cơ quan nghiên cứu, quản lý đối tượng.
Sau khi xác định danh mục đối tượng cần thể hiện trong dữ liệu địa lý hệ thông tin địa lý cấp tỉnh, cần hệ thống hóa thuộc tính và mã hóa chúng giúp cho q trình xây dựng xây dựng CSDL được thuận lợi và đảm bảo sự thống nhất, tối ưu hóa dữ liệu. Căn cứ trên kết quả hệ thống hóa thuộc tính đã đề ra quy ước chung mã hóa tên loại thuộc tính đối tượng. Mã thuộc tính đối tượng địa lý có 3 ký tự là chữ cái Latinh viết hoa, trong đó:
- Ký tự thứ nhất là chữ cái đầu tiên của từ thứ nhất trong tên thuộc tính đối tượng,
- Hai (2) ký tự tiếp theo là hai trong số các ký tự xuất hiện trong các từ cịn lại của tên thuộc tính (ưu tiên lấy chữ cái đầu tiên nếu mã không trùng với các mã thuộc tính đối tượng đã có trong danh mục) sao cho tạo sự liên tưởng đến tên thuộc tính đối tượng.
2.2.2. Xây dựng lược đồ ứng dụng
Lược đồ ứng dụng là một lược đồ khái niệm được xây dựng cho các ứng dụng có các yêu cầu tương tự về dữ liệu. Sơ đồ ở hình 2.1 cho thấy trung tâm của lược đồ ứng dụng trong q trình mơ hình hóa thế giới thực đến bộ dữ liệu địa lý: Đóng vai trị mơ tả trực tiếp bộ dữ liệu.
Hình 2.2. Lược đồ ứng dụng mô tả cấu trúc dữ liệu
Đối với mỗi bộ dữ liệu thông tin địa lý có một lược đồ ứng dụng. Lược đồ ứng dụng là một lược đồ khái niệm ở mức mơ hình ứng dụng và bao hàm định nghĩa đầy đủ, chính xác về nội dung và cấu trúc của bộ dữ liệu.
Lược đồ ứng dụng chứa một mô tả đầy đủ và chính xác về nội dung ngữ nghĩa của bộ phận dữ liệu địa lý tuân theo các khái niệm và cấu trúc định nghĩa trong mơ hình đối tượng tổng quát. Lược đồ chứa các yếu tố về đối tượng gồm: kiểu đối tượng, kiểu thuộc tính đối tượng, kiểu quan hệ đối tượng và kiểu hoạt động đối tượng, các thông tin này được lấy từ bảng phân loại đối tượng.
Lược đồ ứng dụng bao gồm các chỉ định về hệ quy chiếu sử dụng để biểu diễn vị trí khơng gian, các kiểu yếu tố khơng gian để biểu thị tính chất khơng gian, hình học của đối tượng. Lược đồ cũng bao gồm các yếu tố về chất lượng dữ liệu: chất lượng thơng tin về đối tượng, thuộc tính và quan hệ của đối tượng.
2.2.3. Thiết kế cấu trúc cơ sở dữ liệu
a. Thiết kế cấu trúc cơ sở dữ liệu không gian địa lý
- Cơ sở dữ liệu (CSDL) địa lý cấp tỉnh được thiết kế theo cấu trúc của CSDL hệ thông tin địa lý (GIS) và theo công nghệ ArcGIS.
- Các đối tượng địa lý trong CSDL phải lưu theo tính chất topology tức là tách riêng thành các đối tượng dạng điểm, đường, vùng. Đồng thời được liên kết với các bảng thuộc tính mơ tả những đặc điểm cơ bản của chúng.
- Các đối tượng địa lý trong CSDL sẽ được quản lý theo chuyên đề.
- Các chuyên đề trong CSDL được thiết lập trong ArcGIS theo các feature dataset bao gồm nhiều nhóm lớp đối tượng, mỗi lớp đối tượng trong mơ hình được gọi là feature class, một lớp đối tượng (feature class) có các đối tượng, một đối tượng được gọi là feature.
- Trong một lớp, các đối tượng phải đồng nhất về mơ hình khơng gian (hoặc là điểm, hoặc là đường, hoặc là vùng) và được lưu ở khuôn dạng SHP của ArcGIS.
- Các đối tượng địa lý trong CSDL phải được định nghĩa rõ ràng và lập thành danh mục đối tượng.
- Việc đặt tên cho các chuyên đề (feature dataset), các lớp đối tượng (feature class) phải tuân thủ theo ngun tắc: có tính hệ thống, nhất qn và logic.
- Mỗi đối tượng địa lý phải được gán một mã (code) riêng và có tính duy nhất. Trong CSDL đối tượng địa lý được quản lý thông qua mã (code). Mã (code) gồm 3 thành phần đại diện cho chuyên đề, lớp và đối tượng. Để có thể sẵn sàng tích hợp với CSDL địa lý quốc gia, cần vận dụng triệt để cách đặt mã (code) như trong "Danh mục đối tượng địa lý cơ sở quốc gia".
b. Thiết kế cấu trúc cơ sở dữ liệu thơng tin thuộc tính
- Cấu trúc CSDL thuộc tính phải đồng nhất và bao gồm: tên thuộc tính, mã thuộc tính, kiểu dữ liệu, đơn vị, giá trị, mơ tả thuộc tính.
- Cấu trúc CSDL thuộc tính của các lớp đối tượng địa lý cùng loại có mặt trong cả 2 hoặc nhiều chuyên đề phải có tên thuộc tính, mã thuộc tính, kiểu dữ liệu, đơn vị đo, độ lớn của trường... hoàn toàn giống nhau.
Dữ liệu thơng tin thuộc tính được tổ chức quản lý theo mơ hình dữ liệu quan hệ: thơng tin thuộc tính đối tượng được lưu trữ quản lý trong bảng dữ liệu có cấu trúc