Quy trình xây dựng CSDL đ−ợc thể hiện trong hình 4.2
Để xây dựng CSDL cần tuân theo 4 b−ớc cơ bản sau:
a. B−ớc 1: Chuẩn bị
ở bước này cần phải xác định phạm vi, khu vực nghiên cứu. Xác định rõ: CSDL nhằm mục đích gì, cho ai dùng và bao gồm những nội dung gì. Từ
đó sẽ quyết định những nội dung tiếp theo trong quy trình xây dựng CSDL.
Tùy từng mục đích khác nhau mà CSDL sẽ có cấu trúc khác nhau, dữ liệu sẽ
đ−ợc tổ chức khác nhau và có các thuộc tính khác nhau. Từ những mục tiêu trên sẽ quyết định việc lựa chọn các lớp thông tin cần có trong CSDL.
H×nh 4.2: Quy tr×nh x©y dùng CSDL B−íc 3
- Xác định lớp thông tin, hệ quy chiếu, tỷ lệ bản đồ.
- Chọn phần mềm xử lý và lưu tr÷
- Xác vùng nghiên cứu - Mục tiêu, nội dung CSDL cÇn x©y dùng
Thu thập dữ liệu
Nhập dữ liệu thuộc tính - Lựa chọn thuộc tính - Mã hóa thuộc tính Nhập dữ liệu không gian
- Bản đồ nền
- Bản đồ chuyên đề…
B−íc 4
Lưu tr÷, Quản lý CSDL
Biên tập, tổ chức CSDL
Dữ liệu thuộc tính - Bảng biểu thống kê - Đề tài, báo cáo khoa học
Dữ liệu không gian - Bản đồ nền
- Bản đồ chuyên đề B−íc 2
B−íc 1
Trên cơ sở các lớp thông tin đó lựa chọn hệ quy chiếu, tỷ lệ bản đồ và phần mềm sử dụng trong CSDL. Cụ thể gồm những công việc d−ới đây.
a1. Lựa chọn hệ quy chiếu (hệ tọa độ) bản đồ
Đây là phương pháp để biểu diễn bề mặt trái đất lên mặt phẳng bản đồ.
Thực chất là xác lập mối quan hệ giữa tọa độ địa lý của các điểm trên bề mặt trái đất(ϕ,λ ) với tọa độ các điểm ấy trên mặt phẳng (x,y).
Hệ quy chiếu của bản đồ đ−ợc đặc tr−ng bởi hình elipsoid và hệ thống toạ độ trắc địa quốc gia đã sử dụng để thành lập bản đồ. ở nước ta hiện nay có ba hệ thống toạ độ trắc địa khác nhau:
- Với các tỉnh miền Bắc, trong thời gian Pháp thuộc, Sở địa d− Đông d−-
ơng đã lựa chọn Elipsoid Clark 1880 và gốc toạ độ theo điểm thiên văn tại cột cờ Hà Nội, gốc độ cao tại đảo Hòn Dấu.
Năm 1959, Trung Quốc đã giúp ta xây dựng hệ thống toạ độ và độ cao quốc gia. Elipsoid đ−ợc chọn là Krasovski và điểm gốc toạ độ của Trung Quốc cũng đ−ợc tính lan truyền từ hệ thống của Liên Xô cũ sang theo điểm gốc tại Punkôvô. Điểm gốc độ cao vẫn giữ tại Hòn Dấu như trước đây.
- Miền Nam nước ta trước năm 1975 người Mỹ đã chọn Elipsoid Everest và điểm gốc toạ độ theo hệ thống ấn Độ (Indian Datum) và điểm gốc
độ cao tại Mũi Nai.
- Hiện nay, hệ thống bản đồ địa hình Nhà nước được thực hiện cơ sở hệ toạ độ Nhà nước Hà Nội - 1972 (được dẫn toạ độ từ Trung Quốc sang), elipsoid Krasovski (bán trục lớn a=6.378.245 m, bán trục nhỏ b=6.356.863 m,
độ dẹt α=1/298.3) và lưới chiếu hình trục ngang Gauss (m0=1). Hệ thống bản
đồ này được chuyển đổi từ hệ thống cũ của Pháp và Mỹ thành lập. Thủ tướng Chính phủ cũng đã ra quyết định lấy hệ tọa độ mới hiện nay VN 2000, với
điểm toạ độ gốc tại Hà Nội, elipsoid đ−ợc chọn phù hợp hơn.
Tuy nhiên với chức năng của HTTĐL thì vấn đề lưới chiếu không còn là
một khó khăn như trước đây. Chúng ta có thể chuyển đổi từ hệ quy chiếu này sang hệ quy chiếu khác một cách dễ dàng và đảm bảo độ chính xác cao.
Việc lựa chọn lưới chiếu bản đồ trong CSDL cần phải thống nhất ngay từ đầu, ngay từ bước thiết kế CSDL để các bản đồ tuân theo một hệ tọa độ chung, các bản đồ không cùng hệ tọa độ sẽ đ−ợc chuyển đổi về hệ tọa độ chung này. Ngoài ra, khi lựa chọn lưới chiếu cũng phải tính đến khả năng trao
đổi dữ liệu với các quốc gia, các khu vực khác.
Căn cứ vào các nguồn bản đồ đã thu thập đ−ợc thì bản đồ trong CSDL tỉnh Lạng Sơn đ−ợc thiết kế trên cơ sở l−ới chiếu hình trụ ngang Gauss, elipsoid Krasovski theo hệ thống bản đồ địa hình chính quy của nhà nước ta.
Các bản đồ nếu thuộc các hệ quy chiếu khác đều đ−ợc quy chuẩn về hệ quy chiếu trên bằng các phần mềm chuyên dụng.
Các bản đồ và dữ liệu địa lý đ−ợc quản lý theo tọa độ địa lý kinh độ, vĩ
độ (Longitude /Latitude) a2. Lựa chọn tỷ lệ bản đồ
Tỷ lệ bản đồ chỉ mức độ thu nhỏ của bản đồ so với thực tế. Cần phải có một tỷ lệ bản đồ thích hợp và thống nhất cho các đối t−ợng địa lý trong QHSD§.
Tỷ lệ thích hợp cho bản đồ quy hoạch sử dụng đất ở cấp quốc gia là 1:1.000.000, ở cấp vùng là 1:500.000 hoặc 1:250.000. Còn ở cấp tỉnh, tỷ lệ bản đồ thường sử dụng là 1:100.000, với những tỉnh có diện tích nhỏ thì tỷ lệ 1:50.000 là phù hợp.
Khi xây dựng bản đồ quy hoạch sử dụng đất của huyện, tỷ lệ đ−ợc chọn là 1:50.000, với cấp xã tỷ lệ là 1:25.000 hoặc 1:10.000.
Đối với đề tài tỷ lệ bản đồ cơ bản trong CSDL là 1:50.000 cho các bản
đồ chuyên đề. Bản đồ nền địa hình cơ sở đ−ợc quản lý ở tỷ lệ 1:50.000. Các sản phẩm in ấn (bản đồ kết quả) đ−ợc trình bày ở tỷ lệ 1:100.000
a3. Lựa chọn phần mềm sử dụng
Phần mềm sử dụng trong cơ sở dữ liệu đ−ợc lựa chọn dựa theo các tiêu chuẩn: dựa trên tình trạng dữ liệu, dựa trên nội dung và cấu trúc của dữ liệu và các hệ GIS hiện có tại Việt Nam và tại cơ quan công tác của tác giả. Các phần mềm đ−ợc sử dụng trong CSDL tỉnh Lạng Sơn gồm:
- Phần mềm số hóa, nhập dữ liệu: MICROSTATION (INTERGRAPH), ARCVIEW 3.2
- Phần mềm xử lý số liệu, xây dựng các mô hình QHSDĐ: FEWGIS (phần mềm GIS phát triển của Trung tâm T− vấn thông tin lâm nghiệp, Viện
Điều tra Quy hoạch rừng), ILWIS 3.1, IDRISI, ARC/INFO, IMAGINE8.5, ARCVIEW 3.2
- Phần mềm trình bày, hiển thị, lưu trữ, quản lý: MAPINFO, ARCVIEW3.2
b. B−ớc 2: Thu thập bản đồ, số liệu cần thiết
Đây là bước quan trọng. Những tài liệu thu thập là các bản đồ nền, bản
đồ chuyên đề, các tài liệu ảnh vệ tinh, ảnh máy bay của khu vực nghiên cứu, các bảng biểu thống kê, các báo cáo khoa học, các tài liệu nghiên cứu có liên quan đến mục đích và nội dung của CSDL.
Những tài liệu này đ−ợc chia thành hai nhóm chính. Đó là các dữ liệu không gian (dữ liệu bản đồ) và dữ liệu thuộc tính thể hiện đặc tr−ng của các
đối tượng nghiên cứu. Điều này còn liên quan đến sự lựa chọn phương pháp lưu trữ dữ liệu.
c. B−ớc 3: Tổ chức CSDL
B−ớc này bao gồm các công việc cụ thể sau:
- Hệ thống hóa các lớp thông tin trong CSDL (lớp thông tin nền, lớp thông tin chuyên đề). Tùy theo mục đích, yêu cầu mà lựa chọn và hệ thống hóa dữ liệu thành các lớp thông tin, có thể là các lớp thông tin dạng raster, dạng vector (điểm, đ−ờng, vùng) hoặc là dạng text...
- Lựa chọn thông tin thuộc tính cho từng đối t−ợng địa lý. Những thông tin thuộc tính đ−ợc sắp xếp theo đặc điểm và tính chất của dữ liệu để lựa chọn phương pháp lưu trữ. Với những thông tin định lượng, quản lý bằng số nguyên, số thập phân hay số thực. Còn với các thông tin định tính, miêu tả hay phân loại thì mã hóa các giá trị thuộc tính hoặc đặc tả bằng ký tự.
- Nhập dữ liệu vào HTTĐL: Nhập dữ liệu không gian và dữ liệu thuộc tính vào CSDL. Liên kết dữ liệu không gian với dữ liệu thuộc tính của các đối tượng địa lý tương ứng để hình thành CSDL thống nhất.
- Biên tập, kiểm tra, hiệu chỉnh CSDL.
Đi vào cụ thể b−ớc công việc này bao gồm những nội dung chính sau:
c1. Lựa chọn công nghệ số hóa
Hiện nay có hai công nghệ chính để véctơ hóa hay còn gọi là số hóa: đó là số hóa trực tiếp trên bàn số Digitizer và số hóa trên màn hình máy tính thông qua máy quét.
Hình 4.3: Thiết bị số hóa bản đồ (Bàn vẽ)
Bàn số hóa Máy tính
* Số hóa trực tiếp trên bàn số Digitizer:
Đây là kỹ thuật số hóa bằng bàn vẽ (digitizer - hình 4.3). Bản đồ giấy sau khi
đ−ợc định vị trên bàn vẽ sẽ đ−ợc số hóa tách đối t−ợng theo các lớp thông tin và theo yêu cầu kỹ thuật đã quy định. Sau đó sẽ đ−ợc kiểm tra, tiếp biên, biên tập và hoàn thiện để đ−a vào CSDL
* Số hóa trên màn hình máy tính thông qua máy quét ( hình 4.4):
ChuÈn bị bản
đồ giÊy
QuÐt bản đồ
thành
ảnh
-Chọn lớp thông tin -Sè hãa tù
động hoặc bán tự động
KÕt nạp vào CSDL
để sử dông -Tiếp biên
-KiÓm tra -Sửa lỗi -Hoàn thiện dữ liệu -Xử lý
ảnh -Lọc nhiÔu -Nẵn chỉnh ảnh
Hình 4.4: Quy trình số hóa trên màn hình thông qua máy
Từ các bản đồ giấy được quét thành file ảnh và được lưu trữ ở hệ tọa độ hàng cột. File ảnh này phải đ−ợc lọc nhiễu và nắn chỉnh về hệ tọa độ cần thiết, sau đó sẽ đ−ợc số hóa tự động hoặc bán tự động. Dữ liệu sau đó sẽ đ−ợc tiếp biên, kiểm tra, sửa lỗi và đ−ợc cập nhật vào CSDL.
Từng công nghệ số hóa trên đều có những −u điểm và có những hạn chế riêng. Việc lựa chọn sử dụng công nghệ nào là phụ thuộc vào chất l−ợng của tài liệu gốc, phụ thuộc vào thiết bị và khả năng cũng nh− kinh nghiệm của nhân viên kỹ thuật.
Căn cứ vào các phần mềm GIS hiện có tại đơn vị tác giả công tác, đề tài chọn công nghệ “Số hóa trên màn hình máy tính thông qua máy quét ”.
Sai số của công tác số hóa các đối t−ợng địa lý khi nhập vào CSDL không v−ợt quá ±0,2mm so với bản đồ gốc, sai số tiếp biên của các mảnh bản
đồ không v−ợt quá ±0,7 mm ( Tổng cục địa chính ban hành ).
c2. Lựa chọn khuôn dạng dữ liệu
* Khuôn dạng dữ liệu (format):
Đây là yếu tố rất quan trọng trong quá trình trao đổi thông tin giữa những ng−ời dùng (user) khác nhau trong cùng một hệ thống và giữa các hệ thống với nhau. Phải lựa chọn những khuôn dạng dữ liệu có khả năng thể hiện các loại đối t−ợng khác nhau và là những khuôn dạng đã đ−ợc công bố, cho phép ng−ời dùng khác hoặc những hệ phần mềm khác có thể hiểu và truy cập
đ−ợc dữ liệu đó. Một điều quan trọng nữa, đó là dạng dữ liệu này phải phù hợp với các hệ thống phần mềm GIS đang đ−ợc sử dụng và phổ biến hiện nay tại Việt Nam.
Căn cứ vào nguồn tài liệu thu thập đ−ợc cụ thể của tỉnh Lạng Sơn đề tài chọn khuôn dạng Mapinfo là khuôn dạng chính để thể hiện dữ liệu không gian, ngoài ra còn dùng khuôn dạng ArcView để chồng xếp, phân tích bản đồ.
Dữ liệu phi không gian nh− các báo cáo, bảng biểu, số liệu thống kê...
được lưu dưới dạng Word, Exel.
c3. Tổ chức dữ liệu
Tổ chức dữ liệu là nội dung quan trọng để thể hiện sinh động, trực quan CSDL xây dựng đ−ợc.Tổ chức CSDL chính là phân lớp, sắp xếp, phân loại logic các đối t−ợng của bản đồ số dựa trên các tính chất, các thuộc tính của
đối t−ợng. Các đối t−ợng trong cùng một lớp phải có chung một tính chất nào
đó. Việc phân lớp thông tin cũng ảnh hưởng trực tiếp đến sự nhận biết các loại
đối t−ợng trên bản đồ.
Cần phải có một th− viện kí hiệu chuẩn cho dữ liệu bản đồ theo mẫu kí hiệu đã thiết kế. Các đối t−ợng bản đồ cũng đ−ợc phân biệt ra thành những kiểu đối tượng và kí tự, tương ứng với: các kí hiệu kiểu điểm, các kí hiệu kiểu
đ−ờng, các kí hiệu kiểu vùng, các kí hiệu của text.
Tất cả các bản đồ đ−ợc xây dựng trong CSDL tỉnh Lạng Sơn đ−ợc thiết kế theo th− viện ký hiệu chuẩn trong “ Quy định kỹ thuật bản đồ thành quả
Điều tra quy hoạch rừng vẽ và in trên máy vi tính” do Viện Điều tra quy hoạch rừng ban hành.
Trong CSDL phục vục QHSDĐ tỉnh Lạng Sơn, các lớp thông tin đ−ợc phân thành 2 nhóm chính: nhóm lớp thông tin nền và nhóm lớp thông tin chuyên đề (thể hiện cụ thể ở mục 4.3 của luận văn), ngoài ra còn có nhóm thông tin bổ trợ khác như: lớp khung, lưới, tọa độ lưới, tỷ lệ bản đồ... phục vụ cho quá trình biên tập bản đồ.
d. B−ớc 4: L−u trữ và quản lý dữ liệu
Toàn bộ dữ liệu sau khi đã đ−ợc kiểm tra, loại bỏ lỗi sẽ đ−ợc đ−a vào lưu trữ và quản lý trong CSDL để sử dụng cho những phân tích tiếp theo.