địa chính.
Sau một thời gian vận hành cơ sở dữ liệu đất đai (năm 2015 và năm 2016), với đặc thù là khu vực đơ thị có tốc độ đơ thị hóa nhanh, kéo theo đó là sự biến động về
đất đai thông qua các giao dịch chuyển quyền, giao đất, cho thuê đất, chuyển mục đích sử dụng đất, cơ sở dữ liệu được cập nhật thường xuyên thông qua các giao dịch này. Mặt khác nguồn tư liệu xây dựng CSDL đất đai cũng đa dạng và phức tạp do vậy đã phát sinh một số vấn đề sau:
2.4.1. Công tác xây dựng cơ sở dữ liệu địa chính
Cơ sở dữ liệu địa chính được xây dựng trên các nguồn tài liệu đa dạng, có thời gian hình thành khác nhau, lực lượng tham gia xây dựng cơ sở dữ liệu không đồng đều dẫn đến một số tồn tại sau:
- Dữ liệu không gian không đồng nhất với dữ liệu thuộc tính: xuất hiện các trường hợp thửa đất có dữ liệu thuộc tính nhưng khơng có dữ liệu khơng gian; diện tích thửa đất, loại đất trong dữ liệu thuộc tính và khơng gian khác nhau;
- Dữ liệu khơng gian chưa đảm bảo quan hệ hình học: Thửa đất hình học cịn có tình trạng hở vùng, chồng vùng..
- Dữ liệu thuộc tính: xuất hiện các trường hợp được nhập vào CSDL chưa đúng quy cách (quy định nhập tuân thủ theo cấu trúc CSDL và quy định trong các văn bản chuyên môn) hoặc nhập sai thông tin. Nguyên nhân là do một số tài liệu đầu vào không phù hợp với quy định hiện hành (các loại giấy chứng nhận quyền sử dụng đất, sở hữu nhà ở đã cấp trước đây), do vậy người nhập đã hiểu sai từ đó dẫn đến nhập vào CSDL khơng đúng quy định.
- Dữ liệu hồ sơ gốc cấp giấy chứng nhận: Hồ sơ lưu trữ không liên tục theo lịch sử biến động. Nguyên nhân là do địa phương lưu trữ phân tán hồ sơ gốc dẫn đến tình trạng nhầm lẫn hoặc mất hồ sơ.
2.4.2. Công tác vận hành cơ sở dữ liệu đất đai
Trong quá trình vận hành CSDL đất đai, ngoài những lỗi phát sinh tương tự trong cơng tác xây dựng CSDL do q trình cập nhật CSDL từ các giao dịch đăng ký biến động đất đai, CSDL địa chính cũng bộc lộ một số vấn đề sau:
- Dữ liệu không gian đất đai khơng đồng bộ với bản đồ địa chính số. Nguyên nhân là do trong quá trình thực hiện chỉnh lý thửa đất đã phát sinh việc thửa đất không được cập nhật đồng thời trong CSDL và trên bản đồ;
một nền bản đồ. Nguyên nhân là do hệ thống bản đồ địa chính số vẫn được sử dụng độc lập tại hai cấp (VPĐK thành phố và chi nhánh VPĐK). Do vậy khi tiến hành chỉnh lý bản đồ đã hình thành hai phiên bản khác nhau của cùng một tờ bản đồ;
- Dữ liệu hồ sơ gốc cấp giấy chứng nhận quyền sử dụng đất dạng số được lưu trữ theo cách thức khác nhau tại mỗi đơn vị hành chính. Nguyên nhân là chưa có quy định cụ thể về cấu trúc lưu trữ đối với dữ liệu này, quá trình lưu trữ phụ thuộc vào phần mềm do địa phương sử dụng, do vậy sẽ rất khó cho việc trao đổi dữ liệu giữa các hệ thống.
CHƯƠNG 3
ĐỀ XUẤT MƠ HÌNH CHUẨN HĨA, LƯU TRỮ VÀ CHIA SẺ DỮ LIỆU ĐỊA CHÍNH
3.1. Mơ hình chuẩn hóa cấu trúc cơ sở dữ liệu trong trường hợp nâng cấp hoặc chuyển đổi cơ sở dữ liệu địa chính
3.1.1. u cầu đảm bảo mơ hình cấu trúc và tồn vẹn dữ liệu
Việc chuẩn hóa đảm bảo theo yêu cầu cấu trúc dữ liệu được thực hiện trong trường hợp nâng cấp cơ sở dữ liệu hoặc chuyển đổi cơ sở dữ liệu theo cấu trúc chuẩn. Hiện nay Bộ Tài nguyên và Môi trường đã ban hành Thông tư 75/2015/TT- BTNMT quy định kỹ thuật về cơ sở dữ liệu đất đai, do vậy khi tiến hành xây dựng cơ sở dữ liệu thì phải thiết kế cấu trúc cơ sở dữ liệu theo chuẩn này.
Tại địa bàn quận Ngũ Hành Sơn khi tiến hành xây dựng cơ sở dữ liệu đã có một phần dữ liệu thuộc tính lưu trữ trên cơ sở dữ liệu của phần mềm InGCN2009 (dữ liệu cấp giấy chứng nhận từ năm 2010 đến năm 2015), do vậy yêu cầu đặt ra là phải chuyển đổi cơ sở dữ liệu từ phần mềm này vào CSDL địa chính đã được thiết kế theo cấu trúc chuẩn của Thông tư 75/2015/TT-BTNMT quy định về CSDL đất đai.
Để chuyển đổi CSDL từ CSDL chưa theo chuẩn sang CSDL đã thiết kế theo chuẩn đảm bảo tính tồn vẹn dữ liệu, Luận văn trình bày phương pháp thực hiện và quy trình chuẩn hóa chuyển đổi cụ thể như sau:
3.1.2. Yêu cầu kỹ thuật và phương pháp chuẩn hóa áp dụng
Nhiệm vụ đặt ra trong mơ hình chuẩn hóa này là đảm bảo đạt được hai mục tiêu cơ bản sau:
- Dữ liệu được chuyển đầy đủ từ cấu trúc CSDL cũ sang cấu trúc CSDL mới (cấu trúc được thiết kế chuẩn theo quy định);
- Dữ liệu lưu trữ trong các bảng (table) phải đảm bảo được: + Loại bỏ dữ liệu dư thừa sau khi chuyển đổi;
+ Loại bỏ các phụ thuộc hàm bộ phận; + Loại bỏ các phụ thuộc hàm bắc cầu.
Để thực hiện được việc này, mơ hình chuẩn hóa xây đựng được thực hiện theo sơ đồ sau:
Kết thúc Bắt đầu B1. Thiết lập quy tắc chuẩn hóa B2. Thiết lập ánh xạ chuyển đổi B3. Chuyển đổi CSDL
Hình 3.1. Quy trình chuẩn hóa dữ liệu trong trường hợp chuyển đổi hoặc nâng
cấp CSDL (Nguồn: kết quả nghiên cứu) 3.1.2.1. Thiết lập quy tắc chuẩn hóa (Bước 1)
Mục đích của chuẩn hóa CSDL là nhóm các thuộc tính và các quan hệ nhằm giảm thiểu sự dư thừa dữ liệu, loại bỏ các bất thường khi cập nhật CSDL. Như vậy chuẩn hóa trong trường hợp này là chuẩn hóa dữ liệu từ một CSDL chưa chuẩn hóa sang chuẩn hóa. Dạng chưa chuẩn hóa (unnormalized form - UNF): quan hệ chưa chuẩn hóa là quan hệ chứa các bộ dữ liệu bị lặp lại giá trị. Việc chuẩn hóa dữ liệu được thể hiện qua khóa quan hệ và phụ thuộc hàm, trong đó:
- Khóa quan hệ (Primary key) là một (một nhóm) thuộc tính của quan hệ cho phép xác định mỗi bộ khác nhau trong quan hệ. Ví dụ trong quan hệ ThuaDat: ThuaDatID, SoHieuToBanDo, SoThuTuThua, DienTich, LoạiDat... thì thuộc tính khóa là ThuaDatID;
- Phụ thuộc hàm cho hai thuộc tính A và B. B được gọi là phụ thuộc hàm vào A nếu có khơng q một giá trị của thuộc tính B liên kết với một giá trị của thuộc tính A. Hoặc có thể định nghĩa như sau:
Cho r là một quan hệ được định trên lược đồ quan hệ R.
X và Y là hai tập con (khác rỗng) các thuộc tính của R. Ta nói X xác định hàm
Y, ký hiệu XY là một phụ thuộc hàm định nghĩa trên R nếu: ∀ 𝑡1, 𝑡2 ∈
Ví dụ quan hệ ThuaDat: ThuaDatID, SoHieuToBanDo, SoThuTuThua, DienTich, LoạiDat có phụ thuộc hàm ThuaDatID, SoHieuToBanDo.
Như vậy trong trường hợp này có thể hiểu chuẩn hóa là q trình phân rã lược đồ quan hệ dựa trên một tập hợp phụ thuộc hàm nhằm đảm bảo các lược đồ quan hệ thỏa mãn 2 tính chất: trùng lắp dữ liệu ít nhất, khả năng gây ra bất thường khi cập nhật được giảm thiểu. Trong nội dung nghiên cứu của luận văn, tác giả lựa chọn 3 dạng chuẩn là 1NF (First Normal Form), 2NF và 3NF.
a) Dạng chuẩn 1 (1NF)
Lược đồ quan hệ R được gọi là 1NF nếu và chỉ nếu tất cả các thuộc tính của R thỏa mãn cả 3 điều kiện sau:
- Là nguyên tố;
- Giá trị của các thuộc tính trên các bộ là đơn trị, khơng chứa nhóm lặp;
- Khơng có một thuộc tính nào có giá trị mà có thể tính tốn được từ một số thuộc tính khác.
Hình 3.2. Bảng dữ liệu chủ sử dụng đất của CSDL cấp giấy chứng nhận
Hình 3.2 cho thấy dữ liệu chủ sử dụng đất “Bùi Thị Đình” bị lặp lại 2 lần trong 1 bảng dữ liệu. Như vậy, đây là dữ liệu chưa chuẩn.
Như vậy, nguyên tắc chung của chuẩn hóa 1NF là loại bỏ các thuộc tính lặp và đa trị, các bước thực hiện như sau:
- Tách nhóm thuộc tính lặp/đa trị sang một bảng mới
- Khóa các bảng mới là Khóa của bảng ban đầu và khóa nhóm lặp - Bảng cịn lại là bảng gồm có khóa và các thuộc tính cịn lại Ví dụ: cho quan hệ 𝑅(𝐴1, 𝐴2, 𝐴3, {𝐴4, 𝐴5, 𝐴6})
Quan hệ R sẽ được tách thành 2 quan hệ R1(A1,A4,A5,A6); R2(A1, ,A2,A3)
b) Dạng chuẩn 2 (2NF)
Quan hệ R được gọi là đạt dạng chuẩn hóa 2 nếu đã là 1NF và tất cả các thuộc tính khơng khóa đều phụ thuộc hàm đầy đủ vào khóa (Thuộc tính khơng khóa: là thuộc tính khơng tham gia vào bất kỳ khóa nào)
Quy tắc chuẩn hóa từ 1NF sang 2NF
- Bước 1: Loại bỏ các thuộc tính khơng khóa phụ thuộc vào một bộ phận khóa chính và tách thành ra một bảng riêng, khóa chính của bảng là bộ phận khóa mà chúng phụ thuộc vào;
- Bước 2: Các thuộc tính cịn lại lập thành một quan hệ, khóa chính của nó là khóa chính ban đầu.
Ví dụ cho một tập hợp quan hệ: R(A1,A2,A3,A4,A5,A6)
Khóa chính là bộ {A1,A2} (tức là từ {A1,A2} {A3,A4,A5,A6}) Các phụ thuộc hàm phụ thuộc vào một phần của khóa {A2} {A5,A6} Quan hệ này được tách thành 2 quan hệ sau:
R1(A2,A5,A6) - Tách các thuộc tính phụ thuộc vào một phần của khóa R2(A1,A2,A3,A4) - Bảng ban đầu còn lại
c) Dạng chuẩn 3 (3NF)
Cho quan hệ R,F là tập phụ thuộc hàm định nghĩa trên R. R được gọi là đạt dạng chuẩn 3 nếu thỏa mãn các điều kiện sau:
- R phải đạt chuẩn 2NF
- Mọi thuộc tính khơng khóa khơng phụ thuộc bắc cầu vào khóa (tức là tất cả các thuộc tính phải được suy ra trực tiếp từ khóa)
Quy tắc chuẩn hóa về 3NF
- Bước 1: Loại bỏ các thuộc tính phụ thuộc bắc cầu ra khỏi quan hệ và tách chúng thành một quan hệ riêng có khóa chính là thuộc tính bắc cầu;
- Bước 2: Các thuộc tính cịn lại lập thành một quan hệ có khóa chính là quan hệ bắc cầu
Ví dụ cho một tập hợp quan hệ: R(A1, A2,A3,A4,A5,A6) Khóa chính là {A1} (tức là từ {A1} {A2,A3,A4,A5,A6})
Có phụ thuộc hàm phụ thuộc bắc cầu {A3}{A5,A6} Quan hệ này được tách thành 2 quan hệ sau:
R1(A3,A5,A6) - Tách các thuộc tính phụ thuộc bắc cầu R2(A1,A2,A3,A4) - Bảng ban đầu còn lại.
3.1.2.2. Thiết lập ánh xạ chuyển đổi (Bước 2)
Thực chất của bước công việc này là căn cứ vào kết quả xây dựng quy tắc chuẩn hóa tại bước 1 và cấu trúc bảng dữ liệu của CSDL cũ, CSDL mới thực hiện các bước công việc sau:
- Lập bảng tham chiếu trường dữ liệu của các bảng dữ liệu giữa CSDL cũ và CSDL mới;
- Xây dựng quan hệ ánh xạ trực tiếp giữa trường dữ liệu cũ sang trường dữ liệu mới và tuân thủ theo quy tắc chuẩn hóa 1NF, 2NF, 3NF.
Hình 3.3. Lược đồ mơ tả ánh xạ chuyển đổi dữ liệu
Hình 3.3 là ví dụ mơ tả thiết lập ánh xạ chuyển đổi dữ liệu giữa bảng Parcel
trong CSDL cũ sang bảng ThuaDat trong CSDL mới, theo đó ánh xạ được thiết lập cụ thể đến từng trường dữ liệu và các hàm chuẩn hóa (nếu có) kèm theo.
Kết quả của việc thiết lập ánh xạ chuyển đổi sẽ được chuyển sang lưu trữ ở định dạng XML (eXtensible Markup Language, tức "Ngôn ngữ đánh dấu mở rộng",
là ngơn ngữ đánh dấu với mục đích chung do W3C đề nghị, để tạo ra các ngôn ngữ
loại dữ liệu khác nhau) có cấu trúc như Hình 3.4
Hình 3.4. Lược đồ cấu trúc ánh xạ chuyển đổi dữ liệu
3.1.2.2. Chuyển đổi CSDL (bước 3)
Công việc của bước này là chuyển đổi các ánh xạ đã được thiết lập (Hình 3.3) từ tập tin XML vào chương trình phần mềm để thực hiện chuyển đổi dữ liệu.
Hình 3.5. Giao diện phần mềm chuyển đổi dữ liệu (Nguồn: phần mềm VILIS 2.0) Với mơ hình chuẩn hóa dữ liệu và chuyển đổi dữ liệu luận văn đưa ra đã được áp dụng trực tiếp vào công tác chuyển đổi dữ liệu từ phần mềm INGCN 2009 sang phần mềm VILIS 2.0, kết quả thực tế cơ cở dữ liệu đã được đánh giá tại Chương 2.