XÂY DỰNG MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN CHO HỆ THỐNG THÔNG TIN ĐẤT ĐAI CẤP TỈNH VÀ GIẢI PHÁP ĐỒNG BỘ HÓA CƠ SỞ DỮ LIỆU TRÊN ORACLE BUILDING A DISTRIBUTED DATABASE MODEL FOR LAND INFORM
Trang 1XÂY DỰNG MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN CHO
HỆ THỐNG THÔNG TIN ĐẤT ĐAI CẤP TỈNH VÀ GIẢI PHÁP
ĐỒNG BỘ HÓA CƠ SỞ DỮ LIỆU TRÊN ORACLE
(BUILDING A DISTRIBUTED DATABASE MODEL FOR LAND INFORMATION SYSTEM AND SOLUTIONS SYNCHRONIZE DATABASE ON ORACLE)
Bùi Văn Dũng Trung tâm Công nghệ Thông tin, Sở Tài nguyên và Môi trường Đồng Nai
Abstract: Building a modern information system to satisfy the government targets in land
management is on of the first priority nowadays However, the most difficult point now is synchronous all of database between levels of management because land information system is
a huge system, management of decentralized and distributed many places From that actual situation, this the article finds out about making a distributed database model for land information system and put forward a solution about technology of synchronic database on Oracle The result will be experimented on land information system of Dongnai province
Keywords: Land information system, distributed database model, Oracle, Dongnai province
1 ĐẶT VẤN ĐỀ
Trong những năm qua, ngành Tài nguyên và Môi trường không ngừng nổ lực trong việc xây dựng một hệ thống thông tin hiện đại nhằm đáp ứng các mục tiêu quản lý Nhà nước về đất đai theo hướng xây dựng Chính phủ điện tử và thực hiện chủ trương kinh tế hóa của ngành Kết quả có nhiều hệ thống thông tin đất đai được nhiều đơn vị trong nước nghiên cứu xây dựng, các hệ thống cơ bản đều được xây dựng và hoàn thiện trên cơ sở luật hiện hành Tuy nhiên, các hệ thống thông tin đất đai hiện tại chỉ chú trọng vào việc thiết kế cơ sở dữ liệu (CSDL) theo mô hình tập trung, trong khi đó công tác quản lý đất đai lại phân cấp quản lý, cập nhật thông tin Hơn nữa, CSDL đất đai ngoài các dữ liệu thuộc tính còn có cả dữ liệu không gian thường được cập nhật chỉnh lý thường xuyên nên với mô hình CSDL tập trung sẽ gặp rất nhiều khó khăn về vấn đề máy chủ, băng thông đường truyền, tính sẵn sàng của hệ thống Do đó, các hệ thống thông tin đất đai hiện nay thường được triển khai độc lập ở các đơn vị hành chính, CSDL cấp huyện không gắn kết với CSDL cấp tỉnh dẫn đến tình trạng các kho dữ liệu rời rạc, thiếu đồng bộ lẫn nhau Để khắc phục những hạn chế này cần phải xây dựng mô hình CSDL đất đai phù hợp với yêu cầu quản lý của ngành, đồng thời đề xuất giải pháp về kỹ thuật đồng bộ cơ sơ dữ liệu giữa hai cấp huyện, tỉnh góp phần nâng cao hiệu quả trong việc ứng dụng công nghệ thông tin trong công tác quản lý nhà nước về đất đai Trong phạm vi bài báo này, chúng tôi giới thiệu tổng quản về CSDL phân tán; ứng dụng để xây dựng mô hình CSDL phân tán cho hệ thống thông tin đất đai cấp tỉnh và đề xuất giải pháp đồng bộ CSDL trên hệ quản trị CSDL Oracle
2 TỔNG QUAN VỀ CSDL PHÂN TÁN
2.1 Các khái niệm về CSDL phân tán
CSDL phân tán (Distributed DataBase - DDB) là một tập hợp nhiều CSDL có liên đới
logic và được phân bố trên một mạng máy tính Trong khái niệm này có hai thuật ngữ quan trọng trong các định nghĩa này là “liên đới logic” và “phân bố trên một mạng máy tính”
Trang 2- Liên đới logic: Toàn bộ dữ liệu của CSDL phân tán có một số các thuộc tính ràng buộc
chúng với nhau, điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp CSDL cục bộ hoặc các tập tin lưu trữ tại các vị trí khác nhau trong một mạng máy tính
- Phân bố trên một mạng máy tính: Toàn bộ dữ liệu của CSDL phân tán không được lưu
trữ ở một nơi mà lưu trữ trên nhiều trạm thuộc mạng máy tính, điều này giúp chúng ta phân biệt CSDL phân tán với CSDL tập trung đơn lẻ
Hệ quản trị CSDL phân tán (Distributed Database Management System D-DBMS)
được định nghĩa là một hệ thống phần mềm cho phép quản lý các hệ CSDL phân tán và làm cho sự phân tán trở nên “trong suốt” đối với người sử dụng
Hệ CSDL phân tán (Distributed DataBase System - DDBS) được xây dựng dựa trên hai
công nghệ cơ bản là CSDL và mạng máy tính Một hệ CSDL phân tán không phải là một “tập hợp các tập tin” được lưu trữ riêng rẽ tại mỗi nút của một mạng máy tính Để tạo ra một hệ CSDL phân tán các tập tin không chỉ có liên đới logic mà chúng còn phải có cấu trúc và được truy xuất qua một giao diện chung
Hình 1: Mô hình hệ CSDL phân tán
Hệ CSDL phân tán không thuần nhất: các CSDL cục bộ ở các nơi (Site) không dùng
chung một hệ quản trị CSDL
Hệ CSDL phân tán thuần nhất: các CSDL cục bộ ở tất cả các nơi (Site) đều dùng
chung một hệ quản trị CSDL Trong bài báo này chỉ đề cập đến hệ CSDL phân tán thuần nhất với hệ quản trị CSDL Oracle
2.2 Kiến trúc cơ bản của CSDL phân tán
Kiến trúc này không biểu diễn tường minh cho mọi hệ cơ sở dữ liệu phân tán Tuy nhiên, với kiến trúc này các mức của CSDLPT được trình bày mang tính khái niệm thích hợp
để dễ hiểu về tổ chức của các cơ sở dữ liệu phân tán nói chung
Trang 3- Sơ đồ tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL phân tán
Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của các tập quan hệ tổng thể
- Sơ đồ phân đoạn: Mỗi quan hệ tổng thể có thể chia thành một vài phần không gối lên
nhau được gọi là đoạn (fragments) Có nhiều cách khác nhau để thực hiện việc phân chia này Ánh xạ (một - nhiều) giữa sơ đồ tổng thể và các đoạn được định nghĩa trong sơ đồ phân đoạn
- Sơ đồ định vị: Các đoạn là các phần logic của quan hệ tổng thể được định vị vật lý trên
một hoặc nhiều vị trí trên mạng Sơ đồ định vị định nghĩa đoạn nào định vị tại các vị trí nào Lưu ý rằng kiểu ánh xạ được định nghĩa trong sơ đồ định vị quyết định CSDL phân tán là dư thừa hay không
- Sơ đồ ánh xạ địa phương: ánh xạ các ảnh vật lý và các đối tượng được lưu trữ tại một
trạm (tất cả các đoạn của một quan hệ tổng thể trên cùng một vị trí tạo ra một ảnh vật lý)
Hình 2: Các mức trong suốt phân tán
2.3 Các lý do để sử dụng CSDL phân tán?
- Các tổ chức có cấu trúc phân tán: Trong thực tế có nhiều tổ chức được phân tán khắp nơi, trong khi đó, dữ liệu quản lý ngày càng lớn và phục vụ cho đa người dùng nằm phân tán,
vì vậy CSDL phân tán là con đường thích hợp với cấu trúc tự nhiên của các tổ chức đó
- Cần kết nối các CSDL có sẵn: CSDL phân tán là giải pháp tự nhiên khi có các CSDL đang tồn tại và sự cần thiết xây dựng một ứng dụng toàn cục Trong trường hợp này CSDL phân tán được tạo theo tiến trình từ dưới lên dựa trên nền tảng CSDL đang tồn tại Tiến trình này đòi hỏi phải tái cấu trúc các CSDL cục bộ ở một mức nhất định
- Sự lớn mạnh của tổ chức: Các tổ chức có thể phát triển mở rộng bằng cách thành lập thêm các đơn vị mới, vừa có tính tự trị, vừa có quan hệ với các đơn vị tổ chức khác
- Giảm chi phí truyền thông: Tăng ứng dụng cục bộ làm giảm chi phí truyền thông
- Nâng cao hiệu suất: Có cơ chế xử lý song song và phân mảnh dữ liệu theo ứng dụng làm cực đại hóa tính cục bộ của ứng dụng
Trang 4-Tăng độ tin cậy và tính sẵn sàng: Nếu có một thành phần nào đó của hệ thống bị hỏng,
hệ thống vẫn có thể duy trì hoạt động
3 XÂY MÔ HÌNH CSDL PHÂN TÁN CHO HỆ THỐNG THÔNG TIN ĐẤT ĐAI
3.1 Lựa chọn mô hình kiến trúc của hệ quản trị CSDL phân tán
Có nhiều mô hình kiến trúc của hệ CSDL phân tán như: hệ khách/chủ (client/server), ngang hàng và phức hợp Tuy nhiên, với mô hình hệ phân tán khách/chủ có nhiều ưu điểm vược trội là xử lý dữ liệu tập trung, phần lớn việc xử lý dữ liệu được thực hiện trên server Điều này có nghĩa là tất cả mọi việc xử lý và tối ưu hoá vấn tin, quản lý giao dịch được thực hiện tại server, trên đường truyền chỉ có các gói tin yêu cầu và kết quả đáp ứng yêu cầu, như vậy sẽ giảm khối lượng truyền tin trên mạng, tăng tốc độ xử lý dữ liệu của hệ thống CSDL đất đai là một CSDL lớn phức tạp, bao gồm cả dữ liệu không gian và phi không gian nên việc lựa chọn mô hình kiến trúc của hệ quản trị CSDL phân tán client/server là phù hợp
Hình 3: Mô hình kiến trúc của hệ quản trị CSDl phân tán client/server
Mô hình chia thành hai lớp: chức năng đại lý (server function) và chức năng khách hàng (client function) Nó cung cấp kiến trúc hai cấp, tạo dễ dàng cho việc quản lý mức độ phức tạp của các hệ quản trị CSDL hiện đại và độ phức tạp của việc phân tán dữ liệu
3.2 Lựa chọn phương pháp phân tán
CSDL đất đai sẽ được lựa chọn phương pháp phân tán partition, nghĩa là việc thực hiện phân chia bảng dữ liệu của quan hệ tổng thể thành các bảng dữ liệu độc lập nhưng có cấu trúc
giống hệt nhau, sau đó định vị chúng vào các vị trí thích hợp
Phương pháp partition sử dụng kỹ thuật phân mãnh ngang cơ sở trong quá trình phân tán dữ liệu Các CSDL từ xa kết nối và đồng bộ với nhau thông qua databaselink Mọi thay đổi CSDL tại các chi nhánh sẽ được đồng bộ về Trung tâm Như vậy, các chi nhánh thường
Trang 5tâm cũng sẽ được đồng bộ về các chi nhánh Khi đó trung tâm đóng vai trò là vị trí chủ còn chi nhánh đóng vai trò là vị trí ảnh
3.3 Xây dựng mô hình CSDL phân tán cho hệ thống thông tin đất đai
CSDL đất đai chứa thông tin chi tiết đến từng thửa đất (bao gồm dữ liệu thuộc tính và
dữ liệu không gian), thông tin này được sử dụng phục vụ quản lý đất đai ở các cấp tỉnh, thành phố trực thuộc trung ương, cấp huyện, thị xã và cấp xã phường, thị trấn (gọi tắt là cấp tỉnh, huyện và xã)
Hệ thống CSDL liệu đất đai cấp tỉnh được thiết kế phân mãnh ngang theo đơn vị hành chính cấp huyện và tổ chức phân tán CSDL ở hai cấp tỉnh, huyện Mỗi huyện sẽ có một CSDL chứa toàn bộ dữ liệu thuộc phạm vi của huyện và vận hành độc lập; CSDL cấp huyện đặt tại Văn phòng Đăng ký quyền sử dụng đất cấp huyện, phục vụ tác nghiệp cho Văn phòng Đăng ký quyền sử dụng đất, phòng Tài nguyên và Môi trường cấp huyện CSDL cấp tỉnh chứa toàn bộ CSDL đất đai các huyện; CSDL cấp tỉnh đặt tại Sở Tài nguyên và Môi trường, phục vụ tác nghiệp cho Văn phòng Đăng ký quyền sử dụng đất tỉnh, Chi cục Quản lý Đất đai, Trung tâm Công nghệ thông tin CSDL cấp tỉnh và huyện phải có cơ chế đồng bộ trực tuyến hai chiều qua hệ thống mạng WAN
Cán bộ địa chính cấp phường, xã và nhân dân sẽ thông qua Internet để tra cứu thông tin đất đai qua hệ thống CSDL cấp tỉnh đặt tại Sở Tài nguyên và Môi trường
Hình 4: Mô hình CSDL phân tán của hệ thống thông tin đất đai
4 GIẢI PHÁP ĐỒNG BỘ CSDL PHÂN TÁN
Hệ CSDL phân tán có rất nhiều ưu điểm, tuy nhiên một trong những khuyết điểm lớn nhất là các vấn đề đồng bộ dữ liệu Việc điều khiển phân tán có thể trở thành một gánh nặng nếu không có những giải pháp phù hợp để giải quyết vấn đề này
Trang 6CSDL đất đai thuộc dạng CSDL lớn, phức tạp, trong đó có cả dữ liệu không gian và được phân tán ở nhiều nơi với khoản cách địa lý khác nhau Việc giải quyết bài toán đồng bộ trước đây thường sử dụng giải pháp trích xuất và nhập liệu một cách thủ công hoặc theo một
số mô đun chuyên biệt phát triển trong phần mềm quản lý đất đai hay có thể sử dụng công cụ
có sẵn của Oracle như Import/export Tuy nhiên, với giải pháp này thường gây tổn thương đến CSDL được đồng bộ Hiện nay có rất nhiều giải pháp đồng bộ CSDL khác nhau được phát triển từ các hảng phần mềm nổi tiếng như: Streams, Advanced Replication, Advanced Queues, Golden Gate của Oracle; IBM Websphere MQ của IBM…, mỗi loại điều có những
ưu, nhược điểm riêng Trong phạm vi bài báo này sẽ giới thiệu kỹ thuật đồng bộ CSDL đất
đai bằng Streams của Oracle
Streams là giải pháp phù hợp với mô hình CSDL đất đai CSDL cấp huyện và cấp tỉnh
sẽ đồng bộ trực tuyến với độ trễ có thể nói là thấp nhất Các CSDL sẽ được đồng bộ hai chiều lẫn nhau dựa trên DML (Data Manipulation Language), DDL (Data Definition Language) capture và apply procedure của hệ thống Nghĩa là mọi thay đổi dữ liệu từ CSDL cấp tỉnh ngay lập tức sẽ được cập nhật lên CSDL cấp huyện và ngược lại
Streams cung cấp ba module để thực hiện quá trình đồng bộ gồm: capture, propagation
và apply Quá trình capture xảy ra ở CSDL dự định sẽ chuyển dữ liệu đồng bộ Chúng capture các DML hay DDL query đưa vào một hàng đợi và bộ phận propagation chịu trách nhiệm chuyển các DML và DDL này đến máy đích Ở máy đích quá trình tiếp nhận các query từ propagation cũng được đưa vào một hàng đợi (streams_queue) và từ đây quá trình apply sẽ thực thi các câu lệnh query trên máy đích Sau đây là mô hình đồng bộ CSDL bằng công nghệ Streams do Oracle cung cấp
Trang 7Việc cấu hình đồng bộ CSDL phân tán sẽ được hướng dẫn cụ thể ở tài liệu “Oracle
Streams Concepts and Administration, 11g Release” do Oracle cung cấp trên website
http://www.oracle-base.com/articles/11g
5 KẾT QUẢ THỰC NGHIỆM TẠI ĐỒNG NAI
Mô hình này đã được ứng dụng triển khai cho hệ thống thông tin đất đai tại Đồng Nai
Hệ thống này được sở Tài nguyên và Môi trường Đồng Nai phát triển trên nền tảng công nghệ .NET, với hệ thống CSDL phân tán thuần nhất của Oracle và dữ liệu không gian trên công nghệ của ESRI Kiến trúc hệ thống hoạt động theo mô hình khách-chủ (Client-Server) Hiện
hệ thống đang được vận hành hiệu quả ở hai cấp: tỉnh (Chi cục Quản lý Đất đai, Văn phòng Đăng ký quyền sử dụng đất tỉnh, Trung tâm Công nghệ Thông tin), huyện (Văn phòng Đăng
ký quyền sử dụng đất của 11/11 huyện) thông qua 02 hệ thống mạng là mạng LAN và mạng riêng ảo - MEGA WAN
Thông qua hệ thống, toàn bộ CSDL quản lý đất đai được thống nhất trên toàn tỉnh góp phần nâng cao hiệu quả trong công tác quản lý nhà nước về đất đai như: đăng ký cấp giấy chứng nhận quyền sử dụng đất; cập nhật, chỉnh lý biến động; thống kê, tổng hợp, hỗ trợ ra quyết định cho các cấp Lãnh đạo
Dưới đây là một vài hình ảnh về hệ thống thông tin đất đai được ứng dụng tại Đồng Nai:
Hình 6: Chức năng đăng nhập hệ thống
Với CSDL phân tán, người sử dụng lựa chọn đăng nhập vào đơn vị hành chính để quản
lý mà không cần biết vị trí vật lý của CSDL Việc đăng nhập sẽ được tự động thực hiện bởi hệ thống tại điểm đưa ra yêu cầu của người sử dụng Việc chuyển đổi của một phần hay toàn bộ CSDL do thay đổi về Server cũng không ảnh hưởng tới thao tác người sử dụng
Trang 8Hình 7: Giao diện chính của hệ thống thông tin đất đai
6 KẾT LUẬN
Qua việc nghiên cứu, tìm hiểu về mô hình CSDL phân tán cho thấy đây là giải pháp rất hiệu quả để tổ chức quản lý và triển khai các hệ thống thông tin lớn, phân tán về địa lý trong môi trường ứng dụng CNTT Nghiên cứu mô hình CSDL phân tán nhằm khắc phục những hạn chế của CSDL tập trung truyền thống Việc ứng dụng mô hình CSDL phân tán cho hệ thống thông tin đất đai cấp tỉnh sẽ đem lại hiệu quả thiết thực cho công tác quản lý nhà nước
về đất đai, đặt biệt là vấn đề đồng bộ dữ liệu quản lý giữa các cấp
Tài liệu tham khảo
[1] Trần Đức Quang, 1999 Nguyên lý các hệ cơ sở dữ liệu phân tán, Tập 1 (Biên dịch từ Principles of
Distributed Database Systems của M Tamer và Patrick Valduriez), Nxb Thống kê, TP.HCM
[2] Nguyễn Bá Tường, 2004 Nhập môn CSDL phân tán, NXBKH&KT
[3] Randy Urbano, 2007 Oracle Streams Concepts and Administration, 11g Release 1 (11.1)