- Về tính năng của phần mềm: Liên kết thống nhất thông tin Mô hình ứng dụng đa cấp Hệ thống biểu mẫu báo cáo số liệu đa dạng Thực hiện báo cáo đa dạng Gởi, nhận số liệu nhanh c
Trang 1MỤC LỤC
I Giới thiệu về cơ sở dữ liệu phân tán 2
1 Khái niệm 2
2 Ưu nhược điểm của cơ sở dữ liệu phân tán 2
II Phân tán dữ liệu với Geodatabase 2
1 Giới thiệu 2
2 Kỹ thuật phân tán dữ liệu 2
III Vấn đề liên quan đến Geodatabase 3
1 Geodatbase 3
2 Gis (Geographic Information System) 3
a Tổng quan 3
b Lợi ích khi dùng GIS 4
3 Các ứng dụng của giải pháp 4
IV Các hướng nghiên cứu để giải bài toán nêu trong phần III.3 4
1 Bài toán nghiên cứu quản lý tài nguyên thiên nhiên và môi trường 4
2 Bài toán nghiên cứu điều kiện kinh tế - xã hội 5
3 Nghiên cứu hỗ trợ các chương trình quy hoạch phát triển 6
4 Trong lĩnh vực sản xuất nông nghiệp và phát triển nông thôn 6
V Đưa ra ví dụ về bài toán cụ thể 6
VI Nhận xét và đánh giá 11
Trang 2I Giới thiệu về cơ sở dữ liệu phân tán
1 Khái niệm
Cơ sở dữ liệu phân tán (Distributed Database) là cơ sở dữ liệu được phân đoạn và được lưu trữ trên các trạm trong hệ thống mạng Hình dưới đây là một ví dụ về cơ sở dữ liệu phân tán
2 Ưu nhược điểm của cơ sở dữ liệu phân tán
- Dữ liệu gần với nơi xử lý → Hiệu
suất cao
- Tính sẵn sàng của hệ thống cao: Nếu
một trạm bị lỗi sẽ không ảnh hưởng tới
các trạm khác trong hệ thống
- Việc tăng các trạm sử dụng trong hệ
thống là đơn giản nên việc mở rộng
CSDL là dễ dàng
- Lưu trữ: Ngoài lược đồ CSDL như trong CSDL tập
trung (Thuộc tính, kiểu dữ liệu, …) còn thêm các lược đồ phân đoạn CSDL, lược đồ định vị CSDL (cho biết các đoạn được lưu trữ ở đâu)
- Xử lý: Truy vấn tập trung là đơn giản còn truy vấn phân tán phức tạp
- An toàn: CSDL được lưu trữ ở nhiều nơi nảy sinh vấn đề: đảm bảo an toàn dữ liệu khi truyền qua mạng
II Phân tán dữ liệu với Geodatabase
1 Giới thiệu
Phân tán dữ liệu liên quan đến việc tạo ra bản sao của dữ liệu và phân tán dữ liệu giữa hai hay nhiều geodatabase Để giữ các bản sao đồng bộ, phân tán dữ liệu cũng bao gồm một công cụ để áp dụng các chỉnh sửa được thực hiện cho mỗi bản sao trong tất cả các bản sao
2 Kỹ thuật phân tán dữ liệu
Một số kỹ thuật phân tán dữ liệu khác nhau đều có sẵn Việc quyết định sử dụng
kỹ thuật nào liên quan đến việc xem xét các yêu cầu của hệ thống của người dùng cũng như như những lợi ích và hạn chế của mỗi kỹ thuật Có ba kỹ thuật phân tán
Trang 3- Nhân bản Geodatabase: Nhân bản geodatabase cho phép ta phân tán dữ liệu
qua hai hoặc nhiều geodatabase nhờ vậy mà việc sửa đổi có thể được thực hiện độc lập và đồng bộ tuần hoàn Nó đã được xây dựng trong các biện pháp bảo vệ chống lại việc mất
dữ liệu, dự phòng dữ liệu, và sự mất ổn định hệ thống Nhân bản geodatabase đòi hỏi ít nhất một phiên bản ArcSDE ® geodatabase
- Nhân bản DBMS: Geodatabase ArcSDE được xây dựng trên đầu trang của
DBMSs bao gồm công nghệ để nhân bản ở cấp cơ sở dữ liệu Giống như geodatabase khác được xây dựng trên đầu trang của những DBMSs này, có thể được sử dụng với công nghệ này Sử dụng nhân bản DBMS với geodatabase đòi hỏi kiến thức về cơ sở dữ liệu địa lý có cấu trúc được thực hiện ở cấp cơ sở dữ liệu
- Sao chép dữ liệu và các công cụ loading: Một kỹ thuật khác để phân tán dữ liệu
liên quan đến việc chỉ đơn giản là sao chép dữ liệu từ một cơ sở dữ liệu địa lý này sang một cơ sở dữ liệu địa lý khác Kỹ thuật này rất hữu ích cho các hệ thống với các yêu cầu đơn giản
III Vấn đề liên quan đến Geodatabase
1 Geodatbase
- Geodatabase là cơ sở dữ liệu địa lý, là một kho chứa dữ liệu không gian (vector, raster) và thuộc tính Geodatabase mang tính toàn vẹn dữ liệu cao
- Các thành phần của Geodatabase được lưu trữ trong hệ quản trị cơ sở dữ liệu DBMS (Database Management System - DBMS)
- Mô hình Geodatabase: là mô hình dữ liệu hướng đối tượng hỗ trợ trong việc thiết
kế, lưu trữ dữ liệu GIS thống nhất trong một hệ quản trị cơ sở dữ liệu Geodatabase có thể được ứng dụng với các mô hình ứng dụng khác nhau tùy theo kích thước dữ liệu và
số lượng người dùng Trong mô hình này, các thực thể được mô tả như các đối tượng với các thuộc tính, hành động, và các quan hệ
2 Gis (Geographic Information System)
a Tổng quan
- GIS là công cụ trợ giúp quyết định trong nhiều hoạt động kinh tế - xã hội, quốc phòng của nhiều quốc gia trên thế giới
- Hệ thống thông tin địa lý (GIS) là một tập hợp các công cụ cho việc thu thập, lưu trữ, thể hiện và chuyển đổi các dữ liệu mang tính chất không gian từ thế giới thực để giải quyết các bài toán ứng dụng phục vụ cho các mục đích cụ thể Là phương pháp để hình dung, mô phỏng, phân tích và thể hiện dữ liệu không gian
- Các thành phần của GIS: Bao gồm các mô hình 3 thành phần (phần cứng, phần mềm, con người), mô hình 4 thành phần (kỹ thuật, thông tin, tổ chức và con người), mô
Trang 4hình 5 thành phần (phần cứng, phần mềm, con người, dữ liệu và quy trình), mô hình 6 thành phần (phần cứng, phần mềm, tổ chức, quy trình, dữ liệu, con người)
- Hệ thống thông tin địa lý (GIS) sử dụng cơ sở dữ liệu địa lý (geodatabase) làm
dữ liệu
b Lợi ích khi dùng GIS
Là cách tiết kiệm chi phí và thời gian nhất trong việc lưu trữ số liệu
Có thể thu nhập số liệu với số lượng lớn
Số liệu lưu trữ có thể được cập nhật hóa một cách dễ dàng
Chất lượng số liệu được quản lý, xử lý và hiệu chỉnh tốt
Dễ dàng truy cập, phân tích số liệu từ nhiều nguồn và nhiều loại khác nhau
Tổng hợp một lần được nhiều loại số liệu khác nhau để phân tích tạo ra nhanh chóng một lớp số liệu tổng hợp mới
3 Các ứng dụng của giải pháp
GIS được coi là giải pháp tốt để xây dựng các bài toán quản lý ứng dụng thực tiễn trong thế giới thực Các bài toán quản lý đó chính là nghiên cứu các ứng dụng của giải pháp cụ thể như sau:
Nghiên cứu quản lý tài nguyên thiên nhiên và môi trường
Nghiên cứu điều kiện kinh tế - xã hội
Nghiên cứu hỗ trợ các chương trình quy hoạch phát triển
Trong lĩnh vực sản xuất nông nghiệp và phát triển nông thôn
IV Các hướng nghiên cứu để giải bài toán nêu trong phần III.3
1 Bài toán nghiên cứu quản lý tài nguyên thiên nhiên và môi trường
- Hướng giải quyết bài toán này là xây dựng giải pháp phần mềm quản lý môi trường để đảm bảo áp dụng rộng rãi trong các lĩnh vực: Ủy ban Quận/Huyện, Chi cục bảo
vệ môi trường, Phòng quản lý môi trường, Phòng cảnh sát môi trường
Trang 5- Về tính năng của giải pháp phần mềm: Đảm bảo được các chức năng và đưa ra được các báo cáo sau:
Quản lý các điểm phát sinh ô nhiễm
Quản lý các chỉ tiêu quan trắc của các điểm quan trắc môi trường
Báo cáo thống kê chỉ tiêu quan trắc
Khoanh vùng ô nhiễm
Lập bản đồ ô nhiễm môi trường
- Về yêu cầu của hệ thống: Máy tính cấu hình cao, sử dụng hệ điều hành WINDOW SERVER AND CLIENT
- Về ưu điểm:
Thuận tiện trong công tác quản lý, cập nhật, thống kê
Tạo điều kiện thuận lợi cho công tác dự báo ô nhiễm
Thuận tiện trong xác định vị trí ô nhiễm
Giao diện sử dụng ngôn ngữ tiếng Việt và tiếng Anh
2 Bài toán nghiên cứu điều kiện kinh tế - xã hội
- Hướng giải quyết là xây dựng giải pháp phần mềm về hệ thống thông tin tổng hợp kinh tế - xã hội nhằm mục đích Quản lý - Tập hợp – Thống nhất - Chuẩn hóa – Tổng hợp số liệu về chỉ tiêu kinh tế xã hội của cả một tỉnh
- Lĩnh vực áp dụng: Kinh tế xã hội của các xã, phường, quận, huyện, tỉnh, thành phố và các đơn vị Trung Ương
- Về tính năng của phần mềm:
Liên kết thống nhất thông tin
Mô hình ứng dụng đa cấp
Hệ thống biểu mẫu báo cáo số liệu đa dạng
Thực hiện báo cáo đa dạng
Gởi, nhận số liệu nhanh chóng và chính xác
Khai thác thông tin hiệu quả
Tổng hợp, tính toán linh hoạt các số liệu chỉ tiêu
Triển khai dễ dàng và linh động
Bảo mật an toàn thông tin
- Về yêu cầu của hệ thống: Máy tính cấu hình cao, sử dụng hệ điều hành WINDOW SERVER AND CLIENT
Trang 6- Ưu điểm: Hỗ trợ công tác thu thập, tổng hợp số liệu về các chỉ tiêu Kinh tế - Xã hội của các cấp từ Xã Phường tới các Quận, Huyện, Tỉnh thành đến Trung Ương
Hỗ trợ cho công tác tra cứu dựa trên kho số liệu đã thu thập được
Hỗ trợ công tác báo cáo từ các Cơ quan cấp Xã Phường lên những cấp Cơ quan cao hơn
Hỗ trợ trong việc thực hiện những công tác nghiệp vụ của các cán bộ chuyên môn
Hỗ trợ tối đa cho các cấp Lãnh đạo trong công tác điều hành, định hướng và ra quyết định mang tính vĩ mô
3 Nghiên cứu hỗ trợ các chương trình quy hoạch phát triển
Hướng nghiên cứu giải quyết bài toán quy hoạch phát triển là xây dựng ứng dụng đảm bảo các yếu tố và chức năng sau:
Đánh giá khả năng thích nghi cây trồng, vật nuôi và động vật hoang dã
Định hướng và xác định các vùng phát triển tối ưu trong sản xuất nông nghiệp
Hỗ trợ quy hoạch và quản lý các vùng bảo tồn thiên nhiên
Đánh giá khả năng và định hướng quy hoạch các vùng đô thị, công nghiệp lớn
Hỗ trợ bố trí mạng lưới y tế, giáo dục
4 Trong lĩnh vực sản xuất nông nghiệp và phát triển nông thôn
- Hướng nghiên cứu giải bài toán này là xây dụng ứng dụng GIS về các vấn đề liên quan đến sản xuất và phát triển nông thôn như: Thổ nhưỡng, trồng trọt, quy hoạch thủy văn và tưới tiêu, kinh tế nông nghiệp, phân tích khí hậu, mô hình hóa nông nghiệp, chăn nuôi gia súc gia cầm
- GIS có thể được sử dụng để theo dõi sự phát triển của cỏ dại, sâu bệnh phá hoại mùa màng, thể hiện loại đất, hạn hán, lũ lụt và rất nhiều các yếu tố khác giúp quản lý quá trình sản xuất nông, lâm nghiệp và phát triển nông thôn
V Đưa ra ví dụ về bài toán cụ thể
ỨNG DỤNG GIS TRONG QUẢN LÝ, PHÂN TÍCH VÀ TRÌNH BÀY
SỐ LIỆU THỐNG KÊ KINH TẾ - XÃ HỘI
- Số liệu thống kê kinh tế - xã hội có thể đóng góp rất lớn vào việc hoạch định chính sách, ra quyết định đúng đắn về đầu tư phát triển một lĩnh vực, ngành nghề, hay một đơn
vị hành chính Vì vậy, quản lý số liệu thống kê như thế nào để có thể cung cấp thông tin chính xác và nhanh chóng, theo các yêu cầu sử dụng khác nhau là điều rất quan trọng Với cách quản lý hiện nay thì số liệu được cung cấp dưới dạng các bảng biểu cố định Giả sử nhà quản lý muốn xếp hạng mức độ phát triển của các quận dựa trên cùng một lúc một loạt các tiêu chí quan trọng về giáo dục như: số giáo viên, số học sinh, diện tích
Trang 7trường lớp, trang bị thí nghiệm/tin học, …, nhân viên sẽ phải mất rất nhiều thời gian để tìm kiếm và tổng hợp thông tin từ rất nhiều bảng biểu Bài báo này trình bày một công cụ quản lý và phân tích số liệu thống kê dựa trên nền tảng GIS kết hợp mô hình lưu trữ dữ liệu theo thời gian Cơ sở dữ liệu được xây dựng theo mô hình GeodataBase, các chức năng quản lý được xây dựng sử dụng ngôn ngữ lập trình ArcObject, hoạt động trên nền của phần mềm ArcGIS Công cụ không chỉ cung cấp nhanh chóng và chính xác các phân tích dữ liệu thống kê theo bất kỳ tập hợp các tiêu chí nào mà nhà quản lý quan tâm, mà còn trình bày kết quả bằng hình ảnh trực quan vô cùng dễ hiểu và tiện lợi cho người sử dụng
- Trong ví dụ này, chúng tôi trình bày một số chức năng xây dựng cho một hệ thống như thế và minh họa việc ứng dụng GIS phục vụ nhu cầu phân tích đa tiêu chí, phân tích biến đổi theo thời gian dựa trên số liệu thống kê kinh tế xã hội của thành phố Hà Nội
1 Mô hình cơ sở dữ liệu GeoDataBase
- GeodataBase là một mô hình dữ liệu vector được giới thiệu cùng với ArcGIS, là một
cơ sở dữ liệu quan hệ chứa thông tin địa lý trong đó đối tượng được lưu trữ trong các lớp
đối tượng (feature class) và các bảng (table) Số liệu thống kê kinh tế - xã hội của thành
phố Hà Nội được tổ chức dưới dạng GeodataBase Dữ liệu gồm có 2 phần chính: dữ liệu không gian và dữ liệu thuộc tính
- Dữ liệu không gian: Là dữ liệu về ranh giới hành chính của các quận, huyện trong
thành phố Hà Nội (có tất cả 28 quận, huyện) được lưu dưới dạng các lớp đối tượng.
- Dữ liệu thuộc tính: thu thập số liệu thống kê từ các tài liệu, các trang web Dữ liệu
thuộc tính được tổ chức dưới dạng bảng.
- Dữ liệu không gian và thông tin thuộc tính liên kết với nhau thông qua một thuộc tính khóa là mã đơn vị hành chính
Dữ liệu thuộc tính chia làm 2 phần gồm:
- Số liệu thống kê hàng năm: số liệu này gồm các tiêu chí phản ảnh tình hình phát triển
kinh tế xã hội của thành phố Hà Nội Các tiêu chí này được xếp vào các nhóm như thể hiện trong bảng 1
Bảng 1: Danh sách các nhóm thông tin và chỉ tiêu tương ứng
Dân số - Lao động Dân số nam
Dân số nữ Mật độ dân số
Các chỉ tiêu tổng
hợp và mức sống
Thu ngân sách nhà nước Chi ngân sách nhà nước
Trang 8Công nghiệp Giá trị sản xuất công nghiệp ngoài nhà nước
Giá trị sản xuất công nghiệp cá thể
Nông nghiệp
Diện tích trồng lúa Diện tích trồng rau Diện tích trồng cây công nghiệp ngắn ngày Năng suất trồng lúa
Năng suất trồng rau Năng suất trồng cây công nghiệp ngắn ngày Sản lượng lúa
Sản lượng rau Sản lượng cây công nghiệp ngắn ngày
Thương mại Cơ sở thương nghiệp, khách sạn, nhà hàng
Văn hóa – Giáo dục
Số trường mẫu giáo
Số giáo viên mẫu giáo
Số học sinh mẫu giáo
Số trường phổ thông
Số học sinh phổ thông
Số giáo viên phổ thông
Y tế
Số cơ sở y tế
Số giường bệnh
Số cán bộ y tế (bác sĩ, dược sĩ, y tá, hộ sinh…)
Văn hóa – Nghệ
thuật
Số rạp chiếu bóng
Số thư viện
Thể dục – Thể thao
Số cơ sở (sân vận động, hồ bơi…)
Số cán bộ
Số lượng vận động viên
Một số chỉ tiêu khác Số phường
Diện tích
Trang 9- Số liệu thống kê từ các cuộc tổng điều tra dân số: thông tin thu được từ các
cuộc tổng điều tra bao gồm các chỉ tiêu như tổng số hộ; dân số, tỉ lệ dân số theo độ tuổi, tỉ lệ dân số theo trình độ học vấn, cơ cấu dân số …
- Một hệ cơ sở dữ liệu thống kê kinh tế - xã hội ngoài việc cung cấp đầy đủ các thông tin hiện tại, thì còn phải trả lời được các câu hỏi liên quan đến việc so sánh số liệu thu thập được qua nhiều năm, ví dụ như: tốc độ gia tăng dân số của năm nay so với các năm trước là bao nhiêu? diện tích đất nông nghiệp tăng hay giảm so với các năm trước ?, … Để trả lời được những câu hỏi như vậy, đòi hỏi phải lưu được dữ liệu thu thập qua nhiều năm Để giải quyết vấn đề này thì dữ liệu được tổ chức dưới dạng
như hình 1, số liệu của 1 năm sẽ được lưu trữ trong 1 bảng, sang năm mới dữ liệu mới
sẽ được thu thập và lưu vào một bảng mới, số liệu cũ sẽ trở thành dữ liệu lịch sử và vẫn được lưu giữ Với cách lưu trữ này số liệu của các năm trước sẽ không bị mất đi
và việc truy xuất dữ liệu theo thời gian sẽ trở nên dễ dàng
2 Chức năng của hệ thống
- Hệ thống được thiết kế bao gồm các chức năng chính như sau:
i Xem thông tin của từng quận, huyện: cho phép người sử dụng xem được thông tin
của từng quận, huyện theo 1 năm chọn nào đó và trong mỗi năm có thể xem thông tin theo từng nhóm và trong mỗi nhóm người sử dụng có thể xem thông tin theo 1 chỉ tiêu
nào đó Danh sách các nhóm thông tin và chỉ tiêu được minh họa như trong bảng 1.
ii Phân loại dữ liệu: chức năng này cho phép người sử dụng có thể so sánh tình hình
phát triển của các quận với nhau theo một hay nhiều tiêu chí và có thể thấy được sự phát triển này dưới dạng bản đồ
Phân loại đơn biến: dựa vào từng tiêu chí riêng lẻ để sắp xếp sự phát triển của các
quận, huyện vào các nhóm khác nhau Sau đó thể hiện kết quả lên trên bản đồ
Hình1 : Sơ đồ cơ sở dữ liệu theo thời gian
Trang 10 Phân loại đa biến: kết hợp nhiều tiêu chí lại với nhau để đánh giá sự phát triển của
các quận, huyện Trong thực tế cuộc sống bất kì một hiện tượng kinh tế - xã hội nào đều chịu ảnh hưởng bởi nhiều nhân tố (hay nhiều tiêu chí) cho nên việc đánh giá hay phân loại chúng đòi hỏi phải cân nhắc đồng thời nhiều tiêu chí Ví dụ như để đánh giá mức độ phát triển con người, đòi hỏi xem xét các tiêu chí như: tuổi thọ, tỷ lệ biết chữ, GDP/người, tỷ lệ dùng nước sạch…, Chức năng phân loại đa biến đã được thiết kế để cho phép so sánh sự phát triển giữa các quận thông qua nhóm các tiêu chí do người sử dụng lựa chọn, có thể là: tổng dân số, số trường mẫu giáo,… Các tiêu chí được chọn
từ bảng thuộc tính, kết quả phân nhóm được thể hiện lên bản đồ, ngoài ra chức năng này còn cho phép biết được thứ hạng phát triển của các quận, huyện Có nhiều phương pháp phân loại đa biến, tuy nhiên trong hệ thống xây dựng mới chỉ đưa vào 2 phương pháp:
iii Thể hiện số liệu bằng biểu đồ: cụ thể hóa những con số thành các loại biểu đồ hình
cột, hình tròn với màu sắc đẹp mắt Ví dụ, dùng biểu đồ hình tròn thể hiện tỷ lệ phần trăm dân số theo các độ tuổi khác nhau Các biểu đồ này được biểu diễn cùng với vị trí không gian của các đơn vị hành chính
iv Biểu diễn dữ liệu theo thời gian: qua mỗi năm số liệu lại thay đổi ngoài việc phải cập
nhật được số liệu mới để sử dụng thì việc phân tích dãy số liệu theo thời gian cũng là một vấn đề quan trọng, chức năng này giúp người sử dụng có thể xem số liệu và biểu
đồ so sánh mức độ tăng hay giảm của một tiêu chí qua các năm
v Tổng hợp số liệu: chức năng này sẽ giúp ích trong vấn đề lập báo cáo tổng kết hàng
năm, từ số liệu của các quận tính toán ra số liệu của thành phố
ÁP DỤNG
a Chức năng phân loại đa biến
- Để đánh giá mức độ phát triển về giáo dục của các quận, huyện, nhà quản lý đặt
ra một yêu cầu là nhóm các quận, huyện có đặc tính giống nhau vào các nhóm, ví dụ như nhóm có nền giáo dục phát triển mạnh, phát triển trung bình, kém phát triển dựa theo 1 số chỉ tiêu về giáo dục như: số học sinh, số giáo viên, số trường học … Với chức