1. Trang chủ
  2. » Luận Văn - Báo Cáo

TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO PHÂN TÁN DỮ LIỆU VỚI GEODATABASE

12 345 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân tán dữ liệu với geodatabase
Tác giả Hồ Trung Nguyên, Nguyễn Thị Hạnh
Chuyên ngành Cơ Sở Dữ Liệu Nâng Cao
Thể loại Báo cáo đề tài
Định dạng
Số trang 12
Dung lượng 514 KB

Nội dung

- Về tính năng của phần mềm:  Liên kết thống nhất thông tin  Mô hình ứng dụng đa cấp  Hệ thống biểu mẫu báo cáo số liệu đa dạng  Thực hiện báo cáo đa dạng  Gởi, nhận số liệu nhanh c

Trang 1

MỤC LỤC

I Giới thiệu về cơ sở dữ liệu phân tán 2

1 Khái niệm 2

2 Ưu nhược điểm của cơ sở dữ liệu phân tán 2

II Phân tán dữ liệu với Geodatabase 2

1 Giới thiệu 2

2 Kỹ thuật phân tán dữ liệu 2

III Vấn đề liên quan đến Geodatabase 3

1 Geodatbase 3

2 Gis (Geographic Information System) 3

a Tổng quan 3

b Lợi ích khi dùng GIS 4

3 Các ứng dụng của giải pháp 4

IV Các hướng nghiên cứu để giải bài toán nêu trong phần III.3 4

1 Bài toán nghiên cứu quản lý tài nguyên thiên nhiên và môi trường 4

2 Bài toán nghiên cứu điều kiện kinh tế - xã hội 5

3 Nghiên cứu hỗ trợ các chương trình quy hoạch phát triển 6

4 Trong lĩnh vực sản xuất nông nghiệp và phát triển nông thôn 6

V Đưa ra ví dụ về bài toán cụ thể 6

VI Nhận xét và đánh giá 11

Trang 2

I Giới thiệu về cơ sở dữ liệu phân tán

1 Khái niệm

Cơ sở dữ liệu phân tán (Distributed Database) là cơ sở dữ liệu được phân đoạn và được lưu trữ trên các trạm trong hệ thống mạng Hình dưới đây là một ví dụ về cơ sở dữ liệu phân tán

2 Ưu nhược điểm của cơ sở dữ liệu phân tán

- Dữ liệu gần với nơi xử lý → Hiệu

suất cao

- Tính sẵn sàng của hệ thống cao: Nếu

một trạm bị lỗi sẽ không ảnh hưởng tới

các trạm khác trong hệ thống

- Việc tăng các trạm sử dụng trong hệ

thống là đơn giản nên việc mở rộng

CSDL là dễ dàng

- Lưu trữ: Ngoài lược đồ CSDL như trong CSDL tập

trung (Thuộc tính, kiểu dữ liệu, …) còn thêm các lược đồ phân đoạn CSDL, lược đồ định vị CSDL (cho biết các đoạn được lưu trữ ở đâu)

- Xử lý: Truy vấn tập trung là đơn giản còn truy vấn phân tán phức tạp

- An toàn: CSDL được lưu trữ ở nhiều nơi nảy sinh vấn đề: đảm bảo an toàn dữ liệu khi truyền qua mạng

II Phân tán dữ liệu với Geodatabase

1 Giới thiệu

Phân tán dữ liệu liên quan đến việc tạo ra bản sao của dữ liệu và phân tán dữ liệu giữa hai hay nhiều geodatabase Để giữ các bản sao đồng bộ, phân tán dữ liệu cũng bao gồm một công cụ để áp dụng các chỉnh sửa được thực hiện cho mỗi bản sao trong tất cả các bản sao

2 Kỹ thuật phân tán dữ liệu

Một số kỹ thuật phân tán dữ liệu khác nhau đều có sẵn Việc quyết định sử dụng

kỹ thuật nào liên quan đến việc xem xét các yêu cầu của hệ thống của người dùng cũng như như những lợi ích và hạn chế của mỗi kỹ thuật Có ba kỹ thuật phân tán

Trang 3

- Nhân bản Geodatabase: Nhân bản geodatabase cho phép ta phân tán dữ liệu

qua hai hoặc nhiều geodatabase nhờ vậy mà việc sửa đổi có thể được thực hiện độc lập và đồng bộ tuần hoàn Nó đã được xây dựng trong các biện pháp bảo vệ chống lại việc mất

dữ liệu, dự phòng dữ liệu, và sự mất ổn định hệ thống Nhân bản geodatabase đòi hỏi ít nhất một phiên bản ArcSDE ® geodatabase

- Nhân bản DBMS: Geodatabase ArcSDE được xây dựng trên đầu trang của

DBMSs bao gồm công nghệ để nhân bản ở cấp cơ sở dữ liệu Giống như geodatabase khác được xây dựng trên đầu trang của những DBMSs này, có thể được sử dụng với công nghệ này Sử dụng nhân bản DBMS với geodatabase đòi hỏi kiến thức về cơ sở dữ liệu địa lý có cấu trúc được thực hiện ở cấp cơ sở dữ liệu

- Sao chép dữ liệu và các công cụ loading: Một kỹ thuật khác để phân tán dữ liệu

liên quan đến việc chỉ đơn giản là sao chép dữ liệu từ một cơ sở dữ liệu địa lý này sang một cơ sở dữ liệu địa lý khác Kỹ thuật này rất hữu ích cho các hệ thống với các yêu cầu đơn giản

III Vấn đề liên quan đến Geodatabase

1 Geodatbase

- Geodatabase là cơ sở dữ liệu địa lý, là một kho chứa dữ liệu không gian (vector, raster) và thuộc tính Geodatabase mang tính toàn vẹn dữ liệu cao

- Các thành phần của Geodatabase được lưu trữ trong hệ quản trị cơ sở dữ liệu DBMS (Database Management System - DBMS)

- Mô hình Geodatabase: là mô hình dữ liệu hướng đối tượng hỗ trợ trong việc thiết

kế, lưu trữ dữ liệu GIS thống nhất trong một hệ quản trị cơ sở dữ liệu Geodatabase có thể được ứng dụng với các mô hình ứng dụng khác nhau tùy theo kích thước dữ liệu và

số lượng người dùng Trong mô hình này, các thực thể được mô tả như các đối tượng với các thuộc tính, hành động, và các quan hệ

2 Gis (Geographic Information System)

a Tổng quan

- GIS là công cụ trợ giúp quyết định trong nhiều hoạt động kinh tế - xã hội, quốc phòng của nhiều quốc gia trên thế giới

- Hệ thống thông tin địa lý (GIS) là một tập hợp các công cụ cho việc thu thập, lưu trữ, thể hiện và chuyển đổi các dữ liệu mang tính chất không gian từ thế giới thực để giải quyết các bài toán ứng dụng phục vụ cho các mục đích cụ thể Là phương pháp để hình dung, mô phỏng, phân tích và thể hiện dữ liệu không gian

- Các thành phần của GIS: Bao gồm các mô hình 3 thành phần (phần cứng, phần mềm, con người), mô hình 4 thành phần (kỹ thuật, thông tin, tổ chức và con người), mô

Trang 4

hình 5 thành phần (phần cứng, phần mềm, con người, dữ liệu và quy trình), mô hình 6 thành phần (phần cứng, phần mềm, tổ chức, quy trình, dữ liệu, con người)

- Hệ thống thông tin địa lý (GIS) sử dụng cơ sở dữ liệu địa lý (geodatabase) làm

dữ liệu

b Lợi ích khi dùng GIS

 Là cách tiết kiệm chi phí và thời gian nhất trong việc lưu trữ số liệu

 Có thể thu nhập số liệu với số lượng lớn

 Số liệu lưu trữ có thể được cập nhật hóa một cách dễ dàng

 Chất lượng số liệu được quản lý, xử lý và hiệu chỉnh tốt

 Dễ dàng truy cập, phân tích số liệu từ nhiều nguồn và nhiều loại khác nhau

 Tổng hợp một lần được nhiều loại số liệu khác nhau để phân tích tạo ra nhanh chóng một lớp số liệu tổng hợp mới

3 Các ứng dụng của giải pháp

GIS được coi là giải pháp tốt để xây dựng các bài toán quản lý ứng dụng thực tiễn trong thế giới thực Các bài toán quản lý đó chính là nghiên cứu các ứng dụng của giải pháp cụ thể như sau:

 Nghiên cứu quản lý tài nguyên thiên nhiên và môi trường

 Nghiên cứu điều kiện kinh tế - xã hội

 Nghiên cứu hỗ trợ các chương trình quy hoạch phát triển

 Trong lĩnh vực sản xuất nông nghiệp và phát triển nông thôn

IV Các hướng nghiên cứu để giải bài toán nêu trong phần III.3

1 Bài toán nghiên cứu quản lý tài nguyên thiên nhiên và môi trường

- Hướng giải quyết bài toán này là xây dựng giải pháp phần mềm quản lý môi trường để đảm bảo áp dụng rộng rãi trong các lĩnh vực: Ủy ban Quận/Huyện, Chi cục bảo

vệ môi trường, Phòng quản lý môi trường, Phòng cảnh sát môi trường

Trang 5

- Về tính năng của giải pháp phần mềm: Đảm bảo được các chức năng và đưa ra được các báo cáo sau:

 Quản lý các điểm phát sinh ô nhiễm

 Quản lý các chỉ tiêu quan trắc của các điểm quan trắc môi trường

 Báo cáo thống kê chỉ tiêu quan trắc

 Khoanh vùng ô nhiễm

 Lập bản đồ ô nhiễm môi trường

- Về yêu cầu của hệ thống: Máy tính cấu hình cao, sử dụng hệ điều hành WINDOW SERVER AND CLIENT

- Về ưu điểm:

 Thuận tiện trong công tác quản lý, cập nhật, thống kê

 Tạo điều kiện thuận lợi cho công tác dự báo ô nhiễm

 Thuận tiện trong xác định vị trí ô nhiễm

 Giao diện sử dụng ngôn ngữ tiếng Việt và tiếng Anh

2 Bài toán nghiên cứu điều kiện kinh tế - xã hội

- Hướng giải quyết là xây dựng giải pháp phần mềm về hệ thống thông tin tổng hợp kinh tế - xã hội nhằm mục đích Quản lý - Tập hợp – Thống nhất - Chuẩn hóa – Tổng hợp số liệu về chỉ tiêu kinh tế xã hội của cả một tỉnh

- Lĩnh vực áp dụng: Kinh tế xã hội của các xã, phường, quận, huyện, tỉnh, thành phố và các đơn vị Trung Ương

- Về tính năng của phần mềm:

 Liên kết thống nhất thông tin

 Mô hình ứng dụng đa cấp

 Hệ thống biểu mẫu báo cáo số liệu đa dạng

 Thực hiện báo cáo đa dạng

 Gởi, nhận số liệu nhanh chóng và chính xác

 Khai thác thông tin hiệu quả

 Tổng hợp, tính toán linh hoạt các số liệu chỉ tiêu

 Triển khai dễ dàng và linh động

 Bảo mật an toàn thông tin

- Về yêu cầu của hệ thống: Máy tính cấu hình cao, sử dụng hệ điều hành WINDOW SERVER AND CLIENT

Trang 6

- Ưu điểm: Hỗ trợ công tác thu thập, tổng hợp số liệu về các chỉ tiêu Kinh tế - Xã hội của các cấp từ Xã Phường tới các Quận, Huyện, Tỉnh thành đến Trung Ương

 Hỗ trợ cho công tác tra cứu dựa trên kho số liệu đã thu thập được

 Hỗ trợ công tác báo cáo từ các Cơ quan cấp Xã Phường lên những cấp Cơ quan cao hơn

 Hỗ trợ trong việc thực hiện những công tác nghiệp vụ của các cán bộ chuyên môn

 Hỗ trợ tối đa cho các cấp Lãnh đạo trong công tác điều hành, định hướng và ra quyết định mang tính vĩ mô

3 Nghiên cứu hỗ trợ các chương trình quy hoạch phát triển

Hướng nghiên cứu giải quyết bài toán quy hoạch phát triển là xây dựng ứng dụng đảm bảo các yếu tố và chức năng sau:

 Đánh giá khả năng thích nghi cây trồng, vật nuôi và động vật hoang dã

 Định hướng và xác định các vùng phát triển tối ưu trong sản xuất nông nghiệp

 Hỗ trợ quy hoạch và quản lý các vùng bảo tồn thiên nhiên

 Đánh giá khả năng và định hướng quy hoạch các vùng đô thị, công nghiệp lớn

 Hỗ trợ bố trí mạng lưới y tế, giáo dục

4 Trong lĩnh vực sản xuất nông nghiệp và phát triển nông thôn

- Hướng nghiên cứu giải bài toán này là xây dụng ứng dụng GIS về các vấn đề liên quan đến sản xuất và phát triển nông thôn như: Thổ nhưỡng, trồng trọt, quy hoạch thủy văn và tưới tiêu, kinh tế nông nghiệp, phân tích khí hậu, mô hình hóa nông nghiệp, chăn nuôi gia súc gia cầm

- GIS có thể được sử dụng để theo dõi sự phát triển của cỏ dại, sâu bệnh phá hoại mùa màng, thể hiện loại đất, hạn hán, lũ lụt và rất nhiều các yếu tố khác giúp quản lý quá trình sản xuất nông, lâm nghiệp và phát triển nông thôn

V Đưa ra ví dụ về bài toán cụ thể

ỨNG DỤNG GIS TRONG QUẢN LÝ, PHÂN TÍCH VÀ TRÌNH BÀY

SỐ LIỆU THỐNG KÊ KINH TẾ - XÃ HỘI

- Số liệu thống kê kinh tế - xã hội có thể đóng góp rất lớn vào việc hoạch định chính sách, ra quyết định đúng đắn về đầu tư phát triển một lĩnh vực, ngành nghề, hay một đơn

vị hành chính Vì vậy, quản lý số liệu thống kê như thế nào để có thể cung cấp thông tin chính xác và nhanh chóng, theo các yêu cầu sử dụng khác nhau là điều rất quan trọng Với cách quản lý hiện nay thì số liệu được cung cấp dưới dạng các bảng biểu cố định Giả sử nhà quản lý muốn xếp hạng mức độ phát triển của các quận dựa trên cùng một lúc một loạt các tiêu chí quan trọng về giáo dục như: số giáo viên, số học sinh, diện tích

Trang 7

trường lớp, trang bị thí nghiệm/tin học, …, nhân viên sẽ phải mất rất nhiều thời gian để tìm kiếm và tổng hợp thông tin từ rất nhiều bảng biểu Bài báo này trình bày một công cụ quản lý và phân tích số liệu thống kê dựa trên nền tảng GIS kết hợp mô hình lưu trữ dữ liệu theo thời gian Cơ sở dữ liệu được xây dựng theo mô hình GeodataBase, các chức năng quản lý được xây dựng sử dụng ngôn ngữ lập trình ArcObject, hoạt động trên nền của phần mềm ArcGIS Công cụ không chỉ cung cấp nhanh chóng và chính xác các phân tích dữ liệu thống kê theo bất kỳ tập hợp các tiêu chí nào mà nhà quản lý quan tâm, mà còn trình bày kết quả bằng hình ảnh trực quan vô cùng dễ hiểu và tiện lợi cho người sử dụng

- Trong ví dụ này, chúng tôi trình bày một số chức năng xây dựng cho một hệ thống như thế và minh họa việc ứng dụng GIS phục vụ nhu cầu phân tích đa tiêu chí, phân tích biến đổi theo thời gian dựa trên số liệu thống kê kinh tế xã hội của thành phố Hà Nội

1 Mô hình cơ sở dữ liệu GeoDataBase

- GeodataBase là một mô hình dữ liệu vector được giới thiệu cùng với ArcGIS, là một

cơ sở dữ liệu quan hệ chứa thông tin địa lý trong đó đối tượng được lưu trữ trong các lớp

đối tượng (feature class) và các bảng (table) Số liệu thống kê kinh tế - xã hội của thành

phố Hà Nội được tổ chức dưới dạng GeodataBase Dữ liệu gồm có 2 phần chính: dữ liệu không gian và dữ liệu thuộc tính

- Dữ liệu không gian: Là dữ liệu về ranh giới hành chính của các quận, huyện trong

thành phố Hà Nội (có tất cả 28 quận, huyện) được lưu dưới dạng các lớp đối tượng.

- Dữ liệu thuộc tính: thu thập số liệu thống kê từ các tài liệu, các trang web Dữ liệu

thuộc tính được tổ chức dưới dạng bảng.

- Dữ liệu không gian và thông tin thuộc tính liên kết với nhau thông qua một thuộc tính khóa là mã đơn vị hành chính

Dữ liệu thuộc tính chia làm 2 phần gồm:

- Số liệu thống kê hàng năm: số liệu này gồm các tiêu chí phản ảnh tình hình phát triển

kinh tế xã hội của thành phố Hà Nội Các tiêu chí này được xếp vào các nhóm như thể hiện trong bảng 1

Bảng 1: Danh sách các nhóm thông tin và chỉ tiêu tương ứng

Dân số - Lao động Dân số nam

Dân số nữ Mật độ dân số

Các chỉ tiêu tổng

hợp và mức sống

Thu ngân sách nhà nước Chi ngân sách nhà nước

Trang 8

Công nghiệp Giá trị sản xuất công nghiệp ngoài nhà nước

Giá trị sản xuất công nghiệp cá thể

Nông nghiệp

Diện tích trồng lúa Diện tích trồng rau Diện tích trồng cây công nghiệp ngắn ngày Năng suất trồng lúa

Năng suất trồng rau Năng suất trồng cây công nghiệp ngắn ngày Sản lượng lúa

Sản lượng rau Sản lượng cây công nghiệp ngắn ngày

Thương mại Cơ sở thương nghiệp, khách sạn, nhà hàng

Văn hóa – Giáo dục

Số trường mẫu giáo

Số giáo viên mẫu giáo

Số học sinh mẫu giáo

Số trường phổ thông

Số học sinh phổ thông

Số giáo viên phổ thông

Y tế

Số cơ sở y tế

Số giường bệnh

Số cán bộ y tế (bác sĩ, dược sĩ, y tá, hộ sinh…)

Văn hóa – Nghệ

thuật

Số rạp chiếu bóng

Số thư viện

Thể dục – Thể thao

Số cơ sở (sân vận động, hồ bơi…)

Số cán bộ

Số lượng vận động viên

Một số chỉ tiêu khác Số phường

Diện tích

Trang 9

- Số liệu thống kê từ các cuộc tổng điều tra dân số: thông tin thu được từ các

cuộc tổng điều tra bao gồm các chỉ tiêu như tổng số hộ; dân số, tỉ lệ dân số theo độ tuổi, tỉ lệ dân số theo trình độ học vấn, cơ cấu dân số …

- Một hệ cơ sở dữ liệu thống kê kinh tế - xã hội ngoài việc cung cấp đầy đủ các thông tin hiện tại, thì còn phải trả lời được các câu hỏi liên quan đến việc so sánh số liệu thu thập được qua nhiều năm, ví dụ như: tốc độ gia tăng dân số của năm nay so với các năm trước là bao nhiêu? diện tích đất nông nghiệp tăng hay giảm so với các năm trước ?, … Để trả lời được những câu hỏi như vậy, đòi hỏi phải lưu được dữ liệu thu thập qua nhiều năm Để giải quyết vấn đề này thì dữ liệu được tổ chức dưới dạng

như hình 1, số liệu của 1 năm sẽ được lưu trữ trong 1 bảng, sang năm mới dữ liệu mới

sẽ được thu thập và lưu vào một bảng mới, số liệu cũ sẽ trở thành dữ liệu lịch sử và vẫn được lưu giữ Với cách lưu trữ này số liệu của các năm trước sẽ không bị mất đi

và việc truy xuất dữ liệu theo thời gian sẽ trở nên dễ dàng

2 Chức năng của hệ thống

- Hệ thống được thiết kế bao gồm các chức năng chính như sau:

i Xem thông tin của từng quận, huyện: cho phép người sử dụng xem được thông tin

của từng quận, huyện theo 1 năm chọn nào đó và trong mỗi năm có thể xem thông tin theo từng nhóm và trong mỗi nhóm người sử dụng có thể xem thông tin theo 1 chỉ tiêu

nào đó Danh sách các nhóm thông tin và chỉ tiêu được minh họa như trong bảng 1.

ii Phân loại dữ liệu: chức năng này cho phép người sử dụng có thể so sánh tình hình

phát triển của các quận với nhau theo một hay nhiều tiêu chí và có thể thấy được sự phát triển này dưới dạng bản đồ

 Phân loại đơn biến: dựa vào từng tiêu chí riêng lẻ để sắp xếp sự phát triển của các

quận, huyện vào các nhóm khác nhau Sau đó thể hiện kết quả lên trên bản đồ

Hình1 : Sơ đồ cơ sở dữ liệu theo thời gian

Trang 10

 Phân loại đa biến: kết hợp nhiều tiêu chí lại với nhau để đánh giá sự phát triển của

các quận, huyện Trong thực tế cuộc sống bất kì một hiện tượng kinh tế - xã hội nào đều chịu ảnh hưởng bởi nhiều nhân tố (hay nhiều tiêu chí) cho nên việc đánh giá hay phân loại chúng đòi hỏi phải cân nhắc đồng thời nhiều tiêu chí Ví dụ như để đánh giá mức độ phát triển con người, đòi hỏi xem xét các tiêu chí như: tuổi thọ, tỷ lệ biết chữ, GDP/người, tỷ lệ dùng nước sạch…, Chức năng phân loại đa biến đã được thiết kế để cho phép so sánh sự phát triển giữa các quận thông qua nhóm các tiêu chí do người sử dụng lựa chọn, có thể là: tổng dân số, số trường mẫu giáo,… Các tiêu chí được chọn

từ bảng thuộc tính, kết quả phân nhóm được thể hiện lên bản đồ, ngoài ra chức năng này còn cho phép biết được thứ hạng phát triển của các quận, huyện Có nhiều phương pháp phân loại đa biến, tuy nhiên trong hệ thống xây dựng mới chỉ đưa vào 2 phương pháp:

iii Thể hiện số liệu bằng biểu đồ: cụ thể hóa những con số thành các loại biểu đồ hình

cột, hình tròn với màu sắc đẹp mắt Ví dụ, dùng biểu đồ hình tròn thể hiện tỷ lệ phần trăm dân số theo các độ tuổi khác nhau Các biểu đồ này được biểu diễn cùng với vị trí không gian của các đơn vị hành chính

iv Biểu diễn dữ liệu theo thời gian: qua mỗi năm số liệu lại thay đổi ngoài việc phải cập

nhật được số liệu mới để sử dụng thì việc phân tích dãy số liệu theo thời gian cũng là một vấn đề quan trọng, chức năng này giúp người sử dụng có thể xem số liệu và biểu

đồ so sánh mức độ tăng hay giảm của một tiêu chí qua các năm

v Tổng hợp số liệu: chức năng này sẽ giúp ích trong vấn đề lập báo cáo tổng kết hàng

năm, từ số liệu của các quận tính toán ra số liệu của thành phố

ÁP DỤNG

a Chức năng phân loại đa biến

- Để đánh giá mức độ phát triển về giáo dục của các quận, huyện, nhà quản lý đặt

ra một yêu cầu là nhóm các quận, huyện có đặc tính giống nhau vào các nhóm, ví dụ như nhóm có nền giáo dục phát triển mạnh, phát triển trung bình, kém phát triển dựa theo 1 số chỉ tiêu về giáo dục như: số học sinh, số giáo viên, số trường học … Với chức

Ngày đăng: 08/07/2015, 16:06

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w