I. TỔNG QUAN VỀ HỆ THỐNG ĐỊA LÝ THÔNG TIN GIS. 1. Khái niệm. Theo ESRI, tập đoàn nghiên cứu và phát triển các phần mềm GIS nổi tiếng, Hệ thông tin địa lý (GIS – Geographic Information System) là một tập hợp có tổ chức, bao gồm hệ thống phần cứng, phần mềm máy tính, dữ liệu địa lý và con người, được thiết kế nhằm mục đích nắm bắt, lưu trữ, cập nhật, điều khiển, phân tích, và hiển thị tất cả các dạng thông tin liên quan đến vị trí địa lý. 2. Tổng quan về hệ thống thông tin địa lý GIS. – Phần cứng: bao gồm máy tính và các thiết bị ngoại vi. – Phần mềm: là bộ não của hệ thống, phần mềm GIS rất đa dạng và có thể chia làm 3 nhóm (nhóm phần mềm quản đồ họa, nhóm phần mềm quản trị bản đồ và nhóm phần mềm quản trị, phân tích không gian). – Dữ liệu: bao gồm dữ liệu không gian (dữ liệu bản đồ) và dữ liệu thuộc tính (dữ liệu phi không gian). Dữ liệu không gian miêu tả vị trí địa lý của đối tượng trên bề mặt Trái đất. Dữ liệu thuộc tính miêu tả các thông tin liên quan đến đối tượng, các thông tin này có thể được định lượng hay định tính. – Phương pháp: một phần quan trọng để đảm bảo sự hoạt động liên tục và có hiệu quả của hệ thống phục vụ cho mục đích của người sử dụng. – Con người: Trong GIS, thành phần con người là thành phần quan trọng nhất bởi con người tham gia vào mọi hoạt động của hệ thống GIS (từ việc xây dựng cơ sở dữ liệu, việc tìm kiếm, phân tích dữ liệu …). Có 2 nhóm người quan trọng là người sử dụng và người quản lý GIS. 3. Chức năng của GIS: GIS có 5 chức năng chủ yếu: – Thu thập dữ liệu: là công việc khó khăn và nặng nề nhất trong quá trình xây dựng một ứng dụng GIS. Các dữ liệu được thu thập từ nhiều nguồn khác nhau như dữ liệu đo đạc từ thực địa, dữ liệu từ các loại bản đồ, dữ liệu thống kê… – Thao tác dữ liệu: vì các dữ liệu được thu thập từ nhiều nguồn có định dạng khác nhau và có những trường hợp các dạng dữ liệu đòi hỏi được chuyển dạng và thao tác theo một số cách để tương thích với hệ thống. Ví dụ: các thông tin địa lý có giá trị biểu diễn khác nhau tại các tỷ lệ khác nhau (lớp dân cư trên bản đồ địa chính được thể hiện chi tiết hơn trong bản đồ địa hình). Trước khi các thông tin này được tích hợp với nhau thì chúng phải được chuyển về cùng một tỷ lệ (cùng mức độ chi tiết hoặc mức độ chính xác). Đây có thể chỉ là sự chuyển dạng tạm thời cho mục đích hiển thị hoặc cố định cho yêu cầu phân tích. – Quản lý dữ liệu: là một chức năng quan trọng của tất cả các hệ thông tin địa lý. Hệ thống thông tin địa lý phải có khả năng điều khiển các dạng khác nhau của dữ liệu đồng thời quản lý hiệu quả một khối lượng lớn dữ liệu với một trật tự rõ ràng. Một yếu tố quan trọng của GIS là khả năng liên kết hệ thống giữa việc tự động hóa bản đồ và quản lý cơ sở dữ liệu (sự liên kết giữa dữ liệu không gian và thuộc tính của đối tượng). Các dữ liệu thông tin mô tả cho một đối tượng bất kỳ có thể liên hệ một cách hệ thống với vị trí không gian của chúng. Sự liên kết đó là một ưu thế nổi bật của việc vận hành GIS. – Hỏi đáp và phân tích dữ liệu: Khi đã xây dựng được một hệ thống cơ sở dữ liệu GIS thì người dùng có thể hỏi các câu hỏi đơn giản như: + Thông tin về thửa đất: Ai là chủ sở hữu của mảnh đất?, Thửa đất rộng bao nhiêu m2? + T ìm đường đi ngắn nhất giữa hai vị trí A và B? + Thống kê số lượng cây trồng trên tuyến phố? + Hay xác định được mật độ diện tích trồng cây xanh trong khu vực đô thị?… GIS cung cấp khả năng hỏi đáp, tìm kiếm, truy vấn đơn giản “chỉ nhấn và nhấn” và các công cụ phân tích dữ liệu không gian mạnh mẽ để cung cấp thông tin một cách nhanh chóng, kịp thời, chính xác, hỗ trợ ra quyết định cho những nhà quản lý và quy hoạch. – Hiển thị dữ liệu: GIS cho phép hiển thị dữ liệu tốt nhất dưới dạng bản đồ hoặc biểu đồ. Ngoài ra còn có thể xuất dữ liệu thuộc tính ra các bảng excel, tạo các bản báo cáo thống kê, hay tạo mô hình 3D, và nhiều dữ liệu khác.
Trang 1LỜI CẢM ƠN
Trong suốt thời gian học tập vừa qua tôi xin chân thành cảm ơn giảng viên Lê Thị Thu Hà Khoa Kỹ thuật Trắc địa bản đồ Trường Đại học Tài nguyênvà Môi trường đã tạo điều kiện tốt cũng như giúp đỡ tôi tận tình trong môn học Thực hành xây dựng cơ sở dữ liệu địa lý này
Dù thời gian học tập cũng chưa lâu và kiến thức cũng như kinh nghiệm của bản thân tôi còn hạn chế nhưng tôi vẫn cố gắng hoàn thành tốt nhất Báo cáo môn học trong khả năng cho phép Trong quá trình học tập và làm báo cáo cũng không thể tránh khỏi những thiếu sót Tôi rất mong nhận được sự góp ý của cô để bản Báo cáo môn học của tôi được hoàn chỉnh hơn
Tôi xin chân thành cảm ơn!
Sinh viên thực hiện
Nguyễn Ngọc Việt Anh
Trang 2I TỔNG QUAN VỀ HỆ THỐNG ĐỊA LÝ THÔNG TIN GIS.
1 Khái niệm
Theo ESRI, tập đoàn nghiên cứu và phát triển các phần mềm GIS nổitiếng, Hệ thông tin địa lý (GIS – Geographic Information System) là một tậphợp có tổ chức, bao gồm hệ thống phần cứng, phần mềm máy tính, dữ liệu địa
lý và con người, được thiết kế nhằm mục đích nắm bắt, lưu trữ, cập nhật, điềukhiển, phân tích, và hiển thị tất cả các dạng thông tin liên quan đến vị trí địalý
2 Tổng quan về hệ thống thông tin địa lý GIS
– Phần cứng: bao gồm máy tính và các thiết bị ngoại vi
– Phần mềm: là bộ não của hệ thống, phần mềm GIS rất đa dạng và cóthể chia làm 3 nhóm (nhóm phần mềm quản đồ họa, nhóm phần mềm quản trịbản đồ và nhóm phần mềm quản trị, phân tích không gian)
– Dữ liệu: bao gồm dữ liệu không gian (dữ liệu bản đồ) và dữ liệu thuộctính (dữ liệu phi không gian) Dữ liệu không gian miêu tả vị trí địa lý của đốitượng trên bề mặt Trái đất Dữ liệu thuộc tính miêu tả các thông tin liên quanđến đối tượng, các thông tin này có thể được định lượng hay định tính
– Phương pháp: một phần quan trọng để đảm bảo sự hoạt động liên tục
và có hiệu quả của hệ thống phục vụ cho mục đích của người sử dụng
– Con người: Trong GIS, thành phần con người là thành phần quan trọngnhất bởi con người tham gia vào mọi hoạt động của hệ thống GIS (từ việc xâydựng cơ sở dữ liệu, việc tìm kiếm, phân tích dữ liệu …) Có 2 nhóm ngườiquan trọng là người sử dụng và người quản lý GIS
Trang 33 Chức năng của GIS:
GIS có 5 chức năng chủ yếu:
– Thu thập dữ liệu: là công việc khó khăn và nặng nề nhất trong quátrình xây dựng một ứng dụng GIS Các dữ liệu được thu thập từ nhiều nguồnkhác nhau như dữ liệu đo đạc từ thực địa, dữ liệu từ các loại bản đồ, dữ liệuthống kê…
– Thao tác dữ liệu: vì các dữ liệu được thu thập từ nhiều nguồn có địnhdạng khác nhau và có những trường hợp các dạng dữ liệu đòi hỏi đượcchuyển dạng và thao tác theo một số cách để tương thích với hệ thống Ví dụ:các thông tin địa lý có giá trị biểu diễn khác nhau tại các tỷ lệ khác nhau (lớpdân cư trên bản đồ địa chính được thể hiện chi tiết hơn trong bản đồ địa hình).Trước khi các thông tin này được tích hợp với nhau thì chúng phải đượcchuyển về cùng một tỷ lệ (cùng mức độ chi tiết hoặc mức độ chính xác) Đây
có thể chỉ là sự chuyển dạng tạm thời cho mục đích hiển thị hoặc cố định choyêu cầu phân tích
– Quản lý dữ liệu: là một chức năng quan trọng của tất cả các hệ thôngtin địa lý Hệ thống thông tin địa lý phải có khả năng điều khiển các dạngkhác nhau của dữ liệu đồng thời quản lý hiệu quả một khối lượng lớn dữ liệuvới một trật tự rõ ràng Một yếu tố quan trọng của GIS là khả năng liên kết hệthống giữa việc tự động hóa bản đồ và quản lý cơ sở dữ liệu (sự liên kết giữa
dữ liệu không gian và thuộc tính của đối tượng) Các dữ liệu thông tin mô tảcho một đối tượng bất kỳ có thể liên hệ một cách hệ thống với vị trí khônggian của chúng Sự liên kết đó là một ưu thế nổi bật của việc vận hành GIS.– Hỏi đáp và phân tích dữ liệu: Khi đã xây dựng được một hệ thống cơ
sở dữ liệu GIS thì người dùng có thể hỏi các câu hỏi đơn giản như:
+ Thông tin về thửa đất: Ai là chủ sở hữu của mảnh đất?, Thửa đấtrộng bao nhiêu m2?
Trang 4+ T ìm đường đi ngắn nhất giữa hai vị trí A và B?
+ Thống kê số lượng cây trồng trên tuyến phố?
+ Hay xác định được mật độ diện tích trồng cây xanh trong khu vực
đô thị?…
GIS cung cấp khả năng hỏi đáp, tìm kiếm, truy vấn đơn giản “chỉ nhấn
và nhấn” và các công cụ phân tích dữ liệu không gian mạnh mẽ để cung cấpthông tin một cách nhanh chóng, kịp thời, chính xác, hỗ trợ ra quyết định chonhững nhà quản lý và quy hoạch
– Hiển thị dữ liệu: GIS cho phép hiển thị dữ liệu tốt nhất dưới dạng bản
đồ hoặc biểu đồ Ngoài ra còn có thể xuất dữ liệu thuộc tính ra các bảngexcel, tạo các bản báo cáo thống kê, hay tạo mô hình 3D, và nhiều dữ liệukhác
4 Ứng dụng của GIS trong các ngành
Vì GIS được thiết kế như một hệ thống chung để quản lý dữ liệu khônggian, nó có rất nhiều ứng dụng trong việc phát triển đô thị và môi trường tựnhiên như là: quy hoạch đô thị, quản lý nhân lực, nông nghiệp, điều hành hệthống công ích, lộ trình, nhân khẩu, bản đồ, giám sát vùng biển, cứu hoả vàbệnh tật Trong phần lớn lĩnh vực này, GIS đóng vai trò như là một công cụ
hỗ trợ quyết định cho việc lập kế hoạch hoạt động
4.1 Ứng dụng GIS trong môi trường
Theo những chuyên gia GIS kinh nghiệm nhất thì có rất nhiều ứng dụng
đã phát triển trong những tổ chức quan tâm đến môi trường Với mức đơngiản nhất thì người dùng sử dụng GIS để đánh giá môi trường, ví dụ như vị trí
và thuộc tính của cây rừng Ứng dụng GIS với mức phức tạp hơn là dùng khảnăng phân tích của GIS để mô hình hóa các tiến trình xói mòn đất sư lantruyền ô nhiễm trong môi trường khí hay nước, hoặc sự phản ứng của một lưuvực sông dưới sự ảnh hưởng của một trận mưa lớn Nếu những dữ liệu thu
Trang 5thập gắn liền với đối tượng vùng và ứng dụng sử dụng các chức năng phântích phức tạp thì mô hình dữ liệu dạng ảnh (raster) có khuynh hướng chiếm ưuthế.
4.2 Ứng dụng GIS trong thủy văn
Trong lĩnh vực này GIS được dùng như là một hệ thống đáp ứng nhanh,phục vụ chống thiên tai như lũ quét ở vùng hạ lưu, xác định tâm bão, dự đoáncác luồng chảy, xác định mức độ ngập lụt, từ đó đưa ra các biện pháp phòngchống kịp thời vì những ứng dụng này mang tính phân tích phức tạp nên môhình dữ liệu khônggian dạng ảnh (raster) chiếm ưu
4.3 Ứng dụng GIS trong Nông nghiệp, quản lý đất đai
Những ứng dụng đặc trưng: Guam sat thu hoạch, hệ thống quản lý đấtđai, dự báo về hàng hoá, nghiên cứu về đất trồng, kế hoạch tưới tiêu, kiểm tranguồn nước
4.4 Ứng dụng GIS trong Dịch vụ tài chính
GIS được sử dụng trong lĩnh vực dịch vụ tài chính tương tự như là mộtứng dụng đơn lẻ Nó đã từng được áp dụng cho việc xác định vị trí những chinhánh mới của Ngân hàng Hiện nay việc sử dụng GIS đang tăng lên tronglĩnh vực này, nó là một công cụ đánh giá rủi ro và mục đích bảo hiểm, xácđịnh với độ chính xác cao hơn những khu vực có độ rủi ro lớn nhất hay thấpnhất Lĩnh vực này đòi hỏi những dữ liệu cơ sở khác nhau như là hình thức viphạm luật pháp, địa chất học, thời tiết và giá trị tài sản
4.5 Ứngdụng GIS trong Y tế
Ngoại trừ những ứng dụng đánh gía, quản lý mà GIS hay được dùng,GIS còn có thể áp dụng trong lĩnh vực y tế Ví dụ như, nó chỉ ra được lộ trìnhnhanh nhất giữa vị trí hiện tại của xe cấp cứu và bệnh nhân cần cấp cứu, dựatrên cơ sở dữ liệu giao thông GIS cũng có thể được sử dụng như là một công
Trang 6cụ nghiên cứu dịch bệnh để phân tích nguyên nhân bộc phát và lây lan bệnhtật trong cộng đồng.
4.6 Ứng dụng GIS cho Chính quyền địa phương
Chính quyền địa phương là một trong những lĩnh vực ứng dụng rộng lớnnhất của GIS, bởi vì đây là một tổ chức sử dụng dữ liệu không gian nhiềunhất Tất cả các cơ quan của chính quyền địa phương có thể có lợi từ GIS.GIS có thể được sử dụng trong việc tìm kiếm và quản lý thửa đất, thay thế choviệc hồ sơ giấy tờ hiện hành Nhà cầm quyền địa phương cũng có thể sử dụngGIS trong việc bảo dưỡng nhà cửa và đường giao thông GIS còn được sửdụng trong các trung tâm điều khiển và quản lý các tình huống khẩn cấp.4.7 Ứng dụng GIS trong thị trường Bán lẻ
Phần lớn siêu thị vùng ngoại ô được xác định vị trí với sự trợ giúp củaGIS GIS thường lưu trữ những dữ liệu về kinh tế-xã hội của khách hàngtrong một vùng nào đó Một vùng thích hợp cho việc xây dựng môt siêu thị cóthể được tính toán bởi thời gian đi đến siêu thị, và mô hình hoá ảnh hưởng củanhững siêu thị cạnh tranh GIS cũng được dùng cho việc quản lý tài sản vàtìm đường phân phối hàng ngắn nhất
4.8 Ứng dụng GIS trong Giao thông
GIS có khả năng ứng dụng đáng kể trong lĩnh vực vận tải Việc lập kếhoạch và duy trì cở sở hạ tầng giao thông rõ ràng là một ứng dụng thiết thực,nhưng giờ đây có sự quan tâm đến một lĩnh vực mới là ứng dụng định vịtrong vận tải hàng hải, và hải đồ điện tử Loại hình đặc trưng này đòi hỏi sự
hỗ trợ của GIS
4.9 Ứng dụng GIS cho Các dịch vụ điện, nước, gas, điện thoại
Những công ty trong lĩnh vực này là những người dùng GIS linh hoạtnhất, GIS được dùng để xây dựng những cơ sở dữ liệu là cái thường là nhân
tố của chiến lược công nghệ thông tin của các công ty trong lĩnh vự này Dữ
Trang 7liệu vecto thường được dùng trong các lĩnh vực này những ứng dụng lớn nhấttrong lĩnh vực này là Automated Mapping và Facility Management (AM-FM).AM-FM được dùng để quản lý các đặc điểm và vị trí của các cáp, valve Những ứng dụng này đòi hỏi những bản đồ số với độ chính xác cao Một tổchức dù có nhiệm vụ là lập kế hoạch và bảo dưỡng mạng lưới vận chuyền hay
là cung cấp các dịch vụ về nhân lực, hỗ trợ cho các chương trình an toàn côngcộng và hỗ trợ trong các trường hợp khẩn cấp, hoặc bảo vệ môi trường, thìcông nghệ GIS luôn đóng vai trò cốt yếu bằng cách giúp cho việc quản lý và
sử dụng thông tin địa lý một cách hiệu quả nhằm đáp ứng các yêu cầu hoạtđộng và mục đích chương trình của tổ chức đó
Trang 8II TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU.
Section I.1 1 Mở đầu
Có thể chúng ta không để ý, nhưng trong cuộc sống hàng ngày chúng tathường có sử dụng đến cơ sở dữ liệu (database) Chẳng hạn, khi chúng ta muahàng ở siêu thị, một cơ sở dữ liệu sẽ được truy cập, thông quá thiết bị đọc mãvạch do nhân viên bán hàng sử dụng Hệ thống sẽ dùng mã vạch này để truycập đến cơ sở dữ liệu hàng hoá, tìm đơn giá sản phẩm, ghi lên hoá đơn bánhàng và giảm lượng tồn Cũng vậy, khi chúng ta liên hệ một đại lý du lịch đểhỏi về các tour du lịch, nhân viên tiếp nhận cũng sẽ truy cập đến cơ sở dữ liệu
du lịch để cung cấp cho chúng ta các thông tin liên quan cũng như hướng dẫnchúng ta lựa chọn hành trình, phương tiện Hoặc xét tình huống đến mượnsách tại một thư viện Thủ thư có thể phải sử dụng đến cơ sở dữ liệu thư việnlưu trữ dữ liệu về sách, tài liệu, về tác giả, độc giả, về chi tiết mượn cũng nhưchi tiết đăng ký mượn khi chưa có sách, nhằm đáp ứng các hoạt động mượntrả của thư viện
Ngày nay, sự thành công của một tổ chức phụ thuộc vào khả năng thuthập dữ liệu, quản lý chúng một cách hiệu quả cũng như dùng chúng để phântích và định hướng các hoạt động Để có các quyết định tốt chúng ta cần cácthông tin có giá trị, là kết quả của các quá trình xử lý dữ liệu khác nhau Hiệnnay, các thuật ngữ như xa lộ thông tin đã dần trở nên thông dụng và công việc
xử lý thông tin đã nhanh chóng phát triển thành một ngành công nghiệp nhiều
tỷ đô la
Rõ ràng, việc quản lý dữ liệu hiệu quả là một trong các yếu tố quan trọngcủa một tổ chức Bằng các quá trình xử lý dữ liệu phù hợp ta được thông tin.Thông tin là điểm mấu chốt để nhà quản lý sử dụng tài nguyên một cách hiệuquả Được thông tin, đó là biết một tập các khả năng, các phương án hành
Trang 9động giúp cho việc ra quyết định được đúng đắn Tuy nhiên, thông tin cungcấp cho nhà quản lý phải “chính xác, đầy đủ và kịp thời.” Có như vậy cácquyết định của họ không những đúng đắn mà còn hiệu quả.
2 Hệ thống dựa trên tệp tin
(a) 2.1 Tiếp cận
Về mặt lịch sử, các chương trình ứng dụng đầu tiên tập trung vào các tác
vụ văn phòng nhỏ như “xử lý đơn hàng, phân công công việc, thanh toánlương, tính tồn kho, ghi sổ kế toán.” Nói chung, các tác vụ này đơn giản và dữliệu không quá phức tạp để hiểu Dữ liệu được lưu trong một hệ thống các tậptin có cấu trúc riêng và có các quan hệ logic với nhau Đặc tả chi tiết về cấutrúc và các quan hệ cũng như cách truy xuất dữ liệu từ các tập tin là hoàntoàn phụ thuộc vào chương trình ứng dụng cụ thể Với mỗi ứng dụng, các lậptrình viên có toàn quyền trong mô tả dữ liệu và tự mình nhanh chóng xâydựng các tập tin và lưu chúng trên các cuộn băng riêng và các đĩa từ riêng
“Như vậy hệ thống dựa trên tập tin là hệ thống các chương trình ứngdụng thực hiện các dịch vụ cho người dùng cuối mà mỗi chương trình tự địnhnghĩa và quản lý dữ liệu riêng của nó.”
Với tiếp cận này chúng ta phải xây dựng các thủ tục nhập xuất thật hiệuquả và khi gặp phải các yêu cầu xử lý dữ liệu phức tạp chúng ta phải xâydựng các thuật toán chính xác Đặc biệt nếu chúng ta có nhiều bộ phận cónhững chương trình quản lý riêng thì việc lưu trữ dư thừa là không thể tránhkhỏi Thậm chí các cấu trúc trùng lắp này lại được mô tả khác nhau
(b) 2.2 Hạn chế
(i) - Dữ liệu tách biệt và cô lập
Điều này gây khó khăn khi truy cập Với dữ liệu được lưu như ở ví dụ 4,nếu bộ phận quản lý giảng dạy muốn in danh sách giảng viên với đầy đủ chitiết, thì sẽ gặp khó khăn khi phải truy cập đến các tập tin ở bộ phận quản lý
Trang 10(iii) - Lệ thuộc dữ liệu
Sự thay đổi cấu trúc mô tả dữ liệu của một bộ phận, dù thật đơn giản, lạigây ra tác động theo chiều rộng đến các chương trình có sử dụng các cấu trúcnày, không chỉ trong phạm vi một bộ phận Các chương trình làm chủ dữ liệucủa mình nhưng lại lệ thuộc vào dữ liệu do chương trình khác làm chủ
(iv) - Không tương thích
Các chương trình có thể được viết bởi các ngôn ngữ lập trình khác nhau
Cơ chế lưu trữ và lấy lại của các ngôn ngữ lập trình khác nhau có thể khácnhau Điều này gây khó khăn khi phải xử dụng dữ liệu của nhau
(v) - Không mềm dẻo trong xử lý dữ liệu
Dữ liệu bị buộc vào chương trình Chương trình được cài đặt với các xử
lý xác định Nếu một yêu cầu xử lý dữ liệu mới được đặt ra, nó phải được càiđặt thêm và thậm chí biên dịch lại Vẫn xét ví dụ 4, nếu bây giờ tại bộ phậnquản lý giảng dạy có nhu cầu đưa ra một báo cáo thống kê về số tiền chi chogiảng viên theo từng môn, thì chúng ta phải viết hoặc một chương trình mới,hoặc bổ sung một chức năng cho chương trình cũ rồi biên dịch lại Công việcnày cũng sẽ gây khó khăn cho lập trình viên khi phải truy xuất tập tin ở bộphận khác hoặc nhận dữ liệu với cấu trúc lệ thuộc vào chương trình ở bộ phậnkhác
3 Tiếp cận cơ sở dữ liệu
Trang 11Trong thực tế sự bùng nổ dữ liệu đang thách thức chúng ta trong côngviệc mô tả, lưu trữ cũng như tìm kiếm Chúng sẽ nhanh chóng trở thành mộtkhoản nợ nếu như chi phí thu thập và quản lý vượt xa giá trị do chúng manglại Chính vì thế mà chúng ta luôn phải tìm kiếm các mô hình dữ liệu và cáccông cụ quản lý dữ liệu hiệu quả Tại thời điểm này chúng ta hiểu, một cáchtrực giác, cơ sở dữ liệu là một tập các dữ liệu có liên quan đến các hoạt độngcủa một hoặc nhiều tổ chức có quan hệ với nhau và hệ quản trị cơ sở dữ liệu
là một phần mềm được thiết kế để hỗ trợ cho công việc bảo tồn và quản lý cơ
sở dữ liệu
(c) 3.1 Tiếp cận
Khi mà việc quản lý dữ liệu bằng hệ thống tập tin trở nên khó khăn, cầnthiết phải tập trung quản lý chúng như là một thực thể thống nhất, ít ra là ởmức mô tả Khi đó chúng ta sẽ có một cái nhìn tổng quát mang tính hệ thốngđối với toàn bộ dữ liệu của tổ chức
Định Nghĩa 1:
Cơ sở dữ liệu là một tập hợp các dữ liệu dùng chung, có quan hệ logicvới nhau, cùng với mô tả của chúng, được thiết kế cho nhu cầu thông tin củamột tổ chức
Chúng ta xem xét chi tiết định nghĩa này để hiểu đầy đủ khái niệm Theođịnh nghĩa, cơ sở dữ liệu là một kho dữ liệu lớn được định nghĩa một lần vàđược dùng đồng thời bởi nhiều bộ phận người dùng Dữ liệu được tích hợpvới lượng dư thừa tối thiểu, độc lập với ứng dụng và trở thành một tài nguyêndùng chung Cơ sở dữ liệu lưu không chỉ dữ liệu mà cả mô tả của dữ liệu, cònđược gọi là từ điển dữ liệu hay dữ liệu về dữ liệu Việc dữ liệu được địnhnghĩa độc lập với ứng dụng cho phép chúng ta mô hình dữ liệu với nhiều cấp
độ trừu tượng nhờ đó chúng ta thấy được mối quan hệ logic của dữ liệu trong
tổ chức Với tiếp cận này chúng ta có được các thuận lợi trong quản lý dữ liệu
Trang 12nhưng cũng xuất hiện một số thách thức.
(i) - Các thuận lợi
Việc tách dữ liệu ra khỏi chương trình ứng dụng cho phép quản lý và sửdụng chúng được hiệu quả Trước tiên dữ liệu trở nên độc lập với chươngtrình Chương trình có thể khai thác dữ liệu mà không cần biết đến cấu trúc,cũng như chiến lược truy xuất Nhờ đó ta có thể cài đặt các ứng dụng sao chonếu có sự thay đổi trên dữ liệu về cấu trúc hay chiến lược truy xuất thì vẫnkhông phải cài đặt lại chương trình Tiếp theo dữ liệu còn được chia sẻ chonhiều ứng dụng khác nhau Cuối cùng dữ liệu không còn bị trùng lắp giúpgiảm không gian lưu trữ và tăng tính toàn vẹn dữ liệu Nhờ đó dữ liệu sẽ nhấtquán và không gây mâu thuẫn Tính chất thống nhất giữa các dữ liệu trong hệthống như một toàn bộ cho phép xây dựng các mô hình dữ liệu Theo đóchúng ta có thể chỉ ra những liên hệ, những ràng buộc bất biến trong suốt thờigian sống của dữ liệu Nhờ làm nổi bật ý nghĩa của các quan hệ dữ liệu, chúng
ta có thể xây dựng nên các ứng dụng đa dạng và hiệu quả Chúng ta còn cóthể xây dựng phương pháp luận cho phân tích thiết kế và cài đặt chương trìnhứng dụng dựa trên các lược đồ logic giúp việc viết một chương trình ứngdụng được dễ dàng hơn Cho phép xây dựng một ngôn ngữ phi thủ tục theo đóviệc khai thác dữ liệu được thực hiện bằng cách mô tả những gì là cần lấy màkhông cần chỉ rõ dữ liệu sẽ được lấy ra như thế nào Cho phép xây dựng một
cơ chế bảo mật dữ liệu bằng cách hạn chế quyền truy xuất của các chươngtrình ứng dụng Chương trình ứng dụng chỉ được phép truy xuất từng phầnhay toàn bộ dữ liệu phụ thuộc vào thẩm quyền của nó
- Chúng ta có thể liệt kê các thuận lợi như:
+ Kiểm soát được sự dư thừa dữ liệu, giảm chi phí lưu trữ;
+ Dữ liệu nhất quán, dễ phát hiện các xung đột giữa các yêu cầu nếu có;+ Cho phép rút ra nhiều thông tin hơn và có giá trị hơn từ cùng mộtnguồn dữ liệu
Trang 13+ Dữ liệu được chia sẻ, tăng cường khả năng truy cập và đáp ứng, kiểmsoát sự tương tranh;
+ Tăng cường tính toàn vẹn;
+ Tăng cường tính bảo mật;
+ Tăng cường khả năng thỏa mãn các chuẩn của đơn vị, của tổ chức, củaquốc gia cũng như của quốc tế;
+ Tăng hiệu suất quản lý và khai thác dữ liệu;
+Cải thiện việc sao lưu và phục hồi dữ liệu
(ii) - Các thách thức
Dữ liệu được quản lý tập trung làm gia tăng độ phức tạp Để quản lý hiệuquả chúng ta phải tốn nhiều công sức hơn, chuyên nghiệp hơn Tính tổng quátgia tăng làm giảm đi tính chuyên biệt Dữ liệu tập trung quá lớn làm cho mứctin cậy, độ sẵn sàng cũng như tính bảo mật luôn bị đe doạ Chúng ta có thể liệt
kê ra đây một số bất tiện cũng như các bài toán cần giải quyết khi làm việctheo tiếp cận này
Giải quyết các vấn đề này không là nhiệm vụ của ứng dụng Thay vào
đó, chúng ta cần một môi trường cơ sở dữ liệu có sự tham gia của nhiều thànhphần gồm phần cứng, phần mềm, dữ liệu, thủ tục và con người Trong đóphần mềm quản lý cơ sở dữ liệu chuyên dụng, gọi là hệ quản trị cơ sở dữliệu, đóng một vai trò quan trọng
- Định nghĩa 2
Trang 14Hệ quản trị cơ sở dữ liệu là một hệ thống phần mềm cho phép ngườidùng định nghĩa, tạo và bảo tồn cơ sở dữ liệu; cũng cung cấp việc truy cập cókiểm soát đến cơ sở dữ liệu.
Từ định nghĩa chúng ta thấy, về cơ bản, nhiệm vụ chính của hệ quản trị
là tạo, bảo tồn cơ sở dữ liệu và kiểm soát việc truy cập đến cơ sở dữ liệu.Thông qua ngôn ngữ định nghĩa dữ liệu, hệ quản trị cho phép người dùngđịnh nghĩa cơ sở dữ liệu Thông qua ngôn ngữ thao tác dữ liệu, hệ quản trịcho phép người dùng thêm, xoá, sửa và lấy lại dữ liệu
Với cơ chế truy cập có kiểm soát, hệ quản trị cơ sở dữ liệu bảo đảm đượctính bảo mật, tính toàn vẹn dữ liệu, điều khiển sự tương tranh, khôi phục trạngthái toàn vẹn trước đó khi có lỗi xảy ra ở phần cứng hoặc phần mềm Để dữliệu thực sự độc lập với ứng dụng, hệ quản trị cơ sở dữ liệu còn cung cấp cơchế khung nhìn cho người dùng cuối Nhờ đó bảo đảm thực hiện độc lập dữliệu, hơn nữa cơ chế này cũng cho phép tăng cường tính bảo mật và tính toànvẹn dữ liệu
(d) 3.2 Môi trường cơ sở dữ liệu
(i) - Phần cứng
Bao gồm tất cả các thiết bị vật lý mà chủ yếu là máy tính và các thiết bịngoại vi Chúng có thể được nối với nhau trong một hệ thống mạng cho phépthực hiện các truy xuất từ xa Mỗi hệ quản trị cơ sở dữ liệu đòi hỏi phần cứngphù hợp Ngoài ra yêu cầu về phần cứng, trên từng máy và trên toàn hệ thốngmạng, còn phụ thuộc vào chính yêu cầu của tổ chức
(ii) - Phần mềm
Thường vẫn được hiểu là hệ quản trị cơ sở dữ liệu, nhưng trong trườnghợp tổng quát chúng còn bao gồm cả hệ điều hành, các chương trình ứngdụng và các phần mềm tiện ích Vì vai trò quan trọng của hệ quản trị cơ sở dữliệu, chúng ta nên có thêm sự hiểu biết về nó Hệ quản trị cơ sở dữ liệu được
Trang 15phân loại theo các tiêu chí: số người dùng, số vị trí lưu trữ và kiểu sử dụng,như sau:
+ Phân loại tùy theo số người dùng gồm một người dùng hay nhiềungười dùng Hệ một người dùng chỉ cho phép một người dùng tại một thờiđiểm và nếu chỉ dùng một máy tính ta sẽ gọi là hệ cơ sở dữ liệu desktop Hệnhiều người dùng hỗ trợ nhiều người dùng tại cùng một thời điểm và nếu nóđược dùng trong một công ty ta sẽ gọi là cơ sở dữ liệu công ty
+ Phân loại tùy theo số số vị trí lưu trữ gồm tập trung hay phân tán Hệ
cơ sở dữ liệu tập trung chỉ cho phép lưu dữ liệu tại một vị trí duy nhất, tronglúc hệ cơ sở dữ liệu phân tán hỗ trợ lưu dữ liệu tại nhiều vị trí
+ Phân loại tùy theo kiểu sử dụng gồm giao dịch hay trợ giúp quyết định
Hệ cơ sở dữ liệu giao dịch hỗ trợ các giao dịch hàng ngày lưu các dữ liệugiao dịch và ngay lập tức, trong lúc hệ cơ sở dữ liệu trợ giúp quyết định lưutrữ các dữ liệu mang tích lịch sử để hỗ trợ các quyết định, phát sinh các dựbáo, đánh giá thị trường, …
(iii) - Người dùng
Gồm tất cả các người dùng được phân loại theo chức năng như quản trị
dữ liệu, quản trị cơ sở dữ liệu, thiết kế cơ sở dữ liệu, lập trình ứng dụng vàngười dùng cuối Chúng ta cần làm rõ các vai trò này:
+ Vai trò quản trị Cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu cũng là cáctài nguyên cần được quản lý Quản trị dữ liệu có nhiệm vụ lên kế hoạch xâydựng cơ sở dữ liệu, bảo đảm các chuẩn theo quy định, đưa ra các chính sáchcác thủ tục cho thiết kế logic, tư vấn cho nhà quản lý, định hướng phát triển
và hỗ trợ tối đa cho các mục tiêu của tổ chức Quản trị cơ sở dữ liệu có nhiệm
vụ xây dựng cơ sở dữ liệu, kiểm soát tính bảo mật và toàn vẹn, bảo đảm cácyêu cầu của ứng dụng và người dùng
+ Vai trò thiết kế Trong dự án lớn chúng ta phân biệt 2 kiểu thiết kế:thiết kế logic và thiết kế vật lý Thiết kế logic tập trung vào mô hình hoá dữ