2.2. KHÁI QUÁT VỀ CƠ SỞ DỮ LIỆU VÀ HỆ THỐNG THÔNG TIN
2.2.1. Hệ thống cơ sở dữ liệu và hệ thống thống tin địalý
2.2.1.1. Hệ thống cơ sở dữ liệu
a. Khái niệm cơ sở dữ liệu
Để dễ dàng cho việc giải thích các khái niệm trước hết hệ thống bản vẽ
máy bay bằng máy tính. Dữ liệu lưu trữ trong máy tính bao gồm thông tin về
hành khách, chuyến bay, đường ..v..v.. Mọi thông tin về mối quan hệ này được biểu diễn trong máy thông qua việc đặt chỗ của khách hàng. Vậy làm thế nào để
biểu diễn được dữ liệu đó và đểđảm bảo cho hành khách đi đúng chuyến?
Dữ liệu nêu trên được lưu trong máy theo một qui định nào đó và được gọi là cơ sở dữ liệu (CSDL, tiếng Anh là Database).
Cơ sở dữ liệu (viết tắt CSDL; tên tiếng anh là database) được hiểu theo cách
định nghĩa kiểu kĩ thuật thì nó là một tập hợp thông tin có cấu trúc. Tuy nhiên, thuật ngữ này thường dùng trong công nghệ thông tin và nó thường được hiểu rõ hơn dưới dạng một tập hợp liên kết các dữ liệu, thường đủ lớn để lưu trên một thiết bị lưu trữ nhưđĩa hay băng. Dữ liệu này được duy trì dưới dạng một tập hợp các tập tin trong hệđiều hành hay được lưu trữ trong các hệ quản trị cơ sơ dữ liệu.
Và CSDL mang lại rất nhiều ưu điểm:
- Giảm sự trùng lặp thông tin xuống mức thấp nhất. Do đó đảm bảo thông tin có tính nhất quán và toàn vẹn dữ liệu.
- Đảm bảo dữ liệu có thẻđược truy suất theo nhiều cách khác nhau - Nhiều người có thể sử dụng một cơ sở dữ liệu CSDL
b. Phân loại cở sở dữ liệu
- Cơ sở dữ liệu dạng file: dữ liệu được lưu trữ dưới dạng các file có thể là text, ascii, *.dbf. Tiêu biểu cho cơ sở dữ liệu dạng file là Foxpro
- Cơ sở dữ liệu quan hệ: dữ liệu được lưu trữ trong các bảng dữ liệu gọi là các thực thể, giữa các thực thể này có mối liên hệ với nhau gọi là các quan hệ, mỗi quan hệ có các thuộc tính, trong đó có một thuộc tính là khóa chính. Các hệ
quản trị hỗ trợ cơ sở dữ liệu quan hệ như: MS SQL server, Oracle, MySQL... - Cơ sở dữ liệu hướng đối tượng: dữ liệu cũng được lưu trữ trong các bản
dữ liệu nhưng các bảng có bổ sung thêm các tính năng hướng đối tượng như lưu trữ thêm các hành vi, nhằm thể hiện hành vi của đối tượng. Mỗi bảng xem như
một lớp dữ liệu, một dòng dữ liệu trong bảng là một đối tượng. Các hệ quản trị
có hỗ trợ cơ sở dữ liệu quan hệ như: MS SQL server, Oracle, Postgres
- Cơ sở dữ liệu bán cấu trúc: dữ liệu được lưu dưới dạng XML, với định dạng này thông tin mô tả về đối tượng thể hiện trong các tag. Đây là cơ sở dữ
liệu có nhiều ưu điểm do lưu trữđược hầu hết các loại dữ liệu khác nhau nên cơ
sở dữ liệu bán cấu trúc là hướng mới trong nghiên cứu và ứng dụng.
c. Các mô hình của CSDL
*) Mô hình phân cấp (HIERACHICAL)
Mô hình dữ liệu là một cây, trong đó các nút biểu diễn các tập thực thể, giữa các nút con và nút cha được liên hệ theo một mối quan hệ xác định. Điểm nổi bật trong các thủ tục truy xuất đến một đối tượng trong mô hình phân cấp là
đường dẫn đi từ gốc đến phần tử cần xét trong cây phân cấp.
Hình 2.1. Biểu diễn bản đồ A bằng mô hình phân cấp
Nguồn: Phạm Trọng Mạnh và Phạm Vọng Thành (1999) Mô hình phân cấp khá phù hợp với những hình thức tổ chức phân cấp trong xã hội. Thường gặp trong các hệ thống máy tính là mô hình quản lý thư mục.
*) Mô hình lưới (Network Model)
Mô hình dữ liệu kiểu lưới là mô hình cho phép dùng một mô hình đồ thị
Để dễ dàng minh hoạ và phân biệt giữa mô hình phân cấp và mô hình lưới, xem xét ví dụ sau đây:
Cho một bản đồ A đơn giản gồm 2 đa giác I và II được xác định bởi tập hợp các đường thẳng trong đó có được một đường chung của 2 đa giác. Mỗi
đường thẳng được xác định bởi các cặp toạđộ.
Hình 2.2. Biểu diễn bản đồ A bằng mô hình lưới
Nguồn: Phạm Trọng Mạnh và Phạm Vọng Thành (1999) Mô hình lưới và mô hình phân cấp nói chung là khá bất tiện cho lưu trữ và khai thác xử lý bởi vì toạđộ các điểm, một số cạnh phải lưu trữ nhiều lần (như ví dụ trên các cạnh c phải lưu trữ 2 lần) v..v.. gây nên sự dư thừa dữ liệu. Ngoài ra, hệ thống còn phải cần lưu trữ một số lớn các con trỏ móc nối gây nên phức tạp trong quá trình cập nhật, biến đổi dữ liệu, đặc biệt khi thêm bớt một cạnh hoặc một một đỉnh nào đó.
*) Mô hình quan hệ (Relational Model)
Mô hình này dựa trên cơ sở khái niệm lý thuyết tập hợp của các quan hệ, tức là tập các K - bộ với K cốđịnh.
Thuận lợi của mô hình quan hệ là được hình thức hoá toán học chặt chẽ do
đó các xử lý, thao tác với dữ liệu là dễ dàng, có tính độc lập dữ liệu cao. Cấu trúc dữ liệu đơn giản mềm dẻo trong xử lý và dễ dàng cho người sử dụng. Đặc biệt các phép tính cập nhật dữ liệu cho mô hình quan hệ nói chung là ít phức tạp hơn nhiều so với các mô hình khác.
Một cách đơn giản hơn có thể hiểu mối quan hệ là một bảng 2 chiều tệp độc lập, trong đó mỗi cột (trường) là một thuộc tính, mỗi hàng (bộ) là một đối tượng. Trong thí dụ trên, có cấu trúc các quan hệ (bảng) như sau:
Hình 2.3. Biểu diễn bản đồ A bằng mô hình quan hệ
Nguồn: Phạm Trọng Mạnh và Phạm Vọng Thành (1999) Trong 3 loại mô hình nêu trên thì mô hình quan hệ có nhiều ưu điểm và
được nhiều người quan tâm hơn cả. Bởi lẽ, mô hình dữ liệu quan hệ có tính độc lập rất cao, lại dễ dàng sử dụng. Điều quan trọng hơn cả, mô hình quan hệ được hình thức hoá toán học tốt, do đó được nghiên cứu, phát triển và cho được nhiều kết quả lý thuyết cũng hưứng dụng trong thực tiễn.
Trên cơ sở mô hình dữ liệu quan hệ, đến nay đã phát triển thêm một số
loại mô hình khác nhằm mô tả và thể hiện thế giới thực một cách chính xác và phù hợp hơn như mô hình quan hệ thực thể (Entily Relationship model), mô hình dữ liệu hướng đối tượng (Object Oriented Model).
2.2.1.2. Giới thiệu về cấu trúc của hệ thống cơ sở dữ liệu đất đai
CSDL đất đai bao gồm CSDL địa chính, CSDL QHSDĐ, CSDL giá đất và CSDL thống kê, kiểm kê đất đai.
Một cơ sở dữ liệu của hệ thống CSDL đất đai gồm 2 loại dữ liệu cơ bản: dữ liệu không gian và dữ liệu phi không gian (hay thuộc tính). Mỗi loại có những
đặc điểm riêng về số liệu, phương pháp xử lý, lưu trữ và hiển thị.
Số liệu không gian là những mô tả số của đối tượng, bao gồm toạđộ vị trí
đất đai, các ký hiệu dùng để xác định một hình ảnh đất đai cụ thể trên bản đồ. Số liệu thuộc tính là những diễn tả đặc tính, số lượng, chất lượng, tính chất. Và mối quan hệ của đặc tính không gian của đất đai.
Giữa hai loại dữ liệu có mối quan hệ chặt chẽ với nhau. Chúng liên kết với nhau thông qua một cơ chế chung thống nhất.
chính có liên quan đến tài chính đất đai, để cung cấp cho người sử dụng cả bộ hồ
sơ với thông tin đầy đủ khi có nhu cầu. Các phần này liên kết chặt chẽ với nhau tạo thành một cơ sở dữ liệu thông tin vềđất đai thống nhất và hoàn chỉnh.
2.2.1.3. Hệ thống thông tin địa lý
a. Khái niệm hệ thống thông tin địa lý
Ở bất kỳ một ngành khoa học kỹ thuật hay kinh tế chúng ta đều có thể bắt gặp các hệ thống thông tin và các phương pháp xử lý thông tin khác nhau. Tùy theo từng lĩnh vực ( hệ thống thông tin ngân hàng, hệ thống thông tin quân sự,…) cùng với sự phát triển của công nghệ thông tin, các thông tin hiện nay đã đáp ứng và giải quyết được những bài toán rất lớn và thực tếđặt ra.
Trong lĩnh vực hoạt động của xã hội, thông tin là mạch máu chính của các công cụ quản lý: quản lý xã hội nói chung và quản lý đất đai nói riêng, dù sử
dụng công cụ nào thô sơ hay hiện đại đều là thu thập và xử lý thông tin.
Thông tin đất đai là tất cả các thông tin liên quan đến đất đai, thông tin đất
đai thường được thể hiện bằng hệ thống thông tin địa lý và hệ thống thông tin
đất. Hai vấn đề này là cơ sở chính của hệ thống thông tin định hướng theo từng ô thửa và các hoạt động của nó.
Cho đến nay, có rất nhiều cách khác nhau định nghĩa về GIS, tuỳ vào nhiệm vụ, chức năng của mỗi hệ thống thông tin địa lý mà có nhiều định nghĩa khác nhau, cụ thể là:
- Định nghĩa 1: GIS như là một công cụ
“Một bộ công cụ mạnh mẽ cho việc thu thập. lưu trữ, truy cập, chuyển đổi và hiện thị dữ liệu không gian từ thế giới thực cho các mục đích cụ thể” (Burrough. P.A 1993, 1998).
- Định nghĩa 2: GIS là một hệ thống thông tin
“ Một hệ thống thông tin được thiết kế để làm việc với các dữ liệu tham chiếu bởi các toạđộ không gian hoặc địa lý. Nói cách khác, GIS là một hệ thống cơ sở dữ liệu với khả năng cụ thể cho dữ liệu tham chiếu không gian, cũng như
một tập hợp các thao tác phân tích dữ liệu”.
- Định nghĩa 3: GIS đóng vai trò trong xã hội
“Một hoạt động được tổ chức bởi con người mà đo lường và thể hiện các hiện tượng vật lý, và sau đó chuyển đổi sự thể hiện đó thành hình thức khác, trong khi tương tác với cấu trúc xã hội” (Chirisman, 1999 P.13).
- Định nghĩa 4: “GIS là hệ thống phần cứng , phần mềm, dữ liệu, con người, tổ chức, và sự sắp xếp có tổ chức cho việc thu thập, lưu trữ, phân tích, và phổ biến thông tin trên trái đất”.
Tóm lại, định nghĩa tổng quát theo Burrought (1986): “ Hệ thống thông tin
địa lý (GIS) như là một tập hợp các công cụ cho việc thu thập, lưu trữ, thể hiện và chuyển đổi các dữ liệu mang tính chất không gian từ thế giới thực để giải quyết các bài toán ứng dụng phục vụ mục đích cụ thể”.
b. Thành phần cơ bản của GIS
Một hệ thống thông tin địa lý bao gồm phần cứng, phần mềm, dữ liệu, con người và bộ quy định ở cấp độ tổ chức. Các hợp phần này phải được hợp nhất tốt
để phục vụ cho việc sử dụng GIS hiệu quả; và sự phát triển và tương thích của các hợp phần là một quá trình lặp đi lặp lại theo chiều hướng phát triển liên tục. Việc lựa chọn và trang bị phần cứng và phần mềm thường là những bước dễ dàng nhất và nhanh nhất trong quá trình phát triên một hệ GIS. Việc thu thập và tổ
chức dữ liệu, phát triển nhân sự và thiết lập các quy định cho vấn đề sử dụng GIS thường khó khăn hơn và tốn nhiều thời gian hơn (Lê Bảo Tuấn, 2011).
Hình 2.4. Các thành phần của GIS
Người sử dụng
GIS
c. Chức năng của GIS
Các chức năng của GIS có thể chia làm năm loại như sau: • Thu thập dữ liệu.
• Xử lý sơ bộ dữ liệu.
• Lưu trữ và truy nhập dữ liệu. • Tìm kiếm và phân tích không gian. • Hiển thịđồ họa và tương tác.
Sức mạnh các chức năng của hệ thống GIS khác nhau là khác nhau. Kỹ
thuật xây dựng các chức năng trên cũng rất khác nhau. Quan hệ giữa các nhóm chức năng và cách biểu diễn thông tin khác nhau của GIS được thể hiện qua hình 2.1 mô tả quan hệ giữa các nhóm chức năng và cách biểu diễn thông tin khác nhau của GIS. Hình 2.5. Các nhóm chức năng của GIS Xử lý sơ bộ dữ liệu Hiện tượng quan sát Tài liệu, bản đồ giấy Thu thập dữ liệu Dữ liệu thô Lưu trữ và khai thác Hiển thị và tương tác Dữ liệu có cấu trúc Tìm kiếm và phân tích Diễn giải CSD L Thiết bị hiển thị
Chức năng thu thập dữ liệu tạo ra dữ liệu từ các quan sát hiện tượng thể
giới thực và từ các tài liệu, bản đồ giấy, đôi khi chúng có sẵn dưới dạng số. Kết quả ta có tập “dữ liệu thô”, có nghĩa là dữ liệu này không được phép áp dụng trực tiếp cho chức năng truy cập và phân tích hệ thống. Chức năng xử lý sơ bộ dữ liệu sẽ biến đổi dữ liệu thô thành dữ liệu có cấu trúc để sử dụng trực tiếp các chức năng tìm kiếm và phân tích không gian. Kết quả của tìm kiếm và phân tích được xem như là diễn giải dữ liệu, đó là tổ hợp hay biến đổi đặc biệt của dữ liệu có cấu trúc. Hệ thống GIS phải có phần mềm công cụđể tổ chức và lưu giữ các loại dữ liệu khác nhau, từ dữ liệu thô đến dữ liệu diễn giải. Phần mềm công cụ này phải có các thao tác lưu trữ, truy cập đồng thời có khả năng hiển thị, tương tác đồ
họa với tất cả các loại dữ liệu (Lê Bảo Tuấn, 2011).