2.3.1. Siêu dữ liệu là gì?
Siêu dữ liệu là tài liệu tổng thể cung cấp nội dung, chất lượng, loại, sự tạo dữ liệu, và các thơng tin về khơng gian địa lý về các tập hợp dữ liệu. Nĩ được lưu trữ trong bất kỳ định dạng nào như một tệp tin văn bản, XML, hoặc một bản ghi CSDL. Vì kích cỡ nhỏ
của nĩ được sánh với dữ liệu mà nĩ diễn tả, siêu dữ liệu ngày càng dễ dàng chia sẻ. Bằng việc tạo và chia sẻ siêu dữ liệu, thơng tin về dữ liệu cĩ sẵn trở nên sẵn sàng đối với bất kỳ
ai tìm kiếm nĩ. Siêu dữ liệu làm cho dữ liệu dễ dàng được khám phá hơn và giảm sự lặp lại dữ liệu. Nhiều phần mềm GIS lưu trữ siêu dữ liệu với các tập hợp dữ liệu chi tiết và cĩ thể thêm vào chỉ mục siêu dữ liệu ngay bên trong CSDL cho việc chia sẻ. Nhiều phần mềm GIS sử dụng chuẩn XML cho việc xử lý siêu dữ liệu.
Siêu dữ liệu cĩ một thành phần khơng gian địa lý như một quy mơ của thế giới mà dữ liệu bao phủ. Siêu dữ liệu cĩ thể diễn tảđược dữ liệu GIS, một dịch vụ Web GIS, hoặc một chủng loại siêu dữ liệu trực tuyến. Siêu dữ liệu cũng diễn tảđược dữ liệu phi điện tử
như là các bản đồ giấy hoặc các dữ liệu điện tử khơng trực tuyến như là dữ liệu lưu trên
cũng biết tới như là một dịch vụ phân loại. Hai loại dịch vụ phân loại siêu dữ liệu GIS nổi tiếng là Geography NetworkSM và NSDI Clearinghouse.
1) Các tiêu chuẩn siêu dữ liệu
Các tổ chức tiêu chuẩn định nghĩa ra các tiêu chuẩn siêu dữ liệu. Bằng việc tuân theo một chuẩn siêu dữ liệu chung, các tổ chức ngày càng cĩ khả năng chia sẻ dữ liệu. Một tiêu chuẩn quan trọng ở Mỹ là FGDC cho siêu dữ liệu địa lý kỹ thuật số, ấn hành lần
đầu tiên năm 1998. Tổ chức tiêu chuẩn Quốc tế cũng tạo ra một tiêu chuẩn về siêu dữ liệu khơng gian.
Cả hai tiêu chuẩn FGDC và ISO đều được các phần mềm GIS cung cấp một tập hợp các cơng cụ hỗ trợ.
Một trình chỉnh sửa siêu dữ liệu
Các bảng mẫu để trình diễn siêu dữ liệu với nhiều dạng báo cáo
Một thiết bịđồng bộ tựđộng ghi lại các tính chất của tập hợp dữ liệu trong các yếu tố siêu dữ liệu thích hợp cho các tiêu chuẩn đĩ
Các phần mềm GIS rất cố gắng để hỗ trợ các chuẩn siêu dữ liệu mở rộng với cơng nghệ thích hợp.
2) Các tiêu chuẩn truyền thơng kỹ thuật số
Các phần mềm GIS tạo ra siêu dữ liệu trong dạng XML. XML khác với HTML, nĩ diễn tả nội dung dữ liệu cĩ cấu trúc hơn là hiển thị các tính chất. XML là một tiêu chuẩn cơng nghiệp mở là nền tảng trung gian và định hướng để xuất bản và phân phối thơng tin sử dụng Internet. Bất cứ siêu dữ liệu nào được xuất bản trong XML hợp lý cũng được chấp nhận bởi bất kỳ dịch vụ siêu dữ liệu nào.
Z39.50 là một tiêu chuẩn mở, là một giao thức truyền thơng nổi tiếng từ lâu cho việc chia sẻ thơng tin trên các mạng WAN. Các máy khách và các máy chủ cĩ thể gửi và nhận các yêu cầu và đáp ứng bằng việc sử dụng giao thức Z39.50. Tiêu chuẩn FGDC sử
dụng Z39.50 để triển khai NSDI, cho phép tìm kiếm dữ liệu khơng gian ngay trên Internet.
Sử dụng Z39.50 để tham gia vào các tiêu chuẩn NSDI
Các phần mềm ứng dụng của GIS như ArcIMS 4.0.1 cung cấp trình kết nối Z39.50, cho phép biên dịch các yêu cầu và các đáp ứng giữa Z39.50 và các giao thức bên
trong ứng dụng. Điểm mấu chốt của các tình kết nối là các dịch vụ siêu dữ liệu cĩ thể
ngay lập tức trở thành các nút trên mạng NSDI.
2.3.2. Tại sao siêu dữ liệu quan trọng đối với GIS?
Chúng ta thấy một tầm nhìn của việc chia sẻ dữ liệu tồn cầu bằng việc tạo ra cơng nghệ hỗ trợ siêu dữ liệu. Siêu dữ liệu tạo ra các thơng tin khơng gian hữu dụng hơn tất cả các loại dữ liệu của người sử dụng bằng việc tạo ra nĩ một cách dễ dàng hơn để lưu trữ và định vị các tập hợp dữ liệu. Tính sẵn cĩ tăng lên của tất cả các loại dữ liệu từ nhiều nguồn khác nhau giúp cơng nghệ GIS trở nên càng hữu dụng hơn và ngày càng được chấp nhận rộng rãi hơn. Với sự hỗ trợ siêu dữ liệu, những nhà sản xuất dữ liệu cĩ thể xuất bản thơng tin về dữ liệu, và dữ liệu được tiêu thụ cĩ thểđược tìm kiếm cho dữ liệu họ cần. Vì dữ liệu khơng gian là nhiên liệu của GIS, thật quan trọng quan trọng để biết được nếu dữ
liệu là phù hợp với người cần nĩ. Người sử dụng dữ liệu cần siêu dữ liệu để dịnh vị thích hợp các tập hợp dữ liệu. Siêu dữ liệu cung cấp thơng tin về dữ liệu sẵn cĩ bên trong một tổ chức hoặc từ các dịch vụ phân loại, các tổ chức tiêu chuẩn hoặc các nguồn từ bên ngồi. Siêu dữ liệu khơng chỉ giúp tìm kiếm dữ liệu, dữ liệu được tìm thấy chỉ một lần, mà cịn cho chúng ta thấy cách để biên dịch và sử dụng dữ liệu. Việc xuất bản siêu dữ liệu làm dễ dàng cho việc chia sẻ dữ liệu. Chia sẻ thơng tin giữa các tổ chức khuyến khích các tổ chức, các liên hợp, tích hợp tiếp cận các vấn đề liên quan tới khơng gian địa lý.
1) Siêu dữ liệu và quản lý GIS
Lưu trữ các bản ghi siêu dữ liệu khơng gian là rất quan trọng. Từ một phối cảnh quản lý dữ liệu, siêu dữ liệu là quan trọng đối với việc duy trì nguồn đầu tư về dữ liệu khơng gian địa lý của một tổ chức. Siêu dữ liệu làm lợi cho một tổ chức theo các cách sau:
Cung cấp một bảng kiểm kê cho tài sản dữ liệu Giúp xác định và duy trì giá trị của dữ liệu
Giúp bạn xác định độ tin cậy và độ chính xác của dữ liệu Hỗ trợ việc tạo đưa ra quyết định
Lưu thành tài liệu các vấn đề về pháp lý
Giúp giữ dữ liệu chính xác và giúp kiểm định chính xác để hỗ trợ tốt việc
đưa ra quyết định tốt và tiết kiệm chi phí
Giúp xác định ngân sách vì nĩ cung cấp một sự hiểu biết rõ ràng khi nào hoặc dữ liệu là cần thiết được cập nhật hoặc được đầu tư mới
Cả hai dữ liệu và thời gian đều tiêu hao tiền bạc. Một GIS phát triển kế hoạch đưa siêu dữ liệu vào sự tính tốn từ lúc bắt đầu với việc tiết kiệm thời gian và tiền bạc sau đĩ. Dữ liệu tiếp tục tiêu tốn và trở thành một phần lớn nhất của ngân sách GIS, thường là nhiều hơn chi phí cho nhân viên. Nếu siêu dữ liệu là một phần của các thủ tục hoạt động theo tiêu chuẩn, tạo ra các siêu dữ liệu mà thực tế khơng mất chi phí nào. Thời gian và sự
nỗ lực liên quan tới siêu dữ liệu cần được đưa vào ngân sách hoặc kế hoạch dự án của mỗi hoạt động GIS.
Ví dụ, vì cơng nghệ GIS cĩ thể cung cấp các biểu diễn dữ liệu một cách chi tiết, trực quan, nĩ là một nguồn tuyệt đối quan trọng đáp ứng trong các trường hợp khẩn cấp. Các nhà quản lý giáp mặt với các vấn đề an tồn nội bộ biết rằng họ cần truy cập nhanh tới nhiều loại dữ liệu để đáp ứng nhanh chĩng và hiệu quả. Siêu dữ liệu là chìa khố để
cug cấp thơng tin đúng lúc và cĩ thể dễ dàng được truy cập và chia sẻ thơng qua các danh giới nhiều vùng với tất cả các mức của một chính phủ. Trong trường hợp khẩn cấp, các nhà quản lý cũng cần chia sẻ một cách chính xác, cập nhật thơn gtin với phương tiện truyền thơng và cơng cộng.
Siêu dữ liệu nên là một phần tiêu chuẩn của bất kỳ GIS nào và nĩ khơng phải là một chức năng mở rộng. Siêu dữ liệu là một thành phần cơ bản của mỗi sự thực thi của người sử dụng. Những cơng cụ để tạo và quản lý siêu dữ liệu là các cơng nghệ chủ chốt
để chia sẻ thơng tin địa lý và xây dựng những tổng thể.
2) Truy cập siêu dữ liệu
Các nhà quản lý GIS phải điều khiển truy cập dữ liệu và siêu dữ liệu GIS. Các phần mềm GIS cung cấp các truy cập thích hợp đến siêu dữ liệu trên máy chủ. Những
người khác nhau cĩ thể cĩ các mức độ khác nhau để truy cập: duyệt Web, xuất bản, và quản trị.
2.3.3. Các ứng dụng GIS hỗ trợ siêu dữ liệu như thế nào?
Các dịch vụ siêu dữ liệu GIS cho phép những người sử dụng cá nhân hố và tập trung lưu trữ trực tuyến siêu dữ liệu với bất kỳ mức nào – Intranet hoặc Internet.
Các dịch vụ siêu dữ liệu được xây dựng trên tính chức năng của các sản phẩm ứng dụng GIS sẵn cĩ như 3 sản phẩm của ESRI sau:
Ứng dụng ArcGIS ArcCatalog™ được sử dụng để tạo và bản quyền hố siêu dữ liệu và gửi đi một dịch vụ siêu dữ liệu.
ArcIMS and ArcSDE™—các máy chủ ArcIMS quản lý các dịch vụ siêu dữ
liệu; ArcSDE là giao diện của CSDL quan hệ lưu trữ các tài liệu siêu dữ
liệu.
ArcCatalog, Metadata Explorer, Web browsers, hoặc các máy khách Z39.50 cĩ thể truy cập siêu dữ liệu lưu trữ trong một dịch vụ siêu dữ liệu.
Hình 2.9 Các ứng dụng hỗ trợ siêu dữ liệu
1) Bản quyền hố siêu dữ liệu
ArcCatalog, một ứng dụng bao gồm ArcGIS, tự động cập nhật siêu dữ liệu khi cĩ thể. Ví dụ, phạm vi và hệ toạđộ khơng gian cĩ thể tự động được đáp ứng. ArcCatalog tự động chèn siêu dữ liệu vào các tập hợp dữ liệu đảm bảo tính tồn vẹn. ArcCatalog sẽ làm
khi làm mới các thuộc tính được thêm vào sau khi bạn thấy với siêu dữ liệu, ArcCatalog tựđộng cập nhật với thơng tin mới.
ArcCatalog cĩ thể gửi dữ liệu tới dịch vụ siêu dữ liệu ArcIMS, dữ liệu yêu cầu ít nhất một trong các mục sau: Tiêu đề Người xuất bản Phạm vi khơng gian Chủđề dữ liệu Loại nội dung
a) Các cơng cụ siêu dữ liệu dựa trên các tiêu chuẩn
ArcCatalog trở thành trình soạn thảo siêu dữ liệu mà bạn cĩ thể sử dụng để lưu trữ
dữ liệu của bạn. Hai trình soạn thảo sẵn cĩ trong ArcCatalog để tạo ra siêu dữ liệu. Một trình tuân theo chuẩn FGDC và một trình tuân theo chuẩn ISO. Với mỗi tiêu chuẩn, ArcCatalog cung cấp các thành phần:
Trình đồng bộ ( để tựđộng nắm bắt thơng tin) Điều khiển ActiveX (trình soạn thảo)
Định nghĩa loại tài liệu (tuỳ chọn – cho việc phê chuẩn) Các bảng mẫu (cho việc biểu diễn)
Siêu dữ liệu được tạo trong ArcCatalog được lưu trữ trong định dạng XML.
b) Hỗ trợ các loại dữ liệu
ArcGIS 8 được thiết kế để tạo siêu dữ liệu cho bất kỳ tập dữ liệu nào được hỗ
trợ/tạo bởi ArcGIS cũng như các tập dữ liệu khác được định danh và phân loại bởi người dùng (ví dụ văn bản, các tệp tin CAD, các kịch bản). Hỗ trợ các tập dữ liệu sau:
Các mức bao phủ ArcInfo™ Các tệp hình khối ESRI Các bản vẽ CAD Các hình ảnh Các lưới Các mạng TINs
Các CSDL ArcSDE ArcSDE cá nhân Các khơng gian làm việc Các bản đồ Các lớp Các bảng INFO™ Các bảng dBASE® Các bảng hệ quản trị CSDL Các dự án Các tệp văn bản Các kịch bản chương trình 2) Xuất bản siêu dữ liệu
Dịch vụ siêu dữ liệu với ArcIMS cĩ thể cho phép tất cả người dùng của dịch vụ
nhận các thành phần này như một phần của nhân phần mềm. Dịch vụ siêu dữ liệu ArcIMS làm cho siêu dữ liệu được tạo ra với ArcCatalog sẵn cĩ trên Internet.
a) Giao diện ArcSDE
Ứng dụng dịch vụ siêu dữ liệu ArcIMS sử dụng một CSDL ArcSDE như là một kho chứa tất cả các tài liệu siêu dữ liệu được lưu trữ. Bằng việc sử dụng ArcSDE, siêu dữ
liệu tìm kiếm cĩ thể sử dụng khả năng chỉ mục hố khơng gian của phần mềm ArcSDE. ArcIMS nhờ vào ArcSDE để lưu trữ, tìm kiếm, và truy xuất các tài liệu siêu dữ liệu. Tất cả các yêu cầu từ ArcIMS được biên dịch sang ngơn ngữ SQL và được gửi qua ArcSDE tới CSDL quan hệ. Các đáp ứng theo cùng một đường được đảo lại từ CSDL tới dịch vụ
ArcIMS. Thơng tin kết nối CSDL, như máy chủ ArcSDE , CSDL, tên người sử dụng, mật khẩu được chỉ định trong tệp cấu hình siêu dữ liệu. Vài thơng số cĩ sẵn đề điều chỉnh CSDL ArcSDE trong trường hợp đặc biệt cần thiết.
Trong việc bổ xung thêm các lớp và các bảng được tự động tạo bở ArcIMS cho một dịch vụ siêu dữ liệu, ArcSDE cĩ thểđược cá nhân hố hơn nữa để đưa ra những đáp
ứng. CSDL mặc định bao gồm tập hợp các bảng được sử dụng để lưu trữ các tài liệu xuất bản và thơng tin phức tạp.
b) Hỗ trợ tiêu chuẩn
Trong trường hợp đơn giản nhất, một dịch vụ siêu dữ liệu chỉ cung cấp thơng tin sao lưu cho dịch vụđĩ. Để mở rộng một lượng siêu dữ liệu, dịch vụ siêu dữ liệu đĩ phải trả về một truy vấn, ArcIMS cung cấp một kỹ thuật để tích hợp với các ấn bản siêu dữ
liệu khác. ArcIMS Metadata Explorer cĩ thể khởi đầu một tìm kiếm phân phối thơng qua các yêu cầu tìm kiếm siêu dữ liệu trên chuẩn dịch vụ siêu dữ liệu NSDI, những nền tảng phân phối tìm kiếm thực sự. Một cách tiếp cận khác là thực sự sao lưu siêu dữ liệu từ các dịch vụ khác, cách tiếp cận này được gọi là thu hoạch. Thu hoạch cĩ nghĩa là nhập vào nội dung của dịch vụ siêu dữ liệu khác vào dịch vụ siêu dữ liệu của bạn. Bạn cũng cĩ thể
xuất ra nội dung của dịch vụ siêu dữ liệu của bạn với dịch vụ khác để thu hoạch. Các tổ
2.4. Quản trị dữ liệu
Quản lý dữ liệu là một là sự suy xét chính khi phát triển các kiến trúc GIS doanh nghiệp. GIS doanh nghiệp thường mang lợi ích từ những sự nỗ lực để củng cố các nguồn dữ liệu GIS trung gian. Những lý do này bao gồm sự tăng cường người sử dụng truy cập và các nguồn dữ liệu, cung cấp sự bảo vệ dữ liệu tốt hơn, và tăng cường chất lượng của dữ liệu. Sự củng cố của cơng nghệ thơng tin hỗ trợ các nguồn cũng làm giảm chi phí cho phần cứng và chi phí cho tổng thể việc quản trị hệ thống.
Cách đơn giản nhất và hiệu quả chi phí nhất là quản lý các nguồn dữ liệu là giữ
một bản sao lưu của giữ liệu bên trong một kho chứa dữ liệu trung tâm và cung cấp yêu cầu người dùng truy cập tới dữ liệu này để hỗ trợ sự duy trì dữ liệu và hoạt động truy vấn GIS và phân tích những sự cần thiết.
Những cơng việc quản lý dữ liệu này bao gồm: Các cách để bảo vệ dữ liệu khơng gian
Các cách để sao lưu dự phịng dữ liệu khơng gian Các cách để di chuyển dữ liệu khơng gian
Các cách mới để truy cập dữ liệu khơng gian
Sự hỗ trợ cho các giải pháp CSDL phân phối được giới thiệu một cách truyền thống các hoạt động rủi ro cao, với tiềm tàng của nguy cơ hỏng dữ liệu và việc sử dụng của các nguồn dữ liệu hư hỏng trong sự hỗ trợ các hoạt động GIS. Cĩ nhiều tổ chức hỗ
trợ các giải pháp phân phối hiệu quả. Thành cơng của họ dựa trên các kế hoạch cẩn thận và sự chu đáo đối với quá trình quản trị của họ mà hỗ trợ các vị trí dữ liệu phân phối. Các giải pháp quản lý CSDL phân phối trong tương lai cĩ thể giảm đáng kể rủi ro của các mơi