Quản trị dữ liệu Multimedia trong hệ thống thông tin địa lý Phạm Thị Thanh Trà Trường Đại học Công nghệ Luận văn Thạc sĩ ngành: Công nghệ thông tin; Mã số: 1.01.10 Người hướng dẫn: PGS. TS. Nguyễn Đình Hoá Năm bảo vệ: 2008 Abstract: Giới thiệu về GIS đa phương tiện, dữ liệu và quản trị dữ liệu nói chung trong một số hệ thông tin địa lý điển hình (dữ liệu không gian, dữ liệu thuộc tính), các cách lưu trữ và quản lý dữ liệu khác nhau trong các hệ thống trên. Xây dựng WebGis giấu dữ liệu đa phương tiện bằng các công cụ mã nguồn mở, bao gồm các mô hình mở và các đặc tả chuẩn mở để phát triển hệ thống GIS nói chung và WebGis nói riêng, đặc biệt chú trọng các công cụ mã nguồn mở như MapServer, PostgreSQL, PostGIS Xây dựng ứng dụng minh hoạ, trong đó phân tích các bước tạo dữ liệu, cách quản trị dữ liệu đa phương tiện trong ứng dụng và triển khai cụ thể đối với WebGis giới thiệu danh lam thắng cảnh Hà Nội Keywords: Dữ liệu đa phương tiện; Hệ thông tin địa lý; Mã nguồn mở; Quản trị dữ liệu Content MỞ ĐẦU Khái quát về hệ thông tin địa lý và hướng phát triển GIS (Geography Information System - Hệ thống thông tin địa lý) là công nghệ đang rất được chú ý phát triển tại Việt Nam trong thời gian gần đây. GIS có rất nhiều ứng dụng trong phát triển kinh tế xã hội, quản lý tài nguyên môi trường, phục vụ đời sống, dịch vụ công ích và nhiều lĩnh vực khác. Về lịch sử, hệ thống thông tin địa lý là một nhánh của công nghệ thông tin được hình thành vào những năm 1960 và phát triển rất mạnh thành một lĩnh vực riêng. Ngày 17/11 đã được lấy làm ngày GIS, một sự kiện hàng năm do Hội địa lý quốc gia Mỹ cùng với một số nhà bảo trợ khác như ESRI (http://www.esri.com), Microsystems đứng ra tổ chức, nhằm mục đích phổ biến các kiến thức và quảng bá cho hệ thống thông tin địa lý. Có nhiều cách tiệm cận khác nhau khi định nghĩa GIS. Nếu xét dưới góc độ hệ thống, thì GIS có thể được hiểu như một hệ thống gồm các thành phần: con người, phần cứng, phần mềm, cơ sở dữ liệu và các quy trình-kiến thức chuyên gia, nơi tập hợp các quy định, quy phạm, tiêu chuẩn, định hướng, chủ trương ứng dụng của nhà quản lý, các kiến thức chuyên ngành và các kiến thức về công nghệ thông tin. Theo cách tiếp cận truyền thống, GIS là một công cụ máy tính để lập bản đồ và phân tích các sự vật, hiện tượng thực trên trái đất. Công nghệ GIS kết hợp các thao tác cơ sở dữ liệu thông thường (như cấu trúc hỏi đáp) và các phép phân tích thống kê, phân tích không gian. Những khả năng này phân biệt GIS với các hệ thống thông tin khác và khiến cho GIS có phạm vi ứng 2 dụng rộng trong nhiều lĩnh vực khác nhau (phân tích các sự kiện, dự đoán tác động và hoạch định chiến lược). Việc áp dụng công nghệ thông tin trong lĩnh vực dữ liệu không gian đã tiến những bước dài: từ hỗ trợ lập bản đồ (CAD mapping) sang hệ thống thông tin địa lý (GIS). Cho đến nay cùng với việc tích hợp các khái niệm của công nghệ thông tin như hướng đối tượng, GIS đang có bước chuyển từ cách tiếp cận cơ sở dữ liệu (database aproach) sang hướng tri thức (knowledge aproach). Hệ thống thông tin địa lý là hệ thống quản lý, phân tích và hiển thị tri thức địa lý, tri thức này được thể hiện qua các tập thông tin: - Các bản đồ: giao diện trực tuyến với dữ liệu địa lý để tra cứu, trình bày kết quả và sử dụng như là một nền thao tác với thế giới thực. - Các thông tin địa lý: chứa trong các tệp tin và trong các cơ sở dữ liệu gồm các yếu tố cơ bản, mạng lưới, topology, địa hình, thuộc tính. - Các mô hình xử lý: tập hợp các quy trình xử lý để phân tích tự động. - Các mô hình dữ liệu: GIS cung cấp công cụ mạnh hơn là một cơ sở dữ liệu thông thường bao gồm quy tắc và sự toàn vẹn giống như các hệ thông tin khác. Lược đồ, quy tắc và sự toàn vẹn của dữ liệu địa lý đóng vai trò quan trọng. - Siêu dữ liệu (metadata) hay tài liệu mô tả dữ liệu, cho phép người sử dụng tổ chức, tìm hiểu và truy nhập được tới tri thức địa lý. GIS có thể tiếp cận dưới các góc độ khác nhau: - Cơ sở dữ liệu địa lý (Geodatabase - theo cách gọi của ESRI): GIS là một cơ sở dữ liệu không gian chuyển tải thông tin địa lý theo quan điểm gốc của mô hình dữ liệu GIS (yếu tố, topology, mạng lưới, raster, ) - Hiển thị trực quan (GeoVisualization): GIS là tập các bản đồ thông minh thể hiện các yếu tố và quan hệ giữa các yếu tố trên mặt đất. Dựa trên thông tin địa lý có thể tạo nhiều loại bản đồ và sử dụng chúng như là một cửa sổ truy cập cơ sở dữ liệu để hỗ trợ tra cứu, phân tích và biên tập thông tin. - Xử lý (Geoprocessing): GIS là các công cụ xử lý thông tin cho phép tạo ra các thông tin mới từ thông tin đã có. Các chức năng xử lý thông tin địa lý lấy thông tin từ các tập dữ liệu đã có, áp dụng các chức năng phân tích và ghi kết quả vào một tập mới. Hiện nay đã có nhiều sản phẩm GIS thương mại cũng như các công cụ GIS nguồn mở với các chức năng đáp ứng những yêu cầu cơ bản của người dùng chuyên nghiệp. Hệ thông tin địa lý với dữ liệu đa phương tiện Trong xã hội bùng nổ thông tin hiện nay, dữ liệu đa phương tiện rất phổ biến nhờ có Internet, được tạo ra lưu trữ và phân phối rất tiện lợi. Điều này có ảnh hưởng trực tiếp đến công nghệ GIS. Ngoài dữ liệu GIS điển hình là dữ liệu không gian và dữ liệu thuộc tính, người ta muốn đưa vào hệ thông tin địa lý các dữ liệu đa phương tiện khác nhau. Ví dụ, cần gắn kèm với các địa điểm, công trình, khu vực địa lý … nhiều thông tin liên quan dưới các khuôn dạng dữ liệu khác nhau: - Văn bản: mô tả, giải thích, lịch sử - Đồ họa, hình ảnh: hình vẽ, sơ đồ, biểu đồ, đồ thị, ảnh chụp … - Đoạn phim video, đoạn âm thanh: diễn biến một sự kiện, một quy trình, - Hoạt hình máy tính: sự thay đổi theo không gian - thời gian - Thậm chí các mô hình 3 chiều: tệp CAD, VRML, … Vấn đề tích hợp dữ liệu đa phương tiện và GIS đặt ra là khá tự nhiên và cũng là một lĩnh vực không mới. Tuy nhiên, nó vẫn là một thách thức không nhỏ đối với những người phát triển 3 ứng dụng. Việc tìm hiểu toàn diện vấn đề và xem xét các giải pháp từ lựa chọn công nghệ, thiết kế ứng dụng đến triển khai cài đặt là cần thiết. Nội dung và ý nghĩa của đề tài Xuất phát từ các lý do trên, chúng tôi đã chọn đề tài” Quản trị dữ liệu Multimedia trong hệ thông tin địa lý” . Mục đích của đề tài là tìm hiểu về tích hợp dữ liệu đa phương tiện như hình ảnh, âm thanh, video, hoạt hình, … vào hệ thông tin địa lý, làm cho hệ thống trở nên hấp dẫn hơn, hữu dụng hơn với đông đảo người dùng. Việc xử lí dữ liệu đa phương tiện đính kèm các đối tượng trong hệ thông tin địa lí sẽ được tìm hiểu trên cơ sở xem xét công nghệ tổ chức dữ liệu và cơ sở dữ liệu địa lý của các hệ thống GIS phổ biến, thương mại cũng như mã nguồn mở. Đề tài sẽ tập trung tìm hiểu sâu hơn về các cơ sở công nghệ hiện đại để xây dựng một ứng dụng WebGIS mã nguồn mở, hỗ trợ nhiều chức năng xử lí các dữ liệu đa phương tiện, hỗ trợ chia sẻ thông tin trên mạng Internet. Một ứng dụng minh họa được xây dựng bằng Mapserver và hệ quản trị CSDL PosgreSQL, giới thiệu danh lam thắng cảnh Hà Nội. Ý nghĩa thực tiễn là ở chỗ có thể sử dụng ứng dụng minh họa đã xây dựng như một bản thử nghiệm để hoàn thiện thành ứng dụng hoàn chỉnh. Cũng có thể theo mô hình này để phát triển các ứng dụng WebGIS trong nhiều lĩnh vực khác như quản lí hành chính, tài nguyên môi trường, hướng dẫn du lịch, v.v Các nội dung nghiên cứu Để đạt được mục đích trên, cần thực hiện các nhiệm vụ cụ thể sau: - Tìm hiểu một số hệ thông tin địa lí phổ biến như MapInfo, ArcGIS, Grass chú trọng đến các mô hình dữ liệu địa lý, tổ chức cơ sở dữ liệu địa lý và khả năng lưu trữ và hiển thị dữ liệu đa phương tiện. - Tìm hiểu các kết quả đã có về vấn đề tích hợp dữ liệu đa phương tiện với hệ thông tin địa lý và phát triển GIS đa phương tiện. - Tìm hiểu mô hình phát triển hệ thống WebGIS, chú trọng các công nghệ theo chuẩn mở và các công cụ mã nguồn mở như MapServer, PostgreSQL, PostGIS… - Xây dựng một ứng dụng minh họa WebGIS bằng Mapserver và PostgreSQL, cho phép hiển thị dữ liệu đa phương tiện đính kèm các đối tượng trên bản đồ. Cần nghiên cứu nắm vững quá trình tương tác giữa hệ thông tin địa lý với hệ quản trị cơ sở dữ liệu, cụ thể là khả năng lưu trữ và hiển thị các dữ liệu đa phương tiện của hệ quản trị dữ liệu PostgreSQL kết hợp với Mapserver. Bố cục của luận văn Bố cục của luận văn gồm có các phần như sau: Mở đầu: Đặt vấn đề về tính cần thiết của đề tài, cũng như nhiệm vụ, mục đích của đề tài, nêu ý nghĩa khoa học và thực tiễn của đề tài. Chương 1: Giới thiệu về GIS đa phương tiện, dữ liệu và quản trị dữ liệu nói chung trong một số hệ thông tin địa lý điển hình (dữ liệu không gian, dữ liệu thuộc tính). Các cách lưu trữ và quản lý dữ liệu khác nhau trong các hệ thống trên Đặc biệt chú trọng khả năng quản trị dữ liệu đa phưong tiện trong các hệ GIS này để hiểu nền tảng lý thuyết của các giải pháp tổ chức dữ liệu đa phương tiện. Chương 2: Trình bày về WebGis và mục tiêu ứng dụng. Các mô hình mở và các đặc tả chuẩn mở để phát triển hệ thống GIS nói chung và WebGIS nói riêng. Đặc biệt chú trọng các công cụ mã nguồn mở như MapServer, PostgreSQL, PostGIS… Chương 3: Xây dựng ứng dụng minh họa, trong đó phân tích các bước tạo dữ liệu, cách quản trị dữ liệu đa phương tiện trong ứng dụng và triển khai cụ thể. Kết luận: Đánh giá kết quả đã đạt được, xác định những ưu nhược điểm và hướng phát triển trong tương lai. References 4 Tiếng Việt 1. Bùi Quang Vinh - Viện CNTT/Trung tâm KHKT và CNQS/Bộ Quốc Phòng. Xây dựng hệ thông tin địa lý trong môi trường mã nguồn mở - Tham luận 2. Đặng Văn Đức. Hệ thông tin địa lý. Nhà xuất bản Khoa học và Kỹ thuật - 2001. 3. Nguyễn Đình Minh. Ứng dụng Viễn thám và hệ thông tin địa lý nghiên cứu hiện trạng tài nguyên lãnh thổ các tỉnh dọc sông Hồng Việt Nam - Luận văn tiến sĩ. 4. Nguyễn Đăng Vỹ - Trung tâm Công nghệ phần mềm Thuỷ lợi,Viện Khoa học Thuỷ lợi. Một cách tiếp cận xây dựng hệ thống thông tin địa lý trên mạng diện rộng trên cơ sở công nghệ nền của ESRI - Tham luận. 5. Trần Lưu Chương - Ban QL Khu CNC Hòa Lạc, Bộ KHCN-, Đỗ Văn Lộc - Văn phòng CNTT, Bộ KHCN. Về một Kế hoạch khung cho việc triển khai Ứng dụng và Phát triển Phần mềm nguồn mở ở Việt nam trong giai đoạn đến năm 2005 - Tham luận Tiếng Anh 6. Bär, H.R. and Sieber, R. 1997. Atlas of Switzerland – Multimedia Version. Concepts, functionality and interactive techniques. Proceedings of the 18th ICA/ACI International Cartographic Conference ICC, Stockholm. 1141–1149. 7. Bill, R. 1998. Multimedia-GIS: Concepts and applications. GIS, Zeitschrift für raumbezogene Information und Entscheidungen 11(2). 21–24. 8. Craglia, M. and Raper, J. 1995. Guest Editorial: GIS and multi-media. Environment and Planning B: Planning and Design 22(1). 634–636. 9. T. Horanont, N. K. Tripathi, and V. Raghavan,” A Comparative Assessment of Internet GIS Server Systems,” vol. 2005, 2002. 10. Hurni, L., Bär, H.R. and Sieber, R. (1999). The Atlas of Switzerland as an interactive multimedia atlas information system. In: W. Cartwright, 11. Nghiem Vu Khai, Takashi Fujita, Venkatesh Raghavan, Hoang Minh Hien, Nguyen Dinh Duong. GIS IDEAS. Internationl Symposium on GeoInfomatics for Spatial - Infrastructure Deverlopment in Earth and Allied Sciences, Hanoi 16-18 September 2004. The Japan- Vietnam GeoInfomatics Consortium (JVGC). 12. M. Peterson and G. Gartner (Eds.): Multimedia Cartography. Springer. 13. Schneider B., 1999, Integration of analytical GIS-functions in Multimedia Atlas Information Systems, http://www.schneidercorp.com/ 14. Siekierska, E.M. and Palko, S. 1986. Canada's electronic atlas. Auto Carto: International Conference on the acquisition, management and presentation of spatial data, London. 409–417. 15. M. Weidenbach, U. Pröbstl, Multimedia GIS: A New Tool For Landuse Planning 5 . tiện, dữ liệu và quản trị dữ liệu nói chung trong một số hệ thông tin địa lý điển hình (dữ liệu không gian, dữ liệu thuộc tính), các cách lưu trữ và quản lý dữ liệu khác nhau trong các hệ thống. tiện, dữ liệu và quản trị dữ liệu nói chung trong một số hệ thông tin địa lý điển hình (dữ liệu không gian, dữ liệu thuộc tính). Các cách lưu trữ và quản lý dữ liệu khác nhau trong các hệ thống. tiện; Hệ thông tin địa lý; Mã nguồn mở; Quản trị dữ liệu Content MỞ ĐẦU Khái quát về hệ thông tin địa lý và hướng phát triển GIS (Geography Information System - Hệ thống thông tin địa lý)