Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 73 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
73
Dung lượng
1,74 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THỊ THÚY NGA TÌMKIẾMĐỐITƯỢNGVÙNGTRONGGISVÉCTƠLUẬNVĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2017 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THỊ THÚY NGA TÌMKIẾMĐỐITƯỢNGVÙNGTRONGGISVÉCTƠ Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬNVĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS ĐẶNG VĂN ĐỨC THÁI NGUYÊN - 2017 i LỜI CAM ĐOAN Tôi xin cam đoan tất nội dung luậnvăn hoàn toàn hình thành phát triển từ quan điểm cá nhân tôi, hướng dẫn bảo PGS.TS Đặng Văn Đức Các số liệu kết có luậnvăn tốt nghiệp hoàn toàn trung thực Học viên Nguyễn Thị Thúy Nga ii LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS.ĐặngVăn Đức, Viện Công nghệ thông tin – Viện Hàn lâm Khoa học Công nghệ Việt Nam,Thầy tận tình bảo giúp đỡ suốt trình nghiên cứu hoàn thành luậnvăn Xin chân thành cảm ơn quý Thầy Cô cán nhân viên Phòng Đào Trường Đại học Công nghệ Thông tin Truyền thông, Đại học Thái Nguyên nhiệt tình giảng dạy, trang bị cho kiến thức quý báu giúp đỡ mặt suốt thời gian học tập trường Xin cảm ơn bạn lớp đồng nghiệp nơi công tác tạo điều kiện cho hoàn thành luậnvăn Xin gửi lời cảm ơn tới gia đình động viên suốt trình học tập hoàn thành luậnvăn iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii MỤC CÁC HÌNH VẼ, ĐỒ THỊ iv MỞ ĐẦU CHƯƠNG 1:TỔNG QUAN VỀ HỆ THỐNG TÌMKIẾM NỘI DUNG VÀ DỮ LIỆU KHÔNG GIAN VECTƠ 1.1.Mô hình tổng quát hệ thống tìmkiếm sở nội dung 1.2 Biểu diễn cấu trúc liệu không gian vectơ 11 CHƯƠNG 2: MỘT SỐ KỸ THUẬT TÌMKIẾMĐỐITƯỢNGVÙNGTRONG BẢN ĐỒ VECTƠ 19 2.1 Khái quát tìmkiếmđốitượng sở hình dạng 19 2.2 Đặc trưng hình dạng đơn giản 21 2.3 Moment bất biến 22 2.4 Phương pháp mô tả Fourier 25 2.5.Biểu diễn hình dạng sở lưới vùng 30 CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM 40 3.1 Quy trình tổng quan 40 3.2.Trích xuất vùng từ CSDL địa lý 42 3.3.Hiển thị liệu địa lý 43 3.4.Hiển thị vùng đầu vào chọn 44 3.5.Tìm kiếmvùngtương tự 45 3.6.Thử nghiệm với số vùng đầu vào 46 TÀI LIỆU THAM KHẢO 56 PHỤ LỤC 57 iv MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình1.1: Mô hình tổng thể hệ thống tìmkiếm thông tin Hình1.2: Kiến trúc tổng thể hệ thống tìmkiếm ảnh Hình 1.3: Đánh giá hiệu hệ thống 10 Hình 1.4: Ví dụ biểu diễn vị trí nước bị ô nhiễm 12 Hình 1.5: Ví dụ biểu diễn đường 13 Hình 1.6: Ví dụ biểu diễn khu vực hành 14 Hình 1.7: Ví dụ biểu diễn Feature đồ 16 Hình 1.8: Đốitượng point đồ 17 Hình 1.9: Đốitượng Line đồ 17 Hình 1.10: Đốitượng polyon đồ 17 Hình 2.1: Lưu đồ thuật toán tìm đặc trưng ảnh sử dụng momet hình dạng 24 Hình 2.2: Hàm dấu hiệu hình dạng 25 Hình 2.3: Hàm góc tích lũy 26 Hình 2.4: Hàm tính diện tích 26 Hình 2.5: Lưu đồ thuật toán tìm đặc trưng ảnh sử dụng mô tả Fourier 29 Hình 2.6:Ví dụ xếp chồng 30 Hình 2.7: Ví dụ chuẩn hóa co giãn 32 Hình 2.8: Ví dụ đo độ tương tự 34 Hình 2.9: Lưu đồ thuật toán tìm đặc trưng ảnh sử dụng lưới vùng 37 Hình 2.10: Lưu đồ thuật toán tìmkiếmvùngtương tự 40 Hình 3.1: Sơ đồ hệ thống 41 Hình 3.2: Màn hình chương trình 42 Hình 3.3: Bản đồ vùng tỉnh Quảng Ninh 44 v Hình 3.4: Các vùng đầu vào 45 Hình 3.5: Dữ liệu hình học vùng đầu vào 45 Hình 3.6: Hiển thị vùng đầu vào chọn 46 Hình 3.7: Kết tìmvùngtương tự với vùng 13 47 Hình 3.8: Kết tìmvùngtương tự với vùng 48 Hình 3.19: Kết tìmvùngtương tự với vùng 49 Hình 3.10: Kết tìmvùngtương tự với vùng 50 Hình 3.11: Kết tìmvùngtương tự với vùng 51 Hình 3.12: Kết tìmvùngtương tự với vùng 15 52 Hình 3.13: Kết tìmvùngtương tự với vùng 16 53 Hình 3.14: Kết tìmvùngtương tự với vùng 20 54 Hình 3.15: Kết tìmvùngtương tự với vùng 22 55 Hình P-1: Ví dụ đa giác gồm hai vành 64 Hình P-2: Lưu trữ đa giác shapefile 65 vi DANH MỤC BẢNG BIỂU Bảng P-1 Mô tả Main file header 58 Bảng P-2 Các giá trị shape type 59 Bảng P-3 Mô tả header ghi 60 Bảng P-4 Nội dung ghi biểu diễn điểm 61 Bảng P-5 Nội dung ghi biểu diễn đa điểm 62 Bảng P-6 Nội dung ghi chi tiết đa đoạn 63 Bảng P-7 Nội dung ghi đa giác 65 MỞ ĐẦU Đặt vấn đề Hệ thống thông tin địa lý (GIS - Geograpgic Information System) bắt đầu sử dụng rộng rãi nước phát triển từ nhiều thập niên qua, dạng ứng dụng công nghệ thông tin nhằm mô tả giới thực (Real World) mà loài người sống-tìm hiểu-khai thác Với tính ưu việt mình, kỹ thuật GIS ngày ứng dụng nhiều lãnh vực nghiên cứu quản lý, đặc biệt quản lý quy hoạch sử dụng-khai thác nguồn tài nguyên cách bền vững hợp lý GIS chia làm hai loại chính: GISvéctơGIS raster GISvéctơ ngày sử dụng nhiều Nền tảng GIS đồ véctơ Các đồ hình thành từ đốitượng điểm, đường vùng Dạng vùng thường biểu diễn đơn vị hành chính, ao hồ, ruộng, đảo biển… Số lượng đốitượng thường lớn đồ hệ thống GIS Một toán đặt cho người sử dụng GIS thực tế là: Hãy tìmkiếm theo nội dung đốitượng dạng vùng đồ tương tự với đốitượng dạng vùng cho trước sở topo, hướng, khoảng cách [9] Như toán tương tự với toán tìmkiếm ảnh theo nội dung Luậnvăn sử dụng phương pháp, thuật toán nghiên cứu cho tìmkiếmkiếm ảnh sở vùng [2-5] CSDL ảnh để giải toán tìmkiếmđốitượng địa lý dạng vùng đồ tương tự với hình dạng đốitượng cho trước Đốitượng cho trước sinh phác họa hình máy tính hay tệp chứa ảnh, vùng đồ cần tìm Vậy, nội dung nghiên cứu luậnvăn “Tìm kiếmđốitượngvùngGISvéc tơ” bao gồm: - Một số vấn đề GISvéctơ để thấy rõ cấu trúc liệu đốitượng dạng vùng CSDL cần tìm kiếm, - Kiến trúc hệ thống tìmkiếm ảnh theo nội dung, - Các thuật toán tìmkiếm ảnh theo nội dung sở vùng, - Xây dựng chương trình thử nghiệm Đốitượng phạm vi nghiên cứu - Mô hình tổng quát hệ thống tìmkiếm sở nội dung - Biểu diễn cấu trúc liệu không gian vectơ - Các lớp thuật toán đảm bảm tính quán liệu để từ nghiên cứu, đề xuất thuật toán tối ưu đảm bảo quán liệu - Một số kỹ thuật ứng dụng tìmkiếmđốitượngvùng đồ vectơ Hướng nghiên cứu đề tài - Nghiên cứu kỹ thuật liên quan đến tìmkiếm ảnh sở hình dạng - Nghiên cứu phương pháp biểu diễn hình dạng đặc trưng hình dạng - Nghiên cứu giải pháp công nghệ cài đặt chương trình thử nghiệm Những nội dung nghiên cứu Ngoài phần mở đầu giới thiệu toán cần giải luận văn, phương pháp nghiên cứu phần kết luận trình vày kết thu nghiên cứu để giải hạn chế chúng, nội dung luậnvăn chia thành ba chương sau: Chương 1: Trình bày tổng quan hệ thống tìmkiếm ảnh theo nội dung liệu không gian véctơ Bao gồm: mô hình hệ thống tìmkiếm thông tin theo nội dung, biểu diễn cấu trúc liệu không gian GIS Chương 2: Trình bày số kỹ thuật tìmkiếm ảnh sở vùng áp dụng việc tìmkiếmđốitượng dạng vùngGISvectơ Bao gồm thuật toán tìmkiếmđốitượng sở biểu diễn vùng, thuật toán mô tả 51 Hình 3.11: Kết tìmvùngtương tự với vùng 52 Hình 3.12: Kết tìmvùngtương tự với vùng 15 53 Hình 3.13: Kết tìmvùngtương tự với vùng 16 54 Hình 3.14: Kết tìmvùngtương tự với vùng 20 55 Hình 3.15: Kết tìmvùngtương tự với vùng 22 56 3.7.Kết chương Trong chương 3, luậnvăn trình bày quy trình thử nghiệm cho toán tìmkiếmđốitượngvùng Trước hết, chương trình bày sơ đồ xử lý toán với hai nhiệm vụ Một là, truy cập liệu địa lý lấy thông tin chung thông tin hình dạng để đưa vào sở liệu Hai là, tìmkiếm sở liệu đốitượngvùng có hình dạng tương tự với vùng đầu vào Ngoài ra, chương trình thử nghiệm cho phép hiển thị đồ vùng từ sở liệu liệu địa lý, vùng đầu vào vùngtương tự tìm thấy đồ Chương trình thử nghiệm sử dụng thuật toán phủ lưới (đã trình bày chương 2) để kiểm tra độ tượng tự vùng Các kết thử nghiệm cho thấy chương trình làm việc tốt, tìmkiếmvùngtương tự hiển thị lên hình 57 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đặng Văn Đức (2001), Hệ thống thông tin địa lý, NXB Khoa học Kỹ Thuật, Hà Nội Tiếng Anh [2] Adrijit Basu (2015), Shape Based Image Representation and Retrieval, International Journal of Emerging Research in Management &Technology [3] Aratrika Sarkar, PallabiBhatttacharjee (2014), A Shape Based Image Search Technique, International Journal of Advanced Computer Science and Applications [4] Arvind [ M Bhave (2016), Shape Based Descriptors for Image Retrieval, IOSR Journal of Computer Engineering [5] Arulmozhi [ P., S.Abirami (2014), Shape Based Image Retrieval: A Review, International Journal on Computer Science and Engineering (IJCSE) [6] Jhansi [ Rani S and V Vallikumari (2016),Survey on Content Based Image Retrieval Techniques, International Journal of Trend in Research and Development [7] Guojun [ Lu (1999), Multimedia Database Management Systems, Artech House, Boston – London [8] Santhosh [ P Mathew, Philip Samuel (2010), A Novel Image Retrieval System Using an Effective RegionBased Shape Representation Technique, International Journal of Image Processing (IJIP) [9] Shashi Shekhar, Sanjay Chawla (2001), A Tour Of Spatial Databases, Department of Computer Science, University of Minnesota 58 PHỤ LỤC: Cấu trúc file Shapefile Main file header Main file header có độ dài 100 bytes trường file header với vị trí byte, giá trị, kiểu thứ tự byte chúng Trong bảng này, vị trí tươngđối tính từ vị trí bắt đầu file Bảng P-1 Mô tả Main file header Position Field Value Type Byte Order Byte File Code 9994 Integer Big Byte Unused Integer Big Byte Unused Integer Big Byte 12 Unused Integer Big Byte 16 Unused Integer Big Byte 20 Unused Integer Big Byte 24 File Length File Length Integer Big Byte 28 Version 1000 Integer Little Byte 32 Shape Type Shape Type Integer Little Byte 36 Bounding Box Xmin Double Little Byte 44 Bounding Box Ymin Double Little Byte 52 Bounding Box Xmax Double Little Byte 60 Bounding Box Ymax Double Little Byte 68* Bounding Box Zmin Double Little Byte 76* Bounding Box Zmax Double Little Byte 84* Bounding Box Mmin Double Little Byte 92* Bounding Box Mmax Double Little 59 * Không dùng có giá trị 0.0, không độ đo kiểu Z Giá trị độ dài file tổng độ dài file theo đơn vị từ 16-bit, bao gồm 50 từ (tức 100 byte) file header Tất hình dạng không null shapefile phải có kiểu shape Các giá trị kiểu cho Bảng P-2 Các giá trị shape type Giá trị Kiểu Shape Null Shape Point PolyLine Polygon MultiPoint 11 PointZ 13 PolyLineZ 15 PolygonZ 18 MultiPointZ 21 PointM 23 PolyLineM 25 PolygonM 28 MultiPointM 31 MultiPatch Hộp biên (Bounding Box) main file header chứa phạm vi thực shape file: Hình chữ nhật bé phủ toàn shape có cạnh song song với trục X Y (và có khả mở rộng với trục M Z) Nếu shapefile rỗng (không có ghi nào) giá trị Xmin, Ymin, Xmax, Ymax không xác định 60 Các header ghi Header cho ghi chứa số hiệu ghi độ dài nội dung ghi Các header ghi có độ dài cố định byte Bảng P- mô tả trường header ghi, với vị trí tính từ đầu ghi tương ứng Bảng P-3 Mô tả header ghi Position Field Byte Record Value Type Byte Order Số hiệu ghi Integer Big Độ dài nội dung Integer Big Number Byte Content Length Số hiệu ghi Độ dài nội dung ghi độ dài phần nội dung ghi theo đơn vị từ 16-bit Do đó, ghi đóng góp số lượng từ 16-bit (4 + độ dài nội dung) vào tổng độ dài file (được chứa Byte 24 file header) PL3.3 Nội dung ghi Nội dung ghi shapefile bao gồm kiểu shape, theo sau liệu hình học shape Độ dài nội dung ghi phụ thuộc vào số thành phần số đỉnh shape Tiếp sau trình bày số nội dung ghi theo kiểu shape hệ quy chiếu X, Y Kiểu Point (điểm) Một điểm bao gồm cặp tọa độ kiểu doubleprecision theo thứ tự X, Y Point { Double X // X coordinate Double Y // Y coordinate } 61 Bảng P-4 Nội dung ghi biểu diễn điểm Position Byte Field Value Shape Type Type Number Byte Order Integer Little Byte X X Double Little Byte 12 Y Y Double Little Kiểu MultiPoint (đa điểm) Biểu diễn tập điểm, sau: MultiPoint { Double[4] Box // Bounding Box Integer NumPoints // Number of Points Point[NumPoints] Points // The Points in the Set } Hộp Biên (Bounding Box) lưu theo thứ tự Xmin, Ymin, Xmax, Ymax Bảng P-5 Nội dung ghi biểu diễn đa điểm Position Field Byte Shape Value Type Number Byte Order Integer Little Box Double Little Byte 36 NumPoints NumPoints Integer Little Byte 40 Points Points Type Byte Box Point NumPoints Little Kiểu PolyLine (đa đoạn) Một PolyLine tập có thứ tự đỉnh bao gồm nhiều thành phần Một phần thành phần liên thông gồm hai đỉnh Các phần không liên thông với phần khác Các 62 phần không cắt với phần khác Do đặc tả không cấm điểm liên tục với tọa độ trùng nhau, nên đọc shapefile phải kiểm soát trường hợp Việc dẫn tới phần thoái hóa có độ dài không không phép PolyLine { Double[4] Box // Bounding Box Integer NumParts // Number of Parts Integer NumPoints // Total Number of Points Integer[NumParts] Parts // Index to First Point in Part Point[NumPoints] Points // Points for All Parts } Các trường PolyLine mô tả chi tiết sau đây: Box: Hộp Biên cho PolyLine lưu theo thứ tự Xmin, Ymin, Xmax, Ymax NumParts: Số phần PolyLine NumPoints: Tổng số điểm tất phần PolyLine Parts: Một mảng có độ dài NumParts chứa số điểm mảng điểm Các số mảng đánh từ Points: Một mảng cú độ dài NumPoints 63 Bảng P-6 Nội dung ghi chi tiết đa đoạn Position Field Value Type Number Byte Order Byte Shape Integer Little Type Byte Box Box Double Little Byte 36 NumParts NumParts Integer Little Byte 40 NumPoints NumPoints Integer Little Byte 44 Parts Parts Integer NumParts Little Byte X Points Points Point NumPoints Little Chú ý: X = 44 + * NumParts Kiểu Polygon (Đa giác) Một đa giác bao gồm một vành Một vành chuỗi đóng liên thông điểm, không tự cắt Một đa giác chứa nhiều vành Thứ tự định hướng vành mặt vành phía đa giác Lân cận bên phải người quan sát dọc theo vành theo thứ tự đỉnh thuộc vùng phía đa giác Các đỉnh vành định nghĩa lỗ rỗng đa giác theo hướng ngược chiều kim đồng hồ Các đỉnh vành đơn có thứ tự thuận chiều kim đồng hồ Các vành đa giác cho part (phần) Lưu ý điểm liên tiếp không thiết phải phân biệt, nên đọc shapefile phải xử lý tình Cấu trúc đa giác giống cấu trúc đa đoạn, sau 64 Polygon { Double[4] Box // Bounding Box Integer NumParts // Number of Parts Integer NumPoints // Total Number of Points Integer[NumParts] Parts // Index to First Point in Part Point[NumPoints] Points // Points for All Parts } Các trường đa giác mô tả chi tiết sau: Box: Hộp biên đa giác theo thứ tự Xmin, Ymin, Xmax, Ymax NumParts: Số vành đa giác NumPoints: Tổng số điểm tất vành Parts: Một mảng gồm NumParts phần tử, chứa số điểm vành mảng Points Points: Một mảng gồm NumPoints phần tử Các điểm cho vành nối tiếp điểm vành Một ví dụ đa giác gồm vành 10 điểm sau: Hình P-1 Ví dụ đa giác gồm hai vành 65 Thứ tự đỉnh lưu trữ shape file minh họa Hình P- Hình P-2 Lưu trữ đa giác shapefile Bảng P-7 Nội dung ghi đa giác Position Field Value Type Number Byte Order Byte Shape Type Integer Little Byte Box Box Double Little Byte 36 NumParts NumParts Integer Little Byte 40 NumPoints NumPoints Integer Little Byte 44 Parts Parts Integer NumParts Little Byte X Points Points Point NumPoints Little Chú ý: X = 44 + * NumParts Ngoài shapefile có cấu trúc shape khác như: PointM, MultiPointM, PolyLineM, PolygonM (M độ đo), PointZ, MultiPointZ, PolyLineZ, PolygonZ (trong hệ quy chiếu X, Y, Z) cấu trúc MultiPatch (đa mảnh) ... học đề tài - Luận văn nghiên cứu kỹ thuật tìm kiếm đối tượng vùng GIS vectơ - Cài đặt thử nghiệm kỹ thuật tìm kiếm đối tượng vùng đồ vectơ - Giải toán tìm kiếm đối tượng vùng GIS vectơ CHƯƠNG TỔNG... với hình dạng đối tượng cho trước Đối tượng cho trước sinh phác họa hình máy tính hay tệp chứa ảnh, vùng đồ cần tìm Vậy, nội dung nghiên cứu luận văn Tìm kiếm đối tượng vùng GIS véc tơ bao gồm:... đồ véc tơ gọi GIS véc tơ Cả hai phạm vi luận văn này, đồ có cấu trúc véctơ Phần trình bày phương pháp biểu diễn cấu trúc liệu không gian véc tơ Trên sở đó, thuật toán tìm kiếm hình dạng đồ tìm