1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT

25 17 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 2,1 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - ĐỀ TÀI: BÁO CÁO SPATIAL DATA MANAGEMENT Lớp môn học: INT3202_3 - Hệ quản trị sở liệu Nhóm : Thành viên: Trần Xuân Đức - 19020257 Lữ Thị Thùy Linh - 19020172 Đặng Thị Hà Ngân - 19020382 Đinh Thanh Nhàn - 19020387 Mục lục Trang I II Giới thiệu Cơ sở liệu không gian gì? Đặᴄ trưng ᴄủa CSDL khơng gian 3 Quản lý sở liệu không gian Lịch sử phát triển quản lý liệu không gian Dữ liệu không gian Các kiểu liệu không gian 5 1.1 Dữ liệu điểm 1.2 Dữ liệu vùng Các mối quan hệ không gian 2.1 Mối quan hệ topo 2.2 Mối quan hệ theo hướng 2.3 Mối quan hệ dựa khoảng cách Truy vấn không gian III IV 3.1 Truy vấn theo phạm vi không gian 3.2 Truy vấn láng giềng gần 10 3.3 Truy vấn liên kết không gian 11 Lập mục 14 B+ tree 14 R tree 15 Q tree 17 Một số ứng dụng công nghệ quản lý liệu không gian 18 Quản lý liệu không gian-thời gian 18 Quản lý liệu chiều cao 19 GIS 21 Tài liệu tham khảo 24 I Giới thiệu Cơ sở liệu khơng gian gì? Là hệ thống csdl quan hệ cung cấp kiểu liệu không gian mơ hình liệu ngơn ngữ truy vấn Các kiểu liệu không gian như: Point, Line, Polygon CSDL cung cấp mơ hình trừu tượng cho cấu trúc thực thể hình học không gian mối quan hệ chúng như: giao nhau, thuộc nhau… Với CSDL không gian mà áp dụng với ngôn ngữ hay hệ quản trị việc đánh mục(index) cho loại liệu quan trọng, giúp ích cho việc tối ưu hóa truy vấn liệu, giảm thời gian truy vấn giảm nhớ lưu trữ Đặᴄ trưng ᴄủa CSDL không gian Cơ ѕở liệu không gian ѕử đụng đánh ᴄhỉ mụᴄ không gian để tăng tốᴄ hoạt động ᴄủa ᴄơ ѕở liệu Ngồi ᴄáᴄ truу ᴠẫn SQL điển ᴄâu lệnh SELECT, CSDL khơng gian ᴄó thể thựᴄ thi đa dạng ᴄáᴄ thao táᴄ không gian như: ● Đo lường không gian : ᴄó khả tìm khoảng ᴄáᴄh ᴄáᴄ điểm, ᴄáᴄ ᴠùng… ● Hàm khơng gian : ᴠí dụ như, ѕửa đối ᴄáᴄ hàm thời để tạo hình mới: hàm tìm điểm haу ᴠùng giao nhau… ● Xáᴄ nhận khơng gian : ᴄho phép thựᴄ truу ᴠấn True/Falѕe ● Hàm tạo : tạo ᴄáᴄ hình mới, ᴄhỉ ᴄáᴄ điểm nút ᴄó thể tạo nên đường haу đỉnh đầu ᴠà đỉnh ᴄuối trùng nhau, ᴄhúng ᴄó thể tạo nên đa giáᴄ ● Hàm theo dõi : ᴄáᴄ ᴄâu truу ᴠấn trả ᴠề thông tin ᴄụ thể : ᴠị trí tâm ᴄủa đường trịn haу điểm đầu, điểm ᴄuối ᴄủa đường Quản lý sở liệu không gian Quản lý sở liệu không gian liên quan đến việc lưu trữ, lập mục truy vấn liệu với đặc điểm khơng gian, chẳng hạn vị trí phạm vi hình học Nhiều ứng dụng yêu cầu quản lý hiệu liệu không gian, bao gồm Hệ thống Thông tin Địa lý, Thiết kế Hỗ trợ Máy tính Dịch vụ Dựa Vị trí Mục tiêu sách cung cấp cho người đọc nhìn tổng quan cơng nghệ quản lý liệu khơng gian, trọng đến kỹ thuật lập mục tìm kiếm Đầu tiên, giới thiệu mơ hình truy vấn liệu khơng gian thảo luận vấn đề việc mở rộng hệ thống sở liệu để hỗ trợ liệu khơng gian Nó trình bày cách tiếp cận lập mục cho liệu không gian, tập trung vào R-tree Các kỹ thuật đánh giá tối ưu hóa truy vấn cho loại truy vấn khơng gian phổ biến (lựa chọn, tìm kiếm láng giềng gần kết nối không gian) mô tả cho liệu không gian Euclide mạng không gian Cuốn sách kết thúc cách chứng minh ứng dụng phong phú công nghệ quản lý liệu không gian loạt lĩnh vực ứng dụng liên quan: quản lý liệu không gian-thời gian vectơ đặc trưng chiều cao, xếp hạng đa tiêu chí, khai thác liệu OLAP, xuất liệu bảo vệ quyền riêng tư tìm kiếm từ khóa theo khơng gian Lịch sử phát triển quản lý liệu không gian Vào năm 1980, quản lý liệu không gian bắt đầu phần mở rộng cho công nghệ sở liệu quan hệ có để hỗ trợ loại liệu phức tạp tìm thấy hệ thống thông tin địa lý Trong thập kỷ này, trọng tâm nghiên cứu phương pháp lập mục thích hợp cho liệu khơng gian, thiếu sót mục quan hệ, B – tree Điều dẫn đến phát triển loạt số Những năm 1990, với xuất mơ hình hướng đối tượng (OO), trọng tâm chuyển sang mơ hình sở liệu không gian cách sử dụng trực tiếp OO mở rộng mơ hình quan hệ Những nỗ lực sau dẫn đến định nghĩa mơ hình quan hệ đối tượng (OR), mơ hình hầu hết DBMS sử dụng Ngoài ra, cộng đồng xử lý việc xử lý hiệu truy vấn không gian, truy vấn hàng xóm gần phép nối không gian mục cho liệu mạng không gian (đường) phát triển Vào năm 2000, nghiên cứu phù hợp với xu hướng gần nhu cầu ứng dụng: quản lý liệu theo không gian-thời gian, đánh giá liên tục truy vấn không gian liệu truyền trực tuyến, quản lý liệu để lưu trữ khai thác liệu không gian, truy xuất thông tin địa lý Cụ thể: - Trong năm 1970, số hệ thống giống GIS xử lý việc lập đồ tự động quản lý sở vật chất phát triển; mục tiêu họ số hóa đồ sở hạ tầng thành phố (ví dụ: đường ống đường dây tải điện) Ngoài ra, GIS ban đầu phát triển để quản lý liệu (ví dụ: thủy văn) Tất hệ thống độc lập lưu trữ liệu trực tiếp hệ thống tệp - Kể từ năm 1981, ESRI dẫn đầu phát triển GIS thương mại, với loạt ArcInfo (hiện tích hợp vào hệ thống ArcGIS) ArcInfo, có phiên thứ 10, GIS thức hỗ trợ mơ hình liệu trường không gian vectơ Các GIS khác biết đến bao gồm Mapinfo (từ 1986), GE Smallworld GIS (từ 1990) GRASS GIS mã nguồn mở (từ 1997) Các nhà cung cấp DBMS lớn mở rộng sản phẩm họ để xử lý liệu không gian - Kể từ năm 1995, Informix (sau IBM mua lại) bao gồm hỗ trợ liệu không gian triển khai mục R-cây Oracle bao gồm khả liệu không gian từ năm 1984 Khi Oracle phát hành vào năm 1997, bao gồm phần mở rộng Oracle Spatial, với hỗ trợ tìm kiếm lập mục khơng gian hoàn thiện DB2 IBM bao gồm Bộ mở rộng không gian từ cuối năm 1990, hỗ trợ kiểu liệu không gian, vị từ không gian lập mục không gian dựa lưới - Trong phát hành năm 2008, Microsoft SQL Server cung cấp hỗ trợ quản lý liệu không gian, với lựa chọn lập mục (lưới nhiều lớp, đường cong lấp đầy không gian B) Máy chủ truy vấn không gian Công ty Boeing (từ năm 2006) sản phẩm có sẵn thị trường cho phép sở liệu Sybase chứa tính khơng gian II Dữ liệu khơng gian Thuật ngữ liệu không gian (spatial data) sử dụng theo nghĩa rộng, bao gồm điểm đa chiều, đường thẳng, hình khối đối tượng hình học nói chung Mỗi đối tượng liệu chiếm vùng không gian (spatial extent) đặc trưng hai thuộc tính vị trí (location) biên (boundary) Các kiểu liệu khơng gian Dưới góc nhìn từ hệ quản trị sở liệu, phân chia liệu khơng gian thành hai kiểu: liệu điểm (point data) liệu vùng (region data) 1.1 Dữ liệu điểm Với kiểu liệu này, không gian ứng với điểm đặc trưng tọa độ nó; theo trực giác không chiếm vùng không gian hay đơn vị thể tích Dữ liệu điểm tập hợp điểm không gian nhiều chiều, lưu trữ CSDL dựa tọa độ tính tốn trực tiếp, sinh nhờ trình chuyển hóa liệu thu từ phép đo khiến cho việc lưu trữ thực truy vấn trở nên dễ dàng Chẳng hạn Raster data ví dụ liệu điểm lưu trữ trực tiếp thông qua bit maps pixel maps (chẳng hạn ảnh vệ tinh, phim điện não đồ chiều, …) Trong đó, feature vectors data lưu trữ thơng qua liệu trích chọn, chuyển đổi từ đối tượng liệu điểm (thu từ ảnh, văn ) Có thể thấy rằng, sử dụng liệu biểu diễn để trả lời truy vấn dễ dàng sử dụng ảnh ký hiệu nguyên 1.2 Dữ liệu vùng Được xác định dựa tập vùng không gian (spatial extents), vùng đặc trưng hai thuộc tính vị trí biên Dữ liệu vùng lưu trữ CSDL đối tượng hình học đơn giản, xấp xỉ với đối tượng liệu thực Việc mô tả phép xấp xỉ đặc tả thơng qua vector liệu, xây dựng từ điểm, đoạn thẳng, hình đa giác, hình cầu, hình ống Rất nhiều ví dụ liệu vùng đưa ứng dụng địa lý, chẳng hạn đường xá, sơng ngịi biểu diễn dạng tập hợp đoạn thẳng; quốc gia, thành phố biểu diễn dạng hình đa giác… Các mối quan hệ không gian Là mối quan hệ đối tượng khơng gian theo vị trí khơng gian cách xếp không gian chúng Ba loại quan hệ không gian chung xác định: quan hệ dựa khoảng cách, quan hệ tôpô quan hệ hướng 2.1 Mối quan hệ topo Là mối quan hệ logic vị trí đối tượng khơng gian Loại quan hệ không gian không bị ảnh hưởng biến đổi liên tục, chẳng hạn kéo dài, dịch chuyển, quay uốn cong đối tượng không gian liên quan Tùy thuộc vào kiểu hình học hai đối tượng địa lý liên quan, chúng tồn tập hợp quan hệ tôpô khác là: Giao nhau(intersects), bằng(equals), bên trong(inside)/được chứa bởi(contained by), chứa(contains), liền kề(adjacent), chồng chéo(overlaps) phân chia(disjoint) với việc minh họa hệ thống phân cấp mối quan hệ tơpơ đơn giản tồn hai đối tượng đồ thị sau: Cụ thể mối quan hệ topo hai đối tượng không gian minh họa qua bảng: Bảng Phân loại số mối quan hệ tôpô phổ biến hai đối tượng không gian Bảng Phân loại số mối quan hệ tôpô phổ biến hai đối tượng không gian biểu thức logic Trong đó: interior(𝑜𝑖) vùng nội địa đối tượng 𝑜𝑖 boundary(𝑜𝑖) ranh giới(biên) đối tượng 𝑜𝑖 2.2 Mối quan hệ theo hướng Mối quan hệ theo hướng liên kết hai đối tượng dựa định hướng (tương đối) chúng hệ quy chiếu tồn cục.Ví dụ mối quan hệ theo hướng là: bắc, nam, đông, tây, đông bắc, v.v Hệ quy chiếu xác định theo hướng người xem đối tượng tham chiếu Có thể phân biệt thành quan hệ hướng bên ngoại quan hệ hướng nội ● Một quan hệ hướng nội định vị trí đối tượng bên đối tượng tham chiếu Ví dụ: mặt trên, mặt sau, ● Một quan hệ hướng ngoại định vị trí đối tượng bên đối tượng tham chiếu Ví dụ: phía trên, phía trước, bên phải, Các mối quan hệ theo hướng mang tính chủ quan Ví dụ, khơng có biên giới rõ ràng tây nam tây Do đó, mơ hình liệu không gian thường sử dụng định nghĩa mờ hướng (ví dụ: 20% hướng bắc, 80% hướng đơng) Hiện nay, số mơ hình phân tích khơng gian phát triển thêm để đối phó với tình phức tạp làm cho quy trình trở nên hợp lý mặt tính tốn Trong số đó, mơ hình ma trận quan hệ hướng (DRM)- xác định quan hệ hướng với ma trận ví dụ áp dụng rộng rãi Minh họa tập hợp điểm phương trình xác định cho ma trận quan hệ hướng 2.3 Mối quan hệ dựa khoảng cách Mối quan hệ khoảng cách liên kết hai đối tượng dựa khoảng cách chúng, đo thước đo khoảng cách (hình học), ví dụ: khoảng cách Euclide Các giá trị khoảng cách thực tế khơng phải lúc hữu ích người có xu hướng phân loại chúng theo phạm vi (chủ quan khách quan) Ví dụ: chia miền khoảng cách có đối tượng thành phố cho khoảng cách lên đến 100 mét, đặc trưng mối quan hệ gần, khoảng cách từ 100 mét đến 1km, đặc trưng mối quan hệ tiếp cận, khoảng cách từ 1km đến 10km, có đặc điểm mối quan hệ xa, khoảng cách lớn 10km, có đặc điểm mối quan hệ xa Do đó, mối quan hệ khoảng cách thể cách rõ ràng (bằng khoảng cách hình học thực tế đối tượng) ngầm định (bằng khoảng cách) Một truy vấn không gian không thiết phải giới hạn quan hệ không gian.Thực tế, mối quan hệ tôpô, khoảng cách hướng kết hợp để mơ tả đặc điểm cặp đối tượng khơng gian (ví dụ: “ngôi nhà nằm cách biệt nhau, cách 100 mét, phía tây bắc Bờ Tây”) Mối quan hệ không gian sử dụng để hỗ trợ việc thể truy vấn không gian Truy vấn không gian Truy vấn không gian áp dụng (hoặc nhiều) quan hệ không gian yêu cầu đối tượng (hoặc tổ hợp đối tượng) thỏa mãn số mối quan hệ không gian với đối tượng truy vấn tham chiếu (hoặc chúng) Truy vấn không gian lý để đưa phương pháp quản lý chuyên biệt cho liệu không gian, giống truy vấn quan hệ xác định cách liệu quan hệ lưu trữ, lập mục truy cập 3.1.1 Truy vấn theo phạm vi không gian Truy vấn phạm vi không gian truy vấn hỏi đối tượng không gian định liên quan đến đối tượng không gian khác khoảng cách định Vị từ khoảng cách truy vấn trừu tượng hóa thành dạng sau : Dmin < distance (A, B) ≤ Dmax Trong Dmin Dmax biến khoảng cách cho khoảng cách hàm để tìm khoảng cách hai đối tượng A B Khoảng cách trường hợp (A, B) ≤ Dmax coi trường hợp đặc biệt Dmin = Trong truy vấn phạm vi thuộc tính định dạng phạm vi thay giá trị Một ví dụ truy vấn phạm vi đơn giản tìm tất thành phố vòng 50 dặm từ Minneapolis Một truy vấn phức tạp tìm tất hồ vịng 50 dặm từ thành phố lớn tiểu bang Ở phải tìm tất thành phố lớn Sau tìm tất hồ gần thành phố Một dạng khác truy vấn phạm vi truy vấn cửa sổ Ở quan tâm đến việc tìm kiếm đối tượng vùng hình chữ nhật (cửa sổ) không gian Biểu mẫu đặc biệt hữu ích chúng tơi cố gắng xem in phần hình ảnh Chỉ vật thể rơi bên cửa sổ hình chữ nhật hiển thị Khi người dùng di chuyển vùng cửa sổ không gian, đối tượng hiển thị thay đổi Một số đối tượng khơng cịn nhìn thấy, đối tượng khác nhìn thấy Trong mối quan hệ Mối quan hệ dựa khoảng cách chuyển trực tiếp đến truy vấn phạm vi không gian Tuy nhiên mơn quan hệ cịn lại ánh xạ đến truy vấn phạm vi không gian Tất quan hệ khơng gian thực cách sử dụng thuật tốn tìm kiếm MBR Bảng Cho thấy cách mối quan hệ khơng gian đối tượng ánh xạ thành ràng buộc tọa độ MBR Bảng cho thấy ràng buộc cần thiết nút trung gian tìm kiếm R để tìm MBR phù hợp Nhưng MBR giá trị gần đối tượng đối tượng thực nên gặp trường hợp MBR thỏa mãn nhiều quan hệ không gian đối tượng thực tế khơng Vì lý này, truy vấn không gian sử dụng bước tinh chỉnh bổ sung ứng cử viên MBR phù hợp kiểm tra cách sử dụng kỹ thuật hình học tính tốn sau lần truy cập sai bị loại bỏ Nói chung, việc xử lý truy vấn dạng "tìm tất đối tượng p thỏa mãn quan hệ không gian định đối tượng q" cách sử dụng R-tree bao gồm bước sau: B1: Bắt đầu từ nút cùng, loại trừ nút trung gian P bao gồm MBR thỏa mãn quan hệ không gian tìm kiếm đệ quy nút cịn lại Sử dụng Bảng B2: Trong số nút truy xuất, chọn nút thỏa mãn quan hệ không gian Sử dụng Bảng B3: Nếu cần, thực theo bước tinh chỉnh cho MBR chọn 3.2 Truy vấn láng giềng gần Là truy vấn đối tượng không gian gần đến đối tượng truy vấn Ví dụ: người lái xe ô tô yêu cầu trạm xăng gần với vị trí Lưu ý người hàng xóm gần khơng phải nhất; ví dụ: có hai (hoặc nhiều) trạm xăng với khoảng cách (tối thiểu) từ vị trí người lái xe Trong trường hợp chung này, quan tâm đến người hàng xóm gần tất người hàng xóm gần Định nghĩa mở rộng để bao gồm tham số k, thể số lân cận gần truy xuất Một truy vấn k-nearest neighbor truy xuất k đối tượng gần với đối tượng truy vấn, chẳng hạn “Đưa tên 10 thành phố gần Hà Nội nhất” Hiện tại, truy vấn hàng xóm gần xử lý hiệu cách lập mục R – tree cho quan hệ Và thuật tốn dùng phổ biến tìm láng giềng gần theo chiều sâu, sử dụng thơng tin láng giềng gần phát để ràng buộc tìm kiếm cắt bớt phần R – tree Giả sử tìm kiếm hàng xóm gần NN (q, R) q R-tree R Với mindist (q, M) khoảng cách nhỏ q điểm hình chữ nhật có giới hạn nhỏ (MBR) M, gốc, tất mục nhập xếp theo mindist từ q, mục nhập có mindist nhỏ truy cập Quá trình lặp lại cách đệ quy nút (láng giềng gần nhất) tìm thấy Khi trở lại nút cao hơn, truy cập đến nút có mindist nhỏ khoảng cách láng giềng gần tìm tính đến thời điểm Ví dụ: 10 Với hình truy cập vào nút mục nhập gốc E1 (vì có mindist tối thiểu), sau nút trỏ E4, ứng cử viên (a) lấy Khi quay trở lại mức trước đó,mục E6 bị loại trừ mindist lớn khoảng cách a, E5 có mindist với khoảng cách a nên truy cập sau quay lại với E2 Tương tự với E2 hết Bên cạnh thuật tốn tìm láng giềng gần theo chiều sâu(DF) cịn thuật toán hiệu A best-first nearest neighbor search algorithm (BF) 3.3 Truy vấn liên kết không gian Nếu truy vấn theo phạm vi không gian truy vấn láng giềng gần áp dụng quan hệ khơng gian với truy vấn liên kết khơng gian kết hợp thơng tin từ hai quan hệ dựa vị từ/thuộc tính khơng gian 11 Ví dụ minh họa với liên kết khơng gian thành phố dịng sơng Qua đó, đưa dạng truy vấn như: “đưa cặp sông thành phố giao nhau” hay “tìm sơng gần thành phố C3” , Các dạng truy vấn thường thời gian để tính tốn Nếu xem xét quan hệ phần tử điểm biểu diễn thành phố dịng sơng truy vấn thực phép nối quan hệ với với điều kiện nối khoảng cách hai phần tử tương ứng Đương nhiên, thành phố sông biểu diễn chi tiết có vùng khơng gian chúng, ngữ nghĩa truy vấn (chúng ta tìm kiếm hai thành phố mà trung tâm chúng cách 200km hay hai thành phố mà biên chúng cách 200km) việc thực thi truy vấn trở nên phức tạp nhiều Tùy thuộc vào tồn mục, thuật toán liên kết khơng gian khác áp dụng Với thuật tốn R-tree join(RJ), tính liên kết khơng gian hai quan hệ đầu vào với điều kiện hai lập mục R – tree, RJ qua cách đồng gốc theo cặp đường giao Gọi nR, nS hai nút thư mục (không phải lá) R-tree mục cho quan hệ R S tương ứng RJ dựa quan sát sau: hai mục ei ∈ nR ej ∈ nS khơng giao nhau, khơng thể có cặp (oR, oS) đối tượng giao nhau, oR oS nằm ei ej tương ứng Một mã giả đơn giản cho RJ xuất kết bước nối không gian lọc (tức xuất cặp đối tượng có MBR giao nhau) cho hình sau: Mã giả RJ với giả định hai có chiều cao 12 Để minh họa cho bước hoạt động thuật toán RJ Ban đầu, RJ thực thi với tham số gốc Các cặp mục nhập đủ điều kiện cấp sở (A1, B1) (A2, B2) Lưu ý A1 khơng cắt B2 nên khơng thể có cặp đối tượng mục giao RJ gọi đệ quy cho nút trỏ mục đủ điều kiện đạt đến mức lá, nơi cặp giao (a1, b1) (a2, b2) đầu Nếu có tập liệu (cho A) lập mục, phương pháp phổ biến xây dựng R-tree cho B sau áp dụng RJ Khi hai quan hệ khơng lập mục, thuật tốn đơn giản trực quan mà sử dụng để nối chúng phép nối vòng lặp lồng Phương pháp áp dụng cho loại phép nối (không gian, phi không gian) vị từ điều kiện (cấu trúc liên kết, hướng, khoảng cách, v.v.) Tuy nhiên, vịng lặp lồng thuật tốn đắt (𝑂 ) có thuật tốn khác để nối quan hệ không lập mục như: Spatial Hash Join, Partition Based Spatial Merge Join, Size Separation Spatial Join, Scalable Sweeping-Based Spatial Join Các thuật tốn nối khơng gian cho đầu vào không lập mục xử lý việc nối theo hai bước; đối tượng từ hai đầu vào xếp / xử lý trước cách sử dụng cấu trúc liệu sau cấu trúc sử dụng để nhanh chóng tìm đối tượng nằm vùng giao 13 III Lập mục B+ tree B+ Tree cấu trúc liệu dạng ‘đa phân cân bằng’ Cấu trúc node thường chia làm nhiều phần Cây tổ chức với qui tắc định tạo từ đầu Thường giá trị node tăng dần từ trái qua phải, node bên trái chứa giá trị nhỏ node bên phải B + Tree tổng qt hóa nhị phân tìm kiếm (BST) Sự khác biệt chúng số lượng node B+Tree nhiều khơng bị giới hạn hai phần tử nhị phân tìm kiếm Mục tiêu để giảm tối đa số lần truy xuất thiết bị ngoại vi (ở đĩa) Tại thời điểm thử định vị ghi, muốn độ cao đa phân phải nhỏ để giảm chi phí tìm kiếm, để đạt mục tiêu số lượng nhánh phải lớn Nếu B+Tree có bậc m node có tối đa m nhánh có m-1 khóa để tìm kiếm: ● Các ghi lưu nút ● Tất nút (ngoại trừ nút gốc) có tối thiểu m/2 tối đa m cây(nhánh) ● Nút gốc phái có ● Bên node lưu giá trị tìm kiếm, vài khóa sử dụng “người đường” cho trình tìm kiếm Những khóa cần phải xếp theo thứ tự thống trừ trước (thường tăng dần từ trái qua phải) ● Tùy thuộc vào kích thước ghi so với kích thước khóa node B+Tree bậc m lưu nhiều m ghi Thơng thường kích thước node bội số khối liệu ổ đĩa (bên windows mặc định 512byte) ● Các node thường liên kết với để tạo thành danh sách liên kết, điều nhằm mục tiêu để khơng phải duyệt trở lại node gốc q trình duyệt tìm kiếm 14 Ví dụ Cây B+ tree BTree Index dùng để giúp truy vấn câu truy vấn dạng Insert, Update, Delete Nó áp dụng cho yêu cầu từ table cho trường có tính chất đặc biệt Ví lấy sinh viên có số điểm tích lũy trung bình khoảng từ 8.0 tới 9.5 bảng sinh viên Trong BTree Index khóa tương ứng với dịng liệu thực Nó chọn độ trùng lặp liệu số BTree Index tạo tạo bảng định khóa cho nó, khóa mục kiểu B+tree Hoặc tạo khóa ngoại mặc định trường khóa ngoại sử dụng BTree Index R-tree 2.1 R-tree gì? R-tree cấu trúc sử dụng rộng rãi xuất DBMS thương mại, tính đơn giản khả áp dụng cho hai dạng liệu điểm vùng R-tree phương pháp phân chia không gian liệu thành khối lồng chồng chéo lên Đơn giản nhất, hình khối thường sử dụng hình chữ nhật nhỏ chứa liệu (Minimum Bounding Rectangle – MBR) Như vậy, MBR lưu trữ cấu trúc thân liệu Các nút biểu diễn cặp: (R, childpointer) R MBR đối tượng child-pointer trỏ trỏ tới nút Các nút biểu diễn cặp: (R, obj-pointer) R MBR đối tượng obj-pointer trỏ trỏ tới mô tả chi tiết đối tượng 15 Mỗi nút tương ứng với trang nhớ Và MBR chồng chéo lên nhau, tức nút chứa liệu giống nhau, đối tượng liệu phải lưu trữ trọn vẹn nút Để R-Tree hợp lệ cần thỏa mãn tính chất : ● Mỗi nút R-tree giữ tối đa M mục nhập giới hạn m phải thỏa mãn cho 𝑚 ≤ 𝑀/2 ● Mỗi nút nên chứa từ m đến M ghi mục ● Mỗi nút mục nên có từ m đến M nút trừ nút gốc ● MBR phải hình chữ nhật nhỏ có tổng diện tích bao phủ nút trường hợp nút mục ● Nút gốc phải có hai nút trừ ● Tất phải xuất mức Cấu trúc đánh mục R-tree Chúng ta thấy R-tree biến thể B+ tree cân Tuy nhiên, MBR chồng chéo lên chồng chéo gia tăng lượng liệu gia tăng nên cấu trúc có yếu điểm kéo theo gia tăng truy cập tìm kiếm khơng cần thiết Thêm nữa, bắt buộc phải tiến hành tìm kiếm mức cây, trường hợp khơng có (hoặc có ít) đối tượng liệu thỏa mãn u cầu 16 2.2 Chèn, Tìm kiếm, Xóa, Cập nhật Việc chèn ghi vào R-Tree phải cho thuộc tính R-Tree thỏa mãn trước sau chèn Khi ghi chèn có nút, chèn ghi vào nút Nếu có nhiều nút, ngang từ xuống thu nút khơng phải chứa mục nhập với MBR phóng to Sau đó, chèn đối tượng truyền tải thay đổi đến tận gốc Trường hợp tốt số lượng mục nhập nằm giới hạn tối thiểu tối đa Nếu chèn số lượng mục nhập vượt giới hạn tối đa, nút tách cho nút có mục nhập giới hạn tối thiểu tối đa Tìm kiếm ghi nằm cửa sổ định truy vấn thường sử dụng Cây chuyển từ xuống Các ghi chồng lên cửa sổ cho chọn trình truyền tải để khám phá thêm Điều thực cấp độ đạt nút Các nút chồng lên cửa sổ cho ghi đủ điều kiện Xóa ghi phải đáp ứng thuộc tính trước sau xóa Bản ghi cụ thể bị xóa tìm kiếm thuật tốn tìm kiếm Sau ghi tìm thấy, ghi bị xóa Những thay đổi sau truyền tới tận gốc Số lượng ghi trở nên dung lượng tối thiểu luồng có hội Các nút hợp để đáp ứng thuộc tính Cập nhật ghi bao gồm việc xóa giá trị cũ chèn giá trị 3.Q tree Q - tree phương pháp đánh số dựa đường cong Space-Filling Curves để xếp điểm liệu Việc đánh số thực dựa việc phân chia không gian liệu cách đệ quy, khác với R-tree, phương pháp thực độc lập tập liệu thực Space-Filling Curves xây dựng dựa giả thiết giá trị thuộc tính biểu diễn số bit xác định gọi k bit, số lượng giá trị thuộc chiều liệu đạt tới nhiều 2k Để đơn giản, hình vẽ mô tập liệu 2- chiều thực tế phương pháp áp dụng với liệu có số chiều Hình vẽ thứ sử dụng bit để biểu diễn giá trị thuộc tính; hình thứ hai sử dụng bit; hình thứ ba đường cong Hilbert với bit 17 Space-Filling Curves Trên ý tưởng này, Q-tree phương pháp phân chia cách đệ quy không gian liệu thành góc phần tư Trong cấu trúc này, nút có ứng với góc phần tư 00 (góc phần tư bên trái phía dưới), 01 (góc phần tư bên trái phía trên), 10 (góc phần tư bên phải phía dưới) 11 (góc phần tư bên phải phía trên) Trên hình vẽ, thấy khơng gian liệu khơng phân bố cách đối xứng Q-tree bị lệch, Q-tree khơng phải cấu trúc cân bằng, tập liệu lớn, hiệu suất truy cập liệu hiệu Cấu trúc đánh mục Q-tree Một mặt khác, ứng dụng đòi hỏi việc lưu trữ liệu có tính chất liên tục (chẳng hạn liệu đối tượng chuyển động) thay liệu xác định, gặp phải vấn đề khó để cân nhắc vì: việc sử dụng Q-tree có độ sâu lớn độ xác biểu diễn liệu tốt, nhiên lại khiến cho việc xây dựng cấu trúc trở nên hiệu phương diện không gian lưu trữ thời gian xử lý thao tác 18 IV Một số ứng dụng công nghệ quản lý liệu không gian Quản lý liệu không gian-thời gian Dữ liệu không gian-thời gian đơn giản kiện đánh dấu thời gian Ví dụ: Xét mối quan hệ sở liệu lưu trữ gọi khẩn cấp thành phố gắn thẻ vị trí khơng gian dấu thời gian Trong mối quan hệ này, (tức đối tượng) liên kết với giá trị ba chiều không gian 3D không-thời gian Đối với liệu vậy, chiều thứ ba (thời gian) chất khơng khác so với hai tọa độ khơng gian Do đó, liệu đơn giản xem đối tượng không gian ba chiều Lưu trữ lập mục thực trường hợp 2D, để tạo điều kiện thuận lợi cho truy vấn lựa chọn không gian-thời gian Các truy vấn định phạm vi thứ nguyên không gian thời gian, kết hợp thành vùng 3D Ví dụ: truy vấn “tìm tất gọi khẩn cấp từ khu trung tâm khoảng thời gian từ sáng đến sáng hôm qua” xác định phạm vi 3D bao gồm tất vị trí khu trung tâm khoảng thời gian Truy vấn phạm vi kết hợp với tìm kiếm hàng xóm gần Ví dụ: truy vấn "tìm gọi khẩn cấp gần đến trường vụ án sáng đến sáng hơm qua", thực tìm kiếm hàng xóm gần theo khơng gian, loại trừ kiện nằm phạm vi lựa chọn thời gian định (2 sáng đến sáng, hôm qua) Quản lý liệu chiều cao Dữ liệu khơng gian xem trường hợp đặc biệt liệu đa chiều Trong nhiều ứng dụng, đối tượng trừu tượng hóa mơ hình hóa vectơ đặc trưng, ​do đó, chúng xem điểm không gian đặc trưng chiều cao Trong khai phá liệu, gần gũi không gian đặc trưng sử dụng để mơ hình hóa giống đối tượng tương ứng Cơ sở liệu vectơ đặc trưng thu thập lập mục để hỗ trợ tìm kiếm phân tích hiệu Có hai điểm khác biệt liệu không gian vectơ đặc trưng Đầu tiên, liệu không gian hai ba chiều, số chiều vectơ đặc trưng cao tùy ý (thông thường, hàng chục đến hàng trăm chiều) Thứ hai, vectơ đặc trưng khơng có phạm vi khơng gian; chúng điểm đơn giản có chiều cao Mặc dù khác biệt đủ quan trọng để phân biệt quản lý liệu không gian với quản lý liệu chiều cao, hai vấn đề có điểm chung mơ hình hóa đánh giá truy vấn Ví dụ, xét vấn đề truy xuất hình ảnh dựa nội dung sở liệu hình ảnh Trong vấn đề này, người dùng tìm kiếm hình ảnh sở liệu tương tự hình ảnh đầu vào Ví dụ: khách du lịch chụp ảnh địa danh thành phố yêu cầu ảnh tương tự sở liệu công cộng để xác định ảnh tương tự sau tìm thơng tin địa danh từ ảnh Các hệ thống truy xuất dựa nội dung điển hình 19 trích xuất đặc điểm trực quan (ví dụ: màu sắc, kết cấu, ) từ hình ảnh sở liệu lập mơ hình hình ảnh dạng vectơ đặc trưng chiều cao Ví dụ hình cho thấy việc trích xuất biểu đồ d màu từ hình ảnh, đến lượt nó, xem điểm d chiều p = (p1, p2, , pd) Biểu đồ lưu trữ cho màu số d màu (hoặc nhóm màu) phần trăm màu pixel hình ảnh Biểu đồ màu phương tiện thuận tiện để đánh giá độ giống đối tượng đa phương tiện Nếu hai hình ảnh giống (theo màu sắc), chúng phải có biểu đồ tương tự Các biểu đồ tương tự tương ứng với điểm gần không gian chiều cao xác định thùng màu Do đó, đánh giá ví dụ truy vấn đa phương tiện sau Đầu tiên, trích xuất tất biểu đồ cho hình ảnh biết sở liệu tạo tập hợp điểm chiều cao tương ứng P Sau đó, hình ảnh truy vấn người dùng cụ thể Iq, chúng tơi tính tốn biểu đồ q tìm kiếm tập hợp điểm P, gần với q Những điểm tương ứng với hình ảnh có màu sắc tương tự q, kết hình ảnh có xác suất cao kết mong muốn người dùng Tất nhiên, thực tế, tìm kiếm độ tương đồng màu sắc kết hợp với tìm kiếm dựa đặc điểm khác (ví dụ: kết cấu, bố cục màu khơng gian, hình dạng, ) để thu hẹp tập hợp kết xác định xếp hạng thích hợp đối tượng sở liệu liên quan đến tương tự chúng với truy vấn Biểu đồ màu biểu diễn điểm chiều cao hình ảnh Bên cạnh truy xuất đa tầng dựa nội dung, có loạt ứng dụng, đối tượng liệu mơ hình hóa dạng điểm có chiều cao khoảng cách gần sử dụng để đánh giá độ tương đồng Trong liệu quan hệ, lập mơ hình hàng bảng dạng điểm không gian đa chiều xác định thuộc tính bảng Trong sở liệu văn bản, tài liệu f mơ hình hóa điểm chiều cao p(f), chiều thứ i tương ứng với số hạng giá trị thứ i p(f) tần suất số hạng tương ứng f Trong sở liệu chuỗi thời gian, dấu thời gian ánh xạ tới thứ ngun chuỗi mơ hình hóa điểm chiều cao miền kết hợp dấu thời gian 20 GIS Hệ thống Thông tin Địa lý (GIS- Geographic Information System) công cụ dựa máy tính để lập đồ phân tích vật kiện tồn xảy trái đất Cơng nghệ GIS tích hợp hoạt động sở liệu không gian phổ biến truy vấn phân tích thống kê với lợi ích trực quan hóa phân tích địa lý độc đáo đồ cung cấp Ngày nay, với phát triển Internet, GIS dựa web, xử lý thông tin địa lý Internet, xuất phát triển nhanh chóng cơng nghệ Internet Web thay đổi Bản đồ phương tiện thông tin địa lý đối tượng thao tác GIS, biểu diễn đồ họa bề mặt địa lý mặt phẳng, khái qt hóa quy tắc tốn học biểu diễn ký hiệu trực quan cho mục đích khác Bản đồ thể phân bố, trạng thái liên kết tượng tự nhiên xã hội đa dạng Có nhiều cách tiếp cận để biểu diễn thông tin địa lý GIS, chẳng hạn cách tiếp cận dựa lớp cách tiếp cận dựa đối tượng địa lý, v.v Trong cách tiếp cận dựa lớp, liệu không gian biểu diễn tập hợp đồ chuyên đề, lớp đặt tên, biểu thị số chủ đề đường, tòa nhà, tàu điện ngầm, đường bao, biên giới, v.v Phương pháp dựa lớp có ưu điểm dễ dàng xử lý truy vấn khơng gian phân tích không gian Như biết, chồng chất (chồng chéo) đối tượng không gian vấn đề cần xử lý sở liệu không gian Việc quản lý xử lý truy vấn điểm, xử lý truy vấn vùng xử lý phân tích thơng tin khơng gian liệu chồng chéo đối tượng khơng gian khó xử lý có q nhiều ứng viên đối tượng khơng gian Có thể tránh vấn đề cách hiệu cách sử dụng cách tiếp cận dựa lớp nói chung khơng có chồng chất (chồng chéo) đối tượng không gian đồ chuyên đề giới thực Bản đồ bao gồm lớp thể Dữ liệu GIS tách thành hai loại: liệu tham chiếu theo không gian biểu thị dạng vectơ raster (bao gồm hình ảnh) bảng thuộc tính biểu diễn dạng bảng Trong nhóm liệu tham chiếu khơng gian, liệu GIS phân loại thêm thành hai loại khác nhau: vectơ(Dữ liệu vectơ chia thành ba loại: liệu điểm, đường (hoặc cung) đa giác.) raster Hầu hết ứng dụng 21 phần mềm GIS chủ yếu tập trung vào việc sử dụng thao tác với sở liệu địa lý vectơ với thành phần bổ sung để hoạt động với sở liệu địa lý dựa raster Dữ liệu điểm Dữ liệu đường Dữ liệu vùng 22 Dữ liệu radar 23 TÀI LIỆU THAM KHẢO A State-of-Art in R-Tree Variants for Spatial Indexing - Lakshmi Balasubramanian, M Sugumaran Spatial Data Management - Nikos Mamoulis Ứng dụng QR tạo mục sở liệu không gian Dư Phương Hạnh 4.GIS&T Body of Knowledge - University consortium for Geographic Information Science All-Nearest-Neighbors Queries in Spatial Databases - Jun Zhang, Nikos MamoulisDimitris Papadias, Yufei Tao 6.SPATIAL RANGE QUERY - Rooma Rathore,Graduate Student University of Minnesota 7.Spatial data management - Geir-Harald Strand Survey and statistics division, NIBIO 8.SPATIAL DATA MANAGEMENT: TOPIC OVERVIEW - Gary J Hunter Department of Geomatics, University of Melbourne, Australia 24 Phân công công việc ● Lý thuyết: B4 Tìm hiểu quản trị không gian(Spatial Data Management) - Đinh Thanh Nhàn: III Lập mục, IV Một số ứng dụng công nghệ quản lý liệu không gian - Đặng Thị Hà Ngân: I Giới thiệu, II Dữ liệu không gian ● Thực hành: A4 Thiết lập nhân master, sleve; áp dụng thử nghiệm với CSDL quản lý hồ sơ sinh viên trường đại học - Trần Xuân Đức - Lữ Thị Thùy Linh 25 ... Queries in Spatial Databases - Jun Zhang, Nikos MamoulisDimitris Papadias, Yufei Tao 6 .SPATIAL RANGE QUERY - Rooma Rathore,Graduate Student University of Minnesota 7 .Spatial data management -... Dữ liệu vùng 22 Dữ liệu radar 23 TÀI LIỆU THAM KHẢO A State-of-Art in R-Tree Variants for Spatial Indexing - Lakshmi Balasubramanian, M Sugumaran Spatial Data Management - Nikos Mamoulis Ứng dụng... tốn khác để nối quan hệ khơng lập mục như: Spatial Hash Join, Partition Based Spatial Merge Join, Size Separation Spatial Join, Scalable Sweeping-Based Spatial Join Các thuật tốn nối khơng gian

Ngày đăng: 04/01/2022, 10:33

HÌNH ẢNH LIÊN QUAN

Tùy thuộc vào kiểu hình học của hai đối tượng địa lý liên quan, giữa chúng có thể tồn tại các tập hợp các quan hệ tôpô khác nhau như là: Giao nhau(intersects), bằng( equals ), bên trong(inside)/được chứa bởi(contained by), chứa(contains), liền kề(adjacent - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
y thuộc vào kiểu hình học của hai đối tượng địa lý liên quan, giữa chúng có thể tồn tại các tập hợp các quan hệ tôpô khác nhau như là: Giao nhau(intersects), bằng( equals ), bên trong(inside)/được chứa bởi(contained by), chứa(contains), liền kề(adjacent (Trang 6)
Bảng 1. Phân loại một số mối quan hệ tôpô phổ biến giữa hai đối tượng không gian - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
Bảng 1. Phân loại một số mối quan hệ tôpô phổ biến giữa hai đối tượng không gian (Trang 6)
Bảng 2. Phân loại một số mối quan hệ tôpô phổ biến giữa hai đối tượng không gian bằng biểu thức logic - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
Bảng 2. Phân loại một số mối quan hệ tôpô phổ biến giữa hai đối tượng không gian bằng biểu thức logic (Trang 7)
Hiện nay, một số mô hình phân tích không gian đã được phát triển thêm để đối phó với các tình huống phức tạp hơn hoặc làm cho quy trình trở nên hợp lý hơn về mặt tính toán - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
i ện nay, một số mô hình phân tích không gian đã được phát triển thêm để đối phó với các tình huống phức tạp hơn hoặc làm cho quy trình trở nên hợp lý hơn về mặt tính toán (Trang 7)
cửa sổ. Ở đây chúng tôi quan tâm đến việc tìm kiếm các đối tượng trong một vùng hình chữ nhật (cửa sổ) trong không gian - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
c ửa sổ. Ở đây chúng tôi quan tâm đến việc tìm kiếm các đối tượng trong một vùng hình chữ nhật (cửa sổ) trong không gian (Trang 9)
Với hình trên đầu tiên sẽ truy cập vào nút của mục nhập gốc E1 (vì nó có mindist tối thiểu), và sau đó là nút được trỏ bởi E4, trong đó ứng cử viên đầu tiên (a) được lấy - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
i hình trên đầu tiên sẽ truy cập vào nút của mục nhập gốc E1 (vì nó có mindist tối thiểu), và sau đó là nút được trỏ bởi E4, trong đó ứng cử viên đầu tiên (a) được lấy (Trang 11)
BTree Index sẽ được tạo nếu chúng ta tạo một bảng và chỉ định khóa chính cho nó, thì khóa chính chính là một chỉ mục kiểu B+tree - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
ree Index sẽ được tạo nếu chúng ta tạo một bảng và chỉ định khóa chính cho nó, thì khóa chính chính là một chỉ mục kiểu B+tree (Trang 15)
● MBR phải là hình chữ nhật nhỏ nhất có tổng diện tích được bao phủ bởi các nút con của nó trong trường hợp các nút chỉ mục. - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
ph ải là hình chữ nhật nhỏ nhất có tổng diện tích được bao phủ bởi các nút con của nó trong trường hợp các nút chỉ mục (Trang 16)
trích xuất các đặc điểm trực quan (ví dụ: màu sắc, kết cấu, ...) từ các hình ảnh trong cơ sở dữ liệu và lập mô hình từng hình ảnh dưới dạng vectơ đặc trưng chiều cao. - ĐỀ tài báo cáo SPATIAL DATA MANAGEMENT
tr ích xuất các đặc điểm trực quan (ví dụ: màu sắc, kết cấu, ...) từ các hình ảnh trong cơ sở dữ liệu và lập mô hình từng hình ảnh dưới dạng vectơ đặc trưng chiều cao (Trang 20)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w