Cấu trúc chỉ mục

Một phần của tài liệu Phát triển các mô hình và thuật toán biểu diễn, xử lý, khai thác dữ liệu không gian và ứng dụng giải một số bài toán GIS (Trang 80 - 82)

Cơ sở dữ liệu không gian là một hệ thống tích hợp dữ liệu không gian và phi không gian. Để hỗ trợ khả năng truy vấn thông tin hiệu quả thì nhất thiết phải có hệ thống tạo chỉ mục. Việc tạo chỉ mục cho các đối tượng với thuộc tính chuẩn thường là cấu trúc chỉ mục dạng B-Tree hay B+Tree đã được sử dụng rộng rãi trong các hệ quản trị cơ sở dữ liệu thương mại. Dưới đây chúng tôi sẽ chỉ đề cập đến các cấu trúc chỉ mục cho các đối tượng không gian. Chú trọng vào các cấu trúc dữ liệu phân cấp, bao gồm một số biến thể của các dạng cây phân cấp – sắp xếp dữ liệu theo không gian bị phủ. Những kỹ thuật như thế được gọi là các phương pháp đánh chỉ mục không gian. Cấu trúc dữ liệu phân cấp dựa trên nguyên lý phân rã đệ qui. Chúng rất được quan tâm bởi sự gọn gàng và phụ thuộc vào bản chất của dữ liệu, chúng tiết kiệm không gian và thời gian cũng như làm cho các thao tác (tìm kiếm) dễ dàng hơn.

Mục đích chính của chỉ mục không gian là hỗ trợ khả năng chọn đối tượng không gian, điều đó có nghĩa là để lấy từ một tập lớn các đối tượng không gian (đối tượng với một thuộc tính SDT) người ta trích chọn các thông tin liên quan đến một giá trị SDT truy vấn. Phương pháp đánh chỉ mục không gian tổ chức không gian và các đối tượng trong không gian đó theo một cách nào đó sao cho chỉ một phần không gian và một tập nhỏ các đối tượng được xem xét để trả lời câu truy vấn. Có hai cách để cung cấp các chỉ mục không gian:

(i) Thiết lập các cấu trúc dữ liệu không gian chuyên dụng từ bên ngoài để bổ sung vào hệ thống cho đối tượng không gian tương tự như cây B-tree cho các thuộc tính chuẩn.

(ii) Các đối tượng không gian được ánh xạ thành các thuộc tính một chiều chuẩn để có thể sử dụng chỉ mục truyền thống như B-tree. Ngoài việc sử dụng để chọn không đối tượng không gian, chỉ mục không gian còn hỗ trợ các thao tác khác như kết nối không gian (spatial join) hay tìm đối tượng không gian gần nhất với giá trị tìm kiếm…

Ý tưởng cơ bản cho lập chỉ mục không gian và cho xử lí truy vấn không gian xử dụng các phương pháp xấp xỉ. Một trong cách tiếp cận kinh điển là sử dụng khung hộp bao nhỏ nhất bao quanh mỗi đối tượng không gian để thiết lập cấu trúc chỉ mục. Do việc sử dụng các khung bao, hầu hết các cấu trúc dữ liệu không gian được thiết kế để lưu trữ hoặc là tập các điểm (đối với các giá trị điểm), hoặc thiết lập một khung hộp (chẳng hạn khung chữ nhật trên không gian hai chiều cho các đối tượng đường hay vùng). Các thao tác cơ bản được cung cấp bởi cấu trúc chỉ mục không gian như vậy là thêm, xóa và tìm kiếm (tìm một khung chữ nhật hay điểm được lưu trữ trong cơ sở dữ liệu). Bên cạnh đó, còn một số thao tác tìm kiếm khác cũng được hỗ trợ.

Một số loại truy vấn quan trọng cho đối tượng điểm:

 Truy vấn khoảng (range query): Tìm tất cả các điểm nằm trong một khung chữ nhật xác định.

 Tìm láng giềng gần nhất (nearest neighbour): Tìm điểm gần nhất với một điểm xác định.

 Quét khoảng cách (distance scan): Liệt kê các điểm theo trật tự khoảng cách so với một điểm xác định.

Một số truy vấn dựa trên khung chữ nhật:

 Truy vấn phủ (overlap query): Tìm tất cả các khung chữ nhật phủ với một khung chữ nhật xác định.

 Truy vấn chứa (contain query): Tìm tất cả các khung chữ nhật nằm hoàn toàn bên trong một khung chữ nhật xác định.

Cũng tương tự các cấu trúc chỉ mục cho các thuộc tính chuẩn, các cấu trúc chỉ mục không gian có thể được phân nhóm hoặc tạo chỉ mục thứ cấp. Mỗi phân nhóm chỉ mục lưu trữ các đối tượng không gian. Mỗi mục trong chỉ mục thứ cấp chỉ chứa tham chiếu tới đối tượng không gian trong cơ sở dữ liệu (ví dụ điểm hoặc khung chữ nhật).

Trong phạm vi đề tài, tác giả đã áp dụng cấu trúc chỉ mục B-Tree và cấu trúc chỉ mục không gian R-Tree để hiện thực trong hệ quản trị cơ sở dữ liệu không gian GeoBase.

Một phần của tài liệu Phát triển các mô hình và thuật toán biểu diễn, xử lý, khai thác dữ liệu không gian và ứng dụng giải một số bài toán GIS (Trang 80 - 82)

Tải bản đầy đủ (PDF)

(175 trang)