Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 34 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
34
Dung lượng
721,42 KB
Nội dung
SH-TREE ĐÁNH CHỈ MỤC TRONG TÌM KIẾM DỮ LIỆU ĐA CHIỀU SVTH: Đoàn Xuân Duy Lê Nguyễn Khánh Duy Phan Thanh Duy Huỳnh Anh Duy LOGO Nội dung Giới thiệu toán Cấu trúc SH-Tree Các phép toán SH-tree Đánh giá hiệu suất Kết luận Giới thiệu toán Hiện có nhiều cách tiếp cận việc đánh mục cho liệu Đánh mục dựa theo phân vùng không gian Đánh mục theo phân vùng liệu Giới thiệu toán Với SR-tree chia không gian thành khối nhỏ ( hình chữ nhật- rectangles–BRs) phân theo đường kính (hình cầu - spheres–BSs) SR-tree chịu fan-out thấp đọc thêm node làm giảm hiệu suất câu truy vấn Giới thiệu toán Vấn đề không gặp phải KD-Tree, fan-out số Không có không gian trống Giới thiệu toán Sh-tree kết hợp kd-tree để giả vấn đề fan-out SR-tree để giải quyến vấn đề cân Để quản lý spatial points extended spatial objects sh-tree cho phép chồng chéo phân vùng Nội dung Giới thiệu toán Cấu trúc SH-Tree Các phép toán SH-tree Đánh giá hiệu suất Kết luận Cấu trúc SH-Tree Cấu trúc SH-Tree Cấu trúc SH-Tree Có loại node SH-Tree: Internal Balanced Leaf 10 Các phép toán SH-tree Search: - Search internal nodes SH-tree tương tự KD-tree R-tree tùy theo query types search balanced nodes leaves tương tự SR-tree - Để thực tìm kiếm ta cần quan tâm metric distance function D (Euclidean metric, Manhattan metric hay Minkowski metric, etc) - Sau số query types: Exact match queries Range queries Nearestneighbor queries k nearest neighbor queries 20 Các phép toán SH-tree Search: 1/ Exact match queries: - Giả thiết: spatial object O d-dimensional space E tìm kiếm object O database - Ý tưởng giải quyết: (1) Duyệt locate balanced nodes chứa query object O Từ xét leaf node thỏa O ’s feature values (2) MBR BS leaf node phải overlap O + True: chứa O False không chứa O Node: Nếu tồn SH-tree(khác R+-tree , UB-tree) 21 Các phép toán SH-tree Search: 2/ Range queries - Giả thiết: Cho query object Q d-dimensional space E giá trị thực r, tìm tất data objects O thỏa: D(Q, O) ≤ r (bounding sphere range queries) - Ý tưởng giải quyết: (1) Xác định balanced node thỏa khoảng truy vấn (2) Cho balanced node xác định, tìm kiếm tất entries Nếu MBR BS overlap khoảng truy vấn data page (DP) load (3) Cho loaded data page, xét tất data objects Nếu D(Q, O) ≤ r object O báo kết cần tìm 22 Các phép toán SH-tree Search: 3/ Nearest neighbor queries - Giả thiết:Cho query object Q d -dimensional space E Tìm tất data objects O database có khoảng cách gần với Q - Ý tưởng giải quyết: 23 Các phép toán SH-tree Search: 4/ k nearest neighbor queries - Giả thiết:Cho query object Q d-dimensional space E số tự nhiên k, tìm k objects gần với Q database Đây khái quát hóa NN queries 24 Nội dung Giới thiệu toán Cấu trúc SH-Tree Các phép toán SH-tree Đánh giá hiệu suất Kết luận 25 Đánh giá hiệu suất (1) Thuật toán truy vấn k-NN: Kế thừa chỉnh sửa thuật toán từ hai công trình trước: • • N Roussopoulos, S Kelley, F Vincent: Nearest Neighbor Queries 1995 G.R Hjaltason, H Samet: Ranking in Spatial Databases 1995 Chỉnh sửa: • • Không tính toán MINMAXDIST Không sử dụng “Active Branch List” 26 Đánh giá hiệu suất (2) Tập liệu đo đạc: Tập liệu phân phối đồng nhất: • Số chiều dao động từ 2->64, mỗi tập chứa 100,000 “tuples” Tập liệu thực tế: • 60,000 vector đặc trưng chiều trích xuất từ bức ảnh thực tế ( http://kdd.ics.uci.edu) Hệ thống đo đạc: CPU: Sun Ultra Sparc-II 300MHz RAM: 256MB, HardDisk: vài GB 27 Đánh giá hiệu suất (4) Kết quả: 28 Đánh giá hiệu suất (5) Kết quả: 29 Đánh giá hiệu suất (5) Kết quả: 30 Nội dung Giới thiệu toán Bài toán đặt Giải pháp Đánh giá hiệu suất Kết luận 31 Kết luận 32 Tài liệu tham khảo [1] The SH-Tree: A Novel and Flexible Super Hybrid Index Structure for Similarity Search on Multidimensional Data, IJCSA, 3(1):1-25, 2006 [2] The Hybrid Tree: An Index Structure for High Dimensional Feature Spaces , Kaushik Chakrabarti, Sharad Mehrotra 33 Thank You ! LOGO www.themegallery.com [...]... phần tử con) 12 SH- Tree node: Leaf Có cấu trúc tương tự SS -Tree LN: (minO_E Khác biệt với SS -tree, R* tree (Hình 1) 1 - Redistribution: Phân bố lại 1 data object (object entry) từ overfull leaf cho sibling Ta xét locally located trong balanced node vì mỗi balanced node có thể sẽ có (minBN_E,maxBN_E) khác nhau 1 sibling: node gần nhất với overfull node mà còn ít nhất 1 chỗ trống 17 Các phép toán trên SH- tree Insertion: Hình 1 18 Các phép toán trên SH- tree Delete: Khi xóa ... objects sh- tree cho phép chồng chéo phân vùng Nội dung Giới thiệu toán Cấu trúc SH- Tree Các phép toán SH- tree Đánh giá hiệu suất Kết luận Cấu trúc SH- Tree Cấu trúc SH- Tree Cấu trúc SH- Tree Có... Cấu trúc SH- Tree Các phép toán SH- tree Đánh giá hiệu suất Kết luận Giới thiệu toán Hiện có nhiều cách tiếp cận việc đánh mục cho liệu Đánh mục dựa theo phân vùng không gian Đánh mục theo... node 19 Các phép toán SH- tree Search: - Search internal nodes SH- tree tương tự KD -tree R -tree tùy theo query types search balanced nodes leaves tương tự SR -tree - Để thực tìm kiếm ta cần quan tâm