Cây khoảng quan hệ (RItree) tận dụng được những chỉ mục sẵn có trong CSDL quan hệ, do đó có thể thực thi truy vấn khoảng một cách hiệu quả và dễ dàng . Trong báo cáo với đề tài là “Xử lý hiệu quả câu truy vấn hỗn hợp giá trị khoảng và giá trị đơn trong CSDL quan hệ” trình bày tóm tắt về cấu trúc cây khoảng, cây khoảng quan hệ và ứng dụng của nó trong xử lý truy vấn giao khoảng và xử lý truy vấn hỗn hợp khoảng với giá trị đơn. Báo cáo gồm 4 nội dung chính: Tìm hiểu bài toán xử lý truy vấn trong CSDL Tìm hiểu cấu trúc cây khoảng Tìm hiểu cấu trúc cây khoảng quan hệ và ứng dụng của nó trong xử lý truy vấn Cài đặt thuật toán
Thanh Nga Pisces - HHX MỤC LỤC LỜI NÓI ĐẦU NỘI DUNG CHƢƠNG TÌM HIỂU BÀI TOÁN XỬ LÝ TRUY VẤN TRONG CƠ SỞ DỮ LIỆU 1.1.Giới thiệu toán xử lý truy vấn 1.2.Vấn đề 1.3.Cách giải 1.4.Nghiên cứu trước 1.5.Cách giải quyết, cách khắc phục bất cập, ưu điểm 1.6.Cơ sở lý luận CHƢƠNG TÌM HIỂU CẤU TRÚC CÂY KHOẢNG 2.1.Sơ lược khoảng 2.2.Cây khoảng – định nghĩa James Stewart 11 2.2.1 Định nghĩa 11 2.2.2.Cấu trúc lƣu trữ khoảng 12 2.2.3.Truy vấn khoảng 16 2.2.4.Thêm khoảng 17 2.3.Cây khoảng – định nghĩa Edelsbrunner 19 2.3.1.Định nghĩa 19 2.3.2.Cấu trúc liệu 20 2.3.3.Stabbing Query – Truy vấn điểm 21 2.4.Phân loại khoảng 22 CHƢƠNG 3.TÌM HIỂU CẤU TRÚC CÂY KHOẢNG QUAN HỆ VÀ ỨNG DỤNG CỦA NÓ TRONG XỬ LÝ TRUY VẤN 26 3.1.Việc quản lý khoảng sở liệu 26 3.1.1.Cấu trúc nhớ 26 3.1.2.Cấu trúc lƣu trữ thứ cấp 26 3.1.3.Cấu trúc lƣu trữ quan hệ 27 3.2.Dữ liệu khoảng liệu quan hệ 27 3.3.Tìm hiểu cấu trúc khoảng quan hệ 29 3.3.1 Tổng quan khoảng quan hệ 29 3.3.2 Cấu trúc liệu động 29 3.3.3 Cấu trúc khoảng quan hệ 31 3.3.5 Sự tăng cƣờng động không gian liệu 36 Thanh Nga Pisces - HHX 3.3.6 Phân tích chiều cao 39 3.4.Ứng dụng khoảng quan hệ xử lý truy vấn 40 3.4.1.Mối quan hệ khoảng thông thƣờng 41 3.4.2.Quản lý liệu khoảng liệu giá trị sử dụng RI 42 3.4.3.Thuật toán xử lý truy vấn 43 3.4.4.Một số kỹ thuật nâng cao thuật toán RI-tree 53 CHƢƠNG CÀI ĐẶT THUẬT TOÁN 57 4.1.Cài đặt khoảng quan hệ SQL truy vấn khoảng 57 4.2.Tích hợp khoảng quan hệ ứng dụng, truy vấn duyệt 61 4.3.Đánh giá thuật toán 64 KẾT LUẬN 67 5.1.Kết đạt 67 5.2.Hướng phát triển 67 TÀI LIỆU THAM KHẢO 68 PHỤ LỤC 69 Thanh Nga Pisces - HHX LỜI NÓI ĐẦU Trong năm gần đây, nhiều kiểu liệu với mục đích đặc biệt có sẵn sở liệu quan hệ Thay cung cấp hệ thống với ứng dụng cụ thể, chẳng hạn nhƣ sở liệu không gian, đa phƣơng tiện hay sở liệu XML cho vùng xác định, thực thi sở liệu giới thiệu ngày nhiều kiểu liệu nhiều chức quản lý tƣơng ứng trực tiếp vào hệ quan hệ, tích hợp trực tiếp vào nhân CSDL cung cấp giao diện mở rộng cho phép ngƣời dùng định nghĩa kiểu yêu cầu phức tạp với thao tác thích hợp Các ứng dụng sở liệu đại thể nhu cầu ngày tăng quản lý khoảng cách hiệu có tính động, đặc biệt liệu thời gian không gian hay điều khiển ràng buộc Tuy nhiên, cách tiếp cận thơng thƣờng địi hỏi tăng cƣờng cấu trúc mục lại không đƣợc hỗ trợ hệ sở liệu quan hệ có Cây khoảng quan hệ (RI-tree) tận dụng đƣợc mục sẵn có CSDL quan hệ, thực thi truy vấn khoảng cách hiệu dễ dàng Trong báo cáo ĐATN với đề tài “Xử lý hiệu câu truy vấn hỗn hợp giá trị khoảng giá trị đơn CSDL quan hệ”, em xin trình bày tóm tắt cấu trúc khoảng, khoảng quan hệ ứng dụng xử lý truy vấn giao khoảng xử lý truy vấn hỗn hợp khoảng với giá trị đơn Báo cáo gồm nội dung chính: - Tìm hiểu tốn xử lý truy vấn CSDL - Tìm hiểu cấu trúc khoảng - Tìm hiểu cấu trúc khoảng quan hệ ứng dụng xử lý truy vấn - Cài đặt thuật toán Thanh Nga Pisces - HHX NỘI DUNG Chƣơng TÌM HIỂU BÀI TỐN XỬ LÝ TRUY VẤN TRONG CƠ SỞ DỮ LIỆU 1.1.Giới thiệu tốn xử lý truy vấn * Mục đích xử lý truy vấn: Giảm thiểu thời gian xử lý Giảm vùng nhớ trung gian Giảm chi phí truyền thông trạm * Chức xử lý truy vấn: Biến đổi truy vấn mức cao thành truy vấn tƣơng đƣơng mức thấp Phép biến đổi phải đạt đƣợc tính đắn hiệu Mỗi cách biến đổi dẫn đến việc sử dụng tài nguyên máy tính khác nhau, nên vấn đề đặt lựa chọn phƣơng án dùng tài nguyên * Các phương pháp xử lý truy vấn đơn giản Phƣơng pháp biến đổi đại số: đơn giản hóa câu lệnh truy vấn nhờ phép biến đổi đại số tƣơng đƣơng, nhằm giảm thiểu thời gian thực phép tốn, phƣơng pháp khơng quan tâm đến kích thƣớc cấu trúc liệu Phƣơng pháp ƣớc lƣợng chi phí: xác định kích thƣớc liệu, thời gian thực phép toán truy vấn Phƣơng pháp phải xác định kích thƣớc liệu chi phí thời gian thực phép tốn câu truy vấn Thanh Nga Pisces - HHX 1.2.Vấn đề Số lƣợng loại liệu không gian thời gian sở liệu nói chung sở liệu thời gian gần ngày tăng Để hỗ trợ hiệu cho việc truy vấn nội dung liệu có chứa điều kiện khoảng thời gian đƣợc tốt nhƣ liệu có đặc tính thơng thƣờng thời điểm cấu trúc mục dùng để truy vấn phải hỗ trợ đƣợc hai loại thuộc tính Dựa cấu trúc khoảng quan hệ (Relational Interval Tree), tạo đƣợc mục hỗ trợ cho câu truy vấn phức hợp tích hợp hệ sở liệu quan hệ với kết tối ƣu Tham khảo kỹ thuật trƣớc phƣơng pháp RI- tree đƣợc thực tốt đối so sánh với phƣơng pháp truy cập thông thƣờng 1.3.Cách giải Dùng phƣơng pháp RI-tree (Relational Interval Tree) 1.4.Nghiên cứu trƣớc Phƣơng pháp Interval-Spatial Transformation [1] dựa mã hoá khoảng đƣờng cong lắp đầy gọi trật tự D-, V- H- ánh xạ biên vào khơng gian tuyến tính Cấu trúc tỏ thích ứng với mục phức hợp Nhƣng phƣơng pháp khơng hiệu nhƣ câu chọn lựa trả kết sai đƣờng bao thuộc tính Phƣơng pháp Window-List [2] Ramaswamy giải pháp tĩnh cho vấn đề quản lý khoảng tận dụng B+tree Nhƣng không may việc cập nhật cận biên khơng đƣợc tốt Việc thêm vào nhƣ xố khoảng làm tổn hại đến câu truy vấn cấu trúc Segment R-tree (SR-tree) [3] Kolovson and Stonebraker kết hợp memory-based segment với lƣu trữ đối tƣợng thứ cấp (secondary storage-oriented R-tree) Tuy vậy, phƣơng pháp trở nên Thanh Nga Pisces - HHX hiệu mà có q nhiều khoảng bị xố Hơn nữa, để thực đƣợc SR- tree yêu cầu phải có cấu trúc tƣơng thích R-tree 1.5.Cách giải quyết, cách khắc phục bất cập, ƣu điểm - Phân chia câu truy vấn thành loại khác tạo mục tối ƣu cho loại định Truy vấn giá trị điểm (Value-Stabbing Queries); Truy vấn khoảng giá trị (Value-Interval Queries); Truy vấn dãy điểm (Range-Stabbing Queries); Truy vấn dãy khoảng (Range-Interval Queries) - Khơng có loại mục tổng qt tốt cho tất loại liệu, nên việc phân loại giải đƣợc nhƣợc điểm phƣơng pháp trƣớc Ƣu điểm: Ứng với loại câu truy vấn khác có mục tƣơng ứng việc thực truy vấn đạt kết cao 1.6.Cơ sở lý luận - Interval Tree - Relational Interval Tree (RI-tree) - Cây nhị phân Thanh Nga Pisces - HHX Chƣơng TÌM HIỂU CẤU TRÚC CÂY KHOẢNG Trong số toán, việc giải thơng thƣờng khó khăn, khơng phải mặt giải thuật mà độ phức tạp thuật tốn Độ phức tạp cao, chƣơng trình chạy nhiều thời gian Để giải vấn đề này, ngƣời ta nghĩ cấu trúc liệu đặc biệt, số khoảng - Interval Tree Xét số toán quen thuộc sau: Một số toán: Bài toán dãy số: Cho dãy số có độ dài N gồm số nguyên ( đánh số từ → N1) Ngƣời ta có M yêu cầu gồm loại sau: + C i j : Thay phần tử thứ i giá trị j + Q i j : xuất tổng phần tử dãy số, từ vị trí i đến vị trí j Yêu cầu : Cho trƣớc dãy số yêu cầu file DAYSO.INP Hãy làm phép biến đổi dãy viết kết file DAYSO.OUT Giới hạn : 1