1. Trang chủ
  2. » Công Nghệ Thông Tin

Truy vấn hướng đối tượng dựa trên phân cấp tập tin chữ ký và cây SD Tree

8 3 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Bài viết Truy vấn hướng đối tượng dựa trên phân cấp tập tin chữ ký và cây SD Tree đề xuất một phương pháp lập chỉ mục mới. Phương pháp này dựa trên kỹ thuật sử dụng tập tin chữ ký và cây SD Tree trong đó các tập tin chữ ký được tổ chức theo phân cấp để nhanh chóng lọc dữ liệu không thích hợp và mỗi tập tin chữ ký được lưu theo cấu trúc cây SD Tree nhằm tăng tốc độ quét chữ ký.

Kỷ yếu Hội nghị Quốc gia lần thứ VIII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 DOI: 10.15625/vap.2015.000213 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN PHÂN CẤP TẬP TIN CHỮ KÝ VÀ CÂY SD-TREE Trần Minh Bảo1, Trương Công Tuấn2 1, Trường Đại học Khoa học, Đại học Huế tmbaovn@gmail.com, tctuan_it_dept@yahoo.com TÓM TẮT - Truy vấn trực tiếp đối tượng sở liệu hướng đối tượng tốn chi phí lưu trữ liệu trình truy vấn tốn nhiều thời gian để thực truy vấn hệ thống liệu thực Gần đây, có nhiều nghiên cứu tập trung vào việc giải vấn đề cách xây dựng mục lớp đơn, phân cấp lớp, phân cấp đối tượng lồng Trong báo này, đề xuất phương pháp lập mục Phương pháp dựa kỹ thuật sử dụng tập tin chữ ký SD-tree tập tin chữ ký tổ chức theo phân cấp để nhanh chóng lọc liệu khơng thích hợp tập tin chữ ký lưu theo cấu trúc SD-tree nhằm tăng tốc độ quét chữ ký Kỹ thuật giúp giảm đáng kể không gian tìm kiếm cải thiện đáng kể độ phức tạp thời gian truy vấn Từ khóa - Hệ thống sở liệu hướng đối tượng, mục, tập tin chữ ký, SD-Tree, truy vấn hướng đối tượng I MỞ ĐẦU Truy vấn trực tiếp đối tượng sở liệu hướng đối tượng tốn chi phí lưu trữ liệu tốn nhiều thời gian để thực hệ thống liệu thực Bài toán đặt cần mô tả lại hệ thống liệu đơn giản xây dựng cấu trúc liệu tương ứng để giảm khơng gian tìm kiếm q trình thực thi câu truy vấn mà đảm bảo việc truy vấn đối tượng cần thiết Để giảm không gian truy vấn liệu, kỹ thuật mục sử dùng đánh giá truy vấn CSDL đề xuất [6] phát triển dựa chế thăng nhị phân thêm vào số tính chất đặc biệt để giảm việc cân để tối thiểu hóa truy cập vào tập tin liệu Các kỹ thuật phát triển tiếp nhằm tăng tốc truy vấn CSDL hướng đối tượng [10, 11, 12] Ý tưởng SD-tree lớp phân cấp lớp trì mục lồng ghép với mối quan hệ lớp – lớp mục tiêu Ngoài mục theo cấu trúc phân cấp thừa kế có nhiều phương pháp lập mục dùng cho truy vấn thuộc tính lồng đề xuất [1, 2, 3, 7, 9] Thay tập trung vào phân cấp thừa kế lớp, nhà nghiên cứu khác khám phá phân cấp tổng hợp lớp đề xuất cấu trúc lập mục khác theo thuộc tính lồng [1, 2, 7, 9]… cấu trúc lưu trữ tập tin chữ ký làm giảm khơng gian tìm kiếm tối ưu trình truy vấn liệu Để việc tìm kiếm hiệu hơn, cần xây dựng cấu trúc liệu lưu trữ tập tin chữ ký Cấu trúc lưu trữ tập tin chữ ký dạng tập tin chữ ký tuần tự, tập tin chữ ký phân mảnh, cấu trúc chữ ký, cấu trúc dạng đồ thị chữ ký,… Trong đó, chi phí lưu trữ tập tin chữ ký phân mảnh lại gấp đôi tập tin chữ ký chi phí cập nhật tập tin chữ ký phân mảnh gấp ba lần tập tin chữ ký nhiều [8] Ưu điểm phương pháp tập tin chữ ký nằm hiệu xử lý chèn truy vấn lên phần từ Tuy nhiên, so sánh với lập mục dựa cấu trúc tập tin chữ ký liên tiếp lại bị hai nhược điểm, thứ dùng để đánh giá truy vấn phạm vi thứ hai truy vấn xử lý tồn tập tin chữ ký cần phải quét làm tăng chi phí xử lý I/O Trong báo này, cố gắng cải thiện vấn đề thứ hai đến mức độ Đầu tiên, chúng tơi tổ chức tập tin chữ ký sang cấu trúc phân cấp dùng để giảm bớt không gian tìm kiếm trình đánh giá truy vấn Tiếp theo, lưu trữ tập tin chữ ký dạng SD-tree, nhằm tiến hành quét tập tin chữ ký đơn Nếu tập tin chữ ký có kích thước lớn khối lượng thời gian tiết kiệm phương pháp đáng kể Cây SD-tree xây dựng dựa tập tin chữ ký Do đó, tăng tốc q trình xác định vị trí chữ ký tập tin chữ ký Tuy nhiên, SD-tree, đường dẫn tương ứng với định danh chữ ký dùng để xác định chữ ký tương ứng với tập tin chữ ký Cách giúp nhanh chóng tìm tập hợp chữ ký phù hợp với chữ ký truy vấn Bài báo tổ chức sau Trong phần II, đưa số kiến thức sở Tại phần III, giới thiệu cấu trúc liệu thuật toán truy vấn Phần IV đề xuất phương pháp kết hợp phân cấp tập tin chữ ký SD-tree Cuối cùng, phần V đưa kết luận II MỘT SỐ KHÁI NIỆM CƠ SỞ A Chữ ký thuộc tính Trong CSDL hướng đối tượng, đối tượng biểu diễn giá trị thuộc tính Chữ ký giá trị thuộc tính chuỗi bit mã hóa hàm băm Cho trước giá trị thuộc tính, ví dụ chữ “truong”, phân giải thành chuỗi ba chữ sau: “tru”, “ruo”, “uon” “ong” Sau đó, dùng hàm băm h, ánh xạ ba thành số nguyên k với ý nghĩa bit thứ k chuỗi đặt giá trị 730 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN PHÂN CẤP TẬP TIN… Ví dụ, giả sử có h(tru) = 2, h(ruo) = 7, h(uon) = 10, and h(ong) = 11 Sau thiết lập chuỗi bit: 010 000 100 110 làm chữ ký cho từ B Chữ ký đối tượng, tập tin chữ ký Chữ ký đối tượng xây dựng phép toán logic OR cho tất chữ ký giá trị thuộc tính đối tượng Sau ví dụ chữ ký đối tượng: Ví dụ Xét đối tượng có giá trị thuộc tính “truong”, “12345678”, “giao su” Giả sử chữ ký đối tượng là: 010 000 100 110 100 010 010 100 110 100 011 000 Lúc chữ ký đối tượng 110 110 111 110, nhận từ chữ ký giá trị thuộc tính phép tốn logic OR Các chữ ký đối tượng lớp lưu trữ tập tin, gọi tập tin chữ ký đối tượng C Chữ ký truy vấn Một truy vấn đối tượng mã hóa thành chữ ký truy vấn theo hàm băm thực đối tượng Khi có truy vấn cần thực hiện, chữ ký đối tượng quét đối tượng không phù hợp bị loại trừ Lúc chữ ký truy vấn so sánh chữ ký đối tượng tập tin chữ ký Có ba trường hợp xảy ra: (i) Đối tượng phù hợp với truy vấn, nghĩa bit chữ ký truy vấn , bit tương ứng chữ ký đối tượng s nó, tức ∧ , đối tượng thực chứa từ truy vấn; ∧ (ii) Đối tượng không phù hợp với câu truy vấn, nghĩa ; (iii) Chữ ký đối sánh cho kết phù hợp đối tượng không phù hợp với điều kiện tìm kiếm truy vấn Để loại trường hợp này, đối tượng phải kiểm tra sau chữ ký đối tượng đối sánh phù hợp Ví dụ Ví dụ minh họa việc truy vấn chữ ký đối tượng ví dụ 1: Truy vấn Chữ ký truy vấn Kết truong 010 000 100 110 thành công binh 011 000 100 100 không thành công duong 110 100 100 000 thành công không phù hợp Nhận xét: Việc so sánh chữ ký truy vấn sq với chữ ký đối tượng s loại đối sánh khơng xác Nghĩa là, chữ ký truy vấn sq phù hợp chữ ký s bit sq, bit tương ứng s bit Tuy nhiên, bit sq khơng quan trọng bit tương ứng s hay III CẤU TRÚC DỮ LIỆU VÀ THUẬT TOÁN TRUY VẤN A Truy vấn sở liệu hướng đối tượng Trong hệ thống CSDL hướng đối tượng, thực thể biểu diễn dạng đối tượng bao gồm phương thức thuộc tính Các đối tượng có tập thuộc tính phương thức nhóm lại với lớp Nếu lớp C có thuộc tính phức hợp với miền C' thiết lập quan hệ C C' Quan hệ gọi mối quan hệ tổng hợp Khi dùng mũi tên kết nối lớp để biểu diễn mối quan hệ tổng hợp phân cấp tổng hợp xây dựng để hiển thị cấu trúc lồng lớp Ví dụ Một ví dụ hệ thống phân cấp đối tượng lồng minh họa sau: Truong - Khoa: Khoa TenTruong: char DiaChiTruong: char Khoa - TenKhoa: char DiaChiKhoa: char SinhVien - HoTen: char Truong: Truong NganhHoc: NganhHoc NoiSinh: char GioiTinh: byte ThanNhan: ThanNhan MonHoc NganhHoc - MonHoc: MonHoc TenNganh: char - TenMon: char SoTC: int ThanNhan - HoTen: char NoiSinh: char GioiTinh: byte Hình Một ví dụ hệ thống phân cấp đối tượng lồng Trần T Minh Bảo, Trương T Công Tuấnn 731 Nếu đốối tượng o đượ ợc tham chiếuu thuộcc tính đối tượng o’, sau o đượợc coi lồng trrong o’ o’ gọi llà đối tượn ợng cha o Trong CSDL C hướng đối tượng, điềều kiện tìm kiiếm truy y vấn biểểu diễn ddạng tổ hợp th huộc tính Thuuộc tính ccó thể thuộcc tính lồng nhaau lớp mụ ục tiêu Ví dụ 4 Truy vấn ““tìm tất cácc sinh viên sin nh Bến Tre Khoa Cơơng nghệ thơnng tin” biểu diễn d sau: Select SinhVien S Where SinhVien.NoiiSinh = “Bến Tre” And SinnhVien.Truonng.Khoa.TenK Khoa = “Công g nghệ Thông tin” Nếu khhơng có cấu trúúc mục truy vấn nói đư ược đánh giá ttheo trình tự ttrên xuống sau Đầu tiên, hệ thống phải tìm kiếm m tất đốối tượng lớp “SinhVien n” lọc cáác đối tượng ccó nơi sinh “Bến Tre” Tiếp T hệ thốống tìm cácc đối tượng trư ường có tham chiếu sinh viên có nơi ssinh “Bến Trre” kiểm trra tên khoa c trường Cuuối cùng, nhữ ững sinh viên ccó nơi sinh “Bến Tre” vàà thuộc khoa ““Công nghệ T Thông tin” a trường đ trả n cấp tập tin cchữ ký thu uật toán truy vấn B Phân Phân n cấp tập tin cchữ ký Mục đíích việc sử dụng tập tinn chữ ký đểể lọc hầu hết h đối tượợng không đủủ điều kiện, ng ghĩa chữ c ký không phù hợp với cchữ ký truy vấấn đảm bảo o đối tượn ng liên quan vvới chữ ký ày bị bỏ qua a Do trránh việệc truy cập khhông cần thiết vào đối tư ượng Đối với phân cấpp tổng hợp, cóó thể xây dựng g phân cấp tập tin chữ ký saau: (i) Chữ ký k đối tượ ợng tạo cách xếp chồng cáác chữ ký củaa tất thuuộc tính nguyên thủy phức hợp (ii) Chữ ký k thuộc tính nguyên tthủy tạo cách h băm giá trị thuộc tínhh; chữ ký thuộc tính phức hợp chữ kýý đối tượnng mà tham m chiếu (iii) Giả sử C ký hiệuu lớp với o1, , ol đốii tượng lớ ớp đó; tồn m tập tin chữ ữ ký S mà oi (i ( = 1, , l) có mộột mục S (iv) Gọi Si Sj hai ttập tin chữ kýý tương ứng liêên kết với cácc lớp Ci Cj Nếu tồn m mũi tên từ Ci đến Cj, cũũng ngầm địnhh có mũi ttên từ Si đến Sj Ví V dụ Chữ ký k phân cấấp tập tin chữ ký minh h họa sau: H Hình Chữ kýý phân cấp tậập tin chữ ký Xét lớpp “Khoa” trongg phân cấp lớpp khơng th huộc tính phứ ức hợp hìnhh Chữ ký củủa đối tượng o xây dựng d phư ương pháp nhhư hình (a), ó s(o, x) ký k hiệu chữ kký tạo raa cho giá trị th huộc tính x c o s(o) ký k hiệu chữ kký o Đối vvới lớp th huộc tính phứcc hợp chữ ký đốối tượng g đ tạo theo cách thức lớp c thuộc tính nguyên thủy Sự khác biệtt chữ c ký th huộc tính phứ ức hợp chữ kký đối tượ ợng mà thaam chiếu đượcc minh họa hhình 2(b) Tronng hình (b), o’ ký hiệu cho c đối tượng lớp “Truoong” đối tư ượng o lớ ớp “Khoa” giá g trị thuộc tíính “Khoaa” o’ Mộ ột phân cấp tập tin chữ ký mà xâyy dựng cho m sở liệệu hiển thị t hình minh họa hình 2(c) ý Thuậật toán truy vvấn dựa ttập tin chữ ký Định Đ nghĩa 1:: (Cây truy vấấn) Gọi ∧ … ∧ điều đ kiện tìm kiếm k truuy vấn Q, tronng pi vị từ có c dạng: Lúc đó, tất cáác đường dẫn xuất x ng điều kiện tìm m kiếm tạo thành c truy vấn, ký k hiệu Qt 732 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN PHÂN CẤP TẬP TIN… Ví dụ Cây truy vấn minh họa sau: SinhVien Truong NoiSinh Khoa TenKhoa Hình Cây truy vấn Định nghĩa 2: (Cây chữ ký truy vấn) Gọi p1.p2 pn đường dẫn truy vấn Qt Gọi vị từ xuất điều kiện tìm kiếm Q Lúc đó, chữ ký pn svalue Chữ ký nút nút Qt tạo phép toán logic OR cho chữ ký nút Cây chữ ký truy vấn ký hiệu Q(s,t) Vi dụ Cây chữ ký truy vấn minh họa sau: SinhVien 110 110 100 110 NoiSinh 100 110 000 100 Truong 010 000 100 110 Bến Tre 100 110 000 100 Khoa 010 000 100 110 TenKhoa 010 000 100 110 Công nghệ Thông tin 010 000 100 110 Hình Cây chữ ký truy vấn Sử dụng chữ ký truy vấn để giảm bớt không gian tìm kiếm Phương pháp này, cần có hai cấu trúc ngăn xếp (stack) để điều khiển việc quét ưu tiên chiều sâu cấu trúc cây: stackq Q(s,t) stackc phân cấp lớp Trong stackq, thành phần chữ ký trong stackc, thành phần tập đối tượng thuộc lớp tiếp cận cách quét phân cấp lớp Thuật toán [4] Tìm kiếm phân cấp theo kiểu xuống; Vào: Một truy vấn đối tượng Q; Ra: Một tập OIDs thỏa mãn truy vấn Phương pháp: Bước Tính tốn phân cấp chữ ký truy vấn Q(s,t) Q Bước Đưa chữ ký gốc Q(s,t) vào stackq; đẩy tập OID đối tượng lớp mục tiêu vào stackc Bước Nếu stackq không rỗng, sq ← lấy stackq; ngược lại chuyển sang (Bước 7) Bước S ← lấy stackc; với oidi E S, chữ ký osigi khơng so sánh với sq, loại khỏi S; đưa S vào Sresult Bước Gọi C lớp đối tượng S; gọi C1, , Ck lớp C; sau phân chia tập OID đối tượng tham chiếu S vào S1, , Sk cho Si thuộc Ci; đẩy S1, , Sk vào stackc; đẩy nút sq vào stackq Bước Chuyển đến (Bước 3) Bước Đối với đối tượng lá, kiểm tra phù hợp không Kỹ thuật giúp đạt tối ưu hóa thực bước (4) Tại bước này, số đối tượng lọc cách sử dụng chữ ký tương ứng chữ ký truy vấn Trong bước (5), đối tượng tham chiếu chữ ký nút chữ ký truy vấn tương ứng đưa vào stackc stackq Trong bước (7), thực việc kiểm tra nhằm lẫn Trần T Minh Bảo, Trương T Cơng Tuấnn 733 Ví V dụ Giả sử pphần phânn cấp tập tin chữ c ký xây x dựng cho CSDL v ới sơ đồ c minh họa trrong hình thhuộc dạng đượ ợc mơ tả trongg hình 5: Hình Minnh họa trìnhh truy vấn Khi hai chữ ký đầầu tập tin chữ ký cho “SinhVien” phù ù hợp với chữữ ký tương ứnng chữ ký truy vấn, v chữ ký k tham chiếu chúúng tập tin chữ ký ch ho “Truong” sẽẽ kiểm ttra bổ sung Giả G sử chữ c ký đầu tiêên “Truonng” tham m chiếu ch hữ ký n “Sinh Vien” kkhi chữ ký thứ ứ hai “Truong” “ đượ ợc tham chiếuu chữ ký thứ hai “SinhVien” Có thể thấy rrằng chữ ký thứ hai “Truong” không k phù hợpp với chữ ký ttương ứng troong chữ ký ý truy vấn Vìì tất cáác chữ ký đối tượng “K Khoa” n tham chiếuu khơng bị kkiểm tra (xem m minh họa phần màu xám hình 5) Việc llà tối ưu so s sánh với “tìm “ kiếm trênn xuống” troong “tìm kiếm xuống” phải p tiến hành h kiểm tra tất ccả chữ kýý đối tượng “Khoa” C Cây SD-tree S Tổng quát q cấu trrúc SD-tree Kỹ thuậật tạo mụcc hệ thốống CSDL hướ ớng đối tượng g ccách sử dụng SD-tree (Phân cụm chữ c ký) Trongg cơng việc nnày, vị trí bit bit b chữ ữ ký phâân bổ qua mộột tập hợp nút Sử dụng d phương pháp choo chữ ký truy vấn cho sẵn tất cảả chữ ký ttrùng khớp đềều đượ ợc truy vấn tích lũy m nút đơn Việc truy vấnn, đường tìm t kiếm tối ưu tính toốn để đẩy nhhanh tồn q q trình Ví V dụ Cây chữ c ký SD-treee minh họa sau: D-tree Hình Cây chữ ký SD Để xử lý l chữ kýý truy vấn Sq: (1) Đối với chữ c ký có trọn ng lượng dướii 50% xét xxuất cuối bit b vị trí i Sq tììm thấy với ự tạo thành tiềền tố trung giaan (B); (2) Đốối với chữ ký ccó trọng lượng g 50% xét x xuất hiệện cuối ccủa bit vvị trí i Sq tìm thấy với v tạo thàành tiền tố trunng gian (B) Sau S đó, nút chữ c ký nútt thứ i đượcc truy cập từ ggốc tất c chữ ký vớii tiền tố (B) đưược truy vấn Ví V dụ 10 Choo Sq = 0110011000101 Để ttìm tất chữ ký khớp với Sq, SD SD-tree xxét kỹ từ gốc giá trrị nút soo sánh với vị ttrí bit Sq Sự xuất hiiện cuối S q vị trí 122 Tiền tố nhị phân tạo thành cho Sq cách sử dụng vị tríí bit 01100100010 Một nút với ggiá trị khóa làà 12 truy y cập danh d sách chữ ữ ký lưu trữ biit dạngg gom cụm vàà tất chữ ký ý danh ssách chữ ký đđược kiểm tra giá trị tiền tố 011001000110 Do đó, khhơng kể tới m mẫu bit Sq, tất chữ ữ ký trùng khớớp trrả truy cập đơn đ Tương tự, sử dụng SD-ttree để mô tả bit dạn ng gom cụm Điều giúpp cải thiện thờ ời gian tìm kiếm k chữ ký có c trọng lượngg 50% B Bây giờ, giả sử Sq= 011101110101 Sự xuất cuối a bit vị v trí 11 Như nút có giáá trị 11 đđược tìm kiếm m danh sách chữ ký lưưu trữ bit dư ưới dạng gom cụm n SD D-tree Thuật toán truy vấn Thuật T toán sauu phác thảảo bước tììm kiếm chữ ký k khớp với ch hữ ký truy vấnn cho trước Sq Trong q trình t F← c thuật tốn đến trực tiếp nút chữ ký hồi đáp p lại cuối cùn ng từ gốc 734 TRUY VẤN HƯỚNG H ĐỐI TƯỢ ỢNG DỰA TRÊN N PHÂN CẤP TẬP TIN… Thuật T tốn [14] Tìm kiếếm(Sq) Vào: V Chữ ký truy t vấn Ra: R Danh sáchh chữ ký kkhớp với chữ ký cho sẵn Phương P pháp: Bước B Tínhh trọng lượng cchữ ký cho chhữ ký truy vấn n Bước B Nếuu trọng lượng cchữ ký lớn hơ ơn 50% tìm m kiếm chữ ký ý truy vấn tronng nút ccho bit Bước B Nếu khơng tìm m kiếm chữ ký truy vấn nút ch ho bit Bước B Truyy cập nút Bước B So sáánh tiền tố củaa Sq Bước B Nếu tìm thấy đđọc xuất danh sách cácc chữ ký Bước B Nếu khơng báoo cáo khơng cóó chữ ký phù hợp IV PHƯƠ ƠNG PHÁP K KẾT HỢP PH HÂN CẤP TẬ ẬP TIN CHỮ Ữ KÝ VÀ CÂY Y SD-TREE A Mơ hình h cấu trúc liệu truy vấn Để cải thiện thời giann truy vấn trêên sở liệệu, cần mô tả lại hệ thống ddữ liệu đơn giiản xây y dựng cấu trrúc liệu tương ứng để cóó thể giảm khơng gian tìm kiếm k qu trình thực thhi câu truy vấấn mà đảm m bảo việc v truy vấn đ đối ttượng cần thiếết cách sử s dụng chữ c ký Từ [4]], để vấn đề trruy vấn tối ưu cần c kết hợp phhân cấp tập tinn chữ ký ccây chữ ký, vấấn đề đ chứng m minh cải thiệện thời gian trruy vấn tốt h Từ [13], độ phức tạp thhời gian truy vấn SD-tree S nhỏ h nhiều so với độ phứ ức tạp thời gia an truy vấn trrên chữ ký k Do đó, chúúng tơi sử dụng phân cấấp tập tin chữ ữ ký trongg [4], thhay ch hữ ký c SD-tree đểể cải thiện thờ ời gian truy vấnn tốt Dựa trêên sở lý thuuyết thuật tooán đề ngh hị trên, báo đề xuất pphương pháp kết hợp phân cấp tập tin chữ c ký câyy SD-tree sau: (1) Mỗi tập tin chữ ký k lưu trrữ dạng cấu trúc SSD-tree để tăng tốc trrình quét tập tin chữ ký; (22) Tất tập tin chữ ký ý tổ ức theo cấu trúúc phân cấp đđể tạo thuật lợ ợi cho việc th hực kỹ thhuật lọc theo ttừng bước Trrong mơ hình này, n thuật toán n nhằm xác định chữ ký tthuộc lớp nào, thuật tốn xác định chínnh xác chữ kýý lớp cụ thể Ví V dụ 11 Tạo SD-tree đđược minh họaa sau: Hình 7 Tạo SD-ttree Ví V dụ 12 Kết hợp phân cấpp tập tin chữ kýý SD-trree minh h họa sau : Hìn nh Phân cấpp tập tin chữ ký SD-tree ợc lưu trữ hồàn tồn bên trrong nhớ chính, c trrường hợp nàyy, việc chèn v xóa Cấu trúúc liệu đượ chữ c ký câây SD-tree đượ ợc thực ddễ dàng Tuy nhiên, c sở liệu tập tin thư ường lớn, cấu trrúc liệu sẽẽ khơng thể lư ưu trữ bộộ nhớ mà m phải lưu trữ nhớ ngoàii Đối với sở liệu hướng h đối tượ ợng, lưu trữ thực thhi nhớ Cơ sở liệu hướnng đối tượng ccó nhiều lớp, m lớp có nhiều n đối tượnng Ứng với m lớp đượ ợc xây dựng thành t cấu u trúc SD tree, đồng thờời đối tượ ợng Trần Minh Bảo, Trương Công Tuấn 735 tạo chữ ký đối tượng Toàn sở liệu hướng đối tượng phân hoạch dạng cấu trúc bảng băm gồm chữ ký đối tượng để thực trình truy vấn B Xử lý truy vấn hướng đối tượng Để thực việc truy vấn đối tượng sở liệu hướng đối tượng, phải chuyển đổi sở liệu hướng đối tượng thành cấu trúc liệu trên, ta thực sau: Bước Thuộc tính đối tượng băm thành chữ ký nhị phân thuộc tính tạo thành chữ ký đối tượng Bước Các chữ ký đối tượng lớp tạo thành SD-tree Bước Tạo phân cấp tập tin chữ ký tập tin SD-tree Sau có cấu trúc liệu để truy vấn, ta thực trình truy vấn đối tượng sở liệu hướng đối tượng sau: Bước Mã hố từ khóa cần truy vấn thành chữ ký nhị phân Bước Thực truy vấn chữ ký từ khóa để xác định thuộc lớp cần truy vấn Bước Thực truy vấn chữ ký từ khóa SD-tree tương ứng với lớp xác định C Đánh giá độ phức tạp So sánh tìm kiếm theo phương pháp Yong phân cấp tập tin chữ ký Để ước tính số đối tượng truy cập truy vấn sử dụng hai phương pháp khác nhau: (1) phương pháp Yong đề xuất [15]; (2) tìm kiếm phân cấp theo kiểu xuống [4] (1) Phương pháp Yong Phương pháp Yong, chữ ký đối tượng bị tham chiếu lưu trữ đối tượng tham chiếu Sau đó, tiến hành kiểm tra thuộc tính chữ ký chúng trước truy cập Bằng cách tiết kiệm nhiều phép toán I/O (2) Tìm kiếm phân cấp theo kiểu xuống Phương pháp này, có khả lọc mạnh mẽ so với phương pháp Yong Điều kiểm tra nút phân cấp chữ ký truy vấn, khơng thuộc tính liên quan đến nút hành mà cịn có số thuộc tính khác ảnh hưởng chúng đưa lên số đường dẫn tới nút Sử dụng phân cấp chữ ký truy vấn, có nhiều đối tượng lớp mục tiêu bị loại bỏ cách kiểm tra tập tin chữ ký tương ứng, điều dẫn tới giảm bớt đáng kể tổng số đối tượng truy cập Trong [4], cho thấy đạt hiệu suất cao phương pháp tìm kiếm phân cấp xuống từ quan điểm trừu tượng, phân cấp chữ ký truy vấn lọc “toàn cục” kỹ thuật nhân Yong phát triển coi lọc “cục bộ” Cả hai giúp giảm số đối tượng truy cập So sánh độ phức tạp thời gian chữ ký SD-tree (i) Phương pháp chữ ký Trong [13, 14], độ phức tạp thời gian chèn vào chữ ký O(nF), n số chữ ký tập tin F độ dài chữ ký bao gồm bit bit Với chữ ký, chiều cao bị giới hạn O(log2n), n số nút Chi phí tìm kiếm chữ ký trung bình O(λ.log2n), λ số đường qua (ii) Phương pháp SD-tree Trong [13, 14], SD-tree sử dụng cấu trúc mục cho tập hợp liệu lớn, giá trị F nhỏ giảm thời gian xây dựng SD-tree Độ phức tạp thời gian chèn bị giới hạn O(n.m) n số chữ ký tập tin m số bit chữ ký cho trước Một đặc tính hữu ích khác SD-tree với giá trị F lớn hơn, cách biến đổi p, giá trị h, chiều cao giữ mức nhỏ để thúc đẩy tìm kiếm nhanh giới hạn O(logp(F/p-1)) Thời gian tìm kiếm cho truy vấn với tập hợp bit vị trí thứ i sau tổng thời gian truy cập nút (Tli) thời gian tìm kiếm nút chữ ký (Tsi ) tính sau: Ts=Tli+Tsi Trong Tli khơng thay đổi cho tất nút cho cấu trúc cân động SD-tree Tsi tăng giá trị i tăng Do vậy, thời gian tìm kiếm bị giới hạn O(Tli+2i -1) So sánh độ phức tạp thời gian tìm kiếm chữ ký O(λ.log2n) SD-tree O(Tli+2i -1), rõ ràng giá trị Tli nhỏ so với giá trị λ, lợi SD-tree V KẾT LUẬN Trong báo này, đề xuất kỹ thuật lập mục Phương pháp tiếp cận kết hợp phân cấp tập tin chữ ký với SD-Tree Để tối ưu hóa việc quét phân cấp đối tượng, dựa phân cấp tập tin chữ ký để giảm bớt số nhánh Tuy nhiên, tập tin chữ ký làm việc với tư cách lọc phi xác, khơng thể bị xếp hay tìm kiếm nhị phân nên khơng thể dùng để tăng tốc q trình qt tập tin chữ ký Do đó, chúng tơi đề xuất xây dựng SD-Tree tập tin chữ ký xuất với tư cách nút phân cấp 736 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN PHÂN CẤP TẬP TIN… tập tin chữ ký Kỹ thuật tránh phải tìm kiếm giúp giảm kể thời gian cần thiết để tìm kiếm tập tin chữ ký VI TÀI LIỆU THAM KHẢO [1] Bertino, “Optimization of queries using nested indices”, in Proceedings of International Conference on Extending Database Technology, 1990, pp 44-59 [2] Bertino and C Guglielmani, “Optimization of object-oriented queries using path indices”, in 2nd International Workshop on Research Issues on Data Engineering: Transaction and Query Processing, 1992, pp 140-149 [3] S Choenni, E Bertino, H M Blanken,and T Chang, “On the selection of optimal index configuration in OO databases”, in Proceedings of 10th International Conference on Data Engineering, 1994, pp 526-537 [4] Yangjun Chen, “Building Signature Trees into OODBs”, Journal of Information Science and Engineering, 20(2), 2004, 275-304 [5] Dervos, Y Manolopoulos, and P Linardis, “Comparison of signature file models with superimposed coding”, Journal of Information Processing Letters, Vol 65, 1998, pp 101-106 [6] R Elmasri and S B Navathe, Fundamentals of Database Systems, Benjamin Cumming, California, 1989 [7] Fotouhi, T G Lee, and W I Grosky, “The generalized index model for object-oriented database systems”, in 10th Annual International Phonix Conference on Computers and Communication, 1991, pp 302-308 [8] Y Ishikawa, H Kitagawa, and N Ohbo, “Evaluation of signature files as set access facilities in OODBs”, in Procreedings of ACM SIGMOD International Conference on Management of Data, 1993, pp 247-256 [9] W Kim, K C Kim, and A Dale, “Indexing Techniques for Object Oriented Databases”, Addison Wesley, 1989, pp 371-394 [10] Kemper and G Moerkotte, “Access support relations: an indexing method for object bases”, Information Systems, Vol 17, 1992, pp 117-145 [11] C C Low, B C Ooi, and H Lu, “H-trees: a dynamic associative search index for OODB”, in Proceedings of 1992 ACM SIGMOD Conference on the Management of Data, 1992, pp 134-143 [12] Sreenath and S Seshadri, “The hcC-tree: an efficient index structure for object oriented database”, in Proceedings of International Conference on Very Large Database, 1994, pp 203-213 [13] I.E Shanthi, R Nadarajan, “Applying SD-Tree for Object-Oriented Query Processing”, Informatica (Slovenia), 33(2), 2009, 169-179 [14] Ms Ankita Thakur, Ms Meena Chauhan, “Optimizing Search for Fast Query Retrieval in Object Oriented Databases Using Signature Declustering”, International Journal of Engineering Research and Development, 2012, pp 46-50 [15] S Yong, S Lee, and H J Kim,“Applying signatures for forward traversal query processing in object-oriented databases”, in Proceedings of 10th International Conference on Data Engineering, 1994, pp 518-525 OBJECT-ORIENTED QUERIES BASE ON SIGNATURE FILE HIERARCHY AND SD-TREE Tran Minh Bao, Truong Cong Tuan ABSTRACT – Direct query on objects in object-oriented database is time-consuming Recently there are many studies focusing on resolving the problem by indexing on single class, class hierarchy or nested objects hierarchy In this paper, we propose a new indexing approach by combining the signature files and SD-tree where signature files are organized in a hierarchy to quickly filter irrelevant data and each signature file is stored in a signature SD-tree to speed up signature scanning This technique helps to reduce searching space, hence improves significantly time complexity of query ... trữ tập tin, gọi tập tin chữ ký đối tượng C Chữ ký truy vấn Một truy vấn đối tượng mã hóa thành chữ ký truy vấn theo hàm băm thực đối tượng Khi có truy vấn cần thực hiện, chữ ký đối tượng quét đối. .. Bước Thuộc tính đối tượng băm thành chữ ký nhị phân thuộc tính tạo thành chữ ký đối tượng Bước Các chữ ký đối tượng lớp tạo thành SD- tree Bước Tạo phân cấp tập tin chữ ký tập tin SD- tree Sau có cấu... ký Do đó, chúng tơi đề xuất xây dựng SD- Tree tập tin chữ ký xuất với tư cách nút phân cấp 736 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN PHÂN CẤP TẬP TIN? ?? tập tin chữ ký Kỹ thuật tránh phải tìm kiếm giúp

Ngày đăng: 21/05/2021, 14:07

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w