Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 18 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
18
Dung lượng
310,98 KB
Nội dung
BÁO CÁO BÀI TẬP LỚN CƠ SỞ DỮ LIỆU [2011] ClickKhoa Hà Nội Master ĐH Bách to edit GV: Nguyễn Thị Kim Anh subtitle style Nhóm 8: • • 5/21/12 Vũ Việt Trung – SHSV: 20092898 Bạch Ngọc Sơn – SHSV: 20092225 Group 11 Universal Top-k Keyword Search over Relational Databases Tìm kiếm từ khóa phổ dụng top-k sở liệu quan hệ 5/21/12 Group 22 KHÁI QT Tìm kiếm theo khóa • Một mơ hình hiệu cho khai phá thơng tin • Đơn giản • Chất lượng kết quả: nội dung & cấu trúc Giải pháp đề xuất cho kết tốt • Cách tiếp cận tổng hợp - lai • Sử dụng đệm • Phân tách truy vấn phức tạp 5/21/12 Group 33 GIỚI THIỆU Hạn chế truy vấn văn hệ quản trị sở liệu nay: • • • • 5/21/12 Chỉ thực lược đồ liệu cụ thể Người dùng cần nắm thống tin lược đồ Người dùng cần biết khả tìm kiếm văn đầy đủ (full-text search) Các truy vấn cấu trúc trở nên phức tạp với yêu cầu thông tin ngày cao Group 44 Quan hệ Cơ - Cháu gái 5/21/12 Group 55 Tìm người tên Joan có cháu gái tên Caroline 5/21/12 Group 66 ĐẶT VẤN ĐỀ • • Chất lượng truy vấn tìm kiếm theo từ khóa đánh giá dựa quan hệ kết từ khóa hàm tính điểm (scoring function) Sự khác biệt IR System DBMSs o o 5/21/12 Single document Virtual record (Joining tuples) Group 77 Các khái niệm • • Relational database schema Schema graph (SG) đồ thị có hướng biểu thị mối quan hệ o o • Data graph (DG) - đồ thị liệu o o • relation Ri node si relationship(Ri Rj) edge(si, sj) Tuple t node di Referencing(ti tj) edge(ti, tj) Joining tree of tuples (JTT) đồ thị liên thơng phi chu trình DG 5/21/12 Group 88 Joining tree of tuple (JTT) Connection node nút liên kết – kết nối info node Information node nút thông tin – chứa từ khóa cần tìm Mọi nút JTT nút thông tin 5/21/12 Group 99 Quality of JTT Content quality • cho biết mức độ nút thơng tin khớp với từ khóa • Structural quality đánh giá ngữ nghĩa liên kết thơng tin – tính xác mối quan hệ tương ứng 5/21/12 Group 10 Phân loại giải pháp • Explicit data graph model o o Cụ thể hóa DG Lưu DG nhớ truy cập trực tiếp liệu, dễ dàng mở rộng tìm kiếm o Structural quality: - o số JTT tổng trọng lượng cạnh độ kết dính Content quality: Đơn giản khơng hiệu tính tốn phân tán Ø DBXplorer[1], DISCOVER[6], DISCOVER2[5], SPARK[10]… ω1=‘Joan’ ω2=‘Caroli ne’ ω3=‘Kenne dy’ 5/21/12 IR-score JTT-1 bị ảnh hưởng đáng kể họ ‘Kennedy’ xuất lặp lại Group 11 Phân loại giải pháp (tt) • Implicit data graph model o o DG giữ DBMS Chỉ lưu SG nhớ, lấy thông tin cần thiết qua truy vấn SQL tiết kiệm không gian nhớ, I/O cao o Ø Không bị hạn chế content quality đòi hỏi hàm kết hợp phức tạp BANKS[2], BLINKS[4], Kacholia et al technique [8] Explicit DG Implicit DG Better structural quality Better content quality hybrid approach 5/21/12 Group 12 Định nghĩa vấn đề 5/21/12 Group 13 Định nghĩa vấn đề (tt) • Top-k keyword search result T1, T2, … Tk Xếp hạng kết theo hàm tính điểm score(Ti, Q) 5/21/12 Group 14 Đề xuất ma trận chất lượng cấu trúc 5/21/12 Group 15 Độ kết nối 5/21/12 Group 16 Table 5/21/12 Group 17 Summary • • • 5/21/12 Discuss topics covered Reiterate welcome Wrap-up Group 18 ...Universal Top-k Keyword Search over Relational Databases Tìm kiếm từ khóa phổ dụng top-k sở liệu quan hệ 5/21/12 Group 22 KHÁI QUÁT Tìm kiếm theo khóa • Một mơ hình hiệu cho... vấn tìm kiếm theo từ khóa đánh giá dựa quan hệ kết từ khóa hàm tính điểm (scoring function) Sự khác biệt IR System DBMSs o o 5/21/12 Single document Virtual record (Joining tuples) Group 77 Các. .. dùng cần biết khả tìm kiếm văn đầy đủ (full-text search) Các truy vấn cấu trúc trở nên phức tạp với yêu cầu thông tin ngày cao Group 44 Quan hệ Cô - Cháu gái 5/21/12 Group 55 Tìm người tên Joan