1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm kiếm từ khóa phổ dụng top-k trên các cơ sở dữ liệu quan hệ

18 275 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 18
Dung lượng 310,98 KB

Nội dung

BÁO CÁO BÀI TẬP LỚN CƠ SỞ DỮ LIỆU [2011] ClickKhoa Hà Nội Master ĐH Bách to edit GV: Nguyễn Thị Kim Anh subtitle style Nhóm 8: • • 5/21/12 Vũ Việt Trung – SHSV: 20092898 Bạch Ngọc Sơn – SHSV: 20092225 Group 11 Universal Top-k Keyword Search over Relational Databases Tìm kiếm từ khóa phổ dụng top-k sở liệu quan hệ 5/21/12 Group 22 KHÁI QT Tìm kiếm theo khóa • Một mơ hình hiệu cho khai phá thơng tin • Đơn giản • Chất lượng kết quả: nội dung & cấu trúc Giải pháp đề xuất cho kết tốt • Cách tiếp cận tổng hợp - lai • Sử dụng đệm • Phân tách truy vấn phức tạp 5/21/12 Group 33 GIỚI THIỆU Hạn chế truy vấn văn hệ quản trị sở liệu nay: • • • • 5/21/12 Chỉ thực lược đồ liệu cụ thể Người dùng cần nắm thống tin lược đồ Người dùng cần biết khả tìm kiếm văn đầy đủ (full-text search) Các truy vấn cấu trúc trở nên phức tạp với yêu cầu thông tin ngày cao Group 44 Quan hệ Cơ - Cháu gái 5/21/12 Group 55 Tìm người tên Joan có cháu gái tên Caroline 5/21/12 Group 66 ĐẶT VẤN ĐỀ • • Chất lượng truy vấn tìm kiếm theo từ khóa đánh giá dựa quan hệ kết từ khóa  hàm tính điểm (scoring function) Sự khác biệt IR System DBMSs o o 5/21/12 Single document Virtual record (Joining tuples) Group 77 Các khái niệm • • Relational database schema Schema graph (SG) đồ thị có hướng biểu thị mối quan hệ o o • Data graph (DG) - đồ thị liệu o o • relation Ri  node si relationship(Ri  Rj)  edge(si, sj) Tuple t  node di Referencing(ti  tj)  edge(ti, tj) Joining tree of tuples (JTT) đồ thị liên thơng phi chu trình DG 5/21/12 Group 88 Joining tree of tuple (JTT) Connection node nút liên kết – kết nối info node Information node nút thông tin – chứa từ khóa cần tìm  Mọi nút JTT nút thông tin 5/21/12 Group 99 Quality of JTT Content quality • cho biết mức độ nút thơng tin khớp với từ khóa • Structural quality đánh giá ngữ nghĩa liên kết thơng tin – tính xác mối quan hệ tương ứng 5/21/12 Group 10 Phân loại giải pháp • Explicit data graph model o o Cụ thể hóa DG Lưu DG nhớ  truy cập trực tiếp liệu, dễ dàng mở rộng tìm kiếm o Structural quality: - o số JTT tổng trọng lượng cạnh  độ kết dính Content quality: Đơn giản khơng hiệu tính tốn phân tán Ø DBXplorer[1], DISCOVER[6], DISCOVER2[5], SPARK[10]… ω1=‘Joan’ ω2=‘Caroli ne’ ω3=‘Kenne dy’ 5/21/12 IR-score JTT-1 bị ảnh hưởng đáng kể họ ‘Kennedy’ xuất lặp lại Group 11 Phân loại giải pháp (tt) • Implicit data graph model o o DG giữ DBMS Chỉ lưu SG nhớ, lấy thông tin cần thiết qua truy vấn SQL  tiết kiệm không gian nhớ, I/O cao o Ø Không bị hạn chế content quality đòi hỏi hàm kết hợp phức tạp BANKS[2], BLINKS[4], Kacholia et al technique [8] Explicit DG Implicit DG Better structural quality Better content quality hybrid approach 5/21/12 Group 12 Định nghĩa vấn đề 5/21/12 Group 13 Định nghĩa vấn đề (tt) • Top-k keyword search result T1, T2, … Tk Xếp hạng kết theo hàm tính điểm score(Ti, Q) 5/21/12 Group 14 Đề xuất ma trận chất lượng cấu trúc 5/21/12 Group 15 Độ kết nối 5/21/12 Group 16 Table 5/21/12 Group 17 Summary • • • 5/21/12 Discuss topics covered Reiterate welcome Wrap-up Group 18 ...Universal Top-k Keyword Search over Relational Databases Tìm kiếm từ khóa phổ dụng top-k sở liệu quan hệ 5/21/12 Group 22 KHÁI QUÁT Tìm kiếm theo khóa • Một mơ hình hiệu cho... vấn tìm kiếm theo từ khóa đánh giá dựa quan hệ kết từ khóa  hàm tính điểm (scoring function) Sự khác biệt IR System DBMSs o o 5/21/12 Single document Virtual record (Joining tuples) Group 77 Các. .. dùng cần biết khả tìm kiếm văn đầy đủ (full-text search) Các truy vấn cấu trúc trở nên phức tạp với yêu cầu thông tin ngày cao Group 44 Quan hệ Cô - Cháu gái 5/21/12 Group 55 Tìm người tên Joan

Ngày đăng: 12/04/2015, 14:21

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w