Tìm kiếm trong cơ sở dữ liệu dựa trên từ khóa

71 261 0
Tìm kiếm trong cơ sở dữ liệu dựa trên từ khóa

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Nguyễn Hoàng Điệp TÌM KIẾM TRONG SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA Chuyên ngành: Công nghệ thông tin LUẬN VĂN THẠC SĨ KHOA HỌC CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Vũ Tuyết Trinh Hà Nội – Năm 2010 Lời cảm ơn Xin chân thành cảm ơn hướng dẫn, bảo tận tình Vũ Tuyết Trinh suốt thời gian thực ñề tài, cảm ơn ñã hướng dẫn tác giả kiến thức kỹ ñể hoàn thành ñược ñề tài, cảm ơn ñã dành thời gian giúp ñỡ em, cảm ơn em ñã học ñược nhiều ñiều từ Xin chân thành cảm ơn Khoa Công Nghệ Thông Tin – Viện ñào tạo sau ñại học Trường ðại Học Bách khoa Hà Nội ñã tạo ñiều kiện thuận lợi ñể hoàn thành luận văn tốt nghiệp Xin chân thành cảm ơn PGS.TS Nguyễn Quang Hoan, KS Lê Thị Thu Hương, CN Trịnh Thị Nhị ñồng nghiệp khác công tác khoa CNTT trường ðại học Sư phạm Kỹ thuật Hưng Yên ñã ủng hộ, giúp ñỡ tạo ñiều kiện giúp ñỡ hoàn thành luận văn Xin cảm ơn anh chị, bạn bè học viên lớp CNTT khóa 2008-2010 ñã ủng hộ, giúp ñỡ ñộng viên thời gian học tập nghiên cứu Cuối xin cảm ơn người thân yêu nhất, người ñộng viên giúp ñỡ mặt hoàn cảnh Hà Nội, ngày 30 tháng 10 năm 2010 Lời cam ñoan Tôi Nguyễn Hoàng ðiệp - học viên lớp cao học CNTT khóa 2008-2010 xin cam ñoan: - Luận văn tốt nghiệp thạc sĩ công trình nghiên cứu thân hướng dẫn TS.Vũ Tuyết Trinh - Các kết luận văn tốt nghiệp thạc sĩ trung thực, chép toàn văn công trình khác Hà Nội, ngày 30 tháng 10 năm 2010 Học viên Nguyễn Hoàng ðiệp MỤC LỤC Chương ðẶT VẤN ðỀ 1.1 Tìm kiếm sở liệu 1.2 Tìm kiếm dựa từ khóa 1.3 Tìm kiếm dựa từ khoá sở liệu quan hệ 1.4 Mục ñích luận văn 1.5 Phương pháp thực bố cục luận văn Chương TỔNG QUAN TÌM KIẾM TRONG SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 2.1 Kiến trúc hệ quản trị sở liệu tìm kiếm dựa từ khóa 2.2 Tổ chức lưu trữ liệu 2.2.1 B-cây 2.2.2 Tệp băm 2.2.3 Tệp mục xếp 10 2.2.4 Chỉ mục theo từ 11 2.3 Quy trình thực truy vấn từ khóa sở liệu 12 Chương XỬ LÝ TRUY VẤN SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 14 3.1 Bài toán truy vấn top-k sở liệu 14 3.1.1 Bài toán truy vấn top-k 14 3.2 Tính ñiểm cho văn 15 3.2.1 Tính ñiểm liệu văn theo mô hình vectơ 15 3.2.2 Tính ñiểm liệu văn dựa vào trọng số 16 3.3 Xếp hạng 17 3.3.1 Hàm xếp hạng 17 3.3.2 Hàm xếp hạng ñơn ñiệu 18 3.3.3 RankSQL 19 3.4 Thuật toán truy vấn top-k 21 3.4.1 Thuật toán vét cạn 21 3.4.2 Thuật toán Fagin 23 3.4.3 Thuật toán cận 26 3.4.4 Thuật toán vị trí tốt 34 3.4.5 ðánh giá thuật toán truy vấn top-k 39 Chương ÁP DỤNG VÀO BÀI TOÁN QUẢN LÝ ðỒ ÁN 40 4.1 Phát biểu toán 40 4.2 Phân tích thiết kế hệ thống 41 4.2.1 Chức hệ thống 41 4.2.2 Thiết kế sở liệu 44 4.3 Môi trường thực nghiệm 46 4.3.1 Xếp hạng SQL server 47 4.4 Kết thực nghiệm 47 4.4.1 Kết thực nghiệm 47 4.4.2 Giao diện ứng dụng 57 KẾT LUẬN 60 Kết ñạt ñược 60 Hướng phát triển 60 TÀI LIỆU THAM KHẢO 61 Chương ðẶT VẤN ðỀ 1.1 ếm sở liệu Tìm kiếm CSDL tìm kiếm dựa vào cấu trúc liệu ñược lưu trữ, 1.2 Tìm kiếm dựa từ khóa Trong cách tiếp cận khác ñể thực tìm kiếm thông tin, người ta dựa vào việc sử dụng từ khóa ñối sánh từ khóa với nội dung thông tin ñể ñưa thông tin mà người dùng quan tâm DANH MỤC CÁC HÌNH Hình 2.1 Kiến trúc hệ quản trị sở liệu Hình 2.2 Minh họa cấu trúc B-cây Hình 2.3 Minh họa cấu trúc tệp băm Hình 2.4 Minh họa cấu trúc tệp mục xếp 11 Hình 2.5 Quy trình thực truy vấn từ khóa sở liệu 12 Hình 4.1 Quá trình tìm kiếm thông tin với từ khóa 43 Hình 4.2 Thiết kế CSDL 44 Hình 4.3 Thiết kế kiểu liệu cho thuộc tính bảng CSDL 45 Hình 4.4 Kiến trúc tìm kiếm full-text SQL server 46 DANH MỤC CÁC BẢNG Bảng 3.1 Dữ liệu ñầu vào cho ví dụ 3.1 20 Bảng 3.2 ðiểm ñánh giá cho ñối tượng 20 Bảng 3.3 Sắp xếp theo chiều giảm dần ñiểm ñánh giá ñối tượng 20 Bảng 3.4 Dữ liệu ñầu vào cho ví dụ 3.2 22 Bảng 3.5 Truy cập (BA) 23 Bảng 3.6 Truy cập vị trí danh sách 24 Bảng 3.7 Dữ liệu lưu nhớ ñệm (bước 1-FA) 25 Bảng 3.8 Truy cập ngẫu nhiên ñể tìm ñiểm thiếu (bước 2-FA) 25 Bảng 3.9 Dữ liệu lưu nhớ ñệm (bước 3-FA) 26 Bảng 3.10 Dữ liệu sau truy cập (lần 1-TA) 27 Bảng 3.11 Truy cập ngẫu nhiên vị trí thiếu (lần 1-TA) 28 Bảng 3.12 Dữ liệu lưu nhớ ñệm sau thực lần 28 Bảng 3.13 Dữ liệu sau truy cập liệu (lặp lần 1-TA) 29 Bảng 3.14 Minh họa truy cập ngẫu nhiên liệu (lặp lần 1-TA) 29 Bảng 3.15 Dữ liệu lưu nhớ ñệm (lặp lần lần 1-TA) 30 Bảng 3.16 Minh họa truy cập ngẫu nhiên liệu (lặp lần 2-TA) 30 Bảng 3.17 Dữ liệu lưu nhớ ñệm (lặp lần lần 2-TA) 31 Bảng 3.18 Minh họa truy cập liệu (lặp lần 3-TA) 31 Bảng 3.19 Dữ liệu lưu nhớ ñệm (lặp lần lần 3-TA) 32 Bảng 3.20 Minh họa truy cập liệu (lặp lần 4-TA) 32 Bảng 3.21 Dữ liệu lưu nhớ ñệm (lặp lần lần 4-TA) 33 Bảng 3.22 Minh họa truy cập liệu (lặp lần 5-TA) 33 Bảng 3.23 Dữ liệu lưu nhớ ñệm (lặp lần lần 5-TA) 34 Bảng 3.24 Dữ liệu lưu nhớ ñệm (lần 1-BPA) 36 Bảng 3.25 Dữ liệu lưu nhớ ñệm (lặp lần BPA) 37 Bảng 3.26 Dữ liệu lưu nhớ ñệm (lặp lần BPA) 38 Bảng 4.1 Dữ liệu bảng DETAI 47 Bảng 4.1.1 Kết truy vấn xác từ “tìm kiếm” cột TENDT 48 Bảng 4.1.2 Kết truy vấn từ “tìm kiếm” với like cột TENDT 48 Bảng 4.1.3 Kết truy vấn từ “tìm kiếm” cột TENDT 49 Bảng 4.1.4 Kết truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT 50 Bảng 4.1.5 Kết truy vấn từ ‘tìm’ ‘kiếm’ xếp cột TENDT 51 Bảng 4.1.6 Top-10 ghi cho truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT 52 Bảng 4.2.1 Kết truy vấn từ ‘tìm quản’ với like bảng DETAI 53 Bảng 4.2.2 Kết truy vấn từ “tìm” “quản” bảng DETAI 54 Bảng 4.2.3 Kết truy vấn từ “tìm” “quản” xếp bảng DETAI 55 Bảng 4.3 Thiết kế giao diện 57 Bảng 4.3.1 Thiết kế form ñề tài 57 Bảng 4.3.2 Thiết kế form giáo viên hướng dẫn 58 Bảng 4.3.3 Thiết kế form sinh viên thực 58 Bảng 4.3.4 Thiết kế form ngành-chuyên ngành 59 DANH MỤC CÁC KÝ HIỆU VIẾT TẮT Từ viết tắt Viết ñầy ñủ Ý nghĩa BA Basic Algorithm Thuật toán vét cạn BPA Best Position Algorithm Thuật toán vị trí tốt CSDL sở liệu CNTT Công nghệ thông tin CNPM Công nghệ Phần Mềm DATN ðồ án tốt nghiệp DB DataBase ðSQH ðại số quan hệ FA Fagin’s Algorithm GV Giáo viên GVHD Giáo viên hướng dẫn IR Information retrieval KF Keyword Frequency KW Keyword Weight Trọng số từ khóa KWBS KeyWord Based Search Tìm kiếm dựa từ khóa RKW Relative Keywords Weight Trọng số từ khóa liên quan SQL Structured Query Language SV Sinh viên TA Threshold Algorithm sở liệu Thuật toán Fagin Hệ thống tìm kiếm thông tin Tần xuất từ khóa, số lần từ khóa ñơn xuất văn Thuật toán cận Chương 1 ðẶT VẤN ðỀ Dữ liệu ñược lưu trữ ngày nhiều, sử dụng lại thông tin ñã nhu cầu tất yếu Do ñó, tìm kiếm thông tin ngày trở nên quan trọng ñời sống nói chung ứng dụng nói riêng Trong hệ thống thông tin, kết tìm kiếm ñược trả cho người dùng, nên việc xác ñịnh kết truy vấn ñể ñảm bảo thông tin ý nghĩa ñiều quan trọng nhiều cách thức ñể thực tìm kiếm thông tin, ta phân biệt hai hướng tiếp cận ñể thực tìm kiếm tìm kiếm dựa cấu trúc liệu sở liệu (CSDL) tìm kiếm nội dung liệu dựa từ khóa văn bản, tài liệu, liệu web, liệu cấu trúc 1.1 Tìm kiếm sở liệu Tìm kiếm CSDL tìm kiếm dựa vào cấu trúc liệu ñược lưu trữ, ñó sử dụng ngôn ngữ truy vấn Kết tìm kiếm ñầy ñủ xác Tất liệu thỏa mãn ñiều kiện tìm kiếm ñều ñược trả cho người dùng Trong CSDL lớn, với câu truy vấn chứa ñiều kiện tìm kiếm ñược kết trả lại nhiều nhiều liệu thỏa mãn ñiều kiện tìm kiếm (xem ví dụ 4.2.2) Ngược lại, với câu truy vấn chứa nhiều ñiều kiện tìm kiếm, số ghi thỏa mãn tất ñiều kiện tìm kiếm ít, chí ghi ñược trả (truy vấn rỗng) (xem ví dụ 4.1.1, ví dụ 4.2.1) Trong hai tình trên, người dùng ñều gặp khó khăn việc xử lý kết tìm kiếm Khi kết rỗng (không kết nào), hệ thống không cung cấp thông tin cho người dùng Khi kết nhiều, người dùng khó xem tất kết khó biết ñược thông tin quan trọng hơn, thông tin quan trọngdụ 4.1: Giả sử muốn tìm ñồ án tốt nghiệp nội dung liên quan tới “tìm kiếm” Thực cột TENDT bảng DETAI Ví dụ 4.1.1 Tìm kiếm xác với câu truy vấn sau: select * from DETAI WHERE TENDT = N'tìm kiếm' Bảng 4.1.1 Kết truy vấn xác từ “tìm kiếm” cột TENDT Nhận xét: Truy vấn tìm kiếm truy vấn rỗng yêu cầu tìm kiếm xác ghi thỏa mãn yêu cầu (bảng 4.1.1) Ví dụ 4.1.2 Tìm kiếm gần ñúng với câu truy vấn like sau: select MADT,TENDT from DETAI WHERE TENDT LIKE N'%tìm%kiếm%' Bảng 4.1.2 Kết truy vấn từ “tìm kiếm” với like cột TENDT Kết trả 291 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, ñó từ “tìm” phải ñứng trước từ “kiếm”, ghi không xếp theo thứ tự 48 Ví dụ 4.1.3 Tìm kiếm gần ñúng theo từ với contains sau: DECLARE @kws nvarchar(30) SET @kws =N'"TÌM KIẾM"' select MADT,TENDT FROM DETAI WHERE contains(TENDT, @kws) Bảng 4.1.3 Kết truy vấn từ “tìm kiếm” cột TENDT Kết trả 291 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, ghi không xếp theo thứ tự 49 Ví dụ 4.1.4 Tìm kiếm gần ñúng với từ khóa ‘tìm kiếm’ sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select MADT,TENDT FROM DETAI WHERE FREETEXT(TENDT, @kws) Bảng 4.1.4 Kết truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT Kết trả 322 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, ghi không xếp theo thứ tự 50 Ví dụ 4.1.5 Tìm kiếm gần ñúng từ ‘tìm’ ‘kiếm’, ñó ghi ñược xếp theo chiều giảm dần mức ñộ liên quan ghi với từ khóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select MADT, TENDT, RANK from DETAI as DT inner join freetexttable(DETAI, TENDT, @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.1.5 Kết truy vấn từ ‘tìm’ ‘kiếm’ xếp cột TENDT … Kết trả 322 ghi, ñó xếp theo chiều giảm dần mức ñộ liên quan ghi với từ khóa truy vấn 51 Ví dụ 4.1.6 Tìm kiếm gần ñúng từ ‘tìm’ ‘kiếm’, ñó chọn 10 ghi liên quan với từ khóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select top 10 MADT, TENDT,RANK from DETAI as DT inner join freetexttable(DETAI, TENDT, @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.1.6 Top-10 ghi cho truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT Các ghi trả theo thứ tự tương ứng với mức ñộ liên quan ñã tốt với người dùng Tuy nhiên với số lượng vừa ñủ ghi tốt trả ý nghĩa Mười ghi ñiểm ñánh giá tương ứng mức ñộ liên quan nhiều tới từ khóa truy vấn ñược trả (bảng 4.1.6) 52 Ví dụ 4.2: Giả sử muốn tìm ñồ án tốt nghiệp nội dung liên quan tới ‘tìm quản’ Thực tìm kiếm cột TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK bảng DETAI Ví dụ 4.2.1 Tìm kiếm gần ñúng với câu truy vấn like sau: select * from DETAI WHERE TENDT = N'%tìm quản%' or TOMTAT LIKE N'%tìm quản%' or TUKHOA LIKE N'%tìm quản%' or MUCLUC LIKE N'%tìm quản%' or TLTK LIKE N'%tìm quản%' Bảng 4.2.1 Kết truy vấn từ ‘tìm quản’ với like bảng DETAI Nếu truy vấn tìm kiếm xác chắn truy vấn truy vấn rỗng Ngay trường hợp truy vấn tìm kiếm gần ñúng với like kết ñược trả 53 Ví dụ 4.2.2 Tìm kiếm gần ñúng từ “tìm” “quản” sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), @kws) as K on DT.MADT = K.[KEY] Bảng 4.2.2 Kết truy vấn từ “tìm” “quản” bảng DETAI Tất 984 ghi bảng DETAI thỏa mãn truy vấn chứa từ “tìm” từ ‘quản’ ñều ñược trả về, ghi thứ tự gây khó khăn cho người dùng việc khai thác kết 54 Ví dụ 4.2.3 Tìm kiếm gần ñúng từ “tìm” “quản”, ñó hạn chế số ghi liên quan với từ khóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.2.3 Kết truy vấn từ “tìm” “quản” xếp bảng DETAI … Số lượng kết giống bảng 4.2.2, khác 984 ghi ñược theo thứ tự mức liên quan tới từ khóa truy vấn 55 Ví dụ 4.2.4 Tìm kiếm gần ñúng từ “tìm” “quản”, ñó hạn chế số ghi liên quan với từ khóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select top 50 MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), 'tìm quản') as K on DT.MADT = K.[KEY] order by RANK desc Kết trả truy vấn 50 ghi ñiểm ñánh giá cao tương ứng 50 ghi liên quan nhiều với từ khóa truy vấn (xem bảng 4.2.3) Dữ liệu không nhiều thấy chênh lệch số lượng kết trả tương ứng với tìm kiếm xác tìm kiếm gần ñúng, truy vấn rỗng 322 kết (ví dụ 4.1), kết 984 kết (ví dụ 4.2) Số lượng 322 kết (bảng 4.1.5) nhiều, song làm người dùng phải băn khoăn nên dùng kết nào, kết tốt Số lượng 984 kết (bảng 4.1.6) số thực không nhỏ, kết tìm kiếm ñược theo thứ tự giảm dần ñiểm ñánh giá, phần giúp việc xử lý kết trở nên dễ dàng cho người dung Nói cách khác, với việc tích hợp kỹ thuật xếp hạng tìm kiếm CSDL giúp kết “ý nghĩa” với người dùng 56 4.4.2 Giao diện ứng dụng Bảng 4.3 Thiết kế giao diện Bảng 4.3.1 Thiết kế form ñề tài 57 Bảng 4.3.2 Thiết kế form giáo viên hướng dẫn Bảng 4.3.3 Thiết kế form sinh viên thực 58 Bảng 4.3.4 Thiết kế form ngành-chuyên ngành 59 KẾT LUẬN Sau thời gian nghiên cứu tiến hành thực học viên ñã hoàn thành ñược yêu cầu ñề tài: “tìm kiếm sở liệu dựa vào từ khóa” Kết ñạt ñược Luận văn ñã trình bày ñược phương pháp tìm kiếm dựa cấu trúc CSDL, ñưa ñược tình kết không mong ñợi Bên cạnh ñó luận văn trình bày ñược tìm kiếm dựa từ khóa hệ thống thông tin Trình bày ñược tìm kiếm dựa từ khóa hệ thống thông tin kỹ thuật xếp hạng kỹ thuật tìm kiếm gần ñúng Từ ñó, áp dụng kỹ thuật vào tìm kiếm CSDL Luận văn trình bày ñược chi tiết số thuật toán xử lý truy vấn top-k Cuối cùng, ñề xuất việc tích hợp tìm kiếm dựa từ khóa hệ thống quản lý ñồ án tốt nghiệp Hướng phát triển Về lý thuyết: ðề xuất phương pháp xử lý truy vấn tốt áp dụng ñể ứng dụng tìm kiếm CSDL Về ứng dụng: Phát triển mô ứng dụng, tích hợp chức quản lý ñồ án tốt nghiệp website trường ðại Học Sư Phạm Kỹ Thuật Hưng Yên 60 TÀI LIỆU THAM KHẢO Bei Yu, Guoliang Li, Karen Sollins, Anthony K.H.Tung, (2007), “Effective Keyword Based Selection of Relational Databases", ACM SIGMOD, pp.139150 Chengkai Li, K.Chen Chuan Chang, Ihab F.Ilyas, Sumin Song, (2005), “RankSQL: Query Algebra and Optimization for Relational Top-K Queries”, In SIGMOD, pp 131-142 ðinh Mạnh Tường, “Giáo trình cấu trúc liệu giải thuật-thuật toán”, daihoc.com.vn Eyas El Qawasmeh, Ossama Abueid, Abdallah Alashqur, (2010), “A framework for Processing Keyword-Based Queries in Relational Databases”, Journal of Theoretical and Applied Information Technology, pp 149-163 Fang Liu, Clement Yu, Weiyi Meng, Abdur Chowdhury, (2006), "Effective Keyword Search in Relational Databases", ACM SIGMOD, pp 563-574 Hamilton J, Nayak T, (2001), “Microsoft SQL Server Fulltext Search”, IEEE Data Engineering Bulletin, pp 7-10 Ihab F Ilyas, George Beskales, Mohamed A Soliman, (2008), “A Survey of Topk Query Processing Techniques in Relational Database Systems”, ACM Computing Surveys, pp 11-58 Ilioiu Florin, Daniel Rocacher, Ludovic Liétard, (2006), “Study of Preference Driven Database Query Systems” Nicolas Bruno and Hui (Wendy) Wang, (2007), “The Threshold Algorithm: From Middleware Systems to the Relational Engine”, IEEE transactions on knowledge and data engineering, pp 523-537 10 Reza Akbarinia, Esther Pacitti, Patrick Valduriez, Atlas Team, INRIA and LINA, Nates, (2007), “Best Position Algorithms for Top-k Queries”, pp 495-506 11 R Fagin, (1999), “Combining fuzzy information from multiple systems”, J Comput System Sci, Journal of Computer and System Sciences, pp 83-99 61 12 R Fagin, A Lotem and M Naor, (2003), “Optimal aggregation algorithms for middleware”, Journal of Computer and System Sciences, pp 614–656 13 Sanjay Agrawal, Surajit Chaudhuri, and Gautam Das, (2002), "DBXplorer: A system for Keyword-Based Search Over Relational Databases", ICDE, pp 5–16 14 Sanjay Agrawal, Surajit Chaudhuri, Gautam Das, and Aristides Gionis, (2003), “Automated ranking of Database Query Results”, in Proceedings of the 2003 CIDR Conference (CIDR) 15 Shan Wang and Kun-Long Zhang, (2005), “Searching Databases with Keywords”, J Comp Sci & Tech 16 Surajit Chaudhuri, Nicolas Bruno, Luis Gravano, (2002), “Top-k Selection Queries over Relational Databases: Mapping Strategies and Performance Evaluation”, ACM Transactions on Database Systems, pp 1-33 17 Surajit Chaudhuri, Gautam Das, (2009), “Keyword Querying and Ranking in Databases”, VLDB, pp.1658-1659 18 Surajit Chaudhuri, Gautam Das, “Keyword Querying and Ranking in Databases”, VLDB, pp 24-28 19 Vagelis Hristidis, Luis Gravano, and Yannis Papakonstantinou, (2003), "Efficient IR-Style Keyword Search Over Relational Databases", VLDB, pp 850-861 20 Vagelis Hristidis, Oscar Valdivia, Michail Vlachos, Philip S Yu, (2007), “A System for Keyword Search on Textual Streams”, SIAM, pp 503-508 21 Vũ Tuyết Trinh, “Bài giảng hệ quản trị sở liệu”, http://is.hut.edu.vn/~trinhvt/courses/ 22 “Thiết kế CSDL làm việc với CSDL SQL Server”, ðại học SPKT Hưng Yên 23 Xu Yu, Lu Qin, Lijun Chang, (2009), “Keyword Search in Databases: The Power of RDBMS”, SIGMOD Conference, pp 681-694 24 Wei Wang, (2007), “Keyword Search in Databases”, Talk 25 http://msdn.microsoft.com/en-us/library/ 26 justinking@ssw.com.au 27 www.ssw.com.au 62 ... tìm kiếm tìm kiếm dựa cấu trúc liệu sở liệu (CSDL) tìm kiếm nội dung liệu dựa từ khóa văn bản, tài liệu, liệu web, liệu cấu trúc 1.1 Tìm kiếm sở liệu Tìm kiếm CSDL tìm kiếm dựa vào cấu trúc liệu. .. Chương 2 TỔNG QUAN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 2.1 Kiến trúc hệ quản trị sở liệu tìm kiếm dựa từ khóa Sử dụng triệt ñể hệ quản trị CSDL ñã có cách biến ñổi từ khóa truy vấn ñầu... văn Chương TỔNG QUAN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 2.1 Kiến trúc hệ quản trị sở liệu tìm kiếm dựa từ khóa 2.2 Tổ chức lưu trữ liệu 2.2.1 B-cây

Ngày đăng: 27/07/2017, 20:33

Từ khóa liên quan

Mục lục

  • TRANG BÌA

  • LỜI CẢM ƠN

  • LỜI CAM ĐOAN

  • MỤC LỤC

  • DANH MỤC CÁC HÌNH

  • DANH MỤC CÁC BẢNG

  • DANH MỤC CÁC KÝ HIỆU VIẾT TẮT

  • CHƯƠNG 1

  • CHƯƠNG 2

  • CHƯƠNG 3

  • CHƯƠNG 4

  • KÊT LUAN

  • TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan