Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,59 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Nguyễn Hồng Điệp TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHĨA Chun ngành: Cơng nghệ thơng tin LUẬN VĂN THẠC SĨ KHOA HỌC CƠNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Vũ Tuyết Trinh Hà Nội – Năm 2010 Lời cảm ơn Xin chân thành cảm ơn hướng dẫn, bảo tận tình Vũ Tuyết Trinh suốt thời gian thực đề tài, cảm ơn hướng dẫn tác giả kiến thức kỹ để hồn thành đề tài, cảm ơn ln dành thời gian giúp đỡ em, cảm ơn em học nhiều điều từ Xin chân thành cảm ơn Khoa Cơng Nghệ Thơng Tin – Viện đào tạo sau đại học Trường ðại Học Bách khoa Hà Nội ñã tạo ñiều kiện thuận lợi ñể hoàn thành luận văn tốt nghiệp Xin chân thành cảm ơn PGS.TS Nguyễn Quang Hoan, KS Lê Thị Thu Hương, CN Trịnh Thị Nhị đồng nghiệp khác cơng tác khoa CNTT trường ðại học Sư phạm Kỹ thuật Hưng Yên ñã ủng hộ, giúp ñỡ tạo ñiều kiện giúp ñỡ tơi hồn thành luận văn Xin cảm ơn anh chị, bạn bè học viên lớp CNTT khóa 2008-2010 ủng hộ, giúp ñỡ ñộng viên thời gian học tập nghiên cứu Cuối xin cảm ơn người thân u nhất, người ln động viên giúp đỡ mặt hồn cảnh Hà Nội, ngày 30 tháng 10 năm 2010 Lời cam đoan Tơi Nguyễn Hoàng ðiệp - học viên lớp cao học CNTT khóa 2008-2010 xin cam đoan: - Luận văn tốt nghiệp thạc sĩ cơng trình nghiên cứu thân hướng dẫn TS.Vũ Tuyết Trinh - Các kết luận văn tốt nghiệp thạc sĩ trung thực, khơng phải chép tồn văn cơng trình khác Hà Nội, ngày 30 tháng 10 năm 2010 Học viên Nguyễn Hoàng ðiệp MỤC LỤC Chương ðẶT VẤN ðỀ 1.1 Tìm kiếm sở liệu 1.2 Tìm kiếm dựa từ khóa 1.3 Tìm kiếm dựa từ khoá sở liệu quan hệ 1.4 Mục đích luận văn 1.5 Phương pháp thực bố cục luận văn Chương TỔNG QUAN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 2.1 Kiến trúc hệ quản trị sở liệu tìm kiếm dựa từ khóa 2.2 Tổ chức lưu trữ liệu 2.2.1 B-cây 2.2.2 Tệp băm 2.2.3 Tệp mục có xếp 10 2.2.4 Chỉ mục theo từ 11 2.3 Quy trình thực truy vấn từ khóa sở liệu 12 Chương XỬ LÝ TRUY VẤN CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 14 3.1 Bài toán truy vấn top-k sở liệu 14 3.1.1 Bài toán truy vấn top-k 14 3.2 Tính điểm cho văn 15 3.2.1 Tính điểm liệu văn theo mơ hình vectơ 15 3.2.2 Tính ñiểm liệu văn dựa vào trọng số 16 3.3 Xếp hạng 17 3.3.1 Hàm xếp hạng 17 3.3.2 Hàm xếp hạng ñơn ñiệu 18 3.3.3 RankSQL 19 3.4 Thuật toán truy vấn top-k 21 3.4.1 Thuật toán vét cạn 21 3.4.2 Thuật toán Fagin 23 3.4.3 Thuật toán cận 26 3.4.4 Thuật tốn vị trí tốt 34 3.4.5 ðánh giá thuật toán truy vấn top-k 39 Chương ÁP DỤNG VÀO BÀI TOÁN QUẢN LÝ ðỒ ÁN 40 4.1 Phát biểu toán 40 4.2 Phân tích thiết kế hệ thống 41 4.2.1 Chức hệ thống 41 4.2.2 Thiết kế sở liệu 44 4.3 Môi trường thực nghiệm 46 4.3.1 Xếp hạng SQL server 47 4.4 Kết thực nghiệm 47 4.4.1 Kết thực nghiệm 47 4.4.2 Giao diện ứng dụng 57 KẾT LUẬN 60 Kết ñạt ñược 60 Hướng phát triển 60 TÀI LIỆU THAM KHẢO 61 Chương ðẶT VẤN ðỀ 1.1 ếm sở liệu Tìm kiếm CSDL tìm kiếm dựa vào cấu trúc liệu lưu trữ, 1.2 Tìm kiếm dựa từ khóa Trong cách tiếp cận khác để thực tìm kiếm thơng tin, người ta dựa vào việc sử dụng từ khóa đối sánh từ khóa với nội dung thơng tin để đưa thơng tin mà người dùng quan tâm DANH MỤC CÁC HÌNH Hình 2.1 Kiến trúc hệ quản trị sở liệu Hình 2.2 Minh họa cấu trúc B-cây Hình 2.3 Minh họa cấu trúc tệp băm Hình 2.4 Minh họa cấu trúc tệp mục có xếp 11 Hình 2.5 Quy trình thực truy vấn từ khóa sở liệu 12 Hình 4.1 Quá trình tìm kiếm thơng tin với từ khóa 43 Hình 4.2 Thiết kế CSDL 44 Hình 4.3 Thiết kế kiểu liệu cho thuộc tính bảng CSDL 45 Hình 4.4 Kiến trúc tìm kiếm full-text SQL server 46 DANH MỤC CÁC BẢNG Bảng 3.1 Dữ liệu đầu vào cho ví dụ 3.1 20 Bảng 3.2 ðiểm ñánh giá cho ñối tượng 20 Bảng 3.3 Sắp xếp theo chiều giảm dần ñiểm ñánh giá ñối tượng 20 Bảng 3.4 Dữ liệu đầu vào cho ví dụ 3.2 22 Bảng 3.5 Truy cập (BA) 23 Bảng 3.6 Truy cập vị trí danh sách 24 Bảng 3.7 Dữ liệu lưu nhớ ñệm (bước 1-FA) 25 Bảng 3.8 Truy cập ngẫu nhiên để tìm điểm cịn thiếu (bước 2-FA) 25 Bảng 3.9 Dữ liệu lưu nhớ ñệm (bước 3-FA) 26 Bảng 3.10 Dữ liệu sau truy cập (lần 1-TA) 27 Bảng 3.11 Truy cập ngẫu nhiên vị trí cịn thiếu (lần 1-TA) 28 Bảng 3.12 Dữ liệu lưu nhớ ñệm sau thực lần 28 Bảng 3.13 Dữ liệu sau truy cập liệu (lặp lần 1-TA) 29 Bảng 3.14 Minh họa truy cập ngẫu nhiên liệu (lặp lần 1-TA) 29 Bảng 3.15 Dữ liệu lưu nhớ ñệm (lặp lần lần 1-TA) 30 Bảng 3.16 Minh họa truy cập ngẫu nhiên liệu (lặp lần 2-TA) 30 Bảng 3.17 Dữ liệu lưu nhớ ñệm (lặp lần lần 2-TA) 31 Bảng 3.18 Minh họa truy cập liệu (lặp lần 3-TA) 31 Bảng 3.19 Dữ liệu lưu nhớ ñệm (lặp lần lần 3-TA) 32 Bảng 3.20 Minh họa truy cập liệu (lặp lần 4-TA) 32 Bảng 3.21 Dữ liệu lưu nhớ ñệm (lặp lần lần 4-TA) 33 Bảng 3.22 Minh họa truy cập liệu (lặp lần 5-TA) 33 Bảng 3.23 Dữ liệu lưu nhớ ñệm (lặp lần lần 5-TA) 34 Bảng 3.24 Dữ liệu lưu nhớ ñệm (lần 1-BPA) 36 Bảng 3.25 Dữ liệu lưu nhớ ñệm (lặp lần BPA) 37 Bảng 3.26 Dữ liệu lưu nhớ ñệm (lặp lần BPA) 38 Bảng 4.1 Dữ liệu bảng DETAI 47 Bảng 4.1.1 Kết truy vấn xác từ “tìm kiếm” cột TENDT 48 Bảng 4.1.2 Kết truy vấn từ “tìm kiếm” với like cột TENDT 48 Bảng 4.1.3 Kết truy vấn từ “tìm kiếm” cột TENDT 49 Bảng 4.1.4 Kết truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT 50 Bảng 4.1.5 Kết truy vấn từ ‘tìm’ ‘kiếm’ có xếp cột TENDT 51 Bảng 4.1.6 Top-10 ghi cho truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT 52 Bảng 4.2.1 Kết truy vấn từ ‘tìm quản’ với like bảng DETAI 53 Bảng 4.2.2 Kết truy vấn từ “tìm” “quản” bảng DETAI 54 Bảng 4.2.3 Kết truy vấn từ “tìm” “quản” có xếp bảng DETAI 55 Bảng 4.3 Thiết kế giao diện 57 Bảng 4.3.1 Thiết kế form ñề tài 57 Bảng 4.3.2 Thiết kế form giáo viên hướng dẫn 58 Bảng 4.3.3 Thiết kế form sinh viên thực 58 Bảng 4.3.4 Thiết kế form ngành-chuyên ngành 59 DANH MỤC CÁC KÝ HIỆU VIẾT TẮT Từ viết tắt Viết ñầy ñủ Ý nghĩa BA Basic Algorithm Thuật toán vét cạn BPA Best Position Algorithm Thuật toán vị trí tốt CSDL Cơ sở liệu CNTT Cơng nghệ thông tin CNPM Công nghệ Phần Mềm DATN ðồ án tốt nghiệp DB DataBase ðSQH ðại số quan hệ FA Fagin’s Algorithm GV Giáo viên GVHD Giáo viên hướng dẫn IR Information retrieval KF Keyword Frequency KW Keyword Weight Trọng số từ khóa KWBS KeyWord Based Search Tìm kiếm dựa từ khóa RKW Relative Keywords Weight Trọng số từ khóa liên quan SQL Structured Query Language SV Sinh viên TA Threshold Algorithm Cơ sở liệu Thuật toán Fagin Hệ thống tìm kiếm thơng tin Tần xuất từ khóa, số lần từ khóa đơn xuất văn Thuật toán cận Chương 1 ðẶT VẤN ðỀ Dữ liệu ñược lưu trữ ngày nhiều, sử dụng lại thơng tin có nhu cầu tất yếu Do đó, tìm kiếm thơng tin ngày trở nên quan trọng ñời sống nói chung ứng dụng nói riêng Trong hệ thống thơng tin, kết tìm kiếm trả cho người dùng, nên việc xác ñịnh kết truy vấn để đảm bảo thơng tin có ý nghĩa điều quan trọng Có nhiều cách thức để thực tìm kiếm thơng tin, ta phân biệt hai hướng tiếp cận để thực tìm kiếm tìm kiếm dựa cấu trúc liệu sở liệu (CSDL) tìm kiếm nội dung liệu dựa từ khóa văn bản, tài liệu, liệu web, liệu khơng có cấu trúc 1.1 Tìm kiếm sở liệu Tìm kiếm CSDL tìm kiếm dựa vào cấu trúc liệu lưu trữ, sử dụng ngơn ngữ truy vấn Kết tìm kiếm đầy đủ xác Tất liệu thỏa mãn ñiều kiện tìm kiếm trả cho người dùng Trong CSDL lớn, với câu truy vấn chứa ñiều kiện tìm kiếm ñược kết trả lại nhiều nhiều liệu thỏa mãn điều kiện tìm kiếm (xem ví dụ 4.2.2) Ngược lại, với câu truy vấn chứa nhiều điều kiện tìm kiếm, số ghi thỏa mãn tất điều kiện tìm kiếm ít, chí khơng có ghi trả (truy vấn rỗng) (xem ví dụ 4.1.1, ví dụ 4.2.1) Trong hai tình trên, người dùng gặp khó khăn việc xử lý kết tìm kiếm Khi kết rỗng (khơng có kết nào), hệ thống không cung cấp thông tin cho người dùng Khi kết nhiều, người dùng khó xem tất kết khó biết thơng tin quan trọng hơn, thơng tin quan trọng Ví dụ 4.1: Giả sử muốn tìm đồ án tốt nghiệp có nội dung liên quan tới “tìm kiếm” Thực cột TENDT bảng DETAI Ví dụ 4.1.1 Tìm kiếm xác với câu truy vấn sau: select * from DETAI WHERE TENDT = N'tìm kiếm' Bảng 4.1.1 Kết truy vấn xác từ “tìm kiếm” cột TENDT Nhận xét: Truy vấn tìm kiếm truy vấn rỗng u cầu tìm kiếm xác khơng có ghi thỏa mãn u cầu (bảng 4.1.1) Ví dụ 4.1.2 Tìm kiếm gần với câu truy vấn like sau: select MADT,TENDT from DETAI WHERE TENDT LIKE N'%tìm%kiếm%' Bảng 4.1.2 Kết truy vấn từ “tìm kiếm” với like cột TENDT Kết trả 291 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, từ “tìm” phải đứng trước từ “kiếm”, ghi không xếp theo thứ tự 48 Ví dụ 4.1.3 Tìm kiếm gần theo từ với contains sau: DECLARE @kws nvarchar(30) SET @kws =N'"TÌM KIẾM"' select MADT,TENDT FROM DETAI WHERE contains(TENDT, @kws) Bảng 4.1.3 Kết truy vấn từ “tìm kiếm” cột TENDT Kết trả 291 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, ghi không xếp theo thứ tự 49 Ví dụ 4.1.4 Tìm kiếm gần với từ khóa ‘tìm kiếm’ sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select MADT,TENDT FROM DETAI WHERE FREETEXT(TENDT, @kws) Bảng 4.1.4 Kết truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT Kết trả 322 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, ghi khơng xếp theo thứ tự 50 Ví dụ 4.1.5 Tìm kiếm gần từ ‘tìm’ ‘kiếm’, ghi xếp theo chiều giảm dần mức ñộ liên quan ghi với từ khóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select MADT, TENDT, RANK from DETAI as DT inner join freetexttable(DETAI, TENDT, @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.1.5 Kết truy vấn từ ‘tìm’ ‘kiếm’ có xếp cột TENDT … Kết trả 322 ghi, xếp theo chiều giảm dần mức ñộ liên quan ghi với từ khóa truy vấn 51 Ví dụ 4.1.6 Tìm kiếm gần từ ‘tìm’ ‘kiếm’, ñó chọn 10 ghi liên quan với từ khóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select top 10 MADT, TENDT,RANK from DETAI as DT inner join freetexttable(DETAI, TENDT, @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.1.6 Top-10 ghi cho truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT Các ghi trả theo thứ tự tương ứng với mức ñộ liên quan ñã tốt với người dùng Tuy nhiên với số lượng vừa đủ ghi tốt trả cịn có ý nghĩa Mười ghi có điểm đánh giá tương ứng mức ñộ liên quan nhiều tới từ khóa truy vấn trả (bảng 4.1.6) 52 Ví dụ 4.2: Giả sử muốn tìm đồ án tốt nghiệp có nội dung liên quan tới ‘tìm quản’ Thực tìm kiếm cột TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK bảng DETAI Ví dụ 4.2.1 Tìm kiếm gần ñúng với câu truy vấn like sau: select * from DETAI WHERE TENDT = N'%tìm quản%' or TOMTAT LIKE N'%tìm quản%' or TUKHOA LIKE N'%tìm quản%' or MUCLUC LIKE N'%tìm quản%' or TLTK LIKE N'%tìm quản%' Bảng 4.2.1 Kết truy vấn từ ‘tìm quản’ với like bảng DETAI Nếu truy vấn tìm kiếm xác chắn truy vấn truy vấn rỗng Ngay trường hợp truy vấn tìm kiếm gần với like khơng có kết trả 53 Ví dụ 4.2.2 Tìm kiếm gần từ “tìm” “quản” sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), @kws) as K on DT.MADT = K.[KEY] Bảng 4.2.2 Kết truy vấn từ “tìm” “quản” bảng DETAI Tất có 984 ghi bảng DETAI thỏa mãn truy vấn có chứa từ “tìm” từ ‘quản’ trả về, ghi khơng có thứ tự gây khó khăn cho người dùng việc khai thác kết 54 Ví dụ 4.2.3 Tìm kiếm gần từ “tìm” “quản”, hạn chế số ghi liên quan với từ khóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.2.3 Kết truy vấn từ “tìm” “quản” có xếp bảng DETAI … Số lượng kết giống bảng 4.2.2, khác 984 ghi ñược theo thứ tự mức liên quan tới từ khóa truy vấn 55 Ví dụ 4.2.4 Tìm kiếm gần từ “tìm” “quản”, hạn chế số ghi liên quan với từ khóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select top 50 MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), 'tìm quản') as K on DT.MADT = K.[KEY] order by RANK desc Kết trả truy vấn 50 ghi có ñiểm ñánh giá cao tương ứng 50 ghi liên quan nhiều với từ khóa truy vấn (xem bảng 4.2.3) Dữ liệu khơng nhiều thấy chênh lệch số lượng kết trả tương ứng với tìm kiếm xác tìm kiếm gần đúng, truy vấn rỗng 322 kết (ví dụ 4.1), khơng có kết 984 kết (ví dụ 4.2) Số lượng 322 kết (bảng 4.1.5) nhiều, song làm người dùng phải băn khoăn nên dùng kết nào, kết tốt Số lượng 984 kết (bảng 4.1.6) số thực khơng nhỏ, kết tìm kiếm ñược theo thứ tự giảm dần ñiểm ñánh giá, phần giúp việc xử lý kết trở nên dễ dàng cho người dung Nói cách khác, với việc tích hợp kỹ thuật xếp hạng tìm kiếm CSDL giúp kết có “ý nghĩa” với người dùng 56 4.4.2 Giao diện ứng dụng Bảng 4.3 Thiết kế giao diện Bảng 4.3.1 Thiết kế form ñề tài 57 Bảng 4.3.2 Thiết kế form giáo viên hướng dẫn Bảng 4.3.3 Thiết kế form sinh viên thực 58 Bảng 4.3.4 Thiết kế form ngành-chuyên ngành 59 KẾT LUẬN Sau thời gian nghiên cứu tiến hành thực học viên hồn thành u cầu đề tài: “tìm kiếm sở liệu dựa vào từ khóa” Kết đạt Luận văn trình bày ñược phương pháp tìm kiếm dựa cấu trúc CSDL, đưa tình có kết khơng mong đợi Bên cạnh luận văn trình bày tìm kiếm dựa từ khóa hệ thống thơng tin Trình bày tìm kiếm dựa từ khóa hệ thống thông tin kỹ thuật xếp hạng kỹ thuật tìm kiếm gần Từ đó, áp dụng kỹ thuật vào tìm kiếm CSDL Luận văn trình bày chi tiết số thuật toán xử lý truy vấn top-k Cuối cùng, đề xuất việc tích hợp tìm kiếm dựa từ khóa hệ thống quản lý đồ án tốt nghiệp Hướng phát triển Về lý thuyết: ðề xuất phương pháp xử lý truy vấn tốt áp dụng ñể ứng dụng tìm kiếm CSDL Về ứng dụng: Phát triển mơ ứng dụng, tích hợp chức quản lý ñồ án tốt nghiệp website trường ðại Học Sư Phạm Kỹ Thuật Hưng Yên 60 TÀI LIỆU THAM KHẢO Bei Yu, Guoliang Li, Karen Sollins, Anthony K.H.Tung, (2007), “Effective Keyword Based Selection of Relational Databases", ACM SIGMOD, pp.139150 Chengkai Li, K.Chen Chuan Chang, Ihab F.Ilyas, Sumin Song, (2005), “RankSQL: Query Algebra and Optimization for Relational Top-K Queries”, In SIGMOD, pp 131-142 ðinh Mạnh Tường, “Giáo trình cấu trúc liệu giải thuật-thuật toán”, daihoc.com.vn Eyas El Qawasmeh, Ossama Abueid, Abdallah Alashqur, (2010), “A framework for Processing Keyword-Based Queries in Relational Databases”, Journal of Theoretical and Applied Information Technology, pp 149-163 Fang Liu, Clement Yu, Weiyi Meng, Abdur Chowdhury, (2006), "Effective Keyword Search in Relational Databases", ACM SIGMOD, pp 563-574 Hamilton J, Nayak T, (2001), “Microsoft SQL Server Fulltext Search”, IEEE Data Engineering Bulletin, pp 7-10 Ihab F Ilyas, George Beskales, Mohamed A Soliman, (2008), “A Survey of Topk Query Processing Techniques in Relational Database Systems”, ACM Computing Surveys, pp 11-58 Ilioiu Florin, Daniel Rocacher, Ludovic Liétard, (2006), “Study of Preference Driven Database Query Systems” Nicolas Bruno and Hui (Wendy) Wang, (2007), “The Threshold Algorithm: From Middleware Systems to the Relational Engine”, IEEE transactions on knowledge and data engineering, pp 523-537 10 Reza Akbarinia, Esther Pacitti, Patrick Valduriez, Atlas Team, INRIA and LINA, Nates, (2007), “Best Position Algorithms for Top-k Queries”, pp 495-506 11 R Fagin, (1999), “Combining fuzzy information from multiple systems”, J Comput System Sci, Journal of Computer and System Sciences, pp 83-99 61 12 R Fagin, A Lotem and M Naor, (2003), “Optimal aggregation algorithms for middleware”, Journal of Computer and System Sciences, pp 614–656 13 Sanjay Agrawal, Surajit Chaudhuri, and Gautam Das, (2002), "DBXplorer: A system for Keyword-Based Search Over Relational Databases", ICDE, pp 5–16 14 Sanjay Agrawal, Surajit Chaudhuri, Gautam Das, and Aristides Gionis, (2003), “Automated ranking of Database Query Results”, in Proceedings of the 2003 CIDR Conference (CIDR) 15 Shan Wang and Kun-Long Zhang, (2005), “Searching Databases with Keywords”, J Comp Sci & Tech 16 Surajit Chaudhuri, Nicolas Bruno, Luis Gravano, (2002), “Top-k Selection Queries over Relational Databases: Mapping Strategies and Performance Evaluation”, ACM Transactions on Database Systems, pp 1-33 17 Surajit Chaudhuri, Gautam Das, (2009), “Keyword Querying and Ranking in Databases”, VLDB, pp.1658-1659 18 Surajit Chaudhuri, Gautam Das, “Keyword Querying and Ranking in Databases”, VLDB, pp 24-28 19 Vagelis Hristidis, Luis Gravano, and Yannis Papakonstantinou, (2003), "Efficient IR-Style Keyword Search Over Relational Databases", VLDB, pp 850-861 20 Vagelis Hristidis, Oscar Valdivia, Michail Vlachos, Philip S Yu, (2007), “A System for Keyword Search on Textual Streams”, SIAM, pp 503-508 21 Vũ Tuyết Trinh, “Bài giảng hệ quản trị sở liệu”, http://is.hut.edu.vn/~trinhvt/courses/ 22 “Thiết kế CSDL làm việc với CSDL SQL Server”, ðại học SPKT Hưng Yên 23 Xu Yu, Lu Qin, Lijun Chang, (2009), “Keyword Search in Databases: The Power of RDBMS”, SIGMOD Conference, pp 681-694 24 Wei Wang, (2007), “Keyword Search in Databases”, Talk 25 http://msdn.microsoft.com/en-us/library/ 26 justinking@ssw.com.au 27 www.ssw.com.au 62 ... thực tìm kiếm tìm kiếm dựa cấu trúc liệu sở liệu (CSDL) tìm kiếm nội dung liệu dựa từ khóa văn bản, tài liệu, liệu web, liệu khơng có cấu trúc 1.1 Tìm kiếm sở liệu Tìm kiếm CSDL tìm kiếm dựa vào... Chương 2 TỔNG QUAN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 2.1 Kiến trúc hệ quản trị sở liệu tìm kiếm dựa từ khóa Sử dụng triệt để hệ quản trị CSDL có cách biến đổi từ khóa truy vấn đầu... văn Chương TỔNG QUAN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 2.1 Kiến trúc hệ quản trị sở liệu tìm kiếm dựa từ khóa 2.2 Tổ chức lưu trữ liệu 2.2.1 B-cây