Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,61 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Nguyễn Hoàng Điệp TÌMKIẾMTRONGCƠSỞDỮLIỆUDỰATRÊNTỪKHÓA Chuyên ngành: Công nghệ thông tin LUẬN VĂN THẠC SĨ KHOA HỌC CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Vũ Tuyết Trinh Hà Nội – Năm 2010 Lời cảm ơn Xin chân thành cảm ơn hướng dẫn, bảo tận tình cô Vũ Tuyết Trinh suốt thời gian thực ñề tài, cảm ơn cô ñã hướng dẫn tác giả kiến thức kỹ ñể hoàn thành ñược ñề tài, cảm ơn cô ñã dành thời gian giúp ñỡ em, cảm ơn cô em ñã học ñược nhiều ñiều từcô Xin chân thành cảm ơn Khoa Công Nghệ Thông Tin – Viện ñào tạo sau ñại học Trường ðại Học Bách khoa Hà Nội ñã tạo ñiều kiện thuận lợi ñể hoàn thành luận văn tốt nghiệp Xin chân thành cảm ơn PGS.TS Nguyễn Quang Hoan, KS Lê Thị Thu Hương, CN Trịnh Thị Nhị ñồng nghiệp khác công tác khoa CNTT trường ðại học Sư phạm Kỹ thuật Hưng Yên ñã ủng hộ, giúp ñỡ tạo ñiều kiện giúp ñỡ hoàn thành luận văn Xin cảm ơn anh chị, bạn bè học viên lớp CNTT khóa 2008-2010 ñã ủng hộ, giúp ñỡ ñộng viên thời gian học tập nghiên cứu Cuối xin cảm ơn người thân yêu nhất, người ñộng viên giúp ñỡ mặt hoàn cảnh Hà Nội, ngày 30 tháng 10 năm 2010 Lời cam ñoan Tôi Nguyễn Hoàng ðiệp - học viên lớp cao học CNTT khóa 2008-2010 xin cam ñoan: - Luận văn tốt nghiệp thạc sĩ công trình nghiên cứu thân hướng dẫn TS.Vũ Tuyết Trinh - Các kết luận văn tốt nghiệp thạc sĩ trung thực, chép toàn văn công trình khác Hà Nội, ngày 30 tháng 10 năm 2010 Học viên Nguyễn Hoàng ðiệp MỤC LỤC Chương ðẶT VẤN ðỀ 1.1 Tìmkiếmsởliệu 1.2 Tìmkiếmdựatừkhóa 1.3 Tìmkiếmdựatừkhoásởliệu quan hệ 1.4 Mục ñích luận văn 1.5 Phương pháp thực bố cục luận văn Chương TỔNG QUAN TÌMKIẾMTRONGCƠSỞDỮLIỆUDỰATRÊNTỪKHÓA 2.1 Kiến trúc hệ quản trị sởliệutìmkiếmdựatừkhóa 2.2 Tổ chức lưu trữ liệu 2.2.1 B-cây 2.2.2 Tệp băm 2.2.3 Tệp mục có xếp 10 2.2.4 Chỉ mục theo từ 11 2.3 Quy trình thực truy vấn từkhóasởliệu 12 Chương XỬ LÝ TRUY VẤN CƠSỞDỮLIỆUDỰATRÊNTỪKHÓA 14 3.1 Bài toán truy vấn top-k sởliệu 14 3.1.1 Bài toán truy vấn top-k 14 3.2 Tính ñiểm cho văn 15 3.2.1 Tính ñiểm liệu văn theo mô hình vectơ 15 3.2.2 Tính ñiểm liệu văn dựa vào trọngsố 16 3.3 Xếp hạng 17 3.3.1 Hàm xếp hạng 17 3.3.2 Hàm xếp hạng ñơn ñiệu 18 3.3.3 RankSQL 19 3.4 Thuật toán truy vấn top-k 21 3.4.1 Thuật toán vét cạn 21 3.4.2 Thuật toán Fagin 23 3.4.3 Thuật toán cận 26 3.4.4 Thuật toán vị trí tốt 34 3.4.5 ðánh giá thuật toán truy vấn top-k 39 Chương ÁP DỤNG VÀO BÀI TOÁN QUẢN LÝ ðỒ ÁN 40 4.1 Phát biểu toán 40 4.2 Phân tích thiết kế hệ thống 41 4.2.1 Chức hệ thống 41 4.2.2 Thiết kế sởliệu 44 4.3 Môi trường thực nghiệm 46 4.3.1 Xếp hạng SQL server 47 4.4 Kết thực nghiệm 47 4.4.1 Kết thực nghiệm 47 4.4.2 Giao diện ứng dụng 57 KẾT LUẬN 60 Kết ñạt ñược 60 Hướng phát triển 60 TÀI LIỆU THAM KHẢO 61 Chương ðẶT VẤN ðỀ 1.1 ếm sởliệuTìmkiếm CSDL tìmkiếmdựa vào cấu trúc liệu ñược lưu trữ, 1.2 TìmkiếmdựatừkhóaTrong cách tiếp cận khác ñể thực tìmkiếm thông tin, người ta dựa vào việc sử dụng từkhóa ñối sánh từkhóa với nội dung thông tin ñể ñưa thông tin mà người dùng quan tâm DANH MỤC CÁC HÌNH Hình 2.1 Kiến trúc hệ quản trị sởliệu Hình 2.2 Minh họa cấu trúc B-cây Hình 2.3 Minh họa cấu trúc tệp băm Hình 2.4 Minh họa cấu trúc tệp mục có xếp 11 Hình 2.5 Quy trình thực truy vấn từkhóasởliệu 12 Hình 4.1 Quá trình tìmkiếm thông tin với từkhóa 43 Hình 4.2 Thiết kế CSDL 44 Hình 4.3 Thiết kế kiểu liệu cho thuộc tính bảng CSDL 45 Hình 4.4 Kiến trúc tìmkiếm full-text SQL server 46 DANH MỤC CÁC BẢNG Bảng 3.1 Dữliệu ñầu vào cho ví dụ 3.1 20 Bảng 3.2 ðiểm ñánh giá cho ñối tượng 20 Bảng 3.3 Sắp xếp theo chiều giảm dần ñiểm ñánh giá ñối tượng 20 Bảng 3.4 Dữliệu ñầu vào cho ví dụ 3.2 22 Bảng 3.5 Truy cập (BA) 23 Bảng 3.6 Truy cập vị trí danh sách 24 Bảng 3.7 Dữliệu lưu nhớ ñệm (bước 1-FA) 25 Bảng 3.8 Truy cập ngẫu nhiên ñể tìm ñiểm thiếu (bước 2-FA) 25 Bảng 3.9 Dữliệu lưu nhớ ñệm (bước 3-FA) 26 Bảng 3.10 Dữliệu sau truy cập (lần 1-TA) 27 Bảng 3.11 Truy cập ngẫu nhiên vị trí thiếu (lần 1-TA) 28 Bảng 3.12 Dữliệu lưu nhớ ñệm sau thực lần 28 Bảng 3.13 Dữliệu sau truy cập liệu (lặp lần 1-TA) 29 Bảng 3.14 Minh họa truy cập ngẫu nhiên liệu (lặp lần 1-TA) 29 Bảng 3.15 Dữliệu lưu nhớ ñệm (lặp lần lần 1-TA) 30 Bảng 3.16 Minh họa truy cập ngẫu nhiên liệu (lặp lần 2-TA) 30 Bảng 3.17 Dữliệu lưu nhớ ñệm (lặp lần lần 2-TA) 31 Bảng 3.18 Minh họa truy cập liệu (lặp lần 3-TA) 31 Bảng 3.19 Dữliệu lưu nhớ ñệm (lặp lần lần 3-TA) 32 Bảng 3.20 Minh họa truy cập liệu (lặp lần 4-TA) 32 Bảng 3.21 Dữliệu lưu nhớ ñệm (lặp lần lần 4-TA) 33 Bảng 3.22 Minh họa truy cập liệu (lặp lần 5-TA) 33 Bảng 3.23 Dữliệu lưu nhớ ñệm (lặp lần lần 5-TA) 34 Bảng 3.24 Dữliệu lưu nhớ ñệm (lần 1-BPA) 36 Bảng 3.25 Dữliệu lưu nhớ ñệm (lặp lần BPA) 37 Bảng 3.26 Dữliệu lưu nhớ ñệm (lặp lần BPA) 38 Bảng 4.1 Dữliệu bảng DETAI 47 Bảng 4.1.1 Kết truy vấn xác từ “tìm kiếm” cột TENDT 48 Bảng 4.1.2 Kết truy vấn từ “tìm kiếm” với like cột TENDT 48 Bảng 4.1.3 Kết truy vấn từ “tìm kiếm” cột TENDT 49 Bảng 4.1.4 Kết truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT 50 Bảng 4.1.5 Kết truy vấn từ ‘tìm’ ‘kiếm’ có xếp cột TENDT 51 Bảng 4.1.6 Top-10 ghi cho truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT 52 Bảng 4.2.1 Kết truy vấn từ ‘tìm quản’ với like bảng DETAI 53 Bảng 4.2.2 Kết truy vấn từ “tìm” “quản” bảng DETAI 54 Bảng 4.2.3 Kết truy vấn từ “tìm” “quản” có xếp bảng DETAI 55 Bảng 4.3 Thiết kế giao diện 57 Bảng 4.3.1 Thiết kế form ñề tài 57 Bảng 4.3.2 Thiết kế form giáo viên hướng dẫn 58 Bảng 4.3.3 Thiết kế form sinh viên thực 58 Bảng 4.3.4 Thiết kế form ngành-chuyên ngành 59 DANH MỤC CÁC KÝ HIỆU VIẾT TẮT Từ viết tắt Viết ñầy ñủ Ý nghĩa BA Basic Algorithm Thuật toán vét cạn BPA Best Position Algorithm Thuật toán vị trí tốt CSDL Cơsởliệu CNTT Công nghệ thông tin CNPM Công nghệ Phần Mềm DATN ðồ án tốt nghiệp DB DataBase ðSQH ðại số quan hệ FA Fagin’s Algorithm GV Giáo viên GVHD Giáo viên hướng dẫn IR Information retrieval KF Keyword Frequency KW Keyword Weight Trọngsốtừkhóa KWBS KeyWord Based Search Tìmkiếmdựatừkhóa RKW Relative Keywords Weight Trọngsốtừkhóa liên quan SQL Structured Query Language SV Sinh viên TA Threshold Algorithm Cơsởliệu Thuật toán Fagin Hệ thống tìmkiếm thông tin Tần xuất từ khóa, số lần từkhóa ñơn xuất văn Thuật toán cận Chương 1 ðẶT VẤN ðỀ Dữliệu ñược lưu trữ ngày nhiều, sử dụng lại thông tin ñã có nhu cầu tất yếu Do ñó, tìmkiếm thông tin ngày trở nên quan trọng ñời sống nói chung ứng dụng nói riêng Trong hệ thống thông tin, kết tìmkiếm ñược trả cho người dùng, nên việc xác ñịnh kết truy vấn ñể ñảm bảo thông tin có ý nghĩa ñiều quan trọngCó nhiều cách thức ñể thực tìmkiếm thông tin, ta phân biệt hai hướng tiếp cận ñể thực tìmkiếmtìmkiếmdựa cấu trúc liệusởliệu (CSDL) tìmkiếm nội dung liệudựatừkhóa văn bản, tài liệu, liệu web, liệu cấu trúc 1.1 TìmkiếmsởliệuTìmkiếm CSDL tìmkiếmdựa vào cấu trúc liệu ñược lưu trữ, ñó sử dụng ngôn ngữ truy vấn Kết tìmkiếm ñầy ñủ xác Tất liệu thỏa mãn ñiều kiện tìmkiếm ñều ñược trả cho người dùng Trong CSDL lớn, với câu truy vấn chứa ñiều kiện tìmkiếm ñược kết trả lại nhiều nhiều liệu thỏa mãn ñiều kiện tìmkiếm (xem ví dụ 4.2.2) Ngược lại, với câu truy vấn chứa nhiều ñiều kiện tìm kiếm, số ghi thỏa mãn tất ñiều kiện tìmkiếm ít, chí ghi ñược trả (truy vấn rỗng) (xem ví dụ 4.1.1, ví dụ 4.2.1) Trong hai tình trên, người dùng ñều gặp khó khăn việc xử lý kết tìmkiếm Khi kết rỗng (không có kết nào), hệ thống không cung cấp thông tin cho người dùng Khi kết nhiều, người dùng khó xem tất kết khó biết ñược thông tin quan trọng hơn, thông tin quan trọng Ví dụ 4.1: Giả sử muốn tìm ñồ án tốt nghiệp có nội dung liên quan tới “tìm kiếm” Thực cột TENDT bảng DETAI Ví dụ 4.1.1 Tìmkiếm xác với câu truy vấn sau: select * from DETAI WHERE TENDT = N'tìm kiếm' Bảng 4.1.1 Kết truy vấn xác từ “tìm kiếm” cột TENDT Nhận xét: Truy vấn tìmkiếm truy vấn rỗng yêu cầu tìmkiếm xác ghi thỏa mãn yêu cầu (bảng 4.1.1) Ví dụ 4.1.2 Tìmkiếm gần ñúng với câu truy vấn like sau: select MADT,TENDT from DETAI WHERE TENDT LIKE N'%tìm%kiếm%' Bảng 4.1.2 Kết truy vấn từ “tìm kiếm” với like cột TENDT Kết trả 291 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, ñó từ “tìm” phải ñứng trước từ “kiếm”, ghi không xếp theo thứ tự 48 Ví dụ 4.1.3 Tìmkiếm gần ñúng theo từ với contains sau: DECLARE @kws nvarchar(30) SET @kws =N'"TÌM KIẾM"' select MADT,TENDT FROM DETAI WHERE contains(TENDT, @kws) Bảng 4.1.3 Kết truy vấn từ “tìm kiếm” cột TENDT Kết trả 291 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, ghi không xếp theo thứ tự 49 Ví dụ 4.1.4 Tìmkiếm gần ñúng với từkhóa ‘tìm kiếm’ sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select MADT,TENDT FROM DETAI WHERE FREETEXT(TENDT, @kws) Bảng 4.1.4 Kết truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT Kết trả 322 ghi thỏa mãn truy vấn chứa từ “tìm” từ “kiếm”, ghi không xếp theo thứ tự 50 Ví dụ 4.1.5 Tìmkiếm gần ñúng từ ‘tìm’ ‘kiếm’, ñó ghi ñược xếp theo chiều giảm dần mức ñộ liên quan ghi với từkhóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select MADT, TENDT, RANK from DETAI as DT inner join freetexttable(DETAI, TENDT, @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.1.5 Kết truy vấn từ ‘tìm’ ‘kiếm’ có xếp cột TENDT … Kết trả 322 ghi, ñó xếp theo chiều giảm dần mức ñộ liên quan ghi với từkhóa truy vấn 51 Ví dụ 4.1.6 Tìmkiếm gần ñúng từ ‘tìm’ ‘kiếm’, ñó chọn 10 ghi liên quan với từkhóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'TÌM KIẾM' select top 10 MADT, TENDT,RANK from DETAI as DT inner join freetexttable(DETAI, TENDT, @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.1.6 Top-10 ghi cho truy vấn từ ‘tìm’ ‘kiếm’ cột TENDT Các ghi trả theo thứ tự tương ứng với mức ñộ liên quan ñã tốt với người dùng Tuy nhiên với số lượng vừa ñủ ghi tốt trả có ý nghĩa Mười ghi có ñiểm ñánh giá tương ứng mức ñộ liên quan nhiều tới từkhóa truy vấn ñược trả (bảng 4.1.6) 52 Ví dụ 4.2: Giả sử muốn tìm ñồ án tốt nghiệp có nội dung liên quan tới ‘tìm quản’ Thực tìmkiếm cột TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK bảng DETAI Ví dụ 4.2.1 Tìmkiếm gần ñúng với câu truy vấn like sau: select * from DETAI WHERE TENDT = N'%tìm quản%' or TOMTAT LIKE N'%tìm quản%' or TUKHOA LIKE N'%tìm quản%' or MUCLUC LIKE N'%tìm quản%' or TLTK LIKE N'%tìm quản%' Bảng 4.2.1 Kết truy vấn từ ‘tìm quản’ với like bảng DETAI Nếu truy vấn tìmkiếm xác chắn truy vấn truy vấn rỗng Ngay trường hợp truy vấn tìmkiếm gần ñúng với like kết ñược trả 53 Ví dụ 4.2.2 Tìmkiếm gần ñúng từ “tìm” “quản” sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), @kws) as K on DT.MADT = K.[KEY] Bảng 4.2.2 Kết truy vấn từ “tìm” “quản” bảng DETAI Tất có 984 ghi bảng DETAI thỏa mãn truy vấn có chứa từ “tìm” từ ‘quản’ ñều ñược trả về, ghi thứ tự gây khó khăn cho người dùng việc khai thác kết 54 Ví dụ 4.2.3 Tìmkiếm gần ñúng từ “tìm” “quản”, ñó hạn chế số ghi liên quan với từkhóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), @kws) as K on DT.MADT = K.[KEY] order by RANK desc Bảng 4.2.3 Kết truy vấn từ “tìm” “quản” có xếp bảng DETAI … Số lượng kết giống bảng 4.2.2, khác 984 ghi ñược theo thứ tự mức liên quan tới từkhóa truy vấn 55 Ví dụ 4.2.4 Tìmkiếm gần ñúng từ “tìm” “quản”, ñó hạn chế số ghi liên quan với từkhóa truy vấn Câu truy vấn sau: DECLARE @kws nvarchar(30) SET @kws =N'tìm quản' select top 50 MADT, TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK,RANK from DETAI as DT inner join freetexttable(DETAI,(TENDT, TOMTAT, TUKHOA, MUCLUC, TLTK ), 'tìm quản') as K on DT.MADT = K.[KEY] order by RANK desc Kết trả truy vấn 50 ghi có ñiểm ñánh giá cao tương ứng 50 ghi liên quan nhiều với từkhóa truy vấn (xem bảng 4.2.3) Dữliệu không nhiều thấy chênh lệch số lượng kết trả tương ứng với tìmkiếm xác tìmkiếm gần ñúng, truy vấn rỗng 322 kết (ví dụ 4.1), kết 984 kết (ví dụ 4.2) Số lượng 322 kết (bảng 4.1.5) nhiều, song làm người dùng phải băn khoăn nên dùng kết nào, kết tốt Số lượng 984 kết (bảng 4.1.6) số thực không nhỏ, kết tìmkiếm ñược theo thứ tự giảm dần ñiểm ñánh giá, phần giúp việc xử lý kết trở nên dễ dàng cho người dung Nói cách khác, với việc tích hợp kỹ thuật xếp hạng tìmkiếm CSDL giúp kết có “ý nghĩa” với người dùng 56 4.4.2 Giao diện ứng dụng Bảng 4.3 Thiết kế giao diện Bảng 4.3.1 Thiết kế form ñề tài 57 Bảng 4.3.2 Thiết kế form giáo viên hướng dẫn Bảng 4.3.3 Thiết kế form sinh viên thực 58 Bảng 4.3.4 Thiết kế form ngành-chuyên ngành 59 KẾT LUẬN Sau thời gian nghiên cứu tiến hành thực học viên ñã hoàn thành ñược yêu cầu ñề tài: “tìm kiếmsởliệudựa vào từ khóa” Kết ñạt ñược Luận văn ñã trình bày ñược phương pháp tìmkiếmdựa cấu trúc CSDL, ñưa ñược tình có kết không mong ñợi Bên cạnh ñó luận văn trình bày ñược tìmkiếmdựatừkhóa hệ thống thông tin Trình bày ñược tìmkiếmdựatừkhóa hệ thống thông tin kỹ thuật xếp hạng kỹ thuật tìmkiếm gần ñúng Từ ñó, áp dụng kỹ thuật vào tìmkiếm CSDL Luận văn trình bày ñược chi tiết số thuật toán xử lý truy vấn top-k Cuối cùng, ñề xuất việc tích hợp tìmkiếmdựatừkhóa hệ thống quản lý ñồ án tốt nghiệp Hướng phát triển Về lý thuyết: ðề xuất phương pháp xử lý truy vấn tốt áp dụng ñể ứng dụng tìmkiếm CSDL Về ứng dụng: Phát triển mô ứng dụng, tích hợp chức quản lý ñồ án tốt nghiệp website trường ðại Học Sư Phạm Kỹ Thuật Hưng Yên 60 TÀI LIỆU THAM KHẢO Bei Yu, Guoliang Li, Karen Sollins, Anthony K.H.Tung, (2007), “Effective Keyword Based Selection of Relational Databases", ACM SIGMOD, pp.139150 Chengkai Li, K.Chen Chuan Chang, Ihab F.Ilyas, Sumin Song, (2005), “RankSQL: Query Algebra and Optimization for Relational Top-K Queries”, In SIGMOD, pp 131-142 ðinh Mạnh Tường, “Giáo trình cấu trúc liệu giải thuật-thuật toán”, daihoc.com.vn Eyas El Qawasmeh, Ossama Abueid, Abdallah Alashqur, (2010), “A framework for Processing Keyword-Based Queries in Relational Databases”, Journal of Theoretical and Applied Information Technology, pp 149-163 Fang Liu, Clement Yu, Weiyi Meng, Abdur Chowdhury, (2006), "Effective Keyword Search in Relational Databases", ACM SIGMOD, pp 563-574 Hamilton J, Nayak T, (2001), “Microsoft SQL Server Fulltext Search”, IEEE Data Engineering Bulletin, pp 7-10 Ihab F Ilyas, George Beskales, Mohamed A Soliman, (2008), “A Survey of Topk Query Processing Techniques in Relational Database Systems”, ACM Computing Surveys, pp 11-58 Ilioiu Florin, Daniel Rocacher, Ludovic Liétard, (2006), “Study of Preference Driven Database Query Systems” Nicolas Bruno and Hui (Wendy) Wang, (2007), “The Threshold Algorithm: From Middleware Systems to the Relational Engine”, IEEE transactions on knowledge and data engineering, pp 523-537 10 Reza Akbarinia, Esther Pacitti, Patrick Valduriez, Atlas Team, INRIA and LINA, Nates, (2007), “Best Position Algorithms for Top-k Queries”, pp 495-506 11 R Fagin, (1999), “Combining fuzzy information from multiple systems”, J Comput System Sci, Journal of Computer and System Sciences, pp 83-99 61 12 R Fagin, A Lotem and M Naor, (2003), “Optimal aggregation algorithms for middleware”, Journal of Computer and System Sciences, pp 614–656 13 Sanjay Agrawal, Surajit Chaudhuri, and Gautam Das, (2002), "DBXplorer: A system for Keyword-Based Search Over Relational Databases", ICDE, pp 5–16 14 Sanjay Agrawal, Surajit Chaudhuri, Gautam Das, and Aristides Gionis, (2003), “Automated ranking of Database Query Results”, in Proceedings of the 2003 CIDR Conference (CIDR) 15 Shan Wang and Kun-Long Zhang, (2005), “Searching Databases with Keywords”, J Comp Sci & Tech 16 Surajit Chaudhuri, Nicolas Bruno, Luis Gravano, (2002), “Top-k Selection Queries over Relational Databases: Mapping Strategies and Performance Evaluation”, ACM Transactions on Database Systems, pp 1-33 17 Surajit Chaudhuri, Gautam Das, (2009), “Keyword Querying and Ranking in Databases”, VLDB, pp.1658-1659 18 Surajit Chaudhuri, Gautam Das, “Keyword Querying and Ranking in Databases”, VLDB, pp 24-28 19 Vagelis Hristidis, Luis Gravano, and Yannis Papakonstantinou, (2003), "Efficient IR-Style Keyword Search Over Relational Databases", VLDB, pp 850-861 20 Vagelis Hristidis, Oscar Valdivia, Michail Vlachos, Philip S Yu, (2007), “A System for Keyword Search on Textual Streams”, SIAM, pp 503-508 21 Vũ Tuyết Trinh, “Bài giảng hệ quản trị sở liệu”, http://is.hut.edu.vn/~trinhvt/courses/ 22 “Thiết kế CSDL làm việc với CSDL SQL Server”, ðại học SPKT Hưng Yên 23 Xu Yu, Lu Qin, Lijun Chang, (2009), “Keyword Search in Databases: The Power of RDBMS”, SIGMOD Conference, pp 681-694 24 Wei Wang, (2007), “Keyword Search in Databases”, Talk 25 http://msdn.microsoft.com/en-us/library/ 26 justinking@ssw.com.au 27 www.ssw.com.au 62 ... tìm kiếm tìm kiếm dựa cấu trúc liệu sở liệu (CSDL) tìm kiếm nội dung liệu dựa từ khóa văn bản, tài liệu, liệu web, liệu cấu trúc 1.1 Tìm kiếm sở liệu Tìm kiếm CSDL tìm kiếm dựa vào cấu trúc liệu. .. Chương 2 TỔNG QUAN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 2.1 Kiến trúc hệ quản trị sở liệu tìm kiếm dựa từ khóa Sử dụng triệt ñể hệ quản trị CSDL ñã có cách biến ñổi từ khóa truy vấn ñầu... văn Chương TỔNG QUAN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU DỰA TRÊN TỪ KHÓA 2.1 Kiến trúc hệ quản trị sở liệu tìm kiếm dựa từ khóa 2.2 Tổ chức lưu trữ liệu 2.2.1 B-cây