1. Trang chủ
  2. » Công Nghệ Thông Tin

Tìm hiểu về tìm kiếm văn bản top k query và triển khai ứng dụng

37 201 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 37
Dung lượng 669,94 KB

Nội dung

LỜI CAM ĐOAN Trước vào nội dung luận văn thạc sĩ mình, xin cam đoan luận văn viết, dựa kiến thức, hiểu biết thân, dẫn cô giáo hướng dẫn thông tin mà tìm hiểu, tham khảo qua tài liệu liên quan Các kết nêu luận văn trung thực chưa công bố công trình khác Học viên Đỗ Thị Thanh Loan LỜI CẢM ƠN Trên thực tế thành công mà không gắn liền với hỗ trợ, giúp đỡ dù hay nhiều, dù trực tiếp hay gián tiếp người khác Trong suốt thời gian từ bắt đầu học tập giảng đường đại học đến nay, em nhận nhiều quan tâm, giúp đỡ quý Thầy Cô, gia đình bạn bè Với lòng biết ơn sâu sắc nhất, em xin gửi đến quý Thầy Cô Viện Công nghệ thông tin Truyền thông – Trường Đại Học Bách Khoa Hà Nội với tri thức tâm huyết để truyền đạt vốn kiến thức quý báu cho em suốt thời gian học tập trường Em xin chân thành cảm ơn TS.Vũ Tuyết Trinh tận tâm hướng dẫn em suốt trình làm luận văn Nếu lời hướng dẫn, dạy bảo cô em nghĩ luận văn em khó hoàn thiện Một lần nữa, em xin chân thành cảm ơn cô Trong trình làm không tránh khỏi thiếu sót, em mong nhận ý kiến đóng góp quý báu quý Thầy Cô bạn học lớp để kiến thức em hoàn thiện Sau cùng, em xin kính chúc quý Thầy Cô Khoa Công nghệ thông tin thật dồi sức khỏe, niềm tin để tiếp tục thực sứ mệnh cao đẹp truyền đạt kiến thức cho hệ mai sau Trân trọng TP HN, ngày 20 tháng năm 2014 Học viên thực (ký ghi họ tên) MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC DANH MỤC CÁC HÌNH Chương GIỚI THIỆU BÀI TOÁN 1.1 Lý lựa chọn đề tài 1.2 Mục đích đề tài 1.3 Bố cục luận văn Chương CƠ SỞ LÝ THUYẾT 2.1 Phát biểu toán Top-k 2.2 Thuật toán TA (Threshold Algorithm) 2.3 Thuật toán BPA(Best Position Algorithm) 12 2.4 Thuật toán TPUT(Three Phase Uniform Threshold) 16 2.5 Thuật toán TPAT(Three-Phase Adaptive-Threshold) 20 2.6 Thuật toán TPOR(Three-Phase Object-Ranking) 24 2.7 So sánh đánh giá thuật toán TA, TPUT, TPOR 28 Chương XÂY DỰNG ỨNG DỤNG QUẢN LÝ TRUYỆN CƯỜI JOKESYSTEM SỬ DỤNG TRUY VẤN TOP-K 29 3.1 Mô tả toán 29 3.2 Xây dựng hệ thống 29 3.3 Thử nghiệm 32 Chương KẾT LUẬN 36 4.1 Tóm tắt kết 36 4.2 Hướng phát triển 36 TÀI LIỆU THAM KHẢO 37 DANH MỤC CÁC HÌNH Hình Một ví dụ truy vấn top-k Hình Ví dụ với ba hệ thống 10 Hình Ví dụ sở liệu a) danh sách xếp b) Ngưỡng TA vị trí từ tới 10 c)Tổng điểm đối tượng liệu 14 Hình Mô hình quan hệ 31 Hình Giao diện chương trình 31 Chương GIỚI THIỆU BÀI TOÁN 1.1 Lý lựa chọn đề tài Một truy vấn sở liệu SQL trả tất thông tin đáp ứng điều kiện truy vấn Có thể xảy hai trường hợp: - Câu trả lời trống rỗng: câu truy vấn chọn lọc, nhiều lựa chọn, thông tin thỏa mãn - Nhiều câu trả lời: truy vấn chọn lọc, câu truy vấn rộng, thông tin trả nhiều Trong hai trường hợp người dùng mong muốn nhận số lượng vừa phải liệu cần tìm Sử dụng truy vấn top-k thay cho truy vấn thông thường để giải hai vấn đề trên, truy vấn top-k định nghĩa sau: - Truy vấn Top-k nhằm mục đích lấy từ tập thông tin trả truy vấn sở liệu SQL k thông tin mà có tổng điểm cao Tổng điểm tính dựa kết hợp nhiều điều kiện truy vấn Ví dụ Cho sở liệu City gồm bảng: Schools Houses - Cơ sở liệu Houses cung cấp danh sách xếp hạng nhà với giá rẻ vị trí chúng - Cơ sở liệu Schools cung cấp danh sách xếp hạng trường chi phí thấp vị trí chúng - Yêu cầu: Đưa vị trí thành phố có chi phí kết hợp mua nhà trả tiền học phí cho 10 năm vị trí thấp Hình Một ví dụ truy vấn top-k Giải thích: - bảng Schools Houses liên kết dựa vào vị trí ( trường Location) - Để đánh giá độ phù hợp Houses-Schools ta sử dụng công thức sau: Chi phí = Price + 10* Tuition => Kết cuối truy vấn là: cặp Houses-Schools với chi phí thấp Đối với số lượng lớn Schools Houses, xử lý truy vấn theo cách truyền thống thời gian phải thao tác lệnh lựa chọn liệu xếp lại kết 1.2 Mục đích đề tài - Tìm hiểu truy vấn top-k số thuật toán top-k Phân tích so sánh thời gian thực thuật toán - Xây dựng ứng dụng thử nghiệm áp dụng truy vấn top-k với tìm kiếm full-text trường liệu văn 1.3 Bố cục luận văn Phần luận văn trình bày sau: - Chương Cơ sở lý thuyết - Chương Xây dựng ứng dụng quản lý truyện cười JokeSystem sử dụng truy vấn Top-k - Chương Kết luận Chương CƠ SỞ LÝ THUYẾT 2.1 Phát biểu toán Top-k Xét m danh sách liệu xếp dựa vào kết truy vấn SQL - Đầu vào m danh sách chứa liệu bao gồm cặp , với: i=1 m (m số danh sách đầu vào), j=1 n (n số đối tượng m danh sách, n>0, n ∈ N), Oj đối tượng LocalScorei(Oj) điểm đối tượng Oj, đối tượng xuất danh sách mà xuất m danh sách, tùy theo kết truy vấn - Đầu ra: k đối tượng Oj có điểm tổng thể cao Trong đó, điểm tổng thể GlobalScore(Oj) tính sau: GlobalScore(Oj) = ∑(LocalScorei(Oj)), với i=1 m (m số danh sách đầu vào), j=1 n (n số đối tượng m danh sách, n>0, n ∈ N) - Ý tưởng: Không duyệt hết kết mà cần duyệt phần đưa top-k kết có thứ tự - Nhiều thuật toán TA[3][1], BPA[1], TPUT[3], TPAT[3], TPOR[3] đề xuất cho phép tính tổng điểm đối tượng theo nhiều điều kiện đưa top-k kết thỏa mãn khác thời gian thực thuật toán - Dựa vào kỹ thuật xử lý chia thuật toán top-k làm dạng: + Các thuật toán Ngưỡng: TA, BPA + Các thuật toán pha: TPUT, TPAT, TPOR 2.2 Thuật toán TA (Threshold Algorithm) Tư tưởng thuật toán TA[1][3]: Xét m danh sách xếp dựa vào điều kiện tìm kiếm câu truy vấn Duyệt hàng danh sách, sau tính tổng điểm đối tượng tìm thấy Tính giá trị ngưỡng hàng, so sánh giá trị Ngưỡng với tổng điểm đối tượng tìm thấy Quá trình duyệt hàng danh sách lặp thỏa mãn có k đối tượng lớn giá trị ngưỡng dừng thuật toán a Các bước xây dựng thuật toán TA[1][3]: Bước - Tính tổng điểm đối tượng theo công thức: GlobalScore(Oj) = ∑( LocalScorei(Oj)), với i=1 m (m số danh sách đầu vào), j=1 n (n số đối tượng m danh sách, n>0, n ∈ N) + Oj: Đối tượng tìm thấy sớm qua lần duyệt hàng danh sách + LocalScorei(Oj): điểm đối tượng Oj + GlobalScore(Oj): điểm tổng thể đối tượng Oj - Sắp xếp lại danh sách kết sau tính tổng điểm đối tượng đưa k kết có tổng điểm cao vào danh sách Y, với k số kết theo yêu cầu top-k ban đầu Bước Tính ngưỡng N theo công thức: N = ∑( LocalScorei(Oj)), với i=1 m (m số danh sách đầu vào), j=1 n (n số đối tượng m danh sách, n>0, n ∈ N) - So sánh đối tượng danh sách Y bước với Ngưỡng + Nếu đối tượng có tổng điểm lớn ngưỡng cho vào danh sách kết Y xếp lại danh sách + Nếu đối tượng thỏa mãn điều kiện lớn ngưỡng thuật toán duyệt sang hàng quay lại bước Thuật toán dừng có k đối tượng thoả mãn điều kiện lớn ngưỡng Bước Trả danh sách kết Y b Ví dụ 2: Cho ví dụ với ba hệ thống subsystem1, subsystem2, subsystem3 Yêu cầu tìm top-2 đối tượng Hình Ví dụ với ba hệ thống Vị trí 1: - Thuật toán TA duyệt hết đối tượng hàng hệ thống + đối tượng nhìn thấy: O5, O4, O3 => giá trị ngưỡng thời điểm tính sau: N = 21 + 34 + 30 = 85 - thuật toán TA tính tổng điểm đối tượng O5, O4, O3: + O5: ∑(O5) = 21 + + = 37, + O4: ∑(O4) = 11 + 34 + 14 = 59 + O3: ∑(O3) = 11 + 26 +30 = 67 10 N = 30/3=10 Tại lại chia 3: giá trị trung bình cho danh sách Nếu có danh sách ngưỡng 30 chia 4)… =>T=10 (mặc định T3 = 10, có danh sách (subsystem)) Xác định cận cận ngưỡng, cho thỏa mãn giá trị ngưỡng giữa, khoảng: >=T>= - Dựa vào top-k =2, có subsytem=> cận trên, cận chia sang bên chênh so với giá trị Ngưỡng đơn vị Ta có T1=12>=T3=10>=T2=8 Pha 2: Tiến hành so sánh giá trị danh sách cho giá trị ngưỡng T1, T2, T3 tương ứng, ta lấy giá trị xấp xỉ lớn giá trị ngưỡng - Trong danh sách SubSyStem1: lấy giá trị từ vị trí trở lên - Trong danh sách SubSyStem2: lấy giá trị từ vị trí trở lên - Trong danh sách SubSyStem3: lấy giá trị từ vị trí trở lên O3: 56 O4: 48 O5: 30 O0: 29 O1: 29 O2: 17 - Tính tổng đối tượng (sau đưa danh sách kết quả): Ta thấy O3 O4 thuộc top-2 đối tượng có tổng điểm lớn 23 ∑(O3 ) = 67 ∑(O4 ) = 59 Y = {O4; O3} Pha 3: So sánh tổng điểm đối tượng thuộc Pha với O4, O3 Nếu đối tượng có giá trị lớn giá trị O4 O3 dừng Kết luận O4, O3 top-2 đối tượng cần tìm 2.6 Thuật toán TPOR(Three-Phase Object-Ranking) Tư tưởng thuật toán: Thuật toán TPOR[3] thực theo pha, pha duyệt k hàng m danh sách xếp kết Tính tổng điểm đối tượng k hàng Sau xếp lại danh sách tổng điểm để đưa vào danh sách kết k đối tượng có tổng điểm lớn Pha 2: danh sách kết vừa thu ta lại lấy đối tượng có tổng điểm nhỏ chia cho tổng số danh sách đầu vào để giá trị ngưỡng Sau so sánh điểm đối tượng hàng với giá trị ngưỡng để đưa danh sách kết thỏa mãn điều kiện lớn ngưỡng Sau đưa danh sách kết thỏa mãn ta thực tính tổng điểm đối tượng Pha 3: Sắp xếp lại danh sách tổng điểm đối tượng đưa k đối tượng có tổng điểm lớn a Kỹ thuật xử lý Pha 1: - Duyệt đối tượng k hàng đầu tiên, với k thuộc số kết yêu cầu top-k ban đầu - Tính tổng điểm đối tượng k hàng đầu theo công thức: GlobalScore(Oj) = ∑( LocalScorei(Oj)), với i=1 m (m số danh sách đầu vào), j=1 n (n số đối tượng m danh sách, n>0, n ∈ N) 24 + Oj: Đối tượng tìm thấy sớm qua lần duyệt hàng danh sách + LocalScorei(Oj): điểm đối tượng Oj + GlobalScore(Oj): điểm tổng thể đối tượng Oj - So sánh tổng điểm đối tượng, đưa k ghi có tổng điểm cao vào danh sách Y Pha 2: Trong danh sách Y lấy đối tượng có tổng điểm nhỏ nhất, ký hiệu t + Tính ngưỡng T theo công thức: t / m, với m tổng số danh sách đầu vào + Duyệt danh sách so sánh điểm đối tượng với Ngưỡng .Nếu điểm đối tượng thỏa mãn lớn ngưỡng cho vào danh sách M + Tính tổng điểm đối tượng danh sách M theo công thức: GlobalScore(Ot) = ∑( LocalScorel(Ot)), với l=1 m (m số danh sách đầu vào), t=1 n (n số đối tượng m danh sách, n>0, n ∈ N) + Ot: Đối tượng tìm thấy sớm qua lần duyệt hàng danh sách + LocalScorel(Ot): điểm đối tượng Ot + GlobalScore(Ot): điểm tổng thể đối tượng Ot Pha 3: So sánh tổng điểm đối tượng danh sách M với Sắp xếp lại danh sách M, trả k kết thỏa mãn theo yêu cầu b Ví dụ 10: Cho hệ thống con: subsystem1, subsystem2, subsystem3 Yêu cầu tìm đưa top-2 đối tượng 25 Pha 1: Duyệt vị trí subsystem + Tại lại chọn vị trí đầu tiên: duyệt qua note vị trí, lấy k=2 nên xét vị trí (Nếu chọn k=3 xét vị trí 1,2,3) + Tính tổng đối tượng: ∑(O5) = 21 ∑(O4) = 34+14 = 48 ∑(O3) = 30, ∑(O2) = 17, ∑(O1) = 29  Dựa vào tổng đối tượng ta có top k=2 đối tượng có tổng điểm cao Ssum(O4) Ssum (O3)  Pha 1, đối tượng có tổng điểm nhỏ 30 Ngưỡng sử dụng pha tính sau: N = 30/3=10 Tại lại chia 3: giá trị trung bình cho danh sách Nếu có danh sách ngưỡng 30 chia 4)… 26 Pha 2: Tiến hành so sánh giá trị danh sách cho giá trị ngưỡng, ta lấy giá trị lớn giá trị ngưỡng - Trong danh sách SubSyStem1: lấy giá trị từ vị trí trở lên - Trong danh sách SubSyStem2: lấy giá trị từ vị trí trở lên - Trong danh sách SubSyStem3: lấy giá trị từ vị trí trở lên O3: 67 O4: 59 O0: 29 O1: 29 O5: 21 O2: 17 O6: 10 O7: 10 - Tính tổng đối tượng sau đưa danh sách kết so sánh với ngưỡng: Ta thấy O3 O4 thuộc top-2 đối tượng có tổng điểm lớn ∑(O3 ) = 67 ∑(O4 ) = 59 Y = {O4; O3}  t2 = 59 27 Pha 3: So sánh tổng điểm đối tượng thuộc Pha với O4, O3 Nếu đối tượng có giá trị lớn giá trị O4 O3 dừng Kết luận O4, O3 top-2 đối tượng cần tìm 2.7 So sánh đánh giá thuật toán TA, TPUT, TPOR Dựa vào kết ví dụ 2, ví dụ ví dụ thuật toán TA[1][3], TPUT[3], TPOR[3] ta thấy: - Số vòng lặp để đưa kết thuật toán TA[1][3] vòng, thuật toán sử dụng vòng lặp for để tính tổng điểm đối tượng hàng lần lặp, nên độ phức tạp thuật toán O(n*(m*n)) - Trong thuật toán TPUT[3], sau pha đưa kết cần tìm, thuật toán dùng for để lặp tính tổng điểm cho đối tượng, số lần lặp pha, độ phức tạp O(2*(m*n)) - Trong thuật toán TPOR[3] sau pha đưa kết cần tìm, thuật toán dùng for để lặp tính tổng điểm cho đối tượng, số lần lặp pha, độ phức tạp O(2*(m*n)), thuật toán TPOR[3] so sánh tổng điểm đối tượng lớn ngưỡng, rút ngắn thời gian xử lý thuật toán TPUT[3], thuật toán TPUT[3] so sánh tổng điểm đối tượng lớn ngưỡng 28 Chương XÂY DỰNG ỨNG DỤNG QUẢN LÝ TRUYỆN CƯỜI JOKESYSTEM SỬ DỤNG TRUY VẤN TOP-K 3.1 Mô tả toán JokeSystem ứng dụng đọc truyện cười thiết bị di động Ứng dụng tập hợp thể loại truyện cười từ nhiều nước khác Mỗi thể loại gói thành gói truyện, người dùng muốn đọc truyện đọc trực tiếp tải theo thể loại tải truyện nhỏ thể loại máy Mỗi thể loại hay truyện có giá riêng, lần người dùng tải bị trừ phí theo giá Xây dựng trang quản lý cho ứng dụng JokeSystem gồm chức năng: Quản lý danh sách truyện cười, quản lý danh sách thể loại truyện, quản lý danh sách ngôn ngữ truyện, tìm kiếm truyện theo Full-text áp dụng truy vấn Top-k - Sử dụng sở liệu SQLServer 2008 ngôn ngữ lập trình C# 2012 3.2 Xây dựng hệ thống Mỗi vùng có nhiều thể loại truyện cười khác nhau, thể loại có nhiều truyện cười Người dùng đọc đánh giá nhận xét, truyện có nhiều nhận xét khác Mỗi người dùng sau đăng ký sử dụng ứng dụng nạp tiền để tải truyện đọc, người dùng tải truyện hệ thống kiểm soát cập nhật lại số tiền có số lần tải - Bảng Language: Quản lý danh sách ngôn ngữ: Traditional Chinese, Simplified Chinese, English – Australia, Portuguese – Brazil, English – India, Spanish – Mexico, Spanish – Spain, Russian - Bảng Category: Quản lý danh sách thể loại truyện cười Ví dụ như: Animal Jokes, Baby Jokes, Bicycle Jokes… - Bảng Book: Quản lý danh sách truyện cười Gồm trường: mã truyện, tên truyện, miêu tả, ảnh minh họa, tác giả, ngôn ngữ, từ khóa, số lần người dùng 29 xem, số lần người dùng đánh giá truyện, mức độ người dùng đánh giá truyện, cấp độ từ đến sao, ngày đăng truyện, ngày chỉnh sửa truyện, nội dung truyện, số lượt yêu thích thể loại, số lượt không thích thể loại, số lần người dùng nhận xét truyện, số lượt tải đọc máy Bảng Book xét Full-text cho trường: tên truyện, miêu tả, tác giả, ngôn ngữ, từ khóa, nội dung truyện Người dùng tìm kiếm truyện, nội dung truyện cách nhanh chóng hiệu Có thể tìm kiếm tiếng việt có dấu không dấu Tìm kiếm Full-text không tìm kiếm like, Full-text tìm kiếm dựa mục (index), không tìm trang câu truyện mà tìm trang index câu truyện Tìm kiếm Full-text cho phép lọc bỏ từ khóa không cần thiết nội dung người dùng nhập vào để tìm kiếm Các trường: tên truyện, miêu tả, tác giả, ngôn ngữ, từ khóa, nội dung truyện bảng Book tạo Full-Text Catalog, Tạo Full-Text Index tạo Index - Bảng Comment: Quản lý nội dung người dùng nhận xét truyện Gồm trường: mã truyện, mã nhận xét, nội dung, ngày viết - Bảng Download: Quản lý số tiền lượt tải truyện số điện thoại Số điện thoại số đăng ký để tải ứng dụng đọc truyện máy, số đăng ký để mua point trả phí cho lần tải truyện a Mô hình quan hệ: 30 Hình Mô hình quan hệ b Giao diện chương trình Menu quản lý Book, Category, Language Chọn điều kiện Nhập top-k Nhập Fulltext search Chọn thuật toán Result kết Refresh kết Kết Subsystem3 Kết Subsystem2 Kết Subsystem1 Thời gian thực Kết Top-k Hình Giao diện chương trình 31 Mô tả họat động chương trình - Menu quản lý Book, Category, Language: Người quản trị click vào chức Book, Category, Language menu bật cửa sổ cho phép quản lý thông tin chức tương ứng - Trên hình cho phép người quản trị tìm kiếm thông tin truyện cần tìm, ví dụ tìm kiếm truyện có giá cao nhất, lượng like nhiều nhất… - Người quản trị nhập vào số top-k kết cần trả ra, lựa chọn tiêu chí tìm kiếm: giá cao nhất, lượng comment nhiều nhất…, chọn thuật toán dùng để thực truy vấn click vào button Result để chương trình trả kết cần tìm - Sử dụng tìm kiếm Full-text: người quản trị nhập từ nào, có dấu hay dấu, nội dung câu truyện chương trình xử lý Full-text trả danh sách kết thỏa mãn yêu cầu - Kết chương trình hiển thị kết subsystem, với tiêu chí tìm kiếm kết trả hiển thị danh sách truyện xếp subsystem kết top-k cuối hiển thị danh sách kết Với tiêu chí tìm kiếm kết trả hiển thị danh sách truyện xếp subsytem kết top-k cuối hiển thị danh sách kết - Mỗi lần chạy thuật toán có thời gian tính xem thuật toán thực xong, thể bảng Time process 3.3 Thử nghiệm Thử nghiệm môi trường C#2012 SQL Server2008 Ví dụ 7: So sánh thời gian thực truy vấn top-k thuật toán TA, TPUT, TPOR Đưa top-10 truyện cười có tên truyện “art”, có giá thấp nhất, lượng like thấp lượng comment thấp 32 - Trong yêu cầu đưa tìm kiếm full-text truyện có tên “art” tiêu chí tìm kiếm: giá thấp nhất, lượng like thấp lượng comment thấp Với tiêu chí có câu truy vấn tương ứng order by theo tiêu chí Kết có subsystem tương ứng Bảng result bảng kết trả top-10 truyện cười tổng số 1000 truyện thỏa mãn yêu cầu Kết có dựa thuật toán TA lập trình ứng dụng truyện cười JokSystem Bảng time process bảng thời gian thực thuật toán TA Truy vấn top-10 chạy thời gian 0,100s 33 Kết có dựa thuật toán TPUT lập trình ứng dụng truyện cười JokSystem Bảng time process bảng thời gian thực thuật toán TPUT Truy vấn top-10 chạy thời gian 0,282s 34 Kết có dựa thuật toán TPOR lập trình ứng dụng truyện cười JokSystem Bảng time process bảng thời gian thực thuật toán TPOR Truy vấn top-10 chạy thời gian 0,323s 35 Chương KẾT LUẬN 4.1 Tóm tắt kết Luận văn qua trình tìm hiểu hiểu truy vấn top-k kỹ thuật xử lý thuật toán top-k - Đánh giá thời gian thực thuật toán - Xây dựng ứng dụng Truyện cười, tìm kiếm truyện theo Full-text áp dụng thuật toán TA[1][3], TPUT[3], TPOR[3] ứng dụng - Truy vấn top-k truy vấn quan trọng thao tác xử lý liệu với số lượng lớn 4.2 Hướng phát triển Sau kết thúc trình tìm hiều, trình làm luận văn, dựa kiến thức thu được, kết chạy ứng dụng Tôi thấy truy vấn top-k truy vấn quan trọng thao tác xử lý liệu với số lượng lớn Tôi áp dụng kết luận văn để áp dụng vào môi trường thực tế công ty 36 TÀI LIỆU THAM KHẢO [1] Hailing Yu, Hua-Gang Li, Ping Wu, Divyakant Agrawal, Amr El Abbadi Efficient Processing of Distributed Top-k Queries 2005 Department of Computer Science University of California, Santa Barbara, 93106, USA [2] Ihab F Ilyas, George Beskales, Mohamed A Soliman A survey of top-k query processing techniques in relational database systems 2008 ACM Computing Surveys, Vol 40, No 4, Article 11 [3] Pei Cao, Zhe Wang Efficient Top-K Query Calculation in Distributed Networks 2004 Department of Computer Science Princeton University Princeton [4] Reza Akbarinia, Esther Pacitti, Patrick Valduriez Best Position Algorithms for Top-k Queries 2007 Atlas team, LINA and INRIA University of Nantes, France 37 ... tiếng việt có dấu không dấu Tìm kiếm Full-text không tìm kiếm like, Full-text tìm kiếm dựa mục (index), không tìm trang câu truyện mà tìm trang index câu truyện Tìm kiếm Full-text cho phép lọc... đề tài - Tìm hiểu truy vấn top-k số thuật toán top-k Phân tích so sánh thời gian thực thuật toán - Xây dựng ứng dụng thử nghiệm áp dụng truy vấn top-k với tìm kiếm full-text trường liệu văn 1.3... đọc máy Bảng Book xét Full-text cho trường: tên truyện, miêu tả, tác giả, ngôn ngữ, từ khóa, nội dung truyện Người dùng tìm kiếm truyện, nội dung truyện cách nhanh chóng hiệu Có thể tìm kiếm tiếng

Ngày đăng: 25/07/2017, 21:54

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w