Nghiên cứu kĩ thuật so sánh truy vấn để gợI ý tìm kiếm thông tin cho thanh thiếu niên và thử nghiệm Nghiên cứu kĩ thuật so sánh truy vấn để gợI ý tìm kiếm thông tin cho thanh thiếu niên và thử nghiệm Nghiên cứu kĩ thuật so sánh truy vấn để gợI ý tìm kiếm thông tin cho thanh thiếu niên và thử nghiệm luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Đinh Thị Thanh Loan NGHIÊN CỨU KĨ THUẬT SO SÁNH TRUY VẤN ĐỂ GỢI Ý TÌM KIẾM THƠNG TIN CHO THANH THIẾU NIÊN VÀ THỬ NGHIỆM CHUYÊN NGÀNH: KỸ THUẬT PHẦN MỀM MÃ SỐ: 60480103 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS TS HÀ QUANG THỤY Hà Nội - 2016 LỜI CAM ĐOAN Tôi xin cam đoan luận văn công trình nghiên cứu riêng cá nhân tơi, khơng chép ai, tự nghiên cứu, đọc, dịch tài liệu, tổng hợp thực Trong luận văn, việc sử dụng nội dung cơng trình nghiên cứu ngƣời khác đƣợc dẫn tƣờng minh từ tài liệu tham khảo Các số liệu, chƣơng trình phần mềm kết luận văn trung thực chƣa đƣợc công bố cơng trình khác Hà Nội, tháng 10 năm 2016 Học viên thực Đinh Thị Thanh Loan LỜI CẢM ƠN Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến PGS.TS Hà Quang Thụy ngƣời tận tình hƣớng dẫn, bảo, giúp đỡ em suốt trình làm luận văn Em xin gửi lời cảm ơn đến các thầy cô Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội truyền đạt kiến thức giúp đỡ em suốt q trình học Tơi xin gửi lời cảm ơn tới Ban Giám Hiệu trƣờng THPT Đại Mỗ tạo điều kiện thuận lợi cho tham gia khóa học suốt q trình hồn thành luận văn Và cuối xin gửi lời cảm ơn tới đồng nghiệp, gia đình bạn bè ngƣời ủng hộ, động viên tạo điều kiện giúp đỡ để tơi có đƣợc kết nhƣ ngày hôm Hà Nội, tháng 10 năm 2016 Học viên Đinh Thị Thanh Loan MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC CÁC HÌNH VẼ TRONG LUẬN VĂN CÁC BẢNG BIỂU TRONG LUẬN VĂN CHÚ THÍCH VIẾT TẮT THUẬT NGỮ TIẾNG ANH MỞ ĐẦU………………………………………………………………………9 Chƣơng G I 1.1 TRUY VẤN CHO THANH THIẾU NI N 10 Giới thiệu chung an toàn Internet thiếu niên 10 1.1.1 Ảnh hƣởng Internet giới trẻ 10 1.1.2 Biện pháp an toàn Internet thiếu niên 10 1.2 1.2.1 Gợi truy vấn cho thiếu niên 13 ngh a gợi truy vấn cho thiếu niên 13 1.2.2 Gợi truy vấn cho thiếu niên số ài toán liên quan 14 1.2.3 Một số k thuật gợi truy vấn cho thiếu niên 15 1.3 Bài toán gợi truy vấn ằng k thuật so sánh câu truy vấn 17 Chƣơng MỘT SỐ THUẬT G I TRUY VẤN CHO THANH THIẾU NIÊN 18 2.1 Gợi truy vấn ằng “đi ngẫu nhiên” 18 2.1.1 Cách tiếp cận 18 2.1.2 Xếp hạng thẻ 18 2.1.3 Phƣơng pháp 18 2.1.4 Nhận x t 23 2.2 thuật gợi truy vấn ằng so sánh truy vấn QS 23 2.2.1 Cách tiếp cận 23 2.2.2 Nội dung phƣơng pháp 25 2.2.3 Nhận x t 33 2.3 Tính tƣơng tự truy vấn 33 2.3.1 Cách tiếp cận 33 2.3.2 Các phƣơng pháp tính độ tƣơng tự 34 2.4 tƣởng giải pháp gợi truy vấn cho thiếu niên 38 Chƣơng MỘT M HÌNH G I TRUY VẤN CHO THANH THIẾU NI N 40 3.1 Giới thiệu 40 3.2 Mơ hình 40 3.3 Các thành phần mơ hình 41 Chƣơng THỰC NGHIỆM VÀ ĐÁNH GIÁ 44 4.1 Đặt vấn đề 44 4.2 Thi hành mơ hình Phần mềm phần cứng 44 4.3 Dữ liệu trình thực nghiệm 44 4.3.1 Dữ liệu 44 4.3.2 Quá trình thực 44 4.4 ết thực nghiệm đánh giá 46 4.4.1 Giao diện chƣơng trình tính độ tƣơng tự 46 4.4.2 Đánh giá 47 4.4.3 ết trả từ máy tìm kiếm Google sau truy vấn 48 ẾT LUẬN 53 TÀI LIỆU THAM HẢO 54 CÁC HÌNH VẼ TRONG LUẬN VĂN Ví dụ gợi ý truy vấn cơng cụ tìm kiếm google 14 Gợi ý trực quan gợi ý dạng text 15 Ví dụ gợi ý trực quan … 16 Ví dụ gợi ý dạng text 16 Mơ hình gợi ý truy vấn 25 Mơ hình đề xuất so sánh truy vấn 41 Tìm kiếm với câu truy vấn 48 Tìm kiếm với câu truy vấn 49 Tìm kiếm với câu truy vấn tổng hợp 49 Tìm kiếm với câu truy vấn 50 Tìm kiếm với câu truy vấn 51 Tìm kiếm với câu truy tổng hợp 52 CÁC BẢNG BIỂU TRONG LUẬN VĂN Bảng 2.1 Sắp xếp số truy vấn ứng viên 31 Bảng 2.2 Sắp xếp số gợi ý truy vấn 31 Bảng 4.1 Kết tính độ tƣơng tự truy vấn 45 Bảng 4.2 Bảng phân loại đánh giá 48 CHÚ THÍCH VIẾT TẮT THUẬT NGỮ TIẾNG ANH OFSD Online frequent sequence discovery P2R Page rank reviser VSM Vector space model SBM Standard boolean model SE Search engine MỞ ĐẦU Trong ối cảnh lƣợng thông tin Internet ngày lớn cập nhật gần tức thời nhƣ ngƣời dùng, đặc iệt thiếu niên, cơng cụ tìm kiếm thơng tin họ cần cách hiệu ngày trở nên cần thiết Thanh thiếu niên gặp khó khăn xây dựng truy vấn tìm kiếm lựa chọn loại chủ đề có liên quan, ởi kiến thức miền thiếu niên nhƣ vốn từ vựng chƣa thật phát triển so với ngƣời trƣởng thành Một khía cạnh khác, thiếu niên gặp khó khăn đánh giá liên quan kết tìm kiếm Để hỗ trợ thiếu niên việc tìm kiếm thơng tin thực hiệu quả, hệ thống tìm kiếm cần phải đƣợc thiết kế cho việc hỗ trợ phù hợp với nhu cầu lực nhận thức tuổi trẻ Luận văn đề cập tới nội dung nghiên cứu gợi truy vấn thông tin phù hợp với thiếu niên thử nghiệm ứng dụng nghiên cứu Luận văn tập trung vào phƣơng pháp k thuật gợi truy vấn nhƣ random walk ngh a “đi cách ngẫu nhiên”, sử dụng từ gốc tiếng Anh “random walk” luận văn [1], so sánh câu truy vấn [7] cho phù hợp với nhu cầu lực nhận thức thiếu niên, hỗ trợ họ tìm kiếm thơng tin hiệu Luận văn thực khảo sát, nghiên cứu phƣơng pháp tính độ tƣơng tự truy vấn hệ tìm kiếm nhƣ phƣơng pháp dựa từ vựng [16] phƣơng pháp dựa nhật k truy vấn [18] Từ đƣa hƣớng phát triển cho phƣơng pháp tính độ tƣơng tự truy vấn phù hợp để áp dụng thử nghiệm vào hệ tìm kiếm cho thiếu niên Chƣơng GỢI Ý TRUY VẤN CHO THANH THIẾU NIÊN 1.1 Giới thi u chung an toàn Internet thiếu niên 1.1.1 Ảnh hƣởng Internet giới trẻ Theo áo cáo khảo sát LSE Research Online năm 2010 [8], 25 quốc gia châu Âu có đến 93% thiếu niên sử dụng Internet năm 60% lên mạng ngày, 80% thiếu niên sử dụng Internet có độ tuổi từ 15-16 Cũng theo áo cáo, 85% thiếu niên sử dụng Internet trƣờng học, 83% sử dụng trò chơi, 62% đọc tin tức 62%, 16% dùng website chia sẻ liệu 11% sử dụng blog Khảo sát tập trung vào chủ đề nhƣ trấn lột, nội dung khiêu dâm, thơng tin tình dục, giao lƣu hẹn hị trực tuyến chủ đề có khả ảnh hƣởng gây hại đến thiếu niên Đối tƣợng thiếu niên ln có xu hƣớng thiếu k độ tự tin truy cập mạng Internet Tuy nhiên, hầu hết trẻ từ 11-16 tuổi ngăn chặn từ chối tới ngƣời mà chúng khơng muốn liên lạc 64% tìm lời khun an tồn trực tuyến 64% hoảng nửa thay đổi cài đặt riêng tƣ hồ sơ trang mạng xã hội mà tham gia (56%), ngăn chặn thƣ rác (51%) Sách trắng Công nghệ Thông tin Việt Nam năm 20141 cho iết, vào năm 2013, số ngƣời Việt Nam sử dụng Internet lên tới 33 triệu 191 nghìn ngƣời, chiếm tỷ lệ 37,00% dân số doanh thu dịch vụ Internet đạt 965 triệu đô la M Đối tƣợng sử dụng internet chủ yếu giới trẻ với độ tuổi từ 15 đến 24, phần chủ yếu đối tƣợng thiếu niên Ngày nay, với phát triển gia tăng đến cấp số nhân dịng điện thoại thơng minh ngƣời sử dụng để truy cập Internet, mà phần lớn thiếu niên, nguy độc hại đối tƣợng lại cao [10] Ngoài việc tham gia vào hoạt động xã hội, thể ản thân, học tập quản l sống hàng ngày trở nên dễ dàng nguy tiếp xúc trực tiếp với loại thông tin độc hại tạo thách thức an toàn trực tuyến cho trẻ em, chẳng hạn nhƣ rủi ro liên quan đến dịch vụ định vị theo dõi 1.1.2 Biện pháp an toàn Internet thiếu niên http://www.mediafire.com/view/6606y4bt1yju6wc/SachTrang2014.pdf 10 Bước 3: Đánh trọng số cho liên kết tƣơng ứng với truy vấn o Đặt {x1, x2, x3, , xn} tập trọng số Trong đó, xi trọng số liên kết thứ i mà ngƣời dùng lựa chọn mở cho truy vấn {x1, x2, x3, , xn} ộ trọng số chung cho link tất truy vấn ộ liệu Bước 4: Tính độ tƣơng tự o So sánh liên kết đƣợc lựa chọn, sử dụng nguyên lý: Sử dụng “surface representation” để so câu truy vấn Câu có độ xác cao đƣợc chọn để tìm độ liên kết câu truy vấn so sánh nguyên l Những truy vấn đƣợc ngƣời dùng chọn mở liên kết truy vấn tƣơng tự o Sử dụng công thức sim result Qi , Q j (x i xj) MaxN U Qi , N U Qj ( 3.1) Trong đó: Qi Qj hai câu truy vấn Sim-result(Qi,Qj): độ tƣơng tự truy vấn hai câu truy vấn Qi Qj xi, xj trọng số link chung tƣơng ứng thuộc hai câu truy vấn Qi Qj N(U(Qi)): Số lƣợng liên kết đƣợc lựa chọn tƣơng ứng với câu truy vấn Qi 42 N(U(Qj)): Số lƣợng liên kết đƣợc lựa chọn tƣơng ứng với câu truy vấn Qj Từ sở l thuyết trình ày chƣơng trƣớc, luận văn tiến hành thực nghiệm tính độ tƣơng tự câu truy vấn dựa phƣơng pháp sử dụng lƣu vết truy vấn máy tìm kiếm đồng thời đề xuất số cải tiến phƣơng pháp chọn Luận văn sử dụng liệu lƣu vết truy vấn tìm kiếm máy tìm kiếm Google, tiến hành cài đặt chƣơng trình tính độ tƣơng tự câu truy vấn theo mơ hình đề xuất chƣơng 3, gồm chức chính: xử l liệu, tính độ tƣơng tự truy vấn theo công thức 2.19 với cải tiến việc đƣa thêm giá trị trọng số cho liên kết we , sau lựa chọn số truy vấn điển hình để tiến hành đánh giá Nội dung thực nghiệm đƣợc trình ày dƣới 43 Chƣơng THỰC NGHIỆM VÀ ĐÁNH GIÁ 4.1 Đặt vấn đề Do hạn chế mặt thời gian, việc thực nghiệm mơ hình gợi phức tạp, nên luận văn thực nghiệm phần luận văn tính tƣơng tự 10 cặp truy vấn Sau dùng cơng cụ tìm kiếm google tiếng Việt để chạy thử nghiệm truy vấn 4.2 Thi hành mơ hình (Phần mềm phần cứng) Cấu hình phần cứng • CPU: Intel core Duo T8300 • Cache: 2.4Ghz • Ram: 4G • Hệ điều hành: Window • Bộ nhớ ngồi: 250G Cơng cụ phần mềm sử dụng • Visual Studio 2013 • Mơi trƣờng Net Framwork 4.1 • Ngơn ngữ lập trình C# Phần mềm ài tốn ao gồm thành phần • Chƣơng trình xử l gồm mơ đun: Tiền xử l liệu loại ỏ truy vấn dài, ngắn, tập truy vấn an đầu ; • Mơ đun tính tốn độ tƣơng tự câu truy vấn: Similarity, dùng để tính độ tƣơng tự theo từ vựng • Mơ đun hiển thị kết danh sách gợi truy vấn cho ngƣời dùng 4.3 Dữ li u trình thực nghi m 4.3.1 Dữ liệu Dữ liệu ao gồm Câu truy vấn thử nghiệm đƣợc kết hợp với việc sử dụng ộ userlog cơng cụ tìm kiếm trang CocCoc số lƣợt truy vấn ngƣời dùng số trƣờng Trung học phổ thơng Vệt Nam 4.3.2 Q trình thực 44 Tiền xử l : o Xóa ỏ câu truy vấn không lành mạnh o Lƣợc ỏ câu truy vấn với lựa chọn liên kết trùng o Định dạng lại liệu dạng: “truy vấn” link1 link2 … Kết quả: Đƣợc danh sách câu truy vấn với liên kết đƣợc lựa chọn tƣơng ứng Tính độ tƣơng tự Sử dụng mơ hình tính độ tƣơng tự trình ày trên, việc tính độ tƣơng tự có hai cơng đoạn tính độ tƣơng tự từ vựng đề tìm câu truy vấn lịch sử truy vấn có độ tƣơng tự cao Sau lấy trọng số liên kết câu truy vấn để so sánh với danh sách trọng số câu truy vấn lại ết đạt đƣợc nhƣ sau Sau trình thực nghiệm, luận văn thực tính tốn với ộ trọng số {x1, x2, …, xn} khác thấy ộ trọng số {0 9, 85, 1, 1.05, 1, , 1} đạt kết tốt ết thu đƣợc lấy 10 kết với ngƣỡng đƣa 0.39 STT Truy vấn | | truy vấn Độ tƣơng tự LTV | | Trƣờng THPT Lƣơng Thế Vinh 0.95 Toán | | Giải toán mạng 0.85 Nghe nhạc | | nhạc online 0.9 thi thpt 2016 | | ỳ thi THPT Quốc gia năm 2016 0.9 nghe nhạc online | |mp3 trực tuyến 0.70000066 Truyện tranh đẹp | | hình ảnh đẹp 0.38249998 cách học văn hay | | nguyễn ngọc ngạn 0.49249998 tro choi trang diem | | game vui thoi trang 0.41249998 tro choi trang diem | | tro choi mien phi 0.44249998 10 Hoa học trò | | báo niên 0.39 Bảng 4.1 Kết tính độ tương tự truy vấn 45 4.4 Kết thực nghi m đánh giá 4.4.1 Giao diện chƣơng trình tính độ tƣơng tự 1- Chƣơng trình so sánh câu truy vấn: Trường THPT Lương Thế Vinh Trường THPT Lương Thế Vinh 2- Chƣơng trình so sanh câu truy vấn Trường THPT Lương Thế Vinh Trường Lương Thế Vinh 46 4.4.2 Đánh giá Do việc tính tốn định lƣợng để đánh giá tính xác việc tính độ tƣơng tự câu hỏi khó khăn, nên ngƣời ta sử dụng phƣơng pháp đánh giá định tính dựa vào ngƣời/chuyên gia để đánh giá Luận văn sử dụng phƣơng pháp đánh giá dựa vào ngƣời để đánh giá việc tính tốn độ tƣơng tự câu truy vấn thực nghiệm 47 Sử dụng ảng đánh giá phân loại nhƣ sau: Phân loại Mơ tả Ví dụ Rất tốt Hai câu truy vấn có tƣơng đƣơng ngữ LTV || Trường ngh a THPT Lương Thế Vinh Tốt Hai câu truy vấn có chung mục thi thpt 2016 || Kỳ đích truy vấn, độ dài ngắn mô tả thi THPT Quốc khác Ngƣời sử dụng muốn nói đến gia năm 2016 đƣa vào truy vấn há tốt Hai câu truy vấn có mục đích truy nghe nhạc online vấn, nhƣng liên quan không rõ ràng || mp3 trực tuyến hông tốt Hai câu truy vấn không liên quan đến Hoa học trò || báo niên Bảng 4.2 Bảng phân loại đánh giá 4.4.3 ết trả từ máy tìm kiếm Google sau truy vấn Với câu truy vấn: LTV | | Trường THPT Lương Thế Vinh Hình 4.1 Tìm kiếm với câu truy vấn 48 Hình 4.2 Tìm kiếm với câu truy vấn Hình 4.3 Tìm kiếm với câu truy vấn tổng hợp 49 Với câu truy vấn: Toán | | Giải toán mạng Hình 4.4 Tìm kiếm với câu truy vấn 50 Hình 4.5 Tìm kiếm với câu truy vấn 51 Hình 4.6 Tìm kiếm với câu truy vấn tổng hợp 52 KẾT LUẬN Luận văn định hƣớng chủ đề gợi niên ết luận văn là: - Cung cấp khảo sát gợi thiếu niên truy vấn Internet thiếu truy vấn tìm kiếm Internet - Trình bày hai k thuật gợi truy vấn ƣớc ngẫu nhiên random walk) k thuật so sánh câu truy vấn Nghiên cứu phƣơng pháp thống kê phƣơng pháp sử dụng lƣu vết truy vấn cho ài tốn tính độ tƣơng tự câu truy vấn máy tìm kiếm - Đề xuất mơ hình gợi truy vấn cho đối tƣợng thiếu niên dựa việc kết hợp k thuật gợi truy vấn so sánh tính độ tƣơng tự câu truy vấn sử dụng lƣu vết truy vấn Trong mơ hình, luận văn đƣa thêm giá trị trọng số cho liên kết we để nâng cao độ xác kết trả - Xây dựng phần mềm thực nghiệm thi hành mơ hình đề xuất, thực thi việc tính đốn độ tƣơng tự câu truy vấn ết đánh giá định tính 10 cặp câu truy vấn tƣơng tự cho kết trả phù hợp Do hạn chế trình độ thời gian, luận văn chƣa tiến hành thử nghiệm trọn vẹn đƣợc mơ hình đề xuất mà số thành phần mơ hình phân tích dạng định tính Hơn nữa, mơ hình chƣa đƣợc tích hợp vào trang we Trƣờng THPT Đại Mỗ Đấy hƣớng nghiên cứu luận văn 53 TÀI LIỆU THAM KHẢO [1] Sergio Duarte Torres, Djoerd Hiemstra, Ingmar Weber, Pavel Serdyukov Query recommendation for children CIKM 2012: 2010-2014, 2012 [2] Sergio Duarte Torres, Djoerd Hiemstra, Theo W C Huibers Vertical selection in the information domain of children JCDL 2013: 57-66, 2013 [3] Sergio Duarte Torres, Djoerd Hiemstra, Ingmar Weber, Pavel Serdyukov Query recommendation in the information domain of children JASIST 65(7): 13681384, 2014 [4] Sergio Raúl Duarte Torres Information Retrieval for Children: Search Behavior and Solutions PhD Thesis, University of Twentee, [5] Meher T Shaikh, Maria Soledad Pera, Yiu-Kai Ng Suggesting Simple and Comprehensive Queries to Elementary-Grade Children WI-IAT (1) 2015: 252259 [6] Shahrzad Karimi, Maria Soledad Pera Recommendations to Enhance Children Web Searches RecSys Posters 2015 [7] I Bahattin Vidinli, Rifat Ozcan New query suggestion framework and algorithms: A case study for an educational search engine Information Processing and Management, 2016 [8] Livingstone, Sonia and Haddon, Leslie and Gưrzig, Anke and Ĩlafsson, Kjartan Risks and safety on the internet: the perspective of European children: full findings and policy implications from the EU Kids Online survey of 9-16 year olds and their parents in 25 countries EU Kids Online, Deliverable D4, 2011 [9] Dinh, Thuy, Farrugia, Lorleen, O'Neill, Brian, Vandoninck, Sofie and Velicu, Anca (2016) Internet safety helplines: exploratory study first findings Better Internet for Kids [10] Mascheroni, G and Haddon, L (2015) Children, risks and the mobile internet In Y Zheng (Ed.), Encyclopedia of Mobile Phone Behavior (pp.1409-1418) Hershey PA: IGI Global [11] https://www.betterinternetforkids.eu/ [12] Christopher D Manning, Prabhakar Raghvan, Hinrich Schutze, An introduction to Information Retrieval, 2009 [13] Manu Konchady, Building search applications – Lucene, LingPipe, and Gate, Mustru Publishing, 2008 [14] Ziming Zhuang, Silviu Cucerzan, Q-rank: re-ranking search results using query logs 54 [15] IR-models, http://en.wikipedia.org/wiki/Information_retrieval [16] Donald Metzler, Susan T Dumais, Christopher Meek (2007) Similarity Measures for Short Segments of Text, ECIR 2007: 16-27 [17] Fu, L., Goh, H L., Foo, S B., & Na, J C (2003) Collaborative querying through a hybrid query clustering approach Conference on Asian Digital Libraries (6th:2003:Malaysia) [18] Ji-Rong Wen, Jian – Yun Nie, Hong-Jiang Zhang (2002), Query Clustering Using User Logs, ACM Transactions on Information Systems, Vol 20, No 1, January 2002 [19] Ricardo Baeza-Yates, Carlos Hurtado, Marcelo Mendoza (2004), Query Recommendation Using Query Logs in Search Engines, In Current Trends in Database Technology - EDBT 2004 Workshops, Vol 3268/2004 (18 November 2004), pp 588-596 [20] Siddharth Patwardhan (2003) Incorporating Dictionary and Corpus Information into a Context Vector Measure of Semantic Relatedness MSc Thesis, University of Minnesota, Duluth, MN [21] Wen-tau Yih, Christopher Meek (2007) Improving Similarity Measures for Short Segments of Text Microsoft Research One Microsoft Way Redmond, WA 98052, USA, 2007, pp 1489-1494 [22] Wesley W Chu, Guogen Zhang (1997) Associative query answering via query feature similarity, Intelligent Information Systems (IIS '97): 405-409 [24] Phan Xuân Hiếu JGibbsLDA http://gibbslda.sourceforge.net/, School of Information Sciences Tohoku University [25] http:// coccoc.com /users/home [26] Nguyễn Thị Thu Chung Nghiên cứu, phát triển phương pháp tính độ tương tự truy vấn hệ tìm kiếm ứng dụng thử nghiệm vào hệ tìm kiếm thực thể tiếng Việt Luận văn Thạc s , Trƣờng Đại học Công nghệ, ĐHQGHN, 2011 55 56 ... thuật so sánh truy vấn 1.3 Bài toán gợi ý truy vấn kỹ thuật so sánh câu truy vấn Các vấn đề gợi ý truy vấn (Query suggestion: QS) nên nghĩ đơn giản "một chuỗi so sánh hai câu truy vấn" [7] Truy vấn. .. tƣợng thiếu niên việc tìm kiếm khai phá thông tin mạng Internet 12 1.2 Gợi ý truy vấn cho thiếu niên 1.2.1 ngh a gợi truy vấn cho thiếu niên Đối tƣợng thiếu niên thƣờng xun sử dụng cơng cụ tìm kiếm. .. thuật gợi truy vấn cho thiếu niên 15 1.3 Bài toán gợi truy vấn ằng k thuật so sánh câu truy vấn 17 Chƣơng MỘT SỐ THUẬT G I TRUY VẤN CHO THANH THIẾU NIÊN 18 2.1 Gợi truy vấn ằng