Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 56 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
56
Dung lượng
1,38 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Đinh Thị Thanh Loan NGHIÊNCỨUKĨTHUẬTSOSÁNHTRUYVẤNĐỂGỢIÝTÌMKIẾMTHƠNGTINCHOTHANHTHIẾUNIÊNVÀTHỬNGHIỆM CHUYÊN NGÀNH: KỸ THUẬT PHẦN MỀM MÃ SỐ: 60480103 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNGTIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS TS HÀ QUANG THỤY Hà Nội - 2016 LỜI CAM ĐOAN Tôi xin cam đoan luận văn công trình nghiêncứu riêng cá nhân tơi, khơng chép ai, tự nghiên cứu, đọc, dịch tài liệu, tổng hợp thực Trong luận văn, việc sử dụng nội dung cơng trình nghiêncứu ngƣời khác đƣợc dẫn tƣờng minh từ tài liệu tham khảo Các số liệu, chƣơng trình phần mềm kết luận văn trung thực chƣa đƣợc công bố cơng trình khác Hà Nội, tháng 10 năm 2016 Học viên thực Đinh Thị Thanh Loan LỜI CẢM ƠN Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến PGS.TS Hà Quang Thụy ngƣời tận tình hƣớng dẫn, bảo, giúp đỡ em suốt trình làm luận văn Em xin gửi lời cảm ơn đến các thầy cô Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội truyền đạt kiến thức giúp đỡ em suốt q trình học Tơi xin gửi lời cảm ơn tới Ban Giám Hiệu trƣờng THPT Đại Mỗ tạo điều kiện thuận lợi cho tham gia khóa học suốt q trình hồn thành luận vănVà cuối xin gửi lời cảm ơn tới đồng nghiệp, gia đình bạn bè ngƣời ủng hộ, động viên tạo điều kiện giúp đỡ để tơi có đƣợc kết nhƣ ngày hôm Hà Nội, tháng 10 năm 2016 Học viên Đinh Thị Thanh Loan MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN .3 MỤC LỤC CÁC HÌNH VẼ TRONG LUẬN VĂN .6 CÁC BẢNG BIỂU TRONG LUẬN VĂN CHÚ THÍCH VIẾT TẮT THUẬT NGỮ TIẾNG ANH MỞ ĐẦU ………………………………………………………………………9 Chƣơng G I 1.1 TRUYVẤNCHOTHANHTHIẾU NI N 10 Giới thiệu chung an toàn Internet thiếuniên 10 1.1.1 Ảnh hƣởng Internet giới trẻ 10 1.1.2 Biện pháp an toàn Internet thiếuniên 10 1.2 1.2.1 Gợitruyvấnchothiếuniên 13 ngh a gợitruyvấnchothiếuniên 13 1.2.2 Gợitruyvấnchothiếuniênsố ài toán liên quan 14 1.2.3 Một số k thuậtgợitruyvấnchothiếuniên 15 1.3 Bài toán gợitruyvấn ằng k thuậtsosánh câu truyvấn .17 Chƣơng MỘT SỐTHUẬT G I TRUYVẤNCHOTHANHTHIẾUNIÊN 18 2.1 Gợitruyvấn ằng “đi ngẫu nhiên” 18 2.1.1 Cách tiếp cận 18 2.1.2 Xếp hạng thẻ 18 2.1.3 Phƣơng pháp 18 2.1.4 Nhận x t 23 2.2 thuậtgợitruyvấn ằng sosánhtruyvấn QS 23 2.2.1 Cách tiếp cận 23 2.2.2 Nội dung phƣơng pháp 25 2.2.3 Nhận x t 33 2.3 Tính tƣơng tự truyvấn .33 2.3.1 Cách tiếp cận 33 2.3.2 Các phƣơng pháp tính độ tƣơng tự 34 2.4 tƣởng giải pháp gợitruyvấnchothiếuniên .38 Chƣơng MỘT M 40 HÌNH G I TRUYVẤNCHOTHANHTHIẾU NI N 3.1 Giới thiệu 40 3.2 Mơ hình .40 3.3 Các thành phần mơ hình .41 Chƣơng THỰC NGHIỆMVÀ ĐÁNH GIÁ 44 4.1 Đặt vấnđề 44 4.2 Thi hành mơ hình Phần mềm phần cứng .44 4.3 Dữ liệu trình thực nghiệm 44 4.3.1 Dữ liệu 44 4.3.2 Quá trình thực 44 4.4 ết thực nghiệm đánh giá 46 4.4.1 Giao diện chƣơng trình tính độ tƣơng tự 46 4.4.2 Đánh giá 47 4.4.3 ết trả từ máy tìmkiếm Google sau truyvấn 48 ẾT LUẬN .53 TÀI LIỆU THAM HẢO 54 CÁC HÌNH VẼ TRONG LUẬN VĂN Ví dụ gợiýtruyvấn cơng cụ tìmkiếm google 14 Gợiý trực quan gợiý dạng text 15 Ví dụ gợiý trực quan … 16 Ví dụ gợiý dạng text 16 Mơ hình gợiýtruyvấn 25 Mô hình đề xuất sosánhtruyvấn 41 Tìmkiếm với câu truyvấn 48 Tìmkiếm với câu truyvấn 49 Tìmkiếm với câu truyvấn tổng hợp 49 Tìmkiếm với câu truyvấn 50 Tìmkiếm với câu truyvấn 51 Tìmkiếm với câu truy tổng hợp 52 CÁC BẢNG BIỂU TRONG LUẬN VĂN Bảng 2.1 Sắp xếp sốtruyvấn ứng viên 31 Bảng 2.2 Sắp xếp sốgợiýtruyvấn 31 Bảng 4.1 Kết tính độ tƣơng tự truyvấn 45 Bảng 4.2 Bảng phân loại đánh giá 48 CHÚ THÍCH VIẾT TẮT THUẬT NGỮ TIẾNG ANH OFSD Online frequent sequence discovery P2R Page rank reviser VSM Vector space model SBM Standard boolean model SE Search engine MỞ ĐẦU Trong ối cảnh lƣợng thôngtin Internet ngày lớn cập nhật gần tức thời nhƣ ngƣời dùng, đặc iệt thiếu niên, cơng cụ tìmkiếmthôngtin họ cần cách hiệu ngày trở nên cần thiết Thanhthiếuniên gặp khó khăn xây dựng truyvấntìmkiếm lựa chọn loại chủ đề có liên quan, ởi kiến thức miền thiếuniên nhƣ vốn từ vựng chƣa thật phát triển so với ngƣời trƣởng thành Một khía cạnh khác, thiếuniên gặp khó khăn đánh giá liên quan kết tìmkiếmĐể hỗ trợ thiếuniên việc tìmkiếmthơngtin thực hiệu quả, hệ thốngtìmkiếm cần phải đƣợc thiết kế cho việc hỗ trợ phù hợp với nhu cầu lực nhận thức tuổi trẻ Luận vănđề cập tới nội dung nghiêncứugợitruyvấnthôngtin phù hợp với thiếuniênthửnghiệm ứng dụng nghiêncứu Luận văn tập trung vào phƣơng pháp k thuậtgợitruyvấn nhƣ random walk ngh a “đi cách ngẫu nhiên”, sử dụng từ gốc tiếng Anh “random walk” luận văn [1], sosánh câu truyvấn [7] cho phù hợp với nhu cầu lực nhận thức thiếu niên, hỗ trợ họ tìmkiếmthơngtin hiệu Luận văn thực khảo sát, nghiêncứu phƣơng pháp tính độ tƣơng tự truyvấn hệ tìmkiếm nhƣ phƣơng pháp dựa từ vựng [16] phƣơng pháp dựa nhật k truyvấn [18] Từ đƣa hƣớng phát triển cho phƣơng pháp tính độ tƣơng tự truyvấn phù hợp để áp dụng thửnghiệm vào hệ tìmkiếmchothiếuniên Chƣơng GỢIÝTRUYVẤNCHOTHANHTHIẾUNIÊN 1.1 Giới thi u chung an toàn Internet thiếuniên 1.1.1 Ảnh hƣởng Internet giới trẻ Theo áo cáo khảo sát LSE Research Online năm 2010 [8], 25 quốc gia châu Âu có đến 93% thiếuniên sử dụng Internet năm 60% lên mạng ngày, 80% thiếuniên sử dụng Internet có độ tuổi từ 15-16 Cũng theo áo cáo, 85% thiếuniên sử dụng Internet trƣờng học, 83% sử dụng trò chơi, 62% đọc tin tức 62%, 16% dùng website chia sẻ liệu 11% sử dụng blog Khảo sát tập trung vào chủ đề nhƣ trấn lột, nội dung khiêu dâm, thơngtin tình dục, giao lƣu hẹn hò trực tuyến chủ đề có khả ảnh hƣởng gây hại đến thiếuniên Đối tƣợng thiếuniên ln có xu hƣớng thiếu k độ tự tintruy cập mạng Internet Tuy nhiên, hầu hết trẻ từ 11-16 tuổi ngăn chặn từ chối tới ngƣời mà chúng khơng muốn liên lạc 64% tìm lời khun an tồn trực tuyến 64% hoảng nửa thay đổi cài đặt riêng tƣ hồ sơ trang mạng xã hội mà tham gia (56%), ngăn chặn thƣ rác (51%) Sách trắng Công nghệ Thôngtin Việt Nam năm 2014 cho iết, vào năm 2013, số ngƣời Việt Nam sử dụng Internet lên tới 33 triệu 191 nghìn ngƣời, chiếm tỷ lệ 37,00% dân số doanh thu dịch vụ Internet đạt 965 triệu đô la M Đối tƣợng sử dụng internet chủ yếu giới trẻ với độ tuổi từ 15 đến 24, phần chủ yếu đối tƣợng thiếuniên Ngày nay, với phát triển gia tăng đến cấp số nhân dòng điện thoại thông minh ngƣời sử dụng đểtruy cập Internet, mà phần lớn thiếu niên, nguy độc hại đối tƣợng lại cao [10] Ngoài việc tham gia vào hoạt động xã hội, thể ản thân, học tập quản l sống hàng ngày trở nên dễ dàng nguy tiếp xúc trực tiếp với loại thôngtin độc hại tạo thách thức an toàn trực tuyến cho trẻ em, chẳng hạn nhƣ rủi ro liên quan đến dịch vụ định vị theo dõi 1.1.2 Biện pháp an toàn Internet thiếuniên 1http://www.mediafire.com/view/6606y4bt1yju6wc/SachTrang2014.pdf 10 Bước 3: Đánh trọng sốcho liên kết tƣơng ứng với truyvấn o Đặt {x1, x2, x3, , xn} tập trọng số Trong đó, xi trọng số liên kết thứ i mà ngƣời dùng lựa chọn mở chotruyvấn {x1, x2, x3, , xn} ộ trọng số chung cho link tất truyvấn ộ liệu Bước 4: Tính độ tƣơng tự o Sosánh liên kết đƣợc lựa chọn, sử dụng nguyên lý: Sử dụng “surface representation” đểso câu truyvấn Câu có độ xác cao đƣợc chọn đểtìm độ liên kết câu truyvấnsosánh nguyên l Những truyvấn đƣợc ngƣời dùng chọn mở liên kết truyvấn tƣơng tự o Sử dụng công thức (xi sim resultQ ,Q i j xj) MaxN U Qi , N U Qj ( 3.1) Trong đó: Qi Qj hai câu truyvấn Sim-result(Qi,Qj): độ tƣơng tự truyvấn hai câu truyvấn Qi Qj xi, xj trọng số link chung tƣơng ứng thuộc hai câu truyvấn Qi Qj N(U(Qi)): Số lƣợng liên kết đƣợc lựa chọn tƣơng ứng với câu truyvấn Qi 42 N(U(Qj)): Số lƣợng liên kết đƣợc lựa chọn tƣơng ứng với câu truyvấn Qj Từ sở l thuyết trình ày chƣơng trƣớc, luận văn tiến hành thực nghiệm tính độ tƣơng tự câu truyvấn dựa phƣơng pháp sử dụng lƣu vết truyvấn máy tìmkiếm đồng thời đề xuất số cải tiến phƣơng pháp chọn Luận văn sử dụng liệu lƣu vết truyvấntìmkiếm máy tìmkiếm Google, tiến hành cài đặt chƣơng trình tính độ tƣơng tự câu truyvấn theo mơ hình đề xuất chƣơng 3, gồm chức chính: xử l liệu, tính độ tƣơng tự truyvấn theo công thức 2.19 với cải tiến việc đƣa thêm giá trị trọng sốcho liên kết we , sau lựa chọn sốtruyvấn điển hình để tiến hành đánh giá Nội dung thực nghiệm đƣợc trình ày dƣới 43 Chƣơng THỰC NGHIỆMVÀ ĐÁNH GIÁ 4.1 Đặt vấnđề Do hạn chế mặt thời gian, việc thực nghiệm mơ hình gợi phức tạp, nên luận văn thực nghiệm phần luận văn tính tƣơng tự 10 cặp truyvấn Sau dùng cơng cụ tìmkiếm google tiếng Việt để chạy thửnghiệmtruyvấn 4.2 Thi hành mơ hình (Phần mềm phần cứng) Cấu hình phần cứng • CPU: Intel core Duo T8300 • Cache: 2.4Ghz • Ram: 4G • Hệ điều hành: Window • Bộ nhớ ngồi: 250G Cơng cụ phần mềm sử dụng • Visual Studio 2013 • Mơi trƣờng Net Framwork 4.1 • Ngơn ngữ lập trình C# Phần mềm ài tốn ao gồm thành phần • Chƣơng trình xử l gồm mô đun: Tiền xử l truyvấn dài, ngắn, tập truyvấn an đầu liệu loại ỏ ; • Mơ đun tính tốn độ tƣơng tự câu truy vấn: Similarity, dùng để tính độ tƣơng tự theo từ vựng • Mơ đun hiển thị kết danh sách gợitruyvấncho ngƣời dùng 4.3 Dữ li u trình thực nghi m 4.3.1 Dữ liệu Dữ liệu ao gồm Câu truyvấnthửnghiệm đƣợc kết hợp với việc sử dụng ộ userlog cơng cụ tìmkiếm trang CocCoc số lƣợt truyvấn ngƣời dùng số trƣờng Trung học phổ thông Vệt Nam 4.3.2 Quá trình thực 44 Tiền xử l : o Xóa ỏ câu truyvấn không lành mạnh o Lƣợc ỏ câu truyvấn với lựa chọn liên kết trùng o Định dạng lại liệu dạng: “truy vấn” link1 link2 … Kết quả: Đƣợc danh sách câu truyvấn với liên kết đƣợc lựa chọn tƣơng ứng Tính độ tƣơng tự Sử dụng mơ hình tính độ tƣơng tự trình ày trên, việc tính độ tƣơng tự có hai cơng đoạn tính độ tƣơng tự từ vựng đềtìm câu truyvấn lịch sử truyvấn có độ tƣơng tự cao Sau lấy trọng số liên kết câu truyvấnđểsosánh với danh sách trọng số câu truyvấn lại ết đạt đƣợc nhƣ sau Sau trình thực nghiệm, luận văn thực tính tốn với ộ trọng số {x1, x2, …, xn} khác thấy ộ trọng số {0 9, 85, 1, 1.05, 1, , 1} đạt kết tốt ết thu đƣợc lấy 10 kết với ngƣỡng đƣa 0.39 STT Truyvấn | | truyvấn Độ tƣơng tự LTV | | Trƣờng THPT Lƣơng Thế Vinh 0.95 Toán | | Giải toán mạng 0.85 Nghe nhạc | | nhạc online 0.9 thi thpt 2016 | | ỳ thi THPT Quốc gia năm 2016 0.9 nghe nhạc online | |mp3 trực tuyến 0.70000066 Truyện tranh đẹp | | hình ảnh đẹp 0.38249998 cách học văn hay | | nguyễn ngọc ngạn 0.49249998 tro choi trang diem | | game vui thoi trang 0.41249998 tro choi trang diem | | tro choi mien phi 0.44249998 10 Hoa học trò | | báo niên 0.39 Bảng 4.1 Kết tính độ tương tự truyvấn 45 4.4 Kết thực nghi m đánh giá 4.4.1 Giao diện chƣơng trình tính độ tƣơng tự 1- Chƣơng trình sosánh câu truy vấn: Trường THPT Lương Thế Vinh Trường THPT Lương Thế Vinh 2- Chƣơng trình sosanh câu truyvấn Trường THPT Lương Thế Vinh Trường Lương Thế Vinh 46 4.4.2 Đánh giá Do việc tính tốn định lƣợng để đánh giá tính xác việc tính độ tƣơng tự câu hỏi khó khăn, nên ngƣời ta sử dụng phƣơng pháp đánh giá định tính dựa vào ngƣời/chuyên gia để đánh giá Luận văn sử dụng phƣơng pháp đánh giá dựa vào ngƣời để đánh giá việc tính tốn độ tƣơng tự câu truyvấn thực nghiệm 47 Sử dụng Phân loại ảng đánh giá phân loại nhƣ sau: Mô tả Rất tốt Hai câu truyvấn có tƣơng đƣơng ngữ ngh a Tốt Hai câu truyvấn có chung mục đích truy vấn, độ dài ngắn mơ tả khác Ví dụ LTV || Trường THPT Lương Thế Vinh thi thpt 2016 || Kỳ thi THP Quốc T Ngƣời sử dụng muốn nói đến gia năm 2016 đƣa vào truyvấn há tốt Hai câu truyvấn có mục đích truy vấn, nhƣng liên quan không rõ ràng nghe nhạc online || mp3 trực tuyến hông tốt Hai câu truyvấn khơng liên quan đến Hoa học trò || báo niên Bảng 4.2 Bảng phân loại đánh giá 4.4.3 ết trả từ máy tìmkiếm Google sau truyvấn Với câu truy vấn: LTV | | Trường THPT Lương Thế Vinh Hình 4.1 Tìmkiếm với câu truyvấn 48 Hình 4.2 Tìmkiếm với câu truyvấn Hình 4.3 Tìmkiếm với câu truyvấn tổng hợp 49 Với câu truy vấn: Tốn | | Giải tốn mạng Hình 4.4 Tìmkiếm với câu truyvấn 50 Hình 4.5 Tìmkiếm với câu truyvấn 51 Hình 4.6 Tìmkiếm với câu truyvấn tổng hợp 52 KẾT LUẬN Luận văn định hƣớng chủ đềgợiniên ết luận văn là: - Cung cấp khảo sát gợithiếuniêntruyvấn Internet thiếutruyvấntìmkiếm Internet - Trình bày hai k thuậtgợitruyvấn ƣớc ngẫu nhiên random walk) k thuậtsosánh câu truyvấnNghiêncứu phƣơng pháp thống kê phƣơng pháp sử dụng lƣu vết truyvấncho ài tốn tính độ tƣơng tự câu truyvấn máy tìmkiếm - Đề xuất mơ hình gợitruyvấncho đối tƣợng thiếuniên dựa việc kết hợp k thuậtgợitruyvấnsosánh tính độ tƣơng tự câu truyvấn sử dụng lƣu vết truyvấn Trong mơ hình, luận văn đƣa thêm giá trị trọng sốcho liên kết we để nâng cao độ xác kết trả - Xây dựng phần mềm thực nghiệm thi hành mơ hình đề xuất, thực thi việc tính đốn độ tƣơng tự câu truyvấn ết đánh giá định tính 10 cặp câu truyvấn tƣơng tự cho kết trả phù hợp Do hạn chế trình độ thời gian, luận văn chƣa tiến hành thửnghiệm trọn vẹn đƣợc mơ hình đề xuất mà sốthành phần mơ hình phân tích dạng định tính Hơn nữa, mơ hình chƣa đƣợc tích hợp vào trang we Trƣờng THPT Đại Mỗ Đấy hƣớng nghiêncứu luận văn TÀI LIỆU THAM KHẢO [1] Sergio Duarte Torres, Djoerd Hiemstra, Ingmar Weber, Pavel Serdyukov Query recommendation for children CIKM 2012: 2010-2014, 2012 [2] Sergio Duarte Torres, Djoerd Hiemstra, Theo W C Huibers Vertical selection in the information domain of children JCDL 2013: 57-66, 2013 [3] Sergio Duarte Torres, Djoerd Hiemstra, Ingmar Weber, Pavel Serdyukov Query recommendation in the information domain of children JASIST 65(7): 13681384, 2014 [4] Sergio Raúl Duarte Torres Information Retrieval for Children: Search Behavior and Solutions PhD Thesis, University of Twentee, [5] Meher T Shaikh, Maria Soledad Pera, Yiu-Kai Ng Suggesting Simple and Comprehensive Queries to Elementary-Grade Children WI-IAT (1) 2015: 252259 [6] Shahrzad Karimi, Maria Soledad Pera Recommendations to Enhance Children Web Searches RecSys Posters 2015 [7] I Bahattin Vidinli, Rifat Ozcan New query suggestion framework and algorithms: A case study for an educational search engine Information Processing and Management, 2016 [8] Livingstone, Sonia and Haddon, Leslie and Görzig, Anke and Ólafsson, Kjartan Risks and safety on the internet: the perspective of European children: full findings and policy implications from the EU Kids Online survey of 9-16 year olds and their parents in 25 countries EU Kids Online, Deliverable D4, 2011 [9] Dinh, Thuy, Farrugia, Lorleen, O'Neill, Brian, Vandoninck, Sofie and Velicu, Anca (2016) Internet safety helplines: exploratory study first findings Better Internet for Kids [10] Mascheroni, G and Haddon, L (2015) Children, risks and the mobile internet In Y Zheng (Ed.), Encyclopedia of Mobile Phone Behavior (pp.1409-1418) Hershey PA: IGI Global [11] https://www.betterinternetforkids.eu/ [12] Christopher D Manning, Prabhakar Raghvan, Hinrich Schutze, An introduction to Information Retrieval, 2009 [13] Manu Konchady, Building search applications – Lucene, LingPipe, and Gate, Mustru Publishing, 2008 [14] Ziming Zhuang, Silviu Cucerzan, Q-rank: re-ranking search results using query logs [15] IR-models, http://en.wikipedia.org/wiki/Information_retrieval [16] Donald Metzler, Susan T Dumais, Christopher Meek (2007) Similarity Measures for Short Segments of Text, ECIR 2007: 16-27 [17] Fu, L., Goh, H L., Foo, S B., & Na, J C (2003) Collaborative querying through a hybrid query clustering approach Conference on Asian Digital Libraries (6th:2003:Malaysia) [18] Ji-Rong Wen, Jian – Yun Nie, Hong-Jiang Zhang (2002), Query Clustering Using User Logs, ACM Transactions on Information Systems, Vol 20, No 1, January 2002 [19] Ricardo Baeza-Yates, Carlos Hurtado, Marcelo Mendoza (2004), Query Recommendation Using Query Logs in Search Engines, In Current Trends in Database Technology - EDBT 2004 Workshops, Vol 3268/2004 (18 November 2004), pp 588-596 [20] Siddharth Patwardhan (2003) Incorporating Dictionary and Corpus Information into a Context Vector Measure of Semantic Relatedness MSc Thesis, University of Minnesota, Duluth, MN [21] Wen-tau Yih, Christopher Meek (2007) Improving Similarity Measures for Short Segments of Text Microsoft Research One Microsoft Way Redmond, WA 98052, USA, 2007, pp 1489-1494 [22] Wesley W Chu, Guogen Zhang (1997) Associative query answering via query feature similarity, Intelligent Information Systems (IIS '97): 405-409 [24] Phan Xuân Hiếu JGibbsLDA http://gibbslda.sourceforge.net/, School of Information Sciences Tohoku University [25] http:// coccoc.com /users/home [26] Nguyễn Thị Thu Chung Nghiên cứu, phát triển phương pháp tính độ tương tự truyvấn hệ tìmkiếm ứng dụng thửnghiệm vào hệ tìmkiếm thực thể tiếng Việt Luận văn Thạc s , Trƣờng Đại học Công nghệ, ĐHQGHN, 2011 5 ... thuật so sánh truy vấn 1.3 Bài toán gợi ý truy vấn kỹ thuật so sánh câu truy vấn Các vấn đề gợi ý truy vấn (Query suggestion: QS) nên nghĩ đơn giản "một chuỗi so sánh hai câu truy vấn" [7] Truy vấn. .. tƣợng thiếu niên việc tìm kiếm khai phá thông tin mạng Internet 12 1.2 Gợi ý truy vấn cho thiếu niên 1.2.1 ngh a gợi truy vấn cho thiếu niên Đối tƣợng thiếu niên thƣờng xun sử dụng cơng cụ tìm kiếm. .. thuật gợi truy vấn cho thiếu niên 15 1.3 Bài toán gợi truy vấn ằng k thuật so sánh câu truy vấn .17 Chƣơng MỘT SỐ THUẬT G I TRUY VẤN CHO THANH THIẾU NIÊN 18 2.1 Gợi truy vấn ằng