Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 83 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
83
Dung lượng
841,71 KB
Nội dung
Đại Học Quốc Gia TP Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA -oOo - VÕ VĂN CƯỜNG LUẬN VĂN THẠC SĨ Chuyên Ngành: Khoa học máy tính MỞ RỘNG TRUY VẤN DÙNG ONTOLOGY VÀ KỸ THUẬT PHÂN TÍCH CỤC BỘ TP Hồ Chí Minh, Tháng 12 – 2008 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học : PGS TS PHAN THỊ TƯƠI Cán chấm nhận xét : PGS TS CAO HOÀNG TRỤ Cán chấm nhận xét : PGS TS ĐỖ PHÚC Luận văn bảo vệ HỘI ĐỒNG CHẤM LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 19 tháng 02 năm 2009 ĐẠI HỌC QUỐC GIA TP HCM CỘNG HOÀ XÃ HỘI CHỦ NGHIÃ VIỆT NAM Độc Lập - Tự Do - Hạnh Phúc TRƯỜNG ĐẠI HỌC BÁCH KHOA -oOo - Tp HCM, ngày 19 tháng 02 năm 2009 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: VÕ VĂN CƯỜNG Giới tính : Nam ;/ Nữ Ngày, tháng, năm sinh : 28/04/1981 Nơi sinh : Huế Chuyên ngành : Khoa học máy tính Khoá: 2006 1- TÊN ĐỀ TÀI: Mở rộng truy vấn dùng Ontology kỹ thuật phân tích cục 2- NHIỆM VỤ LUẬN VĂN: - Nghiên cứu phương pháp mở rộng truy vấn - Tìm hiểu cơng cụ, cơng nghệ hỗ trợ - Tìm hiểu Ontology hỗ trợ ngữ nghĩa cho mở rộng truy vấn Từ xác định phương pháp mở rộng truy vấn dựa vào Ontology phân tích cục - Xây dụng mơ hình mở rộng truy vấn thực nghiệm minh chứng cho mơ hình đề xuất 3- NGÀY GIAO NHIỆM VỤ : 21/01/2008 4- NGÀY HOÀN THÀNH NHIỆM VỤ : 19/02/2009 5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN: PGS TS: Phan Thị Tươi Nội dung đề cương Luận văn thạc sĩ Hội Đồng Chuyên Ngành thông qua CÁN BỘ HƯỚNG DẪN (Họ tên chữ ký) CHỦ NHIỆM BỘ MÔN QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) LỜI CÁM ƠN Tôi xin chân thành cảm ơn cô PGS TS Phan Thị Tươi, người trang bị cho tơi kiến thức q báu, định hướng cách đặt vấn đề phương pháp nghiên cứu khoa học Tôi xin gửi lời cám ơn anh Nguyễn Chánh Thành, người tận tình hướng dẫn, giúp tơi hồn thành luận văn Cuối cùng, tơi xin gửi lời cám ơn gia đình bạn bè động viên, tạo điều kiện cho tơi q trình học tập TĨM TẮT Tìm kiếm thơng tin nhu cầu thiết yếu người sử dụng Internet Do khối lượng thông tin ngày nhiều đa dạng, hệ thống tìm kiếm theo từ khóa khơng thể đáp ứng kết xác đầy đủ mong muốn người dùng Điểm yếu hệ thống truy vấn theo từ khóa khơng biểu diễn ngữ cảnh tìm kiếm câu truy vấn Mục tiêu đề tài xây dựng hệ thống xử lý nhập nhằng mơ hồ nghĩa, từ mở rộng câu truy vấn theo hướng ngữ cảnh người dùng Luận văn giới thiệu mơ hình mở rộng truy vấn kết hợp dùng Ontology kỹ thuật phân tích cục bộ, sử dụng chế đánh trọng số cho quan hệ mạng giao ngữ nghĩa để tăng độ xác cho từ khóa mở rộng Kết thực nghiệm cho thấy mơ hình mở rộng kết hợp cho độ xác cao phương pháp mở rộng dùng Ontology truyền thống ABSTRACT Searching of information is an essential demand for Internet users Due to the volume of information is being more and more diverse, the Keyword–based Information Retrieval Systems cannot meet the desire of precision and recall The weakness of Keyword-based Search Systems is not able to represent the context of the search query The objective of the thesis is building the system to deal with the vagueness and ambiguity of natural languages, thereby using the sensed information to expand the query to context of user The thesis introduces a new methodology for query expansion It is a hybrid approach, the combination of Ontology in Local Analysis technique Assign a new score to all relationships in the common semantic network to improve the precise and fulfillment of expansion terms The experiment based on Wikipedia in English show that the result of hybrid model is more precise than the conventional Ontology based approaches MỤC LỤC Chương I : Giới thiệu .1 I.1 Phát biểu vấn đề .1 I.2 Mức độ xác cải tiến câu truy vấn mở rộng I.3 Hướng nghiên cứu đề tài I.4 Đóng góp đề tài .4 I.5 Cấu trúc luận văn Chương II : Các cơng trình nghiên cứu liên quan II.1 Các cơng trình nghiên cứu liên quan đến kỹ thuật phân tích thống kê .8 II.2 Các cơng trình nghiên cứu mở rộng truy vấn sử dụng Ontology .11 Chương III : Cơ sở lý thuyết 18 III.1 Mở rộng truy vấn .18 III.2 Các phương pháp mở rộng truy vấn 18 III.2.1 Hướng sử dụng mô hình tri thức 19 III.2.2 Hướng độc lập với mơ hình tri thức 19 III.3 Kỹ thuật phân tích thống kê 20 III.3.1 Kỹ thuật phân tích tồn cục .20 III.3.2 Kỹ thuật phân tích cục 21 III.3.3 Kỹ thuật LCA (Local Context Analysis) 22 III.4 Phương pháp dùng Query Log .22 III.4.1 Cấu trúc Query Log 22 III.4.2 Các phụ thuộc phương pháp mở rộng sử dụng Log 24 III.5 Ontology WordNet 25 III.5.1 Giới thiệu Ontology WordNet 25 III.5.2 Cách biểu diễn danh từ WordNet 29 III.6 Phương pháp mở rộng truy vấn dùng Ontology 31 III.7 Vấn đề nhập nhằng 32 III.7.1 Nhập nhằng nghĩa 32 III.7.2 Một số tượng nhập nhằng 32 III.8 Kỹ thuật xử lý nhập nhằng .33 III.8.1 Phương pháp xác định độ tương đồng ngữ nghĩa .34 III.8.2 Sử dụng mạng ngữ nghĩa để khử nhập nhằng .36 Chương IV : Mô hình đề xuất luận văn 39 IV.1 Hướng giải vấn đề 39 IV.2 Mơ hình 41 IV.3 Cấu trúc Ontology 43 IV.4 Giải thuật xử lý nhập nhằng tìm kiếm từ khóa dự tuyển 45 IV.4.1 Mơ hình tốn xác định khóa dự tuyển .46 IV.4.2 Các bước thực 46 IV.5 Phân tích cục phương pháp phân loại 55 IV.5.1 Sơ đồ giải thuật .56 IV.5.2 Phương pháp đánh trọng số .57 Chương V : Triển khai hệ thống đánh giá kết 60 V.1 Triển khai hệ thống 60 V.2 Hình ảnh chương trình 61 V.3 Đánh giá kết 61 Chương VI : Tổng kết 65 VI.1 Kết đạt 65 VI.2 Hạn chế luận văn .66 VI.3 Hướng phát triển luận văn .66 Phụ lục .68 A Lucene 68 B Danh sách câu truy vấn kết mở rộng 69 Tài liệu tham khảo 71 DANH SÁCH CÁC BẢNG Bảng II-1: Đánh giá độ cải tiến phương pháp phân tích cục Log 16 Bảng II-2: Thực nghiệm phương pháp mở rộng dùng Log 16 Bảng II-3: Các kết mở rộng truy vấn dùng Ontology .16 Bảng IV-1: Dữ liệu Ontology 45 Bảng IV-2: Nghĩa từ khóa 'best ' .48 Bảng IV-3: Nghĩa từ khóa 'toy ' .49 Bảng IV-4: Nghĩa từ khóa ‘year’ .49 Bảng IV-5: Hệ số tích lũy 49 Bảng IV-6: Danh sách khóa mở rộng dự tuyển 54 Bảng V-1: Kết thực nghiệm phương pháp mở rộng kết hợp 63 Bảng PL-1: Danh sách câu truy vấn kết mở rộng 63 DANH SÁCH CÁC HÌNH VẼ Hình II-1 Biểu đồ so sánh độ hồi qui/ độ xác hai thực nghiệm – Truy vấn mở rộng truy vấn không mở rộng .23 Hình III-1 Cấu trúc Query Log 23 Hình III-2 Quan hệ từ khóa truy vấn từ khóa tài liệu 24 Hình III-3 Khái niệm mối quan hệ WordNet 30 Hình III-4 Mơ hình tốn mở rộng truy vấn 32 Hình III-5 Mạng ngữ nghĩa từ khóa 'bus' 37 Hình III-6 Mạng giao ngữ nghĩa mountain#1 top#3 38 Hình IV-1 Mơ hình hệ thống truy vấn luận văn 40 Hình IV-2 Mơ hình mở rộng truy vấn dùng phương pháp kết hợp 41 Hình IV-3 Mơ hình sở liệu Ontology 44 Hình IV-4 Mơ hình tốn xác định khóa dự tuyển .46 Hình IV-5: Phân loại chọn lọc từ khóa mở rộng 56 Hình V-1: Trang giao diện tìm kiếm .61 Hình V-2 Đồ thị biểu diễn độ xác theo số từ khóa mở rộng 65 Hình PL Mơ hình ứng dụng Lucene 69 59 - N kích thước tập khởi tạo - Ω hệ số tích lũy term Ta có : Trọng số từ term tích hệ số tích lũy tần suất xuất term S Score(term) = Ω * ∑ d ∈S tf (term, d ) N * idf (term) Trong : • tf(term, d) tần suất xuất term tài liệu d • idf(term) tần suất nghịch đảo tài liệu có chứa từ term, dùng để xác định tầm quan trọng term • tf idf xác định theo công thức sau - tf (term, d ) = freq(term, d ) - idf ( term ) = log( N ) n n : số tài liệu chứa term Sau gán trọng số cho tất khóa dự tuyển, khóa dự tuyển xếp chọn khóa có trọng số tốt làm từ khóa mở rộng Số lượng từ khóa mở rộng tối đa chọn tham số hệ thống mở rộng truy vấn Trong phần thực nghiệm luận văn, tham số có giá trị 5, 10, 15 Tuy nhiên, với số lượng từ khóa mở rộng tối đa 10, hệ thống đạt số xác độ hồi qui tốt 60 Chương V : Triển khai hệ thống đánh giá kết V.1 Triển khai hệ thống Hệ thống tìm kiếm thực phần mở rộng truy vấn xây dựng theo mơ hình ứng dụng Web - Máy chủ Web Tomcat - Phần đánh mục tìm kiếm xây dựng dựa vào máy tìm kiếm Lucene - Hệ thống sử dụng hệ quản trị sở liệu MySQL để lưu trữ thông tin tìm kiếm thơng tin phản hồi từ người sử dụng để hỗ trợ thống kê, đánh giá cải tiến ứng dụng 61 V.2 Hình ảnh chương trình Hình V-1: Trang giao diện tìm kiếm V.3 Đánh giá kết Bài tốn mở rộng tìm kiếm xây dựng thơng qua hai phần : a Xây dựng huấn luyện Ontology : Như mô tả phần trước, Ontology xây dựng với khái niệm danh từ, tính từ tiếng Anh với mối quan hệ liên kết ngữ nghĩa : hypernonym, similar, Thông tin liệu Ontology trích rút từ WordNet 3.0 62 b Xây dựng giải thuật mở rộng truy vấn dựa vào quan hệ ngữ nghĩa Ontology thông tin phản hồi từ kết phân tích cục Như thế, việc đánh giá kết việc phụ thuộc giải pháp mở rộng phụ thuộc vào kết huấn luyện liệu ontology Dữ liệu huấn luyện ontology trích rút trực tiếp từ WordNet, có tính ổn định độ tin cao Vì thế, kết đánh giá phụ thuộc vào biến tham số ảnh hưởng trình xây dựng từ khóa mở rộng Các tham số mang tính định trình mở rộng truy vấn : a Số nghĩa câu truy vấn chọn b Hệ số tích lũy c Kích thước tập khởi tạo d Số từ khóa mở rộng tối đa chọn Với mục tiêu đặt toán cải tiến độ xác hệ thống mở rộng truy vấn, giá trị thực nghiệm xác định qua độ xác (precision) kết mở rộng Do hạn chế phần đánh giá thực nghiệm không xác định tập tài liệu liên quan, số độ xác phần thực nghiệm đề tài xác định theo cơng thức sau: Độ xác= Số từ khóa mở rộng xác Số từ khóa mở rộng Cơng thức đánh giá độ xác câu truy vấn mở rộng với giả thuyết: Độ xác câu truy vấn mở rộng cao tập kết trả từ câu truy vấn mở rộng xác 63 Sau thơng tin kho liệu tìm kiếm tập câu truy vấn dùng để đánh giá : - Nội dung tìm kiếm hệ thống giới hạn nội dung website: wikipedia.com - Tập 40 câu truy vấn chọn từ kho liệu lưu trữ thơng tin tìm kiếm người sử dụng hệ thống tìm kiếm AOL (http://search.aol.com/aol/webhome) Các kết thực nghiệm đạt dựa theo thông số mở rộng Gọi : - M : số nghĩa tối đa câu truy vấn xét - W kích thước tập khởi tạo - N : Số tổ hợp từ khóa tối đa chọn Thực nghiệm tiến hành với M = 1, W = 100 N = 5, 10, 15 Hệ số tích lũy chọn bảng IV-5 Các giá trị xác độ hồi qui thể phụ lục B Sau phân tích kết thực nghiệm, ta có giá trị trung bình cho trường hợp sau: Mở rộng truy vấn kết hợp Số từ khóa mở Độ xác rộng tối đa (%) 38 10 53 15 42 Bảng V-1: Kết thực nghiệm phương pháp mở rộng kết hợp 64 Đồ thị biểu diễn độ xác theo số tổ hợp từ khóa Hình V-2: Đồ thị biểu diễn độ xác theo số từ khóa mở rộng Mở rộng truy vấn dùng Ontology có độ xác trung bình 30% Từ số liệu thống kê đồ thị trên, ta nhận thấy giải pháp mở rộng truy vấn kết hợp có độ xác cao so với mở rộng truy vấn dùng Ontology Qua kết thực nghiệm, ta nhận thấy phạm vi thông tin sử dụng cho đề tài, phương án mở rộng truy vấn dùng phương pháp kết hợp đem lại cải tiến định so với phương pháp mở rộng sử dụng Ontology Kết đạt khả quan trường hợp chọn tối đa hai nghĩa trình xử lý nhập nhằng chọn tối đa 10 tổ hợp từ khóa mở rộng Trường hợp có độ xác trung bình 53% 65 Chương VI : Tổng kết VI.1 Kết đạt Nhiệm vụ luận văn nghiên cứu phát triển hệ thống mở rộng truy vấn, kết đạt sau : • Nghiên cứu, khảo sát đánh giá cơng trình mở rộng truy vấn liên quan đến Ontology kỹ thuật phân tích thống kê • Nghiên cứu WordNet, xây dựng Ontology với quan hệ ngữ nghĩa trích rút từ WordNet, hỗ trợ việc xử lý nhập nhằng nghĩa • Nghiên cứu ứng dụng mạng ngữ nghĩa để xác định ngữ cảnh câu truy vấn tìm kiếm • Xây dựng mơ hình mở rộng truy vấn kết hợp Ontolgy phân tích cục Đánh trọng số cho quan hệ ngữ nghĩa để xác định từ khóa trội • Hiện thực mơ hình mở rộng truy vấn dùng Ontology truyền thống để đánh giá phương pháp mở rộng kết hợp theo mơ hình đưa Luận văn đưa hướng tiếp cận cho toán mở rộng truy vấn dùng Ontology Đó bổ sung trọng số cho quan hệ ngữ nghĩa từ khóa, kết hợp với kỹ thuật phân tích cục để chọn lựa từ khóa mở rộng Theo hướng tiếp cận này, từ khóa mở rộng có quan hệ gần gủi với câu truy vấn ban đầu người dùng Kết thực nghiệm tập câu truy vấn giá trị khác tham số mở rộng (số từ khóa bổ sung tối đa) cho thấy, phương pháp mở 66 rộng truy vấn kết hợp cho độ xác trung bình tốt phương pháp dùng Ontology Hướng tiếp cận bổ sung trọng số quan hệ cho từ khóa sử dụng mơ hình tốn đánh số tìm kiếm theo ngữ nghĩa, chức quan trọng hệ thống truy hồi thông tin thông minh VI.2 Hạn chế luận văn Luận văn đề xuất phương án mở rộng truy vấn kết hợp sử dụng Ontology kỹ thuật phân tích thống kê, bên cạnh ưu điểm thể sơ lý thuyết minh chứng thực nghiệm, hệ thống cịn có số hạn chế sau: - Trong việc xử lý nhập nhằng, mạng giao ngữ nghĩa chưa đạt độ xác cao từ khóa truy vấn có từ loại khác - Luận văn trọng hướng vào giải pháp mở rộng truy vấn, chưa đề cập yếu tố thời gian thực hệ thống truy hồi thông tin - Kho liệu thực nghiệm chọn wikipedia với ngôn ngữ tiếng Anh, kết đánh giá thực nghiệm dừng lại mức so sánh mơ hình tốn đặt với mơ hình dùng Ontology truyền thống, chưa xác định xác mức độ cải tiến đề tài VI.3 Hướng phát triển luận văn Mơ hình mở rộng truy vấn luận văn hướng phát triển ban đầu việc áp dụng đánh trọng số quan hệ ngữ nghĩa để chọn lựa từ khóa mở rộng thơng qua q trình phân tích cục Từ điểm hạn chế nêu để đáp ứng mục tiêu cải tiến hệ thống truy hồi thông tin, số hướng phát triển cho luận văn sau: 67 • Cải tiến Ontology, nghiên cứu bổ sung quan hệ cần thiết để xử lý nhập nhằng cho từ loại động từ, trạng từ • Nghiên cứu cải tiến giải pháp mở rộng kết hợp để đáp ứng yếu tố thời gian thực Sử dụng Log phương án đưa ra, nhiên, hạn chế thời gian, phương pháp chưa đưa vào phần thực đề tài • Nghiên cứu huấn luyện Ontology hỗ trợ tiếng Việt, làm tảng cho trình xây dựng hệ thống mở rộng truy vấn tiếng Việt 68 Phụ lục A Lucene Lucene thư viện mã nguồn mở phát triển Doug Cutting, cho phép tạo mục tìm kiếm thơng tin tồn văn (full text) với hiệu suất cao Đây ứng dụng mã nguồn mở phát triển dựa ngôn ngữ Java Sau mơ hình ứng dụng Lucene Hình PL Mơ hình ứng dụng Lucene[13] Các tính trội Lucene - Cho phép tích hợp dễ dàng chức tìm kiếm vào ứng dụng 69 - Cập nhập tìm kiếm nhiều mục đồng thời - Hỗ trợ chức tìm kiếm đặc biệt tìm theo từ khóa đặc biệt (*, ?, ), tìm kiếm theo biểu thức luận lý - Cung cấp phương pháp đánh trọng số xếp kết khác B Danh sách câu truy vấn kết mở rộng Query home depot wardrobe storage door viewer tennis instructor medical dictionary social security disability tennis tool computer disk tyre equipment business service birthday party cake factory virus software work accident industry park Industrial school Household garbage public means of transport ambulance plane freight plane N = 10 0.50 Precision N=5 N = 15 0.60 0.63 Ontology 0.25 0.40 0.30 0.40 0.40 0.36 0.30 0.13 0.25 0.60 0.20 0.33 0.27 0.60 0.40 0.33 0.27 0.30 0.60 0.20 0.60 0.25 0.46 0.20 0.50 0.70 0.80 0.33 0.20 0.50 0.40 0.29 0.38 0.20 0.20 0.13 0.06 0.60 0.40 0.40 0.60 0.50 0.36 0.40 0.23 0.60 0.60 0.40 0.20 0.50 0.50 0.40 0.20 0.33 0.30 0.09 0.15 0.33 0.20 0.50 0.22 1.00 0.67 0.67 0.22 1.00 0.67 0.67 0.20 0.30 0.57 0.20 0.20 0.27 0.27 0.07 0.21 70 letter of credit business letter domestication product orbidden forest homeland splinter group training course storage depot Foreign traveller British Council International Red Cross light meal editorial staff organization board help desk desktop computer 0.70 0.80 0.53 0.13 0.40 0.20 0.20 0.08 0.67 0.40 0.67 0.29 0.75 1.00 0.17 0.33 0.75 1.00 1.00 0.50 0.67 0.40 0.67 0.17 0.71 0.40 0.60 0.40 0.46 0.33 0.20 0.17 0.25 0.17 0.20 0.11 1.00 0.17 1.00 1.00 0.20 0.30 0.30 0.17 0.17 0.17 0.13 0.30 0.27 1.00 0.13 0.27 0.44 0.30 0.50 0.20 0.44 0.27 0.40 0.33 0.50 0.40 0.25 0.40 Bảng PL Danh sách câu truy vấn kết mở rộng N: Số từ khóa mở rộng tối đa 71 Tài liệu tham khảo [1] Agissilaos Andreou (2005) Ontologies and Queryexpansion Master thesis, school of Informatics University of Edinburgh [2] Bodo Billerbeck, B.App.Sci/B.Eng (2005) Efficient Query Expansion A thesis submitted for the degree of Doctor of Philosophy RMIT University, Melbourne, Victoria, Australia [3] Cao Hoàng Trụ, VN-KIM cho Web Việt có ngữ nghĩa Kỷ yếu Hội nghị khoa học & Công nghệ lần thứ 9, Đại học Bách Khoa Tp HCM [4] Davide Buscaldi, Paolo Rosso, Emilio Sanchis Arnal (2005) A WordNet-based query expansion method for Geographical information retrival CLEF - 2005 Universidad Politecnica de Valencia, Spain [5] E Mena, V Kashyap, A Illarramendi, A Sheth (1998) Domain Specic Ontologies for Semantic Information In Proc of the International Conference on Formal Ontologies in Information Systems (FOIS'98) Trento (Italy) IOS Press, ISBN 0922-6389, June 1998 [6] George A Miller (1990) A lexical Inheritance system Internantional journal of Lexicography, pp 245-264 [7] George A Miller, Richard Beck, Christiane Fell baum, Derek Gross, and Katherine Miller (1990) Introduction to WordNet: An On-line Lexical Database Internantional journal of Lexicography, p 235-244 72 [8] Igor Jurisica, John Mylopoulos, Eric Yu (1999) Using Ontologies for Knowledge Management: An Information Systems Perspective The Annual Conference of the American Society for Information Sciences [9] J Bhogal, A Macfarlane, P Smith A review of ontology based query expansion ACM - 2007 University of Central England [10] Mandar Mitra, Amit Singhal and Chris Buckley Improve automation query expansion ACM - 1998 University of Melbourne [11] Deborah L McGuinness Ontologies Come of Age In Dieter Fensel, Jim Hendler, Henry Lieberman, and Wolfgang Wahlster, editors The Semantic Web: Why, What, and How, MIT Press, 2003 [12] Ming Hung Hsu, Ming – Heng – Tsai and Hsin –Hsi Cheng Query Expansion With ConceptNet and WordNet: An Intrinsic Comparision AIRS 2006:1-13 Department of Computer Science and Information Engineering [13] Otis Gospodnetic, Erik Hatcher (2005) Lucene in Action JavaTM Application Search Engine [14] PhD Phan Thị Tươi Giáo trình xử lý ngơn ngữ tự nhiên Đại học Bách Khoa Tp HCM [15] Hang Cui, Ji-Rong Wen, Jian-Yun Nie and Wei-Ying Ma Probabilistic Query Expansion Using Query Logs ACM – 2002 New York, NY, USA [16] Roberto Nagvili and Paolo Verladi An analysis of ontology based query expansion strategies In 14th European conference on machine learning (ECML 2003), September 22-26 73 [17] Sandhya Revuri, Sujatha R Upadhyay and P Sreenivasa Kumar (2006) Using Domain Ontologies for efficient informatin retrieval Proceedings of the 13th International Conference [18] Troels Andreasen, Henrik Bulskov and Rasmus Knappe (2002) Ontology based querying Proc 4th Intl Conf on Flexible Query Answering Systems [19] Yonggang Qui, H.P Frei Concepted based query expansion Proceedings of the 16th annual international ACM SIGIR -1993 ... pháp cục III.3.1 Kỹ thuật phân tích tồn cục Phân tích tồn cục kỹ thuật có hiệu cho việc mở rộng truy vấn Một kỹ thuật sớm kỹ thuật nhóm từ 21 (term clustering) Kỹ thuật dựa vào xuất đồng thời... câu truy vấn dẫn đến số trường hợp sai lệch, giảm độ xác câu truy vấn mở rộng III.3.2 Kỹ thuật phân tích cục Phương pháp phân tích cục giải pháp thay phương pháp toàn cục cho việc mở rộng truy vấn. .. tiến mở rộng truy vấn tự động Mandar Mitra Chris Buckley [10] Đây cơng trình nghiên cứu cải tiến mở rộng truy vấn cho phương pháp phân tích cục Trong hướng mở rộng truy vấn tự động, ví dụ phân tích