Bài viết trình bày một mô hình tìm kiếm thông tin theo ngữ nghĩa dựa vào ontology. Việc tìm kiếm thực hiện qua các ontology miền (domain ontology) được thiết kế theo các lĩnh vực (chủ đề) từ các tài liệu thu thập được trong kho lưu trữ (không gian tìm kiếm).
JOURNAL OF SCIENCE OF HNUE Educational Sci., 2015, Vol 60, No 7A, pp 21-29 This paper is available online at http://stdb.hnue.edu.vn DOI: 10.18173/2354-1075.2015-0049 TÌM KIẾM THƠNG TIN THEO NGỮ NGHĨA DỰA VÀO ONTOLOGY Phạm Thị Anh Lê1 , Nguyễn Phước Cường2 Khoa Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội Trường Đại học Tây Nguyên Tóm tắt Ontology cơng cụ hữu ích biểu diễn thông tin ngữ nghĩa thông tin mơ tả cách hình thức Trong báo này, chúng tơi trình bày mơ hình tìm kiếm thơng tin theo ngữ nghĩa dựa vào ontology Việc tìm kiếm thực qua ontology miền (domain ontology) thiết kế theo lĩnh vực (chủ đề) từ tài liệu thu thập kho lưu trữ (không gian tìm kiếm) Truy vấn người sử dụng biến đổi thực ontology Kết tìm kiếm ontology liên kết với tài liệu kho liệu để trả cho người dùng Phần thực nghiệm thực liệu thuộc lĩnh vực y tế số loại truy vấn minh họa cách tiếp cận đề xuất Từ khóa: Tìm kiếm thơng tin, tìm kiếm theo ngữ nghĩa, thông tin ngữ nghĩa, ontology, truy vấn Mở đầu Tìm kiếm ln vấn đề quan tâm Các máy tìm kiếm hỗ trợ người nhiều việc nhanh chóng tìm thơng tin muốn Web ngữ nghĩa đời mở hướng biểu diễn tìm kiếm thơng tin theo ngữ nghĩa Ontology công cụ đáp ứng tốt yêu cầu Ontology mô tả tri thức tập khái niệm quan hệ khái niệm lĩnh vực ứng dụng cụ thể, nhằm biểu diễn chia sẻ thông tin ứng dụng trao đổi thông tin người với máy tính Trong hệ thống tìm kiếm văn (phi cấu trúc) thực tìm kiếm chủ yếu theo tần suất xuất từ khóa mà khơng tính đến ngữ cảnh sử dụng Một khái niệm dùng ngữ cảnh khác mang ý nghĩa khác [8, 10] Vì vậy, để đáp ứng nhu cầu tìm kiếm cách hiệu phương pháp tìm kiếm thơng tin theo ngữ nghĩa quan tâm gần Trong báo, đề xuất cách tìm kiếm thơng tin dựa vào ontology Nội dung tập trung vào việc xây dựng ontology miền liên kết thành phần ontology với tài liệu kho liệu Cách xử lí truy vấn biến đổi truy vấn người dùng thành truy vấn ontology đóng vai trò định chất lượng kết tìm kiếm Trong báo này, xem độc giả quen với khái niệm ontology, ngôn ngữ biểu diễn ontology phổ biến RDF, OWL Các phần báo trình bày chi tiết mơ hình tìm kiếm thơng tin dựa vào ontology, ứng dụng thực nghiệm, đánh giá kết thực nghiệm kết luận Ngày nhận bài: 25/7/2015 Ngày nhận đăng: 18/11/2015 Liên hệ: Phạm Thị Anh Lê, e-mail: lepta@hnue.edu.vn 21 Phạm Thị Anh Lê, Nguyễn Phước Cường 2.1 Nội dung nghiên cứu Mơ hình tìm kiếm thơng tin 2.1.1 Kiến trúc mơ hình tìm kiếm Mơ hình tìm kiếm thơng tin theo ngữ nghĩa có cấu trúc tương tự máy tìm kiếm thông thường Phần giao diện người dùng cho phép người dùng thao tác trực tiếp để đưa câu truy vấn, sau hiển thị danh sách kết tìm kiếm Kiến trúc phần hệ thống tìm kiếm, bao gồm phận lưu liệu tìm kiếm tập tài liệu, phân tích câu hỏi, tìm kiếm kết cho câu hỏi xếp kết tìm kiếm Quy trình tìm kiếm dựa vào ontology thực sau: Hình 1: Mơ hình tìm kiếm thơng tin [3] Bước 1: Câu truy vấn đưa vào từ giao diện người dùng Câu truy vấn biểu diễn ngôn ngữ tự nhiên, từ, cụm từ hay câu Sau đó, phân tích truy vấn để nhằm “hiểu” yêu cầu người dùng Việc phân tích dựa vào thông tin ontology xây dựng Kết bước xác định từ, cụm từ có ý nghĩa quan trọng truy vấn Những từ xác định thông qua trình đối sánh câu truy vấn với liệu RDF Đồng thời cần xác định loại từ hay cụm từ ontology, chẳng hạn từ lớp ontology hay thuộc tính, quan hệ, thực thể, khái niệm Bước 2: Chuyển yêu cầu tìm kiếm thành câu truy vấn dạng RDQL Đây dạng truy vấn liệu RDF Trong báo sử dụng ngôn ngữ truy vấn SPARQL để thay RDQL Vì SPARQL ngơn ngữ truy vấn mở rộng RDQL, SPARQL hỗ trợ truy vấn tốt giải nhiều hạn chế ngơn ngữ truy vấn RDF [5] Q trình chuyển thành truy vấn SPARQL gồm: - Xác định thuộc tính lớp, lớp xuất truy vấn Giá trị thuộc tính kết trả cho người dùng - Xác định thuộc tính quan hệ lớp có - Nếu có xuất thực thể hay khái niệm cần xác định thực thể thuộc lớp Mục đích tạo điều kiện lọc kết tìm kiếm - Chuyển toàn phần xác định xếp thành câu truy vấn SPARQL 22 Tìm kiếm thông tin theo ngữ nghĩa dựa vào Ontology Bước 3: Máy tìm kiếm thực thi câu truy vấn bước Để thực thi truy vấn báo sử dụng hỗ trợ Apache Jena [9], framework lập trình miễn phí ngôn ngữ Java Kết bước danh sách thực thể, khái niệm phù hợp với truy vấn Bước 4: Từ danh sách thực thể (instances), hệ thống cho người dùng tài liệu liên quan dựa vào liên kết ontology tập tài liệu Bước 5: Bước thực xếp hạng tài liệu kết thu Hiện nay, có nhiều hướng tiếp cận cho việc xếp hạng tài liệu Trong báo này, chúng tơi tính tốn mức độ liên quan tài liệu truy vấn dựa vào phương pháp TF-IDF [3] 2.1.2 Xây dựng ontology quy trình tìm kiếm Trong hệ thống tìm kiếm dựa vào ontology, việc xây dựng ontology gắn liền với việc tạo liên kết với tài liệu gán trọng số cho liên kết Đây vấn đề quan trọng, cảnh hưởng đến chất lượng kết tìm kiếm Thơng thường, xuất phát từ kho tài liệu chứa tài liệu theo chủ đề, người ta trích rút thơng tin để xây dựng ontology miền Các bước xây dựng ontology gồm: Xác định miền phạm vi ontology, Kế thừa ontology có sẵn, Liệt kê thuật ngữ quan trọng ontolog, Xây dựng lớp cấu trúc phân cấp lớp, Định nghĩa thuộc tính quan hệ cho lớp, Định nghĩa ràng buộc thuộc tính quan hệ lớp, Tạo thực thể cho lớp Chi tiết bước xem bày tài liệu [7, 10, 12] 2.1.3 Liên kết tài liệu Liên kết tài liệu ánh xạ thành phần ontology nguồn tài liệu Các liên kết không nhúng vào tài liệu mà lưu trữ ontology Để lưu trữ thông tin này, tạo thêm lớp “Liên kết”gồm hai thuộc tính quan hệ “thực thể” “tài liệu” Liên kết tạo chuyên gia lĩnh vực Mục đích liên kết để tham chiếu đến tài liệu truy vấn thực ontology Để đánh giá mức độ liên quan tài liệu truy vấn, tiến hành đánh trọng số cho liên kết Kĩ thuật đánh trọng số sử dụng mơ hình khơng gian vector cổ điển Trong mơ hình khơng gian vector, từ khóa tài liệu gán trọng số Trọng số xác định dựa vào từ khóa khác tài liệu tài liệu khác Tương tự, hệ thống chúng tôi, ghi gán trọng số để xác định ý nghĩa tài liệu Những trọng số tính tốn tự động thuật tốn TF-IDF [2, 9] Dựa vào tần suất xuất thực thể tài liệu Trọng số thực thể tài liệu tính sau: f reqi,j w(i, j) = N maxk f reqk,j × log ni Trong đó, f reqi,j : Tần suất xuất từ thứ i Ik tài liệu Dj maxk f reqk,j : Tần số xuất từ thứ k, Ik tài liệu với từ k xuất nhiều N tổng số tài liệu không gian tìm kiếm ni : Số tài liệu chứa “từ” Ii Số lần xuất thực thể tài liệu chủ yếu định nghĩa số lần nhãn thực thể xuất văn tài liệu, tài liệu ghi trọng số với thực thể, khác không Tuy nhiên, xác định trọng số dựa vào phương pháp vừa nêu kết mang lại chưa thật tốt Một số từ xuất nhiều văn bản, từ lại khơng mang ý nghĩa văn Từ gọi “từ dừng” (Stop word), chẳng hạn: “và”, “thì”, “là” “một”, “nếu, “nhưng”, “vì” Các từ thường xuất nhiều văn tài liệu khác Để giải 23 Phạm Thị Anh Lê, Nguyễn Phước Cường vấn đề có hai hướng sau: - Loại bỏ “từ dừng” trước thực tính tốn trọng số - Phương pháp thứ hai, sử dụng cơng thức tính kết hợp với cơng thức tính tần số nghịch đảo từ văn (IDF-Inverse Document Frequency) Cách áp dụng tính tốn tập liệu lớn Mục đích nhằm giảm giá trị “từ dừng” phổ biến Vì từ xuất nhiều văn này, mà xuất văn khác, xuất nhiều số văn định Nghĩa từ quan trọng, mang ý nghĩa tài liệu xét Ngược lại, từ xuất nhiều hầu hết văn văn xuất hiệu nhiều lần Thường từ mang ý nghĩa tài liệu Cơng thức tính tần suất nghịch đảo IDF sau: |D| idf (t, d) = log |{d ∈ D : t ∈ d}| Trong |D| : Tổng số văn tập liệu |{d ∈ D : t ∈ d}|: số văn chứa từ t với điều kiện f (t, d) = 2.1.4 Xử lí truy vấn Xử lí truy vấn q trình phân tích u cầu tìm kiếm người dùng Mục đích chuyển yêu cầu thành câu truy vấn SPARQL [5], để máy tính hiểu xử lí Truy vấn từ, cụm từ khóa, câu truy vấn dạng ngôn ngữ tự nhiên Ngồi ra, câu truy vấn lấy từ giao diện tìm kiếm dựa theo khn mẫu Tìm kiếm theo khuôn mẫu cho phép người dùng chọn lựa mong muốn tìm kiếm, việc lựa chọn dựa vào lớp ontology miền xây dựng Sau đó, người dùng nhập thơng tin cần tìm phù hợp với lớp để tìm kiếm Hệ thống phân tích truy vấn theo dạng vừa nêu Kết q trình xử lí hệ thống hiểu mong muốn người dùng tạo câu truy vấn SPARQL để thực thi trả tài liệu phù hợp Ví dụ với câu truy vấn: “Bác sĩ thuộc khoa chấn thương chỉnh hình”, kết tìm kiếm máy tìm kiếm Google, Yahoo, chủ yếu thông tin “khoa chấn thương chỉnh hình” Kết chưa đáp ứng yêu cầu người dùng Người dùng cần tìm “bác sĩ” thuộc chuyên khoa “chấn thương chỉnh hình” Thơng tin người dùng muốn tìm thơng tin bác sĩ gồm tên, tuổi, địa chỉ, số điện thoại, học vị, nơi công tác Đây kết mong muốn hệ thống tìm kiếm dựa vào ngữ nghĩa Tức là, hệ thống phải hiểu người dùng muốn tìm thơng tin “bác sĩ” với điều kiện bác sĩ thuộc khoa chấn thương chỉnh hình Chúng tơi đề xuất chia thành ba bước sau: Bước Tách từ, cụm từ từ truy vấn Thực kiểm tra câu truy vấn, xuất lớp, thuộc tính, quan hệ, khái niệm có ontology, rút trích từ hay cụm từ Đồng thời xác định loại từ hay cụm từ Chẳng hạn, với truy vấn “Bác sĩ thuộc khoa chấn thương chỉnh hình” xác định lớp: “Bác sĩ”, “Khoa” thực thể “khoa chấn thương chỉnh hình” Bước Xác định mối quan hệ điều kiện lọc liệu Mục đích bước rút lớp ẩn, thực thể, quan hệ lớp Lớp ẩn lớp không xuất truy vấn, có liên quan đến truy vấn Phương pháp tiến hành sau: Kiểm tra số lớp (class) xuất câu truy vấn, có ba trường hợp sau: Trường hợp 1: Không xuất lớp câu truy vấn - Nếu không xuất thực thể thơng báo khơng tìm thấy kết phù hợp 24 Tìm kiếm thơng tin theo ngữ nghĩa dựa vào Ontology - Nếu xuất thực thể: kiểm tra thực thể thuộc lớp Sau đó, chuyển sang bước Ví dụ, truy vấn “chấn thương chỉnh hình” Trong truy vấn khơng xuất lớp, có thực thể “chấn thương chỉnh hình” Với hỗ trợ Jena rút thực thể thuộc lớp “khoa” Lớp “khoa” gọi lớp ẩn truy vấn Tiếp theo, thực chuyển kết gồm lớp “khoa” thực thể “chấn thương chỉnh hình” qua bước Trường hợp 2: Xuất lớp, tiếp tục tiến hành loại bỏ lớp khỏi câu truy vấn - Nếu phần lại truy vấn rỗng xác nhận tồn lớp chuyển đến bước - Nếu phần lại có chứa thực thể, tương tự trường hợp 1, tiến hành kiểm tra xem thực thể thuộc lớp Nếu thực thể lớp có chuyển kết sang bước Ngược lại, xác định thực thể thuộc lớp khác cần phải xác định thêm lớp tìm thấy lớp xét có quan hệ khơng Sau đó, chuyển tất lớp, thực thể quan hệ có qua bước Trường hợp 3: Xuất nhiều lớp, cần xác định mối quan hệ lớp Sau đó, thực tương tự trường hợp Ví dụ áp dụng bước cho truy vấn “bác sĩ thuộc khoa chấn thương chỉnh hình”, kết thu được: lớp “Bác sĩ” có quan hệ “Thuộc chuyên khoa” với lớp “Khoa” lớp “Khoa” có quan hệ “Có bác sĩ” với lớp “Bác sĩ” Giả sử kí hiệu “Bác sĩ” lớp 1, “Khoa” lớp Bước Tạo câu truy vấn dựa vào từ, cụm từ, mối quan hệ thực thể Nếu xuất lớp câu truy vấn SPARQL sau: SELECT ?lớp WHERE { ?lớp rdf:type ns:lớp } Trong đó: ?lớp biến, ns định dạng URI Nếu xuất thực thể thuộc lớp có chèn thêm đoạn truy vấn sau vào mệnh đề WHERE FILTER (?lớp = ns:thực_thể) Khi đó, truy vấn SPARQL thu sau: SELECT ?tlớp WHERE { ?lớp rdf:type ns:lớp FILTER (?lớp = ns:thực_thể)} Nếu trường hợp có lớp trở lên tạo câu truy vấn SPARQL Nếu tồn mối quan hệ hai lớp hai lớp có thực thể đưa truy vấn SPARQL bổ sung sau (giả sử thực thể xác định lớp lớp có quan hệ với lớp 1): SELECT ?lớp_1 SELECT ?lớp_2 WHERE { WHERE { ?lớp_1 rdf:type ns:lớp_1 ?lớp_2 rdf:type ns:lớp_2 FILTER (?lớp_1 = ns:thực_thể_1)} ?lớp_2 ns:quan_hệ_2 ?lớp_1 FILTER (?lớp_1 = ns:thực_thể_1)} Ngược lại, tồn thực thể lớp mà không tồn quan hệ lớp với lớp 1, tồn quan hệ lớp với lớp mà không tồn thực thể lớp khơng thêm quan hệ Thực thể “Chấn thương chỉnh hình” thuộc lớp 25 Phạm Thị Anh Lê, Nguyễn Phước Cường Áp dụng bước vào trường hợp ta câu truy vấn sau: Truy vấn 1: SELECT?khoa WHERE { ?khoa rdf:type ns:khoa FILTER (?khoa = ns:khoa_chan_thuong_chinh_hinh) } Truy vấn khơng thêm quan hệ “Có bác sĩ”, không tồn thực thể “Bác sĩ” Truy vấn 2: SELECT?bac_sy WHERE { ?bac_sy rdf:type ns:bac_sy ?bac_sy ns:thuoc_chuyen_khoa ?khoa FILTER (?khoa = ns:khoa_chan_thuong_chinh_hinh) } Quan hệ “thuộc chun khoa” thêm vào có tồn thực thể lớp “khoa” “chấn thương chỉnh hình” Kết thực truy vấn danh sách thực thể bao gồm thuộc tính, quan hệ tài liệu liên kết với thực thể tương ứng Trong trường hợp xuất hai câu truy vấn trên, hệ thống tương tác phản hồi với người dùng để chọn câu truy vấn phù hợp với yêu cầu người dùng Nếu người dùng đồng ý với kết kết thúc tìm kiếm Ngược lại, người dùng khơng đồng ý yêu cầu người dùng chọn số hướng tìm kiếm khác Với ví dụ đưa số đề xuất như: “Bạn muốn tìm bác sĩ?” hay “Bạn muốn tìm chun khoa” Ngồi ra, thay đổi số từ, cụm từ câu truy vấn cho phù hợp với miền ontology Ví dụ, từ “bác sĩ” hay “bác sĩ”, “khoa” hay “chuyên khoa’ Số lượng kết tìm kiếm thực tế tương đối lớn Vì vậy, cần có giảm tài liệu danh sách kết phương pháp phân hạng tài liệu Việc phân hạng giúp lọc danh sách tài liệu có mức độ liên quan với yêu cầu người dùng 2.2 Ứng dụng thực nghiệm Để minh họa mô hình tìm kiếm theo ngữ nghĩa, chúng tơi tiến hành xây dựng hệ thống thực nghiệm với ontology lĩnh vực y tế Lĩnh vực y tế lĩnh vực ln quan tâm, việc tìm kiếm thơng tin cụ thể chuyên sâu lĩnh vực cần thiết Trong phạm vi báo, thu thập khoảng 500 tập tin thuộc lĩnh vực khác từ trang web Các loại định dạng tập tin doc, docx, pdf Dựa vào nguồn liệu, xây dựng ontology gồm: 30 lớp, 61 thuộc tính, 25 quan hệ khoảng 400 thực thể Việc soạn thảo ontology tạo liên kết sử dụng công cụ Protégé [12] Chúng thực số loại truy vấn truy vấn theo lớp, truy vấn theo thực thể, truy vấn quan hệ truy vấn quan hệ ẩn Để minh họa, chúng tơi trình bày ví dụ truy vấn theo quan hệ Khi câu truy vấn người dùng có xuất lớp lớp có quan hệ với lớp khác mơ tả ontology Kết tìm kiếm loại truy vấn danh sách thực thể lớp Việc tìm kiếm cần xác định lớp yêu cầu người dùng Điều phụ thuộc vào thông tin theo lớp truy vấn, chẳng hạn, truy vấn có chứa thực thể thuộc lớp nào? truy vấn chứa tên quan hệ lớp nào? Mặt khác, hệ thống đưa gợi ý tìm theo lớp để người dùng chọn Ví dụ, tìm kiếm “các bác sĩ thuộc khoa chấn thương chỉnh hình” Trường hợp câu truy vấn xuất lớp: “Bác sĩ” “Khoa” Hệ thống kiểm tra mối quan hệ hai lớp xác định quan hệ “Thuộc chuyên khoa” Vì câu truy vấn tồn thực thể lớp khoa 26 Tìm kiếm thơng tin theo ngữ nghĩa dựa vào Ontology “khoa chấn thương chỉnh hình” Câu truy vấn SPARQL kết thu danh sách bác sĩ thuộc khoa chấn thương chỉnh hình 2: Hình 2: Kết truy vấn “bác sĩ thuộc khoa Hình 3: Kết người dùng tìm theo khoa chấn thương chỉnh hình” Hơn nữa, câu truy vấn xuất nhiều lớp nên hệ thống thực phản hồi với người dùng xem kết đáp ứng yêu cầu hay chưa Hệ thống gợi ý hướng tìm kiếm tiếp dựa vào hai lớp “bác sĩ” “khoa” hình Câu truy vấn SPARQL thứ đưa tìm khoa với điều kiện “khoa chấn thương chỉnh hình” Nội dung câu truy vấn sau (cho kết hình 3): Kết truy vấn danh sách thực thể Trong trường hợp người dùng muốn xem chi tiết thực thể chọn nhấn vào tên thực thể (ví dụ hình 4) Ngồi ra, chọn xem thực thể liên kết đến thực thể chọn Ví dụ, hình ba liên kết “thuốc paracetamol”, “thuốc Ibuprofen” “loại bệnh da liễu” Hình 4: Kết chọn thực thể 2.3 Hình 5: Một phần thông tin chi tiết thực thể Đánh giá thực nghiệm Với câu truy vấn thuộc loại trình bày phần 3, hệ thống ln trả danh sách thực thể phù hợp Các kết phụ thuộc nhiều vào liên kết thành phần 27 Phạm Thị Anh Lê, Nguyễn Phước Cường ontology tài liệu Thực nghiệm cho thấy, hệ thống đáp ứng tốt nhu cầu tìm kiếm người dùng lĩnh vực y tế, chẳng hạn, tìm kiếm thơng tin bệnh, phương pháp điều trị, biện pháp phòng chống, nơi điều trị bác sĩ điều trị Hơn nữa, q trình tìm kiếm khơng phụ thuộc vào nguồn liệu mà phụ thuộc vào ontology xây dựng nên tốc độ tìm kiếm nhanh Hệ thống thực nghiệm tồn số hạn chế Các câu truy vấn có chứa thực thể không đầy đủ thường trả kết có độ xác (có tài liệu khơng liên quan) Ví dụ, câu truy vấn “Bác sĩ Khoa”, hệ thống xác định từ “Khoa” thuộc hai loại, thực thể lớp “Bác sĩ”, lớp “Khoa” Do đó, hệ thống khơng xác định u cầu xác người dùng để đưa truy vấn SPARQL Đối với truy vấn có nhiều mối quan hệ, hệ thống chưa xử lí tốt kết Hướng giải thiết kế chức tìm kiếm theo dạng khn mẫu, cho phép người dùng tùy chọn tìm kiếm nâng cao Kết luận Trong báo xây dựng quy trình tìm kiếm thơng tin dựa vào ontology với mục đích tìm kiếm thơng tin chun sâu lĩnh vực Kết tập trung việc biến đổi truy vấn người dùng thành truy vấn ontology tạo liên kết tài liệu thành phần ontology Các kết thực nghiệm lĩnh vực y tế cho kết khả quan Các nghiên cứu tiếp tục triển khai truy vấn phức tạp phương pháp tìm kiếm thông tin theo ngữ nghĩa khác TÀI LIỆU THAM KHẢO [1] Atanas Kiryakov, Borislav Popov, Ivan Terziev, Dimitar Monov, Damyan Ognyanoff, 2004 Semantic annotation, indexing, and retrieval Journal of Web Semantics, vol 2, no 1, pp 49-79 [2] Christopher D.Manning, Prabhakar Raghavan, Hinrich Schutze, 2009 An introduction to Information retrieval Online edition c 2009 Cambridge UP [3] David Vallet, Miriam Fernandez and Pablo Castells, 2005 An Ontology-Based information retrieval model Universidad Autonoma de Madrid Second European Semantic Web Conference, ESWC 2005, LNCS 3532, pp 455–470 [4] Dieter, Fensel, 2003 Silver bullet for knowledge management and Electronic commerce Springer-Verlag New York, Inc Secaucus, NJ, USA c [5] Evren Sirin, Bijan Parsia, 2007 SPARQL – DL: SPARQL Query for OWL-DL In proceeding of: Proceedings of the OWLED 2007 Workshop on OWL: Experiences and Directions, Innsbruck, Austria [6] G.Chowdhury, 2010 Introduction to Modern Information Retrivieal, 3rd edition Facet publising 2010, ACM digital library [7] Kincho H Law, 2007 Ontology: Basic Definitions and a Brief Introduction TN-2007-03 NEESit – Workshops [8] Pablo Castells, Miriam Fernandez and David Vallet, 2007, An Adaptation of the Vector-Space Model for Ontology-Based Information Retrieval IEEE transactions on knowledge and data engineering, Vol 19, No 2, pp 261-271 [9] Pascal Soucy, Guy W Mineau, 2005 Beyond TFIDF Weighting for Text Categorization in the Vector Space Model In proceeding of the 19th international joint conference on Artificial intelligence, pp 1130-1135 28 Tìm kiếm thơng tin theo ngữ nghĩa dựa vào Ontology [10] Richard Fikes, Patrick Hayes, Ian Horrocks, 2004 OWL-DL – a language for deductive query answering on the semantic web (2003) Journal web semantics: Science, services and Agents on the World Wide Web 2(1):19-29 [11] Nhóm nghiên cứu thuộc HP Labs, Meg Whitman, CEO and President, HP (2000 – 2014) Nguồn: http://apache.jena.org [12] V Maniraj, Dr.R Sivakumar, 2010 Ontology languages – A review International Journal of Computer Theory and Engineering, Vol.2, No.6, pp 887-891 ABSTRACT Ontology based semantic information search Ontology is a useful tool to pressent the information and information semantic is described in a formal and explicit way In this paper, we present a model of semantic information searching based on ontology The domain ontology is designed in the field (subject) from material collected in the repository (search space) A query of the user is converted and executed in an ontology Search results will be linked to documents in a database to be returned to the user Experiments are carried out using data from a health field and some queries illustrate the results of the model Keywords: Information search, Semantic information search, Semantic information, Ontology, Query 29 ... sách kết tìm kiếm Kiến trúc phần hệ thống tìm kiếm, bao gồm phận lưu liệu tìm kiếm tập tài liệu, phân tích câu hỏi, tìm kiếm kết cho câu hỏi xếp kết tìm kiếm Quy trình tìm kiếm dựa vào ontology. .. diện tìm kiếm dựa theo khn mẫu Tìm kiếm theo khn mẫu cho phép người dùng chọn lựa mong muốn tìm kiếm, việc lựa chọn dựa vào lớp ontology miền xây dựng Sau đó, người dùng nhập thơng tin cần tìm. .. chức tìm kiếm theo dạng khn mẫu, cho phép người dùng tùy chọn tìm kiếm nâng cao Kết luận Trong báo chúng tơi xây dựng quy trình tìm kiếm thơng tin dựa vào ontology với mục đích tìm kiếm thơng tin