Tiểu luận BIỂU DIỄN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

66 806 5
Tiểu luận BIỂU DIỄN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tìm kiếm ngữ nghĩa dựa Ontology ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THÔNG TIN BIỂU DIỄN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG Tìm Kiếm Ngữ Nghĩa dựa Ontology Giảng viên hướng dẫn PGS.TS Đỗ Văn Nhơn Học viên: Huỳnh Lê Quốc Vương MHV: CH1101158 Tìm kiếm ngữ nghĩa dựa Ontology 01 – 2013 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN BIỂU DIỄN CƠNG NGHỆ TRI THỨC VÀ ỨNG DỤNG Tìm Kiếm Ngữ Nghĩa dựa Ontology Giảng viên hướng dẫn PGS.TS Đỗ Văn Nhơn Tìm kiếm ngữ nghĩa dựa Ontology Học viên: Huỳnh Lê Quốc Vương 01 – 2013 MỤC LỤC MHV: CH1101158 Tìm kiếm ngữ nghĩa dựa Ontology MỞ ĐẦU Lượng thông tin khổng lồ ngày gia tăng World Wide Web tạo nhu cầu lớn cho công cụ kỹ thuật để xử lý liệu có ngữ nghĩa Hiện thực tế hệ thống thông tin truy hồi phần lớn dựa tìm kiếm theo từ khóa với liệu full-text mơ hình hóa theo bag-of-word Đó lý sử dụng cơng cụ tìm kiếm thông tin Internet, thường xuyên phải đối mặt với lượng lớn thông tin không hợp lý, chí khơng liên quan đến vấn đề mà quan tâm Vậy đâu lý dẫn tới thơng tin sai lệch kết tìm kiếm Đó cách biểu diễn nội dung website dạng liệu thô Để giải điều này, có nhiều cách tiếp cận khác nhau, số ontology Bài thu hoạch giới thiệu tổng quan truy hồi thông tin, quy trình mơ hình chúng Tiếp theo giới thiệu ontology định nghĩa, thành phần, phân loại xây dựng chúng Với lý thuyết đó, ta xây dựng ứng dụng tìm kiếm địa điểm quán ăn, nhà hàng, café, … dựa ontology với thông tin rút trích từ liệu free-text website ‘quananngon.com.vn’, ‘gucafe.com’, ‘chudu24.com’, … Các đánh giá kết cho thấy, ứng dụng có khả xử lý với truy vấn phức tạp dựa giao diện thân thiện với người dùng truy vấn dạng free-text Lời cảm ơn, em chân thành xin dành cho thầy Nhơn kiến thức Thầy mang lại để giúp em có hồn thành tốt thu hoạch Tìm kiếm ngữ nghĩa dựa Ontology I CƠ SỞ LÝ THUYẾT Truy hồi thông tin Ngày nay, số lượng thông tin kho tài liệu phát triển cách chóng mặt, đa số lưu trữ định dạng số World Wide Web (WWW) ví dụ rõ ràng nhất, ước tính 20 tỷ tài liệu theo thống kê Yahoo vào 2005 Ngồi cịn có thư viện số, mạng nội công ty, … Tuy nhiên, có nội dung khơng có nghĩa hữu ích Ngược lại, người dùng khơng phải lúc tìm thấy thơng tin cần Vấn đề xuất ngày đầu cơng nghệ máy tính Vào 1930 Vannevar Bush nghĩ máy gọi Memex, “một thiết bị lưu trữ sách, viết, hội nghị ông ta để dùng việc tham khảo với tốc độ nhanh chóng” Năm 1950 Calvin Mooers đưa thuật ngữ “Information Retrieval” khơng chấp nhận năm 1960, Maron & Kuhns định nghĩa vấn đề Information Retrieval “xác định đầy đủ nội dung thông tin tài liệu” Với ý tưởng này, nhiều nghiên cứu thực sau với mục đích làm cho thơng tin có sẵn kho chứa (dữ liệu số) truy cập cách dễ dàng hiệu hữu ích Tóm lại, truy hồi thông tin lĩnh vực nghiên cứu lâu đời khoa học thông tin Mục tiêu IR tìm kiếm đưa tài liệu thích hợp cho nhu cầu thơng tin người dùng Vì hệ thống IR tốt nên trả tài liệu mà đáp ứng nhu cầu người dùng, không nên bao gồm liệu khơng cần thiết Tìm kiếm ngữ nghĩa dựa Ontology 1.1 Quy trình truy hồi thơng tin Các hệ thống truy hồi thông tin ngày phát triển cải tiến nhiều so với xuất lần vào năm 1950 Tuy nhiên, trình xử lý khơng thay đổi Input: Một hệ thống IR có hai input chính, u cầu người dùng loại thơng tin đáp ứng - Yêu cầu người dùng: trình truy hồi thơng tin bắt đầu người dùng biểu diễn thông tin họ cần đến hệ thống Trong trường hợp thơng Tìm kiếm ngữ nghĩa dựa Ontology thường, thơng tin chuyển tải hình thức chuỗi tìm kiếm, biểu diễn hình thức khác, trường hệ thống truy hồi đa phương tiện, input ảnh, âm thanh, … - Loại thông tin đáp ứng: loại thông tin truy hồi để đáp ứng – trả lời truy vấn người dùng Nó phân loại chủ yếu theo định dạng (văn tài liệu, âm thanh, video, ảnh, …) độ chi tiết (trang web, đoạn văn, câu, …) Output: Một hệ thống IR thông thường trả output chính, bao gồm danh sách thơng tin xếp hạng Các thơng tin văn bản, âm thanh, video, … Quy trình: hệ thống IR theo Croft & Harper - 1993 có ba quy trình chính: - Trích đặc trưng nội dung biểu diễn chúng hình thức logic (đánh mục) - Xử lý yêu cầu thông tin người dùng thành biểu diễn (xử lý truy vấn) - So khớp biểu diễn (tìm kiếm xếp hạng) • Đánh mục: tất mẩu (phần) thông tin có ý nghĩa việc “nói” lên ý nghĩa thơng tin Ví dụ ngôn ngữ viết, vài từ mang nhiều nghĩa từ khác Do đó, thường có q trình tiền xử lý thông tin để chọn phần tử đặc trưng cho việc đánh mục Các mục cấu trúc liệu xây dựng để tăng tốc trình tìm kiếm Cấu trúc đánh mục phổ biến cho văn tập tin đảo ngược Cấu trúc bao gồm hai thành phần: tập từ vựng số Tìm kiếm ngữ nghĩa dựa Ontology lần từ xuất Tập từ vựng tập tất từ xuất văn Với từ từ vựng, danh sách tất vị trí văn nơi từ vựng xuất lưu trữ lại • Xử lý truy vấn: yêu cầu người dùng (truy vấn) phân tích chuyển thành hình thức theo hệ thống IR Trong trường hợp truy hồi văn bản, từ truy vấn thông thường tiền xử lý thuật toán việc chọn phần tử đặc trưng để đánh mục Các xử lý truy vấn phụ mở rộng truy vấn (query expansion) cần có nguồn tài nguyên từ điển (thesauri) hay phân cấp • Tìm kiếm: truy vấn so khớp với mục thông tin Một tập mục thông tin có tiềm trả cho người dùng Có nhiều cách khác để thu tập thơng tin tiềm này, phụ thuộc vào định dạng thông tin (văn bản, âm thanh, video, …) tất trường hợp, vài hình thức đơn giản hóa thực mơ hình thơng tin để dễ dàng xử lý Ví dụ, truy hồi văn thường xây dựng giả định việc so khớp mục thông tin (các tài liệu) yêu cầu thông tin người dùng (chuỗi truy vấn) dựa tập từ đánh mục Điều rõ ràng (chấp nhận lý hiệu quả) mát thông tin ngữ nghĩa văn lập lại tập từ Một tình tương tự xảy truy hồi multimedia so khớp thực dựa đặc trưng tín hiệu số • Xếp hạng: bước xếp hạng nhằm mục đích dự đốn mức độ liên quan mục thơng tin với truy vấn, sau trả chúng theo thứ tự giảm dần đến người dùng Các thuật toán xếp hạng xem lõi hệ thống IR, chúng chìa khóa để định hiệu hệ thống Tìm kiếm ngữ nghĩa dựa Ontology Các yếu tố khác: sử dụng chủ yếu để giúp cho việc biểu diễn, trích chọn hay xử lý yêu cầu người dùng nghĩa nội dung Hiểu ngữ nghĩa đằng sau mục thông tin truy vấn người dùng giúp nâng cao độ xác q trình truy hồi, gia tăng thỏa mãn người dùng Ba yếu tố chủ yếu sử dụng hệ thống IR là: giao diện người dùng, thao tác xử lý truy vấn, nguồn tài nguyên sử dụng để hỗ trợ đánh mục • Giao diện người dùng: giao diện người dùng “mềm dẻo” không cần thiết cho người dùng biểu diễn yêu cầu họ mà biểu diễn ràng buộc cho thơng tin mà họ tìm kiếm (ví dụ., nội dung xác, nội dung tương tự, nội dung khơng trùng nhau, nội dung theo ngày tháng, ngôn ngữ, định dạng, …) • Các thao tác xử lý truy vấn: phụ thuộc vào kiểu truy vấn, có chế khác sử dụng để tinh lọc truy vấn Phổ biến dựa vào input hỗ trợ thêm người dùng cách tiếp cận dựa phản hồi nhìn chung hiệu Tuy nhiên, chúng giảm tính hiệu dụng hệ thống, nguồn tài ngun ngồi khác, chẳng hạn từ điển phân cấp thường sử dụng thay hay bổ sung để tự động phân loại, làm cho truy vấn thành nghĩa (hoàn chỉnh nghĩa câu truy vấn) hay mở rộng truy vấn • Các nguồn tài nguyên sử dụng để hỗ trợ đánh mục: nguồn tài nguyên xử lý tài liệu chẳng hạn từ điển từ vựng điều chỉnh sử dụng để hỗ trợ cho việc chọn từ thích hợp cho việc đánh mục Tìm kiếm ngữ nghĩa dựa Ontology 1.2 Các mơ hình truy hồi thơng tin Thuật tốn xếp hạng thành phần đặc trưng hệ thống IR Một thuật toán xếp hạng hoạt động dựa theo tiền đề khái niệm độ tương tự tài liệu Các tập hợp hay tiền đề khác phát sinh mơ hình IR khác Có ba mơ hình IR văn là: Boolean, Vector Xác suất Trong mơ hình Boolean, tài liệu truy vấn biểu diễn tập mục từ Trong mơ hình khơng gian vector, tài liệu truy vấn biểu diễn vector không gian t chiều Trong mô hình xác suất bản, biểu diễn tài liệu truy vấn dựa lý thuyết xác suất Theo định nghĩa (Baeza Yaytes & Ribeiro Neto, 1999) mơ hình IR bốn [D, Q, F, sim], đó: • D tập tài liệu • Q tập truy vấn • F framework để mơ hình hóa tài liệu, truy vấn, mối quan hệ chúng • sim: Q × D → U hàm xếp hạng, thể liên kết tài liệu truy vấn, với U tập hợp có thứ tự (thông thường [0, 1], hay P, hay tập chúng) Xếp hạng thứ tự U xác định thứ tự tập tài liệu truy vấn Tìm kiếm ngữ nghĩa dựa Ontology Có nhiều phương pháp để truy vấn sở tri thức ngữ nghĩa truy hồi kết Có cách truy vấn bản: truy vấn dựa từ khóa, dựa ngơn ngữ tự nhiên, dựa view, dựa form Truy vấn ngơn ngữ tự nhiên, cịn nhiều nghiên cứu Do đó, ta chọn truy vấn dựa từ khóa cho phép người dùng thoải mái thực truy vấn Các cách khác chúng cho phép truy vấn xác hơn, yêu cầu tương tác với người dùng nhiều hơn, đồng thời phụ thuộc vào quy mơ lĩnh vực truy vấn Trong tìm kiếm dựa từ khóa truyền thống, tài liệu đánh mục thường chứa đoạn văn thơ gắn với tài liệu Lucene dễ dàng xử lý mục xếp hạng mặc định thường cho kết tốt Tuy nhiên, với mục phức tạp nên xử lý cẩn thận Để lợi dụng ưu điểm ontology, ta cần phải thay đổi chút chế xếp hạng truy vấn Lucene Trước tiên nhất, ta tăng xếp hạng trường chứa thơng tin rút trích suy diễn để nhấn mạnh tầm quan trọng chúng Thứ hai, trường xếp hạng theo độ quan trọng chúng Ví dụ, tìm kiếm với từ khóa “hải sản” có nhiều quán ăn, nhà hàng, khách sạn có hải sản, với trường tên địa điểm ưu tiên địa điểm có tên chứa cụm từ “hải sản” trả trước tiên Hiện thực hệ thống Để xây dựng hệ thống thiết kế, công cụ thư viện chương trình sử dụng: - Thư viện sử dụng để thu thập thông tin từ website crawler4j ‘http://code.google.com/p/crawler4j/’ Tìm kiếm ngữ nghĩa dựa Ontology - Các đoạn mã html trả lọc lấy văn qua phân tích cú pháp html jsoup ‘http://jsoup.org/’ - Ontology quản lý, trì cơng cụ Protégé ‘http://protege.stanford.edu/’ với ngôn ngữ OWL thư viện quản lý luật, suy diễn Jena ‘http://jena.apache.org’ Phân cấp lớp Trong lớp “Nơi” có thuộc tính diaChi (single string) – địa địa điểm id (single int) – id địa điểm ten (single string) – tên địa điểm hinhAnh (single string) – hình ảnh đại diện địa điểm Trong lớp “Nơi Ăn Uống” có thuộc tính Tìm kiếm ngữ nghĩa dựa Ontology mon (multiple string) – nơi ăn uống monDacTrung (multiple string) – đặc trưng nơi ăn uống phongCach (multiple string) – phong cách nơi ăn uống tienNghi (multiple string) – tiện nghi nơi có dacDiemNoiBat (multiple string) – đặc điểm bật nơi ăn uống Trong lớp “Nơi Nghỉ” có thuộc tính tienNghi (multiple string) – tiện nghi nơi Trong lớp “Khách Sạn” có thuộc tính soSao (single int) – số khách sạn giaPhong (multiple string) – giá phòng khách sạn - Mã nguồn mở Lucene dùng cho đánh mục tìm kiếm ‘lucene.apache.org’ - Ngoài ra, thư viện vnTonkenizer ‘http://vlsp.vietlp.org:8080/demo/? page=resources’ sử dụng để tách từ opennlp để xử lý ngôn ngữ tự nhiên ‘http://opennlp.apache.org/’ Đánh giá hệ thống Tìm kiếm ngữ nghĩa dựa Ontology Để đánh giá hệ thống, ta thu thập liệu lớp 10 thể hiện, gồm có quán ăn, nhà hàng, quán kem, café, khách sạn, nhà nghỉ Với tập liệu này, chưa qua rút trích chọn lọc thông tin, chúng đánh mục để thử nghiệm theo phương pháp truy hồi truyền thống Sau đó, dựa ontology, chúng đánh mục lần để kiểm nghiệm phương pháp truy hồi hướng ngữ Các câu truy vấn sử dụng để thử nghiệm (những từ in đậm câu truy vấn): Tìm tất quán ăn: quán ăn Tìm tất quán ăn hải sản: quán ăn hải sản Tìm tất quán ăn hải sản có máy lạnh: quán ăn hải sản máy lạnh Tìm tất quán ăn để tiếp khách: quán ăn tiếp khách Tìm tất quán khách sạn: khách sạn Tìm tất quán khách sạn: khách sạn Tìm tất quán cafe: cafe Tìm tất quản cafe thích hợp để học bài: cafe học Tìm tất quản cafe thích hợp để hẹn hị: cafe hẹn hị 10 Tìm tất nhà hàng: nhà hàng 11 Tìm tất nhà hàng theo phong cách nhật bản: nhà hàng phong cách nhật Tìm kiếm ngữ nghĩa dựa Ontology 12 Tìm tất quán kem: quán kem 13 Tìm tất quán kem có phong cách nước ngồi: qn kem phong cách nước ngồi Một ví dụ tính tốn độ xác trung bình Ở đây, ta sử dụng độ xác trung bình để đánh giá tất câu truy vấn Vì vậy, ta cần hiểu rõ tính tốn Giả sử, ta có ví dụ sau: d2 d4 d1 d6 d11 d20 … Tập tài liệu trả Tìm kiếm ngữ nghĩa dựa Ontology Ta có truy vấn mà nên có tài liệu trả về, tài liệu có liên quan với câu truy vấn Kết trả hình trên, tài liệu thích hợp cho truy vấn nằm vị trí 2, Độ xác trung bình trường hợp tính sau: Trong biểu thức trên, 1/2 độ xác độ bao phủ mức 2, 2/4 độ xác độ bao phủ mức 4, tương tự với 3/5 độ xác độ bao phủ mức Độ xác trung bình 100% có nghĩa tất tài liệu liên quan với câu truy vấn nằm hết vị trí đầu Phân tích kết Trước xem bảng tổng hợp kết câu truy vấn cách đánh mục Ta phân tích cho thấy hiệu việc rút trích thơng tin, suy diễn theo ontology Với truy vấn tìm tất quán ăn cách đánh mục cho kết với độ xác trung bình 100% Tương tự với câu truy vấn cho loại địa điểm khác (nhà hàng, cafe, khách sạn, …) với từ khóa tìm kiếm loại địa điểm Với câu truy vấn thứ 8, tìm tất qn cafe thích hợp để học Bởi liệu thu thập từ website chứa cụm từ “không gian yên tĩnh”, Tìm kiếm ngữ nghĩa dựa Ontology với cách đánh mục truyền thống khơng thể tìm kiếm quán café để học Tuy nhiên, ta rút trích thơng tin cho thuộc tính “thích hợp” học Tương tự, với câu truy vấn số 9, cụm từ “không gian lãng mạn”, “quán café lãng mạn” ta cho địa điểm thích hợp cho việc “hẹn hị” Ở câu truy vấn thứ 13, tìm qn kem có phong cách nước Ta suy diễn dựa danh sách thuộc tính “phong cách” ontology Với quốc gia “Nhật, Mỹ, Ý, …” ta có suy diễn thành thuộc tính cha cho thuộc tính “phong cách” với nội dung “nước ngồi” Nhờ đó, bảo đảm quán kem phong cách “Việt Nam” tìm thấy Truy vấn 10 11 12 13 Truyền thồng Ngữ nghĩa 10/10 = 100% 10/10 = 100% 3/3 = 100% 3/3 = 100% 1.74/2 = 87% 2/2 = 100% 2/2 = 100% 2/2 = 100% 10/10 = 100% 10/10 = 100% 2.73/6 = 45.5% 6/6 = 100% 10/10 = 100% 10/10 = 100% 0/4 = 0% 4/4 = 100% 0/9 = 0% 9/9 = 100% 10/10 = 100% 10/10 = 100% 1.43/2 = 71.5% 2/2 = 100% 10/10 = 100% 10/10 = 100% 0/2 = 0% 2/2 = 100% Độ xác trung bình cách đánh mục Tìm kiếm ngữ nghĩa dựa Ontology Kết cho thấy ưu điểm việc xây dựng ontology thay tìm kiếm theo cách truyền thống Tuy nhiên, để có kết 100% thế, ngồi việc xây dựng ontology, hệ thống cịn sử dụng vnTonkenizer để thực việc tách từ câu truy vấn để đảm bảo độ xác cao Nhưng việc tách từ sai, truy vấn người dùng hay hệ thống kết dẫn tới 0% (tức khơng có tài liệu thích hợp với truy vấn) Nhưng với cách tìm kiếm truyền thống lại có tài liệu trả Tìm kiếm ngữ nghĩa dựa Ontology III TỔNG KẾT Ontology ngày sử dụng nhiều lĩnh vực Chúng chia sẻ kiến thức chung người phần mềm với Nếu hệ thống chia sẻ chung ontology bên liệu người nhập vào hệ thống sau xử lý thơng qua ontology tổng hợp, phân tích hệ thống khác cung cấp thông tin cho người sử dụng khác Chúng tái sử dụng kiến thức lĩnh vực Ngồi ra, thơng qua chúng, ta phân tích suy luận kiến thức chun ngành thuật ngữ, khái niệm mối quan hệ chúng khai báo, đặc tả ontology với cấu trúc suy luận theo ngữ nghĩa Cụ thể khái niệm lưu cấu trúc phân cấp, tên khái niệm quan hệ từ cụm từ có nghĩa biểu diễn cho phát biểu Trong web ngữ nghĩa, ontology xem xương sống cho tảng web tương lai Đặc biệt lĩnh vực truy hồi thông tin, ngày nhiều báo, luận văn nghiên cứu lĩnh vực Bài thu hoạch tìm hiểu vài khía cạnh ontology thành phần, phân loại, ontology-learning … hệ thống truy hồi thông tin với ontology Kết đạt phần chứng minh ưu điểm việc sử dụng ontology cho tìm kiếm hướng ngữ nghĩa Vì thời gian hạn chế, nên chưa phát triển ontology giàu liệu, giàu tính suy diễn để thể sức mạnh cịn nhiều vấn đề cần phải nghiên cứu chẳng hạn ontology-learning Tìm kiếm ngữ nghĩa dựa Ontology TÀI LIỆU THAM KHẢO Trần Đình Khang, Vũ Tuyết Trinh, Đỗ Đức Thành, Đỗ Thị Ngọc Quỳnh, Một phương pháp tìm kiếm dựa Ontology phục vụ quản lý thông tin khoa học công nghệ, 2007 Trần Công Danh, Nguyễn Ngọc Khánh Linh, Xây dựng làm giàu Ontology Tiếng Việt chuyên ngành Công Nghệ Thông Tin, 2011 Huỳnh Thị Thanh Thương, Nghiên cứu mơ hình tổ chức kỹ thuật tìm kiếm có ngữ nghĩa kho tài nguyên học tập lĩnh vực CNTT, 2012 Miriam Fernandez Sanchez, Semanticaly enhanced Information Retrieval: an ontology-based approach, 2009 Natalya F Noy, Deborah L McGuiness, Ontology Development 101: A Guide to Creating Your First Ontology Agissilaos Andreou, Ontologies and Query Expansion, 2005 J.Uma Mahewari, G.R.Karpgam, A Conceptual Framework for Ontology based information retrieval, International Journal of Engineering Science and Technology, 2010 Tìm kiếm ngữ nghĩa dựa Ontology D Mukhopadhyay, A Banik, S Mukherjee, J Bhattacharya, Y Kim, A Domain Specific Ontology Based Semantic Web Search Engine Chris Biemann, Ontology Learning from Text: A Survey of Methods, 2005 T Tran, P Cimiano, S Pudolph, R Studer, Ontology-Based Interpretation of Keywords for Semantic Search, 2007 J.Lee, J.Min, C Chung, An Effective Sematic Search Technique using Ontology, 2009 Matthew Horridge, A Practical Guide To Building OWL Ontologies Using Protégé and CO-ODE Tools, Edition 1.3,2011 Tìm kiếm ngữ nghĩa dựa Ontology PHỤ LỤC HƯỚNG DẪN SỬ DỤNG Phần hướng dẫn cách sử dụng chương trình, yêu cầu để chương trình thực thi u cầu - Chương trình viết máy Pentium® Dual-Core CPU 2.8 GHz, RAM 4GB, OS WIN Professional 64bit - IDE: Netbeans 7.2 - Ngơn ngữ để viết chương trình JAVA, máy phải cài JRE/JDK7u4 phiên cao hơn, download (http://www.oracle.com/technetwork/java/javase/downloads/jre-7u4download-1591157.html) - Máy có kết nối Internet (để lấy hình ảnh địa điểm) Thực thi - Chương trình thực thi chứa thư mục ‘Program\bin’ Mã nguồn chương trình chứa thư mục ‘Program\SourceCode’ Tập tin owl dùng để biểu diễn ontology nằm thư mục ‘Program\bin\owl’ Có thể dùng cơng cụ Protégé để quản lý ontology Tìm kiếm ngữ nghĩa dựa Ontology - Thư mục ‘Program\bin\resources’ chứa liệu dùng để thực xử lý tách từ - Để chạy chương trình, click vào tập tin ‘PlaceSearch.jar’ thư mục ‘Program\bin’ hay dùng command sau java –jar PlaceSearch.jar Sau chạy chương trình, giao diện chương hiển thị lên sau Tìm kiếm ngữ nghĩa dựa Ontology Giao diện chương trình Phía bên tay phải danh sách địa điểm thu thập Tìm kiếm ngữ nghĩa dựa Ontology Danh sách địa điểm thu thập Khung cho người dùng nhập câu truy vấn Khi nhập truy vấn, chương trình có auto complete đơn giản để hỗ trợ ... loại ontology sau: - Ontology biểu diễn tri thức (Knowledge representation Ontology) nắm giữ biểu diễn nguyên thủy dùng để chuẩn hóa tri thức mơ hình biểu diễn tri thức Một ontology thuộc loại... dựa Ontology 01 – 2013 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN BIỂU DIỄN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG Tìm Kiếm Ngữ Nghĩa dựa Ontology Giảng viên hướng dẫn PGS.TS Đỗ... hợp thơng tin biểu diễn quản lý tri thức Ontology giúp ta xây dựng mạng lưới ngữ nghĩa, từ điển lĩnh vực chuyên môn hỗ trợ ứng dụng, giúp ta mã hóa tri thức lĩnh vực thành hệ tri thức dùng chung

Ngày đăng: 10/04/2015, 09:58

Từ khóa liên quan

Mục lục

  • MỞ ĐẦU

  • I. CƠ SỞ LÝ THUYẾT

    • 1. Truy hồi thông tin

    • 1.1. Quy trình truy hồi thông tin

    • 1.2. Các mô hình truy hồi thông tin

    • 1.2.1. Mô hình Boole

    • 1.2.2. Mô hình không gian vector

    • 1.2.3. Mô hình xác suất

    • 1.2.4. Các mô hình khác

    • 1.3. Truy hồi thông tin hướng ngữ nghĩa

    • 1.3.1. Xử lý ngôn ngữ tự nhiên

    • 1.3.2. Ontology

    • 1.4. Đánh giá hệ thống truy hồi

    • 2. Ontology

    • 2.1. Định nghĩa

    • 2.2. Các thành phần của Ontology

    • 2.3. Phân loại ontology

    • 2.4. Xây dựng một ontology

    • 2.4.1. Về mặt ý niệm

    • 2.4.2. Về phương pháp

    • 2.4.3. Về ngôn ngữ

Tài liệu cùng người dùng

Tài liệu liên quan