1. Trang chủ
  2. » Luận Văn - Báo Cáo

TÌM HIỂU ONTOLOGY VÀ ỨNG DỤNG CỦA ONTOLOGY

28 3,1K 25

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 28
Dung lượng 2,35 MB

Nội dung

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN GV. HƯỚNG DẪN : PGS.TS. ĐỖ VĂN NHƠN HỌC VIÊN : PHAN TỬ ÁNH MÃ HV : CH1301080 BÀI THU HOẠCH MÔN BIỂU DIỄN TRI THỨC VÀ SUY LUẬN ĐỀ TÀI: TÌM HIỂU ONTOLOGY VÀ ỨNG DỤNG CỦA ONTOLOGY MỤC LỤC MỞ ĐẦU 3 NỘI DUNG 4 1. CÁC KHÁI NIỆM 4 1.2. Tổng quan về Ontology: 4 1.3. Logic mô tả 7 2. ỨNG DỤNG CỦA ONTOLOGY 8 2.1. Mạng ngữ nghĩa 8 2.2. Hệ chuyên gia 11 2.3. Lập trình hướng đối tượng 12 3. PHƯƠNG PHÁP XÂY DỰNG ONTOLOGY 13 4. NGÔN NGỮ ONTOLOGY WEB LANGUAGE (OWL) DL 14 5. CÔNG CỤ PROTÉGÉ 18 6. XÂY DỰNG CƠ SỞ TRI THỨC Y KHOA BẰNG ONTOLOGY 19 6.1. Mục Vêu 19 6.2. Thông Vn kỹ thuật 20 6.3. Các khái niệm chủ yếu 21 6.4. Định nghĩa các quan hệ 22 6.5 Biểu diễn luật 24 KẾT LUẬN 27 TÀI LIỆU THAM KHẢO 28 2 MỞ ĐẦU Việc biểu diễn tri thức đóng vai trò hết sức quan trọng trong việc khẳng định khả năng giải quyết vấn đề của một hệ cơ sở tri thức. Để hiểu rõ điều này, ta hãy tìm hiểu về mối liên hệ giữa tri thức và biểu diễn tri thức. Tri thức là tập hợp các thông tin được phát biểu một cách tường minh. Biểu diễn tri thức là một phương pháp mã hóa tri thức sao cho máy tính có thể xử lý được chúng. Ngày nay, với sự bùng nổ thông tin, nhất là thông tin trên web đang được rất nhiều nhà nghiên cứu quan tâm. Thế nhưng máy tính hiện nay chỉ có tác dụng nhận và hiển thị thông tin chứ không có khả năng đọc và hiểu được thông tin. Do vậy, việc tìm kiếm, tách chiết, lập luận để đưa ra tri thức cần thiết càng ngày càng khó khăn. Năm 1998, Tim Berners-Lee đã đề xuất ra web ngữ nghĩa (Semantic web), một sự phát triển của web hiện tại. Theo ông, web ngữ nghĩa ra đời sẽ khắc phục được những nhược điểm quan trong của web hiện tại, làm cho máy tính có thể hiểu thông tin trên web và như thế việc xử lý thông tin trên web trở nên thuận lợi và chính xác hơn. Cũng theo ông, nền tảng cơ bản của web ngữ nghĩa là Ontology. Trong một vài năm gần đây, việc áp dụng ontology như một hình thức biểu diễn tri thức trong các lĩnh vực ứng dụng khác nhau đã có những bước tiến quan trọng. Ontology mô tả không chỉ khái niệm và thuộc tính mà còn cung cấp các quan hệ cũng như các tiên đề phục vụ cho việc suy luận. Ontology có rất nhiều lợi thế như cho phép thêm ngữ nghĩa vào dữ liệu, quản lý và cập nhật tri thức, tích hợp dữ liệu cũng như tái sử dụng các thành phần dễ dàng hơn. Nhờ đó, ontology là mô tả chính thức của một số bộ từ vựng chuyên môn. Công dụng quan trọng nhất của ontology là biểu diễn tri thức. Ontology đã được sử dụng thành công trong các hệ thống chuyên gia, mạng ngữ nghĩa… Do hình thức lý thuyết là logic mô tả, ontology có lợi thế cả về diễn đạt ngữ nghĩa lẫn cơ chế suy luận. Mục tiêu của bài thu hoạch này là tiếp cận các kiến thức về ontology, cũng như ngôn ngữ OWL (Ontology Web Language), từ đó xây dựng thử nghiệm một hệ cơ sở tri thức về lĩnh vực y khoa. 3 NỘI DUNG 1. CÁC KHÁI NIỆM 1.1. Biểu diễn tri thức: là một phương pháp mã hóa tri thức sao cho máy tính có thể xử lý được chúng. 1.2. Tổng quan về Ontology: Thuật ngữ “Ontology” đã xuất hiện từ rất sớm. Trong cuốn sách “Siêu hình” (Metaphysics) của mình, Aristotle đã định nghĩa: “Ontology là một nhánh của triết học, liên quan đến sự tồn tại và bản chất các sự vật trong thực tế”. Hay nói cách khác, đối tượng nghiên cứu chủ yếu của Ontology xoay quanh việc phân loại các sự vật dựa trên các đặc điểm mang tính bản chất của nó. Ontology là một thuật ngữ mượn từ triết học được tạm dịch là “bản thể học”, nhằm chỉ khoa học mô tả các loại thực thể trong thế giới thực và cách chúng liên kết với nhau. Trong ngành khoa học máy tính và khoa học thông tin, Ontology mang ý nghĩa là các loại vật và quan hệ giữa chúng trong một hệ thống hay ngữ cảnh cần quan tâm. Các loại vật này còn được gọi là khái niệm, thuật ngữ hay từ vựng có thể được sử dụng trong một lĩnh vực chuyên môn nào đó. Ontology cũng có thể hiểu là một ngôn ngữ hay một tập các quy tắc được dùng để xây dựng một hệ thống Ontology. Một hệ thống Ontology định nghĩa một tập các từ vựng mang tính phổ biến trong lĩnh vực chuyên môn nào đó và quan hệ giữa chúng. Sự định nghĩa này có thể được hiểu bởi cả con người lẫn máy tính. Một cách khái quát, có thể hiểu Ontology là "một biểu diễn của sự khái niệm hoá chung được chia sẻ" của một miền hay lĩnh vực nhất định. Nó cung cấp một bộ từ vựng chung bao gồm các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này. Ngoài bộ từ vựng, Ontology còn cung cấp các ràng buộc, đôi khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nó được sử dụng trong một lĩnh vực mà có thể được giao tiếp giữa người và các hệ thống ứng dụng phân tán khác. Ontology được sử dụng trong trí tuệ nhân tạo, công nghệ Web ngữ nghĩa (Semantic 4 Web), các hệ thống kỹ thuật, kỹ thuật phần mềm, tin học y sinh và kiến trúc thông tin như là một hình thức biểu diễn tri thức về thế giới hoặc một số lĩnh vực cụ thể. Việc tạo ra các lĩnh vực về Ontology cũng là cơ sở để định nghĩa và sử dụng của cơ cấu một tổ chức kiến trúc(an enterprise architecture framework). Định nghĩa 1: Thông thường, ontology được định nghĩa như một cấu trúc bao gồm những thành phần sau (Gruber 1993; Fensel 2001): • C – tập các khái niệm (Concept); • I – tập các thể hiện của khái niệm; • R – tập các quan hệ hai ngôi được định nghĩa trên C; • Z – tập các tiên đề, là các công thức logic biểu diễn các ràng buộc toàn vẹn trong tập các thể hiện và khái niệm. Định nghĩa 2: Một ontology là một bộ tứ O = (C, P, R, A), trong đó: • C là một tập các khái niệm được định nghĩa trong một miền. Một khái niệm thường được xem như một lớp của ontology. • P là một tập các thuộc tính. Một thuộc tính p ∈ P được định nghĩa như một thể hiện của một quan hệ ba ngôi có dạng p(c, v, f), trong đó c ∈ C là một khái niệm ontology, v là một giá trị thuộc tính gắn với c và f định nghĩa các mặt giới hạn trên v. Một vài mặt giới hạn bao gồm loại (f t ), lực lượng (f c ) và phạm vi (f r ). Mặt giới hạn f t có thể là bất kỳ kiểu dữ liệu nào được hỗ trợ bởi trình soạn thảo ontology, ví dụ như f t ∈ {boolean, integer, float, string, symbol, instance, class, …}. Mặt giới hạn lực lượng f c định nghĩa cận trên và cận dưới của số lượng giá trị thuộc tính. Mặt giới hạn phạm vi f r chỉ định một phạm vi các giá trị có thể gán cho thuộc tính. • R = {r | r ⊆ C × C × R t } là một tập các quan hệ ngữ nghĩa hai ngôi được định nghĩa giữa các khái niệm trong C. R t = {một-một, một-nhiều, nhiều- nhiều} là tập các kiểu quan hệ. • A là một tập các tiên đề. Mỗi tiên đề là một chân lý hoặc luật suy diễn. Ontology lĩnh vực: Một Ontology lĩnh vực mô hình hóa một lĩnh vực chuyên môn, hay một phần của thế giới. Ontology lĩnh vực thể hiện những ý nghĩa riêng của các vấn đề khi áp dụng vào lĩnh vực đó. Ví dụ, từ “card” có nhiều rất nghĩa. Một ontology chuyên về bài pocker sẽ mô phỏng nghĩa “playing card” (lá bài) của thế giới, trong khi một 5 ontology lĩnh vực về máy tính lại mô phỏng ý nghĩa “puched card” (thẻ đục lỗ) và “video card” (card màn hình). Định nghĩa 3: Một Ontology lĩnh vực định nghĩa một tập các thuật ngữ gọi là khái niệm. Các mối quan hệ giữa những khái niệm này diễn tả một thế giới mục tiêu. Ontology lĩnh vực được định nghĩa qua bốn tầng, bao gồm tầng lĩnh vực, tầng phân hệ, tầng sự kiện, và tầng chứa các lớp. Một ontology miền thể hiện một tên miền của một ontology và bao gồm nhiều phân hệ khác nhau được định nghĩa bởi các chuyên gia trong lĩnh vực. Mỗi phân hệ được tổ hợp bới các tập sự kiện, kế thừa từ những bản thông tin bởi các chuyên gia lĩnh vực. Mỗi sự kiện bao gồm một vài khái niệm của của tầng chứa lớp. Trong tầng chứa lớp, mỗi khái niệm chứa một tên khái niệm, một tập thuộc tính và một tập tóa tử cho một ứng dụng lĩnh vực. Ontology lĩnh vực có ba loại quan hệ, bao gồm khái quát hóa, quy nạp và liên đới. Quan hệ giữ lĩnh vực và các phân hệ tương ứng là sự khái quát hóa, thể hiện quan hệ “thuộc loại”. Quan hệ giữa mỗi phân hệ và những sự kiện tương ứng là sự quy nạp. Quan hệ quy nạp diễn tả quan hệ “là một phần của”. Liên đới là một quan hệ ngữ nghĩa giữa các lớp trong một tầng. Hình 1: Mô hình Ontology lĩnh vực 6 Ontology thượng tầng: Một ontology thượng tầng (hay ontology nền) là một mô hình các đối tượng thuật ngữ thông dụng mà có thể áp dụng cho số lượng lớn các ontology miền. Ontology thượng tầng chứa một từ điển cốt lõi trong đó mô tả những đối tượng thuật ngữ thuộc một tập hợp các lĩnh vực. Có rất nhiều ontology được chuẩn hóa có thể sử dụng được, bao gồm Dublin Core, GFO, OpenCyc/ResearchCyc, SUMO, and DOLCE. WorldNet, đôi khi được xem như một ontology thượng tầng, thực ra không hoàn toàn là một ontology. Mặc dù vậy, WorldNet được cài đặt như là một công cụ ngôn ngữ để nghiên cứu ontology lĩnh vực. 1.3. Logic mô tả Logic mô tả (Description logics, viết tắt DL) là một họ các ngôn ngữ biểu diễn tri thức có thể sử dụng để biểu diễn tri thức thuật ngữ của một miền ứng dụng theo một cách có cấu trúc và được hiểu rõ một cách hình thức. Mặt khác, cái tên logic mô tả có ý nói đến các mô tả về khái niệm được dùng để mô tả một miền và ngữ nghĩa dựa trên logic (logic-based semantics) thu được qua việc dịch từ logic mệnh đề bậc nhất. Logic mô tả được thiết kế như là một mở rộng của khung ngữ nghĩa (semantic frame) và lưới ngữ nghĩa (semantic network), vốn không được trang bị một ngữ nghĩa dựa trên logic hình thức. Cú pháp: bao gồm • Một tập các ký hiệu mệnh đề dùng để ký hiệu các tên khái niệm (concept name); • Một tập các ký hiệu mệnh đề đôi để ký hiệu các tên vai trò (role name); • Một định nghĩa đệ quy để định nghĩa các thuật ngữ khái niệm từ các tên khái niệm và tên vai trò bằng cách sử dụng các tạo tử (constructor). Trong lôgic mô tả, các tên khái niệm được xem là các khái niệm nguyên tử, các tên vai trò được coi là các vai trò nguyên tử. Nhìn chung, một khái niệm đại diện cho tập các cá thể thuộc về nó, và một vai trò đại diện cho một quan hệ giữa các khái niệm. Cú pháp của một thành viên trong gia đình lôgic mô tả được đặc trưng bởi định nghĩa đệ quy của nó, các định nghĩa đệ quy này định nghĩa các tạo tử có thể được dùng để tạo các thuật ngữ khái niệm. Một số tạo tử thông dụng bao gồm các tạo tử lôgic trong logic bậc nhất như phép giao (intersection) hay tuyển (conjunction) của các khái niệm, phép hợp (union) hay hội (disjunction) của các khái niệm, phép phủ định (negation) hay lấy phần bù (complement) của các khái niệm, hạn chế giá trị (hạn chế với mọi - universal restriction), hạn chế tồn tại (existential resctriction), v.v Các tạo tử khác có thể còn bao gồm các hạn chế đối với các vai trò thường thấy trong các quan hệ nhị phân, ví dụ, tính đảo (inverse), tính bắc cầu (transitivity), chức năng (functionality), v.v Đặc biệt đối với phép giao và phép hợp, lôgic mô tả sử dụng các ký hiệu và để phân biệt chúng với ∧ và ∨ trong lôgic bậc nhất. Dưới đây là một ví dụ về định nghĩa cú pháp của lôgic mô tả: • một khái niệm nguyên tử là một khái niệm; • khái niệm đỉnh ( ) là một khái niệm; • khái niệm đáy ( ) là một khái niệm; • phần bù của một khái niệm C cũng là một khái niệm (ký hiệu là ¬C); • giao của hai khái niệm C và D cũng là một khái niệm (ký hiệu là C D); • nếu C là một khái niệm và R là một tên vai trò, thì ∀ R.C (hạn chế giá trị) cũng là một khái niệm; • nếu R là một tên vai trò, thì ∃R. (hạn chế tồn tại) cũng là một khái niệm. Ngữ nghĩa: Ngữ nghĩa của lôgic mô tả được định nghĩa bằng cách giải nghĩa các khái niệm như là các tập hợp gồm các cá thể, và các vai trò như là các tập gồm các cặp cá thể. Các cá thể đó thường được cho là thuộc một miền xác định cho trước. Sau đó, ngữ nghĩa của các khái niệm và vai trò không nguyên tử được định nghĩa theo các khái niệm và vai trò nguyên tử. Điều này được thực hiện bằng một định nghĩa đệ quy tương tự như trong cú pháp. 2. ỨNG DỤNG CỦA ONTOLOGY 2.1. Mạng ngữ nghĩa Người đặt nền tảng cho mạng thông tin toàn cầu Tim Berners-Lee đã nhiều lần đề cập đến mạng ngữ nghĩa (Sematic Web). Trong đó, các hệ thống có thể giao tiếp với nhau, phân tích và diễn giải ý nghĩa của mọi dữ liệu trên site, rồi tập hợp nội dung liên quan từ nhiều nguồn khác nhau. Nhờ đó, một công ty du lịch sẽ biết khách hàng của họ có bao nhiêu đứa con, công việc, sở thích riêng để tìm ra điểm nghỉ mát lý tưởng nhất cho cả gia đình. Ý tưởng trọng tâm của là tạo ra những "metadata": chuỗi các cơ sở dữ liệu nối tiếp nhau, có nhiệm vụ bổ sung cho thông tin trên web để các máy tính có thể hiểu và giải quyết những vấn đề ngữ nghĩa phức tạp. Mạng ngữ nghĩa được tổ chức dưới dạng một đồ thị, trong đó các nút biểu diễn các đối tượng và cung biểu diễn quan hệ giữa các đối tượng. [...]... được đưa vào dưới dạng các quan hệ và ràng buộc của 3 khái niệm: Thúc vào bụng với người lớn, Thúc vào bụng với trẻ nhỏ và Thúc vào bụng với trẻ sơ sinh Hai loại quan hệ được sử dụng là có triệu chứng và là cách xử lý Các luật của Thúc vào bụng với người lớn được diễn giải như sau: • có triệu chứng some Không nói được • cần thông tin some Người lớn • là cách xử lý some Nghẹt thở Hình 14: Các luật của Khái... 7: Khung ứng dụng Jena hỗ trợ phát triển ứng dụng Ontology 5 CÔNG CỤ PROTÉGÉ Protégé là công cụ soạn thảo Ontology miễn phí, mã nguồn mở và cũng là một khung ứng dụng cho hệ cơ sở tri thức Thông tin và gói cài đặt chương trình có thể tìm thấy tại trang web chính thức: http://p rotege.stanford.edu/ Nền tảng Protégé hỗ trợ hai cách chính để mô hình hóa các ontology thông qua Protégé-Frames và trình soạn... luật của Khái niệm Thúc vào bụng với người lớn KẾT LUẬN Đề tài này đã tập trung nghiên cứu và phát triển một mô hình Ontology cho biểu diễn tri thức, xây dựng ngôn ngữ Ontology để đặc tả mô hình này và làm cơ sở cho việc thiết kế cơ sở tri thức, tìm hiểu những kiến thức cơ bản về Ontology ứng dụng trong khoa học máy tính Bước tiếp theo cần đi sâu vào nghiên cứu cơ chế suy diễn của Ontology cũng như Logic... hành cài đặt hoặc tìm hiểu một động cơ suy diễn chung cho Ontology để có thể hiện thực hóa các chương trình ứng dụng cơ sở tri thức này Trên con đường xây dựng ứng dụng cho Ontology, ngôn ngữ lập trình cũng là một vấn đề then chốt Cần có những nghiên cứu đi sâu vào ngôn ngữ lập trình OWL DL cũng nhưng tìm hiểu cách lưu trữ Ontology trên cơ sở dữ liệu RDF, tối ưu không gian lưu trữ và phương pháp truy... quan hệ đảo của quan hệ xác định bởi xác định bởi Tình huống Bệnh xác định Hình 11: Quan hệ giữa bệnh và tình huống • Có triệu chứng: Mỗi bệnh lý đều được nhận diện qua các triệu chứng Do đó, quan hệ có triệu chứng xác định các triệu chứng đặc trưng của một căn bệnh Đây là quan hệ chủ đạo trong việc chẩn đoán bệnh và có tính bắc cầu • Là triệu chứng của: là quan hệ đảo của quan hệ có triệu chứng • Cần... tính tái sử dụng rất cao, tầng miền xác định có thể tái sử dụng trong một lĩnh vực nhất định Cộng đồng Ontology cũng đang lớn mạnh và có rất nhiều Ontology đã được tạo ra, với tâm huyết của nhiều chuyên gia Do đó trước khi bắt đầu xây dựng ontology, cần xét đến khả năng sử dụng lại các ontology đã có Nếu có thể sử dụng lại một phần các ontology đã có, chi phí bỏ ra cho quá trình xây dựng ontology sẽ... hiện của các lớp trong sự phân cấp Việc tạo thể hiện cho một lớp là quá trình điền các thông tin vào các thuộc tính của lớp đó 4 NGÔN NGỮ ONTOLOGY WEB LANGUAGE (OWL) DL Ontology Web Language (OWL) là ngôn ngữ đánh dấu được sử dụng để xuất bản và chia sẻ dữ liệu sử dụng các ontology trên Internet OWL là một bộ từ vựng mở rộng của khung mô tả tài nguyên (RDF) và được kế thừa từ ngôn ngữ DAML+OIL Web ontology. .. hiện thực Ontology dưới dạng ma trận liên kết Khi ứng dụng vào thực tế, Ontology thường được biểu diễn dưới dạng frame và điều này khá phù hợp với lập trình hướng đối tượng Ngôn ngữ lập trình hướng đối tượng hỗ trợ rất mạnh các khái niệm tương ứng với Ontology như lớp, thuộc tính (quan hệ) và các thực thể Do đó, đây là công cụ hoàn hảo để cài đặt Ontology HìnhHình 5: Siêu mô hình của một Ontology cài... cần xác định mục đích của việc xây dựng ontology là gì? Phục vụ đối tượng nào? Ontology sắp xây dựng cần có đặc điểm gì, liên quan đến lĩnh vực, phạm vi nào Quá trình khai thác, quản lý và bảo trì ontology được thực hiện ra sao? + Bước 2: Xem xét việc sử dụng lại các ontology có sẵn Cấu trúc của một Ontology bao gồm 3 tầng: tầng trừu tượng (Abstract), tầng miền xác định (Domain) và tầng mở rộng (Extension)... kiểu hệ thống máy tính khác nhau, sử dụng các hệ điều hành và các ngôn ngữ ứng dụng khác nhau Mục đích chính của OWL là sẽ cung cấp các chuẩn để tạo ra một nền tảng để quản lý tài sản, tích hợp mức doanh nghiệp và để chia sẻ cũng như tái sử dụng dữ liệu trên Web OWL được phát triển bởi nó có nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML, RDF và RDFS, và vì OWL ra đời sau các ngôn ngữ . TRI THỨC VÀ SUY LUẬN ĐỀ TÀI: TÌM HIỂU ONTOLOGY VÀ ỨNG DỤNG CỦA ONTOLOGY MỤC LỤC MỞ ĐẦU 3 NỘI DUNG 4 1. CÁC KHÁI NIỆM 4 1.2. Tổng quan về Ontology: 4 1.3. Logic mô tả 7 2. ỨNG DỤNG CỦA ONTOLOGY. value(elp:viet) ) ) Hình 7: Khung ứng dụng Jena hỗ trợ phát triển ứng dụng Ontology. 5. CÔNG CỤ PROTÉGÉ Protégé là công cụ soạn thảo Ontology miễn phí, mã nguồn mở và cũng là một khung ứng dụng cho hệ cơ sở. thông qua các Ontology thì mềm dẻo hơn vì người sử dụng có thể lựa chọn bộ từ vựng và các ràng buộc trong các Ontology. Ví dụ, các ứng dụng trong các miền khác nhau có thể sử dụng các Ontology khác

Ngày đăng: 19/05/2015, 01:59

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w