1. Trang chủ
  2. » Luận Văn - Báo Cáo

TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC

67 1,4K 11

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 2,2 MB

Nội dung

ĐẠI HỌC CÔNG NGHỆ THÔNG TIN TIỂU LUẬN MÔN BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC GVHD: TS. ĐỖ VĂN NHƠN Học viên thực hiện Ngô Ngọc Thơ CH 1101139 Cao học khoá 6 Tháng 1/2013 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] MỤC LỤC I. TỔNG QUAN VỀ ONTOLOGY 1. Lịch sử hình thành I.1 Nguồn gốc Triết học Ontology bắt nguồn từ Hy Lạp, từ ontos có nghĩa là sự tồn tại (being), từ logos nghĩa là diễn đạt (word); có nghĩa là diễn đạt sự tồn tại. Nó ảnh hưởng một thời gian trong nền triết học của Hy Lạp. Aristotle (384-332 trước CN) giới thiệu 10 phạm trù cơ bản là: Substance, Quality,Quantity, Relation, Activity, Passivity, Having, Situatedness, Spatiality, và Temporality nằm ở mức lá của cây ở hình 1.2, các phạm trù của ông có ảnh hưởng mạnh mẽ đến các ontology sau này. Sau đó Franz Brentano bổ sung các phạm trù còn lại hình thành cây Brentano, là một hình thức của ontology. Ngô Ngọc Thơ 2 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] Hình 1.2 Cây Brentano về các phạm trù của Aristotle Một ontology khác được biết tới là cây Porphyry do triết gia Hy Lạp Porphyry, sống vào thế kỷ 3 sau Công Nguyên, vẽ ra dựa trên tư tưởng của Aristotle được minh họa ở hình 1.3. Theo cây này vật chất là khái niệm cao nhất không thể tìm thấy khái niệm nào cao hơn chất. Còn nhân loại là khái niệm thấp nhất, dưới nhân loại chỉ có cá nhân như: Socrates, Plato, Aristotle… Bên cạnh việc định nghĩa các phạm trù để biểu diễn ontology, Aristotle còn xây dựng nên tam đoạn luận làm nền móng cho logic học. Hình 1.2 Cây Porphyry Sau đó, Emmanuel Kant (1724-1804) đã đưa ra quan điểm của mình dựa trên 4 lớp, mỗi lớp thể hiện một mẫu thực tế. Ngô Ngọc Thơ 3 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] Bảng 1.1 Phạm trù của Kant Trong quyển sách Knowledge Representation, John F.Sowa đã kết hợp nhiều ý tưởng trước đó tạo ra một lưới phạn trù, một ví dụ về ontology. Hình 1.3 Lưới các phạm trù của Sowa I.2 Một vài hệ thống hiện đại thiết kế dựa trên Ontology Ngô Ngọc Thơ 4 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] Các triết gia thường xây dựng ontology theo hướng từ trên xuống với một tập khái niệm rộng lớn về mọi thứ. Các nhà lập trình có xu hướng xây dựng ontology theo hướng ngược lại (từ dưới lên). Cá nhà lập trình thường giới hạn các ontology hoặc thu nhỏ thế giới, và chỉ quan tâm các khái niệm phù hợp với các ứng dụng quan tâm.  Hệ thống trả lời câu hỏi Chat-80: Phiên bản gốc được công bố vào năm 1980 do các nhà nghiên cứu đại học Edinburgh là David Warren và Fernando Pereira, thiết kế ontology một thế giới thu nhỏ về các khái niệm địa lý. Chat-80 là một trong những hệ thống điển hình đầu tiên việc xử lý ngôn ngữ tự nhiên dựa trên Prolog. Hệ thống này trả lời các câu hỏi về thông tin địa lý của vùng được minh hoạ ở hình 1.4. Hình 1.4 Các kiểu địa lý trong hệ thống Chat-80 Ngô Ngọc Thơ 5 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] Giao diện Demo Chat-80 Ví dụ một truy vấn  Lược đồ khái niệm (conceptual schema): do nhu cầu cần chuẩn hoá các tri thức. ANSI đưa ra lược đồ khái niệm để biểu diễn các tri thức trong một ứng dụng cụ thể. Hình 1.5 minh hoạ một hệ thống tích hợp với lược đồ khái niệm đồng nhất ở trung tâm. Mỗi vòng tròn được dùng riêng cho một mục đích, nhưng tất cả đều tham chiếu đến lược đồ khái niệm. Giao diện người dùng thực hiện truy vấn đến CSDL và thực hiện các chương trình ứng dụng để cung cấp các dịch vụ, CSDL được chia xẻ cho nhiều chương trình ứng dụng. Lược đồ khái niệm liên kết 3 vòng tròn lại với nhau bằng cách định nghĩa các thực thể ứng dụng và mối liên hệ giữa chúng. Hình 1.5 Lược đồ khái niệm là trái tim của hệ thống tích hợp I.3 Một số đồ án xây dựng ontology Ngô Ngọc Thơ 6 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC]  Cyc: là một đồ án AI (Trí tuệ nhân tạo) nhằm kết hợp một ontology toàn diện với cơ sở tri thức các tri thức phổ biến thường ngày với mục tiêu tạo ra một ứng dụng AI thực hiện việc suy luận giống như con người. Nó mô tả toàn bộ tri thức nhân loại, là dự án phát triển ontology lớn nhất từ trước đến nay. Đồ án này được bắt đầu từ năm 1984 bởi Douglas Lenat tại MCC(Microelectronics and Computer Technology Corporation) và phát triển bởi công ty Cycorp. Cyc chi tiết đến từng tiên đề và khái niệm. Các phần của đồ án được phát hành dưới dạng các phiên bản OpenCyc. Phiên bản mới nhất OpenCyc 2.0 với cơ sở tri thức gồm 47,000 khái niệm và 306,000 sự kiện.  ERD (The Electronic Dictionary Research): mô tả một tự điển với hơn 400 000 khái niệm đến cả hai thứ tiếng Anh và Nhật. Mặc dù ERD có nhiều khái niệm hơn Cyc nhưng nó không cung cấp chi tiết từng khái niệm nhiều như Cyc. Mục đích chính của ERD là : “tất cả những gì một máy tính cần để hiểu hoàn toàn ngôn ngữ tự nhiên”. Nó gồm: Word Dictionaries General Vocabulary: English 200,000 Words Japanese 200,000 Words Technical Terminology English 100,000 Words Japanese 100,000 Words Concept Dictionary 400,000 Concepts Classification Descriptions Co-Occurrence Dictionaries English 300,000 Words Japanese 300,000 Words Bilingual Dictionaries English-Japanese 300,000 Words Japanese-English 300,000 Words  WordNet: do George Miller (1995) và Fellbaum (1998) phát triển. Mô tả dạng và nghĩa Ngô Ngọc Thơ 7 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] của 166 000 từ. WordNet không có nhiều khái niệm chi tiết như Cyc và ERD nhưng nó là ontology được sử dụng phổ biến cho việc xử lý ngôn ngữ tự nhiên. Phiên bản WordNet mới nhất WordNet 3.0 dữ liệu gồm 155,287 từ tổ chức trong 117,659 synset, tổng cộng 206,941 word-sense. Ontology trong đề án Cyc được xem là ontology hình thức, còn ontology trong đề án ERD và WordNet là ontology thuật ngữ. 2. Định nghĩa  Theo triết học thì ontology được định nghĩa như sau: “ontology là một siêu hình học nghiên cứu về sự tồn tại và hiện thân của tự nhiên” [Aristoteles].  Theo tin học thì ontology có những định nghĩa như sau:  Gruber (1993), “Ontology là một thuyết minh hình thức, rõ ràng của một nhận thức chung”. Định nghĩa của ông được phân làm 4 khái niệm chính: mô hình trừu tượng của hiện tượng (nhận thức), diễn đạt rỏ ràng bằng toán học (hình thức), các khái niệm và quan hệ giữa chúng phải được định nghĩa một cách chính xác và rỏ ràng (rỏ ràng), tồn tại một sự đồng thuận của những người sử dụng ontology (chung).  Russell & Norving (1995), “Ontology là một mô tả hình thức của các khái niệm và quan hệ mà có thể tồn tại trong một cộng đồng cụ thể”.  Swartout (1996), “Ontology là một tập thuật ngữ có cấu trúc và thứ bậc để diễn tả một phạm vi cụ thể và có thể được sử dụng như là bộ khung của cơ sở tri thức”.  Fensel (2000), “Ontology là một mô tả một cách phổ biến, có khả năng dùng chung và hình thức của các khái niệm quan trọng trong một phạm vi cụ thể”.  John F. Sowa (2000), “Ontology là một bản liệt kê các kiểu của những gì mà tồn tại trong miền D từ khía cạnh mà người sử dụng ngôn ngữ L để mô tả D. Các kiểu của ontology gồm: vị từ, ý nghĩa từ, hay khái niệm và quan hệ của ngôn ngữ L khi mô tả về D”. Ngô Ngọc Thơ 8 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC]  Noy & McGuinness (2001), “Ontology là một mô tả hình thức và rõ ràng của các khái niệm trong phạm vi cụ thể, các thuộc tính của khái niệm mô tả đặc tính và tính chất của khái niệm, các ràng buộc của thuộc tính”.  Fonseca (2002), “Ontology là một lý thuyết mà sử dụng một bộ từ vựng cụ thể để mô tả thực thể, thuộc tính và các thao tác trong một phạm vi cụ thể”.  Enrico Franconi (2002), “Ontology là một nhận thức hình thức về thế giới”.  Starlab (2003), “Ontology bao hàm các thuật ngữ, xác định ý nghĩa của và mối quan hệ giữa chúng”.  A. Maedche & B. Motik & L. Stojanovic (2003), “Ontology là mô hình khái niệm trong phạm vi ứng dụng nhất định, có thể chia sẻ và thực thi trên máy tính”.  Trong khoa học máy tính và thông tin, ontology được định nghĩa là một biểu diễn hình thức cho tập hợp các khái niệm thuộc một lĩnh vực nào đó và quan hệ giữa những khái niệm này. Nói cụ thể hơn, ontology cung cấp một bộ từ vựng chung dùng để mô tả một lĩnh vực – nghĩa là một loại đối tượng hay khái niệm hiện hữu, cùng với các thuộc tính và quan hệ giữa chúng – và lời đặc tả cho nghĩa của những từ trong bộ từ vựng. Dựa vào độ chính xác của đặc tả này, khái niệm ontology bao gồm một số mô hình dữ liệu hay mô hình khái niệm, ví dụ, các bảng phân loại (classifications), từ điển chuyên đề (thesauri), lược đồ cơ sở dữ liệu (database schemas), lý thuyết được tiên đề hoá đầy đủ (fully axiomatized theories), v.v… Ontology có khuynh hướng xuất hiện ở mọi nơi. Ontology được sử dụng trong các lĩnh vực trí tuệ nhân tạo, web ngữ nghĩa, kỹ thuật phần mềm, sinh-y tin học, khoa học thư viện và kiến trúc thông tin như là một dạng biểu diễn tri thức về thế giới hay một phần của nó. Ontology là một giải pháp đơn giản nhưng hiệu quả cho nhiều ứng dụng như tích hợp thông tin, các hệ thống ngang hàng, thương mại điện tử, các dịch vụ web ngữ nghĩa, các mạng xã hội, v.v… Chúng thực sự là những phương tiện thiết thực để khái niệm hoá những thứ cần được biểu diễn theo định dạng của máy tính.  Theo các định nghĩa trên một ontology phải có những tính chất sau:  Được sử dụng để mô tả một phạm vi ứng dụng cụ thể.  Các khái niệm và quan hệ được định nghĩa rõ ràng trong phạm vi ứng dụng đó.  Có cơ chế tổ chức các khái niệm (thường là phân cấp). Ngô Ngọc Thơ 9 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC]  Có sự đồng thuận về mặt ý nghĩa các khái niệm của những người cùng sử dụng ontology. 3. Các thành phần của ontology Các ontology hiện nay đều có nhiều điểm tương tự về mặt cấu trúc, bất kể ngôn ngữ được dùng để biểu diễn. Hầu hết các ontology đều mô tả các đối tượng (thể hiện), lớp (khái niệm), thuộc tính và các quan hệ. 3.1 Cá thể (Individual) – Thể hiện Các cá thể là các thành phần cơ bản, nền tảng của một ontology. Các cá thể trong một ontology có thể bao gồm các đối tượng cụ thể như con người, động vật, cái bàn… cũng như các cá thể trừu tượng như các thành viên hay các từ (mặc dù có một vài khác biệt về ý kiến liệu các con số vài từ là lớp hay là đối tượng). Một ontology có thể không cần bất kỳ một cá thể nào, nhưng một trong những lý do chính của một ontology là để cung cấp một ngữ nghĩa của việc phân lớp các cá thể, mặc dù các cá thể này không thực sự là một phần của ontology. Ví dụ: tam giác được kí hiệu ABC là thể hiện của khái niệm tam giác. 3.2.Lớp (Class) – Khái niệm Các lớp là các nhóm, tập hợp các đối tượng trừu tượng. Chúng có thể chứa các cá thể, các lớp khác, hay là sự phối hợp của cả hai. Các ontology biến đổi tuỳ thuộc vào cấu trúc và nội dung của nó: Một lớp có thể chứa các lớp con, có thể là một lớp tổng quan (chứa tất cả mọi thứ), có thể là lớp chỉ chứa những cá thể riêng lẻ, Một lớp có thể xếp gộp vào hoặc bị xếp gộp vào bởi các lớp khác. Mối quan hệ xếp gộp này được sử dụng để tạo ra một cấu trúc có thứ bậc các lớp, thường là với một lớp thông dụng nhất kiểu Thing ở trên đỉnh và các lớp rất rõ ràng ở phía dưới cùng. Một số ví dụ của lớp: • Person, lớp của tất cả con người, hay các đối tượng trừu tượng có thể được mô tả bởi các tiêu chuẩn làm một con người. • Vehicle, lớp của tất cả xe cộ, hay các đối tượng trừu tượng có thể được mô tả bởi các tiêu chuẩn làm một chiếc xe. • Car, lớp của tất cả xe hơi, hay các đối tượng trừu tượng có thể được mô tả bởi các tiêu chuẩn làm một chiếc xe hơi. Ngô Ngọc Thơ 10 [...]... dàng trong máy tính hay không ontology hình thức thường có xu hướng nhỏ, Ngô Ngọc Thơ 13 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] nhưng các tiên đề và định nghĩa thường rất phức tạp trong suy luận và tính toán Những ontology này thường do các nhà tri t học thiết kế • Ontology thuật ngữ (terminological ontology) : là ontology mô tả các khái niệm theo hướng tiên đề và định... DỤNG TRONG BIỂU DIỄN TRI THỨC] Tháng 1/2013 Ví dụ: ontology về kế hoạch phân công nhiệm vụ • Domain-task ontology: task ontology được sử dụng lại trong một phạm vi ứng dụng cụ thể Ví dụ: ontology về kế hoạch phân công nhiệm vụ của các chuyến bay • Application ontology: chứa các kiến thức cần thiết của một ứng dụng trong phạm vi ứng dụng nhất định Ví dụ: ontology hình học 5 Chu trình phát tri n ontology. .. Thông thường một quan hệ là của một loại (hay lớp cụ thể nào Ngô Ngọc Thơ 11 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] đó chỉ rõ trong ngữ cảnh nào đối tượng được liên hệ với đối tượng khác trong ontology Ví dụ trong ontology chứa khái niệm Ford Explorer và khái niệm Ford Bronco có thể được liên hệ bởi một quan hệ loại Phát biểu đầy đủ của... • Một quan hệ được biểu hiện bằng một cung hướng về đỉnh quan hệ và 1 cung hướng ra từ đỉnh quan hệ đó Nếu quan hệ chỉ có một đối số thì có thể bỏ qua chiều của cung (đầu mũi tên) Nếu một quan hệ có nhiều hơn 2 đối số, chiều của cung (đầu mũi tên) được thay Ngô Ngọc Thơ 18 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] thế bằng các số nguyên từ 1,2,…,n Như vậy một quan hệ... gốc trong ontology là “Top”, là lớp trên cùng và không có lớp cha nào Toàn bộ cấu trúc của ontology trên được minh hoạ trong hình sau: Ngô Ngọc Thơ 27 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] II.2.4 Ngôn ngữ OWL a Giới thiệu OWL (The Web Ontology Language) là một ngôn ngữ gần như XML dùng để mô tả các hệ cơ sở tri thức OWL là một ngôn ngữ đánh dấu dùng để xuất bản và. .. ta Ngô Ngọc Thơ 15 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] cũng phải kiểm tra tính hợp lệ của ontology, tiến hành bảo trì và tiến hoá ontology 6 Phương pháp xây dựng ontology Quy trình phát tri n Ontology là một quy trình gồm nhiều bước, tuy nhiên vẫn chưa có một phương pháp chuẩn hóa nào để phát tri n các ontologies Quy trình phát tri n gồm 7 bước do Stanford Center... được những quan hệ có n cung Theo cách định nghĩa này, đối với những quan hệ bậc 2 thì cung thứ 1 là cung nối từ khái niệm đến quan hệ khái niệm và cung thứ 2 là cung nối từ quan hệ khái niệm đó 1 khái niệm khác Ngô Ngọc Thơ 19 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] Tiền đề 1: Cho Ty là tập các loại và một hàm phân loại type, từ đó sắp xếp các khái niệm và các quan hệ... lớp trong sự phân cấp Việc tạo thể hiện cho một lớp là quá trình điền các thông tin vào các thuộc tính của lớp đó II Ngôn ngữ ontology 1 Định nghĩa Ngôn ngữ ontology là ngôn ngữ dùng để mô tả các thành phần của ontology Để mô tả mọi thứ về các khái niệm của ontology đòi hỏi phải có một ngôn ngữ chung Ngô Ngọc Thơ 17 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] nhất để diễn. .. nhất, được định nghĩa bởi rdf:resource attribute  Các định nghĩa ontology: Lớp, cá thể, thuộc tính, các mối quan hệ… d Các yếu tố cơ bản Ngô Ngọc Thơ 30 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] Hầu hết các yếu tố trong OWL ontology liên quan đến các lớp (classes), thuộc tính (properties), thể hiện (instances) của lớp và các mối quan hệ (relations) giữa chúng  Các lớp... các lớp dễ dàng hơn Có một số phương pháp tiếp cận trong việc xác định phân cấp của các lớp: • Phương pháp từ trên xuống (top-down): bắt đầu với định nghĩa của các lớp tổng quát nhất trong lĩnh vực và sau đó chuyên biệt hóa các khái niệm đó Ví dụ: Trong Ontology Ngô Ngọc Thơ 16 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] về quản lý nhân sự, ta bắt đầu với lớp Người, sau . [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] Ví dụ: ontology về kế hoạch phân công nhiệm vụ. • Domain-task ontology: task ontology được sử dụng lại trong một phạm vi ứng dụng. ĐẠI HỌC CÔNG NGHỆ THÔNG TIN TIỂU LUẬN MÔN BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC GVHD: TS. ĐỖ VĂN NHƠN Học viên thực hiện Ngô Ngọc. 6 Tháng 1/2013 Tháng 1/2013 [TỔNG QUAN VỀ ONTOLOGY VÀ ỨNG DỤNG TRONG BIỂU DIỄN TRI THỨC] MỤC LỤC I. TỔNG QUAN VỀ ONTOLOGY 1. Lịch sử hình thành I.1 Nguồn gốc Tri t học Ontology bắt nguồn từ Hy Lạp,

Ngày đăng: 10/04/2015, 09:59

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w