Tiểu luận môn Biểu diễn tri thức và ứng dụng Tìm hiểu về đồ thị khái niệm

28 807 1
Tiểu luận môn Biểu diễn tri thức và ứng dụng Tìm hiểu về đồ thị khái niệm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đại Học Quốc Gia Thành Phố Hồ Chí Minh Trường Đại Học Công Nghệ Thông Tin Lớp Cao Học khóa 5 ngành Khoa Học Máy Tính 12.2012 BÀI THU HOẠCH MÔN HỌC Biểu diễn tri thức Đề tài Tìm hiểu về đồ thị khái niệm Giảng viên hướng dẫn: PGS.TS Đỗ Văn Nhơn Người thực hiện: Nguyễn Thế Thắng (CH1001128) 26 Mục lục 1. Giới thiệu 3 2. Từ đồ thị hiện sinh đến đồ thị khái niệm 3 3. Logic tổng quát (Common Logic) 9 4. Lập luận với đồ thị 16 5. Mệnh đề, tình huống và siêu ngữ 24 6. Kết luận 27 7. Tài liệu tham khảo 27 26 1. Giới thiệu Đồ thị khái niệm (conceptual graph) là sự biểu diễn đồ thị cho logic dựa trên những mạng ngữ nghĩa của trí tuệ nhân tạo và những đồ thị hiện sinh của Charles Sanders Peirce. Vài phiên bản của đồ thị khái niệm đã được thiết kế và hiện thực hơn ba mươi năm qua. Cái đơn giản nhất là những đồ thị lõi không có kiểu mà tương ứng với đồ thị hiện sinh nguyên thủy của Peirce. Tổng quát hơn là đồ thị khái niệm mở rộng là một tập lớn có kiểu của đồ thị lõi. Đồ thị khái niệm nghiên cứu đã khám phá những kĩ thuật mới lạ cho lập luận, biểu diễn tri thức, và ngữ nghĩa ngôn ngữ tự nhiên. Ngữ nghĩa của đồ thị khái niệm lõi và mở rộng được xác định bởi việc ánh xạ hình thức đến và từ chuẩn ISO của logic tổng quát nhưng đồ thị khái niệm nghiên cứu được định nghĩa bởi nhiều sự mở rộng hình thức và không hình thức. 2. Từ đồ thị hiện sinh đến đồ thị khái niệm Trong suốt thập kỉ 60, biểu diễn ngữ nghĩa dựa trên đồ thị nổi tiếng trong cả hai nghành ngôn ngữ học lí thuyết và ngôn ngữ học máy tính. Tại một trong những hội thảo ấn tượng nhất của thập kỉ, Margaret Masterman đã giới thiệu một kí hiệu dựa trên đồ thị được gọi là mạng ngữ nghĩa bao gồm một dàn những kiểu khái niệm. Silvio Ceccato đã giới thiệu những mạng động quan hệ dựa trên 56 quan hệ khác nhau và những loại thuộc tính khác nhau. David Hays đã trình bày về đồ thị phụ thuộc hình thức hóa kí hiệu được phát triển bởi nhà ngôn ngữ học Lucien Tesniere. Những kí hiệu đồ thị trước đây đã biểu diễn những cấu trúc quan hệ bên dưới ngữ nghĩa ngôn ngữ tự nhiên nhưng không có cái nào có thể biểu thị được logic cấp một đầy đủ. Cuối thập kỉ 70, nhiều kí hiệu đồ thị đã được thiết kế để biểu diễn logic cấp một hoặc tập con được định nghĩa hình thức. Sowa đã phát triển một phiên bản của đồ thị khái niệm như một ngôn ngữ trung gian cho việc ánh xạ những câu hỏi ngôn ngữ tự nhiên và những phát biểu đến một cơ sở dữ liệu. Hình 2.1 trình bày một đồ thị khái niệm cho câu “John is going to Boston by bus”. Hình chữ nhật được gọi là khái niệm (concepts) và hình tròn được gọi là quan hệ khái niệm (conceptual relations). Cung trỏ đến nút hình tròn cho biết 26 đối số đầu tiên của quan hệ và một cung đi ra từ nút hình tròn cho biết đối số cuối cùng. Nếu quan hệ chỉ có một đối số duy nhất, cung sẽ không có mũi tên. Nếu quan hệ có nhiều hơn hai đối số, đầu mũi tên được thay thế bằng những số nguyên. Hình 2.1 dạng hiển thị đồ thị khái niệm cho câu “John is going to Boston by bus”. Đồ thị khái niệm trong hình 2.1 biểu diễn một phiên bản có kiểu hoặc được sắp xếp của logic. Mỗi khái niệm trong bốn khái niệm có một nhãn kiểu (type label) biểu diễn cho kiểu của thực thể là Person, Go, Boston hoặc Bus. Hai khái niệm có tên xác định ám chỉ là John hoặc Boston. Mỗi quan hệ khái niệm có một nhãn kiểu mà biểu diễn loại quan hệ: agent (Agnt), nơi đên (Dest), phương tiện (Inst). Đồ thị khái niệm trên mô tả rằng con người John là một agent của instance của việc đi, thành phố Boston là nơi đến và xe buýt là phương tiện. Hình 2.1 có thể được dịch thành công thức sau đây: Toán tử tồn tại và toán tử giao là toán tử tổng quát nhất trong việc dịch từ ngôn ngữ tự nhiên và nhiều mạng ngữ nghĩa trước đây không thể biểu diễn. Với Begriffsschrift, Frege thông qua kí hiệu cây cho việc biểu diễn đầy đủ logic cấp một chỉ sử dụng 4 toán tử: khẳng định cửa xoay ), phủ định (biểu diễn bằng đường thẳng dọc đứng), suy ra (biểu diễn bằng hình như cái móc) và với mọi (biểu diễn bằng một cái 26 cốc chứa biến ràng buộc). Hình 2.2 là biểu diễn Begriffsschrift tương đương với hình 2.1. Dưới đây là biểu diễn dạng vị từ: Hình 2.2 Begriffsschrift của Frege cho câu “John is going to Boston by bus”. Sự lựa chọn toán từ của Frege đơn giản hóa những luật suy luận nhưng dẫn đến những diễn giải vụng về: không đúng với mọi x và y, nếu x là instance của going thì nếu John là người thì nếu Boston là thành phố thì nếu y là xe bus thì nếu agent của x là John thì nếu nơi đến của x là Boston thì phương tiện của x không phải là y. Không giống như Frege, Peirce đã phát triển kí hiệu đại số cho logic bậc nhất như sự tổng quát hóa của các toán tử kiểu Boolean. Từ khi Boole xem sự phân rã như việc cộng logic và sự kết hợp như nhân logic, Peirce biểu diễn toán tử tồn tại bằng Σ cho việc phân rã lặp đi lặp lại và toán từ với mọi bằng Π cho việc kết hợp lặp đi lặp lại. Sơ đồ hình 2.1 được biểu diễn theo kí hiệu của Peirce như sau: 26 Thông qua kí hiệu của Peirce, Peano đã tạo ra những biểu tượng mới vì muốn kết hợp những kí hiệu toán học và logic trong công thức. Trong khi đó, Peirce bắt đầu thử nghiệm với đồ thị quan hệ cho việc biểu diễn logic như trong hình 2.3. Trong đồ thị đó, lượng từ tồn tại được biểu diễn bằng một đường nhận diện và sự kết hợp là toán tử Boolean mặc định. Vì đồ thị của Peirce không phân biệt những tên đúng, những vị từ monadic isJohn và isBoston có lẽ được sử dụng để biểu diễn những tên. Sau đây là kí hiệu đại số của cho hình 2.1: Hình 2.3 đồ thị quan hệ của Peirce cho câu “John is going to Boston by bus”. Peirce đã thử nghiệm với nhiều phương pháp đồ thị khác nhau cho việc biểu diễn những toán tử khác của kí hiệu đại số của ông nhưng giống như những nhà nghiên cứu AI của thập kỉ 60 ông ta không thể tìm ra cách hay để thể hiện được phạm vi của những lượng từ và phép phủ định. Tuy nhiên vào năm 1897 ông ta đã phát hiện ra một sự đổi mới đơn giản nhưng lỗi lạc của cho phiên bản mới của ông về đồ thị hiện sinh (Existential Graphs): một bao đóng hình bầu dục cho việc trình bày phạm vi. Toán tử mặc định cho hình bầu dục không đánh dấu khác là phủ định nhưng bất kì quan hệ metadata có thể được liên kết với hình bầu dục. Sowa thông qua qui ước của Peirce cho đồ thị khái niệm 26 nhưng với hình chữ nhật thay vì hình bầu dục: hình chữ nhật lồng tốt hơn hình bầu dục và quan trọng hơn mỗi hộp ngữ cảnh có thể được thông dịch như hộp khái niệm mà chứa đồ thị khái niệm lồng nhau. Việc lồng hai phủ định chỉ ra một sự suy ra như trong hình 2.4 thể hiện một đồ thị hiện sinh và đồ thị khái niệm cho câu “If a farmer owns a donkey, then he beats it”. Hình 2.4 EG và CG cho câu “If a farmer owns a donkey, then he beats it.” Sự khác biệt chính giữa đồ thị hiện sinh và đồ thị khái niệm như trong hình 2.4 là sự diễn dịch của những liên kết. Trong đồ thị hiện sinh, mỗi đường nhận dạng biểu diễn một biến lượng từ tồn tại gắn liền với những quan hệ. Trong đồ thị khái niệm, những hộp khái niệm biểu diễn những lượng từ tồn tại và những cung đơn thuần liên kết những nút quan hệ đến những đối số của chúng. Một điểm khác biệt khác là những nhãn kiểu đồ thị khái niệm trở thành những quan hệ monadic trong đồ thị hiện sinh. Không giống đồ thị hiện sinh mà một hình bầu dục không đánh dấu biểu diễn phủ định, biểu tượng ∼ đánh dấu một ngữ cảnh phủ định đồ thị khái niệm. Cả hai đồ thị hiện sinh và đồ thị khái niệm có thể được biểu diễn bởi công thức sau: Nhằm bảo toàn tầm vực đúng của những lượng từ, toán từ suy ra ⊃ không thể được sử dụng để biểu diễn cấu trúc if-then trừ phi những lượng từ tồn tại được chuyển đến trước và được chuyển thành với mọi. 26 Biểu này có thể được đọc như sau: Với mỗi x và y, nếu x là nông dân mà sở hữu con lừa y, thì x đánh bại y. Bản chất bất thường của diễn giải này đưa Kamp phát triển những cấu trúc biểu diễn ngôn ngữ (Discourse Presentation Structures (DRSs)) mà cấu trúc hợp lí là đẳng cấu với những đồ thị của Peirce (hình 2.5). Hình 2.5 EG và DRS cho câu “If a farmer owns a donkey, then he beats it”. Những toán tử bình thường của Kamp giống như của Peirce: lượng từ mặc định là tồn tại, toán từ Boolean mặc định là kết hợp; phủ định được biểu diễn bởi một hộp ngữ cảnh và suy ra được biểu diễn bởi hai hộp ngữ cảnh. Như trong hình 2.5 trình bày, việc lồng của những ngữ cảnh của Peirce cho phép những lượng từ trong tiền đề của phép suy ra bao gồm kết quả bên trong tầm vực của lượng từ. Mặc dù Kamp đã kết nối những hộp với mũi tên, một giả sử được tạo ra một cách chính xác về tầm vực của lượng từ. Kamp và Reyle đã đi xa hơn Peirce trong phân tích ngôn ngữ và tạo ra những luật cho việc diễn dịch những tham chiếu trùng lặp nhưng luật bất kì phát biểu trong những thuật ngữ của kí hiệu DRS cũng có thể được áp dụng cho kí hiệu EG hoặc CG. CG trong hình 2.4 đại diện cho những động từ “owns” và “beats” như quan hệ cặp đôi. Đó là sự lựa chọn những quan hệ được lưa chọn bởi Kamp và nó cũng có thể được sử dụng với kí hiệu EG hoặc CG. Tuy nhiên, Peirce lưu ý rằng các sự kiện hoặc trạng thái được thể hiện bởi một động từ cũng là một thực thể có thể được tham chiếu bởi một biến định lượng. Điểm đó được tìm thấy lại một cách độc lập bởi những nhà ngôn ngữ học, 26 những nhà ngôn ngữ máy tính và những nhà triết học. Đồ thị khái niệm trong hình 2.6 trình bày một biểu diễn mà xem những sự kiện và những trạng thái như những thực thể liên kết với những thành phần tham gia của chúng bởi những quan hệ trường hợp hoặc vai trò theo chủ đề. Hình 2.6 đồ thị khái niệm với những quan hệ trường hợp được trình bày một cách tường minh. Những nhãn kiểu If và Then trong hình 2.6 được định nghĩa như những từ đồng nghĩa cho những ngữ cảnh bị phủ định. Trạng thái của việc sở hữu được liên kết với những thành phần tham gia của nó bởi những quan hệ (Expr) và (Thme) và hoạt động đánh bại bởi những quan hệ (Agnt) và (Ptnt). 3. Logic tổng quát (Common Logic) Logic tổng quát phát triển từ hai dự án nhằm phát triển những chuẩn ANSI song song cho các đồ thị khái niệm và định dạng trao đổi tri thức (Knowledge Interchange Format). Cuối cùng hai dự án được sát nhập thành một dự án ISO để phát triển cú pháp trừu tượng chung và nền tảng lí thuyết mô hình cho một họ những kí hiệu dựa trên logic. Ngoài cú pháp trừu tượng và lí thuyết mô hình, chuẩn CL đặc tả 3 thuật ngữ cụ thể mà có khả năng 26 thể hiện ngữ nghĩa CL đầy đủ: định dạng trao đổi logic tổng quát (Common Logic Interchange Format (CLIF), định dạng trao đổi đồ thị khái niệm (Conceptual Graph Interchange Format (CGIF)) và kí hiệu dựa trên XML cho CL (XML-based notation for CL (XCL)). RDF và OWL cũng có thể được xem như những thuật ngữ mà thể hiện những tập con của ngữ nghĩa CL: bất kì phát biểu trong RDF hoặc OWL có thể được dịch thành CLIF, CGIF hoặc XCL nhưng chỉ một tập con có thể được dịch trở lại RDF hoặc OWL. Cú pháp CL cho phép những lượng từ trong phạm vi hàm và quan hệ những CL giữ lại phong cách bậc nhất của lí thuyết mô hình và lí thuyết chứng minh. Để hỗ trợ cú phát bậc cao hơn nhưng không có sự phức tạp tính toán của ngữ nghĩa bậc cao, lí thuyết mô hình CL sử dụng một miền D bao gồm những cá nhân, những hàm và những quan hệ. Đồ thị khái niệm là một phiên bản được định kiểu của logic từ khi ấn bản đầu tiên trong năm 1976 nhưng đồ thị hiện sinh không định kiểu của Peirce đủ tổng quát để thể hiện ngữ nghĩa CL đầy đủ. Do đó, hai phiên bản của định dạng trao đổi đồ thị khái niệm được định nghĩa trong chuẩn ISO như sau: - CGIF nòng cốt: Một phiên bản không định kiểu của logic thể hiện ngữ nghĩa CL đầy đủ. Thuật ngữ này tương ứng với đồ thị hiện sinh của Peirce: chỉ những tác tử nguyên thủy của nó là kết hợp, phủ định và lượng từ tồn tại. Nó cho phép những lượng từ nằm trên nhiều quan hệ những Peirce cũng đã thử nghiệm với tùy chọn đó cho đồ thị hiện sinh. - CGIF mở rộng: Một phần mở rộng tương thích của phần cốt lõi mà thêm vào lượng từ với mọi; những nhãn kiêu cho việc hạn chế phạm vi của những lượng từ; ngữ cảnh dạng Boolean với những nhãn kiêu If, Then, Either, Or, Equivalence và Iff; và tùy chọn của việc nạp vào văn bản bên ngoài vào trong văn bản CGIF bất kì. Mặc dù CGIF được mở rộng là một ngôn ngữ được định kiểu, nó không được định kiểu mạnh vì những nhãn kiểu chỉ được sử dụng để hạn chế phạm vi của những lượng từ. [...]... trong 2 cách diễn giải sau của câu tiếng Anh gốc Hai đồ thị khái niệm trong hình 5.1 biểu diễn những diễn giải đầu và thứ ba Trong đồ thị khái niệm bên trái của hình 5.1, lượng từ tồn tại cho khái niệm [Sailor] được lồng bên 26 trong tình huống mà Mary muốn Sailor tồn tại hay không và liệu Tom và Mary có biết danh tính của anh ta hay không là không được xác định Đồ thị khái niệm bên phải phát biểu một... niệm bên trên của hình 4.1 biểu diễn câu “The cat Yojo is chasing a mouse.” Mũi tên chỉ xuống biểu diễn hai ứng dụng của qui tắc sao chép Một ứng dụng sao chép quan hệ Agnt và ứng dụng thứ hai sao chép đồ thị con → (Thme) → [Mouse] Liên kết cùng tham chiếu kết nối hai khái niệm [Mouse] mô tả rằng cả hai khái niệm nói đến cùng một cá thể Mũi tên lên biểu diễn hai ứng dụng của luật đơn giản hóa thực... đây là câu CGIF cho cả hai đồ thị: 26 Hình 4.2 qui tắc hạn chế và không hạn chế Đồ thị khái niệm bên trên của hình 4.2 biểu diễn câu “A cat is chasing an animal.” Bởi hai ứng dụng của qui tắc hạn chế, nó được biến đổi thành đồ thị khái niệm cho câu “The cat Yojo is chasing a mouse.” Trong bước đầu, khái niệm [Cat] nói rằng tồn tại con mèo được hạn chế bởi tham khảo đến khái niệm đặc trưng hơn [Cat: Yojo]... mở rộng và CGIF cốt lõi: Trong đồ thị khái niệm, những hàm được biểu diễn bằng những quan hệ khái niệm được gọi là actor Hình 3.2 là dạng hiển thị đồ thị khái niệm cho phương trình sau đây được viết dưới dạng kí hiệu đại số: Ba hàm trong phương trình này sẽ được biểu diễn bởi 3 actor được trình bày trong hình 3.2 như những nút hình bình hành với những nhãn Add, Sqrt và Divide Những nút khái niệm chứa... hỏi từng câu biểu thị mệnh đề trong mỗi mô hình, có những mô hình IKL cho phép trong đó câu này đơn giản là sai vì không có mệnh đề tồn tại Do đó nghịch lí biến mất vì câu có giá trị ổn định nhưng sai 6 Kết luận Thông qua tiểu luận này, em có thể hiểu rõ thêm về đồ thị khái niệm, những công việc có ảnh hưởng trên đồ thị khái niệm Việc biểu diễn có cấu trúc này cung cấp một ngôn ngữ diễn đạt và những phương... thứ hai, khái niệm [Animal] nói rằng tồn tại một động vật được hạn chế bởi kiểu chỉ đến khái niệm của một kiểu con [Mouse] Đồ thị cụ thể hóa hơn suy ra được đồ thị tổng quát hơn: nếu mèo Yojo đang đuổi bắt chuột, thì mèo đang đuổi bắt động vật Để chứng minh rằng đồ thị bên dưới v trong hình 4.2 suy ra đồ thị bên trên u, cho c là một khái niệm của u bị hạn chế đến một khái niệm cụ thể hơn d, và cho u... vậy bằng cách đưa ra những hạn chết về sức mạnh diễn đạt Mặc dù những nghịch lí của logic là có thể diễn đạt trong ngôn ngữ tự nhiên, việc sử dung tổng quát nhất của ngôn ngữ về ngôn ngữ là nói về những niềm tin, mong muốn và ý định của người nói và những người khác Nhiều phiên bản của logic và ngôn ngữ biểu diễn tri thức bao gồm đồ thị khái niệm đã được sử dụng để diễn đạt ngôn ngữ này Ví dụ, câu “Tom... tắc kết hợp và tách rời Hình 4.3 là đồ thị cho câu “Yojo is chasing a mouse and a mouse is brown.” Qui tắc kết hợp phủ hai bản sao giống nhau của khái niệm [Mouse] để tạo một đồ thị khái niệm đơn cho câu “Yojo is chasing a brown mouse” Qui tắc tách rời khôi phục lại thành đồ thị ở trên Sau đây là những câu CGIF biểu diễn cho đồ thị trên và bên dưới trong hinh 4.3: Những qui tắc tổng quát hóa và tương... bất cứ đồ thị hoặc đồ thị con có thể được thay thế bởi bất cứ việc tổng quát hóa 2 (i) Bất cứ đồ thị hoặc đồ thị con trong ngữ cảnh c nào đó có lẽ được sao chép trong ngữ cảnh giống nhau c hoặc trong ngữ cảnh nào đó được lồng trong c (Sự ngoại lệ duy nhất là không có đồ thị được sao chép trực tiếp vào chính nó; tuy nhiên nó có thể sao chép một đồ thị g trong ngữ cảnh c và sau đó sao chép bản sao vào bản... trong hình 5.1 thành IKL là viết chúng ở phiên bản mở rộng của CGIF mà cho phép đồ thị khái niệm được lồng bên trong những nút khái niệm của kiểu Proposition hoặc Situation Sau đây là CGIF cho đồ thị khái niệm bên trái của hình 5.1: 26 Phát biểu này sử dụng tùy chọn chuyển những nút khái niệm cho những kiểu Proposition và Situation bên trong những nút quan hệ của kiểu Thme Tùy chọn đó không nhấn mạnh . những đồ thị lõi không có kiểu mà tương ứng với đồ thị hiện sinh nguyên thủy của Peirce. Tổng quát hơn là đồ thị khái niệm mở rộng là một tập lớn có kiểu của đồ thị lõi. Đồ thị khái niệm nghiên. quát nhưng đồ thị khái niệm nghiên cứu được định nghĩa bởi nhiều sự mở rộng hình thức và không hình thức. 2. Từ đồ thị hiện sinh đến đồ thị khái niệm Trong suốt thập kỉ 60, biểu diễn ngữ nghĩa. hiển thị đồ thị khái niệm cho câu “John is going to Boston by bus”. Đồ thị khái niệm trong hình 2.1 biểu diễn một phiên bản có kiểu hoặc được sắp xếp của logic. Mỗi khái niệm trong bốn khái niệm

Ngày đăng: 10/04/2015, 08:50

Từ khóa liên quan

Mục lục

  • 1. Giới thiệu

  • 2. Từ đồ thị hiện sinh đến đồ thị khái niệm

  • 3. Logic tổng quát (Common Logic)

  • 4. Lập luận với đồ thị

  • 5. Mệnh đề, tình huống và siêu ngữ

  • 6. Kết luận

  • 7. Tài liệu tham khảo

Tài liệu cùng người dùng

Tài liệu liên quan