1. Trang chủ
  2. » Luận Văn - Báo Cáo

Biểu diễn tri thức và ứng dụng

31 779 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 382,5 KB

Nội dung

Biểu diễn tri thức ứng dụng 2012 MỤC LỤC L I CÁM NỜ Ơ .1 L I M UỜ Ở ĐẦ 2 GI I THI UỚ Ệ .4 PH N 1: C S LÝ LU NẦ Ơ Ở Ậ 5 1.2 H c s tri th c:ệ ơ ở ứ 10 1.2.1 Phân lo i tri th c: ạ ứ .11 1.2.3 Các k thu t bi u di n tri th c: ỹ ậ ể ễ ứ .12 1.2.3.1 Bi u di n tri th c b ng b ba OAV (Object – Attribute – Value):ể ễ ứ ằ ộ 13 1.2.3.2 Bi u di n tri th c b ng lu t s n xu t: ể ễ ứ ằ ậ ả ấ .13 1.2.3.3 Bi u di n tri th c b ng m ng ng ngh a: ể ễ ứ ằ ạ ữ ĩ 13 1.2.3.4 Bi u di n tri th c b ng Frame: ể ễ ứ ằ .14 1.2.3.5 Bi u di n tri th c b ng Logic:ể ễ ứ ằ 14 1.3 Khái ni m v h chuyên gia:ệ ề ệ .16 1.3.1 c tr ng c a h chuyên giaĐặ ư ủ ệ 17 1.3.2 Suy di n trong h chuyên gia:ễ ệ .20 1.3.2.1 Suy di n ti n: ễ ế .20 1.3.2.2 Suy di n lùi:ễ 21 1.3.2.3 Chi n l c gi i quy t đ ng đ trong quá trình suy di n:ế ượ ả ế ụ ộ ễ 21 1.3.2.4 H chuyên gia m (Fuzzy Expert System):ệ ờ .21 1.3.3 Bi u di n tri th c trong các h chuyên giaể ễ ứ ệ .22 1.3.3.1 Logic m nh đ :ệ ề 23 1.3.3.2 Logic v t :ị ừ 23 PH N 2: XÂY D NG H CHUYÊN GIA T V N CHO NG I DÙNG H C TI NGẦ Ự Ệ Ư Ấ ƯỜ Ọ Ế ANH .25 2.1 Gi i thi u h th ng:ớ ệ ệ ố .25 2.2 Phân tích: .26 2.3 Ki n trúc h th ngế ệ ố 26 .28 2.5 Mã ngu n h th ng t v n h c Anh v n:ồ ệ ố ư ấ ọ ă .28 K T LU NẾ Ậ 29 TÀI LI U THAM KH OỆ Ả 30 LỜI CÁM ƠN  1 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012 Trong thời gian thực hiện đề tài, em đã nhận được rất nhiều sự động viên, khích lệ hỗ trợ từ phía thầy cô, cha mẹ bạn bè. Con xin gửi tất cả lòng biết ơn sự kính trọng của con đến cha mẹ cùng toàn thể gia đình, những người đã sinh thành, dưỡng dục luôn ở bên con, ủng hộ giúp đỡ con trong quá trình học tập. Em cảm ơn khoa Công nghệ Thông tin, trường Đại học Công nghệ Thông tin đã tạo điều kiện cho em thực hiện đề tài. Em xin gửi lời cảm ơn tới các thầy cô trong khoa công nghệ thông tin nói chung, bộ môn khoa học máy tính nói riêng đã tạo điều kiện giúp đỡ, truyền đạt những kiến thức kỹ năng cần thiết để em hoàn thành nhiệm vụ học tập của mình. Xin chân thành cảm ơn thầy PGS.TS. Đỗ Văn Nhơn đã tận tình giảng dạy hướng dẫn để em hoàn thành đề tài này. Em cũng xin chân thành cảm ơn các bạn trong lớp đã động viên chia sẻ kinh nghiệm trong học tập nghiên cứu giúp đỡ trong quá trình làm đề tài. Tuy nhiên vì thời gian cũng như tri thức còn hạn chế, nên đề tài không tránh khỏi những thiếu sót nhất định. Rất mong nhận được mọi sự đóng góp ý kiến từ quý thầy cô bạn bè. LỜI MỞ ĐẦU  2 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012 Chúng ta đang sống trong thời đại của thông tin nơi mà dữ liệu đa dạng phong phú. Chúng ta thường bị choáng ngợp bởi lượng thông tin vô cùng to lớn do đó không thể tiếp nhận tất cả những lợi ích mà thông tin mang tới. Khoa học máy tính đã bị thách thức để khám phá ra những cách tiếp cận mà có thể sắp xếp được núi dữ liệu hiện có tìm ra những đặc trưng thiết yếu cần có để phục vụ cho lợi ích của con người. Những cách tiếp cận này phải có thể xử lí những lượng lớn dữ liệu trong thời gian nhanh loại bỏ những dữ liệu không liên quan hay không chính xác để trích xuất ra những thông tin, tri thức quý báu cho chúng ta. Trong bối cảnh thông tin đang bùng nổ như hiện nay. Khai thác ứng dụng thông tin sao cho có hiểu quả là điều cần thiết. Các cơ quan, tổ chức đều mong muốn có được càng nhiều thông tin về lĩnh vực mình hoạt động càng tốt: các khách hàng tiềm năng, hoạt động cạnh tranh giữa các công ty, biến động của thị trường… Ngoài ra, thông tin cũng sẽ không giúp ích được nhiều nếu như người nắm giữ thông tin không biết khai thác nó. Bản thân thông tin mang những hiện tượng xu hướng phổ biến. Nếu nắm được các hiện tượng, xu hướng phổ biến này, chúng sẽ hoạt động hiệu quả nhất trong tất cả các lĩnh vực như kinh tế, xã hội, chính trị…,vì ai có được thông tin khai thác thông tin nhanh chính xác hiệu quả nhất sẽ là người chiến thắng. Tuy nhiên, trong thời đại của công nghệ thông tin nơi mà dữ liệu đa dạng phong phú. Người dùng thường bị choáng ngợp bởi lượng thông tin vô cùng to lớn do đó không thể tiếp nhận tất cả những lợi ích mà thông tin mang tới. Khoa học máy tính đã bị thách thức để khám phá ra những cách tiếp cận mà có thể sắp xếp, biểu diễn được lượng dữ liệu vô tận hiện có tìm ra những đặc trưng thiết yếu cần có để phục vụ cho lợi ích của người dùng. Những cách tiếp cận này phải có thể xử lí những lượng lớn dữ liệu trong thời gian nhanh loại bỏ những dữ liệu không liên quan hay không chính xác để trích xuất ra những thông tin, tri thức quý báu cho chúng ta. 3 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012 Xin chân thành cảm ơn thầy PGS.TS. Đỗ Văn Nhơn đã tận tình giảng dạy hướng dẫn để em hoàn thành bài thu hoạch này. Em cũng xin chân thành cảm ơn các bạn trong lớp đã động viên chia sẻ kinh nghiệm trong học tập nghiên cứu giúp đỡ trong quá trình làm bài thu hoạch. Tuy nhiên vì thời gian cũng như tri thức còn hạn chế, nên bài thu hoạch không tránh khỏi những thiếu sót nhất định. Rất mong nhận được mọi sự đóng góp ý kiến từ quý thầy cô bạn bè. GIỚI THIỆU Sau hơn 20 năm thực hiện đường lối đổi mới kinh tế của Đảng Nhà nước, nền kinh tế nước ta đã đạt được nhiều thành tựu đáng kể, cơ cấu kinh tế đã có sự 4 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012 chuyển dịch căn bản tích cực theo hướng công nghiệp hoá, hiện đại hoá.Với những tác động mạnh mẽ của các tiến bộ khoa học công nghệ, đặc biệt là công nghệ thông tin truyền thông, thế giới đang biến chuyển tới một nền kinh tế xã hội mới mà thông tin tri thức được xem là nguồn lực chủ yếu. Điều đó xuất phát từ: Công cuộc đổi mới bắt đầu năm 1986 đã tác động tích cực đến nhiều ngành kinh tế do hội nhập kinh tế thế giới, đặc biệt năm 2006 nước ta gia nhập tổ chức Thương mại thế giới – WTO đã mở cửa nền kinh tế tạo ra nhiều cơ hội phát triển, đồng thời đặt nền kinh tế nước ta trước vô vàn thử thách. Hòa nhập vào sự phát triển chung của nhân loại, Việt Nam đang bước vào một thời kì phát triển mới – thời kì đẩy mạnh công nghiệp hóa - hiện đại hóa. Bên cạnh thành tựu đã đạt được, chúng ta còn nhiều khó khăn, hạn chế cần khắc phục. Cụ thể là trình độ công nghệ thông tin còn lạc hậu, tiềm lực khoa học công nghệ thông tin yếu cả về nguồn nhân lực lẫn nguồn vốn cho hoạt động khoa học công nghệ thông tin, cơ chế quản lý công nghệ thông tin còn yếu kém, ứng dụng vào thực tế chưa cao. Chính vì vậy việc áp dụng công nghệ thông tin vào công cuộc đổi mới nền kinh tế nước ta là tất yếu. Để đáp ứng nhu cầu của người dùng đối với máy tính ngày một cao hơn biết áp dụng hữu hiệu vào đời sống thì biểu diễn tri thức đóng vai trò hết sức quan trọng trong việc phát triển Công nghệ thông tin, nâng cao sự hữu dụng của máy tính, giúp con người gần gũi với máy tính hơn. Ngoài ra, biểu diễn tri thức còn góp phần thúc đẩy nhiều ngành khoa học khác phát triển, khả năng phát triển khoa học dựa trên tri thức liên ngành. PHẦN 1: CƠ SỞ LÝ LUẬN 1.1 Biểu diễn tri thức 1.1.1 Giới thiệu về biểu diễn tri thức 5 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012 Biểu diễn tri thức (KR) là một lĩnh vực nghiên cứu trí tuệ nhân tạo nhằm mục đích đại diện cho kiến thức trong các biểu tượng để tạo điều kiện suy ra từ những yếu tố kiến thức, tạo ra những yếu tố mới của kiến thức. KR có thể được thực hiện cho được độc lập của mô hình kiến thức cơ bản hoặc hệ thống cơ sở tri thức (KBS) như một mạng lưới ngữ nghĩa. Biểu diễn tri thức (KR) nghiên cứu liên quan đến phân tích làm thế nào để lý do chính xác hiệu quả làm thế nào tốt nhất để sử dụng một tập hợp các biểu tượng đại diện cho một tập hợp các sự kiện trong một lĩnh vực kiến thức. Vốn từ vựng biểu tượng một hệ thống logic được kết hợp để cho phép suy luận về các yếu tố trong KR để tạo mới câu KR. Logic được sử dụng để cung cấp ngữ nghĩa chính thức của chức năng có lý nên được áp dụng cho các biểu tượng trong hệ thống KR. Logic là cũng được sử dụng để xác định các toán tử có thể xử lý như thế nào thay đổi hình dáng kiến thức. Ví dụ các toán tử bao gồm: phủ định, kết hợp, trạng từ, tính từ, lượng hóa phương thức khai thác. Logic là lý thuyết giải thích. Những yếu tố-biểu tượng, các toán tử, giải thích lý thuyết là những gì cung cấp cho trình tự của các biểu tượng có nghĩa là trong một KR. Trong việc áp dụng hệ thống KR vấn đề thực tế, sự phức tạp của vấn đề có thể vượt quá hạn chế nguồn lực, khả năng của hệ thống KR. Phát triển gần đây trong KR bao gồm các khái niệm về Semantic Web, phát triển dựa trên ngôn ngữ XML biểu diễn tri thức các tiêu chuẩn, Resource Description Framework (RDF), RDF Schema, Maps Topic, DARPA Agent Markup Language (DAML), Layer Suy diễn Ontology (OIL),và Web Ontology Language (OWL). Có một số kỹ thuật KR như: khung (frames), quy định, gắn thẻ, các mạng ngữ nghĩa có nguồn gốc trong lĩnh vực khoa học nhận thức. Vì tri thức được sử dụng để đạt được hành vi thông minh, mục tiêu cơ bản của biểu diễn tri thức là để tạo điều kiện cho lý luận, suy luận hoặc kết luận bản vẽ. Một KR tốt phải có cả hai kiến thức thủ tục khai báo. 6 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012  Vai trò của biểu diễn tri thức (KR): Một biểu diễn tri thức (KR) về cơ bản là một người đại diện, đại diện cho bản thân sự vật, được sử dụng để cho phép một tổ chức để xác định hậu quả của suy nghĩ hơn là hành động, theo lý luận về thế giới chứ không phải là hành động trong đó. KR là một tập hợp các cam kết bản thể học, trả lời cho câu hỏi: Trong các quan hệ, tôi nên suy nghĩ gì về thế giới? KR là một lý thuyết rời rạc của lý luận thông minh, thể hiện về ba thành phần: quan niệm cơ bản của biểu diễn của lý luận thông minh, tập hợp các suy luận của các hình thức biểu diễn công nhận thiết lập các kết luận có khuyến cáo. KR là một phương tiện để tính toán thực dụng hiệu quả, môi trường tính toán được thực hiện trong đó tư duy. Một trong những đóng góp hiệu quả này thực tế được cung cấp bởi các hướng dẫn cơ quan đại diện cung cấp cho tổ chức thông tin để tạo điều kiện thuận lợi cho việc đưa ra những kết luận đề nghị. KR là một phương tiện biểu hiện của con người, một ngôn ngữ mà chúng ta nói những điều về thế giới. Trong lĩnh vực trí tuệ nhân tạo, giải quyết vấn đề có thể được đơn giản hóa bằng một sự lựa chọn thích hợp của biểu diễn tri thức. Biểu diễn tri thức trong một số cách làm cho một số vấn đề dễ dàng hơn để giải quyết. Ví dụ, nó được dễ dàng hơn để phân chia số đại diện trong các chữ số Hindu-Arabic hơn số biểu diễn như là chữ số La Mã. 1.1.2 Đặc điểm cơ bản về biểu diễn tri thức Bao phủ (coverage), KR bao gồm một bề rộng chiều sâu của thông tin. Nếu không có một phạm vi bao phủ rộng, KR không có thể xác định bất cứ điều gì hoặc giải quyết không rõ ràng. 7 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012 Dễ hiểu bởi con người. KR được xem như là một ngôn ngữ tự nhiên. Nó sẽ hỗ trợ mô đun phân cấp các lớp (gấu Bắc cực là gấu, là động vật). Nhất quán. Nếu Linh mở cửa, nó cũng có thể được hiểu như là cánh cửa đã mở cửa bởi Linh. Bằng cách phù hợp, KR có thể loại bỏ kiến thức dư thừa hoặc xung đột. Hiệu quả Dễ sửa đổi cập nhật. Hỗ trợ các hoạt động thông minh sử dụng cơ sở tri thức. 1.1.3 Ảnh hưởng của Bản thể học (Ontology) Bản thể học giúp xây dựng mô hình của một lĩnh vực xác định các thuật ngữ bên trong lĩnh vực các mối liên hệ giữa chúng. Có nhiều kiểu khác nhau về bản thể học bao gồm các bản thể học lĩnh vực, các bản thể học tổng quát, các bản thể học ứng dụng, các bản thể học tượng trưng. Trong khi phân loại tri thức, lưu trữ, truy xuất quản trị thông tin thì nó không chỉ hữu ích cho việc giải quyết vấn đề không trực tiếp cần chuyên môn loài người mà còn đưa đến các kết quả “Quản trị tri thức” cho phép một tổ chức thực hiện chức năng một cách hiệu quả trong một thời gian dài. 1.1.4 Hướng tiếp cận biểu diễn tri thức để hiểu ngôn ngữ tự nhiên Mô tả nghiên cứu sơ bộ hướng tiếp cận biểu diễn tri thức với việc hiểu Ngôn ngữ tự nhiên (Natural Language Understanding - NLU). Một hệ thống máy tính đang được phát triển để xử lý sự thu nhận, sự mô tả, sử dụng ngôn ngữ tri thức. Hệ thống máy tính được dựa trên nguyên tắc sử dụng một mạng ngữ nghĩa cho việc lưu trữ mô tả tri thức. Để tạo điều kiện tương tác giữa người dùng hệ thống, đầu vào của ngôn ngữ học tri thức các phản ứng máy tính nằm trong ngôn ngữ tự nhiên. Nhiều loại tri thức khác nhau có thể được nhập sử dụng: cú 8 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012 pháp ngữ nghĩa; các xác nhận quy tắc. Sự dễ dàng truy vết suy luận cũng đang được phát triển như là một phần của hệ thống dựa trên nguyên tắc với đầu ra trong ngôn ngữ tự nhiên.  Các hệ thống Ngôn ngữ tự nhiên (NL) bao gồm hai thành phần logic là: Một cơ sở cho đầu vào của ngôn ngữ tri thức vào mạng ngữ nghĩa trong ngôn ngữ tự nhiên. Ngôn ngữ tri thức này chủ yếu là bao gồm các quy tắc về NLU một từ vựng. Hệ thống NL chứa một quy tắc cốt lõi của mạng mà phân tích một quy tắc ngôn ngữ tự nhiên của người sử dụng xây dựng cấu trúc cú pháp tương ứng dưới hình thức của một quy tắc mạng. Cơ sở hệ thống NL này cho phép người dùng thao tác cả các khía cạnh cú pháp ngữ nghĩa của các chuỗi bề mặt . Một cơ sở cho cụm từ, câu tổng quát câu trả lời thông qua các quy tắc trong mạng. Người dùng có thể đặt ra một số giới hạn các loại truy vấn đến hệ thống bằng ngôn ngữ tự nhiên hệ thống sử dụng các quy tắc để phân tích truy vấn tạo ra một trả lời. Một truy vết suy luận cơ sở cũng đang được phát triển trong đó sử dụng khả năng tạo cụm từ, câu. Điều này cho phép người sử dụng truy vết quy trình suy luận mà kết quả từ kích hoạt các quy tắc của mình bằng ngôn ngữ tự nhiên. Khi một người sử dụng hệ thống NL này cho sự thử nghiệm, thì có hai miền tác vụ thuộc về mạng ngữ nghĩa. Các miền này là: (1) Miền NLU bao gồm tập hợp các mệnh đề quy định liên quan đến sự hiểu ngôn ngữ tự nhiên, bao gồm cả các quy tắc các xác nhận cốt lõi của hệ thống NL, các quy tắc các xác nhận cụ thể của người sử dụng; (2) các miền tri thức mà người dùng nhập vào tương tác thông qua các miền NLU. Cách tiếp cận KR đến một tác vụ trí tuệ nhân tạo bao gồm một liên kết chặt chẽ với một chuyên gia trong phạm vi tác vụ. Điều này đòi hỏi phải làm cho nó dễ dàng cho các chuyên gia để thêm tri thức mới vào hệ thống máy tính, để hiểu những tri thức gì đang có trong hệ thống, để hiểu làm thế nào hệ thống hoàn thành được tác vụ, vì vậy những thay đổi cần thiết các sửa chữa dễ dàng nhận ra 9 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương Biểu diễn tri thức ứng dụng 2012 thực hiện. Cần lưu ý rằng phạm vi tác vụ của chúng ta là NLU (Natural Language Understanding). Điều đó là, các tri thức trong hệ thống là tri thức về NLU chuyên gia dự định là một chuyên gia trong NLU. Hệ thống KR chúng ta đang sử dụng là hệ thống xử lý mạng ngữ nghĩa SNePS. Hệ thống này là một hệ thống mạng ngữ nghĩa, trong đó tất cả tri thức, bao gồm cả quy tắc, được đặc trưng là các nút trong một mạng lưới ngữ nghĩa, một hệ thống suy luận thực hiện lập luận theo các quy định được lưu trữ trong mạng một gói truy xuất cho phép người dùng đi theo lập luận của hệ thống. Một phần chủ yếu của nghiên cứu này bao gồm việc thiết kế thực thi một hệ thống dựa trên SNePS được gọi là các hệ thống NL, để cho phép các chuyên gia NLU nhập ngôn ngữ học tri thức vào mạng trong ngôn ngữ tự nhiên để sử dụng tri thức này cho việc xử lý văn bản bao gồm cả bổ sung tri thức NLU. Những tính năng này phân biệt hệ thống của chúng ta từ các hệ thống dựa trên nguyên tắc xử lý ngôn ngữ tự nhiên khác như là của Pereira Warren Robinson. Một trong những mối quan tâm chính khác là tri thức thu được, gồm cả các quy định xác nhận thực tế của lập luận. Vì cả hai loại tri thức được lưu trữ dưới hình thức tương tự trong mạng ngữ nghĩa, hệ thống NL của chúng ta đang được phát triển với khả năng xử lý các đầu vào của cả hai loại tri thức với tri thức mới này ngay lập tức có sẵn để sử dụng. 1.2 Hệ cơ sở tri thức: Hệ cơ sở tri thức là chương trình được thiết kế để mô hình hóa giải quyết vấn đề của chuyên gia con người. Hệ cơ sở tri thức là hệ thống dựa trên tri thức, cho phép mô hình hóa các tri thức của chuyên gia, dùng tri thức này để giải quyết vấn đề phức tạp thuộc cùng lĩnh vực. Hai yếu tố quan trọng trong hệ cơ sở tri thức là: tri thức chuyên gia lập luận, tương ứng với hệ thống có 2 khối chính là cơ sở tri thức động cơ suy diễn. 10 GVHD: PGS.TS.Đỗ Văn Nhơn Học viên: Võ Hồng Phương

Ngày đăng: 26/12/2013, 11:11

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w