Kết luận chương

Một phần của tài liệu nghiên cứu những vấn đề tri thức trong hệ cơ sở tri thức (Trang 28)

Chương 1 đó trỡnh bày tổng quan về cỏc vấn đề về tri thức: từ thụng tin, dữ liệu đến tri thức. Sự phõn loại về cỏc kiểu tri thức như tri thức sự kiện, tri thức thủ tục, tri thức mụ tả, … Cụng nghệ xử lý tri thức, bao gồm quỏ trỡnh thu thập, cỏc phương phỏp biểu diễn và sử dụng tri thức. Biểu diễn tri thức với cỏc cỏc hỡnh thức như: tri thức dạng luật, tri thức dạng luật ngữ nghĩa, tri thức nhờ cõy khung. Khai thỏc và sử dụng tri thức thụng qua cỏc phộp suy diễn.

CHƯƠNG 2: THẨM ĐỊNH ĐÁNH GIÁ HỆ CƠ SỞ TRI THỨC 2.1. Hệ cơ sở tri thức (Knowledge Base System - KBS)

2.1.1. Hệ cơ sở tri thức là gỡ?

Hệ cơ sở tri thức (CSTT) là chương trỡnh mỏy tớnh được thiết kế để mụ hỡnh húa khả năng giải quyết vấn đề của chuyờn gia, con người [1, 2, 4, 5]. Hệ CSTT là hệ thống dựa trờn tri thức, cho phộp mụ hỡnh húa cỏc tri thức của chuyờn gia, dựng tri thức này để giải quyết vấn đề phức tạp thuộc cựng lĩnh vực. Hai yếu tố quan trọng trong hệ CSTT là tri thức chuyờn gia và lập luận, tương ứng với hệ thống cú hai khối chớnh là cơ sở tri thức và động cơ suy diễn:

- Cơ sở tri thức: Chứa cỏc tri thức chuyờn sõu về lĩnh vực như chuyờn gia. Cơ sở tri thức bao gồm: cỏc sự kiện, cỏc luật, cỏc khỏi niệm và cỏc quan hệ - Động cơ suy diễn: Bộ xử lý tri thưc mụ hỡnh húa theo cỏch lập luận của hệ

chuyờn gia. Động cơ hoạt động dựa trờn thụng tinh về vấn đề đang xột, so sỏnh với tri thức đang lưu trong cơ sở tri thức rồi rỳt ra kết luận.

Hệ cơ sở tri thức là một trong những lĩnh vực nghiờn cứu khoa học của trớ tuệ nhõn tạo. Cỏc ứng dụng khỏc của trớ tuệ nhõn tạo là về người mỏy, sự hiểu biết ngụn ngữ tự nhiờn, nhận dạng giọng núi, và tầm nhỡn mỏy tớnh. Đột phỏ lớn trong lĩnh vực trớ tuệ nhõn tạo là sự phỏt triển thụng minh của mỏy tớnh bổ sung nguồn nhõn lực và sự hiểu biết tốt hơn về con người cỏch suy nghĩ, lý do và học hỏi. Hệ cơ sở tri thức cú lẽ là ứng dụng thực tế của trớ tuệ nhõn tạo.

Cỏc hệ thống về chuyờn gia và hệ cơ sở tri thức thường được sử dụng cựng một lỳc. Hệ thống chuyờn gia thường được mụ tả như hệ thống thụng tin mỏy tớnh dựa trờn mụ phỏng suy luận của con người với kiến thức sõu sắc và nhiệm vụ cụ thể trong một miền vấn đề hẹp. Cỏc tài liệu nghiờn cứu cho thấy quan điểm khỏc nhau về hệ cơ sở tri thức bao gồm tất cả cỏc ứng dụng cụng nghệ thụng tin liờn quan đến tổ chức, với mục đớch giỳp quản lý tài sản tri thức trong tổ chức. Với quan điểm này, hệ cơ sở tri thức khụng chỉ bao gồm hệ chuyờn gia, mà cũn ứng dụng như phần mềm nhúm và hệ thống quản lý cơ sở dữ liệu, giống hệt với hệ chuyờn gia, ngoại trừ cỏc nguồn chuyờn mụn cú thể bao gồm kiến thức tài liệu. Do đú hệ chuyờn gia cú thể được xem như là một chi nhỏnh của hệ cơ sở tri thức. Luận văn này sẽ sử dụng định nghĩa của hệ SCTT như đồng nhất với hệ thống chuyờn gia.

Hệ cơ sở tri thức đó được phỏt triển đầu tiờn vào giữa những năm 1960 bởi cộng đồng trớ tuệ nhõn tạo. Trong những năm 1980 hệ cơ sở tri thức là một khỏi niệm học tập. Điều này nhanh chúng thay đổi trong những năm 1990 trong lĩnh vực

được gọi là hệ thống chuyờn gia (hoặc cỏch khỏc như hệ cơ sở tri thức). Hệ cơ sở tri thức một cỏch nhanh chúng phỏt triển thành một sản phẩm đó được kiểm chứng và đỏnh giỏ cao thị trường. Trong thập kỷ qua ứng dụng của họ đó được chứng minh là quan trọng trong việc hỗ trợ quyết định và ra quyết định, và hệ cơ sở tri thức đó thành cụng và được ỏp dụng cho nhiều lĩnh vực, chẳng hạn như, tiếp thị, sản xuất, hệ thống hỗ trợ cuộc sống và kế hoạch sản xuất và lập kế hoạch.

í tưởng cơ bản đằng sau hệ cơ sở tri thức là”một số quyết định định tớnh và tri thức cần phỏn xột nằm trong cỏc chuyờn gia con người”. Cỏc khỏi niệm cơ bản của hệ CSTT bao gồm làm thế nào để xỏc định cỏc chuyờn gia là ai, xỏc định chuyờn mụn, làm thế nào để chuyển chuyờn mụn từ người sang một mỏy tớnh và cỏc tớnh năng của một hệ thống làm việc.

2.1.2. Thành phần cơ bản hệ cơ sở tri thức

Cỏc thành phần chớnh của một hệ cơ sở tri thức thụng thường là một cơ sở tri thức, mỏy suy diễn, một cơ chế giải thớch và một giao diện người dựng được thể hiện trong hỡnh 2.1. Một lợi thế của kiến trỳc hệ cơ sở tri thức là thành phần cơ sở tri thức ngoại lệ cú thể là miền độc lập.Vỏ ngoài hệ chuyờn gia cú thể tỏi sử dụng để phỏt triển thành một hệ thống mới.Vỏ của một hệ chuyờn gia điển hỡnh cú cỏc chức năng phương phỏp suy luận, giao diện người dựng, chỉ cú cơ sở tri thức cần cho việc phỏt triển [7.8].

Hỡnh 2.1: Cỏc thành phần của hệ cơ sở tri thức

Cơ sở tri thức

Mục đớch của cơ sở tri thức là đại diện và lưu trữ tất cả thụng tin liờn quan, sự kiện, quy định, cỏc trường hợp, và mối quan hệ được sử dụng bởi cỏc hệ CSTT. Kiến thức của nhiều chuyờn gia con người cú thể được kết hợp và đại diện trong cơ sở tri thức.

Giao diện người sử dụng Mỏy suy diễn

Cơ sở tri thức Cơ chế giải thớch

Kiến thức chuyờn

Mỏy suy diễn

Như được chỉ ra trong hỡnh 2.1. Bộ nóo (trung tõm điều khiển) của một hệ chuyờn gia là mỏy suy diễn. Mục đớch của nú là để tỡm kiếm thụng tin và cỏc mối quan hệ từ cơ sở tri thức và người sử dụng, và để kết luận cõu trả lời, dự đoỏn và đề xuất như một chuyờn gia về con người. Nhiều phương phỏp suy luận cú khả năng suy luận với sự hiện diện của nhõn tố khụng chắc chắn. Cú hai phương phỏp được sử dụng đú là chuỗi ngược và chuỗi chuyển tiếp.

Cơ chế giải thớch

Một lợi thế của hệ cơ sở tri thức so với cỏc hệ thống hỗ trợ quyết định khỏc là khả năng để giải thớch cho người sử dụng biết thế nào và lý do tại sao hệ thống cú kết quả nhất định. Nhiều cơ chế giải thớch được mở rộng, vớ dụ, cho phộp người dựng nhận được giải thớch lý do tại sao cõu hỏi được hỏi, và cung cấp truy cập kiến thức chuyờn sõu cho người dựng. Cơ chế giải thớch cú thể đưa ra giải thớch dựa trờn những kiến thức trong cơ sở tri thức. Vỡ vậy cơ chế giải thớch mở rộng hệ cơ sở tri thức khụng chỉ cung cấp việc hỗ trợ ra quyết định mà cũn làm cho người dựng tỡm hiểu được cỏch sử dụng hệ thống.

Giao diện người sử dụng

Giao diện người sử dựng là thành phần rất quan trọng khi muốn được sự chấp nhận của người sử dụng. Điều đầu tiờn mà người sử dụng đỏnh giỏ hệ thống cũng như là điều đầu tiờn mà người dựng tiếp cận với hệ chuyờn gia cũng như thường xuyờn tiếp xỳc với đú chớnh là giao diện người sử dụng. Nếu một hệ thống cú giao diện khụng mềm dẻo, linh hoạt, trong sỏng sẽ gõy nhiều khú khăn cho người sử dụng tiếp cận và khai thỏc hệ thống. Người kỹ sư xử lý tri thức sẽ tốn khỏ nhiều thời gian, cụng sức cho việc xõy dựng cỏc chức năng cần thiết cho giao diện người dựng.

Cỏc chức năng cú thể bao gồm: Bộ giao diện, module ngụn ngữ tự nhiờn và module biểu diễn đồ họa. Xõy dựng cỏc menu cho phộp người kỹ sư xử lý tri thức xõy dựng menu một cỏch nhanh chúng. Menu lựa chọn chớnh là một kiểu giao diện trực quan nhất.

Menu ngụn ngữ tự nhiờn cú khả năng trợ giỳp người sử dụng, xõy dựng giao diện người dựng thực hiện cỏc ngụn ngữ tự nhiờn mà người sử dụng giao tiếp với hệ thống và khai thỏc hệ chuyờn gia. Khi đú giao diện ngụn ngữ cho phộp người xõy dựng hệ chuyờn gia và người sử dụng tương tỏc với cỏc chương trỡnh ngoài.

Module biểu diễn đồ họa thường cú giỏ trị trợ giỳp người sử dụng hiểu những cõu hỏi và những lời giải thớch của hệ chuyờn gia. Module này giỳp người sử

dụng xử lý cỏc tri thức kết hợp chặt chẽ với khỏi niệm đồ họa và giao diện người dựng. Nú nhận cỏc file đồ họa và biểu diễn chỳng theo cỏch nhất định mà người xõy dựng hệ chuyờn gia quyết định. Nú thường được sử dụng khi hệ chuyờn gia muốn mụ tả bằng hỡnh ảnh hơn là việc mụ tả bằng lời.

Bộ tạo giải thớch đưa ra lời giải thớch dựa vào dữ liệu tri thức do người kỹ sư xử lý tri thức cung cấp. Do đú người kỹ sư tri thức luụn luụn giữ cỏc chức năng giải thớch và việc sử dụng tri thức sẽ quyết định bằng việc định dạng dữ liệu tri thức vào cơ sở tri thức của hệ chuyờn gia. Nghĩa là người kỹ sư xử lý tri thức xõy dựng cơ sở tri thức cựng với chức năng giải thớch cựng một lỳc.

2.2. Cỏc vấn đề tri thức (adsbygoogle = window.adsbygoogle || []).push({});

Cỏc hệ thống khai phỏ tri thức dựa trờn cơ sở dữ liệu để cung cấp dữ liệu thụ cho đầu vào và đề xuất cỏc vấn đề này trong cơ sở dữ liệu động, khụng đầy đủ, nhiễu, và lớn. Cỏc vấn đề như giới hạn thụng tin, mất mỏt giỏ trị, và cỏc thuộc tớnh khụng liờn quan xuất hiện như là một kết quả của sự đầy đủ và xỏc đỏng của dữ liệu được lưu trữ.

Giới hạn thụng tin: Một cơ sở dữ liệu thường được thiết kế cho mụi trường hoạt động và những mục đớch của nú khỏc với khai phỏ tri thức. Đụi khi cỏc thuộc tớnh sẽ đơn giản húa nhiệm vụ khai phỏ hoặc khụng đưa ra hoặc cú thể được yờu cầu từ thế giới thực. Dữ liệu khụng xỏc định sẽ gõy ra một số vấn đề. Nú cú thể khụng khai phỏ được tri thức quan trọng về một lĩnh vực đó cho nếu một số thuộc tớnh quan trọng đối với kiến thức về lĩnh vực ứng dụng là khụng được đưa ra trong dữ liệu.

Vớ dụ, chỳng ta khụng thể chẩn đoỏn bệnh sốt rột từ một cơ sở dữ liệu bệnh nhõn nếu dữ liệu khụng chứa đựng những xột nghiệm mỏu của bệnh nhõn.

Cập nhật: Cơ sở dữ liệu thường là động trong nội dung do chỳng thay đổi như là thờm, sửa, hay xoỏ dữ liệu. Sự bảo dưỡng hầu hết được giữ để bảo đảm cỏi mà cỏc luật khỏm phỏ được tăng lờn theo ngày thỏng và ổn định với hầu hết dữ liệu hiện tại.

Dữ liệu bờn ngoài: Đõy cú thể là cỏc trường hợp những mẫu được khai phỏ dựa vào dữ liệu cấu trỳc bờn trong khụng thể được chứng minh là đỳng hay được giải thớch. Những mẫu như vậy cú thể được chỉ giải thớch bởi dữ liệu ngoài bổ sung mà khụng cú sẵn trong dữ liệu thao tỏc hay kho dữ liệu liờn quan. Chẳng hạn, chỳng ta cú thể khai phỏ một sự giảm đều số hàng bỏn của một mặt hàng đó cho trong hai thỏng qua. Tại cựng thời gian, những sản phẩm khỏc của cụng ty là tốt và tổng thu nhập toàn diện và những lợi nhuận toàn bộ tăng lờn. Một lý do cho sự giảm trong

những sản phẩm bỏn cú thể là một sự thỳc đẩy tiếp thị cuộc chạy đua giỏ cả được làm bởi một đối thủ với sự quan tõm tới dũng sản phẩm này của chỳng ta. Thụng tin như vậy cú thể khụng sẵn cú trong hệ thống. Chi tiết này là dữ liệu thao tỏc và dữ liệu rỳt trớch thoả thuận gần như với riờng dữ liệu bờn trong tổ chức.

2.2.1. Sự mõu thuẫn trong cơ sở tri thức

Sự mõu thuẫn trong cơ sở dữ liệu cú thể dẫn tới khai phỏ tri thức dư thừa, gộp lại, và mõu thuẫn.

2.2.2. Tri thức dư thừa

Thụng tin thường xảy ra liờn tiếp ở nhiều nơi trong một cơ sở dữ liệu. Một dạng dư thừa phổ biến đú là phụ thuộc hàm trong đú một trường được định nghĩa như một hàm của cỏc trường khỏc (Lợi_nhuận = Thu_nhập – Chi_phớ). Vấn đề với thụng tin thừa là nú cú thể khai phỏ lỗi như là tri thức, mà nú thường khụng được quan tõm bởi người dựng cuối. Tri thức khai phỏ cú thể chứa sự dư thừa khi hai mảnh của tri thức là chớnh xỏc như nhau (cỏc luật cú cỏc giả thuyết và kết luật tương tự nhau) hoặc cú nghĩa tương đương. Thờm vào đú, “khai phỏ tri thức” cú thể là sự thật biết trước (một tri thức lĩnh vực) hơn là một khai phỏ mới. Trong quan hệ CAR của hỡnh 6, chỳng ta cú thuộc tớnh Engine_Size, cỏi mà giống như là Bore*Stroke*Cylinders. Cụng cụ khai phỏ khai phỏ cỏc luật liờn quan tới tổng số dặm đường đó đi tới Engine_Size và tổng số dặm đường đó đi tới Bore, Stroke và Cylinders là sự dư thừa.

2.2.3. Tri thức gộp

Khai phỏ tri thức cú thể gộp những tri thức tương tự nghĩa là cỏc luật cú kết luận tương tự, nhưng chỉ một luật cú nhiều điều kiện hơn.

2.2.4. Tri thức mõu thuẫn

Đõy là khả năng tri thức được khai phỏ mõu thuẫn với tri thức của chuyờn gia. Trong trường hợp khỏc, cỏc luật được khai phỏ cú thể mõu thuẫn lẫn nhau. Nguyờn nhõn cú thể vỡ mọi giỏ trị dữ liệu thực tế được đưa vào trong cơ sở dữ liệu là sai hoặc một vài mối quan hệ bị mất mỏt từ cơ sở dữ liệu.

2.3 Tổng quan về tri thức mờ

Cỏc khỏi niệm cơ bản về logic mờ A. TẬP MỜ

Một tập hợp trong một khụng gian nào đú, theo khỏi niệm cổ điển sẽ chia khụng gian thành 2 phần rừ ràng. Một phần tử bất kỳ trong khụng gian sẽ thuộc hoặc khụng thuộc vào tập đó cho. Tập hợp như vậy cũn được gọi là tập rừ. Lý

thuyết tập hợp cổ điển là nền tảng cho nhiều ngành khoa học, chứng tỏ vai trũ quan trọng của mỡnh. Nhưng những yờu cầu phỏt sinh trong khoa học cũng như cuộc sống đó cho thấy rằng lý thuyết tập hợp cổ điển cần phải được mở rộng [2, 9, 10].

Ta xột tập hợp những người trẻ. Ta thấy rằng người dưới 26 tuổi thỡ rừ ràng là trẻ và người trờn 60 tuổi thỡ rừ ràng là khụng trẻ. Nhưng những người cú tuổi từ 26 đến 60 thỡ cú thuộc tập hợp những người trẻ hay khụng? Nếu ỏp dụng khỏi niệm tập hợp cổ điển thỡ ta phải định ra một ranh giới rừ ràng và mang tớnh chất ỏp đặt chẳng hạn là 45 để xỏc định tập hợp những người trẻ. Và trong thực tế thỡ cú một ranh giới mờ để ngăn cỏch những người trẻ và những người khụng trẻ đú là những người trung niờn. Như vậy, những người trung niờn là những người cú một”độ trẻ”nào đú. Nếu coi”độ trẻ”của người dưới 26 tuổi là hoàn toàn đỳng tức là cú giỏ trị là 1 và coi”độ trẻ”của người trờn 60 tuổi là hoàn toàn sai tức là cú giỏ trị là 0, thỡ”độ trẻ”của người trung niờn sẽ cú giỏ trị p nào đú thoả 0 < p < 1.

Như vậy nhu cầu mở rộng khỏi niệm tập hợp và lý thuyết tập hợp là hoàn toàn tự nhiờn. Cỏc cụng trỡnh nghiờn cứu về lý thuyết tập mờ và logic mờ đó được L.Zadeh cụng bố đầu tiờn năm 1965, và sau đú liờn tục phỏt triển mạnh mẽ.

Định nghĩa: Cho khụng gian nền U, tập AU được gọi là tập mờ nếu A

được xỏc định bởi hàm A:X->[0,1]. A

 được gọi là hàm thuộc, hàm liờn thuộc hay hàm thành viờn (membership

function).

Với xX thỡ A(x) được gọi là mức độ thuộc của x vào A.

Như vậy ta cú thể coi tập rừ là một trường hợp đặc biệt của tập mờ, trong đú hàm thuộc chỉ nhận 2 giỏ trị 0 và 1.

Ký hiệu tập mờ, ta cú cỏc dạng ký hiệu sau:

 Liệt kờ phần tử: giả sử U = {a, b, c, d} ta co thể xỏc định một tập mờ A =

Một phần của tài liệu nghiên cứu những vấn đề tri thức trong hệ cơ sở tri thức (Trang 28)