Sự phát triển vượt bậc trong lĩnh vực khoa học và công nghệ đặc biệt trongkhoa học trí tuệ nhân tạo, để xây dựng các hệ chuyên gia và các hệ giải bài toán dựatrên tri thức người ta phải
Trang 1BÁO CÁO THU HOẠCH MÔN HỌC
BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG
ĐỀ TÀI:
MẠNG NGỮ NGHĨA CHO CƠ CHẾ SUY DIỄN
GIẢI BÀI TOÁN TAM GIÁC
GIẢNG VIÊN : PGS.TS ĐỖ VĂN NHƠN HỌC VIÊN : ĐINH ĐỨC KHOA
MÃ SỐ : CH11002003
HÀ NỘI - 12/2012
Trang 2MỤC LỤC
PHẦN I: MỞ ĐẦU
Cùng vời nhiều ngành khoa học khác Khoa học máy tính và Công nghệ thôngtin đã góp phần không nhỏ vào sự tiến bộ của toàn xã hội Trí tuệ nhân tạo là mộtlĩnh vực khoa học máy tính nhằm nghiên cứu phát triển các hệ thống máy tính ngàycàng thông minh hơn; hỗ trợ tốt hơn cho hoạt động xử lý thông tin và xử lý tri thức,tính toán và điều khiển, v.v Trí tuệ nhân tạo đã xâm nhập vào nhiều mặt đời sống
xã hội và đã trở thành phương pháp rất hiệu lực để giải quyết nhiều bài toán phức tạptrong thực tế
Sự khác biệt giữa các hệ cơ sở tri thức và các chương trình truyền thống nằm
ở cấu trúc Trong các chương trình truyền thống, cách thức xử lý hành vi của chươngtrình đã được ấn định sẵn qua các dòng lệnh của chương trình dựa trên một thuật giải
đã định sẵn Trong các hệ cơ sở tri thức, có hai chức năng tách biệt nhau, trường hợp
đơn giản có hai khối; khối tri thức hay còn được gọi là cơ sở tri thức và khối điều khiển hay còn được gọi là động cơ suy diễn Với các hệ thống phức tạp, bản thân
động cơ suy diễn cũng có thể là một hệ cơ sở tri thức chứa ccas siêu tri thức (tri thức
về cách sử dụng các tri thức khác)
Việc tách biệt tri thức khỏi các cơ chế điều khiển giúp ta dễ dàng thêm vào cáctri thức mới trong tiến trình phát triển của một hệ thống Đây là điểm tương tự củađộng cơ suy diễn trong một hệ cơ sở tri thức và não bộ con người (điều khiển xử lý),
là không đổi cho dù hành vi của cá nhân có thay đổi theo kinh nghiệm và kiến thứcmới nhận được
Trang 3Sự phát triển vượt bậc trong lĩnh vực khoa học và công nghệ đặc biệt trongkhoa học trí tuệ nhân tạo, để xây dựng các hệ chuyên gia và các hệ giải bài toán dựatrên tri thức người ta phải thiết kế một cơ sở tri thức cho hệ thống và một động cơsuy diễn để giải quyết vấn đề dựa trên tri thức, đặt biệt là các hệ giải toán dựa trên trithức vấn đề làm sao để thiết kế mô hình nhằm biểu diễn cơ sở tri thức thể hiện đầy đủmiền tri thức và được mô tả đầy đủ các khía cạnh của tri thức trong lĩnh vực nó cầnbiểu diễn, mô hình này còn hướng đến việc tạo điều kiện thuận lợi cho việc thiết kế,cài đặt để xây dựng một công cụ suy diễn dễ dàng truy cập phục vụ tốt quá trình suyluận khai thác ứng dụng Vì thế một hệ giải bài toán dựa trên tri thức phải là một hệgiải toán thông minh có thể giải được các dạng bài toán tổng quát trong một miền trithức nào đó, trong đó có một cơ sở tri thức và một bộ phận thực hiện suy luận giảibài toán trong phạm vi tri thức của hệ thống [1].
Trong khoa học về trí tuệ nhân tạo có nhiều phương pháp để biểu diễn tri thức
và phương pháp cho hiệu quả cao trong viêc biểu diễn và suy luận dựa trên các bàitoán tổng quát, mỗi phương pháp điều có ưu, nhược điểm riêng của từng phươngpháp trong phần trình bày này người viết đề xuất một mô hình biểu diễn tri thức gọi
là mạng ngữ nghĩa kết hợp với một số thuật toán được ứng dụng trong giải “bài toán
tam giác” của chương trình phổ thông.
Trang 4PHẦN II: TỔNG QUAN VỀ BIỂU DIỄN TRI THỨC
Khái niệm biểu diễn tri thức và kỹ nghệ xử lý tri thức được đề cập nhiều trongkhoa học trí tuệ nhân tạo, nhưng chỉ từ khi xuất hiện và ứng dụng thực thế các hệchuyên gia, chúng mới có được các cơ sở lý luận và thực tiển vững chắc Nói tổngquát biểu diễn tri thức là thể hiện các mô tả về thế giới bên ngoài dưới dạng sao chocác máy thông minh có thể đưa tới những kết luận về môi trường xung quanh nó, trên
cơ sở một cách hình thức các mô tả này, còn kỹ nghệ tri thức bao gồm trong nó các
kỹ thuật cấu trúc tri thức, suy diễn, quản trị tri thức và học tự động Vào những nămđầu thập kỷ 80 sự phát triển của khoa học tri thức mà các nhà nghiên cứu đã đúc kếtlại những điểm khá chung nhau và các phương pháp biểu diễn tri thức đươc quan tâmchủ yếu là:
- Biểu diễn nhờ lôgic hình thức
- Biểu diễn nhờ hệ sản xuất
- Biểu diễn nhờ mạng ngữ nghĩa
- Biểu diễn nhờ các frame
Trong các phương pháp biểu diễn này là tạo ra cơ sở tri thức tường minh trongcác hệ thống khoa học trí tuệ nhân tạo dựa trên tri thức, điều đó phải đòi hỏi xâydựng các ngôn ngữ khoa học trí tuệ biểu diễn tri thức, thêm vào đó các ngôn ngữ nàyphải cung cấp các công cụ truy nhập tới các sự kiện không tường minh có trong cơ sởtri thức, nghĩa là phải bao gồm trong nó cơ chế suy diễn tự động Như vậy trong bất
kỳ một hệ thống biểu diễn tri thức nào, bao giờ cũng phải chứa ba yếu tố: Ngôn ngữbiểu diễn, cơ chế suy dẫn và công cụ lập cơ sở tri thức cho từng lĩnh vực cụ thể
II.1/ Phân loại tri thức
Dựa vào cách thức con người giải quyết vấn đề, các nhà nghiên cứu đã xâydựng các kỹ thuật biểu diễn các dạng tri thức khác nhau trên máy tính, mặc dù vậy
Trang 5không có một kỹ thuật riêng lẻ nào có thể giải thích đầy đủ cơ chế tổ chức tri thứctrong các chương trình máy tính Để giải quyết vấn đề, chúng ta chỉ chọ dạng biểudiễn nào thích hợp nhất, sau đây là các dạng biểu diễn tri thức thường gặp.
Tri thức thủ tục mô tả cách thức giải quyết một vấn đề loại tri thức này đưa
ra giải pháp để thực hiện một công việc nào đó Các dạng tri thức thủ tục tiêu biểuthường là các luật, chiến lược, lịch trình, và thủ tục
Tri thức khai báo cho biết một vấn đề được thấy như thế nào Loại tri thức
này bao gồm các phát biểu đơn giản, dưới dạng các khẳng định logic đúng hoặc sai.Tri thức khai báo cũng có thể là một danh sách các khẳng định nhằm mô tả đầy đủhơn về đối tượng hay một khái niệm nào đó
Siêu tri thức mô tả tri thức của tri thức Loại tri thức này giúp lựa chọn tri
thức thích hợp nhất trong số các tri thức khi giải quyết một vấn đề Các chuyên gia sửdụng tri thức này đề điều chỉnh hiệu quả giải quyết vấn đề bằng cách hướng các lậpluận về miền tri thức có khả năng hơn cả
Tri thức heuristic mô tả các “mẹo” để dẫn dắt tiến trình lập luận Tri thức
heuristic còn được gọi là tri thức nông cạn do không bảo đảm hoàn toàn chính xác vềkết quả giải quyết vấn đề, các chuyên gia thường dùng các tri thức khoa học như sựkiện, các luật… sau đó chuyển chúng thành các tri thức heuristic để thuận tiện hơntrong việc giải quyết một số bài toán
Tri thức có cấu trúc mô tả tri thức theo cấu trúc Loại tri thức này mô tả mô
hình tổng quan hệ thống theo quan điểm của chuyên gia, bao gồm khái niệm và cácđối tượng, diễn tả chức năng và mối liên hệ giữa các tri thức dựa theo cấu trúc xácđịnh
II.2/ Các phương pháp biểu diễn tri thức
Như đã nêu trong mục [II] tương ứng tồn tại các loại tri thức cơ bản sau:
- Tri thức mô tả
Trang 6- Tri thức thủ tục
- Tri thức điều khiển
Tương ứng với hai loại tri thức mô tả và tri thức thủ tục, có hai loại lớpphương pháp biểu diễn tri thức: biểu diễn mô tả và biểu diễn thủ tục Các cơ chế điềukhiển sẽ được lồng trong bản thân cấu trúc ngôn ngữ biểu diễn tri thức, chẳng hạntrong ngôn ngữ PROLOG để tỉa bớt một số nhánh tìm kiếm trong không gian bàitoán, tránh tìm kiếm vét cạn, nếu ta dùng toán tử cắt tỉa (cut) Có thể phân loại sau:
- Phương pháp biểu diễn tri thức mô tả: logic, mạng ngữ nghĩa, AOV
- Phương pháp biểu diễn tri thức thủ tục: sản xuất
- Phương pháp biểu diễn hổn hợp: Frame
Mong muốn của các chuyên gia về xử lý tri thức là tạo ra được các hệ thốngcho phép người sử dụng mô tả bài toán bằng ngôn ngữ mô tả, sau đó giải chúng theochế độ tương tác và hội thoại cao
II.2.1/ Biểu diễn tri thức nhờ logic
Đây là dạng biểu diễn tri thức cổ điển nhất trong máy tính là logic, với haidạng phổ biến là logic mệnh đề và logic vị từ, cả hai kỹ thuật này đều dùng ký hiệu
để thể hiện tri thức và các toán tử áp lên các ký hiệu để suy luận logic Logic đã cungcấp cho nhà nghiên cứu một công cụ hình thức để biểu diễn và suy luận tri thức
Logic mệnh đề biểu diễn và lập luận với các mệnh đề toán học Mệnh đề là
một câu nhận giá trị hoặc đúng hoặc sai giá trị này gọi là chân trị của mệnh đề Logicmệnh đề gán một bước ký hiệu vào một mệnh đề, ví dụ A= “Xe sẽ khởi động”
Trang 7Khi cần kiểm tra chân trị của câu trên trong bài toán sử dụng logic mệnh đềngười ta kiểm tra giá trị của A Nhiều bài toán sử dụng logic mệnh đề để thể hiện trithức và giải quyết vấn đề, bài toán loại này được đưa về bài toán xử lý các luật, mỗiphần giải thiết và kết luận của luật có thể có nhiều mệnh đề.
AND Khoảng cách từ nhà đến chổ làm là xa B
Luật trên có thể biểu diễn lại như sau: A^B -> C
Các phép toán quen thuộc trên các mệnh đề được cho trong bảng sau:
Bảng chân tri, với các giá trị đúng (True), sai (False)
Logic vị từ là sự mở rộng của logic mệnh đề nhằm cung cấp một cách biễu
diễn rõ hơn về tri thức thì logic vị từ dùng ký hiệu để biểu diễn tri thức Cách biểudiễn này khá trực quan và ưu điểm căn bản của nó là có một cơ sở lý thuyết vữngchắc cho những thủ tục suy diễn nhằm tìm kiếm và sản sinh ra những tri thức mới,dựa trên các sự kiện và các luật đã cho Logic vị từ cũng giống như logic mệnh đề,
dùng các ký hiệu để thể hiện tri thức, những ký hiệu này gồm: hằng số, vị từ, biến và
hàm.
Hằng số: Các hằng số dùng để đặt tên các đối tượng đặt biệt hay thuộc tính,
nhìn chung các hằng số được ký hiệu bằng chữ viết thường, chẳng hạn An, bình,nhiệt độ Hằng số An có thể được dùng để thể hiện đối tượng an một người đang xét
Trang 8Vị Từ: Một mệnh đề hay sự kiện trong logic vị từ được chia thành hai phần vị
từ và tham số Tham số thể hiện một khẳng định về đối tượng, chẳng hạn mệnh đề,chẳng hạn mệnh đề “Nam thích Mai” viết theo vị từ sẽ có dạng: thích (nam, mai).Với cách thể hiện này người ta dùng từ đầu tiên tức “thích” làm vị từ, vị từ cho biếtquan hệ giữa các đối số đặt trong ngoặc, đối số là các ký hiệu thay cho các đối tượngcủa bài toán
Biến: Các biến dùng để thể hiện các lớp tổng quát của các đối tượng hay
thuộc tính, biến được viết bằng các ký hiệu bắt đầu là chữ in hoa, như vậy có thểdùng vị tự có biến để thể hiện nhiều vị từ tương tự
Hàm: Logic vị từ cũng cho phép dùng ký hiệu để biểu diễn hàm, hàm mô tả
một ánh xạ từ các thực thể hay một tập hợp đến một phần tử duy nhất của tập hợpkhác
Phép toán: Logic vị từ cũng dùng các phép toán như logic mệnh đề như: thích
(X, Y) AND thích (Z, Y) -> ¬ thích (X, Z), việc lập luận theo cách không hình thứcđòi hỏi một khả năng rút ra được kết luận từ các sự kiện đã có, việc lấy ra thông tinmới từ các thông tin đã biết và các luật là trong tâm của tập luận trong hệ chuyên gia,quá trình lập luận được hình thức hóa trong bài toán suy luận
II.2.2/ Bộ ba đối tượng - Thuộc tính – Giá trị
Cơ chế tổ chức nhận thức của con người thường được xây dựng dựa trên các
sự kiện (fact), xem như các đơn vị cơ bản nhất, một sự kiện là một dạng tri thức khai
báo Nó cung cấp một số hiểu biết về một biến cố hay một vấn đề nào đó
Một cách biểu diễn khác là nhờ sử dụng bộ ba đối tượng – thuộc tính – giá trị(Object – Attribute – Value) để chỉ sự kiện rằng “Đối tượng” với “Thuộc tính” đãcho có một “giá trị” nào đó
Màu
Sơ đồ biểu diễn tri thức theo bộ ba (O-A-V)
Trang 9Trong các sự kiện O – A – V một đối tượng có thể có nhiều thuộc tính với cáckiểu giá trị khác nhau hơn nữa một thuộc tính cũng có thể có một hay nhiều giá trịchúng được gọi là các sự kiện đơn trị (single-value) hoặc đa trị (multi-value), điềunày cho phép các hệ tri thức linh động trong việc biểu diễn các tri thức cần thiết, cầnphân biệt hai đối tượng: đối tượng tĩnh và đối tượng động các đối tượng tĩnh đượclưu trong nội bộ nhớ dài hạn và khi cần được đưa vào bộ nhớ làm việc để xử lý,ngược lại trong quá trình làm việc khi cần sẽ khởi tạo các giá trị thuộc tính của cácđối tượng động và chúng được lưu ở bộ nhớ trong phục vụ cho việc xử lý tiếp theo.
Các sự kiện không phải lúc nào cũng đảm bảo là đúng hay sai với độ chắcchắn hoàn toàn, vì thế khi xem xét các sự kiện người ta còn sử dụng thêm một kháiniệm là độ tin cậy, phương pháp truyền thống để quản lý thông tin không chắc chắn
là sử dụng nhân tố chắc chắn CF (ceratinly factor) được dùng trong hệ MYCIN(khoảng năm 1975)
Ngoài ra, khi các sự kiện mang tính “nhập nhằng” việc biểu diễn tri thức dựavào một kỹ thuật gọi là logic mờ (do Zadeh đưa ra năm 1965) các thuật ngữ nhậpnhằng được thể hiện, lượng hóa trong tập mờ
II.2.3/ Các Luật dẫn
Trong hệ thống dựa trên các luật người ta thu thập các tri thức lĩnh vực trongmột tập và lưu chúng trong cơ sở tri thức của hệ thống Hệ thống dùng các luật nàycùng với các thông tin trong bộ nhớ để giải bài toán việc xử lý các luật trong hệthống dựa trên các luật được quản lý bằng một module gọi là hệ suy diễn, phươngpháp này khá trực quan với người sử dụng, song chỉ phù hợp khi cơ sở tri thức không
có quá nhiều luật suy dẫn và do vậy không chứa nhiều loại vị từ khác nhau
Các luật dẫn cơ bản thể hiện tri thức có thể phân loại theo loại tri thức và nhưvậy có các lớp luật tương ứng với dạng tri thức như quan hệ, khuyến cáo, hướng dẫn,chiến lược và heuristic
Quan hệ
Trang 10THEN Đầu tiên hãy kiểm tra hệ thống nhiên liệu, sau đó kiểm tra hệ
Trang 11có thể như sau.
THEN Lãi suất cao, CF=0,8
Dạng siêu luật một luật với chức năng mô tả cách thức dùng các luật khác sẽđưa ra chiến lượt sử dụng các luật theo lĩnh vực chuyên dụng, thay vì đưa ra thông tinmới
AND Hệ thống điện làm việc bình thường
THEN Có thể sử dụng các luật liên quan đến hệ thống điệnQua thực nghiệm các chuyên gia sẽ đề ra một tập các luật áp dụng cho một bàitoán cho trước thí dụ tập luật trong hệ thống chẩn đoán hỏng hóc xe điều này giúpgiải quyết các trường hợp mà khi chỉ với các luật riêng
II.2.4/ Biểu diễn tri thức bằng Frame
Phương pháp biểu diễn tri thức bằng Frame có tất cả các tính chất vốn có củamột ngôn ngữ biểu diễn tri thức, nó cũng đồng thời cũng là cơ sở cho một phươngpháp xử lý thông tin mới – hướng đối tượng nếu phương pháp biểu diễn nhờ logic vàmạng ngữ nghĩa [III] mang đặc trưng mô tả và phương pháp dùng các luật sản xuấtdùng để biểu diễn tri thức thủ tục, thì Frame lại kết hợp được những đặc điểm của cảhai dạng biểu diễn: Mô tả và thủ tục hệ biểu diễn Frame do M.Minsky đưa ra năm1975
Trang 12Frame thực chất là sự tổng quát hóa của cấu trúc bản ghi trong PASCAL hoặcdanh sách bản thể trong LISP và tương tự như cấu trúc đối tượng trong C++, tậndụng được các ưu điểm của các luật sản xuất và vị từ, cũng như là mạng ngữ nghĩa,một Frame được mô tả bởi cấu trúc
<tên Frame>
<tên slot 1>
<thuộc tính thừa kế> - (như trên, duy nhất, miền)
<Kiểu slot> - (text, integer, real, pointer…)
<Giá trị slot> - (tên, giá trị, thủ tục, pointer)
<tên slot 2>
Cấu trúc Frame này cho ta một “khung dữ liệu” để khoanh vùng các đốitượng, một trong những đặc trưng quan trọng của biểu diễn nhờ Frame là khả năngthừa kế các thông tin của các slot có cùng tên ở đối tượng bậc trên Khi bài toán trởnên phức tạp hơn thì việc mô tả và điều khiển trong Frame sẽ phức tạp hơn nhiềutrong các phương pháp biểu diễn thủ tục khác
Trang 13PHẦN III: MẠNG NGỮ NGHĨA VÀ GIẢI THUẬT LAN TRUYỀN
Như đã trình bày ở phần mở đầu [I] để máy tính có thể sử dụng được tri thức,
có thể xử lý được tri thức, chúng ta cần phải biểu diễn tri thức dưới dạng thuận tiệncho máy tính, đó là mục tiêu của biểu diễn tri thức sau nhiều cố gắng các nhà trí tuệ
nhân tạo đã phát triển một số cách biểu diễn (thể hiện) tri thức có hiệu quả trong máy
tính đặc biệt một trong số biểu diễn mà người viết muốn nhắc đến mạng ngữ nghĩa vàtính toán lan truyền trong mạng
pháp đồ thị, trong đó đỉnh là các đối tượng (khái niệm, tri thức, sự việc) nào đó, còn
các cung giữa các đỉnh nó thể hiện các mối liên hệ giữa các đối tượng
Mạng ngữ nghĩa sử dụng công cụ là đồ thị nên nó thừa hưởng tất cả nhữngmặt mạnh của công cụ đồ thị Các thuật toán đã được cài đặt và phát triển trên máy
Trang 14tính, khi áp dụng chúng ta có thể giải quyết nhiều vấn đề khác nhau ở trên mạng Chođến nay mạng ngữ nghĩa được ứng dụng nhiều trong hai lĩnh vực:
+ Xử lý ngữ nghĩa tự nhiên
+ Giải các bài toán thông minh
Người ta có thể nới rộng mạng ngữ nghĩa bằng cách thêm các nút và nốichúng vào đồ thị, các nút mới ứng với các đối tượng bổ sung, thông thường có thểnới rộng mạng ngữ nghĩa theo ba cách:
- Thêm một đối tượng tương tự
- Thêm một đối tượng đặc biệt hơn
- Thêm một đối tượng tổng quát hơn
Thứ nhất thêm “cách cụt” thể hiện một loại chim mới thứ hai thêm “chip”cũng có nghĩa nó là con “sẻ” và đồng thời là “chim”, thứ ba có thể đưa ra đối tượngtổng quát như “con vật” lúc này không những có thể biết được rằng “chim là convật” mà còn biết “chip thở bằng không khí”