PHẦN I: MỞ ĐẦUSự phát triển vượt bật trong lĩnh vực khoa học và công nghệ đặt biệt trong khoa học trítuệ nhân tạo, để xây dựng các hệ chuyên gia và các hệ giải bài toán dựa trên tri thức
Trang 1PHẦN I: MỞ ĐẦU
Sự phát triển vượt bật trong lĩnh vực khoa học và công nghệ đặt biệt trong khoa học trítuệ nhân tạo, để xây dựng các hệ chuyên gia và các hệ giải bài toán dựa trên tri thứcngười ta phải thiết kế một cơ sở tri thức cho hệ thống và một động cơ suy diễn để giảiquyết vấn đề dựa trên tri thức, đặt biệt là các hệ giải toán dựa trên tri thức vấn đề làm sao
để thiết kế mô hình nhằm biểu diễn cơ sở tri thức thể hiện đầy đủ miền tri thức và được
mô tả đầy đủ các khía cạnh của tri thức trong lĩnh vực nó cần biểu diễn, mô hình này cònhướng đến việc tạo điều kiện thuận lợi cho việc thiết kế, cài đặt để xây dựng một công cụsuy diễn dễ dàng truy cập phục vụ tốt quá trình suy luận khai thác ứng dụng Vì thế một
hệ giải bài toán dựa trên tri thức phải là một hệ giải toán thông minh có thể giải được cácdạng bài toán tổng quát trong một miền tri thức nào đó, trong đó có một cơ sở tri thức vàmột bộ phận thực hiện suy luận giải bài toán trong phạm vi tri thức của hệ thống [1].Trong khoa học về trí tuệ nhân tạo có nhiều phương pháp để biểu diễn tri thức và phươngpháp cho hiệu quả cao trong viêc biểu diễn và suy luận dựa trên các bài toán tổng quát,mỗi phương pháp điều có ưu, nhược điểm riêng của từng phương pháp trong phần trìnhbày này người viết đề xuất một mô hình biểu diễn tri thức gọi là mạng ngữ nghĩa kết hợp
với một số thuật toán được ứng dụng trong giải “bài toán tam giác” của chương trình
phổ thông
PHẦN II: TỔNG QUAN VỀ BIỂU DIỄN TRI THỨC
Khái niệm biểu diễn tri thức và kỹ nghệ xử lý tri thức được đề cập nhiều trong khoa họctrí tuệ nhân tạo, nhưng chỉ từ khi xuất hiện và ứng dụng thực thế các hệ chuyên gia,chúng mới có được các cơ sở lý luận và thực tiển vững chắc Nói tổng quát biểu diễn trithức là thể hiện các mô tả về thế giới bên ngoài dưới dạng sao cho các máy thông minh
có thể đưa tới những kết luận về môi trường xung quanh nó, trên cơ sở một cách hìnhthức các mô tả này, còn kỹ nghệ tri thức bao gồm trong nó các kỹ thuật cấu trúc tri thức,suy diễn, quản trị tri thức và học tự động Vào những năm đầu thập kỷ 80 sự phát triển
Trang 2của khoa học tri thức mà các nhà nghiên cứu đã đúc kết lại những điểm khá chung nhau
và các phương pháp biểu diễn tri thức đươc quan tâm chủ yếu là:
- Biểu diễn nhờ lôgic hình thức
- Biểu diễn nhờ hệ sản xuất
- Biểu diễn nhờ mạng ngữ nghĩa
- Biểu diễn nhờ các frame
Trong các phương pháp biểu diễn này là tạo ra cơ sở tri thức tường minh trong các hệthống khoa học trí tuệ nhân tạo dựa trên tri thức, điều đó phải đòi hỏi xây dựng các ngônngữ khoa học trí tuệ biểu diễn tri thức, thêm vào đó các ngôn ngữ này phải cung cấp cáccông cụ truy nhập tới các sự kiện không tường minh có trong cơ sở tri thức, nghĩa là phảibao gồm trong nó cơ chế suy diễn tự động Như vậy trong bất kỳ một hệ thống biểu diễntri thức nào, bao giờ cũng phải chứa ba yếu tố: Ngôn ngữ biểu diễn, cơ chế suy dẫn vàcông cụ lập cơ sở tri thức cho từng lĩnh vực cụ thể
II.1/ Phân loại tri thức
Dựa vào cách thức con người giải quyết vấn đề, các nhà nghiên cứu đã xây dựng các kỹthuật biểu diễn các dạng tri thức khác nhau trên máy tính, mặc dù vậy không có một kỹthuật riêng lẻ nào có thể giải thích đầy đủ cơ chế tổ chức tri thức trong các chương trìnhmáy tính Để giải quyết vấn đề, chúng ta chỉ chọ dạng biểu diễn nào thích hợp nhất, sauđây là các dạng biểu diễn tri thức thường gặp
Tri thức thủ tục mô tả cách thức giải quyết một vấn đề loại tri thức này đưa ra
giải pháp để thực hiện một công việc nào đó Các dạng tri thức thủ tục tiêu biểu thường làcác luật, chiến lược, lịch trình, và thủ tục
Tri thức khai báo cho biết một vấn đề được thấy như thế nào Loại tri thức này
bao gồm các phát biểu đơn giản, dưới dạng các khẳng định logic đúng hoặc sai Tri thứckhai báo cũng có thể là một danh sách các khẳng định nhằm mô tả đầy đủ hơn về đốitượng hay một khái niệm nào đó
Trang 3Siêu tri thức mô tả tri thức của tri thức Loại tri thức này giúp lựa chọn tri thức
thích hợp nhất trong số các tri thức khi giải quyết một vấn đề Các chuyên gia sử dụng trithức này đề điều chỉnh hiệu quả giải quyết vấn đề bằng cách hướng các lập luận về miềntri thức có khả năng hơn cả
Tri thức heuristic mô tả các “mẹo” để dẫn dắt tiến trình lập luận Tri thức
heuristic còn được gọi là tri thức nông cạn do không bảo đảm hoàn toàn chính xác về kếtquả giải quyết vấn đề, các chuyên gia thường dùng các tri thức khoa học như sự kiện, cácluật… sau đó chuyển chúng thành các tri thức heuristic để thuận tiện hơn trong việc giảiquyết một số bài toán
Tri thức có cấu trúc mô tả tri thức theo cấu trúc Loại tri thức này mô tả mô hình
tổng quan hệ thống theo quan điểm của chuyên gia, bao gồm khái niệm và các đối tượng,diễn tả chức năng và mối liên hệ giữa các tri thức dựa theo cấu trúc xác định
II.2/ Các phương pháp biểu diễn tri thức
Như đã nêu trong mục [II] tương ứng tồn tại các loại tri thức cơ bản sau:
- Tri thức mô tả
- Tri thức thủ tục
- Tri thức điều khiển
Tương ứng với hai loại tri thức mô tả và tri thức thủ tục, có hai loại lớp phương pháp biểudiễn tri thức: biểu diễn mô tả và biểu diễn thủ tục Các cơ chế điều khiển sẽ được lồngtrong bản thân cấu trúc ngôn ngữ biểu diễn tri thức, chẳng hạn trong ngôn ngữ PROLOG
để tỉa bớt một số nhánh tìm kiếm trong không gian bài toán, tránh tìm kiếm vét cạn, if tadùng toán tử cắt tỉa (cut) Có thể phân loại sau:
- Phương pháp biểu diễn tri thức mô tả: logic, mạng ngữ nghĩa, AOV
- Phương pháp biểu diễn tri thức thủ tục: sản xuất
- Phương pháp biểu diễn hổn hợp: Frame
Trang 4Mong muốn của các chuyên gia về xử lý tri thức là tạo ra được các hệ thống cho phépngười sử dụng mô tả bài toán bằng ngôn ngữ mô tả, sau đó giải chúng theo chế độ tươngtác và hội thoại cao.
II.2.1/ Biểu diễn tri thức nhờ logic
Đây là dạng biểu diễn tri thức cổ điển nhất trong máy tính là logic, với hai dạng phổ biến
là logic mệnh đề và logic vị từ, cả hai kỹ thuật này đều dùng ký hiệu để thể hiện tri thức
và các toán tử áp lên các ký hiệu để suy luận logic Logic đã cung cấp cho nhà nghiêncứu một công cụ hình thức để biểu diễn và suy luận tri thức
Logic mệnh đề biểu diễn và lập luận với các mệnh đề toán học Mệnh đề là một
câu nhận giá trị hoặc đúng hoặc sai giá trị này gọi là chân trị của mệnh đề Logic mệnh đềgán một bước ký hiệu vào một mệnh đề, ví dụ A= “Xe sẽ khởi động”
Khi cần kiểm tra chân trị của câu trên trong bài toán sử dụng logic mệnh đề người takiểm tra giá trị của A Nhiều bài toán sử dụng logic mệnh đề để thể hiện tri thức và giảiquyết vấn đề, bài toán loại này được đưa về bài toán xử lý các luật, mỗi phần giải thiết vàkết luận của luật có thể có nhiều mệnh đề
AND Khoảng cách từ nhà đến chổ làm là xa B
Luật trên có thể biểu diễn lại như sau: A^B -> C
Các phép toán quen thuộc trên các mệnh đề được cho trong bảng sau:
Trang 5Bảng chân tri, với các giá trị đúng (True), sai (False)
Logic vị từ là sự mở rộng của logic mệnh đề nhằm cung cấp một cách biễu diễn rõ
hơn về tri thức thì logic vị từ dùng ký hiệu để biểu diễn tri thức Cách biểu diễn này khátrực quan và ưu điểm căn bản của nó là có một cơ sở lý thuyết vững chắc cho những thủtục suy diễn nhằm tìm kiếm và sản sinh ra những tri thức mới, dựa trên các sự kiện và cácluật đã cho Logic vị từ cũng giống như logic mệnh đề, dùng các ký hiệu để thể hiện tri
thức, những ký hiệu này gồm: hằng số, vị từ, biến và hàm.
Hằng số: Các hằng số dùng để đặt tên các đối tượng đặt biệt hay thuộc tính, nhìn
chung các hằng số được ký hiệu bằng chữ viết thường, chẳng hạn An, bình, nhiệt độ.Hằng số An có thể được dùng để thể hiện đối tượng an một người đang xét
Vị Từ: Một mệnh đề hay sự kiện trong logic vị từ được chia thành hai phần vị từ
và tham số Tham số thể hiện một khẳng định về đối tượng, chẳng hạn mệnh đề, chẳnghạn mệnh đề “Nam thích Mai” viết theo vị từ sẽ có dạng: thích (nam, mai) Với cách thểhiện này người ta dùng từ đầu tiên tức “thích” làm vị từ, vị từ cho biết quan hệ giữa cácđối số đặt trong ngoặc, đối số là các ký hiệu thay cho các đối tượng của bài toán
Biến: Các biến dùng để thể hiện các lớp tổng quát của các đối tượng hay thuộc
tính, biến được viết bằng các ký hiệu bắt đầu là chữ in hoa, như vậy có thể dùng vị tự cóbiến để thể hiện nhiều vị từ tương tự
Hàm: Logic vị từ cũng cho phép dùng ký hiệu để biểu diễn hàm, hàm mô tả một
ánh xạ từ các thực thể hay một tập hợp đến một phần tử duy nhất của tập hợp khác
Phép toán: Logic vị từ cũng dùng các phép toán như logic mệnh đề như: thích (X,
Y) AND thích (Z, Y) -> ¬ thích (X, Z), việc lập luận theo cách không hình thức đòi hỏimột khả năng rút ra được kết luận từ các sự kiện đã có, việc lấy ra thông tin mới từ các
Trang 6thông tin đã biết và các luật là trong tâm của tập luận trong hệ chuyên gia, quá trình lậpluận được hình thức hóa trong bài toán suy luận.
II.2.2/ Bộ ba đối tượng - Thuộc tính – Giá trị
Cơ chế tổ chức nhận thức của con người thường được xây dựng dựa trên các sự kiện
(fact), xem như các đơn vị cơ bản nhất, một sự kiện là một dạng tri thức khai báo Nó
cung cấp một số hiểu biết về một biến cố hay một vấn đề nào đó
Một cách biểu diễn khác là nhờ sử dụng bộ ba đối tượng – thuộc tính – giá trị (Object –Attribute – Value) để chỉ sự kiện rằng “Đối tượng” với “Thuộc tính” đã cho có một “giátrị” nào đó
Màu
Sơ đồ biểu diễn tri thức theo bộ ba (O-A-V)
Trong các sự kiện O – A – V một đối tượng có thể có nhiều thuộc tính với các kiểu giá trịkhác nhau hơn nữa một thuộc tính cũng có thể có một hay nhiều giá trị chúng được gọi làcác sự kiện đơn trị (single-value) hoặc đa trị (multi-value), điều này cho phép các hệ trithức linh động trong việc biểu diễn các tri thức cần thiết, cần phân biệt hai đối tượng: đốitượng tĩnh và đối tượng động các đối tượng tĩnh được lưu trong nội bộ nhớ dài hạn và khicần được đưa vào bộ nhớ làm việc để xử lý, ngược lại trong quá trình làm việc khi cần sẽkhởi tạo các giá trị thuộc tính của các đối tượng động và chúng được lưu ở bộ nhớ trongphục vụ cho việc xử lý tiếp theo
Các sự kiện không phải lúc nào cũng đảm bảo là đúng hay sai với độ chắc chắn hoàntoàn, vì thế khi xem xét các sự kiện người ta còn sử dụng thêm một khái niệm là độ tincậy, phương pháp truyền thống để quản lý thông tin không chắc chắn là sử dụng nhân tốchắc chắn CF (ceratinly factor) được dùng trong hệ MYCIN (khoảng năm 1975)
Ngoài ra, khi các sự kiện mang tính “nhập nhằng” việc biểu diễn tri thức dựa vào một kỹthuật gọi là logic mờ (do Zadeh đưa ra năm 1965) các thuật ngữ nhập nhằng được thểhiện, lượng hóa trong tập mờ
NâuGhế
Trang 7II.2.3/ Các Luật dẫn
Trong hệ thống dựa trên các luật người ta thu thập các tri thức lĩnh vực trong một tập vàlưu chúng trong cơ sở tri thức của hệ thống Hệ thống dùng các luật này cùng với cácthông tin trong bộ nhớ để giải bài toán việc xử lý các luật trong hệ thống dựa trên các luậtđược quản lý bằng một module gọi là hệ suy diễn, phương pháp này khá trực quan vớingười sử dụng, song chỉ phù hợp khi cơ sở tri thức không có quá nhiều luật suy dẫn và dovậy không chứa nhiều loại vị từ khác nhau
Các luật dẫn cơ bản thể hiện tri thức có thể phân loại theo loại tri thức và như vậy có cáclớp luật tương ứng với dạng tri thức như quan hệ, khuyến cáo, hướng dẫn, chiến lược vàheuristic
IF Xe không khởi động được
THEN Đầu tiên hãy kiểm tra hệ thống nhiên liệu, sau đó kiểm tra hệ
Trang 8THEN Phát triển bình thường
THEN Lãi suất cao, CF=0,8
Dạng siêu luật một luật với chức năng mô tả cách thức dùng các luật khác sẽ đưa ra chiếnlượt sử dụng các luật theo lĩnh vực chuyên dụng, thay vì đưa ra thông tin mới
AND Hệ thống điện làm việc bình thường
THEN Có thể sử dụng các luật liên quan đến hệ thống điện
Qua thực nghiệm các chuyên gia sẽ đề ra một tập các luật áp dụng cho một bài toán chotrước thí dụ tập luật trong hệ thống chẩn đoán hỏng hóc xe điều này giúp giải quyết cáctrường hợp mà khi chỉ với các luật riêng
Trang 9II.2.4/ Biểu diễn tri thức bằng Frame
Phương pháp biểu diễn tri thức bằng Frame có tất cả các tính chất vốn có của một ngônngữ biểu diễn tri thức, nó cũng đồng thời cũng là cơ sở cho một phương pháp xử lý thôngtin mới – hướng đối tượng nếu phương pháp biểu diễn nhờ logic và mạng ngữ nghĩa [III]mang đặc trưng mô tả và phương pháp dùng các luật sản xuất dùng để biểu diễn tri thứcthủ tục, thì Frame lại kết hợp được những đặc điểm của cả hai dạng biểu diễn: Mô tả vàthủ tục hệ biểu diễn Frame do M.Minsky đưa ra năm 1975
Frame thực chất là sự tổng quát hóa của cấu trúc bản ghi trong PASCAL hoặc danh sáchbản thể trong LISP và tương tự như cấu trúc đối tượng trong C++, tận dụng được các ưuđiểm của các luật sản xuất và vị từ, cũng như là mạng ngữ nghĩa, một Frame được mô tảbởi cấu trúc
<tên Frame>
<tên slot 1>
<thuộc tính thừa kế> - (như trên, duy nhất, miền)
<Kiểu slot> - (text, integer, real, pointer…)
<Giá trị slot> - (tên, giá trị, thủ tục, pointer)
<tên slot 2>
Cấu trúc Frame này cho ta một “khung dữ liệu” để khoanh vùng các đối tượng, một trongnhững đặc trưng quan trọng của biểu diễn nhờ Frame là khả năng thừa kế các thông tincủa các slot có cùng tên ở đối tượng bậc trên Khi bài toán trở nên phức tạp hơn thì việc
mô tả và điều khiển trong Frame sẽ phức tạp hơn nhiều trong các phương pháp biểu diễnthủ tục khác
Trang 10PHẦN III: MẠNG NGỮ NGHĨA VÀ GIẢI THUẬT LAN TRUYỀN
Như đã trình bày ở phần mở đầu [I] để máy tính có thể sử dụng được tri thức, có thể xử lýđược tri thức, chúng ta cần phải biểu diễn tri thức dưới dạng thuận tiện cho máy tính, đó
là mục tiêu của biểu diễn tri thức sau nhiều cố gắng các nhà trí tuệ nhân tạo đã phát triển
một số cách biểu diễn (thể hiện) tri thức có hiệu quả trong máy tính đặc biệt một trong số
biểu diễn mà người viết muốn nhắc đến mạng ngữ nghĩa và tính toán lan truyền trongmạng
III.1/ Mạng ngữ nghĩa
Mạng ngữ nghĩa là một công cụ trực quan giúp chúng ta biểu diễn được các mối liên hệgiữa các tri thức tổng quát, khái niệm, các sự việc mà chúng có mối liên hệ Mạng ngữnghĩa là một phương pháp biểu diễn tri thức đầu tiên và cũng là phương pháp dễ hiểu, đểbiểu diễn một mạng ngữ nghĩa thì người ta dùng phương pháp đồ thị, trong đó đỉnh là các
đối tượng (khái niệm, tri thức, sự việc) nào đó, còn các cung giữa các đỉnh nó thể hiện
các mối liên hệ giữa các đối tượng
Người ta có thể nới rộng mạng ngữ nghĩa bằng cách thêm các nút và nối chúng vào đồthị, các nút mới ứng với các đối tượng bổ sung, thông thường có thể nới rộng mạng ngữnghĩa theo ba cách:
- Thêm một đối tượng tương tự
- Thêm một đối tượng đặc biệt hơn
- Thêm một đối tượng tổng quát hơn
Trang 11Thứ nhất thêm “cách cụt” thể hiện một loại chim mới thứ hai thêm “chip” cũng có nghĩa
nó là con “sẻ” và đồng thời là “chim”, thứ ba có thể đưa ra đối tượng tổng quát như “convật” lúc này không những có thể biết được rằng “chim là con vật” mà còn biết “chip thởbằng không khí”
Tính chất quan trọng của mạng ngữ nghĩa là tính kế thừa, nó cho phép các nút được bổsung sẽ nhận các thông tin của các nút đã có trước, và cho phép mã hóa tri thức một cách
dễ dàng
Để minh họa cho tính kế thừa của mạng ngữ nghĩa hãy xét một câu hỏi trên đồ thị, chẳnghạn tại nút “chim” người ta muốn hỏi con “chip” hoạt động như thế nào ? thông qua cunghoạt động người ta biết được nó bay
Trang 12III.2/ Giải thuật lan truyền trên mạng ngữ nghĩa
Lan truyền kích hoạt (spreading activation) là một phương pháp để tìm kiếm các mạng lưới liên kết, các mạng thần kinh (neural networks) hoặc mạng ngữ nghĩa (semantic networks), quá trình tìm kiếm được bắt đầu bằng cách ghi nhãn một tập hợp các nút
nguồn [III.1] với kích hoạt hay “activation” và sau đó lặp đi lặp lại các lan truyền hay
“spreading” tiếp tục kích hoạt các nút tiếp theo liên quan đến nút nguồn Trong kích hoạtlan truyền các nút đã được kích hoạt và các nút chưa kích hoạt được lưu lại để phục vụcho việc tìm nút lan truyền tiếp theo hợp lý hơn
Lan truyền kích hoạt được ứng dụng trong truy suất thông tin, bằng việc sử dụng ngữnghĩa của một mạng lưới đại diện cho các nút tài liệu và các từ ngữ có trong văn bản đó.Cho một đồ thị có hướng được thể hiện bởi mảng node [1 n], mỗi kích hoạt liên quanđến giá trị A[i] là một số thực nằm trong khoảng [0.0 1.0], link[i, j] sẽ kết nỗi vớinguồn node[i] với mục tiêu là node[j] Mỗi liên kết có một trọng số là w[i, j] thường làmột số thực nằm trong dãy [0.0 1.0]
Các tham số: