CHƯƠNG 1: TỔNG QUAN VỀ CÔNG NGHỆ TRI THỨC VÀ HỆ CHUYÊN GIA
1.9. Các dạng tri thức và cách thể hiện
+ Lĩnh vực là miền mà chủ đề quan tâm
+ Thể hiện tri thức là phương pháp cho phép mã hóa tri thức trong cơ sở tri thức của hệ thống.
b) Các dạng tri thức
Tri thức có thể được mô tả thông qua rất nhiều dạng một cách đa dạng. Bảng sau đây mô tả các dạng cơ bản của tri thức:
Loại tri thức Ví dụ
Tri thức thủ tục Các luật, các chiến lược, lịch và các thủ tục Tri thức mô tả Các khái niệm, đối tượng và sự kiên
Tri thức meta Tri thức về các dạng tri thức khác Tri thức may rủi Các luật may rủi
Tri thức cấu trúc Các tập luật, quan hệ và khái niệm quan hệ của đối tượng
Chuyên gia
Người dùng
Giao diện người sử dụng
Khả năng thích nghi
Bộ nhớ làm việc
Sở hữu tri thức Diễn
dịch
Cơ sở tri thức
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
14 c) Thể hiện của tri thức
Tri thức của một hệ chuyên gia có thể được biểu diễn theo nhiều cách khác nhau. Thông thường người ta sử dụng các cách sau đây:
+ Biểu diễn tri thức bởi các luật sản xuất + Biểu diễn tri thức nhờ mệnh đề logic + Biểu diễn tri thức nhờ mạng ngữ nghĩa + Biểu diễn tri thức nhờ ngôn ngữ nhân tạo
Ngoài ra, người ta còn sử dụng cách biểu diễn tri thức nhờ các sự kiện không chắc chắn, nhờ bộ ba: đối tượng, thuộc tính và giá trị (O-A-V: Object-Attribute- Value), nhờ khung (frame), v.v... Tuỳ theo từng hệ chuyên gia, người ta có thể sử dụng một cách hoặc đồng thời cả nhiều cách. Sau đây sẽ trình bày một số cách biểu diễn tri thức:
■ Biểu diễn tri thức bởi các luật sản xuất
Hiện nay, hầu hết các hệ chuyên gia đều là các hệ thống dựa trên luật, bới lý do như sau :
+ Bản chất đơn thể: Có thể đóng gói tri thức và mở rộng hệ chuyên gia một cách dễ dàng.
+ Khả năng diễn giải dễ dàng: Dễ dàng dùng luật để diễn giải vấn đề nhờ các tiền đề đặc tả chính xác các yếu tố vận dụng luật, từ đó rút ra được kết quả.
+Tương tự quá trình nhận thức của con người: Dựa trên các công trình của Newell và Simon, các luật được xây dựng từ cách con người giải quyết vấn đề.
Cách biểu diễn luật nhờ IF THEN đơn giản cho phép giải thích dễ dàng cấu trúc tri thức cần trích lọc.
Luật là một kiểu sản xuất được nghiên cứu từ những năm 1940. Trong một hệ thống dựa trên luật, công cụ suy luận sẽ xác định những luật nào là tiên đề thỏa mãn các sự việc.
Các luật sản xuất thường được viết dưới dạng IF THEN. Có hai dạng:
IF < điều kiện > THEN < hành động > hoặc
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
15
IF < điều kiện > THEN < kết luận > DO < hành động >
Tuỳ theo hệ chuyên gia cụ thể mà mỗi luật có thể được đặt tên. Chẳng hạn mỗi luật có dạng Rule: tên. Sau phần tên là phần IF của luật.
Phần giữa IF và THEN là phần trái luật, có nội dung được gọi theo nhiều tên khác nhau, như tiền đề, điều kiện, mẫu so khớp...
Phần sau THEN là kết luận hay hậu quả. Một số hệ chuyên gia có thêm phần hành động được gọi là phần phải luật.
Ví dụ :
1. Rule: Đèn đỏ
IF Đèn đỏ sáng THEN Dừng 2. Rule: Đèn-xanh
IF Đèn xanh sáng THEN Đi
Trong ví dụ trên, Đèn đỏ sáng và Đèn xanh sáng là những điều kiện, hay những khuôn mẫu. Sau đây là một số ví dụ khác :
3. Rule: Điều trị sốt
IF Bệnh nhân sốt THEN cho uống thuốc Aspirin 4. Hệ thống chẩn đoán xe máy (OPS5)
IF
Máy xe không nổ khi khởi động THEN
Dự đoán: Xe bị panne sức nén. Pittong, bạc xéc-măng và lòng xy lanh sai tiêu chuẩn, dễ tạo thành những khe hở nhỏ làm cho pittong không còn kín nên hoà khí không được nén lên đầy đủ. Xử lý : nên điều chỉnh hoặc thay mới pittong, bạc xéc-măng và lòng xy lanh cho đúng tiêu chuẩn
IF
máy xe nổ không ổn định, OR máy xe nổ rồi lại tắt, AND bugi khô THEN
Dự đoán : Xe đã bị nghẹt xăng.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
16
Xử lý : nên xúc rửa bình xăng và bộ khoá xăng của xe.
■ Biểu diễn tri thức nhờ mệnh đề logic
Người ta sử dụng các ký hiệu để thể hiện tri thức và các phép toán lôgic tác động lên các ký hiệu để thể hiện suy luận lôgic. Kỹ thuật chủ yếu thường được sử dụng là lôgic vị từ.
Các ví dụ dưới đây minh hoạ cách thể hiện các phát biểu (cột bên trái) dưới dạng vị từ (cột bên phải) :
Phát biểu Vị từ
Tom là đàn ông MAN(tom) Tom là cha của
Mary FATHER(tom, mary)
Tất cả mọi người đều chết
MAN(X) → MORTAL(X)
với quy ước MAN(X) có nghĩa “X là một người” và
MORTAL(X) có nghĩa “X chết”. MAN và MORTAL được
gọi là các vị từ đối với biến X.
Các vị từ thường có chứa hằng, biến hay hàm. Người ta gọi các vị từ không chứa biến (có thể chứa hằng) là các mệnh đề. Mỗi vị từ có thể là một sự kiện hay một luật. Luật là vị từ gồm hai vế trái và phải được nối nhau bởi một dấu mũi tên (→). Các vị từ còn lại (không chứa mũi tên) được gọi là các sự kiện. Trong ví dụ trên đây, MAN và FATHER là các mệnh đề và là các sự kiện. Còn MAN(X) → MORTAL(X) là một luật.
Ví dụ từ các tri thức sau:
Marc có tóc vàng hoe, còn Jean có tóc màu nâu. Pierre là cha của Jean. Marc là cha của Pierre. Jean là cha của René. Marc là con của Georges.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
17
Giả sử X, Y và là Z những người nào đó, nếu Y là con của X thì X là cha của Y. Nếu X là cha của Z và Z là cha của Y thì X là ông của Y.
ta có thể biểu diễn thành các sự kiện và các luật như sau : a. BLOND (marc)
b. BROWN (jean)
c. FATHER (pierre, jean) d. FATHER (marc, pierre) e. FATHER (jean, rené) f. SON (marc, georges)
g. FATHER (X, Y) ← SON (Y, X)
h. GRANDFATHER (X, Y) ← FATHER (X, Z), FATHER (Z, Y) Người ta gọi tập hợp các sự kiện và các luật là một cơ sở tri thức.
Trong logic vị từ, một mệnh đề được cấu tạo bởi 2 thành phần là các đối tượng tri thức và mối liên hệ giữa chúng (gọi là vị từ)
Ví dụ: Cam có vị ngọt Vị (cam, ngọt) Cam có màu xanh Màu(cam, xanh).
Các sự kiện được cho bởi R qi (x,y,z,...), I=1 ,k ,ở đây qi (x,y,z,...) là các vị từ phụ thuộc vào các hạng thức x, y, z,...
Các luật có dạng p1˄... ˄ pn q(.).
Logic vị từ cho phép biểu diễn hầu hết các khái niệm và các phát biểu định lý, định luật trong các bộ môn khoa học. Cách biểu diễn này khá trực quan và ưu điểm căn bản của nó là có một cơ sở lý thuyết vững chắc cho những thủ tục suy diễn nhằm tìm kiếm và sản sinh ra những tri thức mới, dựa trên các sự kiện và các luật đã cho.
* Ưu điểm
- Là ngôn ngữ biểu diễn kiểu mô tả.
- Có khả năng suy diễn đối với các cơ chế quen thuộc : Pronens & Tollens.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
18 - Khá trực quan với người sử dụng.
- Khá gần gũi về cú pháp với các lệnh lập trình logic, chẳng hạn như PROLOG.
- Có thể dùng để mô tả cấu trúc mô hình và xử lý động mô hình.
- Có thể kiểm tra tính mâu thuẫn trong cơ sở tri thức.
- Tính module cao, do vậy các tri thức có thể thêm bớt sửa đổi khá độc lập với nhau và các cơ chế suy diễn.
* Nhược điểm
- Mức độ hình thức hóa cao, dẫn tới khó hiểu ngữ nghĩa của các vị từ khi xét chương trình.
- Năng xuất xử lý thấp. Một trong những khó khăn cơ bản của quá trình suy diễn là cơ chế hợp và suy diễn vét cạn.
- Do các tri thức được biểu diễn nhờ các vị từ, nên ưu thể sử dụng cấu trúc dữ liệu không được khai thác triệt để.
■ Biểu diễn tri thức nhờ mạng ngữ nghĩa
Trong phương pháp này, người ta sử dụng một đồ thị gồm các nút và các cung nối các nút để biểu diễn tri thức. Nút dùng để thể hiện các đối tượng, thuộc tính của đối tượng và giá trị của thuộc tính. Còn cung dùng để thể hiện các quan hệ giữa các đối tượng. Các nút và các cung đều được gắn nhãn.
Ví dụ để thể hiện tri thức “sẻ là một loài chim có cánh và biết bay”, người ta vẽ một đồ thị như sau:
Sẻ Chim
Có cánh là
Biết bay có
di chuyển
Hình 8. Biểu diễn tri thức nhờ mạng ngữ nghĩa.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
19
Bằng cách thêm vào đồ thị các nút mới và các cung mới, người ta có thể mở rộng một mạng ngữ nghĩa. Các nút mới được thêm thể hiện các đối tượng tương tự (với các nút đã có trong đồ thị), hoặc tổng quát hơn. Chẳng hạn để thể hiện “chim là một loài động vật đẻ trứng” và “cánh cụt là loài chim biết lặn“, người ta vẽ thêm như sau :
Một trong những tính chất quan trọng của mạng ngữ nghĩa là tính thừa kế. Khi sử dụng mạng ngữ nghĩa để biểu diễn tri thức, người ta phải xây dựng các phép toán tương ứng.
Sẻ
Loài chim
cánh
bay
Động vật
Đẻ trứng
Cánh
cụt Lặn
là
là
có là biết
biết
đẻ
Hình 9. Mở rộng mạng ngữ nghĩa biểu diễn tri thức.
* Ưu điểm:
- Cho phép biểu diễn một cách trực quan các sự kiện và mối quan hệ giữa chúng.
- Tính mô đun cao, theo nghĩa các tri thức thêm vào hoàn toàn độc lập với các tri thức cũ.
- Là ngôn ngữ biểu diễn dạng mô tả.
- Mạng ngữ nghĩa rất linh động, ta có thể dễ dàng thêm vào mạng các đỉnh hoặc cung mới để bổ sung các tri thức cần thiết.
- Mạng ngữ nghĩa cho phép các đỉnh có thể thừa kế các tính chất từ các đỉnh khác thông qua các cung loại “là”, từ đó, có thể tạo ra các liên kết “ngầm” giữa những đỉnh không có liên kết trực tiếp với nhau.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
20
- Mạng ngữ nghĩa hoạt động khá tự nhiên theo cách thức con người ghi nhận thông tin.
* Nhược điểm:
- Không có một phương pháp suy diễn chung cho mọi loại mạng ngữ nghĩa.
- Khó kiểm soát được quá trình cập nhật tri thức, dễ dẫn đến mâu thuẫn trong cơ sở tri thức. Cho đến nay, vẫn chưa có một chuẩn nào quy định các giới hạn cho các đỉnh và cung của mạng. Nghĩa là bạn có thể gán ghép bất kỳ khái niệm nào cho đỉnh hoặc cung. Tính thừa kế (vốn là một ưu điểm) trên mạng sẽ có thể dẫn đến nguy cơ mâu thuẫn trong tri thức.
■ Biểu diễn tri thức bằng FRAME
Phương pháp biểu diễn tri thức bằng FRAME có tất cả các tính chất vốn có của một ngôn ngữ biểu diễn tri thức. Nghĩa là nó có thể biểu diễn tri thức ở góc độ giao diện người-máy, góc độ mô tả mô hình, điều khiển hệ thống. Đồng thời nó cũng là một cơ sở cho một phương pháp xử lý thông tin mới - hướng đối tượng. Nếu phương pháp nhờ logic và mạng ngữ nghĩa dùng để biểu diễn tri thức mô tả và phương pháp luật sản xuất dùng để biểu diễn tri thức thủ tục thì các FRAME là kết hợp của cả 2 dạng biểu diễn : mô tả và thủ tục.
FRAME tận dụng được các ưu điểm của luật sản xuất, vị từ, cũng như mạng ngữ nghĩa.
Cấu trúc của FRAME :
<tên FRAME>
<tên slot 1>
<thuộc tính thừa kế> (như trên, duy nhất, miền...) < kiểu slot> (text, integer, real, pointer...)
< giá trị slot> (tên, giá trị, thủ tục,...) <tên slot 2>
Ví dụ về 1 FRAME mô tả tập HOCSINH : Frame HOCSINH
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
21 IS-A:
FART-OF : NGUOI-DI-HOC
A KIND OF : (HOC_SINH_CO_SO,HOCSINHTRUNGHOC) Cân nặng : 10-60 kg
Chiều cao : 80-170 cm Có râu : không
Nói tiếng : Việt/Anh/Pháp
=> cấu trúc này cho ta một khung dữ liệu để khoanh vừng các đối tượng là học sinh. Trường hợp gặp 1 người cao 180 cm, nặng 45 kg ta có thể khẳng định rằng đó không phải học sinh, vì không thỏa mãn các ràng buộc đã có.
* Ưu điểm:
- Đáp ứng tất cả các yêu cầu về biểu diễn tri thức.
- Cho phép người sử dụng khá tự do khi biểu diễn tri thức.
- FRAME không chỉ sử dụng để mô tả tri thức mà còn được dùng thể hiện các thuật toán suy diễn.
- Tận dụng được những điểm mạnh của biểu diễn thủ tục và mô tả.
- Quá trình xử lý trên các FRAME độc lập theo nghĩa kế thừa thông tin, không nhất thiết phải tuần tự.
* Nhược điểm:
- Phương pháp biểu diễn quá phức tạp và cồng kềnh.
- Phương pháp biểu diễn FRAME tiện lợi đối với kỹ sư xử lý tri thức cũng như người sử dụng có trình độ cao, nhưng lại là sự quá tải đối với những người sử dụng thông thường.
- Các giá trị của slot có thể gán qua thực hiện các thủ tục, điều này làm cho việc thu nạp và cập nhật tri thức trở nên phức tạp và làm khả năng mềm dẻo, phù hợp với những thay đổi của môi trường bên ngoài bị giảm xuống.
- Do cấu trúc của FRAME nên khi biểu diễn cần phải sử dụng các biện pháp khá cầu kỳ. Vì vậy làm mất đi tính trực quan trong phương pháp biểu diễn.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
22
- Đối với các bài toán phức tạp thì việc mô tả và điều khiển hệ thống sử dụng FRAME sẽ phức tạp lên rất nhiều so với các phương pháp biểu diễn khác.
■ Biểu diễn nhờ bộ ba liên hợp OAV(object-attribute-value)
Biểu diễn tri thức nhờ bộ ba liên hợp OAV là sử dụng bộ ba “Đối tượng”-
“Thuộc tính”-“Giá trị” (Object-Attribute-Value) để chỉ ra rằng đối tượng với thuộc tính đã cho nào đó có một giá trị nào đó.
Ví dụ:
(Nguyễn A, cao, 167) (Nguyễn A, nặng, 64) (Nguyễn A, râu, không) (Nguyễn A, nói, tiếng Việt)
=>Có thể mô tả dưới dạng mạng ngữ nghĩa và các bộ liên hợp như sau :
Nguyễn văn A
Tiếng Việt 64 kg
Không 167 cm
nói nặng
râu cao
Hình 10. Biểu diễn tri thức nhờ bộ 3 liên hợp OAV.
Đối tượng trong bộ ba liên hợp được chia thành 2 loại: đối tượng tĩnh và đối tượng động.
Các đối tượng tĩnh được lưu trong bộ nhớ ngoài (băng từ, đĩa...) và khi cần được nạp vào bộ nhớ trong để xử lý.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
23
Các đối tượng động được khởi tạo trong quá trình làm việc và được lưu giữ ở bộ nhớ trong phục vụ cho việc xử lý.
Một điều quan trọng là các đối tượng có thể sắp xếp và liên kết lại với nhau cũng giống như trong liên kết các FRAME. Tuy vậy, không thể biết một cách chính xác và tường minh bản chất của từng liên kết. Vì vậy người ta thường sử dụng bộ ba liên hợp để biểu diễn các sự kiện không chắc chắn.
* Ưu điểm :
- Cho phép biểu diễn các đối tượng một cách trực quan.
- Tính mô đun tương đối cao.
- Là ngôn ngữ biểu diễn dạng mô tả.
- Cho phép diễn đạt tường minh các luật suy diễn.
* Nhược điểm: Tuy vậy, cách biểu diễn này thực chất là một dạng đặc biêt của phương pháp mạng ngữ nghĩa nên nó cũng có các nhược điểm của mạng ngữ nghĩa. Ngoài ra khi sử dụng phương pháp này, các quan hệ, liên kết giữa các đối tượng không thể biểu diễn một cách tường minh.
■ Biểu diễn tri thức nhờ ngôn ngữ nhân tạo
Theo quan điểm của người sử dụng, các hệ chuyên gia cần có phương thức giao tiếp bằng ngôn ngữ tự nhiên. Điều này giúp cho quá trình tương tác giữa người sử dụng và các chuyên gia trở nên dễ dàng hơn rất nhiều. Tuy nhiên, hiện nay, các hệ thống chỉ có khả năng đối thoại trên ngôn ngữ là tiếng Anh và hạn chế trong lĩnh vực chuyên môn.
Hình dưới đây thể hiện một đơn vị tri thức (luật) trong hệ chuyên gia MYCIN dùng để chẩn đoán các bệnh virut. Cột bên trái là một luật được viết bằng tiếng Anh, cột bên phải là mã hoá nhân tạo của luật đó.
Nếu
1) Màu của cơ thể là gram dương
(($AND (SAME CNTXT GRAM GRAM+)