CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT Trong chương này sẽ trình bày cơ sở lý thuyết liên quan đến hệ chuyên gia, các cơ sở tri thức, phương pháp biểu diễn tri thức, mô hình biểu diễn tri thức, động
Trang 1MỤC LỤC
MỤC LỤC 1
DANH MỤC CÁC TỪ VIẾT TẮT 4
DANH MỤC CÁC BẢNG BIỂU 5
DANH MỤC CÁC HÌNH VẼ 6
CHƯƠNG 1 - TỔNG QUAN 7
1.1 GIỚI THIỆU 7
1.2 ĐỘNG CƠ NGHIÊN CỨU 9
1.3 MỤC TIÊU LUẬN VĂN 11
1.4 PHẠM VI NGHIÊN CỨU 12
1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN 12
CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT 14
2.1 HỆ CHUYÊN GIA 14
2.1.1 Cơ sở tri thức 14
2.1.2 Hệ chuyên gia 15
2.1.3 Cấu trúc hệ chuyên gia 18
2.1.4 Kỹ thuật suy luận trong hệ chuyên gia 19
2.1.5 Quy trình xây dựng hệ chuyên gia: 22
2.1.6 Thuận lợi và khó khăn của hệ chuyên gia 22
2.2 CƠ SỞ TRI THỨC 24
2.3 CÁC PHƯƠNG PHÁP BIỂU DIỄN TRI THỨC 25
2.3.1 Biểu diễn tri thức dựa trên logic hình thức 25
2.3.2 Biểu diễn tri thức dựa trên hệ luật dẫn 27
2.3.3 Biểu diễn tri thức bằng Frame 27
2.3.4 Biểu diễn tri thức dựa trên mạng ngữ nghĩa 30
2.3.5 Mạng các đối tượng tính toán 31
2.3.6 Biểu diễn tri thức dựa trên mô hình COKB 32
2.4 ĐỘNG CƠ SUY DIỄN 36
2.4.1 Suy diễn tiến 37
2.4.2 Suy diễn lùi 38
2.4.3 Ưu nhược điểm của các kỹ thuật suy diễn 38
Trang 2CHƯƠNG 3BIỂU DIỄN TRI THỨC CHUYÊN GIA 40
3.1 TRI THỨC VỀ BỆNH UNG THƯ TẾ BÀO GAN 40
3.1.1 Khái niệm về bệnh UTGNP 42
3.1.2 Đặc điểm lâm sàng 43
3.1.3 Đặc điểm cận lâm sàng 44
3.2 MÔ HÌNH BIỂU DIỄN TRI THỨC CHUYÊN GIA 53
3.2.1 Danh sách các thuộc tính 54
3.2.2 Tập hợp các hành động 57
3.2.3 Tập hợp các Rules 59
3.2.4 Tập đối tượng Patient 60
CHƯƠNG 4VẤN ĐỀ CHẨN ĐOÁN VÀ THUẬT GIẢI SUY LUẬN TRONG CHẨN ĐOÁN BỆNH 61
4.1 VẤN ĐỀ CHẨN ĐOÁN 61
4.1.1 Chẩn đoán lâm sàng 61
4.1.2 Chẩn đoán cận lâm sàng 63
4.1.3 Chẩn đoán và theo dõi 64
4.2 QUY TRÌNH CHẨN ĐOÁN BỆNH UNG THƯ GAN 65
4.3 THUẬT GIẢI SUY LUẬN TRONG CHẨN ĐOÁN BỆNH 68
4.3.1 Ý tưởng của thuật giải 68
4.3.2 Thuật giải suy luận trong chẩn đoán bệnh 68
CHƯƠNG 5THIẾT KẾ HỆ THỐNG VÀ CÀI ĐẶT THỬ NGHIỆM 72
5.1 THIẾT KẾ HỆ THỐNG 72
5.1.1 Mục tiêu ứng dụng 72
5.1.2 Sơ lược quy trình chẩn đoán bệnh của hệ thống 72
5.1.3 Cấu trúc của hệ thống 73
5.1.4 Tổ chức cơ sở tri thức 74
5.2 CÀI ĐẶT THỬ NGHIỆM 78
5.2.1 Nền tảng công nghệ 78
5.2.2 Tổ chức các giao diện 78
5.3 KẾT QUẢ THỬ NGHIỆM 82
CHƯƠNG 6KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 83
6.1 KẾT LUẬN 83
6.2 HẠN CHẾ VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 84
6.2.1 Hạn chế của đề tài 84
6.2.2 Hướng phát triển của đề tài 85
Trang 3TÀI LIỆU THAM KHẢO 86
PHỤ LỤC A 90
PHỤ LỤC B 112
PHỤ LỤC C 115
Trang 4DANH MỤC CÁC TỪ VIẾT TẮT
AASLD: American Assiociation for Study of
Liver Diseases
Hiệp hội nghiên cứu về bệnh gan Hoa Kỳ
AFP : Alpha Fetoprotein Protein phôi thai
BCLC : Barcelona Clinic Liver Cancer Thang điểm phân loại giai
đoạn lâm sàng ung thư gan nguyên phát theo Barcelona COKB : Computational Objects Knowledge
Bases
Mô hình tri thức các đối tượng tính toán
CTScan: Computed Tomography Scan Chụp cắt lớp điện toán
ES : Expert System Hệ chuyên gia
ESLCD: Expert System for Liver Cancer
Diagnosis
Hệ hỗ trợ chẩn đoán bệnh ung thư gan
HBsAg: Hepatitis B surface antigen Kháng nguyên bề mặt viêm
gan B HBV : Hepatitis virus B Viêm gan siêu vi B
HCC : Hepatocellular Carcinoma Ung thư biểu mô tế bào gan HCV : Hepatitis virus C Viêm gan siêu vi C
MRI : Magnetic Resonance Imaging Chụp cộng hưởng từ
Trang 5DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1 Số liệu ung thƣ gan ở nam nữ tại Việt Nam theo WHO năm 2008 10
Bảng 3.1 Độ nhạy và độ đặc hiệu của AFP trong UTGNP 44
Bảng 3.2 Xếp giai đoạn theo BCLC 49
Bảng 3.3 Phân loại CHILD – PUGH 50
Bảng 4.1 Thời gian xuất hiện các triệu chứng 62
Bảng 5.1 Thống kê kết quả thử nghiệm 81
Trang 6DANH MỤC CÁC HÌNH VẼ
Hình 2.1 Các thành phần của một hệ chuyên gia 16
Hình 2.2 Hoạt động của một hệ chuyên gia 16
Hình 2.3 Cấu trúc cơ bản của một hệ chuyên gia 19
Hình 2.4 Nền tảng của công nghệ hệ chuyên gia dựa trên luật 20
Hình 2.5 Quan hệ giữa các đối tượng hình học phẳng 29
Hình 2.6 Mạng ngữ nghĩa mô tả tri thức về xe 30
Hình 3.1 Tỷ lệ dẫn đến xơ gan và UTTBG ở bệnh nhân viêm gan siêu vi C 41
Hình 3.2 Sơ đồ chẩn đoán UTGNP theo hướng dẫn thực hành AASLD 2010 48
Hình 4.1 Quy trình chẩn đoán trong thực tế lâm sàng và cận lâm sàng (1) 65
Hình 4.2 Quy trình chẩn đoán trong thực tế lâm sàng và cận lâm sàng (2) 66
Hình 4.3 Thuật giải suy luận trong chẩn đoán bệnh 69
Hình 5.1 Quy trình chẩn đoán bệnh của hệ thống 73
Hình 5.2 Giao diện màn hình chính 79
Hình 5.3 Giao diện màn hình dữ liệu bệnh nhân 79
Hình 5.4 Giao diện màn hình chẩn đoán bệnh 80
Hình 5.5 Giao diện màn hình yêu cầu thực hiện thêm 81
Hình 5.6 Giao diện màn hình kết quả chẩn đoán 81
Trang 7Ngày nay, Công Nghệ Thông Tin (Information Technology) không ngừng
phát triển trên toàn cầu và được ứng dụng trong mọi lĩnh vực như: Nghiên cứu khoa học, Y tế, Giáo dục,…Vấn đề hiện nay đang được quan tâm của “Trí Tuệ Nhân Tạo” là nghiên cứu các phương pháp biểu diễn và xử lý tri thức Trên cơ sở đó giúp
ta ứng dụng tạo nên một chương trình “Thông minh” như Hệ chuyên gia có thể chẩn đoán hay nhận biết được bất kì một nguyên nhân, hiện tượng nào trong bất kỳ lĩnh vực nào mà người dùng cần đến Người dùng có thể biết được có bệnh hay không bệnh,… chỉ cần thông qua hệ chuyên gia [6], [36]
Ung thư [3] là một bệnh hiểm nghèo, sinh ra do sự rối loạn tế bào Ung thư gan là một trong những bệnh phổ biến nhất thế giới Nó là loại ung thư phổ biến ở Châu Phi, Đông Nam Á,…Ung thư chiếm tỉ lệ 0,13% ở các trường hợp mổ tử thi và chiếm khoảng 1% các ung thư Riêng ở nước ta ung thư gan đứng thứ 4, chiếm khoảng 5-6% tổng số ung thư, miền Bắc nhiều hơn miền Nam Tỉ lệ ung thư gan ngày càng có xu hướng ra tăng Ung thư gan là một loại ung thư có tính chất ác tính rất cao, nếu không được điều trị kịp thời thì thời gian sống của bệnh nhân chỉ được khoảng 6 – 7 tháng và nếu phát hiện ra là giai đoạn cuối thì thời gian sống khoảng 2 – 3 tháng Vì vậy ta cần thăm khám, phát hiện tiêm phòng và điều trị kịp thời [4] Theo tài liệu [11], ung thư gan được phát hiện qua gan to toàn bộ hoặc riêng một thùy hay một phân thùy, mặt gan to gồ ghề nếu u nằm ở lớp nông, góc dưới và góc bên của gan mở rộng (bình thường góc gan trái là 450
và góc gan phải là 750) Trong cơ thể có một ổ hình siêu âm của u là một khối đặc bờ đều, không đều xung quanh thường có một viền giảm âm, kích thước ở giai đoạn sớm dưới 3cm ở giai đoạn muộn có thể trên 10cm, cấu trúc âm của khối đặc có thể là tăng âm, giảm âm
và ở giữa tăng âm xung quanh giảm âm (hình bia bắn súng hoặc hình mắt bò tót)
Trang 8Trường hợp u sẽ hình thành một khối đặc ở giữa rỗng, bờ hốc rỗng dầy và không đều Trong cơ thể nhiều ổ thấy nhiều khối đặc tăng âm nằm tập trung ở một thùy hoặc rải rác khắp cả gan phải trái Trong thể lan tỏa không thấy khối mà chỉ thấy một vùng tăng âm, hoặc xen kẽ cả giảm âm giới hạn không rõ (hình tổ ong) Ung thư gan nguyên phát thường gây huyết khối ở tĩnh mạch cửa và tĩnh mạch chủ dưới
có thể phát hiện bằng siêu âm Có thể dùng DOPPLER xung và chụp động mạch gan để đánh giá sự tăng mạch máu trong khối ung thư Nếu ung thư phát triển trên gan lành, hình nhu mô xung quanh bình thường, còn nếu ung thư phát triển trên nền
xơ sẽ có dấu hiệu xơ gan
Theo phân loại của OKUDA có 4 thông số: khối lượng u chiếm trên 50% khối lượng gan, có cổ trướng, Bilirubin máu trên 30mg/l và abumin dưới 30mg/l siêu âm xác định được hai thông số đầu
– K giai đoạn I không có thông số nào
– K giai đoạn II có một hoặc 2 thông số
– K giai đoạn III có 3 hoặc 4 thông số
Siêu âm giúp theo dõi K lớn gấp đôi theo thời gian, u càng ác tính thời gian càng ngắn Siêu âm hướng dẫn vị trí kích thước khối u, đường vào khối u, ví dụ: bơm hóa chất điều trị qua ống thông luồn vào động mạch gan, chọc kim qua da để bơm cồn 950
vào u nhỏ dưới 4cm
Nhờ siêu âm kiểm tra hàng loạt những người có nguy cơ cao để phát hiện sớm ung thư nhỏ hơn 3cm, chưa có triệu chứng lâm sàng do đó điều trị sẽ tốt hơn Theo ChenD.S sự chính xác của siêu âm chẩn đoán K gan dưới 3cm như sau: siêu âm 95%, cắt lớp vi tính 94%, chụp động mạch gan 89%, chụp lấp lánh 16%, soi ổ bụng 12%
Để giải quyết vấn đề trên, chương trình sẽ thu thập tri thức về các triệu chứng
và dấu hiệu nhận biết bệnh ung thư gan, tổ chức biểu diễn tri thức xây dựng hệ hỗ trợ chẩn đoán bệnh ung thư gan Đó là mô hình COKB ( Computational Objects Knowledge Base)
Chương trình dựa trên tri thức của nhiều bác sĩ chuyên khoa Nội tiêu hóa – Gan mật có kiến thức chuyên sâu, kinh nghiệm lâm sàng và những công trình
nghiên cứu căn bệnh này để phân tích những triệu chứng mơ hồ, căn bệnh phức tạp
Trang 9để đưa ra chẩn đoán và cách điều trị thích hợp Chương trình có ý nghĩa quan trọng trong việc các bác sĩ mới ra trường hoặc những bác sĩ không chuyên về bệnh nội tiêu hóa kế thừa những kinh nghiệm của các chuyên gia trong một thời gian ngắn và bác sĩ tuyến huyện nâng cao trình độ chuyên môn trong việc chẩn đoán và điều trị căn bệnh này
Qua thời gian tìm hiểu và tham khảo ý kiến chuyên gia về chuyên môn Công
nghệ thông tin và Y khoa, tôi đã nghiên cứu tài liệu và chọn hướng đề tài : “Xây dựng hệ hỗ trợ chẩn đoán bệnh ung thư gan”
1.2 ĐỘNG CƠ NGHIÊN CỨU
Hiện nay bệnh ung thư gan đứng thứ ba trên thế giới theo tài liệu [14], các khối u ác tính nguyên phát thường gặp nhất của gan ở người lớn là ung thư biểu mô
tế bào gan hay còn gọi là Hepatocellular Carcinoma (HCC) HCC là một bệnh đặc biệt nguy hiểm, tỷ lệ người bệnh hằng năm tương đương với tỷ lệ tử vong Một phần lớn bệnh nhân HCC có xơ gan căn bản và rối loạn chức năng gan Chăm sóc bệnh nhân HCC là rất quan trọng, an toàn và hiệu quả tối ưu hóa các lựa chọn điều trị, chẳng hạn như cải tiến điều trị virus viêm gan, tăng sàng lọc bệnh nhân có nguy
cơ cao phát triển HCC, cải tiến lựa chọn bệnh nhân ghép gan và phẩu thuật cắt bỏ
và chấp thuận điều trị chống ung thư [21], [23], [25], [28]
Tại Việt Nam cũng như các nước Đông Nam Á, ung thư gan chủ yếu là ung thư gan nguyên phát, ngược lại với các nước Tây Âu và Bắc Mỹ chủ yếu là ung thư gan thứ phát Ung thư tế bào gan đang tăng cao ở các nước Đông Á, Việt Nam cùng bối cảnh với các nước trong khu vực, phần lớn ung thư tế bào gan là do viêm gan siêu vi B, bệnh ảnh hưởng đặc biệt đến nhiều người ở độ tuổi đang làm việc và chi phí điều trị Các thống kê tại các bệnh viện và các khu vực cho thấy ung thư tế bào gan là một trong những ung thư phổ biến nhất ở Việt Nam cho cả hai giới, nhất là nam giới
Theo thống kê của tổ chức Y tế thế giới năm 2008, tại nước ta ung thư gan là một bệnh có tỷ lệ mắc bệnh cao nhất trong tất cả các loại ung thư, cao hơn ung thư phổi, ung thư dạ dày, ung thư đại trực tràng Tỷ lệ tử vong 92,62%, số mắc bệnh và chết ung thư gan ở nam và nữ đều đứng đầu trong các loại ung thư Số trường hợp
Trang 10ung thư gan mới mắc hàng năm rất cao (Bảng 1.1 ), tỷ lệ nam /nữ là 1,9/1 và tỷ lệ tử vong nam /nữ là 1,8/1.[28]
Bảng 1.1 Số liệu ung thư gan ở nam nữ tại Việt Nam theo WHO năm 2008
Với tình hình bệnh gan ngày càng tăng thì một chương trình máy tính hỗ trợ bác sĩ chẩn đoán và theo dõi bệnh gan là cần thiết Loại chương trình này thường được biết đến với tên gọi là hệ chuyên gia Đó là một loại chương trình máy tính có khả năng mô hình hóa khả năng giải quyết vấn đề của các chuyên gia trong từng lĩnh vực Hệ chuyên gia là một trong những lĩnh vực của trí tuệ nhân tạo được nghiên cứu và phát triển từ giữa thập niên 60 [26] Cho đến nay hệ chuyên gia được
áp dụng trong nhiều lĩnh vực, trong đó y khoa là một trong những lĩnh vực được áp dụng đầu tiên
Theo tài liệu website [42], Trường Đại học Y Dược hằng năm đều có chỉ tiêu tuyển sinh bác sĩ ở các chuyên khoa khác nhau Một bác sĩ sau khi ra trường ít nhất phải mất 2 năm để hoàn tất chương trình bác sĩ chuyên khoa I và thêm thời gian làm việc ở bệnh viện 6 năm mới được học chương trình chuyên khoa II kéo dài trong 2 năm mới có kiến thức và kinh nghiệm chuyên sâu trong lĩnh vực Y khoa Chuyên khoa cấp II là loại hình đào tạo sau đại học đặc thù của ngành y tế, nhằm mục đích
Trang 11đào tạo các chuyên gia y tế bậc cao, có khả năng thực hành giỏi trong một chuyên ngành hẹp Chuyên khoa cấp II là bậc học tiếp theo của chuyên khoa cấp I, nội trú bệnh viện là bậc cao nhất về thực hành và áp dụng cho tất cả các chuyên ngành lâm sàng và thực hành nghề nghiệp trong lĩnh vực khoa học sức khỏe [10], [40]
Việc xây dựng hệ chẩn đoán này sẽ giúp cho việc chẩn đoán của bác sĩ thuận tiện hơn Chương trình này dựa trên tri thức chuyên sâu của bác sĩ chuyên khoa II,
khoa Nội tiêu hóa – Gan mật tại bệnh viện Nhân dân Gia Định Đồng thời chương
trình cũng giúp ích cho các bác sĩ mới ra trường chưa có kinh nghiệm trong việc chẩn đoán bệnh Ngoài ra, giá trị lớn nhất là giúp cho mọi người dân có thể sử dụng
để phát hiện bệnh hay nghi ngờ bệnh và đến bệnh viện kịp thời Chương trình xây dựng hệ hỗ trợ chẩn đoán bệnh ung thư gan được gọi tắt là ESLCD (The Expert System for Liver Cancer Diagnosis)
1.3 MỤC TIÊU LUẬN VĂN
Từ nhu cầu thực tiễn cuộc sống về khám chữa bệnh với những động lực đã nêu trên, đề tài mong muốn ứng dụng công nghệ thông tin vào lĩnh vực y khoa và
đặc biệt là chuyên khoa Nội tiêu hóa - Gan mật về chẩn đoán bệnh ung thư gan Đề
tài sẽ tìm hiểu và nghiên cứu về những phương pháp và kĩ thuật xây dựng hệ chuyên gia
Vận dụng mô hình biểu diễn tri thức nhằm xây dựng hệ hỗ trợ chẩn đoán bệnh ung thư gan Hệ hỗ trợ chẩn đoán này đáp ứng một số yêu cầu từ ý kiến của chuyên gia, có giao diện mang tính tương tác và hệ thống thử nghiệm trên các bệnh án thực
tế Hệ thống có cơ sở tri thức từ các chuyên gia cấp cao để hỗ trợ cho bác sĩ trẻ chưa
có nhiều kinh nghiệm hay các bác sĩ tuyến huyện rút kinh nghiệm trước khi ra quyết định lâm sàng Đây là một chương trình ứng dụng thực tế cao
Thông qua ứng dụng này có một số đóng góp về mặt kỹ thuật biểu diễn tri thức và suy luận Dựa trên cơ sở kỹ thuật ứng dụng chương trình giải quyết những vấn đề về nghiên cứu tri thức thực tế từ chuyên gia cấp cao về bệnh ung thư gan để xây dựng mô hình biểu diễn tri thức và đưa ra những kết quả chẩn đoán cho bệnh nhân ung thư gan
Trang 12Để xây dựng ứng dụng đòi hỏi nghiên cứu tri thức thực tế từ lĩnh vực Y khoa
về chẩn đoán bệnh ung thư gan để xây dựng mô hình biểu diễn tri thức Thông qua ứng dụng này có đóng góp nhất định về mặt mô hình và kỹ thuật có thể phát triển sau này
chuyên sâu về bệnh gan
Chương trình hỗ trợ bác sĩ trong việc ra quyết định lâm sàng, chẩn đoán cuối cùng phải là chẩn đoán của bác sĩ điều trị trực tiếp
Về mặt phương pháp thực hiện thì việc đầu tiên là thu thập tri thức từ các bác
sĩ chuyên khoa Nội tiêu hóa – Gan mật của Bệnh viện Nhân dân Gia Định Thành
phố Hồ Chí Minh Nghiên cứu và ứng dụng các mô hình biểu diễn tri thức và các phương pháp suy diễn để xây dựng hệ hỗ trợ chẩn đóan các bệnh ung thư gan Nghiên cứu sử dụng các mẫu thử nghiệm bao gồm các bệnh nhân nhập viện
khoa Nội tiêu hóa – Gan mật bệnh viện từ tháng 04/2014 đến tháng 08/2014 để hệ
chuyên gia thử nghiệm Kết quả chẩn đoán bằng hệ hỗ trợ được so sánh với kết quả chẩn đoán của các bác sĩ trong khoa
1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
Đề tài này mang tính ứng dụng thực tế rất cao do nhu cầu của con người cần
có một chương trình hỗ trợ cho việc chẩn đoán và phát hiện bệnh sớm để kịp thời chữa trị Trong khi làm ứng dụng này, tôi đã nghiên cứu tìm hiểu một số phương pháp, kĩ thuật để thiết kế chương trình nhằm xây dựng một hệ chuyên gia phù hợp hơn so với chương trình ứng dụng thông thường Sử dụng mô hình mới để xây dựng một hệ chuyên gia hỗ trợ cho việc chẩn đoán bệnh trong lĩnh vực Y khoa là một công cụ giúp nâng cao hiệu quả công việc và mang tính thực tiễn rất cao
Trang 13Ngoài ra, vấn đề chẩn đoán bệnh ung thư gan đã được các bác sĩ trong lĩnh vực chuyên khoa nghiên cứu, nhưng việc ứng dụng mô hình Biểu diễn tri thức về bệnh chưa được ai vận dụng Vì vậy tính mới của đề tài là việc ứng dụng công nghệ tri thức và biểu diễn tri thức vào lĩnh vực y khoa để chẩn đoán bệnh ung thư gan
Đề tài đã đưa ra một mô hình tri thức áp dụng những phương pháp thiết kế hệ
cơ sở tri thức dựa vào hệ chuyên gia, phương pháp biểu diễn và kĩ thuật xử lý tri thức phức tạp trong lĩnh vực y khoa là một đóng góp về mặt khoa học của đề tài Dựa vào kết quả của đề tài này, ngoài việc ứng dụng mô hình Sub-COKB vào toán học và y khoa, ta còn có thể ứng dụng mô hình này cho tất cả các lĩnh vực trong đời sống giúp con người tiết kiệm thời gian và chi phí, nâng cao chất lượng cuộc sống ngày càng tiến bộ và văn mình hơn, hiện đại hóa đất nước
Trang 14CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT
Trong chương này sẽ trình bày cơ sở lý thuyết liên quan đến hệ chuyên gia, các cơ sở tri thức, phương pháp biểu diễn tri thức, mô hình biểu diễn tri thức, động
cơ suy diễn và các kỹ thuật xây dựng một hệ cơ sở tri thức để xây dựng một hệ chuyên gia
2.1 HỆ CHUYÊN GIA
2.1.1 Cơ sở tri thức
Tri thức [5] là những gì mà một người có thể biết và hiểu được Tri thức có thể
được phân loại thành tri thức có cấu trúc hoặc không có cấu trúc, tri thức rõ ràng hay tri thức ngụ ý, không rõ ràng Những gì mà chúng ta biết được thường là các tri thức rõ ràng Tri thức không có cấu trúc mà vẫn hiểu được, nhưng không được phát biểu rõ ràng là các tri thức ngầm ý, tri thức không rõ Khi tri thức được tổ chức để
có thể chia sẻ thì lúc đó tri thức được gọi là tri thức có cấu trúc Để có thể chuyển đổi từ tri thức không rõ ràng sang tri thức rõ ràng thì tri thức đó cần phải được cấu trúc hóa và định dạng lại
Phân loại tri thức: như đã đề cập ở trên, tri thức có nhiều loại tùy thuộc vào
tính chất cấu trúc và tính chất rõ ràng của tri thức Tri thức có thể được phân loại thành các loại tri thức sau, đây là các loại tri thức thường gặp trong thực tế:
– Tri thức thủ tục: trong thực tế, nhiều bài toán mà ta có thể gặp là các bài toán mà
tri thức không đơn thuần là khái niệm hay mô tả mà là một hành động hay một công thức, thủ tục Ta gọi các tri thức như vậy là các tri thức thủ tục (diễn tả các vấn đề được giải quyết)
– Tri thức mô tả: cho biết một vấn đề được thấy như thế nào
– Tri thức meta: diễn tả tri thức về tri thức
– Tri thức may rủi: diễn tả các luật may rủi dẫn dắt quá trình suy lý Tri thức này
có được dựa trên kinh nghiệm tích lũy nên còn gọi là hueristic
– Tri thức cấu trúc: mô tả mô hình tri thức tổng quát của chuyên gia về một vấn
đề
Trang 15Tùy thuộc vào ứng dụng cụ thể mà tri thức được biểu diễn theo những phương thức khác nhau Ứng với mỗi dạng biểu diễn đó có một cơ chế để xử lý tri thức đó
Hệ cơ sở tri thức là một tập hợp các cơ sở lập luận, các luật, các quy trình, thủ tục được tổ chức thành một lược đồ Đó là tập hợp của tất cả các thông tin cũng như tất
cả các kiến thức về một lĩnh vực cụ thể nào đó
Quá trình thu thập tri thức được gọi là quá trình rút trích tri thức và định dạng tri thức được thực hiện từ nhiều nguồn khác nhau, đặc biệt là từ các chuyên gia trong các lĩnh vực cụ thể Công việc này là một trong những bước quan trọng và thường mất rất nhiều thời gian cũng như công sức trong quá trình xây dựng một hệ
cơ sở tri thức được sử dụng trong hệ chuyên gia Trong quá trình phát triển một hệ chuyên gia, các kỹ sư tri thức, những nhà chuyên môn trong lĩnh vực trí tuệ nhân tạo, có nhiệm vụ thu thập tri thức từ các chuyên gia thuộc lĩnh vực chuyên ngành Sau đó “sao chép” các tri thức đó vào cơ sở tri thức và diễn đạt các tri thức đó dưới dạng có thể dùng được trong hệ chuyên gia [7]
2.1.2 Hệ chuyên gia
Theo E.Feigenbaum: “ Hệ chuyên gia (Expert System) là một chương trình máy tính thông minh sử dụng tri thức (knowledgea) và các thủ tục suy luận (inference procedures) để giải những bài toán tương đối khó khăn đòi hỏi những chuyên gia mới giải được” [26]
Hệ chuyên gia là một hệ thống tin học có thể mô phỏng (emulates) năng lực quyết đoán (decision) và hành động (making ability) của một chuyên gia (con người) Hệ chuyên gia là một trong những lĩnh vực ứng dụng của trí tuệ nhân tạo (Artificial Intelligence)
Hệ chuyên gia sử dụng tri thức của chuyên gia để giải quyết các vấn đề (bài toán) khác nhau thuộc mọi lĩnh vực
Tri thức (knowledge) trong hệ chuyên gia phản ánh sự tinh thông tích tụ từ sách vở, tạp chí, từ các chuyên gia hay các nhà bác học Các thuật ngữ hệ chuyên gia, hệ thống dựa trên tri thức (knowledge – based system) hay hệ chuyên gia dựa trên tri thức (knowledge – based expert system) thường có cùng nghĩa
Một hệ chuyên gia bao gồm ba thành phần chính là cơ sở tri thức (knowledge base), máy suy diễn hay môtơ suy diễn (inference engine) và hệ thống giao tiếp với
Trang 16người sử dụng (userinterface) Cơ sở tri thức chứa các tri thức để từ đó máy suy diễn tạo ra câu trả lời cho người sử dụng qua hệ thống giao tiếp
Người sử dụng (user) cung cấp sự kiện (facts) là những gì đã biết, đã có thật hay những thông tin có ích cho hệ chuyên gia và nhận được những câu trả lời là những lời khuyên hay những gợi ý đúng đắn (expertise) [37]
Hình 2.1 Các thành phần của một hệ chuyên gia [37]
Hoạt động của một hệ chuyên gia dựa trên cơ sở tri thức được minh họa:
Hình 2.2 Hoạt động của một hệ chuyên gia [11]
Trang 17Những chương trình trí tuệ nhân tạo đạt được khả năng giải quyết các vấn đề trong các lĩnh vực cụ thể ở mức độ chuyên gia bằng cách sử dụng một cơ sở tri thức trong lĩnh vực đó gọi là các hệ cơ sở tri thức hoặc hệ chuyên gia Thông thường, thuật ngữ Hệ chuyên gia được dùng riêng cho các chương trình mà cơ sở tri thức của nó chứa đựng các tri thức được dùng bởi các chuyên gia thực thụ, khác với các tri thức được thu thập trong các sách giáo khoa hoặc không phải là tri thức chuyên môn Tuy nhiên, đôi khi 2 thuật ngữ Hệ chuyên gia và Hệ cở sở tri thức được sử dụng tương tự như nhau Phạm vi của trí tuệ nhân tạo cố gắng để đạt được trong một hệ chuyên gia gọi là lĩnh vực chuyên ngành Nhiệm vụ này có thể là các hoạt động như giải quyết vấn đề, hoặc là các suy luận hướng đích Còn chuyên ngành là phạm vi tri thức mà nhiệm vụ đang thực hiện Các chức năng (nhiệm vụ) thông thường như chẩn đoán bệnh, lập kế hoạch, lập lịch, thiết lập cấu hình và thiết kế Một ví dụ cụ thể là lập lịch bay cho phi hành đoàn trong các chuyến bay của một hãng hàng không, hay phân tích cấu trúc của một tòa nhà và đưa ra các giải pháp hay tư vấn về việc thiết kế tòa nhà đó
Có thể phân loại các hệ chuyên gia như sau: [26]
– ES – phân loại: là các hệ áp dụng trong chẩn đoán hoặc phân loại đối tượng Tri thức thường được tổ chức dưới dạng hệ luật dẫn
– ES – tư vấn: là các hệ thực hiện tư vấn từ các giả thiết có sẵn hoặc từ các giả thiết mới được thiết lập
– ES – phản biện: thực hiện phản biện dựa vào tập phản đề sẵn có hay là tự tạo phản biện
– ES – quyết định: là các hệ trợ giúp quyết định, thường được kết hợp với các công cụ tính toán
Việc xây dựng một hệ chuyên gia được hiểu như là việc ứng dụng các kiến thức khoa học vào việc vận hành và bảo trì tri thức, và người vận hành tri thức này gọi là người thiết kế tri thức Người thiết kế tri thức phải đảm bảo rằng máy tính luôn có đủ tri thức để giải quyết một vấn đề nào đó Người thiết kế tri thức phải chọn một hoặc nhiều hình thức miêu tả các tri thức được yêu cầu dưới dạng các mô hình kí hiệu trong bộ nhớ của máy tính và như vậy anh ta phải chọn một cách biểu diễn có hiệu quả bằng việc chọn ra một số các biện pháp lập luận
Trang 182.1.3 Cấu trúc hệ chuyên gia
Mỗi hệ chuyên gia đều bao gồm 2 thành phần cơ bản là: hệ cơ sở tri thức và
bộ máy suy diễn Tùy theo cách biểu diễn tri thức mà ta có thể xây dựng mô tơ suy diễn theo thuật giải suy diễn nào Ngoài ra còn có thể kết hợp phương pháp biểu diễn thừa số chắc chắn để hệ chuyên gia hoạt động một cách tự nhiên [26]
Cấu trúc của một hệ chuyên gia thường được phân ra thành các thành phần nhỏ như:
– Giao diện người máy: Thực hiện giao tiếp giữa người dùng và hệ thống nhận
dạng các thông tin từ người dùng (các câu hỏi, các yêu cầu về lĩnh vực) và đưa
ra các lời khuyên, các câu trả lời, các giải thích về lĩnh vực đó
– Bộ thu nạp tri thức làm nhiệm vụ thu nạp tri thức từ chuyên gia con người, từ kỹ
sư tri thức và người sử dụng thông qua các câu hỏi và yêu cầu của họ sau đó lưu trữ vào cơ sở tri thức
– Bộ giải thích: giải thích những hành động cũng như những quyết định của hệ
thống cho người dùng
– Mô tơ suy diễn: thực hiện các cơ chế suy diễn (để biến đổi hoặc tìm ra tri thức),
xử lý và điều khiển các tri thức được biểu diễn trong cơ sở tri thức nhằm đáp ứng các câu hỏi và yêu cầu của người sử dụng
– Cơ sở tri thức: Lưu trữ các tri thức trong lĩnh vực mà hệ đảm nhận làm cơ sở
cho mọi hoạt động của hệ Cơ sở tri thức bao gồm các sự kiện và các luật
Trang 19Hình 2.3 Cấu trúc cơ bản của một hệ chuyên gia [11]
2.1.4 Kỹ thuật suy luận trong hệ chuyên gia
Có nhiều phương pháp tổng quát để suy luận các chiến lược giải quyết vấn đề của hệ chuyên gia Những phương pháp hay gặp là suy diễn tiến (forward chaining), suy diễn lùi (backward chaining) và phối hợp hai phương pháp này (mixed chaining)
Những phương pháp khác là phân tích phương tiện (means-end analysis), rút gọn vấn đề (problem reduction), quay lui (backtracking), kiểm tra lập kế hoạch (plan- generate-test), lập kế hoạch phân cấp (hierachical planning)
Dưới đây là nền tảng của công nghệ hệ chuyên gia hiện đại (foundation of modern rule-based expert system)
Trang 20Hình 2.4 Nền tảng của công nghệ hệ chuyên gia dựa trên luật [11]
Phương pháp suy diễn tiến
Suy diễn tiến (forward charning) là lập luận từ các sự kiện, sự việc để rút ra các kết luận Ví dụ: Nếu thấy trời mưa trước khi ra khỏi nhà (sự kiện) thì phải lấy áo mưa (kết luận)
Trong phương pháp này, người sử dụng cung cấp các sự kiện cho hệ chuyên gia để hệ thống (máy suy diễn) tìm cách rút ra các kết luận có thể Kết luận này được xem là những thuộc tính có thể được gán giá trị Trong số những kết luận này,
có thể có những kết luận làm người sử dụng quan tâm, một số khác không nói lên điều gì, một số khác có thể vắng mặt
Các sự kiện thường có dạng: Attribute = value
Lần lượt các sự kiện trong cơ sở tri thức được chọn và hệ thống xem xét tất cả các luật mà các sự kiện này xuất hiện như là tiền đề Theo nguyên tắc lập luận trên,
hệ thống sẽ lấy ra những luật thỏa mãn Sau khi gán giá trị cho các thuộc tính kết
Trang 21luận tương ứng, người ta nói rằng các sự kiện đã được thõa mãn Các thuộc tính được gán giá trị sẽ là một phần của kết quả chuyên gia Sau khi mọi sự kiện đã được xem xét, kết quả được xuất ra cho người sử dụng
Phương pháp suy diễn lùi:
Phương pháp suy diễn lùi tiến hành các lập luận theo chiều ngược lại (đối với phương pháp suy diễn tiến) Từ một giả thuyết (như là một kết luận), hệ thống đưa
ra một tình huống trả lời gồm các sự kiện là cơ sở của giả thuyết đã cho này Ví dụ: nếu ai đó vào nhà mà cầm áo mưa và quần áo bị ướt thì giả thuyết là trời mưa
Để củng cố giả thuyết này, ta sẽ hỏi người đó xem có phải trời mưa không? Nếu người đó trả lời có thì giả thuyết trời mưa đúng và trở thành một sự kiện Nghĩa
là trời mưa nên phải cầm áo mưa và áo quần bị ướt
Suy diễn lùi là cho phép nhận được giá trị của một thuộc tính Đó là câu trả lời cho câu hỏi “ giá trị của thuộc tính A là bao nhiêu?” với A là một đích (goal)
Để xác định giá trị của A cần có các nguồn thông tin Những nguồn này có thể
là những câu hỏi hoặc có thể là những luật Căn cứ vào các câu hỏi, hệ thống nhận được một cách trực tiếp từ người sử dụng những giá trị của thuộc tính liên quan Căn cứ vào các luật, hệ thống suy diễn có thể tìm ra giá trị sẽ là kết luận của một trong số các kết luận có thể của thuộc tính liên quan,v.v
Ý tưởng của thuật toán suy diễn lùi như sau Với mỗi thuộc tính đã cho, người
ta định nghĩa nguồn của nó:
– Nếu thuộc tính xuất hiện như là tiền đề của một luật (phần đầu của luật), thì nguồn sẽ thu gọn thành một câu hỏi
– Nếu thuộc tính xuất hiện như là hậu quả của một luật (phần cuối của luật), thì nguồn sẽ là các luật mà trong đó, thuộc tính là kết luận
– Nếu thuộc tính là trung gian, xuất hiện đồng thời như là tiền đề và như là kết luận, khi đó nguồn có thể là các luật, hoặc có thể là các câu hỏi mà chưa được nêu ra
Nếu mỗi lần với câu hỏi đã cho, người sử dụng trả lời hợp lệ, giá trị trả lời này
sẽ được gán cho thuộc tính và xem như thành công Nếu nguồn là các luật, hệ thống
sẽ lấy lần lượt các luật mà thuộc tính đích xuất hiện như kết luận, để có thể tìm giá
Trang 22trị các thuộc tính thuộc tiền đề Nếu các luật thõa mãn, thuộc tính kết luận sẽ được ghi nhận
2.1.5 Quy trình xây dựng hệ chuyên gia:
Theo tài liệu [26], quy trình được chia làm 7 giai đoạn như sau:
– Giai đoạn 1:
Xác định miền tri thức
Xác định phạm vi vấn đề
Thu thập tri thức
– Giai đoạn 2: Thiết kế cơ sở tri thức
Biểu diễn tri thức
Tổ chức cơ sở tri thức
– Giai đoạn 3: Thiết kế bộ suy diễn
Thu thập và biểu diễn vấn đề chẩn đoán
Thiết kế giải thuật để chẩn đoán
– Giai đoạn 4: Thiết kế giao diện người dùng
– Giai đoạn 5: Cài đặt
– Giai đoạn 6: Xây dựng bảng mẫu để kiểm tra
– Giai đoạn 7: Hiệu chỉnh
2.1.6 Thuận lợi và khó khăn của hệ chuyên gia
Thuận lợi:
Tính lâu dài của Hệ chuyên gia: các chuyên gia là con người vẫn có thể quên những lập luận hay khái niệm nào đó, nhưng hệ chuyên gia thì không Ngoài ra hệ chuyên gia còn có khả năng tái sử dụng cho các mục đích khác nhau, với các lĩnh vực khác nhau, một cách nhanh chóng và dễ dàng Trong khi đó, quá trình tạo ra một cuyên gia là con người phải mất một khoảng thời gian và công sức không nhỏ Các hệ chuyên gia có thể dùng các luật hay quy tắc một cách nhanh chóng mà không nhầm lẫn, nếu trong trường hợp có quá nhiều quy tắc hay luật thì một chuyên gia là con người không xử lý nhanh như một hệ chuyên gia được
Về tính hiệu quả, một hệ chuyên gia có thể tăng số lượng được đưa vào hệ và giảm đi các chi phí nhân công Mặc dù các hệ chuyên gia được xây dựng và bảo trì
Trang 23thường tốn kém, nhưng để vận hành các hệ chuyên gia không phải tốn nhiều công sức và tiền bạc Việc phát triển và duy trì một hệ chuyên gia có thể được trải đều ra cho nhiều người, và tổng chi phí cho việc này sẽ hợp lý hơn rất nhiều so với việc kiếm một chuyên gia thực thụ
Nếu như không có sự trục trặc về thiết bị máy móc thì một hệ chuyên gia có thể hoạt động rất ổn định, với các tập luật đã được xây dựng và cùng với các khả năng xử lý khác, hệ có thể đưa ra các quyết định gần như nhau trong các tình huống tương tự nhau Ngoài ra, một hệ chuyên gia có thể cung cấp các giải pháp một cách thường xuyên trong một quá trình giải quyết vấn đề Trong một thời điểm thì một hệ chuyên gia có khả năng giải quyết được nhiều vấn đề hơn so với một chuyên gia là con người
Một thuận lợi lớn khác của các hệ chuyên gia đó là kiến thức của rất nhiều chuyên gia khác nhau được đưa vào hệ chuyên gia, điều này rõ ràng là làm cho cơ
sở tri thức của một hệ chuyên gia rộng và phong phú hơn so với một vài chuyên gia đơn lẻ Trong lĩnh vực kinh tế, hệ chuyên gia sẽ có thể giảm thiểu được nhiều rủi ro hơn
Những bất lợi của một hệ chuyên gia dựa trên luật:
Một điều dễ nhận ra là các hệ chuyên gia không có khả năng học như các hệ thống thông minh khác như Suy luận dựa tình huống (Case-based reasoning) hay Mạng nơron (Neural Networks), Vì vậy nếu có những thay đổi từ phía các chuyên gia là con người thì hệ chuyên gia cần được cập nhật lập tức Hệ chuyên gia không
có khả năng sáng tạo và không có được các giác quan thông thường như con người, trong những tình huống bất thường, hệ chuyên gia không có khả năng giải quyết Ngoài ra, các hệ chuyên gia không có được những kinh nghiệm, sự nhạy bén, tính sáng tạo như các chuyên gia là con người, và cũng không thể nhận ra được vấn
đề nếu như vấn đề đó không thuộc phạm vi “hiểu biết” của hệ thống
Trang 242.2 CƠ SỞ TRI THỨC
Cơ sở tri thức của hệ chuyên gia bao gồm cả tri thức thực tế và tri thức Heuristic Tri thức thực tế là tri thức chuyên ngành mà được phổ biến và chia sẻ trong phạm vi rộng, có thể tìm thấy dễ dàng trong sách giáo khoa hoặc trong các sách báo và nhìn chung là được chấp nhận dựa trên các kiến thức đúng đắn trong từng lĩnh vực cụ thể Còn tri thức Heuristic mang ít tính nghiêm ngặt hơn, dựa nhiều vào kinh nghiệm và sự phán đoán hơn Trái với tri thức thực tế, tri thức Heuristic ít khi được thảo luận, và mang đậm tính cá nhân Nó là kiến thức rút ra từ việc thực hành và phán đoán tốt và sự lập luận chặt chẽ trong từng lĩnh vực [16] Biểu diễn tri thức là mô hình hóa và tổ chức tri thức Một phương pháp biểu diễn tri thức được sử dụng rộng rãi là sử dụng hệ các luật dẫn hoặc là dùng các luật đơn giản Một luật bao gồm một phần IF và một phần là THEN (còn gọi là điều kiện và kết luận) Phần IF liệt kê một tập hợp các điều kiện được liên kết logic với nhau Một mẫu tri thức được biểu diễn bởi luật dẫn có liên quan đến dòng lập luận đang được khai triển nếu như phần IF của luật được thỏa mãn Vì vậy, phần THEN của luật có thể được kết luận, hoặc là vấn đề của luật có thể được giải quyết
Ví dụ:
(1) Nếu điều-kiện P thì kết-luận C
(2) Nếu trạng-thái S thì hành-động A
(3) Nếu các điều kiện C1, Cn đúng thì kết luận C đúng
Hệ luật dẫn được sử dụng rộng rãi là do các nguyên nhân sau:
Tính đơn thể: Mỗi luật định nghĩa một phần nhỏ và độc lập các tri thức
Dễ thêm: Có thể thêm các luật mới vào CSTT tương đối độc lập với các quy tắc đã có
Dễ sửa đổi: Có thể sửa đổi các quy tắc trong CSTT tương đối độc lập với các quy tắc khác
Trong suốt: Hệ thống dựa trên luật dẫn có khả năng giải thích các hành động cũng như các quyết định của nó
Mô hình giải quyết vấn đề tổ chức và điều khiển các bước thực hiện để giải quyết một vấn đề nào đó của hệ chuyên gia Một mô hình thông dụng nhưng hiệu
Trang 25quả là liên kết các mắt xích của các luật IF-THEN để hình thành một dòng lập luận Nếu như chuỗi mắt xích đó bắt đầu từ một tập hợp các điều kiện và tiến đến các kết luận thì phương pháp này gọi là suy luận tiến Còn nếu như kết luận đã được biết trước nhưng các bước suy luận để dẫn đến kết luận vẫn chưa biết thì khi đó, hàm suy lùi sẽ được gọi, và phương pháp suy luận này gọi là suy diễn lùi Các phương pháp giải quyết vấn đề này được xây dựng trong các module của chương trình và được gọi là các bộ máy suy diễn hoặc là các thủ tục suy diễn, các module này sẽ điều khiển và sử dụng tri thức trong cơ sở tri thức để hình thành dòng lập luận Tri thức là thành phần quan trọng nhất trong bất kỳ một hệ chuyên gia nào Sức mạnh của các hệ chuyên gia dựa vào các tri thức cụ thể và có chất lượng mà nó chứa đối với các lĩnh vực chuyên ngành Do tầm quan trọng của tri thức đối với các
hệ chuyên gia và vì hiện nay các phương pháp thu thập tri thức còn tốn nhiều chi phí, các hệ chuyên gia trong tương lai cần phải giải quyết được vấn đề thu thập tri thức và cải tiến việc hệ thống hóa cũng như việc biểu diễn một hệ cơ sở tri thức lớn Với mục tiêu xây dựng một hệ chuyên gia có những bước suy luận giống như con người thì đòi hỏi trước hết hệ thống cần phải có một cơ sở tri thức phong phú và sâu rộng về vấn đề mà hệ chuyên gia cần giải quyết, quá trình thu thập cơ sở tri thức là một quá trình quan trọng đối với bất cứ một hệ chuyên gia nào, và việc quản lý cơ
sở tri thức cũng là một vấn đề quan trọng [5]
2.3 CÁC PHƯƠNG PHÁP BIỂU DIỄN TRI THỨC
Tri thức là sự hiểu biết về một lĩnh vực của một chủ đề Tri thức thường bao gồm các khái niệm, sự kiện Biểu diễn tri thức là sự diễn đạt và thể hiện của tri thức dưới những dạng thích hợp để có thể tổ chức một cơ sở tri thức của hệ thống Phần này sẽ trình bày các phương pháp và kỹ thuật biểu diễn tri thức.[11],[29],[34],[35]
2.3.1 Biểu diễn tri thức dựa trên logic hình thức
Đây được xem như các biểu diễn tri thức đơn giản nhất trong máy tính Sử dụng các kí hiệu để mô tả tri thức Mỗi kí hiệu nhằm diễn tả một khái niệm nào đó trong lĩnh vực đang xét, và mỗi kí hiệu này mang 2 giá trị luận lý là đúng hoặc sai Các phép toán logic được sử dụng phổ biến của dạng là: and (^), or (v), not (~) và
Trang 26phép kéo theo (→), tương đương (≡) Ví dụ: Tri thức “ nếu trời mưa và xe máy hư thì đi xe buýt” được biểu diễn là : s^p → r, trong đó s diễn tả khái niệm trời mưa, p diễn tả khái niệm xe hư ra r là đi xe buýt Như vậy mô hình cho phương pháp này bao gồm: tập các kí hiệu và tập các luật để diễn đạt các sự kiện và luật trong hệ cơ
sở tri thức
Phương pháp suy luận trong các biểu diễn này là sử dụng suy diễn tiến, suy diễn lùi hoặc kết hợp cả hai Phương pháp suy diễn tiến là suy dẫn từ giả thuyết đi đến kết luận và suy diễn lùi là truy ngược từ kết luận trở về giả thuyết
Cho bài toán suy diễn: Tập luật R={Ri : nếu 1 (Ri) thì r (Ri), i=1,2, n}
Ghi chú: 1(Ri): vế trái luật Ri
r(Ri): vế phải luật Ri
Thuật giải suy diễn tiến
– Đầu vào: Tập giả thiết G và tập kết luận K
– Đầu ra: thành công hay thất bại
Bước 1: GT ← G
Bước 2: nếu K G thì dừng thành công
Ngược lại, chuyển sang bước 3
Bước 3: Từ R chọn luật Ri sao cho 1(Ri) G
GT ← GT r(Ri)
Quay lại bước 2
Nếu không chọn được Ri thì dừng thất bại
Thuật giải suy diễn lùi
– Đầu vào: Tập giả thiết G và tập kết luận K
– Đầu ra: thành công hay thất bại
Bước 1: O ← K: // O là tập các sự kiện kết luận cần chứng minh
Bước 2: nếu O G thì dừng thành công, ngược lại qua bước 3
Bước 3: chứng minh tất cả các sự kiện giả thiết của một luật nào đó trong G
mà có kết luận K
Trang 27Mô hình biểu diễn này rất khó áp dụng trong thực tế vì các phát biểu (sự kiện) được
mô tả quá đơn giản, và giá trị của các phát biểu này là đúng, sai Trong khi đó tri thức của mỗi lĩnh vực thì phức tạp và mô tả trong tri thức là đa dạng
2.3.2 Biểu diễn tri thức dựa trên hệ luật dẫn
Một hệ luật dẫn được mô tả dưới dạng nếu <giả thiết> thì <kết luận> Đây là
dạng biểu diễn tri thức rất phổ biến Mô hình biểu diễn tri thức dạng này thường bao gồm: tập các ký hiệu mô tả các sự kiện (có cấu trúc đơn giản) và tập luật dẫn Trong
đó phần giả thiết và kết luận của luật là tập các sự kiện Mỗi sự kiện được mô tả có
cấu trúc đơn giản như (tên đối tượng – thuộc tính – giá trị) Ví dụ: quả cam – màu
vàng
Mô hình biểu diễn tri thức dạng này có những ưu diểm là dễ hiểu, dễ giải thích
vì các khái niệm được mô tả có cấu trúc tương đối đơn giản Có thể xây dựng cơ chế suy luận dễ dàng bằng cách áp dụng phương pháp suy diễn tiến hay lùi Ngoài
ra, các luật được biểu diễn theo mô hình này thường độc lập nhau nên việc cập nhật luật, hiệu chỉnh và bảo trì hệ thống thuận lợi Tuy nhiên, từ những đặc điểm trong các biểu diễn tri thức dạng này tạo nên ưu điểm thì nó cũng tạo ra các khuyết điểm sau: Chính vì các sự kiện có cấu trúc đơn giản, trong khi tri thức của một số lĩnh vực lại trừu tượng và phức tạp, các khái niệm của lĩnh vực có quan hệ ràng buộc lẫn nhau nên mô hình biểu diễn này không thể hiện được hết tất cả những yếu tố trừu tượng đó
2.3.3 Biểu diễn tri thức bằng Frame
Frame là một cấu trúc dữ liệu chứa đựng tất cả những tri thức liên quan đến một đối tượng cụ thể nào đó Frames có liên hệ chặt chẽ đến khái niệm hướng đối
tượng (thực ra Frame là nguồn gốc của lập trình hướng đối tượng) Ngược lại với
các phương pháp biểu diễn tri thức đã được đề cập đến, frame “đóng gói” toàn bộ một đối tượng, tình huống hoặc cả một vấn đề phức tạp thành một thực thể duy nhất
có cấu trúc Một frame bao hàm trong đó một khối lượng tương đối lớn tri thức về một đối tượng, sự kiện, vị trí, tình huống hoặc những yếu tố khác Do đó, frame có thể giúp ta mô tả khá chi tiết một đối tượng
Trang 28Dưới một khía cạnh nào đó, người ta có thể xem phương pháp biểu diễn tri thức bằng frame chính là nguồn gốc của ngôn ngữ lập trình hướng đối tượng Ý
tưởng của phương pháp này là “thay vì bắt người sử dụng các công cụ phụ như dao
mở để đồ hộp, ngày nay các hãng sản xuất đồ hộp thường gắn kèm các nắp mở đồ hộp ngay bên trên vỏ lon Như vậy, người dùng sẽ không bao giờ phải lo lắng đến việc tìm một thiết bị để mở đồ hộp nữa!” Cũng vậy, ý tưởng chính của frame (hay
của phương pháp lập trình hướng đối tượng) là khi biểu diễn một tri thức, ta sẽ “gắn kèm” những thao tác thường gặp trên tri thức này Chẳng hạn như khi mô tả khái niệm về hình chữ nhật, ta sẽ gắn kèm cách tính chu vi, diện tích
Frame thường được dùng để biểu diễn những tri thức “chuẩn” hoặc những tri thức được xây dựng dựa trên những kinh nghiệm hoặc các đặc điểm đã được hiểu biết cặn kẽ Bộ não của con người chúng ta vẫn luôn “lưu trữ” rất nhiều các tri thức chung mà khi cần, chúng ta có thể “lấy ra” để vận dụng nó trong những vấn đề cần phải giải quyết Frame là một công cụ thích hợp để biểu diễn những kiểu tri thức này
Cấu trúc của Frame: Mỗi một frame mô tả một đối tượng (object) Một frame
bao gồm 2 thành phần cơ bản là slot và facet Một slot là một thuộc tính đặc tả đối tượng được biểu diễn bằng frame Ví dụ: trong frame mô tả xe hơi, có hai slot là
trọng lượng và loại máy
Mỗi slot có thể chứa một hoặc nhiều facet Các facet (đôi lúc gọi là slot “con”) đặc tả một số thông tin hoặc thủ tục liên quan đến thuộc tính được mô tả bởi slot Facet có nhiều loại khác nhau, sau đây là một số facet thường gặp
– Value (giá trị): chi biết giá trị của thuộc tính đó (như xanh, đỏ, tím, vàng nếu
slot là màu xe)
– Dafault (giá trị mặc định): hệ thống sẽ tự động sử dụng giá trị trong facet
này nếu slot là rỗng (nghĩa là chẳng có đặc tả nào!) Chẳng hạn trong frame
về xe, xét slot về số lượng bánh Slot này sẽ có giá trị 4 Nghĩa là, mặc định một chiếc xe hơi sẽ có 4 bánh
– Range (miền giá trị): (tương tự như kiểu biến), cho biết giá trị slot có thể
nhận những loại giá trị gì (như số nguyên, số thực, chữ cái, )
Trang 29– If added: mô tả một hành động sẽ được thi hành khi một giá trị trong slot
được thêm vào (hoặc được hiệu chỉnh) Thủ tục thường là viết dưới dạng một script
– If needed: được sử dụng khi slot không có giá trị nào Facet mô tả một hàm
để tính ra giá trị của slot
Trong thực tế, một hệ thống trí tuệ nhân tạo thường sử dụng nhiều frame được liên kết với nhau theo một cách nào đó Một trong những điểm thú vị của frame là tính phân cấp Đặc tính này cho phép kế thừa các tính chất giữa các frame
Hình sau đây cho thấy cấu trúc phân cấp của các loại hình học cơ bản Gốc của cây ở trên cùng tương ứng với mức độ trừu tượng cao nhất Các frame nằm ở dưới cùng (không có frame con nào) gọi là lá Những frame nằm ở mức thấp hơn có thể thừa kế tất cả những tính chất của những frame cao hơn
Các frame cha sẽ cung cấp những mô tả tổng quát về thực thể Frame có cấp càng cao thì mức độ tổng quát càng cao Thông thường, frame cha sẽ bao gồm các định nghĩa của các thuộc tính Còn các frame con sẽ chứa đựng giá trị thực sự của các thuộc tính này
Hình 2.5 Quan hệ giữa các đối tượng hình học phẳng [11]
Trang 302.3.4 Biểu diễn tri thức dựa trên mạng ngữ nghĩa
Mạng ngữ nghĩa được đề cập trong [6] có dạng một đồ thị, trong đó nút là các khái niệm hay đối tượng, cung là quan hệ giữa các đối tượng hay khái niệm
Dựa vào mạng ngữ nghĩa ta nhận biết tri thức một cách trực quan giúp thiết kế các xử lý như: thêm bớt các khái niệm / đối tượng, tìm kiếm thông tin
Hình 2.6 Mạng ngữ nghĩa mô tả tri thức về xe [30]
Cơ chế thực hiện theo thuật toán “loang” như sau:
– Bước 1: Kích hoạt các nút ứng với giả thiết cho ban đầu (những yếu tố đã có giá
trị)
– Bước 2: Lặp lại bước sau cho đến khi kích hoạt tất cả các đỉnh ứng với các yếu
tố cần tính (thành công) hoặc không thể kích hoạt được bất kỳ đỉnh nào nữa (thất bại)
Mô hình mạng ngữ nghĩa rất linh động, ta dễ dàng thêm các đỉnh hoặc cung để
bổ sung thêm tri thức Cách biểu diễn tri thức dạng đồ thị nên rất dễ hiểu Ngoài ra
so với cách biểu diễn này giữa các đỉnh còn thể hiện mối quan hệ “kế thừa” nếu thông qua quan hệ “là” Cùng với những ưu điểm trên thì cách biểu diễn này khá trừu tượng và khái quát, trong áp dụng phải phát triển các mô hình tri thức cụ thể hơn
Các mô hình biểu diễn tri thức theo mạng ngữ nghĩa: [11]
Mạng tính toán: Là một dạng biểu diễn tri thức về các vấn đề tính toán và
được áp dụng một cách có hiệu quả để giải quyết một số dạng bài toán Mỗi mạng
Trang 31tính toán là một mạng ngữ nghĩa chứa các biến và những quan hệ có thể cài đặt sử dụng cho việc tính toán Mạng tính toán gồm tập M và f
M: tập các biến trong miền giá trị số thực
f: tập các quan hệ giữa các biến
M = {x1,x2, xn},
F = {f1,f2, fn}
Đối với mỗi f F, ta ký hiệu M(f) là tập các biến có liên hệ trong quan hệ f và M(f) là tập con của M: M(f) M Nếu viết f dưới dạng f: u(f) → v(f) thì ta có M(f) = u(f) v(f)
Từ mô hình này theo tác giả Đỗ Văn Nhơn thì sẽ cần giải quyết các vấn đề: Cho trước tập A M và B tập các biến bất kỳ Có thể xác định B từ tập A nhờ các quan hệ trong F hay không?
Nếu xác định được tập B thì quá trình tính toán các biến của B được thực hiện như thế nào?
Trong trường hợp không tìm được B thì cần bổ sung thêm điều kiện gì để
có thể tìm được B
Mạng tính toán cho ta thấy được cấu trúc nội bộ bên trong của một mạng Nhưng nếu xét trên bài toán có nhiều mạng tính toán thì mô hình này chưa thể hiện một cách đầy đủ các quan hệ liên kết giữa các mạng tính toán này
M là tập hợp những biến được xem xét trên mạng, kể cả các biến thuộc tập M(fi)
Trang 322.3.6 Biểu diễn tri thức dựa trên mô hình COKB
Theo lý thuyết mô hình COKB ( Computational Object Knowledge Base) của tác giả Đỗ Văn Nhơn đƣợc đề cập trong [11] Mô hình này gồm 6 thành phần sau:
M = (C, H , R, Ops, Funcs, Rules)
Trong đó:
(1) C là tập hợp các khái niệm về C_Object
(2) H là tập hợp các quan hệ phân cấp giữa các loại đối tƣợng
(3) R là tập hợp các khái niệm về các loại quan hệ trên C_Object
Tập hợp C (các khái niệm về các C_Object):
Các khái niệm đƣợc xây dựng dựa trên các đối tƣợng Mỗi khái niệm là một lớp các đối tƣợng tính toán có cấu trúc nhất định và đƣợc phân cấp theo sự thiết lập của cấu trúc đối tƣợng, bao gồm:
Các đối tượng (hay khái niệm) nền: là các đối tƣợng (hay khái niệm) đƣợc
mặc nhiên thừa nhận Ví dụ: nhƣ một số đối tƣợng kiểu boolean (logic), số tự nhiên (natural), số nguyên (integer), số thực (real), tập hợp (set), danh sách (list) hay một số kiểu tự định nghĩa
Trang 33Các đối tượng cơ bản (hay khái niệm) cơ bản cấp 0: có cấu trúc rỗng hoặc
có cấu trúc thiết lập trên một số thuộc tính kiểu khái niệm nền: Các đối tượng (hay khái niệm) này làm nền cho các đối tượng (hay các khái niệm) cấp cao hơn Ví dụ: đối tượng DIEM có kiểu mô tả không có cấu trúc thiết lập
Các đối tượng (hay khái niệm) cấp 1: Các đối tượng này chỉ có các thuộc
tính kiểu khái niệm nền và có thể được thiết lập trên một danh sách nền các đối tượng cơ bản Ví dụ: đối tượng DOAN[A,B] trong đó A, B là các đối tượng cơ bản loại DIEM, thuộc tính a biểu thị độ dài đoạn thẳng có kiểu tương ứng là “real”
Các đối tượng (hay khái niệm) cấp 2: Các đối tượng này có các thuộc tính
kiểu khái niệm nền và các thuộc tính loại đối tượng cấp 1, có thể được thiết lập trên một danh sách nền các đối tượng cơ bản Ví dụ: đối tượng TAMGIAC[A,B,C] trong đó A, B, C là các đối tượng cơ bản loại DIEM, các thuộc tính như GocA, a, S có kiểu tương ứng là “GOC[C,A,B]”,
“DOAN[B,C]”, “real”
Các đối tượng (hay khái niệm) cấp n >0: Các đối tượng này có các thuộc
tính kiểu khái niệm nền và các thuộc tính loại đối tượng cấp thấp hơn, có thể được thiết lập trên một danh sách nền các đối tượng cấp thấp hơn
Cấu trúc bên trong của mỗi lớp đối tượng:
(1) Kiểu đối tượng: Kiểu này có thể là kiểu thiết lập trên một danh sách nền các
đối tượng cấp thấp hơn
(2) Danh sách các thuộc tính của đối tượng: Mỗi thuộc tính có kiểu thực, kiểu
đối tượng cơ bản hay kiểu đối tượng cấp thấp hơn Phân ra làm 2 loại là tập các thuộc tính thiết lập của đối tượng và tập các thuộc tính khác (còn gọi là tập thuộc tính)
(3) Tập hợp các điều kiện ràng buộc trên các thuộc tính
(4) Tập hợp các tính chất nội tại hay sự kiện vốn có liên quan đến các thuộc tính của đối tượng
(5) Tập hợp các quan hệ suy diễn - tính toán trên các thuộc tính của đối tượng Các quan hệ này thể hiện các luật suy diễn và cho phép ta có thể tính toán một hay một số thuộc tính từ các thuộc tính khác của đối tượng
Trang 34(6) Tập hợp các luật suy diễn trên các loại sự kiện khác nhau liên quan đến các thuộc tính của đối tƣợng hay bản thân đối tƣợng Mỗi luật suy diễn có dạng:
{các sự kiện giả thiết} {các sự kiện kết luận}
Mô hình cho một đối tượng tính toán (C-Object)
Một C-Object có thể đƣợc mô hình hóa bởi một bộ 6 thành phần chính:
(BasicO,Attrs, CRela, Rules, Prop,Cons)
Trong đó:
- BasicO: là tập hợp các đối tƣợng nền của một đối tƣợng
- Attrs: là tập hợp các thuộc tính của đối tƣợng
- CRela: là tập hợp các quan hệ suy diễn tính toán
- Rules: là tập hợp các luật suy diễn trên các sự kiện liên quan đến các thuộc tính
cũng nhƣ liên quan đến bản thân đối tƣợng
- Prop: là tập hợp các tính chất hay sự kiện vốn có của đối tƣợng
- Cons: là tập hợp các điều kiện ràng buộc
Tập hợp H (các quan hệ phân cấp giữa các đối tượng)
Trong tập C, ta có các quan hệ mà theo đó có thể có những khái niệm là sự đặc biệt hoá của những khái niệm khác Có thể nói, H là một biểu đồ Hasse trên C khi xem quan hệ phân cấp là một quan hệ thứ tự trên C
Cấu trúc của một quan hệ phân cấp:
[<tên lớp đối tƣợng cấp cao>, <tên lớp đối tƣợng cấp thấp> ]
Tập hợp R các khái niệm về các loại quan hệ trên các C-Object
Mỗi quan hệ đƣợc xác định bởi tên quan hệ và danh sách các loại đối tƣợng của quan hệ Đối với quan hệ 2 hay 3 ngôi thì quan hệ có thể có các tính chất nhƣ tính phản xạ, tính phản xứng, tính đối xứng và tính bắc cầu
Cấu trúc của một quan hệ:
[ < tên quan hệ > , < loại đối tƣợng > , < loại đối tƣợng > ,…] , {< tính chất > , <
tính chất >}
Tập hợp Opts các toán tử
Các toán tử thể hiện các qui tắc tính toán nhất định trên các biến thực cũng nhƣ trên các đối tƣợng Chẳng hạn nhƣ các phép toán số học, các phép tính toán
Trang 35trên các đối tượng đoạn, góc tương tự như đối với các biến thực hay các phép tính toán vectơ, tính toán ma trận,… Trong trường hợp các phép toán 2 ngôi thì phép toán có thể có các tính chất như tính giao hoán, tính kết hợp, tính nghịch đảo, tính trung hòa
Tập hợp Funcs các hàm
Tập hợp Funcs trong mô hình COKB thể hiện tri thức về các hàm hay nói cách khác là thể hiện tri thức về các khái niệm và các qui tắc tính toán trên các biến thực cũng như trên các loại C-Object, được xây dựng thông qua các quan hệ tính toán dạng hàm Mỗi hàm được xác định bởi <tên hàm>, danh sách các đối số và một qui tắc định nghĩa hàm về phương diện toán học
Tập hợp Rules các luật
Mỗi luật cho ta một qui tắc suy luận để từ các sự kiện đang biết suy ra được các sự kiện mới thông qua việc áp dụng các định luật, định lý hay các qui tắc tính toán nào đó Mỗi luật suy diễn r có thể được mô hình hoá dưới dạng :
r : {sk 1 , sk 2 , , sk m } {sk m+1 , sk m+2 , , sk n }
Cấu trúc của một luật:
[ Kind, BasicO, Hypos, Goals]
Trong đó:
- Kind: loại luật
- BaseO: tập các đối tượng cơ bản
- Hypos: tập các sự kiện giả thiết của một luật
- Goals: tập các sự kiện kết luận của một luật
Ngoài ra, mô hình này có 11 loại sự kiện sau:
Sự kiện loại 1: Sự kiện thông tin loại của đối tượng
Sự kiện loại 2: sự kiện về tính xác định của một đối tượng hay của một thuộc
tính của đối tượng
Sự kiện loại 3: Sự kiện về tính xác định của một đối tượng hay của một thuộc
tính của đối tượng thông qua biểu thức hằng
Trang 36Sự kiện loại 4: Sự kiện về sự bằng nhau của một đối tượng hay một thuộc
tính của đối tượng với một đối tượng hay một thuộc tính khác
Sự kiện loại 5: Sự kiện về sự phụ thuộc giữa các đối tượng và các thuộc tính
của các đối tượng thông qua một công thức tính toán hay một đẳng thức theo các đối tượng hay các thuộc tính
Sự kiện loại 6: Sự kiện về một quan hệ trên các đối tượng hay trên các thuộc
tính của các đối tượng
Sự kiện loại 7: Sự kiện về tính xác định của một hàm
Sự kiện loại 8: Sự kiện về tính xác định của một hàm thông qua một biểu
thức hằng
Sự kiện loại 9: Sự kiện về sự bằng nhau giữa một đối tượng với một hàm
Sự kiện loại 10: Sự kiện về sự bằng nhau giữa một hàm với một hàm khác
Sự kiện loại 11: Sự kiện về sự phụ thuộc của một hàm theo các hàm hay các
đối tượng khác thông qua một công thức tính toán
Mô hình biểu diễn này sử dụng các tiếp cận hướng đối tượng để biểu diễn tri thức
do đó rất dễ thiết kế các mô hình cho những ứng dụng cụ thể và thiết kế các giải thuật
2.4 ĐỘNG CƠ SUY DIỄN
Các cơ sở tri thức đều có động cơ suy diễn để tiến hành các suy diễn nhằm tạo
ra các tri thức mới dựa trên các sự kiện, tri thức cung cấp từ ngoài vào và tri thức có sẵn trong hệ cơ sở tri thức
Động cơ suy diễn thay đổi theo độ phức tạp của cơ sở tri thức Các hệ cơ sở tri thức làm việc theo cách được điều khiển bởi dữ liệu (data driven) sẽ dựa vào thông tin có sẵn (các sự kiện cho trước) và tạo ra các sự kiện mới được suy diễn
Có hai kĩ thuật thường được sử dụng trong hệ chuyên gia đó là suy diễn tiến
và suy diễn lùi Cả hai kĩ thuật này đều dựa trên suy diễn logic [13]
Modus ponens (MP): các luật suy diễn đơn giản gọi là “modus ponens”
Nghĩa là nếu A đúng và A → B đúng thì B cũng đúng
Trang 37Modus Tollens (MT):
Nghĩa là nếu B sai và A → B đúng thì A cũng sai
Nói một cách khác A, B, , là các sự kiện trước khi áp dụng luật A → B
ta có tập {A} ( hoặc { } tương ứng) thì sau khi thực hiện luật ta sẽ có thêm {B} (hoặc { } tương ứng)
Dựa trên các tập kéo theo tức là các luật, và các dữ liệu ban đầu, luật modus ponens tạo nên một dãy các khẳng định Quá trình suy diễn được tiến hành nhờ một dãy các thông tin đã được khẳng định Loại suy diễn này là cơ sở của suy diễn dữ liệu hay của hệ chuyên gia suy diễn tiến
2.4.1 Suy diễn tiến
Suy diễn tiến là loại suy diễn thường được sử dụng trong hệ chuyên gia có tìm kiếm dữ liệu
Quá trình giải đối với vài vấn đề bắt đầu bằng việc thu thập thông tin Thông tin này được suy diễn để đưa ra kết luận Điều này cũng như bác sĩ bắt đầu chẩn đoán bằng một loạt các câu hỏi về triệu chứng của bệnh nhân
Chiến lược suy diễn bắt đầu bằng tập sự kiện đã biết, rút ra các sự kiện mới nhờ dùng luật mà phần giả thiết khớp với sự kiện đã biết, và tiếp tục quá trình này cho đến khi thấy trạng thái đích, hoặc cho đến khi không còn luật nào khớp được các sự kiện đã biết hay được sự kiện suy diễn Ứng dụng đơn giản nhất của hệ thống suy diễn tiến hoạt động như sau: [11]
Bước 1: Khởi tạo bộ nhớ
Lấy các thông tin về bài toán từ người sử dụng và đặt chúng vào bộ nhớ làm việc
Bước 2: Lặp để tìm luật và cho vào bộ nhớ
– Suy diễn quét các luật theo dãy xác định trước
– Xem phần giả thiết có trùng khớp với nội dung trong bộ nhớ?
– Nếu phát hiện một luật như mô tả trên, bổ sung kết luận của luật này vào bộ nhớ
Trang 38– Tiếp tục quá trình, có thể bỏ qua các luật đã chạy
– Quá trình tiếp tục cho đến khi không còn khớp được luật nào Lúc này bộ nhớ có các thông tin của người dùng và thông tin do hệ thống suy diễn
Ví dụ: Giả sử có một bệnh nhân đến thăm bệnh Bác sĩ dùng kiến thức y học và
thông tin do bệnh nhân khai để xem có bệnh gì hay không Mô hình chẩn đoán theo suy diễn tiến
2.4.2 Suy diễn lùi
Suy diễn lùi là chiến lược suy diễn để chứng minh một giả thiết bằng cách thu thập thông tin hỗ trợ
Hệ thống suy diễn lùi bắt đầu từ đích cần chứng minh [11]
Bước 1: Trước hết kiểm tra trong bộ nhớ làm việc để xem đích này đã được bổ sung
trước đó chưa Bước này cần thiết vì cơ sở tri thức khác có thể đã chứng minh đích này
Nếu đích chưa được chứng minh thì chuyển qua bước 2
Bước 2:
Tìm các luật có phần THEN chứa đích Luật này gọi là luật đích
Hệ thống xem phần giả thiết của luật này có trong bộ nhớ làm việc không? Các giả thiết không được liệt kê trong bộ nhớ gọi là các đích mới, hoặc đích con, cần được chứng minh Các đích con này được cung cấp, tức giải, nhờ các luật khác Quá trình này tiếp tục đệ qui cho đến khi hệ thống tìm thấy
một giả thiết không được luật nào cung cấp Đó là một “sơ khởi” Sơ khởi là
giả thiết của một luật mà không do luật nào kết luận Khi thấy sơ khởi hệ thống yêu cầu người sử dụng các thông tin về nó Hệ thống dùng các thông tin này để giải đích con và đích ban đầu Suy diễn lùi thực hiện tương tự như cách con người kiểm tra một giả thiết có đúng không
Ví dụ: Giả sử sau khi tiếp chuyện bệnh nhân, bác sĩ nghĩ rằng người bệnh viêm
họng Công việc của ông ta là chứng tỏ khẳng định này Thủ tục chẩn đoán được
mô hình hóa bằng hệ chuyên gia suy diễn lùi
2.4.3 Ưu nhược điểm của các kỹ thuật suy diễn
Trang 39Suy diễn tiến và suy diễn lùi là hai kỹ thuật suy diễn cơ bản trong hệ chuyên gia Việc phân tích ưu nhược điểm của từng loại kỹ thuật nhằm sử dụng chúng phù hợp trong các ứng dụng [11]
Suy diễn tiến:
Ưu điểm:
- Làm việc tốt khi bài toán về bản chất là đi thu thập thông tin thấy cần suy
diễn
- Suy diễn tiến cho ra khối lượng lớn các thông tin từ một số thông tin ban
đầu Nó sinh ra nhiều thông tin mới Suy diễn tiến là tiếp cận lý tưởng đối với loại bài toán cần giải quyết các nhiệm vụ như chẩn đoán bệnh trong y khoa, lập kế hoạch, điều hành điều khiển và diễn dịch
Nhược điểm:
- Không cảm nhận được rằng chỉ một vài thông tin là quan trọng Hệ thống hỏi
các câu hỏi có thể hỏi mà không biết rằng chỉ một ít câu đã đi đến kết luận được
- Hệ thống có thể hỏi cả câu không liên quan Có thể các câu trả lời cũng quan
trọng, nhưng làm người dùng lúng túng khi phải trả lời các câu không dính đến chủ đề
Suy diễn lùi:
Ưu điểm:
– Phù hợp với bài toán đưa ra giả thiết rồi xem hiệu quả giả thiết đó đúng không
– Suy diễn lùi tập trung vào đích đã cho
– Tạo ra một loạt câu hỏi chỉ liên quan đến vấn đề đang xét
– Khi suy diễn lùi muốn suy diễn cái gì đó từ các thông tin đã biết, nó chỉ tìm trên một phần của cơ sở tri thức thích đáng đối với bài toán đang xét
– Nhược điểm:
Thường tiếp theo dòng suy diễn, thay vì đúng ra phải đúng ở đó mà sang nhánh khác Tuy nhiên có thể dùng nhân tố tin cậy và các luật hỗ trợ để khắc phục
Trang 40CHƯƠNG 3 BIỂU DIỄN TRI THỨC CHUYÊN GIA
Biểu diễn tri thức đóng vai trò quan trong trong việc giải quyết và xử lý tri thức về bệnh ung thư tế bào gan Việc vận dụng mô hình COKB để biểu diễn và thiết kế tri thức đã cải tiến thành mô hình Sub_COKB_Adapt Mô hình Sub_COKB_Adapt giúp biểu diễn tri thức chẩn đoán các triệu chứng về bệnh ung thư gan một cách đầy đủ, rõ ràng và chính xác
3.1 TRI THỨC VỀ BỆNH UNG THƯ TẾ BÀO GAN
Ung thư tế bào gan (UTTBG) là bệnh lý ác tính, phát sinh từ tế bào gan, là loại hay gặp nhất chiếm hơn 90% trong các u biểu mô ác tính ở gan Ung thư tế bào gan
là một quá trình nhiều giai đoạn có thể kéo dài trong nhiều thập kỷ, liên quan đến việc xơ gan và thay đổi gen khác nhau, cuối cùng dẫn đến biến đổi ác tính của tế bào gan Các yếu tố ngoại sinh như: Viêm gan siêu vi B, Viêm gan siêu vi C, aflatoxin, rượu, hóa chất độc hại khác là các yếu tố nguy cơ quan trọng nhất [8], [31]
Viêm gan siêu vi B
Kháng nguyên bề mặt của virus viêm gan siêu vi B (HBsAg) là chỉ điểm quan trọng của nhiễm viêm gan siêu vi B mãn tính, các nghiên cứu dịch tễ học đã định ra yếu tố gây ung thư tế bào gan quan trọng ở bệnh nhân nhiễm loại viên gan siêu vi này, các kết quả trên đã được tổng kết bởi cơ quan quốc tế về ung thư của tổ chức Y
tế thế giới (WHO) [28] Liên quan giữa HBV và UTTBG là không giới hạn ở người
có HBsAg dương tính, các nghiên cứu khác chỉ ra rằng một số bệnh nhân có kháng thể lõi của viêm gan siêu vi B dương tính kèm HBsAg âm tính vẫn tiếp tục có nguy
cơ phát triển ung thư tế bào gan [33]
Viêm gan siêu vi C
Vai trò quan trọng của HCV trong sự phát triển của UTTBG, kháng thể kháng HCV (anti-HCV) được tìm thấy ở hơn 90% bệnh nhân UTTBG Khoảng 60-80% bệnh nhân UTTBG có HCV dương tính được tìm thấy có xơ gan [28] Hầu hết sự