các hệ thống thông tin thông minh đề tàixây dựng hệ chuyên gia dự đoán về bệnh cúm

46 0 0
các hệ thống thông tin thông minh đề tàixây dựng hệ chuyên gia dự đoán về bệnh cúm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Việc chữa trị kịp thời sẽ giảm thiểu những rủi ro này và tránh được những biến chứng nghiêm trọng có thể xảy ra.Xây dựng một hệ thống chuyên gia dự đoán bệnh cúm sẽ thu thập dữ liệu từ c

Trang 1

-*** -CÁC HỆ THỐNG THÔNG TIN THÔNG MINH

ĐỀ TÀI:XÂY DỰNG HỆ CHUYÊN GIA DỰ ĐOÁN VỀ BỆNH CÚM

Giảng viên hướng dẫn:Nhóm thực thực hiện:

Mã lớp học phần:

TS.Vương Như Quỳnh

Lương Minh Tuấn-2121050300Mai Quang Anh—2121050988Nguyễn Thế Thắng-2121050250Nguyễn Gia Hào-2121050212

7080205 - 200

Hà Nội – 2024

Trang 2

MỤC LỤC

CHƯƠNG I:MÔ TẢ BÀI TOÁN 4

1.Mục tiêu của bài toán 4

2.Yêu cầu đặt ra của bài toán 4

3 Các nguồn tài liệu,dữ liệu, biểu mẫu 5

4.Phân tích đánh giá hiện trạng: 6

CHƯƠNG II : HỆ CHUYÊN GIA 7

1.Tổng quan về hệ chuyên gia 7

2.1:Phân biệt tri thức và dữ liệu 14

2.2:Đặc điểm biểu diễn tri thức 16

2.3:Các phương pháp biểu diễn tri thức 17

3.Cơ chế suy diễn 22

3.1.Suy diễn tiến 22

3.2.Suy diễn lùi 22

CHƯƠNG III:ỨNG DỤNG BÀI TOÁN DỰ ĐOÁN BỆNH CÚM DỰA VÀO TRIỆU CHỨNG 23

1 Thu thập tri thức 23

2.Biểu diễn tri thức 23

3.Suy diễn tiến 25

CHƯƠNG IV:CÀI ĐẶT VÀ THỬ CHẠY CHƯƠNG TRÌNH 26

1:Xây đựng chương trình 26

2:Các đoạn mã code của chương trình: 28

3.Đánh giá chương trình 42

KẾT LUẬN 44

Trang 3

MỞ ĐẦU

Trong thời gian gần đây, với sự tiến bộ không ngừng của công nghệ, các phương pháp dự đoán bệnh cúm đã được nghiên cứu và phát triển một cách đáng kể Những phương tiện này đòi hỏi sự tích hợp của dữ liệu khách quan như hình ảnh y tế, thông tin lâm sàng và di truyền để có thể dự đoán nguy cơ mắc bệnh cúm cũng như tiên lượng của bệnh.

Việt Nam, trong số các quốc gia, đang phải đối mặt với một tỷ lệ cao của việc mắc bệnh cúm Do đó, việc nghiên cứu và phát triển các phương pháp dự đoán bệnh cúm phù hợp với hoàn cảnh địa phương trở nên cực kỳ cần thiết Các phương pháp dự đoán bệnh cúm có thể đóng vai trò quan trọng trong việc nâng cao khả năng chẩn đoán và điều trị bệnh, từ đó giảm tỷ lệ tử vong do bệnh cúm tại Việt Nam.

Dự đoán bệnh cúm không chỉ giúp nâng cao hiệu quả của quá trình chẩn đoán và điều trị, mà còn giúp đưa ra biện pháp phòng tránh hiệu quả hơn Đặc biệt, số lượng người mắc bệnh cúm ngày càng tăng và có nhiều biến chứng phức tạp, đặc biệt là vào những mùa đông, mùa mưa và trong những thời điểm có sự thay đổi về thời tiết Việc chữa trị kịp thời sẽ giảm thiểu những rủi ro này và tránh được những biến chứng nghiêm trọng có thể xảy ra.

Xây dựng một hệ thống chuyên gia dự đoán bệnh cúm sẽ thu thập dữ liệu từ các chuyên gia trong lĩnh vực y tế cúm cũng như từ thông tin về triệu chứng từ người dùng Thông qua việc phân tích và xử lý dữ liệu, hệ thống này sẽ cung cấp các dự đoán và khuyến nghị điều trị phù hợp, giúp người dùng có thể tự tin hơn trong việc đối phó với bệnh tình.

Trang 4

Chương I:Mô tả bài toán1.Mục tiêu của bài toán

Mục tiêu chính của dự án này là phát triển một hệ chuyên gia có khả năng dự đoán bệnh cúm dựa trên thông tin được cung cấp bởi những người có các triệu chứng nghi nhiễm bệnh Hệ thống này sẽ tự động phân tích và so sánh các triệu chứng này với cơ sở dữ liệu và các quy tắc đã được xây dựng trước đó để đưa ra dự đoán về việc liệu người đó có bị nhiễm bệnh cúm hay không, và nếu có, thì loại bệnh cúm đó là gì.

Bài toán này nhằm mục đích giúp những người có các triệu chứng đáng ngờ về bệnh cúm có thể tự tin hơn trong việc đưa ra quyết định về việc điều trị và quản lý bệnh, từ đó giảm thiểu các rủi ro và tác động tiêu cực của bệnh.

2.Yêu cầu đặt ra của bài toán

Yêu cầu về dữ liệu:Dữ liệu là yếu tố quan trọng nhất trong việc xây dựng hệ chuyên gia dự đoán bệnh cúm Dữ liệu cần đáp ứng các yêu cầu :

 Đầy đủ: Dữ liệu cần bao gồm đầy đủ các thông tin cần thiết để xây dựng hệ thống, bao gồm thông tin lâm sàng, thông tin hình ảnh y tế, thông tin

 Thu thập dữ liệu: Hệ thống cần có khả năng thu thập dữ liệu từ các nguồn khác nhau, bao gồm dữ liệu lâm sàng, dữ liệu hình ảnh y tế, dữ liệu di truyền,

 Xử lý dữ liệu: Hệ thống cần có khả năng xử lý dữ liệu một cách hiệu quả, bao gồm các bước tiền xử lý, phân tích dữ liệu, và xây dựng mô hình dự đoán.

 Dự đoán bệnh cúm: Hệ thống cần có khả năng dự đoán nguy cơ mắc bệnh cúm hoặc diễn biến của bệnh cúm.

Yêu cầu về quy trình xử lý:Quy trình xử lý của hệ chuyên gia dự đoán bệnh

Trang 5

 Thu thập dữ liệu: Hệ thống thu thập dữ liệu từ các nguồn khác nhau, bao gồm dữ liệu lâm sàng, dữ liệu hình ảnh y tế, dữ liệu di truyền,  Xử lý dữ liệu: Hệ thống xử lý dữ liệu một cách hiệu quả, bao gồm các

bước tiền xử lý, phân tích dữ liệu, và xây dựng mô hình dự đoán  Dự đoán bệnh cúm: Hệ thống sử dụng mô hình dự đoán đã xây dựng

để dự đoán nguy cơ mắc bệnh cúm hoặc diễn biến của bệnh cúm Yêu cầu về chất lượng hệ thống:Hệ chuyên gia dự đoán bệnh cúm cần đạt được các yêu cầu về chất lượng sau:

 Độ chính xác: Hệ thống cần có độ chính xác cao trong việc dự

3 Các nguồn tài liệu,dữ liệu, biểu mẫu

Các nguồn tài liệu liên quan đến bài toán xây dựng hệ chuyên gia dự đoán bệnh cúm bao gồm:

 Tài liệu khoa học về bệnh cúm: Các tài liệu này cung cấp kiến thức về nguyên nhân, triệu chứng, cách lây truyền, cách phòng ngừa và điều trị bệnh cúm.

 Tài liệu về hệ chuyên gia: Các tài liệu này cung cấp kiến thức về khái niệm, cấu trúc, nguyên lý hoạt động, các phương pháp xây dựng và đánh giá hệ chuyên gia.

 Tài liệu về các phương pháp dự đoán bệnh cúm: Các tài liệu này cung cấp kiến thức về các phương pháp dự đoán bệnh cúm, bao gồm các phương pháp thống kê, mô hình hóa, học máy.

Dữ liệu là yếu tố quan trọng nhất trong việc xây dựng hệ chuyên gia dự đoán bệnh cúm Dữ liệu cần đáp ứng các yêu cầu sau:

 Đầy đủ: Dữ liệu cần bao gồm đầy đủ các thông tin liên quan đến bệnh cúm, bao gồm các thông tin về thời gian, địa điểm, số lượng ca mắc bệnh, các triệu chứng, v.v.

 Chất lượng: Dữ liệu cần có chất lượng tốt, chính xác và tin cậy  Được cập nhật thường xuyên: Dữ liệu cần được cập nhật thường

xuyên để đảm bảo tính cập nhật của hệ chuyên gia.

 Dữ liệu từ các cơ quan y tế: Các cơ quan y tế thường thu thập và

Trang 6

 Dữ liệu từ các trang web, ứng dụng theo dõi dịch bệnh: Các trang web, ứng dụng này thường thu thập dữ liệu về các ca mắc bệnh cúm từ các nguồn khác nhau, bao gồm cả các nguồn từ các cơ quan y tế  Dữ liệu từ các mạng xã hội: Các mạng xã hội có thể cung cấp dữ

liệu về các triệu chứng của bệnh cúm từ người dùng.

Một số mẫu biểu có thể sử dụng trong quá trình xây dựng hệ chuyên gia dự đoán bệnh cúm bao gồm:

 Mẫu biểu thu thập dữ liệu: Mẫu biểu này được sử dụng để thu thập dữ liệu từ các nguồn khác nhau.

 Mẫu biểu phân tích dữ liệu: Mẫu biểu này được sử dụng để phân tích dữ liệu thu thập được.

 Mẫu biểu thiết kế hệ chuyên gia: Mẫu biểu này được sử dụng để thiết kế hệ chuyên gia.

 Mẫu biểu thu thập dữ liệu về các ca mắc bệnh cúm: Mẫu biểu này bao gồm các thông tin về thời gian, địa điểm, số lượng ca mắc bệnh, các triệu chứng, v.v.

 Mẫu biểu phân tích dữ liệu về bệnh cúm: Mẫu biểu này bao gồm các thông tin về tần suất mắc bệnh, xu hướng mắc bệnh, các yếu tố ảnh hưởng đến bệnh cúm, v.v.

 Mẫu biểu thiết kế hệ chuyên gia dự đoán bệnh cúm: Mẫu biểu này bao gồm các thông tin về các yếu tố đầu vào, các quy tắc suy luận, các kết quả đầu ra của hệ chuyên gia.

4.Phân tích đánh giá hiện trạng:

Hiện nay, trên thế giới đã có nhiều nghiên cứu về xây dựng hệ chuyên gia dự đoán bệnh cúm Các hệ chuyên gia này thường sử dụng các phương pháp thống kê, mô hình hóa, học máy, v.v để dự đoán xu hướng mắc bệnh cúm trong tương lai.

Mặc dù đã có nhiều nghiên cứu về xây dựng hệ chuyên gia dự đoán bệnh cúm, nhưng vẫn còn một số vấn đề còn tồn tại:

 Tính chính xác của các hệ chuyên gia: Tính chính xác của các hệ chuyên gia dự đoán bệnh cúm phụ thuộc vào nhiều yếu tố, bao gồm chất lượng dữ liệu, phương pháp dự đoán được sử dụng, v.v Tuy nhiên, các hệ chuyên gia hiện nay vẫn chưa có độ chính xác cao, đặc biệt là trong trường hợp xuất hiện các chủng virus cúm mới.

 Khả năng dự đoán trong thời gian ngắn: Các hệ chuyên gia dự đoán bệnh cúm hiện nay thường chỉ có thể dự đoán xu hướng mắc bệnh cúm trong thời gian dài, chẳng hạn như 6 tháng, 3 tháng, hoặc 1 tuần Việc

Trang 7

cần thiết để có thể đưa ra các biện pháp phòng ngừa và kiểm soát hiệu quả.

 Khả năng dự đoán trên phạm vi toàn cầu: Các hệ chuyên gia dự đoán bệnh cúm hiện nay thường chỉ được xây dựng cho một khu vực cụ thể, chẳng hạn như một quốc gia hoặc một khu vực địa lý Việc xây dựng các hệ chuyên gia dự đoán bệnh cúm trên phạm vi toàn cầu là rất cần thiết để có thể dự đoán xu hướng mắc bệnh cúm trên toàn thế giới Để giải quyết những vấn đề còn tồn tại nêu trên, các nghiên cứu về xây dựng hệ chuyên gia dự đoán bệnh cúm cần tập trung vào các vấn đề sau:

 Nâng cao độ chính xác của các hệ chuyên gia: Cần nghiên cứu các phương pháp dự đoán mới, có độ chính xác cao hơn, đặc biệt là trong trường hợp xuất hiện các chủng virus cúm mới.

 Mở rộng khả năng dự đoán trong thời gian ngắn: Cần nghiên cứu các phương pháp dự đoán mới, có thể dự đoán trong thời gian ngắn, chẳng hạn như trong vòng 24 giờ.

 Mở rộng khả năng dự đoán trên phạm vi toàn cầu: Cần nghiên cứu các phương pháp dự đoán mới, có thể dự đoán xu hướng mắc bệnh cúm trên phạm vi toàn cầu.

 Tăng cường khả năng cập nhật dữ liệu của các hệ chuyên gia: Dữ liệu là yếu tố quan trọng nhất trong việc xây dựng hệ chuyên gia dự đoán bệnh cúm Do đó, cần tăng cường khả năng cập nhật dữ liệu của các hệ chuyên gia để đảm bảo tính cập nhật của các dự đoán.

 Tăng cường khả năng giao tiếp của các hệ chuyên gia: Các hệ chuyên gia dự đoán bệnh cúm cần có khả năng giao tiếp hiệu quả với người dùng để người dùng có thể hiểu và sử dụng các dự đoán một cách hiệu quả.

CHƯƠNG II : HỆ CHUYÊN GIA1.Tổng quan về hệ chuyên gia

1.1: Hệ chuyên gia là gì?

Hệ chuyên gia(Expert System) là một chương trình máy tính thông minh sử dụng tri thức (knowledge) và các thủ tục suy luận (inference procedures) để giải quyết các bài toán tương đối khó khăn đòi hỏi những chuyên gia mới có thể giải được.Hay nói cách khác hệ chuyên gia sẽ dựa trên những chi thức của những người giỏi nhất về lĩnh vực cần quan tâm.

Trang 8

Hệ chuyên gia là một hệ thống tin học có thể thông tin có thể mô phỏng (emulates),năng lực quyết đoán (decision) và hành động (making abilily) của một chuyên gia (con người chuyên sâu về lĩnh vực đó).Hệ chuyên gia là một trong những ứng dụng của trí tuệ nhân tạo.

Hệ chuyên gia sử dụng tất cả các tri thức của những chuyên gia để giải quyết vấn đề bài toán khác nhau thuộc mọi lĩnh vực.

Tri thức (knowledge) trong hệ chuyên gia phản ánh sự tỉnh thông được tích tụ từ sách vớ, tạp chí, từ các chuyên gia hay các nhà bác học Bao gồm các sự kiện và các luật Các sự kiện được cấu thành bởi một số nhiều các thông tin, được thu thập rộng rãi, công khai và được sự đồng tình của các chuyên gia con người trong lĩnh vực Các luật biểu thị sự quyết đoán chuyên môn của các chuyên gia trong lĩnh vực Các thuật ngữ hệ chuyên gia, hệ thống dựa trên tri thức (knowledge-based system) hay hệ chuyên gia dựa trên tri thức (knowledge-based expert system)

Mức độ hiệu quả của một hệ chuyên gia phụ thuộc vào kích thước và chất lượng của cơ sở tri thức mà hệ chuyên gia đó có được.

Một hệ chuyên gia chỉ chuyên sâu về một lĩnh vực hoặc một vấn đề cụ thể duy nhất, như y học, tài chính, khoa học ,công nghệ,… mà không phải là cho bất cứ một lĩnh vực vấn đề nào

Một hệ chuyên gia gồm ba thành phần chính là cơ sở tri thức (knowledge base), máy suy diễn hay môtơ suy diễn (inference engine), và hệ thống giao tiếp với người sử dụng (userinterface) Cơ sở tri thức chứa các tri thức để từ đó, máy suy diễn tạo ra câu trả lời cho người sử dụng qua hệ thống giao tiếp.

Trang 9

Người sử dụng (user) cung cấp sự kiện (facts) là những gì đã biết, đã có thật hay những thông tin có ích cho hệ chuyên gia, và nhận được những câu trả lời là những lời khuyên hay những gợi ý dùng dần (expertise).

Hoạt động của một hệ chuyên gia :

Ví dụ: hệ chuyên gia về lĩnh vực y học để dự đoán mắc bệnh tim mạch sẽ có rất nhiều cơ sở tri thức về một số triệu chứng đau ngực,lĩnh vực y học này cần bao gồm các thông tin về các loại triệu chứng đau tim, phân loại bệnh tim và các cách chữa trị theo từng loại bệnh cụ thể.

Tùy theo yêu cầu của người sử dụng mà có nhiều cách nhìn nhận khác nhau về hệ chuyên gia.

1.2:Đặc trưng

Có bốn đặc trưng cơ bản của một hệ chuyên gia :

 Hiệu quả cao (high performance) Khả năng trả lời với mức độ tỉnh thông bằng hoặc cao hơn so với chuyên gia (người) trong cùng lĩnh vực.

 Thời gian trả lời thoa đảng (adequate response time) Thời gian trả lới hợp lý, bằng hoặc nhanh hơn so với chuyên gia (người) để đi đến cùng một quyết định Hệ chuyển gia là một hệ thống thời gian thực (real time system).

 Độ tin cậy cao (good reliability) Không thể xảy ra sự cố hoặc giảm sút độ tin cậy khi sử dụng.

 Dễ hiểu (understandable) Hệ chuyên gia giải thích các bước suy luận một cách dễ hiểu và nhất quản, không giống như cách trả lời bí ẩn của các hộp đen (black box).

Trang 10

 Phổ cập (increased availability):Là sản phẩm chuyên gia, được phát triển không ngừng với hiệu quả sử dụng không thể phủ nhận.

 Giảm giá thành (reduced cost).

 Giảm rủi ro (reduced dangers): Giúp con người tránh được trong các môi trường rủi ro,nguy hiểm

 Tính thường trực (Permanance);Bất kể lúc nào cũng có thể khai thác sử dụng trong khi con người có thể mệt mỏi, nghỉ ngơi hay vắng mặt  Đa lĩnh vực (multiple expertise):Chuyên gia về nhiều lĩnh vực khác

nhau và được khai thác đồng thời bất kể thời gian sử dụng.

 Độ tin cậy (increased relialility) Luôn đảm bảo độ tin cậy khi khai thác Khả năng giảng giải (explanation) Câu trả lời với mức độ tinh thông được giảng giải rõ ràng chi tiết, dễ hiểu.

 Khả năng trả lời (fast reponse) Trả lời theo thời gian thực, khách quan.

 Tĩnh ổn định, suy luận có lý và đầy đủ mọi lúc mọi nơi (steady, une motional, and complete response at all times).

 Trợ giúp thông minh như một người hưỡng dẫn (intelligent -tutor)  Có thể truy cập như là một cơ sở dữ liệu thông minh (intelligent

1.3:Ứng dụng

Tính đến thơi điểm hiện nay đã có đến hàng trăm hệ chuyên gia đã được xây dựng và đã được báo cáo thường xuyên trong các tạp chí, sách, báo và hội thảo khoa học Ngoài ra còn các hệ chuyên gia được sử dụng trong các công ty, các tổ chức quân sự mà không được công bố vì lý do bảo mật

Một số lĩnh vực ứng dụng diện rộng của các hệ chuyên gia.

Cấu hình (Configuration) Tập hợp thích đáng những thành phần của một hệ thống theo một cách riêng Chẩn đoán(Diagnosis) Lập luận dựa trên những kinh nghiệm

thực tế và những điều quan sát được Truyền đạt(Instruction) Dạy học kiểu thông mình sao cho sinh

viên có thể hỏi tất cả các câu hỏi như vì sao (why?), như thế nào (how?) và cái

Trang 11

người thầy giáo, một người có chuyên môn về lĩnh vực đó

Giải thích(Interpretation) Giải thíchnhững dữ liệu thu nhận được Kiểm tra(Monitoring) So sánh dữ liệu thu lượm được với dữ

liệu chuyên môn để đánh giá độ hiệu quả

Lập kế hoạch(Planning) Lập kế hoạch sản xuất theo yêu cầu Dự đoán(Prognosis) Dự đoán hậu quả từ một tình huống xảy

Chữa trị(Remedy) Chỉ định cách giải quyết một vấn đề Điều khiển(Control) Điều khiển một quá trình, đòi hỏi diễn

giải, chẩnđoán, kiểmtra, lập kế hoạch, dự đoán và chữa trị

1.4.Kiến trúc tổng quát của hệ chuyên gia

Một hệ chuyên gia được thiết lập thường có 7 phần.

Trang 12

Giao diện người, máy : Thực hiện giao tiếp giữa hệ chuyên gia và người sử dụng Nhận các thông tin từ người dùng (các câu hỏi, các yêu cầu về lĩnh vực) và đưa ra các lời khuyên, các câu trả lời, các giải thích về lĩnh vực đó.

Bộ giải thích : Giải thích các hoạt động của hệ khi có yêu cầu của người sử dụng.

Bộ thu nạp tri thức : Làm nhiệm vụ thu nhận tri thức từ chuyên gia con người, từ kỹ sư tri thức và cả người sử dụng thông qua các câu hỏi và yêu cầu của họ, sau đó lưu trữ vào cơ sở tri thức.

Cơ sở tri thức : Lưu trữ, biểu diễn các tri thức trong lĩnh vực mà hệ đảm nhận, làm cơ sở cho các hoạt động của hệ Cơ sở tri thức bao gồm các khái niệm cơ bản, các sự kiện, các luật và quan hệ công chúng.Dùng để chứa đựng tri thức trong một lĩnh vực nào đó, tri thức này do chuyên gia con người chuyển giao.Ví dụ: Tri thức về bệnh nhiểm trùng máu phải do các bác sĩ chuyên ngành này chuyển giao

Trang 13

Mô tơ suy diễn : Là bộ sử lí cho tri thức, được mô tả sao cho giống với việc suy luận của chuyên gia con người Bộ xử lí này làm việc dựa trên thông tin mà người dùng mô tả về vấn đề , kết hợp với cơ sở tri thức để cho ra kết luận hay để đề nghị.Thông qua qua cơ sở tri thức để từ đó máy suy diễn tạo ra câu trả lời cho người sử dụng thông qua hệ thống giao tiếp.

Để thực hiện được các công việc của các thành phần trên trong cấu trúc hệ chuyên gia phải có một hệ điều khiển và quản lý việc tạo lập, tích lũy tri thức cho lĩnh vực hệ đảm nhận gọi là “Hệ quản trị cơ sở tri thức” Hệ quản trị cơ sở tri thức thực chất là quản lý và điều khiển công việc của Bộ thu nạp tri thức, Bộ giải thích, Mô tơ suy diễn Nó phải đảm bảo các yêu cầu :

 Giảm dư thừa tri thức, dữ liệu.

 Tính nhất quán và phi mâu thuẫn của tri thức  Tính toàn vẹn và an toàn.

 Giải quyết các vấn đề cạnh tranh  Chuyển đổi tri thức.

 Ngôn ngữ xử lý tri thức.

1.5.Một số cấu trúc mô hình a.Mô hình J.L Ermine

b)Mô hình C.Ernest :

Trang 14

c)Mô hình E.V.Popov :

2.Cơ sở tri thức

2.1:Phân biệt tri thức và dữ liệu

Cơ sở tri thức (knowledge base) là một tập hợp các thông tin có cấu trúc, được sử dụng để mô tả một lĩnh vực kiến thức cụ thể Cơ sở tri thức thường được lưu trữ dưới dạng các quy tắc, thực thể, mối quan hệ, và các kiến thức khác.

Trang 15

Dữ liệu (data) là tập hợp các thông tin thô, chưa được xử lý, chưa có ý nghĩa Dữ liệu có thể là số, văn bản, hình ảnh, âm thanh, hoặc bất kỳ dạng thông tin nào khác.

Sự khác biệt giữa cơ sở tri thức và dữ liệu:

 Khả năng tự giải thích nội dung : Dữ liệu đưa vào máy tính không tự giải thích nổi, đôi khi còn được mã hóa cho ngắn gọn để dễ cài đặt trong máy Chỉ có người lập trình đó mới có thể hiểu được nội dung, ý nghĩa của dữ liệu, nhưng tri thức có thể tự giải thích nội dung của mình với người sử dụng bất kỳ.

 Tính cấu trúc : Một trong những đặc tính cơ bản của hoạt động nhận thức của con người đối với thế giới xung quanh là khả năng phân tích cấu trúc của các đối tượng Tri thức được đưa vào máy cũng cần có khả năng tạo ra được một sự phân cấp giữa các khái niệm và mối quan hệ giữa chúng.

 Tính liên hệ : Ngoài các quan hệ về cấu trúc trong mỗi tri thức (khái niệm, quá trình, hiện tượng, sự kiện) giữa các đơn vị tri thức còn có nhiều mối liên hệ khác (không gian, thời gian, nhân quả…) Một số nghiên cứu đã chỉ ra số các liên hệ cơ bản giữa các sự kiện xấp xỉ 200 lần Một cơ sở tri thức được kết hợp với số liên hệ cơ bản này có thể mô tả và biểu diễn được hầu hết mọi vấn đề mà chúng ta quan tâm  Tính chủ động :

o Như chúng ta đã thấy, dữ liệu có vai trò bị động vì nó phụ thuộc vào sự khai thác của chương trình cụ thể.

o Trong xã hội loài người khi hoạt động bất kỳ ở đâu và ở trong lĩnh vực nào thì con người bao giờ cũng bị điều khiển bằng chính tri thức (vốn hiểu biết) của mình Nhờ có tri thức mà con người đã hình thành mục tiêu và các hành vi để thực hiện mục tiêu đó Quá trình này luôn đi kèm với sự bổ sung tri thức và

Trang 16

khắc phục sự mâu thuẫn giữa các tri thức để đi đến hoàn thiện dần cơ sở tri thức trong mỗi người.

o Đối với các tri thức biểu diễn trong máy cũng vậy, chúng chủ động hướng người sử dụng biết khai thác tri thức Đó chính là quá trình kích hoạt tri thức được thể hiện trong các hệ chuyên gia được xây dựng trên các cơ sở tri thức biểu diễn ở mức cao có khả năng tiếp nhận, tinh chế, tự hoàn thiện ngay trong quá trình hoạt động của hệ Tính chủ động của tri thức còn thể hiện sinh động thông qua các ngôn ngữ lập trình trí tuệ nhân tạo như Lisp, Prolog…ở đó không còn có sự phân biệt rõ ràng giữa dữ liệu và thủ tục.

 Mục đích: Cơ sở tri thức được sử dụng để mô tả một lĩnh vực kiến thức cụ thể, còn dữ liệu được sử dụng để lưu trữ thông tin thô.

 Cấu trúc: Cơ sở tri thức thường có cấu trúc rõ ràng, được tổ chức theo một mô hình nhất định, còn dữ liệu có thể có cấu trúc hoặc không  Ý nghĩa: Cơ sở tri thức có ý nghĩa và có thể được sử dụng để giải

quyết các vấn đề, còn dữ liệu chưa có ý nghĩa và cần được xử lý trước khi có thể sử dụng được.

Ví dụ:

 Cơ sở tri thức: Một cơ sở tri thức về lĩnh vực y tế có thể bao gồm các quy tắc về chẩn đoán bệnh, các thực thể về các loại bệnh và triệu chứng, và các mối quan hệ giữa các quy tắc và thực thể.

 Dữ liệu: Dữ liệu về bệnh nhân có thể bao gồm các thông tin như tên, tuổi, địa chỉ, bệnh sử, và các kết quả xét nghiệm.

2.2:Đặc điểm biểu diễn tri thức

Biểu diễn tri thức (knowledge representation) là một lĩnh vực nghiên cứu quan trọng Nhằm phát triển các phương pháp, cách thức biểu diễn tri thức và các công cụ hỗ trợ việc biểu diễn tri thức.

Trang 17

Có rất nhiều phương pháp biểu diễn tri thức, và phải phụ thuộc vào tri thức cụ thể của từng bài toán ta mới chọn được một phương pháp biểu diễn hợp lý nhất.

 Biểu diễn tri thức bằng luật sản xuất (Production rules)  Biểu diễn tri thức bằng khung (Frames)

 Biểu diễn tri thức sử dụng mạng ngữ nghĩa(Semantic networks )  Biểu diễn tri thức bằng ontology

Khi biểu diễn tri thức cho một bài toán, việc biểu diễn này được coi là tốt khi chúng thỏa mãn được 4 yếu tố sau:

 Tính hoàn chỉnh (Completeness)  Tính ngắn gọn (Conciseness)

 Tính hiệu quả về tính toán( Computational efficiency)  Tính rõ ràng, dễ hiểu(Transparency)

2.3:Các phương pháp biểu diễn tri thức2.3.1)Biểu diễn tri thức nhờ logic

Dựa vào các khái niệm cơ bản về logic mệnh đề và logic vị từ, với một số bài toán, các trạng thái được mô tả qua các biểu thức logic Khi đó bài toán được phát biểu lại dưới dạng :

A.Chứng minh : Từ GT1 ∩ GT2 ∩ …∩ GTn để suy ra một trong các kết luận : KL1,…,KLn.

Ở đây :GTi,KLj là các biểu thức logic (mệnh đề hoặc vị từ)

B.Tìm phép gán cho các biến tự do sao cho từ GT1,…,GTn suy ra một trong các kết luận KL1,…,KLn.

 Cơ sở tri thức bằng logic mệnh đề : Cơ sở tri thức gồm 2 phần :  Các sự kiện.

 Các luật.

Trang 18

Các sự kiện được cho bởi các luật đặc biệt dạng : q1;

q2; …

qk;

Tập F = (p1,…,pn) tạo nên giả thiết cho quá trình suy diễn  Cơ sở tri thức biểu diễn bằng logic vị từ :

Cơ sở tri thức được cấu tạo bởi 2 phần :  Tập các sự kiện F.

 Tập các luật R.

Các sự kiện được cho bởi qi (x,y,z,…), I = ,ở đây qi (x,y,z, …) là các vị từ phụ thuộc vào các hạng thức x, y, z,…

Logic vị từ cho phép biểu diễn hầu hết các khái niệm và các phát biểu định lý, định luật trong các bộ môn khoa học Cách biểu diễn này khá trực quan và ưu điểm căn bản của nó là có một cơ sở lý thuyết vững chắc cho những thủ tục suy diễn nhằm tìm kiếm và sản sinh ra những tri thức mới, dựa trên các sự kiện và các luật đã cho.

Logic vị từ và logic mệnh đề có các ưu điểm:  Là ngôn ngữ biểu diễn kiểu mô tả.

 Có khả năng suy diễn đối với các cơ chế quen thuộc : Pronens & Tollens.

 Khá trực quan với người sử dụng.

 Khá gần gũi về cú pháp với các lệnh lập trình logic, chẳng hạn như PROLOG.

 Có thể dùng để mô tả cấu trúc mô hình và xử lý động mô hình.

Trang 19

 Có thể kiểm tra tính mâu thuẫn trong cơ sở tri thức.

 Tính mô đun cao, do vậy các tri thức có thể thêm bớt sửa đổi khá độc lập với nhau và các cơ chế suy diễn.

Một số điểm yếu của logic :

 Mức độ hình thức hóa cao, dẫn tới khó hiểu ngữ nghĩa của các vị từ khi xét chương trình.

 Năng xuất xử lý thấp Một trong những khó khăn cơ bản của quá trình suy diễn là cơ chế hợp và suy diễn vét cạn.

 Do các tri thức được biểu diễn nhờ các vị từ, nên ưu thể sử dụng cấu trúc dữ liệu không được khai thác triệt để.

2.3.2)Biểu diễn tri thức nhờ mạng ngữ nghĩa

Mạng ngữ nghĩa biểu diễn dưới dạng một đồ thị có hướng nhưng không chi trình Bao gồm nút (Một đối tượng, một sự kiện một khái niệm khác) và cung (thể hiện mối quan hệ)

Ví dụ thể hiện tri thức: Minh là một sinh viên có thẻ sinh viên và có thể đăng kí môn học

Bằng cách thêm vào đồ thị nút mới và các cung mới người ta có thể mở rộng một mạng ngữ nghĩa Các cung mới được thêm thể hiện các đối tượng tương tự (với các nút đã có trong đồ thị), hoặc tổng quát hơn.

Ưu điểm:

Trang 20

 Các tri thức mới có tính độc lập khi được thêm vào với các tri thức cũ  Có tính kế thừa thông tin giữa các đối tượng và các lớp đối tượng  Cho phép biểu diễn một cách trực quan các sự kiện và mối quan hệ

giữa chúng.

 Thuận lợi cho việc biểu diễn tri thức mô tả.

 Tính mô đun cao, theo nghĩa các tri thức thêm vào hoàn toàn độc lập với các tri thức cũ.

Nhược điểm:

 Cập nhật thông tin sẽ khó kiểm soát để phát hiện mẫu  Việc xác định giá trị của một đối tượng sẽ rất phức tạp.

2.3.3)Biểu diễn tri thức nhờ các luật

Hiện nay hầu hết hệ chuyên gia đều là hệ thống dựa trên các luật.Bởi các luật có bản chất đơn thể,khả năng diễn giải dễ dàng,tương tự quá trình nhận thức của con người.

Các luật được viết dưới dạng câu điều kiện IF THEN Có 2 dạng :  If <Điều kiện> Then <Hành động>

 If<Điều kiện> Then <Kết luận> Do <Hành động>

Các điều kiện và các kết luận tương đối thoải mái Trường hợp với mỗi điều kiện thì sẽ suy ra được một kết luận theo cách logic thông thường.

Dùng luật có thể biểu diễn được nhiều loại tri thức như quan hệ,khuyên bảo,hướng dẫn, chiến lược, heuritic,siêu tri thức.

Ví dụ: IF Vị trí bị vết thương có chảy máu AND

Chưa biết chắc chắn là cơ quan nào bị tổn thương AND Chất nhuộm màu là âm tính AND

Vi khuẩn có dạng hình que AND Bệnh nhân bị bệnh sốt cao

THEN

Trang 21

Cơ quan đó bị nhiễm trùng Ưu điểm:

o Biểu diễn khá đơn giản

o Thêm bớt các luật không ảnh hưởng đến nhau Nhược điểm:

o Năng suất xử lý thông tin thấp khi tập dữ liệu lớn.

Là một bảng mẫu, cho phép điển thông tin vào chỗ trống.Mỗi frame đều có tên là tên đối tượng,hay khái niệm cần biểu diễn.Trong mỗi frame có các rãnh(slot).Một rãnh là một mô tả trong frame với 1 cặp gồm thuộc tính và giá trị.

Frame tận dụng được các ưu điểm của luật sản xuất, vị từ, cũng như mạng ngữ nghĩa.

Cấu trúc của FRAME : <tên FRAME>

<tên slot 1>

<thuộc tính thừa kế> (như trên, duy nhất,miền…) <kiểu slot> (text, integer, real, pointer…) <giá trị slot> (tên, giá trị, thủ tục,…)

Trang 22

Nói tiếng : Việt/Anh/Trung

Cấu trúc này cho ta một khung dữ liệu để khoanh vùng các đối tượng là học sinh Trường hợp gặp 1 người cao 120 cm, nặng 30 kg ta có thể khẳng định rằng đó không phải sinh viên vì không thỏa mãn các ràng buộc đã có.

Ưu điểm:

o Biểu diễn tính kế thừa thông tin tốt

o Có thể biểu diễn tới các tri thức mô tả và tri thức thủ tục Nhược điểm:

o Không tốt cho kỹ năng và trực giác của người lập trình.

3.Cơ chế suy diễn3.1.Suy diễn tiến

Lấy những thông tin đã có để sinh ra tất cả các sự kiện có thể sinh ra được.Không thể dự đoán trước được những sự kiện sẽ nhận được ở đầu ra trong cơ chế này.

Cách thức hoạt động:

 Bước 1: Lấy thông tin từ môi trường bên ngoài, thường là yêu cầu người sử dụng đưa các sự kiện vào hệ thống

 Bước 2: Duyệt các luật trong cơ sở luật, với mỗi luật kiểm tra xem phần điều kiện có khớp được với dữ liệu có trong bộ nhớ làm việc không?

 Bước 3: Nếu phát hiện một luật có phần điều kiện khớp được như nói trên thì phần kết luận này được coi là đúng và sự kiện mới đó được bổ sung vào bộ nhớ làm việc  luật cháy

 Bước 4: Quá trình duyệt các luật để tìm luật chảy cho đến khi không còn luật cháy nữa.

 Bước 5: Kết thúc luật bộ nhớ làm việc chứa cả sự kiện ban đầu và những sự kiện được sinh ra nhờ suy diễn

3.2.Suy diễn lùi

Trang 23

Suy diễn lùi hay còn được gọi là suy diễn điều khiển bởi đích Lấy những thông tin đã có để chứng minh hay bác bỏ một giả thuyết.

Các thức hoạt động của suy diễn lùi:

 Bước 1: Bắt đầu từ đích cần chứng minh Kiểm tra Xem đích có trong mộng nhớ làm việc chưa ? Nếu có thì quá trình suy diễn dừng Đích được chứng minh.

 Bước 2: nếu đích chưa được chứng minh, duyệt tìm luật trong cơ sở luật của phần THEN chứa địch gọi là luật đích.

 Bước 3: Kiểm tra Xem phần điều kiện của luật đích đã có trong bộ nhớ làm việc hay chưa điều kiện nào chưa có trong bộ nhớ làm việc và thuộc phần THEN của luật khác được coi là một đích con cần chứng minh Điều kiện chưa có trong bộ nhớ và cũng không nằm trong phần THEN của một luật nào là thông tin của hệ thống lấy từ môi trường bên ngoài vào (từ người dùng)để đặt vào bộ nhớ làm việc

 Bước 4: Quá trình tiếp tục cho đến khi địch con được chứng minh hết hoặc không quy về được các sự kiện đã có trong bộ nhớ làm việc (giải thích ban đầu sai)

CHƯƠNG III:ỨNG DỤNG BÀI TOÁN DỰ ĐOÁN BỆNH CÚM DỰA VÀOTRIỆU CHỨNG

1 Thu thập tri thức

Thu thập tri thức là bước quan trọng mở đầu cho mỗi bài toán, đặc biệt là đối với bài toán xây dựng hệ chuyên gia dự đoán bệnh cúm.

Xác định các triệu chứng bệnh cúm: Bước đầu tiên cần xác định các triệu chứng bệnh cúm có thể được sử dụng để dự đoán bệnh cúm Các triệu chứng này có thể được xác định từ các tài liệu y khoa, dữ liệu lâm sàng, và dữ liệu từ các cơ sở y tế, tổ chức nghiên cứu, và kho dữ liệu mở.Thu thập dữ liệu về các triệu chứng bệnh cúm: Sau khi xác định các triệu chứng bệnh cúm, cần thu thập dữ liệu về các triệu chứng này

Phân tích dữ liệu về các triệu chứng bệnh cúm: Sau khi thu thập dữ liệu, cần phân tích dữ liệu để xác định mối quan hệ giữa các triệu chứng bệnh cúm và nguy cơ mắc bệnh cúm.

Tổng hợp tri thức về các triệu chứng bệnh cúm: Sau khi phân tích dữ liệu, cần tổng hợp tri thức về các triệu chứng bệnh cúm thành một hệ thống tri thức hoàn

Ngày đăng: 26/04/2024, 05:42

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan