CHƯƠNG 2 MƠ HÌNH HỆ CHUN GIA MỜ
3.5. Đánh giá STRESSDIAG
Có một số phương pháp đánh giá các khía cạnh nhất định của hệ chuyên gia y tế, chẳng hạn như độ chính xác chẩn đốn của hệ chuyên gia, tính nhất quán và đầy đủ của cơ sở tri thức, sự chấp nhận của người sử dụng y tế, khả năng triển khai nhân rộng của hệ chuyên gia, hiệu năng của hệ thống... Cũng như PORUL.DEP, STRESSDIAG được đánh giá bằng phương pháp đánh giá theo khía cạnh độ chính xác chẩn đốn. Đối chiếu kết quả thực nghiệm của STRESSDIAG tại bảng 3.4 với kết quả chẩn đoán trong hồ sơ bệnh án tại bảng P.1, bảng P.2, bảng P.3, bảng P.4 và bảng P.5, kết quả như bảng 3.5.
23Bảng 3.5. So sánh kết quả chẩn đoán rối loạn trầm cảm của STRESSDIAG và chẩn đoán hồ sơ bệnh án
Rối loạn trầm cảm trong hồ sơ Chẩn đoán bệnh án
Chẩnđoán của
STRESSDIAG Tỷ lệ
Rối loạn trầm cảm nhẹ 48 46 95,8% Rối loạn trầm cảm vừa 60 46 76,7%
Rối loạn trầm cảm trong hồ sơ Chẩn đoán bệnh án
Chẩnđoán của
STRESSDIAG Tỷ lệ
Rối loạn trầm cảm nặng có triệu
chứng loạn thần 86 68 79,1%
Không rối loạn trầm cảm 20 19 95%
22Hình 3.9. Biểu đồ so sánh kết quả chẩn đoán giữa STRESSDIAG và
hồ sơ bệnh án
Nhận xét: nhìn vào bảng 3.5 cho thấy, kết quả chẩn đoán của STRESSDIAG so với chẩn đoán trong hồ sơ bệnh án trên 264 người bệnh rối loạn trầm cảm đạt tỷ lệ cao cho tất cả các loại rối loạn trầm cảm, rối loạn trầm cảm nhẹ đúng 46/48 trường hợp người bệnh, đạt 95,8%, rối loạn trầm cảm vừa đúng 46/60 trường hợp người bệnh đạt 76,7%, rối loạn trầm cảm nặng đúng 30/50 trường hợp người bệnh đạt 76%, rối loạn trầm cảm nặng có triệu chứng loạn thần đúng 68/86 trường hợp người bệnh đạt 79,1%, không rối loạn trầm cảm đúng 19/20 trường hợp người bệnh đạt 95%. Xem biểu đồ so sánh kết quả
chẩn đoán của STRESSDIAG và kết quả chẩn đốn trong hồ sơ bệnh án tại hình 3.9, hình 3.10.
23Hình 3.10. Biểu đồ so sánh tỷ lệ % kết quả chẩn đoán đúng giữa các loại
rối loạn trầm cảm của STRESSDIAG
Các hệ chuyên gia được thiết kế để giải quyết các vấn đề phức tạp bằng cách lập luận thông qua các khối kiến thức, được biểu diễn chủ yếu dưới dạng các luật if - then thay vì thơng qua mã thủ tục thơng thường. Nhược điểm phổ biến nhất được trích dẫn đối với các hệ chuyên gia trong tài liệu học thuật là vấn đề thu nhận tri thức. Rất nhiều nghiên cứu trong những năm sau đó về hệ chuyên gia đã tập trung vào các công cụ để thu nhận tri thức, giúp tự động hóa q trình thiết kế, gỡ lỗi và duy trì các luật do các chuyên gia xác định. Tuy nhiên, khi xem xét vòng đời của các hệ chuyên gia đang được sử dụng thực tế, các vấn đề khác cũng là nhược điểm của hệ chun gia, đó là tích hợp, truy cập vào cơ sở dữ liệu lớn và hiệu suất [76] .
Hệ chuyên gia ban đầu sử dụng các công cụ để diễn giải các biểu thức mã mà không cần biên dịch chúng trước. Điều này cung cấp một mơi trường phát triển mạnh mẽ, nhưng có nhược điểm là hầu như không thể so sánh với
95,8%
hiệu quả của các ngôn ngữ được biên dịch nhanh nhất (chẳng hạn như các ngơn ngữ lập trình hiện nay). Một thách thức lớn khác của các hệ chuyên gia xuất hiện khi quy mô của cơ sở tri thức tăng lên. Điều này làm cho độ phức tạp của q trình xử lý tăng lên. Ví dụ, khi một hệ chuyên gia với 100 triệu luật được hình dung là hệ chuyên gia cuối cùng, rõ ràng là hệ thống đó sẽ quá phức tạp và nó sẽ gặp q nhiều vấn đề về tính tốn. Một cơ chế suy luận sẽ phải có khả năng xử lý số lượng lớn các luật trước khi đưa ra kết luận. Ngồi ra, cịn một số thách thức với hệ chuyên gia như: xác minh tính nhất quán của các luật, cách ưu tiên sử dụng các luật để hoạt động hiệu quả hơn, làm thế nào để cập nhật tri thức của nó một cách nhanh chóng và hiệu quả, làm thế nào để thêm một phần kiến thức mới (tức là thêm nó vào đâu trong số nhiều luật) cũng là một thách thứ,… [116] .
Thách thức chính của các hệ chuyên gia trong y học hiện đại bao gồm các vấn đề liên quan đến các khía cạnh như: dữ liệu lớn, các quy định hiện hành, thực hành chăm sóc sức khỏe, các vấn đề thuật toán khác nhau và đánh giá hệ thống [137].
Tuy nhiên, STRESSDIAG đã được các chuyên gia y tế cung cấp với số lượng gần 1000 luật, các thách thức về cơ sở tri thức tăng lên làm cho độ phức tạp của q trình xử lý tăng lên khơng phải là vấn đề của STRESSDIAG. Kiểm thử hiệu năng tính tốn của hệ thống, thời gian phản hồi (thời gian từ khi người dùng nhập dữ liệu vào phần mềm hệ chuyên gia cho đến khi phần mềm hệ chun gia xuất ra kết quả chần đốn). Nói chung, thời gian này rất nhanh chóng.
Tiêu chuẩn chẩn đốn của rối loạn trầm cảm có các phần chồng nhau giữa các loại rối loạn trầm cảm. Để khắc phục đặc điểm này, ngoài 857 luật khẳng định, STRESSDIAG đã được cập nhật 124 luật phủ định. Vì vậy, khả năng chẩn đoán nhầm, chẩn đoán sai giữa các loại rối loạn trầm cảm của STRESSDIAG là rất khó xảy ra.