CHƯƠNG 2 MƠ HÌNH HỆ CHUN GIA MỜ
2.4. Đánh giá PORUL.DEP
Việc đánh giá hệ chuyên gia là một bước tự nhiên sau quá trình thiết kế, phát triển và duy trì hệ thống. Đánh giá hệ chuyên gia y học được phổ biến rộng rãi trong các tạp chí trí tuệ nhân tạo, thống kê, tin học y tế và lâm sàng. Nghiên cứu cơ bản trong các hệ chuyên gia y tế nhằm tìm ra các hình thức biểu diễn tri thức mới và tốt hơn, thu nhận tri thức và lập luận tự động vẫn đang được quan tâm sâu sắc. Tuy nhiên, một số hệ chuyên gia y tế đã được áp dụng như hệ thống thường quy trong các cơ sở lâm sàng. Có những chương trình máy tính khác đã hoặc sẽ sớm sẵn sàng đưa vào hoạt động thực tế tại bệnh viện hoặc phòng khám. Một số hệ thống này đã được thử nghiệm với hàng trăm trường hợp lâm sàng. Nhu cầu xác nhận và xác minh của hệ chuyên gia trước và trong quá trình vận hành thực tế ngày càng tăng và các phương pháp đánh giá hoạt động, khả năng chấp nhận và chi phí được quan tâm. Có một số phương pháp đánh giá các khía cạnh nhất định của hệ chuyên gia y tế, chẳng hạn như độ chính xác chẩn đốn của hệ thống, tính nhất quán và đầy đủ của cơ sở tri thức, sự chấp nhận của người sử dụng y tế và khả năng triển khai nhân rộng của hệ chuyên gia, hiệu năng của hệ thống... [33].
Ở bước ban đầu phát triển hệ chuyên gia, PORUL.DEP được lựa chọn phương pháp đánh giá hiệu suất về độ chính xác chẩn đốn, bằng cách đánh giá kết quả chẩn đoán của hệ chuyên gia với kết quả chẩn đoán trong hồ sơ bệnh án. Các đánh giá khác của hệ chuyên gia như tính nhất quán và đầy đủ của cơ sở tri thức, sự chấp nhận của người sử dụng y tế và khả năng triển khai nhân rộng, hiệu năng của hệ thống, … sẽ được tiếp tục xem xét thực hiện trong tương lai.
Đối chiếu kết quả thực nghiệm của PORUL.DEP tại bảng 2.15 với chẩn đoán trong hồ sơ bệnh án đã được thu thập tại các bảng P.1, bảng P.2, bảng P.3, bảng P.4, bảng P.5 Phụ lục luận án, kết quả như bảng 2.16 sau đây.
18Bảng 2.16. So sánh kết quả chẩn đoán rối loạn trầm cảm của PORUL.DEP
và chẩn đoán trong hồ sơ bệnh án
Rối loạn trầm cảm đoán trong hồ Kết quả chẩn sơ bệnh án
Kết quả chẩn đoán của
PORUL.DEP Tỷ lệ
Rối loạn trầm cảm nhẹ 48 46 95,8%
Rối loạn trầm cảm vừa 60 0 0%
Rối loạn trầm cảm nặng 50 0 0%
Rối loạn trầm cảm nặng có triệu
chứng loạn thần 86 0 0%
Không rối loạn trầm cảm 20 19 95%
12 Hình 2.4. Biểu đồ so sánh kết quả chẩn đoán giữa PORUL.DEP và hồ sơ
bệnh án
Thực nghiệm trên PORUL.DEP cho thấy, 48 trường hợp người bệnh rối loạn trầm cảm nhẹ và 20 trường hợp người bệnh không mắc rối loạn trầm cảm, PORUL.DEP cho kết quả chẩn đoán đúng cao, đạt từ 95% trở lên; 60 trường
hợp người bệnh rối loạn trầm cảm vừa, 50 trường hợp người bệnh rối loạn trầm cảm nặng, 86 trường hợp người bệnh rối loạn trầm cảm nặng có loạn thần, PORUL.DEP cho kết quả chẩn đoán sai với tất cả các trường hợp người bệnh; Xem biểu đồ so sánh kết quả chẩn đoán của PORUL.DEP và chẩn đoán trong hồ sơ bệnh án tại hình 2.4 và hình 2.5.
13 Hình 2.5. Biểu đồ so sánh tỷ lệ % kết quả chẩn đoán đúng giữa các loại rối
loạn trầm cảm của PORUL.DEP
Về nguyên nhân chẩn đoán sai đối với người bệnh rối loạn trầm cảm vừa, rối loạn trầm cảm nặng, rối loạn trầm cảm nặng có loạn thần, do các tiêu chí chẩn đốn của các loại rối loạn trầm cảm có phần chồng nhau. Ví dụ: người bệnh mắc rối loạn trầm cảm vừa, khi thỏa mãn tất cả các tiêu chuẩn chẩn đoán rối loạn trầm cảm nhẹ kèm theo một triệu chứng phổ biến; người bệnh mắc rối loạn trầm cảm nặng, khi thỏa mãn tất cả các tiêu chuẩn chẩn đoán rối loạn trầm cảm vừa kèm theo triệu chứng “tự sát”; người bệnh mắc rối loạn trầm cảm nặng có triệu chứng loạn thần khi thỏa mãn tất cả các tiêu chuẩn chẩn đoán rối loạn trầm cảm nặng kèm theo ít nhất 1 triệu chứng loạn thần.