Chương 4
Thực nghiệm và Đánh giá
4.1 Môi trường thực nghiệm và dữ liệu
Thực nghiệm đánh giá chia làm hai bước tương ứng với hai bước trong q trình chẩn đốn. Các thực nghiêm được thực hiện trên máy tính với cấu hình gồm chíp xử lý Intel Core(TM) i5, RAM 4G và hệ điều hành Windows 7 64-bit. Thuật toán GNG và SOM được cài đặt bằng ngơn ngữ lập trình Java.
4.1.1 Mơi trường thực nghiệm cho bước chẩn đốn dựa vào các
thơng tin lâm sàng
Trong bước chẩn đốn dựa trên các thơng tin lâm sàng, chúng tơi sử dụng bộ dữ liệu có sẵn thu được từ UCI. [34]. Bộ dữ liệu bao gồm 294 bản ghi. Tập dữ liệu này đã được tiền xử lý để đưa ra dạng chuẩn của đầu vào thuật tốn Apriori. Hình 4.1 mơ tả tập dữ liệu thực nghiệm.
Trong các thực nghiệm của bước chẩn đốn đầu tiên, chúng tơi sử dụng phần mềm mã nguồn mở Weka. Đây là một phần mềm khai phá dữ liệu, thuộc dự án nghiên cứu của đại học Waikato, New Zealand. Weka là một công cụ hiện đại nhằm phát triển các kỹ thuật học máy và áp dụng chúng vào bài toán khai phá dữ liệu trong thực tế. Do đầu vào của phần mềm Weka là định dạng *.arff nên toàn bộ tập dữ liệu đều phải chuyển đổi sang dạng chuẩn .arff.[33]
Hình 4.1: Tập dữ liệu đầu vào của thuật tốn Apriori
4.1.2 Mơi trường thực nghiệm cho bước chẩn đốn dựa vào sự
thay đổi nhịp tim
Thực nghiệm được thực hiện trên tập dữ liệu tổng hợp để đánh giá hiệu năng của thuật toán GNG. Để đáp ứng yêu cầu của việc nhận biết tình trạng bệnh tim khi bệnh nhân thực hiện các hoạt động thường ngày khác nhau, một mô phỏng bao gồm cảm ứng điện tâm đồ được xây dựng để thu thập dữ liệu về sự thay đổi nhịp tim của bệnh nhân.
Để sinh ra dữ liệu điện tâm đồ biểu diễn sự thay đổi nhịp tim, chúng tôi sử dụng một chương trình mơ phỏng mã nguồn mở [35]. Tất cả các tham số được dùng để sinh ra dữ liệu điện tâm đồ được tổng hợp ở Bảng 4.1. Một nghiên cứu
đã chứng minh rằng, tần suất thở có thể được ước lượng bởi sự dao động sóng R của tín hiệu điện tâm đồ với độ sai lệch nhỏ hơn 2% [8]/ Giá trị sai lệch này có thể xem như khơng đáng kể. Ngồi ra, tỉ lệ LF=HF cũng là một yếu tố quan trọng phản ánh sự thay đổi nhịp tim. Nhịp tim và tỉ lệ LF=HF tăng trong suốt thời gian ban ngày, đặc biệt khi bệnh nhân hoạt động mạnh và giảm khi bệnh nhân nghỉ ngơi [25]. Các giá trị của các đặc trưng mà sử dụng để sinh tập dữ liệu được miêu tả trong Bảng 4.2. Chúng tơi đánh giá tình trạng bệnh tim của bệnh nhân ngoại trú khi cố định tần suất thở, tỷ lệ LF=HF khi thực hoạt động khác nhau.
Hai trạng thái tim của bệnh nhân là bình thường và bất bình thường khi bệnh nhân đó thực hiện các hoạt động khác nhau. Đồng thời từ Bảng 4.1, ta có thể thấy rằng nếu số lần đập trên một hoạt động là 256 và nhịp tim trung bình là 60 lần/phút (bpm), thì hoạt động được duy trì trong khoảng 4 phút. Trong thực nghiệm này, việc đánh giá tín hiệu điện tâm đồ được thực hiện 3ms một lần và mỗi bản ghi cho một hoạt động thực
Tham số HB fs LFstd HFstd HRstd HR Noise LF HF LF=HF tỷ lệ