4 Thực nghiệm và Đánh giá
4.1.2 Môi trường thực nghiệm cho bước chẩn đoán dựa vào sự thay
thay đổi nhịp tim
Thực nghiệm được thực hiện trên tập dữ liệu tổng hợp để đánh giá hiệu năng của thuật toán GNG. Để đáp ứng yêu cầu của việc nhận biết tình trạng bệnh tim khi bệnh nhân thực hiện các hoạt động thường ngày khác nhau, một mô phỏng bao gồm cảm ứng điện tâm đồ được xây dựng để thu thập dữ liệu về sự thay đổi nhịp tim của bệnh nhân. Để sinh ra dữ liệu điện tâm đồ biểu diễn sự thay đổi nhịp tim, chúng tôi sử dụng một chương trình mô phỏng mã nguồn mở [35]. Tất cả các tham số được dùng để sinh ra dữ liệu điện tâm đồ được tổng hợp ở Bảng 4.1. Một nghiên cứu đã chứng minh rằng, tần suất thở có thể được ước lượng bởi sự dao động sóngRcủa tín hiệu điện tâm đồ với độ sai lệch nhỏ hơn2%[8]/ Giá trị sai lệch này có thể xem như không đáng kể. Ngoài ra, tỉ lệLF/HF cũng là một yếu tố quan trọng phản ánh sự thay đổi nhịp tim. Nhịp tim và tỉ lệLF/HF tăng trong suốt thời gian ban ngày, đặc biệt khi bệnh nhân hoạt động mạnh và giảm khi bệnh nhân nghỉ ngơi [25]. Các giá trị của các đặc trưng mà sử dụng để sinh tập dữ liệu được miêu tả trong Bảng4.2. Chúng tôi đánh giá tình trạng bệnh tim của bệnh nhân ngoại trú khi cố định tần suất thở, tỷ lệLF/HF khi thực hoạt động khác nhau.
Hai trạng thái tim của bệnh nhân là bình thường và bất bình thường khi bệnh nhân đó thực hiện các hoạt động khác nhau. Đồng thời từ Bảng4.1, ta có thể thấy rằng nếu số lần đập trên một hoạt động là 256 và nhịp tim trung bình là 60 lần/phút (bpm), thì hoạt động được duy trì trong khoảng4phút. Trong thực nghiệm này, việc đánh giá tín hiệu điện tâm đồ được thực hiện3msmột lần và mỗi bản ghi cho một hoạt động thực
Tham số Ý nghĩa Giá trị mặc định
HB Số lần đập của tim trong
một khoảng thời gian
256
fs tần suất mô phỏng điện tâm đồ 256Hz LFstd Độ lệch chuẩn tần số thấp 0.01Hz HFstd Độ lệch chuẩn tần số cao 0.01Hz HRstd Độ lệch chuẩn nhịp tim HR Trung bình nhịp tim Noise Độ nhiễu 0.1mV LF Tần số thấp 0.1Hz HF Tần số cao 0.25Hz LF/HF tỷ lệ Tỷ lệ sóng trong dải tần số thấp đối với sóng trong dải tần số cao
0.5
Bảng 4.1: Tổng hợp các tham số sử dụng để sinh ra tín hiệu điện tâm đồhiện trong khoảng 4phút. Điều đó có nghĩa, nó bao gồm 256 khoảng RR. Khoảng hiện trong khoảng 4phút. Điều đó có nghĩa, nó bao gồm 256 khoảng RR. Khoảng
RR giữa300msvà 1700msđược đưa vào cùng với∆t = 50ms, do vậy không gian đồ thị Poincaré được chia thành784ô.
Để đánh giá hiệu năng của phân lớp, tập dữ liệu huấn luyện và tập dữ liệu kiểm tra được tạo ra. Tập dữ liệu huấn luyện được sử dụng để xây dựng mô hình phân lớp và tập dữ liệu kiểm tra được sử dụng để kiểm tra sự chính xác của mô hình. Vấn đề ở đây là tập dữ liệu tạo ra phải đáp ứng được yêu cầu mô hình có thể huấn luyện liên tục. Ngoài ra, hiệu năng của phân lớp thì bị ảnh hưởng nhiều bởi cấu trúc tập dữ liệu. Nên, chúng tôi sẽ xem xét hai trường hợp là tập dữ liệu mà tồn tại vùng giao nhau giữa các vùng quyết định và tập dữ liệu mà không tồn tại vùng giao nhau giữa các vùng quyết định. Tập huấn luyến được ký hiệu làD(O)trong đóObiểu diễn mức độ giao nhau giữa các lớp. Tập huấn luyện được ghi lại từ 7 kịch bản. Mỗi kịch bản cho ra một tập các mẫu Di. Vì vậy, chúng ta có D(O) = ∪7
i=1Di. Tập dữ liệu được xây dựng cho những người có độ tuổi trên 46kết hợp với 3 hoạt động và 2 trạng thái tim mạch. Do đó, trong nghiên cứu này, chúng tôi chỉ phân biệt 5 lớp dựa trên sự kết hợp của các hoạt động và trạng thái tim mạch khác nhau. Một kịch bản được xây dựng từ các hoạt động và trạng thái khác nhau, trong đó lựa chọn ngẫu nhiên nhịp tim trong khoảng tương ứng đối với một hoạt động cụ thể và tần suất thở. Những giá trị này được mô tả trong Bảng4.2. Nhịp tim tương ứng với các hoạt động và trạng thái tim
Nghỉ ngơi Làm việc Tập thể dục Tình trạng tim BT BBT BT BBT BT O=0% Sự thay đổi nhịp tim 50-56 60-64 65-73 126-135 141-142 Nhịp tim trung bình 53 62 69 130 141.5 Độ lệch chuẩn nhịp tim 1.6475 1.0954 2.211 2.494 0.3536 O=1% Sự thay đổi nhịp tim 50-56 60-65 65-73 126-135 141-142 Nhịp tim trung bình 53 62.5 69 130 141-142 Độ lệch chuẩn nhịp tim 1.6475 1.3693 2.211 2.949 141.5 O=2% Sự thay đổi nhịp tim 50-56 60-65 65-73 126-140 140-142 Nhịp tim trung bình 53 62.5 69 133 141 Độ lệch chuẩn nhịp tim 1.6475 1.3693 2.211 3.9243 0.5774 HF(Hz) 0.1-0.2 0.25 0.4 LF/HF tỷ lệ 0.5 1 4
Bảng 4.2: Tham số sử dụng để sinh ra tập dữ liệu (BT-Bình thường, BBT- Bất bìnhthường) thường)
khác nhau được mô tả bởi giá trị trung bình. Ví dụ như nhịp tim trung bình khi bệnh nhân đang nghỉ ngơi và tình trạng tim mạch là bất bình thường sẽ là 62. Mỗi tập dữ liệuDichứa4.500mẫu. Nên, tất cả 7 kịch bản chứa31.500mẫu được sinh ngẫu nhiên (D(O) = 31.500) và tương ứng với 5 lớp và không gian đầu vào hai chiều. Ngoài ra, số lượng các mẫu trong mỗi lớp là bằng nhau.
Các tập mẫu Di được đưa vào mạng lần lượt. Để tạo ra môi trường thay đổi liên tục, 2 tập dữ liệu Di và Di+1 hoặc là có ít nhất một lớp khác nhau hoặc một số các mẫu của chúng cùng thuộc về một lớp, nhưng được tạo ra với nhịp tim khác nhau trong một khoảng cố định. Cho ví dụ, chúng ta có một tập dữ liệu thu được từ hai hoạt động (ngủ và làm việc) và hai trạng thái tương ứng (bình thường và bất bình thường). Nhịp tim tương ứng với một hành động và một trạng thái được lựa chọn ngẫu nhiên. Nhịp tim đã được lưa chọn thì bị bỏ đi trong các lần biểu diễn sau.
ta thấy ngay rằng huấn luyện trong một môi trường thì có ưu điểm hơn trong nhiều môi trường, bởi vì khi huấn luyện trong nhiều môi trường sẽ dễ xảy ra tình trạng giao nhau giữa các vùng quyết định. Từ Bảng 4.2, các lớp giao nhau trong những trường hợp sau:
• Đối tượng đang ngủ, nhịp tim tự tăng và đối tượng có thể bị nguy hiểm, nhưng có thể nhầm lẫn rằng đối tượng vẫn bình thường và đang làm việc.
• Đối tượng đang làm việc, nhịp tim tăng cao hơn bình thường. Nhưng có thể bị nhầm lẫn rằng đối tượng vẫn tốt và đang tập thể dục.
Ký hiệu Ý nghĩa Giá trị
mặc định
D(O) Tập huấn luyện với mức giao nhau giữa các vùng quyết định là O
∆t Khoảng thời gian trong kỹ thuật Poincaré
50ms
lb Tốc độ huấn luyện của nút khớp nhất
0.1
lc Tốc độ huấn luyện của nút lân cận của nút khớp nhất
0.001
lo Tốc độ huấn luyện trong không gian đầu ra
0.1
β Tham số để cập nhật giá trị lỗi của các nút khác nút khớp nhất
0.995
γ Tham số để cập nhật lỗi của nút khớp nhất
0.8
λ Tham số được sử dụng để xem xét việc chèn một nút mới
30
amax Giá trị tuổi (Age) lớn nhất 50 Bảng 4.3: Tổng hợp các tham số sử dụng trong GNG
Bảng 4.3 mô tả các tham số chính với giá trị mặc định được sử dụng trong thực nghiệm với thuật toán GNG. Trong một thực nghiệm, nếu không chỉ ra giá trị của tham số thì giá trị mặc định được sử dụng. Để đánh giá được chính xác hiệu năng của thuật toán, chúng tôi sử dụng một giá trị lỗi của phân lớp. Giá trị lỗi phân lớp được tính như tỷ lệ giữa số lượng các mẫu mà phân lớp sai trên toàn bộ mẫu của tập kiểm tra. Đánh giá này và tập kiểm tra được mô tả ở trên giúp chúng ta kiểm tra được tính ổn định, mềm dẻo của GNG cũng như sự hội tụ của thuật toán tới một ngưỡng chấp
nhận được. Gọi số lượng mẫu bị phân lớp sai là m. Gọin là số mẫu trong tập kiểm tra.
Giá trị lỗi= m
n (4.1)
Ngoài ra, chất lượng phân lớp còn được đánh giá dựa trên giá trị lỗi bình phương trung bìnhM SE. Mục đích của MSE là để xem các lớp sẽ được tách biệt thế nào sau khi huấn luyện.
M SE = 1 n n X i (Oi−Ti)2 (4.2)
trong đó, Oi là giá trị đầu ra được dự đoán bởi chương trình cho mẫu i trong n
mẫu vàTi là giá trị đầu ra mong muốn củai. MSE dao động từ0tới vô tận, trong đó 0 tương ứng với trường hợp lý tưởng nhất. Dựa vào MSE ta biết lỗi sẽ thay đổi thế nào khi mô hình mạng thay đổi( trong quá trình huấn luyện). Kết thúc quá trình huấn luyện nếu MSE đạt giá trị0là trường hợp lý tưởng nhưng rất khó xảy ra, cho nên khi huấn luyện nếu MSE đạt xấp xỉ 0.01thì quá trình huấn luyện dừng lại. Khi đó ta có thể coi mô hình mạng đạt được sự hội tụ.