Bảng phân chia số lượng mẫu học và mẫu kiểm tra của 2 loại nhịp

Một phần của tài liệu (Luận văn thạc sĩ) Xây dựng mô hình phối hợp các mạng Nơrôn nhận dạng tín hiệu điện tim (ECG) (Trang 75 - 79)

Loại nhịp Tổng số mẫu Số mẫu học Số mẫu kiểm tra

Bình thường (Normal) 2000 1065 935

Bất thường (Abnormal) 4643 2546 2133

Tổng 6643 3611 3068

Trong bảng 4.1 là số lượng các loại nhịp tim được sử dụng trong quá trình học và kiểm tra của mơ hình nhận dạng. Các loại bệnh tim có số lượng giới hạn (ví dụ như

nhịp E, I) là do sự giới hạn trong cơ sở dữ liệu MIT-BIH [15]. Số lượng gốc của các

nhịp tim bình thường N rất cao, nhưng chúng ta xem những nhịp này như những nhịp đơn giản để phân loại và để tạo ra những kết quả cuối cùng nói chung là độc lập hơn ở số lượng các mẫu trong mỗi nhóm, tác giả giới hạn số lượng các nhịp tim được sử dụng trong các thí nghiệm với một mức hợp lý thông thường vào khoảng 1000 nhịp.

Để tạo được véc-tơ đặc tính và tín hiệu đầu ra tương ứng từ các bản ghi tín hiệu điện tim ECG trong bộ cơ sở dữ liệu MIT-BIH, thì ta thực hiện theo quy trình sau:

- Tách phức bộ QRS: Do trong bộ cơ sở dữ liệu MIT-BIH các tín hiệu ECG đã được đánh dấu vị trí đỉnh R và đã được gán nhãn phân loại bệnh bởi các bác sĩ chuyên ngành nên mỗi mẫu phức bộ QRS, nên trong trường hợp này chưa cần sử dụng thuật toán xác định đỉnh R như đã trình bày trong mục 2.2 mà chỉ cần đọc tuần tự các vị trí đỉnh R của phức bộ QRS trong đường tín hiệu ECG, tách phức bộ QRS bằng cách cắt cửa sổ 250ms xung quanh đỉnh R (125ms trước và 125ms sau vị trí đỉnh R).

- Khai triển phức bộ QRS vừa trích ở trên theo các đa thức Hermite theo công thức 4.1 để xác định 16 hệ số khai triển đầu tiên làm đặc tính.

  1 2 2 2 ( ) 2 ! ( ) x n n x n e H xn        (4.1)

- Xác định khoảng cách R-R từ đỉnh R đang xét tới đỉnh R liền trước để làm đặc tính thứ 17. Giá trị trung bình của 10 đoạn R-R cuối cùng sẽ là đặc tính thứ 18 của phức bộ QRS đang xét.

Như vậy mỗi phức bộ QRS tách ra tương ứng với 18 đặc tính, đầu ra là mã của loại bệnh của nhịp đang xét (đã được đánh dấu trong cơ sở dữ liệu MIT-BIH), ví dụ với 7 loại nhịp khác nhau đầu ra tương ứng sẽ là 7 kênh có giá trị 0 và 1 (6 kênh bằng

0 và kênh có mã tương ứng với loại bệnh sẽ có giá trị 1).

Sau đây là hình ảnh xếp chồng của các mẫu của 6 loại nhịp bệnh với số lượng như trong bảng 4.1. Từ hình 4.1 có thể thấy trở ngại lớn trong việc nhận dạng tín hiệu điện tim là sự biến thiên rất lớn về biên độ lẫn hình dạng của các nhịp tim thuộc cùng một loại bệnh [23]. Hơn nữa, một số loại nhịp thuộc các loại bệnh khác nhau cũng có thể giống nhau về mặt hình thái. Vì thế ta càng thấy rõ là bài tốn phân loại tín hiệu ECG là bài tốn khó.

Ngoại tâm thu nhĩ – A Tâm thất nỗi nhịp – E

Rung thất – I Ngoại tâm thu thất - V Hình 4.1. Hình dáng mẫu phức bộ QRS của các loại nhịp A, E, L, R, I và V

4.1.2. Cơ sở dữ liệu MGH/MF

Ngoài ra, luận văn cũng sử dụng bộ cơ sở dữ liệu thứ hai là MGH/MF [35, 36], bộ CSDL này gồm có 250 bản ghi của tín hiệu ECG, thu thập từ 250 bệnh nhân tim mạch tại các phịng chăm sóc đặc biệt, phịng mổ, phịng thí nghiệm thơng tim,... Tại Bệnh viện Đa khoa Massachusetts. Luận văn lựa chọn sử dụng các mẫu tín hiệu ECG của 20 bản ghi có mã số là: 029, 030, 058, 105, 106, 107, 108, 110, 111, 114, 117, 119, 121, 123, 124, 125, 128, 131, 137, 142, lấy ra tổng 4500 mẫu với 3 loại nhịp: Bình

thường (N -Normal sinus rhythm), nhịp ngoại tâm thu thất (V-Premature ventricular contraction) và loạn nhịp trên thất (S-Supraventricular premature beat) số lượng chi tiết

số mẫu sử dụng được thống kê chi tiết trong bảng 4.3 và bảng 4.4 dưới đây: Bảng 4.3. Bảng phân chia số lượng mẫu học và mẫu kiểm tra của 3 loại nhịp

Loại nhịp Tổng số mẫu Số mẫu học Số mẫu kiểm tra

N 3000 1997 1003

S 750 502 248

V 750 501 249

Tổng 4500 3000 1500

Bảng 4.4. Bảng phân chia số lượng mẫu học và mẫu kiểm tra của 2 loại nhịp

Loại nhịp Tổng số mẫu Số mẫu học Số mẫu kiểm tra

Bình thường

(normal) 3000 1997 1003

Bất thường

(abnormal) 1500 1003 497

Ngoại tâm thất thu – V Loạn nhịp thất trên – S Bình thường – N

Hình 4.2. Hình dáng mẫu phức bộ QRS của các loại nhịp V, S, N

Để tạo được véc-tơ đặc tính và tín hiệu đầu ra tương ứng từ các bản ghi tín hiệu điện tim ECG trong bộ cơ sở dữ liệu MGH/MF, thì ta thực hiện tương tự như đối với bộ cơ sở dữ liệu MIT-BIH.

4.2. Các chỉ tiêu đánh giá chất lượng mơ hình nhận dạng tín hiệu điện tim

Các mơ hình nhận dạng (các mơ hình đơn và cả mơ hình kết hợp) được đánh giá thơng qua các chỉ tiêu sau:

- Số mẫu nhận dạng sai;

- FN (False Negative): Số trường hợp chẩn đốn âm tính sai, tức là trường hợp bệnh nhân có bệnh nhưng chẩn đốn nhầm là bình thường;

- TN (True Negative): Số trường hợp chẩn đốn âm tính đúng;

- FP (False Positive): Số trường hợp chẩn đốn dương tính sai, tức là trường hợp người bệnh bình thường nhưng chẩn đốn có bệnh;

- TP (True Positive): Số trường hợp chẩn đốn dương tính đúng; - Sensitivity (True Positive Rate): Tỷ lệ chẩn đốn dương tính đúng,

TP

Sensitivity .100% TP FN

 (4.2)

- Specificity (True Negative Rate): Tỷ lệ chẩn đốn âm tính đúng

TN

Specificity .100% TN FP

 (4.3) Mơ hình nhận dạng có chất lượng và độ tin cậy cao khi:

- Số mẫu nhận dạng sai, số chẩn đốn dương tính sai FP, số chẩn đốn âm tính sai FN thấp;

- Tỷ lệ chẩn đốn dương tính đúng Sensitivity, tỷ lệ chẩn đốn âm tính đúng Specificity càng cao;

Yêu cầu thực tế về chất lượng của các mơ hình nhận dạng tín hiệu điện tim ECG là rất cao, trong các chỉ tiêu để đánh giá chất lượng mơ hình đã liệt kê ở trên thì lưu ý đến thơng số FN (số chẩn đốn âm tính sai) trong thực tế nếu FN cao sẽ gây

nguy hiểm cho người vì mơ hình nhận dạng sẽ khơng phát hiện được bệnh trong thực tế là có bệnh, do đó nếu mơ hình nhận dạng có FN càng giảm thì chất lượng mơ hình được đánh giá càng tăng.

4.3. Kết quả mơ hình nhận dạng đơn

4.3.1. Trên bộ cơ sở dữ liệu MIT-BIH

a) Thử nghiệm trên bộ dữ liệu trong bảng 4.1

Nhận dạng 7 loại nhịp, các mơ hình nhận dạng cơ sở MLP, SVM, TSK và RF được huấn luyện độc lập trên cùng một bộ dữ liệu học, có kết quả như sau:

- Mạng MLP

Cấu trúc như trong [6], 18 nơ-rôn đầu vào (tương ứng với 18 giá trị của véc-tơ

đặc tính), 20 nơ-rơn ẩn, có 7 nơ-rơn đầu ra (tương ứng với 7 loại rối loạn nhịp tim),

- Mạng TSK

Cấu trúc lựa chọn như trong [5, 6], có 21 luật suy luận, 7 kết quả đầu ra; - Máy hỗ trợ véc-tơ SVM

Cấu trúc lựa chọn như [31], mơ hình SVM phân loại 7 lớp, dùng phương pháp

OVO nên có 21 bộ SVM nhị phân thành phần;

- Rừng ngẫu nhiên RF

Áp dụng theo phương pháp của L. Breiman (2001) [19], rừng ngẫu nhiên RF có 100 cây quyết định thành phần.

Kết quả thử nghiệm của các mô hình nhận dạng cơ sở trên cùng bộ dữ liệu kiểm tra trong bảng 4.1, kết quả trình bày ở dạng ma trận như trong các bảng từ 4.5 đến 4.9: Trong đó cột là các kết quả chuẩn (được đánh dấu trước), hàng là kết quả nhận dạng, đường chéo chính của ma trận là số mẫu nhận dạng đúng, các giá trị ngồi đường chéo chính là các mẫu nhận dạng sai, kết quả cụ thể như sau:

Một phần của tài liệu (Luận văn thạc sĩ) Xây dựng mô hình phối hợp các mạng Nơrôn nhận dạng tín hiệu điện tim (ECG) (Trang 75 - 79)

Tải bản đầy đủ (PDF)

(94 trang)