1.4 Cơ sở dữ liệu ECG
1.4.2 Cơ sở dữ liệu đa chuyển đạo CSE
Đây là dự án được khởi động từ năm 1978 với sự tham gia của các nhà khoa học đến từ 25 viện nghiên cứu khác nhau và cho tới nay đã được sử dụng bởi hơn 110 trung tâm nghiên cứu trên toàn thế giới. Cơ sở dữ liệu CSE tiêu chuẩn bao gồm 3 nhóm cơ sở dữ liệu ECG. Nhóm dữ liệu tiêu chuẩn 3 chuyển đạo chứa 250 bản ghi ECG gốc và 310 bản ghi nhân tạo được chia đều thành hai nhóm nhỏ: DS1 và DS2. Cơ sở dữ liệu đa chuyển đạo chứa 250 bản ghi ECG gốc và 250 bản ghi nhân tạo cũng được chia thành hai nhóm: DS3 và DS4. Các bản ghi ECG nhân tạo được tạo ra bằng cách lặp lại một chu kỳ ECG được chọn. Nhóm cơ sở dữ liệu chẩn đốn (DS5) được thiết kế cho mục đích thử nghiệm, khơng dành cho mục đích phát triển và khơng cơng bố xác nhận chẩn đốn lâm sàng [24]. Số lượng bản ghi của mỗi nhóm dữ liệu được trình bày trong Bảng 3.1.
Bảng 1.1: Sự phân bố các nhóm dữ liệu của cơ sở dữ liệu CSE tiêu chuẩn
Cơ sở dữ liệu 3 chuyển đạo
Cơ sở dữ liệu đa chuyển đạo Cơ sở dữ liệu chẩn đoán Dữ liệu thực DS1: 125 DS2: 125 DS3: 125 DS4: 125 DS5: 1220
Dữ liệu nhân tạo DS1: 155
DS2: 155
DS3: 125 DS4: 125 DS - Data Set
Độ dài mỗi bản ghi ECG là 10 giây và trong một số trường hợp dữ liệu tín hiệu chỉ có ý nghĩa trong 8 giây đầu và các mẫu dữ liệu cuối cùng được lặp lại để hoàn thành 2 giây cuối. Dữ liệu của tất cả các bản ghi đều được chuyển đổi sang đơn vị microvolt. Mức lượng tử hóa trong q trình chuyển đổi A/D nhỏ hơn hoặc bằng 5 µV và tần số lấy mẫu là 500 Hz.
Đối với các nhóm dữ liệu DS1 và DS3, giá trị tham chiếu cho 5 điểm quan trọng của một chu kỳ ECG bao gồm thời điểm bắt đầu và kết thúc sóng P, thời điểm bắt đầu và kết thúc phức bộ QRS, và thời điểm kết thúc sóng T đã được chỉ ra bởi kết quả phân tích của 14 chương trình máy tính khác nhau và 5 bác sĩ tim mạch. Ngồi ra, kết quả phân tích các bản ghi từ các chương trình máy tính khác nhau cũng khác nhau đáng kể. Các kết quả phân tích cho nhóm dữ liệu DS2 và DS4 được thiết kế cho các thử nghiệm độc lập tại trung tâm dữ liệu CSE và không được công bố [89]. Các nhà phát triển cơ sở dữ liệu CSE cũng đặt ra tiêu chí đánh giá độ chính xác cho các thuật tốn khi thử nghiệm trên cơ sở dữ liệu này và được trình bày trong Bảng 3.2.
Bảng 1.2: Tiêu chí đo các sóng thành phần trong cơ sở dữ liệu CSE [66]
Ponset Poffset QRSonset QRSoffset Toffset
Tiêu chí 2sCSE [ms] 10,2 12,7 6,5 11,6 30,6
2sCSE: Độ lệch chuẩn tối đa cho phép giữa vị trí tham chiếu và vị trí phát hiện được của các điểm quan trọng.
Điểm nổi bật của cơ sở dữ liệu đa chuyển đạo CSE là sự đa dạng của tín hiệu. Cơ sở dữ liệu này chứa cả các bản ghi ECG bình thường và bản ghi bệnh lý với đầy đủ các bất thường về tín hiệu điện tâm đồ. Do đó, nhóm cơ sở dữ liệu này phù hợp cho việc kiểm tra đánh giá hiệu suất của các thuật toán nhận dạng phức bộ QRS cũng như xác định vị trí các điểm quan trọng của tín hiệu ECG.