1.4 Cơ sở dữ liệu ECG
1.4.4 Cơ sở dữ liệu điện tâm đồ gắng sức GUDB
CSE và MIT-BIH là hai cơ sở dữ liệu được đo khi bệnh nhân ở trạng thái nghỉ (điện tâm đồ tĩnh). Tuy nhiên, đối với các hệ thống ECG gắng sức thì bệnh nhân được yêu cầu vận động với cường độ và thời gian khác nhau. Điều này khiến cho các tín hiệu ECG có chất lượng khơng tốt do chứa một lượng nhiễu lớn được tạo ra do sự dịch chuyển của điện cực hay do nhịp thở của bệnh nhân thay đổi khi đối tượng gắng sức dẫn tới việc xác định vị trí phức bộ QRS của các thuật tốn gặp khó khăn và độ chính xác khơng cao.
Trong số các cơ sở dữ liệu ECG hiện có trên PhysioNet thì chỉ có duy nhất 2 cơ sở dữ liệu được cung cấp nhằm đưa ra các ví dụ về tín hiệu ECG có chứa một lượng nhiễu lớn. Tuy nhiên, cả 2 cơ sở dữ liệu này đều có những sai sót
làm hạn chế tính hữu dụng của chúng. Cơ sở dữ liệu MIT-BIH Noise Stress Test Database (NSTDB) chứa 12 bản ghi ECG với độ dài 30 phút được tạo thành bởi các bản ghi ECG sạch lấy từ cơ sở dữ liệu MIT-BIH kết hợp với 3 loại tín hiệu nhiễu điển hình là nhiễu trơi đường cơ sở (‘bw’), nhiễu cơ (‘ma’) và nhiễu do sự dịch chuyển của điện cực (‘em’) thông qua việc sử dụng một tập lệnh [55]. Ưu điểm của việc làm này là có thể đánh giá độ chính xác đạt được của thuật toán với các mức nhiễu khác nhau trên cùng một tín hiệu. Tuy nhiên, nhược điểm của NSTDB là sử dụng các chú thích khơng nhất qn của cơ sở dữ liệu MIT-BIH và không đại diện cho các bản ghi ECG gắng sức vì đây là tín hiệu nhiễu tổng hợp với mức nhiễu tĩnh. Cơ sở dữ liệu cịn lại đó là Motion Artefact Contaminated ECG Database với 27 bản ghi ECG thu nhận từ một đối tượng ở trạng thái đứng, đi và thực hiện một bước nhảy [7]. Cơ sở dữ liệu này có số lượng bản ghi ECG nhỏ được thu nhận từ một đối tượng duy nhất và khơng có chú thích nên khơng hữu dụng cho việc đánh giá độ chính xác của các thuật tốn nhận dạng tự động phức bộ QRS.
Để đánh giá hiệu suất của các phương án đề xuất, GUDB của trường Đại học Glasgow là một cơ sở dữ liệu phù hợp để sử dụng [33]. Cơ sở dữ liệu này được thu nhận từ 25 đối tượng thực hiện các hoạt động khác nhau như ngồi yên, ngồi làm kiểm tra toán trên iPad, đi bộ, sử dụng hand-bike và chạy bộ trên máy chạy. Các tín hiệu ECG được ghi nhận đồng thời từ chuyển đạo Einthoven II và từ một dây đeo ngực (chest strap). Ngoài ra, dữ liệu gia tốc theo các trục X, Y và Z cũng được ghi nhận đồng thời để quan sát ảnh hưởng của nhiễu tới tín hiệu ECG do sự tăng tốc [33]. Các thuật tốn lọc thích nghi có thể sử dụng dữ liệu gia tốc vào loại bỏ ảnh hưởng của nhiễu tới chất lượng tín hiệu ECG. Các tín hiệu ECG được chú thích với độ chính xác mẫu cho phép nhằm xác định các điểm chuẩn dành cho việc đánh giá độ chính xác của các thuật tốn nhận dạng phức bộ QRS. Một cơ sở dữ liệu với mức độ nhiễu tăng dần cho phép đánh giá hiệu suất hoạt động của thuật toán một cách tốt nhất. Quy trình lắp đặt thiết bị và thu nhận cơ sở dữ liệu GUDB được thể hiện trong Hình 1.7.
Hình 1.7: Lắp đặt thiết bị và tín hiệu ECG đo được [33]
Cơ sở dữ liệu GUDB bao gồm tổng cộng 125 bản ghi (250 tín hiệu ECG) có độ dài 2 phút được thu nhận từ 25 đối tượng với yêu cầu thực hiện 5 nhiệm vụ khác nhau như sau:
• Ngồi yên trên ghế
• Sử dụng máy tính bảng để thực hiện bài kiểm tra tốn
• Đi bộ trên máy chạy với tốc độ 2 kph
• Sử dụng máy hand-bike để tập
• Chạy bộ trên máy chạy với tốc độ 8 kph