Bài viết trình bày các bước xây dựng một mô hình phân lớp điện tim sử dụng hệ mờ không đơn trị (NSFLS). Đầu tiên, các tín hiệu điện tim được cho qua một khối tiền xử lý để loại nhiễu do môi trường ghi điện tâm đồ gây ra.
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA ỨNG DỤNG GIẢI THUẬT DI TRUYỀN (GA) ĐỂ TỐI ƯU THAM SỐ HỆ MỜ TRONG PHÂN LỚP TÍN HIỆU ĐIỆN TIM APPLICATION OF GA FOR OPTIMISING PARAMETERS OF FUZZY SYSTEMS IN ECG CLASSIFICATION Hoàng Thị Ngọc Diệp, Trần Duy Khánh, Hoàng Thị An Email: hoangdiepdtth@gmail.com Trường Đại Học Sao Đỏ Ngày nhận bài: 16/2/2017 Ngày nhận sửa sau phản biện: 6/11/2017 Ngày chấp nhận đăng: 28/12/2017 Tóm tắt Bài báo trình bày bước xây dựng mơ hình phân lớp điện tim sử dụng hệ mờ không đơn trị (NSFLS) Đầu tiên, tín hiệu điện tim cho qua khối tiền xử lý để loại nhiễu mơi trường ghi điện tâm đồ gây Tín hiệu sau xử lý nhiễu phân tích trích rút đặc trưng thích hợp Các đặc trưng đầu vào hệ phân lớp mờ không đơn trị Sau xác định cấu trúc mơ hình phân lớp, xây dựng tham số mơ hình qua q trình học dựa vào tập liệu huấn luyện Cuối cùng, nhóm tác giả sử dụng giải thuật di truyền để tối ưu tham số hệ mờ nhằm thu kết phân lớp tín hiệu điện tim tốt Từ khóa: Hệ mờ không đơn trị (NSFLS); giải thuật di truyền (GA); phân loại mẫu; phân lớp tín hiệu điện tim (ECG) Abstract The paper presents a method to construct a non-singleton fuzzy logic system (NSFLS) for ECG arrhythmic classification The classifier is applied to distinguish normal sinus rhythm (NSR), ventricular fibrillation (VF) and ventricular tachycardia (VT) Two features of ECG signal, the average period and the pulse width, are inputs to the fuzzy classifier The rule base used in the fuzzy system is constructed from training data The generalized bell membership function is used to examine the performance of the classifier with different shapes of membership function The results of experiments with data from the MIT-BIH Malignant Ventricular Arrhythmia Database show the viability of a non-singleton fuzzy system in ECG classification Then, GA Optimisation of Non-Singleton Fuzzy Logic System for ECG Classification to obtain the best results Keywords: Non-singleton fuzzy logic system (NSFLS); genetic algorithm (GA); pattern classification; electrocardiogram (ECG) GIỚI THIỆU Trong thực tế có nhiều tốn cần phân loại mẫu tốn phân loại ảnh khn mặt, phân loại văn bản, phát lỗi phân tích máy móc y tế, phân loại chữ viết… Có nhiều vấn đề người xử lý đơn giản Trái lại, nhiều trường hợp, phương án sử dụng máy tính mức độ khó vấn đề Tuy gặp nhiều khó khăn việc sử dụng máy tính tốn nhận dạng mẫu ngày trở nên phổ biến Mục đích việc phân loại mẫu tự động trợ giúp người phân tích khối lượng liệu cực lớn từ trích chọn tri thức hữu ích Mặc dù có nhiều phương thức phân loại chúng có chung cấu trúc tảng bước thiết kế Theo [8] thành phần phân loại trình tự thiết kế phân loại hình Bước trích chọn đặc trưng biến đổi liệu đầu vào (trong không gian quan sát) thành vectơ đặc trưng (trong không gian đặc trưng) Không gian đặc trưng có số chiều nhiều so với khơng gian quan sát Bước biến đổi từ không gian đặc trưng sang không gian định định nghĩa tập lớp (xác định) Một phân loại hay thuật toán sinh phân hoạch không gian đặc trưng miền định Sau thiết kế phân loại với Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 NGHIÊN CỨU KHOA HỌC hiệu mong muốn, ta sử dụng để loại mẫu tiết kiệm chi phí tính tốn Nếu phân loại đối tượng Điều có nghĩa đặc trưng thừa hay khơng thích hợp ảnh hưởng phân loại gán vectơ đặc trưng đến hiệu chất lượng phân loại không gian đặc trưng với lớp không mẫu, chí dẫn tới việc phân loại sai gian định Do có nhiều cách lựa chọn thuật tốn nên độ khó Trong tốn phân loại mẫu, trích chọn đặc trích chọn đặc trưng đa dạng Hơn trưng nhiệm vụ khó khăn nhất, định đến nữa, ứng dụng ta ln phải đối mặt với độ xác thuật tốn Khi trích chọn đặc nhiễu Ngun nhân chúng nhiễu điện trưng cần lựa chọn đặc trưng hữu ích để thiết bị trích chọn thao tác thiết tìm thuật tốn học hiệu cho tốn phân bị khơng Dữ liệuvào vào Dữ liệu Thu nhập dữdữ liệu Thu thập Cảm biến Cảm biến Lựa chọn đặcđặc trưng Lựa chọn Tiền xử lýlý Tiền xử Trích chọn Trích chọn đặcđặc trưng t Phân lớp Phân lớp Lựachọn chọ lớp Lựa lớp Huấn phân loại Huấnluyện luyện phân Đánh giágiá hiệu suất Đánh hiệu ấ Quyết Quyếtđịnh định Kết thúc Kết thúc a) b) b) a) Hình a) Các thành phần phân loại; b) Trình tự thiết kế phân loại sử dụng GA Đã có nhiều nghiên cứu để phân lớp tín hiệu điện đơn trị có nhiễu đặc trưng trích tim Theo [3] với mơ hình mờ sử dụng logic mờ loại khoảng đơn trị khả làm việc với nhiễu hiệu chưa cao Theo [9] sử dụng hệ mờ loại hai khoảng thuật toán VF - Filter Leakage khả phân lớp chưa tối ưu hóa hàm thuộc sở luật Do đó, hệ mờ khơng đơn trị chọn thích hợp hệ mờ đơn trị làm việc với nhiễu Giải thuật di truyền dùng để tối ưu hóa đồng thời hàm thuộc sở luật Bài báo trình bày khả hệ mờ khơng đơn trị giải thuật di truyền để xử lý nhiễu toán phân loại mẫu Hiệu hệ thống đơn trị không đơn trị so sánh với toán phân lớp điện tim Các kết giải thuật di truyền tốt hệ mờ chọn Điều hữu ích tránh khỏi nhập nhằng liệu đầu vào [8] GIẢI THUẬT DI TRUYỀN ÁP DỤNG VÀO BÀI TỐN ECG 2.1 Bài tốn ECG Bài tốn phân lớp điện tim mơ tả theo sơ đồ hình 2, đó: - Đầu vào gồm hai đặc trưng: độ rộng xung (PW), chu kỳ xung (T) - Đầu loại nhịp tim (phân làm ba lớp): NRS (nhịp tim bình thường), VF (chứng rung tâm thất) VT (chứng tim đập nhanh) Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HĨA Tín hiệu điện tim đầu vào Xử lý trích rút đặc trưng tín hiệu Phân lớp tín hiệu rn n = 1, 2, …, Do vậy, tổng cộng 21 tham số (3 chức thành viên × tham số × biến đầu vào + quy tắc) cần thiết để giải thuật di truyền điều chỉnh + Mỗi tham số luật mã hóa thành chuỗi nhị phân 2-bit + Mỗi tham số hàm mã hóa thành chuỗi nhị phân 8-bit Do đó, chiều dài chuỗi nhị phân 114 bit (12x8+2x9=114 bit) Minh họa cấu trúc nhiễm sắc thể (hình 3) Loạn nhịp tim Hình Sơ đồ toán ECG 2.2 Giải thuật di truyền Giải thuật di truyền sử dụng mã hóa nhị phân, cá thể chuỗi bit, thông qua toán tử di truyền: chọn lọc, lai ghép, đột biến, tái tạo procedure Genetic_Algorithm; begin Hình Cấu trúc nhiễm sắc thể Trong trình thẩm định thích hợp tham số phải giải mã (kiểu hình đại diện) + Tham số luật giải mã thành dãy số nguyên 0-4 + Tham số hàm giải mã thành số thực cách sử dụng phương trình lập đồ tuyến tính [3]: Aq (1) max g p = Gq t ← 0; Khởi tạo hệ ban đầu P(t); Đánh giá P(t) (theo hàm thích nghi); repeat t ← t + 1; Sinh hệ P(t) từ P(t-1) • Chọn lọc + (Gq − Gq ) × 2N −1 đó: p q: chuỗi gen tương ứng; gp biểu thị giá trị thực tế tham số qth; Aq biểu diễn max số nguyên đại diện chuỗi gen N-bit; Gq Gqmin biểu thị cho người dùng xác định giới hạn gen tương ứng CẤU TRÚC CỦA MƠ HÌNH PHÂN LỚP MỜ SỬ DỤNG GA ĐỂ TỐI ƯU THAM SỐ Về bản, kiến trúc chung mơ hình GA giống với mơ hình phân lớp loại hai khoảng Tuy nhiên cấu trúc có thêm khối tiền xử lý giảm bớt khối giảm loại khử mờ • Lai ghép • Đột biến Đánh giá P(t); until Điều kiện kết thúc thỏa mãn; end; 2.3 Giải thuật di truyền ứng dụng vào toán ECG Khi thiết kế hệ mờ giải toán ECG dùng giải thuật di truyền, xem xét chiến lược trình bày cách thức mã hóa hệ mờ vào nhiễm sắc thể Trong thiết kế giải thuật di truyền báo có hai đầu vào đầu vào gồm hai biến x1 x2 (có thể độ rộng xung chu kỳ hoăc độ rộng xung biên độ) phân chia thành ba hàm, đó, có 12 tham số (vì tham số x đầu vào x chức thành viên = 12 tham số) Giả sử khơng tính tổng quát độ lệch l l tiêu chuẩn hàm tham gia mxi σ xi , với i = 1, l = 1, 2, Ngồi có luật (3x3) quy tắc sở, thêm kết phụ tham số, Hình Cấu trúc hệ phân loại mờ sử dụng GA Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(59).2017 NGHIÊN CỨU KHOA HỌC 3.1 Khái niệm hệ mờ không đơn trị Kaufman Gupta [7] định nghĩa phép mờ hóa khơng đơn trị: Một mờ hóa khơng đơn trị có ′) 1(= i 1, , p ) µ X i ( xi ) giảm dần từ dạng µ X i ( xi= xi xa dần xi′ Lấy x[m] trung bình cộng phần tử mảng {Xi} Tạo mảng X’ cách lấy giá trị phần từ trừ Xm: X’i = {xi – xm} 3.2 Khối tiền xử lý Làm công việc sau mảng X’: Xét phân loại, giả sử có số loại nhiễu Đầu tiên, đầu vào phân loại bị hỏng Các tín hiệu điện tim ghi (đặc biệt tín hiệu điện tim đo bề mặt) nhạy cảm với việc di chuyển cáp điện hoạt động Ngoài ra, nhiễu từ mạng điện sai lệch q trình ghi nhận tín hiệu Do đó, tín hiệu cần tiền xử lý để thu thơng tin từ tín hiệu xác - Tính giá trị âm nhỏ Vn giá trị dương lớn Vp Việc trích rút hai đặc trưng độ rộng xung, chu kỳ xung tín hiệu thực qua hai bước Tín hiệu điện tim sau lọc biến đổi thành chuỗi nhị phân để làm tăng khả trích chọn đặc trưng Thuật tốn biến đổi sử dụng báo cải tiến (nội dung bước 2) từ thuật toán [8] Bài báo sử dụng thuật tốn biến đổi hai bước thay thuật tốn biến đổi bước Zhang Tín hiệu điện tim biến đổi phần thành chuỗi nhị phân thay biến đổi tồn Điều làm giảm việc phát sai đỉnh tích cực cách khử tín hiệu có biên độ nhỏ Sau bước bước biến đổi hoàn toàn chuỗi nhị phân nhằm xác định ngưỡng để cực đại hóa khác biệt lớp NSR lớp VF/VT Sau đó, ta tính tốn độ rộng xung, chu kỳ xung trung bình tín hiệu dựa vào chuỗi nhị phân VFDB - sở liêu chứng loạn nhịp thất ác tính MIT-BIH CSDL điện tim MIT-BIH [10] với tập liệu trích từ sở liệu điện tim từ dự án hợp tác Học viện Kỹ thuật Massachusetts Bệnh viện Beth Israel (MIT-BIH) Đây sở liệu điện tim phong phú đầy đủ, sử dụng rộng rãi nghiên cứu học tập giới Các bước trình bày sau: Thuật tốn: Bước 1: Chuyển mẫu tín hiệu (4s tín hiệu) ban đầu thành chuỗi nhị phân Với liệu VFDB, chọn 4s liệu Tại tần số 250 Hz tín hiệu rời rạc nên có tất 1000 điểm liệu cửa sổ dài 4s ta có n = 1000 mẫu có giá trị Xi với i = 1, 2, , 1000 - Tạo phần chuỗi nhị phân: Nếu phần tử có giá trị khoảng (0