Sau khi lựa chọn được 20 đặc trưng ở cả hai loại tín hiệu EEG và HRV như bảng 4.6, tiếp theo chúng tơi tiến hành giảm chiều dữ liệu sử dụng phương pháp nlPCA. Số chiều để giảm cho từng bộ đặc trưng se được tiến hành như đã trình bày ở mục 3.5.5. Kết quả của bước chọn số chiều tối ưu thể hiện trong Hình 4.4 và 4.5 bên dưới.
ĐẠI HỌC BÁCH KHOA – ĐHQG TP HCM LUẬN VĂN TỐT NGHIỆP
GVHD: ThS. LÊ QUỐC KHẢI 66
ĐẠI HỌC BÁCH KHOA – ĐHQG TP HCM LUẬN VĂN TỐT NGHIỆP
67
GVHD: ThS. LÊ QUỐC KHẢI
Hình 4.4 Phần trăm phương sai của dữ liệu biểu diễn bởi các PC cho bộ đặc trưng tổng hợp.
Hình 4.5 Phần trăm phương sai của dữ liệu biểu diễn bởi các PC. Bên trái là bộ đặc trưng EEG. Bên phải là bộ đặc trưng HRV.
Dựa theo hình 4.4 và 4.5, ta cĩ được số PC tối ưu cho bộ đặc trưng EEG là 4 PC, bộ HRV là 2 PC và tổng hợp cả hai là bộ đặc trưng là 6 PC.
Do khơng thể ve được các cấu trúc 4 chiều của bộ đặc trưng EEG hay 6 chiều của bộ đặc trưng tổng hợp, chúng tơi quyết định ve riêng từng PC trên mơi đồ thị để dễ quan sát và thống nhất hơn khi biểu diễn kết quả.
Hình 4.6 Sự phân bố của dữ liệu trên các chiều (PC) từ PC1-PC6 với bộ đặc trưng tổng hợp.
Hình 4.7 Sự phân bố của dữ liệu trên các chiều (PC) từ PC1-PC4 với bộ đặc trưng từ tín hiệu EEG.
Hình 4.8 Sự phân bố của dữ liệu trên các chiều (PC) từ PC1-PC4 với bộ đặc trưng từ tín hiệu HRV.
Từ sự phân bố ở hình 4.6, 4.7, và 4.8, theo kinh nghiệm của chúng tơi thì cĩ thể dựa vào sự phân chia của hai trạng thái ở mơi trục để xác định số nơ-ron ở mơi lớp cho cấu trúc của mơ hình phân loại. Như đã trình bày ở phần tổng quan về mạng nơ-ron nhân tạo, mơi nơ-ron ở lớp 1 tương ứng với một đường thẳng phân chia dữ liệu thành 2 miền, vì vậy ta se xem xét 1 cách định tính cĩ khoảng bao nhiêu đường thẳng cần thiết để cĩ thể phân chia các trạng thái ở mơi trục. Cũng theo kinh nghiệm, trung vị của số đường thẳng chia miền ở mơi trục chính là số nơ- ron nên cĩ ở các lớp ẩn. Một điểm cần lưu ý là số nơ-ron tối đa khơng nên vượt quá số nơ-ron ở lớp input để tránh tình trạng “overfit”.