PHÂN LOẠI HOẠT ĐỘNG DỰA VÀO TÍN HIỆU EEG

Một phần của tài liệu Kết hợp tín hiệu EEG, Camera và vật mốc để định vị, điều khiển xe lăn điện đến đích dựa vào bản đồ (Trang 45 - 48)

Phân loại tín hiệu EEG nói chung hay phân loại tín hiệu EEG về hoạt động mắt nói riêng là mấu chốt quan trọng trong việc hỗ trợ người không có khả năng tự chủ vận động. Hiện nay, có rất nhiều nghiên cứu phân loại các dạng tín hiệu EEG đã thành công về mặt nghiên cứu và ứng dụng. Điều này đã giúp người khuyết tật được chủ động hơn và cảm thấy hạnh phúc hơn trong cuộc sống của mình.

2.2.1. Phát hiện hoạt động mắt dựa vào ngưỡng biên độ tín hiệu EEG

Việc phát hiện các hoạt động của mắt như nháy mắt dựa vào ngưỡng biên độ tín hiệu EEG cho thấy sự hiệu quả với thời gian xử lý nhanh chóng và không yêu cầu đào tạo người dùng trước khi thực thi thuật toán [57, 58]. Các tín hiệu EEG được lọc và được làm mịn trước khi phát hiện nháy mắt. Thuật toán phát hiện nháy mắt tập trung vào việc tính toán đỉnh chính xác dựa vào đặc tính ngưỡng và biên độ đỉnh [57]. Thuật toán có thể hoạt động chính xác trên một hoặc hai kênh tín hiệu EEG. Các bộ dữ liệu EEG khác nhau đã được sử dụng để đánh giá độ chính xác của thuật toán cho

thấy rằng thuật toán có độ chính xác trung bình trên 96% cho phân loại nháy mắt trái và nháy mắt phải.

Bên cạnh phương pháp phát hiện đỉnh của tín hiệu EEG cho phân loại hoạt động mắt, nghiên cứu của nhóm Trung Nguyễn [58] đã sử dụng giá trị trung bình của tín hiệu EEG khi mở mắt để xác định ngưỡng cho việc phân loại mở mắt và nháy mắt. Công thức (2.1) mô tả cách xác định ngưỡng trung bình như sau:

𝑇𝐻𝑅 = 𝑀 − 𝑎 × 𝑆𝐷 (2.1)

trong đó a là hệ số của độ lệch chuẩn SD, M là giá trị trung bình của tín hiệu mở mắt. Độ lệch chuẩn và giá trị trung bình của tín hiệu mở mắt được tính như sau:

∑𝑁 𝑦(𝑛)

𝑀 = 𝑛=1

𝑁 (2.2)

√∑𝑁 (𝑦(𝑛)−𝑀)

𝑆𝐷 = 𝑛=1

𝑁 (2.3)

với y(n) là tập hợp các tín hiệu EEG và N là số lượng mẫu.

2.2.2. Phân loại tín hiệu EEG dùng mạng nơ-ron

Tibdewal và cộng sự trình bày một mạng nơ-ron nhân tạo đơn giản và hiệu quả với tên gọi là thuật toán Biên độ thời gian [59]. Bằng cách áp dụng thuật toán Biên độ thời gian trên tín hiệu được xác định, chuyển động mắt ở các vùng khác nhau được tự động phát hiện và đánh dấu chính xác như mô tả ở hình 2.1. Thời gian thực hiện thuật toán Biên độ thời gian để tự động phát hiện chuyển động của mắt là rất ngắn, khoảng 4,3 ms và độ chính xác 97,5%.

Hình 2.1. Tín hiệu EEG được phát hiện với các vùng chuyển động của mắt.

Nghiên cứu của nhóm Nguyễn Thanh Hải [18] sử dụng đầu vào của mạng nơ- ron là các đặc trưng được trích xuất từ tín hiệu EEG bằng mô hình tự hồi quy cho phân loại hoạt động mắt như mở mắt, nháy mắt, liếc mắt với độ chính xác 94%.

Nghiên cứu của tác giả Lâm Quang Chuyên năm 2020 sử dụng dữ liệu từ 10 kênh của thiết bị Emotiv Epoc [50]. Dữ liệu thô để huấn luyện mô hình mạng nơ-ron là 5 dạng sóng Delta, Theta, Alpha, Beta, Gamma có được khi các đối tượng thí nghiệm nhìn vào 5 loại hình ảnh khác nhau. Sau đó, tác giả sử dụng biến đổi HTT và kỹ thuật gom cụm để trích đặc trưng tín hiệu cho việc huấn luyện, với độ chính xác của mô hình phân loại là 92,68%.

Đặc điểm chung của các nghiên cứu phân loại hoạt động mắt dùng mạng nơ- ron là cần phải thực hiện trích xuất các đặc trưng của tín hiệu EEG. Quá trình này sẽ cần nhiều thời gian để phân tích và tạo ra cơ sở dữ liệu cho việc huấn luyện, đồng thời độ chính xác của mô hình mạng nơ-ron phụ thuộc nhiều vào độ chính xác của quá trình trích đặc trưng.

2.2.3. Phân loại tín hiệu EEG dùng mạng nơ-ron tích chập

Trong những năm gần đây, các nghiên cứu đã tập trung vào việc ứng dụng mô hình mạng nơ-ron tích chập CNN để phân loại các tín hiệu EEG. Trong nghiên cứu của Abdul Qayyum [60], tín hiệu EEG thu được từ phép biến đổi Wavelet rời rạc của tín hiệu gốc được sử dụng làm đầu vào cho mô hình CNN-1D để phân biệt các cấp độ khác nhau của trạng thái nghỉ ngơi và học tập. Z. Pei và các cộng sự đã sử dụng các đặc trưng của tín hiệu EEG từ một kênh kênh và nhiều kênh để phân loại nhiều nhiệm vụ công việc với độ chính xác là 85% [61]. Mô hình CNN-3D lặp lại sử dụng các đặc trưng từ phổ tần số, thời gian và không gian của tín hiệu EEG để phân loại mức độ khối lượng công việc trí óc cao và thấp cho 20 đối tượng với độ chính xác 88,9% được đề xuất bởi P. Zhang [62]. Tuy nhiên, hầu hết các nghiên cứu này sử dụng bước tiền xử lý để cải thiện độ chính xác phân loại hoặc biểu diễn tần số, thời gian của tín hiệu EEG dưới dạng đầu vào 2D hoặc 3D cho mô hình CNN, làm cho kiến trúc CNN tổng thể trở nên phức tạp và tăng thời gian tính toán của toàn hệ thống.

Mô hình phân loại của Rajedra Acharya và cộng sự năm 2017 sử dụng CNN- 1D để phân biệt 3 loại tín hiệu EEG của người bình thường và người co giật [63].

Cấu trúc mô hình CNN-1D gồm 13 lớp, trong đó có 5 lớp tích chập, 5 lớp max- pooling và 3 lớp kết nối đầy đủ với 3 đầu ra tương ứng cho 3 tín hiệu cần nhận dạng. Các phân đoạn điện não đồ được sử dụng trong nghiên cứu này là những phân đoạn được thu thập bởi Andrzejak và cộng sự tại Đại học Bonn, Đức. Tập dữ liệu thu được từ 5 bệnh nhân, gồm ba tập dữ liệu là bình thường, trước đột quỵ, và động kinh, với 100 tín hiệu EGG trong mỗi tập dữ liệu. Thời gian thu tín hiệu trung bình là 23,6s. Độ chính xác của mô hình phân loại đạt 88,67%.

Một phần của tài liệu Kết hợp tín hiệu EEG, Camera và vật mốc để định vị, điều khiển xe lăn điện đến đích dựa vào bản đồ (Trang 45 - 48)

Tải bản đầy đủ (DOCX)

(207 trang)
w