Phân lớp mềm

Một phần của tài liệu Nghiên cứu tổng hợp xúc tác ni than sinh học đã sunfo hóa đi từ nguồn vi tảo và ứng dụng cho quá trình HDO dầu sinh học (Trang 46)

V. Kết luận

1 Đặc trưng thống kê (miền thời gian) của tín hiệu

3.2.3 Phân lớp mềm

Phân lớp với khoảng cách lề cực đại chỉ áp dụng được đối với các tập dữ liệu khả tách tuyến tính.

Trên thực tế, thường gặp các tập dữ liệu không khả tách tuyến tính. Để xây dựng một máy phân lớp với khoảng cách lề cực đại phù hợp với các loại dữ liệu , cần phải nới lỏng ràng buộc của (3.3). Nghĩa là không ép buộc dữ liệu phải nằm hoàn toàn về hai phía của H1 và H2.

Hình 3.2.3: Minh họa phân lớp mềm bằng SVM

Trong trường hợp này, ta thêm vào các biến trễ (slack variables) không âm ξi

sao cho:

( T ) 1 1

i i i

y w ⋅ + ≥ −x b ξ ≤ ≤i p (3.5) với ξi ≥0 ∀i (3.6) và hàm mục tiêu trong (3.4) được thay bằng hàm mục tiêu có dạng hàm phạt:

1 1 . 2 m p T i i w w C ξ =   +   ∑  (3.7) trong đó C > 0 là một tham số tùy chọn ( C càng lớn thì lượng phạt lỗi càng cao).

, 1 1 min . 2 p T i w b w w C i ξ = + ∑ (3.8) thỏa mãn (3.5) và (3.6) 3.2.4 SVM phi tuyến

Về mặt thực tế, siêu mặt phân lớp có thể không phải tuyến tính mà là một siêu mặt phi tuyến bất kì. Năm 1992, Vapnik, Guyon, Boser đã đề xuất một phương pháp để tạo ra SVM phi tuyến. Nếu dữ liệu không khả tách tuyến tính thì ta có thể ánh xạ các dữ liệu này vào một không gian đặc trưng với số chiều cao hơn sao cho trong không gian mới này, dữ liệu sẽ khả tách tuyến tính.

Theo đó, các mẫu xi thuộc không gian n

R ban đầu được ánh xạ tới một không gian khác Rd với (d>n) như ở hình 4.13. Tiếp đến sử dụng SVM tuyến tính để tìm siêu mặt phẳng phân lớp trong không gian Rd

. Siêu mặt phẳng phân lớp này tương ứng với siêu mặt phi tuyến trong không gian Rn

. Các phép ánh xạ được sử dụng phổ biến là •Ánh xạ đa thức đồng nhất ( i, j) ( i j)d K x x = x x⋅ (3.9) •Ánh xạ đa thức không đồng nhất ( i, j) ( i j 1)d K x x = x x⋅ + (3.10) •Ánh xạ hàm gốc xuyên tâm RBF (Radial Basic Function)

( ) ( 2) , exp i j i j K x x = −γ xx (3.11) •Ánh xạ sigma ( i, j) tanh( i j ) K x x = κx x⋅ +c (3.12)

Hình 3.2.4: Ánh xạ từ miền Rn sang miền Rd

.

3.3 Kết luận

Thông qua chương này đã trình bày về mạng trí tuệ nhân tạo: là trí tuệ được biểu diễn bởi bất cứ hệ thống nhân tạo nào. Thuật ngữ này thường dùng để nói đến các máy tính có mục đích không nhất định và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của trí tuệ nhân tạo. Mà trong luận văn chúng ta nghiên cứu về một số hệ thống nhận dạng thường được sử dụng hiện nay bao gồm: mạng nơ-ron nhân tạo và máy vec-tơ hỗ trợ SVM.

Mạng nơ-ron nhân tạo được coi là một công cụ mạnh để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt trong các trường hợp mà mối quan hệ giữa các quá trình không dễ thiết lập một cách tường minh.Chúng ta nghiên cứu về nơ- ron sinh học, nơ-ron nhân tạo và ứng dụng của mạng nơ-ron nhân tạo bằng cách nắm rõ mối liên hệ giữa ngõ vào và ngõ ra biết trước của mạng.

Máy véc-tơ hỗ trợ SVM là 1 kĩ thuật trong thống kê và khoa học máy tính cho một tập hợp các phương pháp học có giám sát liên quan đến nhau để phân loại và phân tích hồi quy. Tuy nhiên, ở đây chỉ giới thiệu các khái niệm tổng quan về SVM dùng cho phân loại. Hiểu đơn giản SVM là một thuật toán phân loại nhị phân, nhận dữ liệu vào và phân loại chúng vào 2 lớp khác nhau bằng cách tìm 1 siêu phẳng tối ưu để tách tập mẫu thành hai lớp sao cho khoảng cách lề (margin) giữa hai lớp đạt cực đại. Tùy vào loại của dữ liệu vào có thể phân loại SVM thành SVM tuyến tính (tập dữ liệu vào là khả tách tuyến tính) và SVM phi tuyến (tập dữ liệu vào không khả tách tuyến tính).

Chương 4 -PHƯƠNG PHÁP TIÊN TIẾN XỬ LÝ TÍN HIỆU ĐIỆN NÃO ĐỒ NHẰM PHÁT HIỆN BỆNH ĐỘNG KINH

Chương này sẽ trình bày về phương pháp tiên tiến xử lý tín hiệu điện não đồ(EEG) nhằm phát sớm hiện bệnh động kinh: phương pháp phân loại sử dụng máy véc-tơ hỗ trợ SVM(sử dụng đặc trưng đơn biến).

4.1 Mô hình tổng quan

Trong phần nghiên cứu này, chúng tôi chọn nghiên cứu bài toán phát hiện xuất hiện cơn động kinh trên các đối tượng người bệnh chủ yếu là trẻ em. Trong trường hợp này đối tượng được nghiên cứu là bản ghi tín hiệu EEG đa kênh với các đặc trưng được lựa chọn bao gồm biên độ, tần số cơ bản, hình dạng và vị trí không gian ghi nhận trên da đầu (scalp)… và sẽ được phân loại dựa trên các đặc trưng được học của các mẫu học từ bệnh nhân. Mô hình tổng quan được minh họa trong Hình 4.1.1

Hình 4.1.1: Mô hình chẩn đoán bệnh động kinh

4.1.1 Thu thập dữ liệu

Điện não đồ (EEG – Electroencephalogram ) đo và biểu diễn sự thay đổi điện thế theo thời gian của các điện cực được đặt ở các vị trí khác nhau trên da đầu tương ứng với các vùng của vỏ não. Tín hiệu này là phản hồi điện sinh học ngay tức khắc của tế bào não. Mỗi kênh EEG là một tín hiệu điện đo được từ một điện cực cố định

Thu thập dữliệu Tiền xử lý tín hiệu Trích chọn các đặc trưng

Phân loại & hậu xử lý

Tham số thống kê (mean, variance, skewness, kurtosis)

Horjth (Mobility, Complexity) Năng lượng tín hiệu (sóng delta, theta, alpha, beta,… )…..

ngoài da (surface/scalp-EEG, sEEG) hoặc trong não (intracranial-EEG, iEEG). Trong các công trình khoa học nghiên cứu về nhận dạng động kinh chủ yếu sử dụng các bộ CSDL chuẩn đã được dánh dấu (nhận dạng) bởi các chuyên gia về động kinh. Trong chương 2, chúng tôi đã giới thiệu về bộ CSDL của ĐH Freiburg và CHB-MIT là các bộ CSDL được sử dụng phổ biến hiện nay.

4.1.2 Tiền xử lý tín hiệu

Dùng để hạn chế và loại bỏ nhiễu trong tín hiệu điện não EEG. Chúng ta có ba cách: thứ nhất là ngăn chặn và loại bỏ các nguồn gây nhiễu; thứ hai là tối thiểu hóa ảnh hưởng của các nguồn nhiễu; thứ ba là nhận dạng và loại bỏ các tín hiệu nhiễu. Phương pháp tốt nhất không có nhiễu là ngăn chặn và loại bỏ các nguồn gây nhiễu, tuy nhiên đối một số loại nhiễu (như nhiễu do nháy mắt, nhiễu cơ …) thì phương pháp này không khả thi. Thứ hai ta có thể hạn chế tối đa nhiễu bằng bằng việc sử dụng các thiết bị kỹ thuật đo đạc hiện đại có độ nhạy cao, khả năng lọc nhiễu tốt, … tuy nhiên phương pháp này đắt tiền và phức tạp. Trong cách thứ ba, bằng việc sử dụng các thuật toán xử lý tín hiệu số chúng ta có thể khá dễ dàng nhận dạng các nguồn nhiễu và loại bỏ chúng. Phương pháp này không những không yêu cầu các thiết bị phần cứng phức tạp và đắt tiền mà còn có tính linh hoạt rất cao trong nhận dạng và loại bỏ nhiễu khỏi tín hiệu điện não.

4.1.3 Trích chọn các đặc trưng

Mô hình cửa sổ trượt được sử dụng trong module trích chọn đặc trưng. Các kỹ thuật dự đoán dựa trên EEG đều sử dụng đều sử dụng một cửa sổ trượt trong đó các đặc trưng sẽ được tính toán (phân tích) trong cửa sổ có độ dài xác định trước, sau đó các cửa sổ tiếp theo sẽ lần lượt được phân tích. Khoảng thời gian phân tích của cửa số thường nằm trong khoảng 5-40 giây. Ở đây, sự phụ thuộc vào các phân tích được sử dụng đặc trưng cho tín hiệu của một kênh đơn EEG hoặc đặc trưng mối liên hệ giữa hai hay nhiều kênh, ta lần lượt có các đặc trưng đơn biến, lưỡng biến hay đa biến. Do vậy, sau phân tích cửa sổ trượt sẽ trả lại các giá trị (theo thời gian) phản ánh đặc trưng của các kênh khác nhau hoặc giữa các kênh.

Phương pháp cửa sổ trượt thỏa mãn 2 điều kiện:

• Khoảng thời gian là đủ ngắn để quá trình xử lý được xem là tĩnh (stationary process).

Hình 4.1.2: Phương pháp cửa sổ trượt để trích chọn các đặc trưng

Trong để tài khoảng thời gian cửa sổ được chọn là 5s. Bên cạnh đó, ngoài kích thước cửa sổ (window size), chúng ta sử dụng thêm khái niệm Step size. Khi Step size bằng kích thước cửa sổ thì sẽ không có sự chồng lấn (overlap) giữa các cửa sổ. Chẳng hạn trường hợp kích thước cửa sổ bằng 5 giây và Step size bằng 2 giây, khi đó các cửa sổ liền nhau sẽ có sự chồng lấn tín hiệu khoảng 60%.

4.1.4 Phân loai và hậu xử lý

Trong phần phân loại, đầu ra đơn giản nhất sẽ là bài toán phân loại nhị phân (ON và OFF, 0 và 1). Trong trường hợp này đối tượng được nghiên cứu là bản ghi tín hiệu EEG đa kênh với các đặc trưng được lựa chọn bao gồm biên độ, tần số cơ bản, hình dạng và vị trí không gian ghi nhận trên da đầu (scalp)… và sẽ được phân loại thành tín hiệu EEG tiền động kinh (pre-ictal) hoặc phi tiền động kinh (non- preictal) dựa trên các đặc trưng được học của các mẫu học từ bệnh nhân. Mỗi mẫu (đối tượng, thực thể..) dữ liệu là một vector gồm các đặc trưng với trong một thời điểm cụ thể.

Một cách phân loại khác với nhiều đầu ra nhằm cảnh báo về động kinh cũng được nghiên cứu. Trong trường hợp này, chúng ta có thể phân làm 3 hoặc 4 nhóm (loại) tín hiệu. Loại 3 đầu ra gồm: tín hiệu bình thường (thường ký hiệu là

normal/inter-ictal), tiền động kinh (pre-ictal), động kinh (ictal). Loại 4 đầu ra có thêm tín hiệu sau động kinh (thường ký hiệu non-preictal/ post-ictal).

Hình 4.1.3: Minh họa bài toán phân loại.

Hình 4.1.3 minh họa bài toán phân loại. Tín hiệu EEG được chia thành ba đoạn thời gian: inter-ictal (bình thường), pre-ictal và động kinh (xác định bởi chuyên gia). Inter-ictal và pre-ictal được chia thành các cửa sổ với độ dài (thời gian) xác định, từ đó các đặc trưng sẽ được chọn lọc và phân loại, trong đó đoạn pre-ictal được gán nhãn +1 và inter-ictal là -1. Hình A, tất cả cửa sổ inter-ictal đều đước phân loại đúng, đồng thời ít nhất một cửa sổ pre-ictal được nhận dạng đúng do đó cơn động kinh được dự đoán thành công. Hình B, một cửa sổ inter-ictal bị phân loại sai (dương tính giả-false positive) và không của sổ pre-ictal nào được phân loại đúng và do đó cơn động kinh được coi là dự đoán không thành công.

Để phân loại tín hiệu, chúng ta có thể sử dụng các mạng nơ-ron nhân tạo (như mạng Elman, RBF, Perceptron, LVQ…), máy vector hỗ trợ SVM (Support Vector Machine) hoặc phương pháp đánh giá theo ngưỡng tín hiệu (Threshold method). Ở phần tiếp theo, luận văn sẽ tập trung nghiên cứu vào hai phương pháp phân loại sử dụng máy vector hỗ trợ SVM và phân loại theo ngưỡng tín hiệu.

Quá trình hậu xử lý được thực hiện sau bước phân loại nhằm tạo ra các cảnh báo giúp phát hiện sớm cơn động kinh trước khi nó xuất hiện để giúp người bệnh có những biện pháp hỗ trợ và đối phó phù hợp.

4.2 Phương pháp tiếp cận: Phân loại bằng máy vec-tơ hỗ trợ SVM

Trong phần này, chúng ta giới thiệu phương pháp dự đoán phát hiện sớm động kinh bằng phương pháp phân loại sử dụng máy vec-tơ hỗ trợ SVM (sử dụng đặc trưng đơn biến).

Hình 4.2.1: Mô hình phân loại sử dụng SVM

Mỗi kênh EEG là một tín hiệu điện đo được từ một điện cực cố định ngoài da (surface-EEG, sEEG) hoặc trong não (intracranial-EEG, iEEG). Tín hiệu này qua bộ lọc notch để loại bỏ nhiễu 50 (60) Hz sau đó sẽ được trích chọn các (một số) đặc trưng. Từng đặc trưng này được tính trong một cửa sổ trượt 5 giây.

Chúng ta có thể minh họa cho bài toán phân loại 4 trạng thái của não. Đầu ra mạng SVM là các nhãn (giá trị số) gán liên quan đến các vector đầu vào: 1 đối với

inter-ictal, 2 cho pre-ictal, 3 cho ictal và 4 cho post-ictal. Mạng phân loại SVM là mạng ánh xạ 1-1, tuy nhiên điều chúng ta quan tâm nhất là trạng thái tiền động kinh

pre-ictal, do đó nhãn 2 trở thành nhãn quan trọng nhất.

Trong trường hợp bài toán ta sử dụng phân loại hai lớp thì các mẫu pre-ictal sẽ được phân loại với các loại mẫu còn lại. Trong trường hợp này đầu ra chỉ có hai nhãn, chẳng hạn 2 cho pre-ictal và 1 cho các mẫu khác.

Do lỗi phân loại và nhiễu trong dữ liệu, nên việc xuất hiện một chuỗi toàn nhãn 2 là điều ít khi xảy ra, tuy nhiên trong các chuỗi nhãn nếu chuỗi nào có tần suất nhãn 2 nhiều thì có thể xem là dấu hiệu của trạng thái tiền động kinh. Trong thuật toán đề xuất, đối với từng bộ dữ liệu, chúng ta sẽ phân tích từng cửa sổ trượt (tương đương với khoảng thời gian pre-ictal được sử dụng) và nếu hơn một nửa các giá trị đầu ra trong cửa sổ này được gán nhãn pre-ictal (nhãn 2) thì một cảnh báo sẽ được đưa ra.

Trường hợp nếu cơn động kinh xuất hiện (đã được đánh dấu trong dữ liệu) trong khoảng thời gian sau cảnh báo có một dự đoán dương tính thật TP (True Positive) còn nếu không ta sẽ có dự đoán dương tính giả FP (False Positive). Khi trạng thái pre-ictal không được xác định và cơn động kinh xuất hiện ta có dự đoán

Lấy đặc trưng theo từng kênh Ma trận đặc trưng Phân loại bởi SVM Hậu xửlý Phân tích kết quả Tín hiệu EEG đa kênh

âm tính giả FN (False Negative) và dự đoán âm tính thật TN (True Negative) xảy ra khi không xuất hiện cơn.

Khái niệm độ nhạy (SS-Sensitivity) và tỷ lệ đoán sai (FPR- False Prediction per hour) được sử dụng để đánh giá kết quả, được định nghĩa như sau:

TP SS

TP FN

=

+ (4.1)

(tỷ lệ số cơn dự đoán được/tổng số cơn động kinh).

Một cơn động kinh được xem là dự đoán đúng nếu khi cảnh báo được đưa ra và khởi phát cơn động kinh xảy ra ngay sau khoảng thời gian pre-ictal tiếp theo.

( )

1 FP

FPRh

interictal duration FP SOP

− =

− × (4.2)

SOP (Seizure Occurrence Period) là khoảng thời gian xảy ra (theo dự đoán) động kinh (chọn bởi thuật toán) liên quan đến các cảnh báo sai.

Ngoài ra, ta có thể sử dụng thêm các khái niệm độ đặc hiệu (SP-Specificity) và độ chính xác (AC-Accuracy) được định nghĩa:

TN SP TN FP = + (4.3) TN TP AC TN FN TP FP + = + + + (4.4) 4.3 Kết luận

Trên đây là mô hình tổng quan và trình bày chi tiết các bước khi tiếp cận sử dụng máy véc-tơ hỗ trợ SVM trong dự đoán phát hiện sớm động kinh. Việc chẩn đoán bệnh động kinh được thực hiện lần lượt theo các bước sau: thu thập dữ liệu, tiền xử lý tín hiệu, trích chọn các đặc trưng, phân loại và hậu xử lý tín hiệu. Luận văn sử dụng phương pháp phân loại sử dụng máy vec-tơ hỗ trợ SVM (sử dụng đặc trưng đơn biến) trong việc phân loại tín hiệu EEG đa kênh: tín hiệu EEG đa kênh được đưa vào lấy đặc trưng theo từng kênh sau đó tổ hớp thành ma trận đặc trưng, sau đó được phân loại bởi SVM, tín hiệu được phân loại sẽ qua quá trình hậu xử lý để đưa ra kết quả, kết quả cuối cùng sẽ được đưa ra phân tích và đánh giá.

Chương 5 - MỘT SỐ ĐÁNH GIÁ VỀ THU ĐƯỢC

Kết quả mô phỏng trong chương này được thực hiện trên bộ cơ sở dữ liệu về động kinh của ĐH Freiburg (CHLB Đức) bằng phương pháp sử dụng SVM.

5.1 Các thông số mô phỏng

5.1.1 Chọn kênh tín hiệu EEG

Như đã giới thiệu trên trong chương 2, bộ CSDL của ĐH Freiburg gồm 18 bệnh nhân (được chọn lọc với chủ yếu lứa tuổi 10-16 tuổi) với tổng số khoảng 450 giờ ghi và 79 cơn động kinh. Mỗi bản ghi gồm tín hiện của 27 điện cực (hệ thống 10- 20) bao gồm: FT10, T10, TP10, F8, T4, T6, FP2, F4, C4, P4, O2, FPZ, FZ, CZ, PZ, OZ, FP1, F3, C3, P3, O1, F7, T3, T5, FT9, T9, TP9. Ngoài ra còn có 2 kênh dùng

để ghi kèm dữ liệu tín hiệu điện tâm đồ ECG của người bệnh.

Trên thực tế, việc sử dụng tín hiệu ở tất cả các kênh (để nghiên cứu) sẽ dẫn đến khối lượng tính toán khổng lồ. Ngoài ra việc sử dụng nhiều kênh tín hiệu cũng đồng nghĩa với việc người bệnh phải gắn nhiều điện cực trên người (trong trường hợp sử dụng các thiết bị cầm tay phát hiện sớm động kinh). Điều này sẽ gây ra sự bất tiện

Một phần của tài liệu Nghiên cứu tổng hợp xúc tác ni than sinh học đã sunfo hóa đi từ nguồn vi tảo và ứng dụng cho quá trình HDO dầu sinh học (Trang 46)

Tải bản đầy đủ (PDF)

(74 trang)