rối loạn thăng bằng
Dữ liệu sau khi xử lý được chia thành loại: dữ liệu huấn luyện (training data) và dữ liệu kiểm tra (testing data). Dữ liệu huấn luyện gồm 50 bộ mẫu, trong đó 18 bộ mẫu của người có RLTB được dán nhãn “1”; phần còn lại của người không RLTB, được dán nhãn “-1”. Dữ liệu kiểm tra bao gồm 28 bộ mẫu, trong đó 10 mẫu được dán nhãn “1” là 18 mẫu được dán nhãn “-1”.
Sự phân chia số lượng mẫu dựa theo phương pháp “splitting technique”
(trong đó tỷ lệ dữ liệu huấn luyện : dữ liệu kiểm tra = 64 : 36) [20]. Bên cạnh đó,
một số tỷ lệ khác cũng được sử dụng là 50:50 và 70:30, nhằm mục đích so sánh.
Mỗi loại dữ liệu sẽ được áp dụng với 7 thuộc tính (mean distance, rms distance, mean velocity, 95% confident circle area, 95% confident ellipse area, sway area, mean frequency) hoặc 15 thuộc tính (Mean distance, Mean distance x, Mean distance y, Rms distance, Rms distance x, Rms distance y, Mean velocity, Mean velocity x, Mean velocity y, Mean frequency, Mean frequency x, Mean frequency y, 95% conf circle area, 95% conf ellipse area, Sway area.)
Lựa chọn tham số: Thư viện SVM trong C# cho phép tối ưu hóa tham số bằng công cụ tìm kiếm lưới, trong đó độ chính xác xác thực chéo (cross-validation
accuracy) thu được cho từng tham số và thông số có độ chính xác xác thực chéo
72
Phân tích kết quả: Bốn hàm Kernel sẽ được sử dụng và chỉ một hàm có độ chính xác cao nhất sẽ được chọn để phân tích sâu hơn. Mỗi phân loại cho ta các giá trị TP (true positive - dương tính thực), TN (true negative - âm tính thực), FP (false positive- dương tính giả), FN (false negative - âm tính giả) giúp đo độ chính xác, độ nhạy, độ đặc hiệu [22]. Những giá trị này rất quan trọng trong việc đánh giá độ tin cậy của một thử nghiệm cụ thể. Độ nhạy cho thấy xác suất một thử nghiệm có thể cho kết quả dương tính một cách chính xác đối với những người mắc bệnh. Đối với thử nghiệm có độ nhạy cao, nó sẽ cho kết quả dương tính với hầu hết tất cả những người mắc bệnh và chỉ trả về một số kết quả âm tính giả. Tính đặc hiệu của thử nghiệm là khả năng tạo ra kết quả âm tính một cách chính xác cho những người không chứa bệnh đó. Thử nghiệm có độ đặc hiệu cao sẽ xác định chính xác hầu hết những người không mắc bệnh và tỷ lệ cho kết quả dương tính giả là rất thấp.
Độ chính xác = 𝑻𝑵+𝑻𝑷 𝑻𝑵+𝑻𝑷+𝑭𝑵+𝑭𝑷 (3-17) Độ nhạy (TP rate) = 𝑻𝑷 𝑻𝑷+𝑭𝑵 (3-18) Độ đặc hiệu (FP rate) = 𝑭𝑷 𝑭𝑷+𝑻𝑵 (3-19)
73
CHƯƠNG 4.KẾT QUẢ VÀ THẢO LUẬN
Chương 4 tập trung phân tích kết quả của phương pháp “Independent sample T-test” và kết quả phân loại của thuật toán SVM. Kết quả của phương pháp
“Independent sample T-test” giúp khẳng định sự ảnh hưởng của 15 thông số liên
quan điểm rơi trọng tâm, đến khả năng thăng bằng của người. Tiếp theo, kết quả của phân loại sử dụng thuật toán SVM giúp chúng ta có thể phân loại chính xác người có hoặc không có rối loạn thăng bằng.