Trong luận văn tơi đã tiến hành một số thí nghiệm trên tập dữ liệu HAR để dự đốn kết quả của người dùng trong tương lai. Xét 3 bộ dữ liệu thu được với trích chọn thuộc tính từ Weka, thuật tốn J48 được sử dụng như là một phân lớp cơ bản bởi vì sự quan tâm trong giai đoạn này là phát hiện tập dữ liệu tối giản tốt nhất. Dựa trên chỉ số hiệu suất phân lớp được trình bày trong bảng 3.6, tập dữ liệu DT2 được chọn là bộ dữ liệu tối giản tốt hơn, vì vậy nĩ là chỉ số hiệu suất tốt nhất.
Bảng 3.6: Phân lớp J48 với các tập dữ liệu
TP FP Precision Recall F-Measure
DT1 0.84 0.032 0.842 0.84 0.84
DT2 0.860 0.028 0.861 0.860 0.859
DT3 0.861 0.028 0.862 0.861 0.86
Dựa vào bảng 3.7 và tập dữ liệu DT2, thuật tốn IB1 (thể hiện của thuật tốn k- NN) và SMO (thuật tốn SVM) cho hiệu năng tốt hơn so với J48 về giá trị FP và F-
40
Mesure. Tuy nhiên, J48 là phù hợp hơn cho điện thoại thơng minh, bởi vì J48 cần ít thời gian hơn để dự đốn dữ liệu.
Bảng 3.7: Thử nghiệm với tập dữ liệu DT2
J48 IB1 (k-NN) SMO (SVM)
Num FP 395.20 412.20 407.80
F-Measure 0.859 0.90 0.91
Training time 18,5 s 0,238 s 9,2 s Predict time 0,241 s 90.37 s 0,356 s
Xét tập DT2 và mơ hình phân lớp J48, bảng 3.8 và hình 3.4 cho thấy số liệu hiệu suất phân lớp cho tập dữ liệu và mơ hình phân lớp được chọn. Độ chính xác thu được là 87.38 % và lỗi là 12.62% cho tập dữ liệu kiểm thử với 2947 dữ liệu kiểm thử và tập dữ liệu 7532 dữ liệu cho mơ hình huấn luyện. Kết quả được đánh giá như bảng dưới ta thấy dữ liệu theo đường chéo cĩ giá trị cao thể hiện cho phần lớn phân lớp đúng. Với nhãn
Laying dữ liệu phân lớp đúng là 100%.
Bảng 3.8: Kết quả thực nghiệm với thuật tốn J48
Theo tỉ lệ % Theo số mẫu Số trường hợp sai 12.62300645 372 Số trường hợp đúng 87.37699355 2575
41
Hình 3.4: Kết quả phân lớp dữ liệu với thuật tốn J48
Trong các kết quả về phân tích hành vi của hội nghị ESANN 2013, kết quả tốt nhất là 96% [6]. Độ chính xác của luận văn này là 87.4% với thuật tốn cây quyết định – J48, thấp hơn gần 10% so với kết quả tốt nhất. Tuy nhiên, khơng cĩ thơng tin về quy trình xử lý và đánh giá kết quả, do vậy việc so sánh kết quả của các nghiên cứu là một sự khĩ khăn.
42
KẾT LUẬN
Phân tích hoạt động con người đã nhận được sự quan tâm ngày càng nhiều của những người chăm sĩc người cao tuổi, vận động viên, bác sỹ, chuyên gia dinh dưỡng, các nhà vật lý trị liệu, và cả những người muốn kiểm tra mức độ hoạt động hàng ngày.
Với tài liệu tham khảo của các nghiên cứu trước đây trong lĩnh vực này, điện thoại thơng minh với cảm biến gia tốc đã được sử dụng để thu thập dữ liệu chuyển động của người dùng vì chúng nhỏ gọn, ít vướng víu như các cảm biến đeo được, và đặc biệt người dùng thường xuyên mang theo người. Các dữ liệu thu thập được từ gia tốc tuyến tính cung cấp thơng tin về gia tốc do chuyển động cơ thể của con người và do trọng lực. Các tín hiệu được trích xuất như cường độ, gĩc, độ lệch chuẩn của biến đổi FFT cĩ thể được dùng để huấn luyện mơ hình học máy.
Mục tiêu của luận văn thực hiện xây dựng phương pháp để cĩ thể xác định các hoạt động hàng ngày của con người ngồi, nằm, đứng, đi bộ hoặc leo cầu thang trên thiết bị điện thoại thơng minh; sử dụng bộ dữ liệu cảm biến được cung cấp sẵn. Với một cây phán quyết được xây dựng, tỷ lệ chính xác khoảng 86% và lỗi phân loại là khoảng 14%.
Hướng nghiên cứu tiếp theo cĩ thể được phát triển từ các kết quả đã đạt trong luận văn vào bài tốn xây dựng ứng dụng giám sát nhiều hơn cho hoạt động thể chất của con người mà người dùng cĩ thể cung cấp thơng tin phản hồi về tiền sử thể chất của người dùng, cĩ thể tương tác với các thiết bị đeo được để tăng cường tính chính xác cho các hoạt động phân tích của ứng dụng.
43
TÀI LIỆU THAM KHẢO Tiếng Anh
1. Symposium of the Brazilian Institute for Web Science Research (WebScience). Wilde, A. (2010). An overview of human activity detection technologies for pervasive systems. Seminar paper. Pervasive and Artificial Intelligence Group of University of Southampton.
2. Bao, L. (2003). Physical Activity Recognition from Acceleration Data under Semi- Naturalistic Conditions. M.Eng. Thesis, Massachusetts Institute of Technology.
3. Bao, L., & Intille, S. (2004). Activity recognition from user-annotated acceleration data. Pervasive Computing, 1-17.
4. Czabke, A., Marsch, S., & Lueth, T. C. (2011, 23-26 May 2011). Accelerometer based real-time activity analysis on a microcontroller
5. The Morgan Kaufmann Series in Data Management Systems, Jim Gray.
Datamining- Concepts and Techniques, Chapter 7-Classification and Prediction. Series Editor Morgan Kaufmann Publishers, August 2000
6. Anguita, Davide, Ghio, Alessandro, Oneto, Luca, Parra, Xavier, & Reyes-Ortiz, Jorge L. (2013).A Public Domain Dataset for Human Activity Recognition Using Smartphones. 21th European Symposium on Artificial Neural Networks,
Computational Intelligence and Machine Learning, ESANN 2013
Website
7. http://weka.sourceforge.net/doc.stable/
8. https://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smar