Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 47 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
47
Dung lượng
1,57 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - ĐỖ VĂN THÌN NHẬN DẠNG HÀNH VI NGƯỜI DÙNG TỪ DỮ LIỆU CỦA CẢM BIẾN CỦA ĐIỆN THOẠI THÔNG MINH LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Hà Nội – 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - ĐỖ VĂN THÌN NHẬN DẠNG HÀNH VI NGƯỜI DÙNG TỪ DỮ LIỆU CỦA CẢM BIẾN CỦA ĐIỆN THOẠI THƠNG MINH Ngành : Cơng nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN HẢI CHÂU XÁC NHẬN CỦA XÁC NHẬN CỦA CÁN BỘ HƯỚNG DẪN CHỦ TỊCH HỘI ĐỒNG Hà Nội – 2016 LỜI CAM ĐOAN Tôi xin cam đoan nội dung kết luận văn tốt nghiệp tự nghiên cứu hướng dẫn PGS.TS Nguyễn Hải Châu Trong toàn nội dung luận văn, nội dung trình bày cá nhân tơi tổng hợp từ nhiều nguồn tài liệu khác Tất tài liệu tham khảo trích dẫn rõ ràng phần cuối luận văn Tôi xin cam đoan lời thật Nếu sai tơi xin hồn tồn chịu trách nhiệm Hà Nội, ngày tháng năm Học viên Đỗ Văn Thìn LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS Nguyễn Hải Châu, người tận tình bảo tơi kiến thức chuyên môn, phương pháp nghiên cứu khoa học đồng thời gương mặt sống để học tập noi theo Tôi xin chân thành cảm ơn thầy, cô giáo trường Đại học Công Nghệ cung cấp cho kiến thức bổ ích thời gian tơi học tập trường Cuối xin gửi lời cảm ơn tới gia đình tơi ln ủng hộ tơi đường học tập nghiên cứu với nhiều khó khăn, vất vả Mặc dù tơi cố gắng q trình làm luận văn khơng thể tránh khỏi thiếu sót, mong nhận góp ý thầy bạn Hà Nội, ngày tháng năm Học viên Đỗ Văn Thìn MỤC LỤC Mục lục Danh mục chữ viết tắt Danh mục hình Danh mục bảng Giới thiệu Chương 1: Tổng quan 1.1 Tổng quan giám sát hoạt động 1.2 Cảm biến 1.3 Điện thoại thông minh 11 1.4 Phân lớp 13 1.4.1 Khái niệm phân lớp 13 1.4.2 Phân lớp liệu 13 Chương 2: Phương pháp, công cụ hỗ trợ nhận dạng hành vi 18 2.1 Kỹ thuật phân lớp nhận dạng hành vi 18 2.2 Tiền xử lý 20 2.3 Trích chọn tính 21 2.4 Phân lớp liệu 23 2.4.1 Thuật toán SVM 24 2.4.2 Thuận toán k-NN 27 2.4.3 Phân lớp dựa thuật toán định 28 2.5 Đánh giá thuật toán 30 Chương 3: Cài đặt thực nghiệm 32 3.1 Bộ liệu nhận dạng hành vi 32 3.2 Tiền xử lý liệu 35 3.3 Xây dựng thực nghiệm ứng dụng nhận dạng hành vi 37 3.4 Kết thực nghiệm 39 Kết luận 42 Tài liệu tham khảo 43 DANH MỤC CHỮ VIẾT TẮT Ký hiệu ADL AR ARFF DT FFT HMM K-NN SVM Weka Diễn giải Activities of daily living Activity recognition Attribute-Relation File Format Dataset Fast Fourier Transform Hidden Markov Models k-Nearest Neighbours Tiếng Việt Hoạt động hàng ngày Nhận dạng hành vi Định dạng tài liệu ARFF Tập tài liệu Biến đổi Fourier Mơ hình Markov ẩn Mơ hình phân lớp K-hàng xóm gần Support Vector Machines Waikato Environment for Knowledge Analysis DANH MỤC HÌNH Hình 1.1: Lợi ích giám sát hoạt động người Hình 1.2: Cảm biến gia tốc tuyến tính Hình 1.3: Hệ trục điện thoại thông minh Hình 1.4: Tóm tắt nghiên cứu trước nhận dạng hành vi sử dụng cảm biến gia tốc 10 Hình 1.5: Phân lớp liệu – (a) Xây dựng mơ hình phân lớp 15 Hình 1.6: Phân lớp liệu – (b1) ước lượng độ xác mơ hình 16 Hình 1.7: Phân lớp liệu – (b2) phân lớp liệu 16 Hình 2.1: Sơ đồ biểu diễn quy trình học máy 19 Hình 2.2: mơ hình nhận dạng hành vi từ liệu cảm biến điện thoại thơng minh 20 Hình 2.3: Siêu phẳng h chia liệu huấn luyện thành tập + – với khoảng cách biên lớn 25 Hình 2.4: Ví dụ định 29 Hình 2.5: Mã giải thuật tốn phân lớp liệu dựa định 30 Hình 2.6: Ma trận nhầm lẫn 31 Hình 3.1: Thu thập liệu từ cảm biến điện thoại thông minh 32 Hình 3.2: Ví dụ liệu cảm biến gia tốc 33 Hình 3.3: Chương trình ứng dụng demo 39 Hình 3.4: Kết phân lớp liệu với thuật toán J48 41 DANH MỤC BẢNG Bảng 1.1: Các cảm biến trang bị điện thoại thông minh 12 Bảng 2.1: Tính miền thời gian 22 Bảng 2.2: Miền tần số 22 Bảng 2.3: Tính miền chuỗi biểu tượng 23 Bảng 2.4: Cơng thức đánh giá tốn hiệu thuật toán phân lớp 31 Bảng 3.1: Số lượng trường hợp cho lớp 34 Bảng 3.2: Tính trích xuất mơ tả 34 Bảng 3.3: Tín hiệu chuyển hóa từ liệu gia tốc, sử dụng miền thời gian tần số 35 Bảng 3.4: Trích chọn tính từ tập liệu ban đầu 36 Bảng 3.5: Loại bỏ tính đánh dấu tập liệu 36 Bảng 3.6: Phân lớp J48 với tập liệu 39 Bảng 3.7: Thử nghiệm với tập liệu DT2 40 Bảng 3.8: Kết thực nghiệm với thuật toán J48 40 GIỚI THIỆU Tính cấp thiết đề tài Nhận dạng hành vi người sử dụng cảm biến cá nhân trở thành lĩnh vực nghiên cứu quan trọng nhằm tạo hay cải thiện ứng dụng giám sát hoạt động người Khả ghi lại nhận dạng hoạt động cá nhân hàng ngày điều cần thiết để xác định mức độ thực hoạt động người Những hệ thống có ứng dụng thực tế việc chăm sóc sức khỏe theo dõi luyện tập sức khỏe Hoạt động thể chất có tác dụng tích cực lên tất chức thể nghiên cứu chứng minh nguy tim mạch giảm tới 50% người có hoạt động thể chất tích cực [5].Với già hóa dân số kinh phí hạn chế cho việc chăm sóc sức khỏe cộng đồng, quan tâm nhiều trả để giám sát hoạt động người, nâng cao khả hỗ trợ bệnh nhân giúp họ tự chăm sóc thân, giảm chăm sóc y tế thơng thường chuyển qua chăm sóc từ xa Trong lĩnh vực y tế, việc theo dõi hoạt động người dùng thời gian dài hữu ích việc phát sớm bệnh khuyến khích người dùng cải thiện mức độ hoạt động họ Một phương pháp sử dụng để giám sát hoạt động người dựa hệ thống video ghi chuyển động liên kết với cảm nhận áp lực Những phương pháp gây khó chịu, địi hỏi thiết bị lớn sử dụng bên phịng thí nghiệm địi hỏi thiết lập cao, thời gian xử lý không gian nhớ để ghi lại Phân tích hành vi sử dụng cảm biến điện thoại thông minh trở thành lựa chọn thú vị cho hệ thống kích thước nhỏ, chi phí thấp khả ghi lại tín hiệu chuyển động cách kín đáo Hơn ngày hầu hết điện thoại thơng minh tích hợp cảm biến phù hợp cho việc phân tích hành vi người dùng Cảm biến gia tốc quay hồi chuyển sử dụng để nghiên cứu hoạt động hàng ngày người Phân loại thông tin chuyển động, thu thập từ liệu từ cảm biến điện thoại thông minh, nhãn hoạt động thường thực với kỹ thuật học máy đòi hỏi phải khai thác thông số liệu chuyển động để huấn luyện phân lớp để dự đoán liệu hoạt động với mơ hình huấn luyện Mục tiêu nhiệm vụ đề tài Nghiên cứu phương pháp giám sát hành vi người sử dụng điện thoại thông minh sử dụng cảm biến điện thoại thông minh Trong luận văn tập trung vào hoạt động hàng ngày như: đứng (standing), ngồi (sitting), nằm (laying), (walking), lên cầu thang (walking upstairs), xuống cầu thang (walking down stairs) Sự chuyển động người dùng ghi lại cảm biến gia tốc điện thoại thắt lưng đặt thắt lưng người dùng họ thực hoạt động Nghiên cứu thuật toán giúp phân lớp gán nhãn hoạt động người dùng dựa vào liệu cảm biến điện thoại thông minh Xây dựng sản phẩm phân tích hành vi người sử dụng điện thoại thơng minh, đánh giá chất lượng mơ hình xây dựng Hình 2.4: Ví dụ định Xây dựng định Quá trình xây dựng định gồm hai giai đoạn: Giai đoạn thứ phát triển định: Giai đoạn phát triển gốc, đến nhánh phát triển quy nạp theo cách thức chia để trị đạt định với tất gán nhãn lớp Giai đoạn thứ hai cắt, tỉa bớt cành nhánh định: Giai đoạn nhằm mục đích đơn giản hóa khái quát hóa từ làm tăng độ xác định cách loại bỏ phụ thuộc vào mức độ lỗi (noise) liệu đào tạo mang tính chất thống kê, hay biến đổi mà đặc tính riêng biệt liệu đào tạo Giai đoạn truy cập liệu định phát triển giai đoạn trước trình thực nghiệm cho thấy giai đoạn không tốn nhiều tài ngun tính tốn, với phần lớn thuật tốn, giai đoạn chiếm khoảng 1% tổng thời gian xây dựng mơ hình phân lớp Do vậy, tập trung vào nghiên cứu giai đoạn phát triển định Dưới khung công việc giai đoạn này: 1) Chọn thuộc tính “tốt” độ đo định trước 2) Phát triển việc thêm nhánh tương ứng với giá trị thuộc tính chọn 3) Sắp xếp, phân chia tập liệu đào tạo tới node 29 4) Nếu ví dụ phân lớp rõ ràng dừng Ngược lại: lặp lại bước tới bước cho node Hình 2.5: Mã giải thuật toán phân lớp liệu dựa định Cây định sử dụng cho thuộc tính, nhánh cho kết thử nghiệm tạo Các thuật toán dừng tìm thấy Trong Weka sử dụng cài đặt thuật toán định J48 2.5 Đánh giá thuật tốn Có nhiều cách khác để đánh giá hiệu suất thuật toán phân lớp, cách thường dùng sử dụng ma trận nhầm lẫn với tính xác đắn Hiệu phân lớp thường đánh giá qua so sánh định phân lớp với định người tiến hành tập kiểm thử (test set) văn gán nhãn lớp trước Có ba độ đo điển hình sử dụng để đánh giá độ hiệu thuật tốn phân lớp, độ xác P (precision), độ hồi tưởng R (recall) độ đo F-measure tính theo cơng thức bảng 2.4 30 Bảng 2.4: Cơng thức đánh giá tốn hiệu thuật tốn phân lớp Hình 2.6: Ma trận nhầm lẫn 31 CHƯƠNG 3: CÀI ĐẶT VÀ THỰC NGHIỆM Chương mô tả phương pháp sử dụng để đánh giá liệu cảm biến gia tốc, tìm kiếm mơ hình hoạt động huấn luyện phân lớp để dự đoán cho liệu với hành vi tương ứng 3.1 Bộ liệu nhận dạng hành vi Giả thuyết luận văn kiểm tra khả thực thuật toán phân loại điện thoại thông minh để nhận dạng hành vi người, có tính đến đánh giá pin hạn chế nhớ Với mục đích này, chúng cần nghiên cứu kỹ thuật cần thiết cho tiền xử lý phân loại liệu gia tốc, sử dụng liệu cạnh tranh Trong luận văn này, liệu nhận dạng hành vi cung cấp sẵn [6] với đặc tính liệu: Các thí nghiệm tiến hành với nhóm 30 tình nguyện viên phạm vi độ tuổi từ 19 tuổi đến 48 tuổi Mỗi người thực hành vi đeo điện thoại thông minh (Galaxy S II) vào thắt lưng, đặt theo chiều dọc Sử dụng cảm biến gia tốc, quay hồi chuyển họ lấy liệu gia tốc tuyến tính trục vận tốc góc trục tốc độ khơng thay đổi 50Hz Các thí nghiệm ghi hình lại để gán nhãn liệu tay Hình 3.1: Thu thập liệu từ cảm biến điện thoại thông minh Bộ liệu cung cấp tín hiệu gia tốc quay hồi chuyển cho liệu (huấn luyện kiểm thử) nhãn hành vi cho trường hợp 32 “Các tín hiệu cảm biến (gia tốc quay hồi chuyển) tiền xử lý cách áp dụng lọc nhiễu sau lấy mẫu với cửa sổ trượt 2,56 giây 50% chồng chéo Tín hiệu cảm biến gia tốc, thành phần hấp dẫn chuyển động thể phân tách lọc thông thấp Butterworth Lực hấp dẫn giả định thành phần có tần số thấp, lọc với tần số cắt 0.3Hz sử dụng Với cửa sổ, vector tính thu lại cách tính tốn từ biến thời gian miền tần số.” [6] Hình 3.2: Ví dụ liệu cảm biến gia tốc Các tính chuẩn hóa giới hạn khoảng [-1, 1] Việc chuẩn hóa thực theo hàm số: Trường xNorm tính chuẩn hóa, x tính Min Max giá trị tối thiểu tối đa tương ứng với tính x 33 Để phân loại xác hơn, liệu nên cân tất lớp nên có số trường hợp Sự phân lớp từ liệu cạnh tranh giới thiệu bảng 3.1 Bảng 3.1: Số lượng trường hợp cho lớp Nhãn liệu Tập huấn luyện Tập kiểm thử Walking Walking down stairs Walking up stairs Sitting Standing Lying Total 1226 1073 986 1286 1374 1407 496 471 420 491 532 537 7352 2947 Các tác giả trích xuất 561 tính tương ứng với 17 tính bảng 3.2, liệu rút theo tín hiệu từ bảng 3.3 Bảng 3.2: Tính trích xuất mơ tả Tính mean() std() mad() max() min() sma() energy() iqr() entropy() arCoeff() correlation() maxInds() meanFreq() skewness() kurtosis() Mơ tả Giá trị trung bình Độ lệch chuẩn Độ lệch trung bình tuyệt đối Giá trị lớn mảng Giá trị nhỏ mảng Khoảng cường độ tín hiệu Thước đo lượng Tổng giá trị trung bình chia cho số giá trị Khoảng tứ phân Tín hiệu entropy Hệ số Autorregresion với trật tự Burg Hệ số tương quan hai tín hiệu Chỉ số thành phần tần số với cường độ lớn Bình quân trọng số thành phần tần số để có tần số trung bình Độ lệch tín hiệu miền tần số Độ nhọn tín hiệu miền tần số 34 bandsEnergy() angle() Năng lượng khoảng tần số 64 ngăn FFT cửa sổ Góc hai vectơ Bảng 3.3: Tín hiệu chuyển hóa từ liệu gia tốc, sử dụng miền thời gian tần số Miền thời gian tBodyAcc-XYZ tGravityAcc-XYZ tBodyAccJerk-XYZ tBodyGyro-XYZ tBodyGyroJerk-XYZ tBodyAccMag tGravityAccMag tBodyAccJerkMag tBodyGyroMag tBodyGyroJerkMag 3.2 Miền tần số fBodyAcc-XYZ fBodyAccJerk-XYZ fBodyGyro-XYZ fBodyAccMag fBodyAccJerkMag fBodyGyroMag fBodyGyroJerkMag Tiền xử lý liệu Liên quan đến kỹ thuật tiền xử lý, có cách thức để lựa chọn thuộc tính: Filters Wrapper Sau ta tạo tập từ vector đặc trưng phân loại để sử dụng tập con, mục tiêu tạo tập mà phân lớp thực tốt Để tìm tập con, người ta sử dụng phương thức tìm kiếm như: phương pháp linear forward phương pháp best first Các lọc sử dụng thẩm định thuộc tính (attribute evaluator) hàng để xếp hạng tính Với phương pháp này, tính có cấp bậc thấp loại bỏ thời gian để xem độ xác việc phân loại Với luận văn này, sử dụng weka để thực tiền xử lý liệu Trong Weka sử dụng phương pháp đánh giá CfsSubSetEval phương thức tìm kiếm Best First Từ liệu với 562 thuộc tính (561 thuộc tính thuộc tính lớp phân loại), thực trích chọn thuộc tính để có vector 37 tính cho huấn luyện mơ hình phân lớp 35 Bảng 3.4: Trích chọn tính từ tập liệu ban đầu Attribute attribute evaluator Search method Select Att 561 (DT0) CfsSubSetEval BestFirst 49 (DT1) 561 (DT0) CfsSubSetEval LinearForwardSel 37(DT2) 37(DT2) CfsSubSetEval LinearForwardSel 32(DT3) Bảng 3.5: Loại bỏ tính đánh dấu tập liệu Tập liệu 1(DT1) Miền thời gian tBodyAcc-max()-X tBodyAcc-correlation()-X,Y tGravityAcc-mean()-X tGravityAcc-mean()-Y tGravityAcc-std()-X tGravityAcc-max()-X tGravityAcc-max()-Y tGravityAcc-max()-Z tGravityAcc-min()-X tGravityAcc-min()-Y tGravityAcc-energy()-X tGravityAcc-arCoeff()-X,3 tGravityAcc-arCoeff()-Y,1 tGravityAcc-arCoeff()-Z,2 tGravityAcc-correlation()X,Y tGravityAcc-correlation()Y,Z tBodyAccJerk-max()-X tBodyAccJerk-max()-Z tBodyAccJerk-iqr()-Z tBodyAccJerk-entropy()-Z tBodyAccJerk-arCoeff()-X,3 tBodyGyro-mean()-X tBodyGyro-correlation()-X,Y tBodyGyro-correlation()-X,Z tBodyGyro-correlation()-Y,Z tBodyGyroJerk-iqr()-X tBodyGyroJerkMag-min() tBodyGyroJerkMag-iqr() Tập liệu 2(DT2) Miền thời gian tBodyAcc-std()-X tBodyAcc-max()-X tBodyAcc-arCoeff()-Z,4 tBodyAcc-correlation()-X,Y tBodyAcc-correlation()-Y,Z tGravityAcc-min()-X tGravityAcc-min()-Y tGravityAcc-arCoeff()-X,4 tGravityAcc-arCoeff()-Y,1 tGravityAcc-correlation()X,Y tGravityAcc-correlation()X,Z tBodyAccJerk-mad()-Y tBodyAccJerk-max()-Z tBodyAccJerk-entropy()-Z tBodyAccJerk-arCoeff()-X,3 tBodyGyro-mean()-X tBodyGyro-arCoeff()-Y,4 tBodyGyro-correlation()X,Y tBodyGyro-correlation()X,Z tBodyGyro-correlation()Y,Z tBodyAccJerkMag-min() tBodyAccJerkMag-iqr() Tập liệu 3(DT3) Miền thời gian tBodyAcc-max()-X tBodyAcc-arCoeff()-Z,4 tBodyAcc-correlation()X,Y tBodyAcc-correlation()Y,Z tGravityAcc-min()-X tGravityAcc-min()-Y tGravityAcc-arCoeff()X,4 tGravityAcc-arCoeff()Y,1 tGravityAcccorrelation()-X,Y tGravityAcccorrelation()-X,Z tBodyAccJerk-max()-Z tBodyAccJerk-entropy()Z tBodyAccJerk-arCoeff()X,3 tBodyGyro-mean()-X tBodyGyro-arCoeff()-Y,4 tBodyGyro-correlation()X,Y tBodyGyro-correlation()X,Z tBodyGyro-correlation()Y,Z tBodyAccJerkMag-min() tBodyAccJerkMag-iqr() 36 Miền tần số fBodyAcc-std()-X fBodyAcc-skewness()-X fBodyAccJerk-maxInds-X fBodyAccJerk-maxInds-Y fBodyAccJerk-maxInds-Z fBodyAccJerkbandsEnergy()-1,8 fBodyGyro-maxInds-X fBodyGyro-maxInds-Y fBodyGyro-maxInds-Z fBodyAccMag-mean() fBodyAccMag-std() fBodyAccMag-iqr() fBodyBodyAccJerkMagmax() fBodyBodyAccJerkMagenergy() fBodyBodyAccJerkMag-iqr() fBodyBodyGyroMagmaxInds angle(tBodyGyroMean,gravit yMean) angle(tBodyGyroJerkMean,gr avityMean) angle(X,gravityMean) angle(Y,gravityMean) 3.3 Miền tần số fBodyAcc-std()-X fBodyAccJerk-maxInds-X fBodyAccJerkbandsEnergy()-1,8 fBodyAccJerkbandsEnergy()-17,24 fBodyGyro-maxInds-X fBodyGyro-maxInds-Z fBodyGyro-meanFreq()-X fBodyAccMag-mean() fBodyAccMag-mad() fBodyAccMag-iqr() fBodyBodyAccJerkMagmad() fBodyBodyAccJerkMagenergy() fBodyBodyGyroMag-iqr() fBodyBodyGyroMagmaxInds angle(tBodyGyroJerkMean,g ravityMean) Miền tần số fBodyAcc-std()-X fBodyAccJerk-maxIndsX fBodyAccJerkbandsEnergy()-1,8 fBodyGyro-maxInds-X fBodyGyro-maxInds-Z fBodyGyro-meanFreq()X fBodyAccMag-mad() fBodyBodyAccJerkMagmad() fBodyBodyAccJerkMagenergy() fBodyBodyGyroMagmaxInds angle(tBodyGyroJerkMea n,gravityMean) Xây dựng thực nghiệm ứng dụng nhận dạng hành vi Do phạm vi nghiên cứu đề tài luận văn thời gian ngắn, nên tơi xây dựng chương trình mang tính chất demo tơi nghiên cứu Ứng dụng xây dựng tảng Android, sử dụng liệu tiền xử lý với công cụ Weka Ứng dụng sử dụng thư viện Weka cho việc xử lý tiền liệu thư viện Weka mobile cho việc kiểm thử liệu mobile Luận văn xin cung cấp số thông tin Weka sau: Weka phần mềm nguồn mở khai phá liệu phát triển đại học University of Waikato nước New Zealand “Weka” từ viết tắt cho cụm từ Waikato Environment for Knowledge Analysis Weka sử dụng nhiều cấp độ khác 37 Cấp độ đơn giản ta áp dụng thuật toán Weka để xử lý liệu từ dịng lệnh Nó bao gồm nhiều cơng cụ dùng cho việc biến đổi liệu, thuật toán dùng để rời rạc hóa liệu Weka cung cấp tất chức khai phá liệu bao gồm thuật toán phân lớp (classifier), thuật toán tiền xử lý liệu (filter), thuật toán phân cụm (cluster), thuật toán kết tập luật (association rule) Phương pháp phân lớp Trong chương trước luận văn trình bày số thuật toán phân lớp Với thử nghiệm, luận văn sử dụng định thuật tốn SVM để xây dựng mơ hình học máy Mơi trường phát triển: - Hệ điều hành Windows 10 x64 - Android Studio version 2.2.2 - Android SDK - Công cụ Weka Windows thư viện Weka cho android Chức ứng dụng Với liệu tiền xử lý, hệ thống thực nhiệm vụ: xây dựng mơ hình học máy điện thoại thơng minh để đốn định liệu sau kiểm thử với liệu test, sử dụng mơ hình xây dựng công cụ Weka thực kiểm thử liệu test với mơ hình điện thoại thơng minh, đánh giá mơ hình học máy 38 Hình 3.3: Chương trình ứng dụng demo 3.4 Kết thực nghiệm Trong luận văn tiến hành số thí nghiệm tập liệu HAR để dự đoán kết người dùng tương lai Xét liệu thu với trích chọn thuộc tính từ Weka, thuật tốn J48 sử dụng phân lớp quan tâm giai đoạn phát tập liệu tối giản tốt Dựa số hiệu suất phân lớp trình bày bảng 3.6, tập liệu DT2 chọn liệu tối giản tốt hơn, số hiệu suất tốt Bảng 3.6: Phân lớp J48 với tập liệu TP FP Precision Recall F-Measure DT1 0.84 0.032 0.842 0.84 0.84 DT2 0.860 0.028 0.861 0.860 0.859 DT3 0.861 0.028 0.862 0.861 0.86 Dựa vào bảng 3.7 tập liệu DT2, thuật toán IB1 (thể thuật toán kNN) SMO (thuật toán SVM) cho hiệu tốt so với J48 giá trị FP F39 Mesure Tuy nhiên, J48 phù hợp cho điện thoại thông minh, J48 cần thời gian để dự đốn liệu Bảng 3.7: Thử nghiệm với tập liệu DT2 J48 IB1 (k-NN) SMO (SVM) Num FP 395.20 412.20 407.80 F-Measure 0.859 0.90 0.91 Training time 18,5 s 0,238 s 9,2 s Predict time 0,241 s 90.37 s 0,356 s Xét tập DT2 mơ hình phân lớp J48, bảng 3.8 hình 3.4 cho thấy số liệu hiệu suất phân lớp cho tập liệu mơ hình phân lớp chọn Độ xác thu 87.38 % lỗi 12.62% cho tập liệu kiểm thử với 2947 liệu kiểm thử tập liệu 7532 liệu cho mơ hình huấn luyện Kết đánh bảng ta thấy liệu theo đường chéo có giá trị cao thể cho phần lớn phân lớp Với nhãn Laying liệu phân lớp 100% Bảng 3.8: Kết thực nghiệm với thuật toán J48 Theo tỉ lệ % Theo số mẫu Số trường hợp sai 12.62300645 372 Số trường hợp 87.37699355 2575 Tổng số mẫu 2947 40 Hình 3.4: Kết phân lớp liệu với thuật tốn J48 Trong kết phân tích hành vi hội nghị ESANN 2013, kết tốt 96% [6] Độ xác luận văn 87.4% với thuật toán định – J48, thấp gần 10% so với kết tốt Tuy nhiên, khơng có thơng tin quy trình xử lý đánh giá kết quả, việc so sánh kết nghiên cứu khó khăn 41 KẾT LUẬN Phân tích hoạt động người nhận quan tâm ngày nhiều người chăm sóc người cao tuổi, vận động viên, bác sỹ, chuyên gia dinh dưỡng, nhà vật lý trị liệu, người muốn kiểm tra mức độ hoạt động hàng ngày Với tài liệu tham khảo nghiên cứu trước lĩnh vực này, điện thoại thông minh với cảm biến gia tốc sử dụng để thu thập liệu chuyển động người dùng chúng nhỏ gọn, vướng víu cảm biến đeo được, đặc biệt người dùng thường xuyên mang theo người Các liệu thu thập từ gia tốc tuyến tính cung cấp thông tin gia tốc chuyển động thể người trọng lực Các tín hiệu trích xuất cường độ, góc, độ lệch chuẩn biến đổi FFT dùng để huấn luyện mơ hình học máy Mục tiêu luận văn thực xây dựng phương pháp để xác định hoạt động hàng ngày người ngồi, nằm, đứng, leo cầu thang thiết bị điện thoại thông minh; sử dụng liệu cảm biến cung cấp sẵn Với phán xây dựng, tỷ lệ xác khoảng 86% lỗi phân loại khoảng 14% Hướng nghiên cứu phát triển từ kết đạt luận văn vào toán xây dựng ứng dụng giám sát nhiều cho hoạt động thể chất người mà người dùng cung cấp thông tin phản hồi tiền sử thể chất người dùng, tương tác với thiết bị đeo để tăng cường tính xác cho hoạt động phân tích ứng dụng 42 TÀI LIỆU THAM KHẢO Tiếng Anh Symposium of the Brazilian Institute for Web Science Research (WebScience) Wilde, A (2010) An overview of human activity detection technologies for pervasive systems Seminar paper Pervasive and Artificial Intelligence Group of University of Southampton Bao, L (2003) Physical Activity Recognition from Acceleration Data under SemiNaturalistic Conditions M.Eng Thesis, Massachusetts Institute of Technology Bao, L., & Intille, S (2004) Activity recognition from user-annotated acceleration data Pervasive Computing, 1-17 Czabke, A., Marsch, S., & Lueth, T C (2011, 23-26 May 2011) Accelerometer based real-time activity analysis on a microcontroller The Morgan Kaufmann Series in Data Management Systems, Jim Gray Datamining- Concepts and Techniques, Chapter 7-Classification and Prediction Series Editor Morgan Kaufmann Publishers, August 2000 Anguita, Davide, Ghio, Alessandro, Oneto, Luca, Parra, Xavier, & Reyes-Ortiz, Jorge L (2013).A Public Domain Dataset for Human Activity Recognition Using Smartphones 21th European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, ESANN 2013 Website http://weka.sourceforge.net/doc.stable/ https://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smar tphone 43