Đề tài thực hiện nghiên cứu các thuật toán giúp phân lớp gán nhãn các hoạt động người dùng dựa vào dữ liệu cảm biến trên điện thoại thông minh, xây dựng sản phẩm phân tích hành vi người sử dụng trên điện thoại thông minh, đánh giá chất lượng mô hình xây dựng được.
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - ĐỖ VĂN THÌN NHẬN DẠNG HÀNH VI NGƯỜI DÙNG TỪ DỮ LIỆU CỦA CẢM BIẾN CỦA ĐIỆN THOẠI THƠNG MINH Ngành : Hệ thống thơng tin Chun ngành: Hệ thống thơng tin Mã số: 60.48.01.04 TĨM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Hà Nội – 2016 GIỚI THIỆU Tính cấp thiết đề tài Nhận dạng hành vi người sử dụng cảm biến cá nhân trở thành lĩnh vực nghiên cứu quan trọng nhằm tạo hay cải thiện ứng dụng giám sát hoạt động người Khả ghi lại nhận dạng hoạt động cá nhân hàng ngày điều cần thiết để xác định mức độ thực hoạt động người Những hệ thống có ứng dụng thực tế việc chăm sóc sức khỏe theo dõi luyện tập sức khỏe Hoạt động thể chất có tác dụng tích cực lên tất chức thể nghiên cứu chứng minh nguy tim mạch giảm tới 50% người có hoạt động thể chất tích cực.Với già hóa dân số kinh phí hạn chế cho việc chăm sóc sức khỏe cộng đồng, quan tâm nhiều trả để giám sát hoạt động người, nâng cao khả hỗ trợ bệnh nhân giúp họ tự chăm sóc thân, giảm chăm sóc y tế thơng thường chuyển qua chăm sóc từ xa Trong lĩnh vực y tế, việc theo dõi hoạt động người dùng thời gian dài hữu ích việc phát sớm bệnh khuyến khích người dùng cải thiện mức độ hoạt động họ Một phương pháp sử dụng để giám sát hoạt động người dựa hệ thống video ghi chuyển động liên kết với cảm nhận áp lực Những phương pháp gây khó chịu, đòi hỏi thiết bị lớn sử dụng bên phòng thí nghiệm đòi hỏi thiết lập cao, thời gian xử lý không gian nhớ để ghi lại Phân tích hành vi sử dụng cảm biến điện thoại thông minh trở thành lựa chọn thú vị cho hệ thống kích thước nhỏ, chi phí thấp khả ghi lại tín hiệu chuyển động cách kín đáo Hơn ngày hầu hết điện thoại thông minh tích hợp cảm biến phù hợp cho việc phân tích hành vi người dùng Cảm biến gia tốc quay hồi chuyển sử dụng để nghiên cứu hoạt động hàng ngày người Phân loại thông tin chuyển động, thu thập từ liệu từ cảm biến điện thoại thông minh, nhãn hoạt động thường thực với kỹ thuật học máy đòi hỏi phải khai thác thông số liệu chuyển động để huấn luyện phân lớp để dự đoán liệu hoạt động với mơ hình huấn luyện Mục tiêu nhiệm vụ đề tài Nghiên cứu phương pháp giám sát hành vi người sử dụng điện thoại thông minh sử dụng cảm biến điện thoại thông minh Trong luận văn tập trung vào hoạt động hàng ngày như: đứng (standing), ngồi (sitting), nằm (laying), (walking), lên cầu thang (walking upstairs), xuống cầu thang (walking down stairs) Sự chuyển động người dùng ghi lại cảm biến gia tốc điện thoại thắt lưng đặt thắt lưng người dùng họ thực hoạt động Nghiên cứu thuật toán giúp phân lớp gán nhãn hoạt động người dùng dựa vào liệu cảm biến điện thoại thơng minh Xây dựng sản phẩm phân tích hành vi người sử dụng điện thoại thông minh, đánh giá chất lượng mơ hình xây dựng CHƯƠNG 1: TỔNG QUAN 1.1 Tổng quan giám sát hoạt động Theo dõi xác hoạt động người có khả cải thiện hệ thống chăm sóc sức khỏe, cảnh báo sớm nguy cơ, giám sát tập thể dục hỗ trợ sinh hoạt hàng ngày Những hệ thống nhận thức hoạt động cung cấp cho người dùng loạt dịch vụ tiện ích ví dụ như: cách phân tích hoạt động người khoảng thời gian xác định xu hướng thói quen hàng ngày từ điều chỉnh để có chế độ tốt cho thể; đặc biệt với người cao tuổi, giúp cảnh báo nguy sức khỏe Khái niệm hoạt động xem xét tương tác người–máy (HCI) để thiết kế tốt mơ hình điện tốn phân tán dựa hành vi người dùng (Bao & Intille, 2004) Các mục tiêu điện tốn phân tán có mặt khắp nơi kín đáo, dần tảng hỗ trợ người học thực hoạt động hàng ngày Dự đoán hoạt động mục tiêu hệ thống điện toán rộng khắp, nhiên việc sử dụng hành động lập để phân tích tình thực tế bên ngồi khơng thành cơng, hành động ln nằm bối cảnh, hệ thống hiểu bối cảnh Sự phát triển hệ thống nhận biết ngữ cảnh quan trọng để nhận hoạt động bối cảnh có ý nghĩa tối thiểu để hiểu hoạt động cá nhân Phát tư không đủ để phân biệt số hoạt động, có bối cảnh, hoạt động phân biệt cách xác Q trình giám sát hành vi người dùng bắt đầu việc thu thập liệu thô, đặc biệt liệu chuyển động Cảm biến quán tính giải pháp thích hợp để phát chuyển động Những cảm biến phản ứng với kích thích cách tạo tín hiệu phân tích diễn tả Thơng thường, cảm biến đặt bên cạnh thể nên đem lại thoải mái cho người sử dụng Các hệ điện thoại thông minh trang bị với loạt cảm biến bên trong: cảm biến gia tốc, cảm biến quay hồi chuyển, cảm biến nhịp tim, cảm biến tiệm cận, cảm biến độ ẩm… Một số cảm biến sử dụng để giám sát hoạt động hàng ngày người: cảm biến gia tốc, quay hồi chuyển Các thiết bị tiện lợi, nhỏ kín đáo, trở thành ý tưởng cho hệ thống nhận dạng hành vi người dùng Tính hấp dẫn khác đeo được, làm việc với thời gian thực sử dụng để theo dõi lâu dài Những thiết bị ghi nhận, xử lý có đượcthơng tin hữu ích từ liệu thơ cảm biến, khó khăn việc tạo ứng dụng nhận biết bối cảnh việc phát triển tuận tốn nhận diện bối cảnh từ liệu cảm biến có nhiễu khơng rõ ràng Phát triển ứng dụng điện thoại thơng minh cần phải tính đến nguồn lực hạn chế điện thoại thông minh như: thời gian xử lý, nhớ hạn chế tỷ lệ mẫu Cảm biến gia tốc cảm biến lý tưởng chúng đòi hỏi sức mạnh xử lý thấp tiêu thụ lượng 1.2 Cảm biến Cảm biến thu thập liệu sử dụng để phát hành vi người Có vấn đề liên quan đến cảm biến: loại, vị trí số lượng Phần lớn hệ thống nhận biết cử động sử dụng cảm biến quán tính, đặc biệt cảm biến gia tốc để ước tính độ nghiêng thể xác định phương hướng, chuyển động người sử dụng Cảm biến gia tốc sử dụng đầu dò để đo gia tốc tuyến tính Tín hiệu thu với cảm biến gia tốc có thành phần, “một gia tốc trọng trường cung cấp thông tin tư chủ thể, thành phần tăng tốc thể cung cấp thông tin chuyển động chủ thể” Một cảm biến gia tốc chiều đo gia tốc theo trục x, y, z so với hình điện thoại mơ tả hình Gia tốc đo đơn vị m/s2 Các nghiên cứu trước chứng minh hình thức vận động bộ, chạy bộ, leo cầu thang tư ngồi, nằm đứng ghi nhận với độ xác từ 83 – 95% sử dụng cảm biến gia tốc hông, đùi mắt cá chân Tuy nhiên nghiên cứu Ling Bao Intille cho thấy đùi cổ tay vị trí thích hợp để đặt cảm biến gia tốc để phát ADL Dữ liệu cảm biến thu từ cổ tay thuận tốt cho hoạt động phân biệt hành vi liên quan đến chuyển động thể liệu từ gia tốc đùi hữu ích cho việc nhận dạng hành vi thực với chi Hệ thống nhận dạng hành vi nên sử dụng liệu với liệu vị trí khác nhau, cho phép người dùng mang theo thiết bị vị trí thuận tiện cho bối cảnh định Khi cảm biến vị trí nhất, hữu ích để áp dụng hệ thống thơng tin đa chiều để ghi lại tín hiệu theo ngữ cảnh môi trường [5] Liên quan đến số lượng cảm biến để nhận diện xác (Ling Bao & Intille, 2004) cho thấy việc sử dụng cảm biến ảnh hưởng khoảng 5% độ xác so với hệ thống dùng cảm biến So sánh cảm biến gia tốc trục trục làm tăng chi phí mà phong phú liệu không đáng kể Số lượng tối đa cảm biến ghi nhận cảm biến gia tốc đơn trục [4] Một vấn đề quan trọng khác cảm biến số hoạt động leo cầu thang thường phân biệt với cảm biến gia tốc, mà đòi hỏi phải bổ sung (ví dụ microphone áp kế) (Wilde, 2010) Các hoạt động phổ biến người bộ, đứng, nằm, lên xuống cầu thang hành vi nghiên cứu luận văn 1.4 Điện thoại thông minh Thế hệ điện thoại thông minh xem xét nhiều người dùng thiết bị cá nhân quan trọng Các thiết bị có tiềm cho tăng trưởng cân xứng với việc thu thập liệu hành vi cho việc xây dựng hệ thống dự đoán hành vi người Nhận thức lợi ích chúng trở lên phổ biến, người dùng quen với việc có mặt khắp nơi chúng Điện thoại thông minh trang bị với hàng loạt cảm biến bên trong,trong cảm biến gia tốc, cảm biến quay hồi chuyển sử dụng để giám sát hành vi hàng ngày người Các thiết bị tiện lợi, nhỏ kín đáo, trở thành tảng lý tưởng cho hệ thống nhận dạng hành vi phổ biến Tính hấp dẫn khác đeo được, ln ln bên cạnh người dùng, làm việc thời gian thực sử dụng để giám sát lâu dài Sự phát triển điện thoại thơng minh cho việc dự đốn hành vi người có số nhược điểm như: pin hạn chế, nhớ không cao phát triển lĩnh vực cần giải câu hỏi như: tác động ứng dụng lên pin điện thoại, tỉ lệ mẫu để đạt kết xác, thời gian để tạo mơ hình khơng gian nhớ cần thiết cho Về quy trình thu thập liệu, ta chọn thu thập liệu với điện thoại thông minh đặt vị trí xác định trước phần thể tạo tập liệu thích hợp, sử dụng liệu cơng cộng với liệu thích Các tùy chọn trước đơi ưa thích tập liệu có kích thước thích cần thiết để đánh giá thuật tốn phân lớp, liệu có thích kiểm tra kết Để thu thập liệu hồn chỉnh khơng khả thi, phải thu thập lượng lớn liệu từ người sử dụng thời gian dài để tạo thuật toán mạnh mẽ xác cho việc đốn định người dùng Một số nghiên cứu trước hướng dẫn cho việc ghi liệu sử dụng đối tượng khác nhau, ưu tiên người nghiên cứu giám sát để có liệu tự nhiên Các đối tượng yêu cầu thực loạt hành động thích vào sau hoạt động để thực ngẫu nhiên trình tự hoạt động xác định trước Một liệu công cộng tạo ESANN 2012 (Anguita, Ghio, Oneto, Parra, & Reyes-Ortiz, 2012, 2013) [6] Các thí nghiệm tiến hành với nhóm 30 tình nguyện viên phạm vi độ tuổi từ 19 đến 48 Mỗi người thực hành vi đeo điện thoại thông minh (Galaxy S II) vào thắt lưng, đặt theo chiều dọc Sử dụng cảm biến gia tốc, quay hồi chuyển họ lấy liệu gia tốc tuyến tính trục vận tốc góc trục tốc độ khơng thay đổi 50Hz Các thí nghiệm ghi hình lại để gán nhãn liệu tay CHƯƠNG 2: PHƯƠNG PHÁP, CÔNG CỤ HỖ TRỢ NHẬN DẠNG HÀNH VI 2.1 Kỹ thuật phân lớp nhận dạng hành vi Một liệu sẵn sàng, thuật toán phân loại cần phải thực Như đề cập trước đó, dự đốn hành vi người thường coi vấn đề phân loại, sử dụng kỹ thuật học máy dựa lý thuyết xác suất thống kê Vào năm 1959, Arthur Samuel định nghĩa học máy lĩnh vực nghiên cứu cung cấp cho máy tính khả học hỏi mà khơng cần lập trình cách rõ ràng Các sở học máy xác Samuel mơ tả, xây dựng mơ hình phân loại, khả học từ liệu vơ hình.Mơ hình đại diện cho đại diện liệu (thông thường trường hợp đại diện cho cửa sổ liệu với kích thước cố định) đại diện chức bước huấn luyện cuối phân loại khái qt hóa cho liệu khơng nhìn thấy Học máy làm ngành khoa học máy tính có liên quan đến vấn đề mà mơ hình cho việc dự đốn mơ tả phải thực hiện, dựa thuộc tính biết để huấn luyện từ liệu huấn luyện Thuật toán học máy chia thành loại: - Học máy bán giám sát: kỹ thuật cho phép thuật tốn thích nghi với liệu Một số thuật tốn cho học máy như: mơ hình Markov ẩn (HMM), mạng Naïve Bayes, định, K-Nearest Neighbours, Máy vecter hỗ trợ (SMM) - Học máy giám sát: sử dụng liệu gán nhãn để huấn luyện thuật tốn, sau chúng phân lớp liệu chưa gán nhãn - Học máy không giám sát: cố gắng xây dựng mơ hình trực tiếp từ liệu không đượcgán nhãn Cách tiếp cận sử dụng ước lượng mật độ để tìm cụm mẫu tương tự để tạo mơ hình học máy - Học máy tăng cường: huấn luyện nhiều học máy để giải vấn đề Khả tổng quát chúng tốt nhiều so với sử dụng học máy Liên quan đến mục đích mà hệ thống nhận dạng hành vi thiết kế, điều quan trọng thu thập nhiều liệu hoạt động tốt, không số lượng quan trọng, tính xác việc xử lý ghi điềucần thiết thuật toán dựa nhiều vào số liệu Chủng loại, vị trí số lượng cảm biến sử dụng để thu thập liệu quan trọng so sánh kết nghiên cứu khả thi điều kiện tương tự nhau, khơng thiết phải mơ theo Các q trình cần thiết để nhận dạng hành vi người tóm tắt hình 2.2 bao gồm bước: thu thập liệu chuyển động cho hoạt động, tiền xử lý tín hiệu với lọc, lấy mẫu lại cửa sổ xác định trước để phân tích phân lớp liệu Trong trường hợp sử dụng thư viện weka để phân lớp cần bước bổ sung chuyển đổi liệu vào định dạng tệp ARFF Sau lựa chọn thuộc tính, số liệu đánh giá cần tính tốn đầu mơ hình phân lớp cho thể liệu hoạt động Hình 2.2: mơ hình nhận dạng hành vi từ liệu cảm biến điện thoại thông minh 10 2.3 Tiền xử lý Các liệu thô thường cần phải xử lý trước để cung cấp cho công cụ Trong luận văn sử dụng Weka hoạt động với tập tin định dạng ARFF để tiền xử lý liệu, tất file cần chuyển đổi thành ARFF Dữ liệu thô cảm biến gia tốc cần chia cửa sổ, để chuẩn bị tiền xử lý Một cách lựa chọn cửa sổ dựa vào việc nhận dự định thực thời gian thực hay không Đối với ứng dụng online, cửa sổ xác định song song với tập liệu, ứng dụng offline cửa sổ cần xác định trước thu thập liệu Các phương pháp sử dụng phổ biến cửa sổ trượt, tín hiệu chia cửa sổ khơng có khoảng trống nhiên, kế hoạch có nhược điểm kích thước cửa sổ thiết lập cách tùy tiện, dẫn đến việc tách liệu nơi không thuận tiện, khơng ghi “tồn chu kỳ” hoạt động cần ghi nhận Kỹ thuật sử dụng với chồng chéo (thông thường 50%) Trong nghiên cứu sử dụng cửa sổ với kích thước 256 mẫu (tương ứng với 5,12 giây liệu) chồng chéo 50% Dữ liệu thô cần chia thành tập huấn luyện kiểm thử Tập huấn luyện sử dụng để đào tạo thuật toán nhận dạng tập kiểm thử sau dùng để đánh giá thuật tốn sau đào tạo Điều quan trọng để không sử dụng mẫu thử nghiệm để huấn luyện mô hình để khơng thiên vị kết đảm bảo phân loại đánh giá liệu khơng nhìn thấy cơng cụ weka có số chiến lược chia nhỏ liệu, chẳng hạn cross-validation, phần tập liệu sử dụng phần lại cho thử nghiệm percentage split, thường sử dụng phần liệu cho việc kiểm thử, tỉ lệ train/test 66% 11 2.5 Trích chọn tính Đối với cửa sổ, số tính chiết suất để mơ tả tín hiệu Những tính sau sử dụng đầu vào cho thuật toán nhận dạng, kết hợp cửa sổ với hoạt động Miền thời gian, miền tần số tính miền chuỗi biểu tượng chiết xuất từ liệu chuyển động Tuy nhiên, kết hợp chúng kỳ vọng Time-domain features (tính miền thời gian) số liệu toán học thống kê đơn giản sử dụng để trích xuất thơng tin tín hiệu từ liệu thơ Nó tính liệu đọc Thơng thường, tính đơn giản để tính tốn Bảng 2.1 tóm tắt số tính miền thời gian Frequency-domain techniques (miền tần số) nắm bắt chất tương ứng tín hiệu cảm biến (Figo et al., 2010) Trong tính miền tần số, cửa sổ liệu cảm biến phải chuyển thành miền tần số, sử dụng biến đổi Fourier (FFT), đại diện phổ tín hiệu Một đại diện dựa tần số, dựa phân hủy tập vecor trực giao biến đổi Wavelet Bảng 2.2 cho thấy số tính miền tần số Một tính khác chuyển hóa từ miền chuỗi biểu tượng (symbolic string-domain), nơi mà liệu gia tốc chuyển thành chuos ký hiệu rời rạc, sử dụng bảng chữ biểu tượng để đại diện cho tín hiệu Khi áp dụng tính tính tốn điện thoại thông minh, ta nên cẩn thận với độ phức tạp tính tốn chúng, điện thoại thơng minh có nhớ hạn chế, khả xử lý tuổi thọ pin Do tất tính miền thời 12 gian phù hợp cho thiết bị di động, đưa vào bảng điểu hoạt động tương quan có chi phí cao Với ngoại lệ số liệu dựa biến đổi Wavelet, tất tính khác miền số tốn chi phí tính toán 2.6 Phân lớp liệu Sau lấy tín hiệu tính năng, ta nên áp dụng kỹ thuật học máy để xây dựng phân lớp Có thể sử dụng Weka để thực thuật toán nhận dạng Weka phân lớp dựa vào thuật tốn k-NN, định, Nạve Bayes, SVM… Trong thuật toán k-NN, lớp giao thức cho vector x lớp học với số lượng tối đa phiếu đến từ mẫu k gần x Những phân loại dựa trường hợp khơng đòi hỏi mơ hình phù hợp Để tìm mẫu gần nhất, thuật tốn sử dụng khoảng cách Euclide Các đa lớp láng giềng k gần tìm thấy gán cho phiên thử nghiệm Nó thuật tốn nhanh chóng độ phức tạp phụ thuộc vào số lớp cần phân loại Cây định sử dụng cho thuộc tính, nhánh cho kết thử nghiệm tạo Các thuật tốn dừng tìm thấy Trong Weka sử dụng cài đặt thuật tốn định J48 Đối với Naïve bayes, đối tượng phân loại sai định lượng chi phí hao tổn.Sự kỳ vọng chi phí sử dụng phân lớp tối ưu hóa Tn tốn đại diện cho phân bố xác suất liệu huấn luyện SVM phân lớp tuyến tính xác định siêu phẳng phân cách không gian liệu phân loại điểm không gian 13 CHƯƠNG 3: CÀI ĐẶT VÀ THỰC NGHIỆM Chương mô tả phương pháp sử dụng để đánh giá liệu cảm biến gia tốc, tìm kiếm mơ hình hoạt động huấn luyện phân lớp để dự đoán cho liệu với hành vi tương ứng 3.1 Bộ liệu nhận dạng hành vi Giả thuyết luận văn kiểm tra khả thực thuật toán phân loại điện thoại thơng minh để nhận dạng hành vi người, có tính đến đánh giá pin hạn chế nhớ Với mục đích này, chúng cần nghiên cứu kỹ thuật cần thiết cho tiền xử lý phân loại liệu gia tốc, sử dụng liệu cạnh tranh Trong luận văn này, liệu nhận dạng hành vi cung cấp sẵn [6] với đặc tính liệu: Các thí nghiệm tiến hành với nhóm 30 tình nguyện viên phạm vi độ tuổi từ 19 tuổi đến 48 tuổi Mỗi người thực hành vi đeo điện thoại thông minh (Galaxy S II) vào thắt lưng, đặt theo chiều dọc Sử dụng cảm biến gia tốc, quay hồi chuyển họ lấy liệu gia tốc tuyến tính trục vận tốc góc trục tốc độ khơng thay đổi 50Hz Các thí nghiệm ghi hình lại để gán nhãn liệu tay Bộ liệu cung cấp tín hiệu gia tốc quay hồi chuyển cho liệu (huấn luyện kiểm thử) nhãn hành vi cho trường hợp “Các tín hiệu cảm biến (gia tốc quay hồi chuyển) tiền xử lý cách áp dụng lọc nhiễu sau lấy mẫu với cửa sổ trượt 2,56 giây 50% chồng chéo Tín hiệu cảm biến gia tốc, thành phần hấp dẫn chuyển động thể phân tách lọc thông thấp Butterworth Lực hấp dẫn giả định thành phần có tần số thấp, lọc với tần 14 số cắt 0.3Hz sử dụng Với cửa sổ, vector tính thu lại cách tính tốn từ biến thời gian miền tần số.” [6] Các tính chuẩn hóa giới hạn khoảng [-1, 1] Việc chuẩn hóa thực theo hàm số: 𝑥 − 𝑀𝑖𝑛 𝑥𝑁𝑜𝑟𝑚 = ×2−1 𝑀𝑎𝑥 − 𝑀𝑖𝑛 Trường xNorm tính chuẩn hóa, x tính Min Max giá trị tối thiểu tối đa tương ứng với tính x Để phân loại xác hơn, liệu nên cân tất lớp nên có số trường hợp Sự phân lớp từ liệu cạnh tranh giới thiệu bảng 3.1 Bảng 3.1: Số lượng trường hợp cho lớp Nhãn liệu Walking Walking down stairs Walking up stairs Sitting Standing Lying Total 3.2 Tập huấn luyện 1226 1073 986 1286 1374 1407 Tập kiểm thử 496 471 420 491 532 537 7352 2947 Tiền xử lý liệu Liên quan đến kỹ thuật tiền xử lý, có cách thức để lựa chọn thuộc tính: Filters Wrapper Sau ta tạo tập từ vector đặc trưng phân loại để sử dụng tập con, mục tiêu tạo tập mà phân lớp thực tốt Để tìm tập 15 con, người ta sử dụng phương thức tìm kiếm như: phương pháp linear forward phương pháp best first Các lọc sử dụng thẩm định thuộc tính (attribute evaluator) hàng để xếp hạng tính Với phương pháp này, tính có cấp bậc thấp loại bỏ thời gian để xem độ xác việc phân loại Với luận văn này, sử dụng weka để thực tiền xử lý liệu Trong Weka sử dụng phương pháp đánh giá CfsSubSetEval phương thức tìm kiếm Best First Từ liệu với 562 thuộc tính (561 thuộc tính thuộc tính lớp phân loại), thực trích chọn thuộc tính để có vector 37 tính cho huấn luyện mơ hình phân lớp Bảng 3.4: Trích chọn tính từ tập liệu ban đầu Attribute 561 (DT0) 561 (DT0) 37(DT2) 3.3 attribute evaluator CfsSubSetEval CfsSubSetEval CfsSubSetEval Search method Select Att BestFirst LinearForwardSel LinearForwardSel 49 (DT1) 37(DT2) 32(DT3) Xây dựng thực nghiệm ứng dụng nhận dạng hành vi Do phạm vi nghiên cứu đề tài luận văn thời gian ngắn, nên tơi xây dựng chương trình mang tính chất demo tơi nghiên cứu Ứng dụng xây dựng tảng Android, sử dụng liệu tiền xử lý với công cụ Weka Ứng dụng sử dụng thư viện Weka cho việc xử lý tiền liệu thư viện Weka mobile cho việc kiểm thử liệu mobile Luận văn xin cung cấp số thông tin Weka sau: Weka phần mềm nguồn mở khai phá liệu phát triển đại học University of Waikato nước New 16 Zealand “Weka” từ viết tắt cho cụm từ Waikato Environment for Knowledge Analysis Weka sử dụng nhiều cấp độ khác Cấp độ đơn giản ta áp dụng thuật tốn Weka để xử lý liệu từ dòng lệnh Nó bao gồm nhiều công cụ dùng cho việc biến đổi liệu, thuật tốn dùng để rời rạc hóa liệu Weka cung cấp tất chức khai phá liệu bao gồm thuật toán phân lớp (classifier), thuật toán tiền xử lý liệu (filter), thuật toán phân cụm (cluster), thuật toán kết tập luật (association rule) Phương pháp phân lớp Trong chương trước luận văn trình bày số thuật tốn phân lớp Với thử nghiệm, luận văn sử dụng định thuật toán SVM để xây dựng mơ hình học máy Mơi trường phát triển: - Hệ điều hành Windows 10 x64 Android Studio version 2.2.2 Android SDK Công cụ Weka Windows thư viện Weka cho android Chức ứng dụng Với liệu tiền xử lý, hệ thống thực nhiệm vụ: xây dựng mơ hình học máy điện thoại thơng minh để đốn định liệu sau kiểm thử với liệu test, sử dụng mơ hình xây dựng cơng cụ Weka thực kiểm thử liệu test với mơ hình điện thoại thơng minh, đánh giá mơ hình học máy 17 Hình 3.3: Chương trình ứng dụng demo 3.4 Kết thực nghiệm Trong luận văn tơi tiến hành số thí nghiệm tập liệu HAR để dự đoán kết người dùng tương lai Xét liệu thu với trích chọn thuộc tính từ Weka, thuật tốn J48 sử dụng phân lớp quan tâm giai đoạn phát tập liệu tối giản tốt Dựa số hiệu suất phân lớp trình bày bảng 3.6, DT2 chọn liệu tối giản tốt hơn, số hiệu suất tốt 18 Bảng 3.6: Phân lớp J48 với tập liệu DT1 DT2 DT3 TP FP Precision Recall 0.84 0.861 0.861 0.032 0.028 0.028 0.842 0.864 0.862 0.84 0.861 0.861 FMeasure 0.84 0.861 0.86 Dựa vào bảng 3.7 tập liệu DT2, thuật toán IB1 (thể thuật toán k-NN) SMO (thuật toán SVM) cho hiệu tốt so với J48 giá trị FP F-Mesure Tuy nhiên, J48 phù hợp cho điện thoại thơng minh, J48 cần thời gian để dự đốn liệu Bảng 3.7: Thử nghiệm với tập liệu DT2 J48 Num FP F-Measure Training time Predict time 395.20 0.859 18,5 s 0,241 s IB1 (kNN) 412.20 0.90 0,238 s 90.37 s SMO (SVM) 407.80 0.91 9,2 s 0,356 s Xét tập DT2 mơ hình phân lớp J48, bảng 3.8 hình 3.4 cho thấy số liệu hiệu suất phân lớp cho tập liệu mơ hình phân lớp chọn Độ xác thu 87.38 % lỗi 12.62% cho tập liệu kiểm thử với 2947 liệu kiểm thử tập liệu 7532 liệu cho mơ hình huấn luyện Kết đánh bảng ta thấy liệu theo đường chéo có giá trị cao thể cho phần lớn phân lớp Với nhãn Laying liệu phân lớp 100% 19 Bảng 3.8: Kết thực nghiệm với thuật toán J48 Số trường hợp sai Số trường hợp Tổng số mẫu Theo tỉ lệ % Theo số mẫu 12.62300645 372 87.37699355 2575 2947 Hình 3.4: Kết phân lớp liệu với thuật tốn J48 Trong kết phân tích hành vi hội nghị ESANN 2013, kết tốt 96% [6] Độ xác luận văn 87.4% với thuật toán định – J48, thấp gần 10% so với kết tốt Tuy nhiên, khơng có thơng tin quy trình xử lý đánh giá kết quả, việc so sánh kết nghiên cứu khó khăn 20 KẾT LUẬN Phân tích hoạt động người nhận quan tâm ngày nhiều người chăm sóc người cao tuổi, vận động viên, bác sỹ, chuyên gia dinh dưỡng, nhà vật lý trị liệu, người muốn kiểm tra mức độ hoạt động hàng ngày Với tài liệu tham khảo nghiên cứu trước lĩnh vực này, điện thoại thông minh với cảm biến gia tốc sử dụng để thu thập liệu chuyển động người dùng chúng nhỏ gọn, vướng víu cảm biến đeo được, đặc biệt người dùng thường xuyên mang theo người Các liệu thu thập từ gia tốc tuyến tính cung cấp thông tin gia tốc chuyển động thể người trọng lực Các tín hiệu trích xuất cường độ, góc, độ lệch chuẩn biến đổi FFT dùng để huấn luyện mơ hình học máy Mục tiêu luận văn thực xây dựng phương pháp để xác định hoạt động hàng ngày người ngồi, nằm, đứng, leo cầu thang thiết bị điện thoại thông minh; sử dụng liệu cảm biến cung cấp sẵn Với phán xây dựng, tỷ lệ xác khoảng 86% lỗi phân loại khoảng 14% Hướng nghiên cứu phát triển từ kết đạt luận văn vào toán xây dựng ứng dụng giám sát nhiều cho hoạt động thể chất người mà người dùng cung cấp thông tin phản hồi tiền sử thể chất người dùng, tương tác với thiết bị đeo để tăng cường tính xác cho hoạt động phân tích ứng dụng 21 ... xứng với vi c thu thập liệu hành vi cho vi c xây dựng hệ thống dự đốn hành vi người Nhận thức lợi ích chúng trở lên phổ biến, người dùng quen với vi c có mặt khắp nơi chúng Điện thoại thông minh. .. liệu cảm biến thu từ cổ tay thuận tốt cho hoạt động phân biệt hành vi liên quan đến chuyển động thể liệu từ gia tốc đùi hữu ích cho vi c nhận dạng hành vi thực với chi Hệ thống nhận dạng hành vi. .. 2010) Các hoạt động phổ biến người bộ, đứng, nằm, lên xuống cầu thang hành vi nghiên cứu luận văn 1.4 Điện thoại thông minh Thế hệ điện thoại thông minh xem xét nhiều người dùng thiết bị cá nhân