Ứng dụng mơ hình học máy cho bài tốn phát hiện VĐBT

Một phần của tài liệu LA_Nguyễn-Tuấn-Linh (Trang 82 - 84)

5. Bố cục của luận án

2.5. Ứng dụng mơ hình học máy cho bài tốn phát hiện VĐBT

Với sự phát triển của cơng nghệ chế tạo cảm biến, đã cĩ nhiều cảm biến được nghiên cứu, phát triển và sử dụng trong các sản phẩm thương mại với mục đích thu thập các thơng tin về vận động hằng ngày của con người. Cũng chính điều này đã làm cho dữ liệu thu thập được ngày càng đa dạng và thiếu tính đồng nhất. Đối với các hệ thống phát hiện hoạt động, các dữ liệu thơ thu thập từ các cảm biến thường khơng cĩ giá trị nhận dạng nếu khơng được xử lý. Trong trường hợp này, cần sử dụng các

phương pháp học máy để xử lý dữ liệu bằng việc tạo ra các mẫu giúp mơ tả, phân tích và phân loại hoạt động.

Với các đặc trưng được tính tốn từ dữ liệu thu được từ ba cảm biến 3 trục gồm gia tốc kế, con quay hồi chuyển và từ kế cĩ thể coi đĩ là dữ liệu nhiều chiều. Để xử lý các dữ liệu này, NCS sử dụng hai mơ hình học máy bao gồm Máy véc-tơ hỗ trợ (SVM) và Rừng ngẫu nhiên (RF) trong các thử nghiệm về kết hợp các đặc trưng cảm biến, hai mơ hình học máy này đã được chứng minh cĩ khả năng giải quyết tốt các vấn đề đối với dữ liệu nhiều chiều và tránh được vấn đề over-fitting [22, 64, 76]. Mơ hình SVM cĩ thể duy trì các đặc trưng tổng quát trên dữ liệu bằng cách ánh xạ các đặc trưng vào một khơng gian đặc trưng mới cĩ kích thước cao hơn bằng cách sử dụng một hàm nhân [22, 64], giúp tìm một siêu phẳng (hyper plane) với đường phân biệt (max-margin) lớp đối tượng tốt hơn trong khơng gian mới.

Mơ hình RF là một bộ phân loại đồng bộ bao gồm nhiều cây quyết định, RF cĩ một số ưu điểm như các mơ hình RF cĩ thể tạo ra một ước tính khơng thiên vị nội bộ về lỗi tổng quát khi nĩ xây dựng các tiến trình [76]. Đặc biệt là nĩ cĩ khả năng cân bằng lỗi trong lớp phổ biến trên các tập dữ liệu khơng cân bằng. Ngồi ra, RF là một ví dụ điển hình về việc giảm sự phù hợp bằng cách lấy trung bình một nhĩm cây. RF cũng cĩ thể được mở rộng để học từ dữ liệu khơng được gán nhãn, điều này thường được sử dụng trong các tác vụ khác như phân cụm khơng giám sát, kiểm tra dữ liệu và phát hiện ngoại lệ. Những đặc điểm này của RF rất quan trọng đối với các lĩnh vực nghiên cứu nhận dạng hoạt động ở người vì dữ liệu từ các cảm biến cĩ thể tăng nhanh chĩng, phần lớn chúng khơng cĩ nhãn và thường mất cân bằng. Mỗi phần tử của RF là một cây quyết định cĩ cấu trúc dạng đồ thị theo luồng, trong đĩ mỗi nút biểu thị một phép thử trên một thuộc tính trong khi mỗi nhánh trong cây xác định một tiến trình của phép thử, cây quyết định thực hiện nhiệm vụ phân loại bằng cách so sánh các giá trị thuộc tính của một dãy hữu hạn các giá trị với cây quyết định và đường dẫn là một vết từ gốc tới nút lá, để dự đốn lớp cho một quan sát.

Một phần của tài liệu LA_Nguyễn-Tuấn-Linh (Trang 82 - 84)