Trong hình trên ct đại điện cho hồi quy bên trong và ht đại diện cho hồi quy bên ngồi. Các cổng tế bào là cổng đầu vào gt, cổng forget ft và cổng đầu ra ot. Trái ngược với một nút RNN, ở LSTM yt đầu ra hiện tại được coi như bằng với trạng thái ẩn hiện tại ht
Hệ thống phát hiện VĐBT bằng LSTM dựa trên RNN theo sơ đồ như hình 3.6 được đề xuất trong [6]. Một ánh xạ đầu vào là dữ liệu thơ thu thập từ các cảm biến, khi qua mạng sẽ giúp phân loại là các nhãn hoạt động. Đầu vào là một chuỗi tín hiệu rời rạc cách đều (x1, x2, ..., xT), trong đĩ mỗi điểm dữ liệu xt là một mẫu dữ liệu của cảm biến ở thời điểm t. Các mẫu này được phân đoạn thành các cửa sổ cĩ độ dài T (bằng 2 giây) và được đưa vào mơ hình. Đầu ra của mơ hình sẽ là một chuỗi các điểm số biểu diễn nhãn hoạt động cho mỗi bước thời gian ( 1 , 2 , . . . , ). Trong đĩ ∈ là véc-tơ biễu diễn dự đốn cho một mẫu đầu vào là xt, và C là số lớp hoạt động. Từ đây sẽ cho ra điểm số cho mỗi bước theo thời gian dự
đốn hoạt động gì diễn ra tại thời điểm t. Dự đốn cho tồn bộ cửa sổ T sẽ cĩ được bằng cách hợp nhất các điểm số riêng lẻ thành một dự đốn tổng thể. Ở đây, nghiên cứu [6] đã sử dụng kỹ thuật kết hợp muộn (late-fusion) trong đĩ quyết định phân loại được đưa ra từ các mẫu kết hợp riêng lẻ theo cơng thức 3.11. Một lớp softmax trên Y được áp dụng để chuyển đổi các điểm số dự đốn thành xác suất:
= 1∑
(3.11)