Kết luận và hướng phát triển

Một phần của tài liệu (LUẬN văn THẠC sĩ) nhận dạng hành động người dùng mạng nơron tích chập (Trang 58 - 62)

4.1 Kết luận

Trong khóa luạn này, với mục tiêu chính là xây dựng mơ hình trong đó ứng dụng một thuật tốn của học sâu (deep learning - CNN), Demo nhận dạng với phương pháp sử dạng mạng Nơ-ron tích chập có khả năng phát hiện đúng hành động của con người trong video hoặc dữ liệu trên hệ thống camera số. Khóa luận đã đạt được các kết quả như sau:

 Nắm được các vấn đề cơ bản của ảnh số và xử lý ảnh số.

 Nắm được các đặc điểm của một bài tốn phân loại nói chung và nhận dạng hành động người nói riêng.

 Tìm hiểu, nắm được một số kiến trúc mạng CNN, một trong những thuật toán deep learning cho kết quả tốt nhất hiện nay trong hầu hết các bài toán về thị giác máy như phân lớp, nhận dạng, …

 Demo và Test thử thành công trên bộ dữ liệu tự thu thập của tác giả với tỉ lệ nhận dạng chính xác 99,79%.

4.2 Những hạn chế và hướng phát triển của đề tài

4.2.1 Hạn chế của đề tài

Độ chính xác phụ thuộc nhiều vào tập dữ liệu ảnh huấn luyện. Các hành động dự đoán đang ở mức độ đơn giản và chỉ một hành động cho mỗi lần dự đoán.

Tỉ lệ nhận dạng còn phụ thuộc nhiều vào điều kiện ánh sáng, phản chiếu hoặc che bóng,…

4.2.2 Hướng phát triển của đề tài

Nâng cao hiệu quả chương trình, phát hiện được cùng lúc nhiều hành động phức tạp với độ chính xác cao. Hiện nay cũng có rất nhiều phương pháp tiếp cận mục tiêu tiêu trên với sự hỗ trợ đắc lực từ các thuật toán học sâu như:

 Recurrent neural networks (RNN)

 Two-Stream Convolutional Networks

 3D Convolutional Neural Networks

 Actions ∼ Transformations

Nâng cấp chương trình có thể chạy được trên dữ liệu thực tế thu được từ các loại camera số có thể tự động tracking (theo dõi) liên tục đối tượng.

Phát triển chương trình thành module phần cứng. Có khả năng tương thích với các thiết bị quan sát như camera.

Nghiên cứu theo hướng một ứng dụng cụ thể như: trong các thiết bị an ninh, chăm sóc y tế, quản lý trẻ em trong trường học, quản lý con người, …

TÀI LIỆU THAM KHẢO

[1]. Yann Lecun, Léon Bottou, Yoshua BenGio, and Patrick Haffner. “Gradient- Based Learning Applied to Document Recognition”. Proc. of the IEEE, 1998. [2]. Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. “Imagenet

classification with deep convolutional neural networks”. Advances in neural information processing systems, 2012.

[3]. Vedaldi, Andrea, and Karel Lenc. “MatConvNet-convolutional neural networks for MATLAB”. arXiv preprint arXiv:1412.4564, 2014.

[4]. N. Dalal and B. Triggs. “Histograms of oriented gradients for human detection”. In CVPR, pages 886–893, 2005.

[5]. Yangqing Jia. “Caffe: Convolutional Architecture for Fast Feature Embedding”, 2014.

[6]. M. D. Zeiler and R. Fergus. “Visualizing and understanding convolutional networks”. In Proc. ECCV, 2014.

[7]. Anoosha, Nandakumar. “A Technique of Human Action Recognition Using 3D Convolutional Neural Network”. International Journal of Emerging Technology and Advanced Engineering. September 2014.

[8]. Karen Simonyan, Andrew Zisserman. “Two-Stream Convolutional Networks for Action Recognition in Videos”. Visual Geometry Group, University of Oxford, 2014.

[9]. Moez Baccouche, Franck Mamalet, Christian Wolf, Christophe Garcia, and Atilla Baskurt. “Sequential Deep Learning for Human Action Recognition”.

Orange Labs, 4 rue du Clos Courtel, 35510 Cesson-Sévigné, France. LIRIS, UMR 5205 CNRS, INSA-Lyon, F-69621, France, 2011.

[10]. Lê Viết Tuấn. “Nhận diện hành động người bằng cập nhật kết quả phân lớp”. Trường Đại học Yersin Đà Lạt. Bản tin khoa học và giáo dục, 2014.

[11]. Lê Thị Thu Hằng. “Nghiên cứu về mạng neural tích chập và ứng dụng cho bài toán nhận dạng biển số xe”. Luận văn thạc sĩ công nghệ thông tin, Đại học quốc gia Hà Nội, Trường đại học Công Nghệ, 2016.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nhận dạng hành động người dùng mạng nơron tích chập (Trang 58 - 62)

Tải bản đầy đủ (PDF)

(62 trang)