Hạn chế và hướng phát triển

Một phần của tài liệu Ứng dụng cảm biến 3d kinect trong nhận diện ngôn ngữ cử chỉ tiếng việt hỗ trợ việc giao tiếp với người khuyết tật khiếm thính (Trang 53)

Do thời gian có hạn, luận văn vẫn chưa xây dựng một hệ thống có ứng dụng hoàn chỉnh. Bên cạnh đó giải thuật nhận dạng còn tồn tại nhiều vấn đề như mới nhận diện được một bàn tay và thời gian xử lý còn cao v.v... Trong thời gian tiếp theo, tôi mong muốn hệ thống sẽ tiếp tục được cải tiến theo các hướng chính:

- Cải thiện phần tiền xử lý và trích chọn thêm đặc trưng của bàn tay để cải thiện khả năng đánh giá của hàm mục tiêu.

- Tăng cường phần cứng và tối ưu lập trình cho các phần của giải thuật song song để có thể xử lý được 30 hình/giây.

- Xây dựng quá trình hiệu chuẩn tự động bằng phương pháp tối ưu bầy đàn để giải thuật nhận dạng phù hợp với các mô hình kích thước bàn tay khác nhau.

- Nghiên cứu phát triển giải thuật để nhận dạng được chuyển động và tương tác của hai bàn tay.

Bằng việc kết hợp với các giải thuật khác như nhận dạng khuôn mặt, nhận dạng chuyển động cánh tay người, mạng neuron v.v… tôi hi vọng xây dựng được một hệ thống tương tác người máy có khả năng nhận diện được ngôn ngữ kí hiệu tiếng Việt trong tương lai không xa.

TÀI LIỆU THAM KHẢO

[1]A. Erol, G. Bebis, M. Nicolescu, R.D. Boyle, X. Twombly, “Vision-based Hand Pose Estimation: A review”, J. Computer Vision and Image Understanding, vol.108(1-2), pp.52–73, 2007.

[2]I. Oikonomidis, N. Kyriazis, A. Argyros, “Efficient model-based 3D tracking of hand articulations using Kinect”, Proceedings of the British Machine Vision Conference, pp 101.1-101.11, 2011.

[3]H. Ouhaddi, P. Horain, “3D Hand gesture tracking by model registration”, International Workshop on Synthetic—Natural Hybrid Coding and Three Dimensional Imaging, 1999. [4]B. Stenger, P.R.S. Mendonca, R. Cipolla, Model-based 3D tracking of an articulated

hand, IEEE Computer Society Conference on Computer Vision and Pattern Recognition 02 (2001) 310.

[5]B. Stenger, Model-based hand tracking using a hierarchical bayesian filter, Ph.D. thesis, Department of Engineering, University of Cambridge, 2004.

[6]W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling, Numerical Recipes in C, Cambridge University Press, 1992.

[7]J. A. Nelder and R. Mead, “A Simplex Method for Function Minimization”, Computer Journal, vol. 7, 1965, pp. 308-313.

[8]David Goldberg, Genetic Algorithms in Search, Optimization and Machine Learning, Addison-Wesley Professional, 1989.

[9]J. Kennedy, R.C. Eberhart, Swarm Intelligence, Morgan Kaufmann, 2001.

[10] Nicholas Wilt, The CUDA Handbook: A Comprehensive Guide to GPU Programming, Addison-Wesley Professional, 1 edition, 2013.

[11] Matthew Scarpino, OpenCL in Action: How to Accelerate Graphics and Computations, Manning Publications, 1 edition, 2011.

[12] Dave Shreiner, Graham Sellers, John M. Kessenich, Bill M. Licea-Kane, OpenGL Programming Guide: The Official Guide to Learning OpenGL, Addison-Wesley Professional, 8 edition, 2013.

[13] L. Williams, Pyramidal parametrics, In ACM SIGGRAPH Computer Graphics, vol. 17, pp 1–11, 1983.

[14] Ivor Horton, Ivor Horton's Beginning Visual C++ 2010, Wrox; 1 edition, 2010.

[15] Samarth Brahmbhatt, Practical OpenCV (Technology in Action), Apress, 1 edition, 2013

[16] Jana Abhijit, Kinect for Windows SDK Programming Guide (Community Experience Distilled), Packt Publishing, 2012.

Một phần của tài liệu Ứng dụng cảm biến 3d kinect trong nhận diện ngôn ngữ cử chỉ tiếng việt hỗ trợ việc giao tiếp với người khuyết tật khiếm thính (Trang 53)

Tải bản đầy đủ (PDF)

(55 trang)