Luận án Tiến sĩ Kỹ thuật Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy

110 0 0
Luận án Tiến sĩ Kỹ thuật  Nghiên cứu biểu diễn và nhận dạng đối tượng chuyển động dựa trên đại số hình học bảo giác và học máy

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN NĂNG HÙNG VÂN NGHIÊN CỨU BIỂU DIỄN VÀ NHẬN DẠNG ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ HÌNH HỌC BẢO GIÁC VÀ HỌC MÁY LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng – 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN NĂNG HÙNG VÂN NGHIÊN CỨU BIỂU DIỄN VÀ NHẬN DẠNG ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ HÌNH HỌC BẢO GIÁC VÀ HỌC MÁY Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62 48 01 01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Người hướng dẫn khoa học: PGS.TS Kanta Tachibana TS Phạm Minh Tuấn Đà Nẵng - 2021 LỜI CAM ĐOAN Tôi cam đoan kết nghiên cứu trình bày luận án trung thực không chép từ luận án khác Một số kết nghiên cứu thành tập thể đồng tác giả đồng ý cho sử dụng Mọi trích dẫn có ghi nguồn gốc xuất xứ rõ ràng đầy đủ Tác giả Nguyễn Năng Hùng Vân i MỤC LỤC LỜI CAM ĐOAN i MỤC LỤC ii DANH MỤC CÁC TỪ VIẾT TẮT v DANH MỤC KÝ HIỆU TOÁN HỌC vi DANH MỤC HÌNH VẼ vii DANH MỤC BẢNG BIỂU x MỞ ĐẦU 1 Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Bố cục luận án 5 Đóng góp luận án Chương PHƯƠNG PHÁP BIỂU DIỄN ĐỐI TƯỢNG CHUYỂN ĐỘNG TRONG HỌC MÁY 1.1 Phương pháp biểu diễn liệu không gian 1.1.1 Phương pháp biểu diễn liệu không gian vectơ 10 1.1.2 Phương pháp biểu diễn liệu ma trận 10 1.1.3 Phương pháp biểu diễn liệu Ten-xơ 11 1.2 Phương pháp biểu diễn đối tượng chuyển động học máy 12 1.2.1 Biểu diễn liệu dựa mơ hình xác suất 13 1.2.2 Phương pháp giảm chiều liệu 16 1.2.3 Phương pháp tăng chiều liệu 19 1.3 Phương pháp biểu diễn đối tượng chuyển động sử dụng CGA 25 1.3.1 Đại số hình học 27 ii 1.3.2 Đại số hình học bảo giác 27 1.4 Kết luận chương 28 Chương ĐỀ XUẤT PHƯƠNG PHÁP BIỂU DIỄN ĐỐI TƯỢNG CHUYỂN ĐỘNG DỰA TRÊN ĐẠI SỐ HÌNH HỌC BẢO GIÁC 31 2.1 Đại số hình học hình học bảo giác 31 2.1.1 Đại số hình học 31 2.1.2 Đại số hình học Bảo giác 37 2.2 Đề xuất phương pháp phân cụm liệu sử dụng CGA 41 2.2.1 Phân cụm liệu sử dụng CGA dựa GMM 43 2.2.2 Lượng tử hóa vectơ dựa phân cụm liệu sử dụng CGA 45 2.2.3 Phương pháp kết hợp HMM với phân cụm sử dụng CGA 49 2.3 Đề xuất phương pháp trích chọn đặc trưng sử dụng CGA 50 2.3.1 Phương pháp trích chọn đặc trưng sử dụng PCA 51 2.3.2 Phương pháp trích chọn đặc trưng sử dụng CGA 53 2.3.3 Phương pháp PCR kết hợp với CGA 55 2.3.4 Phương pháp trích chọn đặc trưng sử dụng CGA kết hợp RNN 60 2.4 Kết luận chương 64 Chương TRIỂN KHAI THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 67 3.1 Dữ liệu thực nghiệm 68 3.1.1 Đối tượng chuyển động không gian 68 3.1.2 Bộ liệu chuyển động CMU 69 3.1.3 Dữ liệu thực nghiệm 71 3.2 Nhận dạng hành động dựa phân cụm CGA kết hợp với HMM 71 3.2.1 Kết thực nghiệm 72 3.2.2 Đánh giá kết 74 iii 3.3 Nhận dạng hành động dựa vào phương pháp PCR kết hợp với CGA 75 3.3.1 Các phương pháp thực nghiệm 76 3.3.2 Kết thực nghiệm 76 3.3.3 Đánh giá kết 79 3.4 Nhận dạng hành động dựa vào phương pháp CGA kết hợp với RNN79 3.4.1 Kết thực nghiệm 79 3.4.2 Đánh giá kết 81 3.5 Kết luận chương 82 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 84 Kết luận án 84 Đánh giá kết 84 Hướng nghiên cứu 87 DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ 88 TÀI LIỆU THAM KHẢO 89 iv DANH MỤC CÁC TỪ VIẾT TẮT Thuật ngữ Tiếng Anh Tiếng Việt 2D Two Dimension Hai chiều 3D Three Dimension Ba chiều AI Artificial Intelligence Trí tuệ nhân tạo ANN Artificial Neural Network Mạng nơron nhân tạo CGA Conformal Ageometric Algebra Đại số hình học bảo giác CMU Carnegie Mellon University Đại học Carnegie Mellon CNN Convolutional Neural Network Mạng nơron tích chập Deep Learning Học sâu Dynamic Time Warping So khớp thời gian động EM Expectation Maximization Thuật tốn cực đại hóa kỳ vọng GA Geometric Algebra Đại số hình học GMM Gaussian Mixture Model Mơ hình hỗn hợp Gauss HAR Human Activity Recognition Nhận dạnh hành động người HMM Hidden Markov Model Mơ hình Markov ẩn KNN k-Nearest Neighbor LDA Linear Discriminant Analysis Phân tích biệt thức tuyến tính LSTM Long Short Term Memory Mạng nơron nhớ ngắn-dài hạn m-D m-Dimension m chiều PCA Principal Components Analysis Phân tích thành phần PCR Principal Component Regression Hồi quy thành phần RGB Red Green Blue Hệ màu Đỏ-Lục-Lam RNN Recurrent Neural Network Mạng nơron hồi quy SVM Support Vector Machine Máy vectơ hỗ trợ Vector Quantization Lượng tử hóa vectơ DL DTW VQ láng giềng gần v DANH MỤC KÝ HIỆU TOÁN HỌC Ký hiệu, từ viết tắt Diễn giải Hàm số Lagrange Ma trận phương sai CGA Ma trận phương sai PCA Ma trận khoảng cách Hàm mật độ xác suất Gauss Tập liệu huấn luyện Số phân cụm Xác suất chuyển từ trạng thái HMM Mật độ xác suất đầu HMM Tập điểm không gian CGA Vectơ bảo giác khơng gín CGA Các trạng thái HMM Vectơ trọng số phép biến đổi tuyến tính PCA Vectơ trung bình tập liệu Hàm kích hoạt mơ hình RNN vi DANH MỤC HÌNH VẼ Hình 1.1: Mơ hình huấn luyện liệu học máy Hình 1.2: Mơ hình hỗn hợp Gauss M phân phối thành phần 14 Hình 1.3: Mơ hình Markov ẩn trạng thái 15 Hình 1.4: Biểu diễn liệu khơng gian PCA 17 Hình 1.5: Phương pháp phân tích biệt thức tuyến tính hai lớp 18 Hình 1.6: Xác định siêu phẳng với lề cực đại SVM 2D 20 Hình 1.7: Minh họa trình biểu diễn tăng số chiều liệu phương pháp kernel SVM 21 Hình 1.8: Mạng nơron với nút kết nối với để mô mạng nơron não người 22 Hình 1.9: Kiến trúc mạng nơron tích chập gồm hai thành phần 23 Hình 1.10: Phép tích chập mạng nơron tích chập 24 Hình 1.11: Tầng hợp (max pool) với lộc bước nhảy (stride) mạng nơron tích chập 25 Hình 1.12: Mơ hình khớp xương mật độ phân bố liệu khớp lhumerus 26 Hình 2.1: Biểu diễn vectơ khơng gian Clifford 2D 32 Hình 2.2: Biểu diễn vectơ không gian Clifford 3D 33 Hình 2.3: Phép ngoại tích đại số hình học 34 Hình 2.4: Phản xạ vectơ qua mặt phẳng không gian GA 35 Hình 2.5: Phép quay khơng gian GA 36 Hình 2.6: Mơ hình nhận dạng hành động dựa phương pháp phân cụm sử dụng CGA kết hợp với HMM 42 Hình 2.7: Dữ liệu đối tượng phân bố dạng hình cung 43 Hình 2.8: Phân cụm liệu cách sử dụng đại số hình học bảo giác 48 vii Hình 2.9: Mơ hình nhận dạng hành động phương pháp lượng tử hóa vectơ dựa phân cụm liệu sử dụng CGA thuật tốn k-means 48 Hình 2.10: Mơ hình nhận dạng hành động hương pháp kết hợp HMM với phân cụm sử dụng CGA 49 Hình 2.11: Mơ hình nhận dạng hành động sử dụng phương pháp trích chọn đặc trưng sử dụng CGA_PCA 51 Hình 2.12: So sánh phương pháp biểu diễn liệu PCA CGA 54 Hình 2.13: Minh họa phương pháp biểu diễn liệu sử dụng PCR lớp 55 Hình 2.14: Dữ liệu phân bố hai lớp dạng hỗn hợp đối tượng chuyển động không gian 57 Hình 2.15: Mơ hình đề xuất nhận dạng hành động dựa vào PCR kết hợp với CGA 58 Hình 2.16: Ma trận khoảng cách đối tượng 59 Hình 2.17: Phương pháp trích chọn đặc trưng sử dụng CGA kết hợp với RNN để nhận dạng hành động người 61 Hình 2.18: Mơ hình mạng nơron hồi quy ‘many to one’ 63 Hình 3.1: Mơ hình khởi tạo đối tượng (marker) chuyển động thể, nguồn từ [21] 68 Hình 3.2: Mơ hình hóa khớp xương (marker) thể 69 Hình 3.3: Kết nhận dạng sử dụng HMM dựa thuật toán phân cụm kmean phương pháp đề xuất CGA clustering 75 Hình 3.4: Mơ hình khớp xương mật độ phân bố liệu khớp lhumerus 77 Hình 3.5: Kết phương pháp đề xuất sử dụng PCR kết hợp với CGA để nhận dạng hành đồng người 78 Hình 3.6: So sánh kết phương pháp đề xuất thực nghiệm 78 viii KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Kết luận án Luận án đạt mục tiêu đặc ban đầu, tên luận án “Nghiên cứu biểu diễn nhận dạng đối tượng chuyển động dựa đại số hình học bảo giác học máy” đạt số kết sau: - Luận án nghiên cứu vấn đề biểu diễn liệu không gian phương pháp biểu diễn liệu học máy, từ đề xuất áp dụng đại số hình học bảo giác để biểu diễn đối tượng chuyển động không gian - Luận án đề xuất phương pháp phân cụm liệu cách kết hợp đại số hình học bảo giác với hàm mật độ xác suất phân phối Gauss để tạo chuỗi liệu cho HMM - Luận án đề xuất phương pháp lượng tử hóa vectơ cách sử dụng đại số hình học bảo giác để tối ưu hàm khoảng cách kết hợp với HMM để nhận dạng hành động người di chuyển - Luận án đề xuất xây dựng mơ hình huấn luyện liệu cách kết hợp PCR với CGA để nhận dạng hành động người - Luận án đề xuất phương pháp trích chọn đặc trưng giảm số chiều liệu cách sử dụng đại số hình học bảo giác kết hợp CGA với RNN để nhận dạng hành động người Cuối cùng, luận án thực nghiệm phương pháp đề xuất liệu chuyển động MCU Kết thực nghiệm cho thấy phương pháp đề xuất có kết cao áp dụng phương pháp đề xuất luận án để nhận dạng hành động người Đánh giá kết Luận án trình bày kết nghiên cứu sử dụng đại số hình học bảo giác để biểu diễn đối tượng chuyển động kết hợp với mơ hình học máy 84 HMM, PCR RNN để nhận dạng hành đông người Luận án có tính thực tiễn cao xu hướng tạo video từ thiết bị đơn giản, ứng dụng để giám sát, điều khiển để hệ thống tự động hóa để thay người Bảng 3.5 kết phương pháp đề xuất luận án Bảng 3.5: Bảng tổng hợp kết phương pháp đề xuất STT Phương pháp Độ xác Dữ liệu thực nghiệm Thực nghiệm tiến hành k-means HMM 72,57% CGA HMM 86,95% liệu CMU với hành động người (dance, jump, kicking, PCR 63,1 % CGA_PCR 88,9% walk), hành động có nhiều PCA_RNN 90,5% khung hình khung hình CGA_RNN 92,52% placingTee, putt, run, swing, có 41 khớp tọa độ 3D Luận án đề xuất phương pháp phân cụm liệu trích chọn đặc trưng đối tượng chuyển động mở hướng nghiên cứu thay cho lý thuyết trước k-means, hàm mật độ xác suất Gauss PCA So với mục tiêu đặt ban đầu, đánh giá kết đạt luận án sau: - Nghiên cứu tổng quan trình bày đầy đủ vấn đề liên quan đến đại số hình học, đại số hình học bảo giác số mơ hình học máy khả ứng dụng chúng Từ thấy lý ưu điểm việc ứng dụng đại số hình học bảo giác để biểu diễn đối tượng chuyển động không gian - Đối với hàm mật độ xác suất Gauss tối ưu hàm khoảng cách từ điểm đến điểm phân phối biểu diễn có dạng hình “chng” nên xấp xỉ liệu gom cụm với nhau, với liệu chuyển động quay hay liệu phân bố dạng siêu cầu hàm mật độ Gauss biểu diễn khơng xác Nên luận án kết hợp hàm mật độ Gauss với CGA để phân cụm 85 liệu đối tượng chuyển động cách sử dụng phương pháp xấp xỉ siêu phẳng hay siêu cầu để xác định phân cụm - Đối với phương pháp lượng tử hóa vectơ số nghiên cứu trước sử dụng thuật toán k-means để tối ưu khoảng cách sử dụng trọng tâm làm đại diện cho cụm, nên biểu diễn đối tượng chuyển động hay quay cho kết nhận dạng khơng cao (chỉ đạt 72,57%) Trong đó, phương pháp đề xuất phân cụm CGA_Clustering trọng tâm cụm vectơ điểm, mặt phẳng hay siêu cầu, nên biểu diễn đối tượng chuyển chuyển động khơng gian xác kết nhận dạng đạt 86,95% - Phương pháp phân lớp PCR sử dụng thuật toán PCA để giảm số chiều lớp nên gặp hạn chế biểu diễn đối tượng chuyển động quay, nên kết nhận dạng hành động đạt 63,1% Mơ hình đề xuất kết hợp PCR với CGA để phân lớp kết nhận dạng tốt 88,9% - Việc nhận dạng hành động người tiến hành hành động, luận án đề xuất sử dụng CGA để biểu diễn chuyển động đối tượng sử dụng PCR để làm giảm số chiều liệu Kết thực nghiệm tiến hành 41 khớp xương 123 chiều nhận thấy với số khớp 34 kết nhận dạng tốt 88,9% - Đối với liệu phân phối phức tạp số chiều lớn nghiên cứu trước thường sử dụng phương pháp trích chọn đặc trưng sử dụng PCA multi-class LDA để giảm số chiều liệu, giảm thời gian tính tốn dung lượng lưu trữ Luận án đề xuất sử dụng CGA để trích chọn đặc trưng đối tượng sau kết hợp với RNN để huấn luyện nhận dạng Kết nhận dạng cao phương pháp đề xuất đạt 92,52%, sử dụng phương pháp trích chọn đặc trưng sử dụng PCA kết hợp với RNN kết cao 90,5% Trong nghiên cứu kết cơng bố có so sánh đánh 86 giá kết quả, ưu điểm chọn phương pháp nghiên cứu Nên công trình nghiên cứu có tính khả thi cao kết tốt, nghiên cứu mở hướng xử lý ảnh nhận dạng hành động người Hướng nghiên cứu Ngoài kết đạt luận án, số vấn đề đặt để tiếp tục nghiên cứu: - Luận án nghiên cứu số mô hình học máy để kết hợp với CGA Nên cần phải tiếp tục nghiên cứu thêm số mơ hình học máy khác tương lai để kết hợp với CGA để có đánh giá kết cụ thể - Luận án tiến hành kiểm chứng thực nghiệm liệu mẫu CMU, nên cần thực nghiệm liệu khác tiếp tục nghiên cứu để triển khai hệ thống thực tế để đánh giá mơ hình tương lai - Nghiên cứu áp dụng hành động mức thấp dance, jump, kicking, placingTee, putt, run, swing walk mà chưa áp dụng hành động mức cao với thời gian tồn lớn lau nhà, ngắm cảnh Tóm lại, luận án “Nghiên cứu biểu diễn nhận dạng đối tượng chuyển động dựa đại số hình học bảo giác học máy” đạt mục tiêu đặt ra, mơ hình đề xuất thực nghiệm liệu CMU cho kết cao Vì vậy, tương lai cần phát triển thêm để ứng dụng vào liệu thực có thêm nhận dạng hành vi cử người buồn ngủ, trạng thái vui, buồn hay hành động trộm cắp, đánh người… 87 DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ [1] Nguyễn Năng Hùng Vân, Phạm Minh Tuấn, Tachibana Kanta “Nhận dạng chuyển động quay dựa mơ hình Markov ẩn Conformal Geometric Algebra”, Tạp chí Khoa học Cơng nghệ Đại học Đà Nẵng, số 1(72), 2, năm 2014 [2] Nguyễn Năng Hùng Vân, Phạm Minh Tuấn, Tachibana Kanta, “CGA clustering based vector quantization approach for Human activity recognition using discrete Hidden Markov Model”, Tạp chí Khoa học Cơng nghệ Đại học Đà Nẵng, số: 12(85), 1, năm 2014 [3] Nguyễn Năng Hùng Vân, Phạm Minh Tuấn, Ung Nho Dãi, “Mơ hình trọng số kết hợp phương pháp trích chọn đặc tính nhận dạng hành động người”, Kỷ yếu Hội thảo quốc gia Điện tử, Viễn thông Công nghệ Thông tin (REV2015), năm 2015 [4] Nang Hung Van NGUYEN, Minh Tuan PHAM, Phuc Hao DO “Marker Selection for Human Activity Recognition Using Combination of Conformal Geometric Algebra and Principal Component Regression”, In Proceedings of the Seventh International Symposium on Information and Communication Technology (SoICT 2016), papers 274-379, December 08-09, ISBN 978-1-45034815-7, DOI: 10.1145/3011077.3011133 (ACM ICPS, ACM Digital Library and DBLP) [5] Nguyen Nang Hung Van, Pham Minh Tuan, Do Phuc Hao, Pham Cong Thang, and Kanta Tachibana, “Human action recognition method based on Conformal Geometric Algebra and Recurrent Neural Network”, Journal of Information and Control Systems, ISSN 1684-8853 (print); ISSN 2541-8610 (online), no (108)/2020, DOI: 10.31799/1684-8853-2020-5-2-11 (Scopus) 88 TÀI LIỆU THAM KHẢO [1] A Anandkumar, R Ge, D Hsu, S M Kakade, M Telgarsky, "Tensor Decompositions for Learning Latent Variable Models," Journal of Machine Learning Research, vol 15, no 80, pp 2773-2832, 2014 [2] A Hirose, "Complex Valued Neural Network: Theories and Applications, Series on Innovative Intelligence," Theories and Applications, vol 5, 2006 [3] A Rosebrock, "Deep Learning for Computer Vision," in PyimageSearch, Practitioner Bundle, September 2017, p 330 [4] A Rosebrock, Deep Learning for Computer Vision, PyimageSearch, September 2017 [5] A Shahroudy, J Liu, T.-T Ng, and G Wang, "NTU RGB+D: A Large Scale Dataset for 3D Human Activity Analysis," in CVPR, 2016 [6] Alan J.I, Linear Discriminant Analysis, Springer, 2012 [7] Alan Macdonald, A Survey of Geometric Algebra and Geometric Calculus, USA: Luther College, February 13, 2014 [8] Anil K.Jain, "Artifical Neural network: A tutorial," in IEEE Compute, vol 29, no 3, pp 31-44., March, 1996 [9] B Scholkopf and A.J Smola, "Kernel Methods and Support Vector Machines," The MIT Press, December 18, 1998 [10] Baldi, P and S Brunak, Bioinformatics: The Machine Learning Approach, (Second ed.) MIT Press, 2001 [11] Ben-Hur, Asa, Horn, David, Siegelmann, Hava, and Vapnik, Vladimir, "Support vector clustering," in Journal of Machine Learning Research, vol 2, p 125–137, 2001 89 [12] Bouzalmat, A., Jamal Kharroubi & Arsalane Zarghili, "Face Recognition Using SVM Based on LDA," in International Journal of Computer Science Issues (IJCSI), vol 10, no 4, 2013 [13] C Doran and A Lasenby, "Geometric Algebra for Physicists," Cambridge University Press, 2003 [14] Christopher M Bishop, Pattern recognition and Machine Learning, New York, USA: Springer, 2006 [15] D Gehrig, Schultz T, "Selecting Relevant Features for Human Motion Recognition," in International Conference on Pattern Recognition (ICPR 2008), 2008 [16] D H Parks, "Analyzing the Structure of a Motion Capture Database under a Similarity Metric," Electrical and Computer Engineering, UBC, Vancouver, Canada, 2019 [17] D Hestenes and G Sobczyk, Clifford Algebra to Geometric Calculus: A unified language for mathematics and physics, Reidel, 1984 [18] D Hildenbrand and E Hitzer, "Analysis of point clouds using Conformal Geometric Algebra," in 3rd International Conference on Computer Graphics theory and Applications, Funchal, Madeira, Portugal, 2008 [19] Daniel Jurafsky, James H Martin, An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Speech and Language Processing, September 23, 2018 [20] De-hua LIU, and Jing-jing WANG, "A PCA-LSTM Model for Stock Index Prediction," in 2018 International Conference on Electrical, Control, Automation and Robotics (ECAR 2018), 2018 [21] Dempster, A P., N M Laird, and D B Rubin, "Maximum likelihood from incomplete data via the EM algorithm," in Wiley for the Royal Statistical Society, vol 39, no 1, pp 1-38, 1997 90 [22] Durbin, R., S Eddy, A Krogh, and G Mitchison, Biological Sequence Analysis, Cambridge University Press, 1998 [23] Eckhard Hitzer, Tohru Nitta and Yasuaki Kuroe, "Applications of Clifford’s Geometric Algebra," Advances in Applied Clifford Algebras, vol 23, p 377– 404, 24 May 2013 [24] F Lefevre, "Non parametric probability estimation for HMM-based automatic speech recognition," in Computer Speech and Language, vol 17, p 113–136, 2003 [25] Fei Wang, Changshui Zhang, Naijiang Lu, "Boosting GMM and Its Two Applications," in International Workshop on Multiple Classifier Systems, Berlin, Heidelberg, 2005 [26] Fengjun Lv, Ramakant Nevatia, "Recongnition and Segmentation of 3D Human Action Using HMM and Multi-class AdaBoost," 9th European Conference on Computer Vision (ECCV 2006), vol 3954, pp 359-372, 7-13 May , 2006 [27] Frederick Jelinek, Statistical Methods for Speech Recognition, USA: MIT Press Ltd, 1997, p 305 [28] Fukumizu, K., G.R Lanckriet, and B.K Sriperumbudur, "Learning in Hilbert vs Banach spaces: A measure embedding viewpoint," in Advances in Neural Information Processing Systems, 2011 [29] G Hamerly, C Elkan, "Alternatives to the k-means algorithm that find better clusterings," in The Eleventh International Conference on Information and Knowledge Management, McLean, Virginia, USA, 2002 [30] G Sommer, "Geometric Computing with Clifford Algebras," Springer, 2001 [31] H Liu and T Taniguchi, "Feature extraction and pattern recognition for human motion by a deep sparse autoencoder," in IEEE International Conference on Computer and Information Technology, 2014 91 [32] Hoang Le Uyen Thuc, Pham Van Tuan, and Shian-Ru Ke, "Comparison of human action recognitions in monocular videos using DTW and HMM" journals, UD, 2014 [33] Hodgson, M E., "Reducing computational requirements of the minimumdistance classifier," in Remote Sensing of Environments, 1988 [34] I Sekita, T Kurita, and N Otsu, "Complex Autoregressive Model for Shape Recognition," IEEE Trans On Pattern Analysis and Machine Intelligence, vol 14, no 4, 1992 [35] I.T Joliffe, "A note on the use of principal components in regression, Applied Statistics," 1982 [36] I.T Jolliffe, Principal Component Analysis, New York: 2nd Edn SpringerVerlag, 2002 [37] J B MacQueen, "Some Methods for classification and Analysis of Multivariate Observations," vol 1, Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, 1967, p 281–297 [38] J C Bezdek, C Coray, R Gunderson and J Watson, "Detection and characterization of cluster substructure I Linear structure fuzzy clines," SIAM Jour of Appl Math, vol 40, no 2, pp 339-357, 1981 [39] J Schmidhube, "Deep learning in neural networks: An overview," Neural Networks, vol 61, pp 85-117, January 2015 [40] J.A.Bilmes, "A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models," in ISCI, April 1998 [41] J.-F Hu, W.-S Zheng, J Lai, and J Zhang, "Jointly learning heteroge neous features for rgb-d activity recognition," in CVPR, 2015 [42] J.I, Alan, Linear Discriminant Analysis, Springer, 2012, pp 1525.1548 92 [43] J.-L.Gauvain and C.-H.Lee, "Maximum a Posteriori Estimation for Multivariate Guassian Mixture Observation of Markov Chains," in IEEE Transactions on Speech and Audio Processing, vol 2, no 2, pp 291- 298, Apr 1994 [44] JeffA.Bilmes, "A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixtureand Hidden Markov Models," in ISCI, April, 1998 [45] K Arthishwari, M Anand, "Design of LSTM-RNN on a Sensor Based HAR using Android Phones," in International Journal of Recent Technology and Engineering (IJRTE), vol 8, no 5, pp 2277-3878, 2020 [46] K G Manosha Chathuramali Ranga Rodrigo, "Faster Human Activity Recognition with SVM," in The International Conference on Advances in ICT for Emerging Regions, 2012 [47] K.Vinothkumar, M.P.Selvan, "Hierarchical Agglomerative Clustering Algorithm method for distributed generation planning," in International Journal of Electrical Power & Energy Systems, vol 56, pp 259-269, 2014 [48] Kapadia, M., Chiang, I., Thomas, T., Badler, N I., & Kider, J T., "Efficient Motion Retrieval in Large Motion Databases," in the ACM SIGGRAPH Symposium on Interactive 3D Graphics and Games (I3D '13), 2013 [49] L Dorst, D Fontijne, and S Mann, "An Object-oriented Approach to Geometry Morgan Kaufmann Series in Computer Graphics," in Geometric Algebra for Computer Science, 2007 [50] L Jun, G Wang, Li Y Duan, "Skeleton-based human action recognition with global context-aware attention LSTM networks," in IEEE Transactions on Image Processing, vol 27, no 4, pp 1586-1599, 2017 [51] Lasitha Piyathilaka and Sarath Kodagoda, "Gaussian Mixture Based HMM for Human Daily Activity Recognition Using 3D Skeleton Features," in Centre for Autonomous Systems (CAS), University of Technology, Sydney, Australia 93 [52] Laurent Fuchs, Eckhard Hitzer, Vincent Nozick and Akihiro Sugimoto, "Three-dimensional quadrics in extended Conformal Geometric Algebras of higher dimensions from control points, implicit equations and axis alignment," Advances in Applied Clifford Algebras, vol 57, no 29, pp 1-22, 2019 [53] Lawrence R.Rabiner, "A Tatorial on Hidden Markov Models and Selected Applications in Speech Recognition," in Fellow, IEEE, 1989 [54] Li Wei and Shishir K Shah , "Human Activity Recognition using Deep Neural Network with Contextual Information," in Proceedings of the 12th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISIGRAPP 2017), U.S.A, 2017 [55] Lindsay I Smith, A tutorial on Principal Components Analysis, February 26, 2002 [56] M Debyeche, J.P Haton, and A Houacine, "A New Vector Quantization frontend Process for Discrete HMM Speech Recognition System," in International Science Index, vol 1, no 6, 2007 [57] M T Pham, K Tachibana, E M S Hitzer, T Yoshikawa, and T Furuhashi, "Classification and Clustering of Spatial Patterns with Geometric Algebra," in AGACSE 2008 Leipzig, 2008 [58] M T Pham, K Tachibana, T Yoshikawa and T Furuhashi, "A clustering method for geometric data based on approximation using conformal geometric algebra," in 2011 IEEE International Conference on Fuzzy Systems, 2011 [59] M.D Zaharia, L Dorst, "Modeling and visualization of 3D polygonal mesh surfaces using geometric algebra," in ELSEVIER (Computers & Graphics), vol 28, p 519–526, 2004 [60] M.T Pham and K Tachibana, "A Conformal Geometric Algebra Based Clustering Method and Its Applications, Advances in Applied Clifford Algebras," Springer Basel, 2008 94 [61] M.T Pham, K Tachibana, E.M.S Hitzer, S Buchholz, T Yoshikawa and T Furuhashi, "Feature Extractions with Geometric Algebra for Classication of Objects," in IEEE World Congress on Computational Intelligence , Hongkong, 2008 [62] Mannila, Heikki, "Data mining: machine learning, statistics, and databases Int'l Conf Scientific and Statistical Database Management.," in IEEE Computer Society, 1996 [63] Manning, C D and H Schutze, Foundations of Statistical Natural Language Processing, MIT Press, 1999 [64] Mark Richardson, Principal Component Analysis, May 2009 [65] McLachlan G J and T Krishnan, The EM Algorithm and its Extensions, 2nd Edition ed., Wiley series in probability and statistics, March 2008, p 400 [66] Md Al Mehedi Hasan, Omar Faruqe, "Face recognition using PCA and SVM," in Anti-counterfeiting, Security, and Identification in Communication, 2009 ASID 2009, September 2009 [67] Md Zia Uddin, Weria Khaksar and; Jim Torresen, "Activity Recognition Using Deep Recurrent Neural Network on Translation and Scale-Invariant Features," in Activity Recognition Using Deep Recurrent Neural Network on Translation and Scale-Invariant Features, 2018 [68] Michael E Tipping Christopher M Bishop, "Probabilistic Principal Component Analysis," in Journal of the Royal Statistical Society Series B, vol 61, no 3, pp 611-622, 1999 [69] N Matsui, T Isokawa, H Kusamichi, F Peper, and H Nishimura, "Quaternion Neural Network wwith geometric operators," in Journal on Intelligent and Fuzzy Systems, vol 15, no Numbers 3-4, pp 149-164, 2004 95 [70] Nag, R., K Wong, and F Fallside, "Script recognition using Hidden Markov Models," in IEEE International Conference on Acoustics, Speech, and Signal Processing, Tokyo, Japan, 1986 [71] Oyelade O J, Oladipupo O O, Obagbuwa I C, "Application of k-Means Clustering algorithm for prediction of Students," in International Journal of Computer Science and Information Security (IJCSIS), Vols Vol 7,No 1, 2010 [72] P Viola, M Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features," in International Journal of Computer Vision, vol 57, no 2, p 137–154, 2004 [73] P Viola, M Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features," in International Journal of Computer Vision, vol 57, p 137– 154, 2004 [74] Palwasha Afsar, Paulo Cortez and Henrique Santos, "Automatic Human Action Recognition from Video using Hidden Markov Model," in IEEE 18th International Conference on Computational Science and Engineering, 2015 [75] Q Huo and C Chan, "Contextual vector quantization for speech recognition with discrete hidden Markov model," in Pattern recognition, vol 28, no 4, p 513–517, 1995 [76] Qin Jin, Alex Waibel, "Application of LDA to Speaker Recognition," in Sixth International Conference on Spoken Language Processing, Beijing, China, 2000 [77] R Krishnapuram, O Nasraoui and H Frigui, "The fuzzy c spherical hells algorithms: a new approach," in IEEE Trans on Neural Networks, vol 3, no 5, p 663–671, 1992 [78] R.M Gray, "Vector Quantization," in IEEE ASSP Magazine, vol 1, no 2, pp 4-29, 1984 [79] Rabiner, L and B H Juang, “Fundamentals of Speech Recognition,” Prentice Hall, 1993 96 [80] Rogerio E da Silva, Jan Ondˇrej and Aljosa Smolic, "Using LSTM for Automatic Classification of Human Motion Capture Data," in 14th International Conference on Computer Graphics Theory and Applications, VISIGRAPP 2019, 2019 [81] Roweis, S., EM algorithms for PCA and SPCA In M I Jordan, M J Kearns, and S A Solla (Eds.), vol 10, Advances in Neural Information Processing Systems, MIT Press, 1998, p 626–632 [82] S Buchholz and N LeBihan, "Optimal separation of polarized signals by quaternionic Neural Network," in 14th European Signal Processing Conference, OUSIPCO 2006, Florence Italya, Stember 4-8, 2006 [83] S Hochreiter and J Schmidhuber, "Long short-term memory," in Neural Computation, vol 9, no 8, p 1735–1780, 1997 [84] S J Sangwine, E Hitzer, "Polar Decomposition of Complexified Quaternions and Octonions," Advances in Applied Clifford Algebras volume, vol 23, no 30, p 12, 2020 [85] S Ji, W Xu, M Yang, and K Yu, "3D Convolutional Neural Networks for human action recognition," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol 35, no 1, p 221–231, 2013 [86] Saman Cooray and Noel O’Connor, "Facial Feature Extraction and Principal Component Analysis for Face Detection in Color Image," in ICIAR 2004 Springer-Verlag Berlin Heidelberg, vol 3212, pp 741-749, 2004 [87] Satonkar Suhas S., Kurhe Ajay B., Dr.Prakash Khanale B., "Face Recognition Using Principal Component Analysis and Linear Discriminant Analysis on Holistic Approach in Facial Images Database," in IOSR Journal of Engineering, vol 2, no 12, pp 15-23, Dec 2012 [88] Shizhen Zhao, Wenfeng Li and Jingjing Cao, "A User-Adaptive Algorithm for Activity Recognition Based on K-Means Clustering, Local Outlier Factor, and Multivariate Gaussian Distribution," in Sensors 2018 97 [89] Shizhen Zhao, Wenfeng Li, Jingjing Cao, "A User-Adaptive Algorithm for Activity Recognition Based on K-Means Clustering, Local Outlier Factor, and Multivariate Gaussian Distribution," in Sensors, vol 18, no 1850, 2018 [90] Steinwart, Ingo, Christmann, Andreas, Support Vector Machines, Springer, 2008 [91] Swarndeep Saket J, Dr Sharnil Pandya, "An Overview of Partitioning Algorithms in Clustering Techniques," in International Journal of Advanced Research in Computer Engineering & Technology, vol 5, no 6, pp 1943 1946, June 2016 [92] T M a Y B R Pascanu, "On the difficulty of training Recurrent Neural Networks," in International Conference on Machine Learning, 2013, 2013 [93] T Nitta, "An Extension of the Back – Propagation Algorithm to Complex Numbers, Neural Network," ELSEVIER (Neural Networks), vol 10, no 25, p 1391 – 1415, November 1997 [94] Tong, L., Song, Q., Ge, Y., Liu, M, "HMM based Human fall detection and prediction method using tri-axial accelerometer," in IEEE Sens, vol 13, p 1849–1856, 2013 [95] The Carnegie Mellon University, "The Carnegie Mellon University Motion Capture Database," http://mocap.cs.cmu.edu [96] Wee-Hong Ong, Takafumi Koseki, Leon Palafox, "An Unsupervised Approach for Human Activity Detection and Recognition," International Journal of Simulation Systems, Science & Technology, vol 14, no 5, pp 42-49, 2013 [97] Y Du, W Wang, and L Wang, "Hierarchical Recurrent Neural Network for Skeleton based Action Recognition," in IEEE Conference on Computer Vision and Pattern Recognition, 2015 [98] Ye, J., H Yao, and F Jiang, "Based on HMM and SVM multilayer architecture classifier for Chinese sign language recognition with large vocabulary," in Multi-Agent Security and Survivability, 2004 IEEE First Symposium, 2004 98

Ngày đăng: 27/04/2023, 09:15

Tài liệu cùng người dùng

Tài liệu liên quan