Bài viết Nhận dạng chuyển động quay dựa trên mô hình markov ẩn và đại số hình học bảo giác đề xuất mô hình Markov ẩn kết hợp với mật độ xác suất trên không gian đại số hình học bảo giác (Conformal Geometric Algebra - CGA) nhằm tính toán xác suất của trạng thái ẩn đối với quá trình chuyển đổi trạng thái của cổ tay.
TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(74).2014.QUYỂN II NHẬN DẠNG CHUYỂN ĐỘNG QUAY DỰA TRÊN MƠ HÌNH MARKOV ẨN VÀ ĐẠI SỐ HÌNH HỌC BẢO GIÁC ROTATION RECOGNITION BASED ON HIDDEN MARKOV MODEL AND CONFORMAL GEOMETRIC ALGEBRA Nguyễn Năng Hùng Vân1 , Phạm Minh Tuấn1 , Tachibana Kanta2 Trường Đại học Bách khoa, Đại học Đà Nẵng; Email: nguyenvan@dut.udn.vn, pmtuan@dut.udn.vn Trường Đại học Kogakuin; Email: kanta@cc.kogakuin.ac.jp Tóm tắt – Ngày nay, nhà nghiên cứu phát triển đại số hình học (Geometric Algebra - GA) để biểu diễn đối tượng khơng gian chiều (3D) cách xác hiệu Vì vậy, GA ứng dụng vào lĩnh vực nhận dạng vật thể hay nhận dạng hành vi đối tượng chiều Trong báo này, tác giả đề xuất mô hình Markov ẩn kết hợp với mật độ xác suất khơng gian đại số hình học bảo giác (Conformal Geometric Algebra - CGA) nhằm tính tốn xác suất trạng thái ẩn trình chuyển đổi trạng thái cổ tay Từ kết thực nghiệm, phương pháp đề xuất sử dụng CGA Gauss việc tính toán mật độ xác suất trạng thái ẩn cho kết tốt nhiều so với sử dụng hàm mật độ Gauss thông thường Abstract – Nowadays, many researchers have developed mathematical tools of Geometric Algebrato representing objects in the 3D space accurately and effectively So GA can be applied to the field of object recognition or identification of the behavior of 3D objects In this paper, the authors propose a Hidden Markov Model combined with the probability density on the Conformal Geometric Algebra space to calculate the probability of hidden states for the transition state of the wrist From the experimental results, the proposed method using the CGA Gaussian distribution to calculate the probability density of the hidden state is better than using the conventional Gaussian distribution Từ khóa – đại số hình học; học máy; mơ hình xác suất; mơ hình Markov ẩn; mật độ Gauss Key words – geometric algebra, machine learning, probabilistic model, hidden Markov model, Gaussian distribution Giới thiệu đổi cấu trúc dễ dàng nên mơ hình ngày sử dụng rộng rãi nhiều lĩnh vực, đặc biệt lĩnh vực nhận dạng mẫu tiếng nói, hình ảnh đối tượng vật thể Hình ví dụ cho mơ hình HMM Ngày nay, có nhiều nghiên cứu liên quan đến nhận dạng vật thể hay nhận dạng hành vi không gian 3D [1] Những nghiên cứu này, thường sử dụng mơ hình vectơ không gian 3D [2], vectơ thường độc lập với nên mối liên kết hình học khơng gian Một số nghiên cứu khác xây dựng mơ hình liên kết vectơ lý thuyết xác suất Thông thường hàm Gauss sử dụng rộng rãi tất loại mơ hình Tuy nhiên, hàm Gauss hết tất liên kết hình học khơng gian 3D phân bố cong Hiện nay, nhà nghiên cứu phát triển công cụ đại số hình học có khả biểu diễn đối tượng khơng gian cách xác dễ dàng GA hay gọi đại số Cliford, mơ hình tốn học phát triển từ kết hợp đại số hình học [3][4][5] GA biểu diễn vectơ hay mối liên kết chúng 3D cách đơn giản xác Vì vậy, GA bắt đầu nhà nghiên cứu lĩnh vực công nghệ thông tin quan tâm tới Có nhiều ứng dụng GA mơ hình xử lý tính hiệu, xử lý ảnh sử dụng không gian GA số phức [6][7][8] hay quaternions [9][10][11] Hơn nữa, mơ hình xác suất sử dụng GA lĩnh vực học máy (Machine Learning - ML) lĩnh vực hoàn toàn hiệu mang lại cao để ứng dụng vào lĩnh vực nhận dạng 3D nhận dạng hành vi đối tượng [12][13][14][15] Phương pháp đề xuất 2.1 Mơ hình Markov ẩn Mơ hình Markov [16] ẩn phương pháp sử dụng xác suất để mơ hình hóa liệu theo thời gian cách có trình tự Do đạt độ xác cao có khả thay 84 Hình 1: Mơ hình HMM HMM xác định mơ hình xác suất: λ = (N, M, A, B, Π) Trong đó: - N số lượng trạng thái ẩn mơ hình, ký hiệu trạng thái S = {S1 , S2 , SN } trạng thái thời điểm t qt - M số lượng tín hiệu quan sát được, ký hiệu tín hiệu quan sát V = {v1 , v2 , vM } tín hiệu quan sát thời điểm t Ot - A ma trận xác suất chuyển đổi trạng thái ẩn mơ hình, A = {ai,j } với: ai,j = p(qt+1 = Sj |qt = N Si ), ≤ i, j ≤ N thỏa mãn điều kiện j=1 ai,j = - B ma trận xác suất đầu trạng thái ẩn tín hiệu quan sát B = {bj (k)} với bj (k) = p(vt at t|qt = Sj ), ≤ j ≤ N, ≤ k ≤ M thõa mãn Nguyễn Năng Hùng Vân, Phạm Minh Tuấn, Tachibana Kanta M điều kiện k=1 bj (k) = Với bj (k) xác suất đầu Theo đề xuất Hestenes [4], vectơ thực x = m m trạng thái ẩn j tín hiệu quan sát k Trong biểu diễn điểm P ∈ Gm+1,1 i xi ei ∈ mơ hình xác suất liên tục B hàm mật độ không gian CGA sau: xác suất trạng thái - π xác suất khởi đầu trạng thái π = {πi } (4) P = x + ||x||2 e∞ + e0 với πi = p(q1 , = Si ), ≤ i ≤ N thỏa mãn điều kiện M i=1 πj = Một hình cầu biểu diễn vectơ bảo giác Có tốn kinh điển áp dụng HMM vào ứng dụng (conformal vector) không gian CGA: phức tạp thực tế sau: S = P − 1/2r2 e∞ = x + 1/2{||x||2 − r2 }e∞ + e0 , (5) Bài toán Cho trước chuỗi tín hiệu quan sát thời điểm t O = O1 , O2 , , Ot mơ hình HMM đại diện tham số λ = (A, B, π) Làm để tính tốn Ở S biểu diễn mặt cầu có tâm cách hiệu p(O|λ) xác suất phát sinh O từ mô hình λ x, bán kính r khơng gian thực m Khi nội tích (inner Bài tốn Cho trước chuỗi tín hiệu quan sát thời product) S.Q = 0, Q điểm nằm mặt cầu S Từ (4) điểm t O = O1 , O2 , , Ot mô hình HMM đại diện (5), nhận thấy điểm hình tham số λ = (A, B, π) Cần tìm chuỗi trạng thái cầu với bán kính r = không gian CGA Gm+1,1 Không gian CGA biểu diễn mặt phẳng tối ưu Q = q1 , q2 , , qt phát sinh O? Trong vectơ bảo giác sau: qt số thứ tự trạng thái ẩn Bài tốn Cho trước chuỗi tín hiệu quan sát thời điểm t O = O1 , O2 , , Ot Làm để xác định tham số mô hình λ = (A, B, π) cho cực đại hóa xác suất p(O|λ) Đây tốn huấn luyện mơ hình Bài báo này, tập trung nghiên cứu tốn mơ hình HMM với xác suất đầu trạng thái ẩn tín hiệu quan sát liên tục [17] Nội dung báo đề xuất mật độ xác suất không gian CGA thay cho hàm Gauss không gian thực nhằm tăng độ xác xác suất đầu trạng thái ẩn tín hiệu quan sát 2.2 Đại số hình học bảo giác L = n + de∞ (6) Trong n vectơ, d hệ số vô hướng mặt phẳng n.x + d = không gian thực m Nếu nội tích L.Q = Q điểm nằm mặt phẳng L Một vectơ bảo giác S Gn+1,1 viết dạng tổng quát: S = s + s∞ e∞ + s0 e0 (7) m s = i si ei vectơ không gian thực m s∞ s0 tham số vectơ sở e∞ e0 Trong báo này, chúng tơi sử dụng nội tích điểm P vectơ bảo giác S khoảng cách chúng không gian CGA Từ (3), (4) (7), nội tích P Q là: Đại số hình học bảo giác (CGA) [3] phần GA GA định nghĩa không gian cách định nghĩa p+q vectơ sở vng góc O = {e1 , , ep , ep+1 , , ep+q }, ei = +1, ∀i ∈ {1, , p} ei = −1, ∀i ∈ {p + 1, , q} Ở đây, ta ký hiệu không gian d(P, S) ∝ P.Q = (x + 1/2||x||2 e∞ + e0 ) · (s + s∞ e∞ + s0 e0 ) định nghĩa O Gp,q Như không gian thực m chiều = x.s − s∞ − 1/2||x||2 s0 m biểu diễn Gm,0 GA (8) Không gian CGA mở rộng từ không gian thực m với việc thêm vectơ sở Do đó, khơng gian CGA 2.3 Hàm mật độ xác suất trạng thái mơ hình HMM xác định m + vectơ sở {e1 , , em , e+ , e− }, e+ e− định nghĩa sau: 2.3.1 Mật độ Gauss e+ = e+ e+ = 1, e− = e− e− = −1, (1) e+ e− = e+ ei = e− ei = 0, ∀i{1, , m} Do đó, khơng gian CGA ký hiệu Gm+1,1 Ta định nghĩa thêm vectơ sở sau: e0 = 1/2(e− − e+ ), e∞ = (e− + e+ ) (2) Từ (1) (2) có e0 e0 = e∞ e∞ = 0, e0 e∞ = e∞ e0 = 0, e0 ei = e∞ ei = 0, ∀i ∈ {1, , m} (3) Mật độ Gauss phân bố xác suất quan trọng nhiều lĩnh vực Đối với mơ hình HMM mật độ xác suất trạng thái i xác định bởi: bi (x) = N x; µ; = d (2π) || i || exp − (x − µi )T (x − µi ) i (9) Trong đó: - x vector quan sát - µi kỳ vọng tốn học x i ma trận hiệp phương sai - d số chiều khơng gian 85 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 1(74).2014.QUYỂN II 2.3.2 Mật độ CGA Gauss: Mật độ CGA Gauss xây dựng cự ly điểm P vectơ bảo giác Sl không gian CGA kết hợp với mật độ Gauss Hàm mật độ CGA Gauss [13] là: m bi (x) = bi (x|λl ) (10) l bi (x|λl ) = √ d2 (P, Sl ) exp − 2λl 2πλl (11) - x là vectơ quan sát - Sl vectơ bảo giác riêng (eigen conformal vector) thứ l không gian CGA - P điểm xác định bởi: Hình 3: Phân bố liệu hình cung P = x + 1/2||x||2 e∞ + e0 - Λl phương sai hay giá trị riêng (eigen value) thứ l quan sát x không gian CGA Kết nghiên cứu 3.1 So sánh hàm mật độ Gauss CGA Gauss với liệu phân bố đường cong - Hàm mật độ Gauss khơng gian chiều: f (x; µ; σ) = (x − µ) √ exp − 2σ σ 2π (12) Hình 4: Mật độ xác suất hình cung Từ kết trên, ta nhận thấy việc sử dụng hàm mật độ CGA Gauss tốt với mật độ Gauss Nếu biến ngẫy nhiên x có phân phối này, µ = trường hợp liệu có phân bố mặt cong σ = 1, phân phối gọi chuẩn hàm mật độ rút Ví dụ phận thể người quay quanh khớp phân bố mặt cầu không gian gọn thành: 3D nên sử dụng hàm mật độ CGA Gauss thích hợp x f (x) = √ exp − (13) 2π 3.2 So sánh hàm mật độ Gauss CGA Gauss mơ hình Markov ẩn Hình biễu diễn hàm mật độ xác suất Gauss với Giả sử có cánh tay quay không gian tham số khác Dễ dàng nhận thấy mật độ Gauss chiều với góc quay tự Thời gian quay chiều có hình dạng "núi" nên xấp xỉ liệu gom quay T = 50 đơn vị thời gian Số lần thay đổi chiều quay cụm với Tức gần tâm liệu có phân bố N = loại góc quay ứng với đơn vị thời gian dày xa tâm có phân bố thưa Đối với α = {0.05, 0.1, 0.2} (rad) Báo cáo tiến trình thực nghiệm phân bố phức tạp hình cung Hình khó sử dụng mơ hình HMM với xác suất quan sát dựa theo mật độ Gauss để xấp xỉ hàm Gauss hàm CGA Gauss cách huấn luyện cho mơ hình HMM dựa quan sát cổ tay Ở cho trạng thái ẩn số lần thay đổi chiều quay Hình 2: Hàm mật độ Gauss Sử dụng công thức (10), ta tính mật độ xác suất liệu khơng gian CGA Hình kết việc tìm mật độ xác suất CGA Gauss cho liệu phân bố Hình 86 Hình 5: Mô chuyển động cánh tay Nguyễn Năng Hùng Vân, Phạm Minh Tuấn, Tachibana Kanta Tiếp theo, báo cáo quan sát trình chuyển đổi trạng thái ẩn mơ hình HMM huấn luyện thực việc quay cánh tay Quá trình thực 100 lần lần chiều quay thay đổi cách ngẫu nhiên Hàm liên kết (alignment fuction) sử dụng để đánh giá mức độ giống trạng thái quay thực tế cổ tay trạng thái ẩn mơ hình HMM: Tài liệu tham khảo ykl;t ykl;e A (Yt , Ye ) = kl ∈ [0, 1] kl ykl;t kl ykl;e Trong đó, Yt = [ykl;t ] Ye = [ykl;e ] ma trận trạng thái thực trạng thái ẩn mơ hình HMM Với ykl định nghĩa sau: ykl = phương pháp biểu diễn đối tượng khơng gian xác, đặc biệt việc nhận biết hành vi Kết nghiên cứu có ý nghĩa khoa học xã hội cao, góp phần mở hướng nghiên cứu mới, nhận dạng hành vi đối tượng 3D, hướng đến xây dựng hệ thống nhận dạng hành vi người (yk = yl ) (yk = yl ) Hình 6: Trung bình độ lệch chuẩn liên kết mơ hình HMM Hình kết thực nghiệm quan sát trình chuyển đổi trạng thái cổ tay Từ kết thực nghiệm, dễ dàng nhận thấy sử dụng CGA Gauss để tính tốn mật độ xác suất trạng thái ẩn cho kết tốt nhiều so với sử dụng hàm mật độ Gauss thông dụng Từ kết luận phương pháp đề xuất mơ hình hữu hiệu việc nhận dạng hành vi đối tượng không gian 3D Kết luận Bài báo đề xuất phương pháp nghiên cứu nhận dạng hành vi đối tượng 3D sử dụng mơ hình xác suất GA mơ hình Markov ẩn Ưu điểm [1] James D Foley, Andries van Dam, Steven K Feiner, John F Hughes, Computer graphics: Principles and practice (2nd ed.), Addision – Wesley Longman Plublishing Co., Inc., Boston, MA, 1990 [2] Eberlt, D.H 3D Game Engine Design: A Practical Approach to Real-Time Computer Graphics, Morgan Kaufmann Publishers 2001 [3] C Doran and A Lasenby, Geometric Algebra for Physicists, Camgridge University Press, 2003 [4] D Hestenes, New foundations for classical mechanics, Dordrecht, 1996 [5] L Dorst, D Fontijne, and S Mann, Geometric Algebra for Computer Science: An Object – oriented Approacg to Geometric (Morgan Kaufmann Series in Computer Graphics), 2007 [6] I Sekita, T Kurita, and N Otsu, Complex Autoregressive Model for Shape Recognition, IEEE Trans On Pattern Analysis and Machine Intelligence, Vol 14, No 4, 1992 [7] A Hirose, Complex – Valued Neural Network: Theories and Applications, Series on Innovative Intelligence, Vol 5, 2006 [8] T Nitta, An Extension of the Back – Propagation Algorithm to Complex Numbers, Neural Network , Volume 10, Number 8, pp 1391 – 1415 (25), November 1997 [9] N Matsui, T Isokawa, H Kusamichi, F Peper, and H Nishimura, Quaternion Neural Network wwith geometric operators, Journal on Intelligent and Fuzzy Systems, Volume 15, Numbers 3-4, pp 149-164, 2004 [10] S Buchholz and N LeBihan, Optimal separation of polarized signals by quaternionic Neural Network, 14th European Signal Processing Conference, OUSIPCO 2006, Stember 4-8, Florence Italya, 2006 [11] M.Jordan, J.Kleinberg, B.Scholkopf, InformationScienceandStatistics, 2006 [12] D Hestenesand G Sobczyk Clifford Algebra to Geometric Calculus: Aunified language formathematics and physics, Reidel, 1984 [13] P M Tuấn, A clustering method for geometric data based on approximation using conformal geometric algebra, 2011 IEEE International Conference on Fuzzy Systems, pp 2540 – 2545, 2011 [14] Hildenbrand D., Fontijne D., Perwass Ch., Dorst L., Geometric Algebra an its Application to Computer Graphics, Totorial notes of the EUROGRAPHICS conference, 2004, Grenoble [15] E.M.S Hitzer Ecilidean Geometric Objects in the Cliford Geometric Algebra of Origin, 3-space, Infinity Bulletin of the Belgian Mathematical Society – Simon Stevin, 2004 [16] Kristie Seymore, Andrew McCallum, and Roni Rosenfeld.Learning Hidden Markov Model Structure for Information Extraction, AAAI 99 Workshop on Machine Learning for Information Extraction, 1999 [17] Lawrence R Rabiner, Fellow, IEEE, A Tutorial on Hidden Markov Models and Selected Applicatios a Speech Recognition, 1989 (BBT nhận bài: 22/12/2013, phản biện xong: 29/12/2013) 87 ... hình Markov ẩn Hình biễu diễn hàm mật độ xác suất Gauss với Giả sử có cánh tay quay không gian tham số khác Dễ dàng nhận thấy mật độ Gauss chiều với góc quay tự Thời gian quay chiều có hình dạng. .. xuất mơ hình hữu hiệu việc nhận dạng hành vi đối tượng không gian 3D Kết luận Bài báo đề xuất phương pháp nghiên cứu nhận dạng hành vi đối tượng 3D sử dụng mô hình xác suất GA mơ hình Markov ẩn Ưu... tạp hình cung Hình khó sử dụng mơ hình HMM với xác suất quan sát dựa theo mật độ Gauss để xấp xỉ hàm Gauss hàm CGA Gauss cách huấn luyện cho mô hình HMM dựa quan sát cổ tay Ở cho trạng thái ẩn số