CHƯƠNG 1. TỔNG QUAN VỀ PHÂN TÍCH DÁNG ĐI
1.3.2. Phương pháp dựa vào mô hình
Trong phương pháp này, nhiều nhà nghiên cứu đ sử dụng các mô hình toán học để biểu diễn và phân tích dáng đi như máy véc-tơ hỗ trợ, mô hình Markov ẩn, mạng nơron …
a. Máy véc-tơ hỗ trợ (Support Vector Machine - SVM)
Máy véc-tơ hỗ trợ là một thuật toán học máy nổi tiếng được sử dụng để giải quyết bài toán phân lớp. Thuật toán SVM ban đ u được phát minh bởi Vladimir N.
Vapnik [55], là một bộ phân loại tuyến tính, phương pháp của nó dựa trên lý thuyết học thống kê và hàm hạt nhân với ý tưởng nhận dữ liệu vào và phân loại chúng vào hai lớp khác nhau. Nhiều nhà nghiên cứu đ áp dụng rất thành công SVM trong việc giải quyết các vấn đề của thế giới thực như nhận dạng văn bản, hình ảnh, chữ viết tay…
Trong nghiên cứu [59] các tác giả đ tiến hành thử nghiệm một hệ thống phân loại giới tính tự động bằng cách phân tích dữ liệu từ dáng đi của con người. Hệ thống phân loại giới tính bao gồm ba giai đoạn: (1) phát hiện, khai thác việc di chuyển của cơ thể người và đánh dấu đường viền của nó từ hình ảnh quỹ đạo; (2) xây dựng mô hình dáng đi của con người từ những góc khớp và các điểm nối cơ thể; (3) phân tích chuyển động và trích xuất đặc trưng để phân loại giới tính trong các mẫu dáng đi.
Một tập tu n tự các khung xương 2D được sử dụng để biểu diễn cho mô hình dáng đi, là dữ liệu đặc trưng dáng đi dựa trên thông số chuyển động. Tiếp đó, để phân loại giới tính trong mô hình dáng đi các tác giả đ sử dụng bộ phân lớp SVM, thí nghiệm được thực hiện trên 100 đối tượng khác nhau (84 nam và 16 nữ), mỗi đối tượng xây dựng 7 mô hình dáng đi. Trong 700 mô hình dáng đi (≈19,534 hình ảnh) được trích xuất thành các véc-tơ, các nhà nghiên cứu chọn ra 400 véc-tơ để huấn
Hình 1.12. Mẫu mô hình dáng đi.
luyện, 100 véc-tơ để đánh giá, 200 véc-tơ dùng để kiểm tra và kết quả phân loại giới tính đạt 96%.
Các tác giả ở [10] sử dụng SVM với mục đích nhận dạng tự động dáng đi của hai nhóm người: trẻ tuổi và lớn tuổi từ mô hình dáng đi tương ứng. Nghiên cứu này sử dụng hệ thống phân tích chuyển động PEAK-2D để phân tích dữ liệu về khoảng cách tối thiểu bàn chân. Khi 30 người trẻ tuổi và 28 người lớn tuổi tiến hành thử nghiệm đi bộ liên tục với tốc độ tự chọn trong 20 phút trên máy chạy bộ, các mẫu dáng đi được trích xuất về khoảng cách tối thiểu bàn chân được sử dụng để huấn luyện SVM. Kết quả kiểm tra cho biết hiệu suất tổng quát để nhận dạng dáng đi người trẻ và người già của phương pháp SVM trung bình là 83.3% ( so với kết quả chính xác 75.0%
( khi dùng phương pháp mạng nơron để nhận dạng trên tập dữ liệu này.
b. Mô hình Markov ẩn (Hidden Markov Model - HMM)
Mô hình Markov ẩn (HMM) được bắt đ u xây dựng và công bố từ những năm 1960, đây là mô hình toán học về thống kê. Nhiều năm sau đó (từ 1980), mô hình này được bắt đ u nghiên cứu để ứng dụng trong lĩnh vực nhận dạng. Do đạt được độ chính xác cao và có khả năng thay đổi cấu trúc dễ dàng nên mô hình này ngày càng được sử dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnh vực nhận dạng. HMM là kết quả của mở rộng khái niệm mô hình Markov (mô hình Markov là mô hình mà mỗi trạng thái tương ứng với một sự kiện có thể quan sát được) bằng cách mỗi trạng thái được gắn với một hàm mật độ xác suất của các sự kiện quan sát được (observation distribution). Ngoài quá trình ngẫu nhiên chuyển tiếp giữa các trạng thái, tại mỗi trạng thái còn có một quá trình ngẫu nhiên nữa đó là quá trình ngẫu nhiên sinh ra một quan sát. Như vậy, HMM có một quá trình ngẫu nhiên kép, trong đó có một quá trình ngẫu nhiên không quan sát được (ẩn sâu bên trong). Các trạng thái của HMM được xem là ẩn bên trong mô hình vì tại mỗi thời điểm ch nhìn thấy các sự kiện quan sát còn các trạng thái cũng như sự chuyển động trạng thái được vận hành ẩn bên trong mô hình.
Các sự kiện quan sát được nằm trong mỗi trạng thái và phụ thuộc vào hàm mật độ xác suất trong các trạng thái đó.
Trong hình 1.13, là các trạng thái ẩn và là các quan sát, một HMM thông thường có thể được định nghĩa với A là ma trận xác suất chuyển trạng thái, B là ma trận xác suất quan sát và là ma trận khởi đ u của các trạng thái. Dựa trên 3 ma trận này, các giai đoạn huấn luyện và phân lớp được tiến hành: Ở giai đoạn huấn luyện, mỗi một lớp được xây dựng và huấn luyện với số lượng trạng thái được ch định, các xác suất chuyển trạng thái và xác suất quan sát tương ứng được tối ưu sao cho xác suất xuất hiện các chuỗi quan sát giống với véc-tơ đặc trưng mẫu ở mức cao nhất. Ở giai đoạn phân lớp s tính toán xác suất mỗi HMM có thể tạo ra một chuỗi quan sát tương ứng với véc-tơ đặc trưng đ u vào, và kết quả phân lớp được đưa ra dựa trên HMM cho giá trị xác suất cao nhất. Các nhà nghiên cứu đ áp dụng thành công HMM trong nhiều ứng dụng bao gồm cả nhận dạng giọng nói [43], phát hiện gen [47], và nhận dạng cử ch …
Gharaled Panahandeh và các cộng sự trong nghiên cứu [40] dùng mô hình HMM liên tục để phân loại 5 hoạt động gồm: đứng yên, đi bộ, chạy, đi lên cầu thang, đi xuống cầu thang của người đi bộ dựa trên các đơn vị đo lường quán tính gắn trên ngực đối tượng.
Hình 1.14. Đơn vị đo lường quán tính gắn trên ngực đối tượng.
Hình 1.13. Tham số xác suất của một mô hình Markov ẩn.
Với mỗi hoạt động, hệ thống sử dụng một mô hình HMM con để huấn luyện, kiểm thử và tích hợp năm mô hình lại để tạo ra lớp HMM cao hơn.
Nghiên cứu này cho kết quả phân loại chính xác khoảng 95% dữ liệu kiểm thử nhưng điểm hạn chế là các đối tượng phải mang thêm máy tính xách tay kết nối với máy đo lường quán tính gắn trên ngực khi di chuyển, do đó có thể ảnh hưởng đến chuyển động bình thường của họ.
Các tác giả trong nghiên cứu [6] sử dụng giày thông minh (Smart Shoe) để phân tích dáng đi thực tế dựa trên dữ liệu thu được từ HMM, dựa vào các xác suất thu từ HMM để suy ra các giai đoạn dáng đi, và quá trình chuyển đổi bất thường giữa các giai đoạn dáng đi đều được kiểm tra bởi các ma trận chuyển đổi. Các phương pháp phân tích giai đoạn dáng đi được đề xuất đ được áp dụng cho dữ liệu dáng đi thực tế gồm một dữ liệu dáng đi bình thường, hai dữ liệu từ một bệnh nhân Parkinson và kết quả cho thấy các phương pháp đề xuất là công cụ tiềm năng để chẩn đoán tình trạng của bệnh nhân và đánh giá chức năng điều trị phục hồi.
c. Mạng nơron nhân tạo (Artificial Neural Network - ANN)
Mạng nơ-ron nhân tạo gọi tắt là mạng nơ-ron là một mô hình tính toán được xây dựng dựa trên các mạng nơ-ron sinh học. Nó gồm có một nhóm các nơ-ron nhân tạo (nút) nối với nhau, và xử lý thông tin bằng cách truyền theo các kết nối và tính giá trị mới tại các nút (cách tiếp cận connectionism đối với tính toán). Trong nhiều trường hợp, mạng nơ-ron nhân tạo là một hệ thống thích ứng (adaptive system) tự thay đổi cấu trúc của mình dựa trên các thông tin bên ngoài hay bên trong chảy qua mạng trong quá trình học; Về bản chất, học chính là quá trình hiệu ch nh trọng số liên kết giữa các nơron sao cho giá trị hàm lỗi là nhỏ nhất.
Trong nghiên cứu [60] các tác giả nhận biết dáng đi người sử dụng mạng nơ-ron lan truyền ngược: Đ u tiên cơ thể và hình chiếu được trích xuất từ các chuỗi ảnh của
Hình 1.15. Mô hình HMM tương ứng với các mô hình HMM con của mỗi hoạt động.
chuyển động dáng đi; tiếp đến khung xương 2D được trích xuất từ hình chiếu bằng cách xác định 9 tọa độ điểm trên cơ thể, các góc chuyển động trong chu kỳ dáng đi được tính từ chuỗi dáng đi để phân tích; sau đó thuật toán mạng nơ-ron lan truyền ngược tăng cường được dùng để xác định các đặc điểm dáng đi. Thí nghiệm được thực hiện trên 90 đối tượng khác nhau, mỗi đối tượng xây dựng 7 mô hình dáng đi, có tất cả 630 mô hình dáng đi được sử dụng. Các đối tượng này được phân loại thành ba nhóm, mỗi nhóm có 30 đối tượng, dựa theo mức chất lượng của dữ liệu ở giai đoạn tiền xử lý.
Mỗi nhóm dùng 150 véc-tơ để huấn luyện, 30 véc-tơ thử nghiệm. Hệ thống sử dụng 10 đặc trưng dáng đi của từng đối tượng làm dữ liệu đ u vào, 28 nút ẩn và 13 nút đ u ra.
Để nhận dạng dáng đi, mạng nơ-ron được huấn luyện cho đến khi hiệu quả nhận dạng trên dữ liệu huấn luyện đạt 100%. Kết quả nhận dạng đạt 90.0% với nhóm dữ liệu tiền xử lý tốt, cùng đạt 83.3% với nhóm trung bình và yếu.
Để huấn luyện và thử nghiệm việc nhận dạng dáng đi [46] các tác giả sử dụng mạng nơ-ron với giải thuật lan truyền ngược sai số: Đ u tiên, hình chiếu nhị phân của đối tượng được tách, sau đó tính trọng tâm, chiều dài bước đi, chiều dài chu kỳ dáng đi của đối tượng; tiếp đến, mạng nơ-ron được dùng để xây dựng mô hình huấn luyện.
Hình 1.16. Mô hình mạng nơron dùng trong nghiên cứu [46].
Theo tính toán thực nghiệm của các tác giả, lớp dữ liệu vào gồm 4 nơron tương ứng với bốn đặc trưng ở trên, lớp ẩn gồm 40 nơron sử dụng hàm sigmoid để tính toán, lớp ra gồm 25 nơron. Khi tiến hành thử nghiệm với bộ dữ liệu CASIA, tỷ lệ nhận dạng đạt tối đa là 96.32%.
KẾT LUẬN CHƯƠNG 1 1.4.
Như vậy, trong chương này luận văn đ trình bày các thông số đặc trưng của dáng đi, các thiết bị được sử dụng trong phân tích dáng đi cũng như các phương pháp phân tích dáng đi đ và đang được sử dụng phổ biến. Mỗi thiết bị, mỗi phương pháp đều có các ưu điểm và hạn chế riêng. Việc sử dụng thiết bị nào, áp dụng phương pháp nào tùy thuộc vào từng bài toán cụ thể.
Với thời gian và điều kiện thực tế, đề tài sử dụng một camera ghi nhận quá trình chuyển động của đối tượng, sử dụng LBP để trích đặc trưng và dùng mô hình SVM để huấn luyện và nhận dạng dáng đi của bệnh nhân Parkinson. Muốn đạt kết quả tốt cho giải pháp đề xuất, c n phải hiểu rõ hơn về bệnh Parkinson - một bệnh lý liên quan đến dáng đi. Chương tiếp theo s trình bày tổng quan về bệnh Parkinson.