1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phát triển hệ thống theo dõi chuyển Động cơ thể, Ứng dụng trong cơ sinh

80 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu phát triển hệ thống theo dõi chuyển động cơ thể, ứng dụng trong cơ sinh
Tác giả Hoàng Quang Vinh
Người hướng dẫn TS. Nguyễn Phan Kiên
Trường học Đại học Bách khoa Hà Nội
Chuyên ngành Kỹ thuật Y sinh
Thể loại luận văn thạc sĩ
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 80
Dung lượng 3,05 MB

Cấu trúc

  • CHƯƠNG 1. TỔNG QUAN (15)
    • 1.1. Tổng quan về cơ sinh cơ thể người (15)
      • 1.1.1. Khái niệm chung (15)
      • 1.1.2. Các phương pháp nghiên cứu sinh cơ học (19)
    • 1.2. Một số khái niệm giải phẫu cơ bản mô tả vận động người (20)
      • 1.2.1. Các tư thế tham chiếu (20)
      • 1.2.2. Các hệ quy chiếu (tọa độ) (21)
      • 1.2.3. Các loại góc (21)
      • 1.2.4. Các thuật ngữ tư thế tương đối (22)
      • 1.2.5. Các mặt phẳng và trục của vận động (23)
      • 1.2.6. Các vận động khớp (24)
      • 1.2.7. Các thuật ngữ mô tả vận động khác (25)
      • 1.2.8. Các độ tự do (26)
    • 1.3. Thực trạng công tác điều trị phục hồi chức năng tại Bệnh viện Đa khoa tỉnh Quảng Ninh (26)
      • 1.3.1. Giới thiệu về khoa Phục hồi chức năng (26)
      • 1.3.2. Cơ sở vật chất và nguồn nhân lực (27)
      • 1.3.3. Nhu cầu điều trị của người bệnh (29)
      • 1.3.4. Quy trình tập lên, xuống cầu thang (30)
    • 1.4. Một số nghiên cứu liên quan (33)
      • 1.4.1. Thiết bị Kinect của Microsoft (33)
      • 1.4.2. Hệ thống phân tích chuyển động chuyên nghiệp (TEMPLO ® ) (34)
      • 1.4.3. Phát hiện chuyển động bằng trí tuệ nhân tạo - Mediapipe (35)
    • 1.5. Lựa chọn công nghệ và công cụ (36)
      • 1.5.1. Thư viện OpenCV (36)
      • 1.5.2. Thư viện Mediapipe (37)
      • 1.5.3. Ngôn ngữ lập trình Python (37)
      • 1.5.4. Môi trường lập trình Pycharm (38)
    • 1.6. Kết luận chương (39)
    • 2.1. Thư viện xử lý hình ảnh OpenCV (40)
      • 2.1.1. Những điểm đặc trọng (40)
      • 2.1.2. Cách tổ chức (41)
      • 2.1.3. Khởi tạo OpenCV (42)
    • 2.2. Thư viện MediaPipe sử dụng trí tuệ nhân tạo (43)
      • 2.2.1. Face Detection (44)
      • 2.2.2. Face Mesh (45)
      • 2.2.3. Hands Detection (45)
      • 2.2.4. Human Pose Estimation (46)
      • 2.2.5. Nguyên lý hoạt động của công nghệ MediaPipe (47)
    • 2.3. Mô hình trí tuệ nhân tạo (51)
      • 2.3.1. Mạng nơ ron truy hồi (RNN - Recurrent Neural Network) (51)
      • 2.3.2. Mạng trí nhớ ngắn hạn định hướng dài hạn (LSTM - Long short term memory) (53)
    • 2.4. Kết luận chương 2 (54)
  • CHƯƠNG 3. XÂY DỰNG HỆ THỐNG VÀ CHẠY THỬ NGHIỆM (56)
    • 3.1. Xây dựng hệ thống phần mềm (56)
      • 3.1.1. Bước 1. Cài đặt thư viện của ngôn ngữ Python (56)
      • 3.1.2. Bước 2. Thu thập dữ liệu để huấn luyện (57)
      • 3.1.3. Bước 3. Sử dụng MediaPipe để đọc ra tọa độ các điểm landmarks (58)
      • 3.1.4. Bước 4. Mô hình hóa dữ liệu sử dụng thuật toán máy học Long Short- (59)
      • 3.1.5. Chạy thử nghiệm chương trình (60)
      • 3.1.6. Dữ liệu được trích xuất ra từ thực nghiệm (61)
    • 3.2. Kết quả thực nghiệm (63)
  • KẾT LUẬN (64)
  • PHỤ LỤC (65)
  • TÀI LIỆU THAM KHẢO (79)

Nội dung

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ và tên tác giả luận văn: Hoàng Quang Vinh Đề tài luận văn: Nghiên cứu phát tri

TỔNG QUAN

Tổng quan về cơ sinh cơ thể người

Trong chương 1, tôi sẽ trình bày tổng quan về cơ sinh cơ thể người, nền tảng cho các nghiên cứu tiếp theo của luận văn Cơ sinh là ngành nghiên cứu cấu trúc, chức năng và nguyên lý cơ học của các bộ phận cơ thể sống, chi tiết về sự dịch chuyển và cấu trúc của chúng Nghiên cứu này có mối liên hệ chặt chẽ với lĩnh vực kỹ thuật, thường sử dụng các công cụ truyền thống để phân tích hệ thống sinh học.

Trong luận văn này, tôi tập trung vào nghiên cứu phát triển hệ thống theo dõi chuyển động cơ thể nhằm hỗ trợ cho khoa phục hồi chức năng tại các bệnh viện Bài viết sẽ trình bày chi tiết về các quy trình kỹ thuật trong khoa phục hồi chức năng, từ đó cung cấp cái nhìn tổng quan về công việc phục hồi chức năng và ý tưởng cho thiết kế hệ thống.

Vận động học (kinesiology) là một lĩnh vực khoa học chuyên nghiên cứu về sự vận động của con người Môn học này bao gồm nhiều lĩnh vực như giải phẫu, sinh lý, tâm lý và sinh cơ học, tất cả đều liên quan đến các hoạt động vận động.

Sinh cơ học (biomechanics) là một lĩnh vực khoa học chuyên nghiên cứu chuyển động của các hệ thống sinh học thông qua việc áp dụng các nguyên lý cơ học Điều này giúp phân biệt sinh cơ học với vận động học, làm cho nó trở thành một ngành độc lập và đặc thù hơn.

TƯ THẾ VỊ TRÍ GIA TỐC

GIẢI PHẪU HỌC CHỨC NĂNG

Cơ học: là một nhánh của vật lý học mô tả vận động và tác động của các lực lên các vật thể và hệ thống cơ học

Giải phẫu học là một lĩnh vực khoa học nghiên cứu về hệ thống, cơ quan và mô của sinh vật Nó mô tả hình dạng, vị trí của các bộ phận khác nhau, cấu tạo thành phần của từng bộ phận, cũng như mối quan hệ giữa chúng với các bộ phận khác.

Giải phẫu học chức năng: là nghiên cứu các thành phần của cơ thể cần để đạt được vận động có mục đích

Vận động thẳng, hay còn gọi là vận động tịnh tiến, là hình thức chuyển động diễn ra dọc theo một đường thẳng hoặc cong Trong loại vận động này, tất cả các điểm của cơ thể hoặc vật thể di chuyển cùng một khoảng cách trong cùng một khoảng thời gian.

Hình 1.2 Ví dụ về vận động thẳng của người trượt tuyết

Các phương pháp áp dụng phân tích vận động thẳng là đánh giá vận động (hướng, đường đi, tốc độ) của trọng tâm hoặc quỹ đạo của vật

Vận động góc (angular motion) là quá trình chuyển động xung quanh một điểm cố định (trục xoay), trong đó các phần khác nhau của cùng một cơ thể hoặc vật thể không di chuyển đồng thời với cùng một khoảng cách trong một khoảng thời gian nhất định.

Hình 1.3 Vận động góc của cơ thể, vật thể hay phân đoạn xảy ra (A) quanh một trục của một khớp, (B) qua trọng tâm, hay (C) quanh một trục bên ngoài

Trong sinh cơ học, việc đánh giá các đặc điểm vận động thẳng của một hoạt động thường được thực hiện trước, sau đó tiến hành phân tích kỹ lưỡng các vận động góc có liên quan, nhằm hiểu rõ hơn về sự đóng góp của chúng vào vận động thẳng.

Phân tích sinh cơ học có thể là phân tích về chuyển động học hoặc lực động học

Hình 1.4 Động tác đánh gôn dược phân tích về hai khía cạnh: (Trái) các thành phần góc và (Phải) hướng và tốc độ của đầu gậy và quả bóng

Chuyển động học (kinematics) là lĩnh vực nghiên cứu các đặc điểm của vận động trong không gian và thời gian mà không xem xét đến các lực tác động Nó tập trung vào việc phân tích vị trí, vận tốc và gia tốc của vật thể, giúp hiểu rõ hơn về sự chuyển động, bao gồm tốc độ di chuyển nhanh hay chậm và khoảng cách cũng như độ cao mà vật thể đạt được.

Nghiên cứu chuyển động học thẳng và góc trong động tác đánh gôn giúp xác định các phân đoạn cần cải tiến, từ đó đánh giá kỹ thuật của vận động viên Việc phân chia kỹ thuật thành các phần nhỏ hơn cho phép chúng ta hiểu rõ hơn về cơ chế vận động của con người.

Lực động học (kinetics) nghiên cứu các lực tác động lên hệ thống như cơ thể người và các vật thể khác Phân tích vận động thông qua lực động học giúp đánh giá các lực gây ra chuyển động, tuy nhiên, việc này khó hơn so với phân tích chuyển động học do lực không thể nhìn thấy trực tiếp Để hiểu đầy đủ về một vận động, cần xem xét cả các thành phần chuyển động học và lực động học Ngoài ra, việc nghiên cứu mối quan hệ giữa chúng là quan trọng, vì mọi sự tăng tốc của chi, vật thể hay cơ thể đều là kết quả của một lực tác động tại một thời điểm và với độ lớn nhất định.

Hình 1.5 Ví dụ về phân tích lực động học của một vận động viên cử tạ

Phân tích động tác nâng có thể thực hiện thông qua việc quan sát các lực đứng dọc tác động lên mặt đất, từ đó tạo ra lực nâng thẳng Đồng thời, các lực xoay tại ba khớp chi dưới cũng đóng vai trò quan trọng trong việc tạo ra lực cơ cần thiết cho động tác này.

❖ Phân tích vận động ở trạng thái tĩnh là xem xét hệ thống không di chuyển hoặc di chuyển ở cùng một tốc độ

Tư thế ngồi làm việc với máy tính rất quan trọng để duy trì sức khỏe Ngay cả khi không có hoạt động thể chất, cơ thể vẫn chịu tác động của các lực giữa lưng và ghế, cùng với bàn chân và mặt đất Hơn nữa, lực cơ cũng hoạt động khắp cơ thể để chống lại trọng lượng và giữ cho đầu và thân luôn thẳng.

Hệ thống tĩnh được coi là ở trạng thái thăng bằng, không có sự thay đổi về tốc độ Phân tích vận động trong trạng thái tĩnh thường liên quan đến việc nghiên cứu các lực động học tác động lên hệ thống.

❖ Phân tích vận động ở trạng thái động là xem xét hệ thống đang tăng giảm/ tốc

- Ví dụ phân tích dáng đi, chạy

Phân tích chuyển động của cơ thể có thể bao gồm việc xem xét chuyển động thẳng và góc của các chi, đồng thời phân tích lực động học để mô tả các lực tác động lên mặt đất và các khớp trong quá trình đi bộ hoặc chạy.

Một số khái niệm giải phẫu cơ bản mô tả vận động người

1.2.1 Các tư thế tham chiếu

- Tư thế giải phẫu: Là tư thế tham chiếu đứng, lòng bàn tay hướng về phía trước

- Tư thế chức năng: Tương tự như tư thế giải phẫu nhưng tay thư giãn hơn, lòng bàn tay hướng vào trong

Hình 1.8 (Trái) Tư thế khởi đầu giải phẫu và (Phải) tư thế khởi đầu chức năng

1.2.2 Các hệ quy chiếu (tọa độ) Để phân tích vận động, cần xác định một hệ quy chiếu không gian mà vận động đó xảy ra

Hệ tọa độ 2D bao gồm hai trục vuông góc, gọi là trục x và trục y, tạo thành mặt phẳng x-y Mỗi điểm trong mặt phẳng này được xác định bởi khoảng cách đến hai trục, được biểu diễn dưới dạng tọa độ (x,y).

Hệ tọa độ 3D được sử dụng để mô tả các vận động trong không gian ba mặt phẳng, như động tác gấp và dạng đùi Trong hệ tọa độ này, thứ tự mô tả các trục là ngang, thẳng đứng và trong-ngoài, tương ứng với các giá trị x, y, z.

Có thể phân hệ tọa độ thành hai loại (hình 1-8):

Hệ tọa độ tương đối mô tả vận động của phân đoạn dựa trên sự so sánh với phân đoạn kế cận Trong khi đó, hệ tọa độ tuyệt đối, như thể hiện trong Hình 1.8 bên trái, đo lường góc của phân đoạn liên quan đến một điểm xa.

- Hệ tọa độ tuyệt đối: Hệ tọa độ cố định trong môi trường Hình 1.8 phải, hệ tọa độ tương đối đo lường góc tương đối (B) từ hai phân đoạn

Hình 1.9 Hệ tọa độ tuyệt đối và tương đối

Góc tuyệt đối là góc của phần cơ thể tương ứng với hệ tọa độ cố định trong môi trường Khái niệm này thường được áp dụng trong phân tích sinh học và sinh cơ học để hiểu rõ hơn về chuyển động và vị trí của cơ thể.

Hình 1.10 Các góc tuyệt đối: tay (a), thân (b), đùi (c), và cẳng chân (d) của một người đang chạy

Hình 1.11 Tọa độ của khớp háng, gối, cổ chân và các góc tuyệt đối của đùi và cẳng chân được xác định trong một hệ tọa độ tuyệt đối

Hình 1.12 Góc tương đối khuỷu (A) và gối (B)

Góc tương đối, hay còn gọi là góc khớp, là góc giữa các trục dọc của hai phân đoạn và thường được sử dụng trong lâm sàng Ví dụ, góc khớp khuỷu có thể mô tả mức độ gập hoặc duỗi của khớp Tuy nhiên, góc tương đối không thể hiện vị trí của các phân đoạn trong không gian; ví dụ, nếu một người có góc tương đối 90° ở khớp khuỷu và giữ nguyên góc đó, cánh tay có thể ở bất kỳ vị trí nào.

1.2.4 Các thuật ngữ tư thế tương đối

Hình 1.13 Một số thuật ngữ tư thế tương đối mô tả vận động

- Trước (front)/ sau (back): Trước còn gọi là bụng Sau là lưng Tuy nhiên, lòng bàn chân được xem là mặt bụng của bàn chân

- Gần (near)/ xa (far): Gần và xa với gốc hay nơi bắt đầu của cấu trúc

- Ngoài (out)/ trong (in): Ngoài là gần với bề mặt của cơ thể, còn trong gần với trung tâm của cơ thể

- Trên (up)/ dưới (down): Trên là hướng về phía đầu còn gọi là đầu, dưới là hướng về phía chân còn gọi là đuôi

- Trong / ngoài (di chuyển hướng về/ ra khỏi đường giữa cơ thể)

1.2.5 Các mặt phẳng và trục của vận động

- Các mặt phẳng chính: là các mặt phẳng vuông góc nhau và giao nhau ở trọng tâm

- Trục xoay: là điểm quanh đó vận động xảy ra, vuông góc với mặt phẳng vận động

Các mặt phẳng và trục chính (Hình 1-14):

• Mặt phẳng đứng dọc (Sagittal plane): Chia ra các nửa phải và trái theo trục

X Là tất cả các mặt phẳng đứng từ trước ra sau chia cơ thể ra làm hai phần: phải và trái Mặt phẳng đứng dọc giữa chia cơ thể ra làm hai phần đối xứng

Mặt phẳng ngang (Transverse plane) là mặt phẳng chia cơ thể thành hai phần trên và dưới theo trục Y Nó bao gồm tất cả các mặt phẳng tưởng tượng thẳng góc với trục cơ thể, tạo ra nhiều mặt phẳng ở các độ cao khác nhau để phân chia cơ thể và các cơ quan.

Mặt phẳng trán, hay còn gọi là mặt phẳng đứng ngang, chia cơ thể thành hai phần: trước và sau, theo trục Z Đây là các mặt phẳng đứng đi từ bên này sang bên đối diện, song song với mặt trước của cơ thể.

Hình 1.14 Các mặt phẳng và trục chính ở cơ thể người

Sự phân tích vận động đơn giản có thể được tiến hành ở một mặt phẳng chủ yếu

Ví dụ phân tích vận động các khớp ở chân trong động tác đi, chạy (hình 1-15)

Hình 1.15 Đánh dấu các mốc giải phẫu của video một người đang chạy để phân tích chuyển động học chân phải ở mặt phẳng đứng dọc

Vận động của cơ thể người thường diễn ra trên nhiều mặt phẳng và liên quan đến nhiều khớp, vì vậy cần phải phân tích ở cả ba mặt phẳng Một ví dụ điển hình là động tác ném bóng.

Hình 1.16 mô tả vận động trong ba mặt phẳng khi thực hiện động tác ném bóng Vận động ở mặt phẳng đứng dọc được quan sát từ bên cạnh, trong khi vận động ở mặt phẳng trán được nhìn từ phía sau và vận động ở mặt phẳng ngang được quan sát từ trên cao.

Hình 1.17 Các vận động khớp cơ bản

❖ Gấp và duỗi: vận động trong mặt phẳng song song với mặt phẳng đứng dọc

- Gấp: Giảm góc độ của khớp trong mặt phẳng đứng dọc

- Duỗi: Tăng góc độ của khớp trong mặt phẳng đứng dọc

- Gấp quá: Gấp quá mức bình thường

- Duỗi quá: Duỗi quá mức bình thường

❖ Dạng và khép: vận động trong mặt phẳng song song với mặt phẳng trán

- Dạng: Vận động tách xa đường giữa

- Khép: Vận động đến đường giữa

- Dạng quá: Dạng quá điểm 180°

- Khép quá: Khép quá điểm 0°

❖ Xoay: vận động trong mặt phẳng song song với mặt phẳng cắt ngang

- Xoay sang phải/ trái của đầu và thân

1.2.7 Các thuật ngữ mô tả vận động khác

• Gập bên: Dành cho nghiêng sang bên của đầu và thân

• Xoay vòng: Vận động hình tròn

• Vận động của xương bả vai

- Nâng bả vai/ hạ bả vai

- Tách bả vai ra xa (Protraction) / Ép bả vai gần nhau (Retraction)

- Xoay bả vai lên trên (Upward rotation)/ Xoay bả vai xuống dưới (Downward rotation)

• Một số mô tả vận động đặc biệt

- Khép ngang: kết hợp khép và gấp

- Dạng ngang: kết hợp duỗi và dạng (ví dụ dạng ngang khớp vai)

- Nghiêng bên quay/ nghiêng bên trụ

- Gấp lòng bàn chân/gấp mu bàn chân

- Xoay bàn chân vào trong (Inversion)/ xoay bàn chân ra ngoài (Eversion)

- Sấp và ngửa bàn chân: Sấp ngửa bàn chân không đồng nghĩa với xoay bàn chân vào trong và ra ngoài

▪ Sấp bàn chân gồm: Gấp mu bàn chân ở khớp cổ chân, Xoay xương cổ chân ra ngoài, Dạng ở phần trước bàn chân

▪ Ngửa bàn chân gồm: Gấp lòng bàn chân, Xoay trong ở khớp các xương cổ chân, Khép phần trước bàn chân

• Độ tự do (Degree of freedom, Df): Là số mặt phẳng mà một khớp có thể di chuyển

• 1 độ tự do: Một trục

- Ví dụ: khớp khuỷu, gian ngón, quay trụ (khuỷu), cổ chân

• 2 độ tự do: Hai trục

- Ví dụ: gối, bàn-đốt, cổ tay, khớp ngón cái

• 3 độ tự do: Ba trục

- Ví dụ: vai, háng, cột sống

Thực trạng công tác điều trị phục hồi chức năng tại Bệnh viện Đa khoa tỉnh Quảng Ninh

1.3.1 Giới thiệu về khoa Phục hồi chức năng

Khoa Phục hồi chức năng của Bệnh viện Đa khoa tỉnh Quảng Ninh thuộc hệ Nội và hoạt động theo quy chế Bệnh viện hạng I Phục hồi chức năng bao gồm các can thiệp y học, kỹ thuật phục hồi, công nghệ trợ giúp, giáo dục, hướng nghiệp, xã hội và cải thiện môi trường, nhằm giúp người bệnh và người khuyết tật phát triển, duy trì tối đa hoạt động chức năng, cũng như phòng ngừa và giảm khuyết tật phù hợp với môi trường sống của họ.

- Phục hồi chức năng nhằm phục hồi khả năng hoạt động của một cơ quan, một bộ phận cơ thể người bị suy giảm, rối loạn, bị mất đi…

Phục hồi chức năng giúp khôi phục tối đa các chức năng bị giảm hoặc mất cho bệnh nhân, đồng thời tăng cường khả năng còn lại của họ để giảm thiểu hậu quả của tàn tật.

Phục hồi sớm và đồng thời với quá trình điều trị là rất quan trọng để giúp người bệnh nhanh chóng hồi phục sức khỏe, ngăn ngừa các thương tật thứ cấp và rút ngắn thời gian điều trị cũng như giai đoạn phục hồi sau này.

Đánh giá chính xác tình trạng khuyết tật và sức khỏe của bệnh nhân là yếu tố quan trọng để đưa ra chỉ định tập luyện phục hồi phù hợp Việc này giúp đảm bảo rằng mỗi bệnh nhân nhận được chương trình phục hồi đúng lúc và đúng mức, từ đó tối ưu hóa kết quả phục hồi.

1.3.1.1 Nhiệm vụ của khoa PHCN

❖ Khám bệnh, chữa bệnh, PHCN theo các hình thức nội trú, ngoại trú:

- Khám bệnh, chữa bệnh chuyên khoa PHCN;

- Tham gia khám giám định xác định khuyết tật khi được trưng cầu

- Hướng dẫn sử dụng dụng cụ trợ giúp cho người bệnh

- Là cơ sở đào tạo thực hành cho các cơ sở đào tạo chuyên ngành y và các cơ sở giáo dục đào tào hợp pháp khác;

- Thực hiện đào tạo liên tục, bồi dưỡng kiến thức về chuyên ngành PHCN và cấp giấy chứng nhận theo đúng chương trình đào tạo

❖ Chỉ đạo tuyến về PHCN và PHCN dựa vào cộng đồng:

- Chỉ đạo tuyến dưới phát triển kỹ thuật, nâng cao chất lượng PHCN;

- Tham mưu cho cơ quan quản lý cấp trên về xây dựng, phát triển mạng lưới và hoạt động PHCN

- Thực hiện nghiên cứu khoa học và ứng dụng kỹ thuật mới, phương pháp mới về khám bệnh, chữa bệnh và PHCN

1.3.2 Cơ sở vật chất và nguồn nhân lực

Khoa PHCN hiện có 17 nhân sự, bao gồm 5 bác sĩ, 7 KTV đại học, 2 KTV cao đẳng và 3 điều dưỡng Mỗi ngày, khoa điều trị hơn 100 bệnh nhân nội trú và ngoại trú, với mỗi bệnh nhân nhận từ 3-5 chỉ định kỹ thuật, tổng số kỹ thuật thực hiện gần 500 lượt Do thiếu nhân lực, khoa tập trung vào các kỹ thuật điều trị như: 2 nhân viên lắp đặt và vận hành thiết bị vật lý trị liệu (vi sóng, sóng ngắn, siêu âm, laser, máy kéo giãn); 8 nhân viên thực hiện xoa bóp, bấm huyệt và kéo nắn cột sống, mỗi ca kéo dài 30 phút; 1 điều dưỡng trưởng phụ trách quản lý và hồ sơ bệnh án.

(Chi tiết tại Bảng phụ lục số 1) 1.3.2.2 Về cơ sở vật chất

Khoa Phục hồi chức năng hiện nay được trang bị nhiều thiết bị tiên tiến và đầy đủ tính năng, hỗ trợ tối ưu cho hoạt động phục hồi sức khỏe và chăm sóc bệnh nhân Dưới đây là báo cáo tổng quan về các danh mục thiết bị của khoa.

Bệnh viện không chỉ chú trọng vào việc mua sắm thiết bị hiện đại mà còn đầu tư vào bảo dưỡng và sử dụng hiệu quả, giúp đội ngũ y tế cung cấp dịch vụ chăm sóc sức khỏe tốt nhất cho bệnh nhân Điều này hỗ trợ quá trình phục hồi chức năng và nâng cao chất lượng cuộc sống Sự đa dạng và đầy đủ về thiết bị cũng cho phép tối đa hóa khả năng chỉ định điều trị.

16 phương pháp điều trị và tập luyện, tùy thuộc vào nhu cầu cụ thể của từng bệnh nhân

Bệnh viện cam kết nâng cao chất lượng dịch vụ bằng cách duy trì và nâng cấp thiết bị y tế, từ đó hỗ trợ hiệu quả trong quá trình phục hồi sức khỏe và mang lại hạnh phúc cho bệnh nhân.

Ngành phục hồi chức năng hiện nay có tổng cộng 459 quy trình kỹ thuật, được phân loại thành nhiều nhóm khác nhau Thông tin chi tiết về các quy trình này có thể tham khảo tại Bảng phụ lục số 2.

Vật lý trị liệu là phương pháp điều trị sử dụng các tác nhân vật lý như sóng ngắn, sóng cực ngắn, vi sóng, từ trường, dòng điện xung, siêu âm, sóng xung kích, tia hồng ngoại và máy kéo giãn cột sống để cải thiện sức khỏe và phục hồi chức năng cho bệnh nhân.

Vận động trị liệu bao gồm các bài tập vận động thụ động và chủ động, giúp phục hồi chức năng cho người bệnh liệt nửa người Quá trình này bao gồm tập đứng và đi, sử dụng các thiết bị hỗ trợ như thanh song song, khung tập đi, nạng, gậy và bàn xương cá Ngoài ra, người bệnh cũng được hướng dẫn tập lên, xuống cầu thang để cải thiện khả năng di chuyển và tăng cường sức mạnh cơ bắp.

Hoạt động trị liệu bao gồm việc tập sử dụng và điều khiển xe lăn, rèn luyện các vận động thô và khéo léo của bàn tay, cùng với việc cải thiện khả năng phối hợp giữa hai tay, mắt và tay, cũng như tay và miệng Ngoài ra, việc tập luyện các chức năng sinh hoạt hàng ngày cũng là một phần quan trọng trong quá trình phục hồi chức năng.

• Ngôn ngữ trị liệu: tập nói, nuốt, nhai, phát âm, giao tiếp; sửa lỗi phát âm…

Kỹ thuật thăm dò và lượng giá trong phục hồi chức năng bao gồm việc đo tầm vận động cơ, đo áp lực, và đánh giá chức năng thăng bằng, dáng đi cũng như khả năng thực hiện các sinh hoạt hàng ngày.

• Dụng cụ chỉnh hình và trợ giúp: tập sử dụng tay giả, chân giả, nẹp…

(Chi tiết tại Bảng phụ lục số 3)

Hình 1.18 Kỹ thuật viên hỗ trợ bệnh nhân tập đi với thanh song song

Khoa Phục hồi chức năng của Bệnh viện đa khoa tỉnh Quảng Ninh hiện đã được phê duyệt 117 trong tổng số 252 danh mục kỹ thuật Luận văn này sẽ tập trung vào việc nghiên cứu các quy trình liên quan đến lĩnh vực này.

- Tập lên, xuống cầu thang;

- Lượng giá chức năng dáng đi;

- Lượng giá chức năng thăng bằng

 Tổng kết bằng việc đưa ra bảng kết quả đánh giá dựa trên thang điểm từ 1 đến 4

Trong lĩnh vực vật lý trị liệu, hiện có 25 kỹ thuật chưa được thực hiện do thiếu thiết bị, bao gồm Oxy cao áp, Parafin, xông hơi, bồn xoáy, tắm khoáng, điện trường áp và ion Các kỹ thuật nắn bó bột chỉnh hình thuộc khoa Chấn thương chỉnh hình đã được triển khai, trong khi 6 kỹ thuật thuộc khoa Lão khoa cũng đã được thực hiện, cùng với một số kỹ thuật tại khoa Nhi.

(Chi tiết tại Bảng phụ lục số 4)

1.3.3 Nhu cầu điều trị của người bệnh

Một số nghiên cứu liên quan

1.4.1 Thiết bị Kinect của Microsoft [6]

Kinect là thiết bị cảm biến chuyển động do Microsoft phát triển cho Xbox 360 và Windows, cho phép người chơi tương tác với trò chơi mà không cần tay cầm thông qua cử chỉ tự nhiên Thiết bị này đã được các trường đại học lớn trên thế giới nghiên cứu và phát triển cho nhiều ứng dụng khác ngoài trò chơi điện tử, bao gồm thể thao, y tế và giám sát an toàn.

Hình 1.21 Kinect phát hiện bệnh của người lớn tuổi và ngăn ngừa té ngã

Kinect có khả năng phát hiện bệnh cho người cao tuổi và giảm nguy cơ té ngã Nghiên cứu từ Đại học Missouri đã sử dụng Microsoft Kinect để theo dõi sự thay đổi trong thói quen hành vi của bệnh nhân, góp phần nâng cao sức khỏe và an toàn cho người lớn tuổi.

Nghiên cứu thứ hai đã áp dụng công nghệ radar Doppler để phát hiện những biến đổi trong cử động của bệnh nhân, bao gồm việc đi lại, cúi xuống, nhảy và các hành động cụ thể khác, nhằm xác định nguy cơ té ngã cao hơn.

1.4.2 Hệ thống phân tích chuyển động chuyên nghiệp (TEMPLO ® )

Hình 1.22 Hệ thống tất cả trong một để phân tích chuyển động chuyên nghiệp

Với phần mềm phân tích chuyển động TEMPLO ®, CONTEMPLAS đã phát triển một giải pháp phân tích video tiên tiến, dựa trên công nghệ video và xử lý hình ảnh hiện đại nhất.

TEMPLO ® là nền tảng cho các hệ thống phân tích modul của CONTEMPLAS, cho phép mở rộng khả năng hoạt động theo nhu cầu cá nhân bằng cách thêm phần cứng như máy ảnh tốc độ cao và thiết bị đo đạc bên ngoài Ngoài ra, hệ thống còn tích hợp các tính năng phần mềm thông minh, bao gồm theo dõi không cần đánh dấu.

TEMPLO ® ghi lại các chuyển động từ tất cả các góc độ với hệ thống nhiều máy ảnh đồng bộ với chất lượng tốt nhất

Tùy thuộc vào nhu cầu của người dùng, có thể lựa chọn các loại máy ảnh như GigE, USB3, HDMI và IP, với khả năng triển khai không giới hạn Bằng cách kết hợp video ghi lại với các thiết bị đo đạc khác, người dùng có thể nhận được dữ liệu phân tích toàn diện và chính xác, giúp tư vấn hiệu quả cho vận động viên hoặc bệnh nhân.

- Bàn đạp lực (Force plates): Được sử dụng để đo lực tác động lên bề mặt và phân tích biểu đồ lực tác động

- Thiết bị đo áp lực (Pressure Measurement Devices): Sử dụng để đo áp lực hoặc phân phối áp lực trên bề mặt cơ thể hoặc vật thể

- Đo điện cơ (EMG - Electromyography): Được sử dụng để ghi lại hoạt động điện của cơ bắp, giúp theo dõi hoạt động cơ bắp trong thời gian thực

Thiết bị đo thời gian OptoGait được sử dụng để đo lường và ghi lại thông tin về chuyển động của người chạy hoặc bệnh nhân trong các thử nghiệm.

Hình 1.23 Hệ thống phân tích chạy TEMPLO®

Hệ thống phân tích chạy TEMPLO® bao gồm các thành phần sau:

- 2 Máy ảnh tốc độ cao (1)

- Máy tính xách tay hoặc máy tính cá nhân với phần mềm (2)

- Máy chạy bộ với thiết bị đo áp lực tích hợp (3+4)

- Thiết bị đo thời gian OptoGait (5)

1.4.3 Phát hiện chuyển động bằng trí tuệ nhân tạo - Mediapipe

MediaPipe là một bộ giải pháp Machine Learning đa nền tảng, nhẹ và có khả năng can thiệp cao Giải pháp này nổi bật với nhiều ưu điểm vượt trội.

Google cung cấp một giải pháp inference nhanh chóng, khẳng định rằng bộ công cụ này có khả năng hoạt động ổn định trên hầu hết các cấu hình phần cứng phổ biến.

Việc cài đặt và triển khai rất đơn giản và thuận tiện, cho phép người dùng dễ dàng sử dụng trên nhiều nền tảng khác nhau, bao gồm Mobile (Android/iOS), Desktop/Cloud, Web và các thiết bị IoT.

MediaPipe là một nền tảng mã nguồn mở và miễn phí, cho phép người dùng truy cập và tùy chỉnh toàn bộ mã nguồn để phù hợp với nhu cầu cụ thể của họ.

Hình 1.24 Các ứng dụng của Mediapipe

Lựa chọn công nghệ và công cụ

OpenCV là thư viện xử lý ảnh mã nguồn mở do Intel phát triển, cung cấp nhiều ứng dụng như nhận dạng và phát hiện khuôn mặt, lọc Kalman, thể hiện sự đa dạng của trí tuệ nhân tạo Thư viện này cải thiện các thuật toán cơ bản của thị giác máy thông qua các hàm API cấp thấp Hiểu cách thức hoạt động của OpenCV là cách hiệu quả để tận dụng tối đa tính năng của nó Được ra mắt lần đầu vào năm 1999, OpenCV ban đầu yêu cầu thư viện xử lý ảnh của Intel, nhưng đã trở thành độc lập và hoàn toàn miễn phí cho người dùng OpenCV hỗ trợ nhiều hệ điều hành như Windows, Linux và MacOSX.

Sau quá trình nghiên cứu, tôi đã chọn công nghệ trí tuệ nhân tạo MediaPipe cho việc phân tích chuyển động cơ thể MediaPipe cung cấp nền tảng mạnh mẽ để theo dõi và phân tích chuyển động, cùng với các công cụ và thư viện mã nguồn mở, giúp phát triển ứng dụng dựa trên dữ liệu đa phương tiện hiệu quả Công cụ này không chỉ giới hạn trong phân tích chuyển động mà còn mở ra nhiều khả năng khác, tối ưu hóa quá trình phát triển ứng dụng và hỗ trợ cộng đồng trong nghiên cứu và phát triển các ứng dụng sáng tạo.

Sử dụng MediaPipe sẽ tối ưu hóa quá trình phân tích chuyển động cơ thể, mang lại kết quả chính xác và ứng dụng hiệu quả cho bài toán của bạn.

Hình 1.25 Theo dõi chuyển động cơ thể khi đang tập Yoga

1.5.3 Ngôn ngữ lập trình Python [9]

Python là một trong những ngôn ngữ lập trình phổ biến nhất hiện nay, được phát triển bởi Guido van Rossum vào năm 1989 Với cú pháp dễ hiểu và mô-đun đa dạng, Python đã thu hút một cộng đồng lập trình viên sôi nổi và trở thành lựa chọn hàng đầu trong các ứng dụng xử lý hình ảnh.

Python nổi bật với tính đa năng, cho phép sử dụng trong nhiều lĩnh vực như phát triển web, phân tích dữ liệu, máy học và xử lý hình ảnh Nhờ vào các thư viện mạnh mẽ, Python hỗ trợ tạo ra những ứng dụng phức tạp và tăng tốc độ phát triển Một ví dụ điển hình là thư viện OpenCV, thường được sử dụng cho xử lý hình ảnh Ứng dụng nổi bật của Python trong lĩnh vực này là nhận dạng khuôn mặt, giúp phát triển các ứng dụng đáng tin cậy để xác định và phát hiện các biểu hiện khuôn mặt khác nhau Python cũng có khả năng phát triển nhiều ứng dụng xử lý ảnh khác.

Python là một trong những ngôn ngữ lập trình phổ biến nhất trong lĩnh vực xử lý hình ảnh, với khả năng phát hiện vật thể, phát hiện chuyển động và tách ngữ cảnh Sự linh hoạt của Python cho phép phát triển nhiều ứng dụng phức tạp trong các lĩnh vực khoa học và kỹ thuật khác nhau.

Trong nghiên cứu "Nghiên cứu khả năng ứng dụng của công nghệ Open CV và MediaPipe trong việc theo dõi chuyển động cơ thể", ngôn ngữ Python được sử dụng để triển khai các thuật toán xử lý hình ảnh Python cung cấp nhiều thư viện như OpenCV và MediaPipe, hỗ trợ việc phân tích và theo dõi chuyển động cơ thể một cách đơn giản và hiệu quả.

1.5.4 Môi trường lập trình Pycharm

Hình 1.26 Chương trình nhận dạng khuôn mặt

PyCharm là một IDE (Môi trường phát triển tích hợp) do JetBrains phát triển, chuyên dùng cho lập trình Python Nhiều ứng dụng lớn như Twitter, Facebook, Amazon và Pinterest đã chọn PyCharm làm công cụ phát triển Python chính của họ.

PyCharm là một môi trường phát triển tích hợp (IDE) dành riêng cho ngôn ngữ lập trình Python Các tính năng chính của PyCharm bao gồm:

• Hỗ trợ đa nền tảng: PyCharm có khả năng chạy trên nhiều hệ điều hành như

Windows, Linux và macOS, giúp lập trình viên linh hoạt trong việc phát triển trên các nền tảng khác nhau

PyCharm là một trình chỉnh sửa mã thông minh, hỗ trợ lập trình viên viết mã chất lượng cao với các lược đồ màu cho từ khóa, lớp và hàm, giúp nâng cao khả năng đọc và hiểu mã Nó còn giúp phát hiện lỗi dễ dàng và cung cấp tính năng tự động hoàn thiện mã cùng với hướng dẫn hoàn thiện mã hiệu quả.

PyCharm cung cấp tính năng điều hướng mã hiệu quả, giúp lập trình viên dễ dàng chỉnh sửa và cải thiện mã với ít nỗ lực Những tính năng này cho phép tìm kiếm và xác định vị trí nhanh chóng các phần tử, biến, và ký hiệu trong mã nguồn.

PyCharm giúp lập trình viên thực hiện tái cấu trúc mã một cách hiệu quả và nhanh chóng, bao gồm việc thay đổi biến cục bộ và toàn cục mà không ảnh hưởng đến hiệu suất Ngoài ra, công cụ này còn hỗ trợ phân chia các lớp với các chức năng mở rộng, tối ưu hóa quy trình phát triển phần mềm.

Nhờ các tính năng mạnh mẽ này, PyCharm trở thành một môi trường phát triển Python ấn tượng và hữu ích cho các nhà phát triển Python.

Kết luận chương

Trong Chương 1, tôi cung cấp cái nhìn tổng quan về cơ sinh học con người, thiết lập nền tảng cho các nghiên cứu sâu hơn trong luận văn Cơ sinh học không chỉ khám phá cấu trúc và chức năng của cơ thể, mà còn giúp hiểu rõ cách các bộ phận tương tác và di chuyển Sự kết nối giữa cơ sinh học và kỹ thuật là yếu tố thiết yếu trong nghiên cứu hệ thống sinh học.

Đã thực hiện phân tích chi tiết về tình hình hiện tại của khoa phục hồi chức năng tại bệnh viện, xác định nhu cầu cấp thiết cho một hệ thống phân tích chuyển động hiệu quả nhằm cải thiện quá trình phục hồi chức năng cho bệnh nhân.

Em đã tiến hành nghiên cứu sâu rộng về các công nghệ hiện đại trong lĩnh vực phục hồi chức năng, xác định những công nghệ tiên tiến và cơ hội ứng dụng chúng để theo dõi và phân tích chuyển động của bệnh nhân hiệu quả Việc này tạo nền tảng cho lựa chọn và triển khai các giải pháp phù hợp, nhằm nâng cao chất lượng phục hồi chức năng tại khoa và mang lại lợi ích lớn cho bệnh nhân.

CHƯƠNG 2 NGHIÊN CỨU KHẢ NĂNG ỨNG DỤNG CỦA CÔNG NGHỆ OPENCV VÀ MEDIAPIPE TRONG VIỆC THEO DÕI

Thư viện xử lý hình ảnh OpenCV

2.1.1 Những điểm đặc trọng a) Image and Video I/O

Những giao diện này cho phép người dùng đọc dữ liệu hình ảnh từ file hoặc trực tiếp từ video, đồng thời cũng hỗ trợ tạo ra các file hình ảnh và video Bên cạnh đó, thị giác máy và các thuật toán xử lý ảnh đóng vai trò quan trọng trong việc nâng cao khả năng phân tích và xử lý hình ảnh.

Sử dụng các giao diện này cho phép thực hành với nhiều chuẩn thị giác máy mà không cần mã nguồn Modul thị giác máy ở cấp độ cao mang lại sự tiện lợi và hiệu quả trong quá trình phát triển ứng dụng.

OpenCV có nhiều ứng dụng quan trọng trong lĩnh vực thị giác máy tính, bao gồm nhận diện khuôn mặt, phát hiện và theo dõi đối tượng Nó hỗ trợ xử lý hình ảnh từ camera di động để xác định cấu trúc 3D, đồng thời tích hợp khả năng xử lý kích thước camera và âm thanh nổi Bên cạnh đó, OpenCV còn kết hợp với trí tuệ nhân tạo và machine learning để nâng cao hiệu suất và độ chính xác trong các tác vụ phân tích hình ảnh.

Thị giác máy thường yêu cầu các hệ thống máy móc áp dụng học máy hoặc trí tuệ nhân tạo để thực hiện các ứng dụng hiệu quả Nhiều công cụ và phương pháp này đã được tích hợp sẵn trong gói OpenCV, cho phép người dùng dễ dàng lấy mẫu ảnh và thực hiện các phép biến đổi cần thiết.

OpenCV rất hữu ích trong việc xử lý nhóm phần tử ảnh như một đơn vị, bao gồm các chức năng như tách ra, lấy mẫu ngẫu nhiên, phục chế, xoay và làm cong ảnh Ảnh nhị phân thường được sử dụng trong các hệ thống kiểm tra khuyết điểm hình dạng hoặc các bộ phận quan trọng, mang lại sự tiện lợi khi xác định vật thể cần bắt Ngoài ra, OpenCV cũng cung cấp các phương pháp tính toán thông tin 3D hiệu quả.

Các hàm này rất hữu ích trong việc sắp xếp và xác định khối lập thể bằng cách sử dụng thiết bị stereo hoặc trong không gian nhìn phức tạp từ nhiều góc độ của một camera riêng biệt Ngoài ra, chúng còn hỗ trợ trong các phép toán xử lý ảnh, thị giác máy và biểu diễn hình ảnh.

OpenCV sử dụng các phép toán phổ biến như: đại số học, thống kê và tính toán hình học

Các giao diện này hỗ trợ việc viết chữ và vẽ trên hình ảnh, rất hữu ích trong việc ghi nhãn và đánh dấu Chẳng hạn, khi phát triển một chương trình nhận dạng nhiều đối tượng, chúng giúp tạo nhãn ảnh với kích thước và vị trí chính xác Phương thức GUI đóng vai trò quan trọng trong quá trình này.

OpenCV cung cấp giao diện người dùng riêng, nhưng khả năng của nó bị hạn chế tùy thuộc vào từng môi trường Các giao diện này hỗ trợ API đa phương tiện, giúp hiển thị hình ảnh một cách đơn giản Người dùng có thể nhập dữ liệu thông qua chuột, bàn phím và điều khiển quá trình một cách dễ dàng Ngoài ra, OpenCV còn bao gồm các cấu trúc dữ liệu và thuật toán hiệu quả để xử lý hình ảnh.

Với những giao diện này, người dùng có thể dễ dàng giữ lại, tìm kiếm và lưu trữ các danh mục điều khiển, tuyển tập và các tập hợp lệnh, đồng thời quản lý đồ họa và sơ đồ nhánh một cách hiệu quả Khả năng tồn tại lâu dài của dữ liệu (Data persistence) cũng được đảm bảo, giúp người dùng truy cập thông tin một cách liên tục và ổn định.

Các phương pháp này tạo ra giao diện thuận tiện cho việc lưu trữ nhiều dạng dữ liệu khác nhau vào đĩa, giúp dễ dàng khôi phục khi cần thiết.

Một vài ví dụ về tác dụng của OpenCV như: nhận dạng mặt, nhận dạng đường viền, nhận dạng biên…

Cấu trúc OpenCV gồm nhiều module

Hình 2.1 Tổ chức của OpenCV

Thuật toán xử lý hình ảnh và thị giác

Công cụ phân loại, thống kê và phân cụm

Giao diện hình ảnh và video

Các cấu trúc và thuật toán cơ bản

CXCORE bao gồm các dạng dữ liệu cơ bản như ảnh, điểm và hình chữ nhật, được xác định trong file cxtypes.h Nó chứa các phép toán đại số tuyến tính, thống kê, cùng với các hàm lưu trữ lâu dài và xử lý lỗi Đặc biệt, các hàm đồ họa dùng để vẽ ảnh cũng được lưu trữ trong CXCORE.

CV bao gồm quy trình xử lý ảnh và các phương pháp đánh giá kích thước ảnh sơ bộ Ngoài ra, các hàm tính toán hình học cũng được lưu trữ trong CV.

CVAUX được OpenCV mô tả là một module cũ, chủ yếu phục vụ cho việc thí nghiệm Tuy nhiên, nó cung cấp giao diện đơn giản nhất cho nhận dạng khuôn mặt Các mã nguồn trong module này rất phù hợp và được sử dụng rộng rãi cho mục đích nhận diện khuôn mặt.

MLL bao gồm giao diện machine learning, trong khi các hàm khác nằm trong HighGUI và CVCAM, cả hai đều được lưu trữ trong thư mục "otherlibs" Việc sử dụng chúng có thể dễ dàng gặp lỗi do HighGUI chứa các thư viện vào ra cơ bản và nhiều cửa sổ đa chức năng.

CVCAM là thư viện cung cấp các hàm truy cập video qua DirectX trên hệ điều hành Windows 32 bit Mặc dù HighGUI cũng có giao diện video đơn giản và hoạt động trên nhiều môi trường, người dùng Windows XP có thể nâng cao hiệu suất bằng cách chuyển sang giao diện CVCAM Tuy nhiên, OpenCV sẽ dễ sử dụng hơn khi làm việc với HighGUI.

2.1.3 Khởi tạo OpenCV a) Khởi tạo cơ bản

Thư viện MediaPipe sử dụng trí tuệ nhân tạo

MediaPipe là một giải pháp linh hoạt, dễ dàng tích hợp vào các ứng dụng trên nhiều nền tảng, bao gồm máy tính và thiết bị di động Nó cũng cung cấp các công cụ hữu ích cho việc huấn luyện và triển khai mô hình tùy chỉnh trên nền tảng MediaPipe.

❖ Các thành phần chính của MediaPipe bao gồm:

• MediaPipe Graph: một khung chương trình để xây dựng và chạy các đường ống xử lý dữ liệu hình ảnh và video

• MediaPipe Calculator: các thành phần đơn lẻ được sử dụng trong đường ống để xử lý dữ liệu hình ảnh và video

• MediaPipe Python: một API Python để phát triển các ứng dụng MediaPipe

MediaPipe hoạt động dựa trên quy trình xử lý dữ liệu liên tục gọi là "pipeline", là chuỗi các bước xử lý dữ liệu được sắp xếp theo trình tự nhất định Trong lĩnh vực thị giác máy tính, pipeline thường được áp dụng để xử lý và phân tích dữ liệu hình ảnh, giúp tối ưu hóa quá trình chuyển đổi từ đầu vào đến đầu ra.

MediaPipe bao gồm 32 ảnh và video, với các bước quan trọng như tiền xử lý, phát hiện đối tượng, theo dõi đối tượng và phân tích hành vi Các bước trong pipeline của MediaPipe được thiết kế để tối ưu hóa quá trình xử lý và phân tích dữ liệu.

• Input: dữ liệu đầu vào, chẳng hạn như hình ảnh hoặc video, được cung cấp cho pipeline

Tiền xử lý dữ liệu là giai đoạn quan trọng, bao gồm các bước chuyển đổi dữ liệu đầu vào thành định dạng thích hợp cho các mô hình máy học.

Các mô hình máy học được áp dụng để phân tích dữ liệu đầu vào và cung cấp các đầu ra dưới dạng kết quả phân loại, phát hiện hoặc theo dõi đối tượng.

• Post-processing: các bước xử lý dữ liệu đầu ra được thực hiện để loại bỏ các kết quả sai và cải thiện độ chính xác của đầu ra

• Output: các kết quả đầu ra được cung cấp cho ứng dụng hoặc hệ thống khác để sử dụng hoặc hiển thị

MediaPipe là một hệ thống phần mềm mã nguồn mở, cho phép tùy chỉnh và thay đổi các thành phần của pipeline theo nhu cầu của nhà phát triển và nghiên cứu Hệ thống này hỗ trợ nhiều ứng dụng như nhận diện khuôn mặt, phát hiện đối tượng, theo dõi điểm đối tượng, và chuyển đổi hình ảnh cũng như video.

2.2.1 Face Detection Đây là một bài toán quen thuộc với tất cả mọi người Với đầu vào là một ảnh hoặc một video, nhiệm vụ của chúng ta là tìm ra vị trí và đóng hộp (bounding box) những khuôn mặt con người xuất hiện trên đấy, cũng như đánh dấu các điểm quan trọng (MediaPipe sử dụng 5-landmarks) trên khuôn mặt đó MediaPipe Face Detection sử dụng mạng BlazeFace làm nền tảng nhưng thay đổi backbones Ngoài ra, thuật toán NMS (non-maximum suppression) cũng được thay thế bởi một chiến thuật khác, giúp thời gian xử lý giảm đáng kể

Face Mesh là một phương pháp nhận diện khuôn mặt bằng cách xác định 468 điểm trên mặt, tạo thành một lưới (mesh) mà không cần nhiều tài nguyên tính toán hay số lượng camera, chỉ cần một camera chính diện Lưới này được ứng dụng trong các tác vụ chỉnh sửa ảnh 3D, 3D Alignment và chống giả mạo (Anti-spoofing).

Hình 2.3 468 điểm trong Face Mesh

Nhận diện bàn tay, hay còn gọi là Hands Detection, là một bài toán thú vị mà chúng ta sẽ khám phá trong bài viết này Giải pháp của chúng tôi cung cấp một mô hình khung xương (skeleton) của bàn tay, bao gồm vị trí của các điểm đặc trưng (landmarks) và kết nối chúng để tạo thành một khung bàn tay hoàn chỉnh.

Hình 2.4 Nhận diện 3D-Skeleton của tay

Mô hình 3D Skeleton cho cơ thể người được phát triển từ bài toán Hands Detection và Human Pose Estimation, với các khớp quan trọng đã được định nghĩa và liên kết để tạo thành khung hình người Chiến thuật giải quyết vấn đề này tương tự như trong Hands Detection và Face Mesh, trong đó BlazeFace được sử dụng làm nền tảng chính cho thuật toán xử lý.

Hình 2.5 Theo dõi tư thế con người trong môi trường 3D

In addition, Google offers a wide range of solutions within this toolkit, including tasks such as Segmentation (Selfie, Hair, etc.), Object Detection, Motion Tracking, and 3D Object Detection.

2.2.5 Nguyên lý hoạt động của công nghệ MediaPipe

Hình 2.6 Các điểm mốc đánh dấu trên cơ thể của thư viện MediaPipe

Chú thích hình 2.6 gồm có 33 điểm mốc đánh dấu trên cơ thể của thư viện MediaPipe:

1 - mắt trái (bên trong) (left eye inner)

3 - mắt trái (bên ngoài) (left eye outer)

4 - mắt phải (bên trong) (right eye inner)

6 - mắt phải (bên ngoài) (right eye outer)

9 - miệng (bên trái) (mouth left)

10 - miệng (bên phải) (mouth right)

13 - khuỷu tay trái (left elbow)

14 - khuỷu tay phải (right elbow)

15 - cổ tay trái (left wrist)

16 - cổ tay phải (right wrist)

17 - ngón út trái (left pinky)

18 - ngón út phải (right pinky)

19 - ngón áp út trái (left index)

20 - ngón áp út phải (right index)

21 - ngón cái trái (left thumb)

22 - ngón cái phải (right thumb)

27 - mắc cái trái (left ankle)

28 - mắc cái phải (right ankle)

29 - gót chân trái (left heel)

30 - gót chân phải (right heel)

31 - ngón cái chân trái (left foot index)

32 - ngón cái chân phải (right foot index)

Việc ước tính tư thế con người từ video là quá trình xác định vị trí và góc quay của các điểm khớp trong cơ thể, cho phép áp dụng vào nhiều lĩnh vực như đo lường và cải thiện kỹ thuật tập thể dục, hỗ trợ người dùng thực hiện đúng động tác và đánh giá hiệu quả tập luyện Ngoài ra, công nghệ này còn giúp nhận dạng ngôn ngữ ký hiệu, tạo điều kiện giao tiếp cho người khiếm thính, và kiểm soát cử chỉ toàn thân, giúp người dùng tương tác với máy tính và thiết bị điện tử một cách tự nhiên và hiệu quả hơn.

MediaPipe Pose là công nghệ AI tiên tiến giúp theo dõi tư thế cơ thể với độ chính xác cao Công nghệ này tận dụng thông tin từ các khung hình video để phân tích và nhận diện các điểm đặc trưng trên cơ thể.

MediaPipe Pose, được phát triển bởi nhóm nghiên cứu BlazePose, sử dụng công nghệ suy luận tư thế cơ thể thông qua 37 điểm đánh dấu màu xanh lá cây và xanh dương trên cơ thể Công nghệ này có khả năng hoạt động trên nhiều thiết bị như điện thoại di động, máy tính để bàn, máy tính xách tay và cả trên web, bao gồm cả Python Với MediaPipe Pose, người dùng có thể giám sát và đánh giá tư thế tập luyện, từ đó nâng cao hiệu quả tập thể dục Ngoài ra, nó còn có ứng dụng trong thực tế tăng cường và hỗ trợ giao tiếp cho người khiếm thính.

Công nghệ MediaPipe Pose áp dụng quy trình trí tuệ nhân tạo với hai giai đoạn chính là phát hiện và theo dõi Được chứng minh hiệu quả qua các giải pháp MediaPipe Hands và MediaPipe Face Mesh, công nghệ này mang lại những ứng dụng đáng chú ý trong lĩnh vực nhận diện và theo dõi chuyển động.

Hình 2.7 Có 21 điểm mốc đánh dấu trên bàn tay của thư viện MediaPipe Hands 1- Cổ tay (wrist)

2- Đối chiếu thắt chân cái (thumb_cmc)

3- Liên kết giữa đối chiếu thắt chân cái và ngón áp út (thumb_mcp)

4- Đối chiếu thắt chân cái (thumb_ip)

5- Đối chiếu ngón trỏ (thumb_tip)

6- Liên kết giữa đối chiếu ngón trỏ và ngón áp út (index finger_mcp)

7- Giữa ngón trỏ (index finger_pip)

8- Đầu ngón trỏ (index finger_dip)

9- Đối chiếu giữa ngón trỏ và ngón áp út (index_finger_tip)

10- Liên kết giữa ngón trung (middle finger_mcp)

11- Giữa ngón trung (middle finger_pip)

12- Đầu ngón trung (middle finger_dip)

13- Đối chiếu giữa ngón trung và ngón áp út (middle finger_tip)

14- Liên kết giữa ngón áp út (ring finger_mcp)

15- Đầu ngón áp út (ring finger_pip)

16- Giữa ngón áp út (ring finger_dip)

17- Đối chiếu giữa ngón áp út và ngón áp út (ring finger_tip)

18- Liên kết giữa ngón đức (pinky_mcp)

19- Giữa ngón đức (pinky pip)

20- Đầu ngón đức (pinky dip)

21- Đối chiếu giữa ngón đức và ngón áp út (pinky tip)

Mô hình trí tuệ nhân tạo

Trí tuệ nhân tạo (AI) là lĩnh vực trong khoa học máy tính nhằm phát triển máy tính và hệ thống có khả năng thực hiện các nhiệm vụ thông minh, thường cần sự hiểu biết và tư duy của con người Mục tiêu của AI là tạo ra máy tính có khả năng học hỏi, lập trình và thích nghi tự động với môi trường, từ đó thực hiện các tác vụ phức tạp như nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên, đánh giá tình huống và đưa ra quyết định.

❖ AI được phân thành hai loại chính:

AI mạnh (Strong AI) là loại trí tuệ nhân tạo có khả năng tự học và hiểu môi trường giống như con người Nó có thể giải quyết những vấn đề phức tạp và thực hiện nhiều nhiệm vụ đa dạng mà con người có khả năng làm được.

AI yếu, hay còn gọi là Weak AI, là loại trí tuệ nhân tạo được phát triển để thực hiện những nhiệm vụ cụ thể mà nó đã được lập trình hoặc học từ dữ liệu Tuy nhiên, AI yếu không có khả năng tự hiểu hay tự học một cách toàn diện như AI mạnh.

2.3.1 Mạng nơ ron truy hồi (RNN - Recurrent Neural Network)

Mạng Nơ-ron Tái phát (RNN) là một loại mạng nơ-ron nhân tạo quan trọng trong lĩnh vực Trí tuệ Nhân tạo (AI) và Học máy RNN được thiết kế để xử lý và phân tích dữ liệu theo chuỗi, cho phép nó ghi nhớ thông tin từ các bước trước đó, điều này rất hữu ích trong các tác vụ như nhận diện giọng nói và xử lý ngôn ngữ tự nhiên Với khả năng học hỏi từ dữ liệu liên tiếp, RNN đã trở thành một công cụ mạnh mẽ trong việc phát triển các ứng dụng thông minh.

RNN (Mạng nơ-ron hồi tiếp) được thiết kế đặc biệt để xử lý dữ liệu chuỗi và dữ liệu có mối quan hệ thời gian, cho phép thông tin từ các bước trước ảnh hưởng đến dự đoán ở bước hiện tại Chẳng hạn, trong việc dự đoán hành động trong video, RNN có khả năng mang thông tin từ các frame trước đến các frame sau, và ở frame cuối, nó tổng hợp tất cả các thông tin để dự đoán hành động trong video một cách chính xác.

Khác với mạng nơ-ron tiêu chuẩn, RNN (Recurrent Neural Network) có khả năng xử lý dữ liệu theo thứ tự và duy trì trạng thái ẩn, giúp lưu trữ thông tin từ các bước trước trong chuỗi Trạng thái ẩn này đóng vai trò như "bộ nhớ" ngắn hạn của RNN, cho phép mạng học cách xử lý các mối quan hệ phụ thuộc theo thời gian trong dữ liệu.

Hình 2.9 Mạng nơ ron truy hồi với vòng lặp

Kiến trúc của mạng nơ ron truy hồi được mô tả trong hình trên, trong đó đầu vào là véc tơ 𝐱 𝐭 và đầu ra là giá trị ẩn ℎ 𝑡 Đầu vào được kết nối với thân mạng nơ ron A, có tính chất truy hồi, và thân này dẫn đến đầu ra ℎ 𝑡.

Vòng lặp A trong thân mạng nơ ron là yếu tố quan trọng trong nguyên lý hoạt động của mạng nơ ron truy hồi Nó bao gồm chuỗi sao chép nhiều lần của cùng một kiến trúc, cho phép các thành phần kết nối liền mạch theo mô hình chuỗi Đầu ra của vòng lặp trước trở thành đầu vào của vòng lặp sau, và nếu trải phẳng thân mạng nơ ron A, ta sẽ thu được một mô hình dạng.

Hình 2.10 Cấu trúc trải phẳng của mạng nơ ron truy hồi

Kiến trúc mạng nơ ron truy hồi đã chứng minh sự hiệu quả trong nhiều ứng dụng deep learning, bao gồm nhận diện giọng nói, mô hình ngôn ngữ, dịch thuật và chú thích hình ảnh.

Hạn chế lớn nhất của mạng nơ-ron truy hồi (RNN) là khả năng xử lý các phụ thuộc dài hạn trong dữ liệu Khi thông tin từ quá khứ cần được giữ lại để hiểu các sự kiện hiện tại, RNN thường gặp khó khăn Đặc biệt, khi chuỗi thời gian trở nên dài, mạng RNN khó duy trì thông tin và học được các mối quan hệ phức tạp trong dữ liệu.

Một trong những nguyên nhân chính gây ra vấn đề trong huấn luyện mạng RNN là hiện tượng triệt tiêu đạo hàm (vanishing gradient problem) khi lan truyền ngược (backpropagation) Khi mạng RNN làm việc với các chuỗi dài, đạo hàm của hàm mất mát có thể trở nên rất nhỏ, gây khó khăn trong việc cập nhật trọng số (weights) của mạng Hệ quả là mạng không thể học được các phụ thuộc dài hạn trong dữ liệu một cách hiệu quả.

Một giải pháp hiệu quả để giải quyết vấn đề này là sử dụng mạng LSTM (Long Short-Term Memory), một biến thể của RNN được tối ưu hóa để lưu trữ và duy trì thông tin trong thời gian dài mà không gặp phải hiện tượng triệt tiêu đạo hàm Cơ chế đặc biệt của LSTM cho phép mạng học và nhận diện các phụ thuộc dài hạn trong dữ liệu một cách hiệu quả hơn.

2.3.2 Mạng trí nhớ ngắn hạn định hướng dài hạn (LSTM - Long short term memory)

Long Short-Term Memory (LSTM) là kiến trúc mạng nơ-ron tái phát (RNN) được thiết kế để khắc phục vấn đề biến mất gradient trong huấn luyện mạng nơ-ron với chuỗi dài hoặc mối quan hệ thời gian LSTM đã được giới thiệu nhằm giải quyết vấn đề này và hiện là thành phần quan trọng trong nhiều ứng dụng học máy và trí tuệ nhân tạo.

Mạng trí nhớ ngắn hạn định hướng dài hạn (LSTM) là một kiến trúc đặc biệt của RNN, được giới thiệu bởi Hochreiter & Schmidhuber vào năm 1997, có khả năng học các phụ thuộc dài hạn LSTM đã khắc phục nhiều hạn chế của RNN, đặc biệt là vấn đề triệt tiêu đạo hàm, mặc dù cấu trúc của nó phức tạp hơn Điểm nổi bật của LSTM là khả năng duy trì trạng thái bộ nhớ, cho phép ghi nhớ và sử dụng thông tin từ các bước trước trong chuỗi dữ liệu Trạng thái bộ nhớ này được cập nhật thông qua các cổng trong mạng LSTM, bao gồm cổng quên và cổng đầu vào.

Cổng vào (input gate), cổng quên (forget gate) và cổng đầu ra (output gate) trong LSTM cho phép mô hình quyết định thông tin nào cần được lưu trữ và thông tin nào cần bị loại bỏ.

Một mạng RNN tiêu chuẩn sẽ có kiến trúc rất đơn giản chẳng hạn như đối với kiến trúc gồm một tầng ẩn là hàm tanh như bên dưới

Kết luận chương 2

Trong chương 2, tôi đã phân tích và thực nghiệm để khám phá khả năng ứng dụng của OpenCV và MediaPipe trong việc theo dõi chuyển động cơ thể Cả hai công nghệ này thể hiện sức mạnh và tiềm năng lớn trong việc phục vụ cho mục tiêu nghiên cứu của tôi.

OpenCV là một công cụ mạnh mẽ trong xử lý hình ảnh và phát hiện chuyển động Nó có khả năng theo dõi đối tượng, xác định các điểm chuyển động và phân tích biểu đồ màu để nhận diện vị trí và hành vi của các phần tử cơ thể.

MediaPipe tích hợp trí tuệ nhân tạo và xử lý dữ liệu đa phương tiện, cho thấy khả năng ấn tượng trong việc theo dõi và phân tích chuyển động từ video và âm thanh Nó cung cấp các công cụ và thư viện hữu ích để nắm bắt chính xác chuyển động cơ thể, làm nổi bật thông tin quan trọng.

Do đó OPENCV Và MEDIAPIPE có khả năng ứng dụng trong việc theo dõi chuyển động cơ thể

XÂY DỰNG HỆ THỐNG VÀ CHẠY THỬ NGHIỆM

Xây dựng hệ thống phần mềm

3.1.1 Bước 1 Cài đặt thư viện của ngôn ngữ Python

Chương trình áp dụng các thư viện và công cụ phổ biến trong lĩnh vực khoa học dữ liệu, học máy và xử lý ảnh, giúp tối ưu hóa quy trình phân tích và xử lý dữ liệu.

• MediaPipe: MediaPipe là một thư viện mã nguồn mở được phát triển bởi

Google cung cấp một bộ công cụ và thư viện đa dạng cho việc xử lý và phân tích dữ liệu đa phương tiện, bao gồm video và âm thanh Trong số đó, MediaPipe tích hợp nhiều mô hình học máy đã được huấn luyện, cho phép thực hiện các nhiệm vụ như nhận dạng khuôn mặt, theo dõi đối tượng và phân tích chuyển động.

Pandas là một thư viện mã nguồn mở trong Python, được sử dụng rộng rãi cho việc xử lý và phân tích dữ liệu Thư viện này cung cấp các cấu trúc dữ liệu mạnh mẽ, như DataFrame, cho phép thực hiện các thao tác như lọc, sắp xếp và tổng hợp dữ liệu Với tính năng vượt trội, Pandas thường được áp dụng trong lĩnh vực khoa học dữ liệu và phân tích dữ liệu.

OpenCV-Python-Headless là một phiên bản của thư viện OpenCV, chuyên về xử lý hình ảnh và thị giác máy tính, được cung cấp dưới dạng gói Python không có giao diện đồ họa Phiên bản này thường được sử dụng trong các ứng dụng không cần hiển thị hình ảnh trực tiếp trên giao diện người dùng, giúp tối ưu hóa hiệu suất và tài nguyên cho các tác vụ xử lý hình ảnh tự động.

TensorFlow là một thư viện mã nguồn mở do Google phát triển, chuyên dùng cho máy học và trí tuệ nhân tạo Thư viện này cung cấp nền tảng mạnh mẽ để xây dựng, huấn luyện và triển khai các mô hình học máy, đặc biệt là mạng nơ-ron sâu TensorFlow được áp dụng rộng rãi trong nghiên cứu cũng như trong các ứng dụng thực tế trong lĩnh vực học máy.

• Scikit-Learn: Scikit-Learn, hoặc sklearn, là một thư viện mã nguồn mở trong

Python là ngôn ngữ lập trình lý tưởng cho machine learning và data mining, cung cấp nhiều công cụ và thuật toán cho các nhiệm vụ như phân loại, hồi quy, phân cụm và giảm chiều dữ liệu Trong số đó, Scikit-Learn nổi bật như một thư viện mạnh mẽ và phổ biến trong lĩnh vực học máy và khoa học dữ liệu.

3.1.2 Bước 2 Thu thập dữ liệu để huấn luyện

Hình 3.2 Quay video quá trình đi lên xuống cầu thang

Để tối ưu hóa quá trình máy học, bước đầu tiên là lựa chọn góc nhìn cầu thang thuận lợi nhất Tiếp theo, cần xác định thông tin mô hình học và thực hiện dự đoán từ dữ liệu hình ảnh.

Hình 3.3 Chương trình tách khung hình video thành ảnh

Để phân tích chuyển động tập đi lên xuống cầu thang, em đã tạo một tập dữ liệu bằng cách quay video quá trình này Tập dữ liệu được xây dựng với quy mô lớn và đa dạng, nhằm giúp mô hình học được các biến thể khác nhau Em sử dụng chương trình để tách video 5 phút thành gần 10.000 khung hình ảnh, từ đó phục vụ cho việc nghiên cứu và phân tích.

Hình 3.4 Hình ảnh được tách ra từ video

Trong quá trình đánh dấu (Annotation), tôi sẽ tiến hành gán nhãn cho hình ảnh Đối tượng nghiên cứu trong bài toán này được xác định gồm 4 phần.

▪ Bước LÊN cầu thang bằng chân TRÁI (Up_Left)

▪ Bước LÊN cầu thang bằng chân PHẢI (Up_Right)

▪ Bước XUỐNG cầu thang bằng chân TRÁI (Down_Left)

▪ Bước XUỐNG cầu thang bằng chân PHẢI (Down _Right)

Dữ liệu đã đánh dấu được tổ chức thành 4 thư mục riêng biệt, mỗi thư mục lưu trữ chuỗi hình ảnh của 4 chuyển động khác nhau.

Sau khi đánh dấu một số hình ảnh, tôi tiến hành kiểm tra và đánh giá một cách kỹ lưỡng để đảm bảo rằng việc gán nhãn được thực hiện chính xác và đầy đủ.

• Chia tập dữ liệu: Cuối cùng em chia tập dữ liệu thành ba phần: huấn luyện

(training), xác thực (validation), và kiểm tra (testing) để đánh giá hiệu suất của mô hình

Sử dụng tập dữ liệu đã được đánh chú thích để huấn luyện mô hình máy học là bước quan trọng cuối cùng trong quá trình phát triển.

Quá trình đánh dấu dữ liệu là phức tạp và đòi hỏi sự cẩn trọng, nhưng chất lượng của dữ liệu này rất quan trọng cho hiệu suất của mô hình Sau khi hoàn tất việc Annotation, tôi sẽ sử dụng các thư viện học máy như Mediapipe và OpenCV-Python để xử lý và trích xuất đặc trưng từ ảnh, sau đó áp dụng mô hình machine learning để huấn luyện.

3.1.3 Bước 3 Sử dụng MediaPipe để đọc ra tọa độ các điểm landmarks

Sau khi hoàn tất quá trình Annotation, tôi đã sử dụng thư viện MediaPipe để xác định các điểm landmarks trên hình ảnh liên quan đến bốn chuyển động lên xuống cầu thang Những điểm landmarks này giúp mô tả các đặc trưng của chân, từ đó cung cấp thông tin quan trọng cho việc phân tích chuyển động.

MediaPipe cung cấp các mô hình Machine Learning tiên tiến, đặc biệt là các mô hình tracking, giúp nhận diện và xác định tọa độ các điểm landmarks trên hình ảnh một cách chính xác và nhanh chóng Việc nhận dạng các cử chỉ và tư thế của người bệnh khi tập đi lên xuống cầu thang là rất quan trọng trong quá trình phục hồi chức năng.

Hình 3.5 Sử dụng MediaPipe để đọc ra tọa độ các điểm landmarks

Kết quả thực nghiệm

Hình 3.8 Biểu đồ kết quả quá trình tập luyện của một bệnh nhân

Dữ liệu luyện tập đi lên và xuống cầu thang của người bệnh đã được phân tích để theo dõi sự tiến bộ và thay đổi theo thời gian Phân tích biểu đồ hình 3.8 cho thấy những điểm quan trọng liên quan đến sự cải thiện trong khả năng di chuyển của bệnh nhân Những thay đổi này không chỉ phản ánh sự tiến bộ trong quá trình phục hồi mà còn góp phần nâng cao chất lượng cuộc sống của người bệnh.

Dữ liệu cho thấy thời gian trung bình mà người bệnh mất để thực hiện một bước chân (theo giây) cho cả chân phải và chân trái đang giảm dần theo thời gian Đặc biệt, từ ngày 10/09/2023 đến ngày 16/09/2023, sự cải thiện này rõ rệt hơn, cho thấy khả năng thực hiện các bước chân của người bệnh đang được nâng cao.

Dữ liệu về chân phải và chân trái được phân chia thành hai phần riêng biệt, cho phép chúng ta so sánh thời gian tập luyện trung bình của từng chân Kết quả cho thấy thời gian trung bình của chân phải và chân trái tương đồng, và cả hai đều có xu hướng giảm theo thời gian, điều này giúp đánh giá sự phát triển của từng chân một cách hiệu quả.

Dữ liệu cho thấy sự thay đổi theo thời gian của thời gian tập luyện, với sự giảm dần thời gian này có thể là dấu hiệu tích cực Điều này cho thấy bệnh nhân đang cải thiện khả năng di chuyển lên xuống cầu thang.

Dữ liệu này cung cấp thông tin quan trọng về tiến trình phục hồi của người bệnh, cho thấy sự cải thiện liên tục trong khả năng di chuyển thông qua việc giảm thời gian tập luyện Sự tương đồng giữa hai chân cũng chỉ ra sự ổn định trong quá trình phục hồi.

Ngày đăng: 07/12/2024, 15:20

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w