Các thành phần chính của camera 3D Kinect

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng thuật toán nhận dạng chuyển động của người trong môi trường 3d để huấn luyện cho robot chơi cầu lông (Trang 27 - 29)

2.1 Tìm hiểu về camera 3D Kinect của Microsoft

2.1.2 Các thành phần chính của camera 3D Kinect

Bên trong Kinect bao gồm 1 camera RGB, cảm biến độ sâu , một dãy các microphone và 1 động cơ điều khiển góc nâng.

Hình 2.1: Ảnh màu và ảnh độ sâu thu được từ camera Kinect

- Camera ảnh màu: là một camera RGB thơng thường có độ phân giải 640x480, có tốc độ khung hình là 30 fps (30 khung hình trên 1s). Với ảnh màu (ảnh11 RGB) thu được, Kinect có thể bắt ảnh của người dùng trong ứng dụng phát hiện người, hệ thống an ninh và nhiều ứng dụng khác.

- Cảm biến độ sâu: gồm có một thiết bị chiếu tia hồng ngoại (IR projector) kết hợp với cảm biến hồng ngoại, cho phép thu thập dữ liệu độ sâu. Khoảng hoạt động của cảm biến độ sâu có thể được điều khiển bởi nhà sản xuất hoặc bên nhà phát triển thứ ba dựa vào yêu cầu của người dùng. Có 2 phạm vi độ sâu mà cảm biến Kinect

hỗ trợ:

+ Phạm vi mặc định: có sẵn trong cả hai bộ cảm biến Kinect cho Windows và cảm biến Kinect cho Xbox 360. Khoảng hoạt động ở phạm vi mặc đinh là từ 0,8 m đến 4m.

+ Phạm vi gần: chỉ có trong cảm biến Kinect cho Windows. Khoảng hoạt động ở phạm vi gần là từ 0,4 m đến 3m.

Hình 2.3: Phạm vi độ sâu của cảm biến Kinect

- Dãy đa microphone: Thiết bị Kinect hỗ trợ tuyệt vời cho âm thanh với sự trợ giúp của một dãy microphone. Dãy microphone này bao gồm 4 microphone hoạt động ở

bên phải và 1 chiếc còn lại được đặt ở bên trái ở phía cuối của thiết bị). Dãy Microphone này được dùng trong các ứng dụng điều khiển bằng giọng nói. Mục đích của dãy microphone khơng chỉ là thiết bị lấy âm thanh mà cịn là xác hướng của âm thanh tới. Ưu điểm chính của việc có một dãy microphone hơn việc chỉ có 1 microphone là việc bắt và nhận giọng nói được hỗ trợ tốt hơn với cơ chế giảm ồn, cắt tiếng vang và cơng nghệ hình thành chùm âm thanh. Nó cho phép thiết bị Kinect có thể là microphone 2 chiều có thể xác định nguồn của âm và nhận diện ra nhiễu và tiếng vang của môi trường. Video conferencing (hội nghị truyền hình: sử dụng camera để giao tiếp giữa các nước với nhau hoặc giữa công ty mẹ với các công ty thành viên trên khắp thế giới, hoặc giao tiếp giữa khách hàng và các nhà cung cấp ở các quốc gia, gặp nhiều khách hàng cùng một thời điểm,…) ở văn phòng hay ở nhà cũng là một ứng dụng cực kỳ nỗi bật của dãy microphone này kết hợp với tính năng ảnh màu (ảnh RGB).

- Động cơ điều khiển góc ngẩng: là động cơ DC khá nhỏ, nằm ở đế của cảm biến Kinect. Nó có khả năng làm cho cảm biến Kinect hướng đầu lên trên cao và hạ xuống thấp lên tới 270. Với khả năng này sẽ giúp cho cảm biến có thể thu được hình ảnh tốt hơn rất nhiều so với khi khơng có bộ động cơ.

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng thuật toán nhận dạng chuyển động của người trong môi trường 3d để huấn luyện cho robot chơi cầu lông (Trang 27 - 29)

Tải bản đầy đủ (PDF)

(80 trang)