Tầm nhìn máy tính là khoa học và công nghệ của máy móc mà có thể nhìn được. Như một môn khoa học, tầm nhìn máy tính có liên quan với lý thuyết đằng sau hệ thống nhân tạo lấy thông tin từ các hình ảnh. Các dữ liệu hình ảnh có thể có nhiều hình thức, chẳng hạn như chuỗi video, quan sát từ nhiều máy ảnh, hoặc dữ liệu đa chiều từ một máy quét y tế.
Mặt khác tầm nhìn máy tính nghiên cứu và mô tả các quá trình thực hiện trong phần mềm và phần cứng đằng sau hệ thống thị giác nhân tạo. Phần mềm theo dõi cử chỉ của người dùng sử dụng các thuật toán dựa trên máy tính tầm nhìn. Tầm nhìn máy tính, trong một số cách, nghịch đảo của đồ họa máy tính. Trong khi đồ họa máy tính cung cấp dữ liệu hình ảnh từ các mô hình 3D, tầm nhìn máy tính thường tạo ra mô hình 3D từ dữ liệu hình ảnh. Ngoài ra còn có một xu hướng hướng tới một sự kết hợp của hai ngành học khác, ví dụ như những khám phá trong tăng cường thực tế (AR).
Các lĩnh vực liên quan chặt chẽ nhất đến tầm nhìn máy tính là xử lý hình ảnh, phân tích hình ảnh và thị giác máy. Xử lý hình ảnh và phân tích hình ảnh có xu hướng tập trung vào hình ảnh 2D, làm thế nào để chuyển đổi một hình ảnh thành hình ảnh khác. Đặc tính này có nghĩa là xử lý / phân tích hình ảnh mà không yêu cầu giả định hoặc giải
chiếu lên một hoặc một số hình ảnh, ví dụ: làm thế nào để tái tạo lại cấu trúc hoặc các thông tin khác về các cảnh 3D từ một hoặc một số hình ảnh. Máy quan sát có xu hướng tập trung vào các ứng dụng, chủ yếu trong sản xuất, ví dụ như, tầm nhìn dựa trên robot tự động và hệ thống kiểm tra dựa trên tầm nhìn hoặc đo lường.
Hệ thống thị giác máy tính theo dõi và ghi nhận các tư thế tay điều khiển các bản chọn dựa trên sự kết hợp của tính năng phát hiện màu sắc đa quy mô, tầm nhìn dựa trên mô hình phân cấp tay và lọc hạt. Các tư thế tay hoặc trạng thái được thể hiện trong các mục của hệ thống phân cấp tính năng hình ảnh màu sắc đa quy mô ở các quy mô khác nhau, với chất lượng liên quan về quy mô, vị trí và định hướng. Trong mỗi hình ảnh, phát hiện các đặc điểm màu sắc đa qui mô được thực hiện. Sau đó các tư thế tay được phát hiện và theo dõi đồng thời sử dụng bộ lọc hạt (particle filtering), với một phần mở rộng lấy mẫu lớp gọi là mẫu phân cấp lớp. Để cải thiện hiệu suất của hệ thống, màu da được bao gồm trong bộ lọc hạt.