Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 18 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
18
Dung lượng
606,5 KB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN ĐIỆN BÁOCÁO NHẬP MÔN ĐIỆN CHỦ ĐỀ: PERCEPTIVE COMPUTING Nhóm sinh viên: Nguyễn Văn Tới Bùi Đức Thịnh Lều Như Tình Lê Khắc Trường Lớp: Điện 9 Giáo viên hướng dẫn: TS. Nguyễn Hoàng Nam 11/2011 MỤC LỤC Viết tắt Hình vẽ Bảng Lời mở đầu Perceptive computing (Nhận thức máy tính): Là một lĩnh vực mới để kết hợp nhận thức và thị giác, tầm nhìn và trực quan. Nó là một mô phỏng tính toán của con người cái nhìn sâu sắc hay trực giác trong phân tích dữ liệu lớn, giải quyết vấn đề và học tập. Nhận thức của con người có thể nắm bắt các mô hình phức tạp, các mối quan hệ và các ngoại lệ trong một bộ dữ liệu. Nhận thức máy tính là một lĩnh mới để kết hợp nhận thức thị giác, tầm nhìn và trực quan. Nó là một mô phỏng tính toán cái nhìn sâu sắc hay trực giác trong phân tích dữ liệu lớn, giải quyết vấn đề và học tập của con người. Nhận thức của con người có thể nắm bắt các mô hình phức tạp, các mối quan hệ và các ngoại lệ trong một bộ dữ liệu. Nhận thức máy tính là một cách để tóm tắt, tách rời dữ liệu vào bộ phận quan trọng và thông qua bản tóm tắt thông tin cho các cơ quan quyết định. Tuy nhiên, nhiều thuật toán "trực quan" không thể mở rộng. Trong nhiều trường hợp, chúng ta phải thỏa hiệp các yếu tố như: tính chính xác, quy mô và tốc độ, hoặc sử dụng triệt để phương pháp tiếp cận như chiều nén, ngẫu nhiên, v v Đây là một dự án theo định hướng khóa học tiên tiến. Mục tiêu của lớp học là phát triển các thuật toán có tầm nhìn mới để giải quyết các vấn đề thế giới thực. Cách thức thu thông tin: Bằng các sensor (cảm biến) Sensor: Một thiết bị phản ứng với một kích thích vật lý (nhiệt, ánh sáng, âm thanh, áp lực, từ tính hoặc chuyển động cụ thể) và truyền xung (như đối với đo lường hoặc một hoạt động điều khiển) Cảm biến là một thiết bị có chức năng thu nhận và đáp ứng tín hiệu. Cảm biến đo những thay đổi rất nhỏ nên có sự nhạy cảm cao. Vd: Cảm biến quang điện (Photoelectric sensors), cảm biến tiệm cận (Proximity sensors), cảm biến áp suất (Pressure sensors), cảm biến phát hiện bằng siêu âm (Ultrasonic sensors) … Nhận dạng giọng nói Nhận dạng tiếng nói là một quá trình nhận dạng mẫu, với mục đích là phân lớp (classify) thông tin đầu vào là tín hiệu tiếng nói thành một dãy tuần tự các mẫu đã được học trước đó và lưu trữ trong bộ nhớ. Các mẫu là các đơn vị nhận dạng, chúng có thể là các từ, hoặc các âm vị. Nếu các mẫu này là bất biến và không thay đổi thì công việc nhận dạng tiếng nói trở nên đơn giản bằng cách so sánh dữ liệu tiếng nói cần nhận dạng với các mẫu đã được học và lưu trữ trong bộ nhớ. Khó khăn cơ bản của nhận dạng tiếng nói đó là tiếng nói luôn biến thiên theo thời gian và có sự khác biệt lớn giữa tiếng nói của những người nói khác nhau, tốc độ nói, ngữ cảnh và môi trường âm học khác nhau. Xác định những thông tin biến thiên nào của tiếng nói là có ích và những thông tin nào là không có ích đối với nhận dạng tiếng nói là rất quan trọng. Đây là một nhiệm vụ rất khó khăn mà ngay cả với các kỹ thuật xác suất thống kê mạnh cũng khó khăn trong việc tổng quát hoá từ các mẫu tiếng nói những biến thiên quan trọng cần thiết trong nhận dạng tiếng nói. Các nghiên cứu về nhận dạng tiếng nói dựa trên ba nguyên tắc cơ bản: Tín hiệu tiếng nói được biểu diễn chính xác bởi các giá trị phổ trong một khung thời gian ngắn (short-term amplitude spectrum). Nhờ vậy ta có thể trích ra các đặc điểm tiếng nói từ những khoảng thời gian ngắn và dùng các đặc điểm này làm dữ liệu để nhận dạng tiếng nói. Nội dung của tiếng nói được biểu diễn dưới dạng chữ viết, là một dãy các ký hiệu ngữ âm. Do đó ý nghĩa của một phát âm được bảo toàn khi chúng ta phiên âm phát âm thành dãy các ký hiệu ngữ âm. Nhận dạng tiếng nói là một quá trình nhận thức. Thông tin về ngữ nghĩa (semantics) và suy đoán (pragmatics) có giá trị trong quá trình nhận dạng tiếng nói, nhất là khi thông tin về âm học là không rõ ràng. Các cách tiếp cận nhận dạng tiếng nói bằng thống kê bao gồm: sử dụng mô hình Markov ẩn, mạng nơ-ron, sử dụng cơ sở tri thức, v.v Khu vực hoạt động: room, building, district… Quản lý: computer + wireless network Phân tích các tín hiệu liên tục → Quyết định, điều khiển: Alarms, vocal answer… Xây dựng mạng cảm biến [...]... tin về ngữ nghĩa (semantics) và suy đoán (pragmatics) có giá trị trong quá trình nhận dạng tiếng nói, nhất là khi thông tin về âm học là không rõ ràng Các cách tiếp cận nhận dạng tiếng nói bằng thống kê bao gồm: sử dụng mô hình Markov ẩn, mạng nơ-ron, sử dụng cơ sở tri thức, v.v Multimodal Interfaces Dự án này liên quan đến sự phát triển của thư viện phần mềm để kết hợp đa phương thức đầu vào vào giao... tương tác của con người với một sự pha trộn trực quan bằng giọng nói, cử chỉ, ánh mắt, lời nói và chuyển động cơ thể Thiết kế giao diện sẽ có thể sử dụng phần mềm này cho cả hai sự hiểu biết trình độ cao và thấp của các đầu vào đa phương thức và thế hệ của các phản ứng thích hợp Tài liệu tham khảo Phụ lục . chức năng thu nhận và đáp ứng tín hiệu. Cảm biến đo những thay đổi rất nhỏ nên có sự nhạy cảm cao. Vd: Cảm biến quang điện (Photoelectric sensors), cảm biến tiệm cận (Proximity sensors), cảm. là khi thông tin về âm học là không rõ ràng. Các cách tiếp cận nhận dạng tiếng nói bằng thống kê bao gồm: sử dụng mô hình Markov ẩn, mạng nơ-ron, sử dụng cơ sở tri thức, v.v Khu vực hoạt động:. là khi thông tin về âm học là không rõ ràng. Các cách tiếp cận nhận dạng tiếng nói bằng thống kê bao gồm: sử dụng mô hình Markov ẩn, mạng nơ-ron, sử dụng cơ sở tri thức, v.v Multimodal Interfaces Dự