Tương tác giữa con người với nhau thường là tương tác đa hình thức. Một trong những lý do mà chúng ta cần tới tương tác đa phương thức bởi vì tương tác bằng giọng nĩi khơng phải lúc nào cũng thể hiện hết được ý con người muốn diễn đạt. Một ví dụ đơn giản là khi chúng ta nĩi “Đặt vào đây” thì người nghe sẽ khơng biết đây là chỗ nào. Khi đĩ người nĩi cần kết hợp với cử chỉ của cánh tay để chỉ vị trí cần đặt. Như vậy con người cần cĩ thêm những cử chỉ trong giao tiếp để thể hiện được ý nghĩ và cảm xúc của họ. Những ngơn ngữ của cơ thể như cử chỉ là những biểu hiện đơn giản nhưng chứa nhiều thơng tin về trạng thái cảm xúc và ý nghĩ của con người. Tương tác người và robot cũng là một loại giao tiếp vì vậy mà nĩ khơng thể chỉ sử dụng những tương tác đơn lẻ mà cần cĩ nhiều phương thức khác nhau để
Chương 4: Mơ hình tương tác người-robot
- 58 -
tiến tới mức độ tự nhiên trong giao tiếp như con người với nhau. Mơ-đun tương tác đa phương thức ra đời nhằm giải quyết vấn đề này. Sự tích hợp nhiều thơng tin thu được từ các loại cảm biến khác nhau và duy trì sự liên kết giữa các thơng tin là nhiệm vụ chính của mơ-đun này.
Cĩ 2 vấn đề quan trọng cần được quan tâm trong tương tác đa hình thức
- Thứ nhất: Hình thức tương tác nào được chọn để sử dụng và bằng cách nào chúng ta sử dụng chúng
- Thứ hai: Bằng cách nào tích hợp các đầu vào của các hình thức tương tác này theo một cách thống nhất.
Đối với vấn đề thứ nhất robot của chúng ta sử dụng các hình thức giao tiếp qua hình ảnh, âm thanh, và xúc giác (haptic). Thêm vào đĩ, chúng ta sử dụng các đầu vào số như là các lệnh từ giao diện người dùng (GUI) và các cảm biến khác như cảm biến nhiệt độ, cảm biến đo sức khỏe của người dùng. Robot này cũng cĩ thể thể hiện suy nghĩ và trạng thái của nĩ sử dụng các giao tiếp ngơn ngữ, cử chỉ, hay các biểu hiện đơn giản và cĩ thể hiển thị trên màn hình.
Đối với vấn đề thứ 2, mơ-đun giao tiếp đa hình thức phải chọn một số hình thức giao tiếp nhất định để giảm lượng thơng tin từ các đầu vào và tách biệt cũng như đánh trọng số cho các đầu vào tại mỗi thời điểm [9]. Do kết quả nhận dạng từ các phương thức này đơi khi xung đột với các phương thức khác vì vậy việc chọn các đầu vào là cơng việc cĩ ý nghĩa quyết định. Một cách lựa chọn các tiêu chuẩn cho các đầu vào là dựa vào việc phân tích kịch bản. Do đĩ cĩ sự thống nhất hoặc là thơng tin hữu ích của tình huống hiện tại được chọn và xử lý. Sau khi lựa chọn, các đầu vào cĩ thể được đánh trọng số tương ứng và mức độ quan trọng của nĩ và tích hợp trong một đầu vào duy nhất.
Dựa theo luồng thơng tin mơ-đun tương tác đa phương thức được chia làm 2 mơ-đun nhỏ là Input Modalities và Output Modalities.
Chương 4: Mơ hình tương tác người-robot
- 59 -
- Input Modalities nhận các thơng tin đa phương tiện từ các cảm biến và tổng hợp thành đầu vào duy nhất là thơng tin đầu vào cho các mơ-đun sau
- Output Modalities là những thơng tin đa phương tiện được robot tổng hợp từ những thơng từ đầu vào, thơng tin từ các mơ-đun khác để phản hồi tới người dùng
Hình 4.1: Các mơ đun con của mơ đun tương tác người-robot đa phương thức