1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu nhân bản chuyển động khuôn mặt trên các mô hình khuôn mặt 3D khác nhau

82 509 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 82
Dung lượng 3,04 MB

Nội dung

Thứ nhất, khi tạo hoạt ảnh với những mô hình khuôn mặt khác nhau, chúng ta có thể giữ được một mô hình khuôn mặt cố định với số đỉnh và số đa giác được xác định trước.. Chương 1 giới thi

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

ĐẶNG TUẤN ANH

NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG

KHUÔN MẶT TRÊN CÁC MÔ HÌNH KHUÔN MẶT 3D KHÁC NHAU

Ngành: Công nghệ Thông tin Chuyên ngành: Công nghệ Phần mềm

Trang 2

MỤC LỤC

MỞ ĐẦU 1

CHƯƠNG 1 TỔNG QUAN VỀ KHUÔN MẶT VÀ HOẠT ẢNH CỦA KHUÔN MẶT 3D 3

1.1 Giới thiệu 3

1.2 Các kỹ thuật hiện có được sử dụng để tạo mô hình và làm hoạt ảnh khuôn mặt 3D 4

1.2.1 Tạo mô hình khuôn mặt 5

1.2.2 Tạo mô hình hoạt ảnh của khuôn mặt 10

1.2.3 Môi 16

1.3 Một mô hình khuôn mặt 3D cho ứng dụng thời gian thực 17

1.3.1 Lưới mặt 19

1.3.2 Mô hình môi 21

1.4 Các cơ làm khuôn mặt hoạt ảnh 22

1.4.1 Các cơ vectơ 24

1.4.2 Cơ vòng miệng 30

1.4.3 Cơ vòng mắt 31

1.4.4 Xoay quai hàm 31

1.4.5 Xoay tròng mắt 32

1.5 Kết quả thực nghiệm 33

1.6 Kết luận chương 35

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT NỀN TẢNG 36

2.1 Giới thiệu 36

2.2 Các nghiên cứu trước đây về việc chuyển hoạt ảnh khuôn mặt 37

2.2.1 Nhân bản biểu hiện 37

2.2.2 Dịch chuyển các bảng hoạt ảnh khuôn mặt MPEG-4 39

2.2.3 Chuyển một cấu trúc khuôn mặt nhiều lớp 39

2.3 Mạng RBF và các thuật toán di truyền học 40

2.3.1 Mạng RBF 40

2.3.2 Các thuật toán di truyền học 45

Trang 3

CHƯƠNG 3 XÂY DỰNG MÔ HÌNH KHUÔN MẶT 3D TỪ MỘT KHUÔN MẶT

GỐC 49

3.1 Giới thiệu 49

3.2 Mô tả phương pháp biến đổi khuôn mặt 3D 50

3.3 Các mạng RBF 51

3.4 Hàm sai số 52

3.5 Sử dụng GA điều chỉnh các điểm đánh dấu 55

3.5.1 Nhiễm sắc thể 56

3.5.2 Hàm thích nghi (Fitness function) 57

3.5.3 Phép lai ghép (Crossover) 57

3.5.4 Đột biến (Mutation) 58

3.5.5 Phép toán bổ sung (Additional Operation) 58

3.6 Quy trình biến đổi khuôn mặt 3D 59

3.7 Một công cụ biến đổi khuôn mặt 3D 60

3.7.1 Tạo mô hình khuôn mặt 3D bằng Poser 5 60

3.7.2 Công cụ biến đổi 64

KẾT LUẬN 69

TÀI LIỆU THAM KHẢO 70

PHỤ LỤC 74

Trang 4

DANH MỤC VIẾT TẮT

AMA Abstract Muscle Action Hành động cơ trừu tƣợng FAP Facial Animation Parameter Tham số hoạt ảnh mặt FAT Face Animation Table Bảng hoạt ảnh khuôn mặt FFD Free Form Deformation Biến đổi dạng tự do

GA Genetic Algorithms Các thuật toán di truyền học RBF Radial Basis Function Hàm cơ sở bán kính

RFFD Rational Free Form Deformation Biến đổi dạng tự do hợp lý

Trang 5

DANH MỤC CÁC BẢNG

Bảng 1.1: Các cơ trên mô hình khuôn mặt (ở phần khuôn mặt bên phải) 23 Bảng 1.2: Kết quả của việc áp dụng các kỹ thuật tăng tốc độ hoạt ảnh (trên một máy tính Pentium III, 800 Mhz, 256MB RAM, Nvidia GeForce3 video card) 29

Trang 6

DANH MỤC CÁC HÌNH VẼ

Hình 1.1: Các mô hình khuôn mặt CANDIDE (trái) và Greta (phải) 7

Hình 1.2: Một bề mặt B-spline 8

Hình 1.3: Mô hình cơ vòng của Waters 14

Hình 1.4: Mô hình cơ phiến của Waters 15

Hình 1.5: Mô hình cơ vectơ của Waters 15

Hình 1.6: Hành động của cơ vòng miệng thực: (a) chìa môi và (b) mím môi 18

Hình 1.7: (a) Khuôn mặt khung lưới cùng các cơ; (b) khuôn mặt bình thường; và (c) hiệu ứng của cơ gò má lớn bên trái 18

Hình 1.8: Chia vùng trên phần khuôn mặt bên phải 20

Hình 1.9: Đôi môi (bên trái) và các điểm điều khiển của môi (bên phải) 22

Hình 1.10: (a) Lưới mặt không có môi; và (b) môi kết hợp với toàn bộ lưới mặt 22

Hình 1.11: Giản đồ các cơ mặt 23

Hình 1.12: Tác động của cơ đơn lên lưới (a và b); Tác động của hai cơ lên lưới (biểu diễn theo từng bước) bằng cách mô phỏng tính chất song song (c,d,e,f) và bằng cách thêm sự biến đổi (g,h,i,j) 25

Hình 1.13: Tác động của ba cơ lên lưới mặt: bằng cách mô phỏng các đường song song (a) và bằng cách thêm sự biến đổi (b) 25

Hình 1.14: Khi có biểu hiện buồn, xử lý sự co cơ đối với cặp lông mày: bằng cách mô phỏng các đường song song (a) và bằng cách thêm sự biến đổi (b) 25

Hình 1.15: Miền chứa các nếp nhăn được tạo bởi sự co rút của một cơ vectơ 27

Hình 1.16: Hàm nếp nhăn 27

Hình 1.17: Bài toán “pháp tuyến đỉnh không biểu diễn” và cách giải 28

Hình 1.18: Các nếp nhăn do sự co cơ tạo nên 28

Hình 1.19: Mô tả hành động của cơ vòng miệng: đẩy môi ra (a); mím môi lại (b) 30

Hình 1.20: Sự biến đổi của môi dưới tác động của sự co cơ vòng miệng: dạng bình thường (a); đẩy môi ra (b) và mím môi lại (c) 31

Hình 1.21: Chỉ nhắm một mắt (a); Nhắm cả hai mắt (b) 31

Hình 1.22: Các góc định hướng mắt 32

Hình 1.23: Vùng nhìn được của mắt 33

Hình 1.24: Khuôn mặt buồn khi có (a) và khi không có (b) các nếp nhăn và việc xử lý hành động co đa cơ 33

Trang 7

Hình 1.25: Gương mặt ngạc nhiên 34

Hình 1.26: Gương mặt hạnh phúc 34

Hình 1.27: Gương mặt buồn 34

Hình 2.1: Mạng RBF trong xây dựng mô hình chuỗi thời gian 42

Hình 2.2: Mạng RBF trong phân loại mẫu 42

Hình 2.3: Sơ đồ thuật toán di truyền học 46

Hình 3.1: Tổng quan hệ thống khai thác khuôn mặt 50

Hình 3.2: Mô hình khuôn mặt nguồn (4650 đa giác) 53

Hình 3.3: Giao phần giữa một bề mặt của mô hình khuôn mặt với mặt phẳng mẫu 54

Hình 3.4: Cách đặt vị trí các điểm mẫu trên giao phần giữa mặt phẳng mẫu và bề mặt của mô hình khuôn mặt mục tiêu và mô hình khuôn mặt biến đổi 54

Hình 3.5: Một điểm đánh dấu ban đầu và biến thể của nó 56

Hình 3.6: Phép lai ghép đa điểm 58

Hình 3.7: Cách thức hội tụ của quá trình GA: đường nét đứt – các nghiệm được thay thế bởi phép chiếu của chúng lên mô hình khuôn mặt mục tiêu trong suốt quá trình GA; đường liên tục: phép chiếu được sử dụng chỉ để tính hàm sai số và để tạo ra nghiệm cuối cùng 58

Hình 3.8: Quy trình biến đổi khuôn mặt 3D 59

Hình 3.9: Giao diện công cụ Face của Poser 5 60

Hình 3.10: Hai hình ảnh của khuôn mặt: chụp thẳng và chụp bên 61

Hình 3.11: Nạp ảnh và xác định một số vị trí trên gương mặt 62

Hình 3.12: Kết quả thu được sau bước 1 62

Hình 3.13: Texture Variation và công cụ Face Shaping 63

Hình 3.14: Biểu đồ lớp thiết kế của hệ thống 64

Hình 3.15: Giao diện công cụ biến đổi khuôn mặt 3D 66

Hình 3.16: Đưa vào khuôn mặt mục tiêu 67

Hình 3.17: Chọn các điểm đánh dấu trên khuôn mặt mục tiêu 67

Hình 3.18: Kết quả thực nghiệm khi sử dụng công cụ biến đổi khuôn mặt 3D 68

Trang 8

1

MỞ ĐẦU

Hiện nay, phần lớn tương tác giữa con người và máy tính được thực hiện thông qua chuột và bàn phím Cùng với sự phát triển nhanh chóng của đồ họa máy tính và công nghệ ngôn ngữ, các nhà nghiên cứu ngày càng chú ý tới việc đưa sự tương tác này trở nên linh hoạt, thích ứng và hướng tới con người hơn Một cách thực hiện điều này là qua việc tạo ra các agent hiện thân (embodied agent) Các agent hiện thân đã từng được sử dụng làm giao diện cho tương tác con người – máy tính [11] Người ta cho rằng những agent hội thoại hiện thân (embodied conversational agents) cho phép người sử dụng tương tác tự nhiên hơn với máy tính

Với xu thế phát triển của thế giới ảo, công nghệ agent hiện thân cho phép tạo dựng những nhân vật ảo với nhiều mục đích khác nhau như giải trí, giáo dục Khả năng nói chuyện, biểu hiện gương mặt và các cử chỉ của agent hiện thân khiến chúng rất phù hợp với các ứng dụng giải trí Người kể chuyện ảo tại Đại học Twente là một ví dụ về agent hiện thân [38] Đây là một agent nói chuyện hiện thân, kể lại những câu chuyện được sáng tác ra, với những ngôn điệu và cử chỉ thích hợp Agent này được đặt trong một mô hình - bản sao nhà hát địa phương: Virtual Music Center Bên cạnh dạng kể chuyện truyền thống này, người ta cũng dự định phát triển các vở kịch ảo, trong đó các nhân vật hiện thân diễn trên sân khấu ảo, dựa trên cốt truyện đã sáng tác Còn có nhiều

ví dụ khác về các agent hiện thân phục vụ lĩnh vực giải trí, như các nhân vật nhân tạo ở phòng thí nghiệm truyền thông MIT [4], các nhà bình luận bóng đá robot [2]

Các agent hiện thân có thể làm người hướng dẫn các thủ tục, trả lời câu hỏi thắc mắc, và kiểm soát hành động của sinh viên Agent hiện thân cũng có thể trở thành đồng đội trong những nhiệm vụ đòi hỏi sự tham gia của nhiều người Một ví dụ về những agent như vậy là Steve - chuyên gia luyện bay trong môi trường ảo tại Đại học Nam California [35] Steve được xây dựng nhằm hỗ trợ việc tập luyện của đội trong một mô hình môi trường làm việc ảo tương tác ba chiều của một sinh viên, khi mà việc luyện tập dựa trên các thiết bị thật không có trên thực tế

Các agent hiện thân cũng được dùng để phát triển các trò chơi trên máy tính Các trò chơi máy tính truyền thống thường có những nhân vật thụ động, cứng nhắc, máy móc So với trò chơi một người chơi (một người chơi với các nhân vật máy tính), thì các trò chơi nhiều người chơi vẫn được ưa chuộng hơn Chơi với người thật thú vị hơn vì cách phản ứng của con người luôn đưa đến những diễn biến mới mẻ, ngay cả khi chơi nhiều lần với cùng một người Còn trò chơi chỉ chơi với nhân vật máy tính sẽ không có được điều đó Các agent hiện thân (hay các nhân vật ảo có thể cử động) có mục tiêu, kiến thức và khả năng riêng của chúng, đây có thể là lời giải đáp cho vấn đề này [23], đặc biệt là đối với những loại trò chơi sử dụng máy tính để tạo nên thế giới

và các nhân vật ảo có thể tương tác động với người chơi, ví dụ như Quake, Half-Life

2, Diablo 3, Do đó, các nhân vật ảo có thể cử động đang được phát triển và đưa vào

Trang 9

2 nhiều loại trò chơi máy tính Chúng cũng có tiềm năng dẫn đến việc ra đời những loại trò chơi hoàn toàn mới [23]

Một agent hiện thân điển hình gồm các thành phần sau:

- Một cái đầu nói chuyện có khả năng nói, thể hiện các cử động môi trong khi nói, có các biểu cảm trên gương mặt và thể hiện được các tín hiệu hội thoại

- Một cơ thể có khả năng thể hiện các cử chỉ

- Một mô hình trí não có thể bao gồm lòng tin, cảm xúc, kế hoạch hành vi, động thái và tính cách…

Đối tượng nghiên cứu của luận văn này là các agent hiện thân được thể hiện dưới dạng một khuôn mặt 3D Trong bài toán xây dựng một mô hình khuôn mặt 3D, thông thường ta phải trải qua các bước sau:

- Bước 1: Sử dụng đồ hoạ máy tính để tạo dựng một mô hình khuôn mặt 3D

- Bước 2: Tạo dựng mô hình cơ mặt có thể đạt được những biểu hiện khuôn mặt chân thực trong thời gian thực trên một máy tính thông thường

Các nghiên cứu trước đây đã cho thấy bước 2 đòi hỏi rất nhiều công sức và thời gian Và việc này lặp lại mỗi khi chúng ta xây dựng một mô hình khuôn mặt 3D mới Đây là lý do để luận văn nghiên cứu một phương pháp tạo dựng mô hình cơ mặt cho một khuôn mặt 3D mới bằng cách biến đổi mô hình khuôn mặt nguồn đã có mô hình cơ mặt Trên cơ sở nghiên cứu và thử nghiệm phương pháp nhân bản của Bùi Thế Duy và cộng

sự [9], tôi đưa ra một quy trình và xây dựng một công cụ tạo ra hoạt ảnh trên các khuôn mặt 3D Công cụ này được xây dựng để kết nối với phần mềm tạo khuôn mặt Poser

Có một số ưu điểm khi sử dụng mô hình khuôn mặt biến đổi để thể hiện một mô hình khuôn mặt mới thay cho việc sử dụng chính bản thân mô hình mới Thứ nhất, khi tạo hoạt ảnh với những mô hình khuôn mặt khác nhau, chúng ta có thể giữ được một mô hình khuôn mặt cố định với số đỉnh và số đa giác được xác định trước Thứ hai, ta có thể tái sử dụng các thông số trên mô hình khuôn mặt cố định trước, ví dụ như các thông số xoay quai hàm và đảo mắt Thứ ba, ta có thể sử dụng lại những thông tin về các vùng trên mô hình khuôn mặt để nâng cao hiệu quả của cơ vectơ và điều khiển hoạt ảnh

Luận văn được cấu trúc như sau Chương 1 giới thiệu một mô hình khuôn mặt 3D dựa trên hệ thống cơ đơn giản, có thể đáp ứng các mục tiêu sau: nó vừa có thể tạo nên những biểu hiện khuôn mặt chân thực, đồng thời lại đạt được hoạt ảnh thời gian thực trên những máy tính cá nhân thông thường Chương 2 trình bày cơ sở lý thuyết để xây dựng một phương pháp truyền hoạt ảnh khuôn mặt từ một mô hình khuôn mặt cho trước tới một mô hình mới được tạo ra mà không cần nhiều thao tác của con người Chương 3 trình bày một phương pháp truyền hoạt ảnh khuôn mặt từ một mô hình khuôn mặt cho trước tới một mô hình mới được tạo ra mà không cần nhiều thao tác của con người Chương này mô tả quy trình và một công cụ do tác giả phát triển để thử nghiệm phương pháp được đưa ra trong luận văn

Trang 10

và chúng tiếp tục hoàn thiện khả năng này trong quá trình trưởng thành

Hoạt ảnh của khuôn mặt con người giữ vai trò quan trọng trong giao tiếp mặt đối mặt Cử động môi trong khi nói chuyện giúp đoán biết được bằng mắt người đó đang nói gì Cohen and Massaro [13] đã chứng minh rằng tỷ lệ nhận biết âm vị từ những đoạn video vừa có hình ảnh người nói vừa có âm thanh cao hơn hẳn so với từ những đoạn băng chỉ có âm thanh Đối với người điếc, cử động môi là điều thiết yếu

để họ hiểu được các hội thoại Trong giao tiếp bằng cử chỉ, biểu hiện của khuôn mặt thường ngụ ý sự biến đổi của khuôn mặt theo thời gian Tuy nhiên, ngay cả một bức tranh chân dung cũng thể hiện cảm xúc, nghĩa là biểu hiện của khuôn mặt có thể ở chế

độ tĩnh, mặc dù những biểu hiện đó không rõ ràng nếu không được đặt trong hoàn cảnh cụ thể Biểu hiện của khuôn mặt diễn ra liên tục trong suốt quá trình nói chuyện Chúng là sự minh họa và bổ sung cho những thông tin từ lời nói Chúng có thể diễn đạt cảm xúc, tâm trạng, và truyền đạt các thông tin về tính cách của người nói Những thông tin này có thể làm lộ ra phần ẩn giấu bên trong một con người, mà lời nói không toát lên được

Bài toán tạo mô hình khuôn mặt con người và tạo ra các hoạt ảnh mặt bằng máy tính là một thách thức lớn trong cộng đồng khoa học nghiên cứu về đồ họa vi tính Một nhu cầu mới nảy sinh là thể hiện được khuôn mặt chân thực, chất lượng cao và đồng thời đạt được hoạt ảnh thời gian thực của khuôn mặt Nhìn chung, trước nghiên cứu của Bùi Thế Duy và cộng sự [7, 8], các cách tiếp cận đều chưa thể đạt được cả hai mục tiêu này Hoạt ảnh khung cơ sở (key-frame animation) [29], hoạt ảnh được tham số hoá (parameterized animation) [30] và hoạt ảnh dựa trên hệ thống cơ giả (pseudo-muscle-based animation) [21] là các cách thức đơn giản để đạt được hoạt ảnh thời gian thực, tuy nhiên chúng không thể tạo ra các biểu hiện khuôn mặt chân thực, do không tạo được các chỗ phình và nếp nhăn trên da, cũng như không xử lý được các tương tác

đa tham số (đa cơ) Mặt khác, hoạt ảnh dựa trên hệ thống cơ đa lớp với nhiều lớp thuộc cấu trúc khuôn mặt có thể tạo được sự biểu đạt chân thực, nhưng việc xử lý hoạt ảnh

Trang 11

4 thời gian thực bằng phương pháp này đòi hỏi dung lượng tính toán khổng lồ, mà các máy tính cá nhân thông thường không đáp ứng được

Trong chương này, tôi sẽ xem xét một mô hình khuôn mặt 3D dựa trên hệ thống

cơ giản đơn, mà có thể tạo ra nét mặt chân thực cũng như các hoạt ảnh thời gian thực trên máy tính cá nhân thông thường Để thực hiện được điều này, tôi sẽ tìm hiểu:

- Một mô hình có biểu hiện khuôn mặt chân thực và chất lượng cao, đủ đơn giản

để giữ được các hoạt ảnh thời gian thực và có thể hỗ trợ mô hình cơ điều khiển

sự biến đổi trên gương mặt

- Một mô hình cơ tạo ra sự biến đổi chân thực trên bề mặt của khuôn mặt, xử lý được các tương tác đa cơ một cách chính xác, và tạo ra được các chỗ phình và nếp nhăn trong thời gian thực

Phần 1.2 bàn cụ thể về các kỹ thuật hiện có được sử dụng để tạo mô hình và làm hoạt ảnh khuôn mặt Trước tiên, tôi nghiên cứu về hai kỹ thuật chính để tạo mô hình khuôn mặt, đó là: tạo mô hình khuôn mặt bằng các lớp hình đa giác và tạo mô hình khuôn mặt bằng các lớp bề mặt được tham số hoá Phần này cũng chỉ ra những ưu và nhược điểm của từng kỹ thuật trong quá trình biểu hiện và hoạt ảnh gương mặt Sau đó tôi nghiên cứu tiếp các kỹ thuật làm hoạt ảnh khuôn mặt Bốn kỹ thuật chính được đề cập tới là: hoạt ảnh khung cơ sở [29], hoạt ảnh được tham số hoá [30], hoạt ảnh dựa trên hệ thống cơ giả [21] và hoạt ảnh dựa trên hệ thống cơ (muscle-based animation) [43] Phần 1.3 giới thiệu cấu trúc mô hình khuôn mặt của Bùi Thế Duy và cộng sự [7] Tôi

mô tả cách thức xây dựng mạng lưới khuôn mặt để tạo ra các biểu hiện chân thực trong khi vẫn giữ được hoạt ảnh trong thời gian thực Mạng lưới khuôn mặt cũng được thiết kế để nâng cao hiệu quả của mô hình cơ Phần 1.4 thảo luận về hệ thống cơ điều khiển hoạt ảnh của khuôn mặt [7, 8] Trong phần này, tôi mô tả cách thức mở rộng mô hình cơ của Waters [43] để xử lý việc kết hợp giữa các hành động đa cơ, và để tạo ra các chỗ phình và các nếp nhăn trên gương mặt Phần này cũng bàn về các kỹ thuật để nâng cao hiệu quả của mô hình cơ Tiếp theo, tôi tìm hiểu cách cử động cơ vòng miệng, cơ vòng mắt và sự chuyển động của hàm Cuối cùng, những kết quả thực nghiệm của Bùi Thế Duy và cộng sự [8] sẽ được đưa ra ở Phần 1.5, trong đó khuôn mặt được tạo ra mang các sắc thái ngạc nhiên, hạnh phúc và buồn rầu, nhằm minh họa cho cách thức xây dựng các biểu hiện khuôn mặt chân thực

1.2 Các kỹ thuật hiện có được sử dụng để tạo mô hình và làm hoạt ảnh khuôn mặt 3D

Mục đích của hoạt ảnh khuôn mặt 3D là điều khiển mạng lưới bề mặt 3D của

mô hình khuôn mặt theo thời gian, sao cho tại một thời điểm bất kỳ, mô hình khuôn mặt có biểu hiện như ta mong muốn Có nhiều phương pháp tạo nên hoạt ảnh khuôn mặt 3D, từ phương pháp đơn giản nhằm tạo ra hoạt ảnh thời gian thực như mô hình khuôn mặt CANDIDE [36], đến những phương pháp phức tạp hơn nhằm đạt được sự

Trang 12

5 biểu hiện khuôn mặt có chất lượng như ảnh chụp, ví dụ như mô hình khuôn mặt dựa trên hệ thống cơ đa lớp của Lee và cộng sự [24]

Theo mô tả của Rydfalk [36], CANDIDE là một mô hình khuôn mặt được tham

số hoá (parameterized face model), chỉ bao gồm 75 đỉnh và 100 tam giác Mô hình này được xây dựng dành riêng cho việc mã hoá khuôn mặt con người, qua đó khuôn mặt người được mã hóa với tỷ lệ bít được giảm đáng kể, trong các ứng dụng như điện thoại truyền hình Số lượng ít các đa giác của mô hình này cho phép tái xây dựng và đạt được hiệu ứng hoạt ảnh nhanh chóng ngay cả với các máy tính thông thường (dung lượng thấp) CANDIDE do các đơn vị hành động (Action Units) toàn cục và cục bộ điều khiển [15] Các đơn vị toàn cục tương ứng với các chuyển động xoay quanh ba trục Các đơn vị hành động cục bộ tạo ra các biểu hiện khác nhau của khuôn mặt

Mô hình khuôn mặt của Lee và cộng sự [24] là một ví dụ trong các phương pháp nhằm đạt được các biểu hiện chất lượng cao Nó bao gồm nhiều lớp: một lớp mô sinh học, một lớp cơ và một cấu trúc sọ đặc Để tạo mô hình khuôn mặt của một cá nhân, các dữ liệu từ một máy quét laze sẽ được nhập tự động vào mô hình khuôn mặt chung Hình ảnh từ máy quét cũng được xử lý để tạo nên kết cấu bề mặt của mô hình khuôn mặt Bằng một hệ thống cơ xây dựng dựa trên vật lý học, các biểu hiện khuôn mặt chân thực sẽ được tạo ra trên bề mặt được cấu thành của mô hình khuôn mặt

Có hai vấn đề cần lưu tâm khi xử lý hoạt ảnh khuôn mặt 3D Vấn đề đầu tiên là việc tạo mô hình khuôn mặt, trong đó xử lý cách biểu hiện của chính mô hình khuôn mặt đó Vấn đề thứ hai là việc tạo mô hình chuyển động của khuôn mặt Bây giờ tôi sẽ xem xét lại các kỹ thuật để xử lý hai vấn đề này một cách chi tiết Ngoài ra, tôi cũng sẽ thảo luận về các phương pháp để tạo mô hình và làm môi cử động Trong số các bộ phận của khuôn mặt, môi đóng vai trò quan trọng trong giao tiếp mặt đối mặt Nó cũng

là một thành phần quan trọng trong các biểu hiện cảm xúc và tham gia vào việc giải nghĩa lời nói Bởi vậy, môi luôn là một thành phần được chú ý đặc biệt trong việc tạo

mô hình hoạt ảnh khuôn mặt

1.2.1 Tạo mô hình khuôn mặt

Khuôn mặt con người là một bề mặt ba chiều linh hoạt và phức tạp Khuôn mặt thường mang một số nếp nhăn cố định, còn những chỗ phình và nếp nhăn tạm thời được tạo ra trong quá trình biểu đạt của khuôn mặt Thách thức đặt ra là làm sao có thể tạo nên một bề mặt cho phép biểu hiện chân thực, đồng thời đạt được hiệu ứng chuyển động thời gian thực

Tạo mô hình khuôn mặt bằng lớp da gồm nhiều đa giác

Một phương pháp là sử dụng nhiều lớp đa giác để mô phỏng trực tiếp bề mặt khuôn mặt Sau đó, mô hình khuôn mặt được tạo hoạt ảnh bằng cách trực tiếp điều khiển các đỉnh đa giác trên bề mặt Phương pháp này lần đầu được giới thiệu bởi Gouraud [17] Ông xây dựng một mẫu bề mặt của khuôn mặt bằng nhiều điểm và nối

Trang 13

6 các điểm này để tạo thành một lớp da gồm các hình đa giác Ứng dụng phương pháp này, Parke [29] đã tạo ra một mô hình khuôn mặt, một trong những công trình đầu tiên trong lĩnh vực nghiên cứu hoạt ảnh khuôn mặt con người Mô hình này bao gồm khoảng 250 hình đa giác được tạo thành từ 400 đỉnh Do khuôn mặt con người gần như đối xứng, nên chỉ cần tạo ra một nửa mô hình khuôn mặt, còn nửa kia là sự lặp lại đối xứng Parke tập trung vào tốc độ và chất lượng của quá trình kết xuất đồ họa (render) khi tạo ra mô hình khuôn mặt Ông giảm đến mức tối thiểu số lượng hình đa giác (nhưng vẫn đảm bảo chất lượng tốt) để có thể đạt được kết xuất đồ họa nhanh hơn Để thu được độ tô bóng mịn (smooth shading), ông sử dụng thêm nhiều đa giác ở các vùng có độ cong lớn (mũi, miệng, quanh mắt và đỉnh cằm) và giảm bớt ở các vùng có

độ cong nhỏ (trán, má và cổ) Các đa giác ở vùng dưới mắt, cánh mũi, bờ môi, khóe miệng, những nơi xuất hiện nếp nhăn trên khuôn mặt, được thiết kế sao cho cạnh của chúng trùng với các nếp gấp Các đa giác nằm trong vùng xuất hiện các đường biên màu sắc, như môi và lông mày, được thiết kế sao cho cạnh của chúng trùng với các đường biên này

Nhiều hệ thống hoạt ảnh khuôn mặt khác sử dụng lưới đa giác để mô phỏng lớp

da của khuôn mặt Ví dụ như mô hình khuôn mặt CANDIDE [36] và mô hình khuôn mặt Greta [32] CANDIDE ban đầu là một mô hình khuôn mặt tham số hóa do Rydfalk tạo nên tại Linkoping Image Coding Group, được xây dựng riêng nhằm mã hóa khuôn mặt con người Nó bao gồm 75 đỉnh và 100 tam giác, cho phép tái xây dựng khuôn mặt một cách nhanh chóng ngay ở các máy tính dung lượng thấp Những phiên bản nâng cao của mô hình khuôn mặt này đã ra đời sau đó Nhiều đỉnh đa giác được thêm vào để che phủ toàn bộ phần đầu (gồm cả tóc và răng) và phần vai (Candide-2 [45]), và để đơn giản hóa hoạt ảnh bằng các tham số hoạt ảnh mặt MPEG-

4 (Candide-3 [1]) Greta là một mô hình khuôn mặt phù hợp với các đặc điểm kỹ thuật MPEG-4 và chứa khoảng 15000 đa giác Mô hình này là nỗ lực lớn nhằm nâng cao mức độ chi tiết trên các vùng biểu hiện của mô hình khuôn mặt trong giao tiếp trao đổi thông tin và thể hiện cảm xúc Đó là những vùng gồm miệng, mắt, trán và nếp nhăn kéo từ cánh mũi qua khóe miệng Nhiều đa giác được thiết kế và đặt tại các vùng này Ngoài ra, trán và nếp nhăn qua khóe miệng được đặc biệt chú ý Các đa giác ở vùng trán được tổ chức thành một lưới các đường ngang cách đều, để tạo nên những nếp nhăn ngang xuất hiện khi nhướn lông mày bằng các kỹ thuật tạo bề mặt sần (bump mapping techniques) [27] Các đa giác nằm ở nếp nhăn qua khóe miệng được sắp xếp sao cho sự phân tách giữa vùng da bị kéo căng gần miệng và vùng da ở má có thể tạo nên nếp nhăn rõ nét khi khuôn mặt cười

Trang 14

7

Hình 1.1: Các mô hình khuôn mặt CANDIDE (trái) và Greta (phải)

Khi tạo mô hình bề mặt của khuôn mặt, bên dưới lớp da gồm các đa giác, người

ta sử dụng thêm các lớp như lớp mỡ dưới da, lớp cơ và bề mặt sọ để hình thành nên

mô hình cơ dựa trên vật lý học [19, 24]

Để tạo mô hình một cá nhân cụ thể, ta sử dụng ba kỹ thuật Kỹ thuật thứ nhất là xây dựng thủ công mô hình khuôn mặt cho một cá nhân bằng các kỹ thuật tạo mô hình 3D như AutoCAD và 3DMax Đây là một công việc rất tốn thời gian và đòi hỏi sự kiên trì Kỹ thuật thứ hai, được gọi là phương pháp quang trắc (photogrammetric measurement), xây dựng mô hình khuôn mặt từ nhiều tấm ảnh chụp đầu của cá nhân từ những góc độ khác nhau Để tìm được mối quan hệ giữa các bức ảnh với mô hình 3D,

ta cần xác định được những điểm đặc trưng trên các bức ảnh Kỹ thuật thứ ba là sử dụng máy quét laze để quét hình các khuôn mặt thật, rồi sử dụng hình ảnh đó làm chất liệu cho mô hình khuôn mặt Các máy quét laze cho phép thu được dữ liệu 3D rất chi tiết như màu sắc hay mức xám của các điểm được quét Việc kết hợp những dữ liệu này có thể tạo nên những mô hình tĩnh chân thực đến bất ngờ

Việc mô phỏng khuôn mặt con người bằng các đa giác có nhiều ưu điểm Nhờ phương pháp xây dựng các bề mặt đa giác, nhiều vấn đề được giải quyết thông qua các thuật toán, ví dụ như việc xác định một phần hay toàn bộ đối tượng nằm bên trong không gian quan sát, phát hiện các bề mặt ẩn, xác định độ tô bóng của các bề mặt hiển thị… Những thuật toán này xử lý nhanh và đỡ tốn kém hơn so với thuật toán dành cho các bề mặt cấp độ cao hơn, chúng cũng được bổ sung vào phần cứng của máy tính Ngoài ra, việc phát triển các thuật toán tô bóng Grouraud [17] và tô bóng Phong [10] cho phép tạo đường cong liên tục trên một bề mặt xây dựng từ các đa giác Tuy nhiên, nếu chỉ sử dụng một lượng nhỏ đa giác như trong mô hình Parke [29] và mô hình khuôn mặt CANDIDE [36], thì những thuật toán này không thể che dấu hoàn toàn độ phẳng của bề mặt khuôn mặt

Trang 15

8

Tạo mô hình khuôn mặt bằng các bề mặt tham số

Có thể tạo mô hình khuôn con người bằng một bề mặt tham số Mục đích là tìm kiếm một phương trình toán học để biểu diễn bề mặt khuôn mặt Tuy nhiên, rất khó tìm ra một phương trình cho phép biểu diễn khuôn mặt một cách chi tiết Cách tiếp cận được ưa chuộng hơn là tạo ra một bề mặt bằng cách kết nối một tập hợp các mảng tham số Những mảng này phải liên kết với các mảng kế tiếp tại đường biên Đây thường được gọi là tính chất liên tục C0

Độ mịn của toàn bộ bề mặt được đánh giá thông qua tính chất liên tục ở các bậc cao hơn Bề mặt đạt được liên tục C1

khi các mảng (được biểu diễn bằng đạo hàm bậc nhất của các mảng ban đầu) đạt liên tục tại các đường biên, liên tục C2

là liên tục đối với đạo hàm bậc hai… Bề mặt liên tục ở bậc càng cao thì càng mịn Bề mặt được tạo nên bởi các mảng này thường được xác định bởi một tập hợp các điểm được gọi là “điểm điều khiển” (control points) Ta có thể làm mô hình khuôn mặt hoạt ảnh bằng việc điều chỉnh các điểm điều khiển này Các điểm điều khiển thường được sắp xếp thành một lưới kích thước (n1)(m1):

m j n i

W i,j,0  , 0  Các điểm nằm trên bề mặt, w ( v u, ), được xác định là tổng trọng số của các điểm điều khiển W i,j:

j i j

N v

u w

,

)()()

,(

trong đó N i (u) và N j (v) là các hàm cơ bản Một hàm cơ bản biểu diễn một đường cong trên mặt phẳng hai chiều Như vậy, về mặt trực giác, bề mặt được tạo nên bằng cách kết hợp nhiều đường cong Những đường cong này được lựa chọn một cách cẩn thận sao cho bề mặt được tạo nên đạt độ mịn cần thiết Người ta thường chọn các đường cong spline do sự đơn giản và tính chất liên tục bậc cao của chúng Hình 1.2 là một ví dụ về bề mặt được tạo bởi các mảng tham số như thế này

Hình 1.2: Một bề mặt B-spline

Trang 16

9

Vì lớp da khuôn mặt là một bề mặt mịn và mềm dẻo, nên nhiều hệ thống sử dụng mảng tham số đã chọn các mảng spline để tạo mô hình khuôn mặt nhờ tính chất mịn và liên tục của đường cong spline Một ví dụ là mô hình Billy do Pixar tạo ra Billy, đứa trẻ trong phim “Tin Toy”, lúc đầu được xây dựng từ các mảng tam giác Bezier nhưng nó gặp phải các vấn đề liên quan đến nếp nhăn trên khuôn mặt Sau đó các mảng đường cong spline Bicubic Catmull-Rom được sử dụng để thay thế cho các tam giác Bezier Các vấn đề nếp nhăn được giảm bớt nhưng vẫn chưa được giải quyết triệt để Billy cũng gặp nhiều vấn đề tại phần đỉnh đầu và phần cổ Một ví dụ khác là Trình điều khiển hành động khuôn mặt (Facial Action Control Editor) do Waite [41] thiết kế Waite sử dụng các mảng đường cong B-spline với tổng cộng 16x12 điểm điều khiển Bề mặt do các mảng cong B-spline tạo nên rất mịn nhờ tính chất liên tục C2

của các mảng cong B-spline Bề mặt được tạo bởi các mảng như vậy thường được gọi là bề mặt B-spline Các vùng mở như mắt, lỗ mũi và miệng được tạo nên bằng một kỹ thuật gọi là cắt tỉa hình học (geometric trimming) Kỹ thuật này giúp loại bỏ những phần không cần thiết trên bề mặt và cung cấp một mô tả toán học mới dành cho mảng được cắt tỉa Tuy nhiên, với số điểm điều khiển như vậy, dễ nhận thấy đây chưa phải một

mô hình chi tiết, chưa có cách thức tạo mí mắt hay mắt Để tạo mô hình một khuôn mặt cụ thể bằng kỹ thuật này, mô hình khuôn mặt còn được nhập những dữ liệu thu từ máy quét laze Phương pháp của Hoch và cộng sự [18] là một ví dụ Ở đây, quá trình nhập dữ liệu được tiến hành bằng cách tối thiểu hóa sai số bình phương trung bình giữa các điểm dữ liệu cho trước và các điểm bề mặt, với ràng buộc là mọi điểm điều khiển được đặt tại đúng vị trí trong các vùng ứng dụng của các đơn vị hành động tương ứng Điều này nhằm đảm bảo sự liên kết giữa các điểm điều khiển và một đơn

vị hành động sẽ dẫn tới sự biến đổi chính xác tại một khu vực nào đó trên bề mặt da Khi đó, thông tin màu sắc thu từ máy quét laze sẽ được sử dụng làm chất liệu cho vỏ ngoài khuôn mặt

Việc tạo mô hình khuôn mặt bằng các mảng tham số có lợi thế là phải xử lý ít

dữ liệu, nhưng thu được bề mặt mịn hơn so với các mô hình đa giác Tuy nhiên, phương pháp này mắc phải vấn đề kết xuất các bề mặt Mặc dù có bề mặt ẩn và các thuật toán kết xuất dành cho các bề mặt bậc hai, nhưng chúng hầu như không hiệu quả

Có thể đưa ra những thuật toán tương tự cho bề mặt ở các bậc cao hơn, nhưng bề mặt

có bậc càng cao thì càng phức tạp Vì vậy, các bề mặt bậc cao thường được mô phỏng bởi lớp da gồm nhiều đa giác Quá trình này được gọi là đa giác hóa và nó vẫn đòi hỏi những tính toán tương đối phức tạp nếu độ phân giải mẫu cao Vấn đề còn phức tạp hơn nếu sử dụng quá nhiều điểm điều khiển spline (nhằm tạo mô hình chính xác cho từng vùng nhỏ trên khuôn mặt) Ngoài ra, do đòi hỏi về độ mịn, phương pháp này không thích hợp đối với việc tạo các nếp nhăn mờ trên khuôn mặt Với những ưu nhược điểm như vậy, phương pháp này phù hợp với việc tạo mô hình một vùng nhỏ và mịn của khuôn mặt như môi

Trang 17

10

1.2.2 Tạo mô hình hoạt ảnh của khuôn mặt

Như đã nói ở phần trên, bề mặt khuôn mặt được làm hoạt ảnh trực tiếp bằng cách điều khiển các đỉnh đa giác, hoặc gián tiếp bằng cách điều chỉnh các điểm điều khiển Có bốn kỹ thuật cơ bản để điều khiển bề mặt khuôn mặt, đó là hoạt ảnh khung

cơ sở, hoạt ảnh được tham số hoá, hoạt ảnh dựa trên hệ thống cơ giả và hoạt ảnh dựa trên hệ thống cơ

1.2.2.1 Hoạt ảnh khung cơ sở

Các kỹ thuật hoạt ảnh khung cơ sở rất thông dụng vì chúng cung cấp một phương pháp trực giác làm hoạt ảnh khuôn mặt Trong các kỹ thuật này, nhiều hàm nội suy được dùng để tạo nên các khung nằm giữa khung cơ sở Chúng cho phép sự chuyển đổi mềm mại giữa các khung cơ sở Các khung cơ sở trong trường hợp này là các khuôn mặt với những biểu hiện khác nhau Kỹ thuật hoạt ảnh khung cơ sở có thể dựa trên hình học hoặc dựa trên tham số Các kỹ thuật dựa trên tham số trực tiếp điều chỉnh vị trí các đỉnh lưới trên khuôn mặt Những lưới khuôn mặt này phải có cùng dạng tôpô (topology) Vị trí của mỗi đỉnh trên bề mặt ở một thời điểm được xác định bằng cách nội suy giữa vị trí của các đỉnh tương ứng trên hai khuôn mặt cơ sở Các kỹ thuật hoạt ảnh khung cơ sở dựa trên tham số được dùng kết hợp với các kỹ thuật hoạt ảnh khuôn mặt khác như hoạt ảnh tham số hóa và hoạt ảnh dựa trên hệ thống cơ Các tham số có thể chính là tham số trong hoạt ảnh tham số hóa, hay là các mức co rút cơ trong hoạt ảnh dựa trên hệ thống cơ Các kỹ thuật khung cơ sở dựa trên tham số xác định mỗi tham số được dùng cho việc tạo khuôn mặt vào một thời điểm nhất định bằng cách nội suy các tham số tương ứng được dùng để tạo ra hai khuôn mặt cơ sở

Toàn bộ quá trình nội suy được điều khiển bởi hệ số xác định mức tương đồng giữa khuôn mặt tại thời điểm cần tạo nên với khuôn mặt cơ sở thứ nhất và với khuôn mặt cơ sở thứ hai Ví dụ, khuôn mặt cười nửa miệng là kết quả của việc nội suy giữa khuôn mặt bình thường và khuôn mặt cười hết cỡ theo hệ số 0.5 Trong trường hợp tạo một chuỗi hoạt ảnh, thông tin về thời gian của khung tại một thời điểm nhất định và hai khung cơ sở được sử dụng để tính ra hệ số này Các kỹ thuật hoạt ảnh khung cơ sở có thể sử dụng phép nội suy tuyến tính hoặc phi tuyến Nội suy tuyến tính thông dụng hơn

do mức độ đơn giản của nó Nội suy phi tuyến được dùng để mô phỏng các hoạt ảnh khuôn mặt chính xác hơn [29] Bởi vì khuôn mặt được điều khiển bởi các quy tắc vật

lý, nên cử động của nó không tuyến tính mà có xu hướng tăng dần hoặc giảm dần Do

đó, Parke [29] sử dụng một phép nội suy cosin để mô phỏng các quá trình tăng dần và giảm dần Phép nội suy song tuyến được dùng khi có bốn khung cơ sở tham gia vào việc tạo ra nhiều biểu hiện khuôn mặt hơn sự cho phép của nội suy tuyến tính [30]

Các kỹ thuật hoạt ảnh khung cơ sở khá đơn giản, do vậy ta có thể tạo ra các hoạt ảnh khuôn mặt gốc một cách nhanh chóng và dễ dàng Tuy nhiên, chúng không thể tạo nên các biểu hiện vượt ra ngoài giới hạn của các khung cơ sở Bởi phạm vi biểu

Trang 18

11 hiện của khuôn mặt phụ thuộc vào số lượng và mức độ khác biệt của các khung cơ sở, nên kỹ thuật hoạt ảnh khung cơ sở chỉ có thể tạo được nhiều biểu hiện của khuôn mặt nếu có đủ lượng khung cơ sở Điều đó lại đòi hỏi công sức và thời gian trong việc thu thập dữ liệu hình học hoặc phải tạo ra dữ liệu Do nhược điểm này, nên các kỹ thuật khung cơ sở chỉ thích hợp đối với việc tạo ra một tập hợp nhỏ các hoạt ảnh từ một số khung cơ sở, hoặc phải kết hợp với những phương pháp khác để tạo nên các khung ở mỗi thời điểm nhất định

1.2.2.2 Hoạt ảnh tham số hóa

Các kỹ thuật hoạt ảnh tham số hóa do Parke [30] lần đầu đưa ra, nhằm khắc phục một số hạn chế của kỹ thuật hoạt ảnh khung cơ sở Chúng làm hoạt ảnh khuôn mặt bằng một tập hợp nhỏ các tham số điều khiển Những tham số này được điều khiển bằng mạch điện tử tương ứng với những vùng nhất định trên khuôn mặt, nhằm tạo nên sự biến đổi tại vùng đó Sự biến đổi của khuôn mặt được xác định bởi một tham số tạo ra một cử động cụ thể

Để sử dụng các kỹ thuật hoạt ảnh tham số hóa, mô hình khuôn mặt cần được thiết kế đặc biệt để có thể xử lý một tập hợp các tham số điều khiển Mô hình khuôn mặt như vậy được gọi là mô hình tham số hóa Một cách tạo ra mô hình tham số hóa là quan sát tỉ mỉ khuôn mặt con người để chia khuôn mặt thành các vùng khác nhau Kế

đó, đa giác tại những vùng này được thiết kế sao cho có thể tạo ra những biến đổi vùng cục bộ, để cuối cùng thu được hoạt ảnh khuôn mặt như mong muốn Sự giúp đỡ và hướng dẫn từ những nhà làm phim hoạt hình nhiều kinh nghiệm chắc chắn đóng vai trò quan trọng trong việc tạo nên một mô hình khuôn mặt tham số hóa tốt

Có thể tạo nên những biến đổi nội vùng bằng các kỹ thuật nội suy vùng cục bộ (local region interpolations), biến đổi hình học (geometric transformations) và tạo chất liệu (texture mapping) Nội suy vùng cục bộ tạo nên hình dạng tức thời từ hai hình dạng được cho trước của vùng, dựa trên giá trị của tham số Vị trí của mỗi đỉnh đa giác trong vùng cục bộ được xác định bằng phép nội suy các đỉnh tương ứng của hai hình dạng cho trước Các phép biến đổi hình học như xoay chiều, xác định tỷ xích và khoảng cách vị trí, sử dụng các hàm toán học chứa tham số để biến đổi hình dạng vùng cục bộ thành một hình dạng khác Cũng có thể biến đổi cục bộ bằng các kỹ thuật tạo chất liệu bề mặt Những kỹ thuật này điều khiển chất liệu trên vùng bề mặt nhằm tổng hợp nên các hoạt ảnh khuôn mặt Hãy tìm hiểu một ví dụ về cách tạo cử động của mí mặt để hiểu rõ hơn về những kỹ thuật này Để khiến mí mắt cử động, ta có thể nội suy cục bộ giữa hai lưới phụ phần mí mắt được xây dựng từ trước, tương ứng với mí mắt

mở và mí mắt đóng Hệ số nội suy 0.5 sẽ tạo nên một con mắt nhắm một nửa Ta cũng

có thể khiến mí mắt cử động bằng cách xoay cục bộ lưới phụ phần mí mắt quanh một trục được xác định trước Đối với cử động của lông mày, các nếp nhăn ngang sẽ hiển thị trên trán khi lông mày nhướn lên Ta có thể sử dụng các kỹ thuật tạo chất liệu để

Trang 19

12 tạo nên những nếp nhăn này Mức hiển thị và vị trí của những nếp nhăn phụ thuộc vào giá trị của tham số nhướn lông mày

Không như các kỹ thuật hoạt ảnh khung cơ sở, các kỹ thuật hoạt ảnh tham số hóa cho phép điều khiển từng phần cụ thể trên khuôn mặt Chúng cung cấp một phạm

vi biểu hiện khuôn mặt lớn với mức tính toán tương đối thấp Tuy nhiên, chúng cũng

có một số hạn chế Một là, việc lựa chọn tập hợp tham số phụ thuộc vào dạng topo của lưới khuôn mặt, do đó tham số hóa mất tính tổng quát khi được áp dụng cho một dạng topo khuôn mặt mới Hai là, hiện nay ta vẫn chưa thể xây dựng được một tập hợp hoàn chỉnh các tham số điều khiển để tạo nên mọi hoạt ảnh khuôn mặt có thể xảy ra Ba là, các kỹ thuật hoạt ảnh tham số hóa khó xử lý những tham số trái ngược nhưng tác động tới cùng các đỉnh Do đó, mỗi khi xuất hiện sự mâu thuẫn giữa các tham số, kỹ thuật hoạt ảnh tham số hóa hầu như không thể tạo được những biểu hiện tự nhiên của con người Đây là nguyên nhân khiến kỹ thuật hoạt ảnh tham số hóa chỉ thích hợp đối với những vùng cụ thể trên khuôn mặt, tuy nhiên điều này lại gây ra những ranh giới biến đổi dễ nhận thấy Cuối cùng, việc đi tìm tập hợp giá trị tham số là một công việc gây buồn chán và tốn thời gian, mà ngay cả sau khi đã tìm được tập hợp giá trị thì có thể ta vẫn chỉ thu được những cử động không thực tế

1.2.2.3 Hoạt ảnh dựa trên hệ thống cơ giả

Kỹ thuật dựa trên hệ thống cơ giả làm lưới khuôn mặt biến đổi bằng cách mô phỏng sự co rút cơ thực tế, nhưng bỏ qua các yếu tố giải phẫu học khuôn mặt Những

kỹ thuật này bao gồm hành động cơ trừu tượng - AMA [25] và các biến đổi dạng tự do

- FFD [32] Magnenat-Thalmann và cộng sự [25] đã sử dụng các đơn vị hành động FACS [15] làm hướng dẫn cho việc xây dựng các thủ tục AMA Mỗi thủ tục AMA hoạt động trên một vùng mặt cụ thể, được xác định trước cùng quá trình xây dựng khuôn mặt, nhằm mô phỏng hành động của một cơ hay một nhóm cơ có quan hệ gần nhau Hệ thống của Magnenat-Thalmann và cộng sự gồm 30 thủ tục AMA Một ví dụ

về các thủ tục AMA là thủ tục quai hàm cử động theo chiều dọc (khi mở miệng) Việc

sử dụng thủ tục này tạo ra một chuỗi các hành động nhỏ kế tiếp nhau, được điều khiển bởi các tham số của thủ tục Những hành động này khiến quai hàm hạ xuống và môi có dạng tròn hơn Các biểu hiện khuôn mặt được hình thành bằng cách điều khiển các thủ tục AMA thành từng nhóm Do sự phụ thuộc lẫn nhau giữa các thủ tục AMA, nên thứ

tự diễn ra những thủ tục này rất quan trọng

Biến đổi dạng tự do làm biến đổi một đối tượng thể tích có cấu trúc lưới hình ống song song vây quanh, bằng cách thay đổi các đỉnh lưới (hay các điểm điều khiển) Các điểm nằm trên đối tượng đi cùng cấu trúc lưới ban đầu được sắp xếp thành lưới đã biến đổi theo phép nội suy Bezier ba biến thể Việc sắp xếp này cho phép sự thay đổi lưới sẽ tự động truyền tới đối tượng FFD có thể tạo nên những chỗ lồi, lõm, uốn, xoắn, hay nhiều hình dạng biến đổi phức tạp khác của mô hình FFD đã được sử dụng

để mô phỏng Tham số hoạt ảnh mặt (Facial Animation Parameter - FAP) theo tiêu

Trang 20

13 chuẩn MPEG-4 Biến đổi dạng tự do hợp lý (Rational free form deformation - RFFD) kết hợp các trọng số cho mỗi điểm điều khiển, bổ sung thêm một bậc tự do vào việc xác định các biến đổi Kalra và cộng sự [21] đã phối hợp RFFD với một phương pháp dựa trên vùng cục bộ để mô phỏng hiệu ứng thị giác của các cơ Trước tiên, các vùng

bề mặt được xác định tương ứng với mô tả kết cấu xương của các hành động cơ Sau

đó, các vùng liên quan được xác định như những thể tích hình ống song song dựa trên các vùng bề mặt Bằng cách nội suy thay đổi vị trí các điểm điều khiển, và thay đổi trọng số đi kèm mỗi điểm điều khiển, ta có thể mô phỏng sự biến đổi da, để tạo nên sự căng, nén, giãn, co bên trong thể tích này Sự biến đổi của các điểm ranh giới nằm bên trong những vùng tiếp giáp nhau được xác định bằng phép nội suy tuyến tính

Các kỹ thuật dựa trên hệ thống cơ giả không cho phép mô phỏng chính xác hành động của cơ mặt và da Do bỏ qua các yếu tố giải phẫu học của khuôn mặt, nên phương pháp này không thể tạo các nếp nhăn, chỗ phình… trên da Sau cùng, phương pháp này không chú ý đến việc xử lý đúng sự tương tác giữa các nhóm cơ

1.2.2.4 Hoạt ảnh dựa trên hệ thống cơ

Các kỹ thuật dựa trên hệ thống cơ sử dụng các mô hình da và cơ lò xo khối (mass-spring) hay đa lớp dựa trên yếu tố giải phẫu học, để làm biến đổi lưới khuôn mặt Phương pháp lò xo khối truyền lực cơ trong một lưới lò xo co giãn mô phỏng biến đổi của da Một lưới lò xo nhiều lớp mở rộng một cấu trúc lò xo khối thành 3 lớp lưới liên kết nhau để tạo mô hình hành vi khuôn mặt theo kết cấu một cách chân thực hơn Platt và Badler [33] đã đi tiên phong trong việc tạo mô hình cơ bằng cách xây dựng một mô hình lò xo khối Mô hình này gồm 3 phần: da, xương và cơ Da được biễu diễn là một tập hợp các điểm 3D có thể di chuyển, còn xương là một tập hợp các điểm cố định Hệ thống cơ nằm giữa da và xương là nhóm các điểm có cung co giãn Biểu hiện khuôn mặt được tạo nên bằng cách truyền lực vào các lưới co giãn (kết dính) thông qua các cung cơ Sau này, Platt giới thiệu một mô hình khuôn mặt bằng 38 khối

cơ vùng, tương ứng với những vùng biểu hiện được xác định trước của cấu trúc khuôn mặt Các hành động của cơ được biểu diễn bằng tập hợp các hành động được xác định trước ở những vùng này Hành động ở một vùng có thể (hoặc không thể) gây ra sự biến đổi ở các vùng kế tiếp Các khối cơ theo vùng được liên kết với nhau theo một lưới lò xo Các đơn vị hành động của khuôn mặt [15] được tạo nên bằng cách truyền lực cơ để gây ra sự biến đổi của lưới lò xo

Waters [43] đã phát triển một mô hình khuôn mặt gồm 2 loại cơ: các cơ thẳng

có chức năng kéo và các cơ vòng có chức năng siết Cũng như Platt và Badler, ông dùng một mô hình lò xo và khối dành cho da và cơ Tuy nhiên, các cơ của Waters có tính chất định hướng (vectơ) Phần sau sẽ nghiên cứu công trình của Waters một cách chi tiết hơn Một phương pháp yếu tố có hạn (finite element method) cũng được dùng

để mô phỏng các tính chất đàn hồi (kết dính) của da và để tạo mô hình các cơ mặt

Trang 21

14 Terzopoulos và Waters [37] đã đưa ra một mô hình khuôn mặt mô phỏng chi tiết cấu trúc khung xương và động thái của khuôn mặt con người Họ xây dựng ba lớp lưới có thể biến đổi, tương ứng với da, mô mỡ và cơ bó với xương Các yếu tố lò xo đàn hồi kết nối với mỗi mắt lưới và mỗi lớp Lực cơ truyền qua các hệ thống lưới để tạo nên hoạt ảnh Mô hình này đã đạt mức chân thực đáng kể, nhưng cách mô phỏng biến đổi bằng các lưới ba chiều đòi hỏi lượng tính toán rất lớn

Trên cơ sở công trình của Terzopoulos and Waters [37], Lee và cộng sự [24] đã giới thiệu một mô hình các lớp da và cơ tổng hợp dựa trên vật lý học Mô hình khuôn mặt này gồm 3 yếu tố: một lớp mô sinh học có tính chất biến đổi phi tuyến, một lớp cơ đan kết với nhau dưới da, và một cấu trúc sọ đặc bên dưới lớp cơ Các mô tổng hợp được biểu diễn như những thành tố hình lăng trụ tam giác, được chia thành bề mặt biểu

bì, bề mặt mô mềm và bề mặt sọ Các yếu tố lò xo liên kết với các lớp biểu bì và lớp

mô mềm tạo có thể mô phỏng độ co giãn của da Các yếu tố lò xo tác động đến lực cơ được liên kết với các lớp sọ và mô mềm Kahler và cộng sự [19] đã trình bày một phương pháp điều chỉnh lưới cơ để xây dựng hệ thống cơ từ bản vẽ phác của các cơ khuôn mặt Trước hết họ vẽ phác các lưới cơ cơ bản theo từng dòng Sau đó các lưới

cơ được tự động điều chỉnh theo dạng hình học Các sợi có dạng bậc hai được đưa vào lưới để tạo nên hệ thống cơ Tuy nhiên, quá trình này đòi hỏi phải điều chỉnh mô hình chung của sọ người thực theo lưới da (skin mesh), mà đây là việc mang tính chất thủ công và tốn nhiều thời gian

Mặc dù các mô hình dựa trên hệ thống cơ đa lớp đạt được mức độ chân thực và chính xác cao, nhưng chúng đòi hỏi mức độ tính toán vô cùng lớn Do đó, chúng không được sử dụng rộng rãi trong việc tạo hoạt ảnh thời gian thực Ngoài ra, việc tạo

mô hình một khuôn mặt cụ thể theo phương pháp này cũng đòi hỏi những điều chỉnh phức tạp và tốn công sức

Hình 1.3: Mô hình cơ vòng của Waters

1.2.2.5 Mô hình cơ của Waters

Waters [43, 31] đã đưa ra một mô hình cơ rất thành công, bao gồm ba loại cơ: các cơ vectơ có chức năng kéo, các cơ vòng có chức năng siết và các cơ phiến dành cho vùng cơ trên mắt (Frontalis – cơ chẩm trán) Cơ vòng co rút xung quanh một tâm

Trang 22

15 điểm ảo để kéo phần bề mặt bao quanh những phần như miệng, cũng giống như việc thắt chặt tại đầu một túi lưới (xem Hình 1.3) Một cơ phiến bao gồm các sợi gần như song song, nằm thành nhiều bó Khi co rút, da không chỉ bị kéo tới các điểm chèn (insertion point) của một sợi, mà tới các điểm chèn của tất cả các sợi (xem Hình 1.4)

Hình 1.4: Mô hình cơ phiến của Waters

Hình 1.5: Mô hình cơ vectơ của Waters

Cũng như Platt và Badler [33], Waters dùng một mô hình lò xo khối để mô phỏng da và các cơ vectơ Tuy nhiên, các cơ của Waters có tính chất định hướng (vectơ), nhờ vậy chúng không phụ thuộc vào dạng topo của khuôn mặt Mỗi cơ có một vùng tác động, như mô tả trong Hình 1.5

Các cơ được tạo mô hình dưới dạng một vectơ chạy từ v tới 2 v 1 R và s R lần f

lượt biểu diễn bán kính suy giảm (fall-off radius) bắt đầu và kết thúc Đỉnh mới 'p của một đỉnh p ngẫu nhiên nằm trên lưới bên trong hình viên phân (segment) v1p r p s, dọc theo vectơ (p,v1), được tính như sau:1

cos'

1

1

pv

pv kr p

Trang 23

16 trong đó  là góc tạo bởi vectơ (v1,v2) và (v1,p), D là v1 p , k là một hằng số

cố định biểu diễn độ co giãn của da, và r là tham số dịch chuyển của tia (radial

cos

)(

1

m s r n s

f s

m n s

p p p p p

R R

R D

p p v p

R D r

vïngtrongnbª n»mvíi

vïngtrongnbª n»mvíi

Vấn đề của mô hình này nảy sinh khi một đỉnh lưới chịu tác động của các hành động đa cơ Waters kết hợp những hành động cơ này bằng cách lần lượt áp dụng sự dịch chuyển do chúng gây nên trên từng đỉnh Khi đỉnh được dịch ra ngoài phạm vi ảnh hưởng của các vectơ cơ liền kề, và sự co rút trở nên bằng nhau, thì phương pháp này cho những kết quả bất tự nhiên, điều này đã được Wang [42] chỉ rõ Wang sử dụng một phương pháp khác là lấy tổng các dịch chuyển rồi áp dụng nó cho đỉnh lưới Bản thân cách làm này cũng gây nên những kết quả kỳ lạ như biểu diễn tại Hình 1.12 (j) và 1.13 (b) Cả Waters và Wang đều cố gắng sửa lỗi này thông qua việc rút bớt dịch chuyển của đỉnh bằng khoảng cách dịch chuyển tối đa Quá trình này đòi hỏi phải xác định được sự dịch chuyển tối đa của mỗi đỉnh riêng biệt, mà đây lại là một nhiệm vụ khó khăn Việc xác định khoảng cách này như là mức dịch chuyển tối đa (mà mỗi hành động co cơ cực độ có thể tạo nên) sẽ không thể giải quyết triệt để vấn đề, vì đỉnh vẫn bị dịch ra khỏi vùng ảnh hưởng của cơ Việc xác định khoảng cách này như là mức dịch chuyển tối thiểu (mà mỗi hành động co cơ cực độ có thể tạo nên), sẽ làm rút bớt sự dịch chuyển một cách sai lầm khi một cơ đơn co lại Tôi sẽ quay lại tìm lời giải cho bài toán này ở Phần 1.4

1.2.3 Môi

Môi là một bộ phận rất cơ động của khuôn mặt Chúng có thể di chuyển theo nhiều hướng khác nhau Khi có biểu hiện tức giận, hai môi mím chặt với nhau Khi nói chuyện và sử dụng những âm tiết như “ô”, môi mở ra và tạo thành dạng phễu Khi cười, môi chìa ra và có chiều hướng lên; khi buồn, môi chìa ra và có chiều đi xuống Đôi môi cũng cũng là một bộ phận rất diễn cảm của khuôn mặt và chúng tham gia vào việc giải nghĩa lời nói Do vậy, việc tạo được mô hình môi và cử động môi chân thực

là đòi hỏi lớn đối với một hệ thống hoạt ảnh mặt chất lượng cao

Là một bộ phận của khuôn mặt, môi thường được tạo hình và làm biến đổi theo cách thức tạo mô hình khuôn mặt Ví dụ, trong mô hình khuôn mặt của Parke [29], hay trong mô hình khuôn mặt Gretta [32], đôi môi được biểu diễn bằng một lưới phụ của các đa giác nằm trên toàn bộ khuôn mặt Mặt khác, đôi môi của mô hình khuôn mặt Waite [41], là một phần của bề mặt đường cong B-spline biểu diễn toàn bộ khuôn mặt King và cộng sự [22] tách biệt môi ra khỏi mô hình khuôn mặt và tạo mô hình riêng

Trang 24

17 cho môi để nâng cao độ chân thực của hoạt ảnh khuôn mặt Trong khi khuôn mặt vẫn được biểu diễn bằng một lớp da các đa giác, thì môi lại được biểu diễn bằng bề mặt đường cong B-spline với một lưới điều khiển 16x9 Cần lưu ý rằng, vì môi chỉ là một phần nhỏ của cả khuôn mặt, và trên môi hầu như không có nếp nhăn, nên phương pháp này không mắc phải những nhược điểm của bề mặt B-spline Ngoài ra, bề mặt B-spline được chọn bởi ưu điểm dễ biến đổi bề mặt bằng cách di chuyển các đỉnh điều khiển, trong khi bề mặt vẫn giữ được độ mịn sau khi đã có biến đổi hình dạng Mô hình môi của King và cộng sự [22] có tính chất hình học của môi cả bên ngoài lẫn bên trong Hình bên ngoài chứa toàn bộ vùng đỏ của môi Hình bên trong chứa màng nhầy bên trong môi Hình bên trong này rất quan trọng để tạo nên độ chân thực khi miệng

mở ra Nó giúp che dấu các góc cạnh khi nhìn vào môi từ bên ngoài Cử động môi được điều khiển bằng một tập hợp các tham số Ngoại trừ các tham số quai hàm và cơ vòng, mọi tham số khác đều được điều chỉnh theo phép biến đổi vectơ các đỉnh lưới điều khiển Cơ vòng miệng làm co hình dạng của đôi môi thành hình ô van, đồng thời cũng đẩy môi nhô ra Các tham số quai hàm làm môi dưới hạ xuống khi miệng mở ra, đẩy môi dưới nhô ra, thụt vào, kéo nó về phía này hay phía kia Sau các biến đổi, bề mặt B-spline được đa giác hóa thành một lớp da gồm các đa giác với dạng tôpô được xác định trước theo mục đích kết xuất Dạng tôpô được xác định trước lại được kết nối với phần còn lại của hình khuôn mặt, sao cho đôi môi có thể được kết xuất như một bộ phận của mô hình khuôn mặt tổng thể

1.3 Một mô hình khuôn mặt 3D cho ứng dụng thời gian thực

Trong luận văn này, tôi nghiên cứu việc nhân bản chuyển động từ một mô hình khuôn mặt 3D do Bùi Thế Duy và cộng sự [7] phát triển Mô hình khuôn mặt này chủ yếu dựa trên việc mở rộng mô hình cơ vectơ của Waters [43], vì phương pháp này được xây dựng trên nền tảng vật lý học, đồng thời không đòi hỏi quá nhiều tính toán

để tạo hoạt ảnh thời gian thực Phần mở rộng mô hình của Waters sẽ được bàn đến ở Phần 1.4

Các hành động quay của mí mắt và quai hàm có phần phức tạp hơn so với các

cơ vectơ Hiệu ứng của chúng trông giống việc quay những phần cụ thể trên khuôn mặt quanh một trục Trong trường hợp này, các kỹ thuật hoạt ảnh tham số hóa có ưu thế hơn so với các kỹ thuật dựa trên hệ cơ Các cơ vòng miệng phức tạp đến mức không thể tạo hình bằng mô hình cơ vòng của Waters Như thể hiện trong hình 1.3, cơ vòng của Waters chỉ tạo được hiệu ứng kéo môi lại gần nhau, tới một tâm điểm ảo, còn hành động của cơ vòng miệng thực phức tạp hơn rất nhiều (xem Hình 1.6)

Trang 25

18

Hình 1.6: Hành động của cơ vòng miệng thực: (a) chìa môi và (b) mím môi

Bùi Thế Duy và cộng sự [7] cũng áp dụng phương pháp của King và cộng sự [22] và dùng các kỹ thuật hoạt ảnh tham số hóa để tạo mô hình hành động của cơ vòng miệng

Với mục đích chủ yếu là tạo nên biểu hiện khuôn mặt chân thực với những nếp nhăn chi tiết, nên lớp da đa giác được chủ yếu sử dụng cho việc tạo mô hình khuôn mặt Bởi những ưu điểm đối với một bề mặt mịn và nhỏ, King và cộng sự [22] phân tách đôi môi ra khỏi mô hình chung và tạo hình môi bằng một bề mặt đường cong B-spline Để làm mô hình hoạt ảnh khuôn mặt, ta phải thận trọng trong việc lựa chọn các

kỹ thuật phù hợp Mặc dù các kỹ thuật khung cơ sở, tham số hóa, dựa trên hệ thống cơ giả đều tạo được hoạt ảnh trong thời gian thực, nhưng chúng đều không thể cho kết quả biểu hiện khuôn mặt chân thực, bởi vì chúng không tạo được những chỗ phình và nếp nhăn trên da, cũng không xử lý được những tương tác đa cơ, đa tham số Mặt khác, các phương pháp dựa trên hệ cơ đa lớp, với nhiều lớp cấu trúc của khuôn mặt, cho phép tạo nên những biểu hiện chân thực, tuy nhiên chúng đòi hỏi lượng tính toán rất lớn, và cũng không đạt được hoạt ảnh thời gian thực ở những máy tính cá nhân thông thường

Mô hình khuôn mặt của Bùi Thế Duy và cộng sự [7] gồm một lưới đa giác làm mặt và một bề mặt B-spline làm môi, như biểu diễn trên Hình 1.7

Hình 1.7: (a) Khuôn mặt khung lưới cùng các cơ; (b) khuôn mặt bình thường; và

(c) hiệu ứng của cơ gò má lớn bên trái

Trang 26

19 Lưới mặt gồm các đa giác hình tam giác với các đỉnh được sắp xếp theo từng vùng Lưới mặt được chia thành nhiều vùng nhằm nâng cao hiệu quả của mô hình cơ Cách này giúp làm giảm vẻ giả tạo dễ nhận thấy bằng mắt thường do sự di chuyển của các đỉnh trong những vùng không chịu tác động của sự co cơ Thông thường, sự di chuyển các đỉnh đa giác khi co cơ được điều khiển bởi miền tác động của cơ, mà miền này được định dạng trước và không phụ thuộc vào lưới mặt Tuy nhiên, trong một số trường hợp, miền tác động này không thể chứa đựng chính vùng cần tác động trên mô hình khuôn mặt Ví dụ, nếu không xác định các vùng mí mắt, thì các đa giác trên mí mắt có thể bị các cơ chẩm trán làm biến dạng, vì mí mắt có thể nằm trong miền ảnh hưởng của các cơ đó, và kết quả là những hoạt ảnh phi tự nhiên của khuôn mặt Bùi Thế Duy và cộng sự [7] cũng sử dụng cách chia vùng để nâng cao hiệu quả của mô hình cơ Để làm khuôn mặt biến đổi bằng một cơ nhất định, thì thuật toán dành cho mô hình cơ đó phải tìm kiếm tất cả các đỉnh trên lưới mặt nằm trong miền ảnh hưởng của

cơ Cách chia vùng được sử dụng nhằm giảm bớt việc tìm kiếm này, bằng cách bỏ qua những đỉnh không nằm trong các vùng mà cơ đó tác động tới Vấn đề này sẽ được bàn thêm ở phần sau

Như trên đã nói, Bùi Thế Duy và cộng sự [7] chọn bề mặt B-spline đơn giản để biểu diễn đôi môi, nhằm đảm bảo độ mịn của môi sau khi môi biến dạng dưới tác động của các cơ Sau đó, bề mặt B-spline của môi được đa giác hóa thành một dạng topo được xác định trước, gồm các đỉnh và tam giác, được xây dựng nhằm mục đích kết xuất Các đỉnh được nối với nhau và liên kết với phần còn lại của mô hình khuôn mặt theo một cách định trước Kế tiếp, đôi môi được kết xuất như một phần của mô hình khuôn mặt tổng thể (phần 1.3.2) Toàn bộ khuôn mặt được kết xuất bằng phép tô bóng Phong [10] dựa trên công nghệ OpenGL

1.3.1 Lưới mặt

Ban đầu, Bùi Thế Duy và cộng sự [7] xây dựng lưới mặt bằng dữ liệu thu từ một máy quét 3D Dữ liệu này được xử lý nhằm nâng cao hiệu quả hoạt ảnh, đồng thời giữ được chất lượng cao của mô hình Quá trình xử lý gồm hai bước

Bước 1, Bùi Thế Duy và cộng sự [7] giảm số đỉnh và số đa giác ở một số phần trên khuôn mặt Lấy ý tưởng từ Parke [29] và Pasquariello và Pelachaud [32], họ chỉ giữ ít đỉnh và đa giác ở những phần không biểu cảm Số lượng lớn đa giác được duy trì tại những phần biểu cảm, tức là những vùng quanh mắt, mũi, miệng và trán Sau cùng, tổng số đa giác giảm xuống đáng kể Bắt đầu với khoảng 30.000 đa giác, mô hình khuôn mặt 3D dạng chuẩn của Bùi Thế Duy và cộng sự [7] chỉ gồm 2.480 đỉnh và 4.744 đa giác Việc giảm đa giác tại những phần khác làm tăng tốc độ hoạt ảnh Tuy nhiên, phương pháp này vẫn vướng mắc bởi mức độ chi tiết của những phần biểu cảm trên khuôn mặt (những phần liên quan đến việc truyền tín hiệu giao tiếp và biểu hiện cảm xúc)

Trang 27

20 Bước 2, Bùi Thế Duy và cộng sự [7] chia mô hình khuôn mặt thành các vùng Việc chia vùng đã được áp dụng trong Greta [32], nhằm giảm bớt và điều khiển sự di chuyển các đỉnh đa giác (do các tham số hoạt ảnh mặt gây nên) Tương tự như vậy, họ

sử dụng kỹ thuật này nhằm điều khiển sự biến đổi của các đỉnh đa giác do sự co cơ gây

ra Như trên đã nói, điều này giúp làm giảm sự giả tạo dễ nhận thấy bằng mắt thường,

do sự di chuyển của các đỉnh trong những vùng không chịu tác động của co cơ Phần 1.4.1 sẽ bàn về những công trình khác sử dụng cách chia vùng nhằm tăng tốc độ xử lý thuật toán của mô hình cơ

Các cơ khuôn mặt con người tập trung vào sáu vùng chủ yếu trên khuôn mặt: vùng bên trái và phải của phần mặt dưới, giữa và trên Dựa vào đó, Bùi Thế Duy và cộng sự [7] chia mô hình khuôn mặt thành 11 vùng:

(1) vùng mặt dưới bên phải, (2) vùng mặt giữa bên phải, (3) vùng dưới mí mắt bên phải, (4) vùng trên mí mắt bên phải, (5) vùng mặt trên bên phải (6) vùng mặt dưới bên trái, (7) vùng mặt giữa bên trái, (8) vùng dưới mí mắt bên trái, (9) vùng trên mí mắt bên trái, (10) vùng mặt trên bên trái (11) vùng không hoạt ảnh, bao gồm phần còn lại của đầu

Hình 1.8 mô tả các vùng nằm bên phải mô hình khuôn mặt, còn các vùng nằm ở bên trái mô hình khuôn mặt cũng có vị trí tương tự

Hình 1.8: Chia vùng trên phần khuôn mặt bên phải

Trang 28

21 Sau khi chia mô hình khuôn mặt thành từng vùng, để tăng tốc độ thuật toán của

mô hình cơ, ta phải xác định những vùng nào chịu tác động của loại cơ nào Bùi Thế Duy và cộng sự [7] nhận thấy rằng cách chia vùng như trên khiến công việc này trở nên đơn giản hơn Ta cũng có thể chia mô hình khuôn mặt thành những vùng nhỏ hơn, như ở mô hình khuôn mặt Greta [32] Tuy nhiên, điều này khiến công việc tìm kiếm các vùng chịu chịu tác động của một cơ nào đó trở nên khó khăn hơn Ngược lại, việc chia mô hình khuôn mặt thành những vùng lớn hơn sẽ làm giảm số vùng, làm giảm khả năng tăng tốc độ thuật toán của mô hình cơ

Bùi Thế Duy và cộng sự [7] sắp xếp lại các đỉnh của lưới mặt trong file dữ liệu (lấy từ máy quét) thành từng vùng Họ nhập thêm một file mô tả đơn giản đi kèm theo file dữ liệu, kiểu như:

1.3.2 Mô hình môi

Mô hình môi của Bùi Thế Duy và cộng sự [7] được xây dựng dựa trên nghiên cứu của King và cộng sự [22], bắt đầu từ một bề mặt B-spline với lưới điều khiển có kích thước 24x6 Hình 1.9 biểu diễn đôi môi như vậy cùng các đỉnh điều khiển của môi

Để làm môi biến đổi, các cơ mặt di chuyển các điểm điều khiển của bề mặt spline thay vì tác động trực tiếp tới các đỉnh của lưới môi Khi đó, các điểm điều khiển được dùng để tái xác định kết quả công thức của bề mặt B-spline Bề mặt B-spline được đa giác hóa, để liên kết với phần còn lại của mô hình khuôn mặt, nhằm mục đích kết xuất Tại các bước tiền xử lý, các đa giác tạo nên đôi môi ban đầu được tách khỏi

B-mô hình khuôn mặt Hình 1.10 (a) là hình ảnh B-mô hình khuôn mặt không có B-môi Mỗi khi thay đổi bề mặt B-spline của đôi môi, thì bề mặt này lại được tái lập bởi các đỉnh được sắp xếp lại trong một lưới Những đỉnh này được phân bố đều trên bề mặt B-spline Các đỉnh lấy mẫu được nối lại để tạo nên một lưới tam giác Lưới này liên kết với phần còn lại của mô hình khuôn mặt Điều này được thể hiện trên Hình 1.10(b) Sau đó, đôi môi có thể được kết xuất là một bộ phận của toàn bộ khuôn mặt

Trang 29

22

Hình 1.9: Đôi môi (bên trái) và các điểm điều khiển của môi (bên phải)

Hình 1.10: (a) Lưới mặt không có môi; và (b) môi kết hợp với toàn bộ lưới mặt

1.4 Các cơ làm khuôn mặt hoạt ảnh

Trong phần này, tôi sẽ mô tả các cơ điều khiển hoạt ảnh của khuôn mặt Các cơ này chủ yếu dựa vào mô hình cơ của Waters [43, 31] Như trên đã nói, Waters tạo mô hình cho ba loại cơ: các cơ vectơ được dùng cho phần lớn cơ mặt, các cơ phiến cho cơ chẩm trán, và các cơ vòng cho cơ vòng miệng

Bùi Thế Duy và cộng sự [8] đã mở rộng mô hình cơ vectơ để nâng cao hiệu quả kết hợp giữa các hành động đa cơ, nhằm tạo ra những chỗ phình và nếp nhăn, và làm tăng tốc độ hoạt ảnh (Phần 1.4.1) Đối với cơ chẩm trán, họ dùng một tập hợp cơ vectơ thay cho cơ phiến, bởi vì trán không hoàn toàn phẳng Cơ vòng miệng khá phức tạp Như đã nói ở trên, việc tạo mô hình cơ này bằng loại cơ vòng của Waters không cho kết quả hình ảnh chân thực Bùi Thế Duy và cộng sự [8] áp dụng phương pháp của King và cộng sự [22] để tạo mô hình cơ này bằng kỹ thuật tham số hóa (Phần 1.4.2) Đối với cơ vùng mí mắt và cơ chuyển động hàm, các kỹ thuật dựa trên hệ thống cơ không thích hợp Trong trường hợp này, các kỹ thuật hoạt ảnh tham số hóa được dùng nhiều hơn, vì cơ vùng mí mắt và cơ chuyển động hàm không thực sự tạo ra những chỗ phình và nếp nhăn (những chi tiết này sẽ được mô tả lần lượt ở các Phần 1.4.3 và 1.4.4) Bùi Thế Duy và cộng sự [8] cũng tiến hành thuật toán dõi mắt do Parke [30] xây dựng, để cho phép biểu diễn hành vi nhìn chăm chú, nội dung này sẽ được trình bày ở Phần 1.4.5

Bảng 1.1 liệt kê tất cả các cơ nằm ở phần bên phải khuôn mặt Chúng cũng được thể hiện trong Hình 1.7(a) và Hình 1.11 Hình 1.7(c) là ví dụ về tác động của một

cơ mặt

Trang 30

23

Bảng 1.1: Các cơ trên mô hình khuôn mặt (ở phần khuôn mặt bên phải)

STT Tên cơ Vùng ảnh hưởng

1 Cơ gò má lớn bên phải 1,2

2 Cơ gò má nhỏ bên phải 2

3 Cơ hạ góc miệng bên phải 1,2

4 Cơ cười bên phải 1,2

5 Cơ hạ môi dưới bên phải 1

6 Cơ cằm bên phải 1

7 Cơ vòng miệng (đẩy môi ra) Mô hình môi

8 Cơ vòng miệng (mím môi lại) Mô hình môi

9 Cơ chẩm trán trong bên phải 5,10

10 Cơ chẩm trán ngoài bên phải 5

11 Cơ mũi bên phải 2,5

12 Cơ nâng môi trên cánh mũi bên phải 2,5

13 Cơ hạ mày bên phải 2,5

14 Cơ nhăn mày bên phải 2,5

15 Cơ đồng hạ mày bên phải 2,5

Trang 31

24

1.4.1 Các cơ vectơ

Như đã nói ở phần 1.2.2, Bùi Thế Duy và cộng sự [8] cải tiến mô hình cơ vectơ của Waters [43] để làm giảm sự giả tạo của khuôn mặt trong quá trình tác động của hệ thống cơ Tiếp đó, họ bổ sung một cơ chế nhằm tạo ra các nếp nhăn và chỗ phình, để tăng tính chân thực của các biểu hiện trên khuôn mặt Cuối cùng Bùi Thế Duy và cộng

sự [8] sử dụng các kỹ thuật làm giảm lượng tính toán đối với mô hình cơ, để nâng cao hiệu quả hoạt ảnh

Kết hợp các hành động đa cơ

Các cơ mặt của con người co rút song song trong quá trình tạo nên biểu hiện khuôn mặt Bùi Thế Duy và cộng sự [8] kết hợp các loại co cơ trong mô hình khuôn mặt bằng cách mô phỏng tính chất song song của chúng Đối với một đỉnh nằm trong miền ảnh hưởng của một cơ nào đó, họ lần lượt áp dụng các mức co thấp là c đối với đỉnh, cho đến khi không còn hành động co cơ nào khác Giá trịc nhỏ tạo được sự mô phỏng tính chất song song chính xác hơn, nhưng nó cũng đòi hỏi nhiều tính toán hơn Sau các phép thử, họ nhận thấy c bằng 0.2 (giá trị tối đa của mức co cơ là 1.0) cho kết quả thích hợp nhất mà vẫn đáp ứng yêu cầu hoạt ảnh trong thời gian thực

Mỗi khi diễn ra sự co cơ (dù rất ít), thì sự biến đổi của đỉnh (nằm trong miền ảnh hưởng của các cơ co rút) trước tiên được tính toán riêng biệt, rồi sau đó các biến đổi này được tổng hợp và áp dụng đối với đỉnh Ngay khi đỉnh di chuyển ra khỏi miền ảnh hưởng của một cơ, thì nó không còn chịu tác động của cơ đó nữa

Phương pháp sử dụng c= 0.2 cho kết quả như Hình 1.12(f) và 1.13(a) So sánh với việc chỉ thêm vectơ biến đổi trong Hình 1.12(j) và 1.13(b), rõ ràng kết quả chân thực và tự nhiên hơn Hình 1.14 là ví dụ về cách thức áp dụng phương pháp này vào

mô hình khuôn mặt của Bùi Thế Duy và cộng sự [8]: khi muốn khuôn mặt có biểu hiện buồn, nếu chỉ đơn thuần biến đổi đỉnh, thì giữa hai lông mày sẽ xuất hiện những vạch giả tạo Phương pháp này cũng được áp dụng đối với các cơ vòng miệng và cơ vòng mắt Lưu ý là phép tính sự biến đổi của cơ chỉ lặp đi lặp lại vài lần (5 lần với c= 0.2) Điều này giúp mô hình cơ của Bùi Thế Duy và cộng sự [8] tạo được hoạt ảnh thời gian thực trên một máy tính cá nhân thông thường

Trang 32

25

Hình 1.12: Tác động của cơ đơn lên lưới (a và b); Tác động của hai cơ lên lưới (biểu diễn theo từng bước) bằng cách mô phỏng tính chất song song (c,d,e,f) và

bằng cách thêm sự biến đổi (g,h,i,j)

Hình 1.13: Tác động của ba cơ lên lưới mặt: bằng cách mô phỏng các đường song

song (a) và bằng cách thêm sự biến đổi (b)

Hình 1.14: Khi có biểu hiện buồn, xử lý sự co cơ đối với cặp lông mày: bằng cách

mô phỏng các đường song song (a) và bằng cách thêm sự biến đổi (b)

Trang 33

có biểu hiện ngạc nhiên, sợ hãi, buồn bã; nhưng những biểu hiện tức giận, khinh bỉ hay hạnh phúc không tạo nên chúng

Các phương pháp tham số hóa hoặc dựa trên hệ thống cơ giả thường không thể tạo được các nếp nhăn bởi vì chúng không xét đến khía cạnh giải phẫu học của khuôn mặt Với các kỹ thuật tạo chất liệu (như tạo bề mặt sần) hay tạo mô hình dựa trên vật

lý học, ta dễ có được các nếp nhăn hơn Wu và cộng sự [50] dùng một mô hình dựa trên vật lý học, với dạng giải phẫu học phần đầu giản đơn, không xương, nhằm tạo ra những nếp nhăn tức thời và những nếp nhăn cố hữu, dựa trên các tính chất co giãn - kết dính - mềm dẻo của da mặt Tính chất kết dính tạo nên các nếp nhăn tức thời xảy ra khi co cơ, tính mềm dẻo chịu trách nhiệm về các nếp nhăn cố hữu Nhưng kỹ thuật dựa trên vật lý học như thế này lại đòi hỏi lượng tính toán lớn; do đó nó không thích hợp với hoạt ảnh thời gian thực

Moubaraki và cộng sự [27] sử dụng kỹ thuật tạo bề mặt sần để làm các nếp nhăn hiển thị và biến đổi mà không cần di chuyển các đỉnh, thông qua việc tạo ra những xáo động của các pháp tuyến bề mặt và điều chỉnh độ bóng của bề mặt Nhờ các hàm nếp nhăn được xác định trước, các nếp nhăn tùy ý có thể xuất hiện trên một bề mặt hình học phẳng Kỹ thuật này dễ dàng tạo ra nếp nhăn bằng cách thay đổi các tham số trong hàm nếp nhăn Kỹ thuật tạo bề mặt sần thường được dùng để tạo ra các nếp nhăn trên trán hoặc các nếp nhăn cố hữu, như trong mô hình khuôn mặt Greta [32] Kỹ thuật tạo bề mặt sần đòi hỏi lượng tính toán tương đối lớn, gần gấp đôi kỹ thuật tạo chất liệu màu truyền thống

Đối với mô hình khuôn mặt dựa trên các mảng spline, các viên phân spline cũng được dùng để tạo các chỗ phình và nếp nhăn Tuy nhiên, cách tiếp cận này cần thêm nhiều điểm điều khiển để biễu diễn các nếp nhăn Điều này khiến mô hình khuôn mặt phức tạp hơn nhiều, và do đó nó không phù hợp với hoạt ảnh thời gian thực Trong phần này, tôi tìm hiểu một phương pháp tạo chỗ phình và nếp nhăn đơn giản nhưng hiệu quả đạt được rất chân thực, đồng thời lại phù hợp với mô hình cơ của Waters Để đơn giản hóa, Bùi Thế Duy và cộng sự [8] giả định rằng các cơ nằm song song với lớp da mặt và độ dày của nếp nhăn đối với mỗi cơ là bằng nhau Họ gán các giá trị xác định trước cho độ dày của nếp nhăn và số nếp nhăn (N w) do mỗi cơ tạo ra trong quá trình co rút Những giá trị này được tính toán, có xét đến một mô hình hộp

sọ và khả năng duy trì thể tích

Trang 34

27 Biên độ của nếp nhăn được tính cho tất cả các đỉnh ban đầu (trước khi diễn ra

sự dịch chuyển do sự co cơ tạo nên) nằm trong vùng p l p k v3p t (xem Hình 1.15), trong

đó khoảng cách từ p và l p tới k p t p r bằng:

cos4

34

Hình 1.15: Miền chứa các nếp nhăn được tạo bởi sự co rút của một cơ vectơ

Biên độ của nếp nhăn tại một đỉnh p là một hàm của khoảng cách l từ p tới

và   làm tròn một số thực thành số nguyên lớn nhất nhỏ hơn nó Chúng ta sử dụng một chuỗi đường parabôn để biểu diễn hàm nếp nhăn (xem Hình 1.16) như sau:

2 2

Trang 35

28 đỉnh nằm bên trong miền ảnh hưởng của đa cơ, Bùi Thế Duy và cộng sự [8] chỉ sử dụng biên độ tối đa của nếp nhăn do những cơ này gây ra

Cần lưu ý rằng hàm nếp nhăn chỉ là một hàm parabol, mà việc tính toán các giá trị của hàm này khá nhanh chóng, nhờ vậy Bùi Thế Duy và cộng sự [8] có thể duy trì hoạt ảnh trong thời gian thực Quay lại Phần 1.2, các thuật toán tô bóng nội suy được dùng để biểu diễn một đường cong liên tục đối với một bề mặt do các đa giác tạo nên Tuy nhiên, nhược điểm của những thuật toán này - được gọi là nhược điểm “pháp tuyến đỉnh không biểu diễn (unrepresentative vertex normal)” – khiến các nếp nhăn không thể hiển thị (xem Hình 1.17) Để khiến các nếp nhăn dễ nhận thấy bằng mắt hơn, Bùi Thế Duy và cộng sự [8] phải khắc phục nhược điểm này ở các đỉnh nằm tại

“chân trong” của các nếp nhăn Những đỉnh này có khoảng cách tới p t p r bằng:

b L

b

b,4 , , 2

2   Thay vì sử dụng những pháp tuyến đỉnh trung bình của các đỉnh, họ

sử dụng pháp tuyến của các đa giác 3 cạnh chứa các đỉnh đó

Hình 1.18(a) là một ví dụ về các nếp nhăn Hình 1.18(b) biểu diễn các nếp nhăn được tạo ra trên trán

Hình 1.17: Bài toán “pháp tuyến đỉnh không biểu diễn” và cách giải

Hình 1.18: Các nếp nhăn do sự co cơ tạo nên

Nâng cao hiệu quả của hoạt ảnh

Mô hình cơ vectơ phù hợp với những mô hình khuôn mặt 3D có số đa giác nhỏ Khi số đa giác tăng lên, để tạo được biểu hiện khuôn mặt chân thực hơn, ta cần lượng tính toán rất lớn, mà điều này lại gây cản trở hoạt ảnh thời gian thực Một cách làm tăng tốc độ hoạt ảnh là cải tiến mô hình cơ bằng một kỹ thuật “đường tắt” [8] Ban đầu, trọng tâm biến đổi mô hình cơ của Waters [44] được biểu diễn như sau:

Với mọi đỉnh

Nếu đỉnh nằm bên trong miền ảnh hưởng của cơ

Trang 36

29

Thì tính toán và cho các đỉnh dịch chuyển

Chúng ta hãy phân tích độ phức tạp của thuật toán Với mỗi cơ, thuật toán phải kiểm tra từng đỉnh trong khung lưới, xem đỉnh đó có nằm bên trong miền ảnh hưởng của cơ không Để làm việc này, thuật toán phải tính khoảng cách từ đỉnh tới đầu cơ

1

pv , phải tính góc pv1p m (Hình 1.5), và cuối cùng là tính một hàm cosin Mức độ phức tạp của thuật toán phụ thuộc vào số đỉnh cần kiểm tra xem chúng có nằm trong vùng ảnh hưởng không

Mô hình khuôn mặt 3D được chia thành các vùng (xem Phần 1.3.1) và khi nắm được vị trí của các cơ mặt, chúng ta biết vùng nào chịu tác động của cơ nào Mỗi cơ đi kèm với một cờ (flag), cho biết nó tác động đến vùng nào trên mô hình khuôn mặt Phép biến đổi ban đầu được sửa lại như sau:

Với mọi đỉnh

Nếu đỉnh nằm bên trong vùng chịu tác động của cơ

Nếu đỉnh nằm bên trong miền ảnh hưởng của cơ

Thì tính toán và cho các đỉnh dịch chuyển

Trước tiên, bằng một phép kiểm tra file mô tả (xem Phần 1.3.1), kỹ thuật này loại

bỏ tất cả các đỉnh nằm bên ngoài vùng chịu tác động của cơ Khi số đỉnh tăng lên, kỹ thuật này sẽ giúp giảm bớt một lượng tính toán khổng lồ (thay vì phải kiểm tra khoảng cách và các góc) Cải tiến này được biểu diễn trên mô hình gồm 2.480 đỉnh tại Bảng 1.2 Tốc độ hoạt ảnh còn có thể làm tăng hơn nữa bằng cách áp dụng một số kỹ thuật biến đổi cổ điển Thứ nhất, cấu trúc dữ liệu đóng vai trò quan trọng trong việc giảm bớt thời gian tính toán Dữ liệu các đỉnh nên được lưu trữ tách rời với dữ liệu đa giác Dữ liệu về các đa giác chỉ chứa liên kết tới các đỉnh Thời gian tính toán được giảm bớt bởi vì lượng tính toán sự dịch chuyển của mỗi đỉnh không cần nhân đôi đối với mỗi đa giác Điều này cũng giúp tránh được việc tính lại pháp tuyến đỉnh trung bình đối với mỗi đỉnh

đa giác trong phép tô bóng của Phong [10] Thứ hai, mọi công việc kiểm tra điều kiện

với các toán tử phép chia và khai căn bậc i được thay thế bằng các toán tử phép nhân và lũy thừa bậc i Bảng 1.2 cũng thể hiện hiệu quả của những kỹ thuật trên

Bảng 1.2: Kết quả của việc áp dụng các kỹ thuật tăng tốc độ hoạt ảnh (trên một máy tính

Pentium III, 800 Mhz, 256MB RAM, Nvidia GeForce3 video card)

Tốc độ hoạt ảnh (số khung trên giây) Trước khi áp dụng phép kiểm tra file mô tả 20.5

Sau khi áp dụng phép kiểm tra file mô tả 30.5

Sau khi áp dụng thêm các kỹ thuật cổ điển 35.0

Trang 37

30

1.4.2 Cơ vòng miệng

Từ góc độ sinh lý học, cơ vòng miệng không đơn thuần là một cơ vòng, mà đó

là sự kết hợp các cơ có thể đưa miệng dịch chuyển theo nhiều hướng khác nhau Biến đổi cơ vòng miệng dựa trên tham số hóa của Bùi Thế Duy và cộng sự [8] dựa trên nghiên cứu của King và cộng sự [22]

Quay lại Phần 1.3.2, đôi môi được biểu diễn bằng một bề mặt B-spline với một lưới điều khiển kích thước 24x6 Trong mô hình của Bùi Thế Duy và cộng sự [8], cơ vòng miệng chỉ tác động tới bề mặt môi Bề mặt bị biến đổi theo sự di chuyển của các điểm điều khiển Dưới đây là mô hình hai hành động của cơ vòng miệng: đẩy môi ra

và mím môi lại

Theo King và cộng sự [22], sự di chuyển của một điểm điều khiển p dưới tác i

động của sự co cơ vòng miệng, và khiến môi bị đẩy ra, được mô tả như sau:

))(('i o i e p i x i

trong đó o là mức co rút của cơ vòng miệng;  là độ xoay cực đại do nếp nhăn trên môi gây ra, độ xoay bằng 20o, và môi trên và môi dưới xoay theo các hướng ngược chiều nhau; x là mức đẩy ra cực đại do sự co rút của cơ vòng miệng; và i e i ( p) biểu

diễn một vectơ cử động để di chuyển điểm điều khiển p tới một điểm nằm trên đường elip, được tạo ra bởi sự co cơ vòng Điều này được mô tả tại Hình 1.19(a)

Sự di chuyển điểm điều khiển dưới tác động của sự co cơ vòng miệng, và khiến môi mím lại, được mô tả như sau:

))(('i o i e p i

p   

trong đó o là mức co rút của cơ vòng miệng;  là độ xoay cực đại do hành động mím môi gây ra, độ xoay bằng 20o, và theo chiều ngược lại với hành động đẩy môi ra ngoài;

e i ( p) biểu diễn một vectơ cử động để di chuyển điểm điều khiển p tới một điểm

nằm trên đường elip, được tạo ra bởi sự co cơ vòng miệng Điều này được mô tả tại Hình 1.19(b) Hình 1.20 thể hiện sự biến đổi của môi do sự co cơ vòng miệng gây ra

Hình 1.19: Mô tả hành động của cơ vòng miệng: đẩy môi ra (a); mím môi lại (b)

Trang 38

31

Hình 1.20: Sự biến đổi của môi dưới tác động của sự co cơ vòng miệng: dạng bình

thường (a); đẩy môi ra (b) và mím môi lại (c)

1.4.3 Cơ vòng mắt

Cơ vòng mắt gồm hai phần: cơ vòng mắt trên (điều khiển sự nhắm/mở mắt), và

cơ vòng mắt dưới (điều khiển sự ép mắt)

Đối với việc đóng và mở mí mắt, Bùi Thế Duy và cộng sự [8] dùng thuật toán của Parke [30] Mí mắt mở và đóng nhờ việc kết hợp sự biến đổi của kỹ thuật ánh xạ cầu (spherical mapping technique) với phép nội suy tuyến tính Còn hành động ép mắt được tiến hành nhờ cơ vòng, được trình bày trong Waters [43] Ta lưu ý rằng việc đóng mí mắt và ép mắt thường xảy ra cùng nhau Việc ép mắt dẫn đến hành động đóng

mí mắt Việc đóng mí mắt cũng dẫn đến ép mắt khi một người cố gắng chỉ nhắm một trong hai mắt Mối quan hệ này được thể hiện bằng việc điều chỉnh mức co của cơ vòng mắt trên (cclosing) và cơ vòng mắt dưới (csqueezing) ở một mắt như sau:

if csqueezing > 0.5 cclosing then

cclosing = max (1.0, 2 ∙ csqueezing)

Trang 39

32

Để tạo được một cái miệng hình ô van một cách tự nhiên, thì các đỉnh nằm tại môi dưới phải xoay với mức độ khác nhau Các đỉnh nằm ở giữa môi dưới xoay cùng mức với quai hàm Mức xoay giảm đi đối với các đỉnh nằm gần khóe miệng hơn Khóe miệng chỉ xoay bằng 1/3 mức xoay của quai hàm Môi trên cũng chịu ảnh hưởng của quai hàm xoay Các đỉnh tại môi trên bị kéo xuống với mức độ khác nhau Mức độ này bằng 0 với các đỉnh nằm ở giữa môi trên Mức độ bị kéo tăng lên với các đỉnh nằm gần khóe miệng hơn

1.4.5 Xoay tròng mắt

Hành vi nhìn là một phần của khả năng diễn đạt không qua ngôn ngữ, ví dụ như chạm mắt nhau hay các biểu hiện cảm xúc Để có được hành vi nhìn, ta tiến hành thuật toán dõi mắt (eye tracking) do Parke [30] đưa ra Thuật toán này được thiết kế để tính

các góc định hướng (orientation angles) của hai mắt, Ar , Al và Blr , sao cho mắt có

thể dõi theo một mục tiêu nào đó (xem Hình 1.22) Mỗi khi vị trí của mục tiêu cần theo dõi thay đổi, thì giá trị các góc định hướng mắt được cập nhật theo Khi đó, mắt

Trang 40

Hình 1.24 mô tả cách thức các nếp nhăn và việc xử lý các hành động đa cơ làm nâng cao hiệu quả biểu đạt của khuôn mặt Phương pháp của Bùi Thế Duy và cộng sự [8] giúp loại bỏ hình ảnh giả tạo xuất hiện giữa hai lông mày Với việc hiển thị các nếp nhăn, biểu hiện của khuôn mặt trông chân thực và dễ nhận biết hơn

Hình 1.24: Khuôn mặt buồn khi có (a) và khi không có (b) các nếp nhăn và việc

xử lý hành động co đa cơ

Một số ví dụ về biểu hiện cảm xúc trên khuôn mặt được thể hiện trong các Hình 1.25, 1.26 và 1.27 Có thể nhận thấy hành động xoay quai hàm tự nhiên trên khuôn mặt ngạc nhiên (Hình 1.25) Cũng trên khuôn mặt ngạc nhiên, việc kết hợp các cơ chẩm trán tạo nên những nếp nhăn có thể nhìn thấy rõ trên trán (khi lông mày nhướn lên) Các chỗ phình tự nhiên ở vùng dưới cánh mũi qua khóe miệng (được tạo bởi các

cơ gò má) xuất hiện trên khuôn mặt hạnh phúc Đôi môi trông mịn hơn sau khi các cơ

Ngày đăng: 25/03/2015, 10:01

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Ahlberg, J. (2001), “Candide-3 – an updated parameterized face”, Technical Report Report No. LiTH-ISY-R-2326, Dept. of Electrical Engineering, Linkping,University, Sweden Sách, tạp chí
Tiêu đề: Candide-3 – an updated parameterized face”, "Technical Report Report No. LiTH-ISY-R-2326
Tác giả: Ahlberg, J
Năm: 2001
2. André, E., Herzog, G., and Rist, T. (1997), “Generating multimedia presentations for robocup soccer trò chơis”, In Kitano, H., editor, RoboCup ’97: Robot Soccer World Cup I, pages 200–215. Springer-Verlag, New York Sách, tạp chí
Tiêu đề: Generating multimedia presentations for robocup soccer trò chơis”, In Kitano, H., editor, "RoboCup ’97: Robot Soccer World Cup I
Tác giả: André, E., Herzog, G., and Rist, T
Năm: 1997
3. Bishop, C. M. (1995), Neural Networks for Pattern Recognition. Oxford University Press, Oxford Sách, tạp chí
Tiêu đề: Neural Networks for Pattern Recognition
Tác giả: Bishop, C. M
Năm: 1995
5. Bors, A. G., Gabbouj, G. (1994), “Minimal topology for a radial basis function neural network for pattern classification”, Digital Signal Processing: a review jounal, vol. 4, no. 3, pp. 172-188 Sách, tạp chí
Tiêu đề: Minimal topology for a radial basis function neural network for pattern classification”, "Digital Signal Processing: a review jounal
Tác giả: Bors, A. G., Gabbouj, G
Năm: 1994
6. Broomhead, D. S. and Lowe, D. (1988), “Multivariable functional interpolation and adaptive networks”, Complex Systems, vol. 2, pages 321-355 Sách, tạp chí
Tiêu đề: Multivariable functional interpolation and adaptive networks”, "Complex Systems
Tác giả: Broomhead, D. S. and Lowe, D
Năm: 1988
7. Bui The Duy, Heylen, D., and Nijholt, A. (2003a), “Improvements on a simple muscle-based 3d face for realistic facial expressions”, In 16th InternationalConference on Computer Animation and Social Agents (CASA-2003), pages 33–40, Los Alamos, CA. IEEE Computer Society Sách, tạp chí
Tiêu đề: Improvements on a simple muscle-based 3d face for realistic facial expressions”, In "16th International "Conference on Computer Animation and Social Agents (CASA-2003)
8. Bui The Duy, Heylen, D., Poel, M., and Nijholt, A. (2003b), “Exporting vector muscles for facial animation”. In Butz, A., Krger, A., and Olivier, P., editors,Proceedings International Symposium on Smart Graphics 2003, Berlin, Lecture Notes in Computer Science, Springer Sách, tạp chí
Tiêu đề: Exporting vector muscles for facial animation”. In Butz, A., Krger, A., and Olivier, P., editors, "Proceedings International Symposium on Smart Graphics 2003
9. Bui The Duy, Poel, M., Heylen, D., and Nijholt, A. (2003c), “Automatic face morphing for transferring facial animation”, In Proceedings 6th IASTED International Conference on Computers, Graphics, and Imaging (CGIM 2003),Anaheim/Calgary/Zurich, ACTA Press Sách, tạp chí
Tiêu đề: Automatic face morphing for transferring facial animation”, In "Proceedings 6th IASTED International Conference on Computers, Graphics, and Imaging (CGIM 2003)
10. Bui Tuong Phong (1975), “Illumination for computer generated pictures”, Communications of the ACM, 18(6) Sách, tạp chí
Tiêu đề: Illumination for computer generated pictures”, "Communications of the ACM
Tác giả: Bui Tuong Phong
Năm: 1975
11. Cassell, J., Sullivan, J., Prevost, S., and Churchill, E., editors (2000), Embodied Conversational Agents, The MIT Press Sách, tạp chí
Tiêu đề: Embodied Conversational Agents
Tác giả: Cassell, J., Sullivan, J., Prevost, S., and Churchill, E., editors
Năm: 2000
12. Chen, S., Cowan, C. F. N., Grant, P. M. (1991), “Orthogonal least squares learning algorithm for radial basis function networks”, IEEE Trans. On Neural Networks, vol. 2, no. 2, pp. 302-309 Sách, tạp chí
Tiêu đề: Orthogonal least squares learning algorithm for radial basis function networks”, "IEEE Trans. On Neural Networks
Tác giả: Chen, S., Cowan, C. F. N., Grant, P. M
Năm: 1991
13. Cohen, M. M. and Massaro, D. W. (1993), “Modeling coarticulation in synthetic visual speech”, In Magnenat Thalmann, N. and Thalmann, D., editors, Models and Techniques in Computer Animation, pages 139–156, Springer, Tokyo Sách, tạp chí
Tiêu đề: Modeling coarticulation in synthetic visual speech”, In Magnenat Thalmann, N. and Thalmann, D., editors, "Models and Techniques in Computer Animation
Tác giả: Cohen, M. M. and Massaro, D. W
Năm: 1993
14. Eck, M. (1991), “Interpolation methods for reconstruction of 3d surfaces from sequences of planar slices”, CAD und Computergraphik, 13(5) Sách, tạp chí
Tiêu đề: Interpolation methods for reconstruction of 3d surfaces from sequences of planar slices”, "CAD und Computergraphik
Tác giả: Eck, M
Năm: 1991
15. Ekman, P. and Friesen, W. V. (1978), “Facial Action Coding System”, Consulting Psychologists Press, Palo Alto, CA Sách, tạp chí
Tiêu đề: Facial Action Coding System”, "Consulting Psychologists Press
Tác giả: Ekman, P. and Friesen, W. V
Năm: 1978
16. Goldberg, D. E. (1989), Genetic Algorithms in Search, Optimization, and Machine Learning, Addison-Wesley, Reading, MA Sách, tạp chí
Tiêu đề: Genetic Algorithms in Search, Optimization, and Machine Learning
Tác giả: Goldberg, D. E
Năm: 1989
17. Gouraud, H. (1971), Computer display of curved surfaces. PhD thesis, Dept. of Electrical Engineering, University of Utah Sách, tạp chí
Tiêu đề: Computer display of curved surfaces
Tác giả: Gouraud, H
Năm: 1971
18. Hoch, M., Fleischmann, G., and Girod, B. (1994), “Modeling and animation of facial expressions based on b-splines”, Visual Computer, 11 Sách, tạp chí
Tiêu đề: Modeling and animation of facial expressions based on b-splines”, "Visual Computer
Tác giả: Hoch, M., Fleischmann, G., and Girod, B
Năm: 1994
19. Kahler, K., Haber, J., and Seidel, H. P. (2001), “Geometry-based muscle modeling for facial animation”. In Watson, B. and Buchanan, J. W., editors, Proceedings of Graphics Interface 2001, pages 37–46 Sách, tạp chí
Tiêu đề: Geometry-based muscle modeling for facial animation”. In Watson, B. and Buchanan, J. W., editors, "Proceedings of Graphics Interface 2001
Tác giả: Kahler, K., Haber, J., and Seidel, H. P
Năm: 2001
20. Kahler, K., Haber, J., Yamauchi, H., and Seidel, H. P. (2002), “Head shop: Generating animated head models with anatomical structure”, In Spencer, S. N., editor, Proceedings of the 2002 ACM SIGGRAPH Symposium on Computer Animation (SCA-02), pages 55–64, New York, ACM Press Sách, tạp chí
Tiêu đề: Head shop: Generating animated head models with anatomical structure”, In Spencer, S. N., editor, "Proceedings of the 2002 ACM SIGGRAPH Symposium on Computer Animation (SCA-02)
Tác giả: Kahler, K., Haber, J., Yamauchi, H., and Seidel, H. P
Năm: 2002
21. Kalra, P., Mangili, A., Magnenat-Thalmann, N., and Thalmann, D. (1992), “Simulation of facial muscle actions based on rational free form deformations”, In Kilgour, A. and Kjelldahl, L., editors, Computer Graphics Forum (EURO-GRAPHICS ’92 Proceedings), volume 11 (3), pages 59–69 Sách, tạp chí
Tiêu đề: Simulation of facial muscle actions based on rational free form deformations”, In Kilgour, A. and Kjelldahl, L., editors, "Computer Graphics Forum (EURO-"GRAPHICS ’92 Proceedings)
Tác giả: Kalra, P., Mangili, A., Magnenat-Thalmann, N., and Thalmann, D
Năm: 1992

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w