Bùi Thế Duy và cộng sự [7] cũng áp dụng phƣơng pháp của King và cộng sự [22] và dùng các kỹ thuật hoạt ảnh tham số hóa để tạo mô hình hành động của cơ vòng miệng.
Với mục đích chủ yếu là tạo nên biểu hiện khuôn mặt chân thực với những nếp nhăn chi tiết, nên lớp da đa giác đƣợc chủ yếu sử dụng cho việc tạo mô hình khuôn mặt. Bởi những ƣu điểm đối với một bề mặt mịn và nhỏ, King và cộng sự [22] phân tách đôi môi ra khỏi mô hình chung và tạo hình môi bằng một bề mặt đƣờng cong B- spline. Để làm mô hình hoạt ảnh khuôn mặt, ta phải thận trọng trong việc lựa chọn các kỹ thuật phù hợp. Mặc dù các kỹ thuật khung cơ sở, tham số hóa, dựa trên hệ thống cơ giả đều tạo đƣợc hoạt ảnh trong thời gian thực, nhƣng chúng đều không thể cho kết quả biểu hiện khuôn mặt chân thực, bởi vì chúng không tạo đƣợc những chỗ phình và nếp nhăn trên da, cũng không xử lý đƣợc những tƣơng tác đa cơ, đa tham số. Mặt khác, các phƣơng pháp dựa trên hệ cơ đa lớp, với nhiều lớp cấu trúc của khuôn mặt, cho phép tạo nên những biểu hiện chân thực, tuy nhiên chúng đòi hỏi lƣợng tính toán rất lớn, và cũng không đạt đƣợc hoạt ảnh thời gian thực ở những máy tính cá nhân thông thƣờng.
Mô hình khuôn mặt của Bùi Thế Duy và cộng sự [7] gồm một lƣới đa giác làm mặt và một bề mặt B-spline làm môi, nhƣ biểu diễn trên Hình 1.7.
Hình 1.7: (a) Khuôn mặt khung lưới cùng các cơ; (b) khuôn mặt bình thường; và (c) hiệu ứng của cơ gò má lớn bên trái.
Lƣới mặt gồm các đa giác hình tam giác với các đỉnh đƣợc sắp xếp theo từng vùng. Lƣới mặt đƣợc chia thành nhiều vùng nhằm nâng cao hiệu quả của mô hình cơ. Cách này giúp làm giảm vẻ giả tạo dễ nhận thấy bằng mắt thƣờng do sự di chuyển của các đỉnh trong những vùng không chịu tác động của sự co cơ. Thông thƣờng, sự di chuyển các đỉnh đa giác khi co cơ đƣợc điều khiển bởi miền tác động của cơ, mà miền này đƣợc định dạng trƣớc và không phụ thuộc vào lƣới mặt. Tuy nhiên, trong một số trƣờng hợp, miền tác động này không thể chứa đựng chính vùng cần tác động trên mô hình khuôn mặt. Ví dụ, nếu không xác định các vùng mí mắt, thì các đa giác trên mí mắt có thể bị các cơ chẩm trán làm biến dạng, vì mí mắt có thể nằm trong miền ảnh hƣởng của các cơ đó, và kết quả là những hoạt ảnh phi tự nhiên của khuôn mặt. Bùi Thế Duy và cộng sự [7] cũng sử dụng cách chia vùng để nâng cao hiệu quả của mô hình cơ. Để làm khuôn mặt biến đổi bằng một cơ nhất định, thì thuật toán dành cho mô hình cơ đó phải tìm kiếm tất cả các đỉnh trên lƣới mặt nằm trong miền ảnh hƣởng của cơ. Cách chia vùng đƣợc sử dụng nhằm giảm bớt việc tìm kiếm này, bằng cách bỏ qua những đỉnh không nằm trong các vùng mà cơ đó tác động tới. Vấn đề này sẽ đƣợc bàn thêm ở phần sau.
Nhƣ trên đã nói, Bùi Thế Duy và cộng sự [7] chọn bề mặt B-spline đơn giản để biểu diễn đôi môi, nhằm đảm bảo độ mịn của môi sau khi môi biến dạng dƣới tác động của các cơ. Sau đó, bề mặt B-spline của môi đƣợc đa giác hóa thành một dạng topo đƣợc xác định trƣớc, gồm các đỉnh và tam giác, đƣợc xây dựng nhằm mục đích kết xuất. Các đỉnh đƣợc nối với nhau và liên kết với phần còn lại của mô hình khuôn mặt theo một cách định trƣớc. Kế tiếp, đôi môi đƣợc kết xuất nhƣ một phần của mô hình khuôn mặt tổng thể (phần 1.3.2). Toàn bộ khuôn mặt đƣợc kết xuất bằng phép tô bóng Phong [10] dựa trên công nghệ OpenGL.
1.3.1 Lưới mặt
Ban đầu, Bùi Thế Duy và cộng sự [7] xây dựng lƣới mặt bằng dữ liệu thu từ một máy quét 3D. Dữ liệu này đƣợc xử lý nhằm nâng cao hiệu quả hoạt ảnh, đồng thời giữ đƣợc chất lƣợng cao của mô hình. Quá trình xử lý gồm hai bƣớc.
Bƣớc 1, Bùi Thế Duy và cộng sự [7] giảm số đỉnh và số đa giác ở một số phần trên khuôn mặt. Lấy ý tƣởng từ Parke [29] và Pasquariello và Pelachaud [32], họ chỉ giữ ít đỉnh và đa giác ở những phần không biểu cảm. Số lƣợng lớn đa giác đƣợc duy trì tại những phần biểu cảm, tức là những vùng quanh mắt, mũi, miệng và trán. Sau cùng, tổng số đa giác giảm xuống đáng kể. Bắt đầu với khoảng 30.000 đa giác, mô hình khuôn mặt 3D dạng chuẩn của Bùi Thế Duy và cộng sự [7] chỉ gồm 2.480 đỉnh và 4.744 đa giác. Việc giảm đa giác tại những phần khác làm tăng tốc độ hoạt ảnh. Tuy nhiên, phƣơng pháp này vẫn vƣớng mắc bởi mức độ chi tiết của những phần biểu cảm trên khuôn mặt (những phần liên quan đến việc truyền tín hiệu giao tiếp và biểu hiện cảm xúc).
Bƣớc 2, Bùi Thế Duy và cộng sự [7] chia mô hình khuôn mặt thành các vùng. Việc chia vùng đã đƣợc áp dụng trong Greta [32], nhằm giảm bớt và điều khiển sự di chuyển các đỉnh đa giác (do các tham số hoạt ảnh mặt gây nên). Tƣơng tự nhƣ vậy, họ sử dụng kỹ thuật này nhằm điều khiển sự biến đổi của các đỉnh đa giác do sự co cơ gây ra. Nhƣ trên đã nói, điều này giúp làm giảm sự giả tạo dễ nhận thấy bằng mắt thƣờng, do sự di chuyển của các đỉnh trong những vùng không chịu tác động của co cơ. Phần 1.4.1 sẽ bàn về những công trình khác sử dụng cách chia vùng nhằm tăng tốc độ xử lý thuật toán của mô hình cơ.
Các cơ khuôn mặt con ngƣời tập trung vào sáu vùng chủ yếu trên khuôn mặt: vùng bên trái và phải của phần mặt dƣới, giữa và trên. Dựa vào đó, Bùi Thế Duy và cộng sự [7] chia mô hình khuôn mặt thành 11 vùng:
(1) vùng mặt dƣới bên phải, (2) vùng mặt giữa bên phải, (3) vùng dƣới mí mắt bên phải, (4) vùng trên mí mắt bên phải, (5) vùng mặt trên bên phải (6) vùng mặt dƣới bên trái, (7) vùng mặt giữa bên trái, (8) vùng dƣới mí mắt bên trái, (9) vùng trên mí mắt bên trái, (10) vùng mặt trên bên trái
(11) vùng không hoạt ảnh, bao gồm phần còn lại của đầu.
Hình 1.8 mô tả các vùng nằm bên phải mô hình khuôn mặt, còn các vùng nằm ở bên trái mô hình khuôn mặt cũng có vị trí tƣơng tự.