3.3.1 Tập dữ liệu mẫu có sẵn
Các tập dữ liệu khác nhau chủ yếu về số lượng, chất lượng và độ sạch của hình ảnh. Tập dữ liệu FERC-2013 [2] có khoảng 35.000 hình ảnh trắng đen có độ phân giải thấp chỉ
được xử lý trước. Chỉ có phần hình vng có khn mặt khi nhận dạng được giữ lại, được thay đổi kích thước và được chuyển đổi thành một mảng có giá trị đen trắng là 48x48.
Hình 3.3: Một số hình ảnh trong tập dữ liệu mẫu
Tập dữ liệu với định dạng “.csv” chứa hai cột là cảm xúc và pixel. Cột cảm xúc có chứa các số từ 0 đến 6, đại diện cho 7 cảm xúc cơ bản hiện diện trong hình ảnh. Cột pixel chứa một chuỗi dữ liệu được bỏ trong dấu ngoặc kép cho mỗi hình ảnh. Nội dung của chuỗi này là các giá trị pixel được phân tách bằng dấu cách.
Bảng 3.1: Bảng phân loại số lượng cảm xúc trong tập dữ liệu mẫu FERC-2013
Cảm xúc Số lượng ( hình ảnh ) Tỉ lệ ( % ) Giận dữ 4954 13.81 Khó chịu 547 1.52 Sợ hãi 5121 14.27 Vui vẻ 8989 25.05 Buồn 6077 16.93 Ngạc nhiên 4002 11.15
Bình thường 6198 17.27
Tổng 35888 100
Hình 3.4: Biểu đồ số lượng cảm xúc trong tập dữ liệu mẫu FERC-2013
3.3.2 Tập dữ liệu riêng
Tập dữ liệu riêng được tạo ra nhằm mục đích kiểm tra độ chính xác của mơ hình CNN được huấn luyện. Tập dữ liệu riêng bao gồm: tập dữ liệu A và tập dữ liệu B. Trong đó, tập dữ liệu A là hình ảnh được lấy từ webcam máy tính. Tập dữ liệu bao gồm 8 người trong đó có 3 nữ và 5 nam. Mỗi hình ảnh là một cảm xúc với cường độ khác nhau và sự mở rộng các góc cạnh của khn mặt. Với số lượng người tham gia thực nghiệm trên, tập dữ liệu sẽ có 280 hình ảnh được chia cho 7 loại cảm xúc. Hình ảnh dùng cho quá trình kiểm tra là hình ảnh màu trong các điều kiện mơi trường khác nhau. Tập dữ liệu B là hình ảnh được lấy từ tập dữ liệu CK+ [10]. Tập dữ liệu bao gồm 700 hình ảnh được lựa chọn từ tập dữ liệu trên. Hình ảnh dùng cho quá trình kiểm tra là hình ảnh xám với những người được khảo sát có giới tính và màu da khác nhau. Số lượng hình ảnh trong tập dữ liệu riêng được thể hiện ở bảng 3.2 và hình 3.5.
Bảng 3.2: Bảng phân loại số lượng cảm xúc trong tập dữ liệu riêng Cảm xúc Tập mẫu A ( hình ảnh ) Tập mẫu B ( hình ảnh ) Cảm xúc Tập mẫu A ( hình ảnh ) Tập mẫu B ( hình ảnh ) Giận dữ 30 100 Khó chịu 10 10 Sợ hãi 30 60 Vui vẻ 80 150 Buồn 30 80 Ngạc nhiên 30 80 Bình thường 70 140 Tổng 280 620