Một vấn đề quan trọng trong luận án chính là việc chuẩn bị các tập dữ liệu ảnh nhằm thực hiện các thực nghiệm liên quan. Nguồn dữ liệu được chọn phải đảm bảo các yêu cầu sau:
40
- Được công bố bởi các tổ chức có uy tín
- Có số lượng ảnh tương đối lớn
- Nội dung ảnh đa dạng
Hiện nay trên Internet có nhiều thư viện ảnh trực tuyến có độ tin cậy, trong luận án này sử dụng một số ảnh trong hai thư viện trực tuyến [103, 107] của hai trường đại học nổi tiếng Washington, Southern California. Đây là các thư viện được tham khảo và sử dụng trong rất nhiều công trình xử lý ảnh, giấu tin và phát hiện ảnh có giấu tin.
Một phần ảnh được tạo ra từ máy ảnh kỹ thuật số Sony T700 với số điểm ảnh hiệu dụng 10.1 Megapixel, độ phân giải ảnh lớn nhất: 3648 × 2736 điểm ảnh và điện thoại di động Samsung Galaxy 3 với số điểm ảnh hiệu dụng 3.15 Megapixel, độ phân giải ảnh lớn nhất 2048×1536 điểm ảnh.
Tập ảnh gốc thử nghiệm: Tập ảnh gốc sử dụng chung cho các thuật toán giấu và phát hiện trong luận án gồm 2088 ảnh với các kích cỡ khác nhau trong đó: 1014 ảnh được tải về từ hai thư viện trực tuyến [103, 107] và 1074 ảnh được tạo ra từ máy ảnh kỹ thuật số và máy ảnh trên điện thoại di động. Nội dung ảnh đa dạng gồm: ảnh phong cảnh, chân dung, bản vẽ, vệ tinh, các sự kiện, …
Tiền xử lý: Đa số các ảnh trên là định dạng JPEG ảnh 24 bit màu với ba kênh màu R, G, B. Để thuận tiện cho các tính toán trong thử nghiệm chúng ta chuyển ảnh sang dạng ảnh cấp xám 8-bit cấp độ màu bằng trình xử lý ảnh Adobe Photoshop CS 8.0 được tập ảnh thử nghiệm gồm 2088 ảnh cấp xám. Gọi tập ảnh này là 0 sẽ được sử dụng trong hầu hết các thử nghiệm của luận án.
Quá trình thực hiện trên ảnh 24 - bit màu với ba kênh màu R, G, B tương tự như ảnh xám 8-bit bằng cách kiểm tra lần lượt từng kênh 8 - bit R, G, B. Thường thì thông tin giấu trên kênh B, vì theo đánh giá của những nhà giấu tin [27, 32] sẽ ít ảnh hưởng đến chất lượng ảnh.
41