Bước 1: Tổng hợp số lượng quang sai màu đỏ và màu xanh.
Bước 2: Chọn giá trị phương sai màu trong khoảng 0.8 đến 1.2. Tìm kiếm ưu điểm nổi bật được thực hiện trên không gian tham số để tối đa hóa sự tương quan giữa các kênh màu đỏ/xanh lá cây và các kênh màu xanh da trời/xanh lá cây.
Bước 3: Hiển thị kết quả, ba hình ảnh bao gồm: hình ảnh ban đầu, hình ảnh phương sai màu và hình ảnh sau khi ước lượng phương sai đã được lấy ra. Xét hình ảnh thứ ba, nếu hình ảnh gốc và ảnh thứ ba giống nhau, chứng tỏ phương sai đồng nhất trên toàn bộ hình ảnh, ảnh này là ảnh chưa bị sửa đổi.Ngược lại, ảnh này có thể đã bị sửa đổi một vài chi tiết.
3.3.3. Thực nghiệm
Cho hai bức ảnh như sau:
(a) (b) (c)
Hình 3.3 Ảnh thực nghiệm phương pháp CA
Sau khi chạy chương trình thực nghiệm với cả ba bức ảnh trên, thu được kết quả sau:
(a)
(b)
(c)
Hình 3.4 Kết quả chạy thực nghiệm phương pháp CA
- Dựa vào kết quả trên ta thấy, hình 3.4 (a) và hình 3.4 (b) là ảnh gốc, không có sự thay đổi về phương sai đồng nhất trên toàn bộ hình ảnh, vì vậy ảnh thứ ba của hình 3.4 (a) và hình 3.4 (b) không có sự thay đổi so với ảnh gốc ban đầu. Tuy nhiên, ở ảnh ghép hình 3.4 (c) ta thấy rõ ràng có sự khác biệt lớn giữa ảnh thứ ba với ảnh gốc ban đầu.
- Ngoài ra, tôi tiến hành hành kiểm tra với một số bức ảnh giả từ nhiều nguồn khác nhau, cũng thu được kết quả khả quan như sau:
Hình 3.5 Các kết quả thử nghiệm phương pháp CA với các bức ảnh giả được lấy từ nhiều nguồn khác nhau
3.3.4. Kết luận
Phương pháp CA phát hiện được sự giả mạo tuy nhiên hạn chế phương pháp này là không nhận rõ được vùng bị làm giả, mà chỉ có thể kết luận là phương sai toàn cục không đồng nhất, vì thế có dấu hiệu của sự giả mạo.
Chƣơng 4: ĐÁNH GIÁ CÁC PHƢƠNG PHÁP PHÁT HIỆN ẢNH SỐ GIẢ MẠO
4.1. Thực nghiệm so sánh ba phƣơng pháp phát hiện ảnh số giả mạo
Tôi sử dụng thư viện ảnh giả CASIA v1.0 bao gồmhai thư mục, thư mục “Au” là 800 ảnh chụp với các chủ đề khác nhau như phong cảnh, động vật, thực vật, kiến trúc, thiên nhiên, hoa văn có kích thước 384x256 điểmảnh với định dạng JPEG, thư mục thứ hai “Sp” là 921 hình ảnh giả được tạo ra từ 800 bức ảnh tại thư mục “Au” bao gồm nhiều kiểu làm giả khác nhau (tham khỏa tại http://forensics.idealtest.org/). Với mục đích là thử nghiệm các phương pháp phát hiện ảnh giả trên hại loại bị làm giả bởi kỹ thuật sao - chuyển vùng ảnh (copy-move) và ảnh ghép (splicing), tôi cũng phân loại thư viện 921 ảnh giả thành 467 ảnh sao - chuyển vùng ảnh (copy-move) và 454 ảnh ghép (splicing).
Cơ sở của việc phân loại ảnh như sau, trong thư viện ảnh giả CASIA v1.0, các tác giả đã đặt tên tệp theo quy tắc sau: (loại vùng làm giả)_(sự thay đổi vùng làm giả)_(Tên ảnh gốc thứ nhất)_(Tên ảnh gốc thứ hai)_(chỉ số). Ảnh splicing là loại ảnh mà được ghép từ hai hay nhiều hình ảnh, như vậy nếu tên ảnh gốc thứ nhất khác với tên ảnh gốc thứ hai nghĩa là ảnh này là ảnh được ghép từ hai ảnh để tạo thành một ảnh giả, ảnh này là ảnh thuộc loại ảnh ghép (splicing). Ngược lại, nếu tên ảnh gốc thứ nhất mà trùng với tên của ảnh gốc thứ hai, chứng tỏ ảnh giả được tạo ra từ một bức ảnh duy nhất, như vậy, ảnh này thuộc loại ảnh sao - chuyển vùng ảnh. Dựa vào những dấu hiệu đó, tôi đã phân loại 921 ảnh giả trong thư viện của CASIA v1.0 thành 467 ảnh loại sao - chép vùng ảnh (copy- move) và 454 loại ảnh ghép (splicing).
Ví dụ:
- Loại ảnh sao - chuyển vùng ảnh (copy-move): Tên tệp: Sp_03_NNN_C_txt0098_txt0098_0098.jpg
Hình 4.1 Ảnh giả bởi kỹ thuật sao - chuyển vùng ảnh trong thư viện CASIA v1.0
- Loại ảnh ghép (splicing)
Tên tệp: Sp_04_CNN_A_nat0071_ani0024_0270.jpg
Hình 4.2 Ảnh giả bởi kỹ thuật ghép ảnh (splicing) trong thư viện CASIA v1.0
Tiến hành thực nghiệm với ba phương pháp phát hiện ảnh giả mà tôi đã nghiên cứu tại chương trước, thu được kết quả dưới bảng sau:
Loại ảnh DCT Số ảnh phát hiện/tổng số ảnh thực nghiệm (tỷ lệ %) ELA Số ảnh phát hiện/tổng số ảnh thực nghiệm (tỷ lệ %) CA Số ảnh phát hiện/tổng số ảnh thực nghiệm (tỷ lệ %) Sao - chuyển vùng ảnh (copy-move) 436/467 (93,4%) 0/467 (0%) 175/467 (37,5%) Ảnh ghép (splicing) 0/254 (0%) 386/454 (85%) 252/454 (55,5%)
Bảng 3.3 Kết quả so sánh thực nghiệm giữa các phương pháp phát hiện ảnh giả
Dựa vào bảng kết quả ta có một số nhận xét sau:
- Phương pháp DCT nhận diện ảnh copy tương đối tốt 93,4% nhưng không phát hiện được ảnh Splicing 0%. Nguyên nhân do ảnh phương pháp áp dụng thuật toán DCT dựa trên việc so khớp xấp xỉ (robust match), nó chỉ nhận diện được các vùng xấp xỉ giống nhau trên bức ảnh, chứ không nhận diện được vùng được copy từ một hình ảnh khác. Mặt khác, do dựa trên việc so sánh xấp xỉ, nên các bức ảnh làm giả bởi kỹ thuật sao - chuyển vùng ảnh (copy-move) có
vùng nhân bản sẽ sai khác so với vùng bị sao chép một mức xấp xỉ nào đó. Việc xấp xỉ này đảm bảo vùng nhân bản đã bị thay đổi màu sắc một lượng cho phép, kéo dãn một mức cho phép hay đã bị thay đổi độ phân giải... vẫn có thể phát hiện ra. Tuy nhiên, đối bức ảnh mà vùng nhân bản đã bị quay một góc nào đó (rotation), thay đổi kích thước vùng làm giả (resize), hoặc đã bị thay đổi quá ngưỡng cho phép thì thuật toán này cũng chưa nhận biết được sự làm giả đó. Vì thế đã có 6,6% lượng ảnh giả trong thư viện CASIA v1.0 chưa phát hiện được vùng làm giả.
- Phương pháp ELA nhận diện ảnh giả Splicing tương đối tốt 85% nhưng không phát hiện được ảnh làm giả bởi kỹ thuật sao-chuyển vùng ảnh (copy- move). Nguyên nhân do nguồn gốc của phương pháp phân tích mức độ lỗi ELA là dựa trên độ nén tổn hao dữ liệu JPEG của các bức ảnh khác nhau. Do vậy, loại ảnh splicing được tạo từ hai ảnh khác nhau trở lên, nên có thể sử dụng phương pháp này, tuy nhiên, đối với ảnh sao - chuyển vùng ảnh (copy-move), thì không thể phát hiện do các vùng nhân bản có cùng độ nén trên cùng một bức ảnh. Tuy nhiên, cũng do hạn chế của phương pháp này, nếu hai bức ảnh gốc để tạo ra bức ảnh giả có cùng một độ nén, cùng số lần nén, cùng một máy ảnh, nó sẽ khó khăn trong việc phân tích độ lỗi, ngoài ra, với các chi tiết có độ phức tạp cao (ví dụ như cỏ), nó có cùng màu sắc (chấm sáng) sau khi chúng ta phân tích mức độ lỗi với vùng sai khác, nên rất khó để phát hiện vùng làm giả với các bức ảnh chứa nhiều chi tiết có độ phức tạp cao. Do vậy, vẫn có 15% ảnh giả splicing không được phát hiện trong viện CASIA v1.0.
- Phương pháp CA, phương pháp này có thể phát hiện được cả hai loại hình ảnh giả bởi kỹ thuật sao - chuyển vùng ảnh (copy-move) và ghép ảnh (splicing). Nguồn gốc của việc phát hiện bằng phương pháp CA là phân tích phương quang sai của hình ảnh khi bị làm giả sẽ có sự sai khác với quang sai toàn bộ hình ảnh. Vì vậy, với ảnh loại sao - chép vùng ảnhta thấy khi nhân bản vùng nhân bản vào vị trí không thích hợp thì vùng nhân bản có quang sai sẽ bị sai khác với quang sai toàn cục. Tương tự, với ảnh splicing, nếu không được đưa vào vị trí thích hợp thì vùng được ghép ảnh cũng sẽ có quang sai khác với với quang sai toàn cục. Tuy nhiên, tỷ lệ phát hiện được là chưa cao, 37,5% với loại ảnh copymove và 55,5% với loại ảnh ghép (splicing), điều này có thể do thuật toán đưa ra dựa trên sự ước lượng quang sai toàn cục, sau đó rút ước lượng quang sai đó, với kỳ vọng, những vùng có quang sai khác với quang sai toàn cục sẽ xuất hiện. Tuy nhiên, đối với những bức ảnh đã bị làm giả, việc ước lượng
được quang sai của ảnh gốc ban đầu cũng rất khó, chỉ có thể ước lượng được giá trị trung bình giữa ảnh gốc (ảnh làm nền) với vùng được nhân bản hoặc ghép vào. Chính vì vậy, đối với phương pháp này, việc tìm ra chính xác vùng bị làm giả là tương đối khó khăn, chỉ có thể kết luận là ảnh có dấu hiệu bị làm giả hay không. Nhưng, dựa trên lý thuyết về việc so sánh quang sai, chúng ta cũng có thể tin tưởng và hi vọng rằng, sẽ có một phương pháp tiên tiến, phát hiện rõ phương quang sai của từng vùng hình ảnh, từ đó có thể so sánh và tìm ra được vùng bị làm giả.
- Trên cả ba phương pháp trên, ba phương pháp đều đã phát hiện được dấu hiệu của một bức ảnh bị làm giả, phương pháp DCT là phương pháp phát hiện rõ nhất vùng bị làm giả (có thể thay đổi màu sắc các cùng bị làm giả), phương pháp ELA cũng có thể dự đoán được vùng bị làm giả, tuy nhiên vẫn phải dựa vào trực quan và sự so sánh với ảnh gốc, phương pháp CA chưa phát hiện được rõ vùng bị làm giả.
Hiện nay, cả phương phương pháp trên và các phương pháp khác mà trên thế giới đang nghiên cứu, chưa có phương pháp tối ưu nào được đề xuất để phát hiện một bức ảnh bị làm giả. Do vậy, để phát hiện một bức ảnh có bị làm giả hay không, sự cần thiết là kết hợp các phương phát hiện ảnh giả với nhau. Dựa trên kết quả nghiên cứu ba phương pháp phát hiện ảnh giả đã trình bày, tôi cũng đề xuất một mô hình phát hiện ảnh số giả mạo dựa trên việc kết hợp ba phương pháp trên như sau:
4.2. Đề xuất mô hình phát hiện ảnh số giả mạo
Theo kết quả so sánh, ta thấy, nếu sử dụng một phương pháp, không thể kết luận được một ảnh là ảnh giả hay không, do xác suất không phát hiện ra ảnh giả vẫn còn rất lớn. Tuy nhiên, nếu sử dụng kết hợp ba phương pháp, sẽ có thể phân loại được ảnh giả và có một công cụ tin cậy hơn khi xác định một ảnh có bị làm giả hay không. Trên khuôn khổ của đề tài nghiên cứu, tôi xin đề xuất một mô hình phát hiện ảnh giả dựa trên mô hình sau:
Hình 4.3 Mô hình đề xuất phát hiện ảnh số giả mạo
Bắt đầu
Phân tích quang sai màu (CA)
So sánh xấp xỉ dựa (DCT)
Phân tích mức đô lỗi (ELA) Có dấu hiệu sự giả mạo Ảnh thật Kết thúc Phát hiện vùng giả mạo (copymove) Phát hiện vùng giả mạo (splicing)
KẾT LUẬN 1. Kết quả đạt đƣợc
Qua quá trình nghiên cứu luận văn đã đạt được các kết quả nghiên cứu chính như sau:
Tìm hiểu những kiến thức tổng quan về nhận diện ảnh giả mạo, một số loại ảnh giả mạo thường gặp.
Tìm hiểu và tổng hợp kiến thức về các kỹ thuật phát hiện ảnh giả mạo. Cài đặt thử nghiệm ba phương pháp phát hiện ảnh giả mạo ảnh số, so sánh và đánh giá các phương pháp phát hiện trên từng loại ảnh giả mạo.
Đề xuất mô hình phát hiện và phân loại ảnh giả mạo.
2. Hƣớng nghiên cứu
Trên thực tế hiện nay, công nghệ hiện đại không ngừng phát triển tạo ra các bức ảnh giả ngày càng hoàn thiện hơn cũng như chống lại các phương pháp phát hiện ảnh giả. Do vậy, bài toán phát hiện ảnh giả mạo vẫn trở nên cấp thiết và ngày càng khó khăn.
Hướng nghiên cứu của tôi là tìm hiểu các phương pháp khác để hoàn thiện mô hình phát hiện và phân loại ảnh giả mạo.
TÀI LIỆU THAM KHẢO Tiếng Anh
1. BrugionD.A.(1999).“The History and Techniques of Photographic Deception and Manipulation”, Brassey‟s Inc.
2. Qiumin Wu, Shuozhong Wang and Xinpeng Zhang (2010), “Detection of Image Region- Duplication with Rotation and Scaling Tolerance” , ICCCI 2010, Kaohsiung, Taiwan.
3. Farid H. (2009), “A survey of image forgery detection”, IEEE Signal Processing Magazine, vol. 2, no. 26, pp. 16–25, Mar.
4. Farid H. (2008), “Digital Image Forensics”, American Academy of Forensic Sciences, Washington, DC.
5. Farid H. (2009), “Exposing digital forgeries from JPEG ghosts”, IEEE Transactionson Information Forensics and Security, 1(4):154–160.
6. Fridrich J., Soukal D. and Lukas J. (2010), “Detection of Copy-Move Forgery in Digital Images”, Department of Electrical and Computer Engineering, Department of Computer Science SUNY Binghamton, Binghamton, NY 13902-6000.
7. Johnson M.K. and Farid H. (2006), “Exposing Digital Forgeries Through Chromatic Aberration,” in Proceedings of the 8th workshop on Multimedia and security, pp. 48-55.- 257. 8. Seung-Jin Ryu, Min-Jeong Lee, and Heung-Kyu Lee (2010), “Detection of Copy-Rotate- Move Forgery Using Zernike Moments”, Department of Computer Science, Korea Advanced Institute of Science and Technology, Daejeon, Republic of Korea.
9. Weiqi Luo, Jiwu Huang and Guoping Qiu (2010), “JPEG Error Analysis and Its Applications to Digital Image Forensics”, IEEE Transactions on Information Forensics and Security, pp.480-491. Internet 10. http://blog.jgc.org/2008/02/tonight-im-going-to-write-myself-aston.html 11.http://csc.fsksm.utm.my/syed/research/image-forensics/11-types-of-image-forgery.html 12. http://forensics.idealtest.org 13. http://truemark.cn 14. http://www.scientificamerican.com/article.cfm?id=5-ways-to-spot-a-fake 15. http://en.wikipedia.org/wiki/Niepce