MỘT SỐ KỸ THUẬT ĐỐI SÁNH BỀN VỮNG

Một phần của tài liệu (LUẬN án TIẾN sĩ) một số kỹ thuật phòng chống giả mạo ảnh số luận án tiến sĩ hệ thống thông tin 62 48 01 04 (Trang 86 - 89)

CHƯƠNG 3 PHÁT HIỆN ẢNH GIẢ MẠO DẠNG CẮT/DÁN

3.2 MỘT SỐ KỸ THUẬT ĐỐI SÁNH BỀN VỮNG

Nghiên cứu đầu tiên theo hướng đối sánh bền vững phải kể đến J. Fridrich và cộng sự [44] sử dụng ma trận hệ số DCT làm đặc trưng để phát hiện vùng sao chép, nhưng trong bài báo của tác giả không đề cập cụ thể về phương pháp và thử nghiệm của thuật toán. Sau đó, Y. Huang và cộng sự [56] cải tiến bằng cách xây dựng vectơ đặc trưng có số chiều là 16, tuy nhiên thuật toán này chưa hiệu quả, vectơ đặc trưng có số chiều lớn. Y. Cao và cộng sự [25] đề xuất một thuật toán bằng cách vẽ một hình tròn trên ma trận hệ số DCT của mỗi khối để xác định ra 4 đặc trưng làm vectơ đặc trưng, qua thử nghiệm thuật toán hiệu quả với thao tác làm mờ nhưng không thấy có đánh giá về thao tác nén và thêm nhiễu, hơn nữa cách vẽ hình tròn như vậy lại bỏ qua giá trị DC (giá trị đóng vai trò quan trọng của ma trận hệ số DCT) khiến hiệu quả của thuật toán giảm đáng kể. Trong [99], Popescu đề xuất thuật toán dựa trên thành phần chính PCA (Principal component analysis) để giảm số chiều của

vectơ đặc trưng bằng cách chỉ lấy một nửa giá trị của khối thay vì sử dụng toàn bộ để làm vectơ đặc trưng. Trong [80] Lou đề xuất thuật toán sử dụng 7 đặc trưng màu sắc của mỗi khối ảnh làm vectơ đặc trưng.

Dưới đây để tiện theo dõi, luận án trình bày cách trích chọn đặc trưng của hai kỹ thuật được sử dụng để so sánh với kỹ thuật đề xuất.

3.2.1Kỹ thuật dựa trên 7 đặc trưng màu

Với thuật toán của Lou [80], sau khi chia ảnh thành các khối chờm nhau thì mỗi khối sẽ ứng với 7 đặc trưng gọi là c1, c2, c3, c4, c5, c6, c7, được tính như sau:

- Trong đó c1, c2, c3 là giá trị trung bình của thành phần màu R, G, B tương ứng của mỗi khối.

- Chuyển đổi ảnh màu thành ảnh đa mức xám theo công thức I = 0.299R + 0.587G + 0.114B, chia khối thành 2 phần bằng nhau theo 4 hướng như hình dưới

đây:

Hình 3.5. Chia khối theo 4 hướng.

và tính các giá trị đặc trưng c4, c5, c6 , c7 theo công thức:

Ci = sum(part(1)/sum(part(1)+part(2)); i=4,5,6,7

Bây giờ mỗi khối ảnh sẽ được đại diện bằng một vectơ đặc trưng 7 chiều V = ( c1, c2, c3, c4, c5, c6, c7).

3.2.2Kỹ thuật dựa trên phép biến đổi DCT

Cách trích chọn đặc trưng của Yanjun Cao [4] lại khác, sau khi chia ảnh thành các khối, mỗi khối được áp dụng phép biến đổi côsin rời rạc (phép biến đổi DCT) để thu được một ma trận (gọi là ma trận hệ số DCT), trong ma trận này vẽ một hình tròn như sau:

Hình 3.6. Vẽ hình tròn trên ma trận hệ số DCT.

) 4 , 3 , 2 , 1 , ) , ( ( , ) ( ) , ( i C y x f C dt y x f v i i i

Trong đó f(x,y) là giá trị của ma trận DCT tại vị trí x, y. Còn Ci là hình tròn ở góc phần tư thứ i, dt(Ci) diện tích hình tròn Ci. Lúc này mỗi khối ảnh sẽ được đại diện bằng một vectơ đặc trưng 4 chiều V =( v1, v2, v3, v4 ).

3.2.3 Nhận xét về các kỹ thuật

Thuật toán ở bước sắp xếp theo thứ tự từ điển và kiểm tra các hàng tương tự chi phối độ phức tạp của phương pháp này. Các khối giống hoặc tương tự nhau được tìm ra dễ dàng bằng việc duyệt qua tất cả (m-b+1)×(n-b+1) hàng của ma trận đã sắp xếp và sau đó tìm ra 2 hàng liên tiếp giống hoặc tương tự nhau.

Đối với phương pháp phát hiện ảnh giả mạo dạng cắt/dán bởi thuật toán đối sánh chính xác (Exact Match) chỉ phát hiện được ảnh giả mạo dạng ảnh sao chép

nhưng không có chỉnh sửa. Hạn chế của cách tiếp cận này là với dạng ảnh giả mạo sau khi được chỉnh sửa cón bị tác động bởi các thao tác nhiễu, hoặc nén, hoặc co giãn… thì phần lớn các khối đồng nhất bị mất và thuật toán này sẽ phát hiện sai hoặc không đưa được ra các vùng giả mạo trên ảnh.

Đối với kỹ thuật đối sánh bền vững dựa trên miền tần số (DCT), kỹ thuật đối sánh bền vững dựa trên phân tích thành phần chính (PCA) hay kỹ thuật đối sánh bền vững dựa vào trích chọn 7 đặc trưng màu sắc đã khắc phục được hạn chế trong kỹ thuật phát hiện ảnh giả mạo dạng cắt/dán của thuật toán Exact Match. Điểm khác nhau cơ bản của hai kỹ thuật này chính là ở bước trích chọn đặc trưng đại diện cho mỗi khối trong ảnh và xác định các cặp khối tương tự. Việc trích chọn ra các đặc trưng đại diện (thu nhỏ số đặc trưng chính) là thu nhỏ kích thước của ma trận A ban đầu. Vì vậy, kỹ thuật đối sánh bền vững có tốc độ xử lý nhanh hơn so với kỹ thuật đối sánh chính xác. Tuy nhiên, nếu trích chọn đặc trưng càng ít thì sẽ xuất hiện trường hợp vùng giả mạo ảo. Nếu trích chọn ra nhiều đặc trưng thì tốc độ tuy chậm nhưng độ chính xác cao hơn.

Tuy nhiên, với kỹ thuật đối sánh bền vững dựa trên miền tần số (DCT) hay đối sánh bền vững dựa trên phân tích thành phần chính (PCA) thì xuất hiện hai điểm mấu chốt

- Thu nhỏ số đặc trưng (chính là thu nhỏ kích thước hàng của ma trận A) thì chưa nói rõ.

- Việc xác định các khối tương tự theo tiêu chuẩn nào thì cũng không được trình bày cụ thể.

Trong kỹ thuật đối sánh bền vững, chỉ có kỹ thuật phát hiện ảnh giả mạo dựa trên lấy đặc trưng màu sắc (7 đặc trưng) đã chỉ rõ 2 vấn đề mấu chốt còn chưa rõ trong kỹ thuật sử dụng phép biến đổi DCT và PCA:

- Thu nhỏ số đặc trưng của ma trận A dựa vào 7 đặc trưng màu. Kích thước

các hàng của ma trận A giảm từ b×b phần tử xuống 7 phần tử.

- Đưa ra tiêu chuẩn để xét các cặp khối tương tự nhau, tuy nhiên các công thức còn phức tạp.

Một phần của tài liệu (LUẬN án TIẾN sĩ) một số kỹ thuật phòng chống giả mạo ảnh số luận án tiến sĩ hệ thống thông tin 62 48 01 04 (Trang 86 - 89)

Tải bản đầy đủ (PDF)

(162 trang)