2.2.2.1. Giới thiệu dạng giả mạo bằng Sao chộp – di chuyển
Đõy là một dạng phổ biến của kỹ thuật giả mạo ảnh số. Trong đú một phần của hỡnh ảnh đƣợc sao chộp và dỏn vào một phần khỏc của cựng một hỡnh ảnh thƣờng với ý định để che dấu một đối tƣợng hoặc một khu vực của hỡnh ảnh. Vỡ thế, phần đƣợc sao chộp từ cựng một hỡnh ảnh vào trong bản sao di chuyển giả mạo, cỏc bảng màu, thành phần nhiễu, ỏnh sỏng, và hầu hết cỏc thuộc tớnh khỏc sẽ tƣơng thớch với phần cũn lại của hỡnh ảnh, nú trở nờn khú khăn hơn để phỏt hiện bằng mắt thƣờng. Để gõy khú khăn cho việc phỏt hiện giả mạo, ngƣời ta cú thể sử dụng nhiễu, làm mờ, thay đổi tƣơng phản vv... định dạng nộn JPEG làm cho việc phỏt hiện thậm chớ cũn khú khăn hơn nhiều.
Một vớ dụ cho loại giả mạo này cú thể đƣợc nhỡn thấy trong hỡnh một nhúm binh lớnh đƣợc nhõn đụi che Tổng thống George W. Bush.
Quỏ trỡnh này cú thể đƣợc thực hiện mà khụng cú bất kỳ sửa đổi, bổ sung vào những vựng đƣợc nhõn đụi. Kết quả là, cỏc giả mạo khu vực này sẽ thể hiện cỏc đặc điểm giống nhƣ phần cũn lại của hỡnh ảnh mà làm cho nú khú để xỏc định bằng cỏch sử dụng cỏc cụng cụ đƣợc thiết kế để phỏt hiện cỏc bất thƣờng trong hỡnh ảnh. Vỡ vậy, mục tiờu trong việc phỏt hiện sao chộp, di chuyển ảnh bị giả mạo là phỏt hiện ra hỡnh ảnh cỏc khu vực tƣơng tự hoặc giống nhau.
Do đú, để phỏt hiện vựng bị sao chộp, di chuyển trong ảnh giả mạo, chỳng ta cần một kỹ thuật mà cú thể phỏt hiện vựng ảnh xuất nhiều hơn một lần trong ảnh.
31
Tuy nhiờn, việc tỡm kiếm những vựng giống nhau cú thể sẽ khụng đủ trong một số trƣờng hợp, vỡ kẻ giả mạo cú thể sử dụng cỏc cụng cụ chỉnh sửa, thờm nhiễu, hoặc nộn hỡnh ảnh. Hơn nữa, cú nhiều cỏch kết hợp trong khu vực sao chộp nhƣ là xoay nhẹ, thu nhỏ, hoặc xúa mờ mà khụng làm ảnh hƣởng cỏc thụng số hỡnh ảnh.
Vỡ vậy, một kỹ thuật phỏt hiện giả mạo sao chộp-di chuyển tốt cú thể phỏt hiện ra cỏc vựng ảnh trựng lặp dự đó bị sửa đổi hay thờm nhiễu và nộn nhỏ.
2.2.2.2. Cỏc kỹ thuật phỏt hiện sao chộp – dịch chuyển vựng trờn ảnh
Bất kỳ giả mạo bằng sao chộp- di chuyển nào cũng đƣa ra một mối tƣơng quan giữa cỏc đoạn hỡnh ảnh gốc và đoạn đƣợc dỏn. Sự tƣơng quan này cú thể đƣợc sử dụng làm cơ sở để phỏt hiện thành cụng của loại giả mạo này. Bởi vỡ giả mạo cú thể sẽ đƣợc lƣu trong định dạng mất dữ liệu JPEG và vỡ một cụng cụ chỉnh sửa cú thể đƣợc sử dụng hoặc cỏc cụng cụ xử lý định vị ảnh khỏc, cỏc phõn đoạn cú thể khụng phự hợp tuyệt đối, nhƣng cũng chỉ tƣơng đối. Vỡ thế, chỳng ta cần đƣa ra cỏc yờu cầu nhƣ sau cho thuật toỏn xỏc thực:
1. Cỏc thuật toỏn xỏc thực cho phộp phỏt hiện tƣơng đối cỏc đoạn ảnh giống nhau.
2. Thời gian làm việc cú thể chấp nhận đƣợc.
3. Khối phỏt hiện khụng phải là những điểm ảnh cú sự tƣơng đồng.
Trong phần này sẽ trỡnh bày một số phƣơng phỏp phỏt hiện loại giả mạo này bằng việc so khớp khối.
a) So khớp chớnh xỏc (Exact Match)
Giả sử bức ảnh cú kớch thƣớc M N, với B là kớch thƣớc nhỏ nhất của khối bao mà ngƣời dựng định nghĩa để đối sỏnh. với mỗi điểm ảnh ta xỏc định đƣợc một khối bao ma trận B Bđiểm ảnh. Nhƣ vậy với bức ảnh M N ta xỏc định đƣợc
) 1 (
) 1
(M B N B khối bao. Khối bao này đƣợc trƣợt đi một pixel dọc theo ảnh từ trỏi sang phải và từ trờn xuống dƣới. Với mỗi vị trớ của khối B x B, cỏc giỏ trị pixel của khối này đƣợc trớch ra theo cỏc cột và lƣu thành một dũng trong ma trận 2 chiều A với (B B) cột và (M B 1) (N B 1)dũng. Mỗi dũng tƣơng ứng với một vị trớ của khối trƣợt.
Hai hàng giống nhau trong ma trận A tƣơng đƣơng với 2 khối bao giống nhau trong ảnh. Chỳng ta sắp xếp cỏc hàng trong ma trận A theo thứ tự từ điển, yờu cầu
32
này sẽ đƣợc thực hiện trờn MNlog2(MN) bƣớc. Sau đú ta dễ dàng tỡm kiếm bằng cỏch duyệt MN hàng của ma trận đó qua sắp xếp A và tỡm kiếm hai hàng giống nhau liờn tiếp.
Kết quả thuật toỏn sẽ tỡm kiếm và đƣa ra đƣợc tập cỏc vựng bao giống nhau là bằng chứng chứng minh ảnh đó bị cắt dỏn.
Hạn chế: Nếu ảnh giả mạo đƣợc lƣu với định dạng JPEG thỡ phần lớn cỏc khối
đồng nhất sẽ bị mất và thuật toỏn sẽ phỏt hiện sai.
b) So khớp bền vững (Robust match)
í tƣởng chớnh của thuật toỏn phỏt hiện dựa trờn so khớp thụ tƣơng tự nhƣ so khớp chớnh xỏc chỉ khỏc là thuật toỏn so khớp thụ khụng so sỏnh và sắp thứ tự dựa trờn giỏ trị pixel trong khối mà dựa trờn hệ số DCT. Với mỗi khối, biến đổi DCT đƣợc tớnh, cỏc hệ số DCT đƣợc lƣợng tử húa và lƣu thành một dũng của ma trận A. Ma trận này sẽ cú (M-B+1) (N-B+1) dũng và B B cột.
Cỏc dũng của A đƣợc sắp xếp theo từ điển nhƣ trƣớc. Tuy nhiờn, phần cũn lại của thủ tục thỡ khỏc. Vỡ lỳc này giỏ trị của cỏc hệ số DCT lƣợng tử húa đƣợc so sỏnh thay vỡ biểu diễn điểm nờn thuật toỏn cú thể tỡm ra quỏ nhiều khối khớp (cỏc khối khớp sai). Do vậy, thuật toỏn này hƣớng về cỏc vị trớ chung của mỗi cặp khối tƣơng thớch và chỉ chọn ra một cặp khối cụ thể nếu và chỉ nếu cú nhiều cặp tƣơng thớch khỏc cựng vị trớ nhƣ thế (chỳng cú chung shift-vectơ). Hƣớng tới mục tiờu này, nếu 2 dũng liờn tiếp của ma trận sắp xếp A đƣợc tỡm thấy thỡ thuật toỏn này lƣu cỏc vị trớ của cỏc khối tƣơng thớch trong một danh sỏch riờng (vớ dụ, lƣu tọa độ pixel gúc trờn
33
trỏi của một khối) và tăng bộ đếm shift-vectơ C. Cụ thể, lấy (i1,i2) và (j1,j2) là cỏc vị trớ của 2 khối tƣơng thớch. Shift-vectơ s giữa 2 khối tƣơng thớch này đƣợc tớnh:
Với mỗi cặp khối tƣơng thớch, chỳng ta tăng bộ đếm shift-vectơ C lờn 1:
Cỏc vector dịch chuyển đƣợc tớnh và bộ đếm C đƣợc tăng lờn với mỗi cặp dũng liờn tiếp khớp nhau trong ma trận sắp xếp A. Shift-vectơ C đƣợc khởi tạo bằng 0 trƣớc khi thuật toỏn bắt đầu. Kết thỳc tiến trỡnh so khớp, bộ đếm C thể hiện tần số của cỏc shift-vectơ . Sau đú, thuật toỏn này tỡm ra tất cả cỏc shift-vectơ s(1), s(2) , …, s(k) sao cho C(s (r)) > T với r = 1, …, K. Cỏc khối khớp nhau đúng gúp vào cỏc shift-vectơ này đƣợc tụ màu giống nhau và đƣợc xem nhƣ cỏc khối lặp.
c) Phỏt hiện cỏc vựng lặp dựa vào phộp phõn tớch thành phần chớnh
Hạn chế của cỏc cỏch tiếp cận đó nờu là nhạy với cỏc thay đổi nhỏ giữa cỏc vựng lặp vớ dụ do tạp nhiễu thờm vào hay kỹ thuật nộn mất thụng tin. Ở đõy miờu tả một thuật toỏn tiếp theo khắc phục đƣợc hạn chế này trong khi vẫn giữ lại tớnh hiệu quả của nú.
Xột một ảnh cấp xỏm với N pixels. Một ảnh đƣợc lợp bằng việc chồng cỏc khối b pixels ( b bpixels), mỗi khối đƣợc giả sử nhỏ hơn đỏng kể so với kớch thƣớc của cỏc vựng giống nhau đƣợc phỏt hiện. Lấy , i = 1,…, Nb biểu thị cho cỏc khối này ở dạng vectơ, với Nb ( N b 1)2. Bõy giờ chỳng ta xem xột một biểu diễn khỏc cỏc khối ảnh này dựa trờn phộp phõn tớch thành phần chủ yếu (PCA). Giả sử rằng cỏc khối cú giỏ trị trung bỡnh là 0, và tớnh ma trận đồng biến (covariance matrix) nhƣ sau:
(1)
Cỏc vectơ riờng , của ma trận C, cú cỏc giỏ trị riờng tƣơng ứng j, thỏa:
(2)
định nghĩa cỏc thành phần chủ yếu, trong đú j = 1,…, b và 1 2 … b. Cỏc vectơ riờng, , hỡnh thành một cơ sở tuyến tớnh mới cho mỗi khối ảnh, :
34
Số chiều của biểu biễn này cú thể đƣợc giảm một cỏch đơn giản bằng việc bỏ bớt tổng trong phƣơng trỡnh (3) thành Nt số hạng đầu tiờn. Lƣu ý rằng phộp chiếu lờn Nt vectơ riờng đầu tiờn của cơ sở PCA cho ra một sự xấp xỉ Nt chiều tốt nhất theo nghĩa cỏc bỡnh phƣơng tối thiểu (nếu phõn bố của là phõn bố Gaussian đa chiều). Vỡ vậy, Sự biểu diễn giảm về số chiều cung cấp một khoảng trống thuận tiện để nhận ra cỏc khối giống nhau khi cú mặt của tạp nhiễu, vỡ sự bỏ bớt cơ sở này sẽ bỏ đi cỏc biến đổi cƣờng độ nhỏ.
Thuật toỏn phỏt hiện tiến hành nhƣ sau. Đầu tiờn, làm giảm hơn nữa cỏc
biến đổi nhỏ do tạp nhiễu, biễu diễn số chiều giảm của mỗi khối ảnh , đƣợc lƣợng tử húa, trong đú số nguyờn dƣơng Q ỏm chỉ số lƣợng cỏc bớt lƣợng tử húa. Một ma trận N(b b) đƣợc xõy dựng sao cho cỏc dũng của nú chứa cỏc hệ số lƣợng tử này. Lấy ma trận S là kết quả của việc sắp xếp theo từ điển cỏc dũng của ma trận thành thứ tự cột. ỏm chỉ dũng thứ i của ma trận đƣợc sắp xếp này, và bộ (xi, yi) cho biết cỏc tọa độ ảnh của khối (gúc trờn trỏi) tƣơng ứng với . Tiếp theo xột tất cả cỏc cặp dũng và , khoảng cỏch dũng của nú, |i - j|, trong ma trận đƣợc sắp xếp S nhỏ hơn một ngƣỡng cho trƣớc. Trong ảnh, offset của tất cả cỏc cặp nhƣ thế đƣợc cho bởi:
Từ một danh sỏch tất cả cỏc offset nhƣ thế, cỏc vựng lặp trong ảnh đƣợc phỏt hiện bằng việc nhận ra cỏc offset với sự xảy ra cao. Vớ dụ, một vựng lặp lớn sẽ gồm nhiều khối nhỏ hơn, mỗi khối trong chỳng sẽ xuất hiện trong sự xấp xỉ gần với mỗi khối khỏc trong ma trận đƣợc sắp xếp theo thứ tự từ điển và sẽ cú cựng offset. Để trỏnh cỏc sai sút do cỏc vựng cƣờng độ đồng nhất, độ lớn offset thấp hơn một ngƣỡng cho trƣớc phải đƣợc lờ đi.
Cỏc kết quả của sự phỏt hiện này cú thể đƣợc hỡnh dung bằng việc xõy dựng một biểu đồ lặp. Tạo ra một ảnh zero cú cựng kớch thƣớc nhƣ ảnh gốc, và tất cả cỏc điểm trong một vựng lặp đƣợc gỏn một giỏ trị cấp xỏm duy nhất. Độ phức tạp của thuật toỏn này, bị chi phối bởi việc sắp xếp theo thứ tự từ điển, là O(NtNlogN), trong đú Nt là số chiều của cỏc biểu diễn PCA và N là tổng số pixel của ảnh.
35
Cú ớt nhất 2 cỏch để mở rộng thuật toỏn này cho cỏc ảnh màu. Cỏch tiếp cận đơn giản nhất là xử lý độc lập mỗi kờnh màu (vớ dụ, RGB) để tạo ra 3 biểu đồ lặp. Cỏch tiếp cận thứ 2 là ỏp dụng PCA với cỏc khối màu kớch thƣớc 3b, và tiến hành theo cỏch đó miờu tả ở trờn.
36
Chương 3. CHƢƠNG TRèNH THỬ NGHIỆM
Trong chương này sẽ trỡnh bày phần xõy dựng chương trỡnh thử nghiệm kỹ thuật phỏt hiện ảnh giả mạo trong mụi trường lập trỡnh Visual C++. Chương trỡnh ỏp dụng thuật toỏn tỡm cỏc vựng lặp trong ảnh để phỏt hiện loại ảnh giả mạo sinh bởi thao tỏc copy và dịch chuyển vựng trờn ảnh.