Hƣớng tiếp cận bài toán phát hiện ảnh giả mạo

Một phần của tài liệu Nghiên cứu các phương pháp phát hiện ảnh kỹ thuật số giả mạo và ứng dụng (Trang 25 - 66)

2. Bố cục luận văn

1.2.3.Hƣớng tiếp cận bài toán phát hiện ảnh giả mạo

1.2.3.1.Dựa vào hình dạng

Việc phân tích để xác định tính giả mạo có thể dựa vào hình dạng vì việc cắt/dán ảnh hƣờng đƣợc thực hiện dựa theo các đƣờng biên, nơi có sự thay đổi không liên tục của cƣờng độ sáng của các điểm ảnh.

1.2.3.2.Dựa vào phân tích nguồn sáng

Tấm ảnh ghép từ nhiều hình ảnh khác nhau sẽ khó có độ thuần nhất về ánh sáng (cƣờng độ chiếu sáng, hƣớng của ánh sáng…). Ví dụ một quả cầu nhƣ hình bên sẽ sáng nhất ở bề mặt có ánh sáng chiếu thẳng góc (hƣớng của mũi tên vàng), tối nhất ở phía đối diện, các vùng xung quanh nó sẽ sáng với mức độ khác nhau tùy vị trí khuất. Sự phản xạ lại của tia sáng sang không gian hay vật thể xung quanh cũng có mức độ tƣơng ứng.

Để nhận biết hƣớng của nguồn sáng, cần phải biết đƣợc hƣớng chiếu sáng trên từng vị trí của bề mặt. Sẽ rất khó nếu nhìn toàn bộ vật thể để xác định nguồn sáng nhƣng hãy chú ý đến các đƣờng viền trên bề mặt - nơi hƣớng ánh sáng vuông góc với bề mặt. Bằng cách đo độ sáng và hƣớng cùng với một số điểm trên đƣờng viền, các thuật toán có thể xác định đƣợc hƣớng nguồn sáng.

1.2.3.3.Dựa vào biến đổi màu sắc

Ảnh gốc thu nhận thƣờng đƣợc thực hiện bởi một thiết bị, do tính chất biến đổi của ống kính bao gồm góc độ chụp, độ mở v.v.. nên ảnh thu đƣợc thƣờng bị biến dạng theo các tính chất đặc trƣng của các nhà sản xuất. Phần ảnh đƣợc ghép vào hay bổ sung thƣờng không có sự biến đổi tƣơng đồng về độ sáng.

1.2.3.4. Dựa vào cơ sở dữ liệu

17

bản bởi một nơi nào đó nhƣ: Báo chí, trang Web, tạp chí v.v.. Các ảnh này đã đƣợc lƣu trữ nên khi xuất hiện một ảnh nghi là giả mạo ngƣời ta có thể tìm ảnh này với các phần trong nguồn ảnh nằm trong cơ sở dữ liệu ảnh.

Hình 2.7. Sơ đồ về việc phát hiện ảnh giả mạo dựa vào cơ sở dữ liệu

1.2.3.5. Dựa vào dấu vết quá trình điều chỉnh tỷ lệ

Khi cắt/dán các đối tƣợng từ hai hay nhiều bức ảnh để đƣợc một bức ảnh giả ngƣời ta phải quan tâm tới việc điều chỉnh kích thƣớc, màu sắc của các đối tƣợng trên các bức ảnh gốc đƣợc cắt ra để cho phù hợp với nhau khi đƣợc ghép trên cùng một bức ảnh.

18

CHƢƠNG 2: MỘT SỐ KỸ THUẬT PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO

2.1. Phát hiện ảnh giả mạo dựa trên thuật toán Exact Match 2.1.1. Ý tƣởng

Thuật toán sử dụng các khối bao để đối sánh nhằm tìm ra các vùng giống nhau trên toàn bộ bức ảnh, một bức ảnh là giả khi xuất hiện hai hay nhiều vùng ảnh giống nhau. Đây là minh chứng cho bức ảnh đã bị cắt dán.[2]

Giả sử một bức ảnh có kích thƣớcM×N, vớiBlà kích thƣớc nhỏ nhất của khối bao mà ngƣời dùng định nghĩa để đối sánh. Với mỗi điểm ảnh ta xác định đƣợc một khối bao ma trậnB×Bđiểm ảnh. Nhƣ vậy, với bức ảnh M×Nta xác định đƣợc(M - B + 1)×(N - B +1)khối bao. Với mỗi khối bao ta lƣu các phần tử thuộc khối bao vào một hàng của một ma trận A. Vậy duyệt trên toàn bộ bức ảnh ta sẽ đƣợc một ma trận A với (M - B + 1)×(N - B +1)hàng và B×Bcột.[6]

Hai hàng giống nhau trong ma trận A tƣơng đƣơng với 2 khối bao giống nhau trong ảnh. Chúng ta sắp xếp các hàng trong ma trận A theo thứ tự từ điển, yêu cầu này sẽ đƣợc thực hiện trênMNlog2(MN)bƣớc. Sau đó ta dễ dàng tìm kiếm bằng cách duyệtMNhàng của ma trận đã qua sắp xếp A và tìm kiếm hai hàng giống nhau liên tiếp.

Kết quả thuật toán sẽ tìm kiếm và đƣa ra đƣợc tập các vùng bao giống nhau là bằng chứng chứng minh ảnh đã bị cắt dán.

19

2.1.2. Thuật toán

Thuật toán Extract Match nhằm tìm ra các khối bao giống nhau trên cùng một ảnh, bao gồm các bƣớc sau:

Bước 1: Lựa chọn kích thƣớc khối bao nhỏ nhất.

Bước 2: Xác định tập các khối bao dựa trên kích thƣớc khối bao nhỏ nhất.

Bước 3: Đƣa mỗi khối bao vào một hàng của mảng lƣu xác định.

Bước 4: Sắp xếp các hàng trong mảng lƣu ở bƣớc 3 theo thứ tự tăng dần.

Bước 5: Kiểm tra hai hàng liên tiếp trong mảng lƣu sau khi đã sắp xếp, nếu

chúng giống nhau thì đƣa ra 2 tập khối bao giống nhau tƣơng ứng.

Kết quả trong hình minh họa cho thuật toán này. Hình 2.9a là ảnh gốc với một chiếc trực thăng. Hình 2.9b là ảnh giả đƣợc tạo từ ảnh gốc với 3 chiếc trực thăng, trong đó có 2 chiếc đƣợc copy mà không thay đổi kích thƣớc và 1 chiếc có thay đổi kích thƣớc. Hình 2.9c là ảnh kết quả phát hiện giả mạo nhờ thuật toán Exact Match, kết quả những chiếc trực thăng giả mạo không thay đổi kích thƣớc bị phát hiện.

a) Ảnh gốc b) Ảnh giả mạo cắt dán (adsbygoogle = window.adsbygoogle || []).push({});

c) Các vùng giả mạo đƣợc phát hiện bởi thuật toán Exact Match

20

2.1.3. Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thƣớc

Thuật toán Exact Match trình bày ở trên thƣờng phát hiện khá tốt với các ảnh giả mạo dạng cắt dán, nhƣng không có sự thay đổi về kích thƣớc. Trong trƣờng hợp vùng cắt dán có thay đổi về kích thƣớc thì thuật toán không phát hiện đƣợc sự giả mạo. Thực tế cho thấy, hầu hết các ảnh giả mạo đều đƣợc cắt dán nhờ các chƣơng trình xử lý ảnh số. Một trong những chƣơng trình nổi tiếng đó là PhotoShop. Xuất phát từ thực tế này, chúng tôi nghiên cứu các kỹ thuật đƣợc sử dụng trong PhotoShop nhằm thay đổi kích thƣớc khối bao. Trên cơ sở đó, đề xuất một cải tiến cho thuật toán Exact match.

2.1.3.1.Các kỹ thuật thay đổi kích thƣớc

Việc thay đổi kích thƣớc một vùng ảnh thƣờng sử dụng kỹ thuật nội suy tuyến tính xác định để ánh xạ ảnh từ miền không gian này sang miền không gian khác. Các kỹ thuật nội suy đƣợc sử dụng trong trong PhotoShop là: Láng giềng gần nhất (Nearest neighbor), nội suy tuyến tính (Bilinear interpolation) và Bicubic.

Hình 2.10:Mô hình ánh xạ các điểm ảnh từ ảnh gốc sang ảnh đích [2]

Nearest-neighbor

Kỹ thuật này đƣợc diễn tả nhƣ sau: với mỗi điểm ảnh từ ảnh gốc sẽ tƣơng ứng với một vị trí phù hợp trong ảnh đích (ảnh đã đƣợc thay đổi kích thƣớc). các giá trị màu và tín hiệu của một điểm ảnh trong ảnh mới sẽ đƣợc gán bằng giá trị màu của điểm ảnh gần nhất (láng giềng gần nhất) thuộc ảnh gốc tƣơng ứng.

21  Bilinear interpolation

Phƣơng pháp này xác định giá trị của một điểm ảnh mới dựa trên trung bình trọng số của 4 điểm ảnh láng giềng gần nhất 2x-2 của điểm ảnh thuộc ảnh gốc.

Chúng ta miêu tả chi tiết phƣơng pháp nội suy bilinear nhƣ sau: Giả sử với mỗi điểm (x,y) thuộc ảnh gốc ta xác định đƣợc các giá trị ánh xạ tƣơng ứng (X,Y) thuộc ảnh đích theo phép biến đổi sau:

) , (x y f X x ) , (x y f Y y Với fx,fylà các hàm tuyến tính.

Giả sử u và v lần lƣợt là các phần nguyên của X và Y.Thuật toán nội suy bilinear đƣợc định nghĩa nhƣ sau:

) 1 , 1 ( ) 1 , ( ) , 1 ( ) , ( W ) , (X Y u,vI u v W 1, I u v W, 1I u v W 1, 1I u v I u v uv u v Trong đó: ) 1 )( 1 ( Wu,v u x v y ) 1 )( ( , 1 x u v y Wu v ) )( 1 ( 1 , u x y v Wuv ) )( ( 1 , 1 x u y v Wu v

Cách lấy trung bình trọng số của các điểm ảnh láng giềng đã loại bỏ các chi tiết răng cƣa trong ảnh kết quả và do đó bức ảnh kết quả sẽ có các đƣờng biên mịn và sắc nét. Mặt khác đây là phƣơng pháp nội suy làm thay đổi thông tin về màu sắc của ảnh gốc, tất cả các điểm ảnh thuộc ảnh gốc đều góp phần tạo ra giá trị của điểm ảnh mới.

22  Bicubic interpolation

Với phƣơng pháp này bức ảnh sẽ đƣợc chia làm các khối hình vuông kích thƣớc 4x4. Phƣơng pháp này có thể đƣợc tính theo mô hình “hàng-hàng“ (row-by- row) và sau đó là “cột-cột” (column-by-column).

Chúng ta giả sử rằng các cƣờng độ tại u-1, u, u+1, u+2 lần lƣợt là I(u-1), I(u), I(u+1), I(u+2) , cƣờng độ tại 0< X <1 sẽ đƣợc ƣớc lƣợng từ phƣơng trình sau:

2 1 0 1 ( ) ( 1) ( 2) ) 1 ( ) (X I u f I u f I u f I u f f Trong đó: t t t f 2 1 2 1 3 2 1 , , 1 2 5 2 3 3 2 0 t t f , 2 1 2 2 3 3 2 1 t t t f 2 3 2 2 1 2 1 t t f

Nội suy Bicubic phức tạp và cho ra chi tiết các đƣờng biên mịn hơn nội suy Bilinear. Đây là phƣơng pháp đƣợc sử dụng phổ biến nhất trong các phần mềm sử lý ảnh do nó cho chất lƣợng ảnh sau khi nội suy là tốt nhất. Mặt khác phƣơng pháp này cũng làm thay đổi các thông tin về màu sắc của ảnh gốc.

2.1.3.2.Thuật toán cải tiến Exact Match*

Khi thay đổi kích thƣớc ảnh, PhotoShop thƣờng sử dụng 1 trong các kỹ thuật nội suy đƣợc trình bày ở trên. Dựa vào đó ta tìm kiếm các cặp vùng trong ảnh có mối quan hệ tƣơng quan theo một phƣơng pháp nội suy xác định. Một vùng đƣợc gọi là vùng tƣơng quan nếu nó tồn tại ít nhất một vùng và một phép biến đổi, tƣơng ứng khác sao cho:

23 :

f

Trong đó là hệ số tỷ lệ, và phép ánh xạ theo một phƣơng pháp nội suy xác định là một trong các kỹ thuật nội suy. Khi đó cặp vùng ( , ) đƣợc gọi là cặp tƣơng quan.

Giả sử bức ảnh có kích thƣớc M N, là hệ số tỷ lệ xác định, f là phép biến đổi nội suy tuyến tính xác định và B Blà kích thƣớc khối bao nhỏ nhất chỉ định.

Duyệt toàn bộ bức ảnh theo chiều (left-top) (right-bottom). Với mỗi điểm ảnh ta xác định đƣợc hai khối bao tƣơng ứng có kích thƣớc lần lƣợt là B B

B

B bao quanh nó. Vậy khi duyệt trên toàn bộ bức ảnh ta có tất cả ) (adsbygoogle = window.adsbygoogle || []).push({});

1 )(

1

(M B N B khối bao có kích thƣớc B B và (M B 1)(N B 1) khối bao có kích thƣớc B B.

Gọi tập hợp các khối bao có kích thƣớc B B là 1và tập hợp các khối bao có kích thƣớc B B là 2, giả sử 1và 2đƣợc biểu diễn nhƣ sau:

m i a a a a1, 2,.., ,.., 1 n j b b b b1, 2,.., ,.., 2

Trong đó ailà khối bao thứ icó kích thƣớc B B với )

1 )(

1

(M B N B

m , và bjlà khối bao thứ j có kích thƣớc B B với ) 1 )( 1 (M B N B n .

Xét tập hợp 1, ứng với mỗi phần tử khối bao aicó kích thƣớcB B (với

m

i 1, ), ta áp dụng kỹ thuật biến đối nội suy tuyến tính với phép biến đổi f cho trƣớc và một hệ số tỷ lệ đã đƣợc định nghĩa ta sẽ đƣợc một phần tử khối bao mới

'

i

24

'

:ai ai

f

Nhƣ vậy, với tập hợp các khối bao 1sau khi áp dụng lần lƣợt phép biến đổi nội suy tuyến tính đối với từng phần tử trong 1ta sẽ đƣợc một tập hợp mới tƣơng ứng là ' ' ' 2 ' 1 ' 1 a ,a ,..,ai,..,am .

Chúng ta tìm kiếm các cặp khối bao tƣơng quan trong 1 và 2 nhƣ sau: Đối sánh lần lƣợt các khối bao thuộc tập '

1với các khối bao thuộc tập 2,nếu tồn tại một cặp khối bao (ai',bj) với '

1 '

i

abj 2 (trong đó i 1,m, j 1,n) thoả mãn ai' bjthì ta khẳng định cặp khối bao (ai,bj) là cặp tƣơng quan.

Vậy tập hợp các cặp khối bao tƣơng quan (ai,bj)trong đó ai 1,bj 2 là các cặp giả mạo. Do mỗi khối bao ứng với 1 vùng trong ảnh, tập hợp các khối bao tƣơng quan tƣơng ứng với tập hợp các cặp vùng trong ảnh đã đƣợc làm giả.

Thuật toán Exact match*

Thuật toán thực hiện các bƣớc sau:

Bước 1: Lựa chọn các thông số đầu vào bao gồm: Kích thƣớc khối bao nhỏ

nhất B, các tỷ lệ co giãn theo chiều ngang và chiều dọc là p,q và một phƣơng pháp nội suy f. (adsbygoogle = window.adsbygoogle || []).push({});

Bước 2: Xác định 2 tập hợp các khối bao, bao gồm một tập hợp các khối bao

có kích thƣớc tối thiểu B B và một tập hợp các khối bao có kích thƣớc pB qB

trên toàn bộ ảnh.

Bước 3: Biến đổi tập các khối bao có kích thƣớc B B sang tập các khối bao

mới theo phép biến đổi nội suy và các thông số về tỷ lệ co giãn theo chiều ngang và chiều dọc đã cho trong bƣớc 1.

Bước 4: Đối sánh các cặp khối bao, mỗi cặp khối bao gồm một khối bao thuộc tập hợp các khối bao sau khi biến đổi ở bƣớc 3 và một khối bao thuộc tập hợp

25

các khối bao có kích thƣớc pB qB trong bƣớc 2. Nếu chúng giống nhau thì đƣa ra đƣợc cặp hai khối bao tƣơng ứng gồm: Một khối bao thuộc tập các khối bao có kích thƣớc B B tạo ra ở bƣớc 2 và một khối bao thuộc tập các khối bao có kích thƣớc pB qB tạo ra trong bƣớc 2.

2.2. Phát hiện ảnh giả mạo dựa trên thuật toán phân tích nguồn sáng

Khi tạo ra một ảnh giả, ví dụ ghép hai ngƣời đứng cạnh nhau, thƣờng khó tƣơng thích về các điều kiện ánh sáng từ các ảnh riêng lẻ. Các đối tƣợng đƣợc ghép thƣờng có hƣớng nguồn sáng không tƣơng đồng với các đối tƣợng trong ảnh gốc. Do vậy, sự khác nhau về hƣớng sáng có thể là một dấu hiệu của giả mạo ảnh số. Ở hình 2.11 là một ảnh ghép, ở đó hai ngƣời đƣợc chụp với ánh sáng ở các góc độ khác nhau.

Hình 2.11: Phát hiện mâu thuẫn hƣớng nguồn sáng

Với phạm vi hƣớng nguồn sáng có thể đƣợc ƣớc lƣợng cho các đối tƣợng khác nhau trong một ảnh, sự mâu thuẫn trong hƣớng ánh sáng có thể đƣợc sử dụng nhƣ bằng chứng của giả mạo ảnh số.

2.2.1. Các phƣơng pháp uớc lƣợng hƣớng nguồn sáng 2.2.1.1. Nguồn ánh sáng vô tận (3-D) 2.2.1.1. Nguồn ánh sáng vô tận (3-D)

Dƣới đây giả thuyết cƣờng độ điểm ảnh đƣợc biểu diễn bằng phƣơng trình:

26 Trong đó:

+ R là giá trị hằng số phản xạ bề mặt. + L

là vector biểu diễn hƣớng nguồn sáng + N

(x,y) là vector biểu diễn pháp tuyến bề mặt tại điểm ảnh (x,y). + A là biên độ ánh sáng.

Nếu chỉ quan tâm đến hƣớng nguồn sáng, thì hệ số phản xạ R có thể đƣa về giá trị đơn vị. Từ phƣơng trình (2.1) qua biến đổi tuyến tính ta có thể tính L

và A. [3]

Với ít nhất 4 điểm có cùng hệ số phản xạ bề mặt và có các vector pháp tuyến bề mặt khác nhau. Hƣớng nguồn sáng và biên độ A có thể đƣợc tính thông qua ƣớc lƣợng bình phƣơng cực tiểu (least squares estimation). Đầu tiên, một hàm sai phân bậc 2 sẽ thay thế cho phƣơng trình (2.1) nhƣ sau:

(2.2)

Với ||.|| là ký hiệu chuẩn vector Lx,Ly,Lzlà ký hiệu các thành phần của hƣớng nguồn sáng L

. Và

(2.3)

Với Nx(xi,yi), Ny(xi,yi) và Nz(xi,yi) là ký hiệu các thành phần của pháp tuyến bề mặt N tại điểm (xi,yi).

Hàm sai phân bậc 2 ở (2.2) đạt nhỏ nhất tƣơng ứng với vector v đƣợc tính bằng ƣớc lƣợng bình phƣơng cực tiểu:

27 Trong đó:

2.2.1.2.Nguồn ánh sáng vô tận (2-D)

Phần này trình bày một giải pháp thông minh hơn để ƣớc lƣợng 2 thành phần của hƣớng nguồn sáng (Lx và Ly) từ một ảnh đơn. Cách tiếp cận này cung cấp ít thông tin về hƣớng nguồn sáng, làm cho vấn đề dễ kiểm soát hơn. Tại đƣờng biên của một bề mặt, thành phần z của pháp tuyến bề mặt bằng 0, Nz=0. Do vậy, ta chỉ ƣớc lƣợng 2 thành phần Lx, Ly của hƣớng nguồn sáng. [3] (adsbygoogle = window.adsbygoogle || []).push({});

Hình 2.12: Minh họa hƣớng nguồn sáng và pháp tuyến bề mặt của đối tƣợng Lúc này, hàm lỗi (2.2) có dạng:

(2.5) Trong đó:

Một phần của tài liệu Nghiên cứu các phương pháp phát hiện ảnh kỹ thuật số giả mạo và ứng dụng (Trang 25 - 66)