Phát hiện và so khớp các đặc trƣng bất biến

Một phần của tài liệu Phát hiện ảnh kỹ thuật số giả mạo dạng cắt dán luận văn thạc sĩ (Trang 33)

1.1.6.1. Điểm bất động và đặc trƣng bất biến

Điểm bất động trong toán học Ánh xạ f:AB, A B, P

Điểmx*A đƣợc gọi là điểm bất động (điểm bất biến hình học) khi và

chỉ khi f(x*)=x*. Nếu f là ánh xạ co thì x* là duy nhất.

Với cách tiếp cận toán học, hàm f thƣờng là một hàm liên tục trong lân cận của điểm x*.

Để tìm điểm bất động, ngƣời ta thƣờng dùng các phƣơng pháp xác định trƣớc một khoảng [a,b] thỏa mãn tính chất nào đó mà chứa điểm x*, sau đó dùng các phƣơng pháp lặp (nhƣ Newton, Leibniz…) để tính gần đúng điểm bất động. Sau một số bƣớc, phép lặp sẽ hội tụ về điểm bất động.

Điểm bất động trong xử lý ảnh

Trong xử lý ảnh, ngƣời ta cũng thƣờng sử dụng ánh xạ f:AB, với A là tập các điểm ảnh, hay nói cách khác f là phép biến đổi ảnh. Các phép biến đổi

22

ảnh thƣờng thấy là phép biến đổi affine (phép quay, phép tỷ lệ, phép tịnh tiến…), phép thay đổi cƣờng độ sáng. Ta gọi các phép biến đổi đó là f: II’, biến ảnh I thành ảnh I’.

Bằng một cách nào đó, ta sẽ trích ra từ ảnh I các điểm đặc trƣng (x,y)

thỏa mãn tính chất H. Nếu sau phép biến đổi A, ảnh II’, điểm (x,y) của ảnh

I trở thành (x’,y’) của ảnh I’, và điểm đó vẫn thỏa mãn tính chất H đối với ảnh

I’ thì có thể coi điểm (x,y) đó là điểm bất động đối với phép biến đổi f.

Đặc trƣng bất biến ảnh đƣợc xây dựng dựa trên cở sở của điểm bất động. Một tập các điểm bất động cùng với các đặc trƣng bất biến đƣợc tạo ra từ nó có thể đƣợc xem nhƣ là các đặc tính biểu diễn chất liệu ảnh hay đối tƣợng ảnh. Nhƣ vậy, để tìm các đặc trƣng bất biến ảnh: đầu tiên ta xác định các điểm bất động trong ảnh đối với phép biến đổi hình học nào đó, sau đó tính toán các mô tả dựa vào các điểm bất động đã tìm đƣợc, các mô tả này chính là các đặc trƣng bất biến để biểu diễn ảnh.

Có nhiều phƣơng pháp trích chọn các đặc trƣng bất biến, tùy thuộc vào từng ứng dụng cụ thể mà các đặc trƣng phù hợp sẽ đƣợc trích chọn. Bài báo này đề cập đến các đặc trƣng bất biến tỷ lệ (scale) và bất biến quay (rotation). Trong [9] xác định các điểm bất động đối với phép biến đổi tỷ lệ (SIFT), các điểm này còn gọi là các điểm khóa (keypoint), các điểm khóa (keypoint) đƣợc tìm ra trên cơ sở xây dựng các pyramid Gaussian, nó chính là nghiệm của các phƣơng trình khai triển Taylor của DoG D(x,y,σ) trên không gian tỷ lệ, đƣợc thay đổi sao cho gốc tọa độ trùng với điểm lấy mẫu (sample point):

X X D X X X D D X D T T 2 2 2 1 ) (        (1.12) Trong đó: X=(x,y,σ)

23 D(x,y,σ) = (G(x,y,kσ)-G(x,y,σ))*I(x,y) = L(x,y,kσ) - L(x,y,σ) 2 2 2 2 ) ( 2 1 ) , , (    e x y y x G   

I(x,y) là ảnh cƣờng độ, L(x,y,σ) chính là ảnh Pyramid của ảnh

I(x,y) tại tỉ lệ σ.

D và các đạo hàm của nó đƣợc đánh giá tại một điểm trung tâm (giữa) trên ảnh sau khi đã lấy mẫu bằng hàm Gauss.

Giải phƣơng trình D(X)=0 ta sẽ tìm đƣợc các nghiệm:

X D X D X         2 1 2 , và các điểm X ổn định khi và chỉ khi 0.03 D(X)0.5. Theo Taylor

      X X D D X D T 2 1 ) ( .

Sau bƣớc này, ta xác định đƣợc vị trí của các điểm khóa (keypoint) đồng thời tỉ lệ σ đƣợc chọn. Các điểm điểm khóa (keypoint) này thực chất đã bất biến tỉ lệ. Bây giờ, xây dựng đặc trƣng bất biến quay từ các điểm khóa (keypoint) này dựa trên việc tính toán độ lớn và hƣớng gradient ảnh quanh vị trí của các keypoint, các giá trị này thƣờng đƣợc tính toán so với điểm láng giềng bên cạnh [9], chẳng hạn đối với đặc trƣng khoảng cách ta có:

(1.13) Hay đặc trƣng góc: (1.14) 2 2 )) 1 , ( ) 1 , ( ( )) , 1 ( ) , 1 ( ( ) , (x yL xyL xyL x y L x ym ))) , 1 ( ) , 1 ( /( )) 1 , ( ) 1 , ( (( tan ) , (x y  1 L x y L x yL xyL xy

24

L(x,y) chính là giá trị điểm ảnh của ảnh Pyramid có σ đƣợc chọn. Hơn nữa, ở đây chúng tôi kí hiệu L(x,y) là vì thực chất việc tính công thức trên chỉ là phép trừ ảnh chứ chúng tôi không tính toán từng L(x,y, σ) cụ thể.

Với mỗi điểm khóa (keypoint) chúng tôi xây dựng đặc trƣng hƣớng và độ lớn gradient trên một lân cận kích thƣớc (4x4) theo 8 hƣớng theo công thức (1.13)(1.14), cuối cùng sẽ thu đƣợc một vector đặc trƣng 128 chiều.

Việc so khớp các vùng ảnh đƣợc thực hiện sau đó trên cơ sở đối sánh hay so khớp các đặc trƣng.

1.1.6.2. So khớp đặc trƣng

Phát hiện đối tƣợng hay vùng ảnh giống nhau, đƣợc thực hiện chủ yếu bằng việc so khớp mỗi đặc trƣng một cách độc lập với nhau. Việc so khớp đƣợc tiến hành dựa vào việc tính toán khoảng cách, một khoảng cách thƣờng dùng là khoảng cách Euclid.

Giả sử các đặc trƣng đƣợc mô tả dƣới dạng các vector trong không gian Euclid Rn thì khoảng cách Euclidean giữa hai đặc trƣng P = (p1, p2, ..., pn) và Q = (q1, q2, ..., qn) đƣợc định nghĩa nhƣ sau:                   n i i i n n q p q p q p q p Q P d 1 2 2 2 2 2 2 1 1 ... ) , ( (1.15)

Ngoài ra, ngƣời ta cũng thƣờng sử dụng khoảng cách Mahalanobis để lựa chọn cho mỗi đặc trƣng trong ảnh thứ nhất và một đặc trƣng tƣơng tự nhất trong ảnh thứ hai. Nếu khoảng cách này nhỏ hơn một ngƣỡng nào đó thì so khớp đó đƣợc chấp nhận.

25

Khoảng cách Mahalanobis từ một nhóm giá trị với giá trị trung bình = (1, 2, …, p)T và ma trận đồng biến  cho một vector đa biến x= (x1,x2,…, x3)T đƣợc định nghĩa nhƣ sau:

      

x   x

x

DM( ) T 1 (1.16)

Khoảng cách Mahalanobis cũng có thể đƣợc định nghĩa nhƣ độ đo tính không đồng dạng giữa hai vector ngẫu nhiên xy của cùng phân phối với ma trận đồng biến :           y x y x y x d     T 1   (1.17)

Nếu ma trận đồng biến là ma trận đơn vị thì khoảng cách Mahalanobis sẽ dần tới khoảng cách Euclidean. Nếu ma trận đồng biến là chéo thì độ đo khoảng cách kết quả đƣợc gọi là khoảng cách Euclidean chuẩn hóa:

        n i i i i y x y x d 1 2 2    (1.18)

Khoảng cách Mahalanobis thƣờng đƣợc dùng trong phân tích cụm và các kĩ thuật phân lớp.

So khớp hai vùng ảnh dựa trên các đặc trƣng bất biến nghĩa là so khớp các vector. Nếu các so khớp nhỏ hơn một ngƣỡng nào đó thì ta xem hai vùng ảnh đó là giống nhau.

1.2. Ảnh giả mạo và phát hiện ảnh giả mạo 1.2.1. Giới thiệu ảnh giả mạo 1.2.1. Giới thiệu ảnh giả mạo

Ảnh giả mạo đƣợc xem là ảnh không có thật, việc có đƣợc ảnh là do sự ngụy tạo bởi các chƣơng trình xử lý ảnh hoặc quá trình thu nhận. Sức mạnh

26

của các chƣơng trình xử lý ảnh số nhƣ Photoshop giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ dàng. Một trong những ví dụ cho việc giả mạo này là Hình 1.7. Hình ảnh đƣợc tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Hình ảnh Bill Clinton và Saddam Hussein đƣợc cắt/dán vào bức ảnh Nhà trắng Các hiệu ứng về bóng và ánh sáng cũng đƣợc tạo ra làm cho bƣớc ảnh có vẻ nhìn hoàn toàn nhƣ thật.

Hình 1.7 - Minh họa về việc giả mạo ảnh [3]

Giả mạo ảnh nhằm vào nhiều mục đích trong đó có việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội v.v.. Việc phát hiện và chống giả mạo ảnh là một chủ đề ngày càng đƣợc quan tâm bởi các nhóm nghiên cứu trên thế giới nhƣ: TS. Chung-Sheng Li ở IBM T. J. Watson Research Center, TS. Jessica Fridrich ở Department of Electrical and Computer Engineering, SUNY Binghamton, Binghamton, NY 13902-6000 hay TS. David Rosenthal ở Odyssey Research Associates, Inc. v.v..

27

Trong việc chống giả mạo ảnh, ngƣời ta đã nghiên cứu các kỹ thuật về tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào bức ảnh trƣớc khi phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện cho việc phát hiện sửa đổi hoặc cắt/dán sau này. Theo cách tiếp cận này, các thiết bị máy ảnh số và camera ngày nay thƣờng bổ sung các tính năng bản quyền ngay trong quá trình thu nhận ảnh. Dựa vào đó, sau này ta có thể biết đƣợc nguồn gốc của bức ảnh. Nhờ đó mà có thể biết đƣợc đó có phải là ảnh gốc hay không? Phát hiện ảnh giả mạo là một vấn đề khó hơn, ảnh giả mạo thƣờng chia làm hai loại chính. Ảnh giả nhƣng thật, ở đây hiện trƣờng đƣợc dựng thật và sau đó việc thu nhận ảnh là thật. Loại thứ hai là ảnh giả đƣợc tạo lập trên cơ sở các phần của ảnh gốc thật nhƣ hình 1 hoặc đƣợc cắt/dán để thêm vào hay che đi các chi tiết trên ảnh.

Trong báo cáo này chúng ta quan tâm đến một dạng của giả mạo thuộc loại thứ hai. Phần tiếp theo của báo cáo đƣợc trình bày nhƣ sau: Phần 2 là các dạng ảnh giả mạo loại hai cơ bản. Phần 3 là các cách tiếp cận chính trong việc phát hiện ảnh giả mạo loại hai và cuối cùng là kết luận về ảnh giả mạo và phát hiện ảnh giả mạo nói chung.

28

1.2.2. Các dạng ảnh giả mạo cơ bản

Trong dạng ảnh giả mạo thứ hai có thể chia ra làm các loại: Ghép ảnh, che phủ đối tƣợng, bổ sung thêm đối tƣợng. Hình 1.8.a minh họa ảnh ghép từ 2 ảnh riêng rẽ với cùng tỷ lệ. Rõ ràng là nếu chỉ ra đây là ảnh thật hay ảnh giả mạo thì cũng có nghĩa là chứng minh đƣợc mối quan hệ giữa họ.

Hình 1.8.b là ảnh ghép từ hai ảnh có sự thay đổi tỷ lệ. Hình ảnh này nếu không chứng minh là giả tạo thì sẽ phải có cách nhìn khác về tiến hóa của loài ngƣời.

a) Ảnh ghép từ hai ảnh riêng rẽ b) Ảnh ghép từ hai ảnh có thay đổi tỷ lệ

Hình 1.8 - Ghép ảnh từ 2 ảnh riêng rẽ [3]

Một dạng khác thƣờng thấy nữa của ảnh giả mạo loại hai là việc bớt đi các đối tƣợng trong ảnh, việc bớt đi các đối tƣợng trong ảnh có thể đƣợc xem nhƣ là che phủ đối tƣợng hoặc xóa đi đối tƣợng. Hình 1.9.a là ảnh gốc với 2 chiếc ô tô, một xe con và một xe tải. Hình 1.9.bhình 1.9.a giả tạo với việc che phủ chiếc xe tải bởi một cành cây cũng lấy từ chính trong ảnh. Trong khi

hình 1.9.c là ảnh gốc với chiếc trực thăng nhỏ còn hình 1.9.d chính là ảnh gốc

hình 1.9.a đã đƣợc bỏ đi đối tƣợng là trực thăng. Trong cả hai trƣờng hợp giả mạo này đều đƣợc thực hiện từ một ảnh nên độ tƣơng đồng về ánh sáng và bóng là nhƣ nhau. Do đó, bằng mắt thƣờng rất khó xác định.

29

a) Ảnh gốc b) Ảnh đã che phủ đối tƣợng

c) Ảnh gốc d) Ảnh bỏ đi đối tƣợng Hình 1.9 - Ảnh che phủ và bỏ đi đối tƣợng [16]

a) Ảnh gốc b) Ảnh bổ sung đối tƣợng Hình 1.10 - Ảnh bổ sung đối tƣợng [16]

Hình 1.10 thể hiện một dạng khác thƣờng thấy của giả mạo ảnh, đó là việc bổ sung thêm đối tƣợng. Hình 1.10.a là ảnh gốc chỉ có một chiếc máy bay trực thăng, nhƣng trong hình 1.10.b đã đƣợc bổ sung thêm thành 3 chiếc

30

trực thăng ở các vị trí khác nhau. Các trực thăng này chính là đƣợc copy từ trực thăng gốc nên góc độ và hƣớng là giống nhau, do đó khó cho việc xác định.

1.2.3. Một số ảnh nổi tiếng đã đƣợc phát hiện là ảnh giả mạo [18]

Tháng 8/2006, một bức ảnh minh họa của Hãng tin Reuters xuất hiện trên các trang báo lớn nhỏ trên khắp thế giới. Nội dung của bức ảnh là những cột khói tỏa lên từ một số tòa nhà cao tầng sau một đợt không kích tại Beirut. Nhƣng sau đó họ đã phát hiện ra một phần của bức ảnh đã bị ngƣời ta sao chép (copy), rồi cắt/dán lặp lại nhiều lần trong bức ảnh, có lẽ tác giả ảnh muốn cho ngƣời xem cảm nhận đƣợc sự tàn phá và hãi hùng vì... khói.

-

Hình 1.11 - Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh [18]

Một ảnh giả khác đƣợc tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Hình ảnh Bill Clinton và Saddam Hussein đƣợc cắt/dán vào bức ảnh Nhà trắng. Các hiệu ứng về bóng và ánh sáng cũng đƣợc tạo ra làm

31

cho bƣớc ảnh có vẻ nhìn gần giống nhƣ thật, rất khó nhận biết bằng mắt thƣờng.

- Một bức ảnh khác mô là hình ghép giữa hai bức ảnh khác nhau xuất hiện trong chiến dịch tranh cử tổng thống Mỹ năm 2004, cho thấy ứng viên John Kerry nói chuyện với cựu nữ diễn viên Jane Fonda tại một cuộc biểu tình phản chiến vào những năm 60 của thế kỷ trƣớc, bên dƣới có đóng “nhãn hiệu cầu chứng” là The Associated Press.

Hình 1.12 - Ảnh giả của John Kerry và Jane Fonda đƣợc cắt/dán từ hai ảnh riêng lẻ. [16]

Một số cựu binh Mỹ thời chiến tranh Việt Nam phản ứng mạnh bằng thái độ giận dữ khi thấy một ứng viên tổng thống lại chia sẻ diễn đàn với một nữ diễn viên tích cực chống chiến tranh

Ảnh giả mạo Tổng thống Bush đọc sách ngƣợc

32

Các đối thủ của Tổng thống Bush chắc hẳn rất hài lòng trƣớc bức ảnh chụp ông chủ Nhà Trắng đang cầm một quyển truyện tranh theo chiều lộn ngƣợc trong chuyến thăm tới một trƣờng học năm 2005.

Trên thực tế, ông Bush đã cầm sách đúng chiều. Những kẻ giả mạo đã sử dụng công cụ xoay ngƣợc ảnh trong Photoshop để chỉnh sửa.

Dàn khoan dầu, bão và sét

Hình 1.14 - Dàn khoan dầu, bão và sét [18]

Cảnh tƣợng một cơn bão kinh hoàng này đã xuất hiện trên internet với nhiều dị bản khác nhau qua nhiều năm. Bão và gió xoáy là một bức ảnh có thật, do một nhiếp ảnh gia nghiệp dƣ chụp đƣợc ở Flordia năm 1993. Nhƣng dàn khoan dầu đƣợc cắt vào từ một bức ảnh riêng biệt.

Ảnh giả của Holmes với nam diễn viên Tom Cruise đƣợc cắt/dán từ tạp chí bao gồm hiển thị Kimo với nữ diễn viên Katie Holmes

33

Hình 1.15 - Ảnh giả của Holmes với nam diễn viên Tom Cruise đƣợc cắt/dán từ tạp chí bao gồm hiển thị Kimo với nữ diễn viên Katie Holmes [16]

- Cá mập tấn công trực thăng

Hình 1.16 - Cá mập tấn công trực thăng [18]

Bức ảnh gây chú ý này đƣợc tạo nên nhờ việc kết hợp 2 tấm ảnh riêng biệt - một bức ảnh là trực thăng của Không quân Mỹ trong lần diễn tập tại San Francisco và tấm ảnh kia là con cá mập trắng khổng lồ đang nhảy lên khỏi mặt nƣớc ở Nam Phi.

34

Bức ảnh này xuất hiện năm 2001 và đƣợc phát tán qua email với lời chú thích: Một con cá mập đã tấn công các thủy thủ của Hải quân Anh tại Nam Phi. Nhƣng ngƣời ta có thể dễ dàng nhận ra trong ảnh có sự xuất hiện của chiếc cầu Golden Gate tại San Francisco.

- Con mèo trắng khổng lồ

Hình 1.17 - Con mèo trắng khổng lồ [18]

Bức ảnh về một con mèo khổng lồ đã đƣợc phát tán khắp thế giới qua email năm 2000, đôi khi còn đi kèm với một câu chuyện nói rằng mẹ của con mèo đã lớn lên gần một phòng thí nghiệm hạt nhân Canada.

Nhƣng 1 năm sau đó, ngƣời đàn ông trong ảnh thú nhận rằng ông đã làm

Một phần của tài liệu Phát hiện ảnh kỹ thuật số giả mạo dạng cắt dán luận văn thạc sĩ (Trang 33)