Phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán dựa vào thuật toán SIFT.

Một phần của tài liệu Phát hiện ảnh kỹ thuật số giả mạo dạng cắt dán luận văn thạc sĩ (Trang 76 - 96)

toán SIFT.

Cách tiếp cận đƣợc đề xuất là dựa trên các thuật toán SIFT để trích xuất các tính năng mạnh mẽ mà có thể cho phép phát hiện ra nếu một phần của một hình ảnh đƣợc sao chép di chuyển. Trong thực tế, phần sao chép đã cơ bản cùng sự xuất hiện của bản gốc, do đó điểm khóa (keypoints) đƣợc chiết xuất trong khu vực giả mạo sẽ khá giống với bản gốc.

Trên cơ sở đó tôi đƣa ra thuật toán tìm ra các điểm khóa và phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán FImage 0.1, bao gồm các bƣớc sau:

Bước 1: Khai thác các tính năng của thuật toán SIFT và kết hợp với nhiều điểm khóa (keypoint).

Thuật toán SIFT (Scale Invarian Feature Tranorms) [9]

Đây là một trong những phƣơng pháp hiệu quả để trích chọn các điểm bất biến từ các ảnh đƣợc dùng để thực hiện so khớp tin cậy giữa các tầm nhìn khác nhau của cùng một đối tƣợng hoặc quang cảnh. Phƣơng pháp này đƣợc gọi là “Phép biến đổi đặc trƣng bất biến tỷ lệ” (Scale Invariant Feature Transform – SIFT) vì nó biến đổi dữ liệu ảnh thành các tọa độ bất biến tỷ lệ có liên quan tới các đặc trƣng cục bộ. Thuật toán này gồm 4 giai đoạn chính: phát hiện các cực trị trong không gian tỷ lệ, định vị chính xác điểm khóa, gán hƣớng cho các điểm khóa, xây dựng đặc trƣng.

Phát hiện cực trị

Giai đoạn đầu tiên của phát hiện điểm khóa là tìm ra các vị trí và các tỷ lệ có thể đƣợc gán lặp đi lặp lại dƣới các tầm nhìn khác nhau của cùng một đối tƣợng. Việc phát hiện các vị trí bất biến khi có sự thay đổi tỷ lệ của ảnh có thể đƣợc thực hiện bằng việc tìm kiếm các đặc trƣng ổn định qua tất cả các tỷ lệ có thể, sử dụng một hàm liên tục tỷ lệ đƣợc hiểu nhƣ không gian tỷ lệ.

65

Dùng hàm Gaussian làm hàm nhân của không gian tỷ lệ. Vì vậy, không gian tỷ lệ của một ảnh đƣợc xác định bởi hàm L(x,y,), hàm này đƣợc tạo ra từ phép cuộn Gaussian biến thiên tỷ lệ, G(x,y,), với ảnh đầu vào I(x,y):

( , , ) ( , , ) ( , )

L x y G x y  I x y

trong đó * là phép toán cuộn theo x và y, và

2 2 2 ( ) / 2 2 1 ( , , ) 2 x y G x ye      (2.20)

Để phát hiện hiệu quả các vị trí điểm khóa ổn định trong không gian tỷ lệ, ta sử dụng các cực trị không gian tỷ lệ trong hàm Difference-of-Gaussian

đƣợc cuộn với ảnh đó, D(x,y,), hàm này có thể đƣợc tính từ sự chênh lệch giữa hai tỷ lệ lân cận đƣợc phân biệt bởi thừa số k:

( , , ) ( ( , , ) ( , , )) ( , ) ( , , ) ( , , ) D x y G x y k G x y I x y L x y k L x y           (2.21)

Hình 2.22 - Xây dựng một không gian tỷ lệ [9]

Hình 2.22 thể hiện một phƣơng pháp hiệu quả cho việc xây dựng hàm

D(x,y,). Ảnh ban đầu đƣợc cuộn theo kiểu gia tăng với các hàm Gaussian để tạo ra các ảnh đƣợc phân biệt bởi thừa số k trong không gian tỷ lệ, đƣợc xếp

66

thành chồng ở cột bên trái. Ta chia mỗi quãng của không gian tỷ lệ (nghĩa là gấp đôi ) thành s khoảng (s là số nguyên), vì vậy k = 21/s. Chúng ta phải tạo ra

s+3 ảnh trong chồng các ảnh bị làm mờ cho mỗi quãng, để việc phát hiện cực trị cuối cùng bao phủ trọn vẹn một quãng. Các tỷ lệ ảnh gần kề đƣợc trừ với nhau để tạo ra các ảnh Difference-of-Gaussian đƣợc thể hiện ở hình bên phải. Một khi một quãng trọn vẹn đƣợc xử lý, chúng ta tái lấy mẫu ảnh Gaussian gấp đôi giá trị ban đầu và việc xử lý đƣợc lặp lại.

Hình 2.23 - Các giá trị cực đại và cực tiểu của các ảnh DoG đƣợc tìm thấy bằng việc so sánh một điểm ảnh (đánh dấu X) với 26 láng giềng trong các vùng 33 ở các mức hiện thời và các mức gần kề (đƣợc đánh dấu O) [9].

Để tìm giá trị cực đại và cực tiểu địa phƣơng của hàm D(x,y,), mỗi điểm mẫu đƣợc so sánh với 8 láng giềng trong ảnh hiện thời và 9 láng giềng trong tỷ lệ ở trên và ở dƣới (Hình 2.23). Nó đƣợc chọn chỉ khi lớn hơn tất cả các láng giềng này hoặc nhỏ hơn tất cả chúng. Chi phí của sự kiểm tra này là khá nhỏ vì trên thực tế hầu hết các điểm mẫu sẽ bị loại bỏ sau vài lần kiểm tra đầu tiên.

67

Xác định điểm hấp dẫn tiềm năng:

So sánh mỗi điểm ảnh đƣợc xác định bởi hàm DoG với: • 8 điểm ảnh xung quanh ở cùng tỷ lệ

• 9 điểm ảnh xung quanh ở tỷ lệ liền trƣớc • 9 điểm ảnh xung quanh ở tỷ lệ liền sau.

Chọn là điểm hấp dẫn tiềm năng nếu nó đạt giá trị lớn nhất, hoặc nhỏ nhất

Tần số lấy mẫu theo tỷ lệ

Sự xác định thực nghiệm của tần số lấy mẫu làm tăng tối đa tính ổn định của các cực trị. Để xác định tần số lấy mẫu ngƣời ta sử dụng một bộ sƣ tập gồm 32 ảnh thực gồm nhiều loại khác nhau, bao gồm các cảnh ngoài trời, các mặt ngƣời, các bức ảnh trên không và các ảnh kỹ nghệ. Sau đó mỗi ảnh phải chịu một dãy các phép biến đổi, bao gồm phép quay, thay đổi tỷ lệ, thay đổi độ sáng và độ tƣơng phản, và thêm tạp nhiễu ảnh. Bởi vì các thay đổi này là không tự nhiên, nên có thể dự đoán chính xác nơi mà mỗi đặc trƣng trong ảnh gốc sẽ xuất hiện trong ảnh đã biến đổi, chú ý đến phép đo tính lặp lại và độ chính xác vị trí đối với mỗi đặc trƣng. Kết quả là, khả năng lặp lại cao nhất đƣợc đạt đến khi lấy mẫu 3 tỷ lệ cho mỗi quãng.

Thực nghiệm cho thấy khả năng lặp lại của các điểm khóa không tăng khi nhiều tỷ lệ hơn đƣợc lấy mẫu. Lý do là vì có nhiều cực trị địa phƣơng hơn đƣợc phát hiện, nhƣng tính trung bình các cực trị này ít ổn định và vì vậy ít có khả năng đƣợc phát hiện trong ảnh đã bị biến đổi. Số lƣợng các điểm khóa tăng lên cùng với việc lấy mẫu tăng của các tỷ lệ và tổng số lƣợng các so khớp chính xác cũng tăng. Vì sự thành công của việc nhận dạng đối tƣợng thƣờng phụ thuộc nhiều vào số lƣợng các điểm khóa đƣợc so khớp chính xác,

68

chứ không phải tỷ lệ phần trăm so khớp chính xác của chúng, nên đối với nhiều ứng dụng, sẽ tối ƣu hơn khi sử dụng một lƣợng lớn các mẫu tỷ lệ. Tuy nhiên, chi phí tính toán cũng tăng cùng với số lƣợng này, vì vậy qua thực nghiệm chúng ta chỉ cần chọn 3 mẫu tỷ lệ trên mỗi quãng.

Tóm lại, các thí nghiệm cho thấy rằng hàm Difference-of-Gaussian của không gian tỷ lệ có một lƣợng lớn các cực trị và sẽ tốn nhiều chi phí để phát hiện tất cả chúng. May thay, chúng ta có thể phát hiện đƣợc một tập con ổn định và hữu ích nhất thậm chí khi việc lấy mẫu tỷ lệ không tốt.

Tần số lấy mẫu trong một vùng không gian

Vì chúng ta đã xác định tần số lấy mẫu trên mỗi quãng của không gian tỷ lệ, cho nên phải xác định tần số lấy mẫu trong một vùng ảnh liên quan tới tỷ lệ của việc làm trơn. Biết rằng cực trị có thể gần nhau một cách tùy ý, nên sẽ có một sự cân bằng tƣơng đối giữa tần số lấy mẫu và tỷ lệ phát hiện.

Dĩ nhiên, nếu ta làm trơn ảnh trƣớc khi phát hiện cực trị thì sẽ loại bỏ một cách hiệu quả các tần số không gian cao nhất. Bởi vậy, để làm tăng tính hữu ích của dữ liệu vào thì ảnh có thể đƣợc mở rộng để tạo ra nhiều điểm mẫu hơn chúng có mặt trong ảnh gốc. Ta tăng gấp đôi kích thƣớc của ảnh đầu vào sử dụng phép nội suy tuyến tính trƣớc khi xây dựng mức đầu tiên của hình chóp. Khi phép toán tƣơng đƣơng có thể đƣợc thực thi một cách hiệu quả bằng việc sử dụng các bộ lọc khoảng trống subpixel trên ảnh gốc, thì việc gấp đôi ảnh dẫn đến sự thực thi có hiệu quả hơn. Giả sử rằng ảnh gốc có một vết mờ tối thiểu  0.5 và vì vậy, ảnh đƣợc gấp đôi có  1.0 liên quan tới khoảng cách điểm ảnh mới của nó. Điều này có nghĩa là cần làm trơn một chút trƣớc khi tạo ra quãng đầu tiên của không gian tỷ lệ. Việc nhân đôi ảnh làm tăng số lƣợng các điểm khóa ổn định bởi một thừa số là 4, nhƣng chƣa tìm thấy các cải tiến đáng kể hơn nữa đối với thừa số mở rộng lớn hơn.

69

Định vị chính xác điểm khóa

Một khi một điểm khóa ứng cử đƣợc tìm thấy bằng việc so sánh một điểm ảnh với các láng giềng của nó, thì bƣớc tiếp theo là thực hiện điều chỉnh chi tiết với dữ liệu lân cận cho vị trí, tỷ lệ, và tỷ lệ của các độ cong chủ yếu. Thông tin này cho phép loại bỏ các điểm có độ tƣơng phản thấp hoặc đƣợc định vị dọc biên kém. Thực thi ban đầu của hƣớng tiếp cận này đã định vị một cách đơn giản các điểm khóa ở vị trí và tỷ lệ của điểm mẫu trung tâm. Tuy nhiên, gần đây ngƣời ta sử dụng một phƣơng pháp khác đó là làm phù hợp một hàm bậc hai 3D cho các điểm mẫu địa phƣơng để xác định vị trí nội suy của điểm cực đại, và các thử nghiệm đã cho thấy rằng phƣơng pháp này mang lại sự cải tiến đáng kể cho việc so khớp và độ ổn định. Phƣơng pháp này sử dụng phép khai triển Taylor (tối đa là dạng bậc hai) của hàm không gian tỷ lệ, D(x,y,), đƣợc thay đổi để ảnh gốc ở vị trí điểm mẫu:

2 T 2 1 (x) x x x x 2 x T D D D  D      (2.22)

Trong đó D và các đạo hàm của nó đƣợc định giá ở điểm mẫu đó và x( , , )x yToffset từ điểm này. Vị trí của cực trị, x, đƣợc xác định bằng việc lấy đạo hàm theo x và thiết lập nó bằng 0, ta thu đƣợc:

2 1 2 x x x DD       (2.23)

70

Hình 2.24 – Hình ảnh ban đầu để xác định điểm khóa

Trích xuất các điểm khóa

Sau khi đã thu đƣợc rất nhiều điểm tiềm năng có thể làm điểm đặc biệt. Loại bỏ các điểm có độ tƣơng phản kém (nhạy cảm với nhiễu) hoặc tính đặc trƣng cục bộ ít hơn các điểm khác hoặc có xu hƣớng là đƣờng biên đối tƣợng. Bƣớc thực hiện này gồm 3 công đoạn :

o Phép nội suy lân cận cho vị trí đúng của điểm tiềm năng

o Loại trừ các điểm có tính tƣơng phản kém

o Loại bỏ các điểm dƣ thừa theo biên

71

Hình 2.25 các điểm khóa đƣợc vẽ ở dạng một vector thể hiện 3 thông tin : vị trí, hƣớng và độ dài.

Hình 2.26 – Trƣớc khi định vị điểm hấp dẫn

Theo đề xuất của Brown thì ma trận Hessian và đạo hàm của D đƣợc xấp xỉ bằng việc sử dụng các độ chênh lệch giữa các điểm mẫu lân cận. Nếu offset

x lớn hơn 0.5 ở bất kỳ chiều nào, thì có nghĩa là cực trị đó nằm gần với một điểm mẫu khác hơn. Trong trƣờng hợp này, điểm mẫu đƣợc thay đổi và thực hiện phép nội suy thay cho điểm đó. Offset cuối cùng x đƣợc cộng thêm về hƣớng vị trí điểm mẫu của nó để có đƣợc sự ƣớc lƣợng nội suy cho vị trí của cực trị đó.

Giá trị hàm ở cực trị, D( x ), có ích cho việc loại bỏ các cực trị không ổn định có độ tƣơng phản thấp. Có thể đạt đƣợc điều này bằng việc thế phƣơng trình (2.22) vào (2.23), ta đƣợc: 1 (x) x 2 x T D D  D   (2.24)

Thông qua các thí nghiệm ngƣời ta nhận thấy rằng, tất cả các cực trị có giá trị |D(x)| nhỏ hơn 0.03 đều đƣợc loại bỏ.

72

Từ hình 2.26 ta thu đƣợc các điểm hấp dẫn nhƣ hình 2.27

Hình 2.27 - Sau khi định vị điểm hấp dẫn

* Loại bỏ các đáp ứng biên

Đối với tính ổn định, không đủ để loại bỏ các điểm khóa có độ tƣơng phản thấp. Dù vị trí dọc theo biên đƣợc xác định tồi nhƣng hàm Difference-of- Gaussian vẫn có một đáp ứng mạnh dọc theo các biên và vì vậy không ổn định khi có các lƣợng nhỏ tạp nhiễu.

Đỉnh đƣợc xác định tồi trong hàm Difference-of-Gaussian sẽ có một độ cong lớn chủ yếu ngang qua biên ngoại trừ độ cong nhỏ ở hƣớng trực giao. Các độ cong chủ yếu có thể đƣợc tính từ ma trận Hessian 22, H, đƣợc tính ở vị trí và tỷ lệ của điểm khóa:

xx xy xy yy D D D D          H (2.25)

Các đạo hàm đƣợc ƣớc lƣợng bằng việc lấy các độ chênh lệch giữa các điểm mẫu láng giềng.

73

Các giá trị riêng của ma trận H tƣơng ứng với các độ cong chủ yếu của

D. Lấy  là giá trị riêng với cƣờng độ lớn nhất và là giá trị riêng với cƣờng độ nhỏ hơn. Khi đó, ta có thể tính tổng các giá trị riêng từ dấu vết của H và tích của chúng đƣợc tính từ giá trị của định thức:

Tr(H) = Dxx + Dyy =  + , Det(H) = DxxDyy – (Dxy)2 = .

Trong trƣờng hợp không chắc xảy ra đó là định thức có giá trị âm, các độ cong có các dấu hiệu khác nhau vì vậy điểm bị loại bỏ không phải là một cực trị. Lấy r là tỷ lệ giữa giá trị riêng có cƣờng độ lớn nhất và giá trị riêng có cƣờng độ nhỏ hơn, để  = r. Khi đó, 2 2 2 2 2 Tr( ) ( ) ( ) ( 1) Det( ) r r r r             H H (2.26)

Biểu thức (r+1)2/r nhận giá trị cực tiểu khi hai giá trị riêng bằng nhau và nó tăng cùng với r. Vì vậy, để kiểm tra xem tỷ lệ của các độ cong chủ yếu có ở dƣới một ngƣỡng r nào đó không, ta chỉ cần kiểm tra:

2 2 Tr( ) ( 1) Det( ) r r   H H

Các thí nghiệm cho thấy sử dụng giá trị r = 10, sẽ loại bỏ đƣợc các điểm khóa có tỷ lệ giữa các độ cong chủ yếu lớn hơn 10. Sự chuyển tiếp từ Hình 2.25

sang Hình 2.26 thể hiện các tác động của thao tác này.

Gán hƣớng cho các điểm khóa

Bằng việc gán một hƣớng thích hợp cho mỗi điểm khóa dựa trên các đặc tính ảnh cục bộ, bộ mô tả điểm khóa đƣợc trình bày ở phần sau có liên quan tới hƣớng này và vì vậy đạt đƣợc sự bất biến đối với phép quay ảnh.

74

Để gán một hƣớng cục bộ cho mỗi điểm khóa ta sử dụng hƣớng gradient của ảnh. Tỷ lệ của điểm khóa đƣợc dùng để lựa chọn ảnh đƣợc làm trơn Gaussian, L, với tỷ lệ gần nhất, để thực hiện tất cả các tính toán theo kiểu bất biến tỷ lệ. Đối với mỗi mẫu ảnh, L(x,y), ở tỷ lệ này, cƣờng độ gradient, m(x,y) và hƣớng,

(x,y) đƣợc tính toán trƣớc sử dụng độ chênh lệch điểm ảnh:

2 2 ( , ) ( ( 1, ) ( 1, )) ( ( , 1) ( , 1)) m x yL xyL xyL x y L x y 1 ( , )x y tan (( ( ,L x y 1) L x y( , 1)) /( (L x 1, )y L x( 1, )))y         

Một biểu đồ hƣớng đƣợc thiết lập từ các hƣớng gradient của các điểm mẫu trong phạm vi một vùng lân cận xung quanh điểm khóa. Biểu đồ hƣớng có 36 bin bao phủ 360 độ của tất cả các hƣớng. Mỗi mẫu đƣợc thêm vào biểu đồ đƣợc gán trọng số bởi độ lớn gradient của nó và bởi một cửa sổ hình tròn Gaussian với gấp 1.5 lần tỷ lệ của điểm khóa đó.

75

Các đỉnh trong biểu đồ hƣớng tƣơng ứng với các hƣớng bao quát các gradient cục bộ. Dựa vào biểu đồ hƣớng ta có thể xác định đƣợc đỉnh cao nhất trong biểu đồ và khi đó bất kỳ đỉnh cục bộ nào khác nằm trong phạm vi 80% so với đỉnh cao nhất đều đƣợc dùng để tạo ra một điểm khóa với cùng hƣớng đó. Vì vậy, đối với các vị trí có nhiều đỉnh có cƣờng độ tƣơng tự nhau, thì sẽ có nhiều điểm khóa đƣợc tạo ra ở cùng vị trí và tỷ lệ đó nhƣng các hƣớng thì

Một phần của tài liệu Phát hiện ảnh kỹ thuật số giả mạo dạng cắt dán luận văn thạc sĩ (Trang 76 - 96)

Tải bản đầy đủ (PDF)

(104 trang)