1.3.1 Ý nghĩa của việc phát hiện ảnh giả mạo
Ngày nay, ảnh số có vai trò quan trọng là phương tiện truyền thông phổ biến trong các hoạt động của đời sống. Với việc phát triển của mạnh mẽ của các phần mềm xử lý ảnh, việc chỉnh sửa và làm giả ảnh số đã trở nên hết sức dễ dàng, tinh vi.
Bên cạnh đó, vấn nạn sử dụng ảnh giả cho các mục đích xấu đang diễn ra hết sức phức tạp và mang đến hiều hệ lụy trong cuộc sống. Nó có thể ảnh hưởng đến nhiều lĩnh vực của xã hội như: Kinh tế, chính trị, anh ninh quốc phòng... Do vậy, việc phát hiện ra các sự giả mạo trên ảnh có ý nghĩa hết sức to lớn góp phần hạn chế các vấn nạn xuyên tạc thông tin. Đây là hướng nghiên cứu thu hút được sự quan tâm của các tổ chức và các nhà nghiên cứu trong ngoài nước.
1.3.2 Dựa vào hình dạng
Việc phân tích để xác định tính giả mạo có thể dựa vào hình dạng vì việc cắt dán và ghép ảnh thường được thực hiện dựa theo các đường biên, nơi có sự thay đổi không liên tục của cường độ sáng của các điểm ảnh.
1.3.3 Dựa vào phân tích nguồn sáng
Việc ghép các ảnh khác nhau hoặc bổ sung thêm đối tượng không phải thực hiện thao tác coppy có thể được thực hiện bằng việc phân tích nguồn sáng đối với từng đối tượng, các đối tượng được ghép thường có hướng của nguồn sáng không cùng với các đối tượng trong ảnh gốc.
1.3.4 Dựa vào biến đổi màu sắc
Ảnh gốc thu nhận thường được thu nhận bởi một thiết bị. Do tính chất biến đổi của ống kính bao gồm góc độ chụp, độ mở, v.v...Nên ảnh thu được thường bị biến dạng theo các tính chất đặc trưng của nhà sản xuất. Phần ảnh được ghép vào hay bổ sung thường không có sự biến đổi tương đồng về độ sáng.
27
1.3.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ
Khi cắt - dán các đối tượng từ hai hay nhiều bức ảnh để được một bức ảnh giả người ta phải quan tâm tới việc điều chỉnh kích thước, màu sắc của các đối tượng trên các bức ảnh gốc được cắt ra để cho phù hợp với nhau khi được ghép trên cùng một bức ảnh.
1.3.6 Dựa vào phân tích ánh sáng
Qua phân tích sự đồng đều của ánh sáng phân bố trên các phần khác nhau của bức ảnh có thể thực hiện bằng hai cách. Cách thứ nhất là phân tích bóng đổ để tìm ra hướng của nguồn sáng.
Hình 1- 24 Sự khác biệt của các hướng nguồn sáng khác nhau. Cách thứ hai là nghiên cứu các chấm sáng trong con ngươi mắt người. Mắt là một phần tấm gượng soi vào thế giới ẩn chứa chủ thể được chụp.
Ngoài ra, màu của ánh sáng có thể xác định bóng trắng chính xác của các chấm sáng. Một ảnh tổng hợp từ nhiều ảnh khác nhau sẽ có bóng sắc thay đổi từ người này sang người khá.
28
Chương 2: Phát hiện ảnh giả mạo dạng sao chép - dịch chuyển 2.1. Giới thiệu:
Khi mà các dòng máy ảnh kỹ thuật số dần thay thế các dòng analog, tầm quan trọng của bản quyền hình ảnh số, xác định nguồn gốc hình ảnh và phát hiện giả mạo hình ảnh ngày càng gia tăng. Đã có các chương trình tạo chữ ký số và thủy vân nhằm phát hiện khu vực ảnh bị biến đổi và khôi phục nội dung ảnh gốc, tuy nhiên các tệp kèm chữ ký số lại tách biệt khỏi tấm ảnh, trong khi việc nhúng thủy vân lại làm giảm chất lượng hình ảnh. Một vấn đề khác nữa là không có một phương pháp bảo hộ bản quyền nào đảm bảo việc ảnh của bạn có thể miễn nhiễm với mọi hình thức tấn công. Do đó, với các lỗ hổng tồn tại của hai phương thức chữ ký số và thủy vân, cần phải phát triển kỹ thuật có thể đảm bảo chất lượng và điều kiện của hình ảnh.
Phát hiện hình ảnh giả mạo là một phương thức đánh giá hình ảnh để tìm hiểu tình trạng của tấm hình mà không phụ thuộc vào các thông tin của tấm hình trước khi nhúng. Do đây là một thử thách khá lớn và việc kiến thức còn hạn chế, nghiên cứu sẽ được bắt đầu bằng việc đánh giá một vài dạng giả mạo đơn giản, ví dụ như sao chép – cắt dán.
Một cách giả mạo thường gặp đó là sao chép và dán một phần của bức hình để che đi một đối tượng quan trọng hoặc tạo ra một hiện trường giả trong tấm hình. Phần được cắt dán thường là từ chính hình ảnh đó hoặc từ nhiều nguồn hình ảnh khác nhau.
Một trong những yếu tố quyết định sự thành công của việc giả mạo bằng cách cắt dán đó là sự xuất hiện của các vùng trùng lặp trong hình ảnh nhiệt của tấm hình, bất chấp việc hình ảnh đã bị biên tập nhiều lần như là làm mờ viền. Chính điều này có thể sử dụng như bằng chứng chứng minh hình ảnh giả mạo như đã đề cập ở trên. Một phương pháp tiếp cận trực tiếp và dễ dàng để phát hiện vùng hình ảnh trùng lặp là một quá trình gian nan. Do đó nhiều nhà nghiên cứu dùng phương pháp tiếp cận bằng khối để tăng tốc độ của quá trình điều tra. Fridrich đã công bố một phương pháp hiệu quả để phát hiện các khối giả mạo bẳng cách sao-dán từ một hình ảnh đơn. Các khối hình được thể hiện qua phép biến đổi lượng hóa SVD, và phương pháp lọc tra cứu sẽ được áp dụng để phát hiện các khối hình trùng lặp.
Để có thể giảm các bước tính toán xuống thấp hơn nữa, nghiên cứu này đề xuất một phương pháp “tiếp cận vòng quanh” – hoặc “gián tiếp” nhằm
29
phát hiện các vùng hình ảnh trùng lặp dựa trên DWT và SVD. Hình ảnh sẽ được giảm chiều với DWT, sau đó SVD được áp dụng cho các khối chờm nhau có kích thước cố định có tần suất xuất hiện wavelet thấp. Các vectơ giá trị đơn được tra cứu phân loại và các khối hình trùng lập sẽ được phân tách riêng, sau đó được dùng để so sánh trong quá trình điều tra.
2.2 Phép biến đổi DWT
Phép biến đổi wavelet rời rạc (DWT – Discrete Wavelet Transform) có vai trò quan trọng trong xử lý tín hiệu nói chung và xử lý ảnh nói riêng. Ngoài việc ứng dụng trong nén ảnh, phép biến đổi này còn được dùng trong bài toán trích chọn đặc trưng hay phát hiện ảnh giả mạo. Để tiện cho việc theo dõi, phần này luận văn trình bày tóm tắt phép biến đổi wavelet rời rạc trên ảnh ảnh số.
2.2.1 Phép biến đổi DWT một mức
Phép biến đổi DWT thường được tiếp cận theo phương pháp ma trận. Nếu gọi là ma trận wavelet và là ma trận điểm ảnh thì phép biến đổi DWT một mức được xác định theo công thức:
Trong đó, là ma trận chuyển vị của H. Do là ma trận trực chuẩn nên ma trận chuyển vị cũng chính là ma trận nghịch đảo của .
Khi đó, phép đổi wavelet rời rạc ngược (IDWT – Inverse DWT) dễ dàng tính được theo công thức sau:
Như vậy, các phép biến đổi wavelet khác nhau cần xác định ma trận biến đổi . Theo các tài liệu nghiên cứu, phép biến đổi wavelet Haar là một trong những phép biến đổi wavelet thông dụng, và được ứng dụng trong chuẩn nén ảnh JPEG 2000.
Theo [12], ma trận cấp của phép biến đổi wavelet Haar được xác định như sau:
30
Hình 2. 1. Ma trận wavelet Haar cấp 8x8
Theo [12], sau khi áp dụng phép biến đổi DWT một mức trên ảnh gốc để nhận được ảnh (tập các hế số wavelet). Các hệ số của được chia thành 4 vùng như sau:
LL LH
HL H
Hình 2- 2 Miền wavelet một mức
Trên miền wavelet một mức, năng lượng của ảnh tập trung nhất vào vùng LL, tiếp theo tuần tự là các vùng LH, HL và HH. Nói một cách khác, vùng LL là ảnh thu nhỏ (ảnh đại diện) của ảnh A, các vùng LH, HL, HH chứa chi tiết của ảnh.
Ví dụ biến đổi wavelet Haar trên ảnh gốc Lena kích thước và nhận được 4 vùng kích thước tương ứng như Hình sau:
31
LL LH
HL HH
Hình 2-3 Miền wavelet một mức
Như vậy, sau khi biến đổi wavelet một mức, nếu không lưu trữ 3 vùng tần số cao (LH, HL, HH) thì sẽ giảm được ¾ dung lượng lưu trữ. Trong khi chất lượng ảnh khôi phục từ vùng LL vẫn khả quan.
2.2.2 Phép biến đổi DWT nhiều mức
Phép biến đổi DWT có thể được áp dụng nhiều lần (mức), mỗi lần áp dụng kích thước ảnh đại diện sẽ còn lại 1 phần ¼. Như vậy, đối với ảnh kích thước , nêu áp dụng wavelet 3 lần thì ảnh đại diện ở mức 3 (LL2) sẽ có kích thước . LLLLLL (LL3) HLLLLL HLLL HL LHLLLL HHLLLL LHLL HHLL LH HH Hình 2- 4 Miền wavelet 3 mức
32
Trên Hình 2-4, năng lượng của ảnh tập trung vào vùng LL3 và đây chính là ảnh đại diện cho ảnh gốc.
2.2.3 Thuật toán phát hiện ảnh giả mạo DWT
Phép biến đổi wavelet rời rạc (DWT) là một trong những phép biến đổi quan trọng trong xử lý ảnh. Ngoài việc sử dụng để nén dữ liệu, phép biến đổi DWT còn được sử dụng trong bài toán phát hiện ảnh giả mạo. Khác với phép biến đổi SVD, phép biến đổi DWT có thể áp dụng nhiều lần (mức) đối với một ảnh (hoặc một khối ảnh) bằng cách áp dụng liên tiếp phép biến đổi này trên góc phần tư bên trái của khối.
Dựa trên phép biến đổi DWT hai mức, Bashar và các cộng sự đề xuất phương pháp phát hiện ảnh giả mạo dạng cắt dán (thuật toán Bashar) [12] bằng cách đối sánh các khối trên miền DWT. Phần này sẽ trình bày chi tiết nội dung thuật toán Bashar.
2.2.4 Ý tưởng thuật toán DWT
Ý tưởng chính của thuật toán Bashar là chia ảnh đa cấp xám (ảnh cần kiểm tra) thành các khối kích thước (các khối chờm giốn nhau) và áp dụng phép biến đổi DWT hai mức trên mỗi khối (gọi là khối DWT2). Trên mỗi khối DWT chọn các hệ số wavelet thuộc vùng tần số thấp (vùng LL2) để tạo thành các véc tơ đặc trưng. Các véc tơ đặc trưng chính là đại diện cho cho khối điểm ảnh và được dùng để đối sánh.
2.2.5 Nội dung thuật toán DWT
Gọi ảnh cần kiểm tra sự giả mạo là có kích thước (nếu là ảnh màu thì được chuyển về ảnh đa cấp xám) và là kích thước khối điểm ảnh giả mạo cần kiểm tra. Giá trị của ở dạng . Trong thực nghiệm chọn kích thước khối . Nội dung thuật toán Bashar như sau:
Bước 1: Chia ảnh I thành các khối không chờm nhau kích thước . Như vậy tổng số khối nhận được là , ký hiệu các
33
Bước 2: Áp dụng phép biến đổi wavelet rời rạc hai mức trên các khối điểm ảnh để nhận được các khối DWT2 tương ứng .
Bước 3: Lượng tử hóa khối để nhận được khối , với .
Bước 4: Gọi là véc tơ đặc trưng của , véc tơ chứa phần tử và
là các hệ số góc trên bên trái của , .
Bước 5: Xây dựng ma trận đặc trưng như sau: - Tạo ma trận có cấp
- Hàng thứ của ma trận chứa vector . Với
- Sắp xếp các hàng của ma trận B theo thứ tự từ điển để nhận đươc ma trận .
Bước 6: Xác định các vector dịch chuyển :
Duyệt các hàng của ma trận , nếu hàng và hàng thỏa mãn : -
- Hàng tương tự hàng
Thì tạo véc tơ dịch chuyển theo 1 trong 3 trường hợp:
- Nếu thì và
- Nếu thì và
- Nếu thì và
Trong đó:
- và là chỉ số hàng và chỉ số cột của khối thứ được xác định ở Bước 1. Thông thường, chỉ số hàng và cột của khối chính là chỉ số của điểm ảnh góc trên bên trái của khối so với ảnh .
34
- Hai khối và là tương tự được tạo ra bởi thao tác cắt/dán nếu thỏa mãn các điều kiện sau.
với và (2.6) Thông thư (2.6 thao tác cắt/dán nếu thỏa mãn các điều kiện sau. Chỉ số của điểm ảnh góc trên bên trái của khối so với r) trên góc phần tư bên trái của khối. Trong bài toán ph Khog thư (2.6 thao tác cắt/dán nếu thỏa
Trong đó: và lần lượt là tọa độ góc trên bên trái của khối ảnh và .
Bước 7: Xác định tần xuất của các vector dịch chuyển:
Gọi số vector dịch chuyển đã xác định trong Bước 1 là . Khi đó, được phân hoạch thành nhóm khác nhau, các vector bằng nhau thuộc về một nhóm, ký hiệu . Nói một cách khác, các nhóm
thỏa mãn hai điều kiện:
- thì với
- và thì với
Khi đó, số lượng phần tử của , ký hiệu là được gọi là tần xuất của véc tơ dịch chuyển của các .
Bước 8: Xác định vùng giả mạo:
Sau khi xác định được tần xuất của các véc tơ dịch chuyển, thuật toán so sánh tần xuất với ngưỡng :
Nếu thì các khối điểm ảnh có vectơ dịch chuyển thuộc được xác định là giả mạo. Nếu trái lại thì kết giả mạo.
35
2.2.6 Một số nhận xét về thuật toán DWT
Việc áp dụng phép biến đổi DWT trong phát hiện ảnh giả mạo có nhiều cách tiếp cận khác nhau như:
- Áp dụng phép biến đổi DWT trên toàn bộ ảnh để nhận được ảnh thu nhỏ có kích thước bằng ¼ ảnh ban đầu. Sau đó áp dụng các các phương pháp khác nhau để tìm các vùng giả mạo trên ảnh thu nhỏ.
- Áp dụng phép biến đổi DWT nhiều lần trên từng khối điểm ảnh và tìm các khối tương tự nhau có tần suất xuất hiện lớn giống như Bashar.
Việc áp dụng DWT nhiều lần sẽ giảm được được số chiều của véc tơ đặc trưng để tăng tốc độ thực độ thuật toán. Tuy nhiên, điều này sẽ dẫn đến khả năng phát hiện nhầm tăng theo (các vùng không giả mạo nhưng thuật toán lại cho rằng giả mạo).
Tốc độ thực hiện của thuật toán Bashar tương tự thuật toán Fridrich. Tuy nhiên, số chiều của véc tơ đặc trương của thuật toán Bashar ít hơn so với thuật toán Fridich. Vì vậy, thuật toán Bashar có thể thực hiện nhanh hơn thuật Fridrich.
2.3 Phép biến đổi ma trận SVD 2.3.1 Định nghĩa SVD 2.3.1 Định nghĩa SVD
SVD (Singular Value Decomposition) là một phương pháp phân tích một ma trận thành tích của ma trận có kích thước nhỏ hơn. SVD đã được sử dụng trong nhiều lĩnh vực như nén dữ liệu, xử lý tần số và phân tích mẫu.
Cho một ma trận MxN hạng r, định lý phân rã giá trị đơn khẳng định rằng tồn tại các ma trận trực giao và sao cho A được tính theo dạng phương trình (1)
(1)
Trong đó là ma trận đường chéo NxM, được chia thành dạng phương trình (2).
36
Với một ma trận chéo vuông trong ,
với các giá trị chéo dương được gọi là các giá trị đơn lẻ của A và được sắp xếp theo thứ tự giảm dần như sau: .
Nói chung, các ma trận trực giao U, V không phải là duy nhất cho A, nhưng các giá trị là duy nhất của A. Phương trình (1) cũng có thể được viết dưới dạng:
Các ma trận con có kích thước , .
2.3.2 Giảm hạng xấp xỉ của một ma trận
Chúng ta xác định một họ các ma trận hạng nhỏ bằng cách chỉ giữ các giá trị k đầu tiên:
Rõ ràng, hạng k, và khi k = r, chúng ta có = A. Xét dạng đầy đủ SVD đầy đủ của A, chúng ta có thể viết:
Vì vậy, A và có cùng các giá trị đơn k cao nhất của chúng, nhưng các giá trị đơn r-k còn lại của khác biệt r-k của đã được thay thế bởi các giá trị 0 trong . Các ma trận Ak đóng một vai trò đặc biệt trong việc xây dựng các mức giảm hạng xấp xỉ của ma trận gốc A.
Trong tập các ma trận N × M hạng k (k <r), ma trận B gần giống nhất với A trong chuẩn ma trận Euclide (hay Frobenius) là ma trận , tức là khoảng cách || A-B || được giảm tới tối thiểu qua các ma trận hạng k N×M khi B = . Khoảng cách ma trận nhỏ nhất là
và . Định lý này là một công cụ thiết yếu