Chương 1: Tổng quan về nhận diện ảnh giả mạo Chương này sẽ giới thiệu với người đọc khái quát một số phương pháp giả mạo ảnh số thường gặp, bao gồm lịch sử ra đời, các đặc điểm, đồng th
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN HỮU TUYÊN
ĐÁNH GIÁ CÁC PHƯƠNG PHÁP PHÁT HIỆN
ẢNH SỐ GIẢ MẠO
LUẬN VĂN THẠC SĨ
Hà Nội - 2013
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN HỮU TUYÊN
ĐÁNH GIÁ CÁC PHƯƠNG PHÁP PHÁT HIỆN
ẢNH SỐ GIẢ MẠO
Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin
Mã số: 60 48 05
LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Lê Vũ Hà
Hà Nội - 2013
Trang 3MỤC LỤC
DANH MỤC CÁC HÌNH 5
DANH MỤC CÁC BẢNG 6
DANH MỤC CÁC TỪ VIẾT TẮT 7
LỜI NÓI ĐẦU 8
Chương 1: TỔNG QUAN VỀ NHẬN DIỆN ẢNH GIẢ MẠO 10
1.1 Một số ví dụ từ lịch sử 10
1.2 Một số phương ph|p giả mạo ảnh số thường gặp 11
1.2.1 Tút ảnh (Retouching) 12
1.2.2 Ghép ảnh (Splicing) 12
1.2.3 Sao - chuyển vùng ảnh (Copy-Move) 13
Chương 2: TỔNG QUAN VỀ CÁC KỸ THUẬT PHÁT HIỆN ẢNH SỐ GIẢ MẠO 15
2.1 Dựa trên đặc trưng điểm ảnh (Pixel Based) 15
2.1.1 Nh}n bản (Cloning) 15
2.1.2 Lấy mẫu lại (Re-sampling) 16
2.1.3 Ghép (Splicing) 16
2.2 Dựa trên định dạng ảnh (Format Based) 17
2.2.1 Lượng tử hóa JPEG (JPEG quantization) 17
2.2.2 Phần đầu ảnh JPEG (JPEG Header) 18
2.2.3 Nén kép (Double JPEG) 20
2.2.4 Hiệu ứng khối JPEG (JPEG Blocking) 21
2.3 Dựa trên đặc điểm m|y ảnh (Camera-Based) 22
2.3.1 Quang sai màu (Chromatic Aberration) 22
2.3.2 Mảng lọc m{u (Color Filter Array) 23
2.3.3 Đ|p ứng của m|y ảnh (Camera Response) 24
2.3.4 Nhiễu có cấu trúc (Pattern Noise) 25
2.4 Một số phương ph|p trực quan kh|c 27
2.4 1 Nguồn s|ng 28
2.4.2 Hướng mắt nhìn v{ vị trí 29
2.4.3 Điểm s|ng trên mắt 30
2.4.4 Hình học 31
2.5 Kết luận 31
Trang 4Chương 3: NGHIÊN CỨU SỬ DỤNG MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN ẢNH SỐ GIẢ
MẠO 33
3.1 Phương ph|p sử dụng DCT ph|t hiện sao - chuyển ảnh 33
3.1.1 Phương ph|p 33
3.1.2 Thuật to|n 36
3.1.3 Kết quả thực nghiệm 36
3.1.4 Kết luận 38
3.2 Phương ph|p ph}n tích mức độ lỗi JPEG (ELA) 39
3.2.1 Phương ph|p 39
3.2.2 Thuật to|n 40
3.2.3 Thực nghiệm 41
3.2.4 Kết luận 43
3.3 Quang sai màu (Chromatic Aberration) 43
3.3.1 Phương ph|p 43
3.3.2 Thuật toán 45
3.3.3 Thực nghiệm 45
3.3.4 Kết luận 48
Chương 4: ĐÁNH GIÁ CÁC PHƯƠNG PHÁP PHÁT HIỆN ẢNH SỐ GIẢ MẠO 49
4.1 Thực nghiệm so s|nh ba phương ph|p ph|t hiện ảnh số giả mạo 49
4.2 Đề xuất mô hình ph|t hiện ảnh số giả mạo 52
KẾT LUẬN 54
TÀI LIỆU THAM KHẢO 55
Trang 5DANH MỤC CÁC HÌNH
Hình 1.1 Bức ảnh giả Joseph Goebbels đã bị xóa bỏ ra khỏi bức ảnh so với ảnh
gốc 10
Hình 1.2 Bức ảnh giả của tướng Grant được cắt ghép từ ba hình ảnh riêng biệt 10 Hình 1.3 Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh 11 Hình 1.4 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật tút ảnh (retouching) 12
Hình 1.5 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật cắt ghép (Splicing) 13
Hình 1.6 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật sao - chép vùng ảnh 13
Hình 2.1 Quá trình nén dữ liệu JPEG 18
Hình 2.2 Mô phỏng sử dụng quang sai để phát hiện ảnh giả 22
Hình 2.3 Hình ảnh hai mẫu nhiễu lấy được từ 2 loại sensor có công nghệ khác nhau 25
Hình 2.4 Mô phỏng hướng nguồn sáng tới bề mặt một quả cầu 28
Hình 2.5 Mô phỏng việc phân tích nguồn sáng để phát hiện ảnh giả 29
Hình 2.6 Hình ảnh mô phỏng hướng mắn nhìn và vị trí 29
Hình 2.7 Mô phỏng bức ảnh giả được phát hiện dựa trên phân tích tròng mắt 30
Hình 2.8 Mô phỏng vị trí của điểm sáng trên mắt 30
Hình 2.9 Mô phỏng vị trí của điểm sáng trên mắt 31
Hình 3.1 Các kết quả thử nghiệm phương pháp DCT với các bức ảnh được lấy từ nhiều nguồn khác nhau 38
Hình 3.2 Kết quả thực nghiệm khi chạy chương trình mô phỏng phát hiện ảnh giả dựa trên độ nén JPEG 41
Hình 3.3 Ảnh thực nghiệm phương pháp CA 45
Hình 3.4 Kết quả chạy thực nghiệm phương pháp CA 46
Hình 3.5 Các kết quả thử nghiệm phương pháp CA với các bức ảnh giả được lấy từ nhiều nguồn khác nhau 47
Hình 4.1 Ảnh giả bởi kỹ thuật sao - chuyển vùng ảnh trong thư viện CASIA v1.0 50
Hình 4.2 Ảnh giả bởi kỹ thuật ghép ảnh (splicing) trong thư viện CASIA v1.0 50 Hình 4.3 Mô hình đề xuất phát hiện ảnh số giả mạo 53
Trang 6DANH MỤC CÁC BẢNG
Bảng 3.1 Kết quả thực nghiệm phương pháp DCT phát hiện ảnh giả mạo 37Bảng 3.2 Các kết quả thử nghiệm phương pháp phân tích mức độ lỗi ELA với các bức ảnh được lấy từ nhiều nguồn khác nhau 43Bảng 3.3 Kết quả so sánh thực nghiệm giữa các phương pháp phát hiện ảnh giả 50
Trang 7DANH MỤC CÁC TỪ VIẾT TẮT
JPEG Joint Photographic Experts Group - Là một phương pháp nén ảnh
hiệu quả
DCT Discrete Cosine Transform - Dãy biến đổi cosine rời rạc
PCA Principal Component Analysis - Phân tích thành phần chính
EM Expectation Maximization - Thuật toán kỳ vọng cực đại
EXIF Exchangeable Image Tệp format -Tiêu chuẩn xác định định dạng ảnh BAM Blocking Artifact Matrix - Ma trận các khối dấu hiệu
CFA Color Filter Array - Mảng lọc màu sắc
FPN Fixed Pattern Noise - Mẫu nhiễu có cấu trúc
PNU Pixel Non-Uniformity - Điểm ảnh không đồng nhất
PRNU Pixel Response Non-Uniformity- Ảnh hưởng không đồng nhất của
nhiễutớiđiểmảnh
ELA Error Level Analysis - Phân tích mức độ lỗi
CA Chromatic Aberration - Quang sai màu
IFD Image File Directory - Đường dẫn tệp tin hình ảnh
MAP Maximum A Posteriori Estimation - Ước lượng hậu cực đại
Trang 8LỜI NÓI ĐẦU
Ngày nay, cùng với sự phát triển của công nghệ xử lý ảnh, nhiều phần mềm xử lý ảnh ra đời giúp người ta tạo ra được những bức ảnh giả mạo có độ tin cậy cao, như là đã được chụp tự nhiên từ một máy ảnh Trong nhiều trường hợp, không thể xác định được bằng quan sát bởi mắt thường, mà nó cần phải được xác minh bằng các công cụ phân tíchảnh
Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau như việc vu cáo, tạo ra các tin giật gân, làm sai lệch chứng cứ phạm tội v.v…
Nhiều phương pháp phát hiện loại ảnh giả được phát triển, tuy nhiên, không có phương án nào là tối ưu cho mọi ảnh giả Vì vậy cần thiết phải so sánh các phương pháp phát hiện ảnh giả với nhau, từ đócó thể đưa ra giải pháp tốt để
phát hiện ảnh số giả mạo Chính vì vậy, tôi đã chọn đề tài “Đánh giá các phương pháp phát hiện ảnh số giả mạo”
Mục tiêu nghiên cứu được đề ra như sau:
- Tìm hiểu một số phương pháp giả mạo ảnh số thường gặp
- Tìm hiểu một số kỹ thuật phát hiện ảnh số giả mạo
- Cài đặt các kỹ thuật được tìm hiểu và thử nghiệm nhằm so sánh đánh giá hiệu quả của các kỹ thuật này chống lại các phương pháp giả mạo ảnh khác nhau
Bố cục của luận văn được trình bày như sau:
Mở đầu
Đặt vấn đề về ý nghĩa, tính cấp thiết và tính thực tế của đề tài
Chương 1: Tổng quan về nhận diện ảnh giả mạo
Chương này sẽ giới thiệu với người đọc khái quát một số phương pháp giả mạo ảnh số thường gặp, bao gồm lịch sử ra đời, các đặc điểm, đồng thời cũng trình bày một số kỹ thuật phát hiện ảnh số giả mạo hiện nay, để từ đó giúp người đọc có cái nhìn tổng quan về lĩnh vực nhận diện ảnh số giả mạo
Chương 2: Tổng quan về các kỹ thuật phát hiện ảnh số giả mạo
Chương này trình bày một cách khái quát về các phương pháp phát hiện ảnh số giả mạo và sự phân loại giữa chúng, từ đó lựa chọn ba phương pháp để
Trang 9tiến hành thực nghiệm nhằm so sánh, đánh giá các phương pháp phát hiện ảnh
Chương 4: Đánh giá các phương pháp phát hiện ảnh số giả mạo
Chương này, tôi trình bày kết quả so sánh các phương pháp dựa trên các kết quả thực nghiệm, ưu nhược điểm của từng phương pháp, từ đó đề xuất mộtphương pháp nhận diện ảnh số giả mạo dựa trên các kỹ thuật sẵn có
Kết luận
Trang 10Chương 1: TỔNG QUAN VỀ NHẬN DIỆN ẢNH GIẢ MẠO
Mục tiêu của chương này là giới thiệu với người đọc một số phương pháp giả mạo ảnh số thường gặp bao gồm lịch sử ra đời, các đặc điểm, đồng thời cũng trình bày một số kỹ thuật phát hiện ảnh số giả mạo hiện nay, để từ đó, giúp người đọc có cái nhìn tổng quan về lĩnh vực nhận diện ảnh giả mạo
1.1 Một số ví dụ từ lịch sử
Ngành nhiếp ảnh đã bị mất đi sự tự nhiên của nó từ rất nhiều năm trước đây Chỉ vài thập kỷ sau khi Niepce tạo ra bức ảnh đầu tiên vào năm 1814 [15], các bức ảnh đã được chế tác, cùng với sự ra đời của các máy ảnh có độ phân giải cao, sự phát triển mạnh mẽ của máy tính cá nhân và các phần mềm chỉnh sửa hình ảnh, việc chế tác hình ảnh đã trở nên phổ biến Để mở đầu, tôi giới thiệu các ví dụ về hình ảnh giả mạo nổi tiếng trong lịch sử
Hình 1.1Bức ảnh giả Joseph Goebbels đã bị xóa bỏ ra khỏi bức ảnh so với ảnh gốc
Năm 1937: Adolf Hitler đã loại JosephGoebbels ra khỏi bức ảnh [1]
Hình 1.2Bức ảnh giả của tướng Grant được cắt ghép từ ba hình ảnh riêng biệt
Trang 11Năm 1964:Một bứcảnh được làm giả với ngụ ý, tổng tư lệnh quân đội miền
Nam- tướng Ulysses S Grant đứng trước quân đội của mình tại thành phố Virginia trong cuộc nội chiến Mỹ Công việc phát hiện sự giả mạo này được thực hiện bởi một nhóm nhà nghiên cứu tại thư viện quốc hội Mỹ, cho thấy ảnh
in này được ghép từ ba bức ảnh riêng biệt Bức ảnh thứ nhất được lấy từ chân dung của tướng Grant, thứ hai, lấy hình ảnh con ngựa và cơ thể của một vị tướng
có tên là Alexander M.McCook và thứ ba, nền được lấy từ một bứ ảnh chụp những tù nhân miền Bắc bị bắt [1]
Hình 1.3Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh
Tháng 8/2006: một bức ảnh minh họa của hãng tin Reuters xuất hiện trên các
trang báo lớn nhỏ trên khắp thế giới Nội dung của bức ảnh là những cột khói tỏa lên từ một số tòa nhà cao tầng sau một đợt không kích của không quân Isarel vào Beirut Nhưng sau đó họ đã phát hiện ra một phần của bức ảnh đã bị người
ta sao chép (copy), rồi dán lặp lại nhiều lần trong bức ảnh, nhằm làm tăng liều lượng khói
Bằng cách này hay cách, với mục đích này hay mục đích khác, người ta
đã tạo ra rất nhiều bức ảnh giả mạo nhằm phục vụ các mục đích khác nhau Nhiệm vụ của các nhà khoa học đó là làm thế nào để phát hiện ra các bức ảnh giả đó và chứng minh phương pháp phát hiện của mình là đúng đắn
1.2 Một số phương pháp giả mạo ảnh số thường gặp
Kỹ thuật giả mạo ảnh số không khác nhiều so với kỹ thuật giả mạo ảnh thông thường Thay vì sử dụng các bức ảnh, thì kỹ thuật giả mạo ảnh số sử dụng các ảnh số lưu trên các thiết bị lưu trữ như thẻ nhớ máy ảnh, ổ cứng máy tính… Quá trình tạo ra hình ảnh giả mạo đã được đơn giản rất nhiều với sự phát triến
Trang 12mạnh mẽ của các phần mềm chỉnh sửa hình ảnh, phần mềm đồ họa máy tính như Adobe Photoshop, GIMF, Paint Shop, Corel…
Có rất nhiều cách để giả mạo một bức ảnh số Dựa trên các kỹ thuật tạo ra một bức ảnh giả mạo, người ta có thể phân biệt thành ba nhóm chính: tút ảnh (Retouching),ghép ảnh (Splicing) và sao - chuyển vùng ảnh (Copy-Move)
1.2.1 Tút ảnh (Retouching)
Loại này có thể coi là ít nguy hiểm nhất trong các cách giả mạo ảnh số Hình ảnh bị chỉnh sửa không đáng kể, thay vào đó, nó tăng cường hoặc giảm các thuộc tính nhất định của một hình ảnh Kỹ thuật này phổ biến đối với các biên tập viên ảnh của tạp chí Có thể nói rằng hầu như tất cả các trang bìa tạp chí sẽ
sử dụng kỹ thuật này để làm các bức ảnh của họ trở nên hấp dẫn hơn
Hình 1.4Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật tút ảnh (retouching)
Hình ảnh bên trái là ảnh gốc, ảnh phía bên trái là kết quả của việc chỉnh sửa hình ảnh sử dụng phương pháp Retouching
1.2.2 Ghép ảnh (Splicing)
Kỹ thuật này nguy hiểm hơn kỹ thuật tút ảnh (retouching) Ghép ảnh (Splicing) là một kỹ thuật có liên quan đến việc một hỗn hợp gồm hai hay nhiều hình ảnh kết hợp tạo ra một bức ảnh giả mạo Trong hình ảnh dưới đây, hình ảnh chú cá mập được sao chép lên hình ảnh nền (máy bay trực thăng cứu hộ) tạo ra một bức ảnh giả hoàn hảo
Trang 13Hình 1.5 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật cắt ghép (Splicing)
1.2.3 Sao - chuyển vùng ảnh (Copy-Move)
Kỹ thuật sao - chuyển vùng ảnh về mức độ nguy hiểm tương tự như kỹ thuật ghép ảnh, theo cách nhìn cả hai kỹ thuật này đều làm thay đổi một vùng của ảnh gốc Tuy nhiên, thay vì cần một hình ảnh bên ngoài như kỹ thuật ghép ảnh, kỹ thuật sao - chuyển vùng ảnh dùng chính vùng trên ảnh gốc để tạo ra bức ảnh giả Nói cách khác, nguồn và đích của đều bắt nguồn từ một hình ảnh Trong một thao tác sao - chuyển vùng ảnh, một phần của ảnh sẽ được cắt và dán đến một vị trí mong muốn của bức ảnh Điều này thường được thực hiện để che dấu một số chi tiết hoặc nhân bản một số đối tượng trên hình ảnh Các kỹ thuật làm
mờ thường được áp dụng dọc theo biên của khu vực sao - chuyển vùng ảnh để làm giảm hiệu ứng bất thường giữa khu vực gốc và khu vực được sao - chuyển vùng ảnh Hình ảnh dưới đây cho thấy một hình ảnh mẫu đã bị giả mạo bằng cách sử dụng sao - chuyển vùng ảnh Bên trái là ảnh giả và bên phải là ảnh thật
Hình 1.6 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật sao - chép vùng ảnh
Trong khuôn khổ của đề tài, tôi tập trung nghiên cứu cách phát hiệnhai loại ảnh giả là sao - chuyển vùng ảnh và ghép ảnh, có mức độ nguy hiểm lớn vì
nó làm sai lệch thông tin so với ảnh gốc Còn loại ảnh tút ảnh (retouching) - loại
Trang 14ảnh làm đẹp cho các tạp chí, các ảnh quảng cáo với mức độ nguy hiểm thấp, do không làm sai khác nhiều thông tin, sẽ chỉ được giới thiệu ở chương này
Trang 15Chương 2: TỔNG QUAN VỀ CÁC KỸ THUẬT PHÁT HIỆN
ẢNH SỐ GIẢ MẠO
Hiện tại trên thế giới cũng có rất nhiều các nhóm nghiên cứu về nhận diện ảnh giả mạo cũng như phát triển các công cụ khác nhau để phát hiện ra ảnh bị làm giả Dựa vào các đặc trưng để nhận diện ảnh giả người ta cũng chia
ra làm 5 loại [3]: 1) Pixel-Based: dựa vào các dặc trưng củacác điểm ảnh, mỗi liên hệ giữa ở cấp độ điểmảnh của ảnh 2) Format-Based: dựa trên các đặc trưng của định dạng ảnh, dựa trên mối tương quan thống kê 3)Camera-Based: dựa trên đặc điểm kỹ thuật của máy ảnh như cảm biến máy ảnh, ống kính hoặc trên chip xử lý máy ảnh 4) Physically-Based: dựa trên các tính chất vật lý và mối tương tác giữa ánh sáng và máy ánh 5) Geometric-Based: Dựa trên đặc trưng hình học của các đối tượng
2.1 Dựa trên đặc trưng điểm ảnh (Pixel Based)
Trong tất cả các ngành khoa học, các đặc điểm đầu tiên được đưa ra phân tích và nhận dạng chính là các nhân tố nhỏ nhất tạo nên cấu trúc của sự vật, hiện tượng (Trong y học nhận dạng nhờ phân tích ADN, tế bào, trong địa chất nhận dạng các phần tử đất, trong hóa học nhận dạng các nguyên tử, phân tử….) Trong lĩnh vực xử lý ảnh, các cấu trúc nhỏ nhất đó chính là các điểm ảnh Người
ta nghiên cứu mối tương quan giữa các điểm ảnh để tìm dấu hiệu của sự giả mạo ảnh kỹ thuật số
2.1.1.Nhân bản (Cloning)
Một trong những thao tác cơ bản nhất của việc tạo ra một bức ảnh giả đó
là sao - chuyển vùng ảnh(copy-move), một phần hình ảnh sẽ được che giấu bởi một người hoặc một đối tượng trong cảnh Các thao tác sao - chuyển vùng ảnh được thực hiện trên cùng một bức ảnh nên nó sẽ xuất hiện các vùng giống nhau trên bức ảnh giả, các khu vực này chính là bằng chứng của giả mạo
Ta có thể dễ dàng tìm kiếm hai khu vực giống hệt nhau trong hình ảnh bằng cách so sánh các giá trị của điểm ảnh hoặc các khối ảnh với nhau Tuy nhiên, nếu vùng nhân bản đó bị thay đổi kích thước hay màu sắc, hay bị nén JPEG, nó sẽ gây ra sự khó khăn trong việc so sánh để tìm ra các vùng nhân bản
Hiện nay, có hai phương pháp chính nghiên cứu để phát hiện ra các vùng nhân bản của ảnh giả dạng sao - chuyển vùng ảnh Thứ nhất đó là phương pháp dựa trên thuật toán dãy biến đổi cosin rời rạc (DCT) Khu vực nhân bản sẽ được
Trang 16phát hiện bởi từ điển phân loại khối hệ số DCT và nhóm các khối tương tự Thứ hai đó là phương pháp dựa trên việc phân tích thành phần chính (PCA), việc sử dụng PCA nhằm xác định các vector cơ sở và tìm khu vực trùng lặp phát hiện bởi từ điển phân loại khối vector cơ sở và nhóm các khối tương tự
2.1.2 Lấy mẫu lại (Re-sampling)
Để tạo ra một bức ảnh thuyết phục, người ta có thể phải thay đổi kích thước, xoay ảnh hoặc kéo dài các phần của hình ảnh Quá trình này yêu cầu lấy mẫu lại (re-sampling) vào một lưới mẫu mới Mặc dù việc lấy mẫu lại bình thường không dễ nhận thấy, nhưng nó có mối tương quan đặc biệt với hình ảnh, khi phát hiện nó có thể được sử dụng làm bằng chứng của sự giả mạo
Xét ví dụ đơn giản với tín hiệu một chiều x(n) có độ dài là M Lấy mẫu lại tín hiệu này để có tín hiệu mới là y(n) có độ dài 2M Các mẫu lẻ của tín hiệu được lấy mẫu lại bằng giá trị của tín hiệu ban đầu: y(2i-1)= x(i), i=1,… 𝑀 , Các
mẫu chẵn sẽ là trung bình của các tín hiệu liền kề
Ta thấytrong tín hiệu được lấy mẫu lại y(n), mỗi giá trị là sự kết hợp tuyến
tính của hai giá trị lân cận Trong trường hợp đơn giản này, một tín hiệu lấy mẫu lại có thể được phát hiện bởi tất cả các giá trị mẫu đều có sự tương quan với các giá trị lân cận chúng và tương quan đó xuất hiện theo chu kỳ Thuật toán kỳ vọng cực đại (EM) có thể được sử dụng để tìm sự tương quan Thuật toán EM bao gồm hai bước lặp:
1) Bước kỳ vọng: Tính xác suất ước lượng các điểm ảnh có thể tương quan với các điểm lân cận
2) Bước cực đại: Các dạng cụ thể của các mối tương quan giữa các điểm ảnh được ước tính
Giả sử có một mô hình nội suy tuyến tính, bước kỳ vọng làm giảm ước lượng Bayesian và bước cực đại làm giảm trọng số các khoảng ước lượng Xác suất ước tính sau đó được sử dụng để xác định nếu một phần của hình ảnh đã được lấy mẫu lại
2.1.3 Ghép (Splicing)
Trang 17Một hình thức phổ biến của việc giả mạo ảnh số đó là ghép hai hoặc nhiều ảnh vào với nhau Khi họ thực hiện một cách cẩn thận không thể thấy được biên giới giữa các vùng ghép đó bằng mắt thường Tuy nhiên, một số nhà nghiên cứu
đã cho thấy có thể sử dụng thống kê Fourier bậc cao để phát hiện ra sự ghép nối
đó Xét một tín hiệu một chiều x(n) và có dãy biến đổi Fourier X(Ω) Phổ năng lượng biểu diễn là P(Ω)=X(Ω)X*(Ω) được sử dụng để phân tích các thành phần
của tần số tín hiệu Ngoài phổ, ta có công thức thống kê sử dụng để tìm kiếm các tương tác không tuyến tính:
B(Ω1,Ω 2 ) = X(Ω 1 )X(Ω 2 )X*(Ω 1 +Ω 2 ) (2.3)
Dựa vào công thức, ta thấy được sự tương quan giữa bathành phần tần sốΩ1, Ω2 và Ω1 + Ω2 Những khoảng bất thường chứng tỏ đã bị ghép nối
2.2 Dựa trên định dạng ảnh (Format Based)
Nguyên tắc đầu tiên trong việc phân tích tìm bằng chứng là các bằng chứng phải được bảo toàn Về phương diện này, việc mất dữ liệu trong nén hình ảnh qua các phần mềm nén, chẳng hạn như JPEG, có thể được coi như là một khó khăn trong việc phân tích Ngược lại, một số thuộc tính độc đáo của việc mất mát dữ liệu trong quá trình nén ảnh lại có thể được khai thác để phân tích tìm các bằng chứng để chứng minh sự giả mạo trong ảnh số
2.2.1 Lượng tử hóa JPEG (JPEG quantization)
Hầu hết các ảnh nén được sử dụng hiện nay đều theo định dạng JPEG Kỹ thuật nén được sử dụng trong cả các máy ảnh số Các nhà sản xuất máy ảnh thường cấu hình cho thiết bị của họ khác nhau để cân bằng và nén với các chất lượng khác nhau để phù hợp với nhu cầu và thị hiếu của thị trường Sự khác biệt này có thể được sử dụng để xác định nguồn gốc của một hình ảnh
Với ba kênh màu ảnh (RGB), quá trình nén của chuẩn JPEG được tiến hành như sau: Những hình ảnh RGB đầu tiên được chuyển đổi thành không gian
độ sáng/màu sắc (YCbCr) Mỗi kênh sau đó được phân chia thành các khối 8x8 điểm ảnh Các giá trị được chuyển đổi từ số nguyên dương sang số nguyên có dấu (ví dụ từ [0 255] thành [-128,127]) Mỗi khối được chuyển đổi sang không gian tần suất bằng cách sử dụng biến đổi cosin rời rạc (DCT-2D) Tùy thuộc vào
tần số và kênh cụ thể, mỗi hệ số DCT, c, sẽ được lượng tử hóa bởi một lượng q:
𝑐/𝑞 Giai đoạn này chính là nguồn nén Bảng lượng tử hóa đầy đủ bao gồm
192 giá trị - tập 8x8 giá trị tương ứng với một tần số cho một trong ba kênh màu (YCbCr) Đối với tỷ lệ nén thấp, các giá trị có xu hướng tiến tới 1 và tăng dần
Trang 18với tỷ lệ nén cao hơn Với một số biến thể khác nhau, trình tự nêu trên được phát triển bởi các bộ mã hóa JPEG trong máy ảnh kỹ thuật số và phần mềm chỉnh sửa hình ảnh Các nguồn chính của các bộ mã hóa là sự chọn lựa các bảng lượng tử Như vậy, một dấu hiệu sắp xếp đã được nhúng vào trong mỗi ảnh JPEG Bảng lượng tử hóa có thể được triết xuất từ bộ mã hóa ảnh JPEG hoặc ước lượng từ các hình ảnh được chụp từ máy ảnh này Do các máy ảnh sử dụng các bộ mã hóa khác nhau vì thế chúng ta có thể so sánh bảng lượng tử hóa của chúng và có thể xác định được nguồn gốc của một hình ảnh, có thể được chụp bằng loại máy ảnh
này hay không
2.2.2 Phần đầu ảnh JPEG (JPEG Header)
Sau khi lượng tử hóa, các hệ số DCT được đưa đến quá trình mã hóa dữ liệu thường sử dụng mã hóa Huffman Huffman là một phương pháp mã hóa với
độ dài từ mã biến đổi trong đó các giá trị xuất hiện thường xuyên hơn được gán
từ mã có độ dài ngắn hơn, còn các giá trị xuất hiện ít thường xuyên hơn được gán các từ mã có độ dài lớn hơn Đây là phương pháp mã hóa (nén) không mất mát, được tăng hiệu quả nhờ sự lượng tử hóa các hệ số DCT trước khi mã hóa
Hình 2.1 Quá trình nén dữ liệu JPEG
Các chuẩn JPEG không quy định quá trình lượng tử hóa bảng mã hay mã hóa Huffman Các bộ nén có thể tùy ý cân đối giữa việc nén và chất lượng cho nhu cầu và thị hiếu riêng của họ Các bảng lượng tử hóa và các bảng mã Huffman được sử dụng để giải mã một tập tin JPEG sẽ được nhúng vào phần đầu (header) của JPEG Các bảng lượng tử hóa JPEG và mã Huffman cùng với các trích xuất dữ liệu từ các phần đầu của tệp ảnh JPEG có thể coi là một dấu hiệu riêng biệt của bộ nén và có thể được sử dụng để nhận dạng
Ba thành phần đầu tiên chứa dấu hiệu của máy ảnh đó là kích thước ảnh, bảng lượng tử hóa và các mã Huffman Các kích thước hình ảnh được sử dụng
để phân biệt các bộ nén của các thiết bị chụpảnh khác nhau với các bộ cảm biến
Trang 19khác nhau Bộ ba bảng lượng tử hóa 8x8 quy về mảng một chiều bao gồm 192 giá trị Các mã Huffman được xác định gồm 6 bộ của 15 giá trị tương ứng với số lượng chiều dài tữ mã 1,2… 15: mỗi một trong 3 kênh yêu cầu 2 giá trịcode, một cho hệ số DC và một cho hệ số AC Sự biểu diễn này là nhân tố chính cho sự so sánh dựa trên việc phân tích chiều dài các từmã Tổng cộng có 284 giá trị được chiết xuất từ hình ảnh có độ phân giải đầy đủ: 2 kích thước hình ảnh, 192 giá trị lượng tử hóa và 90 từmã Huffman
Một phiên bản thu nhỏ của hình ảnh có độ phân giải đầy đủ thường được nhúng vào trong (header) của tệp ảnh JPEG Ba thành phần xác định đặc điểm của bộ nén được chiết xuất từ hình ảnh thu nhỏ này Hình ảnh thu nhỏ thường không có kích thước lớn hơn 100 điểm ảnhvà được tạo ra bằng cách cắt, lọc, và lấy mẫu đầy đủ độ phân giải của ảnh Hình ảnh thu nhỏ sau đó thường được nén
và lưu trữ trong phần đầu của tệp ảnh JPEG như một hình ảnh trong JPEG Như vậy, thành phần tương tự có thể được chiết xuất từ những hình ảnh thu nhỏ giống như toàn bộ độ phân giải như được trình bày trong phần trước Một số thiết bị chụpảnh số, nhà sản xuất không tạo ra hình ảnh thu nhỏ hoặc không mã hóa chúng như một hình ảnh JPEG Trong những trường hợp như vậy, có thể là một giá trị 0 cho tất cả các thông tin của hình ảnh thu nhỏ Thay vì làmột hạn chế, nó được coi là đặc tính riêng biệt của bộ nén máy ảnh số
Thành phần cuối cùng của nhận dạng bộ nén được chiết xuất từ dữ liệu EXIF của ảnh Các dữ liệu được tìm thấy trong phần đầu (header) của tệp ảnh JPEG lưu trữ hàng loạt các thông tin về thiết bị chụp ảnh số và hình ảnh Theo tiêu chuẩn EXIF, có năm thành phần chính được sắp xếp trong một tệp ảnh (1) Phần chính (2) Exif (3) Khả năng tương thích (4) Ảnh thu nhỏ (5) GPS Nhà sản xuất thiết bị chụp ảnh số có thể tùy ý đưa bất kỳ thông tin vào trong tệp ảnh số Một biểu diễn nhỏ của họ có thể được chiết xuất bằng cách đếm số lượng các mục của một trong năm thành phần chính Bởi vì tiêu chuẩn EXIF cho phép tạo
ra thêm các thành phần bổ sung Tổng số bất kỳ một IFD và tổng số các mục trong IFD cũng được sử dụng để nhận dạng Một số nhà sản xuất máy ảnh tùy chỉnh những dữ liệu theo cách không phù hợp với tiêu chuẩn EXIFsẽ gặp lỗi khi phân tích các dữ liệu Những lỗi này được coi là một tính năng của máy ảnh được thiết kế và tổng số lỗi phân tích cú pháp được sử dụng như một tính năng
để nhận dạng Trong tám giá trị được chiết xuất từ dữ liệu, năm lần đếm cho năm phần trong IFD, một lần đếm số bổ sung của IFD, một cho đếm các lỗi phân tích cú pháp
Trang 20Trong phần tóm lược, có 284 giá trị chiết xuất từ độ phân giải đầy đủ của hình ảnh, tương đương với 284 giá trị của phần đầu (header) trong hình ảnh thu nhỏ, 8 từ chuẩn EXIF, tổng cộng là 576 giá trị hình thành nên 576 dấu hiệu riêng
Một số thí nghiệm của các nhà khoa học cũng cho thấy rằng, các dấu hiệu
từ các phiên bản của phần mềm Adobe Photoshop (ver 3, 4, 7, CS, CS2, CS3, CS4, CS5) được so sánh với dấu hiệu của 9.163 dấu hiệu riêng của bộ nén trên máy ảnh Trong trường hợp này chỉ có hình ảnh và hình ảnh thu nhỏ, bảng lượng
tử và bảng mã Huffman được sử dụng để so sánh Không có sự chồng chéo nào được tìm thấy từ bất kỳ phiên bản nào của phần mềm Photoshop và dấu hiệu của
bộ nén Như vậy, dấu hiệu riêng của Photoshop là duy nhất, điều này có nghĩa là bất kỳ chỉnh sửa nào của Photoshop có thể dễ dàng phát hiện [4]
2.2.3 Nén kép (Double JPEG)
Bất kỳ một ảnh số bị làm giả nào cũng phải được mở bởi một chương trình phần mềm chỉnh sửa ảnh số và được ghi lại Như vậy, sự phát hiện ra sự nén kép cũng là một bằng chứng đáng tin cậy cho việc hình ảnh đã bị làm giả Nhắc lại quá trình mã hóa một ảnh JPEG gồm ba bước cơ bản: DCT, lượng tử hóa và mã hóa các hệ số DCT Giải mã một dữ liệu đã được thực hiện ngược quá trình, giải mã dữ liệu mẫu, lượng tử hóa và nghịch đảo DCT
Xét một tín hiệu tổng quát rời rạc một chiều x(n) Lượng tử hóa là một
hoạt động thông thường là mô tả một tham số gồm các hàm:
𝑞𝑎 𝑢 = 𝑢
Trong đó, các bước lượng tử hóa (là một số nguyên dương), a: hệ số
lượng tử hóaq, u biểu diễn một giá trị của x(n) Lượng tử hóa lại sẽ đem lại giá
trị lượng tử ban đầu Chú ý hàm 𝑞𝑎 (𝑢) không phải là hàm khả nghịch và
Trang 21quátrình ngượi lại của lượng tử hóakhông phải là hàm nghịch đảo của lượng tử Hoạt động hai lần lượng tử hóa là hoạt động được mô tả bởi hàm:
lượng tử hóa với hệ số a, sau đó lượng tử hóa với hệ số b
2.2.4 Hiệu ứng khối JPEG (JPEGBlocking)
Như mô tả trong phần trước, cơ sở cho việc nén JPEG là biến đổi DCT
Vì mỗi một khối DCT được biến đổi riêng biệt và được lượng tử hóa, dấu hiệu riêng sẽ xuất hiện ở biên của các khối lân cận ở các cạnh dọc và ngang Khi một hình ảnh bị thay đổi, các dấu hiệu riêng của các khối sẽ bị thay đổi Người ta cũng dựa vào các dấu hiệu thay đổi này để tìm ra việc làm giả hình ảnh Họ xem xét các giá trị khác biệt của điểm ảnh trong và giữa ranh giới các khối Những sự khác biệt này có xu hướng trong khối sẽ nhỏ hơn ngoài khối Khi một hình ảnh được cắt và nén lại, tập các dấu hiệu khối mới có thể sẽ khác với ranh giới ban đầu Các giá trị điểm ảnh khác nhau của trong và giữa ranh giới được tính toán
từ bốn điểm ảnh lân cận bằng một giá trị xác định, trong đó một điểm ảnh lân cận hoặc nằm trong khối và là biên hoặc chồng lấp lên một khối JPEG Biểu đồ của những sự khác biệt này được tính từ tất các các khối JPEG 8x8 bị chồng lấp
Ma trận các khối dấu hiệu (BAM) được tính toán như sự khác biệt trung bình giữa các biểu đồ Đối với hình ảnh không nén, ma trận này là ngẫu nhiên, trong khi với một hình ảnh nén, ma trận này có một mô hình cụ thể Khi một hình ảnh được cắt và nén lại, mô hình này bị phá vỡ Mô hình giám sát phân loại được sử dụng để phân biệt dấu hiệu xác thực hay giả dối từ BAMs
Trang 222.3 Dựa trên đặc điểm máy ảnh (Camera-Based)
Mỗi một máy ảnh đều có đặc điểm riêng biệt (có thể cùng một nhà sản xuất, cùng một loại máy ảnh), khi ta chụp ảnh bằng những chiếc máy ảnh, những bức ảnh sẽ để lại một số dấu hiệu riêng của máy ảnh mà tạo ra nó Một số nhà nghiên cứu cũng đã khác thác dấu hiệu riêng đó để phân biệt giữa ảnh thật
và ảnh bị làm giả
2.3.1 Quang sai màu (Chromatic Aberration)
Trong một hệ thống hình ảnh lý tưởng, ánh sáng đi qua ống kính được tập trung vào một điểm duy nhất trên cảm biến Trong hệ thống quang học thực tế trái với mô hình lý tưởng, nó không hoàn toàn tập trung ánh sáng của tất cả các bước sóng Cụ thể, phương quang sai thể hiện vị trí nơi mà các ánh sáng có bước sóng khác nhau chiếu đến bộ cảm biến Người ta đã chỉ ra rằng, phương quang sai này có thể được coi như là mở rộng hoặc co lại của màu sắc với các kênh màu khác nhau Thể hiện trong hình (a), hình ảnh chồng lên ảnh với các vector không thẳng hàng đại diện cho các kênh màu đó so với các kênh màu xanh lá cây Thể hiện trong hình (b), hình ảnh này đã được ghép thêm hình ảnh của một con cá Trong trường hợp này, quang sai bên trong khu vực ghép vào khác với quang sai toàn cục
Hình 2.2 Mô phỏng sử dụng quang sai để phát hiện ảnh giả
Trong quang học cổ điển, sự khúc xạ ánh sáng ở biên giới giữa hai nguồn sáng được mô tả theo luật Snell‟s: 𝑛 sin 𝜃 = 𝑛𝑓sin 𝜃𝑓 , trong đó 𝜃 là góc sáng,
Trang 23𝜃𝑓 là góc khúc xạ, n và n f là chỉ số khúc xạ của các phương tiện truyền ánh sáng
mà qua đó, ánh sáng đi qua Chỉ số khúc xạ của thủy tinh n f phụ thuộc vào bước sóng của ánh sáng đi qua nó Điều này phụ thuộc kết quả trong đa sắc ánh sáng được phân chia theo bước sóng của nó sau khi thoát khỏi ống kính và chiếu vào
bộ cảm biến Thể hiện trong hình (c) là một sơ đồ mạch cho thấy sự phân tách ánh sáng có bước sóng ngắn (tia màu xanh lá cây) với ánh sáng có bước sóng
dài (tia màu đỏ) Kí hiệu vị trí của các tia màu đỏ và màu xanh là (x r , y r ) và (x g ,
y g) Trong việc biểu diễn quang sai, vị trí của các tia được mô hình hóa như sau:
𝑥𝑟 = 𝛼 𝑥𝑔 − 𝑥0 + 𝑥0 (2.6)
𝑦𝑟 = 𝛼 𝑦𝑔 − 𝑦0 + 𝑦0 (2.7)
Trong đó 𝛼 là một giá trị vô hướng và (x 0 , y 0) là gốc khúc xạ
Việc ước tính thông số của mô hình này như là chìa khóa để giải quyết vấn đề Khi quang sai cho kế quả không thẳng hàng giữa các kênh màu Mô hình tham số được ước tính bằng cách tối đa hóa sự liên kết của các kênh màu Cụ thể, thông tin giữa các kênh màu đỏ và màu xanh lá cây được tối đa (một ước lượng tương tự được thực hiện để xác định sự biến dạng giữa các kênh màu xanh và màu xanh lá cây) Tính toán quang sai của khu vực sau đó so sánh với quang sai toàn cục ta sẽ phát hiện ra sự giả mạo
2.3.2 Mảng lọc màu (Color Filter Array)
Một hình ảnh kỹ thuật số bao gồm ba kênh màu chứa sự khác nhau về dải tần quang phổ màu sắc Hầu hết các máy ảnh kỹ thuật số đều trang bị bộ cảm biến CCD hoặc CMOS và các ảnh màu được chụp qua mảng lọc màu (CFA) Hầu hết các bộ lọc màu gồm ba màu (đỏ, xanh và xanh lá cây), được đặt trên mỗi đỉnh của bộ cảm biến Kể từ khi chỉ là một mẫu màu duy nhất được ghi lại tại mỗi vị trí điểm ảnh, hai mẫu màu sắc phải được ước tính từ màu lân cận để
có được một màu gồm có cả ba kênh màu Việc ước tính của các màu bị mất được gọi là phép nội suy hoặc khử (Demosaicking) CFA Demosaicking là phương pháp dựa trên những hoạt động hạt nhân trên mỗi kênh độc lập (ví dụ, nội suy tuyến tính hoặc song lập phương) Hơn thế nữacác thuật toán nội suy tuyến tính sẽ làm mờ các tính năng hình ảnh Bất kể triển khai cụ thể thực tế, CFA nội suy đưa ra thống kê cụ thể mối tương quan giữa một tập hợp các điểm ảnh với mỗi một kênh màu Khi mà mảng lọc màu CFA thường được sắp xếp theo một khuôn mẫu định kỳ, với những mối tương quan định kỳ, cùng lúc đó, các điểmảnh sẽ được ghi lần lượt với sự tương quan đó Như vậy, các mối tương
Trang 24quan này có thể được sử dụng như một dấu hiệu để nhận dạng Để xác định sự tương quan này, người ta sử dụng thuật toán kỳ vọng cực đại (EM) Thuật toán
kỳ vọng cực đại (EM) bao gồm hai bước lặp:
1) Bước kỳ vọng: Ước tính xác suất của mỗi điểm ảnh được tương quan với các điểm lân cận
2) Bước cực đại: hình thức cụ thể của mối tương quan được ước tính
Bằng cách mô hình hóa các mối tương quan CFA với một mô hình tuyến tính đơn giản, bước kỳ vọng làm giảm ước lượng Bayesian và bước cực đại làm giảm trọng số của vùng ước lượng Trong một ảnh thật thì mô hình định kỳ của các điểm ảnh với các điểm lân cận có sự tương quan với nhau, nếu có sự chênh lệch nó sẽ là bằng chứng về sự giả mạo một vùng so với toàn cục
2.3.3 Đáp ứng của máy ảnh (Camera Response)
Vì hầu hết các cảm biến của hình ảnh kỹ thuật số gần như tuyến tính, có một mối quan hệ tuyến tính giữa số lượng ánh sáng được đo bởi mỗi phần tử cảm biến tương ứng và tương quan với giá trị điểm ảnh cuối cùng đạt được Tuy nhiên, hầu hết các máy ảnh áp dụng một quá trình phi tuyến để nâng cao chất lượng hình ảnh cuối cùng đạt được Các nhà nghiên cứu đã ước tính lập bản đồ này, được gọi là hàmđáp ứng (response function), từ một hình ảnh duy nhất Sự khác biệt trong các chức năng đáp ứng trên toàn bộ hình ảnh này sau đó được sử dụng để phát hiện giả mạo
Xem xét một cạnh mà các điểm ảnh dưới cạnh là một hằng số màu c1 và
các điểm ảnh trên của cạnh đó có màu sắc khác là c 2 Nếu đáp ứng máy ảnh là tuyến tính thì các điểm ảnh dọc theo cạnh đó phải là một sự kết hợp tuyến tính màu sắc của các điểm ảnh lân cận Độ lệch của các điểm ảnh trung gian dự kiến
sẽ đáp ứng tuyến tính được sử dụng để ước tính chức năng đáp ứng của máy ảnh Chức năng đáp ứng nghịch đảo của máy ảnh sẽ được lấy từ mối tương quan giữa các điểm ảnh màu trước và mối quan hệ tuyến tính được ước tính từ ước lượng hậu cực đại (MAP) Để ổn định ước lượng các cạnh được lựa chọn trên cả hai mặt của cạnh tương tự, sự chênh lệch ở hai bên cạnh là nhỏ, sự khác biệt
giữa c 1 và c 2 là lớn và các điểm ảnh dọc theo cạnh là giữa c 1 và c 2 Hạn chế của phương pháp này là cần thiết phải có tăng đơn điệu với nhiều nhất một điểm ảnh
có sự thay đổi và nên xét trên mỗi kênh màu Khi có thể ước tính được đáp ứng
ở mức độ bộ phận, ta cũng có thể so sánh với đáp ứng trên toàn cục để tìm ra vùng bị làm giả
Trang 252.3.4 Nhiễu có cấu trúc (Pattern Noise)
Trung tâm của mọi máy ảnh kỹ thuật số là cảm biến hình ảnh Cảm biến chia thành những địa chỉ rất nhỏ điểm ảnhđó là tập hợp photon và giấu chúng vào điện áp được lấy mẫu từ bộ chuyển đổi A/D Trước khi ánh sáng từ cảnh vật được truyền đến cảm biến, nó đi qua các ống kính máy ảnh, bộ lọc khử răng cưa (làm mờ), và sau đó thông qua một mảng lọc màu (CFA) CFA là một khảm của
bộ lọc màu có nhiệm vụ chặn một phần nhất định của quang phổ, cho phép mỗi điểmảnh nhận một màu sắc cụ thể Bộ cảm biến FoveonTMX3 là cảm biến duy nhất mà không sử dụng CFA và có thể nắm bắt tất cả ba màu cơ bản ở mỗi điểmảnh
Nếu cảm biến sử dụng CFA, đầu ra cảm biến số hóa bị suy giảm sử dụng thuật toán thêm màu để có được tất cả ba màu cơ bản cho mỗi điểm ảnh Kết quả tín hiệu được tiếp tục xử lý màu sửa chữa và điều chỉnh cân bằng sáng Việc thêm vào quá trình xử lý bao gồm cấu trúc sửa chữa hai thành phần chính của nhiễu đó là nhiễu có cấu trúc cố định (Fixed Pattern Noise - FPN) và nhiễu không đồng nhất do ánh sáng môi trường Nhiễu có cấu trúc cốđịnh đề cập đến
sự khác nhau từ điểmảnhtới điểmảnh khi mà mảng cảm biến không tiếp xúc với ánh sáng (còn gọi là miền tối hiện hành) Nhiễu có cấu trúc cốđịnh là một kiểu nhiễu cộng và một số phụ gia để nâng cao khả năng của máy ảnh có thể chặn được nhiễu bằng cách trừ đi một khung tối từ tất cả bức ảnh mà họ có được Nhiễu có cấu trúc cốđịnh cũng tùy thuộc vào tiếp xúc và nhiệt độ
Hình 2.3 Hình ảnh hai mẫu nhiễu lấy được từ 2 loại sensor có công nghệ khác nhau
Cácảnh hưởngkhông đồng nhấtcủa nhiễu tới hìnhảnh (FPRN), đây là phần chi phối của mẫu nhiễu (PN) trong hìnhảnh được chụp từ tự nhiên.Mô hình toán
Trang 26học của quá trình thu nhận hình ảnh, với i=1,…m, j=1,…n Với mx n là độ phân
giải cảu cảm biến
x = (x ij ):các tín hiệu nguyên mà có thể ghi nhận bởi cảm biến thông qua ánh
sáng
𝜼 = (𝜂𝑖𝑗) : biểu thị độ nhiễu ngẫu nhiên
𝜺 = 𝜀𝑖𝑗 : độ thêm nhiễu ngẫu nhiên (đại diễn cho nhiễu của đầu ra)
𝒄 = 𝑐𝑖𝑗 :miền tối hiện tại
𝒚 = 𝑦𝑖𝑗 : tín hiệu số hóa đầu ra của cảm biến có thể được biểu diễn dưới dạng sau (trước khi được máy ảnh xử lý)
𝑦𝑖𝑗 = 𝑓𝑖𝑗 𝑥𝑖𝑗 + 𝑛𝑖𝑗 + 𝑐𝑖𝑗 + 𝜀𝑖𝑗 (2.8)
Hàm fij gần bằng một và nó nắm bắt ảnh hưởng không đồng nhất của nhiễu tớiđiểm ảnh- PRNU, đó là nhiễu theo cấp số nhân Một thành phần quan trọng của PRNU đó là các điểm ảnh không đồng nhất - Pixel Non-Uniformity (PNU),nó được định nghĩa là độ nhạy khác nhau của điểm ảnh với ánh sáng PNU bắt nguồn từ sự ngẫu nhiêu không đồng nhất trên các tấm silicon wafer sự không đồng nhất khác trong quá trình chế tạo cảm biến Như vậy, nó không phụ thuộc vào nhiệt độ môi trường xung quanh và dường như ổn định theo thời gian Phổ của PNU là liên tục và yếu đi một chút trong không gian tần số cao Ánh sáng khúc xạ trên bề mặt các hạt bụi và các bề mặt quang học và đặc tính của máy ảnh quang cũng góp phần vào PRNU Các thành phần này chắc chắn là một mẫu, một họa tiết nhỏ, và là khoảng tần số thấp trong tự nhiên Bởi vì, các thành phần tần số thấp không phải là một đặc tính của cảm biến, chúng tôi không sử dụng chúng để xác định giả mạo mà chúng tôi sử dụng PNU, là một đặc trưng bên trong của cảm biến (giống như vân tay)
PRNU không hiện diện hoàn toàn trên các vùng của bức ảnh, nơi mà tất
cả các điểm cảm biến ảnh đã được lấp đầy với công suất sản xuất tín hiệu không
đổi.Nó cũng rõ ràng từ công thức (2.8) rằng trong vùng tối (khi x ij xấp xỉ 0) thì PRNU trở nên rõ nét
Các tín hiệu y đi qua một dây chuyền xử lý phức tạp trước khi các tệp tin
hình ảnh cuối cùng được lưu trữ trên thẻ nhớ của máy ảnh Quá trình xử lý bao gồm các hoạt động bên trong vùng lân cận của điểm ảnh chẳng hạn như demosaicking, chỉnh màu sắc, lọc Một số hoạt động có thể phi tuyến trong tự
Trang 27nhiên, chẳng hạn chỉnh gramma, cân bằng sáng hoặc thích nghi với màu nội suy Kết quả cuối cùng là giá trị điểm ảnh pij, mà chúng ta sẽ giả định nó trong khoảng 0<pij<255 cho mỗi màu, đó là
𝑃𝑖𝑗 = 𝑇 𝑦𝑖𝑗, 𝑁 𝑦𝑖𝑗 , 𝑖, 𝑗 (2.9)
Trong đó T là một hàm phi tuyến tính của y ij , vị trí của điểm ảnh (i, j) và
giá trị y từ vùng lân cận 𝒩(𝑦𝑖𝑗) (ví dụ 5x5 lân cận)
Có thể triệt được mẫu nhiễu này bằng cách sử dụng một quá trình gọi là
“flat fielding”, trong đó các giá trị điểm ảnh đầu tiên được sửa chữa các FPN và sau đó chia chúng bởi khung “flat field” bởi ảnh trung bình theo một chuẩn thống nhất
Quá trình xử lý không thể thực hiện được từ các điểm ảnh giá trị cuối
cùng p ij và phải được thực hiện tín hiệu vừa mới nhận được từ cảm biến là y, trước khi bất kỳ công việc xử lý ảnh nào xử lý Trong khi nó thường được sử dụng trong ảnh thiên văn, máy ảnh kỹ thuật số rất khó để hoàn thiện trong lĩnh vực của mình bởi vì rất khó để đạt được một cảm biến thống nhất bên trong máy ảnh
Bởi vì về cơ bản tất cả các bộ cảm biến hình ảnh (CCD, CMOS, JFET hoặc CMOS-FoveonTM
X3) được xây dựng từ các chất bán dẫn và công nghệ sản xuất không khác biệt quá nhiều, mẫu nhiễu trong tất các bộ cảm biết có tính chất tương tự.Cảm biến CMOS theo kinh nghiệm cũng có cả hai mẫu nhiễu FPN
và PRNU Hơn thế nữa, mẫu PRNU đều có cả trong cả hai cảm biến CMOS và CCD Bởi vì bộ cảm biến JFET cũng tương tự như CMOS, như vậy chúng tương
tự nhau
Khu vực giả mạo có thể là những nơi thiếu mẫu nhiễu Chúng tôi phát hiện sự hiện diện của nhiễu PNU trong khu vực bằng cách tính toán sự tương quan giữa vùng nhiễu còn dư với mẫu nhiễu Như vậy, giả mạo phát hiện phải bắt đầu với việc xác định mô hình tham khảo cho máy ảnh Chúng tôi mô tả quá trình này đầu tiên và sau đó trình bày các thuật toán nhận dạng giả mạo
2.4 Một số phương pháp trực quan khác
Ngoài các phương pháp dựa trên việc tính toán, sử dụng thuật toán… để xác định được một bức ảnh là ảnh giả, hiện nay cũng có rất nhiều các phương pháp dựa trên việc xem xét trực quan bằng hình ảnh, căn cứ vào các đặc tính vật
lý và đặc trưng hình học đối tượng trên hình ảnh