2. Bố cục luận văn
2.3.2. Dò tìm mẫu nhiễu
Các vùng giả mạo có thể đƣợc phân biệt nhƣ là những vùng hỗn tạp nhiễu. Bài toán yêu cầu tìm kiếm nhiễu PNU (pixel non-uniformity) trong vùng quan tâm (ROI: region of interest) bằng cách tính toán độ tƣơng quan giữa vùng nhiễu dƣ và mẫu nhiễu. Do đó phát hiện giả mạo phải bắt đầu bằng việc xác định mẫu tham chiếu cho camera. Chúng ta miêu tả quá trình xử lý áp dụng cho thuật toán nhận dạng giả mạo.
Cho một camera, mẫu nhiễu tham chiếu thu đƣợc gần đúng Pc bằng cách lấy trung bình của nhiều phần tử ảnh (pixels) P(k) , k=1,…,Np . Để tốc độ tính toán nhanh hơn cần thực hiện các phép khử nhiễu từ bức ảnh trƣớc khi lấy trung bình. Có thể thu đƣợc nhờ sử dụng bộ lọc nhiễu F và lấy trung bình số dƣ nhiễu n(k)minh hoạ:
n(k)=p(k) –F(p(k)) (2.17)
Việc giảm nhiễu đối với các thành phần tần số thấp của PRNU (mẫu tƣơng thích với sự khúc xạ ánh sáng trên các đốm nhiễu) sẽ tự động bị khử đi. Rõ ràng, đối với các số lớn Np của bức ảnh. Thử ngiệm với Np= 300 và nên sử dụng Np >50 nếu có khả năng.
Sau đó lựa chọn một vùng R (vùng quan tâm) trong bức ảnh p tƣơng thích với mẫu nhiễu từ camera C, đầu tiên chúng ta tính toán tƣơng quan giữa số dƣ nhiễu n(k)=p(k) –F(p(k)) với mẫu tham chiếu Pc:
39 ) ( ) ( ) ( ) ( )) ( ) ( )).( ( ) ( ( )) ( ), ( ( C C C C C P P n n P P n n P n (2.18)
Với n( ) và PC( ) biểu thị n và Pc trong vùng R và đƣợc viết dƣới dạng vector. Dấu gạch ngang trên đầu ký tự biểu thị giá trị trung bình. “.” sử dụng để biểu thị dấu nhân, và ||.|| ký hiệu chuẩn L2.
a. Ảnh đƣợc thu nhận b. Ảnh mẫu nhiễu tham chiếu của camera
Hình 2.21: Minh họa vùng Rđƣợc chọn và mẫu nhiễu tham chiếu tƣơng ứng của nó.
Do nhiễu PRNU đƣợc tạo nên từ nhiều thành phần, nó không tồn tại ở 1 dạng hoàn chỉnh nào và rất phong phú. Mặt khác, các bộ lọc khử nhiễu ít có tác dụng trong việc khử nhiễu ở các vùng đƣợc che phủ tinh vi với rất nhiều đƣờng biên mịn. Trong các vùng đó, độ tƣơng quan (n( ),PC( )) đƣơng nhiên sẽ thấp hơn. Chúng ta có thể thử đánh giá độ tƣơng quan (n(Q),PC(Q)) trong vùng Q tƣơng tự nhƣ vùng của ảnh và tách biệt với nhƣng Histogram tƣơng tự. Sau đó để thu đƣợc kết quả về tính chính xác của ta dựa trên phép thống kê các giá trị
)) ( ), (
(n PC . Vấn đề lớn nhất mà phƣơng pháp này đặt ra là có thể có một số vùng đánh giá không chính xác do các đặc điểm của ảnh. Hơn nữa, nếu đây là những vùng không bị nghi ngờ trong bức ảnh đƣợc làm giả, thì phƣơng pháp này có
40
thể không chính xác. Có thể chọn để tính toán chuỗi các dấu hiệu mà vùng đã làm giả. Sự thuận lợi ở đây là chúng ta có thể luôn luôn thu đƣợc số các mẫu thử liệt kê lớn cần thiết để đánh giá các liệt kê (n( ),PC( )). Tiếp sau đây chúng tôi sẽ miêu tả cách thức xử lý với bài toán này.
Hình 2.22: Hình ảnh minh họa chọn các vùng Qi và mẫu tham chiếu
Đầu tính toán độ tƣơng quan (n(Qk),PC( )) cho các vùng Qk,k 1,...,N
với kích thƣớc tƣơng tự. Các vùng Qkcung cấp các mẫu của các vùng mà không tham chiếu mẫu PC( ). Chúng ta tính toán các (n(Q),PC( )),k 1,...,N , quá trình phân loại tổng quát Gaussian (generalized Gaussian distribution) với hàm tích luỹ G(x). Sử dụng mô hình này có thể tổng quát hoá một trật tự Gaussian biến đổi ngẫu nhiên với ƣớc lƣợng phân loại sẽ thu đƣợc giá trị (n( ),PC( ))hoặc lớn hơn là:
))) ( ), ( ( ( 1 G n PC p (2.19)
Giá trị p này thu đƣợc sẽ đƣợc đem so sánh với vùng . Khi đó là vùng giả mạo nếu p 10 3 ,còn không là giả mạo nếu ngƣợc lại.
Nếu thuật toán giải quyết vấn đề là vùng giả mạo, chúng ta nên áp dụng thuật toán đối với các vùng Q khác tƣơng tự trong bức ảnh với số điểm ảnh tƣơng tự tất cả các vùng không giả mạo khi giá trị .
41