Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau như việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội v.v…
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NÔI KHOA CÔNG NGHỆ THÔNG TIN ĐỀ TÀI KHOA HỌC TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP DÒ TÌM, PHÁT HIỆN SỰ GIẢ MẠO TRONG ẢNH SỐ - - 1 Tìm hiểu một số phương pháp dò tìm, phát hiện sự giả mạo trong ảnh số Information MỤC LỤC Lời mở đầu Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH 1.1. Biểu diễn ảnh số 1.2 Một số khái niệm cơ sở trong xử lý ảnh 1.3 Các giai đoạn trong xử lý ảnh Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠo 2.1 Bài toán phát hiện ảnh giả mạo 2.2 Hướng tiếp cận bài toán 2.2.1 Dựa vào hình dạng 2.2.2 Dựa vào phân tích nguồn sáng 2.2.3 Dựa vào biến đổi màu sắc 2.2.4 Dựa vào cơ sở dữ liệu 2.2.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ 2.2.6 Dựa vào phân tích ánh sáng Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁCH BIỆT HƯỚNG NGUỒN SÁNG 3.1 Giới thiệu 3.2 Các loại nguồn sáng 3.3 Ước lượng hướng chiều nguồn sáng 3.3.1 Ước lượng hướng chiều của nguồn sáng 3.3.2 Tìm những đường có khả năng là biên khuất 3.3.3 Ước lượng hướng chiều sáng cho từng đường biên tìm được 3.3.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất 3.4 Nguồn sáng ở vô tận (3-D) 3.5 Nguồn sáng ở vô tận (2-D) 3.6 Nguồn sáng ở gần (bộ phận) (2-D) 3.7 Nhiều nguồn sáng Phần 4: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN THUẬT TOÁN EXACTMATCh 4.1 Ý tưởng 4.2 Thuật toán 4.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước 4.4 Thuật toán cải tiến Exacta match* 4.5 Kết luận Tài liệu tham khảo - - 2 MỤC LỤC Lời mở đầu…………………………………………………… .4 Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH…………………………… 7 1.1. Biểu diễn ảnh số……………………………………………………………7 1.2 Một số khái niệm cơ sở trong xử lý ảnh………………………………… 8 1.3 Các giai đoạn trong xử lý ảnh…………………………………………….10 Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO…………… .12 2.1 Bài toán phát hiện ảnh giả mạo…………………………………………….12 2.2 Hướng tiếp cận bài toán…………………………………………………….12 2.2.1 Dựa vào hình dạng……………………………………………………….12 2.2.2 Dựa vào phân tích nguồn sáng……………………………………………12 2.2.3 Dựa vào biến đổi màu sắc……………………………………………… .13 2.2.4 Dựa vào cơ sở dữ liệu…………………………………………………….13 2.2.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ………………………… .14 2.2.6 Dựa vào phân tích ánh sáng………………………………………………14 Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁCH BIỆT HƯỚNG NGUỒN SÁNG…………………………………… 15 3.1 Giới thiệu…………………………………………………………………….15 3.2 Các loại nguồn sáng………………………………………………………….15 3.3 Ước lượng hướng chiều nguồn sáng…………………………………………15 3.3.1 Ước lượng hướng chiều của nguồn sáng……………………………… 15 3.3.2 Tìm những đường có khả năng là biên khuất……………………………16 3.3.3 Ước lượng hướng chiều sáng cho từng đường biên tìm được………… 17 3.3.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất……………………………17 3.4 Nguồn sáng ở vô tận (3-D)………………………………………………… 17 3.5 Nguồn sáng ở vô tận (2-D)………………………………………………….18 - - 3 3.6 Nguồn sáng ở gần (bộ phận) (2-D)………………………………………….20 3.7 Nhiều nguồn sáng……………………………………………………………20 Phần 4: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN THUẬT TOÁN EXACTMATCH……… ……………………………………………21 4.1 Ý tưởng………………………………………………………………………….21 4.2 Thuật toán……………………………………………………………………….22 4.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước………………… .22 4.4 Thuật toán cải tiến Exacta match * …………………………………………… .24 4.5 Kết luận…………………………………………………………………………26 Tài liệu tham khảo………………………………………………………………… 27 LỜI MỞ ĐẦU .5 Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH .8 1.1 Biểu diễn ảnh số .8 1.2 Một số khái niệm cơ sở trong xử lý ảnh 9 1.3 Các giai đoạn trong xử lý ảnh .11 Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO 13 2.1 Bài toán phát hiện ảnh giả mạo 13 2.2 Hướng tiếp cận bài toán .13 2.2.1 Dựa vào hình dạng .13 2.2.2 Dựa vào phân tích nguồn sáng 13 2.2.3 Dựa vào biến đổi màu sắc .13 2.2.4 Dựa vào cơ sở dữ liệu .14 2.2.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ .14 2.2.6 Dựa vào phân tích ánh sáng .15 Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁC BIỆT HƯỚNG NGUỒN SÁNG 15 3.1 Giới thiệu .15 3.2 Các loại nguồn sáng .16 - - 4 3.3 Ước lượng hướng chiếu nguồn sáng .16 3.3.1 Ước lượng hướng chiếu của nguồn sáng .16 3.3.2 Tìm những đường có khả năng là biên khuất 16 3.3.3 Ước lượng hướng chiếu sáng cho từng đường biên tìm được .17 3.3.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất 18 3.4 Nguồn sáng ở vô tận (3-D) .18 3.5 Nguồn sáng ở vô tận (2-D) 18 Đơn giản hóa những giả định về hằng số độ tương phản .20 3.6 Nguồn sáng ở gần (bộ phận) (2-D) .20 3.7 Nhiều nguồn sáng 20 Phần 4: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN THUẬT TOÁN EXACT MATCH 21 4.1 Ý tưởng 21 4.2. Thuật toán .22 4.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước 22 ٭ Các kỹ thuật thay đổi kích thước 22 4.4 Thuật toán cải tiến Exact match* 24 4.5 Kết luận 25 LỜI MỞ ĐẦU Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật tiên tiến được ứng dụng vào thực tế và ảnh số là một trong những thành quả đó. Với khả năng - - 5 của các phần mềm biên tập và sử lý ảnh, các bức ảnh có thể dễ dàng bị sửa chữa và hiệu chỉnh. Các chương trình phần mềm có thể thêm vào hay bỏ đi các đặc trưng của ảnh mà không để lại nhiều dấu vết về sự giả mạo. Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau như việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội v.v… Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau như việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội v.v… Ví dụ: - Tháng 8/2006, một bức ảnh minh họa của Hãng tin Reuters xuất hiện trên các trang báo lớn nhỏ trên khắp thế giới. Nội dung của bức ảnh là những cột khói tỏa lên từ một số tòa nhà cao tầng sau một đợt không kích tại Beirut. Nhưng sau đó họ đã phát hiện ra một phần của bức ảnh đã bị người ta sao chép (copy), rồi cắt dán lặp lại nhiều lần trong bức ảnh, có lẽ tác giả ảnh muốn cho người xem cảm nhận được sự tàn phá và hãi hùng vì . khói. - - - 6 Hình 4: Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh - Một ảnh giả khác được tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Hình ảnh Bill Clinton và Saddam Hussein được cắt và dán vào bức ảnh Nhà trắng. Các hiệu ứng về bóng và ánh sáng cũng được tạo ra làm cho bước ảnh có vẻ nhìn gần giống như thật, rất khó nhận biết bằng mắt thường. - Một bức ảnh khác mô là hình ghép giữa hai bức ảnh khác nhau xuất hiện trong chiến dịch tranh cử tổng thống Mỹ năm 2004, cho thấy ứng viên John Kerry nói chuyện với cựu nữ diễn viên Jane Fonda tại một cuộc biểu tình phản chiến vào những năm 60 của thế kỷ trước, bên dưới có đóng “nhãn hiệu cầu chứng” là The Associated Press. - Hình 5: Ảnh giả của John Kerry và Jane Fonda được cắt ghép từ hai ảnh riêng lẻ Một số cựu binh Mỹ thời chiến tranh Việt Nam phản ứng mạnh bằng thái độ giận dữ khi thấy một ứng viên tổng thống lại chia sẻ diễn đàn với một nữ diễn viên tích cực chống chiến tranh Như vậy ảnh hưởng của những thông tin từ những bức ảnh là rất lớn, thông tin hình ảnh luôn có tác động mạnh và trực tiếp tới con người. Do vậy ảnh được coi là công cụ biểu diễn và truyền đạt thông tin rất phổ biến và hữu dụng. - - 7 Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH 1.1 Biểu diễn ảnh số Đối với ảnh đơn giản (ảnh đen trắng) thì ảnh được biểu diễn bằng một hàm cường độ sáng hai chiều ,( )X Yf , trong đó ,X Y là các giá trị toạ độ không gian và hàm giá trị của f tại một điểm ( , )X Y bất kỳ sẽ tỷ lệ với độ sáng hay mức xám của điểm ảnh tại điểm này. [2,4] Hình 1: Biểu diễn ảnh bằng hàm ,( )X Yf Trong mộ số trường hợp hàm ảnh còn được biểu diễn với một trục thứ 3 gọi là hàm cường độ sáng (với hình 1.1, trục thứ 3 bằng 0). Một ảnh số là một ảnh ,( )X Yf được gián đoạn theo không gian và cường độ sáng. Một ảnh số được xem như một ma trận với hàng và cột biểu diễn một điểm trong ảnh và giá trị điểm ma trận tương ứng với mức xám tại điểm đó. Các phần tử của một dãy số như thế được gọi là các điểm ảnh. Ánh sáng có dạng năng lượng ,( )X Yf phải khác 0 và hữu hạn: ,0 ( ) (1.1)X Yf< < ∞ Con người có khả năng nhận các hình ảnh từ ánh sáng phản xạ qua các vật thể. Cơ sở của ,( )X Yf được đặc trưng qua hai thành phần: Số lượng ánh sáng nguồn rơi trên cảnh vật được nhìn thấy. - - * P(X,Y) 8 Số lượng ánh sáng nguồn phản xạ từ vật thể ( trong cảnh vật). Chúng được gọi gần đúng là sự phát sáng và các thành phần phản xạ, và được biểu diễn tương ứng là ,( )X Yi và ,( )X Yr . Bản chất của ,( )X Yi được xác định bằng nguồn sáng và của ,( )X Yr được xác định bằng các đặc trưng của vật thể. Hàm ,( )X Yi và ,( )X Yr kết hợp với nhau để cho hàm ,( )X Yf Với: , , , , , ( ) ( ) ( ) (1.2) ( 0 ( ) 0 ( ) 1) X Y X Y X Y X Y X Y f i r i r = < < ∞ < < Ở đây ta gọi cường độ sáng của một ảnh đen trắng tại tọa độ ,( )X Y là mức xám ( )l của ảnh tại điểm đó. Từ (1.2), (1.3), (1.4) , l nằm trong khoảng: min max (1.3)L l L≤ ≤ Trong lý thuyết, chỉ cần min 0L > và max L hữu hạn. Trong thực tế: min min min max max max (1.4)L i r L i r = = Sử dụng các giá trị chiếu sáng và phản xạ đã được tổng kết qua thực nghiệm hoặc xem là các giá trị cơ bản min max 0.005, 100L L≈ ≈ cho xử lý ảnh. Khoảng [ ] min max ,L L được gọi là thang xám. Ta có thể dịch khoảng này đến [ ] 0, L , trong đó 0l = là đen và l L= là trắng trong thang xám. Giá trị tức thời là các dạng mức xám thay đổi liên tục từ đen đến trắng. 1.2 Một số khái niệm cơ sở trong xử lý ảnh Để có thể xử lý bằng máy tính điện tử thì ảnh cần phải được số hóa. Đó là quá trình biến đổi ảnh từ tín hiệu liên tục sang tín hiệu rời rạc thông qua việc lấy mẫu và lượng tử hóa. Trong quá trình này người ta sử dụng khái niệm “pixel”. Mỗi pixel được đặc trưng bởi một cặp tọa độ ,( )X Y và màu sắc của nó.[4] - - 9 Ảnh: Là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một mảng hai chiều ( , )n p I có n dòng và p cột, ảnh sẽ có n p× (pixel). Ta ký hiệu ( , )X Y I để chỉ điểm ảnh có toạ độ ,( )X Y .[4] Mức xám (Gray level): Đó là kết quả của việc mã hóa, cho tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số, có thể là 16, 32, 64 mức. Biểu diễn ảnh: Trong biểu diễn ảnh người ta thường sử dụng các phần tử đặc trưng của ảnh là pixel. Một hàm hai biến chứa các thông tin như một biểu diễn ảnh. Một số mô hình thường dùng để biểu diễn ảnh là mô hình toán (biểu diễn ảnh nhờ các hàm cơ sở), mô hình thống kê (ảnh coi như một phần tử của một tập hợp đặc trưng bởi kỳ vọng toán, hiệp biến, phương sai, moment…).[4] Tăng cường ảnh: Đây là một bước quan trọng bao gồm các kỹ thuật lọc độ tương phản, khử nhiễu, nổi màu…. Biến đổi ảnh: Thao tác chủ yếu trên một tập các ma trận và sử dụng các kỹ thuật để biến đổi ảnh qua ma trận: Biến đổi Furie, Sin, Cosin, tích Kronecker. Phân tích ảnh: Liên quan tới việc xác định các độ đo định lượng của một ảnh để đưa ra một mô tả đầy đủ về ảnh. Có những kỹ thuật cơ bản để hỗ trợ phân tích ảnh: Dò biên, lọc vi phân, dò theo quy hoạch động, phân vùng ảnh [4] Nhận dạng ảnh: Quá trình này liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Nhận dạng ảnh thường đi sau các quá trình trích chọn các đặc trưng chủ yếu của đối tượng.[1,4] - - 10 [...]... toán phát hiện ảnh giả mạo Ảnh giả mạo được chia làm 2 loại: Thứ nhất, đó là ảnh giả mạo nhưng thật, được dàn dựng một cách có ý đồ sau đó thu nhận ảnh và không thực hiện thao tác chỉnh sửa trực tiếp trên ảnh thu nhận được Thứ hai, ảnh giả mạo được tạo ra từ việc có tác động lên ảnh nhằm thay đổi nội dung và bản chất bức ảnh dựa trên các kỹ thuật xử lý ảnh (cắt, dán, ghép, thêm, bớt, chỉnh sửa) Trong đề... xuất Phần ảnh được ghép vào hay bổ sung thường không có sự biến đổi tương đồng về độ sáng - 13 - 2.2.4 Dựa vào cơ sở dữ liệu Việc giả mạo ảnh thường dựa vào các ảnh đã có, tức là các ảnh đã được xuất bản bởi một nơi nào đó như: Báo chí, trang Web, tạp chí v.v Các ảnh này đã được lưu trữ nên khi xuất hiện một ảnh nghi là giả mạo người ta có thể tìm ảnh này với các phần trong nguồn ảnh nằm trong cơ sở... điểm ảnh từ ảnh gốc sang ảnh đích Nearest-neighbor Kỹ thuật này được diễn tả như sau: với mỗi điểm ảnh từ ảnh gốc sẽ tương ứng với một vị trí phù hợp trong ảnh đích (ảnh đã được thay đổi kích thước) các giá trị màu và tín hiệu của một điểm ảnh trong ảnh mới sẽ được gán bằng giá trị màu của điểm ảnh gần nhất (láng giềng gần nhất) thuộc ảnh gốc tương ứng Bilinear interpolation Đây là phương pháp. .. thành quả đó Ảnh số ngày càng dễ sửa chữa và hiệu chỉnh do sức mạnh của các phần mềm soạn thảo và xử lý ảnh mà điển hình là PhotoShop Do vậy mà bài toán phát hiện ảnh giả mạo đã trở nên cấp thiết và ngày càng khó khăn Trên cơ sở nghiên cứu các kỹ thuật nội suy hiện đang được PhotoShop sử dụng trong việc thay đổi kích thước vùng ảnh Tôi đề xuất một cải tiến cho thuật toán phát hiện ảnh giả mạo Exact match... thước ảnh, PhotoShop thường sử dụng 1 trong các kỹ thuật nội suy được trình bày ở mục 3.1 ở trên Dựa vào đó ta tìm kiếm các cặp vùng trong ảnh có mối quan hệ tương quan theo một phương pháp nội suy xác định Một vùng ℜ được gọi là vùng tương quan nếu nó tồn tại ít nhất một vùng ℜ và ε một phép biến đổi, tương ứng khác sao cho : α f : ℜ→ℜ ε Trong đó α là hệ số tỷ lệ, và phép ánh xạ theo một phương pháp. .. đoạn trong xử lý ảnh Bài toán xử lý ảnh bao gồm các giai đoạn tổng quát như sau [1,2,4] Phân đoạn Scanner, Camera Thu nhận ảnh Biểu diễn Nhận dạng và nội suy Tiền xử lý Cơ sở tri thức Kết quả Hình 2: Các bước cơ bản trong xử lý ảnh số Bước đầu tiên là thu nhận ảnh, thu ảnh số bằng bộ cảm biến ảnh với khả năng số hóa tín hiệu của bộ cảm biến Sau khi nhận được một ảnh số, bước tiếp theo là tiền xử lý ảnh. .. sáng Một ảnh tổng hợp từ nhiều ảnh khác nhau sẽ có bóng sắc thay đổi từ người này sang người khác Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁC BIỆT HƯỚNG NGUỒN SÁNG 3.1 Giới thiệu Vấn đề ước lượng hướng nguồn sáng là một lĩnh vực nghiên cứu lớn của thị giác máy tính Trong phần này sẽ mô tả bài toán, đề xuất giải pháp và sau đó sẽ trình bày cách thức để loại bỏ các yếu tố ngoại cảnh, làm đơn giản... số hóa Thực hiện lấy mẫu và mã hóa - Tiền xử lý ảnh khi thu nhận Bộ xử lý ảnh số bao gồm nhiều bộ xử lý chuyên dụng: Xử lý lọc, trích chọn đặc trưng, nhị phân hóa ảnh Máy chủ đóng vai trò điều khiển các thành phần khác Bộ nhớ ngoài: Lưu trữ dữ liệu ảnh cũng như các kiểu dữ liệu khác để có thể chuyển giao cho các quá trình có nhu cầu - 12 - Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO 2.1 Bài toán phát. .. là phương pháp phức tạp hơn nearest neighbor Phương pháp này xác định giá trị của một điểm ảnh mới dựa trên trung bình trọng số của 4 điểm ảnh láng giềng gần nhất 2x-2 của điểm ảnh thuộc ảnh gốc Chúng ta miêu tả chi tiết phương pháp nội suy bilinear như sau: Giả sử với mỗi điểm (x,y) thuộc ảnh gốc ta xác định được các giá trị ánh xạ tương ứng (X,Y) thuộc ảnh đích theo phép biến đổi sau: X = f x ( x,... được mã hóa thành một hệ thống xử lý trong ảnh dưới dạng cơ sở dữ liệu kiến thức - 11 - Để xử lý các quá trình trên thì cần một hệ thống xử lý ảnh bao gồm một số thành phần cơ bản sau đây:[4] Màn hình đồ họa Camera Bộ nhớ ảnh Bộ xử lý tương tự Bộ nhớ ngoài Màn hình Máy chủ Bàn phím Bộ xử lý ảnh số Máy in Hình 3: Các thành phần cơ bản của một hệ xử lý ảnh Bộ xử lý tương tự thực hiện các chức năng: . điểm đó. Từ (1. 2), (1. 3), (1. 4) , l nằm trong khoảng: min max (1. 3)L l L≤ ≤ Trong lý thuyết, chỉ cần min 0L > và max L hữu hạn. Trong thực tế:. lý ảnh…………………………………..8 1. 3 Các giai đoạn trong xử lý ảnh…………………………………………… .10 Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO…………….. .12 2 .1 Bài toán phát hiện