LỜI CAM ĐOANTôi xin cam đoan luận văn “Nghiên cứu các phương pháp phát hiện ảnh kỹ thuật số giả mạo và ứng dụng” là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn của thầy giáo TS
Trang 1ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN PHƯƠNG THÚY
NGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO VÀ ỨNG DỤNG
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2014
Trang 2ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN PHƯƠNG THÚY
NGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO VÀ ỨNG DỤNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS NGUYỄN NGỌC CƯƠNG
THÁI NGUYÊN – 2014
Trang 3LỜI CẢM ƠN
Luận văn được thực hiện tại Trường Đại học Công nghệ Thông tin và TruyềnThông – Đại học Thái Nguyên dưới sự hướng dẫn của thầy giáo TS Nguyễn NgọcCương
Trước hết em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo TS Nguyễn NgọcCương - Học viện An ninh nhân dân, người đã tận tình hướng dẫn giúp đỡ để emhoàn thành tốt luận văn của mình
Em xin gửi lời cảm ơn chân thành đến các thầy cô giáo Trường Đại họcCông nghệ Thông tin và Truyền Thông - Đại học Thái Nguyên, cùng các thầy côgiáo đã nhiệt tình giảng dạy, truyền đạt kiến thức cho em trong suốt quá trình họctập tại trường cũng như quá trình làm luận văn này
Cuối cùng em xin gửi lời cảm ơn đến gia đình, bạn bè, các đồng nghiệpnhững người đã động viên, giúp đỡ và tạo điều kiện cho em trong quá trình học tập
và hoàn thành luận văn
Thái Nguyên, ngày 15 tháng 05 năm 2014
HỌC VIÊN
NGUYỄN PHƯƠNG THÚY
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Nghiên cứu các phương pháp phát hiện ảnh kỹ
thuật số giả mạo và ứng dụng” là công trình nghiên cứu của riêng tôi dưới sự
hướng dẫn của thầy giáo TS Nguyễn Ngọc Cương Các số liệu, hình ảnh được sửdụng trong luận văn cũng như các kết quả nghiên cứu được trình bày trong luận văn
là trung thực
Trang 5MỤC LỤC
LỜI CẢM ƠN
i LỜI CAM ĐOAN
ii MỤC LỤC
iii DANH MỤC CÁC HÌNH VẼ
vi PHẦN 1: PHẦN MỞ ĐẦU 1
1 Giới thiệu tổng quan về đề tài
1 2 Bố cục luận văn
2 PHẦN 2: NỘI DUNG
4 CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO 4
1.1 Xử lý ảnh, một số vấn đề cơ bản trong xử lý ảnh 4
1.1.1 Xử lý ảnh 4
1.1.2 Biểu diễn ảnh 4
1.1.3 Một số khái niệm cơ bản trong xử lý ảnh 5
1.1.4 Các giai đoạn trong xử lý ảnh 8
1.1.4.1 Thu nhận ảnh 8
1.1.4.2 Tiền xử lý 8
1.1.4.3 Phân đoạn ảnh 9
1.1.4.4 Hệ quyết định 9
1.1.4.5 Trích chọn đặc điểm 9
Trang 61.2 Ảnh giả mạo và phát hiện ảnh giả mạo .11
1.2.1 Ảnh giả mạo 11
Trang 71.2.2 Các dạng ảnh giả mạo cơ bản 13
1.2.2.1 Ghép ảnh 13
1.2.2.2 Tăng cường ảnh 14
1.2.2.3 Sao chép và dịch chuyển vùng trên ảnh 14
1.2.3 Hướng tiếp cận bài toán phát hiện ảnh giả mạo 16
1.2.3.1 Dựa vào hình dạng 16
1.2.3.2 Dựa vào phân tích nguồn sáng 16
1.2.3.3 Dựa vào biến đổi màu sắc 16
1.2.3.4 Dựa vào cơ sở dữ liệu 16
1.2.3.5 Dựa vào dấu vết quá trình điều chỉnh tỷ lệ 17
CHƯƠNG 2: MỘT SỐ KỸ THUẬT PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO 18
2.1 Phát hiện ảnh giả mạo dựa trên thuật toán Exact Match 18
2.1.1 Ý tưởng 18
2.1.2 Thuật toán 19
2.1.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước 20
2.1.3.1 Các kỹ thuật thay đổi kích thước 20
2.1.3.2 Thuật toán cải tiến Exact Match* 22
2.2 Phát hiện ảnh giả mạo dựa trên thuật toán phân tích nguồn sáng 25
2.2.1 Các phương pháp uớc lượng hướng nguồn sáng 25
2.2.1.1 Nguồn ánh sáng vô tận (3-D) 25
2.2.1.2 Nguồn ánh sáng vô tận (2-D) 27
2.2.1.3 Nguồn sáng cục bộ (2-D) 28
2.2.1.4 Nhiều nguồn sáng 28
2.2.2 Thuật toán nhận dạng ảnh giả mạo dựa trên phân tích nguồn sáng 29
Trang 82.2.2.1 Tách biên đối tượng 29
2.2.2.2 Loại bỏ các đối tượng nhỏ và nhiễu 32
2.2.2.3 Chọn các đoạn biên để uớc lượng hướng ánh sáng 33
2.2.2.4 Thuật toán uớc lượng hướng sáng trên đoạn biên 33
2.3 Phát hiện ảnh giả mạo dựa vào thuật toán phân tích mẫu nhiễu cảm biến 35
2.3.1 Mẫu nhiễu và các phương thức biểu diễn 35
2.3.2 Dò tìm mẫu nhiễu 38
2.3.3 Thuật toán phát hiện giả mạo 41
CHƯƠNG 3: THỬ NGHIỆM CHƯƠNG TRÌNH 44
3.1 Bài toán phát hiện ảnh giả mạo 44
3.2 Chương trình thử nghiệm 45
3.2.1 Giao diện chương trình 45
3.2.2 Thông tin chương trình 45
3.2.3 Phát hiện ảnh giả mạo bằng thuật toán Exact Match 52
3.2.4 Kết quả kiểm tra 50
PHẦN 3: KẾT LUẬN 51
TÀI LIỆU THAM KHẢO 54
PHỤ LỤC 56
Trang 9DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Quá trình xử lý ảnh 4
Hình 1.2 Biểu diễn ảnh bằng hàm f(X,Y) 5
Hình 1.3 Ảnh thu nhận và ảnh mong muốn 6
Hình 1.4 Các bước cơ bản trong xử lý ảnh số 8
Hình 1.5 Các thành phần cơ bản của một hệ xử lý ảnh 10
Hình 2.1 Bức anh giả mạo của Brian Walski 12
Hình 2.2 Nghị sĩ John Kerry và nữ diễn viên Jane Fonda phát biểu 12
Hình 2.3 Ghép ảnh từ hai ảnh riêng rẽ 13
Hình 2.4 Ví dụ về tăng cường ảnh 14
Hình 2.5 Ảnh che phủ và bỏ đi đối tượng 15
Hình 2.6 Ảnh bổ sung đối tượng 15
Hình 2.7 Sơ đồ về việc phát hiện ảnh giả mạo dựa vào cơ sở dữ liệu 17
Hình 2.8 Minh họa cho việc tìm kiếm khối bao của thuật toán Extract Match 18
Hình 2.9: Ảnh cắt dán giả mạo và thuật toán phát hiện ảnh giả mạo Exact Match 19 Hình 2.10: ô hình ánh xạ các điểm ảnh từ ảnh gốc sang ảnh đích 20
Hình 2.11: Phát hiện mâu thuẫn hướng nguồn sáng 25
Hình 2.12: Minh họa hướng nguồn sáng và pháp tuyến bề mặt của đối tượng 27
Hình 2.13: Hai đối tượng được chiếu bởi một nguồn sáng ở gần 28
Hình 2.14: Kết quả đạo hàm theo 2 hướng x và y 30
Hình 2.15: Kết quả minh họa tính độ lớn biên 31
Hình 2.16: Minh họa các liên thông theo 4, 8, 6 láng giềng 32
Trang 10Hình 2.17: Minh họa các điểm được đánh dấu để xóa 33
Hình 2.18: Minh họa các điểm được đánh dấu để nối nét đứt 33
Hình 2.19: Minh họa kết quả xác định hướng ánh sáng trên bức ảnh giả mạo có sẵn 34
Hình 2.20: Mô hình mẫu nhiễu 37
Hình 2.21: Minh họa vùng R được chọn và mẫu nhiễu tham chiếu tương ứng của nó 39
Hình 2.22: Hình ảnh minh họa chọn các vùng Q i và mẫu tham chiếu 40
Hình 2.23: Mô hình tạo mẫu tham chiếu của camera 41
Hình 2.24: Sơ đồ mô tả mô hình thực nghiệm 44
Hình 3.1: Giao diện chính 45
Hình 3.2: Giao diện thông tin 46
Hình 3.3: Lựa chọn vùng nghi vấn 47
Hình 3.4: Giao diện kiểm tra vùng nghi vấn 48
Hình 3.5: Thêm vùng nghi vấn 48
Hình 3.6: Chương trình đang phân tích 49
Hình 3.7: Kết quả kiểm tra vùng giống nhau 50
vii
Trang 11PHẦN 1: PHẦN MỞ ĐẦU
1 Giới thiệu tổng quan về đề tài
Mỗi bức ảnh được sáng tác một cách có chủ đích đều truyền tải những thôngđiệp riêng, bên cạnh đó ảnh được coi là công cụ biểu diễn và truyền đạt thông tin rấthữu dụng Hiện nay, công nghệ kỹ thuật số hiện đại và sự phát triển của các phầnmềm chỉnh sửa ảnh, nên các bức ảnh có thể dễ dàng bị chỉnh sửa
Các ảnh đưa vào máy tính được số hóa, sử dụng các chức năng của phầnmềm để cắt, dán, tẩy, xoay, chuyển đổi vị trí, nâng cao chất lượng ảnh tạo mộtbức ảnh như ý mà không để lại nhiều dấu vết của sự giả mạo Do vậy, chúng ta cóthể thấy việc phát hiện ảnh giả mạo này càng trở nên khó khăn và cần thiết
Ảnh giả mạo được xem là ảnh không có thật, việc có được ảnh là do có sựcan thiệp bởi các chương trình xử lý ảnh hoặc quá trình thu nhận Giả mạo ảnhnhằm vào nhiều mục đích trong đó có việc vu cáo, tạo ra các tin giật gân, đánh lừađối thủ, làm sai lệch chứng cứ phạm tội
Việc phát hiện và chống giả mạo ảnh là một chủ đề ngày càng được quantâm bởi nhiều nhóm nghiên cứu Như các nghiên cứu thuộc cấp bộ của nhóm tác giả
Vũ Đức Thi, Đỗ Năng Toàn, Viện công nghệ thông tin, các nhóm của Dugelay vớinghiên cứu về thủy phân, nhóm Fridrich, với nghiên cứu về nhiễu, phát hiện ảnh giảmạo dựa vào đối sánh khối bao, Fraid với nghiên cứu về thống kê trên ảnh, về phépnén ảnh JPEG và sự mâu thuẫn ánh sáng trên ảnh, nhóm của Chang với các phântích về mẫu nhiễu trên ảnh
Trong những năm gần đây, con người có thể dễ sử dụng các phần mềm xử lýảnh để tạo ra các bức ảnh ghép tinh vi, tạo nên những tình huống không tồn tại làmgiảm độ tin cậy và giá trị của bức ảnh Có thể thấy ảnh hưởng của thông tin trênnhững bức ảnh là rất lớn, nó luôn có tác động trực tiếp tới con người, do đó chúng
Trang 12tôi chọn đề tài nghiên cứu: “ Nghiên cứu các phương pháp phát hiện ảnh kỹ thuật
số giả mạo và ứng dụng.”
Các thuật toán phát hiện ảnh giả mạo bao gồm: Thuật toán Exact Mach, thuậttoán Exact Mach* (thuật toán dò tìm khối bao giống nhau), thuật toán phân tíchnguồn sáng, thuật toán phân tích mẫu nhiễu cảm biến
Trong thực tế, các bức ảnh giả mạo thường được làm giả bằng cách thêm, bớt,xóa, sửa thuật toán Exact Mach dựa trên ý tưởng đối sánh khối bao để tìm ranhững điểm giống nhau trên bức ảnh nhằm phát hiện ảnh giả mạo trong trường hợpảnh bị cắt dán bởi các phần khác trong ảnh nhưng chưa phát hiện được ảnh có thayđổi kích thước, thuật toán Exact Mach* cũng dựa trên ý tưởng đối sánh khối bao cókhả năng phát hiện đối với các ảnh giả mạo đạng cắt dán từ hính một ảnh và có sựthay đổi về kích thước cho phép giả quyết bài toán thực tế Do vậy, tôi lựa chọnthuật toán Exact Mach, thuật toán Exact Mach* để thử nghiệm cho chương trình pháthiện ảnh giả mạo
2 Bố cục luận văn
Phần mở đầu: Giới thiệu tổng quan đề tài và bố cục luận văn
Nội dung:
Ử LÝ ẢNH VÀ ẢNH GIẢ MẠO1.1 Một số khái niệm cơ bản trong xử lý ảnh
1.2 Ảnh giả mạo và phát hiện ảnh giả mạo
CHƯƠNG 2: MỘT SỐ KỸ THUẬT PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢMẠO
2.1 Phát hiện ảnh giả mạo dựa trên thuật toán Exact Match
2.2 Phát hiện ảnh giả mạo dựa trên thuật toán phân tích nguồn sáng
Trang 132.3 Phát hiện ảnh giả mạo dựa trên thuật toán phân tích mẫu nhiễuCHƯƠNG 3: THỬ NGHIỆM CHƯƠNG TRÌNH
3.1 Bài toán phát hiện ảnh giả mạo
3.2 Chương trình thử nghiệm
Phần kết luận
Tài liệu tham khảo
Phụ lục
Trang 14PHẦN 2: NỘI DUNG CHƯƠN G 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO1.1 Xử lý ảnh, một số vấn đề cơ bản trong xử lý ảnh
1.1.1 Xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vaitrò quan trọng vì thông tin thu nhận được thu nhận bằng mắt tức là ở dạng hình ảnh.Trong những năm gần đây với sự phát triển của phần cứng máy tính, xử lý ảnh và
đồ hoạ phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống [2]
Xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kếtquả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốthơn” hoặc một kết luận
Hình 1.1 Quá trình xử lý ảnh
1.1.2 Biểu diễn ảnh
Đối với ảnh đơn giản (ảnh đen trắng) thì ảnh được biểu diễn bằng một hàm
cường độ sáng hai chiều f(X,Y) Trong đó X, Y là các giá trị toạ độ không gian và hàm giá trị của f tại một điểm (X,Y) bất kỳ sẽ tỷ lệ với độ sáng hay mức xám của điểm ảnh tại điểm này Giá trị của hàm f(X,Y) được hạn chế trong phạm vi của các
số nguyên dương 0≤ f(X,Y) ≤ f max.
Trang 15Hình 1.2 Biểu diễn ảnh bằng hàm f(X,Y)
Các ảnh thường được biểu diễn theo 2 mô hình cơ bản:
Mô hình Raster: Là mô hình biểu diễn ảnh thông dụng nhất hiện nay Ảnhđược biểu diễn dưới dạng ma trận các điểm ảnh Tùy theo nhu cầu thực tế mà mỗiđiểm ảnh có thể được biểu diễn bởi một hay nhiều bit Mô hình Raster thuận lợi choviệc thu nhận, hiển thị và in ấn
Mô hình Vector: Bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ dànghiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có ưu điểm cho phép dễdàng lựa chọn, sao chép, di chuyển, tìm kiếm,…Theo những yêu cầu này thì kỹthuật biểu diễn vector tỏ ra ưu việt hơn
1.1.3 Một số khái niệm cơ bản trong xử lý ảnh
Ảnh: Là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một mảng
hai chiều I ( n, p ) có n dòng và p cột, ảnh sẽ có n p (pixel) Ta ký hiệu I ( X ,Y ) đểchỉ
điểm ảnh có toạ độ ( X , Y ) .
Điểm ảnh: Gốc của ảnh là ảnh liên tục về không gian và độ sáng Để xử
lý bằng máy tính, ảnh cần phải được số hoá
Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phùhợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa cácđiểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữachúng
Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là
Trang 16 Mức xám (Gray level): Đó là kết quả của việc mã hóa, cho tương ứng một
cường độ sáng của mỗi điểm ảnh với một giá trị số, có thể là 16, 32, 64 mức, mã hóa 256 mức là phổ dụng nhất
Nắm chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử
Pi
Ảnh thu nhận Ảnh mong muốn
Hình 1.3 Ảnh thu nhận và ảnh mong muốn [1]
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường đượcxây dựng trên tập các điểm điều khiển
Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh [1]
- Nhiễu hệ thống: Là nhiễu có quy luật có thể khử bằng các phépbiến đổi
- Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân khắc phục bằng cácphép lọc
Phân tích ảnh
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh Trongphân tích ảnh việc trích chọn đặc điểm là một bước quan trọng, các đặc điểm của
Trang 17đối tượng được trích chọn tùy theo mục đích nhận dạng trong quá trình xử lý ảnh.Một số đặc điểm của ảnh như: Đặc điểm không gian, đặc điểm biến đổi, đặc điểmbiên và đường biên.[1]
Nhận dạng ảnh
Nhận dạng ảnh thường đi sau các quá trình trích chọn các đặc trưng chủ yếucủa đối tượng Quá trình này liên quan đến các mô tả đối tượng mà người ta muốnđặc tả nó
Nhận dạng ảnh là một qua trình phân hoạch ảnh thành các đối tượng ảnh con,chúng được gán vào từng lớp nhãn để đối sánh với mẫu và đối sánh theo các quyluật biết trước nào đó
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủyếu sau đây:
- Thu nhận dữ liệu và tiền xử lý
- Biểu diễn dữ liệu
- Nhận dạng, ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
- Đối sánh mẫu dựa trên các đặc trưng được trích chọn
- Phân loại thống kê
- Đối sánh cấu trúc
- Phân loại dựa trên mạng nơ-ron nhân tạo
Trang 181.1.4 Các giai đoạn trong xử lý ảnh
Hình 1.4 Các bước cơ bản trong xử lý ảnh số
1.1.4.1 Thu nhận ảnh
Đây là bước đầu tiên trong quá trình xử lý ảnh Thu ảnh số bằng bộ cảm biếnảnh vơi khả năng số hoa tín hiệu của bộ cảm biến Bộ thu ảnh ở đây có thể là máychụp ảnh đơn sắc hay màu, máy quét ảnh, … Mặc dù đây chỉ là công đoạn đầu tiênsong kết quả của nó có ảnh hưởng rất nhiều đến công đoạn kế tiếp
1.1.4.2 Tiền xử lý
Mục đích cuả gia đoạn này nâng cao cải thiện về độ tương phản, khử nhiễu,khử bóng, khử độ lệch, v.v… để làm cho chất lượng ảnh trở nên tốt hơn nữa, chuẩn
bị cho các bước xử lý phức tạp hơn về sau trong quá trình xử lý ảnh
+ Khử nhiễu: Gồm nhiễu hệ thống và nhiễu ngẫu nhiên Nhiễu hệ thống có
đặc trưng là tính tuần hoàn Nên để có thể khử nhiễu này cần sử dụng phép biến đổiFourier và loại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, có thể khử bằngphương pháp nội suy, lọc trung vị và trung bình
+ Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều củathiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh
+ Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hay điện tử cóthể bị mờ, nhoè Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàmtán xạ cho phép giải quyết việc hiệu chỉnh này
Trang 191.1.4.3 Phân đoạn ảnh
Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác nhauhay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh Đây là phầnphức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xáccủa ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này
1.1.4.5 Trích chọn đặc điểm
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinhtrong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt ranhững yêu cầu về tốc độ tính toán
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đốitượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảmxuống
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạngtrong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau đây:
- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn
- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiệnlọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (featuremask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cungtròn v.v )
Trang 20- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và dovậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi nhậndạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử Gradient, toán
tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing)
1.1.4.6 Nhận dạng
Nhận dạng ảnh là quá trình xác định nội dung ảnh Quá trình này thường thuđược bằng cách so sánh với mẫu chuẩn đã được lọc (hoặc lưu) từ trước Đây làbước cuối cùng trong quá trình xử lý ảnh
Để xử lý các quá trình trên thì cần một hệ thống xử lý ảnh bao gồm một sốthành phần cơ bản sau đây:
Hình 1.5 Các thành phần cơ bản của một hệ xử lý ảnh
Bộ xử lý tương tự thực hiện các chức năng:
- Chọn Camera thích hợp nếu có nhiều Camera
- Chọn màn hình hiển thị tín hiệu
- Thu nhận tín hiệu video bởi bộ số hóa Thực hiện lấy mẫu và mã hóa
- Tiền xử lý ảnh khi thu nhận
Trang 21Bộ xử lý ảnh số bao gồm nhiều bộ xử lý chuyên dụng: Xử lý lọc, trích chọnđặc trưng, nhị phân hóa ảnh.
Máy chủ đóng vai trò điều khiển các thành phần khác
Bộ nhớ ngoài: Lưu trữ dữ liệu ảnh cũng như các kiểu dữ liệu khác để có thểchuyển giao cho các quá trình có nhu cầu
1.2 Ảnh giả mạo và phát hiện ảnh giả mạo
1.2.1 Ảnh giả mạo
Ảnh giả mạo được xem là ảnh không có thật, việc có được ảnh là do sự ngụytạo bởi các chương trình xử lý ảnh hoặc quá trình thu nhận ảnh Giả mạo ảnh nhằmvào nhiều mục đích trong đó có việc vu cáo, tạo ra các tin giật gân, đánh lừa đốithủ, làm sai lệch chứng cứ tội phạm v.v…
Ảnh giả mạo được chia làm hai loại:
Thứ nhất, đó là ảnh giả mạo như thật, được dàn dựng một cách có ý
đồ sau đó thu nhận ảnh và không thực hiện thao tác chỉnh sửa trực tiếptrên ảnh thu nhận được
Thứ hai, ảnh giả mạo được tạo ra từ việc có tác động lên ảnh nhằmthay đổi nội dung và bản chất bức ảnh dựa trên các kỹ thuật xử lý ảnh(cắt, dán, ghép, thêm, bớt, chỉnh sửa)
ị tiêu diệt, những bức ảnh giả về thi thể của thủ lĩnh al-Qaeda đã nhanh chóng lan truyền trên internet Tuy nhiên, đây không phải lần đầu tiên cư dân mạng bị lừa vì những bức ảnh giả
Bức ảnh giả về thi thể của trùm khủng bố Osama bin Laden xuất hiện trênmạng sau khi thủ lĩnh al-Qaeda bị tiêu diệt Thậm chí một số nghị sĩ Mỹ cũng tinđây là ảnh thật cho tới khi biết họ bị lừa
Trang 22-Hình 2.1 Bức anh giả mạo của Brian Walski
chiến trường Brian Walski của tờ Los Angeles Times đã tạo ra bức ảnh giả (dưới)bằng cách phối 2 bức ảnh nguyên bản (trên) để tăng tính gay cấn Nhưng kỹ xảocủa phóng viên Walski, một phóng viên ảnh lâu năm và có uy tín, đã bị phát hiệnnhờ việc phát hiện ra một vài người ở nền xuất hiện hai lần trên bức
Hình 2.2 Nghị sĩ John Kerry và nữ diễn viên Jane Fonda phát biểu
chống chiến tranh Việt Nam
Trang 23Từ một vài dẫn chứng trên, có thể thấy việc chống ảnh giả mạo (phát hiện)ngày càng trở nên cấp thiết nhưng cũng ngày càng khó khăn Việc phát hiện vàchống giả mạo ảnh là một chủ đề ngày càng được quan tâm bởi các nhóm nghiêncứu trong nước cũng như trên thế giới Có thể kể ra đây như các nghiên cứu thuộc
đề tài cấp bộ của nhóm Vũ Đức Thi, Đỗ Năng Toàn, Viện Công nghệ thông tin, cácnhóm của Hatzinakos, nhóm của Dugelay với các nghiên cứu về thủy vân, nhómcủa Fridrich, với các nghiên cứu về nhiễu, nhóm của Shum với các nghiên cứu vềhàm đáp ứng của camera, nhóm của Tang với các nghiên cứu về phân tích hệ sốbiến đổi Fourier, Farid với các nghiên cứu về thống kê trên ảnh, về phép nén ảnhJpeg và sự mâu thuẫn về ánh sáng trên ảnh, nhóm của Mahdian, Saic về các hàmbiến đổi trên ảnh, nhóm của Swaminathan với các nghiên cứu về đặc trưng số củamáy ảnh, nhóm của Chang với các phân tích về mâu thuẫn trên ảnh
1.2.2 Các dạng ảnh giả mạo cơ bản
1.2.2.1 Ghép ảnh
Đây có lẽ là dạng thức làm giả ảnh số phổ biến nhất Hình 2.3a được ghép từhai ảnh có cùng tỷ lệ Rõ ràng là nếu xác nhận được đây là ảnh thật hay ảnh giả mạothì cũng chứng minh được mối quan hệ giữa họ Độ tin cậy của sự giả mạo phụthuộc vào mức độ phù hợp các thành phần của ảnh về mặt kích thước, tư thế, màusắc, chất lượng và ánh sáng Nếu có một cặp ảnh tương thích tốt, được thực hiện bởimột chuyên gia giàu kinh nghiệm thì việc kết hợp hoàn toàn như thật
a) Ảnh ghép từ hai ảnh riêng rẽ b) Ảnh ghép từ hai ảnh có thay đổi tỷ lệ
Trang 24Một ví dụ khác của dạng giả mạo này là hình 2.3b Hình này là ảnh ghép từhai ảnh có sự thay đổi tỷ lệ.
1.2.2.2 Tăng cường ảnh
Đây là một lớp kỹ thuật tiến hành trên một vùng rộng, không phải là làmtăng cường lượng thông tin vốn có mà làm nổi bật một số đặc tính của ảnh như:thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, tăng cường độ tươngphản, điều chỉnh mức xám của ảnh Hình 2.4 gồm một ảnh gốc (góc trên bên trái),
và 3 ví dụ về việc tăng cường ảnh Ảnh gốc (trên trái) và ảnh được thay đổi màu sắc(trên phải), tăng độ tương phản (dưới trái) và làm mờ nền (dưới phải) Mặc dù loạigiả mạo này không thay đổi sự xuất hiện của các đối tượng nhưng có thể gây nênmột vài hiệu ứng trong việc cảm nhận bức ảnh
Hình 2.4 Ví dụ về tăng cường ảnh
1.2.2.3 Sao chép và dịch chuyển vùng trên ảnh
Một dạng khác thường thấy nữa của ảnh giả mạo loại 2 là việc sao chép dịch chuyển các đối tượng trong ảnh, việc này được xem như là che phủ hoặc xóa điđối tượng Hình 2.5a là ảnh gốc với hai chiếc ô tô, một xe con và một xe tải Hình2.5b là ảnh 2.5a giả mạo với việc che phủ chiếc xe tải bởi một cành cây cũng lấy từ
Trang 25-chính trong ảnh Trong khi hình 2.5c là ảnh gốc với chiếc trực thăng nhỏ còn hình2.5d chính là ảnh gốc 2.5c đã được bỏ đi đối tượng là trực thăng Trong cả hai dạnggiả mạo này đều được thực hiện từ một ảnh nên độ tương đồng về ánh sáng và bóng
là như nhau Trong những trường hợp này bằng mắt thường rất khó xác định
Hình 2.5 Ảnh che phủ và bỏ đi đối tượng
Hình 2.6 Ảnh bổ sung đối tượngHình 2.6 thể hiện một dạng khác thường thấy của giả mạo sao chép/dichuyển, đó là việc bổ sung thêm đối tượng Hình 2.6a là ảnh gốc chỉ có một chiếc
Trang 26trực thăng ở các vị trí khác nhau Các trực thăng này chính là được sao chép từ trựcthăng gốc nên góc độ và hướng là giống nhau, do đó rất khó cho việc xác thực.
1.2.3 Hướng tiếp cận bài toán phát hiện ảnh giả mạo
1.2.3.1 Dựa vào hình dạng
Việc phân tích để xác định tính giả mạo có thể dựa vào hình dạng vì việc cắt/dán ảnh hường được thực hiện dựa theo các đường biên, nơi có sự thay đổikhông liên tục của cường độ sáng của các điểm ảnh
1.2.3.2 Dựa vào phân tích nguồn sáng
Tấm ảnh ghép từ nhiều hình ảnh khác nhau sẽ khó có độ thuần nhất về ánhsáng (cường độ chiếu sáng, hướng của ánh sáng…) Ví dụ một quả cầu như hìnhbên sẽ sáng nhất ở bề mặt có ánh sáng chiếu thẳng góc (hướng của mũi tên vàng),tối nhất ở phía đối diện, các vùng xung quanh nó sẽ sáng với mức độ khác nhau tùy
vị trí khuất Sự phản xạ lại của tia sáng sang không gian hay vật thể xung quanhcũng có mức độ tương ứng
Để nhận biết hướng của nguồn sáng, cần phải biếtđược hướng chiếu sáng trên từng vị trí của bềmặt Sẽ rất khó nếu nhìn toàn bộ vật thể để xácđịnh nguồn sáng nhưng hãy chú ý đến các đườngviền trên bề mặt - nơi hướng ánh sáng vuông gócvới bề mặt Bằng cách đo độ sáng và hướng cùngvới một số điểm trên đường viền, các thuật toán
có thể xác định được hướng nguồn sáng
1.2.3.3 Dựa vào biến đổi màu sắc
Ảnh gốc thu nhận thường được thực hiện bởi một thiết bị, do tính chất biếnđổi của ống kính bao gồm góc độ chụp, độ mở v.v nên ảnh thu được thường bịbiến dạng theo các tính chất đặc trưng của các nhà sản xuất Phần ảnh được ghépvào hay bổ sung thường không có sự biến đổi tương đồng về độ sáng
1.2.3.4 Dựa vào cơ sở dữ liệu
Việc giả mạo ảnh thường dựa vào các ảnh đã có, tức là các ảnh đã được xuất
Trang 27bản bởi một nơi nào đó như: Báo chí, trang Web, tạp chí v.v Các ảnh này đã đượclưu trữ nên khi xuất hiện một ảnh nghi là giả mạo người ta có thể tìm ảnh này vớicác phần trong nguồn ảnh nằm trong cơ sở dữ liệu ảnh.
Hình 2.7 Sơ đồ về việc phát hiện ảnh giả mạo dựa vào cơ sở dữ liệu
1.2.3.5 Dựa vào dấu vết quá trình điều chỉnh tỷ lệ
Khi cắt/dán các đối tượng từ hai hay nhiều bức ảnh để được một bức ảnh giảngười ta phải quan tâm tới việc điều chỉnh kích thước, màu sắc của các đối tượngtrên các bức ảnh gốc được cắt ra để cho phù hợp với nhau khi được ghép trên cùngmột bức ảnh
Trang 28CHƯƠNG 2: MỘT SỐ KỸ THUẬT PHÁT HIỆN ẢNH
KỸ THUẬT SỐ GIẢ MẠO2.1 Phát hiện ảnh giả mạo dựa trên thuật toán Exact Match
2.1.1 Ý tưởng
Thuật toán sử dụng các khối bao để đối sánh nhằm tìm ra các vùng giốngnhau trên toàn bộ bức ảnh, một bức ảnh là giả khi xuất hiện hai hay nhiều vùng ảnhgiống nhau Đây là minh chứng cho bức ảnh đã bị cắt dán.[2]
Giả sử một bức ảnh có kích thước M×N, với B là kích thước nhỏ nhất củakhối bao mà người dùng định nghĩa để đối sánh Với mỗi điểm ảnh ta xác định đượcmột khối bao ma trận B×B điểm ảnh Như vậy, với bức ảnh M×N ta xác địnhđược (M - B + 1)×(N - B +1) khối bao Với mỗi khối bao ta lưu các phần tử thuộckhối bao vào một hàng của một ma trận A Vậy duyệt trên toàn bộ bức ảnh ta sẽđược một ma trận A với (M - B + 1)×(N - B +1) hàng và B×B cột.[6]
Hai hàng giống nhau trong ma trận A tương đương với 2 khối bao giốngnhau trong ảnh Chúng ta sắp xếp các hàng trong ma trận A theo thứ tự từ điển, yêucầu này sẽ được thực hiện trên MNlog 2 (MN) bước Sau đó ta dễ dàng tìm kiếm bằngcách duyệt MN hàng của ma trận đã qua sắp xếp A và tìm kiếm hai hàng giống nhauliên tiếp
Kết quả thuật toán sẽ tìm kiếm và đưa ra được tập các vùng bao giống nhau
là bằng chứng chứng minh ảnh đã bị cắt dán
Hình 2.8 Minh họa cho việc tìm kiếm khối bao của thuật toán Extract Match
Trang 292.1.2 Thuật toán
Thuật toán Extract Match nhằm tìm ra các khối bao giống nhau trên cùng mộtảnh, bao gồm các bước sau:
Bước 1: Lựa chọn kích thước khối bao nhỏ nhất.
Bước 2: Xác định tập các khối bao dựa trên kích thước khối bao nhỏ nhất Bước 3: Đưa mỗi khối bao vào một hàng của mảng lưu xác định.
Bước 4: Sắp xếp các hàng trong mảng lưu ở bước 3 theo thứ tự tăng dần Bước 5: Kiểm tra hai hàng liên tiếp trong mảng lưu sau khi đã sắp xếp, nếu
chúng giống nhau thì đưa ra 2 tập khối bao giống nhau tương ứng
Kết quả trong hình minh họa cho thuật toán này Hình 2.9a là ảnh gốc vớimột chiếc trực thăng Hình 2.9b là ảnh giả được tạo từ ảnh gốc với 3 chiếc trựcthăng, trong đó có 2 chiếc được copy mà không thay đổi kích thước và 1 chiếc cóthay đổi kích thước Hình 2.9c là ảnh kết quả phát hiện giả mạo nhờ thuật toánExact Match, kết quả những chiếc trực thăng giả mạo không thay đổi kích thước bịphát hiện
a) Ảnh gốc b) Ảnh giả mạo cắt dán
c) Các vùng giả mạođược phát hiện bởi thuật toán Exact Match
Hình 2.9: Ảnh cắt dán giả mạo và thuật toán phát hiện ảnh giả mạo Exact Match
Trang 302.1.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước
Thuật toán Exact Match trình bày ở trên thường phát hiện khá tốt với các ảnhgiả mạo dạng cắt dán, nhưng không có sự thay đổi về kích thước Trong trường hợpvùng cắt dán có thay đổi về kích thước thì thuật toán không phát hiện được sự giảmạo Thực tế cho thấy, hầu hết các ảnh giả mạo đều được cắt dán nhờ các chươngtrình xử lý ảnh số Một trong những chương trình nổi tiếng đó là PhotoShop Xuấtphát từ thực tế này, chúng tôi nghiên cứu các kỹ thuật được sử dụng trongPhotoShop nhằm thay đổi kích thước khối bao Trên cơ sở đó, đề xuất một cải tiếncho thuật toán Exact match
2.1.3.1 Các kỹ thuật thay đổi kích thước
Việc thay đổi kích thước một vùng ảnh thường sử dụng kỹ thuật nội suytuyến tính xác định để ánh xạ ảnh từ miền không gian này sang miền không giankhác Các kỹ thuật nội suy được sử dụng trong trong PhotoShop là: Láng giềng gầnnhất (Nearest neighbor), nội suy tuyến tính (Bilinear interpolation) và Bicubic
Hình 2.10: Mô hình ánh xạ các điểm ảnh từ ảnh gốc sang ảnh đích [2]
Nearest-neighbor
Kỹ thuật này được diễn tả như sau: với mỗi điểm ảnh từ ảnh gốc sẽ tươngứng với một vị trí phù hợp trong ảnh đích (ảnh đã được thay đổi kích thước) các giátrị màu và tín hiệu của một điểm ảnh trong ảnh mới sẽ được gán bằng giá trị màucủa điểm ảnh gần nhất (láng giềng gần nhất) thuộc ảnh gốc tương ứng
20
Trang 311
1
1 1
y
1
u
(1
v x
1(1
v u
(1
Trang 32I
1
I I
1 5
1 2 3
Chúng ta giả sử rằng các cường độ tại u-1, u, u+1, u+2 lần lượt là I(u-1), I(u),I(u+1), I(u+2) , cường độ tại 0< X <1 sẽ được ước lượng từ phương trình sau:
2.1.3.2 Thuật toán cải tiến Exact Match*
Khi thay đổi kích thước ảnh, PhotoShop thường sử dụng 1 trong các kỹ thuậtnội suy được trình bày ở trên Dựa vào đó ta tìm kiếm các cặp vùng trong ảnh cómối quan hệ tương quan theo một phương pháp nội suy xác định Một vùng đượcgọi là vùng tương quan nếu nó tồn tại ít nhất một vùng và một phép biến đổi,tương ứng khác sao cho:
Trang 33(
B B
1
1
11
B B
a i
f :
Trong đó là hệ số tỷ lệ, và phép ánh xạ theo một phương pháp nội suy xácđịnh là một trong các kỹ thuật nội suy Khi đó cặp vùng ( được gọi là cặptương quan
Giả sử bức ảnh có kích thước M N , là hệ số tỷ lệ xác định, f là phépbiến đổi nội suy tuyến tính xác định và B
định
B là kích thước khối bao nhỏ nhất chỉ
Duyệt toàn bộ bức ảnh theo chiều (left-top) (right-bottom) Với mỗi điểmảnh ta xác định được hai khối bao tương ứng có kích thước lần lượt là B B và
bao quanh nó Vậy khi duyệt trên toàn bộ bức ảnh ta có tất cả
bao có kích thước
Gọi tập hợp các khối bao có kích thước B B là và tập hợp các khối bao
có kích thước là , giả sử và được biểu diễn như sau:
B ) , và
)
b j là khối bao thứ j có kích thước với
Xét tập hợp , ứng với mỗi phần tử khối bao a i có kích thước B B (với
i , m ), ta áp dụng kỹ thuật biến đối nội suy tuyến tính với phép biến đổi f chotrước và một hệ số tỷ lệ đã được định nghĩa ta sẽ được một phần tử khối bao mới
' có kích thước theo công thức sau:
Trang 34a i
1
1 '
Đối sánh lần lượt các khối bao thuộc tập với các khối bao thuộc tập ,nếu tồntại một cặp khối bao (a '
Thuật toán Exact match*
Thuật toán thực hiện các bước sau:
nhỏ nhất B, các tỷ lệ co giãn theo chiều ngang và chiều dọc là p,q và một phương pháp nội suy f.
bao có kích thước tối thiểu B B và một tập hợp các khối bao có kích thước pB
qB trên toàn bộ ảnh.
mới theo phép biến đổi nội suy và các thông số về tỷ lệ co giãn theo chiều ngang vàchiều dọc đã cho trong bước 1