Báo cáo ảnh giả mạo trong VB
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NÔI
KHOA CÔNG NGHỆ THÔNG TIN
Trang 2MỤC LỤC
Lời mở đầu……… 4
Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH……… 7
1.1 Biểu diễn ảnh số………7
1.2 Một số khái niệm cơ sở trong xử lý ảnh……… 8
1.3 Các giai đoạn trong xử lý ảnh……….10
Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO……… 12
2.1 Bài toán phát hiện ảnh giả mạo……….12
2.2 Hướng tiếp cận bài toán……….12
2.2.1 Dựa vào hình dạng……….12
2.2.2 Dựa vào phân tích nguồn sáng………12
2.2.3 Dựa vào biến đổi màu sắc……… 13
2.2.4 Dựa vào cơ sở dữ liệu……….13
2.2.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ……… 14
2.2.6 Dựa vào phân tích ánh sáng………14
Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁCH BIỆT HƯỚNG NGUỒN SÁNG……… 15
3.1 Giới thiệu……….15
3.2 Các loại nguồn sáng……….15
3.3 Ước lượng hướng chiều nguồn sáng………15
3.3.1 Ước lượng hướng chiều của nguồn sáng……… 15
3.3.2 Tìm những đường có khả năng là biên khuất………16
3.3.3 Ước lượng hướng chiều sáng cho từng đường biên tìm được………… 17
Trang 33.5 Nguồn sáng ở vô tận (2-D)……….18
3.6 Nguồn sáng ở gần (bộ phận) (2-D)……….20
3.7 Nhiều nguồn sáng………20
Phần 4: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN THUẬT TOÁN EXACTMATCH……… ………21
4.1 Ý tưởng……….21
4.2 Thuật toán……….22
4.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước……… 22
4.4 Thuật toán cải tiến Exacta match* ……… 24
4.5 Kết luận………26
Tài liệu tham khảo……… 27
Trang 4
LỜI MỞ ĐẦUVới sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật tiên tiếnđược ứng dụng vào thực tế và ảnh số là một trong những thành quả đó Với khả năngcủa các phần mềm biên tập và sử lý ảnh, các bức ảnh có thể dễ dàng bị sửa chữa vàhiệu chỉnh Các chương trình phần mềm có thể thêm vào hay bỏ đi các đặc trưng củaảnh mà không để lại nhiều dấu vết về sự giả mạo
Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau nhưviệc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tộiv.v…
Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau nhưviệc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tộiv.v…
Trang 5có vẻ nhìn gần giống như thật, rất khó nhận biết bằng mắt thường.
- Một bức ảnh khác mô là hình ghép giữa hai bức ảnh khác nhau xuất hiện trongchiến dịch tranh cử tổng thống Mỹ năm 2004, cho thấy ứng viên John Kerry nóichuyện với cựu nữ diễn viên Jane Fonda tại một cuộc biểu tình phản chiến vào nhữngnăm 60 của thế kỷ trước, bên dưới có đóng “nhãn hiệu cầu chứng” là The AssociatedPress
Trang 6Như vậy ảnh hưởng của những thông tin từ những bức ảnh là rất lớn, thông tinhình ảnh luôn có tác động mạnh và trực tiếp tới con người Do vậy ảnh được coi làcông cụ biểu diễn và truyền đạt thông tin rất phổ biến và hữu dụng.
Trang 7Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH
1.1 Biểu diễn ảnh số
Đối với ảnh đơn giản (ảnh đen trắng) thì ảnh được biểu diễn bằng một hàm
ảnh tại điểm này [2,4]
Trong mộ số trường hợp hàm ảnh còn được biểu diễn với một trục thứ 3 gọi làhàm cường độ sáng (với hình 1.1, trục thứ 3 bằng 0)
sáng Một ảnh số được xem như một ma trận với hàng và cột biểu diễn một điểmtrong ảnh và giá trị điểm ma trận tương ứng với mức xám tại điểm đó Các phần tửcủa một dãy số như thế được gọi là các điểm ảnh
,
Con người có khả năng nhận các hình ảnh từ ánh sáng phản xạ qua các vật thể
* P(X,Y)
Trang 8Chúng được gọi gần đúng là sự phát sáng và các thành phần phản xạ, và được
và r(X Y, ) kết hợp với nhau để cho hàm f(X Y, )
Với:
, ,
L l L
min min min
max max max
Sử dụng các giá trị chiếu sáng và phản xạ đã được tổng kết qua thực nghiệm
mức xám thay đổi liên tục từ đen đến trắng
1.2 Một số khái niệm cơ sở trong xử lý ảnh
trình biến đổi ảnh từ tín hiệu liên tục sang tín hiệu rời rạc thông qua việc lấymẫu và lượng tử hóa Trong quá trình này người ta sử dụng khái niệm “pixel”
Trang 9 Ảnh: Là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một mảng hai
chiều I( , )n p có n dòng và p cột, ảnh sẽ có n p (pixel) Ta ký hiệuI( , )X Y để chỉ
Mức xám (Gray level): Đó là kết quả của việc mã hóa, cho tương ứng một
cường độ sáng của mỗi điểm ảnh với một giá trị số, có thể là 16, 32, 64 mức
Biểu diễn ảnh: Trong biểu diễn ảnh người ta thường sử dụng các phần tử đặc
trưng của ảnh là pixel Một hàm hai biến chứa các thông tin như một biểu diễnảnh Một số mô hình thường dùng để biểu diễn ảnh là mô hình toán (biểu diễnảnh nhờ các hàm cơ sở), mô hình thống kê (ảnh coi như một phần tử của mộttập hợp đặc trưng bởi kỳ vọng toán, hiệp biến, phương sai, moment…).[4]
Tăng cường ảnh: Đây là một bước quan trọng bao gồm các kỹ thuật lọc độ
tương phản, khử nhiễu, nổi màu…
Biến đổi ảnh: Thao tác chủ yếu trên một tập các ma trận và sử dụng các kỹ
thuật để biến đổi ảnh qua ma trận: Biến đổi Furie, Sin, Cosin, tích Kronecker
Phân tích ảnh: Liên quan tới việc xác định các độ đo định lượng của một ảnh
để đưa ra một mô tả đầy đủ về ảnh Có những kỹ thuật cơ bản để hỗ trợ phântích ảnh: Dò biên, lọc vi phân, dò theo quy hoạch động, phân vùng ảnh [4]
Nhận dạng ảnh: Quá trình này liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó Nhận dạng ảnh thường đi sau các quá trình trích chọn các đặctrưng chủ yếu của đối tượng.[1,4]
Trang 101.3 Các giai đoạn trong xử lý ảnh
Bài toán xử lý ảnh bao gồm các giai đoạn tổng quát như sau [1,2,4]
Hình 2: Các bước cơ bản trong xử lý ảnh số
Bước đầu tiên là thu nhận ảnh, thu ảnh số bằng bộ cảm biến ảnh với khả năng sốhóa tín hiệu của bộ cảm biến
Sau khi nhận được một ảnh số, bước tiếp theo là tiền xử lý ảnh Mục đích chủyếu của giai đoạn tiền xử lý ảnh là nâng cao khả năng để các quá trình tiếp theo đạtkết quả tốt, như các quá trình khử nhiễu, tăng độ tương phản…
Bước tiếp theo là phân đoạn: Phân đoạn ảnh là tách một ảnh đầu vào thành cácphần hoặc các vật thể
Đầu ra của quá trình phân đoạn ảnh thường là số liệu pixel chưa lọc, bao gồm cảcác liên kết của vùng hoặc tất cả các điểm ảnh trong vùng đó
Cuối cùng, ảnh sẽ được phân lớp, nhận dạng cho các mục đích khác nhau
Trang 11Tri thức về phạm vi vật thể được mã hóa thành một hệ thống xử lý trong ảnhdưới dạng cơ sở dữ liệu kiến thức
Để xử lý các quá trình trên thì cần một hệ thống xử lý ảnh bao gồm một số thànhphần cơ bản sau đây:[4]
Hình 3: Các thành phần cơ bản của một hệ xử lý ảnh
- Chọn Camera thích hợp nếu có nhiều Camera
- Chọn màn hình hiển thị tín hiệu
- Thu nhận tín hiệu video bởi bộ số hóa Thực hiện lấy mẫu và mã hóa
- Tiền xử lý ảnh khi thu nhận
đặc trưng, nhị phân hóa ảnh
Trang 12 Máy chủ đóng vai trò điều khiển các thành phần khác
chuyển giao cho các quá trình có nhu cầu
Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO
2.1 Bài toán phát hiện ảnh giả mạo
Ảnh giả mạo được chia làm 2 loại:
Thứ nhất, đó là ảnh giả mạo nhưng thật, được dàn dựng một cách có ý đồ sau đóthu nhận ảnh và không thực hiện thao tác chỉnh sửa trực tiếp trên ảnh thu nhận được Thứ hai, ảnh giả mạo được tạo ra từ việc có tác động lên ảnh nhằm thay đổi nộidung và bản chất bức ảnh dựa trên các kỹ thuật xử lý ảnh (cắt, dán, ghép, thêm, bớt,chỉnh sửa)
Trong đề tài nghiên cứu này chỉ quan tâm xác định những bức ảnh giả mạothuộc loại thứ 2
2.2 Hướng tiếp cận bài toán
2.2.1 Dựa vào hình dạng
Việc phân tích để xác định tính giả mạo có thể dựa vào hình dạng vì việc cắt dán
và ghép ảnh thường được thực hiện dựa theo các đường biên, nơi có sự thay đổikhông liên tục của cường độ sáng của các điểm ảnh
2.2.2 Dựa vào phân tích nguồn sáng
Việc ghép các ảnh khác nhau hoặc bổ sung thêm đối tượng không phải thực hiệnthao tác copy có thể được thực hiện bằng việc phân tích nguồn sáng đối với từng đốitượng, các đối tượng được ghép thường có hướng của nguồn sáng không cùng vớicác đối tượng trong ảnh gốc
Trang 132.2.3 Dựa vào biến đổi màu sắc
Ảnh gốc thu nhận thường được thực hiện bởi một thiết bị Do tính chất biến đổicủa ống kính bao gồm góc độ chụp, độ mở v.v nên ảnh thu được thường bị biếndạng theo các tính chất đặc trưng của các nhà sản xuất Phần ảnh được ghép vào hay
bổ sung thường không có sự biến đổi tương đồng về độ sáng
2.2.4 Dựa vào cơ sở dữ liệu
Việc giả mạo ảnh thường dựa vào các ảnh đã có, tức là các ảnh đã được xuất bảnbởi một nơi nào đó như: Báo chí, trang Web, tạp chí v.v Các ảnh này đã được lưutrữ nên khi xuất hiện một ảnh nghi là giả mạo người ta có thể tìm ảnh này với cácphần trong nguồn ảnh nằm trong cơ sở dữ liệu ảnh
Hình 7: Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu
Trang 142.2.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ
Khi cắt ghép các đối tượng từ hai hay nhiều bức ảnh để được một bức ảnh giảngười ta phải quan tâm tới việc điều chỉnh kích thước, màu sắc của các đối tượng trêncác bức ảnh gốc được cắt ra để cho phù hợp với nhau khi được ghép trên cùng mộtbức ảnh
2.2.6 Dựa vào phân tích ánh sáng
Qua phân tích sự đồng đều của ánh sáng phân bố trên các phần khác nhau củabức ảnh có thể thực hiện bằng hai cách Cách thứ nhất là phân tích bóng đổ để tìm rahướng của nguồn sáng
Trang 15Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁC BIỆT HƯỚNG NGUỒN SÁNG
Vấn đề ước lượng hướng nguồn sáng là một lĩnh vực nghiên cứu lớn của thịgiác máy tính Trong phần này sẽ mô tả bài toán, đề xuất giải pháp và sau đó sẽ trìnhbày cách thức để loại bỏ các yếu tố ngoại cảnh, làm đơn giản hóa các điều kiện để
3.3.1 Ước lượng hướng chiếu của nguồn sáng
Phần này trình bày thuật toán ước lượng tự động hướng chiếu của nguồn sángđối với một ảnh đơn Thuật toán gồm ba bước Đầu tiên tìm ra những đường có khảnăng là biên khuất với xác suất cao nhất Sau đó với mỗi đường biên khuất chúng ta
sẽ ước lượng véc-tơ chỉ hướng chiếu của nguồn sáng theo mô hình bóng đổ Cuốicùng các ước lượng đó được đưa vào mô hình mạng Bayet để tìm một ước lượngthích hợp nhất cho hướng chiếu của nguồn sáng Điều kiện là đối tượng phải có bềmặt Lambertian, đồng thời toàn bộ bề mặt có hệ số phản chiếu là hằng số
Trang 163.3.2 Tìm những đường có khả năng là biên khuất
Nhiệm vụ của bước này là tìm ra những đường có khả năng là biên khuất Cóthể không tìm ra chính xác biên khuất nhưng cũng phải đưa ra những đường đủ tốtcho bước tiếp theo
Thuật toán phát hiện cạnh Canny gồm 6 bước như sau:
Bước 1: Bước đầu tiên trong thuật toán phát hiện cạnh Canny là khử nhiễu và
làm phẳng ảnh ban đầu trước khi cố gắng xác định và định vị bất kỳ một cạnh nào đó
Bước 2: Sau khi làm phẳng và khử nhiễu ảnh, bước tiếp theo là phải tìm ra độ
dài của cạnh bằng việc lấy hướng của ảnh
Bước 3: Tìm hướng của cạnh Một khi chúng ta đã biết hướng của cạnh theo
trục x và trục y thì hướng của cạnh sẽ dễ dàng tính được
Bước 4: Khi hướng của cạnh được tìm ra, bước tiếp theo là liên kết hướng đó
với một mà có thể lần ra ảnh
Bước 5: Sau khi đã biết hướng cạnh thuật toán tiếp tục như sau: đi dọc cạnh
theo hướng cạnh, nếu gặp bất kỳ điểm ảnh nào mà không liên quan đến cạnh thì khửđiểm ảnh đó đi (tức là cho giá trị điểm ảnh bằng 0) Việc này sẽ cho chúng ta mộtđường mảnh ở ảnh kết quả
Bước 6: Cuối cùng là khử sự tạo thành vạch Sự tạo thành vạch sẽ phá vỡ cạnh,
gây ra do sự dao động giữa ngưỡng trên và ngưỡng dưới
Đó là thuật toán phát hiện cạnh Canny Sau khi đã trích ra được các cạnh,chúng ta sẽ nhóm các cạnh đó thành chuỗi theo luật sau:
Vùng tiếp theo cạnh sẽ đồng màu
Màu sẽ giống với màu của cạnh kế trước trong chuỗi
Vùng tiếp theo cạnh không chứa cạnh khác
Trong chuỗi không tạo nên những chỗ gấp khúc
Trang 173.3.3 Ước lượng hướng chiếu sáng cho từng đường biên tìm được
Sau khi tìm ra các đường biên khuất (có khả năng là biên khuất) chúng sử dụng
mô hình bóng đổ cho các đường biên này để tìm ra hướng chiếu sáng cho từng đườngbiên
Đo cường độ sáng trên biên khuất
Theo cách trên muốn ước lượng được hướng chiếu của nguồn sáng chúng ta cầnphải có cường độ sáng trên biên khuất Tất nhiên điều này là không thể, chúng takhông thể đo trực tiếp cường độ sáng trên biên khuất, mà phải ngoại suy từ các điểm
ở xa biên
3.3.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất
Sau bước 2 chúng ta có một tập hợp các ước lượng và hiệp phương sai của n
chuỗi cạnh mà có thể hoặc không là biên khuất Để có thể tìm ra biên khuất chính xác
từ tập hợp n chuỗi đó ta cần chú ý một điều là đối với đường biên khuất chính xác,
nói chung sẽ có hiệp phương sai nhỏ hơn và phù hợp với mô hình hơn là nhữngđường không chính xác
+ Bề mặt được chiếu bởi nguồn sáng điểm ở xa vô hạn
+ Góc giữa bề mặt và hướng của nguồn sáng trong khoảng từ 0 đến 90 độ
Trang 18Với:
+ R là hằng số phản xạ
+ là véctơ 3 chiều chỉ hướng của nguồn sáng
+A là hằng số giới hạn ánh sáng xung quanh
chỉ cần dựa trên một bức ảnh duy nhất Thành phần z của bề mặt chuẩn được giả định
ước lượng một cách trực tiếp từ ảnh (hình 12b)
Trang 19Hình 12: Mô hình minh họa cho: Nguồn sáng vô tận (3-D), Nguồn sáng vô tận
(2-D), và nguồn sáng cục bộ (2-D) Trong trường hợp 2-D, thành phần z của bề mặt bằng 0 Không giống trường hợp nguồn sáng vô tận, hướng của nguồn sáng ( biến đổi từ bên này qua bên kia của bề mặt hình cầu
Trang 20 Đơn giản hóa những giả định về hằng số độ tương phản
Thay vì coi toàn bộ bề mặt của đối tượng có cùng hằng số độ tương phản, mỗi phầncủa bề mặt có độ tương phản là hằng số Ta sẽ ước lượng hướng của nguồn sáng bộphận( ) từ việc xem xét từng phần của bề mặt đối tượng
Trang 213.7 Nhiều nguồn sáng
Trong những phần trên ta giả định rằng chỉ có ánh sáng phát ra từ một nguồnsáng duy nhất chiếu lên vật thể và các nguồn sáng khác coi không đáng kể và đượcxem xét với hằng số giới hạn ánh sáng xung quanh (A), điều này thường phù hợp vớiánh sáng ngoài trời Nhưng xảy ra trường hợp đối tượng được chiếu rọi bởi nhiềunguồn sáng
Ánh sáng có thuộc tính rất đặc biệt đó là tuyến tính Giả sử có 2 nguồn sángchiếu lên đối tượng, khi đó hàm mật độ ảnh có dạng:
Phần 4: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN THUẬT TOÁN EXACT MATCH
4.1 Ý tưởng
nhất của khối bao mà người dùng định nghĩa để đối sánh với mỗi
bao Với mỗi khối bao ta lưu các phần tử thuộc khối bao vào mộthàng của một ma trận A Vậy duyệt trên toàn bộ bức ảnh ta sẽ được
Trang 22Hai hàng giống nhau trong ma trận A tương đương với 2 khốibao giống nhau trong ảnh Chúng ta sắp xếp các hàng trong matrận A theo thứ tự từ điển, yêu cầu này sẽ được thực hiện trên
) (
hàng của ma trận đã qua sắp xếp A và tìm kiếm hai hàng giốngnhau liên tiếp
Kết quả thuật toán sẽ tìm kiếm và đưa ra được tập các vùngbao giống nhau là bằng chứng chứng minh ảnh đã bị cắt dán
Hình 2 Minh họa cho việc tìm kiếm khối bao của thuật toán Extract macth
4.2 Thuật toán
Thuật toán Extract match nhằm tìm ra các khối bao giống nhautrên cùng một ảnh, bao gồm các bước sau:
Bước 1: Lựa chọn kích thước khối bao nhỏ nhất
Bước 2: Xác định tập các khối bao dựa trên kích thước khối bao nhỏ nhất
Bước 3: Đưa mỗi khối bao vào một hàng của mảng lưu xác định
Bước 4: Sắp xếp các hàng trong mảng lưu ở bước 3 theo thứ tự tăng dần
Bước 5: Kiểm tra hai hàng liên tiếp trong mảng lưu sau khi đã sắp xếp,
nếu chúng giống nhau thì đưa ra 2 tập khối bao giống nhau tươngứng
4.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước
Trang 23về kích thước Trong trường hợp vùng cắt dán có thay đổi về kíchthước thì thuật toán không phát hiện được sự giả mạo.
٭ Các kỹ thuật thay đổi kích thước
Việc thay đổi kích thước một vùng ảnh thường sử dụng kỹ thuậtnội suy tuyến tính xác định để ánh xạ ảnh từ miền không gian nàysang miền không gian khác Các kỹ thuật nội suy được sử dụngtrong trong PhotoShop là: Láng giềng gần nhất (nearest neighbor),nội suy tuyến tính (bilinear interpolation) và Bicubic
Bilinear interpolation
Đây là phương pháp phức tạp hơn nearest neighbor Phương pháp này xác địnhgiá trị của một điểm ảnh mới dựa trên trung bình trọng số của 4 điểm ảnh láng giềnggần nhất 2x-2 của điểm ảnh thuộc ảnh gốc
Chúng ta miêu tả chi tiết phương pháp nội suy bilinear như sau: Giả sử với mỗiđiểm (x,y) thuộc ảnh gốc ta xác định được các giá trị ánh xạ tương ứng (X,Y) thuộcảnh đích theo phép biến đổi sau: