Phát triển kỹ thuật thủy vân dựa trên đặc trưng độ nổi bật của ảnh sốnhằm tận dụng các đặc trưng thị giác để nhúng thông tin vào các vùng ítthu hút sự chú ý trong ảnh, giúp thông tin thủ
Trang 1VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
Trang 2Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Người hướng dẫn khoa học:
Người hướng dẫn 1: PGS.TS Tạ Minh Thanh, Học viện Kỹ thuận quân sự Người hướng dẫn 2: TS Đào Nam Anh, Trường đại học Điện lực
Phản biện 1: PGS.TS Phản biện 2: PGS.TS Phản biện 3: PGS.TS
Luận án được bảo vệ trước Hội đồng đánh giá luận án tiến sĩ cấp Học viện họp tại Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam vào hồi giờ , ngày tháng năm 2024
Có thể tìm hiểu luận án tại: 1 Thư viện Học viện Khoa học và Công nghệ 2 Thư viện Quốc gia Việt Nam
Trang 31 Đặt vấn đề
Trong thời đại kỹ thuật số hiện nay, việc bảo vệ bản quyền ảnh số trở nêncực kỳ quan trọng và phức tạp do sự phổ biến của Internet và thiết bị diđộng, tạo ra thách thức lớn trong bảo vệ quyền sở hữu trí tuệ Ảnh số khôngchỉ được dùng trong nghệ thuật và giải trí mà còn trong quảng cáo, truyềnthông, giáo dục và nghiên cứu khoa học Việc sao chép và phân phối ảnhsố mà không có sự cho phép của chủ sở hữu diễn ra dễ dàng, gây thiệt hạitài chính cho tác giả và nhà xuất bản, ảnh hưởng đến tính sáng tạo và đổimới Sử dụng hình ảnh không được phép còn dẫn đến các vấn đề pháp lýphức tạp và tranh chấp quyền lợi
2 Mục tiêu của luận án
Mục tiêu của luận án là phát triển và cải tiến các kỹ thuật thủy vân số dựatrên các đặc trưng nổi bật của ảnh kỹ thuật số nhằm bảo vệ bản quyền vàquản lý tài sản số Cụ thể, các mục tiêu chính bao gồm:
i Phát triển kỹ thuật thủy vân dựa trên các vùng không nổi bật để nhúngthông tin vào ảnh mà không làm giảm chất lượng thị giác
ii Áp dụng máy học và các mô hình phát hiện sự nổi bật để chọn vùngnhúng thủy vân một cách chính xác
iii Cải thiện phương pháp nhúng dữ liệu vào ảnh JPEG, sử dụng bảnglượng tử hóa để tăng khả năng chứa thông tin
iv Phát triển các kỹ thuật thủy vân đảm bảo tính đảo ngược, cho phépphục hồi hoàn toàn ảnh gốc sau khi trích xuất thủy vân
v Đánh giá hiệu quả của các phương pháp thủy vân trong các điều kiệnthử nghiệm thực tế, bao gồm độ bền vững và tính toàn vẹn của thủy vân.Những mục tiêu này được xây dựng nhằm nâng cao hiệu quả và tính ứngdụng của các phương pháp thủy vân trong các môi trường kỹ thuật số phứctạp
3 Các đóng góp mới của luận án
Luận án có 02 đóng góp chính sau đây:i Phát triển kỹ thuật thủy vân dựa trên đặc trưng độ nổi bật của ảnh sốnhằm tận dụng các đặc trưng thị giác để nhúng thông tin vào các vùng ítthu hút sự chú ý trong ảnh, giúp thông tin thủy vân khó bị phát hiện bằng
Trang 4mắt thường mà không làm giảm chất lượng thị giác của ảnh; cải thiện khảnăng chống lại các tấn công phổ biến như cắt, xoay và nén ảnh, đảm bảotính bền vững của thông tin thủy vân trong các điều kiện xử lý khác nhau.ii Phát triển kỹ thuật thủy vân thuận nghịch đảm bảo tính toàn vẹn củaảnh gốc, đảm bảo không có sự thay đổi nào về chất lượng hình ảnh banđầu; cho phép nhúng một lượng lớn dữ liệu mà không làm giảm đáng kểchất lượng thị giác của ảnh, mở rộng khả năng ứng dụng trong các lĩnh vựcđòi hỏi bảo mật cao.
4 Bố cục của luận án
Luận án được chia thành 3 chương chính:• Chương 1: Tổng quan nghiên cứu và một số kiến thức nền tảng• Chương 2: Phân tích ảnh hưởng độ nổi bật của ảnh trong thủy vân số• Chương 3: Phát triển kỹ thuật thủy vân đảm bảo tính toàn vẹn của ảnh
gốc
Trang 5CHƯƠNG 1 TỔNG QUAN NGHIÊN CỨU VÀ CÁC
KIẾN THỨC NỀN TẢNG
1.1 Giới thiệu
1.1.1 Nguồn gốc và khái niệm về thủy vân sốThủy vân số (Digital Watermarking) là kỹ thuật nhúng thông tin vào cácdữ liệu số như hình ảnh, âm thanh, video nhằm mục đích bảo vệ bản quyền,xác thực nguồn gốc hoặc kiểm soát việc sao chép dữ liệu Thuật ngữ "thủy vân"xuất phát từ dấu hiệu trên giấy chỉ xuất hiện khi ngâm nước, nhưng trong bốicảnh số, nó ám chỉ việc nhúng thông tin vào dữ liệu số một cách tinh vi và khónhận biết Thủy vân số bắt đầu được nghiên cứu và phát triển mạnh mẽ từnhững năm 1990, đóng vai trò quan trọng trong việc bảo vệ bản quyền và chốnglại các hành vi vi phạm bản quyền trên các phương tiện truyền thông kỹ thuậtsố
1.1.2 Phân loại thủy vân số
Hình 1.1: Phân loại thủy vân sốHình vẽ dựa theo tài liệu của Kumar [15] trong hình 1.1 cung cấp cái nhìn
Trang 6tổng quan về tiến triển gần đây trong lĩnh vực thủy vân số, bao gồm cả phânloại theo miền thực hiện, môi trường chứa và cảm nhận của con người.
1.1.3 Quy trình xây dựng mô hình thủy vân sốThủy vân số được tạo từ hình ảnh hoặc văn bản, thường được mã hóahoặc chuyển đổi trước khi nhúng vào dữ liệu chứa như hình ảnh, âm thanh, hoặcvideo Quá trình nhúng sử dụng khóa thủy vân và bộ công cụ nhúng để tạo radữ liệu bền vững trước nhiễu và tấn công Quá trình trích xuất thủy vân sửdụng bộ trích xuất và khóa từ quá trình nhúng, sản xuất thủy vân có thể giốnghoặc khác ban đầu Có hai loại trích xuất: mù (không cần ảnh gốc) và khôngmù (cần ảnh gốc)
1.1.4 Các đặc trưng của thủy vân sốĐặc trưng của thủy vân số bao gồm các yếu tố chính như tính bền vững,tính vô hình, và tính dễ hỏng Tính bền vững liên quan đến khả năng của thủyvân chống lại các tác động biến đổi như nén, cắt xén, hoặc lọc thông qua quátrình xử lý ảnh Tính vô hình là khả năng thủy vân không làm ảnh hưởng đếnchất lượng thị giác của ảnh, tức là người dùng không thể nhận ra sự hiện diệncủa thủy vân bằng mắt thường Tính dễ hỏng được yêu cầu trong một số ứngdụng đặc thù, nơi mà thủy vân cần bị phá hủy nếu có bất kỳ thay đổi trái phépnào xảy ra đối với dữ liệu Các đặc trưng này đóng vai trò quan trọng trongviệc đảm bảo an toàn, bảo mật, và tính nguyên vẹn của thông tin trong các ứngdụng liên quan đến bảo vệ bản quyền và an ninh dữ liệu số
1.1.5 Các tiêu chí đánh giá thủy vân sốKhi đánh giá chất lượng thuật toán thủy vân ảnh số, cần xem xét các tiêuchí quan trọng sau:
1 Tính bí mật: Đánh giá mức độ "vô hình" của thủy vân trên ảnh, đảm bảobảo vệ tính bí mật của thủy vân Tuy nhiên, trong một số trường hợp nhưxác thực nguồn gốc sản phẩm, việc tiết lộ thủy vân có thể cần thiết.2 Tính toàn vẹn: Khả năng chống giả mạo thủy vân, yếu tố quan trọng để
bảo vệ bản quyền và công nhận pháp lý của sản phẩm
Trang 73 Tính bền vững: Thủy vân cần chịu được cả các tấn công có chủ đích vàkhông có chủ đích, bao gồm nén, lấy mẫu, lọc và các biến đổi khác.
4 Dung lượng: Đánh giá khả năng lưu trữ và quản lý dữ liệu thủy vân, quantrọng cho việc sử dụng và bảo mật dữ liệu thủy vân số
Việc cân nhắc giữa chất lượng (tính bí mật, tính toàn vẹn, và tính bềnvững) và dung lượng là thiết yếu để tạo ra các giải pháp thủy vân hiệu quả
1.1.6 Các ứng dụng của thủy vân sốThủy vân số là công cụ quan trọng trong bảo vệ quyền sở hữu trí tuệ vàquản lý quyền tác giả của ảnh số [7] Nó không chỉ đảm bảo quyền tác giả vàngăn chặn phân phối không phép, mà còn quan trọng trong xác minh thông tinvà phát hiện sự xuyên tạc [75] Thủy vân số cũng được ứng dụng trong xác thựcngười dùng [43] và hỗ trợ điều khiển truy cập trong hệ thống quản lý thông tin[69]
1.1.7 Những tình huống tấn công thủy vân số thường gặpTrong bối cảnh hiện đại, thủy vân số đang trở thành công cụ bảo mậtthông tin quan trọng Tuy nhiên, hệ thống thủy vân số cũng phải đối mặt vớicác thách thức từ những tình huống tấn công ngày càng phức tạp [70] Các tấncông phổ biến bao gồm:
1 Tấn công đơn giản: Gây hại cho thủy vân bằng cách thay đổi ngẫu nhiênpixel mà không cần xác định thủy vân cụ thể Mục tiêu là làm hỏng thủyvân mà không cần phục hồi thông tin từ nó
2 Tấn công phát hiện: Nhằm phá vỡ mối quan hệ giữa dữ liệu và thủy vânbằng cách áp dụng các biến đổi phức tạp như phóng to, thu nhỏ, xoay, cắtxén, xóa hoặc chèn thêm pixel
3 Tấn công gây nhầm lẫn: Tạo ra dữ liệu giả mạo hoặc thủy vân giả mạođể gây nhầm lẫn, làm mất đi tính xác định và đáng tin cậy của thủy vângốc
4 Tấn công loại bỏ: Cố gắng tách dữ liệu đã nhúng thủy vân ra khỏi dữ liệugốc và thủy vân để truy cập thông tin quan trọng
Trang 81.2 Tổng quan về các nghiên cứu liên quan và một số hạnchế còn tồn tại
1.2.1 Độ nổi bật trong ảnhĐộ nổi bật trong ảnh là một khái niệm quan trọng trong lĩnh vực xử lýảnh số, liên quan đến việc xác định các vùng trong ảnh mà con người dễ dàngnhận biết và chú ý đến Các mô hình độ nổi bật được phát triển nhằm tái tạokhả năng nhận biết này của con người, phục vụ cho nhiều ứng dụng khác nhaunhư nhận diện đối tượng, tìm kiếm thông tin trong ảnh, và đặc biệt là trong kỹthuật thủy vân số để nhúng thông tin vào những vùng ít gây chú ý hơn, giúpbảo vệ tính toàn vẹn và bảo mật thông tin
1.2.2 Thủy vân thuận nghịchThủy vân thuận nghịch là kỹ thuật cho phép nhúng thông tin vào ảnh sốmà sau khi trích xuất thông tin, ảnh gốc có thể được phục hồi hoàn toàn màkhông có sự thay đổi nào Kỹ thuật này thường được sử dụng trong các ứngdụng yêu cầu bảo toàn nguyên vẹn của dữ liệu, đặc biệt quan trọng trong cáclĩnh vực như y tế và pháp lý, nơi mà chất lượng và độ tin cậy của hình ảnh làyếu tố then chốt
Trang 9CHƯƠNG 2 PHÂN TÍCH ẢNH HƯỞNG ĐỘ NỔI
BẬT CỦA ẢNH TRONG THỦY VÂN SỐ
2.1 Giới thiệu
Trong chương 2, luận án tập trung vào việc sử dụng các mô hình độ nổibật của ảnh để cải thiện tính bảo mật của thủy vân số Phương pháp chính đượcđề xuất là sử dụng các vùng không nổi bật của ảnh để nhúng thông tin thủyvân Việc này giúp tăng cường độ khó phát hiện và bảo mật thông tin nhúng
2.2 Thủy vân dựa trên đặc trưng không nổi bật của ảnhsố
2.2.1 Phương pháp dựa trên học vùng không nổi bậtPhần này của luận án giới thiệu một phương pháp thủy vân số mới, dựavào việc phát hiện độ nổi bật và lựa chọn vùng con cụ thể trong ảnh màu để ẩnthông điệp Quy trình bao gồm việc đánh giá bản đồ nổi bật của ảnh và xác địnhvùng con phù hợp để nhúng thông điệp mà không ảnh hưởng đến chất lượngảnh gốc Thông tin và tham số liên quan đến quá trình nhúng được coi là khóabí mật, được trao đổi qua kênh an toàn giữa người gửi và người nhận Ảnh đãnhúng thủy vân sau đó được gửi qua kênh công cộng Người nhận sử dụng môhình phát hiện độ nổi bật tương tự để phân tích và trích xuất thông điệp m từảnh Mục tiêu là khôi phục chính xác thông điệp mà không làm mất thông tingốc của ảnh
2.2.1.1 Đặc trưng nổi bậtMục này giới thiệu một phương pháp thủy vân số dựa trên tính nổi bậthình ảnh, sử dụng vùng con không nổi bật để ẩn thông điệp mà không bị pháthiện dễ dàng Bằng cách so sánh độ nổi bật của điểm ảnh với ngưỡng nhất định,tạo ra bản đồ nổi bật và xác định vùng con phù hợp để nhúng thông điệp Thôngđiệp được mã hóa vào ảnh tại vùng đã chọn, và người nhận sử dụng quy trình
Trang 10Hình 2.2: Phương pháp nhúng thủy vân cho ảnh I trong quá trình truyềnthông giữa người gửi (Alice) và người nhận (Bob) bằng cách sử dụng các đặc
trưng nổi bật với một kênh bảo mật để trao đổi các khóa riêng tư R, S
Hình 2.4: Các vị trí biến đổi của vùng con trong ảnh, bao phủ 14 diện tích của
ảnhtương tự để giải mã thông điệp từ ảnh chứa thủy vân Phương pháp này nhấnmạnh việc sử dụng các vùng không nổi bật, tăng cường bảo mật và chính xáctrong việc nhúng và trích xuất thông điệp thủy vân
2.2.1.2 Xác thực thủy vân sốMục này của luận án tập trung vào xác thực thủy vân số, sử dụng phươngpháp Bayesian [5] để đánh giá khả năng chọn vùng con dựa trên đặc trưng nổibật Quá trình này bao gồm việc so sánh vùng con r và u, với mục đích là r = uđể đảm bảo thông điệp được nhúng có thể được phát hiện và giải mã đúng cách.Công thức (2.12) và (2.13) được sử dụng để mô tả mối quan hệ giữa các biến.Luận án cũng đề cập đến việc sử dụng máy vector hỗ trợ (SVM) để ước lượngxác suất và tối ưu hóa mô hình độ nổi bật qua hàm hợp lý Cuối cùng, khả năngchính xác của việc xác định vị trí vùng con phù hợp để giải mã thông điệp đượcxem xét, cho thấy quan hệ giữa đặc trưng sự nổi bật s và e sau khi nhúng thủyvân
Trang 11Hình 2.6: Vídụ về việc nhúng thủy vân bằng các mô hình độ nổi bật khác nhau
r∈{0,1,2,3},e∈[0,1],u∈{0,1,2,3}
2.2.2 Kết quả thử nghiệmLuận án nghiên cứu việc sử dụng các đặc điểm không nổi bật trong hìnhảnh để cải thiện hiệu quả của thủy vân số Sử dụng các mô hình như hiệpphương sai vùng (saliency using region covariance) bởi [23], độ nổi bật thưa thớt(sparse saliency) bởi [29], độ nổi bật hiếm gặp (rare saliency)bởi [67] và độ nổibật phổ tần số (spectral residual saliency) bởi [30], quá trình đào tạo SVM đượcthực hiện để xác định vùng nhúng thủy vân Sự khác biệt giữa hình ảnh gốc vàhình ảnh đã nhúng thủy vân được đánh giá qua các chỉ số như precision, recall,F-measure [11], MSE [63], SAD [100], SSIM và PSNR [72] Kết quả cho thấy sựhiệu quả và độ ổn định của thủy vân số với các mô hình Highlighting và Raređạt điểm số tốt nhất
2.3 Thủy vân dựa trên đặc trưng độ nổi bật của ảnh số
Luận án này khám phá việc sử dụng đặc điểm độ nổi bật trong ảnh số đểnhúng thủy vân, một kỹ thuật bảo vệ bản quyền hiệu quả mà không làm mất
Trang 12Mô hình độ nổi bật Precision Recall Fmeasure rMSECovariance [70] 0.8895 0.9947 0.9391 0.9638Highlighting [71] 0.9266 0.9959 0.9573 0.9652Spectral [72] 0.9154 0.9944 0.9505 0.9655
Rare [73] 0.9189 0.9965 0.9510 0.9651Bảng 2.1: Tính vô hình của thủy vân dựa trên đặc trưng không nổi bật (Các
điểm số in đậm là tốt nhất, các điểm số in nghiêng là thứ hai)
thông tin gốc Phương pháp này chọn các vùng con không nổi bật của ảnh đểẩn thông điệp, nhằm giảm thiểu khả năng bị phát hiện Thông qua việc đánhgiá bản đồ nổi bật và xác định vùng con thích hợp, thông điệp được mã hóamột cách an toàn Các khu vực được chọn dựa trên mức độ nổi bật so với mộtngưỡng cố định, và quá trình nhúng thông tin đòi hỏi sự trao đổi khóa bí mậtgiữa người gửi và người nhận Công trình này cũng áp dụng học máy để tối ưuhóa việc chọn lựa vùng không nổi bật, tăng cường tính bảo mật và hiệu quả củathủy vân Kết quả thử nghiệm cho thấy phương pháp này đạt được độ mạnhmẽ cao và khả năng phục hồi tốt, mở ra hướng mới cho ứng dụng thủy vân sốtrong việc bảo vệ bản quyền và chống giả mạo
2.3.1 Phương pháp dựa trên độ nổi bật để chống giả mạoLuận án này giới thiệu một phương pháp thủy vân ảnh mới, SaliencyGuided Watermarking (SGW), nhấn mạnh việc sử dụng đặc trưng độ nổi bậtđể nhúng thông tin nhằm mục đích chống giả mạo Phương pháp này áp dụngcác kỹ thuật toán học để xác định vùng nhúng thủy vân trong ảnh, dựa vào độnổi bật để tạo ra khóa bí mật và sau đó sử dụng khóa này trong quá trình mãhóa và giải mã Điều này bao gồm việc chọn các vùng con không nổi bật củaảnh để nhúng thủy vân, với mục tiêu giữ cho thủy vân không thể bị phát hiệnmột cách dễ dàng
Quá trình mã hóa và giải mã được minh họa qua các công thức toán học,cho phép nhúng và trích xuất thông tin thủy vân một cách chính xác Đặc biệt,luận án khám phá việc sử dụng đặc trưng độ nổi bật từ nhiều mô hình khácnhau để tối ưu hóa quá trình nhúng và giải mã Các phép đo lường độ nổi bậtđược sử dụng để xác định vùng con thích hợp nhất cho việc nhúng thủy vân, vớisự giúp đỡ của máy vector hỗ trợ (SVM) trong việc xác định vùng có sự thayđổi đặc trưng độ nổi bật ít nhất khi nhúng thủy vân
Hình ảnh gốc và ảnh đã mã hóa được phân tích để đảm bảo rằng thông
Trang 13tin thủy vân có thể được giải mã chính xác, ngay cả khi ảnh bị tấn công hoặcbiến đổi Mục tiêu cuối cùng là đạt được một giải pháp thủy vân mạnh mẽ, cókhả năng chống giả mạo hiệu quả, đồng thời đảm bảo tính bảo mật cao và khảnăng phục hồi thông tin gốc.
2.3.2 Kết quả thực nghiệmPhần này của luận án giới thiệu và thử nghiệm một phương pháp mớiđể thủy vân ảnh dựa trên đặc điểm độ nổi bật, nhằm mục đích chống giả mạo.Phương pháp này, áp dụng trên bộ dữ liệu MSRA10K, tập trung vào việc sửdụng các vùng không nổi bật của ảnh để nhúng thông tin Các thí nghiệm sosánh hiệu suất của bốn mô hình độ nổi bật khác nhau và sử dụng máy vectorhỗ trợ (SVM) để sinh ra các kernel, đồng thời đánh giá sự ổn định của thủy vântrước nhiều loại tấn công khác nhau như xoay, nhiễu, cân bằng histogram, lọctrung vị và cắt ảnh
Kết quả thử nghiệm cho thấy phương pháp thủy vân này đạt được tínhvô hình cao và duy trì được độ ổn định sau các cuộc tấn công, nhờ vào việc lựachọn cẩn thận các vùng con dựa trên đặc điểm độ nổi bật Mô hình độ nổi bậtvà quá trình nhúng thông điệp được mô tả chi tiết qua các công thức toán học,cung cấp một cách tiếp cận đa vùng con để tối ưu hóa quá trình nhúng thôngtin Các hạt nhân học được hình thành thông qua quá trình đào tạo SVM, giúpxác định vùng con thích hợp nhất cho việc nhúng thủy vân mà không làm thayđổi đặc điểm nổi bật của ảnh gốc
Luận án cũng đề cập đến độ phức tạp tính toán của phương pháp, chỉ rarằng nó có độ phức tạp tuyến tính với kích thước của ảnh và vùng con đượcchọn Điều này chứng minh được khả năng áp dụng hiệu quả phương pháp chocác tác vụ nhúng và trích xuất thủy vân trong thực tế, đồng thời duy trì tínhbảo mật cao và khả năng phục hồi sau tấn công
2.4 Kết luận
Luận án này phát triển một phương pháp thủy vân số mới, tập trung vàoviệc tìm kiếm và sử dụng các khu vực không nổi bật trong ảnh để nhúng thôngtin, nhằm tăng cường tính vô hình của thủy vân Sự kết hợp của việc học máyvới SVM cho phép lựa chọn chính xác các vùng con không nổi bật cho quá trìnhmã hóa và giải mã, trong khi độ bền vững của phương pháp học đảm bảo khả