ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THANH TUẤN NÂNG CAO HIỆU QUẢ KỸ THUẬT WATERMARKING THIẾU THÔNG TIN TIÊN NGHIỆM CHO ẢNH Y TẾ VÀ ẢNH ĐA KÊNH LUẬN ÁN TIẾN SĨ TP HỒ CHÍ MINH - NĂM 2023 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THANH TUẤN NÂNG CAO HIỆU QUẢ KỸ THUẬT WATERMARKING THIẾU THÔNG TIN TIÊN NGHIỆM CHO ẢNH Y TẾ VÀ ẢNH ĐA KÊNH IMPROVING THE EFFECTIVENESS OF BLIND WATERMARKING TECHNIQUES FOR MEDICAL IMAGES AND MULTI-CHANNEL IMAGES LUẬN ÁN TIẾN SĨ TP HỒ CHÍ MINH - NĂM 2023 ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THANH TUẤN NÂNG CAO HIỆU QUẢ KỸ THUẬT WATERMARKING THIẾU THÔNG TIN TIÊN NGHIỆM CHO ẢNH Y TẾ VÀ ẢNH ĐA KÊNH Chuyên ngành: Kỹ thuật viễn thông Mã số chuyên ngành: 62520208 Phản biện độc lập: PGS TS Trần Công Hùng Phản biện độc lập: PGS TS Nguyễn Thanh Hải Phản biện: PGS TS Huỳnh Trung Hiếu Phản biện: TS Bùi Trọng Tú Phản biện: TS Huỳnh Khả Tú NGƯỜI HƯỚNG DẪN: GS TS Lê Tiến Thường LỜI CAM ĐOAN Tác giả xin cam đoan cơng trình nghiên cứu thân tác giả Các kết nghiên cứu kết luận luận án trung thực, không chép từ nguồn hình thức Việc tham khảo nguồn tài liệu (nếu có) thực trích dẫn ghi nguồn tài liệu tham khảo quy định Tác giả luận án Chữ ký Nguyễn Thanh Tuấn i TÓM TẮT LUẬN ÁN Watermarking kỹ thuật nhúng trích thơng điệp (thơng tin) vào liệu đa phương tiện Gần đây, kỹ thuật nhận quan tâm lớn nghiên cứu lý thuyết triển khai ứng dụng khả giải nhiều vấn đề thực tiễn Mặc dù có nhiều giải pháp thực khác nhìn chung chia kỹ thuật watermarking làm hai loại có đầy đủ thơng tin tiên nghiệm (tường minh) thiếu thông tin tiên nghiệm (mù) Phần lớn giải pháp cải tiến đề xuất cho kết tốt với watermarking tường minh lại bị giới hạn phạm vi ứng dụng thực tế yêu cầu phải có liệu gốc đặc trưng liệu gốc q trình trích thơng tin Mặt khác, trường hợp watermarking ảnh, nhiều tác giả tập trung cải tiến giải thuật cho loại ảnh cụ thể, phần lớn ảnh xám đơn kênh thông thường Số lượng nghiên cứu cho loại ảnh y tế ảnh đa kênh cịn giới hạn thách thức Bên cạnh đó, thông số giải thuật chủ yếu lựa chọn dựa kinh nghiệm thử nghiệm đơn giản mà thiếu phân tích đánh giá tối ưu Ngồi ra, nhiều tác giả khơng xem xét tính bền vững thông tin nhúng trước đầy đủ loại cơng khác hay tính bảo mật thực trích thơng tin Do đó, mục tiêu luận án đưa giải pháp nâng cao hiệu kỹ thuật watermarking thiếu thông tin tiên nghiệm với ảnh y tế ảnh đa kênh miền không gian miền biến đổi phù hợp với yêu cầu ứng dụng cụ thể Các giải pháp đề xuất phân tích áp dụng cho hai trường hợp watermarking bit nhiều bit Các kết lý thuyết kiểm chứng thông qua mô ứng dụng thực tiễn Các kết thực với nhiều loại ảnh phổ biến đặc thù xem xét loại công khác bao gồm hai loại đồng không đồng Bên cạnh việc đánh giá tính cảm thụ, tính bền vững, luận án bổ sung đánh giá độ tin cậy tăng cường tính bảo mật để phù hợp với yêu cầu đặc thù lĩnh vực y tế Để thực mục tiêu trên, trước tiên, luận án tiến hành phân tích sơ đồ tổng quát hệ thống watermarking dựa tảng lý thuyết truyền thông khảo sát thông số khách quan dùng nghiên cứu đánh giá hiệu kỹ thuật watermarking tiêu biểu với liệu ảnh số Bên cạnh đó, luận án kết hợp phân tích lý thuyết dựa mơ hình xác suất thống kê để đưa lời giải tối ưu đồng thời tiến hành khảo sát thực nghiệm với sở liệu môi trường ứng dụng cụ thể để so sánh đánh giá ưu khuyết điểm phương pháp watermarking khác làm sở cho giải pháp nâng cao hiệu kỹ thuật watermarking cho ứng dụng xử lý ảnh chuyên dụng Nội dung đóng góp luận án đề xuất hai giải pháp DICOM_LSB_AES DICOM_LSB_AES_RONI cách kết hợp kỹ thuật mã hóa kỹ thuật mật mã AES (Advanced Encryption Standard) để nhúng trích thơng tin cá nhân tồn vùng không quan trọng RONI (Region Of Non-Interest) ảnh y tế đặc thù DICOM (Digital Imaging and COmmunications in Medicine) dựa kỹ thuật thay bit trọng ii số thấp LSB (Least Significant Bit) nhằm tăng cường tính bảo mật hỗ trợ cho ứng dụng y tế từ xa Với đặc trưng ảnh DICOM thường sử dụng bit so với định dạng ảnh xám (đơn sắc) phổ biến, hỗ trợ lên đến 16 bit để đạt chất lượng hiển thị cao cho chẩn đốn việc nghiên cứu hồn thiện kỹ thuật watermarking LSB cho ảnh DICOM mang lại hiệu rõ rệt mặt cảm thụ Ngoài ra, phương pháp cịn có thuận lợi đơn giản thực nhúng trích thơng tin thực trực tiếp miền không gian nên phù hợp với ứng dụng thực tiễn Tiếp theo, nội dung nghiên cứu khác luận án tập trung đề xuất giải pháp watermarking hiệu cho ảnh y tế dựa kỹ thuật lượng tử nhằm nâng cao tính bền vững cách chọn lọc đặc trưng SIFT (Scale-Invariant Feature Transform) ổn định q trình trích không cần sử dụng ảnh gốc thông tin đặc trưng ban đầu để so khớp đặc trưng số phương pháp truyền thống Ngoài giải pháp watermaring cho bit thơng tin Q_SIFT (Quantization_SIFT), luận án cịn mở rộng phân tích đánh giá watermarking nhiều bit với hai giải pháp nhúng theo hình quạt FSMQ_SIFT (Fan-shaped Multi-bit Q_SIFT) hình nửa vành khuyên HRSMQ_SIFT (Half-Ring-shaped Multi-bit Q_SIFT) Với giải pháp, luận án bổ sung tính bảo mật kép cách khai thác thông số đặc trưng SIFT qua giải pháp SQ_SIFT (Secure Q_SIFT) khóa bí mật Các mơ xem xét với đa dạng phương thức tạo ảnh y tế phổ biến bao gồm cắt lớp vi tính (Computed Tomography), cộng hưởng từ (Magnetic Resonance Imaging), X quang (X-Ray), siêu âm (UltraSound) nhằm đánh giá mức độ hiệu giải pháp đề xuất đạt hiệu cao trước nhiều loại cơng điển hình xử lý ảnh y tế từ loại không đồng nhiễu, nén, lọc, đồng xoay, co giãn, cắt xén siêu phân giải dùng trí tuệ nhân tạo dựa kỹ thuật ESRGAN (Enhanced Super-Resolution Generative Adversarial Networks) với mơ hình kiến trúc mạng học sâu RRDN (Residual-in-Residual Dense Network) Sau cùng, luận án đưa điều chỉnh cải tiến mở rộng MISS (Multi-bit Improved SS), MISS_DCT (MISS_Discrete Cosine Transform) MISS_DWT (MISS_Discrete Wavelet Transform) nhằm nâng cao hiệu phương pháp watermarking dựa kỹ thuật trải phổ SS (Spread Spectrum) truyền thống cho ảnh đơn kênh nhằm khắc phục số hạn chế tồn tại, để từ phát triển đề xuất giải pháp watermarking trải phổ hợp tác CSS (Cooperative SS) khai thác biến đổi KLT (Karhunen-Loève Transform) với giải pháp CSS_KLT để giải tương quan thành phần tín hiệu ảnh đa kênh Bên cạnh đó, giải pháp cải tiến để loại bỏ can nhiễu watermark kênh ảnh mở rộng watermarking nhiều bit đề xuất phân tích, bao gồm ICSS (Improved CSS), MCSS (Multi-bit CSS), ICSS_KLT (Improved CSS_KLT), MCSS_KLT (Multi-bit CSS_KLT) Các kết phân tích lý thuyết mơ hình tốn học đồng thời kiểm chứng qua mô thực nghiệm với loại ảnh y tế khác iii ABSTRACT Watermarking is a technique of embedding and extracting message (information) in multimedia data Recently, it has received great attention in theoretical research as well as application to solve practical problems Although there are many different implementation solutions, in general, watermarking methods can be divided into two types: obvious and blind Most of the improved solutions obtain good results with obvious watermarking but are limited in practical applications due to the requirement of original data or its features in the information extraction process On the other hand, in the case of image watermarking, many authors only focus on improving algorithms for a specific type of image, most of which are common grayscale images The number of studies for medical images and multi-channel images is still limited and challenging In addition, the parameters in these algorithms are mainly selected based on experience without optimal evaluation analysis In addition, many authors not consider the robustness of embedded information against the full range of different types of attacks or security when performing information extraction Therefore, the objective of the dissertation is to provide solutions to improve the effectiveness of blind watermarking techniques for medical images and multi-channel images in the spatial domain as well as in the transform domains suitable for each specific application requirement The proposed solutions can be applied to both singlebit and multi-bit watermarking cases The theoretical results have been verified through simulation and practical applications The results are performed with a variety of common and specific image types and consider different types of attacks including both synchronous and nonsynchronous types In addition to assessing the imperceptibility and robustness, the thesis also assesses the reliability and enhances the security to match the specific requirements in the medical field To achieve the above goal, firstly, the thesis analyzes the general diagram of the watermarking system based on communication theory and investigates objective parameters used in research to evaluate the effectiveness of typical watermarking techniques with digital image data In addition, theoretical analysis based on statistical probabilistic models to provide the optimal solutions and simulation and experiment surveys with specific databases and application environments are combined to compare and evaluate advantages and disadvantages of different watermarking methods as a basis for solutions to improve the effectiveness of watermarking techniques for specialized image processing applications The first contribution of the thesis is to propose two solutions DICOM_LSB_AES and DICOM_LSB_AES_RONI by combining coding technique, Advanced Encryption Standard technique and Least Significant Bit based watermarking technique for embedding and extracting personal information in whole or only the RONI (Region Of Non-Interest) of DICOM (Digital Imaging and COmmunications in Medicine) medical iv images to enhance security for telemedicine applications With the characteristic that DICOM images often use more than bits compared to common grayscale (monochrome) formats, can be supported up to 16 bits to achieve high display quality for diagnostics, the research on LSB watermarking technique for DICOM images brings a noticeable effect in terms of imperceptibility In addition, this method also has the advantage of being simple in embedding and extracting information because it can be performed directly in the spatial domain, so it is suitable for practical applications Next, another research content of the thesis focuses on proposing effective watermarking solutions for medical images based on quantization techniques to improve robustness by selecting stable SIFT (Scale-Invariant Feature Transform) while the extraction process still does not need to use the original image or original feature information to match features like some traditional methods In addition to the watermarking solution for a single bit of information Q_SIFT (Quantization_SIFT), the thesis also expands analysis and evaluation of multi-bit watermarking with two solutions FSMQ_SIFT (Fan-shaped Multi-bit Q_SIFT) and HRSMQ_SIFT (Half-Ring-shaped Multi-bit Q_SIFT) For each solution, the thesis adds double security by exploiting the parameters of the SIFT feature through the solution SQ_SIFT (Secure Q_SIFT) and the secret key Simulations were implemented with a variety of common medical imaging modalities including Computed Tomography, Magnetic Resonance Imaging, X-Ray, and UltraSound to evaluate the effectiveness of the proposed solutions, which are highly effective against many typical attacks in medical image processing, from nonsynchronous types such as noise, compression, filtering, to synchronous ones such as rotation, scaling, cropping, and even super-resolution using artificial intelligence based on the ESRGAN (Enhanced Super-Resolution Generative Adversarial Networks) approach with the RRDN (Residual-in-Residual Dense Network) architecture Finally, the thesis makes extensive improvements to MISS (Multi-bit Improved Spread Spectrum), MISS_DCT (MISS_Discrete Cosine Transform) and MISS_DWT (MISS_Discrete Wavelet Transform) to improve the the effectiveness of spread spectrum based watermarking method for single-channel images in order to overcome some existing limitations, from which to develop a novel solution for cooperative blind spread spectrum based watermarking CSS (Cooperative SS) and exploit KLT (Karhunen-Loève Transform) with new solution CSS_KLT to decorrelate the signal components of multi-channel images Besides, improved solutions to remove interference between watermark and image channels as well as extend multi-bit watermarking are also proposed and analyzed, including ICSS (Improved CSS), MCSS (Multi-bit CSS), ICSS_KLT (Improved CSS_KLT), MCSS_KLT (Multi-bit CSS_KLT) The results are theoretically analyzed by mathematical model and verified through simulation and experiment with different types of medical images v LỜI CÁM ƠN Lời đầu tiên, từ sâu thẳm trái tim xin bày tỏ lịng biết ơn vơ vàn đến Thầy, GS TS Lê Tiến Thường, tận tình hướng dẫn, động viên, giúp đỡ tơi suốt q trình thực nghiên cứu sinh hoàn thành báo cáo luận án tiến sĩ Kế đến, gửi lời cám ơn đến quý thầy cô bạn bè đồng nghiệp, đặc biệt tập thể Bộ môn Viễn thông, Khoa Điện-Điện tử, Trường Đại học Bách Khoa, Đại học Quốc gia Thành phố Hồ Chí Minh tạo điều kiện hỗ trợ sở vật chất chuyên môn kỹ thuật Sau quan trọng nhất, muốn dành lời tri ân chân thành sâu sắc đến thành viên yêu thương gia đình tơi động viên to lớn hy sinh vô bờ bến làm động lực cho tơi tiếp bước hành trình theo đuổi tri thức khoa học vi MỤC LỤC CHƯƠNG GIỚI THIỆU TỔNG QUÁT VỀ MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU 1.1 Mở đầu 1.2 Tổng quan tình hình nghiên cứu 1.3 Mục tiêu nhiệm vụ 14 1.4 Những đóng góp 15 1.5 Bố cục luận án .18 CHƯƠNG TỔNG QUAN VỀ KỸ THUẬT WATERMARKING 19 2.1 Hệ thống watermarking .19 2.1.1 Nhúng thông điệp 20 2.1.2 Kênh công .21 2.1.3 Trích thông điệp 23 2.2 Các đặc tính hệ thống watermarking 23 2.2.1 Đánh giá mặt cảm thụ .24 2.2.2 Đánh giá tính bền vững độ tin cậy .28 2.2.3 Đánh giá dung lượng nhúng 29 2.2.4 Đánh giá tính bảo mật .30 2.3 Phân loại watermarking .30 2.4 Các phương pháp watermarking 31 2.4.1 Phương pháp LSB 31 2.4.2 Phương pháp watermarking lượng tử 32 2.4.3 Phương pháp watermarking trải phổ 33 2.5 Các biến đổi 38 2.5.1 Biến đổi DCT .39 2.5.2 Biến đổi DWT 41 2.5.3 Biến đổi KLT 47 2.5.4 Biến đổi SIFT .50 2.6 Tấn công siêu phân giải dùng trí tuệ nhân tạo .54 2.7 Kết luận chương 60 vii

