1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nâng cao hiệu quả kỹ thuật watermarking thiếu thông tin tiên nghiệm cho ảnh y tế và ảnh đa kênh

208 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nâng cao hiệu quả kỹ thuật watermarking thiếu thông tin tiên nghiệm cho ảnh y tế và ảnh đa kênh
Tác giả Nguyễn Thanh Tuấn
Người hướng dẫn GS. TS. Lê Tiến Thường
Trường học Đại học Quốc gia TP. Hồ Chí Minh
Chuyên ngành Kỹ thuật viễn thông
Thể loại Luận án tiến sĩ
Năm xuất bản 2023
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 208
Dung lượng 17,62 MB

Cấu trúc

  • 1.1 Mở đầu (19)
  • 1.2 Tổng quan tình hình nghiên cứu (27)
  • 1.3 Mục tiêu và nhiệm vụ (32)
  • 1.4 Những đóng góp chính (33)
  • 1.5 Bố cục luận án (36)
  • CHƯƠNG 2 TỔNG QUAN VỀ KỸ THUẬT WATERMARKING (0)
    • 2.1 Hệ thống watermarking (37)
      • 2.1.1 Nhúng thông điệp (38)
      • 2.1.2 Kênh tấn công (39)
      • 2.1.3 Trích thông điệp (41)
    • 2.2 Các đặc tính cơ bản của hệ thống watermarking (41)
      • 2.2.1. Đánh giá về mặt cảm thụ (42)
      • 2.2.2. Đánh giá về tính bền vững và độ tin cậy (46)
      • 2.2.3. Đánh giá về dung lượng nhúng (47)
      • 2.2.4. Đánh giá về tính bảo mật (48)
    • 2.3 Phân loại watermarking (48)
    • 2.4 Các phương pháp watermarking (49)
      • 2.4.1 Phương pháp LSB (49)
      • 2.4.2 Phương pháp watermarking lượng tử (50)
      • 2.4.3 Phương pháp watermarking trải phổ (51)
    • 2.5 Các biến đổi (56)
      • 2.5.1 Biến đổi DCT (57)
      • 2.5.2 Biến đổi DWT (59)
      • 2.5.3 Biến đổi KLT (65)
      • 2.5.4 Biến đổi SIFT (68)
    • 2.6 Tấn công siêu phân giải dùng trí tuệ nhân tạo (72)
    • 2.7 Kết luận chương (78)
    • 3.1 Mã hóa mật mã AES (79)
    • 3.2 Các vấn đề bảo mật với ảnh DICOM (82)
    • 3.3 Giải pháp đề xuất DICOM_LSB_AES (87)
    • 3.4 Giải pháp đề xuất DICOM_LSB_AES_RONI (92)
    • 3.5 Kết quả thử nghiệm ứng dụng thực tiễn (93)
    • 3.6 Kết luận chương (97)
  • CHƯƠNG 4 NÂNG CAO HIỆU QUẢ KỸ THUẬT WATERMARKING LƯỢNG TỬ VÀ BIẾN ĐỔI SIFT TRƯỚC CÁC TẤN CÔNG ĐỒNG BỘ (100)
    • 4.1 Các vấn đề tồn tại với kỹ thuật watermarking lượng tử dựa trên biến đổi SIFT 82 (100)
    • 4.2 Giải pháp đề xuất watermarking một bit Q_SIFT (102)
      • 4.2.1 Giải thuật nhúng 1 bit thông tin (102)
      • 4.2.2 Giải thuật trích 1 bit thông tin (108)
    • 4.3 Các giải pháp đề xuất watermarking nhiều bit HRSMQ_SIFT và FSMQ_SIFT 92 (110)
      • 4.3.1 Nhúng theo các phần nửa vành khuyên HRSMQ_SIFT (110)
      • 4.3.2 Nhúng theo các phần hình quạt FSMQ_SIFT (111)
      • 4.3.3 Trích nhiều bit thông tin (112)
    • 4.4 Giải pháp đề xuất SQ_SIFT tăng cường tính bảo mật (116)
    • 4.5 Kết quả mô phỏng và thử nghiệm (117)
      • 4.5.1 Kiểm chứng mô hình tấn công siêu phân giải (117)
      • 4.5.2 Đánh giá tính cảm thụ (119)
      • 4.5.3 Đánh giá tính bền vững và độ tin cậy (121)
    • 4.6 Kết luận chương (124)
  • CHƯƠNG 5 NÂNG CAO HIỆU QUẢ KỸ THUẬT WATERMARKING TRẢI PHỔ ỨNG DỤNG CHO ẢNH Y TẾ VÀ ẢNH ĐA KÊNH (127)
    • 5.1 Các vấn đề tồn tại với kỹ thuật watermarking trải phổ truyền thống (127)
    • 5.2 Các giải pháp watermarking trải phổ điều chỉnh cải tiến cho ảnh y tế đơn kênh (130)
    • 5.3 Các giải pháp watermarking trải phổ hợp tác cho ảnh đa kênh (132)
      • 5.3.1 Giải pháp watermarking trải phổ hợp tác CSS (132)
      • 5.3.2 Giải pháp cải tiến loại bỏ can nhiễu ICSS (138)
      • 5.3.3 Giải pháp mở rộng watermarking nhiều bit MCSS (138)
      • 5.3.4 Giải pháp watermarking trải phổ hợp tác sử dụng biến đổi KLT CSS_KLT (139)
      • 5.3.5 Giải pháp cải tiến loại bỏ can nhiễu ICSS_KLT (142)
      • 5.3.6 Giải pháp mở rộng watermarking nhiều bit MCSS_KLT (143)
    • 5.4 Kết quả mô phỏng và thử nghiệm (143)
      • 5.4.1 Đánh giá ảnh hưởng của các loại sai số thực tế trong watermarking ảnh (144)
      • 5.4.2 Kết quả mô phỏng kiểm chứng phân tích lý thuyết (146)
      • 5.4.3 Kết quả thử nghiệm ứng dụng với ảnh màu (155)
    • 5.5 Kết luận chương (157)
  • CHƯƠNG 6 KẾT LUẬN VÀ KIẾN NGHỊ HƯỚNG NGHIÊN CỨU (0)
    • 6.1 Kết luận (159)
    • 6.2 Kiến nghị hướng nghiên cứu phát triển (161)
  • TÀI LIỆU THAM KHẢO (164)

Nội dung

Tổng quan tình hình nghiên cứu

Nghiên cứu đầu tiên về watermarking ảnh được thực hiện trong miền không gian thông qua các phương pháp điều chỉnh giá trị mức xám Kỹ thuật thay thế bit trọng số thấp (LSB) do Tirkel, Schyndel và các cộng sự đề xuất, nhúng watermark dưới dạng chuỗi ngẫu nhiên nhị phân vào LSB còn lại của ảnh sau khi nén histogram mức xám 7-bit Phương pháp này sử dụng bộ so sánh chuỗi bit để phát hiện watermark Ngoài ra, một số tác giả khác cũng thực hiện việc nhúng thông tin nhị phân trực tiếp vào các mặt phẳng LSB của ảnh.

Cox và cộng sự là những người đầu tiên áp dụng lý thuyết truyền thông trải phổ để phát triển thuật toán watermarking, nhúng watermark có phân bố Gaussian vào các hệ số DCT thấp nhất của ảnh Phương pháp khôi phục watermark dựa trên việc trừ ảnh gốc khỏi ảnh đã nhúng và tính toán độ tương tự giữa watermark khôi phục và watermark gốc Mặc dù kỹ thuật này khá bền vững, nhưng nó không thực sự hiệu quả trong thực tế do yêu cầu ảnh gốc và thời gian tính toán lâu Nhiều tác giả khác đã sử dụng khái niệm trải phổ theo những cách khác mà không cần dữ liệu gốc trong quá trình khôi phục, với ý tưởng cơ bản là cộng thêm chuỗi trung bình.

Watermark được tạo ra từ bộ tạo tín hiệu ngẫu nhiên với hai giá trị từ dữ liệu gốc, sử dụng một khóa bí mật mà chỉ người nhúng biết Quá trình trích xuất watermark diễn ra thông qua bộ phát hiện tương quan với cùng khóa nhúng, đảm bảo rằng chỉ có khóa được sử dụng trong quá trình nhúng mới có thể trích xuất watermark.

Kỹ thuật watermarking hiện đại cho phép nhúng thông tin chính xác vào tín hiệu gốc, nâng cao khả năng bảo mật so với các phương pháp khác Các bộ phát hiện hiệu quả này rất phù hợp cho việc bảo vệ bản quyền và chống sao chép Với khả năng trải rộng trên toàn bộ dữ liệu, phương pháp này đạt được tính không cảm thụ và bền vững Watermarking dựa trên trải phổ không yêu cầu dữ liệu gốc, làm cho nó linh hoạt cho nhiều ứng dụng Kỹ thuật trải phổ có thể thực hiện trong miền không gian hoặc các miền biến đổi như DFT và DWT Tuy nhiên, phương pháp này cũng gặp phải một số nhược điểm, như việc năng lượng tín hiệu nhúng giảm đi khi trải phổ, dẫn đến khó khăn trong việc phân biệt tín hiệu nhúng với nhiễu trong quá trình trích xuất Hơn nữa, tín hiệu nhúng cũng có thể được coi là nhiễu, gây ra sai số đáng kể trong quá trình này.

Một số phương pháp trải phổ cải tiến đã được nghiên cứu nhằm khắc phục hạn chế của phương pháp trải phổ truyền thống.

Trong watermarking ảnh đa kênh, việc nhúng watermark thường được thực hiện vào một thành phần dữ liệu cụ thể như kênh màu xanh dương trong không gian màu RGB hoặc thành phần độ sáng trong YUV, mà không xem xét tương quan giữa các kênh Tuy nhiên, Piva và cộng sự đã phát triển một bộ phát hiện dựa trên tương quan toàn cục, cải thiện chất lượng hệ thống bằng cách tổng hợp thông tin từ ba kênh màu RGB, mặc dù kỹ thuật này chỉ xem xét kết hợp trung bình và khó khăn trong việc xác định chiến thuật phát hiện tối ưu Ngược lại, Barni và cộng sự áp dụng biến đổi DCT để giảm tương quan giữa các kênh màu, trong khi nghiên cứu của họ cùng Hajjaji khai thác đặc tính giải tương quan hoàn hảo của biến đổi KLT để nhúng watermark, cho phép xây dựng thuật toán phát hiện tối ưu dựa trên lý thuyết quyết định thống kê Bayes.

Biến đổi KLT có 11 hạn chế, trong đó một hạn chế quan trọng là sự phụ thuộc vào đặc tính thống kê của dữ liệu gốc Do đó, các kết quả trong các nghiên cứu [18, 19] chỉ chính xác khi giả định rằng sự khác biệt giữa ma trận hiệp phương sai của ảnh nhúng và ảnh gốc là không đáng kể.

Trong những năm gần đây, lĩnh vực watermarking đã chứng kiến sự phát triển mạnh mẽ với các giải thuật bền vững trước các biến dạng hình học Nhiều phương pháp như nhúng dựa trên mẫu tham chiếu, nhúng miền bất biến RST, và watermark tự đồng bộ đã được đề xuất Phương pháp watermarking dựa vào các đặc trưng bền vững, thuộc nhóm thế hệ thứ hai, cho phép trích xuất thông tin một cách hoàn hảo thông qua việc kết hợp với các đặc trưng nội dung ảnh như góc Harris, wavelet Mexican Hat và biến đổi SIFT Biến đổi SIFT giúp trích xuất các đặc trưng ổn định trong không gian tỉ lệ, tuy nhiên, việc sử dụng quá nhiều vùng nhúng có thể ảnh hưởng đến chất lượng ảnh Một số nghiên cứu đã chỉ ra rằng chỉ nên chọn vài đặc trưng bền vững để nhúng thông tin nhằm cải thiện hiệu quả Mặc dù một số tác giả đã cải tiến độ bền vững bằng cách sử dụng đặc trưng hướng hoặc cải tiến biến đổi SIFT, nhưng vẫn cần có thông tin gốc trong quá trình trích Ngoài ra, các nghiên cứu về watermarking mù bằng biến đổi SIFT lại chưa xem xét tính bền vững trước các tấn công đồng bộ, đặc biệt trong bối cảnh hình ảnh y tế có độ phân giải cao.

Công nghệ siêu phân giải hình ảnh dựa trên học sâu cho phép cải thiện độ phân giải ảnh một cách hiệu quả, khẳng định rằng các đặc trưng SIFT là giải pháp bền vững với độ phức tạp tính toán thấp Tuy nhiên, số lượng điểm đặc trưng sau biến đổi SIFT rất lớn và không phải tất cả đều hiệu quả, do đó cần tiền xử lý để chọn lọc các điểm bền vững và tạo vùng nhúng không chồng lấp Các phương pháp watermarking hiện tại vẫn thiếu cơ chế bảo mật, khiến kẻ tấn công có thể xác định vùng nhúng Trong bối cảnh phát triển thiết bị chẩn đoán hình ảnh và Internet, nghiên cứu về watermarking trong ảnh y tế ngày càng được quan tâm, đặc biệt là việc xác định ROI (Region of Interest) và RONI (Region of Non-Interest) để nhúng watermark cho các ứng dụng khác nhau Một hướng tiếp cận là nhúng watermark trong vùng ROI/RONI, nhưng thường cần thông tin đi kèm để xác định Hướng tiếp cận khả đảo cho phép khôi phục ảnh gốc hoàn toàn sau khi trích watermark, trong khi khai thác phương pháp watermarking thông thường với yêu cầu tối thiểu méo dạng cũng đang được áp dụng để đảm bảo chất lượng trong chẩn đoán y tế.

Tuy nhiên, ảnh y tế cũng có nhiều khác biệt đặc trưng so với ảnh tự nhiên [113], cụ thể như sau:

 Ảnh y tế được tạo ra từ nhiều phương thức khác nhau, ví dụ như XR, CT, MRI,

Mỗi loại ảnh y tế tại Mỹ có những đặc tính riêng biệt, bao gồm độ tương phản, độ chi tiết, mức độ nhiễu, hiệu ứng nhân tạo và đặc điểm hình học không gian.

 Ảnh y tế thường bao gồm chuỗi các ảnh liên quan với nhau hơn là chỉ một ảnh riêng lẻ như ảnh tự nhiên

 Ảnh y tế nhìn chung bị mờ và nhiễu nhiều hơn so với ảnh tự nhiên

Ảnh y tế thường có cấu trúc đơn giản hơn so với ảnh tự nhiên, dẫn đến việc chúng ít tương thích với hệ thống thị giác của con người Điều này khiến cho các đặc tính thống kê của ảnh y tế không dễ dàng thích ứng như ở ảnh tự nhiên.

 Ảnh y tế thường có vùng quan tâm ROI phục vụ cho việc chẩn đoán và vùng không quan tâm RONI không ảnh hưởng đến kết quả chẩn đoán

Ảnh y tế nguyên gốc thường được lưu dưới định dạng DICOM với độ sâu bit cao hơn ảnh tự nhiên để phục vụ chẩn đoán Sau khi xử lý, chủ yếu qua bước nén ảnh, các hình ảnh này trở thành hình bệnh lý và có thể được lưu dưới định dạng ảnh thông thường cho hồ sơ bệnh án.

 Xử lý ảnh y tế có thêm các yêu cầu đặc thù như chất lượng phải đảm bảo cho việc chẩn đoán chính xác và bảo mật thông tin

Kỹ thuật watermarking đã phát triển nhanh chóng và trở thành một trong những phương pháp giấu thông tin tiên tiến Mặc dù có nhiều giải pháp khác nhau, phương pháp watermarking có thể chia thành hai loại: tường minh và thiếu thông tin tiên nghiệm Các giải pháp cải tiến chủ yếu mang lại kết quả tốt cho watermarking tường minh, nhưng lại hạn chế trong ứng dụng thực tế do yêu cầu dữ liệu gốc Trong lĩnh vực watermarking ảnh, nhiều nghiên cứu tập trung vào các thuật toán cho ảnh xám đơn kênh, dựa trên ba kỹ thuật chính: thay thế bit trọng số thấp, lượng tử và trải phổ Tuy nhiên, nghiên cứu về ảnh y tế và ảnh đa kênh, đặc biệt là tiêu chuẩn DICOM, vẫn còn hạn chế Phần lớn nghiên cứu watermarking tập trung vào bảo vệ bản quyền, chú trọng vào tính cảm thụ của ảnh sau khi nhúng và khả năng bền vững trước các tấn công đặc thù, chủ yếu xem xét các tấn công không đồng bộ như nhiễu, nén và lọc.

Số lượng nghiên cứu về watermarking bền vững trước các tấn công đồng bộ như dịch, xoay, co dãn hay cắt xén ảnh vẫn còn hạn chế Sự phát triển của các mô hình mạng thần kinh sâu đã dẫn đến các loại tấn công mới dựa trên trí tuệ nhân tạo, chẳng hạn như tấn công siêu phân giải Ứng dụng tích hợp thông tin bệnh nhân và chẩn đoán điều trị trong ảnh y tế yêu cầu cao về dung lượng thông tin nhúng, tính bảo mật và độ tin cậy Hơn nữa, nhiều nghiên cứu watermarking chưa kết hợp đầy đủ giữa phân tích lý thuyết và giải pháp thực nghiệm cho các ứng dụng cụ thể, tạo ra những thách thức cho luận án nghiên cứu nhằm phát triển và hoàn thiện lĩnh vực này.

Hình 1.3 Các phương pháp watermarking ảnh.

Mục tiêu và nhiệm vụ

Mục tiêu của luận án là phát triển các mô hình xác suất và giải pháp tối ưu nhằm nâng cao hiệu quả kỹ thuật watermarking mù cho ảnh y tế và ảnh đa kênh Nghiên cứu sẽ tập trung vào việc áp dụng các giải pháp này trong cả miền không gian và các miền biến đổi, phù hợp với từng yêu cầu ứng dụng cụ thể Các giải pháp đề xuất sẽ được phân tích chi tiết để đảm bảo tính hiệu quả và khả năng áp dụng trong thực tiễn.

Luận án nghiên cứu về watermarking một bit và nhiều bit, kiểm chứng các kết quả lý thuyết qua mô phỏng và ứng dụng thực tiễn Nghiên cứu sử dụng nhiều loại ảnh khác nhau và xem xét các loại tấn công đồng bộ và không đồng bộ Ngoài việc đánh giá tính cảm thụ và tính bền vững, luận án còn tập trung vào độ tin cậy và tăng cường tính bảo mật cho lĩnh vực y tế Để đạt được mục tiêu này, luận án phân tích hệ thống watermarking dựa trên lý thuyết truyền thông và khảo sát các thông số trong nghiên cứu hiệu quả của các kỹ thuật watermarking với dữ liệu ảnh số Luận án cũng kết hợp phân tích lý thuyết với mô hình xác suất thống kê và thực nghiệm với các cơ sở dữ liệu cụ thể để so sánh ưu nhược điểm của các phương pháp watermarking, từ đó đề xuất giải pháp nâng cao hiệu quả cho kỹ thuật watermarking trong ảnh y tế và ảnh đa kênh.

Những đóng góp chính

Luận án đã thành công trong việc đề xuất hai giải pháp watermarking thiếu thông tin tiên nghiệm cho ảnh DICOM, một tiêu chuẩn phổ biến trong chẩn đoán hình ảnh y tế Ảnh DICOM có cấu trúc và định dạng khác biệt so với ảnh tự nhiên, bao gồm thông tin cá nhân cần bảo mật Luận án khai thác đặc tính của ảnh DICOM với độ sâu bit lớn hơn 8, sử dụng kỹ thuật thay thế bit trọng số thấp LSB để nhúng thông tin bảo mật, kết hợp với mã hóa AES và tiêu chuẩn DICOM, tạo ra giải pháp DICOM_LSB_AES Giải pháp này đảm bảo chất lượng hình ảnh sau khi nhúng, ngay cả với dung lượng thông tin lớn, đồng thời tuân thủ định dạng DICOM.

Phương pháp đề xuất có khả năng sử dụng với mọi hệ thống chẩn đoán hình ảnh hiện có, với ưu điểm là đơn giản trong việc nhúng và trích xuất thông tin trực tiếp trong miền không gian, phù hợp cho ứng dụng thực tiễn Đặc biệt, luận án giới thiệu giải pháp DICOM_LSB_AES_RONI, cho phép nhúng và trích xuất thông tin chỉ trong vùng không quan trọng RONI, đảm bảo tính chính xác tuyệt đối của vùng quan trọng ROI trong ảnh nhúng so với ảnh gốc Kết quả của hai giải pháp này đã được công bố trong một bài báo tạp chí y học thực hành, bốn bài báo hội nghị quốc tế, và qua các thử nghiệm thực tế với các hệ thống phần mềm ứng dụng trong lĩnh vực y tế, bao gồm một đề tài cấp nhà nước, một đề tài cấp thành phố, và một đề tài cấp trường.

Luận án nghiên cứu các giải pháp watermarking hiệu quả cho ảnh y tế dựa trên kỹ thuật lượng tử, nhằm nâng cao tính bền vững trước các tấn công đồng bộ bằng cách chọn lọc các đặc trưng SIFT ổn định mà không cần sử dụng ảnh gốc Đánh giá chất lượng ảnh nhúng được thực hiện qua các chỉ số như MSE, PSNR và SSIM Luận án xem xét toàn diện các tấn công từ không đồng bộ đến đồng bộ, đồng thời đưa ra thông số đánh giá độ tin cậy để so sánh với các phương pháp phổ biến khác Các giải pháp được đề xuất bao gồm watermarking một bit (Q_SIFT) và mở rộng cho nhiều bit thông qua FSQ_SIFT và HRSQ_SIFT Mỗi giải pháp đều tích hợp tính bảo mật kép bằng cách khai thác các thông số SIFT và khóa bí mật Đặc biệt, các thuật toán so sánh độ tin cậy và chia nhóm lặp vòng đã được đề xuất để khôi phục vùng nhúng mà không cần ảnh gốc hay thông tin phụ.

Giải pháp đề xuất cho xử lý ảnh y tế cho thấy tính bền vững cao trước các tấn công phổ biến và tấn công siêu phân giải sử dụng trí tuệ nhân tạo Các kết quả nghiên cứu đã được công bố trong 2 tạp chí Scopus và 1 hội nghị quốc tế, đồng thời được triển khai thử nghiệm ứng dụng thực tiễn tại một số bệnh viện thông qua các nhiệm vụ khoa học công nghệ, bao gồm 1 đề tài cấp nhà nước, 1 đề tài cấp thành phố và 1 đề tài cấp trường.

Luận án đã đề xuất các điều chỉnh cải tiến để nâng cao hiệu quả của phương pháp watermarking dựa trên kỹ thuật trải phổ truyền thống, nhằm khắc phục những hạn chế hiện có Cụ thể, hai phương pháp điều chỉnh được đưa ra: một cho bộ trích tương quan (loại bỏ mức DC) và một cho tín hiệu gốc đầu vào dựa trên phương pháp trải phổ cải tiến ISS Những cải tiến này giúp nâng cao chất lượng dữ liệu sau khi nhúng và giảm thiểu ảnh hưởng của nhiễu nội từ dữ liệu gốc trong quá trình trích xuất watermark Thêm vào đó, luận án còn phát triển các điều chỉnh này theo hướng tổng quát hóa để nhúng nhiều bit thông tin, thay vì chỉ 1 bit như phương pháp truyền thống.

MISS được thiết kế để cải thiện độ chính xác trong quá trình nhúng và trích xuất thông tin, đồng thời nâng cao dung lượng và chất lượng dữ liệu sau khi nhúng Phương pháp MISS kết hợp với các phép biến đổi, đặc biệt là biến đổi DCT, tạo ra phương pháp MISS_DCT, so sánh với MISS_DWT dựa trên biến đổi DWT để nâng cao chất lượng watermarking Mặc dù phương pháp watermarking hiện tại chủ yếu áp dụng cho ảnh xám đơn kênh, luận án còn đề xuất giải pháp watermarking mới mang tên CSS_KLT, khai thác biến đổi KLT để giải tương quan giữa các thành phần tín hiệu của ảnh đa kênh Giải pháp này cho phép nhúng thông tin vào nhiều kênh ảnh và sử dụng một bộ quyết định hợp tác tuyến tính toàn cục để tối ưu hóa mức độ đóng góp của từng bộ phát hiện tương quan ở mỗi kênh.

Phương pháp watermarking trải phổ hợp tác sử dụng 18 biến đổi KLT, cải thiện đáng kể tính vô hình và bền vững của hệ thống Đặc biệt, khác với các giải pháp khác, phương pháp này cho phép trích xuất thông tin chính xác mà không cần ảnh gốc, nhờ vào điều kiện watermark trực giao Bốn giải pháp cải tiến nhằm loại bỏ can nhiễu giữa watermark và các kênh ảnh, cũng như mở rộng watermarking nhiều bit, bao gồm ICSS, MCSS, ICSS_KLT, và MCSS_KLT, đã được đề xuất và phân tích Kết quả nghiên cứu được kiểm chứng qua mô phỏng và thực nghiệm với nhiều loại ảnh y tế khác nhau, đồng thời đã được công bố trong các bài báo khoa học và triển khai ứng dụng thực tiễn tại một số bệnh viện trong các nhiệm vụ khoa học công nghệ.

Bố cục luận án

Phần tiếp theo của luận án được cấu trúc rõ ràng với các chương cụ thể Chương 2 trình bày cơ sở lý thuyết cho các nội dung nghiên cứu Chương 3 đề xuất giải pháp watermarking sử dụng kỹ thuật LSB với ảnh DICOM để tăng cường bảo mật cho ứng dụng y tế từ xa Chương 4 giới thiệu giải pháp watermarking dựa trên kỹ thuật lượng tử và đặc trưng SIFT nhằm nâng cao tính bền vững trước các cuộc tấn công đồng bộ Chương 5 đề xuất giải pháp watermarking trải phổ hợp tác với ảnh đa kênh, áp dụng biến đổi KLT và các bộ thu tối ưu cùng các điều chỉnh cải tiến Cuối cùng, Chương 6 đưa ra kết luận chung và hướng nghiên cứu phát triển, kèm theo thông tin chi tiết về các công trình đã công bố liên quan đến luận án.

TỔNG QUAN VỀ KỸ THUẬT WATERMARKING

Hệ thống watermarking

Watermarking là kỹ thuật nhúng thông điệp vào dữ liệu đa phương tiện, chủ yếu là dữ liệu số như hình ảnh, âm thanh và video Dữ liệu gốc được gọi là dữ liệu bao phủ, trong khi dữ liệu nhúng được gọi là watermark Có hai dạng watermark: thông điệp watermark, thường là chuỗi bit thông tin, và tín hiệu watermark, là sự tác động trực tiếp vào dữ liệu bao phủ Sau khi chèn watermark, dữ liệu được gọi là dữ liệu sau watermarking Dữ liệu này có thể bị xử lý hoặc thay thế, dẫn đến dữ liệu bị tấn công Watermarking có thể được chia thành hai loại: có thông tin tiên nghiệm (tường minh) và thiếu thông tin tiên nghiệm (mù), trong đó phương pháp thiếu thông tin thường gặp nhiều thách thức hơn nhưng lại được ứng dụng rộng rãi hơn trong thực tiễn.

Bài viết này phân tích các giải pháp watermarking mà không dựa vào dữ liệu gốc, tập trung vào việc thiếu thông tin tiên nghiệm trong luận án.

Bài viết này trình bày việc kết hợp giữa lý thuyết tổng quát hệ thống watermarking thiếu thông tin tiên nghiệm và ứng dụng cụ thể, nhằm đề xuất các giải pháp cải tiến đột phá trong kỹ thuật watermarking ảnh y tế và ảnh đa kênh Các giải pháp này dựa trên những kỹ thuật tiên tiến trong lĩnh vực truyền thông tin, xử lý tín hiệu số và xử lý ảnh Hệ thống watermarking tổng quát được cấu thành từ ba thành phần chính: nhúng thông điệp, kênh tấn công và trích thông điệp.

Hình 2.1 Nền tảng hệ thống thông tin của một hệ thống watermarking thiếu thông tin tiên nghiệm

Quá trình nhúng thông điệp b vào dữ liệu gốc x nhằm cải thiện tính cảm thụ của dữ liệu sau nhúng thông qua mô hình cảm thụ M Trước khi nhúng, thông điệp có thể được chuyển đổi thành dạng hiệu quả hơn bằng bộ mã hóa Để tăng cường tính bảo mật, các khóa k i được sử dụng trong cả bộ mã hóa và bộ nhúng watermark Điều này đảm bảo rằng các khóa k i vẫn cần thiết để trích xuất thông tin, ngay cả khi hệ thống watermarking thiếu thông tin tiên nghiệm.

Giả sử một thông điệp b=(b 1 ,…,b N ) được nhúng vào dữ liệu gốc x Để chuyển đổi thông điệp thành dạng hiệu quả, nó được mã hóa hoặc điều chế phụ thuộc vào khóa k i Một watermark w được tạo ra bởi hàm phụ thuộc khóa w=f(c,p,M,k i), đảm bảo vùng phân phối watermark cần thiết dựa trên hàm chiếu p và đặc tính cảm thụ của con người qua thông số mặt nạ cảm thụ M Lựa chọn điển hình cho hàm chiếu p là tập hợp các hàm trực giao cho mỗi bit từ mã {c n}, sao cho p n và p l không giao nhau Watermark thu được là sự xếp chồng của các thành phần này.

Bộ nhúng watermark thực hiện chèn watermark vào dữ liệu gốc ban đầu hay ở miền biến đổi, tạo thành dữ liệu đã watermark:

Biến đổi trực giao T, như DCT, DFT, DWT hay KLT, được định nghĩa bởi công thức y T     Emb T x w   Hàm nhúng Emb( ) thường tuân theo mô hình cộng tuyến tính, được mô tả qua phương trình y x w  .

Kênh tấn công tạo ra phiên bản méo y’ của dữ liệu sau khi nhúng y, được mô hình hóa bằng hàm mật độ xác suất rời rạc Q(y’|y) để mô tả nhiễu ngẫu nhiên trong dữ liệu watermark Một tấn công thành công cần phải làm hư hại hoặc phá hủy watermark mà vẫn bảo toàn chất lượng thương mại của dữ liệu, do đó, sái dạng phải nằm trong giới hạn của tiêu chuẩn đã chọn Các tấn công có thể chia thành hai loại: tấn công không chủ đích, thường gặp trong xử lý ảnh, và tấn công có chủ đích, nhằm mục đích trích xuất thông tin bất hợp pháp.

Trong nghiên cứu này, luận án tập trung vào các loại tấn công không chủ đích, bao gồm cả tấn công không đồng bộ và tấn công đồng bộ, hai hình thức tấn công phổ biến nhất trong lĩnh vực xử lý ảnh Việc vô hiệu hóa ứng dụng watermarking ban đầu là một phần quan trọng trong nhóm tấn công giao thức.

Hình 2.2 Phân loại các tấn công watermarking

Tấn công không đồng bộ, hay còn gọi là tấn công loại bỏ, chỉ làm thay đổi giá trị các điểm ảnh mà không ảnh hưởng đến vị trí nhúng thông tin giữa ảnh gốc và ảnh sau tấn công Các ví dụ phổ biến bao gồm nén ảnh có tổn hao, lọc ảnh và nhiễu ảnh Do đó, kỹ thuật watermarking bền vững trước các tấn công này chỉ cần dựa vào nội dung giá trị của ảnh sau tấn công để trích xuất thông tin Ngược lại, tấn công đồng bộ, hay tấn công hình học, có thể thay đổi hoặc không thay đổi giá trị điểm ảnh nhưng luôn làm thay đổi vị trí nhúng thông tin Vì vậy, kỹ thuật watermarking bền vững trước các tấn công này cần dựa vào cả nội dung giá trị của ảnh sau tấn công và đồng bộ vị trí với ảnh gốc thông qua thông tin tiên nghiệm để trích xuất thông tin.

Tấn công không chủ đích

Tấn công không đồng bộ Tấn công đồng bộ

Tấn công có chủ đích

Tấn công mật mã Tấn công giao thức

Quá trình trích thông điệp từ dữ liệu kiểm tra bao gồm hai bước chính: phát hiện watermark và giải mã watermark Giai đoạn phát hiện nhằm xác định xem dữ liệu có chứa thông điệp nhúng hay không, chỉ cần một bit thông tin cho hai trạng thái Tiếp theo, giai đoạn giải mã phục hồi thông điệp nhúng ban đầu Phương pháp watermarking chỉ thực hiện phát hiện được gọi là watermarking một bit, thường được sử dụng trong xác thực và chống sao chép Ngược lại, phương pháp thực hiện giải mã được gọi là watermarking nhiều bit, ứng dụng trong bảo vệ bản quyền, tích hợp dữ liệu, giám sát theo dõi và truyền thông bí mật.

Bộ trích watermark thực hiện ước lượng w của watermark ban đầu thông qua hàm trích Extr(…) dựa trên phiên bản tấn công y của dữ liệu sau nhúng:

Bộ giải mã nói chung dựa trên hướng tiếp cận ML (Maximum Likelihood) hay MAP (Maximum A Posteriori)

Bộ giải mã có thể thiết kế dựa trên MAP:

Giả sử rằng tất cả các từ mã b có xác suất như nhau, với vectơ quan sát r đã được biết, bộ giải mã tối ưu nhằm tối thiểu hóa xác suất lỗi có điều kiện được xác định bởi bộ giải mã ML.

Do sự xuất hiện của b được giả định có xác suất đồng đều, bộ giải mã ML thường được ưa chuộng trong thực tế hơn bộ giải mã MAP do tính phức tạp cao hơn của bộ giải mã này.

Các đặc tính cơ bản của hệ thống watermarking

Một hệ thống watermarking thường sở hữu các đặc tính cơ bản như tính cảm thụ (độ trung thực), tính bền vững, tính bảo mật, dung lượng thông tin nhúng và khả năng phục hồi.

Bài viết đề cập đến 24 yếu tố khôi phục dữ liệu, bao gồm độ phức tạp và quá trình trích xuất thông tin, cũng như việc có cần dữ liệu gốc hay không Tùy thuộc vào từng ứng dụng, các yêu cầu sẽ được ưu tiên khác nhau; trong bảo vệ bản quyền, tính bền vững và khả năng cảm thụ cùng với dung lượng bit thông tin nhúng là những yếu tố quan trọng Việc đánh giá không chỉ tập trung vào tính bền vững mà còn vào sự méo dạng do watermarking gây ra Do đó, bên cạnh việc thiết kế phương pháp watermarking, việc đưa ra đánh giá và so sánh chính xác cũng rất cần thiết Để so sánh các thuật toán, các công cụ benchmark như Unzign, Stirmark và Centimark thường được sử dụng để đánh giá hiệu quả của chúng qua nhiều loại tấn công khác nhau.

Một hệ thống watermarking được coi là bền vững khi watermark có khả năng tồn tại ngay cả khi dữ liệu nhúng bị biến đổi nghiêm trọng Để đánh giá hiệu suất của các hệ thống watermarking này, ba yêu cầu chính thường được xem xét: mức độ không cảm thụ, tính bền vững và khả năng dung lượng thông tin nhúng Tuy nhiên, luôn tồn tại sự đánh đổi giữa các yêu cầu này, do đó, việc đánh giá và so sánh phải được thực hiện dưới cùng một điều kiện để đảm bảo tính công bằng.

2.2.1 Đánh giá về mặt cảm thụ

Kỹ thuật watermarking được áp dụng cho nhiều loại dữ liệu, nhưng luận án này tập trung vào watermarking ảnh, lĩnh vực được nghiên cứu nhiều nhất Luận án mở rộng nghiên cứu các giải pháp nâng cao hiệu quả watermarking cho ảnh đa kênh và ảnh y tế Đối với ảnh y tế, nghiên cứu khai thác các phương pháp watermarking thông thường với yêu cầu tối thiểu về méo dạng để đảm bảo chất lượng chẩn đoán, đồng thời đáp ứng các yêu cầu về độ tin cậy và tính bảo mật mà nhiều phương pháp hiện tại chưa đề cập.

Yêu cầu về chất lượng ảnh sau watermark là đảm bảo rằng nó chỉ suy giảm tối thiểu so với ảnh gốc Khi so sánh các thuật toán, chất lượng ảnh sau watermark của chúng cần phải tương đương Việc đánh giá chất lượng ảnh bao gồm cả cảm nhận chủ quan qua mắt và đánh giá khách quan thông qua các thông số định lượng Để xác định mức độ suy giảm chất lượng, người ta sử dụng thang điểm so sánh với ảnh lý tưởng (ảnh gốc), như được trình bày trong Bảng 2.1.

Bảng 2.1 Đánh giá sự suy giảm chất lượng của ảnh

Có thể nhận biết nhẹ

Có thể nhận biết nhưng chỉ hư hại nhẹ

Hư hại nhưng không khó chịu Hơi khó chịu

Khó chịu Rất khó chịu

Việc đánh giá chất lượng ảnh một cách chủ quan gặp nhiều khó khăn do phụ thuộc vào người quan sát và hình ảnh được quan sát Do đó, không thể chỉ dựa vào các công cụ tự động để đánh giá chất lượng ảnh Hơn nữa, định nghĩa về méo dạng cũng phụ thuộc vào ứng dụng cụ thể, cho thấy rằng việc đánh giá chất lượng tốt nhất không phải lúc nào cũng do con người thực hiện.

Méo dạng được đánh giá bằng cách so sánh ảnh sau xử lý với ảnh gốc thông qua các đại lượng khách quan như sai số tuyệt đối trung bình (MAE), sai số trung bình bình phương (MSE), tỉ số tín hiệu đỉnh trên nhiễu (PSNR), và hệ số tương quan chuẩn hóa (NCC) hay hệ số tương quan Pearson (ZNCC) Những chỉ số này giúp định lượng độ chính xác và chất lượng của ảnh đã qua xử lý.

Tầm động của độ sáng các điểm ảnh được ký hiệu là L (2.9), với L tối đa được tính theo công thức L = 2^B - 1 cho ảnh biểu diễn bằng B bit nhị phân PSNR không cung cấp thông tin mới so với MSE, trừ khi các ảnh so sánh có tầm động khác nhau, lúc đó PSNR mới trở nên hữu ích.

  là trung bình của hai tập mẫu

Đánh giá khách quan có thể thực hiện dễ dàng và tự động, nhưng hạn chế lớn nhất của nó là không phản ánh đầy đủ chất lượng hiển thị Dù vậy, phương pháp này vẫn được sử dụng chủ yếu để khảo sát các thuật toán watermarking khác nhau.

Các đại lượng khách quan như MSE, PSNR và NCC được sử dụng phổ biến trong thực tế, nhưng không có mối liên hệ rõ ràng nào giữa chúng và khả năng cảm thụ của hệ thống thị giác con người (HVS) Điều này dẫn đến trường hợp hai ảnh sau xử lý có cùng MSE so với ảnh gốc, nhưng một ảnh có thể không được cảm nhận tốt như ảnh kia.

Để đánh giá chất lượng ảnh sau khi watermarking, việc chỉ dựa vào các đại lượng khách quan thường không chính xác, vì mắt người không nhạy cảm với sự thay đổi nhỏ giữa các pixel mà nhạy hơn với sự thay đổi về giá trị trung bình và độ tương phản trong vùng lớn Một phương pháp mới được đề xuất để đo độ trung thực của ảnh là chỉ số SSIM (Structural Similarity Index Measurement), dựa trên quan sát rằng ảnh tự nhiên có tính cấu trúc cao, với các mẫu lân cận phụ thuộc vào nhau SSIM đo sự tương đồng giữa hai khối ảnh cục bộ bằng cách xem xét ba thành phần: độ chói, độ tương phản và cấu trúc, thông qua các thống kê đơn giản để tạo thành chỉ số SSIM cục bộ.

SSIM là chỉ số đo độ tương đồng giữa hai hình ảnh, với giá trị nằm trong khoảng -1 đến 1, trong đó s = 1 khi và chỉ khi hai hình ảnh hoàn toàn giống nhau (x = y) Để đảm bảo tính ổn định cho các thành phần tương đồng, các hằng số dương nhỏ C1, C2, C3 được sử dụng, đặc biệt trong các trường hợp liên quan đến trung bình mẫu, độ lệch chuẩn và tương quan.

0 cũng không dẫn đến bất kì sự bất ổn nào trong tính toán số Thực ra, ngay cả khi C1 C2 = C3 = 0 thì SSIM thường hoạt động khá tốt

SSIM được tính toán cục bộ trong cửa sổ trượt qua từng điểm ảnh, tạo thành bản đồ SSIM Giá trị cuối cùng của SSIM cho toàn ảnh được tính bằng cách lấy trung bình các giá trị SSIM hoặc theo trọng số không gian thích nghi Để đạt được kết quả tốt nhất, cần sử dụng giải pháp SSIM với nhiều tỉ lệ khác nhau.

Một hạn chế của chỉ số SSIM là sự nhạy cảm với các phép dịch chuyển tương đối, co dãn và xoay ảnh Để khắc phục điều này, chỉ số CW-SSIM (Chỉ số Độ tương đồng Kết cấu Wavelet Phức) đã được phát triển Trong đó, cx và cy là các hệ số biến đổi wavelet phức trong cùng băng tần con tại cùng vị trí không gian của hai khối ảnh.

2.2.2 Đánh giá về tính bền vững và độ tin cậy

Trong quá trình watermarking, tính bền vững được đánh giá dựa trên khả năng khôi phục watermark trước các tấn công khác nhau, thông qua việc so sánh mức độ giống nhau giữa watermark trích và watermark nhúng Điều này thường được đo bằng các chỉ số liên quan đến giá trị tương quan Khi watermark được tạo ra từ việc mã hóa chuỗi bit, tính bền vững được xác định bởi tỉ lệ bit lỗi (BER) và thông số lỗi phát hiện Bộ phát hiện watermark sẽ so sánh các thông số này với một ngưỡng nhất định, dẫn đến hai khả năng lỗi: lỗi không phát hiện (false positive) và lỗi phát hiện sai (false alarm) Những lỗi này ảnh hưởng đến độ tin cậy của hệ thống, với xác suất tồn tại watermark trong ảnh tăng lên khi ngưỡng giảm.

Phân loại watermarking

Có nhiều tiêu chí khác nhau để phân loại các kỹ thuật watermarking Sau đây là một số cách phân loại watermarking:

 Dựa trên đối tượng bao phủ: watermarking cho hình ảnh, âm thanh hay chuỗi video

 Dựa trên yêu cầu bền vững: watermarking bền vững hay nhạy với tác động

 Dựa trên miền nhúng: watermarking trực tiếp miền thời gian/không gian hay miền biến đổi

 Dựa trên giải thuật nhúng và trích: watermarking dựa trên tương quan (các giải thuật nhúng chuỗi giả ngẫu nhiên và phát hiện dùng hàm tương quan như giải

31 thuật trải phổ SS) hay không tương quan (như giải thuật LSB, lượng tử hay giải thuật dựa trên quan hệ hình học)

 Dựa trên yêu cầu bảo mật: watermarking không dùng khóa, dùng khóa riêng hay khóa chung

 Dựa trên khả năng đảo ngược: watermarking có thể khôi phục chính xác dữ liệu bao phủ hay không

 Dựa trên vị trí nhúng: watermarking toàn cục hay cục bộ

 Dựa trên cách thức trích: watermarking tường minh (có đầy đủ thông tin tiên nghiệm) hay mù (thiếu thông tin tiên nghiệm).

Các phương pháp watermarking

Phương pháp LSB là một kỹ thuật đơn giản và phổ biến trong việc nhúng thông tin Trong phương pháp này, dữ liệu được chuyển đổi thành dạng bit và sau đó được chèn vào các bit có trọng số nhỏ của dữ liệu chứa, như minh họa trong Hình 2.3.

Hình 2.3 Mô hình đơn giản của phương pháp LSB

Để tăng dung lượng thông tin nhúng, kỹ thuật LSB có thể được mở rộng cho các mặt phẳng bit có trọng số thấp liền kề, cho phép nhúng nhiều dữ liệu hơn mà vẫn giữ nguyên chất lượng của tín hiệu gốc.

Việc sử dụng 32 bit cho các bit có trọng số thấp của dữ liệu bao phủ sẽ không gây ra sự thay đổi đáng kể trong dữ liệu, từ đó đảm bảo tính cảm thụ của thông tin.

Phương pháp LSB cho phép trích xuất thông tin bằng cách lấy các bit có trọng số thấp từ dữ liệu nhúng với độ chính xác cao Tuy nhiên, do thông tin có thể được truy xuất nếu xác định được vị trí nhúng, độ bảo mật của phương pháp này khá thấp Để khắc phục điều này, luận án đề xuất giải pháp kết hợp kỹ thuật mã hóa và mật mã nhằm nhúng thông tin cá nhân vào ảnh y tế DICOM, từ đó tăng cường tính bảo mật cho ứng dụng y tế từ xa.

2.4.2 Phương pháp watermarking lượng tử

Lượng tử hóa là quá trình ánh xạ các khoảng giá trị ban đầu thành giá trị đại diện tương ứng Trong watermarking, quá trình này xấp xỉ giá trị dữ liệu bằng các giá trị lượng tử cách đều nhau, với bước lượng tử (Delta) được xác định dựa trên giá trị thông tin Các giá trị lượng tử thường được thiết kế là giá trị trung bình của từng khoảng giá trị ban đầu, nhằm giảm thiểu sai số lượng tử và khác biệt giữa giá trị trước và sau khi nhúng thông tin.

Tùy thuộc vào bit thông tin b, giá trị nhúng sau lượng tử được xác định như sau:

Quá trình trích thông tin được xác định như sau:

Để đơn giản hóa việc biểu diễn và thực hiện so với phương pháp watermarking lượng tử trong các nghiên cứu trước đó, luận án này giới thiệu một cách tiếp cận mới sử dụng hai bộ lượng tử cho mỗi bit thông tin 0 và 1 Cụ thể, giá trị lượng tử cho bộ lượng tử chẵn là = 2, trong khi giá trị cho bộ lượng tử lẻ là = 2 + 1 Khi nhúng một bit thông tin vào giá trị điểm ảnh, cần kiểm tra giá trị đó là 0 hay 1 để lựa chọn bộ lượng tử phù hợp, sau đó xác định giá trị lượng tử gần nhất bằng cách tính khoảng cách nhỏ nhất từ giá trị cần nhúng đến các giá trị lượng tử đã cho.

Độ rộng lượng tử lớn giúp tăng cường khả năng trích xuất thông tin chính xác trong các tấn công, nhờ vào khoảng cách lớn giữa các giá trị lượng tử của hai bộ lượng tử, từ đó dễ dàng phân biệt giá trị bit “0” và “1” Tuy nhiên, điều này cũng dẫn đến sự suy giảm chất lượng ảnh, khi giá trị sau lượng tử thay đổi đáng kể so với giá trị ban đầu Để so sánh với phương pháp trải phổ, độ méo giữa ảnh nhúng và ảnh gốc được đánh giá thông qua chỉ số sai số trung bình bình phương (MSE).

D = E[(Q – s) 2 ] = 2 /3 (2.17) Việc trích xuất thông tin đã nhúng thông qua phương pháp lượng tử hóa diễn ra dễ dàng, nhờ vào việc có sẵn bảng giá trị lượng tử Từ đó, giá trị thu được sẽ được so sánh với cả hai bộ lượng tử để phục hồi thông tin nhúng từ giá trị lượng tử gần nhất, như được trình bày trong các công thức (2.32a-b) và (2.33).

Phương pháp watermarking lượng tử là một sự mở rộng tổng quát của phương pháp LSB, với trường hợp đặc biệt khi = 1 tương ứng với LSB Khác với phương pháp trải phổ thực hiện nhúng thông điệp theo cách toàn cục và yêu cầu sự đồng bộ của watermark, phương pháp watermarking lượng tử thực hiện nhúng thông điệp theo cách cục bộ và chỉ phụ thuộc vào vị trí nhúng Điều này mang lại khả năng bền vững trước các tấn công đồng bộ nếu quá trình trích thông điệp xác định chính xác vị trí nhúng.

2.4.3 Phương pháp watermarking trải phổ

Luận án xem xét mô hình watermarking thiếu thông tin tiên nghiệm dựa trên kỹ thuật trải phổ truyền thống như Hình 2.4

Hình 2.4 Mô hình watermarking trải phổ thiếu thông tin tiên nghiệm truyền thống

Một bộ giả ngẫu nhiên PRN với khóa bí mật K tạo ra chuỗi ngẫu nhiên U, hay còn gọi là chuỗi watermark, được sử dụng trong cả quá trình nhúng và trích thông tin Để đơn giản hóa việc trình bày kết quả phân tích, luận án áp dụng ký hiệu E[A] hoặc (̅ để biểu thị giá trị trung bình của tất cả phần tử trong dữ liệu A (dưới dạng vector hoặc ma trận) Ký hiệu được sử dụng để nhân từng phần tử của hai ma trận, trong khi ký hiệu * cho phép thực hiện phép nhân giữa hai ma trận.

Không mất tính tổng quát, giả sử chuỗi watermark thỏa tính chất trung bình 0 và chuẩn hóa, nghĩa là:

+,- = -/ = 0 (2.21) +,- - = 1 (2.22) Ở quá trình nhúng, chuỗi watermark U được nhúng vào ảnh gốc X theo hệ số độ mạnh nhúng  và bit thông tin b tương ứng để tạo thành ảnh nhúng S

0 = 1 +  - (2.23) Lúc này, độ méo dạng giữa ảnh nhúng và ảnh gốc được đánh giá qua độ đo sai số trung bình bình phương (MSE)

Mô hình tấn công được xem xét là nhiễu cộng Gaussian, dẫn đến ảnh thu được tại đầu vào quá trình trích sẽ tương ứng với ảnh sau khi bị tấn công.

Trong quá trình trích xuất, giá trị trung bình r của tích số giữa ảnh thu được và chuỗi watermark được tính toán và so sánh với giá trị ngưỡng để xác định bit thông tin cần trích Phương pháp tính toán giá trị trung bình này tương tự như các bước đã thực hiện trong quá trình trích xuất.

35 cách tính tương quan trong xử lý tín hiệu hay cách tính tích nội trong đại số tuyến tính như thể hiện trong công thức sau:

6 = +, 4 − 47 - − -/ (2.26) Nếu điều kiện (2.14) thỏa, khi đó công thức (2.19) có thể rút gọn thành

6 = +,4 - (2.27) Nếu điều kiện (2.15) thỏa, công thức (2.20) sẽ được triển khai thành

Phương pháp trải phổ cho phép quá trình nhúng và trích thông tin diễn ra đơn giản mà không cần dữ liệu gốc, do đó phù hợp với nhiều ứng dụng thực tiễn Để đánh giá xác suất lỗi, cần xác định hàm phân bố của hệ số tương quan trích r trong công thức (2.28) Giả sử dữ liệu gốc có phân bố Gaussian, tức là X ~ N(mx, σx²), thì hệ số tương quan trích cũng sẽ có phân bố Gaussian, cụ thể là r ~ N(mr, σr²), với giá trị trung bình và phương sai được xác định theo công thức mr = bα (2.29a).

Dựa trên các công thức (2.29a) và (2.29b), chúng ta có thể xác định ngưỡng tối ưu T cho bộ so sánh quyết định khi nhúng bit thông tin b = {b1, b2}, cùng với xác suất lỗi bit tương ứng.

= = 3 >6?@ A |9 3√3D < B9 : E |  F (2.31) trong đó erfc(.) là hàm sai số bù

Theo phương trình (2.32), để tối ưu hóa hiệu quả, độ mạnh của watermark nên được tăng cường Tuy nhiên, việc gia tăng độ mạnh này có thể dẫn đến sự suy giảm chất lượng của ảnh nhúng, như được chỉ ra bởi độ méo dạng trong công thức (2.24).

Các biến đổi

Trước sự gia tăng các cuộc tấn công trong quá trình truyền tín hiệu, đặc biệt là do sự xuất hiện của các thuật toán nén dữ liệu, tổn hao trong tấn công trên kênh truyền của quy trình watermarking ngày càng gia tăng Để giải quyết vấn đề này, các kỹ thuật mới được phát triển ứng dụng trong miền biến đổi nhằm chuyển tín hiệu từ miền không gian sang miền khác, tạo điều kiện thuận lợi hơn cho việc nhúng tín hiệu Trong miền này, thông tin nhúng sẽ có độ bền cao hơn trước các cuộc tấn công.

Trong kỹ thuật watermarking, việc sử dụng các biến đổi như DCT và DWT chủ yếu nhằm nâng cao tính bền vững của watermark trước các phương pháp nén như JPEG và JPEG2000 Đối với những trường hợp yêu cầu giải tương quan triệt để và nén năng lượng tối ưu, việc áp dụng các kỹ thuật này là rất cần thiết.

39 thể khai thác biến đổi KLT Trong khi đó, biến đổi SIFT được sử dụng để nâng cao hiệu quả watermarking trước các tấn công đồng bộ

Phép biến đổi cosin rời rạc (DCT) chuyển đổi chuỗi dữ liệu hữu hạn thành tổng các hàm cosin với tần số khác nhau DCT tương tự như biến đổi Fourier rời rạc (DFT) nhưng chỉ sử dụng các số thực Kỹ thuật này giúp chuyển đổi thông tin từ miền thời gian hoặc không gian sang miền tần số, rất phổ biến trong xử lý tín hiệu và nén dữ liệu Trong nhiều ứng dụng thực tế, DCT được xem là xấp xỉ tối ưu của KLT với chi phí tính toán hợp lý và đã được công nhận trong các tiêu chuẩn quốc tế.

DCT một chiều chuyển đổi biên độ tín hiệu tại các điểm rời rạc theo thời gian hoặc không gian thành chuỗi hệ số rời rạc, với mỗi hệ số đại diện cho biên độ của một thành phần tần số nhất định trong tín hiệu gốc Quá trình biến đổi DCT thuận (FDCT - Forward DCT) và DCT ngược (IDCT - Inverse DCT) được định nghĩa cho tín hiệu một chiều như sau:

DCT N-điểm của x[n] có thể đạt được từ DFT 2N-điểm của tín hiệu mở rộng đối xứng LX,J với

1Y Z , = ∑ 3PB S LX,J.> B[3O \] 1, b0 > 0 (2.41)

Họ wavelets được rời rạc hóa:

44 trong đó  m , n (t) được chuẩn hóa bằng 1

Các wavelet hẹp với tần số cao được dịch bằng các bước ngắn, trong khi các wavelet rộng với tần số thấp được dịch bằng các bước dài hơn.

Biến đổi Wavelets rời rạc DWT (Discrete Wavelet Transform) của tín hiệu f(t) được định nghĩa là:

Thông thường, người ta chọn a0 = 2 và b0 = 1  m,n(t) = 2 -m/2 (2 -m t – n)

Với một hàm (t) xác định và với các giá trị thích hợp của a0, b0, tồn tại mỗi họ

 m để tín hiệu f(t) có thể được phục hồi từ công thức: f(t) =   

Phép biến đổi DWT, được phát triển từ năm 1976 bởi Croiser, Esteban và Galand, đã mở ra một kỹ thuật mới trong việc biến đổi tín hiệu thời gian rời rạc Cuối năm 1976, Crochiere, Weber và Flanagan đã ứng dụng DWT vào việc mã hóa tiếng nói, cho thấy sự tương đồng với các kỹ thuật trước đó.

Croiser, hay còn gọi là mã hóa băng con (subband coding), được phát triển bởi Burt và Adelson vào năm 1983 với tên gọi mã hóa hình tháp (pyramidal coding) Đến năm 1989, Mallat đã giới thiệu kỹ thuật phân tích đa phân resolution (multiresolution analysis) dựa trên mã hóa hình tháp và đề xuất các hàm wavelet trực giao để ứng dụng trong xử lý tín hiệu số.

Tấn công siêu phân giải dùng trí tuệ nhân tạo

Trí tuệ nhân tạo, bao gồm học máy và học sâu, đã được áp dụng rộng rãi và đạt nhiều thành tựu trong các lĩnh vực khác nhau Gần đây, học sâu đã chứng tỏ tiềm năng lớn trong xử lý ảnh, với các nhiệm vụ như phân đoạn, phân loại, khử nhiễu và giải quyết các bài toán ngược Khác với các phương pháp phân tích truyền thống, nơi các vấn đề được xác định rõ ràng và kiến thức miền được thiết kế cẩn thận, mạng thần kinh sâu không dựa vào kiến thức trước đó mà thay vào đó sử dụng tập dữ liệu lớn để khám phá các giải pháp chưa biết cho các bài toán ngược.

Siêu phân giải (SR) là một bài toán ngược nhằm nâng cao độ phân giải không gian của hình ảnh kỹ thuật số Quá trình này liên quan đến việc khôi phục hình ảnh có độ phân giải cao (HR) từ hình ảnh có độ phân giải thấp (LR).

Một bức ảnh có thể có "độ phân giải thấp hơn" do độ phân giải không gian nhỏ hoặc do sự suy giảm chất lượng Các thuật toán tăng cường độ phân giải (SR) được phân loại dựa trên số lượng hình ảnh đầu vào và đầu ra Luận án này tập trung vào SR ảnh đơn, trong đó một ảnh có độ phân giải cao (HR) được khôi phục từ một ảnh có độ phân giải thấp (LR).

Hình ảnh HR cung cấp cấu trúc thông tin chi tiết hơn so với hình ảnh LR Nhu cầu về hình ảnh SR ngày càng tăng và đóng vai trò quan trọng do giá trị ý nghĩa mà nó mang lại.

Độ chi tiết của thông tin trong lĩnh vực chẩn đoán ảnh y tế rất quan trọng, đặc biệt khi phân tích hình ảnh y tế Nhu cầu về chi tiết phong phú trong hình ảnh là rất lớn, và chẩn đoán thường được thực hiện tốt nhất khi các chi tiết nhỏ được giữ lại với độ phân giải cao Tuy nhiên, việc thu được hình ảnh y tế có độ phân giải cao gặp nhiều thách thức và tốn kém do yêu cầu công cụ phức tạp, nguồn nhân lực được đào tạo và có thể gây ra sự chậm trễ trong hoạt động Do đó, việc truy xuất hình ảnh HR từ hình ảnh LR thông qua phương pháp SR là một giải pháp tiềm năng.

Về mặt kỹ thuật, hình ảnh SR là kỹ thuật tái tạo lại nội dung tần số cao trong ảnh

Khi áp dụng các phương pháp Super Resolution (SR), chỉ cần hình ảnh độ phân giải thấp (LR) giúp giảm độ phức tạp trong việc thu nhận ảnh Tuy nhiên, SR là một nhiệm vụ khó khăn, đặc biệt trong lĩnh vực y tế, nơi các chi tiết nhỏ như cấu trúc giải phẫu có vai trò quan trọng trong chẩn đoán Do đó, các phương pháp SR cần tránh gây ra hiệu ứng không mong muốn, ảnh hưởng đến độ chính xác trong chẩn đoán Các phương pháp SR được chia thành hai nhóm chính: phương pháp truyền thống và phương pháp học sâu Phương pháp truyền thống bao gồm ba loại: nội suy, tái tạo và học đặc trưng, trong khi các phương pháp học sâu đã cho thấy sự vượt trội hơn so với nhiều phương pháp truyền thống Các kỹ thuật SR dựa trên học sâu có khả năng trích xuất chi tiết phong phú từ ảnh LR, và mặc dù tài liệu về ứng dụng học sâu trong SR ảnh y tế mới xuất hiện, nhưng đã thu hút sự quan tâm lớn cho các phương thức hình ảnh như MRI và CT Hai ưu điểm chính của phương pháp học sâu là khả năng tính toán song song và khả năng biểu diễn mạnh mẽ.

Bài báo [122] đã giới thiệu việc sử dụng khối phần dư (residual block) để giải quyết những khó khăn trong việc huấn luyện các mạng thần kinh sâu cho bài toán siêu phân giải ảnh đơn.

Bài báo đề xuất khối dày đặc (dense block) nhằm khai thác các tính năng phân cấp cho siêu phân giải ảnh, nhưng gặp hạn chế về tốc độ tăng trưởng (growth rate) và khó khăn trong việc huấn luyện mạng rộng hơn Zhang và cộng sự đã phát triển mạng dày đặc phần dư (RDN) với các khối dày đặc phần dư (RDB), cho phép kết nối trực tiếp trạng thái và hợp nhất tính năng cục bộ để tận dụng tối đa các tính năng phân cấp từ ảnh LR ban đầu, tạo ra ảnh SR chất lượng cao Phương pháp này kết hợp các tính năng tích chập của lớp nông vào khối RDB để thu được tính năng toàn cục và cục bộ, trong khi mỗi lớp trong khối RDB được kết nối trực tiếp với lớp trước đó nhằm tái sử dụng tính năng Cuối cùng, lớp tích chập pixel phụ được sử dụng để lấy mẫu lên và tái tạo siêu phân giải, mang lại hình ảnh có độ phân giải cao rõ ràng.

Hình 2.16 Kiến trúc mạng RDN

Học phần dư toàn cục

Học phần dư cục bộ

Trong số các phương pháp siêu phân giải (SR) dựa trên học sâu, các phương pháp sử dụng Mạng Đối Kháng Sinh (GAN) đã cho thấy sự cải thiện đáng kể GAN bao gồm hai thành phần chính: mô hình tạo sinh G và mô hình phân biệt D Hình 2.17 minh họa lưu đồ thuật toán tạo ảnh SR điển hình sử dụng mạng GAN thông qua phương pháp huấn luyện nhiều lần với tập dữ liệu bao gồm ảnh có độ phân giải cao (HR) và ảnh.

Quá trình suy giảm chất lượng từ ảnh HR dẫn đến việc sử dụng các ảnh LR qua bộ G để tạo ra ảnh SR Ảnh SR sau đó được so sánh với ảnh HR từ tập dữ liệu tương ứng nhằm đánh giá chất lượng Hàm mất mát được tính toán dựa trên các bản đồ đặc trưng của ảnh SR thông qua bộ D và mô hình VGG cho ảnh HR Hàm mất mát này được cập nhật cho bộ G để điều chỉnh ảnh SR sao cho giống nhất với ảnh HR Giá trị hàm mất mát của bộ G và bộ D được lan truyền ngược để cải thiện quá trình Cuối cùng, khi hàm mất mát đạt giá trị trung bình, điều này có nghĩa là bộ D không còn khả năng phân biệt các ảnh siêu phân giải.

SR được tạo ra và bộ G cũng hội tụ

Hình 2.17 Lưu đồ giải thuật tạo ảnh siêu phân giải dựa trên GAN

Các mạng GAN (Generative Adversarial Networks) hoạt động tương tự như quá trình sinh học tiến hóa, với sự cạnh tranh giữa hai bộ phận: bộ phân biệt (D) và bộ tạo sinh (G) Quá trình huấn luyện diễn ra song song, trong đó bộ D được tối đa hóa hàm mục tiêu trong khi bộ G được tối thiểu hóa, tạo ra một cuộc đua tiến hóa hiệu quả giữa hai bộ phận này.

Để tối ưu hóa hàm mất mát E(D, G) trong bộ G, cần tuân theo công thức (2.69) Trong đó, L là ảnh LR đầu vào và L… = s L là ảnh SR được tạo ra.

Hàm mất mát của bộ D được định nghĩa như sau:

Hàm mất mát đối nghịch của bộ G có dạng đối xứng như sau:

Thực tế cho thấy rằng việc chỉ sử dụng hàm mất mát đối nghịch trong bộ G không đủ để đảm bảo chất lượng ảnh tạo Do đó, đã có nhiều hàm mất mát thành phần được xem xét và bổ sung để cải thiện kết quả.

Hàm mất mát cảm thụ bổ sung ở cấp độ điểm ảnh, thường được sử dụng trong hình ảnh siêu phân giải (SR), là cơ sở cho nhiều phương pháp tiên tiến hiện nay Các phương pháp này thường dựa vào MSE để tính toán hiệu quả.

‰ oŠ‹ ŠŒ = ˆ < •Ž ∑ ˆ• |S ∑ ˆŽ }S u |,} ŽŒ − s • • u ‘Œ |,} 3 (2.72) trong đó s• • u ‘Œ là ảnh khôi phục và u|,} ŽŒ là ảnh lấy mẫu xuống với hệ số giảm mẫu r

Một loại hàm mất mát bổ sung tại cấp độ điểm ảnh được xác định thông qua khoảng cách norm-1 giữa ảnh khôi phục s L và ảnh nhãn y, được thể hiện trong công thức (2.73): q = +| ’‖s L − r‖ (2.73).

Kết luận chương

Hệ thống watermarking được phân tích dựa trên lý thuyết truyền thông tin với ba thành phần chính: nhúng thông điệp, kênh tấn công, và trích thông điệp Các thông số đánh giá đặc tính của hệ thống bao gồm khả năng cảm thụ (MSE, PSNR, SSIM), tính bền vững (BER), độ tin cậy (%), dung lượng nhúng (số lượng bit nhúng), và tính bảo mật (khóa bí mật) Những thông số này tạo nền tảng cho việc phân loại các hệ thống watermarking.

Ba phương pháp watermarking ảnh phổ biến bao gồm LSB, trải phổ và lượng tử, được phân tích chi tiết qua các mô hình toán học Các phép biến đổi DCT, DWT, KLT và SIFT cũng được trình bày và đánh giá về ưu nhược điểm nhằm nâng cao hiệu quả watermarking Kỹ thuật siêu phân giải sử dụng trí tuệ nhân tạo và mạng thần kinh sâu được đề cập như một thách thức hiện đại đối với tính bền vững của kỹ thuật watermarking Trên cơ sở lý thuyết này, các giải pháp nâng cao hiệu quả watermarking sẽ được phân tích và thảo luận trong các chương tiếp theo.

CHƯƠNG 3 NÂNG CAO HIỆU QUẢ KỸ THUẬT WATERMARKING LSB ỨNG DỤNG CHO ẢNH Y TẾ DICOM

Chương này trình bày đóng góp đầu tiên của luận án với hai giải pháp DICOM_LSB_AES và DICOM_LSB_AES_RONI nhằm nâng cao bảo mật cho việc nhúng thông tin trong ảnh y tế DICOM trong lĩnh vực y tế từ xa Giải pháp này khai thác kỹ thuật watermarking LSB kết hợp với mã hóa AES Đầu tiên, luận án giới thiệu lý do lựa chọn và các thông số cơ bản của kỹ thuật mã hóa AES Tiếp theo, các đặc tính và vấn đề bảo mật của ảnh DICOM được đề cập Hai giải pháp DICOM_LSB_AES và DICOM_LSB_AES_RONI sau đó được mô tả và phân tích từ lý thuyết đến mô phỏng Cuối cùng, luận án tổng hợp kết quả thử nghiệm ứng dụng thực tiễn của hai giải pháp này tại các bệnh viện.

Mã hóa mật mã AES

Mã hóa mật mã là quá trình chuyển đổi dữ liệu có thể đọc được (plaintext) thành định dạng không thể đọc được (ciphertext), nhằm ngăn chặn truy cập trái phép khi dữ liệu được trao đổi trong môi trường mạng không an toàn Việc mã hóa dữ liệu giúp ngăn chặn các hành vi như nghe trộm, xem lén, chỉnh sửa, đánh cắp dữ liệu, giả mạo thông tin và chối bỏ dữ liệu Sau khi nhận được dữ liệu đã mã hóa, người nhận sẽ thực hiện giải mã để đưa dữ liệu về dạng cơ bản ban đầu.

Thuật toán mã hóa đối xứng sử dụng một khóa bí mật chung để mã hóa và giải mã dữ liệu, yêu cầu khóa này phải được chia sẻ trước giữa bên truyền và bên nhận Việc bảo vệ khóa bí mật cho phép lựa chọn thuật toán với độ dài ngắn hơn, giúp tăng tốc độ tính toán Thông thường, thuật toán đối xứng đơn giản hơn và có thể được tăng tốc bằng phần cứng chuyên dụng, phù hợp cho việc mã hóa lượng dữ liệu lớn Tuy nhiên, thách thức lớn nhất khi sử dụng thuật toán đối xứng là quản lý khóa, vì khóa bí mật cần được trao đổi qua kênh an toàn trước khi bắt đầu truyền dữ liệu.

Kỹ thuật mã hóa đối xứng phổ biến nhất là mã hóa khối, trong đó dữ liệu gốc (plaintext) được mã hóa thành dữ liệu đã mã hóa (ciphertext) với kích thước cố định, thường là 64 hoặc 128 bit Kích thước khối xác định lượng dữ liệu được mã hóa tại một thời điểm; nếu dữ liệu đầu vào nhỏ hơn kích thước khối, thuật toán sẽ thêm bit giả để đạt được kích thước cần thiết.

Các thuật toán mã hóa đối xứng phổ biến bao gồm DES (Data Encryption Standard) và AES (Advanced Encryption Standard), trong đó AES được ưa chuộng hơn trong thế giới hiện đại và thay thế cho DES đã có từ năm 1977 AES vượt trội hơn DES và 3DES, đặc biệt trong các môi trường yêu cầu thông lượng cao và độ trễ thấp, và có thể thực hiện dễ dàng với tốc độ cao bằng phần mềm hoặc phần cứng mà không cần nhiều bộ nhớ AES được công nhận là tiêu chuẩn mã hóa của chính phủ Mỹ, do Viện Tiêu chuẩn và Công nghệ quốc gia Mỹ (NIST) phát hành vào ngày 26/11/2001, và được phép sử dụng cho thông tin mật từ tháng 6/2003 Thiết kế và độ dài khóa của thuật toán AES là 128 bit.

Để bảo vệ thông tin được xếp loại TỐI MẬT, việc sử dụng khóa mã hóa 192 hoặc 256 bít là cần thiết Đối với các thông tin TUYỆT MẬT, khóa 192 hoặc 256 bít là yêu cầu bắt buộc để đảm bảo an toàn tối đa.

Kể từ khi được công nhận là tiêu chuẩn, AES đã trở thành một trong những thuật toán mã hóa phổ biến nhất, sử dụng khóa mã đối xứng cho quá trình mã hóa và giải mã Tại Việt Nam, thuật toán AES được công bố là tiêu chuẩn quốc gia TCVN 7816:2007 vào năm 2007, quy định về thuật toán mã hóa dữ liệu AES.

AES, hay Advanced Encryption Standard, được xây dựng dựa trên thuật toán Rijndael do Joan Daemen và Vincent Rijmen phát triển Rijndael là một thuật toán lặp với khả năng sử dụng khối và khóa có độ dài thay đổi Để đạt được kết quả cuối cùng, khối dữ liệu đầu vào và khóa sẽ trải qua nhiều vòng biến đổi Khóa 128 bit là một trong những tùy chọn phổ biến trong quá trình mã hóa này.

192 hoặc 256 bits có thể được sử dụng để mã hóa các khối dữ liệu có kích thước 128,

Thuật toán này hỗ trợ 3 độ dài khóa khác nhau, bao gồm 192 và 256 bits, và do đó được biết đến với 3 tên gọi tương ứng.

“AES-128”, “AES-192” và “AES-256” Nhiều phần mềm thương mại hiện nay sử dụng mặc định khóa có độ dài 128 bit AES-128 sử dụng 10 vòng (round), AES-192 sử dụng

12 vòng và AES-256 sử dụng 14 vòng

Thuật toán AES sử dụng bốn phép biến đổi chính trong quá trình mã hóa và giải mã: SubBytes(), ShiftRows(), MixColumns() và AddRoundKey() Các phép biến đổi này có thể được đảo ngược để thực hiện giải mã, với các phép biến đổi tương ứng là InvShiftRows(), InvSubBytes(), InvMixColumns() và AddRoundKey() Hình 3.1 minh họa quy trình mã hóa và giải mã của thuật toán AES.

Hình 3.1 Kỹ thuật mã hóa mật mã AES

Khi cài đặt thuật toán mã hóa AES, người ta thường không sử dụng ở dạng nguyên gốc mà áp dụng trong 4 chế độ cơ bản của mã khối n-bit, bao gồm ECB, CBC, CFB và OFB, theo tiêu chuẩn ISO/IEC 10116:1997 Hơn nữa, AES cũng được khuyến nghị trong tiêu chuẩn bảo mật định dạng tập tin DICOM (RFC5652).

Các vấn đề bảo mật với ảnh DICOM

DICOM, viết tắt từ Digital Imaging and Communications in Medicine, là tiêu chuẩn công nghiệp nhằm kết nối, lưu trữ, trao đổi và in ấn ảnh y tế Được phát triển bởi Hiệp hội ngành Chẩn đoán hình ảnh Mỹ (ACR) và Hiệp hội các nhà sản xuất Điện-Điện tử Mỹ (NEMA), tiêu chuẩn DICOM ra đời vào năm 1993, kế thừa từ tiêu chuẩn ACR-NEMA trước đó Hiện nay, việc quản lý DICOM thuộc về Ủy ban Tiêu chuẩn DICOM với sự tham gia của nhiều công ty sản xuất thiết bị y tế lớn trên toàn cầu Tiêu chuẩn này cho phép tích hợp dễ dàng các thiết bị như máy CT, MR, và US vào hệ thống lưu trữ và truyền hình ảnh PACS DICOM tạo ra ngôn ngữ chung cho giao tiếp hình ảnh và thông tin y tế, giúp các bệnh viện và phòng khám áp dụng rộng rãi trong thực tiễn.

Tập tin DICOM không chỉ chứa dữ liệu hình ảnh mà còn bao gồm thông tin quan trọng về bệnh nhân và loại máy tạo ra bức ảnh, điều này làm cho định dạng DICOM khác biệt so với các định dạng ảnh khác Các tập tin DICOM được tạo ra từ nhiều phương thức chụp ảnh khác nhau và thường có phần mở rộng là dcm.

Hình 3.3 Khuôn dạng tập tin DICOM

Phần Header của tập tin DICOM chứa thông tin bộ định danh dữ liệu, bắt đầu bằng 128 bytes Preamble có giá trị 00H, tiếp theo là 4 bytes ký tự “DICM” để nhận dạng tập tin.

Phần Data Set trong ảnh DICOM bao gồm nhiều Data Element tạo thành trường thông tin, như minh họa ở Hình 3.4 Các Data Element ở đầu tập tin chứa thông tin quan trọng được gọi là File Meta Information Tiếp theo là các Data Element chứa nội dung của tập tin DICOM, bao gồm hình ảnh, thông tin hình ảnh và thông tin bệnh nhân Mỗi cấu trúc thành phần dữ liệu đều yêu cầu ba trường bắt buộc: nhãn (Tag), chiều dài giá trị (Value Length) và trường giá trị (Value Field).

Hình 3.4 Cấu trúc của Data Element

Nhãn (Tag) là một cặp số nguyên không dấu 16 bits, thường được định dạng dưới dạng số hex (FFFF), dùng để thể hiện nhóm (Group ID) và số thành phần (Element ID) Nhãn này giúp xác định ý nghĩa của các thành phần dữ liệu, như được minh họa trong Bảng 3.1.

Bảng 3.1 Bảng mô tả một số tag của DICOM

Chiều dài giá trị (Value Length) là một số nguyên không dấu 16 bits hoặc 32 bits, thể hiện chiều dài hiện tại của trường giá trị tính bằng số byte (chẵn) tạo nên giá trị Chiều dài này không bao gồm chiều dài của nhãn thành phần lệnh và trường chiều dài lệnh Nếu Value Length có giá trị FFFFFFFFH, độ dài của Data Element sẽ được coi là không xác định.

Trường giá trị (Value Field) là một tập hợp các byte chứa giá trị của thành phần dữ liệu Loại dữ liệu được lưu trữ trong trường này được xác định bởi.

VR là một nhãn thành phần dữ liệu cụ thể, được xác định thông qua từ điển dữ liệu hoặc được lưu trữ trực tiếp trong trường VR của thành phần dữ liệu.

VR (Value Representation) là chuỗi ký tự 2 bytes mô tả kiểu dữ liệu và định dạng của thành phần dữ liệu Mỗi VR tương ứng với một nhãn thành phần dữ liệu cụ thể được định nghĩa trong từ điển dữ liệu Hai ký tự VR được mã hóa theo bộ ký tự mặc định DICOM và trường này chỉ xuất hiện trong các cấu trúc thành phần dữ liệu VR tường minh.

Để xem ảnh DICOM, bác sĩ cần sử dụng phần mềm chuyên biệt, tuy nhiên, hầu hết các phần mềm này thiếu cơ chế bảo mật, làm tăng nguy cơ xâm phạm thông tin cá nhân trong quá trình lưu trữ và truyền nhận, đặc biệt là trên Internet Bất kỳ ai có khả năng đọc ảnh DICOM đều có thể truy cập và chỉnh sửa thông tin cá nhân trong đó Do đó, giải pháp đơn giản nhất để bảo vệ thông tin cá nhân là xóa bỏ nội dung các trường dữ liệu liên quan khi lưu trữ và truyền nhận ảnh DICOM.

Người sử dụng có thể thao tác với dữ liệu hình ảnh, nhưng thông tin cá nhân không thể khôi phục, khiến phương pháp này chỉ phù hợp cho thử nghiệm hoặc đào tạo liên quan đến ảnh DICOM Để khắc phục vấn đề này, một số tác giả đã áp dụng kỹ thuật mã hóa mật mã, trong đó mã AES tiên tiến được sử dụng phổ biến Tuy nhiên, việc mã hóa toàn bộ tập tin DICOM bằng AES không hiệu quả do kích thước lớn của tập tin này Thay vào đó, chỉ mã hóa các trường dữ liệu liên quan có thể là giải pháp tối ưu hơn.

Thông tin cá nhân trong ảnh DICOM không hoàn toàn thành công do cú pháp quy định cho các trường dữ liệu phải ở định dạng chuỗi ký tự, như trình bày trong Bảng 3.2 Dữ liệu sau khi mã hóa bằng AES có thể chứa các ký tự điều khiển trong bảng mã ASCII, như minh họa trong Bảng 3.3, dẫn đến khả năng giải mã sai và hiển thị tên bệnh nhân không chính xác.

Bảng 3.2 Cú pháp quy định cho các trường dữ liệu định dạng chuỗi ký tự

Tag Name VR Character Repertoire Value

0010) Patient Name PN Không cho phép các ký tự điều khiển

0020) Patient ID LO Không cho phép các ký tự điều khiển

Các ký tự in hoa, các chữ số, khoảng trắng và gạch dưới "_"

0040) Patient’s Sex CS Các ký tự in hoa, các chữ số, khoảng trắng và gạch dưới "_"

Bảng 3.3 Các kí tự điều khiển trong bảng mã ASCII dẫn tới việc giải mã sai

Viết tắt Tên kí tự Hệ thập phân

Viết tắt Tên kí tự

00 NULL Null character 13 CR Carriage Return

08 BS Backspace 28 FS File Separator

09 HT Horizontal Tab 29 GS Group Separator

10 LF Line Feed 30 RS Record Separator

11 VT Vertical Tab 31 US Unit Separator

Giải pháp đề xuất DICOM_LSB_AES

Chuẩn ảnh DICOM không phù hợp với giải pháp mã hóa AES cho thông tin cá nhân, do đó, luận án áp dụng kỹ thuật watermarking để nhúng thông tin cá nhân vào ảnh DICOM Kỹ thuật này cho phép giấu thông tin một cách không thể cảm nhận, điều mà mật mã không thể làm được Ảnh DICOM thường hỗ trợ đến 16 bit, giúp nâng cao chất lượng hiển thị cho chẩn đoán, do đó, việc hoàn thiện kỹ thuật watermarking thay thế bit trọng số thấp LSB có thể mang lại hiệu quả cảm thụ rõ rệt Phương pháp này cũng đơn giản trong việc nhúng và trích xuất thông tin, vì có thể thực hiện trực tiếp trong miền không gian Tuy nhiên, thông tin cá nhân nhúng có thể bị truy xuất nếu xác định được vị trí nhúng, dẫn đến độ bảo mật của phương pháp này rất thấp.

Luận án đề xuất giải pháp kết hợp kỹ thuật mã hóa và mã hóa AES để nhúng thông tin cá nhân vào ảnh y tế DICOM, được gọi là DICOM_LSB_AES, nhằm nâng cao tính bảo mật cho ứng dụng y tế từ xa.

Quá trình nhúng thông tin của giải pháp đề xuất DICOM_LSB_AES được thực hiện qua các bước sau:

 Bước 1: Mã hóa nhị phân chuỗi thông tin cá nhân theo đúng định dạng cấu trúc dữ liệu chuẩn DICOM

 Bước 2: Mã hóa mật mã AES chuỗi nhị phân dùng 1 từ mã bí mật

Trong bước 3, dữ liệu sau khi được mã hóa mật mã sẽ được chèn vào các mặt phẳng bit trọng số thấp (LSB) của ảnh gốc Sau khi hoàn tất quá trình nhúng, tất cả các trường dữ liệu liên quan đến thông tin cá nhân sẽ được xóa bỏ khỏi tập tin DICOM.

Quá trình trích thông tin của giải pháp đề xuất DICOM_LSB_AES được thực hiện ngược lại với các bước sau:

 Bước 1: Trích dữ liệu từ các mặt phẳng bit trọng số thấp LSB của ảnh nhúng

 Bước 2: Giải mã hóa mật mã AES chuỗi nhị phân trích với từ mã bí mật ban đầu

 Bước 3: Giải mã hóa nhị phân chuỗi bit thu được sau giải mã hóa mật mã theo đúng định dạng cấu trúc dữ liệu chuẩn DICOM

Phương pháp nhúng LSB cho thấy rằng việc tăng dung lượng chuỗi nhúng sẽ dẫn đến sự suy giảm chất lượng của ảnh Tuy nhiên, dung lượng chuỗi nhúng còn phụ thuộc vào kích thước của ảnh; ảnh càng lớn thì dung lượng chuỗi nhúng có thể được chèn vào càng nhiều Hình 3.5 minh họa rõ ràng sự suy giảm chất lượng của ảnh khi thay đổi số lượng mặt phẳng LSB được nhúng, với các ví dụ cụ thể: a) Ảnh gốc (8 bits), b) Ảnh nhúng 5-LSBs (25.02 dB), c) Ảnh nhúng 4-LSBs (32.43 dB), và d) Ảnh nhúng 3-LSBs (38.91 dB).

Hình 3.5 Ảnh CT gốc và nhúng với số lượng các mặp phẳng bit LSB khác nhau

Chất lượng ảnh nhúng phụ thuộc vào hệ thống thị giác của con người, cho phép chấp nhận tối đa 3 mặt phẳng LSB Khi số mặt phẳng LSB nhúng đạt 4, sự suy giảm chất lượng trở nên cảm nhận được nhưng vẫn nhẹ.

5 mặt phẳng LSB thì ảnh nhúng bị suy giảm chất lượng đáng kể

Các Hình 3.6-3.8 minh họa rõ ràng tính cảm thụ khi nhúng 3 mặt phẳng LSB vào các loại ảnh US, DX và MR Cụ thể, Hình 3.6 cho thấy ảnh gốc US (8 bits) và ảnh sau khi nhúng 3-LSBs với độ nhạy đạt 36.89 dB Tương tự, Hình 3.7 trình bày ảnh gốc DX (8 bits) và ảnh nhúng 3-LSBs với độ nhạy 38.02 dB Cuối cùng, Hình 3.8 thể hiện ảnh gốc MR (8 bits) cùng với ảnh nhúng 3 mặt phẳng bit LSB.

Theo các kết quả nghiên cứu, giá trị PSNR tối thiểu để đảm bảo chất lượng ảnh nhúng không bị cảm thụ là khoảng 37-38 dB Kết luận này cũng phù hợp với nhiều công trình nghiên cứu về watermarking cho ảnh 8 bit thông thường.

Các ảnh y tế DICOM với độ sâu bit lớn hơn 8 cho phép nhúng nhiều hơn 3 mặt phẳng LSB mà vẫn duy trì chất lượng ảnh Để xác định số lượng tối đa mặt phẳng LSB có thể nhúng, nghiên cứu đã phân tích lý thuyết về chỉ số MSE (Mean Squared Error) Trong đó, x và y lần lượt là giá trị thập phân của pixel ảnh gốc và ảnh nhúng, với cùng độ sâu bit B và chuỗi bit nhúng b có P bit tương ứng với P mặt phẳng LSB Công thức cho x, b và y được trình bày rõ ràng, cho thấy cách tính toán giá trị pixel sau khi nhúng thông tin.

2 P xP + 2 P-1 bP-1 + 2 P-2 bP-2 + 2 1 b1 + 2 0 b0 (3.3) Độ méo dạng trung bình:

MSELSB(y, x) = E[(y – x) 2 ] = E[2 (P-1)2 (bP-1 - xP-1) 2 + 2 (P-2)2 (bP-2 - xP-2) 2 +

Giả sử xác suất 0 và 1 là như nhau với các bit của pixel ảnh gốc và chuỗi bit nhỳng, nghĩa là p(xi = 0) = p(xi = 1) = p(bi = 0) = p(bi = 1) = ẵ

E[(bi - xi)] 2 = ẳ.(0 – 0) 2 + ẳ.(0 – 1) 2 + ẳ.(1 – 0) 2 + ẳ.(1 – 1) 2 = ẵ (3.5) Kết quả thu được:

Bảng 3.4 cho thấy giá trị lý thuyết của MSE và PSNR khi nhúng tối đa toàn bộ các điểm ảnh, đồng thời thay đổi số lượng mặt phẳng LSB nhúng cho các ảnh có độ sâu bit khác nhau Kết quả phân tích cho thấy rằng việc tăng số lượng mặt phẳng LSB nhúng có ảnh hưởng rõ rệt đến MSE và PSNR.

Việc thêm một mặt phẳng LSB vào ảnh sẽ dẫn đến sự giảm PSNR khoảng 6 dB Do đó, số lượng tối đa mặt phẳng LSB có thể nhúng được xác định dựa trên độ sâu bit của ảnh gốc, nhằm đảm bảo chất lượng của ảnh nhúng.

Bảng 3.4 Giá trị lý thuyết của MSE và PSNR

PSNR (dB) Độ sâu bit của ảnh gốc MSE

Phương pháp đề xuất cho phép nhúng thông tin với dung lượng cao lên đến 1 bit thông tin mỗi pixel trên mỗi mặt phẳng bit, có khả năng nhúng tối đa 98304 byte dữ liệu cá nhân vào 3 mặt phẳng LSB của ảnh xám kích thước 512 x 512 So với các thuật toán đã được trình bày trong bài báo, đây là một cải tiến đáng kể trong việc tối ưu hóa dung lượng thông tin nhúng.

Giải pháp đề xuất cho ảnh y tế DICOM đạt được mức độ bảo mật hai lớp nhờ vào việc kết hợp kỹ thuật mã hóa và quá trình nhúng trích thông tin Điều này khác biệt so với nghiên cứu trước đó, nơi chỉ sử dụng kỹ thuật đảo bit cho ảnh tự nhiên với độ bảo mật rất thấp Trong chế độ thông thường, bất kỳ ai cũng có thể thao tác xử lý trên dữ liệu ảnh.

DICOM đảm bảo thông tin cá nhân được bảo mật, chỉ cho phép người dùng hợp lệ với khóa bí mật truy cập Giải pháp này không chỉ tăng cường tính năng bảo mật trong việc lưu trữ và truyền nhận ảnh DICOM mà còn đáp ứng nhu cầu thực tiễn của y tế từ xa.

Giải pháp đề xuất DICOM_LSB_AES_RONI

Kỹ thuật watermarking LSB không thể khôi phục ảnh gốc từ ảnh nhúng, gây khó khăn trong việc đảm bảo độ chính xác tuyệt đối cho kết quả chẩn đoán hình ảnh Để giải quyết vấn đề này, luận án đề xuất giải pháp DICOM_LSB_AES_RONI, cho phép nhúng thông tin trong vùng không quan tâm RONI, được xác định từ đa giác khoanh vùng ROI/RONI Vùng này có thể được tạo tự động dựa trên đặc tính của từng phương thức tạo ảnh hoặc điều chỉnh bởi bác sĩ chẩn đoán, như minh họa trong Hình 3.9.

Hình 3.9 Đa giác khoanh vùng ROI/RONI

Quá trình nhúng thông tin trong giải pháp đề xuất DICOM_LSB_AES_RONI được thực hiện qua 5 bước sau:

 Bước 1: Mã hóa nhị phân chuỗi thông tin cá nhân theo đúng định dạng cấu trúc dữ liệu chuẩn DICOM

 Bước 2: Mã hóa mật mã AES chuỗi nhị phân dùng 1 từ mã bí mật

 Bước 3: Lựa chọn đa giác khoanh vùng ROI/RONI

Bước 4: Chèn dữ liệu sau khi mã hóa mật mã vào các mặt phẳng bit trọng số thấp (LSB) của vùng RONI trong ảnh gốc, trừ các biên ảnh Sau khi hoàn thành việc nhúng ảnh, tất cả các trường dữ liệu liên quan đến thông tin cá nhân sẽ được xóa khỏi tập tin DICOM.

Bước 5: Chèn các thông số cần thiết cho quá trình trích, bao gồm chiều dài dữ liệu sau mã hóa và vị trí các đỉnh đa giác trong vùng ROI/RONI, vào các mặt phẳng bit trọng số thấp (LSB) tại các biên ảnh.

Quá trình trích thông tin trong giải pháp đề xuất DICOM_LSB_AES_RONI được thực hiện ngược lại với các bước sau:

Bước đầu tiên là trích xuất dữ liệu từ các mặt phẳng bit trọng số thấp (LSB) ở các biên của ảnh nhúng Sau đó, tiến hành giải mã để xác định chiều dài dữ liệu sau khi mã hóa và vị trí của các đỉnh đa giác trong khu vực quan tâm (ROI) hoặc khu vực không quan tâm (RONI).

 Bước 2: Trích dữ liệu từ các mặt phẳng bit trọng số thấp LSB của vùng RONI trong ảnh nhúng

 Bước 3: Giải mã hóa mật mã AES chuỗi nhị phân trích với từ mã bí mật ban đầu

 Bước 4: Giải mã hóa nhị phân chuỗi bit thu được sau giải mã hóa mật mã theo đúng định dạng cấu trúc dữ liệu chuẩn DICOM.

Kết quả thử nghiệm ứng dụng thực tiễn

Dựa trên kết quả nghiên cứu, luận án đã phát triển và thử nghiệm phần mềm khai thác dữ liệu ảnh DICOM với tính năng bảo mật nâng cao, hỗ trợ cho ứng dụng y tế từ xa Phần mềm này đã được áp dụng trong các đề tài và dự án thực tiễn tại một số bệnh viện, như minh họa trong Hình 3.10.

Tập dữ liệu DICOM được sử dụng trong các thử nghiệm thực tiễn tại bệnh viện Việt Nam, đảm bảo tuân thủ đầy đủ các quy định hiện hành để phục vụ cho mục đích nghiên cứu khoa học.

Hơn 1000 ảnh DICOM đã được thu thập ngẫu nhiên từ hệ thống PACS tại các bệnh viện, bao gồm bệnh viện Medic Hòa Hảo, bệnh viện Quận Thủ Đức (nay là Thành phố Thủ Đức) và bệnh viện Thống Nhất Việc thu thập này dựa trên các từ khóa tìm kiếm liên quan đến các phương thức chụp ảnh khác nhau như cắt lớp vi tính (CT), cộng hưởng từ (MRI) và X quang (XR).

Các ảnh DICOM được mã hóa khuyết danh và lưu trữ trên máy chủ thủ nghiệm, với một số trường thông tin cá nhân được bảo vệ Phần mềm thử nghiệm truy cập máy chủ để nhúng và trích xuất thông tin từ ảnh DICOM qua hai phương pháp là DICOM_LSB_AES và DICOM_LSB_AES_RONI.

Hình 3.10 Phần mềm thử nghiệm khai thác ảnh DICOM có tăng cường bảo mật

Phương pháp DICOM_LSB_AES cho thấy khả năng nhúng thông tin cao, đạt 1 bit/pixel với mức suy giảm chất lượng ảnh thấp nhất Đối với yêu cầu chất lượng ảnh nhúng tương đương ảnh gốc nhằm đảm bảo độ chính xác trong chẩn đoán, phương pháp DICOM_LSB_AES_RONI được áp dụng để xác định vùng ROI, bảo toàn chất lượng ảnh, và vùng RONI cho việc nhúng thông tin Phần mềm thử nghiệm cung cấp hai lựa chọn xác định vùng RONI: tự động hoặc thủ công do bác sĩ chẩn đoán hình ảnh thực hiện.

Phần mềm thử nghiệm sử dụng hai giải thuật để xác định vùng RONI tự động, bao gồm khoanh vùng chữ nhật dựa trên phân bố mức xám và khoanh vùng tự do dựa trên phép toán hình thái học Kết quả khảo sát cho thấy giải thuật khoanh vùng RONI tự động ít nhạy với các loại ảnh y tế, trong khi giải thuật khoanh vùng tự do lại tương đối nhạy nhưng không hiệu quả với ảnh siêu âm Mặc dù vậy, khoanh vùng RONI tự động chữ nhật gặp phải hạn chế về dung lượng nhúng thông tin.

77 Hình 3.11 Khoanh vùng RONI tự động chữ nhật (trên) và tự do (dưới) với ảnh CT

Hình 3.12 Khoanh vùng RONI tự động chữ nhật (trên) và tự do (dưới) với ảnh MRI

78 Hình 3.13 Khoanh vùng RONI tự động chữ nhật (trên) và tự do (dưới) với ảnh XR

Hình 3.14 Khoanh vùng RONI tự động chữ nhật (trên) và tự do (dưới) với ảnh US

Giải thuật khoanh vùng RONI thủ công yêu cầu thông tin tọa độ các đỉnh đa giác được nhúng vào biên ảnh để đảm bảo quá trình trích xuất xác định chính xác vùng nhúng Khảo sát cho thấy, đối với ảnh kích thước 512x512, lượng thông tin tọa độ nhúng thêm chỉ chiếm từ 1 đến 2 hàng hoặc cột, cho thấy tính hiệu quả trong việc tối ưu hóa dữ liệu.

Kết quả thử nghiệm cho thấy quá trình nhúng và trích thông tin của hai giải pháp DICOM_LSB_AES và DICOM_LSB_AES_RONI rất đơn giản và nhanh chóng, cho phép áp dụng rộng rãi trong các hệ thống xử lý ảnh DICOM, đặc biệt là trong các ứng dụng có hạn chế về khả năng xử lý Thử nghiệm thành công trong việc trích thông tin cũng chứng minh rằng hai giải pháp này không ảnh hưởng đến các giao thức truyền Tuy nhiên, chỉ cần một thay đổi nhỏ, như 1 đơn vị mức xám trong ảnh sau khi nhúng, có thể dẫn đến việc trích sai thông tin Do đó, hai giải pháp này phù hợp với các ứng dụng kênh truyền không lỗi, như việc tăng cường bảo mật thông tin cá nhân trong lưu trữ và truyền nhận ảnh DICOM.

Kết luận chương

Chương 3 đã phân tích trình bày giải thuật và các kết quả của hai giải pháp đề xuất nâng cao hiệu quả của kỹ thuật watermarking dựa trên kỹ thuật LSB cho ảnh đặc thù DICOM bao gồm DICOM_LSB_AES và DICOM_LSB_AES_RONI nhằm tăng cường tính năng bảo mật cho các ứng dụng y tế từ xa Các kết quả có liên quan của hai giải pháp đề xuất này đã được công bố trong 1 bài báo tạp chí trong nước chuyên ngành y học thực hành (thuộc danh sách tạp chí được tính điểm theo quy định của Hội đồng chức danh giáo sư nhà nước), 4 bài báo hội nghị quốc tế, và thử nghiệm thực tế với các hệ thống phần mềm ứng dụng trong lĩnh vực y tế qua 2 đề tài cấp nhà nước, 1 đề tài cấp thành phố, 1 đề tài cấp trường

Bài báo số 4, được xuất bản trên tạp chí trong nước và có sự đồng tác giả, trình bày giải pháp DICOM_LSB_AES và trích dẫn ứng dụng của nó trong thử nghiệm thực tế nhằm đánh giá hiệu quả của hệ thống PACS-Cloud tại các bệnh viện.

Bài báo số 6 tại hội nghị quốc tế IEEE, do tác giả chính trình bày, giới thiệu và đánh giá giải pháp DICOM_LSB_AES, nhằm nâng cao bảo mật thông tin cá nhân trong ảnh DICOM Giải pháp này được ứng dụng trong việc phát triển hệ thống PACS và hỗ trợ hội chẩn y tế trực tuyến.

Bài báo số 7 tại hội nghị quốc tế IFBME, do tác giả chính thực hiện, đã phân tích và đánh giá giải pháp DICOM_LSB_AES nhằm bảo mật thông tin cá nhân trong các ảnh y tế DICOM.

Bài báo số 8 tại hội nghị quốc tế ACOMP, do tác giả chính trình bày, giới thiệu giải pháp DICOM_LSB_AES_RONI nhằm nâng cao bảo mật thông tin cá nhân trong thiết kế hệ thống phần mềm xử lý ảnh DICOM trên nền tảng web.

Bài báo số 9 tại hội nghị quốc tế ISEE, do tác giả chính trình bày, giới thiệu giải pháp DICOM_LSB_AES nhằm nâng cao bảo mật thông tin cá nhân trong thiết kế phần mềm khai thác ảnh DICOM trên hệ điều hành Windows.

Tham gia vào đề tài cấp nhà nước mã số 02.18.DACNC.QG, “Ứng dụng công nghệ ảo hóa và điện toán đám mây để xây dựng hệ thống lưu trữ và truyền hình ảnh (PACS-Cloud) phục vụ kết nối liên thông dữ liệu giữa các bệnh viện,” từ tháng 04/2018 đến tháng 10/2020, đã được nghiệm thu với kết quả đạt vào tháng 12/2020 Đề tài nghiên cứu ứng dụng giải pháp DICOM_LSB_AES nhằm tăng cường bảo mật cho phần mềm khai thác ảnh DICOM, góp phần vào sự phát triển của hệ thống PACS-Cloud và hỗ trợ hội chẩn y tế trực tuyến.

Tham gia vào đề tài cấp nhà nước “Hoàn thiện công nghệ chế tạo thiết bị hệ thống thu thập, lưu trữ hình ảnh DICOM và hệ thống hội chẩn y tế trực tuyến,” mã số 01/2015/CNC-HDKHCN, thuộc Bộ Công thương, từ tháng 07/2015 đến tháng 06/2017, đã được nghiệm thu vào tháng 11/2017 với kết quả đạt yêu cầu Đề tài nghiên cứu ứng dụng giải pháp DICOM_LSB_AES nhằm nâng cao bảo mật thông tin cá nhân trong thiết kế phần mềm khai thác ảnh DICOM trên hệ điều hành Windows.

Tham gia vào đề tài cấp thành phố "Nghiên cứu thiết kế hệ thống phần mềm khai thác dữ liệu DICOM trên nền Web phục vụ hội chẩn y tế qua thiết bị Mobile và Smart Tivi," mã số 82/2017/HĐ-SKHCN, do Sở Khoa học Công nghệ TpHCM thực hiện từ tháng 06/2017 đến tháng 05/2019, đã nghiệm thu vào tháng 04/2019 với kết quả đạt yêu cầu Đề tài tập trung vào việc ứng dụng giải pháp DICOM_LSB_AES trong thiết kế phần mềm bảo mật, nhằm khai thác cơ sở dữ liệu hình ảnh DICOM phục vụ chẩn đoán bệnh.

Chủ nhiệm đề tài cấp trường T-ĐĐT-2017- là “Thiết kế phần mềm khai thác dữ liệu ảnh DICOM nhằm tăng cường tính năng bảo mật cho ứng dụng y tế từ xa.”

Từ tháng 06/2017 đến tháng 12/2018, tại Trường Đại học Bách Khoa – ĐHQG TpHCM, đề tài nghiên cứu đã được nghiệm thu với kết quả đạt Nghiên cứu tập trung vào việc ứng dụng hai giải pháp DICOM_LSB_AES và DICOM_LSB_AES_RONI nhằm nâng cao bảo mật thông tin cá nhân trong thiết kế hệ thống phần mềm xử lý ảnh DICOM trên nền tảng web.

NÂNG CAO HIỆU QUẢ KỸ THUẬT WATERMARKING LƯỢNG TỬ VÀ BIẾN ĐỔI SIFT TRƯỚC CÁC TẤN CÔNG ĐỒNG BỘ

Các vấn đề tồn tại với kỹ thuật watermarking lượng tử dựa trên biến đổi SIFT 82

Kỹ thuật watermarking lượng tử, tương tự như watermarking LSB, nhúng thông tin ở mức độ cục bộ từng điểm ảnh nhưng có độ bền cao hơn trước các thay đổi nhỏ về giá trị mức xám Tuy nhiên, kỹ thuật này vẫn gặp khó khăn trước các tấn công hình học do sự mất đồng bộ trong vị trí nhúng và trích xuất thông tin Gần đây, nhiều giải thuật watermarking thế hệ thứ hai đã được đề xuất để chống lại các tấn công đồng bộ, thường sử dụng biến đổi SIFT do Lowe giới thiệu, cho thấy rằng các điểm trích xuất này bất biến với các phép dịch, xoay, co dãn ảnh và các biến đổi tịnh tiến.

Các đặc trưng SIFT được khẳng định là giải pháp hiệu quả nhờ vào tính bền vững và độ phức tạp tính toán thấp hơn so với nhiều phương pháp trích đặc trưng khác Phương pháp watermarking dựa trên SIFT tập trung vào việc trích xuất các đặc trưng ổn định trong không gian tỉ lệ, cho phép nhúng thông tin vào các vòng tròn có tâm tại vị trí của điểm đặc trưng, với bán kính tương ứng với hệ số tỉ lệ.

Việc sử dụng tất cả các đặc trưng để nhúng watermark giúp bảo toàn vấn đề đồng bộ, nhưng số lượng lớn vùng nhúng theo yêu cầu của thuật toán lại làm giảm chất lượng ảnh Một ảnh kích thước 500x500 có thể tạo ra tới 2000 điểm đặc trưng, tuy nhiên không phải tất cả đều hữu ích cho quá trình nhúng và trích Guo, Li và Pan đã chỉ chọn những đặc trưng bền vững để nhúng thông tin và chứng minh hiệu quả so với các phương pháp trước đó Tuy nhiên, phương pháp này yêu cầu thông tin gốc trong quá trình trích và có thể dẫn đến mất đồng bộ Một số tác giả đã cải thiện độ bền vững bằng cách sử dụng đặc trưng hướng, nhưng cần biết trước mô tả gốc của các đặc trưng Do đó, cần tiền xử lý để chọn lọc các điểm đặc trưng bền vững nhất và tạo ra các vùng nhúng không chồng lấp Các phương pháp watermarking sử dụng biến đổi SIFT hiện vẫn thiếu cơ chế bảo mật, khiến kẻ tấn công có thể xác định vùng nhúng Luận án nghiên cứu đề xuất các giải pháp đột phá nhằm nâng cao tính bền vững trước nhiều loại tấn công, cho phép trích thông điệp trực tiếp từ ảnh kiểm tra mà không cần ảnh gốc hay thông tin đặc trưng ban đầu.

Giải pháp đề xuất watermarking một bit Q_SIFT

4.2.1 Giải thuật nhúng 1 bit thông tin

Giải thuật nhúng 1 bit thông tin Q_SIFT được trình bày trong Hình 4.1, trong đó các đặc trưng SIFT được lựa chọn kỹ lưỡng nhằm nâng cao tính bền vững và hiệu quả Sau đó, thông tin sẽ được nhúng theo kỹ thuật lượng tử.

Hình 4.2 minh họa các đặc trưng SIFT trích xuất ban đầu, cho thấy số lượng đặc trưng khá nhiều nhưng không phải tất cả đều hiệu quả cho việc nhúng thông tin Một số đặc trưng gần biên hoặc bị chồng lấp có thể làm giảm chất lượng ảnh nhúng Việc sử dụng quá nhiều đặc trưng sẽ ảnh hưởng tiêu cực đến chất lượng, trong khi quá ít sẽ giảm khả năng trích xuất thông điệp trước các tấn công Do đó, cần lựa chọn các đặc trưng một cách hợp lý để đảm bảo hiệu quả Các hệ số scale của đặc trưng SIFT cần được phân tích và chọn lọc phù hợp, như minh họa trong các biểu đồ histogram ở hình 4.3 và 4.4, cho thấy giá trị hệ số scale và giá trị tương quan của các đặc trưng trước và sau tấn công xoay.

Việc lựa chọn các hệ số scale phù hợp là rất quan trọng trong việc đảm bảo hiệu quả khi gặp tấn công Đầu tiên, nó giúp thu được một số đặc trưng ban đầu cần thiết Thứ hai, việc này đảm bảo số lượng đặc trưng sử dụng là vừa đủ Thứ ba, tỉ lệ thay đổi hệ số scale không nên quá lớn để các vùng nhúng thông tin không chênh lệch nhiều Cuối cùng, lựa chọn hợp lý còn giúp giảm thời gian xử lý trong việc tìm kiếm các đặc trưng bền vững ở bước tiếp theo Kết quả của quá trình lựa chọn này được thể hiện rõ ràng trong Hình 4.5.

Hình 4.1 Lưu đồ giải thuật nhúng 1 bit thông tin Q_SIFT

Nhúng bit dùng lượng tử Ảnh Cover Chọn các đặc trưng không chồng lấp

Lọc các đặc trưng ở biên

Chọn các đặc trưng bền vững với các tấn công

Trích xuất đặc trưng SIFT Ảnh chứa bit nhúng

Lọc đặc trưng có hệ số Scale phù hợp

85 Hình 4.2 Các đặc trưng ban đầu (kSIFT=3)

Hình 4.3 Histogram hệ số scale trước và sau tấn công xoay 45 o

86 Hình 4.4 Giá trị tương quan các đặc trưng trước và sau tấn công xoay 45 o

Hình 4.5 Các đặc trưng trích chọn với thông số scale phù hợp (kSIFT)

Để chọn lọc các đặc trưng bền vững trước các tấn công xoay và co giãn ảnh, các đặc trưng với hệ số scale phù hợp sẽ được xác định Sau khi bị tấn công, tọa độ, hệ số co giãn và hướng của đặc trưng có thể thay đổi, nhưng thông số mô tả (descriptor) vẫn hầu như không thay đổi Do đó, descriptor có thể đại diện cho đặc trưng tương ứng Phương pháp lựa chọn đặc trưng bền vững bao gồm việc xoay ảnh với bước nhảy 15 độ và co giãn ảnh với bước nhảy 0.1 để loại bỏ các đặc trưng không bền vững, giữ lại những đặc trưng bền vững dựa vào descriptor Giá trị ngưỡng tương quan giữa descriptor ban đầu và descriptor sau tấn công được xác định là 0.8.

Hình 4.6 và 4.7 lần lượt minh họa các đặc trưng trích chọn bền vững với xoay ảnh và co giãn ảnh

Hình 4.6 Các đặc trưng trích chọn bền vững với xoay ảnh (kSIFT)

Để nâng cao độ chính xác trong việc trích xuất thông tin từ các đặc trưng trích chọn bền vững với co giãn ảnh (kSIFT), chúng ta áp dụng kỹ thuật lượng tử chẵn lẻ để nhúng thông tin vào các vùng tròn theo tọa độ (t1, t2) và hệ số scale , như được mô tả trong công thức 4.1.

L − ™ 3 + r − ™ 3 3 = ŠšZe p 3 (4.1) trong đó, k SIFT là hệ số khuếch đại để điều khiển bán kính của các vùng tròn

Tùy thuộc vào giá trị hệ số khuếch đại k SIFT, có thể xuất hiện nhiều vùng nhúng chồng lấp hoặc tràn ra ngoài biên ảnh Do đó, trước khi nhúng thông tin, cần chọn các đặc trưng với các vùng tròn không tràn ra ngoài biên và không chồng lấp lên nhau Điều này đặc biệt quan trọng trong các tấn công như xoay.

Để đạt được sự ổn định trong việc nhúng thông tin vào ảnh, cần ưu tiên chọn các đặc trưng có tọa độ gần tâm của ảnh Sau khi loại bỏ các đặc trưng gây ra vùng nhúng tràn ra ngoài biên, bước tiếp theo là loại bỏ những đặc trưng có vùng nhúng chồng lấp lên nhau Quá trình này được lặp lại cho đến khi không còn đặc trưng nào có vùng nhúng chồng lấp Việc trích chọn đặc trưng bền vững là quan trọng để đảm bảo hiệu quả của phép nhúng; nếu quá ít đặc trưng, thông tin có thể bị sai sót khi trích xuất, trong khi quá nhiều đặc trưng lại làm giảm khả năng trích xuất chính xác do số lượng pixel trong mỗi vùng nhúng trở nên quá ít Kết quả của quá trình này được minh họa qua Bảng 4.1 và Hình 4.8, thể hiện việc trích chọn đặc trưng SIFT bền vững để nhúng thông tin với kSIFT.

Hình 4.8 Các đặc trưng trích chọn sau bỏ biên và không chồng lấp (kSIFT)

Bảng 4.1 Bảng minh họa số lượng đặc trưng SIFT trích chọn sau mỗi bước xử lý

Bước xử lý Số lượng đặc trưng SIFT

Sau bền vững với xoay ảnh 14

Sau bền vững với co giãn ảnh 12

Sau bỏ biên và không chồng lấp 5

4.2.2 Giải thuật trích 1 bit thông tin

Hình 4.9 trình bày giải thuật trích 1 bit thông tin theo giải pháp đề xuất Q_SIFT

Hình 4.9 Lưu đồ giải thuật trích 1 bit thông tin Q_SIFT

Quá trình trích thông tin bao gồm bước trích chọn đặc trưng phù hợp, nhưng khác biệt so với quá trình nhúng thông tin Theo giải thuật trích đề xuất, bước trích chọn đặc trưng chỉ tập trung vào việc loại bỏ các vùng trích tràn ra ngoài.

Trích bit dùng lượng tử Ảnh chứa thông tin nhúng

Trích xuất đặc trưng SIFT

Lọc các đặc trưng ở biên

So sánh độ tin cậy với ngưỡng

Việc trích xuất thông tin từ ảnh không sử dụng ảnh gốc hoặc đặc trưng ban đầu dẫn đến sự khác biệt giữa các đặc trưng thu được và các đặc trưng đã nhúng thông tin Hơn nữa, các tấn công làm sai lệch đặc trưng nhúng ban đầu ảnh hưởng đến khả năng lựa chọn các vùng không chồng lấp dựa trên vị trí gần tâm như trong giải thuật nhúng Do đó, thách thức hiện tại là xác định các đặc trưng đã được sử dụng để nhúng thông tin Trong bối cảnh này, việc tính toán và so sánh thông số độ tin cậy với ngưỡng là cần thiết để quyết định bit thông tin tương ứng với vùng nhúng ban đầu.

Khi nhúng cùng một bit thông tin trong một vùng diện tích theo công thức (4.1), bit thông tin trích xuất tương ứng sẽ được xác định dựa trên số lượng lớn hơn của loại bit giải lượng tử theo công thức (4.2).

= 0, 5-› ≥ 5-› 1, 5-› < 5-› (4.2) trong đó 5-› 0 và 5-› 1 lần lượt là tổng số bit 0 và bit 1 sau giải lượng tử trong vùng trích

Theo phân tích kỹ thuật lượng tử, khi trích xuất thông tin từ các vùng nhúng thực sự, kết quả sẽ gần như chính xác với tỷ lệ bit 0 hoặc bit 1 Ngược lại, nếu các đặc trưng không liên quan đến vùng nhúng, kết quả sẽ ngẫu nhiên với tỷ lệ bit 0 và bit 1 gần bằng nhau Dựa vào ngưỡng xác định, chúng ta có thể ước đoán các vùng có khả năng cao là vùng nhúng ban đầu Luận án này khai thác đặc tính này để nâng cao tính bền vững và độ tin cậy của các giải pháp trong việc trích xuất thông tin trực tiếp từ ảnh tấn công mà không cần ảnh gốc hoặc thông tin phụ Độ tin cậy được đánh giá ở nhiều cấp độ, trong đó ở cấp độ bit, độ tin cậy được xác định dựa trên các bit sau khi giải lượng tử ở mỗi vùng trích, với độ tin cậy cao nhất khi tất cả bit trích chỉ là 0 hoặc 1, và thấp nhất khi tổng số bit loại 0 (NUM0) và 1 (NUM1) là như nhau.

Theo công thức (4.3), độ tin cậy ở cấp độ bit có giá trị tối đa là 1 khi quyết định chính xác thông tin là 0 hoặc 1, và tối thiểu là 0.5 khi quyết định hoàn toàn ngẫu nhiên Khi trích thông tin tại vùng nhúng ban đầu, chênh lệch giữa số lượng bit 0 và 1 sẽ lớn, trong khi ở vùng không nhúng, số lượng bit 0 và 1 sẽ gần bằng nhau Do đó, có thể thiết lập một ngưỡng để xác định vùng nhúng ban đầu Ở cấp độ điểm ảnh, độ tin cậy được xác định dựa trên sai số giữa giá trị thực tế và giá trị lượng tử theo công thức (4.4), với độ tin cậy cao hơn khi giá trị gần với các giá trị lượng tử {Q0k, Q1k} và thấp nhất khi nằm ở giữa.

Với các thông số độ tin cậy, tính bền vững của quá trình watermarking có thể được đánh giá ngay lập tức qua một trường hợp cụ thể, thay vì cần khảo sát một số lượng lớn các lần mô phỏng để đạt được độ chính xác thống kê Hơn nữa, trong ứng dụng thực tế, độ tin cậy cũng cung cấp thông tin bổ sung về mức độ chính xác của thông tin được trích xuất.

Các giải pháp đề xuất watermarking nhiều bit HRSMQ_SIFT và FSMQ_SIFT 92

Các giải thuật nhúng và trích 1 bit thông tin Q_SIFT có thể được mở rộng để xử lý nhiều bit thông tin thông qua hai phương pháp: đầu tiên là chia vùng tròn nhúng thành các phần nửa vành khuyên, gọi là HRSMQ_SIFT (Half-Ring-Shaped Multi-bit Q_SIFT), và thứ hai là chia vùng tròn nhúng thành các phần hình quạt, được gọi là FSMQ_SIFT (Fan-shaped Multi-bit Q_SIFT).

4.3.1 Nhúng theo các phần nửa vành khuyên HRSMQ_SIFT

Giải pháp nhúng nhiều bit thông tin HRSMQ_SIFT tương tự như giải pháp nhúng

Q_SIFT sử dụng 1 bit thông tin, với sự khác biệt ở bước cuối cùng, nơi chuỗi bit được nhúng vào các phần nửa vành khuyên của mỗi vùng tròn nhúng không chồng lấp.

93 minh họa việc nhúng N bit thông tin theo 2N phần nửa vành khuyên trong vùng tròn bán kính Ro

Hình 4.10 Các phần hình nửa vành khuyên

Việc chia mỗi vùng vành khuyên thành hai nửa giúp tăng cường độ bảo mật thông qua việc sử dụng khóa bí mật, tạo ra một dịch chuyển góc ngẫu nhiên so với hướng của đặc trưng để xác định phần nửa vành khuyên tương ứng với mỗi bit thông tin Các vùng vành khuyên thứ i được xác định theo công thức: ăœ0 = â L, r | H − 1 Œ P  ≤ = |} ≤ H Œ P  ê (4.5).

4.3.2 Nhúng theo các phần hình quạt FSMQ_SIFT

Giải pháp nhúng nhiều bit thông tin FSMQ_SIFT tương tự như giải pháp nhúng

Q_SIFT nhúng 1 bit thông tin vào các phần hình quạt của mỗi vùng tròn không chồng lấp, chỉ khác biệt ở bước cuối cùng Hình 4.11 minh họa quá trình nhúng N bit thông tin tương ứng với N phần hình quạt.

Giải pháp nhúng theo các phần hình quạt có thể đạt được độ bảo mật cao tương tự như giải pháp nhúng theo các phần nửa vành khuyên, thông qua việc sử dụng khóa bí mật để tạo ra một dịch chuyển góc ngẫu nhiên so với thông số hướng của đặc trưng.

94 để xác định phần hình quạt nhúng tương ứng với mỗi bit thông tin Các vùng hình quạt thứ i được xác định theo công thức sau: ô0 = â L, r | − ơ + H − 1 3O P ≤ ơ |} ≤ − ơ + H 3O P ê (4.7) trong đó ơ |,} = k6@™kJ A } | F (4.8)

Hình 4.11 Các phần hình quạt

4.3.3 Trích nhiều bit thông tin

Dựa vào các đặc trưng trích xuất và thông số hướng, chúng ta xác định vị trí các vùng nửa bán khuyên hoặc hình quạt Qua đó, thực hiện giải lượng tử để tìm chuỗi bit thông tin tạm thời Bằng cách so sánh tương quan giữa các chuỗi bit này với ngưỡng và áp dụng kỹ thuật chia nhóm lặp vòng, chúng ta có thể xác định lại các vùng nhúng không chồng lấp ban đầu, từ đó quyết định chuỗi bit thông tin đã nhúng.

Nếu không xảy ra tấn công, nhóm đặc trưng đã nhúng thông tin sẽ có tính chất tương tự như các chuỗi bit ngẫu nhiên trích xuất từ các vùng không nhúng, bao gồm nhiều chuỗi bit hoàn toàn giống nhau và các vùng nhúng không chồng lấp lên nhau Khi ảnh bị tấn công, các chuỗi bit trích xuất có thể bị sai lệch, nhưng nếu thông tin trích xuất chỉ sai một vài bit so với tổng số bit đã nhúng, thì độ tương quan của nó vẫn cao Vì vậy, việc so sánh các chuỗi bit dựa trên độ tương quan là cần thiết.

Giải thuật chia nhóm lặp vòng bắt đầu bằng việc xác định hai vùng trích có độ tương quan thấp nhất và tìm các vùng không chồng lấp có độ tương quan trên ngưỡng Nếu hai nhóm vùng trích có số đặc trưng khác nhau, nhóm ít đặc trưng hơn sẽ bị loại bỏ Trong trường hợp số đặc trưng bằng nhau, nhóm có tổng diện tích nhỏ hơn sẽ bị loại Nếu không tìm thấy thêm vùng không chồng lấp nào có độ tương quan trên ngưỡng, cả hai vùng trích ban đầu sẽ bị loại bỏ Quá trình này tiếp tục lặp lại cho đến khi thu được một nhóm vùng trích không chồng lấp với độ tương quan trên ngưỡng cuối cùng.

Hình 4.12 mô tả giải thuật trích nhiều bit thông tin cho hai trường hợp HRSMQ_SIFT và FSMQ_SIFT Quá trình này bao gồm các bước trích đặc trưng SIFT tương tự như khi trích 1 bit thông tin, nhưng khác ở chỗ mở rộng chuỗi bit qua các phần nửa vành khuyên (HRSMQ_SIFT) hoặc các phần hình quạt (FSMQ_SIFT) Đồng thời, nó cũng khai thác tương quan giữa các vùng thông tin đã trích để chọn lọc các vùng nhúng không chồng lấp ban đầu.

Hình 4.12 Lưu đồ giải thuật trích nhiều bit thông tin (HRSMQ_SIFT và FSMQ_SIFT)

Trích chuỗi bit dùng thuật toán lượng tử chẵn lẻ Ảnh chứa thông tin nhúng

Chọn nhóm có số vùng không chồng lấp nhiều nhất

Trích xuất đặc trưng SIFT

Chọn các nhóm chuỗi bit có độ tương quan cao

Lọc các đặc trưng ở biên

Trong trường hợp không có tấn công, các chuỗi bit trích xuất từ các đặc trưng sẽ tương đồng nhau, phản ánh chính xác thông tin từ các vùng không chồng lấp Tuy nhiên, khi bị tấn công, các chuỗi bit có thể bị sai lệch, nhưng nếu sự sai lệch này không lớn, độ tương quan giữa chúng vẫn cao Để xác định một nhóm các chuỗi bit có độ tương quan lớn với nhau và không chồng lấp, chúng ta cần thực hiện các bước phân tích cụ thể.

Bước 1: Lập ma trận tương quan giữa các chuỗi bit trong A

Hàng đầu tiên trong ma trận m thể hiện hệ số tương quan giữa chuỗi bit và tất cả các chuỗi bit trong A Độ tương quan giữa các chuỗi bit được ký hiệu là k[ và k, với điều kiện k[ = k[ và k = 1 Nếu k[ đạt ngưỡng tối thiểu € thì hai chuỗi bit này sẽ được coi là tương quan, trong đó β là ngưỡng tương quan.

Việc xét độ tương quan giữa các chuỗi bit với nhau chỉ cần xét ma trận tam giác dưới h của m, cho các phần tử còn lại gán bằng 1

Bước 2: Dựa vào thông tin đã có, chúng ta sẽ xác định các chuỗi thông tin không tương quan nhau trong ma trận m Qua đó, chúng ta sẽ tìm ra hàng thứ i và cột thứ j, từ đó khẳng định rằng hai chuỗi ( và ( [ không có mối tương quan với nhau.

Bước 3: Xác định tất cả các chuỗi bit tương quan bằng cách tìm tất cả các phần tử trong hàng thứ i của ma trận m lớn hơn hoặc bằng β Tương tự, hãy tìm tất cả các chuỗi liên quan.

97 bit tương quan với ( [ Trong hai nhóm này ta sẽ chọn nhóm có nhiều đặc trưng không chồng lấp hơn

Bước 4: Trong nhóm đầu tiên, xác định hai đặc trưng có hình tròn chồng lấp Đối với mỗi đặc trưng, tìm tất cả các đặc trưng mà hình tròn không chồng lấp Nếu số lượng đặc trưng không chồng lấp ít hơn, đặc trưng đó sẽ bị loại bỏ Nếu số lượng bằng nhau, loại bỏ đặc trưng có tổng tương quan nhỏ hơn Trong trường hợp tổng độ tương quan của hai chuỗi bit bằng nhau, cần loại bỏ một trong hai đặc trưng Tiếp tục lặp lại quy trình này để tạo ra một nhóm các đặc trưng không chồng lấp.

Bước 5: Lặp lại quy trình của bước 4 cho nhóm thứ hai để tạo ra hai nhóm đặc trưng không chồng lấp Trong hai nhóm này, nhóm có ít đặc trưng hơn sẽ bị loại bỏ Nếu số lượng đặc trưng bằng nhau, nhóm có tổng độ tương quan giữa các chuỗi bit tương ứng thấp hơn sẽ bị loại.

Giải pháp đề xuất SQ_SIFT tăng cường tính bảo mật

Luận án đề xuất giải pháp nâng cao bảo mật cho SQ_SIFT (Secure Q_SIFT) bằng cách điều chỉnh vị trí vùng nhúng dựa trên các đặc trưng và khóa bí mật, như thể hiện trong Hình 4.13.

Hình 4.13 Thay đổi vị trí vùng nhúng dựa trên các đặc trưng và khóa bí mật

Khóa bí mật sẽ tạo ra cặp thông số (, ), dẫn đến việc vị trí nhúng Q(u,v) thay đổi từ vị trí ban đầu P(t1,t2) Sự thay đổi này được thực hiện thông qua phép xoay góc  so với hệ số góc  của đặc trưng SIFT, cùng với phép tịnh tiến  theo hệ số scale  của đặc trưng SIFT.

Các đặc trưng khi trích thông tin ít bị ảnh hưởng bởi vùng nhúng thông tin không thực hiện trực tiếp tại vị trí các đặc trưng Điều này khiến cho kẻ tấn công gặp khó khăn trong việc trích xuất thông tin một cách bất hợp pháp hoặc làm hư hại thông tin nhúng, do không sở hữu khóa bí mật.

Kết quả mô phỏng và thử nghiệm

Dữ liệu sử dụng cho mô phỏng và thử nghiệm đánh giá hiệu quả các giải pháp watermarking được tổng hợp từ các tập dữ liệu công khai quốc tế, đảm bảo tính đa dạng trong các phương thức tạo ảnh Các nguồn dữ liệu bao gồm CT (LiTS, LCTSC, VESSEL), MRI (BraTS, Kaggle), XR (NIH Chest X-ray, CheXpert), và US (EchoNet-Dynamic) Một số ảnh đa kênh đã được chuyển đổi thành ảnh xám để phục vụ cho việc đánh giá.

Tập dữ liệu sử dụng để huấn luyện mô hình tấn công siêu phân giải được lấy từ DIV2K, bao gồm hình ảnh độ phân giải 2K với nhiều chi tiết như động vật, con người và quang cảnh thiên nhiên, phục vụ cho các tác vụ khôi phục hình ảnh Tập dữ liệu này có nhiều hệ số tỷ lệ khác nhau, bao gồm 2x, 4x, 3x và 8x, với phương pháp thu nhỏ chủ yếu là song lập phương (bicubic) Toàn bộ tập dữ liệu được chia thành 800 hình ảnh để huấn luyện, 100 hình ảnh để kiểm chứng và 100 hình ảnh để kiểm tra.

4.5.1 Kiểm chứng mô hình tấn công siêu phân giải

Luận án này tập trung vào việc thực hiện tấn công siêu phân giải ảnh đơn bằng kỹ thuật ESRGAN nổi tiếng Qua việc đào tạo lại mô hình với các tham số khác nhau, chúng tôi so sánh kết quả để hiểu rõ hơn về hoạt động của mô hình cũng như ảnh hưởng của các tham số trong việc xây dựng kiến trúc mạng.

Hình 4.14 minh họa kết quả hàm mất mát của bộ tạo sinh trong quá trình huấn luyện và kiểm chứng Trong quá trình huấn luyện (Hình a), hàm mất mát dao động qua các lần lặp, cho thấy sự cải thiện liên tục trong khả năng tạo hình ảnh của bộ tạo sinh.

Bộ phân biệt nhận diện các hình ảnh tạo ra từ bộ tạo sinh so với ảnh thực gắn nhãn, dẫn đến sự dao động trong quá trình học Để cải thiện chất lượng hình ảnh, bộ tạo sinh cần điều chỉnh dựa trên phản hồi từ bộ phân biệt Hàm mất mát trong quá trình kiểm chứng giảm dần theo các epoch, cho thấy sự tiến bộ trong việc tạo ra hình ảnh.

Hình 4.14 Kết quả hàm mất mát của bộ tạo sinh

Hình 4.15 minh họa kết quả hàm mất mát của bộ phân biệt trong quá trình huấn luyện và kiểm chứng, cho thấy rằng bộ phân biệt gặp khó khăn trong việc phân loại hình ảnh thật và hình ảnh giả do trình tạo sinh tạo ra Điều này chứng tỏ rằng các kết quả mô phỏng tương thích với lý thuyết về kỹ thuật GAN.

Hình 4.15 Kết quả hàm mất mát của bộ phân biệt

Theo bài báo [127], kiến trúc RRDN trong phương pháp ESRGAN duy trì hiệu quả mà vẫn tiết kiệm tài nguyên tính toán và bộ nhớ Kết quả mô phỏng được thực hiện trên máy chủ differ.ai với card đồ họa 1080Ti và RAM 16GB.

Mô hình thực hiện huấn luyện 80 epoch, 500 lần lặp ở mỗi epoch và kích thước lô (batch)

Mô hình xây dựng lại với tham số tối ưu hóa PSNR cho thấy chất lượng tương tự như nghiên cứu trước đó, với PSNR chấp nhận được và hiệu suất tốt trên hình ảnh ngoài bộ huấn luyện Bảng 4.2 cho thấy ESRGAN đạt PSNR trung bình cao nhất khi lấy mẫu tăng x2 từ 100 hình ảnh độ phân giải thấp, trong khi SRGAN có hiệu suất kém hơn trong hầu hết các đánh giá, cho thấy rằng để mạng thần kinh hoạt động hiệu quả, cần có các điều kiện tối ưu.

Việc sử dụng PSNR để đánh giá chất lượng ảnh là không đủ, đặc biệt trong phần lấy mẫu tăng x4 Kết quả khảo sát cho thấy phương pháp nội suy bicubic đạt PSNR cao hơn, nhưng một số vùng có thể bị mờ Ngược lại, các mạng thần kinh không chỉ giữ lại nhiều chi tiết mà còn mang lại chất lượng hiển thị tốt hơn về mặt cảm thụ thị giác.

Bảng 4.2 Bảng kết quả huấn luyện với PSNR(dB)

Tỉ lệ lấy mẫu lên x2 x4 Bicubic 29.83 25.75

Các kết quả mô phỏng kiểm chứng cho thấy mô hình siêu phân giải sử dụng kỹ thuật ESRGAN đạt hiệu quả cao Điều này tạo nền tảng cho luận án nhằm bổ sung loại tấn công này vào các đánh giá tính bền vững của các giải pháp watermarking đề xuất.

4.5.2 Đánh giá tính cảm thụ

Luận án này đánh giá tính cảm thụ của việc nhúng thông tin trong không gian bằng các phương pháp watermarking khác nhau, bao gồm phương pháp LSB và các phương pháp dựa trên lượng tử (Q) Trong đó, phương pháp Q1 thực hiện nhúng và trích thông tin từ toàn bộ ảnh mà không sử dụng đặc trưng, trong khi các phương pháp Q2, Q3 và Q4 tập trung vào việc nhúng thông tin dựa trên các đặc trưng SIFT bền vững Phương pháp Q2 trích thông tin từ toàn ảnh, Q3 sử dụng toàn bộ các đặc trưng, và Q4 chỉ trích từ các đặc trưng có tương quan cao nhất Độ méo giữa ảnh nhúng và ảnh gốc được đánh giá qua PSNR và SSIM, với ngưỡng cảm thụ khác biệt của mắt người được xác định trong khoảng 37-38 dB Để đạt được điều này và giảm thiểu sai số làm tròn, luận án lựa chọn khoảng lượng tử =5 cho các phương pháp lượng tử Kết quả đánh giá tính cảm thụ được trình bày trong Bảng 4.3.

Bảng 4.3 Bảng đánh giá tính cảm thụ

Luận án này đánh giá mức độ cảm thụ thị giác giữa phương pháp siêu phân giải sử dụng AI với kỹ thuật ESRGAN và phương pháp lấy mẫu bicubic truyền thống, như thể hiện trong Hình 4.6.

Hình 4.16 So sánh mức độ cảm thụ thị giác giữa ảnh lấy mẫu lên bicubic (bên trái) và ảnh ESRGAN (bên phải)

4.5.3 Đánh giá tính bền vững và độ tin cậy

Luận án không chỉ đánh giá tính bền vững dựa trên độ chính xác của thông tin trích so với thông tin nhúng mà còn đưa ra thông số đánh giá độ tin cậy cho phương pháp watermarking lượng tử Độ tin cậy trong trường hợp không bị tấn công được trình bày trong Bảng 4.4, trong đó phương pháp LSB là trường hợp đặc biệt của Q1 với độ tin cậy hoàn toàn Dù LSB mang lại chất lượng ảnh nhúng cao nhất khi đánh giá bằng PSNR, nhưng lại kém bền vững trước các tấn công, chỉ phù hợp với kênh truyền không nhiễu Các phương pháp Q2, Q3 và Q4 cải thiện chất lượng ảnh nhúng bằng cách chỉ nhúng thông tin vào các vùng đặc trưng bền vững Phương pháp Q1 không thể áp dụng cho việc nhúng nhiều bit trên toàn ảnh Khi đánh giá bằng SSIM, chất lượng ảnh nhúng của các phương pháp này có thể tương đương với LSB, nhưng độ tin cậy thấp nếu trích thông tin từ các vùng không nhúng như ở Q2 và Q3 Chỉ có phương pháp Q4 (Q_SIFT) đạt được độ tin cậy hoàn toàn nhờ vào việc phân tích tương quan giữa các vùng đặc trưng để xác định chính xác vùng chứa thông tin nhúng.

Bảng 4.4 Bảng đánh giá độ tin cậy khi không tấn công

Phương pháp LSB Q1 Q2 Q3 Q_SIFT Độ tin cậy 1 1 0.5291 0.5727 1

Hình 4.17 cho thấy độ tin cậy cao (trên 0.8) của các vùng đặc trưng trích khi chỉ nhúng một bit thông tin mà không bị tấn công Các vùng này khá tương đồng với vùng nhúng thông tin ban đầu Dựa trên kết quả này, luận án tiếp tục khảo sát độ tin cậy của phương pháp lượng tử đề xuất (Q4) trong trường hợp nhúng một bit thông tin trước các loại tấn công khác nhau, như được trình bày trong Bảng 4.5 Trường hợp tấn công khiến không thể trích được vùng đặc trưng được ghi nhận là NA (Not Available) Nhìn chung, phương pháp lượng tử đề xuất cho thấy khả năng ứng dụng tiềm năng.

Tính bền vững của hệ thống đạt mức vượt trội, có khả năng chống lại các tấn công đồng bộ như xoay ảnh và cắt xén lên đến 20% Ngoài ra, hệ thống cũng thể hiện khả năng chống lại một số tấn công không đồng bộ, bao gồm nén ảnh JPEG và JPEG2000.

Hình 4.17 Độ tin cậy của các vùng đặc trưng trích

Bảng 4.5 Bảng đánh giá độ tin cậy trước các tấn công với nhúng một bit

Tấn công Q_SIFT Tấn công Q_SIFT

Nhiễu muối tiêu (0.02) NA Cắt xén 10% 1

Nén JPEG (75) 0.6932 Co giãn 0.5 lần 0.6927

Nén JPEG2000 1 Co giãn 0.8 lần 0.8086

N u m b e r o f p ix e ls R e lia b ili ty

Xoay 30 o 1 Siêu phân giải AI 2 lần 0.8631

Kết luận chương

Phần lớn các giải thuật watermarking thế hệ thứ hai dựa vào biến đổi SIFT, cho thấy khả năng trích xuất điểm đặc trưng bền vững với các biến đổi như dịch chuyển, xoay, co dãn và tịnh tiến Các nghiên cứu khẳng định rằng đặc trưng SIFT mang lại giải pháp hiệu quả nhờ tính bền vững và độ phức tạp tính toán thấp Ý tưởng cốt lõi của biến đổi SIFT là trích xuất các đặc trưng ổn định trong không gian tỉ lệ, trong đó thông tin được nhúng bằng kỹ thuật lượng tử chẵn lẻ tại các vòng tròn có tâm tại vị trí điểm đặc trưng, với bán kính tỉ lệ tương ứng.

Luận án đề xuất giải pháp nhúng và trích thông tin hiệu quả cho ảnh y tế bằng kỹ thuật lượng tử kết hợp với chọn lọc đặc trưng SIFT bền vững, không cần ảnh gốc để so khớp Việc tiền xử lý các điểm đặc trưng giúp chọn lọc những điểm bền vững nhất trước các tấn công, đồng thời tạo ra các vùng nhúng không chồng lấp Chất lượng ảnh nhúng được đánh giá qua các thông số như MSE, PSNR và SSIM, trong khi tính bền vững được xem xét qua nhiều loại tấn công khác nhau Luận án cũng đưa ra thông số đánh giá độ tin cậy để so sánh với các phương pháp phổ biến, tăng cường khả năng ứng dụng trong lĩnh vực y tế Ngoài giải pháp watermarking cho một bit thông tin Q_SIFT, còn có phân tích đánh giá watermarking nhiều bit với hai giải pháp FSMQ_SIFT và HRSMQ_SIFT, bổ sung tính bảo mật qua các thông số SIFT và khóa bí mật Đặc biệt, thuật toán chia nhóm lặp vòng dựa trên so sánh tương quan cho phép trích thông tin mà không cần ảnh gốc Kết quả mô phỏng cho thấy giải pháp nhúng thông tin trong các vùng hình quạt đạt hiệu quả cao nhất trước các tấn công thường gặp, là những đóng góp nổi bật của luận án.

Kết quả nghiên cứu đã được tổng hợp và trình bày trong hai bài báo tạp chí Scopus, một bài báo hội nghị quốc tế, một đề tài nghiên cứu cấp thành phố và một đề tài nghiên cứu cấp trường.

Bài báo số 1 được đăng trên tạp chí quốc tế JAIT, do tác giả chính thực hiện, phân tích và đánh giá các giải pháp kỹ thuật watermarking bền vững trước các tấn công đồng bộ như Q_SIFT, FSMQ_SIFT, HRSMQ_SIFT và SQ_SIFT, đặc biệt cho các loại ảnh y tế khác nhau.

Bài báo số 2 trên tạp chí quốc tế JAIT, với sự đồng tác giả, thực hiện phân tích và đánh giá mô hình học máy trong việc tạo ảnh siêu phân giải Nghiên cứu này nhằm xem xét và đánh giá hiệu quả của kỹ thuật nhúng trích thông tin trước khi tiến hành tấn công siêu phân giải bằng trí tuệ nhân tạo.

Bài báo số 5 tại hội nghị quốc tế ISEE, do tác giả chính thực hiện, phân tích và đánh giá ưu nhược điểm của các giải pháp kỹ thuật watermarking bền vững trước các tấn công đồng bộ như Q_SIFT, FSMQ_SIFT, và HRSMQ_SIFT So sánh này được thực hiện với các kỹ thuật watermarking truyền thống như LSB và trải phổ, nhằm cung cấp cái nhìn sâu sắc về hiệu quả và độ an toàn của từng phương pháp.

Tham gia vào đề tài cấp thành phố “Xây dựng, thử nghiệm bộ chuẩn dữ liệu dựa trên các nền tảng tiêu chuẩn quốc tế HL7 FHIR và DICOM ứng dụng cho bệnh án điện tử và liên thông dữ liệu giữa các bệnh viện” (mã số 98/2019/HĐ-QPTKHCN) do Sở Khoa học Công nghệ TpHCM thực hiện từ tháng 11/2019 đến tháng 05/2022, với kết quả nghiệm thu đạt yêu cầu vào tháng 05/2022 Đề tài nghiên cứu ứng dụng các giải pháp kỹ thuật watermarking bền vững để bảo vệ thông tin trong hồ sơ bệnh án điện tử trước các tấn công đồng bộ như Q_SIFT, FSMQ_SIFT, HRSMQ_SIFT và SQ_SIFT cho các loại ảnh y tế khác nhau.

Chủ nhiệm đề tài cấp trường "Giải pháp hiệu quả nâng cao tính bền vững của kỹ thuật watermarking ảnh mù" (mã số T-ĐĐT-2019-28) tại Trường Đại học Bách Khoa – ĐHQG TpHCM, thực hiện từ tháng 09/2019 đến tháng 09/2020, đã được nghiệm thu với kết quả Đạt vào tháng 12/2020 Đề tài nghiên cứu phân tích và đánh giá các giải pháp kỹ thuật watermarking bền vững trước các tấn công đồng bộ như Q_SIFT, FSMQ_SIFT, HRSMQ_SIFT, và SQ_SIFT, áp dụng cho các loại ảnh y tế khác nhau.

NÂNG CAO HIỆU QUẢ KỸ THUẬT WATERMARKING TRẢI PHỔ ỨNG DỤNG CHO ẢNH Y TẾ VÀ ẢNH ĐA KÊNH

Các vấn đề tồn tại với kỹ thuật watermarking trải phổ truyền thống

Phương pháp watermarking dựa trên kỹ thuật trải phổ đang được nghiên cứu và ứng dụng rộng rãi nhờ vào các đặc tính bảo mật cao, tính trong suốt của dữ liệu sau nhúng và khả năng bền vững trước các tấn công trong các miền biến đổi khác nhau Tuy nhiên, phương pháp này cũng gặp phải một số hạn chế.

Phương pháp watermarking ảnh gặp phải một số hạn chế cố hữu, bao gồm sai số giữa thông tin nhúng và trích, phụ thuộc vào hệ số tương quan giữa watermark và dữ liệu nhúng, dẫn đến giảm độ tin cậy và tính bền vững Nhiều thông số trong các thuật toán thường được chọn dựa trên kinh nghiệm hoặc thử nghiệm đơn giản, thiếu phân tích đánh giá tối ưu Hơn nữa, nhiều tác giả không xem xét ảnh hưởng của sai số làm tròn và giới hạn của bộ giả ngẫu nhiên đến độ chính xác của hệ thống, đặc biệt là trong miền biến đổi.

Luận án này khảo sát ảnh hưởng của chiều dài chuỗi watermark, với mục tiêu tối ưu hóa độ tin cậy và dung lượng bit nhúng Chiều dài chuỗi được chọn nhằm đảm bảo rằng độ tương quan giữa hai chuỗi watermark khác nhau phải ở mức thấp (gần 0), từ đó nâng cao độ tin cậy trong quá trình phát hiện lỗi Đồng thời, cần cân nhắc thời gian thực thi và độ phức tạp để đạt được hiệu quả tốt nhất.

Kết quả khảo sát chiều dài chuỗi watermark cho thấy rằng khi chiều dài watermark tăng, phương sai giữa các chuỗi watermark khác nhau giảm, điều này chứng tỏ độ tin cậy của hệ thống được cải thiện Tuy nhiên, chiều dài watermark lớn hơn cũng dẫn đến thời gian thực thi lâu hơn và khả năng nhúng nhiều bit thông tin giảm Để tối ưu hóa việc nhúng thông tin, có thể phân đoạn ảnh thành các khối nhỏ hơn và thực hiện watermarking cho từng khối Đối với ảnh kích thước 512x512, mối quan hệ giữa kích thước khối, dung lượng bit nhúng và chiều dài chuỗi watermark được thể hiện rõ trong Bảng 5.1 Kích thước khối quá lớn sẽ hạn chế số bit nhúng, trong khi kích thước quá nhỏ sẽ làm giảm chiều dài chuỗi watermark và độ chính xác trong quá trình phát hiện Ngoài ra, chiều dài watermark cũng bị giới hạn bởi kích thước ảnh và mức phân tích Wavelets trong miền DWT.

Hình 5.1 Khảo sát chiều dài chuỗi watermark

Bảng 5.1 Mối liên hệ giữa kích thước khối và dung lượng bit cũng như chiều dài watermark trong trường hợp ảnh 512 x 512

Kích thước khối Dung lượng bit Chiều dài watermark tối đa

Kết quả khảo sát can nhiễu giữa các loại ảnh khác nhau, bao gồm ảnh tự nhiên và ảnh y tế, được trình bày trong Bảng 5.2 và Hình 5.2 Mỗi thể loại ảnh mô phỏng cho thấy giá trị trung bình, giá trị lớn nhất và phương sai của hệ số tương quan giữa ảnh gốc và 200 chuỗi watermark có chiều dài tương đương với kích thước ảnh gốc Mặc dù giá trị trung bình của hệ số tương quan xấp xỉ 0, nhưng sự tồn tại của phương sai đáng kể cho thấy ảnh hưởng can nhiễu giữa ảnh gốc và chuỗi watermark, điều này làm giảm độ tin cậy của hệ thống.

112 watermarking Ngoài ra, can nhiễu giữa ảnh gốc và chuỗi watermark cũng phụ thuộc vào đặc trưng của từng loại ảnh

Bảng 5.2 Khảo sát can nhiễu giữa ảnh gốc và chuỗi watermark

Image Size Mean Max Var

Hình 5.2 Khảo sát can nhiễu giữa ảnh gốc và chuỗi watermark.

Các giải pháp watermarking trải phổ điều chỉnh cải tiến cho ảnh y tế đơn kênh

Luận án này tập trung vào việc giải quyết các vấn đề còn tồn tại trong kỹ thuật watermarking trải phổ truyền thống cho ảnh đơn kênh Nó đề xuất các phương pháp điều chỉnh cho bộ trích tương quan, bao gồm phương pháp loại bỏ mức DC, và cải tiến tín hiệu gốc đầu vào thông qua phương pháp trải phổ ISS Mục tiêu là nâng cao chất lượng dữ liệu sau khi nhúng và giảm thiểu ảnh hưởng của nhiễu nội do dữ liệu gốc gây ra trong quá trình trích xuất watermark Thêm vào đó, luận án cũng phát triển các điều chỉnh cải tiến khác.

Phương pháp MISS (Multi-bit Improved Spread Spectrum) đại diện cho một bước tiến quan trọng trong việc tổng quát hóa công nghệ nhúng nhiều bit thông tin, vượt qua giới hạn của các phương pháp truyền thống chỉ cho phép nhúng 1 bit Đề xuất này không chỉ cải thiện độ chính xác trong quá trình nhúng và trích xuất thông tin mà còn nâng cao dung lượng thông tin có thể nhúng, đồng thời cải thiện chất lượng dữ liệu sau khi nhúng.

Giả sử {Ui}i = [1…B] là các chuỗi watermark ngẫu nhiên chuẩn hóa trung bình 0 với hai giá trị 1 tương ứng với B bit thông tin {b i } Ảnh sau khi nhúng S của phương pháp MISS được tạo thành từ ảnh gốc X với hệ số độ mạnh watermark  được xác định theo công thức cụ thể.

Bộ trích tương quan dựa trên ảnh thu (sau tấn công) Y trong phương pháp đề xuất MISS được điều chỉnh như sau: r k  E Y Y [(  ).U ] k (5.2) ˆ k sign( ) k b  r (5.3)

Trong trường hợp lý tưởng không có tấn công, giá trị tương quan của bộ trích ứng với từng bit thông tin có dạng:

Phương pháp đề xuất đạt độ tin cậy 100% khi và chỉ khi điều kiện +,- - = 0 được thỏa mãn Điều này có thể đạt được bằng cách sử dụng các chuỗi watermark trực giao, giúp đảm bảo rằng dữ liệu trích ra hoàn toàn chính xác như dữ liệu thông tin nhúng.

Nhúng trích thông điệp trong miền không gian mang lại sự đơn giản, nhưng bị hạn chế bởi số lượng giá trị mức xám có sẵn, chẳng hạn như 256 mức trong ảnh 8 bit Hệ số độ mạnh nhúng không thể điều chỉnh linh hoạt, điều này có thể dẫn đến sai số làm tròn đáng kể nếu lựa chọn không phù hợp Hơn nữa, trong bối cảnh ngày càng nhiều tấn công xảy ra trong quá trình truyền tín hiệu, việc bảo vệ thông tin trở nên cấp thiết hơn bao giờ hết.

Trong bối cảnh 114 giải thuật nén tín hiệu và hình ảnh, tổn hao trong quá trình watermarking trên kênh truyền ngày càng gia tăng Để giải quyết vấn đề này, các kỹ thuật mới đã được phát triển, ứng dụng trong miền biến đổi như DCT và DWT Mục tiêu chính của các kỹ thuật này là chuyển tín hiệu từ miền không gian sang miền khác, dựa trên đặc tính cảm thụ của mắt người, nhằm giảm thiểu ảnh hưởng đến độ trong suốt (chất lượng) của ảnh nhúng Đồng thời, thông tin nhúng trong miền này sẽ bền vững hơn trước các tấn công nén tổn hao, đặc biệt là từ các kỹ thuật nén JPEG và JPEG2000.

Kết hợp phương pháp đề xuất MISS với các phép biến đổi là một giải pháp khả thi cho việc triển khai ứng dụng, đặc biệt trong bối cảnh đối phó với các cuộc tấn công nén tổn hao tín hiệu.

Phương pháp MISS_DCT được phát triển từ sự kết hợp giữa phương pháp đề xuất MISS và biến đổi DCT, với các điều chỉnh thực hiện trong quá trình nhúng và trích xuất thông tin dựa trên các công thức (5.5) và (5.6).

Phương pháp MISS_DWT được phát triển từ sự kết hợp giữa phương pháp đề xuất MISS và biến đổi DWT, với các điều chỉnh được thực hiện trong quá trình nhúng và trích thông tin theo các công thức (5.7) và (5.8).

Các giải pháp watermarking trải phổ hợp tác cho ảnh đa kênh

5.3.1 Giải pháp watermarking trải phổ hợp tác CSS

Việc mở rộng kỹ thuật watermarking trải phổ cho dữ liệu đa kênh như ảnh màu và ảnh siêu phổ vẫn còn nhiều cơ hội và thách thức Thông thường, quá trình này được thực hiện bằng cách nhúng watermark vào một thành phần đặc biệt của dữ liệu bao phủ.

Trong không gian màu RGB, việc xử lý các kênh màu như kênh xanh dương và thành phần độ sáng trong không gian YUV thường được thực hiện riêng lẻ mà không xem xét tương quan giữa chúng Một số nghiên cứu đã khai thác tương quan chéo của các kênh màu RGB thông qua việc thiết kế bộ phát hiện dựa trên tương quan toàn cục, nhằm tổng hợp thông tin từ ba kênh màu, qua đó cải thiện chất lượng hệ thống Tuy nhiên, phương pháp này chỉ mới xem xét kết hợp trung bình trong bộ phát hiện toàn cục và khó khăn trong việc xác định chiến thuật phát hiện tối ưu, đồng thời yêu cầu dữ liệu gốc cho bộ phát hiện Để khắc phục những hạn chế này, luận án đề xuất và phân tích hệ thống watermarking hợp tác CSS (Cooperative Spread Spectrum) với m kênh cho dữ liệu hình ảnh, dựa trên kỹ thuật trải phổ truyền thống và bộ thu tương quan tuyến tính tổng quát.

Hình 5.3 Mô hình watermarking trải phổ hợp tác

Mô hình watermarking truyền thống sử dụng một khóa bí mật K và bộ giả ngẫu nhiên PRN để tạo ra chuỗi watermark U đồng nhất cho tất cả các kênh ảnh trong quá trình nhúng và trích xuất thông tin Trong mô hình hợp tác đề xuất, chuỗi watermark U được cộng thêm vào từng kênh ảnh gốc Xi thông qua bit.

116 thông tin b và hệ số độ mạnh nhúng i để cho ra các kênh ảnh nhúng tương ứng Si theo công thức (5.9):

Độ méo dạng của mỗi kênh ảnh nhúng so với ảnh gốc được xác định bởi công thức di = E[(Si – Xi) 2 ] = αi 2 Giả sử mô hình tấn công là nhiễu cộng, ảnh thu được sẽ có dạng tương ứng.

Yi = Si + Ni (5.11) Quá trình trích thông tin sử dụng bộ phát hiện tương quan như sau:

6 = +,4 - = +,1 - + • + +,5 - (5.12) Để cho phép các bộ phát hiện cục bộ có thể hợp tác, một bộ phát hiện tuyến tính toàn cục được sử dụng như sau:

Trong công thức 6 ` = ∑ S 6 (5.13), các hệ số trọng số {wi  0} được sử dụng để điều chỉnh bộ phát hiện toàn cục, thể hiện tỷ lệ đóng góp của từng kênh vào quyết định thông tin trích ra cuối cùng.

Giả sử các kênh ảnh gốc và nhiễu có phân bố Gaussian, với Xi ~ N(0, xi 2) và Ni ~ N(0, ni 2) Khi đó, ngõ ra của các bộ tương quan cục bộ cũng tuân theo phân bố Gaussian, tức là ri ~ N(mri, ri 2), trong đó mri = b.i.

Hệ quả, hệ số tương quan trích toàn cục rc cũng có phân bố Gaussian, nghĩa là rc

Nếu bit thông tin nhúng b = {±1}, thì bit thông tin được trích xuất từ từng kênh sẽ dựa vào ngưỡng cố định là 0, không phụ thuộc vào độ mạnh của tín hiệu nhúng.

Vì vậy, mỗi bộ phát hiện tương quan cục bộ sẽ gây ra xác suất lỗi bit là:

Trong trường hợp dùng bộ quyết định hợp tác, bit thông tin trích sau cùng được xác định bởi:

G = HIJ 6 ` (5.18) Khi đó, xác suất lỗi bit của hệ thống watermarking hợp tác được xác định như sau:

√3¿∑ ặ ’ầ: Å ’ < D E’ < Ã (5.19) Với bộ tương quan toàn cục trọng số bằng nhau (trung bình) thì xác suất lỗi bit được tính như sau:

Xác suất lỗi bit của bộ tương quan toàn cục trung bình sẽ nhỏ nhất khi và chỉ khi độ mạnh watermark là như nhau ở mỗi kênh

Đối với độ méo dạng D=E[di] đã cho, xác suất lỗi bit tối thiểu của bộ phát hiện toàn cục trung bình xảy ra khi hệ số độ mạnh watermark đồng nhất cho tất cả các kênh ảnh, tức là i = j = D 1/2.

Rõ ràng, khi m tăng thì hiệu quả của bộ tương quan toàn cục trung bình tốt hơn từng bộ tương quan cục bộ

Thay vì sử dụng bộ tương quan toàn cục trung bình, vector trọng số w = [w1, w2,

Để tối thiểu hóa xác suất lỗi bit, hàm f(w) được định nghĩa là tổng của các thành phần liên quan Xác suất lỗi bit p trong (5.21) đạt cực trị khi và chỉ khi hàm f(w) cũng đạt cực trị.

Bằng cách đạo hàm riêng phần f(w) và cho bằng 0, ta được kết quả:

Bảng 5.3 trình bày xác suất lỗi bit trong các trường hợp độ mạnh watermark khác nhau, với độ méo dạng trung bình D=E[di] Bài viết xem xét hai loại bộ tương quan tối ưu và trung bình để phân tích hiệu quả của watermark.

Trường hợp Độ mạnh watermark

Xác suất lỗi bit với bộ tương quan tối ưu

Xác suất lỗi bit với bộ tương quan trung bình

Trong trường hợp (1), khi độ mạnh watermark đồng nhất cho tất cả các kênh, xác suất lỗi bit với bộ tương quan tối ưu sẽ luôn thấp hơn so với bộ tương quan trung bình, đặc biệt là khi số kênh tăng lên.

Trường hợp (2) ở đó với độ mạnh watermark tỉ lệ với phương sai của hệ số tương quan cục bộ tại các kênh Theo đó, ta có: ắ ’

Với bộ tương quan tối ưu, trọng số lọc toàn cục sẽ bằng nhau, dẫn đến xác suất lỗi bit tương tự như trường hợp bộ lọc trung bình.

Trường hợp (3) cho thấy rằng độ mạnh của watermark tỷ lệ với độ lệch chuẩn của hệ số tương quan cục bộ ở các kênh, dẫn đến xác suất lỗi bit cục bộ đồng nhất tại các kênh Do đó, ta có mối quan hệ: ắ ’ ắ • = D D E’.

Xác suất lỗi bit với bộ lọc tương quan tối ưu vượt trội hơn so với bộ tương quan trung bình Đặc biệt, khi độ mạnh watermark bằng nhau, xác suất lỗi bit của bộ lọc tương quan tối ưu sẽ bằng xác suất lỗi bit của bộ tương quan trung bình.

5.3.2 Giải pháp cải tiến loại bỏ can nhiễu ICSS

Trong mô hình watermarking trải phổ hợp tác, việc sử dụng bộ tương quan toàn cục kết hợp với các bộ tương quan cục bộ cho phép điều chỉnh hệ số ảnh hưởng của can nhiễu E[Xi.U] giữa ảnh gốc và watermark Tuy nhiên, điều này vẫn không thể loại bỏ hoàn toàn can nhiễu Do đó, quá trình nhúng trong mô hình CSS đã được cải tiến thành ICSS (Improved CSS) nhằm loại bỏ hoàn toàn ảnh hưởng của can nhiễu theo công thức (5.40).

0 † = 1 + • - − +,1 - - (5.40) Khi đó, so sánh với công thức (5.12) thì thành phần can nhiễu E[Xi.U] tại mỗi kênh đã được loại bỏ hoàn toàn

6 † = +,4 - = • + +,5 - (5.41) Tuy nhiên, quá trình nhúng cải tiến theo công thức (5.40) cũng làm tăng méo dạng giữa ảnh nhúng và ảnh gốc

5.3.3 Giải pháp mở rộng watermarking nhiều bit MCSS

Kết quả mô phỏng và thử nghiệm

Dữ liệu trong mô phỏng và thử nghiệm được sử dụng tương tự như trong chương 4 Một số trường hợp sử dụng ảnh đa kênh để thử nghiệm các thuật toán đề xuất cho ảnh đa kênh, đồng thời cũng chuyển đổi sang ảnh xám đơn kênh để kiểm tra các thuật toán đề xuất cho ảnh đơn kênh.

5.4.1 Đánh giá ảnh hưởng của các loại sai số thực tế trong watermarking ảnh

 Sai số trong quá trình tạo watermark

Luận án phân tích bốn trường hợp watermark, bao gồm phân bố chuẩn (Gaussian), phân bố đều, phân bố nhị phân (±1) và chuỗi Hadamard, tất cả đều có đặc tính giá trị trung bình bằng nhau.

Nghiên cứu này phân tích ảnh hưởng của kích thước watermark đến các đặc tính thống kê của ba loại watermark khác nhau, với giả thuyết rằng các đặc tính thống kê như trung bình và phương sai bằng 0 và 1 không phụ thuộc vào kích thước watermark Mặc dù lý thuyết cho thấy các watermark ứng với các khóa khác nhau là độc lập, nhưng thực tế cho thấy kích thước watermark cần đủ lớn do hạn chế của bộ tạo số giả ngẫu nhiên Các kết quả sai số, bao gồm giá trị trung bình và lớn nhất, được trình bày trong các Bảng 5.4-5.6 và các Hình 5.9-5.11, dựa trên khảo sát 20.000 lần khác nhau.

Bảng 5.4 Thống kê sai số điều kiện trung bình bằng 0 với các loại watermark

Bảng 5.5 Thống kê sai số điều kiện tương quan chuẩn hóa với các loại watermark

Bảng 5.6 Thống kê sai số điều kiện trực giao với các loại watermark

Các nghiên cứu cho thấy, ngoài watermark Hadamard, ba loại watermark còn lại đều gặp phải sai số nhất định trong điều kiện giá trị trung bình bằng 0 và điều kiện trực giao, trong khi chỉ watermark loại nhị phân hoàn toàn thỏa mãn điều kiện tương quan chuẩn hóa Sai số ở điều kiện trung bình bằng 0 và điều kiện trực giao của cả ba loại watermark gần như tương đương và giảm đáng kể khi kích thước watermark tăng Tuy nhiên, việc tăng chiều dài watermark lại kéo theo thời gian thực thi lâu hơn Để nhúng nhiều bit thông tin vào một bức ảnh, có thể thực hiện phân đoạn ảnh thành các khối nhỏ hơn và áp dụng watermarking cho từng khối Khi đó, mặc dù chiều dài watermark tăng, khả năng nhúng nhiều bit sẽ giảm Watermark Hadamard, mặc dù mang lại hiệu quả tối ưu, chỉ có thể đáp ứng kích thước tối đa 64x64, và với kích thước từ 128x128 trở lên thì không xác định được do giới hạn phần cứng.

 Sai số trong quá trình làm tròn của định dạng ảnh số

Một yếu tố quan trọng ảnh hưởng đến độ tin cậy của hệ thống là sai số làm tròn trong định dạng ảnh số Khảo sát ảnh với độ mạnh nhúng nhỏ nhất (α = 1) cho thấy sai số làm tròn trung bình như được trình bày trong Bảng 5.7 Do đó, việc lựa chọn watermark dạng nhị phân hoặc Hadamard không chỉ đảm bảo điều kiện tương quan chuẩn hóa mà còn giúp giảm thiểu sai số làm tròn trong quá trình nhúng thông tin.

Bảng 5.7 Ví dụ sai số làm tròn trung bình của định dạng ảnh số

 Sai số giữa KLT từ ảnh gốc và ảnh nhúng

KLT dựa trên ảnh gốc trong quá trình nhúng, trong khi quá trình trích lại dựa vào ảnh nhúng Luận án chứng minh rằng cần thiết kế tập chuỗi watermark trực giao để đảm bảo độ tin cậy tuyệt đối trong điều kiện lý tưởng hoặc khi có nhiễu cộng Gausisan Hình 5.6 cho thấy sai số giữa KLT gốc và KLT khôi phục khi sử dụng chuỗi watermark duy nhất so với tập chuỗi watermark trực giao Mặc dù sai số thực tế không bằng 0 do giới hạn điều kiện trực giao, nhưng sai số MSE khi sử dụng tập chuỗi watermark trực giao vẫn nhỏ hơn nhiều so với chuỗi watermark duy nhất, đặc biệt khi năng lượng watermark lớn.

Hình 5.6 Sai số giữa KLT gốc và KLT khôi phục

5.4.2 Kết quả mô phỏng kiểm chứng phân tích lý thuyết

 Kiểm chứng khả năng cảm thụ

Luận án này đánh giá chất lượng ảnh nhúng thông qua kỹ thuật watermarking trải phổ ở miền không gian Mặc dù sử dụng cùng độ mạnh và chuỗi watermark, các ảnh khác nhau sẽ cho kết quả PSNR khách quan khác nhau Tuy nhiên, khi so sánh các ảnh có cùng kích thước, PSNR thường xấp xỉ trong nhiều trường hợp Sự thay đổi độ mạnh của watermark cũng ảnh hưởng đến chất lượng ảnh nhúng.

Việc nhúng watermark với độ mạnh quá lớn (α) dẫn đến sự suy giảm chất lượng ảnh đáng kể Hình 5.7 minh họa quá trình nhúng watermark với các giá trị α lần lượt là 2, 3 và 4 theo phương pháp SS trong miền không gian, đồng thời xem xét khả năng cảm thụ của mắt người Cụ thể, ảnh gốc và ảnh đã được watermarking với α=2 cho thấy sự khác biệt rõ rệt về chất lượng.

(PSNR = 42.19 dB) c) Ảnh watermarking với =3 d) Ảnh watermarking với =4 (PSNR = 38.67 dB) (PSNR = 36.18 dB)

Hình 5.7 Minh họa khả năng cảm thụ của ảnh nhúng dùng phương pháp SS miền không gian

Kết quả trong Hình 5.7 xác nhận phân tích lý thuyết về khả năng cảm thụ của phương pháp SS miền không gian, như thể hiện trong Bảng 5.8 Như đã nêu trước đó, không tồn tại mối quan hệ cố định nào giữa khả năng cảm thụ của mắt người.

Trong nghiên cứu về PSNR, đã xác định rằng để một ảnh nhúng đạt chất lượng chấp nhận được, watermark nhúng không nên dễ dàng nhận thấy hoặc chỉ cảm nhận ở mức độ rất nhẹ Qua khảo sát nhiều loại ảnh khác nhau, mối quan hệ cho thấy độ mạnh của watermark nhúng trong miền không gian tối đa chỉ nên ở mức 3.

Bảng 5.8 MSE và PSNR của phương pháp SS miền không gian Độ mạnh watermark

PSNR (dB) Độ sâu bit của ảnh gốc MSE

Hình 5.8 cho thấy khả năng cảm thụ của ảnh nhúng miền DCT với các kích thước khối khác nhau Kết quả cho thấy, khi kích thước khối lớn từ 32x32 trở lên, ảnh nhúng gần như không thể phân biệt với ảnh gốc Ngược lại, kích thước khối 16x16 bắt đầu xuất hiện hiệu ứng khối, và tình trạng này trở nên nghiêm trọng hơn với các kích thước khối nhỏ hơn, dẫn đến suy giảm chất lượng ảnh nhúng.

Bảng 5.9 minh họa tác động của kích thước khối đến chất lượng ảnh nhúng miền DCT thông qua các chỉ số PSNR và SSIM, trong trường hợp nhúng 1 bit với độ mạnh nhúng =3 Khi kích thước khối giảm, chất lượng ảnh nhúng cũng giảm theo Tuy nhiên, kích thước khối lớn lại hạn chế dung lượng bit nhúng.

Bảng 5.9 Đánh giá ảnh hưởng của kích thước khối đến chất lượng ảnh nhúng miền DCT

Kích thước khối PSNR (dB) SSIM

131 a) Ảnh watermarking với khối 64x64 b) Ảnh watermarking với khối 32x32 c) Ảnh watermarking với khối 16x16 d) Ảnh watermarking với khối 8x8

Hình 5.8 Minh họa khả năng cảm thụ của ảnh nhúng miền DCT

Bảng 5.10 so sánh các loại MSE của các phương pháp MISS, MISS_DCT, và MISS_DWT với phương pháp trải phổ truyền thống khi nhúng 4 bit thông tin vào các khối ảnh kích thước 64x64 Kết quả cho thấy phương pháp MISS_DCT chịu ảnh hưởng nhiều nhất từ sai số làm tròn, dẫn đến MSE lớn, trong khi các phương pháp MISS và MISS_DWT không làm tăng đáng kể méo dạng so với phương pháp truyền thống SS.

Bảng 5.10 MSE của các phương pháp đề xuất MISS, MISS_DCT, MISS_DWT so với phương pháp trải phổ truyền thống

SS MISS MISS_DCT MISS_DWT

MSE giữa ảnh sau nhúng có làm tròn và ảnh gốc 8.8239 8.8606 27.1801 8.8837

MSE giữa ảnh sau nhúng không làm tròn và ảnh gốc 9 9.0495 28.4832 9.0685

MSE giữa ảnh sau nhúng có làm tròn và ảnh sau nhúng không làm tròn

Để kiểm chứng độ tin cậy của các phương pháp đề xuất, giá trị tương quan trích của các phương pháp MISS, MISS_DCT, và MISS_DWT so với phương pháp trải phổ truyền thống SS đã được khảo sát mô phỏng và trình bày trong Bảng 5.11 Kết quả cho thấy, trong trường hợp ảnh sau nhúng không bị làm tròn, các phương pháp này đạt độ tin cậy 100% với trung bình và phương sai của giá trị tương quan trích bằng 0 Khi có sai số làm tròn, các phương pháp MISS, MISS_DWT, và MISS_DCT vẫn cho độ tin cậy cao hơn so với phương pháp SS, với phương sai giá trị tương quan trích nhỏ hơn Đặc biệt, phương pháp MISS_DWT thể hiện hiệu quả vượt trội hơn so với phương pháp MISS_DCT trong việc đánh giá độ méo dạng.

Bảng 5.11 Đánh giá giá trị tương quan trích của các phương pháp đề xuất MISS, MISS_DCT, MISS_DWT so với phương pháp trải phổ truyền thống

Giá trị tương quan trích SS MISS MISS_DCT MISS_DWT Ảnh sau nhúng có làm tròn

Trung bình -0.0014 -8.5E-05 0.0637 0.0005 Phương sai 0.0750 0.0177 0.0346 0.0183 Ảnh sau nhúng không làm tròn

Luận án đề xuất khái niệm độ tin cậy trong phương pháp watermarking trải phổ để so sánh hiệu quả với phương pháp watermarking lượng tử Trong điều kiện lý tưởng, giá trị tương quan trích r có thể đạt ±α, với độ tin cậy cao nhất (100%) khi giá trị tương quan thực tế trùng với một trong hai giá trị lý tưởng và thấp nhất (50%) khi giá trị tương quan thực tế bằng 0, như được xác định trong công thức (5.66).

Kết luận chương

Kỹ thuật trải phổ là phương pháp phổ biến trong watermarking thiếu thông tin tiên nghiệm, không yêu cầu dữ liệu gốc tại bộ phát hiện Tuy nhiên, việc sử dụng bộ phát hiện tương quan trong quá trình trích xuất thông tin có thể dẫn đến can nhiễu giữa dữ liệu gốc và watermark, làm giảm độ tin cậy của hệ thống Phương pháp này chủ yếu áp dụng cho ảnh xám đơn kênh, với ít mở rộng cho ảnh đa kênh, tạo ra thách thức cho nghiên cứu Luận án đã khảo sát và đánh giá các hạn chế của phương pháp watermarking trải phổ truyền thống, đồng thời đề xuất sơ đồ nhúng và trích thông tin mới qua giải pháp trải phổ hợp tác CSS Giải pháp này khai thác kết hợp tuyến tính các bộ thu tương quan cục bộ tại từng kênh ảnh nhúng và sử dụng biến đổi KLT để giải tương quan giữa các kênh Ngoài ra, các giải pháp điều chỉnh như MISS, MISS_DCT, MISS_DWT cũng được nghiên cứu và đề xuất cho kỹ thuật watermarking trải phổ với ảnh đơn kênh.

Áp dụng 140 cơ sở để nâng cao hiệu quả kỹ thuật watermarking trong ảnh đa kênh bao gồm các phương pháp ICSS, MCSS, ICSS_KLT và MCSS_KLT.

Một số kết quả đã được tổng hợp trình bày trong 1 bài báo hội nghị quốc tế, 1 bài báo tạp chí Scopus, 1 đề tài nghiên cứu cấp trường

Bài báo số 10 tại hội nghị quốc tế, do tác giả chính trình bày, phân tích và đánh giá những ưu nhược điểm của kỹ thuật watermarking trải phổ SS truyền thống Đồng thời, bài viết cũng đề xuất giải pháp cải tiến nhằm nâng cao tính bền vững của các phương pháp MISS, MISS_DCT và MISS_DWT cho ảnh đơn kênh.

Bài báo số 3 được đăng trên tạp chí quốc tế Scopus, do tác giả chính thực hiện, phân tích và đánh giá giải pháp kỹ thuật watermarking trải phổ hợp tác cải tiến ICSS_KLT cho ảnh đa kênh Nghiên cứu này đóng góp vào việc nâng cao chất lượng và hiệu quả của công nghệ watermarking trong xử lý ảnh đa kênh.

Chủ nhiệm đề tài cấp trường "Giải pháp hiệu quả nâng cao tính bền vững của kỹ thuật watermarking ảnh mù" (mã số T-ĐĐT-2019-28) tại Trường Đại học Bách Khoa – ĐHQG TpHCM đã thực hiện từ tháng 09/2019 đến tháng 09/2020 và nghiệm thu thành công vào tháng 12/2020 với kết quả đạt Đề tài bao gồm phân tích và đánh giá các giải pháp kỹ thuật watermarking như CSS, ICSS, MCSS và CSS_KLT cho ảnh đa kênh.

Ngày đăng: 05/12/2023, 23:32

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w