các thuật toán cơ bản của chuẩn nén ảnh tĩnh JPEG Baseline
CHƯƠNG 1: MỞ ĐẦU 1.1. Cơ sở nghiên cứu mục đích luận văn Watermarking số trình nhúng thông tin, hay watermark, vào đối tượng multimedia số, watermark phát hay trích sau để đưa xác nhận đối tượng. Watermarking chứng tỏ công cụ đáng tin cậy cho bảo vệ quyền nhận thực cho phương tiện số, có nhiều nghiên cứu thực lĩnh vực này. Watermarking xuất cách 700 năm. Khi kỹ thuật sử dụng nhà sản xuất giấy để nhận dạng sản phẩm mình. Ngày thường xuyên bắt gặp watermark giấy, ví dụ tờ tiền giấy, séc, tem bưu điện, văn hành nhà nước. Bên cạnh ứng dụng giấy, watermarking sử dụng để cung các giải pháp an ninh cho liệu đa phương tiện số âm thanh, hình ảnh, video… Trong phạm vi đề tài này, đề tài lựa chọn kỹ thuật watermarking cho ảnh tĩnh để nghiên cứu, phân tích thực với hai loại watermarking ẩn. Một ứng dụng có ý nghĩa quan trọng watermarking cho hình ảnh nhận thực hình ảnh đầu camera giám sát hay bảo mật. Việc chuyển dịch từ tương tự sang số lĩnh vực giám sát hình ảnh tạo lỗ hổng bảo mật cố gắng cung cấp chứng hình ảnh giám sát tới pháp luật. Hình ảnh giám sát số chấp nhận chứng hợp pháp việc sửa đổi liệu số trực tiếp dễ dàng, hữu công cụ xử lý ảnh làm cho nhận thực đáng ngờ. Đặc biệt, phá rối gây nhiễu video số mà không để lại dấu vết nào. Watermarking cung cấp nhận thực phát phá rối cho hệ thống giám sát số. Một vài hệ thống cung cấp lựa chọn watermarking cho hình ảnh lưu trữ. Các hệ thống cho đường truyền dẫn từ video camera tới trung tâm lưu trữ an toàn chúng thực tập trung bảo mật cho video trung tâm lưu trữ. Sự thừa nhận không nều hệ thống bị công tầng truyền dẫn. Trong trường hợp này, nhận thực phải thực video camera để cung cấp hệ thống bảo mật an toàn hơn. Điều đạt việc sử dụng thiết bị sở phần cứng hay mềm để nhúng watermark vào tín hiệu video video camera. Vì trình nhúng watermark yêu cầu tốc độ độ mạnh, nên thực phần cứng có lẽ cần thiết hợp lý hơn. Ngày nay, chíp FPGA cải thiện đáng kể tốc độ, dung lượng nhớ, mềm dẻo, tiêu hao lượng theo năm. Các ứng dụng mà FPGA ứng dụng bao gồm xử lý tín hiệu số, xử lý âm hình ảnh, máy tính số, nhận dạng, bảo mật…Các ứng dụng mà yêu cầu nhiều xử lý song song hiệu với kiến trúc FPGA. Với watermarking cho ảnh số FPGA đem lại nhiều hiệu khả xử lý song song mạnh mẽ nó. Nhưng tất giá thành mà FPGA mang lại hợp lý. Vì luận văn lựa chọn FPGA để nghiên cứu thực phát triển cho thuật toán watermarking cho ảnh số, với mục đích đóng góp luận văn là: Sự phân tích khoa học vấn đề liên quan đến watermarking cho ảnh số nén. Các kết mô mức hệ thống khẳng định tính đắn mạnh mẽ thuật toán. Các phân tích tối ưu thuật toán cho việc thực phần cứng nghiên cứu thực hiện. Khảo sát đánh giá đưa ứng dụng quan trọng watermarking lĩnh vực bảo vệ quyền nhận thực số, đặc biệt ứng dụng cho hệ thống camera giám sát bảo mật. Quy trình thiết kế số công cụ sử dụng thiết kế mô thực FPGA. Các kết trình bày luận văn đạt từ thuật toán cụ thể thiết bị FPGA hãng Xilinx. Tuy nhiên chúng dừng lại mức độ nghiên cứu mô đồng thiết kế Co-design công cụ phát triển hãng Xilinx máy tính PC. 1.2. Tổ chức luận văn Bố cục đề tài tổ chức thành chương sau: Chương 1: Mở đầu. Tác giả trình bày tóm tắt sở nghiên cứu mục đích tổ chức luận văn. Chương 2: Tổng quan chuẩn nén multimedia, watermarking phương pháp mô phỏng. Trong chương giới thiệu tổng quan multimedia, nén liệu multimedia, phương pháp đánh giá chất lượng liệu chất lượng nén thuật toán nén. Lý thuyết watermarking công cụ sử dụng để thực mô giới thiệu chương này. Chương 3: Cơ sở lý thuyết kỹ thuật nén ảnh JPEG Watermarking cho ảnh số. Trong chương tác giả trình bày phân tích sở lý thuyết thuật toán kỹ thuật liên quan đến nén ảnh JPEG, watermarking miền DCT miền nén miền chưa nén JPEG. Chương 4: Phân tích xây dựng khối thuật toán nén ảnh watermarking. Chương tập trung phân tích thuật toán nén ảnh watermarking theo chiều sâu, từ xây dựng thiết kế khối mã VHDL thực thuật toán cho ứng dụng phần cứng FPGA. Chương 5: Kết mô thực phát triển. Chương trình bày kết mô mô hình mức hệ thống cho toàn thuật toán dựa công cụ Matlab/simulink, kết thực thuật toán VHDL FPGA. Từ đưa nhận xét kết luận CHƯƠNG 2: TỔNG QUAN VỀ CÁC CHUẨN NÉN MULTIMEDIA, WATERMARKING VÀ CÁC PHƯƠNG PHÁP MÔ PHỎNG Hiện giới có nhiều chuẩn nén liệu multimedia khác nhau. Mỗi chuẩn nén sử dụng kỹ thuật riêng đặc trưng cho ứng dụng khác nhau. Giống nén liệu multimedia, kỹ thuật watermarking thực theo nhiều phương pháp, miền làm việc khác nhau. Vì việc đánh giá kỹ thuật quan trọng trình nghiên cứu trình thực hiện. Trong chương này, luận văn giới thiệu tổng quan nén liệu multimedia, kỹ thuật watermarking, phương pháp đánh giá chất lượng phương pháp mô phục vụ cho trình nghiên cứu thực kỹ thuật này. 2.1. Tổng quan nén liệu Multimedia 2.1.1. Tổng quan multimedia Chúng ta chứng kiến cách mạng công nghệ truyền thông máy tính kỷ 21. Ngành công nghiệp viễn thông trải qua thay đổi to lớn từ mạng tương tự sang mạng số cho phép công nghệ Internet phát triển vũ bão ngày nay. Truyền dẫn từ tương tự sang truyền dẫn số mang lại cho nhiều hội khía cạnh sống. Viễn thông, Internet, giải trí số, tính toán tổng quát trở thành phần tất yếu sống hàng ngày. Ngày nói nhiều mạng số, biểu diễn số ảnh, phim, video, tivi, thoại, thư viện số…tất biểu diễn số tín hiệu mạnh nhiều so với biểu diễn tương tự xử lý, tính toán, lưu trữ, khôi phục, truyền dẫn qua khoảng cách địa lý dài. Trong năm gần có nhiều thành tựu nhiều ý nghĩa xử lý ảnh tĩnh, video, đồ họa, thoại, tín hiệu audio thông qua máy tính số để đạt thách thức ứng dụng khác nhau. Như kết tất yếu, thông tin multimedia mà bao gồm ảnh, video, audio, thoại, văn bản, loại liệu khác có tiềm để trở thành kiểu liệu. Viễn thông không tảng truyền thông thoại điểm tới điểm hai đầu cuối. Nhu cầu cho truyền thông liệu multimedia thông qua mạng thông tin viễn thông truy nhập liệu multimedia thông qua Internet phát triển mạnh mẽ. Để làm điều cần thiết biểu diễn liệu mã hóa liệu multimedia phải tiêu chuẩn hóa ứng dụng tảng khác nhau. Dữ liệu video ảnh tĩnh phần quan trọng liệu multimedia chúng chiếm phần lớn băng thông truyền thông multimedia. Do vậy, phát triển kỹ thuật nén ảnh hiệu tiếp tục trở thành thách thức quan trọng cho chúng ta, học thuật công nghiệp. Mặc dù biểu diễn số tín hiệu mang lại nhiều ưu điểm so với biểu diễn tương tự, chúng cần số lượng lớn bit cho lưu trữ truyền dẫn. Ví dụ, tín hiệu audio chất lượng cao yêu cầu xấp xỉ 1,5Mbps cho biểu diễn số lưu trữ [1]. Một tín hiệu truyền hình màu độ phân giải thấp, tốc độ 30 khung hình giây với khung bao gồm 640x480 pixels (24 bits pixel màu) yêu cầu lớn 210Mbps cho lưu trữ. Và phim màu có thời gian tiếng mà số hóa yêu cầu không gian lưu trữ xấp xỉ 95 Gbytes. Sự truyền dẫn tín hiệu số thông qua kênh thông tin có băng thông hữu hạn vô khó khăn trí định dạng liệu gốc này. Một điều quan trọng hầu hết tín hiệu multimedia ảnh, video, thoại thường bao gồm số lượng lớn thông tin dư thừa không cần thiết biểu diễn hệ thống cảm nhận người. Do thực nén liệu để giảm dư thừa biểu diễn liệu để đáp ứng yêu cầu truyền thông lưu trữ. 2.1.2. Hiệu nén liệu multimedia Giống hệ thống khác, thước đo hiệu thuật toán nén nguyên tắc quan trọng cho lựa chọn thuật toán. Các phương pháp xác định hiệu thuật toán nén liệu xem xét từ nhiều khía cạnh khác phụ thuộc vào yêu cầu ứng dụng: tỷ lệ nén đạt được, chất lượng liệu sau khôi phục, phức tạp tương đối thuật toán, tốc độ thực hiện… 2.1.2.1. Tỷ lệ nén số bit mẫu Thước đo phổ biến xem xét hiệu thuật toán nén liệu tỷ lệ nén. Nó định nghĩa tỷ lệ số lượng bit dùng để biểu diễn liệu gốc số bit dùng để biểu diễn liệu nén. Xem xét ảnh có kích thước 256x256 yêu cầu 65536 bytes lưu trữ pixel biểu diễn byte đơn. Nếu phiên nén ảnh lưu trữ 4096 bytes, tỷ lệ nén đạt thuật toán nén 16:1. Sự biến thể tỷ lệ nén số bits mẫu. Thước đo cho biết số lượng bit trung bình để biểu diễn mẫu đơn liệu (ví dụ: số lượng bits pixel ảnh mã hóa). Nếu 65536 pixels ảnh nén tới 4096 bytes, nói thuật toán nén đạt trung bình 0,5 bit pixel. Do vậy, số lượng bits mẫu đo tỷ lệ số lượng bít mẫu chưa nén đơn tỷ lệ nén [1]. 2.1.2.2. Các thước đo chất lượng Thước đo không ứng dụng cho thuật toán nén không tổn hao. Thước đo chất lượng hay độ trung thực đặc biệt quan trọng cho thuật toán nén có tổn hao cho video, audio, ảnh, thoại…, liệu sau khôi phục khác với liệu gốc hệ thống cảm thụ người phiên tòa phân xử sau chất lượng liệu sau khôi phục. Sự khác liệu sau khôi phục so với liệu gốc gọi méo dạng. Như thuật toán nén cho chất lượng cao méo dạng nhỏ hơn. Các phương pháp đo chất lượng chủ quan dựa vào cảm nhận người hay xác định khách quan dựa sử dụng đánh giá thống kê toán học. Thực tế có nhiều thước đo đánh giá chất lượng chủ quan khách quan khác để đánh giá chất lượng thuật toán nén. - Thước đo chất lượng chủ quan: Thông thường thước đo chất lượng chủ quan định nghĩa điểm số người quan sát trung bình MOS (mean observer score). Thỉnh thoảng, gọi điểm số quan điểm trung bình (mean opinion score). Có nhiều cách thống kê khác để tính MOS. Trong số cách đơn giản nhất, số người quan sát có ý nghĩa thống kê chọn ngẫu nhiên để đánh giá chất lượng nhìn thấy ảnh khôi phục lại. Tất ảnh nén giải nén thuật toán. Mỗi người quan sát cho điểm số cho ảnh sau khôi phục dựa cảm nhận chất lượng ảnh anh (chị) ta. Trung bình điểm gán tất người quan sát ảnh khôi phục gọi điểm quan sát trung bình MOS. Các kỹ thuật xác định MOS khác cho loại liệu thu nhận khác nhau. Phương pháp để xác định chất lượng chủ quan ảnh tĩnh hoàn toàn khác cho video hay liệu thoại. - Thước đo chất lượng khách quan: Với phương pháp khách quan thước đo chất lượng khách quan sử dụng rộng rãi lỗi bình phưong trung bình bậc hai RMSE (Root-mean-squared error), tỷ số tín hiệu nhiễu SNR (signal – to – noise ratio), tỷ số tín hiệu nhiễu đỉnh PSNR (peak signal – to – noise ratio). Nếu I ảnh số MxN, I’ ảnh khôi phục lại tương ứng sau nén giải nén, RMSE tính công thức sau: RMSE = MN M N ∑∑ [ I (i, j ) − I ' (i, j )] (2.1) i =1 j =1 Trong i,j vị trí pixel ảnh. SNR theo đơn vị decibel tính theo biểu thức sau: M N I ( i , j ) ∑∑ MN i =1 j =1 SNR = 20 log = 10 log10 RMSE M N I (i, j ) ∑∑ i =1 j =1 (2.2) M M ∑∑ [ I (i, j ) − I ' (i, j )] i =1 j =1 Trong trường hợp ảnh bit, PSNR tương ứng tính theo dB là: 255 PSNR = 20 log10 RMSE (2.3) Trong 255 giá trị pixel lớn bit. Lưu ý RMSE thấp (tương ứng SNR hay PSNR cao hơn) luôn cần thiết chất lượng chủ quan cao. Các thước đo lỗi khách quan luôn tương quan tốt với thước đo chất lượng chủ quan. Có nhiều trường hợp, PSNR ảnh khôi phục tương đối cao, chất lượng chủ quan lại tương đối tồi nhìn nhận mắt người. Vì lựa chọn thước đo chủ quan hay khách quan để đánh giá thuật toán nén giải nén thường phụ thuộc vào tiêu chuẩn ứng dụng. 2.1.2.3. Trễ mã hóa Trễ mã hóa phương pháp đánh giá hiệu khác thuật toán nén hệ thống mã hóa giải mã tương tác (ví dụ: truyền hình hội thảo tương tác, thông tin thoại thời gian thực…). Thuật toán nén phức tạp có lẽ đem lại tỷ lệ nén tốt hơn, dẫn tới tăng trễ mã hóa, ảnh hưởng ứng dụng tương tác thời gian thực. 2.1.2.4. Độ phức tạp mã hóa. Độ phức tạp mã hóa thuật toán nén thường xem xét phép đo hiệu yêu cầu tính toán để thực mã hóa giải mã nguyên tắc quan trọng. Các yêu cầu tính toán thường xác định số lượng phép tính số học yêu cầu nhớ. Thông thường số lượng phép tính số học miêu tả MOPS (million of operations per second). Nhưng kỹ thuật nén, MIPS (million of instructions per second) thường sử dụng để xác định hiệu nén kiến trúc thuật toán cụ thể, đặc biệt thực sơ đồ thuật toán nén kiến trúc xử lý tín hiệu số DSP. 2.1.3. Tổng quan nén ảnh 10 Hình 5.18: Giản đồ thời gian thực khối watermarking_block_compressed - Kết thực tổng hợp: Thực tổng hợp dòng chip Virtex5(xc5vlx50t-3ff1136) thu bảng kết tổng hợp (Bảng 5.19): 128 Bảng 5.19: Kết tổng hợp khối watermarking_block_compressed dòng chip V5 jpeg_watermarking Project Status (10/15/2009 - 18:36:39) Project File: jpeg_watermarking.ise Implementation State: Synthesized Module Name: watermarking_block_compressed • Errors: No Errors Target Device: xc5vlx50t-3ff1136 • Warnings: 7812 Warnings Device Utilization Summary (estimated values) Logic Utilization Used [-] Available Utilization Number of Slice Registers 1122 28800 3% Number of Slice LUTs 1500 28800 5% Number of fully used LUT-FF pairs 1059 1563 67% 17 480 3% 32 3% 16 48 33% Number of bonded IOBs Number of BUFG/BUFGCTRLs Number of DSP48Es Timing Summary: --------------Speed Grade: -3 Minimum period: 5.192ns (Maximum Frequency: 192.600MHz) Minimum input arrival time before clock: 1.844ns Maximum output required time after clock: 2.775ns. Maximum combinational path delay: No path found Thực tổng hợp dòng chip Spartan3E(xc3s500e-5fg320) thu bảng kết tổng hợp (Bảng 5.20): Bảng 5.20: Kết tổng hợp khối watermarking_block_compressed dòng chip S3E jpeg_watermarking Project Status (10/15/2009 - 18:41:43) Project File: jpeg_watermarking.ise Implementation State: Module Name: watermarking_block_compressed • Errors: No Errors Target Device: xc3s500e-5fg320 • Warnings: 7799 Warnings 129 Synthesized Device Utilization Summary (estimated values) Logic Utilization Used [-] Available Utilization Number of Slices 1175 4656 25% Number of Slice Flip Flops 1090 9312 11% Number of input LUTs 1911 9312 20% Number of bonded IOBs 17 232 7% Number of MULT18X18SIOs 16 20 80% 24 4% Number of GCLKs Timing Summary: --------------Speed Grade: -5 Minimum period: 8.869ns (Maximum Frequency: 112.748MHz) Minimum input arrival time before clock: 3.227ns Maximum output required time after clock: 4.040ns Maximum combinational path delay: No path found 5.2.2.3. Khối Watermarking-JPEG miền nén tổng thể. - Giản đồ thời gian: 130 Hình 5.19: Giản đồ thời gian thực khối jpeg_watermarking_in_compressed_domain - Kết thực tổng hợp: Thực tổng hợp dòng chip Virtex5(xc5vlx50t-3ff1136) thu bảng kết tổng hợp (Bảng 5.21): Bảng 5.21: Kết tổng hợp khối jpeg_watermarking_in_compressed_domain dòng chip V5 jpeg_watermarking Project Status (10/15/2009 - 19:31:05) Project File: jpeg_watermarking.ise Implementation State: Synthesized Module Name: jpeg_watermarking_in_compressed_domain • Errors: No Errors Target Device: xc5vlx50t-3ff1136 • Warnings: 10504 Warnings Device Utilization Summary (estimated values) Logic Utilization Used [-] Available Number of Slice Registers 3788 131 Utilization 28800 13% Number of Slice LUTs 3335 28800 11% Number of fully used LUT-FF pairs 1988 5135 38% 43 480 8% 32 6% 36 48 75% Number of bonded IOBs Number of BUFG/BUFGCTRLs Number of DSP48Es Timing Summary: --------------Speed Grade: -3 Minimum period: 8.684ns (Maximum Frequency: 115.152MHz) Minimum input arrival time before clock: 4.190ns Maximum output required time after clock: 3.537ns Maximum combinational path delay: 3.434ns Thực tổng hợp dòng chip Spartan3E(xc3s500e-5fg320) thu bảng kết tổng hợp (Bảng 5.22): Bảng 5.22: Kết tổng hợp khối jpeg_watermarking_in_compressed_domain dòng chip S3E jpeg_watermarking Project Status (10/15/2009 - 19:25:33) Project File: jpeg_watermarking.ise Implementation State: Synthesized Module Name: jpeg_watermarking_in_compressed_domain • Errors: No Errors Target Device: xc3s500e-5fg320 • Warnings: 12391 Warnings Device Utilization Summary (estimated values) Logic Utilization Used [-] Available Utilization Number of Slices 3818 4656 82% Number of Slice Flip Flops 3776 9312 40% Number of input LUTs 5097 9312 54% Number of bonded IOBs 43 232 18% Number of MULT18X18SIOs 24 20 24 Number of GCLKs Timing Summary: --------------Speed Grade: -5 Minimum period: 12.843ns (Maximum Frequency: 77.864MHz) Minimum input arrival time before clock: 9.502ns Maximum output required time after clock: 5.712ns Maximum combinational path delay: 8.372ns 5.3. Đánh giá thảo luận 132 120% 4% 5.3.1. Chất lượng ảnh chất lượng nén mô hình nén ảnh watermarking Để đánh giá chất lượng ảnh chất lượng nén sử dụng tiêu trí trình bày Chương (2.1.2). Luận văn tiến hành đánh giá mức hệ thống mô Matlab/Simulink. Tiến hành thực mô tính PSNR Matlab/Simulink cho ảnh nguồn (vanmieu.bmp) ảnh watermark (DHBK.TIF) mô hình khác nhau: Hình 5.1: Mô hình thực nén ảnh JPEG. Hình 5.3 5.7 hai mô hình Watermarking-JPEG miền chưa nén miền nén với α=ß=1. PSNR tính toán công cụ sẵn có Matlab/Simulink (Hình 5.1, Hình 5.3, Hình 5.7) tính theo công thức (2.1) (2.3). Trong mô hình luận văn sử dụng kết tính PSNR Matlab để so sánh đánh giá, lỗi bình phương trung bình bậc hai RMSE tính từ PSNR theo công thức (2.3). Kết tổng hợp bảng so sánh (Bảng 5.23): Bảng 5.23: Bảng so sánh đánh giá kết mức hệ thống Loại mô hình xử lý Mô hình nén ảnh JPEG Mô hình Wartermarking-JPEG miền chưa nén Mô hình Watermarking-JPEG miền nén PSNR 38.8(dB) 22.6(dB) 23.09(dB) 133 RMSE 2.93 (4.67dB) 18.9 (12.76dB) 17.87 (12.52dB) Tỷ lệ nén 12.55 18.32 12.12 Nhận xét: Mô hình nén ảnh JPEG cho tỷ lệ nén đạt cao 12.55 nằm tiêu chí chuẩn nén JPEG, cho PSNR 38.8dB, tương ứng nhiễu RMSE 4.67dB. Với nhiễu RMSE =4.67dB hệ thống thị giác người khó phát nhiễu. Với hai mô hình Watermarking-JPEG miền chưa nén miền nén đạt tỷ lệ nén khác lớn, xem xét PSNR nhiễu RMSE Không chênh lệch nhiều. Cụ thể, mô hình Watermarking-JPEG miền chưa nén đạt tỷ lệ nén cao 18.32, PSNR=22.6dB, RMSE=12.76dB, mô hình Watermarking-JPEG miền nén đạt tỷ lệ nén thấp 12.12, PSNR=23.09dB, RMSE=12.52dB. Với nhiễu RMSE phạm vi 10dB tới 20dB cảm thụ thị giác dễ dàng phát hiện. Cả hai mô hình watermarking miền chưa nén miền nén có tương ứng RMSE=12.76dB 12.52, với tiêu chí watermarking (α=ß=1). Mô hình Watermarking miền chưa nén JPEG cho kết nén cao mà đảm bảo chất lượng ảnh sau nén nhúng watermark xét mặt chủ quan khách quan. Nhưng mô hình phức tạp phải thực thêm khối biến đổi DCT ngược chiều 16x16. Đây khối phức tạp gây độ trễ ảnh hưởng tới tốc độ xử lý hệ thống thực phần cứng. 5.3.2. Đánh giá độ mạnh watermarks mô hình thuật toán watermarking. Độ mạnh watermark công cụ xác định khả kháng cự watermark chống lại cố gắng nhằm loại bỏ hay làm thay đổi chất lượng nó, có mục đích hay mục đích loại công xử lý tín hiệu số 134 khác nhau. Luận văn thực khảo sát trình bày kết độ mạnh watermark từ hai hoạt động xử lý tín hiệu số (các công), là: tác động nhiễu Gaussian tác động thuật toán nén ảnh cấp độ tác động khác nhau. Việc khảo sát thông qua hai loại công ít, đại diện cho hoạt động công phổ biến. Nhiễu Gaussian loại công làm giảm chất lượng watermark, nén ảnh (jpeg) loại công loại bỏ watermark[17]. Luận văn thực đo giống watermark gốc watermark trích từ ảnh bị công sử dụng hệ số tương quan ρ theo phương trình 5.1 sau[18][19]: N ρ ( w, wˆ ) = ∑ w wˆ i i =1 N i N ∑ w ∑ wˆ i =1 i i =1 (5.1) i ˆ watermark gốc Trong N số pixels watermark, w w watermark trích tương ứng. Hệ số tương quan ρ có giá trị từ (quan hệ ngẫu nhiên) tới 1(quan hệ tuyến tính hoàn toàn giống nhau). Thông thường, hệ số tương quan khoảng 0.7 chấp nhận [18]. Các kết thực nghiệm từ kết qủa thực mô thuật toán watermarking hai mô hình miền chưa nén miền nén cho ảnh đầu vào ‘vanmieu.bmp’ ảnh watermark ‘DHBK.tif’, sau thực tác động nhiễu Gaussian nén jpeg ảnh, ta tính giá trị hệ số tương quan theo Phương trình (5.1) trình bày Bảng 5.24. 135 Bảng 5.24: Các giá trị hệ số tương quan thu từ hai loại công Loại mô hình thuật toán Watermarking miền chưa nén JPEG Watermarking miền nén JPEG Không Nhiễu Gaussian Nén ảnh JPEG có (Tham số) (hệ số chất lượng) công 0.2 0.4 40 80 0.9036 0.6953 0.4659 0.3586 0.6912 0.8926 0.8989 0.9307 0.7029 0.4723 0.3609 0.6917 0.9171 0.9254 Kết watermarks sau trích từ ảnh bị công tương ứng: Tham số nhiễu Tham số nhiễu 0.2 Tham số nhiễu 0.4 Hình 5.20: Watermarks sau trích từ ảnh bị công nhiễu Gause Quality =0 Quality = 40 Quality = 80 Hình 5.21: Watermarks sau trích từ ảnh bị công nén JPEG Các kết đưa Bảng 5.24 cho thấy watermarks mô hình thuật toán watermarking miều nén có độ mạnh lớn watermarks 136 mô hình watermarking miền chưa nén jpeg hai trường hợp công nhiễu Gaussian nén JPEG. Các kết cho thấy watermark nhạy cảm chịu tác động nhiễu cho giá trị hệ số tương quan thấp so với chịu tác động nén ảnh JPEG. 5.3.3. Đánh giá phân tích thời gian, tốc độ thực chiếm dụng tài nguyên thực hệ thống thuật toán FPGA. Từ bảng kết tổng hợp thực thuật toán hai dòng chip FPGA, thực tổng hợp lại ta hai bảng so sánh sau: Bảng 5.25: Bảng kết tổng hợp cho khối thuật toán thực dòng chip V5 (xc5vlx50t-3ff1136) Tên khối Số lượng (Tỷ Số lượng Tần số cực lệ) (Tỷ lệ) đại ghi chiếm LUT chiếm dụng dụng Số lượng (Tỷ lệ) IOB chiếm dụng Số lượng (Tỷ lệ) DSP48E chiếm dụng color_conv_cw 644.330MHz 97 (0%) 109 (0%) 49 (10%) (0%) color_resampler444to420 586.441MHz 100 (0%) 90 (0%) 42 (8%) (0%) dct8x8 192.600MHz 265 (0%) 373 (1%) 17 (3%) (8%) Quant 410.689MHz (0%) 54 (0%) 30 (6%) (2%) zigzag_scan 366.757MHz 796 (2%) 346 (1%) 30 (6%) (0%) rle_en 388.629MHz 81 (0%) 76 (0%) 49 (10%) (0%) huffman_en 115.152MHz 316 (1%) 223 (0%) 52 (10%) (14%) dct16x16 192.600MHz 554 (1%) 738 (2%) 17 (3%) (16%) 137 jpeg_encoder 115.152MHz 2909 (10%) 2186 (7%) 43 (8%) 24 (50%) watermarking_block_com pressed 192.600MHz 1122 (3%) 1500 (5%) 17 (3%) 16 (33%) 115.152MHz 3788 (13%) 3335 (11%) 43 (8%) 36 (75%) jpeg_watermarking_in_co mpressed_domain Bảng 5.26: Bảng kết tổng hợp cho khối thuật toán thực dòng chip S3E (xc3s500e-5fg320) Số lượng Tên khối Tần số cực (Tỷ lệ) đại SLICEs chiếm dụng Số lượng Số lượng (Tỷ (Tỷ lệ) lệ) LUT IOB chiếm dụng chiếm dụng Số lượng (Tỷ lệ) nhân MULT18x 18 chiếm dụng color_conv_cw 286.369MHz 78 (1%) 118 (1%) 49 (21%) (0%) color_resampler444to420 286.369MHz 58 (1%) 90 (0%) 42 (18%) (0%) dct8x8 112.748MHz 272 (5%) 462 (4%) 17 (7%) (20%) Quant 188.187MHz 56 (1%) 108 (1%) 30 (12%) (5%) zigzag_scan 173.292MHz 682 (14%) 532 (5%) 30 (12%) rle_en 181.668MHz 56 (1%) 73 (0%) 49 (21%) huffman_en 77.864MHz 227 (4%) 300 (3%) 52 (22%) (25%) dct16x16 112.748MHz 584 (12%) 957 (10%) 17 (7%) (40%) jpeg_encoder 77.864MHz 2533 (54%) 3006 (32%) 43 (18%) 20 (100%) 138 watermarking_block_comp ressed 112.748MHz 1175 (25%) 1911 (20%) 17 (7%) 16 (80%) jpeg_watermarking_in_com pressed_domain 77.864MHz 3818 (82%) 5097 (54%) 43 (18%) 24 (120%) Nhận xét: Tần số cực đại thực khối thuật toán nén jpeg watermarking miền nén (jpeg_watermarking_in_compressed_domain) dòng chíp FPGA Virtex đạt tần số cực đại fmax = 115.152MHz. Suy chu kỳ xung nhịp tối thiểu T = 1/fmax = 1/111.152 Mhz = 8.684ns. Khối jpeg_watermarking_in_compressed_domain tổng hợp từ khối color_conv_cw, color_resampler444to420, dct8x8, Quant, zigzag_scan, watermarking_block_compressed, rle_en, huffman_en, buffer_in_compress, theo hai nhánh (Hình 4.30). Khối xử lý véc tơ đầu vào phần tử pixel bits. Từ thời điểm bắt đầu véc tơ đầu vào thời điểm có đầu ra, khối thực tổng thời gian xử lý 412 chu kỳ xung nhịp: (13(color_conv_cw) + 7(color_resampler444to420) + 311(watermarking_block_compressed) + 66(zigzag_scan) + 2(rle_en) + 12(Huffman_en) + 1(mux32)). Như thời gian khối xử lý véc tơ pixel 8bits thực chíp V5 412*8.684 = 3577.808ns. Với ảnh số kích thước 384x512 gồm có 24576 véc tơ, tổng thời gian xử lý cho ảnh 24576*3577.808=87928209.4ns = 87.928ms. Tốc độ nén khối 11.373 khung hình 384x512 giây. Khi xem xét thực khối dòng chíp Spartan3E, tần số cực đại đạt 77.864MHz, suy chu kỳ xung nhịp tối thiểu 1/77.864 = 12.843ns. Từ theo lập luận ta tính tổng thời gian xử lý cho ảnh số đầu vào có kích thước 384x512 24576*412*12.843 = 130039382ns = 130.0394ms. Suy tốc độ nén 7.69 khung hình giây. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 139 Luận văn trình bày thuật toán chuẩn nén ảnh tĩnh JPEG Baseline. Hai mô hình thuật toán Watermarking miền DCT miền chưa nén miền nén JPEG luận văn phân tích xây dựng. Với kết mô đạt mức hệ thống sử dụng công cụ Matlab/Simulink khẳng định tính đắn, xác mạnh mẽ mô hình thuật toán. Cả hai mô hình thuật toán watermarking miền DCT miền nén miền chưa nén cho kết PSNR giống phạm vi tiêu trí nén ảnh watermarking, tỷ lệ nén khác nhau. Với mô hình watermarking miền DCT miền chưa nén cho tỷ lệ nén lớn nhiều so với mô hình thuật toán watermarking miền DCT miền nén. Tuy nhiên, xét độ phức tạp thuật toán mô hình watermarking miền DCT miền chưa nén phức tạp nhiều. Cả watermarking ẩn hay thực mô hình thông qua việc điều chỉnh hai tham số α ß khối thuật toán nhúng watermark. Các kết mô đạt thực thuật toán sử dụng ngôn ngữ mô tả phần cứng HDL thực FPGA chứng tỏ mô hình thuật toán hoàn toàn đáp ứng ứng dụng thời gian thực. Việc xây dựng module ứng dụng cho camera an ninh giám sát đạt giá trị ứng dụng cao, chi phí thấp với dòng chip FPGA. Luận văn đạt tiêu chí với mục đích đóng góp ban đầu là: Sự phân tích khoa học vấn đề liên quan đến watermarking cho ảnh số nén thực hiện. Các kết mô mức hệ thống khẳng định tính đắn mạnh mẽ thuật toán. 140 Các phân tích tối ưu thuật toán cho việc thực phần cứng nghiên cứu thực hiện. Khảo sát đánh giá đưa ứng dụng quan trọng watermarking lĩnh vực bảo vệ quyền nhận thực số, đặc biệt ứng dụng cho hệ thống camera giám sát bảo mật. Quy trình thiết kế số công cụ sử dụng thiết kế mô thực FPGA. Tuy nhiên kết dừng lại mức độ nghiên cứu mô đồng thiết kế Co-design công cụ phát triển hãng Xilinx máy tính PC. Với kết đạt từ luận văn, tiếp sau tác giả xin đề cập số hướng phát triển nghiên cứu tương lai: Tiếp tục nghiên cứu chế tạo module sản phẩm watermarking miền DCT cho ảnh số FPGA DSP ứng dụng thực tế vào hệ thống camera an ninh giám sát. Nghiên cứu ứng dụng FPGA DSP thực thuật toán watermarking miền DCT cho video số nén MPEG-2 MPEG-4. Nghiên cứu ứng dụng FPGA DSP thực thuật toán watermarking miền DCT cho video số nén H264. TÀI LIỆU THAM KHẢO 141 [1] Tinku Acharya, Ping-Sing Tsai, JPEG2000 Standard for Image Compression Concepts, Algorithms and VLSI Architectures, JOHN WILEY & SONS, 2005. [2] Wei Cai, FPGA prototyping of a Watermarking algorithm for MPEG-4, UNIVERSITY OF NORTH TEXAS, 2007. [3] Mohammed Ghanbari, Standard Codecs: Image Compression to Advanced Video Coding, IEEE Express, USA, 2003. [4] Frank Hartung and Bernd Girod, Watermarking of Uncompressed and Compressed Video, University of Enlangen-Neremburg, Germany, 1998. [5] Juan R. Hernandez, Martín Amado, Fernando Perez-Gonzalez, DCT-Domain Watermarking Techniques for Still Images: Detector Performance Analysis and a New Structure, IEEE TRANSACTIONS ON IMAGE PROCESSING, VOL. 9, NO. 1, JANUARY 2000. [6] S. P. Mohanty, K. R. Ramakrishnan, and M. S. Kanakanhalli, "An Adaptive DCT Domain Visible Watermarking Technique for Protection of Publicly Available Images", in Proceedings of the International Conference on MultimediaProcessing and Systems (ICMPS), pp.195-198, 2000. [7] Saraju P. Mohanty, K.R. Ramakrishnan, Mohan S Kankanhalli, A DCT Domain Visible Watermarking Technique for Images, IEEE, 2003. [8] Fred Mintzer, Gordon W. Braudaway and Minerva M. Yeung, Effective and Ineffective DigitalWatermarks, IEEE, 2006. [9] Latha Pillai, Video Compression Using DCT, Xilinx Application Note: Virtex-II Series, 2002. [10] Latha Pillai, Quantization, Xilinx Application Note: Virtex and Virtex-II Series, 2003. [11] Latha Pillai, Variable Length Coding, Xilinx Application Note: Virtex-II Series, 2005. 142 [12] Latha Pillai, Huffman Coding, Xilinx Application Note: Virtex Series, 2003. [13] Alba M. Sánchez G., Ricardo Alvarez G., Sully Sánchez G.; FCC and FCE BUAP, Architecture for filtering images using Xilinx System Generator, INTERNATIONAL JOURNAL of MATHEMATICS AND COMPUTERS IN SIMULATION, 2007. [14] T. Saidani , D. Dia, W. Elhamzi, M. Atri and R. Tourki, Hardware Cosimulation For Video Processing Using Xilinx System Generator, Proceedings of the World Congress on Engineering 2009 Vol I , CE 2009, July - 3, 2009, London, U.K. [15] Gabor Szedo, Color-Space Converter: RGB to YCrCb, Xilinx Application Note: Virtex-4, Virtex-II, Virtex-II Pro, Spartan-3, 2007. [16] Clive Walker, Chroma Resampler, Xilinx FPGAs Application Note, 2006. [17] Voloshynovskiy, S. Pereira and T.Pun, “Attacks on Digital Watermarking: Classification, Estimation-Based Attacks, and Benchmarks”, Comm Magazine, 39, 2001. [18] Ali Al-Haj, “Combined DWT-DCT Digital Image Watermarking”, Journal of Computer Science 3(9), 740-746, 2007. [19] Borko Furht, Darko Kirovski, “Multimedia Security Handbooks”, CRC Press, USA, 2005. [20] http://www.watermarkingworld.org [21] http://www.cosy.sbg.ac.at/~pmeerw/Watermarking/ [22] http://www.mathworks.com [23] http://en.wikipedia.org/wiki/Peak_signal-to-noise_ratio [24] http://www.xilinx.com 143 [...]... DCT để thực hiện nén ảnh và watermarking Thuật toán được lựa chọn cho nén ảnh là thuật toán nén JPEG Baseline Đây là thuật toán được sử dụng rộng rãi và khá đơn giản trong chế độ nén ảnh JPEG trên cơ sở biến đổi DCT, nhưng cũng mang lại hiệu quả nén cao Thuật toán định nghĩa cho việc nén các ảnh tĩnh với 1 tới 4 thành phần Số lượng các thành phần cho ảnh đơn sắc là 1, trong khi đó một ảnh màu có thể... THUYẾT CỦA CÁC KỸ THUẬT NÉN ẢNH JPEG VÀ WATERMARKING CHO ẢNH SỐ Chuẩn nén ảnh tĩnh JPEG được khảo sát và thực hiện trong luận văn này là JPEG Baseline Cơ sở toán học của JPEG Baseline là các kỹ thuật chuyển đổi không gian màu và tốc độ lấy mẫu màu, biến đổi cosine rời rạc (DCT), lượng tử hóa biến đổi, quét zigzag và mã hóa entropy Kỹ thuật watermarking cho ảnh số được khảo sát và thực hiện là kỹ thuật. .. bậc Thuật toán được sử dụng rộng rãi cho nén ảnh trong chế độ dựa vào DCT tuần tự được gọi là Baseline JPEG Hệ thống JPEG hiện tại được thực hiện với mục đích nén các ảnh tĩnh với tốc độ bit là từ 0,25 đến 2 bits trên một pixel JPEG2 000 là chuẩn mã hóa ảnh tĩnh thế hệ tiếp theo nhằm đạt được các tốc độ bit thấp hơn trong khi chất lượng cao hơn với nhiều các đặc tính mong muốn thêm vào để đáp ứng các. .. lượng tử hóa Các pixel ảnh đã được giải tương quan và giải lượng tử hóa sau đó được đưa tới quá trình mã hóa entropy để tạo ra dữ liệu ảnh nén 2.1.4 Các chuẩn nén dữ liệu multimedia 2.1.4.1 Chuẩn mã hóa ảnh tĩnh Hai tổ chức chính trong lĩnh vực nén ảnh tĩnh là ISO và ITU-T ISO thực hiện xử lý thông tin liên quan đến các vấn đề như là lưu trữ ảnh và phục hồi ảnh, trong khi đó ITU-T giải quyết các vấn đề... phát triển của nén dữ liệu multimedia và các kỹ thuật watermarking cho multimedia Một công cụ rất hiệu quả sử dụng để mô phỏng và chứng minh kết quả của các thuật toán nén và watermarking cho multimedia là Matlab/Simulink Với sự phát triển của công nghệ FPGA, cùng với sự hỗ trợ của các công cụ lập trình, việc thực hiện các thuật toán nén và watermarking phức tạp trên FPGA là có thể 17 CHƯƠNG 3: CƠ SỞ LÝ... đạt được hiệu quả nén tốt thì sự tương quan giữa các thành phần màu phải được giảm đầu tiên bằng việc chuyển đổi ảnh RGB sang một không gian màu giải tương quan Trong Baseline JPEG, một ảnh 3 màu RGB được chuyển đổi sang một không gian màu L-C (chói-màu) như là YCbCr, YUV…Tiếp theo ảnh được lấy mẫu màu lại và sắp xếp để đưa tới các thuật toán lõi của JPEG Baseline Thuật toán JPEG Baseline được thể... tương quan ảnh với một vài kỹ thuật tiền xử lý Tổng quát, các kỹ thuật nén ảnh tĩnh phụ thuộc vào hai nguyên lý giảm dư thừa cơ bản là giảm dư thừa về mặt không gian và giảm dư thừa về mặt thống kê Dư thừa không gian là sự giống nhau của các pixel liền kề trong một ảnh và nó được làm giảm bằng cách các kỹ thuật giải tương quan như là mã hóa dự đoán, mã hóa chuyển đổi, mã hóa băng con,…Còn các dư thừa... đó ITU-T giải quyết các vấn đề liên quan đến truyền dẫn thông tin JPEG (Joint Photographic Expert Group) là tiêu chuẩn được phát triển bởi sự kết hợp giữa ISO và ITU-T vào năm 1992 cho các ảnh tĩnh – cho cả ảnh đen trắng và ảnh màu Có một sự hiểu nhầm trong rất nhiều người rằng JPEG là một thuật toán đơn cho nén ảnh tĩnh Thực tế, chuẩn JPEG định nghĩa ra 4 chế độ hoạt động [1][3], chúng là: Chế độ dựa... thể có tới 4 thành phần màu Baseline Jpeg cho phép chỉ các mẫu 8 bit trong mỗi thành phần của ảnh nguồn Một ví dụ của ảnh màu 4 thành phần là ảnh CMYK (Cyan, Magenta, Yellow, và Black), đây là ảnh được sử dụng trong nhiều các ứng dụng như in ấn, scan,… Một ảnh màu thường có 3 thành phần màu cơ bản là RGB Trong một ảnh màu 18 thông thường, sự tương quan về không gian giữa các thành phần màu R, G, B là... ứng các thách thức mới mà JPEG không có Các chuẩn nén ảnh hai mức phổ biến là Group 3 và Group 4 (cũng được gọi là ITU-T rec T4 và T6) được phát triển bởi ITU-T trong năm 1980 cho nén fax, và JBIG được phát triển bởi ISO trong năm 1994 cho nén ảnh đen trắng 12 2.1.4.2 Các chuẩn mã hóa video MPEG (Moving picture expert group) là chuẩn của ISO cho một hệ thống nén số để xử lý các ảnh động (video) kết hợp . thống nào khác, các thước đo về hiệu quả của một thuật toán nén là các nguyên tắc quan trọng cho sự lựa chọn thuật toán. Các phương pháp xác định hiệu quả của các thuật toán nén dữ liệu có thể. lựa chọn chế độ nén có tổn hao trên cơ sở biến đổi DCT để thực hiện nén ảnh và watermarking. Thuật toán được lựa chọn cho nén ảnh là thuật toán nén JPEG Baseline. Đây là thuật toán được sử dụng. của các kỹ thuật nén ảnh JPEG và Watermarking cho ảnh số. Trong chương này tác giả trình bày và phân tích cơ sở lý thuyết của các thuật toán và các kỹ thuật liên quan đến nén ảnh JPEG, watermarking