Như chúng ta đã biết, ảnh số được lưu dưới dạng các ma trận điểm ảnh. Do đó, các phép biến đổi ảnh số thực chất là các phép biến đổi trên các ma trận. Trong mục này, ta xét các phép biến đổi ma trận được sử dụng nhiều trong xử lý ảnh. Các phép biến đổi này thường trả về những nét đặc trưng nhất của ảnh, qua đó có thể sử dụng các đặc trưng này để tiến hành xử lý ảnh.
1.2.1. Biến đổi Cosine rời rạc DCT
Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh hay video. Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần số và biến đổi ngược lại từ miền tần số quay trở lại miền không gian mà không gây tổn hao đến chất lượng. Lý do chọn biến đổi cosine cho xử lý ảnh số là biến đổi cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn.
Phép biến đổi DCT 1-D
Với dữ liệu đầu vào là tập n giá trị pt (giá trị điểm ảnh, mẫu âm thanh). Theo [12], phép biến đổi thuận DCT một chiều được xác định:
𝐺𝑓 = √2
𝑛𝐶𝑓∑ 𝑃𝑡cos [(2𝑡 + 1)𝑓𝑛
2𝑛 ]
𝑛−1
𝑡=0
trong đó:
𝐶𝑓 = {
1
√2 𝑛ế𝑢 𝑓 = 0
𝑣ớ𝑖 𝑓 = 0,1, … , 𝑛 − 1 1 𝑛ế𝑢 𝑓 > 0
và Gf là tập n hệ số DCT tương ứng của đầu vào. Hệ số đầu tiên 𝐺0 được gọi là phần tử DC (Direct Current) và các hệ số còn lại được gọi là phần tử AC (Alternating current). Các hệ số này có thể bao gồm cả số âm và số dương.
Phép biến đổi IDCT biến đổi các hệ số DCT (DC và AC) từ miền tần số về miền thời gian được xác định theo công thức:
𝑃𝑡 = √2
𝑛. ∑ 𝐶𝑗𝐺𝑗cos [(2𝑡 + 1)𝑗𝜋
2𝑛 ]
𝑛−1
𝑗=0
𝑣ớ𝑖 𝑡 = 0,1, … , 𝑛 − 1
Một tính chất quan trọng của DCT là rất hữu ích trong bài toán nén dữ liệu, với dữ liệu đầu vào có sự tương quan cao thì năng lượng của dữ liệu đầu vào sẽ tập trung vào một số phần tử đầu tiên, đặc biệt là hệ số DC. Các phần tử còn lại có giá trị nhỏ, thường xấp xỉ bằng 0.
Phép biến đổi DCT 2-D
Phép biến đổi DCT 1-D phù hợp với các mẫu dữ liệu âm thanh. Nhưng không phù hợp ảnh, do dữ liệu ảnh có quan hệ trên không gian hai chiều (hàng, cột). Tuy nhiên, đối với ảnh ta có thể áp dụng DCT 1-D hai lần: trên các hàng và trên các cột. Do vậy ta gọi phép biến đổi này là DCT 2-D.
Theo [12], phép biến đổi thuận DCT 2-D đối với 𝑚 × 𝑛 giá trị của p trên không gian 2 chiều được xác định theo công thức:
𝐺𝑖,𝑗 = 2
√𝑚 × 𝑛𝐶𝑖𝐶𝑗∑ ∑ 𝑃𝑥,𝑦× 𝑐𝑜𝑠
𝑚−1
𝑦=0 𝑛−1
𝑥=0
((2𝑦 + 1)𝑗𝜋
2𝑚 ) × 𝑐𝑜𝑠 ((2𝑥 + 1)𝑖𝜋
2𝑛 )
với 0 ≤ 𝑖 ≤ 𝑛 − 1; 0 ≤ 𝑗 ≤ 𝑚 − 1 và 𝐶𝑖, 𝐶𝑗 được xác định:
𝐶𝑓 = {
1
√2 𝑛ế𝑢 𝑓 = 0
𝑣ớ𝑖 𝑓 = 0,1, … , 𝑛 − 1 1 𝑛ế𝑢 𝑓 > 0
Khi đó, hệ số đầu tiên G0,0 gọi là phần tử DC và các hệ số còn lại là AC.
Phép biến đổi IDCT 2-D tương ứng đối với m x n hệ số G về miền không gian được tính theo công thức:
𝑃𝑥,𝑦 = 2
√𝑚 × 𝑛. ∑ ∑ 𝐶𝑖
𝑛−1
𝑗=0
𝐶𝑗
𝑛−1
𝑖=0
𝐺𝑖,𝑗× 𝑐𝑜𝑠 ((2𝑥 + 1)𝑖𝜋
2𝑚 ) × 𝑐𝑜𝑠 ((2𝑦 + 1)𝑗𝜋
2𝑛 )
với 0 ≤ 𝑖 ≤ 𝑛 − 1; 0 ≤ 𝑗 ≤ 𝑚 − 1 và 𝐶𝑖, 𝐶𝑗 được xác định:
𝐶𝑓 = {
1
√2 𝑛ế𝑢 𝑓 = 0
𝑣ớ𝑖 𝑓 = 0,1, … , 𝑛 − 1 1 𝑛ế𝑢 𝑓 > 0
Trong ứng dụng, dữ liệu ảnh được chia thành các khối 8 × 8, áp dụng phép biến đổi DCT 2-D để nhận được khối hệ số DCT gồm 64 phần tử. Để tăng tốc độ thực hiện, phép biến đổi DCT thường được tiếp cận theo phương pháp ma trận. Theo [12], ma trận Cosine rời rạc T cấp 8 × 8 được tính theo công thức:
𝐶𝑖,𝑗 = {
1
√8 𝑛ế𝑢 𝑖 = 0
1
√8cos [(𝑗 + 0.5)𝑖𝜋
8 ] 𝑛ế𝑢 𝑖 > 0
Khi đó, phép biến đổi Cosine rời rạc hai chiều đối với khối điểm ảnh P để nhận được khối hệ số DCT (G) theo công thức:
𝐺 = 𝑇 × 𝑃 × 𝑇′ và phép biến đổi ngược tương ứng:
𝑃 = 𝑇′× 𝐺 × 𝑇
Kỹ thuật thuỷ vân sử dụng phép biến đổi DCT thường chia ảnh gốc thành các khối, thực hiện phép biến đổi DCT với từng khối ảnh gốc để được miền tần số thấp, miền tần số giữa và miền tần số cao. Đa số kỹ thuật thuỷ vân ẩn bền vững sẽ chọn miền tần số giữa của mỗi khối để nhúng bit thuỷ vân theo một hệ số k nào đó gọi là hệ số tương quan giữa chất lượng ảnh sau khi nhúng thuỷ vân (tính ẩn của thuỷ vân) và độ bền vững của thuỷ vân.
Trong một vài năm gần đây, một số lược đồ thủy vân dựa trên phép biến đổi DCT kết hợp với các giải thuật trí tuệ nhân tạo như: giải thuật di truyền, giải thuật tối ưu bầy đàn, mạng neural,… đã được nhiều nhà khoa học quan tâm nghiên cứu.
1.2.2. Biến đổi Wavelet rời rạc DWT
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việc hết sức phức tạp. Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng lồ. Để giảm thiểu công việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành tính toán. Hơn nữa nếu việc tính toán được tiến hành tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ số 2 thì kết quả thu được sẽ hiệu quả và chính xác hơn rất nhiều. Quá trình chọn các tỷ lệ và các vị trí để tính toán như trên tạo thành lưới nhị tố (dyadic). Một phân tích như trên hoàn toàn có thể thực hiện được nhờ biến đổi Wavelet rời rạc (DWT). Do đó, việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b như sau:
𝑎 = 2𝑚, 𝑏 = 2𝑚𝑛 , 𝑣ớ𝑖 𝑚, 𝑛 ∈ 𝑍
Biến đổi Wavelet được sử dụng rộng rãi trong các lĩnh vực xử lý tín hiệu số, xử lý ảnh, nén ảnh, mã hóa tín hiệu,….
1.2.3. Biến đổi SVD Định nghĩa
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành tích của 3 ma trận thực như sau [13, trang 448]:
𝑌 = 𝑈 × 𝐷 × 𝑉𝑇 Trong đó:
𝑈 là ma trận trực chuẩn cấp 𝑚 × 𝑚.
𝑉 là ma trận trực chuẩn cấp 𝑛 × 𝑛.
𝐷 là ma trận đường chéo cấp m×n có tính chất:
𝐷(1,1) ≥ 𝐷(2,2) ≥ . . . ≥ 𝐷(𝑠, 𝑠) ≥ 0, với 𝑠 = 𝑚𝑖𝑛(𝑚, 𝑛).
Tính chất
Phép biến đổi SVD (Singular Value Decomposition) cũng giống như DCT, DWT đều là các phép biến đổi ma trận trực giao và có cùng một tính chất quan trọng là tập trung năng lượng ảnh vào một số phần tử cố định của miền biến đổi. Năng lượng ảnh tập trung vào phần tử 𝐷(1,1) trong phép biến đổi SVD, phần tử này có tính ổn định cao, vì vậy có thể sử dụng chúng để xây dựng các lược đồ thủy vân bền vững trước các phép tấn công.
Các ứng dụng
Một số ứng dụng sử dụng biến đổi SVD có thể chỉ ra như:
- Nén ảnh (Image Compression)
- Lập chỉ mục ngữ nghĩa tiềm ẩn (Latent semantic indexing - LSI)
Lập chỉ mục ngữ nghĩa tiềm ẩn (LSI) là một phương pháp lập chỉ mục và tìm kiếm sử dụng một kỹ thuật phân tích ma trận SVD để xác định các mẫu trong các mối quan hệ giữa các điều kiện và khái niệm có trong một bộ sưu tập không có cấu trúc văn bản.
LSI là dựa trên nguyên tắc rằng các từ được sử dụng trong các bối cảnh tương tự có xu hướng có ý nghĩa tương tự. Một tính năng quan trọng của LSI là khả năng trích xuất nội dung khái niệm của một nội dung văn bản bằng cách thiết lập mối liên hệ giữa những điều kiện xảy ra trong những hoàn cảnh tương tự [25]. LSI cũng là một ứng dụng thống kê đa biến được phát triển bởi Jean-Paul [26] Benzécri trong đầu những năm 1970, vào một bảng dự phòng được xây dựng từ tính từ trong các tài liệu.
Ưu điểm của phương pháp LSI sử dụng biến đổi SVD là có thể đối phó với vấn đề đồng nghĩa, điều mà các phương pháp truyền thống không thực hiện được.
- Kỹ thuật (Engineering)
Trong kỹ thuật nói chung, biến đổi SVD có khả năng áp dụng cho các lĩnh vực sau:
Hệ thống động lực tuyến tính (Linear Dynamical System)
Phân tích EOF analysis(of ocean topography and climate system)
Xử lý tín hiệu và nhận dạng mẫu (Signal processing and pattern recognition)
Dự báo thời tiết số (Numerical weather prediction, Lanczos methods) - Truyền thông (Comunications)
Ứng dụng phương pháp SVD trong truyền thông như:
Mạng không dây (Wireless communications)
Nén ảnh và video (Compression of videos and images) - Toán học và thống kê (Mathematics and Staticstics)
Đại số tuyến tính (Numerical linear algebra)
Xấp xỉ hạng ma trận (Low-rank matrix approximation)
Giải phương trình tuyến tính thuần nhất (Solving Homogeneous linear equations)
Principal Component Analysis 1.2.4. Biến đổi QR
Định nghĩa
Mọi ma trận thực Y cấp 𝑚 × 𝑛 cho trước luôn luôn có thể phân tích thành tích của 2 ma trận thực như sau [8, trang 223]:
𝑌 = 𝑄 × 𝑅 Trong đó:
𝑄 là ma trận trực chuẩn cấp 𝑚 × 𝑚.
𝑅 là ma trận tam giác trên cấp 𝑚 × 𝑛.
Tính chất
Phép biến đổi QR cũng giống như DCT, DWT là các phép biến đổi ma trận trực giao và có cùng một tính chất quan trọng là tập trung năng lượng ảnh vào một số phần tử cố định của miền biến đổi. Năng lượng ảnh tập trung vào hàng đầu của ma trận R trong phép biến đổi QR. Các phần tử này có tính ổn định cao, vì vậy có thể sử dụng chúng để xây dựng các lược đồ thủy vân bền vững trước các phép tấn công.
Các ứng dụng
Cũng giống như phép biến đổi SVD, phép biến đổi ma trận QR được xử dụng nhiều trong kỹ thuật, xử lý tín hiệu, xử lý ảnh, xấp xỉ tuyến tính, …