Lý thuyết về compressive sensing đư c phát triển bởi Candes cùng các đồng nghiệp [3] và onoho [1] vào năm 2004. N bao gồm việc lấy các phép chiếu ngẫu nhiên tín hiệu và khôi phục lại từ một số lư ng nhỏ các ph p đo s dụng thuật toán tối ưu.Trong đ nh lý lấy mẫu truyền thống, tín hiệu đư c lấy mẫu s dụng t n số Nyquist,trong khi đ với s h tr của Compressive sensing tín hiệu đư c lấy mẫu ở t n số thấp hơn t n số Nyquist. Điều này là có thể bởi tín hiệu đư c biến đổi sang miền mà nó có dạng biểu diễn thưa.Sau đ tín hiệu đư c khôi phục lại từ các mẫu s dụng một trong các k thuật tối ưu khác nhau c sẵn. Sơ đồ khối cơ bản của hệ thống s dụng S đư c thể hiện trong hình 2.1
Hình 2.1: Sơ ồ khối cơ bản Compressive Sensing
64
Biểu diễn tín hiệu và tính thưa đ ng một vai trò quan tr ng trong Compressive sensing. Cho x RL biểu diễn một tín hiệu th c,giả s rằng tín hiệu x là thưa trong cơ sở tr c giao { 1, 2, 3,... N}với N là chiều dài của tín hiệu, thì x có thể đư c biểu diễn bằng một tổ h p tuyến tính của S ( S<< N ) hàm cơ sở: i i n n i=1 x = S θ ψ (2.23) Với i n ψ ψ, ni{1, 2,3,...., }N và [ , , ,...,1 2 3 N]T là vector hệ số của tín hiệu x trong ψ.Hoặc ta có thể đưa ra đ nh ngh a như sau:
Định nghĩa 2.2.1 Một vec-tơ N
xC đư c g i là thưa S(S-sparse) với
SN,nếu có nhiều nhất S thành ph n của nó khác 0,tức là nếu:
0
x S
Ta biểu th tập h p các vec-tơ thưa s trong N
C là NS .
Th c tế,ta bỏ chỉ số chỉ chiều của vec-tơ và viết Sm i khi chiều của tín hiệu là rõ ràng trong ph n trình bày.
Định nghĩa 2.2.2.Cho một vec-tơ N
xC ,với SN vàp1,ta đ nh ngh a l i xấp xỉ giới hạn S của xvới pnormlà:
: min S S p p x x x x Mệnh đề 2.2.3.Cho N xC ,và cho ( )p S
x thỏa mãn sao cho ( )p
s x p x xS p
.Khi đ , với p1 thì ( )p
S S
x x ,với xSlà vec-tơ trùng với x tại S hệ số với các (2.24)
65
giá tr tuyệt đối lớn nhất, và bằng 0 tại các v trí còn lại.
Chứng minh. Cho là hoán v của các chỉ số 0,....,N1sao cho s p xếp các thành ph n của x là thứ t giảm d n theo độ lớn,tức
x (0) x (1) .... x (N1) ,và cho x S tùy ý.Lúc đ , ta c : 1
0 supp supp supp
N p p p p p p i i i i i p i i x i x i x x x x x x x x x Mặt khác, ta có thể viết 1 1 ( ) 0 p N p N p S p i S i i i i S x x x x x
Vì theo đ nh ngh a của tổng cuối này đư c th c hiện trên NSthành ph n nhỏ nhất của x, và vì supp x S,ta ch c ch n có:
1 ( ) supp N p p i i i x i S x x , (2.25)
Là điều phải chứng minh vì x đư c ch n tùy ý trong S .
Dễ dàng nhận thấy,với tất cả tín hiệu thưa S ,x S ta có S 0
p
x
với tất
cả p1.Nhưng không may,rất nhiều tín hiệu phát sinh trong các tình huống th c tế không th c s thưa. Nếu một tín hiệu xcó thể xấp xỉ h p lý bằng một tín hiệu thưa, tức nếu l i xấp xỉ giới hạn SS x p của nó phân rã nhanh trong
Svới p1,ta g i n c tính n n đư c.Khái niệm khá chung này có thể đư c đ nh lư ng bằng cách s dụng hoán v đ nh ngh a trong chứng minh của mệnh đề 1.2.3.Nếu các hệ số này tu n theo đ nh luật ph n r hàm mũ,ngh a là:
( ) q o i
66
vớiq0 và hằng số co 0,có tồn tại một số r0 và hằng số c1 0 thỏa mãn: 2 1
( ) r
S x c S
Dễ dàng quan sát tính nén của tín hiệu sẽ càng tốt hơn nếu r (hay tương đương q) càng lớn hơn.
Bây gi ,ta trở lại với vấn đề cơ bản của việc thu nhận d liệu.
Đ nh ngh a ph p đo ngẫu nhiên tín hiệu x có thể đư c biểu diễn như sau:
yxz (2.27)
vớiCM x N là ma trận đo, y là vector đo của tín hiệu x và M
zC là vec-tơ nhiễu. Đ u tiên chúng ta xem xét với trư ng h p không nhiễu,ngh a là giả s
0M
z .Trong trư ng h p N ph p đo tuyến tính độc lập c n thiết để khôi phục một tín hiệu tùy ý N
xC một cách chính xác,tức là c n phải vuông và khả đảo, và ta không thể trông ch thành công với ít ph p đo hơn trong trư ng h p tổng quát.Mặt khác,với tín hiệu thưa,ta ít nhất có thể hi v ng làm tốt hơn.Nếu các v trí của các hệ số khác 0 của một tín hiệu x thưa S đ đư c biết trước,ta có thể khôi phục nó một cách chính xác từ S ph p đo tuyến tính nếu m i hàng của bằng 0 tại m i v trí trừ v trí của thành ph n khác 0 trong x. Tuy nhiên,thông tin này không thể có sẵn trong tình huống th c tế,và vì vậy ta chỉ có thể mong thành công với một số trung gian M ph p đo,tức là
SM N.
Đ y chính xác là điều mà lý thuyết CS muốn phát huy.Nó giới thiệu một lư c đồ ph p đo và ph p khôi phục mà M Nph p đo tuyến tính là đủ chính xác cho việc khôi phục tín hiệu thưa S(tất nhiên vẫn phải có S M ).Ma trận đo vì thế là một ma trận “b o”,ngh a là n c ít hàng hơn cột,và hệ
67
thống của biểu thức tuyến tính là không xác đ nh.Vì vậy,tổng quát có vô hạn l i giải nhưng hạn chế trong trư ng h p tín hiệu thưa,một chiến lư c sẽ đơn giản l a ch n vec-tơ thưa nhất phù h p với các ph p đo.Ở đ yM cS biểu th số ph p đo c n thiết cho việc khôi phục lại hoàn hảo. Nếu tất cả các thành ph n của là phân phối Gaussian, tín hiệu có thể đư c khôi phục một cách chính xác với khả năng thành công cao khi hằng số “c” trong khoảng 2 và 5 [4].Các thủ tục s dụng để đảm bảo tính thưa của tín hiệu đư c g i là mã hóa biến đổi,đư c th c hiện bởi 4 bước sau
i.Thu đư c đ y đủ N-điểm tín hiệu x s dụng t n số Nyquist.
ii.Tính toán đ y đủ các bộ hệ số biến đổi (ví dụ DFT).
iii.Xác đ nh S hệ số lớn nhất và loại bỏ các hệ số nhỏ nhất.
iv.Nhân tín hiệu với ma trận đo để thu đư c vector quan sát có chiều dài M.
Hình 2.2 cho thấy một ví dụ về cách mà CS có thể đư c dùng để nén một tín hiệu thấp hơn t n số Nyquist [6].Trong ví dụ này,tín hiệu lấy mẫu gốc bao gồm 300 mẫu. Mục tiêu là khôi phục lại tín hiệu s dụng chỉ 30 mẫu. Hình 2.2(a) cho thấy biểu diễn miền th i gian của tín hiệu lấy mẫu. Từ hình này,rõ ràng bằng cách l a ch n 30 mẫu (chấm đỏ) từ 300 mẫu,ta không thể khôi phục lại tín hiệu gốc một cách hoàn toàn.Mặt khác,bằng cách áp dụng Compressive sensing cho miền biểu diễn t n số của tín hiệu,ta có thể khôi phục hoàn toàn nó từ một số lư ng nhỏ các mẫu quan tr ng. Để đạt đư c mục tiêu này,c n phải triển khai một k thuật tối ưu. Tuy nhi n,không phải k thuật tối ưu nào cũng c thể dùng cho mục tiêu này. Ví dụ,hình 2.2(c) biểu diễn phổ khôi phục s dụng l2 minimization. Rõ ràng, có nh ng khác nhau đáng kể gi a tín hiệu trong hình 2.2(b) và tín hiệu trong hình 2.2(c).
68
Hình 2.2 Lấy mẫu s dụng Compressive sensing (a)Biểu diễn trong miền th i gian của tín hiệu gồm 300 mẫu (b)Phổ Fourier của tín hiệu đư c mã hóa
(c)Khôi phục lại phổ Fourier dùng l2 minimization (d)Khôi phục lại phổ Fourier dùng l1 minimization
Ngư c lại,nếu khôi phục dùng l1 minimization cho kết quả g n như là hoàn hảo. Ta có thể thấy rõ bằng việc so sánh hình 2(b) với hình 2(d).Tóm lại, k thuật tối ưu d a trên l1 minimization sẽ đư c s dụng để khôi phục lại tín hiệu trong Compressive sensing.
2.1.9Ma trận đo(Measurement matrix)
Ph n này sẽ đưa ra điểm nhấn quan tr ng để biểu diễn tín hiệu với cơ sở r i rạc. Quá trình đo tuyến tính đư c miêu tả trong hình 2.3 tính toán M < N tích trong gi a x và tập h p vec-tơ { } Mj1 đư cyj x,Tj với j = 1,…,M . T
j
biểu
69
tơ y c kích cỡ Mx1,trong ký hiệu ma trận vec-tơ y thu đư c từ biểu thức:
yx (2.28)
Với là ma trận đo MxN,m i hàng là một vec-tơ đo T j
và là hệ số vec- tơ với S thành ph n khác 0.Một số ma trận đo c thể đư c dùng trong bất kỳ hoàn cảnh nào, chỉ c n chúng độc lập với cơ sở cố đ nh như abor,sin hay wavelets.Quá trình đo ompressive sensing với vec-tơ x thưa S (S-sparse) đư c miêu tả trong hình 3:
Hình 2.3 Phương pháp đo ompressive sensing
Ma trận đo đ ng vai trò quan tr ng trong quá trình khôi phục lại tín hiệu gốc. Điều này đặt ra một vấn đề thú v : Làm sao để thiết kế một ma trận đo về cơ bản là tập h p của N vec-tơ M chiều? ”.Trong ompressive sensing,chúng ta có hai loại ma trận đo c thể s dụng: ma trận đo Random và ma trận đo đ xác đ nh trước.Nếu một tín hiệu x gồm N mẫu là thưa thì tín hiệu đ c thể khôi phục lại bằng việc dùngM O S log(N S/ ) phép chiếu tuyến tính của x lên một cơ sở khác. ơn n a, x có thể khôi phục hoàn toàn s dụng các k thuật tối ưu khác nhau. Nếu là một ma trận cấu trúc ngẫu nhiên, thì các hàng của ma trận ngẫu nhi n độc lập vì chúng đư c ngẫu nhiên tạo ra từ cùng một vec-tơ con ngẫu nhiên. Ma trận ngẫu nhi n đư c chuyển v và tr c giao h a. Điều này sẽ có tác dụng tạo ra một ma trận biểu diễn một cơ sở tr c giao.Nếu ma trận đo là ma trận xác đ nh trước, ma trận có thể đư c tạo ra bởi các hàm như hàm irac và hàm Sin .Trong trư ng h p này, tín hiệu đư c nhân với một vài hàm Dirac tại các điểm khác nhau để thu đư c vec-tơ quan
70
sát.Sau đ tín hiệu tiếng gốc có thể đư c khôi phục bằng phương pháp l1- minimization s dụng vec-tơ quan sát và ma trận đo xác đ nh trước.
Lập trình tuyến tính là một thủ tục khác đ ng vai trò quan tr ng trong việc khôi phục lại tín hiệu gốc.Đ là một cách tiếp cận toán h c đư c thiết kế để c đư c kết quả tốt nhất trong một mô hình toán h c cho trước,là trư ng h p đặc biệt của lập trình toán h c. Lập trình tuyến tính có thể đư c diễn giải theo một số nguyên t c sau:
C c đại cTx sao cho A x. b (2.29)
Với x biểu th giá tr sẽ đư c xác đ nh, c và b là vec-tơ các hệ số và A là ma trận của các hệ số.Biểu thức trên mà có thể c c đại hóa hay tối thiểu h a đư c g i là hàm mục ti u và phương trình A x. bxác đ nh nh ng hạn chế mà hàm mục tiêu có thể tối ưu h a đư c.Cuối cùng,việc khôi phục lại tín hiệu gốc phụ thuộc vào vec-tơ quan sát và ma trận đo.
2.1.10Điều kiện khôi phục lại tín hiệu trong Compressive sensing
2.1.10.1 Restricted isometric Property (RIP)
Phát triển g n đ y trong lý thuyết tín hiệu đ chỉ ra rằng tín hiệu thưa là một mô hình h u ích trong một số l nh v c như: thông tin, radar và x lý ảnh.Vì thế giả thiết rằng m i tín hiệu có thể biểu diễn ở dạng thưa đ giúp cho việc nén tín hiệu đư c quan tâm.S khôi phục lại hoàn toàn tín hiệu x phụ thuộc vào ma trận đo và vec-tơ đo y. Lý thuyết Compressive sensing nói rằng khi ma trận thỏa m n điều kiện g n tr c giao Restricted Isometric Property (RIP) [7] thì nó có thể khôi phục S hệ số quan tr ng lớn nhất từ một bộ M O S log(N S/ ) ph p đo y cùng kích cỡ.
Định nghĩa 2.3.1Một ma trận CM x N đư c g i là thỏa m n điều tính chất giới hạn đẳng c c (RIP) của bậc S với SN,nếu có một hằng số
71
0 1 sao cho:
2 2 2
2 2 2
(1) x x (1 ) x (2.30)
với m i vec-tơ thưa S x S.Hằng số nhỏ nhất đư c biểu th là S,và nó đư c g i là hằng số giới hạn đẳng c c (RIP-restricted isometry constant) của
.
Kết quả là,tín hiệu thưa c thể khôi phục lại bởi một số k thuật tối ưu khác nhau như k thuật tối ưu l1-norm.K thuật tối thiểu h a đ u ti n đư c dùng để khôi phục lại tín hiệu là l1 minimization
(P1) min 1
x sao cho x y (2.31)
òn đư c g i là thuật toán đuổi khớp cơ bản (Basic Pursuit).Mục đích của k thuật này là tìm nh ng vec-tơ c l1-norm nhỏ nhất.
L1-norm còn đư c biết đến với tên g i Taxicab norm hay Manhattan norm. Kết quả thu đư c trong [8,9] chỉ ra rằng, nếu một tín hiệu x đủ thưa,tín hiệu có thể đư c khôi phục lại d a trên thuật toán đuổi khớp cơ bản (P1). ác k thuật tối ưu khác g i là tối ưu convex (cvx) sẽ giải quyết các vấn đề có quy mô nhỏ và vừa.Dùng cvx c c tiểu hóa tín hiệu để khôi phục lại tín hiệu gốc.
2.1.10.2 Incoherence (Điều kiện độc lập)
Trong khi điều kiện RIP cung cấp s đảm bảo cho việc khôi phục lại tín hiệu thưa S (S-sparse), việc kiểm tra lại ma trận có thỏa mãn hay không là một bài toán phức tạp.Trong nhiều trư ng h p,có thể tính toán một cách dễ dàng hơn để đảm bảo khôi phục lại tín hiệu nh điều kiện độc lập.Giá tr liên kết của ma trận , ( ) , là giá tr tuyệt đối tích trong lớn nhất gi a hai cột bất kì ai , aj của : 1 i < j n 2 2 , ( ) max i j i j a a a a (2.32)
72
Có thể dễ dàng nhận thấy giá tr liên kết của ma trận ( ) nằm trong
khoảng ,1 ( 1) n m m n . Chú ý rằng khi n >> m,cận dưới có thể xấp xỉ rằng ( ) 1/ m .
Điều kiện độc lập đư c phát biểu như sau.nếu:
1 1 1 2 ( ) S (2.33)
Thì với m i vec-tơ đo yRmluôn tồn tại nhiều nhất một tín hiệu x thưa S
(S-sparse) sao cho yx.
2.1.10.3Phương pháp khôi phục tín hiệu
Khôi phục lại tín hiệu đ ng vai trò quan tr ng trong lý thuyết Compressive sensing khi tín hiệu đư c tái tạo hoặc phục hồi từ một số lư ng tối thiểu các ph p đo.Bằng cách s dụng nh ng k thuật tối ưu h a ở bên thu,húng ta có thể khôi phục lại tín hiệu mà không làm mất thông tin.Với phương pháp lấy mẫu n n,sau khi thu đư c tín hiệu yxthì bài toán đặt ra là tìm lại tín hiệu x từ các giá tr y.Tới nay,đ c một loạt bài báo li n quan đến việc khôi phục lại tín hiệu từ thông tin không đ y đủ một cách g n chính xác nhất.
2.1.11 Thuật toán khôi phục l1 minimization
Chúng ta c n khôi phục lại x,tức là tìm lại chính xác các giá tr x[n], n=1,2…N khi mà chỉ c M ph p đo y.Tuy nhi n do M < N tức là số phương trình thiết lập đư c là nhỏ hơn số ẩn c n tìm, do đ sẽ có vô số các nghiệm thỏa mãn, và tất nhiên nếu không cho thêm bất kỳ thông tin gì về nghiệm c n