1. Trang chủ
  2. » Thể loại khác

MatrixComputations-3

11 332 1
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 11
Dung lượng 168,66 KB

Nội dung

MatrixComputations-3

cơ sở đại số tuyến tính cho giá trịkỳ dị1 Các khái niệm.1.1 Chuẩn vector.Định nghĩa 1.1.1 Cho a1, . . . , an∈ Rm, khi đóspan{a1, . . . , an} = {nj=1βjaj: βj∈ R}Định nghĩa 1.1.2 (Chuẩn vector) Một chuẩn vector trên Rnlà một hàm f :Rn→ R thỏa:(i)f(x) ≥ 0 x ∈ Rn, (f(x) = 0, x = 0)(ii)f(x + y) ≤ f(x) + f(y) x, y ∈ Rn(iii)f(αx) = |α|f(x) α ∈ R, x ∈ RnKý hiệu, x - chuẩn x.xp= (|x1|p+ ··· + |xn|p)1pp ≥ 1 : p-chuẩn của x.Các chuẩn quan trọng:x1= |x1| + ··· + |xn|x2= (|x1|2+ ··· + |xn|2)12= (xTx)12x∞= max1≤i≤n|xi|* Các tính chất của chuẩn vector.(i) Bất đẳng thức Holder:|xTy| ≤ xpyq,1p+1q= 1.(ii) Bất đẳng thức Cauchy-Schwartz:|xTy| ≤ x2y2.(iii) Mọi chuẩn trên Rnđều tương đương, i.e. nếu .αvà .βlà các chuẩntrên Rn, thì tồn tại c1và c2sao choc1xα≤ xβ≤ c2xα.Khi đó, một dãy hội tụ trong α - chuẩn thì cũng hội tụ trong β - chuẩn.68 1.2 Chuẩn Ma trận.Định nghĩa 1.2.1 Cho A là một ma trận cấp m× n, ta có các khái niệm sauran(A) = {y ∈ Rm: y = Ax, x ∈ Rn} - Miền giá trị (range) của A.null(A) = {x ∈ Rn: Ax = 0} - không gian rỗng (null space) của A.Nếu A = {a1, . . . , an} là một phân hoạch cột, thìran(A) = span{a1, . . . , an}.Định nghĩa 1.2.2 (Đạo hàm) Cho A(α) = (aij(α))m×n. Nếu (aij(α)) là cáchàm khả vi theo biến α, thì ma trận A(α) có đạo hàmA(α) =ddαA(α) = (ddαaij(α)) = (aij(α))Giả sử A(α) ∈ Rm×r, B(α) ∈ Rr×nlà các ma trận của các hàm khả vi theobiến α, khi đóddα[A(α)B(α)] = [ddαA(α)]B(α) + A(α)[ddαB(α)]Định nghĩa 1.2.3 (Chuẩn ma trận) Hàm f : Rm×n→ R được gọi là mộtchuẩn ma trận nếu thỏa:(i) f(A) ≥ 0 A ∈ Rm×n, (f(A) = 0, A = 0).(ii) f(A + B) ≤ f(A) + f (B) A, B ∈ Rm×n.(iii) f(αA) = |α|f(A) α ∈ R, A ∈ Rm×n.Ký hiệu, A - chuẩn của ma trận A.Chuẩn ma trận được dùng nhiều trong đại số tuyến tính số đó là Frobenius-chuẩn:AF=mi=1nj=1|a2ij|.p - chuẩn:Ap= supx=0Axpxp= supx=0 A(xxp) p= maxxp=1Axp.Nhận xét. ABp≤ ApBp.Ta nói rằng các chuẩn f1, f2, f3trên Rm×q, Rm×n, Rn×qlà tương hỗ nhất quán(mutually consistent) nếu với mọi A ∈ Rm×n, B ∈ Rn×q, ta cóf1(AB) ≤ f2(A)f3(B).69 Nói chung, không phải tất cả các chuẩn đều thỏa: AB ≤ AB.Chẳng hạn, nếu A= max|aij| vàA = B =1 11 1,thì AB> AB.p - chuẩn có một tính chất quan trọng: với mọi A ∈ Rm×nvà x ∈ Rnta cóAxp≤ Apxp. Tổng quát hơn, với mọi chuẩn vector .αtrên Rnvà .βtrên Rm, ta cóAxβ≤ Aα,βxαvớiAα,β= supx=0Axβxα.Khi đó, ta nói .α,βlà phụ thuộc (subordinate) .αvà .β. Do {x ∈ Rn:xα= 1} là compact và .βlà liên tục, ta nhận đượcAα,β= maxxα=1Axβ= Ax∗βvới x∗∈ Rncó α-chuẩn bằng 1.1.2.1 Các tính chất.Cho A ∈ Rm×nta có các tính chất sau:A2≤ AF≤√nA2maxi,j|aij| ≤ A2≤√mn maxi,j|aij|A1= max1≤j≤nmj=1|aij|A∞= max1≤j≤mnj=1|aij|1√nA∞≤ A2≤√mA∞1√mA1≤ A2≤√nA1.70 Nếu 1 ≤ i1≤ i2≤ m, 1 ≤ ji1≤ j2≤ n, thìA(i1: i2, j1: j2)p≤ Ap.Một dãy {A(k)} ∈ Rm×nhội tụ nếulimk→∞A(k)− A = 0.Định lý 1.2.1 Nếu A ∈ Rm×n, thì tồn tại z ∈ Rn,z2= 1 sao cho ATAz =µ2z, µ = A2.Chứng minh. Giả sử z ∈ Rn,z2= 1 sao cho Az2= A2. Đặtg(x) =12Ax22x22=12xTATAxxTxKhi đó, ∇g(z) = 0, nên ta nhận được∂g(z)∂zi= [(zTznj=1(ATA)ijzj− (zTATAz)zi]/(zTz)2= 0⇒nj=1(ATA)ijzj= (zTATAz)zi⇔mi=1nj=1(ATA)ijzj=mi=1(zTATAz)zi⇔ ATAz = (zTATAz)z = Az22Đặt µ = Az2= A2. Chú ý. 1 Theo kết quả định lý, A22chính là nghiệm của phương trình đặctrưng p(λ) = det(ATA − λI) = 0.Hệ quả 1.2.1 Nếu A ∈ Rm×n, thì A2≤A1A∞.Chứng minh. Nếu z = 0 sao cho ATAz = µ2z, µ = z2, thìµ2z1= ATAz1≤ AT1A1z1= A∞A1z1. 71 1.2.2 Phép nhiễu và nghịch đảo.Bổ đề 1.2.1 Nếu F ∈ Rn×nvà Fp< 1, thì I − F là không suy biến và(I − F )−1=∞k=0Fkvới(I − F )−1p≤11 − Fp.Chứng minh. Giả sử I − F là suy biến. Khi đó, phương trình (I − F )x = 0có nghiệm x = 0 và Ixp= F xpsuy ra xp= F xp≤ Fpxp, vậyFp≥ 1 (mâu thuẩn). Vậy I − F là không suy biến.Xét đồng nhất thức(Nk=0Fk)(I − F ) = I − FN+1.Do Fp< 1 và Fkp≤ Fkpnên limk→∞Fk= 0.Như vậy,( limN→∞Nk=0Fk)(I − F ) = I.Điều đó chỉ ra rằng(I − F )−1= ( limN→∞Nk=0Fk) =∞k=0FkVà khi đó,(I − F )−1p= ∞k=0Fkp≤∞k=0Fkp=11 − Fp. Theo kết quả định lý, ta có (I − F )−1− Ip≤F p1−F p.Định lý 1.2.2 Nếu A là không suy biến và r = A−1Ep< 1, thì A + E làkhông suy biến và (A + E)−1− A−1p≤ EpA−12p/(1 − r).Chứng minh. Từ A là không suy biến suy ra A + E = A(I − F ), với F =−A−1E. Khi đó, Fp= r < 1, theo bổ đề trên I − F là không suy biến và72 (I − F )−1p< 1/(1− r). Ta có, (A + E)−1= (A(I − F ))−1= (I − F )−1A−1,do đó(A + E)−1p≤A−1p1 − r.áp dụng: B−1= A−1− B−1(B − A)A−1ta nhận được (A + E)−1− A−1=−A−1E(A + E)−1, và khi đó(A + E)−1− A−1p≤ A−1pEp(A + E)−1p=A−12pEp1 − r. 1.3 Tính trực giao.Một tập các vector {x1,··· , xp} ⊂ Rmlà trực giao nếu xTixj= 0,∀i = j.Phần bù trực giao của S ⊆ Rmdược định nghĩaS⊥= {y ∈ Rm: yTx = 0,∀x ∈ S}.Ma trận Q ∈ Rm×mđược gọi là trực giao nếu QTQ = I.Định lý 1.3.1 Nếu V1∈ Rn×rcó các cột trực giao, thì tồn tại V2∈ Rn×(n−r)để cho V = [V1V2] là trực giao.Khi đó, ran(V1)⊥= ran(V2).Nhận xét.(ii) Nếu QTQ = I, thì Qx22= xTQTQx = xTx = x22.(ii) Nếu Q và Z là các ma trận trực giao, thìQAZF= AF, |QAZ2= A2.2 Các giá trị kỳ dị của ánh xạ tuyến tính -Phân tích giá trị kỳ dị (SVD).Không gian Rntrang bị tích vô hướng <. , .>.Định lý 2.1 Cho L : Rn→ Rmlà ánh xạ tuyến tính. Khi đó tồn tại cơ sở trựcchuẩn e1, . . . , encủa Rnvà ´e1, . . . , ´emcủa Rm, và các số λ1≥ . . . ≥ λr> 0,với r = rankL, sao choLej= λj´ej(j = 1, . . . , r), Lej= 0 (j = r + 1, . . . , n).73 Chứng minh. Xét dạng toàn phương trên Rn: q(x) =< Lx, Lx >= xTATAx.Tồn tại cơ sở trực chuẩn e1, . . . , encủa Rnsao choq(x) =nk=1λ2kx2k, với x =nk=1xkek,và λ1≥ . . . ≥ λr> 0 = λr+1= . . . = λn.Khi đó, ´ej=1λjLej, j = 1, . . . , r, là hệ trực chuẩn, nên có thể bổ sung thànhhệ cơ sở trực chuẩn của Rm. Đó là cơ sở thỏa định lý. Dạng ma trận của định lý trên là:Định lý 2.2 (Singular Value Decomposition (SVD))Cho A là một m × n - ma trận thực. Khi đó, tồn tại các ma trận trực giaoU = (u1, . . . , um) ∈ Rm×mvà V = (v1, . . . , vn) ∈ Rn×nvà các số λ1≥ ··· ≥λq≥ 0, với q = min(m, n), sao choUTAV = diag(λ1, . . . , λq) ∈ Rm×nChứng minh. Cho x ∈ Rnvà y ∈ Rmlà các vector đơn vị trong 2-chuẩn thỏaAx = λy, λ = A2. Khi đó, tồn tại V2∈ Rn×(n−1)và U2∈ Rm×(m−1)để choV = [xV2] ∈ Rn×nvà U = [yU2] ∈ Rm×mlà các ma trận trực giao. Khi đó,UTAV =λ wT0 B= A1, B = UT2AV2∈ R(m−1)×(n−1).Ta có,A1λw22= (λ w)AT1A1λw≥ (λ2+ wTw)2.Do đó, A122≥ (λ2+wTw). Mà λ2= A22= A122, nên ta nhận được w = 0.Tiếp tục, chứng minh quy nạp với B = UT2AV2∈ R(m−1)×(n−1), ta nhận đượcchứng minh của định lý. Định nghĩa 2.1 Các giá trị λi= λi(L), i = 1, . . . , q trong các định lý trênđược gọi là các giá trị kỳ dị của L hay của A, uivà viđược gọi là các vectorkỳ dị trái thứ i và phải thứ i tương ứng. λ0(L) = 1.Ví dụ.A =0.96 1.722.28 0.96= UDVT=−0.8 0.60.6 0.81 00 30.6 0.8−0.8 0.6T.A =0.96 1.722.28 0.96= UDVT=0.6 −0.80.8 0.63 00 10.8 0.60.6 −0.8T.74 3 Hình học của các giá trị kỳ dị.Không gian vector tích ngoại thứ k của Rn,kRn, cảm sinh tích vô hướng:< w, ´w >= det(< vi, ´vj>)1≤i,j≤k, với w = v1∧ ··· ∧ vk, ´w = ´v1∧ ··· ∧ ´vk. Khiđó,v1∧ ··· ∧ vk = V olk(v1,··· , vk).Mỗi ánh xạ tuyến tính L : Rn→ Rm, sinh ra ánh xạ tuyến tínhLk:kRn→kRm, Lk(v1∧ ··· ∧ vk) = Lv1∧ ··· ∧ LvkKý hiệu wk(L) = Lk = maxw=1Lk(w), w0(L) = 1(k = 1,··· , q =min(m, n)).Theo chứng minh định lý trên ta có:Mệnh đề 3.1 Gọi r = rank L. Khi đó(i) L(Bn(0, 1)) là một ellipsoid r-chiều, với độ dài các nửa trục là λ1(L),··· , λr(L).(ii) wk(L) = λ0(L)··· λk(L) = max{V olk(L(C)) : C hộp đơn vị k-chiều trongRn}.Chứng minh: Xem [6].4 ý nghĩa của các giá trị kỳ dị.Từ các định lý trên, ta có nhận xét:(i) rank L = r khi và chỉ khi λr(L) > 0, λr+1= 0.(ii) Trong phân tích SVD, gọi D = diag(λ1, . . . , λq) ∈ Rm×n, khi đó, AV =UD, ATU = V DT, và ta cóAvi= λiuiATui= λivii = 1 : minm, nA = UDVT=qk=1λkukvTk(iii)A2= λ1, λi(A) = uTiAviminx=0Ax2x2= λq, q = min{m, n}.75 Định lý 4.1 Giả sử A ∈ Rm×ncó phân tích SVD UTAV = diag(λ1,··· , λr) ∈Rm×n. Nếu k < r = rank(A) vàAk=ki=1λiuivTi,thìminrank(B)=kA − B2= A − Ak2= λk+1.Chứng minh. Do UTAkV = diag(λ1,··· , λk, 0,··· , 0), nên rank(Ak) = k, vàdo UT(A − Ak)V = diag(0,··· , 0, λk+1,··· , λr, 0,··· , 0), nên A − Ak2=λk+1.Giả sử B ∈ Rm×n, rank(B) = k. Khi đó, tồn tại hệ trực chuẩn {x1,··· , xn−k} ⊂Rnsao cho null(B) = span{x1,··· , xn−k}. Từ số chiều suy ranull(B) = span{x1,··· , xn−k} ∩ span{v1,··· , vk+1} = {0}.Giả sử z là vector đơn vị trong tập giao trên. Do Bz = 0 vàAz =k+1i=1λi(vTiz)ui, (do vTk+jz = 0, j = 2,··· )nên ta cóA − B22≥ (A − B)z22= Az22=k+1i=1λ2i(vTiz)2≥ λ2k+1.Từ đó suy ra kết quả định lý. Nhận xét.(i) Các giá trị kỳ dị đo khoảng cách đến các tập kỳ dị:Giá trị kỳ dị nhỏ nhất của A là khoảng cách (theo 2- chuẩn) của A đến tậptất cả các ma trận có hạng khuyết (≤ rank(A)). Nói cách khác, với 0 ≤ k <q = min(m, n), đặt Σk= {L ∈ L(Rm, Rn: rank(L) = k}. Khi đóλk+1(L) = d(L, Σk) = d(L, Σ0∪ ··· ∪ Σk).(ii) ε − rank của một ma trận A, được ký hiệu và xác địnhrε= rank(A, ε) = minA−B2≤εrank(B).Khi đó ta cóλ1(A) ≥ ··· ≥ λrε(A) > ε ≥ λrε+1(A) ≥ ··· ≥ λq, q = min(m, n).76 (iii) Cho A là ma trận vuông cấp n khả nghịch. Khi đó hệ phương trình tuyếntính Ax = b có duy nhất nghiệm x = A−1b.Theo phân tích SVD,A =ni=1λiuivTi= UDVT,nênx = (UDVT)−1b =ni=1uTibλivi.Vậy nếu λnbé, A, b thay đổi nhỏ dẫn tới x thay đổi lớn.5 Quan hệ với một số đánh giá kỳ dị khác.Định lý 5.1 (Eckart-Young). Khi A là ma trận khả nghịch cấp n,λn(A) = d(A, Σn−1) =1A−1.Chứng minh. Từ phân tích SVD của A, ta có phân tích SVD A−1= (UDVT)−1=V D−1UT.Suy ra A−1 = λ1(A−1) =1λn(A). Một chứng minh khác xem [1].Số Rabier. Cho A ∈ L(Rn, Rm). Đặtν(A) = infϕ=1A∗ϕ,trong đó A∗là ánh xạ liên hợp của A.Ta có ν(A) > 0 ⇔ A là toán ánh. Các tính chất của số Rabier xem [3, 4, 5].Khi n ≥ m, ν(A) = λm(A) = min{|λ| : λ2là giá trị riêng của AA∗}.Số Kuo. Cho A = (A1,··· , Am) ∈ L(Rn, Rm). Ký hiệu Ai= grad Ai, <(Aj)j=i> là không gian tuyến tính được sinh ra bởi các Aj, j = i. Đặtk(A) = min1≤k≤md(Ak, < (Aj)j=k>).là số Kuo của A.77

Ngày đăng: 27/10/2012, 10:05

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w