Phân tích nhân trong I đgl sự phân tích giá trị suy biến của ma trận A và các cột trong U và V đgl bên trái , bên phải của vector suy biến A , tương ứng.. Trong khi các phương pháp xây d
Trang 1KHOA TOÁN
-BÀI NIÊN LUẬN PHÂN TÍCH THEO GIÁ TRỊ SUY BIẾN
CỦA MỘT MA TRÂN
Giáo viên hướng dẫn : T.S TRẦN ĐÌNH LONG
Học phần : Thực hành viết niên luận
Sinh viên : VÕ QUANG HƯNG
: HUỲNH THÁI DƯƠNG
Lớp : TOÁN K36
Năm học 2015- 2016
Trang 2LỜI NÓI ĐẦU
SVD đã được phát hiện một cách độc lập và tái phát nhiều lần , theo những ghi chép với sự phát triển ban đầu gồm có :
- Eugenio Beltrami (1835-1899) vào năm 1873 ,
- ME Camille Jordan (1838-1922) vào năm 1875 ,
-James J Sylvester (1814-1897) vào năm 1889 ,
-L Autonne vào năm 1913 và
-C Eckart và G Young trong năm 1936
Trang 3Mục lục
Trang bìa……….
Lời nói đầu ………
Nội dung (-) PHÂN TÍCH GIÁ TRI SUY BIẾN ………
(-) ẢNH CỦA CÁC ĐƠN VỊ HÌNH CẦU ( MẶT CẦU )……….
(-) KHOẢNG CÁCH ĐẾN MA TRẬN BẬC THẤP HƠN………
(-) PHƯƠNG PHÁP NGHỊCH ĐẢO MOORE-PENROSE………
(-) BÀITẬP……….…
Trang 4NỘI DUNG
I) PHÂN TÍCH GIÁ TRI SUY BIẾN
Cho A ∈R m n× có rank = r , có ma trận trực giao U m m× ,V n n× , và một ma trận đường chéo D r r× =diag( , , , , ) δ δ δ 1 2 3 δr Ta có
m n
D
×
= ÷
với δ δ 1 ≥ 2 ≥ ≥ δ 3 ≥ δr > 0 (I)
min(m,n) thì A được cộng thêm p-r giá tri suy biến Phân tích nhân trong (I) đgl sự phân tích giá trị suy biến của ma trận A và các cột trong
U và V đgl bên trái , bên phải của vector suy biến A , tương ứng
Từ đây ta phân tích vì sao lại được như vậy
Đối với ma trận A có rank = r , và áp dụng houselolder để rút
như thế này
B = C n n(0× )÷
=> B = (C T|0)V => ÷B0
= 0 00
T C
V Như vậy
A = P
( )
0
C
×
÷
T
Trong đó C là ma trân tam giác
Mục đích phần này là chứng minh rằng C buộc phải la ma trận
đường chéo
Giả sử
1
Như vậy
Trang 5(C CT −λI) x 0= trong đó x 2 = 1 và λ = x C Cx T T =δ12 (1) Tập hợp Y = Cx/ Cx 2 = Cx/δ 1 , và R y = ( | )y Y và R x = ( | X)x , ta được
bộ phản xạ cơ bản có y va x là cột đầu tiên của ma trận và xây dựng một ma trận unitary có chứa x là cột đầu tiên của nó
vậy nhân trên bên trái của R ( ghi nhớ rằng R2 = I) , và
x = ∓μRe1 = [∓μR]* 1 Từ đó | ∓μ | = 1, U = ∓μR là một ma trận
thể suy ra rằng bộ phản xạ là ma trân trực giao
Ta tiến hành
0
T X C CX X X
y y
được
1 2
0 ( | )
0
T
y Cx y CX y
R CR c x X
C
δ
= ÷ = ÷= ÷
Với δ ≥ 1 C2 2 ( bởi vì δ 1= C 2 = max {δ 1, C 2}
này :
2 2
3
0 0
y x
S C S
C
δ
= ÷
trong đó δ ≥ 2 C3 2
,
1
3
P CQ
C
δ δ
= ÷÷
giao P r−1 và Q r−1 , như vậy
P CQ r−1 r−1 =diag( , , , , ) D δ δ δ 1 2 3 δr = trong đó δ δ 1 ≥ 2 ≥ ≥ δr
Trang 61 0 1 0
U ,
Sau đó
0
0 0
U AV
= ÷
Ví dụ
1) Tìm một SVD cho ma trận sau :
C −34 −68
= − ÷
Giải
Ta tính được
0 100
T
C C= ÷δ =
Như vậy
1
3 / 5 /
4 / 5
y Cx= δ = −− ÷
Ta thiết lập u x = −x e1 và u y = −y e1 và xây dựng
1 0
T
x x
x x
u u
R I
u u
= − = ÷
4 / 5 3 / 5
T
y y
y y
u u
R I
u u
Như vậy
R CR y x =10 00 5=D
÷
Vậy ta tìm được 1 SVD của C
II) ẢNH CỦA CÁC ĐƠN VỊ HÌNH CẦU ( MẶT CẦU )
Trang 7Trong khi các phương pháp xây dựng dùng để lấy SVD có thể được sử dụng như một thuật toán, Tuy nhiên, các chi tiếtcủa một thuật toán SVD thực tế là quá phức tạp để được thảo luận vào thời điểm này
Trong thực tế, các thuật toán thực tế để tính SVD là một thực hiện
Giá trị suy biến tiết lộ điều gì đó về hình học của biến đổi tuyến tính , bởi vì các giá trị suy biến δ δ 1 ≥ 2 ≥ ≥ δ 3 ≥ δn của một ma trận A , cho chúng ta biết có thể xảy ra quá trình chuyển đổi bằng A Họ làm như vậy bằng cách cho chúng tôi một bức tranh rõ ràng về cách
A là biến dạng các cầu đơn vị Để phát triển điều này , giả sử rằng
R
tích giá trị suy biến của 1 ma trận ,
T
A UDV= và 1 1 T
A− =VD U− , trong đó D diag= ( , , , , ) δ δ δ 1 2 3 δn
1 = x = A Ax− = A y− = VD U y− T = D U y− T = D w−
=
2
3
r r
w
thể ảnh hưởng đến sự định hướng của A (S2), do đó A (S2) cũng là
trục A (S2) được định hướng cùng bên trái vectơ suy biến và xác định bởi các cột của U Vì vậy , những bán trục thứ k của A (S2) là
k
Trang 8biến bên phải V *k là một điểm trên S2 là ánh xạ tới các vị trí k có độ dài
như hình 5.12 1
Hình 5.12.1
Mức độ biến dạng của hình cầu đơn vị thực hiện chuyển đổi bằng A
là do bởi κ2 = σ1/σn, tỷ lệ giá trị suy biến lớn nhất với giá trị suy biến nhỏ nhất
Ta có
2
1
1
T x
=
Và
x Ax
A− VD U− D− δ
2
1/
k = A A− Sau đây là bảng tóm tắt nội dung trên :
Trang 9ẢNH CỦA CÁC ĐƠN VỊ HÌNH CẦU (MẶT CẦU)
δ δ ≥ ≥ ≥ δ ≥ δ và một SVD A UDV= T với D diag= ( , , , , ) δ δ δ 1 2 3 δn ,
đơn vị đó , khi đó AV*k = δk U*k Đặc biệt ,
=
= = = (II.2)
x
=
Mức độ biến dạng của hình cầu đơn vị thực hiện chuyển đổi bằng
A , được đo bằng số lượng đăng ký 2-mức :
n
δ
−
Ví dụ
(hoặc gần đúng), giải pháp cho một hệ thống không suy biến Ax = b
được "kiểm tra" bằng cách tính dư r
= b-Ax:
Nếu r = 0, chính xác,
sau đó x:
phải là giải pháp chính xác Nhưng nếu r không chính xác
đội hình dự kiến chính xác đến khoảng t con số đáng kể
Vấn đề:
Đến mức nào kích thước của dư phản ánh chính xác của một giải pháp gần đúng?
Giải pháp:
tương đối so với các
như Ax:
= b-r, và áp dụng
Trang 10x x
:
được
x x
≤ ≤
:
Vì vậy, đối với một A có điều kiện , r còn lại là tương đối nhỏ
xuất một r dư nhỏ, và và một xấp xỉ rất chính xác có thể sản xuất một dư lớn
Kết luận :
Dư là chỉ số đáng tin cậy về độ chính xác chỉ khi A là cũng có điều kiện , nếu A có điều kiện xấu thì dư gần như vô nghĩa
III) KHOẢNG CÁCH ĐẾN MA TRẬN BẬC THẤP HƠN
Trang 11Ngoài việc đo lường sự biến dạng của cầu đơn vị và đánh giá sự
độ nhạy của hệ thống tuyến tính, giá trị suy biến cung cấp một biện pháp như thế nào gần A là một ma trận các cấp bậc thấp hơn
Nếu δ δ 1 ≥ 2 ≥ ≥ δ 3 ≥ δr là những giá trị số ít khác không của A m n× , sau đó cho mỗi k < r, khoảng cách từ A đến ma trận gần nhất của bậc k là :
k 1 min( ) 2
rank B k A B
δ +
=
Chứng minh
A U V
= ÷
với D diag= ( , , , ) δ δ 1 2 δr Xác định S diag= ( , , , δ δ 1 2 δk+1 ) và phân vùng
1
( n k | )
V = F× + G
Mặc khác rank BF( ) ≤rank B( ) =k , dim (N BF) = + −k 1 rank BF( ) 1 ≥ , do đó
x N BF∈ với x 2 = 1
0 0 0
T
D
y
A B max A B y
=
0
k
D
B U V
= ÷
với D k =diag( , , ) δ 1 δk và như thế (III,1) đã được chứng minh
Ví dụ
Cho { , , , } δ δ 1 2 δp và {β1, β2, , βp} là tất cả các giá trị suy biến
và cho A và A + E, tương ứng
Vấn đề : Chứng minh rằng
Trang 12k k E
Giải pháp: Nếu SVD cho A được đưa ra trong (I) được viết dưới dạng
1
p
T
i i i i
=
1
1
k
T
i
=
Sau đó
≥ βk − E 2
Ghép các dữ liệu lại và quan sát ta thấy
δ
rank B k A E B E β E
= −
để kết luận rằng
2
IV) PHƯƠNG PHÁP NGHỊCH ĐẢO MOORE-PENROSE
Trang 13Cũng như sự phân hủy tầm nullspace để xác định nghịch đảo Drazin của một ma trận vuông , một nhân tử URV hoặc một SVD có thể được sử dụng để xác định một nghịch đảo tổng quát cho các ma trận chữ nhật Đối với một phần từ URV
0
0 0
T
m n
m n
C
×
= ÷
,
chúng ta xác định
1
0 0
T
m n
n m
C
−
×
+
= ÷
là nghịch đảo Moore-Penrose (hoặc các pseudoinverse) của A Mặc
dù các yếu tố URV không duy nhất xác định bởi A, nó có thể được chứng minh rằng A † là duy nhất bằng cách cho rằng A † là giải pháp duy nhất để bốn phương trình Penrose
(AA ) =AA† T † (A A) =A A† T †
như vậy A † là ma trận không đổi và được xác định như trên Vì nó không quan trọng về việc nhân tử URV được sử dụng , nên chúng
ta có thể sử dụng SVD ở (I) , trong trường hợp này
1
( , , )r
liên quan A † đến giải pháp và nhất là các giải pháp cho hình
vuông , hệ thống tuyến tính được đưa ra trong những điều tóm tắt sau đây
Trang 14• Xét về yếu tố URV, các pseudoinverse Moore-Penrose của
0
m n
C
o
×
×
1
0 0
T
n m
C
−
×
Euclide (IV.2)
định mức tối thiểu Euclide (IV.3)
• Khi một SVD được sử dụng , C = =D diag( , , ) δ 1 δr , vì vậy
1
†
1
0
0 0
T r
δ
−
=
= ÷ =
1
r i i
u b
δ
=
Chứng minh
† ( ) † ( T)
A b R A∈ = R A , như vậy b⊥n Do đó, theo định lý Pythagore ,
z = A b n + = A b + n ≥ A b
nhất giải pháp định mức Khi Ax = b là không phù hợp, các giải pháp bình phương tối thiểu là các giải pháp của phương trình bình
tối thiểu của định mức tối thiểu, áp dụng lập luận tương tự được sử dụng trong các trường hợp phù hợp với các phương trình bình
thường
Chú ý ! Nghịch đảo tổng quát là hữu ích trong việc xây dựng báo
cáo lý thuyết chẳng hạn như những người ở trên, nhưng, cũng giống như trong trường hợp của nghịch đảo bình thường, tổng quát
Trang 15ngược là không công cụ tính toán thực tế Ngoài việc tính toán hiệu quả, vấn đề nghiêm trọng số kết quả từ thực tế rằng A †nhu cầu không phải là một hàm liên tục của các mục của A
Ví dụ như
†
x
x
x
≠
>
>
.
Không chỉ là A x† không liên tục trong ý nghĩa rằng lim ( )x→0 A x† ≠ A†(0) ,
nhưng nó là không liên tục trong cách tồi tệ nhất bởi vì như A (x)
Những hành vi này dịch vào khó khăn không thể vượt qua tính toán
vì những lỗi nhỏ do làm tròn (hoặc bất cứ điều gì khác) có thể tạo ra những lỗi rất lớn trong việc tính toán A †, và sai sót trong A trở nên nhỏ hơn các lỗi dẫn đến A † có thể trở nên lớn hơn Thực tế ma quỷ cũng đúng đối với nghịch đảo Drazin Các vấn đề về số vốn có cùng với thực tế rằng đó là cực kỳ hiếm hoi cho một ứng dụng để
được công cụ lý thuyết hoặc kí hiệu Nhưng đừng đánh giá thấp vai trò này
Bài tập
Trang 161) Nếu δ δ 1 ≥ 2 ≥ ≥ δr là những giá trị số ít khác không của A, sau
ν = δ + δ + δ + + δ
C ×
) cho mỗi k = 1,2, , r Giải thích tại sao 2 - chuẩn mực và tiêu chuẩn Frobenius là những trường hợp cực đoan trong ý nghĩa
1 2
F
A = δ + δ + δ + + δ
Giải
2
một trình bày lại (II.2)
( )
2
1 2 3
0
r F
D
đó rank (A + E) ≥ rank (A)
Giải
Nếu rank(A+E)=k<r sau đó theo () ta thấy rằng
1
rank k
=
đó là không thể Do đó rank (A + E) ≥r = rank (A)
b) ( )A† † = A
c) ( )A† T = (A T)†
Trang 17d)
1
†
1
{
m n
T T
m n
A
×
−
−
×
=
=
=
f) A† = A AA T( T)† =(A A A T )† T cho tất cả A∈ℜm n×
g) R A( )† = R A( T) = R(A† A), , và N A( ) † = N A( T) =N AA( † )
Giải
= ÷
† †
đó ,
†
( ) A T = (VR U )T = ( URV ) ( = U R VT T ) = ( AT )
d) Khi rank (Am × n) = n, một SVD phải có các hình thức
0
n n
m n n
D
− ×
† ( 1 0) UT
A = I D−
Hơn nữa , A A D T = 2 và (A A T )−1A T = I D( −10)U T = A† các phần khác là tương tự
e)
1
0 0
T
r r
−
×
= ÷ ÷ ÷ =
Các phần khác là tương tự
f) Sử dụng một SVD viết
( )
T
= ÷ ÷ = ÷ =
và một phần (f) gợi ý R A( ) † ⊆ R A( T) , do đó R A( ) † =R A( T), mặc
cũng tương tự
Trang 184) Chứng minh rằng nếu 2
r
0
lim(A A T I) A T A
ε ε −
Giải
0 0
T
D
sau đó
0
I
ε ε
ε
không có giá trị suy biến , vì vậy nó không suy biến
Hơn nữa,
Điều phải chứng minh