Biên của giả phổ

Chúng ta bắt đầu mục này với hướng tiếp cận hình học để giải bài toán hoành độ giả phổ bằng việc nghiên cứu biên của giả phổ.

Mệnh đề 2.5.1 [2] Giả phổ Λ(A) là tập compact được chứa trong hình tròn bán kính

||A||+. Nó chứa giả phổ chặt Λ0

(A), và Λ0

(A)là mở và rỗng.

Chứng minh: Giả phổ chặt là tập khác rỗng vì nó chứa phổ và là tập mở vì σmin và g là liên tục. Điều này chỉ ra rằng giả phổ là tập đóng. Với z ∈Λ(A) tùy ý, có một véc tơ đơn vị u∈ Cn thỏa mãn ||(A−zI)u|| ≤ . Mặt khác ||Au|| ≤ ||A||.||u||=||A||, nên ta có bất đẳng thức:

|z|=||zu|| ≤ ||(A−zI)u||+||Au|| ≤ ||A||+.

Vì vậy ta suy ra tính bị chặn của giả phổ.

Nhận xét: Theo Mệnh đề 2.5.1 thì -hoành độ giả phổ của ma trận A nằm trong đoạn [α, +||A||].

Định lý 2.5.2 [2] Các cực tiểu địa phương của hàm

g(z) =σmin(A−zI)

là các giá trị riêng của ma trận A.

Chứng minh: Giả sử rằng z0 là một cực tiểu địa phương của g(z) nhưng không là giá trị riêng của ma trận A. Khi đóz0 là cực đại địa phương theo chuẩn của giải thức||(A−zI)−1||. Ta có thể chọn các véc tơ đơn vị u, v ∈Cn thỏa mãn:

||(A−z0I)−1||=|u∗(A−z0I)−1v|

và do đó ta có, với điểm z gần z0, các bất đẳng thức

|u∗(A−zI)−1v| ≤ ||(A−zI)−1k ≤ ||(A−z0I)−1||=|u∗(A−z0I)−1v|.

Do đó môđun của hàm u∗(A−zI)v đạt cực đại địa phương tại z0. Nhưng điều này mâu thuẫn với nguyên lý môđun cực đại, vì hàm này khả vi vô hạn lần và khác hằng tại lân cận của z0.

Hệ quả 1 [2] Bao đóng của giả phổ chặt là giả phổ, do đó với > 0 hoành độ giả phổ được xác định bởi:

α(A) = sup{Rez :z ∈Λ0(A)}.

Chứng minh: Một điểm thuộc giả phổ nằm ngoài bao đóng của giả phổ chặt phải là cực

tiểu địa phương của hàm g.

Dễ thấy hoành độ giả phổα(A)là một hàm liên tục, tăng chặt theo biếntrên[0,+∞). Chú ý rằng trái ngược với kết quả trên, hàm g phải có cực đại địa phương do đó giả phổ chặt có thể không bằng với tập các điểm trong của giả phổ.

Chúng ta có thể cải tiến hệ quả trên bằng lập luận khéo léo hơn, chỉ ra rằng có thể "truy cập" tới bất kì điểm nào trong giả phổ theo một đường trơn nằm trong giả phổ chặt.

Luận văn tốt nghiệp Về giả phổ của ma trận

Định lý 2.5.3 [2] Cho trước điểm z0 tùy ý thuộc giả phổ, khi đó tồn tại một đường cong khả vi vô hạn lần p: [0,1]→C sao cho p(0) = z0 và p(t) nằm trong giả phổ chặt với mọi

t∈(0,1].

Chứng minh: Ta hoàn toàn có thể giả sử rằng g(z0) = . Theo Hệ quả 1, tồn tại một dãy

zr ∈Λ0

hội tụ đếnz0. Với mỗi chỉ sốr tồn tại một véc tơur ∈Cn thỏa mãn bất đẳng thức 1<||ur||<1 +1

r và ||(A−zrI)ur||< .

Ta lấy một dãy con, và ta có thể giả sử rằng dãy con đó là ur hội tụ và có giới hạn là u0, và ta có (z0, u0)thuộc bao đóng của S, trong đó

S ={(z, u) :||u||2 >1,||(A−zI)u||< 2}.

Vì tập S được xác định bởi một số hữu hạn các bất đẳng thức chặt, nên chúng ta có thể áp dụng bổ đề tính truy cập được (accessibility lemma) trong giải tích phức. Tức là có một đường cong khả vi vô hạn lần q : [0,1] → C×Cn sao cho q(0) = (z0, u0) và q(t)∈ S với mọi t∈(0,1]. Từ đó ta có ngay điều cần chứng minh khi lấyplà thành phần thứ nhất của

Thông thường, biên của giả phổ có thể dễ dàng nhận được mà không cần tới kết quả trên. Trước hết chúng ta có định nghĩa sau đây.

Định nghĩa 2.5.1 [2] Một điểmz ∈Cđược gọi là suy biến nếu giá trị kì dị nhỏ nhất của ma trậnA−zI khác 0 và đơn, và véc tơ kì dị phải tương ứnguthỏa mãn u∗(A−zI)u= 0.

Bổ đề 4 [2]Cho trước véc tơ đơn vị tùy ý u∈Cn, ma trận B ∈Cn×n, và số phức w∈C, ta có:

||(B +wI)u||2− ||Bu||2=|u∗(B+wI)u|2− |u∗Bu|2.

Chứng minh: Từ u là véc tơ đơn vị tức là kuk2 =u∗u= 1, chúng ta có

k(B+wI)uk2− kBuk2= (u∗B∗+ ¯wu∗)(Bu+wu)−u∗B∗Bu=wu∗B∗u+ ¯wu∗Bu+|w|2

=u∗B∗uu∗Bu+wu∗B∗uu∗u+ ¯wu∗uu∗Bu+|w|2u∗uu∗u−u∗B∗uu∗Bu

=u∗(B∗+ ¯wI)uu∗(B+wI)u−u∗B∗uu∗Bu =|u∗(B+wI)u|2− |u∗Bu|2.

Vậy bổ đề được chứng minh.

Mệnh đề 2.5.4 [2] Mọi điểm không suy biến thuộc giả phổ đều nằm trên biên của một hình tròn mở chứa trong giả phổ chặt.

Chứng minh: Xét điểm không suy biếnz0 ∈Λ. Ta có thể giả sử rằngg(z0) =. Chọn một véc tơ đơn vị kì dị phảiu ứng σmin(A−z0I)thỏa mãn điều kiệnu∗(A−z0I)u6= 0. Khi đó, ta có khẳng định nếu z∈C thỏa mãn|z−u∗Au|<|z0−u∗Au| thì z ∈Λ0

.Thật vậy, theo các tính chất của khai triển kỳ dị

σmin2 (A−z0I) =||(A−z0I)u||2 và σmin(A−zI) = min

x6=0

k(A−zI)xk kxk ,

ta suy ra

σmin2 (A−zI)−2 =σmin2 (A−zI)−σmin2 (A−z0I)≤ ||(A−zI)u||2− ||(A−z0I)u||2.

Theo Bổ đề 4, ta nhận được

σ2min(A−zI)−2 ≤ |u∗(A−zI)u|2− |u∗(A−z0I)u|2 =|z−u∗Au|2− |z0−u∗Au|2.

Vậy ta có điều cần chứng minh.

Mệnh đề 2.5.5 [2]Bất kỳ nghiệm tối ưuz0 nào của bài toán hoành độ giả phổ(2.2.1)(hoặc

(2.4.1)) phải nằm trên biên của giả phổ. Hơn nữa, trừ khi z0 suy biến, biên của giả phổ khả vi tại đó.

Chứng minh: Thực tế z0 không thể nằm trong phần trong củaΛ được. Bây giờ giả sử rằng

Luận văn tốt nghiệp Về giả phổ của ma trận

thẳng đi qua z0. Từ z0 không suy biến nên theo Mệnh đề 2.5.4, Λ chứa một hình tròn đóng mà biên của nó chứa z0. Do đó biên của Λ nằm giữa hình tròn và tiếp tuyến của nó

tại z0.

Định lý 2.5.6 [1] Với mọi điểm (x0, y0) ∈ R2 nếu giá trị kì dị nhỏ nhất của ma trận

A−(x0 +iy0)I là đơn, thì hàm nhận giá trị thực h khả vi vô hận lần trong lân cận của điểm (x0, y0), với gradient

∇h(x0, y0) = [−Re(u∗v),Im(u∗v)] (2.5.1)

với mọi cặp véc tơ đơn vị kỳ dị trái, phải u, v ∈ Cn tương ứng với giá trị kì dị nhỏ nhất. Hơn nữa, giả sử rằng h(x0, y0) = 0, và Re(u∗v)<0, thì tồn tại hàm f : R→R, khả vi vô hạn lần trong lân cận 0 sao cho

f(0) = 0, f0(0) =−Re(Im(uu∗∗vv)),

và dấu của các hàm h(x, y)và x−x0+f(y−y0) trùng nhau với mọi điểm (x, y)∈R2 nằm trong lân cận của điểm (x0, y0).

Chứng minh: Ma trận S(p, q) =   0 A−(p+iq)I A∗−(p−qi)I 0  

có giá trị riêng đơn σmin(A−(x0 +iy0)I) khi tham số (p, q) ∈ C2 bằng với (x0, y0). Vì

S(p, q) phụ thuộc tuyến tính vào (p, q), nên giá trị riêng λ(p, q) là một hàm thuần nhất theo (p, q). Hơn nữa, vớix và y thực ta có

λ(x, y) =σmin(A−(x+iy)I) =h(x, y) +.

Do đó hàm hlà khả vi vô hạn lần trong lân cận điểm(x0, y0).

Ta có véc tơ riêng đơn vị của ma trận Hermit S(x0, y0) tương ứng với giá trị riêng σmin(A−(x0+iy0)I) là w= √1 2   u v  .

Bây giờ sử dụng lý thuyết nhiễu của ma trận, ta nhận được các đạo hàm riêng của hàm

λ:C2 →C và h:R2 →R λp(x0, y0) =hx(x0, y0) =w∗   0 −I −I 0  w=−Re(u∗v), λq(x0, y0) =hy(x0, y0) =w∗   0 −iI iI 0  w= Im(u∗v).

Vì theo giả thiết đạo hàm riêng λp(x0, y0) 6= 0 nên phương trình λ(p, q) = xác định

p(q) là một hàm của q trong lân cận điểm (x0, y0)∈C2. Mặt khác, vì hx(x0, y0)6= 0, ta có thể áp dụng định lý hàm ẩn cho phương trình h(x, y) = 0, để xác định x(y) là hàm nhận giá trị thực của ytrong lân cận điểm (x0, y0)∈R2. Hai hàm p(q)và x(y) phải trùng nhau với mọiy là thực, do đó hàm thu được là hàm khả vi vô hạn lần.

Vì vậy tồn tại một hàm f : R → R, khả vi vô hạn lần trong lân cận của 0 sao cho

f(0) = 0 và h(x0−f(y−y0), y) = 0 với mọiy thực trong lân cận của y0. Ta lấy đạo hàm cả hai vế đẳng thức sau và áp dụng công thức đạo hàm của hàm hợp thì

−hx(x0−f(y−y0), y)f0(y−y0) +hy(x0−f(y−y0), y) = 0. Từ đó suy ra f0(0) = hy(x0, y0) hx(x0, y0) =−Im(u∗v) Re(u∗v). Cuối cùng, chú ý rằng hx(x0−f(y−y0), y)>0

với mọi y thực trong lân cận y0, vì vế trái liên tục theo y và dương thực sự khi y=y0. Do đó ta thu được

Luận văn tốt nghiệp Về giả phổ của ma trận

đúng với mọi (x, y)∈R2 trong lân cận điểm(x0, y0). Vậy ta có điều chứng minh.

Dưới giả thiết của Định lý 2.5.6 giả phổ được xác định trong lân cận điểm (x0, y0) bởi bất đẳng thức

x−x0 ≤ −f(y−y0) (2.5.2)

và về mặt địa phương hàmh= 0chính xác tại các điểm(x, y)mà tại đó dấu đẳng thức xảy ra. (Rõ ràng, với những giả thiết tương tự ngoại trừ Re(u∗v) >0, thì ta cũng nhận được các kết quả như trong định lý, ngoại trừ khẳng định các hàm h(x, y) vàx−x0+f(y−y0) có dấu đối nhau.)

Định nghĩa 2.5.2 [1] Một điểm (x0, y0) ∈ R2 được gọi là chính quy đối với ma trận A

nếu ma trận A−(x0 +iy0)I có một giá trị kì dị nhỏ nhất đơn tương ứng với các véc tơ đơn vị kì dị phải,trái u, v ∈Cn thỏa mãn u∗v 6= 0.

Nếu điểm (x0, y0) là chính quy, theo Định lý 2.5.6 hàm h khả vi vô hạn lần trong lân cận điểm x0, y0, với gradient khác 0.

Hệ quả 2 [1] Giả sử rằng điểm (x0, y0) ∈ R2 là điểm cực đại địa phương của bài toán hoành độ giả phổ, và chính quy. Khi đó có một hàm f : R → R, khả vi vô hạn lần trong lân cận của 0, sao cho:

f(0) = 0, f0(0) = 0, . . . , f(2k−1)(0) = 0, f(2k)(0) >0 trong đó k ∈N (2.5.3)

và dấu của các hàm h(x,y) và x−x0+f(y−y0)trùng nhau với mọi điểm(x, y)∈R2 trong lân cận điểm (x0, y0).

Chứng minh: Theo Định lý 2.5.6, hàm hkhả vi vô hạn lần trong lân cận điểm(x0, y0). Nếu véc tơ d = (d1, d2) ∈ R2 thỏa mãn d· ∇h(x0, y0) < 0 thì theo quy tắc đạo hàm của hàm hợp, với t >0 thực nhỏ, ta có

h((x0, y0) +td) =h(x0, y0) +t(d· ∇h(x0, y0)) +O(t2)<0,

do đó điểm (x0, y0) +td nằm trong giả phổ chặt. Vì (x0, y0) là điểm cực đại địa phương, nên ta suy ra d1 <0. Dễ dàng suy ra rằng ∇h(x0, y0) là một bội dương của véc tơ (1,0).

Bây giờ theo (2.5.1), với các véc tơ đơn vị trái và phải u và v tương ứng với giá trị kì dị nhỏ nhất , ta biết rằng u∗v thực và âm. Do đó Định lý 2.5.6 chỉ ra rằng tồn tại hàm giải tích thực f thỏa mãn f(0) = 0 = f0(0) sao cho, trong lân cận điểm (x0, y0), giả phổ được xác định theo bất đẳng thức (2.5.2). Nhưng ta biết rằng gốc tọa độ là điểm cực đại địa phương của bài toán

max{s :s ≤ −f(t), s, t∈R}

và tính chất (2.5.3) được suy ra từ xét khai triển Taylor của hàmf trong lân cận điểm0. Định lý sau là cần thiết cho chứng minh tính hội tụ của thuật toán trong Chương 3. Tuy nhiên việc chứng minh định lý này liên quan đến các khái niệm của giải tích phức, vì vậy chúng tôi bỏ qua sự chứng minh của nó.

Định lý 2.5.7 [1] Với mọi số thực x ∈ α(A), α(A)

luôn tồn tại số thực y sao cho

Chương 3

Tính toán hoành độ giả phổ của ma trận

3.1 Thuật toán

Phương pháp đơn giản chúng tôi mô tả trong mục này được kế thừa bởi thuật toán của Boyd và Balakrishnan. Xét bài toán cực tiểu sau:

µ= min

y∈Rσmin(A−yiI).

Hướng tiếp cận của họ như sau: cho trước một đánh giá µ ≥ µ¯, tìm tất cả các số thực y

thỏa mãn σmin(A−iyI) =µbởi sử dụng Bổ đề 1. Chúng ta kí hiệu các nghiệm này là

y1≤ y2 ≤ · · · ≤y2m,

với cách liệt kê các nghiệm không xuyên qua hai lần tương tự danh sách (2.4.3). Tiếp theo ta đặt

µ:= min

j σmin(A−y2j−1+y2j

2 iI),

và thực hiện lặp. Về mặt hình học, phương pháp này chung quy là xét các giao điểm của đồ thị hàm số y 7→σmin(A−iyI) với các đường thẳng ngang và đứng biến thiên. Boyd và Balakrishnan đã chứng minh thuật toán này hội tụ toàn cục và hội tụ địa phương cấp 2

tới µ¯.

Để đi tính hoành độ giả phổ α(A) chúng ta sử dụng một thuật toán với hướng tiếp cận tương tự. Thuật toán này phụ thuộc vào việc tìm kiếm các không điểm của các hàm

h(x,·)(vớix thực cố định) và h(·, y)(với ythực cố định) như đã được trình bày ở Mục 2.4 bởi việc tính các giá trị riêng ảo của các ma trận Hamilton liên kết.

Thuật toán 3.1.1 (Phương pháp ciss-cross) [1]

1. Khởi đầu: x1 =α;r = 1.

2. Tìm kiếm tung độ: Tìm tất cả các không điểm

l1r≤ur1 ≤l2r ≤ur2 ≤ · · · ≤urmr

của hàm h(xr,·), liệt kê hai lần các không điểm không xuyên qua. 3. Tìm kiếm hoành độ: Với mỗi j = 1,2, . . . , mr, xác định

yrj = l

r j +ur

2 ,

và tìm kiếm không điểm lớn nhất xr

j của hàm h(·, yr j). 4. Cập nhật: Xác định

xr+1 = max{xrj :j = 1,2, . . . , mr},

tăng r lên 1, và quay trở lại Bước 2.

Chú ý rằng, với kí hiệu danh sách (2.4.3), ta có mr =m(xr), lr

j =lj(xr), ur

j =uj(xr). Nếu k là chọn lớn nhất của chỉ số j trong Bước 4 của phép lặp thứ r của thuật toán, thì trong Bước 2 (tìm kiếm tung độ) của phép lặp kế tiếp, yr

k phải xuất hiện trong danh sách các không điểm của hàm h(xr+1,·).

Như lưu ý ở trên, việc tìm kiếm tung độ sẽ được thực hiện bởi việc tính giá trị riêng của H(xr) và việc loại đi nhưng giá trị mà có giá trị kì dị tương ứng lớn hơn . Điều này tránh việc tìm kiếm hoành độ không cần thiết trong bước tiếp theo. Mặt khác, không cần kiểm tra sự tương ứng giữa các giá trị riêng ảo của H˜(yr

Luận văn tốt nghiệp Về giả phổ của ma trận

trình tìm kiếm hoành độ, tất cả thứ ta cần là các giá trị riêng ảo với phần ảo lớn nhất dựa theo kết quả của Bổ đề 3.

Nhận xét: Thuật toán 3.1.1 dừng khi mr = 0, nghĩa là trong Bước 2 ta không thu được danh sách các không điểm hoặc khi xr+1 ≤xr.

Định lý 3.1.1 [1]Phương pháp criss-cross sinh ra dãy lặp tăng {xr}, có giới hạn là hoành độ giả phổ α(A).

Chứng minh: Nhận thấy rằng xr+1 được sinh ra ở Bước 3 của Thuật toán 3.1.1 là không điểm của h(·, yr

j) với chỉ số j nào đó, và do đóxr+1 ≤α. Khi đó chứng minh bởi quy nạp, ta nhận được xr ≤α(A)với mọi r.

Tại mỗi bước lặp r, nếulr j =ur

j với mỗij thì đường thẳng đứng gồm các điểm với hoành độxr hoàn toàn không cắt giả phổ chặt, vì vậy theo Định lý 2.5.7 suy raxr =α(A)và có điều cần chứng minh. Mặt khác, nếu lr

j < ur

j, thìh(xr, yr

j)<0, và do đó xr+1 > xr. Vì vậy ta có thể giả sử rằng dãy {xr} tăng ngặt, và bị chặn trên bởi α(A).

Theo phương pháp phản chứng, giả sử rằng xr có giới hạn x∞ < α(A). Vì các số mr

bị chặn đều (bởi 2n), ta có thể chọn một dãy con S của tập các số tự nhiên N sao cho mr

bằng hằng số m với mọi chỉ sốr trong S, và sao cho với các điểm tới hạnl∞

j , u∞ j và y∞ j với (j = 1,2, ..., m) ta có ljr →l∞j , urj →uj∞ và yjr →yj∞ khi r → ∞ trong S. Với số thực µ∈[0,1], chúng ta có h(xr, µlr j + (1−µ)ur j)≤0,

vì vậy theo tính liên tục ta suy ra

h(x∞, µl∞j + (1−µ)u∞j )≤0.

Vậy

h(x∞, y)≤0 mỗi khi y ∈[l∞, u∞].

Nếu l∞ j < u∞ j với chỉ số j nào đó, thì l∞ j < y∞ j < u∞ j , do đó

lj∞< yjr < u∞j với mọi r đủ lớn trong S.

Với mỗi chỉ số r ta đều có h(x∞, yr

j) ≤ 0, do đó theo định nghĩa của quá trình tìm kiếm hoành độ ta phải có điều mâu thuẫn xr+1≥x∞.

Vì vậy ta có thể giả thiết rằng

l∞

j =u∞

j với mỗi j = 1,2, . . . , m. (3.1.1)

Nhưng từ α < x∞ < α, theo Định lý 2.5.7 kéo theo sự tồn tại số thực y∞ thỏa mãn

h(x∞, y∞)<0. Theo tính liên tục của hàmh(x, y), thì tồn tại δ >0sao cho

h(x, y)<0 mỗi khi |x−x∞| < δ và |y−y∞|< δ.

Nhưng khi đó với mọi r đủ lớn ta có

h(xr, y)<0 mỗi khi |y−y∞|< δ,

do đó phải tồn tại một chỉ số j sao cho lr j −ur

j ≥2δ, mâu thuẫn với (3.1.1).

Sau đây chúng tôi giới thiệu một số ý tưởng chính về phương pháp chia đôi, tính α- hoành độ giả phổ của ma trận A như sau:

Thành phần liên thông của giả phổ