Thuậttoán phân tích Jordan của một ma trận vuông tùy ý có trong matlab, maple,....nhưng lý thuyết phân tích Jordan phức tạp, khó hiểu, đòi hỏi trình độ nâng caovề đại số tuyến tính mới h
Kiến thức chuẩn bị
Không gian cột R(A) - Không gian nghiệm N(A)
Định nghĩa 1.1.1 [4, trang 170] Cho ma trận vuông A cấp n, không gian cột của ma trận A là không gian con của R n :
R(A) = {Ax|x ∈R n } ⇔ ∀y ∈ R(A) : ∃x ∈ R n sao cho Ax = y Định nghĩa 1.1.2 [4, trang 174] Cho ma trận A cấp n, N (A) là không gian nghiệm của hệ:
Tính chất 1.1.1 [4, trang 394] ∀k ∈N, ta có: i) N (A 0 ) ⊆ N (A 1 ) ⊆ N (A 2 ) ⊆ ⊆ N (A k ) ⊆ N (A k+1 ) ⊆ (1) ii) R(A 0 ) ⊇ R(A 1 ) ⊇ R(A 2 ) ⊇ ⊇ R(A k ) ⊇ R(A k+1 ) ⊇ (2) iii) Tồn tại dấu ” = ” ở (1) và (2) xảy ra cùng một lúc. iv) Nếu xảy ra dấu ” = ” ở một vị trí nào đó thì những vị trí còn lại sau đó phải là dấu ” = ”.
Chứng minh i) Chứng minh: N (A i ) ⊆ N(A i+1 ), ∀i ∈N. Ta có: ∀x ∈ N (A i ) : A i x = 0
⇒ R(A 0 ) ⊇ R(A 1 ) ⊇ R(A 2 ) ⊇ ⊇ R(A k ) ⊇ R(A k+1 ) ⊇ iii) Chứng minh: Tồn tại dấu ” = ” ở (1) và (2) xảy ra cùng một lúc.
∀k ∈N, giả sử N(A k ) = N (A k+1 ) Ta cần chứng minh: R(A k ) = R(A k+1 )
( dim N (A k ) + dim R(A k ) = n dim N (A k+1 ) + dim R(A k+1 ) = n mà N (A k ) = N (A k+1 ) ⇔ dim N(A k ) = dim N(A k+1 )
⇒ dim R(A k ) = dim R(A k+1 ). Vậy: Dấu ” = ” ở (1) và (2) xảy ra cùng một lúc. iv) Giả sử: N (A k ) = N (A k+1 ) Chứng minh: N (A k+p ) = N (A k+p+1 ), ∀p ∈N.
, ∀p ∈N. Đầu tiên, ta sẽ chứng minh: R A k A p
(2) Từ (1) và (2), ta suy ra: Nếu xảy ra dấu ” = ” ở một vị trí thì những vị trí còn lại sau đó phải là dấu ” = ”. Định lý 1.1.1 [4, trang 210] Cho ma trận A cỡ m × n và ma trận B cỡ n × p. Khi đó: rank(AB) = rank(B) − dim(N (A) ∩ R(B))
Chứng minh Giả sử: E = {e 1 , e 2 , , e m } là cơ sở của N (A) ∩ R(B ). Bổ sung vào E để được cơ sở của R(B) là:
Ta cần chứng minh: E 2 = {Av 1 , Av 2 , , Av k } là cơ sở của R(AB). i) Chứng minh: E 2 độc lập tuyến tính.
Giả sử: α 1 Av 1 + α 2 Av 2 + + α k Av k = 0
⇔ α 1 v 1 + α 2 v 2 + + α k v k − β 1 e 1 − β 2 e 2 − − β m e m = 0 (∗) do E 1 độc lập tuyến tính nên:
⇒ α 1 = α 2 = = α k = 0 Vậy E 2 độc lập tuyến tính. ii) Chứng minh: E 2 là tập sinh của R(AB).
∀y ∈ R(AB) : ∃x ∈R n sao cho ABx = y mà Bx ∈ R(B ) nên: Bx = m
⇒ E 2 là tập sinh của R(AB). Từ i) và ii) ta chứng minh được E 2 là cơ sở của R(AB). Định lý 1.1.2 [4, trang 394] Với mọi ma trận A cấp n không suy biến, tồn tại số tự nhiên k sao cho: R(A k ) ⊕ N (A k ) = R n (∗) Số k nhỏ nhất thoả (∗) gọi là chỉ số của ma trận A.
N (A k−1 ) ⊂ N (A k ) = N (A k+1 ) = (dấu ” = ” xảy ra ở vị trí k) i) Chứng minh: N (A k ) ∩ R(A k ) = {0}
Ta chứng minh phản chứng:
∃x ∈R n : A k x = y (2) Thế (2) vào (1), ta thu được:
A k A k x = 0 ⇔ A 2k x = 0 ⇒ x ∈ N (A 2k ) = N (A k ) ⇒ A k x = 0 (3) Từ (2) và (3) suy ra: y = 0 (vô lý).
∗ Tìm cơ sở của N (A) ∩ R(B): [4, trang 211]
Bước 1: Tìm cơ sở E 1 = {e 1 , e 2 , , e k } của R(B). Bước 2: Đặt X = (e 1 |e 2 | |e k ).
Bước 3: Tìm cơ sở E 2 = {v 1 , v 2 , , v q } của N (AX ).Bước 4: E 3 = {Xv 1 , Xv 2 , , Xv q } là cơ sở của N(A) ∩ R(B).
Chứng minh E 3 là cơ sở của N (A) ∩ R(B). 1) Chứng minh: E 3 ⊂ N (A) ∩ R(B)
⇒ (AX)v i = 0 ⇔ A(Xv i ) = 0 ⇒ Xv i ∈ N (A) ⇒ E 3 ⊂ N (A) (∗) Vì: Xv i là tổ hợp tuyến tính của E 1
⇒ Xv i ∈ R(B ) ⇒ E 3 ⊂ R(B) (∗∗) Từ (*) và (**) ⇒ E 3 ⊂ N (A) ∩ R(B) 2) Chứng minh: dim(N (A) ∩ R(B)) = q Do X là ma trận cấp n × k và r(X) = r(B) = k nên: dimN (X) = k − r(X) = 0 ⇒ N (X) = 0 Ta có: dim(N (AX)) = q và dim(N (AX)) = k − r(AX)
3) Chứng minh: E 3 độc lập tuyến tính.
Giả sử: α 1 Xv 1 + α 2 Xv 2 + + α q Xv q = 0
⇒ α 1 = α 2 = = α q = 0 (vì E 2 độc lập tuyến tính) Vậy E 3 độc lập tuyến tính.
Từ 1), 2) và 3), suy ra: E 3 là cơ sở của N (A) ∩ R(B).
a) Tìm cơ sở và số chiều của N (A).b) Tìm cơ sở và số chiều của R(A).
⇒ dimR(A) = r(A) = 2. Ta có thể tính: dimR(A) = 3 − dimN(A) = 3 − 1 = 2.
a) Tìm dim (N (A) ∩ R(B )).b) Tìm cơ sở của N (A) ∩ R(B ).
⇒ r(AB) = 2 Ta có: r(AB) = r(B) − dim (N (A) ∩ R(B))
⇒ dim (N (A) ∩ R(B)) = r(B) − r(AB) = 3 − 2 = 1. b) Bước 1: Tìm cơ sở của R(B)
Bước 3: Tìm cơ sở của N (AX)
⇒ Cơ sở của N (AX) là:
Bước 4: Tìm cơ sở của N (A) ∩ R(B)
Không gian con bất biến
Định nghĩa 1.1.3 [4, trang 259] Cho ánh xạ tuyến tính T : V → V và X là không gian con của V Không gian X được gọi là không gian con bất biến đối với T nếu T (X) ⊆ X.
Chứng minh X là không gian con bất biến qua phép biến đổi A.
⇒ Ax 2 ∈ X (2) Từ (1) và (2) ⇒ X là không gian con bất biến qua phép biến đổi A.
Cho A là ma trận suy biến cấp n Theo định lý 1.1.2, ∃k :R n = R(A k ) ⊕ N (A k ) thì N (A k ) và R(A k ) là những không gian con bất biến đối với phép biến đổi A.
Chứng minh i) Chứng minh: N (A k ) là không gian con bất biến đối với phép biến đổi A.
⇔ Chứng minh: ∀x ∈ N(A k ) thì Ax ∈ N (A k ). Ta có: ∀x ∈ N (A k ) : A k x = 0
⇒ Ax ∈ N (A k ) ⇒ điều phải chứng minh. ii) Chứng minh: R(A k ) là không gian con bất biến đối với phép biến đổi A.
⇔ Chứng minh: ∀y ∈ R(A k ) thì Ay ∈ R(A k ) Ta có: ∀y ∈ R(A k ) : ∃x ∈R n sao cho A k x = y
⇔ AA k x = Ay ⇔ A k+1 x = Ay ⇔ A k (Ax) = Ay
⇒ Ay ∈ R(A k ) ⇒ điều phải chứng minh.
Từ i) và ii), suy ra: N(A k )và R(A k ) là những không gian con bất biến đối với phép biến đổi A. Định lý 1.1.3 [4, trang 262]
Cho ánh xạ tuyến tính T : V → V, dim V = n Các không gian con X, Y, , Z với các chiều r 1 , r 2 , , r k và các cơ sở tương ứng: B X , B Y , , B Z Giả sử P i r i = n và B = B X ∪ B y ∪ ∪ B Z là cơ sở của V. i) Không gian con X là bất biến khi và chỉ khi ma trận của T trong cơ sở B có dạng: [T ] B = A r 1 ×r 1 B
! ii) Các không gian con X, Y, , Z là bất biến khi và chỉ khi ma trận của T trong cơ sở B có dạng: [T ] B =
Định lý 1.1.4 [4, trang 263] Cho ma trận vuông T cấp n: i) Q là ma trận không suy biến thoả
! khi và chỉ khi khi r cột đầu của Q sinh ra không gian con bất biến đối với T. ii) Q là ma trận không suy biến thoả
khi và chỉ khi Q = (Q 1 |Q 2 | |Q k ) với Q i là n × r i và các cột của mỗi Q i sinh ra không gian con bất biến đối với T.
với X = span {q 1 , q 2 } là không gian con bất biến đối với phép biến đổi T.
với X = span {q 1 , q 2 }, Y = span {q 3 } , Z = span {q 4 } là không gian con bất biến đối với phép biến đổi T Ta có:
Ma trận lũy linh
Định nghĩa 1.1.4 [4, trang 396] Ma trận vuông N cấp n gọi là ma trận luỹ linh (nilpotent), nếu tồn tại số tự nhiên k sao cho N k = 0.
Số k nhỏ nhất thỏaN k = 0 gọi là chỉ số của ma trận lũy linhN hayindex(N ) = k.
Ví dụ 1.1.6 Xét ma trận N =
Vậy N là ma trận lũy linh và index(N ) = 3 do N 3 = 0 mà N 2 6= 0.
Phân tích Core - Nilpotent
Cho A là ma trận suy biến cấp n, có chỉ số k và r(A k ) = r thì tồn tại ma trận không suy biến Q thoả:
! trong đó C là ma trận khả nghịch và N là ma trận luỹ linh.
Chứng minh Cho Q = (X|Y ) với X, Y lần lượt là cơ sở của R(A k ) và N (A k ) Do R(A k ) và N (A k ) là không gian con bất biến, theo Định lý 1.1.4 ta có:
! (∗) i) Chứng minh: N là ma trận lũy linh. Đặt: Q −1 =
( VA k X = 0 N k = 0 ⇒ N là ma trận lũy linh và index(N ) = k. ii) Chứng minh: C là ma trận khả nghịch cấp r.
= r.Vậy: C k là ma trận không suy biến cấp r.
⇒ C r×r là ma trận khả nghịch.
= r Vô lý vì index(A) = k với k là số tự nhiên nhỏ nhất thỏa r(A k ) = r.
Ví dụ 1.1.7 Tìm phân tích Core - Nilpotent của ma trận:
Giải Bước 1: Tìm chỉ số của ma trận A.
Vậy: index(A) = 2. Bước 2: Tìm cơ sở của R(A 2 ) và N (A 2 ) i) Tìm cơ sở của R(A 2 ):
ii) Tìm cơ sở của N (A 2 ):
⇒ N là ma trận lũy linh, index(N ) = 2.
Cấu Trúc Jordan
Đặt vấn đề
Toán học nói chung hay ma trận nói riêng được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau từ sinh học, hóa học, vật lý đến kinh tế, môi trường, Có những ma trận được tạo ra rất phức tạp nên khi giải bài toán cũng gặp nhiều khó khăn Vì vậy, nhiều nhà toán học đã tìm ra cách để tam giác hóa ma trận đó nhằm đưa ma trận đã cho về ma trận mới đơn giản hơn Cách phổ biến nhất mà chúng ta biết là chéo hóa ma trận tuy nhiên không phải ma trận nào cũng có thể chéo hóa được Khi đó, chúng ta cần tam giác hóa Phần này tác giả viết dựa vào chương 7 sách Matrix analysis and applied linear algebra của CarlMeyer (1983).
Cách giải quyết vấn đề
Theo định lý Schur, ta có: mọi ma trận A n×n luôn tồn tại ma trận U và T sao cho: U ∗ AU = T với T là ma trận tam giác trên nhưng ta chỉ biết rằng đường chéo của T chính là các trị riêng của ma trận A, còn các phần tử còn lại thì chưa biết.
Thay vì tìmT theo cách này, ta tìm một ma trậnP khả nghịch sao choP −1 AP có dạng đơn giản và dễ đoán T hơn.
Theo phân tích Core - Nilpotent nếu ma trận A có index k và hạng r thì sẽ có ma trận khả nghịch Q sao cho:
! với C là ma trận khả nghịch và L là ma trận lũy linh index k Khi đó việc tam giác hóa ma trận sẽ được thực hiện xung quanh L và C Ta sẽ xem xét phương pháp tam giác hóa ma trận lũy linh L trước.
Phân tích Jordan cho ma trận lũy linh
Cho L là ma trận lũy linh cấp n và index(L) = k, ∀k ∈ N Ma trận L chỉ có một trị riêng duy nhất λ = 0 Giả sử L 6= 0, khi đó L không thể chéo hoá được.
L là ma trận lũy linh và index(L) = k nên L k = 0 và L k−1 6= 0. Với mọi vector riêng x 6= 0 ứng với trị riêng λ của L, ta có:
Lx = λx ⇒ L k x = λ k x ⇔ 0 = λ k x ⇒ λ = 0 vậy ma trận L chỉ có 1 trị riêng duy nhất là λ = 0
Giả sử L chéo hóa được thì ta có: P −1 LP = D Ma trận chéo D sinh ra có đường chéo là trị riêng của L (λ = 0) và do đó D = 0 ⇒ L = 0 Vậy L 6= 0, khi đó L không thể chéo hoá được.
Tuy nhiên, theo định lý Schur thì L tam giác hóa được.
Nếu P −1 LP = T là ma trận tam giác trên thì đường chéo của ma trận T phải là trị riêng của ma trận L Ma trận T có dạng:
Một cách để đơn giản dạng của ma trận T là chỉ có dòng ngay phía trên đường chéo được phép khác 0, vì vậy chúng ta phải cố gắng xây dựng ma trận khả nghịch P sao cho T có dạng:
Trước khi tìm hiểu kỹ thuật phân tích Jordan cho ma trận lũy linh bất kỳ, chúng ta xét ví dụ về một ma trận lũy linh tùy ý khác 0 với cấp nhỏ để xem cách tìm ma trận khả nghịch P như thế nào.
Cho L là ma trận lũy linh cấp 3 thỏa L 3 = 0, L 2 6= 0 Giả sử:
⇒ LP ∗1 = 0; LP ∗2 = P ∗1 ; LP ∗3 = P ∗2 vì L 3 = 0, ta đặt P ∗1 = L 2 x với mọi véctơ x thỏa L 2 x 6= 0. Khi đó có thể chọn P ∗2 = Lx và P ∗3 = x.
⇒ Ma trận cần tìm là:
Chứng minh P ∗1 , P ∗2 , P ∗3 độc lập tuyến tính:
Giả sử có α 1 , α 2 , α 3 sao cho: α 1 P ∗1 + α 2 P ∗2 + α 3 P ∗3 = 0 (∗)
⇒ α 2 P ∗1 = 0 ⇒ α 2 = 0 (2) Vậy phần còn lại là: α 1 P ∗1 = 0 ⇒ α 1 = 0 (3) Từ (1), (2) và (3) ⇒ α 1 = α 2 = α 3 = 0 ⇒ P ∗1 , P ∗2 , P ∗3 độc lập tuyến tính.
Nhận xét Từ ví dụ này, chúng ta thấy để có được ma trận T như trên thì ma trận khả nghịch P cần tìm có dạng:
Vậy để tìm ma trận khả nghịch P cấp3 × 3sao cho ma trận T =
chúng ta cần làm các bước sau:
- Tìm cơ sở b củaR(L 2 ) ∩ N (L). - Tìm véctơ x bất kỳ khác 0 thỏa hệ phương trình: L 2 x = b. - Tính Lx.
Từ một véctơ cơ sở b của R(L 2 ) ∩ N (L), chúng ta có thêm hai véctơ mới: Lx và x được gọi là cơ sở mở rộng của cơ sở R(L 2 ) ∩ N (L) và bộ ba véctơ trên độc lập tuyến tính nên ma trận khả nghịch P cấp3 × 3 có dạng:
Tương tự như trường hợp L cấp 3, giả sử L là ma trận lũy linh cấp n và chỉ số k Để tìm ma trận P chúng ta sẽ làm như sau:
Bước 1: Chọn một cơ sở phù hợp B của N(L) bằng cách: Đặt M i = R(L i ) ∩ N (L) ; i = 0, 1, , k. Ta có: 0 = M k ⊆ M k−1 ⊆ ⊆ M 1 ⊆ M 0 = N (L). do 0 = R(L k ) ⊆ R(L k−1 ) ⊆ ⊆ R(L 1 ) ⊆ R(L 0 ) = I (tính chất 1.1.1 phần ii)).
Xây dựng một cơ sở cho N (L) = M 0 từ tập nhỏ nhất là: M k nhưng M k = 0 nên chúng ta sẽ bắt đầu với S k−1 là cơ sở tùy ý của M k−1
Mở rộng S k−1 bởi S k−2 , S k−3 , , S 0 sao cho:
S k−1 ∪ S k−2 là cơ sở của M k−2 S k−1 ∪ S k−2 ∪ S k−3 là cơ sở của M k−3 Đến khi được: B = S k−1 ∪ S k−2 ∪ ∪ S 0 là cơ sở của M 0 = N (L).
Hình 1.1: Cơ sở của các khối trong ma trận lũy linh có chỉ số k
Bước 2: Mở rộng cở sở B của N (L) thành cơ sở của C n : Ta mở rộng cơ sở B = S k−1 ∪ S k−2 ∪ ∪ S 0 = {b 1 , b 2 , , b t } củaN (L) thành cơ sở của C n bằng cách xây dựng xích Jordan từ mỗi véctơ b ∈ B:
Với mỗi b ∈ B, nếu b ∈ S i thì b ∈ M i vậy nên b ∈ R(L i ). Tìm véctơ x sao cho L i x = b.
L i x, L i−1 x, , Lx, x Tập hợp các véctơ trong tất cả các xích Jordan là cơ sở của C n
Hình 1.2: Các xích Jordan của ma trận lũy linh có chỉ số k
Hình 1.3: Các xích Jordan của ma trận lũy linh có chỉ số k
Chứng minh a) Chứng minh tổng số véctơ trong các xích Jordan đúng bằng n: Nhắc lại công thức: r(AB) = r(B) − dim(N (A) ∩ R(B))
⇒ d i = r i − r i+1 với d i = dimM i = dim(R(L i ) ∩ N (L)) và r i = r(L i ). Gọi v i là số lượng véctơ trong S i , ta có: v i = r(S i ) = dim M i − dim M i+1
= r i − 2r i+1 + r i+2 Mỗi véctơ trong b ∈ S i có xích JordanL i x, L i−1 x, , Lx, x chứai + 1 véctơ, với x là nghiệm khác không tùy ý của hệ L i x = b.
Số véctơ trong tất cả các xích Jordan là: k−1
= r(L 0 ) = r(I) = n. do d k = r k − r k+1 mà r k = r k+1 = 0 nên d k = 0. Vậy tổng số tất cả các véctơ sinh ra đúng bằng n. b) Bây giờ ta chứng minh các dãy này độc lập tuyến tính: Đặt số véctơ trong các cơ sở S k−1 , S k−2 , , S 1 , S 0 lần lượt là: q, p, , j, i. Giả sử: h α (k−1) 1 x (k−1) 1 + α (k−1) 2 x (k−1) 2 + + α (k−1) q x (k−1) q i
⇒ α (k−1) 1 = α (k−1) 2 = = α q (k−1) = 0 (do S k−1 là cơ sở của M k−1 ) L (k−2) (∗) = 0
(do S k−1 ∪ S k−2 là cơ sở của M k−2 )
Tiếp tục quá trình trên cho đến:
= α (1) 2 = = α (1) j = 0 (do S k−1 ∪ S k−2 ∪ ∪ S 1 là cơ sở của M 1 ) Khi đó:
= α (0) 1 = α (0) 2 = = α (0) i = 0 (do S k−1 ∪ S k−2 ∪ ∪ S 1 ∪ S 0 là cơ sở của M 0 ) Vậy: Các véctơ trong các xích Jordan độc lập tuyến tính. Định lý 1.2.1 [4, trang 579] (Dạng Jordan của ma trận lũy linh) Mọi ma trận chỉ số k đều đồng dạng với ma trận N sau đây:
, ∀j = 1, 2, , t ii) Số khối của ma trận: t = dim(N (L)). iii) Cấp của khối lớn nhất trong N là k. iv) Số lượng khối cấp i là: w i = r i−1 − 2r i + r i+1 , r i = rank(L i ). v) Nếu B = S k−1 ∪ S k−2 ∪ ∪ S 0 = {b 1 , , b t } là cơ sở của N (L), thì tập tất cả các véctơ J = J b 1 ∪ J b 2 ∪ ∪ J b t từ tất cả các xích Jordan là cơ sở của C n và tạo thành các cột của ma trận P.
Chứng minh iv) Chứng minh: w i = r i−1 − 2r i + r i+1 , r i = rank(L i ) Khối Jordan cấp i được tạo ra từ S i−1 nên w i = v i−1 = d i−1 − d i = r i−1 − 2r i + r i+1 , r i = rank(L i ) ii) Chứng minh: t = dim(N (L)) t = k
= dim(N(L)). Định lý 1.2.2 [4, trang 580] (Tính duy nhất của dạng Jordan của ma trận lũy linh)
Cấu trúc của dạng Jordan cho ma trận lũy linh L có chỉ số k được xác định duy nhất theo nghĩa nếu L đồng dạng với ma trận khối B = diag(B 1 , B 2 , , B t ) trong đó mỗi B i có dạng:
, ε i 6= 0 thì t = dim(N(L)) và số lượng khối Jordan cấp i được tính bởi: w i = r i−1 − 2r i + r i+1 , r i = rank(L i )
Ví dụ 1.2.2 Phân tích ma trận L thành dạng Jordan.
⇒ L là ma trận lũy linh, index(L) = k = 4.
Bước 1: Tính số khối Jordan bằng công thức:
Khối cấp i: w i = r i−1 − 2r i + r i+1 ; i = 1, 2, , k. Khối cấp 4: w 4 = r 3 − 2r 4 + r 5 = 1 − 2 × 0 + 0 = 1. Khối cấp 3: w 3 = r 2 − 2r 3 + r 4 = 2 − 2 × 1 + 0 = 0. Khối cấp 2: w 2 = r 1 − 2r 2 + r 3 = 3 − 2 × 2 + 1 = 0. Khối cấp 1: w 1 = r 0 − 2r 1 + r 2 = 4 − 2 × 3 + 2 = 0.
⇒ Chỉ có duy nhất một khối Jordan 4 × 4. Bước 2: Tìm cơ sở của N (L).
Bắt đầu từ cơ sở củaR(L 3 ), do r(L 3 ) = 1nên chọn bất kỳ một cột của L 3 làm cơ sở cho M 3 = R(L 3 ) ∩ N (L) là: b = (2, 2, 0, 2). r(L) = 3 ⇒ dim N (L) = n − r(L) = 4 − 3 = 1 Do đó, cơ sở của N (L) chỉ có 1 véctơ đó là: b = (2, 2, 0, 2).
Bước 3: Mở rộng cơ sở N (L) bằng cách dùng Jordan Chain.
Do b ∈ M 3 ⇒ b ∈ R(L 3 ), chọn một véctơ tuỳ ý khác 0 là nghiệm của hệ L 3 x = b:
Ta có phân tích Jordan:
Ví dụ 1.2.3 Phân tích ma trận L thành dạng Jordan.
⇒ L là ma trận lũy linh, index(L) = k = 3. Bước 1: Tính số khối Jordan bằng công thức:
Khối cấp i: w i = r i−1 − 2r i + r i+1 ; i = 1, 2, , k. Khối cấp 3: w 3 = r 2 − 2r 3 + r 4 = 1 − 2 × 0 + 0 = 1. Khối cấp 2: w 2 = r 1 − 2r 2 + r 3 = 3 − 2 × 1 + 0 = 1. Khối cấp 1: w 1 = r 0 − 2r 1 + r 2 = 6 − 2 × 3 + 1 = 1.
⇒ Có 1 khối Jordan 3 × 3, 1 khối Jordan 2 × 2 và 1 khối Jordan 1 × 1.
•Bước 2: Tìm cơ sở của N (L). Bắt đầu từ cơ sở R(L 2 ), do r(L 2 ) = 1 nên chọn bất kỳ một cột của L 2 làm cơ sở cho M 2 = R(L 2 ) ∩ N (L) là: b 1 = (1, 1, −1, 1, −2, 1).
Thêm véctơ vào b 1 để được cơ sở củaM 1 = R(L 1 ) ∩ N (L). Tìm cơ sở R(L) ∩ N (L): a) Tìm cơ sở R(L):
b) Tìm cơ sở N (LX): Giải hệ phương trình: (LX)y = 0
⇒ Cơ sở của N (LX) là:
Họ độc lập tuyến tính cực đại của họ {b 1 , Xv 1 , Xv 2 }: b 1 = (1, 1, −1, 1, −2, 1); b 2 = (1, 2, 0, 2, −2, 1) là cơ sở của M 1 = R(L 1 ) ∩ N (L). Thêm véctơ vào b 1 ; b 2 để được cơ sở của M 0 = R(L 0 ) ∩ N (L).
Tìm cơ sở R(L 0 ) ∩ N (L):Gọi X là ma trận được tạo ra từ cơ sở của R(L 0 ), trong trường hợp này thìX = I ⇒ LX = L.
Giải hệ phương trình: (LX)z = 0 ⇔ Lz = 0
⇒ Cơ sở của N (LX) là:
Họ độc lập tuyến tính cực đại của họ {b 1 , b 2 , Xz 1 , Xz 2 , Xz 3 }:b 1 = (1, 1, −1, 1, −2, 1); b 2 = (1, 2, 0, 2, −2, 1); b 3 = (1, 0, −2, 0, −3, 0) là cơ sở của M 0 = R(L 0 ) ∩ N (L) cũng chính là cơ sở của N (L).
Bước 3: Mở rộng cơ sở của N (L) với
Với mỗi véctơ b 1 ∈ S 2 , chọn một véctơ khác 0 tùy ý của hệ L 2 x 1 = b 1
Với mỗi véctơ b 2 ∈ S 1 , chọn một véctơ khác 0 tùy ý của hệ Lx 2 = b 2
Với mỗi véctơ b 3 ∈ S 0, ta có:
Ta có phân tích Jordan: N = P −1 LP =
Phân tích Jordan cho ma trận tùy ý
Cho ma trận A ∈ C n×n và chỉ số k Ở đây, chúng ta xét trường hợp ma trận A không chéo hóa được có nghĩa là tổng số véctơ riêng độc lập tuyến tính sẽ ít hơn n Để tam giác hóa ma trận A trong trường hợp này chúng ta cần phải tìm véctơ riêng mở rộng của ma trận A để cho ma trận A có đúng n véctơ độc lập tuyến tính.
Các bước để phân tích Jordan cho ma trận vuông tùy ý:
Bước 1: Tìm trị riêng của ma trận A Giải phương trình: det(A − λI ) = 0 ta thu được tập trị riêng của A σ(A) = {λ 1 , λ 2 , , λ s }
Chỉ số của một trị riêng λ của ma trận A được định nghĩa là chỉ số của ma trận (A − λI) hay index(λ) = index(A − λI ) = k.
Bước 2: Tìm và mở rộng véctơ riêng của ma trận AVới λ 1 : Ở phần trước, chúng ta đã biết ma trận lũy linh khi phân tích Jordan thì cơ sở được mở rộng Vì vậy, chúng ta cần tìm ma trận đồng dạng với ma trận (A − λ 1 I) có chứa ma trận lũy linh.
Giả sử chỉ số của λ 1 làk 1 , khi đó tồn tại ma trận khả nghịch X 1 sao cho theo phân tích Core - Nilpotent, ta có:
(1.1) trong đó: L 1 là ma trận lũy linh cấp k 1 và C 1 là ma trận khả nghịch.
Theo phần trước, ma trận lũy linh L 1 có phân tích Jordan là:
(1.2) với mỗi khối N i (λ 1 ), i = 1, 2, , t 1 có dạng:
Từ (1.2) ta có: N (λ 1 ) là ma trận đồng dạng với ma trận L 1 Thế N (λ 1 ) vào (1.1), ta thu được ma trận đồng dạng của ma trận (A − λ 1 I):
! khi đó ma trận X 1 được thay bởi ma trận Q 1 với Q 1 = X 1 Y 1 0
! là ma trận khả nghịch ⇒ Q −1 1 = Y 1 −1 0
và A 1 = C 1 + λ 1 I Tập hợp các trị riêng của ma trận A là: σ(A) = {λ 1 , λ 2 , , λ s }
⇒ Tập hợp các trị riêng của ma trận (A − λ 1 I) là: σ(A − λ 1 I) = {0, (λ 2 − λ 1 ), (λ 3 − λ 1 ), , (λ s − λ 1 )}
Do L 1 là ma trận lũy linh có trị riêng duy nhất bằng 0 nên: σ(C 1 ) = {(λ 2 − λ 1 ), (λ 3 − λ 1 ), , (λ s − λ 1 )}
Với λ 2: Lặp lại quá trình trên cho ma trận A 1 − λ 2 I, ta thu được:
Từ (1.3) và (1.4), nếu ta đặt P 2 = Q 1
! thì P 2 là ma trận khả nghịch và P 2 −1 = I 0
Tiếp tục quá trình trên cho tới khi mọi trị riêng đều được sử dụng, khi đó ta thu được phân tích Jordan cho ma trận A là:
P là ma trận khả nghịch.
J là ma trận Jordan chứa các khối Jordan J (λ j ) ứng với mỗi trị riêng λ j ∈ σ(A); j = 1, 2, , s Mỗi ma trận J (λ j ) có dạng:
Cấp của khối lớn nhất trong J (λ j ) là k j với: k j = index(λ j ) = index(A − λ j I) t j = dim(N (A − λ j I)). Số lượng khối có cở i × i là: v i (λ j ) = r i−1 (λ j ) − 2r i (λ j ) + r i+1 (λ j ) với r i (λ j ) = rank((A − λ j I) i )
Ví dụ 1.2.4 Phân tích Jordan cho ma trận
Giải Bước 1: Tìm trị riêng của ma trận A:
⇒ L là ma trận lũy linh, index(L) = k = 2. Bước 3: Phân tích Jordan ma trận L. a) Tính số khối Jordan:
⇒ Có 1 khối Jordan 2 × 2 và 1 khối Jordan 1 × 1. b) Tìm cơ sở N (L):
Bắt đầu từ cơ sở của R(L), do r(L) = 1 nên chọn bất kỳ 1 cột của ma trận L làm cơ sở cho M 1 = R(L 1 ) ∩ N (L) là: b 1 = (1, −2, −2).
Thêm véctơ vào b để được cơ sở M 0 = R(L 0 ) ∩ N (L).
∗ Tìm cơ sở R(L 0 ) ∩ N (L): Gọi X là ma trận được tạo ra từ các cơ sở của R(L 0 ), trong trường hợp này thì ma trận X = I ⇒ LX = L.
Giải hệ phương trình: (LX)z = 0 ⇔ Lz = 0
⇒ Cơ sở của N (LX) là:
Họ độc lập tuyến tính cực đại của họ {b 1 , Xv 1 , Xv 2 }: b 1 = (1, −2, −2) ; b 2 = (0, 1, 0) là cơ sở của M 0 cũng chính là cơ sở của N (L).
⇒ S 1 = {b 1 } ; S 0 = {b 1 , b 2 }. c) Mở rộng cơ sở của N (L): Với véctơ b 1 ∈ S 1 , chọn một véctơ khác 0 tùy ý của hệ Lx = b.
⇒ Chuỗi Jordan: J 1 = {(1, −2, −2) , (0, 0, 1)}. Với véctơ b 2 ∈ S 0, ta có: J 2 = {b 2 } = {(0, 1, 0)}
Đây cũng chính là phân tích Jordan ma trận A.
Ví dụ 1.2.5 Phân tích Jordan của ma trận A:
Giải Bước 1: Tìm trị riêng của ma trận A.
⇒ index(B) = 2. b) Phân tích Core - Nilpotent ma trận B:
Tìm cơ sở của N (B 2 ): Giải hệ phương trình: B 2 x = 0
! là ma trận lũy linh.
! là ma trận khả nghịch. c) Phân tích Jordan ma trận L 1:
⇒ index(L 1 ) = k = 2. Tính số khối Jordan:
⇒ Chỉ có duy nhất một khối Jordan 2 × 2. Tìm cơ sở của N (L 1 ):
Bắt đầu từ cơ sở của R(L 1 1 ), do r(L 1 1 ) = 1 nên chọn một véctơ bất kỳ của L 1 làm cơ sở cho M 1 = R(L 1 1 ) ∩ N (L 1 ) là: b = (7, 1). Đây cũng chính là cơ sở của N (L 1 ), S 1 = {b}. Mở rộng cơ sở của N (L 1 ):
Với véctơ b ∈ S 1 , chọn một véctơ khác 0 tùy ý của hệL 1 1 x = b
Ta có phân tích Jordan:
⇒ index(C) = 1. b) Phân tích Core - Nilpotent ma trận C:
Tìm cơ sở N (C): Giải hệ phương trình: Cx = 0
Ta thu được phân tích Jordan ma trận A là:
Tính A n
Cho ma trận A ∈ C n×n và tập trị riêng σ(A) = {λ 1 , λ 2 , , λ s } Khi đó phân tích Jordan của ma trận A có dạng:
trong đó: J là ma trận Jordan chứa các khối Jordan J (λ j ) ứng với mỗi trị riêng λ j ∈ σ(A); j = 1, 2, , s Mỗi ma trận J (λ j ) có dạng:
Giả sử J(λ) = N (λ) + λI là khối Jordan cấp k × k Ta có:
J n (λ) = (N (λ) + λI) n (1.5) Áp dụng công thức Newton: (a + b) n = n
= C n 0 [N (λ)] 0 (λI ) n +C n 1 [N (λ)] (λI ) n−1 + +C n k−1 [N (λ)] k−1 (λI ) n−k+1 +C n k [N (λ)] k (λI ) n−k + do N (λ) là ma trận lũy linh có chỉ số k nên từ [N (λ)] k trở đi thì các giá trị đều bằng 0 nên:
Chứng minh Chúng ta sẽ chứng minh (1.6) bằng phương pháp qui nạp như sau:
P −1 trong đó: J là ma trận Jordan chứa các khối Jordan J (λ j ) ứng với mỗi trị riêng λ j ∈ σ(A); j = 1, 2, , s Mỗi ma trận J n (λ j ) có dạng:
với k i là cấp của khối Jordan J m (λ i ) Ta có:
Ví dụ 1.2.6 Tính A 2015 của ma trận
GiảiMa trận A không chéo hóa được và theo ví dụ 1.2.5 ta đã tìm được phân tích
Jordan của ma trận A là:
Khối Jordan J (λ 1 ) là khối cấp 2 Vậy k 1 = 2 :
Khối Jordan J (λ 2 ) là khối cấp 1 Vậy k 2 = 1 :
J n (λ 2 ) = (λ n 2 ) ⇒ J 2015 (λ 2 ) = (−3) 2015 (2) Khối Jordan J (λ 3 ) là khối cấp 1 Vậy k 3 = 1 :
J n (λ 3 ) = (λ n 3 ) ⇒ J 2015 (λ 3 ) = 1 2015 = 1 (3) Từ (1), (2) và (3), ta suy ra:
Phân tích Jordan trong lý thuyết đồ thị
Trong chương này, chúng ta sẽ tìm hiểu về ứng dụng của phân tích Jordan cho ma trận kề từ một hàm f :N → N bất kỳ được cho trước Trước tiên, chúng ta sẽ phân tích Jordan cho ma trận kề không có trọng số từ đồ thị có hướng dựa vào bài báo The Jordan canonical form for a class of zero - one matrices của Cardon và Tuckfield năm 2011 Tiếp theo, ta sẽ phân tích Jordan cho ma trận kề có trọng số theo đồ thị trọng số có hướng dựa vào bài báo The Jordan canonical form for a class of weighted directed graphs của Nina, Soto và Cardoso năm 2013 Để hiểu rõ hơn về các bước phân tích, chúng ta sẽ tìm hiểu về các tính chất cơ bản của đồ thị liên kết với ma trận kề như sau:
Đồ thị Γ n liên kết với A n
Định nghĩa 2.1.1 (Định nghĩa đồ thị) Cho f :N → N là hàm bất kỳ.
1) Với mọi n ∈N, đặt: A n = (a ij ) là ma trận vuông cấp n được định nghĩa: a ij = ( 1 nếu i = f(j) với i, j ∈ {1, , n} ,
0, trường hợp ngược lại. khi đó, ma trận A được gọi là ma trận kề cho đồ thị có hướng Γ n với những đỉnh được gán vào 1, , n có cạnh hướng từ đỉnh j đến đỉnh i khi và chỉ khi i = f (j).
2) Với mọi n ∈N, đặt: A n = (a ij ) là ma trận vuông cấp n được định nghĩa: a ij = ( p j nếu i = f (j) với i, j ∈ {1, , n} ,
0, trường hợp ngược lại. khi đó, ma trận A được gọi là ma trận kề có trọng số cho đồ thị trọng số có hướng Γ n với những đỉnh được gán vào 1, , n có trọng số p j ∈ C \ {0} và cạnh hướng từ đỉnh j đến đỉnh i khi và chỉ khi i = f (j). Định nghĩa 2.1.2 (Định nghĩa xích và chu trình) Một xích trong Γ n là một danh sách có thứ tự của các đỉnh rời nhau C = {c 1 , c 2 , , c r } sao cho f(c j ) = c j+1 nhưng f (c r ) 6= c 1 với 1 ≤ j < r.
Một chu trình trong Γ n là một danh sách có thứ tự của các đỉnh rời nhau Z = {z 1 , z 2 , , z r } sao cho f(z j ) = z j+1 và f (z r ) = z 1 với 1 ≤ j < r.
Trong cả hai trường hợp trên, r là độ dài của xích hoặc của chu trình và được viết r = lenC hay r = lenZ.
Chú ý: Theo định nghĩa trên, một đỉnh đơn {i} có thể là một xích hoặc là một chu trình, tuy nhiên vì f (i) 6= i hoặc f (i) = i nên nó không thể vừa là một xích vừa là một chu trình Mặc dù một đồ thị có hướng bất kỳ có thể chứa hai chu trình không bằng nhau có một đỉnh chung nhưng điều này là không thể với Γ n Bởi vì Γ n do một hàm f : N → N tạo ra nên nếu Z 1 và Z 2 là hai chu trình có một đỉnh chung thì Z 1 = Z 2 Do đó, các chu trình không bằng nhau trong Γ n phải rời nhau. Định nghĩa 2.1.3 (Định nghĩa điểm cuối và điểm sát nhập (merge)) Nếu C = {c 1 , , c s } là một xích của Γ n thì c s được gọi là điểm cuối của xích.
Một đỉnh k củaΓ n sao cho f(k) > n là một điểm cuối của Γ n Nếu k là một đỉnh của Γ n sao cho f (i) = f (j) = k với i, j sao cho i 6= j thì k được gọi là điểm sát nhập của Γ n Định nghĩa 2.1.4 (Định nghĩa phân hoạch) Phân hoạch của Γ n là một tập các chu trình và các xích rời nhau mà hợp của nó là Γ n Một phân hoạch chính của Γ n là một phân hoạch dạng:
P = {Z 1 , , Z r , C 1 , , C s } với Z 1 , , Z r là các chu trình và C 1 , , C s là các xích thỏa các tính chất sau:
1) Mỗi chu trình của Γ n bằng Z i nào đó.
2) Nếu Γ (i) n là đồ thị con của Γ n được lấy bằng cách bỏ tất cả các đỉnh trong các chu trình Z 1 , , Z r và trong các xích C 1 , , C i , khi đó C i+1 là xích có độ dài lớn nhất trong Γ (i) n
Ví dụ 2.1.1 Giả sử f :N → N cho các giá trị sau:
Ta được đồ thị Γ 10: và ma trận kề A 10:
Ta có: 4 và 5 là các điểm sát nhập và 9 là điểm cuối của Γ 10 Hai phân hoạch chính của Γ 10 là:
Ví dụ 2.1.2 Giả sử f :N → N cho các giá trị sau:
Ta được đồ thị Γ 7 : và ma trận kề A 7:
Ta có: 4 là điểm sát nhập và 5 là điểm cuối của Γ 7 Một phân hoạch chính của Γ 7 là:
C 1 = {1, 2, 3, 4, 5} ; C 2 = {6, 7} một phân hoạch không chính của Γ 7 là:
Trong phân hoạch chính, ta thấy rằng xích chứa điểm sát nhập 4 dài hơn xích còn lại.
Bổ đề 2.1.1 Cho C = {c 1 , , c m } là xích bất kỳ trong phân hoạch chính của Γ n Khi đó, một trong những điều dưới đây xảy ra:
1) Điểm cuối c m của xích là điểm cuối của đồ thị Γ n 2) Điểm f (c m ) là điểm sát nhập của Γ n
Hơn nữa, nếu f (c m ) là một điểm sát nhập và f (c m ) nằm trong xích khác C 0 = c 0 1 , , c 0 m 0 , khi đó f (c m ) = f(c 0 k ) với k ≥ m Do đó, nếu f (c m ) là một điểm sát nhập nằm trong một xích hoặc nằm trong một chu trình khác thì có một đỉnh z duy nhất trong chu trình hoặc xích chứa f (c r ) sao cho f m (z) = f m (c 1 ) = f (c m ) với f m là hợp m lần của hàm f.
Giả sử điểm cuối c m của xích không phải điểm cuối của đồ thị Γ n: Nếu f (c m ) nằm trong một trong các chu trình củaΓ n , khi đó f(c m )là điểm sát nhập vì f(c m ) có cả c m và một điểm khác của chu trình là những tiền ảnh.
Nếu f(c m ) nằm trong xích C 0 khác thì f(c m ) hoặc là điểm đầu của xích C 0 hoặc là không Nếuf (c m ) không phải là điểm đầu của xích C 0 , khi đó c m và một điểm của C 0 là những tiền ảnh của f (c m ) làm cho f (c m ) thành điểm sát nhập.
Nếu f (c m ) là điểm đầu của xích C 0 , khi đó phân hoạch là không chính vì C và C 0 có thể nối lại thành một xích mới dài hơn, mâu thuẫn giả thiết. Điều trên chứng tỏ hoặc c m là điểm cuối của đồ thịΓ n hoặc f(c m )là điểm sát nhập của Γ n.
Bây giờ, ta giả sử f (c m ) nằm trong xích khác C 0 = c 0 1 , , c 0 m 0 Khi đó, f(c m ) = f(c 0 k ) với một k nào đó sao cho k < m 0 Nếu k < m thì các đỉnh của hai xích C và C 0 có thể bị phân hoạch lại thành các xích mới
Do k < m 0 : lenC 00 = m 0 − k + m > m = lenC và k < m: lenC 00 = m 0 − k + m > m 0 = lenC 0
CặpC vàC 0 ban đầu đã vi phạm điều kiện tối đa của phân hoạch chính trong định nghĩa 2.1.4 Do đó, k ≥ m.
Cấu trúc Jordan của A n
Phân tích Jordan cho ma trận kề
Định nghĩa 2.2.4 (Ma trận kề) Cho f :N → N là hàm bất kỳ Với mỗi n ∈N, chúng ta định nghĩa ma trận A n = (a ij ) như sau: a ij = ( 1 nếu i = f (j ) với i, j ∈ {1, , n} ,
0 trong trường hợp còn lại.
Khi đó, A n là ma trận kề cho đồ thị có hướng Γ n với những đỉnh được gán vào 1, , n có cạnh hướng từ đỉnh j đến đỉnh i khi và chỉ khi i = f(j).
Mọi trị riêng của ma trận kề A n hoặc bằng 0 hoặc bằng căn của 1.
Chứng minh Véctơ cột của ma trận A n là cột véctơ 0 nếu f(j ) > n, là cột véctơ chứa một số 1 nếu 1 ≤ f (j ) ≤ n Do đó, với mọi k ∈N thì ma trận tích A k n vừa chứa các cột véctơ 0 vừa chứa các cột véctơ chỉ có một số 1 Nói cách khác, mỗi véctơ cột của ma trận A k n có n cách sắp xếp vị trí số 1, từ đó ta có nhiều nhất là n n cách sắp xếp vị trí số 1 trong ma trận A k n Vậy các ma trận n × n vừa chứa các cột véctơ 0 vừa chứa các cột véctơ chỉ có một số 1 là hữu hạn nên dãy vô hạn
I, A n , A 2 n , A 3 n , phải lặp lại Cho phương trình: f (X) = 0 Giả sử ma trận A là nghiệm của phương trình trên, ta có: f (A) = 0 Luôn tồn tại ma trận J và ma trận khả nghịch P sao cho A = P J P −1 nên: f (A) = 0 ⇔ f P J P −1
Vậy ma trận J cũng là nghiệm của phương trình f (X) = 0 Đặt λ là trị riêng của ma trận A Ta có: f (J) =
Suy ra, λ cũng là nghiệm của phương trình f (X) = 0. Nhận xét: Nếu ma trận A là nghiệm của phương trình f (X) = 0 thì trị riêng của ma trận A là cũng nghiệm của phương trình f (X) = 0. Đặt: 0 ≤ i < j là các số mũ sao cho A i n = A j n Khi đó, ma trận A n thỏa mãn đa thức x j − x i = 0 Đặt: f (x) = x j − x i ⇒ f (A) = 0 Gọi λ là trị riêng của ma trận A n , ta có: f (λ) = 0 ⇒ λ i λ j−i − 1
1Do đó, tất cả các trị riêng của A n hoặc bằng 0 hoặc bằng căn của 1. Định lý 2.2.1.
Cho f :N → N là một hàm Đặt Γ n là đồ thị có hướng theo hàm f với số tự nhiên n và đặt A n là ma trận kề Giả sử:
P = {Z 1 , , Z r , C 1 , , C s } là phân hoạch chính của Γ n theo định nghĩa 2.1.4 với Z 1 , , Z r là các chu trình và C 1 , , C s là các xích Độ dài của các chu trình và các xích được viết như sau: lenZ j = l j (1 ≤ j ≤ r) và lenC j = m j (1 ≤ j ≤ s) Đặt ω = exp (2πi/l j ) là căn bậc l j của 1 Phân tích Jordan của A n chứa các khối Jordan 1 × 1 ứng với trị riêng bằng căn của 1 là:
J 1 ω j k với 1 ≤ j ≤ r và 1 ≤ k ≤ l j Phân tích Jordan của A n chứa các khối Jordan ứng với trị riêng bằng 0 là:
1)P = {Z 1 , , Z r , C 1 , , C s }là phân hoạch chính của Γ n vớiZ 1 , , Z r là các chu trình vàC 1 , , C s là các xích Độ dài của các chu trình và các xích được viết như sau: lenZ j = l j (1 ≤ j ≤ r) và lenC j = m j (1 ≤ j ≤ s)
2) l 1 + + l r + m 1 + + m s = n. Ta ký hiệu véctơ cơ sở thứ i của C n là e i
Cho Z = {z 1 , , z l } là chu trình bất kỳ của phân hoạchP và đặtω = exp (2πi/l) là căn bậc l của 1 Khi đó, véctơ v k = l
X j=1 ω −kj e z j (2.1) là một véctơ riêng của A n ứng với trị riêng ω k Hơn nữa, span {v 1 , , v l } = span {e z 1 , , e z l }Chúng ta nói v k là véctơ riêng của đỉnh z k
Chứng minh Do A n e z j = e z j+1 với 1 ≤ j ≤ l − 1, Ae z l = e z 1 và ω l = 1, ta có:
Vậy v k là một véctơ riêng của A n ứng với trị riêng ω k Bởi vì các véctơ riêng v 1 , , v l thuộc về các trị riêng khác nhau nên chúng là tập độc lập tuyến tính và số chiều củaspan {v 1 , , v l }làl Hơn nữa,span {v 1 , , v l } là một không gian con củaspan {e z 1 , , e z l } và số chiều củaspan {e z 1 , , e z l } cũng là l Do đó: span {v 1 , , v l } = span {e z 1 , , e z l }
Trong phân hoạch chính P = {Z 1 , , Z r , C 1 , , C s } của Γ n , tập hợp các véctơ riêng ứng với các đỉnh của các chu trình Z 1 , , Z r là tập độc lập tuyến tính.
Chứng minh Từ bổ đề 2.2.2, ta có các véctơ riêng ứng với các đỉnh của một chu trình bất kỳ trongΓ n là tập độc lập tuyến tính Hơn nữa, các chu trình trongΓ n rời nhau.
Do đó, tập các véctơ riêng ứng với các đỉnh của các chu trình Z 1 , , Z r là tập độc lập tuyến tính.
Tiếp theo, chúng ta sẽ xác định véctơ riêng mở rộng ứng với trị riêng 0 của A n Nhắc lại bổ đề 2.1.1: nếu C = {c 1 , , c s } là một xích trong phân hoạch chính của Γ n , khi đó c s hoặc là điểm cuối hoặc là điểm sát nhập của Γ n
Bổ đề 2.2.4. Đặt C = {c 1 , , c m } là một xích bất kỳ trong phân hoạch chính của Γ n 1) Nếu c m là điểm cuối của đồ thị Γ n thì:
{e c m , e c m−1 , , e c 2 , e c 1 } (2.2) là một xích véctơ riêng mở rộng của A n ứng với trị riêng 0.
2) Nếu f(c m ) là điểm sát nhập của Γ n, đặt z là một đỉnh trong chu trình hoặc xích chứa f(c m ) sao cho f m (z) = f (c m ) (z được định nghĩa ở bổ đề 2.1.1).
Khi đó: e c m − e f m−1 (z) , , e c 3 − e f 2 (z) , e c 2 − e f(z) , e c 1 − e z (2.3) là một xích véctơ riêng mở rộng của A n ứng với trị riêng 0.
Trong trường hợp đầu tiên, e c i là véctơ ứng với đỉnh c i Trường hợp thứ hai, e c i − e f i−1 (z) là véctơ ứng với đỉnh c i
Chứng minh 1) Trường hợp c m là điểm cuối của đồ thị Γ n :
Nếu c m là điểm cuối của đồ thị Γ n thì f (c m ) > n, nói cách khác, véctơ cột thức m của ma trận A n là cột véctơ0 Khi đó: A n e c m = A m n e c 1 = 0 Vì vậy, e c m là véctơ riêng gốc của A n ứng với trị riêng 0 và e c 1 là véctơ riêng mở rộng.
Do C = {c 1 , , c m } là một xích của Γ n nên A n e c i = e c i+1 với 1 ≤ i < m. Theo định nghĩa 2.2.3, ta có:
A m−1 n e c 1 , A m−2 n e c 1 , , A n e c 1 , e c 1 = {e c m , e c m−1 , e c m−2 , , e c 2 , e c 1 } là một xích véctơ riêng mở rộng của A n ứng với trị riêng 0. 2) Trường hợp f (c m ) là điểm sát nhập của Γ n :
Vì f m−1 (z) không thuộc xích C nên e c m − e f m−1 (z) là véctơ khác 0. Khi đó:
= A n e c m − A n e f m−1 (z) = e c m+1 − e f m (z) = e f(c m ) − e f m (z) = 0 do f m (z) = f (c m ) Vậy e c m − e f m−1 (z) là véctơ riêng ứng với trị riêng 0. Do C = {c 1 , , c m } là một xích của Γ n nên A n e c i − e f i−1 (z)
Tương tự trường hợp một, ta có:
A m−1 n (e c 1 − e z ) , A m−2 n (e c 1 − e z ) , , A n (e c 1 − e z ) , (e c 1 − e z ) nói cách khác: e c m − e f m−1 (z) , , e c 3 − e f 2 (z) , e c 2 − e f(z) , e c 1 − e z là một xích véctơ riêng mở rộng của A n ứng với trị riêng 0.
Từ bổ đề 2.2.2 và bổ đề 2.2.4, chúng ta đã biết được các véctơ riêng mở rộng ứng vớin đỉnh của đồ thịΓ n Bước tiếp theo, chúng ta cần chứng minh các véctơ riêng mở rộng đó độc lập tuyến tính Khi đó, các véctơ riêng mở rộng từ phân hoạch chính của Γ n là một cơ sở Jordan của C n cho ma trận A n
Cho P = {Z 1 , , Z r , C 1 , , C s } là một phân hoạch chính của Γ n Tập tất cả các véctơ riêng mở rộng ứng với các đỉnh của các chu trình Z 1 , , Z r và các xích C 1 , , C s là tập n véctơ độc lập tuyến tính Do đó, tập này là một cơ sở Jordan của C n cho ma trận A n
Chứng minh Từ bổ đề 2.2.3, ta có: Tập tất cả các véctơ riêng ứng các đỉnh của các chu trình Z 1 , , Z r là tập độc lập tuyến tính Các véctơ riêng này ứng với trị riêng là căn của 1 Nếu len(Z i ) = l i thì ta có l 1 + + l r véctơ riêng.
Nếu len(C i ) = m i thì ta cóm 1 + + m s véctơ riêng mở rộng ứng các đỉnh của các xích C 1 , , C s Các véctơ riêng này ứng với trị riêng 0 Nếu tất cả các véctơ trên đều độc lập tuyến tính, khi đó ta có: n = l 1 + + l r + m 1 + + m s véctơ riêng mở rộng độc lập tuyến tính vì chu trình và xích rời nhau.
Vì vậy, chúng ta cần chứng minh tất cả các véctơ riêng ứng các đỉnh của các xích C 1 , , C s là tập độc lập tuyến tính. Đặt: l = l 1 + + l r và đặt σ : {1, , n} → {1, , n} là ánh xạ hoán vị các số 1, , l thành các đỉnh của các chu trình Z 1 , , Z r sao cho các xích có dạng:
Theo bổ đề 2.2.4, ta có:
Nếu phần tử cuối cùng σ (l + m 1 + + m j ) của xích C j cũng là điểm cuối cùng của đồ thị Γ n thì véctơ riêng gốc có dạng: e σ(l+m 1 + +m j )
Nếu f (σ (l + m 1 + + m j )) là điểm sát nhập, khi đó tồn tại z j thích hợp với σ (z j ) thuộc một xích khác dài hơn xích C j hoặc là thuộc một chu trình nào đó Lúc đó, véctơ riêng gốc có dạng: e σ(l+m 1 + +m j ) − e σ(z j )
Phân tích Jordan cho ma trận kề có trọng số
Định nghĩa 2.2.5 (Ma trận kề có trọng số) Cho f : N → N là hàm bất kỳ Với mỗi n ∈ N, chúng ta định nghĩa ma trận A n = (a ij ) như sau: a ij = ( p j nếu i = f(j) với i, j ∈ {1, , n} ,
0 trong trường hợp còn lại.
Khi đó, A n là ma trận kề có trọng số cho đồ thị trọng số có hướng Γ n với những đỉnh được gán vào 1, , n có trọng số p j ∈ C \ {0} và cạnh hướng từ đỉnh j đến đỉnh i khi và chỉ khi i = f (j).
Bổ đề 2.2.6 Mọi trị riêng của ma trận kề có trọng số hoặc bằng 0 hoặc bằng bội của căn 1.
Bổ đề 2.2.7 Cho Z = {z 1 , , z l } là chu trình bất kỳ của một phân hoạch chính P Đặt ω = exp (2πi/l) là căn bậc l của 1 và đặt τ là căn bậc l của tích l
! e z j (2.4) là một véctơ riêng của A n ứng với trị riêng λ k = τ ω k ; k = 1, , l. Hơn nữa, span {v 1 , , v l } = span {e z 1 , , e z l } Chúng ta nói v k là véctơ riêng của đỉnh z k
Bổ đề 2.2.8. Đặt C = {c 1 , , c m } là một xích bất kỳ trong phân hoạch chính của Γ n. 1) Nếu c m là điểm cuối của đồ thị Γ n thì: e c m , e c m−1 p c m−1 , e c m−2 p c m−2 p c m−1 , , e c 2 p c 2 p c m−1 , e c 1 p c 1 p c 2 p c m−1
(2.5) là một xích véctơ riêng mở rộng của A n ứng với trị riêng 0. 2) Nếu f(c m ) là điểm sát nhập của Γ n , đặt z là đỉnh trong chu trình hoặc xích chứa f(c m ) sao cho f m (z) = f (c m ) Khi đó: e c m p c m − e f m−1 (z) p f m−1 (z) , e c m−1 p c m−1 p c m − e f m−2 (z) p f m−2 (z) p f m−1 (z) , , e c 2 p c 2 p c m − e f(z) p f(z) p f m−1 (z) , e c 1 p c 1 p c m − e z p f(z) p f m−1 (z)
(2.6) là một xích véctơ riêng mở rộng của A n ứng với trị riêng 0. Định lý 2.2.2.
Cho f : N → N là một hàm Đặt Γ n là đồ thị trọng số có hướng theo hàm f với số tự nhiên n và đặt A n là ma trận kề có trọng số Giả sử:
P = {Z 1 , , Z r , C 1 , , C s } là phân hoạch chính của Γ n với Z 1 , , Z r là các chu trình và C 1 , , C s là các xích. Độ dài của các chu trình và các xích được viết như sau: lenZ j = l j (1 ≤ j ≤ r) và lenC j = m j (1 ≤ j ≤ s) Đặt ω = exp (2πi/l j ) là căn bậc l j của 1 và đặt τ là căn bậc l j của tích l j
Phân tích Jordan của A n chứa các khối Jordan 1 × 1 ứng với trị riêng bằng bội của căn 1 là:
J 1 τ ω k j với 1 ≤ j ≤ r và 1 ≤ k ≤ l j Phân tích Jordan của A n chứa các khối Jordan ứng với trị riêng bằng 0 là:
Các bước phân tích Jordan cho ma trận kề có trọng số:
Bước 1: Viết đồ thị trọng số có hướng Γ n và ma trận kề có trọng số A n Bước 2: Tìm phân hoạch chính và điểm cuối, điểm sát nhập (nếu có) của Γ n :
P = {Z 1 , , Z r , C 1 , , C s } với Z 1 , , Z r là các chu trình và C 1 , , C s là các xích. Độ dài của các chu trình và các xích được viết như sau: lenZ j = l j (1 ≤ j ≤ r) và lenC j = m j (1 ≤ j ≤ s)
Bước 3: Tìm các khối Jordan và dạng chuẩn Jordan cho ma trận kề có trọng số: Đặt ω = exp (2πi/l j ) là căn bậc l j của 1 Phân tích Jordan của A n chứa các khối Jordan 1 × 1 ứng với trị riêng bằng bội của căn 1 là:
Phân tích Jordan của A n chứa các khối Jordan ứng với trị riêng bằng 0 là:
Bước 4: Tìm cơ sở β = {v 1 , , v n } của các véctơ riêng mở rộng: a) Trường hợp chu trình: (Áp dụng công thức (2.4)) Cho Z j = {z 1 , , z l } là chu trình bất kỳ của phân hoạch P và đặt ω = exp (2πi/l) là căn bậc l của 1 và đặt τ là căn bậc l của tích l
! e z j là một véctơ riêng của A n ứng với trị riêng λ k = τ ω k b) Trường hợp xích: (Áp dụng công thức (2.5) và (2.6)) Đặt C = {c 1 , , c m } là một xích bất kỳ trong phân hoạch chính của Γ n :
1) Nếuc m là điểm cuối của đồ thị Γ n thì: e c m , e c m−1 p c m−1 , e c m−2 p c m−2 p c m−1 , , e c 2 p c 2 p c m−1 , e c 1 p c 1 p c 2 p c m−1 là một xích véctơ riêng mở rộng của A n ứng với trị riêng 0.
2) Nếuf (c m ) là điểm sát nhập của Γ n, đặt z là đỉnh trong chu trình hoặc xích chứa f(c m ) sao cho f m (z) = f(c m ) Khi đó: e c m p c m − e f m−1 (z) p f m−1 (z) , e c m−1 p c m−1 p c m − e f m−2 (z) p f m−2 (z) p f m−1 (z) , , e c 2 p c 2 p c m − e f (z) p f(z) p f m−1 (z) , e c 1 p c 1 p c m − e z p f(z) p f m−1 (z) là một xích véctơ riêng mở rộng của A n ứng với trị riêng 0.
Ví dụ 2.2.5 Cho hàm f :N → N như sau:
Giải Bước 1: Viết đồ thị trọng số có hướng và ma trận kề có trọng số:
Từ hàm f trên, ta được đồ thị Γ 5 : và ma trận kề A 5:
Bước 2: Tìm phân hoạch chính của Γ 5: Ta có: 2 là điểm sát nhập của Γ 5 Một phân hoạch chính của Γ 5 là:
Bước 3: Tìm các khối Jordan và dạng chuẩn Jordan cho ma trận kề: Đặt: ω = exp (2πi/2) = exp (πi) = -1, khi đó ω là căn bậc hai của 1 và ω 2 = 1. Đặt: τ = √ p 1 p 2 = √
√ 6 2 (1 + i) Các khối Jordan trong phân tích Jordan ma trận A 8 là:
6 2 (1 + i) Dạng chuẩn Jordan của ma trận A 5 là:
Bước 4: Tìm cơ sở β = {v 1 , , v 5 } của các véctơ riêng mở rộng:
Xét Z = {z 1 , z 2 } = {1, 2} ⇒ l = 2 với ω = exp (2πi/2) = exp (πi) = -1, khi đó ω là căn bậc hai của 1 và ω 2 = 1 Đặt:τ = √ p 1 p 2 = √
√ 6 2 (1 + i) Áp dụng công thức (2.4), ta có:
Véctơ riêng của đỉnh số 1 ứng với trị riêng τ ω 1 là: v 1 = τ −1 ω −1 e 1 + τ −2 ω −2 p 1 e 2 = − 1 − i
√ 6 e 1 + e 2 Véctơ riêng của đỉnh số 2 ứng với trị riêng τ ω 2 là: v 2 = τ −1 ω −2 e 1 + τ −2 ω −4 p 1 e 2 = 1 − i
Xét C = {c 1 , c 2 , c 3 } = {3, 4, 5} ⇒ m = 3 Ta có: f (c 3 ) = f (5) = 2 là điểm sát nhập và f(5) = f(2.1) = 2 nên z trong trường hợp này là z = 1 Áp dụng công thức (2.6), ta được:
Véctơ riêng của đỉnh số 5 là: v 3 = e 5 p 5 − e 1 p 1 = 1 + 2i
Véctơ riêng của đỉnh số 4 là: v 4 = e 4 p 4 p 5
3 e 2 Véctơ riêng của đỉnh số 3 là: v 5 = e 3 p 3 p 4 p 5 − e 1 p 1 p 2 p 1 = e 3
Từ 5 véctơ riêng mới tìm được ở trên, ta có bảng các véctơ riêng mở rộng tương ứng với các đỉnh trong phân hoạch chính của Γ 8 như sau: Đỉnh Véctơ riêng mở rộng
5 v 3 = 1+2i 5 e 5 + 3 i e 1 4 v 4 = 3+i 10 e 4 + 3 i e 2 3 v 5 = − 3+i 40 e 3 + 1 9 e 1 Từ đó, ta có ma trận Q như sau:
Các ứng dụng của phân tích Jordan
Ứng dụng giải hệ phương trình vi phân
Phân tích Jordan
Trong trường hợp ma trận A không chéo hóa được, chúng ta sử dụng phân tích Jordan để tam giác hóa ma trận A Khi đó, việc giải hệ phương trình (3.1) trở nên dễ dàng hơn.
Thay vì giải hệ phương trình (3.1), chúng ta sẽ giải hệ phương trình (3.2) đơn giản hơn bằng cách giải ngược từ dưới lên.
Ví dụ 3.1.1 Giải hệ phương trình:
Vì ma trận Akhông thể chéo hóa được nên chúng ta sử dụng phân tích Jordan cho ma trận A và tìm được ma trận khả nghịch P và ma trận J như sau:
Từ phương trình (5), ta có: y 5 = C 5 e −2t Thế y 5 vào phương trình (4), ta được: y 4 = − 1
4 + 1 2 t + (C 5 t + C 4 ) e −2t Từ phương trình (3), ta có: y 3 = −1 + t + C 3 e −t Thế y 3 vào phương trình (2), ta được: y 2 = −2 + t +
2 e −t Thế y 2 vào phương trình (1), ta được: y 1 = −4 + 2t + 1
Nghiệm của hệ phương trình đã cho là:
Ứng dụng trong bài toán kinh tế
chủ thể trong nền kinh tế Các biến kinh tế thường nhận các giá trị khác nhau, tùy vào thời điểm cụ thể được xem xét Chẳng hạn, giá cả của một mặt hàng nào đó có tính biến động theo thời gian, tức là giá cả là một hàm của thời gian:
P = P (t) Do đó, chúng ta cần nghiên cứu các quỹ đạo thời gian của các biến kinh tế, nhằm xác định xem các biến có hội tụ đến một mức giá trị (cân bằng) nhất định sau một khoảng thời gian đủ dài (thường được kí hiệu là t → ∞) hay không.
Trong phần này, chúng ta dựa vào mục 6 chương 4 trang 138 từ giáo trình các phương pháp toán kinh tế của Nguyễn Hải Thanh và xét bài toán mô hình kinh tế vĩ mô về lạm phát và thất nghiệp được phát biểu mô hình như sau:
Xét mối quan hệ Phillips: w = f (U ) với điều kiện f 0 (U ) < 0, trong đó w là mức tăng trưởng của lương và U là mức thất nghiệp.
Giả sử: p = w − T (3.3) trong đó: p là mức tăng trưởng về giá (lạm phát) và T là hiệu suất lao động.
Khi w > T thì p > 0, tức là nếu tốc độ tăng trưởng của tiền lương nhanh hơn hiệu suất lao động thì sẽ có lạm phát về giá.
Nếu giả sử: w = α − βU, (α > 0, β > 0) (3.4) tức là tốc độ tăng trưởng của tiền lương tỉ lệ nghịch với mức thất nghiệp.
Bây giờ, ta xét mối quan hệ Phillips có bổ sung giá trị kỳ vọng: w = f (U ) + hπ, (0 < h ≤ 1) trong đó: π là tốc độ lạm phát dự báo (kỳ vọng tốc độ lạm phát) Thay phương trình trên vào (3.5), ta được: p = α − βU − T + hπ (3.6)
Ngoài ra, chúng ta cũng giả sử rằng: dπ dt = j (p − π) , (0 < j ≤ 1) (3.7) Điều này có nghĩa là: Nếu tốc độ lạm phát về giá hiện tại lớn hơn tốc độ lạm phát dự báo (tức là p > π) thì tốc độ lạm phát dự báo có xu hướng tăng thêm
(tức là dπ dt > 0) Ngược lại, nếu π > p thì tốc độ lạm phát dự báo có xu hướng giảm đi (tức là dπ dt < 0).
Giả sử: dU dt = −k (m − p) , (k > 0) (3.8) với m là tốc độ tăng trưởng của lượng tiền cân bằng danh nghĩa.
Phương trình (3.8) có nghĩa là: Nếu tốc độ tăng trưởng của lượng tiền cân bằng danh nghĩa lớn hơn tốc độ lạm phát về giá hiện tại (tức là m > p) thì tốc độ thất nghiệp có xu hướng giảm ( dU dt < 0) Ngược lại, nếup > m thì tốc độ thất nghiệp có xu hướng tăng ( dU dt > 0).
Từ (3.6), (3.7) và (3.8) ta có mô hình tương tác giữa lạm phát và thất nghiệp được phát biểu dưới dạng hệ phương trình vi phân như sau:
p = α − βU − T + hπ; (α, β > 0; 0 < h ≤ 1) (1) dπ dt = j (p − π) ; (0 < j ≤ 1) (2) dU dt = −k (m − p) ; (k > 0) (3) với: p là mức tăng trưởng về giá (lạm phát).
T là hiệu suất lao động. π là tốc độ lạm phát dự báo (kì vọng tốc độ lạm phát). m là tốc độ tăng trưởng của lượng tiền cân bằng danh nghĩa.
Thay biểu thức của p trong phương trình (1) vào phương trình (2) và (3) của hệ trên, ta thu được:
Bây giờ, chúng ta sẽ giải một ví dụ bài toán mô hình kinh tế vĩ mô về lạm phát và thất nghiệp có hệ phương trình vi phân được cho như trên với ma trận A không chéo hóa được để thấy rõ hơn về ứng dụng của phân tích Jordan.
Ví dụ 3.1.2 Xét mô hình tương tác giữa lạm phát và thất nghiệp:
Tìm quỹ đạo thời gian của các mức lạm phát π(t), giá cả p(t) và thất nghiệp U (t).
(∗) ⇔ X 0 = AX + F Thay vì giải hệ phương trình trên, ta sẽ giải hệ phương trình:
Y 0 = J Y + G với G = P −1 F và Y = P −1 X ⇒ Y 0 = P −1 X 0 Do ma trận A không thể chéo hóa được nên khi phân tích Jordan cho ma trận A, ta thu được:
4 thế y 2 vào phương trình (1), ta được: y 1 0 = −y 1 − 1
Nghiệm của hệ phương trình đã cho là:
+ m U (t) = 2 C 1 − 1 4 tC 2 e −t + 1 2 Từ đây, ta suy ra: p(t) = e −t
Các đường π(t) và p(t) có tính dao động tắt dần và hội tụ về m Vì vậy, m là mức tăng trưởng về tiền tệ cân bằng danh nghĩa lại chính là mức cân bằng của lạm phát giá và của dự báo lạm phát giá.
Trong khi đó, đường U (t) cũng có tính dao động tắt dần nhưng hội tụ về mức 1/2 = 50%.
Ứng dụng vào mô hình Leslie
Cấu trúc mô hình ma trận Leslie
Trong mô hình này, độ tuổi của nữ giới được chia thành các lớp có độ dài bằng nhau Giả sử tuổi cao nhất của nữ giới trong nhóm khảo sát là Ltuổi được chia thành n giai đoạn, như vậy mỗi lớp có độ dài là L/n.
Giả sử ta biết được số lượng của nữ giới phân bố tại các lớp ở thời điểm t = 0, ký hiệu: x (0) i với i = 1, 2, , n là thứ tự các lớp tuổi, tức là biết được véctơ phân bố ban đầu: x (0) i =
x (0) 1 x (0) 2 x (0) n Phân bố tuổi ở thời điểm t k với k bất kỳ, ký hiệu: x (k) i x (k) i =
Cùng với thời gian, số lượng nữ giới ở các lớp tuổi sẽ thay đổi bởi ba nguyên nhân: Độ tuổi tăng lên. Được sinh ra (cộng thêm vào lớp thứ nhất).
Qua đời (có thể xảy ra ở tất cả các lớp).
Chúng ta sẽ định lượng các nguyên nhân này và quan sát sự thay đổi của phân bố trên. Để đơn giản, chúng ta chỉ quan sát tại các thời điểm rời rạc t k , với:
Ta nhận thấy rằng: số lượng nữ giới ở lớp thứ i + 1 tại thời điểmt k+1 trưởng thành từ lớp thứ i tại thời điểm t k
Tỷ lệ sinh, tử được mô tả qua các thông số sau: a i : số bé gái trung bình được sinh ra bởi một người mẹ ở lớp tuổi thứ i. b i: tỷ lệ nữ giới ở lớp tuổi thứ i có thể sống đến lớp tuổi thứ i + 1. Theo định nghĩa trên, ta có các điều kiện sau:
Không cho phép bất kỳ một giá trị b i nào bằng 0, bởi vì nếu như vậy thì sẽ không có ai ở lớp i còn sống đến lớp i + 1, với i = 1, 2, , n − 1.
Có ít nhất một a i nào đó là số dương (khác 0), bởi vì chắc chắn phải có một tỷ lệ sinh nhất định nào đó trong cộng đồng.
Bây giờ ta xét lớp tuổi thứ nhất tại thời điểm t k , rõ ràng số lượng ở lớp này chính bằng số lượng bé gái được sinh ra ở các lớp trên trong giai đoạn từ t k−1 đến t k
Ta có thể viết như sau: x (k) 1 = a 1 x (k−1) 1 + a 2 x (k−1) 2 + + a n x (k−1) n
Các lớp tuổi còn lại là tỷ lệ chuyển từ lớp tuổi dưới lên: x (k) i+1 = b i x (k−1) i ; i = 1, 2, , n − 1 (3.11) (3.10) và (3.11) có thể được viết lại ở dạng ma trận như sau:
Viết cách khác là: x (k) = Lx (k−1) ; k = 1, 2, (∗) với L là ma trận Leslie:
Mô hình Leslie có thể áp dụng cho phân bố tuổi dân số hoặc phân bố tuổi của các loại động vật nói chung.
Ví dụ 3.2.1 Để minh họa, ta xét một loại động vật có tuổi thọ tối đa của một con cái là 15 năm được chia ra thành ba lớp tuổi chính, mỗi lớp kéo dài 5 năm.
Ma trận Leslie và phân bố ban đầu được cho như sau:
Giải Số lượng của loài vật này ở mỗi nhóm sau 5 năm là: x (1) = Lx (0) =
Số lượng của loài vật này ở mỗi nhóm sau 10 năm là: x (2) = Lx (1) =
Số lượng của loài vật này ở mỗi nhóm sau 15 năm là: x (3) = Lx (2) =
Vậy sau 15 năm: có 3222 con cái ở lớp tuổi [0, 5), có 320 con cái ở lớp tuổi [5, 10) và có 309 con cái ở lớp tuổi [10, 15].
Ngoài ra, từ công thức (*) ta có: x (1) = Lx (0) x (2) = Lx (1) = LLx (0) = L 2 x (0) x (j) = Lx (j−1) = LL j−1 x (0) = L j x (0)
Như vậy, nếu ta biết véctơ phân bố ban đầu x (0) và ma trận Leslie L thì ta có thể xác định được phân bố tại bất kỳ thời điểm nào về sau.
Ta xét trường hợp ma trận Leslie L không thể chéo hóa được.
Ví dụ 3.2.2 Xét một loại động vật có tuổi thọ tối đa của một con cái là 45 năm được chia ra thành ba lớp tuổi chính, mỗi lớp kéo dài 15 năm Ma trận Leslie và phân bố ban đầu được cho như sau:
Tìm số lượng của loài vật này ở mỗi nhóm sau 600 năm.
Giải Loại động vật trên có tuổi thọ tối đa của một con cái là 45 năm được chia ra thành 3 lớp tuổi chính, mỗi lớp kéo dài 15 năm Vậy sau 600 năm thì k = 40.
Do ma trậnL không thể chéo hóa được nên khi phân tích Jordan cho ma trận L, ta được:
Số lượng của loài vật này ở mỗi nhóm sau 600 năm là: x (40) = L 40 x (0) = P J 40 P −1 x (0)
Vậy sau 600 năm: có 3,805,3611,663 con cái ở lớp tuổi [0, 15); có 543,623,024 con cái ở lớp tuổi [15, 30) và có 15,532,086 con cái ở lớp tuổi [30, 45].
Từ biểu thức: x (k) = L k x (0) ta dễ dàng xác định được phân phối theo độ tuổi đặc trưng của dân số tại thời điểm k bất kỳ khi có phân bố độ tuổi ban đầu là x (0) và ma trận Leslie L Tuy nhiên, điều đó vẫn chưa có thể dự đoán được phân phối theo độ tuổi đặc trưng của dân số sau một thời gian dài, tức là khi k đủ lớn.
Vậy để nghiên cứu đặc tính của quá trình tăng trưởng trong thời gian dài, chúng ta cần tìm ma trận L k với k đủ lớn Cách dễ dàng tìm ma trận L k là tam giác hóa ma trận Khi đó, chúng ta cần tìm trị riêng và véctơ riêng của ma trận Leslie.
Trị riêng của ma trận Leslie là nghiệm của phương trình:
⇔ λ n − a 1 λ n−1 − a 2 b 1 λ n−2 − a 3 b 1 b 2 λ n−3 − − a n b 1 b 2 b n−1 = 0 Vậy trị riêng của ma trận Leslie là nghiệm của phương trình đặc trưng: λ n − a 1 λ n−1 − a 2 b 1 λ n−2 − a 3 b 1 b 2 λ n−3 − − a n b 1 b 2 b n−1 = 0 Với λ 6= 0, chia 2 vế phương trình trên cho λ n , ta được:
Khi đó có thể viết lại là: q(λ) = 1, λ 6= 0 với: q(λ) = a 1 λ + a 2 b 1 λ 2 + a 3 b 1 b 2 λ 3 + + a n b 1 b 2 b n−1 λ n Do a i và b i là các hằng số không âm, nên dễ dàng nhận thấy: q(λ) là hàm đơn điệu giảm khi λ > 0. q(λ) có một tiệm cận đứng tại λ = 0. q (λ) → 0 khi λ → +∞.
Từ đó, ta thấy chỉ tồn tại duy nhất một giá trị λ = λ 1 sao cho q(λ) = 1, điều đó có nghĩa là ma trận L chỉ có duy nhất một trị riêng dương.
Ngoài ra, λ 1 còn là nghiệm đơn của phương trình đặc trưng do đó không gian con riêng ứng với trị riêng này có số chiều bằng một.
Khi đó, cơ sở của không gian con riêng này là nghiệm của hệ:
(a 1 − λ 1 ) y 1 + a 2 y 2 + a 3 y 3 + + a n−1 y n−1 + a n y n = 0 (1) b 1 y 1 − λ 1 y 2 = 0 (2) b 2 y 2 − λ 1 y 3 = 0 (3) b n−2 y n−2 − λ 1 y n−1 = 0 (k − 1) b n−1 y n−1 − λ 1 y n = 0 (k)Chúng ta sẽ giải hệ phương trình trên bắt đầu từ phương trình (2) đến phương trình (k). Đặt: y 1 = α Thế vào phương trình (2), ta được: b 1 α − λ 1 y 2 = 0 ⇒ y 2 = b 1 α λ 1
Thế y 2 vào phương trình (3), ta được: b 2 y 2 − λ 1 y 3 = 0 ⇒ y 3 = b 2 y 2 λ 1 = b 2 b 1 α λ 2 1 Tiếp tục quá trình trên, ta thu được: b 3 y 3 − λ 1 y 4 = 0 ⇒ y 4 = b 3 y 3 λ 1 = b 3 b 2 b 1 α λ 3 1 b n−2 y n−2 − λ 1 y n−1 = 0 ⇒ y n−1 = b n−2 y n−2 λ 1 = b n−2 b n−3 b 2 b 1 α λ n−2 1 b n−1 y n−1 − λ 1 y n = 0 ⇒ y n = b n−1 y n−1 λ 1
Vậy cơ sở của không gian con riêng ứng với trị riêng λ 1 là: x 1 =
(3.12) Để ý rằng mọi phần tử của véctơ riêng x 1 đều dương Từ đó, ta có các định lý sau: Định lý 3.2.1 Một ma trận Leslie L có duy nhất một trị riêng dương λ 1 , trị riêng này có bội đại số bằng 1 và tương ứng với một véctơ riêng x 1 với tất cả các thành phần đều là số dương. Định lý 3.2.2 Nếu λ 1 là trị riêng dương duy nhất của ma trận Leslie và λ k là các trị riêng còn lại (có thể mang giá trị thực hoặc phức), khi đó |λ k | ≤ λ 1.
Nói cách khác, trị riêng lớn nhất của ma trận Leslie chỉ có duy nhất một giá trị dương và có độ dài lớn nhất, các trị riêng còn lại mang giá trị thực hoặc phức và có độ dài nhỏ hơn hay bằng độ dài trị riêng dương đó.
Trường hợp ma trận L chéo hóa được
Trong trường hợp này, L có n trị riêng λ 1 , λ 2 , , λ n , với λ 1 là trị riêng trội và (n − 1) trị riêng còn lại không nhất thiết phải là các trị riêng phân biệt, tương ứng là n véctơ riêng độc lập tuyến tính x 1 , x 2 , , x n Khi đó, L được chéo hóa theo phương trình:
Theo Leslie, phân bố độ tuổi tại thời điểm t k của quần thể con cái là: x (k) = L k x (0) = P
Chia hai vế cho λ k 1 , ta được: x (k) λ k 1 = P
Bởi vì λ 1 là trị riêng trội nên: λ i λ 1 < 1 ⇔ lim k→∞ λ i λ 1 k
P −1 x (0) Đặt: P −1 x (0) = (c 1 |c 2 | |c n ) T Khi đó, ta có: k→∞ lim x (k) λ k 1 = (x 1 |x 2 | |x n )
⇔ x (k) ≈ λ k 1 c 1 x 1 (3.13) với c 1 là phần tử đầu tiên của P −1 x (0)
Trường hợp ma trận L không chéo hóa được
Trong trường hợp ma trận Leslie không thể chéo hóa được thì chúng ta cần sử dụng đến phân tích Jordan để đưa ma trận ban đầu về ma trận đơn giản, từ đó dễ tìm ma trận mũ hơn.
Xét ma trận Leslie và tập trị riêngσ (L) = {λ 1 , λ 2 , , λ s }, trong đó có trị riêng trội là λ 1 Phân tích Jordan cho ma trận L, ta có:
trong đó: J là ma trận Jordan chứa các khối Jordan J (λ i ) ứng với mỗi trị riêng λ i ∈ σ(L); i = 1, 2, , s Mỗi ma trận J (λ i ) có dạng:
P −1 trong đó: J là ma trận Jordan chứa các khối Jordan J (λ i ) ứng với mỗi trị riêng λ i ∈ σ(L); i = 1, 2, , s Mỗi ma trận J k (λ i ) có dạng:
với m i là cấp của khối Jordan J l (λ i ) Ta có:
Theo Leslie, phân bố tuổi tại thời điểm t k với k bất kỳ của quần thể con cái là: x (k) = L k x (0) = P J k P −1 x (0)
P −1 x (0) (3.15) Đặt index(λ 1 ) = t Khi đó, cấp lớn nhất của khối Jordan ứng với λ 1 là t × t. Do đó, λ 1 sẽ được lặp lại ít nhất t lần hay nói cách khác thì bội đại số của λ 1 sẽ lớn hơn hoặc bằng t Vậy index(λ 1 ) sẽ bé hơn hay bằng bội đại số của λ 1 Mà ta lại có λ 1 là trị riêng trội với bội đại số bằng 1, do đó 0 < index(λ 1 ) ≤ 1. Suy ra, index(λ 1 ) = 1 hay cấp của khối Jordan ứng với trị riêng λ 1 là 1 × 1 Vậy:
; i = 2, , s với m i là cấp của khối Jordan J l (λ i ) ; l = 1, 2, , t j Ta có:
Chia 2 vế phương trình (3.15) cho λ k 1 , ta được: x (k) λ k 1 = P
Do λ 1 là trị riêng trội nên lim k→∞ λ i λ 1 k
⇒ x (k) ≈ λ k 1 x 1 c 1 (∗) với c 1 là phần tử đầu tiên của P −1 x (0)
Kết luận
Để có thể dự đoán được phân bố theo độ tuổi đặc trưng của dân số sau một thời gian dài, tức là khik đủ lớn, ta có thể sử dụng trực tiếp kết quả xấp xỉ như sau: x (k) ≈ λ 1 x (k−1) (3.17) và x (k) ≈ λ k 1 c 1 x 1 (3.18) trong đó c 1 là phần tử đầu tiên của P −1 x (0)
Chúng ta thấy rằng sau một thời gian dài thì cứ mỗi một chu kỳ, số lượng cá thể cái của dân số trong mỗi lớp tuổi sẽ tăng lên hay giảm xuống xấp xỉ (λ 1 − 1) × 100 phần trăm (biểu thức (3.17)) và tỷ lệ cá thể cái giữa các nhóm tuổi của dân số được phân phối theo tỷ lệ xấp xỉ với tỷ lệ các phần tử của véctơ riêng x 1 tương ứng với trị riêng trội λ 1 (biểu thức (3.18)).
Ví dụ 3.2.3 Xem lại ví dụ 3.2.1, với ma trận Leslie và phân bố ban đầu:
Khi đó, phương trình đặc trưng:
125 = 0 có nghiệm trội λ 1 = 7 5 Từ (3.12), ta tính được véctơ riêng tương ứng với λ 1 = 7 5 là: x 1 =
Sau một thời gian dài:
Số lượng cá thể tăng 40% sau mỗi chu kỳ (15 năm).
Tỷ lệ phân phối giữa các nhóm tuổi sẽ là: 1 : 70 1 : 2450 1 Có nghĩa là có98, 55% số con cái ở lớp tuổi đầu tiên; 1, 41% số con cái ở lớp tuổi thứ hai và0, 04% số con cái ở lớp tuổi thứ ba.
Ứng dụng vào chuỗi Markov
Quy trình của chuỗi Markov
Nếu chuỗi Markov có k trạng thái có thể xảy ra Khi đó, xác suất mà hệ thống đang ở trạng thái thứ i tại bất kỳ lần quan sát nào sau khi nó ở trạng thái j tại lần quan sát trước đó được ký hiệu là p ij và được gọi là xác suất chuyển đổi từ trạng thái j đến trạng thái i.
được gọi là ma trận chuyển đổi của chuỗi Markov.
Ví dụ Trong chuỗi Markov ba trạng thái, ma trận chuyển đổi có dạng là:
Trong ma trận này: p 12 là xác suất chuyển từ trạng thái 2 sang trạng thái 1. p 33 là xác suất vẫn ở trạng thái 3 nếu trước đó nó ở trạng thái 3.
Một chuỗi nhà hàng gồm ba địa điểm khác nhau, ký hiệu: 1, 2 và 3 Một khách hàng sau khi ăn tại một trong ba địa điểm trên sẽ được phát phiếu giảm giá vào lần ăn tiếp theo tại bất kỳ một trong ba địa điểm đó Chủ nhà hàng nhận thấy rằng khách hàng sử dụng phiếu giảm giá tại các địa điểm khác nhau theo xác suất sau:
Ma trận này là ma trận chuyển đổi của một hệ thống như một chuỗi Markov.
Từ ma trận này, ta biết được:
0.15 là xác suất một phiếu giảm giá từ vị trí số 1 sẽ được sử dụng ở vị trí số 2.
0.7 là xác suất một phiếu giảm giá từ vị trí số 3 sẽ được sử dụng ở vị trí số 3.
Trong ví dụ trên, ma trận chuyển đổi của chuỗi Markov có tính chất là tổng các hệ số ở các cột đều bằng 1.
Nếu P = (p ij )là ma trận chuyển đổi của bất kỳ chuỗi Markov nào với k trạng thái thì với mỗi j, ta có: p 1j + p 2j + + p kj = 1 (3.19) bởi vì nếu hệ thống ở trạng thái j tại một lần quan sát thì chắc chắn nó sẽ là một trong k trạng thái đó ở lần quan sát tiếp theo.
Một ma trận thỏa (3.19) được gọi là ma trận ngẫu nhiên, ma trận xác suất, hoặc ma trận Markov Từ đó ta thấy, ma trận chuyển đổi của một chuỗi Markov phải là một ma trận ngẫu nhiên.
Trong một chuỗi Markov, trạng thái của hệ thống tại bất kỳ thời điểm quan sát thường không thể được xác định một cách chắc chắn Do đó, tốt nhất là nên thường xuyên xác định xác suất có thể xảy ra đối với mỗi trạng thái.
Ví dụ Trong một chuỗi Markov với 3 trạng thái, chúng ta có thể mô tả trạng thái có thể có của hệ thống tại một vài thời điểm quan sát bởi một véctơ cộtx =
trong đó: x 1 là xác suất của hệ thống tại trạng thái 1. x 2 là xác suất của hệ thống tại trạng thái 2. x 3 là xác suất của hệ thống tại trạng thái 3.
Một cách tổng quát, chúng ta có định nghĩa sau: Định nghĩa 3.3.2.
Véctơ trạng thái cho một lần quan sát của một chuỗi Markov với k trạng thái là một véctơ cột x mà thành phần thứ i của nó là x i chính là xác suất có thể xảy ra của hệ thống ở trạng thái thứ i tại cùng thời điểm.
Quan sát thấy rằng các hệ số trong bất kỳ véctơ trạng thái của chuỗi Markov là không âm và có tổng bằng 1 Một véctơ cột có tính chất này được gọi là véctơ xác suất.
Giả sử, chúng ta biết được véctơ trạng tháix (0) của một chuỗi Markov tại lần quan sát ban đầu: x (0) =
Ta cũng định nghĩa được véctơ trạng thái x (n) của một chuỗi Markov tại lần quan sát thứ n như sau: x (n) =
Bây giờ ta xét trạng thái của một hệ thống tại một thời điểm bất kỳ trong lần quan sát tiếp theo, rõ ràng trạng thái này được sinh ra từ các trạng thái của hệ thống đó tại tất cả thời điểm trong lần quan sát hiện tại nhân với xác suất chuyển đổi tương ứng của nó: x (n+1) i = p i1 x (n) 1 + p i2 x (n) 2 + + p ik x (n) k
Từ đó, chúng ta có thể viết lại dạng ma trận như sau:
Ví dụ 3.3.2 Xét lại ví dụ 3.3.1, ta có ma trận Markov được cho như sau:
Nếu 1 phiếu giảm giá đầu tiên được phát ở vị trí 2 thì véctơ trạng thái ban đầu là: x (0) =
Tính xác suất khách hàng sử dụng phiếu giảm giá tại mỗi vị trí sau 3 năm.
Giải Áp dụng công thức (3.20), ta có:
Véctơ trạng thái sau 1 năm là: x (1) = P x (0) =
Véctơ trạng thái sau 2 năm là: x (2) = P x (1) =
Véctơ trạng thái sau 3 năm là: x (3) = P x (2) =
Vậy sau 3 năm, ta có:
Xác suất khách hàng sử dụng phiếu giảm giá ở vị trí 1 là 0.222 Xác suất khách hàng sử dụng phiếu giảm giá ở vị trí 2 là 0.124 Xác suất khách hàng sử dụng phiếu giảm giá ở vị trí 3 là 0.654
Từ công thức (3.20), ta có: x (1) = P x (0) x (2) = P x (1) = P P x (0) = P 2 x (0) x (3) = P x (2) = P P 2 x (0) = P 3 x (0) x (m) = P x (m−1) = P P m−1 x (0) = P m x (0)
Như vậy, nếu ta biết được véctơ trạng thái ban đầu x (0) và ma trận chuyển đổi trạng thái P thì chúng ta sẽ biết được véctơ trạng thái tại các thời điểm về sau.
Ví dụ 3.3.3 Tìm véctơ trạng thái sau 3 năm với ma trận Markov và véctơ trạng thái ban đầu được cho như ví dụ 3.3.2:
Giải Ma trận P không chéo hóa được nên khi phân tích Jordan cho ma trận P, ta thu được:
Véctơ trạng thái sau 3 năm là: x (3) = P 3 x (0) = U J 3 U −1 x (0)
Sự hội tụ của véctơ trạng thái
Ví dụ 3.3.4 Giải ví dụ 3.3.2 theo công thức (3.20)
Giải Véctơ trạng thái sau 3 năm là: x (3) = P 3 x (0) =
Ngoài 3 năm trên, ta tìm được các véctơ trạng thái sau (lấy theo dạng phân số): x (4) =
Nói cách khác, khi số lượng các lần quan sát tăng lên hay khi n đủ lớn thì các véctơ trạng thái sẽ hội tụ về một véctơ cố định.
Tuy nhiên, không phải lúc nào véctơ trạng thái cũng sẽ hội tụ về một véctơ cố định khi số lượng các lần quan sát tăng lên như trên.
Bây giờ, chúng ta xét một ví dụ như sau:
Ví dụ 3.3.5 Xét ma trận chuyển đổi trạng thái và véctơ trạng thái ban đầu:
Nhìn vào (3.22), ta thấy rằng hệ thống này dao động không xác định giữa hai véctơ:
Vì vậy, khi số lượng các lần quan sát tăng lên thì véctơ trạng thái sẽ không hội tụ về một véctơ cố định nào.
Nếu ta đặt một điều kiện nhỏ trên ma trận chuyển đổi thì ta thấy rằng véctơ trạng thái luôn luôn xấp xỉ bằng một véctơ cố định Điều kiện này được mô tả trong định nghĩa sau đây: Định nghĩa 3.3.3 Một ma trận chuyển đổi là thuần nhất nếu những lũy thừa nguyên của nó là dương, có nghĩa là các hệ số đều dương.
Một chuỗi Markov được chi phối bởi ma trận chuyển đổi thuần nhất được gọi là chuỗi Markov thuần nhất Mỗi chuỗi Markov thuần nhất có một véctơ trạng thái cố định q sao choP n x (0) xấp xỉ bằng q khi n tăng với mọi x (0) Kết quả này là quan trọng nhất trong lý thuyết chuỗi Markov.
Xét ma trận chuyển đổi thuần nhất P, để tìm sự hội tụ của P n x (0) chúng ta cần phải tìm sự hội tụ của ma trận P n Cách dễ dàng tìm P n là tam giác hóa ma trận P với cách phổ biến nhất là chéo hóa ma trận Vấn đề đặt ra là không phải ma trận nào cũng có thể chéo hóa được, khi đó chúng ta sẽ tam giác hóa ma trận P bằng phương pháp Jordan.
Trước khi tìm hiểu hai phương pháp nói trên, chúng ta sẽ bắt đầu tìm trị riêng của ma trận Markov qua các định lý sau: Định lý 3.3.1 Mọi trị riêng λ của ma trận Markov thỏa |λ| ≤ 1 (1)
Chứng minh Giả sử P là ma trận Markov có tập trị riêng là σ (P ), ta có: σ (P ) = σ P T
Cho λ ∈ C là một trị riêng của ma trận Markov và x ∈ C là véctơ riêng tương ứng λ, ta có:
Lấy k sao cho |x j | ≤ |x k | , ∀j, 1 ≤ j ≤ n Từ (3.23), suy ra: n
⇒ |λ| |x k | ≤ |x k | ⇒ |λ| ≤ 1. Định lý 3.3.2 Ma trận Markov có trị riêng trội là λ 1 = 1.
Chứng minh Trước khi chứng minh định lý trên, chúng ta cần biết về định lý Perron – Frobenius được phát biểu như sau:
Nếu A n×n ≥ 0 là ma trận bất khả quy, khi đó bán kính phổ r = max |λ| λ∈σ(A) của ma trận A là một trị riêng dương và bội đại số của r bằng 1 (2) Đặt: J =
⇒ P T J = JVậy λ 1 = 1 là trị riêng của ma trận P và |λ 1 | = 1 (3)Từ (1), (2) và (3), ta suy ra λ 1 = 1 là trị riêng trội của ma trận Markov.
Trường hợp ma trận P chéo hóa được
Trong trường hợp này, P có s trị riêng λ 1 , λ 2 , , λ s , với λ 1 = 1 là trị riêng trội và (s − 1)trị riêng còn lại không nhất thiết phải là các trị riêng phân biệt, tương ứng là s véctơ riêng độc lập tuyến tính u 1 , u 2 , , u s
Khi đó, P được chéo hóa theo phương trình:
Vì: λ i < 1 ⇒ lim n→∞ λ n i = 0; i = 2, , s Do đó: n→∞ lim P (n) = U
Trường hợp ma trận P không chéo hóa được
Trong trường hợp ma trận Markov không thể chéo hóa được thì chúng ta cần sử dụng đến phân tích Jordan để đưa ma trận ban đầu về ma trận đơn giản, từ đó dễ tìm ma trận mũ hơn.
Xét ma trận P và tập trị riêng σ (P ) = {λ 1 , λ 2 , , λ s }, trong đó có trị riêng trội là λ 1 = 1 Phân tích Jordan cho ma trận P, ta có:
J (λ 1 ) = 1(Vì nếu ta đặtindex(λ 1 ) = t Khi đó, cấp lớn nhất của khối Jordan ứng với λ 1 là t × t Do đó, λ 1 sẽ được lặp lại ít nhất t lần hay nói cách khác thì bội đại số của λ 1 sẽ lớn hơn hoặc bằng t Vậy index(λ 1 ) sẽ bé hơn hay bằng bội đại số của λ 1 Mà ta lại có bội đại số của λ 1 bằng 1, do đó 0 < index(λ 1 ) ≤ 1. Suy ra, index(λ 1 ) = 1 hay cấp của khối Jordan ứng với trị riêng λ 1 là 1 × 1 Vậy:
Mỗi ma trận J (λ i ) ứng với mỗi trị riêng λ i ∈ σ(P ); i = 2, , s có dạng:
U −1 trong đó: J là ma trận Jordan chứa các khối Jordan J (λ i ) ứng với mỗi trị riêng λ i ∈ σ(P ); i = 2, , s Mỗi ma trận J n (λ i ) có dạng:
với m i là cấp của khối Jordan J l (λ i ) ; l = 1, 2, , t i Ta có:
Ta nhận thấy phương trình trên quay về dạng của phương trình (3.24) mà chúng ta đã phân tích theo phương pháp chéo hóa ma trận nói trên Vậy:
Kết luận
trong đó q i là những số thực dương sao cho : q 1 + q 2 + + q k = 1
Tính véctơ xác suất cố định
Khi đó, Q là ma trận chuyển đổi và tất cả các cột của nó chính là véctơ xác suất q Với x là một véctơ xác suất bất kỳ, ta có:
do x là véctơ xác suất nên: x 1 + x 2 + + x k = 1
⇒ Qx = 1 × q = q Có nghĩa là:Qbiến đổi bất kỳ véctơ xác suấtxthành véctơ xác suất cố địnhq.
( P n → Q, n → ∞ Qx = q, ∀x ⇒ P n x → Qx = q Từ đó, ta có định lý sau: Định lý 3.3.3 Nếu P là ma trận chuyển đổi thuần nhất và x là véctơ xác suất bất kỳ thì khi n → ∞, ta có:
Do đó, đối với chuỗi Markov thuần nhất thì hệ thống cuối cùng cũng xấp xỉ một véctơ trạng thái cố định q Véctơq được gọi là véctơ trạng thái cố định của chuỗi Markov thuần nhất.
Cho một hệ thống với nhiều trạng thái, thường thì chúng ta tìm véctơ trạng thái cố định q bằng cách tính P n x (0) với n đủ lớn Tuy nhiên, có một cách khác để tính toán véctơ trạng thái cố định là sử dụng định lý sau: Định lý 3.3.4 Véctơ trạng thái cố định q của một ma trận chuyển đổi thuần nhất P là véctơ xác suất duy nhất thỏa mãn phương trình P.q = q
Chứng minh i) Chứng minh q là véctơ trạng thái cố định thì P.q = q Nếu P là ma trận chuyển đổi thuần nhất và x là véctơ xác suất bất kỳ thì khi n → ∞, ta có:
( P n x → q (1) P n+1 x → q (2) Nhân 2 vế (1) với ma trận P:
⇔ P n+1 x → P q (3) P là ma trận chuyển đổi thuần nhất nên từ (2) và (3), suy ra:
P.q = q ii) Chứng minh q là véctơ xác suất duy nhất Giả sử: Tồn tại véctơ xác suất r thỏa P.r = r
Theo định lý 3.3.3 suy ra r = q Vậy q là véctơ xác suất duy nhất.
Từ i) và ii), suy ra q là véctơ xác suất duy nhất thỏa phương trình P.q = q.
Từ định lý 3.3.4, ta có:
P.q = q ⇒ q − P.q = 0 ⇔ (I − P ).q = 0Hệ phương trình tuyến tính thuần nhất (I − P ).q = 0 có nghiệm duy nhất là véctơ q với hệ số không âm thỏa mãn điều kiện q 1 + q 2 + + q k = 1.
Ta có thể áp dụng kỹ thuật chứng minh này để tính toán véctơ trạng thái cố định nhanh hơn so với cách tính P n x (0) khi n đủ lớn.
Ví dụ 3.3.6 Xét ví dụ 3.3.4 với ma trận chuyển đổi trạng thái:
Bây giờ chúng ta sẽ tìm véctơ trạng thái cố định theo cách nói trên.
Giải Hệ phương trình tuyến tính thuần nhất (I − P ).q = 0 có dạng:
trong đó α là hằng số tùy ý. Để đưa véctơ q về dạng véctơ xác suất, ta đặt: α = 1
Các hệ số của qcho ta xác suất lâu dài mà bất kỳ một phiếu giảm giá được sử dụng tại các địa điểm 1, 2 hoặc 3 tương ứng Nếu chuỗi nhà hàng trên có 1000 phiếu giảm giá thì chủ nhà hàng cần thiết kế suất giảm giá tại các địa điểm trên để có ít nhất 222 suất giảm giá tại địa điểm 1, ít nhất 124 suất giảm giá tại địa điểm 2 và ít nhất 654 suất giảm giá tại địa điểm 3.
Phân tích Jordan cho ma trận tùy ý được ứng dụng rộng rãi trong các bài toán kỹ thuật, kinh tế, môi trường, Hiểu rõ phân tích Jordan của một ma trận tùy ý đòi hỏi kiến thức chuyên sâu về đại số tuyến tính Trong luận văn này, tác giả đã trình bày phân tích Jordan rất chi tiết, rõ ràng và nêu các bước cụ thể để phân tích Luận văn giúp cho người đọc hiểu rõ về phân tích Jordan và có code matlab do tác giả viết kèm theo dùng để phân tích Jordan cho ma trận tùy ý.
Các bước phân tích Jordan của một ma trận được trình bày trong luận văn rõ ràng, cùng với cơ sở lý thuyết chính xác, tuy nhiên việc phân tích Jordan của một ma trận vuông tùy ý là phức tạp Từ thực tế đó, trong những bài toán khác nhau người ta đi tìm phương pháp riêng, đơn giản, nhanh chóng hơn để phân tích Jordan cho dạng bài toán của mình Trong chương 2, dựa trên bài báo 2011 và 2013, tác giả đã trình bày lại cơ sở lý thuyết của phương pháp phân tích Jordan cho ma trận kề và ma trận kề có trọng số trong lý thuyết đồ thị Theo hướng nghiên cứu của đề tài luận văn, một bài toán được đặt ra: Tìm phân tích Jordan đơn giản, hiệu quả cho các bài toán cụ thể trong kỹ thuật.
Qua luận văn này, tác giả bắt đầu làm quen với công việc nghiên cứu khoa học một cách nghiêm túc và có hệ thống Tuy nhiên, với sự hiểu biết hạn chế của bản thân, tác giả rất mong học hỏi nhiều hơn từ sự đóng góp và chỉ bảo của Quý Thầy, Cô và các bạn bè, đồng nghiệp Một lần nữa, tác giả xin cám ơnThầy hướng dẫn khoa học TS Đặng Văn Vinh đã cho những góp ý xác đáng và tận tình giúp đỡ trong lúc thực hiện luận văn cũng như viết chương trình.
[1] Đặng Văn Vinh, Giáo trình đại số tuyến tính.
[2] Nguyễn Hải Thanh, Các phương pháp toán kinh tế, Hà Nội, (2008).
[3] Nguyễn Ngọc Trung, Giáo trình lý thuyết đồ thị, Tp.HCM, (2006).
[4] Carl Meyer, Matrix analysis and applied linear algebra, Birkhauser, (1983).
[5] Anton Howard, Chris Rorres, Elementary Linear Algebra, (2005).
[6] Gilbert Strange, Linear algebra and its application.
[7] David A Cardon and Bradford Tuckfield, The Jordan canonical form for a class of zero - one matrices, (2011).
[8] Hans Nina, Ricardo L Soto and Domingos M Cardoso,The Jordan canonical form for a class of weighted directed graphs, (2013).
[9] John S Alin, Colin L Starr, Undergraduate Matrix Theory and Linear Al- gebra, (2006).
[10] David C Lay, Linear algebra and its applications.
[11] Peyam Ryan Tabrizian,How to find the Jordan canonical form of a matrix, (2013).
[12] Jeremy West, The Jordan normal form and its applications.
Trong phần này, chúng ta sẽ tìm hiểu về code matlab để phân tích Jordan cho ma trận bất kỳ dựa trên cơ sở lý thuyết phân tích Jordan được nói đến trong chương I.
1 % PHAN TICH JORDAN CHO MA TRAN BAT KY:
5 6 % Doc ma tran tu file txt
8 9 % Kiem tra ma tran thuong hay luy linh
12 disp('A la ma tran thuong');
16 disp('A la ma tran luy linh');
18 %flag = 1 => xuat chi tiet ra man hinh
19 %flag = 0 => chi xuat ket qua ra man hinh
26 % De chay ham ta go vao Command Window: jordanThuong()
28 29 % Lay so chieu cua ma tran A
35 % Dua cac lamda trung nhau len dau mang va chi lay 1 lan
51 % Neu L chi co 1 phan tu
58 % Tao ma tran cap n tao boi Y va I
61 YI(1:mY,1:mY) = Y(1:mY,1:mY);
62 YI(mY + 1:nA1,mY + 1:nA1) = eye(nA1 - mY);
70 % Lay A1 moi ra (cap cua A1 la nA1 hien tai - cap L)
75 % Gan gia tri moi vao
76 A1(1:mA1,1:mA1) = R(mL+1:nA1,mL+1:nA1)
78 % Tao ma tran cap n boi I va Q
81 IQ(1:n - mQ,1:n - mQ) = eye(n - mQ);
82 IQ(n - mQ + 1:n,n - mQ + 1:n) = Q(1:mQ,1:mQ);
83 %voi lamda dau tien thi P = Q
84 %cac lamda tiep theo thi P se duoc nhan IQ vao them
99 % De chay ham ta go vao Command Window: jordanLuyLinh()
107 108 % Lay so chieu cua ma tran A
133 disp(sprintf('+ Co %d khoi %dx%d', v(i), i, i));
147 % Tinh cac B con lai, ket qua se duoc gan vao B1
204 % KIEM TRA MA TRAN LUY LINH, NEU LA THI TIM CHI SO
205 % De chay ham ta go vao Command Window: maTranLuyLinh()
208 % Neu A luy linh thi k la chi so cua A, nguoc lai k = 0
211 212 % Lay so chieu cua ma tran A
221 222 % Neu A la ma tran 0 => A luy linh
228 229 % Kiem tra trong vong 10 lan xem A co mu len = 0 hay khong
241 % TIM CO SO CUA N(A) GIAO R(B)
242 % De chay ham ta go vao Command Window: NAgiaoRB()
248 249 % Tim co so cua N(AX)
252 % Lay so chieu cua ma tran NAX
256 257 % Tim co so cua N(A) giao R(B)
264 % TIM MA TRAN DOC LAP TUYEN TINH
265 % De chay ham ta go vao Command Window: maTranDLTT()
267 % Lay so chieu cua ma tran A
283 % De chay ham ta go vao Command Window: coreNilpotent()
286 % Lay so chieu cua ma tran L
308 % R(Ak) la ma tran dang dong
312 % N(Ak) la ma tran dang cot
315 % Chuyen vi de duoc dang dong
319 % Noi 2 ma tran lai (dang dong)
321 % Chuyen vi de thanh dang cot
328 disp('Ma tran Core - Nilpotent:');
331 332 % L la ma tran cap nA - r(A^k)
337 % Chuyen cac gia tri bang 0 cua ma tran A ve 0 (do matlab tinh sai)
340 % tol la 1 con so rat nho (gan bang 0)
358 % tol la 1 con so rat gan bang 1
360 %tolMin la 1 con so rat gan bang 0
382 % Tim cac phan tu trung nhau trong mang
383 % Cac phan tu trung nhau chi lay 1 lan
384 % Dua chung len tren dau mang
389 390 % Lay ra cac phan tu trung nhau
400 401 % Gan cac phan tu con lai cua A vao trong B
410 % Dem so lan xuat hien cua x trong mang A
421 %Sao chep ma tran (ham nay dung de sao chep gia tri cua ma tran
422 %nay vao mot ma tran khac)
423 %thuong duoc su dung de lay gia tri cua cac ma tran da duoc
424 %chuyen thanh dang bien (sym), cho ra kq la 1 ma tran binh thuong