Bài toán hồi quy đối với các biến cấu trúc- 123docz.net

nhiên có cấu trúc tuyến tính

2.3 Bài toán hồi quy đối với các biến cấu trúc

Xét mô hình phân tích nhân tố của mục 2.2 cho một vectơ ngẫu nhiên

p-chiều X:

X =A·F+ε (2.32)

ở đây, A là một ma trận cấp p×r với tất cả các cột chứa ít nhất hai phần tử khác 0 và không hàng nào chứa toàn phần tử 0, F là một vectơ ngẫu nhiên

r-chiều với thành phần Fi độc lập và ε là một vectơ ngẫu nhiên p-chiều với

các thành phần εi độc lập, đồng thờiF vàε độc lập. Xét biến ngẫu nhiên thứ

(p+1) được xác định bởi:

Y =aTF+ε0 (2.33)

ở đâyalà một vectơ cố định, ε0 là một biến ngẫu nhiên độc lập vớiF. Chúng ta sẽ nghiên cứu điều kiện để hồi quy củaY đối với X là tuyến tính. Không mất tính tổng quát, ta giả sử rằng:

E(F) =0, E(ε) =0, E(ε0) =0. (2.34) Giả sử tính hồi quy củaY đối vớiX là tuyến tínhE(Y|X) =βTX.

Từ(2.32) ta có

Định lý 2.18. Giả sử p≥2và hồi quy củaε0đối vớiε là tuyến tính:E(ε0|ε) =

δTε. Khi đóE(Y|X) =βTX nếu và chỉ nếu các điều kiện sau đây thỏa mãn: (i) Giả sử γj là thành phần thứ j của vectơ a−ATβ. Nếuγj khác0thì Fj là

chuẩn.

(ii) Giả sử ξj là thành phần thứ j của vectơ β −δ. Nếu ξj khác 0 thì εj là một biến ngẫu nhiên chuẩn.

(iii) Nếu Fj và εj là những biến ngẫu nhiên chuẩn và Var Fj=σ2j, Varεj =

η2j, khi đó vectơ β và các hằng số σj,ηj phải có mối liên hệ với nhau theo đồng nhất thức (2.39) ở dưới đây và đòi hỏi thêm điều kiện đối với

β sao cho một số thành phần của vectơa−ATβ vàβ −δ phải triệt tiêu.

Chứng minh

Áp dụng bổ đề 1.4 ta được:

E(Y −βTX)exp(itTX)=0. (2.35) Biểu diễn Y và βTX qua các biến cấu trúc F,ε0 và ε. Phương trình (2.35) tương đương với

E(aTF+ε0−βTAF−βTε)expitT(AF+ε) =0. (2.36) DoE(ε0/ε) =δTε nên (2.36) được viết lại

E[ (aT −βTA)F+ (δT −βT)εexpitT(AF+ε)] =0.

Gọiγj,ξj tương ứng là phần tử thứ j của vectơaT −βTAvàδT −βT, gọiαj là cột thứ j của ma trậnA, ta được E h ( r ∑ j=1 γjFj+ p ∑ j=1 ξjεj)ei(∑αTjtFj+∑tjεj)i=0. (2.37)

Ký hiệu hàm đặc trưng củaFjlà fj, củaεjlàgjvà đặtφj = f 0 j fj ,hj = g 0 j gj trong lân cận của điểm gốc.

Phương trình(2.37) rút gọn thành: r ∑ j=1 γjφj(αTj t) + n ∑ j=1 ξjhj(tj) =0, |t|<δ. (2.38)

Nếu γj 6=0, khi đó áp dụng bổ đề 1.6 chỉ ra rằng φj là một đa thức. Khi đó sử dụng lập luận quen thuộc, ta nhận được bậc củaφjcao nhất là một và biến ngẫu nhiên tương ứng là chuẩn (có thể suy biến). Tương tự nếuξj khác 0thì εj là chuẩn (có thể suy biến).

Nếu trong trường hợp khi Fj và εj là chuẩn ta đặt VarFj =σ2j,Var εj =η2j và ký hiệu ∑∗ là tổng lấy theo mọi j mà γj 6=0, ξj 6=0, khi đó, chúng ta thu được:

∗

∑γjσ2j(αTj t) + ∗

∑ξjη2jtj =0. (2.39) Ta chú ý rằng nếu γj =0thì Fj có thể là biến ngẫu nhiên bất kỳ và tương tự εj cũng vậy nếuξj=0.

Như vậy, chúng ta đã chứng minh xong điều kiện cần của định lý.

Điều kiện đủ được thiết lập bởi việc lập luận ngược lại nếu lưu ý rằng(2.38)

đúng với mọit thì Fj vàεj là chuẩn.

Định lý 2.19. Giả sử X =AF +ε là một mô hình phân tích nhân tố, ở đây rankA bằng số cột củaA. Xét biến ngẫu nhiênY =aTF+ε0 và giả sử tất cả các biến ngẫu nhiên là không suy biến và có kỳ vọng bằng0, biến ngẫu nhiên

ε0 độc lập với F vàE(ε0|ε) =δTε. Để hồi quy củaY đối vớiX là tuyến tính với mọia điều kiện cần và đủ là tất cả các thành phần của vectơ ngẫu nhiên

F vàε là chuẩn.

Chứng minh

Giả sửAlà một ma trận p×r, rank A=r, E(Y|X) =βTX, ở đâyβ phụ thuộc

vàoa. Phương trình(2.38)có thể viết:

r ∑ j=1 (aj−βTαj)φj(αTj t) + p ∑ k=1 (δk−βk)hk(tk) =0 (2.40) ở đâyα1, ...,αr là các cột củaA,ak,δk,βklà thành phần thứkcủa vectơa,δ,β tương ứng.

Giả sử rằng với mọi a:

aj =βTαj, j=1,2, ...,s<r (2.41) δk =βk, k=1,2, ...,m< p (2.42) Chúng ta có thể giả sử rằng s 6=r và m6= p. Khi đó dễ dàng suy ra từ bổ đề 1.6 rằng các ngẫu nhiênFs+1, ...,Fr vàεm+1, ...,εp là chuẩn.

Không mất tính tổng quát, trong trường hợpFi,vàεjcó phân phối chuẩn ta giả sử VarFi =σi2, Varεj =1. Lưu ý rằng trong trường hợp này φi(u) =−σi2u vàhj(u) =−u, có thể giản ước(2.40) dựa trên điều kiện (2.41) và (2.42) ta được: r ∑ j=s+1 σ2j(aj−βTαj)(αTj t) + p ∑ k=m+1 (δk−βk)tk =0 (2.43) Ký hiệuC là ma trận với các cộtαs+1, ...,αr vàDlà ma trận chéo với các phần tử trên đường chéo làσs2+1, ...,σr2 và vectơ ξ có các thành phần as+1, ...,ar. Với những ký hiệu này(2.43)có thể viết dưới dạng ma trận như sau:

βT(CDCT +I)t =ξTDCTt+δTt ⇔(CDCT +I)β =CDξ+δ (2.44) Do hạng của (CDCT +I)là pnên β là xác định duy nhất bởi (2.44)khiξ đã cho. Nhưng ngoài ra β phải thỏa mãn (2.41) với bất kỳ aj, j=1, ...,s. Điều này là không thể, nên s =0. Do vậy trong (2.40) các hệ số của φj(αTj t) là khác0với ít nhất một giá trị củaa. Từ đó, suy ra tất cả các thành phần của F là chuẩn.

Nếu ta bỏ điều kiện(2.41) thì(2.44) có thể viết

(ADAT +I)β =ADξ+δ (2.45) ở đây, ma trận đường chéo Dđược xây dựng bởi các phương sai của r thành phần củaF vàξ =a.

Từ(2.45)

β =δ+Aγ (2.46)

với mộtγ nào đó thích hợp. Vậy(2.45) có dạng:

(ADAT+I)Aγ =AD(ξ−ATδ) (2.47) Khiξinhận giá trị trên không gian p-chiều thì γ cũng vậy. Với mỗiγ, ta nhận được β theo (2.46). Nếu bây giờ βi=δi với mọi γ thì dòng thứ i của A phải là vectơ0. Do điều kiện của định lý2.19thì biểu thức (2.42) không thể thỏa mãn với mọia. Do đó, hệ số củahj(tj) trong(2.40)là khác 0với mọi j với ít nhất một giá trị củaa. Bởi vậy tất cả cácεj là chuẩn.

Định lý 2.20. Giả sửr=1,F chỉ có một thành phầnF1 và giả sửF1,ε1, ...,εp

vàε0 là những biến ngẫu nhiên độc lập và không suy biến (ε0 có thể suy biến). Để hồi quy củaY đối vớiX là tuyến tính (và không là hằng số) tức là

thì điều kiện cần và đủ làF1 và cácεi mà tương ứng vớiβikhác0là các biến ngẫu nhiên chuẩn.

Chứng minh

Phương trình(2.38) trong trường hợp này rút gọn thành:

(α1−γ1)φ1(α10t)−β1h1(t1)− · · · −βphp(tp) =0 (2.48) ở đâyβ1, ...,βp là các hệ số hồi quy không đồng thời bằng0. Khi đó α1−γ1 khác0, nếu không nó sẽ dẫn đến một sốεi suy biến, dẫn đến trái với giả thiết. Khi đó theo bổ đề 1.6, φ1 là tuyến tính và từ đóF1 là chuẩn. Nhưng khi đóhi là một hàm tuyến tính nếuβi6=0, dẫn đến εi cũng chuẩn.

Trong các định lý2.18-2.20, chúng ta đã xét một vài sự mở rộng của bài toán sau mà đã được đưa ra bởi Ragnar Frisch tại hội nghị Oxford của Hội kinh tế năm 1936.

"Giả sửX1 vàX2 là hai biến ngẫu nhiên có dạngX1 =au+v,X2=bu+w, ở đây u,v,w là các biến ngẫu nhiên độc lập. Với điều kiện nào thì hồi quy của

X1 đối vớiX2 là tuyến tính với mọiavàb?"

Bài toán này là trường hợp riêng của định lý2.18ứng với p=1. Nhưng chứng minh của định lý chỉ đúng cho p≥2, việc kiểm tra trường hợp p=1cần phải sử dụng một phương pháp đặc biệt. Sự giải quyết đó cũng đáng được quan tâm bởi vì nó chỉ ra rằng không nhất thiết các biến ngẫu nhiên u,v,w phải là chuẩn để cho hồi quy của X1 đối vớiX2 là tuyến tính.

Ta sẽ chỉ ra dưới đây điều kiện để hồi quy củaX1 đối vớiX2 sẽ là tuyến tính, không phải là cho tất cả các giá trị a và b mà cho một vài giá trị của những hằng số đó. Chúng ta cần sử dụng bổ đề sau đây.

Bổ đề 2.1. Giả sử f là hàm đặc trưng của một biến ngẫu nhiên không suy biến nào đó, thỏa mãn điều kiện:

f(t) = [f(β1t)]γ1 = [f(β2t)]γ2, t ∈R (2.49)

ở đây0<|βi|<1vàγi>0 với mọii=1,2. ĐặtBi=−log|βi|. Khi đó,

(i) Tồn tại hằng số thực λ sao choγ1|β1|λ =γ2|β2|λ. (ii) Nếu λ =2 thì f là hàm đặc trưng của luật chuẩn.

(iii) Giả sử 0<λ <2, nếu B1

B2 là vô tỷ, khi đó f là hàm đặc trưng của một

luật ổn định nếu β1 và β2 là dương và λ 6=1, và là một luật ổn định đối xứng nếuλ =1.

(iv) Giả sử 0<λ <2, nếu B1

B2 là hữu tỷ, khi đó f là hàm đặc trưng của luật

bán ổn định cho bởi (1.9).

Chứng minh

Định lý 1.1 đã chỉ ra rằng: nếu một hàm đặc trưng thỏa mãn phương trình: f(t) = [f(βt)]γ, 0<|β|<1, γ >0 (2.50) khi đó f là chia vô hạn và nếu λ là một nghiệm thực duy nhất của phương trình γ|β|λ =1, thì biểu diễn Levy L(µ,σ2,M,N) chologf có tính chất sau đây: (i) σ 6=0, M =N =0, nếuλ =2 (2.51) (ii)      σ =0, M(u) =ξ(log|u|)/|u|λ N(u) =−η(logu)/uλ nếu 0<λ <2, β <0 (2.52) ở đâyξ, η là những hàm không âm, liên tục phải trênRvà tuần hoàn với chu kỳB=−logβ, (iii)      σ =0, M(u) =ξ(log|u|)/|u|λ N(u) =−ξ(logu+B)/uλ nếu 0<λ <2, β <0 (2.53)

ở đây ξ là một hàm không âm, liên tục phải trên R, tuần hoàn với chu kỳ 2B=−2 log|β|.

Ta chứng minh khẳng định (i) của bổ đề. Lưu ý rằng nếu những hàm đặc trưng thỏa mãn (2.50) thì hàm phân phối tương ứng có các momen tuyệt đối mọi cấp nhỏ hơnλ (và không có moment bậcλ), ở đây λ xác định bởiγ|β|λ =1 (xem các bổ đề 1.1- 1.2). Vì f thỏa mãn(2.49) mà thực chất cũng như(2.50), mà đã được viết cho hai cặp giá trị (β,γ) nên những tính chất vừa được lưu ý ở trên của hàm phân phối ứng với hàm đặc trưng f thỏa mãn(2.50) sẽ dẫn tới:

γ1|β1|λ =γ2|β2|λ =1.

Khẳng định (ii) của bổ đề trên được suy từ biểu diễn Levy (2.51).

Chứng minh khẳng định (iii), chúng ta xét biểu diễn (2.52) và chú ý rằng hàm ξ tuần hoàn với hai chu kỳ B1,B2. Vì B1/B2 là số vô tỷ, tập các điểm

ξ(0). Do tính liên tục phải củaξ nên ξ là hằng số. Tương tựη cũng là hằng số. Từ (1.6) suy ra f là hàm đặc trưng của luật ổn định và logarit của nó cho bởi công thức (1.4|).

logf(t) =iαt−c|t|λn1+iδ 1

|t|tan 1 2π λ o nếuλ 6=1 (2.54) logf(t) =iαt−c|t|n1+i2δ π t |t|log|t| o nếu λ =1 (2.55) Thế (2.55) vào(2.49) đối với một cặp giá trị (β,γ), chẳng hạn (β1,γ1) ta sẽ đượcδ =0nếuλ =1, trong trường hợp này luật ổn định là đối xứng.

Hơn nữa, nếu một trong hai giá trị β1,β2 thậm chí là âm, khi đó biểu diễn Levy chologf được cho bởi(2.53), khi đó sử dụng những lập luận tương tự, chúng ta có thể chỉ ra rằng ξ và η là hằng số và hơn nữa chúng bằng nhau. Nhưng khi đó do (1.8) thì f là hàm đặc trưng của luật ổn định đối xứng. Chứng minh khẳng định (iv) của bổ đề. Ta chú ý rằnglogf có biểu diễn Levy hoặc dạng (2.52) hoặc dạng (2.53), phụ thuộc vào cả hai β1, β2 đều dương hoặc ít nhất một trong số chúng là âm. Việc rút gọn hàmξ vàη là không thể khiB1/B2 là hữu tỷ, chỉ có thể khẳng định chúng tuần hoàn với chu kỳρ phụ thuộc vàoB1 và B2.

Bây giờ, chúng ta trình bày và chứng minh định lý đặc trưng được suy ra từ bổ đề2.1.

Định lý 2.21. Cho X,Y và Z là các biến ngẫu nhiên không suy biến với kỳ vọng hữu hạn, không mất tính tổng quát ta giả sử tất cả các kỳ vọng bằng

0. Giả sử X độc lập với (Y,Z) vàE(Y|Z) =0. Khi đó các khẳng định sau là đúng:

(i) Để hồi quy của X+Y đối với aX+Z là tuyến tính với ít nhất hai giá trị của a: a=a1 và a=a2, sao cho |a1/a2| khác 1 thì điều kiện cần và đủ làX vàZ có phân phối bán ổn định.

(ii) Giả sử a1,a2 vàa3 là ba giá trị củaasao cho |a1|>|a2|>|a3|>0, giả sửβ1=a2/a1vàβ2=a3/a1,B1=−log|β1|,B2=−log|β2|. Để hồi quy củaX+Y đối vớiaX+Z là tuyến tính với ba giá trị củaa:a=a1,a2,a3

được chỉ ra ở trên thì điều kiện cần và đủ là

2. X và Z có phân phối ổn định đối xứng nếu β1 ≤0, β2 ≤0và B1/B2

là vô tỷ.

3. X vàZ có phân phối bán ổn định nếu B1/B2 là hữu tỷ.

Trong tất cả các trường hợp, số mũλ của các phân phối tương ứng thỏa mãn điều kiện1<λ ≤2.

Chứng minh

Chúng ta chứng minh điều kiện cần, điều kiện đủ dễ dàng kiểm tra. Giả sử

E(X+Y|aX+Z) =c(aX+Z)

Điều này kéo theo tồn tại hằng sốcsao cho:

E[(1−ac)X+Y −cZ|aX+Z] =0

Sử dụng những lập luận quen thuộc, ta nhận được

(1−ac)logf1(at) =aclogf2(t)với|t|<δ (2.56) ở đây f1 và f2 là những hàm đặc trưng củaX vàZ tương ứng.

Phương trình (2.56) có thể viết lại như sau logf2(t) = 1−ac

ac logf1(at),với|t|<δ (2.57) Ta chú ý rằng ở đâyc6=0vì nếu không thì X sẽ suy biến. Từ(2.57) được

f2(t) = [f1(at)]γ∗, |t|<δ,γ∗ = 1−ac

ac (2.58)

Lần lượt thay các giá trị a= a1 và a=a2 vào phương trình (2.58) ta nhận được + Vớia=a1 thì f2(t) = [f1(a1t)]γ1∗, |t|<δ,γ1∗ = 1−a1c a1c (2.59) + Vớia=a2 thì f2(t) = [f1(a2t)]γ2∗, |t|<δ,γ2∗ = 1−a2c a2c (2.60)

Từ phương trình (2.59) và (2.60) ta được

[f1(a1t)]γ1∗ = [f1(a2t)]γ2∗ (2.61) Trong phương trình (2.61), đặtβ =a2/a1 vàγ =γ1∗/γ2∗ ta được phương trình hàm của f1:

f1(t) = [f1(βt)]γ, 0<|β|<1, |t|<δ (2.62) Từ đó chúng ta nhận thấyγ >0và (2.62) thỏa mãn với mọi số thựct. Từ đó, f1là hàm đặc trưng của luật nửa ổn định, tương tự f2 cũng vậy. Do vậy, khẳng định (i) được chứng minh.

Chứng minh khẳng định (ii) chúng ta thay thế a1,a2,a3 cho a trong (2.58), chúng ta nhận được phương trình:

f1(t) = [f1(β1t)]γ1 = [f1(β2t)]γ2 (2.63) Từ đây, với sử dụng kết quả của bổ đề 2.1 ta suy ra tất cả các khẳng định của (ii).

Vì các momen đầu của các biến ngẫu nhiên đang xét tồn tại, số mũ λ của phân phối thỏa mãn bất đẳng thức 1 <λ ≤ 2. Với λ >2 phân phối là suy biến.

Định lý được chứng minh.

Bây giờ, ta xét hai biến ngẫu nhiên độc lập X vàY. Chúng ta xác định điều kiện để hồi quy của X+Y đối với aX+Z là tuyến tính với hai hoặc ba cặp giá trị(a,b).

Định lý 2.22. Giả sử X vàY là hai biến ngẫu nhiên độc lập với EX và EY

hữu hạn, không mất tính tổng quát ta giả sử các kỳ vọng đó bằng 0. Khi đó các khẳng định sau là đúng:

(i) Để hồi quy của X +Y đối với aX+bY là tuyến tính với hai cặp giá trị

(a,b): (a1,b1), (a2,b2) với điều kiện |a1b2/a2b1| 6=1 thì điều kiện cần và đủ làX vàY có phân phối bán ổn định.

(ii) Giả sử (a1,b1), (a2,b2) và (a3,b3) là ba cặp giá trị của (a,b) sao cho

∏

i=1

aibi6=0,|a1/b1|<|a2/b2|<|a3/b3|,β1=a1b2/a2b1vàβ2=a1b3/a3b1