T ẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 528.2008TUY ẾN TÍNH ON THE RESIDUAL PARTS OF THE LINEAR REGRESSION EQUATIONS CAO VĂN NUÔI Trường Đại học Sư phạm, Đại học Đà Nẵng
Trang 1T ẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 5(28).2008
TUY ẾN TÍNH
ON THE RESIDUAL PARTS OF THE LINEAR REGRESSION
EQUATIONS
CAO VĂN NUÔI
Trường Đại học Sư phạm, Đại học Đà Nẵng
CAO NGỌC CHÂU
Học viên cao học khoá 2005-2008
TÓM T ẮT
Bài báo trình bày ph ương pháp tìm phân ph ối của phần dư trong phương trình hồi quy tuy ến tính Các kết luận trong bài báo được chứng minh một cách chi tiết Khi biết được phân ph ối của phần dư trong phương trình hồi quy tuyến tính, người ta đánh giá được sai số của dữ liệu đầu ra và hiểu rõ thêm quy luật phân phối của phần dư Vì vậy, phân
ph ối của phần dư trong phương trình hồi quy tuyến tính là rất quan trọng
ABSTRACT
This paper presents on the distributions of the residual parts of the linear regression equations The results in this paper proved in detail If we known the distribution of this residual parts then we can estimate errors of output data and to study the distributions
of this residual parts of the linear regression equations So, the distributions of residual
parts of the linear regression equation is the most importance
1 Khái ni ệm
Định nghĩa 1.1 Nếu Z , Z , , Z là các bi1 2 n ến ngẫu nhiên chuẩn tiêu chuẩn độc lập thì
X được xác định bởi
X=Z +Z + + Z ,
được gọi là có phân phối khi-bình phương với n b ậc tự do và ký hiệu:
2 n
X ~χ
Thông thường ta ký hiệu E( ), V( )ξ ξ lần lượt là kỳ vọng và phương sai của đại
lượng ngẫu nhiên ξ
Định nghĩa 1.2 Một đại lượng ngẫu nhiên ξđược gọi là chuẩn hoá, nếu E( ) 0ξ = và
V( ) 1.ξ = M ọi đại lượng ngẫu nhiên (khác hằng số, tức là P(ξ ≠C) 1= ) đều có thể đưa
v ề dạng chuẩn hoá bằng cách đặt
E( )
V( )
ξ − ξ
ξ =
ξ
Trang 2Trong khuôn khổ bài báo này ta xét phương trình hồi quy tuyến tính có dạng:
Y= α +β + ε x , trong đó : x là biến độc lập;
Ylà biến ngẫu nhiên phụ thuộc vào biến độc lập x;
,
α βgọi là các tham số hồi quy;
ε gọi là sai số ngẫu nhiên và giả thiết E( )ε =0
Với mẫu hai chiều (x , Y ), ii i =1, , n cỡ mẫu n ta có:
Y= α +β + εx , i=1, n
với ε là sai si ố ngẫu nhiên
Ta xét trong trường hợp các ε thoã mãn các i điều kiện sau:
a) E( )ε =i 0,∀ =i 1, n
b)
2 2
i j E( )
0
σ
ε ε = σ =
i j
i j
=
≠
nÕu nÕu
c) εi ~(0,σ2), ∀ =i 1, n
2 Phân phối của phần dư
Bổ đề 2.1 [2] Cho X= +Y K v ới giả thiết X là đại lượng ngẫu nhiên có phân phối
2
n
χ , K là đại lượng phân phối 2
1
χ ; và Yvà K là độc lập Khi đó, Y có phân ph ối
2
n 1 −
χ
Bổ đề 2.2 [2] Cho Z , , Z là các bi1 n ến ngẫu nhiên chuẩn tiêu chuẩn độc lập và X là đại lượng ngẫu nhiên được xác định bởi 2 2 2
X=Z +Z + + Z , i=1, n thì:
a) E(X)=n
b) V(X)=2n
Bổ đề 2.3 [2] Nếu (X , , X ) là m1 n ẫu ngẫu nhiên sinh ra bởi phân phối chuẩn có
2
E(X )= µ, V(X )= σ , i=1, n; thì:
a)
2 E(X) , V(X)
n
σ
b)
2 2
n 1 2
(n 1)s
~ −
σ
trong đó n Xi
X=∑ và
n
2 i
2 i 1
(X X)
−
=
−
∑
Trang 3T ẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 5(28).2008
Định lý 2.1 Giả sử rằng đầu ra Y , ii =1, , n là các bi ến ngẫu nhiên chuẩn độc lập có
i
E(Y )= α + β và x ( ) 2
i
V Y = σ ∀ =, i 1, n v ới A và Bl ần lượt là ước lượng bình phương
bé nh ất của α vàβ thì:
i 1
n 2 2
(Y A Bx )
=
−
− −
χ σ
∑
2
Từ đó suy ra,
i)
2 2
(Y x ) (Y Bx ) n(B ) x
= − α − β = − α − − β
ii)
2
(Y Bx ) (Y Bx A) n(A )
* Bây giờ ta sẽ chứng minh i)
Từ phương trình Y= α + β + εx (2.1)
trong đó A là ước lượng của α
Lấy (2.2) – (2.1) vế theo vế ta được:
(1) (1)
− α + ε − ε =
Mà E(A− α = ⇒) 0 E(ε − ε = ⇒ ε(1) ) 0 E( (1))+ ε E( )
Bây giờ, ta đặt: Z=Yi− α ⇒ =Z Yi− α =Yi− α = α +Bxi− α =Bxi
Suy ra i) được chứng minh
* Để chứng minh ii) ta đặt: T=Yi−Bxi
Vậy ii) được chứng minh
Từ Y là các bii ến ngẫu nhiên chuẩn độc lập nên ta có: i [ ]i
i
(Y E Y )
, i 1, , n
V(Y )
−
=
Suy ra,
n 2
i
(Y E[Y ] (Y x )
~ V(Y )
= − = − α − β
σ
Trang 4Từ i) có:
n
i 1
n 2
(Y x )
~
= − α − β
χ σ
và
2 2
2 i 1 2
n(B ) x
~ ,
σ
kết hợp với bổ đề 2.1 suy ra:
i 1
n 1 2
(Y Bx )
~
=
−
− − α
χ σ
∑
1 2
~ ,
σ Suy ra,
i 1
n 2 2
(Y A Bx )
~
=
−
− −
χ σ
∑
Vậy định lý được chứng minh hoàn toàn
Định lý 2.2 Giả sử đầu ra Y , ii =1, , n là các bi ến ngẫu nhiên chuẩn độc lập có
i
E(Y )= α + β và x ( ) 2
i
V Y = σ ∀ =, i 1, n v ới A và Bl ần lượt là ước lượng bình phương
bé nhất của α vàβ thì:
a)
i 1
2
(Y A Bx )
− −
= −
σ
b)
i 1
2
(Y A Bx )
V = 2(n 2)
− −
σ
∑
Chứng minh
a) Từ định lý 2.1.có:
i 1
n 2 2
(Y A Bx )
~
=
−
− −
χ σ
∑
Nghĩa là,
i 1
2
(Y A Bx )
σ
∑ có phân phối khi bình phương với n 1− bậc tự do,
nên theo bổ đề 2.2 ta có:
i 1
2
(Y A Bx )
− −
= −
σ
b) Từ bổ đề 2.1 có: với 2
n
X ~χ thì V(X)=2n,
Từ định lý 2.1 ta có:
i 1
n 2 2
(Y A Bx )
~
=
−
− −
χ σ
∑
Suy ra,
Trang 5T ẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 5(28).2008
i 1
2
(Y A Bx )
V = 2(n 2)
− −
σ
∑
Vậy định lý được chứng minh
TÀI LI ỆU THAM KHẢO
[1] William Feller, An Introduction to Probability Theory and Its Application, New
York-Chichester-Brisbane-Toronto, Singapore, 1971
[2] Shedon M Ross, Introduction to prabbility and statistics for engineers and
scientists, New York-Chichester-Brisbane-Toronto, Singapore, 1987