Thực chất của ph−ơng pháp bình ph−ơng nhỏ nhất là sau khi tịnh tiến hệ trục toạ độ tới điểm

Một phần của tài liệu Đề cương bài giảng Lý thuyết xác suất Thống kê (Trang 49 - 50)

(EY, EX1, ..., EXk)∈ Rk+1, Yˆ là phép chiếu vuông góc Y xuống L2(X1, ..., Xk)). Suy ra, nh− đ1 biết trong lí thuyết về không gian Hilberthệ số t−ơng quan chẳng qua là côsin của góc giữa hai véc tơ, hệ số t−ơng quan bội bằng căn bậc hai của hệ số xác định

R=√R2. R2.

Trong ví dụ của chúng taR=√

0.8652 = 0.93.

Khi khảo sát mối t−ơng quan ta tính hệ số t−ơng quan giữa các đại l−ợng ngẫu nhiên, chẳng hạn ̺ij = ̺ij(Xi, Xj). Đó là độ đo toàn phần mối t−ơng quan giữa chúng (có kể đến mối quan hệ thông qua các biến ngẫu nhiên khác: X1, ..., Xk). Nh− trên ta biết rằng có thể phân tích một đại l−ợng ngẫu nhiên thành tổng của hai đại l−ợng ngẫu nhiên không t−ơng quan (chiếu vuông góc xuốngL2(X2, ..., Xk))

Y = ˆYY′2...k+ (Y −YˆY′2...k) = ˆYY′2...k+ηY′2...k, X1= ˆX1+ (X1−Xˆ1) = ˆX1+η1′2...k

Có thể coiηY′2...k=Y−YˆY′2...klà phần còn lại củaY sau khi đ1 loại đi các tác động tuyến tính củaX2, ..., Xk

vào Y. T−ơng tựη1′2...k =X1−Xˆ1 là phần còn lại của X1 sau khi đ1 loại đi các tác động tuyến tính của

X2, ..., Xk vàoX1. Khi đó hệ số t−ơng quan giữa hai phần d−ηY′2...k =Y −YˆY′2...k vàη1′2...k=X1−Xˆ1

đ−ợc gọi làhệ số t−ơng quan riêng(mối quan hệ nội tại, không phụ thuộc vào các đại l−ợng ngẫu nhiên khác:

X2, ..., Xk) giữaY vàX1. Kí hiệu̺Y.1=̺(ηY′2...k, η1′2...k).

Quay trở lại ví dụ trên, ta tính hệ hệ số t−ơng quan riêng giữa l1i suất (Y) và số văn phòng giao dịch đ−ợc mở ra (X2). Ta lập bảng sau mà các cột dữ liệu là hồi quy củaY theoX1 và hồi quy củaY theoX2.

STT ηY′2...k η1′2...k=X1−Xˆ1 STT ηY′2...k η1′2...k =X1−Xˆ1 1 0.086830251 -53.63957787 14 0.153152011 -451.2549257 2 -0.005600136 9.06929472 15 0.109917223 -298.5076835 3 -0.104647917 263.1517884 16 0.045286765 -318.2055251 4 -0.196930487 540.9815244 17 0.042199793 -269.3374194 5 -0.10862179 501.2947138 18 0.112643243 -343.9748293 6 -0.080165276 371.7287666 19 -0.030295912 -219.9858604 7 -0.013252248 174.5968723 20 0.06323451 -184.4913759 8 -0.034795734 65.03092506 21 0.028751869 -156.0683541 9 0.152265111 -186.980106 22 -0.141543765 288.6899192 10 0.072265111 -183.980106 23 -0.022939434 383.2448354 11 0.007339019 -223.9196743 24 -0.059556828 538.6184565 12 0.049325955 -427.991137 25 -0.197717709 563.4261304 13 0.072856378 -381.4966525

Hệ số t−ơng quan riêng giữa l1i suất (Y) và số văn phòng giao dịch đ−ợc mở ra (X2) khi đó bằng̺Y.1 = −0.85617. (Sử dụng lệnhCORREL).

Bình ph−ơng hệ số t−ơng quan riêng(−0.85617)2= 0.73, vậy 73% phần biến động của l1i suất (Y) đ−ợc giải thích bởi sự phụ thuộc tuyến tính (tỉ lệ nghịch) vào số l−ợng văn phòng giao dịch đ−ợc mở.

T−ơng tự hệ số t−ơng quan riêng giữa l1i suất (Y) và (X1) bằng̺Y.2= 0.6731. (Tỉ lệ thuận). Ta cũng có thể tính t−ơng quan riêng giữa lMi suất (Y) và (X1) bằng cách sử dụng các công thức (??-??)

̺01.(23...n)= −C10 √

C00C11

=√ 5.929936871

3.10432981ì25 = 0.673126. Khoảng tin cậy và kiểm định giả thiết cho các tham số của hồi quy.

Các vấn đề về khoảng tin cậy và kiểm định giả thiết cho các tham số của hồi quy dựa trên định lí sau

Định lí 13

Với các giả thiết nh− trong định lí 12, đồng thời giả thiết thêm rằng rằng các số hạng sai sốεi có phân bố chuẩn. Kí hiệusbk, sbk−1, ..., sb2, sb1sa là các sai số chuẩn của các hệ số hồi quybk, bk−1, ..., b2, b1, a, khi đó

ta =a−α sa

, tbi =bi−βi

sbi

, i= 1,2, ..., k

là các đại l−ợng ngẫu nhiên có phân bố Student vớin−k−1bậc tự do. Chẳng hạn trong ví dụ l1i suất của các công ty tài chính, với độ tin cậy 99%

0.081< β2<0.394, −0.000339< β1<−0.000159.

(sb1tǫ−b1β1sb1tǫ+b1, tǫ=t0.01= 2.81876, sb1= 3.2ì10−5, b1=−0.000249)

Do mẫu hồi quy nhiều chiều (adsbygoogle = window.adsbygoogle || []).push({});

E(Yi/X1=x1i, X2=x2i, ..., Xk =xki) =α+β1x1i+β2x2i+...+βkxki, i= 1,2, ..., n.

Suy ra

E(Yi/X1=x1i+ 1, X2=x2i, ..., Xk =xki)−E(Yi/X1=x1i, X2=x2i, ..., Xk =xki) =β1

Nghĩa là trong ví dụ đ1 nêu nếu số văn phòng giao dịch tăng thêm 1000, (với tổng thuX1 không đổi), khi đó tỉ lệ l1i suất hàng năm giảm từ0.159tới0.339.

Một phần của tài liệu Đề cương bài giảng Lý thuyết xác suất Thống kê (Trang 49 - 50)