m Tính toán và giải thích được hàm tương quan tuyến tính đơn biên m Thông hiểu được các giả thuyết khi xây dựng hàm tương quan m Biết được cách kiểm định trong hàm tương quan... = Hệ
Trang 1PHAN TICH TUONG QUAN VA
Trang 2m Xác định mức độ tin cậy thống kê của hệ số tương quan
m Tính toán và giải thích được hàm tương quan tuyến tính đơn biên
m Thông hiểu được các giả thuyết khi xây dựng hàm tương
quan
m Biết được cách kiểm định trong hàm tương quan
Trang 34 2) Sơ đồ phân tán và hệ số tương quan
= So dé phan tan thể hiện mối quan hệ giửa hai
biên
Phân tích hệ số tương quan dùng để đo lường mối
quan hệ đồng hành giửa hai biến
= Hệ số tương quan không thê hiện mối quan hệ nhân quả
Trang 4So do phan tan (scatter plot)
Trang 5So do phan tan (scatter plot)
Trang 6ơ đồ phân tan (scatter plot)
Trang 7{ 2) Hệ số tương quan
(continued)
„ Hệ số tương quan của đám đông ký hiệu là p
(rho) thê hiện sự đông hành của hai biên
= Hệ sô tương quan của mâu r dùng ước lượng cho
rho và nó thê hiện tương quan tuyên tính dựa trên
các phân tử quan sát được từ mâu
Trang 8, 2 Đặc điêm của p and r
= Không có đơn vị đo lường
„ Biến động trong phạm vi -1 val
„ Càng gần -l, mối quan hệ nghịch biến càng cao
„ Càng gần +1, mỗi quan hệ đồng biến càng cao
„ Càng gần 0, mối quan hệ tuyến tính càng yếu
Trang 9a 4) Mot so vi du vé cac gia tri cua r
Trang 10x = các giá trị của biến độc lập
y = Các giá trị của biến phụ thuộc
Trang 11a Vị dụ
Trang 13
2 Excel Output
Excel Correlation Output
Tools / data analysis / correlation
Trang 14Kiém định mức ý nghĩa của hệ số tương
Trang 16à Example: Test Solution
Trang 174 2 Mô hình hồi quy tuyến tính giản đơn
„ Chỉ có một biến đôc lập: x
„ Mối quan hệ giửa x và y là quan hệ tuyến tính
= Su thay đổi của y được giả định là do sự thay đôi của x
Trang 18Quan hệ phi tuyến
Các mô hình thê hiện môi quan hệ
Trang 194 2) Ham tuong quan cua dam dong
Trang 20| 2 Các giả thuyết của hàm tương quan
m Cac sai lệch ngau nhiên hoàn toàn độc lập với nhau
vê phương diện thông kê
=m Các sai lệch ngâu nhiên có phân phôi chuân
= Phân phôi xác suât của các sai lệch ngâu nhiên có phương sai không đôi
„ Quan hệ giửa x và y là quan hệ tuyến tính
Trang 21Hàm tương quan tuyến tính của dam
Trang 22Hàm tương quan ước lượng của mâu
Hằng số ước
Giá trị ước tượng của ham L số sóc ước
lượng/dự đoán tương quan lượng
Trang 23Tiêu chuẩn bình phương bé nhất (Least
4 2 Squares Criterion)
= by va b, duoc tinh toan theo tiéu chuẩn tổng bình
phương bé nhât của phân du (residuals)
we =D
= » - (bạ +b,Xx)Ý
Trang 24Hệ sô của hàm tương quan theo tiêu
| 2) chuan tong binh phuong bé nhat
Trang 25Yù nghĩa của hệ sô góc và hăng sô
a của hàm tương quan
a by la gia tri trung bình của y khi x nhận giá trị bằng 0
= b, là sự thay đối theo ước lượng của giá trị trung bình của y mỗi khi x thay đổi một đơn
VỊ.
Trang 26cá 2 Vi du vé ham tuog quan gian don
„ Một nhà buôn bất động sản tiến hành khảo sát mối
quan hệ giửa giá bán căn hộ và diện tích căn hộ (đo
lường băng m
= Mot mau gom 10 căn hộ được chọn ra
„ Biến phụ thuộc (y): Giá bán căn hộ (1000USD)
Biến độc lập (x): Diện tích
be |
""
ApS |?
Trang 272 Gia tri cac quan sat
Trang 28
Sử dụng excel để xây dựng hàm tương
Trang 29Multiple R 076211 The regression equation is:
Residual 13665.5652 1708.1957
Total 9 32600.5000
Coefficients \$tandard Error t Stat P-value Lower 95% Upper 95% Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Square Feet 0.10977 ) 0.03297 3.32938 0.01039 0.03374 0.18580
Trang 30
- house price= 98.24833+ 0.10977(square mefer)
[es foo | use price = 98 : qu
Trang 31
d 4) Giải thích ý nghĩa của hăng sô bạ
m Trong trường hợp này, không có giá tri x nào nhận
giá trị 0, cho nên bạ = 98.24833 thể hiệh giá nhà
không được giải thích bởi số lượng met vuông
Trang 32a 4) Giải thích ý nghĩa của hệ số góc bạ
m Trong trường hợp này bị = 10977 chỉ ra
rằng giá trung bình của can hộ sẽ gia tăng
0.10977 đơn vị ($1000) khi số met vuông
Trang 33Vay VQIŒVC U ULE vVud 1IQŒI11 LUVULLE yualt theo phương pháp bình phương bé
4 2) nhat
=» Tong gia tri cua phan dw (residual) phai bằng 0 > (y-)=0
= Tông bình phương của phân dư phải cực tiêu » (y _?)?
= Duong thê hiện hàm tương quan phải di qua diém thê hiện
gia tri trung bình của x và y
„_ Hệ số của hàm tương quan phải ước lượng không chệch
cho fy va ÿ¡
Trang 34Biến thiên giải thích được và không giải
Tổng biến Tổng biến thiên Tổng biến thiên
thiên có thể giải thích của sai
Trang 35Biến thiên giải thích được và không giải
Trang 36Hệ số xác định R2(coefficient of
„ Hệ số xác định thê hiện tỷ trọng của tổng biến thiên
của biên phụ thuộc có thê giải thích được bởi biên thiên của biên độc lập
„ Hệ số xác định được gọi là R bình phương (R?)
Trang 37Hệ sô xac dinh R?
(continued)
Chú ý: Trong trường hợp của hàm tương quan 1 biến, hệ số xác định
nầy bằng bình phương của hệ số tương quan
Trang 38
Vị dụ về các tình huông đặc biệt của
y
Quan hệ tuyến tính hoàn hão giửa x và y : 100% tổng biến R2=1 thiên của y được giải thích
bang bién thiên của x
x
R? = +1
Trang 39Vi dụ về các tình huống đặc biệt của
2
© 0<R2<1
ee ° Mối quan hệ tuyến tính yếu:
© — wiột bộ phận biến thiên của y
được giải thích bằng biến thiên của x
Trang 40Vi dụ về các tình huống đặc biệt của
R2=0
Không có môi quan hệ tuyên tính giửa x và y
Trang 41Kết quả trên Excel
52842 58.08% of the variation in Standard Error 41.33032 house prices is explained by Observations - 10_ variation in square feet
pO)
Trang 424 2) Độ lệch tiêu chuân của ước lượng
„ Độ lệch tiêu chuẩn của biến thiên của biến phụ thuộc
xoay quanh đường tương quan được ước lượng bởi côg thức
Trang 43Độ lệch chuân của hệ sô góc của 2) — hảm tương quan
„ Độ lệch chuẩn của hệ số góc của hàm tương quan (b¡) được tính theo công thức sau:
Trang 44Residual 13665.5652 1708.1957
Total 32600.5000
Coefficients | Standard Error t Stat P-value Lower 95% Upper 95% Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Trang 45
So sánh sai lệch chuân của ước lượng
Biến thiên của giá trị quan sát y
khỏi đường tương quan
và của hệ sô góc của hàm tương quan
Biến thiên của hệ số góc của đường
tương quan từ các mâu khác nhau
small s,, x
large s,,
Trang 46Kiêm định t cho hệ sô góc với hàm
q 4) tương quan một biên
„ Kiểm định t
„ Có mối quan hệ tuyến tính gitra x và y hay không?
Thiết lập giả thuyết
= Hy: B, =0
= H,: B, 0 Test statistic
Trang 47
Inference about the Slope:
Trang 48›) Kiêm định t cho hệ số sóc
S
Họ: Bị =0 From Excel output: Dạ 5 bạ :
Hạ: B z0 Coefficients | Standard Error | tStat | P-value
diện tích căn hộ tác động đên
giá bán affects house price
Réject Hp
Trang 492 IPhân tích mô tả với hàm tương quan
Khoảng ước lượng của hệ sô góc
Excel Printout for House Prices:
Intercept 98.24833 58.03348| 1/69296| 0.12892| -35.57720| 23207386 Square meter ( 0410977] 0.03297 | 3.32938| 0.01039| (~ 0.03374 |) ( 0.18580 |
Trang 50ÀjPhân tích mô tả với hàm tương quan
>
Intercept 98.24833 58.03348| 1.69296 | 0.12802| -35.87720| 23207386 Square meter ( 0.10977 0.03297| 3.32938| 0.01039| (~ 0.03374 |) ( 0.18580 |
Since the units of the house price variable is
$1000s, we are 95% confident that the average
impact on sales price is between $33.70 and
$185.80 per square meter of house size
This 95% confidence interval does not include 0
Conclusion: There is a significant relationship between
house price and square feet at the 05 level of significance
Trang 512) Residual Analysis
=» Purposes
» Examine for linearity assumption
» Examine for constant variance for all levels of x
=» Evaluate normal distribution assumption
= Graphical Analysis of Residuals
= Can plot residuals vs x
= Can create histogram of residuals to check for normality
Trang 52a Residual Analysis for Linearity
Trang 53Residual Analysis for