Dùng CORREL trong Excel, xác định hệ số tương quan tuyến tính rgiữa tổng chi tiêu dùng cho chăm sóc sức khỏe EXPHLTH và tổngthu nhập cá nhân INCOME... Hãy cho biết có mối tương quan tuyế
Trang 1KINH TẾ LƯỢNG ỨNG DỤNG
BÀI TẬP 1
Bài 1 (BT2-Fullright)
Câu 1: (Dữ liệu AM06-PS2-sheet 1)
EXPHLTH: Tổng chi tiêu dành cho chăm sóc sức khỏe (tỷ USD)INCOME: Tổng thu nhập cá nhân (tỷ USD)
1a Vẽ đồ thị phân tán (Scatter Diagram) cho tập dư liệu trên Dùng trục hòanh cho biến INCOME và trục tung chobiến EXPHLTH.
Dựa vào dữ liệu AM06-PS2- sheet 1, ta có Đồ thị phân tán sau:
1b Tính các trị thống kê tổng hợp cho biến lương biến INCOME VÀ EXPHLTH.
Đặt EXPHLTH là Y và INCOME là X, ta có:
Đồng phương sai
Cov (X,Y) = (1/n-1) * ∑(Xi - ) (Yi - )
Cov (X,Y) = (1/ 51-1) * 111190.066 = 2223.801
1c Dùng CORREL trong Excel, xác định hệ số tương quan tuyến tính (r)giữa tổng chi tiêu dùng cho chăm sóc sức khỏe EXPHLTH và tổngthu nhập cá nhân INCOME
Trang 2-= - * -= 15.068863 – (0.141652 * 105.1333) -= 0.176496
TSS= ∑Yi2 – n *( )2 = 27648.816 – 51*(15.069)2 = 16068.214
ESS = 2*∑xi2 = 2*∑(Xi- )2 = (0.141652)2 * (784951.293) = 15750.275
RSS= TSS- ESS = 16068.214 - 15750.275 = 317.940
Hệ số xác định R2 = ESS/ TSS = 15750.275 / 16068.214 = 0.9802132
Hệ số tương quan:
r= ±√R2 = ±√0.9802132 = ± 0.9900584
Ý nghĩa:
a) r và có cùng dấu , do đó r=0.9900584
b) >0 và r >0, nên X và Y có quan hệ đồng biến, hay tổng thunhập cá nhân tăng thì tổng chi tiêu dành cho chăm sóc sứckhỏe tăng
1d Hãy cho biết có mối tương quan tuyến tính giữa tổng chi tiêu dùng cho chăm sóc sức khỏe EXPHLTH và tổng thu nhập cá nhân
Gọi là hệ số tương quan tuyến tính giữa tổng chi tiêu dành chochăm sóc sức khỏe và tổng thu nhập cá nhân
Đặt giả thiết X và Y có mối tương quan tuyến tính
H0: = 0
H1: # 0
Tại 1c, Ta đã có r = 0.9900584
Tính t0 = r / √[ (1-r2) / (n-2)] = 0.9900584 /√[(1- 0.99005842)/49]= 49.2717867Với =5%, /2= 0.025, tra bảng tn-2, /2= t49,0.025= 2.010
Vì t0 > t49,0.025 nên tổng chi tiêu dùng cho chăm sóc sức khỏe EXPHLTHvà tổng thu nhập cá nhân INCOME có mối tương quan tuyến tính ởmức ý nghĩa =5%
Câu 2 (Dữ liệu AM06-PS2-sheet 2)
CPI: chỉ số giá tiêu dùng
NYSE: chỉ số chứng khóan trên thị trường chứng khóan New York T: thời kỳ 1977~1991
2a Vẽ đồ thị phân tán (Scatter Diagram) cho tập dư liệu trên Dùng trục hòanh cho biến CPI và trục tung cho biến NYSE.
Dựa vào dữ liệu AM06-PS2-sheet 2, ta có Đồ thị phân tán sau:
Trang 3đồng biến.
Sử dụng Excel/ Graph/ Scatter XY
2b Anh Vũ đề nghị mô hình hồi quy tuyến tính
Trang 4-Năm NYSE CPI
Cách 2: Dùng các lệnh SLOPE và INTERCEPT trong Excel
Excel = SLOPE (Y, X) = = 2.1294425
Excel = INTERCEPT (Y, X) = = -102.06055
Trang 5Cách 3: Dùng công cụ DATA ANALYSIS trong Excel
Series1 Linear (Series1)
2c Viết phương trình hồi quy ước lượng của mô hình trên:
2d Xác định mối quan hệ tuyến tính có ý nghĩa về mặt thống kê
Đặt giả thiết, CPI(X) và NYSE(Y) không có mối quan hệ tuyến tínhvề mặt thống kê (X không ảnh hưởng đến Y)
H0: = 0
5
Trang 6-H1: # 0
Tại 2b, Ta đã có p-value = 4.43E-07= 0.0443% <5%, bác bỏ giả thiết H0.
Do đó, CPI và NYSE có mối quan hệ tuyến tính về mặt thống kê.(Thừa nhận X có ảnh hưởng đến Y)
TSS= ∑(Yi - )2 = 38782.03
ESS = 2*∑xi2 = (2.1294425)2* 7423.924 = 33663.97
RSS= TSS- ESS = 38782.03 - 33663.97 = 5118.06
Hệ số xác định R2 = ESS/ TSS = 33663.97 / 38782.03 = 0.86803 = 86.8%
Ý nghĩa: Hệ số xác định R2 [0,1], xác định mức độ thích hợp củamô hình hồi quy, có nghĩa là 86.8% sự thay đổi của NYSE đựơc giảithích bởi CPI
2f Vẽ đồ thị của đại lượng sai số ut, với ut trên trục tung, thời gian(năm) trên trục hòanh)
Tính phần dư, thay từng giá trị Xi vào hàm hồi quy SRF để tính
Hàm hồi quy = -102.06055 + 2.1294425 Xi
Sử dụng Excel/Graph
Câu 3
GNP bình quân đầu người (GNPKAP) (tính theo USD)
Tỉ lệ học sinh cấp hai (EDUC)
Các trị thống kê
Trang 7Mô hình 1: EDUCi = + *GNPKAPi + êi
Mô hình 2: GNPKAPi = + * EDUCi + i (tác động của EDUC đối vớiGNPKAP)
Xác định hệ số độ dốc ( ) và tung độ gốc ( ) sử dụng trong môhình 2
Đặt GNPKAP là Y và EDUC là X, ta có:
Trang 8-Bài 2 (BT3-Fullright)
Câu 1 (Dữ liệu AM06-PS2-sheet 2) chuyển qua Eview
CPI: chỉ số giá tiêu dùng
NYSE: chỉ số chứng khóan trên thị trường chứng khóan New York T: thời kỳ 1977~1991
1a Tính các trị thống kê tổng hợp cho biến lương biến NYSE và CPI.
Eview: Group Statistics / Decriptive Statistics / Common sample
Dependent Variable: NYSE
Method: Least Squares
Trang 9CPI 2.129443 0.230284 9.247018 0.0000
Dựa vào bảng kết quả hồi quy trên, ta có phương trình hồi quytuyến tính:
NYSEt = -102.0606 + 2.129443 CPIt + ut
Chuyển số liệu sang Eview: Quick / Estimate Equation / nyse c cpi
1d Xác định khỏang tin cậy 95% cho hệ số độ đốc ()
Mức ý nghĩa = 5% , /2 = 0.025
Tra bảng t-student tn-2, /2 =t13,0.025 = 2.16
Để xác định khỏang tin cậy cho hệ số độ dốc , ta phải so sánhnhư sau:
9
Trang 10-1e Vẽ đồ thị của đại lượng sai số u t theo CPI t (với t trên trục tung)
Câu 2: (Dữ liệu Gujarati 4 – Table 6.4)
CM: số trẻ sơ sinh tử vong trên 1000 trẻ sơ sinh
PGNP: GNP bình quân đầu người (USD)
Chuyển dữ liệu sang phần mềm Eview
2a Viết phương trình hồi quy tổng thể (PRF)
CMi = + PGNPi + ui
Bằng trực quan, kỳ vọng dấu của hệ số độ dốc trong phương trìnhhồi quy là dấu (-) vì 2 biến này có mức độ tương quan nghịch nhau,không thể đồng nhau Vì nếu xét PGNP là biến độc lập, CM là biếngiải thích thì khi PGNP tăng (hoặc giảm) dẫn đến CM cùng tăng(hoặc giảm) gây ra tình trạng không hợp lý với thực tế Trong thựctế không có tình trạng GNP bình quân đầu người tăng sẽ dẫn đếnsố trẻ sơ sinh tử vong tăng
2b Ước lượng phương trình hồi quy.
Nhận xét: Nhìn vào đồ thị
ta thấy các giá trị u^t dao động xung quanh đường t =0, khi CPI tăng, lúc đầu các giá trị t giảm dần, sau đó tăng dần
Số liệu chuyển từ Excel sang Eview: View / Graph / Scatter / Scatter with Regression
Trang 11R-squared 0.166217 Mean dependent var 141.5
Sử dụng Eview : Quick / Estimate Equation / cm c pgnp
Dựa vào bảng kết quả này, ta nhận đựơc phương trình hồi quy:
2c
Xác định mối quan hệ tuyến tính có ý nghĩa về mặt thống kê
Đặt giả thiết, PGNP(X) và CM(Y) không có mối quan hệ tuyến tínhvề mặt thống kê (X không ảnh hưởng đến Y)
H0: = 0
H1: # 0
Tại 2b, Ta đã có p-value = 0.0008 <5%, bác bỏ giả thiết H0.
Do đó, CM và PGNP có mối quan hệ tuyến tính về mặt thống kê.(Thừa nhận X có ảnh hưởng đến Y)
2d Giả sử PGNP* đựơc tính bằng 1000USD thay vì USD Việc thay thế này có ảnh hưởng gì đến giá trị độ dốc và tung độ gốc và các kết quả kiểm định ở các câu trên.
Đặt PGNP2 là GNP bình quân đầu người tính bằng nghìn USD
Ta có quan hệ PGNP và PGNP2 là PGNP = PGNP2*1000
Phương trình (1) CMi = + * PGNPi + ui
Phương trình (2) CMi = 2+ 2 * PGNP2+ ui
= 2+ 2 * PGNP / 1000+ ui
= 2+ 2/1000 * PGNP + uiGiả sử: = 2 nên = 2/1000
Các kết quả kiểm định khác không đổi
Câu 3 Cho kết quả phương trình hồi quy ước lượng Yt= 16898.27 –2978.546 Xt
Yt : lượng cầu hoa hồng (lố/quí)
Xt : giá bán trung bình hoa hồng trong quí (10000/lố)
3a Xác định độ co giãn trung bình của cầu hoa hồng:
Trang 12= ∑ xi*yi / ∑xi2 = ∑(Xi - )*(Yi - ) / ∑(Xi - )2
=> ∑(Xi - )*(Yi - ) = * ∑(Xi - )2 = 2978.546 * 4.338545539 = 12922.55746
-Cov(X,Y) = (1/n-1)* ∑(Xi - )*(Yi - ) = (1/16-1)* (-12922.55746) = 861.5038307
-Vậy: r = Cov(X,Y) / Sx*Sy = -861.5038307 / (0.537807*2042.814) = 0.784155037
Do đặc điểm của hàm hồi quy đơn biến, ta có:
R2 = r2 = (-0.784155037)2 = 0.614899122
KINH TẾ LƯỢNG ỨNG DỤNG
BÀI TẬP 2
Bài 2 Sử dụng file Table 6.4.
Fertility and other data for 64 countries
CM = child mortality (tỉ lệ tử vong ở trẻ sơ sinh)
FLR = female literacy rate (tỉ lệ phụ nữ biết chữ)
PGNP = per capita GNP in 1980 (thu nhập bình quân đầu người năm 1980)
TFR = total fertility rate (tỉ lệ sinh đẻ trung bình của một phụ nữ)
Vậy ta có kết quả hồi quy
CMi = 263.6416 – 0.0056471 PGNPi – 2.231586FLRi + ui
b Kiểm định giả thiết Ho: 1 = 0
Với mức ý nghĩa =5% Ta có t(61,0.025) = 2
So sánh kết quả t-stat từ kết quả hồi quy trên, ta có t-stat = -2.818Do: t-stat = -2.818 < t(61,0.025) = - 2 => Bác bỏ giả thiết
vì t-stat nằm ngòai khỏang (-2,2)
Vậy PGNP có ảnh hưởng đến CM
Trang 13c Kiểm định giả thiết Ho: 2 = 2.2
Ta tính t-stat = (-2.231586 – 2.2) / 0.209947 = -21.108
Với mức ý nghĩa =5% Ta có t(61,0.025) = 2
So sánh kết quả t-stat = -21.108
Do: t-stat = -21.108 < t(61,0.025) = - 2 => Bác bỏ giả thiết Ho
vì t-stat nằm ngòai khỏang (-2,2)
d Giải thích ý nghĩa các hệ số ước lượng 1,2.
* 1 = - 0.005647 có ý nghĩa: khi thu nhập bình quân đầu người PGNP giảm (tăng) 1% thì trung bình số trẻ sơ sinh tử vong có xu hướng tăng(giảm) tương ứng xấp xỉ 0.5647% trẻ, trong điều kiện các yếu tố khác không đổi
* 2 = - 2.2316 có ý nghĩa: khi tỉ lệ phụ nữ biết chữ giảm (tăng) 1%thì trung bình số trẻ sơ sinh tử vong tăng (giảm) tương ứng xấp xỉ 223% trẻ, trong điều kiện các yếu tố khác không đổi
Bài 3 Sử dụng file Table 7.3.
YEAR = Year
Y = Real Gross Product, Millions of NT $ (Tổng sản lượng thực)
X2 = Labor Days, Millions of Days (Ngày lao động)
X3 = Real Capital Input, Millions of NT $ (Vốn thực)
a Giả sử hàm sản xuất Cobb-Douglas trong khu vực nôngnghiệp Đài Loan có dạng sau:
Dependent Variable: LNY
Method: Least Squares
Ước lượng các hệ số 1 = -1.44987, 2 =1.49877, và 3 =0.48986
b Kiểm định các giả thiết H0: 2 = 0 và H0: 3 = 0
Kiểm định giả thiết Ho : 2 = 0
Với mức ý nghĩa =5% Ta có t(12,0.025) = 2.179
13
Trang 14-So sánh kết quả t-stat từ kết quả hồi quy trên, ta có t-stat = 2.7765Do: t-stat = 2.7765 > t(12,0.025) = 2.179 => bác bỏ giả thiết
vì t-stat nằm ngòai khỏang (-2.179,2.179)
Kiểm định giả thiết Ho : 3 = 0
Với mức ý nghĩa =5% Ta có t(12,0.025) = 2.179
So sánh kết quả t-stat từ kết quả hồi quy trên, ta có t-stat = 4.8005Do: t-stat = 4.8005 > t(12,0.025) = 2.179 => bác bỏ giả thiết
vì t-stat nằm ngòai khỏang (-2.179~2.179)
c Giải thích ý nghĩa các hệ số 2 và 3
Y, có nghĩa là theo dữ liệu mẫu, khi số ngày công tăng (hoặcgiảm) 1đơn vị thì trung bình tổng sản lượng tăng (hoặc giảm) 1.4987đơn vị với điều kiện vốn đầu tư cho sản xuất đầu vào không đổi
Y, có nghĩa là theo dữ liệu mẫu, khi vốn đầu tư tăng (hoặcgiảm) 1 đơn vị thì trung bình tổng sản lượng tăng (hoặc giảm)
0.48986 đơn vị, với điều kiện số ngày công không đổi
d Kiểm kịnh giả thiết cho rằng 2 + 3 = 1,
Biến đổi (1) Yi = 1X2i2X3i3eui
Với giả thiết Ho: 2+3 = 1, H1: 2+3 # 1,
3=1-2Thế vào (1): Y= 1X2i2X3i 1-2eui
Y = 1 (X2i/ X3i )2 X3ieui
Y/ X3i = 1 (X2i/ X3i )2 eui
ln (Y/ X3i)= 1 +2 ln (X2i/ X3i ) +eui
Trang 15Ước lượng 2 mô hình
UR: Ln Yi = 1 +2lnX2i+ 3 lnX3i +ui
R: ln (Y/ X3i)= 1 +2 ln (X2i/ X3i ) +eui
Dependent Variable: LNY
Method: Least Squares
Từ kết quả hồi quy, ta có:
Bài 4: Bài tập 7.16, Gujarati (2003), trang 235 (Table 7.6)
Y: lượng hoa hồng tiêu thụ (bó)
X2 = giá bán sỉ trung bình
X3 = giá hàng hóa thay thế
X4 = thu nhập trung bình hàng tuần
X5 = biến theo thời gian
a Ước lượng tham số của mô hình(1), giải thích
Trang 16-X2 -2.227704 0.920466 -2.420193 0.034
Mô hình: Yt=10.81604- 2.227704X2t+1.251141X3t+0.006283X4t -0.1974X5t+ut.(1)
Giải thích ý nghĩa hệ số hồi quy:
2 = - 2.227704 có ý nghĩa giá bán sỉ trung bình tăng(giảm) 1đơn vị thì trung bình lượng hoa hồng bán ra giảm (tăng) 2.227 đơn
vị với các yếu tố khác không đổi
3 = 1.251141 có ý nghĩa khi giá hàng hóa thay thế tăng(giảm) 1 đơn vị thì trung bình lượng hoa hồng tăng (giảm)1.251141 đơn vị với các yếu tố khác không đổi
4 = 0.006283 có ý nghĩa khi thu nhập trung bình hàng tuầntăng (giảm) 1 đơn vị thì trung bình lượng hoa hồng tăng (giảm)0.006283 đơn vị với các yếu tố khác không đổi
b Ước lượng tham số của mô hình(2), giải thích
lnYt=1+2lnX2t+3lnX3t+4lnX4t+5X5t+ut.(2)
Kết quả hồi quy mô hình (2)
Dependent Variable: LOG(Y)
Method: Least Squares
Mô hình lnYt=1+2lnX2t+3lnX3t+4lnX4t+5X5t+ut.(2)
Giải thích ý nghĩa:
đối với lượng hoa hồng tiêu thụ, nghĩa là theo dữ liệu mẫu khigiá bán sỉ trung bình tăng (giảm) 1% thì lượng hoa hồng bán ragiảm (tăng) 1.2735 % với các yếu tố khác không đổi
Trang 173 = 0.937305 là hệ số của giãn của giá hàng hóa thay thếđối với lượng hoa hồng tiêu thụ, nghĩa là theo dữ liệu mẫu khigiá hàng hóa thay thế tăng (giảm) 1% thì lượng hoa hồng bán
ra tăng(giảm) 0.937305 % với các yếu tố khác không đổi
4 = 1.712976 là hệ số của giãn của thu nhập trung bình hàngtuần đối với lượng hoa hồng tiêu thụ, nghĩa là theo dữ liệumẫu khi thu nhập trung bình hàng tuần tăng (giảm) 1% thì lượnghoa hồng bán ra tăng(giảm) 1.71298 % với các yếu tố kháckhông đổi
c 2 , 3 , 4 là hệ số co giãn của cầu theo giá chính, giá chéo, theo thu nhập Dấu kỳ vọng của 2 , 3 , 4 là gì? Xuất kết quả hồi quy xem đúng hay không?
tăng khi giá bán sỉ trung bình giảm
tăng khi giá hàng hóa thay thế tăng
tăng khi thu nhập trung bình hàng tuần tăng
17
Trang 18-Bài 5: -Bài tập 7.19, Gujarati (2003), trang 238 (Table 7.9) Rõ hơn
trong bài “Đa cộng tuyến”
Y: tiêu dùng thịt gà / lượng cầu
heo và thịt bò (lượng tiêu dùng)
a Dựa vào các hàm yêu cầu sau, bạn chọn mô hình nào? Tại sao?
Ước lượng mô hình
thay thế) nên mồ hình không đầy đủ => dạng hàm sai
thay thế tốt nhất hay không
thay thế tốt nhất hay không
(4)lnYt = 1 + 2lnX2t + 3lnX3t + 4lnX4t + 5lnX 5t + ut
nhau Ngoài ra, nó còn phụ thuộc vào văn hóa, kinh tế ởtừng địa phương khác nhau Vì vậy khi đưa vào mô hình sẽ cóhiện tượng sai lệch xảy ra
Trang 19S.E of regression 0.02834 Akaike info criterion -4.132297
Sum squared
resid 0.01526 Schwarz criterion -3.934819
Log likelihood 51.52141 F-statistic 315.2063
Durbin-Watson
giúp mô hình không xảy ra hiện tượng đa cộng tuyến Vì vậy,mô hình (5) là mô hình tốt nhất
b Giải thích hệ số hồi quy lnX 2t và lnX 3t trong mô hình.
Từ bảng kết quả hồi quy ta có:
ut
người tăng (giảm) 1 đơn vị thì lượng cầu tiêu dùng thịt gàtrung bình tăng (giảm) 0.481286 đơn vị
1 đơn vị thì lượng cầu tiêu dùng thịt gà trung bình giảm (tăng)0.350628 đơn vị
c Có sự khác nhau nào giữa 2 hàm (2) và (4)
lnYt = 1 + 2lnX2t + 3lnX3t + 4 lnX4t + ut (2)
Kết quả hồi quy:
Trang 20-Adjusted R-squared 0.97859 S.D dependent var 0.187659
S.E of regression 0.027459 Akaike info criterion -4.195488
Sum squared resid 0.014326 Schwarz criterion -3.998011
Log likelihood 52.24812 F-statistic 336.1808
Durbin-Watson stat 1.778678 Prob(F-statistic) 0
lnYt = 1 + 2lnX2t + 3lnX3t + 4lnX4t + 5lnX 5t + ut (4)
Kết quả hồi quy:
Dependent Variable: LOG(Y)
Method: Least Squares
R-squared 0.978383 S.D dependent var 0.187659
S.E of regression 0.027591 Akaike info criterion -4.152987
Sum squared
resid 0.013703 Schwarz criterion -3.90614
Log likelihood 52.75935 F-statistic 249.9282
Durbin-Watson
stat 1.826069 Prob(F-statistic) 0.00000
điều này còn phải kiểm định bởi thực tế, nên chưa chính xác
là hàng hóa thay thế và có mối liên hệ với nhau nên sẽlàm cho mô hình có kết quả sai lệch, vì có hiện tượng đa cộngtuyến xảy ra
KINH TẾ LƯỢNG ỨNG DỤNG
BÀI TẬP 3
Trang 21Bài 2: Bài tập 9.2, Gujarati (2003), trang 324
21
Trang 22-Y: số giờ làm việc của người vợ
X2: thu nhập sau thuế của người vợ
X3:thu nhập sau thuế của chồng
X4: số tuổi của người vợ
X5: số năm học ở trường của người vợ (biến định lượng)
X6: Biến dummy
D=1 người phỏng vấn cảm thấy rằng người phụ nữ có thể làm việcnếu chồng đồng ý
D = 0 khác
X7: biến dummy, thái độ (thích làm việc hay không)
D = 1 muốn đi làm,
D = 0 khác
X8: số trẻ em dưới 6 tuổi
X9: số trẻ em trong độ tuổi 6~13
a Ý nghĩa của các hệ số của biến định lượng (không phải biến giả)
Theo lý thuyết kinh tế ta kỳ vọng những hệ số của X2, X5 sẽ tăng (mang dấu +)và kỳ vọng các hệ số của X3, X8, X9 sẽ giảm ( mang dấu -) Hệ số X4 tăng haygiảm phụ thuộc vào tuổi của người vợ và số lượng con cái Ngoài ra, biếntương tác của tuổi và số con dưới 6 tuổi hay số con giữa 6 và 13 tuổi sẽ giảmnhanh hơn trên mối quan hệ giữa tuổi và thời gian mong muốn dành cho côngviệc của người vợ
b Giải thích ý nghĩa biến giả X 6 và X 7 ,so sánh giá trị thống kê “2-t”
Qui tắc 2-t? So sánh giá trị t tính tóan với giá trị tra bảng t=2 (khỏang -2,2) thay
vì so với t(/2,df)
Biến giả X6: với tX6 = -0.4 => giá trị tuyệt đối t=0.4 <2, không có ý nghĩa thốngkê
Biến giả X7: với tX7 = 6.94 > 2, có ý nghĩa thống kê
c Tại sao bạn nghĩ biến tuổi và biến giáo dục không ảnh hưởng đến quyết định tham gia lực lượng lao động của người vợ.
- Có thể có hiện tượng đa cộng tuyến giữa X4 và X5 vì người lớn tuổi hơn có
22