Bài 1: Hồi quy tuyến tính đơn Eviews Câu 1: Gọi kids số người phụ nữ gọi educ số năm học người phụ nữ Một mơ hình hồi quy đơn liên hệ hai biến là: Kids = B1 +B2educ + U Trong đó, U sai số ngẫu nhiên khơng quan sát (i) Những yếu tố hàm chứa U? Những yếu tố có khả tương quan với trình độ học vấn hay khơng? Những yếu tố chưa U độ tuổi kết hôn, điều kiện kinh tế, sức khỏe người phụ nữ, sức khỏe người chồng,… Những yếu tố có khả tương quan với trình độ học vấn, khơng phải tất Kết hồi quy đơn có phản ảnh xác tác động trình độ (ii) học vấn lên số người phụ nữ hay không, điều kiện yếu tố khác khơng đổi? Giải thích sao? Trong điều kiện yếu tố khác khơng đổi, kết hồi quy đơn không phản ánh xác tác động trình độ học vấn lên số người phụ nữ Vì educ => kids > Trong thực tế, số năm học người phụ nữ cao số người phụ nữ giảm Vì sinh ảnh hưởng đến công việc sắc đẹp người phụ nữ nên người phụ nữ có trình độ học vấn cao họ sinh khơng sinh, ngược lại Câu 2: Tìm hiểu nhu cầu sử dụng điện thoại, ơng Bình sử dụng liệu Singapore giai đoạn 1960-1981 với biến sau: TEL: Số lượng máy điện thoại 1000 người GDP: Tổng sản phẩm quốc nội theo đầu người, mức giá cấu tính theo đô la Singapore năm 1968 Năm 1960 1961 1962 1963 1964 1965 TEL 36 37 38 41 42 45 GDP 1299 1365 1409 1549 1416 1473 Năm 1971 1972 1973 1974 1975 1976 TEL 90 102 114 126 141 163 GDP 2723 3033 3317 3487 3575 3784 1966 1967 1968 1969 1970 48 54 59 67 78 1589 1757 1974 2204 2462 1977 1978 1979 1980 1981 196 223 262 291 317 4025 4286 4628 5038 5472 a Vẽ đồ thị phân tán điểm cho tập liệu Dùng trục hoành cho biến GDP trục tung cho biến TEL Bằng trực quan, Anh/ chị nhận xét ngắn gọn mối quan hệ 02 số dựa đồ thị 350 Nhận xét: Mối quan 300 hệ số mối quan hệ đồng 250 biến TEL 200 150 100 50 1,000 2,000 3,000 4,000 5,000 6,000 GDP b Hãy tính trị thống kê tổng hợp cho biến GDP TEL (trung bình, phương sai, độ lệch chuẩn, đồng phương sai) Mean Median Maximum Minimum Std Dev Skewness Kurtosis TEL 116.8182 84.00000 317.0000 36.00000 88.48332 1.016681 2.777545 GDP 2812.045 2592.500 5472.000 1299.000 1323.027 0.471032 1.971067 Jarque-Bera Probability 3.835376 0.146946 1.784004 0.409834 TEL GDP TEL 7473.421487603308 108688.1446280992 GDP 108688.1446280992 1670836.225206612 Giá trị trung bình TEL 116.818 Phương sai TEL (88.483)2 Độ lệch chuẩn TEL 88.483 Observations 22 22 Đồng phương sai TEL 7473.421 Giá trị trung bình GDP 2812.045 Phương sai GDP (1323.027)2 Độ lệch chuẩn GDP 1323.027 Đồng phương sai GDP 1670836.225 Sum Sum Sq Dev 2570.000 164415.3 61865.00 36758397 c Tính hệ số tương quan cho biến TEL GDP kiểm định hệ số tương quan với mức ý nghĩa 5%? Correlation Probability TEL TEL 1.000000 - GDP GDP 0.972648 0.0000 1.000000 - Hệ số tương quan TEL GDP r = 0.972 H0 : r = => TEL GDP biến độc lập, TEL GDP có mối quan hệ xác khơng tuyến tính H1 : r => TEL GDP có mối quan hệ tuyến tính với P value = < 0.05 => Bác bỏ H0 Vậy mức ý nghĩa 5%, TEL GDP có mối quan hệ đồng biến, tương quan chặt chẽ d Ước lượng phương trình hồi quy tuyến tính sau: TELt = α + βGDPt + Ut = 0.065*GDP - 66.105 e Giải thích ý nghĩa hệ số góc mơ hình hồi quy trên? Khi tăng tổng sản phẩm quốc nội theo đầu người ( GDP) lên điểm đô la Singapore ( năm 1968) số lượng máy điện thoại 1000 người tăng 0.065 cái, với điều kiện yếu tố khác khơng đổi f Kết ước lượng có phù hợp với lý thuyết kinh tế không? Kết ước lượng phù hợp với lý thuyết kinh tế Bởi GDP thấp giai đoạn từ 1960 – 1981 1299$ Thay vào phương trình ước lượng ta có giá trị TEL dương, nên phù hợp g Hãy xét xem GDP có ảnh hưởng đến TEL hay khơng? Giả thuyết: H0 : B2 = : GDP không ảnh hưởng đến TEL H1 : B2 : GDP ảnh hưởng đến TEL P value = < 0.05 => Bác bỏ H0 Với mức ý nghĩa 5% GDP có ảnh hưởng đến số lượng máy điện thoại 1000 người h Xác định khoảng tin cậy 95% cho hệ số độ dốc Anh/Chị nhận xét khoảng tin cậy này? Variable 95% CI Coefficient Low High GDP C 0.065050 -66.10579 0.072296 -43.67964 0.057804 -88.53194 Khoảng tin cậy 95% cho hệ số độ dốc [0.057 < B2 < 0.072] Nhận xét: Từ 0.057 đến 0.072 khoảng chênh lệch khơng q lớn Có thể nói khoảng tin cậy hệ số độ dốc hẹp, ước lượng có độ xác cao i Hãy vẽ đồ thị đại lượng sai số mẫu (phần dư) e t theo GDPt (với et trục tung) Anh/ Chị nhận xét phân tán giá trị et đồ thị 30 Nhận xét: 20 Sự phân tán giá trị et không đồng đều, xa rời giá trị Phản ánh mức độ sai lệch lớn RESID 10 gây ảnh hưởng đến kết điều -10 tra -20 -30 -40 1,000 2,000 3,000 4,000 GDP 5,000 6,000 Câu 3: Bảng sau chứa điểm ACT (điểm tuyển sinh đại học) GPA (điểm trung bình) sinh viên đại học GPA tính theo thang điểm làm tròn đến số thập phân STT (i) GPA 2.8 3.4 3.0 3.5 3.6 3.0 2.7 3.7 ACT 21 24 26 27 29 25 25 30 Ước lượng mối quan hệ GPA ACT? Nhận xét chiều hướng mối quan hệ? Hệ số chặn có ý nghĩa thực tế ví dụ khơng? Hãy giải thích? Nếu ACT tăng thêm điểm, dự đoán GPA tăng bao nhiêu? Ước lượng mối quan hệ GPA ACT = 0.102*ACT + 0.568 Nhận xét: Chiều hướng mối quan hệ đồng biến Hệ số chặn khơng có ý nghĩa thực tế ví dụ Vì điểm tuyển sinh đại học điểm trung bình 0.568 Điều trái thực tế điểm tuyển sinh đại học sinh viên khơng học đại học nên khơng có điểm trung bình đại học Nếu ACT tăng thêm điểm GPA tăng 0.51 điểm (ii) Tính giá trị ước lượng phần dư quan sát, kiểm chứng tổng phần dư (gần đúng) không Các giá trị ước lượng: = 0.568 = 0.102 Se() = 0.928 Se() = 0.035 Các phần dư quan sát 0.08571428571428851 0.3791208791208805 -0.2252747252747254 0.1725274725274719 0.06813186813186656 -0.1230769230769222 -0.423076923076922 0.06593406593406348 Tổng phần dư -0.002 (iii) Giá trị dự đoán GPA ACT = 20 bao nhiêu? Khi ACT = 20 giá trị dự đoán GPA = 2.608 (iv) ACT giải thích phần trăm thay đổi GPA? R2 = 0.5774 => ACT giải thích 57.74% thay đổi GPA (v) Theo anh/chị ACT có ảnh hưởng đến GPA khơng? Với mức ý nghĩa 5% H0 : B2 = : ACT không ảnh hưởng đến GPA H1 : B2 : ACT có ảnh hưởng đến GPA P value = 0.0287 < 0.05 => Bác bỏ H0 Vậy với mức ý nghĩa 5% điểm tuyển sinh đại học có ảnh hưởng đến điểm trung bình đại học sinh viên Câu 4: Sử dụng liệu tập tin SLEEP75.WF1 từ nghiên cứu Biddle Hamermesh (1990) để nghiên cứu liệu có đánh đổi thời gian dành để ngủ tuần thời gian làm việc kiếm tiền Chúng ta sử dụng hai biến làm biến phụ thuộc Cụ thể hơn, ta ước lượng mơ hình sau: Sleepi 1 2totwrki U i Trong sleep số phút ngủ ban đêm tuần totwrk tổng số phút làm việc suốt tuần (i) Trình bày kết hồi quy với số quan sát R Nêu ý nghĩa hệ số hồi quy ước lượng được? = -0.15*TOTWRK + 3586.376 Số quan sát : 706 R2 = 0.103 Ý nghĩa hệ số hồi quy: Hệ số chặn B1 cho biết, tổng số phút làm việc suốt tuần số phút ngủ ban đêm tuần 3586.376 phút Hệ số góc B2 cho biết, tổng số phút làm việc suốt tuần tăng lên phút số phút ngủ ban đêm tuần giảm 0.15 phút, với điều kiện yếu tố khác không đổi (ii) Nếu totwrk tăng thêm giờ, sleep dự đốn giảm bao nhiêu? Theo bạn, mức tác động có lớn khơng? Nếu tổng số phút làm việc suốt tuần tăng thêm ( 120 phút) số phút ngủ ban đêm tuần dự đoán giảm 18 phút Theo em, mức tác động không lớn khơng nhỏ Vì biến thời gian nên bù trừ lẫn (iii) Theo bạn biến totwrk có ảnh hưởng đến sleep không? Với mức ý nghĩa 5% H0 : B2 = : thời gian làm việc suốt tuần không ảnh hưởng đến thời gian ngủ ban đêm tuần H1 : B2 : thời gian làm việc suốt tuần ảnh hưởng đến thời gian ngủ ban đêm tuần P value = < 0.05 => Bác bỏ H0 Vậy với mức ý nghĩa 5% thời gian làm việc suốt tuần ảnh hưởng đến thời gian ngủ ban đêm tuần (iv) Mơ hình hồi quy ước lượng có ý nghĩa khơng? Với mức ý nghĩa 1% P value (Fc) = < 0.01 => mơ hình hồi quy ước lượng có ý nghĩa Câu 5: Có tài liệu tiêu dùng cà phê (Y) giá cà phê (X) giai đoạn 1970 1980 Mỹ sau: Năm 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 Y (ly/ngày/người) 2.57 2.50 2.35 2.30 2.25 2.20 2.11 1.94 1.97 2.06 2.02 X (USD/ly) 0.77 0.74 0.72 0.73 0.76 0.75 1.08 1.81 1.39 1.20 1.17 a) Hãy viết hàm hồi quy tổng thể biểu diễn mối quan hệ phụ thuộc tuyến tính Y theo X? Y = B1 + B2*Xi + Ui b) Ước lượng hàm hồi quy viết câu a = -0.479*X + 2.691 c) Giải thích ý nghĩa hệ số góc hàm hồi quy tổng thể hàm hồi quy mẫu Hệ số góc hàm hồi quy tổng thể cho biết giá trị trung bình mức tiêu dùng cà phê thay đổi đơn vị giá trị giá cà phê tăng lên USD/ ly, với điều kiện yếu tố khác khơng đổi Hệ số góc hàm hồi quy mẫu cho biết giá cà phê tăng lên USD/ ly mức tiêu dùng cà phê giảm 0.479 ly/ ngày/ người, với điều kiện yếu tố khác khơng đổi d) Tính hệ số xác định giải thích ý nghĩa R2 = 0.6627 Cho biết giá cà phê ảnh hưởng 66.27% đến mức tiêu dùng cà phê e) Giá cà phê có ảnh hưởng đến mức tiêu dùng cà phê không? H0 : B2 = : Giá cà phê không ảnh hưởng đến mức tiêu dùng cà phê H1 : B2 : Giá cà phê ảnh hưởng đến mức tiêu dùng cà phê P value = 0.002 < 0.05 => Bác bỏ H0 Vậy với mức ý nghĩa 5% giá cà phê ảnh hưởng đến mức tiêu dùng cà phê f) Các yếu tố bên giá cà phê ảnh hưởng đến mức tiêu dùng cà phê %? Các yếu tố bên ảnh hưởng 33.73% đến mức tiêu dùng cà phê g) Tính phương sai sai số tiêu chuẩn ước lượng OLS? Se (B1) = 0.121622 Var (B1) = (0.121622)2 Se (B2) = 0.114022 Var (B2) = (0.114022)2 h) Với độ tin cậy 95%, tìm khoảng tin cậy hệ số hồi quy? Variable Coefficient 95% CI Low High X C -0.479529 2.691124 -0.737464 -0.221594 2.415995 2.966253 [ 2.415 < B1 < 2.966 ] [ -0.737 < B2 < -0.221 ] i) Với mức ý nghĩa 5%, đánh giá ý kiến "Nếu giá cà phê tăng 1USD/ly mức tiêu dùng cà phê giảm 0.5 ly/ngày/người" H0 : B2 = 0.5 : giá cà phê tăng 1USD/ly mức tiêu dùng cà phê giảm 0.5 ly/ngày/người H1 :B2 0.5 :giá cà phê tăng 1USD/ly mức tiêu dùng cà phê khơng giảm 0.5 ly/ngày/người t2 = -4.205 | t2 | = 4.205 > = 2.2281 => Bác bỏ H0 Với mức ý nghĩa 5% ý kiến sai Câu 6: Cho số liệu sau suất (tạ/ha) loại trồng mức phân bón (tạ/ha) cho loại tính 1ha 10 năm từ 1988-1997 Nă m 1988 1989 1990 1991 1992 Phân bón (X) Năng suất (Y) Năm Phân bón (X) Năng suất (Y) 10 12 14 16 18 22 24 26 32 40 44 46 48 52 1993 1994 1995 1996 1997 58 60 68 74 80 a) Hãy ước lượng mơ hình hồi quy suất phụ thuộc mức phân bón? = 1.659*X + 27.125 b) Hãy giải thích ý nghĩa kinh tế hệ số nhận Khi mức phân bón ( tức khơng bón phân) suất đạt 27.125 tạ/ha Khi mức phân bón tăng lên tạ/ha suất tăng 1.659 tạ/ha, với điều kiện yếu tố khác không đổi $ c) Hãy tính độ lệch tiêu chuẩn Se(B1) = 1.979 Se (B2) = 0.101 d) Với mức ý nghĩa 5% cho biết mức phân bón có ảnh hưởng đến suất loại không? H0 : B2 = : mức phân bón khơng ảnh hưởng đến suất H1 : B2 : mức phân bón ảnh hưởng đến suất P value = < 0.05 => Bác bỏ H0 Với mức ý nghĩa 5% mức phân bón ảnh hưởng đến suất e) Hãy tìm khoảng tin cậy 95% cho hệ số hồi quy 95% CI Variable Coefficient X C 1.659722 27.12500 Low High 1.426075 1.893369 22.56081 31.68919 [22.56 < B1 < 31.689] [1.426 < B2 < 1.893] f) Hãy tính r giải thích ý nghĩa kết nhận R2 = 0.971 Cho biết mức phân bón ảnh hưởng 97.1% đến suất g) Với mức phân bón 20 tạ/ha, dự báo suất trồng bao nhiêu? Với mức phân bón 20 tạ/ha, suất trồng 60.305 tạ/ha h) Trình bày kết phân tích hồi qui = 1.659*X + 27.125 R2 = 0.971 Se(Bj) = (0.101) (1.979) df = Tj (13.704) F = 268.33 (0) (0) = (16.38) P value = (0) Câu 7: Có tài liệu kết hồi qui sau: Yˆi Se = 2,6911 - 0,4795X2i (0,121) tj = (22,127) r2=0,6627 (0,114) (-4,206) df = 35 Fc = (68,765), P_value (Fc) = 0,0043, α = 5% Yêu cầu: a) Tính kích thước mẫu (n) n = 37 b) Hãy tính điền vào chỗ thiếu ( ) c) Xét xem biến X có ảnh hưởng đến Y hay khơng? H0 : B2 = : X không ảnh hưởng đến Y H1 : B2 : X ảnh hưởng đến Y t2 = -4,206 | t2 | = 4,206 > =1.6896 => bác bỏ H0 Với mức ý nghĩa 5% X ảnh hưởng đến Y d) Xét xem mơ hình hồi quy ước lượng có ý nghĩa khơng? P value ( Fc) = 0.0043 < 0.05 => Bác bỏ H0 => mơ hình hồi quy ước lượng có ý nghĩa ... Năm 19 70 19 71 1972 19 73 19 74 19 75 19 76 19 77 19 78 19 79 19 80 Y (ly/ngày/người) 2.57 2.50 2.35 2.30 2.25 2.20 2 .11 1. 94 1. 97 2.06 2.02 X (USD/ly) 0.77 0.74 0.72 0.73 0.76 0.75 1. 08 1. 81 1.39 1. 20 1. 17... loại tính 1ha 10 năm từ 19 88 -19 97 Nă m 19 88 19 89 19 90 19 91 1992 Phân bón (X) Năng suất (Y) Năm Phân bón (X) Năng suất (Y) 10 12 14 16 18 22 24 26 32 40 44 46 48 52 19 93 19 94 19 95 19 96 19 97 58 60.. .19 66 19 67 19 68 19 69 19 70 48 54 59 67 78 15 89 17 57 19 74 2204 2462 19 77 19 78 19 79 19 80 19 81 196 223 262 2 91 317 4025 4286 4628 5038 5472 a Vẽ đồ thị phân tán điểm cho tập liệu Dùng