HAI BIẾN NGẪU NHIÊN NGANG NHAU - KHÔNG PHÂN BIỆT BIẾN ĐỘC LẬP ppsx

11 344 1
HAI BIẾN NGẪU NHIÊN NGANG NHAU - KHÔNG PHÂN BIỆT BIẾN ĐỘC LẬP ppsx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

CHƯƠNG TƯƠNG QUAN VÀ HỒI QUY Trong chương trước, ta đề cập chủ yếu phương pháp nghiên cứu biến đơn lẻ, biến ngẫu nhiên độc lập Trong chương này, ta nói đến mối liên hệ hai biến ngẫu nhiên với hai phương pháp: tương quan hồi quy TƯƠNG QUAN Mục tiêu phân tích tương quan đo lường cường độ mối quan hệ hai biến Trong phân tích này, xem hai biến ngẫu nhiên “ngang nhau”- không phân biệt biến độc lập biến phụ thuộc Tương quan tuyến tính hai biến khái niệm thể mức độ mối liên hệ tuyến tính 1.1.Hệ số tương quan Giả sử hai biến ngẫu nhiên, với trung bình phương sai gọi hệ số tương quan tổng thể Ta có −1 ≤ Hệ số tương quan ≤ thể cường độ chiều hướng tuyến tính ; , , , < có mối liên hệ nghịch, nghĩa biến giảm biến tăng lên ngược lại > có mối liên hệ thuận, nghĩa biến tăng biến tăng ngược lại = khơng có mối liên hệ tun tính Trị tuyệt đối lớn mối liên hệ tuyến tính chặt chẽ Gọi ( , ), ( , ), … , ( Trong thực tế, ta Hệ số tương quan tổng thể tương quan Pearson): , ) mẫu gồm n cặp giá trị quan sát thu thập ngẫu nhiên từ phải ước lượng từ liệu mẫu thu thập được ước lượng từ hệ số tương quan mẫu = ∑ (còn gọi hệ số ( − )( − ) ( − 1) Ví dụ: Số lượng thời gian quảng cáo truyền hình lượng sản phẩm tiêu thụ công ty sản xuất đồ chơi trẻ em: Thời gian quảng cáo tuần (phút) 28 37 44 36 47 35 26 29 33 32 31 28 Lượng tiêu thụ tuần 41 32 49 42 38 33 27 24 35 30 34 25 (1000 sản phẩm) Gọi thời gian quảng cáo truyền hình (phút) lượng sản phẩm tiêu thụ tuần (1000 sản phẩm) Áp dụng công thức ta có = 0.63882 1.2.Kiểm định giả thuyết mối liên hệ tương quan Bên cạnh việc thể mức độ chặt chẽ mối liên hệ, vấn đề chủ yếu dùng r để xét xem có hay khơng mối liên hệ tương quan hai biến , , tức kiểm định giả thuyết cho hệ số tương quan tổng thể khơng Giả sử có mẫu n cặp quan sát chọn ngẫu nhiên từ , có phân phối chuẩn Gọi r hệ số tương quan mẫu : =0( ó ê ệ ữ ) : ≠0( ó ê ệ ữ ) Kiểm định giả thuyết tương quan tổng thể Giá trị kiểm định ( ), / = | | 1− −2 > ( ), / tra bảng phân phối Student với bậc tự ( − 2) với mức ý nghĩa /2 Quy tắc định mức ý nghĩa Với sau: bác bỏ Kiểm định hai phía sử dụng trước chiều hướng mối liên hệ Nếu xác định chiều hướng mối liên hệ, ta thực kiểm định phía,bên trái bên phải: : > : < Ta làm hoàn toàn tương tự kiểm định hai phía, lưu ý tra bảng phân phối Student giá trị ( ), thay ( ), / HỒI QUY ĐƠN GIẢN 2.1 Lý thuyết Keynes tiêu dùng 2.1.1 Lý thuyết Keynes đặt mối quan hệ tiêu dùng thu nhập = ( ) Ví dụ: Kết điều tra thu nhập (triệu đồng/tháng) tiêu dùng (triệu đồng/tháng) cho bảng giá trị sau: 10 Thu nhập 2.038 4.038 Tiêu dùng Minh họa số liệu hình vẽ, quan hệ tiêu dùng thu nhập tuyến tính 15 6.038 = ( ), mối quan hệ Dependent Variable: TIEUDUNG Method: Least Squares Date: 12/11/09 Time: 15:34 Sample: Included observations: Variable Coefficient Std Error t-Statistic Prob THUNHAP C 0.400000 0.038000 1.60E-16 1.73E-15 2.50E+15 2.20E+13 0.0000 0.0000 R-squared Adjusted R-squared S.E of regression F-statistic Prob(F-statistic) 1.000000 1.000000 1.13E-15 6.23E+30 0.000000 Mean dependent var S.D dependent var Sum squared resid Durbin-Watson stat Khi ta có quan hệ dạng 4.038000 2.000000 1.28E-30 1.114255 = 0.038 + 0.4 Nếu = = 0.038, điều có ý nghĩa người khơng có thu nhập tiêu dùng mức tối thiểu 0.038 triệu đồng/tháng Hệ số 0.4 (hay khuynh hướng tiêu dùng theo thu nhập) cho biết, tăng thu nhập lên triệu/tháng tiêu dùng tăng lên 0.4 triệu đồng/tháng Tức mức tăng tiêu dùng không nhanh mức tăng thu nhập Ý nghĩa phương trình sau: Về trung bình, thu nhập tăng tỷ lệ thu nhập tiêu dùng ( ) ngày giảm 2.038 4.038 6.038 > > 10 15 Như có tỷ lệ lớn thu nhập đưa vào tiết kiệm người ta giàu lên Một cách tổng quát, hàm mô tả tốt khuynh hướng tiêu dùng theo thu nhập Keynes có dạng tuyến tính = + ( > 0, ∈ (0, 1) Ví dụ: Số liệu tiêu dùng trung bình thu nhập khả dụng theo giá cố định kinh tế Mỹ 10 năm từ 1970-1979 Đơn vị: tỷ dollars Năm 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 Thu nhập khả dụng 751.6 779.2 810.3 864.7 857.5 874.9 906.8 942.9 988.8 1015.7 Tiêu dùng trung bình 672.1 696.8 737.1 767.9 762.8 779.4 823.1 864.3 903.2 927.6 Dependent Variable: TIEUDUNGTRUNGBINH Method: Least Squares Date: 12/11/09 Time: 15:40 Sample: 10 Included observations: 10 Variable Coefficient Std Error t-Statistic Prob THUNHAPKHADUNG C 0.979267 -67.58065 0.031607 27.91071 30.98253 -2.421316 0.0000 0.0418 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood Durbin-Watson stat 0.991735 0.990702 8.193028 537.0056 -34.10650 1.566424 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 793.4300 84.96543 7.221301 7.281818 959.9172 0.000000 Mặc dù liệu xem thể tốt quy luật tuyến tính Nhưng rõ ràng mối quan hệ có tính xác định khơng đủ để mơ tả thực tiễn, cịn nhiều yếu tố khác ảnh hưởng đến tiêu dùng (như giới tính, tuổi tác, tâm lý…) Nói chung, khơng có tham vọng đưa hết tất yếu tố ảnh hưởng tới tiêu dùng vào mơ hình mà yếu tố quan trọng, thiết yếu Vì vậy, để biểu diễn quy luật tiêu dùng giới thực, ta cần đưa thêm vào mơ hình tuyến tính thành phần khác mang tính ngẫu nhiên, thể tác động tổng hợp nhân tố nhỏ, không ổn định tới tiêu dùng Tức yếu tố làm cho quan sát thật tiêu dùng thu nhập bị lệch khỏi xu ổn định, tuyến tính nêu Tức ta muốn biểu diễn mối quan hệ cặp liệu quan sát thu nhập tiêu dùng { , } sau: = + + , = 1, 2, … , Trong ( , ) = ( , ) tiêu dùng thu thập thực tế mẫu quan sát thứ Xét vế phải phương trình ta có: - Thành phần thứ + quy luật xác định, mà ta cần ước lượng Thành phần thứ hai nhiễu (tức bao gồm tác động tổng hợp yếu tố khác hồn cảnh, có tính ngẫu nhiên, làm quan sát bị lệch khỏi khuynh hướng hay ổn định) Cả hai phần này, tính xu - xác định yếu tố ngẫu nhiên gộp lại phương trình để mô tả lý thuyết tiêu dùng Keynes 2.1.2 Ước lượng quy luật tiêu dùng = + Ta muốn ước lượng xu tiêu dùng quy luật tuyến tính: tham số ước lượng tham số tổng thể, chưa biết , ước lượng tiêu dùng, cho trước quan sát thu nhập = − ; Mức độ tốt việc ước lượng đo lường qua số dư Tổng bình phương sai số, ký hiệu ESS ( = − ) = − − Một cách tổng quát, muốn tổng bình phương sai số phần dư nhỏ theo phương pháp bình phương cực tiểu: , Sử dụng cực trị có điều kiện ta có = − − → min( , ) , , =0 → − − − − = − ̅ ∑ ( − ̅ )( − ) = = ∑ ( − ̅) → Trong =0 (−1) = (− )=0 Covariance mẫu; = ̅ điểm ( , ) nằm đường hồi quy + phương sai mẫu Ý nghĩa phương trình 2.1.3 = + Đo lường độ phù hợp ước lượng Sử dụng điều kiện tìm cực trị ta có ( − ) = ( − ) + Vế trái tổng bình phương dao động tiêu dùng, ký hiệu TSS Vế phải phân thành tổng bình phương phần giải thích mơ hình hồi quy RSS; Hay Ký hiệu = + =1− → =1− tổng sai số ước lượng ESS →0≤ ≤1 2.2 Mơ hình hồi quy tuyến tính đơn = + + , = 1, 2, … , Cơng thức tổng qt mơ hình hồi quy tuyến tính đơn là: Trong , , quan sát thứ n biến độc lập biến phụ thuộc; tham số chưa biết ước lượng; sai số không quan sát giả thiết biến ngẫu nhiên với số đặc tính nghiên cứu kỹ phần sau Khi , gọi hệ số hồi quy Thuật ngữ đơn mơ hình hồi quy tuyến tính đơn sử dụng để có biến giải thích sử dụng mơ hình Mục tiêu sử dụng liệu thu thập để ước lượng hàm hồi quy tổng thể, ước lượng tham số tổng thể , Ký hiệu ước lượng mẫu ; = ước lượng mẫu Khi mối quan hệ trung bình ước lượng Ứng với giá trị quan sát trị cho trước cho trước ta có = Phần dư ước lượng hay phần dư Cần phân biệt hàm hồi quy tổng thể − = = + Đây gọi hàm hồi quy mẫu + = + , giá trị dự báo − − Hay = hàm hồi quy mẫu 2.2.1 Bản chất thống kê mơ hình hồi quy tuyến tính đơn + = với giá + + Phương pháp LS (bình phương nhỏ nhất) xác định đường hồi quy cho tổng bình phương phần dư nhỏ ∑ ( Theo phương pháp LS ta có ước lượng Do ∑ ( Đặt = − ̅ ) = ̅ = , ta suy ∑ = − ̅ )( − ) = 0, ∑ phụ thuộc vào quan sát { } = = Ta chứng minh = + ∑ , suy ước lượng làm giá trị khơng trùng khít với tổng thể Khi ∑ ( tham số tổng thể (Tương tự dụng cho ) − ̅) bị ảnh hưởng yếu tố ngẫu nhiên 2.2.2 Các yếu tố ngẫu nhiên Các đặc trưng thống kê nhiễu ngẫu nhiên: Các yếu tố ngẫu nhiên nhiên độc lập, có phân phối chuẩn Xu tổng thể: theo , + ~ (0, )( ) biến ngẫu phần xác định mơ hình trung bình có điều kiện ( | )= + Thuật ngữ tuyến tính dùng để chất thông số tổng thể , nhất) khơng phải tuyến tính tuyến tính (bậc Số hạng (hay gọi số hạng ngẫu nhiên) thành phần ngẫu nhiên không quan sát sai biệt phần xác định + 2.2.3 Những đặc trưng thống kê ước lượng bình phương cực tiểu +∑ = Tính tốt ước lượng theo tiêu chuẩn thống kê Từ phương trình ( Vì ∑ = =∑ − ̅ = = ta có: = = − + = = + = ( )= ( )= = ) Ý nghĩa giá trị thực tế nhỏ hay hiệu ước lượng tăng lên, độ đa dạng thông tin quan sát đo tăng lên 2.2.4 Kiểm định giả thuyết thống kê Ta xét vấn đề kiểm định thơng qua ví dụ sau: Một cơng ty bảo hiểm Mỹ muốn kinh doanh bảo hiểm nhân thọ Họ tiến hành nghiên cứu tiềm thị trường sở Lý luận kinh tế rằng: yêu cầu mua bảo hiểm tăng lên với khả xảy rủi ro, với quy mô tổn thất tài xảy rủi ro với tâm lý lo ngại rủi ro cá nhân Họ nhận định rằng, gia đình giàu có kinh doanh, người chủ gia đình chịu nhiều Stress Tức người lệ thuộc ngại rủi ro gây nên stress cho người chủ gia đình gia đình thu nhập thấp, tham dự vào kinh doanh = + Vì ban nghiên cứu thị trường công ty bảo hiểm đề xuất mô hình sau Trong đó: giá trị hợp đồng bảo hiểm, trả cho bên mua bảo hiểm xảy rủi ro; thu nhập, đơn vị hai nghìn dollas Dữ liệu điều tra kết ước lượng ghi bảng đây: obs INS 90 INC 25 10 11 12 13 14 15 16 17 18 19 20 165 220 145 114 175 145 192 395 339 230 262 570 100 210 243 335 299 305 205 40 60 30 29 41 37 46 105 81 57 72 140 23 55 58 87 72 80 48 Dependent Variable: INS Dependent Variable: INS Method: Least Squares Method: Least Squares Date: 12/11/09 Time: 15:44 Date: 12/11/09 Time: 15:44 Sample: 20 Sample: 20 Included observations: 20 Included observations: 20 Variable Variable Coefficient Coefficient Std Error Std Error t-Statistic t-Statistic Prob Prob INC INC C C 3.880186 3.880186 6.854991 6.854991 0.112125 0.112125 7.383473 7.383473 34.60601 34.60601 0.928424 0.928424 0.0000 0.0000 0.3655 0.3655 R-squared R-squared Adjusted R-squared Adjusted R-squared S.E of regression S.E of regression Sum squared resid Sum squared resid Log likelihood Log likelihood Durbin-Watson stat Durbin-Watson stat 0.985192 0.985192 0.984370 0.984370 14.35730 14.35730 3710.375 3710.375 -80.61033 -80.61033 3.175965 3.175965 Dependent Variable: INS Method: Least Squares Kết ước lượng tóm Date: 12/11/09 Time: 15:44 Sample: 20 Included observations: 20 = 6.85 + 3.88 236.9500 236.9500 114.8383 114.8383 8.261033 8.261033 8.360606 8.360606 1197.576 1197.576 0.000000 0.000000 tắt lại sau: Variable Coefficient INC C 3.880186 6.854991 R-squared Adjusted R-squared S.E of regression Mean dependent var Mean dependent var S.D dependent var S.D dependent var Akaike info criterion Akaike info criterion Schwarz criterion Schwarz criterion F-statistic F-statistic Prob(F-statistic) Prob(F-statistic) 0.985192 0.984370 14.35730 = 20; = 0.985; = 3710 0.112125 34.60601 0.0000 (7.38) t-Statistic (0.11) Std Error 7.383473 0.928424 Mean dependent var S.D dependent var Akaike info criterion Prob 0.3655 236.9500 114.8383 8.261033 Điều có nghĩa thu nhập gia đình tăng thêm nghìn dollars chi cho bảo hiểm tăng lên khoảng từ nghìn đến nghìn dollas Tuy nhiên giá trị tăng lên với độ tin cậy Nghĩa cần xác định khoảng tin cậy tham số tổng thể a Khoảng tin cậy Trước hết ta có ~ ( ; ) Sau chuẩn hóa ta có Để cơng thức có ý nghĩa ứng dụng, ta thay Khi thống kê Khoảng tin cậy (1 − )100% thống kê = (1 − ) Hay khoảng ước lượng Ví dụ ta có tổng thể là = 3.88; , − < = 0.11 , − ∗ 3.88 − 2.011 ∗ 0.11 ≤ b Kiểm định giả thuyết thống kê Tính giá trị kiểm định = Quy tắc định: Bác bỏ ( Ngược lại, sở bác bỏ Chúng ta sử dụng giá trị − = ( ) , ~ (0, 1) ~ ( ∑ = ) là: = ≤ , , =1− ≤ + , ∗ với độ tin cậy = 2.101, nên độ tin cậy 95% ≤ 3.88 + 2.011 ∗ 0.11 ) mức ý nghĩa ( ( ) < : = : ≠ ứ ý Tiến hành kiểm định giả thuyết sau: = chuyển thành thống kê = − = ≥ ) mức ý nghĩa , < , phân bảng kết xuất Eview sau: Và ta có quy tắc định: − = { > } Bác bỏ ( ) mức ý nghĩa ≥ − Khơng có sở bác bỏ ( ) mức ý nghĩa < − 2.3.Hệ số xác định kiểm định F phân tích hồi quy đơn a Hệ số xác định Hay = + → =1− Ký hiệu =1− →0≤ ≤1 bình phương hệ số tương quan mẫu r nói trên, thể thích hợp mơ hình hồi quy liệu lớn mơ hình tuyến tính xây dựng xem thích hợp b Kiểm định Tương tự phân tích phương sai ANOVA Biến thiên Tổng chênh lệch bình phương Hồi quy −2 Sai số Tổng Tra bảng Fisher Bậc tự ( , , ) −1 Trung bình chênh lệch bình phương = = −2 Giá trị kiểm định = ... hưởng yếu tố ngẫu nhiên 2.2.2 Các yếu tố ngẫu nhiên Các đặc trưng thống kê nhiễu ngẫu nhiên: Các yếu tố ngẫu nhiên nhiên độc lập, có phân phối chuẩn Xu tổng thể: theo , + ~ (0, )( ) biến ngẫu phần... quy tuyến tính đơn là: Trong , , quan sát thứ n biến độc lập biến phụ thuộc; tham số chưa biết ước lượng; sai số không quan sát giả thiết biến ngẫu nhiên với số đặc tính nghiên cứu kỹ phần sau Khi... Coefficient Std Error t-Statistic Prob THUNHAP C 0.400000 0.038000 1.60E-16 1.73E-15 2.50E+15 2.20E+13 0.0000 0.0000 R-squared Adjusted R-squared S.E of regression F-statistic Prob(F-statistic) 1.000000

Ngày đăng: 13/08/2014, 08:21

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan