1. Trang chủ
  2. » Khoa Học Tự Nhiên

Thực hành 5 ngoại suy thống kê (statistical inferences)

22 125 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 505 KB

Nội dung

Thực Hành 5: Ngoại Suy Thống Kê (Statistical Inferences) I Kiểm định F: Như hồi quy đơn giản, ta dùng kiểm định t để kiểm định giả thuyết với MỘT giả thuyết Trong hồi quy tuyến tính đa biến, ta dùng kiểm định t Tuy nhiên, ta muốn kiểm định giả thuyết với HAI giả thuyết ĐỒNG THỜI trở lên, ta phải dùng kiểm định F Ta xét tiếp ví dụ Big Andy Burger Barn, ta ước lượng mô hình: Si = β1 + β2Pi + β3Ai + εi Ta coù thể dùng kiểm định t để kiểm định giả thuyết H0: β2 = so với H1: β2 ≠ Một cách khác để kiểm định dùng kiểm định F Nếu giả thuyết H0 hàm số giới hạn (tức với β2 = 0) viết thành Si = β1 + β3Ai + εi Kiểm định F so sánh tổng bình phương sai số hai mô hình : không giới hạn có giới hạn Nếu có khác biệt lớn hai mô hình, ta suy luận rằng, giới hạn ta đặt không Giá trị kiểm định F là: SSER SSEU tổng bình phương số dư mô hình giới hạn mô hình không giới hạn lấy từ bảng ANOVA hai mô hình J số lượng giới hạn, tức giả thuyết cần kiểm định N số lượng quan sát mô hình không giới hạn K số lượng biến độc lập (kể giao điểm) mô hình không giới hạn Nếu giả thuyết H0 đúng, F phân phối theo phân phối FJ/N-K Trong Excel, ta tiện ích thực kiểm định trực tiếp Ta xây dựng template cho kiểm định sau Trong bảng tính trên, ta dùng : • Hàm FINV(a, j, n-k) để tính giá trị F-quyết định phép kiểm định • Hàm FDIST(kiểm định F, j, n-k) tính giá trị p tương ứng với giá trị F tính toán Trong phép kiểm định này, ta cần ước lượng mô hình: mô hình không giới hạn mô hình giới hạn Mô hình không giới hạn ta ước lượng chương trước Trong phần này, ta tiếp tục ước lượng mô hình giới hạn Ta mở file Andy.xls, tiến hành Tools/Data Analysis/Regression với biến độc lập Advert Chỉ có Advert Ta có kết quả: Ta điền vào đầy đủ thông số, ta có: Giá trị kiểm định F > giá trị định F , giá trị p < a, ta kết luận a = 5%, giá có ảnh hưởng đến tổng doanh thu II Kiểm tra độ tin cậy toàn mô hình: Ta áp dụng kiểm định F để kiểm tra độ tin cậy toàn mô hình Ta có mô sau: yi = β1 + β2x2 + β3x3 + …βkxk + εi Kiểm tra độ tin cậy toàn mô hình kiểm tra xem biến độc lập có góp phần giải thích y hay không, nghóa : H0: β2 = β3 = …=βk = H1: tối thiểu số beta Ta dùng template để kiểm tra mô hình Andy’s burger barn Ta tính mô hình giới hạn với biến độc lập giao điểm ở đây, J = ta có giả thuyết β2 = β3 = Ta có kết từ bảng ANOVA cho kiểm định tin cậy toàn mô hình III Mở rộng mô hình Khái niệm lợi nhuận biên giảm dần khái niệm quan trọng kinh tế ta phải lưu tâm mô hình hoá quan hệ kinh tế Ví dụ, mô hình Andy’s Burger Barn, ta lập luận với dollar chi phí tăng thêm cho quảng cáo làm tăng lợi với mức độ dần, đến lúc đó, tăng quảng cáo không tăng doanh số thêm nữa, chí giảm lợi nhuận Dựa phân tích đó, ta mở rộng mô hình thành: Si = β1 + β2Pi + β3Ai + β4A2 + εi Trong worksheet chứa liệu, ta tạo thêm biến độc lập tên “ A2” nhập công thức = C2^2 vào ô D2 copy công thức hết vùng liệu Ta thực ước lượng mô hình mở rộng : Và ta có kết Ta thấy, giá P lại không đứng vững mức 5%, nghóa giá không ảnh hưởng tới doanh số Trong đó, Advert A2 đứng vững mức 5% Điều có nghóa là, quảng cáo ảnh hưởng đến doanh số có biểu lợi nhuận biên giảm dần IV Kiểm định đồng thời số giả thuyết Tiếp theo ví dụ trên, ta muốn kiểm tra hiệu quảng cáo, ta phải kiểm tra đồng thời hai giả thuyết: H0 : β2 = β4 = ( quảng cáo hoàn toàn không tác dụng) H1 : tối thiểu hệ số khác (quảng cáo có tác dụng) Ta có mô hình không giới hạn, ta tiến hành ước lượng mô hình giới hạn với : β2 = β4 = tiếp theo, ta điền thông tin cần thiết vào template Ta loại bỏ giả thuyết H0 kết luận chi phí cho quảng cáo tác động lên doanh số V Mức quảng cáo tối ưu Chúng ta chứng tỏ quảng cáo có lợi nhuận biên giảm dần Mức quảng cáo tối ưu lợi nhuận biên chi phí biên quảng cáo; nghóa mức quảng cáo tối ưu lợi ích (doanh số) chi phí từ dollar chi phí tăng thêm cho quảng cáo Giải phương trình cho ta A* = (1 – b3)/2b4 , b3 b4 hệ số hồi quy ước lượng, , tức 2014 dollar Giả sử Andy muốn kiểm định xem mức 1900 có phải tối ưu không, thay 1.9 vào giả thuyết: H0 : β3 + 2β4(1.9) =1 H1 : β3 + 2β4(1.9) ≠1 Ta dùng kiểm định t để kiểm định giả thuyết: Tuy nhiên, ta phải tính thêm cov(b3, b4) Cách thứ ta dùng kiểm định F; ta ước lượng mô hình đầy đủ mô hình hạn chế Ta ước lượng mô hình hạn chế cách thay : β3 + 2β4(1.9) =1  β3 = – 3.8β4 vào mô hình gốc Si = β1 + β2Pi + β3Ai + β4A2 + εi Ta có mô hình hạn chế S – A = β1 + β2Pi + β4 (A2 – 3.8A) + εi Kết mô hình là: Ta copy thông tin cần thiết dán vào template ta tạo cho F-test Kết ta phủ nhận $1900 mức quảng cáo tối ưu mức độ định 5% Ta kiểm tra hai giả thuyết lúc, ví dụ, kèm với giả thuyết giả thuyết doanh số $80, giả sử giá $6 H0 : : β3 + 3.8β4 =1 vaø β1 + 6β2 + 1.9β3 + 3.61β4 H1 : tối thiểu hai giả thuyết sai đây, ta có giới hạn, J=2 nên ta phải dùng F-test Mô hình giới hạn thiết lập cách thay giới hạn vào mô hình goác: S – A – 80 – 1.9 = β2 (Pi -6) + β4 (A2 – 3.8A + 3.61) + εi Để ước lượng hàm số trên, ta tạo biến phụ thuộc độc lập tương ứng ước lượng bình thường Sau có mô hình giới hạn, ta copy thông tin cần thiết dán vào template Ftest tạo ( lưu ý K=4 J=2) VI Hồi quy với thông tin bổ trợ: Thông thường kinh tế, ta có số thông tin mô hình tập liệu Thông tin đến từ kinh nghiệm khứ, lí thuyết, …Nếu thông tin bổ trợ xác ta tăng độ xác mô ước lượng Để minh hoạ, ta nghiên cứu mô hình nhu cầu bia (Q) dựa giá (PB), giá rượu (PL), giá hàng hoá dịch vụ khác (PR), thu nhập (I) với liệu tập tin beer.xls thông tin bổ trợ khách hàng không bị “ảo giác tiền tệ”, tức tất giá thu nhập tăng lượng giống nhu cầu giữ nguyên Ta có mô hình: Ln(Q) = β1 + β2ln(PB) + β3ln(PL) + β4ln(PR) + β5ln(I) + εi Từ thông tin bổ trợ, ta có thêm giới hạn b2 + b3 + b4 + b5 =0 ta seõ đưa thông tin vào mô hình cách xếp lại giới hạn thành β4 = - β2 – β3 – β5 thay vào hàm số gốc Ta có : Ta gọi mô hình mô hình bình phương tối thiểu có giới hạn Kết sau : Để tính b4, ta thay số vào giới hạn b4 = - b2 – b3 – b5 , Mô hình cuối : Lưu ý : mô hình log-log cho ta thông tin « độ co dãn » giá trị biên tế mô hình bình thường VII Xây dựng mô hình : Bỏ sót yếu tố hữu ích : Nếu bạn bỏ sót yếu tố hữu ích mô hình, mô hình bạn bị thiên lệch Chúng ta nghiên cứu ví dụ gia đình có chồng vợ làm Dữ liệu chứa file edu_inc.xls Trước tiên, lập mô hình hồi quy thu nhập gia đình (FAMINC) dựa trình độ chồng (HE) vợ (WE) Kết : Tiếp theo, ta thử bỏ yếu tố trình độ vợ (WE) chạy mô hình có trình độ chồng (HE), ta có : Và mô hình khác bao gồm WE trẻ em trước tuổi đến trường KL6 : Ta thấy ước lượng thay đổi theo trường hợp ta bỏ sót yếu tố có liên quan tới mô hình Yếu tố thừa : Nếu đưa yếu tố thừa vào mô hình, ước lượng không thiên lệch, nhiên, độ xác ước lượng bị giảm xuống Cụ thể độ lệch chuẩn hàm hồi quy tăng lên Ví dụ, mô hình trên, ta thêm vào biến độc lập gọi XTRA_X5 XTRA_X6, kết : Ta thấy hai yếu tố tăng thêm có giá trị P cao, tức không đứng vững ta tiến hành kiểm định Ngoài ra, làm tăng độ lệch chuẩn mô hình Chọn mô hình : Chọn dạng mô hình là quan trọng Ngoài cách dùng lí thuyết để xây dựng mô hình, ta dùng tập liệu cho để xây dựng mô hình Quy trình gọi RESET (Regression Specification Error Test), ta dùng Ftest để kiểm định mô hình gốc (mô hình giới hạn) mô hình không giới hạn gồm mô hình gốc kèm với dạng bình phương Thông qua kiểm định, ta kết luận liệu tăng độ xác mô hình cách đưa thêm dạng bình phương vào mô hình RESET kiểm định đơn giản với H0 mô hình bạn đúng, H1 mô hình bạn thiếu sót Trong này, đề cập đến RESET (1), tức mô hình gốc kèm theo dạng bình phương Giả sử ta cho mô hình sau : FAMINC = β1 + β2 HE + β3 WE + e RESET(1) ta kèm vào mô hình gốc dạng bình phương giá trị dự đoán biến phụ thuộc: FAMINC = β1 + β2 HE + β3 WE + β4 ŷ2 + e Ta tiến hành sau: Mở file edu_inc.xls, tiến hành ước lượng mô hình giới hạn, tức mô hình gốc Sau có mô hình gốc ta tính giá trị dự đoán FAMINC từ mô hình giới hạn Ta tạo tiếp cột adjusted yhat nhập công thức = I2/10,000 trước bình phương để tránh số wá lớn Ta tạo cột yhat2 nhập công thức = J2^2 Sau ta ước lượng hàm số RESET(1) Ta có kết quả: Ta thấy dạng bình phương yhat2 có giá trị P nhỏ 0.05, ta kết luận dạng bình phương tăng độ xác mô hình ta nên đưa dạng bình phương vào mô hình Trong trường hợp này, ta kiểm định giả thuyết nên ta dùng giá trị P t-test Trong trường hợp ta muốn thêm dạng lập phương…., ta phải kiểm định hai giả thuyết đồng thời, ta phải dùng F-test VIII Đa cộng tuyến Khi hai nhiều biến độc lập có quan hệ chặt chẽ với nhau, ta có đa cộng tuyến Phương pháp bình phương tối thiểu không phân biệt ảnh hưởng biến cụ thể Khi đa cộng tuyến làm tăng độ lệch chuẩn ước lượng khiến ước lượng trở nên không vững ta thực kiểm định Khi ta có cặp biến độc lập nhiều liên hệ hoàn hảo, hồi quy không cho ta kết Trong thực tế, ta không gặp trường hợp liên hệ tuyến tính hoàn hảo, nhiên ta gặp mối liên hệ tuyến tính chặt chẽ đủ để làm hại mô hình Do đó, trước xây dựng mô hình, ta phải đảm bảo yếu tố có mức liên hệ giới hạn cho phép Ta nghiên cứu ví dụ quan hệ số dăm xe với gallon xăngï (MPG) số piston máy Ta mở tập liệu cars.xls thực hồi quy sau: có kết sau: Bây ta thêm biến: diện tích máy tính theo inch vuông (ENG) trọng lượng (WGT) Kết cho ta thấy mối quan hệ MPG CYL khác Giá trị CYL nhỏ, độ lệch chuẩn cao, ta thực t-test thấy mối quan hệ không đáng kể Điều phi lí Tuy nhiên, ta kiểm định CYL ENG lúc thấy chúng có mối quan hệ đáng kể với MPG Đây triệu chứng đa cộng tuyến CYL ENG Ta kiểm tra thêm cách tính hệ số quan hệ CYL ENG Ta vào Tools/Data Analysis/Correlation Ta có kết Ta thấy yếu tố ENG, CYL, WGT có quan hệ chặt chẽ Ta nghiên cứu sâu mối quan hệ cách quan sát R2 mô hình hồi quy EGN dựa CYL WGT: CYL dựa ENG WGT WGT dựa ENG WGT Các nhà kinh tế lượng có nhiều định nghóa quan hệ chặt chẽ Một số nhà nghiên cứu cho R2>80% chặt chẽ Một số nhà nghiên cứu lại cho R2>50% có vấn đề Vì thế, ta nên tuỳ vấn đề mà chọn tiêu chí cho phù hợp ... β3ln(PL) + β4ln(PR) + β5ln(I) + εi Từ thông tin bổ trợ, ta có thêm giới hạn b2 + b3 + b4 + b5 =0 ta đưa thông tin vào mô hình cách xếp lại giới hạn thành β4 = - β2 – β3 – ? ?5 thay vào hàm số gốc... rộng : Và ta có kết Ta thấy, giá P lại không đứng vững mức 5% , nghóa giá không ảnh hưởng tới doanh số Trong đó, Advert A2 đứng vững mức 5% Điều có nghóa là, quảng cáo ảnh hưởng đến doanh số có... rộng mô hình thành: Si = β1 + β2Pi + β3Ai + β4A2 + εi Trong worksheet chứa liệu, ta tạo thêm biến độc lập tên “ A2” nhập công thức = C2^2 vào ô D2 copy công thức hết vùng liệu Ta thực ước lượng

Ngày đăng: 06/12/2015, 18:14

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w