Giải thích tỷ lệ phần trăm hệ số co giãn thuận tiệnHệ số độ dốc của các biến lấy log là bất biến đối với thay đổi tỷ lệLấy log thường loại bỏ giảm nhẹ vấn đề các giá trị bất thườngLấy log thường giúp bảo đảm tính chuẩn và phương sai không đổiCác biến sử dụng đơn vị đo lường như năm thì không nên lấy logCác biến sử dụng đơn vị đo lường tỷ lệ phần trăm cũng không nên lấy logLog không nên sử dụng nếu biến có giá trị 0 hoặc âmCó khó khăn khi lấy toán tử ngược của log trong xây dựng dự đoán
Phân tích hồi quy bội: Một số vấn đề mở rộng Chương Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng 6.1 Bàn thêm dạng hàm hồi quy Bàn thêm dạng hàm logarit Giải thích tỷ lệ phần trăm/ hệ số co giãn thuận tiện Hệ số độ dốc biến lấy log bất biến thay đổi tỷ lệ Lấy log thường loại bỏ / giảm nhẹ vấn đề giá trị bất thường Lấy log thường giúp bảo đảm tính chuẩn phương sai khơng đổi Các biến sử dụng đơn vị đo lường năm không nên lấy log Các biến sử dụng đơn vị đo lường tỷ lệ phần trăm không nên lấy log Log khơng nên sử dụng biến có giá trị âm Có khó khăn lấy tốn tử ngược log xây dựng dự đốn © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Sử dụng dạng hàm bậc Ví dụ: Phương trình lương Tác động biên Dạng hàm lõm Có năm kinh nghiệm tăng 0,298-2 (0,0061) (1) = 0,29 $, Có năm kinh nghiệm lương tăng 0,298-2 (0,0061) (2) = 0,27 $, © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Cực đại lương tương ứng với số năm kinh nghiệm Liệu điều có nghĩa số năm kinh nghiệm nhiều 24,4 năm trở nên tiêu cực? Không cần thiết Nó phụ thuộc vào có quan sát mẫu nằm bên phải điểm cực đại Trong ví dụ trên, có khoảng 28% quan sát nằm bên phải Có thể có vấn đề lỗi định mơ hình (ví dụ biến bị bỏ sót) © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Nitơ oxit không khí, khoảng cách từ trung tâm việc làm, tỷ lệ sinh viên / giáo viên Ví dụ: Ảnh hưởng ô nhiễm tới giá nhà đất: Mô hình giá nhà với đặc điểm cộng đồng Điều có nghĩa rằng, mức đó, nhiều phịng có liên quan với giá thấp hơn? price log(price) price .545 124rooms rooms rooms %Δprice = 100.(-0.545+0.124 rooms) Δrooms Vậy số phòng tăng lên giá nhà thay đổi (-0.545 + 0.124 rooms).100% (tỷ lệ thay đổi phụ thuộc số phòng tại) © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Tính tốn điểm cực tiểu Điểm cực tiểu: Diện tích bỏ qua liên quan đến có 1% quan sát Gia tăng số phòng từ lên 6: Gia tăng số phịng từ lên 7: © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Khả khác price log(price) price %price 1 2 [log(nox)] log(nox ) nox % nox nox nox tăng 1% price thay đổi {β1 + 2β2[log(nox)]} % Đa thức bậc cao © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Mơ hình với số hạng tương tác Số hạng tương tác Tác động số phịng ngủ phụ thuộc vào diện tích Giải thích tham số phức tạp có tác động tương tác Tác động số phịng ngủ, diện tích © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Xác định lại tham số mơ hình tương tác Mục đích: Thể ý nghĩa cần nghiên cứu hệ số biến gốc Mơ hình ban đầu: Trung bình tổng thể; thay trung bình mẫu Mơ hình xác lại tham số Tác động x2 tất biến cố định giá trị trung bình Lợi ích việc xác định lại tham số Dễ dàng giải thích tất tham số Sai số chuẩn cho tác động riêng phần giá trị trung bình có sẵn Nếu cần thiết, mơ hình tương tác phân tích giá trị quan tâm khác ngồi giá trị trung bình 1 , 2 © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng 6.2 Nói thêm độ phù hợp lựa chọn biến độc lập Nhận xét chung R-squared Một R-squared cao không ngụ ý có quan hệ nhân Một R-squared thấp ước lượng xác tác động riêng phần nhiên sẽ khó việc dự báo Có thể sử dụng R2 để lựa chọn nhiều mơ hình khác phải thỏa nguyên tắc : - Cùng mẫu - Dạng biến phụ thuộc giống - Cùng số biến độc lập dù biến độc lập dạng lúc mơ hình có R2 cao chọn © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng R-squared hiệu chỉnh R2 R-squared tổng thể R-squared thông thường định nghĩa gì? ước lượng Một ước lượng khác có xét đến bậc tự sẽ Bậc tự tử số mẫu số R-squared hiệu chỉnh có tính đến hệ việc thêm biến độc lập R-squared hiệu chỉnh gia tăng nếu, thống kê t biến độc lập thêm vào (hay F kiểm định ý nghĩa đồng thời nhóm biến thêm vào ) có trị tuyệt đối lớn Mối liên hệ R-squared R-squared hiệu chỉnh R-squared hiệu chỉnh lấy giá trị âm © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Sử dụng R-squared hiệu chỉnh để chọn lựa mơ hình khơng lồng ( R lớn chọn) Nguyên tắc sử dụng R2 – hiệu chỉnh ( R 2) lựa chọn mơ hình: - Cùng mẫu - Dạng biến phụ thuộc giống Việc so sánh R-squared hai mơ hình sẽ khơng cơng với mơ hình mơ hình chứa tham số nên dùng R Trong ví dụ trên, mơ hình bậc hai ưa thích R cao © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Ngoài R2 R , thêm tiêu chuẩn khác để chọn mơ hình như: AIC (Akaike information criterion) BIC ( Baysian information criterion) Điều kiện dùng AIC BIC giống R : - Cùng mẫu - Dạng biến phụ thuộc giống Nguyên tắc lựa chọn: - R2, R lớn tốt - AIC BIC nhỏ tốt Các phần mềm kinh tế lượng có câu lệnh để tính tốn tiêu chuẩn © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng 6.3 Phân tích dự đốn sai số dự đốn 6.3.1 Dự đốn điểm cho giá trị trung bình giá trị cá biệt (cụ thể) Cho hàm hồi quy y 0 1 x1 k xk u (1) Giả sử x1 , x2, …,xk nhận giá trị c1, c2, …,ck Dự đốn (ước lượng) điểm cho giá trị trung bình E(y|x1= c1, …, xk=ck) giá trị cá biệt y0 là: ˆ0 yˆ ˆ0 ˆ1c1 ˆk ck Tức thay biến x giá trị cho c vào hồi quy mẫu yˆ ˆ0 ˆ1 x1 ˆk xk © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng 6.3.2 Khoảng tin cậy cho giá trị trung bình Cho hàm hồi quy y 0 1 x1 k xk u (1) Giả sử x1 , x2, …,xk nhận giá trị c1, c2, …,ck Dự đốn (ước lượng) điểm cho giá trị trung bình E(y|x1= c1, …, xk=ck)? Thay β0 = θ0 – β1c1– β2c2 –…– βkck vào hàm hồi quy biến đổi, ta được: y 0 1 ( x1 c1 ) k ( xk ck ) u (2) E[ y| x1= c1, …,xk = ck ) = θ0 khoảng tin cậy cho giá trị trung bình khoảng tin cậy cho θ0 ˆ0 se(ˆ0 ) t (n/2k 1) Với ˆ0 ước lượng điểm θ0 (2) ˆ0 ,se(ˆ0 ) có nhờ chạy hồi quy (2), tức hồi quy y theo (x1- c1), (x2- c2), …,(xk- ck ), ( ý ˆ0 yˆ ) © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Ví dụ1: Hồi quy colgpa theo sat, tothrs, ta có: colgpa = 0.5291+ 0.0019sat +0.0025 tothrs Hãy dự đoán giá trị trung bình colgpa sat =1000 tothrs= 120? Thay sat =1000, tothrs=120, ta ước lượng điểm colgpa ˆ0 = 2,7633 Trong R, dùng lệnh predict để dự đoán ước lượng điểm khoảng tin cậy giá trị trung bình sat =1000, tothrs=120 sau : ˆ0 >ketqua cvalues predict(ketqua, cvalues, se.fit= TRUE, interval = "confidence",level = 0.99) fit lwr upr 2.763298 2.711859 2.814737 Cận $se.fit Cận [1] 0.0199606 Se(ˆ0 ) $df [1] 4134 $residual.scale Bảng [1] 0.5946301 © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng 6.3.3 Khoảng dự báo cho giá trị cá biệt y0 y 0 1 x1 k xk u Cho hàm hồi quy Giả sử x1 , x2, …,xk nhận giá trị c1, c2, …,ck Dự đoán (ước lượng) khoảng cho giá trị cá biệt y0, với y 0 1c1 k ck u0 ˆ0 se(eˆ ) t (n/2k 1) Khoảng dự báo: Trong đó: ˆ0 ước lượng điểm y0 se(eˆ ) se(ˆ0 ) ˆ 0 0 ( eˆ y yˆ y ˆ0 ) © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng Ví dụ2: Với hồi quy colgpa theo sat, tothrs phần dự báo khoảng cho giá trị trung bình Tìm dự báo khoảng cho giá trị cá biệt colgpa sat = 1000, tothrs=120 Dựa vào bảng 1, ta có: ˆ0 2.7633 se (ˆ0 ) 0.01996 0.02 ˆ 0.5946 Nên khoảng dự báo cho giá trị cá biệt colgpa với mức ý nghĩa 5% là: 2.7633 ± [(0.02)2 + (0.5946)2]1/2 * 1.96 = ( 1.5975; 3.9291 ) Trong R, tìm dự báo khoảng lệnh predict với đối số interval=“prediction”: >ketquacvaluespredict(ketqua,cvalues,interval = "prediction",level = 0.95) fit lwr upr 2.763298 1.596846 3.929749 © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng * Dưới giả định thêm vào độc lập với : Dự đốn y © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Một số vấn đề mở rộng 6.4 So sánh mơ hình với biến phụ thuộc có dạng khác R-squared R-squared hiệu chỉnh không sử dụng để so sánh mơ hình mà chúng có dạng hàm biến phụ thuộc khác Ví dụ: Sự bồi thường CEO hiệu làm việc công ty log(salary) biến thiên salary Khơng thể dùng R2 hay R2-hiệu chỉnh để so sánh hai mơ hình bên dạng biến phụ thuộc khác © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part