Bài giảng Kinh tế lượng - Chương 5: Hồi quy với biến giả cung cấp các kiến thức giúp người học có thể biết cách đặt biến giả, nắm được phương pháp sử dụng biến giả trong phân tích hồi quy. Mời các bạn cùng tham khảo nội dung chi tiết.
06/11/2018 Chương 5: HỒI QUY VỚI BIẾN GIẢ GV Phan Trung Hiếu -Biết cách đặt biến giả -Nắm phương pháp sử dụng biến giả phân tích hồi quy I Khái niệm biến giả: I Định nghĩa: -Biến định lượng: giá trị quan sát thể số -Biến định tính: giá trị khơng thể số, thể đặc điểm, tính chất Một biến định tính có đặc điểm, hai đặc điểm, ba đặc điểm nhiều LOG O Biến định tính Đặc điểm Đặc điểm Giới tính Nam Nữ Điểm bán hàng Thành thị Nơng thơn Tơn giáo Có Khơng Có Khơng có Bằng cấp đại học đại học Biến định tính ĐĐ1 Thành Địa bàn cơng tác phố Tình trạng sở hữu Tư doanh nghiệp nhân Làm để đưa biến định tính vào mơ hình? Lượng hóa biến định tính Gán cho đặc điểm biến định tính số Sau lượng hóa, biến định tính gọi biến giả ĐĐ2 ĐĐ3 Nông Miền núi thôn Quốc Liên kết với doanh nước ngồi II Mơ hình hồi quy với biến giả: Ví dụ 4.1:Khảo sát thu nhập giảng viên theo trình độ (cử nhân-CN hay thạc sĩ-ThS) ta bảng số liệu sau Số biến giả = Số đặc điểm - -Thường lượng hóa cho đặc điểm hai số: Hồi quy với biến định tính với đặc điểm: Ta đặt biến giả Z, Zi = : đặc điểm Zi = : đặc điểm Hoặc ngược lại a) Hãy đặt biến giả tạo lập bảng số liệu theo biến giả b) Hãy tìm hàm hồi quy tuyến tính mẫu thu nhập theo trình độ nêu ý nghĩa hàm hồi quy ý nghĩa hệ số hồi quy 06/11/2018 Giải Gọi Y: thu nhập giảng viên (triệu đồng/tháng) Cách 1: a) Zi giảng viên có trình độ cử nhân Zi giảng viên có trình độ thạc sĩ Ta có bảng số liệu sau đặt biến giả: Cách 2: a) Zi giảng viên có trình độ thạc sĩ Zi giảng viên có trình độ cử nhân Ta có bảng số liệu sau đặt biến giả: 4, 44 3,62 Z 4, 44; 3, 62; (SRF ) : Y b) i i Ý nghĩa hàm hồi quy: 4,44 : thu nhập trung bình giảng viên Zi Y i có trình độ ……… ……… triệu đồng/tháng i 4, 44 3,62 8, 06 : thu nhập trung Zi Y bình giảng viên có trình độ ………… …… triệu đồng/tháng Ý nghĩa hệ số hồi quy: 4, 44 cho biết giảng viên có trình độ ……… thu nhập trung bình …… triệu đồng/tháng 3, 62 cho biết mức chênh lệch thu nhập trung bình …………và ……… ……… triệu đồng/tháng 8, 06 3,62 Z 8, 06; 3, 62; (SRF ) : Y b) i i Ý nghĩa hàm hồi quy: i 8, 06 : thu nhập trung bình giảng Zi Y viên có trình độ ………… …… triệu đồng/tháng 8,06 3,62 4,44 : thu nhập trung bình Zi Y i giảng viên có trình độ ……… ……… triệu đồng/tháng Ý nghĩa hệ số hồi quy: 8, 06 cho biết giảng viên có trình độ ……… thu nhập trung bình …… triệu đồng/tháng 3, 62 cho biết mức chênh lệch thu nhập Hồi quy với biến định tính với đặc điểm: Ta đặt biến giả Z1, Z2 trung bình …………và ……… ……… triệu đồng/tháng 10 Ví dụ 4.2: Khảo sát thu nhập giảng viên theo trình độ (cử nhân-CN; thạc sĩ-ThS tiến sĩ-TS) ta bảng số liệu sau 1: đặc điểm Z1i : đặc điểm khác 1: đặc điểm Z2i 0 : đặc điểm khác Khi đó, Z1i = Z2i = : đặc điểm 11 12 06/11/2018 a) Hãy đặt biến giả tạo lập bảng số liệu theo biến giả Ta có bảng số liệu sau đặt biến giả: Gọi Y: thu nhập giảng viên (triệu đồng/tháng) 1 : cử nhân Z1i 0 : trình độ khác Như vậy, ta có Cử nhân: 1: thạc só Z2 i 0 : trình độ khác Thạc sĩ: Tiến sĩ: 13 b) Hãy tìm hàm hồi quy tuyến tính mẫu thu nhập theo trình độ nêu ý nghĩa hàm hồi quy 14 ( SRF ) : Yi 10,82 6, 38Z1i 2, 76 Z 2i Ý nghĩa hàm hồi quy: 10,82 thu nhập trung bình Z1i Z i Y i giảng viên có trình độ …… …… triệu đồng/tháng 10,82 6,38 4, 44 thu nhập Z 1, Z Y i 1i 2i trung bình giảng viên có trình độ …… … … triệu đồng/tháng 10,82 2,76 8,06 thu nhập Z 0, Z Y 1i 2i i trung bình giảng viên có trình độ …… triệu đồng/tháng … … 10,82; 6,38; 2, 76 15 c) Nêu ý nghĩa hệ số hồi quy 10,82 cho biết thu nhập trung bình giảng viên có trình độ ………… ……… triệu đồng/tháng 6,38 cho biết mức chênh lệch thu nhập trung bình ………và ………… …… triệu đồng/tháng Nói cách khác, thu nhập trung bình ………cao ………… ……… triệu đồng/tháng 2, 76 cho biết mức chênh lệch thu nhập trung bình ……… ………… ………triệu đồng/tháng Nói cách khác, thu nhập trung bình ……… cao ……… ……… triệu đồng/tháng 16 III Kỹ thuật sử dụng biến giả: Hồi quy với biến định lượng biến định tính với đặc điểm: Ta có biến lượng X ta đặt biến giả Z, Zi = : đặc điểm Zi = : đặc điểm Hoặc ngược lại Nhận xét: Mức thu nhập trung bình tiến sĩ tiêu chuẩn để so sánh, ta gọi đặc điểm tiến sĩ đặc điểm sở 17 18 06/11/2018 Ví dụ 4.3: Khảo sát lương giáo viên theo số năm giảng dạy, ta có mơ hình Y X U Y: lương giáo viên, X: số năm giảng dạy, xem xét yếu tố giới tính có tác động đến thu nhập khơng? Z: giới tính với Z=1: nam; Z=0: nữ TH1: Lương khởi điểm GV nam nữ khác tốc độ tăng lương theo số năm giảng dạy TH2: Lương khởi điểm tốc độ tăng lương khác TH3: Lương khởi điểm khác tốc độ tăng lương khác 19 20 TH1: Dịch chuyển số hạng tung độ gốc Đặt Z Khi Hàm PRF: Y Z X U Hàm SRF ứng với nữ (Z=0): X Y Hàm SRF ứng với nam (Z=1): X Y Để xét xem yếu tố giới tính có thực ảnh hưởng đến lương giáo viên hay khơng ta phải tiến hành kiểm định giả thuyết 21 Ý nghĩa hệ số hồi quy: 22 TH2: Dịch chuyển số hạng độ dốc Đặt 1 Z Khi Hàm PRF: Y X 1 ( Z X ) U Hàm SRF ứng với nữ (Z=0): X Y Hàm SRF ứng với nam (Z=1): X Y 23 24 06/11/2018 Ý nghĩa hệ số hồi quy: Để xét xem yếu tố giới tính có thực ảnh hưởng đến lương giáo viên hay khơng ta phải tiến hành kiểm định giả thuyết 25 26 TH3: Dịch chuyển số hạng độ dốc số hạng tung độ gốc Đặt Z 1 Z Khi Hàm PRF: Y X Z 1 ( ZX ) U Hàm SRF ứng với nữ (Z=0): X Y Để xét xem yếu tố giới tính có thực ảnh hưởng đến lương giáo viên hay khơng ta phải tiến hành kiểm định giả thuyết Hàm SRF ứng với nam (Z=1): X Y 27 28 Ý nghĩa hệ số hồi quy: 29 30 06/11/2018 Hồi quy với biến định lượng biến định tính với nhiều đặc điểm: Ví dụ 4.4: Giả sử muốn hồi quy thu nhập giảng viên theo thâm niên nơi giảng dạy (thành phố, đồng bằng, miền núi) Mơ hình hồi quy E (Y | X , Z1 , Z ) 1 X 3 Z1 Z Khi đó, ta có E (Y | X , Z1 0, Z 0) 1 X : Thu nhập trung bình giảng viên miền núi E (Y | X , Z1 1, Z 0) 1 X :Thu nhập trung bình giảng viên thành phố E (Y | X , Z1 0, Z 1) 1 X :Thu nhập trung bình giảng viên đồng Y (triệu đồng/tháng): Thu nhập giảng viên X (năm): Thâm niên giảng dạy Z1 = 1: thành phố; Z1 = 0: nơi khác Z2 = 1: đồng bằng; Z2 = 0: nơi khác 31 32 IV So sánh cấu trúc: V Hồi quy tuyến tính khúc: Ví dụ 5.6: Doanh thu X* tiền hoa hồng khác với doanh thu X* Hàm hồi quy có dạng Xem trang … Yi X i ( X i X * )Z i U i Y X X* Zi Zi 33 Tiền hoa hồng Doanh thu Giá trị ngưỡng sản lượng =1 Xi > X* =0 Xi ≤ X* 34 Y VI Phân tích mùa: Y chi tiêu cho tiêu dùng X thu nhập Z = quan sát mùa (tháng 1-6) Z = quan sát không nằm mùa (tháng 7-12) X* X Hình 5.1 Hàm tuyến tính khúc •Kiểm định giả thiết H: 3=0 Nếu bác bỏ H: hàm hồi quy thay đổi cấu trúc 35 TH1: Nếu yếu tố mùa TH2: Nếu yếu tố ảnh hưởng đến hệ mùa có ảnh hưởng số chặn đến hệ số góc Yˆi ˆ1 ˆ2 Xi ˆ3Zi Yˆi ˆ1 ˆ2 X i ˆ3 Z i ˆ4 X i Z i (*) Mơ hình * có tính tổng quát Qua việc kiểm định giả thiết để biết hệ số góc có ý nghĩa 36 SO SÁNH CẤU TRÚC (KIỂM ĐỊNH TÍNH ỔN ĐỊNH CẤU TRÚC) Giả thiết: Cho số liệu Y X hai thời kì (giai đoạn) I II Các câu hỏi thường gặp: -Hai hồi quy hai thời kì có khác khơng? -Có khác mặt cấu trúc hồi quy hai thời kì (giai đoạn) khơng? -Có khác biến phụ thuộc Y hai thời kì (giai đoạn) khơng? PHƯƠNG PHÁP KIỂM ĐỊNH CHOW: Các bước làm: Bước 1: Tiến hành hồi quy toàn số liệu, với cỡ mẫu n quan sát, ta RSS Bước (Tiến hành hồi quy giai đoạn): -Giai đoạn I: có n1 quan sát, tiến hành hồi quy giai đoạn I, ta RSS1 -Giai đoạn II: có n2 quan sát, tiến hành hồi quy giai đoạn II, ta RSS Chú ý: n n1 n2 H : Hai hồi quy nhö Bước 3: Đặt giả thiết: H : Hai hồi quy khác Bước 4: Tính RSS RSS1 RSS Bước 5: Tính F ( RSS RSS ).(n 2k ) , k số biến mơ hình k RSS Bước 6: Tìm F ( k , n 2k ) (tra bảng phân phối Fisher đề cho sẵn) Bước (Kết luận): -Nếu F F ( k , n 2k ) ta chấp nhận H -Nếu F F ( k , n 2k ) ta bác bỏ H PHƯƠNG PHÁP BIẾN GIẢ: Các bước làm: Bước 1: Đặt biến giả Bước 2: Lập bảng số liệu gồm Y X Z XZ (Lấy tương ứng số liệu cột X nhân với số liệu cột … … … Z) Tiến hành hồi quy cho bảng số liệu mới: Y theo X, Z, XZ Giả sử, mơ hình cần ước lượng Y 1 X Z ( XZ ) H : Bước 4: Kiểm định giả thiết (Dùng kiểm định T phương pháp p_value) H : H : Bước 5: Kiểm định giả thiết (Dùng kiểm định T phương pháp p_value) H : Bước (Kết luận): Kết kiểm định Kết luận Hai hồi quy khác Hai hồi quy Ví dụ 4.5: Số liệu tiết kiệm (Y) thu nhập (X) nước Anh từ năm 1946 đến 1963 cho bảng sau Thời kì I Y X Thời kì II Y X 1946 0,36 8,8 1955 0,59 15,5 1947 0,21 9,4 1956 0,90 16,7 1948 0,08 10,0 1957 0,95 17,7 1949 0,20 10,6 1958 0,82 18,6 1950 0,10 11,0 1959 1,04 19,7 1951 0,12 11,9 1960 1,53 21,1 1952 0,41 12,7 1961 1,94 22,8 1953 0,50 13,5 1962 1,75 23,9 1954 0,43 14,3 1963 1,99 25,2 Tiến hành hồi quy Y theo X cho toàn số liệu trên, ta kết Included observations: 18 Variable Coefficient C -1,082 X 0,1178 Sum squared resid: 0,5722 Tiến hành hồi quy Y theo X thời kì I (từ năm 1946 đến 1954), ta kết Included observations: Variable Coefficient C -0,26625 X 0,047 Sum squared resid: 0,1396 Tiến hành hồi quy Y theo X thời kì II (từ năm 1955 đến 1963), ta kết Included observations: Variable Coefficient C -1,75 X 0,1504 Sum squared resid: 0,1931 Với mức ý nghĩa 5%, có khác mặt cấu trúc hồi quy hai thời kì khơng? Giải 0, 05 H : Hai hồi quy H : Hai hồi quy khác Ta có: RSS ……… RSS1 …… RSS …… RSS RSS1 RSS ……………………… ( RSS RSS ).(n 2k ) ………………………………………………… k RSS F (k , n 2k ) ……………………………………………………………… F Vì ……………………… nên ta …………… H ……………… H , nghĩa là…………… ………………………………………………………………………………………………… Ví dụ 4.6: Số liệu tiết kiệm (Y) thu nhập (X) nước Anh từ năm 1946 đến 1963 cho bảng sau Thời kì I Y X Thời kì II Y X 1946 0,36 8,8 1955 0,59 15,5 1947 0,21 9,4 1956 0,90 16,7 1948 0,08 10,0 1957 0,95 17,7 1949 0,20 10,6 1958 0,82 18,6 1950 0,10 11,0 1959 1,04 19,7 1951 0,12 11,9 1960 1,53 21,1 1952 0,41 12,7 1961 1,94 22,8 1953 0,50 13,5 1962 1,75 23,9 1954 0,43 14,3 1963 1,99 25,2 Đặt 1: thời kì I Zi 0 : thời kì II Lập bảng số liệu Z Y X XZ Z Y X XZ 0,36 8,8 8,8 0,59 15,5 0,21 9,4 9,4 0,90 16,7 0,08 10,0 10,0 0,95 17,7 0,20 10,6 10,6 0,82 18,6 0,10 11,0 11,0 1,04 19,7 0,12 11,9 11,9 1,53 21,1 0,41 12,7 12,7 1,94 22,8 0,50 13,5 13,5 1,75 23,9 0,43 14,3 14,3 1,99 25,2 Tiến hành hồi quy cho bảng số liệu mới: Y theo X, Z, XZ, ta Variable Coefficien Std Error t-Statistic Prob t C -1.750172 0.331888 -5.273377 0.0001 X 0.150450 0.016286 9.238172 0.0000 Z 1.483923 0.470362 3.154852 0.0070 XZ -0.103422 0.033260 -3.109471 0.0077 Với mức ý nghĩa 5%, có khác mặt cấu trúc hồi quy hai thời kì khơng? Giải 0, 05 Gọi hệ số hồi quy biến Z; hệ số hồi quy biến XZ H : -Kiểm định giả thiết Ta có p _ value nên ta …………… H H : ……………… H , nghĩa ……………… (1) H : -Kiểm định giả thiết Ta có p _ value nên ta …………… H H : ……………… H , nghĩa ……………… (2) Từ (1) (2), ……………………………………………………………………………… Bài tập Kinh tế lượng Bài tập Chương Bài 1: Một số chuyên gia cho rằng, mức lương người lao động ngành dệt may ngồi phụ thuộc vào số năm kinh nghiệm cịn phụ thuộc vào giới tính (Nam Nữ) phụ thuộc vào vùng đặt nhà máy (Bắc, Trung, Nam) Bằng kiến thức kinh tế, anh chị a) Đề xuất mơ hình hồi quy quan hệ nhằm so sánh mức lương Nam so với Nữ phụ thuộc miền Bắc, miền Nam so với miền Trung b) Nêu ý nghĩa hệ số mơ hình đề xuất Bài 2: Dưới phần bảng kết sử dụng phần mềm Eviews để phân tích số liệu trường đại học mức lương giáo sư đại học (Y: ngàn USD/năm), số năm kinh nghiệm giảng dạy (X: năm) giới tính (nam: Z = 1, nữ: Z = 0) 15 người a) Viết hàm hồi quy tuyến tính mẫu mức lương giáo sư đại học theo số năm kinh nghiệm giảng dạy giới tính Cho biết ý nghĩa hệ số hồi quy riêng b) Với độ tin cậy 96%, tìm khoảng tin cậy hệ số hồi quy c) Với mức ý nghĩa 5%, cho biết giới tính có ảnh hưởng đến mức lương giáo sư đại học hay không? Bài 3: Dưới phần bảng kết sử dụng phần mềm Eviews để phân tích số liệu lượng hàng bán sản phẩm Y (tấn/tháng), thu nhập người tiêu dùng X (triệu đồng/tháng) nơi bán (thành phố: Z = 1, nông thôn: Z = 0) khu vực bán hàng a) Viết hàm hồi quy tuyến tính mẫu Y theo X Z Cho biết ý nghĩa hệ số hồi quy riêng b) Tìm tổng bình phương độ lệch c) Giả sử, ứng với thu nhập X = triệu đồng/tháng, cho biết lượng hàng bán trung bình thành phố nông thôn d) Với độ tin cậy 95%, tìm khoảng tin cậy hệ số hồi quy biến X e) Có ý kiến cho rằng: hệ số hồi quy biến X khác Với mức ý nghĩa 1%, có nên tin vào ý kiến khơng? f) Với mức ý nghĩa 5%, cho biết nơi bán có ảnh hưởng đến lượng hàng bán không? g) Kiểm định phù hợp hàm hồi quy mẫu với mức ý nghĩa 5% h) Với mức ý nghĩa 5%, có nên bỏ biến Z khỏi mơ hình khơng? Biết mơ hình hồi quy tuyến tính mẫu hai biến Y theo X có hệ số xác định 0,90711 Bài 4: Người ta cho chi tiêu mặt hàng A (Y: triệu đồng/tháng) không phụ thuộc vào thu nhập người tiêu dùng (X: triệu đồng/tháng) mà phụ thuộc vào giới tính người tiêu dùng (D = nam D = nữ) Với số liệu mẫu gồm 20 quan sát, người ta ước lượng mơ hình 10 Bài tập Kinh tế lượng Y 6, 426 0, 098 X 2, 453D 0, 025 XD Se (3,628) (0, 032) (0,988) (0, 011) a) Nêu ý nghĩa hệ số hồi quy b) Tìm khoảng tin cậy hệ số hồi quy biến XD với độ tin cậy 95% c) Với mức ý nghĩa 5%, chi tiêu mặt hàng A nam nữ có giống hay khơng? X Z , Y mức chi tiêu cho mặt hàng A (100 Bài 5: Xét hàm hồi quy mẫu Y ngàn đồng/tháng), X thu nhập người tiêu dùng (triệu đồng/tháng), Z giới tính (Z = nam Z = nữ) Với số liệu mẫu có kích thước n = 20, người ta tìm kết sau Y 4,1365 0,5133 X 0,2053Z 0,325XZ t (4,889) (11,35) (0,557) (2, 42) R 0,7485 a) Nêu ý nghĩa hệ số hồi quy b) Kiểm định giả thuyết H : 2 0,6 với mức ý nghĩa 5% c) Tính hệ số xác định mơ hình có hiệu chỉnh d) Kiểm định phù hợp mơ hình với mức ý nghĩa 5% e) Với mức ý nghĩa 5%, chi tiêu mặt hàng A nam nữ có khác hay khơng? Bài 6: Cho bảng kết sau xử lý Eviews Y tổng chi phí (USD), X tổng sản lượng (sản phẩm), Z = 1000 X 5000 (Phân khúc 1) Z = 6000 X 10000 (Phân khúc 2) a) Viết phương trình hồi quy tuyến tính mẫu b) Viết phương trình hồi quy tuyến tính mẫu ứng với phân khúc c) Một ý kiến cho tổng sản lượng tăng sản phẩm tổng chi phí trung bình phân khúc tăng nhiều tổng chi phí trung bình phân khúc Với mức ý nghĩa 1%, nhận xét ý kiến 11 ... 1946 0,36 8,8 1 955 0 ,59 15, 5 1947 0,21 9,4 1 956 0,90 16,7 1948 0,08 10,0 1 957 0, 95 17,7 1949 0,20 10,6 1 958 0,82 18,6 1 950 0,10 11,0 1 959 1,04 19,7 1 951 0,12 11,9 1960 1 ,53 21,1 1 952 0,41 12,7 1961... 1946 0,36 8,8 1 955 0 ,59 15, 5 1947 0,21 9,4 1 956 0,90 16,7 1948 0,08 10,0 1 957 0, 95 17,7 1949 0,20 10,6 1 958 0,82 18,6 1 950 0,10 11,0 1 959 1,04 19,7 1 951 0,12 11,9 1960 1 ,53 21,1 1 952 0,41 12,7 1961... Error t-Statistic Prob t C -1 . 750 172 0.331888 -5 . 273377 0.0001 X 0. 150 450 0.016286 9.238172 0.0000 Z 1.483923 0.470362 3. 154 852 0.0070 XZ -0 .103422 0.033260 -3 .109471 0.0077 Với mức ý nghĩa 5% ,