Bài giảng Phân tích dữ liệu nghiên cứu: Chủ đề 4 giúp người học hiểu về Biến độc lập định tính (hoặc biến giả). Nội dung trình bày cụ thể gồm có: Hồi qui với biến độc lập đều là biến định tính, hồi qui với các biến độc lập định lượng và các biến định tính.
Chủ đề 4: BIẾN ĐỘC LẬP ĐỊNH TÍNH (HOẶC BIẾN GIẢ) Lê Kim Long Phạm Thành Thái Khoa Kinh tế - NTU I Hồi qui với biến độc lập biến định tính Trường hợp biến định tính có hai lựa chọn Ví dụ, hai ngơi nhà có đặc trưng, có hồ bơi ngơi nhà lại khơng có Tương tự, hai nhân viên cơng ty có tuổi, học vấn, kinh nghiệm, người nam người nữ… Để phát triển mặt lý thuết, lấy ví dụ lương đặt Yi tiền lương hàng tháng nhân viên thứ i công ty Để đơn giản mặt sư phạm, bỏ qua biến khác có ảnh hưởng đến lương tập trung vào giới tính Vì biến giới tính khơng phải biến định lượng cách trực tiếp nên định nghĩa biến giả gọi D (Dummy variables), biến giả biến nhị nguyên nhận giá trị với nam nhân viên với nữ nhân viên Lưu ý cách định nghĩa hồn tồn ngẫu nhiên Nhóm mà giá trị D gọi nhóm điều khiển (Control group) I Hồi qui với biến độc lập biến định tính Trường hợp biến định tính có hai lựa chọn Bây thiết lập ước lượng mơ hình sử dụng biến biến giải thích Dạng đơn giản mơ sau: Yi D i U i (6.1) Chúng ta giả sử sai số ngẫu nhiên thỏa mãn giả thiết mơ hình hồi qui tuyến tính cổ điển Chúng ta lấy kỳ vọng có điều kiện Y với D cho trước phương trình sau: Đối với nam: E(Y / D 1) 1 2 (6.2) Đối với nữ: E (Y / D 0) 1 (6.3) I Hồi qui với biến độc lập biến định tính Trường hợp biến định tính có hai lựa chọn Vậy, 1 lương trung bình nhóm điều khiển (nhân viên nữ) 2 khác biệt kỳ vọng lương trung bình hai nhóm cho tổng thể (chênh lệch lương trung bình nhân viên nam so với nhân viên nữ) Để xét xem hai nhân viên có phân biệt giới hay không ta tiến hành kiểm định giả thiết H0: 2=0 H1:2 Kiểm định thích hợp kiểm định t với bậc tự df = n-2 Lưu ý: Thủ tục ước lượng phương trình (6.1) tiến hành bình thường mơ hình chương trước phương pháp OLS I Hồi qui với biến độc lập biến định tính Trường hợp biến định tính có nhiều hai lựa chọn Số lựa chọn có biến định tính nhiều hai Xét ví dụ sau đây: Gọi Yi tiền tiết kiệm hộ gia đình thứ i Chúng ta kỳ vọng hộ gia đình thuộc nhóm tuổi khác có mức tiết kiệm khác Nếu có tuổi xác người chủ hộ, biến đưa vào mơ biến định lượng Tuy nhiên, có nhóm tuổi (ví dụ người chủ hộ thuộc nhóm tuổi 25, từ 25 đến 55 55), xem xét biến định tính "nhóm tuổi chủ hộ" nào? Thủ tục chọn nhóm làm nhóm kiểm sốt xác định biến giả cho hai nhóm lại Cụ thể hơn, định nghĩa: I Hồi qui với biến độc lập biến định tính Trường hợp biến định tính có nhiều hai lựa chọn chủ hộ từ 25 đến 55 tuổi D1i= chủ hộ thuộc nhóm tuổi khác chủ hộ 55 tuổi D2i= chủ hộ thuộc nhóm tuổi khác Nhóm điều khiển nhóm mà D1i D2i 0, có nghĩa tất hộ gia đình mà chủ hộ 25 tuổi Một mơ hình đơn giản mơ tả quan hệ tiền tiết kiệm nhóm tuổi sau: Yi 1 2 D1i 3 D2i Ui I Hồi qui với biến độc lập biến định tính Trường hợp biến định tính có nhiều hai lựa chọn Giả sử mơ hình thỏa mãn giả thiết mơ hình hồi qui tuyến tính cổ điển Chúng ta lấy kỳ vọng có điều kiện Y với điều kiện biến D cho trước ta mô hình sau: Đối với hộ gia đình 25 tuổi: E (Y / D1i D2 i 0) 1 (6.4) Đối với hộ gia đình từ 25 đến 55 tuổi: E(Y / D1i 1, D2i 0) 1 2 (6.5) Đối với hộ gia đình 55 tuổi: E(Y / D1i 0, D2i 1) 1 3 (6.6) I Hồi qui với biến độc lập biến định tính Như vậy, (6.4) cho biết tiền tiết kiệm trung bình tháng hộ gia đình mà chủ hộ 25 tuổi Tương tự, (6.5) cho biết tiền tiết kiệm trung bình tháng hộ gia đình mà chủ hộ từ 25 đến 55 tuổi (6.6) cho biết tiền tiết kiệm trung bình tháng hộ gia đình mà chủ hộ 55 tuổi - 2 biểu thị chênh lệch tiền tiết kiệm trung bình tháng hộ gia đình mà chủ hộ thuộc nhóm tuổi từ 25 đến 55 tuổi so với nhóm tuổi 25 - 3 biểu thị chênh lệch tiền tiết kiệm trung bình tháng hộ gia đình mà chủ hộ thuộc nhóm tuổi 55 so với nhóm tuổi 25 Chú ý: Để tránh trường hợp bẫy biến giả (dummy variables trap), số biến giả ln biến so với số lựa chọn II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có biến định tính với lựa chọn: Bước phân tích thêm biến độc lập định lượng Để minh họa, ta lấy lại ví dụ tiền lương - Đặt Yi : tiền lương hàng tháng nhân viên thứ i - Gọi Xi : kinh nghiệm nhân viên thứ i - Với Di =1 : nhân viên nam - Với Di =0 : nhân viên nữ Bây giờ, ta bỏ qua yếu tố giới tính, xét mối quan hệ tiền lương hàng tháng kinh nghiêm, mơ hình hồi quy đơn cho quan hệ là: Yi 1 X i U i (6.7) II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có biến định tính với lựa chọn: Lưu ý ta kiểm sốt kinh nghiệm hỏi "Giữa hai nhân viên có kinh nghiệm, có khác biệt tiền lương tháng giới tính khơng?" Một cách đơn giản để trả lời câu hỏi đặt tung độ gốc 1 phương trình (6.7) khác nam nữ Thực việc cách giả sử là: 1 = 3 + 4Di thay vào (6.7) ta có mơ hình kinh tế lượng: Yi 3 Di X i U i (6.8) Lưu ý 2, 3 4 ước lượng cách hồi quy Y theo số, biến D X Các quan hệ ước lượng cho hai nhóm là: II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có biến định tính với lựa chọn: Đối với Nữ: X Yi i X Đối với Nam: Yi i (6.9) (6.10) Một giả thiết tự nhiên cần kiểm định "khơng có khác biệt quan hệ hai nhóm" So sánh phương trình (6.9) (6.10), thấy quan hệ 4 =0 Vì vậy, kiểm định giả thiết H0: 4 =0 H1: 4 0 Kiểm định thích hợp kiểm định t với bậc tự df = n-3 II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có biến định tính với nhiều lựa chọn: Lấy lại ví dụ tiền tiết kiệm hộ gia đình trên, ta thêm biến định lượng vào mơ hình thu nhập họ (được ký hiệu X).Từ đó, xây dựng mơ hình kinh tế lượng sau: Yi 1 D1i 3 D2i X i U i Giả sử mô hình thỏa mãn giả thiết mơ hình hồi qui tuyến tính cổ điển Chúng ta lấy kỳ vọng có điều kiện Y với điều kiện cho thu nhập X biến D cho trước ta mơ hình sau: II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có biến định tính với nhiều lựa chọn: Đối với hộ gia đình 25 tuổi: E (Y / X i , D1i D2 i 0) 1 X i (6.11) Đối với hộ gia đình từ 25 đến 55 tuổi: E (Y / X i , D1i 1, D2 i 0) X i (6.12) Đối với hộ gia đình 55 tuổi: E (Y / X i , D1i 0, D2i 1) 1 3 X i (6.13) II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có biến định tính với nhiều lựa chọn: Một số giả thuyết thú vị Để kiểm định giả thuyết gia đình nhóm tuổi cao có hành vi giống gia đình nhóm tuổi trẻ hơn, đơn giản tiến hành kiểm định t hệ số 2 3 Để kiểm định giả thuyết "khơng có khác biệt hàm tiết kiệm theo độ tuổi", giả thuyết H0: 2=3=0 giả thuyết đối H1: hệ số khác không Giả thuyết kiểm định kiểm định Wald Hoặc để kiểm định giả thuyết "khơng có khác biệt hành vi hai nhóm tuổi trung niên cao tuổi", nghĩa 2=3 Giả thuyết kiểm định nhiều phương pháp khác II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có nhiều biến định tính Phân tích biến giả dễ dàng mở rộng cho trường hợp có nhiều biến định tính Để minh họa, xem xét hàm tiết kiệm mô tả trước đây, Y tiền tiết kiệm hộ gia đình X thu nhập hộ gia đình Có thể đưa giả thuyết tuổi chủ hộ, yếu tố khác sở hữu nhà, trình độ học vấn, tình trạng nghề nghiệp, yếu tố xác định tiết kiệm hộ gia đình Giả sử ta có thơng tin chủ hộ có trình độ sau đại học, có trình độ đại học, tốt nghiệp trung học; Chủ hộ làm nghề sau: quản lý, cơng nhân lành nghề, cơng nhân khơng có tay nghề, thư ký, kinh doanh tự Cũng tương tự, ta khơng biết xác tuổi chủ hộ biết ơng/bà ta thuộc nhóm tuổi nào,… II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có nhiều biến định tính chủ hộ từ 25 đến 55 tuổi D1i= chủ hộ thuộc nhóm tuổi khác chủ hộ 55 tuổi D2i= chủ hộ thuộc nhóm tuổi khác chủ hộ sở hữu nhà D3i= điều kiện khác II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có nhiều biến định tính chủ hộ có trình độ sau đại học D4i = điều kiện khác chủ hộ có trình độ đại học D5i = điều kiện khác II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có nhiều biến định tính chủ hộ nhà quản lý D6i = điều kiện khác chủ hộ công nhân lành nghề D7i = điều kiện khác II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có nhiều biến định tính chủ hộ thư ký D8i = điều kiện khác chủ hộ kinh doanh tự D9i = điều kiện khác II Hồi qui với biến độc lập định lượng biến định tính Trường hợp có nhiều biến định tính Một mơ hình kinh tế lượng xây dựng sau: Yi 1 D1i D2i D3i D4i D5i D6i D7i D8i 10 D9i 11 X i U i Nên lưu ý đặc điểm nhóm điều khiển sau: chủ hộ có độ tuổi 25, cơng nhân khơng có tay nghề, với trình độ học vấn bậc trung học không sở hữu nhà Một cách dễ dàng, ước lượng mơ hình tính tiền tiết kiệm trung bình hộ gia đình với điều kiện biến X biến D cho trước nêu ý nghĩa ... hai lựa chọn chủ hộ từ 25 đến 55 tuổi D1i= chủ hộ thuộc nhóm tuổi khác chủ hộ 55 tuổi D2i= chủ hộ thuộc nhóm tuổi khác Nhóm điều khiển nhóm mà D1i D2i 0, có nghĩa tất hộ gia đình mà chủ hộ 25 tuổi... chọn: Bước phân tích thêm biến độc lập định lượng Để minh họa, ta lấy lại ví dụ tiền lương - Đặt Yi : tiền lương hàng tháng nhân viên thứ i - Gọi Xi : kinh nghiệm nhân viên thứ i - Với Di =1... định tính Trường hợp có nhiều biến định tính chủ hộ từ 25 đến 55 tuổi D1i= chủ hộ thuộc nhóm tuổi khác chủ hộ 55 tuổi D2i= chủ hộ thuộc nhóm tuổi khác chủ hộ sở hữu nhà D3i= điều kiện khác II Hồi