Hồi qui sử dụng biến giả Tác giả: Nguyễn Trọng Hoà

Một phần của tài liệu Học Cách Sử Dụng Phân Tích Hồi QuyAllen Bellas (Trang 25)

Tác giả: Nguyễn Trọng Hoài

Trước đây chúng ta chỉ sừ dụng biến giải thích định lượng. Trong bài giảng này chúng ta đề cập trong mô hình biến giải thích định tính nhằm giải quyết các tình huống như: tìm hiểu sự khác biệt về giới tính trong việc thanh tóan lương, sư khác biệc về doanh số giữa các mùa trong năm, và sự khác biệt giữa hai giai đọan chính sách khác nhau . . .

Công cụ xừ lý đó chính là biến giả (dummy). Chúng ta giải thích trong nhiếu trường hợp khác nhau từ đơn giản đến phức tạp. Biến giả thể hiện các biến định tính.

1) Mô hình chỉ có biến giải thích là biến giả

2) Mô hình có biến giải thích định lượng và biến giả. Trong mô hình này lại có nhiều trường hợp khác nhau mà chúng ta sẽ đề cập sau.

Trường hợp 1: Hồi qui với một biến giả duy nhất là biến độc lập

Yi= b1+ b2 Di + (11.1)

Nam: E(Yi|D = 1) = b1+ b2

Ý nghĩa của a là lương trung bình của nhóm D= 0 và b là khác biệt kỳ vọng của lương trung bình của hai nhóm trong tổng thể.

Dựa vào mô hình hồi qui đơn chúng có ∑Yi = n1+ 2∑Dt (11.2)

YiDi =1∑Di +2∑Di2 = 1∑Di +2∑Di(11.3)

Lưu ý rằng do D là biến giả và chỉ nhận giá trị 1 và 0, D2 cũng có giá trị giống D. Trong Phương trình (11.3), ∑Dt ở vế bên phải bằng số nam nhân viên (gọi là nm) và ∑YiDi ở vế bên trái bằng tổng lương của họ. Chia hai vế cho nm ta có

1+ 2 = m(11.4)

với m là lương trung bình của nam nhân viên. Vì vậy, tổng các hệ số hồi qui là một ước lượng của E(Yi|D = 1), trung bình tổng thể lương của nam nhân viên.

Vì ∑Di = nm, Phương trình (11.2) và (11.3) có thể viết lại thành ∑Yi = n1 + nm2

YiDi = nm(1+ 2) (11.5)

Lấy phương trình thứ nhất trừ phương trình thứ hai và bỏ đi những số hạng chung ở vế bên phải, ta có

Yi -∑YiDi = (n -nm) 1 = nf1 (11.6)

với nf là số nhân viên nữ. Lưu ý là vế bên trái của phương trình đơn giản là tổng lương của nữ nhân viên (tổng của toàn bộ lương trừ tổng lương của nam nhân viên). Vì vậy, chia hai vế cho

nf , chúng ta có 1 = f, trung bình mẫu của lương nữ nhân viên, đây là một ước lượng của trung bình tổng thể E(Yi|D = 0).

Trong đó WAGE: tiền lương, DUMMY (= 0 nếu quan sát là nữ và = 1 nếu quan sát là nam) Kiểm tra lại bằng cách tìm giá trị lương trung bình của nữ trong tập hợp nữ

Ở đây do mẫu bao gồm cả nam và nữ nên ta dùng lệnh sample với if như sau

Như vậy thì dữ liệu chúng ta kiểm tra phù hợp với giải thích về lý thuyết ở trên Trường hợp 2: Hồi qui với một biến giả và một biến định lượng

Giả sừ rằng chúng ta phải ước lượng mối quan hệ giữa tiền lương của các giáo sư và số năm công tác của họ.

(11.7)

Yi = tiền lương hàng năm của giáo sư i. Xi = số năm công tác của giáo sư i.

Ở đây chúng ta hòan tòan chưa nói là giáo sư là nam hay nữ.

Bây giờ giả sừ rằng chúng ta muốn tìm hiểu xem xem liệu có phải các giáo sư nữ bị phân biệt đối xừ về việc trả lương của họ không. Chúng ta có hai cách để làm việc này:

Cách 1:ước hai hàm hồi qui riêng biệt, có nghĩa là một hàm hồi qui cho các giáo sư nam có trong mẫu nM và một hàm hồi qui cho các giáo sư nữ có trong mẫu nF)

Có hai khó khăn trong cách giải quyết này. Một là, mỗi phép hồi qui là kém hiệu quả hơn so với phép hồi qui sừ dụng toàn bộ dữ liệu. Hai là , tương đối không thuận tiện khi kiểm định liệu rằng hai phép hồi qui này là khác nhau.

Cách 2: ước lượng chung cho cả giáo sư nam và nữ bằng cách xác định một biến mới ghi nhận sự có mặt hay vắng mặt của thuộc tính "nữ " (adsbygoogle = window.adsbygoogle || []).push({});

Di = 0 nếu quan sát i thuộc về một giáo sư nam Di = 1 nếu quan sát i thuộc về một giáo sư nữ Như vậy phương trình 11.1 trở thành mô hình sau:

11.8

Hãy ghi nhận rằng bậc tự do của mô hình này là nM + nF - 3. Sự có mặt của biến giả này làm có thể thể hiện cả hai mô hình hồi qui riêng biệt nói trên (ở cách 1) trong một mô hình (theo cách 2). Xét các giá trị kỳ vọng có điều kiện sau:

nữ 11.9

nam 11.10

Chúng ta thấy rằng nếu là dương thì các giáo sư nữ có một hàm hồi qui tổng thể có tung độ gốc cao hơn sovới các giáo sư nam.

Hệ số là chênh lệch tung độ gốc và nó cho thấy chênh lệch của các tung độ gốc đối với hai mẫu phụ. Dễ dàng kiểm định xem liệu chênh lệch này có ý nghĩa thống kê hay không: đơn giản là tính giá trị thống kê tc cho rồi so với giá trị tới hạn tra bảng t* như chúng ta đã làm như thường lệ khi kiểm định ý nghĩa thống kê của các hệ số hồi qui.

Chúng ta có thể sừ dụng dữ liệu và minh họa khi hồi qui lương theo kinh nghiệm EXPER và GENDER như sau

Giải thích sự khác biệt này bằng đồ thị.

Lưu ý: tuy nhiên sự khác biệt này mới chỉ được kiểm sóat bởi biến giải thích duy nhất là EXPER. Do đó các hệ số ước lượng sẽ có sự hiện tượng chệch do bỏ sót biến. Chúng ta có thể minh họa điều này bằng cách hồi qui WAGE theo EXPER cho GENDER=1

Chúng ta thấy kết quả bảng trên khác biệt rất nhiều so với kết quả đầu tiên về hệ số trục tung cũng như hệ số độ dốc. Tóm lại chúng ta có các trường hợp sau đây:

a) Thay đổi hệ số trục tung (có sự phân biệt giữa hai tính chất của biến định tính nhưng không liên quan đến biến định lượng)

b) Thay đổi hệ số độ dốc (có sự phân biệt giữa hai tính chất trong biến định lượng) c) Bao gồm cả hai trường hợp trên.

Ghi chú: chúng ta có thể mô tả đồ thị giải thích các trường hợp này một cách dễ dàng

Điều này cho chúng ta một suy nghĩ rằng biến định tính có thể làm thay đổi cả hệ số trục tung lẫn hệ số độ dốc

<h2>Bổ xung trường hợp 2: sừ dụng biến tương tác</h2>

Chúng ta có thể đưa khả năng này vào bằng cách xác định một biến tương tác như sau : DXi = Di x Xi

Các kỳ vọng có điều kiện giờ đây trở thành nữ

nam

Hệ số được gọi là chênh lệch độ dốc vì nó là chênh lệch giữa các độ dốc của hai mô hồi qui đối với hai mẫu phụ của chúng ta. Dễ dàng kiểm định rằng liệu chênh lệch này có ý nghĩa thống kê hay không. Chúng ta chỉ cần đánh giá mức độ ý nghĩa của trị thống kê t tính cho ước lượng của .

Một phần của tài liệu Học Cách Sử Dụng Phân Tích Hồi QuyAllen Bellas (Trang 25)