Đề tài tiểu luận số 39: Phân tích mô hình và dự báo mức lương hàng tháng của công nhân với biến phụ thuộc WAGE và các biến giải thích MAINT, EXPER, GENDER, CRAFTS, CLERICAL là một đề tài
Trang 1LỜI CÁM ƠN 1
LỜI MỞ 2
ĐỀ TÀI TIỂU LUẬN SỐ 39 3
PHẦN MỘT: THỰC HIỆN TRÊN EXCEL 5
1 Thiết lập mô hình hồi quy mẫu 5
2 Phân tích kết quả thực nghiệm 5
PHẦN HAI: THỰC HIỆN TRÊN EVIEW 6 8
A - LÝ THUYẾT KIỂM ĐỊNH 8
1 Kiểm định Wald 8
2 Kiểm định White (minh họa với trường hợp 3 biến, trường hợp k biến được tổng quát hóa tương tự) 8
3 Kiểm định Breusch – Godfrey (BG) 9
B – THỰC HÀNH TRÊN EVIEW 6 10
1 Chuyển dữ liệu từ Excel sang Eview 6 10
a Lập bảng tham số thống kê của các biến độc lập và vẽ đồ thị 10
b Lập ma trận Correlation gồm cả biến phụ thuộc và tất cả các biến độc lập 17
c Ước lượng phương trình hồi quy trên Eview 6 20
2 Kiểm định Wald – Kiểm tra sự có mặt của biến không cần thiết 23
a Kiểm định Wald với biến MAINT 24
b Kiểm định Wald với biến GENDER 25
c Kiểm định Wald với biến EXPER 25
d Kiểm định Wald với biến CRAFTS 26
e Kiểm định Wald với biến CLERICAL 26
3 Kiểm định White và kiểm định BG cho mô hình 28
a Kiểm định White 28
b Kiểm định BG 32
4 Dự báo giá trị trung bình và giá trị cá biệt mức lương tháng của công nhân 34
KẾT LUẬN 44
Trang 2LỜI CÁM ƠN
Em xin gởi lời cảm ơn chân thành tới:
- Ban Giám Hiệu trường Đại học Công Nghiệp TP.HCM đã tạo mọi điều kiện thuận lợi nhất cho chúng em có một môi trường học tập và nghiên cứu có hiệu quả nhất
- Th.S Đinh Kiệm đã tận tình giảng dạy, giúp em nắm bắt và vận dụng những kiến thức từ môn Kinh tế lượng vào thực tế cũng như hướng dẫn chi tiết cách thực hành phân tích, dự báo trên Excel và Eview 6 để em có thể hoàn thành đề tài tiểu luận một cách tốt nhất
Thành phố Hồ Chí Minh, ngày 30 tháng 10 năm 2012
Trang 3là một công cụ “chuyên gia” có ưu điểm chính là có thể cho chúng ta kết quả nhanh chóng khi tiến hành ước lượng, phân tích hồi quy cho các mô hình kinh tế
Những năm gần đây, trong bối cảnh nền kinh tế đầy khó khăn, vấn đề lương và tăng lương cho công nhân đã làm tốn không ít giấy mực của báo chí Nhiều ý kiến, quan điểm được đề xuất nhằm cải thiện tình hình nhưng tới nay, vấn đề điều chỉnh mức lương vẫn còn gặp khá nhiều khó khăn và bất cập Lương thấp, chế độ chưa thỏa đáng, sự trì trệ trong việc trả lương của các doanh nghiệp khiến công nhân liên tục
“nhảy việc” để tìm kiếm lương cao nhưng thực tế tình trạng này đang gây ra không ít khó khăn cho chính bản thân những công nhân này, những doanh nghiệp và cả các cơ quan quản lý
Đề tài tiểu luận số 39: Phân tích mô hình và dự báo mức lương hàng tháng của công nhân với biến phụ thuộc WAGE và các biến giải thích MAINT, EXPER, GENDER, CRAFTS, CLERICAL là một đề tài rất hay và mang tính thực tế Sử dụng phần mềm Eview 6, qua các bước đặt ra các giả thiết liên quan, thiết lập mô hình, ước lượng tham số của mô hình, từ đó đánh giá sự phù hợp hay không của mô hình để đi tới quyết định áp dụng nó vào dự báo thực tế…
Mặc dù đã rất cố gắng nhưng chắc chắn không tránh khỏi những sơ suất, cả về hình thức cũng như nội dung của bài tiểu luận, mong thầy thông cảm và góp ý để em
có thể rút kinh nghiệm làm tốt hơn những bài tiểu luận về sau Một lần nữa, em xin gởi lời cảm ơn chân thành tới thầy – ThS Đinh Kiệm
Sinh viên thực hiện
Phạm Lộc
Trang 4ĐỀ TÀI TIỂU LUẬN SỐ 39 Phần I : Trên Excel
Sử dụng dữ liệu Data BT 6 trên Excel, dùng Regression trên Data Analysis để ước
lượng hàm hồi quy mẫu có dạng sau :
WAGE = B1 + B2*MAINT + B3*EXPER +B4*GENDER + B5*CRAFT
+ B6*CLERICAL
CLERICAL = 1 cho công nhân văn phòng, = 0 cho công nhân khác
Phần II : Trên Eviews
a/ Hãy chuyển dữ liệu từ file Excel ở phần 1 sang thành dữ liệu dưới dạng workfile của
Eviews và lưu lại dưới tên : Data TL 39 Sau đó dùng công cụ Eviews để:
- Lập bảng các tham số thống kê của các biến độc lập, vẽ đồ thị các biến độc lập trên
cùng một bảng
- Lập ma trận Correlation Matrix gồm cả biến phụ thuộc và tất cả các biến độc lập
- Ước lượng phương trình hồi quy dưới dạng như ở câu phần I
b/ Hãy kiểm định Wald ( biến thừa ) cho 5 biến độc lập nêu trên
c/ Từ mô hinh câu a phần II hãy kiểm định White và BG cho mô hình này d/ Hãy dự báo giá trị trung bình và giá trị cá biệt mức lương tháng của công nhân theo
Biểu diễn trực quan đồ thị dự báo bằng cách vẽ đồ thị khoảng dự báo trung bình, dự
báo cá biệt, tương ứng với các cận trên và cận dưới theo số quan sát làm biến trên trục
hoành chung cho các đại lượng khác
Trang 6PHẦN MỘT: THỰC HIỆN TRÊN EXCEL
1 Thiết lập mô hình hồi quy mẫu
X2i = MAINT : Giá trị là 1 nếu là công nhân bảo trì, là 0 nếu là công nhân khác
X3i = GENDER : Giá trị là 1 nếu là nam giới, là 0 nếu là nữ giới
X4i = EXPER : Số năm làm việc cho công ty này
X5i = CRAFTS : Giá trị là 1 nếu làm trong nghề thủ công, là 0 nếu là nghề khác
X6i = CLERICAL : Giá trị là 1 cho công nhân văn phòng, là 0 nếu là công nhân khác
2 Phân tích kết quả thực nghiệm
a Kết quả chạy mô hình từ Excel:
Ta lập được mô hình hồi quy mẫu :
- B 1 = 2093,84399: Khi các biến giải thích MAINT, GENDER, EXPER, CRAFTS,
CLERICAL đồng thời bằng 0 thì trung bình mức lương tháng (WAGE) của công nhân
Trang 7- B 2 = -1353,91998: Trong điều kiện các yếu tố khác không đổi thì lương tháng của
công nhân bảo trì thấp hơn công nhân khác là 1353,91998 USD
- B 3 = 629,49664: Trong điều kiện các yếu tố khác không đổi thì lương tháng của công
nhân nam cao hơn công nhân nữ là 629,49664 USD
- B 4 = 25,49901: Trong điều kiện các yếu tố khác không đổi, khi số năm làm việc của
công nhân tăng lên 1 năm sẽ làm lương tháng công nhân đó tăng 25,49901 USD
- B 5 = -855,64872: Trong điều kiện các yếu tố khác không đổi thì lương tháng của công
nhân làm trong nghề thủ công thấp hơn công nhân làm trong nghề khác 855,64872 USD
- B 6 = -917,28246: Trong điều kiện các yếu tố khác không đổi thì lương tháng của công
nhân văn phòng thấp hơn công nhân khác 917,28246 USD
b Giải thích một số ký hiệu:
- R Square: Hệ số xác định Trong 100% sự biến động của biến phụ thuộc Y thì có
bao nhiêu % sự biến động là do các biến độc lập X ảnh hưởng, còn lại là do sai số
- Standard Error: Sai số chuẩn của Y do hồi quy
- Observation: Số quan sát hay dung lượng mẫu
- F: Trị số F-Fisher dùng làm căn cứ để kiểm định độ tin cậy về mặt khoa học (thống
kê) của toàn bộ phương trình hồi quy
- Residual (cột MS): Trị số sigma ước lượng bình phương
- t Stat: Tiêu chuẩn t dùng làm căn cứ để kiểm định độ tin cậy về mặt khoa học của
mối liên hệ giữa biến độc lập với biến phụ thuộc
- P-value: Xác suất để tkd > t Stat, là các trị xác suất tiêu chuẩn tới hạn
- Coefficients: Hệ số chặn và các hệ số hồi quy riêng
- Lower 95%, Upper 95%, Lower 98%, Upper 98%: Cận dưới và cận trên của
khoảng ước lượng cho các tham số với độ tin cậy 95% và độ tin cậy 98%
c Nhận xét:
- R Square = R 2 = 0,683878837 ≈ 68,39% Nghĩa là trong 100% sự biến động của
biến phụ thuộc WAGE thì có 68,39 % sự biến động là do các biến độc lập ảnh hưởng, còn lại là do sai số ngẫu nhiên hoặc các các yếu tố khác ngoài mô hình
- F = F kd = 18,60475885 > F α (k-1,n-k) = F 0.05 (6-1,49-6) = 2,43223647
Ta đi tìm Fα(k-1,n-k) bằng hàm FINV với cú pháp :
=FINV(probability, deg_freedom1, deg_freedom2)
Trang 8Trong đó: probability là mức ý nghĩa, deg_freedom1 và deg_freedom2 là các số bậc tự
do thứ nhất (k-1) và thứ hai (n-k) (với k là số biến độc lập và n là số quan sát của mô hình)
Thực hiện hàm =FINV(0.05,5,43) cho F0.05(6-1,49-6) trong Excel ta được kết quả
F0.05(6-1,49-6) = 2.43223647
- Các giá trị P-value của các biến độc lập đều nhỏ hơn mức ý nghĩa α=0,05 Vậy các
biến đưa vào mô hình là hợp lý
Kết luận: Mô hình phù hợp ở mức độ khá
Trang 9PHẦN HAI: THỰC HIỆN TRÊN EVIEW 6
RSSR (hay ESS): tổng bình phương phần dư ei của mô hình giới hạn
RSSU: tổng bình phương phần dư ei của mô hình không giới hạn
2 Kiểm định White (minh họa với trường hợp 3 biến, trường hợp k biến được
tổng quát hóa tương tự)
Xét mô hình:
Y X X U
Bước 1: Trước tiên ta ước lượng phương trình trên để tính các phần dư ei
Bước 2: Ta thực hiện hồi quy mô hình phụ dưới dạng sau:
Trang 10Bước 3: Tính trị thống kê kiểm định nR2, với n là số quan sát của mẫu, R2 là hệ số xác định bội của mô hình phụ
Bước 4: Từ giả thiết H0: 2 3 4 5 6 0 (không có hiện tượng phương sai thay đổi) xem xét nếu nR2 > 2(df ) ta bác bỏ giả thiết H0, nghĩa là có hiện tượng
phương sai thay đổi (df là bậc tự do, tức là thông số hồi quy m của mô hình phụ không
tính hằng số C ở bước 2)
3 Kiểm định Breusch – Godfrey (BG)
Xét mô hình hồi quy gốc có dạng: Yi = a + bXi + Ui
Giả sử trong mô hình xảy ra hiện tượng tự tương quan bậc p, ký hiệu AR(p), tức là các phần dư được biểu diễn dưới dạng sau:
(1c) > 2(p) thì bác bỏ giả thiết H0, có nghĩa là mô hình gốc có hiện tượng tự tương quan bậc p
Trang 11B – THỰC HÀNH TRÊN EVIEW 6
1 Chuyển dữ liệu từ Excel sang Eview 6
a Lập bảng tham số thống kê của các biến độc lập và vẽ đồ thị
Lập bảng tham số thống kê:
Chọn các biến giải thích, phải chuột vào vùng chọn, chọn Open > as Group
Trang 12Xuất hiện bảng:
Vào View > Descriptive Stats > Common Sample
Trang 13Ta có bảng thống kê như sau:
Jarque - Bera: Giá trị phân phối Jarque-Bera dùng để kiểm định phân phối chuẩn
Probability: Giá trị xác suất tới hạn
Trang 14mức độ tương đồng cao mà rải rác ở nhiều giá trị khác nhau Nghĩa là số năm làm việc của công nhân trong công ty chênh lệch nhau khá nhiều
- Thứ hai, giá trị trung bình của biến MAINT là 0,224490 < 0,5 cho thấy số công nhân bảo trì trong công ty chiếm không tới một nửa số công nhân; giá trị trung bình của biến GENDER là 0,530612 > 0,5 cho thấy số công nhân nam trong công ty đông hơn
số công nhân nữ; giá trị trung bình của biến CRAFTS là 0,224490 < 0,5 cho thấy số công nhân làm trong nghề thủ công trong công ty chiếm không tới một nửa số công nhân; giá trị trung bình của biến CLERICAL là 0,367347 < 0,5 cho thấy số công nhân
văn phòng trong công ty chiếm không tới một nửa số công nhân
Vẽ đồ thị các biến độc lập:
Thực hiện lại các thao tác ở trên để có được bảng sau :
Trang 15Vào View > Graph…
Xuất hiện hộp thoại Graph Options, tại đây ta chuyển đổi giữa các Tab để thiết lập các mục để có được biểu đồ theo ý muốn, sau đó nhấn OK
Ở đây chọn kiểu đồ thị là Distributation:
Trang 16Các biến MAINT, GENDER, CLERICAL, CRAFTS là các biến giả nên chỉ có 2 giá trị là 1 và 0 Tần suất của các giá trị của biến độc lập EXPER và biến phụ thuộc WAGE chênh lệch nhau khá nhiều
Thực hiện thống kê mô tả cho biến EXPER: Từ hộp lệnh của Eview 6 ta gõ hist
exper và nhấn Enter trên bàn phím
Trang 17Nhận thấy Probability = 0,157548 > α = 0,05 nên ta kết luận, biến exper có phân
phối chuẩn
Thực hiện thống kê mô tả cho biến WAGE: Từ hộp lệnh của Eview 6 ta gõ hist
wage và nhấn Enter trên bàn phím
Nhận thấy Probability = 0,157548 > α = 0,05 nên ta kết luận, biến exper có phân
phối chuẩn
Trang 18b Lập ma trận Correlation gồm cả biến phụ thuộc và tất cả các biến độc lập
Mở các biến ở chế độ Group:
Vào View > Covariance Analysis…
Xuất hiện hộp thoại Covariance Analysis > Tại mục Statistics chọn Correlation
Trang 19Ta có ma trận Correlation Matrix :
Nhận xét:
Các biến CLERICAL và GENDER giải thích ở mức tương đối cho biến WAGE; các biến CRAFTS, EXPER, MAINT giải thích không tốt lắm cho biến WAGE
Mức tương quan giữa biến GENDER với các biến CLERICAL, MAINT là khá cao,
mô hình có thể xảy ra hiện tượng cộng tuyến giữa các biến này
Trang 20- Chạy mô hình hồi quy phụ giữa biến GENDER với biến CLERICAL:
Nhận thấy Prob(F-statistic) = 0,000000 < α = 0,05 (mức ý nghĩa α =5%) nên ta kết
luận mô hình hồi quy phụ này tồn tại Vậy thực sự có hiện tượng cộng tuyến giữa 2
biến này R-squared = 0,416544 = 41,65% cho thấy 41,65% sự thay đổi của biến này
do biến kia giải thích, sự cộng tuyến giữa 2 biến độc lập này khá cao, không thực sự tốt cho mô hình
- Chạy mô hình hồi quy phụ giữa biến GENDER với biến MAINT:
Trang 21Nhận thấy Prob(F-statistic) = 0,002112 < α = 0,05 (mức ý nghĩa α =5%) nên ta kết
luận mô hình hồi quy phụ này tồn tại Vậy thực sự có hiện tượng cộng tuyến giữa 2
biến này R-squared = 0,180368 = 18,04% cho thấy 18,04% sự thay đổi của biến này
do biến kia giải thích, sự cộng tuyến giữa 2 biến độc lập này ở mức chấp nhận được
c Ước lượng phương trình hồi quy trên Eview 6
Mở biến phụ thuộc và các biến giải thích ở chế độ as Equation… (Phải chọn biến phụ
thuộc trước rồi mới chọn lần lượt các biến giải thích)
Trang 22Giao diện kết quả chạy hồi quy:
Ta lập được mô hình hồi quy mẫu :
Trang 23Từ hộp lệnh của Eview 6 ta gõ scalar f=@qfdist(0.95,5,43) để tìm Fα(k-1,n-k)
Nhận xét:
- Hệ số xác định R 2 = 0,683879 nghĩa là mô hình giải thích tương đối tốt sự thay đổi
của biến phụ thuộc WAGE
- Giá trị kiểm định F-statistic = 18,60476 > F α (k-1,n-k) = F 0,05 (5,43) = 2,432236472
nên mô hình kiểm định là hợp lý
- Sai số tiêu chuẩn S.E of regression = 385,0953, giá trị trung bình của biến phụ thuộc WAGE là Mean dependent var = 1820,204
- Giá trị p-value của các biến giải thích đều nhỏ hơn 0,05 nên độ phù hợp của các biến độc lập là rất tốt
Kết luận: Mô hình phù hợp ở mức độ khá
Trang 242 Kiểm định Wald – Kiểm tra sự có mặt của biến không cần thiết
Tiến hành kiểm định đồng thời, ta vào View > Coefficient Tests > Wald – Coefficient
Restrictions…
Hộp thoại Wald Test xuất hiện, gõ C(1)=C(2)=C(3)=C(4)=C(5)=0 để kiểm định đồng
thời:
Kết quả kiểm định:
Trang 25Nhận xét:
Từ kết quả trên, ta thấy được giá trị Probability của F-statistic là 0,0000<0,05 (mức ý nghĩa α=0,05), vậy bác bỏ giả thiết H0, nghĩa là các biến giải thích MAINT, GENDER, EXPER, CRAFTS, CLERICAL đồng thời ảnh hưởng tới biến phụ thuộc WAGE
a Kiểm định Wald với biến MAINT
Gõ vào hộp thoại Wald Test: C(1)=0
Trang 26Nhận xét:
Từ kết quả trên, ta thấy được giá trị Probability của F-statistic là 0,0000<0,05 (mức ý nghĩa α=0,05), nghĩa là biến giải thích MAINT đưa vào mô hình là hợp lý
b Kiểm định Wald với biến GENDER
Gõ vào hộp thoại Wald Test: C(2)=0
Nhận xét:
Từ kết quả trên, ta thấy được giá trị Probability của F-statistic là 0,0002<0,05 (mức ý nghĩa α=0,05), nghĩa là biến giải thích GENDER đưa vào mô hình là hợp lý
c Kiểm định Wald với biến EXPER
Gõ vào hộp thoại Wald Test: C(3)=0
Trang 27Nhận xét:
Từ kết quả trên, ta t hấy được giá trị Probability của F-statistic là 0,0139<0,05 (mức ý nghĩa α=0,05), nghĩa là biến giải thích EXPER đưa vào mô hình là hợp lý
d Kiểm định Wald với biến CRAFTS
Gõ vào hộp thoại Wald Test: C(4)=0
Nhận xét:
Từ kết quả trên, ta thấy được giá trị Probability của F-statistic là 0,0000<0,05 (mức ý nghĩa α=0,05), nghĩa là biến giải thích CRAFTS đưa vào mô hình là hợp lý
e Kiểm định Wald với biến CLERICAL
Gõ vào hộp thoại Wald Test: C(5)=0
Trang 28Nhận xét:
Từ kết quả trên, ta thấy được giá trị Probability của F-statistic là 0,0000<0,05 (mức ý nghĩa α=0,05), nghĩa là biến giải thích CLERICAL đưa vào mô hình là hợp lý
Kết luận chung: Qua việc thực hiện kiểm định Wald cho đồng thời 5 biến rồi
lần lượt cho từng biến, ta nhận thấy cả 5 biến MAINT, GENDER, EXPER, CRAFTS, CLERICAL đều cần thiết cho mô hình