Nó nghiên cứu sự phụ thuộccủa một biến biến phụ thuộc vào một hay nhiều biến khác biến độclập, nhằm mục đích ước lượng hay dự đoán giá trị trung bình củabiến phụ thuộc trên cơ sở các giá
Trang 1KHOA TOÁN
Nguyễn Hoàng Vân Anh
HỒI QUY TUYẾN TÍNH VỚI BIẾN ĐỊNH TÍNH VÀ
ỨNG DỤNG
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Hà Nội – Năm 2016
Trang 2TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
Nguyễn Hoàng Vân Anh
HỒI QUY TUYẾN TÍNH VỚI BIẾN ĐỊNH TÍNH VÀ
ỨNG DỤNG
Chuyên ngành: Toán ứng dụng
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS Trần Trọng Nguyên
Hà Nội – Năm 2016
Trang 3Trước khi trình bày nội dung chính của bản khóa luận tốt nghiệp, emxin bày tỏ lòng biết ơn sâu sắc tới PGS.TS Trần Trọng Nguyên đã tậntình hướng dẫn để em có thể hoàn thành đề tài này.
Em cũng xin bày tỏ lòng biết ơn chân thành tới toàn thể các thầy côgiáo trong khoa Toán, Trường Đại học Sư phạm Hà Nội 2 đã dạy bảo emtận tình trong suốt quá trình học tập tại khoa
Nhân dịp này em cũng xin được gửi lời cảm ơn chân thành tới gia đình,bạn bè đã luôn bên em, động viên, giúp đỡ em trong suốt quá trình họctập và thực hiện đề tài thực tập này
Hà Nội, ngày 2 tháng 05 năm 2016
Sinh viên
Nguyễn Hoàng Vân Anh
Trang 4Em xin cam đoan dưới sự hướng dẫn của PGS.TS Trần Trọng Nguyênkhóa luận "Hồi quy tuyến tính với biến định tính và ứng dụng"được hoàn thành không trùng với bất kỳ đề tài nào khác.
Trong quá trình hoàn thành khóa luận, em đã thừa kế những thành tựucủa các nhà khoa học với sự trân trọng và biết ơn
Hà Nội, ngày 2 tháng 05 năm 2016
Sinh viên
Nguyễn Hoàng Vân Anh
Trang 5Lời mở đầu iii
1.1 Mô hình và một số khái niệm 1
1.1.1 Mô hình hồi quy 1
1.1.2 Hàm hồi quy tổng thể 3
1.1.3 Hàm hồi quy mẫu 4
1.2 Phương pháp bình phương nhỏ nhất (Phương pháp OLS) 4 1.2.1 Các giả thiết của mô hình hồi quy 5
1.2.2 Phương pháp OLS 5
1.2.3 Các tham số đặc trưng của ước lượng OLS 7
1.3 Một số bài toán ước lượng và kiểm định giả thuyết 9
1.3.1 Khoảng tin cậy cho các hệ số hồi quy 10
1.3.2 Kiểm định giả thuyết thống kê về hệ số hồi quy 11 1.3.3 Kiểm định sự phù hợp của hàm hồi quy 13
Trang 61.3.4 Kiểm định thu hẹp hồi quy 15
2 Mô hình hồi quy chứa biến định tính là biến độc lập 172.1 Khái niệm biến giả 172.2 Mô hình hồi quy chứa biến định tính là biến độc lập 192.2.1 Mô hình hồi quy chứa biến định tính chỉ có hai
phạm trù 192.2.2 Mô hình hồi quy với biến giả và biến tương tác 262.2.3 Mô hình hồi quy với biến định tính có nhiều phạm
trù 342.3 Ứng dụng 37
3 Hồi quy với biến phụ thuộc là biến định tính 433.1 Khái niệm 433.2 Mô hình logit 443.2.1 Mô hình logit - Phương pháp Goldberger (1964) 443.2.2 Mô hình logit - Phương pháp Berkson (1953) 473.3 Ứng dụng mô hình logit 50
Trang 7Lời mở đầu
1 Lý do chọn đề tài
Phân tích hồi quy có lẽ là một trong những phương pháp phân tích
số liệu thông dụng nhất trong thống kê học Nó nghiên cứu sự phụ thuộccủa một biến (biến phụ thuộc) vào một hay nhiều biến khác (biến độclập), nhằm mục đích ước lượng (hay dự đoán) giá trị trung bình củabiến phụ thuộc trên cơ sở các giá trị biết trước của biến độc lập Trongthực tế, biến phụ thuộc không những chịu tác động của các biến địnhlượng mà còn chịu tác động của các biến định tính hoặc biến phụ thuộckhông phải là biến định lượng mà là biến định tính
Với mong muốn tìm hiểu sâu vấn đề này, cùng với sự giúp đỡ tận tìnhcủa PGS TS Trần Trọng Nguyên, tôi đã chọn nghiên cứu đề tài: "Hồiquy tuyến tính với biến định tính và ứng dụng"
2 Mục đích nghiên cứu
Nghiên cứu mô hình hồi quy tuyến tính chứa biến độc lập là biếnđịnh tính và mô hình hồi quy với biến phụ thuộc là biến định tính Tìmhiểu một số bài toán thực tế ứng dụng hai mô hình này với sự hỗ trợcủa phần mềm Eviews
3 Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: biến định tính, mô hình hồi quy với biến địnhtính
- Phạm vi nghiên cứu: mô hình hồi quy tuyến tính chứa biến độc lập
là biến định tính, mô hình hồi quy với biến phụ thuộc là biến định tính(chủ yếu tìm hiểu mô hình logit)
Trang 84 Phương pháp và công cụ nghiên cứu
- Phương pháp nghiên cứu và tổng hợp các tài liệu tham khảo
- Phương pháp nghiên cứu thực nghiệm với dữ liệu thực tế
- Sử dụng phần mềm Eviews 4.0
5 Cấu trúc khóa luận
Khóa luận gồm ba chương
Chương 1 "Kiến thức chuẩn bị"
Chương này nhắc lại một số kiến thức cần sử dụng để nghiên cứu cácphần sau
Chương 2 "Mô hình hồi quy chứa biến định tính là biến độc lập".Chương này nghiên cứu biến định tính, mô hình chứa biến định tính làbiến độc lập và ứng dụng của nó
Chương 3 "Hồi quy với biến phụ thuộc là biến định tính"
Chương 3 nghiên cứu mô hình hồi quy với biến phụ thuộc là biến địnhtính, cụ thể là mô hình logit cùng với những ứng dụng của nó
Trang 91.1 Các cặp giả thuyết và điều kiện để bác bỏ H0 tương ứng
trong kiểm định giả thuyết về một hệ số hồi quy 121.2 Các cặp giả thuyết và điều kiện để bác bỏ H0 tương ứng
trong kiểm định về tổ hợp tuyến tính các hệ số hồi quy 13
2.1 Biến định tính có nhiều hơn hai phạm trù 35
Trang 102.1 Hệ số của biến giả cho biết sự khác biệt về hệ số chặn
giữa hai hàm hồi quy 212.2 Hệ số của biến giả cho biết sự khác biệt về hệ số chặn
giữa hai hàm hồi quy 242.3 Hai hồi quy hoàn toàn khác nhau (a) 282.4 Hai hồi quy hoàn toàn khác nhau (b) 282.5 Mô hình khác hệ số góc nhưng giống nhau về hệ số chặn 292.6 Hai mô hình hồi quy hoàn toàn giống nhau 292.7 Bảng số liệu thị trường tiêu thụ trà xanh và các nhân tố
liên quan khác 372.8 Bảng số liệu biến giả 382.9 Bảng ước lượng giá trị liên quan đến biến giả qua phần
mềm Eviews 39
3.1 Bảng số liệu về mức thu nhập và số hộ sở hữu nhà trong
nhóm quan sát 513.2 Bảng xử lý số liệu về mức thu nhập và số hộ sở hữu nhà
trong nhóm quan sát 513.3 Kết quả ước lượng mô hình bằng phương pháp Berkson 52
Trang 11Kiến thức chuẩn bị
Chương này nhắc lại một số kiến thức cơ bản của mô hình hồi quynhằm giúp người đọc nắm bắt tốt hơn các kiến thức phần sau
Mục 1.1 sẽ nhắc lại mô hình hồi quy tuyến tính, các thành phần của
mô hình và một số khái niệm cơ bản Mục 1.2 trình bày phương phápbình phương nhỏ nhất và các công thức ước lượng, mục này cũng giớithiệu các giả thiết của mô hình hồi quy Mục 1.3 nêu một số bài toánước lượng và kiểm định giả thuyết
1.1.1 Mô hình hồi quy
Xét mô hình hồi quy tuyến tính k biến:
Y = β1 + β2X2 + + βkXk + u (1.1)Khi đó với mẫu ngẫu nhiên kích thước n, có thể biểu diễn lại (1.1)
Trang 12Mô hình (1.3) được gọi là mô hình hồi quy tuyến tính bội.
Như vậy mô hình hồi quy tuyến tính bội có các thành phần sau:
Trang 13- Biến phụ thuộc là biến số mà ta đang quan tâm đến giá trị của nó,thường kí hiệu là Y và nằm ở vế trái của phương trình Biến phụ thuộccòn được gọi là biến được giải thích (explained variable) hay biến phảnứng.
- Biến độc lập là biến số được cho là có tác động đến biến phụ thuộc,thường được kí hiệu là X và nằm ở vế phải của phương trình Biến độclập còn được gọi là biến giải thích (explanatory variable) hay biến điềukhiển (control variable)
- Sai số ngẫu nhiên là yếu tố đại diện cho các yếu tố tác động đếnbiến Y ngoài X, thường được kí hiệu là u
- Hệ số hồi quy là các hệ số thể hiện mối quan hệ giữa biến X và Ykhi các yếu tố bao hàm trong u không đổi
Trong đó, β1 là hệ số chặn (hệ số tự do) nó cho ta biết trung bìnhcủa Y khi X2, X3, , Xk bằng 0; βj (j = 1, 2, , k) là các hệ số hồi quyriêng, nó cho ta biết sự thay đổi của Y khi Xj thay đổi một đơn vị còncác Xh(h 6= j) không thay đổi
1.1.2 Hàm hồi quy tổng thể
Với giả thiết E(u|X) = 0 ta có thể biểu diễn lại mô hình hồi quy (1.1)dưới dạng sau:
E(Y |X) = β1 + β2X2 + + βkXk (1.4)trong đó E(Y |X) là kì vọng của biến Y khi biến giá trị của biến X haycòn gọi là kỳ vọng của Y với điều kiện X
Trang 14Phương trình (1.4) được gọi là hàm hồi quy tổng thể (PRF).
1.1.3 Hàm hồi quy mẫu
Giả sử có mẫu ngẫu nhiên kích thước n bao gồm các quan sát củabiến X và biến Y : (Yi, Xi), i = 1, 2, , n Từ mẫu ngẫu nhiên này ta xâydựng được các ước lượng cho các hệ số hồi quy tổng thể β1, β2, , βk, kíhiệu ˆβ1, ˆβ2, , ˆβk tương ứng
Khi đó ta có hàm hồi quy mẫu (SRF) cho hàm hồi quy tổng thể:
Trang 151.2.1 Các giả thiết của mô hình hồi quy
•Giả thiết 1: Việc ước lượng dựa trên cơ sở mẫu ngẫu nhiên (X, Y )
•Giả thiết 2: E(u|X) = 0n×1 với 0n×1 là vectơ gồm n thành phầnbằng 0
•Giả thiết 3: E(uu0|X) = σ2I
trong đó I là ma trận đơn vị cỡ n × n, dấu 0 trên đầu mỗi ma trận là kýhiệu của ma trận chuyển vị
•Giả thiết 5: Sai số ngẫu nhiên tuân theo quy luật chuẩn
Trang 17Như vậy véc tơ ước lượng ˆβ cần thỏa mãn điều kiện cần bậc nhất
(1.6) chính là công thức ước lượng OLS cho các hệ số hồi quy
Để xem xét công thức tính ma trận phương sai- hiệp phương sai củacác hệ số ước lượng, ta biến đổi công thức (1.6) như sau:
• Với hồi quy đơn:
Kì vọng
E( ˆβj) = βj.Phương sai
var( ˆβ1) =
Pn i=1Xi2
nPn i=1x2 i
σ2
Trang 18var( ˆβ2) = σ
2
Pn i=1x2i.
Độ lệch chuẩn
se( ˆβj) =
qvar( ˆβj)
σ2 chưa biết và được ước lượng bởi: ˆσ2 = P e2
i
n − 2.ˆ
σ gọi là độ lệch chuẩn của hồi quy (se)
• Với hồi quy tổng quát:
Định lý 1.2 Khi các giả thiết 1- giả thiết 5 thỏa mãn thì các ướclượng OLS sẽ là các ước lượng không chệch tốt nhất (BUE- best unbiasedestimator), kể cả trong lớp các ước lượng tuyến tính và ước lượng phi
Trang 19Định lý 1.4 Khi các giả thiết 1- 5 thỏa mãn ta có:
Trang 201.3.1 Khoảng tin cậy cho các hệ số hồi quy
* Khoảng tin cậy cho một hệ số hồi quy
• Khoảng tin cậy đối xứng với độ tin cậy (1 − α) cho các hệ số hồiquy được xác định bằng công thức sau:
Y gia tăng trong khoảng này
• Khoảng tin cậy để ước lượng giá trị lớn nhất cho hệ số hồi quy:
(−∞, ˆβj + tα,n−kse( ˆβj))
• Khoảng tin cậy để ước lượng giá trị bé nhất cho hệ số hồi quy:
( ˆβj − tα,n−kse( ˆβj), +∞)
* Khoảng tin cậy cho biểu thức của hai hệ số hồi quy
Với a và b là các giá trị bất kì thì khoảng tin cậy cho mức gia tăngcủa trung bình của biến Y khi biến Xi tăng a đơn vị và Xj tăng b đơn
vị được tính bởi công thức:
((a ˆβi+b ˆβj)−tα
2 ,n−kse(a ˆβi+b ˆβj), (a ˆβi+b ˆβj)−tα
2 ,n−kse(a ˆβi+b ˆβj)) (1.11)
Trang 21Trong đó sai số chuẩn se(a ˆβi + b ˆβj) được tính theo công thức:
se(a ˆβi + b ˆβj) =
q
a2var( ˆβi) + b2var( ˆβj) + 2abcov( ˆβi, ˆβj)
1.3.2 Kiểm định giả thuyết thống kê về hệ số hồi quy
* Kiểm định giả thuyết về một hệ số hồi quy
Xét mô hình hồi quy:
P
ˆ
βj
se( ˆβj)
... mang tính địnhtính lên biến phụ thuộc số ứng dụng mô hình
Trong q trình phân tích hồi quy, biến phụ thuộc không phụthuộc vào biến định lượng mà cịn phụ thuộc vào biến định tính
Định. .. hình hồi quy chứa biến định tính biến< /h3>
Mơ hình Mơ hình hồi quy với biến độc lập biến địnhtính
Xem xét tiền lương cơng chức có bị ảnh hưởng yếu tố giớitính hay khơng?
Do biến. .. sốcủa biến giả β2 cho biết khác biệt hệ số chặn hai hàm hồi quycủa nhóm, tương ứng với hai phạm trù biến định tính.
Mơ hình Mơ hình hồi quy chứa biến định tính biến? ?ịnh lượng