LỜI GIỚI THIỆU
Kinh tế lượng là thuật ngữ được hai nhà kinh tế học sử dụng lần đầu
tiên vao nam 1930 Do la Gido su A K Ragnar Frisch (1885 — 1973) và Jan Tinbergen (1903 — 1994) Hai 6ng 14 những nhà khoa học được nhận giải Nobel năm 1969 về kinh tế do những công trình nghiên cứu nỗi tiếng mà trong đó, những ứng dụng mạnh của kinh tế lượng đã đưa ra những mô
hình kinh tế đưới dạng định lượng Có thể nói, Kinh tế lượng là một bộ môn
khoa học vận dụng những thành tựu của toán học nhằm thiết lập các mô hình
kinh tế với mục đích ước lượng các tham số của mô hình dưới dạng định lượng để nêu bật mối quan hệ giữa các biến kinh tế trong các mô hình đó Đồng
thời sử dụng các kết quả để kiểm tra tính vững chắc của các giả thuyết trong mô hình và thực hiện dự báo cũng như mô phỏng biện tượng kinh tế
Từ những năm 1960, Kinh tế lượng đã được quy định giảng dạy ở một
số trường Đại học ở Việt Nam và đến năm 1982, Kinh tế lượng là môn học bắt buộc đối với sinh viên các trường Đại học Kinh tế Với yêu cầu cấp thiết cung cấp các kiến thức cơ bản của kinh tế lượng cho sinh viên khối
kinh tế, đã có nhiều giáo trình Kinh tế lượng, bài giảng Kinh tế lượng được biên soạn Dựa trên kinh nghiệm nhiều năm giảng dạy và hướng dẫn thực
hành, tác giả biên soạn cuốn giáo trình Kinh tế lượng nhằm đơn giản cách tiếp cận những vấn đề rất phức tạp của môn học Đồng thời trong giáo trình
cũng đưa ra các bước đầu tiên để người học có thể xây dựng được những mô hình kinh tế đơn giản dựa trên phần mềm EVIEWS
Tác giả xin chân thành cám ơn Thể Trịnh Huy Hồng, Th§ Phạm Tuấn Hòa, ThS Lê Văn Hùng và đặc biệt trân trọng cám ơn GS.TS Nguyễn
Khắc Minh đã cho những ý kiến quý báu trong quá trình hoàn thành bản
thảo giáo trình này |
Tác giả mong đón nhận được nhiều ý kiến đóng góp của đông đảo bạn đọc về nội dung, hình thức, các thuật ngữ để cuốn sách có nội dung hoàn
thiện hơn Mọi sự góp ý xin gửi về Bộ mơn Tốn, Học viện Ngân hàng, hoac Email: buiduyphu@yahoo.com
_ _ mm chân thành cảm ơn
TS Bùi Duy Phi”
Trang 4- NHẬP MÔN KINH TẾ LƯỢNG
1 CÁC KHÁI NIỆM CƠ BẢN
Kinh tế lượng (Econometrics) là một mơn Tốn ứng dụng được ra đời từ cuối thế ký XIX, đầu thế kỷ XX Đó là môn khoa học để đo lường kinh
tế hay lượng hóa kinh tế Tuy nhiên ngày nay, kinh tế lượng không chỉ bó
hẹp trong lĩnh vực kinh tế mà nó còn được ứng dụng rộng rãi trong các lĩnh vực khác như kỹ thuật, văn hóa, xã hội
Trước hết có thể hiểu, Kinh tế lượng là lý thuyết kinh tế được sử dụng
bằng ngơn ngữ tốn học Đó là sự kết hợp của các học thuyết kinh tế, thống
kê kinh tế, thống kê tốn và mơ hình toán kinh tế
Kinh tế lượng nghiên cứu một hiện tượng kinh tế được đặt trong một
không gian và một khoảng thời gian nhất định Điều đó có nghĩa là, hiện
tượng nghiên cứu xảy ra trong lĩnh vực, một miền hay một vùng nào đó và có xuất phát điểm ban đầu và có điểm kết thúc
Kinh tế lượng là sự kết hợp các công cụ nghiên cứu về mặt lý thuyết và thực nghiệm để phân tích định lượng các mối quan hệ trong hiện tượng đang nghiên cứu
Kinh tế lượng có thê được xem là một môn khoa học vận dụng phương pháp suy đoán thích hợp để tìm ra các quy luật vận động giữa các nhân tố trong hiện tượng đang nghiên cứu Từ đó bằng các công cụ của nó sẽ thực
hiện công tác dự báo dựa trên nền tảng kết quả thu được 2 PHƯƠNG PHÁP LUẬN CỦA KINH TẾ LƯỢNG
Nghiên cứu một hiện tượng kinh tế được tiến hành theo các bước sau:
Bước 1: Nêu ra giả thuyết kinh tế Mỗi hiện tượng xây ra sẽ được soi
sáng bởi nền tảng một học thuyết kinh tế Trên cơ sở đó, người nghiên cứu
Trang 5Bước 2: Thiết lập mô hình toán kinh tế Trong hiện tượng nghiên cứu, các nhân tố có quan hệ chặt chẽ với nhau Để phản ánh các mối quan hệ về mặt định lượng cần phải biểu thị dưới dạng toán học bằng mơ hình tốn kinh tế, trong đó các nhân tố được phân chia thành ba loại: biến ngoại sinh, biến nội sinh và các tham số kinh tế Mối quan hệ giữa các biến được phản ánh bởi các phương trình hay hệ các phương trình
Bước 3: Xây dựng mô hình kinh tế lượng tương ứng
Mơ hình tốn kinh tế đã phản ánh tương đối chặt chế quan hệ giữa các
biến kinh tế trong một hiện tượng nghiên cứu Tuy nhiên kinh tế lượng cho
rằng trên thực tế, ngoài những nhân tố đã biết, có thể còn có nhiều nhân tố khác không được nêu ra nhưng có ảnh hưởng tới các nhân tố trong mô hình
Vì vậy, đại diện cho các nhân tố này được biểu thị bởi một lượng ngẫu nhiên U¡ Chúng sẽ được gọi là sai số ngẫu nhiên, yếu tố ngẫu nhiên hay
nhiễu ngẫu nhiên SỐ
Buốc 4: Thu thập và xử lý số liệu
Kinh tế lượng nghiên cứu mối quan hệ giữa các biến số trong một không gian và một khoảng thời gian nhất định Sự biến động của các biến số được phản ánh qua số liệu của chúng Vì vậy khi xây dựng mô hình cần phải có các số liệu chính xác của các biến Tuy nhiên đây là một khó khăn thực tế mà bắt kỳ người nghiên cứu nào cũng gặp phải Bởi vậy, có số liệu đã khó, xử lý số liệu để phục vụ mục đích nghiên cứu còn là vấn đề khó khăn hơn đặt ra cho người nghiên cứu
Bước 5: Ước lượng các tham số của mô hình
Nhiệm vụ đầu tiên của kinh tế lượng là sau khi xây dựng mô hình và thu
thập được số liệu, người nghiên cứu sẽ sử dụng các công cụ của kinh tế lượng để ước lượng các tham số của mô hình để đưa ra mối quan hệ về lượng giữa các yếu tố trong mô hình Như vậy đòi hỏi người nghiên cứu phải có
những kiến thức nhất định vẻ lý thuyết kinh tế và mô hình toán kinh tế
Bước 6: Kiểm định các giả thuyết
Thực hiện các kiểm định giả thuyết sẽ cho biết bản chất các mối quan hệ về lượng trong mô hình Việc chấp nhận các giả thuyết cho phép khẳng định tính đúng đắn của các mối quan hệ cũng như việc chấp nhận mô hình
Trang 6Bước 7- Dự báo
Nhiệm vụ quan trọng của xây dựng mô hình kinh tế lượng là sau khi có một mô hình tốt, sử dụng mô hình đó để thực hiện các dự báo, làm cơ sở cho các hoạch định chính sách trong tương lai
Bước 8: Sử dụng mơ hình để kiểm sốt hoặc đẻ ra các chính sách Từ mô hình tốt và các dự báo, người nghiên cứu sẽ đưa ra các biện pháp, các chính sách để kiểm soát các nhân tố của mô hình phục vụ mục đích trong tương lai Những biện pháp này có thể là những biện pháp mang tính chất định tính và cả những biện pháp có tính định lượng
3 VÍ DỤ
Hãy nghiên cứu mối quan hệ giữa thu nhập và tiêu dùng bằng việc xây dựng mô hình kinh tế lượng
Bước 1: Nêu ra giả thuyết kinh tế
Mối quan hệ giữa thu nhập và tiêu dùng là một trong những mối quan hệ cơ bản được nhiều lý thuyết kinh tế đề cập tới Ở đây chúng ta dựa trên giả thuyết cơ bản của Keynes: “Tâm lý cơ bản là một người sẽ tăng tiêu dùng khi thu nhập của người đó tăng, song không thể nhiều hơn mức tăng của thu nhập”
Từ giả thuyết trên ta có thể rút ra 2 ý sau:
— Thu nhập tăng kéo theo sự gia tăng của tiêu dùng
— Tốc độ tăng của tiêu dùng không thể lớn hơn tốc độ tăng của thu nhập
Điều đó có nghĩa là 0 < MPC < l
Bước 2: Xây dựng mơ hình tốn kinh tế
Ta gọi X là mức thu nhập, Y là mức tiêu dùng Như vậy, X sẽ là biến
ngoại sinh, Y là biến nội sinh Để lượng hóa mối quan hệ giữa hai biến này, ta
Trang 7
Hình 1.1
Hàm tiêu đùng đơn giản của Keynes có ưu điểm là, trong mọi trường hợp, thu nhập tăng đều cho biết tiêu dùng tăng Tuy nhiên, nó có nhược điểm sau:
— Giả định Y phụ thuộc vào X dưới dạng hàm số là quá cứng nhắc Nếu
ta chấp nhận nó có nghĩa là với mỗi giá trị của X sẽ cho một giá tri cha Y _ Tuy nhiên trên thực tế, mỗi giá trị của X có thể xảy ra các giá trị của Y một
cách ngẫu nhiên
— Với hàm tiêu dùng của Keynes, ta chưa biết được chính xác B, va B, là bao nhiêu, ở đây chỉ có thông tin duy nhất là 0<, <1
- Bước 3: Xây dựng mô hình kinh tế lượng tương ứng
Kinh tế lượng giả định rằng, tiêu dùng phụ thuộc vào thu nhập ở dạng tương quan chứ không phải ở dạng hàm số nên mô hình kinh tế lượng có đạng:
Y, =B¡ +B,X, + Uj
trong đó: U¡ là sai số ngẫu nhiên (yếu tố ngẫu nhiên, nhiễu) phản ánh
sự tiêu dùng cá biệt Từ đó hàm tiêu dùng sẽ được biểu diễn dưới dạng: E(VY/X) = Bị + B„X,
Trang 8Bước 4: Thu thập số liệu
Xét ví dụ sau: Nghiên cứu mỗi quan hệ giữa tiêu dùng gộp Y phụ thuộc vào thu nhập gộp X của nước Mỹ từ năm 1980 — 1991 tính theo giá năm 1987 (đơn vị: tỷ USD) Năm ` x Nam Y xX 1980 2447.1 3776.3 1986 2969.1 4404.5 1981 2476.9 ` 3843.1 1987 - 3052.2 4539.9 1982 2503.7 3760.3 1988 3162.4 4718.6 1983 261 9.4 3906.6 1989 3223.3 4838.0 1984 2746.1 4148.5 1990 3260.4 4877.5 1985 2865.8 4279.8 1991 3240.8 4821.0
Bước 5: Ước lượng các tham số của mô hình
Sử dụng phương pháp ước lượng của kinh tế lượng ta thu được các ước lượng điểm cho các tham số với các giá trị sau
^ a
B, =—231.8; Bạ =0.7194 _ Khi đó hàm tiêu dùng ước lượng có đạng:
Yi =-231,8+0.7194X,
trong do: Ÿ: là ước lượng điểm của E(Y/X )
Với kết quả nhận được chúng ta có thể xây dựng khoảng tin cậy cho
các tham số với độ tin cậy l—œ cũng như khoảng tin cậy cho E(Y/⁄X)) Bước 6: Kiểm định các giả thuyết liên quan
Trong một mô hình đòi hỏi phải thực hiện nhiều kiểm định giả thuyết
Chẳng hạn, xuất phát từ giả thiết 0 <B, <1 chúng ta có bài toán kiểm định
cặp giả thiết:
th :B¿ <1
H,:B, >1
Còn nhiều kiểm định khác được đặt ra tương ứng với mỗi mô hình cụ
Trang 9Bước 7: Thực hiện dự báo
Giả sử rằng, dự kiến đến năm 1994, thu nhập gộp của nước Mỹ là 6000
tỷ USD Câu hỏi đặt ra là mức tiêu dùng trung bình sẽ là bao nhiêu, tức là đưa ra một ước lượng điểm cúa tiêu dùng Thay vào hàm thu được:
Yioos =—231.8 + 0.7194x6000 = 4084.6
Từ kết quả này, nền kinh tế phải thực hiện các chính sách hỗ trợ như sản xuất bao nhiêu, xuất nhập khâu bao nhiêu, đầu tư như thế nào để đạt
mục (tiêu đó :
Bước 8: Sử dụng mô hình để kiểm soát hoặc đề ra các chính sách
Chẳng hạn, Chính phủ Mỹ tin rằng với mức tiêu dùng là 4000 tỷ USD thì sẽ duy trì được tỷ lệ thất nghiệp là 6.5% Vậy mức thu nhập phải đạt
được là:
4000 = —231.8 + 0.7194K => XK ~5882 ty USD
Từ đó, Chính phủ phải có những chính sách vĩ mô như thế nào để đạt mức thu nhập đó
Tóm lại, kinh tế lượng là phương pháp tiếp cận định lượng để nghiên
cứu một hiện tượng xảy ra trong đời sống kinh tế và xã hội Nó sẽ cho ta một cách nhìn dưới dạng định lượng của các quan hệ trong một mô hình thực nghiệm Bởi vậy ngày nay nó còn được sử dụng rộng rãi trong các ngành kỹ thuật và trong các ngành xã hội khác
Trang 10Cương 4 |
MO HiNH HOI QUY HAI BIEN —
CAC TU TUGNG CO BAN
1.1 PHAN TICH HOI QUY
1.1.1 Khái niệm cơ bản
Khái niệm hồi quy được F Galton đưa ra vào năm 1886 khi ông nghiên cứu mối quan hệ giữa chiều cao của các ông bố ảnh hưởng thế nào đến chiều cao của những người con
Phân tích hồi quy là nghiên cứu sự phụ thuộc của một hay nhiều biến
được gọi là biến phụ thuộc (biến được giải thích, biến nội sinh) vào một hay
nhiều biến khác được gọi là biến độc lập (biến giải thích, biến ngoại sinh) — Nếu trong mô hình chỉ có một biến độc lập và một biến phụ thuộc, ta gọi là mô hình hồi quy đơn
Ví dụ 1.1: Nghiên cứu mối quan hệ giữa chiều cao của các người con phụ thuộc vào chiều cao của các ông bố
Gọi X là chiều cao của người bố, Y là chiều cao của người con Khi đó, X là biến độc lập (ngoại sinh), Y là biến phụ thuộc Rõ ràng mối quan hệ
này không thể biểu diễn dưới dạng:
Y=P,+B,X
bởi lẽ mỗi ông bố chỉ có một chiều cao duy nhất, nhưng các con của người đó sẽ có chiều cao khác nhau Do đó việc nghiên cứu này phải được đưa ra dưới dạng:
Y, =B, + B,X, + Uj
Đây là mô hình hồi quy đơn được đặt ra dé nghién cứu mối quan hệ giữa hai biến
— Nếu mô hình có một hay nhiều biến phụ thuộc và nhiều biến độc lập, ta gọi là mô hình hồi quy bội
Trang 11Vi du I.2: Nghiên cứu mối quan hệ giữa nhụ cầu thị trường về một loại hàng hóa
Gọi Y là nhu cầu thị trường về loại hàng hóa đang nghiên cứu, khi đó
các nhân tố có ảnh hưởng đến Y sẽ là: _
©_ X¿ giá của chính loại hàng hóa nghiên cứu
e X: giá bình quân của các loại hàng hóa thay thé ° X¿ thu nhập bình quân của thị trường
® Xs thị hiếu của thị trường
e© X; cơ cấu gia đình e_ X; tôn giáo gia đình
Khi đó mô hình hổi quy bội có dạng:
Y, =Pịạ +B;.X¿¡ +Bạ.X¿; +B¿.X¿; +B;-ÿ¡ + s.ẤX¿; +B¿.Xz¡ + Ú,
_ Trong mô hình này, U; đại điện cho những nhân tố có ảnh hưởng tới nhu
câu loại hàng hóa nghiên cứu nhưng ta không đưa vào Đông thời nhận thây
trong mô hình, các biến Xa, Xạ, Xạ là các biến định lượng, còn các bién Xs,
X¿, X; là các biên định tính Nói cách khác, kinh tê lượng sẽ nghiên cứu được mô hình mà trong đó có các biến định lượng và cả các biến định tính
1.1.2 Nội dung phân tích hồi quy
Ba nội dung chính của phân tích hồi quy là:
e© Ước lượng các tham số của mô hình Từ đó ước lượng giá trị trung
bình của biến phụ thuộc khi cho trước giá trị của biến giải thích e©_ Kiểm định giả thuyết về bản chất của sự phụ thuộc
e Dv bao giá trị trung bình và giá trị cá biệt của biến phụ thuộc khi đã biết giá-trị các biến độc lập trong tương lai
1.1.3 Số liệu cho phân tích hồi quy
Trong quá trình phân tích hồi quy, các số liệu bao gồm 3 loại:
— Số liệu theo thời gian: đây là loại số liệu được thu thập định kỳ tại các
thời điểm khác nhau trong một khoảng thời gian cho một đối tượng cụ thể
Trang 12theo tháng, theo quý, theo năm Ví dụ số liệu về chỉ số giá tiêu dùng theo tháng của Việt Nam từ tháng 1 năm 2000 đến tháng 6 năm 2011, đó là số liệu theo tháng Việc điều tra số liệu theo tần số nào tùy thuộc vào mục đích
- của người nghiên cứu -
— Số liệu chéo: là số liệu điều tra cho nhiều đối tượng khác nhau tại
cùng một thời điểm Chẳng hạn, số liệu các yếu tố ảnh hưởng đến mức lợi
nhuận của một công ty trong năm 2011 Khi đó người nghiên cứu phải thu
thập số liệu các yếu tô như giá đầu vào, khối lượng đầu vào, các loại chỉ phí,
giá đầu ra, doanh thu, chi phí nhân công, đóng góp xã hội
— Số liệu hỗn hợp: là loại số liệu điều tra cho nhiều đối tượng định kỳ
trong một khoảng thời gian nào đó Đây là loại số liệu được sử dụng rất nhiều trong nghiên cứu
Cần lưu ý rằng, trong quá trình thu thập số liệu phải khai báo đúng và nhất quán loại số liệu Đồng thời cũng phải nhận thức được rằng các số liệu điều tra thường có độ tin cậy thấp do các nguyên nhân sau:
— Các số liệu kinh tế thường phi thực nghiệm (tức là không loại trừ
được các nhân tố ngoại lai)
— Các số liệu điều tra thường sai lệch do sự trùng lặp, bỏ sót hay thông tin kém chính xác
— Do quy mô điều tra rộng nên việc chọn mẫu khác nhau có thê thu
nhận được các kết quả khác nhau
~ Các số liệu kinh tế thường ở mức tổng hợp, do đó khó khăn trong phân tích chỉ tiết
Như vậy trong xây dựng mô hình, khó khăn lớn nhất mà người nghiên cứu gặp phải đó là vẫn đề về thu thập và xử y các số liệu phục vụ quá trình hồi quy
1.2 HÀM HỒI QUY TỔNG THỂ
1.2.1 Các khái niệm cơ bán
Để đưa ra khái niệm cơ bản của hàm hồi quy tổng thể, chúng ta giả sử
có một biến ngẫu nhiên hai chiều rời rạc (X,Y) với bảng phân phối xác suất như sau:
Trang 13Y = x yr Y2 wey; Ym P(X)
Xị P@y) PŒ@y¿) PRY) P(Xi.Ym) p(x)
s |P&sy) p@y) POY) POY) p(x)
Kj p(xnys) P(%Y2) p(X,yj) PŒiYm) p(xi)
Xụ pXuyi) PXaY2) PŒXay) —- P(Xuym) p(%n)
P(Y) p(y) py2) pỚ/) Pm) - I Các tính chất của bảng phân phối xác suất: Tính chất l : Tính chất 2 : Tính chất 3 : 0<p(x,,y,) <1 > p(x; ,y;) = p(x;) 1=1,n jel > p(x;,,y;) = P(y;) i=l ¡j=1Lm 53 pŒ,,y;)=1 i=l jel
Từ bảng phân phối xác suất đồng thời, chúng ta có hai bảng phân phối
xác suất của các thành phần biên như sau
- Bảng phân phối xác suất của biến ngẫu nhiên X có dạng : x XY} X Kj eae Xy P(X) p(x) pŒ) p(X) - p@Œ) — Bảng phân phối xác suất của biến ngẫu nhiên Ÿ có dạng : © Y Vị Y2 Yj vee Ym
P(Y) Pp) POs POD Pm)
- Từ các bảng phân phối xác suất trên, chúng ta thu được các tham số cơ
bản sau :
Trang 14* EX) = Dx) Var(X) = E(X-E(X))? = 3 x’p(x,) — BOO)? = 4 Var(X) * EY) =>) y;p(y;) Var(Y) = E(Y-E(Y)y = > y*p(y;) — (EC) = vVar(Y)
Khi 46 có hai tham số quan trọng phản anh mối quan hệ giữa hai biến ngẫu nhiên X và Y như sau :
— Hệ số hiệp phương sai il (Covariance cofficient) được xác định bởi công thức sau : n m Cov(X, Y) = E(X-E(X))(Y-E(Y)) = 2 » x¡y,p(,,y,)—~ EOOE(Y) I je Hệ số Cov(X,Y) có các tính chất sau: Tỉnh chất 1: Cov(X,Y) = Cov(Y,X)
Tinh chat 2 : Cov(X + Y,Z) = Cov(X,Z) + Cov(Y,Z) Tinh chat 3: Cov(a X,Y) = Cov(X, a Y) = a Cov(X,Y)
Tinh chat 4 : Var(X+Y) = Var(X) + Var(Y) + 2.Cov(X,Y)
Var(X—Y) = Var(X) + Var(Y) — 2.Cov(X,Y)
Ket quả trên cho thấy, Cov(X,X) = Var(X) Đồng thời trong trường hợp
hai biên ngầu nhiên X và Y độc lập, Cov(X,Y) = 0, trường hợp ngược lại,
X và Y la hai biến không độc lập Nói cách khác, hệ số này có thể được sử
dụng đê xem xét tính độc lập của hai biên ngầu nhiên Tuy nhiên, nhược điểm của hệ số này là đơn vị đo của nó được tính theo tích đơn vị đo của hai biên ngau nhién nên khó khăn trong việc sử dụng đê đo mức độ quan hệ giữa các biên ngẫu nhiên Từ đó người ta sử dụng hệ sô sau:
Cov(X,Y)
— Hệ số tương quan được tính theo công thire: p,, =
Ơ,.Ơy
Trang 15Hệ số này có các tính chất :
Tinh chat 1: -1< p„ <1 và không có đơn vị đo
Tỉnh chất 2 : p„„ =0 © Cov(%X,Y) =0 điều này phản ánh X và Y là hai
biến ngẫu nhiên độc lập
Tỉnh chất 3 : Nếu Є =—l (p„ =1), X và Y là hai biến ngẫu nhiên có
quan hệ dạng hàm số nghịch biến (đồng biến)
Tỉnh chất 4: Nễu -1< p„ <0, X và Y là hai biến ngẫu nhiên có tương quan ngược chiều (tương quan âm) với nhau
: Néu 0< p„ <1, X và Y là hai biến ngẫu nhiên có tương
.quan thuận chiều (tương quan đương) với nhau
Đây là một hệ số quan trọng trong quá trình nghiên cứu của kinh tế lượng Bởi lẽ trên thực tế việc hai biến ngẫu nhiên độc lập hay có quan hệ dạng hàm số là rất hiếm xảy ra, phần lớn chúng sẽ có quan hệ dạng tương quan
ca : x: As A A
- 1/2.2 Hàm hồi quy tông thê
Khi nghiên cứu biến ngẫu nhiên nhiều chiêu, chúng ta còn quan tâm tới _ khái niệm phân phối xác suât có điêu kiện và kỳ vọng toán của nó Chang hạn, khi cho biến ngẫu nhiên X nhận giá trị Xị, ta có bảng phân phôi xác suât có điều kiện sau : Y/(X = Xj) | yr Y2 wee yj - Ym P(Y/X=X) | PO) pWz/x) PO/X) PWwX) " _ Đ¡,Vj) - trong đó: p(yj/xi) = ———— V (x) 1]
Từ đó kỳ vọng toán có điều kiện thu được:
E(Y/X=X) = Dy, Py; Ix ) Vi=l,n
Với mỗi giá trị cua X, chúng ta thu nhận được duy nhất một giá trị xác định của kỳ vọng toán có điều kiện của Y Do X thay đổi giá trị, các giá trị kỳ vọng toán này cũng thay đổi Từ đó ta có một mối quan hệ hàm
số và hàm số này được gọi là hàm hồi quy tổng thể, ký hiệu là PRF
Trang 16(Population Regression Function) Như vậy về bản chất, hàm hồi quy tông thể là kỳ vọng toán có điều kiện Nó phản ánh sự biến thiên của giá trị trung bình theo xác suất của biến phụ thuộc khi biến độc lập thay đổi
Để đơn giản, giả sử rằng hàm này có dạng tuyến tính như sau
E(Y/X=X) =f@X)= B,+B,X, Vi=ln
- Việc chúng ta giả định dạng hàm là tuyến tính nhằm đơn giản việc phân tích ban đầu Bởi lẽ dạng hàm tuyến tính trong hồi quy hai biến chỉ chứa đựng hai tham số B,, B„ Chúng được gọi là các tham số hổi quy Khi đó
| — B, được gọi là hệ số chặn Nó cho biết khi X nhận giá trị bằng 0 thì
giá trị trung bình của Y là Bị :
— B; được gọi là hệ số góc Nó cho biết khi X tang 1 don vị thì giá trị
trung bình của Y thay đổi bao nhiêu đơn VỊ
Ý nghĩa chung của PRF: Ham héi quy tổng thể phan í ánh xu _ hướng
trung bình của sự phụ thuộc của biến Y vào biếnX ` ˆ sẽ
1.2.3 Mô hình hồi quy tổng thể (PRM)
Ở trên chúng ta có hàm hồi quy tông thể phản ánh sự biến thiên của giá
trị trung bình của biến phụ thuộc Tuy nhiên với mỗi giá trị của biến độc lập có thể xảy ra các giá trị của biến phụ thuộc một cách ngẫu nhiên và chúng sai lệch so với các giá trị trung bình một lượng ngẫu nhiên Khi đó, „ mô hình hồi quy tổng thể PRM (Population Regression Model) có dang:
= B, +B,X, +U; _Vi=ln
Sự tồn tại của các sai số ngẫu nhiên Uj trong PRM có thể được giải
thích bởi các nguyên nhân sau: chu
— Sự mập mờ về lý thuyết: trong một t hiện tượng nghiên curu, cd thê có rất nhiều nhân tố ảnh hưởng đến biến phụ thuộc mà người nghiên cứu không thê biết hết được Khi đó U; đại diện cho các nhân tố có tác động đến
mô hình nhưng không được đưa vào
— Theo nguyên tắc tiết kiệm trong xây dựng mô hình, các nhân tố có
ảnh hưởng yếu đến biến phụ thuộc có thể được loại bỏ ra U; sẽ là biến đại
diện cho chúng
17
Trang 17— Do sự sai lệch trong quá trình thu thập và xử lý số liệu Việc điều tra, thu nhận số liệu gốc chuẩn xác là rất khó khăn Do rất nhiều điều kiện khách quan và chủ quan, số liệu thu thập được, qua quá trình xử lý
sẽ có những sai lệch nhất định Từ đó gây ra những sai lệch nhất định
trong quá trình hồi quy U; sẽ là nơi chứa đựng những sai lệch đó
— Do chỉ định sai mô hình Mối quan hệ giữa biến độc lập với biến phụ thuộc trên thực tế là phức tạp và không biết rõ Việc giả định mô tả dưới dạng hàm nào đó, chẳng hạn dạng tuyến tính có thê chưa phản ánh chính xác bản chất mối quan hệ đó Khi đó sẽ gây ra sự chênh lệch giữa tính toán
.so với thực tiễn và U¡ phản ánh chênh lệch đó -
_ Như vậy các sai số ngẫu nhiên U¡ tồn tại trong PRM như là một tất yếu
Chúng đại diện cho những yếu tố ngẫu nhiên nên tự chúng lại là các biến ngẫu nhiên và có các quy luật phân phối xác suất nào đó Chính sự tổn tại thành phan ngẫu nhiên này đã giúp chúng ta phân biệt ranh giới giữa mơ
hình tốn kinh tế và mô hình kinh tế lượng |
_ 1.3 M0 HINH HOI QUY MẪU VÀ HÀM HỒI QUY MẪU
1.3.1 Hàm hồi quy mẫu SRF (Sample Regression Function)
Trong một tổng thể, các tham số B,, B, la các tham số hoàn toàn xác
định nhưng chúng ta không biết được Đề ước lượng chúng, từ tông thể xây dựng một mẫu ngẫu nhiên hai chiều với kích thước n như sau:
W =(Œ, Y¡), (Xa, Y¿), :., CXn, Yn))
Khi đó hàm hồi quy được xây dựng đựa trên mẫu rút ra từ tổng thể
được gọi là hàm hổi quy mẫu (SRF) Nó có dạng như sau:
Ÿ =ñ, + BX, i=1n
_ trong đó: Ÿ: là ước lượng điểm của E(Y/X));
B,, B; là ước lượng điểm của B,, B,
Trang 18| | SRF { Un PRE
U, ‘ | U2 `
1.3.2 Mô hình hồi quy mẫu SRM (Sample Regression Model)
Việc xác định được các hệ số B,, 8, giúp ta xác định được các giá trị
ước lượng điểm của kỳ vọng toán của Y trên mẫu Các giá trị này so với các giá trị Y trên mẫu sẽ có sự sai lệch được gọi là các phần dư e¡ Từ đó
mô hình hồi quy mẫu (SRM) có dạng |
Yi=B,+B,.Xite = i=in
Sự tồn tại các phần dư trong SRM có thê được giải thích bởi sự tồn tại thành phần U; trong PRM Nói cách khác, các phần dư e;¡ như là hình ảnh của các thành phần U; trên mẫu
TÓM TẮT CHƯƠNG
Những tư tưởng cơ bản của bài toán hồi quy và ba nội dung cơ bản của
hồi quy: ước lượng các tham số, kiểm định các giả thiết thống kê và thực hiện đự báo đã được trình bày trong phần đầu của chương 1 Từ đó người đọc có thé thay được sự khác biệt giữa một mô hình kinh tế toán với một
mô hình kinh tế lượng bởi sự tổn tại các sai số ngẫu nhiên trong các mô hình kinh tế lượng Chính sự tồn tại của các nhân tế này, việc nghiên cứu sâu về chúng đã là một trong những nhân tố thúc đây sự phát triển mạnh mẽ
của môn Kinh tế lượng
Trang 19Cfươns 2
HÀM HỒI QUY HAI BIẾN
2.1 PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT CÁC PHẦN DƯ -
OLS (Ordinary Least Squares) 2.1.1 Nội đung cúa phương pháp `
Trong chương trước, từ tổng thể của biến ngẫu nhiên hai chiều, chúng ta rút ra một mẫu ngẫu nhiên hai chiều và từ đó đi xây dựng hàm hổi quy mẫu và mô hình hồi quy mẫu Vẫn đề đặt ra là, các hệ số B, › 8, được tính như thế nào để đại điện tốt nhất cho B,, Be ? Phuong phap binh phuong bé nhất các phần dư sẽ giải quyết vấn đề này
_ Nội dung cơ bản của phương pháp này là di tìm các ước lượng điểm B, ; B, sao cho tổng bình phương các sai lệch giữa SRF va SRM là be nhat, điều này có nghĩa là:
xở S04, ~Y;) = Sey,- fi B,.X,)? > min
Khi có một mẫu xác định, các giá trị Xị, Y¡ đã biết, Như vậy đòi hỏi trên
chính là việc đi tìm cực tiểu của một hàm với hai biến độc lập B,, B;
Áp dụng điều kiện cực trị của hàm hai biến chúng ta sẽ thu được các kết t qua sau:
7 Goi: X-_ŸX, yeldy la các giá trị trung bình cộng "` Tea ong Ps bộ wee của X “
và Y có
_ Đặt xị xi = Xj - X, yi= - Y; - Y la su sai ¡lệch giữa các giá: trị thu nhận được so với giá trị trung bình của các chuỗi số liệu
Từ đó chúng ta có công thức xác định các ƯỚC lượng điểm cho các - tham số hồi quy như sau:
Trang 20ze wo
hee m—— " «BY BX (2.1)
V6i (2.1), ching ta sẽ xây dựng được hàm hổi quy mẫu và mô hình hdi quy mẫu cho vẫn đề cần nghiên cứu Hơn nữa, từ (2.1) chúng ta còn có những nhận xét sau:
_ Với mỗi mẫu cụ thể, các giá tri B,, B, được xác định một cách duy: nhất
— Vì mẫu là ngẫu nhiên nên mỗi sự thay đổi của mẫu sẽ kéo theo sự
thay đổi các giá trị của Ô,, 8, Mà những sự thay đổi của mẫu mang tinh ngẫu nhiên nên các ước lượng điểm ÿ,, B, lại là các biến ngẫu nhiên và
chúng sẽ có những quy luật phân phối xác suất nhất định sẽ được xét đến ở phần sau
2.1.2 Các tính chất của SRF
Ti inh chat 1: SRF di qua diém trung bình của mẫu (X, Y )
Tỉnh chất 2: Y= Ÿ?, Trung bình của các giá trị thực tế của mẫu bằng
trung bình các giá trị ước lượng
Tinh chat 3: — e, =0, tức là trung bình các phần dư phải triệt tiêu
i=l ` /
Tinh chất 4: Các giá trị của biến giải thích không tương quan với các phần dư, nghĩa là cov(Xi, ej) = 0
Tỉnh chất 5: Các giá trị ước lượng của biến phụ thuộc không tương
quan với các phần dư, nghĩa là cov( Ÿ,e) =0
2.2 CÁC GIÁ THIẾT CỦA PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT
._ Việc thực hiện hồi quy dé tìm ra các hệ số hồi quy có rất nhiều phương _ pháp Phương pháp bình phương bé nhất là một phương pháp đơn giản Nó -đã đưa ra các công thức đơn giản để xác định ổ, > ñ› Tuy nhiên, để áp
dụng phương pháp này, trong mô hình phải chấp nhận các giả thiết sau:
Trang 21Giả thiết 1: Mô hình là tuyến tính đỗi với các tham số mà không nhất thiết tuyến tính đối với các biến số Điều đó có nghĩa là, sự có mặt của các
tham số trong mô hỉnh chỉ ở đưới dạng bậc nhất Còn các biến số có thể
không ở dạng tuyến tính Trong những trường hợp đó phải thực hiện đổi biến số để các biến tham gia trong mô hình có dạng tuyến tính Khi đó chúng ta mới có mô hình hồi quy tuyến tính
Giả thiết 2: Các biến giải thích phải là phi ngẫu nhiên (hoàn toàn là các
giá trị xác định) Đồng thời trên mỗi mẫu, giá trị của các biến giải thích phải khác nhau, càng khác nhau nhiều càng tốt
Với giả thiết này, khi thực hiện lấy mẫu, giá trị của các biến giải thích phải lấy khác nhau Còn giá trị của biến phụ thuộc có thê bằng nhau Điều này thể hiện tính ngẫu nhiên của biến phụ thuộc khi chịu tác động của các
biến giải thích
Giả thiết 3: Kỳ vọng toán của các sai số ngẫu nhiên U; bằng 0, tức là: E(U/X) = 0; Vi
Chúng ta đã coi các sai số ngẫu nhiên là các biến ngẫu nhiên Giả thiết này cho phép chúng ta coi chúng có cùng kỷ vọng toán và giá trị đó triệt
tiêu Trung tâm phân phối của các U; là 0 |
Giả thiết 4: Phương sai các sai số ngẫu nhiên là không thay đổi (đồng đẻu)
`, Var(U/Xi)=@'”; Vi
Giả thiết này cùng với giả thiết 3 khẳng định các sai số ngẫu nhiên có cùng kỳ vọng toán và cùng phương sai Sự biễn động của các giá trị cá biệt
so với các giá trị trung bình là có sự tương đồng Đây là một giả thiết khá chặt để nghiên cứu mô hình (Trong trường hợp giá thiết này bị phá vỡ,
chúng ta sẽ đề cập tới trong nội dung của chương 6)
Giả thiết 5: Các sai số ngẫu nhiên không có quan hệ tuyến tính với
nhau, nghĩa là:
_— Với các số liệu chéo: cov(U/, Uj) =0; VI#j
— Với các số liệu theo thời gian: cov(U;, Urn) = 0; Vk #0
- Việc giả thiết không có quan hệ tuyến tính giữa các sai số ngẫu nhiên _ khẳng định tính độc lập của chúng Nói cách khác, sự biến động của các giá
trị biến phụ thuộc ở thời điểm ¡ không chịu ảnh hưởng ở các thời điểm khác - Tuy nhiên trên thực tế, điều này có thể xảy ra và chúng ta sẽ nghiên cứu
trong chương 7
Trang 22Giả thiết 6: Các biến giải thích Xị không có quan hệ tuyến tính với các sai số ngẫu nhiên U¡, nghĩa là:
Cov(X;, U; )= 0; VI
Giả thiết này cho thấy sự biến động các giá trị cá biệt của biến phụ
thuộc không phụ thuộc vào giá trị của biến giải thích
Giả thiết 7: Kích thước mẫu khi thu thập n mẫu phải đủ lớn, ít nhất phải
lớn hơn các tham số hồi quy trong mô hình và càng lớn cảng tốt
Giả thiết 8: Mô hình phải được chỉ định đúng
Khi xây dựng hàm hỏi quy tổng thê chúng ta đã giả định rằng nó có
dạng tuyến tính Việc giả định cho phép dễ dàng hơn trong phân tích Tuy
nhiên trên thực tế có thể dạng mô hình không như chúng ta chỉ định và khi
đó ta nói rằng mô hình cðỉ định sai Chương 8 sẽ tập trung nghiên cứu vẫn đề về chỉ định dạng hàm
Giả thiết 9: Trong các mô hình hồi quy bội, không có hiện tương đa cộng tuyến giữa các biến giải thích
Việc giả thiết trong mô hình có nhiều biến giải thích, các biến này không có quan hệ tuyến tính với nhau nhằm chỉ xem xét ảnh hưởng trực tiếp của các biến này đến biến phụ thuộc một cách đơn giản nhất Tuy nhiên, giữa các biến này còn có thể có quan hệ với nhau và có các ảnh hưởng gián tiếp đến biến phụ thuộc Vấn đề này sẽ được đề cập đến ở chương 5
2.3 ĐỘ CHÍNH XÁC CỦA CÁC ƯỚC LƯỢNG
Về bản chất, các ước lượng ñ,„ ñ, là các biến ngẫu nhiên nên độ chính
xác của chúng được đo bởi phương sai và hiệp phương sai giữa chúng
Người ta cing minh được rằng khi đó:
Var(B, )= =! =o; —— Var(B,)=
2 2
ny) Xi i=l » i=l (2.2)
trong do o” la phuong sai cac sai sé ngau nhién ma ching ta dua ra trong gia thiét 4
Từ đó độ lệch tiêu chuẩn của chúng là:
Trang 23
Tuy nhiên vì ơ? chưa biết, nên nó được thay thế bởi ước lượng điểm
của nó theo công thức sau: -
(2.3)
(2.4)
Các kết quả (2.4) rất quan trọng vì từ một mẫu cụ thể, chúng ta xác định được các thông số cơ bản là tiền đề để thực hiện các ước lượng cho
các tham số hồi quy cũng như các kiểm định giả thiết liên quan
Trang 24Nếu X < 0 = cov( B, › B,) > 0, B,, B, có mối quan hệ thuận chiều
theo nghĩa nếu 8, là ước lượng thiếu (thừa) của B, thì 8, cũng là ước lượng
thiếu (thừa) của B; Điều đó cho thấy đường SRF không cắt đường PRF - Nếu X> 0 = cov( ñ, › B,) < 0, ñ,, ; B, cé quan hệ ngược chiều theo
nghĩa nếu Š, là ước lượng thiếu của B, thi B„ là ước lượng thừa của B, và
ngược lại Khi đó đường SRF luôn cắt đường PRE
2.4 HỆ SỐ XÁC ĐỊNH r2
Để đánh giá mức độ ảnh hưởng của biến giải thích tác động đến biến
phụ thuộc, chúng ta xây dựng một hệ số từ sự biến thiên của các giá trị biển phụ thuộc
Xuất phát từ mẫu ngẫu nhiên với kích thước n rút ra từ tổng thể, ta có mô hình hồi quy mẫu
Yi= 8, +đ,.Xi+ei= f2 +ep i=in >Yi-¥=f-Fre; | i=in = ÿWi=2, te (i=ln)= yŸ=Ÿ teÖ+2.y,e(1=ln) = Syt=N9, +e t2.5 5,6; a As “ “ | (2.6) Theo tính chất 5 của SRF, thành phần thứ 3 trong (2.6) triệt tiêu Do đó: Sy = ý + e? a a a | (2.7) Goi: TSS = Sy? (Total Sum of Squares) tong binh phuong cdc giá trị của isl biến phụ thuộc CC SỐ ESS = yy; Gixplained Sum of Squares) tổng bình phương các giá trị i=l
ước lượng của biến phụ thuộc
RSS= ye? (Residuals Sum of Squares) tong bình phương các phan du
i=1 ni ng
Trang 25Từ đó có hệ thức:
TSS = ESS + RSS (2.8)
Hệ thức cho thấy sự biến thiên các giá trị của biến phụ thuộc được phân
chia thành hai bộ phận:
— Bộ phận thứ nhất (ESS) là sự biến thiên của biến phụ thuộc được giải
thích bởi sự biến thiên của biến giải thích có mặt trong mô hình
— Bộ phận thứ hai (RSS) 1a sự biến thiên của biến phụ thuộc do những nhân tố vắng mặt trong mô hình gây ra
Việc xây dựng một mô hình hồi quy nhằm xem xét một cách tốt nhất - ảnh hưởng của biến ngoại sinh tác động tới biến phụ thuộc Điều đó có
TT (2.9)
1ˆ được gọi là hệ số xác định
Ý nghĩa:
— Hệ số xác định rˆ dùng để đo mức độ thích hợp của hàm hồi quy Nó cho biết sự biến thiên của biến giải thích có mặt trong mô hình giải thích được bao nhiều phần trăm sự biến thiên của biến phụ thuộc
— r được gọi là hệ số tương quan Nó phản ánh mối quan hệ giữa hai
biến X và Y Dấu của r được xác định bởi mối tương quan ngược chiều hay thuận chiều giữa X và Y
Chú ý: r? còn được tính theo công thức sau: n no n n 3 ESs » a2 2X ad 2x /(n=1) Ag S? T S8” n = By =B; Rn =Ba (2.10) Sự vị 3v /(n-Ð y i=1 i i=l i 2 ữ _
Trong đó: S2, Số là phương sai mẫu của X và Y
2.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG HỒI QUY
Giả thiết 10: Với mỗi mẫu cụ thê chúng ta thu được các giá trị cụ thể của các giá trị ước lượng Tuy nhiên vì mẫu là ngẫu nhiên nên chúng lại là các biến ngẫu nhiên và có các quy luật phân phối nhất định Do đó theo phương
Trang 26pháp bình phương nhỏ nhất chúng được chấp nhận theo giả thiết sau: Các
sai số ngẫu nhiên U¡ phân phối chuẩn độc lập Nghĩa là: e =U, ~ NID(0;0’); Vi B, ~ N(B,; Var(8,)) B, ~ N(B,; Var(B,)) Yi ~ N(B, +B, Xi; 0”); Wi a2 - (n-2)ơ ?o`t 2” ~x*(n—9)
Việc chấp nhận các giả thiết này sẽ tạo cơ sở để chúng ta xây dựng các
biến ngẫu nhiên phục vụ quá trình ước lượng cũng như kiểm định các giả
thiết cho các hệ số hồi quy
2.6 KHOẢNG TIN CẬY CHO HỆ SỐ HỒI QUY
Trong mô hình hồi quy đơn chúng ta đang nghiên cứu có ba tham số cần ước lượng là B,, B,„ và ơø? Việc ước lượng các tham số được tiến hành
theo hai hướng là ước lượng điểm và ước lượng bằng khoảng tin cậy Trong phân trên chúng ta đã thực hiện ước lượng điểm cho chúng Trong phần này chúng ta tiến hành ước lượng bằng các khoảng tin cậy
2.6.1 Khoảng tin cậy cho ÿ,
"VI ~NŒ;Varô)) =U= SD ~N@;1) 1 = poi SEQ@,) _ Tín -9) Khi đó với dé tin cay 1-a , khoang tin cdy cho B, dugc xac định theo công thức sau: P(B, ~ SE(,).t,, (n—2) < B, <8, +SE@,).t„(n-2))=1—œ (2.11)
Trong đỏ: a, +a, =a; con t, (n-2), t,,(n-2) la cdc gid trị tới hạn
của biến ngẫu nhiên T voi mirc xdc sudt a,,a, Tir dé cd cac loai
khoang tin cay sau:
Trang 27~ Khoảng tin cậy bên trái: khi œ, = œ, œ, =0 ta CÓ: -
0 <B, <f, +SE(B,).t,(n-2)
kết quả này được sử dụng khi đòi hỏi tìm giá trị lớn nhat cia 8,
— Khoảng tin cậy bén phai: khi a, = a, a, =0 taco:
B, — SE(B,).t,(n-2) < B, <te
kết quả này được sử dụng khi đòi hỏi tìm giá trị nhỏ nhất của B,
— Khoảng tin cậy đối xứng: khi œ, = œ„= % ta co:
B, — SE(B,) t.y(n—2) < B, < B, + SE(B, ).t,,(n —2) _ 2 2.6.2 Khoảng tin cậy cho ÿ,
2 Any ở _ Ba ~By one
Vì B; ~ NŒ,; Var(;)) iB B,; Var , | => spa) ~ N(0;1) > T= By - B, ~ By ~T(n- 2) SE(,) Khi đó với độ tin cay 1- o ; Khoảng tin cậy cho By được xác định theo công thức sau: P(B, — SE(B,).t, ,(m~ 2) <B, <B, +SE(B,).t,, (n- —- (2.12) Từ đó có các loại khoảng tin cậy sau:
— Khoảng tin cậy bên trái: khi œ, = œ, œ, =0 ta có:
—œ < B, < 8, + SE( ỗ,).1„(n~3)
kết quả này được sử dụng khi đòi hỏi tìm giá trị lớn nhất của B,
— Khoảng tỉ tin cậy bên phải: khi œ;= a, a,=0 ta có:
| — SE(B,).t,(n - 2) < B, < +00
kết quả này được sử dụng khi đòi hỏi tìm giá trị nhỏ nhất của ÿ,
~ Khoảng tin cậy đối xứng: khi Oy = y= % ta CÓ:
B; — SE(B,).t,/(w—3) < B„ < B, + SE(ð,).£,.(m—9) th : <a
Trang 282.6.3 Khoảng tin cậy cho tham số ơ?
(n= 2/6
Theo giả thiết 10 ta có: yŸ = ~X {n -2), vì vậy với độ tin cậy
l—a, khoang tin cậy cho ơ? có dạng: ^9 b(Ú= Qo cote (n ~2)6 Xa, (2-2) Xia, (1m - 2) Từ đó ta có các loại khoảng tin cậy sau: J=l-a (2.13) a2 ¬2
— Khoảng tin cậy bén trai, a, = Ú; œ = œ: 0 < ơ< "=2 | Xi-u(w— 3) nó cho biết giá trị lớn nhất của ơề
a2
¬ a ~2
— Khoang tin cay bén phai,a, = a; a, = 0: ma < oa” < +0;
xu(n~3)
nó cho biết giá trị nhỏ nhất của ơ? Kho
— Khoảng tin cậy dạng œ,=ơ; = œ/2, vi đỗ thị hàm mật độ của biến ngẫu
nhiên ø? không có tính đối xứng nên trong trường hợp này chúng ta co:
(n-9)6 <g°< (n— bì ng
Xe (n — 2) Xa, (n — 2) -
2.7 KIẾM ĐỊNH GIẢ THUYẾT CHO CÁC THAM SỐ
Trong lý thuyết xác suất và thống kê toán học ta đã biết kiểm định giả thuyết thống kê bao gồm hai loại: kiểm định giả thuyết tham số và kiểm
định giả thuyết phi tham SỐ Trong phần này chúng ta thực hiện kiêm định
tham số cho các hệ số hồi quy theo trình tự các bước sau:
2.7.1 Kiểm định giả thuyết cho tham số ÿ,
Giả sử từ thông tín ban đầu cho biết 6, = } Khi đó:
— Bước I: Theo yêu cầu của bài toán tá có một trong 3 cặp giả thuyết sau
Hy :B, =B;, H, :B, =B; , A, : 8B, =B;
H,:8,>8;° H, :B, <B, H, :B, 4B,
Trang 29— Bước 2: Tiêu chuẩn kiểm định được chọn là _ñ- B-B, * Bi Pr ° B,-B: ~'T(n—9)
"8W, SEW,)
— Bước 3: Với mức ý nghĩa œ, miền bác bỏ giả thuyết Họ, ký hiệu là
W„, được biểu diễn dưới bảng sau: Loại giả thuyết ` Họ Hy Wa Bén phai B, = By ~ B, > B T: T > tu(n-2) Bên trái B, = Bị B, <B; T: T<-t/n-2) Hai phía B, = Bị Bạ # T: |T| > tua(n-2)
— Bước 4: Với các số liệu thu được từ mẫu, tính giá trị của tiêu chuẩn kiểm định, gọi là giá trị quan sát, ký hiệu là tạ
— Bước 5: So sánh tạ với miền bác bỏ W„ mà thực chất là so sánh với
-_ các giá tri tới hạn tu(n-2)
+ Nếu tụ cW,, kết luận: với mức ý nghĩa œ, với số liệu đã cho chúng ta bác bỏ Hạ, thừa nhận H)
+ Nếu tgs ¢ Wa, két luận: với mức ý nghĩa œ, với số liệu đã cho, ta
chưa có cơ sở bác bỏ Họ để thừa nhận H; (trên thực tế là thừa nhận Hụ) 2.7.2 Kiểm định giá thuyết cho tham số B,
Gia sử từ thông tin ban đầu cho biết B, = B; Khi đó:
Trang 30— Bước 3: Với mức ý nghĩa œ, miền bác bỏ giả thuyết Họ, ký hiệu là W,
được biểu diễn dưới bảng sau: Loại giả thuyết Ho Hị | Wa Bén phai 8, = B; B > By | T: T > tuín-2) Bén trai B, = B B < By T: T <—to(n-2) Hai phia B, = B, B, * By T: a > to/a(n-2)
— Bước 4: Với các số liệu thu được từ mẫu, tính giá trị của tiêu chuẩn
kiểm định, gọi là giá trị quan sát, ký hiệu là tụ |
oo Bước 5: So sánh t„ với miền bác bỏ Wa
+ Néu tgs € Was kết luận: với mức ý nghĩa a, với số liệu đã cho
chúng ta bác bỏ Họ, thừa nhận H¡
+ Nếu tgs € Wa, kết luận: với mức ý nghĩa œ, với số liệu đã cho, ta
chưa có cơ sở bác bỏ Họ dé thừa nhận H; (trên thực tế thừa nhận Hạ)
2.7.3 Kiểm định giả thuyết cho tham số ø?
Giả sử từ thông tin ban dau cho biét o? = 02 Khi đó:
— Bude 1: Theo yéu cầu của bài toán ta có một trong 3 cặp giá thuyết sau: ad La? a? c2 _ x8 (ieee =6o, (eee =Ơn, th =G§ oe 2? oe 2°? eee 2 H, :0° >o, H, :0° <65 H,:0° #6) — Bước 2: Tiêu chuẩn kiểm định được chọn là (n9): (n~9)6 n-2)o (n-2)œ Oe ——===——;_—~X(n-3) G Ơn
— Bước 3: Với mức ý nghĩa œ, miền bác bỏ giả thuyết, ký hiệu là WQ, được biểu diễn đưới bảng sau:
Trang 31Loại giả thuyết ` Ho " Hi Wo
Bén phai ơ? =ơ? o >a, — XẺ:XẺ>JÖ(n-9)_
Bên trái ơ° =ơ? o <0 X):X)<X„(w—3) 2, ¬„2 2 Xˆ:X <XX„z(@n—3) Hai phía _ =a; o #05 hoặc „ X) >Xãa(m—3)
— Bước 4: Với các số liệu thu được từ mẫu, tính giá trị của tiêu chuẩn kiêm định, gọi là giá trị quan sát, ky hiệu la y?,
— Bước 5: So sánh xã, với miền bác bỏ Wa
+ Néu Xác eWq, kết luận: với mức ý nghĩa œ, VỚI số liệu đã cho chúng ta bác bỏ Hạ, thừa nhận Hì
+ Nếu Xá, ¢ Wa, két luận: với mức y nghia a, véi số liệu đã cho, ta chựa có cơ sở bác bỏ Họ để thừa nhận Hị (trên thực tế thừa nhận Hy)
2.8 KIỂM ĐỊNH VỀ TÍNH THÍCH HỢP CỦA HÀM HỒI QUY Xét mô hình hồi quy : Y¡ = B, + B;.X¡ + Uị
H,:B; =0
Giả sử khi thực hiện kiểm định cặp giả thuyết le “Bs g Sử dụng tiêu
H.:B;,#z
chuẩn kiểm định T, với số liệu thu được từ mẫu, chúng ta đi " kết luận
bác bỏ Hị, thừa nhận Họ Như vậy, mọi sự biến động của biến giải thích X
không ảnh hưởng một chút nào tới sự biến động của biến phụ thuộc Y Việc nghiên cứu mô hình trở nên vô nghĩa, nói cách khác, hàm hồi quy: là không thích hợp Khi đó dẫn đến bài toán kiểm định phi tham số với Hạ là giả thuyết hàm hồi quy không thích hợp, Hị là hàm hồi quy thích hợp
:Để kiểm định cặp giả thuyết này, tiêu chuẩn kiểm định được chọn là
tiêu chuẩn Fisher như sau: |
Vì Ơ,~N(,;Var(ơ,)) => U Soa ~N(0;1)
2
Trang 32¬T=Ê:—B: _ mm —2) = x‡ =U? =(Š =Ê2 ~ xe) SE@, ) Var(B,) ot Mat khac Y= _(n=2)6 y(n-2) => mm" ⁄n~9) -p,) cà => Fate yee —= B= *i ~ F(1;n-2) (2.14) i=l
Với mức ý nghĩa œ, miền bác bỏ giả thuyết là We= { F: F> f,(1; n— 2)} trong đó f,(1; n—2) 1a gia tri téi han Fisher mirc « dugc tim thay trong bang
gia tri F
Ý nghĩa của kiểm định F: Kiểm định F là một kiêm định mạnh dùng đề
kiểm định các giả thuyết phi tham số Trong trường hợp này, nó giúp ta kiểm tra tính thích hợp của hàm hồi quy nhằm trả lời cho câu hỏi hàm hồi
quy có phù hợp hay không Vì vậy, nó còn được dùng để kiểm định cặp giả A, : thuyét Khi đó tiêu chuẩn kiểm định F còn được tính theo công thức sau: r? x = tt ~ F(ajn - 2) 2,15) Ne -9) | 2.9 DỰ BAO
Một trong những nội dung chính của hồi quy là thực hiện công tác dự
báo Giả sử với mẫu rút ra từ tổng thê chúng ta thu được hàm hồi quy mẫu:
¥,=f6,+f,.X,° isin
Néu trong tuong lai X = Xo, ta cd Ÿ = B, + B,.Xp Đây mới chỉ là một
ước lượng điểm của biến phụ thuộc trong tương lai Vấn đề khi đó
B4 )va Tư sẽ nhận những giá trị như thế nào |
0 0
33
Trang 332.9.1 Dự báo cho giá trị trung bình cúa biến phụ thuộc
Với độ tín cậy I — œ, khoảng tin cậy cho BY, ) được xác định bởi 0 công thức sau: P(Ÿu -SE(Ÿo).t„(n—9)< HỒ )<Ÿ› +8B(Ÿ)+„ (n—9)) =1~ơ 0 | | (2.16) trong dé: t, (n—2); t,, (n —2) la cac giá trị tới hạn Student mức œ¡ và mức ơ;;
Chú ý: Thông thường với giá trị trung bình sẽ đòi hỏi tìm khoảng t tin
cậy đối xứng, tức là Oy =o2= a /2
-2.9.2 Dự báo cho giá trị cá biệt
Với độ tin cậy 1 — œ, khoảng tin cậy cho giá trị cá biệt Cx ) duge /X
xác định bởi công thức sau:
-_ P(Ÿu -SE(Y,).1„ (n—9)< % < Yo + SE(Y,).t, (n-2)) =1-0 0 (2.17) trong do: t, (n—2); t, (n-2) la cac giá trị tới hạn Student mức œ ¡ và mức œ;; _BE(Y,)= øll+— 1, Ko =X) n 2 »
Từ đó chúng ta có thể thu nhận được các giá trị lớn nhất, giá trị nhỏ nhất của biến phụ thuộc được dự báo trong tương lai hay khoảng đối xứng cho nó
Trang 34PRF
E(¥o/Xo)
2.10 Vi DU
Giả sử nghiên cứu mối quan hệ giữa mức tiền thưởng Y' (đơn vị: triệu
Trang 35Từ bộ số liệu trên, hãy trả lời các câu hỏi sau:
1 Viết hàm hồi quy tông thể, mô hình hồi quy tổng thẻ
2 Tính các hệ số Ô, , By |
3 Viết hàm hồi quy mẫu, mô hình hồi quy mẫu
4 Cho biết các hệ số hồi quy nhận được có phù hợp với lý thuyết và thực tiễn hay không?
5 Tính TSS, ESS, RSS Từ đó tính r và cho biết ý nghĩa của r?
-6 Tính SE(Ô, ), SE(Ô, )
7 Tìm khoảng tin cậy đối xứng cho B, , B, với độ tín cậy 95% 8 Với mức ý nghĩa 5%, có thể nói rằng hệ số B› thực sự khác 0? ˆ
9 Hàr:hỏi quy là phù hợp?
10 Thực hiện dự báo cho giá trị trung bình và giá trị cá biệt của mức
tiền thưởng khi người công nhân sản xuất được 1100 sản phẩm với độ tin
cậy 95% :
_ Giải: | |
1 Theo giả thiết, biến phụ thuộc là Y, biến độc lập là X Do đó :
PRF có dạng : E(Y/Xi) = By + B2.Xi i=],
Trang 364 Kết quả cho ta B, > 0 là phù hợp vì sản phẩm làm ra tăng thì mức
tiền thưởng trung bình sẽ tăng Giá trị B, = 0.0075673 phản ánh rằng nếu
người công nhân sản xuất tăng thêm 1 sản phẩm thì mức tiền thưởng trung bình sẽ tăng thêm x4p xi 7 ngàn 567 đồng
Từ hình 2.1 ta thấy rằng xu hướng của đồ thị đi lên, nhưng được xuất
phát từ 1 giá trị Xọ > 0 Điều này có thê được giải thích theo hướng đây là mức tiền thưởng cho người sản xuất, do đó để được thưởng, trước hết
người đó phải hoàn thành kế hoạch Vì vậy, B, < 0 là phù hợp Giá trị ñ, = -3.482339 cho biết mức sản phẩm kế hoạch trung bình mà người công
nhân phải thực hiện là xấp xỉ Xọ = 461 sản phẩm 5 TSS =30.7855; ESS = 23.3575; RSS= 7.428 ESS Từ đó ừ đó: r? =——— TSS = 0.7587 2
Ý nghĩa: r” = 0.75872 cho biết sự biến thiên giá trị của sản phẩm làm ra giải thích được 75.872% sự thay đổi mức tiền thưởng của người công nhân Còn 24.128% sự biến động mức tiền thưởng là do các nhân tố khác (số liệu
xác định nhờ bảng sau)
Trang 386 Trước hết ta có: 6 =.£— = 0.41267 n- ø=0⁄771317; SE(,)=-C—==0.001006 7 Khoảng tin cậy đối xứng cho ¡, Bạ Ta có công thức tổng quát là : B, ~ SE(B;).t,,(m —2) <B, <ñ, + SE(B,) ty(n—-2) G= 1,2) tooas(18) = 2.101, ta có : > —5.11548 < Bị <—1.849196 > 0.005454 < B2 < 0.009681 Hy : By =0
§ Ta kiêm định cặp giả thiết : H,: By 40
Tiêu chuẩn kiểm dinh T = B, -B, _" =— 2 Be T(18)
SE(Ô,) SE(B,)
Miền bác bỏ giả thiết: Wạ = {T:|T|>t,,.(18)} ma too25(18) = 2.101
tgs = 7.52339 —tq c W¿ bác bỏ Họ, thừa nhận H:
Kết luận: Với mức ý nghĩa 3%, với số liệu đã cho, có thể nói sự biến động của lượng sản phẩm sản xuất ra thực sự có ảnh hưởng đến mức tiền thưởng của công nhân ; , H,:r2=0 9 Kiểm định cặp giả thiết: J 0) H :r“ >0 oA Â_ 1Ä r?/1 Tiêu chuân kiêm định: F = q18 ~F(1,18) —T
Miền bác bỏ giả thiết: W¿ = {F:F>f,(1L18); fĐøœ(L18) = 441;
Í = 56.6014 — Íq; Wq bác bỏ Họ, thừa nhận Hì, ham hồi quy là phù hợp
Trang 39-10 Dự báo cho giá trị trung bình và giá trị cá biệt
Trước hết từ hàm hồi quy mẫu ta có: Ÿ) = 4.84165; SE(Ÿ, ) = 0.3546988; _ = 4.096432 < E(YwXo) <5.586876 - SE(Y)) = 0.7338104 — 3.2999184 < Yq„/Xọ < 6.3833898 Kết quả hồi quy thực hiện trên EVIEWS 5.1 như sau: Dependent Variable: Y Method: Least Squares Sample: | 20 Included observations: 20 Variable Coefficient Std Error t-Statistic Prob C _ =3.482339 0.777317 -4.479947 — 0.0003 X 0.007567 0.001006 7.523390 0.0000
R-squared 0.758718 Mean dependent var 2.265000
Adjusted R-squared 0.745313 S.D dependent var 1.272906
S.E of regression 0.642391 Akaike info criterion 2.047401 Sum squared resid 7.427998 Schwarz criterion 2.146974
Log likelihood —18.47401 F-statistic 56.60139
Durbin—Watson stat 0.771958 Prob(F-statistic) 0.000001
Giải thích một số thuật ngữ trong bản báo cáo của EVIEWS:
— Dependent Variable: Bién phu thuéc
— Method: Leas! Sạuares: Phương pháp ước lượng là bình phương bé nhất — Sample: 1 20: Mau gém cac gid tri quan sát từ 1 đến 20
— Included observations: 20: S6 quan sat dua vao hồi quy là 20
— Variable: Các biến hồi quy Lưu ý rằng trong EVIEWS, hệ số chặn
mặc định có ký hiệu là C, do đó khi đặt tên các biến khác không đặt trùng
là C nữa - :
Trang 40
— Coefficient: Giá trị các hệ số hồi quy ô
" —&fd Error: Sai số chuẩn của các hệ số hồi quy SE(Ô)
— t-Statistic: Giá trị của các tiêu chuẩn kiểm định T được xác định theo A cong thie t= mì Các giá trị nảy dùng để kiểm định cặp giả thiết H, :B=0 H, :B#0 — Prob ; Giá trị xác suất của các tiêu chuẩn kiểm định T được gọi là Hạ:B=0 H,:Bz0 1
p — value Khi kiém định cặp giả thiét miễn bác bỏ giá thiết W„
là miền bác bỏ hai phía Vì vay, néu p< œ =p/2 < œ/2 ta bác bỏ Hụ, thừa
nhận Hị, tức là chấp nhận B z 0 Nếu p> œ =p/2 > œ/2 ta chưa có cơ sở
bác bỏ Họ Với phương thức dựa trên giá trị của p — value, nếu p < œ, ta nói
rằng tham số đang nghiên cứu có ý nghĩa thống kê Trong trường hợp
ngược lại, ta nói rằng tham số đó không có ý nghĩa thống kê
-_ =-squared: Hệ số xác định bội RẺ
— Adjusted R-squared: Hé sé xac dinh da hiéu chinh R ~SE of regression: Sai sé chuan cua héi quy Ớ
— Sum squared resid: Téng binh phuong cdc phan du RSS — Mean dependent var: Trung binh céng cia bién phy thudc Y
—%Ð đependenr var: Độ lệch tiêu chuẩn của biến phụ thuôc được tính theo công thức: ~ F-statistic: Gia trị của thống kê F dùng để kiểm định cặp giá thiết H,:rˆ=0 bu ir’ >0
— Prob (F-statistic): Gia tri xác suất của thống kê F Trên cơ sở miễn bác bỏ của cặp giả thiết là miền bác bỏ bên phải do đó nếu p < œ, ta bác bỏ
Họ, thừa nhận Hì và ngược lại, nếu p> œ, chưa có cơ sở bác bỏ Hạ