1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Giáo trình kinh tế lượng

219 1 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 3

LỜI GIỚI THIỆU

Kinh tế lượng là thuật ngữ được hai nhà kinh tế học sử dụng lần đầu

tiên vao nam 1930 Do la Gido su A K Ragnar Frisch (1885 — 1973) và Jan Tinbergen (1903 — 1994) Hai 6ng 14 những nhà khoa học được nhận giải Nobel năm 1969 về kinh tế do những công trình nghiên cứu nỗi tiếng mà trong đó, những ứng dụng mạnh của kinh tế lượng đã đưa ra những mô

hình kinh tế đưới dạng định lượng Có thể nói, Kinh tế lượng là một bộ môn

khoa học vận dụng những thành tựu của toán học nhằm thiết lập các mô hình

kinh tế với mục đích ước lượng các tham số của mô hình dưới dạng định lượng để nêu bật mối quan hệ giữa các biến kinh tế trong các mô hình đó Đồng

thời sử dụng các kết quả để kiểm tra tính vững chắc của các giả thuyết trong mô hình và thực hiện dự báo cũng như mô phỏng biện tượng kinh tế

Từ những năm 1960, Kinh tế lượng đã được quy định giảng dạy ở một

số trường Đại học ở Việt Nam và đến năm 1982, Kinh tế lượng là môn học bắt buộc đối với sinh viên các trường Đại học Kinh tế Với yêu cầu cấp thiết cung cấp các kiến thức cơ bản của kinh tế lượng cho sinh viên khối

kinh tế, đã có nhiều giáo trình Kinh tế lượng, bài giảng Kinh tế lượng được biên soạn Dựa trên kinh nghiệm nhiều năm giảng dạy và hướng dẫn thực

hành, tác giả biên soạn cuốn giáo trình Kinh tế lượng nhằm đơn giản cách tiếp cận những vấn đề rất phức tạp của môn học Đồng thời trong giáo trình

cũng đưa ra các bước đầu tiên để người học có thể xây dựng được những mô hình kinh tế đơn giản dựa trên phần mềm EVIEWS

Tác giả xin chân thành cám ơn Thể Trịnh Huy Hồng, Th§ Phạm Tuấn Hòa, ThS Lê Văn Hùng và đặc biệt trân trọng cám ơn GS.TS Nguyễn

Khắc Minh đã cho những ý kiến quý báu trong quá trình hoàn thành bản

thảo giáo trình này |

Tác giả mong đón nhận được nhiều ý kiến đóng góp của đông đảo bạn đọc về nội dung, hình thức, các thuật ngữ để cuốn sách có nội dung hoàn

thiện hơn Mọi sự góp ý xin gửi về Bộ mơn Tốn, Học viện Ngân hàng, hoac Email: buiduyphu@yahoo.com

_ _ mm chân thành cảm ơn

TS Bùi Duy Phi”

Trang 4

- NHẬP MÔN KINH TẾ LƯỢNG

1 CÁC KHÁI NIỆM CƠ BẢN

Kinh tế lượng (Econometrics) là một mơn Tốn ứng dụng được ra đời từ cuối thế ký XIX, đầu thế kỷ XX Đó là môn khoa học để đo lường kinh

tế hay lượng hóa kinh tế Tuy nhiên ngày nay, kinh tế lượng không chỉ bó

hẹp trong lĩnh vực kinh tế mà nó còn được ứng dụng rộng rãi trong các lĩnh vực khác như kỹ thuật, văn hóa, xã hội

Trước hết có thể hiểu, Kinh tế lượng là lý thuyết kinh tế được sử dụng

bằng ngơn ngữ tốn học Đó là sự kết hợp của các học thuyết kinh tế, thống

kê kinh tế, thống kê tốn và mơ hình toán kinh tế

Kinh tế lượng nghiên cứu một hiện tượng kinh tế được đặt trong một

không gian và một khoảng thời gian nhất định Điều đó có nghĩa là, hiện

tượng nghiên cứu xảy ra trong lĩnh vực, một miền hay một vùng nào đó và có xuất phát điểm ban đầu và có điểm kết thúc

Kinh tế lượng là sự kết hợp các công cụ nghiên cứu về mặt lý thuyết và thực nghiệm để phân tích định lượng các mối quan hệ trong hiện tượng đang nghiên cứu

Kinh tế lượng có thê được xem là một môn khoa học vận dụng phương pháp suy đoán thích hợp để tìm ra các quy luật vận động giữa các nhân tố trong hiện tượng đang nghiên cứu Từ đó bằng các công cụ của nó sẽ thực

hiện công tác dự báo dựa trên nền tảng kết quả thu được 2 PHƯƠNG PHÁP LUẬN CỦA KINH TẾ LƯỢNG

Nghiên cứu một hiện tượng kinh tế được tiến hành theo các bước sau:

Bước 1: Nêu ra giả thuyết kinh tế Mỗi hiện tượng xây ra sẽ được soi

sáng bởi nền tảng một học thuyết kinh tế Trên cơ sở đó, người nghiên cứu

Trang 5

Bước 2: Thiết lập mô hình toán kinh tế Trong hiện tượng nghiên cứu, các nhân tố có quan hệ chặt chẽ với nhau Để phản ánh các mối quan hệ về mặt định lượng cần phải biểu thị dưới dạng toán học bằng mơ hình tốn kinh tế, trong đó các nhân tố được phân chia thành ba loại: biến ngoại sinh, biến nội sinh và các tham số kinh tế Mối quan hệ giữa các biến được phản ánh bởi các phương trình hay hệ các phương trình

Bước 3: Xây dựng mô hình kinh tế lượng tương ứng

Mơ hình tốn kinh tế đã phản ánh tương đối chặt chế quan hệ giữa các

biến kinh tế trong một hiện tượng nghiên cứu Tuy nhiên kinh tế lượng cho

rằng trên thực tế, ngoài những nhân tố đã biết, có thể còn có nhiều nhân tố khác không được nêu ra nhưng có ảnh hưởng tới các nhân tố trong mô hình

Vì vậy, đại diện cho các nhân tố này được biểu thị bởi một lượng ngẫu nhiên U¡ Chúng sẽ được gọi là sai số ngẫu nhiên, yếu tố ngẫu nhiên hay

nhiễu ngẫu nhiên SỐ

Buốc 4: Thu thập và xử lý số liệu

Kinh tế lượng nghiên cứu mối quan hệ giữa các biến số trong một không gian và một khoảng thời gian nhất định Sự biến động của các biến số được phản ánh qua số liệu của chúng Vì vậy khi xây dựng mô hình cần phải có các số liệu chính xác của các biến Tuy nhiên đây là một khó khăn thực tế mà bắt kỳ người nghiên cứu nào cũng gặp phải Bởi vậy, có số liệu đã khó, xử lý số liệu để phục vụ mục đích nghiên cứu còn là vấn đề khó khăn hơn đặt ra cho người nghiên cứu

Bước 5: Ước lượng các tham số của mô hình

Nhiệm vụ đầu tiên của kinh tế lượng là sau khi xây dựng mô hình và thu

thập được số liệu, người nghiên cứu sẽ sử dụng các công cụ của kinh tế lượng để ước lượng các tham số của mô hình để đưa ra mối quan hệ về lượng giữa các yếu tố trong mô hình Như vậy đòi hỏi người nghiên cứu phải có

những kiến thức nhất định vẻ lý thuyết kinh tế và mô hình toán kinh tế

Bước 6: Kiểm định các giả thuyết

Thực hiện các kiểm định giả thuyết sẽ cho biết bản chất các mối quan hệ về lượng trong mô hình Việc chấp nhận các giả thuyết cho phép khẳng định tính đúng đắn của các mối quan hệ cũng như việc chấp nhận mô hình

Trang 6

Bước 7- Dự báo

Nhiệm vụ quan trọng của xây dựng mô hình kinh tế lượng là sau khi có một mô hình tốt, sử dụng mô hình đó để thực hiện các dự báo, làm cơ sở cho các hoạch định chính sách trong tương lai

Bước 8: Sử dụng mơ hình để kiểm sốt hoặc đẻ ra các chính sách Từ mô hình tốt và các dự báo, người nghiên cứu sẽ đưa ra các biện pháp, các chính sách để kiểm soát các nhân tố của mô hình phục vụ mục đích trong tương lai Những biện pháp này có thể là những biện pháp mang tính chất định tính và cả những biện pháp có tính định lượng

3 VÍ DỤ

Hãy nghiên cứu mối quan hệ giữa thu nhập và tiêu dùng bằng việc xây dựng mô hình kinh tế lượng

Bước 1: Nêu ra giả thuyết kinh tế

Mối quan hệ giữa thu nhập và tiêu dùng là một trong những mối quan hệ cơ bản được nhiều lý thuyết kinh tế đề cập tới Ở đây chúng ta dựa trên giả thuyết cơ bản của Keynes: “Tâm lý cơ bản là một người sẽ tăng tiêu dùng khi thu nhập của người đó tăng, song không thể nhiều hơn mức tăng của thu nhập”

Từ giả thuyết trên ta có thể rút ra 2 ý sau:

— Thu nhập tăng kéo theo sự gia tăng của tiêu dùng

— Tốc độ tăng của tiêu dùng không thể lớn hơn tốc độ tăng của thu nhập

Điều đó có nghĩa là 0 < MPC < l

Bước 2: Xây dựng mơ hình tốn kinh tế

Ta gọi X là mức thu nhập, Y là mức tiêu dùng Như vậy, X sẽ là biến

ngoại sinh, Y là biến nội sinh Để lượng hóa mối quan hệ giữa hai biến này, ta

Trang 7

Hình 1.1

Hàm tiêu đùng đơn giản của Keynes có ưu điểm là, trong mọi trường hợp, thu nhập tăng đều cho biết tiêu dùng tăng Tuy nhiên, nó có nhược điểm sau:

— Giả định Y phụ thuộc vào X dưới dạng hàm số là quá cứng nhắc Nếu

ta chấp nhận nó có nghĩa là với mỗi giá trị của X sẽ cho một giá tri cha Y _ Tuy nhiên trên thực tế, mỗi giá trị của X có thể xảy ra các giá trị của Y một

cách ngẫu nhiên

— Với hàm tiêu dùng của Keynes, ta chưa biết được chính xác B, va B, là bao nhiêu, ở đây chỉ có thông tin duy nhất là 0<, <1

- Bước 3: Xây dựng mô hình kinh tế lượng tương ứng

Kinh tế lượng giả định rằng, tiêu dùng phụ thuộc vào thu nhập ở dạng tương quan chứ không phải ở dạng hàm số nên mô hình kinh tế lượng có đạng:

Y, =B¡ +B,X, + Uj

trong đó: U¡ là sai số ngẫu nhiên (yếu tố ngẫu nhiên, nhiễu) phản ánh

sự tiêu dùng cá biệt Từ đó hàm tiêu dùng sẽ được biểu diễn dưới dạng: E(VY/X) = Bị + B„X,

Trang 8

Bước 4: Thu thập số liệu

Xét ví dụ sau: Nghiên cứu mỗi quan hệ giữa tiêu dùng gộp Y phụ thuộc vào thu nhập gộp X của nước Mỹ từ năm 1980 — 1991 tính theo giá năm 1987 (đơn vị: tỷ USD) Năm ` x Nam Y xX 1980 2447.1 3776.3 1986 2969.1 4404.5 1981 2476.9 ` 3843.1 1987 - 3052.2 4539.9 1982 2503.7 3760.3 1988 3162.4 4718.6 1983 261 9.4 3906.6 1989 3223.3 4838.0 1984 2746.1 4148.5 1990 3260.4 4877.5 1985 2865.8 4279.8 1991 3240.8 4821.0

Bước 5: Ước lượng các tham số của mô hình

Sử dụng phương pháp ước lượng của kinh tế lượng ta thu được các ước lượng điểm cho các tham số với các giá trị sau

^ a

B, =—231.8; Bạ =0.7194 _ Khi đó hàm tiêu dùng ước lượng có đạng:

Yi =-231,8+0.7194X,

trong do: Ÿ: là ước lượng điểm của E(Y/X )

Với kết quả nhận được chúng ta có thể xây dựng khoảng tin cậy cho

các tham số với độ tin cậy l—œ cũng như khoảng tin cậy cho E(Y/⁄X)) Bước 6: Kiểm định các giả thuyết liên quan

Trong một mô hình đòi hỏi phải thực hiện nhiều kiểm định giả thuyết

Chẳng hạn, xuất phát từ giả thiết 0 <B, <1 chúng ta có bài toán kiểm định

cặp giả thiết:

th :B¿ <1

H,:B, >1

Còn nhiều kiểm định khác được đặt ra tương ứng với mỗi mô hình cụ

Trang 9

Bước 7: Thực hiện dự báo

Giả sử rằng, dự kiến đến năm 1994, thu nhập gộp của nước Mỹ là 6000

tỷ USD Câu hỏi đặt ra là mức tiêu dùng trung bình sẽ là bao nhiêu, tức là đưa ra một ước lượng điểm cúa tiêu dùng Thay vào hàm thu được:

Yioos =—231.8 + 0.7194x6000 = 4084.6

Từ kết quả này, nền kinh tế phải thực hiện các chính sách hỗ trợ như sản xuất bao nhiêu, xuất nhập khâu bao nhiêu, đầu tư như thế nào để đạt

mục (tiêu đó :

Bước 8: Sử dụng mô hình để kiểm soát hoặc đề ra các chính sách

Chẳng hạn, Chính phủ Mỹ tin rằng với mức tiêu dùng là 4000 tỷ USD thì sẽ duy trì được tỷ lệ thất nghiệp là 6.5% Vậy mức thu nhập phải đạt

được là:

4000 = —231.8 + 0.7194K => XK ~5882 ty USD

Từ đó, Chính phủ phải có những chính sách vĩ mô như thế nào để đạt mức thu nhập đó

Tóm lại, kinh tế lượng là phương pháp tiếp cận định lượng để nghiên

cứu một hiện tượng xảy ra trong đời sống kinh tế và xã hội Nó sẽ cho ta một cách nhìn dưới dạng định lượng của các quan hệ trong một mô hình thực nghiệm Bởi vậy ngày nay nó còn được sử dụng rộng rãi trong các ngành kỹ thuật và trong các ngành xã hội khác

Trang 10

Cương 4 |

MO HiNH HOI QUY HAI BIEN —

CAC TU TUGNG CO BAN

1.1 PHAN TICH HOI QUY

1.1.1 Khái niệm cơ bản

Khái niệm hồi quy được F Galton đưa ra vào năm 1886 khi ông nghiên cứu mối quan hệ giữa chiều cao của các ông bố ảnh hưởng thế nào đến chiều cao của những người con

Phân tích hồi quy là nghiên cứu sự phụ thuộc của một hay nhiều biến

được gọi là biến phụ thuộc (biến được giải thích, biến nội sinh) vào một hay

nhiều biến khác được gọi là biến độc lập (biến giải thích, biến ngoại sinh) — Nếu trong mô hình chỉ có một biến độc lập và một biến phụ thuộc, ta gọi là mô hình hồi quy đơn

Ví dụ 1.1: Nghiên cứu mối quan hệ giữa chiều cao của các người con phụ thuộc vào chiều cao của các ông bố

Gọi X là chiều cao của người bố, Y là chiều cao của người con Khi đó, X là biến độc lập (ngoại sinh), Y là biến phụ thuộc Rõ ràng mối quan hệ

này không thể biểu diễn dưới dạng:

Y=P,+B,X

bởi lẽ mỗi ông bố chỉ có một chiều cao duy nhất, nhưng các con của người đó sẽ có chiều cao khác nhau Do đó việc nghiên cứu này phải được đưa ra dưới dạng:

Y, =B, + B,X, + Uj

Đây là mô hình hồi quy đơn được đặt ra dé nghién cứu mối quan hệ giữa hai biến

— Nếu mô hình có một hay nhiều biến phụ thuộc và nhiều biến độc lập, ta gọi là mô hình hồi quy bội

Trang 11

Vi du I.2: Nghiên cứu mối quan hệ giữa nhụ cầu thị trường về một loại hàng hóa

Gọi Y là nhu cầu thị trường về loại hàng hóa đang nghiên cứu, khi đó

các nhân tố có ảnh hưởng đến Y sẽ là: _

©_ X¿ giá của chính loại hàng hóa nghiên cứu

e X: giá bình quân của các loại hàng hóa thay thé ° X¿ thu nhập bình quân của thị trường

® Xs thị hiếu của thị trường

e© X; cơ cấu gia đình e_ X; tôn giáo gia đình

Khi đó mô hình hổi quy bội có dạng:

Y, =Pịạ +B;.X¿¡ +Bạ.X¿; +B¿.X¿; +B;-ÿ¡ + s.ẤX¿; +B¿.Xz¡ + Ú,

_ Trong mô hình này, U; đại điện cho những nhân tố có ảnh hưởng tới nhu

câu loại hàng hóa nghiên cứu nhưng ta không đưa vào Đông thời nhận thây

trong mô hình, các biến Xa, Xạ, Xạ là các biến định lượng, còn các bién Xs,

X¿, X; là các biên định tính Nói cách khác, kinh tê lượng sẽ nghiên cứu được mô hình mà trong đó có các biến định lượng và cả các biến định tính

1.1.2 Nội dung phân tích hồi quy

Ba nội dung chính của phân tích hồi quy là:

e© Ước lượng các tham số của mô hình Từ đó ước lượng giá trị trung

bình của biến phụ thuộc khi cho trước giá trị của biến giải thích e©_ Kiểm định giả thuyết về bản chất của sự phụ thuộc

e Dv bao giá trị trung bình và giá trị cá biệt của biến phụ thuộc khi đã biết giá-trị các biến độc lập trong tương lai

1.1.3 Số liệu cho phân tích hồi quy

Trong quá trình phân tích hồi quy, các số liệu bao gồm 3 loại:

— Số liệu theo thời gian: đây là loại số liệu được thu thập định kỳ tại các

thời điểm khác nhau trong một khoảng thời gian cho một đối tượng cụ thể

Trang 12

theo tháng, theo quý, theo năm Ví dụ số liệu về chỉ số giá tiêu dùng theo tháng của Việt Nam từ tháng 1 năm 2000 đến tháng 6 năm 2011, đó là số liệu theo tháng Việc điều tra số liệu theo tần số nào tùy thuộc vào mục đích

- của người nghiên cứu -

— Số liệu chéo: là số liệu điều tra cho nhiều đối tượng khác nhau tại

cùng một thời điểm Chẳng hạn, số liệu các yếu tố ảnh hưởng đến mức lợi

nhuận của một công ty trong năm 2011 Khi đó người nghiên cứu phải thu

thập số liệu các yếu tô như giá đầu vào, khối lượng đầu vào, các loại chỉ phí,

giá đầu ra, doanh thu, chi phí nhân công, đóng góp xã hội

— Số liệu hỗn hợp: là loại số liệu điều tra cho nhiều đối tượng định kỳ

trong một khoảng thời gian nào đó Đây là loại số liệu được sử dụng rất nhiều trong nghiên cứu

Cần lưu ý rằng, trong quá trình thu thập số liệu phải khai báo đúng và nhất quán loại số liệu Đồng thời cũng phải nhận thức được rằng các số liệu điều tra thường có độ tin cậy thấp do các nguyên nhân sau:

— Các số liệu kinh tế thường phi thực nghiệm (tức là không loại trừ

được các nhân tố ngoại lai)

— Các số liệu điều tra thường sai lệch do sự trùng lặp, bỏ sót hay thông tin kém chính xác

— Do quy mô điều tra rộng nên việc chọn mẫu khác nhau có thê thu

nhận được các kết quả khác nhau

~ Các số liệu kinh tế thường ở mức tổng hợp, do đó khó khăn trong phân tích chỉ tiết

Như vậy trong xây dựng mô hình, khó khăn lớn nhất mà người nghiên cứu gặp phải đó là vẫn đề về thu thập và xử y các số liệu phục vụ quá trình hồi quy

1.2 HÀM HỒI QUY TỔNG THỂ

1.2.1 Các khái niệm cơ bán

Để đưa ra khái niệm cơ bản của hàm hồi quy tổng thể, chúng ta giả sử

có một biến ngẫu nhiên hai chiều rời rạc (X,Y) với bảng phân phối xác suất như sau:

Trang 13

Y = x yr Y2 wey; Ym P(X)

Xị P@y) PŒ@y¿) PRY) P(Xi.Ym) p(x)

s |P&sy) p@y) POY) POY) p(x)

Kj p(xnys) P(%Y2) p(X,yj) PŒiYm) p(xi)

Xụ pXuyi) PXaY2) PŒXay) —- P(Xuym) p(%n)

P(Y) p(y) py2) pỚ/) Pm) - I Các tính chất của bảng phân phối xác suất: Tính chất l : Tính chất 2 : Tính chất 3 : 0<p(x,,y,) <1 > p(x; ,y;) = p(x;) 1=1,n jel > p(x;,,y;) = P(y;) i=l ¡j=1Lm 53 pŒ,,y;)=1 i=l jel

Từ bảng phân phối xác suất đồng thời, chúng ta có hai bảng phân phối

xác suất của các thành phần biên như sau

- Bảng phân phối xác suất của biến ngẫu nhiên X có dạng : x XY} X Kj eae Xy P(X) p(x) pŒ) p(X) - p@Œ) — Bảng phân phối xác suất của biến ngẫu nhiên Ÿ có dạng : © Y Vị Y2 Yj vee Ym

P(Y) Pp) POs POD Pm)

- Từ các bảng phân phối xác suất trên, chúng ta thu được các tham số cơ

bản sau :

Trang 14

* EX) = Dx) Var(X) = E(X-E(X))? = 3 x’p(x,) — BOO)? = 4 Var(X) * EY) =>) y;p(y;) Var(Y) = E(Y-E(Y)y = > y*p(y;) — (EC) = vVar(Y)

Khi 46 có hai tham số quan trọng phản anh mối quan hệ giữa hai biến ngẫu nhiên X và Y như sau :

— Hệ số hiệp phương sai il (Covariance cofficient) được xác định bởi công thức sau : n m Cov(X, Y) = E(X-E(X))(Y-E(Y)) = 2 » x¡y,p(,,y,)—~ EOOE(Y) I je Hệ số Cov(X,Y) có các tính chất sau: Tỉnh chất 1: Cov(X,Y) = Cov(Y,X)

Tinh chat 2 : Cov(X + Y,Z) = Cov(X,Z) + Cov(Y,Z) Tinh chat 3: Cov(a X,Y) = Cov(X, a Y) = a Cov(X,Y)

Tinh chat 4 : Var(X+Y) = Var(X) + Var(Y) + 2.Cov(X,Y)

Var(X—Y) = Var(X) + Var(Y) — 2.Cov(X,Y)

Ket quả trên cho thấy, Cov(X,X) = Var(X) Đồng thời trong trường hợp

hai biên ngầu nhiên X và Y độc lập, Cov(X,Y) = 0, trường hợp ngược lại,

X và Y la hai biến không độc lập Nói cách khác, hệ số này có thể được sử

dụng đê xem xét tính độc lập của hai biên ngầu nhiên Tuy nhiên, nhược điểm của hệ số này là đơn vị đo của nó được tính theo tích đơn vị đo của hai biên ngau nhién nên khó khăn trong việc sử dụng đê đo mức độ quan hệ giữa các biên ngẫu nhiên Từ đó người ta sử dụng hệ sô sau:

Cov(X,Y)

— Hệ số tương quan được tính theo công thire: p,, =

Ơ,.Ơy

Trang 15

Hệ số này có các tính chất :

Tinh chat 1: -1< p„ <1 và không có đơn vị đo

Tỉnh chất 2 : p„„ =0 © Cov(%X,Y) =0 điều này phản ánh X và Y là hai

biến ngẫu nhiên độc lập

Tỉnh chất 3 : Nếu Є =—l (p„ =1), X và Y là hai biến ngẫu nhiên có

quan hệ dạng hàm số nghịch biến (đồng biến)

Tỉnh chất 4: Nễu -1< p„ <0, X và Y là hai biến ngẫu nhiên có tương quan ngược chiều (tương quan âm) với nhau

: Néu 0< p„ <1, X và Y là hai biến ngẫu nhiên có tương

.quan thuận chiều (tương quan đương) với nhau

Đây là một hệ số quan trọng trong quá trình nghiên cứu của kinh tế lượng Bởi lẽ trên thực tế việc hai biến ngẫu nhiên độc lập hay có quan hệ dạng hàm số là rất hiếm xảy ra, phần lớn chúng sẽ có quan hệ dạng tương quan

ca : x: As A A

- 1/2.2 Hàm hồi quy tông thê

Khi nghiên cứu biến ngẫu nhiên nhiều chiêu, chúng ta còn quan tâm tới _ khái niệm phân phối xác suât có điêu kiện và kỳ vọng toán của nó Chang hạn, khi cho biến ngẫu nhiên X nhận giá trị Xị, ta có bảng phân phôi xác suât có điều kiện sau : Y/(X = Xj) | yr Y2 wee yj - Ym P(Y/X=X) | PO) pWz/x) PO/X) PWwX) " _ Đ¡,Vj) - trong đó: p(yj/xi) = ———— V (x) 1]

Từ đó kỳ vọng toán có điều kiện thu được:

E(Y/X=X) = Dy, Py; Ix ) Vi=l,n

Với mỗi giá trị cua X, chúng ta thu nhận được duy nhất một giá trị xác định của kỳ vọng toán có điều kiện của Y Do X thay đổi giá trị, các giá trị kỳ vọng toán này cũng thay đổi Từ đó ta có một mối quan hệ hàm

số và hàm số này được gọi là hàm hồi quy tổng thể, ký hiệu là PRF

Trang 16

(Population Regression Function) Như vậy về bản chất, hàm hồi quy tông thể là kỳ vọng toán có điều kiện Nó phản ánh sự biến thiên của giá trị trung bình theo xác suất của biến phụ thuộc khi biến độc lập thay đổi

Để đơn giản, giả sử rằng hàm này có dạng tuyến tính như sau

E(Y/X=X) =f@X)= B,+B,X, Vi=ln

- Việc chúng ta giả định dạng hàm là tuyến tính nhằm đơn giản việc phân tích ban đầu Bởi lẽ dạng hàm tuyến tính trong hồi quy hai biến chỉ chứa đựng hai tham số B,, B„ Chúng được gọi là các tham số hổi quy Khi đó

| — B, được gọi là hệ số chặn Nó cho biết khi X nhận giá trị bằng 0 thì

giá trị trung bình của Y là Bị :

— B; được gọi là hệ số góc Nó cho biết khi X tang 1 don vị thì giá trị

trung bình của Y thay đổi bao nhiêu đơn VỊ

Ý nghĩa chung của PRF: Ham héi quy tổng thể phan í ánh xu _ hướng

trung bình của sự phụ thuộc của biến Y vào biếnX ` ˆ sẽ

1.2.3 Mô hình hồi quy tổng thể (PRM)

Ở trên chúng ta có hàm hồi quy tông thể phản ánh sự biến thiên của giá

trị trung bình của biến phụ thuộc Tuy nhiên với mỗi giá trị của biến độc lập có thể xảy ra các giá trị của biến phụ thuộc một cách ngẫu nhiên và chúng sai lệch so với các giá trị trung bình một lượng ngẫu nhiên Khi đó, „ mô hình hồi quy tổng thể PRM (Population Regression Model) có dang:

= B, +B,X, +U; _Vi=ln

Sự tồn tại của các sai số ngẫu nhiên Uj trong PRM có thể được giải

thích bởi các nguyên nhân sau: chu

— Sự mập mờ về lý thuyết: trong một t hiện tượng nghiên curu, cd thê có rất nhiều nhân tố ảnh hưởng đến biến phụ thuộc mà người nghiên cứu không thê biết hết được Khi đó U; đại diện cho các nhân tố có tác động đến

mô hình nhưng không được đưa vào

— Theo nguyên tắc tiết kiệm trong xây dựng mô hình, các nhân tố có

ảnh hưởng yếu đến biến phụ thuộc có thể được loại bỏ ra U; sẽ là biến đại

diện cho chúng

17

Trang 17

— Do sự sai lệch trong quá trình thu thập và xử lý số liệu Việc điều tra, thu nhận số liệu gốc chuẩn xác là rất khó khăn Do rất nhiều điều kiện khách quan và chủ quan, số liệu thu thập được, qua quá trình xử lý

sẽ có những sai lệch nhất định Từ đó gây ra những sai lệch nhất định

trong quá trình hồi quy U; sẽ là nơi chứa đựng những sai lệch đó

— Do chỉ định sai mô hình Mối quan hệ giữa biến độc lập với biến phụ thuộc trên thực tế là phức tạp và không biết rõ Việc giả định mô tả dưới dạng hàm nào đó, chẳng hạn dạng tuyến tính có thê chưa phản ánh chính xác bản chất mối quan hệ đó Khi đó sẽ gây ra sự chênh lệch giữa tính toán

.so với thực tiễn và U¡ phản ánh chênh lệch đó -

_ Như vậy các sai số ngẫu nhiên U¡ tồn tại trong PRM như là một tất yếu

Chúng đại diện cho những yếu tố ngẫu nhiên nên tự chúng lại là các biến ngẫu nhiên và có các quy luật phân phối xác suất nào đó Chính sự tổn tại thành phan ngẫu nhiên này đã giúp chúng ta phân biệt ranh giới giữa mơ

hình tốn kinh tế và mô hình kinh tế lượng |

_ 1.3 M0 HINH HOI QUY MẪU VÀ HÀM HỒI QUY MẪU

1.3.1 Hàm hồi quy mẫu SRF (Sample Regression Function)

Trong một tổng thể, các tham số B,, B, la các tham số hoàn toàn xác

định nhưng chúng ta không biết được Đề ước lượng chúng, từ tông thể xây dựng một mẫu ngẫu nhiên hai chiều với kích thước n như sau:

W =(Œ, Y¡), (Xa, Y¿), :., CXn, Yn))

Khi đó hàm hồi quy được xây dựng đựa trên mẫu rút ra từ tổng thể

được gọi là hàm hổi quy mẫu (SRF) Nó có dạng như sau:

Ÿ =ñ, + BX, i=1n

_ trong đó: Ÿ: là ước lượng điểm của E(Y/X));

B,, B; là ước lượng điểm của B,, B,

Trang 18

| | SRF { Un PRE

U, ‘ | U2 `

1.3.2 Mô hình hồi quy mẫu SRM (Sample Regression Model)

Việc xác định được các hệ số B,, 8, giúp ta xác định được các giá trị

ước lượng điểm của kỳ vọng toán của Y trên mẫu Các giá trị này so với các giá trị Y trên mẫu sẽ có sự sai lệch được gọi là các phần dư e¡ Từ đó

mô hình hồi quy mẫu (SRM) có dạng |

Yi=B,+B,.Xite = i=in

Sự tồn tại các phần dư trong SRM có thê được giải thích bởi sự tồn tại thành phần U; trong PRM Nói cách khác, các phần dư e;¡ như là hình ảnh của các thành phần U; trên mẫu

TÓM TẮT CHƯƠNG

Những tư tưởng cơ bản của bài toán hồi quy và ba nội dung cơ bản của

hồi quy: ước lượng các tham số, kiểm định các giả thiết thống kê và thực hiện đự báo đã được trình bày trong phần đầu của chương 1 Từ đó người đọc có thé thay được sự khác biệt giữa một mô hình kinh tế toán với một

mô hình kinh tế lượng bởi sự tổn tại các sai số ngẫu nhiên trong các mô hình kinh tế lượng Chính sự tồn tại của các nhân tế này, việc nghiên cứu sâu về chúng đã là một trong những nhân tố thúc đây sự phát triển mạnh mẽ

của môn Kinh tế lượng

Trang 19

Cfươns 2

HÀM HỒI QUY HAI BIẾN

2.1 PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT CÁC PHẦN DƯ -

OLS (Ordinary Least Squares) 2.1.1 Nội đung cúa phương pháp `

Trong chương trước, từ tổng thể của biến ngẫu nhiên hai chiều, chúng ta rút ra một mẫu ngẫu nhiên hai chiều và từ đó đi xây dựng hàm hổi quy mẫu và mô hình hồi quy mẫu Vẫn đề đặt ra là, các hệ số B, › 8, được tính như thế nào để đại điện tốt nhất cho B,, Be ? Phuong phap binh phuong bé nhất các phần dư sẽ giải quyết vấn đề này

_ Nội dung cơ bản của phương pháp này là di tìm các ước lượng điểm B, ; B, sao cho tổng bình phương các sai lệch giữa SRF va SRM là be nhat, điều này có nghĩa là:

xở S04, ~Y;) = Sey,- fi B,.X,)? > min

Khi có một mẫu xác định, các giá trị Xị, Y¡ đã biết, Như vậy đòi hỏi trên

chính là việc đi tìm cực tiểu của một hàm với hai biến độc lập B,, B;

Áp dụng điều kiện cực trị của hàm hai biến chúng ta sẽ thu được các kết t qua sau:

7 Goi: X-_ŸX, yeldy la các giá trị trung bình cộng "` Tea ong Ps bộ wee của X “

và Y có

_ Đặt xị xi = Xj - X, yi= - Y; - Y la su sai ¡lệch giữa các giá: trị thu nhận được so với giá trị trung bình của các chuỗi số liệu

Từ đó chúng ta có công thức xác định các ƯỚC lượng điểm cho các - tham số hồi quy như sau:

Trang 20

ze wo

hee m—— " «BY BX (2.1)

V6i (2.1), ching ta sẽ xây dựng được hàm hổi quy mẫu và mô hình hdi quy mẫu cho vẫn đề cần nghiên cứu Hơn nữa, từ (2.1) chúng ta còn có những nhận xét sau:

_ Với mỗi mẫu cụ thể, các giá tri B,, B, được xác định một cách duy: nhất

— Vì mẫu là ngẫu nhiên nên mỗi sự thay đổi của mẫu sẽ kéo theo sự

thay đổi các giá trị của Ô,, 8, Mà những sự thay đổi của mẫu mang tinh ngẫu nhiên nên các ước lượng điểm ÿ,, B, lại là các biến ngẫu nhiên và

chúng sẽ có những quy luật phân phối xác suất nhất định sẽ được xét đến ở phần sau

2.1.2 Các tính chất của SRF

Ti inh chat 1: SRF di qua diém trung bình của mẫu (X, Y )

Tỉnh chất 2: Y= Ÿ?, Trung bình của các giá trị thực tế của mẫu bằng

trung bình các giá trị ước lượng

Tinh chat 3: — e, =0, tức là trung bình các phần dư phải triệt tiêu

i=l ` /

Tinh chất 4: Các giá trị của biến giải thích không tương quan với các phần dư, nghĩa là cov(Xi, ej) = 0

Tỉnh chất 5: Các giá trị ước lượng của biến phụ thuộc không tương

quan với các phần dư, nghĩa là cov( Ÿ,e) =0

2.2 CÁC GIÁ THIẾT CỦA PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT

._ Việc thực hiện hồi quy dé tìm ra các hệ số hồi quy có rất nhiều phương _ pháp Phương pháp bình phương bé nhất là một phương pháp đơn giản Nó -đã đưa ra các công thức đơn giản để xác định ổ, > ñ› Tuy nhiên, để áp

dụng phương pháp này, trong mô hình phải chấp nhận các giả thiết sau:

Trang 21

Giả thiết 1: Mô hình là tuyến tính đỗi với các tham số mà không nhất thiết tuyến tính đối với các biến số Điều đó có nghĩa là, sự có mặt của các

tham số trong mô hỉnh chỉ ở đưới dạng bậc nhất Còn các biến số có thể

không ở dạng tuyến tính Trong những trường hợp đó phải thực hiện đổi biến số để các biến tham gia trong mô hình có dạng tuyến tính Khi đó chúng ta mới có mô hình hồi quy tuyến tính

Giả thiết 2: Các biến giải thích phải là phi ngẫu nhiên (hoàn toàn là các

giá trị xác định) Đồng thời trên mỗi mẫu, giá trị của các biến giải thích phải khác nhau, càng khác nhau nhiều càng tốt

Với giả thiết này, khi thực hiện lấy mẫu, giá trị của các biến giải thích phải lấy khác nhau Còn giá trị của biến phụ thuộc có thê bằng nhau Điều này thể hiện tính ngẫu nhiên của biến phụ thuộc khi chịu tác động của các

biến giải thích

Giả thiết 3: Kỳ vọng toán của các sai số ngẫu nhiên U; bằng 0, tức là: E(U/X) = 0; Vi

Chúng ta đã coi các sai số ngẫu nhiên là các biến ngẫu nhiên Giả thiết này cho phép chúng ta coi chúng có cùng kỷ vọng toán và giá trị đó triệt

tiêu Trung tâm phân phối của các U; là 0 |

Giả thiết 4: Phương sai các sai số ngẫu nhiên là không thay đổi (đồng đẻu)

`, Var(U/Xi)=@'”; Vi

Giả thiết này cùng với giả thiết 3 khẳng định các sai số ngẫu nhiên có cùng kỳ vọng toán và cùng phương sai Sự biễn động của các giá trị cá biệt

so với các giá trị trung bình là có sự tương đồng Đây là một giả thiết khá chặt để nghiên cứu mô hình (Trong trường hợp giá thiết này bị phá vỡ,

chúng ta sẽ đề cập tới trong nội dung của chương 6)

Giả thiết 5: Các sai số ngẫu nhiên không có quan hệ tuyến tính với

nhau, nghĩa là:

_— Với các số liệu chéo: cov(U/, Uj) =0; VI#j

— Với các số liệu theo thời gian: cov(U;, Urn) = 0; Vk #0

- Việc giả thiết không có quan hệ tuyến tính giữa các sai số ngẫu nhiên _ khẳng định tính độc lập của chúng Nói cách khác, sự biến động của các giá

trị biến phụ thuộc ở thời điểm ¡ không chịu ảnh hưởng ở các thời điểm khác - Tuy nhiên trên thực tế, điều này có thể xảy ra và chúng ta sẽ nghiên cứu

trong chương 7

Trang 22

Giả thiết 6: Các biến giải thích Xị không có quan hệ tuyến tính với các sai số ngẫu nhiên U¡, nghĩa là:

Cov(X;, U; )= 0; VI

Giả thiết này cho thấy sự biến động các giá trị cá biệt của biến phụ

thuộc không phụ thuộc vào giá trị của biến giải thích

Giả thiết 7: Kích thước mẫu khi thu thập n mẫu phải đủ lớn, ít nhất phải

lớn hơn các tham số hồi quy trong mô hình và càng lớn cảng tốt

Giả thiết 8: Mô hình phải được chỉ định đúng

Khi xây dựng hàm hỏi quy tổng thê chúng ta đã giả định rằng nó có

dạng tuyến tính Việc giả định cho phép dễ dàng hơn trong phân tích Tuy

nhiên trên thực tế có thể dạng mô hình không như chúng ta chỉ định và khi

đó ta nói rằng mô hình cðỉ định sai Chương 8 sẽ tập trung nghiên cứu vẫn đề về chỉ định dạng hàm

Giả thiết 9: Trong các mô hình hồi quy bội, không có hiện tương đa cộng tuyến giữa các biến giải thích

Việc giả thiết trong mô hình có nhiều biến giải thích, các biến này không có quan hệ tuyến tính với nhau nhằm chỉ xem xét ảnh hưởng trực tiếp của các biến này đến biến phụ thuộc một cách đơn giản nhất Tuy nhiên, giữa các biến này còn có thể có quan hệ với nhau và có các ảnh hưởng gián tiếp đến biến phụ thuộc Vấn đề này sẽ được đề cập đến ở chương 5

2.3 ĐỘ CHÍNH XÁC CỦA CÁC ƯỚC LƯỢNG

Về bản chất, các ước lượng ñ,„ ñ, là các biến ngẫu nhiên nên độ chính

xác của chúng được đo bởi phương sai và hiệp phương sai giữa chúng

Người ta cing minh được rằng khi đó:

Var(B, )= =! =o; —— Var(B,)=

2 2

ny) Xi i=l » i=l (2.2)

trong do o” la phuong sai cac sai sé ngau nhién ma ching ta dua ra trong gia thiét 4

Từ đó độ lệch tiêu chuẩn của chúng là:

Trang 23

Tuy nhiên vì ơ? chưa biết, nên nó được thay thế bởi ước lượng điểm

của nó theo công thức sau: -

(2.3)

(2.4)

Các kết quả (2.4) rất quan trọng vì từ một mẫu cụ thể, chúng ta xác định được các thông số cơ bản là tiền đề để thực hiện các ước lượng cho

các tham số hồi quy cũng như các kiểm định giả thiết liên quan

Trang 24

Nếu X < 0 = cov( B, › B,) > 0, B,, B, có mối quan hệ thuận chiều

theo nghĩa nếu 8, là ước lượng thiếu (thừa) của B, thì 8, cũng là ước lượng

thiếu (thừa) của B; Điều đó cho thấy đường SRF không cắt đường PRF - Nếu X> 0 = cov( ñ, › B,) < 0, ñ,, ; B, cé quan hệ ngược chiều theo

nghĩa nếu Š, là ước lượng thiếu của B, thi B„ là ước lượng thừa của B, và

ngược lại Khi đó đường SRF luôn cắt đường PRE

2.4 HỆ SỐ XÁC ĐỊNH r2

Để đánh giá mức độ ảnh hưởng của biến giải thích tác động đến biến

phụ thuộc, chúng ta xây dựng một hệ số từ sự biến thiên của các giá trị biển phụ thuộc

Xuất phát từ mẫu ngẫu nhiên với kích thước n rút ra từ tổng thể, ta có mô hình hồi quy mẫu

Yi= 8, +đ,.Xi+ei= f2 +ep i=in >Yi-¥=f-Fre; | i=in = ÿWi=2, te (i=ln)= yŸ=Ÿ teÖ+2.y,e(1=ln) = Syt=N9, +e t2.5 5,6; a As “ “ | (2.6) Theo tính chất 5 của SRF, thành phần thứ 3 trong (2.6) triệt tiêu Do đó: Sy = ý + e? a a a | (2.7) Goi: TSS = Sy? (Total Sum of Squares) tong binh phuong cdc giá trị của isl biến phụ thuộc CC SỐ ESS = yy; Gixplained Sum of Squares) tổng bình phương các giá trị i=l

ước lượng của biến phụ thuộc

RSS= ye? (Residuals Sum of Squares) tong bình phương các phan du

i=1 ni ng

Trang 25

Từ đó có hệ thức:

TSS = ESS + RSS (2.8)

Hệ thức cho thấy sự biến thiên các giá trị của biến phụ thuộc được phân

chia thành hai bộ phận:

— Bộ phận thứ nhất (ESS) là sự biến thiên của biến phụ thuộc được giải

thích bởi sự biến thiên của biến giải thích có mặt trong mô hình

— Bộ phận thứ hai (RSS) 1a sự biến thiên của biến phụ thuộc do những nhân tố vắng mặt trong mô hình gây ra

Việc xây dựng một mô hình hồi quy nhằm xem xét một cách tốt nhất - ảnh hưởng của biến ngoại sinh tác động tới biến phụ thuộc Điều đó có

TT (2.9)

1ˆ được gọi là hệ số xác định

Ý nghĩa:

— Hệ số xác định rˆ dùng để đo mức độ thích hợp của hàm hồi quy Nó cho biết sự biến thiên của biến giải thích có mặt trong mô hình giải thích được bao nhiều phần trăm sự biến thiên của biến phụ thuộc

— r được gọi là hệ số tương quan Nó phản ánh mối quan hệ giữa hai

biến X và Y Dấu của r được xác định bởi mối tương quan ngược chiều hay thuận chiều giữa X và Y

Chú ý: r? còn được tính theo công thức sau: n no n n 3 ESs » a2 2X ad 2x /(n=1) Ag S? T S8” n = By =B; Rn =Ba (2.10) Sự vị 3v /(n-Ð y i=1 i i=l i 2 ữ _

Trong đó: S2, Số là phương sai mẫu của X và Y

2.5 PHÂN PHỐI XÁC SUẤT CỦA CÁC ƯỚC LƯỢNG HỒI QUY

Giả thiết 10: Với mỗi mẫu cụ thê chúng ta thu được các giá trị cụ thể của các giá trị ước lượng Tuy nhiên vì mẫu là ngẫu nhiên nên chúng lại là các biến ngẫu nhiên và có các quy luật phân phối nhất định Do đó theo phương

Trang 26

pháp bình phương nhỏ nhất chúng được chấp nhận theo giả thiết sau: Các

sai số ngẫu nhiên U¡ phân phối chuẩn độc lập Nghĩa là: e =U, ~ NID(0;0’); Vi B, ~ N(B,; Var(8,)) B, ~ N(B,; Var(B,)) Yi ~ N(B, +B, Xi; 0”); Wi a2 - (n-2)ơ ?o`t 2” ~x*(n—9)

Việc chấp nhận các giả thiết này sẽ tạo cơ sở để chúng ta xây dựng các

biến ngẫu nhiên phục vụ quá trình ước lượng cũng như kiểm định các giả

thiết cho các hệ số hồi quy

2.6 KHOẢNG TIN CẬY CHO HỆ SỐ HỒI QUY

Trong mô hình hồi quy đơn chúng ta đang nghiên cứu có ba tham số cần ước lượng là B,, B,„ và ơø? Việc ước lượng các tham số được tiến hành

theo hai hướng là ước lượng điểm và ước lượng bằng khoảng tin cậy Trong phân trên chúng ta đã thực hiện ước lượng điểm cho chúng Trong phần này chúng ta tiến hành ước lượng bằng các khoảng tin cậy

2.6.1 Khoảng tin cậy cho ÿ,

"VI ~NŒ;Varô)) =U= SD ~N@;1) 1 = poi SEQ@,) _ Tín -9) Khi đó với dé tin cay 1-a , khoang tin cdy cho B, dugc xac định theo công thức sau: P(B, ~ SE(,).t,, (n—2) < B, <8, +SE@,).t„(n-2))=1—œ (2.11)

Trong đỏ: a, +a, =a; con t, (n-2), t,,(n-2) la cdc gid trị tới hạn

của biến ngẫu nhiên T voi mirc xdc sudt a,,a, Tir dé cd cac loai

khoang tin cay sau:

Trang 27

~ Khoảng tin cậy bên trái: khi œ, = œ, œ, =0 ta CÓ: -

0 <B, <f, +SE(B,).t,(n-2)

kết quả này được sử dụng khi đòi hỏi tìm giá trị lớn nhat cia 8,

— Khoảng tin cậy bén phai: khi a, = a, a, =0 taco:

B, — SE(B,).t,(n-2) < B, <te

kết quả này được sử dụng khi đòi hỏi tìm giá trị nhỏ nhất của B,

— Khoảng tin cậy đối xứng: khi œ, = œ„= % ta co:

B, — SE(B,) t.y(n—2) < B, < B, + SE(B, ).t,,(n —2) _ 2 2.6.2 Khoảng tin cậy cho ÿ,

2 Any ở _ Ba ~By one

Vì B; ~ NŒ,; Var(;)) iB B,; Var , | => spa) ~ N(0;1) > T= By - B, ~ By ~T(n- 2) SE(,) Khi đó với độ tin cay 1- o ; Khoảng tin cậy cho By được xác định theo công thức sau: P(B, — SE(B,).t, ,(m~ 2) <B, <B, +SE(B,).t,, (n- —- (2.12) Từ đó có các loại khoảng tin cậy sau:

— Khoảng tin cậy bên trái: khi œ, = œ, œ, =0 ta có:

—œ < B, < 8, + SE( ỗ,).1„(n~3)

kết quả này được sử dụng khi đòi hỏi tìm giá trị lớn nhất của B,

— Khoảng tỉ tin cậy bên phải: khi œ;= a, a,=0 ta có:

| — SE(B,).t,(n - 2) < B, < +00

kết quả này được sử dụng khi đòi hỏi tìm giá trị nhỏ nhất của ÿ,

~ Khoảng tin cậy đối xứng: khi Oy = y= % ta CÓ:

B; — SE(B,).t,/(w—3) < B„ < B, + SE(ð,).£,.(m—9) th : <a

Trang 28

2.6.3 Khoảng tin cậy cho tham số ơ?

(n= 2/6

Theo giả thiết 10 ta có: yŸ = ~X {n -2), vì vậy với độ tin cậy

l—a, khoang tin cậy cho ơ? có dạng: ^9 b(Ú= Qo cote (n ~2)6 Xa, (2-2) Xia, (1m - 2) Từ đó ta có các loại khoảng tin cậy sau: J=l-a (2.13) a2 ¬2

— Khoảng tin cậy bén trai, a, = Ú; œ = œ: 0 < ơ< "=2 | Xi-u(w— 3) nó cho biết giá trị lớn nhất của ơề

a2

¬ a ~2

— Khoang tin cay bén phai,a, = a; a, = 0: ma < oa” < +0;

xu(n~3)

nó cho biết giá trị nhỏ nhất của ơ? Kho

— Khoảng tin cậy dạng œ,=ơ; = œ/2, vi đỗ thị hàm mật độ của biến ngẫu

nhiên ø? không có tính đối xứng nên trong trường hợp này chúng ta co:

(n-9)6 <g°< (n— bì ng

Xe (n — 2) Xa, (n — 2) -

2.7 KIẾM ĐỊNH GIẢ THUYẾT CHO CÁC THAM SỐ

Trong lý thuyết xác suất và thống kê toán học ta đã biết kiểm định giả thuyết thống kê bao gồm hai loại: kiểm định giả thuyết tham số và kiểm

định giả thuyết phi tham SỐ Trong phần này chúng ta thực hiện kiêm định

tham số cho các hệ số hồi quy theo trình tự các bước sau:

2.7.1 Kiểm định giả thuyết cho tham số ÿ,

Giả sử từ thông tín ban đầu cho biết 6, = } Khi đó:

— Bước I: Theo yêu cầu của bài toán tá có một trong 3 cặp giả thuyết sau

Hy :B, =B;, H, :B, =B; , A, : 8B, =B;

H,:8,>8;° H, :B, <B, H, :B, 4B,

Trang 29

— Bước 2: Tiêu chuẩn kiểm định được chọn là _ñ- B-B, * Bi Pr ° B,-B: ~'T(n—9)

"8W, SEW,)

— Bước 3: Với mức ý nghĩa œ, miền bác bỏ giả thuyết Họ, ký hiệu là

W„, được biểu diễn dưới bảng sau: Loại giả thuyết ` Họ Hy Wa Bén phai B, = By ~ B, > B T: T > tu(n-2) Bên trái B, = Bị B, <B; T: T<-t/n-2) Hai phía B, = Bị Bạ # T: |T| > tua(n-2)

— Bước 4: Với các số liệu thu được từ mẫu, tính giá trị của tiêu chuẩn kiểm định, gọi là giá trị quan sát, ký hiệu là tạ

— Bước 5: So sánh tạ với miền bác bỏ W„ mà thực chất là so sánh với

-_ các giá tri tới hạn tu(n-2)

+ Nếu tụ cW,, kết luận: với mức ý nghĩa œ, với số liệu đã cho chúng ta bác bỏ Hạ, thừa nhận H)

+ Nếu tgs ¢ Wa, két luận: với mức ý nghĩa œ, với số liệu đã cho, ta

chưa có cơ sở bác bỏ Họ để thừa nhận H; (trên thực tế là thừa nhận Hụ) 2.7.2 Kiểm định giá thuyết cho tham số B,

Gia sử từ thông tin ban đầu cho biết B, = B; Khi đó:

Trang 30

— Bước 3: Với mức ý nghĩa œ, miền bác bỏ giả thuyết Họ, ký hiệu là W,

được biểu diễn dưới bảng sau: Loại giả thuyết Ho Hị | Wa Bén phai 8, = B; B > By | T: T > tuín-2) Bén trai B, = B B < By T: T <—to(n-2) Hai phia B, = B, B, * By T: a > to/a(n-2)

— Bước 4: Với các số liệu thu được từ mẫu, tính giá trị của tiêu chuẩn

kiểm định, gọi là giá trị quan sát, ký hiệu là tụ |

oo Bước 5: So sánh t„ với miền bác bỏ Wa

+ Néu tgs € Was kết luận: với mức ý nghĩa a, với số liệu đã cho

chúng ta bác bỏ Họ, thừa nhận H¡

+ Nếu tgs € Wa, kết luận: với mức ý nghĩa œ, với số liệu đã cho, ta

chưa có cơ sở bác bỏ Họ dé thừa nhận H; (trên thực tế thừa nhận Hạ)

2.7.3 Kiểm định giả thuyết cho tham số ø?

Giả sử từ thông tin ban dau cho biét o? = 02 Khi đó:

— Bude 1: Theo yéu cầu của bài toán ta có một trong 3 cặp giá thuyết sau: ad La? a? c2 _ x8 (ieee =6o, (eee =Ơn, th =G§ oe 2? oe 2°? eee 2 H, :0° >o, H, :0° <65 H,:0° #6) — Bước 2: Tiêu chuẩn kiểm định được chọn là (n9): (n~9)6 n-2)o (n-2)œ Oe ——===——;_—~X(n-3) G Ơn

— Bước 3: Với mức ý nghĩa œ, miền bác bỏ giả thuyết, ký hiệu là WQ, được biểu diễn đưới bảng sau:

Trang 31

Loại giả thuyết ` Ho " Hi Wo

Bén phai ơ? =ơ? o >a, — XẺ:XẺ>JÖ(n-9)_

Bên trái ơ° =ơ? o <0 X):X)<X„(w—3) 2, ¬„2 2 Xˆ:X <XX„z(@n—3) Hai phía _ =a; o #05 hoặc „ X) >Xãa(m—3)

— Bước 4: Với các số liệu thu được từ mẫu, tính giá trị của tiêu chuẩn kiêm định, gọi là giá trị quan sát, ky hiệu la y?,

— Bước 5: So sánh xã, với miền bác bỏ Wa

+ Néu Xác eWq, kết luận: với mức ý nghĩa œ, VỚI số liệu đã cho chúng ta bác bỏ Hạ, thừa nhận Hì

+ Nếu Xá, ¢ Wa, két luận: với mức y nghia a, véi số liệu đã cho, ta chựa có cơ sở bác bỏ Họ để thừa nhận Hị (trên thực tế thừa nhận Hy)

2.8 KIỂM ĐỊNH VỀ TÍNH THÍCH HỢP CỦA HÀM HỒI QUY Xét mô hình hồi quy : Y¡ = B, + B;.X¡ + Uị

H,:B; =0

Giả sử khi thực hiện kiểm định cặp giả thuyết le “Bs g Sử dụng tiêu

H.:B;,#z

chuẩn kiểm định T, với số liệu thu được từ mẫu, chúng ta đi " kết luận

bác bỏ Hị, thừa nhận Họ Như vậy, mọi sự biến động của biến giải thích X

không ảnh hưởng một chút nào tới sự biến động của biến phụ thuộc Y Việc nghiên cứu mô hình trở nên vô nghĩa, nói cách khác, hàm hồi quy: là không thích hợp Khi đó dẫn đến bài toán kiểm định phi tham số với Hạ là giả thuyết hàm hồi quy không thích hợp, Hị là hàm hồi quy thích hợp

:Để kiểm định cặp giả thuyết này, tiêu chuẩn kiểm định được chọn là

tiêu chuẩn Fisher như sau: |

Vì Ơ,~N(,;Var(ơ,)) => U Soa ~N(0;1)

2

Trang 32

¬T=Ê:—B: _ mm —2) = x‡ =U? =(Š =Ê2 ~ xe) SE@, ) Var(B,) ot Mat khac Y= _(n=2)6 y(n-2) => mm" ⁄n~9) -p,) cà => Fate yee —= B= *i ~ F(1;n-2) (2.14) i=l

Với mức ý nghĩa œ, miền bác bỏ giả thuyết là We= { F: F> f,(1; n— 2)} trong đó f,(1; n—2) 1a gia tri téi han Fisher mirc « dugc tim thay trong bang

gia tri F

Ý nghĩa của kiểm định F: Kiểm định F là một kiêm định mạnh dùng đề

kiểm định các giả thuyết phi tham số Trong trường hợp này, nó giúp ta kiểm tra tính thích hợp của hàm hồi quy nhằm trả lời cho câu hỏi hàm hồi

quy có phù hợp hay không Vì vậy, nó còn được dùng để kiểm định cặp giả A, : thuyét Khi đó tiêu chuẩn kiểm định F còn được tính theo công thức sau: r? x = tt ~ F(ajn - 2) 2,15) Ne -9) | 2.9 DỰ BAO

Một trong những nội dung chính của hồi quy là thực hiện công tác dự

báo Giả sử với mẫu rút ra từ tổng thê chúng ta thu được hàm hồi quy mẫu:

¥,=f6,+f,.X,° isin

Néu trong tuong lai X = Xo, ta cd Ÿ = B, + B,.Xp Đây mới chỉ là một

ước lượng điểm của biến phụ thuộc trong tương lai Vấn đề khi đó

B4 )va Tư sẽ nhận những giá trị như thế nào |

0 0

33

Trang 33

2.9.1 Dự báo cho giá trị trung bình cúa biến phụ thuộc

Với độ tín cậy I — œ, khoảng tin cậy cho BY, ) được xác định bởi 0 công thức sau: P(Ÿu -SE(Ÿo).t„(n—9)< HỒ )<Ÿ› +8B(Ÿ)+„ (n—9)) =1~ơ 0 | | (2.16) trong dé: t, (n—2); t,, (n —2) la cac giá trị tới hạn Student mức œ¡ và mức ơ;;

Chú ý: Thông thường với giá trị trung bình sẽ đòi hỏi tìm khoảng t tin

cậy đối xứng, tức là Oy =o2= a /2

-2.9.2 Dự báo cho giá trị cá biệt

Với độ tin cậy 1 — œ, khoảng tin cậy cho giá trị cá biệt Cx ) duge /X

xác định bởi công thức sau:

-_ P(Ÿu -SE(Y,).1„ (n—9)< % < Yo + SE(Y,).t, (n-2)) =1-0 0 (2.17) trong do: t, (n—2); t, (n-2) la cac giá trị tới hạn Student mức œ ¡ và mức œ;; _BE(Y,)= øll+— 1, Ko =X) n 2 »

Từ đó chúng ta có thể thu nhận được các giá trị lớn nhất, giá trị nhỏ nhất của biến phụ thuộc được dự báo trong tương lai hay khoảng đối xứng cho nó

Trang 34

PRF

E(¥o/Xo)

2.10 Vi DU

Giả sử nghiên cứu mối quan hệ giữa mức tiền thưởng Y' (đơn vị: triệu

Trang 35

Từ bộ số liệu trên, hãy trả lời các câu hỏi sau:

1 Viết hàm hồi quy tông thể, mô hình hồi quy tổng thẻ

2 Tính các hệ số Ô, , By |

3 Viết hàm hồi quy mẫu, mô hình hồi quy mẫu

4 Cho biết các hệ số hồi quy nhận được có phù hợp với lý thuyết và thực tiễn hay không?

5 Tính TSS, ESS, RSS Từ đó tính r và cho biết ý nghĩa của r?

-6 Tính SE(Ô, ), SE(Ô, )

7 Tìm khoảng tin cậy đối xứng cho B, , B, với độ tín cậy 95% 8 Với mức ý nghĩa 5%, có thể nói rằng hệ số B› thực sự khác 0? ˆ

9 Hàr:hỏi quy là phù hợp?

10 Thực hiện dự báo cho giá trị trung bình và giá trị cá biệt của mức

tiền thưởng khi người công nhân sản xuất được 1100 sản phẩm với độ tin

cậy 95% :

_ Giải: | |

1 Theo giả thiết, biến phụ thuộc là Y, biến độc lập là X Do đó :

PRF có dạng : E(Y/Xi) = By + B2.Xi i=],

Trang 36

4 Kết quả cho ta B, > 0 là phù hợp vì sản phẩm làm ra tăng thì mức

tiền thưởng trung bình sẽ tăng Giá trị B, = 0.0075673 phản ánh rằng nếu

người công nhân sản xuất tăng thêm 1 sản phẩm thì mức tiền thưởng trung bình sẽ tăng thêm x4p xi 7 ngàn 567 đồng

Từ hình 2.1 ta thấy rằng xu hướng của đồ thị đi lên, nhưng được xuất

phát từ 1 giá trị Xọ > 0 Điều này có thê được giải thích theo hướng đây là mức tiền thưởng cho người sản xuất, do đó để được thưởng, trước hết

người đó phải hoàn thành kế hoạch Vì vậy, B, < 0 là phù hợp Giá trị ñ, = -3.482339 cho biết mức sản phẩm kế hoạch trung bình mà người công

nhân phải thực hiện là xấp xỉ Xọ = 461 sản phẩm 5 TSS =30.7855; ESS = 23.3575; RSS= 7.428 ESS Từ đó ừ đó: r? =——— TSS = 0.7587 2

Ý nghĩa: r” = 0.75872 cho biết sự biến thiên giá trị của sản phẩm làm ra giải thích được 75.872% sự thay đổi mức tiền thưởng của người công nhân Còn 24.128% sự biến động mức tiền thưởng là do các nhân tố khác (số liệu

xác định nhờ bảng sau)

Trang 38

6 Trước hết ta có: 6 =.£— = 0.41267 n- ø=0⁄771317; SE(,)=-C—==0.001006 7 Khoảng tin cậy đối xứng cho ¡, Bạ Ta có công thức tổng quát là : B, ~ SE(B;).t,,(m —2) <B, <ñ, + SE(B,) ty(n—-2) G= 1,2) tooas(18) = 2.101, ta có : > —5.11548 < Bị <—1.849196 > 0.005454 < B2 < 0.009681 Hy : By =0

§ Ta kiêm định cặp giả thiết : H,: By 40

Tiêu chuẩn kiểm dinh T = B, -B, _" =— 2 Be T(18)

SE(Ô,) SE(B,)

Miền bác bỏ giả thiết: Wạ = {T:|T|>t,,.(18)} ma too25(18) = 2.101

tgs = 7.52339 —tq c W¿ bác bỏ Họ, thừa nhận H:

Kết luận: Với mức ý nghĩa 3%, với số liệu đã cho, có thể nói sự biến động của lượng sản phẩm sản xuất ra thực sự có ảnh hưởng đến mức tiền thưởng của công nhân ; , H,:r2=0 9 Kiểm định cặp giả thiết: J 0) H :r“ >0 oA Â_ 1Ä r?/1 Tiêu chuân kiêm định: F = q18 ~F(1,18) —T

Miền bác bỏ giả thiết: W¿ = {F:F>f,(1L18); fĐøœ(L18) = 441;

Í = 56.6014 — Íq; Wq bác bỏ Họ, thừa nhận Hì, ham hồi quy là phù hợp

Trang 39

-10 Dự báo cho giá trị trung bình và giá trị cá biệt

Trước hết từ hàm hồi quy mẫu ta có: Ÿ) = 4.84165; SE(Ÿ, ) = 0.3546988; _ = 4.096432 < E(YwXo) <5.586876 - SE(Y)) = 0.7338104 — 3.2999184 < Yq„/Xọ < 6.3833898 Kết quả hồi quy thực hiện trên EVIEWS 5.1 như sau: Dependent Variable: Y Method: Least Squares Sample: | 20 Included observations: 20 Variable Coefficient Std Error t-Statistic Prob C _ =3.482339 0.777317 -4.479947 — 0.0003 X 0.007567 0.001006 7.523390 0.0000

R-squared 0.758718 Mean dependent var 2.265000

Adjusted R-squared 0.745313 S.D dependent var 1.272906

S.E of regression 0.642391 Akaike info criterion 2.047401 Sum squared resid 7.427998 Schwarz criterion 2.146974

Log likelihood —18.47401 F-statistic 56.60139

Durbin—Watson stat 0.771958 Prob(F-statistic) 0.000001

Giải thích một số thuật ngữ trong bản báo cáo của EVIEWS:

— Dependent Variable: Bién phu thuéc

— Method: Leas! Sạuares: Phương pháp ước lượng là bình phương bé nhất — Sample: 1 20: Mau gém cac gid tri quan sát từ 1 đến 20

— Included observations: 20: S6 quan sat dua vao hồi quy là 20

— Variable: Các biến hồi quy Lưu ý rằng trong EVIEWS, hệ số chặn

mặc định có ký hiệu là C, do đó khi đặt tên các biến khác không đặt trùng

là C nữa - :

Trang 40

— Coefficient: Giá trị các hệ số hồi quy ô

" —&fd Error: Sai số chuẩn của các hệ số hồi quy SE(Ô)

— t-Statistic: Giá trị của các tiêu chuẩn kiểm định T được xác định theo A cong thie t= mì Các giá trị nảy dùng để kiểm định cặp giả thiết H, :B=0 H, :B#0 — Prob ; Giá trị xác suất của các tiêu chuẩn kiểm định T được gọi là Hạ:B=0 H,:Bz0 1

p — value Khi kiém định cặp giả thiét miễn bác bỏ giá thiết W„

là miền bác bỏ hai phía Vì vay, néu p< œ =p/2 < œ/2 ta bác bỏ Hụ, thừa

nhận Hị, tức là chấp nhận B z 0 Nếu p> œ =p/2 > œ/2 ta chưa có cơ sở

bác bỏ Họ Với phương thức dựa trên giá trị của p — value, nếu p < œ, ta nói

rằng tham số đang nghiên cứu có ý nghĩa thống kê Trong trường hợp

ngược lại, ta nói rằng tham số đó không có ý nghĩa thống kê

-_ =-squared: Hệ số xác định bội RẺ

— Adjusted R-squared: Hé sé xac dinh da hiéu chinh R ~SE of regression: Sai sé chuan cua héi quy Ớ

— Sum squared resid: Téng binh phuong cdc phan du RSS — Mean dependent var: Trung binh céng cia bién phy thudc Y

—%Ð đependenr var: Độ lệch tiêu chuẩn của biến phụ thuôc được tính theo công thức: ~ F-statistic: Gia trị của thống kê F dùng để kiểm định cặp giá thiết H,:rˆ=0 bu ir’ >0

— Prob (F-statistic): Gia tri xác suất của thống kê F Trên cơ sở miễn bác bỏ của cặp giả thiết là miền bác bỏ bên phải do đó nếu p < œ, ta bác bỏ

Họ, thừa nhận Hì và ngược lại, nếu p> œ, chưa có cơ sở bác bỏ Hạ

Ngày đăng: 08/11/2022, 23:02

w