1.1 Lời mở đầu
Để đánh giá chất lượng cuộc sống của các hộ gia đình, các Bộ, Ban, Nghành thường tiến hành các cuộc điều tra khảo sát mức sống dân cư, phân
tích thực trạng thu nhập và chỉ tiêu của các hộ gia đình thơng qua các đề tài nghiên cứu Là một học viên nghành Toán chuyên nghành Xác suất và
thống kê, được sự gợi ý và giúp đỡ của các thầy cô, tác giả đã thực hiện đề tài
“Ứng dụng lý thuyết thống kê vào mơ hình kinh tế lượng trong phân tích mức sống cúa các hộ gia đình Việt Nam”
Tác giả xin chân thành cảm ơn PGS-TS Nguyễn Văn Quảng - giảng
viên, chủ nhiệm bộ môn XSTK khoa Toán, khoa sau Đại học, trường Đại học Vinh; TS Hồ Đăng Phúc - Viện Toán Học Việt Nam; đặc biệt là TS Nguyễn
Thị Minh - Chủ nhiệm bộ mơn Tốn kinh tế, khoa Toán kinh tế, trường Đại
học Kinh Tế Quốc Dân Hà Nội đã tận tình giúp đỡ hướng dẫn và chỉ bảo để bài Luận văn được hoàn thành
Toàn bộ nội dung của luận văn gồm 3 chương: Chương 1 Tổng quan về luận văn
Chương 2 Cơ sở lý thuyết Toán học
Chương 3 Ứng dụng phần mềm SPSS và STATA để phân tích đánh giá các
yếu tố ảnh hưởng đến thu nhập và chỉ tiêu của các hộ gia đình Việt Nam
Trong quá trình nghiên cứu mặc dù có nhiều cố gắng song cũng không thể tránh khỏi những thiếu sót Rất mong nhận được những ý kiến đóng góp từ
phía những người quan tâm đến bài Luận văn để bài Luận văn được hoàn
Trang 2nâng cao đời sống cho người dân Ngoài ra tác giả cũng muốn kết quả của Luận Văn sẽ gợi ý cho các doanh nghiệp tập trung sản xuất một số mặt hàng, khai thác các thị trường tiềm năng
1.2 Đối tượng nghiên cứu
Đối tượng nghiên cứu của Luận văn là hộ gia đình và một số chỉ tiêu
kinh tế xã hội của hộ gia đình Việt nam Luận văn sử dụng bộ số liệu điều tra
mức sống dân cư hộ gia đình Việt Nam năm 2006 (VHLSS 2006), là bộ số liệu mới nhất hiện có VHLSS thực hiện bởi Tổng cục Thống kê với sự hỗ trợ kỹ thuật của Ngân hàng Thế giới và các tổ chức quốc tế Mẫu điều tra gồm
hơn 9000 hộ và rất nhiều chỉ tiêu, các đặc điểm liên quan đến hộ gia đình
1.3 Mục đích nghiên cứu
Luận văn hướng tới 4 mục đích:
- Trình bày một cách tổng quát về thực trạng mức sống hộ gia đình Việt Nam, chủ yếu dựa vào thu nhập, chi tiêu; ngồi ra cịn đề cập đến giáo dục, y tế, lao động, việc làm theo các tiêu chí khác nhau dựa vào đặc điểm cộng đồng như khu vực thành thị/nông thôn, theo vùng hoặc theo đặc điểm của hộ gia đình như nghề nghiệp, trình độ học vấn, nhóm chỉ tiêu
- Phân tích các yếu tố ảnh hưởng đến thu nhập của hộ gia đình Việt Nam như
giáo dục, lao động, việc làm, khác biệt vùng địa lý
- Phân tích các đặc điểm hộ, các khác biệt vùng ảnh hưởng như thế nào đến
hành vi chỉ tiêu của hộ gia đình
- Nêu lên cơ sở Toán học (lý thuyết về hôi qui trong thống kê) trong ứng dụng
Trang 31 Ước lượng các tham số của hàm hồi quy
2 Kiểm định giả thiết về giá trị của các tham số đó
3 Đánh giá các sai số ước lượng và kiểm tra tính phù hợp hay đúng đắn của hàm hồi quy
4 Dự báo (hay dự đoán) các giá trị của Y theo X,,X, X, 1.4 Phương pháp nghiên cứu
1 Sử dụng phương pháp thống kê mô tả và phân tích tổng hợp để đưa ra cái
nhìn tổng quát về mức sống dân cư các hộ gia đình Việt Nam năm 2006 Phần này thực hiện các bước sau:
Bước 1: Xác định số liệu thu nhập và chỉ tiêu bình quân đầu người/tháng của
mỗi hộ gia đình (ở đây luân văn chỉ điều chỉnh sự khác biệt của các vùng chứ
không điều chỉnh về giá tiêu dùng) Số liệu được lấy từ kết quả điều tra năm
2006 (VHLSS2006)
Bước 2: Sử dụng phương pháp phân tích tổng hợp và thống kê mơ tả để phân tích trên cơ sở các khía cạnh: thu nhập, chỉ tiêu, y tế, giáo dục, nghành nghẻ,
vùng, miễn, khu vực
Bước 3: Lựa chọn các đặc điểm hộ (số người, tuổi, giới tính chủ hộ, nghành nghề chủ hộ )
2 Sử dụng mơ hình hồi quy phân tích tác động của một số yếu tố chính đến thu nhập và chi tiêu của các hộ gia đình
Các phần mềm SPSS và STATA được dùng trong xử lý và phân tích số liệu 1.5 Ý nghĩa của vấn đề nghiên cứu
Trang 4về thu nhập và chỉ tiêu của các hộ gia đình Kết quả nghiên cứu cũng hy vọng
đưa ra các khuyến nghị về mặt chính sách trong việc giải quyết vấn đề về
nghèo đói và bất bình đẳng trong thu nhập ớ Việt Nam
- Có thể sử dụng làm tài liệu tham khảo cho sinh viên trong việc áp dung
Trang 5PHAN TICH HOI QUY
Trong thực tế, nhiều khi cần dự báo giá trị của một biến số hoặc đánh giá tác động của sự thay đổi trong giá trị của một (hay một số) biến số lên một
biến số khác thông qua một công thức nào đó Nói cách khác, chúng ta phải nghiên cứu trực tiếp nhiều chỉ tiêu khác nhau đối với một đối tượng nghiên cứu Các chỉ tiêu này có thể là định lượng (tức là các biến ngẫu nhiên) hay định tính (được gọi là các dấu hiệu nhân tổ ) Các chỉ tiêu này được xác định cụ thể trên đối tượng quan sát (phân biệt đối tượng nghiên cứu và đối tượng quan sát) và được “đo lường” (thu thập thông tỉn) trực tiếp trên các đơn vị quan sát Đó là các phần tử thuộc tập hợp đối tượng quan sát mà ta sẽ trực tiếp thu nhận thông tin từ đó Ví dụ, đối tượng quan sát là cán bộ CNV trong một
công ty chẳng hạn, theo đơn vị quan sát là các công nhân; cán bộ lãnh đạo
Công ty đó Tùy theo vấn đề cần nghiên cứu, phân tích mà các chỉ tiêu có thể
là: tuổi, thời gian làm việc, năng suất lao động (chỉ tiêu định lượng) hay
giới tính, tay nghề, loại hình nghề nghiệp, trình độ văn hóa (chỉ tiêu định tính)
Như vậy để giải quyết vấn đề cụ thể người ta phải nghiên cứu, phân tích
nhiều chỉ tiêu (cũng gọi là chỉ tiêu thống kê) đó là các biến ngẫu nhiên (chỉ tiêu định lượng), các nhân tố, dấu hiệu (chỉ tiêu định tính) Một phương pháp hữu hiệu giúp chúng ta có thể làm rõ bản chất của hiện tượng hay sự việc cần nghiên cứu để tìm ra quy luật, dự đoán được xu thế biến động của hiện tượng, sự việc đó trong tương lai, đó là
phương pháp phân tích hồi quy Cụ thể chúng ta sẽ đề cập đến những vấn đề
Trang 6chúng tổn tại 2)
2 Mỗi phụ thuộc đó thuộc loại nào? Trong thống kê người ta phân biệt hai loại phụ thuộc sau:
+ Định nghĩa 1: /z¡ biến ngẫu nhiên X và Y được gọi là phụ thuộc hàm nếu ton tại ham f sao cho Y = f(X)
+ Dinh nghia 2: Hai bién ngdu nhién X, Y được gọi là có phụ thuộc thống kê nếu với moi giá trị của X ta đều có thể xác định được quy luật phân phối xác
suất có điều kiện của Y đối với X là:
F4) = P(Y < y/X = x)
3 Xác định biểu thức của hàm mô tả mối phụ thuộc nói trên giữa các biến ngẫu nhiên
Ta có tập hợp các điểm (X,,E(Y/X,)) trên hệ tọa độ Oxy lập thành một hàm
có dạng:
E(Y/X,)= ÑX,) gọi là hàm hỏi quy tổng thể (PRF) Trong khuôn khổ của bài luận văn này tác giả chỉ đề cập dén ham f(x,) 1a hàm tuyến tính đối với tham số (ngoài ra cũng có dạng phi tuyến nhưng có thể tuyến tính hóa được) Giả sử rằng: PRF E(Y/X,) là hàm tuyến tính dạng:
E(Y/X,) =B, +B„X,, + + B,X «i» hay viet dưới dạng ngầu nhiên
Y, = B, + BX), + + BX + Uy
Trong đó, 6, với i=1,k là tham số và U¡ là các sai số ngẫu nhiên độc lập với nhau và tuân theo quy luật phân phối N(0,ø° ) Tuy nhiên trong thực tế việc xác định hay xây dựng PRF là rất khó, vì vậy chỉ có cách xây dựng ham
Trang 7Trong khuôn khổ của bài luận văn này tác giả xin đưa ra phân tích vấn đề 3, và cũng chính là nội dung của bài toán phân tích hồi quy
I KHÁI NIỆM HAM HOI QUY VÀ PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHÁT
2.1.1 Khái niệm hàm hồi quy
Có nhiều bài tốn trong các lĩnh vực sinh học, kinh tế, giáo dục, khí tượng học, xã hội học khi biết được một số giá trị thực nghiệm của các đại lượng, ví dụ ta có p biến ngẫu nhiên: X,,X,,X, X,.Ta muốn nghiên cứu
rõ hơn sự tác động của một, hay nhiều biến trong số đó đến sự biến động của
một biến nào đó, ví dụ xX, chẳng hạn Có nghĩa là chúng ta muốn giải thích được nhiều hơn và cụ thể hơn sự biến động của X, thông qua sự tác động của
những biến đó Đó chính là mục đích của phương pháp phân tích hồi quy Để
tiện cho việc trình bày, chúng ta xét một tập hợp p biến ngẫu nhiên, nhưng trong đó X, được thay thế bằng Y, tức là ta có: Y,X,,X; X,
Giả sử ta muôn tìm hàm nào đó của X,,X, X, sao cho nó xâp xi Y
tốt nhất theo nghĩa cực tiéu sai số bình phương trung bình, có nghĩa là:
E(Y -f(X,.X X,))” = E(Y - £(X))? = minE(Y - f(X))? NO ( (X))
Trong đó ký hiệu X= X,,X, X, 2.1.2 Định nghĩa
Trang 8- Với p > 2 theo fy (X,,X, Xp) =B, + BX, + B3X,+- + BpXp, gọi là
hàm hồi quy tuyến tính bội
2.1.3 Phương pháp bình phương nhỏ nhất
Phương pháp bình phương nhỏ nhất do nhà toán học người Đức Carl Friedrich Gauss đưa ra Sử dụng phương pháp này kéo theo một vài giá thiết,
các ước lượng thu được có tính chất đặc biệt 2.1.3.1 Mệnh đề
E(Y- {(X))? > min khi f(X) = E(Y/X,, X, X,)
Ta chứng minh mệnh đề trên cho trường hợp p = 2 nghĩa là: f(X) = E(Y/X) Chứng mình:
E(Y- f(X))? = E(Y-E(Y/X)) + E(Y/X) - f(X))? = E(Y - E(Y/X))? + E(E(Y/X) - f(X))’
+ 2E(Y - E(Y/X)E(Y/X) - f(X))
Số hạng thứ ba bằng 0, cũng hai số hạng cũng lại là > 0 Ta bỏ đi số E(E(Y/X) - f(X))?, nói cách khác, nếu chọn f(X) = E(Y/X) theo số hạng đó
triệt tiêu Vậy ta có:
E(Y- f(X))? ¬ min khi f(X) = E(Y/X)
2.1.4 Các giả thiết cơ bản của phương pháp bình phương nhỏ nhất
Trong phân tích hồi quy, mục đích chúng ta là ước lượng, dự báo về tổng thể, tức là ước lượng E(Y/X,) Tuy nhiên chúng ta chỉ có các ước lượng của nó, và trong thực tế chúng ta dùng các ước lượng này để suy diễn cho tổng thể Do đó để các suy diễn này đáng tin cậy thì các ước lượng này phải là các đại
diện tốt cho các hệ số của tổng thể Chất lượng của các ước lượng phụ thuộc
Trang 9- Phụ thuộc vào kích thước mẫu
Đề các suy diễn thống kê trên là đáng tin cậy, mô hình cần thỏa mãn các giả thiết cơ bản sau đây:
Giá thiết 1: Biến (các biến) giải thích là phi ngẫu nhiên, tức là các giá trị của chúng là các số đã được xác định
Giả thiết này khơng có gì mới, vì phân tích hồi quy được đề cập là phân tích hồi quy có điều kiện, phụ thuộc vào các giá trị X đã cho
Giả thiết 2: Kỳ vọng của các yếu tố ngẫu nhiên U bằng không, tức là: E(U/X,)=0
Giả thiết này có nghĩa là các yếu tố khơng có trong mơ hình, U, đại diện cho chúng, khơng có ảnh hưởng hệ thống lên giá trị trung bình của Y
Về mặt hình học giả thiết này được mô tả bằng đồ thị như sau:
ía trị trung bình
Trang 10
Đồ thị chỉ ra rằng với mỗi giá trị của X, các giá trị có thể có của Y xoay quanh giá trị trung bình Phân bó của phần lớn hơn hay nhỏ hơn giá trị trung bình chính là các U,, theo giả thiết này trung bình của các chênh lệch này bằng 0 Chú ý: Giả thiết E(U,/X,) = 0 kéo theo E(Y,/X,) = B, + B,X,,-
Giả thiết 3: Phuong sai bằng nhau (phương sai thuần nhất) của các U,
Var(U,/X,) = Var(U /X ) = o Vizj
Giả thiết 3 có nghĩa là phân bố có điều kiện của Y với giá trị đã cho của X có phương sai bằng nhau, các giá trị cá biệt của Y xoay quanh giá trị trung bình với phương sai như nhau
Giả thiết 3 kéo theo Var(Y,/X,) = ø? Giá thiết 4:
Khơng có sự tương quan giữa các U,:
Cov(U,U,)=0 Vi#j
Giả thiết này có nghĩa là U, là ngẫu nhiên Về mặt hình học có nghĩa là nếu
như có một giá trị U nào đó lớn hơn hay nhỏ hơn giá trị trung bình khơng có nghĩa là giá trị khác cũng lớn hơn hay nhỏ hơn giá trị trung bình
Giả thiết 5: U, và X, không tương quan với nhau: Cov(U,,X,) = 0
Các tính chất của các ước lượng bình phương nhỏ nhất được thê hiện qua định
lý Sau:
2.1.5 Định lý Gauss-Markov: Với các giả thiết 1-5 của phương pháp ước lượng bình phương bộ nhất, các ước lượng bình phương nhỏ nhất là các ước lượng tuyến tính, khơng chệch và có phương sai nhỏ nhất trong các ước lượng tuyến tính khơng chệch
Trang 11Ta chứng minh x e,X, = 0, thật vậy:
i=l
` eX, = 0= Š W.(, +B„Xj)
i=l i=l
E(B) =B, = Wi + Boe WX,
Do B, là ước lượng không chệch: E(B,) =B, Cho nên Š W,=0
n
WX, =1
i=l
Var(B, ) = Var(S: W,X,) => W2Var(Y,) = 07S W?
i=l i=l i=l
Do Var(Y,)= Var(U,)= 67 5 n xX, X, Var(B))= ø? % (W, - =1 i yx? > xX? i=l i=l 8 X > x? x X =o ¥ (W,-= 1)? + 6? 4+=1_ + 267(w, - a > MG) im i= 1 sx? (yx?) =1 vl EX} YX mm
=o yw, i-t 1 - boy eo y xX? y xX?
¡=1 1 ¡=1
>ơ? =1 = Var(B, ) xX;
Trang 12II MƠ HÌNH HỎI QUY TUYẾN TÍNH k - BIEN BANG PHUONG PHAP MA TRAN
Giả sử hàm hồi quy có dạng:
Y, =B, + B,X,, + + BX, + U, (1)
Trong dé p, 14 hé sé tu do (hé sé chan)
B, id= 2,k là các hệ số hồi quy riêng
Giả sử có n quan sát thực tế, mỗi quan sát gồm k giá trị (Y,-Xg,-X Gy) Vậy ta có:
Yị =Bị¡ +B¿X¿i + t B Xu + U, Y, = B, +B, X 2 + + BX FU,
% | |B | (Us | } Xo Xap o Xu |
|Y; | |B, | |U,| h Xo Xị co Xia |
Ký hiệu Y=| |: ð=| |; Us| fs X=] - "
Scene 7
Lyn} [Bal LU] Xan Xan Bea]
Khi đó ta có: Y = XB +U
Giả thiết 4 nói rằng giữa các biến độc lập khơng có quan hệ tuyến tính
với nhau, khi đó các cột của ma trận X là độc lập tuyến tính Do đó hạng của
ma trận X bằng số cột của ma trận này tức là R(X) = k, ma trận X không suy
biến
Như trình bày ở trên, trong thực tế việc sử dụng phương trình hồi quy
tổng thể theo số liệu tơng qt là rất khó khăn, vì vậy cũng như hồi quy 2 hay
3 biến, việc ước lượng phải dựng đến hàm hồi quy mẫu SRF
Trang 13Từ hàm hồi quy tổng quát (1), hàm hồi quy mẫu có dạng: ¥ = B + BX i Thử BX, Y,= B, + B,X,, + + B,X,, +e, Hay Y = X +e Trong đó e=
Ta tìm § theo phương pháp bình phương nhỏ nhất, tức là tìm ơ sao cho:
>ỚY,- Y) = XY - B, -B;X¿¡- BX.)
=Dep = mind (Y - B, - BX,,- + BX) =min S(B,B, Bp)
Hoặc viết dưới dạng vectơ:
^ 2 ^JI2
»ớŒ,-Ÿ) =|Y-Ÿ| = lel = min i
Ta thu được B, lñy Bn là nghiệm của hệ phương trình tuyến tính sau:
(2S(B,.B.„ ơ§(BỊ.B; -.Bp) _
l J= lp
Bằng cách sử dụng phương pháp hình học và một số phép tính cơ bản của ma
trận ta có:
Nếu coi ÿ như một vectơ biến theo F = XB chính là phương trình của một
Trang 14là ta cũng phải gia thiét rang (1, X ;›.›X„ ) là độc lập tuyến tính hay ma trận X cơ sở hạng là p
2 ~IẾ š ˆ Los ˆ
Vì lv - vỗ| = lv - | = min nén tasuyrarang Y là hình chiêu của Y lên siêu phẳng F Tức là ta có: (Y - Ý ) trực giao với F Vì (1, X,, Xa ) là cơ sở của F do đó (Y - Ÿ ) cũng trực giao với tất cả những vectơ đó
Ta có hình vẽ mơ tả sau:
Vì (Y - Ÿ ) vng góc với (I, X,, X„) nên tích vơ hướng của (Y - Y ) voi những vectơ đó phải bằng khơng Tức là ta có:
(X,Y-Ÿ)=šX.(Y.-Ÿ)=0 (j=2.p) J 1J 1 J và (,Y-Ÿ) =XƠ, -Y)) =0
Sử dụng ký hiệu ma trận ta có thể viết lại như sau:
(X,, Y-Y)= XY, - Y) =0 G=2,p)
va
,Y-Ÿ) =I'W,-Ÿ) =0
Hay: (X',Y-Ÿ)=0 Thay Y = X$ vao ta
(X', Y-Y) = (X'" Y- XB) = 0> X'Y = X'xB
Trang 15Vì hạng của X bằng p nên (X'X) cũng có hạng bằng p, do đó sẽ tồn tại ma trận
nghịch đảo (xxY" (theo giả thiết 4, X không suy biến nên (XX) cũng khơng suy biến) Ta có: (X'X) X'Y = (X'X}X'Xô
Vậy B =(XX) 'XY
2.2.2 Ma trận hiệp phương sai của Š
Để kiểm định giả thiết, tìm khoảng tin cậy, cũng như thực hiện các suy
luận thống kê khác cần phải tìm Var(8,) i=l,k Và CoviB,.B,) Phuong phap ma tran cho phép ching ta tim mét cach dé dang
Ta có ma trận hiệp phương sai của Ệ :
[ Vart(Š) CovÐ,Š;) Covi, By.) |
ICovjl¿) - Var¿) Covi 8
Cov(8)=| |
- a
[Cov(B,.B,) CovB,B,) varB,) |
Trong đó Š = (x'xy!x'y
Y =XB +U suy ra Š = (X X)'X (XB +U)= B +(XX) 'XU
©-B=(XX)'XU
Cov(Š) = ELfB-B)fB-B) ] = E{((X X) 'XU][Œ X}'X U])
Trang 16Vậy Cov(Š) = ø?(X X) 1
Trong công thức trên (X X)”' là ma trận nghịch đảo của ma trận (X X), ø? là Var(U,) Vì ø? chưa biết, chúng ta thay nó bằng ước lượng khơng chệch:
n-k n-k n-k
Các phần tử nằm trên đường chéo của ma trận hiệp phương sai {0,5} = 62(x'x)! chinh là các phương sai của các ước lượng ô, :
2.2.3 Hệ số xae dinh béi R? va hệ số xác định bội đó hiệu chỉnh R?
Trong mơ hình hồi quy hai biến, rˆ đo độ thích hợp của hàm hồi quy Nó
chính là tỷ lệ của toàn bộ sự biến đổi của biến phụ thuộc Y do biến giải thích
X gây ra Trong mơ hình hồi quy bội tỷ lệ của toàn bộ sự khác biệt của biến Y do tất cả các biến giải thích X,,X; X, gây ra, được gọi là hệ số xác định bội, ký hiệu Rˆ
Từ hình vẽ trên ta thấy rằng:
—I2 ^II2 ˆ —IJ2
ly -š[ ~jr-Y[ : l -Y|
Hay >(Y, -Y)?= SƠ, -Y)? +x(¥ -Y)? =TSS
Đặt ESS = y(Ÿ -Y)? (Explained sum of squares)
RSS = EY, - Y)? (Residual sum of squares)
Trang 17= Dax, + Y -4X-Y)? = (L(x, -x)?
= @?|> X? -n@) |
Chia hai về cho TSS ta thu được:
1= 100% = BSS, ESS TSS TSS ~ —I2 - | pat r?= 288 FT | RSS TSS ly 7} TSS
R7 chính là tí lệ (số %) sự biến động của Y xung quanh giá trị trung bình Y được giải thích bởi mơ hình hồi quy Mặt khác, từ ý nghĩa hình học ta thấy
R? cũng chính là cosin của góc tạo bởi hai vectơ (Ÿ - Y) và (Y - Y) Góc đó
càng nhỏ theo độ chính xác của ước lượng càng cao Tức là R? càng lớn thì mơ hình càng IỗI
Cụ thể: 0<R? <1 Nếu R? = 1, có nghĩa là đường hồi quy giải thích 100% sự
thay đổi của Y Nếu R? = 0, có nghĩa là mơ hình khơng giải thích sự thay đổi
nào đo của Y
Một tính chất quan trọng của R? là nếu là hàm không giảm của số biến
~ z x n
giải thích có trong mơ hình Dê thây rang > I= Ji => (Vi-Y)” không phụ i=
L L n
thuộc vào số biên giải thích có trong mơ hình, nhung >
i=l e là hàm giảm của số này
Do đó, nếu tăng số biến giải thích trong mơ hình theo R 2 cting tang Van đề đặt ra là khi nào thì nên đưa thêm biến giải thích vào mơ hình ?
Trang 18bậc tự do của Š (Y,-#' )? và
=1 Ì 1 = (Y, -Y)? tương ứng là (n-k) va (n-1) Trong
i=l
ic
đó k là số các tham số (kể cả hệ số chặn ) của mơ hình
2 2 IMs e7/(n-k) = |- X=) -(-R2) 8 $7 n-k Y wn è II Y?((n-1) TMs ¬ R? có các tính chất sau:
1 Nếu k>l, R?<RŸ” <1, điều này có nghĩa là nếu số biến giải thích tăng lên
theo R7 tăng chậm hơn so với RỶ
2 R’> 0, nhung Rˆ có thể bé hơn Như vậy khi R? cũng tăng theo, ta cũng
phải đưa thêm biến mới R? cũng có thé tăng khi mà hệ số của biến mới trong
hàm hồi quy khác không Lúc đó các giả thiết bị bác bỏ
2.2.4 Đánh giá mơ hình qua việc kiểm định các giải thiết thống kê
Hệ số tương quan bội R của phương trình hồi quy chưa nói lên đầy đủ được chất lượng của mơ hình
-_ Nếu hai mơ hình có các biến mô tả khác nhau xuất hiện trong phương trình hồi quy theo dựng hệ số tương quan bội không kết luận được mơ hình nao tét hơn
-_ Có thể việc loại bỏ bớt một số biến nào đó ra khỏi phương trình hồi quy tuy làm thay đổi hệ số tương quan bội, song về thực chat lại không làm giám đáng kế chất lượng của mơ hình
- Trong thực hành, nhiều khi bỏ bớt biến mơ tá trong phương trình hồi quy thì sẽ “kinh tế” hơn, mặc dù sai số ước lượng có thê lớn hơn
Trang 192.2.5 Dw bao
Chúng ta có thể sử dụng mơ hình hồi quy vào dự báo: Dự báo giá trị trung bình và dự báo giá trị cá biệt, nhằm đưa ra những thơng tin chính xác định hướng cho việc phát triển những vấn đề cần thống kê trong tương lai
Cho vectơ chuyển vị: X? = (1 X°.X) XE) - Dự báo giá trị trung bình: E(Y/X')
Y=b 1 + b, x g tet by X, = xb
Voi X= X" tacé (¥,/X°) = X°b => Var(¥,/X,) = X°Var(b)X° Var(Ÿ,/X;) =s?X°(X%X)!'X° vì Var(6)=s@XX)
Nhưng ø ? chưa biết nên phải dùng ước lượng không chệch 6? néu:
Var(Y/X°) = 8X °(X'X) 1X? Se(Y,/X°) = \R?X'9(XX) 1X?
Suy ra: Ÿ, -t,„(n-k)Se(Ÿ,/X”) < E(V/X,) < Ÿ, +t „(n-k)Se(Ý,/X?)
- Dự báo giá trị cá biệt:
Với Y, = Xb+ = Var(¥,/X°) = Var(X °6) + s2 Var(Y,/X")= §?[I + X°@X'X) 'XỈ];
Se(Y,/X°) = (vary, /X°)
Trang 20II HÒI QUY VỚI BIẾN GIÁ
Trong mơ hình hồi quy, ngoài các biến số lượng ra theo người ta cũng dựng đến biến chất lượng Trong trường hợp này để mơ hình có thể đồng bộ hóa người ta phải dùng đến biến giả
Biến chất lượng thường chỉ ra có hoặc khơng có một thuộc tính nào đó,
chẳng hạn nam hay nữ; khu vực tư nhân hay nhà nước Các biến này nhiều
khi cũng có ảnh hưởng đến biến phụ thuộc Để đánh giá được các tác động này, người ta sử dụng phương pháp biến giả
Trang 21Chuong II
PHAN I
SU DUNG MO HINH HOI QUY PHAN TICH ANH HUONG CUA MOT SO YEU TO CHINH LEN HANH VI CHI TIEU VA TIET KIEM CUA HO
GIA DINH
3.1.1 Số liệu
Luận văn sử dụng bộ số liệu điều tra mức sống dân cư hộ gia đình Việt Nam năm 2006 (VHLSS 2006) VHLSS thực hiện bởi cơ quan phát triển và UNDP tài trợ với sự hỗ trợ kỹ thuật của Ngân hàng Thế giới Mẫu điều tra
gồm hơn 9000 hộ và rất nhiều chỉ tiêu, các đặc điểm liên quan đến hộ gia
đình, rất hữu ích trong việc phân tích và xây dựng mơ hình
Luận văn chủ yếu quan tâm đến chỉ tiêu thu nhập và chỉ tiêu của hộ gia
đình nên để hiểu rõ hơn các tính tốn và kết quả đưa ra của mơ hình sau đây chúng ta sẽ tìm hiểu cách tính thu nhập và chỉ tiêu 1 người/1 tháng của hộ gia
đình trong bộ số liệu điều tra Các số liệu về thu nhập và chỉ tiêu được lấy chủ
yếu ở trong phần điều tra về thu nhập và chỉ tiêu của chủ hộ, chỉ có một vải khoản thu và chỉ tiêu từ giáo dục, y tế là được lấy từ phần điều tra về giáo dục, y tế chăm sóc sức khỏe
Trang 22Bảng 1: Cách tính thu nhập bình quân đầu người/một tháng của hộ gia đình u MS Tông thu 1 Tổng thu
2 Trị giá các khoản trợ giúp, học bổng, thưởng từ giáo dục
3 Trị giá các khoản trợ giúp từ y tế
4 Thu từ tiền lương, tiền công các thành viên
5 Thu từ trồng trọt
6 Thu từ chăn nuôi
7 Thu từ dịch vụ nông nghiệp
8 Thu từ săn bắt, thuần đưỡng và nuôi chim thú
9 Thu từ lâm nghiệp
10 | Thu từ nuôi trồng thủy sản
11 Thu từ phi nông nghiệp
12 Thu khác tính vào thu nhập
13 Thu khác khơng tính vào thu nhập
14_ | Thu từ cho thuê đất/nhà
Trang 23Cách tính thu nhập và chỉ tiêu từ các số liệu: Tổng thu: l =mã 2 + 3 +4 + 13 + 14
Thu nhập = mã 2 + 3 + 4 + (5 - 18) + (6 - 19) + (7 - 20) + (§ - 21) + (9 - 22) + (10 - 23) + (11-24) + 12 + 14
Thu nhập bình quân/người/tháng = thu nhập/(số nhân khâu của hộ * 12) Tổng chỉ: 15 = mã 16 + 17 + 18 + + 34 + 35
Chỉ tiêu bình quân/người/tháng = chỉ tiêu/(số nhân khẩu của hộ * 12)
Bang 2: Cách tính chỉ tiêu bình quân đầu người một tháng cúa hộ gia
đình MS Tổng chỉ 15 Tổng chỉ
16 Trị giá các khoản chỉ cho giáo dục
17 Trị giá các chỉ cho y tế
18 Chỉ cho trồng trọt
19 Chi cho chan nuôi
20 Chi cho các dịch vụ nông nghiệp
21 Chỉ cho săn bắt, thuần đưỡng và nuôi chim thú
22 Chi cho lâm nghiệp
Trang 24
24 Chị cho phi nông nghiệp
25 Chỉ cho ăn uống lễ Tết
26 Chỉ cho ăn uống thường xuyên
27 Chỉ không phải lương thực thực phâm hàng ngày
28 Chi không phải lương thực thực phẩm hàng năm 29 Chi khác tính vào chi tiêu
30 Chi khác khơng tính vào chi tiêu 31 Chỉ sữa chữa lớn tài sản có định
32 Chỉ mua tài sản có định 33 Chi mua đồ dùng lâu bền
34 Chi mua đất nhà, mua sắm, sữa chữa, xây mới
35 Chi điện, nước, thuê nhà, gas
Nguôn: Bộ câu hỏi điều tra nức sống dân cư VHLSS 2006
3.1.2 Các biến số
Các biến sử dụng trong cả hai mô hình bao gồm thu nhập, chi tiêu, các đặc điểm của chủ hộ, các đặc điểm hộ và các đặc điểm vùng sẽ được trình bảy sau
đây Trong mỗi tập hợp biến mô tả như phân loại vùng thì một vùng bị bỏ qua
xem như nhóm tham khảo Ví dụ như vùng Tây Bắc Bộ là nhóm bị bỏ qua cho
biên “reg”, vì thê hệ sô vùng khác phản ánh tác động của mức sông của vùng
Trang 25Lax: logarit thụ nhập bình quân/người /tháng (nghìn đồng/người/tháng) Lay: logarit chỉ tiêu bình quân/người /tháng (nghìn đồng/người/tháng)
Nhóm các biến đại diện cho đặc điểm của chủ hộ như: trình độ học vấn, tuổi, giới tính, tình trạng hơn nhân, dân tộc, việc làm Cụ thể gồm 17 biến sau:
Edu0 Không bằng cấp 1 nếu chủ hộ đã tốt nghiệp THCS Edul =
0 nếu ngược lại
1 nếu chủ hộ tôt nghiệp THPT Edu2 =
0 néu ngược lại
1 nếu chủ hộ tốt nghiệp trung cấp KT, dạy nghề ngắn và
Edu3 = dai han
0 néu ngược lại
1 nếu chủ hộ có trình độ Cao đẳng, Đại học và sau Đại học
Edu4 =
0 nếu ngược lại
Age: tuổi của chủ hộ (năm)
Agesa = ti * tuổi (bình phương tuôi của chủ hộ)
Trang 261 nếu chủ hộ làm việc trong thành phần kinh tế nhà nước
stat =
0 nêu ngược lại
1 nếu chủ hộ làm việc trong thành phần kinh tế có vốn nước fore= ngoai
0 nêu ngược lại
1 nếu chủ hộ tự sx kinh doanh hoặc dịch vụ
priv=
0 nêu ngược lại
Nhóm các yếu tô vùng địa lý:
Urban = 1 nếu hộ gia đình sống ở vùng nơng thôn
0 nếu hộ gia đình sống ở thành thị
Regl = 1 nếu hộ gia đình sống ở vùng đồng bằng sông Hồng
0 nếu hộ sống ở vùng khác
Reg2 = 1 nếu hộ gia đình sống ở vùng Đông Bắc Bộ
0 nếu hộ sống ở vùng khác
Reg3 = 1 nếu hộ gia đình sống ở vùng Tây Bắc Bộ
0 nếu hộ sống ở vùng khác
Reg4 = 1 nếu hộ gia đình sống ở vùng Bắc Trung Bộ
0 nếu hộ sống ở vùng khác
Trang 27
Regs = 1 nếu hộ gia đình sống ở vùng duyén hai mién Trung 0 nếu hộ sống ở vùng khác
Reg6 = 1 nếu hộ gia đình sống ở vùng Tây Nguyên
0 nếu hộ sống ở vùng khác
Reg7 = 1 nếu hộ gia đình sống ở vùng Đông Nam Bộ 0 nếu hộ sống ở vùng khác
Reg8 = 1 nếu hộ gia đình sống ở vùng đồng bằng sông Cửu Long
0 nếu hộ sống ở vùng khác
Trong nội dung nghiên cứu của đề tài biến giả được đặt như sau:
Tên biến giả được | „
TT Y nghĩa
gan
1 nếu hộ ở thành thị
1 | URBAN ;
0 nêu hộ ở nông thôn
1 nếu chủ hộ là người dân tộc kinh
2_ |ETHNIC „
0 nêu là các dân tộc khác 1 là nam
3 |SEX
0 là nữ
4 Jold 1 nếu thành viên của hộ trên 60 tuôi
Trang 280 nêu ngược lại
1 nếu thành viên của hộ dưới 15 tuổi
5 | child „
0 nêu ngược lại
1 nếu chủ hộ khơng có bằng cấp hoặc
6 |EDUO không đi học
0 nếu ngược lại
I1 nếu chủ hộ đã có bằng tiểu học hoặc
7 |EDUI trung học cơ sở
0 nếu ngược lại
1 nếu chủ hộc đã có bằng PTTH
8 EDU2 „
0 nêu ngược lại
1 nếu chủ hộ có trình độ cao đẳng, đại học
9 | EDU3 `
và bang 0 nêu ngược lại
1 nếu chủ hộ có trình độ trên Đại học
10 | EDU4 „
0 nêu ngược lại
1 nếu chủ hộ làm việc trong ngành nông,
II |AGR lâm nghiệp
0 nếu ngược lại
1 nếu chủ hộ làm việc trong ngành công
12 |INDS nghiệp, xây dựng cơ bản
Trang 290 nêu ngược lại
1 nếu chủ hộ làm việc trong ngành dịch vụ
13 |SER ;
0 nêu ngược lại
1 nếu chủ hộ làm trong thành phần kinh tế 14 |STAT Nhà nước, kinh tế tập thé
0 nêu ngược lại
1 nếu chủ hộ làm trong thành phần kinh tế 15 |PRIV tư nhân hoặc cá thé, tiểu chủ
0 nêu ngược lại
1 nếu chủ hộ làm trong thành phần kinh tế
16 | FORE có vốn đầu tư nước ngoài
0 nêu ngược lại
3.1.3 Mơ hình đánh giá các yếu tố ảnh hướng đến thu nhập - chỉ tiêu của các hộ gia đình và kết quả ước lượng
3.1.3.1 Mơ hình
Trang 30
TT | Tén bién Mô tả biến
1 |LnX Logarit thu nhập bình quân đầu người (biến phụ
thuộc)
2 Edu0 - Edu4 | Trình độ học vấn của chủ hộ
3 |Age Tuôi của chủ hộ
4 |Agesq Bình phương tuổi của chủ hộ 5 | Ethnic Chủ hộ có là dân tộc thiểu số 6 Sex Giới tính của chủ hộ
7 |Maricd Tình trạng hôn nhân của chủ hộ
8 | tpkt Thành phần kinh tế chính mà chủ hộ tham gia 9_ | nganh Nghề nghiệp chính của chủ hộ
10 | Hhsize Quy mô hộ gia đình
11 |old Tý lệ người già (trên 60 tuôi) trong hộ
12 | child Tý lệ người trẻ (dưới 15 tuổi) trong hộ 13 |Urban Vùng nông thôn/thành thị
14 | Regl-Reg8 | Vùng địa lý
Bảng 3: Các biến dùng đánh giá thu nhập và chỉ tiêu
Trang 31làm cho một số giả thiết cơ bản của mơ hình hồi quy khơng cịn đúng nữa Biến phụ thuộc do vậy trở thành logarit của thu nhập bình quân đầu người
Ta có phương trình sau:
Ln(X,)= B, + B,X,, ++ BYX,, + U;
Trong đó x, là thu nhập bình quân đầu người của hộ thứ ¡ X,, là vectơ các đặc điểm của hộ thứ
8, là vectơ các hệ số ước lượng
U, là sai số ngẫu nhiên
3.1.3.2 Kết quả ước lượng mơ hình
Sau khi dùng phần mềm STATA để xử lý và nối các File số liệu lại với nhau thành 1 File thống nhất, sử dụng chương trình chuyển File chuyên dụng để Import File sang phần mềm SPSS để phân tích, các kết quả thu được như sau: a Phân tích thống kê
Số hộ tham gia điều tra trong bộ số liệu phân tích gồm 6080 hộ - Phân tích số hộ chia theo khu vực, dân tộc của chủ hộ và vùng
Khu vue Cumulative Frequency |Percent |Valid Percent|Percent
Valid Nong thon [4493 [73.9 73.9 [73.9
Thanh thí |1587 26.1 26.1 100.0
Trang 32
Frequency |Percent |Valid Percent|Percent
Valid INong thon |4493 73.9 73.9 73.9
Thanh thi |1587 26.1 26.1 100.0
Total 6080 100.0 100.0
Dan toc
Trang 34Khu vuc
fhong thon
IfThanh thí
Hình 1 - Biểu đồ phân chia khu vực Thành thị - Nông thôn
Dan toc
khac Bkinh
Trang 35
Vung [bb song Hong Dong Bac Bo [Tay Bac Bo [Bac Trung Bo (Nam Trung Bo Tay Nguyen Dong Nam Bo
[Db song Cuu Long
Hinh 3 - Biéu dé phan chia ving Phân tích tổng số người trong hộ ta thấy:
- Số người trung bình trong hộ gia đình là 4, trung vị và mod đều là 4
chứng tỏ mơ hình gia đình ở Việt Nam là mô hình gia đình có 1, 2 thế hệ sống
cùng nhau Qui mơ gia đình không lớn Tổng số người trong hộ nhiều nhất là
Trang 36Statistics
Tong so nguoi trong ho
Trang 37Statistics
Tong so nguoi trong ho
Trang 38
Tong so nguoi trong ho
Frequency |Percent Valid Percent }Cumulative Percent
Trang 39
Tong so nguoi trong ho
Frequency |Percent [Valid Percent {Cumulative Percent
Trang 40Tong so nguoi trong ho 2,500 2,000~] 15007 Frequency 1,000- 5004 1 2 3 4 5 6 7 8 8 10 11 12 13 15
Tong so nguoi trong ho
Hình 4 — Biểu đồ phân chia tổng số người trong hộ
- Phân tích tỷ lệ người già và trẻ em (thành phần phụ thuộc trong gia đình, chưa đi làm công ăn lương) ta thấy: tỷ lệ trẻ em trung bình trong các hộ gia đình là khá lớn chiếm 25,634% còn tỷ lệ người già thì ít hơn chỉ có 7,466%