Mơ hình nhiều mức

Một phần của tài liệu (LUẬN văn THẠC sĩ) thử nghiệm phân tích dữ liệu kinh tế xã hội việt nam bằng thống kê toán học (Trang 43)

Việc mở rộng thành các mơ hình mức cao về cơ bản cũng giống như các mơ hình hai mức. Để thấy rõ, chúng ta đưa ra một mơ hình ba mức dựa trên ví dụ của Raudenbush và Bryk. Xét mơ hình về thành tích của sinh viên với đáp ứng y. Khi đó, mơ hình mức một có dạng

yi,j,k = z1′,i,j,kβi,j +x′1,i,j,kβ1+ε1,i,j,k, (3.1.8) trong đó có i= 1,2,· · · , n trường, j = 1,2,· · · , J1 lớp học ở trong trường thứ i vàk = 1,2,· · · , Ki,j sinh viên ở trong lớp học thứ j. Các biến giải thíchz1,i,j,k và x1,i,j,k có thể phụ thuộc vào các đặc trưng của sinh viên(như giới tính, thu nhập gia đình,..), lớp học(như các đặc điểm của giáo viên, cơ sở vật chất,...) hay trường(như vị trí, cơ cấu quản lý,...). Các tham số phụ thuộc vào trường học i hay lớp học j đều là một phần của vectơ βi,j, trong khi đó các tham số hằng số là một phần của vectơ β1. Các nhiễu ε1,i,j,k có trung bình bằng 0 và phương sai khơng đổi.

Mơ hình mức hai mơ tả sự biến đổi tại mức lớp học và có dạng

βi,j =Z2,i,jγi+X2,i,jβ2+ε2,i,j. (3.1.9)

Tương tự với mơ hình mức một, các biến giải thích Z2,i,j và X2,i,j có thể phụ thuộc vào các đặc trưng của lớp hay trường học nhưng không phụ thuộc vào sinh viên. Các tham số γi được gán với các biến giải thíchZ2,i,j phụ thuộc vào trường học i, trong khi đó các tham số được gán với các biến giải thích X2,i,j

3.2. Các mơ hình nhiều mức dọc 37 là hằng số. Các nhiễu ε2,i,j có trung bình bằng 0 và có phương sai không đổi theo lớp và trường học. Các tham số mức một βi,j có thể biến đổi nhưng phi ngẫu nhiên hoặc là biến ngẫu nhiên. Với điều này, chúng ta sẽ sử dụng phương sai bằng 0 với các mơ hình có tham số biến đổi nhưng phi ngẫu nhiên.

Mơ hình mức ba mơ tả sự biến đổi tại mức trường học. Các tham số mức hai γi có thể biến đổi nhưng phi ngẫu nhiên hoặc là một biễn ngẫu nhiên. Mơ hình mức ba có dạng

γi =X3,iβ3+ε3,i. (3.1.10) Các biến giải thích X3,i có thể phụ thuộc vào trường học. Các nhiễu ε3,i có trung bình bằng 0 và có phương sai khơng đổi theo trường.

Kết hợp các phương trình (3.1.8)-(3.1.10), ta có

yi,j,k = z1,i,j,k′ (Z2,i,j(X3,i+ε3,i) +X2,i,jβ2+ε2,i,j) +x′1,i,j,kβ1+ε1,i,j,k

= x′1,i,j,kβ1+z1,i,j,k′ X2,i,jβ2+z1,i,j,k′ Z2,i,jX3,i+z1,i,j,k′ Z2,i,jε3,i+z1,i,j,k′ ε2,i,j +ε1,i,j,k = x′i,j,kβ +zi,j,k′ αi,j +ε1,i,j,k.

(3.1.11)trong đó x′ trong đó x′

i,j,k = (x′

1,i,j,k;z′

1,i,j,kX2,i,j;z′

1,i,j,kZ2,i,jX3,i);β = (β1;′ β2;′ β3)′ ′, z′

i,j,k = (z′

1,i,j,k;z′

1,i,j,kZ2,i,j) và αi,j = (ε′

2,i,j;ε′

3,i)′.

Chúng ta giả thiết các ε1,i,j,k, ε2,i,j, ε3,i là khơng tương quan với nhau. Phương trình (3.1.11) biểu diễn mơ hình ba mức có dạng như một mơ hình hiệu quả hỗn hợp. Như vậy các ước lượng tham số của phương trình này được tính theo các kết quả của Chương 2.

3.2 Các mơ hình nhiều mức dọc

Phần này chỉ ra cách sử dụng khung mơ hình có điều kiện để biểu diễn dữ liệu dọc như thế nào. Bây giờ, chúng ta sẽ xét một cá thể như một đơn vị phân tích mức hai và các quan sát tại các thời điểm khác nhau như các đơn vị mức một.

3.2. Các mơ hình nhiều mức dọc 38 3.2.1 Mơ hình hai mức

Xét mơ hình mức một có dạng

yit =z1,it′ βi+x′1,itβ1+εit

Mơ hình này có Ti đáp ứng theo thời gian đối với cá thể thứ i. Đơn vị phân tích cho mơ hình mức một là mỗi quan sát tại một thời điểm, chứ khơng phải là một cá thể như phương trình (3.1.1). Các tham số phụ thuộc vào đối tượng thứ i là một phần của vectơ βi, các tham số không đổi thuộc về vectơ β1. Lấy điều kiện trên các đối tượng, nhiễu εit là biến ngẫu nhiên có trung bình bằng 0 và khơng tương quan với βi.

Giống với mơ hình cắt ngang, mơ hình hai mức có thể được biểu diễn dưới

dạng βi = X2,iβ2 + αi. Tuy nhiên, bây giờ chúng ta giải thích các βi khơng

quan sát được là các hệ số ngẫu nhiên được gán với cá thể thứ i. Như vậy, mặc dù về biểu diễn tốn học thì tương tự với mơ hình chéo, nhưng sự giải thích về các thành phần cá thể của mơ hình thì hồn tồn khác. Như với phương trình (3.1.7), chúng ta có thể kết hợp các mơ hình mức một và mức hai thành

yit = z1,it′ (βi= X2,iβ2+αi) +x′1,itβ1+εit = zit′αi+x′itβ+εit,

trong đó x′

it = (x′

1,itz′

1,itX2,i);zit =z1,it và β = (β1β′ 2)′ ′. Đây là mơ hình hồi quy tuyến tính đã được giới thiệu trong phần 3.3.1.

3.2.2 Mơ hình nhiều mức

Mơ hình mức bội cũng có khái niệm tương tự như mơ hình cắt ngang ở phần 5.1.2, ngoại trừ các bản sao mức 1 là theo thời gian. Để minh họa, chúng ta xét mơ hình ba mức dưới đây. Mơ hình mức một có dạng

yi,j,t = z′1,i,j,tβi,j +x′1,i,j,tβ1+ε1,i,j,t. (3.2.1) Mơ hình mức hai như sau

3.3. Dự đốn 39 Và mơ hình mức ba có dạng

γi =X3,iβ3+ε3,i.

Như với mơ hình chéo, người ta kết hợp ba mức này thành một dạng biểu diễn đơn như trong phương trình (3.1.8). Các mơ hình được kết hợp cho phép tính đồng thời trên tất cả các mức, đánh giá các tham số, hiệu quả hơn việc đánh giá tại mỗi mức.

3.3 Dự đoán

Ở phần cuối chương 3, chúng ta đã phân biệt giữa khái niệm ước lượng các tham số mơ hình và khái niệm dự đốn các biến ngẫu nhiên. Trong mơ hình nhiều mức, các biến phụ thuộc ở mức hai và các mức cao hơn là các hệ số ngẫu nhiên không quan sát được. Để hiểu bản chất của các hệ số này, chúng ta đi dự đoán chúng. Và thơng thường, chúng ta sử dụng dự đốn của các hệ số mức hai (hay mức cao hơn) để dự đốn cho mơ hình mức đầu tiên.

Trong phần này, chúng ta chỉ ra cách sử dụng các dự đốn khơng chệch tuyến tính tốt nhất BLUP đối với các vấn đề dự đoán như thế nào. Các dự đốn khơng chệch tuyến tính tốt nhất, theo định nghĩa, là các dự đốn có phương sai nhỏ nhất trong tất cả các dự đốn khơng chệch.Và dưới đây, chúng ta sẽ bắt đầu việc dự đốn với mơ hình hai mức.

3.3.1 Mơ hình hai mức

Xét các mơ hình hai mức trong các phương trình (3.1.5) - (3.1.7). Giả sử

D = V arαi = V arβi và V arεi = Ri, trong đó εi = (εi1· · ·εiTi)′. Giả sử rằng chúng ta muốn dự đốn βi. Ta có dự đốn khơng chệch tuyến tính tốt nhất BLUP của βi là

bi,BLU P =ai,BLU P +X2,ib2,GLS,

trong đó b2,GLS là ước lượng GLS của β2 và ai,BLU P = DZ′V−1

i (yi−XibGLS).

3.3. Dự đoán 40

(b′1,GLSb′2,GLS)′;Vi = Ri + ZiDZi′ và Xi = (xi1, xi2,· · · , xiTi), trong đó x′it = (x′1,itz1′,itX2,i). Bây giờ, ta xét mơ hình thành phần sai số, có zij =z1,ij = 1; Ri

bằng ma trận đơn vị nhân với một vơ hướng và khơng có các biến giải thích mức một. Khi đó, người ta có thể kiểm tra BLUP của kì vọng có điều kiện của đáp ứng mức một E(yit/α) = αi+X2,iβ2 là

ai,BLU P +X2,ib2,GLS = ξi(yi−X2,ib2,GLS) +X2,ib2,GLS (3.3.1)

=ξiyi+ (1−ξ)X2,ib2,GLS. (3.3.2) trong đó ξi = Ti

Ti+ (V arε)/(V arα).

Như vậy dự đốn là một trung bình có trọng số của trung bình thứ i, mức hai, và ước lượng hồi quy là ước lượng lấy được từ tất cả các đơn vị mức hai.Người ta có thể sử dụng phương pháp BLUP để dự đoán được sự phát triển của đáp ứng mức một. Chúng ta có dự đốn củayiTi với thời gian kéo dài L là

b

yi,Ti+L = z1,i,T′ i+Lbi,BLU P +x′1,i,Ti+Lb1,BLU P +Cov(εi,Ti+L, εi)R−1i ei,BLU P,

trong đó ei,BLU P là vectơ BLUP các phần dư. Trong trường hợp mà các nhiễu trong mơ hình tự hồi quy mức một AR(1) với tham số ρ, chúng ta có

b

yi,Ti+L = z1′,i,Ti+Lbi,BLU P +x′1,i,Ti+Lb1,BLU P +ρLeiTi,BLU P.

3.3.2 Mơ hình nhiều mức

Với các mơ hình ba mức hay cao hơn, phương pháp tương tự như mơ hình hai mức mặc dù khó khăn hơn trong việc đưa ra giải thích cho các kết quả.

Phương pháp đánh giá tương lai cho các đáp ứng mức một 1. Giả thiết một mơ hình tại mỗi mức.

3.3. Dự đốn 41 3. Ước lượng các tham số của mơ hình đơn, sử dụng GLS và các ước lượng

thành phần phương sai.

4. Xác định các BLUPs của mỗi hệ số ngẫu nhiên không quan sát được cho các mơ hình mức hai và mức cao hơn.

5. Sử dụng các ước lượng tham số và các dự đoán hệ số ngẫu nhiên để dự đoán tương lai của các đáp ứng mức một.

Để minh họa, chúng ta sẽ xem phương pháp này làm việc với mơ hình dữ liệu dọc ba mức như thế nào với các bước dưới đây.

Bước 1. Chúng ta sẽ sử dụng mơ hình mức một được mơ tả ở phương trình (3.1.8) cùng với các mơ hình mức hai và mức 3 được mơ tả ở phương trình (3.1.9) và (3.1.10) . Đối với mơ hình mức một, chúng ta lấyRij = V arε1,i,j trong đó ε1,i,j = (ε1,i,j,1· · ·ε1,i,j,1)′.

Bước 2. Mơ hình kết hợp là phương trình (3.1.11). Giả sử các hệ số ngẫu nhiên trong mơ hình mức một, hai, ba khơng tương quan cới nhau. Chúng ta định nghĩa V arαi,j = V ar ε2,i,j ε3,i =  V arε2,i,j 0 0 V arε3,i   =  D2 0 0 D3  = DV và Cov(αi,j, αi,k) = 

Cov(ε2,i,j, ε2,i,k) Cov(ε2,i,j, ε3,i) Cov(ε3,i, ε2,i,k) V arε3,i

  =  0 0 0 D3  = DC

Gộp các vectơ lại, chúng ta viếtyi,j = (yi,j,1· · ·yi,j,Ti,j)′;yi = (y′

1,i· · ·y′ i,Ji)′;εi = (ε′ 1,i,1· · ·ε′ 1,i,Ji) và αi = (α′ i,1· · ·α′

3.3. Dự đoán 42

(xi,j,1· · ·xi,j,Ti,j)′;Zi,j = (zi,j,1· · ·zi,j,Ti,j)′;Xi = (Xi,′1· · ·Xi,J′ i)′ và

Zi =         Zi,1 0 · · · 0 0 Zi,2 · · · 0 ... ... · · · ... 0 0 · · · Zi,Ji.        

Với các khác niệm này, ta có thẻ viết phương trình (4.1.11) dưới dạng mơ hình hiệu quả hỗn hợp tuyến tính có dạng yi = Ziαi +Xiβ +εi. Chú ý

rằng Ri = V arεi = chéo khối(Ri,1,· · · , Ri,Ji) và

D =V arαi =         DV DC · · · DC DC DV · · · DC ... ... · · · ... DC DC · · · DV        

Bước 3. Các biến giải thích và dạng của các ma trận phương sai D và Ri, các ước

lượng tham số được suy ra trực tiếp từ các kết quả của phần 3.3 và 3.4. Bước 4. Các dự đoán BLUP được xây dựng bắt đầu với các dự đốn choαicó dạng

ai,BLU P =DZi′Vi−1(yi−XibGLS), trong đóαi,j = (ε′2,i,jε′3,i)′ vàai,j,BLU P = (e′2,i,j,BLU Pe′3,ij,BLU P). Những dự đoán BLUP này cho phép ta dự đoán các hệ số ở mức hai và mức cao hơn qua mối quan hệ

gi,BLU P =X3,ib3,BLU P +e3,i,BLU P và

bi,j,BLU P = Z2,i,jgi,BLU P +X2,i,jb2,BLU P +e2,i,j,BLU P,

tương ứng với phương trình (4.1.9) và (4.1.10). Bước 5. Chúng ta có

b

Chương 4

Thử nghiệm phân tích dữ liệu kinh tế - xã hội Việt Nam bằng mơ hình nhiều mức

Sang chương này, chúng ta sẽ sử dụng mơ hình nhiều mức đã được giới thiệu ở chương 3 để phân tích thử nghiệm mối quan hệ giữa các yếu tố kinh tế - xã hội của nước ta.

4.1 Sơ lược về nguồn dữ liệu

Việc phân tích nền kinh tế của một xã hội, mối quan hệ giữa các nhân tố, thành phần kinh tế thành công hay không là phụ thuộc vào việc sử dụng các dữ liệu thích hợp và phương pháp xử lý các dữ liệu đó. Trong phạm vi luận văn này, học viên sử dụng dữ liệu trong cuốn "Niên giám thống kê" qua các năm 2005 đến 2010 và qua website "www.gso.gov.vn" do Tổng cục Thống kê biên soạn và ban hành để phân tích thử nghiệm sự phụ thuộc của một vài yếu tố vào các yếu tố kinh tế khác.

4.2. Các biến số trong mơ hình 444.2 Các biến số trong mơ hình 4.2 Các biến số trong mơ hình

Dữ liệu được học viên lựa chọn dùng trong việc phân tích thử nghiệm thuộc các nhóm ngành Cơng nghiệp, Nông - Lâm - Ngư nghiệp, Giao thông vận tải

& Bưu chính viễn thơng, Thương mại & Dịch vụ và dữ liệu về Dân số. Trong mỗi ngành này, dữ liệu lại được phân chia theo nhiều nội dung hay tiêu chí thành phần, theo dõi trên 63 tỉnh thành của cả nước . Cụ thể:

• Dữ liệu ngành Cơng nghiệp được xét theo tổng giá trị sản xuất công nghiệp phân theo địa phương, trong đó bao gồm giá trị sản xuất công nghiệp Nhà nước, giá trị sản xuất công nghiệp Nhà nước do Trung ương quản lý, giá trị sản xuất công nghiệp Nhà nước do địa phương quản lý, giá trị sản xuất cơng nghiệp ngồi Nhà nước, giá trị sản xuất cơng nghiệp của khu vực có vốn đầu tư nước ngồi.

• Trong dữ liệu ngành Nông - Lâm - Ngư nghiệp, giá trị sản xuất và diện tích sử dụng được phân theo các nhóm trồng trọt, chăn ni, ni trồng và đánh bắt thủy hải sản; trồng và khai thác rừng.

• Đối vơi ngành Giao thơng vận tải & Bưu chính viễn thơng, học viên lựa chọn dữ liệu về lượng hàng hóa và lượng hành khách vận chuyển (nghìn tấn, triệu lượt người) , luân chuyển (triệu tấn.km; triệu lượt người.km) và số thuê bao di động được sử dụng.

• Đối với ngành Thương mại & Dịch vụ, dữ liệu về Tổng mức bán lẻ hàng hóa và doanh thu dịch vụ tiêu dùng được chọn.

• Dữ liệu về mảng Dân số bao gồm Dân số trung bình nam, nữ; Dân số thành thị, nơng thơn và Lao động bình quân trong khu vực Nhà nước. Trong dữ liệu này, chúng ta quan tâm đến sự phụ thuộc của mức bán lẻ hàng hóa & dịch vụ tiêu dùng, số thuê bao đi động được sử dụng, khối lượng hành khách luân chuyển qua các năm dưới sự tác động của một số nhân tố như tỉ

4.3. Mã hóa dữ liệu 45lệ dân số sống ở thành thị hay nơng thơn, diện tích và sản lượng lúa, hoa màu lệ dân số sống ở thành thị hay nơng thơn, diện tích và sản lượng lúa, hoa màu như khoai, lạc, sắn..., diện tích và sản lượng ni trồng, đánh bắt thủy hải sản, giá trị sản xuất nông nghiệp, giá trị sản xuất cơng nghiệp nói chung và số doanh nghiệp hoạt động trên địa bàn các tỉnh thành trong cả nước.

4.3 Mã hóa dữ liệu

Dữ liệu trong bài luận văn được xử lý bằng phần mềm STATA và được chia theo tỉ lệ hay bình quân theo đầu người (chia cho dân số trung bình). Trong "Niên giám thống kê", dữ liệu của các biến là dữ liệu nguyên thủy nhưng để tạo ra sự công bằng so sánh cho các tỉnh, không bị ảnh hưởng bởi sự chênh lệch về dân số, các biến dưới đây đều là các biến "bình qn" được tính bằng cách chia các biến nguyên thủy tương ứng cho dân số trung bình của tỉnh.

4.3.1 Các biến phụ thuộc

(a) "BQblhhdvtd" là bình qn doanh thu hàng hóa bán lẻ và dịch vụ tiêu dùng đã bán ra thị trường của các cơ sở kinh doanh, bao gồm doanh thu bán lẻ hàng hóa của các cơ sở kinh doanh thương nghiệp; doanh thu bán lẻ sản phẩm của các cơ sở sản xuất và nông dân trực tiếp bán ra thị trường; doanh thu khách sạn, nhà hàng; doanh thu du lịch, lữ hành; doanh thu dịch vụ phục vụ cá nhân, cộng đồng và các dịch vụ khác do các tổ chức và cá nhân kinh doanh, phục vụ trực tiếp cho người tiêu dùng. Tiêu chí này nói lên sự phát triển kinh tế của xã hội, đời sống của người dân càng

Một phần của tài liệu (LUẬN văn THẠC sĩ) thử nghiệm phân tích dữ liệu kinh tế xã hội việt nam bằng thống kê toán học (Trang 43)