Bài tập nhóm phân tích định lượng: Xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ trung bình của phụ nữ giữa các quốc gia trên thế giới nhằm trình bày về phân tích ma trận tương quan và quan hệ giữa các biến, xây dựng mô hình hổi quy tổng quát dùng phương pháp enter.
TR B GIÁO D C VÀ ÀO T O NG I H C M TP H CHÍ MINH BÀI T P NHĨM MƠN H C PHÂN TÍCH NH L NG Xây d ng mơ hình h i quy gi i thích s khác bi t v tu i th trung bình c a ph n gi a qu c gia th gi i Gi ng viên h ng d n : Ths HOÀNG TR NG L p : MBA8 Nhóm : Bùi Qu c Nam Hu nh Gia Xuyên Nguy n Ng c Qu nh Nh Lê Th Bích Ng c V Th Bích Vân TP H CHÍ MINH 03/2009 M TS THU T NG VI T T T DÙNG TRONG BÀI ANOVA (Analysis of Variance): Phân tích ph ng sai DF (Degrees of Freedom): B c t Sig (Observed Significance level): M c ý ngh a quan sát (chính p-value) Std Deviation (Standard deviation): l ch chu n Std Error (Standard Error): Sai s chu n SPSS (Statistical Package for Social Science): Ph n m m th ng kê cho khoa h c xã h i VIF (Variance Inflation Factor): H s phóng i ph ng sai M CL C M T S THU T NG VI T T T DÙNG TRONG BÀI M CL C N I DUNG FILE XU T C A SPSS (MBA8_KT_NHOM_2.SOP) I GI I TH U I.1 T ng quát I.2 Mô t d li u II QUAN SÁT TR C QUAN V T NG QUAN TUY N TÍNH GI A CÁC BI N Trang 1 III XÂY D NG MƠ HÌNH III.1 Phân tích ma tr n t ng quan quan h gi a bi n III.2 Xây d ng mơ hình h i quy t ng quát dùng ph ng pháp Enter III.2.1 Hi n t ng a c ng n III.2.2 T m quan tr ng gi a bi n III.2.3 Ki m nh phù h p c a mơ hình III.2.4 Ki m tra l i m t s vi ph m gi nh c n thi t III.2.4.1 Ki m nh m i quan h n tính gi a bi n c l p bi n ph thu c III.2.4.2 Ki m nh v tính c l p c a sai s (khơng có t ng quan gi a ph n d ) III.3 Mơ hình h i quy IV K T LU N IV.1 Ý ngh a c a mơ hình h i quy IV.2 Xây d ng th 10 10 12 13 13 13 14 15 15 15 16 N I DUNG FILE XU T C A SPSS ( MBA8_KT_NHOM_2.SPO) PH N N I DUNG th bi u th quan h gi a bi n urban bi n lifeexpf th bi u th quan h gi a bi n pop_incr bi n lifeexpf th bi u th quan h gi a bi n gdp_cap bi n lifeexpf th bi u th quan h gi a bi n calories bi n lifeexpf H s t ng quan gi a bi n lifexpf v i bi n nh l ng khác Mơ hình h i quy g m bi n: literacy, babymort, birth_rt, fertilty, lgurban, lggdpcap, sqcalory Mơ hình h i quy g m bi n: literacy, fertilty, lgurban, lggdpcap, sqcalory Mơ hình h i quy g m bi n: literacy, fertilty, lgurban, lggdpcap Bi u phân tán gi a ph n d chu n hoá giá tr d oán chu n hoá 10 Bi u t n s c a ph n d chu n hoá 11 K t qu th ng kê t n s tu i th trung bình c a ph n th gi i GVHD : ThS Hoàng Tr ng I.GI I THI U I.1./ T ng quát Bài làm c a nhóm t xây d ng mơ hình h i quy gi i thích s khác bi t v tu i th ph n gi a qu c gia th gi i v i d li u làm vi c file World 95 Tieng Viet SAV th y Hoàng Tr ng cung c p Nhóm ã dùng ph n m m SPSS ver.11 x lý s li u v i file output có tên MBA8_KT_nhom_2.SPO , ng th i x lý s li u nhóm c ng gi thuy t s li u c a file World 95 Tieng Viet SAV ã c làm s ch có tin c y ch p nh n c v i yêu c u t I.2./ Mô t v d li u D li u thu th p d li u tu i th trung bình c a ph n 109 qu c gia khác nhau, m i m t m u tin g m 23 bi n v i bi n nh danh country (qu c gia), religion (tơn giáo chính), region (khu v c) climate (khí h u chính) Qua th ng kê t n s ta th y s li u tu i th trung bình c a ph n c thu th p y (missing = 0) có giá tr bi n thiên kho ng r t r ng t 43 (tu i) n 82 (tu i), tu i th trung bình 70,16 (tu i) l ch chu n 10,572 B ng I.1 K t qu th ng kê t n s Statistics Tu i th TB ph n N Valid Missing Mean Median Mode Std Deviation Skewness Std Error of Skewness Kurtosis Std Error of Kurtosis Minimum Maximum Sum a Multiple modes exist The smallest value is shown Nhóm th c hi n : Nhóm Trang 109 70.16 74.00 75(a) 10.572 -1.109 231 213 459 43 82 7647 GVHD : ThS Hoàng Tr ng II.QUAN SÁT TR C QUAN V T NG QUAN TUY N TÍNH GI A CÁC BI N u tiên, ta dùng th Scatter công c curve estimate (trong SPSS) nh n nh tr c quan m i t ng quan n tính gi a bi n ph thu c tu i th ph n (lifeexpf) v i bi n nh l ng c l p khác1 (18 bi n), (b qua bi n nh tính bi n s country (qu c gia), bi n s religion (tôn giáo) bi n s 12 region (khu v c) Ta có k t q a nh sau (b ng II.1): B ng II.1 Các bi n STT c a bi n Populatn Density Urban Lifeexpm 10 11 13 Literacy pop_incr Babymort gdp_cap Calories 14 15 16 17 Aids birth_rt death_rt aids_rt 18 19 20 21 22 B_to_d Fertilty Cropgrow Lit_mal Lit_fema nh l ng c kh o sát b ng Tên bi n ph thu c Label bi n ph thu c S l ng dân M t dân s (ng i/km2) T l dân s ng vùng ô th (%) Tu i th nam gi i T l dân bi t ch (%) T c t ng dân s (%/n m) T su t t tr s sinh (%) GDP tính u ng i Calori n p h ng ngày TB ng i Aids cases T su t sinh T su t t Number of aids cases/100.000 people Birth to death ratio S TB c a ph n T l nam gi i bi t ch (%) T l n gi i bi t ch (%) Nh v y qua quan sát bi n nh l ng c l p có m i t (b ng II.2) K t qu không Xem ph Xem ph Xem ph Xem ph th (l n 1) T ng quan qua th scatter v i bi n ph thu c Khơng có Khơng có Phi Tuy n Tuy n tính Tuy n tính Khơng rõ Tuy n tính Phi n Phi Tuy n Khơng có Tuy n tính Tuy n tính Khơng có Khơng có Tuy n tính Khơng có Tuy n tính Tuy n tính th Scatter (và Curve estimation) ta ch c n xem l i 12 ng quan v i tu i th trung bình c a ph n (lifeexpf) th scatter gi a bi n nh l ng v i bi n lifeexpf bi u th m i t ng quan n tính rõ r t c l u l i file xu t MBA8_KT_nhom_2.spo, nh m m c ích cho t p tin nh g n n file xu t MBA8_KT_nhom_2.spo n file xu t MBA8_KT_nhom_2.spo n file xu t MBA8_KT_nhom_2.spo n file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm Trang GVHD : ThS Hoàng Tr ng B ng II.2 K t qu bi n Tên bi n ph thu c nh l ng gi l i sau kh o sát b ng STT c a bi n Label bi n ph thu c Urban Lifeexpm T l dân s ng vùng ô th (%) Tu i th nam gi i Phi n Tuy n tính 10 11 13 15 16 19 21 22 Literacy pop_incr Babymort gdp_cap Calories birth_rt death_rt Fertilty lit_mal lit_fema T l dân bi t ch (%) T c t ng dân s (%/n m) T su t t tr s sinh(%) GDP tính u ng i Calori n p h ng ngày TB ng T su t sinh (%) T su t t (%) S TB c a ph n T l nam gi i bi t ch (%) T l n gi i bi t ch (%) Tuy n tính Khơng rõ Tuy n tính Phi n Phi n Tuy n tính Tuy n tính Tuy n tính Tuy n tính Tuy n tính th (l n 1) T ng quan qua th scatter v i bi n ph thu c i Do th scatter, bi n s (urban), s (pop_incr), s 11 (gdp_cap), 13 (calories) bi u th m i t ng quan v i tu i th ph n (lifeexpf) có d ng phi n ho c khơng rõ nên ta có th xác minh l i b ng công c Curve estimation SPSS6 i v i bi n Urban ta có k t qu nh sau: Independent: Dependent LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF Mth LIN LOG INV QUA CUB COM POW S GRO EXP LGS URBAN Rsq 553 563 378 586 587 533 559 388 533 533 533 d.f 106 106 106 105 104 106 106 106 106 106 106 F 131.00 136.70 64.43 74.43 49.36 121.12 134.17 67.10 121.12 121.12 121.12 Sigf 000 000 000 000 000 000 000 000 000 000 000 Ta th y giá tr R2 c a ba mơ hình b c 2, b c mơ hình log cao nh t, i u th hi n kh n ng gi i thích ba d ng mơ hình m nh nh t cho m i quan h gi a urban lifeexpf Tuy r ng R2 c a hai mơ hình b c 2, b c cao h n R2 c a mơ hình log, nh ng n gi n hố mơ hình h n n a có th tránh hi n t ng c ng n có th có gi a bi n urban b c b c 2, 3, ta quy t nh ch n mơ hình log - n tính cho quan h g a urban lifeexpf b ng cách t o bi n lgurban = log10 (urban) Bi n lgurban có s th t 24 Tham kh o th ph n 1,2,3,4 c a file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm Trang GVHD : ThS Hồng Tr ng i v i bi n pop_incr ta có: Independent: Dependent LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF POP_INCR Mth LIN LOG INV QUA CUB COM POW S GRO EXP LGS Rsq 336 d.f 107 F 54.07 Sigf 000 034 406 488 302 107 106 105 107 3.76 36.24 33.39 46.36 055 000 000 000 031 302 302 302 107 107 107 107 3.44 46.36 46.36 46.36 066 000 000 000 Notes: 12 Independent variable has non-positive values tính Giá tr R2 c a mơ hình u nh , th m chí hai mơ hình logarith power khơng th c, v y ta d t khoát b bi n pop_incr kh i mơ hình quan h v i bi n lifeexpf i v i bi n gdp_cap ta có: Independent: GDP_CAP Dependent Mth LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIN LOG INV QUA CUB COM POW S GRO EXP LGS Rsq d.f F Sigf 412 691 600 544 604 364 652 597 364 364 364 107 107 107 106 105 107 107 107 107 107 107 75.11 238.93 160.41 63.35 53.32 61.26 200.32 158.60 61.26 61.26 61.26 000 000 000 000 000 000 000 000 000 000 000 Giá tr R2 c a mơ hình Logarithm l n nh t, ó ta ch n mơ hình log - n tính bi u th m i quan h gi a gdp_cap v i lifeexpf b ng cách t o bi n lggdpcap = log10 (gdp_cap) Bi n lggdpcap có s th t 25 i v i bi n calories ta có: Independent: CALORIES Nhóm th c hi n : Nhóm Trang GVHD : ThS Hoàng Tr ng Dependent Mth LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIFEEXPF LIN LOG INV QUA CUB COM POW S GRO EXP LGS Rsq d.f F Sigf 601 631 648 667 668 569 602 622 569 569 569 73 73 73 72 72 73 73 73 73 73 73 110.05 125.07 134.41 72.00 72.35 96.56 110.49 120.18 96.56 96.56 96.56 000 000 000 000 000 000 000 000 000 000 000 K t qu R2 c a mơ hình b c cao (dù R2 c a mơ hình b c cao h n nh ng không k mà l i ph c t p h n nhi u) nên ta quy t nh dùng mơ hình b c mô t m i quan h gi a calories lifeexpf b ng cách t o thêm bi n calories2 = (calories)2 ng th i n ây ta c ng quy t nh b h n bi n calories kh i mơ hình v b n ch t ch c n bi n sqcalory = (calories)2 thay th cho bi n calories , n u v n gi bi n calories s r t d gây hi n t ng a c ng n Bi n sqcalory s có s th t 26 Nh v y, qua quan sát tr c quan b ng th scatter dùng công c curve estimation , tr c h t ta t m th i cho bi n c l p b ng (II.3) vào mơ hình xây d ng h i quy cho tu i th trung bình c a ph n B ng II.3 K t qu gi l i bi n Tên bi n ph thu c nh l ng sau dùng Curve Estimation STT c a bi n Label bi n ph thu c Lifeexpm Tu i th nam gi i Tuy n tính 10 15 16 19 21 22 24 25 26 Literacy babymort Birth_rt Death_rt fertilty lit_mal lit_fema lgurban lggdpcap sqcalory T l dân bi t ch (%) T su t t tr s sinh (%) T su t sinh (%) T su t t (%) S TB c a ph n T l nam gi i bi t ch (%) T l n gi i bi t ch (%) Log (urban) Log (gdp_cap) Sqrt (calories) Tuy n tính Tuy n tính Tuy n tính Tuy n tính Tuy n tính Tuy n tính Tuy n tính Lin-Log Lin-Log Lin-Qua7 Lin-Qua hay g i Quadratic Dependence Nhóm th c hi n : Nhóm Trang T ng quan qua th scatter v i bi n ph thu c GVHD : ThS Hoàng Tr ng III XÂY D NG MƠ HÌNH III.1./ Phân tích ma tr n h s t ng quan quan h gi a bi n8 Qua tính tốn ma tr n h s t ng quan (xem b ng III.2), ta nh n th y h s t ng quan gi a bi n ph thu c lifeexpf v i bi n c l p ã nêu u cao (th p nh t -0,696 i v i bi n death_rt) Tuy nhiên m i t ng quan gi a bi n c ng r t cao (thí d gi a h s t ng quan gi a babymort v i lifeexpm -0,936, v i literacy -0,9 Và h s t ng quan gi a fertilty v i birth_rt 0,975) ý ngh a ôi t ng ng, v y ta có th xét l i vi c a bi n vào ph ng trình h i quy nh sau: - Bi n lifeexpm (Tu i th nam gi i) có m i t ng quan v i lifeexpf r t cao (0,982), nh ng b n ch t gi a hai bi n t ng ng, y u t tu i th nam gi i cao không ph i y u t làm tu i th n gi i cao Có ngh a bi n lifeexpm khơng ph i bi n nguyên nhân tác ng t i bi n ph thu c lifeexpf, mà c hai bi n u b nh h ng b i m t s bi n nguyên nhân khác Do ó ta có th b bi n khơng a vào mơ hình h i quy - Bi n babymort (T su t t tr s sinh(%)) có h s t ng quan v i lifeexpf r t cao (-0,962) nh ng ng th i l i c ng có quan h ch t ch v i bi n literacy (h s t ng quan = - 0,9) nên ta c ng có th b bi n kh i mơ hình ngồi xét v b n ch t bi n babymort c ng khơng ph i y u t nh h ng t i lifeexpf - Bi n birth_rt (T su t sinh (%)) c ng c a kh i mơ hình h i quy r ng h s t ng quan v i lifeexpf c ng cao ( -0,862), nh ng b n thân bi n l i c ng quan h ch t v i bi n fertilty (h s t ngquan = 0,975) H n n a xét v m t ý ngh a c ng khơng ph i y u t nh h ng t i bi n lifeexpf - Bi n death_rt (T su t t (%)) khơng c a vào mơ hình h s t ng quan v i lifeexpf th p nh t (-0,696) b ng k t qu correlation H n n a xét v m t ý ngh a bi n death_rt c ng khơng ph i y u t nh h ng t i bi n lifeexpf - Bi n lit_male (T l nam gi i bi t ch (%)) lit_fema (T l n gi i bi t ch (%)) có quan h v i lifeexpf (h s t ng quan l n l t 0,777 0,819) nh ng l i c ng có quan h ch t v i bi n literacy (h s t ng quan l n l t 0,948 0,973), v y có th nói ba bi n literacy,,lit_male lit_fema b n ch t (cùng th hi n dân trí t l dân bi t ch s ng bi n v i t l nam gi i bi t ch t l n gi i bi t ch ) Do v y ta có th b hai bi n lit_male lit_fema khơng a vào mơ hình, mà ch gi l i m t bi n literacy th hi n m c dân trí mà thơi Tóm l i, n ây ch b y bi n a vào mơ hình h i quy nh Xem ph n c a file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm Trang b ng (III.1) GVHD : ThS Hoàng Tr ng B ng III.1: Các bi n (7 bi n) gi l i sau phân tích ý ngh a STT Tên bi n ph thu c Literacy 10 Babymort 15 birth_rt 19 Fetilty 24 Lggdpcap 25 Lgurban 26 Sqcalory Label bi n ph thu c T l dân bi t ch (%) T su t t tr s sinh (%) T su t sinh (%) S TB c a ph n GDP tính u ng i T l dân s ng vùng ô th (%) Calory n p TB cho ng i/1 ngày Nhóm th c hi n : Nhóm Trang D ng a vào mơ hình Tuy n tính Tuy n tính Tuy n tính Tuy n tính lggdpcap = log(gdp_cap) lgurban = log(urban) Tuy n tính GVHD : ThS Hồng Tr ng B ng III.2 B ng h s t Tuổi thọ TB phụ nữ Tuổi thọ TB phụ nữ Pearson Correlation Sig (2-tailed) Tỉ lệ dân biết chữ (%) Tỉ suất tử trẻ sơ sinh o/oo Tỉ suất sinh o/oo Pearson Correlation Tỉ suất tử trẻ sơ sinh o/oo Tỉ suất sinh o/oo Tỉ suất tử o/oo Số TB phụ nữ Tỉ lệ nữ giới biết chữ (%) logarith co so 10 cua bien gdp_cap binh phuong bien calories 982(**) 865(**) -.962(**) -.862(**) -.696(**) -.838(**) 777(**) 819(**) 750(**) 831(**) 750(**) 000 000 000 000 000 000 000 000 000 000 000 109 107 109 109 108 107 85 85 108 109 75 982(**) 809(**) -.936(**) -.805(**) -.739(**) -.783(**) 717(**) 745(**) 735(**) 805(**) 739(**) Sig (2-tailed) 000 000 000 000 000 000 000 000 000 000 000 N 109 109 107 109 109 108 107 85 85 108 109 75 865(**) 809(**) -.900(**) -.869(**) -.486(**) -.866(**) 948(**) 973(**) 662(**) 732(**) 661(**) Sig (2-tailed) 000 000 000 000 000 000 000 000 000 000 000 N 107 107 107 107 107 106 105 85 85 107 107 74 -.962(**) -.936(**) -.900(**) 865(**) 630(**) 833(**) -.809(**) -.843(**) -.716(**) -.824(**) -.754(**) Sig (2-tailed) 000 000 000 000 000 000 000 000 000 000 000 N 109 109 107 109 109 108 107 85 85 108 109 75 -.862(**) -.805(**) -.869(**) 865(**) 367(**) 975(**) -.794(**) -.835(**) -.635(**) -.769(**) -.754(**) 000 000 000 000 000 000 000 000 000 000 000 109 109 107 109 109 108 107 85 85 108 109 75 -.696(**) -.739(**) -.486(**) 630(**) 367(**) 396(**) -.486(**) -.510(**) -.560(**) -.402(**) -.307(**) 000 000 000 000 000 000 000 000 000 000 007 108 108 106 108 108 108 107 85 85 107 108 75 -.838(**) -.783(**) -.866(**) 833(**) 975(**) 396(**) -.796(**) -.839(**) -.642(**) -.693(**) -.683(**) Pearson Correlation Pearson Correlation Pearson Correlation Sig (2-tailed) Pearson Correlation Sig (2-tailed) N Số TB phụ nữ Tỉ lệ dân biết chữ (%) logarith co so 10 cua bien urban N Tỉ suất tử o/oo Tuổi thọ TB nam giới Tỉ lệ nam giớ i biế t chữ (%) 109 N Tuổi thọ TB nam giới Correlations ng quan gi a bi n Pearson Correlation Nhóm th c hi n : Nhóm Trang GVHD : ThS Hồng Tr ng Tỉ lệ nam giớ i biế t chữ (%) Sig (2-tailed) 000 000 000 000 000 000 000 000 000 000 000 N 107 107 105 107 107 107 107 85 85 106 107 75 777(**) 717(**) 948(**) -.809(**) -.794(**) -.486(**) -.796(**) 964(**) 590(**) 611(**) 553(**) 000 000 000 000 000 000 000 000 000 000 000 85 85 85 85 85 85 85 85 85 85 85 59 819(**) 745(**) 973(**) -.843(**) -.835(**) -.510(**) -.839(**) 964(**) 620(**) 632(**) 527(**) 000 000 000 000 000 000 000 000 000 000 000 85 85 85 85 85 85 85 85 85 85 85 59 750(**) 735(**) 662(**) -.716(**) -.635(**) -.560(**) -.642(**) 590(**) 620(**) 713(**) 638(**) Sig (2-tailed) 000 000 000 000 000 000 000 000 000 000 000 N 108 108 107 108 108 107 106 85 85 108 108 74 831(**) 805(**) 732(**) -.824(**) -.769(**) -.402(**) -.693(**) 611(**) 632(**) 713(**) 838(**) Sig (2-tailed) 000 000 000 000 000 000 000 000 000 000 000 N 109 109 107 109 109 108 107 85 85 108 109 75 750(**) 739(**) 661(**) -.754(**) -.754(**) -.307(**) -.683(**) 553(**) 527(**) 638(**) 838(**) 000 000 000 000 000 007 000 000 000 000 000 75 75 74 75 75 75 75 59 59 74 75 75 Pearson Correlation Sig (2-tailed) N Tỉ lệ nữ giớ i biế t chữ (%) Pearson Correlation Sig (2-tailed) N logarith co so 10 cua bien urban logarith co so 10 cua bien gdp_cap binh phuong bien calories Pearson Correlation Pearson Correlation Pearson Correlation Sig (2-tailed) N ** Correlation is significant at the 0.01 level (2-tailed) Nhóm th c hi n : Nhóm Trang GVHD : ThS Hồng Tr ng III.2./ Xây d ng mơ hình h i quy t ng quát dùng ph ng pháp Enter Qua k t qu phân tích trên, ta s xây d ng mơ hình n tính gi a lifeexpf v i b y bi n literacy, babymort, birth_rt, fertilty, lgurban (logarith c s 10 c a urban), lggdpcap (logarith c s 10 c a gdp_cap), sqcalory (sqcalory = calories2) Ta s dùng ph ng pháp Enter SPSS, a toàn b b y bi n vào m t lúc, sau ó ta s l n l t dò tìm vi ph m gi nh c n thi t d n d n tinh ch nh thêm mơ hình h i quy c a ta: B ng III.3 K t qu ki m nh mơ hình h i quy g m b y bi n cl p Coefficients(a) Mod el Unstandardized Coefficients B (Constant) Tỉlệdân biết chữ (%) Tỉ suất tử trẻ sơ sinh o/oo Tỉ suất sinh o/oo Số TB phụ nữ logarith co so 10 cua bien urban logarith co so 10 cua bien gdp_cap binh phuong bien calories Std Error 83.140 6.978 -.094 041 -.260 Standardized Coefficients T Sig Zeroorder Beta Collinearity Statistics Correlations Partial Part Tolerance 000 -.191 -2.274 026 869 -.270 -.066 122 8.213 027 -.880 -9.590 000 -.963 -.763 -.280 102 9.848 -.119 164 -.129 -.721 474 -.864 -.088 -.021 027 37.286 -.334 922 -.057 -.362 718 -.842 -.045 -.011 035 28.674 4.901 2.013 122 2.434 018 766 287 071 343 2.915 684 1.317 040 519 605 827 064 015 146 6.859 -1.105E07 000 -.030 -.531 597 750 -.065 -.016 260 3.843 a Dependent Variable: Tuổi thọ TB phụ nữ III.2.1/ Hi n t VIF 11.914 ng a c ng n9 (xem b ng III.3): - Bi n t su t t tr s sinh (babymort) có h s VIF (Variance Inflation factor) ~10 (9,848) c ng nh h s tolerance nh (0,102) nên có hi n t ng a c ng n Qua b ng correlation ta th y bi n babymort (T su t t tr s sinh(%)) có h s t ng quan v i lifeexpf r t cao (-0,962) nh ng ng th i l i c ng có quan h ch t ch v i bi n literacy (h s t ng quan = - 0,9) nên n u gi l i bi n literacy s ph i b bi n babymort kh i mơ hình - Bi n t su t sinh (birth_rt) có h s VIF > 10 (37,286) c ng nh h s tolerance nh (0,027) nên có hi n t ng a c ng n Qua b ng Correlation, ta th y bi n birth_rt r ng h s t ng quan v i lifeexpf c ng cao ( -0,862), nh ng b n thân bi n l i c ng quan h r t ch t v i bi n fertilty (h s t ngquan = 0,975) Do v y gi bi n literacy mơ hình ta s ph i b bi n birth_rt kh i mơ hình - Bi n s trung bình c a m t ph n (fertilty) có h s VIF > 10 (28,674) c ng nh h s tolerance nh (0,035) nên có hi n t ng a c ng n Tuy nhiên qua b ng Correlation, ta th y b n thân bi n l i c ng quan h r t ch t v i bi n birth_rt (t Multicollinearity Nhóm th c hi n : Nhóm Trang 10 GVHD : ThS Hoàng Tr ng su t sinh) (h s t ngquan = - 0,975) Mà ta ã quy t nh b bi n birth_rt kh i mô hình nên ta có th gi l i bi n fertilty mơ hình (ta s ch y l i k t qu b bi n birth_rt xem vi c gi l i bi n fertilty có phù h p không?) n ây sau b hai bi n babymort birt_rt ki m tra l i ta th y tr c m t khơng hi n t ng a công n (h s VIF cao nh t 5,134) nh ng h s h i quy ng tr c bi n sqcalory l i không ý ngh a (Beta chu n hố q nh = 0,08 sig l i l n = 0,347), ó ta c ng l i b ln bi n sqcalory kh i mơ hình (n u ý, ta có th th y gi a bi n sqcalory bi n lggdpcap có m i quan h c ng n ti m n ch m c sung túc v v t ch t c a cu c s ng) B ng III.3: K t qu ki m nh m c phù h p c a h s h i quy v i bi n cl p Coefficients(a) Mod el Unstandardized Coefficients Std Error B (Constant) Tỉlệdân biết chữ (%) Số TB phụ nữ logarith co so 10 cua bien urban logarith co so 10 cua bien gdp_cap binh phuong bien calories 34.348 6.324 169 048 -1.371 Standardize d Coefficients t Sig Zeroorder Beta Collinearity Statistics Correlations Partial Part Toleran ce VIF 5.432 000 342 3.559 001 869 396 159 216 4.623 544 -.233 -2.522 014 -.842 -.292 -.113 234 4.271 8.314 2.795 206 2.975 004 766 339 133 415 2.408 3.183 1.740 185 1.829 072 827 217 082 195 5.134 2.899E07 000 080 948 347 750 114 042 281 3.560 a Dependent Variable: Tuổi thọ TB phụ nữ V y cu i ta ch b n bi n hình h i quy (b ng III.4) c l p literacy, fetilty, lggdpcap, lgurban mô B ng III.4: Các bi n (4 bi n ) gi l i mơ hình h i quy sau ki m tra hi n t c ng n STT Tên bi n ph thu c Literacy 19 Fetilty 24 Lggdpcap 25 Lgurban Label bi n ph thu c T l dân bi t ch (%) S TB c a ph n GDP tính u ng i T l dân s ng vùng ô th (%) Nhóm th c hi n : Nhóm Trang 11 D ng ng a a vào mơ hình Tuy n tính Tuy n tính lggdpcap = log(gdp_cap) lgurban = log(urban) GVHD : ThS Hoàng Tr ng Ch y l i mơ hình h i quy v i b n bi n quan sát ta có k t q a B ng III.5: K t q a ki m nh m c b ng (III.5) phù h p c a h s h i quy v i bi n cl p Coefficients(a) Mod el Unstandardized Coefficients Std Error B (Constant) Tỉlệdân biết chữ (%) Số TB phụ nữ logarith co so 10 cua bien urban logarith co so 10 cua bien gdp_cap 33.767 5.031 143 036 -1.459 Standardize d Coefficients t Sig Zeroorder Beta Collinearity Statistics Correlations Partial Part Toleran ce 000 308 3.996 000 865 371 144 218 4.585 419 -.258 -3.479 001 -.847 -.329 -.125 236 4.236 8.772 2.337 213 3.753 000 779 351 135 403 2.481 4.486 1.079 263 4.159 000 833 384 150 324 3.084 a Dependent Variable: Tuổi thọ TB phụ nữ n ây ta ã th y hồn tồn khơng hi n t ng a c ng n (VIF cao nh t 4,585 h s beta u có ý ngh a, sig l n nh t 0,001) Ta có th xem nh b n bi n c l p a vào mô hình h p lý (b ng III.5) III.2.2./ T m quan tr ng c a bi n10 (b ng III.5) - H s Beta: H s beta c a bi n ph ng trình h i quy có ý ngh a th ng kê (sig l n nh t 0,001) x p x nhau: Literacy: 0,308 Fertilty: -0,258 Logurban: 0,213 Loggdpcap: 0,263 10 VIF 6.712 - H s t ng quan t ng ph n (Part Correlation coefficient): th hi n t ng quan c a bi n d c l p v i ph thu c lifeexpf ã lo i b nh h ng n tính gi a bi n c l p v i Literacy: 0,144 Fertilty: -0,125 Logurban: 0,135 Loggdpcap: 0,150 - H s t ng quan riêng (Partial Correlation coefficient) : th hi n t ng quan c a bi n d c l p v i ph thu c lifeexpf ã lo i b nh h ng n tính gi a bi n c l p v i gi a bi n c l p khác v i bi n ph thu c Literacy: 0,371 Fertilty: -0,329 Logurban: 0,351 Loggdpcap: 0,384 Có th tham kh o k h n ph n c a file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm Trang 12 GVHD : ThS Hồng Tr ng Qua phân tích ta th y nh h ng c a bi n c l p v i bi n ph thu c chênh l ch nhi u Có th th y r ng bi n Lggdpcap có m c nh h ng l n nh t, literacy có m c nh h ng nhì, th ba lgurban cu i fertilty III.2.3/ Ki m - - nh phù h p c a mơ hình 11 Ki m nh phù h p: Ki m nh Fisher cho gi thuy t t t c h s h i quy b ng 0, tr h ng s (Ho: = = = = 0) v i sig =0,000 cho phép ta an toàn bác b gi thuy t Ho, nh v y mơ hình h i quy n tính c a ta phù h p v i d li u ã dùng (b ng III.7) ánh giá phù h p c a mơ hình: v i h s R2 i u ch nh = 0,865 nên có th coi m c phù h p c a mơ hình cao B ng III.7: K t qu th ng kê F tính t giá tr R2 ANOVA(b) Sum of Squares Model Regressio n Residual Total Df Mean Square 10351.984 2587.996 1543.673 11895.657 100 104 15.437 F Sig 167.652 000(a) a Predictors: (Constant), logarith co so 10 cua bien gdp_cap, Soá TB phụ nữ, logarith co so 10 cua bien urban, Tỉlệdâ n biế t chữ(%) b Dependent Variable: Tuổi thọ TB phụ nữ III.2.4./ Ki m tra l i m t s vi ph m gi nh c n thi t: ph n 2.1, ta ã xét mô hình h i quy c a ta khơng d u hi n x y hi n t ng a c ng n Du i ây ta s ti p t c gi thuy t v m i quan h n tính gi a bi n c l p bi n ph thu c (cho dù tr c ây, ta ã dùng th Scatter curve estimation th y m i quan h n tính gi a bi n c l p bi n ph thu c nh ng i u ó ch mang tính tr c quan mà thơi) V tính c l p c a sai s (khơng có t ng quan gi a ph n d ) tính phân ph i chu n c a ph n d III.2.4.1./ Ki m nh m i quan h n tính gi a bi n c l p bi n ph thu c Nh ã nói, r ng tr c ây ta ã dùng th Scatter công c curve estimation th y m i quan h n tính gi a bi n c l p bi n ph thu c nh ng d u i u c ng ch mang tính tr c quan th hi n m i t ng quan c a t ng bi n c l p v i bi n ph thu c mà thôi, ta c n ki m nh l i gi thuy t gi a bi n c l p bi n ph thu c có quan h n tính c s xem th phân tán (hình III.1) gi a ph n d c chu n hoá (standardized residual c ph n m m SPSS l u bi n zre_1) giá tr d oán chu n hoá (standardized predicted value c ph n m m SPSS l u bi n zpr_1) Qua th này, ta th y ph n d phân tán ng u nhiên chung quanh ng i qua g c O, nên ta có th k t lu n gi nh bi n c l p v i bi n ph thu c có quan h n tính (ph i nh có hai bi n c l p lgurban lggdpcap logarithm c s 10 c a hai bi n quan sát lúc u urban gdp_cap) 11 Có th tham kh o rõ h n ph n c a file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm Trang 13 GVHD : ThS Hồng Tr ng Hình III.1: th phân tán gi a ph n d c chu n hoá giá tr d oán chu n hoá Standardized Residual -1 -2 -3 -4 -5 -3 -2 -1 Standardized Predicted Value III.2.4.2/ Ki m nh v tính c l p c a sai s (khơng có t ng quan gi a ph n d )12 Ta dùng b ng th ng kê Durbin-Watson ki m nh Qua b ng tóm t t mơ hình (b ng III.8) ta th y h s Durbin-Watson = 2,067 n m gi a giá tr c a du = 1,4 c a (4-du) = 2,6 nên có th ch p nh n gi thuy t khơng có hi n t ng t t ng quan chu i b c nh t gi a ph n d , có ngh a kh ng nh gi thuy t v tính c l p c a sai s B ng III.8 B ng k t q a ki m nh mơ hình Model Summary(b) Change Statistics Model R 933(a) R Square Adjusted R Square Std Error of the Estimate 870 865 3.929 R Square Change 870 F Change 167.652 df1 df2 100 Sig F Change DurbinWatson 000 a Predictors: (Constant), logarith co so 10 cua bien gdp_cap, Số TB phụ nữ, logarith co so 10 cua bien urban, Tỉlệdâ n biế t chữ(%) b Dependent Variable: Tuổi thọ TB phụ nữ III.2.4.3./ Ki m nh v tính phân ph i chu n c a ph n d : Ta có th dùng bi u t n s Histogram (hình III.2) kh o sát phân ph i c a ph n d (th hi n bi n zre_1 SPSS l u l i) Qua th ta th y phân ph i ph n d c a mơ hình x p x chu n có trung bình Mean = d l ch chu n Std Dev = 0,98 (g n = 1) Nên ta có th k t lu n gi thuy t ph n d có phân ph i chu n không b vi ph m 12 Autocorrelated errors : g i t t Breusch-Godfrey (BG) Nhóm th c hi n : Nhóm ng quan.Có th ki m Trang 14 nh b ng ph ng pháp Durbin-Watson hay 2.067 GVHD : ThS Hồng Tr ng Hình III.2 Histogram kh o sát phân ph i c a ph n d 20 10 Std Dev = 98 Mean = 0.00 N = 105.00 00 50 00 00 0 -.5 0 -1 -1 0 -2 -2 0 -3 -3 0 -4 Standardized Residual - - III.3./ Mơ hình h i quy (b ng III.5): Cu i ta ã xây d ng c mơ hình h i quy cho vi c d báo tu i th c a ph n (lifeexpf) v i bi n c l p literacy (t l dân bi t ch có n v %), fertilty (s trung bình c a ph n ), lggdpcap (log10 c a gdp_cap v i gdp_cap GDP bình quân m t u ng i có n v USD), lgurban (log10 c a urban v i urban t l dân s ng th có n v %) Mơ hình khơng hi n t ng a c ng n (VIF cao nh t 4,585