Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 44 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
44
Dung lượng
281,57 KB
Nội dung
Kiểmđịnhphithamsố thực hành Thống kê Lí THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN Chương Kiểmđịnhphithamsố NỘI DUNG Chương dành riêng cho kiểmđịnhphitham số, kiểmđịnh thường tiến hành để xác định tính chất tổng thể thơng qua số liệu hay mẫu ngẫu nhiên Các kiểmđịnh quan trọng kiểmđịnh dạng phân phối thực nghiệm phù hợp chúng với phân phối lý thuyết Chương dành phần quan trọng cho việc kiểmđịnh phân phối thông dụng phân phối chuẩn, Poison, Đều, Mũ Trong vài trường hợp kiểmđịnh trình bày kỹ thuật, kiểmđịnh nhận từ phần mềm ứng dụng Có thể chia nội dung kiểmđịnhphithamsố thành hai phần, kiểmđịnh Khi bình phương kiểmđịnhphithamsố khác mà chủ yếu kiểmđịnh dựa hệ số tương quan hạng Một số thủ tục, tính toán cụ thể giới thiệu để người học tỡnh toỏn độc lập khơng cần đến trợ giúp phần mềm chuyên dụng Về phần mềm ứng dụng, chỳng tụi dành phần riêng để giới thiệu kiểmđịnhphithamsố SPSS, với sốkiểmđịnh khơng trình bày sở lý thuyết YấU CẦU Sau nghiờn cứu chương người học cần đạt số yêu cầu sau: - Phõn biệt rừ kiểmđịnhphithamsốkiểmđịnh giá trị thamsố biến ngẫu nhiên - Nắm cách thổng quát cách tiếp cận kiểmđịnh phù hợp phân phối thực nghiệm với công cụ kiểmđịnh Khi bỡnh phương - Nắm cách thức dùng kiểmđịnh dấu số toán cụ thể - Áp dụng thục kỹ kiểmđịnh dựa tiêu chuẩn Khi bỡnh phương - Nắm thuật toán kiểmđịnh dạng phân phối đặc biệt kiểmđịnh Jacque-Bera, Kolmogorov, Kolmogorov-Simirnov Cách thức sử dụng kỹ thuật SPSS - Cỏch hỡnh thành cỏc hệ số tương quan hạng sử dụng hệ số toán kiểmđịnh quan hệ khơng tuyến tính, phithamsố - Sử dụng thành thạo kiểmđịnh Winstata SPSS cú liờn quan Kiểmđịnhphithamsố thực hành Thống kê I kim nh bỡnh phng 1- Kiểmđịnh phù hợp qui luật thực nghiệm Kiểmđịnh Khi bình phương dùng phổ biến việc kiểmđịnh giả thuyết dạng phân phối Kiểmđịnh dựa sở đánh giá tổng bình phương khác biệt giá trị lý thuyết theo giả thuyết giá trị thực nghiệm tương ứng Để đưa giả thuyết dạng phân phối, người ta thường mơ tả phân tích sơ tượng, đặc điểm biến ngẫu nhiên thông qua số liệu quan sát Tuy vậy, nhiều trường hợp phân tích bị bỏ qua, nhận thức chủ quan hay kinh nghiệm người phân tích Thống kê Khi bình phương thiết lập mẫu kích thước n mơ tả tổng qt nhờ công thức sau: n χ2 = ∑ i =1 (Oi − E i ) Ei (5.1) Trong đó: Ei giá trị lý thuyết theo giả thuyết, Oi giá trị thực nghiệm tương ứng Cỏc giỏ trị Oi Ei tần số dấu hiệu giá trị thực biến ngẫu nhiên Trong kiểmđịnh cụ thể mô tả cụ thể cách chọn hai loại giá trị a- Kiểmđịnh giả thuyết phân phối Phân phối đoạn [a, b] phân phối liên tục, mà biến ngẫu nhiên tương ứng có khả nhận giá trị khác đoạn Đây trường hợp minh họa dễ dàng kiểmđịnh dạng phân phối biến ngẫu nhiên lien tục Đặc điểm thực tế quan sát nhận giá trị rời rạc, kiểmđịnh thực sở phân khoảng rời rạc hoá phân phối sau: Giả sử X nhận giá trị {x i} k khoảng thời gian có độ dài Nếu X phân phối theo thời gian giá trị X khoảng thời gian trung bình X (x* chẳng hạn) Thống kê bình phương tính theo cơng thức k χ2 = ∑ i =1 ( xi − x*) x* thống kê tuân theo qui luật Khi bình phương (k-1) bậc tự X phân phối Với mức ý nghĩa α cho trước, giả thuyết X phân phối bị bác bỏ giá trị quan sát lớn giá trị tới hạn χ2(k-1) mức α Thí dụ 1: Quan sát 12 tháng số lượng lương thực cung cấp cho hộ người ta nhận kết sau Thán 10 11 12 Kiểmđịnhphithamsố thực hành g SL Thống kê 25.0 32.0 33.0 28.0 19.0 31.0 27.0 28.0 17.0 18.0 21.0 20.0 Để tính giá trị thống kê Khi bình phương ta lập bảng sau: i xi x* xi -x* (xi-x*)2/x* 10 11 12 25.0 32.0 33.0 28.0 19.0 31.0 27.0 28.0 17.0 18.0 21.0 20.0 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 0.083 7.083 8.083 3.083 -5.917 6.083 2.083 3.083 -7.917 -6.917 -3.917 -4.917 0.00028 2.01366 2.62235 0.38155 1.40496 1.48523 0.17419 0.38155 2.51533 1.92001 0.61566 0.97018 TB 24.917 χ2qs= 14.48945 Tra bảng giá trị phân phối χ2 ta có: χ20.05 (11) = 19.675 So sánh với giá trị quan sát, ta thấy khơng có sở bác bỏ giả thuyết cho lượng lương thực cung cấp cho hộ đặn (phân phối theo thời gian) b- Kiểmđịnh giả thuyết cấu trúc tổng thể Giả thiết cấu trúc tổng thể theo dấu hiệu biến định tính hay khoảng biến định lượng, qui phân phối xác suất biến ngẫu nhiên rời rạc Có thể xem trường hợp tổng quát kiểmđịnh phân phối xác suất biến ngẫu nhiên rời rạc với việc sử dụng tiờu chuẩn Khi bỡnh phương để kiểmđịnh cấu trúc tổng thể Khơng tính tổng qt, mơ tả kiểmđịnh qua thí dụ cụ thể sau Thớ dụ 2: Giả sử mức sống cư dân vùng phân chia bậc sau: q nghèo, nghèo, trung bình, giàu Có người cho tỷ lệ dân cư mức sống tương ứng là: Mức sống nghèo nghèo Trung bình Khá Giàu Tỷ lệ (%) 12 25 40 20 Với mẫu ngẫu nhiên 1000 quan sát người ta thấy số cư dân có mức sống sau: Mức sống nghèo nghèo Trung bình Khá Giàu Số cư dân 135 280 440 100 45 Ta tính giá trị quan sát thống kê Khi bình phương nhờ bảng sau: Giá trị lý thuyết Giá trị quan sát (Oi -Ei)2/Ei (Ei) (Oi) 120 135 1.875 250 280 3.6 400 440 Kiểmđịnhphithamsố thực hành Thống kê 200 30 1000 Ta cú: χ qs= 66.975 Với mức ý nghĩa 5%, 100 50 45 7.5 1000 66.975 tra bảng phân phối Khi bình phương ta nhận được: χ20.05 (4) = 9.4877 Như đủ sở bác bỏ giả thuyết cấu trúc mức sống dân cư nói c- Kiểmđịnh giả thuyết phân phối Poison Phân phối Poison phân phối có nhiều ứng dụng thực tế, phân phối tượng “hiếm” Có nhiều cách nhận biết biến ngẫu nhiên X phân phối Poison, dựa vào tượng trung bình xấp xỉ phương sai; tính chất dòng biến cố theo thời gian Chúng ta nêu thủ tục, nhờ kiểm tra lại phân tích có tính định tính nhờ tiêu chuẩn Khi bình phương qua thí dụ cụ thể Thớ dụ 3: Quan sát số lần máy bay bay qua khơng phận A, người ta có số liệu (k nk) bảng tính tốn sau: Số lần (k) >=5 số phút (nk) 10 23 45 49 32 41 Pk (λ=2.965) 0.05156 0.152877 0.22664 0.223996 0.166037 0.17889 n’= nPk (n-n’)2/n’ 10.31209 30.57536 45.32797 44.79914 33.20736 35.77807 0.009445 1.876873 0.002373 0.393918 0.043898 0.762157 3.088665 200 200 Ta có: χ 0.05 (5) =11.07048, khơng đủ sở bác bỏ giả thuyết số máy lần máy bay qua không phân A phân phối Poison d- Kiểmđịnh giả thuyết phân phối chuẩn Phân phối chuẩn phân phối liên tục, thực hành nhận giá trị quan sát rời rạc Để kiểmđịnh giả thuyết phân phối chuẩn biến ngẫu nhiên X, người ta dựa tần số theo khoảng Thủ tục kiểmđịnh sau: Chia vựng giỏ trị quan sỏt thành k khoảng dạng (x i , xi+1); gọi ni số giỏ trị quan sỏt thuộc khoảng (xi , xi+1) k Kích thước mẫu n = ∑ ni i =1 Kiểmđịnhphithamsố thực hành Thống kª Tớnh giỏ trị trung bỡnh khoảng i: xi = x i + x i +1 k Tớnh giỏ trị trung bỡnh mẫu: x = ∑ nixi i =1 Tính giá trị phương sai mẫu theo giá trị trung tâm x i , từ tính độ lệch tiêu chuẩn mẫu s x −x zi = i s Chuẩn hóa khoảng ước lượng với giá trị biên là: , Tỡnh cỏc tần số lý thuyết: n i = nP(z i < Z < z i +1 ) với Z biến n.n phõn phối N(0,1) Tớnh giỏ trị quan sỏt thống kờ Khi bỡnh phương ( χqs ) So sỏnh với giỏ trị tới hạn χα (k − 1) kết luận Thớ dụ 4: Sau kiểmđịnh giả thuyết thu nhập ( X) viên chức vùng A phân phối chuẩn, (Z biến chuẩn hoá X) Khoảng Giá trị giá trị trung tâm (xi xi+1) x ( i) 570 580 575 580 590 585 590 600 595 600 610 605 610 620 615 620 630 625 Số người ni x i (ni) 20 142 310 370 128 30 11500 83070 184450 223850 78720 18750 x n ( i - x )2 i Zi Zi+1 ni’= nP(Zi = Test Value Total Cases Number of Runs Z Asymp Sig (2-tailed) 637 773 1410 684 -.830 406 Runs T est Test Valuea Total Cases Number of Runs Z Asymp Sig (2-tailed) O pera 1410 476 -.240 811 a User-specified a Mode Giá trị kiểmđịnh giá trị trung gian biến ưa thích nhạc Opera Kết không với nhạc đồng quê Châu Âu, xem kết sau: NPAR TESTS /RUNS(3)=country /MISSING ANALYSIS Runs T est Country Western Music Test Valuea Total Cases 1468 Number of Runs 627 Z -3.498 Asymp Sig (2-tailed) 000 a User-specified Giá trị Z cho thấy nhiều người thích nhạc đồng quê Châu Âu kết luận ny cú ý ngha thng kờ 30 Kiểmđịnhphithamsố thực hành Thống kê 4- Th tc K-S test Thủ tục sử dụng thống kê Kolmogorov- Simirnov kiểmđịnh dạng phân phối biến Khi dùng thủ tục ý đến tính chất biến để chọn giả thuyết Phân phối chuẩn, phân phối phân phối mũ phân phối liên tục Trong phân phỗi Poisson phân phối biến ngẫu nhiên rời rạc Tuy nhiên sử dụng phân phối cho biến ngẫu nhiên rời rạc trường hợp mở rộng Sau số thí dụ với GSS93 Khảo sát số xem ti vi ngày (biến tvhours), với giả thuyết qui luật phân phối xác suất biến NPAR TESTS /K-S(NORMAL)= tvhours /K-S(UNIFORM)= tvhours /MISSING ANALYSIS NPar Tests One-Sample Kolmogorov-Smirnov Test N Normal Parameters a,b Most Extreme Differences Mean Std Deviation Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Hours Per Day Watching TV 1489 2.90 2.24 201 201 -.160 7.773 000 a Test distribution is Normal b Calculated from data 31 Kiểmđịnhphithamsố thực hành Thống kê One-Sample Kolmogorov-Smirnov Test N Uniform Parameters a,b Most Extreme Differences Minimum Maximum Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Hours Per Day Watching TV 1489 24 701 701 -.004 27.049 000 a Test distribution is Uniform b Calculated from data Như số xem tivi ngày không phân phối không phân phối chuẩn 5- Kiểmđịnh độc lập hai mẫu (2 Independent samples) Kiểmđịnh dựa tiêu chuẩn (hay có lựa chọn) khác nhau, nhằm kiểm tra giả thuyết mẫu theo tiêu thức hai mẫu coi rút từ tổng thể - Tiêu chuẩn M-W (Mann- Whitney) trình bày - Tiêu chuẩn Moses (Moses extreme reaction)1: Tiêu chuẩn dựa việc kiểmđịnh tác động giá trị ngoại lai đến nhóm ảnh hưởng chúng đến tồn cho hai nhóm - Tiêu chuẩn K-S (Kolmogorov- Smirnov)2: Tiêu chuẩn vận dụng cách cố định phân phối nhóm áp dụng phân phối Kolmogorov nói cho nhóm thứ hai A nonparametric test designed to test hypotheses in which it is expected that the experimental variable will affect some subjects in one direction and other subjects in the opposite direction Tests for extreme responses compared to the control group Requires an ordinal scale of measurement This test focuses on the span of the control group, and is a measure of how much extreme values in the experimental group influence the span when combined with the control group A test of whether two samples (groups) come from the same distribution It is sensitive to any type of difference in the two distributions shape location, etc The test is based on the largest difference between the two cumulative distributions 32 Kiểmđịnhphithamsố thực hành Thống kª - Tiêu chuẩn W-W (Wald-Wolfowitz runs)3: Tiêu chuẩn kiểmđịnh độc lập hai mẫu sở tính đoạn mạnh tối thiểu tối đa Nhờ nhận kết luận rõ khả không độc lập hay độc lập mẫu Sau kiểmđịnh hai biến chldidel rincom91 theo biến sex NPAR TESTS /M-W= chldidel rincom91 BY sex(1 2) /MOSES= chldidel rincom91 BY sex(1 2) /K-S= chldidel rincom91 BY sex(1 2) /W-W= chldidel rincom91 BY sex(1 2) /STATISTICS= DESCRIPTIVES /MISSING ANALYSIS NPar Tests Mann-Whitney Test Ranks Ideal Number of Children Respondent's Income Respondent's Sex Male Female Total Male Female Total N 432 533 965 482 512 994 Mean Rank 472.22 491.74 Sum of Ranks 203998.00 262096.98 567.53 431.58 273548.50 220966.50 a Test St at ist ics Mann-Whitney U Wilcoxon W Z Asymp Sig (2-tailed) Ideal Number of Children 110470.000 203998.000 -1.209 227 Respond ent's Income 89638.500 220966.5 -7.474 000 a Grouping Variable: Respondent's Sex A nonparametric test of the hypothesis that two samples come from the same population Requires at least an ordinal scale of measurement The values of the observations from both samples are combined and ranked from smallest to largest Runs are sequences of values from the same group If the samples are from the same population, the two groups should be randomly scattered throughout the ranking 33 KiÓm địnhphithamsố thực hành Thống kê Moses Test Frequencies Respondent's Sex Male (Control) Female (Experimental) Total Male (Control) Female (Experimental) Total Ideal Number of Children Respondent's Income N 432 533 965 482 512 994 a,b Test St at ist ics Observed Control Group Span Sig (1-tailed) Trimmed Control Group Span Sig (1-tailed) Outliers Trimmed from each End Ideal Number of Children 933 000 585 000 Respond ent's Income 959 000 849 000 21 24 a Moses Test b Grouping Variable: Respondent's Sex Với biến số mong muốn, kiểmđịnh sử dụng giới nam làm tiêu chuẩn giới nữ làm đối tượng so sánh Với 933 quan sát kiểm tra quan sát lại tác động đến nhóm khác với mức ý nghĩa 0,000 Khi thu hẹp mẫu 585 quan sát mức ý nghĩa kiểmđịnh quan sát ngoại lai tác động đến nhóm khác Vậy xem số mong muốn nam nữ khác khơng thể bác bỏ vai trò quan sát ngoại lai (có số mong muốn cao thấp) Two-Sample Kolmogorov-Smirnov Test Frequencies Ideal Number of Children Respondent's Income Respondent's Sex Male Female Total Male Female Total N 432 533 965 482 512 994 34 Kiểmđịnhphithamsố thực hành Thống kê a Test St at ist ics Most Extreme Differences Ideal Number of Children 073 005 -.073 1.134 152 Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Respond ent's Income 220 220 -.023 3.462 000 a Grouping Variable: Respondent's Sex Wald-Wolfowitz Test Frequencies Ideal Number of Children Respondent's Income Respondent's Sex Male Female Total Male Female Total N 432 533 965 482 512 994 c,d Test St at ist ics Ideal Number of Children Respondent's Income Minimum Possible Maximum Possible Minimum Possible Maximum Possible Number of Runs 10a 861a 23b 751b Z -30.495 24.931 -30.146 16.101 Asymp Sig (1-tailed) 000 1.000 000 1.000 a There are inter-group ties involving 965 cases b There are 22 inter-group ties involving 994 cases c Wald-Wolfowitz Test d Grouping Variable: Respondent's Sex Kết luận từ kiểmđịnh dành cho người học 6- Kiểmđịnh k mẫu độc lập (k Independent samples) Thủ tục cho phép kiểmđịnh k mẫu, với giả thuyết mẫu rút từ tổng thể Hay biến theo yếu tố khác Tiêu chuẩn kiểmđịnh Kruskal-Wallis mở rộng Jonckheere-Terpstra Test4 Sau kiểmđịnhsố mong muốn theo tín ngưỡng NPAR TESTS /K-W=chldidel BY relig(1 5) /MEDIAN=chldidel BY relig(1 5) Tests whether k independent samples defined by a grouping variable are from the same population This test is appropriate for either continuous or ordered categorical data, and is more powerful than the Kruskal-Wallis test when the k populations are at the ordinal level of measurement 35 Kiểmđịnhphithamsố thực hành Thống kê /J-T=chldidel BY relig(1 5) /MISSING ANALYSIS Kruskal-Wallis Test Ranks Ideal Number of Children Religious Preference Protestant Catholic Jewish None Other Total N 622 210 21 90 18 961 Mean Rank 480.98 527.20 506.69 389.56 370.06 a,b Test St at ist ics Chi-Square df Asymp Sig Ideal Number of Children 23.274 000 a Kruskal Wallis Test b Grouping Variable: Religious Preference Median Test Frequencies Ideal Number of Children > Median Number of Children c Number of Children = Ideal Number of Children A nonparametric test for two related ordinal variables This test is an extension of the McNemar test from binary response to multinomial response It tests for changes in responses using the chi-square distribution It is useful for detecting changes in responses due to experimental intervention in before-and-after designs 37 Kiểmđịnhphithamsố thực hành Thống kê b Test St a t ist ics Ideal Number of Children Number of Children -12.576a 000 Z Asymp Sig (2-tailed) a Based on negative ranks b Wilcoxon Signed Ranks Test Kết luận từ hai biến không coi độc lập Kết nhận từ thủ tục: NPAR TEST /WILCOXON=childs WITH chldidel (PAIRED) /SIGN= childs WITH chldidel (PAIRED) /MH= childs WITH chldidel (PAIRED) /MISSING ANALYSIS Sign Test Frequencies N Ideal Number of Children - Number of Children Negative Differences a Positive Differences b Ties c Total 189 504 271 964 a Ideal Number of Children < Number of Children b Ideal Number of Children > Number of Children c Number of Children = Ideal Number of Children Marginal Homogeneit y Test a Test St at ist ics Z Asymp Sig (2-tailed) a Sign Test Ideal Number of Children Number of Children -11.928 000 Distinct Values Off-Diagonal Cases Observed MH Statistic Mean MH Statistic Std Deviation of MH Statistic Std MH Statistic Asymp Sig (2-tailed) Number of Children & Ideal Number of Children 1225 2010.000 1586.000 35.833 11.833 000 38 Kiểmđịnhphithamsố thực hành Thống kê Tt c cỏc kim định cho thấy, số thực tế số mong muốn có quan hệ tương quan với Tuy vậy, tính số thực tế theo số mong muốn không xác nhận Kiểmđịnh Mcnemar thường dùng kiểmđịnh biến theo kiểu “trước sau” Chẳng hạn tỷ lệ tiết kiệm từ thu nhập trước sau sách 8- Kiểmđịnh quan hệ k biến (k Relation samples) Thủ tục đơn kiểmđịnh cặp sởkiểmđịnh Friedman hay phân tích phương sai hai nhân tố (Xem chương phân tích phương sai), kiểmđịnh hạng Kendall kiểmđịnh dấu Cochran Riêng kiểmđịnh Cochran thực với biến nhị phân Thủ tục kiểmđịnh giả thuyết biến có phân phối xác xuất Với SPSS thủ tục thực nhờ hệ số Kendall's W, hệ số sử dụng trường hợp giả thuyết k mẫu rút từ tổng thể Vì vậy, kiểmđịnh tương đương kiểmđịnh k mẫu có phân phối xác suất Hệ số Kendall's W hệ số đo "hoà thuận" (hay nhất) hạng mẫu Sau kiểmđịnh phân phối xác suất nhiều biến trên, với GSS93 NPAR TESTS / FRIEDMAN = folk jazz opera rap /KENDALL = folk jazz opera rap /STATISTICS DESCRIPTIVES /MISSING LISTWISE NPar Tests Descript ive St at ist ics Folk Music Jazz Music Opera Rap Music N 1310 1310 1310 1310 Mean 2.77 2.63 3.49 3.96 Std Deviation 1.03 1.11 1.13 1.09 Minimum 1 1 Maximum 5 5 Friedman Test a T est St at ist ics Ranks Folk Music Jazz Music Opera Rap Music Mean Rank 2.05 1.91 2.82 3.23 N 1310 Chi-Square 1174.315 df Asymp Sig .000 a Friedman Test 39 KiÓm địnhphithamsố thực hành Thống kê Kt lun từ hai kiểmđịnh nhau: Sự ưa thích ba loại nhạc khơng phân phối (khơng có qui luật nhau) Việc sử dụng thủ tục kiểmđịnhphithamsố SPSS tương đối phức tạp Vì vậy, cần phải tìm hiểu đầy đủ điều kiện sử dụng kiểmđịnh kết luận từ kiểmđịnh 40 Kiểmđịnhphithamsố thực hành Thống kê Bài tập chương 1- Quan sát ngẫu nhiên, số sản phẩm A bán cửa hàng số ngày người ta có số liệu sau: (chọn mức ý nghĩa 5%) Lượng bán 40 60 80 100 120 140 160 180 Số ngày 22 46 42 42 18 11 12 đến 60 đến 80 đến 100 đến 120 đến 140 đến 160 đến 180 đến 200 a- Hãy cho biết lượng sản phẩm A bán ngày có phân phối chuẩn hay khơng b- Ước lượng khoảng tin cậy cho lượng sản phẩm bán trung bình/ngày Ước lượng có đáng tin cậy khơng? Cơ cấu doanh nghiệp theo loại hỡnh sở hữu (LHDN) Việt Nam năm 2008 sau: LHDN Tỷ lệ (%) LHDN Tỷ lệ (%) 0.43 0.53 0.12 0.27 1.02 7.13 21.63 10 11 12 13 14 0.03 49.50 15.50 1.16 2.18 0.22 0.28 Với mức ý nghĩa 5% cú thể xem cấu số doanh nghiệp theo loại hỡnh sở hữu (LHDN) tỉnh A khỏc cấu hay không từ quan sát mẫu có thơng tin tỉnh A sau: LHDN Số DN LHDN Số DN 32 34 14 118 456 324 2716 10 1612 11 139 12 123 13 33 14 30 Thực kiểmđịnh Wilcoxon (mức ý nghĩa 5%) điểm toán hai học kỳ liên tiếp sinh viên năm thứ với số liệu mẫu sau Kỳ Kỳ Kỳ Kỳ 8 5 8 4 4 9 5 7 41 Kiểmđịnhphithamsố thực hành Thống kê Quá trình kiểm tra chất lượng sản phẩm A tiến hành lặp nhờ chuyên gia độc lập, người ta cho khả sản phẩm bị loại (bị coi SP xấu) chuyên gia 10% Cho số liệu quan sát sau: (chọn mức ý nghĩa 10%) Số chuyên gia Số sản phẩm cho SP xấu 162 71 12 a- Hãy cho biết trình kiểm tra nói có phải q trình phân phối nhị thức hay không? b- Đặt vấn đề kiểmđịnh câu a có ý nghĩa nào? c- Hãy tạo tệp số liệu SPSS tiến hành kiểmđịnh để xác nhận kết câu a Quan sát số sản phẩm hỏng ca từ hai dây chuyền sản xuất, ca sản suất 100 sản phẩm Người ta thu số liệu sau: Dây chuyền A Dây chuyền B Số SP hỏng/ca Số ca SX Số SP hỏng/ca Số ca SX 6 7 10 11 9 10 a- Phải số sản phẩm hỏng ca dây chuyền phân phối b- Nếu xét số sản phẩm hỏng, xem hai dây chuyền hay khơng? Bảng sau thống kê tình trạng việc làm theo màu da Hãy cho biết với mức ý nghĩa 1%, tình trạng việc làm có độc lập với màu da hay không? Labor Force Status Racew of Respondent white black other Working fulltime 625 84 38 Working parttime 138 11 12 Temp not working 27 Unempl, laid off 35 Retired 206 21 School 36 Keeping house 163 30 Other 27 7 Phải với số liệu sau coi thu nhập hộ phân phi chun? 42 Kiểmđịnhphithamsố thực hành Thèng kª Thu nhập 5000-5999 6000-6999 7000-7999 8000-9999 10000-12499 12500-14999 15000-17499 17500-19999 20000-22499 22500-24999 25000-29999 30000-34999 35000-39999 40000-49999 số hộ 32 23 28 39 66 70 56 56 51 42 40 32 25 22 Sử dụng kiểm Mann-Whitney cho biết cú khỏc biệt tuổi thọ trung bỡnh nữ cỏc quốc gia thuộc hai khu vực A, B cú số liệu quan sỏt sau: 81 78 81 81 82 80 79 Khu vực A 79 80 81 78 81 81 80 80 79 79 81 79 80 82 Khu vực B 76 76 78 75 75 77 77 77 77 75 76 74 76 75 9*- Với tệp số liệu GSS93.sav, sử dụng kiểmđịnh đoạng mạch (Runs Test) đặc trưng trung tâm biến tvhours theo tiêu thức nông thôn- thành thị Với kết nhận nên chọn đặc trưng làm đặc trưng trung tâm biến 10*- Với tệp số liệu Hhexp98n.sav cho biết biến sau biến phân phối chuẩn (mức ý nghĩa 10%): a- Chi tiêu bình quân đầu người hộ tính theo giá hành (pcexp2) b- Chi tiêu lương thực thực phẩm bình quân người hộ điều chỉnh theo số giá vùng tháng(tháng giêng 1998=1) (rlpcfdex) 11*- Hãy thực lại yêu cầu số 10 với số liệu tỉnh (thành phố): Hà Nội, Khánh Hoà, Cần Thơ, Thái Bình Nêu nhận xét cụ thể từ kết (có so sánh với kết 10) 12*- Hãy kiểmđịnh giả thuyết độc lập biến quint98b theo biến reg7 tệp Hhexp98n.sav Nêu ý nghĩa kết kiểmđịnh 13*- Với tệp Hhexp98n.sav, kiểm tra nhận xét qui mô hộ vùng vùng xem 43 Kiểmđịnhphithamsố thực hành Thống kª 14- Thực lại tập 10* - 12* Winstata với tệp Hhexpn98.dta 15- Từ tệp Hhexpn98.dta (hoặc Hhexpn98.sav) tiến hành thủ tục để nhận bảng tiếp liên hai biến học số "năm đến trường chủ hộ" "Qui mô hộ" Với tệp số liệu có tần sốkiểmđịnh giả thuyết hai biến độc lập nhờ Winstata 16- Các kết sau cho kết luận c One-Sample Kolmogorov-Smirnov Test N Normal Parameters a,b Most Extreme Differences Mean Std Deviation Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Value rice expenditur es 859 2568.8994 1061.5135 043 043 -.024 1.264 082 a Test distribution is Normal b Calculated from data c Code by regions = c One-Sample Kolmogorov-Smirnov Test N Normal Parameters a,b Most Extreme Differences Mean Std Deviation Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Value rice expenditur es 1175 1924.5695 928.7427 052 052 -.037 1.774 004 a Test distribution is Normal b Calculated from data c Code by regions = 17*- Nhờ kiểmđịnh Khi bình phương kết luận nhận xét: " Khơng có vùng vùng có mức chi tiêu theo cấu chia mức chi tiêu nước " Hãy chia lại mức chi tiêu thành mức theo ngũ phân vị cho vùng kiểm tra lại ý kiến lần 44 ... thêm kiểm định iV- Winstata với kiểm định phi tham số Winstata cung cấp lớp thủ tục kiểm định phi tham số phong phú không tiện lợi Sau xem xét thủ tục với tệp số liệu Hhexpn98.dta 1- Các kiểm định. .. =0.2191 ASE= 0.010 Các kiểm định cho kết luận chung cấp chủ hộ phân loại chi tiêu không độc lập V- SPSS với kiểm định phi tham số SPSS cung cấp nhiều kiểm định phi tham số, số kiểm định thực thủ tục... mức tới hạn χ α (k − 1) Các kiểm định phi tham số giới thiệu chương phận nhỏ phương pháp kiểm định phi tham số Chúng ta tìm thấy thủ tục kiểm định mở rộng kiểm định trên, cho nhiều biến, nhiều