Chuong 5 kiem dinh phi tham so

43 1.7K 2
Chuong 5 kiem dinh phi tham so

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh Chương Kiểm định phi tham số NỘI DUNG Chương dành riêng cho kiểm định phi tham số, kiểm định thường tiến hành để xác định tính chất tổng thể thông qua số liệu hay mẫu ngẫu nhiên Các kiểm định quan trọng kiểm định dạng phân phối thực nghiệm phù hợp chúng với phân phối lý thuyết Chương dành phần quan trọng cho việc kiểm định phân phối thông dụng phân phối chuẩn, Poison, Đều, Mũ Trong vài trường hợp kiểm định trình bày kỹ thuật, kiểm định nhận từ phần mềm ứng dụng Có thể chia nội dung kiểm định phi tham số thành hai phần, kiểm định Khi bình phương kiểm định phi tham số khác mà chủ yếu kiểm định dựa hệ số tương quan hạng Một số thủ tục, tính toán cụ thể giới thiệu để người học tỡnh toỏn độc lập không cần đến trợ giúp phần mềm chuyên dụng Về phần mềm ứng dụng, chỳng tụi dành phần riêng để giới thiệu kiểm định phi tham số SPSS, với số kiểm định không trình bày sở lý thuyết YấU CẦU Sau nghiờn cứu chương người học cần đạt số yêu cầu sau: - Phõn biệt rừ kiểm định phi tham số kiểm định giá trị tham số biến ngẫu nhiên - Nắm cách thổng quát cách tiếp cận kiểm định phù hợp phân phối thực nghiệm với công cụ kiểm định Khi bỡnh phương - Nắm cách thức dùng kiểm định dấu số toán cụ thể - Áp dụng thục kỹ kiểm định dựa tiêu chuẩn Khi bỡnh phương - Nắm thuật toán kiểm định dạng phân phối đặc biệt kiểm định Jacque-Bera, Kolmogorov, Kolmogorov-Simirnov Cách thức sử dụng kỹ thuật SPSS - Cỏch hỡnh thành cỏc hệ số tương quan hạng sử dụng hệ số toán kiểm định quan hệ không tuyến tính, phi tham số - Sử dụng thành thạo kiểm định Winstata SPSS có liên quan KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh I kiểm định bình phương 1- Kiểm định phù hợp qui luật thực nghiệm Kiểm định Khi bình phương dùng phổ biến việc kiểm định giả thuyết dạng phân phối Kiểm định dựa sở đánh giá tổng bình phương khác biệt giá trị lý thuyết theo giả thuyết giá trị thực nghiệm tương ứng Để đưa giả thuyết dạng phân phối, người ta thường mô tả phân tích sơ tượng, đặc điểm biến ngẫu nhiên thông qua số liệu quan sát Tuy vậy, nhiều trường hợp phân tích bị bỏ qua, nhận thức chủ quan hay kinh nghiệm người phân tích Thống kê Khi bình phương thiết lập mẫu kích thước n mô tả tổng quát nhờ công thức sau: n χ2 = ∑ i =1 (Oi − E i ) Ei (5.1) Trong đó: Ei giá trị lý thuyết theo giả thuyết, O i giá trị thực nghiệm tương ứng Cỏc giỏ trị Oi Ei tần số dấu hiệu giá trị thực biến ngẫu nhiên Trong kiểm định cụ thể mô tả cụ thể cách chọn hai loại giá trị a- Kiểm định giả thuyết phân phối Phân phối đoạn [a, b] phân phối liên tục, mà biến ngẫu nhiên tương ứng có khả nhận giá trị khác đoạn Đây trường hợp minh họa dễ dàng kiểm định dạng phân phối biến ngẫu nhiên lien tục Đặc điểm thực tế quan sát nhận giá trị rời rạc, kiểm định thực sở phân khoảng rời rạc hoá phân phối sau: Giả sử X nhận giá trị {x i} k khoảng thời gian có độ dài Nếu X phân phối theo thời gian giá trị X khoảng thời gian trung bình X (x* chẳng hạn) Thống kê bình phương tính theo công thức k χ2 = ∑ i =1 ( xi − x*) x* thống kê tuân theo qui luật Khi bình phương (k-1) bậc tự X phân phối Với mức ý nghĩa α cho trước, giả thuyết X phân phối bị bác bỏ giá trị quan sát lớn giá trị tới hạn χ2(k-1) mức α Thí dụ 1: Quan sát 12 tháng số lượng lương thực cung cấp cho hộ người ta nhận kết sau Thán g 10 11 12 KiÓm ®Þnh phi tham sè SL Thèng kª thùc hµnh 25.0 32.0 33.0 28.0 19.0 31.0 27.0 28.0 17.0 18.0 21.0 20.0 Để tính giá trị thống kê Khi bình phương ta lập bảng sau: i xi x* xi -x* (xi-x*)2/x* 10 11 12 25.0 32.0 33.0 28.0 19.0 31.0 27.0 28.0 17.0 18.0 21.0 20.0 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 24.917 0.083 7.083 8.083 3.083 -5.917 6.083 2.083 3.083 -7.917 -6.917 -3.917 -4.917 0.00028 2.01366 2.62235 0.38155 1.40496 1.48523 0.17419 0.38155 2.51533 1.92001 0.61566 0.97018 TB 24.917 χ2qs= 14.48945 Tra bảng giá trị phân phối χ2 ta có: χ20.05 (11) = 19.675 So sánh với giá trị quan sát, ta thấy sở bác bỏ giả thuyết cho lượng lương thực cung cấp cho hộ đặn (phân phối theo thời gian) b- Kiểm định giả thuyết cấu trúc tổng thể Giả thiết cấu trúc tổng thể theo dấu hiệu biến định tính hay khoảng biến định lượng, qui phân phối xác suất biến ngẫu nhiên rời rạc Có thể xem trường hợp tổng quát kiểm định phân phối xác suất biến ngẫu nhiên rời rạc với việc sử dụng tiờu chuẩn Khi bỡnh phương để kiểm định cấu trúc tổng thể Không tính tổng quát, mô tả kiểm định qua thí dụ cụ thể sau Thớ dụ 2: Giả sử mức sống cư dân vùng phân chia bậc sau: nghèo, nghèo, trung bình, giàu Có người cho tỷ lệ dân cư mức sống tương ứng là: Mức sống nghèo nghèo Trung bình Khá Giàu Tỷ lệ (%) 12 25 40 20 Với mẫu ngẫu nhiên 1000 quan sát người ta thấy số cư dân có mức sống sau: Mức sống nghèo nghèo Trung bình Khá Giàu Số cư dân 135 280 440 100 45 Ta tính giá trị quan sát thống kê Khi bình phương nhờ bảng sau: Giá trị lý thuyết Giá trị quan sát (Oi -Ei)2/Ei (Ei) (Oi) 120 135 1.875 250 280 3.6 400 440 200 100 50 30 45 7.5 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh 1000 1000 66.975 Ta có: χ 2qs= 66.975 Với mức ý nghĩa 5%, tra bảng phân phối Khi bình phương ta nhận được: χ20.05 (4) = 9.4877 Như đủ sở bác bỏ giả thuyết cấu trúc mức sống dân cư nói c- Kiểm định giả thuyết phân phối Poison Phân phối Poison phân phối có nhiều ứng dụng thực tế, phân phối tượng “hiếm” Có nhiều cách nhận biết biến ngẫu nhiên X phân phối Poison, dựa vào tượng trung bình xấp xỉ phương sai; tính chất dòng biến cố theo thời gian Chúng ta nêu thủ tục, nhờ kiểm tra lại phân tích có tính định tính nhờ tiêu chuẩn Khi bình phương qua thí dụ cụ thể Thớ dụ 3: Quan sát số lần máy bay bay qua không phận A, người ta có số liệu (k nk) bảng tính toán sau: Số lần (k) >=5 số phút (nk) 10 23 45 49 32 41 Pk (λ=2.965) 0.05156 0.152877 0.22664 0.223996 0.166037 0.17889 n’= nPk (n-n’)2/n’ 10.31209 30.57536 45.32797 44.79914 33.20736 35.77807 0.009445 1.876873 0.002373 0.393918 0.043898 0.762157 3.088665 200 200 Ta có: χ20.05 (5) =11.07048, không đủ sở bác bỏ giả thuyết số máy lần máy bay qua không phân A phân phối Poison d- Kiểm định giả thuyết phân phối chuẩn Phân phối chuẩn phân phối liên tục, thực hành nhận giá trị quan sát rời rạc Để kiểm định giả thuyết phân phối chuẩn biến ngẫu nhiên X, người ta dựa tần số theo khoảng Thủ tục kiểm định sau: Chia vựng giỏ trị quan sỏt thành k khoảng dạng (x i , xi+1); gọi ni số giỏ trị quan sỏt thuộc khoảng (xi , xi+1) k Kích thước mẫu n = ∑ ni i =1 Tớnh giỏ trị trung bỡnh khoảng i: xi = x i + x i +1 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh k Tớnh giỏ trị trung bỡnh mẫu: x = ∑ ni xi i =1 Tính giá trị phương sai mẫu theo giá trị trung tâm x i , từ tính độ lệch tiêu chuẩn mẫu s x −x zi = i s Chuẩn hóa khoảng ước lượng với giá trị biên là: , Tỡnh cỏc tần số lý thuyết: n i = nP(z i < Z < z i +1 ) với Z biến n.n phõn phối N(0,1) Tớnh giỏ trị quan sỏt thống kờ Khi bỡnh phương ( χqs ) So sỏnh với giỏ trị tới hạn χα (k − 1) kết luận Thớ dụ 4: Sau kiểm định giả thuyết thu nhập ( X) viên chức vùng A phân phối chuẩn, (Z biến chuẩn hoá X) Khoảng Giá trị giá trị trung tâm (xi xi+1) x ( i) 570 580 575 580 590 585 590 600 595 600 610 605 610 620 615 620 630 625 Số người ni x i (ni) 20 142 310 370 128 30 x n ( i - x )2 i 11500 83070 184450 223850 78720 18750 Zi Zi+1 ni’= nP(Zi = Test Value Total Cases Number of Runs Z Asymp Sig (2- tailed) 637 773 1410 684 - 830 406 Runs T est Test Valuea Total Cases Number of Runs Z Asymp Sig (2- tailed) O pera 1410 476 - 240 811 a User- specified a Mode Giá trị kiểm định giá trị trung gian biến ưa thích nhạc Opera Kết không với nhạc đồng quê Châu Âu, xem kết sau: NPAR TESTS /RUNS(3)=country /MISSING ANALYSIS Runs T est Country Western Music a Test Value Total Cases 1468 Number of Runs 627 Z - 3.498 Asymp Sig (2- tailed) 000 a User- specified Giá trị Z cho thấy nhiều người thích nhạc đồng quê Châu Âu kết luận có ý nghĩa thống kê 4- Thủ tục K-S test Thủ tục sử dụng thống kê Kolmogorov- Simirnov kiểm định dạng phân phối biến Khi dùng thủ tục ý đến tính chất biến để chọn giả thuyết Phân phối chuẩn, phân phối phân phối mũ phân phối liên tục Trong phân phỗi Poisson phân phối biến ngẫu nhiên rời rạc Tuy nhiên sử dụng phân phối cho biến ngẫu nhiên rời rạc trường hợp mở rộng Sau số thí dụ với GSS93 Khảo sát số xem ti vi ngày (biến tvhours), với giả thuyết qui luật phân phối xác suất biến NPAR TESTS /K-S(NORMAL)= tvhours 30 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh /K-S(UNIFORM)= tvhours /MISSING ANALYSIS NPar Tests One-Sample Kolmogorov-Smirnov T est N Normal Parameters a,b Most Extreme Differences Mean Std Deviation Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Hours Per Day Watching TV 1489 2.90 2.24 201 201 -.160 7.773 000 a Test distribution is Normal b Calculated from data One-Sample Kolmogorov-Smirnov Test N Uniform Parameters a,b Most Extreme Differences Minimum Maximum Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Hours Per Day Watching TV 1489 24 701 701 -.004 27.049 000 a Test distribution is Uniform b Calculated from data Như số xem tivi ngày không phân phối không phân phối chuẩn 5- Kiểm định độc lập hai mẫu (2 Independent samples) Kiểm định dựa tiêu chuẩn (hay có lựa chọn) khác nhau, nhằm kiểm tra giả thuyết mẫu theo tiêu thức hai mẫu coi rút từ tổng thể - Tiêu chuẩn M-W (Mann- Whitney) trình bày - Tiêu chuẩn Moses (Moses extreme reaction)1: Tiêu chuẩn dựa việc kiểm định A nonparametric test designed to test hypotheses in which it is expected that the experimental variable will affect some subjects in one direction and other subjects in the opposite direction Tests for extreme responses compared to the control group Requires an ordinal scale of measurement 31 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh tác động giá trị ngoại lai đến nhóm ảnh hưởng chúng đến toàn cho hai nhóm - Tiêu chuẩn K-S (Kolmogorov- Smirnov)2: Tiêu chuẩn vận dụng cách cố định phân phối nhóm áp dụng phân phối Kolmogorov nói cho nhóm thứ hai - Tiêu chuẩn W-W (Wald-Wolfowitz runs)3: Tiêu chuẩn kiểm định độc lập hai mẫu sở tính đoạn mạnh tối thiểu tối đa Nhờ nhận kết luận rõ khả không độc lập hay độc lập mẫu Sau kiểm định hai biến chldidel rincom91 theo biến sex NPAR TESTS /M-W= chldidel rincom91 BY sex(1 2) /MOSES= chldidel rincom91 BY sex(1 2) /K-S= chldidel rincom91 BY sex(1 2) /W-W= chldidel rincom91 BY sex(1 2) /STATISTICS= DESCRIPTIVES /MISSING ANALYSIS NPar Tests Mann-Whitney Test This test focuses on the span of the control group, and is a measure of how much extreme values in the experimental group influence the span when combined with the control group A test of whether two samples (groups) come from the same distribution It is sensitive to any type of difference in the two distributions shape location, etc The test is based on the largest difference between the two cumulative distributions A nonparametric test of the hypothesis that two samples come from the same population Requires at least an ordinal scale of measurement The values of the observations from both samples are combined and ranked from smallest to largest Runs are sequences of values from the same group If the samples are from the same population, the two groups should be randomly scattered throughout the ranking 32 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh Ranks Ideal Number of Children Respondent's Income Respondent's Sex Male Female Total Male Female Total Mean Sum of Rank Ranks 472.22 203998.00 491.74 262096.98 N 432 533 965 482 512 994 567.53 273548.50 431.58 220966.50 a T est St at ist ics Ideal Number of Children Mann-Whitney U 110470.000 Wilcoxon W 203998.000 Z -1.209 Asymp Sig (2-tailed) 227 Respond ent's Income 89638.500 220966.5 -7.474 000 a Grouping Variable: Respondent's Sex Moses Test Frequencies Ideal Number of Children Respondent's Income Respondent's Sex Male (Control) Female (Experimental) Total Male (Control) Female (Experimental) Total N 432 533 965 482 512 994 a,b T est St at ist ics Observed Control Group Span Trimmed Control Group Span Sig (1-tailed) Sig (1-tailed) Outliers Trimmed from each End Ideal Number of Children 933 000 585 000 Respond ent's Income 959 000 849 000 21 24 a Moses Test b Grouping Variable: Respondent's Sex Với biến số mong muốn, kiểm định sử dụng giới nam làm tiêu chuẩn giới nữ làm đối tượng so sánh Với 933 quan sát kiểm tra quan sát lại tác động đến nhóm khác với mức ý nghĩa 0,000 Khi thu hẹp mẫu 585 quan sát mức ý nghĩa kiểm định quan sát ngoại lai tác động đến nhóm khác Vậy xem số mong muốn nam nữ khác 33 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh bác bỏ vai trò quan sát ngoại lai (có số mong muốn cao thấp) Two-Sample Kolmogorov-Smirnov Test Frequencie s Ideal Number of Children Respondent's Income Respondent's Sex Male Female Total Male Female Total N 432 533 965 482 512 994 a T est St at ist ics Most Extreme Differences Ideal Number of Children 073 005 -.073 1.134 152 Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Respond ent's Income 220 220 -.023 3.462 000 a Grouping Variable: Respondent's Sex Wald-Wolfowitz Test Frequencies Ideal Number of Children Respondent's Income Respondent's Sex Male Female Total Male Female Total N 432 533 965 482 512 994 c,d Test St at ist ics Ideal Number of Children Respondent's Income Minimum Possible Maximum Possible Minimum Possible Maximum Possible Number of Runs 10 a 861a 23b 751b Z -30.495 24.931 -30.146 16.101 Asymp Sig (1-tailed) 000 1.000 000 1.000 a There are inter-group ties involving 965 cases b There are 22 inter-group ties involving 994 cases c Wald-Wolfowitz Test d Grouping Variable: Respondent's Sex Kết luận từ kiểm định dành cho người học 34 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh 6- Kiểm định k mẫu độc lập (k Independent samples) Thủ tục cho phép kiểm định k mẫu, với giả thuyết mẫu rút từ tổng thể Hay biến theo yếu tố khác Tiêu chuẩn kiểm định Kruskal-Wallis mở rộng Jonckheere-Terpstra Test4 Sau kiểm định số mong muốn theo tín ngưỡng NPAR TESTS /K-W=chldidel BY relig(1 5) /MEDIAN=chldidel BY relig(1 5) /J-T=chldidel BY relig(1 5) /MISSING ANALYSIS Kruskal-Wallis Test Ranks Ideal Number of Children Religious Preference Protestant Catholic Jewish None Other Total N 622 210 21 90 18 961 Mean Rank 480.98 527.20 506.69 389.56 370.06 a,b T est St at ist ics Chi-Square df Asymp Sig Ideal Number of Children 23.274 000 a Kruskal Wallis Test b Grouping Variable: Religious Preference Median Test Frequencies Ideal Number of Children > Median Number of Children c Number of Children = Ideal Number of Children b T e st St at ist ics Z Asymp Sig (2-tailed) Ideal Number of Children Number of Children -12.576a 00 a Based on negative ranks b Wilcoxon Signed Ranks Test Kết luận từ hai biến không coi độc lập Kết nhận từ thủ tục: NPAR TEST /WILCOXON=childs WITH chldidel (PAIRED) /SIGN= childs WITH chldidel (PAIRED) /MH= childs WITH chldidel (PAIRED) /MISSING ANALYSIS Sign Test Frequencies N Ideal Number of Children - Number of Children Negative Differencesa Positive Differences b Tiesc Total 189 504 271 964 a Ideal Number of Children < Number of Children b Ideal Number of Children > Number of Children c Number of Children = Ideal Number of Children 37 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh Marginal Homogeneit y T est a T est St at ist ics Z Asymp Sig (2-tailed) Ideal Number of Children Number of Children -11.928 0 a Sign Test Distinct Values Off-Diagonal Cases Observed MH Statistic Mean MH Statistic Std Deviation of MH Statistic Std MH Statistic Asymp Sig (2-tailed) Number of Children & Ideal Number of Children 1225 20 10.0 00 1586.0 00 35.833 11.833 0 Tất kiểm định cho thấy, số thực tế số mong muốn có quan hệ tương quan với Tuy vậy, tính số thực tế theo số mong muốn không xác nhận Kiểm định Mcnemar thường dùng kiểm định biến theo kiểu “trước sau” Chẳng hạn tỷ lệ tiết kiệm từ thu nhập trước sau sách 8- Kiểm định quan hệ k biến (k Relation samples) Thủ tục đơn kiểm định cặp sở kiểm định Friedman hay phân tích phương sai hai nhân tố (Xem chương phân tích phương sai), kiểm định hạng Kendall kiểm định dấu Cochran Riêng kiểm định Cochran thực với biến nhị phân Thủ tục kiểm định giả thuyết biến có phân phối xác xuất Với SPSS thủ tục thực nhờ hệ số Kendall's W, hệ số sử dụng trường hợp giả thuyết k mẫu rút từ tổng thể Vì vậy, kiểm định tương đương kiểm định k mẫu có phân phối xác suất Hệ số Kendall's W hệ số đo "hoà thuận" (hay nhất) hạng mẫu Sau kiểm định phân phối xác suất nhiều biến trên, với GSS93 NPAR TESTS / FRIEDMAN = folk jazz opera rap /KENDALL = folk jazz opera rap /STATISTICS DESCRIPTIVES /MISSING LISTWISE NPar Tests 38 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh Descript ive St at ist ics Folk Music Jazz Music Opera Rap Music N 1310 1310 1310 1310 Mean 2.77 2.63 3.49 3.96 Std Deviation 1.03 1.11 1.13 1.09 Minimum 1 1 Maximum 5 5 Friedman Test a T est St at ist ics Ranks Folk Music Jazz Music Opera Rap Music Mean Rank 2.05 1.91 2.82 3.23 N 1310 Chi- Square 1174.315 df Asymp Sig .000 a Friedman Test Kết luận từ hai kiểm định nhau: Sự ưa thích ba loại nhạc không phân phối (không có qui luật nhau) Việc sử dụng thủ tục kiểm định phi tham số SPSS tương đối phức tạp Vì vậy, cần phải tìm hiểu đầy đủ điều kiện sử dụng kiểm định kết luận từ kiểm định 39 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh Bài tập chương 1- Quan sát ngẫu nhiên, số sản phẩm A bán cửa hàng số ngày người ta có số liệu sau: (chọn mức ý nghĩa 5%) Lượng bán 40 60 80 100 120 140 160 180 Số ngày 22 46 42 42 18 11 12 đến 60 đến 80 đến 100 đến 120 đến 140 đến 160 đến 180 đến 200 a- Hãy cho biết lượng sản phẩm A bán ngày có phân phối chuẩn hay không b- Ước lượng khoảng tin cậy cho lượng sản phẩm bán trung bình/ngày Ước lượng có đáng tin cậy không? Cơ cấu doanh nghiệp theo loại hỡnh sở hữu (LHDN) Việt Nam năm 2008 sau: LHDN Tỷ lệ (%) LHDN Tỷ lệ (%) 0.43 0.53 0.12 0.27 1.02 7.13 21.63 10 11 12 13 14 0.03 49.50 15.50 1.16 2.18 0.22 0.28 Với mức ý nghĩa 5% cú thể xem cấu số doanh nghiệp theo loại hỡnh sở hữu (LHDN) tỉnh A khỏc cấu hay không từ quan sát mẫu có thông tin tỉnh A sau: LHDN Số DN LHDN Số DN 32 34 14 118 456 324 2716 10 1612 11 139 12 123 13 33 14 30 Thực kiểm định Wilcoxon (mức ý nghĩa 5%) điểm toán hai học kỳ liên tiếp sinh viên năm thứ với số liệu mẫu sau Kỳ Kỳ Kỳ Kỳ 8 5 8 4 4 9 5 7 40 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh Quá trình kiểm tra chất lượng sản phẩm A tiến hành lặp nhờ chuyên gia độc lập, người ta cho khả sản phẩm bị loại (bị coi SP xấu) chuyên gia 10% Cho số liệu quan sát sau: (chọn mức ý nghĩa 10%) Số chuyên gia Số sản phẩm cho SP xấu 162 71 12 a- Hãy cho biết trình kiểm tra nói có phải trình phân phối nhị thức hay không? b- Đặt vấn đề kiểm định câu a có ý nghĩa nào? c- Hãy tạo tệp số liệu SPSS tiến hành kiểm định để xác nhận kết câu a Quan sát số sản phẩm hỏng ca từ hai dây chuyền sản xuất, ca sản suất 100 sản phẩm Người ta thu số liệu sau: Dây chuyền A Dây chuyền B Số SP hỏng/ca Số ca SX Số SP hỏng/ca Số ca SX 6 7 10 11 9 10 a- Phải số sản phẩm hỏng ca dây chuyền phân phối b- Nếu xét số sản phẩm hỏng, xem hai dây chuyền hay không? Bảng sau thống kê tình trạng việc làm theo màu da Hãy cho biết với mức ý nghĩa 1%, tình trạng việc làm có độc lập với màu da hay không? Labor Force Status Working fulltime Working parttime Temp not working Unempl, laid off Retired School Keeping house Other Racew of Respondent white 625 138 27 35 206 36 163 27 black 84 11 21 30 other 38 12 4 7 Phải với số liệu sau coi thu nhập hộ phân phối chuẩn? Thu nhập 5000-5999 6000-6999 số hộ 32 23 41 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh 7000-7999 8000-9999 10000-12499 12500-14999 15000-17499 17500-19999 20000-22499 22500-24999 25000-29999 30000-34999 35000-39999 40000-49999 28 39 66 70 56 56 51 42 40 32 25 22 Sử dụng kiểm Mann-Whitney cho biết cú khỏc biệt tuổi thọ trung bỡnh nữ cỏc quốc gia thuộc hai khu vực A, B cú số liệu quan sỏt sau: 81 78 81 81 82 80 79 Khu vực A 79 80 81 78 81 81 80 80 79 79 81 79 80 82 Khu vực B 76 76 78 75 75 77 77 77 77 75 76 74 76 75 9*- Với tệp số liệu GSS93.sav, sử dụng kiểm định đoạng mạch (Runs Test) đặc trưng trung tâm biến tvhours theo tiêu thức nông thôn- thành thị Với kết nhận nên chọn đặc trưng làm đặc trưng trung tâm biến 10*- Với tệp số liệu Hhexp98n.sav cho biết biến sau biến phân phối chuẩn (mức ý nghĩa 10%): a- Chi tiêu bình quân đầu người hộ tính theo giá hành (pcexp2) b- Chi tiêu lương thực thực phẩm bình quân người hộ điều chỉnh theo số giá vùng tháng(tháng giêng 1998=1) (rlpcfdex) 11*- Hãy thực lại yêu cầu số 10 với số liệu tỉnh (thành phố): Hà Nội, Khánh Hoà, Cần Thơ, Thái Bình Nêu nhận xét cụ thể từ kết (có so sánh với kết 10) 12*- Hãy kiểm định giả thuyết độc lập biến quint98b theo biến reg7 tệp Hhexp98n.sav Nêu ý nghĩa kết kiểm định 13*- Với tệp Hhexp98n.sav, kiểm tra nhận xét qui mô hộ vùng vùng xem 14- Thực lại tập 10* - 12* Winstata với tệp Hhexpn98.dta 42 KiÓm ®Þnh phi tham sè Thèng kª thùc hµnh 15- Từ tệp Hhexpn98.dta (hoặc Hhexpn98.sav) tiến hành thủ tục để nhận bảng tiếp liên hai biến học số "năm đến trường chủ hộ" "Qui mô hộ" Với tệp số liệu có tần số kiểm định giả thuyết hai biến độc lập nhờ Winstata 16- Các kết sau cho kết luận c One-Sample Kolmogorov-Smirnov T est N Normal Parameters a,b Most Extreme Differences Mean Std Deviation Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Value rice expenditur es 859 2568.8994 1061.5135 043 043 -.024 1.264 082 a Test distribution is Normal b Calculated from data c Code by regions = c One-Sample Kolmogorov-Smirnov T est N Normal Parameters a,b Most Extreme Differences Mean Std Deviation Absolute Positive Negative Kolmogorov-Smirnov Z Asymp Sig (2-tailed) Value rice expenditur es 1175 1924.5695 928.7427 052 052 -.037 1.774 004 a Test distribution is Normal b Calculated from data c Code by regions = 17*- Nhờ kiểm định Khi bình phương kết luận nhận xét: " Không có vùng vùng có mức chi tiêu theo cấu chia mức chi tiêu nước " Hãy chia lại mức chi tiêu thành mức theo ngũ phân vị cho vùng kiểm tra lại ý kiến lần 43 ... xi+1) x ( i) 57 0 58 0 57 5 58 0 59 0 58 5 59 0 600 59 5 600 610 6 05 610 620 6 15 620 630 6 25 Số người ni x i (ni) 20 142 310 370 128 30 x n ( i - x )2 i 1 150 0 83070 184 450 223 850 78720 18 750 Zi Zi+1 ni’=... 14 18 18 4 14 25 4 22 18 14 9 22 24 14 20 10 10 10 -1 10 10 -6 10 -6 10 10 15 10 -6 10 -6 10 12 20 ,5 -2 ,5 20 ,5 -6 ,5 20 ,5 -11 ,5 20 ,5 -11 ,5 20 ,5 1 ,5 20 ,5 3 ,5 24 ,5 -10 ,5 24 ,5 -4 ,5 Sum (d i)= Hệ... 2644,47 5 5 3 Thèng kª thùc hµnh 8970,6 11299 ,5 73 25, 61 12226,4 12287,1 12333,6 751 8,33 755 9,07 1 057 7,88 20117916 255 357 40 17888187 29896971 3019 456 5 3042 353 8 18841762 1904 651 3 27972886 0 ,58 23 0,6 456

Ngày đăng: 17/03/2017, 23:14

Từ khóa liên quan

Mục lục

  • Chương 5

  • Kiểm định phi tham số

    • I. kiểm định khi bình phương

      • 1- Kiểm định sự phù hợp của qui luật thực nghiệm

        • a- Kiểm định giả thuyết về phân phối đều

        • b- Kiểm định giả thuyết về cấu trúc tổng thể

        • c- Kiểm định giả thuyết về phân phối Poison

        • d- Kiểm định giả thuyết về phân phối chuẩn

        • 2- Kiểm định tính độc lập của hai dấu hiệu

        • 3. Kiểm định dấu (sign test)

          • a- Kiểm định giá trị trung vị

          • b- Kiểm định giá trị xác suất

          • c- Kiểm định tính ngẫu nhiên của mẫu- Kiểm định các đoạn mạch (Runs test)

          • Xắp xếp dấu phần dư et nhận được từ hồi qui Y=a+bX theo chiều tăng của X người ta nhận được 24 đoạn mạch với 42 dấu "+" và 64 dấu "-". Có thể kiểm định tự tương quan trong mô hình trên nhờ kiểm định tính ngẫu nhiên về dấu của các phần dư như sau:

          • II. MỘT SỐ KIỂM ĐỊNH DẠNG PHÂN PHỐI THÔNG DỤNG

            • Phần này giới thiệu một số thủ tục kiểm định dạng phân phối của biến ngẫu nhiên 1 chiều. Các thủ tục kiểm định được trỡnh bày ở đây tập trung cho một số dạng phân phối như: Phân phối đều; Phân phối Poison; Phân phối mũ và đựac biệt chú trọng đến phân phối chuẩn.

            • 1- Tiêu chuẩn Kolmogorov

            • 2- Tiêu chuẩn Jacque- Bera

            • Thớ dụ 10: Mức xăng tiêu hao cho mỗi km đường đi trên mỗi xi lanh xe du lịch là biến ngẫu nhiên X. Với 397 quan sát người ta tính được Skew(x)=0,21 và Kurt(x)=-1,197. Phải chăng X phân phối chuẩn.

            • Tiờu chuẩn Kolmogorov-Simirnov cú thể dựng để kiểm định giả thuyết một biến ngẫu nhiên X phân phối Chuẩn, đều, Poisson hay phõn phối mũ.

            • Cú thể túm tắt tiờu chuẩn này như sau: Giả sử quan sỏt mẫu Wn(x) là: x1 < x2 < x3 <…< xm, goi fi là tần số tương ứng của xi. Hàm phõn phối xỏc suất thực nghiệm của x sẽ là:

            • Đặt:

            • III. các kiểm định trên cơ sở tương quan hạng

              • 1- Kiểm định Wilcoxon

                • Kết quả kiểm định

                • NPar Tests

                • 2- Kiểm định tương quan hạng Spearman

Tài liệu cùng người dùng

Tài liệu liên quan