CHI-SQUARE TEST - KIỂM ĐỊNH TÍNH PHÙ HỢP
Trang 111 Lê Thị Mỹ Ngôn
12.Lê Thanh Thùy
Trang 2 TWO-INDEPENDENT SAMPLES TESTS
K- INDEPENDENT SAMPLES TESTS
TWO-RELATED SAMPLES TESTS
K- RELATED SAMPLES TESTS
Trang 3CHI-SQUARE TEST - KIỂM ĐỊNH TÍNH PHÙ HỢP
Dữ liệu: GSS93, biến R’s Highest Degree
Mục tiêu nghiên cứu: kiểm định sự phù hợp giữa
thực tế và lý thuyết Liệu số người tham gia khảo sát được quan sát thực tế và số người được kỳ vọng ở các cấp học có sự khác biệt không?
Giả thiết Ho: Tần số thực tế = Tần số lý thuyết
Thực hiện: Analyze/Nonparametric tests/Chi-square
Trang 4CHI-SQUARE TEST - KIỂM ĐỊNH TÍNH PHÙ HỢP
N quan sát & N kỳ vọng cho từng cấp học là lớn
- Với P value = 0.000 < 0.05,
ta bác bỏ giả thiết Ho & kết luận:
Có khác biệt giữa số người tham gia thực tế và số người kỳ vọng
ở các cấp học, và số SV ở các
cấp học là khác nhau
Trang 5CHI-SQUARE TEST - KIỂM ĐỊNH TÍNH ĐỘC LẬP
Nguồn dữ liệu : Từ cơ sở dữ liệu GSS93 Nghiên cứu
mối liên hệ giữa giới tính (biến: Respondent’s Sex)
và độ tuổi kết hôn lần đầu (biến: Age When First Married).
Câu hỏi nghiên cứu : Liệu độ tuổi kết hôn lần đầu có
liên hệ với giới tính hay không?
Giả thiết : Ho: Độ tuổi kết hôn lần đầu không có liên hệ
với giới tính.
Thực hiện : Analyze/Descriptive Statistics/crosstabs
chọn cột và hàng tương ứng với 2 biến Chọn Statistic đánh dấu vào Chi-Square
Trang 6CHI-SQUARE TEST - KIỂM ĐỊNH TÍNH ĐỘC LẬP
Trang 7The Binomial Test
Dữ liệu: GSS93, biến Age Categories và Allow Incurable Patients
Mục tiêu nghiên cứu: Tỷ lệ những người đồng ý cho phép người bệnh nan
y được chết ở các nhóm tuổi là có như nhau không?
Giả thiết Ho: Tỷ lệ những người đồng ý cho phép người bị bệnh nan y
được chết ở các nhóm tuổi là như nhau.
Trang 8The Binomial Test
Kết quả Binomial Test:
Bác bỏ Ho: Tỉ lệ tán thành việc cho người bệnh nan y được chết sẽ không như nhau giữa những
người trong nhóm tuổi 18-29.
Chấp nhận Ho (với α =0.05): Tỉ lệ tán thành việc cho người bệnh nan y được chết sẽ là như nhau
giữa những người trong nhóm tuổi 50+
Trang 9ONE-SAMPLE KOLMOGOROV SMIRNOV TEST
1. Sử dụng : Để kiểm định giả thuyết phân phối của dữ liệu có
phù hợp với phân phối lý thuyết
2. Câu hỏi nghiên cứu : Độ tuổi kết hôn lần đầu có là phân phối
chuẩn hay không?
3. Giả thiết Ho:
Ho : Tổng thể của biến độ tuổi kết hôn lần đầu có phân phối
chuẩn
Cách kiểm định:
Thực hiện kiểm định One-sample Kolmogorov smirnov test
Chọn : Analyze/Nonparametric 1 Tests /1-sample K-S/
Trang 10ONE-SAMPLE KOLMOGOROV SMIRNOV TEST
Sig<α: Bác bỏ Ho
Độ tuổi kết hôn lần đầu không
có phân phối chuẩn
Trang 11TWO INDEPENDENT SAMPLES TEST KIỂM ĐỊNH U CỦA MANN WHITNEY
KIỂM ĐỊNH MOSES EXTREME REATION
KIỂM ĐỊNH WALD-WOLFOWITZS RUNS
Trang 12KIỂM ĐỊNH U CỦA MANN WHITNEY
Dữ liệu: Biến R’s Highest Degree và biến Rap Music
Câu hỏi nghiên cứu: Phân phối về sở thích nghe nhạc Rap của hai nhóm trình độ Bachelor và Graduate có giống nhau không?
Giả thiết Ho: phân phối về sở thích nghe nhạc Rap của hai nhóm trình độ : Bachelor và Graduate giống nhau
Thực hiện:
Analyze\Nonparametric Tests\2-Independent sample
Chọnbiến - Rap music cho : Test variable List
- RS Highest Degree cho :Grouping variable
Define Groups: để xác nhận 2 nhóm cần so sánh
Đánh dấu chọn kiểm định Mann Whitney U
Trang 13KIỂM ĐỊNH U CỦA MANN WHITNEY
Ta có sig=0.088 lớn hơn so với mức ý nghĩa α (0.05)
=> Ta chấp nhận giả thiết Ho: Sở thích nghe nhạc
Rap của hai nhóm trình độ : Bachelor và Graduate giống nhau
Asymp Sig (2-tailed) 088
a Grouping Variable: R's Highest Degree
Trang 14KIỂM ĐỊNH MOSES EXTREME REATION
Dữ liệu: Biến R’s Highest Degree và biến Rap Music
Câu hỏi nghiên cứu: Phân phối về sở thích nghe nhạc Rap của hai nhóm trình độ Bachelor và Graduate có giống nhau không?
Giả thiết Ho: phân phối về sở thích nghe nhạc Rap của hai nhóm trình độ : Bachelor và Graduate giống nhau
Thực hiện:
Analyze\Nonparametric Tests\2-Independent sample
Chọnbiến - Rap music cho : Test variable List
- RS Highest Degree cho :Grouping variable
Define Groups: để xác nhận 2 nhóm cần so sánh
Đánh dấu chọn kiểm định Moses extreme reactions
Trang 15KIỂM ĐỊNH MOSES EXTREME REATION
Test Statisticsa,b
Rap Music Observed Control Group Span
262 Sig (1-tailed) .000Trimmed Control Group Span 246
Sig (1-tailed) .000Outliers Trimmed from each End 11
a Moses Test
b Grouping Variable: R's Highest Degree
- Ta có sig Span max=0, sig Span2=0 Trong đó span = span max –span min =0 ( giá trị này càng lớn càng bác bỏ Ho) ta chấp nhận giả thiết Ho
- Tức là phân phối về sở thích nghe nhạc Rap của hai nhóm trình độ: Bachelor và Graduate giống nhau Hay hai nhóm có trình độ Bachelor và Graduate đều có sở thích về nghe nhạc Rap như nhau
Trang 16KIỂM ĐỊNH WALD-WOLFOWITZS RUNS
Dữ liệu: Biến R’s Highest Degree và biến Rap Music
Câu hỏi nghiên cứu: Phân phối về sở thích nghe nhạc Rap của hai nhóm trình độ Bachelor và Graduate có giống nhau không?
Giả thiết Ho: phân phối về sở thích nghe nhạc Rap của hai nhóm trình độ : Bachelor và Graduate giống nhau
Thực hiện:
Analyze\Nonparametric Tests\2-Independent sample
Chọnbiến - Rap music cho : Test variable List
- RS Highest Degree cho :Grouping variable
Define Groups: để xác nhận 2 nhóm cần so sánh
Đánh dấu chọn kiểm định WALD-WOLFOWITZS RUNS
Trang 17KIỂM ĐỊNH WALD-WOLFOWITZS RUNS
Ta có số run = 219 (hay sig=1 >α (0.05)) Chấp nhận giả thiết
Ho Tức là phân phối về sở thích nghe nhạc Rap của hai nhóm trình
độ : Bachelor và Graduate giống nhau Hay hai nhóm có trình độ Bachelor và Graduate đều có sở thích về nghe nhạc Rap như nhau
Test Statisticsb,c
Number of Runs Z Asymp Sig (1-tailed) Rap Music Minimum Possible 5a -17.867 .000
Maximum Possible 219a 8.819 1.000
a There are 4 inter-group ties involving 332 cases.
b Wald-Wolfowitz Test
c Grouping Variable: R's Highest Degree
Trang 18K - INDEPENDENT SAMPLES TEST
KIỂM ĐỊNH KRUSKAL-WALLIS H
KIỂM ĐỊNH MEDIAN
KIỂM ĐỊNH JONCKHEERE-TERPATRA
Trang 19KIỂM ĐỊNH KRUSKAL-WALLIS H
Mục tiêu: xem xét xem mức độ thường xuyên đọc báo của của bốn
nhóm trình độ: High school , Junior college, Bachelor và Graduate
có giống nhau không ?
Giả thiết Ho: Phân phối mức độ thường xuyên đọc báo của bốn
nhóm trình độ : High school , Junior college Bachelor và Graduate giống nhau
Thực hiện:
+ Analyze/Nonparametric Tests /K-Independent sample
+ Chọn biến : - How Often Does R Read Newspaper cho: Test
Trang 20R's Highest Degree N Mean Rank
How Often Does R Read
Newspaper
High school 531 431.45Junior college 61 416.98Bachelor 154 360.87Graduate 76 370.33Total 822
a Kruskal Wallis Test
b Grouping Variable: R's Highest Degree
Ta có sig =0.002 nhỏ hơn so với mức ý nghĩa α Bác bỏ giả thiết Ho
Tức là phân phối thường xuyên đọc báo của bốn nhóm trình độ: High school, Junior college,
Bachelor và Graduate là khác nhau
Trang 21KIỂM ĐỊNH MEDIAN
Mục tiêu: xem xét xem mức độ thường xuyên đọc báo của của bốn
nhóm trình độ: High school , Junior college, Bachelor và Graduate
có giống nhau không ?
Giả thiết Ho: Phân phối mức độ thường xuyên đọc báo của bốn
nhóm trình độ : High school , Junior college Bachelor và Graduate giống nhau
Thực hiện:
+ Analyze/Nonparametric Tests /K-Independent sample
+ Chọn biến : - How Often Does R Read Newspaper cho: Test
Trang 22KIỂM ĐỊNH MEDIAN
Kết luận : Ta thấy Sig = 0.014
Bác bỏ giả thiết Ho, tức là Mức
độ thường xuyên đọc báo của 4 nhóm trình độ 1:High school , 2:Junior college, 3:Bachelor và 4:Graduate là khác nhau.
Trang 23Mục tiêu: xem xét xem mức độ thường xuyên đọc báo của của bốn
nhóm trình độ: High school , Junior college, Bachelor và Graduate
có giống nhau không ?
Giả thiết Ho: Phân phối mức độ thường xuyên đọc báo của bốn
nhóm trình độ : High school , Junior college Bachelor và Graduate giống nhau
Thực hiện:
+ Analyze/Nonparametric Tests /K-Independent sample
+ Chọn biến : - How Often Does R Read Newspaper cho: Test
Trang 24Ta thấy Sig = 0.000
Bác bỏ giả thiết Ho, tức là Số lần đọc báo của giữa 4 nhóm trình
độ 1:High school ,
2:Junior college,
3:Balchelor và
4:Graduate là khác nhau.
Trang 25TWO RELATED SAMPLES TEST
KI M Đ NH D U SIGN Ể Ị Ấ
KI M Đ NH D U VÀ H NG WILCOXON Ể Ị Ấ Ạ
KI M Đ NH D U MCNEMAR Ể Ị Ấ
KI M Đ NH MARGINAL HOMOGENEITY Ể Ị
Trang 26KIỂM ĐỊNH DẤU SIGN
Dữ liệu : 2 biến How often R watches public TV shows và How
often R watches TV news
Câu hỏi nghiên cứu : mức độ thường xuyên xem chương trình công cộng hơn và chương trình tin tức trên tivi có như nhau
không?
Giả thiết Ho: Phân phối mức độ thường xuyên xem chương trình công cộng và chương trình tin tức trên ti vi là như nhau
Thực hiện :
Analyze > Nonparametric Tests > 2 related samples
Dùng chuột bôi cả 2 biến và nhấp để chuyển cả 2 vào ô Test Pairs
Đánh dấu vào ô kiểm định Sign , chọn Ok và ra kết quả
Trang 27KIỂM ĐỊNH DẤU SIGN
Asymp Sig (2 tailed) <α (0.05): Bác bỏ giả thiết Ho Mức độ thường xuyên xem chương trình công cộng và chương trình tin tức trên tivi
là khác nhau.
Trang 28KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON
Dữ liệu : 2 biến How often R watches public TV shows và How
often R watches TV news
Câu hỏi nghiên cứu : mức độ thường xuyên xem chương trình công cộng hơn và chương trình tin tức trên tivi có như nhau
không?
Giả thuyết Ho: Phân phối mức độ thường xuyên xem chương trình công cộng và chương trình tin tức trên ti vi là như nhau
Thực hiện :
Analyze > Nonparametric Tests > 2 related samples
Dùng chuột bôi cả 2 biến và nhấp để chuyển cả 2 vào ô Test Pairs
Đánh dấu vào ô kiểm định WILCOXON , chọn Ok và ra kết quả
Trang 29KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON
Asymp Sig (2 tailed) <α (0.05): Bác bỏ giả thiết Ho Mức độ thường xuyên xem chương trình công cộng và chương trình tin tức trên tivi
là khác nhau.
Trang 30KIỂM ĐỊNH DẤU MCNEMAR
Dữ liệu : 2 biến How often R watches public TV shows và How
often R watches TV news
Câu hỏi nghiên cứu : mức độ thường xuyên xem chương trình công cộng hơn và chương trình tin tức trên tivi có như nhau
không?
Giả thiết Ho: Phân phối mức độ thường xuyên xem chương trình công cộng và chương trình tin tức trên ti vi là như nhau
Thực hiện :
Mã hóa lại 2 biến trên thành 2 biến mới có giá trị nhị phân
Analyze > Nonparametric Tests > 2 related samples
Dùng chuột bôi cả 2 biến và nhấp để chuyển cả 2 vào ô Test Pairs
Đánh dấu vào ô kiểm định MCNEMAR , chọn Ok và ra kết quả
Trang 31tvnews & public shows
tvnews
public showsRarely Usually
thường xuyên xem chương trình công cộng
và chương trình tin tức trên ti vi là khác nhau
KIỂM ĐỊNH DẤU MCNEMAR
Trang 32KIỂM ĐỊNH MARGINAL HOMOGENEITY
Dữ liệu : 2 biến How often R watches public TV shows và How
often R watches TV news
Câu hỏi nghiên cứu : mức độ thường xuyên xem chương trình công cộng hơn và chương trình tin tức trên tivi có như nhau
không?
Giả thuyết Ho: Phân phối mức độ thường xuyên xem chương trình công cộng và chương trình tin tức trên ti vi là như nhau
Thực hiện :
Analyze > Nonparametric Tests > 2 related samples
Dùng chuột bôi cả 2 biến và nhấp để chuyển cả 2 vào ô Test Pairs
Đánh dấu vào ô kiểm định MARGINAL HOMONEITY , chọn Ok và ra kết quả
Trang 33KIỂM ĐỊNH MARGINAL HOMOGENEITY
Marginal Homogeneity Test
How Often R Watches TV News & How
Often R Watches Public TV Shows
khác nhau
Trang 34K- RELATED SAMPLES TEST
KI M Đ NH FRIEDMAN Ể Ị
KI M Đ NH KENDALL’S W Ể Ị
KI M Đ NH COCHRAN’S Q Ể Ị
Trang 35KIỂM ĐỊNH FRIEDMAN
Dữ liệu : 3 biến: How often R watches TV Drama or Sitcoms, How
often R watches public TV shows ,và How often R watches TV news
Câu hỏi nghiên cứu : Liệu rằng có sự khác biệt giữa mức độ
xem TV Drama or Sitcoms, TV News, và Public TV Shows hay không?
Giả thiết Ho: Phân phối mức độ thường xuyên xem 3 chương trình này là giống nhau
Thực hiện :
Analyze > Nonparametric Tests > k - related samples
Dùng chuột bôi cả 3 biến và nhấp để chuyển cả 3 vào ô Test Pairs
Đánh dấu vào ô kiểm định Friedman, chọn Ok và ra kết quả
Trang 36KIỂM ĐỊNH FRIEDMAN Friedman Test
Trang 37KIỂM ĐỊNH KENDALL’S W
Dữ liệu : 3 biến: How often R watches TV Drama or Sitcoms, How
often R watches public TV shows ,và How often R watches TV news
Câu hỏi nghiên cứu : Liệu rằng có sự khác biệt giữa mức độ
xem TV Drama or Sitcoms, TV News, và Public TV Shows hay không?
Giả thuyết Ho: Phân phối mức độ thường xuyên xem 3 chương trình này là giống nhau
Thực hiện :
Analyze > Nonparametric Tests > k - related samples
Dùng chuột bôi cả 3 biến và nhấp để chuyển cả 3 vào ô Test Pairs
Đánh dấu vào ô kiểm định Kendall’s W, chọn Ok và ra kết quả
Trang 39Giả thiết Ho : 3 biến All Will Die if Exposed to Radioact, Nuke
Waste Dangerous for Thousands of Yr, và Greenhouse Effect
Caused by Hole in Atmosphere có cùng phân phối.
Trang 40và Greenhouse nhận giá trị nhị phân 0
(False), 1 (True)
Sig nhỏ => Bác bỏ Ho: Quan điểm về 3 vấn đề
ô nhiễm môi trường là khác nhau
Trang 41THANK YOU!