PowerPoint Presentation 17 1 Chương 17 KiỂM ĐỊNH GiẢ THUYẾT CÁC LOẠI PHÂN TÍCH DỮ LIỆU LOAÏI MOÂ TAÛ VÍ DUÏ KHAÙI NIEÄM THOÁNG KEÂ Moâ taû Dieãn giaûi döõ lieäu moâ taû ñaùp vieân tieâu bieåu, moâ taû[.]
Chương 17 KiỂM ĐỊNH GiẢ THUYẾT 17-1 CÁC LOẠI PHÂN TÍCH DỮ LIỆU LOẠI Mô tả MÔ TẢ Diễn giải liệu VÍ DỤ KHÁI NIỆM THỐNG KÊ mô tả đáp viên tiêu biểu, mô + tả đáp viên giống + khác + + + + Suy Xác định thông số Ước tính tính tiêu biểu đám + luận đông đám đông, kiểm + nghiệm giả thiết Khác biệt Xác định có đánh giá khác biệt đáng kể + khác biệt tồn trị trung bình nhóm nhóm mẫu + Mối liên Xác định mối hệ liên hệ xác định biến có liên quan cách hệ thống Tóm tắt Thu nhỏ lượng Xác định biến có tương liệu để sử quan chặt với thể liệu dụng khái niệm nghiên cứu Dự báo dựa mô Ước tính mức độ Y dựa hình thống kê số lượng X Sai số chuẩn (standard error) Giả thuyết (null hypothesis) Kiểm nghiệm t khác biệt (t – test) Phân tích phương sai (ANOVA) + + Tương quan (correlation) Bảng chéo (cross –tabulation) + + Giá trị eigen (Eigen value) Hệ số tải nhân tố (factor loading) Hệ số (Cronbach alpha) + Dự báo Trị trung bình (mean) Trung vị (median) Yếu vị (Mode) Khoảng biến thiên (range) Phân phối tần số (frequency distribution) Độ lệch chuẩn (SD) + + Phân tích dãy số (time series analysis) Hồi qui (regression) Các loại giả thuyết • Null (giả thuyết khơng Ho) that no statistically significant difference exists between the parameter and the statistic being compared (khơng có khác biệt có ý nghĩa thống kê tham số so sánh) • Alternative (Giả thuyết đối Ha) – logical opposite of the null hypothesis (ngược lại với giả thuyết không) – that a statistically significant difference does exist between the parameter and the statistic being compared (có khác biệt có ý nghĩa thống kê tham số so sánh) 17-3 Các bước kiểm định giả thuyết Bước 1: Thiết lập giả thuyết “thuần” Ho giả thuyết thay Ha Ví dụ: Ho: 1 = 2 (không khác biệt/không có mối quan hệ) Ha: 1 2 (có khác biệt/có mối quan hệ) Bước 2: Chọn mức ý nghóa (level of significance: 5% hay 10%) Bước 3: Chọn phép kiểm nghiệm thích hợp tính giá trị thống kê kiểm nghiệm Bước 4: Xác định giá trị tới hạn (critical value) phép kiểm nghiệm tương ứng với mức ý nghóa chọn Bước 5: So sánh giá trị kiểm nghiệm với giá trị tới hạn để định (bác bỏ chấp nhận Ho) 17-4 Sai lầm kiểm định giả thuyết • Type I error (sai lầm loại I) – a true null hypothesis is rejected (giả thuyết bị bác bỏ, xác suất (p) xuất sai lầm loại I ) • Type II error (sai lầm loại II) – one fails to reject a false null hypothesis (giả thuyết sai chấp nhận, xác suất (p) xuất sai lầm loại II ) Khi kiểm định, bác bỏ Ho phạm sai lầm loại I, chấp nhận Họ phạm sai lầm loại II 17-5 Mức ý nghĩa kiểm định ❖Giá trị xác suất phạm sai lầm loại I (phải ấn định trước kiểm định) ❖Tùy thuộc vào mức ý nghóa chọn giá trị p tính ta đến định bác bỏ hay chấp nhận Ho: p : CHẤP NHẬN Ho, BÁC BỎ Ha p < : BÁC BỎ Ho, CHẤP NHẬN Ha 17-6 Kiểm định mối quan hệ biến: định danh/thứ bậc với định danh/thứ bậc Ví dụ: Nhà nghiên cứu muốn biết “Giữa giới tính việc xếp hạng tầm quan trọng nhạc vần điệu lời quảng cáo có mối liên hệ không?” xem BCH 17-7 Trình tự kiểm định giả thuyết B.1: Ho: “Không có mối liên hệ biến cột biến dòng” Ha: “Có mối liên hệ biến cột biến dòng” B.2: Mức độ chấp nhận rủi ro = mức ý nghóa (hệ số alpha) Ví dụ: chọn hệ số alpha = 0,05; hệ số tin cậy = 0,95 B.3: Chọn phép thống kê thích hợp Chi bình phương (Chi-square) để kết luận cho tổng thể Công thức tính trị số thống kê Chi bình phương (Trị số kiểm định): Oi = giá trị quan sát ô thứ i Ei = giá trị kỳ vọng ô thứ i Df = (số dòng -1) * (số cột - 1) k (Oi − Ei ) i =1 Ei x = 2 B.4: Điểm ranh giới vùng bác bỏ Ho vùng chấp nhận Ho = trị số tới hạn Nếu trị số kiểm định < trị số tới hạn => chấp nhận Ho, trị số kiểm định > trị số tới hạn => bác bỏ Ho Thay giá trị quan sát giá trị kỳ vọng vào công thức ta có 2 = 11,142 Đối chiếu cách tra bảng trị số Chi bình phương, ta có giá trị tới hạn là: 2 [2,95] = 5,99 B.5: So sánh giá trị kiểm định với giá trị tới hạn: 2 = 11,142 > 2 [2,95] = 5,99 => bác bỏ Ho: “có mối liên hệ biến cột biến dòng” Phân phối chi bình phương Độ tin cậy (1- ) = 0,95 Vùng chấp nhận Ho 22,95 = 5,99 Vùng bác bỏ Ho Kiểm định Chi-square Giới tính * Nhạc nề n vầ n điệ u lờ i ng cá o Crosstabulation Nhạc vần điệu lời quảng cáo Ba mức quan hàn g đầu Giới t ính nữ nam Total Count Mức quan t rọng thứ tư năm Ba mức quan t rọng 22 20 18 60 % wit hin Giới t ính 36.7% 33.3% 30.0% 100.0% % wit hin Nhạc vần điệu lời quảng cáo 50.0% 52.6% 25.0% 39.0% % of Tot al 14.3% 13.0% 11.7% 39.0% 22 18 54 94 % wit hin Giới t ính 23.4% 19.1% 57.4% 100.0% % wit hin Nhạc vần điệu lời quảng cáo 50.0% 47.4% 75.0% 61.0% % of Tot al 14.3% 11.7% 35.1% 61.0% 44 38 72 154 28.6% 24.7% 46.8% 100.0% 100.0% 100.0% 100.0% 100.0% 28.6% 24.7% 46.8% 100.0% Count Count % wit hin Giới t ính % wit hin Nhạc vần điệu lời quảng cáo % of Tot al Chi-Square Tests Value Pearson Chi-Square Asymp Sig (2-sided) df 11.142 a 004 11.374 003 8.373 004 Continuity Correction Likelihood Ratio Linear-by-Linear Association N of Valid Cases 17-10 Total 154 a cells (.0%) have expected count less than The minimum expected count is 14.81 ... compared (có khác biệt có ý nghĩa thống kê tham số so sánh) 17- 3 Các bước kiểm định giả thuyết Bước 1: Thiết lập giả thuyết “thuần” Ho giả thuyết thay Ha Ví dụ: Ho: 1 = 2 (không khác biệt/không... nghiệm với giá trị tới hạn để định (bác bỏ chấp nhận Ho) 17- 4 Sai lầm kiểm định giả thuyết • Type I error (sai lầm loại I) – a true null hypothesis is rejected (giả thuyết bị bác bỏ, xác suất (p)... ANOVA 17- 12 Kiểm định Independent samples-T-test (phân tíchdữ liệu khoảng/tỉ lệ với nhóm độc lập thuộc liệu định danh/thứ bậc) • Two tailed test (kiểm định phía) – nondirectional test (kiểm định