Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 38 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
38
Dung lượng
341,65 KB
Nội dung
95% khoảng tin cậy & giá trị p Nguyễn Quang Vinh – Nguyễn Thị Từ Vân Giới thiệu Thống kê • Mô tả: – Độ tập trung – Độ phân tán • Suy lý / Suy luận / Suy rộng: – Ước lượng – Kiểm định giả thuyết SỐ ĐO XU HƯỚNG TRUNG TENDENCY MEASURES OFTẬP CENTRAL Trung bình (trung bình đại số) The Mean (arithmeti c mean) x Sample mean : x Trung bình mẫu n x Population mean : Trung bình tổng thể N ••Uniqueness Duy Đơn giản ••Simplicity • Giá trị ngoại lai & trung bình (!) • Extreme value & The Mean (!) Trung điểm The Midrange (Mr) LH Mr • Less popular than mean and median • Ít dùng trung bình trung vị • An tính easy tốn - to - grasp • Dễ giản • Đơn • Simplicity • Giá trị ngoại lai & Mr (!) • Extreme value & The Midrange (!) Mode Trung Trungvịvịvị(Md) (Md) Trung (Md) The Median (Md) • Uniqueness Duy • Đơn giản ••Simplicity Giá trị ngoại lai & trung vị (!) • • Extreme value & The Median Mode (Mo) mơ tả liệu định tính •• dùng Useđểfor describing qualitativ e data SỐ ĐO ĐỘ PHÂN TÁN (dispersion, variation, spread, scatter) Khoảng giá trị Phương sai Độ lệch chuẩn Hệ số biến thiên SỐ ĐO ĐỘ PHÂN TÁN MEASURES OF DISPERSION Độ lệch chuẩn Standard Deviation Độ lệch chuẩn từ mẫu, s2 Sample Standard Deviation, s : x x s n 1 n 1 n Độ lệch chuẩn tổng thể, Population Standard Deviation, : x x x N Hệ số biến thiên* Coefficien t of Variation* : s C.V 100 x * for data sets with extremevariation, it is possible to obtain a C.V 100% MEASURES SỐ ĐO ĐỘ PHÂN TÁNOF DISPERSION (dispersion, variation, spread, scatter) (dispersion, variation , spread, scatter) Khoảng giá trị: H - L Range H L Phương sai Variance Sample variance, s : Phương sai mẫu, s2 x x x x s2 n 1 n 1 n Phương sai tổng thể, 2 Population variance, : x N PHÂN PHỐI MẪU Phân phối xác suất trị số thống kê có từ mẫu nghiên cứu gọi phân phối mẫu Sai số chuẩn X n cịn gọi là: • Sai số chuẩn trị số trung bình, • Sai số chuẩn, • Độ lệch chuẩn trị số trung bình từ mẫu nghiên cứu Ước lượng KHOẢNG TIN CẬY CỦA KHÁC BIỆT TỶ LỆ CỦA HAI TỔNG THỂ ( pˆ - pˆ ) ( p1 p2 ) Khi: cỡ mẫu n1 & n2 lớn & tỷ lệ tổng thể, p1 p2, không gần → áp dụng định lý giới hạn trung tâm & lý thuyết phân phối normal để xác định khoảng tin cậy S E pˆ 1 pˆ pˆ (1 - pˆ ) pˆ (1 - pˆ ) n1 n2 ( pˆ1 - pˆ ) z/2 pˆ1 (1 - pˆ 1) pˆ (1 - pˆ ) n1 n2 100 (1 - )% khoảng tin cậy p1 - p2 Ghi * Thông thường phương sai 2 cần phải ước lượng 2 * Việc ước lượng 2 từ nguồn sau đây: Mẫu nghiên cứu thử Kết nghiên cứu trước tương tự R/4 (hoặc R/6) (phân phối xấp xỉ normal & biết giá trị nhỏ giá trị lớn biến số tổng thể) s IQR/1.35 KHOẢNG TIN CẬY CỦA PHƯƠNG SAI TỔNG THỂ CÓ PHÂN PHỐI NORMAL / (n 1) s / (n 1) s 1 / 2 (n 1) s 1 / 2 1 / (n 1) s / 2 100 - )% KTC (n-1)s2/2 (100 - )% KTC 2 (n 1) s / 2 (100 - )% KTC KHOẢNG TIN CẬY CỦA PHƯƠNG SAI TỔNG THỂ CÓ PHÂN PHỐI NORMAL Nhược điểm Mặc dù phương pháp để xác định khoảng tin cậy 2 dùng rộng rãi, khơng phải khơng có số nhược điểm: • Giả định phân phối tổng thể mà mẫu rút normal, điều quan trọng • Số ước lượng không nằm khoảng tin cậy phân phối 2 khơng đối xứng phân phối normal KHOẢNG TIN CẬY CỦA PHƯƠNG SAI TỔNG THỂ CÓ PHÂN PHỐI NORMAL Nếu cỡ mẫu đủ lớn: (100 - )% khoảng tin cậy KHOẢNG TIN CẬY CỦA TỶ SỐ HAI PHƯƠNG SAI CỦA HAI TỔNG THỂ CÓ PHÂN PHỐI NORMAL tuân theo phân phối F 2 s Với giả định: s 2 2 s &s 2 tính từ hai mẫu độc lập n1 & n2, lần lượt, rút từ hai tổng thể có phân phối bình thường KHOẢNG TIN CẬY CỦA TỶ SỐ HAI PHƯƠNG SAI CỦA HAI TỔNG THỂ CÓ PHÂN PHỐI NORMAL (100 - )% KTC 2 s F / s12 s 2 2 F1 / 2 2 2 22 (100 - )% KTC s s s s F1 / F / 2 12 s22 2 2 Ghi F(1 ), , F , , Trong đó: 1 = n1 - (độ tự tử số) 2 = n2 - (độ tự mẫu số) Kiểm định giả thuyết thống kê 32 Giới thiệu Đưa định tổng thể cách khảo sát mẫu lấy từ tổng thể Hai loại giả thuyết: (1) Giả thuyết nghiên cứu: - phán đoán khả - kết nhiều năm quan sát - dẫn trực tiếp đến giả thuyết thống kê (2) Giả thuyết thống kê: giả thuyết phát biểu theo cách thức mà đánh giá kỹ thuật kiểm định thống kê phù hợp 33 Các trường hợp mắc sai lầm loại I & sai lầm loại II (4 khả năng) Kết nghiên cứu từ mẫu → Kết luận: Sự thật tổng thể Có mối liên hệ tiếp xúc & kết cục (Ho sai) Bác bỏ Quyết định Ho Không bác bỏ Ho Sai lầm loại II Khơng có mối liên hệ tiếp xúc & kết cục (Ho đúng) Sai lầm loại I Quyết định Lưu ý Ho, HA & phải xác lập trước nhìn vào liệu Nói cách khác, khơng để liệu dẫn đường giả thuyết Giá trị nhỏ, giá trị lớn → muốn nhỏ, cần chọn giá trị lớn Trong hầu hết trường hợp khoảng giá trị chấp nhận thay đổi từ 0.01 đến 0.1 Nếu khơng có khác biệt đáng kể hiệu lực sai lầm loại I so với sai lầm loại II, nên chọn = 05 35 Năm bước kiểm định giả thuyết thống kê Bước 1: Đặc tính liệu - Kiểm tra giả định Xác lập Ho - HA Bước 2: xác định test thống kê, phân phối Bước 3: xác định vùng bác bỏ: đưa giá tri α Bước 4: tính giá trị test thống kê kiểm định với phân phối tương ứng → giá trị p Phát biểu định thống kê: bác bỏ Ho không bác bỏ Ho Bước 5: đưa kết luận – khơng có thuật ngữ thống 36 kê • Nếu H0 bị bác bỏ, kết luận HA • Nếu khơng bác bỏ H0, kết luận có lẽ H0 - Tránh dùng “chấp nhận” trường hợp không bác bỏ Ho, ta nên phát biểu Ho “khơng bác bỏ” 37 Tóm tắt (1) Nói chung, kiểm định giả thuyết không chứng minh giả thuyết - Chỉ đơn giản liệu tay có ủng hộ hay khơng ủng hộ cho giả thuyết không (2) Điều mà mong chờ để kết luận kết kiểm định thường nên để giả thuyết HA (3) Giả thuyết HO giả thuyết kiểm định (4) Hai giả thuyết HO & HA bổ sung 38 ... thế, 95% khoảng tin cậy p pˆ 1.96 p? ? p? ? 1.96 p? ? (1 p? ? ) / n KHOẢNG TIN CẬY CỦA KHÁC BIỆT TỶ LỆ CỦA HAI TỔNG THỂ ( p? ? - p? ? ) ( p1 p2 ) Khi: cỡ mẫu n1 & n2 lớn & tỷ lệ tổng thể, p1 p2 ,... khơng nằm khoảng tin cậy phân phối 2 khơng đối xứng phân phối normal KHOẢNG TIN CẬY CỦA PHƯƠNG SAI TỔNG THỂ CÓ PHÂN PHỐI NORMAL Nếu cỡ mẫu đủ lớn: (100 - )% khoảng tin cậy KHOẢNG TIN CẬY CỦA... → ? ?p dụng định lý giới hạn trung tâm & lý thuyết phân phối normal để xác định khoảng tin cậy S E p? ? 1 p? ? p? ? (1 - p? ? ) p? ? (1 - p? ? ) n1 n2 ( p? ?1 - p? ? ) z/2 p? ?1 (1 - p? ? 1) p? ? (1 - p? ?