Chương 9 Xử lý số liệu sẽ học về các nội dung - Tham khảo dữ liệu về tỷ lệ và số lượng - Kiểm tra Chi-Square bằng cách sử dụng Phân phối Đa thức - Kiểm định giả thuyết về tỷ lệ cho n lớn - Tính toán kích thước mẫu cho CI - Tham chiếu cho dữ liệu đếm hai chiều
Bài tập chương 9: Xử lý số liệu Phần 9.1 9.2 Khi bị quân Đức giam cầm Thế chiến II, nhà toán học người Anh Jobn Kerrich tung đồng xu 10, 000 lần thu 5067 đầu Gọi p xác suất đầu ngón tay Chúng tơi muốn kiểm tra xem liệu có phù hợp với giả thuyết khơng điều đồng tiền cơng a Đặt giả thuyết Tại phương án phải có hai phía? Giả thuyết H0: p = ½, H1: p ≠ ½ Ở ta dùng giả thuyết phía đồng tiền có kết sấp ngửa b Tính giá trị P Bạn từ chối Ho mức 0,05 khơng? Có: 𝑝̂ = 5067/10000 z= 𝑝̂−𝑝0 ; thay số 𝑝̂ = 5067/10000; p0 = 1/2; n = 10000, ta z = 1,34 (1−𝑃0 ) √𝑝0 𝑛 P- value = (1- ø(z)) = (1 – ø (1,34)) = (1-0,9099) = 0,1802 c Tìm 95% CI cho tỷ lệ số đầu đồng xu Kerrich Ta có: α = 0,05 nên zα = z0,025 = 1,96 Khoảng tin cậy là: thay số 𝑝̂ = 0,5067; 𝑞̂ = 1- 0,5067 = 0,4933; n = 10000 𝑝̂𝑞̂ 𝑝̂𝑞̂ 𝑛 𝑛 [ ̂𝑝 − 𝑧𝛼∕2 √ ; ̂𝑝 + 𝑧𝛼∕2 √ ] = [0,4969; 0,5164] 9.4 Phần bị lỗi quy trình sản xuất số lượng lớn ước tính cách sử dụng CI 95% với sai số chênh lệch 0,2% a Nếu dự đoán tiên nghiệm phân số bị lỗi 1%, nên lấy mẫu phần? So sánh số với kích thước mẫu mà bạn cần khơng có thông tin tiên nghiệm phân số thực bị lỗi giả định Dự đoán tiên nghiệm tỷ phần bị lỗi p* = 1% = 0,01 số mẫu cần lấy là: 𝒏=( 𝒛𝜶∕𝟐 𝟐 𝑬 ) ⋅ 𝒑∗ ⋅ 𝒒*, thay số z0,025 = 1,96; E = 0,2% = 0,2.10-2, p* = 0,01; q* = 0,99 Ta n = 9507,96 hay 9508 mẫu Nếu khơng có tủ phần lỗi p* cơng thức viết 𝒏=( 𝒛𝜶∕𝟐 𝟐 𝑬 ) ⋅ 𝒑∗ ⋅ 𝒒* = ( 𝒛𝜶∕𝟐 𝟐 𝑬 ) ⋅ 𝟏 𝟒 b Vấn đề đáng ý ước tính phần nhỏ bị lỗi thu chất khử bọt mẫu, khiến khơng thể tính CI Bạn sử dụng phương pháp lấy mẫu để đảm bảo có đủ số lượng khuyết tật mẫu để cung cấp thông tin đáng tin cậy phần sai hỏng thực sự? Sử dụng phương pháp lấy mẫu ước tính giá trị có nghĩa 9.6 Một xét nghiệm máu nhằm xác định bệnh nhân có “nguy cao” mắc bệnh tim cho kết dương tính 80 tổng số 100 bệnh nhân tim biết, 16 bệnh nhân 200 bệnh nhân bình thường biết a Tìm CI 90% đưa kết kiểm tra, xác định xác suất số bênh nhân mắc bệnh tim xác định xác Với câu a: n = 100; x = 80; ̂𝑝 = 0,8 Do khoảng tin cậy là:; thay số: 𝑝̂ = 0,8; 𝑞̂ = 0,2; n = 100; z0,05 = 1,645 𝑝̂𝑞̂ 𝑝̂𝑞̂ 𝑛 𝑛 [ ̂𝑝 − 𝑧𝛼∕2 √ ; ̂𝑝 + 𝑧𝛼∕2 √ ] = [0,7342; 0,8658] b Tìm CI 90% để biết tính xác thử nghiệm, xác định xác suất bệnh nhân bình thường xác định xác Với câu b: n = 200; x = 184; ̂𝑝 = 0,92 Do khoảng tin cậy là:; thay số: 𝑝̂ = 0,92; 𝑞̂ = 0,08; n = 200; z0,05 = 1,645 𝑝̂𝑞̂ 𝑝̂𝑞̂ 𝑛 𝑛 [ ̂𝑝 − 𝑧𝛼∕2 √ ; ̂𝑝 + 𝑧𝛼∕2 √ ] = [0,89; 0,95] Phần 9.2 9.10 Để đánh giá thay đổi quan điểm quan điểm công chúng giáo dục song ngữ, thăm dò qua điện thoại thực vào tháng năm 1993 lần vào tháng năm 1995 Kết dựa khảo sát 1000 người lớn Mỹ liên hệ thăm dò 40% so với năm 1993 Cuộc thăm dò ý kiến 48% từ thăm dò năm 1995 ủng hộ việc dạy tất trẻ em tiếng Anh lựa chọn thay song ngữ Có thay đổi đáng kể quan điểm không? Trả lời cách thực phép thử hai mặt để biết ý nghĩa khác biệt hai tỷ lệ = 05 Tại giải pháp thay hai phía lại thích hợp đây? Bài giải: Giả thuyết chiều H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 ≠ 𝑃̂2 Khoảng tin cậy là: [ 𝑝̂1 − 𝑝̂2 − 𝑧𝛼∕2 √ 𝑝̂1 𝑞̂1 𝑛1 + 𝑝̂2 𝑞̂2 𝑛2 𝑝̂1 𝑞̂1 ; 𝑝̂1 − 𝑝̂ + 𝑧𝛼∕2 √ 𝑛1 + 𝑝̂2 𝑞̂2 𝑛2 ] Thay số: 𝑝̂1 = 0,4, 𝑞̂1 = 0,6; 𝑝̂ = 0,48; 𝑞̂2 = 0,52; z0,025 = 1,96; ta tính khoảng tin cậy [-0,123; -0,036] Giá trị z = 𝑝̂1 −𝑝̂2 ̂ 𝑞 ̂ ̂ 𝑞 ̂ 𝑝 𝑝 √ 1+ 2 𝑛1 = - 3,615; ta thấy: |z| > z0,025 = 1,96 nên ta từ chối H0 𝑛2 9.12 Tập liệu sau từ nghiên cứu nhà hóa học tiếng người đoạt giải Nobel Linus Pauling (1901-1994) cho biết tỷ lệ bị cảm 279 vận động viên trượt tuyết người Pháp chọn ngẫu nhiên vào nhóm Vitamin C giả dược Có khác biệt đáng kể tỷ lệ mắc bệnh cảm lạnh nhóm Vitamin C nhóm giả dược mức = 0,05 khơng? Bạn kết luận hiệu Vitamin C việc ngăn ngừa bệnh cảm lạnh? Bài giải: Giả thuyết chiều H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 ≠ 𝑃̂2 ; z0,025 = 1,96 Ta tính được: 𝑝̂1 = 17/139 = 0,1223; 𝑝̂ = 31/140 = 0,2214; 𝑃̂ = 𝑝̂1 +𝑝̂2 𝑛1 +𝑛2 = 1,23.10-3 𝑞̂ = 1- 𝑃̂ = 0,99877 Có: z = 𝑝̂1 −𝑝̂2 ; thay số: 𝑝̂1 = = 0,1223; 𝑝̂ = = 0,2214; 𝑃̂ = 1,23.10-3; 𝑞̂ = 0,99877 1 √𝑝̂𝑞̂(𝑛 +𝑛 ) Z = - 23,61; ta thấy |z| >> z0,025 = 1,96 ta từ chối H0; Nhạn xét Vitamin C có hiệu điều trị thấp so với Placebo việc chữa cảm lạnh 9.14 Một nghiên cứu đánh giá tiết thromboglobulin nước tiểu 12 bệnh nhân bình thường 12 bệnh nhân đái tháo đường '' Cung kết tóm tắt thu cách mã hóa giá trị từ 20 trở xuống “thấp” giá trị 20 “cao”, trình bày bảng sau a Thiết lập giả thuyết để xác định xem có khác biệt việc tiết thrombogiobulin qua nước tiểu bệnh nhân bình thường bệnh nhân tiểu đường Thử nghiệm thống kê thích hợp để kiểm tra giả thuyết? Các giả thuyết có là: p1: Normal P2: diabetic H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 ≠ 𝑃̂2 H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 > 𝑃̂2 H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 < 𝑃̂2 Ở giả thuyết kiểm tra là: H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 ≠ 𝑃̂2 ; giả thuyết chiều thấp b Tính giá trị P phép thử Kết luận bạn sử dụng = 05? Dựa vào bảng 9.3 giáo trình Ta có giá trị: n1 = 12; n2 = 12; n = n1 + n2 = 24; m = 14 x =20 PL = P (X ≤ x| X + Y = m) = P (X ≤ 20| X + Y = 14) = ∑ 𝑖≤𝑥 𝑛 𝑛 ( )( ) 𝑖 𝑚−𝑖 ; 𝑛) (𝑚 giá trị giới hạn i m – n2 = 14 – 12 = ta tính PL = P (X ≤ 20| X + Y = 14) = ∑20 𝑖= (12)( 12 ) 𝑖 14−𝑖 (24) 14 = 0,9986 Suy P – value = – 0,9986 = 0,0014 với phía P- value = 2.0,0014 = 0,0028 9.16 Trong lớp tiến hành diễn thuyết, hai phát biểu thuyết phục, ủng hộ khác lại chống đối, thực hai học sinh việc phương án khách mời cho bữa tiệc huynh đệ / nữ sinh Ý kiến 52 sinh viên khác lớp thu thập vấn đề trước sau phát biểu với phản hồi sau Bài giải: Áp dụng bảng 9.5 𝑚 P – value = P (B ≥ b| B+ C = m) ( )𝑚 ∑𝑚 ( ); 𝑖=𝑏 𝑖 thay số: b =8; c = 26; m = 34; i = b = Phần 9.3 9.18 Số lần sinh cho 700 phụ nữ thống kê theo tháng từ Bệnh viện Đại học Basel, Thụy Sĩ Nêu giả thuyết tbe để kiểm tra cung tbat bizths lan truyền đồng năm Thực kiểm định giả thuyết = 05 Bài giải: Ta có : p0 = p1 = p2 = … = p12 = Giả thuyết đây: H0: p = Giá trị ei = n.pio = 700 Kiểm định: χ2 = 12 12 = 𝑛𝑖 − 𝑒𝑖 ∑12 𝑖=1 𝑒 𝑖 ; H1 : p ≠ 12 12 175 = 19,725 Có bậc tự dây 12 – 1=11 nên χ11;0,05 = 19,675, nhận thấy χ2 > χ11;0,05 nên ta từ chối H0 Còn 9.20 ... thoại thực vào tháng năm 199 3 lần vào tháng năm 199 5 Kết dựa khảo sát 1000 người lớn Mỹ liên hệ thăm dò 40% so với năm 199 3 Cuộc thăm dò ý kiến 48% từ thăm dò năm 199 5 ủng hộ việc dạy tất trẻ... 200; x = 184; ̂