1. Trang chủ
  2. » Tài Chính - Ngân Hàng

BÀI GIẢNG XÁC SUẤT THỐNG KÊ

39 391 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 39
Dung lượng 599,11 KB

Nội dung

Giáo trình xác suất thống kê.trong tài liệu này các bạn sẽ được tiếp xúc với các công thức cơ bản.Tài liệu về bài tập trắc nghiệm xác suất thống kê giúp các bạn sinh viên rèn luyện kỹ năng làm bài tập. Lý thuyết xác suất thống kê là một bộ phận của toán học, nghiên cứu các hiện tượng ngẫu ... Giáo trình gồm 6 chương tương ứng với 4 đơn vị học trình

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA KHOA HỌC CƠ BẢN HUỲNH HỮU DINH BÀI GIẢNG TOÁN THỐNG KÊ MSSV: Họ tên: TPHCM - Ngày tháng năm 2015 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Chương ƯỚC LƯỢNG THAM SỐ 1.1 Ước lượng điểm Xét tập hợp Ω giả sử ta quan tâm tới biến lượng X đo lường dấu hiệu cá thể tập hợp Về mặt Toán học, X coi BNN (giá trị thay đổi từ cá thể sang cá thể khác) Phân bố xác suất X khó nắm bắt, thông thường ta giới hạn việc xác định số tham số đặc trưng X giá trị trung bình (kỳ vọng), phương sai, trung vị (median), mode, Các tham số xác định xác được, mà phải ước lượng từ giá trị X mẫu chọn ngẫu nhiên Như toán ước lượng tham số phát biểu sau: Giả sử X BNN có tham số đặc trưng θ (chưa biết) mà ta quan tâm Vấn đề đặt là: Căn n giá trị x1 , x2 , , xn X đo mẫu kích thước n lấy từ tập hơp chính, cần tìm giá trị gần θ∗ θ Định nghĩa 1.1 Một hàm θ∗ = Sn (x1 , x2 , , xn ) n giá trị x1 , x2 , , xn gọi ước lượng điểm cho θ Để cho gọn ta gọi tắt ước lượng điểm ước lượng Để khảo sát mặt Toán học, ta coi x1 , x2 , , xn giá trị quan sát (hay giá trị thực nghiệm) mẫu tổng quát X1 , X2 , , Xn , BNN X1 , X2 , , Xn độc lập với có phân bố với X Như ước lượng θ∗ = Sn hàm n BNN X1 , X2 , , Xn BNN Giá trị θ∗ thay đổi từ mẫu quan sát sang mẫu quan sát khác Việc lựa chọn ước lượng “tốt” tiêu chuẩn Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Định nghĩa 1.2 Ước lượng Sn gọi ước lượng không chệch cho θ ESn = θ Ước lượng Sn gọi ước lượng vững với ϵ > ta có lim P (|Sn − θ| ≤ ϵ) = n→∞ Ước lượng Sn gọi hiệu Sn ước lượng không chệch phương sai DSn nhỏ lớp tất ước lượng không chệch Tính chất không chệch có nghĩa ước lượng Sn sai số hệ thống Tính chất vững đảm bảo cho ước lượng Sn gần θ tùy ý với xác suất cao kích thước mẫu đủ lớn 1.1.1 Ước lượng giá trị trung bình µ Giả sử X BNN với EX = µ (chưa biết) µ gọi giá trị trung bình tập hợp Nếu ta có mẫu n gồm giá trị x1 , x2 , , xn X trung bình mẫu x1 + x2 + · · · + xn x= n dùng làm ước lượng cho µ Định lý 1.1 Trung bình mẫu ước lượng không chệch vững cho trung bình tập hợp Chứng minh Ta có x giá trị quan sát X= X1 + X2 + · · · + Xn n BNN X1 , X2 , , Xn độc lập với có phân bố với X, suy EX = EX1 + EX2 + · · · + EXn nµ = = µ n n Vậy X ước lương không chệch µ Hơn nữa, DX = DX1 + DX2 + · · · + DXn DX = n n Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Áp dụng bất đẳng thức Chebyshev ta P ( suy ) ( ) DX DX X − µ > ε = P X − EX > ε ≤ = ε nε2 ) ( ) DX X −µ ≤ε =1−P X −µ >ε ≥1− nε2 ( ) Cho n → +∞ ta có lim P X − µ ≤ ε = Vậy X ước P ( n→+∞ lượng vững µ 1.1.2 Ước lượng phương sai σ Giả sử X BNN với DX = σ (chưa biết) σ gọi phương sai tập hợp Nếu ta có mẫu gồm n giá trị x1 , x2 , , xn X cách hợp lí phương sai mẫu chưa hiệu chỉnh s2 = (x1 − x)2 + (x2 − x)2 + · · · + (xn − x)2 n xem xét dùng để ước lượng σ Tuy nhiên phương sai mẫu chưa hiệu chỉnh s2 ước lượng chệch Thật vậy, s2 giá trị quan sát BNN ( )2 ( )2 ( )2 X − X + X − X + · · · + X − X n S2 = n BNN X1 , X2 , , Xn độc lập với có phân bố với X Đặt Yi = Xi − µ, ta suy • EYi = EXi − µ = • EY = • Xi − X = Yi − Y • EYi2 = E(Xi − µ)2 = E(Xi − EXi )2 = DXi = σ • DYi = DXi = σ • EY = E(Y − EY )2 = DY = σ2 n Do đó, n ( n ( )2 )2 1∑ 1∑ = Xi − X Yi − Y = n i=1 n i=1 (n )n ∑ = Y − nY n i=1 i ( n ∑ i=1 Yi2 − 2Y n ∑ i=1 Yi + nY ) Huỳnh Hữu Dinh Vậy ( E S2 ) = n ( Trường Đại Học Công Nghiệp TPHCM n ∑ ) EYi2 − nEY = i=1 ) n−1 1( nσ − σ = σ ̸= σ n n Kết chứng tỏ S ước lượng chệch Do đó, ta xét phương sai mẫu hiệu chỉnh s2 = (x1 − x)2 + (x2 − x)2 + · · · + (xn − x)2 n−1 s2 ước lượng không chệch σ 1.1.3 Ước lượng tỉ lệ Giả sử ta quan tâm đến đặc tính A mà cá thể tập hợp Ω mang không mang Gọi p tỉ lệ cá thể mang đặc tính A Ω Chúng muốn ước lượng p dựa việc khảo sát mẫu gồm n cá thể Chẳng hạn ta muốn biết tỉ lệ phế phẩm mặt hàng nhập khẩu, tỉ lệ sinh viên đến từ Miền Tây trường Đại học Công Nghiệp TP.HCM, v.v Xét biến lượng X xác định sau: { cá thể đặc tính A X= cá thể có đặc tính A Từ định nghĩa X ta có • P (X = 0) = − p • P (X = 1) = p Nếu x1 , x2 , , xn mẫu gồm n giá trị quan sát X x1 + x2 + + xn số cá thể mang đặc tính A mẫu f= x1 + x2 + · · · + xn n tần suất xuất đặc tính A mẫu Ta thấy f giá trị quan sát BNN F = X1 + X2 + · · · + Xn n X1 , X2 , , Xn BNN độc lập với có phân bố với X Vì EX = p nên ta dễ dàng chứng minh f ước lượng không chệch vững cho p Chú ý 1.1 Từ trở sau, để tiện cho việc trình bày phần lí thuyết, mẫu xem xét mà mẫu tổng quát Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM 1.2 Ước lượng khoảng Bài toán tìm ước lượng khoảng đặt sau: Căn mẫu quan sát X1 , X2 , , Xn , xác định khoảng (a; b) để khoảng chứa tham số θ với xác suất − α cho trước (1 − α thường chọn 0, 95 hay 0, 99) Một cách xác hơn, khoảng ước lượng định nghĩa sau: Định nghĩa 1.3 Khoảng có hai đầu mút a = a(X1 , X2 , , Xn ) b = b(X1 , X2 , , Xn ) gọi khoảng ước lượng với độ tin cậy 1−α P (a ≤ θ ≤ b) = − α Chú ý 1.2 Hai đầu mút a, b khoảng ước lượng hai BNN Chúng hàm X1 , X2 , , Xn nên thay đổi từ mẫu cụ thể sang mẫu cụ thể khác Khoảng ước lượng cho ta biết với xác suất cao khoảng chứa θ ta không chắn θ có nằm khoảng ước lượng hay không (trừ xác định toàn tập chính, mà điều thực thực tế) 1.2.1 Ước lượng khoảng cho kỳ vọng Phương sai σ biết Định lý 1.2 Giả sử X ∼ N (µ, σ ) σ biết Với độ tin cậy 1−α − α, gọi zα giá trị thỏa mãn φ(zα ) = , φ (x) = √ 2π ∫x t2 e− dt ( ) Khi X − zα √σn ; X + zα √σn khoảng ước lượng cho µ với độ tin cậy − α, X= X1 + X2 + · · · + Xn n với X1 , X2 , , Xn quan sát độc lập X Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Chứng minh Vì BNN Xi , i = 1, n độc lập có phân bố với √ (X−µ) n σ2 X ∼ N (µ, σ ) nên X ∼ N (µ, n ), suy Z = ∼ N (0, 1) Khi σ ( ) ) ( √ σ σ (X − µ) n P X − zα √ < µ < X + zα √ < zα = P −zα < σ n n = P (−zα < Z < zα ) = 2φ (zα ) = − α Định lý chứng minh Chú ý 1.3 Các giá trị thông dụng − α zα là: • Nếu − α = 90% zα = 1, 64 • Nếu − α = 95% zα = 1, 96 • Nếu − α = 98% zα = 2, 33 • Nếu − α = 99% zα = 2, 58 Ví dụ 1.1 Đo chiều cao (đơn vị cm) 100 sinh viên trường Đại học Công Nghiệp TP HCM ta trung bình mẫu x = 160cm Giả sử độ lệch chuẩn σ chiều cao người trưởng thành 8cm, xác định khoảng ước lượng chiều cao trung bình sinh viên trường ĐHCN trường hợp sau: 1) Độ tin cậy 95% 2) Độ tin cậy 99% 3) Độ tin cậy 98% Giải Từ đề ta có n = 100; x = 160cm; σ = 8cm 1) Với đô tin cậy 95% ta zα = 1, 96 Vậy khoảng ước lượng chiều cao trung bình sinh viên trường ĐHCN ) ( σ σ x − zα √ ; x + zα √ = (158, 43; 161, 57) n n 2) Với đô tin cậy 99% ta zα = 2, 58 Vậy khoảng ước lượng chiều cao trung bình sinh viên trường ĐHCN ) ( σ σ x − zα √ ; x + zα √ = (157, 94; 162, 06) n n 3) Làm tương tự hai câu Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Phương sai σ chưa biết kích thước mẫu n ≥ 30 Trong nhiều trường hợp, ta phương sai tập hợp Nếu kích thước mẫu n > 30 ta xấp xỉ σ phương sai hiệu chỉnh s2 mẫu Khi đó, khoảng ước lượng trung bình với độ tin cậy − α ) ( s s x − zα √ ; x + zα √ n n Ví dụ 1.2 Một mẫu ngẫu nhiên gồm 100 sinh viên trường ĐHCN TP.HCM hỏi quãng đường họ từ nhà tới trường Giá trị trung bình độ lệch chuẩn hiệu chỉnh mẫu tương ứng 5km 0, 8km Với độ tin cậy 95%, xác định khoảng ước lượng quãng đường trung bình học tất sinh viên trường ĐHCN TP.HCM Giải Từ đề ta tính n = 100; x = 5km; s = 0, 8km; zα = 1, 96 Do đó, khoảng ước lượng ( quãng đường trung ) bình học tất sinh s s √ √ viên trường ĐHCN x − zα n ; x + zα n = (4, 84; 5, 16) Ví dụ 1.3 Trường ĐHCN TP.HCM tiến hành điều tra xem trung bình sinh viên trường tiêu hết tiền gọi điện thoại học kỳ Một mẫu ngẫu nhiên gồm 49 sinh viên chọn số tiền chi cho việc gọi điện thoại họ sau (đơn vị nghìn đồng): 112 155 175 195 212 240 275 126 157 177 197 216 243 277 130 161 181 200 220 247 281 133 167 184 201 222 249 284 145 169 187 205 229 255 287 149 171 189 208 233 260 289 151 173 191 210 237 263 291 Với độ tin cậy 99%, xác định khoảng ước lượng trung bình số tiền gọi điện thoại sinh viên trường ĐHCN học kỳ Giải Từ bảng số liệu ta có n = 49; x = 206, 31; s = 48, 36; zα = 2, 58 Khi đó, khoảng ước lượng trung bình số tiền ( gọi điện thoại )của sinh viên trường ĐHCN học kỳ x − zα √sn ; x + zα √sn = (188, 49; 224, 13) Ví dụ 1.4 Để xác định chiều cao trung bình (đơn vị m) bạch đàn khu rừng bạch đàn lớn, người ta chọn ngẫu nhiên 64 để đo Kết thu sau: Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Khoảng chiều cao 5, − 6, 6, − 7, 7, − 8, 8, − 9, 9, − 10, Số 15 20 13 10 Với độ tin cậy 98%, xác định khoảng ước lượng chiều cao trung bình bạch đàn khu rừng Giải Để dễ tính toán, khoảng chiều cao ta lấy trung điểm khoảng làm đại diện Từ đây, ta tính n = 64; x = 8, 09; s = 1, zα = 2, 33 Khi đó, khoảng(ước lượng trung bình ) chiều cao bạch đằng s s khu rừng x − zα √n ; x + zα √n = (7, 74; 8, 44) Phương sai σ chưa biết n < 30 Cơ sở cho việc xây dựng khoảng ước lượng cho trường hợp dựa vào định lý sau: Định lý 1.3 Giả sử X ∼ N (µ, σ ) X1 , X2 , , Xn BNN√ độc n lập với có phân bố với X Khi đó, BNN T = (X−µ) S có phân bố Student với bậc tự n − 1, tức T ∼ tn−1 , ( S = X1 − X )2 ( )2 ( )2 + X2 − X + · · · + Xn − X n−1 Gọi tn−1 giá trị cho S(tn−1 α α ) = Γ (n) S (x) = √ (n − 1) πΓ 1−α , ∫x ( 1+ ( n−1 ) t2 n−1 )−n dt ) ( √S ; X + tn−1 √S khoảng ước lượng cho µ với Khi đó, X − tn−1 α α n n độ tin cậy − α Ví dụ 1.5 Một phương pháp điều trị bệnh xem xét nghiệm thu Một tiêu để đánh giá hiệu phương pháp số ngày trung bình µ từ lúc điều trị bệnh nhân khỏi bệnh Một mẫu ngẫu nhiên gồm 16 bệnh nhân theo dõi số ngày điều trị bệnh nhân khỏi bệnh ghi lại sau: 10 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Giải Trước hết, ta phát biểu giả thiết H0 đối thiết H1 sau: H0 : µ = 21, H1 : µ ̸= 21, với µ tuổi thọ trung bình pin thực tế Test thống kê chọn √ (x − µ0 ) n t= s với x = 20; µ0 = 21, 5; n = 6; s = 3, 16 Khi đó, ta tính t = 1, 16 Hơn nữa, với mức ý nghĩa α = 5% bậc tự n − = ta tα = 2, 571 Vì |t| < t5α nên ta chưa có sở bác bỏ H0 Bài toán 2.5 Ta muốn kiểm định giả thiết H0 với đối thiết H1 sau: H0 : µ = µ H1 : µ > µ µ0 giá trị cho trước Test thống kê chọn ( X − µ0 T = S )√ n , √ với mẫu cụ thể ta dùng ký hiệu t = (x−µs0 ) n Ta bác bỏ H0 T lớn cách có ý nghĩa Do đó, miền bác bỏ H0 có dạng ∆ = {T > c} với c phụ thuộc vào mức ý nghĩa α Nếu H0 đúng, tức µ = µ0 , T ∼ tn−1 Vậy với mức ý nghĩa α cho, số c tìm từ điều kiện n−1 P ({T > c}) = α ⇔ P ({T ≤ c}) = − α ⇔ c = t2α Ví dụ 2.10 Trong năm học trước, mức chi tiêu trung bình hàng tháng sinh viên trường ĐHCN 1.400.000 đồng Trong năm học này, với mẫu ngẫu nhiên 16 em, ta tìm tháng họ chi tiêu trung bình 1.460.000 đồng với độ lệch chuẩn hiệu chỉnh 100.000 đồng Với mức ý nghĩa 5%, ta kết luận chi phí sinh viên năm cao năm trước hay không ? Giải Trước hết, ta phát biểu giả thiết H0 đối thiết H1 : H0 : µ = 1.400.000 H1 : µ > 1.400.000 với µ chi phí chi tiêu trung bình sinh viên trường ĐHCN 25 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Test thống kê sử dụng √ (x − µ0 ) n t= s với x = 1.460.000; µ0 = 1.400.000; n = 16; s = 100.000 Khi đó, ta tính t = 2.4 Hơn nữa, với mức ý nghĩa α = 5% bậc tự n − = 15 ta 15 t2α = 1, 753 Vì t > t15 2α nên ta bác bỏ H0 chấp nhận H1 , tức sinh viên năm chi tiêu cao năm trước Bài toán 2.6 Ta muốn kiểm định giả thiết H0 với đối thiết H1 sau: H0 : µ = µ0 H1 : µ < µ µ0 giá trị cho trước Test thống kê chọn ( X − µ0 T = S )√ n , √ với mẫu cụ thể ta dùng ký hiệu t = (x−µs0 ) n Ta bác bỏ H0 T nhỏ cách có ý nghĩa Do đó, miền bác bỏ H0 có dạng ∆ = {T < −c} với c phụ thuộc vào mức ý nghĩa α Nếu H0 đúng, tức µ = µ0 , T ∼ tn−1 Vậy với mức ý nghĩa α cho, số c tìm từ điều kiện n−1 ⇔ P ({T < −c}) = α ⇔ c = t2α Ví dụ 2.11 Để điều trị loại bệnh R người ta thường dùng loại thuốc A Thời gian chữa trị thuốc A trung bình kéo dài 30 ngày bệnh nhân khỏi bệnh Vì chữa trị thuốc A tốn nên nhà khoa học cố gắng chế tạo loại thuốc mới, mà ta gọi B, với phí chữa trị thấp thời gian khỏi bệnh nhanh Để kiểm tra tính hiệu thật B, nhà khoa học chọn ngẫu nhiên 25 bệnh nhân mắc bệnh R cho dùng thuốc B Kết cho thấy thời gian khỏi bệnh trung bình bệnh nhân 26 ngày với độ lệch chuẩn hiệu chỉnh ngày Với mức ý nghĩa 1%, ta kết luận thuốc B hiệu thuốc A hay không ? Giải Trước hết, ta phát biểu giả thiết H0 đối thiết H1 sau: H0 : µ = 30 H1 : µ < 30 với µ số ngày trung bình để người bị bệnh R chữa khỏi thuốc B 26 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Test thống kê chọn √ (x − µ0 ) n t= s với x = 26; µ0 = 30; n = 25; s = Khi đó, ta tính t = −4 Hơn nữa, với mức ý nghĩa α = 1% bậc tự n − = 24 ta 24 t24 2α = 2, 492 Vì t < −t2α nên ta bác bỏ H0 chấp nhận H1 , tức thuốc B hiệu thuốc A 2.3 Kiểm định giả thiết giá trị tỉ lệ Giả sử tập hợp chính, cá thể mang hay không mang đặc tính A Gọi p tỉ lệ cá thể mang đặc tính A toàn tập chính, tất nhiên ta p Một mẫu có kích thước n bao gồm giá trị X1 , X2 , , Xn thu từ n quan sát độc lập (lưu ý Xi ∼ B(p)) Sử dụng mẫu thu được, ta kiểm định giả thiết p = p0 với p0 số cho Bài toán 2.7 Ta muốn kiểm định giả thiết H0 với đối thiết H1 sau: H0 : p = p H1 : p ̸= p0 p0 giá trị cho trước Test thống kê chọn √ (F − p0 ) n T =√ , p0 (1 − p0 ) (f −p0 ) với mẫu cụ thể ta ký hiệu t = √ √ n p0 (1−p0 ) Ta bác bỏ H0 T lớn (hoặc bé) cách có ý nghĩa Do đó, miền bác bỏ H0 có dạng ∆ = {|T | > c} với c phụ thuộc vào mức ý nghĩa α 0) Nếu H0 đúng, tức p = p0 , np0 ≥ 5; n(1−p0 ) ≥ F ∼ N (p0 , p0 (1−p ), n suy T ∼ N (0, 1) Vậy với mức ý nghĩa α cho, số c tìm từ điều kiện P ({|T | > c}) = α ⇔ P ({|T | ≤ c}) = − α ⇔ c = zα với φ(zα ) = 1−α Ví dụ 2.12 Ở địa phương A người ta dự đoán có 45% số hộ gia đình sử dụng máy vi tính Kiểm tra ngẫu nhiên 200 hộ ta thấy có 80 hộ sử dụng máy vi tính Với mức ý nghĩa 5%, ta có kết luận tỉ lệ dự đoán xác hay không ? 27 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Giải Trước hết, ta phát biểu giả thiết H0 đối thiết H1 sau: H0 : p = 45% H1 : p ̸= 45% với p tỉ lệ hộ gia đình sử dụng máy vi tính Vì np0 = 90 > 5; n(1 − p0 ) = 110 > nên ta sử dụng test thống kê √ (f − p0 ) n t= √ p0 (1 − p0 ) 80 = 0, 4; p0 = 0, 45; n = 200 Khi đó, ta tính t = −1, 42 với f = 200 Hơn nữa, với mức ý nghĩa α = 5%, ta zα = 1, 96 Vì |t| < zα nên ta chấp nhận giả thiết H0 Chú ý 2.1 Trường hợp đối thiết H1 có dạng p > p0 p < p0 ta làm tương tự toán 2.2 2.3 Ví dụ 2.13 Có bệnh truyền nhiễm mà dùng thuốc A tỉ lệ bệnh nhân khỏi bệnh hoàn toàn 60% Một loại thuốc B thử nghiệm 121 người thấy có 88 người chữa khỏi hoàn toàn Với mức ý nghĩa α = 1%, ta kết luận thuốc B tốt thuốc A Giải Trước hết, ta phát biểu giả thiết H0 đối thiết H1 sau: H0 : p = 60% H1 : p > 60% với p tỉ lệ bệnh nhân chữa khỏi dùng thuốc B Vì np0 = 72, > 5; n(1 − p0 ) = 48, > nên ta sử dụng test thống kê √ (f − p0 ) n t= √ p0 (1 − p0 ) 88 với f = 121 ; p0 = 0, 6; n = 121 Khi đó, ta tính t = 2, 86 Hơn nữa, với mức ý nghĩa α = 1%, ta có z2α = 2, 33 Vì t > z2α nên ta chấp nhận giả thiết H1 , tức thuốc B tốt thuốc A Ví dụ 2.14 Một công ty sản xuất bánh kẹo tuyên bố 70% trẻ em tỉnh A thích bánh kẹo công ty sản xuất Một mẫu gồm 64 em hỏi có 40 em thích bánh kẹo công ty Với mức ý nghĩa 1%, ta nói công ty tuyên bố thật không ? Giải Trước hết, ta phát biểu giả thiết H0 đối thiết H1 sau: H0 : p = 70% H1 : p < 70% với p tỉ lệ trẻ em tỉnh A thích bánh kẹo công ty sản xuất 28 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Vì np0 = 44, > 5; n(1 − p0 ) = 19, > nên ta sử dụng test thống kê √ (f − p0 ) n t= √ p0 (1 − p0 ) với f = 40 = 0, 625; p0 = 0, 7; n = 64 Khi đó, ta tính t = −1, 31 64 Hơn nữa, với mức ý nghĩa α = 1%, ta có z2α = 2, 33 Vì t > −zα nên ta chấp nhận H0 , tức công ty không tuyến bố thật 2.4 Kiểm định giả thiết hai trung bình Giả sử X ∼ N (µ1 , σ12 ); Y ∼ N (µ2 , σ22 ), muốn so sánh µ1 µ2 dựa hai mẫu quan sát độc lập X Y Một mẫu ngẫu nhiên có kích thước n bao gồm giá trị X1 , X2 , , Xn rút từ tập hợp I, bao gồm tất giá trị BNN X; tương tự, mẫu ngẫu nhiên có kích thước m bao gồm giá trị Y1 , Y2 , , Ym rút từ tập hợp II, bao gồm tất giá trị BNN Y Ta muốn kiểm định giả thiết µ1 µ2 2.4.1 Phương sai σ12 σ22 biết Bài toán 2.8 Ta muốn kiểm định giả thiết H0 với đối thiết H1 sau: H0 : µ1 = µ2 H1 : µ1 ̸= µ2 Test thống kê chọn X −Y , T =√ σ22 σ1 + n m với mẫu cụ thể ta dùng ký hiệu t = √ x−y σ1 σ2 + m2 n Ta bác bỏ H0 T lớn (hoặc bé) cách có ý nghĩa Do đó, miền bác bỏ H0 có dạng ∆ = {|T | > c} với c phụ thuộc vào mức ý nghĩa α Nếu H0 đúng, tức µ1 = µ2 , T ∼ N (0, 1) Vậy với mức ý nghĩa α cho, số c tìm từ điều kiện P ({|T | > c}) = α ⇔ P ({|T | ≤ c}) = − α ⇔ c = zα với φ(zα ) = 1−α 29 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Ví dụ 2.15 Từ hai tập hợp có phân bố chuẩn X Y ta lấy hai mẫu độc lập có kích thước tương ứng n = 40 m = 50 Trung bình mẫu tính x = 160 y = 155 Biết tập hợp X có giá trị trung bình µ1 (chưa biết) phương sai σ12 = 90; tập hợp Y có giá trị trung bình µ2 (chưa biết) phương sai σ22 = 100 Với mức ý nghĩa 1%, kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 ̸= µ2 Giải Test thống kê chọn x−y t= √ , σ1 σ22 +m n với x = 160; y = 155; n = 40; m = 50; σ12 = 90; σ22 = 100 Khi đó, ta tính t = 2, 43 Hơn nữa, với mức ý nghĩa α = 1%, ta zα = 2, 58 Vì |t| < zα nên ta chấp nhận H0 Bài toán 2.9 Ta muốn kiểm định giả thiết H0 với đối thiết H1 sau: H0 : µ1 = µ2 H1 : µ1 > µ2 Test thống kê chọn X −Y T =√ , σ1 σ22 +m n với mẫu cụ thể ta dùng ký hiệu t = √ x−y σ1 σ2 + m2 n Ta bác bỏ H0 T lớn cách có ý nghĩa Do đó, miền bác bỏ H0 có dạng ∆ = {T > c} với c phụ thuộc vào mức ý nghĩa α Nếu H0 đúng, tức µ1 = µ2 , T ∼ N (0, 1) Vậy với mức ý nghĩa α cho, số c tìm từ điều kiện P ({T > c}) = α ⇔ P ({T ≤ c}) = − α ⇔ c = z2α Ví dụ 2.16 Từ hai tập hợp có phân bố chuẩn X Y ta lấy hai mẫu độc lập có kích thước tương ứng n = 100 m = 120 Trung bình mẫu tính x = 100 y = 80 Biết tập hợp X có giá trị trung bình µ1 (chưa biết) phương sai σ12 = 200; tập hợp Y có giá trị trung bình µ2 (chưa biết) phương sai σ22 = 240 Với mức ý nghĩa 5%, kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 > µ2 30 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Giải Test thống kê chọn x−y t= √ , σ1 σ22 +m n với x = 100; y = 80; n = 100; m = 120; σ12 = 200; σ22 = 240 Khi đó, ta tính t = 10 Hơn nữa, với mức ý nghĩa α = 5%, ta z2α = 1, 65 Vì t > z2α nên ta chấp nhận giả thiết H1 Bài toán 2.10 Ta muốn kiểm định giả thiết H0 với đối thiết H1 sau: H0 : µ1 = µ2 H1 : µ1 < µ2 Test thống kê chọn X −Y T =√ , σ1 σ22 +m n với mẫu cụ thể ta dùng ký hiệu t = √ x−y σ2 σ1 + m2 n Ta bác bỏ H0 T bé cách có ý nghĩa Do đó, miền bác bỏ H0 có dạng ∆ = {T < −c} với c phụ thuộc vào mức ý nghĩa α Nếu H0 đúng, tức µ1 = µ2 , T ∼ N (0, 1) Vậy với mức ý nghĩa α cho, số c tìm từ điều kiện P ({T < −c}) ⇔ c = z2α Ví dụ 2.17 Từ hai tập hợp có phân bố chuẩn X Y ta lấy hai mẫu độc lập có kích thước tương ứng n = 64 m = 100 Trung bình mẫu tính x = 80 y = 100 Biết tập hợp X có giá trị trung bình µ1 (chưa biết) phương sai σ12 = 128; tập hợp Y có giá trị trung bình µ2 (chưa biết) phương sai σ22 = 200 Với mức ý nghĩa 1%, kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 < µ2 Giải Test thống kê chọn x−y t= √ , σ1 σ22 + n m với x = 80; y = 100; n = 64; m = 100; σ12 = 128; σ22 = 200 Khi đó, ta tính t = −10 Hơn nữa, với mức ý nghĩa α = 1%, ta z2α = 2, 33 Vì t < −z2α nên ta chấp nhận giả thiết H1 31 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM 2.4.2 Phương sai σ12 σ22 chưa biết, kích thước mẫu n, m ≥ 30 Trong trường hợp ta dùng test thống kê ta thay phương sai tập hợp σ12 ; σ22 phương sai hiệu chỉnh mẫu s21 ; s22 Ví dụ 2.18 Một nghiên cứu tiến hành để so sánh tuổi trung bình người mẹ sinh đứa cuối hai vùng A B Một mẫu ngẫu nhiên gồm 36 phụ nữ vùng A cho kết tuổi trung bình sinh lần cuối 33, độ lệch chuẩn hiểu chỉnh năm; mẫu ngẫu nhiên gồm 49 phụ nữ vùng B cho kết tuổi trung bình sinh lần cuối 30, độ lệch chuẩn hiểu chỉnh 5,5 năm Với mức ý nghĩa 5%, kiểm định giả thiết “ trung bình độ tuổi sinh lần cuối phụ nữ vùng A B nhau” Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 ̸= µ2 với µ1 , µ2 trung bình số tuổi sinh lần cuối phụ nữ vùng A B Test thống kê chọn x−y t= √ , s1 s22 +m n với x = 33; y = 30; n = 36; m = 49; s21 = 25; s22 = 30, 25 Ta tính t = 2, 62 Hơn nữa, với mức ý nghĩa α = 5%, ta có zα = 1, 96 Vì |t| > zα nên ta chấp nhận H1 , tức trung bình độ tuổi sinh lần cuối phụ nữ vùng A B khác Ví dụ 2.19 Một nghiên cứu tiến hành để so sánh tuổi trung bình người mẹ sinh đứa cuối hai vùng A B Một mẫu ngẫu nhiên gồm 36 phụ nữ vùng A cho kết tuổi trung bình sinh lần cuối 33, độ lệch chuẩn hiểu chỉnh năm; mẫu ngẫu nhiên gồm 49 phụ nữ vùng B cho kết tuổi trung bình sinh lần cuối 30, độ lệch chuẩn hiểu chỉnh 5,5 năm Với mức ý nghĩa 1%, kiểm định giả thiết “ trung bình độ tuổi sinh lần cuối phụ nữ vùng A cao vùng B” Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 > µ2 32 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM với µ1 , µ2 trung bình số tuổi sinh lần cuối phụ nữ vùng A B Test thống kê chọn x−y t= √ , s1 s22 +m n với x = 33; y = 30; n = 36; m = 49; s21 = 25; s22 = 30, 25 Ta tính t = 2, 62 Hơn nữa, với mức ý nghĩa α = 1%, ta có z2α = 2, 33 Vì t > z2α nên ta chấp nhận H1 , tức trung bình độ tuổi sinh lần cuối phụ nữ vùng A cao vùng B Ví dụ 2.20 Một nghiên cứu tiến hành để so sánh mức lương trung bình nữ giới nam giới công ty lớn (đơn vị, USD/ giờ) Một mẫu ngẫu nhiên gồm 100 phụ nữ có mức lương trung bình USD/ giờ, độ lệch chuẩn hiệu chỉnh 1,5 USD; mẫu ngẫu nhiên gồm 64 đàn ông có mức lương trung bình 9,5 USD/ giờ, độ lệch chuẩn hiệu chỉnh USD Với mức ý nghĩa 1%, ta kết luận mức lương trung bình nam giới cao nữ giới hay không ? Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 < µ2 với µ1 , µ2 lương trung bình nữ giới nam giới Test thống kê chọn x−y , t= √ s1 s22 +m n với x = 8; y = 9, 5; n = 100; m = 64; s21 = 2, 25; s22 = Khi đó, ta tính t = −5, 14 Hơn nữa, với mức ý nghĩa α = 1%, ta có z2α = 2, 33 Vì t < −z2α nên ta chấp nhận H1 , tức mức lương trung bình nam giới cao nữ giới 2.4.3 Phương sai σ12 = σ22 (chưa biết), kích thước mẫu n, m < 30 Bài toán 2.11 Ta muốn kiểm định giả thiết H0 với đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 ̸= µ2 33 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Ta đặt ( • SX • SY2 = ( = • S2 = X1 − X Y1 − Y )2 )2 ( )2 ( )2 + X2 − X + · · · + Xn − X n−1 ( )2 ( )2 + Y2 − Y + · · · + Ym − Y m−1 (n − 1) SX + (m − 1) SY2 n+m−2 Test thống kê chọn T = X −Y √ , 1 S n+m với mẫu cụ thể ta dùng ký hiệu t = √x−y 1 s n +m Ta bác bỏ H0 |T | lớn cách có ý nghĩa Do đó, miền bác bỏ H0 có dạng ∆ = {|T | > c} với c phụ thuộc vào mức ý nghĩa α Nếu H0 đúng, tức µ1 = µ2 , T ∼ tn+m−2 Vậy với mức ý nghĩa α cho, số c tìm từ điều kiện P ({|T | > c}) = α ⇔ P ({|T | ≤ c}) = − α ⇔ c = tαn+m−2 với S(tn+m−2 )= α 1−α Chú ý 2.2 Với trường hợp đối thiết H1 có dạng µ1 > µ2 µ1 < µ2 ta làm tương tự mục 2.4.1 Ví dụ 2.21 Để so sánh chiều cao trung bình nam niên hai địa phương A B, người ta chọn ngẫu nhiên niên địa phương A 16 niên địa phương B Số đo chiều cao hai nhóm người cho bảng sau (đơn vị, cm): Địa phương A: 154 156 157 159 161 161 165 166 170 163 174 165 175 165 175 167 177 167 177 169 171 Địa phương B: 153 160 173 173 Với mức ý nghĩa α = 1%, ta kết luận chiều cao trung bình nam niên hai địa phương A B 34 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 ̸= µ2 với µ1 , µ2 trung bình chiều cao nam niên hai địa phương A B Từ số liệu đề ta tính • n = 9; x = 161; sX = 5, • m = 16; y = 169; sY = 6, • s = 6, 22 Test thống kê chọn x−y t= √ = −3, 09 1 s n+m Với mức ý nghĩa α = 1% bậc tự n + m − = 23 ta tính = 2, 807 Vì |t| > t23 α nên ta chấp nhận giả thiết H1 , tức chiều cao trung bình nam niên hai địa phương A B khác t23 α Ví dụ 2.22 Để so sánh chiều cao trung bình nam niên hai địa phương A B, người ta chọn ngẫu nhiên niên địa phương A 16 niên địa phương B Số đo chiều cao hai nhóm người cho bảng sau (đơn vị, cm): Địa phương A: 154 156 157 159 161 161 165 166 170 163 174 165 175 165 175 167 177 167 177 169 171 Địa phương B: 153 160 173 173 Với mức ý nghĩa α = 1%, ta kết luận chiều cao trung bình nam niên địa phương A nhỏ địa phương B Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 < µ2 với µ1 , µ2 trung bình chiều cao nam niên hai địa phương A B Từ số liệu đề ta tính 35 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM • n = 9; x = 161; sX = 5, • m = 16; y = 169; sY = 6, • s = 6, 22 Test thống kê chọn x−y t= √ = −3, 09 s n1 + m1 Với mức ý nghĩa α = 1% bậc tự n + m − = 23 ta tính 23 t23 2α = 2, Vì t < −t2α nên ta chấp nhận giả thiết H1 , tức chiều cao trung bình nam niên địa phương B lớn địa phương A Ví dụ 2.23 Sản lượng hai giống lúa A B trồng trạm thực nghiệm mùa liên tiếp kết sau (đơn vị, tấn/ha): Giống lúa A: 7,2 7,3 7,3 7,5 7,8 8,0 Giống lúa B: 6,5 6,9 6,9 7,0 7,2 7,5 Với mức ý nghĩa 5%, ta kết luận suất giống A cao giống B Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : µ1 = µ2 H1 : µ1 > µ2 với µ1 , µ2 trung bình suất hai giống lúa A B Từ số liệu đề ta tính • n = 6; x = 7, 52; sX = 0, 112 • m = 6; y = 7; sY = 0, 3347 • s = 0, 3269 Test thống kê chọn x−y t= √ = 2, 76 s n1 + m1 Với mức ý nghĩa α = 5% bậc tự n + m − = 10 ta tính = 1, 812 Vì t > t10 2α nên ta chấp nhận giả thiết H1 , tức suất giống lúa A cao giống lúa B t10 2α 36 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM 2.5 Kiểm định giả thiết hai tỉ lệ Xét hai tập hợp I II đặc tính A mà cá thể hai tập hợp có không Ta muốn so sánh tỉ lệ cá thể mang đặc tính A tập hợp I, ký hiệu p1 , với tỉ lệ cá thể mang đặc tính A tập hợp II, ký hiệu p2 Ta lấy mẫu có kích thước n bao gồm giá trị X1 , X2 , , Xn từ tập hợp I (lưu ý Xi ∼ B(p1 )); tương tự, ta lấy mẫu có kích thước m bao gồm giá trị Y1 , Y2 , , Ym từ tập hợp II (lưu ý Yj ∼ B(p2 )) Dựa vào mẫu chọn ta tiến hành kiểm định giả thiết hai giá trị p1 p2 Bài toán 2.12 Ta muốn kiểm định giả thiết H0 với đối thiết H1 phát biểu sau: H0 : p1 = p2 H1 : p1 ̸= p2 Trước hết, ta đặt • FX = X1 + X2 + · · · + Xn , với mẫu cụ thể ta ký hiệu fX n • FY = Y1 + Y2 + · · · + Ym , với mẫu cụ thể ta ký hiệu fY m Nếu np1 , n(1 − p1 ), mp2 , m(1 − p2 ) ≥ FX ∼ N (p1 , (1 − p1 )p1 (1 − p2 )p2 ) FY ∼ N (p2 , ) n m Test thống kê chọn T =√ FX − FY p1 (1−p1 ) n + p2 (1−p2 ) m 1) 2) Vì p1 p2 không biết, nên với mẫu cụ thể ta thay p1 (1−p + p2 (1−p n m X +nfY f (1 − f )( n1 + m1 ), f = mfm+n (n + m)f ≥ 10, (n + m)(1 − f ) ≥ 10 Khi đó, giá trị test thống kê với mẫu cụ thể t = √ fX −fY1 f (1−f )( n + m ) Ta bác bỏ H0 |T | lớn cách có ý nghĩa Do đó, miền bác bỏ H0 có dạng ∆ = {|T | > c} với c phụ thuộc vào mức ý nghĩa α Nếu giả thiết H0 đúng, tức p1 = p2 , T ∼ N (0, 1) Vậy với mức ý nghĩa α cho, số c tìm từ điều kiện P ({|T | > c}) = α ⇔ P ({|T | ≤ c}) = − α ⇔ c = zα 37 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Ví dụ 2.24 Điều tra 100 hộ gia đình địa phương A có 45 hộ sử dụng máy vi tính; 121 hộ địa phương B có 50 hộ sử dụng máy vi tính Với mức ý nghĩa 5%, ta nói tỉ lệ sử dụng máy vi tính hai địa phương A B Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : p1 = p2 H1 : p1 ̸= p2 với p1 , p2 tỉ lệ hộ gia đình sử dụng máy vi tính địa phương A B Từ số liệu mẫu ta tính • n = 100; fX = • m = 121; fY = 45 100 = 0, 45 50 121 = 0, 41 • m + n = 221; f = nfX +mfY n+m = 0, 43 Vì (m + n)f = 95 > 10; (m + n)(1 − f ) = 126 > 10 nên ta sử dụng test thống kê fX − fY t= √ = 0, f (1 − f )( n1 + m1 ) Hơn nữa, với mức ý nghĩa α = 5%, ta zα = 1, 96 Vì |t| < zα nên ta chấp nhận giả thiết H0 Chú ý 2.3 Với trường hợp đối thiết H1 có dạng p1 > p2 p1 < p2 ta làm tương tự mục 2.4.1 Ví dụ 2.25 Khảo sát 120 sinh viên trường A có 35 em đến từ Miền Tây; 130 sinh viên trường B có 32 em đến từ Miền Tây Với mức ý nghĩa 1%, ta kết luận tỉ lệ sinh viên đến từ Miền Tây trường A cao trường B Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : p1 = p2 H1 : p1 > p2 với p1 , p2 tỉ lệ sinh viên đến từ Miền Tây trường A B Từ số liệu mẫu ta tính • n = 120; fX = • m = 130; fY = 35 120 = 0, 29 31 130 = 0, 24 • m + n = 250; f = nfX +mfY n+m = 66 250 = 0, 26 38 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Vì (m + n)f = 66 > 10; (m + n)(1 − f ) = 184 > 10 nên ta sử dụng test thống kê fX − fY t= √ = 0, 1 f (1 − f )( n + m ) Hơn nữa, với mức ý nghĩa α = 1%, ta z2α = 2, 33 Vì t < z2α nên ta chấp nhận giả thiết H0 Ví dụ 2.26 Khảo sát 120 sinh viên trường A có 35 em đến từ Miền Tây; 130 sinh viên trường B có 50 em đến từ Miền Tây Với mức ý nghĩa 1%, ta kết luận tỉ lệ sinh viên đến từ Miền Tây trường A thấp trường B Giải Ta muốn kiểm định giả thiết H0 đối thiết H1 phát biểu sau: H0 : p1 = p2 H1 : p1 < p2 với p1 , p2 tỉ lệ sinh viên đến từ Miền Tây trường A B Từ số liệu mẫu ta tính • n = 120; fX = • m = 130; fY = 35 120 = 0, 29 50 130 = 0, 38 • m + n = 250; f = nfX +mfY n+m = 85 250 = 0, 34 Vì (m + n)f = 85 > 10; (m + n)(1 − f ) = 165 > 10 nên ta sử dụng test thống kê fX − fY t= √ = −1, f (1 − f )( n1 + m1 ) Hơn nữa, với mức ý nghĩa α = 1%, ta z2α = 2, 33 Vì t > −z2α nên ta chấp nhận giả thiết H0 39 [...]... tiếp Các bước cần thiết trong việc tiến hành một kiểm định giả thiết thống kê: 1 Phát biểu giả thiết H0 và đối thiết H1 2 Định rõ mức ý nghĩa α (xác suất mắc sai lầm loại I) 3 Chọn test thống kê 4 Chọn miền bác bỏ H0 5 Tính giá trị của test thống kê từ mẫu quan sát được 6 Kết luận bác bỏ hay chấp nhận H0 tùy theo giá trị của test thống kê có rơi vào miền bác bỏ giả thiết hay không 2.2 Kiểm định giả thiết... tha bổng kẻ có tội Trong bài toán kiểm định giả thiết cũng vậy Ta coi sai lầm loại I là nghiêm trọng hơn sai lầm loại II Thành thử người ta cố định trước xác suất sai lầm loại I Xác suất của việc mắc sai lầm loại I còn gọi là mức ý nghĩa, ký hiệu α Xác suất mắc sai lầm loại II được ký hiệu là β Con số 1 − β được gọi là lực lượng của kiểm định Lực lượng của kiểm định là xác suất bác bỏ H0 khi H0 sai... chính xác zα Trường Đại Học Công Nghiệp TPHCM f (1−f ) n = 4, 02% = 0, 0402 2) Từ giả thiết ta có f = 0, 64;⌈ϵ = 0, 02; ⌉ zα = 1, 64 Do đó, cỡ mẫu nhỏ 2 f (1−f ) zα nhất thỏa yêu cầu đề bài là n = = 1550 ε2 16 Chương 2 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 2.1 Nguyên lí chung Trong chương này chúng ta sẽ đề cập đến một vấn đề rất quan trọng trong Thống kê: Đó là vấn đề kiểm định giả thiết thống kê Nội dung của bài. .. các số liệu thu được, hãy cho kết luận về một giả thiết thống kê nào đó mà ta quan tâm Một giả thiết thống kê là một giả thiết về sự phân bố của tập hợp chính đang xét Nếu phân bố đó được đặc trưng bởi các tham số (như giá trị trung bình, phương sai, ) thì giả thiết thống kê là giả thiết về tham số của phân bố nó Một số thí dụ về giả thiết thống kê: • Tập hợp chính có phân bố chuẩn với kỳ vọng là 3... thấy xuất hiện mặt sấp 700 lần Ta nghi ngờ xác suất xuất hiện mặt sấp cao hơn mặt ngữa và nhiệm vụ của ta là kiểm tra điều đó Gọi p là xác suất xuất hiện mặt sấp Như vậy, giả thiết H0 là p = 0, 5 và đối thiết H1 là p > 0, 5 Nếu giả thiết H0 đúng, tức p = 0, 5, thì xác suất gieo 1000 lần đồng xu được 700 lần mặt 1 700 sấp là C1000 = 5, 067 × 10−38 Giá trị xác suất này quá nhỏ nên ta có 21000 thể bác... Chúng ta chấp nhận hay bác bỏ một giả thiết bằng cách nào ? Các nhà thống kê đều nhất trí với nhau nguyên lí sau đây: Nếu một biến cố có xác suất rất nhỏ thì trong một phép thử hay một vài phép thử, biến cố đó sẽ không xảy ra 17 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Như vậy, chúng ta sẽ quyết định bác bỏ giả thiết H0 nếu xác suất xuất hiện một sự kiện quan sát được, tính trong điều kiện giả... khi H0 sai Thông thường α được lấy là 0, 05; 0, 02 và 0, 01 Trong tập hợp các kiểm định thống kê có cùng mức ý nghĩa α, thống kê nào có β nhỏ nhất được xem là tốt nhất Các kiểm định được sử dụng trong chương này đều đã được chứng minh một cách chặt chẽ là các kiểm định tốt nhất Cần lưu ý rằng khi kiểm định thống kê dẫn tới việc chấp nhận H0 thì β bằng bao nhiêu thì ta không biết Thành thử, việc chấp... đối thiết H1 là µ < 19, 4 Nếu giả thiết H0 đúng, ta sẽ tính xác suất để trung bình mẫu X bé hơn hay bằng 18, 5 Như đã biết, BBN X có phân bố chuẩn (hoặc xấp xỉ chuẩn) với kỳ vọng là 19,4 và phương sai là √sn = √6,8 = 0, 575 Khi đó, 140 ( ) ( ) 18, 5 − 19, 4 1 P X ≤ 18, 5 = φ + = 0, 0582 0, 575 2 Xác suất này không nhỏ lắm (thông thường xác suất bé hơn 0,05 mới được xem là nhỏ) Do đó, ta chưa có cơ sở... chính xác của ước lượng của ta càng cao Tuy nhiên, kích thước mẫu lớn thì đòi hỏi nhà nghiên cứu phải tốn nhiều thời gian, tiền bạc và công sức để khảo sát Vậy bài toán đặt ra là: Cần chọn kích thước mẫu tối thiểu là bao nhiêu để đạt được độ chính xác mong muốn 1.3.1 Trường hợp ước lượng cho trung bình Giả sử ta muốn ước lượng µ với sai số không quá ϵ cho trước và độ tin cậy 1 − α Ta biết rằng với xác suất. .. quan sát độc lập từ X Ta muốn kiểm định giả thiết về µ 2.2.1 Phương sai σ 2 đã biết Bài toán 2.1 Ta muốn kiểm định giả thiết H0 với đối thiết H1 như sau: H0 : µ = µ 0 H1 : µ ̸= µ0 ở đây µ0 là giá trị cho trước 19 Huỳnh Hữu Dinh Trường Đại Học Công Nghiệp TPHCM Bài toán 2.1 được gọi là bài toán kiểm định hai phía Test thống kê được chọn ở đây là √ (X − µ0 ) n , T = σ √ với mẫu cụ thể ta dùng ký hiệu t =

Ngày đăng: 18/05/2016, 11:36

TỪ KHÓA LIÊN QUAN

w