Bài giảng tóm tắt môn Thống Kê. Dành cho học viên Ôn thi cao học. Khi khảo sát đám đông X ta thu thập số liệu của mẫu cỡ n: (X1, X2,…, Xn) và thường lập bảng số liệu theo các dạng sau. Những sản phẩm có chỉ tiêu X từ 19 cm trở xuống được xếp vào loại B. Hãy xác định kỳ vọng mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh, độ lệch mẫu, độ lệch mẫu hiệu chỉnh của chỉ tiêu X và tỉ lệ mẫu các sản phẩm loại B.
BÀI GIẢNG TĨM TẮT MƠN TỐN THỐNG KÊ – ƠN THI CAO HỌC §1 CÁC ĐẶC TRƯNG MẪU 1.1 Bảng số liệu Khi khảo sát đám đông X ta thu thập số liệu mẫu cỡ n: (X1, X2,…, Xn) thường lập bảng số liệu theo dạng sau: Dạng 1: Liệt kê dạng: x1, x2,…, xn số liệu lặp lại nhiều lần Dạng 2: Lập bảng có dạng: Xi ni x1 n1 x2 n2 ……………………… xk ………………………… nk x1 < x2 < < xk số liệu xi xuất ni lần Dạng 3: Lập bảng có dạng: Xi ni x1 – x2 x2 – x3 ……………………… xk – xk+1 n1 n2 nk ………………………… x1 < x2 < < xk < xk+1 nửa khoảng [xi; xi+1) (trừ cuối đoạn [xk; xk+1]) chứa ni số liệu Khi xử lý số liệu ta đưa số liệu Dạng Có thể đưa Dạng Dạng cách thống kê lại Dạng đưa Dạng cách thay khoảng xi–xi+1 giá trị trung bình hai đầu mút x'i xi xi1 Trong phần sau, ta xét mẫu đám đơng X có dạng 1.2 Kỳ vọng mẫu Định nghĩa Kỳ vọng mẫu hay Trung bình mẫu đám đơng X ứng với mẫu (X1, X2,…, Xn), kí hiệu Xn hay X đại lượng ngẫu nhiên định bởi: 1) 1 X n k X n i i i 1 2) Ý nghĩa Khi n kỳ vọng mẫu X n = M(X) Do n lớn ta xấp xỉ: hội tụ kỳ vọng đám đông M(X)Xn 1.3 Phƣơng sai mẫu độ lệch mẫu 1) Định nghĩa Phương sai mẫu đám đông X ứng với mẫu (X1, X2,…, Xn), kí hiệu S 2 2 (cịn kí hiệu xn hay n hay x ) đại lượng ngẫu nhiên định bởi: S k n X i i 1 n i (X) Căn bậc hai phương sai mẫu X gọi độ lệch mẫu, kí hiệu S (cịn ): kí hiệu xn hay n hay x k n X 2i n i (X)2 S i 1 2) Phƣơng sai mẫu độ lệch mẫu hiệu chỉnh Phương sai mẫu hiệu chỉnh đám đông X ứng với mẫu (X1, X2,…, 2 Xn), kí hiệu S (cịn kí hiệu xn nhiên định bởi: n 2 S n1S hay n n1 2 hay Sx ) đại lượng ngẫu k n i1 X i n i n (X) Căn bậc hai phương sai mẫu hiệu chỉnh X gọi độ lệch mẫu hiệu chỉnh, kí hiệu S (cịn kí hiệu xn1 hay n1 hay Sx ): k S n1i X i n i 1 n (X) n1 3) Ý nghĩa Khi n phương sai mẫu hiệu chỉnh hội tụ phương sai đám đơng = D(X) Do n lớn ta xấp xỉ: 2 1.4 Tỉ lệ mẫu D(X) S 1) Định nghĩa Ta xét đám đông với tỉ lệ phần tử có tính chất A p Dấu hiệu X mà ta quan tâm phần tử đám đơng có tính chất A hay khơng: Nếu có, ta đặt X = 1; khơng, ta đặt X = Như vậy, đám đơng X có phân phối Bernoulli X B(p) sau: X P q p (q = 1–p) Khi mẫu cỡ n gồm n đại lượng ngẫu nhiên (X1, X2, …, Xn) mà Xi có phân phối Bernoulli với X: X i B(p), nghĩa Xi P q p Nói cách khác, Xi nhận hai giá trị: (với xác suất q) (với xác suất p) Tỉ lệ mẫu đám đông X ứng với mẫu (X1, X2,…, Xn), kí hiệu Fn, đại lượng ngẫu nhiên định bởi: Fn n k X i ni i 1 2) Ý nghĩa Khi n tỉ lệ mẫu Fn hội tụ tỉ lệ đám đông p Do n lớn ta xấp xỉ: p Fn 3) Chú ý Dưới Dạng bảng, việc tính giá trị tỉ lệ mẫu đơn giản ta cần xác định số phần tử m thỏa tính chất A mẫu cỡ n Khi Fn m n Ví dụ Để khảo sát tiêu X loại sản phẩm, người ta quan sát mẫu có kết sau: X(cm) Số sản phẩm 11–15 15–19 19–23 23–27 27–31 31–35 35–39 20 16 16 13 18 Những sản phẩm có tiêu X từ 19 cm trở xuống xếp vào loại B Hãy xác định kỳ vọng mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh, độ lệnh mẫu, độ lệnh mẫu hiệu chỉnh tiêu X tỉ lệ mẫu sản phẩm loại B Giải Trước hết ta thay khoảng xi – xi+1 giá trị trung bình hai đầu mút xi xi1 x'i Xi ni Ta có: - 13 17 21 20 25 16 29 16 33 13 37 18 Cỡ mẫu n = 100 Kỳ vọng mẫu X X n X i ni 26,36 (cm) - Phương sai mẫu X là: S n X i n i X (7, 4452) (cm 2) - Độ lệch mẫu X là: S 7, 4452 (cm) - Phương sai mẫu hiệu chỉnh X là: - - S2 n S2 (7, 4827) (cm ) n1 Độ lệch mẫu hiệu chỉnh X là: S 7, 4827(cm) Tỉ lệ mẫu sản phẩm loại B là: Fn m 17 n 100 0,17 17% n = 100 sản phẩm có m = + = 17 sản phẩm có tiêu X nhỏ hay 19 cm, nghĩa có m = 17 sản phẩm loại B 1.5 Hướng dẫn sử dụng phần mềm thống kê máy tính bỏ túi CASIO 500MS, 570MS, 500ES, 570ES, ) tính đặc trưng mẫu: Với phần mềm thống kê máy tính bỏ túi CASIO 500MS, 570MS, 500ES, 570ES, ) ta tính đặc trưng mẫu Ví dụ Xét đám đơng X với mẫu số liệu sau: Xi ni 13 17 21 20 25 16 29 16 33 13 37 18 1.5.1 Đối với loại máy tính CASIO 500 570MS a Vào MODE SD: Bấm MODE (vài lần ) bấm số ứng với SD, hình lên chữ SD b Xóa nhớ thống kê: Bấm SHIFT MODE (màn hình lên Stat clear) Kiểm tra lại: Bấm nút tròn thấy n = vàởgóc số xóa Chú ý: Cũng xóa nhớ thống kê cách thoát khỏi Mode SD cách bấm MODE , sau vào trở lại Mode SD mục a AC c Nhập số liệu: Cách bấm số liệu sau, bấm SHIFT , hình lên dấu ; SHIFT , M + SHIFT , M + SHIFT , M + SHIFT , M + SHIFT , M + 3 SHIFT , M + SHIFT , M + Chú ý: Sau nhập liệu bấm M+ lần đầu tiên, nên copy lại thao tác cũ (bấm ), di chuyển trỏ để sửa số lại số bấm bấm M+ , tiếp tục cho đế hết d Kiểm tra sửa số liệu sai: Bấm nút tròn để kiểm tra việc nhập số liệu Thấy số liệu sai để hình số liệu đó, nhập số liệu bấm thay cho số liệu cũ = số liệu Ví dụ Nhập sai SHIFT , M+ Khi kiểm tra ta thấy hình ra: - x1 = 13 - Freq1 = (sai) Sửa sau: Để hình Freq1 = 7, bấm = nhận số liệu Freq1 = Số liệu bị nhập dư để hình số liệu bấm SHIFT M+ tịan số liệu (gồm giá trị X xác suất tương ứng) bị xóa Chẳng hạn, + nhập dư SHIFT , M Khi kiểm tra ta thấy x8 = 47 (dư) Ta để hình số liệu bấm SHIFT M+ 47 tần số tương ứng 18) bị xóa tịan số liệu dư (gồm giá trị X = Chú ý Sau kiểm tra việc nhập số liệu xong, phải bấm AC để xóa hình thóat khỏi chế độ chỉnh sửa e Đọc kết quả: Đại lƣợng cần tìm Thao tác Kết Cỡ mẫu n SHIFT = Kỳ vọng mẫu X SHIFT SHIFT = X 26.36 = xn 7.4827 Độ lệch mẫu hiệu chỉnh S Phương sai mẫu hiệu chỉnh S (7, 4827) 1.5.2 Đối với loại máy tính CASIO 500 570ES a Khai báo cột tần số: Bấm SHIFT SETUP (Bấm cách bấm nút tròn xuống) b Vào Mode Thống kê: Bấm MODE (hoặc MODE ) (Trên hình lên chữ STAT) c Nhập số liệu: Như bảng sau: Ghi n = 100 S x n1 d Kiểm tra sửa số liệu sai: Bấm nút tròn để kiểm tra việc nhập số liệu Thấy số = số liệu liệu sai để trỏ số liệu đó, nhập số liệu bấm thay cho số liệu cũ Số liệu bị nhập dư để trỏ số liệu bấm DEL tịan số liệu (gồm giá trị X tần suất tương ứng) bị xóa Chú ý Sau kiểm tra việc nhập số liệu xong, phải bấm AC để xóa hình thóat khỏi chế độ chỉnh sửa Trong trình xủ lý số liệu, muốn xem lại bảng số liệu bấm SHIFT e Đọc kết quả: Đại lƣợng cần tìm Thao tác Kết Ghi Cỡ mẫu n SHIFT 151= Kỳ vọng mẫu X Độ lệch mẫu hiệu chỉnh S SHIFT 15 = 15 = SHIFT n = 100 X 26.36 x n 1 7.4827 S xn 1; sx Phương sai mẫu hi ệu chỉnh S2 (7,4827) Đối với máy 570 ES Plus ta bấm SHIFT … thay SHIFT … §2 ƢỚC LƢỢNG 2.1 Ƣớc lƣợng điểm sau: Xét đám đông X mẫu (X1, X2, , Xn) ta có ước lượng điểm khơng chệch 1) Kỳ vọng mẫu M(X)X X ước lượng không chệch kỳ vọng đám đông: 2) Phương sai mẫu hiệu chỉnh S ước lượng không chệch phương 2 sai đám đông: D(X) S 3) Tỉ lệ mẫu Fn ước lượng không chệch tỉ lệ đám đông: p Fn Ví dụ: Để khảo sát tiêu X loại sản phẩm, người ta quan sát mẫu có kết sau: X(cm) Số sản phẩm 11–15 15–19 19–23 23–27 27–31 31–35 35–39 20 16 16 13 18 Những sản phẩm có tiêu X từ 19cm trở xuống xếp vào loại B Hãy ước lượng giá trị trung bình, phương sai tiêu X tỉ lệ sản phẩm loại B Giải Trong Ví dụ §1, ta tìm được: Kỳ vọng mẫu X X 26,36 - (cm) Phương sai hiệu chỉnh X n S - n1 17% Tỉ lệ mẫu sản phẩm loại B Fn Ta ước lượng: - S (7, 4827) 55, 9903 (cm ) Giá trị trung bình X M(X) X 26,36 - Phương sai X (cm) 2 D(X) S 55, 9903 (cm ) Tỉ lệ sản phẩm loại B p Fn 17% 2.2 Ƣớc lƣợng khoảng cho kỳ vọng Xét đám đông X mẫu (X1, X2, , Xn), ta có cơng thức ước lượng khỏang (hai phía) cho kỳ vọng M(X) với độ tin cậy = – sau: BẢNG ƢỚC LƢỢNG KHOẢNG CHO KỲ VỌNG = M(X) (ĐỘ TIN CẬY = – ) Trƣờng hợp n 30 Phƣơng sai Đã biết (X z Công thức (X z Chưa biết n < 30 X có phân phối chuẩn Đã biết (X z Chưa biết ;Xz k ) n n S ;Xz S) n n n ; X z n S k S (X t n ; X t n ) ) z thoả (z) = (1 – )/2 = /2 tra từ Bảng giá trị hàm Laplace k t với k = n – = – tra từ Bảng Phân phối Student Tra Bảng hàm Laplace để xác dịnh z thỏa (z ) =1– 90% 91% 92% 93% (z ) = /2 0,45 0,455 0,46 0,465 z 1,65 1,70 1,75 1,81 ta được: 2 94% 95% 96% 97% 98% 99% 0,47 0,475 0,48 0,485 0,49 0,495 Đôi giá trị z cho 0,5 + = 0, , Z N(0,1) 1,88 1,96 2,06 2,17 2,33 2,58 dạng P(|Z| z) = 1– = hay P(Z z) = Bảng phân phối Student ứng với k = n – = – cho ta giá trị tk thỏa P(|T|> tk ) = = – , nghĩa P(|T| tk ) = 1– = Ví dụ Khi k = 12, = 0,01 ta có tk = 3,055 Ví dụ Để khảo sát tiêu X loại sản phẩm, người ta quan sát mẫu có kết sau: X(cm) Số sản phẩm 11–15 15–19 19–23 20 23–27 16 27–31 16 31–35 13 35–39 18 Những sản phẩm có tiêu X từ 19 cm trở xuống xếp vào loại B a) Ước lượng giá trị trung bình tiêu X với độ tin cậy 95% b) Ước lượng giá trị trung bình tiêu X sản phẩm loại B với độ tin cậy 99% (Giả sử X có phân phối chuẩn) Giải a) Đây toán ước lượng khoảng cho kỳ vọng = M(X) với độ tin cậy = – = 95% = 0,95 Với số liệu trên, §1, ta tìm được: - Cỡ mẫu n = 100 X 26,36 (cm) S (7,4827)2 (cm2 ) vọng: Vì n 30, = D(X) chưa biết nên ta có cơng thức ước lượng khoảng cho kỳ S (X z n ; X z S n ) (z) = /2 = 0,95/2 = 0,475 Tra bảng giá trị hàm Laplace ta z = 1,96 Vậy ước lượng khoảng là: (26,36 1,96 7,4827 100 ; 26,36 1,96 7,4827 100) (24,89; 27,83) Nói cách khác, với độ tin cậy 95%, giá trị trung bình tiêu X từ 24,89cm đến 27,83 cm b) Đây toán ước lượng khoảng cho kỳ vọng B = M(XB) tiêu X = XB sản phẩm loại B với độ tin cậy = – = 99% = 0,99 Ta lập bảng số liệu XB: XBi nBi 13 17 Từ bảng ta tính được: - Kỳ vọng mẫu XB X n B - X B 15,1176 (cm) n Bi Bi Phương sai mẫu hiệu chỉnh XB là: S B nB S2 (2, 0580) (cm 2) n B 1 B Vì nB < 30, XB có phân phối chuẩn, 2B= D(XB) chưa biết, nên ta có cơng thức ước lượng khoảng cho kỳ vọng: k (X B t SB n ;XBt B k SB n ) B tk xác định từ bảng phân phối Student với k = nB –1 = 16 = – = – 0,99 = 0,01 Tra bảng phân phối Student ta t k 2, 921 Vậy ước lượng khoảng là: (15,1176 2,921 2,0580 17 ;15,1176 2,921 2,0580 17) (13,66;16,58) Nói cách khác, với độ tin cậy 99%, giá trị trung bình tiêu X sản phẩm loại B từ 13,66cm đến 16,58cm Ƣớc lƣợng phía: Xét đám đơng X mẫu (X 1, X2, , Xn), ta có cơng thức ước lượng khỏang phía cho kỳ vọng M(X) với độ tin cậy = – sau: 2) 2.3 Ƣớc lƣợng khoảng cho tỉ lệ Xét đám đông X mẫu (X1, X2, , Xn), ta có cơng thức ước lượng khỏang (hai phía) cho tỉ lệ p = P(A) với độ tin cậy = – sau: BẢNG ƢỚC LƢỢNG KHOẢNG CHO TỈ LỆ p = P(A) (ĐỘ TIN CẬY = 1– ) Fn (1 Fn ) ; F z Fn (1 Fn ) ) n n n z thoả (z) = (1 – )/2 = /2 tra từ Bảng giá trị hàm Laplace (Fn z z Fn (1 Fn ) n n Ví dụ Để khảo sát trọng lượng loại vật nuôi, người ta quan sát mẫu có kết sau: (F tỉ lệ mẫu, hàm Laplace) Độ xác ước lượng X(kg) Số 110–117 28 117–124 29 124–131 35 131–138 46 138–145 36 145–152 152–159 Những có trọng lượng từ 145kg trở lên xếp vào loại A Hãy ước tỉ lệ vật loại A với độ tin cậy 97% Giải Đây toán ước lượng khoảng cho tỉ lệ p loại A với độ tin cậy = 1– = 97% = 0,97 Ta có công thức ước lượng khoảng : (Fn z Fn (1 Fn ) ; Fn z n Fn (1 Fn ) ) n (z) = (1– )/2 = /2 = 0,97/2 = 0,485 Tra bảng giá trị hàm Laplace ta z = 2,17 Cỡ mẫu n = 189 Trong n = 189 có m = 7+8=15 có trọng lượng từ 145kg trở lên nên có m = 15 loại A Do tỉ lệ mẫu loại A là: Fn = m/n = 15/189 = 0,0794 Vậy ước lượng khoảng là: 0, 0794(1 0, 0794) (0, 0794 2,17 ; 0, 0794 2,17 189 0, 0794(1 0, 0794) 189 ) (0, 0367; 0,1221) (3, 67%; 12, 21%) Nói cách khác, với độ tin cậy 97%, tỉ lệ loại A từ 3,67% đến 12,21% 2.4 Các tiêu toán ƣớc lƣợng khoảng cho kỳ vọng tỉ lệ Trong toán ước lượng khoảng cho kỳ vọng tỉ lệ có tiêu là: Cỡ mẫu n - Độ xác Độ tin cậy = – Nếu biết tiêu suy tiêu lại 1) Trƣờng hợp ƣớc lƣợng khoảng cho kỳ vọng Ta xét trường hợp phổ biến n 30; 2 = D(X) chưa biết Khi đó, ta có cơng thức ước lượng khoảng cho kỳ vọng = M(X) với độ tin cậy : S (X z n S ;Xz n ) với (z ) Do ta có cơng thức độ xác ước lượng là: z S n (1) – Nếu biết cỡ mẫu n độ tin cậy ta tra bảng giá trị hàm Laplace để tìm z thoả (z) = /2 Từ ta tìm độ xác theo (1) – Nếu biết cỡ mẫu n độ xác từ (1) ta suy n z S 10 Tra bảng giá trị hàm Laplace ta tìm (z) Từ suy độ tin cậy = 2(z) – Nếu biết độ xác độ tin cậy từ (1) ta suy ra: zS2 n Chú ý zS 2 khơng số nguyên, nữa, ta biết ước lượng, cỡ mẫu lớn ước lượng xác Do thực tế ta có yêu cầu: n n1 (2) 2 (z S / ) n (z S / ) Gọi n0 số nguyên nhỏ lớn hay cỡ mẫu xét, ta có: Nếu n1 n0 ta khơng cần điều tra thêm cỡ mẫu có thỏa (2) Nếu n1 > n0 ta cần điều tra thêm n 1– n0 số liệu để đảm bảo tổng số liệu n1 thoả (2) Tóm lại, ta có qui tắc xác định tiêu ước lượng khoảng cho kỳ vọng sau: BẢNG XÁC ĐỊNH CÁC CHỈ TIÊU CHÍNH TRƢỜNG HỢP ƢỚC LƢỢNG KHOẢNG CHO KỲ VỌNG = M(X) Chỉ tiêu biết Chỉ tiêu cần tìm Cơng thức – Cỡ mẫu n – Độ tin cậy = 1– – Cỡ mẫu n Độ xác S z Độ tin cậy = 1– n n 2( S ) – Độ xác – Độ tin cậy = 1– Cỡ mẫu n – Độ xác n zS / z thoả (z) = (1 – )/2 = /2 tra từ Bảng giá trị hàm Laplace (x) zS / 2 số nguyên nhỏ zS / 2 Ví dụ Để khảo sát tiêu X loại sản phẩm, người ta quan sát mẫu có kết sau: X(cm) Số sản phẩm 11–15 15–19 19–23 20 23–27 16 27–31 16 31–35 13 35–39 18 a) Nếu muốn ước lượng giá trị trung bình tiêu X loại sản phẩm với độ xác 1,8cm đạt độ tin cậy bao nhiêu? b) Nếu muốn ước lượng giá trị trung bình tiêu X loại sản phẩm với độ xác 1,5cm độ tin cậy 97% phải điều tra thêm sản phẩm nữa? Giải Các số liệu toán tính ví dụ trước Nhắc lại : Cỡ mẫu n = 100 - X 26,36 (cm) 11 S (7,4827)2 (cm2 ) - a) Đây toán xác định độ tin cậy = 1– ước lượng kỳ vọng tiêu X với độ xác = 1,8cm Vì n 30, = D(X) chưa biết nên ta có cơng thức tính độ xác ước lượng: S z n (z) = /2 Suy z n 1, 100 2, 41 S 7,4827 Tra bảng giá trị hàm Laplace ta độ tin cậy là: 2(z ) 2(2, 41) 2.0, 4920 98, 40% Vậy độ tin cậy đạt 98,40% b) Đây toán xác định cỡ mẫu ước lượng kỳ vọng tiêu X với độ xác = 1,5cm độ tin cậy = 1– = 97% = 0,97 Vì n 30, = D(X) chưa biết nên ta có cơng thức tính độ xác ước lượng: z S n (z) = /2 = 0,97/2 = 0, 485 Tra bảng giá trị hàm Laplace ta z = 2,17 Suy zS n 2,17.7,4827 117,18 1, Thực tế yêu cầu: n 117,18 = 118 Vì n1 = 118 > 100 (100 cỡ mẫu có) nên ta cần điều tra thêm 118 – 100 = 18 sản phẩm 2) Trƣờng hợp ƣớc lƣợng khoảng cho tỉ lệ Ta xét trường hợp cỡ mẫu lớn Khi đó, ta có cơng thức ước lượng khoảng cho tỉ lệ p với độ tin cậy : (Fn z Fn (1 Fn ) ; Fn z Fn (1 Fn ) ) với (z ) n n 2 Do ta có cơng thức độ xác ước lượng là: z Fn (1 Fn ) n (1) – Nếu biết cỡ mẫu n độ tin cậy ta tra bảng giá trị hàm Laplace để tìm z thoả (z) = /2 Từ ta tìm độ xác theo (1) – Nếu biết cỡ mẫu n độ xác từ (1) ta suy z n F (1 F ) n n 12 Tra bảng giá trị hàm Laplace ta tìm (z) Từ suy độ tin cậy = 2(z) – Nếu biết độ xác độ tin cậy từ (1) ta suy ra: n z2 Fn (1 Fn ) 2 z Fn (1 Fn ) Chú ý không số nguyên, nữa, ta biết ước 2 lượng, cỡ mẫu lớn ước lượng xác Do thực tế ta có yêu cầu: n n1 (2) nguyên nhỏ lớn hay n1 z Fn (1 Fn ) / số z Fn (1 Fn ) / Gọi n0 cỡ mẫu xét, ta có: Nếu n1 n0 ta khơng cần điều tra thêm cỡ mẫu có thỏa (2) Nếu n1 > n0 ta cần điều tra thêm n 1– n0 số liệu để đảm bảo tổng số liệu n1 thoả (2) Tóm lại, ta có qui tắc xác định tiêu ước lượng khoảng cho tỉ lệ sau: BẢNG XÁC ĐỊNH CÁC CHỈ TIÊU CHÍNH TRƢỜNG HỢP ƢỚC LƢỢNG KHOẢNG CHO TỈ LỆ p = P(A) Chỉ tiêu biết Chỉ tiêu cần tìm Công thức – Cỡ mẫu n – Độ tin cậy = 1– Độ xác – Cỡ mẫu n – Độ xác Độ tin cậy = 1– – Độ tin cậy = 1– Cỡ mẫu n z 2( Fn (1 Fn ) n n Fn (1 Fn ) ) 2 n z Fn (1 Fn ) / – Độ xác z thoả (z) = (1 – )/2 = /2 tra từ Bảng giá trị hàm Laplace (x) 2 z Fn (1 Fn ) / số nguyên nhỏ z Fn (1 Fn ) / Ví dụ Để khảo sát tiêu X loại sản phẩm, người ta quan sát mẫu có kết sau: X(cm) Số sản phẩm 11–15 15–19 19–23 20 23–27 16 27–31 16 31–35 13 35–39 18 Những sản phẩm có tiêu X từ 19cm trở xuống xếp vào loại B a) Nếu muốn ước lượng tỉ lệ sản phẩm loại B với độ xác 8% đạt độ tin cậy bao nhiêu? b) Nếu muốn ước lượng tỉ lệ sản phẩm loại B với độ xác 9% độ tin cậy 96% phải điều tra thêm sản phẩm nữa? Giải Các số liệu toán xét nhiều lần Nhắc lại : - Cỡ mẫu n = 100 13 Tỉ lệ mẫu sản phẩm loại B Fn = 0,17 a) Đây toán xác định độ tin cậy = 1– lượng tỉ lệ sản phẩm loại B với độ xác = 8% = 0,08 Ta có cơng thức tính độ xác ước lượng: - z Fn (1 Fn ) n (z) = /2 Suy n 100 z Fn (1 Fn ) 0, 08 0,17(1 0,17) 2,13 Tra bảng giá trị hàm Laplace ta độ tin cậy 2(z ) 2(2,13) 2.0, 4834 96, 68% Vậy độ tin cậy đạt 96,68% b) Đây toán xác định cỡ mẫu ước lượng tỉ lệ sản phẩm loại B với độ xác = 9% = 0,09 độ tin cậy = 1– = 96% = 0,96 Ta có cơng thức tính độ xác ước lượng: z Fn (1 Fn ) n (z) = /2 = 0,96/2 = 0,48 Tra bảng giá trị hàm Laplace ta z = 2,06 Suy n z Fn (1 Fn ) 2 2,06 0,17(1 0,17) 73,92 0,09 Thực tế yêu cầu: n 73,92 = 74 Vì n1 = 74 < 100 (100 cỡ mẫu có) nên ta khơng cần điều tra thêm sản phẩm §3 KIỂM ĐỊNH GIẢ THIẾT 3.1 Kiểm định giả thiết kỳ vọng Xét đám đơng X có kỳ vọng = M(X) chưa biết Với số (0 < < 1) bé, dựa vào mẫu (X1, X 2, , X n) ta có qui tắc kiểm định giả thiết hai phía kỳ vọng = M(X) với mức ý nghĩa sau: BẢNG KIỂM ĐỊNH GIẢ THIẾT VỀ KỲ VỌNG = M(X) H0: = với giả thiết đối H1: (mức ý nghĩa ) n 30 Trƣờng hợp Bƣớc 1) Tính z 2) Tra Bảng 3a) Chấp nhận H0 n < 30 biết chƣa biết biết chƣa biết z (X 0 ) n z (X 0 ) n S z (X 0 ) n z (X 0 ) n S z z z |z| z |z| z |z| z 14 k t |z| tk 3b) Bác bỏ H0 |z| > z |z| > tk |z| > z |z| > z z thoả (z) = (1 – )/2 tra từ Bảng giá trị hàm Laplace k t với k = n–1 tra từ Bảng Phân phối Student Ví dụ Để khảo sát tiêu X loại sản phẩm, người ta quan sát mẫu có kết sau: X(cm) Số sản phẩm 11–15 15–19 19–23 20 23–27 16 27–31 16 31–35 13 35–39 18 Những sản phẩm có tiêu X từ 19cm trở xuống xếp vào loại B a) Giả sử trung bình tiêu chuẩn tiêu X 29cm Hãy nhận định tình hình sản xuất với mức ý nghĩa 1% b) Bằng phương pháp sản xuất mới, sau thời gian, người ta thấy giá trị trung bình tiêu X sản phẩm loại B 16cm Hãy cho kết luận phuơng pháp với mức ý nghĩa 2% (Giả sử X có phân phối chuẩn) Giải Các số liệu toán tính được: Cỡ mẫu n = 100 - - Kỳ vọng mẫu X: X 26,36 (cm) Phương sai mẫu hiệu chỉnh X: S (7,4827)2 (cm2 ) Cỡ mẫu loại B: nB = 17 Kỳ vọng mẫu XB: X B 15,1176 (cm) Phương sai mẫu hiệu chỉnh XB: SB (2,0580)2 (cm2 ) a) Đây toán kiểm định giả thiết kỳ vọng = M(X) với mức ý nghĩa = 1% = 0,01: H0: = 29 với giả thiết đối H1: 29 Vì n 30; = D(X) chưa biết, nên ta kiểm định sau: Bước 1: Ta có z (X 0 ) n S (26, 36 29) 100 7,4827 3, 5281 Bước 2: Tra bảng giá trị hàm Laplace để tìm z thoả (z) = (1– )/2 = 0,99/2 = 0,495 ta z = 2,58 Bước 3: Kiểm định Vì |z| = 3,5281 > 2,58 = z nên ta bác bỏ giả thiết H0: = 29, ghĩa chấp nhận H1: 29 Kết luận: Với mức ý nghĩa 1%, tình hình sản xuất khơng bình thường giá trị trung bình tiêu X khơng tiêu chuẩn b) Đây toán kiểm định giả thiết kỳ vọng B = M(XB) tiêu X = XB sản phẩm loại B với mức ý nghĩa = 2% = 0,02: H0: B = 16 với giả thiết đối H1: B 16 Vì nB < 30, XB có phân phối chuẩn, B= D(XB) chưa biết, nên ta kiểm định sau: Bước 1: Ta có 15 z (X B 0) SB nB (15,1176 16) 17 1,7678 2,0580 Bước 2: Đặt k = nB –1 = 16 Tra bảng phân phối Student ứng với k = 16 = 0,02 ta tk = 2,583 Bước 3: Kiểm định Vì |z| = 1,7678 < 2,583 = tk nên ta chấp nhận giả thiết H0: B = 16 Kết luận: Với mức ý nghĩa 2%, phương pháp khơng có tác dụng làm thay đổi giá trị trung bình tiêu XB sản phẩm loại B 3.2 Kiểm định giả thiết tỉ lệ Xét đám đơng X có tỉ lệ p = P(A) chưa biết Với số (0 < < 1) bé, dựa vào mẫu (X1, X2, , Xn) ta có qui tắc kiểm định giả thiết hai phía tỉ lệ p = P(A) với mức ý nghĩa sau: BẢNG KIỂM ĐỊNH GIẢ THIẾT VỀ TỈ LỆ p = P(A) H0: p = p0 với giả thiết đối H1: p p0 (mức ý nghĩa ) Bƣớc 1: Tính z z (F p ) n n p (1 p ) Bƣớc 2: Tra Bảng z |z| z |z| > z Bƣớc 3a: Chấp nhận H0 Bƣớc 3b: Bác bỏ H0 z thoả (z) = (1 – )/2 tra từ Bảng giá trị hàm Laplace Ví dụ Để khảo sát tiêu X loại sản phẩm, người ta quan sát mẫu có kết sau: X(cm) Số sản phẩm 11–15 15–19 19–23 20 23–27 16 27–31 16 31–35 13 35–39 18 Những sản phẩm có tiêu X từ 27cm trở lên dược xếp vào loại A Một tài liệu cũ cho tỉ lệ sản phẩm loại A 60% Hãy nhận định tài liệu cũ với mức ý nghĩa 1% Giải Ta tính được: - Cỡ mẫu n = 100 Tỉ lệ mẫu sản phẩm loại A Fn = 47/100 = 0,47 Đây toán kiểm định giả thiết tỉ lệ p sản phẩm loại A với mức ý nghĩa = 1% = 0,01: H0: p = 60% = 0,6 với giả thiết đối H1: p 0,6 Ta kiểm định sau: Bước 1: Ta có z (Fn p ) n p0q0 (0, 47 0, 6) 100 0, 6(1 0, 6) 16 2, 6536 Bước 2: Tra bảng giá trị hàm Laplace để tìm z thoả (z) = (1 – )/2 = 0,99/2 = 0,495 ta z = 2,58 Bước 3: Kiểm định Vì |z|= 2,6536 > 2,58 = z nên ta bác bỏ giả thiết H0: p = 0,6, nghĩa chấp nhận H1: p 0,6 Kết luận: Với mức ý nghĩa 1%, tài liệu thống kê cũ dã lạc hậu, khơng cịn phù hợp với thực tế BÀI TẬP Bài Để khảo sát chiều cao X giống trồng, người ta quan sát mẫu có kết qủa sau: X(cm) Số 95–105 105–115 115–125 10 10 15 125–135 135–145 145–155 155–165 30 10 10 15 a) Ước lượng chiều cao trung bình giống trồng với độ tin cậy 96% b) Nếu muốn ước lượng chiều cao trung bình giống trồng với độ tin cậy 99% độ xác cm cần phải điều tra thêm nữa? c) Nếu ước lượng chiều cao trung bình giống trồng với độ xác 4,58cm đạt độ tin cậy bao nhiêu? d) Một tài liệu thống kê cũ cho chiều cao trung bình giống trồng 127cm Hãy cho kết luận tài liệu với mức ý nghĩa 1% e) Những trồng có chiều cao từ 135cm trở lên gọi “cao” Hãy ước lượng tỉ lệ cao với độ tin cậy 95% f) Nếu ước lượng tỉ lệ cao với độ xác 10% đạt độ tin cậy bao nhiêu? g) Nếu ước lượng tỉ lệ cao với độ tin cậy 95% độ xác 11% cần phải điều tra thêm nữa? h) Trước đây, tỉ lệ cao loại trồng 40% Các số liệu thu thập sau áp dụng kỹ thuật Hãy cho kết luận kỹ thuật với mức ý nghĩa 5% i) Những trồng có chiều cao từ 105cm đến 125cm gọi loại A Hãy ước lượng chiều cao trung bình loại A với độ tin cậy 95% (GS X có phân phối chuẩn) j) Bằng phương pháp mới, sau thời gian người ta thấy chiều cao trung bình loại A 119,5cm Hãy cho kết luận phương pháp với mức ý nghĩa 1% (GS X có phân phối chuẩn) Bài Để nghiên cứu nhu cầu loại hàng khu vực, người ta khảo sát 400 hộ gia đình Kết sau: Nhu cầu (kg/tháng/hộ) Số hộ 0–1 10 1–2 35 2–3 86 Cho biết khu vực có 4000 hộ 17 3–4 132 4–5 78 5–6 31 6–7 18 7–8 10 a) Ước lượng nhu cầu trung bình mặt hàng toàn khu vực năm với độ tin cậy 95% b) Khi ước lượng nhu cầu trung bình mặt hàng tồn khu vực năm, ta muốn đạt độ tin cậy 99% độ xác 4,8tấn cần khảo sát hộ gia đình? Bài Để khảo sát tiêu X loại sản phẩm xí nghiệp I, người ta quan sát mẫu kho có kết qủa sau: X(cm) 11–15 15–19 19–23 23–27 27–31 31–35 35–39 Số sphẩm 20 16 16 13 18 a) Những sản phẩm có tiêu X từ 19cm trở xuống gọi sản phẩm loại B Hãy ước lượng tỉ lệ sản phẩm loại B với độ tin cậy 92% b) Giả sử kho có 1000 sản phẩm loại B Hãy ước lượng số sản phẩm kho với độ tin cậy 92% c) Giả sử kho có 10.000 sản phẩm Hãy ước lượng số sản phẩm loại B có kho với độ tin cậy 92% d) Giả sử kho để lẫn 1000 sản phẩm xí nghiệp II 100 sản phẩm lấy từ kho có sản phẩm xí nghiệp II Hãy ước lượng số sản phẩm xí nghiệp I có kho với độ tin cậy 82% Bài Trái chủ hàng đựng sọt, sọt 100 trái Người ta kiểm tra 50 sọt thấy có 450 trái khơng đạt tiêu chuẩn a) Ước lượng tỉ lệ trái không đạt tiêu chuẩn lô hàng với độ tin cậy 95% b) Nếu muốn ước lượng tỉ lệ trái không đạt tiêu chuẩn với độ xác 0,5% đạt độ tin cậy bao nhiêu? c) Nếu muốn ước lượng tỉ lệ trái không đạt tiêu chuẩn với độ xác 1% độ tin cậy 99% phải điều tra thêm sọt nữa? Bài Để biết số lượng cá hồ lớn người ta bắt lên 2000 đánh dấu xong thả chúng xuống hồ Sau người ta bắt lên 400 thấy có 80 đánh dấu Với độ tin cậy 95%, ước lượng số cá có hồ Bài Trọng lượng loại sản phẩm theo qui định 10kg Người ta dùng máy để sản xuất 150 sản phẩm thấy trọng lượng trung bình sản phẩm 10,5kg phương sai mẫu 8,5kg Máy xem hoạt động bình thường sản phẩm có trọng lượng trung bình trọng lượng qui định Với mức ý nghĩa 1%, nhận định máy Bài Một máy sản xuất hàng hóa với tỉ lệ loại tốt 61% Do cố điện, máy bị hỏng Sau sửa chữa cho máy hoạt động lại, người ta kiểm tra ngẫu nhiên 500 sản phẩm thấy có 275 sản phẩm tốt Với mức ý nghĩa 5%, tỉ lệ sản phẩm tốt máy sản xuất có bị thay đổi khơng? 18 ... lệ sản phẩm loại B Giải Trong Ví dụ §1, ta tìm được: Kỳ vọng mẫu X X 26,36 - (cm) Phương sai hiệu chỉnh X n S - n1 17% Tỉ lệ mẫu sản phẩm loại B Fn Ta ước lượng: - S (7, 4827) 55, 9903... thống kê cũ cho chiều cao trung bình giống trồng 127cm Hãy cho kết luận tài liệu với mức ý nghĩa 1% e) Những trồng có chiều cao từ 135cm trở lên gọi ? ?cao? ?? Hãy ước lượng tỉ lệ cao với độ tin cậy... x'i Xi ni Ta có: - 13 17 21 20 25 16 29 16 33 13 37 18 Cỡ mẫu n = 100 Kỳ vọng mẫu X X n X i ni 26,36 (cm) - Phương sai mẫu X là: S n X i n i X (7, 4452) (cm 2) - Độ lệch mẫu X là: