Bài giảng Toán ứng dụng - P
Cao Hào Thi 66 Chương 6 LẤY MẪU VÀ PHÂN PHỐI MẪU (Sampling and Sampling Distribution) 6.1. LẤY MẪU TỪ TẬP HỢP CHÍNH (Sampling from a Population) 6.1.1. Tập hợp chính (Population) Tập hợp chính là tập hợp tất cả các đối tương mà ta quan tâm nghiên cứu trong một vấn đề nào đó. Số phần tử của tập hợp chính được ký hiệu là N. - Nếu N là số hữu hạn ta có tập hợp chính hữu hạn (finite population) - Nếu N là số vô hạn ta có tập hợp chính vô hạn (infinite population) 6.1.2. Mẫu (Sample) Mẫu là tập hợp con của tập hợp chính. Số phần tử của mẫu đã ký hiệu là n (cỡ mẫu). 6.1.3. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling) Đó là cách chọn n phần tử từ tập hợp chính gồm N phần tử sao cho mỗi tổ hợp trong nNC tổ hợp đều có cùng khả năng được chọn như nhau. Kết quả của việc chọn này cho ta các mẫu ngẫu nhiên (random sample). Việc lấy mẫu ngẫu nhiên có thể tiến hành theo cách lấy mẫu không hoàn trả lại (sampling without replacement) hay theo cách lấy mẫu có hoàn trả lại (sampling with replacement). 6.1.4. Phân phối mẫu (Sampling Distribution) Các mẫu đều có các đặc trưng thống kê của mẫu như số trung bình X, phương sai 2xS. Phân phối xác suất của các đặc trưng thống kê của mẫu được gọi là phân phối mẫu. Trong chương này ta khảo sát phân phối mẫu của X, 2xS. Suy diễn thống kê (Statistic Inference) : Dựa vào các đặc trưng thống kê của mẫu ta có thể suy rộng ra cho các đặc trưng thống kê của tập hợp chính. 6.2. PHÂN PHỐI MẪU CỦA SỐ TRUNG BÌNH CỦA MẪU X (Sampling Distribution of the Sample Mean) Phân phối mẫu của số trung bình của mẫu là phân phối xác suất của đại lượng X 6.2.1. Kỳ vọng của số trung bình mẫu E (X) Giả sử tập hợp chính có N phần tử, có trung bình là µx và phương sai là 2xσ. Ta có: NXNiix∑=µ=1 N)X(Niix∑µ−=σ=122 Cao Hào Thi 67 Gọi X1, X2 . Xn là mẫu ngẫu nhiên có cỡ mẫu là n, được chọn từ tập hợp chính. Số trung bình của mẫu là : ∑=iXnX1 • Kỳ vọng của số trung bình mẫu của số trung bình mẫu E (X) là giá trị trung bình của tập hợp chính µx. Nói cách khác, phân phối mẫu của X có số trung bình là µx. E(X ) = µx Thí dụ: Giả sử tập hợp chính gồm 5 học sinh có số tuổi là 2, 4, 6, 8 và 10. Trong trường hợp này số trung bình của tập hợp chính sẽ là µx = 1/5(2+4+6+8+10) = 6 Giả sử lấy mẫu ngẫu nhiên không hoàn lại với cỡ mẫu là 2. Ta sẽ có 25C = 10 mẫu khác nhau (với cỡ mẫu là 2). Và mỗi mẫu sẽ có số trung bình của mẫu X như sau : Sample 2,4 2,6 2,8 2,10 4,6 4,8 4,10 6,8 6,10 8,10 X 3 4 5 6 5 6 7 7 8 9 Phân phối mẫu của số trung bình X là : (Phân phối xác suất của đặc trưng thống kê của mẫu X Sample 3 4 5 6 7 8 9 10 X 0,1 0,1 0,2 0,2 0,2 0,1 0,1 0,1 Kỳ vọng của X E(X ) = ΣX * p(X) = 3 * 0,1 + 4 * 0,1 + 5 * 0,2 + 6 * 0,2 + 7 * 0,2 + 8 * 0,1 + 9 * 0,1 E(X ) = 6 = µx 6.2.2. Phương sai của số trung bình mẫu (2Xσ) a) Trường hợp tập hợp chính vô hạn (Infinite Polulation) Phương sai của số trung bình mẫu X được ký hiệu là σ2x Var (X ) = σ2x = nxσ2 Đúng khi n < N Với σ2x là phương sai của tập hợp chính, n là cỡ mẫu. Var (X ) = σ2x = )(1NnNn2x−−σ Cao Hào Thi 68 b) Trường hợp tập hợp chính hữu hạn (Finite Population) Thí dụ: Tính phương sai của X trong thí dụ trên Phương sai của tập hợp chính σ2x = E[(Xi - µx)² = Σ(xi - µx)² * P(Xi) µx = 6; P(Xi) = 1/5 = 1/5[(2-6)² + (4 - 6)² + (6 -6 )² + (8-6)² + (10 - 6)²] σ2x = 8 Phương sai của X tính từ định nghĩa Var (X ) = E [(X - E( X ))2] = E [( X - 6)2] vì E ( X ) = µx = 6 = [(3-6)2*0,1 + (4-6)2*0,1 + (5-6)2*0,2 + (6-6)2*0,2 + (7-6)2*0,2 + (8-6)2 *0,1 + (9-6)2*0,1] Var (X) = σ2x = 3 Nếu áp dụng công thức : Var (X) = 3 1525 28 1NnN n 2x2X=−−=−−σ=σ** 6.2.3. Độ lệch chuẩn của số trung bình mẫu (Xσ) Độ lệch chuẩn của X được ký hiệu (Xσ ) σσσxxxn==2 Đối với tập hợp chính vô hạn hay 1NnN n xx−−σ=σ * Đối với tập hợp chính hữu hạn xσ được xem như sai số chuẩn (Standard Error) của số trung bình mẫu X. 6.2.4. Lấy mẫu từ tập hợp chính tuân theo phân phối chuẩn (Sampling From Normal Population) Luật phân phối của số trung bình mẫu X Nếu tập hợp chính của biến X tuân theo phân phối chuẩn với số trung bình là µx và phương sai σx thì số trung bình mẫu X sẽ tuân theo phân phối chuẩn với số trung trình là µx và phương sai là n2x/σ. X ~ X N2xX==>σµ),( ~ NnXX(, )µσ2 Cao Hào Thi 69 6.2.5. Chuẩn hóa số trung bình mẫu X Đặt : ZXXX=−µσ Nếu X có số trung bình là µx và phương sai là σ2X thì Z có số trung bình là 0 và phương sai là 1. Nếu ()( )102,N~Z ,N~XXx==>σµ 6.2.6. Định lý giới hạn trung tâm (Central Limit Theorem) Khi n lớn thì nX ZXXσµ−= sẽ gần đúng có phân phối chuẩn chuẩn hóa hay X có phân phối chuẩn với số trung bình là µx phương sai nx2σ Khi n lớn ==> Z ~ N(0, 1) hay XNnXX~,µσ2⎛⎝⎜⎞⎠⎟ Thí dụ : Chiều dài của các cây thước kẻ trong dây chuyền sản xuất thước tuân theo phân phối chuẩn với µ = 30cm. Độ lệch chuẩn xung quanh số trung trung bình là σ = 0,1cm. Nhân viên thanh tra lấy mẫu với cỡ mẫu n = 4 và nhận thấy số trung bình của mẫu là X = 29875cm. Tìm xác suất để số trung bình của mẫu nhỏ hơn hoặc bằng 29875cm. Giải : ()⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡−≤⎟⎟⎟⎠⎞⎜⎜⎜⎝⎛−=〈40,13029875 nσ30X P 29875 XP = P (Z ≤ - 350) = 0,062 Thí dụ : Một nhà sản xuất phụ tùng xe ôtô cho biết tuổi thọ của phụ tùng xe tuân theo luật phân phối chuẩn với số trung bình là 36.000 dặm và độ lệch chuẩn là 4.000 dặm. Đối với một mẫu được chọn một cách ngẫu nhiên với cỡ mẫu là 16 thì tuổi thọ trung bình của mẫu là 34.500 dặm. Nếu nhà sản xuất nói đúng thì xác suất để số trung bình mẫu nhỏ hơn hoặc bằng giá trị của mẫu đã đo là bao nhiêu. Giải : ()⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎝⎛−〈−=〈164000000.36500.34 500.34 XXXPXPσµ = P (Z < -1,5) = 0,0668 Cao Hào Thi 70 Thí dụ: Giả sử tập hợp chính tuân theo phân phối chuẩn với µ = 40, σ 2 = 100 . Xµ = 40f(x) Lấy 1.000 mẫu ngẫu nhiên với cỡ mẫu 5. Gọi X là số trung bình của mẫu. X tuân theo phân phối chuẩn với số trung bình là µ = 40 phương sai σ2100520n==. Lấy 1.000 mẫu ngẫu nhiên với cỡ mẫu 10. Gọi X là số trung bình của mẫu. X tuân theo phân phối chuẩn với số trung bình là µ = 40, phương sai σ21001010n==. Xµ = 40f(x)Ν = 10Ν=5 Nhận xét : Phương sai của phân phối mẫu sẽ giảm khi cỡ mẫu tăng. 6.3. PHÂN PHỐI MẪU CỦA PHƯƠNG SAI MẪU 2xS. (Sampling Distribution Of The Sample Variance) Phân phối mẫu của phương sai mẫu là phân phối xác suất của phương sai mẫu 2xS. 6.3.1. Kỳ vọng của phương sai mẫu E (2xS) Phương sai mẫu ký hiệu là S2x. ()21211∑=−−=niXXXNSi Cao Hào Thi 71 Kỳ vọng của phương sai mẫu E(S2x) chính là phương sai của tập hợp chính 2Xσ . Nói cách khác, phân phối mẫu của (2xS) có số trung bình là 2Xσ. E(2xS) = 2Xσ Điều kiện : n < < N 6.3.2. Phương sai của phương sai mẫu Phương sai của phương sai mẫu được ký hiệu Var(2xS). Var(2xS) tùy thuộc vào luật phân phối của tập hợp chính. Nếu tập hợp chính tuân theo phân phối chuẩn thì ( )1n2SVar4X2X−σ= 6.3.3. Phân phối χ2 (Chi - squared Distribution) Biến ngẫu nhiên X2 tuân theo luật phân phối χ2 có độ tự do là n (degree of freedom) nếu hàm mật độ xác suất của X2 có dạng ⎪⎪⎩⎪⎪⎨⎧≤>⎟⎟⎠⎞⎜⎜⎝⎛⎟⎠⎞⎜⎝⎛νΓ=−−ν0 x neáu 00 x neáu e2x221xf2x1222X22*)( Ghi chú : ( )αχ2υ,α ∫∞−−=22221222)2()2/(1),(xdxxvexvpvxP Người ta lập bảng tính sẵn các giá trị diện tích P(x², ν) Biến ngẫu nhiên X tuân theo luật phân phối χ2 với độ tự do là ν được ký hiệu. X² ~ χ2v F(χ2) 0 χ2 Cao Hào Thi 72 6.3.4. Luật phân phối của 2x2xS1nσ− )( = χ²n-1 Ta có: X²n-1=2x2xS1nσ− )( = 2Xn1i2iXXσ∑−=)( Nếu tập hợp chính tuân theo luật phân phối chuẩn thì 2x2xS1nσ− )( tuân theo luật phân phối χ² với độ tự do là (n-1) X ~ N(µx, 2xσ ) => 2x2xS1nσ− )(~ χ²n-1 Thí dụ : Một nhà sản xuất sữa hộp muốn trọng lượng trung bình của các hộp sữa sản xuất ra phải gần bằng trọng lượng đã được quảng cáo. Giả sử phân phối trọng lượng của tập hợp chính tuân theo phân phối chuẩn. Nếu lấy ngẫu nhiên 20 hộp đem đi kiểm tra. Tìm 2 số K1 và K2 sao cho : a) P( 05,0)122=<KSxxσ b) P( 05,0)222=>KSxxσ Giải : a. 0,05 = (=<σ)12x2xKSP[2x2xS1nσ− )( < (n-1)K1] = P[χ²n-1 < (n-1) K1] Với cỡ mẫu n =20 và χ²n-1 là biến ngẫu nhiên có độ tự do n-1 = 19. Ta có : 0,05 = P[χ²n-1 <19K1] = P[ χ²19<19K1] hay 1-0,05 = 0,95= P[χ²n-1 >19K1] = P[χ²19>19K1] Tra bảng ta có : 19K1 = 10,12 K1 = 0,533 Ý nghĩa : Với xác suất 5%, phương sai của mẫu sẽ nhỏ hơn 53,3% lần phương sai của tập hợp chính. Hay P(2xS < 0,5332xσ ) = 0,05 b. 0,05 = P(])1()1([)222222KnSnPKSXxxx−>−=>σσ = P[χ²n-1 >(n-1)K2] 0,05= P[χ²19> 19K2] n : cỡ mẫu Cao Hào Thi 73 Tra bảng ta có : 19K2 = 30,14 K2 = 1,586 Ý nghĩa : Với xác suất 5%, phương sai của mẫu sẽ lớn hơn 58.6% phương sai của tập hợp chính. X5%5% P(2xS >1,586 2xσ ) = 0,05 . E [(X - E( X ))2] = E [( X - 6)2] vì E ( X ) = µx = 6 = [( 3-6 )2*0,1 + ( 4-6 )2*0,1 + ( 5-6 )2*0,2 + ( 6-6 )2*0,2 + ( 7-6 )2*0,2 + ( 8-6 )2 *0,1 + ( 9-6 )2*0,1]. chính σ2x = E[(Xi - µx)² = Σ(xi - µx)² * P(Xi) µx = 6; P(Xi) = 1/5 = 1/5[( 2-6 )² + (4 - 6)² + (6 -6 )² + ( 8-6 )² + (10 - 6)²] σ2x = 8 Phương