Ký hiệu X là đặc tính cần nghiên cứu trên các phần tử của tập hợp M. M gọi là tổng thể (population), số phần tử của M ký hiệu là N. Thông thường không thể lấy hết các phần tử của M để quan sát X vì những lý do sau
Chương 5: ƯỚC LƯỢNG THAM SỐ THỐNG KÊ I Mẫu thống kê Ký hiệu X đặc tính cần nghiên cứu phần tử tập hợp M M gọi tổng thể (population), số phần tử M ký hiệu N Thông thường lấy hết phần tử M để quan sát X lý sau - Số N lớn Thời gian kinh phí khơng cho phép Có thể làm hư hại hết phần tử M Vì người ta thường lấy số phần tử M để quan sát X, phần tử gọi mẫu (sample) lấy từ M Số phần tử mẫu gọi cỡ mẫu (sample size), ký hiệu n Điều kiện để chọn mẫu - Các phần tử mẫu lấy ngẫu nhiên từ M - Các phần tử M có đồng khả chọn làm mẫu - Các phần tử mẫu lấy cách độc lập với Phân phối lý thuyết X X P x1 x2 xN N N N Trong x giá trị quan sát X i phần tử thứ i M Giai đoạn lý thuyết (Chưa lấy mẫu cụ thể) Ký hiệu Xj giá trị quan sát X phần tử thứ j mẫu Khi ta có n biến ngẫu nhiên (X1 , …, Xn ) gọi mẫu lý thuyết lấy từ M Tính chất mẫu lý thuyết 1) Các Xj có phân phối X 2) Các Xj độc lập với Giai đoạn thực nghiệm (Đã lấy mẫu cụ thể) Khi lấy mẫu cụ thể xong ta có số liệu ( x1 , … , xn ) gọi mẫu thực nghiệm lấy từ X Phương pháp lấy mẫu ngẫu nhiên đơn giản - Đánh số phần tử M từ đến N - Lập phiếu đánh số từ đến N - Trộn phiếu, sau lấy có hồn lại n phiếu Các phần tử M có số thứ tự phiếu lấy chọn làm mẫu II Các đặc trưng mẫu X biến ngẫu nhiên cần nghiên cứu Ký hiệu EX = µ (trung bình tống thể) DX = σ (phương sai tống thể) Trung bình mẫu Giai đoạn lý thuyết Xét mẫu lý thuyết (X1 , …, Xn ) Trung bình mẫu xác định sau X n ngẫu nhiên X =biến X ∑ i n i =1 Ta tính kỳ vọng, phương sai Xđộ lệch n chuẩn : nµ EX = ∑ EX i = =µ n i =1 n DX = n DX = nσ σ DX i = = ∑ n n i =1 n σ n 2 Giai đoạn thực nghiệm Xét mẫu thực nghiệm : ( x1 , … , xnn ) X= x ∑ n i =1 a) Mẫu có X x1 lặp i Tổng xk ni n1 nk n Trong đó, mẫu ni tần số giá trị n1+ …+ nk = n k X = ∑ ni xi n i =1 xi Khoảng tin cậy cho tỷ lệ Giả sử tham số p tỷ lệ phần tử loại L tổng thể M Xét mẫu (X1 , …, Xn) với Xi = phần tử thứ i mẫu thuộc loại L Xi = ngược lại Cần tìm hai đại lượng p1(X1 , …, Xn), p2(X1 , …, Xn) cho P( p1 ≤ p ≤ p2 ) = γ • Xét mẫu cỡ lớn : nf ≥ 10, n(1-f ) ≥ 10 thống kê f−p Z= p (1 − p ) n ~ N (0,1) Trong f tỷ lệ mẫu Từ p1,2 = f ± z1+γ f (1 − f ) n Thí dụ 3: Kiểm tra 100 sản phẩm kho hàng thấy có 10 phế phẩm Ước lượng tỷ lệ phế phẩm kho hàng với ĐTC 95%, 99% Giải: Gọi p - tỷ lệ phế phẩm kho hàng Cần tìm KTC cho p Tỷ lệ mẫu: f = 10/100=0,1 nf ≥ 10, n(1-f ) ≥ 10 • Xét γ z1+;γ =0,95 p1,2 = f ± z1+γ = z0,975 = 1,96 f (1 − f ) n 0,1(1 − 0,1) = 0,1 ± 1,96 100 = 0,1 ± 0, 059 KTC: [ 0,04 ; 0,16 ] z • Xét γ =0,99 ; 1+γ p1,2 = f ± z1+γ = z0,995 = 2,58 f (1 − f ) n 0,1(1 − 0,1) = 0,1 ± 2,58 100 = 0,1 ± 0, 077 KTC: [ 0,02 ; 0,18 ] Nhận xét: ĐTC tăng KTC rộng Cỡ mẫu tăng KTC hẹp Độ xác ước lượng xác định cỡ mẫu 1) Trường hợp kỳ vọng Độ xác (sai số) ước X lượng cho tham số µ =EX với độ tin cậy γ số P ( X − µ ≤ ε ) = γ ε > cho P(−ε ≤ X − µ ≤ ε ) = γ Từ P( X − ε ≤ µ ≤ X + ε ) = γ So sánh với KTC cho kỳ vọng ta có ε = z1+γ σ n , σ biết ε = z1+γ S n , σ 2 • Cho ε γ tìm cỡ mẫu n σ n ≥ z1+γ ε S n ≥ z1+γ ε , σ2 biết , σ2 2) Trường hợp tỷ lệ Độ xác (sai số) ước lượng f cho tham số p với ĐTC γ số ε > P ( f − p ≤ ε ) = γ cho f (1 − f ) n Tương tự trên, so sánh với KTC cho tỷ lệ + γ ta có ε=z • Cho ε γ n ≥ z1+γ tìm cỡ mẫu n f (1 − f ) ε Thí dụ 4: Điều tra ban đầu 30 người thấy có người bị bệnh B Muốn tìm KTC 95% tỷ lệ bệnh B dân số phải lấy mẫu cỡ bao nhiêu, chấp nhận sai số 0,05 1+γ f=5/ 30 0,975 Giải: Tỷ lệ mẫu =z z γ =0,95 ; = 1,96 n ≥ z1+γ 2 f (1 − f ) = ε 5 − 30 30 = 1,96 0,05 = 213, 42 n=214 Thí dụ 5: Đo đường huyết 10 người tính phương sai mẫu điều chỉnh 0,04 Muốn cho chênh lệch tuyệt đối TB mẫu trung bình dân số 0,02g/l với ĐTC 95% phải lấy mẫu cỡ ? Giải: Ta có chênh lệch X − µ = 0,02 = ε γ =0,95 ; z1+γ = z0,975 = 1,96 2 S n ≥ z1+γ ε 0,04 = 1.96 = 384,16 0,02 n =385 ... < 30, σ khơng biết, X~N(µ , σ ): TH4 n −1 γ =0, 95 t; = t0,9 75 = +γ 2, 262 µ1,2 = X ± t1+γ n −1 S n 103,3 = 30, ± 2, 262 = 30, ± 7, 10 KTC: [ 23 ,5 ; 37,9 ] cg/l ... DX=σ - phương sai đường huyết dõn s Cn tỡm KTC cho C mu n=100 >30, σ biết: TH2 γ =0, 95 ; 1+γ z khơng = z0,9 75 = 1,96 µ1,2 = X ± z1+γ S n 10, 08 = 100 ± 1, 96 =100 ± 1, 98 100 KTC: [ 98,02 ; 101,98... 1(X1 , …, Xn ), θ 2(X1 , …, Xn ) cho P(θ ≤ θ ≤ θ ) = γ (*) với γ đủ lớn cho trước, thường γ = 95% hay 99% Xác suất γ gọi độ tin cậy ước lượng khoảng Khoảng [θ , θ 2] gọi khoảng tin cậy cho θ