Bài giảng Xác suất thống kê - Chương 5: Lý thuyết mẫu cung cấp cho người học các kiến thức: Phương pháp mẫu, phân phối của trung bình mẫu, các thuật ngữ, phân phối xác suất của thống kê mẫu,...Mời các bạn cùng tham khảo nội dung chi tiết.
2/16/2019 Phương pháp mẫu Chương LÝ THUYẾT MẪU Tổng thể (population) Mẫu (Sample) Tham số (parameter) Thống kê (statistic) Nội dung Tóm tắt tổng thể mẫu • Trong lý thuyết mẫu hay thống kê suy diễn ta thường dùng đặc trưng mẫu (statistic) để ước tính đặc trưng tổng thể (parameter) • Nếu ta lấy mẫu cỡ n từ tổng thể điều xảy ra? Trung bình mẫu có quy luật phân phối gì? Tỷ lệ mẫu có quy luật gì? • Để ước tính trung bình tổng thể ta dùng đặc trưng mẫu? Tương tự cho tham số khác tỷ lệ phương sai? • Phải hiểu rõ quy luật phân phối mẫu (sampling distribution) Kích thước Trung bình Phương sai Độ lệch chuẩn Tỷ lệ A Tổng thể Mẫu TQ Mẫu cụ thể N n n EX X x V X S ; S ;S s ; s ;s 2 * 2 V X S; S; S * s; s; s * p P A F f Các thuật ngữ * Phân phối trung bình mẫu • Tham số (Parameters) đại lượng số đặc trưng tổng thể Đây giá trị cố định • Thống kê (Statistics) đại lượng đặc trưng mẫu Chúng biến đổi từ mẫu sang mẫu khác nhìn chung biến ngẫu nhiên Ta cố gắng xác định quy luật phân phối xác suất biến ngẫu nhiên Từ tìm cách suy diễn cho tổng thể • Sai số chuẩn (Standard error) độ lệch chuẩn thống kê mẫu • Độ lệch chuẩn (Standard deviation) liên quan đến mẫu • Một bể cá lớn từ trại cá giống chuyển đến hồ Ta muốn biết chiều dài trung bình cá bể Thay đo chiều dài toàn cá bể ta chọn ngẫu nhiên mẫu sử dụng trung bình mẫu để ước lượng cho trung bình tổng thể • Đặt trung bình mẫu 𝑋 Giá trị 𝑋 ngẫu nhiên phụ thuộc vào mẫu chọn • Trung bình mẫu 𝑋 gọi thống kê • Trung bình tổng thể cố định, ta ký hiệu μ • Phân phối trung bình mẫu phân phối biến ngẫu nhiên 𝑋 • Thơng thường, phân phối trung bình mẫu phức tạp ngoại trừ trường hợp cỡ mẫu nhỏ lớn • Phương pháp chọn mẫu ngẫu nhiên, khơng hồn lại 2/16/2019 Ví dụ minh họa Chọn mẫu cỡ n=2 • Tổng thể trọng lượng sáu bí ngơ (kg) trưng bày gian hàng trò chơi "đốn trọng lượng" hội chợ Bạn u cầu đốn trọng lượng trung bình sáu bí ngơ cách lấy mẫu ngẫu nhiên mà khơng hồn lại từ tổng thể Quả bí A B C D E F Trọng lượng (kg) 19 14 15 10 17 Sample A, B A, C A, D A, E A, F B, C B, D B, E B, F Weight 19, 14 19, 15 19, 19, 10 19, 17 14, 15 14, 14, 10 14, 17 𝑋 16.5 17.0 14.0 14.5 18.0 14.5 11.5 12.0 15.5 Probability 1/15 1/15 1/15 1/15 1/15 1/15 1/15 1/15 1/15 Sample C, D C, E C, F D, E D, F E, F Weight 15, 15, 10 15, 17 9, 10 9, 17 10, 17 𝑋 12.0 12.5 16.0 9.5 13.0 13.5 Probability 1/15 1/15 1/15 1/15 1/15 1/15 E X 14 Bảng phân phối xác suất trung bình mẫu: Trung bình tổng thể: μ=14 (kg) 𝑋 9.5 11.5 12.0 12.5 13.0 13.5 14.0 14.5 15.5 16.0 16.5 17.0 18.0 P 1/15 1/15 2/15 1/15 1/15 1/15 1/15 2/15 1/15 1/15 1/15 1/15 1/15 Chọn mẫu cỡ n=5 Sample A, B, C, D, E A, B, C, D, F A, B, C, E, F A, B, D, E, F A, C, D, E, F B, C, D, E, F 𝑋 P Weight 19, 14, 15, 9, 10 19, 14, 15, 9, 17 19, 14, 15, 10, 17 19, 14, 9, 10, 17 19, 15, 9, 10, 17 14, 15, 9, 10, 17 13.0 1/6 13.4 1/6 𝑋 13.4 14.8 15.0 13.8 14.0 13.0 13.8 1/6 14.0 1/6 Tổng hợp Probability 1/6 1/6 1/6 1/6 1/6 1/6 14.8 1/6 • • • • • 15.0 1/6 E X 14 Nếu cỡ mẫu lớn thì? Cần chọn mẫu cỡ bao nhiêu? Trung bình mẫu có quy luật phân phói nào? Xu hướng trung tâm trung bình mẫu là? Mức độ biến động trung bình mẫu so với xu hướng trung tâm? 10 Tổng thể tham số tổng thể Phân phối xác suất thống kê mẫu • Bị ảnh hưởng bởi: • Kích thước N, gồm phần tử có dấu hiệu nghiên cứu X • X: bnn gốc tổng thể • PPXS X ppxs tổng thể • Các tham số tổng thể tham số đặc trưng bnn X Cỡ mẫu Phân phối tổng thể Cách thức chọn mẫu E X ; 11 V X ; p P X 12 2/16/2019 Các đặc trưng mẫu (statistic) Mẫu ngẫu nhiên – tổng quát • Định nghĩa Tập hợp n biến ngẫu nhiên độc lập X1, X2, …, Xn thành lập từ biến ngẫu nhiên gốc X gọi mẫu ngẫu nhiên cỡ n (kích thước n) • Ký hiệu: W=(X1, X2, …, Xn) Xi bnn • Xi có quy luật phân phối với X E Xi E X • Trung bình mẫu: 𝑋= • Phương sai mẫu: 𝑆 = V Xi V X • Một phép thử với mẫu ngẫu nhiên mẫu cụ thể gồm n quan sát w=(x1,x2,…,xn) 𝑆 𝑆∗ 2 𝑛−1 = 𝑛 = 𝑛 𝑛 𝑋1 + 𝑋2 + +𝑋𝑁 𝑛 Tỷ lệ mẫu: 𝑛 𝑋𝑖 − 𝑋 F 𝑖=1 𝑋𝑖 − 𝑋 𝑋𝑖 − 𝜇 𝑖=1 𝑛 𝑖=1 13 Tính chất thống kê mẫu V X • Phương sai mẫu: E S2 2 n X n n1 E S Điều tra thời gian sử dụng internet tuần 90 sinh viên trường ta bảng số liệu sau: n Thời gian (giờ) Số sv E S *2 2 V F 8 17 24 20 14 Hãy tính thống kê mẫu sau: a) Trung bình mẫu, phương sai mẫu (đã hiệu chỉnh), phương sai mẫu chưa hiệu chỉnh? b) Tỷ lệ sinh viên mẫu có thời gian sử dụng tuần? • Tỷ lệ mẫu: E F p 14 Thực hành tính thống kê mẫu • Trung bình mẫu: E X p 1 p n 15 16 Cách 1_Lập bảng xi … … Tổng ni … … xini … … n i n ni s x n x n i i xi Tổng x n x n x Cách 1_Lập bảng (xi)2ni … … i i i i Y n xn i i n n s2 s n 1 17 ni 17 24 20 14 90 xini 21 32 85 144 140 112 534 (xi)2ni 63 128 425 864 980 896 3356 18 2/16/2019 Cách 1_Lập bảng Cách dùng máy tính 570ES n ni 90 • Cỡ mẫu: • Trung bình mẫu: x xn i i n 534 5,9333 90 Shift + + + = + =: Reset máy Shift + Mode + + + 1: bật tần số (frequency on) Mode + + 1: vào tính thống kê biến (stat1-var) Khi ta có bảng sau: • Phương sai mẫu chưa hiệu chỉnh: xn s n x i i 2 X 2,0844 • Phương sai mẫu hiệu chỉnh: Độ lệch mẫu hiệu s2 n s n 1 chỉnh: 2,1078 FREQ s 2,1078 1, 4518 19 Cách dùng máy tính 570ES Cách 2_dùng máy tính 570ES Lấy số liệu thống kê: Shift + + (4) Chọn Var Ta có bảng sau: • Ta nhập vào sau: X 20 FREQ 17 24 20 14 1: n 2: x 3: x 4: sx Tương ứng: 1: cỡ mẫu 2: trung bình mẫu Độ lệch chuẩn mẫu Độ lệch chuẩn mẫu hiệu chỉnh • Nhấn AC để 21 Ví dụ Số lần tương ứng 10 22 Mô phân phối mẫu • http://onlinestatbook.com/stat_sim/sampling_dis t/index.html • http://www.jbstatistics.com/samplingdistributions/ • https://newonlinecourses.science.psu.edu/stat41 4/node/132/ • https://shiny.rit.albany.edu/stat/ Lượng xăng hao phí tơ từ A đến B sau 30 lần chạy kết cho bảng Lượng xăng hao phí 9,6 – 9,8 9,8 – 10 10 – 10,2 10,2 – 10,4 10,4 – 10,6 Khơng phải phương sai a) Tính trung bình mẫu b) Tính độ lệch chuẩn mẫu c) Tính độ lệch chuẩn mẫu hiệu chỉnh 23 24 2/16/2019 Phân phối xác suất thống kê mẫu • • • • Tổng thể có phân phối chuẩn • Cho tổng th cú phõn phi chun Bin nn gc X~N(à; σ2) • Ta có: A Biến ngẫu nhiên gốc có phân phối chuẩn B Biến ngẫu nhiên gốc có phân phối B(1,p) C Hai tổng thể có phân phối chuẩn D Hai tần suất hai tổng thể X 2 X ~ N , n X n S Z n S * 2 n ~ N 0;1 ~ t n 1 ~ n Z n 1 S ~ n 25 Tổng thể có phân phối nhị thức • • • • 26 Hai tổng thể có phân phối chuẩn Gọi p tỷ lệ tính chất A tổng thể Khi ppxs bnn gốc X là: B(1;p) hay A(p) Lấy mẫu nn cỡ n, gọi F tỷ lệ mẫu Ta có: • Cho hai tổng thể bnn gốc: X ~ N X ; X2 ; Y ~ N Y ; Y2 • Ta tiến hành lấy mẫu độc lập: W n X , X , , X n p 1 p F p n F ~ N p; ~ N 0;1 n p 1 p W m Y1 , Y2 , , Ym • Các thống kê mẫu tương ứng: X X X X n n Y S X2 Y1 Y2 Ym m SY2 27 Hai tổng thể có phân phối chuẩn • Ta có: 28 Hai tổng thể có phân phối chuẩn • Nếu chưa biết phương sai mẫu lớn m>30, n>30 thì: 2 2 X ~ N X ; X ; Y ~ N Y ; Y n m X2 Y2 X Y ~ N X Y ; n m Z X Y X Y S X2 SY2 n m N 0;1 • Do đó: X Y X2 n X Y Y2 ~ N 0;1 m 29 30 2/16/2019 Hai tổng thể có pp Chuẩn, mẫu nhỏ Hai tổng thể có pp Chuẩn, mẫu nhỏ • Hai tổng thể có phân phối chuẩn • Trường hợp mẫu nhỏ (m hay n30 • Đã biết hai phương sai Z X Y X2 n X Y Y2 • • • • N 0;1 Z m • Chưa biết hai phương sai: Z X Y X Y S X2 SY2 n m Cho hai tổng thể có tỷ lệ p1; p2 Lấy mẫu cỡ n từ tổng thể 1, tần suất mẫu F1=k1/n Lấy mẫu cỡ m từ tổng thể 2, tỷ lệ mẫu F2=k2/m Với n, m đủ lớn ta có: F1 F2 p1 p2 p1 1 p1 p2 1 p2 n m ~ N 0;1 N 0;1 35 36 2/16/2019 Tóm tắt tổng thể mẫu Tổng thể Kích thước Trung bình Phương sai Độ lệch chuẩn Mẫu cụ thể N n n EX X x V X Tỷ lệ A Mẫu TQ PPXS hai mẫu độc lập N, t S ; S ;S s ; s ;s 2 * 2 Tổng thể * 2 V X S; S; S * s; s; s * p P A F f Trung bình Phương sai Tỷ lệ 2 Mẫu TQ X ; Y X ;Y X2 ; Y2 S X2 ; SY2 s ; s ;s p1 ; p2 F1 ; F2 f1 ; f Tổng hợp phân phối mẫu ~ ??? F p n ~ ??? p 1 p X ~ ??? S 2 ~ ??? * F N 38 • Giả sử bạn lấy mẫu 100 giá trị từ tổng thể có trung bình 500 độ lệch chuẩn 80 Tính xác suất để trung bình mẫu nằm khoảng (490, 510) n n 1 S N, t Ví dụ • Một tổng thể n x; y N 37 X Mẫu cụ thể nS *2 2 ~ ??? • Hai tổng thể X X 1 2 ~ ??? ??? F1 F2 p1 p2 ~ ??? ??? X X 1 2 ??? S / 12 ~ ??? S2 / ~ ??? S1*2 / 12 ~ ??? S2*2 / 2 39 40 Ví dụ Ví dụ Một mẫu kích thước n rút từ tổng thể phân phối chuẩn với trung bình μ độ lệch chuẩn 10 Hãy xác định n cho: Trọng lượng loại sản phẩm biến ngẫu nhiên phân phối chuẩn với trung bình 20,5 độ lệch chuẩn Lấy ngẫu nhiên sản phẩm để kiểm tra với xác suất 0,95 trọng lượng trung bình chúng sai lệch so với trọng lượng qui định tối đa bao nhiêu? b) P X 0,9544 a) P 10 X 10 0,9544 41 42 2/16/2019 Ví dụ Ví dụ • Chiều dài loại sản phẩm bnn pp chuẩn với trung bình 20 m độ lệch chuẩn 0,2 m Lấy mẫu ngẫu nhiên 25 sp a) Cho biết ppxs trung bình mẫu Tính kỳ vọng phương sai b) Xs để trung bình mẫu tối thiểu 30,06m c) Tìm số k để tỷ số phương sai mẫu hiệu chỉnh phương sai tổng thể k có xác suất 0,1 • Giả sử X suất lúa vùng A có pp chuẩn với phương sai (tạ/ha)2 Lấy mẫu ngẫu nhiên kích thước 100 Tính xác suất để: 43 44 100 P Xi X i 1 270 ... phối xác suất trung bình mẫu: Trung bình tổng thể: μ=14 (kg)