Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 54 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
54
Dung lượng
1,64 MB
Nội dung
3/2/2012 Chương Phân bố Xác suất Nội dung Các dạng phân bố Phân bố nhị thức Phân bố Poisson Phân bố chuẩn Phân bố mẫu 02/03/2012 Biostatistics - Bùi Tấn Anh 3/2/2012 • • • • • Các dạng phân bố Phân bố nhị thức Phân bố Poisson Phân bố chuẩn Phân bố mẫu 02/03/2012 Biostatistics - Bùi Tấn Anh Phân bố đối xứng • Chiều cao 100 người nam 168.0 172.0 175.3 175.0 164.9 175.5 173.6 164.2 178.9 164.0 176.8 173.5 02/03/2012 167.6 167.8 166.9 173.5 175.6 174.1 171.7 167.6 171.1 174.2 162.8 167.2 172.3 172.0 166.7 179.3 174.7 181.0 164.9 171.1 167.6 170.0 166.6 164.8 166.1 170.1 160.3 170.4 168.6 168.4 174.2 167.8 172.3 167.6 172.4 163.9 168.3 172.6 171.0 166.6 172.8 174.5 170.6 173.4 172.4 172.5 171.0 172.3 175.9 171.2 164.1 164.9 167.2 176.8 169.5 Biostatistics - Bùi Tấn Anh 176.3 166.8 172.0 170.0 170.1 177.9 168.7 171.8 171.2 168.1 170.6 167.2 167.9 162.4 162.5 173.8 165.8 170.5 166.7 171.1 172.0 169.5 166.0 166.3 167.7 165.9 172.0 176.7 163.1 165.3 174.0 167.3 166.4 3/2/2012 Stat > Basic statistics > Graphical summary… Summary for Height A nderson-D arling N ormality Test 160 164 168 172 176 180 A -S quared P-V alue 0.39 0.369 M ean StD ev V ariance Skew ness Kurtosis N 170.06 4.21 17.75 0.157839 -0.405964 100 M inimum 1st Q uartile M edian 3rd Q uartile M aximum 160.30 166.83 170.25 172.75 181.00 95% C onfidence Interv al for M ean 169.23 170.90 95% C onfidence Interv al for M edian 168.25 171.20 95% C onfidence Interv al for S tD ev % C onfidence Inter v als 3.70 4.89 Mean Median 168.0 168.5 02/03/2012 169.0 169.5 170.0 170.5 171.0 Biostatistics - Bùi Tấn Anh Nhận xét • Giá trị trung bình (170.1 cm; khoảng tin cậy 95% 169.23 – 170.90) trung vị (170.3 cm; khoảng tin cậy 95% 168.25 – 171.20) xấp xỉ • Kiểm định Anderson-Darling P-value > 0.05 Phân bố chuẩn, đối xứng qua giá trị trung bình 02/03/2012 Biostatistics - Bùi Tấn Anh 3/2/2012 Phân bố lệch dương • Số tế bào trứng 100 dê 4100 4500 21400 9400 13400 2700 4900 10000 3000 3800 11900 3600 3900 9000 13200 4100 5600 2400 5900 2700 1700 1900 2500 3600 1300 4300 4400 1600 4800 12200 6000 1500 4500 1200 02/03/2012 6200 6400 2500 2400 4500 2200 5600 2000 9600 7300 5600 6600 15900 4100 5400 2800 6700 10400 3100 5400 2600 12000 5500 2200 4500 2500 4500 5200 7500 3100 4700 7500 2000 3300 2900 9300 3700 4800 10800 3800 6000 7400 6400 12300 2300 7800 3600 4100 1800 4900 5800 2600 13000 3600 2900 5300 6800 3300 2400 10500 2900 6600 9900 5900 2300 6600 Biostatistics - Bùi Tấn Anh Stat > Basic statistics > Graphical summary… Summary for Oocysts A nderson-D arling N ormality Test 4000 8000 12000 16000 A -S quared P-V alue < 3.78 0.005 M ean StD ev V ariance Skew ness Kurtosis N 5551.0 3597.0 12938483.8 1.59382 3.30152 100 M inimum 1st Q uartile M edian 3rd Q uartile M aximum 20000 1200.0 2900.0 4500.0 6675.0 21400.0 95% C onfidence Interv al for M ean 4837.3 6264.7 95% C onfidence Interv al for M edian 4048.5 5425.8 95% C onfidence Interv al for S tD ev % C onfidence Inter v als 3158.2 4178.6 Mean Median 4000 02/03/2012 4500 5000 5500 6000 Biostatistics - Bùi Tấn Anh 6500 3/2/2012 Nhận xét • Kiểm định Anderson-Darling: P-value < 0.05 Không có phân bố chuẩn • Phân bố có đuôi dài lệch phía bên phải Giá trị skewness lớn (1.59) • Trong box plot chiều dài whisker không nhau, trung vị không nằm box • Có giá trị ngoại lai (outliers) bên phải • Số trung bình (5551) > số trung vị (4500) 02/03/2012 Biostatistics - Bùi Tấn Anh Phân bố lệch âm • Tần số gen 100 bò 49 47 48 48 49 48 45 50 02/03/2012 47 45 48 47 50 50 48 49 49 47 47 46 49 44 47 48 46 48 48 47 50 48 48 47 47 47 50 49 49 48 43 49 50 46 50 47 50 46 48 43 49 44 49 49 48 49 49 48 47 47 49 47 48 49 47 48 47 47 49 47 47 47 48 49 Biostatistics - Bùi Tấn Anh 48 45 49 48 48 50 47 46 50 45 48 50 46 47 46 47 50 47 50 46 47 47 47 48 47 48 48 46 10 3/2/2012 Stat > Basic statistics > Graphical summary… Summary for Gene+ A nderson-Darling Normality Test 44 46 48 A -Squared P -V alue < 2.32 0.005 M ean S tD ev V ariance S kew ness K urtosis N 47.680 1.563 2.442 -0.617526 0.581375 100 M inimum 1st Q uartile M edian 3rd Q uartile M aximum 50 43.000 47.000 48.000 49.000 50.000 95% C onfidence Interv al for M ean 47.370 47.990 95% C onfidence Interv al for M edian 47.000 48.000 95% C onfidence Interv al for StDev % Confide nce Inter v als 1.372 1.815 Mean Median 47.0 02/03/2012 47.2 47.4 47.6 47.8 48.0 Biostatistics - Bùi Tấn Anh 11 Nhận xét • Kiểm định Anderson-Darling: P-value < 0.05 Không có phân bố chuẩn • Phân bố có đuôi dài lệch phía bên trái Giá trị skewness âm (- 0.62) • Trong box plot chiều dài whisker không nhau, trung vị không nằm box • Có giá trị ngoại lai (outliers) bên trái • Số trung bình (47.68/g) < số trung vị (48) 02/03/2012 Biostatistics - Bùi Tấn Anh 12 3/2/2012 • • • • • Các dạng phân bố Phân bố nhị thức Phân bố Poisson Phân bố chuẩn Phân bố mẫu 02/03/2012 Biostatistics - Bùi Tấn Anh 13 Tổng quan • Một phép thử có hai khả xảy ra: “thành công” “thất bại” – xác suất thành công – xác suất thất bại 1- gọi phép thử Bernoulli • Phân bố số lần phép thử thành công gọi phân bố nhị thức 02/03/2012 Biostatistics - Bùi Tấn Anh 14 3/2/2012 Thí dụ • Tiếp xúc với hóa chất độc hại: có không • Trả lời câu hỏi trắc nghiệm: sai • Kiểm tra chất lượng sản phẩm: đạt không 02/03/2012 Biostatistics - Bùi Tấn Anh 15 Hàm xác suất • Hàm xác suất P X x Cxn x (1 ) n x • đó: – x = 0, 1,…, n – n: số phép thử – : xác suất thành công phép thử 02/03/2012 Biostatistics - Bùi Tấn Anh 16 3/2/2012 Trung bình phương sai • Trung bình m E x n • Phương sai s n (1 ) 02/03/2012 Biostatistics - Bùi Tấn Anh 17 Áp dụng Minitab • Calc > Probability Distributions > Binomial 02/03/2012 Biostatistics - Bùi Tấn Anh 18 3/2/2012 Áp dụng Minitab 02/03/2012 Biostatistics - Bùi Tấn Anh 19 Áp dụng Minitab • Các tuỳ chọn: – Probability: tính hàm mật độ xác suất (PDF) P(X=x) – Cummulative probability: tính hàm phân bố tích lũy (CDF) P ( X Calculator 02/03/2012 Biostatistics - Bùi Tấn Anh 79 Chuyển dạng bậc Summary for SqrtCnt A nderson-D arling N ormality Test 1.2 1.6 2.0 2.4 2.8 A -S quared P -V alue < 50 0.005 M ean S tD ev V ariance S k ew ne ss Kurtosis N 2.1040 0.5040 0.2540 -0.137839 -0.132102 400 M inim um 1st Q ua rtile M edia n 3rd Q ua rtile M axim um 3.2 1.0000 1.7321 2.0000 2.4495 3.4641 95% C onfide nce I nte rv al for M ean 2.0544 2.1535 95% C onfidence I nterv al for M edian 2.0000 2.2361 95% C onfide nce I nte rv al for S tD ev % C o nf id ence Inte r v als 0.4713 0.5415 Mean Median 2.00 02/03/2012 2.05 2.10 2.15 2.20 2.25 Biostatistics - Bùi Tấn Anh 80 40 3/2/2012 Chuyển dạng bậc • Chuyển dạng thành công (mặc dù P < 0.05) Probability Plot for Square Root Count 0.999 Mean StDev N AD P-Value 0.99 0.95 2.104 0.5040 400 4.497 [...]... lần đẻ là 0.5 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 23 Giải Dạng phân bố là nhị thức với = 0.5 và n = 3: P{ X x} C x3 (0.5) x (0.5 )3 x với x = 0, 1, 2, 3 x=0 P{ X 0} C 03 (0.5)0 (0.5 )3 0.125 x=1 P{ X 1} C 13 (0.5)1(0.5)2 0 .37 5 x=2 P{ X 2} C 23 (0.5) 2 (0.5)1 0 .37 5 x =3 P{ X 3} C 33 (0.5 )3 (0.5)0 0.125 Trung bình và phương sai của phân bố là: μ = n = (3) (0.5) = 1.5 σ2... lục → P(Z Display data >/Columns, constants, and matrices to display: K1 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 66 33 3/ 2/2012 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 67 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 68 34 3/ 2/2012 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 69 Kiểm tra phân bố chuẩn • Dùng một trong ba phương pháp: – Anderson-Darling: là phương pháp... Anh 44 22 3/ 2/2012 Hình dạng • Theo tính chất toán học thì sự phân bố mẫu thí nghiệm sẽ có: – 68,26% dữ liệu nằm trong khoảng m 1s – 95,46% dữ liệu nằm trong khoảng m + 2s – 99, 73% dữ liệu nằm trong khoảng m + 3s 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 45 Hàm mật độ xác suất 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 46 23 3/2/2012 Hàm phân bố tích lũy 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 47 Hình dạng.. .3/ 2/2012 Hình dạng • Phụ thuộc vào: –n – 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 21 Hình dạng Distribution Plot Binomial, n=20 0 .30 p 0.5 0.2 0.1 0.25 Probability 0.20 0.15 0.10 0.05 0.00 0 5 10 15 20 X 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 22 11 3/ 2/2012 Thí dụ 1 • Hãy xác định phân bố xác suất số bê cái được sinh ra trong ba lần đẻ liên tiếp Giả sử rằng mỗi lần bò chỉ đẻ một con và xác suất sinh. .. 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 31 Áp dụng Minitab 02/ 03/ 2012 Biostatistics - Bùi Tấn Anh 32 16 3/ 2/2012 Áp dụng Minitab • Các tuỳ chọn: – Probability: tính hàm mật độ xác suất (PDF) P(X=x) – Cummulative probability: tính hàm phân bố tích lũy (CDF) P ( X