TRƢỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Bài giảng TOÁN THỐNG KÊ Mục lục Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ 3 3 3 1.2. 3 3 3 3 2.2. 5
TRƢỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Bài giảng TOÁN THỐNG KÊ Mục lục Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ 3 3 3 1.2. 3 3 3 3 2.2. 5 5 5 2.2. 5 2.3. 6 8 4.1. 8 4.2. 8 4.3. kê 8 8 5.1. 8 - 2 ) 9 9 -Snedecor 10 10 11 Chương 5. ƢỚC LƢỢNG THAM SỐ 12 12 12 12 1.2. 12 13 a-/ 13 b- 13 c- 14 14 2.1. 14 15 a) 2 . 15 2 16 17 ) 17 19 20 ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 2 Chương 6. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 22 22 22 1.2. 22 23 23 23 a) 2 . 23 2 24 c) Chú thích: 25 27 28 22 xy σvà σ . 28 b) 22 xy σvà σ 29 c) Chú ý 30 31 2.5. 32 33 34 34 i 35 i 36 37 40 Chương 7. TƢƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH 45 45 45 45 45 45 45 46 46 46 47 48 III. 49 3.1. 49 3.2. 50 52 54 CÁC BẢNG SỐ 57 57 58 59 60 Bài giảng Toán Thống kê 3 Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ I. TỔNG THỂ VÀ MẪU 1.1. Tổng thể . in hoa N. 1.2. Mẫu ó n). x i 1 , x 2 , , x n ). B (x 1 , x 2 , , x n . 1.3. Các phƣơng pháp lấy mẫu nhiên. II. BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU 2.1. Sắp xếp số liệu 1 , x 2 , , x n i nhau là x 1 , x 2 k i < x i + 1 ) và có n i i ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 4 X x 1 x 2 x k n i n 1 n 2 n k T 1 + n 2 + n k = n. C i i n n f i i i Thí dụ: X (cm) 163 164 165 166 167 168 n i 2 3 5 5 4 1 c) ành phân min , x max k xx h minmax 0 x min ; x i = x 0 + i k x max i 1 , x i i 1 , x i )). thành X x 0 x 1 x 1 x 2 x k 1 x k n i n 1 n 2 n k T 1 + n 2 + n k = n. i n n f i i Thí dụ: 1,20 1,26 1,21 1,17 1,19 1,25 1,22 1,22 1,19 1,18 1,25 1,19 1,22 1,20 1,21 1,21 1,20 1,20 1,25 1,18 1,24 1,15 1,23 1,21 1,22 1,24 1,18 1,23 1,21 1,18 1,16 1,17 1,20 1,15 1,18 1,22 1,21 1,23 1,26 1,24 Ta có: x max = 1,26; x min = 1,15 (1,14; 1,16] X (kg) 1,14 1,16 1,16 1,18 1,18 1,20 1,20 1,22 1,22 1,24 1,24 1,26 n i 3 7 8 11 6 5 : X(kg) 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 1,26 n i 2 1 2 5 3 5 6 5 3 3 3 2 Bài giảng Toán Thống kê 5 2.2. Biểu diễn hình học của mẫu X x 1 x 2 x k f i f 1 f 2 f k và c X x 0 x 1 x 1 x 2 x k 1 x k f i f 1 f 2 f k i = i n n ó III. CÁC SỐ ĐẶC TRƢNG CỦA MẪU 3.1. Trung bình mẫu 1 , x 2 n n 1i i n21 x n 1 n x xx x (4.1) X x 1 x 2 x k n i n 1 n 2 n k thì: k 1i ii k21 kk2211 xn n 1 n nn xn xnxn x (4.1a) . 2.2. Phƣơng sai mẫu 1 , x 2 n 2 = n 1i 2 i )xx( n 1 (4.2) 4 n i (f i ) 5 (0,25) 4 (0,2) 3 (0.15) 2 (0,1) 1 (0,05) 0 163 164 165 166 167 168 X n i (f i ) 11 (11/40) 7 (7/40) 5 (5/40) 3 (3/40) 0 1,14 1,16 1,18 1,20 1,22 1,24 1,26 X ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 6 s* 2 = 2 n 1i 2 i 2 2 n 1i i n 1i 2 i 2 n 1i i n 1i 2 i xx n 1 n xxn x n 1 x n 1 (4.2a) 2 = k 1i 2 ii )xx(n n 1 (4.3) s* 2 = 2 k 1i 2 ii 2 2 n 1i n 1i ii 2 ii 2 k 1i ii k 1i 2 ii xxn n 1 n xnxnn xn n 1 xn n 1 (4.3a) 1 + n 2 k . độ lệch chuẩn 2 *s*s 2.3. Phƣơng sai hiệu chỉnh của mẫu 1 , x 2 n 2 = 2 *s 1n n s 2 = n 1i 2 i )xx( 1n 1 (4.4) 2 = 1n xnx )1n(n xxn 2 n 1i 2 i 2 n 1i i n 1i 2 i (4.4a) 2 = k 1i 2 ii )xx(n 1n 1 (4.5) 2 = 1n xnxn )1n(n xnxnn 2 k 1i 2 ii 2 k 1i ii k 1i 2 ii (4.5a) 1 + n 2 k . độ lệch chuẩn hiệu chỉnh 2 ss x i = xx i là i và x i n hay xa tâm x x . chỉ dùng phƣơng sai hiệu chỉnh của mẫu s 2 mà không dùng 2 Bài giảng Toán Thống kê 7 Thí dụ 1. ( X (cm) 163 164 165 166 167 168 n i 2 3 5 5 4 1 Giải: x, x 2 . Có hai cách - Cách 1: x n i n i x i n i x i 2 163 2 326 53138 164 3 492 80688 165 5 825 136125 166 5 830 137780 167 4 668 111556 168 1 168 28224 Tổng 20 3309 547511 - Cách 2: Tính theo hàng: n i x i n i x i 2 = 163 2 .2 + 164 2 2 = 547511 45,165 20 3309 x s* 2 = 2 )45,165( 20 547511 =1,84750 2 = 19 )45,165(20547511 2 = 1,94474 s = 1,3945 Thí dụ 2. X (kg) 1,14 1,16 1,16 1,18 1,18 1,20 1,20 1,22 1,22 1,24 1,24 1,26 n i 3 7 7 12 6 5 x i n i n i x i n i x i 2 1,14-1,16 1,15 3 3,45 3,9675 1,16-1,18 1,17 7 8,19 9,5823 1,18-1,20 1,19 7 8,33 9,9127 1,20-1,22 1,21 12 14,52 17,5692 1,22-1,24 1,23 6 7,38 9,0774 1,24-1,26 1,25 5 6,25 7,8125 Tổng 40 48,12 57,9216 40 12,48 x = 1,203 ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 8 2 = 2 )203,1( 40 9216,57 = 0,00083 * = 0,0288 2 = 39 )203,1(409216,57 2 = 0,00085 s = 0,0292 IV. MẪU NGẪU NHIÊN 4.1. Mẫu ngẫu nhiên Xét X. i (X 1 , X 2 n ). 1 , X 2 n i . 1 , x 2 n 1 , X 2 n ). 4.2. Các đặc trƣng của mẫu ngẫu nhiên kê (x 1 , x 2 n ) nhiên X nhiên (X 1 , X 2 n ) nó. là: : n X X n 1i i ; : n XX *S n 1i 2 i 2 ; và : 1n XX S n 1i 2 i 2 1 , x 2 n 4.3. Thống kê 1 , X 2 n G = G(X 1 , X 2 n ) các đặc trƣng của mẫu ngẫu nhiên là các thống kê. V. MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ 5.1. Các định lý về phân phối chuẩn Bài giảng Toán Thống kê 9 , 2 ) thì: Z = X ~ N(0, 1) 1 , X 2 n , 2 ) , thì: n ,N~X n 1 X 2 n 1i i n n 1 XE n 1 X n 1 EXE n 1i i n 1i i ; n n n 1 XD n 1 X n 1 DXD 2 2 2 n 1i i 2 n 1i i N( x , x 2 ), Y~N( y , y 2 ) thì X Y ~ N( x y , x 2 + y 2 ) (vì D(X Y) = D(X) + D(Y)) /2 ) sao cho: 1)2/(u |X| P X ~ N(, 2 ). (u /2 ) 1 = 1 (u /2 ) = 1 /2. /2). 5.2. Phân phối khi-bình phƣơng ( 2 ) Định nghĩa: 1 , X 2 n 2 n 2 2 2 1 2 X XX khi-. K 2 ~ 2 (n). 2 ~ 2 (n) P( 2 > 2 (, n) ) = 2 ~ 2 2 (, n) (hay 2 , n ) . 2 (-, dòng n. 2 (0,05; 4) = 9,488; 2 (0,95; 10) = 3,94 5.3. Phân phối Student Định nghĩa: 1 , X 2 n nhau n 1i 2 i X n 1 X T . K f(q) n 1 n 2 O 2 (,n 2 ) q 2 Đồ thị hàm mật độ biến 2 n bậc tự do (n 1 < n 2 ) f(t) /2 /2 -t(/2) O t(/2) t Đồ thị hàm mật độ biến Chuẩn tham số , 2 ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI 10 . P(|T| > t(/2, n) ) = trong /2, n) (hay t /2, n ). , dòng n. t(0,025; 31) = t(0,025;35) = t(0,025; n) = 1,96, n t(0,05; 31) = t(0,05;35) = t(0,05; n) = 1,645, n 5.4. Phân phối Fisher-Snedecor Định nghĩa: 1 , X 2 n và Y 1 , Y 2 m m 1i 2 i n 1i 2 i Yn Xm F P(F > F(,n,m) ) = ,n,m) (hay F , n, m ). khi- F(0,05; 12; 9) = 3,073 5.5. Phân vị mức 1 – P( X < X ) 1 P(X X ) F(X ) 1 )X(F 0 1dx)x(f)X(F X ) ; 2 (, n); t(, n); F( Chú ý là các u ; 2 , n ; t , n ; F , n, m . f(f) n 1 ,m 1 n 2 ,m 2 O F(,n 1 ,m 1 ) fF Đồ thị hàm mật độ biến Fisher n,m bậc tự do f(t) n 1 n 2 /2 /2 -t(/2,n 1 ) O t(/2,n 1 ) tT Đồ thị hàm mật độ biến Student n bậc tự do (n 1 > n 2 ) [...]... đó tìm đƣợc các thống kê G1 = G1(X1, X2, , Xn) và G2 = G2(X1, X2, , Xn) sao cho: P(G1 G2) = P (5.1) Vì P gần bằng 1, nên biến cố (G1 G2) hầu nhƣ xảy ra Với mẫu thống kê cụ thể (x1, x2, …, xn) của X, ta tính đƣợc: 1 = G1(x1, x2, …, xn), 2 = G2(x1, x2, …, xn) Vậy, với P cho trƣớc, ta xác định đƣợc khoảng (1, 2) chứa sao cho: P( [1, 2]) = P 14 Bài giảng Toán Thống kê - Khoảng [1,... là: [9,815 – 2,093 16 0,0319 0,0319 ; 9,815 + 2,093 ] [9,731; 9,899] (đồng/sản phẩm) 20 20 Bài giảng Toán Thống kê 2.3 Ƣớc lƣợng phƣơng sai của phân phối chuẩn Bài toán: Giả sử X là đại lƣợng ngẫu nhiên chuẩn N(, 2), trong đó D(X) = 2 chƣa biết Hãy tìm khoảng tin cậy của 2 với độ tin cậy P Chọn thống kê n 1S2 2 với S2 2 1 n Xi X thì n 1 i 1 Với mức tin cậy 1 – đã cho ta tìm... Khái niệm về bài toán ƣớc lƣợng tham số Giả sử khi nghiên cứu biến ngẫu nhiên X tồn tại trong một tập hợp chính nào đó, chúng ta đã biết quy luật phân phối xác suất của X, tuy nhiên còn tham số nào đó của X chƣa xác định đƣợc giá trị, ta phải tiến hành xác định giá trị của bằng một mẫu thống kê (x1, x2,…,xn) của X Bài toán xác định giá trị (gần đúng) của tham số nhƣ vậy gọi là bài toán ƣớc lƣợng.. .Bài giảng Toán Thống kê BÀI TẬP CHƢƠNG 4 (Các số trong dấu ngoặc đơn là số của bài tập tƣơng ứng trong sách giáo khoa) 1 (1)Điều tra năng suất lúa (X tạ/ha) trên 10 thửa ruộng đƣợc bảng số liệu sau: Thửa số X 1 2 3 4 5 6 7 8 9 10 45,5 46,0... thì G sẽ dần (theo xác suất) đến : lim P G 1 , >0 n Một ƣớc lƣợng điểm là chấp nhận đƣợc nếu nó đồng thời là ƣớc lƣợng không chệch, ƣớc lƣợng hiệu quả và ƣớc lƣợng vững 12 Bài giảng Toán Thống kê 1.3 Các ƣớc lƣợng điểm thƣờng gặp Với mẫu ngẫu nhiên (X1, X2, …, Xn) của X, trong đó Xi là các biến ngẫu nhiên độc lập có cùng phân phối xác suất với X và giả sử E(X) = , D(X) = 2 Ta có:... kiến 400 ngƣời và có 252 ngƣời trả lời là thích Hãy ƣớc lƣợng tỷ lệ ngƣời thích loại sản phẩm đó với độ tin cậy 0,90 252 0,63 Giải: Tần suất số ngƣời thích loại sản phẩm mới là: f 400 18 Bài giảng Toán Thống kê Ở đây = 1 – 0,90 = 0,10 Tra bảng chuẩn đƣợc u0,05 = 1,645 Khoảng tin cậy cần tìm của tỷ lệ ngƣời ƣa thích sản phẩm đó là: 0,63(1 0,63) 0,63(1 0,63) ; 0,63 1,645 0,63 1,645... khoảng ƣớc lƣợng [1, 2] I ƢỚC LƢỢNG ĐIỂM 1.1 Định nghĩa Giả sử cần ƣớc lƣợng tham số của đại lƣợng ngẫu nhiên X Một thống kê (một hàm) của mẫu ngẫu nhiên G = G(X1, …, Xn) dùng thay thể cho gọi là một ƣớc lƣợng của tham số Khi thay (X1, …, Xn) bằng một mẫu cụ thể (x1, …, xn) vào thống kê G thì đƣợc một giá trị cụ thể G0 = G(x1, …, xn) G0 gọi là ƣớc lƣợng điểm của Dễ thấy G là biến ngẫu nhiên (vì... cậy khác nhau nên cần phải chọn khoảng nào có độ rộng nhỏ nhất 2.2 Ƣớc lƣợng kỳ vọng (giá trị trung bình) của phân phối chuẩn Bài toán: Giả sử X là biến ngẫu nhiên chuẩn N(, 2), trong đó M(X) = chƣa biết Hãy tìm khoảng tin cậy của với độ tin cậy P cho trƣớc từ mẫu thống kê (x1, x2, …, xn) của X Giải: Nhƣ đã biết trong phần I, trung bình mẫu của mẫu ngẫu nhiên X 1 n Xi là ƣớc n i 1 lƣợng điểm... 8.7 Tra bảng 2 đƣợc: 2(0,025; 7) = 16,013; 2(0,975; 7) = 1,690; 2 Từ đó có khoảng tin cậy 95% của 2: 7 0,0364 7 0,0364 ; 1,69 16,013 (0,0159; 0,1508) 2.4 Ƣớc lƣợng xác suất (tỷ lệ) Bài toán: Giả sử mỗi cá thể trong tổng thể có đặc tính A với xác suất p (tỷ lệ cá thể có đặc tính A là p) (p chƣa biết) Hãy tìm khoảng tin cậy của p với độ tin cậy P cho trƣớc Giải: Ở 1.3c đã chứng minh... N p, , trong đó q = 1 – p n n 17 ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Fp Fp thì ~ N(0, 1) pq pq n n Do đó với xác suất P đã cho có thể tìm đƣợc phân vị chuẩn u/2 với = 1 P đƣợc: Bởi vậy, chọn thống kê: | F p | u = P P| F p | u pq = P P pq n 2 2 n Lấy mẫu cụ thể với n cá thể, trong mẫu có k cá thể có tính chất A thì tính tần suất cá thể có k