Bài giảng toán thống kê

61 672 0
Bài giảng toán thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

I. TỔNG THỂ VÀ MẪU 1.1. Tổng thể . Trong thực tế và trong khoa học chúng ta thường phải khảo sát một tập hợp có rất nhiều phần tử. Chẳng hạn khảo sát chiều cao của thanh niên Việt nam thì mọi thanh niên Việt nam đều là đối tượng cần khảo sát hay khảo sát nang suất của giống lúa A thì đối tượng khảo sát là mọi thửa ruộng trồng giống lúa A. Trong lý thuyết toán thống kê, người ta gọi các tập hợp đó là tổng thể (còn gọi là tập hợp chính hoặc đám đông). Số lượng các cá thể của tổng thể gọi là kích thước của tổng thể, thường ký hiệu bằng chữ in hoa N.

TRƯỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Bài giảng TOÁN THỐNG KÊ Mục lục Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ I. TỔNG THỂ VÀ MẪU 3 1.1. Tổng thể 3 1.2. Mẫu 3 1.3. Các phương pháp lấy mẫu 3 II. BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU 3 2.1. Sắp xếp số liệu 3 2.2. Biểu diễn hình học của mẫu 5 III. CÁC SỐ ĐẶC TRƯNG CỦA MẪU 5 3.1. Trung bình mẫu 5 2.2. Phương sai mẫu 5 2.3. Phương sai hiệu chỉnh của mẫu 6 IV. MẪU NGẪU NHIÊN 8 4.1. Mẫu ngẫu nhiên 8 4.2. Các đặc trưng của mẫu ngẫu nhiên 8 4.3. Thống kê 8 V. MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ 8 5.1. Các định lý về phân phối chuẩn 8 5.2. Phân phối khi-bình phương (2) 9 5.3. Phân phối Student 9 5.4. Phân phối Fisher-Snedecor 10 5.5. Phân vị mức 1 –  10 BÀI TẬP CHƯƠNG 4 11 (Các số trong dấu ngoặc đơn là số của bài tập tương ứng trong sách giáo khoa) 11 Chương 5. ƯỚC LƯỢNG THAM SỐ Khái niệm về bài toán ước lượng tham số 12 I. ƯỚC LƯỢNG ĐIỂM 12 1.1. Định nghĩa 12 1.2 Các loại ước lượng 12 1.3. Các ước lượng điểm thường gặp 13 b-/ Phương sai mẫu ngẫu nhiên hiệu chỉnh: 13 II. ƯỚC LƯỢNG KHOẢNG 14 2.1. Khoảng tin cậy. Độ tin cậy 14 2.2. Ước lượng kỳ vọng (giá trị trung bình) của phân phối chuẩn 15 a) Trường hợp biết phương sai D(X) = σ2 15 b) Trường hợp không biết phương sai 2 16 2.3. Ước lượng phương sai của phân phối chuẩn 17 2.4. Ước lượng xác suất (tỷ lệ) 17 2.5. Kích thước mẫu cần thiết 19 BÀI TẬP CHƯƠNG 5 20 ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Chương 6. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ I. GIẢ THUYẾT, ĐỐI THUYẾT 22 1.1. Giả thuyết, đối thuyết 22 1.2. Quy tắc kiểm định giả thuyết 22 1.3. Các loại sai lầm 23 II. CÁC BÀI TOÁN KIỂM ĐỊNH THAM SỐ 23 2.1. Kiểm định kỳ vọng của biến chuẩn 23 a) Trường hợp biết phương sai σ2 23 b) Trường hợp chưa biết phương sai 2 24 2.2. Kiểm định một xác suất (tỷ lệ) 26 2.3. Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu độc lập 28 a) Trường hợp biết 28 b) Trường hợp không biết 28 c) Chú ý 30 2.4. Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu theo cặp 30 2.5. Kiểm định sự bằng nhau của phương sai hai biến chuẩn 32 2.6. Kiểm định sự bằng nhau của hai xác suất (so sánh hai tỷ lệ) 33 III. MỘT VÀI KIỂM ĐỊNH PHI THAM SỐ 34 3.1. Kiểm định luật phân phối xác suất 34 a) Trường hợp các pi đã biết 34 b) Trường hợp các pi phụ thuộc các tham số chưa biết 36 3.2. Kiểm định sự độc lập của hai đặc tính định tính 37 BÀI TẬP CHƯƠNG 6 40 Chương 7. TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH I. MẪU THỐNG KÊ HAI CHIỀU 45 1.1. Biến ngẫu nhiên hai chiều 45 1.2. Mẫu thống kê hai chiều 45 a) Nếu mẫu nhỏ (n nhỏ) 45 b) Nếu mẫu lớn và có nhiều số liệu trùng nhau 45 c) Nếu mẫu lớn và các số liệu ít trùng nhau 45 II. HỆ SỐ TƯƠNG QUAN 46 2.1. Sự liên hệ tương quan 46 2.2. Hệ số tương quan lý thuyết 46 2.2. Hệ số tương quan mẫu 47 2.3. Kiểm định sự tương quan 48 III. HỒI QUY TUYẾN TÍNH 49 3.1. Hàm hồi quy lý thuyết 49 3.2. Hàm hồi quy tuyến tính mẫu 50 3.3. Dự báo theo phương trình hồi quy 52 BÀI TẬP CHƯƠNG 7 54 Bảng 4: Phân vị Fisher – Snedecor mức 0,05 60 2 Bài giảng Toán Thống kê Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ I. TỔNG THỂ VÀ MẪU 1.1. Tổng thể . Trong thực tế và trong khoa học chúng ta thường phải khảo sát một tập hợp có rất nhiều phần tử. Chẳng hạn khảo sát chiều cao của thanh niên Việt nam thì mọi thanh niên Việt nam đều là đối tượng cần khảo sát hay khảo sát nang suất của giống lúa A thì đối tượng khảo sát là mọi thửa ruộng trồng giống lúa A. Trong lý thuyết toán thống kê, người ta gọi các tập hợp đó là tổng thể (còn gọi là tập hợp chính hoặc đám đông). Số lượng các cá thể của tổng thể gọi là kích thước của tổng thể, thường ký hiệu bằng chữ in hoa N. 1.2. Mẫu Do tổng thể quá lớn, và hơn nữa có nhiều nghiên cứu phải phá huỷ đối tượng nghiên cứu, chẳng hạn khi định lượng hàm lượng của một loại thuốc chữa bệnh nào đó bằng phương pháp hoá học. Bởi vậy cần chọn ra n phần tử của tổng thể để nghiên cứu, n phần tử được chọn đó gọi là một mẫu có kích thước n (hay mẫu có dung lượng n). Kích thước mẫu thường rất nhỏ so với kích thước của tổng thể (n << N). Tập hợp tất cả các mẫu có kích thước n có thể lấy được từ tổng thể gọi là không gian mẫu có kích thước n. Nếu đặc tính cần nghiên cứu là đặc tính định lượng X, ký hiệu x i là giá trị của X đo được ở cá thể thứ i của mẫu thì được bộ số liệu (x 1 , x 2 , , x n ). Bộ số liệu (x 1 , x 2 , , x n ) gọi là một mẫu thống kê kích thước n của X. Dễ thấy khi đó đặc tính cần nghiên cứu X là một biến ngẫu nhiên. 1.3. Các phương pháp lấy mẫu Mục đích chọn mẫu là từ kết quả khảo sát các phần tử của mẫu để đưa ra kết luận cho cả tổng thể. Vì thế mẫu phải đại diện cho cả tổng thể. Muốn vậy mọi phần tử của tổng thể đều có cùng khả năng được chọn vào mẫu, nói cách khác việc chọn mẫu phải dựa trên nguyên tắc ngẫu nhiên. Các phương pháp cụ thể xem trong SGK (trang 97, 97) II. BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU 2.1. Sắp xếp số liệu Xét mẫu (x 1 , x 2 , , x n ) kích thước n của X. Bước đầu tiên là phải sắp xếp lại các giá trị x i của mẫu để dễ dàng cho việc xử lý tiếp theo. a) Mẫu đơn: Nếu dung lượng n nhỏ thì không cần thiết phải sắp xếp lại các số liệu thu thập được và gọi là mẫu đơn. Với mẫu có dung lượng n lớn. Khi đó có hai trường hợp: b) Mẫu có tần số: 3 ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Nếu các số liệu thu thập được có nhiều giá trị giống nhau thì đếm số các giá trị giống nhau và xếp các số liệu thành bảng hai dòng. Chẳng hạn trong n giá trị thu được chỉ có k giá trị khác nhau là x 1 , x 2 , …, x k (trong đó x i < x i + 1 ) và có n i giá trị x i thì xếp thành bảng: X x 1 x 2 … x k n i n 1 n 2 … n k Trong đó n 1 + n 2 + … + n k = n. Các số n i gọi là tần số gặp giá trị x i trong mẫu và tỷ số n n f i i = gọi là tần suất gặp giá trị x i trong mẫu. Bảng trên gọi là mẫu có tần số. Thí dụ: Đo chiều cao của 20 thanh niên thấy có: 5 người cao 165 cm, 2 người cao 167, 3 người cao 164, 4 người cao 166, 2 người cao 163 và 1 người cao 168. Khi đó ta có bảng: X (cm) 163 164 165 166 167 168 n i 2 3 5 5 4 1 c) Mẫu phân lớp Nếu các số liệu thu thập được không có, hoặc ít có các giá trị trùng nhau thì tiến hành phân khoảng các số liệu. Gọi x min , x max tương ứng là giá trị nhỏ nhất và lớn nhất của các số liệu thu thập được và giả sử ta chia các số liệu thành k khoảng. Khi đó đại lượng: k xx h minmax − ≈ gọi là độ rộng của lớp. Đặt x 0 ≤ x min ; x i = x 0 + ih, i = 1, 2, …, k sao cho x k ≥ x max . Mỗi khoảng (x i – 1 , x i ] được gọi là một lớp (chú ý rằng cũng có thể chọn lớp là [x i – 1 , x i )). Đếm các giá trị thuộc các lớp và xếp thành bảng: X x 0 – x 1 x 1 – x 2 … x k – 1 – x k n i n 1 n 2 … n k Trong đó n 1 + n 2 + … + n k = n. Cũng như mẫu có tần số, các số n i gọi là tần số của lớp thứ i trong mẫu và tỷ số n n f i i = gọi là tần suất của lớp i. Giá trị giữa lớp gọi là giá trị đại diện của lớp. Bảng trên gọi là mẫu phân lớp. Thí dụ: Cân thử 40 con gà 3 tháng tuổi được kết quả (đơn vị tính kg/con): 1,20 1,26 1,21 1,17 1,19 1,25 1,22 1,22 1,19 1,18 1,25 1,19 1,22 1,20 1,21 1,21 1,20 1,20 1,25 1,18 1,24 1,15 1,23 1,21 1,22 1,24 1,18 1,23 1,21 1,18 1,16 1,17 1,20 1,15 1,18 1,22 1,21 1,23 1,26 1,24 Ta có: x max = 1,26; x min = 1,15 Chia các số liệu thành 6 lớp (k = 6), chọn độ rộng của lớp là 0,02, lớp đầu tiên là (1,14; 1,16] được bảng phân lớp: X (kg) 1,14 – 1,16 1,16 – 1,18 1,18 – 1,20 1,20 – 1,22 1,22 – 1,24 1,24 – 1,26 n i (số con) 3 7 8 11 6 5 Chú thích: Nếu không phân lớp thì có bảng tần số: X(kg) 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 1,26 4 Bài giảng Toán Thống kê n i 2 1 2 5 3 5 6 5 3 3 3 2 2.2. Biểu diễn hình học của mẫu Có thể lập bảng tần suất cho mẫu có tần số: X x 1 x 2 … x k f i f 1 f 2 … f k và cho mẫu phân lớp: X x 0 – x 1 x 1 – x 2 … x k – 1 – x k f i f 1 f 2 … f k Trong các bảng trên thì f i = i n n Từ đó có dạng biểu diễn hình học cho mẫu có tần số hoặc mẫu phân lớp như sau: Chọn trục hoành biểu diễn các giá trị thu thập được và trục tung biểu diễn tần suất hoặc tần số khi đó ta có một hình vẽ gọi là biểu đồ tần suất hoặc biểu đồ tần số. Chẳng hạn biểu diễn hình học của hai thí dụ trong mục 2.1 là: III. CÁC SỐ ĐẶC TRƯNG CỦA MẪU Sau khi sắp xếp lại các số liệu, ta thường phải tính các số đặc trưng của mẫu. Sau đây là một số số đặc trưng chính của một mẫu thống kê. 3.1. Trung bình mẫu Số trung bình của mẫu thống kê (x 1 , x 2 , …, x n ) là số: ∑ = = +++ = n 1i i n21 x n 1 n x xx x (4.1) Nếu mẫu cho có tần số: X x 1 x 2 … x k n i n 1 n 2 … n k thì: ∑ = = +++ +++ = k 1i ii k21 kk2211 xn n 1 n nn xn xnxn x (4.1a) Nếu mẫu là phân lớp thì tính như mẫu có tần số, nhưng tính theo giá trị đại diện của lớp (giá trị giữa lớp). Trung bình mẫu đặc trưng cho độ lớn của các số liệu quan sát được. 2.2. Phương sai mẫu Số phương sai của mẫu thống kê (x 1 , x 2 , …, x n ) là số: s* 2 = ∑ = − n 1i 2 i )xx( n 1 (4.2) 5 n i (f i ) 5 (0,25) 4 (0,2) 3 (0.15) 2 (0,1) 1 (0,05) 0 163 164 165 166 167 168 X n i (f i ) 11 (11/40) 7 (7/40) 5 (5/40) 3 (3/40) 0 1,14 1,16 1,18 1,20 1,22 1,24 1,26 X ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Biến đổi (4.2) được: s* 2 = ( ) 2 n 1i 2 i 2 2 n 1i i n 1i 2 i 2 n 1i i n 1i 2 i xx n 1 n xxn x n 1 x n 1 −=       − =       − ∑ ∑∑ ∑∑ = == == (4.2a) Nếu là mẫu có tần số thì: s* 2 = ∑ = − k 1i 2 ii )xx(n n 1 (4.3) Biến đổi (4.3) được: s* 2 = ( ) 2 k 1i 2 ii 2 2 n 1i n 1i ii 2 ii 2 k 1i ii k 1i 2 ii xxn n 1 n xnxnn xn n 1 xn n 1 −=       − =       − ∑ ∑ ∑ ∑∑ = = = == (4.3a) trong đó n = n 1 + n 2 + … + n k . Với mẫu phân lớp thì dùng công thức mẫu có tần số để tính và tính theo giá trị giữa của lớp (giá trị đại diện của lớp). Căn bậc hai của phương sai gọi là độ lệch chuẩn của mẫu và ký hiệu là s*: 2 *s*s = 2.3. Phương sai hiệu chỉnh của mẫu Số phương sai hiệu chỉnh của mẫu thống kê (x 1 , x 2 , …, x n ) là số: s 2 = 2 *s 1n n − , nghĩa là: s 2 = ∑ = − − n 1i 2 i )xx( 1n 1 (4.4) Biến đổi (4.4) được: s 2 = ( ) 1n xnx )1n(n xxn 2 n 1i 2 i 2 n 1i i n 1i 2 i − − = −         − ∑ ∑∑ = == (4.4a) Nếu là mẫu có tần số thì: s 2 = ∑ = − − k 1i 2 ii )xx(n 1n 1 (4.5) Biến đổi (4.5) được: s 2 = ( ) 1n xnxn )1n(n xnxnn 2 k 1i 2 ii 2 k 1i ii k 1i 2 ii − − = −         − ∑ ∑∑ = == (4.5a) trong đó n = n 1 + n 2 + … + n k . Với mẫu phân lớp thì dùng công thức mẫu có tần số để tính và tính theo giá trị giữa của lớp (giá trị đại diện của lớp). Căn bậc hai của phương sai hiệu chỉnh gọi là độ lệch chuẩn hiệu chỉnh của mẫu và ký hiệu là s: 2 ss = Nếu coi trung bình mẫu x là tâm của dãy số liệu thu thập được thì đại lượng e i = xx i − là độ lệch giữa x i và x , nó cho biết x i gần hay xa tâm x . Bởi vậy phương sai mẫu cũng như phương sai mẫu hiệu chỉnh và các độ lệch chuẩn là đặc trưng cho độ phân tán các số liệu quan sát được quanh giá trị trung bình mẫu x . Chú ý rằng sau này chúng ta chỉ dùng phương sai hiệu chỉnh của mẫu s 2 mà không dùng phương sai mẫu s* 2 . Điều này sẽ được lý giải ở chương sau. 6 Bài giảng Toán Thống kê Phương sai, độ lệch chuẩn cũng như phương sai hiệu chỉnh, độ lệch chuẩn hiệu chỉnh đặc trưng cho độ phân tán của các số liệu quanh giá trị trung bình mẫu. Thí dụ 1. Tính các số đặc trưng của mẫu (số liệu của thí dụ 1 trong 2.1) X (cm) 163 164 165 166 167 168 n i 2 3 5 5 4 1 Giải: Thường dùng các công thức (4.1a), (4.2a) hoặc (4.3a), (4.4a) hoặc (4.5a) để tính các số đặc trưng của mẫu. Khi đó cần phải tính dung lượng mẫu n và các tổng: Σx, Σx 2 . Có hai cách tính các tổng này: - Cách 1: Lập bảng tính như sau: x n i n i x i n i x i 2 163 2 326 53138 164 3 492 80688 165 5 825 136125 166 5 830 137780 167 4 668 111556 168 1 168 28224 Tổng 20 3309 547511 - Cách 2: Tính theo hàng: Dung lượng mẫu: n = 2 + 3 + … + 1 = 20 Σx = 163.2 + 164.3 + … + 168 = 3309 Σx 2 = 163 2 .2 + 164 2 .3 + … + 168 2 = 547511 Từ đó có: Trung bình mẫu: 45,165 20 3309 x == Phương sai mẫu: s* 2 = 2 )45,165( 20 547511 − =1,84750 ⇒ độ lệch chuẩn: s* = 1,3592 Phương sai mẫu hiệu chỉnh: s 2 = 19 )45,165(20547511 2 − = 1,94474 ⇒ s = 1,3945 Thí dụ 2. Tính các số đặc trưng của mẫu (số liệu của thí dụ 2 trong 2.1) X (kg) 1,14 – 1,16 1,16 – 1,18 1,18 – 1,20 1,20 – 1,22 1,22 – 1,24 1,24 – 1,26 n i (số con) 3 7 7 12 6 5 Giải: Có thể lập bảng tính như sau: Lớp x i n i n i x i n i x i 2 1,14-1,16 1,15 3 3,45 3,9675 1,16-1,18 1,17 7 8,19 9,5823 1,18-1,20 1,19 7 8,33 9,9127 1,20-1,22 1,21 12 14,52 17,5692 1,22-1,24 1,23 6 7,38 9,0774 1,24-1,26 1,25 5 6,25 7,8125 Tổng 40 48,12 57,9216 Trung bình mẫu: 40 12,48 x = = 1,203 Phương sai mẫu: s* 2 = 2 )203,1( 40 9216,57 − = 0,00083 ⇒ độ lệch chuẩn: s* = 0,0288 7 ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Phương sai mẫu hiệu chỉnh: s 2 = 39 )203,1(409216,57 2 − = 0,00085 ⇒ s = 0,0292 IV. MẪU NGẪU NHIÊN 4.1. Mẫu ngẫu nhiên Xét mẫu lượng n của biến ngẫu nhiên X. Gọi X i là biến ngẫu nhiên chỉ giá trị của X ở cá thể thứ i của mẫu thì được bộ biến ngẫu nhiên (X 1 , X 2 , …, X n ). Bộ các biến ngẫu nhiên (X 1 , X 2 , …, X n ) gọi là mẫu ngẫu nhiên của X. Do việc khảo sát các cá thể trong mẫu là độc lập nên các biến ngẫu nhiên X i trong mẫu ngẫu nhiên được coi là độc lập với nhau và cùng phân phối xác suất với X. Người ta còn nói mẫu thống kê (x 1 , x 2 , …, x n ) là một thể hiện hay là một mẫu cụ thể của mẫu ngẫu nhiên (X 1 , X 2 , …, X n ). 4.2. Các đặc trưng của mẫu ngẫu nhiên Cũng như mẫu thống kê (x 1 , x 2 , …, x n ) của biến ngẫu nhiên X, với mẫu ngẫu nhiên (X 1 , X 2 , …, X n ) cũng có các đặc trưng của nó. Đó là là: Trung bình mẫu ngẫu nhiên: n X X n 1i i ∑ = = ; Phương sai mẫu ngẫu nhiên: ( ) n XX *S n 1i 2 i 2 ∑ = − = ; và Phương sai hiệu chỉnh của mẫu ngẫu nhiên: ( ) 1n XX S n 1i 2 i 2 − − = ∑ = ; … Các số dặc trưng của mẫu thống kê (x 1 , x 2 , …, x n ) gọi là các thể hiện tương ứng của các đặc trưng của mẫu ngẫu nhiên. 4.3. Thống kê Xét mẫu ngẫu nhiên (X 1 , X 2 , …, X n ). Một hàm của mẫu ngẫu nhiên: G = f(X 1 , X 2 , …, X n ) gọi là một thống kê. Như vậy các đặc trưng của mẫu ngẫu nhiên là các thống kê. Vì các thống kê là các hàm của các biến ngẫu nhiên nên nó cũng là các biến ngẫu nhiên và trong toán thống kê nó được khảo sát như mọi biến ngẫu nhiên khác, nghĩa là nó cũng có luật phân phối xác suất cũng như các số đặc trưng của nó. V. MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ 5.1. Các định lý về phân phối chuẩn Phân phối chuẩn đã được trình bày trong chương 2, ở đây chỉ nêu thêm một số vấn đề về phân phối chuẩn. Với phân phối chuẩn có một số kết luận sau: 1) Nếu X ~ N(µ, σ 2 ) thì: 8 f(t) α/2 α/2 -t(α/2) O µ t(α/2) t Đồ thị hàm mật độ biến Chuẩn tham số µ, σ 2 Bài giảng Toán Thống kê Z = σ µ−X ~ N(0, 1) 2) Nếu các biến X 1 , X 2 , …, X n độc lập và cùng phân phối chuẩn N(µ, σ 2 ) , thì:         σ µ= ∑ = n ,N~X n 1 X 2 n 1i i ( ) ( )     µ=µ==       = ∑∑ == n n 1 XE n 1 X n 1 EXE n 1i i n 1i i ; ( ) ( )     σ =σ==       = ∑∑ == n n n 1 XD n 1 X n 1 DXD 2 2 2 n 1i i 2 n 1i i 3) Nếu X~ N(µ x , σ x 2 ), Y~ N(µ y , σ y 2 ) thì X ± Y ~ N(µ x ± µ y , σ x 2 + σ y 2 ) (vì D(X ± Y) = D(X) + D(Y)) 4) Trong toán thống kê thường phải tìm số u(α/2) (còn ký hiệu là u α /2 ) sao cho: α−=       α≤ σ µ− 1)2/(u |X| P , với α đã cho với X ~ N(µ, σ 2 ). Khi đó biểu thức đã cho là tương đương với: 2Φ(u α /2 ) – 1 = 1 – α ⇔ Φ(u α /2 ) = 1– α/2. Từ đó số u(α/2) được tìm bằng cách tra ngược bảng phân phối chuẩn: Tìm số 1 – α/2 ở giữa bảng, dóng theo hàng và cột lên cột đầu tiên và hàng đầu tiên là số u(α/2). Thí dụ: u(0,025) = 1,96; u(0,05) = 1,645 5.2. Phân phối khi-bình phương (χ 2 ) Định nghĩa: Nếu X 1 , X 2 , …, X n là n biến ngẫu nhiên độc lập, cùng phân phối chuẩn tắc thì biến ngẫu nhiên 2 n 2 2 2 1 2 X XX +++=χ có phân phối khi-bình phương với n bậc tự do. Ký hiệu χ 2 ~ χ 2 (n). Chú ý rằng biến χ 2 ~ χ 2 (n) chỉ nhận các giá trị không âm, đường cong mật độ xác suất của nó còn phụ thuộc vào số bậc tự do n Trong toán thống kê thường gặp biểu thức xác suất: P(χ 2 > χ 2 (α, n) ) = α, với α đã cho trong đó χ 2 ~ χ 2 (n) và phải tìm χ 2 (α, n) (hay χ 2 α , n ) . Khi đó số χ 2 (α,n) được tìm trong bảng phân phối khi-bình phương ở giao của cột α, dòng n. Thí dụ: χ 2 (0,05; 4) = 9,488; χ 2 (0,95; 10) = 3,94 5.3. Phân phối Student Định nghĩa: Nếu X, X 1 , X 2 , …, X n là các biến ngẫu nhiên chuẩn tắc và độc lập với nhau thì biến ngẫu nhiên ∑ = = n 1i 2 i X n 1 X T có phân phối Student với n bậc tự do. Ký hiệu T ~ t(n). 9 f(q) n 1 n 2 α O χ 2 (α,n 2 ) q∈χ 2222 Đồ thị hàm mật độ biến χ 2 n bậc tự do (n 1 < n 2 ) ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Phân phối Student là phân phối đối xứng (đường cong mật độ xác suất là đối xứng qua trục tung). Đồ thị của hàm mật độ xác suất của biến Student có dạng giống như đồ thị hàm mật độ xác suất của biến chuẩn tắc, nhưng ít nhọn hơn (n càng lớn thì đường cong mật độ xác suất càng nhọn). Trong toán thống kê thường gặp biểu thức xác suất: P(|T| > t(α/2, n) ) = α, với α đã cho trong đó T ~ t(n) phải tìm t(α/2, n) (hay t α /2, n ). Khi đó số t(α/2, n) được tìm trong bảng phân phối Student ở giao của cột α, dòng n. Thí dụ: t(0,025; 15) = 2,131; t(0,05; 15) = 1,753 Người ta chứng minh được rằng khi n lớn thì phân phối Student n bậc tự do là xấp xỉ phân phối chuẩn tắc. Trong thực tế, nếu n > 30 thì phân phối Student n bậc tự do được coi là phân phối chuẩn tắc. Vi thế: t(0,025; 31) = t(0,025;35) = t(0,025; n) = 1,96, ∀n≥31 (tra ở dòng cuối của bảng Student) t(0,05; 31) = t(0,05;35) = t(0,05; n) = 1,645, ∀n≥31 (tra ở dòng cuối của bảng Student) 5.4. Phân phối Fisher-Snedecor Định nghĩa: Nếu X 1 , X 2 , …, X n và Y 1 , Y 2 , …, Y m là các biến ngẫu nhiên chuẩn tắc và độc lập với nhau thì biến ngẫu nhiên ∑ ∑ = = = m 1i 2 i n 1i 2 i Yn Xm F gọi là biến ngẫu nhiên Fisher với n, m bậc tự do (Quy luật phân phối xác suất của F gọi là quy luật Fisher với n, m bậc tự do, chú ý bậc tự do của tử số đọc trước) và ký hiệu F ~ F(n, m). Trong toán thống kê thường gặp biểu thức xác suất: P(F > F(α,n,m) ) = α, với α đã cho trong đó F ~ F(n,m) và phải tìm F(α,n,m) (hay F α , n, m ). Khi đó số F(α,n,m) được tìm trong bảng phân phối khi-bình phương ở giao của cột n, dòng m, bảng α Thí dụ: F(0,05; 9; 12) = 2,796 F(0,05; 12; 9) = 3,073 5.5. Phân vị mức 1 – α Phân vị mức 1 – α của biến ngẫu nhiên X là số X α thỏa mãn: P( X < X α ) ≤ 1 – α ≤ P(X ≤ X α ) Nếu F(x) là hàm phân phối của X, thì từ tính chất của hàm phân phối, ta có: F(X α ) ≤ 1 – α ≤ )X(F 0+ α Nếu X là biến ngẫu nhiên liên tục có hàm mật độ f(x) thì: α−== ∫ α ∞− α 1dx)x(f)X(F X Các số u(α) ; χ 2 (α, n); t(α, n); F(α, n, m) trong các phân phối trên chính là các phân vị mức 1 – α của các phân phối tương ứng. Chú ý là các phân vị trên có thể ký hiệu tương ứng: u α ; χ 2 α , n ; t α , n ; F α , n, m . 10 f(f) n 1 ,m 1 n 2 ,m 2 α O F(α,n 1 ,m 1 ) f∈F Đồ thị hàm mật độ biến Fisher n,m bậc tự do f(t) n 1 n 2 α/2 α/2 -t(α/2,n 1 ) O t(α/2,n 1 ) t∈T Đồ thị hàm mật độ biến Student n bậc tự do (n 1 > n 2 ) [...]... đó tìm được các thống kê G 1 = G1(X1, X2, , Xn) và G2 = G2(X1, X2, , Xn) sao cho: P(G1 ≤ θ ≤ G2) = P (5.1) Vì P gần bằng 1, nên biến cố (G1 ≤ θ ≤ G2) hầu như xảy ra Với mẫu thống kê cụ thể (x1, x2, …, xn) của X, ta tính được: θ1 = G1(x1, x2, …, xn), θ2 = G2(x1, x2, …, xn) Vậy, với P cho trước, ta xác định được khoảng (θ1, θ2) chứa θ sao cho: P(θ ∈ [θ1, θ2]) = P 14 Bài giảng Toán Thống kê - Khoảng [θ1,... s2 = [9,815 – 2,093 16 0,0319 0,0319 ; 9,815 + 2,093 ] ⇔ [9,731; 9,899] (đồng/sản phẩm) 20 20 Bài giảng Toán Thống kê 2.3 Ước lượng phương sai của phân phối chuẩn Bài toán: Giả sử X là đại lượng ngẫu nhiên chuẩn N(µ, σ2), trong đó D(X) = σ2 chưa biết Hãy tìm khoảng tin cậy của σ2 với độ tin cậy P Chọn thống kê ( n − 1) S2 σ2 2 với S = 1 n ∑ Xi − X n − 1 i =1 ( )2 Với mức tin cậy 1 – α đã cho ta tìm... ) = 1 – α Sau khi xây dựng được thống kê Z, cũng như miền chấp nhận giả thuyết W và miền bác bỏ giả thuyết W thì được quy tắc kiểm đinh: Từ mẫu cụ thể (x1, x2, …, xn) ta tính được giá trị thống kê thực nghiệm ZT của Z • Nếu ZT∈W thì kết luận bác bỏ H0 và chấp nhận H1; • Nếu ZT ∉ W ⇔ ZT∈ W thì kết luận chấp nhận H0 (và đương nhiên H1 bị bác bỏ) 22 Bài giảng Toán Thống kê 1.3 Các loại sai lầm Khi tiến... định một xác suất (tỷ lệ) Bài toán: Giả sử mỗi cá thể trong tổng thể có đặc tính A với xác suất p chưa biết (tỷ lệ cá thể có đặc tính A bằng p) Lấy mẫu dung lượng n, thấy có k cá thể có đặc tính A Chúng ta xây dựng quy tắc kiểm định giả thuyết H 0: p = p0 với các đối thuyết khác nhau ở mức ý nghĩa α 26 Bài giảng Toán Thống kê Tiêu chuẩn kiểm định Mẫu ngẫu nhiên trong bài toán này là lượng ngẫu nhiên... bằng nhau của kỳ vọng hai biến chuẩn, mẫu theo cặp Bài toán: Giả sử X~N(µx, σx2) và Y~N(µy, σy2), trong đó µx, µy chưa biết và cần so sánh µx với µy ở mức α (kiểm định H0: µx = µy) Trong điều kiện có thể, hai mẫu thống kê của X và của Y được khảo sát trên cùng một mẫu gồm n cá thể, mỗi cá thể thứ i của mẫu đều được xác định 30 Bài giảng Toán Thống kê cả giá trị xi của X và cả giá trị yi của Y Như vậy... là sai Pearson đã đưa ra thống kê Z = npi, đồng thời chứng minh được Z xấp xỉ phân phối χ2(k – 1), bởi vậy ở mức α có: Miền bác bỏ H0 là: W = (χ2(α, k – 1), ∞) Từ đó có quy tắc: 34 Bài giảng Toán Thống kê Quy tắc 9 Quy tắc kiểm định giả thuyết về luật phân phối xác suất, không phải ước lượng tham số - Tính các tần số lý thuyết npi, (n i − npi ) 2 npi i =1 k - Tính lượng thống kê thực nghiệm ZT = ∑ (6.11)... θ0 và gọi là đối thuyết phải - H1: θ < θ0 và gọi là đối thuyết trái Hai đối thuyết sau (θ > θ0 và θ > θ0) gọi chung là đối thuyết một phía Bài toán kiểm định với đối thuyết hai phía gọi bài toán kiểm định hai phía Bài toán kiểm định với đối thuyết một phía gọi bài toán kiểm định một phía Chú thích: Khái niệm kiểm định hai phía hay kiểm định một phía là do: • Nếu miền bác bỏ giả thuyết H0 nằm ở hai bên... kiểm định giả thuyết thống kê Giả thuyết nêu lên để kiểm định gọi là giả thuyết không hay giả thuyết gốc, ký hiệu H0 Tuy nhiên, khi kết luận là bác bỏ giả thuyết H 0 đã nêu thì cần phải chấp nhận một giả thuyết khác Bởi vậy trong bài toán kiểm định thống kê phải có thêm một giả thuyết khác giả thuyết H0 gọi là đối thuyết H1 Cặp giả thuyết H0, đối thuyết H1 được nêu ngay từ đầu bài toán kiểm định giả... ngay từ đầu bài toán kiểm định giả thuyết Kết luận của bài toán kiểm định giả thuyết thống kê có dạng: - Hoặc chấp nhận H0 - Hoặc bác bỏ H0, khi đó phải chấp nhận H1 Nếu giả thuyết H0 là về tham số của luật phân phối xác suất của một hay nhiều biến ngẫu nhiên thì bài toán gọi là kiểm định tham số, nếu giả thuyết H0 không phải là tham số thì bài toán gọi là kiểm định phi tham số 1.2 Quy tắc kiểm định... Khái niệm về bài toán ước lượng tham số Giả sử khi nghiên cứu biến ngẫu nhiên X tồn tại trong một tập hợp chính nào đó, chúng ta đã biết quy luật phân phối xác suất của X, tuy nhiên còn tham số θ nào đó của X chưa xác định được giá trị, ta phải tiến hành xác định giá trị của θ bằng một mẫu thống kê (x1, x2,…,xn) của X Bài toán xác định giá trị (gần đúng) của tham số θ như vậy gọi là bài toán ước lượng . X n ) gọi là một thống kê. Như vậy các đặc trưng của mẫu ngẫu nhiên là các thống kê. Vì các thống kê là các hàm của các biến ngẫu nhiên nên nó cũng là các biến ngẫu nhiên và trong toán thống kê nó được. theo phương trình hồi quy 52 BÀI TẬP CHƯƠNG 7 54 Bảng 4: Phân vị Fisher – Snedecor mức 0,05 60 2 Bài giảng Toán Thống kê Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ I. TỔNG THỂ VÀ MẪU 1.1 của θ bằng một mẫu thống kê (x 1 , x 2 ,…,x n ) của X. Bài toán xác định giá trị (gần đúng) của tham số θ như vậy gọi là bài toán ước lượng tham số θ. Về mặt lý thuyết, bài toán được giải quyết

Ngày đăng: 16/10/2014, 16:22

Mục lục

  • Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ

    • I. TỔNG THỂ VÀ MẪU

      • 1.1. Tổng thể .

      • 1.2. Mẫu

      • 1.3. Các phương pháp lấy mẫu

      • II. BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU

        • 2.1. Sắp xếp số liệu

        • 2.2. Biểu diễn hình học của mẫu

        • III. CÁC SỐ ĐẶC TRƯNG CỦA MẪU

          • 3.1. Trung bình mẫu

          • 2.2. Phương sai mẫu

          • 2.3. Phương sai hiệu chỉnh của mẫu

          • IV. MẪU NGẪU NHIÊN

            • 4.1. Mẫu ngẫu nhiên

            • 4.2. Các đặc trưng của mẫu ngẫu nhiên

            • 4.3. Thống kê

            • V. MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ

              • 5.1. Các định lý về phân phối chuẩn

              • 5.2. Phân phối khi-bình phương (2)

              • 5.3. Phân phối Student

              • 5.4. Phân phối Fisher-Snedecor

              • 5.5. Phân vị mức 1 – 

              • BÀI TẬP CHƯƠNG 4

              • (Các số trong dấu ngoặc đơn là số của bài tập tương ứng trong sách giáo khoa)

              • Chương 5. ƯỚC LƯỢNG THAM SỐ

                • Khái niệm về bài toán ước lượng tham số

                • I. ƯỚC LƯỢNG ĐIỂM

                  • 1.1. Định nghĩa.

Tài liệu cùng người dùng

Tài liệu liên quan