1. Trang chủ
  2. » Giáo án - Bài giảng

Phan phoi mau

36 10 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 36
Dung lượng 443,99 KB

Nội dung

Thống kê xã hội học Khoa CTXH & PTCð Chương PHÂN PHỐI MẪU Phân phối mẫu Phân phối tổng thể mẫu Sai số mẫu sai số không lấy mẫu Trung bình độ lệch chuẩn x Hình dáng phân phối mẫu x Ứng dụng phân phối mẫu x Tỷ lệ tổng thể mẫu TB, ðLC hình dáng PP mẫu pˆ Ứng dụng phân phối mẫu pˆ 1 Phân phối tổng thể mẫu • Phân phối tổng thể phân phối xác suất liệu tổng thể • Ví dụ Giả sử có sinh viên ñăng ký học lớp Thống kê Xã hội học ðiểm thi cuối kỳ sinh viên 70 78 80 80 95 Gọi x ñiểm thi cuối kỳ sinh viên Dùng lớp giá trị ta tính phân phối tần suất ñiểm sau: Phân phối tần suất tương ñối tổng thể Phân phối xác suất tổng thể x f Tần suất tương ñối x P(x) 70 1/5 = 0,20 70 0,20 78 1/5 = 0,20 78 0,20 80 2/5 = 0,40 80 0,40 95 1/5 = 0,20 95 0,20 N=5 Tổng = 1,00 Tổng = 1,00 Dựa vào phân phối tần suất tương ñối ta có phân phối xác suất tổng thể Từ phân phối xác suất tổng thể ta tính giá trị trung bình µ độ lệch chuẩn σ Ta có µ = 80,60 σ = 8,09 ðây tham số tổng thể Từ tổng thể trên, ta chọn ngẫu nhiên mẫu khác có kích thước Ứng với mẫu ta tính trung bình mẫu x Ta thấy giá trị µ khơng đổi giá trị x thay đổi tùy theo phần tử có mẫu • Ta nói trung bình mẫu x biến ngẫu nhiên Như giống biến ngẫu nhiên khác, trung bình mẫu có phân phối xác suất • Phân phối xác suất trung bình mẫu x gọi phân phối mẫu • Tổng quát hơn, phân phối xác suất thống kê mẫu ñược gọi phân phối mẫu Nhắc lại chương 3, ño lường tóm lược tính tốn tập liệu tổng thể ñược gọi tham số tổng thể, cịn tính tốn tập liệu mẫu gọi thống kê mẫu • Ví dụ Trở lại ví dụ trước, ta gán A, B, C D cho ñiểm số sinh viên Rút ngẫu nhiên từ tổng thể mẫu gồm sinh viên Tất mẫu có trung bình mẫu chúng Mẫu Các điểm mẫu TB mẫu ABC ABD 70, 78, 80 70, 78, 80 76,00 76,00 ABE ACD ACE ADE BCD 70, 78, 95 70, 80, 80 70, 80, 95 70, 80, 95 78, 80, 80 78, 80, 95 78, 80, 95 80, 80, 95 81,00 76,67 81,67 81,67 79,33 BCE BDE CDE 84,33 84,33 85,00 Phân phối tần suất tương ñối trung bình mẫu TB mẫu 76,00 76,67 79,33 81,00 81,67 84,33 85,00 f 1 2 Tổng = 10 Tần suất tương ñối 2/10 = 0,20 1/10 = 0,10 1/10 = 0,10 1/10 = 0,10 2/10 = 0,20 2/10 = 0,20 1/10 = 0,10 Tổng = 1,00 Phân phối mẫu x (Phân phối xác suất x ) x P( x ) 76,00 76,67 2/10 = 0,20 1/10 = 0,10 79,33 81,00 1/10 = 0,10 1/10 = 0,10 81,67 84,33 85,00 2/10 = 0,20 2/10 = 0,20 1/10 = 0,10 Tổng = 1,00 Phân phối mẫu Phân phối tổng thể mẫu Sai số mẫu sai số không lấy mẫu Trung bình độ lệch chuẩn x Hình dáng phân phối mẫu x Ứng dụng phân phối mẫu x Tỷ lệ tổng thể mẫu TB, ðLC hình dáng PP mẫu pˆ Ứng dụng phân phối mẫu pˆ 10 Sai số mẫu sai số khơng lấy mẫu • Nhận xét Các mẫu khác ñược chọn từ tổng thể cho kết khác Nhìn chung, kết thu ñược từ mẫu khác với kết thu ñược từ tổng thể tương ứng Ví dụ trung bình mẫu khác với trung bình tổng thể Sự sai khác gọi sai số mẫu (sai số có từ việc lấy mẫu) • Sai số mẫu (sampling error) chênh lệch giá trị thống kê mẫu giá trị tham số tổng thể tương ứng 11 • Trong trường hợp trung bình, ta có Sai s mu = x - ã iu quan trng cần nhớ sai số mẫu xảy may rủi mẫu chọn ngẫu nhiên • Còn sai số khác xảy từ việc thu thập liệu, nhập liệu, tổ chức liệu thành bảng ñược gọi sai số khơng lấy mẫu (nonsampling errors) • Ví dụ Trở lại ví dụ điểm sinh viên 12 ðiểm sinh viên 70, 78, 80, 80 95 Trung bình tổng thể µ = (70+78+80+80+95) / = 80,60 Lấy mẫu ngẫu nhiên gồm phần tử, giả sử có điểm 70, 80 95 Trung bình mẫu = (70+80+95) / = 81,67 Sai số mẫu = x - µ = 81,67 – 80,60 = 1,07 Sự chênh lệch xảy may rủi (do tình cờ), ta ñã dùng mẫu ngẫu nhiên thay dùng tổng thể Cũng với mẫu ngẫu nhiên thu thập liệu ñể xử lý ta ghi nhầm số 80 thành 82 13 Khi trung bình mẫu = (70+82+95) / = 82,33 Sai số mẫu = x - µ = 82,33 – 80,60 = 1,73 Ta có 1,73 – 1,07 = 0,66 Trong trường hợp này: Sai số mẫu = 1,07 Sai số không việc lấy mẫu = 0,66 Như vậy, sai số không việc lấy mẫu = TB mẫu khơng – TB mẫu ñúng = 82,33 – 81,67 = 0,66 Chú ý thực tế ta thường khơng biết trung bình tổng thể Do ta chọn mẫu để dùng trung bình mẫu ước lượng trung bình tổng thể Như ta khơng biết ñược sai số mẫu 14 Phân phối mẫu Phân phối tổng thể mẫu Sai số mẫu sai số không lấy mẫu Trung bình độ lệch chuẩn x Hình dáng phân phối mẫu x Ứng dụng phân phối mẫu x Tỷ lệ tổng thể mẫu TB, ðLC hình dáng PP mẫu pˆ Ứng dụng phân phối mẫu pˆ 15 Trung bình độ lệch chuẩn x • Trung bình ñộ lệch chuẩn phân phối mẫu x ñược gọi trung bình ñộ lệch chuẩn x , ký hiệu µ σ x x cách tương ứng • Trung bình x ln ln trung bình tổng thể Tức l àx = 16 ã Vớ d Tr lại ví dụ cũ ta có: x P( x ) 76,00 76,67 79,33 81,00 81,67 84,33 85,00 2/10 = 0,20 1/10 = 0,10 1/10 = 0,10 1/10 = 0,10 2/10 = 0,20 2/10 = 0,20 1/10 = 0,10 Tổng = 1,00 17 Trung bình x trung bình phân phối mẫu x tức trung bình phân phối xác suất x µ x = 76,0 x 0,2 + 76,67 x 0,1 + 79,33 x 0,1 + 81,0 x 0,1 + 81,67 x 0,2 + 84,33 x 0,2 + 85,0 x 0,1 = 80,60 Trung bình tổng thể µ = (70+78+80+80+95) / = 80,60 Ta cú àx = ã Trung bỡnh mu ( x ) ñược gọi ước lượng trung bỡnh tng th ( ) ã Do tớnh cht µ x = µ mà x ñược xem c lng khụng chch ca 18 ã Tuy nhiên độ lệch chuẩn x lại khơng ñộ lệch chuẩn σ tổng thể (trừ n=1) • Tổng quát, ta có: σx = σ n Trong ñó, σ ñộ lệch chuẩn tổng thể n kích thước mẫu Cơng thức dùng n/N ≤ 0,05 với N kích thước tổng thể 19 • Nếu điều kiện n/N ≤ 0,05 khơng thỏa cơng thức sau dùng để tính độ lệch chuẩn phân phối mẫu x σx = σ n N −n N −1 Trong đó, n kích thước mẫu N kích thước tổng thể (Tuy nhiên phần lớn ứng dụng thực tế kích thước mẫu nhỏ kích thước tổng thể nhiều nên ñiều kiện n/N ≤ 0,05 thường ñược thỏa mãn.) 20 10 Ứng dụng phân phối mẫu x • Từ định lý giới hạn trung tâm ta suy ñược số mệnh ñề sau • Từ tổng thể ta rút tất mẫu có kích thước (lớn) có tính trung bình mẫu có khoảng 68,26% trung bình mẫu nằm khoảng độ lệch chuẩn so với trung bình tổng thể P ( µ − σ x ≤ x ≤ µ + σ x ) = 0,6826 43 Diện tích vùng tơ màu 0,6826 0,3413 µ − 1σ x 0,3413 µ µ + 1σ x x P ( µ − σ x ≤ x ≤ µ + σ x ) = 0,6826 44 22 • Từ tổng thể ta rút tất mẫu có kích thước (lớn) có tính trung bình mẫu có khoảng 95,44% trung bình mẫu nằm khoảng hai độ lệch chuẩn so với trung bình tổng thể P ( µ − 2σ x ≤ x ≤ µ + 2σ x ) = 0,9544 45 Diện tích vùng tơ màu 0,9544 0,4772 µ − 2σ x 0,4772 µ µ + 2σ x x P ( µ − 2σ x ≤ x ≤ µ + 2σ x ) = 0,9544 46 23 • Từ tổng thể ta rút tất mẫu có kích thước (lớn) có tính trung bình mẫu có khoảng 99,74% trung bình mẫu nằm khoảng ba ñộ lệch chuẩn so với trung bình tổng thể P ( µ − 3σ x ≤ x ≤ µ + 3σ x ) = 0,9974 47 Diện tích vùng tơ màu 0,9974 0,4987 µ − 3σ x 0,4987 µ µ + 3σ x x P ( µ − 3σ x ≤ x ≤ µ + 3σ x ) = 0,9974 48 24 • Ví dụ Giả sử trọng lượng tất gói bánh (một loại bánh có nhãn hiệu đó) có phân phối chuẩn với trung bình 320g ñộ lệch chuẩn 3g Tính xác suất ñể trọng lượng trung bình, x , mẫu ngẫu nhiên gồm 20 gói bánh nằm 318g 319g Mặc dù kích thước mẫu nhỏ (n < 30) hình dáng phân phối mẫu x chuẩn tổng thể có phân phối chuẩn Trung bình độ lệch chuẩn x µ x = µ = 320 σx = σ n = 0,6708204 20 = 49 Ta tính xác suất P(318 ≤ x ≤ 319) Trước hết ta tính giá trị z tương ứng giá trị x z = x− µ σ x Sau chuyển qua z ta tính được: P (318 ≤ x ≤ 319) = P( −2,98 ≤ z ≤ −1,49) = 0,0667 50 25 Phân phối mẫu Phân phối tổng thể mẫu Sai số mẫu sai số không lấy mẫu Trung bình độ lệch chuẩn x Hình dáng phân phối mẫu x Ứng dụng phân phối mẫu x Tỷ lệ tổng thể mẫu TB, ðLC hình dáng PP mẫu pˆ Ứng dụng phân phối mẫu pˆ 51 Tỷ lệ tổng thể mẫu • Khái niệm tỷ lệ giống khái niệm tần suất tương ñối chương 2, khái niệm xác suất thành công phép thử nhị thức • Tần suất tương ñối loại (lớp) cho ta tỷ lệ mẫu tỷ lệ tổng thể thuộc loại (lớp) • Tương tự, xác suất thành công phép thử nhị thức biểu diễn tỷ lệ mẫu tỷ lệ tổng thể có đặc tính cho 52 26 • Tỷ lệ tổng thể, ký hiệu p, tỷ lệ mẫu, ký hiệu pˆ , tỷ số p= X N and pˆ = x n • N = tổng số phần tử có tổng thể • n = tổng số phần tử có mẫu • X = số phần tử tổng thể có đặc tính cho • x = số phần tử mẫu có đặc tính cho 53 • Ví dụ Giả sử tổng cộng có tất 789.654 gia đình sống thành phố có 563.282 gia đình số có sở hữu nhà Một mẫu gồm 240 gia đình chọn từ thành phố này, có 158 gia đình có sở hữu nhà Tính tỷ lệ gia đình sở hữu nhà tổng thể mẫu p = X / N = 789654 / 563282 = 0,71 Tương tự pˆ = x / n = 158 / 240 = 0,66 Sai số mẫu = pˆ - p = 0,66 – 0,71 = -0,05 Khi nói đến sai số mẫu ta cần giả sử mẫu chọn ngẫu nhiên khơng có sai số không việc lấy mẫu 54 27 Phân phối mẫu Phân phối tổng thể mẫu Sai số mẫu sai số khơng lấy mẫu Trung bình độ lệch chuẩn x Hình dáng phân phối mẫu x Ứng dụng phân phối mẫu x Tỷ lệ tổng thể mẫu TB, ðLC hình dáng PP mẫu pˆ Ứng dụng phân phối mẫu pˆ 55 TB, ðLC hình dáng PP mẫu pˆ • Giống trung bình mẫu x , tỷ lệ mẫu pˆ biến ngẫu nhiên Do có phân phối xác suất, phân phối xác suất ñược gọi phân phối mẫu pˆ • Nói cách khác, phân phối mẫu pˆ phân phối xác suất tỷ lệ mẫu pˆ • Ví dụ Hội Tham vấn học đường có tất nhân viên Sau thơng tin liên quan đến kiến thức thống kê nhân viên 56 28 Tên NV Biết thống kê An Biết Bình Khơng biết Hải Linh Khơng biết Biết Nam Biết Gọi p tỷ lệ nhân viên biết thống kê tổng thể Ta có: p = 3/5 = 0,60 (p tỷ lệ tổng thể) Giả sử ta lấy ngẫu nhiên tất mẫu có từ tổng thể (mẫu có phần tử) Tổng số mẫu = 10 57 Mẫu An , Bình, Hải An , Bình, Linh An, Bình, Nam An, Hải, Linh An, Hải, Nam An, Linh, Nam Bình, Hải, Linh Bình, Hải, Nam Bình, Linh, Nam Hải, Linh, Nam Tỷ lệ người biết TK pˆ 1/3 = 0,33 2/3 = 0,67 2/3 = 0,67 2/3 = 0,67 2/3 = 0,67 3/3 = 1,0 1/3 = 0,33 1/3 = 0,33 2/3 = 0,67 2/3 = 0,67 58 29 Phân phối tần suất tương đối pˆ kích thước mẫu Phân phối xác suất pˆ pˆ f TS tương ñối pˆ P( pˆ ) 0,33 3/10 = 0,30 0,33 0,30 0,67 6/10 = 0,60 0,67 0,60 1,00 1/10 = 0,10 1,00 0,10 Tổng = 10 Tổng = 1,00 Tổng = 1,00 µ pˆ = 0,33 × 0,30 + 0,67 × 0,60 + 1,00 × 0,10 = 0,6 = p 59 • Trung bình pˆ luôn tỷ lệ tổng thể Tức µ pˆ = p (*) (Ta nói trung bình pˆ tức trung bình phân phối mẫu tỷ lệ mẫu pˆ ) • Tỷ lệ mẫu pˆ ñược gọi ước lượng tỷ lệ tổng thể p • Do tính chất (*), pˆ xem ước lượng không chệch p 60 30 • ðộ lệch chuẩn pˆ tính cơng thức sau kích thước mẫu nhỏ so với kích thước tổng thể (tức n / N ≤ 0,05) σ pˆ = pq n Trong p tỷ lệ tổng thể, q = – p, n kích thước mẫu (Ta nói độ lệch chuẩn pˆ tức ñộ lệch chuẩn phân phối mẫu tỷ lệ mẫu pˆ ) 61 • Tuy nhiên n khơng thỏa điều kiện n/N ≤ 0,05 độ lệch chuẩn pˆ tính sau: σ pˆ = pq n N −n N −1 • Ta nhận xét kích thước mẫu tăng lên độ lệch chuẩn pˆ giảm xuống Do tính chất này, pˆ ñược xem ước lượng phù hợp p 62 31 ˆ • Hình dáng phân phối mẫu p suy từ định lý giới hạn trung tâm • ðịnh lý giới hạn trung tâm Phân phối mẫu pˆ xấp xỉ chuẩn mẫu có kích thước đủ lớn Trong trường hợp này, mẫu xem có kích thức ñủ lớn np nq ñều lớn 63 • Ví dụ Một điều tra khảo sát sinh viên cho thấy 87% sinh viên năm ñánh giá kinh nghiệm ñại học họ “tốt” “xuất sắc” Giả sử ñiều ñúng ñối với tổng thể sinh viên năm Coi pˆ tỷ lệ sinh viên mẫu ngẫu nhiên gồm 900 sinh viên năm có đánh Tìm trung bình độ lệch chuẩn pˆ mơ tả hình dáng phân phối mẫu Gọi p tỷ lệ tất sinh viên năm có nhận ñịnh kinh nghiệm ñại học họ “tốt” “xuất sắc” 64 32 p = 0,87 and q = − p = − 0,87 = 0,13 µ pˆ = p = 0,87 pq (0,87)(0,13) = = 0,011 n 900 np = 900(0,87) = 783 and nq = 900(0,13) = 117 σ pˆ = Cả np nq lớn nên ta áp dụng ñịnh lý giới hạn trung tâm ñể suy hình dáng phân phối mẫu pˆ 65 Phân phối mẫu pˆ xấp xỉ chuẩn với trung bình 0,87 độ lệch chuẩn 0,11 σ pˆ = 0,011 Xấp xỉ chuẩn µ pˆ = 0,87 pˆ 66 33 Phân phối mẫu Phân phối tổng thể mẫu Sai số mẫu sai số không lấy mẫu Trung bình độ lệch chuẩn x Hình dáng phân phối mẫu x Ứng dụng phân phối mẫu x Tỷ lệ tổng thể mẫu pˆ TB, ðLC hình dáng PP mẫu Ứng dụng phân phối mẫu pˆ 67 Ứng dụng phân phối mẫu pˆ • Ví dụ Theo điều tra khảo sát ðH Michigan năm 2002, có 1/3 dân chúng Mỹ hy vọng năm tới thời gian tốt ñẹp liên tục ñất nước Giả sử 33% tổng thể thời dân chúng Mỹ có nhận định Coi pˆ tỷ lệ mẫu ngẫu nhiên gồm 800 người dân Mỹ có nhận định Tính xác suất để tỷ lệ 0,35 0,37 Ta có n = 800, p = 0,33, q = – p = 0,67 68 34 µ pˆ = p = 0,33 σ pˆ = (0,33)(0,67) pq = = 0,01662453 n 800 np = 800 (0,33) = 264 nq = 800 (0,67) = 536 Vì np > nq > nên phân phối chuẩn pˆ xấp xỉ chuẩn ðể tính xác suất ta cần chuyển qua giá trị z z= pˆ − p σ pˆ 69 pˆ = 0,35, z = 1,20 pˆ = 0,37, z = 2,41 P(0,35 < pˆ < 0,37) = P(1,20 < z < 2,41) = P(0 < z < 2,41) − P (0 < z < 1,20) = 0,4920 − 0,3849 = 0,1071 Xác suất ñể pˆ nằm khoảng 0,35 0,37 0,1071 70 35 Tóm lại, tìm hiểu … Phân phối tổng thể mẫu Sai số mẫu sai số không lấy mẫu Trung bình độ lệch chuẩn x Hình dáng phân phối mẫu x Ứng dụng phân phối mẫu x Tỷ lệ tổng thể mẫu pˆ TB, ðLC hình dáng PP mẫu Ứng dụng phân phối mẫu pˆ 71 T h a n k s 72 36

Ngày đăng: 06/04/2021, 22:33

TỪ KHÓA LIÊN QUAN

w