Giáo trình xác suất thống kê phần 1 pgs ts nguyễn thị dung

104 1 0
Giáo trình xác suất thống kê phần 1   pgs ts nguyễn thị dung

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Giáo trình Xác suất thống kê PGS.TS Nguyễn Thị Dung, TS Phạm Thanh Hiếu ThS Mai Thị Ngọc Hà, Th.S Nguyễn Thị Hồng Nhung Ngày tháng 10 năm 2018 Mục lục Lời nói đầu I v Lý thuyết xác suất Chương Biến cố ngẫu nhiên xác suất 1.1 Giải tích tổ hợp 1.1.1 Quy tắc cộng 1.1.2 Quy tắc nhân 1.1.3 Hoán vị 1.1.4 Chỉnh hợp 1.1.5 Chỉnh hợp lặp 1.1.6 Tổ hợp 1.1.7 Phương pháp giải toán giải tích tổ hợp 1.2 Phép thử biến cố 1.2.1 Phép thử 1.2.2 Biến cố (sự kiện) 1.2.3 Quan hệ phép toán biến cố 1.3 Các định nghĩa xác suất 1.3.1 Định nghĩa cổ điển xác suất 1.3.2 Định nghĩa thống kê xác suất 1.3.3 Nguyên lý xác suất lớn xác suất nhỏ 1.4 Các định lý 1.4.1 Định lý cộng xác suất 1.4.2 Định lý nhân xác suất 1.4.3 Định lý xác suất toàn phần - Định lý Bayes 1.4.4 Định lý Bernoulli Bài tập Chương Chương Biến ngẫu nhiên Quy luật phân phối xác suất 2.1 Biến ngẫu nhiên 2.2 Quy luật phân phối xác suất biến ngẫu nhiên 2.2.1 Biến ngẫu nhiên rời rạc bảng phân phối xác suất 2.2.2 Hàm phân phối xác xuất 2.2.3 Biến ngẫu nhiên liên tục hàm mật độ xác suất i 10 11 13 15 15 15 17 20 23 26 29 29 30 31 33 36 ii MỤC LỤC 2.3 Các tham số đặc trưng biến ngẫu nhiên 2.3.1 Kỳ vọng toán 2.3.2 Phương sai 2.3.3 Độ lệch chuẩn 2.3.4 Một số tham số đặc trưng khác 2.4 Một số quy luật phân phối xác suất thông dụng 2.4.1 Quy luật không – 2.4.2 Quy luật nhị thức 2.4.3 Quy luật Poisson 2.4.4 Quy luật chuẩn N (a,σ ) 2.4.5 Quy luật bình phương – χ2 2.4.6 Quy luật Student – T(n) 2.4.7 Các định lý giới hạn 2.5 Biến ngẫu nhiên hai chiều 2.5.1 Khái niệm biến ngẫu nhiên hai chiều 2.5.2 Bảng phân phối xác suất 2.5.3 Hàm phân phối xác suất 2.5.4 Hàm mật độ xác suất 2.5.5 Các tham số đặc trưng Bài tập Chương II Thống kê toán Chương Cơ sở lý thuyết mẫu 3.1 Tổng thể mẫu 3.1.1 Tổng thể kích thước tổng thể 3.1.2 Mẫu phương pháp chọn mẫu 3.1.3 Mẫu ngẫu nhiên 3.2 Các phương pháp mô tả mẫu 3.2.1 Sắp xếp số liệu thực nghiệm 3.2.2 Biểu diễn số liệu biểu đồ 3.3 Các tham số đặc trưng mẫu ngẫu nhiên 3.3.1 Hàm thống kê 3.3.2 Trung bình mẫu 3.3.3 Phương sai mẫu phương sai điều chỉnh mẫu 3.3.4 Độ lệch chuẩn mẫu độ lệch chuẩn điều chỉnh mẫu 3.3.5 Một số tham số đặc trưng mẫu khác 3.3.6 Cách tính đặc trưng mẫu 3.4 Ý nghĩa thực nghiệm số đặc trưng mẫu Bài tập Chương 40 40 43 46 46 48 48 49 50 51 58 59 60 64 64 65 66 67 69 71 75 77 77 77 78 79 80 80 82 84 85 85 86 86 87 87 90 93 Chương Ước lượng tham số 97 4.1 Phương pháp ước lượng điểm 97 MỤC LỤC 4.2 Phương pháp ước lượng khoảng tin cậy 4.2.1 Khái niệm 4.2.2 Ước lượng kỳ vọng toán 4.2.3 Ước lượng tỷ lệ Bài tập Chương iii Chương Kiểm định giả thuyết thống kê 5.1 Một số khái niệm 5.1.1 Giả thuyết thống kê 5.1.2 Tiêu chuẩn kiểm định giả thuyết thống kê 5.1.3 Miền bác bỏ giả thuyết thống kê 5.1.4 Giá trị quan sát tiêu chuẩn kiểm định 5.1.5 Quy tắc kiểm định giả thuyết 5.1.6 Các sai lầm mắc phải kiểm định 5.1.7 Các bước tiến hành toán kiểm định giả 5.2 Kiểm định giả thuyết thống kê kỳ vọng toán 5.2.1 Trường hợp tổng thể 5.2.2 Trường hợp hai tổng thể 5.3 Kiểm định giả thuyết thống kê tỷ lệ 5.3.1 Trường hợp tổng thể 5.3.2 Trường hợp hai tổng thể Bài tập Chương thuyết 100 100 100 107 111 thống kê 115 115 115 116 116 116 116 117 117 118 118 122 125 125 126 128 Chương Tương quan hồi quy 6.1 Sắp xếp số liệu thực nghiệm 6.2 Đồ thị phân tán 6.3 Hệ số tương quan 6.3.1 Hệ số tương quan lý thuyết 6.3.2 Hệ số tương quan mẫu 6.3.3 Kiểm định giả thuyết giá trị ρ 6.4 Hồi quy tuyến tính 6.4.1 Mơ hình hồi quy tuyến tính 6.4.2 Phương trình hồi quy tuyến tính đơn giản tổng thể 6.4.3 Phương trình đường hồi quy tuyến tính mẫu Bài tập Chương Phụ lục Phụ lục Phụ lục Phụ lục Tài liệu tham khảo 133 133 135 135 135 137 140 140 140 141 143 146 151 154 155 156 159 Lời nói đầu “Xác suất thống kê” môn học cần thiết sinh viên khối trường kỹ thuật nội dung phong phú ứng dụng rộng rãi nhiều lĩnh vực khác khoa học tự nhiên, kỹ thuật, y học kinh tế - xã hội Đã có nhiều sách giáo trình viết cho mơn học này, nhiên nhóm tác giả mong muốn viết giáo trình phù hợp với nội dung chương trình Trường Đại học Nơng Lâm để sinh viên học tập, vận dụng mơn học vào mơn học chun ngành sau đó, phục vụ cho việc học tập bậc cao ứng dụng vào thực tiễn Nông Lâm nghiệp Giáo trình gồm hai phần • Phần I: “Lý thuyết xác suất” có hai chương, PGS TS Nguyễn Thị Dung biên soạn Chương trang bị kiến thức giải tích tổ hợp, khái niệm tảng, định lý quan trọng lý thuyết xác suất cổ điển Chương quan tâm đến khái niệm trung tâm xác suất biến ngẫu nhiên quy luật phân phối xác suất, tham số đặc trưng Một số quy luật phân phối xác suất thông dụng định lý luật số lớn, định lý giới hạn trình bày chương • Phần II: “Thống kê tốn” gồm có chương TS Phạm Thanh Hiếu ThS Mai Thị Ngọc Hà biên soạn Chương trình bày sở lý thuyết mẫu: phương pháp chọn mẫu, xếp mẫu, đặc trưng mẫu Chương Chương quan tâm đến hai toán ước lượng tham số kiểm định giả thuyết thống kê Các toán tương quan hồi quy tuyến tính đơn giản đề cập đến Chương Phần cuối số bảng phụ lục thơng dụng Các bảng biểu, hình vẽ xử lý kỹ thuật LATEX ThS Nguyễn Thị Hồng Nhung đảm nhận Bạn đọc tự học mơn “Xác suất thống kê” với giáo trình trang bị số kiến thức Giải tích cổ điển Đại số tuyến tính Các khái niệm cập nhật thêm thuật ngữ tiếng Anh để bạn đọc làm quen với thuật ngữ đọc sách nước ngồi Hệ thống ví dụ lựa chọn nhiều liên quan đến toán thường gặp thực tế lĩnh vực Nông, Lâm nghiệp, Sinh học Các tập cuối chương dành cho bạn đọc giải thông qua vận dụng lý thuyết lời giải ví dụ chương Trong kiến thức rộng lớn lý thuyết xác suất thống kê toán, để lựa chọn vấn đề cần thiết viết khuôn khổ giáo trình nhỏ cho phù hợp với nội dung chương trình bậc đại học, đáp ứng mục tiêu đề khó khăn Cuốn sách mơn Tốn - Lý dùng v vi Lời nói đầu làm tài liệu tham khảo giảng dạy cho sinh viên trường Đại học Nông Lâm số năm gần khó tránh khỏi sai sót Các tác giả mong muốn nhận nhận xét góp ý đồng nghiệp, sinh viên bạn đọc để giáo trình hồn thiện Nhóm tác giả Phần I Lý thuyết xác suất Sự không chắn phổ biến giới mà ta sống: từ vấn đề giới tự nhiên nắng, mưa, giông, bão, đến vấn đề đời sống trị, xã hội người Ngay Sinh - Lão - Bệnh - Tử – quy luật tất yếu mà biết, chặng đường chắn mà đời người phải trải qua nhìn chung nằm điều khiển Tuy nhiên, không chắn làm cho sống trở nên thú vị nhiều Hãy thử tưởng tượng xem giới trở nên buồn tẻ, chán ngắt đến mức thứ biết trước cách chắn, hoàn hảo? Lý thuyết xác suất ngành khoa học Tốn học xác lập suy luận mang tính định lượng khơng chắn, thơng qua nghiên cứu quy luật tất nhiên ẩn dấu sau tượng mang tính ngẫu nhiên nhằm cho phép dự báo tượng ngẫu nhiên xảy Chính vậy, phương pháp lý thuyết xác suất ứng dụng rộng rãi lĩnh vực sống 70 Chương 2: Biến ngẫu nhiên Quy luật phân phối xác suất Để tìm hiệp phương sai biến ngẫu nhiên rời rạc, ta có cơng thức: Cov(X, Y ) = n ∑ m ∑ xi yj pij − E(X)E(Y ), (2.26) i=1 j=1 biến ngẫu nhiên liên tục ∫+∞ ∫+∞ Cov(X, Y ) = x y f (x, y) dxdy − E(X)E(Y ) (2.27) −∞ −∞ Chú ý 2.5.12 Hiệp phương sai thường dùng để đo mức độ phụ thuộc tương quan hai biến ngẫu nhiên X Y Tuy nhiên, hiệp phương sai có đơn vị đo lường tích đơn vị đo lường biến ngẫu nhiên X Y Do đó, hiệp phương sai có giá trị khác tùy thuộc vào đơn vị đo lường biến nên khơng tiện dùng phân tích so sánh biến ngẫu nhiên Để khắc phục, người ta đưa tham số sau d) Hệ số tương quan: Định nghĩa 2.5.13 Hệ số tương quan (coefficient of correlation) hai biến ngẫu nhiên X Y , ký hiệu ρxy , tỷ số hiệp phương sai tích độ lệch chuẩn biến ngẫu nhiên ρxy = Cov(X, Y ) · σx σy (2.28) Hệ số tương quan đơn vị đo có tính chất sau: Tính chất 2.5.14 (i) ρxy = ρyx (ii) −1 ≤ ρxy ≤ (iii) Nếu ρxy > X Y đồng biến cịn ρxy < X Y nghịch biến (iv) Nếu X Y độc lập ρxy = (v) Nếu ρxy = ±1 X Y phụ thuộc hàm số với  Ví dụ 2.5.15 Xét Ví dụ 2.5.3 Hãy tính (i) E(X), E(Y ) (ii) Cov(X,Y ) (iii) ρxy 2.5 Biến ngẫu nhiên hai chiều 71 Giải (i) Ta áp dụng Cơng thức 2.17 2.18, dùng bảng phân phối xác suất biên X Y Ví dụ 2.5.3 để tính kỳ vọng: E(X) = (1)(0,45) + (2)(0,55) = 1,55 E(Y ) = (1)(0,25) + (2)(0,30) + (3)(0,45) = 2,2 (ii) Áp dụng công thức Cov(X, Y ) = n ∑ m ∑ xi yj pij − E(X)E(Y ) i=1 j=1 = (1)(1)(0,10) + (1)(2)(0,25) + (2)(1)(0,15) + (2)(2)(0,05) + (2)(3)(0,35) = 3,50 − (1,55)(2,20) = 0,09 (iii) Tương tự, ta dùng Cơng thức 2.21 2.22 dùng cách tính phương sai biến ngẫu nhiên chiều thông qua bảng phân phối xác suất biên để tính: V (X) = (1)2 (0,45) + (2)2 (0,55) − (1,55)2 = 0,2475 V (Y ) = (1)2 (0,25) + (2)2 (0,30) + (3)2 (0,45) − (2,2)2 = 0,66 √ √ Do σx = 0,2475 = 0,4975 σy = 0,66 = 0,8124 Vậy, hệ số tương quan hai biến ngẫu nhiên X Y ρxy = Cov(X,Y ) 0,09 = = 0,2226 σx σy (0,4975)(0,8124) Bài tập Chương Một lơ hàng có sản phẩm có phế phẩm Chọn ngẫu nhiên sản phẩm để kiểm tra Gọi X số sản phẩm tốt sản phẩm lấy Tìm bảng phân phối xác suất, hàm phân phối xác suất, tính kỳ vọng, phương sai X Trong hịm có bóng đèn có bóng tốt bóng hỏng Lấy ngẫu nhiên bóng để kiểm tra Gọi X số bóng tốt số bóng kiểm tra Lập bảng phân phối xác suất, tìm hàm phân phối xác suất, tính kỳ vọng, phương sai X Một túi chứa 10 thẻ đỏ thẻ xanh Chọn ngẫu nhiên thẻ Gọi X số thẻ đỏ lấy Lập bảng phân phối xác suất, tìm hàm phân phối xác suất, tính kỳ vọng, phương sai X Một xí nghiệp có tơ vận tải hoạt động Xác suất ngày làm việc ô tô bị hỏng tương ứng 0,1 0,2 Gọi X số ô tô bị hỏng ngày làm việc Lập bảng phân phối xác suất, tìm hàm phân phối xác suất, tính kì vọng phương sai X 72 Chương 2: Biến ngẫu nhiên Quy luật phân phối xác suất Trong phòng thí nghiệm có nghiên cứu viên tiến hành thí nghiệm độc lập tế bào ung thư khoảng thời gian Xác suất thực thành cơng thí nghiệm nghiên cứu viên thứ nhất, thứ hai, thứ ba 0,6; 0,5 0,4 Gọi X số thí nghiệm thành cơng thí nghiệm Lập bảng phân phối xác suất, tìm hàm phân phối xác suất, tính kì vọng phương sai X Một người từ nhà đến quan phải qua ba ngã tư, xác suất để người gặp đèn đỏ ngã tư tương ứng 0,2; 0,4 0,5 Hỏi thời gian trung bình phải dừng đường biết gặp đèn đỏ người phải dừng đường 30 giây Một hộp kín có 10 bi xanh bi đỏ Lấy ngẫu nhiên bi, bi đỏ thưởng ngàn đồng, bi xanh thưởng ngàn đồng Gọi X biến ngẫu nhiên số tiền thưởng Hãy lập bảng phân phối xác suất, tìm hàm phân phối xác suất, tính kỳ vọng, phương sai X Đề thi trắc nghiệm mơn Hóa học gồm 10 câu hỏi, câu có phương án trả lời, có phương án Biết trả lời câu điểm, sai câu trừ điểm Gọi X số điểm đạt Hãy lập bảng phân phối xác suất, tìm hàm phân phối xác suất, tính kỳ vọng, phương sai X Một xạ thủ có viên đạn yêu cầu bắn viên trúng đích hết đạn dừng lại Xác suất bắn trúng đích viên đạn 0,8 Gọi X biến ngẫu nhiên số đạn bắn Lập bảng phân phối xác suất, tìm hàm phân phối, tính kỳ vọng, phương sai X 10 Kiểm tra vấn đáp hết môn cho học sinh, học sinh vào kiểm tra người kiểm tra trước đạt yêu cầu Xác suất đạt yêu cầu kiểm tra học sinh 0,6 Lập bảng phân phối xác suất, tìm hàm phân phối xác suất, tính kì vọng vàphương sai số học sinh vào kiểm tra  x3 x ∈ (0,2) 11 Cho hàm số f (x) = 0 x∈ / (0,2) (a) Chứng minh f (x) hàm mật độ xác suất biến ngẫu nhiên liên tục X (b) Tính kì vọng, phương sai biến ngẫu nhiên (c) Tính(xác suất ) để phép thử độc lập có lần X nhận giá trị khoảng 1, 12 Tìm hệ số k, tìm hàm phân phối xác suất F (x), tính E(X) biến ngẫu nhiên liên tục { X có hàm mật độ xác suất cho bởi: kx(4 − x2 ), x ∈ (0,2) (a) f (x) = x∈ / (0, 2) { kx2 (1 − x), x ∈ (0,1) (b) f (x) = x∈ / (0, 1) 2.5 Biến ngẫu nhiên hai chiều 73 { kx2 (4 − x), x ∈ (0,4) (c) f (x) = x∈ / (0,4) { k(1 − x2 ), x ∈ (−1,1) (d) f (x) = x∈ / (−1,1) { k cos x, x ∈ [−π/4, π/4] (e) f (x) = 0, x∈ / [−π/4, π/4] { cos kx, x ∈ (−π/2k, π/2k) (f) f (x) = 0, x∈ / (−π/2k, π/2k) { x k sin , x ∈ [0, π] (g) f (x) = 0, x∈ / [0, π] 13 Tìm hệ số k, tìm hàm phân phối xác suất F (x) biến ngẫu nhiên liên tục X có hàm { mật độ xác suất cho bởi: k(x3 + 2x + 1) x ∈ [0,4] (a) f (x) = Tính xác suất P (1 X 3) x∈ / [0,4] { k(x − x2 ) x ∈ [0,1] (b) f (x) = Tính xác suất P (1/4 X 1/2) x∈ / [0,1] { kx(2 − x) x ∈ [0,2] (c) f (x) = Tính xác suất P (1 X 3) x∈ / [0,2] { 2kx(x − 1) x ∈ [1,3] (d) f (x) = Tính xác suất P (1/2 X 3/2) x∈ / [1,3] 14 Hãy tính diện tích miền đường cong chuẩn hóa bên trái giá trị sau: (a) u0 = 1,2; (b) u0 = −0,9; (c) u0 = 1,46 (d) u0 = −0,42; 15 Tính xác suất biến ngẫu nhiên có phân phối chuẩn hóa: (a) P (0,3 < U < 1,56) (b) P (−0,2 < U < 0,2) (c) P (U > −0,75) (d) P (U < 1,35) 16 Đường kính loại chi tiết máy sản xuất có phân phối chuẩn, kì vọng 20 mm, phương sai 0,04 mm (a) Tính xác suất để lấy ngẫu nhiên chi tiết có đường kính khoảng 19,9 mm đến 20,3 mm (b) Tính xác suất để lấy ngẫu nhiên chi tiết có đường kính sai khác với kì vọng khơng q 0,3 mm 17 Biến ngẫu nhiên X tuân theo quy luật phân phối chuẩn với kì vọng 10 độ lệch tiêu chuẩn Tính xác suất để X nhận giá trị khoảng (8, 12) 18 Trọng lượng lợn xuất chuồng biến ngẫu nhiên có phân phối chuẩn với giá trị trung bình 80 kg độ lệch tiêu chuẩn kg Con lợn đánh giá chưa đạt tiêu chuẩn có trọng lượng nhỏ 40 kg Tính xác suất để bắt ngẫu nhiên lợn chưa đạt tiêu chuẩn 74 Chương 2: Biến ngẫu nhiên Quy luật phân phối xác suất 19 Chiều cao giống trồng tháng tuổi địa phương biến ngẫu nhiên phân phối chuẩn với kì vọng 54,25 cm độ lệch tiêu chuẩn cm Một coi phát triển có chiều cao nhỏ 50 cm (a) Tìm tỷ lệ phát triển vùng (b) Tính P (| X − 54,25 |< 0,3) 20 Một trường đại học với số lượng sinh viên năm thứ 2000 sinh viên Các sinh viên phải học mơn Tốn cao cấp Sau kết thúc học kì, giáo viên ước lượng điểm thi trung bình sinh viên 5,5 với độ lệch chuẩn 1,5 Biết điểm thi mơn Tốn cao cấp tuân theo quy luật phân phối chuẩn Không dùng bảng tra phân phối chuẩn, ước lượng: (a) Tỷ lệ sinh viên có điểm thi từ 4,0 đến 7,0 Từ suy số sinh viên có điểm thi nằm khoảng (b) Số sinh viên có điểm thi nằm khoảng (4,0; 8,5) (c) Sinh viên có điểm thi lớn 4,0 coi đạt u cầu Hãy tính số sinh viên có điểm thi đạt yêu cầu (d) Số sinh viên có điểm thi lớn 8,5 21 Một chủ trại lợn ước lượng trọng lượng trung bình lợn xuất chuồng trại khoảng 75kg với độ lệch tiêu chuẩn 6kg Biết trọng lượng lợn xuất chuồng có quy luật phân phối chuẩn Hãy xác định: (a) Tỷ lệ lợn xuất chuồng có trọng lượng nằm khoảng (63; 87)kg (b) Tỷ lệ lợn xuất chuồng có trọng lượng nhỏ 63kg (c) Tỷ lệ lợn xuất chuồng có trọng lượng lớn 81kg (d) Biết đàn lợn đến thời gian xuất chuồng trại có 3500 lợn Lợn xuất chuồng phải có trọng lượng lớn 51kg Hãy tính số lợn đạt yêu cầu xuất chuồng trại lợn Phần II Thống kê toán Thống kê toán học đời gắn liền với nhu cầu thực tiễn tự nhiên - xã hội có lịch sử phát triển lâu đời Nội dung thống kê tốn xây dựng phương pháp thu thập, xếp xử lý số liệu thống kê (số liệu thống kê đặc tính định tính đặc tính định lượng) Thơng qua việc phát hiện, phản ánh quy luật mặt lượng tượng, số thống kê giúp cho việc kiểm tra, đánh giá tượng tự nhiên, vấn đề kinh tế vấn đề xã hội Từ đưa định, dự báo chiến lược phát triển cho toán thực tế nhiều lĩnh vực từ tự nhiên đến văn hóa, xã hội thông qua số liệu thu từ vật, tượng nghiên cứu Như ta biết, thống kê tốn chia thành hai mảng thống kê mô tả thống kê suy luận Thống kê mô tả sử dụng để mô tả đặc tính liệu thu thập từ nghiên cứu thực nghiệm thông qua cách thức khác Chương giáo trình trình bày thống kê mơ tả thơng qua nội dung lý thuyết mẫu như: thu thập xử lý mẫu; mô tả mẫu phương pháp định tính định lượng Thống kê suy luận sử dụng để suy đặc điểm tổng thể dựa số liệu có từ mẫu thống kê mô tả Trong giáo trình này, phần thống kê suy luận, trình bày Chương 4, Chương Chương 6, giới thiệu kiến thức số toán quan trọng toán ước lượng tham số, toán kiểm định giả thuyết thống kê toán tương quan hồi quy 75 Chương Cơ sở lý thuyết mẫu Quá trình nghiên cứu thống kê gồm giai đoạn: thu thập số liệu, xử lý tổng hợp phân tích, dự báo Trong thu thập số liệu thường áp dụng hai hình thức chủ yếu: báo cáo thống kê định kỳ điều tra thống kê Chương nhằm giới thiệu số vấn đề cần quan tâm bắt đầu nghiên cứu thống kê giai đoạn thu thập xử lý số liệu • Mục 3.1 trình bày khái niệm tổng thể mẫu, hai đối tượng quan trọng tốn thống kê • Mục 3.2 giới thiệu phương pháp mô tả mẫu ngẫu nhiên • Mục 3.3 trình bày tham số đặc trưng mẫu ngẫu nhiên trung bình mẫu, phương sai mẫu, phương sai điều chỉnh mẫu, độ lệch chuẩn mẫu độ lệch chuẩn điều chỉnh mẫu, hệ số biến động mẫu, Nội dung chương tham khảo tài liệu [8], [9], [12], [14] 3.1 Tổng thể mẫu 3.1.1 Tổng thể kích thước tổng thể Định nghĩa 3.1.1 Toàn tập hợp phần tử đồng theo dấu hiệu nghiên cứu định tính định lượng gọi tổng thể (population) (hay tổng thể nghiên cứu) Số lượng cá thể tổng thể gọi kích thước tổng thể (size of population), thường kí hiệu N Với tổng thể ta nghiên cứu hay số dấu hiệu đặc trưng cho tổng thể đó, gọi dấu hiệu nghiên cứu Các dấu hiệu định tính định lượng (ta gọi biến định tính biến định lượng) Chẳng hạn, để nghiên cứu chiều dài lúa giống lúa dấu hiệu nghiên cứu mang tính định lượng, chiều dài bơng; nghiên cứu loại bệnh xuất gia cầm đồng Bắc Bộ đặc tính mà ta quan tâm đến đặc tính mang tính định tính, cá thể gia cầm tổng thể có khơng có loại bệnh mà ta quan tâm 77 78 Chương 3: Cơ sở lý thuyết mẫu 3.1.2 Mẫu phương pháp chọn mẫu Định nghĩa 3.1.2 Một tập hợp cá thể lấy từ tổng thể gọi mẫu (sample) Số lượng cá thể mẫu gọi kích thước mẫu (size of sample), thường kí hiệu n Chú ý kích thước mẫu thường nhỏ nhiều so với kích thước tổng thể, mẫu phải đại diện khách quan cho tổng thể Từ tổng thể cho ta lấy nhiều mẫu khác (cùng kích thước khơng kích thước) Tập hợp tất mẫu lấy từ tổng thể gọi không gian mẫu (sample space) Ta quan tâm đến phương pháp lấy mẫu sau đây: a) Lấy mẫu ngẫu nhiên khơng hồn lại: Đó phương pháp lấy mẫu cách đánh số cá thể tổng thể từ đến N Rút ngẫu nhiên n cá thể đưa vào mẫu theo hai cách sau • Mẫu ngẫu nhiên đơn giản: Từ tổng thể kích thước N người ta dùng cách rút thăm đơn giản n cá thể mẫu theo bảng số ngẫu nhiên Ưu điểm phương pháp cho phép thu mẫu có tính đại diện cao, cho phép suy rộng kết mẫu cho tổng thể với sai số xác định Nhược điểm phương pháp phải có toàn danh sách tổng thể nghiên cứu, mặt khác chi phí chọn mẫu lớn • Mẫu ngẫu nhiên hệ thống: Là loại mẫu ngẫu nhiên đơn giản hóa cách chọn, có cá thể chọn cách ngẫu nhiên, sau dựa danh sách đánh số tổng thể để chọn cá thể vào mẫu theo thủ tục Nhược điểm phương pháp dễ mắc sai số hệ thống danh sách tổng thể không xếp cách ngẫu nhiên mà lại theo trật tự chủ quan b) Lấy mẫu ngẫu nhiên có hồn lại: Đánh số cá thể tổng thể từ đến N Rút ngẫu nhiên từ tổng thể cá thể, ghi đặc tính cá thể trả cá thể tổng thể, đặc tính vừa ghi lại coi cá thể mẫu Việc xác định cá thể mẫu làm tương tự Từ phương pháp lấy mẫu ngẫu nhiên có hồn lại ta thấy xác suất để cá thể có mặt mẫu 1/N Mỗi cá thể có mặt nhiều lần mẫu Dễ thấy, với kích thước n, số lượng mẫu trường hợp lấy mẫu khơng hồn lại n AnN , số lượng mẫu trường hợp lấy có hồn lại AN = N n Khi N lớn nhiều so với n AnN ≈ N n , việc lấy mẫu hồn lại khơng hồn lại cho ta kết sai lệch không đáng kể c) Lấy mẫu phân tầng: Trước tiên phân chia tổng thể thành tổ theo tiêu chí hay nhiều tiêu chí có liên quan đến mục đích nghiên cứu (chẳng hạn phân tổ doanh nghiệp theo vùng, theo khu vực, theo loại hình kinh doanh, theo quy mơ, ) Sau đó, tổ, dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn đơn vị mẫu Đối với chọn mẫu phân tầng, số đơn vị chọn tổ tuân theo tỷ lệ số đơn vị tổ chiếm tổng thể khơng tn theo tỷ lệ d) Lấy mẫu theo cụm: Trước tiên lập danh sách tổng thể theo khối (như làng, xã, phường, lượng sản phẩm sản xuất đơn vị thời gian, ) Sau đó, 3.1 Tổng thể mẫu 79 ta chọn ngẫu nhiên số khối điều tra tất đơn vị khối chọn Thường dùng phương pháp khơng có sẵn danh sách đầy đủ đơn vị tổng thể cần nghiên cứu e) Lấy mẫu theo chu kỳ: Trong việc kiểm tra chất lượng sản phẩm công nghiệp sản xuất theo dây chuyền, việc lấy mẫu ngẫu nhiên gặp khó khăn tốn Phương pháp lấy mẫu theo chu kỳ tỏ có hiệu sản xuất công nghiệp đại Cứ sau chu kỳ gồm T sản phẩm lấy sản phẩm để đưa vào mẫu Để tránh trùng lặp chu kỳ sản xuất sản phẩm tốt, xấu dây chuyền với chu kỳ lấy mẫu, ta thay đổi chu kỳ T đợt lấy mẫu khác với mục đích mẫu phải đại diện cách khách quan cho tổng thể Các phương pháp lấy mẫu phương pháp phổ biến việc thu thập liệu Việc lấy mẫu tốt, xấu theo nghĩa có khách quan hay khơng ảnh hưởng lớn đến việc đưa kết luận có xác hay khơng đặc tính có mặt tổng thể Chú ý 3.1.3 Từ kết tập mẫu có ta suy kết cho tổng thể mắc phải sai lầm định Độ sai lệch lớn hay bé phụ thuộc vào phương pháp xây dựng mẫu kích thước mẫu Độ xác thống kê thường gọi độ tin cậy (degree of confidence) kết luận, kí hiệu γ Nếu gọi α tỷ lệ sai sót (hay mức ý nghĩa) kết luận α = − γ 3.1.3 Mẫu ngẫu nhiên Giả sử đặc trưng biến X cá thể tổng thể biến ngẫu nhiên, gọi biến ngẫu nhiên gốc, có hàm phân phối xác suất F (x) Ta tiến hành phép lấy mẫu ngẫu nhiên có kích thước n Gọi Xi biến ngẫu nhiên giá trị X cá thể thứ i mẫu, ta thấy Xi biến ngẫu nhiên có phân phối xác suất với X Mỗi biến ngẫu nhiên Xi có giá trị cụ thể xi Do việc lấy mẫu độc lập nên dãy X1 , X2 , ,Xn biến ngẫu nhiên độc lập Định nghĩa 3.1.4 Mẫu ngẫu nhiên (random sample) kích thước n tập hợp n biến ngẫu nhiên độc lập X1 , X2 , , Xn thành lập từ biến ngẫu nhiên X có quy luật phân phối xác suất với X, ký hiệu W = (X1 , X2 , , Xn ) Giả sử X1 nhận giá trị x1 , X2 nhận giá trị x2 , , Xn nhận giá trị xn Tập hợp n giá trị x1 , x2 , , xn tạo thành giá trị cụ thể mẫu ngẫu nhiên gọi mẫu cụ thể, ký hiệu w = (x1 , x2 , , xn )  Ví dụ 3.1.5 Xét tổng thể tập sinh viên Việt Nam, biến ngẫu nhiên gốc X chiều cao sinh viên Xét mẫu có kích thước n = 10, gọi Xi chiều cao sinh viên thứ i mẫu, W = (X1 , X2 , , X10 ) mẫu ngẫu nhiên Thực phép thử mẫu ngẫu nhiên trên, tức tiến hành đo chiều cao (đơn vị mét) 10 sinh viên chọn vào mẫu ta thu mẫu cụ thể 80 Chương 3: Cơ sở lý thuyết mẫu x1 = 1,50; x2 = 1,52; x3 = 1,60; x4 = 1,65; x5 = 1,70; x6 = 1,81; x7 = 1,63; x8 = 1,77; x9 = 1,55, x10 = 1,58, số (1,50; 1,52; 1,60; 1,65; 1,70; 1,81; 1,63; 1,77; 1,55; 1,58) mẫu cụ thể mẫu ngẫu nhiên (X1 , X2 , ,X10 ) Chú ý 3.1.6 (Xem [8, tr 268]) Với cách xây dựng mẫu ngẫu nhiên biến ngẫu nhiên X1 , X2 , , Xn mẫu sẽ: (i) Có dạng phân phối xác suất với biến ngẫu nhiên gốc X, tức có hàm phân phối xác suất F (x); (ii) Các tham số đặc trưng chúng tham số đặc trưng X, tức là: E(X1 ) = E(X2 ) = · · · = E(Xn ) = E(X) V (X1 ) = V (X2 ) = · · · = V (Xn ) = V (X) (3.1) (3.2) 3.2 Các phương pháp mô tả mẫu 3.2.1 Sắp xếp số liệu thực nghiệm Để khai thác xử lý thông tin chứa đựng dãy số liệu ta cần xếp số liệu nhằm nhận đặc trưng dãy số liệu Thơng thường ta xếp số liệu theo thứ tự tăng dần Dãy số liệu ưu điểm dãy số liệu ban đầu, ta dễ dàng nhận biết giá trị nhỏ giá trị lớn nhất, biên độ dao động số liệu mẫu Với cách xếp ta dễ dàng nhận biết số liệu có mặt mẫu lần số liệu xếp liền Một số phương pháp thường dùng để xếp số liệu sau a) Phương pháp liệt kê: Liệt kê tất phần tử mẫu Chẳng hạn, với mẫu cỡ n, ta viết x1 = 2,5; x2 = 2,6; , xn = 3,0 Nhược điểm cách xếp không mô tả mẫu cỡ lớn, tính tốn phức tạp, khơng khoa học b) Phương pháp dùng bảng tần số bảng tần suất: Giả sử từ tổng thể biến ngẫu nhiên gốc X rút mẫu ngẫu nhiên kích thước n, giá trị x1 xuất với tần số n1 , giá trị x2 xuất với tần số n2 , , giá trị xk xuất với tần số nk Lúc sau xi xếp theo trình tự tăng dần giá trị cụ thể mẫu, ta mơ tả mẫu cụ thể bảng phân phối tần số thực nghiệm sau xi ni x1 n1 x2 n2 xi ni xk nk với n1 + n2 + + nk = n Dòng ghi giá trị có mẫu theo thứ tự tăng dần, dòng ghi tần số tương ứng Tần số mẫu số cá thể có đặc tính X = xi mẫu Bảng tần số cho ta nhiều thông tin dãy số liệu 3.2 Các phương pháp mô tả mẫu 81 xếp theo thứ tự tăng dần Ngồi thơng tin có dãy số liệu xếp theo thứ tự tăng dần, qua bảng tần số ta biết số liệu có mặt nhiều nhất, số liệu có mặt mẫu ni Gọi fi = ,(i = 1, ,k) tần suất cá thể có đặc tính xi mẫu, ta có n bảng phân phối tần suất thực nghiệm sau xi fi x1 f1 x2 f2 xi fi xk fk với f1 + f2 + + fk = Ngoài thơng tin có bảng tần số mẫu, ta cịn biết tỷ lệ phần trăm đóng góp số liệu mẫu  Ví dụ 3.2.1 Gặt ngẫu nhiên 100 điểm trồng lúa vùng, ta thu số liệu xếp thành bảng sau: Năng suất(tạ/ha) Số điểm ni 21 10 24 20 25 30 26 15 28 10 32 10 34 Bảng phân phối tần suất thực nghiệm: xi fi 21 0,1 24 0,2 25 0,3 26 0,15 28 0,1 32 0,1 34 0,05 c) Phương pháp phân khoảng: Khi làm việc với số liệu dạng biến ngẫu nhiên liên tục, giá trị quan sát xi gần Trong trường hợp ta thường chia miền giá trị quan sát thành khoảng liên tiếp [xi , xi+1 ), thông thường với độ rộng để thuận tiện cho việc phân tích xử lý số liệu Cách làm sau: Giả sử xmin giá trị nhỏ nhất, xmax giá trị lớn số liệu Chia khoảng (xmin , xmax ) thành k khoảng cách với độ rộng khoảng là: xmax − xmin h= k Có nhiều cách để chọn giá trị k Có thể dùng cơng thức 2k > n, với k ∈ Z k = 1+[3,322 lg n] Kết hợp với bảng tần số, ta có bảng sau gọi bảng ghép lớp Khoảng Tần số liệu khoảng x0 − x1 n1 x1 − x2 n2 xk−1 − xk nk ni số cá thể có đặc tính X thỏa mãn xi−1 X xi , i = 1,2, , n có mẫu Phương pháp có ưu điểm mô tả liệu, khoảng dầy xác, tính tốn máy tính thuận lợi  Ví dụ 3.2.2 Trong vấn 30 sinh viên trường đại học thời gian (tính phút) ngày mà sinh viên dành cho việc học, người ta thu số liệu sau: 82 Chương 3: Cơ sở lý thuyết mẫu 102 71 103 105 109 124 104 116 97 99 108 112 85 107 105 86 118 122 67 99 103 87 87 78 101 82 95 100 125 92 Hãy xếp số liệu dạng bảng tần số với số liệu phân khoảng Giải Ta có n = 30, xmin = 67 xmax = 125 Gọi k số khoảng, ta chọn k theo quy tắc 2k > n, k ∈ Z Suy k ≥ Chọn k = Khi độ rộng h khoảng là: xmax − xmin 125 − 67 h= = ≈ 12 k Khi đó, ta có khoảng chia tần số tương ứng biểu diễn bảng sau đây: Thời gian (phút) Tần số 67 − 79 79 − 91 91 − 103 103 − 115 115 − 127 3.2.2 Biểu diễn số liệu biểu đồ Phương pháp thường dùng thống kê mô tả Sau thu thập số liệu vào mẫu xếp số liệu thành bảng tần số, bảng tần suất hay bảng ghép lớp, người ta biểu diễn số liệu biểu đồ để minh họa mật độ phân bố số liệu thực nghiệm dựa sở mẫu ngẫu nhiên cho Có nhiều loại biểu đồ để biểu diễn số liệu thống kê biểu đồ hình trịn, hình cột, biểu đồ đường, biểu đồ hình bậc thang, Việc sử dụng loại biểu đồ để biểu diễn số liệu cho thích hợp phụ thuộc vào đặc tính đặc trưng mà ta nghiên cứu (biến định tính hay biến định lượng), phụ thuộc vào phương pháp xếp số liệu mục đích nghiên cứu chủ thể a) Biểu đồ tần số: Nếu số liệu xếp phân loại theo tần số người ta thường dùng loại biểu đồ sau để biểu diễn: • Biểu đồ tần số hình cột gồm nhiều hình chữ nhật, đặc tính ứng với cột hình chữ nhật, đáy cột trùng với trục hoành biểu thị đặc tính tương ứng, trục tung biểu thị tần số độ cao cột hình chữ nhật thể tần số đặc tính • Biểu đồ đường tần số hay đa giác tần số đường nối điểm (x1 , n1 ), (x2 , n2 ), , (xk , nk ) b) Biểu đồ tần suất: Nếu liệu xếp phân loại theo tần suất hay tỷ lệ phần trăm người ta thường dùng loại biểu đồ sau để biểu diễn: • Biểu đồ hình trịn biểu đồ gồm nhiều hình quạt, hình quạt biểu diễn tỷ lệ phần trăm đặc tính so với tồn đặc tính thu mẫu n1 • Biểu đồ đường tần suất hay đa giác tần suất đường nối điểm (x1 , ), (x2 , n n2 nk ), , (xk , ) Gọi pi = P (X = xi ), theo định nghĩa thống kê xác suất n n ni → pi n → ∞, điều nghĩa n đủ lớn tung độ biểu n 3.2 Các phương pháp mơ tả mẫu 83 đồ đường tần suất xấp xỉ tung độ biểu đồ đường xác suất cần tìm Do biểu đồ đường tần suất giúp ta hình dung dạng hàm mật độ biến ngẫu nhiên X  Ví dụ 3.2.3 Để nghiên cứu chất lượng học tập sinh viên năm thứ trường đại học, người ta thống kê điểm tổng kết theo xếp loại A,B,C,D 400 sinh viên năm thứ chọn ngẫu nhiên từ danh sách thu bảng số liệu sau Đánh giá Tần số A 35 B 260 C 93 D 12 Hãy vẽ biểu đồ hình trịn hình cột biểu diễn kết học tập 400 sinh viên Giải Ta tổng hợp số liệu bảng dạng bảng thống kê sau để thuận tiện cho việc biểu diễn số liệu biểu đồ hình trịn Đánh giá A B C D Tổng số Tần số 35 260 93 12 400 Tần suất 35/400 = 0,09 260/400 = 0,65 93/400 = 0,23 12/400 = 0,03 1,00 Phần trăm 9% 65% 23% 3% 100% 300 250 200 150 100 50 C 32% 260 D A 9% 3% fi Góc trịn 0,09 × 360 = 32,4o 234o 82,8o 10,8o 360o B 93 35 65% 12 B C A D xi Hình 3.1: Biểu đồ tần số hình cột Hình 3.2: Biểu đồ hình trịn Tác động trực quan hai loại biểu đồ có khác Biểu đồ hình trịn dùng để biểu thị mối quan hệ loại đặc tính với tồn bộ, biểu đồ hình cột dùng để nhấn mạnh số lượng thực tần số đặc tính có mẫu thơng qua độ cao cột Hai loại biểu đồ dùng để mô tả số liệu biến định lượng Nhiều người ta phải tập hợp số liệu biến định lượng nhóm phân loại tổng thể Chẳng hạn, nghiên cứu thu nhập trung bình người dân theo nhóm giới tính, nghề nghiệp theo vùng địa lý khác quốc gia Trong trường hợp đó, dùng đồ thị hình trịn hình cột để mơ tả số liệu thu thập 84 Chương 3: Cơ sở lý thuyết mẫu c) Tổ chức đồ tần suất: Khi X biến ngẫu nhiên liên tục, kích thước mẫu lớn ta phải ghép số liệu thành lớp, chẳng hạn thành k lớp với độ rộng lớp h, điểm chia x0 < x1 < x2 < < xk Khi tổ chức đồ tần suất hình bậc thang gồm nhiều hình chữ nhật có đáy trùng với trục hồnh, độ dài cạnh đáy hình chữ nhật thứ i h, cạnh đáy đoạn [xi−1 , xi ] chiều cao ni ni ni Diện tích hình chữ nhật thứ i h = Diện tích hình bậc thang nh nh n n1 n2 nk h +h + + h = nh nh nh Đa giác tần suất tập hợp đoạn thẳng nối liền trung điểm đáy hình chữ nhật đứng kề tổ chức đồ Hai đoạn nối với h điểm trục hoành cách điểm x0 hay (xn ) khoảng Tổ chức đồ đa giác tần suất giúp ta hình dung dạng hàm mật độ biến ngẫu nhiên liên tục X  Ví dụ 3.2.4 Trong điều tra suất trung bình (tính tạ/ha) giống lúa vùng, người ta gặt ngẫu nhiên 100 ruộng vùng thu bảng số liệu: X( suất) ni ( số thửa) 40 − 42 42 − 44 13 44 − 46 25 46 − 48 35 48 − 50 15 50 − 52 Hãy lập tổ chức đồ tần suất với mẫu Giải Vì độ rộng khoảng h = nên ta có bảng sau: X ni ni nh 40 − 42 42 − 44 13 44 − 46 25 46 − 48 35 48 − 50 15 50 − 52 0,035 0,065 0,125 0,175 0,075 0,025 Tổ chức đồ tần suất đa giác tần suất ứng với mẫu sau: ni nh 0,175 0,125 0,075 0,065 0,035 0,025 x Hình 3.3: Tổ chức đồ tần suất 3.3 Các tham số đặc trưng mẫu ngẫu nhiên Trong Chương 2, nghiên cứu số tham số đặc trưng kỳ vọng, phương sai, độ lệch chuẩn, hệ số biến động, tổng thể Mục dành để nghiên

Ngày đăng: 15/11/2023, 13:30

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan