Bài I. LÝ THUYẾT MẪU Ghi chú: những bài tập có ký hiệu T trên đầu là bài tập làm thêm, không bắt buộc. 1. Số liệu về chiều cao của các sinh viên nữ (Đơn vị: inch) trong một lớp học như sau: 62 64 66 67 65 68 61 65 67 65 64 63 67 68 64 66 68 69 65 67 62 66 68 67 66 65 69 65 70 65 67 68 65 63 64 67 67 a Tính chiều cao trung bình và độ lệch tiêu chuẩn. b Vẽ biểu đồ Stem & Leaf cho số liệu chiều cao. Từ đồ thị, hãy nêu các đặc điểm của số liệu. c Trung vị của chiều cao sinh viên lớp này là bao nhiêu? 2. Cũng trong lớp học này, đo chiều cao của các nam sinh viên 69 67 69 70 65 68 69 70 71 69 66 67 69 75 68 67 68 69 70 71 72 68 69 69 70 71 68 72 69 69 68 69 73 70 73 68 69 71 67 68 65 68 68 69 70 74 71 69 70 69 a Vẽ biểu đồ Stem & Leaf về chiều cao của các nam sinh viên trên đồ thị đã vẽ của nữ sinh viên để so sánh. (HD: phần của 2 đồ thi sử dụng chung, phần lá về chiều cao của nữ sinh vẽ bên phải, phần lá của đồ thi của nam sinh vẽ bên trái) b Từ đồ thị, hãy nêu các nhận xét về số liệu chiều cao nam sinh và nữ sinh mà anh (chị) thấy được. 3. Với số liệu chiều cao nữ sinh viên trong bài 1), hãy vẽ biểu đồ tổ chức tần số (histogram); tương tự vẽ đồ thi histogram cho chiều cao nam sinh viên trong bài 2). 4. Cho bộ dữ liệu sau: 4.2, 4.7, 4.7, 5.0, 3.8, 3.6, 3.0, 5.1, 3.1, 3.8, 4.8, 4.0, 5.2, 4.3, 2.8, 2.0, 2.8, 3.3, 4.8, 5.0 a Tính trung bình mẫu, phương sai mẫu và độ lệch tiêu chuẩn. b Vẽ đồ thị boxplot. 5. Cho bộ dữ liệu sau: 43 47 51 48 52 50 46 49 45 52 46 51 44 49 46 51 49 45 44 50 48 50 49 50 a Tính trung bình mẫu, phương sai mẫu và độ lệch tiêu chuẩn. b Vẽ đồ thị boxplot, từ đồ thị hãy nêu các nhận xét về dữ liệu. n 6T. Xét biểu thức y = ∑ ( xi − a ) , với a nào thì y đạt giá trị nhỏ nhất? i =1 7T. Xét y = a + bx , i = 1, …, n, và a,b là các hằng số khác 0. Hãy tìm mối liên hệ i i giữa x và y , sx và sy. 8T. Giả sử ta có mẫu cỡ n gồm các giá trị quan trắc: x1, x2 ,…, xn và đã tính được trung bình mẫu xn và phương sai mẫu sn2 Quan trắc thêm giá trị thứ (n+1) là xn +1 , gọi xn +1 và sn2+1 lần lượt là trung bình mẫu và phương sai mẫu ứng với mẫu có (n+1) quan trắc. a Tính xn +1 theo xn và xn +1 n ( xn +1 − xn ) = ( n − 1) s + n +1 2 n +1 b Chứng tỏ rằng: ns n Bài II. ƯỚC LƯỢNG THAM SỐ THỐNG KÊ Ghi chú: những bài tập có ký hiệu T trên đầu là bài tập làm thêm, không bắt buộc. 1T. Giả sử có mẫu ngẫu nhiên cỡ 2n được chọn từ tổng thể có đặc tính X, EX = μ và VarX = σ Đặt X1 = 2n ∑ Xi 2n i =1 vaø X = n ∑ Xi n i =1 là hai ước lượng cho kỳ vọng μ , hỏi ước lượng nào tốt hơn, tại sao? 2T. Xét biến ngẫu nhiên X ~ N ( μ , σ ) , chứng tỏ rằng a S = n X i − X ) là một ước lược chệch cho phương sai σ ( ∑ n i =1 b Tìm độ chệch của ước lượng. Độ chệc của ước lượng sẽ như thế nào nếu tăng cỡ mẫu? 3T. Biết X và s12 là trung bình mẫu và phương sai mẫu lấy từ tổng thể có kỳ vọng là μ1 và phương sai σ 12 và X và s22 là trung bình mẫu và phương sai mẫu lấy từ tổng thể thứ hai độc lập có kỳ vọng là μ2 và phương sai σ 22 Cỡ mẫu lấy từ hai tổng thể lần lượt là n1 và n2 a Chỉ ra rằng X ‐ X là một ước lượng không chệch cho μ1 ‐ μ2 b Giả sử phương sai hai tổng thể bằng nhau σ 12 = σ 22 = σ Chỉ ra rằng S= (n1 − 1) S12 + (n2 − 1) S22 n1 + n2 − c là một ước lượng không chệch cho σ 4. Xét một tổng thể có phân phối chuẩn với phương sai σ đã biết, hỏi. a Độ tin cậy của khoảng tin cậy x − 2.14σ / n ≤ μ ≤ x + 2.14σ / n là bao nhiêu? b Độ tin cậy của khoảng tin cậy x − 2.49σ / n ≤ μ ≤ x + 2.49σ / n là bao nhiêu? c Độ tin cậy của khoảng tin cậy x − 1.85σ / n ≤ μ ≤ x + 1.85σ / n là bao nhiêu? 5. n = 100 mẫu nước được lấy từ các hồ nước và đo hàm lượng canxi (mg/l). Một khoảng tin cậy 95% cho hàm lượng canxi trung bình là 0.49 ≤ μ ≤ 0.82 a Khoảng tin cậy 99% được tính từ mẫu này sẽ dài hơn hay ngắn hơn KTC 95%? b Xét phát biểu sau: có 95% khả năng giá trị μ từ 0.49 đến 0.82. Phát biểu này đúng không? Giải thích. c Xét phát biểu sau: Nếu một mẫu ngẫu nhiên cỡ n = 100 mẫu nước được chọn và đã tính KTC 95% cho μ , và quá trình lấy mẫu này lặp lại 1000 lần, thì 950 KTC sẽ chưa giá trị thực của μ ? Phát biểu này đúng không? Giải thích. 6. Đường kính của một ống piston trong động cơ xe máy có phân phối chuẩn với độ lệch chuẩn σ = 0.001 mm. Một mẫu ngẫu nhiên gồm 15 ống piston có đường kính trung bình x = 74.036 mm. a Lập KTC 95% cho đường kính trung bình của piston. b Lập KTC 99% cho đường kính trung bình của piston. 7T. Khoảng [L, U] gọi là Khoảng tin cậy với độ tin cây 100 γ % cho tham số θ nếu P [ L ≤ θ ≤ U ] = γ Khoảng ( −∞,U ) và ( L, +∞ ) lần lượt gọi là Khoảng tin cậy bên trái và bên phải cho θ Xét biến ngẫu nhiên X ~ N ( μ , σ ) , lấy mẫu n phần tử có trung bình mẫu là X và phương sai đã biết σ a. Xây dựng KTC bên trái và bên phải cho kỳ vọng μ b. Gọi Y là số phần tử loại A có trong mẫu ( X ,…, X n ) , hãy tìm KTC bên trái và bên phải cho tỷ lệ p (tỷ lệ phần tử loại A trong tổng thể). 8. Gọi X là sản lượng lúa tính bằng tạ/ha. Giả sử X có phân phối chuẩn. Lấy mẫu trên 10 thửa ruộng cho kết quả: 51, 48, 56, 57, 44, 52, 50, 60, 46, 47 . Hãy tìm khoảng tin cậy 99% cho sản lượng lúa trung bình. 9. Quan sát trọng lượng X (kg) của 1 nhóm thanh niên ta có bảng số liệu sau: Trọng lượng Số người 42,5 – 47,5 47,5 – 52,5 52,5 – 57,5 57,5 – 62,5 62,5 – 67,5 8 14 28 18 12 a Tính các tham số mẫu. b Tìm KTC cho trọng lượng trung bình với độ tin cậy 95%. c Những thanh niên có trọng lượng từ 55 kg trở lên gọi là nhóm có sức khỏa loại A, hãy tìm KTC cho tỷ lệ thanh niên có sức khỏe loại A với ĐTC 98%. 10. Độ chịu nén của các hợp kim được kiểm tra bởi 1 kỹ sư, anh ta chọn 12 mẫu để kiểm tra và thu được kết quả sau 2216 2225 2318 2237 2301 2255 2249 2281 2275 2204 2263 2295 a Có thể kết luận rằng độ chịu nén của các hợp kim tuân theo phân phối chuẩn hay không? Hãy sử dụng 1 loại đồ thị để kiểm tra phân phối của dữ liệu. b Lập khoảng tin cậy 95% cho độ chịu nén trung bình của một mẫu hợp kim. c Lập khoảng tin cậy 95% bên phải cho độ chịu nén trung bình của một mẫu hợp kim. 11. Một nhà máy sản xuất những thanh trục sử dụng trong động cơ xe máy. Chọn ngẫu nhiên 15 thanh trục và đo đường kính (Đv: mm) được kết quả sau: 8.24 8.25 8.20 8.23 8.24 8.21 8.26 8.26 8.20 8.25 8.23 8.23 8.19 8.28 8.24 a Hãy kiểm tra giả thiết về phân phối chuẩn cho đường kính thanh trục. b Lập KTC 95% cho đường kính trung bình của 1 thanh trục. 12. Theo dõi 1000 bệnh nhân ung thư phổi thấy có 823 bệnh nhận chết trong vòng 10 năm. a Lập KTC 95% cho tỷ lệ bệnh nhân chết vì ung thư phổi. b Nếu muốn sai số bé hơn 0.03 thì phải theo dõi tối thiểu bao nhiêu bệnh nhân trong 10 năm? 13. Chọn ngẫu nhiên 50 nón bảo hiểm từ những người đi xe máy và kiểm tra độ chịu lực của nón. Sau khi kiểm tra tháy có 18 nón bị hỏng khi tác động lực. a Lập KTC 95% cho tỷ lệ nón bảo hiểm bị hỏng. b Sử dụng giá trị ước lượng cho tỷ lệ nón bảo hiểm bị hỏng của mẫu 50 nón bảo hiểm đã được chọn. Hỏi cần phải kiểm tra ít nhất bao nhiêu nón để sai số ước lượng của KTC 95% bé hơn 0.02. 14. Một khảo sát trên các hộ gia đình ở một TP cho thấy rằng mỗi gia đình có ít nhất 2 ti vi. Hỏi cần khảo sát bao nhiêu gia đình để KTC 99% có sai số bé hơn 0.017? 15. Tại một vùng rừng nguyên sinh, người ta theo dõi 1 loài chim bằng cách đeo vòng cho chúng. Tiến hành đeo vòng cho 1000 con. Sau một thời gian, bắt lại 200 con thì thấy 40 con có đeo vòng. Hãy ước lượng số chim trong vùng rừng đó với độ tin cậy 99%. 16. Kiểm tra 100 sản phẩm trong lô hàng thấy có 20 phế phẩm. a. Hãy tìm KTC 95% cho tỉ lệ phế phẩm. b. Nếu độ chính xác là 0,04 thì độ tin cậy của ước lượng là bao nhiêu. c. Nếu muốn có độ tin cậy 99% và độ chính xác 0,04 thì phải kiểm tra bao nhiêu sản phẩm. 17. Một khách hàng nhận được lô hàng từ nhà máy sản xuất bút bi rẻ tiền. Để ước lượng tỷ lệ bút bi bị hỏng, khách hàng lấy ngẫu nhiên 300 bút để kiểm tra và thấy có 30 bút hỏng. a. Tìm KTC 99% cho tỷ lệ bút hỏng. b. Tìm KTC 95% phía bên phải cho tỷ lệ bút hỏng. Lô hàng sẽ bị từ chối nếu có trên 5% số bút hỏng. Dựa vào mẫu điều tra và KTC 95% bên phải chủ hàng có thể từ chối lô hàng đó không. Số bút bi bị hỏng tối đa là bao nhiêu để chấp nhận lô hàng.