XSTK Ứng Dụng Trong Kinh Tế - TLU and maths ď Chuong7_HO tài liệu, giáo án, bài giảng , luận văn, luận án, đồ án, bài tậ...
CHƯƠNG 7: ƯỚC LƯỢNG CÁC THAM SỐ TỔNG THỂ Trần Minh Nguyệt Đại học THĂNG LONG Tháng năm 2014 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Nội dung Ước lượng điểm Ước lượng khoảng cho trung bình tổng thể Khoảng tin cậy cho trung bình tổng thể phân phối chuẩn biết phương sai Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu lớn Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Câu lệnh R Ước lượng khoảng cho tỷ lệ tổng thể Ước lượng khoảng cho tỷ lệ tổng thể Câu lệnh R Xác định cỡ mẫu cho toán ước lượng Quy tắc xác định cỡ mẫu cho ước lượng trung bình tổng thể Quy tắc xác định cỡ mẫu cho ước lượng tỷ lệ tổng thể Xác định cỡ mẫu tình tổng thể hữu hạn Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Ví dụ Hai bạn Mai Hoa muốn điều tra xem chi phí trung bình sinh viên Thăng Long sống xa nhà năm học 2013-2014 Vì khơng thể điều tra tất bạn sinh viên Thăng Long năm đó, nên bạn định chọn mẫu ngẫu nhiên cỡ 20 Hai bạn tự thu thập mẫu riêng Mẫu Hoa là: 63 65 54 70 62 68 60 58 68 61 58 66 51 55 68 51 60 64 61 57 58 60 56 57 49 58 51 52 54 55 56 57 62 53 Và mẫu Mai: 51 59 62 49 52 58 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Ví dụ Hoa tính sau: 63 + 65 + 54 + + 64 + 61 + 57 = 61 20 Mai tính sau: 51 + 59 + 62 + + 57 + 62 + 53 = 55.45 20 Hoa kết luận: Chi phí trung bình cho năm học 2013- 2014 sinh viên Thăng Long sống xa nhà 61 triệu đồng Mai kết luận: Chi phí trung bình cho năm học 2013- 2014 sinh viên Thăng Long sống xa nhà 55.45 triệu đồng Hỏi: Ai đúng, sai hai bạn? Hai số mà Mai Hoa tính có ý nghĩa mục đích hai bạn? Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Ví dụ Chi phí trung bình sinh viên Thăng Long sống xa nhà năm học 2013-2014 số xác định nhất, xác định cơng thức: Tổng chi phí tất sinh viên Thăng Long Tổng số sinh viên Thăng Long Con số trung bình tổng thể, kí hiệu µ, tổng thể tập hợp sinh viên Thăng Long sống xa nhà năm học 2013-2014 Tuy nhiên, khơng biết µ (Tại sao?) Hai số Mai Hoa tính khơng phải giá trị µ, trung bình mẫu ¯x Tuy nhiên, chừng mực đó, trung bình mẫu cho ”thơng tin” trung bình tổng thể µ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Tham số tổng thể Hàm ước lượng điểm Định nghĩa Một hàm ước lượng điểm cho tham số θ tổng thể biến ngẫu nhiên phụ thuộc vào mẫu, cho mẫu cụ thể hàm ước lượng cho kết số Đối với mẫu cụ thể, số tìm được gọi ước lượng điểm tham số θ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Tham số tổng thể Hàm ước lượng điểm Chú ý: Các mẫu khác cho ước lượng điểm khác cho tham số tổng thể Có nhiều hàm ước lượng điểm khác cho tham số tổng thể, nhiên ta thường sử dụng hàm ước lượng điểm sau: Tham số tổng thể Trung bình (µ) Phương sai (σ ) Độ lệch chuẩn (σ) Tỷ lệ (p) Hàm ước lượng X S2X SX PX Trần Minh Nguyệt (ĐH THĂNG LONG) Ước lượng x s2x sx px Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Hàm ước lượng điểm X, PX ta biết từ chương trước, SX S2X xác định sau: Với mẫu ngẫu nhiên (X1 , X2 , , Xn ) từ tổng thể thì: S2X = n1 [(X1 X)2 + (X2 X)2 + + (Xn X)2 ] gọi phương sai mẫu SX bậc hai S2X gọi độ lệch chuẩn mẫu Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Ví dụ Ví dụ 1: Quay lại với ví dụ Mai Hoa: Hai số mà bạn tìm ước lượng điểm cho chi phí trung bình sinh viên Thăng Long sống xa nhà năm học 2013-2014 ¯ Cả hai bạn dùng hàm ước lượng điểm X ¯ = X1 + X2 + + Xn X n Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Ví dụ Ví dụ 2: Một mẫu ngẫu nhiên gồm điểm thi kì mơn XSTKUD bạn sinh viên chọn từ lớp sau: 5, 6, 4, 9, 8, Tìm ước lượng điểm cho điểm thi XSTK kì trung bình lớp Tìm ước lượng điểm cho phương sai điểm thi XSTK kì lớp Tìm ước lượng điểm cho độ lệch chuẩn điểm thi XSTK kì lớp Tìm ước lượng điểm cho tỉ lệ sinh viên có điểm thi XSTK kì lớn lớp Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 10 / 53 Ước lượng điểm Lời giải > Diem=c(5,6,4,9,8,3) > mean(Diem) > var(Diem) [1] 5.833333 [1] 5.366667 > sd(Diem) [1] 2.31660 Vậy ước lượng điểm cho điểm thi XSTK kì trung bình lớp 5.8 Một ước lượng điểm cho phương sai điểm thi XSTK kì lớp 5.37 Một ước lượng điểm cho độ lệch chuẩn điểm thi XSTK kì lớp 2.32 Một ước lượng điểm cho tỉ lệ sinh viên có điểm thi XSTK kì lớn lớp 36 = 0.5 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 11 / 53 Ước lượng điểm Hàm ước lượng không chệch Định nghĩa Gọi θ tham số cần ước lượng θˆ hàm ước lượng điểm θ Hàm ước lượng θˆ gọi hàm ước lượng không chệch tham số θ ˆ E(θ) = θ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 12 / 53 Ước lượng điểm Hàm ước lượng không chệch Ví dụ: Xét (X1 , X2 , , Xn ) mẫu cỡ n từ tổng thể có trung bình µ phương sai σ Trung bình mẫu X, phương sai mẫu s2X Ta có E(X) = µX nên X hàm ước lượng không chệch trung bình tổng thể Ta có E(s2X ) = σX2 nên phương sai mẫu ước lượng không chệch phương sai tổng thể Ta có E(PX ) = p nên tỷ lệ mẫu ước lượng không chệch tỷ lệ tổng thể Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 13 / 53 Ước lượng điểm Hàm ước lượng không chệch hữu hiệu Định nghĩa Cho θˆ1 θˆ2 hai hàm ước lượng θ dựa mẫu ngẫu nhiên θˆ1 gọi hữu hiệu θˆ2 Var(θˆ1 ) Var(θˆ2 ) Nếu θˆ hàm ước lượng không chệch θ có phương sai nhỏ tất hàm ước lượng khơng chệch θ θˆ gọi hàm ước lượng không chệch hữu hiệu Nhận xét: Các hàm ước lượng sau đây: Trung bình mẫu từ phân phối chuẩn Phương sai mẫu từ phân phối chuẩn Tỷ lệ mẫu từ phân phối nhị thức hàm ước lượng không chệch hữu hiệu Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 14 / 53 Ước lượng khoảng cho trung bình tổng thể Ước lượng khoảng Định nghĩa Giả sử θ tham số cần ước lượng α số, α Dựa mẫu ngẫu nhiên rút từ tổng thể ta tìm hai biến ngẫu nhiên A, B cho: P(A θ B) = α Khi khoảng (A, B) gọi hàm ước lượng khoảng với độ tin cậy (1 α)100% cho θ .Số α gọi độ tin cậy khoảng ước lượng Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 Với mẫu cụ thể chọn ra, A, B có giá trị a, b khoảng (a, b) gọi khoảng tin cậy (1 α)100% cho θ 15 / 53 Khoảng tin cậy cho trung bình tổng thể phân phối chuẩn biết Ước lượng khoảng cho trung bình tổng thể phương sai Tổng thể phân phối chuẩn, biết phương sai Bài toán Cho tổng thể tuân theo phân phối chuẩn với phương sai σ biết trung bình µ chưa biết Tìm khoảng tin cậy (1 α)100% cho trung bình µ tổng thể dựa thơng tin mẫu ngẫu nhiên chọn từ tổng thể Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 16 / 53 Khoảng tin cậy cho trung bình tổng thể phân phối chuẩn biết Ước lượng khoảng cho trung bình tổng thể phương sai Tổng thể phân phối chuẩn, biết phương sai Lời giải: Giả sử X1 , X1 , , Xn mẫu ngẫu nhiên độ dài n chọn từ tổng thể có phân phối chuẩn với phương sai σ biết trung bình µ chưa biết Ta có Trung bình mẫu X= X1 + X2 + + Xn n có phân phối chuẩn Z= Xµ ? σ/ n N(0, 1) Mặt khác ta biết với số α cho trước ln tìm số zα/2 cho: P(zα/2 Z zα/2 ) = α hay P(Z ¡ zα/2 ) = P(Z zα/2 ) = α Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 17 / 53 Khoảng tin cậy cho trung bình tổng thể phân phối chuẩn biết Ước lượng khoảng cho trung bình tổng thể phương sai Minh họa hình vẽ Khoang tin cay (1 − α)100% cho trung binh tong the Duong mat cua phan phoi chuan hoa 1−α α α − zα zα Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 18 / 53 Khoảng tin cậy cho trung bình tổng thể phân phối chuẩn biết Ước lượng khoảng cho trung bình tổng thể phương sai Tổng thể phân phối chuẩn, biết phương sai Do đó: α= = = P(zα/2 Z zα/2) Xµ ? zα/2) P(zα/2 σ/ n σ σ P(X zα/2 ? µ X + zα/2 ? ) n n Vậy hàm ước lượng cho trung bình tổng thể trường hợp tổng thể phân phối chuẩn, biết phương sai tổng thể là: σ σ (X zα/2 ? , X + zα/2 ? ) n n Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 19 / 53 Khoảng tin cậy cho trung bình tổng thể phân phối chuẩn biết Ước lượng khoảng cho trung bình tổng thể phương sai Tổng thể phân phối chuẩn, biết phương sai Vậy khoảng tin cậy (1 α)100% cho trung bình tổng thể trường hợp tổng thể có phân phối chuẩn biết phương sai là: σ σ (x zα/2 ? , x + zα/2 ? ) n n đó: x : trung bình mẫu σ : độ lệch chuẩn tổng thể n : cỡ mẫu zα/2 : phân vị ứng với mức xác suất α/2 phân phối chuẩn hóa Trên R, zα/2 tính lệnh: qnorm(1 α/2) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 20 / 53 Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu lớn Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu lớn Bài tốn Cho tổng thể tùy ý (khơng thiết tuân theo phân phối chuẩn) với phương sai σ chưa biết trung bình µ chưa biết Tìm khoảng tin cậy (1 α)100% cho trung bình µ tổng thể dựa thơng tin mẫu ngẫu nhiên chọn từ tổng thể cỡ mẫu n lớn (n ¥ 30) Lời giải: Khi cỡ mẫu n lớn (n ¥ 30) trung bình mẫu X xấp xỉ phân phối chuẩn Ta có khoảng tin cậy (1 α)100% là: sx x zα/2 ? n µ x + zα/2 ?sxn Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 21 / 53 Ước lượng khoảng cho trung bình tổng thể Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu lớn Ví dụ Trong quy trình sản xuất bao đường tinh chế, trọng lượng đường bao tuân theo phân phối chuẩn với độ lệch chuẩn 1.2 (kg) Một mẫu ngẫu nhiên gồm 25 bao đường chọn trọng lượng trung bình 19.8 (kg) Tìm khoảng tin cậy 90% cho trọng lượng trung bình tất bao đường sản xuất quy trình Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 22 / 53 Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu lớn Ví dụ Ban giám đốc nhà máy in quan tâm tới số lỗi trang sách Chọn ngẫu nhiên 100 trang, đọc kỹ, nhận thấy số lỗi trung bình 1.24 lỗi trang độ lệch chuẩn 0.8 Tìm khoảng tin cậy 95% cho số lỗi trung bình tất trang in Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 23 / 53 Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Khoảng tin cậy cho trung bình cỡ mẫu nhỏ Bài toán Cho tổng thể tuân theo phân phối chuẩn với trung bình µ chưa biết phương sai σ chưa biết Tìm khoảng tin cậy (1 α)100% cho trung bình tổng thể dựa thông tin mẫu ngẫu nhiên chọn từ tổng thể có số phần tử n 30 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 24 / 53 Ước lượng khoảng cho trung bình tổng thể Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Mô tả phân phối t Ta biết tổng thể có phân phối chuẩn phân phối Xµ ? σ/ n phân phối chuẩn hóa Xµ ? có σ/ n Khi tổng thể tuân theo phân phối cỡ mẫu lớn phân phối xấp xỉ phân phối chuẩn hóa Xµ ? tn theo phân phối t (hay phân phối Tuy nhiên với n nhỏ SX / n Student) với bậc tự df = n Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 25 / 53 Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Mô tả phân phối t 0.4 Phan phoi t so sanh voi phan phoi chuan 0.0 0.1 0.2 0.3 df=1 df=2 df=5 df=10 PPchuan −3 −2 −1 x Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 26 / 53 Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Mô tả phân phối t Phân phối t có đặc điểm sau: Đường mật độ dạng hình chuông cân hai đuôi dày phân phối chuẩn mức độ tập trung Phân phối t với n bậc tự (df = n) có trung bình phương sai n/(n 2) với n ¡ Khi cỡ mẫu nhỏ (tức bậc tự nhỏ) phân phối t khác với phân phối chuẩn hóa, cỡ mẫu tăng lên phân phối t tiến đến phân phối chuẩn hóa cỡ mẫu từ 30 trở lên hai phân phối xấp xỉ với độ xác cao Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 27 / 53 Ước lượng khoảng cho trung bình tổng thể Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Giá trị tn,α tn,α giá trị thỏa mãn P(tn ¡ tn,α ) = α, tn biến ngẫu nhiên tuân theo phân phối t với số bậc tự df = n Trên R, tn,α tính lệnh qt(1 α, df = n) Duong phan phoi t voi df=n bac tu α α − tn, α tn, α Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 28 / 53 Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Khoảng tin cậy cho trung bình cỡ mẫu nhỏ Xµ ? tuân theo phân phối t (hay phân phối SX / n Student t) với bậc tự df = n Mặt khác P(tn1,α/2 tn1 tn1,α/2 ) = α Nên Xµ ? tn1,α/2) α =P(tn1,α/2 SX / n SX SX =P(X tn1,α/2 ? µ X + tn1,α/2 ? ) n n Với n nhỏ tn1 = Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 29 / 53 Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Khoảng tin cậy cho trung bình cỡ mẫu nhỏ Vậy khoảng tin cậy (1 α)100% cho trung bình tổng thể là: sx sx (x tn1,α/2 ? , x + tn1,α/2 ? ) n n Trong tn1,α/2 giá trị cho P(tn1 ¡ tn1,α/2) = α/2 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 30 / 53 Ước lượng khoảng cho trung bình tổng thể Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Minh họa hình vẽ Khoang tin cay (1 − α)100% cho trung binh tong the Duong phan phoi t voi df=n−1 bac tu α α − tn−1, α tn−1, α Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 31 / 53 Khoảng tin cậy cho trung bình tổng thể với cỡ mẫu nhỏ Ví dụ Để khảo sát chiều cao trung bình niên vùng A đó, mẫu ngẫu nhiên gồm 16 niên chọn ghi lại chiều cao họ sau: 172, 173, 173, 174, 174, 175, 176, 166, 166, 167, 165, 173, 171, 170, 171, 170 (cm) Tìm khoảng tin cậy 99% cho trung bình tổng thể với giả sử chiều cao niên vùng xét tuân theo phân phối chuẩn Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 32 / 53 Câu lệnh R Câu lệnh R Trường hợp 1: Tìm ước lượng khoảng cho trung bình tổng thể có phân phối chuẩn, biết phương sai tổng thể: z.test zsum.test Dùng lệnh z.test liệu mẫu sơ cấp, tức có tất quan sát mẫu Dùng lệnh zsum.test liệu mẫu thứ cấp, tức quan sát mẫu mà có thơng tin mẫu trung bình mẫu, phương sai mẫu, cỡ mẫu, Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 33 / 53 Ước lượng khoảng cho trung bình tổng thể Câu lệnh R Câu lệnh R > z.test(x, sigma.x= , conf.level=) > zsum.test(mean.x, sigma.x = , n.x = , conf.level=) Trong đó: x: Véc tơ liệu sigma.x: Độ lệch chuẩn tổng thể mean.x: Trung bình mẫu n.x: Cỡ mẫu conf.level: Độ tin cậy (mặc định 0.95) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 34 / 53 Câu lệnh R Câu lệnh R Trường hợp 2: Tìm ước lượng khoảng cho trung bình cỡ mẫu lớn, phương sai tổng thể, tổng thể không thiết phải tuân theo phân phối chuẩn: t.test (mẫu sơ cấp) tsum.test (mẫu thứ cấp) > t.test(x, conf.level=) > tsum.test(mean.x, s.x= , n.x= , conf.level=) Trong đó: x: Véc tơ liệu conf.level: Độ tin cậy (mặc định 0.95) mean.x: Trung bình mẫu n.x: Cỡ mẫu s.x: Độ lệch chuẩn mẫu Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 35 / 53 Câu lệnh R Câu lệnh R Trường hợp 3: Tìm ướclượng khoảng cho trung bình cỡ mẫu nhỏ, tổng thể tuân theo phân phối chuẩn, phương sai tổng thể: t.test (mẫu sơ cấp) tsum.test (mẫu thứ cấp) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 36 / 53 Ước lượng khoảng cho trung bình tổng thể Câu lệnh R Câu lệnh R Trường hợp 3: Tìm ướclượng khoảng cho trung bình cỡ mẫu nhỏ, tổng thể tuân theo phân phối chuẩn, phương sai tổng thể: t.test (mẫu sơ cấp) tsum.test (mẫu thứ cấp) Chú ý: Trước dùng lệnh z.test, zsum.test, tsum.test ta phải gọi thư viện BSDA sau: > library(BSDA) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 36 / 53 Câu lệnh R Ví dụ dùng lệnh Ví dụ 1: Trong quy trình sản xuất bao đường tinh chế, trọng lượng đường bao tuân theo phân phối chuẩn với độ lệch chuẩn 1.2 (kg) Một mẫu ngẫu nhiên gồm 25 bao đường chọn trọng lượng trung bình 19.8 (kg) Tìm khoảng tin cậy 90% cho trọng lượng trung bình tất bao đường sản xuất quy trình Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 37 / 53 Câu lệnh R Lệnh cho Ví dụ > library(BSDA) > zsum.test(mean.x=19.8, n.x=25, sigma.x=1.2, conf.level=0.9) One-sample z-Test data: Summarized x z = 82.5, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 90 percent confidence interval: 19.40524 20.19476 sample estimates: mean of x 19.8 Khoảng tin cậy 90% cho trọng lượng trung bình tất bao đường sản xuất quy trình (19.41, 20.19) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 38 / 53 Ước lượng khoảng cho trung bình tổng thể Câu lệnh R Ví dụ dùng lệnh Ví dụ 2: Ban giám đốc nhà máy in quan tâm tới số lỗi trang sách Chọn ngẫu nhiên 100 trang, đọc kỹ, nhận thấy số lỗi trung bình 1.24 lỗi trang độ lệch chuẩn 0.8 Tìm khoảng tin cậy 95% cho số lỗi trung bình tất trang in Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 39 / 53 Câu lệnh R Lệnh cho Ví dụ > tsum.test(mean.x=1.24, s.x=0.8, n.x=100) One-sample t-Test data: Summarized x t = 15.5, df = 99, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 95 percent confidence interval: 1.081263 1.398737 sample estimates: mean of x 1.24 Khoảng tin cậy 95% cho số lỗi trung bình tất trang in (1.08, 1.40) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 40 / 53 Câu lệnh R Ví dụ dùng lệnh Ví dụ 3: Để khảo sát chiều cao trung bình niên vùng A đó, mẫu ngẫu nhiên gồm 16 niên chọn ghi lại chiều cao họ sau: 172, 173, 173, 174, 174, 175, 176, 166, 166, 167, 165, 173, 171, 170, 171, 170 (cm) Tìm khoảng tin cậy 99% cho chiều cao trung bình niên A với giả sử chiều cao niên vùng xét tuân theo phân phối chuẩn Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 41 / 53 Ước lượng khoảng cho trung bình tổng thể Câu lệnh R Lệnh cho Ví dụ > mau=c(172, 173, 173, 174, 174, 175, 176, 166, 166, 167, 165, 173, 171, 170, 171, 170) > t.test(mau, conf.level=0.99) One Sample t-test data: mau t = 199.685, df = 15, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 99 percent confidence interval: 168.4766 173.5234 sample estimates: mean of x 171 Khoảng tin cậy 99% cho chiều cao trung bình niên A (168.48, 173.52) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho tỷ lệ tổng thể Tháng năm 2014 42 / 53 Ước lượng khoảng cho tỷ lệ tổng thể Khoảng tin cậy cho tỷ lệ tổng thể Bài toán Ước lượng khoảng cho tỷ lệ số phần tử tổng thể có đặc tính từ tỷ lệ mẫu ngẫu nhiên Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho tỷ lệ tổng thể Tháng năm 2014 43 / 53 Ước lượng khoảng cho tỷ lệ tổng thể Khoảng tin cậy cho tỷ lệ tổng thể Ta biết cỡ mẫu n lớn (np ¥ 5, n(1 p) ¥ 5) biến ngẫu nhiên PX p Z= xấp xỉ phân phối chuẩn (theo định lý giới hạn trung tâm) p(1 p)n Mặt khác n đủ lớn tỷ lệ p tổng thể xấp xỉ tỷ lệ mẫu px Nên ta có khoảng tin cậy (1 α)100% cho tỷ lệ tổng thể là: ( ) px (1 px ) px (1 px ) px zα/2 , px + zα/2 n n = ? ? Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 44 / 53 Ước lượng khoảng cho tỷ lệ tổng thể Ước lượng khoảng cho tỷ lệ tổng thể Ví dụ Cơ quan cảnh sát giao thông kiểm tra ngẫu nhiên hệ thống phanh 40 xe tải đường quốc lộ Họ phát thấy 14 xe có phanh chưa đảm bảo an tồn Tìm khoảng tin cậy 90% cho tỷ lệ xe tải có phanh chưa an tồn lưu hành đường quốc lộ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho tỷ lệ tổng thể Tháng năm 2014 45 / 53 Câu lệnh R Câu lệnh R cho tốn ước lượng khoảng Để tìm khoảng ước lượng cho tỉ lệ R ta dùng lệnh sau: >prop.test (x, n, conf.level =, correct =) Trong đó: n: cỡ mẫu, x: số quan sát ”thành cơng” mẫu, conf.level: độ tin cậy ước lượng, mặc định 0.95, corect=T/ F: Có hay khơng điều chỉnh liên tục Yates, mặc định TRUE Chú ý: Trong chương trình ta khơng học điều chỉnh Yates, để correct= F Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho tỷ lệ tổng thể Tháng năm 2014 46 / 53 Câu lệnh R Ví dụ dùng lệnh Ví dụ: Cơ quan cảnh sát giao thơng kiểm tra ngẫu nhiên hệ thống phanh 40 xe tải đường quốc lộ Họ phát thấy 14 xe có phanh chưa đảm bảo an tồn Tìm khoảng tin cậy 90% cho tỷ lệ xe tải có phanh chưa an toàn lưu hành đường quốc lộ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 47 / 53 Ước lượng khoảng cho tỷ lệ tổng thể Câu lệnh R Ví dụ dùng lệnh > prop.test(x=14, n=40, conf.level=0.9, correct=F) 1-sample proportions test without continuity correction data: 14 out of 40, null probability 0.5 X-squared = 3.6, df = 1, p-value = 0.05778 alternative hypothesis: true p is not equal to 0.5 90 percent confidence interval: 0.2390737 0.4799323 sample estimates: p 0.35 Vậy khoảng tin cậy 90% cho tỷ lệ xe tải có phanh chưa an tồn lưu hành đường quốc lộ (0.24, 0.48) Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Xác định cỡ mẫu cho toán ước lượng Tháng năm 2014 48 / 53 Quy tắc xác định cỡ mẫu cho ước lượng trung bình tổng thể Quy tắc xác định cỡ mẫu cho ước lượng trung bình tổng thể Cỡ mẫu n cần thiết để xây dựng khoảng ước lượng cho trung bình tổng thể với độ tin cậy cho trước n= 4z2α/2 σ ω2 với ω độ rộng khoảng ước lượng, σ phương sai tổng thể cần ước lượng Một số cách xác định σ công thức xác định cỡ mẫu là: Tham khảo thông tin σ nghiên cứu tương tự trước Áp đụng quy tắc 3σ để tìm, phân phối liệu cân đối hình chng khoảng biến thiên từ giá trị nhỏ đến giá trị lớn R có chiều dài 6σ Từ σ = R/6 Thực điều tra với cỡ mẫu nhỏ tính tốn s từ mẫu để thay cho σ Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Xác định cỡ mẫu cho toán ước lượng Tháng năm 2014 49 / 53 Quy tắc xác định cỡ mẫu cho ước lượng trung bình tổng thể Ví dụ: Trưởng phòng nhân công ty muốn ước lượng số ngày nghỉ bệnh trung bình năm nhân viên cơng ty, tìm hiểu cơng ty tương tự người biết tổng thể số ngày nghỉ ốm có phân phối chuẩn với phương sai Nếu muốn khoảng tin cậy 85% trung bình tổng thể thay đổi 0.5 so với trung bình mẫu cần chọn mẫu gồm nhân viên Lời giải: Ta có σ = 3, ω = 1, α = 0.85 = 0.15 suy zα/2 = z0.075 = 1.44 Do cỡ mẫu cần xét là: n= 4z2α/2 σ ω2 = 1.442 32 = 74.6 12 Vậy để đạt yêu cầu đề cần nghiên cứu 75 nhân viên Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 50 / 53 Xác định cỡ mẫu cho toán ước lượng Quy tắc xác định cỡ mẫu cho ước lượng tỷ lệ tổng thể Quy tắc xác định cỡ mẫu cho ước lượng tỷ lệ tổng thể Cỡ mẫu cần thiết để xây dựng khoảng ước lượng cho tỷ lệ tổng thể với độ tin cậy cho trước là: n= 4z2α/2 p(1 p) ω2 Với ω độ rộng khoảng ước lượng p tỷ lệ ”thành công” tổng thể cần ước lượng Một số cách xác định p công thức xác định cỡ mẫu: Tham khảo thông tin p nghiên cứu tương tự trước dùng kinh nghiệm để đoán Chọn p = 0.5 Khi p = 0.5 thành phần p(1 p) lớn so với tình khác p Như làm cho cỡ mẫu xác định theo công thức đạt cực đảm bảo n ước lượng có độ lớn ”an tồn” Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Xác định cỡ mẫu cho toán ước lượng Tháng năm 2014 51 / 53 Quy tắc xác định cỡ mẫu cho ước lượng tỷ lệ tổng thể Ví dụ Phản ứng người loại trắc nghiệm tâm lý phát hai dạng A B Nếu người muốn làm tắc nghiệm muốn ước tính xác suất số người có phản ứng loại A tổng thể cần làm thí nghiệm với người Giả sử người lòng với kết độ rộng khoảng ước lượng ω = 0.08 độ tin cậy toán 90% Anh ta kỳ vọng p có gía trị 0.6 Lời giải: Ta có α = 0.9 = 0.1, zα/2 = z0.05 = 1.645, p = 0.6, ω = 0.08 Nên ta có cỡ mẫu cần tìm là: n= 4z2α/2 p(1 p) ω2 = 1.6452 0.6 (1 0.6) = 410 0.082 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Xác định cỡ mẫu cho toán ước lượng Tháng năm 2014 52 / 53 Xác định cỡ mẫu tình tổng thể hữu hạn Xác định cỡ mẫu tình tổng thể hữu hạn Cỡ mẫu n điều chỉnh trường hợp tổng thể hữu hạn cho công thức: n0 N n= n0 + (N 1) Trong N cỡ mẫu tổng thể hữu hạn n0 cỡ mẫu trường hợp chưa điều chỉnh: 4z2α/2 σ 4z2α/2 p(1 p) n0 = n0 = ω2 ω2 Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 53 / 53 ... độ lệch chuẩn điểm thi XSTK kì lớp Tìm ước lượng điểm cho tỉ lệ sinh viên có điểm thi XSTK kì lớn lớp Trần Minh Nguyệt (ĐH THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm... thống kê ứng dụng kinh tế xã hội Ước lượng khoảng cho trung bình tổng thể Tháng năm 2014 39 / 53 Câu lệnh R Lệnh cho Ví dụ > tsum.test(mean.x=1.24, s.x=0.8, n.x=100) One-sample t-Test data:... THĂNG LONG) Xác suất thống kê ứng dụng kinh tế xã hội Tháng năm 2014 / 53 Ước lượng điểm Ví dụ Chi phí trung bình sinh viên Thăng Long sống xa nhà năm học 201 3-2 014 số xác định nhất, xác định