Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 41 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
41
Dung lượng
1,17 MB
Nội dung
Bài 3: Lý thuyết mẫu PP trung bình mẫu tỷ lệ mẫu Vinh Lương University of Economics and Finance vinhlx@uef.edu.vn September 2018 Lý thuyết mẫu Vinh Lương September 2018 / 41 Contents Giới thiệu lấy mẫu dạng mẫu thường gặp Định lý giới hạn trung tâm Phân phối trung bình mẫu 𝑋 Phân phối tỷ lệ mẫu F Lý thuyết mẫu Vinh Lương September 2018 / 41 Contents Giới thiệu lấy mẫu dạng mẫu thường gặp Định lý giới hạn trung tâm Phân phối trung bình mẫu 𝑋 Phân phối tỷ lệ mẫu F Lý thuyết mẫu Vinh Lương September 2018 / 41 Population vs Sample Tổng thể: tập hợp tất phần tử mà ta quan tâm Kích thước tổng thể: N (thường lớn) Ví dụ: Tập hợp chiều cao tồn người dân Việt nam Tập hợp tất bóng đèn nhà máy sản xuất Mẫu : tập tổng thể Kích thước mẫu: 𝑛(𝑛 ≪ 𝑁 ) Ví dụ: Chọn ngẫu nhiên 10,000 người để đo chiều cao Chọn ngẫu nhiên 100 bóng đèn để kiểm tra chất lượng Chọn ngẫu nhiên 50 bệnh nhân để kiểm tra hiệu loại thuốc Lý thuyết mẫu Vinh Lương September 2018 / 41 Sampling vs Inference Lấy mẫu trình chọn số phần tử tổng thể để tiến hành nghiên cứu Ngược lại với lấy mẫu trình suy luận thống kê Tức từ thông tin mẫu ta suy thơng tin tổng thể (thơng tin là: Trung bình, Tỷ lệ, Phương sai, ) Lý thuyết mẫu Vinh Lương September 2018 / 41 Example Muốn tìm chiều cao trung bình 𝜇 12000 niên khu vực số lý ta khảo sát chiều cao tất 12000 niên khu vực Chọn ngẫu nhiên mẫu gồm 100 niên khu vực để khảo sát Tính chiều cao trung bình 𝑥 100 niên Từ 𝑥 tính dựa vào mẫu trên, ta suy thơng tin trung bình 𝜇 tổng thể Lý thuyết mẫu Vinh Lương September 2018 / 41 Tại phải lấy mẫu? Không thể khảo sát tất phần tử tổng thể (Ví dụ: kiểm tra hộp sữa lơ hàng, kiểm tra tuổi thọ bóng đèn ) Bị giới hạn thời gian chi phí (Ví dụ: khảo sát trước kỳ bầu cử tổng thống Mỹ, khảo sát chiều cao dân số ) Kết suy luận thống kê chấp nhận ta lấy mẫu hợp lý Ví dụ: Chiều cao trung bình sinh viên nam từ 164cm đến 166cm Lý thuyết mẫu Vinh Lương September 2018 / 41 Lấy mẫu hợp lý? Lấy mẫu ngẫu nhiên: phần tử tổng thể có hội chọn Kích thước mẫu đủ lớn: n lớn, thông tin suy luận tổng thể đáng tin cậy có ý nghĩa Lý thuyết mẫu Vinh Lương September 2018 / 41 Trung bình - Phương sai mẫu cụ thể Trung bình mẫu cụ thể 𝑛 ∑︀ 𝑥𝑖 𝑥1 + 𝑥2 + · · · + 𝑥𝑛 𝑖=1 𝑥= = 𝑛 𝑛 Phương sai mẫu Phương sai mẫu có điều chỉnh n n ∑︀ ∑︀ (xi − x)2 (xi − x)2 𝑛 ; ˆs2 = i=1 ; 𝑠ˆ2 = × 𝑠2 s2 = i=1 n n−1 𝑛−1 Trung bình Phương sai tổng thể ký hiệu: 𝑁 ∑︀ 𝜇= 𝑥𝑖 𝑖=1 𝑁 = 𝜎2 = Lý thuyết mẫu 𝑥1 + 𝑥2 + · · · + 𝑥𝑁 𝑁 N ∑︀ (xi − 𝜇)2 i=1 Vinh Lương N September 2018 / 41 Trung bình - Phương sai mẫu ngẫu nhiên Khi nói mẫu ngẫu nhiên, tức giá trị 𝑋𝑖 ngẫu nhiên Khi ta khơng dùng ký hiệu 𝑥; 𝑠ˆ giống mà thay ký hiệu in hoa để thể khơng phải mẫu cụ thể Trung bình mẫu ngẫu nhiên: 𝑛 ∑︀ 𝑋= 𝑋𝑖 𝑖=1 𝑛 = 𝑋1 + 𝑋2 + · · · + 𝑋𝑛 𝑛 Phương sai mẫu ngẫu nhiên phương sai mẫu ngẫu nhiên có điều chỉnh: n ∑︀ S2 = Lý thuyết mẫu n ∑︀ (Xi − X) i=1 n ; Vinh Lương ˆ2 = S (Xi − X) i=1 n−1 September 2018 10 / 41 Phân phối trung bình mẫu 𝑋 Gọi {𝑋1 , , 𝑋𝑛 } mẫu ngẫu nhiên có kích thước n lấy từ tổng thể có trung bình 𝜇 độ lệch chuẩn 𝜎 Khi trung bình mẫu ngẫu nhiên 𝑋 ĐLNN: ¯ = 𝑋1 + 𝑋2 + · · · + 𝑋𝑛 𝑋 𝑛 Nếu 𝑋 ∼ 𝑁 (𝜇, 𝜎 ) trung bình mẫu 𝑋 có pp chuẩn: 𝜎 𝑋 ∼ 𝑁 (𝜇, ( √ )2 ) 𝑛 Nếu tổng thể khơng có phân phối chuẩn kích thước mẫu lớn 𝑛 ≥ 30 trung bình mẫu xấp xỉ phân phối chuẩn: 𝑋 ∼ 𝑁 (𝜇, 𝜎2 ) 𝑛 Tức theo (1) (2) ta có: 𝜇𝑋¯ = 𝜇 ; Lý thuyết mẫu Vinh Lương 𝜎 𝜎𝑋¯ = √ 𝑛 September 2018 27 / 41 Phân phối trung bình mẫu 𝑋 Lý thuyết mẫu Vinh Lương September 2018 28 / 41 Example Giả sử chiều cao sinh viên nam tp.HCM có phân phối chuẩn với trung bình 172 cm độ lệch chuẩn 10 cm Chọn mẫu ngẫu nhiên gồm 25 sinh viên Tìm quy luật phân phối trung bình mẫu (trung bình chiều cao 25 sinh viên bất kỳ) Tính xác suất để mẫu ngẫu nhiên có chiều cao trung bình lớn 174cm Lý thuyết mẫu Vinh Lương September 2018 29 / 41 Gọi X chiều cao sinh viên (lấy từ tổng thể) Gọi 𝑋 chiều cao trung bình mẫu ngẫu nhiên gồm 25 sinh viên Ta có: ¯ = 𝑋1 + 𝑋2 + · · · + 𝑋25 𝑋 25 ¯ có phân phối Do 𝑋 ∼ 𝑁 (𝜇, 𝜎 ) nên ta có trung bình mẫu 𝑋 chuẩn với: 𝜇𝑋¯ = 𝜇 = 172𝑐𝑚; 10 𝜎 𝜎𝑋¯ = √ = √ = 2𝑐𝑚 𝑛 25 Tức là: 𝑋 ∼ 𝑁 (172, 22 ) Xác suất để mẫu ngẫu nhiên có chiều cao trung bình lớn 174cm 𝑃 (𝑋 > 174) = − 𝑃 (𝑋 < 174) = − 𝑁 𝑂𝑅𝑀.𝐷𝐼𝑆𝑇 ( ) ≈ 15.87% Lý thuyết mẫu Vinh Lương September 2018 30 / 41 Example Cho 𝑋 ∼ 𝑁 (𝜇, 𝜎 ) có trung bình 100 độ lệch chuẩn 15 Lấy mẫu ngẫu nhiên gồm phần tử {𝑋1 , 𝑋2 , , 𝑋9 } gọi 𝑋 trung bình mẫu ngẫu nhiên Hãy cho biết phân phối 𝑋 Tính 𝑃 (90 < 𝑋 < 110) 𝑃 (90 < 𝑋 < 110) Nhận xét DS: 49.72% vs 95.44% Lý thuyết mẫu Vinh Lương September 2018 31 / 41 Exercise Bài 5.4 : 500 vịng bi có trọng lượng trung bình 150g độ lệch chuẩn 0,9g Chọn mẫu ngẫu nhiên gồm 100 vịng bi, tìm xác suất để mẫu có tổng trọng lượng: Trong khoảng 14,98kg 14,99kg Lớn 15,03 Lý thuyết mẫu Vinh Lương September 2018 32 / 41 Exercise A C Neilsen khảo sát thấy trẻ em độ tuổi từ đến tuổi tuần xem tivi trung bình 25 độ lệch chuẩn Giả sử thời gian xem tivi trẻ có phân phối chuẩn Nếu chọn mẫu ngẫu nhiên gồm 20 em bé bất kỳ, tính xác suất để thời gian xem tivi trung bình mẫu lớn 26.3 (Source: Michael D Shook and Robert L Shook, The Book of Odds.) ĐS: 2.62% Lý thuyết mẫu Vinh Lương September 2018 33 / 41 Exercise The average age of a vehicle registered in the United States is years, or 96 months Assume the standard deviation is 16 months If a random sample of 36 vehicles is selected, find the probability that the mean of their age is between 90 and 100 months ĐS: 92.1% Lý thuyết mẫu Vinh Lương September 2018 34 / 41 Contents Giới thiệu lấy mẫu dạng mẫu thường gặp Định lý giới hạn trung tâm Phân phối trung bình mẫu 𝑋 Phân phối tỷ lệ mẫu F Lý thuyết mẫu Vinh Lương September 2018 35 / 41 Phân phối tỷ lệ mẫu F Gọi 𝑝 tỷ lệ tổng thể (tỷ lệ phần tử có tính chất ℘ tổng thể) Gọi F tỷ lệ mẫu ngẫu nhiên kích thước n (tỷ lệ phần tử có tính chất ℘ mẫu ngẫu nhiên) Khi n đủ lớn (𝑛 ≥ 30)(︂thì tỷ lệ mẫu )︂ F có phân phối xấp xỉ phân 𝑝(1 − 𝑝) phối chuẩn 𝐹 ∼ 𝑁 𝑝, 𝑛 Tức là: √︂ 𝜇𝐹 = 𝑝 ; Lý thuyết mẫu 𝜎𝐹 = Vinh Lương 𝑝(1 − 𝑝) 𝑛 September 2018 36 / 41 Example Người ta phát máy sản xuất có 2% sản phẩm máy sản xuất bị hỏng Tính xác suất 400 sản phẩm máy sản xuất có: Khơng 3% sản phẩm bị hỏng? Không 2% sản phẩm bị hỏng? Tỷ lệ tổng thể 𝑝 = 2% (tỷ lệ sản phẩm hỏng) Gọi F tỷ lệ sp hỏng mẫu ngẫu nhiên kích thước 𝑛 = 400 Do 𝑛 > 30 nên tỷ lệ mẫu F xấp xỉ phân phối chuẩn √︂ (︀ )︀ 𝑝(1 − 𝑝) 𝐹 ∼ 𝑁 𝜇𝐹 , 𝜎𝐹2 với 𝜇𝐹 = 𝑝 ; 𝜎𝐹 = 𝑛 𝐹 ∼ 𝑁 (0.02, 0.0072 ) 𝑃 (𝐹 ≥ 3%) = − 𝑃 (𝐹 < 3%) = − 𝑁 𝑂𝑅𝑀.𝐷𝐼𝑆𝑇 (3%; 2%; 0, 007; 1) = 7.66% Lý thuyết mẫu Vinh Lương September 2018 37 / 41 Exercise Bài 5.6 : Một công bố kết bầu cử cho thấy ứng cử viên đạt 46% số phiếu bầu Tìm xác suất 200 số phiếu bầu chọn ngẫu nhiên từ tổng số phiếu bầu có đa số phiếu bầu dành cho ứng viên (tức có số phiếu lớn 50%) Tìm xác suất 1000 số phiếu bầu chọn ngẫu nhiên từ tổng số phiếu bầu có đa số phiếu bầu dành cho ứng viên ĐS: 𝑃 (𝐹 ≥ 50%) = 12.82% 𝑃 (𝐹 ≥ 50%) = 0.5575% Lý thuyết mẫu Vinh Lương September 2018 38 / 41 Exercise Tỷ lệ sinh viên thi đậu môn XSTK trường đại học 60% Chọn mẫu gồm 100 sinh viên Tính xác suất để tỷ lệ đậu mẫu nằm khoảng từ 55% đến 65% Nếu lấy 50 mẫu bạn tin có mẫu có tỷ lệ đậu từ 55% đến 65% ĐS: 0.6922 Exercise Kindergarten children have heights that are approximately normally distributed about a mean of 39 inches and a standard deviation of inches A random sample of size 25 is taken, and the mean is calculated What is the probability that this mean value will be between 38.5 and 40.0 inches? ĐS: 0.8881 Lý thuyết mẫu Vinh Lương September 2018 39 / 41 Exercise The average number of pounds of meat that a person consumes per year is 218.4 pounds Assume that the standard deviation is 25 pounds and the distribution is approximately normal (Source: Michael D Shook and Robert L Shook, The Book of Odds.) Find the probability that a person selected at random consumes less than 224 pounds per year If a sample of 40 individuals is selected, find the probability that the mean of the sample will be less than 224 pounds per year ĐS: 0.5871 0.9222 Lý thuyết mẫu Vinh Lương September 2018 40 / 41 Exercise 10 It has been estimated that 43% of business graduates believe that a course in business ethics is very important for imparting ethical values to students (David, Anderson, and Lawrimore 1990) Find the probability that more than one-half of a random sample of 80 business graduates have this belief ĐS: 0.1020 Exercise 11 Forty percent of students at small colleges have brought their own personal computers to campus A random sample of 120 entering freshmen was taken What is the standard error of the sample proportion bringing their own personal computers to campus? What is the probability that the sample proportion is between 0.38 and 0.46? Lý thuyết mẫu Vinh Lương September 2018 41 / 41