•Giới thiệu về suy luận thống kê•Tính toán trên dữ liệu mẫu cụ thể, để tìm các tham số,…)x̅,độ lệch chuẩn mẫuđặc trưng mẫu (trung bình mẫu• Tìm hiểu về luật phân phối của– Trung bình mẫu– Tỉ lệ mẫu– Phương sai mẫu
Bài LÝ THUYẾT MẪU Thursday, February 09, 2017 Mục tiêu buổi học • Giới thiệu suy luận thống kê • Tính tốn liệu mẫu cụ thể, để tìm tham số đặc trưng mẫu (trung bình mẫu ̅ , độ lệch chuẩn mẫu ,…) • Tìm hiểu luật phân phối – Trung bình mẫu – Tỉ lệ mẫu – Phương sai mẫu 2/9/2017 Nội dung • Giới thiệu mẫu tham số đặc trưng mẫu • Các dạng biểu diễn mẫu thường gặp • Luật phân phối tham số đặc trưng mẫu Thursday, February 09, 2017 Khái niệm ký hiệu • Tổng thể (population): tập hợp tất phần tử mà ta quan tâm – Kích thước tổng thể: – Ví dụ: (thường lớn) • Tập hợp tất người bầu bầu cử tới • Tập hợp tất bóng đèn nhà máy sản xuất tháng • Mẫu (sample): tập tổng thể – Kích thước mẫu: – Ví dụ: ( ≪ ) • Phỏng vấn ngẫu nhiên 1000 người trước bầu cử diễn (mục đích: tham dò dư luận khả ứng viên) • Chọn ngẫu nhiên 100 bóng đèn để kiểm tra chất lượng 2/9/2017 How & what for? Sampling Lấy mẫu Inference Suy luận Mục đích: từ thơng tin mẫu suy thơng tin tổng thể Q trình gọi suy luận thống kê (inference) Ví dụ việc lấy mẫu Muốn tìm chiều cao trung bình 12000 niên khu vực Không thể khảo sát chiều cao tất 12000 niên khu vực Chọn ngẫu nhiên mẫu gồm 100 niên khu vực để khảo sát • Ký hiệu: ,…, , chiều cao niên thứ • Tính chiều cao trung bình ̅ 100 niên Từ trung bình mẫu ̅ , ta suy thơng tin trung bình tổng thể (chiều cao 12000 niên khu vực) 2/9/2017 Tại phải lấy mẫu ? • Khơng thể khảo sát tất phần tử tổng thể Ví dụ: kiểm tra hộp sữa lơ hàng • Bị giới hạn thời gian chi phí Ví dụ: khảo sát trước kỳ bầu cử tổng thống Mỹ • Ta suy kết thống kê xác lấy mẫu hợp lí Lấy mẫu hợp lý? • Lấy mẫu ngẫu nhiên: phần tử tổng thể có hội chọn • Kích thước mẫu đủ lớn: n lớn, thông tin suy luận tổng thể đáng tin cậy có ý nghĩa • Vấn đề: {value of infomation} vs {time & cost} → balance 2/9/2017 Ví dụ: Khảo sát chiều cao • Chọn mẫu ngẫu nhiên: n = 100 sinh viên → trung bình mẫu ̅ = 165cm (chiều cao trung bình 100 sv) • Gọi trung bình tổng thể (chiều cao tất sinh viên) • Bằng tính tốn, ta tìm số cho ̅ < < ̅ + = 95% Ví dụ, =10cm, có đến 95% khả trung bình tổng thể nằm khoảng ̅ ± , tức 155 , 175 • 95% gọi độ tin cậy, ký hiệu • ̅ , ̅ + gọi khoảng ước lượng • Tăng : ta có độ tin cậy lớn hơn, ta có khoảng ước lượng nhỏ (thơng tin có giá trị hơn) 2/9/2017 Next… Thursday, February 09, 2017 • Giới thiệu mẫu tham số đặc trưng mẫu 10 Ví dụ The contents of soft drink cans is distributed with mean 378mL and standard deviation 7.2mL Find the likelihood that a box of 36 cans has average contents less than 375mL Tổng thể X: dung tích(mL) chai công ty sản xuất, với = 378mL, = 7.2mL : dung tích trung bình 36 chai thùng Vì = 36 > 30 nên ∼ , , = = 378mL = = 1.2mL < 375 ≈ 0.62% 2/9/2017 37 Ví dụ Một mẫu ngẫu nhiên có kích thước n=25 rút từ tổng thể có phân phối chuẩn với trung bình 50 độ lệch chuẩn tìm xác suất để trung bình mẫu nằm khoảng từ 49 đến 51 2/9/2017 38 Ví dụ 500 vòng bi có trọng lượng trung bình 150g độ lệch chuẩn 0,9g Chọn mẫu ngẫu nhiên gồm 100 vòng bi, giả sử trọng lượng vòng bi có phân phối chuẩn Tìm xác suất để trung bình mẫu có trọng lượng: a) Trong khoảng 149,8g 149,9g b) Lớn 150,3g 2/9/2017 39 Phân phối tỷ lệ mẫu • Tỷ lệ tổng thể (tỷ lệ phần tử có tính chất tổng thể) • tỷ lệ mẫu ngẫu nhiên (tỷ lệ phần tử có tính chất mẫu) = • Tính chất: • Khi với lớn ( ≥ 30): = = với xấp xỉ với phân phối chuẩn ~ , = • Khi n