CHƯƠNG 3 HỆ PHƯƠNG TRÌNH TUYẾN TÍNH HỌC PHẦN TOÁN ĐẠI CƯƠNG CHƯƠNG 4 THỐNG KÊ TOÁN Giảng viên T S Trịnh Thị Hường Bộ môn Toán Email trinhthihuong@tmu edu vn NỘI DUNG CHÍNH 4 1 LÝ THUYẾT MẪU 4 2 ƯỚC LƯ[.]
HỌC PHẦN TOÁN ĐẠI CƯƠNG CHƯƠNG 4: THỐNG KÊ TOÁN Giảng viên: T.S Trịnh Thị Hường Bộ mơn : Tốn Email: trinhthihuong@tmu.edu.vn NỘI DUNG CHÍNH 4.1 LÝ THUYẾT MẪU 4.2 ƯỚC LƯỢNG THAM SỐ CỦA ĐLNN 4.2.1 ƯỚC LƯỢNG ĐIỂM 4.2.2 ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY 4.3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 4.2 Ước lượng tham số ĐLNN 4.2.1 Ước lượng điểm Giả sử cần ước lượng tham số θ ĐLNN X đám đông • Ta lấy mẫu ngẫu nhiên W = (X1,X2,…,Xn) • Tùy thuộc vào θ, XDTK: θ* = f(X1,X2,…,Xn) • Khi n lớn với mẫu cụ thể w = (x1,x2,…,xn), tính tốn θ*tn = f (x1,x2,…,xn) Ta lấy θ ≈ θ*tn làm ước lượng điểm cho tham số θ CÁC TIÊU CHUẨN ĐÁNH GIÁ BẢN CHẤT TỐT CỦA ƯỚC LƯỢNG a Ước lượng không chệch (unbiased estimator) b Ước lượng vững (consistent estimator) c Ước lượng hiệu (efficient estimator) a Ước lượng không chệch Thống kê θ* gọi ước lượng không chệch θ E(θ*) = θ Ngược lại, ta nói θ* gọi ước lượng chệch θ b Ước lượng vững θ* gọi ước lượng vững θ với ε > ta có: lim 𝑃 ( 𝜃 ∗ − 𝜃 < 𝜀) = 𝑛→∞ Ví dụ: 𝑋 ước lượng vững μ f ước lượng vững p c Ước lượng hiệu (không chệch tốt nhất) θ* gọi ước lượng hiệu θ ước lượng khơng chệch có phương sai nhỏ so với ước lượng không chệch khác xây dựng mẫu Hạn chế phương pháp ước lượng điểm • Kết ước lượng khơng đáng tin cậy n khơng đủ lớn • Khơng sai số, độ tin cậy ước lượng => Phương pháp: Ước lượng khoảng tin cậy 4.2.2 Ước lượng khoảng tin cậy a Ước lượng khoảng, khoảng tin cậy độ tin cậy Giả sử cần ước lượng tham số θ ĐLNN X đám đông Chọn mẫu ngẫu nhiên W = (X1,X2, …, Xn), Từ ước lượng điểm tốt θ xây dựng thống kê: G = f(X1,X2, …, Xn, θ) cho G có quy luật xác định Với γ = - α cho trước, xác định α1 ≥ 0, α2 ≥ thỏa mãn α1+ α2 = α Từ xác định phân vị g1- α1 gα2 𝑃 𝑔1−𝛼1 < 𝐺 < 𝑔𝛼2 = − 𝛼1 − 𝛼2 = − 𝛼 𝑃 𝜃1∗ < 𝐺 < 𝜃2∗ = − 𝛼 Xác suất = - α gọi độ tin cậy Khoảng 𝜃1∗ , 𝜃2∗ gọi khoảng tin cậy 𝐼 = 𝜃2∗ − 𝜃1∗ gọi độ dài khoảng tin cậy Chú ý: + Thường chọn độ tin cậy lớn 0,9; 0,95 hay 0,99… theo nguyên lý xác suất lớn biến cố (θ*1 < θ < θ*2 ) hầu chắn xảy lần thực phép thử + Xác suất mắc sai lầm ước lượng khoảng α + Khi G có phân phối N(0,1) phân phối Student chọn α1= α2 = α/2 ta có khoảng tin cậy ngắn khoảng tin cậy đối xứng + Để ước lượng giá trị tối đa tối thiểu θ ta chọn α1= α α2 = α b Ước lượng kỳ vọng toán ĐLNN Giả sử ĐLNN X đám đơng có E(X) = μ Var(X) = σ2 μ chưa biết Bài tốn đặt ra: từ mẫu ngẫu nhiên thu được, ta ước lượng μ Trường hợp 1: ĐLNN gốc X phân phối chuẩn, σ2 biết Trường hợp 2: ĐLNN gốc X phân phối chuẩn, σ2 chưa biết Trường hợp 3: Chưa biết luật PPXS X, n > 30 TRƯỜNG HỢP 1: ĐLNN GỐC X PHÂN PHỐI CHUẨN, Σ2 ĐÃ BIẾT Vì 𝑋 ∼ 𝑁 𝜇, 𝜎 nên 𝑋ሜ ∼ 𝑁 𝜎2 𝜇, 𝑛 𝑋ሜ − 𝜇 𝑈 = 𝜎 ∼ 𝑁 0,1 𝑛 Xác suất Hai phía 𝑃( 𝑈 < 𝑢𝛼/2 ) = − 𝛼 = 𝛾 Khoảng tin cậy 𝑋 − 𝑢𝛼 Trái Phải 𝑃(−𝑢𝛼 < 𝑈) = − 𝛼 = 𝛾 𝑃(𝑈 < 𝑢𝛼 ) = − 𝛼 = 𝛾 𝜎 𝜎 ; 𝑋 + 𝑢𝛼 𝑛 𝑛 −∞ ; 𝑋 + 𝑢𝛼 𝑋 − 𝑢𝛼 𝜎 𝑛 𝜎 ; +∞ 𝑛 Ta có toán cần giải quyết: Bài toán 1: Cho n, cho 𝛾 , tìm sai số khoảng tin cậy Bài toán 2: Cho n, cho sai số ε khoảng tin cậy, tìm độ tin cậy n u / = = 1− Bài toán 3: Cho độ tin cậy, cho sai số khoảng tin cậy, tìm n 𝑛= 𝜎 𝑢𝛼/2 𝜖2 Chú ý: Nếu biết μ, cần ước lượng 𝑋ത ta có: 𝑃 𝜇 − 𝜖 < 𝑋ത < 𝜇 + 𝜖 = − 𝛼 = 𝛾 TRƯỜNG HỢP 2: ĐLNN GỐC X PHÂN PHỐI CHUẨN, Σ2 CHƯA BIẾT Vì 𝑋 ∼ 𝑁 𝜇, 𝜎 nên ta xây dựng thống kê 𝑋ሜ − 𝜇 𝑇= ∼𝑇 𝑛−1 𝑆′ 𝑛 Xác suất Hai phía (𝑛−1) 𝑃( 𝑇 < 𝑡𝛼/2 ) = − 𝛼 = 𝛾 Khoảng tin cậy (𝑛−1) 𝑋 − 𝑡𝛼 Trái Phải (𝑛−1) 𝑃(−𝑡𝛼 < 𝑇) = − 𝛼 = 𝛾 (𝑛−1) 𝑃(𝑇 < 𝑡𝛼 )=1−𝛼 =𝛾 𝑆′ (𝑛−1) 𝑆′ ; 𝑋 + 𝑡𝛼 𝑛 𝑛 −∞ ; 𝑋 + (𝑛−1) 𝑡𝛼 (𝑛−1) 𝑋 − 𝑡𝛼 𝑆′ 𝑛 𝑆′ ;+∞ 𝑛 TRƯỜNG HỢP 3: CHƯA BIẾT LUẬT PPXS CỦA X, NHƯNG N > 30 Vì n > 30 nên 𝑋ሜ ≃ 𝑁 𝜎2 𝜇, 𝑛 𝑋ሜ − 𝜇 𝑈 = 𝜎 ≃ 𝑁 0,1 𝑛 •Phần cịn lại tiến hành tương tự trường hợp X có phân phối chuẩn với σ2 biết •Với n đủ lớn, ta lấy σ s’ c Ước lượng tỷ lệ Trên đám đơng kích thước N có M phần tử mang dấu hiệu A, 𝑃 𝐴 = 𝑀 𝑁 = 𝑝 Bài toán đặt ra: từ mẫu ngẫu nhiên thu được, ta ước lượng p Từ đám đông ta lấy mẫu ngẫu nhiên kích thước n tính tần suất 𝑓 = 𝑛𝐴 𝑛 Vì n đủ lớn nên 𝑝𝑞 𝑓 ≃ 𝑁 𝑝, 𝑛 𝑈= 𝑓−𝑝 𝑝𝑞 𝑛 ≃ 𝑁 0,1 ... p c Ước lượng hiệu (không chệch tốt nhất) θ* gọi ước lượng hiệu θ ước lượng khơng chệch có phương sai nhỏ so với ước lượng không chệch khác xây dựng mẫu Hạn chế phương pháp ước lượng điểm •... lượng hiệu (efficient estimator) a Ước lượng không chệch Thống kê θ* gọi ước lượng không chệch θ E(θ*) = θ Ngược lại, ta nói θ* gọi ước lượng chệch θ b Ước lượng vững θ* gọi ước lượng vững θ với... thể w = (x1,x2,…,xn), tính tốn θ*tn = f (x1,x2,…,xn) Ta lấy θ ≈ θ*tn làm ước lượng điểm cho tham số θ CÁC TIÊU CHUẨN ĐÁNH GIÁ BẢN CHẤT TỐT CỦA ƯỚC LƯỢNG a Ước lượng không chệch (unbiased estimator)