Bài giảng Xác suất thống kê: Chương 4 Thống kê - Ước lượng tham số cung cấp cho người học những kiến thức như: Một số lý do không thể khảo sát toàn bộ tổng thể; Biểu diễn dữ liệu; Mẫu ngẫu nhiên; Các đặc trưng mẫu; Tính tham số đặc trưng mẫu-máy CASIO FX570 ES; Xác định ước lượng điểm; Ước lượng khoảng cho kỳ vọng;...Mời các bạn cùng tham khảo!
Chương 4: Thống kê - Ước lượng tham số Lê Xuân Lý (1) Viện Toán ứng dụng Tin học, ĐHBK Hà Nội Hà Nội, tháng năm 2018 (1) Email: lexuanly@gmail.com Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu thống kê mô tả Hà Nội, 1/37 tháng năm 2018 / 37 Tổng thể tập mẫu Tổng thể Khi nghiên cứu vấn đề người ta thường khảo sát dấu hiệu đó, dấu hiệu thể nhiều phần tử Định nghĩa 1.1 Tập hợp phần tử mang dấu hiệu ta quan tâm gọi tổng thể hay đám đông (population) Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 3/37 tháng năm 2018 / 37 Mẫu thống kê mô tả Tổng thể tập mẫu Một số lý khơng thể khảo sát tồn tổng thể Giới hạn thời gian, tài chính: Ví dụ muốn khảo sát xem chiều cao niên VN có tăng lên hay khơng ta phải khảo sát toàn niên VN (giả sử 40 triệu người) Để khảo sát hết tốn nhiều thời gian kinh phí Ta khảo sát triệu niên VN, từ chiều cao trung bình thu ta suy chiều cao trung bình người VN Phá vỡ tổng thể nghiên cứu: Ví dụ ta cất vào kho N = 10000 hộp sản phẩmvà muốn biết tỷ lệ hộp hư sau năm bảo quản Ta phải kiểm tra hộp để xác định số hộp hư M = 300, tỷ lệ hộp hư kho M/N Một hộp sản phẩm sau kiểm tra phẩm chất, sau kiểm tra kho "tiêu" ln kho Ta lấy ngẫu nhiên n = 100 hộp kiểm tra, giả sử có m = hộp bị hư Tỷ lệ hộp hư 9% ta suy tỷ lệ hộp hư kho Không xác định xác tổng thể: Ví dụ muốn khảo sát tỷ lệ người bị nhiễm HIV qua đường tiêm chích Tổng thể lúc tồn người bị nhiễm HIV, ta xác định xác người (những người xét nghiệm bệnh viện biết, người khơng xét nghiệm ) Do ta biết phần tổng thể Ngoài số người bị nhiễm HIV bị chết HIV thay đổi liên tục nên tổng thể thay đổi liên tục Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu thống kê mô tả Hà Nội, 4/37 tháng năm 2018 / 37 Tổng thể tập mẫu Tập mẫu Do người ta nghĩ cách thay khảo sát tổng thể, người ta cần chọn tập nhỏ để khảo sát đưa định Định nghĩa 1.2 Tập mẫu tập tổng thể có tính chất tương tự tổng thể Số phần tử tập mẫu gọi kích thước mẫu Câu hỏi: Làm chọn tập mẫu có tính chất tương tự tổng thể để kết luận tập mẫu dùng cho tổng thể ? Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 5/37 tháng năm 2018 / 37 Mẫu thống kê mô tả Tổng thể tập mẫu Một số cách chọn mẫu Một số cách chọn mẫu Chọn mẫu ngẫu nhiên có hoàn lại: Lấy ngẫu nhiên phần tử từ tổng thể khảo sát Sau trả phần tử lại tổng thể trước lấy phần tử khác Tiếp tục n lần ta thu mẫu có hồn lại gồm n phần tử Chọn mẫu ngẫu nhiên khơng hồn lại: Lấy ngẫu nhiên phần tử từ tổng thể khảo sát để qua bên, không trả lại tổng thể Sau lấy ngẫu nhiên phần tử khác, tiếp tục n lần ta thu mẫu không hồn lại gồm n phần tử Chọn mẫu phân nhóm: Đầu tiên ta chia tập thành nhóm tương đối nhất, từ nhóm chọn mẫu ngẫu nhiên Tập hợp tất mẫu cho ta mẫu phân nhóm Phương pháp dùng tập có sai khác lớn Hạn chế phụ thuộc vào việc chia nhóm Chọn mẫu có suy luận: dựa ý kiến chuyên gia đối tượng nghiên cứu để chọn mẫu Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu thống kê mô tả Hà Nội, 6/37 tháng năm 2018 / 37 Biểu diễn liệu Biểu diễn liệu Từ tổng thể ta trích tập mẫu có n phần tử Ta có n số liệu Dạng liệt kê Các số liệu thu ta ghi lại thành dãy số liệu: x1 , x , , x n Dạng rút gọn Số liệu thu có lặp lặp lại sơ giá trị ta có dạng rút gọn sau: Dạng tần số: (n1 + n2 + + nk = n) Giá trị Tần số x1 n1 x2 n2 xk nk Dạng tần suất: (pk = nk /n) Giá trị Tần suất Lê Xuân Lý (SAMI-HUST) x1 p1 x2 p2 Thống kê - Ước lượng tham số xk pk Hà Nội, 7/37 tháng năm 2018 / 37 Mẫu thống kê mô tả Biểu diễn liệu Biểu diễn liệu Ví dụ dạng rút gọn Ta có bảng số liệu sau: Giá trị Tần số Tần suất 10 0.10 Lê Xuân Lý (SAMI-HUST) 15 0.15 30 0.30 20 0.20 14 0.14 Thống kê - Ước lượng tham số Mẫu thống kê mô tả 11 0.11 Hà Nội, 8/37 tháng năm 2018 / 37 Biểu diễn liệu Biểu diễn liệu Dạng khoảng Dữ liệu thu nhận giá trị (a, b) Ta chia (a, b) thành k miền điểm chia: a0 = a < a1 < a2 < < ak−1 < ak = b Dạng tần số: (n1 + n2 + + nk = n) (a0 − a1 ] n1 Giá trị Tần số (a1 − a2 ] n2 (ak−1 − ak ] nk Dạng tần suất: (pk = nk /n) Giá trị Tần suất (a0 − a1 ] p1 (a1 − a2 ] p2 (ak−1 − ak ] pk Một số vấn đề ý: • k = → 15 • Độ dài khoảng thường chia Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 9/37 tháng năm 2018 / 37 Mẫu thống kê mô tả Biểu diễn liệu Biểu diễn liệu Dạng khoảng • Nếu độ dài khoảng ta chuyển dạng rút gọn Giá trị Tần suất x1 p1 x2 p2 xk pk Trong xi điểm đại diện cho (ai−1 , ] thường xác định trung điểm miền: xi = 12 (ai−1 + ) • Dạng rút gọn thường thể đồ thị dạng đường dạng hình trịn • Dạng khoảng thường thể đồ thị dạng hình cột Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu ngẫu nhiên đặc trưng mẫu Hà Nội, 10/37 tháng năm 2018 10 / 37 Mẫu ngẫu nhiên Mẫu ngẫu nhiên Tổng thể đặc trưng dấu hiệu nghiên cứu X biến ngẫu nhiên Do nói X nói tổng thể Từ tổng thể trích n phần tử làm tập mẫu Ta có loại tập mẫu: mẫu ngẫu nhiên mẫu cụ thể Gọi Xi biến ngẫu nhiên giá trị thu phần tử thứ i, i = 1, 2, , n Ta có X1 , X2 , , Xn n biến ngẫu nhiên độc lập có phân phối với biến ngẫu nhiên X Định nghĩa 2.1 Mẫu ngẫu nhiên: véctơ WX = (X1 , X2 , , Xn ), thành phần Xi biến ngẫu nhiên Các biến ngẫu nhiên độc lập có phân phối xác suất với X Mẫu cụ thể: véctơ Wx = (x1 , x2 , , xn ), thành phần xi giá trị cụ thể Với mẫu ngẫu nhiên có nhiều mẫu cụ thể ứng với lần lấy mẫu khác Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 12/37 tháng năm 2018 12 / 37 Mẫu ngẫu nhiên đặc trưng mẫu Mẫu ngẫu nhiên Mẫu ngẫu nhiên Ví dụ Một kệ chứa đĩa nhạc với sau: Giá (ngàn đồng) Số đĩa 20 35 25 10 30 25 34 17 40 13 Ta cần lấy đĩa có hoàn lại để khảo sát Ta xét trường hợp: Xét mặt định lượng: giá đĩa bao nhiêu? Xét mặt định tính: đĩa có phải đĩa lậu khơng? (Đĩa lậu đĩa có giá 25 ngàn đồng) Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu ngẫu nhiên đặc trưng mẫu Hà Nội, 13/37 tháng năm 2018 13 / 37 Mẫu ngẫu nhiên Mẫu ngẫu nhiên Xét tổng thể mặt định lượng Lấy ngẫu nhiên đĩa nhạc kệ Gọi X giá đĩa nhạc Ta có bảng phân phối xác suất X X P 20 0, 35 25 0, 10 30 0, 25 34 0, 17 40 0, 13 Lấy ngẫu nhiên có hồn lại đĩa nhạc từ kệ Gọi Xi giá đĩa nhạc thứ i lấy được, i = 1, 2, 3, Ta thấy biến Xi độc lập có phân phối xác suất với X Ta có WX = (X1 , X2 , X3 , X4 ) mẫu ngẫu nhiên Bây ta khảo sát giá cụ thể đĩa lấy ra, ta thấy: • Đĩa 1: giá 20 ngàn đồng • Đĩa 2: giá 30 ngàn đồng • Đĩa 3: giá 20 ngàn đồng • Đĩa 4: giá 40 ngàn đồng Lập Wx = (x1 , x2 , x3 , x4 ) = (20, 30, 20, 40), mẫu cụ thể Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 14/37 tháng năm 2018 14 / 37 Mẫu ngẫu nhiên đặc trưng mẫu Mẫu ngẫu nhiên Mẫu ngẫu nhiên Xét tổng thể mặt định tính Đĩa có giá 25 ngàn đồng đĩa "lậu" Lấy ngẫu nhiên đĩa từ kệ Gọi X số đĩa lậu lấy X P 0, 65 0, 35 Lấy ngẫu nhiên có hồn lại đĩa nhạc từ kệ Gọi Xi só đĩa lậu lấy lấy đĩa lần thứ i, i = 1, 2, 3, Ta thấy biến Xi độc lập có phân phối xác suất với X Ta có WX = (X1 , X2 , X3 , X4 ) mẫu ngẫu nhiên Bây ta khảo sát giá cụ thể đĩa lấy ra, ta thấy: • Đĩa 1: giá 20 ngàn đồng → x1 = • Đĩa 2: giá 30 ngàn đồng → x2 = • Đĩa 3: giá 20 ngàn đồng → x3 = • Đĩa 4: giá 40 ngàn đồng → x4 = Lập Wx = (x1 , x2 , x3 , x4 ) = (1, 0, 1, 0), mẫu cụ thể Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu ngẫu nhiên đặc trưng mẫu Hà Nội, 15/37 tháng năm 2018 15 / 37 Các đặc trưng mẫu Các đặc trưng mẫu Thống kê Cho (X1 , X2 , , Xn ) mẫu ngẫu nhiên Biến ngẫu nhiên Y = g(X1 , X2 , , Xn ) (với g hàm đó) gọi thống kê Các tham số đặc trưng Xét tổng thể mặt định lượng : tổng thể đặc trưng dấu hiệu nghiên cứu X, (X biến ngẫu nhiên) Ta cú: ã Trung bỡnh tng th: EX = • Phương sai tổng thể: V X = σ • Độ lệch chuẩn tổng thể: σ Xét tổng thể mặt định tính: tổng thể có kích thướcN , có M phần tử có tính chất A Khi p = M/N gọi tỷ lệ xảy A tổng thể Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 16/37 tháng năm 2018 16 / 37 Mẫu ngẫu nhiên đặc trưng mẫu Các đặc trưng mẫu Các đặc trưng mẫu Trung bình mẫu Cho (X1 , X2 , , Xn ) mẫu ngẫu nhiên Thống kê - Trung bình mẫu ngẫu nhiên: n X= n Xi i=1 Mẫu ngẫu nhiên (X1 , X2 , , Xn ) có mẫu cụ thể (x1 , x2 , , xn ) X nhận giá trị: x= n n xi i=1 x gọi trung bình mẫu Nếu mẫu dạng rút gọn thì: x = Lê Xuân Lý (SAMI-HUST) k n xi ni i=1 Thống kê - Ước lượng tham số Mẫu ngẫu nhiên đặc trưng mẫu Hà Nội, 17/37 tháng năm 2018 17 / 37 Các đặc trưng mẫu Các đặc trưng mẫu Phương sai mẫu(chưa hiệu chỉnh) Cho (X1 , X2 , , Xn ) mẫu ngẫu nhiên Thống kê - Phương sai mẫu ngẫu nhiên: S = n n (Xi − X)2 i=1 Mẫu ngẫu nhiên (X1 , X2 , , Xn ) có mẫu cụ thể (x1 , x2 , , xn ) S nhận giá trị: S = n n (xi − x)2 i=1 S gọi Phương sai mẫu (chưa hiệu chỉnh) n−1 Vấn đề: E(S ) = σ n Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 18/37 tháng năm 2018 18 / 37 Mẫu ngẫu nhiên đặc trưng mẫu Các đặc trưng mẫu Các đặc trưng mẫu Phương sai mẫu hiệu chỉnh Ta phải hiệu chỉnh để thu giá trị thay σ tốt Thống kê - Phương sai mẫu ngẫu nhiên hiệu chỉnh: n s = n−1 (Xi − X)2 i=1 Mẫu ngẫu nhiên (X1 , X2 , , Xn ) có mẫu cụ thể (x1 , x2 , , xn ) s2 nhận giá trị: s = n−1 n (xi − x)2 i=1 s2 gọi Phương sai mẫu hiệu chỉnh s gọi độ lệch chuẩn mẫu hiệu chỉnh Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu ngẫu nhiên đặc trưng mẫu Hà Nội, 19/37 tháng năm 2018 19 / 37 Ứớc lượng điểm Ước lượng điểm Vấn đề Cho biến ngẫu nhiên gốc X có phân phối xác suất biết chưa biết tham số θ Mẫu số liệu thu thập X là: (x1 , x2 , , xn ) Khi θ = g(x1 , x2 , , xn ) gọi ước lượng điểm θ Muốn biết ước lượng tốt hay xấu ta phải so sánh với θ Ước lượng không chệch Thống kê θ gọi ước lượng không chệch θ thoả mãn: Eθ = θ Kết Cho biến ngẫu nhiên X có EX = µ, V X = σ Mẫu số liệu quan sát (x1 , x2 , , xn ) Khi ta có kết quả: Ước lượng khơng chệch cho µ là: x Ước lượng không chệch cho σ là: s2 Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 20/37 tháng năm 2018 20 / 37 Mẫu ngẫu nhiên đặc trưng mẫu Ứớc lượng điểm Tính tham số đặc trưng mẫu-máy CASIO FX570 ES Bật thống kê: M ode + ST AT + − var Tắt thống kê: M ode + Nhập liệu: Có dạng bảng số liệu gặp xi — x1 x2 xn ===> shif t xi — x1 freq — n1 M ode ⇓ on x2 xk n2 nk Xem kết quả: ấn AC Trung bình mẫu: Shif t + + var + + = Phương sai mẫu hiệu chỉnh: Shif t + + var + + = Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu ngẫu nhiên đặc trưng mẫu Hà Nội, 21/37 tháng năm 2018 21 / 37 Ứớc lượng điểm Xác định ước lượng điểm Ví dụ Khảo sát mẫu gồm 12 người cho thấy số lần xem phim năm sau: 14 16 17 17 24 20 32 18 29 31 15 35 Tính trung bình mẫu, độ lệch chuẩn mẫu hiệu chỉnh biến ngẫu nhiên X số lần xem phim người năm x = 22, 333; s = 7, 512 Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 22/37 tháng năm 2018 22 / 37 Mẫu ngẫu nhiên đặc trưng mẫu Ứớc lượng điểm Xác định ước lượng điểm Ví dụ Điều tra suất lúa diện tích 100 hécta trồng lúa vùng, ta thu bảng số liệu sau: Năng suất (tạ/ha) Số có suất tương ứng 41 10 44 20 45 30 46 15 48 10 52 10 54 a Tính trung bình mẫu, độ lệch chuẩn mẫu hiệu chỉnh b Những ruộng có suất từ 48 tạ/ha trở lên ruộng có suất cao Tính trung bình mẫu, độ lệch chuẩn mẫu hiệu chỉnh ruộng có suất cao x = 46; s = 3, 30 Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Mẫu ngẫu nhiên đặc trưng mẫu Hà Nội, 23/37 tháng năm 2018 23 / 37 Ứớc lượng điểm Xác định ước lượng điểm Ví dụ Quan sát tuổi thọ số người ta có bảng số liệu sau: Tuổi(năm) Số người 20-30 30-40 14 40-50 25 50-60 16 60-70 Tính trung bình mẫu, độ lệch chuẩn mẫu hiệu chỉnh biến ngẫu nhiên X tuổi thọ người Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 24/37 tháng năm 2018 24 / 37 Ước lượng khoảng Ước lượng khoảng cho kỳ vọng Ước lượng khoảng Cho biến ngẫu nhiên X có EX = µ, V X = σ Mẫu cụ thể X (x1 , x2 , , xn ) Chú ý: cỡ mẫu n ≤ 30 ta phải thêm điều kiện X ∼ N (µ, σ ) Bài tốn đặt tìm khoảng ước lượng cho µ với xác suất xảy (1 − α) cho trước Điều tương đương với việc tim khoảng (a, b) cho: P (a < µ < b) = − α • (a, b) gọi khoảng tin cậy (hoặc khoảng ước lượng) µ • (1 − α) gọi độ tin cậy Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Ước lượng khoảng Hà Nội, 26/37 tháng năm 2018 26 / 37 Ước lượng khoảng cho kỳ vọng Ước lượng khoảng cho kỳ vọng Trường hợp 1: σ biết X − µ√ n ∼ N (0; 1) σ Xét cặp số không âm α1 , α2 thoả mãn: α1 + α2 = α phân vị chuẩn tắc uα1 , u1−α2 : • P (Z < uα1 ) = α1 Do tính chất phân phối chuẩn tắc: uα1 = −u1−α1 • P (Z < u1−α2 ) = − α2 Suy P (−u1−α1 < Z < u1−α2 ) = P (uα1 < Z < u1−α2 ) = P (Z < u1−α2 ) − P (Z < uα1 ) = − α2 − α1 = − α Chọn thống kê: Z = − α = P (−u1−α1 < Z < u1−α2 ) = P (−u1−α1 < σ σ = P (X − u1−α2 √ < µ < X + u1−α1 √ ) n n X − µ√ n < u1−α2 ) σ Từ mẫu cụ thể (x1 , x2 , , xn ), ta có khoảng ước lượng cho µ với độ tin cậy − α là: σ σ (x − u1−α2 √ ; x + u1−α1 √ ) n n Như có vơ số khoảng ước lượng cho µ Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 27/37 tháng năm 2018 27 / 37 Ước lượng khoảng Ước lượng khoảng cho kỳ vọng Ước lượng khoảng cho kỳ vọng Trường hợp 1: σ biết Khoảng ước lượng đối xứng (α1 = α2 = α/2): σ σ α (x − u1− α2 √ ; x + u1− α2 √ ) , hàm laplace: φ(u1− α2 ) = 0, − n n σ = u1− α2 √ gọi độ xác ước lượng n Chú ý: Khoảng đối xứng khoảng ước lượng có độ dài ngắn Khoảng ước lượng phía (α1 = α; α2 = 0): σ (−∞; x + u1−α √ ) , hàm laplace: φ(u1−α ) = 0, − α n Khoảng ước lượng phía (α1 = 0; α2 = α): σ (x − u1−α √ ; +∞) , hàm laplace: φ(u1−α ) = 0, − α n Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Ước lượng khoảng Hà Nội, 28/37 tháng năm 2018 28 / 37 Ước lượng khoảng cho kỳ vọng Ước lượng khoảng cho kỳ vọng Ví dụ Doanh thu cửa hàng biến ngẫu nhiên X(triệu/tháng) có độ lệch chuẩn triệu/tháng Điều tra ngẫu nhiên doanh thu 500 cửa hàng có qui mơ tương tự ta tính doanh thu trung bình 10 triệu/tháng Với độ tin cậy 95% ước lượng khoảng cho doanh thu trung bình cửa hàng thuộc qui mơ Bài làm X doanh thu cửa hàng loại xét, EX = µ , V X = σ với σ = X − µ√ Chọn thống kê: Z = n ∼ N (0; 1) σ Khoảng ước lượng đối xứng cho doanh thu trung bình µ là: σ σ (x − u1− α2 √ ; x + u1− α2 √ ) n n Với x = 10, σ = 2, n = 500 − α = 0, 95 ⇒ α = 0, 05 ⇒ u1− α2 = u0,975 = 1, 96 Thay số liệu vào khoảng ta có kết quả: (9,825 ; 10,175) Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 29/37 tháng năm 2018 29 / 37 Ước lượng khoảng Ước lượng khoảng cho kỳ vọng Ước lượng khoảng cho kỳ vọng Trường hợp 2: σ chưa biết Do σ chưa biết nên ta thay s X − µ√ n ∼ t(n − 1) s Làm tương tự trường hợp 1, ta thay phân vị chuẩn phân vị Student Chọn thống kê: Z = Mẫu cụ thể (x1 , x2 , , xn ), ta có khoảng ước lượng cho µ với độ tin cậy − α là: s s (x − t(n − 1, − α2 ) √ ; x + t(n − 1, − α1 ) √ ) n n Chú ý: n > 30 phân phối chuẩn tắc phân phối student bậc tự (n − 1) coi X − µ√ Do n > 30 ta chọn thống kê: Z = n ∼ N (0; 1) s Khoảng ước lượng cho µ với độ tin cậy − α là: s s (x − u1−α2 √ ; x + u1−α1 √ ) n n Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Ước lượng khoảng Hà Nội, 30/37 tháng năm 2018 30 / 37 Ước lượng khoảng cho kỳ vọng Ước lượng khoảng cho kỳ vọng Trường hợp 2: σ chưa biết Khoảng ước lượng đối xứng (α1 = α2 = α/2): (x − t(n − 1, − α s α s ) √ ; x + t(n − 1, − ) √ ) 2 n n Khoảng ước lượng phía (α1 = α; α2 = 0): s (−∞; x + t(n − 1, − α) √ ) n Khoảng ước lượng phía (α1 = 0; α2 = α): s (x − t(n − 1, − α) √ ; +∞) n Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 31/37 tháng năm 2018 31 / 37 Ước lượng khoảng Ước lượng khoảng cho kỳ vọng Ước lượng khoảng cho kỳ vọng Ví dụ Ví dụ trước hợp với thực tế ta sửa lại sau: Doanh thu cửa hàng biến ngẫu nhiên X(triệu/tháng) Điều tra ngẫu nhiên doanh thu 500 cửa hàng có qui mơ tương tự ta tính doanh thu trung bình 10 triệu/tháng độ lệch chuẩn mẫu hiệu chỉnh triệu/tháng Với độ tin cậy 95% ước lượng khoảng cho doanh thu trung bình cửa hàng thuộc qui mơ Bài làm X(triệu/tháng) doanh thu cửa hàng loại xét, EX = µ , V X = σ X − µ√ n ∼ t(n − 1) Chọn thống kê: Z = s Khoảng ước lượng đối xứng cho doanh thu trung bình µ là: s s (x − t(n − 1, − α2 ) √ ; x + t(n − 1, − α2 ) √ ) n n Với x = 10, s = 2, n = 500 − α = 0, 95 ⇒ α = 0, 05 ⇒ t(n − 1, − α ) = t(499; 0, 975) = 1, 96 Thay số liệu vào khoảng ta có kết quả: (9,825 ; 10,175) Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Ước lượng khoảng Hà Nội, 32/37 tháng năm 2018 32 / 37 Ước lượng khoảng cho kỳ vọng Ước lượng khoảng cho kỳ vọng Ví dụ Điều tra suất lúa diện tích 100 hécta trồng lúa vùng, ta thu bảng số liệu sau: Năng suất (tạ/ha) Số có suất tương ứng 41 10 44 20 45 30 46 15 48 10 52 10 54 Hãy ước lượng khoảng cho suất lúa trung bình vùng với độ tin cậỵ 95% Ví dụ Quan sát tuổi thọ số người ta có bảng số liệu sau: Tuổi(năm) Số người 20-30 30-40 14 40-50 25 50-60 40 60-70 35 70-80 13 Hãy ước lượng khoảng cho tuổi thọ trung bình người với độ tin cậy 90% Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 33/37 tháng năm 2018 33 / 37 Ước lượng khoảng Ước lượng khoảng cho tỷ lệ Ước lượng khoảng cho tỷ lệ Bài toán Xác suất xảy kiện A p Do p nên người ta thực n phép thử độc lập, điều kiện Trong có m phép thử xảy A f = m/n ước lượng điểm không chệch cho p Câu hỏi: Với độ tin cậy (1 − α) ước lượng khoảng cho p Cách giải quyết: tương tự cách làm cho kỳ vọng Chọn thống kê: Z = f −p √ n ∼ N (0; 1) p(1 − p) Tuy nhiên khó giải nên người ta thay p mẫu f cho dễ tính f −p √ Thống kê trở thành: Z = n ∼ N (0; 1) f (1 − f ) Mẫu cụ thể (x1 , x2 , , xn ), ta có khoảng ước lượng cho p với độ tin cậy − α là: (f − u1−α2 Lê Xuân Lý (SAMI-HUST) f (1 − f ) , f + u1−α1 n f (1 − f ) ) n Thống kê - Ước lượng tham số Ước lượng khoảng Hà Nội, 34/37 tháng năm 2018 34 / 37 Ước lượng khoảng cho tỷ lệ Ước lượng khoảng cho tỷ lệ Các trường hợp ước lượng hay dùng Khoảng ước lượng đối xứng (α1 = α2 = α/2): (f − u1− α2 f (1 − f ) , f + u1− α2 n f (1 − f ) ) n Khoảng ước lượng phía (α1 = α; α2 = 0): (−∞; f + u1−α f (1 − f ) ) n Khoảng ước lượng phía (α1 = 0; α2 = α): (f − u1−α f (1 − f ) ; +∞) n Chú ý: Do tỷ lệ nhận giá trị từ đến nên ta thay giá trị −∞ +∞ khoảng ước lượng phía Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 35/37 tháng năm 2018 35 / 37 Ước lượng khoảng Ước lượng khoảng cho tỷ lệ Ước lượng khoảng cho tỷ lệ Ví dụ Tại bến xe, kiểm tra ngẫu nhiên 100 xe thấy có 30 xe xuất phát Với độ tin cậy 95% ước lượng khoảng cho tỷ lệ xe xuất phát Bài làm Gọi p tỷ lệ xe xuất phát f −p √ Chọn thống kê: Z = n ∼ N (0; 1) f (1 − f ) Khoảng ước lượng đối xứng cho tỷ lệ xe xuất phát là: f (1 − f ) f (1 − f ) (f − u1− α2 , f + u1− α2 ) n n Với n = 100, m = 30 ⇒ f = m/n = 0, − α = 0, 95 ⇒ α = 0, 05 ⇒ u1− α2 = u0,975 = 1, 96 Thay số liệu vào khoảng ta có kết quả: (0,21 ; 0,39) Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Ước lượng khoảng Hà Nội, 36/37 tháng năm 2018 36 / 37 Ước lượng khoảng cho tỷ lệ Ước lượng khoảng cho tỷ lệ Ví dụ 10 Lấy ngẫu nhiên kết khám bệnh 120 người quan thấy có 36 người bị máu nhiễm mỡ Hãy ước lượng khoảng cho tỷ lệ người bị máu nhiễm mỡ quan với độ tin cậy 95% Hãy ước lượng tỷ lệ người bị máu nhiễm mỡ cao quan với độ tin cậy 95% Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 37/37 tháng năm 2018 37 / 37 ... Tuổi(năm) Số người 2 0-3 0 30 -4 0 14 4 0-5 0 25 5 0-6 0 40 6 0-7 0 35 7 0-8 0 13 Hãy ước lượng khoảng cho tuổi thọ trung bình người với độ tin cậy 90% Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số... Những ruộng có suất từ 48 tạ/ha trở lên ruộng có suất cao Tính trung bình mẫu, độ lệch chuẩn mẫu hiệu chỉnh ruộng có suất cao x = 46 ; s = 3, 30 Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham... đồng • Đĩa 4: giá 40 ngàn đồng Lập Wx = (x1 , x2 , x3 , x4 ) = (20, 30, 20, 40 ), mẫu cụ thể Lê Xuân Lý (SAMI-HUST) Thống kê - Ước lượng tham số Hà Nội, 14/ 37 tháng năm 2018 14 / 37 Mẫu ngẫu nhiên