Bài giảng Lý thuyết xác suất và thống kê toán - Bài 5: Cơ sở lý thuyết mẫu với các nội dung khái niệm cơ bản; tổng thể nghiên cứu; mẫu ngẫu nhiên; thống kê; quy luật phân phối xác suất liên hệ.
BÀI CƠ SỞ LÝ THUYẾT MẪU ThS Nguyễn Hải Dương Khoa Toán Kinh tế Trường Đại học Kinh tế Quốc dân v1.0014109216 TÌNH HUỐNG KHỞI ĐỘNG Có nhiều khách mua hàng cửa hàng, nhiên người quản lý có tay hóa đơn tốn 100 khách hàng ngày (đơn vị: nghìn đồng) sau: 169 119 234 299 181 204 130 221 176 175 v1.0014109216 210 177 118 219 294 220 152 304 234 184 160 248 191 174 116 159 210 174 281 127 196 208 141 179 173 171 157 106 232 215 203 321 60 165 234 258 297 198 196 227 221 214 197 237 211 174 195 160 165 258 208 283 182 156 223 184 65 252 301 195 174 234 195 225 256 189 101 198 211 160 260 197 287 68 338 182 216 153 222 219 164 221 311 138 175 301 227 139 170 231 Khách hàng nói chung có chi tiêu nào? Số tiền khách mua hàng có phân phối xác suất nào? Số tiền trung bình tất khách hàng mua hàng bao nhiêu? Phương sai số tiền tất khách hàng mua hàng bao nhiêu? MỤC TIÊU • Hiểu phân biệt khái niệm Tổng thể Mẫu; • Hiểu phân biệt khái niệm Tham số Thống kê; • Tính xác thống kê đặc trưng mẫu máy tính bấm tay; • Nhớ quy luật liên hệ để áp dụng tra bảng số v1.0014109216 HƯỚNG DẪN HỌC • Học lịch trình mơn học theo tuần; • Theo dõi chi tiết ví dụ giảng, tự làm tập luyện tập; • Sử dụng máy tính bấm tay để tính ví dụ, tự tính kết đối chiếu với đáp số giảng; • Tự nghiên cứu trao đổi với bạn học cần thiết; • Trao đổi với giảng viên qua phương tiện cung cấp; • Tự nghiên cứu tình thông qua số liệu cụ thể v1.0014109216 NỘI DUNG Khái niệm Tổng thể nghiên cứu Mẫu ngẫu nhiên Thống kê Quy luật phân phối xác suất liên hệ v1.0014109216 KHÁI NIỆM CƠ BẢN 1.1 Biến ngẫu nhiên gốc 1.2 Phương pháp nghiên cứu v1.0014109216 1.1 BIẾN NGẪU NHIÊN GỐC Những khái niệm thống kê toán đối tượng nghiên cứu, dấu hiệu nghiên cứu, đại lượng nghiên cứu • Ví dụ 1: Nghiên cứu hài lịng sinh viên Đại học KTQD với phương pháp giảng dạy giảng viên trường, đối tượng nghiên cứu sinh viên học trường Cách 1: lấy ý kiến với hai loại ý kiến: Không hài lòng Hài lòng Đại lượng – đại diện cho giá trị Khơng hài lịng Hài lòng đại lượng nghiên cứu Cách 2: đặt thang điểm từ đến với số lớn thể hài lòng nhiều Mức điểm đại lượng nghiên cứu • Ví dụ 2: Quản lý cửa hàng quan tâm đến số tiền mà khách hàng chi tiêu cửa hàng Đối tượng nghiên cứu khách hàng, dấu hiệu nghiên cứu đại lượng nghiên cứu, số tiền khách hàng chi tiêu Định nghĩa – Đại lượng nghiên cứu: Với vấn đề nghiên cứu, biến ngẫu nhiên gốc đại lượng nghiên cứu, nhận giá trị ngẫu nhiên tùy đối tượng nghiên cứu v1.0014109216 1.2 PHƯƠNG PHÁP NGHIÊN CỨU • Nghiên cứu tổng thể: nghiên cứu toàn đối tượng theo dấu hiệu nghiên cứu xác định Ưu điểm: thông tin đầy đủ, xác, trọn vẹn Nhược điểm: • Chi phí lớn kinh tế thời gian; Có thể dẫn tới phá hủy tồn tập hợp nghiên cứu; Có tập hợp khơng thể nghiên cứu toàn Nghiên cứu mẫu: nghiên cứu phận, từ tổng thể nghiên cứu ta lấy tập nghiên cứu phần tử tập Ưu điểm: Tính khả thi; Chi phí tốn so với điều tra toàn tổng thể; Mẫu lấy ngẫu nhiên, khoa học thơng tin có tính xác v1.0014109216 1.2 PHƯƠNG PHÁP NGHIÊN CỨU Mẫu Mẫu Tổng thể v1.0014109216 NGHIÊN CỨU TỔNG THỂ 2.1 Định nghĩa 2.2 Mô tả tổng thể 2.3 Các tham số đặc trưng tổng thể v1.0014109216 10 4.3 PHƯƠNG SAI MẪU Định nghĩa 14 – Độ lệch chuẩn mẫu: Độ lệch chuẩn mẫu, ký hiệu S, bậc hai phương sai mẫu S S2 Với mẫu cụ thể: k 1 k (x)2 x (x)2 n x ms ni (x i x) i i n i1 n i1 Phương sai cụ thể s2 k s ni (x i x)2 n i1 Độ lệch chuẩn cụ thể s s2 v1.0014109216 n ms n 1 33 4.4 TỶ LỆ MẪU Định nghĩa 15 – Tỷ lệ mẫu: Tỷ lệ mẫu, ký hiệu f, tỉ số số lần xuất biến cố A mẫu kích thước mẫu Nếu mẫu ngẫu nhiên kích thước n, biến cố A xuất XA lần, XA biến ngẫu nhiên, XA = {0, 1, …, n}, tần suất mẫu biến cố A: f XA n n 0 Tần suất mẫu f biến ngẫu nhiên f , , , n n n • Kỳ vọng: E(f ) = p • Phương sai: • Độ lệch chuẩn: (f ) v1.0014109216 V(f ) p(1 p) n p(1 p) n 34 4.4 TỶ LỆ MẪU (tiếp theo) Ví dụ 9: Điều tra thu nhập (đơn vị: triệu đồng) số hộ gia đình Thu nhập Số hộ 10 – 14 14 – 18 18 – 22 22 – 26 26 – 30 a) Tính thống kê đặc trưng mẫu gồm trung bình, phương sai, độ lệch chuẩn b) Tính tỷ lệ mẫu hộ gia đình có thu nhập 18 triệu Giải: Gọi X thu nhập hộ gia đình, X biến ngẫu nhiên v1.0014109216 Cột [1] Cột [2] Cột [3] = [1][2] Cột [4] = [1]2[2] xi ni nixi ni xi2 12 24 288 16 80 1280 20 160 3200 24 168 4032 28 84 2352 Tổng () 25 516 11152 35 4.4 TỶ LỆ MẪU (tiếp theo) a) Trung bình mẫu: Phương sai mẫu: x n x 516 20,64 i i n 25 25 11152 2 n 2 (20,64) s x (x) 25 20,907 25 n 1 Độ lệch chuẩn mẫu: s s2 20,907 4,572 b) Tính tỷ lệ mẫu hộ gia đình có thu nhập 18 triệu f k ( X18 ) n 25 0,28 25 Tỷ lệ mẫu hộ thu nhập 18 triệu 0,28 hay 28% v1.0014109216 36 QUY LUẬT PHÂN PHỐI XÁC SUẤT LIÊN HỆ 5.1 Với dấu hiệu nghiên cứu định lượng 5.2 Với dấu hiệu nghiên cứu định tính v1.0014109216 37 5.1 VỚI DẤU HIỆU NGHIÊN CỨU ĐỊNH LƯỢNG Biến ngẫu nhiên gốc phân phối chuẩn, X ~ N(, 2), trung bình tổng thể m , phương sai tổng thể V(X) Xây dựng mẫu ngẫu nhiên kích thước n: W = (X1, X2,…, Xn) Trung bình mẫu X n Xi tổ hợp tuyến tính Xi, tham số đặc trưng X : n i1 E(X) m ta có: v1.0014109216 2 V(X) n 2 X ~ N ; n 38 5.1 VỚI DẤU HIỆU NGHIÊN CỨU ĐỊNH LƯỢNG • • Thống kê liên quan với trung bình mẫu trung bình tổng thể U (X ) n ~ N(0,1) T (X ) n ~ T(n 1) S Thống kê liên quan với phương sai mẫu phương sai tổng thể (n 1)S2 ~ 2 (n 1) v1.0014109216 39 5.2 VỚI DẤU HIỆU NGHIÊN CỨU ĐỊNH TÍNH (tiếp theo) Dấu hiệu định tính có hai trạng thái Khơng Có, biến ngẫu nhiên gốc có dạng Khơng – một, tỷ lệ tổng thể hay xác suất p Tỷ lệ mẫu hay tần suất mẫu mẫu ngẫu nhiên kích thước n f, với n ≥ 100, chứng minh được: (f p) n U ~ N(0,1) p(1 p) v1.0014109216 40 Tổng thể Mẫu ngẫu nhiên: W Mẫu cụ thể: w Kích thước N n n Giá trị biến xi Xi xi TỔNG KẾT n x (x)2 n 1 χ2(n – 1) m=μ X Phương sai 2 S2 Độ lệch chuẩn S s Tần số M XA kA Tính chất v1.0014109216 p M N Là giá trị xác định, chưa biết f XA n Là biến ngẫu nhiên X ~ N(μ; 2) T(n – 1) Trung bình Tần suất xác suất k ni x i n i1 x s2 Phân phối f kA n Là số, tính tốn N(0;1) N(0;1) Tra bảng giá trị tới hạn 41 GIẢI QUYẾT TÌNH HUỐNG Tính thống kê đặc trưng mẫu với ví dụ tình trường hợp số liệu liệt kê chi tiết trường hợp gộp thành nhóm Việc tính số liệu gốc dài, viết kết quả: Kích thước mẫu: n = 100 • Trung bình mẫu: • xi 20040 200,4 x n 100 Phương sai mẫu: 100 4320366 n (200,4)2 3074,24 s2 x (x)2 100 100 n 1 • Độ lệch chuẩn mẫu: s s2 3074,24 55,446 v1.0014109216 42 GIẢI QUYẾT TÌNH HUỐNG • Cách tính khác: Gộp số liệu thành nhóm Giá trị 60–100 100–140 140–180 180–220 xi ni 80 120 160 25 200 29 220–260 260–300 240 21 280 300–340 320 Lập bảng tính v1.0014109216 nixi ni xi2 xi ni 80 240 19200 120 1080 129600 160 25 4000 640000 200 29 5800 1160000 240 21 5040 1209600 280 1960 548800 320 1920 614400 Tổng 100 20040 4321600 43 GIẢI QUYẾT TÌNH HUỐNG • Kích thước mẫu: n = 100 Trung bình mẫu: x x 20040 200,4 i n 100 Phương sai mẫu: n 100 4321600 2 x (x)2 (200,4) 3086,71 100 100 n 1 Độ lệch chuẩn mẫu: s2 s s2 3086,71 55,558 v1.0014109216 44 CÂU HỎI TRẮC NGHIỆM Cho số liệu mẫu (3 ; ; 1) tính giá trị trung bình Đây đại lượng nào? A Tham số m B Tham số μ C Thống kê x mẫu ngẫu nhiên D Thống kê x mẫu cụ thể Trả lời: • Đáp án là: D Thống kê x mẫu cụ thể • Vì: Đây giá trị quan sát số liệu thực biến ngẫu nhiên v1.0014109216 45 CÂU HỎI TRẮC NGHIỆM Cho kết điều tra giá mặt hàng hệ thống siêu thị sau: Giá bán (USD) 10 14 18 Số ngày X biến ngẫu nhiên Phương sai mẫu là: A 6,56 B 7,29 C 2,70 D 2,56 Trả lời: • Đáp án là: B 7,29 • Vì: áp dụng cơng thức v1.0014109216 n x2 x n 1 46 TĨM LƯỢC CUỐI BÀI • Nghiên cứu tượng qua đối tượng nghiên cứu, dấu hiệu nghiên cứu đại lượng nghiên cứu Đại lượng nghiên cứu Biến ngẫu nhiên gốc • Tổng thể tập hợp tất phần tử chứa dấu hiệu nghiên cứu, kích thước tổng thể lớn vơ hạn Trên tổng thể có quy luật phân phối xác suất biến ngẫu nhiên gốc Các tham số: trung bình tổng thể, phương sai tổng thể, độ lệch chuẩn tổng thể tham số biến ngẫu nhiên gốc Tỷ lệ tổng thể trung bình tổng thể biến ngẫu nhiên gốc dạng – • Mẫu phận thơng tin rút từ tổng thể, gồm mẫu ngẫu nhiên mẫu cụ thể Các thống kê mẫu ngẫu nhiên biến ngẫu nhiên, mẫu cụ thể số Các thống kê phải tương ứng với tham số tổng thể, có trung bình mẫu, phương sai mẫu, độ lệch chuẩn mẫu, tỷ lệ mẫu • Mối quan hệ thống kê mẫu tham số tổng thể thể qua quy luật phân phối Chuẩn hóa, Khi – bình phương, Student v1.0014109216 47 ... 208 141 179 173 171 157 106 232 2 15 203 321 60 1 65 234 258 297 198 196 227 221 214 197 237 211 174 1 95 160 1 65 258 208 283 182 156 223 184 65 252 301 1 95 174 234 1 95 2 25 256 189 101 198 211 160... thành nhóm tuổi v1.0014109216 Nhóm tuổi 20–29 30–39 40–49 50 ? ?59 Số người 25 60 80 35 Nhóm tuổi Số người 24 ,5 25 34 ,5 60 44 ,5 80 54 ,5 35 25 3.3 MÔ TẢ MẪU CỤ THỂ (tiếp theo) Ví dụ (tình dẫn nhập):... 300–340 25 29 21 26 THỐNG KÊ 4.1 Định nghĩa thống kê 4.2 Trung bình mẫu 4.3 Phương sai mẫu 4.4 Tỷ lệ mẫu v1.0014109216 27 4.1 ĐỊNH NGHĨA VỀ THỐNG KÊ Định nghĩa 10 – Thống kê: Thống kê hàm thành