Lesson Student Lecture Notes THỐNG KÊ KINH DOANH Chương ƯỚC LƯỢNG VÀ KIỂM ĐỊNH NỘI DUNG I ƯỚC LƯỢNG II KIỂM ĐỊNH Đọc giáo trình: Chương 5,6 (ước lượng Chương 7,8 (kiểm định) Bài tập: Bài 1,2,3,4,5 trang248 Bài 1,2 trang293 Bài 1,2,3,4,5,11,12,13, 14,15 trang 317 Bài 1,2,3,4,14,15,16 trang343 I ƯỚC LƯỢNG Một số khái niệm thường dùng ước lượng Ước lượng trung bình tổng thể chung • Trường hợp biết phương sai • Trường hợp chưa biết phương sai • Các nhân tố ảnh hưởng tới độ lớn khoảng tin cậy ước lượng Ước lượng tỷ lệ tổng thể chung Xác định cỡ mẫu Statistics for Management 4-1 Lesson Student Lecture Notes Một số khái niệm thường dùng ước lượng • • • • • • Quá trình ước lượng Ước lượng khoảng tin cậy Giới hạn tin cậy cho trung bình tổng thể chung Khoảng tin cậy Mức độ tin cậy Ước lượng tham số tổng thể chung 1.1 Quá trình ước lượng Tổng thể chung Mẫu ngẫu nhiên TB Trung bình, , chưa biết X = 50 Tơi tin 95% trung bình tổng thể chung nằm khoảng 40 & 60 Lấy mẫu Tổng thể chung tổng thể mẫu Chỉ tiêu Quy mơ Tham số Số bình qn Tỷ lệ theo tiêu thức Phương sai Tổng thể chung n N xi N p 2 ( xi ) N p (1 p ) Tổng thể mẫu , xi x n f S2 ( xi x ) n 1 f (1 f ) Statistics for Management 4-2 Lesson Student Lecture Notes Cách chọn Chọn hoàn lại (chọn lặp, chọn nhiều lần): Quy mơ tổng thể khơng đổi số mẫu có: k A n N n N • Chọn khơng hồn lại (chọn khơng lặp, chọn lần): Quy mơ tổng thể giảm n số mẫu có: k C N N! n!( N n )! 1.2 Ước lượng khoảng tin cậy • Đưa khoảng giá trị dựa quan sát từ tổng thể mẫu • Tìm giá trị gần tham số tổng thể chung • Khoảng tin cậy ln tương ứng với xác suất định Xác suất khơng đạt 100% Các yếu tố ước lượng KTC Xác suất để tham số tổng thể chung rơi vào khoảng tin cậy Thống kê mẫu Khoảng tin cậy Giới hạn tin cậy (Giới hạn dưới) Giới hạn tin cậy (Giới hạn trên) Statistics for Management 4-3 Lesson Student Lecture Notes 1.3 Giới hạn tin cậy cho trung bình tổng thể chung Tham số = Thống kê ± Sai số X X Sai số = Sai số = X © 1984-1994 T/Maker Co 10 1.4 Khoảng tin cậy X Z X X Z n _ X 1.645x 1.645x 90% 1.96 x 2.58 x 95% 99% 1.96 x 2.58 x 11 1.5 Độ tin cậy • Là xác suất để tham số tổng thể chung rơi vào khoảng tin cậy • Biểu hiện: (1 - ) % = độ tin cậy e.g 90%, 95%, 99% là xác suất để tham số tổng thể chung không rơi vào khoảng tin cậy 12 Statistics for Management 4-4 Lesson Student Lecture Notes 1.6 Ước lượng tham số tổng thể chung Ước lượng tham số tổng thể chung… từ thống kê tổng_thể mẫu Trung bình X Tỷ lệ p f 2 s Phương sai - Khác biệt _ _ x - x 2 13 Ước lượng trung bình tổng thể chung Ước lượng Trung bình Đã biết Tỷ lệ Chưa biết 14 2.1 Trường hợp biết phương sai (Đã biết ) • • Giả thiết (điều kiện) Đã biết độ lệch chuẩn tổng thể chung Tổng thể chung phân bố chuẩn Nếu bất bình thường, sử dụng mẫu lớn Ước lượng khoảng tin cậy: x x x x Trong đó: x phạm vị sai số chọn mẫu tính bằng: x z / x 15 Statistics for Management 4-5 Lesson Student Lecture Notes 2.1 Trường hợp biết phương sai (Đã biết ) Trường hợp 1: Chọn lần (Chọn không lặp) x 2 n (1 ) n N Trường hợp 2: Chọn nhiều lần (Chọn có lặp lại) x 2 n 16 2.2 Trường hợp chưa biết phương sai (Chưa biết ) • Giả thiết (điều kiện) Chưa biết độ lệch chuẩn tổng thể chung Tổng thể chung phân bố chuẩn • • Nếu mẫu n ≥ 30, sử dụng phân phối z Nếu mẫu nhỏ, sử dụng phân bố t Student’s • Ước lượng khoảng tin cậy: x t / 2,( n1) x x t / 2,(n1) x x t / 2,( n1) x Hay khoảng tin cậy là: 17 2.2 Trường hợp chưa biết phương sai (chưa biết ) Trường hợp 1: Chọn lần (Chọn không lặp) x s2 n (1 ) n N Trường hợp 2: Chọn nhiều lần (Chọn có lặp lại) x s2 n 18 Statistics for Management 4-6 Lesson Student Lecture Notes Phân bố t Student’s Phân bố chuẩn Hình chng Đối xứng t (df = 13) t (df = 5) Z t 19 Bài tập Một doanh nghiệp dệt có 1000 cơng nhân, người ta chọn ngẫu nhiên (theo cách chọn không lặp) 100 công nhân để điều tra suất lao động có kết sau: NSLĐ (m) • • • • Số cơng nhân Dưới 40 30 40-50 33 50-60 24 Từ 60 trờ lên 13 Tính NSLĐ bình qn chung cơng nhân toàn doanh nghiệp với độ tin cậy 95,44% Từ xác định sản lượng vải doanh nghiệp? Giả sử doanh nghiệp tiến hành điều tra chọn mẫu để suy rộng NSLĐ bình quân Với độ tin cậy 95% phạm vi sai số chọn mẫu khơng q 2m tính số cơng nhân cần chọn để điều tra theo cách chọn Tính tỷ lệ chung số cơng nhân có NSLĐ từ 60m trở lên với độ tin cậy 90% Có khoảng cơng nhân doanh nghiệp đạt mức suất Giả sử doanh nghiệp tiến hành điều tra để suy rộng tỷ lệ công nhân đạt mức NSLĐ từ 60m trở lên, với độ tin cậy 99% phạm vi sai số chọn mẫu khơng vượt q 5% tính số công nhân cần điều tra theo cách chọn 20 2.3 Những nhân tố ảnh hưởng tới độ lớn khoảng tin cậy • • Độ biến thiên liệu: đo Cỡ mẫu x • n Khoảng tin cậy kéo dài từ x z. x đến x z. x Mức độ tin cậy (1 - ) © 1984-1994 T/Maker Co 21 Statistics for Management 4-7 Lesson Student Lecture Notes Ước lượng tỷ lệ tổng thể chung • Giả thiết: Chỉ có hai biểu định tính Tổng thể chung phân bố theo quy luật nhị thức Điều kiện cỡ mẫu: • n·p Ước lượng khoảng tin cậy: Trong đó: n·(1 - p) & f f p f f f phạm vi sai số chọn mẫu tính bằng: f z / f 22 Ước lượng tỷ lệ Trường hợp 1: Chọn lần (Chọn không lặp) f f (1 f ) n (1 ) n N Trường hợp 2: Chọn nhiều lần (Chọn có lặp lại) f f (1 f ) n 23 Xác định cỡ mẫu Cỡ mẫu Q lớn: • Đòi hỏi nhiều nguồn lực Q nhỏ: • Sẽ khơng thể thực mục tiêu đặt 24 Statistics for Management 4-8 Lesson Student Lecture Notes Xác định cỡ mẫu • Yêu cầu: + Sai số nhỏ + Chi phí thấp • Cơ sở xác định: sai số nhỏ 25 Cách xác định Cách chọn Suy rộng Chọn hoàn lại Chọn khơng hồn lại Bình qn n Tỷ lệ n z / x2 n N z / 2 N x2 z / z / 22 p(1 p) n N.z / 22 p(1 p) 2f N z / p(1 p) 2f 26 Một số phương pháp xác định phương sai tổng thể chung + Lấy phương sai (2) lớn lần điều tra trước tỷ lệ (p) gần 0,5 + Lấy phương sai tỷ lệ điều tra khác có tính chất tương tự + Điều tra thí điểm để xác định phương sai + Ước lượng phương sai dựa vào khoảng biến thiên R xmax x 6 27 Statistics for Management 4-9 Lesson Student Lecture Notes Các nhân tố ảnh hưởng tới cỡ mẫu điều tra + Hệ số tin cậy (z)/Trình độ tin cậy + Phương sai (độ đồng đều) tổng thể chung (2) + Phạm vi sai số chọn mẫu () + Phương pháp tổ chức chọn mẫu Lưu ý: Số lượng đơn vị mẫu điều tra không lẻ (khi xác định kích thước mẫu ln làm tròn lên) 28 NỘI DUNG I II ƯỚC KIỂM LƯỢNG ĐỊNH 29 II KIỂM ĐỊNH Một số vấn đề chung Kiểm định trung bình • Kiểm định giá trị trung bình tổng thể chung • So sánh hai giá trị trung bình hai tổng thể chung Kiểm định tỷ lệ • Kiểm định tỷ lệ tổng thể chung • So sánh hai tỷ lệ hai tổng thể chung 30 Statistics for Management 4-10 Lesson Student Lecture Notes Một số vấn đề chung kiểm định Giả thiết thống kê Kiểm định Sai lầm mức ý nghĩa kiểm định Tiêu chuẩn kiểm định Các bước tiến hành kiểm định 31 Một số vấn đề chung kiểm định 1.1 Giả thiết thống kê Giả thiết giả định tham số tổng thể chung Tham số trung bình tỷ lệ tổng thể chung Tham số phải xác định trước phân tích Tơi cho điểm trung bình lớp 8.5! © 1984-1994 T/Maker Co 32 Các loại giả thiết thống kê Giả thiết “không”, H0 Đưa giả định (bằng số) để kiểm định VD: Số lượng TV trung bình gia đình Mỹ (H0: 3) Bắt đầu với giả định giả thiết “không” luôn ĐÚNG (Tương tự khái niệm vô tội có chứng chứng minh có tội) Ln ln có dấu ‘ = ‘ Giả thiết “khơng” bác bỏ 33 Statistics for Management 4-11 Lesson Student Lecture Notes Các loại giả thiết thống kê Giả thiết “đối”, H1 Là đối lập với giả thiết “khơng” VD: Số lượng TV trung bình hộ gia đình Mỹ nhỏ (H1: < 3) Khơng có dấu ‘=‘ Giả thiết đối khơng thể chấp nhận 34 Quá trình kiểm định giả thiết - Đặt giả thiết “không” (H0: 3) - Đặt giả thiết đối (H1: < 3) • Các giả thiết loại trừ lẫn bao hàm tất cảc trường hợp • Đôi điền giả thiết đối trước dễ dàng - Thu thập thông tin mẫu để rút kết luận giả thiết cần kiểm định 35 a Mức ý nghĩa a • Là xác suất bác bỏ Ho Gọi miền bác bỏ phân bố mẫu • • Lựa chọn giá trị alpha Các giá trị điển hình: 0.01, 0.05, 0.10 • Được chọn trước bắt đầu nghiên cứu • Đưa giá trị tới hạn cho kiểm định 36 Statistics for Management 4-12 Lesson Student Lecture Notes Mức ý nghĩa a miền bác bỏ H0: = H1: < Giá trị tới hạn Miền bác bỏ H0: = H1: > H0: 3 H1: /2 37 b Những sai lầm định Loại I ♣ Bác bỏ giả thiết “không” ♣ Gây hậu nghiêm trọng ♣ Xác suất sai loại I a Gọi mức ý nghĩa Loại II ♣ Không bác bỏ giả thiết “khơng” sai ♣ Xác suất xảy sai sót loại II b (Beta) 38 & b có mối liên hệ ngược chiều Giảm sác xuất sai loại làm tăng sác xuất tăng loại b 39 Statistics for Management 4-13 Lesson Student Lecture Notes Tiêu chuẩn kiểm định quy luật phân phối xác suất dùng để kiểm định • Trong tập hợp kiểm định thống kê có mức ý nghĩa (tức có xác suất mắc sai lầm loại 1như nhau), kiểm định có xác suất mắc sai lầm loại nhỏ xem “tốt nhất” • Một số quy luật phân phối thông dụng chọn làm tiêu chuẩn kiểm định tùy thuộc vào giả thiết cần KĐ như: quy luật phân phối chuẩn, phân phối T-Student, phân phối 2, phân phối Fisher 40 Phát biểu giả thiết H0 giả thiết đối H1 Định rõ mức ý nghĩa (xác suất mắc sai lầm loại 1) Chọn tiêu chuẩn kiểm định Tính giá trị tiêu chuẩn kiểm định từ mẫu quan sát Kết luận bác bỏ hay chấp nhận H0 tuỳ theo giá trị tiêu chuẩn kiểm định rơi vào miền bác bỏ hay chấp nhận Cụ thể : - Nếu giá trị tiêu chuẩn kiểm định thuộc miền bác bỏ: H0 sai, bác bỏ giả thiết H0 , thừa nhận H1 - Nếu giá trị tiêu chuẩn kiểm định thuộc miền chấp nhận: Trong trường hợp khơng nên hiểu H0 hồn tồn mà nên hiểu qua mẫu cụ thể chưa đủ sở để bác bỏ H0, cần nghiên cứu thêm 41 II KIỂM ĐỊNH Một số vấn đề chung Kiểm định so sánh giá trị trung bình • Kiểm định giá trị trung bình tổng thể chung • So sánh hai giá trị trung bình hai tổng thể chung Kiểm định so sánh tỷ lệ • Kiểm định tỷ lệ tổng thể chung • So sánh hai tỷ lệ hai tổng thể chung 42 Statistics for Management 4-14 Lesson Student Lecture Notes Kiểm định so sánh số trung bình - Kiểm định giá trị trung bình tổng thể chung - So sánh giá trị trung bình tổng thể chung 43 2.1 Kiểm định giá trị trung bình tổng thể chung a) Phương sai tổng thể chung biết Tiêu chuẩn kiểm định chọn : Z x μ n σ Tuỳ thuộc vào dạng giả thiết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Kiểm định phía trái: Kiểm định phía : H0: = 0 H0: = 0 H0: = 0 H1: > 0 H1: < 0 H1: 0 Nếu Z > Z , bác bỏ giả thiết H0, nhận H1 Nếu Z Z/2 ,bác bỏ giả thiết H0, nhận H1 44 Miền bác bỏ H0: =0 H1: < H0: =0 H1: > Bác bỏ H0 Bác bỏ H0 Z Z 45 Statistics for Management 4-15 Lesson Student Lecture Notes Ví dụ Một hộp ngũ cốc trung bình có chứa 368 grams? Lấy ngẫu nhiên mẫu gồm 25 hộp cho kết x = 372.5 Công ty định rõ độ lệch tiêu chuẩn 15 grams Kiểm định mức ý nghĩa a = 0.05 368 gm H0: =368 H1: > 368 46 Tính tốn kết luận Tiêu chuẩn kiểm định: H0: =368 H1: > 368 = 0.05 n = 25 • Giá trị tới hạn: 1.645 Z x μ n = 1.5 σ Quyết định: Bác bỏ 05 1.645 Z Chưa đủ sở bác bỏ với Ho Kết luận: Chưa đủ chứng chứng tỏ hộp ngũ cốc trung bình chứa 368 grams với mức ý nghĩa 5% 47 2.1 Kiểm định giá trị trung bình tổng thể chung b) Phương sai tổng thể chung chưa biết (mẫu lớn) Tiêu chuẩn kiểm định chọn : (s độ lệch tiêu chuẩn mẫu ) Z x μ n s Tuỳ thuộc vào dạng giả thiết đối H1 mà miền bác bỏ xây dựng tương tự trên: Kiểm định phía phải: Kiểm định phía trái: Kiểm định phía : H0: = 0 H0: = 0 H0: = 0 H1: > 0 H1: < 0 H1: 0 Nếu Z > Z , bác bỏ giả thiết H0, nhận H1 Nếu Z Z/2 ,bác bỏ giả thiết H0, nhận H1 48 Statistics for Management 4-16 Lesson Student Lecture Notes 2.1 Kiểm định giá trị trung bình tổng thể chung c) Phương sai tổng thể chung chưa biết (mẫu nhỏ) Tiêu chuẩn kiểm định chọn : (s độ lệch tiêu chuẩn mẫu) t x μ n s Tuỳ thuộc vào dạng giả thiết đối H1 mà miền bác bỏ xây dựng tương tự trên: Kiểm định phía phải: Kiểm định phía trái: Kiểm định phía: H0: = 0 H0: = 0 H0: = 0 H1: > 0 H1: < 0 H1: 0 Nếu t > t ,(n-1) , bác bỏ giả thiết H0, nhận H1 Nếu t t/2,(n-1) ,bác bỏ giả thiết H0, nhận H1 49 2.2 So sánh hai giá trị trung bình hai tổng thể chung (2 mẫu độc lập) a) Phương sai tổng thể chung 12, 22 biết Tiêu chuẩn kiểm định chọn : x1 x Z σ 12 σ 22 n1 n Tuỳ thuộc vào dạng giả thiết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: H0: 1 = 2 H1: 1 > 2 Nếu Z > Z , bác bỏ giả thiết H0, nhận H1 Kiểm định phía trái: H0: = 2 H1: 1 < 2 Nếu Z Z/2 ,bác bỏ giả thiết H0, nhận H1 50 2.2 So sánh hai giá trị trung bình hai tổng thể chung (2 mẫu độc lập) b) Phương sai tổng thể chung 12, 22 chưa biết *) Nếu phương sai không Tiêu chuẩn kiểm định chọn : t x x s12 s 22 n1 n Nếu giả thuyết Ho đúng, t phân phối theo quy luật Student với bậc tự v, đó: s12 s 22 n1 n v 2 s12 s 22 n 1 n n 1 n Statistics for Management 51 4-17 Lesson Student Lecture Notes 2.2 So sánh hai giá trị trung bình hai tổng thể chung (2 mẫu độc lập) b) Phương sai tổng thể chung 12, 22 chưa biết Nếu phương sai không Tuỳ thuộc vào dạng giả thiết đối H1 mà miền bác bỏ xây dựng theo trường hợp sau: Kiểm định phía phải: Kiểm định phía trái: H0: 1 = 2 H0: = 2 H1: 1 > 2 H1: 1 < 2 Nếu t > t ,v , bác bỏ giả thiết H0 , nhận H1 Kiểm định phía phải: H0: = 2 H1: 2 Nếu t t/2,v, bác bỏ giả thiết H0, nhận H1 52 2.2 So sánh hai giá trị trung bình hai tổng thể chung (2 mẫu độc lập) b) Phương sai tổng thể chung 12, 22 chưa biết Nếu phương sai tổng thể chung Tiêu chuẩn kiểm định chọn : t x x 2 s s n1 n x x 1 s n1 n Trong đó: s2 n1 1s12 (n 1)s 22 n1 n Nếu giả thuyết Ho đúng, t phân phối theo quy luật Student với (n1 + n2 – 2) bậc tự Tuỳ thuộc vào dạng giả thiết đối H1 mà miền bác bỏ xây dựng theo trường hợp 53 Ví dụ: • Bạn nhân viên phân tích tài cho Charles Schwab Liệu có khác phân chia lợi tức cổ phiếu niêm yết NYSE NASDAQ? Bạn thu thập liệu đây: • NYSE Số lượng 21 Trung bình 3.27 Độ lệch chuẩn 1.30 NASDAQ 25 2.53 1.16 • Cho phương sai nhau, liệu thực có khác lợi tức trung bình sàn khơng ( = 0.05)? © 1984-1994 T/Maker Co 54 Statistics for Management 4-18 Lesson Student Lecture Notes II KIỂM ĐỊNH Một số vấn đề chung Kiểm định so sánh giá trị trung bình • Kiểm định giá trị trung bình tổng thể chung • So sánh hai giá trị trung bình hai tổng thể chung Kiểm định so sánh tỷ lệ • Kiểm định tỷ lệ tổng thể chung • So sánh hai tỷ lệ hai tổng thể chung 55 Kiểm định so sánh tỷ lệ - Kiểm định tỷ lệ tổng thể chung - So sánh tỷ lệ hai tổng thể chung 56 3.1 Kiểm định tỷ lệ tổng thể chung • P tỷ lệ theo tiêu thức định tính tổng thể chung • Tiêu thức định tính có hai biểu phân bố theo quy luật nhị thức Bao gồm biểu có khơng có theo tiêu thức nghiên cứu • Tỷ lệ tổng thể mẫu: f Tiêu chuẩn kiểm định: Statistics for Management Z f p0 p0 (1 p0 ) n 57 4-19 Lesson Student Lecture Notes 3.1 Kiểm định tỷ lệ tổng thể chung Ví dụ ﺤ Vấn đề: công ty marketing cần phải nhận 4% lời phúc đáp sau gửi thư qua đường bưu điện ﺤ Tiếp cận: Để kiểm định đòi hỏi này, điều tra mẫu ngẫu nhiên gồm 500 đơn vị, có 25 lời phúc đáp ﺤ Giải pháp: Kiểm định mức ý nghĩa α=0.05 58 3.1 Kiểm định tỷ lệ tổng thể chung Tiêu chuẩn kiểm định: H0: p 0.04 H1: p 0.04 • • Z = 05 n = 500 f p0 0,05 0,04 = 1.14 0,04(1 0,04) p (1 p ) 500 n Giá trị tới hạn: 1.96 Bác bỏ Ra định: Không bác bỏ với =0,05 Bác bỏ 0.025 0.025 Kết luận: Chúng ta khơng có đủ chứng để bác bỏ mục tiêu công ty tỷ lệ phúc đáp 4% Z 59 3.2 So sánh hai tỷ lệ hai tổng thể chung Giả định: Mẫu đủ lớn n 1p1; n p & n (1 p1 ); n (1 p ) Tiêu chuẩn kiểm định: f1 f Z 1 p(1 p) n1 n Trong đó: p n1f n f n1 n 60 Statistics for Management 4-20 ... bình có chứa 36 8 grams? Lấy ngẫu nhiên mẫu gồm 25 hộp cho kết x = 37 2.5 Công ty định rõ độ lệch tiêu chuẩn 15 grams Kiểm định mức ý nghĩa a = 0.05 36 8 gm H0: = 36 8 H1: > 36 8 46 Tính tốn... đình Mỹ nhỏ (H1: < 3) Không có dấu ‘=‘ Giả thiết đối khơng thể chấp nhận 34 Q trình kiểm định giả thiết - Đặt giả thiết “không” (H0: 3) - Đặt giả thiết đối (H1: < 3) • Các giả thiết loại... nhân để điều tra suất lao động có kết sau: NSLĐ (m) • • • • Số công nhân Dưới 40 30 40-50 33 50-60 24 Từ 60 trờ lên 13 Tính NSLĐ bình qn chung cơng nhân tồn doanh nghiệp với độ tin cậy 95,44% Từ