Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh BÀI TẬP CÁ NHÂN Đề bài: Trả lời câu hỏi sau đây, giải thích rõ cách làm Diện tích nằm đường mật độ phân phối chuẩn hóa hai điểm –1.75 là: Chỉ số IQ có phân phối chuẩn với trung bình 100 độ lệch chuẩn 16 Gọi số IQ biến ngẫu nhiên X, tính P (68 < X < 132): Nếu độ tin cậy giảm đi, khoảng tin cậy rộng hay hẹp lại? Giả sử khoảng tin cậy cho trung bình tổng thể từ 62.84 đến 69.46 Biết σ = 6.50 kích thước mẫu n=100 Hãy tính trung bình mẫu : Giá trị p-value sau dẫn đến việc bác bỏ giả thiết H0 α= 0.05? a 0.150 b 0.100 c 0.051 d 0.025 Hoàn thành tập sau Bài Một phương pháp bán hàng theo đơn đặt hàng xem xét Để đánh giá tính hiệu xét mặt thời gian người ta vấn ngẫu nhiên 30 khách hàng bán hàng theo phương pháp ghi lại số ngày từ đặt hàng đến giao hàng sau: 9 5 6 10 6 5 Hãy ước lượng số ngày trung bình từ đặt hàng đến giao hàng bán hàng theo phương pháp với độ tin cậy 95% Hãy kết luận hiệu phương pháp bán hàng so với phương pháp cũ Biết phương pháp bán hàng cũ có số ngày trung bình từ đặt hàng đến giao hàng 7,5 ngày Bài Tại doanh nghiệp người ta xây dựng hai phương án sản xuất loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án có khác hay không người ta tiến hành sản xuất thử thu kết sau: (ngàn đồng) Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30 Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28 Chi phí theo hai phương án phân phối theo quy luật chuẩn Với mức ý nghĩa 5% rút kết luận hai phương án Bài 3: Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm) loại hoá chất xác định Nếu mức độ tập trung lớn 247 ppm, loại thuốc gây số phản ứng phụ; mức độ tập trung nhỏ 247 ppm, loại thuốc hiệu Nhà sản xuất Page Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh muốn kiểm tra xem liệu mức độ tập trung bình quân lô hàng lớn có đạt mức 247 ppm yêu cầu hay không Một mẫu ngẫu nhiên gồm 60 đơn vị kiểm nghiệm người ta thấy trung bình mẫu 250 ppm độ lệch chuẩn mẫu 12 ppm a Hãy kiểm định mức độ tập trung bình quân toàn lô hàng 247 ppm với mức ý nghĩa α = 0.05 Thực điều với α=0.01 b Kết luận bạn nào? Bạn có định lô hàng này? Nếu lô hàng bảo đảm chứa đựng mức độ tập trung bình quân 247 ppm, định bạn vào việc kiểm định giả thiết thống kê? Bài 4: Gần đây, nhóm nghiên cứu tập trung vào vấn đề dự đoán thị phần nhà sản xuất cách sử dụng thông tin chất lượng sản phẩm họ Giả sử số liệu sau thị phần có tính theo đơn vị phần trăm (%) (Y) chất lượng sản phẩm theo thang điểm 0-100 xác định quy trình định giá khách quan (X) X: 27, 39, 73, 66, 33, 43, 47, 55, 60, 68, 70, 75, 82 Y: 2, 3, 10, 9, 4, 6, 5, 8, 7, 9, 10, 13, 12 a Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn thị phần chất lượng sản phẩm Kết luận ? b Kiểm định tồn mối liên hệ tương quan tuyến tính giưa X Y c Cho biết hệ số R2 giải thích ý nghĩa Bài làm: Lý thuyết: Diện tích nằm đường mật độ phân phối chuẩn hóa hai điểm –1.75 là: = P(-1.75 α tăng => Khoảng tin cậy rộng Giả sử khoảng tin cậy cho trung bình tổng thể từ 62.84 đến 69.46 Biết σ = 6.50 kích thước mẫu n=100 Hãy tính trung bình mẫu : Khoảng tin cậy trung bình tổng thể 62.84 = X - Zα/2 σ σ ≤ µ ≤ X + Zα/2 = 69.46 n n Giải hệ phương trình, ta có: X = 62.84+69.46 = 132.3 Trung bình mẫu là: X = 66.15 Giá trị p-value sau dẫn đến việc bác bỏ giả thiết H0 α= 0.05?= a 0.150 b 0.100 c 0.051 d 0.025 Là câu d Bác bỏ giả thiết H0 có p- value ≤ α: 0,025 < 0.05 Bài tập Bài 1: Gọi μ số ngày trung bình từ đặt hàng đến giao hàng bán hàng theo phương pháp Ước lượng số ngày trung bình từ đặt hàng đến giao hàng với độ tin cậy 95% , mẫu lớn, chưa biết phương sai tổng thể chung , Sử dụng phân vị Student với khoảng tin cậy sau: X * tα/2; (n-1) * s s ≤ μ ≤ X + tα/2; (n-1) * n n Với s = ∑( X i −X ) n −1 Với số liệu đầu cho ta chạy phần mềm tính toán có số liệu sau: Descriptive statistics Số Page Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh count mean sample variance sample standard deviation minimum maximum range ngày 30 6.13 3.29 1.81 10 1st quartile median 3rd quartile interquartile range mode 5.00 6.00 7.00 2.00 6.00 low extremes low outliers high outliers high extremes 0 0 Confidence interval - mean 95% 6.13 1.81 30 2.045 0.676 6.806 5.454 confidence level mean std dev n t (df = 29) half-width upper confidence limit lower confidence limit Hoặc thực tính toán sau: 30 Ta có: X = ∑ xi /30 = 184/30 = 6.13 i =1 s= ∑( X i −X ) n −1 95.467 29 1.81 Với độ tin cậy 95% tương ứng với mức ý nghĩa α = 0,05 tra bảng t α/2; (n-1) => t α/2; 29 = 2.045 => Ta có: X - tα/2; (n-1) * s s ≤ μ ≤ X + tα/2; (n-1) * n n Page Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung 6.13 − 2.045 Bài tập cá nhân – Môn Thống kê kinh doanh 1.81 1.81 ≤ µ ≤ 6.13 + 2.045 30 30 5.45 ≤ µ ≤ 6.8 Kết luận: Với việc áp dụng phương pháp mới, thời gian trung bình từ đặt hàng đến giao hàng, bán hàng 5.45 – 6.8 ngày so với thời gian trung bình từ đặt hàng đến giao hàng theo phương pháp cũ 7.5 ngày phương pháp nhanh phương pháp cũ phương pháp bán hàng đáp ứng nhu cầu khách hàng nhanh Bài 2: Gọi µ1 , µ2 chi phí trung bình theo phương án Cặp giả thiết cần kiểm định : H0 : µ1 = µ H1 : µ1 ≠ µ2 Descriptive statistics count mean sample variance sample standard deviation minimum maximum range PA 12 29.75 19.84 4.45 24 38 14 standard error of the mean 1.29 1st quartile median 3rd quartile interquartile range mode 26.00 29.00 32.75 6.75 35.00 low extremes low outliers high outliers high extremes 0 0 Page Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh Descriptive statistics count mean sample variance sample standard deviation minimum maximum range PA 14 28.21 20.95 4.58 20 38 18 standard error of the mean 1.22 1st quartile median 3rd quartile interquartile range mode 25.25 28.00 30.00 4.75 25.00 low extremes low outliers high outliers high extremes 0 6/27/2011 12:54.42 (1) Hypothesis Test: Independent Groups (t-test, pooled variance) PA 29.75 PA 28.21 mean Page Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh 4.45 12 4.58 14 24 1.536 20.442 4.521 1.779 0.86 3965 -2.135 5.207 3.671 sample standard deviation n df difference (PA - PA 2) pooled variance pooled std dev standard error of difference hypothesized difference t p-value (two-tailed) confidence interval 95.% lower confidence interval 95.% upper margin of error Với mức ý nghĩa 5% ta có giá trị p-value = 0.3965 > α = 0.05 không bác bỏ giả thiết H o, tức chi phí trung bình hai phương án Bài 3: X = 250 n = 60 S =12 a Kiểm định mức độ tập trung bình quân toàn lô hàng 247 ppm với mức ý nghĩa α = 0.05 Gọi μ mức độ tập trung bình quân bình quân toàn lô hàng Ta kiểm định cặp giả thiết là: H0 : µ1 = 247 H1 : µ1 ≠ 247 Tap chung 250 12 60 Hypothesis Test: Mean vs Hypothesized Value Page Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh 247.00 250.00 12.00 1.55 60 59 hypothesized value mean Tap chung std dev std error n df 1.94 0576 t p-value (two-tailed) 246.90 253.10 3.10 confidence interval 95.% lower confidence interval 95.% upper margin of error Với mức ý nghĩa α = 0.05 giá trị p-value = 0.0576 > α = 0.05 không bác bỏ giả thiết H o, mức độ tập trung bình quân toàn lô hàng 247 ppm Còn với mức ý nghĩa α = 0.01 ta có giá trị p-value = 0.0576 > α = 0.01 không bác bỏ giả thiết Ho, tức mức độ tập trung bình quân toàn lô hàng 247 ppm b Kết luận vào kết kiểm định thống kê có mức độ tập trung bình quân toàn lô hàng 247 ppm, thuốc ko gây tác dụng phụ có hiệu chữa bệnh Lô hàng đảm bảo yêu cầu đưa sử dụng Bài 4: Với số liệu đầu cho, chạy phần mềm tính toán ta có số liệu sau: Regression Analysis r² r Std Error ANOVA table Source Regression Residual Total SS 128.3321 10.8987 139.2308 0.922 0.960 0.995 df 11 12 n k Dep Var MS 128.3321 0.9908 13 Y - Thị phần % F 129.53 p-value 2.00E-07 Page Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh Regression output coefficient variables s Intercept -3.0566 X - Điểm 0.1866 confidence interval std error 0.9710 0.0164 t (df=11) -3.148 11.381 p-value 0093 2.00E-07 95% lower -5.1938 0.1505 95% upper -0.9194 0.2227 ####### ) Ta có hàm: Y = -3.057 + 0.187.Xi b Hàm hồi quy tổng thể: Yi = β0 + β1Xi + ε kiểm định tồn tuyến tính X Y tổng thể cặp giả thiết: H0 : β1 = H1 : β1 ≠ ANOVA table Source SS df MS F p-value 129.53 2.00E-07 Regression 128.3321 128.3321 Residual 10.8987 11 0.9908 Total 139.2308 12 Page Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh Mức ý nghĩa 5% có p-value = 2.00E-10 < α = 0.05 bỏ giả thiết H0 Kết luận X Y tổng thể có mối quan hệ tuyến tính c Như tính R2 = 0.922 = 92% độ phù hợp mô hình tương đối cao Tóm lại, R2 = 92% Sự biến thiên thị phần có giải thích biến đổi chất lượng sản phẩm Page 10 ...Lớp: GaMBA01.X0610 Nguyễn Ngô Thị Chung Bài tập cá nhân – Môn Thống kê kinh doanh muốn kiểm tra xem liệu mức độ tập trung bình quân lô hàng lớn có đạt mức 247 ppm yêu cầu hay... hàng bảo đảm chứa đựng mức độ tập trung bình quân 247 ppm, định bạn vào việc kiểm định giả thiết thống kê? Bài 4: Gần đây, nhóm nghiên cứu tập trung vào vấn đề dự đoán thị phần nhà sản xuất cách... Bài tập cá nhân – Môn Thống kê kinh doanh count mean sample variance sample standard deviation minimum maximum range ngày 30 6.13 3.29 1.81 10 1st quartile median 3rd quartile interquartile range