BÀITẬP CÁ NHÂN THỐNGKÊ TRONG KINH DOANH Học Viên: Phạm Quang Dũng Lớp : M0211 I Trả lời câu hỏi sau đây: Diện tích nằm đường mật độ phân phân phối chuẩn hóa hai điểm -1.75 có hàm F(X) biểu diễn: P(-1.75 < X < 0) Theo phân phối chuẩn có giá trị tương ứng P(-1.75 < X < 0), cho kết hình Theo ta có diện tích nằm đường mật độ phân phối chuẩn hóa là: (0.9599 - 0.0401)/2 = 0.4599 Gọi số IQ biến ngẫu nhiên X, Tính P (68 < X < 132): Theo kết ta có: P (68 < X < 132) = 0.9772 - 0.0228 = 0.9545 Nếu độ tin giảm đi, khoảng tin cậy rộng hay hẹp lại? Theo công thức ước lượng khoảng tin cậy: X − tα / 2,n −1 s n ≤ µ ≤ X + tα / 2,n −1 s n Kết luận: Nếu giảm độ tin cậy khoảng tin cậy rộng Giả sử khoảng tin cậy cho trung bình tổng thể từ 62.84 đến 69.46 biết σ =6.5 kích thước mẫu n=100 Tính trung bình mẫu Thay số vào công thức ước lượng khoảng tin cậy biết phương sai ta có: x =62.84+69.46=132.3, suy x = 132.3/2=66.15 Chọn: Phương án (d: 0.025) Vì: Nếu p-value≤ α bác bỏ giả thiết H0 Nếu p-value ≥ α không bác bỏ giả thiết H0 Vậy việc bác bỏ giả thiết H0 có giá trị p-value=0.025 ≤ α=0.05 II Hoàn thành tập sau Bài Với số lượng ngẫu nhiên 30 khách hàng ta có bảng sau: Descriptive statistics #1 #2 #3 #4 #5 #6 count mean 6.00 6.80 6.80 5 6.00 5.80 5.40 population variance population standard deviation 6.40 2.53 2.96 1.72 1.36 1.17 2.80 1.36 1.67 1.17 2.64 1.62 confidence interval 95.% lower 2.49 confidence interval 95.% upper 9.51 half-width 3.51 4.41 9.19 2.39 5.18 8.42 1.62 3.68 4.18 8.32 7.42 2.32 1.62 3.14 7.66 2.26 Số ngày trung bình theo phương pháp với độ tin cậy 95% là: 5.40 < µ < 6.80 Với theo phương pháp cũ có số ngày trung bình 7,5 ngày Theo phương pháp số ngày trung bình nằm khoảng Do đó, sử dụng phương pháp có hiệu Bàisố Cho mức ý nghĩa 5% hai phương án sản xuất phân phối theo quy luật chuẩn, rút kết luận hai phương án sản xuất loại sản phẩm Descriptive statistics count mean sample variance sample standard deviation minimum maximum range 1st quartile median 3rd quartile interquartile range mode low extremes low outliers high outliers high extremes Phương án A 12 29.75 19.84 4.45 24 38 14 Phương án B 14 28.21 20.95 4.58 20 38 18 26.00 29.00 32.75 6.75 35.00 25.25 28.00 30.00 4.75 25.00 0 0 0 Ở đây, giả sử rằng: X chi phí cho phương án A: X ~ N(µ1,σ12) Y chi phí cho phương án B: Y ~ N(µ2,σ22) H : µ1 = µ H : µ1 ≠ µ Tiến hành kiểm định cặp giả thiết sau: X = 29.75; S1 = 4.45 Y = 28.21; S = 4.58 Vì S1và S2 không khác nhiều => dùng phương sai hỗn hợp (pooled variance) Một số nhận xét, kết luận sau phân tích thốngkê mô tả sử dụng đồ thị phân tích số liệu thốngkê phương án kiểm định phương án sản xuất trên: - Phương án A (12 quan sát) có chi phí trung bình cao phương án B (14 quan sát), phương án A: 29.12 ngàn đồng phương án B: 28.21 ngàn đồng - Độ lệch chuẩn phương án A phương án B khác không đáng kể, coi (phương án A: 4.45, phương án B: 4.58) - Khoảng tứ phân vị phương án A 6.75 lớn phương án B (4.75) Tứ phân vị thứ trung vị 02 phương án chênh lệch khoảng 1.0 (phương án A cao hơn) - Trên biểu đồ rải điểm hộp ria mèo phương án A B có phân bố gần với phân bố chuẩn, nhiên phương án A bị cong xuống tức lệch sang phải, giá trị ngoại lai hay đột xuất Rải điểm phương án B thẳng phân phối phương án B chuẩn hơn, có 01 giá trị ngoại lai - Theo giả thiết chi phí phương án sản xuất phân phối theo quy luật chuẩn với mức ý nghĩa 5% sở sử dụng kiểm định giả thuyết cho trường hợp độ lệch chuẩn phương án coi khác (có thể dùng phương sai hỗn hợp -pooled unequal variance) cho kết số p-value ứng với kiểm định t 0.86-0.87 gần sai khác ~0.396% >α ⇒ Chấp nhận giả thiết H0 (Chi phí trung bình phương án sản xuất nhau) Hypothesis Test: Independent Groups (t-test, pooled variance) p/a A 29.75 4.45 12 p/a B 28.21 4.58 14 24 1.536 20.442 4.521 1.779 0.86 3965 mean std dev n df difference (p/a A - p/a B) pooled variance pooled std dev standard error of difference hypothesized difference t p-value (two-tailed) Hypothesis Test: Independent Groups (t-test, unequal variance) p/a A 29.75 4.45 12 p/a B 28.21 4.58 14 23 1.536 mean std dev n df difference (p/a A - p/a B) 1.775 standard error of difference hypothesized difference 0.87 t 3958 p-value (two-tailed) Bài Kiểm định mức độ tập trung bình quân toàn lô hàng: Hypothesis Test: Mean vs Hypothesized Value 247.00 250.00 12.00 1.55 60 59 hypothesized value mean ppm std dev std error N Df 1.94 0576 T p-value (two-tailed) 246.90 253.10 3.10 confidence interval 95.% lower confidence interval 95.% upper margin of error Hypothesis Test: Mean vs Hypothesized Value 247.00 250.00 12.00 1.55 60 59 hypothesized value mean ppm std dev std error N Df 1.94 0576 T p-value (two-tailed) 245.88 254.12 4.12 confidence interval 99.% lower confidence interval 99.% upper margin of error Với hai giá trị α =0.05 α =0.01 ta có kết trên: Có p-value = 0.0567 So sánh giá trị p-value α hai trường hợp p-value > α -> Không có sở để bác bỏ H0 Kết luận: Không có chứng để nhà xản xuất kiểm tra xem liệu mức độ tập trung bình quân lô hàng lớn đạt mức 247ppm yêu cầu Bài a Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn thị phần chất lượng sản phẩm? Kết luận Regression Analysis R² r Std 0.922 0.960 0.995 n 13 k Dep Var Y df MS Error ANOVA table Source SS Regression Residual Total 128.332 1 10.8987 11 139.230 12 F p- value 128.3321 129.53 2.00E07 0.9908 Regression output variables coefficients std Intercept error (df=11) 0.9710 -3.148 value 0093 0.0164 5.1938 2.00E- 0.1505 0.2227 X -3.0566 0.1866 t p- 11.381 confidence interval 95% 95% upper lower - -0.9194 07 Với kết ta so sánh p-value < α -> Bác bỏ giả thiết H Đi đến kết luận thị phần chất lượng sản phẩm có mối quan hệ hồi quy đơn tuyến tính Điều cho biết chất lượng tăng lên điểm thị phần tăng lên 0.1866% tương ứng b Kiểm định mối liên hệ tương quan tuyến tính X Y Cặp giả thiết: H0: β1=0 (không có mối liên hệ tương quan tuyến tính) H1: β1≠0 (có mối liên hệ tương quan tuyến tính) Với t(α/2, n-2) = t(2,5%; 11) = 2.201 :t=11.381 -> Bác bỏ giả thiết H0, chấp nhận giả thiết H1 Kết luận: Thị phần có mối liên hệ tuyến tính với chất lượng sản phẩm ngược lại c Cho biết hệ số R2 giải thích ý nghĩa nó: R2 hệ số xác định đo lường phần biến thiên Y (thị phần) giải thích biến độc lập X (chất lượng sản phẩm) R2 có giá trị từ đến 100% (hay 1) Giá trị R2 cao dấu hiệu cho thấy mối liên hệ hai biến số thị phần chất lượng sản phẩm chặt chẽ Ta có công thức : R2 = SSR SST Theo kết bảng Excel cho thấy R2 = 0,92, tức 92% thay đổi chất lượng sản phẩm giải thích mô hình với thị phần R = 0,96 chứng tỏ mối quan hệ chất lượng sản phẩm thị phần mối tương quan thuận chặt chẽ TÀI LIỆU THAM KHẢO Thốngkê khoa học định, Chương trình đạo tạo Thạc sĩ Quản trị Kinh doanh Quốc tế Giáo trình nguyên lý Thốngkê Kinh tế, Đại học Kinh tế Thành phố Hồ Chí Minh, 2010 http://tailieu.vn/tag/tailieu/nguy%C3%AAn%20l%C3%BD%20th %E1%BB%91ng%20k%C3%AA.html http://www.ebook.edu.vn/?page=1.12&view=4129 ... tương quan thuận chặt chẽ TÀI LIỆU THAM KHẢO Thống kê khoa học định, Chương trình đạo tạo Thạc sĩ Quản trị Kinh doanh Quốc tế Giáo trình nguyên lý Thống kê Kinh tế, Đại học Kinh tế Thành phố Hồ Chí... Một số nhận xét, kết luận sau phân tích thống kê mô tả sử dụng đồ thị phân tích số liệu thống kê phương án kiểm định phương án sản xuất trên: - Phương án A (12 quan sát) có chi phí trung bình... kiểm định cặp giả thiết sau: X = 29.75; S1 = 4.45 Y = 28.21; S = 4.58 Vì S1và S2 không khác nhiều => dùng phương sai hỗn hợp (pooled variance) Một số nhận xét, kết luận sau phân tích thống kê