1 Sai: Tại vì mối liên hệ tương quan được sủ dụng làm thước đo độ lớn trong các mối liên hệ giữa các biến định lượng, Xu hướng biến động qua thời gian chỉ là một trường hợp đặc biệt khi
Trang 1BÀI TẬP THỐNG KÊ VÀ KHOA HỌC QUYẾT ĐỊNH
Học viên: Nguyễn Thành Chung
Lớp: Gamba 01.V03
BÀI LÀM
Câu 1: Lý thuyết (2đ)
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Sai:
Tại vì mối liên hệ tương quan được sủ dụng làm thước đo độ lớn trong các mối liên hệ giữa các biến định lượng, Xu hướng biến động qua thời gian chỉ là một trường hợp đặc biệt khi có một biến là thời gian
2) Sai:
Tại vì Tần suất biểu hiện bằng %
3) Sai:
Tại vì Phương sai cho biết độ biến thiên xung quanh giá trị trung bình của một hiện tượng nghiên cứu
4) Đúng:
Tại vì khoảng tin cậy được tính theo biểu thức: Ẍ ± Z(δ/√n)
5) Đúng:
Tại vì kiểm định trong thống kê là một quá trình tính toán định lượng để đi đến kết luận một giả thiết nào đó có bị bác bỏ hay không
B Chọn phương án trả lời đúng nhất:
1) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng
b) Độ đồng đều của tổng thể chung
c) Phương pháp chọn mẫu
d) Cả a), b), c)
e) Không yếu tố nào cả
2) Ưu điểm của Mốt không phải là:
a) San bằng mọi chênh lệch giữa các lượng biến
b) Không chịu ảnh hưởng của các lượng biến đột xuất
c) Kém nhậy bén với sự biến động của tiêu thức
d) Cả a), c)
e) Cả a), b), c)
3) Đại lượng nào không phản ánh chiều hướng của mối liên hệ tương quan:
a) Hệ số tương quan
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 )
d) Cả a), b)
Trang 2e) Cả a), c).
f) Cả a), b), c)
4) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng
γ d) Cả a), b)
η e) Cả b), c)
f) Cả a), b), c)
5) Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu
b) Sử dụng phương pháp chọn mẫu thích hợp
c) Giảm phương sai của tổng thể chung
d) Cả a), c)
e) Cả a), b)
f) Cả a), b), c)
Câu 2 (2 đ)
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét Để đánh giá tính hiệu quả của nó xét về mặt thời gian người ta phỏng vấn ngẫu nhiên 30 khách hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao hàng như sau:
9
5
3
9
4
6 5 10 7 6
8 7 6 5 8
9 6 6 4 5
7 6 7 5 4
6 7 4 7 3 Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng theo phương pháp mới với độ tin cậy 95% Hãy kết luận về hiệu quả của phương pháp bán hàng mới so với phương pháp cũ Biết rằng phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày
Trả Lời:
1) Các tham số của mẫu:
Sử dụng công cụ Data Analysis của Excel ta có bảng Descriptive như sau:
Column1
Standard Deviation 1.81437428
Trang 3Sample Variance 3.29195402
x= 6.13333333
2) Ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng với độ tin cậy 95% (Ước lượng µ)
Với phương sai mẫu s2 = 3.29195402, độ lệch chuẩn s = 1.81437428, mẫu đủ lớn (n≥30) nên ta sử dụng khoảng tin cậy:
Thay x= 6.13333333,
2
Zα= 1,96 (α = 0,05 nên α/2 = 0,025), s = 1.81437428, n
= 30 ta có:
5.484067832≤ ≤µ 6.782598828
Như vậy, số ngày trung bình từ khi đặt hàng đến khi giao hàng với độ tin cậy 95% nằm trong khoảng từ 5.484067832 đến 6.782598828 ngày
3) Kết luận về hiệu quả của phương pháp bán hàng mới so với phương pháp cũ:
Biết rằng phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày, ta cần kiểm định cặp giả thiết:
H0: µ = 7,5 (Phương pháp mới có hiệu quả như phương pháp cũ)
H1: µ < 7,5 ((Phương pháp mới có hiệu quả hơn phương pháp cũ)
Đây là bài toán kiểm định giả thiết về giá trị trung bình của tổng thể chung khi chưa biết phương sai của tổng thể chung, nhưng mẫu lớn, kiểm định trái, và tiêu chuẩn kiểm định là:
( x 0) n z
s
µ
−
=
Thay vào:
Trang 4(6.13333333 7,5) 30
-4.125687693 1.81437428
Với tiêu chuẩn kiểm định Z0,5-α = Z 4,5 = 1,64
Như vậy Z < - Z0,5-α nên bác bỏ H0, chấp nhận H1,
Kết luận: phương pháp mới hiệu quả hơn phương pháp cũ.
Câu 3 (2 đ)
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Trả Lời:
Cần kiểm định cặp giả thiết:
H0: µ1 = µ2 (Chi phí trung bình 2 phương án như nhau)
H1: µ1 ≠ µ2 (Chi phí trung bình 2 phương án khác nhau)
Tiêu chuẩn kiểm định là (do 2 mẫu nhỏ, chưa biết phương sai của 2 tổng thể):
1 2
1 2
x x t
s
n n
−
=
+
Trong đó s2 là giá trị chung của 2 phương sai mẫu
2 1 1 2 2
1 2
2
s
n n
=
+ −
Phương sai mẫu được tính như sau:
- Mẫu 1 (PA1): Sử dụng công cụ Data Analysis của Excel ta có bảng Descriptive:
Column1
Standard
Trang 5Sample
- Mẫu 2 (PA 2):
Column1
Standard
Sample Variance 20.95055
Ta có:
2 (12 1)*19.84091 (14 1)*20.95055
20.44196429
12 14 2
+ −
29.75 28.21429
0.863410008
4.521279054
12 14
+
Tra bảng tìm 1 2 2 0.02524
2
tα+ − =t =2,064
׀t 1 2 2 0.02524 > ׀
2
n n
tα+ − =t =
2,064 chưa đủ cơ sở bác bỏ H0, tức là tạm chấp nhận phương án H0, hay chi phí trung bình 2 phương án là như nhau
Câu 4 (2 đ)
Có tài liệu về doanh thu của một doanh nghiệp trong 9 năm như sau:
Trang 6Năm Doanh thu (tỷ đồng) 2001
2002 2003 2004 2005 2006 2007 2008 2009
26 28 32 35 40 42 48 51 56
1 Xác định hàm xu thế tuyến tính biểu diễn xu hướng biên động của doanh thu qua thời gian
2 Xác định sai số của mô hình và dự đoán doanh thu năm 2010 dựa vào mô hình trên với xác suất tin cậy 95%
Trả Lời:
Bảng tính Excel theo hàm Regression có kết quả:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,9959
R Square
0,9918 Adjusted R
Square
0,9906 Standard Error
1,0111
ANOVA
Coefficients
Standard
Intercept
20,7778 0,734510839 28,2879117
Trang 73,8000 0,130526001 29,1129734
Vây phương trình biểu diễn doanh thu theo thời gian như sau:
Y = 20,7778 + 3,8 t
Sai số của mô hình:
Syt = 1,0111
Dự doán doanh thu năm 2010:
t = 10 ; L=1
Đầu tiên ta tra bảng với α = 0,05 : bậc tự do 9-2 = 7 có tα= 2,365
Dự đoán điểm: thay t = 10 vào Phương trình:
Y = 58,7778 Khoảng tin cậy dự đoán tính theo công thức:
^
Y ± tα/2,n-2 Syt √1 +1/n + 3(n + 2L -1)²/(n(n²- 1)) Với:
tα/2,n-2 = 2,365 Syt = 1,0111
n = 9
ta có Sai số dự kiến = 2,9555 ==> Cận trên : 61,7333; Cận dưới: 55,8223
Kết luận : Với số liệu đã cho, mức ý nghĩa 5%, dự đoán doanh thu năm 2010 của công ty nằm trong khoảng từ: 55,8223 đến 61,7333 tỷ đồng
Câu 5 (2 đ)
Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây của một nhà máy (đơn vị: triệu tấn)
1 Biểu diễn dữ liệu trên bằng sơ đồ thân lá và rút ra nhận xét từ kết quả đó
2 Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau, vẽ đồ thị hình cột (histogram) và nhận xét thêm
Trả Lời:
1) Biểu diễn bằng biểu đồ thân lá:
Phần thân Phần lá
3 0,3 0,3 0,7 0,8
4 0,5 0,5 0,7 0,7 0,8 0,9
5 0,1 0,2 0,3 0,3 0,7
Trang 86 0,0 0,1 0,1 0,2 0,4 0,4 0,5 0,6
7 0,0 0,2 0,3 0,3 0,5 0,8 0,9
+ Kết luận: Qua biểu đồ thân lá cho thấy mức sản lượng phổ biến nhất là từ 6 tr tấn đến 7tr tấn, số tháng có sản lượng 6-7tr tấn chiếm 50% (15 tháng) trong số 30 tháng Điều này khẳng định rằng: Nhà máy đang vận hành công tác sản xuất có hiệu quả
2) Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau, vẽ đồ thị hình cột (histogram) và nhận xét thêm
a Xây dựng bảng tần số phân bổ với 5 tổ có khoảng cách tổ bằng nhau:
Khoảng cách tổ = (7,9-3,0)/5 = 0,98 làm tròn lên 1
Vậy ta xây dựng bảng tần số phân bổ với 5 tổ với khoảng cách tổ là 1
Khối lượng thép
(triệu tấn)
Trị số giữa (xi)
Tần số (fi)
Tần suất
di (%)
Tần số tích lũy (Si)
b Vẽ đồ thị hình cột (histogram):
c Nhận xét:
Nhận xét:Có 4 tháng khối lượng sản phẩm thép đạt trung bình 3.45 triệu tấn, 6 tháng đạt trung bình 4.68 triệu tấn, 5 tháng đạt trung bình 5.32 triệu tấn, 8 tháng đạt trung bình 6.29 triệu tấn, 7 tháng đạt trung bình 7.43 triệu tấn