1 Hệ số hồi quy b1 phản ánh cả chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả 2 Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ thuận với
Trang 1BÀI TẬP CÁ NHÂN
Môn học: Thống kê và khoa học quyết định
Học viên: Trần Thị Việt Anh
Nghệ An, tháng 6/2011
Trang 2ĐỀ BÀI
Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Hệ số hồi quy (b1) phản ánh cả chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả
2) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ thuận với phương sai của tổng thể chung đó
3) Phương sai là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại
4) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối
5) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
B Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để phân tích kết cấu của hiện tượng
γ d) Cả a), b)
η e) Cả b), c)
f) Cả a), b), c)
2) Đại lượng nào không phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
a) Hệ số tương quan
b) Hệ số chặn (b0)
c) Hệ số hồi quy (b1)
d) Cả a), b)
ι e) Cả a), c)
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng
b) Độ đồng đều của tổng thể chung
c) Tiêu thức nghiên cứu
d) Cả a), b)
e) Cả a), b), c)
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
ϕ e) Cả a), c)
κ f) Cả a), d)
5) Biểu đồ hình cột (Histograms) có đặc điểm:
Trang 3a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được bao nhiêu sản phẩm để đặt định mức Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng 1,5 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta
độ lệch tiêu chuẩn về năng suất trong một giờ là 8 sản phẩm Hãy tính số công nhân cần được điều tra để đặt định mức
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà
họ hoàn thành trong 1 giờ là 45 với độ lệch tiêu chuẩn là 7,5 Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Câu 3 (1,5đ)
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng than khai thác được trong 50 tháng gần đây của một nhà máy (đơn vị: triệu tấn):
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2 Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên
3 Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
4 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và
từ bảng phân bố tần số So sánh kết quả và giải thích
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu Hãng cho phép tăng chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:
Trang 4% tăng doanh thu 2 3 4,5 3,5 3 5 2,5 2 6
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính không?
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên
4 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo
là 7% với độ tin cậy 90%
BÀI LÀM
Câu 1: Lý thuyết
A Trả lời đúng (Đ), sai (S) và giải thích tại sao?
1) Hệ số hồi quy (b1) phản ánh cả chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả (Đ)
Giải thích: b1 là độ dốc của đường hồi quy, thể hiện mức thay đổi của biến kết quả (Y) khi biến nguyên nghân (X) thay đổi 1 đơn vị; b1 cũng phản ánh cả chiều hướng ảnh hưởng của tiêu thức nguyên nhân đến kết quả: Nếu b1 mang dấu (+) phản ánh mối liên quan tuyến tính thuận của biến nguyên nhân lên biến kết quả, nếu b1 mang dấu (-) phản ánh mối liên quan tuyến tính nghịch
2) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ thuận với phương sai của tổng thể chung đó (S)
Giải thích: Phương sai là số trung bình cộng của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó Phương sai cho biết độ biến thiên xung quanh giá trị trung bình Phương sai không làm ảnh hưởng đến khoảng tin cậy cho một tham số nào đó của tổng thể chung
3) Phương sai là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại (S)
Giải thích: Phương sai là chỉ tiêu cho biết độ biến thiên xung quanh giá trị trung bình của các lượng biến, thường dùng để đánh giá độ biến thiên của tiêu thức Phương sai không có đơn vị tính thích hợp và khuếch đại trị số vì là bình phương các sai số
4) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối (Đ)
Giải thích: Tần số là biểu thị trị số quan sát được trong mỗi tổ Tổng tần tần số là tổng số đơn vị của tổng thể Do số tần số biểu hiện là số tuyệt đối
5) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu (Đ)
Giải thích: Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tùy theo mục đích nghiên cứu khác nhau Ví dụ: Tiêu thức thuộc tính phản ánh các thuộc tính của đơn vị tổng thể; Tiêu thức số lượng phản ánh các đặc điểm về số lượng của đơn vị tổng thể
B Chọn phương án trả lời đúng nhất:
Trang 51) Phân tích dãy số thời gian có tác dụng:
f) Cả a), b), c)
2) Đại lượng nào không phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
d) Cả a), b)
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
e) Cả a), b), c)
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
d) Hệ số biến thiên
5) Biểu đồ hình cột (Histograms) có đặc điểm:
e) Cả b) và c) đều đúng
Câu 2:
a Tính số công nhân cần được điều tra để đặt định mức:
Đây là bài toán xác định cỡ mẫu (n): n = 2/ 2 22
Error
Zα σ
Trong đó: - Sai số: Error = 1,5
- Độ lệch tiêu chuẩn Ϭ = 8
- α = 5% → Tra bảng Z có Zα/2 = 1,96
n = 2/ 2 22
Error
Zα σ =
2
2 2
5 , 1
8
* 96 , 1
= 109,272 ≈ 110 (người)
Kết luận: Số công nhân cần được điều tra để đặt định mức là 110 công nhân
b Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Ta có: n = 110; S = 7,5; X = 45; α = 0,05
Trong đó: - n : cỡ mẫu
- S : độ lệch tiêu chuẩn của mẫu
- X : trung bình mẫu
- t(α/2;n-1) = t0,025;109 = 1,982
Gọi μ là năng suất trung bình một giờ của toàn bộ công nhân
Đây là bài toán ước lượng số trung bình của tổng thể chung khi chưa biết Ϭ
μ = X ± t(α/2;n-1)*
n
S
= 45 ± 1,982 x
110
5 , 7
= 45 ± 1,4173
→ 43,5827 ≤ μ ≤ 46,4173
Kết luận: Với mẫu đã điều tra ở độ tin cậy 95%, có thể nói rằng năng suất trung bình của toàn bộ công nhân nằm trong khoảng từ 43,5827 đến 46,4173 sản phẩm/giờ
Câu 3:
Để có kết luận về 2 phương án sản xuất ta xem xét chi phí sản xuất trung bình của 2
PA như thế nào: Kiểm định xem chi phí sản xuất trung bình của PA2 có bằng PA1 không?
Gọi μ1 và μ2 lần lượt là chi phí trung bình của Phương án 1 và Phương án 2
- Ta có cặp giả thiết cần kiểm định:
H0: μ1 = μ2 (chi phí sản xuất trung bình của 2 PA là bằng nhau)
H1: μ1 ≠ μ2 (chi phí sản xuất trung bình của 2 PA không bằng nhau)
Trang 6- Tiêu chuẩn kiểm định: Đây là trường hợp kiểm định so sánh 2 giá trị trung bình của 2 tổng thể chung (trường hợp 2 mẫu độc lập), khi chưa biết độ lệch tiêu chuẩn (ϭ) của 2 tổng thể chung, mẫu nhỏ, tổng thể phân phối chuẩn; kiểm định 2 phía
Với độ tin cậy 95%, ta có kết quả trên Exel như sau:
t-Test: Two-Sample Assuming Equal Variances
P/A 1 P/A 2
Hypothesized Mean Difference 0
P(T<=t) one-tail 0,1587
t Critical one-tail 1,6991
P(T<=t) two-tail 0,3174
t Critical two-tail 2,0452
Tiêu chuẩn kiểm định:
(
) (
) (
2 1 2
2 1 2 1
n n S
X X
−
−
16
1 15
1 ( 948 , 18
) 875 , 27 467 , 29 (
+
−
2
1, X
X là trung bình mẫu tương ứng của PA1 và PA2
Sp2 là phương sai chung của 2 mẫu
n1, n2 là kích thước mẫu tương ứng của PA1 và PA2
n1 = 15, n2 = 16, df = n1 + n2 – 2, α = 0,05
Giá trị kiểm định: tα/2;(n1+n2-2) = ± 2,045
t = 1,0174 → t không thuộc miền bác bỏ ở mức ý nghĩa α = 0,05
→ chưa đủ cơ sở bác bỏ giả thiết Ho
Kết luận: Với 2 mẫu sản xuất thử ở 2 phương án trên, ở mức ý nghĩa 5%, chưa đủ cơ sở bác bỏ giả thiết Ho, hay không thể kết luận chi phí sản xuất trung bình của PA1 và PA2 là khác nhau.
Câu 4:
1 Biểu diễn tập hợp số liệu bằng biểu đồ thân lá
Stem and leaf
8
Trang 79 10
2 Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên
Khối lượng than khai thác (triệu tấn) Tần số (Số tháng) Tần suất (%)
3 Nhận xét:
Từ biểu đồ thân lá và bảng tần số phân bố đã xây dựng, có thể nhận thấy rằng bộ dữ liệu đã cho có dữ liệu đột xuất là 11,5 (triệu tấn) và 12,3 (triệu tấn), và có thể nhận định rằng khối lượng than khai thác bình quân/tháng nằm trong khoảng từ 5 triệu tấn đến dưới 8 triệu tấn
4 Tính khối lượng than trung bình khai thác được trong 1 tháng
a Dựa trên các số liệu ban đầu:
=
= ∑
=
n
x X
n
50
3 ,
303 = (triệu tấn)
b Dựa trên bảng tần số phân bố:
Khối lượng than khai thác (triệu
tấn)
Số tháng ( f i ) Trị số giữa ( x i ) x i f i
Dựa vào bảng tần số phân bố ta có:
Trang 8∑
=
=
= n
i i
n
i
i i f
f x X
1
50
0 ,
309 = (triệu tấn)
Câu 5: Tính toán theo hàm Thống kê Regression trên Exel, ta có kết quả sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,939068
R Square 0,881848
Adjusted R
Square 0,864970
Standard
Error 0,511489
Observations 9
ANOVA
Regression 1 13,668651 13,668651 52,245937 0,000173
Residual 7 1,831349 0,261621
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 90,0% Upper 90,0%
Intercept 0,974868 0,388732 2,507812 0,0405264 0,055662 1,894074 0,238384 1,711352
X 0,658730 0,091134 7,228135 0,0001732 0,443232 0,874228 0,486069 0,831391
1 Từ bộ số liệu thu được ở trên ta thấy đây là mô hình hồi quy tuyến tính có công thức:
Ŷi = bo + b1Xi Trong đó: - Ŷ là biến phụ thuộc chỉ % tăng doanh thu
- Xi là biến độc lập % tăng chi phí quảng cáo
Tính toán theo hàm Regression, ta có kết quả từ Exel như sau: b0 = 0,975; b1 = 0,659;
Phương trình hồi quy biểu diễn mối liên hệ giữa % tăng doanh thu và % tăng chi phí
quảng cáo có dạng sau: Ŷ = 0,975 + 0,659X i
Từ công thức trên ta thấy rằng:
Với bo = 0,975:
Với b1: Phản ánh mức ảnh hưởng cụ thể của % tăng chi phí quảng cáo tới % tăng doanh thu: Cứ tăng thêm 1% chi phí quảng cáo thì mô hình dự đoán rằng doanh thu tăng thêm được 0,659%
2 Kiểm định mối liên hệ thực tế giữa % tăng chi phí quảng cáo và % tăng doanh thu: β1
Ta có : n = 9, α = 0,05 Cặp giả thiết cần kiểm định:
H0: β1 = 0 (không có mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu)
H1: β1 ≠ 0 (có mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu)
Tiêu chuẩn kiểm định: t1 = b1/Sb1 = 0,659/0,0911 = 7,228
Trang 9t1 = 7,228 tương ứng với α1 = 0,00017 < 0,05 → t thuộc miền bác bỏ
→ Quyết định bác bỏ giả thiết H0, nhận giả thiết H1
Kết luận: Với độ tin cậy 95% thực sự có mối liên hệ tương quan tuyến tính giữa % tăng chi phí quảng cáo và % tăng doanh thu.
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình
- Đánh giá sự phù hợp của mô hình: Hệ số xác định: r² = 0,8818: mô hình trên chỉ
ra rằng 88,18 % sự thay đổi của % tăng doanh thu được giải thích bởi % tăng chi phí quảng cáo
- Đánh giá cường độ của mối liên hệ: Hệ số tương quan: r = r2 = 0,939 > 0,9: mối liên hệ % tăng chi phí quảng cáo và % tăng doanh thu là mối liên hệ tương quan tuyến tính thuận và rất chặt chẽ
4 Dự đoán tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí QC là 7% với độ tin cậy 90%:
Ta có n = 9, α = 10% → tα/2;(n-2) = 1,894
* Dự đoán giá trị trung bình Y*khi X* = 7 (%)
% tăng chi phí
quảng cáo % tăng doanh thu
=
X 3,83
∑
=
−
−
− +
±
i yx
n i
X X
X X n x xS t
Y
Y
1
2
2 )
2 ( 2 /
*
) (
) (
1 ˆ
α
- Dự đoán điểm: Yˆ i = 0,975 + 0,659 x 7 = 5,586
- Sai số dự đoán:
∑
=
−
−
− + n
i i
i yx
n
X X
X X n x
xS
t
1
2
2 )
2
(
2
/
) (
) (
1
5 , 31
) 83 , 3 7 ( 9
1+ − 2
= 0,635
→ 4,951 ≤ Y*≤ 6,221
Như vậy với độ tin cậy 90%, khi chi phí quảng cáo tăng 7% thì doanh thu được dự báo là tăng khoảng từ 4,951% đến 6,221%.
Nghệ An, ngày 10 tháng 6 năm 2011
2
) ( Xi − X
Trang 10Người thực hiện Trần Thị Việt Anh
DANH MỤC TÀI LIỆU THAM KHẢO
+ Bài giảng của Giáo viên PGS.TS Trần Thị Kim Thu
+ Giáo trình môn học Thống kê trong kinh doanh của Đại học GRIGGS