Vì tần suất biểu hiện tỷ trọng của từng tổ trong tổng thể và được biểu hiện bằng số tương đối đơn vị tính là lần hoặc %.. Sai Vì Độ lệch chuẩn bằng căn bậc hai của phương sai tức là số b
Trang 1BÀI TẬP CÁ NHÂN MÔN HỌC: THỐNG KÊ TRONG KINH DOANH
HỌ VÀ TÊN: HÀ QUỐC TUẤN
LỚP: GaMBA.X01
CÂU 1:
A Trả Trả lời đúng (Đ), sai (S) cho các câu hỏi sau và giải thích tại sao?
1 Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu (Đúng) Vì: Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tùy theo mục đích khác nhau, do vậy nó phản ánh đặc điểm của từng tổng thể nghiên cứu Tiêu thức thống kê có thể gồm các loại: tiêu thức thuộc tính (giới tính, nghề nghiệp, ngành nghề kinh tế), tiêu thức số lượng (số nhân khẩu, tiền lương, ), tiêu thức thay phiên (nam, nữ )
2 Tần suất biểu hiện bằng số tuyệt đối (Sai) Vì tần suất biểu hiện tỷ trọng của từng tổ trong tổng thể và được biểu hiện bằng số tương đối (đơn vị tính là lần hoặc %)
3 Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại (Sai)
Vì Độ lệch chuẩn bằng căn bậc hai của phương sai (tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó) Nó dung để so sánh độ biến thiên vè tiêu thức nghiên cứu của hai hiện tượng cùng loại và có số trung bình bằng nhau
4 Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ nghịch với phương sai của tổng thể (Sai)
Vì khoảng tin cậy cho tham số của tổng thể chung được tính theo công thức:
(Trong đó là trung bình của tham số trong tổng thể chung)
Khi σ tăng (hoặc giảm) trong khi và n không đổi, khoảng tin cậy của tham số của tổng thể chung tăng (hoặc giảm) Như vậy khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của tổng thể
5 Phương pháp dãy số bình quân trượt không nên dung trong dãy số có biến động thời vụ (Đúng)
Vì: Phương pháp dãy số bình quân trượt sử dụng để san bằng dãy số có nhiều biến động ngẫu nhiên, phương pháp này làm trơn nhẵn biến động thực tế nên
ko dùng với dãy số có biến động thời vụ mà thường dùng với dãy số theo năm
Trang 2B Chọn phương án trả lời đúng nhất:
1 Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm: a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
c) Loại bỏ tác động của các yếu tố ngẫu nhiên
d) Không có điều nào ở trên
Đáp án: d
2 ưu điểm của Mốt là:
a) San bằng chênh mọi chênh lệch giữa các lượng biến
b) Không chịu ảnh hưởng của các biến đột xuất
c) Kém nhạy bén với sự biến động của tiêu thức
d) cả a), b)
e) cả a),b),c)
Đáp án: b
3 Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan: a) Hệ số tương quan
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 )
d) Cả a), b)
e) Cả a), c)
f) Cả a), b), c)
Đáp án e
4 Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện độ rộng của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Đáp án: e
5.Các biện pháp hạn chế sai số chọn mẫu
a, Tăng số đơn vị tổng thể mẫu
b, Sử dụng phương pháp chọn mẫu thích hợp
c, Giảm phương sai tổng thể chung
d, Cả a, c
Đáp án b
CÂU 2:
Trang 31 Gọi X là số sản phầm công nhân hoàn thành trong 1 giờ làm việc Theo giả thiết X phân phối chuẩn với σ= 6 Vậy số sản phẩm trung bình công nhân hoàn thành trong 1 giờ là µ đây là bài tóan ước lượng khỏang tin cậy đối xứng của tham
số µ khi đã biết phương sai Công thức ước lượng là:
Theo giả thiết đầu bài ta có sai số khoảng ước lượng bằng 1 sản phẩm và độ tin cậy 95% (mức ý nghĩa α = 5%), độ lệch tiêu chuẩn б = 6 sản phẩm, tính số công nhân cần điều tra (n)
=> Zα /2* = 1
Tra bảng Z ta có Z0,025 =1,96, thay vào công thức ta có:
1,96*6/√n =1
n = 138,29
Như vậy, cần điều tra với 139 công nhân để đạt định mức
2 Ước lượng năng suất trung bình 1 giờ của toàn bộ công nhân với độ tin cậy 95%, (cỡ mẫu theo kết quả câu 1) là n = 39; sảm phẩm mà họ hoàn thành trong một giờ ( ) là 35 với độ lệch tiêu chuẩn là (s) 6,5
Đây là bài toán ước lượng trung bình (µ) đối xứng khi chưa biết độ lệch tiêu chuẩn của tổng thể chung Công thức ước lượng là:
n
s t
X n
s t
X − α/2;(n−1) ≤µ ≤ + α/2;(n−1)
Tra bảng ta có t0,025(138) = 1,978
=> 35 - 1,978 * 6,5/√139 ≤ µ ≤ 35 + 1,978* 6,5/√139
33,91 ≤ µ ≤ 36,09
Trang 4Như vậy, với độ tin cậy 95%, năng suất trung bình một giờ của toàn bộ công nhân nằm trong khoảng từ 33,91 sản phẩm đến 36,09 sản phẩm
CÂU 3:
Gọi X1 là chi phí của Phương án 1, Gọi X2 là chi phí của phương án 2 theo giả thiết đầu bài X1 và X2 phân phối chuẩn với σ2
1 và σ2
2 chưa biết Vậy chi phí trung bình theo các phương án đó µ1 và µ2, đây là bài toán kiểm định với cặp giả thiết cần kiểm định là:
Ho: µ1 = µ2 (chi phí trung bình của 2 phương án là như nhau) H1: µ1 # µ2 (chi phí trung bình của 2 phương án là khác nhau) khi chưa biết σ2
1 và σ2
2 và n1, n2 <30, ta áp dụng tiêu chuẩn kiểm định:
X 1 X 1 (x 1i -X 1 ) 2 X 2 X 2 (x 2i -X 2 ) 2
Từ công thức kiểm định
Trang 5Trong đó:
2
) 1 ( ) 1 (
2 1
2 2 2
2 1 1
2
− +
− +
−
=
n n
S n
S n
2
) (
) (
2 1
2 2 2
2 1 1
− +
− +
∑
n n
X Xi X
Xi
Thay số ta có
2 12 10
36 , 272 25 , 218
2
− +
+
=
863 , 0 14
44 , 20 12
44 , 20
21 , 28 75 , 29
2
2 1
2 2
+
−
= +
−
=
n
S n S
X X tqs
Tra bảng tìm giá trị: tα/ 2 (n1+n2− 2 )
Ta có kiểm định với độ tin cậy 95% => α = 5 %; α / 2 = 2 , 5 %
064 , 2 ) 2 ( 2 / n1+n2− =
tα
ta có biểu đồ khoảng tin cậy
Nhìn vào đồ thị khoảng tin cậy ta thấy giá trị của tqs không thuộc miền bác bỏ Do vậy, chưa có đủ căn cứ để bác bỏ giả thiết Ho và chấp nhận giả thiết H1
Như vậy với 2 mẫu đã điều tra, ở mức ý nghĩ 5% chưa có đủ cơ sở kết luận chi phí trung bình của hai phương án là khác nhau
CÂU 4:
1 Sơ đồ thân lá:
3 0 7 8
4 9 5 7 7 8 5
5 7 3 1 3 2
6 1 4 2 4 6 5 0 1
7 0 3 8 5 2 9 3
12 3
2,064
0,863 -0,863
Trang 62 Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu:
3 Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Để có thể nhận biết biến đột xuất ta vẽ biểu đồ Hộp ria mèo (Box plot) để xác định:
Từ bộ dữ liệu đã cho ta tính được Q1 = 4,83 ; Q2 = 6,05 ; Q3 = 6,90
=> IQR = Q3 - Q1 = 6,9 - 4,83 = 2,07
Sơ đồ Hộp ria mèo:
Như vậy, trong bộ dữ liệu có giá trị 12,3 nằm trong khoảng nghi ngờ là biến đột suất (10,01 đến 13,13) Do vậy chưa kết luận đươc trong bộ dữ liệu trên có dữ liệu đọt suất
4 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả và giải thích
a Khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra:
Áp dụng công thức:
Trang 7
b Khối lượng than trung bình khai thác được trong 1 tháng từ bảng phân bổ tần số:
Ta có:
Áp dụng công thức:
= 177/30 = 5,90 Như vậy số bình quân từ tài liệu điều tra (a) lớn hơn số bình quân tính từ bảng phân bổ tần số (b) vì (b) lấy trị số giữa của tôt là 7,5 nhưng có một biến trong
tổ có trị số 12,3 đã được đưa về trị số thấp hơn rất nhiều (7,5)
CÂU 5:
1
Gọi X là % tăng lên của chi phí quảng cáo
Gọi Y là %tăng lên của doan thu
Với dữ liệu đã cho với mức độ tin cậy là 90% ta có bảng dữ liệu sau :
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9770
R Square 0.9545
Adjusted R
Square 0.9393
Standard
Observations 5
ANOVA
Khối luợng than khai thác giữa (Xi) Trị số Tần số (fi) Xi*fi
Trang 8df SS MS F Significanc e F
Regression 1 2.1953 2.1953 62.8839 0.00418
Residual 3 0.1047 0.0349
Coefficient
s Standard Error t Stat P-value Lower 95% Upper 95% 95.0% Lower 95.0% Upper
Intercept 2.0676 0.1765 11.7173 0.00134 1.5060 2.6291 1.5060 2.6291
%t?ng CF
QC 0.3851 0.0486 7.9299 0.00418 0.2306 0.5397 0.2306 0.5397
Như vậy b0 = 2,0676 ; b1 = 0,3851
Ta có phương trình hồi quy tuyến tính như sau:
= 2,0676 + 0,3851 X
Khi chi phí quảng cáo tăng 1% thì doanh thu sẽ tăng khoảng 0,3851%
Khi chi phí quảng cáo là bằng 0 thì doanh thu tối thiểu ở mức 2,0676%
Sai số chuẩn của mô hình là Sxy = 0,1868
Hàm số có mối liên hệ tỷ lệ thuận
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và phần trăm tăng doanh thu thực sự có mối liên hệ tương quan tuyến tinh hay không?
Dùng tiêu chuẩn kiểm định T – Student để kiểm định hệ số hồi quy β1 với ý nghĩa liệu thực sự có mối liên hệ tuyến tính giữa X (% tăng chi phí quảng cáo) với Y (% tăng doanh thu) hay không?
Ta có cặp giả thiết kiểm định: Ho β1= 0 không có mối liên hệ tuyến tính
H1 β1≠ 0 có mối liên hệ tuyến tính Công thức kiểm định:
B1- β1
tqs =
-Sb1 Với n-2 bậc tự do
Theo kết quả chạy Exell ở câu 1 với xác suất độ tin cậy là 90%
Ta có
0,3851
tqs = - = 7,9299
0,0486
tqs = 7,9299 ứng với giá trị α = 0,00418 <0,1
Trang 9ta có biểu đồ khoảng tin cậy
Có nghĩa là giá trị của tqs thuộc miền bác bỏ do vậy có cở sở để bác bỏ giả thiết Ho chấp nhận giả thiết H1 Điều này có nghĩa là: giữa % tăng chi phí quảng cáo và phần trăm tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình
Căn cứ kết quả đã tính toán ở câu 1 ta có
R = 0, 9770 cho thấy hàm số có mối liên hệ giữa giữa % tăng chi phí quảng cáo và phần trăm tăng doanh thu rất chặt chẽ và đây là mối liên hệ tỷ lệ thuận
R2= 0,9545 có nghĩa là 95,45% sự thay đổi của Y (% tăng doanh thu) sẽ được giải thích bới 97,70% sư thay đổi của X (% tăng chi phí quảng cáo)
4 hãy ước đoán tỷ lệ tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với
xác suất độ tin cậy là 90%
STT % tăng chi phí
quảng cáo (X) % tăng doanh thu (Y) (Xi- X)
2
= (1+2+6+4+3)/5= 3,2
Từ phương trình hồi quy
= 2,0676 + 0,3851 X
0,05
0,00209 -0,00209
Trang 10Với % tăng chi phí quảng cáo là 5% ta có :
Y 5 = 2,0676 + 0,3851*5= 3,9931
* Ta có dự đoán điểm : Y5 = 3,9931
* Đây là ước lượng khoảng tin cậy cho 1 giá trị cá biệt của Y (Y5 ) tại một giá trị cá biệt của X (X5) , do vậy sai số dự đoán được tính theo công thức :
∑
=
−
−
− +
+
⋅
i i
i yx
n
X X
X X n S
t
1
2
2 2
; 2 /
1 1
α
Tra bảng t với số bậc tự do =3, mức ý nghĩa 10% (2 phía) ta có t=2.353
Syx = 0,1868 ; n = 5 ; = 3,2
Sai số dự đoán là:: 2.353* 0,1868* ( )
∑
=
− +
1
2
8 , 14
2 , 3 5 5
1 1
i
Sai số dự đóa là : 0,5236
Cận trên là : 3,9931+ 0,5236= 4,5167
Cận dưới là : 3,9931- 0,5236= 3,4695
Kết luận: Với độ tin cậy 90%, khi chi phí quảng cáo tăng 5% thì doanh
thu tăng trong khoảng từ 3,4695% đến 4,5167%