Liên hệ tương quan giữa hai chỉ tiêu là mối liên hệ ước tính từ một tập chuỗi các cặp quan sát của hai chỉ tiêu này, chứ không phải trên từng đơn vị cá biệt.. 3 Phương sai cho phép so sá
Trang 1BÀI TẬP CÁ NHÂN
Họ tên: Nguyễn Thị Thu Hương
Líp: GaMBA X0410.
NỘI DUNG BÀI TẬP
Câu 1: Lý thuyết (2đ)
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Liên hệ tương quan là mối liên hệ biểu hiện rõ trên từng đơn vị cá biệt
SAI Liên hệ tương quan giữa hai chỉ tiêu là mối liên hệ ước tính từ một tập chuỗi các cặp quan sát của hai chỉ tiêu này, chứ không phải trên từng đơn vị cá biệt
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối
ĐÚNG Tần số sẽ được biểu hiện bằng số tuyệt đối còn tần suất thì được biểu hiện bằng tỷ lệ phần trăm Tổng của các tần số sẽ phải đúng tổng số quan sát
3) Phương sai cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện tượng khác loại
SAI Muốn so sánh độ biến thiên của hai hiện tượng khác loại, chúng ta phải sử dụng Hệ số biến thiên (CV) được tính bằng tỷ số giữa độ lệch chuẩn với giá trị bình quân Bởi nếu so sánh giữa các phương sai của các hiện tượng khác loại, thì phương sai của những hiện tượng có thể khác đơn vị hoặc quy mô của các hiện tượng khác nhau nên so sánh sẽ không chuẩn
4) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó
SAI Khoảng tin cậy phải có quan hệ thuận chiều với phương sai, chính xác là tỷ lệ thuận với độ lệch chuẩn
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả
ĐÚNG
Mô hình hồi quy Y = + 1X1 + 2X2 +… +
Nếu ước lượng được hệ số hồi quy 1 thì chúng ta sẽ biết được X1 (biến nguyên nhân/độc lập) ảnh hưởng ra sao tới Y (biến kết quả/phụ thuộc) cả về chiều hướng và mức độ
B Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
d a) Phân tích đặc điểm biến động của hiện tượng qua thời gian
b) Biểu hiện xu hướng và tính quy luật của sự biến động
f c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng
Trang 2g d) Cả a), b).
h e) Cả b), c)
f) Cả a), b), c)
Đáp án F
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả: a) Hệ số tương quan
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 )
d) Cả a), b)
i e) Cả a), c)
j Đáp án C - Hệ số hồi quy
k
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng
b) Độ đồng đều của tổng thể chung
c) Phương pháp chọn mẫu
d) Cả a), b), c)
e) Không yếu tố nào cả
Đáp án D
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
l e) Cả a), c)
m f) Cả a), d)
Đáp án D
5) Biểu đồ hình cột (Histograms) không phải là đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Đáp án D
Câu 2 (2 đ)
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét để đánh giá tính hiệu quả của nó Phỏng vấn ngẫu nhiên 30 khách hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao hàng như sau:
8
5
3
9
4
6 5 10 7 6
6 7 6 4 8
9 6 6 4 5
7 6 7 5 4
6 7 4 7 3
Trang 3Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng theo phương pháp mới với xác suất tin cậy 95% Hãy kết luận về hiệu quả của phương pháp bán hàng mới so với phương pháp cũ Biết rằng phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7 ngày
Lời giải
Số ngày bình quân từ khi đặt hàng đến giao hàng là x= 6
Giá trị phương sai mẫu hiệu chỉnh 2
1
n i i
x x S
n
và tính ra bằng 3.10345
Do đó độ lệch chuẩn mẫu hiệu chỉnh s = 1.76166
Bởi số quan sát n = 30 nên trung bình của tổng thể được xác định bằng công thức:
Trong đó độ tin cậy là 95% nên = 0.05
Từ đó, chúng ta xác định được khoảng tin cậy bằng 0.6578 Do đó, với độ tin cậy 95%, số ngày bình quân từ khi đặt hàng đến giao hàng là 5.3422 đến 6.6578
Chúng ta sẽ kiểm định xem phương pháp giao hàng mới có rút ngắn được thời gian hơn không Hai giả thuyết được viết như sau:
H0: m =7
H1: m < 7 Giá trị thống kê Z được tính như sau:
6 7
0.10363 1.76166 30
X z
s n
m
Giá trị ngưỡng z = -1.645 tại mức ý nghĩa 0.05, do vậy chúng ta không thể bác bỏ giả thuyết H0 Tức là chúng ta không thể kết luận được rằng số thời gian giao hàng đã được rút ngắn hơn so với phương pháp bán hàng cũ
Câu 3 (2 đ) V0110
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
P/A 1 25 32 35 38 35 26 30 28 24 28 26 34 28 27 26
P/A 2 20 27 25 29 23 26 28 30 32 34 38 25 30 24 27 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Lời giải
Giá trị bình quân: Phương án 1 là 29.47 còn Phương án 2 là 27.88
Phương sai mẫu hiệu chỉnh: Phương án 1 là 18.55 còn Phương án 2 là 19.32
Do cỡ mẫu nhỏ hơn 30 nên chúng ta phải sử dụng kiểm định đối với mẫu nhỏ
Chúng ta tiến hành kiểm định xem chi phí trung bình của hai phương án có thực sự khác nhau không
H0: m1 = m2
H1: m1 ≠ m2
Giá trị thống kê t được xác định như sau:
Trang 41 2
1 1 2
1 2
t s
p n n
Trong đó ước lượng kết hợp của phương sai tổng thể được tính:
2
2
p
s
n n
Với thông tin vừa tính được ở trên, chúng ta có s = 18.94.2p
Từ đó chúng ta tính ra được t = 1.01
Giá trị ngưỡng của thống kê t với số bậc tự do là 29 và mức ý nghĩa 0.05 là ±2.045
Do đó, chúng ta không thể bác bỏ giả thuyết H0 Tức là mức chi phí trung bình của hai phương án sản xuất trên không khác nhau một cách có ý nghĩa về mặt thống kê
Câu 4 (2 đ)
Có tài liệu về doanh thu của một doanh nghiệp trong 10 năm như sau:
Năm Doanh thu (tỷ đồng) 2001
2002 2003 2004 2005 2006 2007 2008 2009 2010
25 26 28 32 35 40 42 50 51 54
1 Xác định hàm xu thế tuyến tính biểu diễn xu hướng biên động của doanh thu qua thời gian
2 Xác định sai số của mô hình và dự đoán doanh thu năm 2011 dựa vào mô hình trên với xác suất tin cậy 95%
Lời giải
Phương trình mô tả xu thế tăng trưởng doanh thu theo thời gian:
Y = a + bt Trong đó chúng ta gán cho t = 1 ứng với năm 2001, t= 2 ứng với năm 2002 …
Sử dụng Excel, chúng ta rút ra hàm hồi quy như sau:
Trang 5SUMMARY
OUTPUT
Regression Statistics
Multiple R 0.98885
R Square 0.97783
Adjusted R
Square 0.97506
Standard
Error 1.70244
Observation
ANOVA
Significa nce F
Regression 1 1022.91
10
22 352.9 6.66E-08 Residual 8 23.187 2.898
Coeffici ents
Standard Error
t Sta t
P-value
Lower 95%
Upper 95%
Lower 95.0%
Upper 95.0%
Intercept 18.933 1.1630 16.27 2.04E-07 16.251 21.615 16.251 21.615
78
6.66E -08 3.088 3.9534 3.0889 3.9534
Như vậy, hàm hồi quy sẽ được viết như sau:
ˆ
Y = 18.933 + 3.5212t
Vào năm 2011, tức là ứng với t = 11 thì doanh thu dự đoán sẽ là Y’ = 57.662
Khoảng tin cậy được xác định bằng công thức
2
1
yx
i
X X
t s
Thống kê t với số bậc tự do bằng 10 – 2 = 8 và độ tin cậy 95% bằng 2.306
Syx được tính theo Excel bằng 1.702 (Standard Error)
Khoảng tin cậy tính được sẽ bằng:
±2,306 1,702 1 11 5,5
10 82,5
Do vậy doanh thu bán hàng của năm 2001 với độ tin cậy 95% sẽ là
57.662 ± 1.602 Tức là doanh thu sẽ từ 56.06 tới 59.264 tỷ đồng
Câu 5 (2 đ)
Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây của một nhà máy (đơn vị: triệu tấn)
Trang 66,2 3,3 5,3 4,5 7,9 7,3
1 Xây dựng biểu đồ thân lá và bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau
2 Tính trung bình từ dãy số liệu ban đầu và từ bảng phân bố tần số So sánh kết quả và giải thích sự khác nhau (nếu có)
Lời giải
Biểu đồ thân lá
Bảng phân bố tần số
Khối lượng sản phẩm Trị số giữa Tần số Tần suất
Giá trị trung bình từ dãy số liệu ban đầu là 5.693
Giá trị trung bình tính theo bảng phân bố tần số:
3.5*4 4.5*6 5.5*5 6.5*8 7.5*7
5.767 30
Như vậy hai giá trị trung bình tính theo hai cách là khác nhau Đó là do khi chúng ta tính theo phương pháp sử dụng bảng phân bổ tần số, ta lấy trị số giữa của mỗi tổ để tính ra giá trị bình quân của mẫu, tuy nhiên các giá trị cá biệt trong tổ đó có thể phân bố không đều quanh giá trị của trị số giữa nên dẫn tới độ chệch