Trong đó: UnitsSold: Số lượng xe đạp bán được FloorSpace: Diện tích trưng bày bán hàng mét vuông CompetingAds: Chi phí quảng cáo của các đối thủ cạnh tranh nghìn đô la Price: Giá bán sản
Trang 1Bài tập Thống kê Ra quyết định quản lý
Một nhà quản lý bán hàng cho 1 nhãn hiệu xe đạp địa hình muốn xem xét ảnh hưởng của các yếu tố liên quan đến doanh thu bán hàng đã thu thập số liệu của 30 cửa hàng bán loại xe đạp này Trong đó:
UnitsSold: Số lượng xe đạp bán được
FloorSpace: Diện tích trưng bày bán hàng (mét vuông)
CompetingAds: Chi phí quảng cáo của các đối thủ cạnh tranh (nghìn đô la)
Price: Giá bán sản phẩm (đô la)
Obs UnitsSold FloorSpace CompetingAds Price
Trang 225 1369 78.5 99.7 823
Hãy sử dụng các số liệu trên đây để trả lời các câu hỏi sau:
1 Sử dụng các mô tả thống kê thích hợp để nhận xét về các biến trong số liệu
trên:
Các biến phân tích đều là biến định lượng do đó các thống kê mô tả đặc trưng
cho biến định lượng gồm mean, median, các tứ phân vị, khoảng tứ phân vị, giá trị min,
max, phương sai, độ lệch chuẩn, giá trị ngoại lai và khoảng tin cậy cho từng biến Ta
sử dụng công cụ megastat trên excel – megastat - descriptive statistics và đưa toàn bộ
dữ liệu đề bài cho vào phần dữ liệu, ta có mô tả thống kê và đồ thị boxplot cho từng
biến như sau:
Descriptive statistics
UnitsSold
sample standard
confidence interval 95.%
confidence interval 95.%
Trang 3low extremes 0 0 0 0
low outliers 1 1 0 0
high outliers 0 0 0 0
high extremes 0 0 0 0
Nhận xét:
Căn cứ vào kết quả mô tả dữ liệu thống kê, ta thấy các biến có phân phối tương
đối đối xứng, trung bình và trung vị xấp xỉ bằng nhau, biến Doanh số và Diện tích cửa
8/9/2012 8:48.19 (4)
Trang 4hàng có một giá trị ngoại lai (có một cửa hàng có diện tích và doanh thu rất bé so với các cửa hàng khác) Biến Giá bán và Chi phí quảng cáo không có giá trị ngoại lai
Biến Diện tích cửa hàng và Chi phí quảng cáo có giá trị phân bố tương đối tập trung: khoảng biến thiên bé, độ lệch chuẩn nhỏ trong đó biến Chi phí quảng cáo có phân bố tập trung nhất (độ biến thiên bé nhất)
Biến Diện tích cửa hàng và Chi phí quảng cáo có giá trị đặc trưng (mode), hai biến còn lại không có
2 Sử dụng đồ thị rải điểm để đánh giá về mối quan hệ tuyến tính giữa doanh số bán hàng và các yếu tố còn lại Kết quả từ đồ thị có giống như nhận định của anh chị về các quan hệ này dựa trên các lý thuyết kinh tế không Sử dụng hệ số tương quan để kiểm tra lại kết quả từ đồ thị:
Vẽ đồ thị rải điểm bằng công cụ Megastat trên excel dựa trên bảng số liệu đã
cho bằng cách dung hàm Correlation/Regression- scaterplot ta có đồ thị phản ánh mối quan hệ giữa doanh số bán xe đạp (thể hiện trên trục tung, đơn vị: chiếc xe đạp) với lần lượt từng biến riêng biệt là diện tích trưng bày, chi phí quảng cáo của đối thủ cạnh tranh và giá bán của cửa hàng (thể hiện trên trục hoành với đơn vị tính lần lượt là mét vuông, nghìn đô la và đô la) như sau:
Nhìn vào đồ thị ta thấy có xu thế tăng lên, thể hiện mối quan hệ tương quan tỷ
lệ thuận giữa doanh số bán hàng và diện tích trưng bày, diện tích trưng bày càng lớn thì số lượng hàng bán ra càng lớn Điều này khá phù hợp với lý thuyết kinh tế vì đây là hàng hoá có tính thương hiệu cao, khách hang thường tìm đến các cửa hàng quy mô
Trang 5trưng bày lớn, có nhiều sự lựa chọn để tìm kiếm sản phẩm phù hợp nhất do vậy doanh
số bán tăng theo quy mô trưng bày, hơn nữa diện tích cửa hàng càng lớn tất nhiên số lượng hàng hóa bán ra cũng càng lớn, điều này cũng phù hợp với thực tế Theo kết quả
từ bảng trên ta có hàm hồi quy Y=10.382x + 454.035, Hệ số tương quan dương phản ánh mối quan hệ tỷ lệ thuận, và khi diện tích tăng lên 1 m2 thì số lượng bán tăng được
10, 382 xe (khoảng 10 chiếc xe) Hệ số R2 là 0.719 có nghĩa 71.9% sự tăng lên của doanh số do yếu tố diện tích mặt bằng quyết định, 28.1% còn lại là do các yếu tố khác quyết định
Nhìn vào đồ thị ta thấy có xu thế tăng lên thể hiện tương quan tỷ lệ thuận giữa doanh số bán và việc quảng cáo của đổi thủ cạnh tranh, điều này có vẻ không phù hợp với các lý thuyết kinh tế (vì thông thường doanh số sẽ giảm khi cho phí quảng cáo của đối thủ cạnh tranh tăng) Tuy nhiên, xu hướng này chưa rõ rệt do độ phân tán của các điểm khá phân tán so với đường thể hiện xu thế chung Điều này có thể giải thích rằng yếu tố quảng cáo của đối thủ cạnh tranh thường làm giảm doanh số bán, tuy nhiên đối với mặt hàng xe đạp, việc quảng cáo của đối thủ không ảnh hưởng nhiều đến doanh số bán của các cửa hàng
Theo bảng trên ta có hàm tương quan giữa doanh số bán và chi phí quảng cáo của đối thủ cạnh tranh như sau Y= 8.625x + 303.833, hệ số tương quan dương phản ánh tỷ lệ thuận , khi chi phí quảng cáo của đối thủ tăng lên 1000 USD thì doanh số bán của cửa hàng tăng lên khoảng 9 xe Tuy nhiên, hệ số R2 = 0.064 cho thấy chỉ 6.4% sự
Trang 6tăng lên của doanh số là chịu ảnh hưởng của chi phí quảng cáo của đối thủ, tỷ lệ này không nhiều do vậy chưa thể khẳng định mối quan hệ giữa doanh số và chi phí quảng cáo
Quan hệ giữa doanh số bán và giá: nhìn vào đồ thị ta thấy có xu hướng giảm, giá tăng lên thì doanh số bán giảm đi, tuy nhiên sự giảm sút do giá không nhiều (đường xu hướng gần nằm ngang) thể hiện mối quan tâm về giá đối với quyết định mua hàng không có nhiều ảnh hưởng với loại hàng hoá này Điều này hoàn toàn phù hợp với lý thuyết co giãn của cầu so với giá (khi giá tăng thì doanh số giảm) Xem xét hàm hồi quy Y= -0.064x + 1.218.619 ta thấy phù hợp với đồ thị, hệ số tương quan âm thể hiện quan hệ tỷ lệ nghịch giữa hai biến Tuy nhiên với hệ số R2=0.005 có nghĩa chỉ 0.5% sự giảm đi của doanh số là do ảnh hưởng của việc tăng giá
3 Dùng khoảng tin cậy ước lượng trung bình cho các biến nêu trên với độ tin cậy 95%, nêu ý nghĩa của các kết quả nhận được Ước lượng tỷ lệ các cửa hàng có doanh số lớn hơn 1200 đơn vị:
Sử dụng phần Confidence interval – mean trong phần mềm MegaStat
Confidence interval – mean UnitsSold (unit)
95% confidence level 1146.433333 mean
233.1006418 std dev
30 n
Trang 72.045 t (df = 29) 87.0412 half-width 1,233.4745
upper confidence limit
1,059.3921
lower confidence limit
Nhận xét: Doanh số trung bình của các cửa hàng nằm trong khoảng (1146 ± 87) (từ
1059 đến 1233) sản phẩm, với độ tin cậy 95%
Confidence interval - mean FloorSpace (m2)
95% confidence level 66.69 mean
19.03645052 std dev
30 n 2.045 t (df = 29) 7.108 half-width 73.798
upper confidence limit
59.582
lower confidence limit
Nhận xét: Diện tích trưng bày trung bình của các cửa hàng nằm trong khoảng (66 ± 7)
(từ 59 đến 73) m2, với độ tin cậy 95%
Confidence interval - mean CompetingAds(1000USD)
95% confidence level 97.69333333 mean
6.831313971 std dev
30 n 2.045 t (df = 29) 2.5509 half-width 100.2442 upper confidence limit 95.1425 lower confidence limit
Nhận xét: Chi phí quảng cáo của các đối thủ cạnh tranh trung bình của các cửa hàng
nằm trong khoảng (97.69± 2.55) (từ 95.14 đến 100.24) (đơn vị: 1000USD), với độ tin cậy 95%
Trang 8Confidence interval - mean Price (USD)
95% confidence level 1136.133333 mean
270.5294596 std dev
30 n 2.045 t (df = 29) 101.0174 half-width 1,237.1507
upper confidence limit 1,035.1160
lower confidence limit
Nhận xét: Giá bán trung bình của các cửa hàng nằm trong khoảng (1136± 101) (từ
1035 đến 1237) USD, với độ tin cậy 95%
Ước lượng tỷ lệ các cửa hàng có doanh số lớn hơn 1200 đơn vị:
Sử dụng chức năng Frequency Distribution – Quantitative để tính tỷ lệ phân phối các cửa hàng có doanh số lớn hơn 1200 đơn vị sản phẩm:
Frequency Distribution - Quantitative
UnitsSold
low
er
uppe r
midpoi nt
widt h
frequen cy
percen
t
freque ncy
percen t
1,00
0 900 200 5 16.7 7 23.3 1,00
1,20
0 1,100 200 9 30.0 16 53.3 1,20
1,40
0 1,300 200 9 30.0 25 83.3 1,40
1,60
0 1,500 200 5 16.7 30 100.0
30 100.0 Qua bảng phân phối cho thấy số cửa hàng có doanh số lớn hơn 1200 đơn vị sản phẩm
là 14 cửa hàng trong số 30 cửa hàng lấy mẫu, chiếm 46.7%
Sử dụng chức năng Confidence interval – proportion để ước lượng tỷ lệ các cửa hàng
có doanh số lớn hơn 1200 đơn vị:
Trang 9Confidence interval - proportion
95% confidence level
0.46666666
7 proportion
30 n 1.960 z
0.179 half-width
0.645
upper confidence limit
0.288
lower confidence limit
Nhận xét: tỷ lệ các cửa hàng có doanh số lớn hơn 1200 đơn vị nằm trong khoảng
(46.7 ± 17.9 %) với độ tin cậy 95%
4 Kiểm tra ý kiến cho rằng chi phí quảng cáo trung bình của các đối thủ cạnh tranh là không quá 100 nghìn đô la và doanh số bán trung bình của các cửa hàng
là ít hơn 1200 đơn vị sản phẩm:
Sử dụng chức năng Hypothesis test để kiểm định giả thiết: “chi phí quảng cáo
trung bình của các đối thủ cạnh tranh là không quá 100 nghìn đô la”.
Ta có cặp giả thiết: H0 ≤ 100 và H1 > 100
Hypothesis Test: Mean vs Hypothesized Value
100.00000 hypothesized value
97.69333 mean CompetingAds(1000USD)
6.83131 std dev
1.24722 std error
30 n
29 df
-1.85 t
.9627 p-value (one-tailed, upper)
95.14248 confidence interval 95.% lower
100.24419 confidence interval 95.% upper
2.55085 margin of error
Nhận xét: căn cứ vào giá trị của P-value trong bảng trên, p-value = 0.96 > α =0.05, do
đó ta chưa thể bác bỏ giả thiết Ho, có nghĩa là giả thiết: “chi phí quảng cáo trung bình của các đối thủ cạnh tranh là không quá 100 nghìn đô la” là có cơ sở
Sử dụng chức năng Hypothesis test để kiểm định giả thiết: “doanh số bán trung bình
của các cửa hàng là ít hơn 1200 đơn vị sản phẩm”.
Trang 10Ta có cặp giả thiết: H0 ≥ 1200 và H1 < 1200
Hypothesis Test: Mean vs Hypothesized Value
1,200.00000 hypothesized value
1,146.43333 mean UnitsSold (unit)
233.10064 std dev
42.55816 std error
30 n
29 df
-1.26 t 1091 p-value (one-tailed, lower)
1,059.39212 confidence interval 95.% lower
1,233.47454 confidence interval 95.% upper
87.04121 margin of error
Nhận xét: căn cứ vào giá trị của P-value trong bảng trên, p-value = 0.10 > α =0.05, do
đó ta chưa thể bác bỏ giả thiết Ho, có nghĩa là chưa thể bác bỏ giả thiết “doanh số bán
trung bình của các cửa hàng là lớn hơn hoặc bằng 1200 đơn vị sản phẩm”, điều
đó có nghĩa là giả thiết H1: “doanh số bán trung bình của các cửa hàng là ít hơn
1200 đơn vị sản phẩm” là chưa có cơ sở.
5 Ước lượng mô hình hồi quy tuyến tính với biến phụ thuộc là doanh số bán hàng, các biến độc lập là các biến còn lại:
Sử dụng công cụ Megastat trên Excel, dựa trên bảng số liệu đã cho bằng cách dùng hàm Correlation/Regression- regression analysis ta có bảng phân tích hồi quy phản ánh mối quan hệ giữa doanh số bán xe đạp, ký hiệu là Y (đơn vị: chiếc) với từng biến độc lập là diện tích trưng bày ký hiệu là X1(m2), chi phí quảng cáo của đối thủ cạnh tranh, ký hiệu là X2 (nghìn USD) và giá bán ký hiệu là X3 (đô la) như sau:
Regression Analysis
R² 0.759
Trang 11R 0.871 k 3 Std Error
120.78
UnitsSold (unit)
ANOVA table
Regression
1,196,409.6
398,803.21
81 27.33
3.36E-08 Residual
379,331.712
14,589.681
2 Total
1,575,741.3
variables coefficients
std.
error t (df=26)
p-value
95%
lower
95% upper
Intercept 1,225.4435
397.26
408.84
64
2,042.04
06
3.82
CompetingAds(1000U
-14.961
a Giải thích ý nghĩa của các hệ số hồi quy và hệ số R 2 Biến độc lập nào có ảnh hưởng nhiều nhất đến doanh số bán xe đạp:
Hàm hồi quy mẫu phản ánh quan hệ giữa doanh số bán xe đạp với các yếu tố diện tích trưng bày (m2), chi phí quảng cáo của đối thủ cạnh tranh (nghìn USD) và giá bán của cửa hàng (đô la) như sau:
Y = b 0 + b 1 *X 1 + b 2 *X 2 + b 3 *X 3
Y=1225.4435+ 11.5222X 1 – 6.9351X 2 - 0.1496X 3
+ Hệ số hồi quy 11.5222 của biến độc lập Diện tích trưng bày Floor space có nghĩa quan hệ giữa doanh số bán với diện tích trưng bày là tỷ lệ thuận, khi diện tích tăng 1 m2 thì số xe bán được tăng khoảng 11 xe với điều kiện các yếu tố chi phí quảng các của đối thủ và giá bán vẫn giữ nguyên
Trang 12+ Hệ số hồi quy -6.9351 của biến độc lập Chi phí quảng cáo của đối thủ cạnh tranh có nghĩa quan hệ giữa doanh số bán với biến chi phí quảng cáo của đối thủ cạnh tranh là tỷ lệ nghịch, khi chi phí quảng cáo của đối thủ tăng lên 1000$ thì số xe bán được giảm khoảng 7 xe với điều kiện các yếu tố diện tích trưng bày và giá bán vẫn giữ nguyên
+ Hệ số hồi quy -0.1496 của biến độc lập Giá có nghĩa quan hệ giữa doanh số bán với giá là tỷ lệ nghịch, khi giá tăng lên 1 USD thì số xe bán được giảm khoảng 0.15 xe (tương đương với khi giá tăng lên 7 USD thì số xe bán được giảm khoảng 1 xe) với điều kiện các yếu tố chi phí quảng các của đối thủ và diện tích trưng bày vẫn giữ nguyên
+ Hệ số R2 =0.759 cho biết 75.9% việc tăng lên của doanh số bán được giải thích bằng sự ảnh hưởng của các yếu tố diện tích trưng bày, chi phí quảng cáo của đối thủ cạnh tranh và giá bán của xe
+ Trong các yếu tố trên, yếu tố diện tích trưng bày ở cửa hàng có ảnh hưởng nhiều nhất đến doanh số bán xe đạp (có hệ số hồi quy tính được lớn nhất)
b Dùng kiểm định thích hợp cho biết biến độc lập nào có ảnh hưởng và không ảnh hưởng thực sự tới doanh số bán hàng Từ đó hãy nhận định xem trong nghiên cứu này việc chọn các biến độc lập đã thích hợp chưa? Liệu có thể còn biến nào cũng có ảnh hưởng đến doanh số mà bị bỏ sót không, nêu ví dụ:
b1 Kiểm định mối liên hệ giữa doanh số bán và diện tích trưng bày:
Chọn giả thuyết:
H0: β1 = 0
H1: β1 ≠ 0
Với t trong kiểm định 8.666 có p-value = 3.82.10-9 < α = 0,05 do đó bác bỏ H0
Kết luận hai biến doanh số bán và diện tích trưng bày có mối quan hệ với nhau và diện tích trưng bày có ảnh hưởng tới doanh số bán
b2 Kiểm định mối liên hệ giữa Doanh số bán và chi phí quảng cáo của đối thủ cạnh tranh:
Chọn giả thuyết: H0: β2 = 0
Trang 13H1: β2 ≠ 0
Với t trong kiểm định là -1.176 có p-value 0.0874 > α = 0,05 suy ra: Chấp nhận H0 Như vậy chưa có cơ sở khẳng định mối quan hệ giữa chi phí quảng cáo của đối phương với doanh số bán hàng của cửa hàng
b3 Kiểm định mối liên hệ giữa doanh số bán hàng và giá bán:
Chọn giả thuyết: H0: β3 = 0
H1: β3 ≠ 0
Với t trong kiểm định là -1,675 có p-value = 0.1059 > α = 0,05 Suy ra chấp nhận H0 Như vậy chưa có cơ sở khẳng định mối quan hệ giữa giá bán với doanh số bán hàng của cửa hàng
Kết luận chung:
+Có thể khẳng định chắc chắn mối quan hệ giữa doanh số bán và diện tích trưng bày là quan hệ tỷ lệ thuận
+ Chưa thể kết luận về yếu tố chi phí của đối thủ cạnh tranh và giá bán có mối quan
hệ ảnh hưởng đến doanh số bán hay không Do đó việc chọn hai biến độc lập là chi phí quảng cáo của đối thủ và giá bán chưa thích hợp trong mẫu phân tích này
+ Ngoài ra, doanh số bán hàng của một sản phẩm không chỉ phụ thuộc vào các yếu tố trên mà còn phụ thuộc vào các yếu tố khác như chi phí quảng cáo của chính bản thân hãng, vị trí của cửa hàng và đặc điểm kinh tế, địa lý và xã hội của các vùng miền khác nhau…
c Dùng kiểm định F kiểm tra xem mô hình có ý nghĩa không?
Sử dụng kiểm định F: ta có cặp giả thiết sau:
H0: β1= β2 =β3=0
H1: Có ít nhất βi≠0 (trong đó i=1, 2, 3)
Nếu: β1= β2 =β3=0 không có sự phụ thuộc giữa doanh số bán và các biến độc lập
βi≠0 ít nhất 1 biến độc lập ảnh hưởng tới doanh số bán, -> mô hình có ý nghĩa Bảng phân tích phương sai (ANOVA table) cho thấy:
F (tỉ số biến thiên của trong mô hình và ngoài mô hình) =27.33, mà F càng lớn thì có
sự biến đổi trong mô hình Từ bảng ta có p-value = 3.36*10_8 ≈ 0 < α = 0.05 nên bác
bỏ H0
Kết luận Có ít nhất 1 biến độc lập trong 3 yếu tố diện tích trưng bày , chi phí quảng
cáo của đối thủ và giá bán có ảnh hưởng tới doanh số bán , suy ra: Mô hình là phù hợp