9 4.Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu .... 11 6.Sự liên hệ giữa thời gian truy cập website với số trang đã xem .... 20 3.Ước lượng khoảng trung bình của c
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
- o0o -
TIỂU LUẬN HỌC PHẦN THỐNG KÊ ỨNG DỤNG
Giảng viên hướng dẫn : Ths Lê Văn Hòa Nhóm sinh viên : Phạm Hồng Thương 20136566
: Nguyễn Thị Thùy Linh 20135898
Trang 2LỜI CẢM ƠN
Thống kê ứng dụng là môn học rất cần thiết trong học tập và giảng dạy đối với giáo dục đại học Việt Nam nói chung và sinh viên các ngành kinh tế nói riêng Đặc biệt là đối với sinh viên của các chuyên ngành khối kinh tế - xã hội
Những tình huống thực tế sẽ giúp sinh viên hiểu sâu và hiểu kĩ lý thuyết hơn, có thể vận dụng những gì đã học vào tình huống cụ thể mà sau này có thể sẽ gặp trong công việc Làm quen với những thách thức cần phải đưa ra một quyết định trong dự án kinh doanh của chính mình hoặc của doanh nghiệp mà mình công tác
Để hoàn thành được bài tiểu luận này, nhóm chúng em đã nỗ lực rất nhiều và chúng
em xin gửi lời cảm ơn sâu sắc tới thầy giáo, Thạc sĩ Lê Văn Hòa, bộ môn Quản trị
kinh doanh Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội đã đồng hành cùng chúng em suốt quá trình nghiên cứu và học tập, cảm ơn thầy đã tận tình giảng dạy và truyền thụ kiến thức, kinh nghiệm cũng như phong cách trình bày, để chúng em
có thêm những bài học quý báu
Do chưa có cơ hội va chạm và tiếp xúc với môi trường thực tế trong kinh doanh nên nhóm có thể chưa hiểu rõ hoặc hiểu sai những yêu cầu trong tình huống, bài làm còn những sai sót, rất mong nhận được sự góp ý và sửa chữa của thầy và các bạn
Chúng em xin trân trọng cảm ơn!
Hà Nội ngày 5 tháng 10 năm 2015
Nhóm thực hiện
Trang 3MỤC LỤC
Lời cảm ơn 1
Tình huống 1:Công ty sô-cô-la Heavenly Chocolates 4
1 Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả 4
1.1.Đối với thời gian truy cập website công ty 4
1.2.Đối với số trang đã đọc 5
1.3.Đối với số tiền chi tiêu bình quân một giao dịch 7
2 Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo từng ngày thứ trong tuần 8
3.Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo loại trình duyệt web đã sử dụng 9
4.Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu 9
4.1.Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền chi tiêu 10
5.Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu 10
5.1.Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và
số tiền chi mua hàng 11
6.Sự liên hệ giữa thời gian truy cập website với số trang đã xem 11
6.1.Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang đã xem
11
Tình huống 2: 12
Công ty sản xuất đồ chơi trẻ em Specialty Toys 12
1.Đồ thị phân phối 12
2.Xác suất hết hàng đối với các phương án đặt hàng được đề ra 13
3.Lơi nhuận kì vọng 14
3.1 Giả định bán được 10000 sản phẩm 14
3.2 Giả định bán được 20000 sản phẩm 14
3.3 Giả định bán được 30000 sản phẩm 14
Trang 45.Khuyến nghị 16
Tình huống 3:Công ty nghiên cứu thị trường Metropolitan Research(Chapter 8, Auto) 17
1.Phân tích thông kê mô tả 17
2.Ước lượng trung bình khoảng 18
3 Thảo luận hàm ý 18
4.Xác định cỡ mẫu 19
5)Thông tin thêm 19
Tình huống4:Thu nhập của nhân viên bán hàng(Chapter 13, SalesSalary) 20
1.Phân tích thống kê mô tả 20
2.Ước lượng khoảng trung bình 20
3.Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp 21
4.Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa 21
5.Kiểm định giả thuyết 22
6.Kiểm định giả thuyết 23
7.Kiểm định giả thuyết 25
Tình huống 5:Chi tiêu qua thẻ tín dụng của người tiêu dùng(Chapter 15, Consumer) 27 1.Thống kê mô tả 27
2.Xây dựng phương trình hồi qui mẫu 27
3.Xây dựng phương trình hồi quy bội 34
4.Dự báo 36
5.Thông tin thêm 36
TÀI LIỆU THAM KHẢO 37
Trang 5Tình huống 1:
Công ty sô-cô-la Heavenly Chocolates
(Chapter 3, Shopper) Bài làm
1 Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả
Trang 7Bin Frequency Cumulative %
Trang 8Bin Frequency Cumulative %
Trang 9Nhận xét: Khách hàng chi tiêu chủ yếu ở mức dưới 75$, chiếm 72.55% tổng lượng tiền
đã chi tiêu cho mua hàng online
2 Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo từng ngày thứ trong tuần
Trang 10Thứ Số giao dịch Tổng số tiền($) Tần số(%) Số tiền bình quân($)
5, số lần giao dịch ít hơn, vì vậy lượng tiền chi tiêu ít hơn những ngày khác
3 Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo loại trình duyệt web đã sử dụng
Khách hàng chủ yếu sử dụng trình duyệt Internet Explorer để truy cập website, do đó
số tiền khách hàng đã chi tiêu cho mua hàng online ở trình duyệt web này lớn hơn các trình duyệt còn lại Tuy nhiên số tiền chi bình quân cho mỗi giao dịch lại thấp hơn Firefox và các trình duyệt web khác
4 Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu
Trang 114.1 Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền
chi tiêu
Hệ số tương quan mẫu r = 0.580048
Nhận xét: Giữa thời gian truy cập website và số tiền chi tiêu có mối liên hệ tương quan
tuyến tính thuận chiều, thời gian truy cập website càng nhiều thì số tiền chi tiêu càng cao
5 Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu
y = 3.0942x + 28.492 r² = 0.3365
0.00 20.00 40.00 60.00 80.00 100.00 120.00 140.00 160.00 180.00
y = 11.489x + 12.752 r² = 0.5237
0.00 20.00 40.00 60.00 80.00 100.00 120.00 140.00 160.00 180.00
Linear (Amount Spent ($))
Trang 125.1 Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và số tiền
chi mua hàng
Hệ số tương quan r = 0.7236
Nhận xét: Thông qua đồ thị tán xạ và hệ số tương quan r = 0.7236, ta nhận thấy có một
mối liên hệ tương quan tuyến tính mạnh giữa số trang đã xem trên website và số tiền chi mua hàng, tức là số lượng trang của website được xem càng nhiều thì số lượng tiền khách hàng đã chi tiêu để mua hàng của công ty càng lớn
6 Sự liên hệ giữa thời gian truy cập website với số trang đã xem
6.1 Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang
y = 1.7725x + 4.2666 r² = 0.3547 0.0
5.0 10.0 15.0 20.0 25.0 30.0 35.0
Trang 13Đồ thị phân phối nhu cầu mua hàng
Ta có P(xbar - Zα/2 𝜎xbar <= 𝜇<= xbar + Zα/2 𝜎xbar ) = 1 – α = 0.95
Trang 14 Vậy giá trị TB và độ lệch chuẩn của phân phối lần lượt là: Xbar=20000; 𝜎xbar =
Trang 15Tổng tiền bán được giá 5$($)
Tổng tiền đầu tư mua sản phẩm giá 16$ ($)
Lợi nhuận ($)
Tổng tiền bán giá 5$ ($)
Tổng tiền đầu
tư giá 16$ ($)
Lợi nhuận ($)
Tổng tiền bán giá 5$ ($)
Tổng tiền đầu
tư giá 16$ ($)
Lợi nhuận ($)
Trang 164 Lợi nhuận dự kiến
Gọi số lượng hàng cần đặt mua là S( sản phẩm ) Vì lượng hàng cần đặt phải đáp ứng 70% nhu cầu người mua và chỉ nên 30% hết hàng
Hay lượng hàng ta cần đặt mua là 20404 sản phẩm
Lợi nhuận dự kiến thu được là:
doanh thu kì giáng sinh (x4)
tiền bán hàng tồn kho (x5)
số tiền mua hàng (x6)
lợi nhuận ( x7) X3= x1-x2 X4 =x2 *24 $ X5= x3 * 5$ X6= x1*16$ X7= x4+x5 –x6
Trang 19 Trung bình mẫu: mean = 73 340.30
Khoảng ước lượng cho µ là: L ≤ µ ≤ U
Vậy với độ tin cậy 95%, số dặm trung bình tổng thể lái được đến khi bộ truyền động bị lỗi được ước lượng trong khoảng từ 66438.73 miles đến 80241.87 miles.Vì giá trị 73340.30 thuộc khoảng ước lượng này nên ta có thể khẳng định bộ truyền động hoạt động bình thường
0 20000 40000 60000 80000 100000 120000 140000 160000 180000
Miles BoxPlot
Trang 20 Hệ số skewness = 0.26>0 nên suy ra dữ liệu có phân phối lệch phải
Độ trải giữa R0 = 86 575 – 60 421 = 26 154 => mức độ phân tán của dữ liệu khá lớn
Trung vị nằm giữa 2 tứ phân vị cho thấy phân phối khá đều
Vậy cho nên chưa có đủ căn cứ để tin rằng một số người mua xe hơi đã bị hỏng bộ truyền động sớm
4) Xác định cỡ mẫu
Với e=5000; s = 24898.72; Zα/2= 1.96 thì cần lấy cỡ mẫu tối thiểu là:
N = (Zα/2*s)2/e2 = (1.96*24898.72)2/50002 = 95.263
Vậy lấy cỡ mẫu tối thiểu là 96 chiếc xe
5) Thông tin thêm
Để đánh giá vấn đề lỗi bộ truyền động một cách đầy đủ hơn thì cần có thêm thông tin về:
Tiêu chuẩn số dặm mà một chiếc xe bình thường lái được đến khi bị lỗi bộ truyền động mà công ty đặt ra
Lấy cỡ mẫu lớn hơn để có dữ liệu với độ sai lệch ít hơn
Trang 21sample standard deviation 10,838.67 Độ lệch chuẩn s
sample variance 117,476,831.86 Phương sai mẫu
3rd quartile 76,092.25 Tứ phân vị thứ 3
interquartile range 19,818.00 Độ trải giữa
2 Ước lượng khoảng trung bình
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của tất cả những người bán hàng
n=120>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối normal
confidence interval 95.% lower 62,986.23 confidence interval 95.% upper 66,864.72 margin of error 1,939.25
Trang 22 Với độ tin cậy 95%, thu nhập trung bình năm của tất cả những người bán hàng được ước lượng trong khoảng 62,986.23 đến 66,864.72
3 Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của các nhân viên bán hàng tại doanh nghiệp (inside)
n=60>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối normal
confidence interval 95.% lower 55,112.18
confidence interval 95.% upper 56,928.85
margin of error 908.33
Với độ tin cậy 95%, thu nhập trung bình năm của các nhân viên bán hàng tại doanh nghiệp (inside) được ước lượng trong khoảng 55,112.18 đến 56,928.85
4 Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của các nhân viên bán hàng tại thực địa (outside)
n=60>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối normal
confidence interval 95.% lower 71,825.68 confidence interval 95.% upper 75,835.18 margin of error 2,004.75
Trang 23 Với độ tin cậy 95%, thu nhập trung bình năm của các nhân viên bán hàng tại thực địa (outside) được ước lượng trong khoảng 71,825.68 đến 75,835.18
5 Kiểm định giả thuyết
H0: µ1=µ2, thu nhập do vị trí công tác là như nhau
H1: µ1≠µ2, có sự khác nhau về thu nhập do vị trí công tác
One factor ANOVA
Mean n Std Dev
73,830.4 60 7,922.96 outside 64,925.5 120 10,838.67 Total ANOVA
Trang 24p-value<α=0.05 => bác bỏ H0
Với độ tin cậy 95% có đủ bằng chứng thống kê để bác bỏ giả thuyết H0, như vậy có sự khác nhau giữa thu nhập của nhân viên bán hàng tại doanh nghiệp (inside) và nhân viên bán hàng tại thực địa (outside)
6 Kiểm định giả thuyết
n=40>30 => Trung bình mẫu xấp xỉ phân phối normal
H0: µ1=µ2=µ3, Thu nhập do số năm kinh nghiệm là như nhau
H1: Có sự khác nhau về thu nhập do số năm kinh nghiệm
Trang 25p-value=0.0006 < α=0.05 => bác bỏ H0=> Với độ tin cậy 95% có đủ bằng
chứng thống kê để bác bỏ giả thuyết H0, như vậy có sự khác nhau về thu nhập
do số năm kinh nghiệm
Phân tích sâu ANOVA:
Post hoc analysis
p-values for pairwise
Tukey simultaneous comparison t-values (d.f = 117)
Trang 26p-valuelow-high=0.0053 < α=0.05 => Có sự khác nhau về thu nhập giữa người có kinh nghiệm thấp và người có kinh nghiệm cao
p-valuelow-medium=0.0002 <α => Có sự khác nhau về thu nhập giữa người có kinh nghiệm thấp và người có kinh nghiệm trung bình
7 Kiểm định giả thuyết
H0:
- Thu nhập do vị trí công tác là như nhau
- Thu nhập do số năm kinh nghiệm là như nhau
- Không có ảnh hưởng tương tác giữa vị trí công tác và số năm kinh nghiệm
H1:
- Có sự khác nhau về thu nhập do vị trí công tác
- Có sự khác nhau về thu nhập do số năm kinh nghiệm
- Có sự ảnh hưởng tương tác giữa vị trí công tác và số năm kinh nghiệm
Two factor ANOVA
Factor 2 Means:
ANOVA
table
value
p-Factor 1 9,515,793,950.21 1 9,515,793,950.208 751.36
5.32E-52
Trang 27- Có sự khác nhau về thu nhập do vị trí công tác
- Có sự khác nhau về thu nhập do số năm kinh nghiệm
- Có sự ảnh hưởng tương tác giữa vị trí công tác và số năm kinh nghiệm
Trang 28Household Size
Amount Charged ($)
Trang 29i x(i) y(i) xi-𝒙 ̅ yi - 𝒚 ̅ (xi-𝒙 ̅)(yi-𝒚 ̅) ( xi-𝒙 ̅)^2 ( yi-𝒚 ̅)^2 (𝒀 ̂i-𝒚̅)^2
-6 55 4,070 11.52 105.940 1220.429 132.710 11,223.284 217463.669
7 37 2,731 -6.48
1,233.060 7990.229 41.990 1,520,436.964 68806.536
-14 33 2,514 -10.48
1,450.060 15196.629 109.830 2,102,674.004 179971.093
-19 44 2,995 0.52 -969.060 -503.911 0.270 939,077.284 443.102
20 37 4,171 -6.48 206.940 -1340.971 41.990 42,824.164 68806.536
21 62 5,678 18.52 1,713.940 31742.169 342.990 2,937,590.324 562035.096
22 21 3,623 -22.48 -341.060 7667.029 505.350 116,321.924 828081.800
Trang 31TS(b1) MS(b1) SST SSR
𝑥̅= (∑xi)/n = 2174/50 = 43.48 𝑦̅ = (∑yi)/n = 198,203/50 = 3964.06 Phương trình hồi qui mẫu: 𝑌̂ = b0 + b1*x b1= TS(b1)/MS(b1) = 419956.560/10374.480 = 40.480 b0 = 𝑦̅ - b1*𝑥̅ = 3964.06 - 40.480*43.48 = 2203.990 PTHQ mẫu: 𝑌̂ = 2203.990 + 40.480*x
SSR = 16,999,938.312 SST = 42,699,148.820 SSE = SST-SSR= 25,699,210.508 R^2 = SSR/SST = 16,999,938.312/ 42,699,148.820 = 0.398 => Khoảng 39.8%
số tiền chi tiêu bằng thẻ tín dụng phụ thuộc vào thu nhập
Trang 32Regression output confidence interval
variables coefficients
std
error t (df=48) p-value 95% lower 95% upper
Intercept 2,203.9996 329.0489 6.698 2.14E-08 1,542.4024 2,865.5968 x(i) 40.4798 7.1839 5.635 9.01E-07 26.0357 54.9239
PTHQ tổng thể: Y = β0 + β1*X giả thuyết: H0: β1=0
H1: β1≠0 chỉ tiêu kiểm định tstat = b1/S(b1) = 5.635 t(α/2) = t(0.025;48) = 2.0106 Ta thấy tstat >t(α/2) => β1≠0
* Quy mô hộ gia đình làm biến độc lập Lập bảng tính
i x(i) y(i) xi-𝒙 ̅ yi - 𝒚 ̅
Trang 34𝑥̅ = (∑xi)/n = 171/50 = 3.42 𝑦̅ = (∑yi)/n = 198,203/50 = 3964.06 Phương trìn hồi qui mẫu: 𝑌̂ = b0 + b1*x b1 = TS(b1)/MS(b1) = 59,884/148 = 404.128 b0 =𝑦̅ - b1*𝑥̅ = 3964.06 - 404.128*3.42 = 2581.942 Vậy PTHQ mẫu là: 𝑌̂ = 2581.942 + 404.128*x SSR = 24,200,675
SST = 42,699,149 SSE = SST-SSR = 18,498,474 R^2 = SSR/SST = 24,200,675/42,699,149 = 0.567 => khoảng 56.7% số tiền chi tiêu bằng thẻ tín dụng phụ thuộc vào quy mô gia đình
Trang 35PTHQ tổng thể: Y=β0 + β1*X giả thuyết H0: β1=0
H1: β1≠0 chỉ tiêu kiểm định tstat = b1/S(b1) =7.924 t(α/2) = t(0.025;48) = 2.0106
Trang 36Coefficients
Standard Error t Stat P-value
Lower 95%
Upper 95%
Intercept 1304.9048 197.6548 6.6019
3.287E-08 907.2745 1702.5350 Income (X1)
7.682E-11 25.1506 41.1154 Household (X2)
Hệ số xác định bội R2= 0.8256 => Kết quả này cho biết 82.56% biến thiên trong tiền chi tiêu qua thẻ tín dụng có thể được giải thích bởi mối liên hệ tuyến tính giữa tiền chi tiêu qua thẻ tín dụng với thu nhập và quy mô gia đình, nhưng tầm quan trọng không ngang nhau
Hệ số xác định hiệu chỉnh R2(adj)=0.8181 => Cho biết 81.81% biến thiên
Trang 37Sai số chuẩn của ước lượng Sy/x=398.0910
5 Thông tin thêm
Trên thực tế thì tiền chi tiêu qua thẻ tín dụng không chỉ chịu ảnh hưởng của 2 yếu
tố trên mà còn chịu ảnh hưởng của nhiều yếu tố khác nữa, ví dụ như: tuổi, trình độ học vấn,số thành viên có thu nhập, tiết kiệm
Nên đưa thêm vào mô hình biến tuổi, số thành viên có thu nhập Vì những biến này có thể dễ dàng điều tra