1. Trang chủ
  2. » Kinh Tế - Quản Lý

Bài tập lớn thống kê ứng dụng

38 4,8K 60

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 38
Dung lượng 1,39 MB

Nội dung

9 4.Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu .... 11 6.Sự liên hệ giữa thời gian truy cập website với số trang đã xem .... 20 3.Ước lượng khoảng trung bình của c

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VIỆN KINH TẾ VÀ QUẢN LÝ

- o0o -

TIỂU LUẬN HỌC PHẦN THỐNG KÊ ỨNG DỤNG

Giảng viên hướng dẫn : Ths Lê Văn Hòa Nhóm sinh viên : Phạm Hồng Thương 20136566

: Nguyễn Thị Thùy Linh 20135898

Trang 2

LỜI CẢM ƠN

Thống kê ứng dụng là môn học rất cần thiết trong học tập và giảng dạy đối với giáo dục đại học Việt Nam nói chung và sinh viên các ngành kinh tế nói riêng Đặc biệt là đối với sinh viên của các chuyên ngành khối kinh tế - xã hội

Những tình huống thực tế sẽ giúp sinh viên hiểu sâu và hiểu kĩ lý thuyết hơn, có thể vận dụng những gì đã học vào tình huống cụ thể mà sau này có thể sẽ gặp trong công việc Làm quen với những thách thức cần phải đưa ra một quyết định trong dự án kinh doanh của chính mình hoặc của doanh nghiệp mà mình công tác

Để hoàn thành được bài tiểu luận này, nhóm chúng em đã nỗ lực rất nhiều và chúng

em xin gửi lời cảm ơn sâu sắc tới thầy giáo, Thạc sĩ Lê Văn Hòa, bộ môn Quản trị

kinh doanh Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội đã đồng hành cùng chúng em suốt quá trình nghiên cứu và học tập, cảm ơn thầy đã tận tình giảng dạy và truyền thụ kiến thức, kinh nghiệm cũng như phong cách trình bày, để chúng em

có thêm những bài học quý báu

Do chưa có cơ hội va chạm và tiếp xúc với môi trường thực tế trong kinh doanh nên nhóm có thể chưa hiểu rõ hoặc hiểu sai những yêu cầu trong tình huống, bài làm còn những sai sót, rất mong nhận được sự góp ý và sửa chữa của thầy và các bạn

Chúng em xin trân trọng cảm ơn!

Hà Nội ngày 5 tháng 10 năm 2015

Nhóm thực hiện

Trang 3

MỤC LỤC

Lời cảm ơn 1

Tình huống 1:Công ty sô-cô-la Heavenly Chocolates 4

1 Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả 4

1.1.Đối với thời gian truy cập website công ty 4

1.2.Đối với số trang đã đọc 5

1.3.Đối với số tiền chi tiêu bình quân một giao dịch 7

2 Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo từng ngày thứ trong tuần 8

3.Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo loại trình duyệt web đã sử dụng 9

4.Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu 9

4.1.Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền chi tiêu 10

5.Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu 10

5.1.Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và

số tiền chi mua hàng 11

6.Sự liên hệ giữa thời gian truy cập website với số trang đã xem 11

6.1.Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang đã xem

11

Tình huống 2: 12

Công ty sản xuất đồ chơi trẻ em Specialty Toys 12

1.Đồ thị phân phối 12

2.Xác suất hết hàng đối với các phương án đặt hàng được đề ra 13

3.Lơi nhuận kì vọng 14

3.1 Giả định bán được 10000 sản phẩm 14

3.2 Giả định bán được 20000 sản phẩm 14

3.3 Giả định bán được 30000 sản phẩm 14

Trang 4

5.Khuyến nghị 16

Tình huống 3:Công ty nghiên cứu thị trường Metropolitan Research(Chapter 8, Auto) 17

1.Phân tích thông kê mô tả 17

2.Ước lượng trung bình khoảng 18

3 Thảo luận hàm ý 18

4.Xác định cỡ mẫu 19

5)Thông tin thêm 19

Tình huống4:Thu nhập của nhân viên bán hàng(Chapter 13, SalesSalary) 20

1.Phân tích thống kê mô tả 20

2.Ước lượng khoảng trung bình 20

3.Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp 21

4.Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa 21

5.Kiểm định giả thuyết 22

6.Kiểm định giả thuyết 23

7.Kiểm định giả thuyết 25

Tình huống 5:Chi tiêu qua thẻ tín dụng của người tiêu dùng(Chapter 15, Consumer) 27 1.Thống kê mô tả 27

2.Xây dựng phương trình hồi qui mẫu 27

3.Xây dựng phương trình hồi quy bội 34

4.Dự báo 36

5.Thông tin thêm 36

TÀI LIỆU THAM KHẢO 37

Trang 5

Tình huống 1:

Công ty sô-cô-la Heavenly Chocolates

(Chapter 3, Shopper) Bài làm

1 Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả

Trang 7

Bin Frequency Cumulative %

Trang 8

Bin Frequency Cumulative %

Trang 9

Nhận xét: Khách hàng chi tiêu chủ yếu ở mức dưới 75$, chiếm 72.55% tổng lượng tiền

đã chi tiêu cho mua hàng online

2 Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo từng ngày thứ trong tuần

Trang 10

Thứ Số giao dịch Tổng số tiền($) Tần số(%) Số tiền bình quân($)

5, số lần giao dịch ít hơn, vì vậy lượng tiền chi tiêu ít hơn những ngày khác

3 Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo loại trình duyệt web đã sử dụng

Khách hàng chủ yếu sử dụng trình duyệt Internet Explorer để truy cập website, do đó

số tiền khách hàng đã chi tiêu cho mua hàng online ở trình duyệt web này lớn hơn các trình duyệt còn lại Tuy nhiên số tiền chi bình quân cho mỗi giao dịch lại thấp hơn Firefox và các trình duyệt web khác

4 Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu

Trang 11

4.1 Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền

chi tiêu

Hệ số tương quan mẫu r = 0.580048

Nhận xét: Giữa thời gian truy cập website và số tiền chi tiêu có mối liên hệ tương quan

tuyến tính thuận chiều, thời gian truy cập website càng nhiều thì số tiền chi tiêu càng cao

5 Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu

y = 3.0942x + 28.492 r² = 0.3365

0.00 20.00 40.00 60.00 80.00 100.00 120.00 140.00 160.00 180.00

y = 11.489x + 12.752 r² = 0.5237

0.00 20.00 40.00 60.00 80.00 100.00 120.00 140.00 160.00 180.00

Linear (Amount Spent ($))

Trang 12

5.1 Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và số tiền

chi mua hàng

Hệ số tương quan r = 0.7236

Nhận xét: Thông qua đồ thị tán xạ và hệ số tương quan r = 0.7236, ta nhận thấy có một

mối liên hệ tương quan tuyến tính mạnh giữa số trang đã xem trên website và số tiền chi mua hàng, tức là số lượng trang của website được xem càng nhiều thì số lượng tiền khách hàng đã chi tiêu để mua hàng của công ty càng lớn

6 Sự liên hệ giữa thời gian truy cập website với số trang đã xem

6.1 Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang

y = 1.7725x + 4.2666 r² = 0.3547 0.0

5.0 10.0 15.0 20.0 25.0 30.0 35.0

Trang 13

Đồ thị phân phối nhu cầu mua hàng

Ta có P(xbar - Zα/2 𝜎xbar <= 𝜇<= xbar + Zα/2 𝜎xbar ) = 1 – α = 0.95

Trang 14

 Vậy giá trị TB và độ lệch chuẩn của phân phối lần lượt là: Xbar=20000; 𝜎xbar =

Trang 15

Tổng tiền bán được giá 5$($)

Tổng tiền đầu tư mua sản phẩm giá 16$ ($)

Lợi nhuận ($)

Tổng tiền bán giá 5$ ($)

Tổng tiền đầu

tư giá 16$ ($)

Lợi nhuận ($)

Tổng tiền bán giá 5$ ($)

Tổng tiền đầu

tư giá 16$ ($)

Lợi nhuận ($)

Trang 16

4 Lợi nhuận dự kiến

Gọi số lượng hàng cần đặt mua là S( sản phẩm ) Vì lượng hàng cần đặt phải đáp ứng 70% nhu cầu người mua và chỉ nên 30% hết hàng

Hay lượng hàng ta cần đặt mua là 20404 sản phẩm

 Lợi nhuận dự kiến thu được là:

doanh thu kì giáng sinh (x4)

tiền bán hàng tồn kho (x5)

số tiền mua hàng (x6)

lợi nhuận ( x7) X3= x1-x2 X4 =x2 *24 $ X5= x3 * 5$ X6= x1*16$ X7= x4+x5 –x6

Trang 19

 Trung bình mẫu: mean = 73 340.30

 Khoảng ước lượng cho µ là: L ≤ µ ≤ U

Vậy với độ tin cậy 95%, số dặm trung bình tổng thể lái được đến khi bộ truyền động bị lỗi được ước lượng trong khoảng từ 66438.73 miles đến 80241.87 miles.Vì giá trị 73340.30 thuộc khoảng ước lượng này nên ta có thể khẳng định bộ truyền động hoạt động bình thường

0 20000 40000 60000 80000 100000 120000 140000 160000 180000

Miles BoxPlot

Trang 20

 Hệ số skewness = 0.26>0 nên suy ra dữ liệu có phân phối lệch phải

 Độ trải giữa R0 = 86 575 – 60 421 = 26 154 => mức độ phân tán của dữ liệu khá lớn

 Trung vị nằm giữa 2 tứ phân vị cho thấy phân phối khá đều

Vậy cho nên chưa có đủ căn cứ để tin rằng một số người mua xe hơi đã bị hỏng bộ truyền động sớm

4) Xác định cỡ mẫu

Với e=5000; s = 24898.72; Zα/2= 1.96 thì cần lấy cỡ mẫu tối thiểu là:

N = (Zα/2*s)2/e2 = (1.96*24898.72)2/50002 = 95.263

Vậy lấy cỡ mẫu tối thiểu là 96 chiếc xe

5) Thông tin thêm

Để đánh giá vấn đề lỗi bộ truyền động một cách đầy đủ hơn thì cần có thêm thông tin về:

 Tiêu chuẩn số dặm mà một chiếc xe bình thường lái được đến khi bị lỗi bộ truyền động mà công ty đặt ra

 Lấy cỡ mẫu lớn hơn để có dữ liệu với độ sai lệch ít hơn

Trang 21

sample standard deviation 10,838.67 Độ lệch chuẩn s

sample variance 117,476,831.86 Phương sai mẫu

3rd quartile 76,092.25 Tứ phân vị thứ 3

interquartile range 19,818.00 Độ trải giữa

2 Ước lượng khoảng trung bình

Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của tất cả những người bán hàng

n=120>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối normal

confidence interval 95.% lower 62,986.23 confidence interval 95.% upper 66,864.72 margin of error 1,939.25

Trang 22

 Với độ tin cậy 95%, thu nhập trung bình năm của tất cả những người bán hàng được ước lượng trong khoảng 62,986.23 đến 66,864.72

3 Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp

Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của các nhân viên bán hàng tại doanh nghiệp (inside)

n=60>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối normal

confidence interval 95.% lower 55,112.18

confidence interval 95.% upper 56,928.85

margin of error 908.33

 Với độ tin cậy 95%, thu nhập trung bình năm của các nhân viên bán hàng tại doanh nghiệp (inside) được ước lượng trong khoảng 55,112.18 đến 56,928.85

4 Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa

Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của các nhân viên bán hàng tại thực địa (outside)

n=60>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối normal

confidence interval 95.% lower 71,825.68 confidence interval 95.% upper 75,835.18 margin of error 2,004.75

Trang 23

 Với độ tin cậy 95%, thu nhập trung bình năm của các nhân viên bán hàng tại thực địa (outside) được ước lượng trong khoảng 71,825.68 đến 75,835.18

5 Kiểm định giả thuyết

H0: µ1=µ2, thu nhập do vị trí công tác là như nhau

H1: µ1≠µ2, có sự khác nhau về thu nhập do vị trí công tác

One factor ANOVA

Mean n Std Dev

73,830.4 60 7,922.96 outside 64,925.5 120 10,838.67 Total ANOVA

Trang 24

p-value<α=0.05 => bác bỏ H0

 Với độ tin cậy 95% có đủ bằng chứng thống kê để bác bỏ giả thuyết H0, như vậy có sự khác nhau giữa thu nhập của nhân viên bán hàng tại doanh nghiệp (inside) và nhân viên bán hàng tại thực địa (outside)

6 Kiểm định giả thuyết

n=40>30 => Trung bình mẫu xấp xỉ phân phối normal

H0: µ1=µ2=µ3, Thu nhập do số năm kinh nghiệm là như nhau

H1: Có sự khác nhau về thu nhập do số năm kinh nghiệm

Trang 25

p-value=0.0006 < α=0.05 => bác bỏ H0=> Với độ tin cậy 95% có đủ bằng

chứng thống kê để bác bỏ giả thuyết H0, như vậy có sự khác nhau về thu nhập

do số năm kinh nghiệm

Phân tích sâu ANOVA:

Post hoc analysis

p-values for pairwise

Tukey simultaneous comparison t-values (d.f = 117)

Trang 26

p-valuelow-high=0.0053 < α=0.05 => Có sự khác nhau về thu nhập giữa người có kinh nghiệm thấp và người có kinh nghiệm cao

p-valuelow-medium=0.0002 <α => Có sự khác nhau về thu nhập giữa người có kinh nghiệm thấp và người có kinh nghiệm trung bình

7 Kiểm định giả thuyết

H0:

- Thu nhập do vị trí công tác là như nhau

- Thu nhập do số năm kinh nghiệm là như nhau

- Không có ảnh hưởng tương tác giữa vị trí công tác và số năm kinh nghiệm

H1:

- Có sự khác nhau về thu nhập do vị trí công tác

- Có sự khác nhau về thu nhập do số năm kinh nghiệm

- Có sự ảnh hưởng tương tác giữa vị trí công tác và số năm kinh nghiệm

Two factor ANOVA

Factor 2 Means:

ANOVA

table

value

p-Factor 1 9,515,793,950.21 1 9,515,793,950.208 751.36

5.32E-52

Trang 27

- Có sự khác nhau về thu nhập do vị trí công tác

- Có sự khác nhau về thu nhập do số năm kinh nghiệm

- Có sự ảnh hưởng tương tác giữa vị trí công tác và số năm kinh nghiệm

Trang 28

Household Size

Amount Charged ($)

Trang 29

i x(i) y(i) xi-𝒙 ̅ yi - 𝒚 ̅ (xi-𝒙 ̅)(yi-𝒚 ̅) ( xi-𝒙 ̅)^2 ( yi-𝒚 ̅)^2 (𝒀 ̂i-𝒚̅)^2

-6 55 4,070 11.52 105.940 1220.429 132.710 11,223.284 217463.669

7 37 2,731 -6.48

1,233.060 7990.229 41.990 1,520,436.964 68806.536

-14 33 2,514 -10.48

1,450.060 15196.629 109.830 2,102,674.004 179971.093

-19 44 2,995 0.52 -969.060 -503.911 0.270 939,077.284 443.102

20 37 4,171 -6.48 206.940 -1340.971 41.990 42,824.164 68806.536

21 62 5,678 18.52 1,713.940 31742.169 342.990 2,937,590.324 562035.096

22 21 3,623 -22.48 -341.060 7667.029 505.350 116,321.924 828081.800

Trang 31

TS(b1) MS(b1) SST SSR

𝑥̅= (∑xi)/n = 2174/50 = 43.48 𝑦̅ = (∑yi)/n = 198,203/50 = 3964.06 Phương trình hồi qui mẫu: 𝑌̂ = b0 + b1*x b1= TS(b1)/MS(b1) = 419956.560/10374.480 = 40.480 b0 = 𝑦̅ - b1*𝑥̅ = 3964.06 - 40.480*43.48 = 2203.990 PTHQ mẫu: 𝑌̂ = 2203.990 + 40.480*x

SSR = 16,999,938.312 SST = 42,699,148.820 SSE = SST-SSR= 25,699,210.508 R^2 = SSR/SST = 16,999,938.312/ 42,699,148.820 = 0.398 => Khoảng 39.8%

số tiền chi tiêu bằng thẻ tín dụng phụ thuộc vào thu nhập

Trang 32

Regression output confidence interval

variables coefficients

std

error t (df=48) p-value 95% lower 95% upper

Intercept 2,203.9996 329.0489 6.698 2.14E-08 1,542.4024 2,865.5968 x(i) 40.4798 7.1839 5.635 9.01E-07 26.0357 54.9239

PTHQ tổng thể: Y = β0 + β1*X giả thuyết: H0: β1=0

H1: β1≠0 chỉ tiêu kiểm định tstat = b1/S(b1) = 5.635 t(α/2) = t(0.025;48) = 2.0106 Ta thấy tstat >t(α/2) => β1≠0

* Quy mô hộ gia đình làm biến độc lập Lập bảng tính

i x(i) y(i) xi-𝒙 ̅ yi - 𝒚 ̅

Trang 34

𝑥̅ = (∑xi)/n = 171/50 = 3.42 𝑦̅ = (∑yi)/n = 198,203/50 = 3964.06 Phương trìn hồi qui mẫu: 𝑌̂ = b0 + b1*x b1 = TS(b1)/MS(b1) = 59,884/148 = 404.128 b0 =𝑦̅ - b1*𝑥̅ = 3964.06 - 404.128*3.42 = 2581.942 Vậy PTHQ mẫu là: 𝑌̂ = 2581.942 + 404.128*x SSR = 24,200,675

SST = 42,699,149 SSE = SST-SSR = 18,498,474 R^2 = SSR/SST = 24,200,675/42,699,149 = 0.567 => khoảng 56.7% số tiền chi tiêu bằng thẻ tín dụng phụ thuộc vào quy mô gia đình

Trang 35

PTHQ tổng thể: Y=β0 + β1*X giả thuyết H0: β1=0

H1: β1≠0 chỉ tiêu kiểm định tstat = b1/S(b1) =7.924 t(α/2) = t(0.025;48) = 2.0106

Trang 36

Coefficients

Standard Error t Stat P-value

Lower 95%

Upper 95%

Intercept 1304.9048 197.6548 6.6019

3.287E-08 907.2745 1702.5350 Income (X1)

7.682E-11 25.1506 41.1154 Household (X2)

Hệ số xác định bội R2= 0.8256 => Kết quả này cho biết 82.56% biến thiên trong tiền chi tiêu qua thẻ tín dụng có thể được giải thích bởi mối liên hệ tuyến tính giữa tiền chi tiêu qua thẻ tín dụng với thu nhập và quy mô gia đình, nhưng tầm quan trọng không ngang nhau

Hệ số xác định hiệu chỉnh R2(adj)=0.8181 => Cho biết 81.81% biến thiên

Trang 37

Sai số chuẩn của ước lượng Sy/x=398.0910

5 Thông tin thêm

Trên thực tế thì tiền chi tiêu qua thẻ tín dụng không chỉ chịu ảnh hưởng của 2 yếu

tố trên mà còn chịu ảnh hưởng của nhiều yếu tố khác nữa, ví dụ như: tuổi, trình độ học vấn,số thành viên có thu nhập, tiết kiệm

Nên đưa thêm vào mô hình biến tuổi, số thành viên có thu nhập Vì những biến này có thể dễ dàng điều tra

Ngày đăng: 15/05/2016, 17:04

TỪ KHÓA LIÊN QUAN

w