bài tiểu luận thống kê ứng dụng case 2 predicting winnings for nascar drivers

20 2 0
Tài liệu đã được kiểm tra trùng lặp
bài tiểu luận thống kê ứng dụng case 2 predicting winnings for nascar drivers

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CẢM ƠNBản ti u luân được hoàn thành trên cơ sở đóng góp của các thành viên với vốn kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Thống Kê -ng D/ng.. Đây cũng là một cơ

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘIVIỆN KINH TẾ VÀ QUẢN LÝ

BÀI TIỂU LUẬN

HỌC PHẦN: THỐNG KÊ ỨNG DỤNG CASE 2: PREDICTING WINNINGS FOR NASCAR DRIVERS

Giảng viên hướng dẫn: Hà Thị Thư Trang Nhóm sinh viên thực hiện: nhóm 11

Trang 2

LỜI CẢM ƠN

Bản ti u luân được hoàn thành trên cơ sở đóng góp của các thành viên với vốn kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Thống Kê -ng D/ng Đây cũng là một cơ hội thực hành khiến chúng em có th hi u rõhơn về các phân tích và ki m định đặc trưng có liên quan, áp d/ng kiến thức trên giảng đường đ làm quen và rút ra được nhưng kết luân bổ ích về những hiện tượng trong những mối tương quan khác nhau và sự ảnh hưởng lẫn nhau giữa các nhân tố Chúng em xin gửi lời cảm ơn sâu sắc tới cô Hà Thị Thư Trang,Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội đã đồng hành cùngchúng em suốt quá trình nghiên cứu và học tâp, cảm ơn cô đã tân tình giảng dạyvà truyền th/ kiến thức, kinh nghiệm cũng như phong cách trình bày, đ chúng em có thêm những bài học quý báu.

Do vốn kiến thức và kĩ năng còn hạn chế nên chắc hẳn bản báo cáo này không th tránh khỏi sai sót, chúng em rất mong nhân được sự góp ý động viên của cô đ chúng em có th hoàn thiện hơn, áp d/ng tốt hơn trong các công việc sau này.

Chúng em xin chân thành cảm ơn Cô.

Trang 3

ĐÓNG GÓP CỦA CÁC THÀNH VIÊN1 Thực hiện thống kê mô tả các biến: Nguyễn Thị Hương Giang2 Phân tích các câu hỏi gợi ý trong Case Problems: Lại Thế Việt, Phạm

Văn Hoan, Đặng Ngọc Chính

3 Ph_n ước lượng mô hình hồi quy bội: Cả nhóm4 Tổng kết nội dung, trình bày: Phùng Kim Thu 5 Thực hiện Slide thuyết trình: Phùng Kim Thu

2

Trang 5

I.ĐẶT VẤN ĐỀ

1 Đề bài:

Matt Kenseth đã thắng được cuộc đua Daytona 500 mùa giải 2012, cuộc đua quan trọng nhất của mùa giải NASCAR Chiến thắng của anh ấy không có gì ngạc nhiên vì trong mùa giải 2011, anh ấy đứng thứ 4 trong bảng xếp hạng đi mvới 2330 đi m, sau Tony Stewart (2403 đi m), Carl Edwards (2403 đi m) và Kevin Harvick (2345 đi m) Năm 2011, anh kiếm được 6.183.580 đô la khi thắng ba Ba Lan (tay đua nhanh nhất vòng loại), chiến thắng ba cuộc đua, về đích ở top 5 với 12times và về đích ở top 10 với 20times Hệ thống tính đi m của NASCAR năm 2011 đã phân bổ 43 đi m cho tay đua về đích đ_u tiên, 42 đi m cho tay đua về thứ hai, và cứ thế giảm xuống 1 đi m cho tay đua về đích ởvị trí thứ 43 Ngoài ra, bất kỳ tay đua nào dẫn đ_u vòng đua nhận được 1 đi m thưởng, tay đua dẫn đ_u vòng đua nhiều nhất nhận được thêm đi m thưởng và người chiến thắng cuộc đua được thưởng 3 đi m thưởng Tuy nhiên, số đi m tốiđa mà một tay đua có th kiếm được trong bất kỳ cuộc đua nào là 48 Bảng 1 hi n thị dữ liệu của mùa giải 2011 cho 35 tay đua hàng đ_u (trích: trang web NASCAR 28 tháng 2 năm 2011)

4

Trang 6

DriverPointsPolesWinsTop 5Top 10 Winnings ($)

Carl Edwards24033119268,485,990Kevin Harvick2345049196,197,140Matt Kenseth23303312206,183,580Brad

Jimmie Johnson23040214216,296,360Dale Earnhardt

Trang 7

1 Thống kê mô tả các biến:1.1.Tóm tắt dữ liệu:

1.2 Bảng tần số và đồ thị của dữ liệu:1.2.1 Điểm số (Points)

10 11

94% 100%

Histogram

Trang 8

Nhận xét: Đi m (Points) chủ yếu tập trung trong khoảng từ 745-1298 và từ 1851-2403, khá cao.

- Giá trị trung bình: 1304,2- Độ lệch chuẩn: 766,6- Biến thiên từ 192 đến 2403I.2.2 Số lần thắng Pole (Poles)

Trang 9

Nhận xét: H_u hết các tay đua đều không giành được pole, một số giành được pole 1 l_n và số ít người được 2, 3 l_n pole.

- Giá trị trung bình: 0,94- Độ lệch chuẩn: 1,1099- Biến thiên từ 0 đến 3.I.2.3 Số lần thắng (Wins) :

8

Trang 10

Nhận xét: H_u hết số l_n thắng của các tay đua là 0.- Giá trị trung bình: 1

- Độ lệch chuẩn: 1,4- Biến thiên từ 0 đến 5I.2.4 Số lần trong top 5 (Top 5):

Trang 11

Nhận xét: Ph_n lớn các tay đua nằm trong Top 5 từ 0-5 l_n.- Giá trị trung bình: 5,11

- Độ lệch chuẩn: 4,86- Biến thiên từ 0 đến 20I.2.5 Số lần trong Top 10 (Top 10):

Nhận xét: Số l_n đạt trong Top 10 phân bổ khá đều trong khoảng từ 0-21 l_n, riêng khoảng từ 21-26 l_n đạt Top 10 chỉ có 2 người chiếm 6% Độ tin cây đượcdự đoán chủ yếu là Tốt và Rất Tốt.

- Giá trị trung bình: 10,23- Độ lệch chuẩn: 7,15- Biến thiên từ 0 đến 26

2 Phân tích theo các câu hỏi được gợi ý trong Case-ProblemsPhân tích hồi quy

10

Trang 12

Giả sử:

- là biến ph/ thuộc Winnings.

- X1, X , X , X l_n lượt là các biến độc lập Poles, Wins, Top 5, Top 10.234

a Câu 1:

- Phương trình hồi quy:

biến động của biến ph/ thuộc

Trang 13

- Phương trình hồi quy:

= 4093477.71 + 612032.5758xX2

biến động của biến ph/ thuộc

- Sự ảnh hưởng của biến độc lập X3 đến biến ph/ thuộc

- Phương trình hồi quy:

= 3537775.2411 + 228328.0814xX312

Trang 14

- Với R Square = 0.7416 ➪ Biến độc lập X3 giải thích được 74.16% sự biến động của biến ph/ thuộc

Sự ảnh hưởng của biến độc lập X3 đến biến ph/ thuộc

- Phương trình hồi quy:

b Câu 2:

Trang 15

- Phương trình hồi quy:

- Từ phương trình hồi quy ta có th đưa ra kết luận:+ X1 cứ tăng 1 thì giảm trung bình 12938.9208 và ngược lại.+ X2 cứ tăng 1 thì tăng trung bình 13544.8127 và ngược lại.+ X3 cứ tăng 1 thì tăng trung bình 71629.3933 và ngược lại.+ X4 cứ tăng 1 thì tăng trung bình 117070.5768 và ngược lại.

- R Square = 0.8205 => cho thấy 82,05% biến thiên của biến ph/ thuộc Winnings có th được giải thích bởi mối liên hệ tuyến tính giữa các biến ph/c thuộc Winnings với 4 biến độc lập Poles, Wins, Top5, Top10.- Adjusted R Square = 0.7966 => cho thấy 79.66% sự biến thiên của biến

ph/ thuộc có th giải thích bởi mô hình hồi quy bội Đánh giá ý nghĩa toàn diện mô hình

- H0: R = 02

- H1: R ≠ 02

- F = MSR/MSE = 11586832038700.5/ 338005258749.844 = 34.28- Với mức ý nghĩa là =0,05 và n=35, k=4

(; = (;0,05) = 2,6914

Trang 16

F > (;

Wins, Top 5, Top 10 có th giải thích một cách có ý nghĩa cho biến thiên của biến ph/ thuộc Winnings.

Đánh giá ý nghĩa của từng biến độc lập riêng biệt.Biến X (Pole)1

- H0: �1 = 0 - H1: �1 ≠ 0- t(n-k-1, α/2) = 2.042

- t4 = (b – 0)/(S(b )) = 117070.5768/33432.8838 = 3.544

Trang 17

- |t4| > t(n-k-1, α/2) => bác bỏ giả thuyết H0 Biến X có ý nghĩa giải thích cho Winnings.4

c Câu 3:Giả sử:

- là biến ph/ thuộc Winnings.

- X1, X , X , X l_n lượt là các biến độc lập Poles, Wins, Top 2-5, Top 6-10234

16

Trang 18

- Phương trình hồi quy:

- Từ phương trình hồi quy ta có th đưa ra kết luận:

- R Square = 0.8205 => cho thấy 82,05% biến thiên của biến ph/ thuộc Winnings có th được giải thích bởi mối liên hệ tuyến tính giữa các biến ph/c thuộc Winnings với 4 biến độc lập Poles, Wins, Top 2-5, Top 6-10.- Adjusted R Square = 0.7966 => cho thấy 79.66% sự biến thiên của biến

ph/ thuộc có th giải thích bởi mô hình hồi quy bội.

Trang 19

Đánh giá ý nghĩa toàn diện mô hình- H0: R2 = 0

- H1: R2 ≠ 0

- F = MSR/MSE = 11586832038700.5/ 338005258749.844 = 34.28- Với mức ý nghĩa là =0,05 và n=35, k =4

=> (; = (;0,05) = 2,69

=> F > (; => bác bỏ giả thuyết H0

=> Mô hình hồi quy bội với các biến độc lập Poles, Wins, Top 2-5, Top 6-10 có th giải thích một cách có ý nghĩa cho biến thiên của biến ph/ thuộc Winnings.

Đánh giá ý nghĩa của từng biến độc lập riêng biệt.Biến X (Pole)1

- H0: �1 = 0 - H1: �1 ≠ 0- t(n-k-1, α/2) = 2.042

- t4 = (b – 0)/(S(b )) = 117070.5768/33432.8838 = 3.544

- |t4| > t(n-k-1, α/2) => bác bỏ giả thuyết H0

=> biến X có ý nghĩa giải thích cho Winnings.4

18

Trang 20

d Câu 4:

Vậy ta thấy mô hình hồi quy ở câu 3 có 3 biến độc lập có ý nghĩa giải thích cho Winnings trong khi mô hình hồi quy ban đ_u chỉ có duy nhất 1 biến độc lập có ý nghĩa giải thích cho Winnings, do đó nên chọn mô hình hồi quy ở câu 3 đ dự đoán cho biến ph/ Winnings.

Ngày đăng: 17/06/2024, 17:28