1. Trang chủ
  2. » Luận Văn - Báo Cáo

phân tích dữ liệu nascar

19 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Biến nào trong số bốn biến này cung cấp công cụ dự đoán đơn lẻ tốt nhất về số tiền thắng cược?2.. Phát triển một phương trình hồi quy ước tính có thể được sử dụng để dự đoán Số tiền thắn

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH T & QU N LÝẾ Ả

Trang 2

PHẦN II: Nghiên c u các ứnội dung trong Case problem, phân tích và gi i ảthích các mô hình

kết qu mô hình ả

Trang 3

2

MỤC LỤC

SƠ LƯỢC VÀ NHIỆM V NASCAR 3 Ụ

PHẦN I: TH NG KÊ MÔ T V CÁC BI N NGHIÊN CỐẢ ỀẾỨU QUAN TÂM 5

1: Biến “Điểm” 5

2: Biến “Poles” 6

4: Biến “Top 5” 9

5: Biến “Top 10” 10

6: Biến “Giải thưởng”: 11

Phần II: Nghiên c u các nứội dung trong Case problem, phân tích và gi i thích các mô hình.ả 12 Phần III: Th o lu n v kảậề ết qu mô hình 18 ả

Trang 4

3

SƠ LƯỢC VÀ NHIỆM V NASCAR

Matt Kenseth đã giành được Daytona 500 2012, cuộc đua quan trọng nhất của mùa gi i NASCAR Chiả ến th ng c a anh y không có gì ngắ ủ ấ ạc nhiên vì trong mùa giải 2011, anh ấy đứng thứ tư trên bảng xếp hạng với 2330 điểm, sau Tony Stewart (2403 điểm), Carl Edwards (2403 điểm) và Kevin Harvick (2345 điểm) Năm 2011, anh ấy kiếm được 6.183.580 đô la khi giành được ba giải Ba Lan (tay đua nhanh nhất trong vòng loại), chi n th ng ba cuế ắ ộc đua, về đích trong năm người dẫn đầu 12 lần và về đích trong top mười 20 lần Hệ thống điểm của NASCAR vào năm 2011 đã phân bổ 43 điểm cho tay đua về đích đầu tiên, 42 điểm cho tay đua về nhì, và cứ thế giảm xuống 1 điểm cho tay đua về đích ở vị trí th 43 Ngoài ra, b t kứ ấ ỳ tay đua nào dẫn đầu một vòng đua đều nhận được 1 điểm thưởng, tay đua dẫn đầu nhiều vòng đua nhất sẽ nhận được thêm điểm thưởng và người chiến thắng cuộc đua được thưởng 3 điểm thưởng Tuy nhiên, số điểm tối đa mà một tay đua có thể ếm đượ ki c trong bất kỳ cuộc đua nào là 48 Bảng 1 cho th y d liấ ữ ệu về mùa giải 2011 của 35 tay đua hàng đầu (trang web của NASCAR, ngày 28 tháng 2 năm 2011)

Driver Points Poles Wins Top

2-5 Top 6-10 Top 5 Top 10 Winnings ($)

Tony Stewart 2403 1 5 4 10 9 19 6,529,870 Carl Edwards 2403 3 1 18 7 19 26 8,485,990 Kevin Harvick 2345 0 4 5 10 9 19 6,197,140 Matt Kenseth 2330 3 3 9 8 12 20 6,183,580 Brad Keselowski 2319 1 3 7 4 10 14 5,087,740 Jimmie Johnson 2304 0 2 12 7 14 21 6,296,360 Dale Earnhardt Jr 2290 1 0 4 8 4 12 4,163,690 Jeff Gordon 2287 1 3 10 5 13 18 5,912,830 Denny Hamlin 2284 0 1 4 9 5 14 5,401,190 Ryan Newman 2284 3 1 8 8 9 17 5,303,020 Kurt Busch 2262 3 2 6 8 8 16 5,936,470 Kyle Busch 2246 1 4 10 4 14 18 6,161,020 Clint Bowyer 1047 0 1 3 12 4 16 5,633,950 Kasey Kahne 1041 2 1 7 7 8 15 4,775,160 A.J Allmendinger 1013 0 0 1 9 1 10 4,825,560 Greg Biffle 997 3 0 3 7 3 10 4,318,050 Paul Menard 947 0 1 3 4 4 8 3,853,690 Martin Truex Jr 937 1 0 3 9 3 12 3,955,560 Marcos Ambrose 936 0 1 4 7 5 12 4,750,390 Jeff Burton 935 0 0 2 3 2 5 3,807,780 Juan Montoya 932 2 0 2 6 2 8 5,020,780 Mark Martin 930 2 0 2 8 2 10 3,830,910

Trang 5

4

David Ragan 906 2 1 3 4 4 8 4,203,660 Joey Logano 902 2 0 4 2 4 6 3,856,010 Brian Vickers 846 0 0 3 4 3 7 4,301,880 Regan Smith 820 0 1 1 3 2 5 4,579,860 Jamie McMurray 795 1 0 2 2 2 4 4,794,770 David Reutimann 757 1 0 1 2 1 3 4,374,770 Bobby Labonte 670 0 0 1 1 1 2 4,505,650 David Gilliland 572 0 0 1 1 1 2 3,878,390 Casey Mears 541 0 0 0 0 0 0 2,838,320 Dave Blaney 508 0 0 1 0 1 1 3,229,210 Andy Lally* 398 0 0 0 0 0 0 2,868,220 Robby Gordon 268 0 0 0 0 0 0 2,271,890 J.J Yeley 192 0 0 0 0 0 0 2,559,500

Bảng 1

1.Giả sử bạn muốn dự đoán Tiền thắng ($) chỉ sử dụng số cột giành được (Poles), số trận thắng (Wins), số lần về đích ở vị trí cao nhất (Top 5) hoặc số lần về đích ở vị trí cao nhất (Top 10) Biến nào trong số bốn biến này cung cấp công cụ dự đoán đơn lẻ tốt nhất về số tiền thắng cược?

2 Phát triển một phương trình hồi quy ước tính có thể được sử dụng để dự đoán Số tiền thắng ($) cho số lượng poles đã thắng (poles), số lần thắng (Wins), số lượng hàng đầu năm lần về đích (Top 5) và số lần về đích trong top 10 (Top 10) Kiểm tra tầm quan trọng của từng cá nhân và thảo luận về những phát hiện và kết luận của bạn

3.Tạo hai biến độc lập mới: Top 2–5 và Top 6–10 Top 2–5 biểu thị số lần tay đua về đích từ vị trí thứ hai đến vị trí thứ năm và Top 6–10 biểu thị số lần tay đua về đích từ vị trí thứ sáu đến thứ mười Phát triển một phương trình hồi quy ước tính có thể được sử dụng để dự đoán Số tiền thắng ($) sử dụng Poles, Wins, Top 2–5 và Top 6–10 Kiểm tra ý nghĩa cá nhân và thảo luận về những phát hiện và kết luận của bạn

4 Dựa trên kết quả phân tích của bạn, phương trình hồi quy ước tính nào bạn sẽ đề xuất sử dụng để dự đoán Tiền thắng ($)? Cung cấp một diễn giải về các hệ số hồi quy ước tính cho phương trình này

Trang 6

5

PHẦN I: THỐNG KÊ MÔ T VẢ Ề CÁC BI N NGHIÊN C U ẾỨ

QUAN TÂM 1: Biến “Điểm”

* Các tham s th ng kê mô t c a biố ố ả ủ ến “Điểm”:

Trang 7

6

- Ph n lầ ớn các tay đua có điểm số trong khoảng từ 744,75 đến 1297,5 - Không tay đua nào có điểm thu c khoộ ảng 1297,5 đến 1850,25 - Số điểm không đồng đều

Trang 8

* Biểu đồ về số poles của các tay đua:

- Ph n lầ ớn các tay đua có số poles là 0 - Số Poles không đồng đều

3: Biến “Trận thắng”:

* Các tham s th ng kê mô t c a biố ố ả ủ ến “Trận thắng”: 0

Poles

Trang 9

8 * V i: ớ

- Tr n thậ ắng dao động từ 0 đến 5, trung bình là 1, trung vị là 0 - Các t phân v : Q = 0; Q = 0; Q = 1; mứ ị 123 ốt là 0

- H s l ch là 1,4533 (>0), d li u l ch ph i Sai s chuệ ố ệ ữ ệ ệ ả ố ẩn ước lượng là 0,2355 - Với độ tin c y 95%, giá tr quan sát là 0,4786 ậ ị

* Biểu đồ về số trận thắng của các tay đua:

- Ph n lầ ớn các tay đua có số trận thắng là 0 - S tr n thố ậ ắng không đồng đều

Wins

Trang 10

Top 5

Trang 12

6: Biến “Giải thưởng”:

* Các tham s th ng kê mô t c a biố ố ả ủ ến “Giải thưởng”:

- Với độ tin c y 95%, giá tr quan sát là 442770,4218 ậ ị* Biểu đồ phân ph i giố ải thưởng của các tay đua:

Trang 13

* Hệ số tương quan giữa các biến Poles, Wins, Top 5, Top 10 và biến Giải thưởng:

R Poles Wins Top 2-5 Top 6-10 Top 5 Top 10 thưởng Tiền

Wins 0.13313526 1 Top 2-5 0.48893427 0.53722 1 Top 6-10 0.33005646 0.41968 0.41113 1

Top 5 0.43731218 0.72517 0.97034 0.45592 1

Top 10 0.45781177 0.69717 0.85981 0.795851 0.901745 1 Tiền

* Kiểm định tương quan giữa biến Top 10 và Tiền thưởng với ý nghĩa 𝛼= 0,05 (Độ tin cậy 95%)

- G i là h sọ 𝜌 ệ ố tương quan giữa biến Top 10 và Tiền thưởng

Trang 14

13 C p gi thuy t: H : = 0 ặ ả ế 0 𝜌

H : 1 𝜌 ≠0 Giá tr quan sát: t = ị qs𝑅

*Phân tích hồi quy tuyến tính để dự đoán Giải thưởng ($) dựa trên Số lần giành pole, số Trận thắng, Top 5 và Top 10

- H sệ ố xác định điều ch nh b i: R = 0,797 ph n ánh mỉ ộ ả ức độ phù hợp của mô hình h i quy là t t, có th cho r ng các biồ ố ể ằ ến độ ậc l p (Poles, Tr n th ng, Top 5, ậ ắTop 10) giải thích t t cho biố ến ph thuụ ộc (Tiền thưởng)

Trang 15

- Phát hi n: ệ

+ Ch riêng biỉ ến Top 10 có ý nghĩa giải thích bi n ph thu c Tiế ụ ộ ền thưởng vì có value là 0,001 (<0,05)

P-+ Top 10 có ảnh hưởng l n nhớ ất đến Ti n ề thưởng

+ S Poles ố có tác động ngược chiều; các biến còn lại có tác động cùng chiều đến Tiền thưởng

- K lu n: Trong mô hình h i quy, các bi n Poles, Tr n thế ậ ồ ế ậ ắng, Top 5 và Top 10 đều ảnh hưởng tới biến Tiền thưởng với mức độ giải thích là 82% (Hệ số R Square là 0,82)

3: Tạo hai biến độc lập mới: Top 2–5 và Top 6 10 Top 2– –5 biểu thị số lần tay đua về đích từ vị trí thứ hai đến vị trí thứ năm và Top 6–10 biểu thị số lần tay đua về đích từ vị trí thứ sáu đến thứ mười Phát triển một phương trình hồi quy ước tính có thể được sử dụng để dự đoán Số tiền thắng ($) sử dụng Poles, Wins, Top 2–5 và Top 6–10 Kiểm tra ý nghĩa cá nhân và thảo luận về những phát hiện và kết luận của bạn

Trang 16

Y=3140367,09- 12938,92.X + 202244,78.X + 188699,97.X + 117070,58.X + e 1234

- V i : Y: Ph n ớ ầ thưởng ($); 3140367,09 là hệ số chặn X : s Poles 1 ố

X : Tr n th ng 2 ậ ắ X : Top 2-5 3

X : Top 6-10 4

Trang 17

16 e: H s phệ ố ần dư

* Ảnh hưởng của từng biến, những phát hiện và kết luận.- Ảnh hưởng của các biến độc lập đến biến phụ thuộc:

+ Trong các biến độc lập, chỉ trừ biến Poles, các biến còn lại đều tương quan dương đến biến phụ thuộc Tiền thưởng (Đồng biến)

+ Biến Poles có P value= 0,905 (>0,05) nên trong mô hình, nó không có ý nghĩa thống kê

Phát hi n: ệ

+ Chỉ trừ biến Poles, ta có thể chấp nhận các hệ số hồi quy còn lại của mô hình

- K lu n: Trong mô hình h i quy, ch tr bi n Poles, Tr n th ng, Top 2-5 và Top 6-10 ế ậ ồ ỉ ừ ế ậ ắđều ảnh hưởng tới biến Tiền thưởng với mức độ ả gi i thích là 82% (H s R Square là ệ ố0,82)

4: Dựa trên kết quả phân tích trên, phương trình hồi quy ước tính nào sẽ đề xuất sử dụng để dự đoán Tiền thưởng ($)? Cung cấp một diễn giải về các hệ số hồi quy ước tính cho phương trình này

- Trong các nghiên cứu trên, ta thấy hầu hết các biến độc lập đều ảnh hưởng đến biến Tiền thưởng, nên ta không thể chọn một yếu tố để giải thích sự thay đổi của biến phụ thuộc Tiền thưởng

- Ở mô hình dự đoán ố iền thưởngs T ($) bằng số Poles, số lần thắng (Wins), số Top 5 và số lần về đích trong Top 10; mặc dù có hệ số xác định lớn (82%), nhưng mô hình lại chỉ có thể chấp nhận biến Top 10, nên ta không chọn mô hình này - Ở mô hình dự đoán iền th ng ($) sử dụng T ưở Poles, Wins, Top 2–5 và Top 6–10; ta chỉ loại bỏ biến Poles, chấp nhận 3 biến độc lập còn lại với hệ số xác định tương đối cao, nên ta có thể để cử mô hình gồm 3 biến độc lập: Trận thắng, Top 2-5, Top 6-10 để dự đoán cho Tiền thưởng

- Bảng hân tích hồi quy tuyến tính giữa các biến Trận thắng, Top 2–p 5 và Top 6–10 với biến Tiền thưởng :

Trang 18

17

- Mức ý nghĩa thống kê <0.001, mô hình này chấp nhận được Giá trị R Square= 0,82, các biến độc lập giải thích được 8 % sự biến thiên của Tiền thưởng ($).2- Cả ba nhân tố đều có tác động đến biến Giải thưởng ($) là Trận thắng, Top 2-5 và Top 6-10 (với mức ý nghĩa thống kê P-value lần lượt là 0,024; 0,000; 0,001 nhỏ hơn 0,005)

- Phương trình hồi quy tuyến tính của Tiền thưởng ($) theo các biến đầu vào có dạng:

Y=3138093,984- 204735,492.X + 186778,041.X + 116188,773.X + e 123Trong đó: Y: Tiền thưởng

X1: Trận thắng X : Top 2-5 2 X : Top 6-10 3 e: Hệ số phần dư

- C ba biả ến độ ập đềc l u có ảnh hưởng cùng chi u v i bi n phề ớ ế ụ thu c Tiộ ền thưởng (Đồng biến) Khi tay đua có thêm 1 Trận thắng thì tiền thưởng anh nhận được sẽ tăng thêm trung bình 204735,492 Còn khi tay đua nằm trong Top 2-5 thì anh ta s kì v ng ẽ ọđược nhận thêm trung bình 186778,041; nếu nằm trong Top 6-10 thì con số đó là 116188,773 đô-la

Trang 19

18

PHẦN III: TH O LU N VẢẬỀ KẾT QUẢ MÔ HÌNH

Giải thưởng c a mủ ột tay đua phụ thuộc vào r t nhi u y u t , mấ ề ế ố ột số yếu t ốquan tr ng trong sọ ố đó là: Cọc thắng, S trố ận thắng, Top 5, Top 10 hoặc các biến tự tạo ra như Top 2-5, Top 6-10 Có thể d a vào các s liự ố ệu thống kê về các yếu tố này để làm cơ sở dự đoán cho Tiền thưởng tương ứng mà tay đua có thể nhận được

Dựa vào phân tích tương quan và hồi quy gi a bi n ph thu c và biữ ế ụ ộ ến độc lập ta có một số k t luận quan tr ng sau: ế ọ

- Ti n ề thưởng có mức độ tương quan khá chặt chẽ với Top 5 và Top 10 Top 10 có ảnh hưởng lớn nhất đến Tiền thưởng

- Mô hình h i quy b i c a Giồ ộ ủ ải thưởng theo Poles, Trận th ng, Top 5, Top 10 ắcó h sệ ố xác định l n nh t vớ ấ ới 82%

- Ở mô hình dự đoán iền th ng ($) sử dụng T ưở Poles, Wins, Top 2–5 và Top 6–10; ta chỉ loại bỏ biến Poles, chấp nhận 3 biến độc lập còn lại với hệ số xác định tương đối cao, nên ta có thể để cử mô hình gồm 3 biến độc lập: Trận thắng, Top 2-5, Top 6-10 để dự đoán cho Tiền thưởng.

- Mô hình h i quy b i c a Giồ ộ ủ ải thưởng theo Trận th ng, Top 2-5 và Top 6-10 có ắkiểm định h s h i quy t t nh t (ch p nhệ ố ồ ố ấ ấ ận tất cả các hệ số hồi quy)

Ngày đăng: 17/06/2024, 17:09

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w