1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài tập lớn xác suất – thống kê

19 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài tập lớn Xác suất – Thống kê
Tác giả Phan Đăng Quý, Nguyễn Luân, Phạm Văn Phúc Hoàng, Đặng Lê Minh Nhật, Bùi Thế Trí, Nguyễn Tấn Duy, Cao Tấn Phát, Lưu Minh Trí, Phạm Thế Khang
Trường học Trường Đại học Bách Khoa - Đại học Quốc gia TP.HCM
Chuyên ngành Xác suất – Thống kê
Thể loại Bài tập lớn
Thành phố TP.HCM
Định dạng
Số trang 19
Dung lượng 3,19 MB

Nội dung

Trình bày lý thuy ết: - Dạng kiểm định: Hồi quy tuyến tính đơn... - Đồ thị biểu diễn các điểm có tọa độ X và Y cùng với đường quan hệ giữa X và Y:... Trình bày lý thuy ết: - Dạng kiểm đị

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA

-oOo

Phan Đăng Quý 1811185 Nguyễn Luân 1812996 Phạm Văn Phúc Hoàng 1810929 Đặng Lê Minh Nh t ậ 1811119 Bùi Thế Trí 1814452 Nguyễn Tấn Duy 1810869 Cao T n Phát ấ 1811136 Lưu Minh Trí 1811298 Phạm Thế Khang 1812558

Trang 2

MỤC L C

Phân công công việc 3

I Bài 1 4

1 Trình bày lý thuy ết: 4

2 Trình bày tính toán: 4

3 Trình bày k t qu : ế ả 4

II Bài 2 6

1 Trình bày lý thuy ết: 6

2 Trình bày tính toán và k t qu : ế ả 7

2.1 S ự phụ thuộc (độ ậc l p) của yếu tố giới tính và âm thanh: 7

2.2 S ự phụ thuộc (độ ậc l p) của yếu tố giới tính và ánh sáng: 8

2.3 S ự phụ thuộc (độ ậc l p) của yếu tố giới tính và xung nhị 10 p: III Bài 3 12

1 Trình bày lý thuy ết: 12

2 Trình bày tính toán: 12

3 Trình bày k t qu : ế ả 12

IV Bài 4 14

1 Trình bày lý thuy ết: 14

2 Trình bày tính toán: 15

3 Trình bày k t qu : ế ả 16

Tài li u tham khảo 19

Trang 3

Phân công công vi c

Phân công Họ và tên thành viên Mức độ đóng góp Bài 1 Cao T n Phát - 1811136 ấ 11.11%

Nguyễn Luân - 1812996 11.11% Bài 2 Phạm Văn Phúc Hoàng - 1810929 11.11%

Nguyễn Tấn Duy - 1810869 11.11% Bài 3 Đặng Lê Minh Nh - 1811119 ật 11.11%

Lưu Minh Trí - 1811298 11.11% Bài 4 Phan Đăng Quý - 1811185 11.11%

Bùi Th Trí - 1814452 ế 11.11% Tổng h p bài ợ Phạm Th Khang - 1812558 ế 11.11%

Trang 4

I Bài 1 S d ng hử ụ ồi quy tuyến tính, mô hình hoá d ữ liệu sau đây:

1 Trình bày lý thuy ết:

- Dạng kiểm định: Hồi quy tuyến tính đơn

- Các biến đượ ử ụng trong bài toán: X và Y theo đề bài c s d

- Mục tiêu là xác định được hệ số chặn β0 và h s ệ ố góc β1 từ đó xác định được phương trình của đường h i quy tuy n tính m u có d ng: ồ ế ẫ ạ

Y = β + β0 1X

2 Trình bày tính toán:

- Nhập giá trị c a biủ ến X:

- Nhập giá trị c a biủ ến Y:

- Tính toán giá tr cị ủa β và β0 1 b ng hàm lm (linear model): ằ

- Đưa các thông số tính toán của hàm lm vào object reg:

- Vẽ đồ thị biểu diễn các điểm với tọa độ X và Y cho trong bảng đề bài:

- Vẽ đường bi u di n m i liên h ể ễ ố ệ giữa X và Y b ng l nh abline: ằ ệ

3 Trình bày k t quế ả:

- Giá trị của X và Y được nhập vào:

- Giá tr cị ủa β0và β1 được tính b i hàm lm: ở

Trong đó β = 0.9241 và β1 0 = 40.05

Trang 5

- Đồ thị biểu diễn các điểm có tọa độ X và Y cùng với đường quan

hệ giữa X và Y:

Trang 6

II Bài 2 Mộ t nhà nghiên c u mu n ki m tra ứ ố ể thờ i gian ph n x

của nam và n i v i nh ng lo i tín hiữ đố ớ ữ ạ ệu khác nhau H ọ được yêu cầu nh n nút Enter trên bàn phím máy tính ngay khi h ọ nhận được

tín hi u Kho ng th i gian (tính b ng giây) t lúc phát tín hiệ ả ờ ằ ừ ệu đến

lúc nút Enter được nhấn Đây là kết qu ả của 15 người nam và 15

ngườ ữi n :

Giới tính Âm thanh Ánh sáng Xung nh p

Nam 10.0

7.2 6.8 6.0 5.0

6.0 3.7 5.1 4.0 3.2

9.1 5.8 6.0 4.0 5.1

Nữ 10.5

8.8 9.2 8.1 13.4

6.6 4.9 2.5 4.2 1.8

7.3 6.1 5.2 2.5 3.9 Trình bày k t luế ận ở mức ý nghĩa thống kê = 5% Y u t ế ố giớ i tính và lo ại

tín hi u có ệ ảnh hưởng đến k ết quả không?

1 Trình bày lý thuy ết:

- Dạng kiểm định: Kiểm định tính độc lập

- Các biến đượ ử ụng trong bài toán: H s c s d ệ ố 𝒳𝛼2để so sánh với 𝜒2kiểm tra tính độ ậc l p, ngoài ra còn có các biến dùng để tính toán ph c v yêu ụ ụ cầu đề bài

- Giả thuyết:

+ H0: P = P ; P = P1 1,0 2 2,0; … ; Pk = Pk,0 ⇔ “Các cặp P và P i i,0giống nhau” + H1: “Ít nh t có m t cấ ộ ặp P và P khác nhau i i,0 ”

➢ Biện lu n: ậ

- Nếu 𝒳2> 𝒳𝛼2 Bác b⇒ ỏ giả thuyết H (DF = k- 0 1)

❖ Giá tr ị thống kê χ2 theo bi u thể ức:

- Trong đó

+ Oij: t n s ầ ố thực nghi m c a ô thu c hàng i và c t j (observed frequency) ệ ủ ộ ộ + Eij: t n s lý thuy t c a ô thu c hàng i v i c t j (expected ầ ố ế ủ ộ ớ ộ

frequency)

Trang 7

+ r: s hà ố ng

+ c: s c t ố ộ

2 Trình bày tính toán và k t qu : ế ả

2.1 Sự phụ thu ộc (độ ậ c l p) c a y u t ủ ế ố giới tính và âm thanh:

- H0: Phân b ố thời gian tương tác với âm thanh gi a 2 nhóm gi i tính là ữ ớ như nhau

- H1: Phân b ố thời gian tương tác với âm thanh gi a 2 nhóm gi i tính là ữ ớ không như nhau

2.1.1 Trình bày tính toán

- Nhập bảng s u ố liệ

- Tính toán t ng các hàng và các c t c a ma tr n ổ ộ ủ ậ

- Tính toán các t n s ầ ố thực nghi m và t n s lý thuy t ệ ầ ố ế

- Tính toán giá tr ịthống kê kiểm định

2.1.2 Trình bày k t qu : ế ả

- Giá tr s ị ố liệu được nh p vào ậ

- Tính toán giá tr tị ổng hàng và t ng c t c a ma tr n ổ ộ ủ ậ

Trang 8

- Tính toán các t n s ầ ố thực nghi m và t n s lý thuy t ệ ầ ố ế

- Giá tr ịthống kê kiểm định

2.1.3 Kết luận:

- Giá tr tính toán th ng kê kiị ố ểm định: 𝒳2= 2.1

+ Nếu H 0đúng, thống kê 𝑄2 có phân phối Chi bình phương với (r-1)(s-1) bậc tự do

+ Bác b Hỏ 0 khi 𝒳2> 𝒳𝛼2

- Ta có: 𝒳𝛼2

= 9,49 > 𝒳2= 2,1 ➔ Do đó chấp nh n gi thuy t H ậ ả ế 0

2.2 Sự phụ thu ộc (độ ậ c l p) c a y u t ủ ế ố giới tính và ánh sáng:

- H0: Phân b ố thời gian tương tác với ánh sáng gi a 2 nhóm gi i tính là ữ ớ như nhau

- H1: Phân b ố thời gian tương tác với ánh sáng gi a 2 nhóm gi i tính là ữ ớ không như nhau

2.2.1 Trình bày tính toán:

- Nhập bảng s u ố liệ

- Tính toán t ng các hàng và các c t c a ma tr n ổ ộ ủ ậ

Trang 9

- Tính toán các t n s ầ ố thực nghi m và t n s lý thuy t ệ ầ ố ế

- Tính toán giá tr ịthống kê kiểm định

2.2.2 Trình bày k t qu : ế ả

- Giá tr s ị ố liệu được nh p vào ậ

- Tính toán giá tr tị ổng hàng và t ng c t c a ma tr n ổ ộ ủ ậ

- Tính toán các t n s ầ ố thực nghi m và t n s lý thuy t ệ ầ ố ế

- Giá tr ịthống kê kiểm định

2.2.3 Kết luận:

- Giá tr ịgiả thuy t thế ống kê kiểm định: 𝒳2= 8.49

+ Nếu H 0đúng, thống kê 𝑄2 có phân phối Chi bình phương với (r-1)(s-1) b c t do ậ ự

Trang 10

+ Bác b Hỏ 0 khi 𝒳2> 𝒳𝛼2

- Ta có: 𝒳𝛼

2

= 9.49 > 𝒳2= 8.49 ➔ Do đó chấp nhận giả thuyết H 0

2.3 Sự phụ thu ộc (độ ậ c l p) c a y u t ủ ế ố giới tính và xung nhị p:

- H0 : Phân b ố thời gian tương tác với xung gi a 2 nhóm giữ ới tính là như nhau

- H1 : Phân b ố thời gian tương tác với xung gi a 2 nhóm gi i tính là ữ ớ

không như nhau

2.3.1 Trình bày tính toán:

- Nhập bảng s u: ố liệ

- Tính toán t ng các hàng và các c t c a ma tr n: ổ ộ ủ ậ

- Tính toán các t n s ầ ố thực nghi m và t n s lý thuy t ệ ầ ố ế

- Tính toán giá tr ịthống kê kiểm định

2.3.2 Trình bày k t qu : ế ả

- Giá tr s ị ố liệu được nh p vào ậ

Trang 11

- Tính toán giá tr tị ổng hàng và t ng c t c a ma ổ ộ ủ trận

- Tính toán các t n s ầ ố thực nghi m và t n s lý thuy t ệ ầ ố ế

- Giá tr ịthống kê kiểm định

2.3.3 Kết luận:

- Giá tr ịgiả thuy t thế ống kê kiểm định: 𝒳2= 14.4

+ Nếu H 0đúng, thống kê 𝑄2 có phân phối Chi bình phương với (r-1)(s-1) b c t do ậ ự

+ Bác b Hỏ 0 khi 𝒳2> 𝒳𝛼2

- Ta có: 𝒳𝛼2

= 9.49 < 𝒳2= 14.4 ➔ Do đó bác bỏ giả thuy t H ế 0→ Chấp nh n giả thuyết H ậ 1

Trang 12

III Bài 3 Để tìm hiểu xem độ lớn của công ty có ảnh hưởng đến

hiệu qu khi qu ng cáo không, cu c thả ả ộ ống kê được tiến hành v i việc

lấy ý ki n cế ủa 356 khách hàng, có b ng thả ống kê sau đây:

Độ lớn c a công ty Độ hiệu quả trong qu ng cáo

Cao Trung bình Thấp Nhỏ

Vừa

Lớn

20

53

67

52

47

32

32

28

25 Với mức ý nghĩa = 0.1, có đủ dữ kiện để kết luận rằng độ lớn của công ty có

ảnh hưởng đến hi u qu khi qu ng cáo? ệ ả ả

1 Trình bày lý thuy ết:

- Phát bi u gi thiể ả ết 𝐻0: Tầm ảnh hưởng và kích thước công ty độc lập

- Dạng kiểm định tính độc lập

- Tìm ra h s ệ ố 𝑄2để so sánh với 𝜒2 để kiếm tra có độc lập hay không

2 Trình bày tính toán:

- Nhập thông s ố ảnh hưởng của công ty nh : ỏ

- Nhập thông s ố ảnh hưởng của công ty v a ừ

- Nhập thông s ố ảnh hưởng của công ty l n ớ

3 Trình bày k t quế ả:

- Gộp thành ma tr n tậ ổng:

-

- Tính t ng hàng và c i, ổ ột j tương ứng:

- Tính kích thước mẫu:

Trang 13

- T n s lý thuyầ ố ết:

- Tính th ng kê kiố ểm định

Ta có: 𝜒( 𝑟−1 𝑠−1 )( )

2 (0,05) = 𝜒4(0,05) = 9,47

Suy ra:

𝑄2> 𝜒4(0,05)

➔ K t ế luận: Ta k t luế ận độ ớ l n của công ty có ảnh hưởng đến sự hiệu qu khi ả

quảng cáo

Trang 14

IV Bài 4 Số lượ ng h ọc sinh đi trễ ở 4 trường vào nh ng ngày khác

nhau được cho trong b ng sau:

Các ngày

trong tu n

Trường

Thứ hai

Thứ ba

Thứ tư

Thứ năm

5

4

4

4

4

5

3

4

5

3

4

3

7

2

5

2

Có s khác biệt đáng kể nào ở số lượng học sinh đi trễ vào các ngày khác nhau v i mức ý nghĩa = 5% không?

1 Trình bày lý thuy ết:

- Khi nhìn vào b ng s u, bài gi i có th sả ố liệ ả ể ử dụng phương pháp so sánh hai nhóm b ng kiằ ểm định t, từ đó ta xây dựng bài gi i b ng 6 so sánh: ả ằ + So sánh s ự phương sai số học sinh ngh cỉ ủa các trường giữa thứ 2 và thứ 3

+ So sánh s ự phương sai số học sinh ngh cỉ ủa các trường giữa thứ 2 và thứ 4

+ So sánh s ự phương sai số học sinh ngh cỉ ủa các trường giữa thứ 2 và thứ 5

+ So sánh s ự phương sai số học sinh ngh cỉ ủa các trường giữa thứ 3 và thứ 4

+ So sánh s ự phương sai số học sinh ngh cỉ ủa các trường giữa thứ 3 và thứ 5

+ So sánh s ự phương sai số học sinh ngh cỉ ủa các trường giữa thứ 4 và thứ 5

- Tuy nhiên phương pháp này sẽ làm xuất hiện 6 phương sai khác nhau và nếu phương pháp này khả thi thì sẽ mất nhiều th i gian trình bày ờ

- Phương pháp thích hợp sẽ là phân tích phương sai hai yếu tố

- Các bi n, các ký hi u và công th c s dế ệ ứ ử ụng trong bài:

 Sum of square (SS) = ∑𝑚𝑖=1∑ Xijni𝑗 ∗ X − n ∗ Xavg ∗ Xavgij

+ n: S c t cố ộ ủa bảng d u ữ liệ

+ m: S hàng c a b ng d u ố ủ ả ữ liệ

 Mean square = 𝑁−1𝑆𝑆

+ N: T ng s ổ ố phầ ử trong b ng d u n t ả ữ liệ

Trang 15

- Phát bi u các gi thuy ể ả ết:

+ H0: Không có s khác bi t gi a s hự ệ ữ ố ọc sinh đi trễ đối với các ngày trong tu n ầ

+ Bác bỏ H0 khi p giá tr ị < alpha (đủ diều kiện để khẳng định có sự khác bi t) t c là H ệ ứ 1đúng

+ H1: có s khác bi t gi a s hự ệ ữ ố ọc sinh đi trễ đối với các ngày trong tuần

2 Trình bày tính toán:

- Ở bài này ta s d ng bử ụ ảng ANOVA để phân tích dữ liệu Vì là phương pháp phân tích phương sai hai yếu tố do đó ta cần ph i nh p vào hai yả ậ ếu tố:

+ Yếu t 1: Các ngày trong tu n ố ầ

Trong đó các số 1, 2, 3, 4 tương ứng với thứ hai, th ba, th ứ ứ tư, thứ năm trong bảng s ố liệu

Hàm as.factor(day) nhằm thông báo cho R đây là 1 yếu tố của bảng số li u ệ + Yếu t 2: ố Trường

Trong các s đó ố 1, 2, 3, 4 tướng ứng v các ới trường A, D c a b ng sB, C, ủ ả ố u liệ Hàm as.factor(school) nhằm thông báo cho R đây cũng là 1 yếu tố của bảng

số liệu

- Sau đó ta nhập số liệu th ng kê c a bố ủ ảng vào:

- Từ 3 y u t ta xây d ng d u b ng hàm data.frame: ế ố ự ữ liệ ằ

- Kết qu ả ta được bảng data như sau:

- Sau khi có b ng data ta ti n hành phả ế ân tích phương sai theo 2 yếu tố là school và day:

Trang 16

- Trong hàm trên R s ẽ định nghĩa stu là một hàm s c a day và school ố ủ

3 Trình bày k t quế ả:

- Sau đó ta dùng hàm ANOVA để quan sát kết quả phân tích:

Trong k t qu trên có 4 c t g m: (degree of freedom); ế ả ộ ồ Df Sum sq (Sum of square): là tổng bình phương; Mean sq (Mean Square): trung bình bình phương;

F value là giá trị thống kê; Pr(>F): là p giá tr ịliên quan đến kiểm định F

Để quan sát s khác bi t mự ệ ột cách c ụ thể hơn ta sử dụng hàm TukeyHSD (HSD là vi t t t c a Honest Significant Difference) Mu n s d ng hàm này ta ế ắ ủ ố ử ụ phải xây d ng l i b ng ANOVA b ng hàm aov ự ạ ả ằ

- Sau đó ta vẽ đồ thị của hàm TukeyHSD

Trang 17

 Qua đồ thị và bảng th ng kê thông qua hàm TurkeyHSD cho ta th y mố ấ ỗi cặp đều có phương sai Như đã đề cập ở trên, vi c b t c p t ng ngày ệ ắ ặ ừ trong tuần để so sánh s cho t th y nhiẽ ấ ều phương sai khác nhau Nguyên nhân là do m u t 16 ph n t ẫ ừ ầ ử đã được rút gọn l i thành 8 ph n tạ ầ ử, do đó phương sai giữa 2 không gian mẫu s khác nhau ẽ

Trang 18

❖ Kết luận:

➢ Từ ả b ng Anova ta có th k t lu n rể ế ậ ằng: p value = 0.1794 > alpha = 0.05

➔ Không đủ cơ sở để bác bỏ giả thuy t Hế 0

➔ Nên ta không th k t lu n r ng có s khác bi t v s hể ế ậ ằ ự ệ ề ố ọc sinh đi trễ của các trường gi a các ngày trong tu n ữ ầ

Trang 19

TÀI LI U THAM KH O Ệ Ả

1 Hướng d n s d ng RStudio Truy c p t ẫ ử ụ ậ ừhttps://docs.rstudio.com

2 Hoàng Văn Hà Bài gi ng môn hả ọc Xác suất – Th ng kêố

Ngày đăng: 08/10/2024, 16:44

w