BÀI TẬP LỚN Xác Suất Thống Kê

Câu 1 : Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ những người đi làm bằng xe máy, xe đạp và xe buýt.. Kết quả như sau: Với mức ý nghĩa ? = 5%, hãy nhận

Trang 1

Câu 1 :

Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ

lệ những người đi làm bằng xe máy, xe đạp và xe buýt Việc điều tra được tiến hành trên hai nhóm Kết quả như sau:

Với mức ý nghĩa 𝛼 = 5%, hãy nhận định xem có sự khác nhau về tỷ lệ sử dụng các phương tiện giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ hay không

Câu 2:

Một cửa hàng lớn có bán ba loại giày A, B, C.Theo dõi số khách hàng mua các loại giày này trong 5 ngày, người quản lý thu được bản số liệu sau :

Loại giày

28

21

20

18

23

35

42

32

25

27

33

38

31

42

29 Với mức ý nghĩa 𝛼 = 1%, hãy so sánh lượng tiêu thụ trung bình của ba loại giày nói trên

Trang 2

Câu 3:

Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây, Với mức ý nghĩa 𝛼 = 5% , có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không?) Tìm đường hồi quy của Y đối với X

(X,Y) = (15,13), (25,22), (10,6), (15,17), (20,21), (10,10), (20,25), (25,18), (30,14), (30,10)

Câu 4:

Trên cơ sở tập số liệu sau đây hãy phân tích xem tỷ lệ đỗ loại giỏi có phụ thuộc vào trường phổ thông và ban hay không với mức ý nghĩa 𝛼 = 0.05 Ở đây z

là tỷ lệ đỗ loại giỏi (%); f là trương phổ thông số 1,2,3,4; g là ban (1 = ban A; 2 = ban B)

Trang 3

Câu 1:

Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ những người đi làm bằng xe máy, xe đạp và xe buýt Việc điều tra được tiến hành trên hai nhóm Kết quả như sau:

Với mức ý nghĩa 𝛼 = 5%, hãy nhận định xem có sự khác nhau về tỷ lệ sử dụng các phương tiện giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ hay không

1.Dạng bài:

* Nhận xét: có mức ý nghĩa 𝛼=0,05.Vậy đây là bài toán kiểm địnhTa thấy trong mỗi cá thể trong tập hợp chính chỉ có một tính trạng là phân bố cách đi làm trong tập hợp các dân cư của khu công nghiệp X

 Đây là bài toán so sánh các phân số, kiểm định giả thiết về tỷ lệ sử dụng các

phương tiện giao thông đi làm trong hai nhóm công nhân nam và nữ

2.Cách giải:

 Giải thuyết H0: tỉ lệ sử dụng các phương tiên giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ

Khoảng cách giữa TSTN và TSLT được đo bằng:

𝑘 𝑖=1

 Biện luận:

1 >  2(a)  bác bỏ giả thiết Ho

Trong Excel có hàm Chitest có thể tính giá trị  2 theo biểu thức:

𝑐 𝑗=1

𝑟 𝑖=1

r là số hàng và c là số cột Xác xuất với bậc tự do DF = (r-1)(c-1)

Trang 4

3.Công cụ giải:

Áp dụng MS-Excel:

-Nhập bảng dữ liệu thực tế

-Sử dụng hàng SUM dùng con trỏ kéo từ B2 đến D2 để tình tổng hàng của nữ và tương

tụ ở các ô tổng hàng và tổng cột khác

-Tính tấn số lý thuyết = tổng hàng * tổng cột /tổng cộng

𝛾𝑖𝑗 = (𝑛𝑖 ∗ 𝑛𝑗)/𝑛 -Nhập B8 = ($E2*B$4)/$E$4

-Sau đó kéo từ B7 → D8 ta được bảng sau:

-Để tính P(X > 2 ), ta dùng hàm CHITEST(actual_range ; expected_range)

-Sử dụng hàm CHITEST

Tính p = CHITEST(B2:D3 ; B8:D9)

-P(X > 2 ) = 0.00218853 < 0.05

→ Vậy bác bỏ giả thuyết H 0

 Kết luận

Vậy tỷ lệ sử dụng các phương tiện giao thông đi làm trong hai nhóm công nhân nam và công nhân nữ là khác nhau

Trang 5

Câu 2:

Một cửa hàng lớn có bán ba loại giày A, B, C.Theo dõi số khách hàng mua các loại giày này trong 5 ngày, người quản lý thu được bản số liệu sau :

Loại giày

28

21

20

18

23

35

42

32

25

27

33

38

31

42

29 Với mức ý nghĩa 𝛼 = 1%, hãy so sánh lượng tiêu thụ trung bình của ba loại giày nói trên

1.Dạng toán : Phân tích phương sai một nhân tố, so sánh giá trị trung bình của nhiều tập hợp

chính

2.Cơ sở lý thuyết :

 Giả thiết H0 : 𝜇1 = 𝜇2 = 𝜇𝑘  “Các giá trị trung bình bằng nhau”

 Giả thiết H1 : 𝜇𝑖 ≠ 𝜇𝑗  “Ít nhất có hai giá trị trung bình khác nhau”

Đặt:

 SST : tổng bình phương các độ lệch:

 SSA : tổng bình phương độ lệch riêng của các nhóm so với 𝑥̅

 SSA = SST – SSF

(SSF : tổng bình phương do sai số)

 MSF : trung bình , bình phương của các nhân tố

𝑘 − 1

 MSE : trung bình bình phương của sai số

𝑛 − 𝑘 Nếu H0 đúng thì 𝐹 = 𝑀𝑆𝐹

𝑀𝑆𝐸có phân phối theo Fisher bậc tự do (k-1; n-k)

 F < Fα (k-1; n-k) → chấp nhân giả thiết H0 và ngược lại

Trang 6

3.Công cụ giải:

Áp dụng MS Excel:

-Nhập dữ liệu vào Excel :

- Click vào Data → Data Analysis → Anova : Single Factor”

- Hộp thoại hiện lên, nhập vào thông tin :

 Phạm vi đầu vào (Input Range) : $A$1:$C$6

 Chọn cách sắp xếp theo cột

 Chọn label in first row

 Output Range : $A$8

Trang 7

-Nhấn OK Ta được kết quả như sau:

 Biện luận:

F = 7.586441 > F(0.01) = 6.926608

→ Vậy bác bỏ giả thiết H0

 Kết luận:

Vậy lương tiêu thụ trung bình của ba loại giày nói trên là khác nhau

Câu 3:

Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây, Với mức ý nghĩa 𝛼 = 5% , có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không?) Tìm đường hồi quy của Y đối với X

(X,Y) = (15,13), (25,22), (10,6), (15,17), (20,21), (10,10), (20,25), (25,18), (30,14), (30,10)

1) Dạng bài toán: Phân tích tương quan và hồi quy

2) Công cụ : Thực hiên bài tập bằng Exel:

 Phân tích tương quan tuyến tính

Giả thiết H0: X và Y không có tương quan

tuyến tính

-Nhập dữ liệu Excel:

Trang 8

-Click chuột vào Data → Data Analysis → Correlation Trong hộp hội thoại Correlation:

 Phạm vi đầu vào (Input Range) : $A$1:$B$11

 Chọn cách sắp xếp thep cột

 Chọn Label in first Row

 Chọn Output Range $A$13

-Ấn OK.Ta được bảng sau:

 n = 10

 Theo bảng kết quả, ta tìm được hệ số tương quan r = 0.31984409

 Hệ số xác định r2 = 0.10230024

 Giá trị T = 0.954811781 theo CT

 Phân phối Student mức 𝛼 = 0.05 với bậc tự do n-2 = 8

 c = 2.306 (tra theo Student với (n-2 = 8) bậc tự do)

 |T| < c nên bác bỏ giả thiết H0

Chưa kết luận được X và Y có tương quan phi tuyến tính

Trang 9

 Tính hệ số tương quan, phân tích mối tương quan phi tuyến:

Giả thiết H0 : X và Y không có tương quan phi tuyến

-Sắp xếp lại các giá trị của X và Y theo bảng sau:

-Click chuột vào Data → Data Analysis → Anova Single Factor

-Hộp thoại Anova Single Factor hiện lên:

 Phạm vi đầu vào (Input Range) : $A$17:$E$19

 Chọn Alpha (mức ý nghĩa) : 0.05

Trang 10

-Ta được kết quả sau:

 n = 10, k = 5

 SST = 330.4

 SSF = 290.4

 Giá trị F = 10.69174 theo CT

 Mà: Tra bảng phân phối Fisher với bậc tự do (3,5) ở mức 5% bằng cách nhập hàm

c = FINV(0.05, 3, 5) → c = 5.40945

 F > c nên bác bỏ giả thiết H1

X và Y có tương quan phi tuyến

 Phân tích đường hồi quy:

Giả thiết H0: X và Y không hồi quy tuyến tính

-Click Data → Data Analysis → Regression

-Hộp thoại hiện lên, điền vào hộp thoại với thông tin:

 Phạm vi đầu vào:

X : $A$1:$A$11

Y : $B$1:$B$11

o Confidence Level nhập : 95%

 Residual chọn Line Fit Plos

Trang 12

-Ấn OK Ta được kết quả sau:

 Biện luận :

Đường hồi quy của Y đối với X là

Y = 10.4 + 0.24X (R2 = 0.1023, S = 0.608892)

Sai số tiêu chuẩn là 6.08892

Ta thấy : F = 0.91167 < c = 5.317655

(Dùng hàm FINV với bậc tự do (1,8) ở mức 0.05)

 Chấp nhận giả thiết H0

Vậy không có hồi quy tuyến tính giữa Y và X

Giả thiết H0 : hệ số hồi quy không có ý nghĩa

Hệ số A: t= 1.80041 < t0.0258 nên chấp nhân H0 (hệ số A không có ý nghĩa)

Hệ số B: t= 0.95481 < t0.0258 nên chấp nhận giả thiết H0 (hệ số B không có ý nghĩa)

Trang 13

 Kết luân:

- Tỷ số tương quan : 𝜂𝑌/𝑋 = 0.878935

- Hệ số tương quan r = 0.31984409

- Hệ số xác định r2 = 0.10230024

- X và Y không có tương quan tuyến tính với mức ý nghĩa 5%

- X và Y có tương quan phi tuyến tính với mức ý nghĩa 5%

- Phương trình đường hồi quy của Y với X : Y = 10.4 + 0.24X là không thich hợp

Câu 4:

Trên cơ sở tập số liệu sau đây hãy phân tích xem tỷ lệ đỗ loại giỏi có phụ thuộc vào trường phổ thông và ban hay không với mức ý nghĩa 𝛼 = 0.05 Ở đây z là tỷ lệ đỗ loại giỏi (%); f là trương phổ thông số 1,2,3,4; g là ban (1 = ban A; 2 = ban B)

1.Dạng toán : Phân tích phương sai hai yếu tố có lặp

2.Cơ sở lý thuyết:

 Giả thuyết:

H0: μ1 = μ2 = ⋯ μk “Các giá trị trung bình bằng nhau”

H1: μ1 ≠ μ2  “Ít nhất có hai giá trị trung bình khác nhau”

 Giá trị thống kê:

 Biện luận:

Nếu FR< Fa[b − 1, (k − 1)(b − 1)] => Chấp nhận H0 (yếu tố A) Nếu FC < Fa[b − 1, (k − 1)(b − 1)] => Chấp nhận H0 (yếu tố B)

Trang 14

3.Công cụ giải: Microsoft Excel

 Giả thiết HA : Tỷ lệ đậu loại giỏi không phụ thuộc vào ban

Giả thiết HB : Tỷ lệ đậu loại giỏi không phụ thuộc vào trường phổ thông

Giả thiết HC : Tỷ lệ đậu loại giỏi giữa ban và trường phổ thông không liên quan nhau

-Nhập dữ liệu :

-Click Data → Data Analysis → Anova : Two-Factor With Replication

-Hộp thoại hiện lên, nhập vào thông tin:

 Input Range : $A$1:$E$5

 Row per sample : 2

 Nhập Alpha : 0.05

 Output Range : $A$7

Trang 15

Nhấn OK, ta được kết quả:

 Biện luận :

-FA = 11.571429 > F0.05 = 5.317655 → Bác bỏ giả thiết HA

-FB = 55.380952 > F0.05 = 4.066181 → Bác bỏ giả thiết HB

-FC = 0.9047619 < F0.05 = 4.066181 → Chấp nhận giả thiết HC

Vậy cả 2 yếu tố trường và ban đều ảnh hưởng đến tỉ lệ đổ loại giỏi của học sinh,tuy nhiên không có sự tương tác giữa hai yếu tố trường và ban lên tỉ lệ đó

Định dạng
Số trang	15
Dung lượng	714,97 KB