1. Trang chủ
  2. » Giáo Dục - Đào Tạo

bài tập lớn xác suất thống kê thầy Nguyễn Đình Huy

34 1,3K 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 34
Dung lượng 2,89 MB

Nội dung

1.ĐỀ BÀI TẬP – ĐỀ SỐ 5 ............................................................................. 3 2.PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL ....................... 6 2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY). ................................................................................................6 2.1.1 Ví dụ 10 trang 172 ................................................................................. 6 2.1.2 Ví dụ 12 trang 181 ................................................................................. 9 2.2 Bài tập 2 ........................................................................................................15 2.3 Bài tập 3 ........................................................................................................19 2.4 Bài tập 4 ........................................................................................................25 2.5 Bài tập 5 ........................................................................................................28 1.ĐỀ BÀI TẬP – ĐỀ SỐ 51.1. Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY). 1.1.1. Ví dụ 10172: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Trang 1

MỤC LỤC

1 ĐỀ BÀI TẬP – ĐỀ SỐ 5 3

2 PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL 6

2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY) .6

2.1.1 Ví dụ 10 trang 172 6

2.1.2 Ví dụ 12 trang 181 9

2.2 Bài tập 2 15

2.3 Bài tập 3 19

2.4 Bài tập 4 25

2.5 Bài tập 5 28

1 ĐỀ BÀI TẬP – ĐỀ SỐ 5 1.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY) 1.1.1 Ví dụ 10/172: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố Yếu tố B

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?

1.1.2 Ví dụ 12/181: Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135C kết hợp với ba khoảng thời gian là 12, 30 và 60 phút, để thực hiện mộ phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:

Trang 2

Với mức ý nghĩa = 0,05, hãy nhận định xem có phải ba giống bò này thuần như nhau về

phương diện sản lượng sữa hay không?

1.3 Hãy phân tích tình hình kinh doanh của một số ngành nghề ở quận 4 quận nội thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau:

Ngành nghề kinh

doanh

Khu vực kinh doanh

Điện lạnh

Vật liệu xây dựng

Dịch vụ tin học

2.5:2.7:2.0:3.0 0.6:10.4 1.2:1.0:9.8:1.8

3.1:3.5:2.7 15.0 2.0:2.2:1.8

2.0:2.4 9.5:9.3:9.1 1.2:1.3:1.2

5.0:5.4 19.5:17.5 5.0:4.8:5.2

1.4 Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hàng năm và tuổi của họ Kết quả thu được như sau:

Trang 3

1.5 Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:

Ngày khảo sát

Quận nội thành

Thứ hai

Thứ ba

Thứ tư Thứ năm

5.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY)

5.1.1 Vd 10, trang 172: Hiệu suất phần trăm (%) của một phản ứng hĩa học được nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng

5.1.1.1.Phương pháp:

Trang 4

Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình hình vuông la tinh n x n Thí dụ như mô hình 4 x 4:

Mô hình hình vuông la tinh ba yếu tố được trình bày như sau:

BẢNG ANOVA :

Trắc nghiệm:

Giả thiết:

H0 : μ1= μ2= =μk <=> “Các giá trị trung bình bằng nhau”

H1 : μi ≠ μj <=> “Có ít nhất hai giá trị trung bình khác nhau”

Trang 5

Giá trị thống kê: Fr và Fc

Biện luận:

 Nếu Fr < Fα => Chấp nhận H0 (Yếu tố A)

 Nếu Fc< Fα=> Chấp nhận H0 (Yếu tố A)

Trang 6

Các giá trị SUMSQTi , SUMSQT.J và SUMSQT k

Trang 7

Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)

Tính các giá trị MSR, MSC, MSF và MSE

Các giá trị MSR, MSC và MSF

Chọn ô K7 và nhâp biểu thức =I7/(4-1)

Dùng con trỏ kéo kí hiệu điền từ ô K7 đến ô K9

Giá trị MSE: Chọn ô K10 và nhâp biểu thức =I10/((4-1)*(4-2))

Tình các giá trị FR , FC và F:

Chọn ô M7 và nhâp biểu thức =K7/0.3958

Dùng con trỏ kéo kí hiệu điền từ ô M7 đến ô M9

Ta có kết quả như sau:

Kết quả và biện luận

 FR=3.1 < F0.05(3.6)=4.76 → Chấp nhận Ho (pH)

 FC=11.95 > F0.05(3.6)=4.76→ Bác bỏ Ho (nhiệt độ)

 F=30.05 > F0.05(3.6)=4.76 → Bác bỏ Ho (chất xúc tác)

 Vậy chỉ có nhiệt độ và chất xuc tác gây ảnh hưởng đến hiệu suất

5.1.2 Ví dụ 12/181: Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135C kết hợp với ba khoảng thời gian là 12, 30 và 60 phút, để thực hiện mộ phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:

Trang 8

Hãy cho yếu tố nhiệt độ và thời gian/ hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115°C trong vòng 50 phút thì hiệu suất phản ứng

sẽ là bao nhiêu?

5.1.2.1.Phương pháp: Hồi quy tuyền tính đa tham số

Trong phương tình hồi quy tuyền tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập

Xi (i=1,2,…,k) thay vì chỉ có một như trong quy hồi quy tuyến tính đơn giản

Trang 9

Trắc nghiệm thông kê

o Giá trị thông kê: F

o Trắc nghiệm t:

H0 βi = 0 ↔ Các hệ số hồi quy không có ý nghĩa

H1 βi ≠ ↔ Có ít nhất vài hệ số hồi quy có ý nghĩa

o Trác nghiệm F:

H0 βi = 0 ↔ Phuơng trình hồi quy không thích hợp

H1 βi ≠ ↔ Phương trình hồi quy thích hợp với ít nhất vài hệ số Bi

Trang 10

Trong hộp Regression, lần lượt ấn định các chi tiết :

o Phạm vị của biến X (Input X Range): $A$1:$A$10

o Phạm vị của biến Y (Input Y Range): $C$1:$C$10

o Nhãn dữ liệu (Labels)

o Mức tin cậy (Confidence Level)

o Đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals)

Nhấn OK ta có bảng sau:

Phương trình hồi quy: ŶX1=f(X1)

ŶX1=2.73 + 0.04X1 (R2=0.21;S=1.81)

T0=2.129< t0.05=2.365

Trang 11

 Chấp nhận giả thiết Ho

T2=1.38< t0.05=2.365

 Chấp nhận giả thiết Ho

F=1.905< F30.05=5.59

 Chấp nhận giả thiết Ho

Vậy cả hai hệ số 2.37(Bo) và 0.04 (B1) của phương trình hồi quy ŶX1=2.73+0.04X1 đều không có ý nghĩa thống kê Hay phương trình hồi quy không thích hợp

Kết luận : yếu tố thời gian không liên quan tuyến tính với hiệu suất của phản ứng

Trang 12

Phương trình hồi quy: ŶX2=f(X2)

 Chấp nhận giả thiết Ho

Vậy cả hai hệ số -11.14 (B0) và 0.13(B1) của phương trình hồi quy ŶX2=-11.14+0.13X2 đều có ý nghĩa thống kê Hay phương trình hồi quy thích hợp

Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp

 Cả hai yếu tố nhiệt độ và thời gian:

Trang 13

Phương trình hồi quy: ŶX1, X2=f(X1, X2)

ŶX1, X2= -12.7+ 0.04X1+ 0.13X2

T0 11.528 > t0.05=2.365

 Bác bỏ giả thiết Ho

T1=7.583> t0.05=2.365

Trang 14

 Bác bỏ giả thiết Ho

T2=14.328> t0.05=2.365

 Bác bỏ giả thiết Ho

F=131.395> F0.05=5.51

 Chấp nhận giả thiết Ho

Vậy cà hai hệ số -12.7 (Bo); 0.04(B1) và 0.13(B2) của phương trình hồi quy ŶX1, X2= -12.7+ 0.04X1+ 0.13X2 đều có ý nghĩa thống kê Hay phương trình hồi quy thích hợp

Kết luận: Hiêu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là nhiệt độ và

thơi gian

Dự đoán hiệu suất của phản ứng tại nhiệt độ 115°C và 50 phút:

Chọn ô B21 và nhập công thức: B1 7+B18*50+B19*115 được kết quả là: 4.310873

Bài 2: Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C Lượng sữa của các con bò được

thống kê trong bảng sau đây:

Với mức ý nghĩa = , , hãy nhận định xem có phải ba giống bò này thuần như nhau về

phương diện sữa hay không?

BÀI LÀM

 Nhận xét: Đây là bài toán kiểm định giả thuyết vể tỷ lệ

 Giải thuyết H0: Tỷ lệ sữa của ba giống bò này có phân phân bố tỉ nhau

Trang 15

GIẢI BÀI TOÁN BẰNG EXCEL

Trang 17

 Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa

Bài 3: Với mức ý nghĩa 1%, Hãy phân tích tình hình kinh doanh của 1 số ngành nghề ở quận 4 quận nội thành trên cơ sở số liệu về doanh thu của 1 số cửa hàng như sau:

3.1:3.5:1.7 15.0 2.0:2.2:1.8

2.0:2.4 9.5:9.3:9.1 1.2:1.3:1.2

5.0:5.4 19.5:17.5 5.0:4.8:5.2 BÀI LÀM

Phương pháp: Phân tích phương sai 2 yếu tố ( có lặp)

Cơ sở lý thuyết:Trên thực một biến lượng chịu tác động không chỉ một nhân tố mà có thể hai (hay nhiều nhân tố) Chẳng hạn năng suất cây trồng chịu ảnh hưởng của nhân tố giống và của nhân tố đất Kết quả học tập của một sinh viên chịu ảnh hưởng không những bởi nhân tố giảng viên mà còn bởi nhân tố sĩ số của lớp học

Trang 18

Trong mục này ta sẽ trình bày một cách vắn tắt kỹ thuật phân tích phương sai hai nhân tố nhằm phát hiện ảnh hưởng của mỗi nhân tố cũng như tác động qua lại của hai nhân tố đó đến biến lượng đang xét

Giả sử chúng ta quan tâm tới nhân tố A và B Nhân tố A được xem xét ở các mức

A1, A2, Ar và nhân tố B được xem xét ở các nước B1, B2, Bc

Gọi Xjk là ĐLNN đo lường hiệu quả việc tác động của mức Aj và Bk lên cá thể

Giả sử x1jk, x2jk, , xnjk là mẫu kích thước njk rút ra từ tập hợp chính các giá trị của Xjk Ta gọi

đó là mẫu (j, k) Ta đưa ra một số ký hiệu sau:

Trang 19

+ Tổng bình phương chung, ký hiệu là SST, được tính theo công thức sau:

+ Tổng bình phương do tương tác (Sum of Squares for Interaction) ký hiệu là SSI, được tính

 (với r – 1 gọi là bậc tự do của A bằng số mức của A trừ 1)

+ Trung bình bình phương của nhân tố B, ký hiệu là MSFB, được tính theo công thức sau:

 (với c – 1 gọi là bậc tự do của B bằng số mức của B trừ 1)

+ Trung bình bình phương của sai số, ký hiệu là MSE, được tính theo công thức sau:

SSE

MSE

n cr

 (với n – cr gọi là bậc tự do của sai số)

+ Trung bình bình phương của tương tác, ký hiệu là MSI, được tính bởi

MSE

+ Tương tự tỷ số F cho nhân tố B, ký hiệu bởi FB được tính như sau: B B

MSF F

MSE

và tỷ số F cho tương tác giữa A và B, ký hiệu là FAB được tính như sau: AB

MSI F

MSE

Với mức ý nghĩa  đã cho ta ký hiệu f (u, v) là phân vị mức  của phân bố Fisher với bậc tự

do (u, v)

Trang 20

Ta có quy tắc quyết định như sau:

+ Nếu FA > f (r – 1, n – cr) thì ta bác bỏ giả thiết

Trên thực hành tính toán chúng ta thực hiện như sau

Giả sử Tjk là tổng các giá trị trong mẫu (j, k) Ký hiệu:

n SSI SST SSF SSF SSE

Trang 21

do đó:o

2 2

2 2

' 1

jk

k j

T T SSF

T T SSF

T SSE A

Giả thuyết:

-HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề

-HB (yếu tố quận): doanh thu không phụ thuộc vào quận

-HAB (sự tương tác giữa 2 yếu tố): doanh thu giữ các ngành nghề và các quận không có liên quan tới nhau

Nhập dữ liệu vào bảng tính:

Trang 22

Áp dụng: “Anova: Two-Factor With Replication”

Vào Data -> Data Analysis Chọn mục Anova: Two-Factor With Replication

Chọn OK

Trong hộp thoại Anova: Two-Factor With Replication lần lượt ấn định các chi tiết Phạm vi đầu vào (Input Range): $A$9:$E$21

Số hàng mỗi mẫu (Rows per sample): 4

Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)

Phạm vi đầu ra (Output Range): $A$23

Trang 23

Nhấn OK Ta được bảng sau:

Kết quả và biện luận:

Thực hiện bài toán trên MS-EXCEL:

FR = 2.8929 < F0.01 = 5.247894

Chấp nhận giả thuyết Ho (ngành nghề kinh doanh)

FC= 0.8089 < F0.01 = 4.3771

Chấp nhận giả thuyết Ho (ngành nghề và địa điểm kinh doanh)

KẾT LUẬN: Vì vậy doanh thu cửa hàng trên không phụ thuộc vào ngành nghề và địa điểm kinh doanh, giữa ngành nghề kinh doanh và địa điểm kinh doanh không có sự tương tác lẫn nhau

Trang 24

Bài 4: Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hằng năm và tuổi thọ của họ Kết quả thu được như hình sau:

Tuổi

Thu nhập Dưới 100 000 $ Từ 100 000 $

là một biến lượng hay là một dấu hiệu định lượng Chẳng hạn nếu cad thể là người thì biến lượng

có thể là chiều cao, trong lượng, tuổi tuy nhiên trong thực tế có những dấu hiệu không thể đo đạc để biểu diễn bằng con số được Chẳng hạn màu tóc, màu mắt của một người, cảm giác hạnh phúc, sự yêu thích một cuốn phim nào đó Đó đều là những dấu hiệu không đo đạc được Ta gọi

Trong đó ký hiệu pij là xác suất để một cá thể chọn ngẫu nhiên mang dấu hiệu Ai và Bj ; pjo và poj

tương ứng là xác suất để cá thể mang dấu hiệu Ai và Bj

Nếu giả thiết Ho “Hai dấu hiệu A và B độc lập” chúng ta có hệ thức sau:

pij = pio.poj

Các xác suất p và p được ước lượng bởi

Trang 25

T > c, trong đó c là phân vị mức  của phân bố 2 với (k–1).(r–1) bậc tự do

Chú ý Ta có các thức sau đây khá thuận lợi trong tính toán thực hành:

2 ij

Nếu02 2 → Chấp nhận giả thiết H0

Hoặc kết quả hàm CHITEST > α =0.01 → Chấp nhận giả thiết H0

4 Bài làm:

a) Kết quả tính bằng tay

Trang 26

Giả thiết H0: Tuổi và thu nhập không phụ thuộc nhau

Ô B9 nhập lệnh = =B$6*$E3/$E$6 rồi enter

Sau đó ta kéo chọn từ B9:D11 , sau đó ta ấn tổ hợp phím F2+ctrl+enter

Trang 27

Ta có bảng tần số lý thuyết:

 Bước 4: Dùng hàm CHITEST để tính

Nhấn vào Tab Fomulas chọn Insert Function chọn CHITEST rồi nhấn OK

Lúc đó sẽ xuất hiện hộp thoại Function Arguments

Nhập các giá trị tần số quan sát vào mục Actual_range:

Trang 28

Rồi nhập các giá trị tần số quan sát vào mục Expected_range Nhấn OK

c) Kết quả: Ta được P = 0.14376

Vì giá trị P > α = 1% => Chấp nhận giả thuyết H0, tuổi và thu nhập không phụ thuộc nhau

7 Kết luận: Tuổi và thu nhập không phụ thuộc nhau

Bài 5 Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội

Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn  = 1% Lượng báo bán ra có chịu tác động của các yếu tố ngày trong tuần không?

Trang 29

- Giả sử yếu tố A có n mức a1,a2,…,an ( yếu tố hàng)

B có m mức b1,b2,…,bm (yếu tố cột)

- Giả thiết H0:

+Trung bình yếu tố cột bằng nhau

+ Trung bình yếu tố hàng bằng nhau

+ Không có sự tương tác giữa yếu tố cột và hàng

Trang 30

Đối với Excel 2010 cần thực hiện các bước sau để mở hộp thoại Data Analysis:

+ File > Options > Add-Ins > Analysis ToolPak > Go > Analysis ToolPak > Ok

+ Hộp thoại Data Analysis sẽ xuất hiện trong Data

3 Thao tác trên hộp thoại Data Analysis

Khi đó sẽ xuât hiện bảng giá trị như sau :

Trang 31

Anova: Two-Factor Without Replication

Kết luận:

- Rows: F =3,5672<F0.01 =4,1027=> Chấp nhận giả thiết H0

- Columns: F=2.47479 < F0.02 =4,4307=> Chấp nhận giả thiết H0

=> Vậy yếu tố ngày không ảnh hưởng đến số lượng báo bán ra

Lượng báo bán ra ở năm quận không khác nhau

Ngày đăng: 02/06/2018, 00:45

TỪ KHÓA LIÊN QUAN

w