1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÁO CÁO XÁC SUẤT THỐNG KÊ pptx

31 911 7

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 784,5 KB

Nội dung

H0 : Βi = 0 ó Các hệ số hồi quy không có ý nghĩaH1 : Βi ≠ 0 ó Các hệ số hồi quy có ý nghĩa-Trong trắc nghiệm F: H0 : Βi = 0 ó Phương trình hồi quy không thích hợp H1 : Βi ≠ 0 ó Phương tr

Trang 1

MỤC LỤC

BÀI 1:Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình XSTK 2009 2Bài 2: Cĩ 4 báo cáo viên A, B, C, D nĩi về cùng một chủ đề Sau đây là thời gian tính bằng phút mà mỗi báo cáo viên đĩ sử dụng trong 5 buổi báo cáo ở các địa điểm khác nhau: 11Bài 3: 17 Bài 4.Lượng sữa vắt được bởi 16 con bò cái khi cho nghe các lọai nhạc khác nhau (nhạc nhẹ, nhạc rốc, nhạc cổ điển, không có nhạc) được thống kê trong bảng sau đây: 25Bài 5 Hãy phân tích sự biến động của thu nhập ($/tháng/người) trên cơ sở số liệu điều tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khau nhau sau đây: 28

A KHÁI NIỆM THỐNG KÊ: 28

B THUẬT TỐN: ÁP DỤNG ANOVA TWO- FACTOR WITHOUT REPLIATION 30

Trang 2

BÀI 1:Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình

Trang 3

Bước 2: Tính các giá trị thống kê

Tính các giá trị Ti ; T.j ; T k và T…

- Các giá trị Ti

Chọn ô B7 nhập biểu thức =SUM(B2:E2)Chọn ô C7 nhập biểu thức =SUM(B3:E3)Chọn ô D7 nhập biểu thức =SUM(B4:E4)Chọn ô E7 nhập biểu thức =SUM(B5:E5)

- Giá trị T…

Chọn B10 và nhập biểu thức =SUM(B2:E5)

Tính các giá trị G G

Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến G9

- Giá trị G

Chọn ô G10 và nhập biểu thức =POWER(B10,2)

- Giá trị G

Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)

- Các giá trị SSR, SSC và SSF

Trang 4

Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9.

- Giá trị SST

Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)

- Giá trị SSE

Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)

- Các giá trị MSR, MSC, MSF

Chọn ô K7 và nhập biểu thức =I7/(4-1)Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9

- Giá trị SSE

Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))

Tính các giá trị G và K

Chọn ô M7 và nhập biểu thức =K7/0.3958Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9

Bước 3: Kết quả và biện luận

FR = 3,1052632 < F0,05(3,6) = 4,76 => Chấp nhận H0 (pH)

FC = 11,947368 > F0,05(3,6) = 4,76 => Bác bỏ H0 (nhiệt độ)

F = 30,052632 > F0,05(3,6) = 4,76 => Bác bỏ H0 (chất xúc tác)

3) Kết luận : Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất.

Trang 5

Ví dụ 4.2

Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 1350C kết hợp với

ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:

3060153060153060

105105105120120120135135135

1.872.023.283.054.075.545.036.457.26

Hãy cho biết yếu tố nhiệt độ và thời gian hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115 0C trong vòng 50 phút thì hiệu suất phản ứng là bao nhiêu ?

Gi

ải 1) Dạng toán : hồi quy tuyến tính đa tham số

2) Áp dụng MS-EXCEL :

-Trong trắc nghiệm t:

Trang 6

H0 : Βi = 0 ó Các hệ số hồi quy không có ý nghĩa

H1 : Βi ≠ 0 ó Các hệ số hồi quy có ý nghĩa-Trong trắc nghiệm F:

H0 : Βi = 0 ó Phương trình hồi quy không thích hợp

H1 : Βi ≠ 0 ó Phương trình hồi quy thích hợp với ít nhất vài Bi

Bước 1: Nhập dữ liệu theo cột

Bước 2: Sử dụng “Regression”

a) Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis

b) Chọn chương trình Regression trong hộp thoại Data Analysis và nhấn OK

c) Trong hộp thoại Regression lần lượt ấn định:

-Phạm vi của biến X (Input X Range)-Phạm vi của biến Y (Input Y Range)-Nhãn dữ liệu (Labels)

-Mức tin cậy (Confidence Level) -Tọa độ đầu ra (Output Range)

Trang 7

Ä Phương trình hồi quy = f(X1)

= 2.73 + 0.04X 1

(R2 = 0,21;S = 1,81)

Trang 8

Vậy cả hai hệ số 2,73(B0) và 0,04(B1) của phương trình hồi quy

= 2,73 + 0,04X1 đều không có ý nghĩa thống kê Nói cách khác, phương trình hồi quy này không thích hợp

Kết luận: Yếu tố thời gian không liên quan tuyến tính với hiệu suất của

phản ứng tổng hợp

Ä Phương trình hồi quy = f(X 2)

= -11,14 + 0,13X2

(R2 = 0,76; S = 0,99)

Trang 9

Vậy cả hai hệ số -11,14(B0) và 0,13(B2) của phương trình hồi quy

-11,14 + 0,13X2 đều có ý nghĩa thống kê Nói cách khác, phương trình hồi quy này thích hợp

Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng

tổng hợp

Ä Phương trình hồi quy = f(X 1,X2)

= -12,70 + 0,04X1 + 0,13X2

(R2 = 0,97; S = 0,33)

Trang 10

3) Kết luận:

Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu

tố là thời gian và nhiệt độ

 Nếu ở điều kiện nhiệt độ 115 0 C trong vòng thời gian 50 phút thì hiệu suất sẽ là:

Trang 11

= -12,70 + 0,04X1 + 0,13X2

=-12,7+0,04.50+0,13.115 =4,25%

Bài 2: Cĩ 4 báo cáo viên A, B, C, D nĩi về cùng một chủ đề Sau đây là thời

gian tính bằng phút mà mỗi báo cáo viên đĩ sử dụng trong 5 buổi báo cáo ở các địa điểm khác nhau:

Hãy thiết lập bảng ANOVA cho số liệu trên Giả thiết H0 là gì? Giả thiết

H0 cĩ bị bác bỏ mức ý nghĩa 5% hay khơng?

Giải : 1) Dạng tốn: phân tích phương sai một yếu tố :

A.Cơ sở lí thuyết:

Trang 12

Giả sử {x , x , x } 11 21 n 1 1 là một mẫu có kích thước n1 rút ra từ tập hợp chính các giá trị của X1; {x , x , x } 12 22 n 2 2 là một mẫu kích thước rút

ra từ tập hợp chính các giá trị của X2, , {x , x , x } 1k 2k n k k là một mẫu kích thước nk rút ra từ tập hợp chính các giá trị của Xk Các số liệu thu được trình bày thành bảng ở dạng sau đây:

Ta đưa ra một số kí hiệu sau

 Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảng trên):

i i

x T

T x

k i

x x22 x n k k

Tổng

=∑k1 k i

T T

Trung

T x n

Trang 13

 Tổng bình phương chung ký hiệu là SST (viết tắt là chữ Total Sum of Squares) được tính theo công thức sau:

i j

T

n T

x n

 Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt của chữ Sum of Squares for Factor) được tính theo công thức sau:

SST = SSF + SSE

Trang 14

 Trung bình bình phương của nhân tố, ký hiệu là MSF (viết tắt của chữ Mean Square for Factor) được tính bởi công thức:

SSF MSF

k 1

=

k – 1 được gọi là bậc tự do của nhân tố

 Trung bình bình phương của sai số, ký hiệu là MSE (viết tắt của chữ Mean Square for Error) được tính bởi công thức:

SSE MSE

n k

=

n – k được gọi là bậc tự do của sai số

Tỷ số F được tính bởi công thức

MSF F

Bậc tự do

Trung bình bình phương

Trang 15

MSF F

MSE

=

sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)

Thành thử giả thiết Ho sẽ bị bác bỏ ở mức ý nghĩa α của phân bố Fisher với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫu số

Trang 16

2) Aùp dụng MS-EXCEL:

H0: Gỉa thiết H0 : a1 =a2 =a3=a4 (Thời gian trung bình mà các báo cáo viên cần cho các bài báo cáo của mình là bằng nhau)

H1 :a I ≠ aJ

B

ước 1 : Nhập dữ liệu vào bảng tính

Bước 2: Lập bảng ANOVA

Áp dụng “Anova: Single Factor”

a) Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis

b) Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấp nút OK

c) Trong hộp thoại Anova: Single Factor lần lượt ấn định:

- Phạm vi đầu vào (Input Range)

- Cách sắp xếp theo hàng hay cột (Grouped By)

- Nhãn dữ liệu (Labels in First Row)

- Mức ý nghĩa (Alpha)

Trang 18

hàng mua các loại giày này trong 5 ngày, người quả lý thu được bảng số liệu sau:

Loại giày

2821201823

3542322527

3338314229Với mức ý nghĩa α = 1% hãy so sánh lượng tiêu thụ trung bình của

ba loại giày nói trên

Bài giải

Bài toán phân tích phương sai một nhân tố

1 Cơ sở lí thuyết:

Giả sử {x , x , x } 11 21 n 1 1 là một mẫu có kích thước n1 rút ra từ tập hợp chính các giá trị của X1; {x , x , x } 12 22 n 2 2 là một mẫu kích thước rút

ra từ tập hợp chính các giá trị của X2, , {x , x , x } 1k 2k n k k là một mẫu kích thước nk rút ra từ tập hợp chính các giá trị của Xk Các số liệu thu được trình bày thành bảng ở dạng sau đây:

Các mức nhân tố

Trang 19

1 1 n

T T

Trung

T x n

Ta đưa ra một số kí hiệu sau

 Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảng trên):

i i

x T

T x

i j

T

n T

x n

Trang 20

 Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt của chữ Sum of Squares for Factor) được tính theo công thức sau:

SSF MSF

k 1

=

k – 1 được gọi là bậc tự do của nhân tố

 Trung bình bình phương của sai số, ký hiệu là MSE (viết tắt của chữ Mean Square for Error) được tính bởi công thức:

SSE MSE

n k

=

n – k được gọi là bậc tự do của sai số

Tỷ số F được tính bởi công thức

Trang 21

Bậc tự do

Trung bình bình phương

MSE

=

sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)

Thành thử giả thiết Ho sẽ bị bác bỏ ở mức ý nghĩa α của phân bố Fisher với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫu số

n k

Trang 22

7,5864 29.5

MSF

F

MSE

Ta trình bày các kết quả tính toán trên trong bảng ANOVA

Nguồn Tổng bình phương Bậc tự do bình phương Trung bình Tỷ số F

Ta có F > c do đó ta bác bỏ Ho

3 Kết quả làm trên Excel :

Nhập dữ liệu vào bảng tính :

Sau đó vào Data  Data Analysis  Anova: Single Factor.

Trang 23

Trong hộp thoại Anova: Single Factor điền một số thông tin:

Trang 24

Sau đó ấn OK cho ra kết quả:

Trang 25

khác nhau (nhạc nhẹ, nhạc rốc, nhạc cổ điển, không có nhạc) được thống kê trong bảng sau đây:

Giải

1) Dạng tốn: phân tích phương sai một yếu tố

Cơ sở lí thuyết:(Giống bài 2 và 3)

Aùp dụng MS-EXCEL:

B

ước 1 : Nhập dữ liệu vào bảng tính

Bước 2: Lập bảng ANOVA

Áp dụng “Anova: Single Factor”

• Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis

• Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấp nút OK

Trang 26

• Trong hộp thoại Anova: Single Factor lần lượt ấn định:

- Phạm vi đầu vào (Input Range)

- Cách sắp xếp theo hàng hay cột (Grouped By)

- Nhãn dữ liệu (Labels in First Row)

- Mức ý nghĩa (Alpha)

Trang 27

3.Kết luận

F=1.35468 < F crit =3.490295  Chấp nhận H0

Lượng sữa trung bình của môĩ nhóm là như nhau và âm nhạc không ảnh hưởng đến lượng sữa của các con bò

Trang 28

Bài 5 Hãy phân tích sự biến động của thu nhập ($/tháng/người) trên cơ

sở số liệu điều tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khau nhau sau đây:

Loại ngành

1234

212222241240

200205250228

230222245230

220225235240



Dạng bài tập: phân tích phương sai 2 yếu tố

A KHÁI NIỆM THỐNG KÊ:

Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (I = 1 2… r: yếu tố A; j = 1 2… c: yếu tố B)

Trang 29

Nguồn

sai số

Bậc tự do

Tổng số bình phương Bình

phương trung bình

Giá trị thống kê

SSB)

MSF = ( 1)

SSF

c−MSB =

H 1 : µ i ≠ µ j ó “Ít nhất có hai giá trị trung bình

khác nhau”

Giá trị thống kê : FR =

MSB MSE và FC = MSF MSE

Biện luận :

Nếu: FR < Fα [b-1,(k-1)(b-1)} => chấp nhận Ho (yếu tố A)Nếu: Fc < Fα [k-1,(k-1)(b-1)} => chấp nhận Ho (yếu tố B)

Trang 30

B THUẬT TOÁN: ÁP DỤNG ANOVA TWO- FACTOR WITHOUT REPLIATION

a) Nhấp lần lượt đơn lệnh Tool và lệnh Data Analysis

b) Chọn chương trình Anova:Two- trong hộp thoại Data Analysis rồi nhấp nút OK

c) Trong hộp thoại Anova: Two-Factor Without Replication, lần lượt

ấn định các chi tiết:

- Phạm vi đầu vào Input Range

- Nhãnn dữ liệu Lable in First Row/Column

- Ngưỡng tin cậy Alpha

- Phạm vi đầu ra Output Range

Trang 31

Anova: Two-Factor Without Replication

Kết quả và biện luận:

FR = 8.783 > F0.05 = 3.863 => Bác bỏ giả thuyết Ho (Loại ngành

Ngày đăng: 03/07/2014, 10:20

HÌNH ẢNH LIÊN QUAN

Bảng ANOVA - BÁO CÁO XÁC SUẤT THỐNG KÊ pptx
ng ANOVA (Trang 14)
Bảng ANOVA - BÁO CÁO XÁC SUẤT THỐNG KÊ pptx
ng ANOVA (Trang 21)
Bảng ANOVA: - BÁO CÁO XÁC SUẤT THỐNG KÊ pptx
ng ANOVA: (Trang 28)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w