Chọn ô B7 và chọn biểu thức=SUM(B2:E2)Chọn ô C7 và nhập biểu thức=SUM(B3:E3)Chọn ô D7 và nhập biểu thức=SUM(B4:E4)Chọn ô E7 và nhập biểu thức=SUM(B4:E4)•Các giá trị T.j.Chọn ô B8 và nhập biểu thức=SUM(B2:B5)Dùng con trỏ kéo ký tự điền từ ô B8 đến ô E8•Các giá trị T..kChọn ô B9 và nhập biểu thức=SUM(B2,C5,D4,E3)Chọn ô C9 và nhập biểu thức=SUM(B3,C2,D5,E4)Chọn ô D9 và nhập biểu thức=SUM(B4,C3,D2,E5)Chọn ô E9 và nhập biểu thức=SUM(B5,C4,D3,E2)•Giá trị T…Chọn ô B10 và nhập biểu thức=SUM(B2:B5)
Trang 2Page | 2
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá trị quan sát G(i=1,2…r:yếu tố A;j=1,2…r:yếu tố B;k=1,2…r:yếu tố C)
Mô hình vuông la tinh ba yếu tố được trình bày như sau:
Trang 3Bình phương trung
bình
Giá trị thốngkê
SSE=SST-
MSE=SSE/(r-1)(r-2)Tổng
2-1) SST=
Ta có giả thuyết sau :
H0 :Các giá trị trung bình bằng nhau
H1 :Có ít nhất hai giá trị trung bình bằng nhau
Nếu giá trị thống kê bé hơn Fα
Trang 5Page | 5
Chọn ô D7 và nhập biểu thức=SUM(B4:E4)Chọn ô E7 và nhập biểu thức=SUM(B4:E4)
Các giá trị T.j
Chọn ô B8 và nhập biểu thức=SUM(B2:B5)Dùng con trỏ kéo ký tự điền từ ô B8 đến ô E8
Các giá trị T kChọn ô B9 và nhập biểu thức=SUM(B2,C5,D4,E3)Chọn ô C9 và nhập biểu thức=SUM(B3,C2,D5,E4)Chọn ô D9 và nhập biểu thức=SUM(B4,C3,D2,E5)Chọn ô E9 và nhập biểu thức=SUM(B5,C4,D3,E2)
Chọn ô B10 và nhập biểu thức=SUM(B2:B5)
2 tính các giá trị G
Các giá trị GChọn ô G7 và nhập biểu thức=SUMSQ(B7:E7)Dung con trỏ kéo ký hiệu tự điền từ G7 đến ô G9Chọn ô G10 và nhập biểu thức=POWER(B10,2)Chọn ô G11 và nhập biểu thức=SUMSQ(B2:E5)
3 tính các giá trị SSR.SSC.SSF.SST và SSE
Trang 6Page | 6
Các giá trị SSR.SSC.SSFChọn ô I7 và nhập biểu thức=G7/4-39601/POWER(4,2)Dung con trỏ kéo ký tự điền từ ô I7 đến ô I9
Giá trị SSTChọn ô I11 và nhập biểu thức=G11-G10/POWER(4,2)
Giá trị SSEChọn ô I10 và nhập biểu thức=I11-SUM(I7:I9)
4 tính các giá trị MSR.MSC.MSF và MSE
Giá trị SSTChọn ô K7 và nhập biểu thức=I7/(4-1)Dung con trỏ kéo ký tự điền từ ô K7 đến ô K9
Chọn ô K10 và nhập biểu thức=I/((4-1)*(4-2))
5 tính các giá trị G và F:
Chọn ô M7 và nhập biểu thức=K7/0.3958Dùng con trỏ kéo ký tự điền từ ô M7 đến M9
Trang 7Page | 7
IV.KẾT QUẢ VÀ BIỆN LUẬN:
FR=3.10<F0.05(3.6)=4.76=>chấp nhận H0(Ph)
FC=11.95> F0.05(3.6)=4.76=> bác bỏ H0(nhiệt độ)F=30.05> F0.05(3.6)=4.76=>bác bỏ H0(chất xúc tác)Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất
Hiệu xuất (%) Y
Trang 8Giá trị thốngkê
Trang 9-Trong trắc nghiệm t
H0:Các hệ số hồi quy không có ý nghĩa
H1:Có ít nhất vài hệ số hồi quy có ý nghĩa
Trang 10Page | 10
Bậc tự do của giá trị t: =N-k-1
t=
-trong trắc nghiệm F:
H2:phương trình hồi quy không thích hợp
H3:phương trình hồi quy thích hợp với ít nhất vài βi
Bậc tự do của giá trị F:v1=1;vv=N-k-1
III.Áp dụng MS-EXCEL:
-Trong trắc nghiệm t:
H0 : Βi = 0 ó Các hệ số hồi quy không có ý nghĩa
H1 : Βi ≠ 0 ó Các hệ số hồi quy có ý nghĩa-Trong trắc nghiệm F:
H0 : Βi = 0 ó Phương trình hồi quy không thích hợp
H1 : Βi ≠ 0 ó Phương trình hồi quy thích hợp với ít nhất vài Bi
Bước 1:nhập dử liệu vào bản tính
Dử liệu nhất thiết phải được nhập theo cột
Trang 11Page | 11
Bước 2:áp dụng Regression
Nhấn lần lượt đơn lệnh tools và lệnh data Analysis
Chọn chương trình Regression trong hộp thoại data Analysis rồi nhấp OK
Trang 12Page | 12
Trong hộp thoại Regression ,làn lượt ấn các chi tiết:
Phạm vi của biến số Y (input Y range)Phạm vi của biến số X (input X range)Nhãn dử liệu(Labels)
Mức tin cậy(Confidence level)Tọa độ đầu ra(Output range)Đường hồi quy(line Fit Plots),…
Trang 13Page | 13
Các giá trị đầu ra cho bảng sau:
Trang 15Page | 15
=>Chấp nhận giả thiết H0
Vậy cả hai hệ số 2.73(B0) và 0.04(B1) của phương trình hồi quy
X1=2.73+0.04X1 đều không có ý nghĩa thống kê.nói cách khác phương trình hồi quy này không thich hợp
YX2=2.73+0.04X2 (R 2 =0.76,S=0.99)
t0=3.418> t0.05=2.365(hay Pv2=0.011>α=0.05)
Trang 16Vậy cả hai hệ số -11.14(B0) và 0.13(B1) của phương trình hồi quy
X2=2.73+0.04X2 đều có ý nghĩa thống kê.Nói cách khác phương trình hồi quy này thích hợp
IV.Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu xuất của phản
ứng tổng hợp.
X1,X2=-12.70+0.04X1+0.13X2 (R2=0.97; S=0.33)
Trang 18Page | 18
Vậy cả hai hệ số -12.70(B0),0.04(B1)và 0.13(B1)của phương trình hồi quy =-12.80+0.04X1+0.13X2 đều có ý nghĩa thống kê Nói cách
khác,phương trinh hồi quy này thích hợp
Kết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với
cả hai yếu tố là thời gian và nhiệt độ.
Sự tuyến tính của phương trình X1,X2=-12.70+0.04X1+0.13X2 có thể
được trình bày trong biểu đồ phân tán(scatterplots):
BIỂU ĐỒ:
Kết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với
cả hai yếu tố là thời gian và nhiệt độ.
Nếu muốn dự đoán hiệu xuất bằng phương trình hồi quy
Y=-12.70+0.04X1+0.13X2,chỉ cần chọn một ô,ví dụ như
Trang 19Page | 19
E20,sau đó nhập hàm=E17+E18*50+E19*115 và được kết quả như sau:
Ghi chú: E17 tọa độ của B0 ,E18 tọa độ của B1,E19 tọa độ của B2,50 là giá
trị của X1(thời gian) và 115 là giá trị của X2 (nhiệt độ)
BÀI 2:
Có 4 báo cáo viên A,B,C,D nói về cùng một chủ đề.sau đây là thời gian(tính bằng phút)mà mỗi báo báo cáo viên đó sử dụng trong 5 buổi báo ở các địa điểm khác nhau:
A: 25 29 30 42 35B: 35 20 20 17 30C: 30 27 18 19 26D: 28 32 33 35 24Hãy thiết lập bảng ANOVA cho các số liệu trên.Gỉa thiết H0là gì?giả thiết H0 có bị bác bỏ mứ ý nghĩa 5% hay không
Giải:
Trang 21j 1 i i
x T
ij i 1 j 1
x x
T x
i j
T
n T
x n
Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt củachữ Sum of Squares for Factor) được tính theo công thứcsau:
Trang 22SSF MSF
k 1
k – 1 được gọi là bậc tự do của nhân tố
Trung bình bình phương của sai số, ký hiệu là MSE (viếttắt của chữ Mean Square for Error) được tính bởi công
Trang 23Page | 23
thức:
SSE MSE
n k
n – k được gọi là bậc tự do của sai số
Tỷ số F được tính bởi công thức
MSF F
Bậc tự do
Trung bình bình phương
Trang 24Page | 24
MSF F
MSE
sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)
Thành thử giả thiết Ho sẽ bị bác bỏ ở mức ý nghĩa của phân bốFisher với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫusố
Giả thiết H0: H0:µ1= µ2= µ3= µ4 ĩ”thời gian nĩi trung bình của 4 người là thời gian nĩi trung bình của 4 người là bằng nhau”thời gian nĩi trung bình của 4 người là
Trang 25Page | 25
Bước 1: Tính SSF:
SSF = (1612 +1222 +1202+1522)/5 – 5552/20=260,55Bước 2: Tính SST:
Trang 26Page | 26
c biện luận:
từ bảng ANOVA thu được FR,FC
nếu FR<Fα=> chấp nhận H0 ( báo cáo viên)
IV.Quy trình giải thuật :
Khởi động Ms- EXCEL
Nhập dử liệu vào bảng:
Áp dụng “anova:single-factor”
Nhấn lần lượt lệnh tools và lệnh data analysis
Từ hộp thoại data analysis ta chọn” single-factor” rồi nhấp nút OK
Trang 27Page | 27
Trong hộp thoại anova:single factor, lần lượt ấn định các chi tiết:
Phạm vi đầu vào(input range)Nhãn dử liệu (labels in fisrt row/column)Ngưởng tin cậy (alpha)
Phạm vi đầu ra(output range)
Trang 28Page | 28
Sau khi nhấn OK ta thu được kết quả được thể hiện qua bảng anova sau:
Trang 293338314229Với mức ý nghĩa α=1% hãy so sánh lượng tiêu thụ trung bình của ba loại giầy nói trên
Giải:
Loại giầy
Trang 30Page | 30
I.Dạng: Bài toán phân tích phương sai một nhân tố
II.Cơ sở lí thuyết:
Giả sử {x , x , x } 11 21 n 1 1 là một mẫu có kích thước n1 rút ra từ tậphợp chính các giá trị của X1; {x , x , x } 12 22 n 2 2 là một mẫu kích thước rút
ra từ tập hợp chính các giá trị của X2, , {x , x , x } 1k 2k n k k là một mẫukích thước nk rút ra từ tập hợp chính các giá trị của Xk Các số liệu thuđược trình bày thành bảng ở dạng sau đây:
Các mức nhân tố
Trang 31j 1 i i
x T
ij i 1 j 1
x x
T x
i j
T
n T
x n
Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt của
Trang 32SSF MSF
k 1
k – 1 được gọi là bậc tự do của nhân tố
Trung bình bình phương của sai số, ký hiệu là MSE (viếttắt của chữ Mean Square for Error) được tính bởi công
Trang 33Page | 33
thức:
SSE MSE
n k
n – k được gọi là bậc tự do của sai số
Tỷ số F được tính bởi công thức
MSF F
Bậc tự do
Trung bình bình phương
MSE
Trang 34Page | 34
sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)
Thành thử giả thiết Ho sẽ bị bác bỏ ở mức ý nghĩa của phân bốFisher với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫusố
k
354
29,5
15 3
SSE MSE
MSF F
Trung bình bình phương Tỷ số F
Trang 35nếu F<Fα=>chấp nhận giả thiết H0
ngược lại thì bác bỏ giả thiết H0
IV.quy trình giải thuật:
Khởi động Ms- EXCEL
Nhập dử liệu vào bảng tính
Áp dụng “anova single factor”
Trang 36Page | 36
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.
Chọn trương trình Anova:single factor trong hộp thoại Data Analysis rồi
nhấn nút OK
Trong hộp thoại Anova: single factor lần lượt ấn định
Phạm vi đầu vào(input range)Cách xắp xếp theo hang hay cột(group by)Nhấn dử liệu(labels in fisrt row/column)Phạm vi đầu ra(output range)
Trang 37Page | 37
Sau khi nhấn OK xuất hiện bảng Anova:
Trang 38=>lượng tiêu thụ trung bình:
Loại C>Loại B>loại A
Trang 39Page | 39
BÀI 4:
Lượp với 3 ng s a v t đ c b i 16 con bị cái khi cho nghe các lo i nh c khác nhau(nh c ử ượp với 3 ởi 16 con bị cái khi cho nghe các loại nhạc khác nhau(nhạc ại nhạc khác nhau(nhạc ại nhạc khác nhau(nhạc ại nhạc khác nhau(nhạc
nh ,nh c r c,nh c c đi n,khơng cĩ nh c)đ c th ng kê trong b ng sau đây: ại nhạc khác nhau(nhạc ốc,nhạc cổ điển,khơng cĩ nhạc)được thống kê trong bảng sau đây: ại nhạc khác nhau(nhạc ổng hợp.các hiệu xuất ể thực hiện một phản ứng tổng hợp.các hiệu xuất ại nhạc khác nhau(nhạc ượp với 3 ốc,nhạc cổ điển,khơng cĩ nhạc)được thống kê trong bảng sau đây:
II.Cơ sở lí thuyết:
Giả sử {x , x , x } 11 21 n 1 1 là một mẫu có kích thước n1 rút ra từ tậphợp chính các giá trị của X1; {x , x , x } 12 22 n 2 2 là một mẫu kích thước rút
ra từ tập hợp chính các giá trị của X2, , {x , x , x } 1k 2k n k k là một mẫukích thước nk rút ra từ tập hợp chính các giá trị của Xk Các số liệu thuđược trình bày thành bảng ở dạng sau đây:
Trang 40Ta đưa ra một số kí hiệu sau
Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảngtrên):
i
n ji
j 1 i i
x T
ij i 1 j 1
x x
T x
Trang 41i j
T
n T
x n
Tổng bình phương do nhân tố ký hiệu là SSF (viết tắt củachữ Sum of Squares for Factor) được tính theo công thứcsau:
Trang 42SSF MSF
k 1
k – 1 được gọi là bậc tự do của nhân tố
Trung bình bình phương của sai số, ký hiệu là MSE (viếttắt của chữ Mean Square for Error) được tính bởi côngthức:
SSE MSE
n k
n – k được gọi là bậc tự do của sai số
Tỷ số F được tính bởi công thức
MSF F
MSE
Trang 43Bậc tự do
Trung bình bình phương
MSE
sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)
Thành thử giả thiết Ho sẽ bị bác bỏ ở mức ý nghĩa của phân bốFisher với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫusố
III.Thuật tốn:
Trang 44=>thu được bảng Anova ta thu được F
nếu F<Fα=>chấp nhận giả thiết H0
ngược lại thì bác bỏ giả thiết H0
IV.quy trình giải thuật:
Khởi động Ms- EXCEL
Nhập dử liệu vào bảng:
Áp dụng “anova single factor”:
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.
Chọn trương trình Anova:single factor trong hộp thoại Data Analysis rồi
nhấn nút OK
Trang 46Page | 46
Sau khi nhấn OK xuất hiện bảng Anova:
Trang 47Page | 47
V.Kết luận:
Từ giá trị trong bảng Anova:
F=1.35468<Fα=3.490295=> chấp nhận H0(loại nhạc)
=>lượng sữa trung bình của mỗi nhóm trên là giống nhau
=>vậy âm nhạc không ảnh hưởng đến lượng sửa của các con bò
Bài 5:
Hãy phân tích sự biến động của thu nhập ($/tháng/người) trên cơ
sở số liệu điều tra vềt thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau sau đây:
Trang 48I.Dạng bài tập: phân tích phương sai 2 yếu tố
Giả thiết Ho: “lượng thu nhập trung bình là như nhau theo ngành và nơi làm việc”thời gian nói trung bình của 4 người là
Ta áp dụng phương pháp phân tích phương sai 2 yếu tố ( không lặp ):
II.Cơ sở lý thuyết:
A KHÁI NIỆM THỐNG KÊ:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trịquan sát Yij (I = 1 2… r: yếu tố A; j = 1 2… c: yếu tố B)
Mô hình:
Trang 49Page | 49
Yếu tố A
cộng
Trung bình
1 2
… r
Y2
…
Yr
Y1 Y2
T.1 Y.1
T.2 Y.2
…
…
Tc Y.c
Tổng số bình phương Bình phương
trung bình
Giá trị thống kê
Trang 50Yếu tố B
(cột)
Sai số
(c-1)(r-1)(c-1)
H0 : µ1 = µ2 = … = µk ó “ Các giá trị trung bình bằng nhau”thời gian nói trung bình của 4 người là
H1 : µi ≠ µj ó “Ít nhất có hai giá trị trung bình khác nhau”thời gian nói trung bình của 4 người là
Giá trị thống kê : FR =
MSB MSE và FC = MSF MSE
Biện luận :
Nếu: FR < Fα [b-1,(k-1)(b-1)} => chấp nhận Hb-1,(k-1)(b-1)} => chấp nhận Ho (yếu tố A)
Trang 51=>thu được bảng Anova ta thu được F
nếu F<Fα=>chấp nhận giả thiết H0
ngược lại thì bác bỏ giả thiết H0
IV.quy trình giải thuật:
Khởi động Ms- EXCEL
Nhập dử liệu vào bảng:
Nh p d li u vào b ng tính : ập dữ liệu vào bảng tính : ữ liệu vào bảng tính : ện một phản ứng tổng hợp.các hiệu xuất
Trang 52a) Nhấp lần lượt đơn lệnh Tool và lệnh Data Analysis.
b) Chọn chương trình Anova:Two- trong hộp thoại Data Analysis rồi nhấp nút OK
c) Trong hộp thoại Anova: Two-Factor Without Replication, lần lượt ấn địnhcác chi tiết:
- Phạm vi đầu vào Input Range
- Nhãnn dữ liệu Lable in First Row/Column
- Ngưỡng tin cậy Alpha
- Phạm vi đầu ra Output Range
Trang 53Page | 53
Nhấn ok ta có bảng ANOVA:
Anova: Two-Factor Without Replication
Trang 54V.Kết quả và biện luận:
FR = 8.783 > F0.05 = 3.863 => Bác bỏ giả thuyết Ho (Loại ngành nghề)
FC = 1.233 < F0.05 = 3.863 => Chấp nhận giả thuyết Ho (Nơi làm việc)
Vậy: chỉ có loại ngành nghề mới có sự biến động về thu nhập
Trang 55Page | 55