BÀI TẬP 1: A. Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? Dạng bài: Kiểm định giá trị trung bình. Cơ sở lý thuyết: Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n × n. Thí dụ như mô hình vuông la tinh 4 × 4 : B C D A C D A B D A B C A B C D BÀI TẬP 1: A. Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? Dạng bài: Kiểm định giá trị trung bình. Cơ sở lý thuyết: Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n × n. Thí dụ như mô hình vuông la tinh 4 × 4 : B C D A C D A B D A B C A B C D BÀI TẬP 1: A. Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? Dạng bài: Kiểm định giá trị trung bình. Cơ sở lý thuyết: Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n × n. Thí dụ như mô hình vuông la tinh 4 × 4 : B C D A C D A B D A B C A B C D BÀI TẬP 1: A. Ví dụ 10 trang 172 Đề bài: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ? Dạng bài: Kiểm định giá trị trung bình. Cơ sở lý thuyết: Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n × n. Thí dụ như mô hình vuông la tinh 4 × 4 : B C D A C D A B D A B C A B C D
Trang 1Yêu cầu: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ?
Dạng bài: Kiểm định giá trị trung bình.
Trang 2 Phương pháp giải: Phân tích phương sai 3 yếu tố (A, B, C)
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá trị
quan sát Yijk (i = 1, 2 r: yếu tố A; j = 1, 2 r: yếu tố B: k = 1, 2 r: yếu tố C).
Sai số (r-1)(r-2) SSE=SST −(SSC+SSF +SSR) MSE=
H0: μ1 = μ2 = = μk ↔ Các giá trị trung bình bằng nhau
H1: μi ¿ μj ↔ Có ít nhất hai giá trị trung bình khác nhau
Trang 3Chọn ô B9 nhập vào biểu thức: ¿∑( B 2, C 5 , D 4,E3)
Chọn ô C9 nhập vào biểu thức: ¿∑( B 3 ,C 2, D 5,E4)
Chọn ô D9 nhập vào biểu thức: ¿∑( B 4 , C 3 , D 2,E5)
Chọn ô E9 nhập vào biểu thức: ¿∑(B 5 , C 4 , D 3,E2)
Tính giá trị T…
Trang 4Tính các giá trị SSR, SSC, SSF, SST, SSE
Các giá trị SSR, SSC, SSF
Chọn ô I7 nhập vào biểu thức : ¿G 7/4−39601/ POWER (4,2)
Dùng con trỏ chuột kéo kí hiệu tự điền từ ôn I7 đến I9
Dùng con trỏ chuột kéo kí hiệu tự điền từ ôn M7 đến M9
Kết quả sau khi tính toán:
Kết quả và biện luận:
Trang 5B Ví dụ 12 trang 181:
Đề bài: Người ta dùng 3 mức nhiệt độ gồm 105, 120 và 135 kết hợp với 3 khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%) đưuọc trình bày trong bảng dưới đây:
Thời gian (phút) Nhiệt độ (°C) Hiệu suất (%)
Dạng bài: Phân tích tương quan và hồi quy tuyến tính.
Trang 6H0: βi = 0 ↔ Hệ số hồi quy không có ý nghĩa.
H1: βi ¿ 0 ↔ Hệ số hồi quy có ý nghĩa
H0: βi = 0 ↔ Phương trình hồi quy không thích hợp
H1: βi ¿ 0 ↔ Phương trình hồi quy thích hợp
Giá trị thống kê: F= MSR
MSE
Biện luận:
Nếu F < Fα(1,N-2) → Chấp nhận H0
Trang 7 Phương pháp giải: Hồi quy tuyến tính đa tham số.
Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y
có liên quan đến k biến số độc lập Xi ( i = 1, 2, 3, …, k) thay vì chỉ có một như hồi quy tuyến tính đơn giản
MSE =
MSR MSE
Trang 8F <Fα(1,N-k-1) → Chấp nhận H0
Bài làm:
Nhập dữ liệu vào bảng tính:
Áp dụng Regression
Trên thanh công cụ , nhấn vào Data
Trong mục Data vừa chọn, nhấp chọn vào biểu tượng Data Analysis
Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấp OK
Trang 9Trong hộp thoại Regression, lần lượt ấn định các chi tiết:
Phạm vi của biến số Y ( input range)
Phạm vi của biến số X ( input range)
Nhãn dữ liệu ( Labels)
Mức tin cậy ( Confidence level)
Tọa độ đầu ra ( Output range)
Đường hồi quy ( Line Fit Plots)
Biểu thức sai số: ( Residual Plots),…
Viết phương trình đường hồi quy Y^¿X1=f (X1)
Các giá trị nhập vào như sau:
Input Y Range: Kéo chuột từ ô C1 đến C10
Input X Range: Kéo chuột từ ô A1 đến A10
Nhấp chọn Labels
Nhấp chọn Confidence Level là 95%
Nhấp chọn vào Output Range , chọn A15 ( Kết quả sẽ xuất hiện luôn trong sheet này vào ô kết quả đầu tiên sẽ được ghi vào ô A15, các kết quả khác sẽ được ghi dựa vào ô A15 này )
Nhấp OK
Trang 10Kết quả hiển thị như sau:
Phương trình hồi quy: Y^¿X1=f (X1)
Trang 11Vậy cả hai hệ số 2,37(B o) và 0,04(B1) của phương trình hồi quy Y^¿X1=2,73+0,04 X1 đềukhông có ý nghĩa thống kê Nói một cách khác, phương trình hồi quy này không thích hợp.
Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp
Viết phương trình đường hồi quy Y^¿X2=f (X2)
Các giá trị nhập vào như sau:
Input Y Range: Kéo chuột từ ô C1 đến C10
Input X Range: Kéo chuột từ ô B1 đến B10
Nhấp chọn Labels
Nhấp chọn Confidence Level là 95%
Nhấp chọn vào Output Range , chọn A15 ( Kết quả sẽ xuất hiện luôn trong sheet này vào ô kết quả đầu tiên sẽ được ghi vào ô A15, các kết quả khác sẽ được ghi dựa vào ô A15 này )
Nhấp OK
Kết quả hiển thị như sau:
Trang 12Phương trình hồi quy: Y^¿X2=f (X2)
Viết phương trình đường hồi quy Y^¿X1, X2=f (X1, X2)
Các giá trị nhập vào như sau:
Input Y Range: Kéo chuột từ ô C1 đến C10
Input X Range: Kéo chuột từ ô A1 đến B10
Nhấp chọn Labels
Trang 13 Nhấp chọn Confidence Level là 95%
Nhấp chọn vào Output Range , chọn A15 ( Kết quả sẽ xuất hiện luôn trong sheet này vào ô kết quả đầu tiên sẽ được ghi vào ô A15, các kết quả khác sẽ được ghi dựa vào ô A15 này )
Nhấp OK
Kết quả hiển thị như sau:
Trang 14Phương trình hồi quy: Y^¿X1, X2=f (X1, X2)
Trang 15Ghi chú: 50 là giá trị của X1 (Thời gian) và 115 là giá trị của X2 (nhiệt độ)
Trang 16- Nếu P (X>χ qs2) > α → Chấp nhận giả thiết H0 và ngược lại.
Thực hiện bài toán:
Trang 17- Áp dụng hàm số CHITEST để tính xác suất P:
Trang 18H1: Ba giống bò này không thuần nhau về phương diện sản xuất lượng sữa.
- Biện luận:
Nếu P (X>χ qs2) = 0.022515147 < α=0,05 bác bỏ giả thiết H0
Vậy ba giống bò này không thuần nhau về phương diện sản xuất lượng sữa
3.1:3.5:2.715.02.0:2.2:1.8
2.0:2.49.5:9.3:9.11.2:1.3:1.2
5.0:5.419.5:17.55.0:4.8:5.2
Dạng toán : Phân tích phương sai 2 yếu tố (có lặp)
+ Tổng bình phương chung, ký hiệu là SST, được tính theo công thức sau:
n0 k( ¯ x0 k−¯ x )2
Trang 19+Tổng bình phương do sai số, ký hiệu là SSE, được tính theo công thức
jk n
+ Tổng bình phương do tương tác (Sum of Squares for Interaction) ký hiệu là SSI,
được tính theo công thức
r – 1 gọi là bậc tự do của A bằng số mức của A trừ 1
+Trung bình bình phương của nhân tố B, ký hiệu là MSFB, được tính theo côngthức
c – 1 gọi là bậc tự do của B bằng số mức của B trừ 1
+ Trung bình bình phương của sai số, ký hiệu là MSE, được tính bởi
SSE MSE
n cr
n – cr gọi là bậc tự do của sai số
+ Trung bình bình phương của tương tác, ký hiệu là MSI, được tính bởi
SSI MSI
Trang 20Tương tự tỷ số F cho nhân tố B, FB được tính bởi
Ta có quy tắc quyết định như sau:
+ Nếu FA> f (r – 1, n – cr) thì ta bác bỏ giả thiết
:
A o
H “Các mức A1, Arcó hiệu quả trung bình như nhau”
+ Nếu FB> f (c – 1, n – cr) thì ta bác bỏ giả thiết
:
B o
H “Các mức B1, B2, Bccó hiệu quả trung bình như nhau”
+ Nếu FAB> f ((r – 1)(c – 1), n – rc)
Ta bác bỏ giả thiết:
:
AB o
H “Có sự tương tác giữa A và B”.
Trên thực hành tính toán chúng ta thực hiện như sau:
Giả sử Tjktổng các giá trị trong mẫu (j, k).Ký hiệu
, ,
Ta có các đẳng thức sau:
2T SST A
n
Trang 212
jo A
k 1 j 1
T SSE A
jo 2
j 1 A
TTSSF
ok 2
k 1 B
T
T SSF
T SSE A
m
(7’)Trước hết ta cần tính các đại lượng Tjk Tiếp theo tính các giá trị Tjo,
njo, nok, Tok, n, T và A theo các công thức (1), (2), (3)
Từ đó tính SST, SSFA, SSFB, SSE và SSI theo các công thức (4), (5),
Trang 22H02(yếu tố quận):tình hình kinh doanh ở 4 quận là như nhau
Nhập bảng số liệu
Vào DataData AnalysisTwo – Factor With Replication
Điền thông số vào cửa sổ trên
Trang 23Nhấn OK, ta thu được bảng sau:
Trang 24Với mức ý nghĩa 1%, kiểm định giả thiết cho rằng tuổi và mức thu nhập có quan
hệ với nhau hay không
Cơ sở lý thuyết:
Dạng bài toán: Kiểm định tính độc lập
Trang 25k i
O E E
Oi: các tần số thực nghiệm (observed frequency);
Ei: các tần số lý thuyết (expected frequency)
Biện luận:
Nếu 2 2 Bác bỏ giả thuyết H0 (DF = k-1)
Trong chương trình MS-EXCEL có hàm CHITEST có thể tính:
- Giá trị 2 theo biểu thức:
2
ij ij 2
Oij: tần số thực nghiệm của ô thuộc hàng i và cột j;
Eij: tần số lý thuyết của ô thuộc hàng i với cột j;
r: số hàng;
c: số cột
- Xác suất P(X >2) với bậc tự do DF = (r-1)(c-1); trong đó, r là số hàng và c
là số cột trong bảng ngẫu nhiên (contingency table)
Nếu P(X >2) > α Chấp nhận giả thuyết H0 và ngược lại
Phương pháp giải
Trang 27Tính giá trị “P” : Chọn ô B14 và nhập biểu thức =CHITEST(B4:D6,B10:D12)
Trang 28Ta thấy: 2 2 Bác bỏ giả thuyết H0
Kết luận: Tuổi và mức thu nhập không có mối quan hệ với nhau
Trang 291 Lượng báo bán ra ở 5 quận có thực sự khác nhau hay không?
Dạng bài: Kiểm định giá trị trung bình một nhân tố.
Phương pháp giải: Phân tích phương sai một nhân tố.
- Mục tiêu của phân tích phương sai là so sánh trung bình của nhiều nhóm (tổng thể)
dựa trên các số trung bình của các mẫu quan sát từ các nhóm này và thông qua kiểm
định giả thuyết để kết luận về sự bằng nhau của các số trung bình này
- Phân tích phương sai một yếu tố là phân tích ảnh hưởng của một yếu tố nguyên nhân(dạng biến dữ liệu định tính) đến một yếu tố kết quả (dạng biến dữ liệu định lượng)
đang nghiên cứu
Công cụ giải: Anova Single Factor.
Sai số n-k SSE ¿ SST −¿ SSF MSE= SSE
Trang 30+ Giá trị thống kê:
F = MSF MSE
+ Biện luận:
Nếu F ¿ Fα(k – 1 ; N−k ) ⇒ Chấp nhận giả thuyết H0
Thực hiện bài toán bằng excel:
+ Nhập bảng số liệu vào mẫu excel:
+ Vào Data/ Data Analysis/Anova: Single Factor
+ Chọn các mục như hình:
- Phạm vi đầu vào (Input range)
- Cách xắp xếp theo hàng hay cột (Group by): chọn Column(Cột)
- Nhãn dữ liệu (Labels in fisrt row/column)
- Mức ý nghĩa (Alpha): 0.01
- Phạm vi đầu ra (Output range)
Trang 31+ Kết quả
+ Giả thuyết:
H0: Trung bình lượng báo bán ra ở 5 quận bằng nhau
H1: Trung bình lượng báo bán ra ở 5 quận không bằng nhau
+ Biện luận
F¿1,6352 ¿ F0,01¿ 4,1774 ⇒ Chấp nhận H0
Trang 32 Cơ sở lý thuyết:
Phân tích phương sai 2 yếu tố nhằm xem xét cùng lúc 2 yếu tố nguyên nhân (dưới dạng dữ liệu định tính) ảnh hưởng đến yếu tố kết quả (dưới dạng dữ liệu định lượng) đang nghiên cứu
+ Mô hình:
+ Bảng ANOVA:
+ Giả thuyết:
H0: u 1¿ u 2¿ … ¿ u A “Các giá trị trung bình bằng nhau”
H1: u i ≠ u j “Ít nhất có hai giá trị trung bình khác nhau”
+ Giá trị thống kê:
FA¿ MSA
MSE , FB¿ MSB
MSE + Biện luận:
Trang 33Nếu FA¿ Fα[n−1,(n−1)(m−1)]⇒ Chấp nhận giả thuyết H0 (Yếu tố A)
Nếu FB ¿ Fα[m−1,(n−1)(m−1)]⇒ Chấp nhận giả thuyết H0 (Yếu tố B)
Thực hiện bài toán bằng excel:
+ Nhập bảng số liệu vào mẫu excel:
+ Vào Data/ Data Analysis/Anova: Two-Factor Without Replication
+ Trong hộp thoại Anova: Two-Factor Without Replication, lần lượt ấn định các chi tiết:
- Phạm vi đầu vào (Input range)
- Nhãn dữ liệu (Labels in fisrt row/column)
- Mức ý nghĩa (Alpha): 0.01
- Phạm vi đầu ra (Output range)
Trang 35Vậy số lượng báo bán ra và yếu tố thời gian là các ngày trong tuần có liên quan tới nhau