Phương pháp bình phương nhỏ nhất OLS là phương pháp rất đáng tin cậy trong việc ước lượng các tham số của mô hình, tuy nhiên mô hình ước lượng phải thỏa mãn giả thiết.. ANOVA MỘT YẾU T
Trang 1TRUONG DAI HOC BACH KHOA
Trang 2- 211300 | TK suy dién va thảo luận
Huynh Nguyên Phúc Duy SA
Trang 3
Muc luc
1 Mô hình hồi quy tuyén tinh DOD ccc cece teeeeteeeee 6
2 Ước lượng các tham số của mô hình hồi quy tuyến tính bội 7
2.1 Hàm hồi quy tổng thể (PRu - Population Regression
2.2 Hàm hồi quy mẫu (SRụ - Sample Regression uunction) 7
2.3 Phương pháp bình phương nhỏ nhất (OLS - Ordinary Least
SqUaF) - Q.0 20201212121 1212112121212212121101 0111 11H tt H111 na 8
2.3.1 Mô hình hồi quy tuyén tinh 2521222222222 re §
2.3.2 Các giá trị của X được cố định trong việc lấy mẫu lặp lại
8
2.3.3 Phương sai của sai số không đổi -. - eeeeseeeeseeeeees §
2.3.4 Độc lập theo chuỗi - - cc2nn 0.20211111212121 21 re 9
2.3.5 Phương pháp ước lượng các hệ số sec 9
2.4 Độ phù hợp của mô hình - 5: 2222121212121 12221222 rre 10
2.5 Khoảng tin cậy và kiểm định các hệ số hồi quy 12
2.5.1 Ước lượng khoảng tin cậy đối với các hệ số hồi quy 12
2.5.2 Kiểm định giả thiết đối với fị -sc cua 12
2.6 Kiểm định ý nghĩa của mô hình 2222222 22212 xe 13
1 Trường hợp k tông thê có phân phối bình thường và phương sai bằng nhau 14
Trang 41 Thực hiện tính thống kê mô tả cho các biến trong dữ liệu -c s25: 25
2 Vẽ biểu đồ biểu thị phân phối cho các biến 2-52 S222 15282121215 2122 236 25
1 Ta cân nghiên cứu xem mức độ ảnh hưởng của các thông sô điều chỉnh trong máy
ín 3D đến độ nhám của bản in như thế nào) - 2-2 S21 555 5355255525551 1251551215555 25e5 34
2 Ta cần nghiên cứu xem mức độ ảnh hưởng của các thông sô điêu chỉnh trong mây
¡n 3D đến độ căng của bản ín như thế nảo) -2- 2 22 2219EE2252212212122121221222Xe2 39
3 Ta cân nghiên cứu xem mức độ ảnh hưởng của các thông số điều chỉnh trong máy
¡n 3D đến độ căng của bản ín như thế nảo) -2- 2 22 2219EE2252212212122121221222Xe2 44
Trang 5I TONG QUAN DU LIEU
Tập tin “data.csv” chứa bộ dữ liệu của nhóm nghiên cứu khoa Cơ khí Đại học Selcuk
Mục đích của nghiên cứu là xác định mức độ ảnh hưởng của các thông số điều chỉnh của máy in 3D đến chất lượng in, độ chính xác
và độ bền
Bộ dữ liệu bao gồm 50 quan sát với 9 thông số cài đặt đầu vào và
3 thông số đầu ra được đo lường và ghi chép
Dir liệu gốc được cuủng cấp - tại: https:/www.kaggle.com/datasets/afumetto/3dprinter
Các thông số đầu vào bao gồm:
« Layer height (mm): Độ cao lớp
«_ Wall thickess (mm): Độ dày lớp ngoài
« _ Infill density (%): Phần trăm độ điền đầy
e Infill pattern: Kiéu điền day
¢ Nozzle temperature (C°): Nhiét dé dau dun
¢ Bed temperature (C°): Nhiệt độ bàn in
e Print speed (mm/s): Téc dé in
e Material: Vat liéu
¢ uan speed (%): D6 manh cua quạt
Các thông số đầu ra bao gồm:
e Roughness (um): Dé nham
e Ultimate tension strength (MPa): Dé bén kéo I6n nhat
e Elongation (%): Dé gian dai
Đề tài nghiên cứu được thực hiện trên máy in Ultimaker S5 3-D Kiểm nghiệm sức bền của vật liệu và sản phẩm in được thực hiện trên máy kéo Sinotec GMBH với khả năng kéo 20kN
Trang 7II KIẾN THỨC NỀN
A HỒI QUY
Phân tích hồi quy là một dạng phân tích thống kê với mục đích
xác định được sự thay đổi của một yếu tố đầu ra (biến phụ thuộc)
dựa vào sự tác động của một hay nhiều biến số đầu vào (biến độc
lập) Mô hình hồi quy với hai hay nhiều biến độc lập được gọi là mô
hình hồi quy đa biến hoặc mô hình hồi quy bội
Ví dụ: Sự phụ thuộc của điểm số của sinh viên dựa vào hoàn cảnh
gia đình, thời gian dành cho việc giải trí, môi trường học và giới tính,
; SỨC mạnh của vận động viên cử tạ dựa vào các điều kiện như chế
độ dinh dưỡng, thời gian tập luyện một tuần (giờ), thời gian nghỉ
ngơi, số lượng bài tập hằng tuần, ; Độ hiểu quả của vaccine dựa
trên độ tuổi, giới tính, cân nặng,
1 Mô hình hồi quy tuyến tính bội
Công thức tổng quát của mô hình hồi quy đa biến:
« _B¡: hệ số hồi quy riêng
e u: sai số ngẫu nhiên
Bi do lường tác động riêng phần của biến X; lên Y với điều kiện các
biến số khác trong mô hình không đổi Cụ thể hơn, nếu các biến
khác trong mô hình không đổi, giá trị kỳ vọn của Y sẽ tăng B¡ đơn
nếu X; tăng 1 đơn vị
Như vậy, "Hồi quy tuyến tính" là một phương pháp để dự đoán
giá trị biến phụ thuộc (Y) dựa trên giá trị của biến độc lập (X) Thuật
Trang 8ngữ tuyến tính dùng để chỉ rằng bản chất của các thông số của tổng
thể B¡ và B; là tuyến tính (bậc nhất) Nó có thể được sử dụng cho các
trường hợp chúng ta muốn dự đoán một số lượng liên tục Ví dụ: dự
đoán lượng nước trung bình một người trưởng thành uống một năm
v.v Bằng dữ liệu thu thập được, ta đi ước lượng hàm hồi quy của
tổng thể, đó là ước lượng cáctham số của tổng thể: Bi, B2, , Br
2 Ước lượng các tham số của mô hình hồi quy tuyến tính bội
2.1 Hàm hồi quy tổng thể (PRF - Population Regression
Function)
Với Y là biến phụ thuộc, Xa, X:, , X là biến độc lập, Y là ngẫu
nhiên và có một phân phối xác suất nào đó Suy ra, tồn tại E(Y|X;,
X:, , Xk) = giá trị xác định Do vậy, u(X;, X:, , X¿) = E(Y|X:, X:, ,
X.) là hàm hồi quy tổng thể của Y theo X;, X:, , X Với một cá thể i,
tồn tại (X2i, X34, ., Xxi, Yi)
Tuy vậy, giá trị thực tế của tổng thể có sự sai khác so với giá trị
tính toán Lượng sai khác u; đó được tính như sau:
u, = Y,-F Vậy hàm hồi quy tổng thể có dạng:
Y=E(Y|X} + u,
2.2 Ham héi quy mau (SRF - Sample Regression Function)
Do không biết tổng thể, nên chúng ta không biết giá trị trung
bình tổng thể của biến phụ thuộc là đúng ở mức độ nào Do vậy
chúng ta phải dựa vào dữ liệu mẫu để ước lượng
Trên một mẫu có n á thể, goi Y = U(X, X3, , Xx) là hồi quy mẫu
Với một cá thể mẫu Y; z ú(X;¡, X:¡, , X¿¡) sinh ra e¡ = Y¡ - ú (X;, X:,
Xx); ®¡ gọi là phần dư SRụ
Ta có hàm hồi quy mẫu tổng quát được viết dưới dạng như sau:
Vi = B, + Box, + Bsx., + Bix,
Trang 9Phan du sinh ra: e; = y; - Vi
Ký hiéu: 8, la ước lượng của B„ Chúng ta trông đợi g,, la udc
lượng không chệch của B„, hơn nữa phải là một ước lượng hiệu quả
Ước lượng SRụ: chọn một phương pháp nào đó để ước lượng các
tham số của ụ qua việc tìm tham số của ú và lấy giá trị quan sát của
các tham số này làm giá trị xấp xỉ cho tham số của ụ
2.3 Phương pháp bình phương nhỏ nhất (OLS - Ordinary
Least Square)
Phương pháp bình phương nhỏ nhất được đưa ra bởi nhà Toán học
Đức Carl uriedrich Gauss Tư tưởng của phương pháp này là cực tiểu
tổng bình phương của các phần dư Do đó có thể nói để có được hồi
quy thích hợp nhất, chúng ta chọn các ước lượng có tung độ gốc và
độ dốc sao cho phần dư là nhỏ
Phương pháp bình phương nhỏ nhất (OLS) là phương pháp rất
đáng tin cậy trong việc ước lượng các tham số của mô hình, tuy
nhiên mô hình ước lượng phải thỏa mãn giả thiết Khi thỏa mãn các
giả thiết, ước lượng bình phương nhỏ nhất (OLS) là ước lượng tuyến
tính không chệch có hiệu quả nhất trong các ước lượng Vì thế
phương pháp OLS đưa ra ước lượng không chệch tuyến tính tốt nhất
(BLUE)
Kết quả này được gọi là Định lý Gauss - Markov, theo lý thuyết
này ước lượng OLS là BLUE, nghĩa là trong tất cả các tổ hợp tuyến
tính không chệch của Y, ước lượng OLS có phương sai bé nhất Các
giả thiết như sau:
2.3.1 Mô hình hồi quy tuyến tính
Mô hình hồi quy là tuyến tính theo các tham số của mô hình
y = Bi + BoX2 + B3X3 + BaXa + + BEX + U
Trang 10
2.3.2 Các giá trị của X được cố định trong việc lấy mẫu lặp
lại
Giá trị lấy ra từ biến X được coi là cố định trong các mẫu lặp lại X
được cho là không ngẫu nhiên
e E(u|X) = 0
e _ Đồng phương sai giữa u; và X; bằng 0, cov(u¡, Xi) = 0
e Sự biến thiên trong các giá trị của X
Các giá trị Xi trong mẫu cho trước không thể tất cả đều bằng
nhau, var (Xi ) z 0
2.3.3 Phương sai của sai số không đổi
X¡j= Elu,-Elu|X,ƒ = Elưi
Xi =ơi
e Mô hình hồi quy được xác định một cách đúng đắn (không có
độ thiện lệch hoặc sai số đặc trưng)
se Không có đa cộng tuyến hoàn toàn
2.3.5 Phương pháp ước lượng các hệ số:
Ta đặt:
e y¡ ký hiệu giá trị thực của biến y tai quan sat i
e _ÿ;, ký hiệu giá trị của hàm hồi quy mẫu
« _e; ký hiệu phần dư y, - yi
Trang 11» e= » Vị iB + BX,, + B; X,, Tit ñ Xu, I"
Chúng ta có thể thiết lập các điều kiện bậc nhất cho phép tính tối
thiểu này như sau:
Hệ phương trình mà chúng ta có được gọi là hệ phương trình
chuẩn của hồi quy mẫu Chúng ta có thể giải k phương trình chuẩn này để tìm k hệ số ô chưa biết ổ,, ổ,, , 8, được gọi là các ước lượng
bình phương nhỏ nhất
Trang 12
2.4 Độ phù hợp của mô hình
Để có thể biết mô hình giải thích được như thế nào hay bao nhiêu
% biến động của biến phụ thuộc, người ta sử dụng Rˆ
Ta có: X(y¡ - ÿ)?= 3[(y¡ - ÿ¡) + (ÿ¡ - ÿ)]? = X[ei + (ÿ¡ - ÿ)]?
= Ye? + 22e(¥i - y) + 2(yi - y)?
Với:
¢ X(yi- y)* : TSS - Total Sum of Squares
«_ >(ÿ; - ÿ)? : ESS - Explained Sum of Squares
¢ Ye? : RSS - Residual Sum of Squares
Do >3e:(ÿ¡ - ÿ) = 0 c (Xeiÿi = 0; >eiy = 0)
Trang 13ess _, rss _ (Ziyi viii
—— ®
Tỷ số giữa tổng biến thiên được giải thích bởi mô hình cho tổng
bình phương cần được giải thích được gọi là hệ số xác định, hay là trị thống kê “good of fit” Từ định nghĩa R? chúng ta thấy R? đo tỷ lệ hay
số % của toàn bộ sai lệch Y với giá trị trung bình được giải thích bằng mô hình Khi đó người ta sử dụng R? để đo sự phù hợp của hàm hồi quy:
se Nếu R? =0, nghĩa là mô hình không đưa ra thông tin nào về sự
thay đổi của biến phụ thuộc y
Trong mô hình hồi quy đa biến tỷ lệ của toàn bộ sự khác biệt của biến y do tất cả các biến x: và x: gây ra được gọi là hệ số xác định
bội, ký hiệu là R2,
ñ, >,|y, - y|ÍX„ - x,|+ » ly¡- y|lXa- %| =1- » (e,)?
2.5 Khoảng tin cậy và kiểm định các hệ số hồi quy
R’ =
2.5.1 Ước lượng khoảng tin cậy đối với các hệ số hồi quy
Mục đích của phân tích hồi quy không phải chỉ suy đoán về B1,
82 Bk mà còn phải kiểm tra bản chất sự phụ thuộc Do vậy cần phải biết phân bố xác suất của B1, B2, , Bk Các phân bố này phụ thuộc vào phân bố của các ui
Với các giả thiết OLS, ui có phân phối N (0, ơ?) Các hệ số ước lượng tuân theo phân phối chuẩn:
Trang 14« _ Ước lượng 2 phía, ta tìm được uin-3 =1~# thỏa mẫn:
ñ, - Bị
<———'.< -3
PL ín- 3)
« _ Khoảng tin cay 1 - a cua Bị là:
lô: ty n - 3)Se|Ệ, |: B+ t, [n- 3}Se(B,|
2.5.2 Kiém dinh gia thiét déi voi B,
Kiểm định ý nghĩa thống kê của các hệ số hồi quy có ý nghĩa hay không: kiểm định rằng biến giải thích có thực sự ảnh hưởng đến biến phụ thuộc hay không Nói cách khác là hệ số hồi quy có ý nghĩa
thống kê hay không
Có thể đưa ra giả thiết nào dé déi vdi Bj, chang han Bj = Bj* Nếu
gia thiét dung thi:
Trang 15
Phia trai B, <8," B, > B, t> t(n-k) Phía phải B, >B, B,< 8B, t<t,(m-k) Kiểm định Bj:
¢ Ho: Bj = 0 © xj không tác động
¢ Hi: Bj #0 = x; có tác động
¢ Hi: Bj < 0 @ xj c6 tac déng ngược
¢ Hi: Bj > 0 & xj cé tac dong thuan
2.6 Kiểm định ý nghĩa của mô hình
Trong mô hình hồi quy đa biến, giả thuyết “không” cho rằng mô
hình không có ý nghĩa được hiểu là tất cả các hệ số hồi quy riêng đều bằng 0
Ứng dụng kiểm định Wald (thường được gọi là kiểm định ụ) được
tiến hành cụ thể như sau:
Bước 1: Giả thuyết “không” là Họ: Ba = Ba: = = B = 0
Giả thuyết đối là H1: “có ít nhất một trong những giá trị B khác
„
không”
Bước 2: Trước tiên hồi quy Y theo một số hạng không đổi và Xa, X:,
, X, sau đó tính tổng bình phương sai số RSSu, RSSạ Phân phối ụ là
tỷ số của hai biến ngẫu nhiên phân phối khi bình phương độc lập Điều này cho ta trị thống kê:
Trang 16
Bước 3: Tra số liệu trong bảng ụ tương ứng với bậc tự do (k - 1) cho
tử số và (n - k) cho mẫu số, và với mức ý nghĩa a cho trước
Bước 4: Bác bỏ giả thuyết Họ ở mức ý nghĩa ơ nếu ục > u(ơd, k-1, n- k) Đối với phương pháp giá trị p, tính giá trị p = P(ụ > ụ.|Ho) và bác
bỏ giả thuyết Ho nếu p < ơ
B ANOVA MỘT YẾU TỐ (One-way ANOVA)
Phân tích phương sai (Analysis of Variance - ANOVA) là một phương pháp thống kê được sử dụng để so sánh trung bình của ba hoặc nhiều nhóm khác nhau để xem xét xem có sự khác biệt đáng
kể giữa chúng hay không Mục tiêu của ANOVA là phát hiện ra xem liệu sự biến động giữa các nhóm có xuất phát từ sự ngẫu nhiên hay
từ một yếu tế nguyên nhân nào đó
Phân tích phương sai một yếu tô (One-way ANOVA) là phân tích ảnh hưởng của một yếu tô nguyên nhân (dạng biến định tính) ảnh hưởng đến một yếu tô kết quả (dạng biến định lượng) đang nghiên cứu
1 Trường hợp k tổng thể có phân phối bình thường và phương sai bằng nhau Giả sử, muốn so sánh trung bình của k tông thể trên những mẫu độc lập ngẫu nhiên gồm nụ, nạ, n:, , n¿ quan sát từ k tông thê này Đề có thế tiến hành phân tích
ANOVA, cần phải ghi nhớ 3 giả định sau về các nhóm tông thê:
e _ Các tông thể có phân phối chuẩn
e Phuong sai của các tổng thê bằng nhau
® Các quan sát được lay mau tir tong thê là độc lập nhau
Nếu trung bình của các tong thé duoc ki hiéu la Lu, bo, [3, , [x thi khi cdc piả định trên được đáp ứng, mô hình phân tích phương sai một yếu tố ảnh hưởng được mô tả dưới dạng kiểm định gia thuyét như sau:
Trang 17HO: pi = be = pp = = Uk Gia thuyét HO cho rang trung bình của k tổng thể bằng nhau, xét
về mặt nghiên cứu liên hệ thì giả thuyết này cho rằng yếu tố nguyên nhân không có tác động gì đến vấn đề đang nghiên cứu Ta có được giả thuyết đối của giả thuyết H0 là:
HI: Tổn tại ít nhất một cặp trung bình tổng thể khác nhau Hai giả định đầu tiên đề tiến hành phân tích phương sai được mô tả như hình dưới đây, bạn thấy ba tổng thế đều có phân phối bình thường với mức độ phân tán tương đối giống nhau, nhưng ba vị trí chênh lệch của chúng cho thấy ba trị trung bình khác nhau Rõ ràng là nếu bạn thực sự có các 1á trị của 3 tong thê và biểu diễn được phân phối của chúng như hình dưới thì bạn không cần phải làm gì nữa mà kết luận được noay là bạn bác bỏ H0 hay 3 tổng thé nay có trị trung bình khác nhau
Trang 18
Trước hết ta xem cách tính các trung bình mẫu từ những quan sát của k mẫu ngẫu nhiên độc lập (kí hiệu X¡› X; %;› - X¿) và trung bình chung của k mẫu quan sát (kí hiệu X ) từ trường hợp tổng quát như sau:
Bảng 1: Bảng số liệu tổng quát thực hiện phân tích phương sai
Tổng các chênh lệch bình phương trong nội bộ nhóm (SSW) được tính bằng cách cộng các chênh lệch bình phương giữa các giá trị quan sát với trung bình mẫu của từng nhóm, rồi sau đó lại tính tổng cộng kết quả tát cả các nhóm lại SSW phản ánh phần biến thiên của yếu tô kết quả do ảnh hưởng của các yếu tố khác, chứ không phải
Trang 19do yếu tố nguyên nhân đang nghiên cứu (là yếu tổ dùng để phân biệt các tông thê/ nhóm đang so sánh)
Tổng các chênh lệch bình phương của từng nhóm được tính theo công thức:
SST = »y (xụ~ XÝ
i=l j=l
Trang 20Có thế đễ dàng chứng minh là tổng các chênh lệch bình phương toản bộ bằng tổng
cộng tông các chênh lệch bình phương trong nội bộ các nhóm và tông các chênh lệch
bỏ H0 và kết luận là yếu tổ nguyên nhân đang nghiên cứu ảnh hưởng có ý nghĩa đến yếu tố kết quả
Bước 3: Tính các phương sai (là trung bình của các chênh lệch bình phương)
Các phương sai được tính bằng cách lấy các tổng các chênh lệch bình phương chia cho bậc tự do tương ứng
Tình phương sai trong nội bộ nhóm (MSW) bằng cách lây tông các chênh lệch bình phương trong nội bộ các nhóm (SSW) chia cho bậc tự do tương ứng là n-k (n là số quan sát, k là số nhóm so sánh) MSW là ước lượng phân biến thiên của yếu tố kết qua
do các yếu tô khác gây ra (hay giải thích)
SSW
MSW ==>"
Tính phương sai giữa các nhóm (MSG) bằng cách lấy tông các chênh lệch bình phương giữa các nhóm chia cho bậc tự do tương ứng là k — 1 MSG là ước lượng phần biến thiên của yếu tô kết quả do yếu tố nguyên nhân đang nghiên cứu gây ra (hay giải thích được)
MSG =——
k-1 Bước 4: Kiểm định gia thuyét
Trang 21
Giả thuyết về sự bằng nhau của k trung bình tổng thế được quyết định dựa trên tỉ
số của hai phương sai: phương sai giữa các nhóm (MSG) và phương sai trong nội bộ nhóm (MSW), tỉ số này được gọi là tý số F vì nó tuần theo qui luật Fisher- Snedecor với bậc tự do là k - 1 ở tử số và n - k ở mẫu sô
g -MSG MSW
Ta bác bỏ giả thuyết H0 cho rằng trị trung bình của k tông thể bằng nhau khi:
Ý nghĩa của công thức và logic của các tính toán trong bảng trên cân được hiểu rõ
để có thế vận dụng và giải thích các kết quả phân tích một cách súc tích
2 Kiểm tra các gia dinh cua phan tích phương sai
Chúng ta có thể kiểm tra nhanh cac gia dinh nay bang dé thi Histogram la phuong pháp tốt nhất dé kiểm tra giả định về phân phối bình thường của đữ liệu nhưng nó đòi
hỏi một số lượng quan sát khá lớn Biểu đồ thân lá hay biểu đỗ hộp và râu là một thay
Trang 22thế tốt trong tình huống số quan sát ít hơn Nếu công cụ đồ thị cho thấy tập dữ liệu mẫu khá phù hợp với phân phối bình thường đã thỏa mãn Hình dưới mô tả biểu đỗ hộp râu cho tập dữ liệu mẫu về ba nhóm sinh viên trong tập dữ liệu của chúng ta Đồ thị cho thấy ngoại trừ nhóm có thời gian tự học TB có hình đáng phân phối của dữ liệu hơi lệch sang trái, còn hai nhóm còn lại có phân phối khá cân đối Với số quan sát không nhiều thì biểu hiện như thế này của dữ liệu là khả quan và có thế chấp nhận được
Đề khảo sát giả định bằng nhau của phương sai, biểu đỗ hộp và râu cũng cho cảm nhận ban đầu nhanh chóng, với ba biểu đỗ này, mức độ phân tan cua dir liéu trong
trong mỗi tập đữ liệu mẫu không khác biệt nhau nhiều
Một phương pháp kiếm định tham số chắc chắn hơn cho giả định phương sai bằng
nhau là kiểm định Levene về phương sai của các tông thể Kiếm định này xuất phát từ giả thuyết sau
© Hy: 0) = 05 = = 0;
¢ H,: Không phải tat cả các phương sai đều bằng nhau
Đề quyết định chấp nhận hay bác bỏ H0 ta tính toán giá trị kiểm định F theo công thức
Trang 23Trong đó s;„ là phương sai lớn nhất trong các nhóm nghiên cứu và s” là phương sai nhỏ nhất trong các nhóm nghiên cứu
Giá tri F tính được được đem so sánh với giá trị Fj,„,„ tra được từ bảng phân phối
Hartley Fmax (là bảng số 5 trong phần phụ lục) Trong đó k là số nhóm so sánh, bậc
tự do df tính theo công thức df = (ñ - 1) Trong tỉnh huỗng các nhóm này khác nhau
k
thì _ > mh (chú ý néu két qua tinh cua 1 1a số thập phân thì ta lây phần nguyên)
n =
Quy tac quyét dinh:
F nax > Figata thi ta bac bo Ho cho rằng phương sai bằng nhau và ngược lại
Nếu chúng ta không chắc chắn về các giả định hoặc nếu kết quả kiếm định cho thấy các øiảá định hoặc nếu kết quả kiểm định cho thấy các giả định không được thỏa
mãn thì một phương pháp kiêm định thay thế cho ANOVA là phương pháp kiểm định
hi tham số Krusksl-Wallis sẽ được áp dụng Tuy nhiên trong ví dụ này ở đây, ta có thé xem các giả định đề tiến hành phân tích phương sai đã được thỏa mãn
3 Phân tích sâu ANOVA
Mục đích của phân tích phương sai là kiếm định giả thuyết Ho rằng trung bình của
các tông thê bằng nhau Sau khi phân tích và kết luận, có hai trường hợp xảy ra là chấp nhận giả thuyết Ho hoặc bác bỏ giả thuyết Ho Nếu chấp nhận giả thuyết Ho thì phân tích kết thúc Nếu bác bỏ giả thuyết H0, bạn kết luận trung bình của các tổng thế không bằng nhau Vì vậy, vấn để tiếp theo là phân tích sâu hơn để xác định nhóm (tông thể) nào khác nhóm nào, nhóm nảo có trung bình lớn hơn hay nhỏ hơn
Có nhiều phương pháp để tiếp tục phân tích sâu ANOVA khi bác bỏ giả thuyết Ho Trong chương này chỉ để cập đến 1 phương pháp thông dụng đó là phương pháp
Tukey, phương pháp này còn được gọi là kiểm định HSD (Honestly Significant
Differences) Nội dung của phương pháp này là so sánh từng cặp các trung bình nhóm
ở mức ý nghĩa œ nào đó cho tất cả các cặp kiểm định có thể để phát hiện ra những
Trang 24nhóm khác nhau Nếu có k nhóm nghiên cứu, và chúng ta so sánh tất cả các cặp nhóm thì số lương cặp cần phải so sánh là tô hợp chập 2 của k nhóm
Các giả thuyết cần kiểm định sẽ là :
1 Ho! y= Hos Hye AM
do, wx là giá trị tra bảng phân phối kiểm dinh Tukey (Bang tra số 9) ở mức ý nghĩa
œ, với bậc tự do k vàn — k, với n là tổng số quan sát mẫu (n = Є n,)
MSW là phương sai trong nội bộ nhóm
n, là số quan sat trong 1 nhóm (tổng thê), trone trường hợp mỗi nhóm có số quan sát n, khác nhau, sử dụng giá trị n; nhỏ nhất
Tiêu chuẩn quyết định là bác bỏ giả thiết Hạ khi độ lệch tuyệt đối gitta các cặp trung bình mẫu lớn hơn hay bằng T giới hạn
Trong chương trình Excel không có các lệnh phân tích sâu ANOVA Chúng ta có
thé thực hiện phân tích này bằng chương trình SPSS Ngoài ra kết quả của SPSS còn cung cấp cho các bạn một kiếm định chính thức về sự bằng nhau của các phương sai tong thé la kiém dinh Levene (Bạn đọc có thể xem cách thức tiến hành kiểm tra giả
Trang 25định của phân tích ANOVA một yếu tố và phân tích sâu ANOVA trong sách Phân tích
đữ liệu nehiền cứu với SPSS của củng tác p1ả)
Phân tích phướng sai với kiểm định F chỉ có thể áp dụng khi các nhóm so sánh có phân phối bình thường và phương sai bằng nhau Trong trường hợp không thỏa điều
kiện này, chúng ta có thê chuyến đổi đữ liệu của yếu tổ kết quả từ dạng định lượng về dạng định tính (dữ liệu thứ bậc) và áp dụng một kiểm định phi tham số phủ hợp tên là Kruskal- Wallis Bạn đọc có thê tìm hiểu về kiểm định này ở Chương 10, kiểm định phi tham số
Trang 26Il TIEN XU LY SO LIEU
Trang 27Median :0.100 Median 5.00 Median :50.0 Mode :character Median :220.0 Mean 20.106 Mean : §.22 Mean 353.4 Mean 2221.5
3rd Qu.:0.150 3rd Qu.: 7.00 3rd Qu.:80.0 3rd Qu.:230.0
Max :0.200 Max :10.00 Max 290.0 Max :250.0
bed temperature print_speed material fan_speed roughness
Min : 60 Min : 40 Length : 50 Min Min : 21.0 lst Qu.:65 ist Qu.: 40 Class :character ist Qu.: 25 ist Qu.: 92.0 Median :70 Median : 60 Mode :character Median : 50 Median :165.5
Mean :70 Mean : 64 Mean : 50 Mean :170.€
3rd Qu.:75 3rd Qu.: 60 3rd Qu.: 75 3rd Qu.:239.2
Max :80 Max :120 Max :100 Max :368.0
e Lap bang thong ké sé long cho 2 bién infill_pattern, material
e© Lệnh và kết quả của 2 biến
> table (data BTL$Ệinfill pattern)
Biéu do Histogram cua cac bién “tension strenght’, “elongation”, “roughness”
¢ Biéu dé tension strenght