Trong mọi ngành khoa học thực nghiệm, mọi kết quả bằng số đạt được trong thí nghiệm, hay nói chung trong thực tế đều là giá trị của một biến ngẫu nhiên, phụ thuộc vào nhiều nhân tố nội sinh và ngoại sinh ở các tổ hợp mức độ hay tổ hợp giá trị khác nhau của các nhân tố đó, mà để ước lượng được quy luật phụ thuộc bằng phân tích độ biến động người ta sử dụng phương pháp thống kê toán học.
Trang 1MỤC LỤC
CHẤP THUẬN CỦA HỘI ĐỒNG i
LỜI CÁM ƠN ii
LỜI CAM ĐOAN iii
MỤC LỤC iv
DANH SÁCH BẢNG vii
DANH SÁCH HÌNH ix
DANH MỤC TỪ VIẾT TẮT x
GIỚI THIỆU xi
Chương 1: CÁC KIẾN THỨC CƠ BẢN VỀ BỐ TRÍ THÍ NGHIỆM 1
1.1 Các khái niệm thống kê 1
1.1.1 Tổng thể và mẫu 1
1.1.2 Ước lượng các tham số đặc trưng của mẫu 1
1.1.3 Kiểm định giả thiết thống kê 3
1.1.4 Hệ số tương quan và hồi quy tuyến tính 6
1.2 Một số khái niệm về bố trí thí nghiệm 14
1.2.1 Nguyên tắc bố trí thí nghiệm 14
1.2.2 Xác định số thí nghiệm lập 16
1.2.3 Phân loại sai số 16
1.2.4 Định luật cộng sai số 17
1.2.5 Quá trình nghiên cứu nhờ bố trí thí nghiệm 17
Chương 2: MỘT SỐ BỐ TRÍ THÍ NGHIỆM 19
2.1 Bố trí thí nghiệm nhân tố toàn phần dạng 2k 19
2.1.1 Giới thiệu mô hình bố trí thí nghiệm nhân tố toàn phần dạng 2k .19
2.1.2 Tìm hệ số hồi quy bố trí thí nghiệm nhân tố toàn phần dạng 2k 21
2.1.3 Kiểm định ý nghĩa phương trình hồi quy và tính thích hợp của phương trình hồi quy 23
Trang 22.2 Bố trí thí nghiệm nhân tố riêng phần dạng 2k p 30
2.2.1 Giới thiệu mô hình bố trí thí nghiệm nhân tố riêng phần 2k P 30
2.2.2 Phân tích mô hình bố trí thí nghiệm nhân tố riêng phần 2k P 34
2.4 Ứng dụng 1 47
2.4.1 Tổng quan về ứng dụng 47
2.4.2 Kết quả thực hiện 50
Chương 3: BỐ TRÍ THÍ NGHIỆM VỚI NHÂN TỐ NGẪU NHIÊN 53
3.1 Bố trí thí nghiệm với nhân tố ngẫu nhiên 53
3.2 Tương tác hai nhân tố với nhân tố ngẫu nhiên 54
3.3 Mô hình tác động ngẫu nhiên với dữ liệu bảng 58
3.3.1 Thực nghiệm với nhân tố tác động cố định (FE) 58
3.3.2 Thực nghiệm với nhân tố tác động ngẫu nhiên (RE) 59
3.3.3 Ước lượng hệ số hồi quy nhân tố tác động ngẫu nhiên 60
3.3.4 Ước lượng tính thích hợp của mô hình hồi quy với nhân tố tác động ngẫu nhiên bằng kiểm định Hausman 62
3.4 Ứng dụng 2 64
KẾT LUẬN 68
TÀI LIỆU THAM KHẢO 69
PHỤ LỤC 70
Trang 3DANH SÁCH BẢNG
Bảng 2.1 Giá trị thí nghiệm mã hóa của bố trí thí nghiệm nhân tố 2 192
Bảng 2.2 Giá trị thí nghiệm mã hóa của bố trí thí nghiệm nhân tố 2 203
Bảng 2.3 Dữ liệu tự nhiên của bố trí nhân nhân tố 2 212
Bảng 2.4 Mô hình bố trí thí nghiệm và kết quả thực nghiệm 26
Bảng 2.5 Kết quả tính toán 26
Bảng 2.6 Kết quả phân tích hồi quy ví dụ 2.1 29
Bảng 2.7 Ma trận bố trí thí nghiệm riêng phần 2 3 1 31
Bảng 2.8 Ma trận tổng quát bố trí thí nghiệm riêng phần 34
Bảng 2.9 Dữ liệu tự nhiên bố trí thí nghiệm ví dụ 2.2 36
Bảng 2.10 Kết quả thực nghiệm ví dụ 2.2 36
Bảng 2.11 Kết quả tính toán thực hiện 3 thí nghiệm ở tâm 37
Bảng 2.12 Kết quả tính toán ví dụ 2.2 38
Bảng 2.13 Kết quả phân tích hồi quy ví dụ 2.2 39
Bảng 2.14 Kết quả tìm giá trị tối ưu bằng MODDE 5.0 40
Bảng 2.15 Kết quả phân tích hồi quy ví dụ 2.3 46
Bảng 2.16 Ký hiệu các biến đầu vào của ứng dụng 1 47
Bảng 2.17: Ma trận bố trí thí nghiệm ứng dụng 1 48
Bảng 2.18 Kết quả phân tích giả thuyết thống kê 50
Bảng 2.19 Kết quả phân tích hồi quy cho ứng dụng 1 50
Bảng 2.20 Kết quả giá trị phương án tối ưu của thí nghiệm 52
Bảng 3.1 Kết quả phân tích phương sai (Minitab 18.0) cho ví dụ 3.1 56
Bảng 3.2 Kết quả phân tích hồi quy (Minitab 18.0) cho ví dụ 3.1 57
Bảng 3.3 Kết quả phân tích hồi quy (STATA) của ví dụ 3.2 63
Trang 4Bảng 3.4 Kết quả kiểm định Hausman 63
Bảng 3.5 Mô tả dữ liệu 64
Bảng 3.6 Ma trận tương quan 65
Bảng 3.7 Kết quả phân tích hồi quy theo mô hình FE 65
Bảng 3.8 Kết quả phân tích hồi quy theo mô hình RE 65
Bảng 3.9 Kết quả phân tích hồi quy theo GLS 66
Trang 5DANH SÁCH HÌNH
Hình 2.1 Chọn kiểu bố trí thí nghiệm toàn phần (Full fac (2 levels)) 28
Hình 2.2 Kết quả bố trí thí nghiệm (MODDE 5.0) ví dụ 2.1 29
Hình 2.3 Mức độ, chiều hướng tác động của các nhân tố ví dụ 2.1 29
Hình 2.4 Chọn kiểu bố trí thí nghiệm riêng phần 2 4 1 (Frac Fac res IV) 38
Hình 2.5 Kết quả bố trí thí nghiệm (MODDE 5.0) ví dụ 2.2 39
Hình 2.6 Mức độ, chiều hướng tác động của các nhân tố ví dụ 2.2 40
Hình 2.7 Chọn kiểu bố trí thí nghiệm toàn phần 3 2 ví dụ 2.3 45
Hình 2.8 Kết quả bố trí thí nghiệm (MODDE 5.0) ví dụ 2.2 45
Hình 2.9 Mức độ, chiều hướng tác động của các nhân tố ví dụ 2.3 46
Hình 2.10 Chọn kiểu bố trí thí nghiệm toàn phần 3 2 ví dụ 2.3 48
Hình 2.11 Kết quả bố trí thí nghiệm (MODDE 5.0) ứng dụng 1 48
Hình 2.12 Mức độ, chiều hướng tác động của các nhân tố ứng dụng 1 51
Hình 2.13 Biểu đồ mặt đáp biểu thị chuyển hóa đạm trong sản phẩm khi cố định rượu bằng 3% 52
Trang 6DANH MỤC TỪ VIẾT TẮT
FGLS Ước lượng bình phương tổng quát tổi thiểu khả thi
Trang 7GIỚI THIỆU
Trong mọi ngành khoa học thực nghiệm, mọi kết quả bằng số đạt được trong thí nghiệm, hay nói chung trong thực tế đều là giá trị của một biến ngẫu nhiên, phụ thuộc vào nhiều nhân tố nội sinh và ngoại sinh ở các tổ hợp mức độ hay tổ hợp giá trị khác nhau của các nhân tố đó, mà
để ước lượng được quy luật phụ thuộc bằng phân tích độ biến động người ta sử dụng phương pháp thống kê toán học.
Vì không thể xét cả tổng thể, nên quy luật đó được nghiên cứu trên một tập con của nó, để từ đó ước lượng cho cả tổng thể với đọ tin cậy nào đó Tập con đó được gọi là mẫu, mẫu cở n gồm n phần tử, mỗi phần tử đều chứa trong nó những chỉ tiêu mà người thí nghiệm quan tâm, trong đó có những chỉ tiêu là nhân tố (điều khiển được) đóng vai trò là nhân tố giải thích, có chỉ tiêu cần giải thích (kết quả thí nghiệm) Nhiều vấn đề được đặt ra là: cở mẫu và các kiểu chọn mẫu, bố trí thí nghiệm, các phương pháp phân tích thí nghiệm, mô tả các kết quả của thí nghiệm
và lợi dụng chúng để đạt được kết quả tốt hơn Trong luận văn này tôi sẽ giới thiệu những kiểu bố trí thí nghiệm liên quan đến nhân tố và ứng dụng Bố trí thí nghiệm liên quan đến nhân tố là công cụ quan trọng trong các lĩnh vực khoa học kỹ thuật để cải thiện quá trình tạo ra sản phẩm Tầm quan trọng của công cụ này là thiết kế phát triển quy trình và quản lý quy trình đó.
Đề tài “Một số bố trí thí nghiệm liên quan đến nhân tố và ứng
dụng” nhằm hệ thống hóa các vấn đề về lý thuyết và ứng dụng chúng
trong khoa học thực nghiệm.
Bố trí thí nghiệm được giới thiệu lần đầu tiên vào năm 1935 bởi Ronald
A Fisher trong tài liệu Design Experiments
Sau đó vài dạng bố trí thí nghiệm được giới thiệu bởi Raj chandra Bose
và K Kishen vào năm 1940 tại viện thống kê Ấn Độ và bố trí thực nghiệmđược mọi người chú ý đến là quy hoạch Plackett – Burman được đăng trên tạpchí Biometrika vào năm 1946 Cùng lúc đó C.R Rao giới thiệu khái niệm matrận trực giao như là một dạng bố trí thực nghiệm khái niệm này đóng vai tròquan trọng trong việc phát triển phương pháp Taguchi
Trang 8Vào năm 1950, Gertrude Mary cox và William Gemmell Cochran xuấtbản sách “Experimenttal Design” Các nhà khoa học đóng góp đáng kể vàolĩnh vực bố trí thực nghiệm bao gồm C.S.Peirce, r A Fisher, F Yates, C R.Rao, R C Bose, O Kempthorne, W T Federer, G Taguchi, D Montgomery
…
Bố trí thí nghiệm được sử dụng rộng rải trong các lĩnh vực kinh tế, dịch
vụ, khoa học, công nghệ và kỹ thuật…để thiết kế và phát triển sản phẩm, quytrình mới, nâng cao chất lượng sản phẩm hiện có, quản lý quá trình…
Trước khi nghiên cứu tiến hành thí nghiệm, thực nghiệm người nghiêncứu cần xác định sơ bộ mô hình toán học của đối tượng nghiên cứu , cần xácđịnh mức độ nào cần thay đổi, mức độ nào cần cố định và mục tiêu tối ưu cầnđạt được
Thí nghiệm, thực nghiệm có thể tiến hành bằng hai cách: thí nghiệmtheo phương pháp cổ điển hoặc phương pháp tối ưu Khi tổ chức thí nghiệmtheo phương pháp cổ điển, người ta thay đổi lần lược từng nhân tố, do đó khinghiên cứu những quá trình phụ thuộc quá nhiều vào những nhân tố độc lậpthì phương pháp cổ điển trở nên rất cồng kềnh và tốn kém
Phương pháp thực nghiệm tối ưu cho phép thay đổi đồng thời nhiềunhân tố, xác định sự tương tác giữa các nhân tố nhờ đó giãm bớt số thí nghiệmchung
Quá trình nghiên cứu bố trí thí nghiệm là quá trình lặp gồm các bước:phỏng đoán; bố trí thí nghiệm; thực nghiệm; phân tích kết quả
Phân tích kết quả thực nghiệm dẫn đến hoặc là xác định mô hình được
đề ra và tính toán các hệ quả của nó, hoặc là hình thành một ước đoán khác.Các quá trình này được dùng nhiều lần trong thời gian nghiên cứu và nhờ kiếnthức và sự thông minh của ngườ nghiên cứu mà sự hiểu biết về đối tượngnghiên cứu lớn dần một cách vững chắc
Phương pháp mô hình hóa toán học là phương pháp hiện đại để tínhtoán và phân tích các quá trình kỹ thuật là vấn đề chọn công thức thực nghiệm
và ước lượng các tham số của công thức đó Để ước lượng được các giá strijthực của các đối tượng được quan sát và độ chính xác của các ước lượng cầnphải tiến hành xử lý các số liệu thực nghiệm Ở đây dùng phân tích hồi quy
Bố trí thí nghiệm được Fisher đề xuất trong những năm 30 để giải cácbài toán sinh học nông nghiệp Fisher đã đặt nền móng cho một lĩnh vực mới
Trang 9của thống kê toán học là giải tích phương sai, cho phép ước lượng vai trò củatừng nhân tố trong tổng phương sai Giải tích phương sai và giải tích hồi quydựa trên cơ sở thực nghiệm có mối liên quan rất phức tạp phương pháp bố tríthí nghiệm thực nghiệm từ khi đưa vào giải tích hồi quy đã mở ra n hững triễnvọng mới mẻ để giải nhiều bài toán trong hóa học, vật lý kỹ thuật, luyện kim,gia công cơ khí, vật liệu, chế tạo các linh kiện điện tử…các quá trình nghiêncứu được rút ngắn thời gian chuyển từ phòng thí nghiêm ra sản xuất, tiết kiệmthời gian, công sức và chi phí.
Trên cơ sở nghiên cứu đã được thực hiện, đề tài một số bố trí thínghiệm liên quan đến nhân tố và ứng dụng đã nghiên cứu và trình bày hệthống:
i) Những kiến thức cơ bản về bố trí thí nghiệm gồm những khái niệmthống kê về kiểm định giả thuyết thống kê, phân tích phương sai, phân tích hồiquy và hệ số tương quan…; Một số khái niệm về bố trí thí nghiệm như nguyêntắc bố trí thí nghiệm, sai số, định luật cộng sai số,…
ii) Một số bố trí thí nghiệm nhân tố toàn phần 2kvà riêng phân 2k p , bốtrí thí nghiệm bậc hai 3 , bố trí thí nghiệm với nhân tố ngẫu nhiên.k
Trên cơ sở lý thuyết trình bày, các nội dung được minh họa cụ thể bằngcác ứng dụng trong các lĩnh vực công nghệ, kỹ thuật, kinh tế, y tế, nôngnghiệp, công nghiệp,…vận dụng kiến thức nghiên cứu vấn đề liên quan đến bốtrí thí nghiệm và xử lý kết quả thực nghiệm bằng cơ sở toán học và một sốphần mềm hỗ trợ như MODDE 5.0, STATA
Trang 10CHƯƠNG 1: CÁC KIẾN THỨC CƠ BẢN VỀ BỐ TRÍ THÍ NGHIỆM 1.1 Các khái niệm thống kê
Tổng thể thường rất rộng lớn, chúng ta không có đủ thời gian, côngsức, tiền bạc, điều kiện,…, và đôi khi không cần thiết để quan sát hết các phần
tử của tổng thể Do đó, ta chỉ cần chọn ra một số đơn vị từ tổng thể chung theomột phương pháp lấy mẫu nào đó, từ đó suy đoán về các tham số, quy luật củatổng thể Các phần tử được chọn ra để nghiên cứu này được gọi là mẫu Sốlượng phần tử được chọn ra ta gọi là kích thước mẫu
1.1.2 Ước lượng các tham số đặc trưng của mẫu
1.1.2.1 Ước lượng kỳ vọng
Khi nghiên cứu thực nghiệm, người nghiên cứu không có những giá trịthực của các đặc trưng số của các đại lượng ngẫu nhiên, vì vậy phải ước lượngcác đại lượng các đặc trưng ấy trên cơ sở các thí nghiệm Mặc khác, số lượng
số thí nghiệm bị hạn chế những ước lượng ấy được xem như là những ướclượng của mẫu
Kỳ vọng toán học m x được ước lượng bằng giá trị trung bình:
1
n
i i
x x
1.1.2.2 Ước lượng phương sai và phương sai tái hiện
Phương sai được ước lượng bằng phương sai mẫu:
Trang 11Nếu thực nghiệm n thí nghiệm song song với các giá trị đo được là
1, , 2 m
s s s thìphương sai tái hiện được tính theo công thức:
m
f s f s f s s
i
f là bậc tự do của những thí nghiệm song song thứ i
1.1.2.3 Khoảng tin cậy và xác suất tin cậy
Các đặc trưng của mẫu là những ước lượng của các đặc trưng số của tậpchính khi số lượng mẫu đủ lớn Trong trường hợp số lượng mẫu có hạn thì cầnđánh giá mức độ chính xác của các ước lượng Ở đây nghiên cứu cần đánh giámức độ chính xác của giá trị trung bình thay cho kỳ vọng Có nghĩa là xét hiệu
x
x m
Trang 12Vấn đề đặt ra như sau: Một trong những đặc trưng quan trọng để đánhgiá mức độ hoàn thiện của quá trình kỹ thuật là sự ổn định của các kết quả lậplại thí nghiệm nhiều lần trong điều kiện tối ưu.
Ví dụ, chỉ xét các chỉ tiêu về chất lượng sản phẩm, về kinh tế kỹ thuậtkhông vượt ra ngoài những biên xác định nào đó Xác định những giá trị củacác biên ấy bằng số thí nghiệm rất khó khăn vì người thực nghiệm chỉ thựchiện một số ít thí nghiệm Có thể giải quyết khó khăn đó khi dùng thống kêtoán học: khoảng tin cậy và xác suất tin cậy
Cho xác suất đủ lớn sao cho sự kiện với xác suất có thể xem làchắc chắn và tìm giá trị f thỏa mãn :P x m( x )
Có nghĩa là miền giá trị thực tế có thể có sai số khi thay m x bằng x sẽ
là được gọi là xác suất tin cậy, đặc trưng cho độ chính xác của ướclượng Thường được chọn là 0.90, 0.95, thậm chí 0.99 Khoảng I x
được gọi là khoảng tin cậy
Các điểm x' x , "x x là những điểm biên của khoảng tin cậy
Khi cho ta tìm được giá trị của hàm Laplace: 2 k
ta suy ra khoảng tin cậy x k xm x x kx
Trang 13x phụ thuộc vào số thí nghiệm song song n; phụ thuộc n, khi ntăng thìxác suất tin cậy tăng.
Rõ ràng những sai số có giá trị tuyệt đối lớn hơn chỉ xuất hiện vớixác suất nhỏ: p 1 ; pđược gọi là mức ý nghĩa, biểu diễn theo phần trăm
1.1.3 Kiểm định giả thiết thống kê
Giả thiết thống kê là những giả thiết về sự phân bố các giá trị (hoặc tínhchất) thuộc tập chính của một đại lượng ngẫu nhiên.Trong nghiên cứu khoahọc, nhiều vấn đề được giải quyết nhờ đưa ra một số giả thiết sau đó kiểmđịnh các giả thiết ấy bằng thực nghiệm
Kiểm định các giả thiết thống kê là so sánh một số chỉ tiêu thống kêđược gọi là tiêu chuẩn kiểm định, được tính theo số liệu thực nghiệm với cácchỉ tiêu ấy được nêu ra theo giả thiết Để kiểm định cần nêu ra một giả thiết
0
H gọi là giả thiết không (Thuật ngữ Fisher) và đối thiết H (đối thiết có thể có
nhiều) Sau khi nêu ra giả thiết người ta chọn một bộ quy tắc xác định phươngpháp kiểm định giả thiết ấy Muốn chấp nhận hoặc bác bỏ giả thiết H cần biết0
thêm mức ý nghĩa Xác suất tinh cậy tương ứng là 1 Theo xác suất tincậy và giả thiết về sự phân phối của ước lượng (phân phối chuẩn hoặcStudent) ta tìm được phân vị các biên của khoảng tin cậyu/2 và u1/2, thường
là đối xứng với 0 Các số u/2 và u1/2 được gọi là các giá trị tới hạn của giả
thiết các giá trị u u /2 và u u 1 /2 tạo thành miền tới hạn của giả thiết H 0Nếu u được tính theo mẫu rơi vào miền tới hạn thì giả thiết H bị bác bỏ Khi0đối thiết H chỉ có một thì khi loại bỏ H có nghĩa là chấp nhận H 0
1.1.3.1 Kiểm định sự đồng nhất của hai phương sai
Giả sử có hai mẫu I và II với số lượng tương ứng là n và 1 n Vấn2
đề đặt ra là: hãy kiểm định hai mẫu ấy có phải được lấy từ những tập có cùngphương sai hay không
Giả thiết 12 22
Trang 14Tiêu chuẩn kiểm định: Muốn kiểm định hai phương sai, người ta
dùng tiêu chuẩn F - tiêu chuẩn Fisher Với:
2 1 2 2
s F
x x s
F F f f thì chấp nhận giả thiết H , ngược lại 0 H bị bác bỏ.0
Khi dùng tiêu chuẩn hai phía thì đối thiết 2 2
1.1.3.2 So sánh hai giá trị trung bình
Khi so sánh hai giá trị trung bình nhận được theo mẫu lấy từ hai tập
chính phân phối chuẩn, người ta dùng tiêu chuẩn t Giả sử hai mẫu
1, , , ; , , ,2 n1 1 2 n2
x x x y y y , lấy từ hai tập phân phối chuẩn với các đặc trưng số
tương ứng: m x, , ,x2 m y y2 từ các mẫu ta nhận được các ước lượng: x , s , y , x2
Trang 151 2
x y t
1 2
y x
x y t
s s s
Công thức: Hệ số tương quan của hai biến ngẫu nhiên X và Y, ký
hiệu xy được xác định bởi công thức : ( , )
Ý nghĩa: Hệ số tương quan của hai biến là đại lượng thể hiện chiều
hướng và độ mạnh của mối quan hệ tuyến tính giữa hai biến đó xy càng gần
1 thì mối quan hệ tuyến tính càng mạnh và xy càng gần 0 thì mối quan hệtuyến tính càng yếu
Trang 16Hệ số tương quan mẫu: trong thực tế, chúng ta không biết được chính
xác Cov X Y( , ), V X( ), V Y( ) để tính hệ số tương quan xyvì ta phải biết luậtphân phối xác suất của nó Do đó ta phải ước lượng các tham số của tổng thểtrong công thức tính nêu trên bởi các tham số mẫu đặt trưng Giả sử từ tổng
thể ta chọn ra một mãu gồm n phần tử Quan sát hai biến ngẫu nhiên X và Y
trên n phần tử này ta có số liệu cụ thể: ( ; ),( ; ), ,( ; )x y1 1 x y2 2 x y Khi đó hệ số n n
tương quan sẽ được ước lượng bằng hệ số tương quan mẫu Kí hiệu:
xy xy
1.1.4.2 Hồi quy tuyến tính
Mô hình: giả sử Y phụ thuộc vào k biến độc lập X X1, ,2 X bởi mô k
hình: Y 01 1x k k x
Trong đó:
là hệ số tung độ góc0
1, , ,2 là các hệ số hồi quyk
là thành phân ngẫu nhiên với E( ) 0 ,V ( )2
Mô hình hồi quy mẫu: Giả sử chúng ta có n quan sát, mỗi quan sát có
Trang 17Trong đó:
1 2
n
y y y y
1
n
i i i
n
ki i i
1.1.4.3 Kiểm định ý nghĩa của các hệ số hồi quy
- Việc kiểm định ý nghĩa của các hệ số hồi quy được thực hiện theo tiêuchuẩn Student:
j
j j
Trang 18Như vậy các hệ số trên đường chéo của ma trận là phương sai của các
hệ số cần kiểm định ý nghĩa, các phần tử không cùng nằm trên đường chéo là
co v của các hệ số hồi quy tương ứng, xác định sự phụ thuộc thống kê giữa các
Trang 19Với giả thiết các giá trị của thông số tối ưu hóa độc lập với nhau và có
sự đồng nhất của các phương sai tái hiện, ta có:
Trong đó: rujr b b u, jlà hệ số tương quan của b u và b j
Ma trận X X T 1 được gọi là ma trận sai số hoặc ma trận mômen tươngquan Vì rằng ma trận sai số hoặc là mômen tương quan không phải ma trậnđường chéo nên mọi hệ số hồi quy đều liên quan với nhau và không thể kiểmđịnh ý nghĩa mỗi hệ số riêng rẽ Vì vậy, tỷ số:
j j
y jj
b t
s C
Chỉ cho phép xếp hạng các nhân tố trong các thành phần của phươngtrình hồi quy theo mức độ ảnh hưởng của chúng vào thông số tối ưu
Trang 20Những nhân tố có t j lớn ảnh hưởng nhiều đến thông số tối ưu Nếu
Chẳng hạn, xét phương trình hồi quy là một đa thức bậc hai Ước lượngđược viết dưới dạng:
Bằng cách tương tự, có thể thay thế các số hạng phi tuyến của đa thức
có bậc bất kỳ bằng các số hạng tuyến tính Các phương trình này gọi làphương trình tuyến tính hóa theo thông số
Trang 21Như vậy có thể xem một đa thức bất kỳ sau khi tuyến tính hóa như mộtphương trình thuần nhất tuyến tính và có thể dùng những công thức phân tíchhồi quy đối với hệ phương trình hồi quy tuyến tính.
Nếu bậc của đa thức chưa biết trước thì việc tính toán thường phải tiếnhành vài lần, tăng dần bậc của đa thức đến chừng nào phương trình hồi quynhận được còn chưa tương thích với thực nghiệm
Mỗi lần tăng bậc đa thức, toàn bộ việc tính toán liên quan đến hồi quyđều phải tính lại Sự thay đổi bậc của đa thức hoặc loại bỏ một phần số hạngtrong phương trình hồi quy dẫn đến thay đổi các giá trị tính toán các hệ số cònlại trong đa thức Kết quả là xuất hiện sự không xác định trong việc ước lượngcác hệ số hồi quy, gây khó khăn cho việc giải thích ảnh hưởng của các biếnđộc lập vào đại lượng được nghiên cứu Vì vậy, trong trường hợp được xét thìdùng phương trình hồi quy như một công thức nội suy
Có thể tránh sự bất lợi nói trên nếu thực nghiệm được quy hoạch sao
cho tích của hai cột bất kỳ của X triệt tiêu, có nghĩa là
1
0
n
ji ui i
2 1
0
0
n i i T
n ki i
Trang 222 0 1
2 1
1
0
10
n i i T
n ki i
b j- là ước lượng của hệ số hồi quy j;
t là hệ số chuẩn tra bảng theo tiêu chuẩn Student
s b jlà sai số trong việc xác định b j
1.1.4.4 Kiểm định sự tương thích của phương trình hồi quy
Sự tương thích của phương trình hồi quy được kiểm định theo tiêuchuẩn Fisher
s tt2 là phương sai tương thích;
s th2 là phương sai tái hiện
Trang 23Trong đó p là số hệ số có ý nghĩa trong phương trình hồi quy.
Nếu F được tính nhỏ hơn giá trị tra bảng F1( , )f f1 2 với mức ý nghĩa
, f1f f tt; 2 f th thì phương trình tương thích với thực nghiệm
Bài toán xác định hệ số hồi quy dẫn đến việc xác định cực tiểu của hàmnhiều biến: 0, , ,1 k
y f x là giá trị của thông sô tối ưu hóa tìm được
theo ước lượng của phương trình hồi quy
Trang 24 Sự ngẫu nhiên hóa: Ngẫu nhiên là cần thiết để đảm bảo sự phân bổcông bằng phương pháp nghiên cứu cho các đơn vị để bảo vệ chống lại thiên
vị, và để đối phó với sự biến đổi tự nhiên giữa các đơn vị thí nghiệm bêntrong trường hợp đơn giản, sự ngẫu nhiên đòi hỏi mỗi hoán vị của tập hợp cácphương pháp nghiên cứu có xác suất bằng nhau xảy ra Do đó, mỗi lần nghiêncứu là như nhau có khả năng được áp dụng cho các đơn vị 'tốt' cũng như cácđơn vị 'xấu'
Trang 25 Chia khối: Đó là mong muốn cho các thiết lập của các đơn vị thửnghiệm được sử dụng để so sánh các phương pháp nghiên cứu để được hợp lýthống nhất (đồng nhất) trong phản ứng tự nhiên của họ, vì điều này làm giảmước lượng của biến đổi nền của các đơn vị thí nghiệm, do đó làm tăng độchính xác và khả năng cho thí nghiệm để phát hiện sự khác biệt xử lý nhỏ Vìvậy, nếu các đơn vị thử nghiệm là bản chất đa dạng (không đồng nhất), sau đócác thí nghiệm có khả năng là không nhạy cảm Hơn nữa, sử dụng một tập hợpcác đơn vị đồng nhất làm tăng khả năng so sánh giữa phương pháp nghiêncứu Tuy nhiên, nó không phải là luôn luôn có thể có được đầy đủ các đơn vịthí nghiệm đồng nhất cho toàn bộ một thí nghiệm Trong trường hợp này, nó
có thể xác định các nhóm đơn vị thử nghiệm là hợp lý đồng nhất, nhưng có sựkhác nhau cơ bản phản ứng giữa các nhóm Những nhóm đơn vị có thể đượcxem là khối trong thiết kế chia khối các đơn vị theo cách này có khả năng làmtăng độ chính xác của một thử nghiệm, khi so sánh giữa các phương phápnghiên cứu trong khối được thực hiện lại đối với một nhóm đồng đều hơn.Trong ý nghĩa này, chia khối được cho là được sử dụng để kiểm soát sự thayđổi, và vì lý do này cũng được biết đến như là kiểm soát địa phương
1.2.2 Xác định số thí nghiệm lập
Giả sử ta tìm số thí nghiệm ít nhất lặp lại trên mỗi thực nghiệm, khi đógiá trị trung bình x theo mẫu này khác với kỳ vọng toán không lớn hơn đạilượng cho trước Để giải bài toán này cần tìm độ lệch bình phương trungbình s2 Khi đó, giá trị n được xác định như sau:
Đại lượng t tìm theo bảng phụ thuộc vào hệ số q và bậc tự do f Nếu
số thí nghiệm > 120 thì thay vì t ta xác định như sau:
Trang 261.2.3 Phân loại sai số
Nếu biểu diễn giá trị thực là a , kết quả quan sát là X, thì độ lệch giữa giá trị thực và số đo được gọi là sai số quan sát X
Sai số hệ thống: sai số hệ thống không thay đổi do một loạt đo vàthay đổi theo một quy luật nhất định Muốn loại bỏ nó cần phải có một nghiêncứu đặc biệt và khi khám phá được có thể loại trừ bằng cách đưa vào một sốhiệu chỉnh thích hợp
Sai số ngẫu nhiên: là những sai số của phép đo còn lại sau khi dãloại bỏ những sai số hệ thống và sai số thô Thường các sai số ngẫu nhiên phânphối đối xứng đối với không Sau này ta chỉ xét đến sai số ngẫu nhiên, vì:
X X a, (M X ) 0 nên ( )M X a
1.2.4 Định luật cộng sai số
Các đại lượng ngẫu nhiên độc lập có tính chất cộng phương sai
Giả sử X i i( 1, )n là những đại lượng ngẫu nhiên, a i i( 1, )n là
những đại lượng không ngẫu nhiên và 1 1 2 2
Trang 27
Nếu các đại lượng X X1, 2, X n được xem như kết quả của n
quan sát độc lập của cùng một đại lượng ngẫu nhiên X thì
s s n
Xác định mục tiêu, định hướng vấn đề cần nghiên cứu Xác định biếnđáp ứng cần phải nêu ra để phân tích tìm phương án tối ưu và xác định cácnhân tố được kiểm soát, thực nghiệm để tối ưu hóa quy trình
Xác định các loại phép đo, các mức độ cần thực nghiệm
1.2.5.2 Lựa chọn mô hình thống kê
Mô hình thống kê cần được xây dựng liên quan đến mối quan hệ giữacác biến và các phân phối lỗi của chúng Điều này phụ thuộc vào mục tiêunghiên cứu, số lượng nhân tố, các mức độ của từng nhân tố và thậm chí làphương pháp đo, phương pháp thực nghiệm Có thể là mô hình tuyến tính, môhình bậc hai, mô hình tác động ngẫu nhiên…
1.2.5.3 Thực nghiệm
Tiến hành xây dựng bố trí thí nghiệm dựa trên mục tiêu và mô hìnhthống kê được lựa chọn Tiến hành thực nghiệm trên cơ sơ các nhân tố và cácphép đo được chọn cần đảm bảo :
Tính hợp lý
Tính chính xácTính tổng quát hóa
Trang 28 Dễ dàng thực hiện
1.2.5.4 Phân tích
Trên cơ sở số liệu thực nghiệm thu được người nghiên cứu cần tiếnhành việc phân tích số liệu để đánh giá mức độ phù hợp của mô hình và tìmphương án tối ưu cho mục tiêu nghiên cứu Thường được tiến hành các bướcsau:
Đánh giá giả thuyết thống kê tùy theo mô hình lựa chọn (sẽ đượctrình bày trong chương 2 và chương 3)
Kiểm định tính phù hợp của mô hình như: ý nghĩa của hệ số hồi quy,tính tương thích của phương trình hồi quy
Tối ưu hóa mô hình nhờ sự hỗ trợ của phần mềm MODDE 5.0,STATA
1.2.5.5 Kiểm nghiệm phương án tối ưu
Khi tìm được phương án tối ưu người nghiên cứu cần tiến hành kiểmnghiệm dựa vào các nghiệm thức tối ưu để suy luận và kết luận mức độ chínhxác của quá trình nghiên cứu
Chương 2: MỘT SỐ BỐ TRÍ THÍ NGHIỆM
2.1 Bố trí thí nghiệm nhân tố toàn phần dạng 2k
2.1.1 Giới thiệu mô hình bố trí thí nghiệm nhân tố toàn phần dạng 2k
Bố trí nhân tố 2k là bố trí k nhân tố, mỗi nhân tố có 2 mức độ X và1min
1max
X Để tiện cho việc tính toán ta chuyển từ nhân tố tự nhiên sang nhân tố
mã hóa bằng phép biến đổi:
Trang 29- Nếu X j X jminthì x j 1
Phân tích tác động của k nhân tố X X1, , ,2 X , mỗi nhân tố có hai mức k
độ Mô hình thống kê của bố trí nhân tố 2k bao gồm k tác động chính, 2
Bảng 2.1 Giá trị thí nghiệm mã hóa của bố trí thí nghiệm nhân tố 22
Trang 308 + - + - - + - + y8
Bố trí nhân tố 2k có các đặc trưng sau:
Tính đối xứng và tâm quy hoạch: Tổng đại số các phần tử cột của bất
kỳ nhân tố nào đều bằng 0:
2.1.2 Tìm hệ số hồi quy bố trí thí nghiệm nhân tố toàn phần dạng 2k
Bài toán: Giả sử chúng ta quan tâm đến hai nhân tố X và 1 X Mỗi2nhân tố có hai mức độ thấp và cao Trong mỗi mức của nhân tố có n quan sát (n lần lập lại) Điều kiện cần thỏa mãn là tổng thể phải có phân phối chuẩn,
phương sai của các nhóm nghiên cứu phải đều nhau Ta xét sự tác động củanhân tố X và 1 X và tác động đồng thời của 2 nhân tố lên hiện tượng nghiên2
cứu
Trang 31Bảng 2.3 Dữ liệu tự nhiên của bố trí nhân nhân tố 2 2
Trang 321 1
2 1
3 1
N
i i i N
i i i T
N
i i i N
i i i
1 1
0
1 1
4
N N
i i
i i
i i
12
N
i i
x x y
Trang 33j k ji i i
Giá trị của các hệ số b j đặc trưng sự đóng góp của nhân tố thứ j vàobiến đáp ứng Các phần tử trên đường chéo chính của ma trận hiệp biến bằngnhau nên mọi hệ số của phương trình được xác định với độ chính xác như sau:
j
th b
s s
i
y y
i
y y s
Trang 342 max 2 1
N
i i
Nếu G G 1( , )f f1 2 ta có phương sai đồng nhất
Tính phương sai tái hiện:
2
N i i
th
s s
j
x y b
Nếu t j t f( ),f N m( 1)thì b j bị loại khỏi phương trình hồi quy
Kiểm định sự tương thích của mô hình hồi quy:
y y s
Trang 35Với p là số hệ số có ý nghĩa trong phương trình hồi quy.
Nếu F F1( , )f f1 2 thì phương trình hồi quy tương thích với thựcnghiệm Trong đó f1N p f, 2 N m( 1)
Nếu F F1( , )f f1 2 thì phương trình hồi quy không tương thích vớithực nghiệm và phải tăng bậc của đa thức
Ví dụ 2.1 Xem xét nghiên cứu tác động của chất phản ứng và chất xúc
tác lên năng suất của quá trình hóa học Gọi chất phản ứng là nhân tố x , có1
hai mức độ là 15% và 25% và hiệu quả của chất xúc tác là nhân tố x , có mức2
độ cao biểu thị sử dụng 2 pounds của chất xúc tác và có mức độ thấp biểu thị
sử dụng 1 pounds chất xúc tác Thí nghiệm được lập lại 3 lần và dữ liệu theobảng sau:
Bảng 2.4 Mô hình bố trí thí nghiệm và kết quả thực nghiệm
Trang 36N i i i
N i i i
N i i i
N
i i
1 2
j j j
th
y y s
0.594
j
th b
s s
N
Tính ý nghĩa của các hệ số được kiểm định theo tiêu chuẩn Student.Kiểm tra mức độ ảnh hưởng của các nhân tố đến biến đáp ứng, với mức ýnghĩa 0.05
j
j j
Trang 3727.5
46.610.59
2.243
j j tt
s s
2.243
1.611.39
tt th
s F s
Trang 38Hình 2.1 Chọn kiểu bố trí thí nghiệm toàn phần (Full fac (2 levels))
Các lựa chọn như hình 2.1, kết quả:
Phân tích hồi quy chọn: analysis/ coefficients/ list
Bảng 2.6 Kết quả phân tích hồi quy ví dụ 2.1
Trang 39Conf lev = 0.95
Kết quả của bảng 2.6 sắp sỉ kết quả tính bằng công thức Hệ số hồi quycủa tác động tương tác x x1 2 giá trị P 0.05 nên kết luận rằng tác động củatương tác là không đáng kể
-4 -3 -2 -1 0 1 2 3 4 5
Qua kết quả phân tích hồi quy bảng 2.7 và đồ thị hình 2.3 mô tả chothấy nhân tố x1- chất phản ứng có tác động theo chiều thuận đến quá trìnhphản ứng và nhân tố x2- chất xúc tác có ảnh hưởng nghịch đến biến đáp ứng –quá trình phản ứng Biến tương tác x x1 2 ảnh hưởng không đáng kể nên ta cóthể loại ra khỏi mô hình Với mức ý nghĩa 0.05, P giá trị nhỏ nên tínhtương thích của mô hình hồi quy được thỏa, tức là các nhân tố độc lập có tácđộng đáng kể đến biến đáp ứng Tiếp theo, người nghiên cứu sẽ phân tíchphương trình hồi quy để tìm phương án tối ưu
2.2 Bố trí thí nghiệm nhân tố riêng phần dạng 2k p
2.2.1 Giới thiệu mô hình bố trí thí nghiệm nhân tố riêng phần dạng 2k P
Bố trí thí nghiệm nhân tố riêng phần là thực nghiệm chỉ tiến hành ở một
số kết hợp giữa các mức của nhân tố
Khi dùng mô hình tuyến tính thì số thí nghiệm trong bố trí thí nghiệmnhân tố toàn phần sẽ quá nhiều so với hệ số hồi quy cần tính Số thí nghiệm sẽgiãm đáng kể nếu dùng bố trí thí nghiệm nhân tố riêng phần
Để lời giải riêng phần là một phương án trực giao cần chọn bố trí thínghiệm nhân tố riêng phần có số nhân tố nhỏ hơn làm cơ sở Ví dụ, để xét ảnh
Trang 40hưởng của ba nhân tố x x x1, ,2 3 vào biến đáp ứng y, trong trường hợp mô hìnhtuyến tính được biểu diễn dạng:
0 1 1 2 2 3 3
Muốn xác định các hệ số hồi quy b j nhờ lời giải riêng phần, ta dùng bốtrí thí nghiệm nhân tố toàn phần hai nhân tố làm cơ sở Trong ma trận bố trí thínghiệm nhân tố riêng phần cột x x1 2 ta thay bằng x3 Do vậy, chỉ thực nghiệm
4 nghiệm thức thay vì 8 nghiệm thức như trong bố trí thí nghiệm nhân tố toànphần là 2 3
k p là số nhân tố trong mô hình bố trí thí nghiệm nhân tố riêng phần
Ví dụ, Nếu trong bố trí thí nghiệm nhân tố toàn phần 2 3có một trongcác tác động tương tác (x x1 2,x x1 3,x x2 3,x x x1 2 3) được thay bằng nhân tố thứ 4 x4,