một số khía cạnh thống kê trong thiết kế thí nghiệm tính các hệ số hồi quy, phân tích phương sai và đánh giá tính phù hợp của phương trình hồi quy, phân tích phương sai anova thiết kế thí nghiệm bậc 1, mạng noron nhân tạo
Trang 1B Ộ GIÁO DỤC VÀ ĐÀO TẠO B Ộ Y TẾ
T RƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI
Trang 2MỤC LỤC
1 MỘT SỐ KHÁI NIỆM 1
1.1 Biến và phân loại biến 1
1.2 Tối ưu hoá 3
1.3 Thiết kế thí nghiệm 4
1.4 Trình tự tiến hành thiết kế thí nghiệm và tối ưu hoá 5
2 MỘT SỐ CÔNG CỤ TOÁN HỌC VÀ KHÍA CẠNH THỐNG KÊ LIÊN QUAN ĐẾN THIẾT KẾ THÍ NGHIỆM 5
2.1 Mã hoá các giá trị của biến đầu vào 5
2.2 Một số khía cạnh thống kê trong thiết kế thí nghiệm 7
3 MỘT SỐ THIẾT KẾ THÍ NGHIỆM THƯỜNG DÙNG 12
3.1 Thiết kế bậc 1 12
3.2 Thiết kế bậc 2 24
4 MỘT SỐ PHƯƠNG PHÁP TỐI ƯU HOÁ THƯỜNG DÙNG 29
4.1 Giới thiệu 29
4.2 Phương pháp thực nghiệm theo đường dốc nhất 34
4.3 Phương pháp phân tích mặt đáp 36
5 VÀI NÉT VỀ THIẾT KẾ THÍ NGHIỆM VÀ TỐI ƯU HOÁ DỰA TRÊN MẠNG NEURON NHÂN TẠO 38
6 KẾT LUẬN 40
TÀI LIỆU THAM KHẢO 42
Trang 3M ỘT SỐ PHƯƠNG PHÁP THIẾT KẾ THÍ NGHIỆM
VÀ TỐI ƯU HOÁ ỨNG DỤNG TRONG BÀO CHẾ
1 MỘT SỐ KHÁI NIỆM
1.1 Bi ến và phân loại biến
1.1.1 Bi ến đầu vào và biến đầu ra
Biến đầu ra (output variable) còn gọi là biến phụ thuộc (dependent variable) hay đáp ứng (response): Là các kết quả của thí nghiệm mà người làm thí nghiệm thấy cần phải đo đạc và đánh giá
Ví d ụ: Nghiên cứu bào chế một viên nén thì biến đầu ra có thể là các chỉ tiêu
chất lượng của viên như:
- Hình thức bên ngoài (xấu, đẹp)
Ví d ụ: Nghiên cứu bào chế một viên nén thì biến đầu vào có thể là:
Trang 4- Loại/khối lượng mỗi loại tá dược
- Thời gian/tốc độ nhào, trộn
Ví d ụ: Khối lượng tá dược rã trong một viên nén là một biến định lượng Nó có
thể nhận giá trị bất kỳ từ 10 - 50 mg (tuỳ người thiết kế công thức)
Biến định lượng nhiều mức (quantitative multilevel variable) là những biến
mà giá trị của nó có thể đo/biểu diễn được bằng các số thực nhưng không liên tục
Ví d ụ: Cỡ rây xát hạt là một biến định lượng nhiều mức Nó có thể nhận giá trị
là 0,6; 0,8; 1,0 mm Việc chế tạo ra các rây xát hạt có cỡ từ 0,6; 0,61; 0,62 đến 1,0 mm là điều không thực tế
Biến định tính (qualitative variable, categorical variable) là những biến mà giá trị của nó không thể đo/biểu diễn được bằng các số thực
Ví d ụ: Loại tá dược rã là biến định tính Nó có thể nhận các giá trị là: tinh bột,
cellulose vi tinh thể, DST
Biến kiểm soát được (controlled variable) là biến mà người làm thí nghiệm
có thể tuỳ ý thay đổi giá trị của nó
Ví d ụ: Khối lượng tinh bột trong một viên
Trang 5 Biến không kiểm soát được (uncontrolled variable) là biến mà người làm thí nghiệm không thể tuỳ ý thay đổi giá trị của nó
Ví d ụ: Nhiệt độ và độ ẩm khi bảo quản ở điều kiện thường (phụ thuộc vào thời
tiết) Đối với loại biến này thì người làm thí nghiệm chỉ có thể ghi lại giá trị của nó khi tiến hành thí nghiệm để phân tích sau
Trong bào chế còn chia ra biến công thức (khối lượng/loại các tá dược) và biến quy trình (gồm các thông số của quy trình bào chế)
1.2 T ối ưu hoá
T ối ưu hoá một công thức hay quy trình bào chế là việc tìm công thức, thông
s ố (hay điều kiện tiến hành) của quy trình để sản phẩm làm ra đạt chất lượng tốt
nh ất trong giới hạn mong muốn của người làm thí nghiệm [7]
Việc tối ưu hoá các công thức hay quy trình bào chế một cách đầy đủ nhiều khi đòi hỏi một khối lượng công việc khổng lồ mà các phương pháp tiến hành thí nghiệm cổ điển không thể giải quyết được
Theo lý thuyết hệ thống, một hệ thống có thể xem như là một tiến trình chuyển đổi từ đầu vào (input) thành đầu ra (output) Ví dụ: Với quá trình làm ra một loại thuốc, đầu vào là các thành phần tá dược, quy trình sản xuất ; còn đầu ra là chế
phẩm thuốc với các đặc tính yêu cầu Việc xem xét hệ thống từ phương diện bằng
thực nghiệm được coi là việc tiếp cận một hộp đen Hộp đen là một hệ thống với
cấu trúc bên trong chưa biết nhưng biết được giá trị của đầu vào và đầu ra Trên
thực tế, chất lượng của đầu ra không những bị ảnh hưởng bởi đầu vào mà còn có nhiều yếu tố khác có thể không được biết (hình 1) Do đó, có thể sử dụng các yếu tố được biết, điều khiển được và có ảnh hưởng đến tiến trình để tối ưu hoá
Như vậy, để tối ưu hoá phải mô tả được mối quan hệ giữa biến đầu ra và biến đầu vào Công việc này khá phức tạp bởi vì không chỉ có những biến đầu vào được đưa vào nghiên cứu mới ảnh hưởng đến giá trị của biến đầu ra mà còn nhiều yếu tố khác mà người làm thí nghiệm không thể kiểm soát hết được
Trang 6Có hai cách chính để mô tả quan hệ giữa biến đầu ra và biến đầu vào:
- Dùng mô hình (phương trình) toán học: Đây là cách mô tả đơn giản và dễ
hiểu nhất Phương trình thường có dạng đa thức có bậc ≤ 2 và được gọi là phương trình hồi quy
- Dùng mạng neuron nhân tạo (Artificial Neural Network - ANN)
Dù sử dụng phương pháp nào chăng nữa, để mô tả chính xác mối quan hệ trên,
cần phải tiến hành trước một số thí nghiệm và các thí nghiệm này phải được thiết kế
một cách khoa học
Hình 1 S ơ đồ tóm tắt lý thuyết hệ thống và hộp đen
1.3 Thi ết kế thí nghiệm
Phương pháp thiết kế thí nghiệm được Fisher đưa ra lần đầu tiên vào năm
1926, sau đó được Box, Hunter, Scheffé, Tagushi và các tác giả khác phát triển và hoàn thiện
Thi ết kế thí nghiệm là phương phương pháp lập kế hoạch và tiến hành thực nghi ệm để thu nhận được thông tin tối đa từ tập hợp các dữ liệu thí nghiệm trong
s ự có mặt của nhiều yếu tố có thể làm biến đổi kết quả thí nghiệm với số thí nghiệm
Trang 71.4 Trình t ự tiến hành thiết kế thí nghiệm và tối ưu hoá
Việc thiết kế thí nghiệm và tối ưu hoá gồm những bước cơ bản sau:
- Xác định các biến đầu ra (biến phụ thuộc) cần tối ưu hoá và yêu cầu của chúng Đó có thể là các chỉ tiêu chất lượng của sản phẩm, giá thành, lượng nguyên,
phụ liệu, năng lượng tiêu thụ
- Xác định các biến đầu vào (biến độc lập) có khả năng ảnh hưởng đến các
biến đầu ra
- Sàng lọc: Thiết kế và tiến hành các thí nghiệm sơ bộ nhằm phân tích ảnh
hưởng của các biến đầu vào lên các biến đầu ra để loại bỏ các biến đầu vào không
hoặc ít ảnh hưởng
- Thiết kế và tiến hành thí nghiệm để phân tích ảnh hưởng của các biến đầu vào còn lại lên các biến đầu ra Từ các kết quả thí nghiệm, xây dựng các mối quan
hệ giữa các biến đầu ra và các biến đầu vào Mối quan hệ này có thể biểu diễn dưới
dạng phương trình hồi quy dạng đa thức có bậc ≤ 2 hoặc mạng neuron nhân tạo
Những mối quan hệ này cho phép dự đoán giá trị của các biến đầu ra khi biết giá trị
của các biến đầu vào mà không cần làm thêm thí nghiệm
- Tối ưu hoá các biến đầu ra dựa trên các các mối quan hệ đã xây dựng để tìm các giá trị tối ưu của các biến đầu vào
- Làm thí nghiệm theo các giá trị tối ưu của các biến đầu vào vừa tìm được để
kiểm tra và điều chỉnh nếu cần
- Triển khai sản xuất thử ở quy mô bán công nghiệp và công nghiệp Trong giai đoạn này có thể tối ưu hoá quy trình bằng thuật toán tiến hoá (Evolutionary Optimization of Processes, EVOP)
2 MỘT SỐ CÔNG CỤ TOÁN HỌC VÀ KHÍA CẠNH THỐNG KÊ LIÊN QUAN ĐẾN THIẾT KẾ THÍ NGHIỆM
2.1 Mã hoá các giá tr ị của biến đầu vào
Trang 8 Đối với biến định lượng:
Các giá trị thực xi của biến định lượng khi đưa vào thiết kế thí nghiệm thường được chuyển sang giá trị mã hoá Xi theo nguyên tắc ở bảng 1 và công thức sau:
B ảng 1 Các mức và khoảng biến thiên của biến định lượng đầu vào
i
λ
0x
5 4
X
Đối với biến định tính:
Mỗi giá trị của biến định tính có thể coi như là một mức và có thể mã hoá bằng
một chữ cái tuỳ ý
Trang 9Khi đã thiết lập được phương trình hồi quy theo các giá trị mã hoá của biến đầu vào thì có thể dễ dàng chuyển phương trình này trở lại theo các giá trị thực nếu
cần
Mục đích của việc mã hoá các biến đầu vào là nhằm đảm bảo cho ma trận thí nghiệm có một số tính chất đặc biệt (như tính trực giao, tính xoay ) để đơn giản hoá việc tính toán [1], [3], [4], [5]
2.2 M ột số khía cạnh thống kê trong thiết kế thí nghiệm
Giả sử có bảng thiết kế thí nghiệm (bảng 2) gồm n biến đầu vào Xi (i = 1 , n), N thí nghiệm trong đó có N0 thí nghiệm ở tâm (là thí nghiệm có các mức của Xi đều
bằng 0) Tiến hành thí nghiệm theo bảng 2 và xác định giá trị của biến đầu ra Y N0
thí nghiệm ở tâm được viết cuối cùng (từ thí nghiệm thứ N – N0 +1 đến N)
B ảng 2 Bảng thiết kế thí nghiệm và giá trị của biến đầu ra
Giả sử mô hình toán học được lựa chọn là mô hình bậc 2 (mô hình bậc 1 chỉ là
trường hợp riêng của mô hình bậc 2):
⋅
⋅ +
⋅ +
=
1 i
2 i ii n
j i 1 j
j i ij i
n
1 i i 0
n 2
1 , X , , X b b X b X X b X X
f Y
Trong đó: Y: Biến đầu ra
Xi: Biến đầu vào thứ i n: Số biến đầu vào
b0, bi, bij, bii: Các hệ số của phương trình hồi quy
Trang 10Phần dưới đây sẽ trình bày cách tính các hệ số hồi quy, đánh giá tính có nghĩa
của hệ số hồi quy, phân tích phương sai và đánh giá tính phù hợp của phương trình
hồi quy bằng phương pháp bình phương tối thiểu Phương pháp này là phương pháp được sử dụng phổ biến nhất nhưng nó chưa chắc là phương pháp tốt nhất Tuy nhiên, các phương pháp khác chưa được đề cập đến trong chuyên đề này
bn
b12
b13
b(n-1)n
b11
b22
Trang 11
bnnThì:
B = (X’X)-1X’Y Trong đó ký hiệu ()’ là ma trận chuyển vị, ()-1 là ma trận nghịch đảo
Đối với biến định tính, thay vì tính hệ số hồi quy, người ta tính hiệu ứng riêng cho mỗi mức:
MmøcX
cãnghiÖmthÝ
Sè
MmøcX
cãnghiÖmthÝ
c¸cëYtrÞgi¸
Tængb
i
i M)
(møc
=
=
Tính các tổng bình phương và bậc tự do tương ứng theo các công thức sau [5]:
Tổng bình phương toàn bộ (the adjusted total sum of squares):
2 i
2 i i
SS có bậc tự do fRESID = N – p
Tổng bình phương hồi quy (the regression sum of squares):
RESID TOTAL
2 0 i ERR
0YY
SS có bậc tự do fERR = N0 – 1
Tổng bình phương phù hợp (the lack-of-fit sum of squares):
ERR RESID
SS = − có bậc tự do fLOF = N – p – N0 + 1
Trang 12Với: p: Số hệ số của phương trình hồi quy
Yi: Giá trị thực của biến Y ở thí nghiệm thứ i
Y: Giá trị thực trung bình của biến Y
Lập bảng phân tích phương sai như sau:
B ảng 3 Bảng phân tích phương sai (ANOVA)
ph ương
Trung bình bình ph ương F M ức ý nghĩa P
MS
MS
Phần dư fRESID SSRESID
RESID
RESID RESID
MS
MS
F = P(FLOF,fLOF,fERR)*
Sai số fERR SSERR
ERR
ERR ERR
f
SS
* Tính t ừ phân phối Fisher
Các mức ý nghĩa phải thoả mãn điều kiện Phồi quy = P(FREGR,fREGR,fRESID) < 0,05
và Pphù hợp = P(FLOF,fLOF,fERR) > 0,05 thì phương trình hồi quy tìm được mới có ý nghĩa và phù hợp về mặt thống kê (mô tả đúng kết quả thực nghiệm)
2.2.3 Giá tr ị R 2
và R 2 hi ệu chỉnh
Giá trị R2 được tính theo các công thức sau:
Trang 13REGR 2
R2 hiệu chỉnh (the adjusted R2 - 2
adj
R ) tính theo công thức sau:
pN
1NR11MS
MSMS
R
2
TOTAL
RESID TOTAL
2 adj
i (trên đường chéo của ma trận) thì phương sai của hệ số thứ i trong phương trình
hồi quy được tính bởi công thức:
2 ii 2
s = được gọi là sai số chuẩn của hệ số hồi quy
Để đánh giá tính có nghĩa của các hệ số hồi quy, tính:
i
b
i i s
Trang 143 MỘT SỐ THIẾT KẾ THÍ NGHIỆM THƯỜNG DÙNG
3.1 Thi ết kế bậc 1
Do tính đơn giản, số thí nghiệm không lớn, nên thiết kế bậc 1 rất hay dùng để sàng lọc các biến đầu vào [1], [4], [5]
3.1.1 Thi ết kế 2 n đầy đủ (mô hình hoá thực nghiệm bậc 1 đầy đủ)
Nếu mỗi biến đầu vào chỉ lấy 2 mức thực nghiệm thì số thí nghiệm phải làm sẽ là:
N = 2nTrong đó: N: Số số hạng của phương trình hồi quy bậc 1 đầy đủ (cũng
bằng số thí nghiệm phải làm)
n: Số biến đầu vào 2: Số mức được chọn cho mỗi biến đầu vào
Ví dụ: Với 3 biến đầu vào, thiết kế sẽ gồm 23
= 8 thí nghiệm được trình bày ở
Trang 15Y = b0 + b1X1 + b2X2 + b3X3 +b12X1X2 + b13X1X3 + b23X2X3 + b123X1X2X3
3.1.2 Thi ết kế 2 n rút g ọn (mô hình hoá thực nghiệm bậc 1 rút gọn)
Mô hình hoá thực nghiệm bậc 1 đầy đủ có nhược điểm là số thí nghiệm sẽ rất
lớn khi số biến đầu vào phải khảo sát lớn (với 7 biến đầu vào sẽ phải làm 27 = 128 thí nghiệm!!!) Khi đó phải tiến hành thực nghiệm rút gọn
Số thực nghiệm rút gọn được tính theo công thức:
N = 2n - q
Với n là số biến đầu vào và q là số mức rút gọn
Ma trận thực nghiệm của thiết kế rút gọn phải có 3 tính chất sau:
Nghiên cứu bào chế pellet bằng phương pháp đùn - tạo cầu Công thức pellet
có chứa dược chất, tá dược tạo cầu, tá dược độn và tá dược dính được giữ cố định Các thông số của quy trình bào chế cần tối ưu hoá để tỷ lệ pellet thu được có kích
thước từ 900 - 1100 µm là lớn nhất Những đặc tính khác của pellet như hình dạng,
độ nhẵn bề mặt, độ trơn chảy tạm thời chưa được đề cập đến Các yếu tố có thể ảnh hưởng đến tỷ lệ pellet thu được có kích thước mong muốn là:
Trang 16* Các điều kiện tạo hạt: Tổng lượng nước
Thời gian nhào trộn
hưởng hoặc ít ảnh hưởng đến biến đầu ra Y (tỷ lệ pellet thu được có kích thước 900
- 1100 µm )
B ảng 5 Các biến đầu vào
Bi ến đầu vào hi Ký ệu M ức dưới (-1) M ức gốc (0) M ức trên (+1)
Thiết kế thí nghiệm được sử dụng là thiết kế Plackett - Burman gồm 8 (=27 – 4) thí nghiệm và 4 thí nghiệm ở tâm được trình bày ở bảng 6 Phần trăm pellet thu được có kích thước từ 900 - 1100 µm thu được (Y) khi tiến hành thí nghiệm được ghi ở cột bên phải
Trang 17R2 = R2adj =0,846
Trang 18Có 4 hệ số (trừ b0) là b1, b2, b5, b7 có mức ý nghĩa P < 0,05 nên có thể kết
luận ảnh hưởng của nồng độ tá dược dính (X1), tỷ lệ tá dược dính (X2), khối lượng
hạt đem tạo cầu (X5) và thời gian tạo cầu (X7) tới tỷ lệ pellet thu được có kích
thước từ 900 - 1100 µm (Y) có ý nghĩa thống kê với độ tin cậy 95%
Tiến hành phân tích phương sai và đánh giá tính phù hợp của phương trình hồi quy Kết quả thể hiện ở bảng 8
B ảng 8 Kết quả phân tích phương sai
Các mức ý nghĩa thoả mãn điều kiện Phồi quy = P(FREGR,fREGR,fRESID) < 0,05 và
Pphù hợp = P(FLOF,fLOF,fERR) > 0,05 nên mô hình tìm được có ý nghĩa và phù hợp về
mặt thống kê (mô tả đúng kết quả thực nghiệm)
3.1.3 Thi ết kế 2 2n k ết hợp với ô vuông latin
Các thiết kế 2n đầy đủ hay rút gọn đều có chung một nhược điểm là nếu dùng
để khảo sát các biến định tính thì chỉ có thể đưa vào 2 mức cho mỗi biến định tính (ví dụ, với tá dược rã, chỉ có thể chọn 2 loại là tinh bột hay cellulose vi tinh thể) Để
khắc phục nhược điểm này có thể dùng thiết kế 22n kết hợp với ô vuông latin hoặc thiết kế D - optimal
Đối với thiết kế 22n kết hợp với ô vuông latin, người ta dùng kiểu bố trí hỗn
hợp giữa thí nghiệm 22n với ô vuông latin cỡ 2n×2n Kiểu bố trí này cho phép đưa vào trong mô hình thí nghiệm một số biến định tính thay đổi trên 2n
mức và biến
Trang 19định lượng thay đổi trên 2 mức Để có thể kết hợp như vậy, phải chọn cách bố trí
của biến định lượng sao cho phù hợp với biến định tính và có thể dùng mô hình đầy
đủ hoặc rút gọn như đã trình bày ở mục 3.1.1 và 3.1.2
Phần dưới đây sẽ trình bày một ví dụ thiết kế 24 kết hợp với ô vuông latin 4×4
Ví d ụ:
Viên nang theophylin 200 mg tác dụng kéo dài được bào chế bằng phương pháp bao pellet theophylin rồi đóng nang [2] Dịch bao có thành phần như sau:
- Ethyl cellulose N10 (EC): Polyme chính đóng vai trò chất tạo màng
- Hydroxy propyl methyl cellulose E15 (HPMC), polyvinyl pyrolidon K-30 (PVP), Eudragit L100, Eudragit E100: Đóng vai trò polyme phối hợp làm cho màng bao bền vững nhưng tan được trong môi trường hoà tan tạo ra các kênh khuếch tán giải phóng theophylin
- Diethyl phthalat (DEP), glycerin, polyethylen glycol (PEG) 4000, PEG
6000 đóng vai trò chất làm dẻo do EC giòn dễ gãy vỡ
- Titan dioxyd: Chất chống dính và tạo màu trắng đục cho màng bao
- Tween 80: Chất diện hoạt làm tăng khả năng thấm môi trường của màng bao và ổn định hỗn dịch bao
- Diclomethan, ethanol tuyệt đối: Dung môi
Thiết kế thí nghiệm
Mục đích của thí nghiệm là đánh giá ảnh hưởng của các yếu tố có trong thành
phần màng bao tới tốc độ giải phóng theophylin ra khỏi viên nang Trên cơ sở này
lựa chọn công thức tạo màng phù hợp với mục tiêu đề ra Do đó thí nghiệm được thiết kế như sau:
• Các biến đầu vào: Gồm 7 biến định lượng và 2 biến định tính được trình bày ở bảng 9 và 10
Trang 20B ảng 9 Các biến định lượng (số lượng tính cho mẻ bao 200 g pellet)
Bi ến Ký hi ệu Mức dưới (-1) Mức trên (+1)
Eudragit E100 (C)
PVP (D)
(0)
Glycerin (1)
Dựa trên đồ thị giải phóng theophylin của viên Euphylline L.A 200 mg, các
biến đầu ra và yêu cầu của chúng được chọn như sau:
B ảng 11 Các biến đầu ra và yêu cầu
Bi ến Ký hi ệu Yêu c ầu
Phần trăm theophylin giải phóng sau 2 h Y2 20 – 35 %
Phần trăm theophylin giải phóng sau 4 h Y4 45 – 55 %
Phần trăm theophylin giải phóng sau 6 h Y6 60 – 70 %
Phần trăm theophylin giải phóng sau 8 h Y8 ≥ 75%
Ph ương sai của tốc độ giải phóng S2v min
S2vđược tính theo công thức sau:
Trang 21i i i
t t
c c
1 1
Trong đó: - vi : Tốc độ giải phóng theophylin trung bình trong khoảng thời
gian từ thời điểm ti-1 đến ti
- Ci, Ci-1 : Nồng độ dược chất tại thời điểm ti và ti-1
S2v càng nhỏ, sự sai khác giữa tốc độ giải phóng dược chất tại những khoảng
thời gian khác nhau càng nhỏ Do vậy tốc độ giải phóng dược chất được coi là hằng định theo thời gian Sự giải phóng dược chất xấp xỉ tuân theo động học bậc 0
Trang 22- Pellet theophylin (200 g/mẻ) được bao màng rồi đóng vào nang số 1 với dung tích 0,48 ml một lượng tương ứng với 200 mg theophylin khan cùng với một
lượng pellet trơ (không chứa dược chất) thích hợp
- Đánh giá khả năng giải phóng theophylin từ viên nang:
+ Kết quả được biểu diễn qua bảng 13
B ảng 13 Tỷ lệ % theophylin giải phóng từ các mẫu viên nang
theo th ời gian (mỗi thí nghiệm làm 3 lần)