Do đú, phần trăm phƣơng sai mà mỗi PC chiếm tƣơng ứng giảm dần. Tổng phƣơng sai t ch lũy của cỏc PC theo số PC đƣợc biểu diễn trờn hỡnh 3.9
Trị riờn g
Hỡnh 3.9: Phương sai tớch lũy của mụ hỡnh biểu diễn theo số cấu tử riờng từng phần khi xỏc định hoạt chất cefixim và cỏc tỏ dược
Nhƣ vậy, PC1 đó chiếm 47% tổng phƣơng sai của tập số liệu, thờm PC2 thỡ tổng phƣơng sai t ch lũy đó đƣợc gần 95 %. Vỡ vậy, lựa chọn số PC=2 để bắt đầu khảo sỏt lựa chọn số PC tối ƣu.
- Tỡm phương trỡnh hồi qui biểu diễn mối quan hệ giữa ma trận hàm lượng và
ma trận trọng số, ma trận trị số của cỏc PC
Hệ số hồi quy “beta” đƣợc t nh theo cỏc ma trận trọng số, ma trận trị số và ma trận hàm lƣợng tỡm đƣợc với giỏ trị PC=2 theo cỏc cõu lệnh sau:
beta = regress(Y-mean(Y), PCAScores(:,1:2)); beta = PCALoadings(:,1:2)*beta;
beta = [mean(Y) - mean(X)*beta; beta];
- Tớnh lại cỏc hàm lượng của hoạt chất cefixim trong mẫu chuẩn tự tạo
Hàm lƣợng cefixim trong cỏc mẫu chuẩn đƣợc t nh lại bằng hệ số hồi quy “beta” vừa tỡm đƣợc theo cõu lệnh.
Ypred = [ones(n,1) X]*beta;
Số cấu tử riờng theo PCA
Phƣơng sai tớch lũy của mụ hỡnh
- Kiểm tra tớnh chớnh xỏc của mụ hỡnh hồi quy đa biến.
Độ ch nh xỏc của phƣơng phỏp đƣợc đỏnh giỏ qua độ đỳng và độ chụm. Độ đỳng đƣợc quyết định bởi sự sai khỏc giữa kết quả tỡm đƣợc theo mụ hỡnh hồi quy và hàm lƣợng trong mẫu chuẩn và mẫu kiểm tra và đƣợc đỏnh giỏ qua hệ số tƣơng quan R của hai kết quả này. Độ chụm của kết quả phõn t ch đƣợc đỏnh giỏ qua độ lệch chuẩn của kết quả tỡm đƣợc (RMSE).
Đỏnh giỏ độ đỳng thụng qua so sỏnh kết quả hàm lƣợng của cefixim trong mẫu chuẩn và mẫu kiểm tra với hàm lƣợng biết trƣớc, t nh lại cỏc đại lƣợng hệ số tƣơng quan R, RMSE của mẫu chuẩn và mẫu kiểm tra (cụng thức 3.2; 3.3 và 3.4). Nếu cỏc kết quả cho thấy chƣa đạt yờu cầu thỡ thay đổi cỏc số PC khỏc nhau từ 2 đến 4 (số in nghiờng trong cõu lệnh) để lựa chọn mụ hỡnh hồi quy và số PC phự hợp.
Ngoài ra, trong phộp đo IR, giỏ trị của độ hấp thụ quang trong vựng súng lựa chọn bị ảnh hƣởng bởi rất nhiều yếu tố gõy nhiễu, đặc biệt là thành phần nền khụng biết trƣớc. Điều này cú thể khắc phục bằng cỏch đạo hàm tập số liệu ban đầu trƣớc khi xử lý PCR. Ma trận đạo hàm bậc 1 cú k ch thƣớc 20x95, ma trận đạo hàm bậc 2 cú k ch thƣớc 20x94 (đĩa CD- phụ lục 3).
Tiến hành tƣơng tự đối với cỏc ma trận đạo hàm bậc 1 và ma trận đạo hàm bậc 2 và số PC thay đổi từ 2 đến 4. Kết quả thu đƣợc trong bảng 3.9.
Bảng 3.9: Độ chớnh xỏc của mụ hỡnh hồi qui xỏc định cefixim cú lẫn tỏ dược trong mẫu chuẩn tự tạo theo phương phỏp PCR
PC Ma trận số liệu R2 RMSES 2 Ban đầu 0,892 6,70 Đạo hàm bậc 1 0,958 4,65 Đạo hàm bậc 2 0,955 7,99 3 Ban đầu 0,959 3,741 Đạo hàm bậc 1 0,960 4,69 Đạo hàm bậc 2 0,958 4,81 4 Ban đầu 0,959 3,58 Đạo hàm bậc 1 0,961 4,75 Đạo hàm bậc 2 0.959 4,91
Kết quả phõn t ch số liệu ở bảng 3.9 thấy đƣợc nếu R2
càng tiến về 1 và
RMSES càng nhỏ thỡ kết quả phõn t ch càng ch nh xỏc. Từ kết quả thu đƣợc ta thấy
rằng với số PC bằng 2 thỡ dữ liệu từ mụ hỡnh ban đầu cú kết quả khụng tốt do R2
thấp và giỏ trị RMSES cao, cũn với cỏc mụ hỡnh từ ma trận đạo hàm bậc một và ma
trận bậc 2 cho ta kết quả khả quan hơn rất nhiều. Với số PC bằng 3 và 4 ta thấy rằng kết quả thu đƣợc từ cỏc ma trận khỏc nhau khụng nhiều.
Để lựa chọn mụ hỡnh hồi quy với số PC phự hợp, cần kiểm tra độ ch nh xỏc của mụ hỡnh với cỏc mẫu kiểm tra theo cỏc bƣớc nờu trờn. Nhập ma trận gồm 10 mẫu kiểm tra ma trận hàm lƣợng Ytest cú dạng (10x1) và ma trận t n hiệu Xtest cú k ch thƣớc (20x96) nếu là ma trận t n hiệu ban đầu, (20x95) nếu là ma trận t n hiệu đạo hàm bậc 1, (20x94) nếu ma trận t n hiệu đạo hàm bậc 2 (đĩa CD- Phụ lục 3) vào trong cửa sổ workspace nhập cỏc cõu lệnh vào cửa sổ command window trong phần mềm Matlab R2015a thu đƣợc cỏc ma trận Ytest tƣơng ứng với mỗi mụ hỡnh theo từng số PC khỏc nhau. Sau khi xử l tập số liệu ta thu đƣợc bảng kết quả nhƣ bảng 3.10.
Bảng 3.10: Độ chớnh xỏc của mụ hỡnh hồi qui xỏc định cefixim cú lẫn tỏ dược trong mẫu kiểm tra tự tạo theo phương phỏp PCR
PC Ma trận số liệu R2 RMSES 2 Ban đầu 0,993 0,83 Đạo hàm bậc 1 0,885 4,74 Đạo hàm bậc 2 0,879 4,88 3 Ban đầu 0.941 4,30 Đạo hàm bậc 1 0,903 4,30 Đạo hàm bậc 2 0,900 4,28 4 Ban đầu 0,943 4,31 Đạo hàm bậc 1 0,907 4,29 Đạo hàm bậc 2 0,920 3,97
Căn cứ vào bảng 3.10 ta thấy rằng ma trận ban đầu của cỏc mẫu kiểm tra cho kết quả rất tốt ở PC2, song kết quả này khụng lặp lại ở cỏc mẫu chuẩn đƣợc lựa chọn làm mụ hỡnh chuẩn nờn chỳng tụi khụng chọn giỏ trị PC này, cũn với cỏc số PC 3 và 4 kết quả khụng thay đổi nhiều ở cả 3 ma trận ban đầu, ma trận đạo hàm bậc một và ma trận đạo hàm bậc 2.
Căn cứ vào kết quả xử l số liệu ở bảng 3.9 và 3.10 thấy rằng kết quả tốt, lặp lại ở ma trận ban đầu với số PC bằng 4 và ở ma trận đạo hàm bậc 1 và 2 với cỏc số PC 3 và 4. Cỏc ma trận này đều cú thể sử dụng làm mụ hỡnh chuẩn với cỏc số PC tối ƣu khỏc nhau để định lƣợng nhanh cefixim khi cú lẫn tỏ dƣợc trong cỏc mẫu thuốc thành phẩm.
Kết quả so sỏnh tƣơng quan hàm lƣợng của cefixim trong mẫu chuẩn và mẫu kiểm tra với số PC4 theo mụ hỡnh PCR đƣợc mụ tả ở hỡnh 3.10. Nhƣ vậy, mụ hỡnh tỡm đƣợc hoàn toàn cú thể sử dụng để phõn t ch cefixim trong mẫu thuốc cú tỏ dƣợc.
Hỡnh 3.10: Tương quan hàm lượng cefixim tỡm được từ mụ hỡnh PCR với hàm lượng đỳng trong mẫu chuẩn và mẫu kiểm tra
3.2.4. Xỏc định cefixim khi cú lẫn tỏ dược theo phương phỏp phỏp PLS
Điểm giống nhau giữa phƣơng phỏp PLS với phƣơng phỏp PCR là chuyển tập số liệu ban đầu lờn một mặt phẳng với mục đ ch làm giảm chiều của tập số liệu trong khi sự khỏc nhau căn bản giữa PCR và PLS ch nh là cỏch xử l tập số liệu để tỡm ra số PC và hệ số hồi quy của mụ hỡnh.
R² = 0.9598 R² = 0.9435 0 10 20 30 40 50 60 70 80 90 100 0 20 40 60 80 100 Thàn h p h ần( % ) h oạt ch ất t ron g m ẫu tự tạo
Thành phần (%) hoạt chất cefixim tớnh được từ mụ hỡnh PCR
cefixim
mẫu chuẩn mẫu kiểm tra
PLS tối ƣu hoỏ giỏ trị đồng phƣơng sai (covariance) giữa ma trận X và Y. Hai ma trận X và Y đƣợc phõn t ch thành hai ma trận trị số T và W (score matrices) và ma trận trọng số (loading matrices) P và Q. Từ đú, nhận đƣợc một ma trận T chung cho cả 2 phƣơng trỡnh. Bằng cỏch này cú thể biến sự phụ thuộc tuyến t nh dạng Y= a+w.X (w cũn gọi là ma trận “beta”) thành hai sự phụ thuộc tuyến t nh của X theo P và Y theo Q. Do đú, PLS phự hợp cho những tập số liệu cú số th nghiệm cú sự tƣơng quan giữa cỏc biến độc lập và cú t nh chất cộng t nh cao. PLS cũng làm giảm số biến và tạo ra cỏc cấu tử khụng liờn quan sau đú biểu diễn phƣơng trỡnh bỡnh phƣơng tối thiểu với những cấu tử này. Tuy nhiờn, nú trỏi với PCR, là trọng số “w” dựng để trực giao nhằm tối ƣu hoỏ đồng phƣơng sai giữa hai biến X và Y. Số tối ƣu cỏc biến ẩn (PC) cú thể đƣợc ƣớc đoỏn bằng dựng thuật toỏn đỏnh giỏ chộo (cross-validation) hoặc tập số liệu kiểm tra riờng biệt. Nhƣ vậy, PLS sẽ hạn chế đƣợc vấn đề loại bỏ nhầm t n hiệu so với PCR [5, 6, 10, 69].
Trong phƣơng phỏp PLS, ma trận hàm lƣợng cefixim trong mẫu chuẩn (Ypred) và trong mẫu kiểm tra (Ytest) đƣợc t nh theo cỏc số PC khỏc nhau dựa trờn tập số liệu gồm ma trận hàm lƣợng của 20 mẫu chuẩn Y(20x1), ma trận t n hiệu của mẫu chuẩn ban đầu X(20x96).
- Tỡm ma trận trị số (score matrices) và ma trận trọng số (loading
matrices), tỡm hệ số hồi quy “BETA”
Bƣớc đầu tiờn trong PLS là phõn tỏch ma trận hàm lƣợng Y và ma trận t n hiệu X thành cỏc ma trận trị số và ma trận trọng số. Điều này đƣợc thực hiện bằng
cỏch phõn tỏch X thành 2 ma trận trọng số (loading) (XL) và trị số (score) (XS)
(nhƣ trong PCA), tƣơng tự phõn tỏch Y thành 2 ma trận YL và YS.
Nhƣ vậy, PLS tỡm thấy một tập hợp cỏc thành phần trực giao mà cú thể giải th ch tối đa thụng tin của cả X và Y, cung cấp phƣơng trỡnh dự đoỏn Y theo X. Cỏc bƣớc tỡm ma trận trục giao đƣợc thể hiện trong hỡnh 3.11.
Hỡnh 3.11: Biểu diễn cỏch tỡm ma trận trực giao trong PLS
Cỏc cõu lệnh PLS của Matlab R2015a nhƣ sau:
[XL,YL,XS,YS,BETA,PctVar] = plsregress(X,Y,19);
- Tỡm số PC theo ma trận X và Y
Số PC trong PLS đƣợc t nh tƣơng tự nhƣ PCA trờn cả tập X và Y theo cõu lệnh
plot(1:19,cumsum(100*PctVar(2,:)),'-bo'); xlabel('Number of PLS components'); ylabel('Percent Variance Explained in Y');
-Tỡm mối tương quan giữa X và Y theo số PC vừa tỡm được ta được “BETA” Khi PC = 2, “BETA” đƣợc tỡm dựa vào cỏc ma trận trị số và ma trận trọng số theo cõu lệnh:
[XL,YL,XS,YS,BETA,PctVar] = plsregress(X,Y,2);
- Tớnh lại hàm lượng cefixim trong cỏc mẫu chuẩn tự tạo
Hàm lƣợng cefixim trong cỏc mẫu chuẩn đƣợc t nh lại theo hệ số hồi quy “BETA” vừa tỡm đƣợc theo cõu lệnh:
- Kiểm tra tớnh chớnh xỏc của mụ hỡnh hồi quy đa biến.
Từ kết quả hàm lƣợng của cefixim trong mẫu chuẩn và mẫu kiểm tra với hàm lƣợng biết trƣớc, t nh lại cỏc đại lƣợng hệ số tƣơng quan R, RMSE của mẫu chuẩn và mẫu kiểm tra (cụng thức 3.1; 3.2 và 3.3). Nếu cỏc kết quả cho thấy chƣa đạt yờu cầu thỡ thay đổi cỏc số PC khỏc nhau từ 2 đến 4 (số in nghiờng trong cõu lệnh) để lựa chọn mụ hỡnh hồi quy và số PC phự hợp.
Tiến hành tƣơng tự đối với cỏc ma trận đạo hàm bậc 1, ma trận đạo hàm bậc 2 và số PC thay đổi từ 2 đến 4. Kiểm tra t nh đỳng của mụ hỡnh bằng cỏc mẫu kiểm tra. Kết quả thu đƣợc trong bảng 3.11.
Bảng 3.11: Độ chớnh xỏc của mụ hỡnh hồi qui xỏc định cefixim cú lẫn tỏ dược trong mẫu kiểm tra tự tạo theo phương phỏp PLS
PC Ma trận số
liệu
Ma trận chuẩn Ma trận kiểm tra
R2 RMSES R2 RMSET 2 Ban đầu 0,864 8,860 0,983 1,398 Đạo hàm bậc 1 0.959 3,901 0,886 3,92 Đạo hàm bậc 2 0.9559 4.073 0,880 4,50 3 Ban đầu 0,9638 3,475 0.832 5,45 Đạo hàm bậc 1 0,9631 3,581 0,923 3,59 Đạo hàm bậc 2 0,9598 3,72 0,921 3,58 4 Ban đầu 0,9667 3,130 0,841 5,281 Đạo hàm bậc 1 0,9674 3,08 0,924 3,521 Đạo hàm bậc 2 0,9647 3,26 0,939 3,32
Kết quả ở bảng giỏ trị 3.11 cho thấy với 2 PC thỡ dữ liệu từ mụ hỡnh ban đầu
cú kết quả khụng tốt, R2 thấp và giỏ trị RMSES cao ở cỏc mẫu chuẩn nhƣng lại cho
kết quả tốt (R2 tiến gần đến 1 và RMSET thấp) ở cỏc mẫu kiểm tra. Nhƣ vậy, khụng
cú sự đồng nhất về độ ch nh xỏc của kết quả phõn t ch ở cỏc mẫu chuẩn và mẫu kiểm tra nờn khụng thể lựa chọn số PC=2 để làm mụ hỡnh chuẩn.
Khi tăng lờn 3 hoặc 4 PC, kết quả hàm lƣợng tỡm đƣợc ở cỏc ma trận chuẩn ban đầu thỡ cho kết quả tốt cũn ở cỏc ma trận kiểm tra lại cho kết quả khụng khả
quan (R2=0,841 và RMSET =5,281) nờn khụng lựa chọn cỏc ma trận ban đầu làm
mụ hỡnh chuẩn xỏc định cefixim khi cú lẫn tỏ dƣợc.
Với cỏc mụ hỡnh PLS xõy dựng trờn tập số liệu từ ma trận phổ đạo hàm bậc một và ma trận bậc hai cho ta kết quả khả quan hơn rất nhiều. Ở số PC=2, cú sự phự hợp lớn về hàm lƣợng tỡm đƣợc với hàm lƣợng ban đầu trong ma trận chuẩn nhƣng sai khỏc rất lớn ở cỏc ma trận kiểm tra. Khi số PC bằng 3 và 4 kết quả đều tốt ở cỏc mẫu chuẩn và mẫu kiểm tra. Vậy ta cú thể lựa chọn cỏc mụ hỡnh đạo hàm bậc 1 và mụ hỡnh đạo hàm bậc 2 với số PC bằng 3 hoặc 4 theo phƣơng phỏp PLS làm mụ hỡnh chuẩn xỏc định cefixim trong thuốc thành phẩm.
Nhƣ vậy đối với cỏc hợp chất bất kỳ, để xỏc định bằng phƣơng phỏp phổ IR kết hợp với thuật toỏn PLS, việc xõy dựng mụ hỡnh chuẩn cần tiến hành theo cỏc bƣớc sau đõy:
- Sử dụng ma trận hàm lƣợng (của mẫu chuẩn tự tạo) và ma trận t n hiệu ban
đầu tỡm số PC và t nh lại hàm lƣợng cỏc hoạt chất trong cỏc mẫu chuẩn bắt đầu với số PC sao cho tổng phƣơng sai t ch lũy đạt 95%, cho đến khi cỏc hệ
số tƣơng quan và hệ số biến thiến (RMSES) đạt yờu cầu (R>0,9 và RMSES<5
nếu t nh theo % hàm lƣợng). Nếu tỡm đƣợc số PC phự hợp thỡ dừng lại.
- Nếu tăng số PC mà % phƣơng sai t ch lũy đó lớn hơn 99% nhƣng vẫn chƣa
đạt yờu cầu về R và RMSE thỡ phải tiến hành đạo hàm bậc 1 và đạo hàm bậc 2 phổ IR rồi tiếp tục tỡm số PC phự hợp.
Kết quả hàm lƣợng thu đƣợc ở cỏc bảng 3.9, 3.10, 3.11 cho thấy cả 2 phƣơng phỏp PCR và PLS đều cho kết quả tốt, song với phƣơng phỏp PLS cú cỏc giỏ trị
RMSES và RMSET thấp hơn. Mặt khỏc, với mụ hỡnh đạo hàm bậc 2 cú thể tỏch t n
hiệu, loại bỏ nhiễu nhƣng làm giảm giỏ trị A nờn làm cho sai số lại tăng lờn. Vỡ vậy, chỳng tụi lựa chọn ma trận đạo hàm bậc 1 với số PC bằng 4 theo phƣơng phỏp PLS để làm mụ hỡnh chuẩn xỏc định hoạt chất cefixim trong thuốc.
Hỡnh 3.12: Tương quan hàm lượng (%) cefixim tỡm được với hàm lượng trong cỏc mẫu chuẩn và mẫu kiểm tra sử dụng phổ đạo hàm bậc 1 và phương phỏp PLS
Sau khi xử l cỏc tập số liệu ở cỏc ma trận chuẩn và ma trận kiểm tra bằng cả 4 phƣơng phỏp CLS, ILS, PLS, PCR ta thấy rằng với hai phƣơng phỏp PLS và PCR tỏ ra ƣu việt hơn rất nhiều so với 2 phƣơng phỏp CLS và ILS. Cú thể sử dụng phƣơng phỏp PLS và PCR khi kết hợp với phƣơng phỏp phõn t ch phổ hồng ngoại để định lƣợng nhanh cefixim khi cú lẫn tỏ dƣợc cho kết quả đỏng tin cậy.
R² = 0.9674 R² = 0.9241 0 10 20 30 40 50 60 70 80 90 100 0 20 40 60 80 100 Hàm lƣợn g (% ) c ef ix im tro ng cỏc m ẫu tự tạo Hàm lƣợng (%) của cefixim t nh đƣợc từ PLS mẫu chuẩn mẫu kiểm tra
3.2.5. Nghiờn cứu lựa chọn mụ hỡnh hồi quy đa biến xỏc định hoạt chất khỏng sinh sulfaguanidin trong thuốc sinh sulfaguanidin trong thuốc
Chuẩn bị 35 mẫu tự tạo theo quy trỡnh xử l mẫu mục 2.2.2.3, gồm 25 mẫu làm ma trận chuẩn và 10 mẫu làm ma trận kiểm tra chứa hoạt chất sulfaguanidin và tỏ dƣợc thƣờng sử dụng trong thành phần viờn thuốc là magie stearat, natri glycolat. Đo 35 mẫu tự tạo theo quy trỡnh mục 2.2.2.3. Ma trận chuẩn gồm ma trận hàm lƣợng cú k ch thƣớc (25x1), ma trận t n hiệu cú k ch thƣớc (25x417); ma trận kiểm tra gồm ma trận hàm lƣợng cú k ch thƣớc (10x1), ma trận t n hiệu cú k ch thƣớc (10x417) (đĩa CD - phụ lục 3).
Nhập cỏc dữ liệu ma trận nồng độ và ma trận t n hiệu của ma trận chuẩn, ma trận kiểm tra vào cửa sổ workspace và chạy cõu lệnh theo từng bƣớc của từng phƣơng phỏp PLS và PCR trong cửa sổ command window. Kết quả ta thu đƣợc cỏc ma trận Ypred, Ytest t nh ra đƣợc từ mụ hỡnh với cỏc số PC khỏc nhau. Xử l kết
quả theo cỏc cụng thức (3.2, 3.3, 3.4) tỡm ra cỏc hệ số tƣơng quan R2
, RMSES,
RMSET để tỡm ra thuật toỏn hồi quy phự hợp với số PC lựa chọn tối ƣu. Kết quả thu