Nghiên cứu ứng dụng mạng thần kinh (neural networks) và kỹ thuật lập trình di truyền (genetic programming) trong việc mô hình hóa dữ liệu, so sánh kết quả mô hình hóa dữ liệu của hai kỹ thuật trên, dựa vào kết quả của hai kỹ thuật này hy vọng sẽ giúp nhà bào chế có một sự lựa chọn công cụ hợp lý khi mô hình hóa dữ liệu công thức.
Nghiên cứu Y học Y Học TP Hồ Chí Minh * Tập 15 * Phụ Số * 2011 SO SÁNH ỨNG DỤNG KỸ THUẬT MẠNG THẦN KINH VÀ LẬP TRÌNH DI TRUYỀN TRONG MƠ HÌNH HĨA DỮ LIỆU CƠNG THỨC VIÊN NÉN PHĨNG THÍCH CĨ KIỂM SỐT Nguyễn Phương Nam*, Đỗ Quang Dương** TÓM TẮT Mục tiêu: Nghiên cứu ứng dụng mạng thần kinh (Neural Networks) kỹ thuật lập trình di truyền (Genetic Programming) việc mơ hình hóa liệu So sánh kết mơ hình hóa liệu hai kỹ thuật Dựa vào kết hai kỹ thuật hy vọng giúp nhà bào chế có lựa chọn cơng cụ hợp lý mơ hình hóa liệu công thức Phương pháp: Cách thức so sánh: so sánh hệ số tương quan R2 so sánh phương trình đường thẳng hồi quy với hệ số góc Cả hai phương pháp so sánh dựa liệu dự đốn từ hai kỹ thuật thơng minh: mạng thần kinh lập trình di truyền Kết quả: Từ kết việc mơ hình hóa với hai liệu viên nén phóng thích có kiểm sốt (viên matrix, viên diclofenac sodium microspheres), kết cho thấy hai kỹ thuật mạng thần kinh cho kết tốt kỹ thuật mạng thần kinh vượt trội so với kỹ thuật lập trình di truyền Kết từ thực nghiệm cho thấy, việc ứng dụng hai kỹ thuật lập trình di truyền mạng thần kinh việc mơ hình hóa liệu thành công Kết luận: Khi đánh giá mơ hình xây dựng hai kỹ thuật, mạng thần kinh cho kết trội Việc so sánh hai kỹ thuật giúp cho nhà bào chế khách quan việc lựa chọn phương pháp cơng cụ xây dựng mơ hình hóa liệu phù hợp Từ khóa: mạng thần kinh, kỹ thuật lập trình di truyền, cơng thức dược phẩm, viên nén phóng thích có kiểm sốt ABSTRACT A SYSTEMATIC COMPARISON OF ARTIFICIAL INTELLIGENCE TECHNIQUES IN MODELLING CONTROLLED RELEASE TABLET FORMULATION Nguyen Phuong Nam, Do Quang Duong * Y Hoc TP Ho Chi Minh * Vol 15 - Supplement of No - 2011: - 12 Objectives: This study has compared the performance of two computational methods: neural networks and genetic programming in generating predictive models for published databases of controlled release tablet formulation Material and Methods: This study used two methods: the R-squared value (R2) and the coefficients of regression equations generated from the predictive models Results: Both approaches were successful in developing invaluable predictive models for tablet tensile strength and drug dissolution profiles whilst neural networks demonstrated a slightly superior capability in predicting unseen data, genetic programming had the added advantage of generating mathematical equations representing the cause–effect relationships contained in the experimental data The results of examined data (matrix table formulation, controlled release diclofenac sodium microspheres formulation) showed that the * Đại học Y Dược Thành phố Hồ Chí Minh Tác giả liên lạc: TS Đỗ Quang Dương ĐT: 0913662043; Email: dqduong@uphcm.edu.vn Chuyên Đề Dược Khoa Y Học TP Hồ Chí Minh * Tập 15 * Phụ Số * 2011 Nghiên cứu Y học performance of neural network was superior when compared to genetic programming Conclusion: In evaluating models generated by the two technologies, neural networks showed a higher capability of predicting unseen data than genetic programming This study also will help the pharmacist easily in choosing the techniques and tools to build model data Keyword: neural networks, genetic programming, tablet formulation, controlled release ĐẶT VẤN ĐỀ Trong quy trình sản xuất thuốc việc khảo sát mối liên quan nhân thành phần với tính chất dược phẩm ln vấn đề nhà bào chế quan tâm Việc xác định mối liên quan nhân thường dựa vào mô hình dự đốn xây dựng phương pháp thống kê (truyền thống) hay máy tính (hiện đại) thách thức lớn nhà sản xuất(5) Bên cạnh việc xây dựng mơ hình cơng thức bước quan trọng qui trình tối ưu cơng thức Việc mơ hình hóa cơng thức dược phẩm cơng cụ máy tính ngày áp dụng phổ biến lợi ích khơng giới hạn số biến độc lập (x), tối ưu đồng thời nhiều biến phụ thuộc (y), phù hợp với loại liệu phức tạp phi tuyến(9) Có nhiều kỹ thuật xây dựng mơ hình cơng thức máy tính áp dụng mạng thần kinh (Neural Network - NN)(2) thuật giải di truyền (Genetic Algorithms)(3) lập trình di truyền (Genetic Programming - GP)(4) hệ thống lai chúng Những kỹ thuật phần giải yêu cầu nhà sản xuất giảm thời gian chi phí nghiên cứu phát triển cơng thức Mạng thần kinh (Neural Network) Mạng thần kinh áp dụng từ 60 năm qua, có ích việc thiết lập mơ hình quan hệ nhân quả, đặc biệt liệu phi tuyến hay liệu phức tạp(9) Ngày nay, mạng thần kinh đựợc áp dụng nhiều lãnh vực khác nhau: công nghệ thông tin, khoa học tri thức (mô tả kiểu suy luận nhận thức), sinh học (lý giải chuỗi nucleotid)… Chuyên Đề Dược Khoa Mạng thần kinh sinh học (Hình 1) tạo thành liên kết nhiều tế bào thần kinh sinh học (neuron) Các xung động thần kinh truyền từ khớp qua trục để đến thân Thân tế bào tổng hợp xung động thần kinh định tiếp tục truyền tín hiệu sang tế bào thần kinh khác Khớp Nhánh Trục Thân Hình Cấu trúc tế bào thần kinh sinh học X1 Đầu vào W1 W2 X2 Σ Đầu W3 X3 Hình Cấu trúc tế bào thần kinh nhân tạo Mạng thần kinh nhân tạo (Hình 2) mô cấu trúc mạng thần kinh sinh học, tạo thành liên kết nhiều đơn vị thần kinh (perceptron) Những đơn vị thần kinh có nhiệm vụ thu thập tín hiệu, xác định trọng số, tổng cộng chuyển tín hiệu sang đơn vị thần kinh khác Mỗi mạng thần kinh nhân tạo cấu tạo hàng trăm ngàn đơn vị liên kết xếp thành nhiều lớp Có nhiều cấu trúc mạng thần kinh, song cấu trúc mạng nhiều lớp (multilayer perceptron networks) thơng dụng Cấu trúc mạng nhiều lớp có lớp vào, hay nhiều lớp ẩn lớp đầu Thông thường, cấu trúc mạng với lớp ẩn dùng nhiều thiết lập mơ hình tối ưu hóa cơng thức Cấu trúc mạng với nhiều lớp ẩn Y Học TP Hồ Chí Minh * Tập 15 * Phụ Số * 2011 Nghiên cứu Y học dùng cho mô hình phi tuyến song đòi hỏi nhiều thời gian cho máy tính xử lý(9) Cấu trúc mạng thần kinh với lớp ẩn minh họa Hình thường áp dụng cho tốn tìm lời giải tối ưu, GP xếp vào nhóm thuật tốn máy học: tìm mơ hình phù hợp dựa liệu đưa vào (Hình 5)(7) Hình Cấu trúc mạng thần kinh nhân tạo thường gặp Lập trình di truyền (Genetic ProgrammingGP) Lập trình di truyền kỹ thuật với ý tưởng chương trình máy tính có khả tự tiến hóa để thực cơng việc đó, giới thiệu Koza vào năm 1992(7) Lập trình di truyền biến thể thuật giải di truyền với điểm khác cấu trúc liệu sử dụng để biểu diễn cá thể quần thể Có hai phần cá thể GP, node terminal minh họa Hình Các node phép tính, nút (terminal) giá trị số hay biến Việc lựa chọn phép tính nút thao tác GP để tìm lời giải cho vấn đề (mơ hình liệu dạng biểu thức tốn học y = f(xi))(7) Phép tính (Nodes) A hình hóa liệu cơng thức viên nén phóng thích có kiểm sốt Trong nghiên cứu trước nhóm tác giả cho thấy kỹ thuật mạng thần kinh lập trình di truyền hiệu việc mơ hình hóa liệu(4) Việc so sánh hai kỹ thuật giúp cho nhà bào chế khách quan việc lực chọn phương pháp mô hình hóa liệu PHƯƠNG PHÁP NGHIÊN CỨU Cơng cụ phần mềm Công cụ sử dụng báo truyền khoa Dược – Đại học Y Dược Hồ Chí Nút (Terminals) Hình Mơ tả cá thể kỹ thuật lập trình di truyền, cá thể biểu diễn công thức y = A*B + C GP khác thuật tốn thơng minh khác phạm vi ứng dụng: thuật toán khác dụng hai kỹ thuật thông minh việc mô thơng minh: mạng thần kinh lập trình di C B Bài báo kết nghiên cứu so sánh ứng nghiên cứu ứng dụng hai kỹ thuật + * Hình Quá trình chọn lọc xử lý liệu lập trình di truyền Minh cho việc xây dựng mơ hình tối ưu hóa cơng thức Để đánh giá chất lượng mơ hình hóa, nghiên cứu dùng giá trị (R2) (cơng thức 1) Giá trị R2 cao, mơ hình liệu tương thích(2,5) Chuyên Đề Dược Khoa Y Học TP Hồ Chí Minh * Tập 15 * Phụ Số * 2011 n ⎛ ⎞ ⎜ ∑ (yi − yˆi ) ⎟ ⎟x100 R = ⎜1 − i=n1 ⎜ ⎟ ⎜ ∑ (yi − y) ⎟ i =1 ⎝ ⎠ Nghiên cứu Y học liệu cho viên nén matrix hai kỹ thuật (GP, NN), kết dự đoán hệ số R2 minh họa Bảng với yi: biến phụ thuộc với liệu; y : giá trị trung bình biến phụ thuộc; yˆ : giá trị dự đoán từ mơ hình; n: số lượng liệu Dữ liệu thực nghiệm Dữ liệu công thức viên nén matrix tham khảo từ cơng trình Bodea Leucuta(1) Cơng thức viên nén matrix bao gồm 13 công thức thực nghiệm với biến độc lập (x1: % HPMC; x2: % CMCNa; x3: % HCl), biến phụ thuộc (y1: % hoạt chất phóng thích sau giờ; y2: % hoạt chất phóng thích sau giờ; y3: % hoạt chất phóng thích sau 12 giờ) Một liệu khác tham khảo từ cơng trình Gohel & Amin(6) Cơng thức viên nén phóng thích có kiểm sốt diclofenac sodium microspheres bao gồm 27 công thức thực nghiệm với biến độc lập (x1: Tốc độ khuấy; x2: Lượng CaCl2; x3: % liquid paraffin) biến phụ thuộc (y1: thời gian 80% hoạt chất phóng thích; y2: % hoạt chất phóng thích sau 60 phút; y3: % hoạt chất phóng thích sau 360 phút; y4: % hoạt chất phóng thích sau 480 phút) KẾT QUẢ VÀ BÀN LUẬN Thông qua số liệu từ Bảng 1, so sánh hệ số tương quan (R2) hai kỹ thuật thơng minh thấy: hệ số tương quan (R2) mạng thần kinh giữ mức cao (lớn 99 %) lập trình di truyền ngược lại (nhỏ 99%) Điều chứng tỏ, nhìn chung mạng thần kinh có khả dự đốn xác lập trình di truyền Tuy nhiên số liệu 5, 11 giá trị y1 8, 9, 10 y2, y3 xảy điều ngược lại Giá trị dự đoán biến phụ thuộc (y) dùng kỹ thuật lập trình xác Để kết so sánh hai kỹ thuật xây dựng mơ hình hóa liệu rõ ràng xác hơn, phương trình đường thẳng hồi quy với hệ số góc sử dụng Với phương pháp này, hệ số góc phương trình đường thẳng hồi quy tương ứng (y1-GP: 0,978, y1-NN: 0,992; y2-GP: 0,977, y2-NN: 0,998; y3-GP: 0.973, y3-NN: 0,998) (chi tiết Hình 6) So sánh hệ số góc này, rõ ràng kết mơ hình hố từ kỹ thuật thơng minh mạng thần kinh tốt lập trình di truyền cho liệu viên nén matrix giá trị hệ số góc tiến tới giá trị 1,00 Công thức viên nén matrix(1) Bằng lựa chọn giá trị, điều kiện phù hợp q trình xây dựng mơ hình hóa Bảng Dữ liệu thực nghiệm kết dự đoán y1, y2, y3 dùng kỹ thuật thông minh GP NN No y1 y1-GP y1-NN y2 y2-GP y2-NN y3 y3-GP y3-NN 10 11 0,152 0,104 0,112 0,122 0,148 0,074 0,098 0,084 0,087 0,084 0,089 0,150 0,098 0,111 0,123 0,148 0,076 0,104 0,090 0,090 0,090 0,090 0,151 0,104 0,112 0,122 0,149 0,074 0,098 0,087 0,087 0,087 0,087 0,683 0,545 0,612 0,448 0,585 0,388 0,576 0,512 0,518 0,507 0,525 0,669 0,541 0,639 0,446 0,607 0,382 0,572 0,515 0,515 0,515 0,515 0,682 0,545 0,612 0,448 0,585 0,388 0,576 0,52 0,52 0,52 0,52 0,992 0,902 0,986 0,712 0,866 0,68 0,925 0,856 0,862 0,851 0,87 0,980 0,905 1,010 0,709 0,877 0,730 0,907 0,861 0,861 0,861 0,861 0,99 0,902 0,987 0,712 0,866 0,68 0,925 0,865 0,865 0,865 0,865 Chuyên Đề Dược Khoa Y Học TP Hồ Chí Minh * Tập 15 * Phụ Số * 2011 Nghiên cứu Y học No y1 y1-GP y1-NN y2 y2-GP y2-NN y3 y3-GP y3-NN 12 13 0,052 0,143 0,045 0,140 0,980 0,052 0,143 0,998 0,352 0,518 0,376 0,527 0,977 0,353 0,518 0,998 0,672 0,792 0,686 0,786 0,973 0,674 0,792 0,998 R2 Giống với liệu đầu tiên, lựa chọn P re d i c te d 0.16 giá trị, điều kiện phù hợp trình ŷ - GP = 0.978x + 0.003 0.14 R = 0.9803 xây dựng mơ hình hóa liệu cho viên phóng 0.12 ŷ1 - NN = 0.992x + 0.001 thích có kiểm sốt hai kỹ thuật (GP, R2 = 0.998 NN), kết hệ số tương quan (R2) trình 0.1 0.08 bày Bảng 0.06 y1-GP 0.04 0.04 0.06 0.08 0.1 0.12 y1-NN 0.14 0.16 Observed So sánh giá trị R2 (Bảng 2), giá trị R2 kỹ thuật mạng thần kinh cao giá trị R2 kỹ thuật lập trình di truyền với hai thơng số luyện thử Đối với kỹ thuật thông 0.8 minh mạng thần kinh với liệu đầu thời ŷ2 - GP = 0.979x + 0.015 R = 0.9774 0.7 gian 80% hoạt chất phóng thích (t80) thơng số R2- P re d ic t e d ŷ2 - NN = 0.994x + 0.005 luyện đạt tới giá trị 0,99, kỹ thuật lập R = 0.998 0.6 trình di truyền R2-luyện đạt 0,940 Đặc biệt 0.5 với liệu đầu - phần trăm hoạt chất phóng 0.4 y2-GP thích sau 60 phút (y60), khả xây dựng mô y2-NN 0.3 0.3 0.4 0.5 0.6 0.7 hình hóa liệu kỹ thuật lập trình di truyền không cao (R2 luyện = 0.750, R2 thử = 0,940), Observed đó, mơ hình hóa liệu áp dụng 1.1 mạng thần kinh cho kết vượt trội (R2 luyện = ŷ3 - GP = 0.928x + 0.066 R = 0.9732 0,940, R2 thử = 0,960) P r e d i c te d ŷ - NN = 0.997x + 0.004 Ở biểu đồ quy hồi (Hình 7), đặc biệt R2 = 0.998 0.9 biến phụ thuộc y60 hệ số góc phương trình 0.8 đường thẳng quy hồi với kỹ thuật lập trình di 0.7 y3-GP y3-NN 0.6 0.6 0.7 0.8 0.9 1.1 Observed Hình Biểu đồ so sánh kết dự đoán GP (♦) NN() cho y1, y2, y3 Công thức viên nén phóng thích có kiểm sốt diclofenac sodium microspheres(6) truyền 0,780 mạng thần kinh đạt 0,960 Với biểu đồ cho biến phụ thuộc khác (y1, y3, y4), mạng thần kinh trội so với kỹ thuật lập trình di truyền Từ kết trên, kết luận, việc xây dựng mơ hình hóa liệu viên nén phóng thích có kiểm sốt diclofenac sodium microspheres, mạng thần kinh vượt trội so với lập trình di truyền 10 Chuyên Đề Dược Khoa Y Học TP Hồ Chí Minh * Tập 15 * Phụ Số * 2011 Nghiên cứu Y học Bảng Giá trị R2 hai kỹ thuật GP NN Giá trị R2 t80 y60 y360 y480 R2 Luyện = 0,94 R2 Thử = 0,99 R2 Luyện = 0,99 R2 Thử = 0,98 R Luyện = 0,75 R2 Thử = 0,94 R Luyện = 0,94 R2 Thử = 0,96 R Luyện = 0,93 R2 Thử = 0,97 R Luyện = 0.99 R2 Thử = 0,97 R Luyện = 0,91 R2 Thử = 0,94 R Luyện = 0,97 R2 Thử = 0,96 Kỹ thuật GP NN R = 0.947 500 ŷt80 - NN = 0.999x - 0.350 R2 = 0.995 450 400 350 300 ŷ60 - GP = 0.781x + 8.995 50 R2 = 0.7799 45 ŷ60 - NN = 0.976x + 1.056 R2 = 0.962 40 35 y60-GP 300 350 400 450 500 550 600 25 30 35 100 R2 = 0.9456 95 ŷ360 - NN = 0.9778x + 1.980 90 R2 = 0.988 P r e d i c te d P r e d i c te d 80 40 45 50 55 Observed ŷ480 - GP = 0.901x + 8.325 ŷ 360 - GP = 0.958x + 3.065 85 y60-NN 25 Observed 90 30 t80-GP t80-NN 250 250 55 ŷt80 - GP = 0.941x + 26.228 550 P r e d i c te d P r e d i c te d 600 75 70 R2 = 0.917 ŷ480 - NN = 0.979x + 2.172 R2 = 0.964 85 80 75 65 y480-GP y480-NN y360-GP y360-NN 70 60 60 65 70 75 Observed 80 85 90 70 75 80 85 90 95 100 Observed Hình Biểu đồ quy hồi so sánh kết dự đoán GP (♦) NN () cho yt80, y60, 360,y480 việc lực chọn phương pháp cơng KẾT LUẬN cụ xây dựng mơ hình liệu phù hợp Kết từ thực nghiệm cho thấy việc ứng TÀI LIỆU THAM KHẢO dụng hai kỹ thuật lập trình di truyền mạng Bodea A, Leucuta SE (1997) Optimization of hydrophilic thần kinh việc mơ hình hóa liệu matrix tablets using a D-optimal design Int J Pharm, 153:24755 thành công Khi đánh giá mơ hình xây Bourquin J, Schmidli H, Hoogevest PV, Leuenberger H dựng hai kỹ thuật cho dạng viên nén phóng (1998) Comparison of artificial neural networks (ANN) with thích có kiểm sốt, mạng thần kinh cho mơ hình classical modelling techniques using different experimental designs and data from a galenical study on a solid dosage dự đốn có kết trội hơn, nhiên với việc form Eur J Pharm Sci, 6:287-300 sử dụng lập trình di truyền nhà bào chế Cheng CT, Ou CP, Chau KW (2002) Combining a fuzzy optimal model with a genetic algorithm to solve khảo sát mối liên quan nhân thành multiobjective rainfall-runoff model calibration J Hydrol, phần tính chất sản phẩm dựa mơ 268:72-86 hình dạng biểu thức toán học Việc so sánh Duong QD, Rowe RC and York P (2008) Modelling drug dissolution from controlled release products with Genetic hai kỹ thuật giúp cho dược sĩ khách quan programming Int J Pharm, 351:194-200 Chuyên Đề Dược Khoa 11 Nghiên cứu Y học 12 Y Học TP Hồ Chí Minh * Tập 15 * Phụ Số * 2011 Đặng Văn Giáp (2002) Thiết kế & Tối ưu hóa cơng thức quy trình: Áp dụng phần mềm thơng minh Nhà xuất Y học Gohel MC, Amin AF (1998) Formulation optimization of controlled release diclofenac sodium microspheres using factorial design J Control Release, 51:115-22 Koza JR (1998) Genetic Programming on the Programming of Computers by Mean of Natural Selection 6th ed London: MIT press Langdon WB, Poli R (2002) Foundations of Genetic Programming 1st ed Berlin, Heidelberg: Springer-Verlag Rowe RC, Roberts RJ (1998) Intelligent Software for Product Formulation 1st ed London: Taylor and Francis Chuyên Đề Dược Khoa ... vi ứng dụng: thuật toán khác dụng hai kỹ thuật thông minh việc mơ thơng minh: mạng thần kinh lập trình di C B Bài báo kết nghiên cứu so sánh ứng nghiên cứu ứng dụng hai kỹ thuật + * Hình Quá trình. .. phóng thích có kiểm sốt diclofenac sodium microspheres(6) truyền 0,780 mạng thần kinh đạt 0,960 Với biểu đồ cho biến phụ thuộc khác (y1, y3, y4), mạng thần kinh trội so với kỹ thuật lập trình di truyền. .. trên, kết luận, việc xây dựng mơ hình hóa liệu viên nén phóng thích có kiểm sốt diclofenac sodium microspheres, mạng thần kinh vượt trội so với lập trình di truyền 10 Chuyên Đề Dược Khoa Y Học