Mục tiêu nghiên cứu đề tài là nghiên cứu xây dựng mô hình dự báo gia cổ phiếu dựa trên sự tích hợp mô hình mờ TSK hướng dữ liệu (data-driven models) trích xuất từ máy học véc-tơ hỗ trợ với tri thức tiên nghiệm.
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ MƠ HÌNH DỰ BÁO GIÁ CỔ PHIẾU DỰA TRÊN VIỆC TÍCH HỢP MƠ HÌNH MỜ TSK VÀ TRI THỨC TIÊN NGHIỆM Mã số: T2017-07-02 Xác nhận quan chủ trì đề tài Chủ nhiệm đề tài Nguyễn Đức Hiển Đà Nẵng, 12/2017 i MỤC LỤC MỤC LỤC i DANH MỤC HÌNH VẼ iii DANH MỤC BẢNG BIỂU iv DANH MỤC CÁC TỪ VIẾT TẮT v THÔNG TIN KẾT QUẢ NGHIÊN CỨU vi MỞ ĐẦU 1 Tổng quan Tính cấp thiết đề tài Mục tiêu đề tài Cách tiếp cận phương pháp nghiên cứu Đối tượng phạm vi nghiên cứu Nội dung nghiên cứu Chương CƠ SỞ LÝ THUYẾT MƠ HÌNH MỜ TSK VÀ MÁY HỌC VÉC-TƠ 1.1 Mơ hình mờ 1.1.1 Mơ hình mờ Mamdani 13 1.1.2 Mơ hình mờ Takagi-Sugeno 14 1.2 Cơ sở lý thuyết Máy học Véc-tơ hỗ trợ 15 1.2.1 Máy học Véc-tơ hỗ trợ 15 1.2.2 Máy học Véc-tơ hỗ trợ cho vấn đề tối ưu hóa hồi qui 17 1.3 Sự tương tự máy học Véc-tơ hỗ trợ mơ hình mờ 18 1.4 Trích xuất luật mờ từ liệu dựa kết hợp máy học SVM mơ hình 20 Chương VIỆC HỌC MƠ HÌNH MỜ VỚI TRI THỨC TIÊN NGHIỆM Error! Bookmark not defined 2.1 Vai trò tri thức tiên nghiệm Error! Bookmark not defined 2.2 Học dựa giải thích (EBL) Error! Bookmark not defined 2.3 Học dựa thích hợp (RBL) Error! Bookmark not defined 2.4 Học quy nạp dựa tri thức (KBIL) .Error! Bookmark not defined Chương TÍCH HỢP TRI THỨC TIÊN NGHIỆM VÀO QUÁ TRÌNH HỌC 22 3.1 Điều kiện đảm bảo tính “có thể diễn dịch được” mơ hình mờ 22 ii 3.2 Tích hợp tri thức tiên nghiệm mơ hình mờ dựa máy học véc-tơ hỗ trợ 24 Chương MỘT SỐ KẾT QUẢ THỰC NGHỆM 27 4.1 Ví dụ hồi quy phi tuyến tính Error! Bookmark not defined 4.2 Chuỗi thời gian hỗn loạn Mackey-Glass Error! Bookmark not defined 4.3 Hệ thống Lorenz Error! Bookmark not defined KẾT LUẬN VÀ KIẾN NGHỊ 33 TÀI LIỆU THAM KHẢO i iii DANH MỤC HÌNH VẼ Hình Cấu trúc mơ hình mờ Hình Hình ảnh phân lớp với SVM 11 Hình Sự tương đương SVM Mơ hình mờ 14 Hình Sơ đồ khối thuật tốn f-SVM 16 Hình Mơ hình học EBL 18 Hình Mơ hình học RBL 19 Hình Mơ hình học KBIL 20 Hình Thuật tốn SVM-IF 25 Hình Kết mơ hình tối ưu hóa (RMSE = 0.0183) 28 Hình 10 Kết dự đốn 200 mẫu liệu thử nghiệm (RMSE = 0.0092) 31 Hình 11 (a) Kết mơ hình tối ưu hóa (RMSE = 0.0043), (b)(c)(d) Các hàm thành viên tương ứng x(t-1), y(t-1) x(t-1) 33 iv DANH MỤC BẢNG BIỂU Bảng Tập luật trích xuất từ mơ hình tối ưu hóa – 4.1 28 Bảng So sánh kết mơ hình qua thơng số RMSE – 4.1 28 Bảng Diễn dịch ngôn ngữ cho luật bảng 29 Bảng Tập luật trích xuất 800 mẫu liệu huấn luyện – 4.2 30 Bảng So sánh kết mơ hình qua thơng số RMSE – 4.2 31 Bảng Tập luật trích xuất 500 mẫu liệu huấn luyện – 4.3 32 Bảng So sánh kết mơ hình qua thơng số RMSE – 4.3 34 v DANH MỤC CÁC TỪ VIẾT TẮT SVM Support Vector Machine SOM Self Organizing Map GA Genetic Algorithm EBL explaination-based learning RBL relevance-based learning KBIL Knowledge-based inductive learning SMO Sequential Minimal Optimization SVs Support vectors RMSE Root Mean Squared Error vi ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CƠNG NGHỆ THƠNG TIN CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc THƠNG TIN KẾT QUẢ NGHIÊN CỨU Thơng tin chung: - Tên đề tài: Mơ hình dự báo giá cổ phiếu dựa việc tích hợp mơ hình mờ TSK tri thức tiên nghiệm - Mã số: T2017-07-02 - Chủ nhiệm: NGUYỄN ĐỨC HIỂN - Thành viên tham gia: khơng có - Cơ quan chủ trì: TRƯỜNG CAO ĐẲNG CÔNG NGHỆ THÔNG TIN - Thời gian thực hiện: 01/2017 – 12/2017 Mục tiêu: Nghiên cứu xây dựng mô hình dự báo gia cổ phiếu dựa tích hợp mơ hình mờ TSK hướng liệu (data-driven models) trích xuất từ máy học véc-tơ hỗ trợ với tri thức tiên nghiệm Tính sáng tạo: Đề xuất xây dựng mơ hình mờ TSK cho tốn dự báo giá cổ phiếu dựa việc tích hợp mơ hình mờ trích xuất từ máy học Véc-tơ hỗ trợ hồi quy với tri thức tiên nghiệm Tóm tắt kết nghiên cứu: Đối với lý thuyết mơ hình mờ (fuzzy modelling) máy học Véc-tơ hỗ trợ, đề tài nghiên cứu lý thuyết tốn học mơ hình mờ TSK, mơ hình máy học SVM cho tốn phân lớp tốn tối ưu hóa hồi quy Đối với vai trò tri thức tiên nghiệm, đề tài nghiên cứu vai trò tri thức tiên nghiệm việc học mơ hình mờ kịch tích hợp tri thức tiên nghiệm vào q trình học mơ hình mờ để cải thiện hiệu mơ hình Đối với pháp tích hợp tri thức tiên nghiệm vào mơ hình mờ TSK trích xt từ máy học véc-tơ hỗ trợ hồi quy, đề tài phân tích đề xuất thuật tốn SVM-IF Đề tài tiến hành thực nghiệm thuật toán đề xuất số tốn ví dụ phân tích, đánh giá kết kết hợp so sánh với số mơ hình có trước khác vii Tên sản phẩm: Bài báo khoa học đăng kỷ yếu Hội thảo khoa học quốc tế: Hybrid Model of SelfOrganized Map and Integrated Fuzzy Rules with Support Vector Machine: Application to Analysis Stock Price Chapter in Springer AISC, Vol 672, Proc of INDIA-2017 Mơ hình đề xuất số kết thực nghiệm với mơ hình mờ trích xuất Một báo cáo tổng kết đề tài nghiên cứu khoa học Hiệu quả, phương thức chuyển giao kết nghiên cứu khả áp dụng: Hiệu mặt giáo dục - đào tạo: Kỹ thuật trích xuất luật mờ từ liệu dựa máy học véc-tơ hỗ trợ với thuật toán SVM-IF mơ hình tích hợp nhiề giai đoạn cho toán dự báo giá cổ phiếu hướng để sinh viên ngành CNTT phát triển ứng dụng khai phá liệu, hệ chuyên gia dự báo, Hiệu mặt khoa học: đóng góp đề tài đề xuất thuật tốn - SVM-IF cho phép trích xuất mơ hình mờ từ máy học véc-tơ hỗ trợ mơ hình mờ tích hợp nhiều giai đoạn cho toán dự báo hồi quy Về sản phẩm ứng dụng: Mơ hình đề xuất thiết kế cho việc xây dựng mô hình mờ dạng luật để giải tốn phân tích liệu tài chính, hệ chuyên gia dự đốn, dự báo Hình ảnh, sơ đồ minh họa viii Hình Sự tương đương SVM Mơ hình mờ Begin Khởi tạo tham số SVMs Centers : 𝑐𝑖 , 𝑖 = 𝑚 Variances : 𝜎𝑖 , 𝑖 = 𝑚 Trích xuất luật mờ từ SVMs IF x is Gaussmf(𝑐𝑖 , 𝜎𝑖 ) THEN y is B Tối ưu hóa 𝜎𝑖 ሺ𝑡 + 1ሻ = 𝜎𝑖 ሺ𝑡ሻ + 𝛿𝜀1,𝑖 ቂ 𝑐𝑖 ሺ𝑡 + 1ሻ = 𝑐𝑖 ሺ𝑡ሻ + 𝛿𝜀1,𝑖 ቂ ሺ𝑥−𝑐ሻ2 𝜎3 −ሺ𝑥−𝑐ሻ 𝜎2 𝑒𝑥𝑝 ቀ− 𝑒𝑥𝑝 ቀ− End Hình Sơ đồ khối thuật toán f-SVM ሺ𝑥−𝑐ሻ2 2𝜎2 ሺ𝑥−𝑐ሻ2 2𝜎2 ቁቃ ቁቃ ix Procedure ModelExtraction(ℋ, k, tol) Khởi tạo giá trị tham số: 𝐶, 𝜀, 𝜎, 𝑠𝑡𝑒𝑝 while error>tol fሺxሻ = ∑li=1ሺαi − αi∗ ሻ Kሺxi , xሻ + b 𝑆𝑉 = {ሺ𝛼𝑖 − 𝛼𝑖∗ ሻ: ሺ𝛼𝑖 − 𝛼𝑖∗ ሻ ≠ 0, 𝑖 ∈ {0, … , 𝑙}} InterpretabilityTest(SV, n, σ, k) 𝐷 ′ −𝐷 ′ ቃ, Điều chỉnh ma trận kernel: 𝐻 ′ = ቂ ′ −𝐷 𝐷′ 〈𝜑ሺ𝑥𝑖 ሻ, 𝜑(𝑥𝑗 )〉 𝑣ớ𝑖 𝐷𝑖𝑗′ = ∑𝑗〈𝜑ሺ𝑥𝑖 ሻ, 𝜑(𝑥𝑗 )〉 𝑒𝑟𝑟𝑜𝑟 = 𝐸 [‖𝑓 ሺ𝑥ሻ − ℋ ‖2 ] 𝜀 = 𝜀 + 𝑠𝑡𝑒𝑝 10 end while 11 σi ሺt + 1ሻ = σi ሺtሻ + δε1,i ቂ 12 ci ሺt + 1ሻ = ci ሺtሻ + δε1,i ቂ 13 return 𝑓ሺ𝑥ሻ = ሺx−cሻ2 σ3 −ሺx−cሻ σ2 ∑𝑙𝑖=1(𝛼𝑖 −𝛼𝑖∗ )𝐾ሺ𝑥𝑖 ,𝑥ሻ ∑𝑙𝑖=1(𝛼𝑖 −𝛼𝑖∗ ) exp ቀ− exp ቀ− ሺx−cሻ2 2σ2 ሺx−cሻ2 2σ2 ቁቃ ቁቃ 14 end procedure 15 Procedure InterpretabilityTest(SV, n, σ, k) 16 repeat − 17 Tính độ tương tự cặp tập mờ: 𝑆 𝐺 (𝐴𝑖 , 𝐴𝑗 ) = 𝑑2 σ𝑒 σ2 − 𝑑2 2σ−σ𝑒 σ2 Lựa chọn môt cặp tập mờ 𝐴∗𝑖 𝐴𝑗∗ cho 𝑆 𝐺 (𝐴∗𝑖 , 𝐴𝑗∗ ) = 𝑚𝑎𝑥𝑖,𝑗 {𝑆 𝐺 (𝐴𝑖 , 𝐴𝑗 )} 19 if 𝑆 𝐺 (𝐴∗𝑖 , 𝐴𝑗∗ ) > 𝑘 then 20 Gộp cặp tập mờ 𝐴∗𝑖 𝐴𝑗∗ thành tập mờ 𝐴𝑘 21 end if 22 until khơng cịn căp tập mờ có độ đo tương tự 𝑆 𝐺 (𝐴𝑖 , 𝐴𝑗 ) > 𝑘 23 end procedure Hình Thuật tốn SVM-IF 18 32 Mã cổ phiếu Số phân cụm Số luật IBM APPL Số SVs NMSE MAE DS NMSE MAE DS 1367 1.2203 0.0617 47.74 1157 1.1054 0.0564 48.05 55 1898 2.8274 0.0650 49.75 1423 1.0877 0.0474 52.27 SP500 # 1.7836 0.1421 48.24 1356 1.1100 0.1200 51.25 DJI 35 # 1.7602 0.1614 49.75 1144 1.0660 0.1104 50.86 Bảng Vb Kết thử nghiệm mơ hình SOM+f-SVM mơ hình SOM+SVM-IF đề xuất Mã cổ phiếu Số phân cụm SOM + f-SVM SOM + SVM-IF Số luật NMSE MAE DS Số luật NMSE MAE DS IBM 1157 1.1028 0.0577 44.22 5*6 1.0324 0.0554 50.75 APPL 55 1323 1.1100 0.0445 52.76 5*55 1.0467 0.0435 53.27 SP500 1356 1.1081 0.1217 52.76 5*6 1.0836 0.1207 53.27 DJI 35 1144 1.0676 0.1186 50.25 5*35 1.0459 0.1181 51.76 33 KẾT LUẬN VÀ KIẾN NGHỊ Máy học Véc-tơ hỗ trợ hồi quy cho phép trích xuất Support-vector làm sở để sản sinh luật mờ cho mơ hình dự đốn hồi quy Tuy nhiên tăng tinh xác mơ hình SVM số luật mờ mơ hình trích xuất tăng lên tính “có thể diễn dịch được” giảm Mục tiêu thuật toán đề xuất nhằm giải điểm hạn chế mô hình máy học Véc-tơ hỗ trợ tính phức tạp tính “có thể diễn dịch được” Đề tài phân tích mối quan hệ tương đương mơ hình máy học Véc-tơ hỗ trợ mơ hình mờ Bên cạnh đó, điều kiện hệ thống mờ đảm bảo tính chất “có thể diễn dịch được” phân tích, từ xác định tri thức tiên nghiệm thích hợp dùng để tích hợp vào mơ hình mờ dựa máy học Véc-tơ hỗ trợ nhằm đảm bảo đặc tính “có thể diễn dịch được” mơ hình Trong nghiên cứu này, chúng tơi đề xuất thuật tốn SVMIF; thuật tốn cho phép điều chỉnh số lượng vị trí SVs học từ máy học Véc-tơ hỗ trợ, để từ trích xuất hệ thống mờ đảm bảo đặc tính “có thể diễn dịch được” Trong nghiên cứu đề xuất mô hình dự báo giá cổ phiếu dựa kết hợp SOM SVM-IF Kết thực nghiệm liệu thử nghiệm cho thấy mơ hình đề xuất phần cải thiện so với mô hình đề xuất trước [7][8][16], thể hiện qua số giá trị tốt thông số NMSE, MAE DS Với số lượng lớn liệu chuỗi thời gian tài giải pháp kết hợp phân cụm liệu đầu vào SOM giúp cải thiện đáng kể thời gian thực hiện thuật toán học suy luận Cải thiện rõ mơ hình đề xuất số lượng luật mờ trích xuất mơ hình giảm nhiều, hiệu dự đoán đảm bảo Với tập luật mờ trích xuất mơ hình đề xuất phân thành từng cụm nhỏ, số lượng hạn chế, đảm bảo tính “có thể diễn dịch được” chuyên gia người lĩnh vực tương ứng, cụ thể lĩnh vực chứng khoán, dễ dàng diễn dịch ngôn ngữ cho luật Trong định hướng nghiên cứu tiếp theo, 34 phối hợp với chuyên gia người để phân tích, đánh giá tập luật mờ hướng liệu này; từ có chọn lựa chí bổ sung thêm luật chuyên gia để gia tăng giá trị sử dụng tập luật Trên sở mơ hình đề xuất, chúng tơi mong muốn hợp tác với sinh viên, chuyên gia phát triển phần mềm để phát triển ứng dụng cụ thể thiết thực giải toán dự đoán, dự báo thực tế, cụ thể như: chứng khốn, thời tiết, Chúng tơi xin chân thành cảm ơn i TÀI LIỆU THAM KHẢO [1] A.J Smola and B Scholkopf A Tutorial on Support Vector Regression NEUROCOLT2 echnical Report Series, NC2-TR- 1998-030, 1998 [2] B Scholkopf, P Bartlett, A Smola and R Williamson Shrinking the Tube: A New Support Vector Regression Algorithm NIPS Conference, Denver, Colorado, USA, November 30 - December 5, 1998 [3] Burges, C J C A tutorial on support vector machines for pattern recognition datamining and knowledge discovery, 2(2), 955-974, 1998 [4] C F F Carraro, M Vellasco, R Tanscheit A Fuzzy-Genetic System for Rule Extraction from Support Vector Machines IEEE, 2013 [5] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen lin A practical Guide to Support Vector Classification http://www.csie.ntu.edu.tw/~cjlin/libsvm/ (2010) [6] Corinna Cortes and Vladimir Vapnik Support-Vector Networks Machine Learning, 20, 273-297, 1995 [7] David Martens, Johan Huysmans, Rudy Setiono, Jan Vanthienen, Bart Baesens Rule Extraction from Support Vector Machines - An Overview of issues and application in credit scoring Studies in Computational Intelligence (SCI) 80, 33–63, 2008 [8] Dou, W., Ruan, S., Chen, Y., Bloyet, D., and Constans, J.-M A framework of fuzzy information fusion for the segmentation of brain tumor tissues on RM images Image and Vision Computing, vol 25, no 2, 164-171, 2007 [9] George Bojadjev, Maria Bojadjev Fuzzy logic for Business, Finance, and Management World Scientific Publishing Co Pte Ltd, 2007 [10] J.-H Chiang and P.-Y Hao Support vector learning mechanism for fuzzy rulebased modeling: a new approach IEEE Trans On Fuzzy Systems, vol 12, pp 1-12, 2004 [11] J.L Castro, L.D Flores-Hidalgo, C.J Mantas and J.M Puche Extraction of fuzzy rules from support vector machines Elsevier Fuzzy Sets and Systems, 158, 2057 ii – 2077, 2007 [12] John Yen, Reza Langari Fuzzy logic: Intelligence, Control, and Information Prentice hall, Uper dadle river, New Jersey, 1999 [13] J.-S R Jang and C.-T Sun Functional equivalence between radial basis function networks and fuzzy inference systems IEEE Transactions on Neural Networks, vol 4, no 1, pp 156-159, 1993 [14] Juan C Figueroa-García, Cynthia M Ochoa-Rey, José A Avellaneda-González Rule generation of fuzzy logic systems using a self-organized fuzzy neural network Neurocomputing– ELSEVIER, 151, 955–962, 2015 [15] L.J.Cao and Francis E.H.Tay Support vector machine with adaptive parameters in Financial time series forecasting IEEE trans on neural network,vol 14, no 6, 2003 [16] Lorenz E N Deterministic nonperiodic flow Journal of the Atmospheric Sciences, vol 20, pp 130–141, 1963 [17] M Delgado, F Herrera, E Herrera-Viedma, L Martin Combining Numerical and Linguistic Information in Group Decision making Journal of Information Sciences, 1996 [18] M.C MacKey and L Glass Oscillation and chaos in physiological control systems Science, vol 197, pp 287–289, 1997 [19] N Ancona Classification Properties of Support Vector Machines for Regression Technical Report, RI-IESVCNR-Nr 02/99 [20] Nahla Barakat, Andrew P Bradley Rule extraction from support vector machines: A review Neurocomputing – ELSEVIER, 74, 178–190, 2010 [21] R Sindelar and R Babuska Input selection for nonlinear regression models IEEE Trans on Fuzzy Systems, vol 12, no 5, 688-696, 2004 [22] S Chen, J Wang and D Wang Extraction of fuzzy rules by using support vector machines IEEE, Computer society, pp 438-441, 2008 [23] Serge Guillaume, Luis Magdalena Expert guided integration of induced knowledge into a fuzzy knowledge base Soft Comput, Springer-Verlag, 10: 773– iii 784, 2006 [24] Stuart Rusell, Perter Norvig Artificial Intelligence: A Modern Approach Second Editor, Prentice Hall - Series in Artificial Intelligence, 2003 [25] Xianchang Wang, Xiaodong Liu, Witold Pedrycz, Lishi Zhang Fuzzy rule based decision trees Pattern Recognition– ELSEVIER, 48, 50–59, 2015 [26] Y Jin and B Sendhoff Extracting interpretable fuzzy rules from RBF networks Neural Processing Letters, vol 17, no 2, pp 149-164, 2003 [27] Dương Thăng Long Luận án tiến sĩ Toán học: Phương pháp xây dựng hệ mờ dạng luật với ngữ nghĩa dựa đại số gia tử ứng dụng toán phân lớp Viện Công nghệ Thông tin - Viện Khoa học Công nghệ Việt Nam, 2010 [28] Duc-Hien Nguyen, Manh-Thanh Le A two-stage architecture for stock price forecasting by combining SOM and fuzzy-SVM International Journal of Computer Science and Information Security (IJCSIS), USA, ISSN: 1947-5500 No: Vol 12 No 8, 20-25, 2014 [29] Duc-Hien Nguyen, Manh-Thanh Le Improving the Interpretability of Support Vector Machines-based Fuzzy Rules Advances in Smart Systems Research, Future Technology Publications, ISSN: 2050-8662, No: Vol No 1, – 14, 3013 [30] Nguyễn Đức Hiển,: Ứng dụng mô hình máy học véc-tơ tựa (SVM) phân tích liệu điểm sinh viên, Tạp chí Khoa Cơng nghệ Đại học Đà Nẵng, Số 12(73), 33-37, 2013 ĐẠI HỌC ĐÀ NẴNG CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN Độc lập - Tự - Hạnh phúc THUYẾT MINH ĐỀ TÀI KHOA HỌC & CÔNG NGHỆ CẤP CƠ SỞ (DO TRƯỜNG CAO ĐẲNG CÔNG NGHỆ THÔNG TIN QUẢN LÝ) TÊN ĐỀ TÀI: Mơ hình dự báo giá cổ phiếu dựa việc tích MÃ SỐ hợp mơ hình mờ TSK tri thức tiên nghiệm LĨNH VỰC NGHIÊN CỨU LOẠI HÌNH NGHIÊN CỨU Mơi trường Tự nhiên Kỹ thuật Kinh tế; XH-NV Nông Lâm ATLĐ Y Dược Sở hữu trí tuệ Giáo dục THỜI GIAN THỰC HIỆN x Cơ Ứng dụng x x Triển Khai 12 tháng Từ tháng 04 năm 2017 đến tháng 12 năm 2017 CƠ QUAN CHỦ TRÌ ĐỀ TÀI (đơn vị thành viên ĐHĐN) Tên quan: Trường Cao đẳng Công nghệ Thông tin Điện thoại: 0236.3667117 E-mail: Địa chỉ: Làng Đại học, Đường Nam Kỳ Khởi Nghĩa, Phường Hòa Quý, Q Ngũ Hành Sơn, TP Đà Nẵng Họ tên thủ trưởng quan chủ trì: TS Trần Tấn Vinh CHỦ NHIỆM ĐỀ TÀI Họ tên: NGUYỄN ĐỨC HIỂN Chức danh khoa học: Địa quan: Khoa CNTT, CĐ CNTT Điện thoại quan: 0236.3667118 Di động: 0905734949 E-mail: ndhien@cit.udn.vn Học vị: Thạc sĩ Năm sinh: 1973 Địa nhà riêng: 47 Đặng Thùy Trâm Điện thoại nhà riêng : Fax: 0236.3667116 NHỮNG THÀNH VIÊN THAM GIA NGHIÊN CỨU ĐỀ TÀI TT Họ tên Đơn vị công tác lĩnh vực chuyên môn Nội dung nghiên cứu cụ thể giao Chữ ký ĐƠN VỊ PHỐI HỢP CHÍNH Tên đơn vị nước Nội dung phối hợp nghiên cứu Họ tên người đại diện đơn vị 10 TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU THUỘC LĨNH VỰC CỦA ĐỀ TÀI Ở TRONG VÀ NGỒI NƯỚC 10.1 Trong Ngồi nước (phân tích, đánh giá tình hình nghiên cứu thuộc lĩnh vực đề tài giới, liệt kê danh mục cơng trình nghiên cứu, tài liệu có liên quan đến đề tài trích dẫn đánh giá tổng quan) Bài toán dự đoán giá cổ phiếu thu hút nhiều quan tâm nghiên cứu nhà khoa học Có nhiều mơ hình giải pháp khác nhà nghiên cứu đề xuất, với mục tiêu cuối nâng cao tính xác kết dự đốn Bài toán dự đoán giá cổ phiếu chủ yếu tiếp cận hai dạng, dự đoán giá cổ phiếu xu hướng giá cổ phiếu sau n-ngày [6][15] Một hướng tiếp cận phổ biến để giải toán dự đốn giá cổ phiếu trích xuất mơ hình mờ dự đoán giá cổ phiếu từ liệu giao dịch lịch sử, gọi mơ hình mờ hướng liệu (data-driven model) Một kỹ thuật trích xuất luật mờ tự động từ liệu hiệu dựa vào máy học véc-tơ hỗ trợ (Support vector machines - SVM) nhóm tác giả J.-H Chiang P.-Y Hao nghiên cứu công bố lần [8] Theo hướng tiếp cận này, nhiều tác giả nghiên cứu đề xuất ứng dụng kỹ thuật rút trích luật mờ từ SVM cho việc phát triển mơ hình mờ hướng liệu cho toán phân lớp [4][9], dự báo hồi quy [12][14] Một đặc điểm đáng lưu ý máy học Véc-tơ hỗ trợ tập liệu học định, điều chỉnh tham số để tăng tính xác mơ hình dự đốn số lượng véc-tơ hỗ trợ (Support Vector - SVs) tăng lên [4][5][12] Nói cách khác tăng hiệu suất mơ hình đồng nghĩa với việc làm giảm tính “có thể diễn dịch được” (intepretability) mơ hình Như vấn đề đặt làm trích xuất hệ thống mờ đảm bảo tính xác dự đốn, đồng thời đảm bảo đặc tính “có thể diễn dịch được” Bên cạnh đó, lý thuyết học dựa tri thức cho thấy kiểu khác tri thức sử dụng để cải thiện hiệu mơ hình máy học nói chung mơ hình mờ nói riêng Tùy thuộc vào vai trò tri thức, việc học dựa tri thức phân thành kịch sau: học dựa giải thích (explaination-based learning) hay gọi EBL, học dựa phù hợp (relevance-based learning) hay gọi RBL, học qui nạp dựa tri thức (knowledge-based learning) hay gọi KBIL [17] Như hướng nghiên cứu tich hợp tri thưc tiên nghiệm với mơ hình mờ hướng liệu TSK chọn giải đề xuất để cải thiện hiệu mơ hình dự báo giá chứng khốn dự mơ hình mờ hướng liệu 1) 2) 3) 4) 5) 6) 7) 8) Alex J Smola, Bernhard Scholkopf, 2004 A Tutorial on Support Vector Regression, Statistics and Computing 14: 199–222 Chih-Wei Hsu, Chih-Chung Chang, Chih-Jen lin, 2010 A practical Guide to Support Vector Classification, http://www.csie.ntu.edu.tw/~ cjlin/libsvm/ Corinna Cortes and Vladimir Vapnik, 1995 Support-Vector Networks Machine Learning, 20: 273-297 David Martens, Johan Huysmans, Rudy Setiono, Jan Vanthienen, Bart Baesens, 2008 Rule Extraction from Support Vector Machines - An Overview of issues and application in credit scoring, Studies in Computational Intelligence (SCI) 80: 33–63 Duc-Hien Nguyen, Manh-Thanh Le, 2013 A two-stage architecture for stock price forecasting by combining SOM and fuzzy-SVM, International Journal of Computer Science and Information Security (IJCSIS), USA, ISSN: 1947-5500, Vol 12 No 8: 20-25 Francis Eng Hock Tay and Li Yuan Cao, 2001 Improved financial time series forecasting by combining Support Vector Machines with self-organizing feature map, Intelligent Data Analysis 5, IOS press: 339-354 John Yen, Reza Langari,1999 Fuzzy logic: Intelligence, Control, and Information, Prentice hall, Uper dadle river, New Jersey J.-H Chiang and P.-Y Hao, 2004 Support vector learning mechanism for fuzzy rule-based modeling: a new approach, IEEE Trans On Fuzzy Systems, vol 12: 1-12 9) 10) 11) 12) 13) 14) 15) 16) J.L Castro, L.D Flores-Hidalgo, C.J Mantas and J.M Puche, 2007 Extraction of fuzzy rules from support vector machines, Elsevier Fuzzy Sets and Systems, 158: 2057 – 2077 Juha Vesanto, Johan Himberg, Esa Alhoniemi, Jaha Parhankangas, 2000 SOM Toolbox for Matlab 5, http://www.cis.hut.fi/projects/som-toolbox/ L.J.Cao and Francis E.H.Tay, 2003 Support vector machine with adaptive parameters in Financial time series forecasting, IEEE trans on neural network,vol 14, no Nahla Barakat, Andrew P Bradley, 2010 Rule extraction from support vector machines: A review, Neurocomputing – ELSEVIER, 74: 178–190 R Courant, D Hilbert,1953 Methods of Mathematical Physics, Wiley, New York S Chen, J Wang and D Wang, 2008 Extraction of fuzzy rules by using support vector machines, IEEE, Computer society: 438-441 Sheng-Hsun Hsu, JJ Po-An Hsieh, Ting-Chih CHih, Kuei-Chu Hsu, 2009 A two-stage architecture for stock price forecasting by integrating self-organizing map and support vector regression, Expert system with applications 36: 7947-7951 Wang-Hsin Hsu, Yi-Yuan Chiang, Wen-Yen Lin, Wei-Chen Tai, and Jung-Shyr Wu, 2009 SVM-based Fuzzy Inference System (SVM-FIS) for Frequency Calibration in Wireless Networks, CIT'09 Proceedings of the 3rd international conference on comminications and information technology: 207-213 17) Stuart Rusell, Perter Norvig, Artificial Intelligence: A Modern Approach, Second Editor, Prentice Hall Series in Artificial Intelligence, 2003 10.2 Danh mục cơng trình cơng bố thuộc lĩnh vực đề tài chủ nhiệm thành viên tham gia nghiên cứu (họ tên tác giả; báo; ấn phẩm; yếu tố xuất bản) 1) Ứng dụng mơ hình máy học Véc-tơ tựa (SVM) việc phân tích liệu điểm sinh viên Tạp chí Khoa học & Cơng nghệ Đại học Đà Nẵng Số 12(73).2013 Năm 2013 2) Improving the Interpretability of Support Vector Machines-based Fuzzy Rules Advances in Smart Systems Research, Future Technology Publications, PO Box 2115, United Kingdom ISSN: 20508662 No: Vol No 3013 3) A two-stage architecture for stock price forecasting by combining SOM and fuzzy-SVM International Journal of Computer Science and Information Security (IJCSIS), USA, ISSN: 19475500 No: Vol 12 No 8, 2014 4) Mơ hình hai giai đoạn dự báo giá cổ phiếu với K-mean Fuzzy-SVM Tạp chí Khoa học Cơng nghệ Đại học Đà Nẵng Số 12(84).2014 Năm 2014 5) Mơ hình tích hợp f-SVM tri thức tiên nghiệm cho toán dự báo hồi quy, Tạp chí Khoa học Đai học Huế Số T 106, S (2015) Năm 2015 6) Mô hình mờ TSK dự đốn giá cổ phiếu dựa máy học véc-tơ hỗ trợ hồi quy Tạp chí khoa học Trường Đai học Cần Thơ Số chuyên đề Công nghệ thơng tin (2015) Năm 2015 7) Tối ưu hóa mơ hình mờ TSK trích xuất từ máy học véc-tơ hỗ trợ hồi qui với tham số epsilon Tạp chí Khoa học Công nghệ Đại học Đà Nẵng Số 12(97).2015 Năm 2015 11 TÍNH CẤP THIẾT CỦA ĐỀ TÀI Sự khác biệt chủ yếu hệ thống mờ dựa máy học Véc-tơ hỗ trợ mơ hình máy học Véc-tơ hỗ trợ ngun thủy đặc tính “có thể diễn dịch được” (interpretability); đặc tính cho phép hệ thống mờ dễ hiểu so với mơ hình máy học Véc-tơ hỗ trợ Tuy nhiên, mô hình máy học Véc-tơ hỗ trợ, tính xác mơ hình thu tỷ lệ thuận với số lượng SVs (Support vectors) sinh ra, điều đồng nghĩa với việc số lượng luật mờ tăng lên Nói cách khác, tăng hiệu suất mơ hình đồng nghĩa với việc làm giảm tính “có thể diễn dịch được” mơ hình mờ trích xuất Giải pháp tích hợp tri thức tiên nghiệm vào mơ hình mờ dựa F-SVM giúp đảm bảo tính “có thể diễn dịch được” mơ hình mờ trích xuất 12 MỤC TIÊU ĐỀ TÀI Nghiên cứu xây dựng mơ hình dự báo gia cổ phiếu dựa tích hợp mơ hình mờ TSK hướng liệu (data-driven models) trích xuất từ máy học véc-tơ hỗ trợ với tri thức tiên nghiệm 13 ĐỐI TƯỢNG, PHẠM VI NGHIÊN CỨU 13.1 Đối tượng nghiên cứu - Mơ hình mờ TSK hướng liệu trích xuất từ máy học Véc-tơ hỗ trợ - Tri thức tiên nghiệm (a priori knowledge) - Mơ hình tích hợp Tri thức tiên nghiệm với mơ hình mờ trích xuất từ máy học Véc-tơ hỗ trợ - Mơ hình tích hợp nhiều giai đoạn cho toán dự báo giá cổ phiếu 13.2 Phạm vi nghiên cứu: Nâng cao hiệu dự báo giá cổ phiếu dựa mơ hình mờ dự báo hồi quy dựa việc tích hợp tri thức tiên nghiệm với mơ hình mờ trích xuất từ máy học Véc-tơ hỗ trợ 14 CÁCH TIẾP CẬN, PHƯƠNG PHÁP NGHIÊN CỨU 14.1 Cách tiếp cận: Tiếp cận từ thực tiễn lý thuyết - Tiếp cận thực tiễn: đưa vấn đề đánh giá kết - Tiếp cận lý thyết: đưa giải pháp 14.2 Phương pháp nghiên cứu: Từ kết trích xuất mơ hình mờ TSK cho toán thực tế kết nghiên cứu lý thuyết vai trò tri thức tiên nghiệm để đưa đến giải pháp tích hợp tri thức tiên nghiệm vào mơ hình; sau dề xuất mơ hình tích hợp nhiều giai đoạn cho tốn dự báo giá cổ phiếu 15 NỘI DUNG NGHIÊN CỨU VÀ TIẾN ĐỘ THỰC HIỆN 15.1 Nội dung nghiên cứu (trình bày dạng đề cương nghiên cứu chi tiết) 1) Nghiên cứu thuật tốn trích xuất mơ hình mờ từ máy học Véc-tơ hỗ trợ 2) Nghiên cứu vai trò Tri thức tiên nghiệm (a priori knowledge) mơ hình máy học 3) Giải pháp tích hợp Tri thức tiên nghiệm với mơ hình mờ trích xuất từ máy học Véc-tơ hỗ trợ 4) Nghiên cứu xây dựng mơ hình tích hợp nhiều giai đoạn cho toán dự báo giá cổ phiếu dưa Giải pháp tích hợp Tri thức tiên nghiệm với mơ hình mờ trích xuất từ máy học Véc-tơ hỗ trợ 15.2 Tiến độ thực STT Các nội dung, công việc thực Sản phẩm Nghiên cứu thuật tốn trích xuất Báo cáo mơ hình mờ từ máy học Véc-tơ hỗ trợ Nghiên cứu vai trò Tri thức Báo cáo tiên nghiệm (a priori knowledge) mơ hình máy học Thời gian (bắt đầu-kết thúc) Người thực 04/17 - 05/17 Nguyễn Hiển Đức 05/17 - 06/17 Nguyễn Đức Hiển Giải pháp tích hợp Tri thức tiên nghiệm với mơ hình mờ trích xuất từ máy học Véc-tơ hỗ trợ Xây dựng mơ hình tích hợp nhiều giai đoạn cho toán dự báo giá cổ phiếu dưa Giải pháp tích hợp Tri thức tiên nghiệm với mơ hình mờ trích xuất từ máy học Véc-tơ hỗ trợ Thuật toán số liệu 07/1 - 08/17 thực nghiệm Nguyễn Đức Hiển Mơ hình đề xuất 09/17 - 12/17 kết thực nghiệm Nguyễn Đức Hiển 16 SẢN PHẨM 16.1 Sản phẩm khoa học Bài báo đăng tạp chí nước ngồi Bài báo đăng tạp chí nước Bài đăng kỷ yếu hội nghị, hội thảo quốc tế Sản phẩm khác (giáo trình, tài liệu tham khảo… ) x 16.2 Sản phẩm đào tạo Cao học NCS 16.3.Sản phẩm ứng dụng Mẫu Giống trồng Tiêu chuẩn Tài liệu dự báo Phương pháp Dây chuyền công nghệ Vật liệu Giống vật nuôi Qui phạm Đề án Chương trình máy tính Báo cáo phân tích x Thiết bị máy móc Qui trình cơng nghệ Sơ đồ, thiết kế Luận chứng kinh tế Bản kiến nghị Bản quy hoạch 16.4 Các sản phẩm khác…………………………………………………… 16.5 Tên sản phẩm, số lượng yêu cầu khoa học sản phẩm Stt Tên sản phẩm Số lượng Yêu cầu khoa học Bài báo nước quốc tế 01 Chất lượng Thuật tốn (chương trình mô 01 phỏng) Báo cáo tổng kết 01 Đúng xác Chất lượng đầy đủ 17 HIỆU QUẢ (giáo dục đào tạo, kinh tế - xã hội) - Về mặt giáo dục - đào tạo: Giải pháp, thuật tốn mơ hình đề xuất đề tài cung cấp cho sinh viên nghiên cứu thực hành lĩnh vực thuật toán, khai phá liệu, xây dựng chương trình dự báo giá cổ phiếu - Về mặt khoa học: Kết đề tài đóng góp cho hướng nghiên cứu cải tiến, xây dựng phát triển mơ hình mờ hướng liệu, đặc biệt ứng dụng dự báo giá cổ phiếu 18 PHƯƠNG THỨC CHUYỂN GIAO KẾT QUẢ NGHIÊN CỨU VÀ ĐỊA CHỈ ỨNG DỤNG Thuật toán mơ hình cung cấp cho đối tượng quan tâm đến việc xây dựng mơ hình mờ hướng liệu dựa máy học Véc-tơ hỗ trợ, mô hình dự báo giá cổ phiếu Tư liệu phục vụ cho việc nghiên cứu cải tiến phát triển mơ hình mờ hướng liệu 19 KINH PHÍ THỰC HIỆN ĐỀ TÀI VÀ NGUỒN KINH PHÍ Tổng kinh phí: Trong đó: Ngân sách Nhà nước: 7.000.000 đồng Các nguồn kinh phí khác: Dự trù kinh phí theo mục chi (phù hợp với nội dung nghiên cứu): Stt I II III IV Khoản chi, nội dung chi Thời gian thực Chi công lao động tham gia trực tiếp thực 12 tháng đề tài Chi công lao động cán khoa học, nhân viên kỹ thuật trực tiếp tham gia thực đề tài Chi công lao động khác phục vụ triển khai đề tài Chi mua nguyên nhiên vật liệu Chi mua vật tư, nguyên, nhiên, vật liệu, tài liệu, tư liệu, số liệu, sách, tạp chí tham khảo, tài liệu kỹ thuật, bí công nghệ, tài liệu chuyên môn, xuất phẩm, dụng cụ bảo hộ lao động phục vụ công tác nghiên cứu Chi sửa chữa, mua sắm tài sản cố định Chi khác Cơng tác phí Hội nghị, hội thảo khoa học Văn phòng phẩm, in ấn, dịch tài liệu Quản lý phí quan quản lý Nghiệm thu cấp sở Phí xác lập quyền sở hữu trí tuệ Chi khác liên quan trực tiếp đến đề tài Tổng cộng Đơn vị tính: 1000 đồng Nguồn kinh phí Tổng kinh phí Kinh phí từ NSNN 4530 4530 3000 3000 1530 1530 2470 2470 0 1000 350 1120 0 0 1000 350 1120 0 7000 Các nguồn khác 7000 Ngày 20 tháng năm 2017 TM HỘI ĐỒNG KH&ĐT KHOA CNTT Ngày 20 tháng năm 2017 Chủ nhiệm đề tài (ký, họ tên) (ký, họ tên) Đà Nẵng, ngày…tháng…năm…… Cơ quan Chủ trì duyệt HIỆU TRƯỞNG Ghi DỰ TỐN KINH PHÍ ĐỀ TÀI KH&CN CẤP CƠ SỞ NĂM 2017 Tên đề tài: Mơ hình dự báo giá cổ phiếu dựa việc tích hợp mơ hình mờ TSK tri thức tiên nghiệm Đơn vị tính: 1000 đồng TT I II III IV Tổng số Nội dung khoản chi Nguồn kinh phí Kinh phí % Kinh phí từ NSNN 4530 64,7 4530 0 0 0 2470 7000 35,3 2470 7000 Chi công lao động tham gia trực tiếp thực đề tài Chi mua nguyên nhiên vật liệu Chi sửa chữa, mua sắm tài sản cố định Chi khác Tổng cộng Các nguồn khác Giải trình khoản chi Khoản I Chi công lao động tham gia trực tiếp thực đề tài TT Nội dung Chi công lao động tham gia trực tiếp thực đề tài Tổng kinh phí I.1 Xây dựng thuyết minh đề cương chi tiết 140 I.2 Nghiên cứu xây dựng sản phẩm đề tài 3340 I.3 Chuyên đề nghiên cứu lĩnh vực KHXH nhân văn Đơn vị tính: 1000 đồng Nguồn kinh phí Đơn vị Kinh phí Các tính từ nguồn NSNN khác Đề tài 140 3340 Chuyên đề - Chuyên đề loại - Chuyên đề loại I.4 Báo cáo tổng thuật tài liệu đề tài I.5 Lập mẫu phiếu điều tra; -Trong nghiên cứu KHCN -Trong nghiên cứu KHXH nhân văn: + Đến 30 tiêu + Trên 30 tiêu Phiếu mẫu duyệt I.6 Cung cấp thông tin : -Trong nghiên cứu KHCN -Trong nghiên cứu KHXH nhân văn: + Đến 30 tiêu + Trên 30 tiêu Phiếu I.7 Báo cáo xử lý, phân tích số liệu điều tra 210 Báo cáo 210 I.8 Báo cáo khoa học tổng kết đề tài (bao gồm báo cáo tồn văn báo cáo tóm tắt) I.9 Chun gia phân tích, đánh giá, khảo nghiệm kết quả, sản phẩm đề tài trước đánh giá nghiệm thu cấp sở (Số lượng chuyên gia cấp có thẩm quyền định, không 05 chuyên gia/đề tài) Báo cáo - Họp tổ chuyên gia (nếu có) Buổi họp 840 840 - Tổ trưởng - Thành viên - Đại biểu mời tham dự Cộng 4530 4530 Khoản II: Chi nguyên nhiên vật liệu TT Nội dung II.1 Nguyên, vật liệu II.2 Dụng cụ, phụ tùng II.3 Năng lượng, nhiên liệu II.4 Thuê thiết bị, dụng cụ Đơn vị đo Số lượng Đơn giá Đơn vị tính: 1000 đồng Nguồn kinh phí Tổng Kinh phí Các KP từ nguồn NSNN khác Cộng Khoản III: Chi sửa chữa, mua sắm tài sản cố định TT Nội dung Số lượng III.1 Mua thiết bị công nghệ phục vụ cho nghiên cứu (nếu có) III.2 Ghi danh mục cụ thể loại III.3 Mua thiết bị thử nghiệm, đo lường phục vụ cho nghiên cứu (nếu có); Ghi danh mục cụ thể loại Cộng Đơn giá Đơn vị tính: 1000 đồng Nguồn kinh phí Thành Kinh phí Các tiền từ nguồn NSNN khác Khoản IV: Chi khác Đơn vị tính: 1000 đồng Nguồn kinh phí TT Nội dung Chi khác Tổng kinh phí Đơn vị tính Kinh phí từ NSNN IV.1 Cơng tác phí IV.2 Hội thảo khoa học - Người chủ trì - Thư ký hội thảo - Báo cáo tham luận theo đơn đặt hàng - Đại biểu mời tham dự IV.3 Văn phòng phẩm, in ấn, dịch tài liệu IV.4 Quản lý phí quan quản lý 1000 1000 350 350 IV.5 Họp Hội đồng nghiệm thu thức Buổi họp - Chủ tịch Hội đồng 200 200 - Thành viên phản biện(x 2người) 460 460 - Thành viên, thư ký khoa học(x 2người) 360 360 - Thư ký hành 50 50 - Đại biểu mời tham dự 50 50 2470 2470 IV.6 Phí xác lập quyền sở hữu trí tuệ IV.7 Chi khác liên quan trực tiếp đến đề tài (nêu cụ thể) IV.8 Thù lao Chủ nhiệm đề tài IV.9 Thù lao cho thư ký, kế toán đề tài (nếu có) Cộng Cộng: I + II + III + IV = 4.530.000 + + + 2.470.000 = 7.000.000 (Bảy triệu đồng) Cơ quan Chủ trì HIỆU TRƯỞNG Chủ nhiệm đề tài (ký, họ tên) Các nguồn khác ... hình mờ trích xuất Giải pháp tích hợp tri thức tiên nghiệm vào mơ hình mờ dựa F-SVM giúp đảm bảo tính “có thể diễn dịch được” mơ hình mờ trích xuất Mơ hình mờ dự báo giá cổ phiếu dựa việc tích. .. giá cổ phiếu khứ hiện để phân tích dự báo Theo mơ hình dự báo giá cổ phiếu đề xuất Cao Tay [8], toán đặt dự báo giá cổ dự đoán giá cổ phiếu sau thời gian 5-ngày Tuy nhiên việc dự đoán giá cổ. .. CÔNG NGHỆ THÔNG TIN Độc lập - Tự - Hạnh phúc THUYẾT MINH ĐỀ TÀI KHOA HỌC & CÔNG NGHỆ CẤP CƠ SỞ (DO TRƯỜNG CAO ĐẲNG CÔNG NGHỆ THÔNG TIN QUẢN LÝ) TÊN ĐỀ TÀI: Mơ hình dự báo giá cổ phiếu dựa việc tích