1. Trang chủ
  2. » Tất cả

Mô hình hai giai đoạn dự đoán giá cổ phiểu với k means và fuzzy svm

5 5 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 5
Dung lượng 543,83 KB

Nội dung

20 Nguyễn Đức Hiển MÔ HÌNH HAI GIAI ĐOẠN DỰ ĐOÁN GIÁ CỔ PHIỂU VỚI K MEANS VÀ FUZZY SVM A TWO STAGE MODEL FOR STOCK PRICE FORECASTING BY COMBINING K MEANS WITH FUZZY SVM Nguyễn Đức Hiển Đại học Huế; Em[.]

Nguyễn Đức Hiển 20 MƠ HÌNH HAI GIAI ĐOẠN DỰ ĐOÁN GIÁ CỔ PHIỂU VỚI K-MEANS VÀ FUZZY-SVM A TWO-STAGE MODEL FOR STOCK PRICE FORECASTING BY COMBINING K-MEANS WITH FUZZY-SVM Nguyễn Đức Hiển Đại học Huế; Email: hiencit@gmail.com Tóm tắt - Bài báo đề xuất mơ hình dự đốn giá cổ phiếu kết hợp K-Means fuzzy - Support Vector Machines (fuzzy-SVM) Việc trích xuất tập luật mờ từ liệu thô dựa vào kết hợp mơ hình học thống kê sở mơ hình đề xuất Kiến trúc mơ hình gồm hai giai đoạn, giai đoạn áp dụng thuật tốn K-means để phân chia khơng gian liệu đầu vào thành nhiều cụm riêng biệt Ở giai đoạn hai, với phân vùng liệu đầu vào, mô hình fuzzy-SVM (thuật tốn f-SVM) sử dụng để khai phá luật mờ sử dụng cho hệ thống dự đốn Mơ hình đề xuất áp dụng dự đoán cho số mã cổ phiếu thị trường chứng khốn Việt Nam Các thơng số đánh giá kết thực nghiệm giới thiệu, có so sánh với kết số mơ hình khác Abstract - This paper proposes a model for stock price forecasting via a combination of K-Means and fuzzy– Support Vector machines (fuzzy-SVM) The extraction of fuzzy rules from raw data based on the combination of statistical machine learning models is the foundation of this proposed approach The architecture of the proposed model includes two stages: the first stage is using KMeans algorithm to partition the whole input space into several disjoint regions In the second stage, the fuzzy-SVM model (f-SVM alogorithm) is used to extract fuzzy rules from each partition of input data Then, the proposed model is applied in predicting some of stock codes of Vietnam’s stock market The experiment results are presented in comparison with the results of the other approaches Từ khóa - dự đốn giá cổ phiếu; mơ hình mờ; mơ hình mờ hướng liệu; luật mờ; máy học Véc-tơ hỗ trợ; K-Means Key words - stock price forecasting; fuzzy model; data-driven fuzzy models; fuzzy rules; support vector machine; K-Means Đặt vấn đề Vấn đề dự đoán theo chuỗi thời gian, mà đặc biệt vấn đề dự đoán thị trường chứng khoán thu hút nhiều quan tâm nghiên cứu nhà khoa học Có nhiều mơ hình giải pháp khác nhà nghiên cứu đề xuất, với mục tiêu cuối nâng cao tính xác kết dự đốn Vấn đề dự đoán thị trường chứng khoán chủ yếu tiếp cận hai dạng, dự đoán giá cổ phiếu xu hướng giá cổ phiếu sau n-ngày Những hướng tiếp cận phổ biến cho vấn đề dự đoán thị trường chứng khốn khai phá liệu, ứng dụng mơ hình máy học thống kê [3] Những nghiên cứu [7], [8], [14], [16], [17] đề xuất ứng dụng mạng nơ-ron nhân tạo, máy học véc-tơ hỗ trợ (SVM – Support Vector Machine), mơ hình markov ẩn (HMM – Hidden Markov Model) dự đoán thị trường chứng khoán Những mơ hình theo hướng cải tiến kết hợp nhiều phương thức học khác để nâng cao hiệu dự đoán [4], [9], [11] tác giả nghiên cứu đề xuất Mơ hình dự đốn dựa tập mờ trích xuất từ máy học Véc-tơ hỗ trợ giới thiệu hướng nghiên cứu mơ hình mờ - mơ hình mờ hướng liệu (data-driven fuzzy models) [5], [6], [10] Một hạn chế mơ hình mờ hướng liệu vấn đề học từ động từ liệu huấn luyện với kích thước lớn thiếu tính đặc trưng Với mục tiêu hướng đến giải vấn đề kích thước liệu lớn, đồng thời tạo điều kiện thuận lợi cho chuyên gia người hiểu phân tích tập luật mờ học từ liệu, qua điều chỉnh, tiến tập luật, nâng cao hiệu dự đoán, nghiên cứu này, đề xuất mô hình giai đoạn dự đốn giá cổ phiếu dựa kết hợp K-Means f-SVM Các phần báo bao gồm: phần trình bày sơ lược mơ hình trích xuất luật mờ từ SVM- thuật tốn fSVM Trong phần 3, chúng tơi đề xuất mơ hình hai giai đoạn dự đốn giá cổ phiếu kết hợp K-Means f-SVM Phần trình bày kết thực nghiệm mơ hình đề xuất, có kết hợp so sánh với số kết mơ hình khác Cuối cùng, phần nêu lên số kết luận định hướng nghiên cứu Mô hình trích xuất luật mờ từ SVM Máy học véc-tơ hỗ trợ SVM Vapnik giới thiệu năm 1995, mơ hình học dựa lý thuyết học thống kê (Statistical Learning Theory) [1] kỹ thuật đề nghị để giải cho toán phân lớp Một số nghiên cứu gần [2], [4], [6] đề xuất sử dụng SVM giải tốn tối ưu hóa hồi quy; đồng thời SVM sử dụng để khai phá luật mờ từ liệu số [2], [3], [5] Với vai trò giải vấn đề tối ưu hóa hồi quy, lý thuyết SVM vắn tắt sau [22]: Cho tập liệu huấn luyện {(x1 , y1 ), … , (xl , yl )} ⊂ 𝒳 × ℝ, 𝒳 xác định miền liệu đầu vào Mục tiêu ε-SV hồi quy (ε-Support Vector Regression) tìm siêu phẳng qua tất phần tử liệu huấn luyện, đồng thời độ sai lệch yi tập liệu huấn luyện không lớn ε Trong trường hợp hồi quy phi tuyến, hàm định f(x) xác định sau: f(x) = ∑li=1(αi − α∗i ) K(xi , x) + b Sao cho: (1) ∑li−1(αi − α∗i ) = 0, and C ≥ αi , α∗i ≥ 0, ∀i, (2) ∗ Trong đó, C số chuẩn tắc, αi , αi nhân tử Lagrange; K (xi , x) hàm Kernel định nghĩa sau: ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 12(85).2014, QUYỂN K(xi , xj ) = 〈Φ(xj ), Φ(xj )〉 (3) với Φ ánh xạ thuộc tính cho kernel K Những điểm đầu vào xi với (αi − α∗i ) ≠ gọi véc-tơ hỗ trợ (SVs) Bên cạnh đó, ta biết luật mờ (fuzzy rules) biểu diễn dạng IF – THEN, sở phép suy luận mờ [2] Giả sử có m luật mờ biểu diễn sau: j j j R j : IF x1 is A1 and x2 is A2 and … and xn is An THEN y is Bj , for j = 1, 2, … , m (4) Trong xi (i = 1,2, … n) biến điều kiện; y j j j biến định hệ thống mờ; Ai B thuật ngữ ngữ nghĩa xác định hàm thành viên (membership functions) tương ứng μAj (xi ) μBj (y) Như cách biến đổi [2], hàm suy luận mờ viết lại sau: xj −x j f(x) = ∑lj=1 z exp (− ( f(x) = j n ∑M j=1 z (∏i=1 μAj (xi )) i n ∑M j=1 ∏i=1 μAj (xi ) i Mơ hình hai giai đoạn dự đoán giá cổ phiếu Huấn luyện Part Lựa chọn Dữ liệu thuộc tính vào liệu vào Phân cụm liệu K-Means xi −x σi ) ) (6) xj −x j f(x) = ∑lj=1 z exp(− ( ) ) σj xj −x (7) ∑lj=1 exp(− ( ) ) σj Begin Khởi tạo tham số SVMs Centers : 𝑐𝑖 , 𝑖 = 𝑚 Variances :𝜎𝑖 , 𝑖 = 𝑚 Trích xuất luật mờ từ SVMs IF x is Gaussmf(𝜎𝑖 , 𝑠𝑣𝑖 ) THEN y is B Tối ưu hóa (𝑥 − 𝑐)2 (𝑥 − 𝑐)2 𝜎𝑖 (𝑡 + 1) = 𝜎𝑖 (𝑡)𝛿𝜀1,𝑖 ቈ 𝑒𝑥𝑝 (− )቉ 𝑐𝑖 (𝑡 + 1) 𝜎3 2𝜎 (𝑥 − 𝑐)2 −(𝑥 − 𝑐) = 𝑐𝑖 (𝑡)𝛿𝜀1,𝑖 ቈ 𝑒𝑥𝑝 (− )቉ 𝜎2 2𝜎 End Hình Sơ đồ khối thuật toán f-SVM F-SVM Part F-SVM Part n-1 Part n j f(x) = ∑li=1(αi − α∗i )exp (− ( (8) j z = (αi − α∗i ) (9) Trên sở đồng hàm đầu SVMs hệ thống mờ, xây dựng thuật tốn cho phép trích xuất tập luật mờ từ máy học SVM - thuật toán f-SVM [22] (Hình 1) (5) Trong đó, z giá trị đầu hàm thành viên μBj (y) đạt giá trị cực đại Để (1) (5) nhau, trước tiên phải đồng hàm kernel (1) hàm thành viên (5) Ở đây, để thỏa mãn điều kiện Mercer [15] hàm thành viên Gaussian chọn làm hàm kernel; đồng thời giá trị b (1) phải Khi hàm Gaussian chọn làm hàm thành viên (1) hàm kernel (5), đồng thời số luật mờ m với số Support vectors l (1) (5) biến đổi thành: σj ) ) trung tâm hàm thành viên Gaussian chọn i Kết đầu suy luận xác định công thức sau [22]: 21 Các tập luật mờ F-SVM n-1 F-SVM n Dự đoán Part Phân cụm liệu K-Means Suy luận Các tập luật mờ Giá trị dự đốn Part n Hình Mơ hình hai giai đoạn Dự đoán giá cổ phiếu dựa vào liệu khứ toán dự đoán chuỗi thời gian không ổn định (nonstationary), nghĩa phân bố thống kê liệu không ổn định theo thời gian Để nâng cao hiệu dự đoán, liệu đầu vào phải thu thập thời gian dài, thuộc tính liệu phải bao phủ nhiều tốt trường hợp toán; thuật toán học suy luận phải thực tập liệu lớn Để khắc phục trở ngại này, đề xuất mơ hình hai giai đoạn cách kết hợp kỹ thuật phân cụm K-Means mơ hình trích xuất luật mờ f-SVM Sơ đồ khối mơ hình thể Hình Với mơ hình này, trước tiên liệu đầu vào phân cụm K-Means để gom mẫu liệu gần giống (có phân bố thống kê gần giống nhau) vào cụm (cluster); sau cụm liệu dùng để huấn luyện cho mơ hình f-SVM để trích xuất tập luật tương ứng 3.1 Lựa chọn thuộc tính đầu vào Theo kết nghiên tác giả khác việc dự đốn thị trường chứng khốn, có nhiều cách khác để lựa chọn thuộc tính đầu vào, ví dụ như: sử dụng số kinh tế vi mô [1], sử dụng số giá cổ phiếu hàng ngày [8], [17],… Ở mơ hình này, lựa chọn số giá cổ phiếu hàng ngày làm liệu vào Tuy nhiên, tập liệu vào tiền xử lý trước đưa vào huấn luyện cho mơ hình Theo phân tích đánh giá L J Cao Francis Nguyễn Đức Hiển 22 E.H Tay [8], việc chuyển đổi số giá ngày thành tỷ lệ khác biệt trung bình ngày (5-day relative difference in percentage of price – RDP) mang lại số hiệu định, đặc biệt cải thiện hiệu dự đoán Trong mơ này, chúng tơi lựa chọn biến đầu vào dựa theo đề xuất tính tốn L J Cao Francis E H Bảng thể thuộc tính lựa chọn cơng thức tính chúng ứng để trích xuất luật mờ Trong mơ hình thực nghiệm, chúng tơi sử dụng thuật tốn học SVM thư viện LIBSVM, phát triển nhóm Chih-Chung Chang [18], để sản sinh SVs; sở chúng tơi xây dựng thuật tốn f-SVM để trích xuất tập luật mờ Các luật mờ trích xuất có dạng Bảng Bảng Dạng tập luật mờ trích xuất Bảng Cơng thức tính tốn thuộc tính lựa chọn Ký hiệu Thuộc tính EMA100 𝑥1 Cơng thức tính 𝑃𝑖 − ̅̅̅̅̅̅̅̅̅̅̅̅̅̅ 𝐸𝑀𝐴100 (𝑖) 𝑥2 RDP-5 (𝑃(𝑖) − 𝑃(𝑖 − 5))/𝑃(𝑖 − 5) ∗ 100 𝑥3 RDP-10 (𝑃(𝑖) − 𝑃(𝑖 − 10))/𝑃(𝑖 − 10) ∗ 100 𝑥4 RDP-15 (𝑃(𝑖) − 𝑃(𝑖 − 15))/𝑃(𝑖 − 15) ∗ 100 𝑥5 RDP-20 𝑦 RDP+5 (𝑃(𝑖) − 𝑃(𝑖 − 20))/𝑃(𝑖 − 20) ∗ 100 ̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅ ∗ 100 (𝑃(𝑖 + 5) − ̅̅̅̅̅̅ 𝑃(𝑖))/𝑃(𝑖) ̅̅̅̅̅̅ ̅̅̅̅̅̅̅̅̅̅̅ 𝑃(𝑖) = 𝐸𝑀𝐴3 (𝑖) Trong đó, P(i) số giá đóng phiên ngày thứ i, EMAm (i) m-day exponential moving average giá đóng phiên ngày thứ i 3.2 Phân cụm liệu đầu vào K-Means Dữ liệu đầu vào ứng dụng khai phá liệu thường lớn, có nhiều thuật tốn học khơng hiệu với kích thước liệu lớn Một hướng tiếp cận vấn đề phân liệu đầu vào thành cụm nhỏ, áp dụng thuật toán học cụm liệu sau tổng hợp kết học lại [13] Ngoài ra, đặc điểm đáng lưu ý giá cổ phiếu tính khơng ổn định theo thời gian Phân bố thống kê giá cổ phiếu theo thời gian phụ thuộc vào nhiều yếu tố khác tăng trưởng hay suy thối kinh tế, tình hình trị, mơi trường, thiên tai,… Điều gây nên nhiều hạn chế cho việc tìm quy tắc dự đoán giá cổ phiếu dựa liệu khứ Như vậy, giải pháp phân cụm liệu theo phân bố thống kê chúng làm giảm tính bất ổn định xét cụm liệu riêng biệt Thuật toán phân cụm K-Means (K-Means clustering) MacQueen giới thiệu năm 1967 [12] K-Means clustering thuật toán dùng tốn phân loại/ nhóm n đối tượng thành k nhóm dựa đặc tính/ thuộc tính đối tượng (k, n nguyên, dương) Trong báo mong muốn phân tích đánh giá thuật tốn K-Means, lý thuyết chi tiết K-Means tham khảo tài liệu [12] Phương pháp sử dụng K-Means để phân cụm liệu giá cổ phiếu nhiều tác giả giới thiệu sử dụng [19], [20], [21] Trong khuôn khổ nghiên cứu này, đề xuất sử dụng thuật toán K-Means để phân chia mẫu dự liệu đầu vào thánh k cụm riêng biệt, k số xác định trước Trong mơ hình thực nghiệm, chúng tơi sử dụng thuật toán phân cụm K-Means thư viện Statistics Toolbok công cụ MATLAB 2012b Giá trị số k chọn thủ công cách thử nhiều lần để đạt kết dự đoán tốt 3.3 Trích xuất luật mờ thuật tốn f-SVM Mỗi cụm liệu vào phân tách K-Means đưa vào huấn luyện cho máy f-SVM tương Luật Chi tiết R1 IF x1=Gaussmf (sv11, σ11) and … xi=Gaussmf (sv1i, σ1i) and … THEN y=B1 R2 IF x1=Gaussmf (sv21, σ21) and … xi=Gaussmf (sv2i, σ2i) and … THEN y=B2 … … Rm IF x1=Gaussmf (svm1, σm1) and … xi=Gaussmf (svmi, σmi) and … THEN y=Bm 3.4 Dự đoán giá cổ phiếu dựa tập luật trích xuất Các tập luật mờ trích xuất từ máy f-SVM tương ứng với cụm liệu huấn luyện sử dụng để suy luận dự đoán giá cổ phiếu Với tập luật mờ phân thành nhiều cụm với kích thước nhỏ làm giảm độ phức tạp thuật toán suy luận mờ Những luật mờ khai phá từ liệu biểu diễn dạng có khoảng cách định hiểu biết chuyên gia người; nhiên việc phân cụm luật mờ khai phá điều kiện để chuyên gia người ngữ nghĩa hóa từ hiểu đánh giá luật Kết thực nghiệm Nguồn liệu thực nghiệm chọn ngẫu nhiên từ mã cố phiếu có lịch sử giao dịch tương đối dài bao gồm: TTC (Công ty cổ phần Gạch men Thanh Thanh), SGH (Cơng ty Cổ phần Khách sạn Sài Gịn), DXP (Công ty cổ phần Cảng Đoạn xá); số hai sàn giao dịch chứng khoán Việt Nam VNINDEX HASTC (Bảng 3) Các liệu lấy từ nguồn liệu lịch sử sàn chứng khốn Việt Nam, thơng qua website http://www.cophieu68.vn/ Bảng Nguồn liệu thực nghiệm Tên cổ phiếu Thời gian Công ty cổ phần Gạch men 08/08/2006 Thanh Thanh (TTC) 16/04/2014 Cơng ty Cổ phần Khách 16/07/2001 sạn Sài Gịn (SGH), 08/04/2014 Công ty cổ phần Cảng 16/12/2005 Đoạn xá (DXP) 16/04/2014 28/07/2000 VNINDEX 16/04/2014 01/01/2006 – HASTC 16/04/2014 Dữ liệu training Dữ liệu testing 1520 200 1780 200 1610 200 2800 200 1700 200 Các tập liệu training dùng để trích xuất tập luật mờ Bảng thể nhóm luật mờ trích xuất từ liệu training mã cổ phiếuTTC Bằng cách sử dụng hàm AVALFIS thư viện công cụ Matlab Fuzzy Logic, thử nghiệm suy luận ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 12(85).2014, QUYỂN dựa tập luật sản xuất tập liệu testing Bên cạnh chúng tơi thử nghiệm dự đốn liệu với mơ hình đề xuất tác giả khác, bao gồm RBN, SVM mơ hình kết hợp K-Means+SVM Mơ hình RBN xây dựng dựa mạng neural hồi qui Generalized kiểu Radial Basis Network (RBN) Mạng neural hồi qui Generalized đề xuất giải tốn dự đốn [7], [14], [16] Mơ hình K-Means+SVM mơ hình dựa kết hợp K-Means SVM, đề xuất để dự đoánxu hướng cổ phiếu [19] Hiệu mô hình so sánh đánh giá dựa ba thông số, gồm NMSE (Nomalized Mean Squared Error), MAE (Mean Absolute Error), DS (Directional Symmetry) Trong đó, NMSE MAE đo lường độ lệch giá trị thực tế giá trị dự đoán, DS đo lường tỷ lệ dự đoán xu hướng giá trị RDP+5 Giá trị tương ứng NMSE MAE nhỏ DS lớn chứng tỏ mơ hình dự đốn tốt 23 mơ hình RBN SVM Điều chứng tỏ độ sai lệch giá trị dự đoán giá trị thực tế mơ hình đề xuất so với hai mơ hình Bên cạnh đó, ta thấy giá trị thơng số DS mơ hình đề xuất lớn so với mơ hình RBN SVM, chứng tỏ tỷ lệ dự đốn xu hướng mơ hình đề xuất cao so với hai mơ hình R2 IF x1=Gaussmf(0.10,-0.01) and x2=Gaussmf(0.09,-0.06) and x3=Gaussmf(0.10,0.04) and x4=Gaussmf(0.10,-0.10) and x5=Gaussmf(0.10,-0.12) THEN y=0.57 R3 IF x1=Gaussmf(0.09,0.02) and x2=Gaussmf(0.10,0.02) and x3=Gaussmf(0.09,0.08) and x4=Gaussmf(0.10,-0.08) and x5=Gaussmf(0.10,-0.13) THEN y=-0.02 R4 IF x1=Gaussmf(0.10,-0.04) and x2=Gaussmf(0.10,-0.08) and x3=Gaussmf(0.10,0.02) and x4=Gaussmf(0.09,-0.08) and x5=Gaussmf(0.09,-0.11) THEN y=-0.29 So sánh kết mơ hình K-Means+f-SVM đề xuất với mơ hình K-Means+SVM (Bảng 5b), ta thấy giá trị thông số hai mơ hình tương đương Điều dễ dàng lý giải được, thuật tốn f-SVM đề xuất rút trích tập luật mờ dùng cho mơ hình dự đốn từ máy SVMs, mơ hình dự đốn đề xuất kết hợp K-Means f-SVM thừa hưởng hiệu mơ hình K-Means+SVM điều tất yếu Tuy nhiên, so với mơ hình dự đốn K-Means+SVM mơ hình dự đốn đề xuất có ưu điểm sau: - Mơ hình dự đốn K-Means+SVM mơ hình “hộp đen” người dùng cuối, mơ hình đề xuất cho phép trích xuất tập luật mờ trình suy luận thực tập luật Đối với người dung cuối mơ hình suy luận dựa tập luật mờ dễ hiểu sáng tỏ hơn; - Trên sở tập luật mờ trích xuất được, chuyên gia người đọc hiểu điều chỉnh, bổ sung tập luật luật chuyên gia để nâng cao hiệu suy luận dựa tập luật; - Ngoài việc áp dụng K-Means để phân cụm liệu đầu vào thành tập nhỏ riêng biệt, bên cạnh hiệu mang lại giảm kích thước liệu vào từ làm giảm độ phức tạp thuật toán, tập luật sinh phân thành cụm riêng biệt tương ứng Điều góp phần giúp cho chuyên gia người đọc hiểu phân tích luật mờ học dễ dàng R5 IF x1=Gaussmf(0.10,-0.03) and x2=Gaussmf(0.09,-0.06) and x3=Gaussmf(0.10,0.03) and x4=Gaussmf(0.09,-0.10) and x5=Gaussmf(0.09,-0.13) THEN y=-0.38 Kết luận Bảng Một nhóm luật mờ trích xuất ứng với mã cổ phiểu TTC Luật Chi tiết R1 IF x1=Gaussmf (0.09,-0.11) and x2=Gaussmf (0.09,-0.12) and x3=Gaussmf(0.09,-0.04) and x4=Gaussmf(0.09,-0.10) and x5=Gaussmf(0.09,-0.09) THEN y=0.10 Bảng 5a Kết dự đoán theo mơ hình RBN, SVM Mã cổ phiếu NMSE MAE DS NMSE MAE HASTC 0,9039 0,0184 39,30 0,9278 0,0191 38,31 VN INDEX 1,0910 0,0115 34,31 1,0725 0,0110 34,33 TTC 1,2211 0,0391 39,80 1,2687 0,0394 38,90 SGH 1,1120 0,0604 38,46 1,1015 0,0576 38,31 DXP 1,2197 0,0244 39,80 1,2073 0,0242 39,83 RBN SVM DS Bảng 5b Kết dự đoán theo mơ hình K-Means+SVM, K-Means+F-SVM Mã cổ phiếu HASTC K-Means+SVM K-Means+F-SVM Số cụm NMSE MAE DS NMSE MAE DS 0,9057 0,0188 41,71 0,7601 0,0164 44,72 VNIND EX 1,1726 0,0109 42,68 1,1408 0,0108 42,21 TTC 1,1358 0,0392 42,71 1,1390 0,0391 42,81 SGH 1,0792 0,0573 41,71 1,0909 0,0646 42,71 DXP 1,1138 0,0258 45,72 1,1281 0,0254 45,22 Với kết thực nghiệm dự đoán 200 mẫu liệu testing thể Bảng ta thấy, mã cổ phiếu, giá trị thông số MNSE MAE mơ hình K-Means+f-SVM (Bảng 5a) đề xuất nhỏ so với Trong nghiên cứu đề xuất mơ hình dự đốn giá cổ phiếu dựa kết hợp K-Means f-SVM Kết thực nghiệm liệu thử nghiệm cho thấy mơ hình đề xuất thật mạng lại hiệu dự đốn cao so với mơ hình đơn RBN, SVM trước tác giả khác, thể qua giá trị tốt thông số NMSE, MAE DS Đồng thời, với giải pháp kết hợp phân cụm K-Means mơ hình giúp cải thiện đáng kể thời gian thực thuật tốn mơ hình Mặt khác, trình bày phần 4.2 báo, hiệu mang lại mơ hình đề xuất việc gom cụm luật mờ trích xuất được, hình thức chia nhỏ tập luật, giúp cho việc phân tích luật dễ dàng Bên cạnh ưu điểm nêu trên, mô hình đề xuất cịn tồn định, vấn đề tồn thuật tốn trích xuất luật mờ từ máy học SVM Cụ thể máy học SVM, tăng tính xác mơ hình số lượng SVs tăng lên, đồng nghĩa với số lượng luật mờ tăng lên Điều làm cho tính phức tạp hệ thống tăng lên đặc biệt tính “có thể hiểu được” tập luật mở giảm đi, gây nên khó khăn cho chuyên gia người để hiểu phân tích luật Việc nghiên cứu tìm tìm giải pháp cải thiện tính “có thể hiểu được” tập luật mờ trích xuất từ SVMs định hướng nghiên cứu Nguyễn Đức Hiển 24 TÀI LIỆU THAM KHẢO [1] Christan Pierdzioch, Jorg Dopke, Daniel Hartmann, Forecasting stock market volatility with macroeconomic variables in real time, Journal of Economics and Business 60, 256-276 (2008) [2] Corinna Cortes and Vladimir Vapnik, Support-Vector Networks, Machine Learning, 20, 273-297 (1995) [3] Hajizadeh E., Ardakani H D., Shahrabi J., Application Of Data Mining Techniques In Stock Markets: A Survey, Journal of Economics and International Finance Vol 2(7), 109-118 (2010) [4] Francis Eng Hock Tay and Li Yuan Cao, Improved financial time series forecasting by combining Support Vector Machines with self-organizing feature map, Intelligent Data Analysis 5, 339-354, IOS press (2001) [5] J.-H Chiang and P.-Y Hao, Support vector learning mechanism for fuzzy rule-based modeling: a new approach, IEEE Trans On Fuzzy Systems, vol 12, pp 1-12 (2004) [6] J L Castro, L D Flores-Hidalgo, C J Mantas and J M Puche, Extraction of fuzzy rules from support vector machines, Elsevier Fuzzy Sets and Systems, 158, 2057 – 2077 (2007) [7] Kreesuradej W., Wunsch D., Lane M., Time-delay Neural Network For Small Time Series Data Sets, in World Cong, Neural Networks, San Diego, CA (1994) [8] L J Cao and Francis E H Tay, Support vector machine with adaptive parameters in Financial time series forecasting, IEEE trans on neural network, vol 14, no (2003) [9] Md Rafiul Hassan, Baikunth Nath, Michael Kirley, A fusion model of HMM, ANN and GA for stock market forecasting, Expert Systems with Applications 33, 171–18 (2007) [10] S Chen, J Wang and D Wang, Extraction of fuzzy rules by using support vector machines, IEEE, Computer society, pp 438-441 (2008) [11] Sheng-Hsun Hsu, JJ Po-An Hsieh, Ting-Chih CHih, Kuei-Chu Hsu, A two-stage architecture for stock price forecasting by integrating self-organizing map and support vector regression, Expert system with applications 36, 7947-7951 (2009) [12] MacQueen J B., Some Methods for classification and Analysis of Multivariate Observations, Proceedings of 5-th Berkeley [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1:281-297 (1967) T G Dietterich, Machine learning research: Four current directions, AI Magazine, 18(4), 97-136 (1997) Younes Chtioui, Suranjan Panigrahi, Leonard Francl, A generalized regression neural network and its application for leaf wetness prediction to forecast plant disease, Chemometrics and Intelligent Laboratory System 48, 47-58 (1999) R Courant, D Hilbert, Methods of Mathematical Physics Wiley, New York (1953) Iffat A Gheyas, Leslies S Smith, A Neural network approach to time series forecasting, Proceeding of the World congress on Engineering 2009, Vol II (2009) Md Rafiul Hassan and Baikunth Nath, Stock market forecasting using Hidden markov model: A new approach, 5th International conference on intelligent system design and applications (ISDA’05) (2005) Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen lin, A practical Guide to Support Vector Classification http://www.csie.ntu.edu.tw/ ~cjlin/libsvm/ (2010) Vạn Duy Thanh Long, Lê Minh Duy, Nguyễn Hoàng Tú Anh, Phương pháp dự đoán xu hướng cổ phiếu dụa việc kết hợp Kmean SVM với ước lượng xác suất lớp, Đại học quốc gia – Tp HCM (2011) Keerthiram Murugesan Jun Zhang, Hybrid Bisect K-Means Clustering Algorithm, Proceeding of BCGIN '11 Proceedings of the 2011 International Conference on Business Computing and Global Informatization, 216-219 (2011) Pei-Chann Chang and Chin-Yuan Fan, A Hybrid System Integrating a Wavelet and TSKFuzzy Rules for Stock Price Forecasting, IEEE Transactions on systems, MAN, And Cybernetics – Part C: Applications and reviews, vol 38, No (2008) Nguyễn Đức Hiển, Ứng dụng mơ hình máy học Véc-tơ tựa (SVM) phân tích liệu điểm sinh viên, Tạp chí Khoa học Cơng nghệ - Đại học Đà Nẵng, 12(73).2013, 33-37 (2013) (BBT nhận bài: 23/08/2014, phản biện xong: 10/10/2014) ... dùng cho mơ hình dự đốn từ máy SVMs, mơ hình dự đốn đề xuất k? ??t hợp K- Means f -SVM thừa hưởng hiệu mơ hình K- Means+ SVM điều tất yếu Tuy nhiên, so với mơ hình dự đốn K- Means+ SVM mơ hình dự đốn đề... Generalized đề xuất giải toán dự đốn [7], [14], [16] Mơ hình K- Means+ SVM mơ hình dựa k? ??t hợp K- Means SVM, đề xuất để dự đoánxu hướng cổ phiếu [19] Hiệu mơ hình so sánh đánh giá dựa ba thông số, gồm NMSE... 1,2197 0,0244 39,80 1,2073 0,0242 39,83 RBN SVM DS Bảng 5b K? ??t dự đốn theo mơ hình K- Means+ SVM, K- Means+ F -SVM Mã cổ phiếu HASTC K- Means+ SVM K- Means+ F -SVM Số cụm NMSE MAE DS NMSE MAE DS 0,9057 0,0188

Ngày đăng: 27/02/2023, 19:28

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w