Với sự phát triển ngày càng mạnh mẽ của sức mạnh tính toán và các thuật toán máy học, phương pháp dự đoán giá cổ phiếu bằng các kỹ thuật máy học đang là một hướng tiếp cận thu hút được nhiều s ự quan tâm của cộng đồng nghiên cứu trong thời gian gần đây.Ưu điểm củ a hướng tiếp cận này là không cần phải có nhiều kinh nghiệm cũn g như là kiến th ức nghiệp vụ về thị trường cổ phiếu. Ta chỉ cần có bộ dữ liệu cổ phiếu quá khứ, sau đó sẽ sử dụng các mô hình máy học để tự động tìm ra mối quan hệ giữa giá cổ phiếu trong tương lai với dữ liệu q uá khứ.
Như đã nói, s ự biến động của giá cả cổ phiếu rất phức tạp, nhiễu loạn và không ổn định. Do đó, nếu ta chỉ đơn giản sử dụng các mô hình máy học tuyến tính thì khó có thể d ự đoán thành công được. Cần phải sử dụng các mô hình có thể biễu diễn được mối quan hệ ph i tuyến giữa đầu ra với đầu vào. Bên cạnh đó, sự biến động của giá cổ phiếu diễn ra khác nhau ở các thị trường cổ phiếu khác nhau và ở các mã cổ phiếu khác nhau. Vì vậy, các mô hình này cũng cần hướng dữ liệu (data- driven ), để cho dữ liệu tự nói lên tính chất của nó, không có giả thiết ban đầu về sự phân bố của dữ liệu.
Mạng nơ ron nhân tạo (Artificial Neural Network - ANN) là một mô hình máy học thỏa các tính chất trên nên được tập trung nghiên cứu nhiều. Tuy nhiên, nhược điểm của ANN là d ễ b ị quá khớp, dễ bị bẫy vào tối ưu cục bộ và s ố lượng tham số tự do nhiều (số tầng ẩn, số node tầng ẩn, hệ số học, momentu m).
Gần đây, cộng đồng nghiên cứu đang có xu hướng tập trung vào một kỹ thuật mớ i: hồi qui véc tơ hỗ trợ (Support Vector Regress ion - S VR). Nguồn gốc của SVR là máy véc tơ h ỗ trợ (Support Vector Machine – SVM). S VM do Vapnik và các đồng nghiệp phát triển vào năm 1995, ban đầu được dùng cho bài toán phân lớp, về
32
sau mở rộ ng cho bài toán hồi qui và được gọi là SVR. Nhiều nghiên cứu gần đây cho thấy SVR cho kết quả tốt hơn A NN trong bài toán dự đoán giá cổ phiếu. Đó là do SVR s ử dụng nguyên lý tối thiểu hóa rủi ro cấu trúc nên tránh được vấn đề quá khớp và có khả năng tổng quát hóa cao hơn A NN. Giải pháp củ a SVR là giải pháp tối ưu toàn cục, trong khi đó giải pháp của A NN là giải pháp tối ưu cục bộ. Bên cạnh đó, s ố lượng tham số tự do của SVR cũng ít hơn s o với ANN.
Nhằm nâng cao độ chính xác dự đoán, xu hướng phổ biến hiện nay là la i ANN hay SVR với các kỹ thuật trí tuệ nhân tạo khác. Đã có rất nhiều các mô hình lai được đề xuất, trong đó ta có thể phân ra làm 4 nhóm ch ính:
Nhóm 1: Chia để trị (áp dụng nguyên tắc phân nhỏ). Các mô hình đề xuất trong nhóm này kết hợp A NN hay SVR với thuật toán gom cụm. Ý tưởng này xuất phát từ nhận xét về tính không ổn định của chuỗi giá cổ phiếu làm ch o mối quan hệ g iữa đầu ra với đầu vào (chẳng hạn mối quan hệ giữa giá ngày mai với giá của các ngày trước đó) không cố định. Vì vậy, để thể hiện được mối quan hệ giữa đầu ra với đầu vào, ta không thể chỉ đơn giản dùng một mô hình ANN hay SVR mà cần dùng nhiều mô hình ANN hay SVR. Khi đó, quá trình huấn luyện được chia làm hai giai đoạn như s au:
o Đầu tiên, dùng thuật toán gom cụ m để phân chia dữ liệu thành các cụm. Bằng cách này, các điểm dữ liệu trong mỗi cụm s ẽ có tính chất tương tự nhau.
o Kế đến, xây d ựng cho mỗi cụm một mô hình dự đoán.
Khi có một điểm dữ liệu mới, trước h ết cần xác định xem nó thuộc cụm nào, sau đó s ẽ sử dụng mô hình dự đoán của cụm đó để tiến hành dự đoán. Phương pháp này không chỉ giảm độ lỗi dự đ oán mà còn giảm thời gian huấn luyện.
Nhóm 2: Chọn lựa các đặc trưng đầu vào (áp dụn g nguyên tắc “tách khỏi” để loại bỏ đặc trưng gây nhiễu). Các đề xuất thuộc nhóm này lai ghép ANN hoặc SVR với thuật toán chọn lựa đặc trưng đầu vào. Việc chọn lựa các đặc trưng đầu v ào đóng v ai trò rất quan trọng trong bài toán dự đoán giá cổ phiếu.
33
Các đặc trưng đầu vào thường là chỉ số phân tích kỹ thuật. Hiện nay có khá nhiều chỉ số phân tích kỹ thuật (khoảng hơn 100), việc lựa chọn chỉ số phù hợp cho từng mã cổ phiếu là không đơn giản do chỉ số này có thể tốt cho cổ phiếu A nhưng chưa chắc đã tốt cho cổ phiếu B. Rõ ràng, ta cần xây dựng một chiến lược lựa chọn các chỉ số quan trọng tương ứng với một mã cổ phiếu cụ thể. Để chọn đặc trưng đầu vào trong bài toán dự đoán giá cổ phiếu, ta sử dụng kỹ thuật phân tích th ành phần chính (PCA), GA ,ICA…
Nhóm 3: Xác định bộ tham s ố tối ưu cho mô hình (áp dụng nguyên tắc giải thiếu hoặc thừa trong bài toán tối ưu). Các nghiên cứu thuộc nhóm này kết hợp ANN hay SVR với các thuật toán xác đ ịnh bộ tham số tối ưu cho ANN hay SVR. Việc xác định bộ tham số tối ưu cho mô hình rất quan trọng bởi bộ tham số này sẽ ảnh hưởng đến độ chính xác d ự đoán của mô hình. Với SVR, người ta thường dùng thuật toán Grid Search để tìm bộ tham s ố tối ưu. Nhằm nân g cao hiệu quả trong việc xác định bộ tham s ố tối ưu của SVR, ta cũng có thể s ử dụng thuật giải di truyền (GA). Để tìm b ộ tham số tối ưu cho ANN, ta sử dụng GA hoặc lan truyền ngược.
Nhóm 4: Đặt trọng số cho dữ liệu (áp dụng nguyên tắc phản đối xứng các điểm dữ liệu khôn g còn đượ c xem quan trọng như nhau). Với nhận định tính chất của chuỗi dữ liệu thời gian (time-s eries) là nhữn g điểm dữ liệu ở gần (xét về mặt thời gian) s ẽ quan trọng và có nhiều ảnh hưởng hơn những điểm dữ liệu ở xa, các mô hình đề xuất trong nhóm này tìm cách đặt trọng số cho các điểm dữ liệu. Ngoài việc lai ghép với các kỹ thuật khác, cũng để đặt trọng s ố cho chuỗi dữ liệu thời gian, Tay và Cao đưa ra ba phiên bản cải tiến của SVR là tăng dần tham số C của SVR theo thời gian (C-as cending SVR)Error! Referen ce source not foun d., g iảm dần tham s ố của SVR th eo thời gian ( -des cending SVR) và vừa tăng C vừa giảm .
34
KẾT LUẬN
Phương pháp luận sáng tạo và đổi mới là bộ môn khoa h ọc giúp con người hành động tư duy có định hướng, có kế hoạch hóa một cách đúng đắn. Nó có mục đích tổ chức hợp lý và làm tích cực hóa tư duy sáng tạo, có tính logic và linh động. Về mặt logic, có tác dụng phân nhỏ bài toán s áng chế thành từng phần, vừa s ức với người giải bình thường. Về mặt linh động, nó khai thác tới mức lớn nhất mặt mạnh của từng người giải như kiến thức, kinh nghiệm, trí tưởng tượng, linh tính... và hạn chế mặt yếu như tính ì tâm lý, sự phân tán trong suy nghĩ.
Ứng dụng tốt các thủ thuật sáng tạo s ẽ giúp nâng cao năng s uất và hiệu quả, về lâu dài tiến tới điều khiển quá trình tư duy sáng tạo, quá trình s uy nghĩ và ra quyết định của con người, từ đó giúp con người tránh được tính ì tâm lý và cách suy nghĩ theo lối mòn thiếu s áng tạo.
35
TÀI L IỆU THAM KH ẢO
[1] GS. TSKH . Hoàng Kiế m, Bài giảng "Phương pháp nghiên cứu khoa học”,
2012
[2] Nguyễn Sinh Huy, Trần Trọng Thủy, Phư ơng pháp nghiên cứu khoa học giáo dục, Hà Nội, 1999
[3] Phạm Viết Vượng, Phương pháp luận nghiên cứ u khoa học (Giáo trình dành
cho học viên cao học và nghiên cứ u sinh), NXB. Đại học Quốc gia Hà Nội,
1997
[4] Phan Dũng, Bộ sách “Sáng tạo và đổi mới”, NXB. Đại học Quố c g ia TP Hồ Chí Minh, 2012
[5] Trần Trung Kiên, Bành Trí Thành, Xây dự ng ứng dụng hỗ tr ợ dự đoán giá cổ phiếu Việt Nam dựa trên m ô hình lai GA-SVR, Luận văn tốt nghiệp cử nhân
CNTT, Trường ĐH K HTN TP. HCM, 2011
[6] Vũ Cao Đàm, Phư ơng pháp luận nghiên cứu khoa học, NXB. Khoa học – Kỹ