Trong nghiíncứu năy, chúng tơi giớithiệu phương phâpGA-LSTM,sửdụngthuật tôn di truyền GA để lựa chọn câc đặctrưng đầu văo cho mô hình bộ nhớ dăi - ngắn hạn LSTM.Phương phâp GA-LSTM được
Hội nghị Khoa học trẻ ỉần 5 năm 2023(YSC2023)-ỈUH YSC5.F013 Dự ĐOÁN GIÁ CỎ PHIẾU SỬ DỤNG THUẬT TOÁN DI TRUYỀN NGUYỄN NĂNG ANH1*, NGUYỄN TẤN ĐẮT1, NGUYỄN HUỲNH ĐAN KHÁNH1, ĐỖ THÀNH MINH PHÚ1, CAO HUỲNH VÕ THANH1, LÊ PHÚC LŨ1, NGUYỄN HỮU TÌNH1 }Khoa Công nghệ Thông tin, TrườngĐại học Công nghiệp Thành phổ Hồ Chỉ Minh *nanganhaỉ 0@gmaiỉ.com T óm tắt Dự đoán giá cổ phiếu là một trong những bài toán thực tế thu hút được sự quan tâm của cả các nhà đầu tư và nhà nghiên cứu về kinh tế Tuy nhiên, bài toán này gặp nhiều khó khăn do giá cổ phiếu có tính ngẫu nhiên và biến động cao Trong nghiên cứu này, chúng tôi giới thiệu phương pháp GA-LSTM, sử dụng thuật toán di truyền (GA) để lựa chọn các đặc trưng đầu vào cho mô hình bộ nhớ dài - ngắn hạn (LSTM) Phương pháp GA-LSTM được áp dụng để phân tích và dự đoán giá cổ phiếu, giúp cho việc đưa ra các quyết định đầu tư hở nên hiệu quả hơn Các kết quả thực nghiệm hên dữ liệu thực tế cho thấy rằng phương pháp đề xuất đạt được kết quả tốt hơn so với các phương pháp thống kê truyền thống và mô hình học máy thông thường Từ khoá Dự đoán giá cổ phiếu, Thuật toán di huyền, Bộ nhớ dài - ngắn hạn, dự báo tài chính, phân tích chuỗi thời gian STOCK PRICE PREDICTION USING GENETIC ALGORITHM Abstract The problem of predicting stock prices is an interesting and important task that attracts the attention of investors and economic researchers However, it is a complex problem, as stock prices are usually noisy and random In this paper, we introduce the GA-LSTM method that combines genetic algorithm (GA) and long short-term memory (LSTM) network to select input features for stock price analysis and prediction The GA-LSTM method is applied to analyze and predict stock prices, improving the effectiveness of investment decision-making Experimental results on real data show that the proposed method achieves better performance than traditional statistical methods and conventional machine learning models Keyword Stock price prediction, Genetic algorithm, LSTM, Financial forecasting, Time series analysis 1 GIỚI THIEL Trong nền kinh tế phát hiển, số lượng công ty được niêm yết trên sàn chứng khoán ngày càng tăng đã mở ra nhiều cơ hội sinh lời cho nhà đầu tư, làm cho thị hường cổ phiếu hở thành một chủ đề hấp dẫn hong lĩnh vực tài chính [1] Sự biến đổi xu hướng của giá cổ phiếu phụ thuộc bởi nhiều yếu khác nhau bao gồm: sự kiện chính trị và địa chính trị; tỷ giá hối đoái; diễn biến của những thị hường cổ phiếu khác; tình hình nền kinh tế và tâm lý của các nhà đầu tư [2] [3] [4] Phương pháp dự đoán giá cổ phiếu truyền thống thường xây dựng các mô hình dự đoán tuyến tính dựa trên dữ liệu lịch sử của cổ phiếu Tuy nhiên, do đặc thù của dữ liệu cổ phiếu nên Bowden và cộng sự [5] đã dùng phương pháp ARIMA (Autoregressive Integrated Moving Average) thường được sử dụng để xây dựng để xây dựng mô hình tự hồi quỵ dự đoán giá cổ phiếu Mặc dù phương pháp này có một số ưu điểm về hiệu suất tính toán, giả định rằng phân phối thống kê và sự ổn định của dữ liệu nghiên cứu giới hạn khả năng mô hình hóa chuỗi thời gian vốn đã phi tuyến tính và không ổn định Bên cạnh đó các giá trị ngoại lai trong dữ liệu ảnh hưởng đáng kể đến kết quả dự đoán của mô hình Giá cổ phiếu có thể bị ảnh hưởng bởi nhiều yếu tố khác nhau Cùng với sự phát hiển của các kỹ thuật thống kê trong lĩnh vực tài chính, các nhà nghiên cứu đã khai thác nhiều yếu tố ảnh hưởng đến thị trường chứng khoán và định lượng những yếu tố đó thành dữ liệu cụ thể để © 2023 Trường Đại học Công nghiệp Thành phố Hồ Chí Minh 149 Hội nghị Khoa học trẻ ỉần 5 năm 2023(YSC2023)-ỈUH nghiên cứu xu hướng biến động của các cổ phiếu Sự hỗ trợ của dữ liệu lớn đã hiện thực hoá khả năng của các thuật toán máy học Ngày càng có nhiều nhà nghiên cứu bắt đầu sử dụng mô hình dự đoán phi tuyến tính của máy học để dự đoán giá cổ phiếu Naữ và đồng nghiệp [6] đã đề xuất một hệ thống cây quyết định hên tập mờ Phương pháp kết hợp những ưu điểm của cây quyết định và tập mờ, nhưng dễ gặp hiện tượng overfitting khi xử lý tập dữ liệu có nhiều nhiễu dẫn đến ảnh hưởng đến kết quả dự đoán của mô hình Theo lý thuyết, mạng nơ-ron nhân tạo (ANN) có thể học được bất kỳ mối quan hệ phi tuyến tính nào và ít bị ảnh hưởng hơn bởi dữ liệu nhiễu, chính vì vậy mà nó đã được sử dụng phổ biến trong lĩnh vực dự đoán chuỗi thời gian Li và đồng nghiệp [7] đã tiến hành một loạt mô hình dự đoán sử dụng mạng nơ-ron và đạt được kết quả khả quan hơn so với cây quyết định Tuy nhiên, các mạng nơ-ron dễ gặp vấn đề tối ưu hóa cục bộ trong quá trình thực nghiệm, và Support Vector Machine (SVM) dựa trên giảm thiểu hoá rủi ro cấu trúc giúp tỉ lệ rơi vào lỗi tối ưu cục bộ của mô hình giảm đi đáng kể Cao và đồng nghiệp [8] đã xây dựng mô hình dự đoán cổ phiếu với SVM từ đó cải thiện hiệu suất tổng thể của mô hình Sự vượt bậc của trí tuệ nhân tạo, học máy, học sâu thu hút sự chú ý rộng rãi nhờ hiệu suất vượt trội trong các lĩnh vực như là: dịch máy [9] nhận diện cảm xúc giọng nói [10]; nhận dạng hình ảnh [11] và nhiều khía cạnh khác nữa So với mô hình thống kê truyền thống, Deep Neural Network (DNN) có thể phân tích mối quan hệ phi tuyến phức tạp qua biểu diễn đặc trưng thành các lớp, điều này phù hợp với vấn đề phức tạp, bị ảnh hưởng bởi nhiều yếu tố, tính mất ổn định và phi tuyến tính của dữ liệu cổ phiếu [12] Tsantekidis và đồng nghiệp [13] đề xuất một mô hình dự đoán cổ phiếu dựa hên mạng nơ-ron tích chập (CNN) và so sánh với các mô hình khác để xác minh tính hiệu quả của mô hình tích chập trong dự đoán cổ phiếu Tuy nhiên, do tính thời điểm của dữ liệu cổ phiếu, mạng nơ-ron tích chấp không phải là mô hình mạng nơ-ron phù hợp nhất cho dự đoán cổ phiếu Selvin và đồng nghiệp [14] đã đề xuất ba mô hình dự đoán cổ phiếu dựa trên CNN, mạng nơ-ron hồi quỵ (RNN) và LSTM Kết quả cho thấy phương pháp LSTM là phù hợp nhất để dự báo thị hường chứng khoán và chuỗi thời gian là do khả năng ghi nhớ dài hạn của mạng Đối với dự báo tài chính dữ liệu đa biến, việc lựa chọn được đặc trưng đóng vai hò rất là quan trọng Lựa chọn đặc trưng mang lại nhiều lợi ích, chẳng hạn như: (i) giảm thời gian huấn luyện mô hình; (ii) đơn giản hoá sự mô hình bằng cách loại bỏ đặc trưng không cần thiết; (iii) cải thiện độ chính xác của mô hình; (iv) giảm việc overfitting nhờ loại bỏ đi những biến không cần thiết [15] Yu và đồng nghiệp [16] đã thành công cải thiện độ chính xác dự đoán của mô hình bằng cách sử dụng PCA để giảm chiều dữ liệu kết hợp với mô hình SVM Dựa hên sự thay đổi những thông tin ảnh hưởng qua các giai đoạn khác nhau, Zheng và đồng nghiệp [16] đã sử dụng Multistage Attention Network và học được thông tin ảnh hưởng của nhiều chuỗi thời gian không dự đoán tác động lên chuỗi mục tiêu qua các giai đoạn thời gian khác nhau Mặc dù những phương pháp này có thể có hiệu quả trong việc bắt lấy đặc trưng tạm thời nhưng chúng không thể xác định hiệu quả của một tổ hợp yếu tố Khi mà số lượng yếu tố dữ liệu tăng lên, và các yếu tố có xu hướng tương quan hoặc ảnh hưởng lẫn nhau Việc áp dụng thuật toán di truyền dựa trên quần thể có thể giải quyết hiệu quả các vấn đề về nhiễu và cộng tuyến của đặc trưng Bằng việc ứng dụng thuật toán di huyền đề chọn lọc đặc trưng và đưa những đặc trưng đó vào mô hình dự đoán giá cổ phiếu LSTM 2 Cơ SỞ LÝ THUYẾT 2.1 Dự đoán thị trường chúng khoán Thị trường chứng khoán phải đối mặt với nhiều dữ liệu chứng khoán đến từ các ngành công nghiệp khác nhau, bao gồm toàn bộ dữ liệu về thị hường tài chính Dựa hên các dự đoán về thị hường, các nhà đầu tư điều chỉnh hành động của mình dựa trên việc mua và bán các cổ phiếu Có một số yếu tố ảnh hưởng đến tình trạng thị hường bao gồm: thông báo về lợi nhuận; thông báo chia cổ tức; thay đổi đội ngũ quản lý; và nhiều yếu tố khác Các chuyên gia xem xét rằng các vấn đề về giao dịch chứng khoán có ảnh hưởng đến giá của cổ phiếu hên thị hường chứng khoán [17] Hiện tại, các công cụ khai phá dữ liệu đóng một vai trò không nhỏ trong việc hỗ hợ các nhà đầu tư, quỹ đầu tư, tổ chức để dự đoán xu hướng và hành vi của thị trường, chủ động đưa ra các giải pháp dựa hên dữ liệu có cơ sở kiến thức [18] 150 © 2023 Trường Đại học Công nghiệp Thành phố Hồ Chí Minh Hội nghị Khoa học trẻ lần 5 nám 2023(YSC2023)-ỈUH 2.2 RNN-LSTM 2.2.1 Giới thiệu về Deep learning Deep Learning là một phần của Machine learning, là phương pháp xây dụng một mạng nơ-ron có nhiều lớp Nhũng mạng lưới thần kinh này cố gắng mô phỏng hành vi của não người cho phép deep learning học được từ một lượng lớn dữ liệu Trong khi mạng nơ-ron có một lớp vẫn có thể đưa ra các dự đoán gần đúng, các lóp ần bỗ sung có thể giúp tối ưu hóa và tinh chỉnh để có độ chính xác Deep Learning thúc đẩy nhiều ứng dụng và dịch vụ trí tuệ nhân tạo (AI) nhằm cải thiện tự động hóa, thực hiện các tác vụ phân tích và vật lý mà không cần sự can thiệp của con ngưòi Công nghệ deep learning được ứng dụng rộng rãi trong các sản phẩm và dịch vụ hàng ngày chẳng hạn như trợ lý kỹ thuật số, điều khiển từ xa hỗ trợ giọng nói và phát hiện gian lận thẻ tín dụng cũng như các công nghệ mới nối chẳng hạn như ô tô tự lái Các thuật toán Deep learning nổi bật: Convolution Neural Network (CNN) sử dụng rất phổ biến trong các bài toán về Computer Vision, Recurrent Neural Network (RNN) lại phù hợp với các loại dữ liệu có mối liên hệ về thời gian như time serial forecasting hay trong các bài toán về xử lý ngôn ngữ tự nhiên, bởi vì một phần output của nó ở thòi điểm này được đua trở lại thành input ở thời điểm tiếp theo, 2.2.2 Mạng mr-ron hồi quy (RNN) Mạng nơ-ron hồi quy là một mạng nơ-ron nhân tạo có khả năng tính toán mạnh mẽ và ỗn định, được sử dụng hiệu quả trong việc giải quyết các vấn đề phức tạp trong nhiều lĩnh vực bao gồm xử lý ngôn ngữ tự nhiên, nhận dạng giọng nói và xử lý ảnh [16], Khác với mạng nơ-ron nhân tạo truyền thống (ANN), không thể ghi nhớ được thông tin lịch sử trước đó của các chuỗi, RNN có hidden layer để duy trì các đặc điểm của toàn bộ chuỗi Hình 1: Mạng nơ-ron hồi quy truyền thống (RNN) 2.2.3 Long Short-Term Memory (LSTM) Network Khi mà số lớp (layer) trong mạng ngày càng trở nên nhiều hơn, vấn đề của RNN là chỉ mang được thông tín qua một số bước nhất định do vấn đề triệt tiêu đạo hầm - vanishing gradient [ 19] Bộ nhó' dài ngắn hạn (LSTM) được đề xuất bởi Hochreiter và Schmidhuber đã giải quyết được vấn đề này [20] [21] Cấu trúc của mạng L STM được thiết kế các ô nhớ cho việc lưu trữ thông tin dài hạn Quá trinh sử dụng rà thay đổi thông tin của các thời điểm được quyết định qua ba cống: cổng rào - input gate; cồng quên - forget gate và cồng ra - output gate © 2023 Trường Đại học Công nghiệp Thành phố Hồ Chí Minh 151 Hội nghị Khoa học trẻ lần 5 nám 2023(YSC2023)-ỈUH Hình 2: Tối ưu hoá LSTM cho một đơn vị RNN Cho h là ô nhớ LSTM, c là giá tri của ô nhớ và X là dữ liệu đầu vào Quá trình cập nhật có thể được chia thành các bước sau đây: (1) Đầu tiên chúng ta tính giá trị từng thành phần cho ô nhớ ở thời điểm hiện tại ”, wxc và whc dụa trên công thức RNN truyền thống, lần lượt là dữ liệu đầu vào và ma trận trọng số của đầu ra của ô nhớ trước đó ~ = tanh(wxcxt + IVt-i + ốc) (2) Tính toán giá trị it lượng dữ liệu được đi qua cổng đầu vào cống vào dùng để điều khiển lượng giá trị ảnh hưởng đối với trạng thái ô nhớ hiện tại Việc tính toán tất cả các cổng không chỉ bị ảnh hưởng bỏi dữ liệu hiện tại xt và giá trị đầu ra của ô nhớ liền trước đó hf-! mà còn bởi giá trị của ô nhớ Q-! trước đó Mô hình này gọi là peephole connections k = ơ(wxixt h Wftiht—I + PkcjCf—i + bf) (3) Tính toán giá trị cửa cồng quên ft Khác với cống vào, cồng quên điều chỉnh sự ảnh hưởng của thông tin lịch sử với trạng thái hiện tại của ô nhớ ft - a(yVxfxt + + tVc/Q-i + bf) (4) Tính giá trị trạng thái của ô nhớ hiện tại ct Q = ft o Ct-1 + ít o Q- 0 được định nghĩa là phép nhân theo từng điểm - product point by point Công thức cho thấy trạng thái ô nhó' được cập nhật dựa trên lượng thông tin đưa vào ô nhớ trước đó sẽ loại bỗ đi thông tin không cần thiết và xác định lượng thông tin mới từ giá trị ô nhớ được đưa vào, lần lượt là ct_! và Q, và hai phần này được điều chỉnh bởi cổng quên và và cổng vào tương ứng ft và it (5) Tính giá đầu ra ot, đây là đầu ra để điều chỉnh giá trị trạng thái của đơn vị ô nhớ Of ^(^xo^-t "b Wfioh-t-1 “b ^coQ—1 “b bo)- (6) Đầu ra cuối cùng của một đơn vị LSTM ht = Of o tanhlcf) Hàm kích hoạt là hàm Sigmoid chung trên các công thức có giá trị từ khoảng 0 đến 1 Thiết kế của 3 cổng và ô nhớ riêng cho phép đơn vị L STM lưu trữ, đọc, xóa và cập nhật dù là dài hay ngắn hạn 2.3 Thuật toán di truyền (GA) 2.3.1 Khái niệm Thuật toán di truyền (GA) là một thuật toán metaheuústic chỉ phương pháp toán nhằm tối tru hoá vấn đề của bài toán được lấy cảm hứng từ quá trình tiến hoá và di truyền tự nhiên Thuật toán được sử dụng rộng rãi như một thuật toán tìm kiếm lời giải tối ưu hoặc sấp sỉ tối tru cho trong một khoảng tim kiếm lớn Quá 152 © 2023 Trường Đại học Công nghiệp Thành phố Hồ Chí Minh Hội nghị Khoa học trẻ lần 5 nám 2023(YSC2023)-ỈUH trình đi truyền của thuật toán bao gồm những toán tử bắt chước theo quá trinh di truyền tự nhiên và nguyên tắc tiến hoá, có liên quan đến hoạt động lai ghép và đột biến ứng với mỗi cá thể tượng trưng cho một lời giải nhất định được mã hoá thành chuỗi nhị phân Các cá thể sẽ được một cách ngẫu nhiên và dựa rào những toán tử như lai chéo, đột biến để có cơ hội tạo ra những cá thể tốt hơn hay chinh là lời giải tốt hơn 2-3.2 Các bước trong giải thuật di truyền Hình 3: Các bước thực hiện cơ bản của giải thuật di truyền 2.3.2.1 Xác định quần thể ban đầu Việc khỏi tạo quần thể hoàn toàn ngẫu nhiên các cá thể sẽ được mã hoá nhị phân và được khởi tạo ngẫu nhiên, cần xác định rõ quần thể có số lượng cá thể đủ lớn để đảm bảo độ đa dạng của quần thể đó Và tính chất của mỗi cá thể sẽ được xác định 2.3.2.2 Quá trình lai ghép các cá thể Nguyên tắc chọn theo mô hình bánh xe roulette: Trong việc lựa chọn các cá thể để lai chéo, thuật toán mong muốn cá thể được sẽ đạt được những tiêu chí tốt và tạo ra thế hệ mói tốt hơn Có nhiều phương pháp để lựa chọn cá thể tốt như là: o Chọn theo thứ hạng (rank selection) o Chọn theo độ ồn định (steady State selection) o Chọn theo vòng xoay roulette (roulette wheel selection) Trong đó phương pháp chọn theo bánh xe roulette có nhũng đặc đỉểm như sau: Các cá thể được chọn bằng cách đánh giá trên độ thích nghi của cá thể đó; những cá thể tốt hon, thì xác suất được chọn sẽ cao hon Với ý tưởng giống vòng xoay roulette, tuy nhiên phương pháp này có những điểm khác biệt quan trọng là các ô trên vòng xoay luôn có kích thước ngang nhau, đồng nghĩa vói việc xác suất được chọn lựa như nhau © 2023 Trường Đại học Công nghiệp Thành phố Hồ Chí Minh 153 Hội nghị Khoa học trẻ lần 5 năm 2023(YSC2023)-IƯH Hình 4: Bánh xe roulette nguyên bản Hình 5: Bánh xe roulette có trọng số Thay vào đó chung ở mỗi lần chọn cá thể được diễn ra, một phiên vòng xoay roulette có trọng số sẽ được tính toán Trong đó trọng số là của mỗi cá thể, dựa trên giá trị thích nghi của cá thể đó Xác suất để cá thể được lựa chọn là: fi Pi Với fj là giá trị thích nghi của cá thể; N là số lượng cá thể có trong quần thể đó 0 Tổng giá trị thích nghi = F F A B c D E G L e (0; F) Hình 6: Dàn trải các giá trị trọng số của bánh xe roulette Mô phỏng quá trình này có được giải thích như sau: [Sum] tính toán tổng F của tất cả các giá trị thích nghi của cá thể thứ i tương ứng với fi với i E (0, N) [Select] chọn ngẫu nhiên giá trị r trong giá trị từ (0; F) hay hiểu là r E (0; F) [Loop] tiến hành vòng lặp bắt đầu từ vị trí đầu tiên cho đến vị trí cuối cùng của quần thể và lần tính tổng các giá trị thích nghi các cá thể để được giá trị là tổng s Khi mà tổng s lớn hơn r; s > r, dừng lại và trả về cá thể đang chọn totalSum ■= 0 pop the population for each chromosome E pop do fitnessValuation