1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo Đồ Án phân tích dữ liệu Áp dụng lsmt trong dự Đoán thị trường chứng khoán

29 7 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Áp Dụng LSMT Trong Dự Đoán Thị Trường Chứng Khoán
Tác giả Huỳnh Duy Khánh, Nguyễn Văn Ngàn, Phạm Thanh Vương
Người hướng dẫn Trịnh Tấn Đạt, Nguyễn Thị Tuyết Nam
Trường học Trường Đại Học Sài Gòn
Chuyên ngành Phân Tích Dữ Liệu
Thể loại báo cáo đồ án
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 29
Dung lượng 1,96 MB

Nội dung

Một trong những phương pháp truyền thống để dự báo chiều biến động c a củ ổ phiếu là mô hình Trung bình di động tích hợp tự hồi quy ARIMA được sử dụng để nghiên cứu các quá trình thay đổ

Trang 1

UỶ BAN NHÂN DÂN THÀNH PH H CHÍ MINH Ố Ồ

TRƯỜNG ĐẠI HỌC SÀI GÒN

Giảng viên hướng dẫn: Trịnh Tấn Đạt

Nguyễn Thị Tuyết Nam

Trang 2

LỜI CẢM ƠN

Nhóm chúng em xin gửi lời biết ơn chân thành đến Thầy Trịnh Tấn Đạt và Cô Nguyễn Thị Tuyết Nam, người đã không ngần ngại chia sẻ kiến thức và hướng dẫn tận tình trong suốt quá trình thực hiện đồ án môn học Phân Tích Dữ Liệu Sự đồng hành và hỗ trợ của Thầy Cô đã là nguồn động viên quan trọng, giúp chúng em vận dụng linh hoạt những kiến thức đã học

để hoàn thiện đồ án một cách thành công Mặt khác, nhóm chúng em nhận thức rõ ràng trong quá trình học tập và triển khai đồ án, không thể tránh khỏi những thiếu sót Chúng em trân trọng mọi ý kiến đóng góp và đánh giá từ Thầy để có thể cải thiện và hoàn thiện hơn về mặt chất lượng Đồ án của chúng em không chỉ là sản phẩm cá nhân mà còn là kết quả của sự đóng góp nhiệt tình và chuyên sâu từ tất cả các thành viên trong nhóm Hy vọng rằng thông qua đồ án này, chúng em có thể đóng góp một phần nhỏ vào sự phát triển của lĩnh vực này

Trang 3

MỤC LỤC

LỜI C ẢM ƠN 1

MỤC LỤC 2

Chương I – Mở đầu 4

1.1 Gi i thi u v ớ ệ ấn đề ầ c n gi i quy t ả ế 4

1.2 Lý do ch ọn đề tài 6

1.3 ng d ng c Ứ ụ ủa đề tài 7

CHƯƠNG II – Mô hình và đối tượ ng dự đoán 8

2.1 Mô hình LSTM 8

2.2 Đối tượng và phạm vi dự đoán 14

2.3 Các ch s ỉ ố đánh giá 15

CHƯƠNG III – XÂY DỰNG MÔ HÌNH DỰ ĐOÁN GIÁ CHỨ NG KHOÁN NETFLIX BẰNG MÔ HÌNH LSTM ( LONG SHORT- TERM MEMORY) 17

3.1 Các bướ c xây dựng mô hình dự đoán chứ ng khoán netflix 17

4.2 K t qu ế ả thự c nghi m ệ 20

4.3 Ch s sai sót ỉ ố 21

CHƯƠNG IV – KẾT LUẬN 24

CHƯƠNG V – HẠN CHẾ VÀ HƯỚ NG PHÁT TRIỂN 26

5.1 H n ch ạ ế 26

5.2 Hướng phát triển 26

Trang 4

Danh mục hình

Hình 1: Mô hình s khác nhau gi a RNN và LSTM ự ữ 10

Hình 2: Bi u di n ki n trúc bên trong c a m t Cell LSTM ể ễ ế ủ ộ 10

Hình 3: Diễ n gi i các kí hi ả ệu trong đồ thị m ạng nơ ron 11

Hình 4: T ng c ng quên( forget gate layer) ầ ổ 12

Hình 5: C p nh t giá tr cho ô tr ng thái ậ ậ ị ạ 13

Hình 6: ô tr ng thái m i ạ ớ 13

Hình 7: Điều chỉnh thông s ố thông tin đầu ra 14

Hình 8: Giá ch ng khoán Netflix t ứ ừ năm 2012 - 2021 15

Hình 9: D u l ữ liệ ịch s ử tăng giả m ch ng khoán qua t ứ ừng năm 17

Hình 10: Khở ạ i t o m ng Neural d a trên LSTM ạ ự 19

Hình 11 : Huy n luy n mô hình ế ệ 19

Hình 12 : Biểu đồ ự đoán giá đóng cửa của Netflix t d ừ năm 2014 – 2024 20

Hình 13 : D ự đoán giá đóng cửa của ngày hôm sau 20

Hình 14 : D ự đoán giá đóng cửa 7 ngày 21

Hình 15 : So sáng d ự đoán 21

Hình 16: Đo lường độ chính xác trên tập huấn luy n ệ 21

Hình 17: Đo lường độ chính xác trên tập giám sát 22

Hình 18: Tóm t t các thông s trên mô hình LSTM ắ ố 23

Hình 19: Đo lường độ chính xác trên tập huấn luy n ệ 23

Hình 20: Đo lường độ chính xác trên tập giám sát 23

Trang 5

Chương I – Mở đầu

1.1 Giới thiệu vấn đề cần giải quyết

Trong bài toán này, chúng ta đang nghiên cứu về việc dự đoán giá cổ phiếu của Neftlix trong tương lai Điều này có ý nghĩa quan trọng trong việc hỗ trợ quyết định đầu tư và tối ưu hóa lợi nhuận

D ự báo chính xác xu hướng biến động c a giá c ủ ổ phiếu th t s là thách ậ ựthức vì giá c ổ phiếu chứa đựng rất nhi u thông tin không rõ ràng, nhi u yề ề ếu

tố nhiễu và còn phụ thuộc tâm lý đám đông Ngoài ra, giá cổ phiếu bị ảnh hưởng b i các chính sách c a Chính phở ủ ủ, cũng như thông tin về tình hình chính tr , kinh t - xã h i, th m chí c ị ế ộ ậ ả thị trường chứng khoán Hoa K ỳ cũng tác động đến thị trường chứng khoán trong nước Tuy nhiên, hiện nay dự báo giá cổ phiếu thu hút được nhiều s quan tâm nghiên c u Các nghiên ự ứcứu đi theo hai hướng đó là phân tích cơ bản và phân tích kỹ thuật Phân tích cơ bản, giả sử rằng bất kỳ cổ phi u riêng lẻ có giá trị nội tại phụ thuộc ếvào tiềm năng thu nhập c a giá c phiủ ổ ếu như chất lượng qu n lý, tri n vả ể ọng ngành và tri n v ng kinh tể ọ ế Phân tích cơ bản sử ụng các phương pháp tài dchính xác định giá th c t c a c ự ế ủ ổ phiếu cao hơn hoặc thấp hơn giá trị nội tại của nó và tạo ra dự đoán về giá trị tương lai; trong khi phân tích kỹ thuật

hoặc biểu đồ giả định r ng sằ ự thay đổi giá cổphiếu có s lự ặp lại xu hướng trong quá kh Giá c phi u ph n ánh các y u tứ ổ ế ả ế ố như xu hướng, biến động kinh t , tâm lý thế ị trường và k t quế ả kinh doanh Do đó phân tích kỹ thuật chỉ chú trọng s ự biến động của giá để đưa ra chiến lược phù hợp Phân tích

kỹ thu t s d ng các th ng kê hoậ ử ụ ố ặc các phương pháp toán học dựa vào lịch

sử giao d ch, khị ối lượng giao dịch để xác định xu hướng d báo Phân tích ự

cơ bản phản ánh giá trị nội tại của cổ phiếu nhưng không phản ánh sự thay

đổi liên tục c a cổ phi u Báo cáo tài chính củủ ế a công ty, bảng cân đối kếtoán, báo cáo k t quế ả hoạt động kinh doanh thường theo kho ng th i gian ả ờdài, vì v y chúng không phù hậ ợp để ự d báo chi u biề ến động thường xuyên của giá cổ phiếu Phân tích và d báo chuự ỗi thời gian đã được nghiên cứu

Trang 6

chuyên sâu hơn 40 năm Một trong những phương pháp truyền thống để dự báo chiều biến động c a củ ổ phiếu là mô hình Trung bình di động tích hợp

tự hồi quy (ARIMA) được sử dụng để nghiên cứu các quá trình thay đổi theo th i gian Tuy nhiên, m t h n ch cờ ộ ạ ế ủa ARIMA là xu hướng t nhiên ựcủa nó t p trung vào các giá tr trung bình c a chu i d ậ ị ủ ỗ ữ liệu quá khứ Do đó, vẫn còn khó khăn để nắm bắt một quá trình thay đổi nhanh chóng Hỗ trợ hồi quy vectơ (SVR) đã được áp dụng thành công để dự đoán chuỗi thời gian, nhưng nó cũng có những nhược điểm như thiếu phương pháp có cấu trúc để xác định một số tham số chính của mô hình Tuy nhiên, dữ liệu cổ phiếu là phi tuyến, không cố định thậm chí có yếu t mùa vố ụ, vì vậy khó đáp ứng các gi ả định c a mô hình S phát triủ ự ển c a máy h c và trí tu nhân ủ ọ ệtạo đã mở ra hướng nghiên c u cho d báo giá hoứ ự ặc chiều biến động c a c ủ ổphiếu mà không đòi hỏi các điều kiện chặt chẽ về dữ liệu Các nghiên cứu

dự báo giá c ổ phiếu ch yủ ếu đang sử dụng l ch s giá giao d ch mà ít nghiên ị ử ịcứu s d ng các ch báo k thuử ụ ỉ ỹ ật để d báo chi u biự ề ến động c a ch s ủ ỉ ố chứng khoán tại Việt Nam Đây là khoảng tr ng cố ần nghiên cứu nh m ki m tra ằ ểtính hi u qu c a các ch báo k thuệ ả ủ ỉ ỹ ật ứng d ng mô hình h c máy Các mô ụ ọhình h c máy phọ ổ biến nh t hiấ ện nay như mạng nơ-ron h i quy (RNN - ồRecurrent Neural Network), mạng nơ ron v i bớ ộ nhớ ngắn hạn định hướng dài h n (LSTM - Long Short Term Memory networks), mạ ạng nơ ron hồi tiếp v i nút c ng (GRU Gated Recurrent Unit), mớ ổ – ạng nơ-ron chuyển đổi (Transformer Neural Network), và các d ng ph c h p c a chúng Trong ạ ứ ợ ủnhững năm gần đây do có cấu trúc linh hoạt, các mô hình máy học ngày càng được sử dụng nhiều hơn trong dự đoán chuỗi thời gian Cụ th , RNN ể

m t trong nh ng mô hình máy hộ ữ ọc, được thi t l p nh m gi i quy t vế ậ ằ ả ế ấn đềtrên b ng các k t n i thằ ế ố ần kinh tái phát Tuy nhiên, đố ớ ấ ỳ kiếi v i b t k n trúc RNN tiêu chu n nào, ẩ ảnh hưởng c a mủ ột đầu vào nhất định lên các lớp ẩn

và cuối cùng là đầu ra mạng thần kinh sẽ phân rã hoặc nổ tung theo cấp số nhân khi quay vòng các k t n i lế ố ặp đi lặp lại Để giải quy t vế ấn đề này LSTM, GRU và các ph c hứ ợp đã được thi t k mang tính cách m ng b ng ế ế ạ ằcách thay đổi cấu trúc c a các t bào thủ ế ần kinh ẩn trong RNN truy n th ng ề ốNgày nay, nghiên c u và ng d ng c a mô hình LSTM, GRU và các phứ ứ ụ ủ ức hợp để d ự đoán thị trường ch ng khoán còn r t h n ch M t vài nghiên cứ ấ ạ ế ộ ứu

lý thuy t v hai mô hình trên và các phế ề ức hợp của nó như sau: Shejul et al.,

Trang 7

(2023), v i nghiên cớ ứu “Dự đoán giá cổ phiếu b ng GRU, SimpleRNN và ằLSTM” cho thấy kết quả dự có độ chính xác cao trước những biến bất thường của thị trường chứng khoán; Kanzari et al (2023) v i nghiên cứu ớ

“Dự đoán bất ổn tài chính vĩ mô Tâm lý có liên quan như thế- nào? B ng ằcác mạng nơ-ron hồi quy.” Kết qu cho th y mô hình LSTM có th d ả ấ ể ự đoán chính xác xu hướng c a thủ ị trường ch ng khoán, tuy nhiên mô hình GRU ứchạy và đào tạo nhanh hơn LSTM, nhưng LSTM chính xác hơn Mục tiêu của nghiên cứu này đóng góp vào vi c nâng cao hi u qu và tính chính xác ệ ệ ảcủa mô hình d báo thự ị trường ch ng khoán thông qua viứ ệc ứng dụng và đánh giá hiệu suất của mô hình LSTM sẽ giúp cho nhà đầu tư, các tổ chức tài chính cũng như nhà nghiên cứu có cái nhìn sâu hơn về tính hiệu qu cả ủa

mô hình máy h c trong vi c d báo ọ ệ ự

1.2 Lý do chọn đề tài

Hiện nay, thời đại của chúng ta là thời đại mang xu hướng toàn cầu hóa và khu vực hóa Chính vì điều đó, mà chúng ta thấy rằng thị trường chứng khoán trên thế giới hiện nay và Việt Nam là một thị trường nóng bỏng

và có nhiều triển vọng đi lên Nó không chỉ là một kênh huy động vốn có hiệu quả cho hoạt động đầu tư trong nền kinh tế mà còn là nhân tố thúc đẩy hoạt động đầu tư trong nền kinh tế mà còn là nhân tố thúc đầy hoạt động của nền kinh tế diễn ra suôn sẻ hơn Thị trường chứng khoán đã đi vào hoạt động với nhiều biến động và đóng góp vào sự phát triển của nền kinh tế nước ta Đến nay thị trường đóng vai trò là một kênh huy động vốn hiệu quả cho những người cần vốn đồng thời cũng mang lại mức lợi nhuận cao cho các nhà đầu tư Chính vì vậy thị trường không chỉ thu hút sự quan tâm của các nhà đầu tư trong nước mà còn đông đảo các nhà đầu tư nước ngoài Do

đó, đề tài “ Dự đoán giá chứng khoán bằng mô hình LSTM (Long Term Memory)“ là đề tài mà nhóm em nghiên cứu vào nhằm giúp cho các nhà đầu tư có thể dự báo giá chứng khoán một cách tốt nhất và từ đó có thể đưa ra quyết định đầu tư của mình

Trang 8

Short-1.3 Ứng dụng của đề tài

Hướng đến việc xây dựng mô hình Neural Network phù hợp trên tập

dữ liệu TimeSeries để dự báo giá chứng khoán Mô hình dự đoán Time Series cũng sẽ được áp dụng trên các lĩnh vực khác đối với dữ liệu có thời gian

Kết quả của nghiên cứu có thể được áp dụng rộng rãi trong các lĩnh vực liên quan đến đầu tư tài chính, quản lý rủi ro, và dự báo kinh tế

Trang 9

CHƯƠNG II – Mô hình và đối tượng dự đoán

2.1 Mô hình LSTM

Để muốn phân tích một thứ gì đó hay dự đoán một điều gì như chứng khoán, giá vàng, thời tiết, bệnh tim mạch, giá xe, giá nhà thì chúng ta đều cần xác định kiểu tập dữ liệu mà chúng ta muốn dự đoán Vì thế mỗi tập dữ liệu chúng ta muốn dự đoán và phân tích đều có mỗi dạng khác nhau, nên phương pháp dự đoán và phân tích đều có cách riêng biệt cho mỗi kiểu dữ liệu chúng ta thực hiện với chúng Chẳng hạn, ta muốn dự đoán giá của một căn nhà dựa vào dữ liệu ta có là : phòng tắm, phòng ngủ, diện tích, vị trí,…Và cũng từ những giá trị đó ta có giá nhà cụ thể là cao hay thấp, giả sử

ta có tập dữ liệu về nhiều giá nhà dựa trên các giá trị đó thì nhìn chung kiểu

dữ liệu mà ta muốn dự đoán là một tập dữ liệu gồm nhiều giá trị với nhau

và từ đó cho ra giá nhà cụ thể, đối với tập dữ liệu như trên thì thông thường phương pháp là sẽ sử dụng Linear Regression( Hồi quy tuyến tính) để dự đoán nhà mà ta muốn

Đối tượng trong lần này là dự đoán chứng khoán Chúng ta có thể hiểu chứng khoán là một kiểu dữ liệu Time Series Time Series là một chuỗi các điểm dữ liệu xảy ra theo thứ tự liên tiếp trong một khoảng thời gian Trong đầu tư, một chuỗi thời gian theo dõi chuyển động của các điểm dữ liệu đã chọn, chẳng hạn như chứng khoán, trong một khoản thời gian xác định với các điểm dữ liệu được ghi lại theo các khoảng thời gian xác định với các điểm dữ liệu được ghi lại theo các khoảng thời gian đều đặn Không có thời gian tối thiểu hoặc tối đa phải được đưa vào, cho phép dữ liệu được thu thập theo cách nhà cung cấp thông tin mà nhà đầu tư hoặc nhà phân tích tìm kiếm khi kiểm tra hoạt động Điều này có thể được theo dõi trong suốt thời gian ngắn, chẳng hạn như giá của một chứng khoán vào giờ trong suốt một ngày làm việc hoặc thời gian dài và giá của một chứng khoán vào lúc đóng cửa vào ngày cuối cùng của mỗi tháng trong quá trình 2 năm

Trang 10

Phân tích Time Series có thể hữu ích để xem là một tài sản, chứng khoán hoặc biến số kinh tế nhất định thay đổi như thế nào theo thời gian

Nó cũng có thể được sử dụng để kiểm tra xem những thay đổi liên quan đến điểm dữ liệu đã chọn so với những thay đổi của các biến khác nhau như thế nào trong một khoảng thời gian Time Series được sử dụng trong một số bối cảnh phi tài chính, chẳng hạn như đo lường sự thay đổi dân số theo thời gian Hình dưới mô tả một chuỗi thời gian như vậy với sự tăng trưởng Đối với dạng bài toán có Time Series thì sẽ sử dụng mạng Neural mô hình Long Short-Term Memory ( LSTM ) để dự đoán giá chứng khoán LSTM là một dạng đặt biệt của mạng nơ ron hồi quy ( Recurrent Neural -Network gọi là RNN ) Để nói Long Short- Term Memory là một trong những mạng thần kinh nhân tạo được sử dụng phổ biến trong phân tích dữ liệu chuỗi thời gian ( Time Series ) thì có những đặc điểm sau :

• LSTM được thiết kế để tránh vấn đề phụ thuộc xa( Long-Term Dependency)

• Việc nhớ thông tin trong suốt thời gian dài là đặc tính mặc định của chúng, chứ không cần phải đào tạo để có thể nhớ được

• Tức là ngày nội tại của nó đã có thể ghi nhớ được mà không cần bất

cứ can thiệp nào

Trong kiến trúc mạng RNN chuẩn, các mô đun này có cấu trúc rất đơn giản, thường là một tầng hàm tanh LSTM cũng có kiến trúc dạng chuỗi như vậy, nhưng các mô đun trong nó có cấu trúc khác với mạng RNN chuẩn -Thay vì một tầng mạng nơ ron, chúng có tới 4 tầng tương tác với nhau một -cách đặt biệt

Trang 11

-Hình 1: Mô hình sự khác nhau giữa RNN và LSTM

Để hiểu rõ thuật toán của mô hình LSTM thì trước xem hình bên dưới cho thấy cách hoạt động chi tiết của một Cell LSTM

Hình 2: Bi u di n ki n trúc bên trong cể ễ ế ủa một Cell LSTM

Trang 12

Các kí hi u có th ệ ể diễn giải như sau:

Hình 3: Diễn giải các kí hiệu trong đồ thị mạng nơ ron

Trong sở đồ tính toán trên, m i m t phép tính s tri n khai trên mỗ ộ ẽ ể ột véc tơ Trong đó hình tròn màu hồng biểu diễn một toán tử đối với véc tơ như phép cộng véc tơ, phép nhân vô hướng các véc tơ Màu vàng thể hiện hàm activation mà mạng nơ ron sử dụng để ọ h c trong t ng ầ ẩn, thông thường

là các hàm phi tuy n sigmoid và tanh Kí hiế ệu 2 đường thẳng nhập vào th ể

hiện phép chập kết quả trong khi kí hiệu 2 đường thẳng rẽ nhánh thể ện hicho nội dung véc tơ trước đó được sao chép để đi tới m t ph n khác cộ ầ ủa

Các bước của thuật toán :

Bước đầu tiên trong LSTM s ẽ quyết định xem thông tin nào chúng ta

sẽ cho phép đi qua ô trạng thái (cell state) Nó được kiểm soát bởi hàm

Trang 13

sigmoid trong m t t ng g i là tộ ầ ọ ầng quên (forget gate layer) Đầu tiên nó nhận

đầu vào là 2 giá trị ℎ𝑡 −1và 𝑥 và trả về một giá trị nằm trong kho ng 0 và 1 𝑡 ảcho m i giá tr c a ô tr ng thái ỗ ị ủ ạ 𝐶𝑡−1 N u giá tr b ng 1 th ế ị ằ ể hiện ‘giữ toàn b ộthông tin’ và bằng 0 thể hiện ‘bỏ qua toàn bộ chúng’

Hình 4: Tầng cổng quên( forget gate layer)

Trang 14

Hình 5: Cập nhật giá trị cho ô trạng thái

it = σ( Wi.[ht-1,xt] + bi) (2) Ct= tanh( WC.[ht-1,x ] + b ) (3) t C

Đây là thời điểm để cập nhật một ô trạng thái cũ, 𝐶𝑡−1 sang một trạng thái mới 𝐶𝑡 Những bước trước đó đã quyết định làm cái gì, và tại bước này chỉ cần th c hi n nó Chúng ta nhân trự ệ ạng thái cũ với 𝑓𝑡tương ứng v i viớ ệc quên những th quyứ ết định được phép quên s m Ph n t ớ ầ ử đề cử 𝑖𝑡 𝑡 là một ∗𝐶giá tr mị ới được tính toán tương ứng với bao nhiêu được c p nh t vào mậ ậ ỗi giá tr ng thái ị trạ

'

Hình 6: ô trạng thái mới

Ct=ft ∗ Ct-1 + 𝑖𝑡∗ Ct (4)

Ngày đăng: 29/11/2024, 19:56

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN