Ứng dụng dự báo giá chứng khoán bằng mô hình lai ghép giữa bộ phân lớp đa thức và mô hình học sâu

Tính cấp thiết của đề tài Error! Bookmark not defined 2 Mục đích của đề tài Error! Bookmark not defined 3 Đối tượng và phạm vi nghiên cứu Error! Bookmark not defined 4 Dự kiến kết quả đạt được Error! Bookmark not defined Phần 2: NỘI DUNG

Trong bối cảnh công nghệ phát triển nhanh chóng hiện nay, việc tìm kiếm cơ hội kinh doanh và lợi nhuận trở nên dễ dàng nhưng cũng đầy thách thức Thị trường chứng khoán, với tiềm năng lớn, mang đến nhiều cơ hội sinh lời, nhưng cũng tiềm ẩn rủi ro và thua lỗ nếu không biết phân tích đúng cách Do đó, việc dự đoán giá cổ phiếu đã trở thành mối quan tâm lớn của các nhà khoa học, nhờ vào những lợi ích to lớn mà nó có thể mang lại.

2 Mục đích của đề tài

Xây dựng mô hình dự đoán chứng khoán chính xác và đáng tin cậy nhằm hỗ trợ người dùng Mô hình này phân tích dữ liệu chứng khoán trong quá khứ để dự đoán giá trong tương lai, giúp giảm thiểu rủi ro và sự không chắc chắn cho nhà đầu tư khi tham gia thị trường chứng khoán.

3 Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu tập trung cáo các công ty, thị trường giao dịch chứng khoán

Phạn vi nghiên cứu bao gồn dữ liệu giá cổ phiếu trong trước và ngoài nước, các chỉ số liên quan đến giá cả chứng khoán

4 Dự kiến kết quả đạt được

Hiểu biết về lý thuyết chứng khoán và mô hình bộ phân lớp đa thức là rất quan trọng Ngoài ra, việc nắm vững các mô hình học sâu như RNN, LSTM, GRU cũng đóng vai trò then chốt Các phương pháp lai ghép giữa bộ phân lớp đa thức và mô hình học sâu mang lại những cải tiến đáng kể trong phân tích và dự đoán thị trường chứng khoán.

Sử dụng thành thạo các công cụ phân tích như python,…

Xây dựng mô hình lai ghép có độ chính xác cao, mang tính thực tiễn

TỔNG QUAN VỀ CHỨNG KHOÁN VÀ THỊ TRƯỜNG CHỨNG KHOÁN

Tổng quan về chứng khoán Error! Bookmark not defined .1 Khái niệm về chứng khoán

1.1.1 Khái niệm về chứng khoán

Chứng khoán là tài sản có thể giao dịch, xác nhận quyền sở hữu và lợi ích của người sở hữu đối với tài sản hoặc phần vốn của công ty Chúng được phát hành và giao dịch trên thị trường chứng khoán, nơi nhà đầu tư có thể mua, bán và thực hiện giao dịch.

Các công ty phát hành chứng khoán nhằm huy động vốn từ thị trường Khi nhà đầu tư mua chứng khoán, họ không chỉ đầu tư tiền mà còn trở thành đồng sở hữu một phần tài sản và vốn của công ty phát hành.

Chứng khoán bao gồm: cổ phiếu, trái phiếu, chứng chỉ quỹ; chứng quyền,… [1]

Nga, một người làm kẹo mứt nổi tiếng, muốn xây dựng cơ sở sản xuất kẹo mứt để kinh doanh nhưng chỉ có 5 tỷ đồng trong khi cần 10 tỷ đồng Để huy động vốn, Nga quyết định phát hành chứng khoán, cho phép nhà đầu tư mua và trở thành cổ đông của công ty Nếu cơ sở phát triển và tạo ra lợi nhuận, các nhà đầu tư sẽ được chia lợi nhuận, ngược lại, họ cũng sẽ phải chịu rủi ro nếu công ty không thành công.

1.1.2 Đặc điểm của chứng khoán

Tính sinh lời là yếu tố quan trọng, thể hiện qua lợi nhuận mà các nhà đầu tư nhận được từ các công ty và tổ chức phát hành chứng khoán Đây là động lực chính thúc đẩy nhà đầu tư tham gia vào thị trường chứng khoán, đồng thời cũng là cơ sở để hình thành các loại chứng khoán Ngoài việc thu lợi từ việc nắm giữ chứng khoán, nhà đầu tư còn có cơ hội kiếm tiền thông qua việc mua bán và giao dịch trên các sàn giao dịch chứng khoán.

Tính thanh khoản của chứng khoán cho phép nhà đầu tư dễ dàng bán tài sản với giá trị nhất định thông qua các sàn giao dịch hoặc ngân hàng Điều này không chỉ khuyến khích việc mua bán chứng khoán mà còn giảm thiểu rủi ro từ sự giảm giá Tuy nhiên, tính thanh khoản còn bị ảnh hưởng bởi uy tín của các công ty phát hành, chi phí chuyển đổi và biến động của thị trường.

Tính rủi ro trong đầu tư chứng khoán được thể hiện qua hành động mua bán của các nhà đầu tư Mặc dù việc này có thể mang lại lợi nhuận, nhưng cũng tiềm ẩn nhiều rủi ro Khi nhà đầu tư mua chứng khoán, họ đồng nghĩa với việc đầu tư số tiền hiện tại và chỉ có thể thu hồi trong tương lai Thời gian chờ đợi để thu lợi nhuận chính là khoảng thời gian chứa đựng những rủi ro này.

1.1.3.1 Khái niệm về cổ phiếu

Cổ phiếu là chứng khoán xác nhận quyền sở hữu cổ phần trong một công ty, do công ty cổ phần phát hành Người sở hữu cổ phiếu, được gọi là cổ đông, nắm giữ một phần vốn của công ty tương ứng với số lượng cổ phiếu mà họ có.

Lan sở hữu một xưởng bánh kẹo đang phát triển tốt và muốn mở rộng quy mô, nhưng gặp khó khăn về vốn do chi phí cao Để giải quyết vấn đề này, Lan quyết định phát hành cổ phiếu, thu hút nhà đầu tư với tiềm năng lợi nhuận trong tương lai Những nhà đầu tư này trở thành cổ đông, và cổ phiếu trở thành giấy xác nhận quyền sở hữu Hàng năm, nếu xưởng hoạt động có lãi, lợi nhuận sau thuế sẽ được chia cho các cổ đông theo tỷ lệ góp vốn, gọi là cổ tức.

1.1.3.2 Các loại cổ phiếu hiện nay

Cổ phiếu hiện nay gồm 2 loại chính bao gồm:

Cổ phiếu phổ thông là loại cổ phiếu phổ biến nhất hiện nay, được phát hành bởi các công ty và tổ chức Người sở hữu cổ phiếu này có quyền tự do chuyển nhượng trên các sàn giao dịch chứng khoán, tham gia biểu quyết tại Đại hội cổ đông, và nhận cổ tức dựa trên kết quả kinh doanh cũng như giá trị cổ phiếu mà họ nắm giữ.

Cổ phiếu ưu đãi là một loại chứng khoán kết hợp đặc điểm của cả cổ phiếu thường và trái phiếu Người sở hữu cổ phiếu ưu đãi được công nhận là cổ đông trong công ty, nhưng khác với cổ phiếu thường, họ nhận được một lượng cổ tức cố định Mệnh giá của cổ phiếu ưu đãi có vai trò quan trọng trong việc xác định cổ tức, với tỷ lệ cổ tức được ấn định dựa trên mệnh giá, điều này tạo ra sự ổn định cho nhà đầu tư.

1.1.4.1 Khái niệm về trái phiếu

Trái phiếu là chứng nhận nghĩa vụ nợ phải trả cho người sở hữu, giống hình thức cho vay nợ [4]

Nga muốn vay tiền của Lan với cam kết trả lại trong 2 năm và lãi suất 12% mỗi năm Nhận thấy Nga là người uy tín và lời đề nghị hấp dẫn, Lan quyết định cho vay Khi cho vay, Nga đã viết một tờ giấy nợ cho Lan, và tờ giấy nợ này chính là trái phiếu.

1.1.4.2 Các lưu ý khi mua trái phiếu

Khi mua trái phiếu bạn cần quan tâm các yếu tố như sau:

Lãi suất là yếu tố quan trọng hàng đầu khi đầu tư vào trái phiếu, vì đây là hình thức đầu tư mang lại lợi nhuận.

Thời hạn trả lãi định kỳ của các công ty và tổ chức phát hành trái phiếu có sự khác biệt, thường được thực hiện theo từng quý hoặc có thể thanh toán lãi sau khi kết thúc kỳ hạn.

✔ Thời điểm đáo hạn: là ngày cuối cùng của kỳ hạn, doanh nghiệp phải trả hết tiền gốc và lãi cho bạn

Mệnh giá của trái phiếu là giá trị của mỗi trái phiếu khi được phát hành trên các sàn giao dịch chứng khoán Trước đây, mệnh giá trái phiếu thường rất cao, dẫn đến việc chỉ có các doanh nghiệp phát hành và các công ty khác tham gia thu mua.

✔ Tìm hiểu kỹ về các doanh nghiệp họ phát hành trái phiếu với mục đích gì, làm gì để trả lãi và hạn đúng định kỳ

1.1.4.3 Các loại trái phiếu hiện nay

Trái phiếu hiện nay bao gồm 2 lại chính:

Trái phiếu doanh nghiệp là loại trái phiếu phổ biến do các doanh nghiệp phát hành, với đặc điểm là doanh nghiệp sẽ trả lãi định kỳ và hoàn trả vốn gốc vào ngày đáo hạn.

Tổng quan về thị trường chứng khoán

1.2.1 Khái niệm về thị trường chứng khoán

Thị trường chứng khoán là không gian diễn ra các giao dịch mua bán và trao đổi cổ phiếu, trái phiếu, cung cấp thông tin liên tục về các loại chứng khoán để người mua dễ dàng nắm bắt Nó bao gồm cổ phiếu niêm yết trên các sàn giao dịch và cổ phiếu giao dịch không công khai, như chia sẻ thông qua gọi vốn cộng đồng Thị trường này thể hiện mối quan hệ cung-cầu vốn và là nơi chuyển đổi quyền sở hữu chứng khoán giữa các nhà đầu tư.

Thị trường chứng khoán Việt Nam được quản lý bởi Sở Giao dịch Chứng khoán Hồ Chí Minh (HoSE), Ủy ban Chứng khoán Nhà nước (SSC) và Sở Giao dịch Chứng khoán Hà Nội (HNX) Thông tin về các loại chứng khoán được lưu trữ tại Trung tâm Lưu ký Chứng khoán (VSD).

1.2.2 Các loại thị trường chứng khoán

Thị trường chứng khoán bao gồm 2 loại: Thị trường sơ cấp và thị trường thứ cấp

Khái niệm: Là thị trường phát hành chứng khoán mới

Thị trường sơ cấp đóng vai trò quan trọng trong việc cung cấp nguồn vốn cho các công ty và tổ chức phát hành chứng khoán, đồng thời chuyển đổi các nguồn vốn nhàn rỗi thành nguồn vốn đầu tư hiệu quả.

Trên thị trường sơ cấp, chứng khoán đóng vai trò quan trọng trong việc huy động vốn cho tổ chức phát hành, đồng thời là công cụ hiệu quả để nhà đầu tư đầu tư các nguồn tiền nhàn rỗi.

- Chủ thể giao dịch: trên thị trường sơ cấp, người bán chứng khoán là các tổ chức phát hành, người mua là các nhà đầu tư

- Kết quả giao dịch trên thị trường sơ cấp làm tăng vốn đầu tư cho tổ chức phát hành

- Tính chất hoạt động của thị trường: thị trường sơ cấp là thị trường không liên tục

Khái niệm: Là thị trường diễn ra các giao dịch mua bán chứng khoán đã được phát hành trên thị trường sơ cấp

Thị trường chứng khoán thứ cấp đóng vai trò quan trọng trong việc chuyển nhượng quyền sở hữu chứng khoán giữa các nhà đầu tư, góp phần điều tiết vốn đầu tư giữa các ngành và lĩnh vực khác nhau Từ góc độ kinh tế vĩ mô, thị trường này không chỉ giúp tạo ra sự cân đối mới cho nền kinh tế mà còn là một phần thiết yếu của thị trường tài chính.

Trên thị trường thứ cấp, chứng khoán chủ yếu được xem như công cụ đầu tư, không còn đóng vai trò huy động vốn cho tổ chức phát hành.

- Chủ thể giao dịch trên thị trường thứ cấp chủ yếu là các nhà đầu tư, kinh doanh chứng khoán

Kết quả hoạt động của thị trường thứ cấp không tạo ra sự gia tăng vốn đầu tư cho nền kinh tế, mà chỉ thay đổi quyền sở hữu chứng khoán giữa các nhà đầu tư.

Thị trường thứ cấp hoạt động liên tục và có mối quan hệ hữu cơ với thị trường sơ cấp, đóng vai trò quan trọng trong sự phát triển của thị trường chứng khoán Trong khi thị trường sơ cấp tạo ra hàng hóa cho thị trường chứng khoán, thị trường thứ cấp tăng cường tính thanh khoản của chứng khoán, từ đó đảm bảo sự phát triển bền vững cho thị trường sơ cấp.

Các khái niệm đặc trưng liên quan đến chứng khoán

Mệnh giá: số tiền mỗi của phiếu khi phát hành: tối thiểu cổ phiếu là 10 ngàn đồng, trái phiếu 100 ngàn đồng ở VN

Thị giá: giá mua bán trên thị trường hằng ngày

Giá niêm yết: mức giá cổ phiếu thực hiện trong phiên giao dịch đầu tiên ( giá lên sàn lần đầu tiên)

Giá khớp lệnh: giá 2 bên thỏa thuận mua bán với nhau trong một thời điểm nhất định ( thay đổi thường xuyên theo giờ)

Giá đóng cửa: mức giá tại lần khớp cuối cùng trong ngày giao dịch

Giá mở cửa là mức giá khởi đầu cho một phiên giao dịch, chẳng hạn như phiên ATO tại TP HCM Trong khi đó, giá tham chiếu được sử dụng để xác định giới hạn dao động và biên độ giá, thường dựa trên giá đóng cửa hoặc giá trung bình của ngày giao dịch trước đó, tùy thuộc vào từng sàn giao dịch.

Biên độ giao động giá: giới hạn dao động giá tối đa trong một phiên so với giá tham chiếu.

Phương thức khớp lệnh

Khớp lệnh là quá trình hoàn tất giao dịch giữa người mua và người bán trong hệ thống giao dịch trực tuyến, nơi các phương thức khớp lệnh được sắp xếp theo nguyên tắc ưu tiên thị trường để thực hiện giao dịch chứng khoán với mức giá hợp lý Khi tham gia giao dịch, nhà đầu tư đóng vai trò là người mua hoặc người bán, trao đổi chứng khoán với giá và số lượng xác định Tất cả thông tin giao dịch được công khai, cho phép nhà đầu tư theo dõi và quản lý danh mục đầu tư một cách hiệu quả Giá được sử dụng trong giao dịch tại thời điểm khớp lệnh được gọi là giá khớp lệnh.

Hệ thống giao dịch thực hiện việc so khớp lệnh mua và bán chứng khoán dựa trên nguyên tắc ưu tiên theo giá và thời gian.

- Lệnh đặt mua với mức giá cao hơn sẽ được ưu tiên mua trước

Giá tham chiếu của cổ phiếu X trên thị trường là 52 ngàn Nếu bạn đặt lệnh mua cổ phiếu với giá 54 ngàn trong khi người khác đặt mua ở mức 53 ngàn, bạn sẽ được ưu tiên khớp lệnh trước.

- Lệnh bán có mức giá thấp hơn được ưu tiên thực hiện trước

Khi giá cổ phiếu A là 30 ngàn đồng, nếu một người đặt lệnh mua với giá 31 ngàn đồng và bạn đặt lệnh mua với giá 32 ngàn đồng, bạn sẽ được ưu tiên khớp lệnh trước.

Trong trường hợp các lệnh mua hoặc bán cùng mức giá, ưu tiên sẽ được dành cho lệnh nào được đặt trước Điều này có nghĩa là lệnh đặt trước sẽ được thực hiện trước, đảm bảo tính công bằng trong giao dịch.

Khi bạn đặt mua cổ phiếu A với giá 30 ngàn, nếu có người khác cũng đặt mua với cùng mức giá, lệnh của bạn sẽ được ưu tiên nếu bạn đặt trước Điều này có nghĩa là thời gian đặt lệnh sẽ quyết định ai là người mua trước.

Nếu lệnh được được đặt chưa khớp lệnh thì bạn có thể hủy lệnh hoàn toàn không mất phí [6]

BỘ PHÂN LỚP ĐA THỨC VÀ ỨNG DỤNG TRONG DỰ BÁO CHỨNG KHOÁN

Bộ phân thức đa lớp

2.1.1 Tổng quan về đa thức Đa thức là một biểu thức toán học bao gồm các biến và hệ số, được kết hợp bằng các phép toán số học như cộng, trừ, nhân và mũ Các phần tử trong đa thức được gọi là hạng tử của đa thức [7] Đa thức được xác định là một biểu thức có dạng:

P (x) = a 0 + a 1 x + a 2 x 2 + a 3 x 3 + + a n x n (Chữ cái P được lấy từ Polynomial)

Trong đó P (x) là đa thức, a0, a1, a2, , an là các hệ số, x là biến và n là một số nguyên không âm

Các đa thức thường được phân loại với nhau dựa trên 2 thuộc tính chính là số mũ lớn nhất và số lượng hạng tử của đa thức đó

Dựa vào số mũ lớn nhất, đa thức có thể được phân loại thành bậc 3 như 2x^3 + 4 và bậc 1 như x + 1 Ngoài ra, theo số lượng hạng tử, -x được gọi là đơn thức, x + 2 là nhị thức, và 2x^3 + x - 4 là tam thức.

2.1.2 Tổng quan về bộ phân lớp đa thức Để giải quyết các mối quan hệ đầu ra/đầu vào phi tuyến tính, PC cung cấp một phương pháp hiệu quả để mô tả chúng Với việc sử dụng bộ phân loại đa thức, ta có thể mô hình một chuỗi dữ liệu đầu vào/đầu ra bằng cách xác định một tập hợp các tham số, còn được gọi là trọng số, để đảm bảo rằng các vectơ đặc trưng đa chiều, đại diện cho chuỗi đầu vào, được ánh xạ tốt nhất đến chuỗi đầu ra tương ứng Với vấn đề cụ thể về dự đoán giá cổ phiếu, chúng ta sử dụng các giá cổ phiếu lịch sử của cổ phiếu đang được nghiên cứu để hình thành một chuỗi các vectơ đặc trưng đầu vào Sau đó, ta sử dụng bộ phân loại đa thức để dự đoán giá cổ phiếu trong tương lai tương ứng với mỗi vectơ đặc trưng đầu vào Tóm lại, PCs là một công cụ hữu ích để mô hình hóa các mối quan hệ đầu ra/đầu vào phi tuyến tính, và chúng có thể được sử dụng để dự đoán giá cổ phiếu dựa trên các giá cổ phiếu lịch sử [8]

Ví dụ: Ta có dữ liệu đầu vào lần lượt là giá cổ phiếu của 5 ngày như sau: 45,

45.5, 46, 45, 44.7 Thì từ chuỗi giá trị cổ phiếu đầu vào này, bộ phân lớp đa thức có thể dự đoán giá cổ phiếu của ngày thứ 6, có thể là 45,…

Ứng dựng bộ phân lớp đa thức trong dự báo chứng khoán

Bước 1: Xây dựng ma trận đầu vào X từ tập dữ liệu chứng khoán và ma trận giá thực tế cho các dự đoán T

Ma trận X được tạo ra từ tập dữ liệu đầu vào với n dòng và d cột, có tổng cộng n*d phần tử Tương tự, ma trận T cũng được hình thành từ tập dữ liệu đầu vào với n dòng và t cột, chứa n*t phần tử.

Giá trị của d và t do người dùng quyết định Mỗi dòng tiếp theo của ma trận X và

T sẽ là giá của ngày tiếp theo của dòng trước

 d: là số ngày dùng để dự đoán cho giá cổ phiếu tiếp theo, do người dùng quy định

 n: số dòng của ma trận X và ma trận T (n = số dòng dữ liệu của tập train - d – t +1)

 t: số ngày mà ta muốn dự đoán giá cổ phiếu từ d ngày trước đó

 x1, x2, xn: Các vector chứa giá của d ngày mà ta muốn dùng để dự đoán

 t1, t2, tn : Các vector chứa giá của t ngày mà ta muốn dự đoán

 a1, a2, an : Giá cổ phiếu của mỗi ngày

Bước 2: Xây dựng hàm p(xi) dưới dạng đa thức

Từ ma trận X, ta xây dựng các hàm p(xi) là một đa thức bậc 2 (i nhận giá trị từ 1

 xi là vector chứa các giá trị tương ứng với dòng thứ i của ma trận X

Hình 2.3: Các vector xi tương ứng với ma trận X

Ví dụ: Với d=2, p(xi) được thành đa thức có dạng: p(x i ) = [1 a i a i+1 a i 2 a i+1 2 a i *a i+1 ]

Hình 2.4: Các vector xi được khải triển dưới dạng đa thức bậc 2

Bước 3: Xây dựng ma trận M chứa các hàm p(xi)

Ma trận M có n dòng và 1 cột (Mn*1), ứng với mỗi hàm p(xi) sẽ là một phần tử trong ma trận M

Bước 4: Tính ma trận trọng số w

Sau khi xây dựng ma trận M và T, chúng ta áp dụng sai số bình phương trung bình để xác định ma trận trọng số w Ma trận w được tính theo công thức: w = (M T M) -1 M T T.

Hình 2.6: Triển khai phép tính M T M

Hình 2.7: Triển khai ma trận W

Bước 5: Tiến hành dự đoán giá cổ phiếu tương lai

Sau khi xây dựng ma trận trọng số w, ta dự đoán giá cổ phiếu tương lai theo công thức: t z =w.p(z)

 t z : ma trận chứa giá cổ phiếu dự đoán

 z: giá cổ phiếu của d ngày trước đó mà ta dùng để dự đoán [8]

Hình 2.8: Triển khai ma trận T z

Ví dụ: Dự đoán giá cổ phiếu của một tập dữ liệu nhỏ như sau:

Dữ liệu của một mã cổ phiếu có giá ngày đóng của như sau (dữ liệu tập train):

Tập dữ liệu đầu vào lấy từ ngày 2/1/2021 đến 2/10/2021

Yêu cầu: dự đoán giá cổ phiểu ngày tiếp theo từ 2 ngày trước đó

Bước 1: Xây dựng ma trận X và T

Ma trận X là ma trận có 6 dòng và 2 cột:

Hình 2.9: Ví dụ triển khai ma trận X

Ma trận T là ma trận có 6 dòng và 1 cột:

Hình 2.10: Ví dụ triển khai ma trận T

Bước 2: Xây dựng hàm p(xi) dưới dạng đa thức

Hình 2.11: Ví dụ triển khai các xi dưới dạng đa thức bậc 2

Bước 3: Xây dựng ma trận M chứa các hàm p(xi)

Hình 2.12: Ví dụ ma trận M

Bước 4: Xây dựng ma trận trọng số W

Hình 2.13: Ví dụ ma trận W

Bước 5: Tiến hành dự đoán giá cổ phiếu tương lai

Hình 2.14: Ví dụ ma trận T z

Cài đặt

Numpy, pandas, math, dateime, dateutil.parse

2.3.2 Các hàm và tham số

- Chức năng: Tạo ra ma trận giá dùng để dự đoán X và ma trận giá thực tế T

- Kết quả trả về: Trả về ma trận X chứa dữ liệu giá chứng khoán để dự đoán và ma trận T chứa giá chứng khoán thực

+ d: số ngày dùng để dự đoán

+ t: số ngày mà ta muốn dự đoán

+ data: tập dữ liệu chứng khoán ban đầu

+ priceIndex: Index của cột dữ liệu chứa giá chứng khoán mà ta muốn dự đoán, được người dùng chọn

- Chức năng: Chuyển ma trận X thành ma trận đa thức

- Kết quả trả về: Ma trận M chứa các dữ liệu chứng khoán đã được biến đổi thành các đa thức

+ X: Ma trận chứa dữ liệu dùng để dự đoán X

- Chức năng: Chuyển đổi một vector gồm nhiều số thành dạng đa thức của vector đó

- Kết quả trả về: Trả về một đa thức bậc 2

Chức năng của mô hình là thực hiện dự đoán bằng cách tìm kiếm ma trận trọng số w, ma trận này chứa các tham số giúp phản ánh chính xác mối quan hệ giữa dữ liệu đầu vào và đầu ra.

Kết quả trả về là ma trận trọng số w, phản ánh mối tương quan giữa dữ liệu dự đoán và dữ liệu thực tế.

+ t: số ngày mong muốn dự đoán

+ data: tập dữ liệu training

+ priceIndex: Index của cột dữ liệu chứa giá mà mình muốn dự đoán

- Chức năng: Tiến hành dự đoán giá chứng khoán dựa trên tập dữ liệu test và ma trận trọng số tính được

- Kết quả trả về: Ma trận chứa giá chứng khoán dự đoán được và ma trận chứa giá thực tế

+ w: Ma trận trọng số sau khi tính được từ model

+ t: số ngày muốn dự đoán

+ priceIndex: Index của cột dữ liệu chứa giá chứng khoán muốn dự đoán

CÁC MÔ HÌNH HỌC SÂU VÀ ỨNG DỤNG TRONG DỰ BÁO CHỨNG KHOÁN

Các mô hình học sâu

3.1.1 Mô hình Recurrent Neural Network (RNN)

RNN (Mạng Nơ-ron Hồi tiếp) là một mô hình mạng nơ-ron nhân tạo được thiết kế để xử lý nhiều loại dữ liệu khác nhau, bao gồm hình ảnh, âm thanh và văn bản, đặc biệt là các dữ liệu có tính thời gian RNN có khả năng lưu trữ thông tin từ các chuỗi trước đó trong trạng thái ẩn của nó, với cấu trúc bao gồm các nơ-ron liên kết theo dạng chuỗi, tạo thành một mạng nơ-ron truyền thẳng.

Khác với các mạng nơ-ron thông thường, mạng nơ-ron hồi tiếp (RNN) sở hữu một trạng thái ẩn trong mỗi nơ-ron Trạng thái ẩn này được tính toán dựa trên trạng thái ẩn của nơ-ron trước đó kết hợp với dữ liệu đầu vào tại thời điểm hiện tại.

3.1.1.2 Cấu trúc của một mạng RNN

Hình 2.1: Cấu trúc mạng RNN

RNN (Mạng nơ-ron hồi tiếp) bao gồm một chuỗi các đơn vị nơ-ron được gọi là "cell" (tế bào) kết nối theo thứ tự Mỗi cell nhận hai đầu vào: một từ phần tử hiện tại của chuỗi và một từ trạng thái ẩn của cell trước đó Trạng thái ẩn này chứa thông tin về chuỗi đã xử lý trước đó và được truyền qua các cell, ảnh hưởng đến kết quả của cell tiếp theo.

RNN thường được mô tả dưới dạng đồ thị có hướng, trong đó mỗi nút tương ứng với một cell, có cạnh vào từ nút trước và cạnh ra đến nút tiếp theo Điều này cho phép RNN xử lý dữ liệu chuỗi với độ dài khác nhau một cách hiệu quả.

Bước 1: Tính trạng thái ẩn tại thời điểm t:

- Dữ liệu đầu vào bao gồm:

+ Trạng thái ẩn ở thời điểm trước (ht-1)

+ Input đầu vào tại thời điểm t (xt)

- Ban đầu, RNN được khởi tạo với một trạng thái ẩn đầu vào ℎ là một vector 0 hoặc được khởi tạo ngẫu nhiên

- Trạng thái ẩn tại thời điểm t được tính theo công thức:

 ℎ : Trạng thái ẩn tại thời điểm − 1

 ℎ : Trạng thái ẩn tại thời điểm

 : Ma trận trọng số giữa đầu vào và trạng thái ẩn

 : Ma trận trọng số giữa trạng thái ẩn của cell trước và trạng thái ẩn của cell hiện tại

 : bias để điều chỉnh ht

Bước 2: Tính kết quả đầu ra

- Kết quả đầu ra được tính theo công thức sau:

 : Vectơ đầu ra của cell tại thời điểm t

 : Ma trận trọng số giữa trạng thái ẩn của cell hiện tại và output

 ℎ : Trạng thái ẩn tại thời điểm t

 : Biases của trạng thái ẩn

Trong quá trình huấn luyện mô hình RNN, việc tối ưu hóa được thực hiện bằng cách cập nhật trọng số và bias nhằm giảm thiểu sai số giữa đầu ra dự đoán và đầu ra thực tế Quá trình này sử dụng phương pháp lan truyền ngược (backpropagation) kết hợp với thuật toán gradient descent.

3.1.1.4 Ưu nhược điểm của RNN

RNN (Mạng nơ-ron hồi tiếp) có khả năng xử lý và dự đoán dữ liệu chuỗi nhờ vào việc lưu trữ thông tin lịch sử qua trạng thái ẩn Điều này cho phép RNN mô hình hóa và dự đoán các chuỗi dữ liệu phức tạp, bao gồm ngôn ngữ tự nhiên và âm thanh.

Mạng nơ-ron hồi tiếp (RNN) có khả năng học và lưu trữ thông tin từ tất cả các phần tử trong chuỗi dữ liệu, không chỉ từ phần tử hiện tại mà còn từ các phần tử trước đó Điều này cho phép RNN nắm bắt và áp dụng kiến thức về sự phụ thuộc dài hạn giữa các phần tử trong chuỗi một cách hiệu quả.

 Phải thực hiện tuần tự, không tối ưu hóa được khả năng tính toán của CPU

Vấn đề gradient vanishing và exploding thường xảy ra trong mạng RNN khi số lượng lớp quá nhiều hoặc khi sử dụng hàm kích hoạt phi tuyến Hiện tượng này gây khó khăn trong quá trình huấn luyện mạng do gradient không thể lan truyền hiệu quả qua các lớp.

RNN thường gặp khó khăn trong việc học cách phụ thuộc vào khoảng cách giữa các phần tử trong chuỗi dữ liệu Khi khoảng cách giữa các phần tử quá lớn, mạng RNN không thể lưu giữ thông tin quan trọng, dẫn đến việc không thể nhận diện mối quan hệ giữa các phần tử trong chuỗi.

3.1.2 Mô hình Long Short-Term Memory (LSTM)

LSTM (Long Short-Term Memory) là một loại mạng nơ-ron thuộc lớp RNN (Recurrent Neural Network), được phát triển để xử lý dữ liệu chuỗi dài Mạng LSTM giúp khắc phục vấn đề mất mát thông tin trong quá trình lan truyền ngược của mạng RNN, từ đó cải thiện khả năng học và dự đoán các mẫu trong dữ liệu chuỗi.

Mô hình LSTM đã được áp dụng rộng rãi trong nhiều tác vụ xử lý ngôn ngữ tự nhiên (NLP) như dịch máy, phân loại văn bản và sinh văn bản tự động Ngoài ra, LSTM còn được sử dụng trong các lĩnh vực khác như nhận dạng tiếng nói, phân tích hình ảnh và dự báo thị trường tài chính.

3.1.2.2 Cấu trúc của một mạng LSTM

Hình 3.2: Cấu trúc mạng LSTM

Mạng LSTM có cấu trúc tương tự như RNN, với chuỗi các đơn vị nơ-ron gọi là "cell" được kết nối theo thứ tự Khác với RNN, mỗi "cell" trong LSTM có ba đầu vào, cho phép lưu trữ và quản lý thông tin trong thời gian dài LSTM sử dụng các cơ chế gọi là "cổng" để kiểm soát thông tin được lưu trữ và thông tin bị bỏ qua, với các hàm kích hoạt sigmoid quyết định thông tin nào sẽ được giữ lại Mỗi cell trong mạng LSTM bao gồm ba cổng chính.

Cổng quên (forget gate) là một thành phần quan trọng trong mạng nơ-ron, giúp quyết định thông tin nào sẽ bị loại bỏ từ trạng thái trước đó của cell Điều này cho phép tính toán lại lượng thông tin được giữ lại trong bộ nhớ dài hạn, nâng cao hiệu quả xử lý dữ liệu.

Cổng đầu vào (input gate) đóng vai trò quan trọng trong việc quyết định thông tin nào sẽ được lưu trữ từ dữ liệu đầu vào và trạng thái trước đó của cell Nó tính toán lượng thông tin cần thêm vào bộ nhớ dài hạn dựa trên trạng thái ẩn trước đó và dữ liệu đầu vào tại mỗi thời điểm.

 Cổng đầu ra (output gate): quyết định thông tin nào sẽ được chọn để đầu ra từ trạng thái hiện tại của cell [13]

3.1.2.3 Quá trình hoạt động của mô hình LSTM

Bước 1: Tính toán lượng thông tin được giữ lại trong bộ nhớ dài hạn tại thời điểm t:

- Giông như mô hình RNN, Ban đầu, LSTM được khởi tạo với một trạng thái ẩn đầu vào ℎ là một vector 0 hoặc được khởi tạo ngẫu nhiên

Hình 3.3: Quá trình tính toán lượng thông tin được giữ lại trong bộ nhớ dài hạn

Dữ liệu đầu vào của mô hình bao gồm hai thành phần chính: trạng thái ẩn của nơ-ron trước đó, được gọi là bộ nhớ ngắn hạn (ht-1), và dữ liệu đầu vào tại thời điểm hiện tại, ký hiệu là xt.

 # : Tỉ lệ thông tin của bộ nhớ dài hạn được giữ lại

 xt: dữ liệu đầu vào tại thời điểm t

 ht-1: bộ nhớ ngắn hạn tại thời điểm trước

 bf: biases để điều chỉnh ft

Ứng dụng trong dự báo chứng khoán

3.2.1.1 Công dụng của giai đoạn training

Giai đoạn training là bước quan trọng nhất trong việc xây dựng các mô hình học máy và học sâu Trong giai đoạn này, dữ liệu được đưa vào mô hình để học, từ đó rút ra các mối quan hệ và đặc trưng của dữ liệu Mục tiêu của quá trình này là tối ưu hóa hàm mất mát (loss function) nhằm cải thiện độ chính xác của dự đoán.

Quá trình huấn luyện mô hình diễn ra qua nhiều vòng lặp, trong đó mô hình dự đoán kết quả cho tập dữ liệu huấn luyện Sau đó, độ chính xác của các dự đoán được đánh giá và trọng số của mô hình được cập nhật dựa trên kết quả này Quá trình này tiếp tục cho đến khi mô hình đạt được độ chính xác mong muốn trên tập dữ liệu huấn luyện hoặc khi số vòng lặp tối đa đã được thực hiện.

Tập dữ liệu huấn luyện là tập hợp các mẫu dữ liệu thiết yếu cho việc đào tạo các mô hình học máy và học sâu Những mô hình này sẽ phân tích và học hỏi các mối quan hệ cũng như đặc trưng trong dữ liệu để cải thiện khả năng dự đoán và xử lý thông tin.

Việc lựa chọn tập dữ liệu training là rất quan trọng trong quá trình huấn luyện mô hình Tập dữ liệu training cần đủ lớn để đại diện cho toàn bộ dữ liệu mà mô hình cần học, đồng thời không chứa dữ liệu nhiễu, giúp mô hình nhận diện các mối quan hệ phức tạp Tuy nhiên, nếu dữ liệu quá phong phú và phức tạp, có thể dẫn đến hiện tượng overfitting Thông thường, một phần của tập dữ liệu training sẽ được tách ra làm tập dữ liệu validation, nhằm đánh giá hiệu suất của các mô hình học máy hoặc học sâu trong quá trình huấn luyện Tập dữ liệu validation đóng vai trò quan trọng trong việc điều chỉnh và cải thiện hiệu suất mô hình, đồng thời giảm thiểu nguy cơ overfitting.

Overfitting là hiện tượng không mong muốn trong học máy và học sâu, xảy ra khi mô hình quá tập trung vào bộ dữ liệu đào tạo mà không thể tổng quát hóa hiệu quả trên tập dữ liệu kiểm thử Khi gặp phải overfitting, mô hình có thể đạt độ chính xác cao trên dữ liệu huấn luyện nhưng lại cho kết quả kém trên dữ liệu kiểm thử.

Hiện tượng overfitting xuất hiện khi mô hình không đạt được độ chính xác cao trên tất cả các tập dữ liệu, mà chỉ có độ chính xác tốt trên tập dữ liệu huấn luyện Nguyên nhân của hiện tượng này có thể đến từ nhiều yếu tố khác nhau.

 Kích thước của tập dữ liệu training nhỏ, không đủ để mô hình học các đặc trưng của dữ liệu hoặc khái quát dữ liệu

 Tập dữ liệu training chứa một lượng lớn dữ liệu không liên qua, gọi là nhiễu dữ liệu

Mô hình học máy hoặc học sâu có thể trở nên quá phức tạp với nhiều tham số, dẫn đến việc chúng học các đặc trưng chi tiết của dữ liệu huấn luyện nhưng không thể khái quát hóa hiệu quả trên tập dữ liệu kiểm tra.

Một số biện pháp tránh overfitting:

Sử dụng tập dữ liệu lớn và không bị nhiễu là yếu tố quan trọng giúp các mô hình học nhận diện được các đặc trưng tổng quát của dữ liệu Việc lựa chọn dữ liệu training phù hợp không chỉ cải thiện hiệu suất của mô hình mà còn giúp tránh tình trạng overfitting.

Giảm độ phức tạp của mô hình là cần thiết để tránh hiện tượng overfitting Điều này có thể thực hiện bằng cách giảm số lượng tham số trong mô hình hoặc lựa chọn các mô hình có kiến trúc đơn giản hơn.

Regularization là một kỹ thuật quan trọng trong huấn luyện mô hình học máy, giúp giảm thiểu hiện tượng overfitting Kỹ thuật này hoạt động bằng cách giới hạn giá trị của các tham số, từ đó giảm độ phức tạp của mô hình.

Hai kỹ thuật phổ biến trong việc điều chỉnh mô hình là L1 Regularization (Lasso regularization) và L2 Regularization L1 Regularization sử dụng hàm mất mát thông thường kèm theo một đại lượng bổ sung, được tính bằng tổng giá trị tuyệt đối của các tham số nhân với tham số alpha (α), giúp loại bỏ những đặc trưng không quan trọng bằng cách đưa một số tham số về 0, từ đó giảm thiểu số lượng tham số và tăng tính khái quát, ngăn chặn hiện tượng overfitting Trong khi đó, L2 Regularization cũng kết hợp hàm mất mát thông thường với một đại lượng bổ sung, nhưng tính tổng bình phương các giá trị tham số Khi giá trị alpha tăng, các tham số trong mô hình có xu hướng giảm, giúp tăng tính ổn định và giảm nguy cơ overfitting.

Dropout là một kỹ thuật Regularization được sử dụng trong các mạng nơ-ron để ngăn chặn hiện tượng overfitting Kỹ thuật này hoạt động bằng cách ngẫu nhiên loại bỏ một số nơ-ron trong quá trình huấn luyện, giúp mô hình không quá phụ thuộc vào bất kỳ nơ-ron cụ thể nào Nhờ đó, Dropout tăng cường khả năng tổng quát của mô hình, ngăn chặn việc học quá chính xác trên tập dữ liệu huấn luyện mà không đạt hiệu suất cao trên tập dữ liệu kiểm tra.

Data augmentation là kỹ thuật mở rộng tập dữ liệu huấn luyện bằng cách tạo bản sao và áp dụng các biến đổi như xoay, lật và cắt ảnh Kỹ thuật này tăng cường độ đa dạng của dữ liệu, giúp mô hình học được các đặc trưng khác nhau và quan trọng của dữ liệu.

Early stopping là một phương pháp hiệu quả để giảm thiểu hiện tượng overfitting trong quá trình huấn luyện mô hình Kỹ thuật này cho phép dừng quá trình huấn luyện khi không còn sự cải thiện đáng kể nào về hiệu suất, từ đó ngăn chặn mô hình học quá sâu vào các đặc trưng của tập dữ liệu huấn luyện.

Underfitting là hiện tượng mà các mô hình học máy và học sâu không thể nắm bắt đầy đủ các đặc trưng của tập dữ liệu đầu vào Kết quả là mô hình không đạt hiệu suất cao, cả trên tập dữ liệu huấn luyện lẫn tập dữ liệu kiểm thử.

MÔ HÌNH LAI GHÉP GIỮA POLYNOMIAL CLASSIFER VÀ MÔ HÌNH HỌC SÂU

Lai ghép tuần tự theo mô hình cộng

Mô hình kết hợp giữa hai phương thức, bao gồm mô hình tuyến tính và mô hình phi tuyến, cụ thể là Polynomial Classifier và một mô hình học sâu, được thực hiện theo thứ tự: trước là mô hình tuyến tính và sau là mô hình phi tuyến Sự kết hợp này mang lại hiệu quả và độ chính xác cao hơn so với việc sử dụng các mô hình đơn lẻ, đặc biệt trong lĩnh vực dữ liệu chứng khoán, nơi dữ liệu thuộc dạng chuỗi thời gian có thể chứa cả thành phần tuyến tính và phi tuyến tính Đây là minh chứng rõ ràng cho tính hiệu quả và chính xác của mô hình kết hợp này.

Mô hình tuyến tính Polynomial Classifier tiếp cận dữ liệu chuỗi thời gian bằng cách thực hiện dự đoán trực tiếp, phản ánh xu hướng tổng thể của tập dữ liệu Các phần dữ liệu dự đoán không chính xác sẽ được xem như thành phần phi tuyến và được mô hình hóa bằng các phương pháp học sâu.

Hình 4.1: Mô hình lai ghép tuần tự

4.1.2 Quá trình tạo mô hình lai ghép Đầu tiên dữ liệu được đưa vào mô hình Polynomial Classifer để tiến hành dự đoán và đưa ra kết quả Sau đó kết quả được trừ khỏi chuỗi dữ liệu ban đầu theo công thức

(1) Lúc này L ^ t sẽ cho kết quả chính xác hơn với các điểm dữ liệu tuyến tính

 Nt là dữ liệu dư dùng làm đầu vào cho mô hình học sâu

 yt là giá trị thực của chứng khoán

 Lˆt là kết quả dự đoán bởi mô hình Polynomial Classifer

Tiếp theo, Nt được sử dụng làm dữ liệu đầu vào cho mô hình học sâu, và kết quả dự đoán thu được là chuỗi N^t, được gọi là chuỗi lỗi phi tuyến tính dự báo.

Kết quả dự đoán cuối cùng của mô hình kết hợp giữa Polynomial Classifier và mô hình học sâu được tính bằng tổng của kết quả dự đoán từ hai mô hình, được biểu diễn bằng công thức: y ^ t = L ^ t + N ^ t.

Lai ghép song song

Mô hình lai ghép theo phương thức cộng kết hợp hai loại mô hình: một mô hình tuyến tính và một mô hình phi tuyến, cụ thể là mô hình Polynomial Classifier và một mô hình học sâu Các mô hình con được thực hiện song song trên cùng một tập dữ liệu, và kết quả của mỗi mô hình được sử dụng để tính toán sai số Cuối cùng, sự kết hợp của các kết quả này mang lại hiệu quả cao hơn cho kết quả tổng hợp.

Mô hình dự đoán chuỗi thời gian sử dụng hai phương pháp chính: Polynomial Classifier để thực hiện dự đoán tuyến tính và mô hình học sâu để đưa ra các dự đoán phi tuyến tính Kết quả từ hai phương pháp này sẽ được sử dụng để tối ưu hóa sai số bằng cách tìm ra hệ số phù hợp Cuối cùng, hai kết quả dự đoán sẽ được nhân với hệ số tương ứng và cộng lại để tạo ra dự báo cuối cùng.

Hình 4.2: Mô hình lai ghép song song

4.2.2 Quá trình tạo mô hình lai ghép Đầu tiêu dữ liệu chứng khoán ban đầu được đưa vào cả 2 mô hình là Polynomial Classifer và mô hình học sâu Kết quả dự đoán sẽ được tính toán theo công thức Khi ω càng gần 1 thì độ ảnh hưởng của mô hình Polynomial Classifer càng thấp đến kết quả, dộ ảnh hưởng của mô hình học sâu thì càng cao và ngược lại ω*y' + (1- ω)*y''

 ω: Trọng số cho thấy độ ảnh hưởng của mô hình Polynomial Classifer tới kết quả cuối cùng, được tính theo công thức

 y’, y’’ : Kết quả dự đoán của mô hình Polynomial Classifer và mô hình học sâu

Trọng số ω được tính toán sao cho sai số MSE cho ra là nhỏ nhất, trong đó MSE được tính theo công thức:

 Ti: Là giá trị thật của cổ phiếu vào điểm i

 Yi: Là giá trị dự đoán của cố phiếu vào điểm i

 Y’i và Y’’i : lần lượt là giá trị dự đoán của Polynomial Classifer và mô hình học sâu tại điểm i

Để tối thiểu hóa giá trị của MSE, ta cần tính toán giá trị của ω Công thức tính ω được xác định như sau: ω = ∑ ) H = G = GG < = GG.

Sau khi tính được ω thì t có thể thay vào công thức (3) và tính được kết quả dự đoán cuối cùng [25]

ĐÁNH GIÁ VÀ THỰC NGHIỆM

Môi trường thực nghiệm

Quá trình thực nghiệm được thực hiện trên môi trường như sau:

- Môi trường phần cứng: Máy tính laptop Asus TUF 2020, SSD 252Gb, Ram 8GB, CPU intel 10300H

- Môi trường phần mềm: Ngôn ngữ lập trình Python, công cụ Visual Studio 2019, Framework dijango.

Các tập dữ liệu thực nghiệm

Hình 5.1: Tổng qua tập dữ liệu XRX

Dữ liệu lịch sử giá cổ phiếu của Xerox Corporation, một công ty toàn cầu của Mỹ, chuyên cung cấp giải pháp tài liệu, dịch vụ và sản phẩm công nghệ, là nguồn thông tin quan trọng cho các nhà đầu tư.

The dataset, sourced from Kaggle (https://www.kaggle.com/datasets/jacksoncrow/stock-market-dataset?select=stocks), comprises 10,908 rows, representing trading days from March 1, 1977, to April 1, 2020, and includes seven attributes Each attribute in the dataset holds significant meaning, contributing to a comprehensive analysis of stock market trends over the specified period.

+ Open: Giá đóng cửa của phiên giao dịch hôm trước + High: Mức giá cao nhất trong 1 chu kỳ theo dõi biến động

+ Low: Mức giá thấp nhất trong 1 chu kỳ theo dõi biến động

+ Close: Giá thực hiện tại lần khớp lệnh cuối cùng trong ngày giao dịch

+ Adj Close: Giá đóng cửa được điều chỉnh

+ Volume: Khối lượng giao dịch

Biểu đồ về giá lịch sử của dữ liệu:

Hình 5.2: Biểu đồ thể hiện sự phân bố giá của cổ phiếu của tập dữ liệu XRX

Hình 5.3: Tổng qua tập dữ liệu DXC

Tập dữ liệu chứa giá cổ phiểu lịch sử của DXC Technology Company là một công ty tư vấn và dịch vụ công nghệ đa quốc gia của Mỹ

The dataset, sourced from Kaggle (https://www.kaggle.com/datasets/jacksoncrow/stock-market-dataset?select=stocks), comprises 11,993 rows, representing 11,993 trading days from June 1, 1972, to April 1, 2020, and includes seven attributes Each attribute in the dataset holds significant meaning, contributing to comprehensive stock market analysis.

Hình 5.4: Biểu đồ thể hiện sự phân bố giá của cổ phiếu của tập dữ liệu DXC

Hình 5.5: Tổng qua tập dữ liệu ARNX

Dữ liệu lịch sử giá cổ phiếu của Arconic Corporation, một công ty công nghiệp Mỹ chuyên về kỹ thuật và sản xuất kim loại nhẹ, cung cấp cái nhìn sâu sắc về hiệu suất tài chính của doanh nghiệp này.

The dataset, sourced from Kaggle, encompasses 5,094 rows representing trading days from March 1, 2000, to April 1, 2020, and includes seven attributes Each attribute within the dataset provides critical insights into stock market performance during this period.

Hình 5.6: Biểu đồ thể hiện sự phân bố giá của cổ phiếu của tập dữ liệu ARNX

Hình 5.7: Tổng qua tập dữ liệu DCO

Ducommun Incorporated là một công ty sản xuất công nghệ, chuyên thiết kế và xây dựng các hệ thống điện tử, cấu trúc hàng không và các sản phẩm kỹ thuật với độ tin cậy cao Dữ liệu lịch sử về giá cổ phiếu của công ty này phản ánh sự phát triển và ổn định trong ngành công nghiệp công nghệ.

Nguồn dữ liệu: Dữ liệu được lấy từ website kaggle

The dataset consists of 5,094 rows, representing trading days from March 1, 2000, to April 1, 2020, and includes seven attributes Each attribute provides valuable insights into stock market performance during this extensive period.

+ Open: Giá đóng cửa của phiên giao dịch hôm trước

+ High: Mức giá cao nhất trong 1 chu kỳ theo dõi biến động

Hình 5.8: Biểu đồ thể hiện sự phân bố giá của cổ phiếu của tập dữ liệu DCO.

Các tiêu chí đánh giá

5.3.1 Độ chính xác Độ chính xác của mô hình được đánh giá bằng các chỉ số sau:

MSE (Mean Squared Error) là chỉ số đo lường sai số bằng cách tính trung bình bình phương của sự khác biệt giữa giá trị thực tế và giá trị dự đoán Giá trị MSE luôn không âm, và càng gần 0 thì mô hình càng chính xác Để tính MSE, ta bình phương các sai số từ các điểm đến đường hồi quy, giúp giảm độ phức tạp và tăng trọng số cho các sai lệch lớn Việc cải tiến mô hình nhằm giảm thiểu MSE sẽ giúp dự báo chính xác hơn và gần gũi với dữ liệu thực tế MSE thấp đồng nghĩa với dự báo tốt hơn và mô hình hiệu quả hơn.

Hình 5.9: Công thức tính MSE

RMSE: Root Mean Square Error (RMSE) hoặc Root Mean Square Deviation

RMSD là căn bậc hai của trung bình các sai số bình phương, trong khi RMSE thể hiện độ lệch chuẩn của các phần dư (sai số dự đoán).

Hình 5.10: Công thức tính RMSE

MAE (Mean Absolute Error) đo lường độ lớn trung bình của các sai số trong tập hợp dự đoán bằng cách tính giá trị trung bình của sự khác biệt tuyệt đối giữa dự đoán và giá trị thực tế MAE xử lý các giá trị ngoại lai tốt hơn so với MSE (Mean Squared Error), vì MSE tính bình phương sai số, làm tăng ảnh hưởng của các giá trị ngoại lai và có thể tác động tiêu cực đến các tham số của mô hình.

Hình 5.11: Công thức tính MAE

MAPE: Mean Absolute Percent Error(MAPE) Trung bình độ lệch tương đối

MAPE (Mean Absolute Percentage Error) đo lường độ chính xác của dự báo bằng cách xem xét độ lệch tương đối giữa giá trị dự báo và giá trị thực tế Mô hình có MAPE thấp cho thấy độ chính xác cao hơn trong việc dự đoán.

Hình 5.12: Công thức tính MAPE.

Các trường hợp thực nghiệm

Các thí nghiệm được tiến hành trên mô hình học sâu gồm 1 lớp đầu vào, 1 lớp ẩn và 1 lớp đầu ra Số lượng nơ-ron trong lớp đầu vào được cố định là 30, tương ứng với 1 tháng, trong khi số nơ-ron ở lớp đầu ra chỉ có 1.

Trường hợp 1: Chọn lựa mô hình tốt nhất khi thay đổi số noron lớp ẩn từ 50 tới

70 step = 1 chạy trên cả 4 tập dữ liệu

Trong trường hợp 2, chúng ta tiến hành so sánh các mô hình như PC, RNN, GRU, LSTM, tuantu và songsong, với số lượng nơ-ron trong lớp ẩn được giữ cố định theo trường hợp 1 Việc so sánh này không chỉ tập trung vào độ chính xác của từng mô hình mà còn xem xét thời gian thực thi để đánh giá hiệu quả tổng thể.

Kết quả thực nghiệm

Trường hợp 1: Chọn lựa mô hình tốt nhất khi thay đổi số noron lớp ẩn từ 50 tới

70 step = 1 chạy trên cả 4 tập dữ liệu

Kết quả sai số của mô hình RNN trên 4 tập dữ liệu với số noron của lớp ẩn từ

Model Số_Noron MSE RMSE MAE MAPE

Mặc dù RNN có giá trị MSE, RMSE và MAE cao hơn LSTM và GRU, cho thấy sai lệch lớn trong dự đoán giá chứng khoán, nhưng MAPE của RNN lại thấp, chỉ ở mức 0.014752, cho thấy tỷ lệ lỗi trung bình của mô hình này khá thấp.

GRU có hiệu suất dự đoán tương đương với LSTM, mặc dù giá trị MSE và RMSE của GRU cao hơn Tuy nhiên, giá trị MAE và MAPE của GRU không khác biệt so với LSTM Điều này cho thấy GRU sử dụng một mạng nơ-ron phức tạp hơn với 65 neurons.

Mô hình LSTM đạt giá trị MSE, RMSE và MAE thấp nhất trong ba mô hình, chứng tỏ hiệu suất dự đoán của nó vượt trội hơn so với RNN và GRU Mặc dù LSTM sử dụng số lượng neurons tương đương với RNN, nhưng giá trị MSE và RMSE của LSTM vẫn thấp hơn, cho thấy khả năng dự đoán chính xác hơn của mô hình này.

Model Số Noron MSE RMSE MAE MAPE

Mô hình RNN và LSTM cho thấy giá trị MSE và RMSE tương đối gần nhau, cho thấy khả năng dự đoán tương đương và hiệu quả hơn so với GRU, mô hình này có giá trị MSE và RMSE cao hơn trong trường hợp này.

Mô hình GRU có giá trị MAE thấp nhất trong ba mô hình, chứng tỏ khả năng dự đoán gần với giá thực tế nhất Tuy nhiên, giá trị MAPE của GRU lại cao hơn so với RNN và LSTM, cho thấy tỷ lệ lỗi trung bình của mô hình này cũng cao hơn.

Mô hình LSTM có giá trị MAE cao nhất trong ba mô hình, cho thấy sự sai lệch lớn hơn trong dự đoán giá chứng khoán Tuy nhiên, LSTM lại có giá trị MAPE thấp hơn so với RNN, chỉ ra rằng tỷ lệ lỗi trung bình của nó thấp hơn.

Model Số Noron MSE RMSE MAE MAPE

Nhận xét:RNN, GRU và LSTM có giá trị MSE và RMSE tương đối gần nhau, không có sự chênh lệch lớn giữa các mô hình

Các mô hình RNN, GRU và LSTM đều có giá trị MAE tương đương, chứng tỏ rằng khả năng dự đoán và độ chính xác của chúng là tương tự nhau.

Mô hình GRU có giá trị MAPE cao nhất trong ba mô hình, cho thấy rằng tỷ lệ lỗi trung bình của nó cao hơn so với RNN và LSTM Tuy nhiên, sự chênh lệch giữa các giá trị MAPE không đáng kể.

Model Số_Noron MSE RMSE MAE MAPE

Các mô hình RNN, GRU và LSTM cho thấy giá trị MSE, RMSE và MAE tương đối cao, điều này chỉ ra rằng các mô hình này không đạt được độ chính xác trong việc dự đoán giá chứng khoán trong trường hợp này.

Mô hình RNN đạt giá trị MAPE thấp nhất trong ba mô hình, chỉ ở mức 0.010642, cho thấy rằng tỷ lệ lỗi trung bình của nó thấp hơn so với các mô hình GRU và LSTM.

Mô hình GRU có giá trị MAPE cao nhất trong ba mô hình, đạt mức 0.024562, cho thấy tỷ lệ lỗi trung bình của nó cao hơn đáng kể so với các mô hình RNN và LSTM.

Trong trường hợp 2, chúng ta sẽ tiến hành so sánh các mô hình như PC, RNN, GRU, LSTM, tuantu và songsong, với số nơ-ron ở lớp ẩn được cố định theo trường hợp 1 Mục tiêu là đánh giá cả độ chính xác và thời gian thực thi của từng mô hình để tìm ra sự khác biệt và hiệu quả của chúng trong việc xử lý dữ liệu.

Tập dữ liệu XRX model MSE RMSE MAE MAPE Thời gian train

Mô hình GRU nổi bật nhất về sai số tổng quan, thể hiện hiệu suất vượt trội với các chỉ số MSE, RMSE và MAE thấp nhất Điều này chứng tỏ GRU có khả năng dự đoán gần với giá trị thực tế nhất so với các mô hình đơn lẻ khác.

Mô hình kết hợp bộ phân lớp đa thức và mạng nơ-ron (tự tuần tự và song song) thể hiện hiệu suất vượt trội khi xét đến sai số tương đối (MAPE), với tuần tự PCGRU đạt giá trị MAPE thấp nhất là 0.178497351 Điều này chứng tỏ rằng mô hình PCGRU kết hợp có tỷ lệ lỗi trung bình thấp nhất, đồng thời cho thấy khả năng dự đoán tương đối chính xác.

Mô hình RNN đơn lẻ nổi bật với thời gian huấn luyện và dự đoán thấp nhất trong số các mô hình đơn lẻ Ngược lại, các mô hình kết hợp bộ phân lớp đa thức và mạng nơ-ron, bao gồm cả tự tuần tự và song song, có thời gian huấn luyện và dự đoán cao hơn do độ phức tạp của chúng.

Tập dữ liệu ARNC model MSE RMSE MAE MAPE Thời gian train

PC 280.3867 16.74475 16.62941 0.672613 1.063251 15.50238 RNN 0.331808 0.576028 0.409595 0.016581 0.112131 11.9794 GRU 0.308437 0.555371 0.391388 0.015819 0.357973 25.26217 LSTM 0.490785 0.70056 0.482428 0.018091 0.389865 24.41597 Tuần tự PC

Tiêu đề	Ứng Dụng Dự Báo Giá Chứng Khoán Bằng Mô Hình Lai Ghép Giữa Bộ Phân Lớp Đa Thức Và Mô Hình Học Sâu
Tác giả	Trần Văn Duy, Trần Công Trường
Người hướng dẫn	TS. Nguyễn Thành Sơn
Trường học	Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh
Chuyên ngành	Công Nghệ Thông Tin
Thể loại	Đồ Án Tốt Nghiệp
Năm xuất bản	2023
Thành phố	Tp. Hồ Chí Minh

Định dạng
Số trang	80
Dung lượng	6,22 MB