1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Quản lý xây dựng: Dự đoán giá cổ phiếu doanh nghiệp xây dựng và bất động sản trên thị trường chứng khoán Việt Nam dựa trên tiếp cận máy học

97 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Dự đoán giá cổ phiếu doanh nghiệp ngành xây dựng và bất động sản trên thị trường chứng khoán Việt Nam dựa trên tiếp cận máy học
Tác giả Trần Đỗ Quốc Trung
Người hướng dẫn TS. Dương Minh Đức, TS. Đỗ Tiến Sỹ
Trường học Trường Đại học Bách Khoa – Đại học Quốc gia Thành phố Hồ Chí Minh
Chuyên ngành Quản Lý Xây Dựng
Thể loại Luận văn Thạc sĩ
Năm xuất bản 2021
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 97
Dung lượng 3,12 MB

Nội dung

Phạm vi bài luận này sẽ nghiên cứu ứng dụng 05 mô hình ANN, KNN, LSTM, ARIMA, Linear Regressive trong việc dự đoán dựa trên bộ dữ liệu chứng khoán của 175 doanh nghiệp trong đó có 80 DN

Trang 1

ĐẠI HỌC QUỐC GIA TP HCM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

-

TRẦN ĐỖ QUỐC TRUNG

KHOÁN VIỆT NAM DỰA TRÊN TIẾP CẬN MÁY HỌC

Chuyên ngành:Quản Lý Xây Dựng

Mã số :8580302

TP HỒ CHÍ MINH, tháng 08 năm 2021 LUẬN VĂN THẠC SĨ

Trang 2

CÔNG TRÌNH HOÀN THÀNH TẠI:

TRƯỜNG ĐẠI HỌC BÁCH KHOA – ĐẠI HỌC QUỐC GIA THÀNH

PHỐ HỒ CHÍ MINH

Cán bộ hướng dẫn khoa học 01: TS Dương Minh Đức Chữ ký:

Cán bộ hướng dẫn khoa học 02: TS Đỗ Tiến Sỹ Chữ ký:

Cán bộ chấm phản biện 01: PGS.TS Trần Đức Học Chữ ký:

Cán bộ chấm phản biện 02: TS Phạm Hải Chiến Chữ ký

Luận văn thạc sĩ được bảo vệ tại trường Đại học Bách Khoa Thành phố

Hồ Chí Minh vào ngày 20 tháng 08 năm 2021 (trực tuyến)

Thành phần hội đồng đánh giá LVThs gồm:

1 Chủ tịch hội đồng TS Nguyễn Anh Thư

2 Ủy viên Thư ký TS Phạm Vũ Hồng Sơn

Xác nhận của Chủ tịch Hội đồng đánh giá Luận văn và Trưởng Khoa quản lý chuyên ngành sau khi Luận văn đã được sửa chữa (nếu có)

CHỦ TỊCH HỘI ĐỒNG KHOA KỸ THUẬT XÂY DỰNG

Trang 3

ĐẠI HỌC QUỐC GIA TP.HCM

Họ tên học viên : TRẦN ĐỖ QUỐC TRUNG MSHV: 1870107

Ngày sinh : 29/08/1980 Nơi sinh: Vĩnh Long

liệu

TS DƯƠNG MINH ĐỨC TS ĐỖ TIẾN SỸ

Trang 4

Sẽ không có chúng ta của ngày hôm nay cũng như chúng ta của ngày mai nếu không có sự hy sinh thầm lặng của gia đình; sự tận tụy, tâm huyết của những người thầy, người cô đáng kính; sự động viên chân thành, lớn lao từ phía bạn bè và sự hỗ trợ nhiệt tình của lãnh đạo trường Đại học Bách Khoa thành phố Hồ Chí Minh Đặc biệt, tôi xin gởi lời tri ân sâu sắc đến Thầy Ts Đỗ Tiến Sỹ và Thầy Ts Dương Minh Đức – những người đã luôn ở bên cạnh tôi, giúp đỡ, động viên tôi trong quá trình học tập và nghiên cứu Xin cảm ơn hai Thầy rất nhiều, bằng tất cả sự chân thành trong trái tim tôi!

Trân trọng!

TP.HCM, Ngày 09 tháng 07 năm 2021

Người thực hiện luận văn

Trang 5

TÓM TẮT

Quản lý xây dựng là việc sử dụng kinh nghiệm, kiến thức chuyên môn để lập

kế hoạch kiểm soát chi phí, tiến độ, an toàn và chất lượng nhằm hoàn thành dự án một cách tốt nhất có thể và đạt được hiệu quả của dự án Cũng có thể nói, mục tiêu cuối cùng của việc quản lý là tạo ra lợi nhuận và giá trị cho doanh nghiệp trong lĩnh vực bất động sản, xây dựng và các giá trị xã hội nhân văn mà dự án mang lại Hai ngành này chiếm tỷ trọng lớn và có ảnh hưởng đến triển vọng kinh tế vĩ mô của một Quốc gia Một đất nước với bức tranh kinh tế ảm đạm, trì trệ sẽ kéo theo giá cổ phiếu tụt giảm ngược lại, khi đất nước có nền kinh tế năng động, phát triển thì thị trường chứng khoán sẽ sôi sục giá cổ phiếu cũng sẽ tăng đặc biệt trong hai lĩnh vực trên Những năm trở lại đây, tình hình thị trường chứng khoán nước ta tăng giảm thất thường khiến một số doanh nghiệp không kịp trở tay và lâm vào tình cảnh khó khăn Với tinh thần trách nhiệm cao của một người từng tham gia hoạt động nhiều năm trong nghề đã thôi thúc tôi nghiên cứu đề xuất một công cụ dự báo tiên tiến có độ chuẩn xác cao theo hướng tiếp cận máy học

Phạm vi bài luận này sẽ nghiên cứu ứng dụng 05 mô hình ANN, KNN, LSTM, ARIMA, Linear Regressive trong việc dự đoán dựa trên bộ dữ liệu chứng khoán của 175 doanh nghiệp (trong đó có 80 DN bất động sản và 95 DN ngành xây dựng) được niêm yết trên sàn chứng khoán Việt Nam từ 2017 đến 21/01/2021 lấy từ các website đáng tin cậy (Vietstock, Vndirect,…) trong phân tích và đánh giá đối sánh nhằm tìm một mô hình đạt hiệu suất tốt nhất cho bộ dữ liệu này Ngoài

ra, bài luận cũng nêu ra các giải pháp cho doanh nghiệp và đầu tư với xu hướng tăng, giảm của giá trị cổ phiếu

Trong khoảng thời gian này, học viên đã tham gia nghiên cứu và công bố bài báo “Applying Transfer Learning in Stock Prediction Based on Financial New” [10] với vai trò đồng tác giả trên tạp chí Springer LNEE, 3-2021 (Scopus – Q3)

ABSTRACT

Trang 6

Construction management is the use of experience, expertise to plan cost control, schedule, safety and quality to complete the project in the best possible way and achieve the effectiveness of the project judgment It can also be said that the ultimate goal of management is to create profits and values for businesses in the field of real estate, construction and humane social values that the project brings These two industries account for a large proportion and have an impact on the macroeconomic outlook of a Country A country with a gloomy and stagnant economic picture will lead to a decline in stock prices, on the contrary, when the country has a dynamic and developed economy, the stock market will be boiling especially in these two areas In recent years, the situation of the stock market in our country has increased and decreased erratically, causing a number of businesses to be unable to react and fall into difficult situations With a high sense

of responsibility of a person who has been in the industry for many years, it prompted me to research and propose an advanced forecasting tool with high accuracy in the direction of machine learning

The scope of this essay will study and apply 05 models ANN, KNN, LSTM, ARIMA, Linear Regressive in predicting based on stock data set of 175 companies (including 80 real estate companies and 95 companies) construction companies) listed on the Vietnam Stock Exchange from 2017 to January 21, 2021, taken from reliable websites (Vietstock, Vndirect, .) in analysis and benchmarking to find a model the best performing model for this dataset In addition, the essay also outlines solutions for businesses and investments with the increasing and decreasing trend of stock value

During the time of researching and implementing this essay, students participated in the research and published the article "Applying Transfer Learning

in Stock Prediction Based on Financial New" [10] as a co-author in Springer LNEE, 3-2021 (Scopus – Q3)

Trang 7

LỜI CAM KẾT

Với tinh thần đầy trách nhiệm, tôicamkết rằng nội dung của bài luận: “Dự

đoán giá cổ phiếu doanh nghiệp ngành Xây dựng và Bất động sản trên thị

trường chứng khoán Việt Nam dựa trên tiếp cận máy học” là dự án do

bản thân nghiên cứu phát triển, chưa được công bố khoa học bởi người

khác

TP.HCM, Ngày 09 tháng 07 năm 2021

Người thực hiện luận văn

Trang 8

MỤC LỤC

Trang 9

4.2 Phương pháp phân tích bằng các mô hình học máy – mô hình đề xuất 35

5.6 Chạy thực nghiệm trên 03 bộ dữ liệu (80 mã CP nhóm BĐS, 95 mã CP nhóm

5.7.2 Trường hợp dự đoán giá trên toàn bộ dữ liệu của 175 công ty, 80 công ty lĩnh vực

Trang 10

DANH MỤC CÁC BIỂU BẢNG

Bảng 2-1 Bảng tổng hợp các nghiên cứu liên quan 4 Bảng 5-1 Tổng hợp các chỉ số của các mô hình 51 Bảng 5-2 Tổng hợp các chỉ số đo của các bộ dữ liệu 54

Trang 11

DANH MỤC HÌNH ẢNH

Hình 3-1”Linear Regression nhạy cảm với nhiễu nhỏ” [10] 15

Hình 3-2 Ví dụ về KNN với K=3, K=5 16

Hình 3-3 Minh họa hyper-plane trong SVM 17

Hình 3-4 Hình minh họa quy tắc 2 17

Hình 3-5 Minh họa quy tắc 3 18

Hình 3-6 Minh họa quy tắc 4 18

Hình 3-7 Minh họa quy tắc 5 19

Hình 3-8 Minh họa quy tắc 5 19

Hình 3-9 Mô hình mạng nơron 22

Hình 3-10 Mô hình neuron dự đoán giá vé máy bay 23

Hình 3-11 “Gradient Descent” 24

Hình 3-12 RNN có vòng lặp 27

Hình 3-13 RNN đã được trải ra 28

“Hình 3-14 RNN phụ thuộc gần” 29

Hình 3-15 RNN phụ thuộc xa 29

Hình 3-16 Module lặp trong RNN chuẩn chứa một lớp tanh duy nhất 30

Hình 3-17 “Module lặp trong LSTM chứa 4 lớpitương tác” 30

Hình 3-18 Các ký hiệu trong LSTM 31

Hình 3-19 Dây chuyền C trong LSTM 31

Hình 3-20 Cổng điều khiển thông tin 31

Hình 4-1 Cổng quên trong LSTM 36

Hình 4-2 Cổng đầu vào trong LSTM 37

Hình 4-3 Cập nhật ô trạng thái trong LSTM 37

Hình 5-1 Giao diện môi trường Google colaboratory 40

Hình 5-2 Trích xuất các thư viện bằng Python 42

Hình 5-3 Truy xuất dữ liệu công ty Hưng Thịnh từ Web bằng Python 42

Hình 5-4 Biểu đồ giá CP Công ty Hưng Thịnh bằng Python 43

Hình 5-5 Truy xuất dữ liệu thô các nhóm ngành sử dụng Python 44

Hình 5-6 Tải dữ liệu toàn bộ 175 mã CP về Google Colab bằng Python 45

Hình 5-7 Biểu đồ training và testing Công ty UDC 47

Trang 12

Hình 5-8 Biểu đồ dự đoán giá CP Cty UDC bằng LSTM 47

Hình 5-9 Biểu đồ phóng to giá trị dự đoán của mô hình LSTM 48

Hình 5-10 Biểu đồ dự đoán giá CP Cty UDC bằng ARIMA 48

Hình 5-11 Biểu đồ dự đoán giá CP Cty UDC bằng Linear regression 49

Hình 5-12 Biểu đồ dự đoán giá CP Cty UDC bằng KNN 49

Hình 5-13 Biểu đồ dự đoán giá CP Cty UDC bằng SVM 50

Hình 5-14 Biểu đồ dự đoán giá CP KNN, SVM, LSTM, ARIMA, Linear regression so với thực tế 51

Hình 5-15 Biểu đồ độ lệch chuẩn bộ dữ liệu tất cả các công ty 53

Hình 5-16 Biểu đồ độ lệch chuẩn bộ dữ liệu các công ty BĐS 53

Hình 5-17 Biểu đồ độ lệch chuẩn bộ dữ liệu các công ty XD 53

Hình 8-1 Tập Training giá CP công ty UDC 64

Hình 8-2 Tập Testing giá CP công ty UDC 64

Hình 8-3 Truy xuất kết quả mô hình LSTM 64

Hình 8-4 Truy xuất kết quả mô hình ARIMA 65

Hình 8-5 Truy xuất kết quả mô hình Linear regression 65

Hình 8-6 Truy xuất kết quả mô hình KNN 65

Hình 8-7 Truy xuất kết quả mô hình SVM 66

Hình 8-8 Truy xuất tổng hợp kết quả các mô hình 66

Trang 13

DANH MỤC CÁC TỪ VIẾT TẮT

RNN Recurrent Neural Network Mạng thần kinh tái phát

ARIMA Autoregressive Intergrated

Moving Average

Đường trung bình động tích hợp tự động hồi phục LSTM Long short-term memory Bộ nhớ ngắn hạn – dài hạn

AI Artifical Intelligence Trí tuệ nhân tạo

ANN Artificial Neural Network Mạng thần kinh nhân tạo

SVM Support Vector Machine Máy vector hỗ trợ

NYSE New York Stock Exchange Sở giao dịch chứng khoán

Trang 14

CK Chứng khoán

MAE Mean absolute error Sai số trung bình tuyệt đối

MSE Mean squared error Sai số toàn phương trung

Trang 15

1 CHƯƠNG 1 GIỚI THIỆU

1.1 Lý do chọn đề tài

Ngành XD và BĐS là những ngành có đặc thù riêng, chúng có sự tác động qua lại và tỷ lệ thuận với sự phát triển của một nền kinh tế vĩ mô Những năm gần đây, giá CP của các công ty trên sàn CK Việt Nam biến động mạnh và diễn biến rất phức tạp, có thể khiến một số DN, NĐT trong lĩnh vực XD và BĐS kịp thời phản ứng và đẩy họ vào tình thế khó khăn Vì vậy, việc nghiên cứu một phương pháp dự báo với độ chính xác cao là một nhiệm vụ không dễ dàng, đầy thử thách

và cần thiết trong thời điểm hiện nay nhằm góp phần giúp các DN, NĐT có đối sách, chiến lược hợp lý để giải quyết khó khăn có thể xảy ra trong tương lai Với mục đích này, nội dung bài luận sẽ tập trung nghiên cứu dự đoán giá CP bằng hướng tiếp cận học máy dựa trên dữ liệu CK các công ty XD và BĐS tại Việt Nam, cụ thể áp dụng các mô hình ANN, KNN, LSTM, ARIMA, Hồi quy tuyến tính (Linear Regressive) trong phân tích và đánh giá đối sánh nhằm tìm một mô hình đạt hiệu suất tốt nhất cho bộ dữ liệu này Ngoài ra, bài luận cũng nêu ra các giải pháp cho DN và NĐT với xu hướng tăng, giảm của giá trị CP

1.2 Mục tiêu nghiên cứu

- Tìm hiểu các vấn đề có liên quan đến TTCK…

- Hệ thống và cập nhật kiến thức về các mô hình học máy tiên tiến: Thuật toán ANN, KNN, LSTM, SVM, Linear Regressive …

- Dựa vào các chỉ số đo MAPE, MSE, RMSE, MAE của các mô hình tìm

ra phương pháp dự đoán có độ chính xác cao nhất

- Kết hợp giữa kết quả dự đoán và các chỉ số đo cần thiết nhằm khuyến cáo cho NĐT, các DN kịp thời có những quyết sách hợp lý

1.3 Đối tượng và phạm vi nghiên cứu

- Đối tượng nghiên cứu: là giá trị CP của 175 DN ngành XD, BĐS trên sàn

CK Việt Nam, giá dự đoán sẽ là “giá đóng cửa theo ngày”

Trang 16

- Phạm vi nghiên cứu: Các mô hình học máy dựa vào các số liệu giá lịch

sử từ 2017 đến 21/01/2021 của các công ty BĐS và XD lấy từ các website đáng tin cậy (Vietstock, Vndirect,…) nên độ chính xác và giá trị thực tiễn cao Đồng thời bài luận còn tìm hiểu về TTCK cũng như các nguyên tắc hoạt động của nó

1.4 Ý nghĩa khoa học và thực tiễn của đề tài

- Về thực tiễn: Luận văn có ý nghĩa thực tiễn với các báo cáo thực nghiệm

trên các mô hình phân tích, dự báo và đối sánh với thực tế trên dữ liệu thực tế từ các sàn CK tại Việt Nam Đề tài có thể áp dụng để dự báo trên bộ dữ liệu các ngành khác trên TTCK

đang được sử dụng rộng rãi hiện nay cho việc dự báo, các kết quả đã được phân tích đánh giá, làm rõ với độ chính xác đáng tin cậy

1.5 Kết cấu luận văn

Chương 1: Giới thiệu

Chương 2: Tổng quan

Chương 3: Cơ sở lý thuyết

Chương 4: Phương pháp luận - Mô hình đề xuất

Chương 5: Phân tích và đánh giá kết quả thực nghiệm

Chương 6: Kết luận và đề xuấti hướng nghiên cứu

Trang 17

2 CHƯƠNG 2 TỔNG QUAN

2.1 Các nghiên cứu liên quan

Năm 2012, mạng học sâu AlexNet đánh dấu bước nhảy vọt của học sâu và đánh bại các thuật toán học máy khác Mạng LSTM được đề xuất bởi Sepp Hochreiter và Jürgen Schmidhuber [1] vào năm 1997, với tính chất tuần tự thì việc áp dụng giải quyết các vấn đề liên quan đến chuỗi thời gian như giá chứng khoán rất hợp lý Mãi đến năm

2013, mạng học sâu LSTM mới trở thành đối thủ đáng gờm trong các cuộc thi về nhận dạng giọng nói, chữ viết Đến năm 2016, LSTM trở thành nền tảng không thể thiếu trong các sản phẩm mới của các hãng công nghệ khổng lồ như Google, Apple, Microsoft Cũng nhờ đó việc cài đặt mạng LSTM trên thực tế và thử nghiệm trở nên

dễ dàng hơn nhờ các công cụ phần mềm mã nguồn mở Đặc biệt với tính chất dễ tiếp cận cũng như khả năng hiện thực hoá lợi nhuận đơn giản như thị trường chứng khoán hay tiền điện tử đã thu hút rất nhiều người tham gia với các thuật toán học máy, đặc biệt là LSTM Nhưng việc chọn mô hình tinh chỉnh các tham số chuẩn là một công việc cần có kinh nghiệm chuyên sâu về cả cổ phiếu lẫn học máy Việc thực hiện tinh chỉnh bằng tay hoặc ngẫu nhiên thì tốn rất thời gian và chí phí mà không đảm bảo được hiệu quả

Dự báo giá CP là một việc rất phức tạp Hầu hết các tổ chức kinh doanh trong lĩnh vực này thường sử dụng phân tích chuỗi kỹ thuật, cơ bản hoặc phân tích chuỗi thời gian trong việc cố gắng dự đoán giá CP Tuy nhiên, các chiến lược này không dẫn đến kết quả đáng tin cậy vì chúng hướng dẫn về xu hướng và không phải là giá có độ chính xác cao nhất Cần phải sử dụng các phương pháp nâng cao để dự đoán kết quả chính xác nhất Nhiều nhà NC cũng đã dùng nhiều phương pháp khác nhau với nhiều

bộ tham số đầu vào khác nhau để dự đoán giá CP trong vài thập kỷ qua Hiện tại, các vấn đề về phân tích dữ liệu chuỗi lịch sử giá CP với nhiều mô hình học máy trong việc

dự đoán được sử dụng rộng rãi trong và ngoài nước Chúng được tóm tắt ngắn gọn và liệt kê trong bảng sau:

Trang 18

Bảng 2-1 Bảng tổng hợp các nghiên cứu liên quan

dự đoán giá cổ phiếu

“Tác giả so sánh hiệu suất dự báo của ARIMA và ANN với dữ liệu CK được công bố thu được từ

Sở giao dịch CK New York”

“Nghiên cứu sử dụng dữ liệu công bố từ NYSE trên các mô hình ARIMA và ANN được phát triển

“ARIMA và ANN đạt hiệu suất dự báo tốt, sai số của hai mô hình khá thấp trong

dự báo ngắn hạn Tuy nhiên, ANN vẫn tốt hơn so với

“Đề xuất mô hình ANN trong dự đoán giiá CP trên các thị trường CK điển hình”

“Dữ liệu được sử dụng

là giá đóng cửa hàng ngày của từng CP riêng

lẻ (khoảng 60 công ty) của sàn CK Nairobi (NSE) trong thời gian 5 năm,

“Nghiên cứu cho kết quả dự đoán với MAPE trong khoảng 0,71% đến 2,77%”

Trang 19

2008 đến 2012 (1.000 hàng dữ liệu) thu từ (Synergy 2013)

“Mô hình cơ sở ban đầu

sử dụng tỷ lệ dữ liệu thử nghiệm và đào tạo 70:30, với cấu hình là 5:

11: 11: 1, 70% dữ liệu đào tạo là

từ tháng 1/2008 – 12/2012”

“Thời gian kiểm tra trong 3 tháng từ nhóm 30% dữ liệu còn lại”

“Sử dụng KNN dự đoán nhằm hỗ trợ các NĐT, ban quản

lý, người ra quyết định và người dùng

“Áp dụng thuật toán KNN (k=5) và phương pháp hồi quy phi tuyến

để dự đoán giá CP cho một mẫu gồm năm DN

“Theo kết quả, thuật toán KNN ổn định và mạnh mẽ với tỷ lệ sai

số nhỏ nên kết quả đưa ra là hợp lý”

Trang 20

- “Internatiional

Journal of Busiiness,

Humanities and

Technoilogy, Vol 3

No 3; Marich 2013”

[4]

đưa ra giá trị chính xác và các quyết định đầu tư sáng suốt”

lớn được niêm yết trên thị trường CK Jordan”

Đề xuất thuật toán SVM để dự đoán giá

CP có độ chính xác cao

“Dựa trên SSA và lấy giá đóng cửa Chỉ số tổng hợp của sàn Thượng Hải (SSE) từ ngày 5/1/2009 đến ngày 30/9/2013”

Tác giả giới thiệu phương pháp SVM để

dự đoán

So sánh hiệu quả kết hợp SSA-SVM với SVM và kết hợp EEMD-SVM

“Dự đoán kết hợp bằng cách phân tách chuỗi chỉ số ban đầu thành các chuỗi có hàm ý kinh tế được mong muốn hơn là đưa ra các dự đoán SVM đơn thuần và các dự đoán kết hợp SSA-SVM tốt hơn so với các dự đoán kết hợp EEMD-SVM”

Trang 21

dự báo chỉ số Index trong ngắn hạn”

VN-“Dự báo chỉ số Index trong tuần đầu tiên 5/2015 để đề xuất xu hướng chiỉ

VN-số CK và tìinh hình thị trường để NĐT

và DN có cái nhìn tổng quan về TTCK

có đối sách trong thờii giian ngắn hạn”

“Sử dụng chuỗi dữ liiệu

đã có tiính dừng để ước lượng một loạt các mô hình ARiIMA sử dụng các chỉ tiiêu như AIC, SIC,…để lựa chọn mô hình ARIiMA tốt nhất.”

“Mô hiình GARCH (1, 1) sửa lỗi được

hiiện tượng phương sai saii số thay đổi mà

mô hình ARIMA (2,

1, 2) không làm được, vừa đơn giản

và có độ tổng quát cao hơn so với mô hình ARCH.”

Trang 22

2.2 Phạm vi ứng dụng

Bài luận đã nêu ra các kỹ thuật học máy tiên tiến có độ tin cậy cao trong việc dự đoán các mục vấn đề dựa vào dữ liệu quá khứ Thuật toán xử lý được các bài toán phi tuyến với nhiều yếu tố ảnh hưởng

Chính vì thế, thuật toán có thể đưa ra các dự báo trong một số lĩnh vực như sau:

+ Kinh tế, tài chính: Dự báo giá CP, chỉ số CK

+ Bất động sản: Dự báo giá nhà, giá nhà cho thuê, giá đất

+ Lĩnh vực y tế: Chẩn đoán bệnh…

+ Lĩnh vực XD: Có thể dự đoán các vết nứt, sụt lún theo thời gian và nhiều lĩnh vực khác

Trang 23

3 CHƯƠNG 3 CƠ SỞ LÝ THUYẾT

3.1 Các khái niệm liên quan chứng khoán

3.1.1 Cổ phiếu

Theo khoản 2, điều 4 Luật chứng khoán số 54/2019/QH14 ngày 26/11/2019 nêu rõ [7] “Cổ phiếu là loại chứng khoán xác nhận quyền và lợi ích hợp pháp của người sở hữu đối với một phần vốn cổ phần của tổ chức phát hành”

3.1.2 Phân loại cổ phiếu

- CP thường: “Là CP thông dụng nhất trong công ty cổ phần, nó còn được

gọi là CP phổ thông, người nắm giữ loại CP này được hưởng quyền lợi nhất định” [8]

- CP ưu đãi:

+ CP ưu đãi biểu quyết: Được hiểu là CP có số phiếu biểu quyết nhiều hơn

so với CP phổ thông Tùy thuộc vào điều lệ mỗi DN sẽ quy định số phiếu biểu quyết của một cổ phần ưu đãi là bao nhiêu, còn pháp luật không quy định + CP ưu đãi cổ tức: Loại CP này có mức cổ tức cao hơn so với CP thường hoặc mức ổn định hằng năm

+ CP ưu đãi hoàn lại: Là CP sẽ được công ty trả lại phần giá trị góp vốn nếu chủ sở hữu yêu cầu hoặc theo quy định ghi trên CP này, đồng thời có thể được chuyển đổi thành CP thường theo quyết định của Đại hội cổ đông

+ Ngoài ra các CP ưu đãi nêu trên một số DN có các loại CP ưu đãi riêng

3.1.3 Đặc điểm của cổ phiếu

- Khôngcó kỳ hạn và không hoàn vốn ngoại trừ các loại CP ưu đãi hoàn lại hoặc CP ưu đãi khác do mỗi DN quy định

Trang 24

- Tính thanh khoản: là khả năng chuyển đổi tài sản hữu hình thành tiền mặt, thời gian và chi phí chuyển đổi sẽ quyết định khả năng nhanh hay chậm Các loại

CK khác nhau có mức độ chuyển nhượng khác nhau

- Giá CP không ổn định và thay đổi theo hiệu quả SXKD của từng DN mang lại

- Khi tham gia mua, bán CP có nghĩa là chúng ta đang chơi một trò trơi đầy rủi ro

3.1.4 Các loại giá cổ phiếu

- Mệnh giá: Giá trị danh nghĩa của CP Do sự tăng trưởng của DN và sự

thay đổi của thị trường dẫn đến giá bán CP ngày càng tách khỏi giá trị danh nghĩa của CP Khi một công ty mới được thành lập,nó có công thứctính như sau:

(3.1)

Điều 13 Luật CK số 54/2019/QH14 ngày 29/11/2019 [7] quy định: “Mệnh giá của CP lần đầu chào bán ra công chúng là 10.000 đồng Việt Nam”

DN tại một mốc thời gian nào đó

(3.2)

cứ giá trị cổ tức, triển vọngtăng trưởng của DN và lãi suất thị trường để tính giá trị nội tại Giá trị này là mấu chốt quan trọng để thẩm định giá trị thực của

CP, so sánh với giá giao dịch trên thị trường, giúp chọn được phương án tối ưu

Trang 25

- Thị giá: Là giá của CP được mua bán ngay thời điểm giao dịch, theo đó

giá này có thể cao hơn, thấp hơn hoặc bằng đúng giá trị thực vào thời điểm giao dịch

3.1.5 Lợi tức của cổ phiếu

+ Cổ tức: Lấy khoản sinh lợi sau thuế trừ phần chi trả cổ tức ưu đãi và giữ

lại một khoản để tái đầu tư còn lại đem chia cho mỗi CP Mức cổ tức tùy vào lợi nhuận và chính sách cổ tức DN [9]

+ Lợi tức do chênh lệch giá: Là phần dư ra giữa giá bán ra và mua vào

của một CP Hầu hết, các NĐT với chiến lược giao dịch ngắn hạn sẽ bán ra khi giá tăng để hưởng chênh lệch [9]

3.1.6 Rủi ro của cổ phiếu

+ Rủi ro hệ thống: Là các rủi ro do tác động bởi các yếu tố ngoài tầm kiểm

soát bên ngoài DN, có tác động lớn đến toàn bộ các loại CK, chẳng hạn như dịch bệnh, thiên tai, chiến tranh, lạm phát…

+ Rủi ro phi hệ thống: Các rủi ro gây ra bởi các yếu tố tồn tại trong DN

mà ta có thể làm giảm hoặc kiểm soát khả năng ảnh hưởng của chúng Nó chỉ ảnh hưởng đến một ngành, một công ty, một hoặc nhiều CK Các yếu tố này chủ yếu do trình độ, năng lực, tư duy quản lý điều hành, các điều kiện thực tại của DN

3.1.7 Thị trường chứng khoán

TTCK là nơi các tổ chức giao dịch CK hoặc tài chính khác (trái phiếu được cung cấp cho thương mại) Đối với cổ phiếu, thị trường thường hoạt động một giao dịch người mua đưa ra mong muốn mức giá muốn mua, người bán đưa ra mức giá muốn bán, và nếu có người mua và người bán đều có mức giá phù hợp với nhau thì giao dịch sẽ được diễn ra Nếu không thì sẽ không có giao dịch nào diễn ra và chờ đợi một mức giá trong tương lai hoặc hết hạn Trong hầu hết các sản phẩm giao

Trang 26

dịch trên các sàn CK, sản phẩm thông dụng và dễ tiếp cận nhất là cổ phiếu vì nó có rất ít rào cản để mọi người có thể tham gia

Nói cách khác, TTCK là điểm giao dịch tài chính diễn ra các hình thức trao đổi, mua bán, chuyển nhượng các loại CK từ đó làm thay đổi quyền sở hữu CK Đây là thị trường cực kỳ quan trọng để thu hút nhanh chóng nguồn vốn đầu tư từ các tổ chức cá nhân trong xã hội

3.1.8 Chỉ số chứng khoán

Là chỉ số thể hiện giá trung bình ngay thời điiểm hiện tại của CK so với giá trung bình của kỳ gốc được lựa chọn, phản ánh thực trạng thị trường CK, nó được tổng hợp từ danh sách các CP theo một cách tính nhất định [9]

- Chỉ số VN30: Bao gồm nhóm 30 CP với tỷ lệ 80% tổng vốn hóa thị

trường và 60% tổng giá trị giao dịch toàn bộ thị trường được niêm yết trên HSX đồng thời có giá trị vốn hóa và thanh khoản cao nhất thị trường [9]

- Chỉ số HNX30: Dựa trên 30 CP có thanh khoản và giá trị vốn hóa tốt

nhất trên sàn CK Hà Nộii (HNX) [9]

- Một số chỉ số chứng khoán các nước trên thế giới: Chỉ số Dow Jones (Dow

Jones Averagre); chỉ số Nikkei 225; chỉ số FT-30; chỉ số CAC (Pháp); Chỉ số DAX (Đức)…

3.1.9 Các chủ thể tham gia thị trường chứng khoán

- Nhà phát hành: Là tổ chức huy động vốn thông qua sở giao dịch CK

- Nhà đầu tư: Người mua và bán chứng khoán trên các sàn giao dịch

- Các tổ chức kinh doanh: Công ty, quỹ đầu tư CK, tổ chức môi giới tài

chính…

- Các tổ chức có liên quan đến TTCK: Cơ quan quản lý Nhà nước, Sở

giao dịch CK, hiệp hội các nhà kinh doanh CK…

Trang 27

3.2 Machine Learning (Học máy)

- Artificial Intelligence (AI): Là việc sao chép trí thông minh của con

người vào máy tính và đưa ra nhiều quy tắc phải tuân theo Từ đó, máy tính có một danh sách cụ thể các hoạt động có thể phải thực hiện và đưa ra quyết định dựa trên các quy tắc này AI là một trong những chủ đề nóng nhất hiện nay, và chúng ta có thể dễ dàng thấy chúng được nhắc đến rất nhiều trên Internet

Thuật ngữ “AI” cũng có mặt trong các cuộc nói chuyện hàng ngày Bạn nghe ai đó muốn học về AI? Bạn nghe các giám đốc, quản lý, start-up nói rằng

họ muốn dùng AI để cung cấp các dịch vụ của họ Nhưng vấn đề là, nhiều trong

số những người này vẫn chưa hiểu rõ AI là gì cả Tuy nhiên, một khi đã đọc bài viết này thì phần nào đó, bạn sẽ hiểu những điều cơ bản về AI, cũng như nắm được cách mà Deep Learning - một loại Machine Learning phổ biến nhất hiện nay hoạt động

- Machine Learning: Là đề cập đến khả năng máy móc học hỏi từ các tập

dữ liệu rất lớn hơn thay vì các quy tắc được mã hóa cứng, ML cho phép máy tính

xử lý việc này hoàn toàn tự động

- Deep Learning: Thuật ngữ ám chỉ việc học sâu của máy tính được cấu

tạo bởi nhiều lớp xử lý với cấu trúc phức tạp để cố gắng mô hình hóa dữ liệu mang tính trừu tượng cao dựa trên một tập hợp các thuật toán đã được lập trình

Về cơ bản, Deep Learning là một phương pháp học máy (ML), nó cho phép chúng ta dạy một AI dự đoán đầu ra dựa trên một bộ đầu vào Cả hai loại Supervised và Unsupervised Learning đều có thể được sử dụng để dạy AI Để tìm hiểu cách Deep Learning hoạt động, chúng ta hãy thử xây dựng một dịch vụ

dự đoán giá vé máy bay Chúng ta sẽ dạy cho AI bằng cách dùng phương pháp Supervised Learning với mạng thần kinh nhân tạo ở phần sau

- Supervised Learning: Là một kỹ thuật học máy bằng cách gán các tập

dữ liệu có đầu vào (Input) và các đầu ra (Output) được kỳ vọng, nhằm mục đích tìm ra một dữ liệu mới thông qua một hàm số được tạo nên từ việc học hỏi từ

Trang 28

một tập dữ liệu huấn luyện Học có giám sát là nhómthuật toán học máyphổ biến nhất hiện nay

Khi bạn dạy một AI bằng cách sử dụng Supervised Learning, nghĩa là bạn

đã cho nó một đầu vào và nói với nó đầu ra mong đợi của bạn Nếu đầu ra được tạo bởi AI là sai thì nó sẽ phải điều chỉnh lại các tính toán của nó Quá trình này được thực hiện rất nhiều lần trên bộ dữ liệu đó cho tới khi AI không gây ra lỗi nào nữa

- Unsupervised Learning: Dạy AI bằng cách sử dụng các tập dữ liệu phi

cấu trúc, để AI tự phân loại dữ liệu một cách logic

Một ví dụ về Unsupervised Learning đó là AI dự đoán hành vi cho một trang web thương mại điện tử Nó không học bằng cách dùng một bộ dữ liệu đầu vào và đầu ra đã được gán Thay vào đó, nó sẽ tạo ra các phân loại dữ liệu đầu vào của riêng nó Nó sẽ nói với bạn loại người dùng nào có khả năng nhất

sẽ mua các sản phẩm

3.2.1 Linear Regression (Hồi quy tuyến tính)

+ Linear hay (tuyến tính): “Thẳng và phẳng” Điều này chỉ ra rằng đồ thị

một hàm số gọi là tuyến tính trong không gian hai chiều, nếu nó có dạng là một đường thẳng Tương tự là nó có dạng một mặt phẳng với không gian 03 chiều, còn không giang nhiều chiều là siêu mặt phẳng

+ Regression (Hồi quy): Từ nguồn dữ liệu đầu vào cho ra kết quả là một

giá trị thực chứ không phải phân chia thành các nhóm

Ví dụ: Bài toán đặt ra là dự đoán giá cho thuê của một căn hộ có diện tích x1 (m2), số tiện ích xung quanh căn hộ gọi là x2, khoảng cách từ căn hộ đến trung tâm của thành phố là x3 (km)

Như vậy, ta cần xây dựng hàm y = f(x) với x = [x1, x2, x3] Nhận xét rằng căn hộ có diện tích càng lớn, càng gần trung tâm, càng có nhiều tiện ích giá cho thuê sẽ càng cao

Trang 29

(3.3) (3.4)

Ta có thể nói rằng mối quan hệ Y ≈ f (x) là tuyến tiính Mặt khác, ta cần

tìim các hệ số {w1, w2, w3, w0} sao cho Y  Ȳ để có kết quả dự đoán chính xác

nhất (gọi là hồi quy) Các bài toán dạng này được gọi là hồi quy tuyến tính

- Ưu điểm của Linear Regression

+ Dễ dàng tạo ra mô hình

+ Cho kết quả rất tốt nếu sự ràng buộc của mô hình không phức tạp và ít

dữ liệu

- Các hạn chế của Linear Regression

+ Cho kết quả không chính xác nếu trong tập dữ liệu có quan sát đột biến hay còn gọi là nhiễu

Ví dụ về imối iquan ihệ igiữa ichiều icao ivà icân inặng trong biểu đồ dưới đây,

có một cặp dữ liệu nhiễu thì ikết iquả isẽ isai ikhác iđi rất nhiều

Hình 3-1”Linear Regression nhạy cảm với nhiễu nhỏ” [10]

+ Có kết quả sai với tập dữ liệu phi tuyến

Trang 30

3.2.2 K-nearest neighbor

Dựa vào thông tin các điểm dữ liệu lân cận để học và cho ra kết quả điểm

dữ liệu mới, bất kể việc có một vài điểm này bị nhiễu, phương pháp học này được gọi là KNN

Hình 3-2 Ví dụ về KNN với K=3, K=5

- Ưu điểm của KNN

+ Đơn giản trong việc tính toán của quá trình training

+ Dự đoán kết quả của dữ liệu mới rất dễ dàng

+ Bạn không cần đưa ra bất kỳ giả định nào về phân phối lớp

- Nhược điểm của KNN

+ Nếu k nhỏ và có điểm dữ liệu bị nhiễu thì KNN cho kết quả không đúng

+ Mất nhiều thời gian để tính toán khoảng cách đến từng điểm dữ liệu trong tập huấn luyện

+ K càng lớn thì độ phức tạp càng lớn

3.2.3 Support Vector Machine (SVM)

- SVM là một thuật toán học có giám sát, có thể áp dụng cho hai dạng bài toán phân loại hoặc đệ quy, trên thực tế nó chủ yếu dùng để phân loại Trong

Trang 31

(n là số lượng đối tượng) với giá trị của mỗi đối tượng sẽ là một phần của liên kết Sau đó, chúng tôi tạo một "quỹ đạo" phân chia các lớp Nói một cách đơn giản, quỹ đạo là một đường có thể chia các lớp thành hai phần riêng biệt SVM

là một giới hạn để chia hai lớp tốt nhất.[10]

Hình 3-3 Minh họa hyper-plane trong SVM

- Các quy tắc chọn siêu mặt phẳng hyper-plane

+ Quy tắc 1: Chọn một hyper-plane để phân chia hai lớp tốt nhất Trong

ví dụ này chính là đường B (Hình 3-3)

+ Qui tắc 2: Nhìn vào (Hình 3-4) ta thấy 3 đường hyper-plane (A, B và

C), các đường này đều thỏa theo quy tắc số 1 Quy tắc thứ hai là tìm khoảng cách lớn nhất từ điểm gần nhất của một lớp nào đó đến đường hyper-plane Khoảng cách này được gọi là "Margin" Như vậy, đường C đáp ứng cả quy tắc

1 và 2

Hình 3-4 Hình minh họa quy tắc 2

Trang 32

+ Quy tắc 3: Đường A là đường được chọn vì thỏa mãn quy tắc 1 và quy tắc

2, còn đường B chỉ thỏa mãn nguyên tắc 2, nhưng không thỏa mãn quy tắc 1

Hình 3-5 Minh họa quy tắc 3 + Quy tắc 4: Tiếp (Hình 3-6), chúng ta không thể tách nó thành 2 lớp

riêng biệt với 1 đường thẳng để tạo ra một phần chỉ có các ngôi sao và một khu vực chỉ có các chấm tròn Ở đây, ta sẽ chấp nhận một ngôi sao bên ngoài, SVM

có một chức năng có thể bỏ qua các ngoại lệ và tìm hyper-plane có giới hạn tối

đa, vì vậy ta có thể nói rằng SVM có các khả năng chấp nhận ngoại lệ mạnh

mẽ

Hình 3-6 Minh họa quy tắc 4

Trang 33

+ Quy tắc 5: Trong (Hình 3-7), chúng ta không thể tìm ra 1 đường

hyper-plane tương đối để chia các lớp, SVM sẽ được giải quyết bằng việc thêm một tính năng Ở đây, chúng ta sẽ thêm tính năng z = x2 + y2, bây giờ dữ liện sẽ

được biến đổi theo trục x và z như (Hình 3-8):

Hình 3-7 Minh họa quy tắc 5

Hình 3-8 Minh họa quy tắc 5

Trang 34

Trong sơ đồ trên, các điểm cần xem xét là:

+ Hàm z = x2 + y2 luôn dương, nên dữ liệu sau khi chuyển đổi trên trục x

+ Trên (Hình 3-7) các điểm tròn đỏ gần trục x và y hơn các ngôi sao nên z sẽ nhỏ hơn Do đó, trong đồ thị (z, x) điểm tròn gần trục x hơn (Hình 3-8)

SVM có một kỹ thuật được gọi là thủ thuật hạt nhân (kernel trick ) để thực hiện một số phép biến đổi dữ liệu phức tạp Bộ tách dữ liệu dựa trên nhãn hoặc đầu ra được xác định trước cho việc tìm một siêu mặt phẳng tuyến tính để tách thành hai lớp tương đối đơn giản

+ Vì bài toán có nhiều chiều, SVM cho kết quả không chính xác

+ Tính xác suất không rõ ràng: Phân lớp SVM chỉ sử dụng siêu phẳng SVM để tách các đối tượng thành hai lớp Điều này không giải thích khả năng một quan sát xảy ra trong một nhóm

3.2.4 ARIMA model

Sự kết hợp giữa quá trình tự hồi quy và đường trung bình động được gọi là quá trình tự hồi quy tích hợp ARMA (p, q) Hàm tuyến tính này bao gồm các quan sát có tính dừng trong quá khứ và các sai số dự đoán cả quá khứ và hiện tại

(3.5)

Trang 35

Khi chuỗi thời gian nghiên cứu có tính dừng thì mô hình ARMA mới cho kết quả tốt; trên thực tế, hầu hết các chuỗi thời gian không có tính này Do

đó, chúng ta cần sử dụng phương pháp lấy sai phân để chuyển chuỗi thời gian không có tính dừng thành chuỗi thời gian dừng trước khi kết hợp nó với qúa trình ARMA, ta nhận được mô hình đồng liên kết trung bình động tự hồi quy ARIMA (p, d, q)

+ Mô hình ARIMA áp dụng chuỗi dữ liệu trong lĩnh vực khoa học tự

nhiên và kỹ thuật cho kết quả rất tốt;

- Khuyết điểm:

+ Trong tài chính và kinh tế, chuỗi dữ liệu có phương sai thay đổi theo thời gian nên ARIMA hầu như không được sử dụng cho dự báo vì kết quả không tốt

Trang 36

3.2.5 Mạng Nơron (Neural Network)

Bộ não AI tiên đoán cũng có các tế bào thần kinh tương tự con người, biểu thị chúng dưới dạng các vòng tròn liên kết với nhau

Hình 3-9 Mô hình mạng nơron

Các neuron được nhóm thành 3 loại lớp (layer) như sau:

a Input Layer (lớp đầu vào)

b Hidden Layer (s) (lớp ẩn)

c Output Layer (lớp đầu ra)

Ví dụ chúng ta muốn AI dự đoán vé máy bay dự đoán giá bằng cách sử dụng những đầu vào sau (để đơn giản, chúng ta sẽ loại bỏ các vé khứ hồi):

- Origin Airport (Điểm khởi hành)

- Destination Airport (Điểm đến)

- Departure Date (Thời gian khởi hành)

- Airline (Hãng máy bay)

Lớp đầu vào nhận dữ liệu đầu vào Trong trường hợp trên, chúng ta có 4 neuron trong lớp này: Origin Airport, Destination Airport, Departure Date, và Airline Các đầu vào sẽ đi qua Input Layer để đi vào lớp ẩn

Trang 37

Lớp ẩn thực hiện các tính toán về mặt toán học đối với các đầu vào Một trong những thử thách trong việc tạo được các mạng neuron đó là quyết định

số lượng các lớp ẩn cũng như số neuron cho mỗi lớp

Từ “Deep” trong Deep Learning ám chỉ có nhiều hơn một lớp ẩn

Lớp đầu ra sẽ trả về các dữ liệu đầu ra Trong trường hợp đang giả định

đó là chúng ta sẽ nhận được thông tin về dự đoán giá

Hình 3-10 Mô hình neuron dự đoán giá vé máy bay

Vậy thì AI tính toán giá dự đoán như thế nào? Đây chính là điểm mà Deep Learning tạo ra điều kỳ diệu Mỗi một liên kết giữa các neuron gắn một trọng số (weight) Trọng số này quyết định tầm quan trọng của giá trị đầu vào Ban đầu, các trọng số được đặt ngẫu nhiên Khi dự đoán giá vé máy bay, ngày khởi hành là một trong những yếu tố “nặng” nhất Do đó, các kết nối neuron ở đầu vào ngày khởi hành sẽ có trọng số lớn

Mỗi neuron có một hàm kích hoạt (hàm f hay Activation Function) Một cách đơn giản, một trong những mục đích của hàm kích hoạt đó là “chuẩn hóa” đầu ra từ neuron đầu vào Một khi một bộ dữ liệu đầu vào vượt qua tất cả các lớp trong mạng neuron thì nó sẽ trả lại dữ liệu đầu ra qua lớp đầu ra

- Đào tạo mạng Neuron

+ Bạn cần một bộ dữ liệu lớn

Trang 38

+ Bạn cần một lượng lớn sức mạnh điện toán

Đối với AI dự đoán giá vé máy bay, chúng ta cần tìm dữ liệu lịch sử của các giá vé Và vì một lượng lớn các kết hợp có thể giữa hãng máy bay và ngày khởi hành nên chúng ta cần một danh sách vô cùng lớn các giá máy bay Để dạy AI, chúng ta cần đưa cho nó dữ liệu đầu vào từ bộ dữ liệu của chúng ta và

so sánh các dữ liệu đầu ra của nó với dữ liệu đầu ra từ bộ dữ liệu Vì AI vẫn chưa được dạy nên đầu ra của nó sẽ không chính xác Một khi chúng ta nghiên cứu kỹ toàn bộ bộ dữ liệu, chúng ta có thể tạo ra một hàm cho thấy các dữ liệu đầu ra của AI khác với các dữ liệu thật sự như thế nào Hàm này được gọi là hàm mất mát (Loss Function) Một cách lý tưởng, chúng ta muốn hàm mất mát bằng 0, đồng nghĩa với đầu ra của AI giống với đầu ra của bộ dữ liệu

- Làm thế nào chúng ta có thể tối ưu hàm mất mát?

Chúng ta thay đổi trọng số giữa các neuron Chúng ta có thể ngẫu nhiên thay đổi chúng cho tới khi hàm mất mát thấp nhưng điều này không hề hiệu quả Thay vào đó, chúng ta sử dụng một kỹ thuật gọi là Gradient Descent

3.2.5.1 Gradient Descent:

Là một kỹ thuật cho phép chúng ta tìm điểm cực tiểu của một hàm, trong trường hợp này chúng ta đang tìm điểm cực tiểu của hàm mất mát Nó hoạt động bằng cách thay đổi trọng số với các lượng gia (increment) nhỏ sau mỗi lần lặp lại bộ dữ liệu Bằng cách tính toán đạo hàm (hoặc gradient) của hàm mất mát ở một bộ trọng số cụ thể, chúng ta có thể nhìn thấy những hướng nào là nhỏ nhất

Hình 3-11 “Gradient Descent”

Trang 39

Để tối ưu hóa hàm mất mát, chúng ta cần lặp lại bộ dữ liệu nhiều lần, đó

là lý do tại sao cần phải có lượng lớn sức mạnh điện toán, việc cập nhật trọng

số bằng cách dùng Gradient Descent được thực hiện tự động Đó là điều kỳ diệu của Deep Learning Một khi chúng ta dạy cho AI (dự đoán giá vé máy bay) thì chúng ta có thể sử dụng nó để dự đoán giá trong tương lai

 Mỗi neuron gắn với một hàm kích hoạt trong dữ liệu để “chuẩn hóa” đầu

ra là kết quả của neuron

 Để dạy một mạng neuron, bạn cần một bộ dữ liệu rất lớn

 Lặp lại một bộ dữ liệu và so sánh các đầu ra sẽ tạo ra một hàm mất mát biểu thị bao nhiêu lỗi mà AI tạo ra so với các đầu ra thực tế

 Sau mỗi một lần lặp như vậy, các trọng số giữa các neuron được điều chỉnh bằng cách dùng Gradient Descent để giảm giá trị hàm mất mát

+ Các bước thực hiện Gradient Descent

thần kinh nhân tạo bằng cách cập nhật trọng số sau mỗi lần lặp

Trang 40

Khuyết điểm: Nếu learning_rate quá lớn làm cho hàm số không hội tụ,

còn ngược lại learning_rate quá nhỏ thì tốc độ training rất lâu tốn nhiều thời gian và bộ nhớ Ngoài ra, nếu hàm số có 02 global minimum sẽ có kết quả khác nhau tùy vào hai điểm khởi tạo ban đầu

3.2.5.2 Stochastic Gradient Descent (SGD): Đây là một biến thể của GD, nhằm

khắc phục thời gian hội tụ chậm của GD Sau mỗi epoch thay vì cập nhật một lần thì SGD cập nhật N lần nếu có N điểm dữ liệu trong mỗi epoch

Ưu điểm: Xử lý nhanh các bộ dữ liệu lớn

3.2.5.3 Momentum:

Đây là thuật toán tạo đà để GD tiến tới được điểm global minimum, nhưng

nó tốn nhiều thời gian để hội tụ

3.2.5.4 Adagrad:

Gán learning_rate = 0.01 trong quá trình huấn luyện thuật toán sẽ tự động điều chỉnh giảm dần Theo thời gian tốc độ học ngày càng nhỏ dẫn đến việc training bị đứng

3.2.5.4 RMSprop:

Khắc phục vấn đề tỷ lệ học giảm dần của Adagrad bằng cách chia trung bìnhcủa bình phương gradient Tuy nhiên, thuật toán này chỉ cho kết quả local minimum chứ không phải kết quả global minimum

3.2.5.5 Adam:

Là thuật toán được sử dụng nhiều nhất trong các mô hình học sâu vì nó

dễ dàng vượt qua local minimum để về đích global minimum và không mất nhiều thời gian để dừng

Ngày đăng: 03/08/2024, 12:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w