TÊN ĐÈTÀI:NHIỆMVỤVÃ NỘI DƯNG:Nhiệm vụ: Dựa trên lịch sử giácổ phiếu và dữ liệu tin tứcpháttriển mô hìnhdự đoángiácổphiếu trong tương lai.Nội dung: tìm hiểu về cổ phiếu, một số phương phá
Trang 2Công trình được hoàn thành tạiTrường Đại học Công nghiệp TP Hồ Chí Minh.
Luận văn thạc sĩđược bảo vệ tại Hội đồng chấm bảo vệLuận văn thạc sĩ Trường Đại
CHỦ TỊCH HỘI ĐÒNG TRƯỞNG KHOA KHOA MÁY HỌC TÍNH
Trang 3BỘ CÔNG THƯƠNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP Độc lập - Tự do - Hạnh phúc
THÀNH PHÓ HÒ CHÍ MINH
Họ tên học viên: Võ Duy Quí MSHV:
Ngành: Khoa Máyhọc Tính Mã ngành: 8480101
I TÊN ĐÈ TÀI:
NHIỆM VỤ VÃ NỘI DƯNG:
Nhiệm vụ: Dựa trên lịch sử giácổ phiếu và dữ liệu tin tứcpháttriển mô hìnhdự đoángiácổphiếu trong tương lai
Nội dung: tìm hiểu về cổ phiếu, một số phương pháp tiền xử lý các dữ liệu đầu vào
để xử lý dữ liệu khi đưa vào mô hình dự đoán Tìm hiểu và xâydựng, kiểm thử mô
hình dựa trên các mô hình máy học thường dùng, các mô hình học học sâu và mô
chú ý so với các phương pháp khác để tối ưu mô hình
II NGÀY GIAO NHIỆM VỤ: 30/10/2022
III NGÀY HOÀN THÀNH NHIỆM VỤ:
IV NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Nguyễn Chí Kiên
TRƯỞNG KHOA KHOA MÁY HỌC TÍNH
Trang 4LỜI CẢM ƠN
Trướctiên, tôi xin bàytỏ sự biết ơn chân thành và sâu sắcnhất tớiThầy TS Nguyễn
trình nghiên cứu, hoàn thiện luận văn thạc sĩ của mình
Công Nghiệp Tp Hồ Chí Minh đã nhiệt tình hướng dẫn và giáo dục tôi trong suốt
thực hiện luận văn tại Trường Đại học Công Nghiệp Tp Hồ Chí Minh
cạnh, động viên và khuyến khích tôi trong suốtquá trình thực hiện đề tài
Trang 5TÓM TẤT LUẬN VÃN THẠC sĩ
yếu tố đon lẻ mà là sự kếthợp của nhiều yếu tố khác nhau Khôngthể đon thuần chỉ
xác định một nguyên nhân cụ thể nào đó gây ảnh hưởng, mà thay vào đó, sự tư ongtác của nhiều yếu tố như doanh nghiệp, tình hình kinh tế, biến động chính trị, quan
ảnh hưởng đồng thời đến thị trường chứng khoán Những yếu tố trên thường đượctrình bày thông qua tin tức, bài báo Vì vậy, việc dự đoán hướng phát triển của thị
trường cổ phiếu được coi làmộttrong những lĩnhvực rộng lớn và quý báu nhấttrong
ngữ tự nhiên (NLP) để xử lý dữ liệu đầu vào, gán nhãn cho dữ liệu, kết hợp nhiều
cổ phiếu
Kết quảcủacác thử nghiệm cho thấy rằng mô hình được đề xuấtđạt đượchiệu suất
các độ đo, bao gồm độ chính xác, giátrị F1, giátrị AUC trên từng mô hình đon lẽ
Trang 6businesses, economic situations, political fluctuations, and investors' perspectives
Therefore,predictingthe development direction ofthe stock market is consideredone
of the mostextensive and valuable fields in the financial sector
processing (NLP) models to process input data, label data, and combine many
machine learning technical models (ML) for building calculation models andpredicting stock prices
closing prices
The results of the experiments show that the proposed model achieves high
including accuracy, validity Fl, AUC value on each single model
Trang 7LỜI CAM ĐOAN
Tôi xác nhận rằng kết quả thu đượctrong luận văn là kết quả củacông trình nghiên
Kiên
tài liệu(nếu có) đã được thực hiện theo quy định về trích dẫn và ghi nguồn tài liệutham khảo
Tôi hoàn toàn chịu tráchnhiệm và san sàng chấp nhận mọi hình thức kỷ luật theo quy
Học viên
(Chữ ký)
Võ Duy Quí
Trang 8MỤC LỤC
LỜI CảM ƠN i
TÓM TẤT LUẬN VĂNTHẠC sĩ ii
ABSTRACT iii
DANH MỤC HÌNH ẢNH viii
DANH MỤC BẢNG BIỂU ix
DANH MỤC TỪ VIẾT TẤT X MỞ ĐẦU xi
1 Đặtvấn đề xi
2 Mục tiêu nghiên cứu xiii
3 Đốitượng và phạm vi nghiên cứu xiii
4 Cáchtiếpcận và phương pháp nghiên cứu xiii
5 Ý nghĩa thực tiễn của đề tài xiv
TỔNG QUAN XV CHƯƠNG 1 TỔNG QUAN VỀ CHÚNGKHOÁN VÀCỔPHIẾU 1
1.1 Tổng quan về thị trườngchứng khoán Việt Nam 1
1.1.1 Vai trò của thị trường chứng khoán 4
1.1.2 Phân loại thị trường chứng khoán 6
1.1.3 Cổ phiếu 6
1.2 Tổng quan vềthông tin của giá cổ phiếu 7
1.2.1 Các nhân tố ảnh hưởng đến tính thông tin của giá cổ phiếu 7
1.2.1.1 Các nhằn tố vĩ mô 7
1.2.1.2 Các nhằn tố vi mô 8
1.3 Phân tích chứng khoán 8
1.3.1 Phân tích cơbản (Fundamental analysis) 8
1.3.2 Phân tích kỹ thuật(Technical analysis) 9
1.3.3 Các chỉ số của chứng khoán Việt Nam 9
1.3.3.1 Chỉ số VN-index 9
1.3.3.2 Chỉ sốVN30 10
1.3.3.3 Chỉ sốHXN-index 11
Trang 91.3.3.4 Chỉ số UPCOM-index 11
1.3.4 Các chỉ số phân tích cơbản của chứng khoán 11
1.3.4.1 Chỉ số EPS -Thu nhập trên một cổphiếu 11
1.3.4.2 Chỉ số PE - Hệ số giá trên thu nhập 12
1.3.4.3 Chỉ số P/B - Giá thị trường/Giátrị sổ sách 13
1.3.5 Các chỉ số phân tích kỹ thuật của chứng khoán 13
1.3.5.1 Chỉ số SMA - Simple Moving Average 14
1.3.5.2 MACD - Moving AverageConvergence Divergence 15
1.3.5.3 Bollinger bands 16
1.3.5.4 RSI - Relative Strength Index 17
CHƯƠNG 2 KỸ THUẬT MÁY HỌCVÀ PHÂNTÍCH TIN TỨC TRONG THỊ TRƯỜNG CHỨNG KHOÁN 20
2.1 Các công trình nghiên cứu liên quan 20
2.2 Các phương pháp máy học được sử dụng trong đề tài 23
2.2.1 Phương pháp LogisticRegression 23
2.2.2 Phương pháp Random forest 25
2.2.3 Phương pháp Xgboots 27
2.2.3.1 Thuật toán LightGBM 29
2.2.3.2 Thuật toán CatBoost 30
2.2.4 Phương pháp Support Vector Machine 32
2.3 Phân tích xúc cảm từ tin tức ảnh hưởngđến cổ phiếu chứngkhoán 32
2.3.1 Giới thiệu BERT 36
2.3.2 Giới thiệu FinancialBERT 38
2.4 Một số thư viện được sử dụng trong đề tài 39
2.4.1 Thư viện TA-lib 39
2.4.2 Thư viện Vnstock 39
2.4.3 Thư viện TensorFlow 39
2.4.4 Thư viện beautifulsoup 40
CHƯƠNG 3 THỰC NGHIỆM ĐÁNH GIÁ KẾT QUẢ 41
3.1 Mô hình đề xuất 41
3.2 Thu thập dữ liệu 42
3.2.1 Dữ liệu quá khứ cổ phiếu 42
Trang 103.2.2 Dữ liệu chỉ số kĩ thuật và dữ liệu chỉ số cơbản của cổ phiếu 43
3.2.3 Dữ liệu tin tức 45
3.3 Phương tiện và công cụ triển khai 46
3.4 Phương thức 47
3.4.1 Gán nhãn dữ liệu 47
3.4.2 Truy xuất và phân tích dữ liệu tin tức 48
3.4.3 Chuẩn hóa dữ liệu 50
3.4.4 Phươngthức đánh giá mô hình 50
3.4.5 Thử nghiệm mô hình 52
3.4.5.1 Mô hình thử nghiệm RandomForest chưa cócácdữ liệu phân tíchxúc cảm 52
3.4.5.2 Môhình thử nghiệm Logistic Regression với tất cảtập dữ liệu 53
3.4.5.3 Môhình thửnghiệm Support Vector Machinevới tất cả tập dữ liệu 53
3.4.5.4 Môhình thử nghiệm XGBoost với tất cả tập dữ liệu 54
3.4.5.5 Môhình thử nghiệm Randomforest với tất cả tập dữ liệu 55
3.4.5.6 Điều chỉnh các tham số trong mô hình phân loại dự đoán 55
3.5 Đánh giákết quả 57
KẾTLUẬN VÀ KIẾN NGHỊ 59
DANH MỤC CÔNGTRÌNH ĐẪ CÔNG BỐ CỦA HỌC VIÊN
PHỤ LỤC 63
LÝLỊCH TRÍCHNGANG CỦA HỌC VIÊN 71
Trang 11DANH MỤC HÌNH ẢNH
Hình 1.1 danh sách cổ phiếu VN30 11
Hình 1.2 Chỉ số MACD 15
Hình 1.3 Bollinger bands 17
Hình 1.4 Các trường hợp mua bán với phân kỳ RSI 18
Hình 2.1 Đồ thị hàm Sigmoid 24
Hình 2.2 Mô hình Random Forest, 25
Hình 2.3 Mô hình hoạt độngcủa XGBoots 27
Hình 2.4 Cách hoạt động của tính năngtăng cườngcây 29
Hình 2.5 Minh họa sự khác nhau giữa 2 cơ chế Level-wise và Leaf-wise 30
Hình 2.6 Toàn bộ tiến trình pre-training và fine-tuning của BERT 37
Hình 2.7 Thư viên vnstock 39
Hình 3.1 Mô hình đềxuấttổng quát 41
Hình 3.2 Dữ liệu quá khứ của vn-index 42
Hình 3.3 Dữ liệu cổ phiếu của Cty Vinamilk mã chứng khoán VNM 43
Hình 3.4 Dữ liệu chỉ số cơbản của mãcổ phiếu VNM 44
Hình 3.5 Dữ liệu chỉ số kỹ thuật và chỉ số cơbản của mã cổ phiếu VNM 44
Hình 3.6 Nguồn dữ liệu tin tức tài chính liên quan đến mã chứngkhoán VNM 45
Hình 3.7 Nguồn dữ liệu tin tức tài chính liên quan đến mã chứngkhoán SSI 46
Hình 3.8 Dữ liệu tin tức của mã cổ phiếu VNM sau khi thuthập và lưu trữ cục bộ48 Hình 3.9 Dữ liệu tin tức của mã cổ phiếu TCB sau khi thu thập và lưu trữ cục bộ 48
Hình 3.10 Dữ liệu tin tứcsau khi được dịch sang tiếnganh 49 Hình 3.11 Kết quả sau khi sử dụng model phân tích xúc cảm của mộtcổ phiếu 50
Trang 12DANH MỤC BẢNG BIỂU
Bảng 1.1 Diễn biến chỉ sốVN-INDEX năm 2022 3
Bảng 1.2 Giá trị vốn hóa thị trường cổ phiếu 4
Bảng 2.1 Kích thước của văn bản được thu tập từ nhiều nguồn khác nhau của bài báo [33] : 38
Bảng 3.1 Biểu đồ giácủamãcổ phiếu VNM sau khi gán nhãn dữ liệu 47
Bảng3.2 Kết quả thực nghiệm dữ liệu áp dụng model Randomforestchưathêm dữ liệu phân tích xúc cảm 52
Bảng 3.3 Kết quả thực nghiệm dữ liệu áp dụng model Logistic Regression 53
Bảng3.4 Ket quả thực nghiệm dữ liệu áp dụngmodel Support Vector Machine 53
Bảng 3.5 Ket quả thực nghiệm dữ liệu áp dụng model XGboost 54
Bảng 3.6 Kết quả thực nghiệm dữ liệu áp dụngmodel Randomforest 55
Bảng3.7 Ket quả thực nghiệm dữ liệu áp dụng model Randomforest + Randomized Seach 56
Bảng 3.8 Ket quả thực nghiệm dữ liệu áp dụng model Randomforest + Grid Search 56
Bảng3.9 kết quảthử nghiệm trên các mô hình 57
Bảng3.10 Biểu đồ ROC các mô hìnhdự đoán phân lóp 57
Bảng 3.11 Thống kê tưong quan các dữ liệu đầu vào trongmô hình dự đoán 58
Trang 13AreaUnderthe Curve
Bidirectional Encoder Representations from Transformers
Deep Learning
Doanh nghiệp nước ngoài
Earning PerShare
Machine learning
Return on Total Assets
Relative Strength Index
Simple Moving Average
Thị Trường Chứng Khoán
Extensible Markup Language
Trang 14MỞ ĐẦU
1 Đặt vấn đề
Thị trường chứng khoán ViệtNam từ khi ra đời tới nay đã trải qua các giai đoạn phát
triển thăngtrầm cùng với sự biến độngcủa nền kinh tế trong nước lúc tăng, lúc giảm
giácổ phiếu làchỉ số được chú ý nhiều nhất trên các TTCK
Biến động giácổ phiếu rấtquan trọng vì nó có thể ảnh hưởng đến lợi nhuận hoặc thua
có thể bị thua lỗ
Biến động giá cổ phiếu cũng có thể ảnh hưởng đến sự tin tưởng củacác nhà đầu tưvào công ty Nếu giá cổ phiếu của một công ty giảm đột ngột, các nhà đầu tư có thể suy nghĩ tiêu cực về tình hình hoạt động của công ty đó và có thể bán cổ phiếu ra
Giá cổ phiếu chịu ảnh hưởng của nhiều yếu tố khác nhau, trong đó có các thông tin
thông tin về cân đối tài sản, thu nhập và dòng tiền củadoanh nghiệp được trình bày trên báo cáo tài chính Tại các TTCK phát triển, đãcó nhiều nghiên cứu về mối quan
hệ giữa giá cổ phiếu với thông tin kế toán (lợi nhuận kế toán, lợi nhuận cơbản trên
mỗi cổphiếu, giátrị sổsách trên mỗi cổ phiếu) điển hình, như: Ball và Brown (1968),
Trang 15phiếu trên TTCK New York Kết quảcho thấy, lợi nhuận đượccông bố trên báo cáo
Nhắc đến TTCK, nhiều người sẽ nghĩ đến ngay nhữngchiến lược kinh doanh hết sức
lợinhuận củacông ty qua từng thời kỳ nhất định, sự vận độngcủa dòng tiền, Điều
triển của doanh nghiệp trước khi quyết định đầu tư vào mộtcổ phiếu Một côngty cóhoạt động tài chính ổn định và vững mạnh thì cổ phiếu cũng có khả năng sinh lợinhuận tốt hơn và ngược lại [1]
Thị trường chứng khoán luôn thu hút các nhà đầu tư do khả năng sinh lời cao, tuy
giảmthiểu rủi ro với hy vọng có thể tốiđa hóalợi nhuận Ngày nay, các mô hình Máy
dữ liệu cho phép các doanh nghiệp gặt hái được nhiều lợi ích nhất có thể Các mô
khoán
thực tiễn Chủ đề này đã được nhiều nhà nghiên cứu trong và ngoài nước quan tâm
và đưa ra nhiều giải pháp Mỗi giải pháp có những ưu nhược điểm khác nhau, tuynhiên sử dụng máy học là giải pháp manglại kếtquả tốt Vì cáclý do trên tôi đã lựa
Trang 16chọn đề tài “ứng dụng Machine Learning và Phân tích xúc cảm cho giao dịch cổ
2 Mục tiêu nghiên cứu
Luận văn này tập trung nghiên cứu giải quyết bài toán dự đoán giá cổ phiếu trên thị
trường cổ phiếu Việt Nam vói các cổ phiếu như Techcombank, Vinamilk, Công ty
Xem xét sự ảnh hưởng của tin tức đến những côngty có thể được đề cập trực tiếp hay
3 Đối tượng và phạm vi nghiên cứu
trí tuệnhântạo, nhằm áp dụng chúng vào phân tích môhìnhdự đoán giácổ phiếu
4 Cách tiếp cận và phương pháp nghiên cứu
Trang 17- Ảp dụng phương pháp nghiên cứu tài liệu, tậptrung vào cáckỹ thuậtxử lý số liệu, trí tuệ nhân tạo và đặcbiệt áp dụng các thuật toán máy học kết hợp xử lý ngôn ngữ
tự nhiên
5 Ý nghĩa thực tiễn của đề tài
Ýnghĩa khoa học:
trước đây đãthực hiện
giácổ phiếu
- Đánh giá hiệu suất của mô hình bằng các thực nghiệm trên tập dữ liệu thực, từ đó
Ýnghĩathựctiễn:
đưa số hiệu suất mô hình và phân tích dữ liệu
Trang 18TỎNG QUAN
mô, chỉ sốnày phản ảnh các quy luật cung cầu của thịtrường chứng khoán (TTCK)
tham giavào thị trường Phưong pháp phân tích định lượng được sử dụng rộng rãi để
đầu tư tổng thể và tác động đến thị trường chứng khoán như kết quả kinh doanh của
phiếu Những mẫu tin tứctrong túi từ ngữ không gian,trong đó phân tích mối quan
hệtiềm ẩn giữa các mẫu thống kê từ và biến động giácổ phiếu
Các bài báo tin tức được xem là dữ liệu phi cấu trúc Nó là những thông tin khôngđược định nghĩatrướcvề mô hình dữ liệu hay cách thức tổ chức nội dung của dữ liệu,
kiểu dữ liệu và trường dữ liệu rõ ràng Với sự khởi đầu của công nghệ kỹthuậtsố, dữ liệu đang pháttriển một cách mạnh mẽvà không ngừng nghỉ Đặc biệt với dữ liệu về
Trang 19Ngoài phần TÔNG QUAN, luận văn gồm các phần sau:
Phần cơ sở lý thuyếtbao gồm:
Chương 1: Tổng quan về chứng khoán và cổ phiếu
Chương 2: Kỹ thuật máy học vàphân tíchtin tức trong thị trường chứng khoán
Cuối cùng làphần Kết luận vàKiến nghị, tổng hợp các kết quả chínhcủa luận văn và
đề xuấthướng nghiên cứu tiếp theo
Trang 20CHƯƠNG TỔNG QUAN VỀ CHỨNG KHOÁN VÀ CỎ PHIẾU
phiếu Ngoài ra, chương này cũng trình bàymộtsố cơ sỡ lý thuyết liên quan
1.1 Tổng quan về thị trường chứng khoán Việt Nam
Theo điều 6 củaLuậtchứng khoán Việt Nam thì: “ Chứng khoán là bằng chứng xác
Thị trường chứng khoán giúp những người thiếu vốn huy động được vốn vàngười cóvốn chuyển vốn của mình thành vốn đầu tư Vì thế, thị trường chứngkhoáncòn được
Thị trường chứng khoán Việt Nam đã đi vào hoạt động từ năm 2000, đến nay, sau
hơn 20 năm hoạt động đãtrởthành một kênh huy động vốn dài hạn cho đầu tư phát
gần 2,9 triệu đồng, gấp gần 10 lần so với giai đoạn 2000 - 2010, đónggóp bình quân19,5%tổng mức đầu tư toàn xã hội, gópphần cơ cấu lại hệthống tàichính Việt Namtheo hướng cằn đối, bền vững hơn
Thị trường chứng khoán ngày càng đa dạng về mặt hàng hóa giao dịch Trên thị
trường cổ phiếu hiện có hơn 1.000 cổ phiếu niêm yết và đăng ký giao dịch (tính đếncuối năm 2020 có 745 cổ phiếu niêm yết và 910 cổ phiếu đăng ký giao dịch), bao
Trang 21cổ phần hóa các doanh nghiệp nhànước (DNNN) quy mô lớn gắn với niêm yết trên
thị trường chứng khoán đãtạo ra một lượng hàng hóa có chất lượng trên thị trường
Tính đến cuối năm 2020, vốn hóa thị trường đạt 64,1% GDP, gấp 7,3 lần so vói năm
2010
Thị trường chứng khoán Việt Nam đã không ngừng hoàn thiện về cấu trúc thông qua
trường chứng khoán phái sinh đã phát triển nhanh chóng với mức tăng trưởng giao
hữu hiệu
Thị trườngtrường chứng khoánViệt Nam đãpháttriển mạnh mẽ, trởthành kênh huy
phần cơ cấu lại hệthống tài chínhViệtNam theo hướng cân đối, bền vững hơn Tính
2010, [2]
chuẩn và thông lệ về quản trị công ty, năng lực quản lý, giám sát, thanh tra và thực
làm trung tâm Các chính sách quản lý TTCK đãthực hiện được mục tiêu tăng cường
tính công khai, minh bạch thông tin,
Tiếp nối đàtăng của năm 2021, chỉ số thị trường đã duytrì được mứctăng mạnh mẽ
vào ngày 6/1/2022 Tuy nhiên, sau đó trước những ảnh hưởng đến từ tình hình kinh
Trang 22tế -xã hội trong vàngoàinước,TTCKViệt Nambước vào giaiđoạn điều chỉnh mạnh
và đạt mức thấp nhất vào ngày 15/11/2022 vói chỉ số VN-Index đóng cửa ở mức
chỉ số VNIndexđạt 1007,09 điểm, giảm 34,12% so với mức đỉnh được thiết lập đầunăm và giảm 32,8% so vói cuối năm 2021 Bên cạnh đó, chỉ số HNX-Index cũng
Bảng 1.1 Diễnbiếnchỉ sốVN-INDEX năm 2022
43% sovớinăm 2021 Trong khi đó, khối lượng cổ phiếu hủy NY/ĐKGD đạt3.804triệu cổ phiếu, tăng70% so vói năm 2021 Tínhđến cuối tháng 12/2022, thịtrường có
757 cổ phiếu, CCQniêm yết trên 2 SởGDCK và 856 cổ phiếu ĐKGD trên UPCoM
với tổng giá trị niêm yết, ĐKGD đạt 1.983 nghìn tỷ đồng, tăng 14% với cuối năm
2021 (tương đương 20,8%GDP ướctính năm 2022) [3]
Trang 23Bảng 1.2 Giátrị vốn hóa thị trường cổ phiếu
■ HOSE ■■HNX ■UPCOM —• — %GDP
ỉ 1.1 Vai trò của thị trường chứng khoán
Thịtrường này hoạt động thuhút nhũng nhà giao dịch đầu tưtừ cá nhân, doanh nghiệp
Cung cấpchocác nhà đầutư một nơi đểđầu tưan toàn vàlành mạnh, thị trường này phân biệt rấtrõ, vói những ai có nhiềukiến thức và kinh nghiệm sẽ được trả công
bằng lợi nhuận họ kiếm được Những người mói cần học hỏi nhiếuhơn thì mới có
thề đứng vững ở thị trường biến động này Thị trườngcũng cung cấp rất nhiều sản
đích và phù hợpvói chiến lược kinhdoanhmà họ mong muốn
Trang 24Thị trường chứng khoán được nhiều người đầu tư vào thì nó sẽ tạo được một thị
trường cóthanh khoản lớn, họ có thể đổi được tiền mặt hoặc giao dịch chứng khoán
đanghoạt động trên thị trường có tốt haykhông,giúpcác nhà đầu tư có thể biết cách
Yeu tố thông tin là yếu tố cạnh tranh trên thị trqờng sẽ đảm bảo cho việc phân phối
phủ Đồng thời,TTCK cũng cung cấp mộtdự báotuyệtvời về các chu kỳ kinh doanh
Ngoài những tác động tích cực trên, TTCK cũng có những tác động tiêu cực nhất
túngthị trường làm nản lòng các nhà đầu tưtác động tiêu cựctói tiết kiệm vàđầu tư
Nhiệm vụ của các nhà quản lý thị trường là giảm thiểu các tiêu cực của thị trường
nhằm bảo vệquyền lọicủa các nhà đầu tư và đảm bảotính hiệu quả của TTCK
Trang 25Như vậy, vai trò của TTCK được thể hiện ởnhiều khíacạnh khác nhau Song để vai
ĩ 1.2 Phân loại thị trường chứng khoán
Thị trường so cấp: Làthị trường muabán các chứng khoán mới phát hành Trên thị
trường này, vốn từ nhà đầu tư sẽ được chuyển sang nhàpháthành thông qua việc nhà đầu tư mua các chứng khoán mới phát hành
trường socấp.Thị trường thứcấp đảm bảo tính thanh khoản cho các chứng khoán đã
1.1.3 Co phiếu
nhau gọi là cổphần Người muacổ phần gọi là cổ đông, cổ đông được cấp mộtgiấy
cổ phiếu Như vậy, cổ phiếu chính là một chứng thư chứng minh quyền sở hữu củamộtcổ đông đối với một công ty cổ phần và cổ đông là người có cổ phần thể hiệnbằng cổ phiếu
Thông thườnghiện nay các công ty cổ phần thường phát hành 02 dạng cổ phiếu: cổ
Trang 261.2 Tổng quan về thông tin của giá cỗ phiếu
cổ phiếu là chỉ dấu giúp các nhà quản trị nhận biết phản ứngcủa thị trườngvềnhữngquyết định của nhà quản trị, dovậy giúp họ đưara những quyết định quản trị tốt hơn
nhằm hướng đến làm tăng giátrị công ty Tính thông tin của giácổ phiếu cho phép
Chen, Goldstein & Jiang, 2007)
1.2.1 Các nhân to ảnh hưởng đen tính thông tin của giá co phiếu
Morck, Yeung & Yu (2000) là một trong những nghiên cứu đầu tiên đưara quan điểm
về ảnh hưởng của môi trường thể chế quốc gia đến tính thông tin của giá cổ phiếu
có môi trường thể chế yếu hoặc thiếu sự bảo vệ quyền lợi của nhà đầu tư so với các
với sự yếu kém trong việcbảo vệ quyền lợi nhà đầu tư làm cho tính thông tincủa giá
cổ phiếu thấphơn Li và cộng sự(2004) thấy rằng tính thông tincủa giácổ phiếuthấp
Fernandes & Ferreira (2009) đánh giá tác động của việc thực thi luật giao dịch nộigián đến tính thông tin của giá cổ phiếu Brockman, Liebenberg & Schutte (2010)
thấy rằng tính thông tin của giácổ phiếu giảm trong thời kì suy thoái kinh tế và tăng
thấp ở những nước có nhiều ràngbuộc khắt khe về văn hóa và ở những nước đề cao
chủ nghĩatập thể
Trang 27ỉ 2 ỉ 2 Các nhân tố vi mô
thông tin của giá cổ phiếu Brockman & Yan (2009) thấy rằng cổ đông lớn giúp cảithiện vấn đề quản trị công ty và gia tăng chất lượng của thông tin được công bố ra
bằng chứng cho thấy tính thông tincủa giá cổ phiếu có quan hệ thuận với sở hữu cổ
Trung Quốc Kim & Shi (2012) thấy rằng cổ phiếu của những công ty áp dụng cácchuẩn mực IFRS mang tính thông tin cao Haggard, Martin & Pereira (2008) cung
cấp bằng chứngcho thấy việc tăng cườngcông bố thông tin tự nguyện làm tăngtínhthông tin của giá cổ phiếu
1.3 Phân tích chứng khoán
cho việc ra quyếtđịnh đầu tư trong thị trường chứng khoán Phân tích chứng khoán
phưong pháp này vẫn gây không ít hiểu lầm cho nhà đầu tư chứng khoán, tuy có rất
nhiều cơsở và cách tiếp cận để phằn tích chứng khoán nhưng hai phương phápđược
1.3.1 Phân tích cơ bản (Fundamental analysis)
Phân tích cơbản là phương pháp nhằm xác định giá trị nội tại củacổ phiếu trên thị
trường bằng cách kiểm tra các tác nhân cơbản cótác động hoặc làm thayđổi đến giá
cổ phiếu Cụ thể, nhà phân tích cơ bản tập trung xem xét các báo cáo tài chính củadoanh nghiệp, các phân tích vĩ mô như phân tích ngành mà công ty đang hoạt động,
Trang 28phân tích trạngthái nền kinh tế hay phân tích vi mô như mô hình hoạt động và hiệu
quả quản lý củacông ty để ra quyết định đầu tư Từ đó, hoạt động phân tích co bản
1.3.2 Phân tích kỹ thuật (Technical analysis)
Phân tích kỹ thuật không giống với phân tích cơ bản Ở phương pháp này, cácnhà
phân tích sẽ căn cứ vào biểu đồ, đồ thị diễn biến giá và khối lượng giao dịch của cổ
khuyến nghị mua - bán cổ phiếutrên thịtrường.Xét vềbản chất, quan điểm phân tích
kỹthuật cho rằng có mẫu hìnhtrong quá khứcó xu hướng quyluật (lặp lại) vì vậy có
trị vốn hoá củathị trường cơ sở(ngày 28/07/2000) nhằm thể hiện xu hướng giá cổ
Hiểu đơn giản làchỉ số Vn-Index cho chúng ta biết được giá trị vốn hoá củathị trường
khi giao dịch ngày đầu tiên (ngày 28/07/2000) [6]
VN- Index được tính theo công thức sau:
Trang 29Q iì : Khối lượng đang lưu hành (khối lượngniêmyết) của cổphiếu i
Qoì: Khối lượngcủacổ phiếu i tại thờikì gốc
gồm 30 cổ phiếuđã niêm yếttrên sànchứng khoán HSX Giá trị của 30 cổ phiếu này
thị trường
trên VN30, nhà đầutư có thể xác đinh cácdoanh nghiệphàng đầu trong mộtlĩnhvực
cụ thể, từ đó nhận biết xu hướng thị trường và đưa ra quyết đinh đầu tư phù hợp
Phụ lục 14: Dự báo tỷ trọng các cố phiếu trong VN30
Trang 30Hình 1.1 danh sách cổ phiếu VN30
(HASTC), chỉ số HNX-index còn có tên làHASTC-index
chúngchưaniêm yết (Unlisted Public Company Market).Các mã cổ phiếu của doanh
ỉ 3.4 Các chỉ so phân tích cơ bản của chứng khoán
Các chỉ số co bản thường đượcnhữngnhà đầu tư nhắc đến trong trường phái phân tích cơbản Các nhà đầu tư sẽ sử dụng báo cáo tài chính, xu hướngngành, cũng như
mộtdoanh nghiệp, cũng như triển vọng của doanhnghiệp đótrong tương lai
Việc phân tích các chỉ số cơ bản sẽ giúp nhà đầu tư xác định được giátrị tương đối
của một doanh nghiệp và nắm bắt cơ hội đầu tư vào cổ phiếu của doanh nghiệp đó
[8]
EPS (Earning Per Share) được hiểu là lợi nhuận mànhà đầu tư cóthể kiếm được trên
mỗi cổ phiếu Đây là mộtchỉ sốchothấy khảnăngtạo ra lợi nhuận của công ty, như
ty EPS càng cao, tiềmnăng lợi nhuận của công tycàng lớn
Trang 31EPS = (LỢINHUẬN SAU THUẾ- LỢI TỨC ưu ĐẪI) / SỐ
Có hai loại chỉ số EPS:
Lãi cơbản trên cổ phiếu: là lãi cơbản trên cổ phiếu tính theo tỷ lệ phần trăm
chuyển đổi hoặc cổ phiếu uu đãi hoặc cổ phiếu bổ sung
một đồng lợinhuận thu được từ cổ phiếu P/E thấp có thể làdo định giá thấp, doanh
P/E = THỊ GIÁCỔ PHIẾU (PRICE)/ LỢI NHUẬN TRÊN 1
được baonhiêu lợi nhuận từ 1 đồng vốn chủ sở hữu Chỉ sốnàythường được nhữngnhà đầu tưtrường phái cơbản quantâm vì họquantâm đếnhiệu quả của việc sử dụngvốn của doanh nghiệp như thế nào
Chỉ số ROA (Return on Total Assets): thể hiện tỷsuất sinh lời trêntài sản Chỉ số này
Trang 32của doanh nghiệp đượchìnhthành dựa trên 2 yếu tố cơbản là vốn vay và vốn chủ sở
hữu.Neu chỉ số ROA đang ởmức cao thì đồngnghĩalà công ty đó đang cólợi nhuận caovới lượng đầu tư ít
Chỉ số P/B (Price to Book ratio) được dùng để so sánh giá trị hiện tại của cổ phiếu
đang lưu hành trên thị trường đối với giátrị theo sổ sách của cổ phiếu đó Hiểu một
Tống giá trị tài sản - giá trị tài sản vô hình - nợ
1.3.5 Các chỉ sỗ phân tích kỹ thuật của chứng khoán
Nếu như nhà đầu tư sử dụng phân tích cơbản để nghiên cứu doanh nghiệp, ra quyếtđịnh mua thì phân tíchkỹ thuật sẽ giúp dự đoán xu hướng giá tươnglai, giúpnhà đầu
tư tìm được thời điểm tham giaphù hợp
Các nhà phân tích kỹ thuật cũng sử dụng rộng rãi nhiều loại chỉ báo thị trường, một vài trong số đó là các biến đổitoán học của giá cả, thường bao gồm cả khối lượnglên
Trang 33xuống, dữ liệu tăng/giảm và các đầu vào khác Những chỉ sốnày được sử dụng để
giúp đánh giá liệu một tài sản có đang trongxu hướng không, vànếu nó là trong xuhướng, khả năng về hướng và sự tiếp diễn của nó lànhư thế nào Nhà phân tích kỹ
thuật cũng tìm kiếm các mối quan hệ giữa các chỉ số giá/khối lượng và các chỉ báo thị trường
kỳ thị trường chứng khoán hoặc, theo cách cổ điển, thông qua sự công nhận của các
Hiện nay có rất nhiều chuyên gia kết hợp nhiều chỉ báo kết hợp trong phân tích kỹ
tương đối, chưa cóthống kê tuyệt đối với xu hướng của giá cổ phiếu
Trong đề tài này tôi sẽ tiếpcận một số phương pháp phân tích kỹthuật được đề xuất
Trung bình động (MA)làmộtđường biểu thị giá trị trung bình cộng củadữliệu trước
mức giá mới hơn) hơn
Chỉ số đứng đầu SMA là chu kỳ giá đóng cửa mà đường trung bình động biểu thị
SMA20
Đường trung bình động phân tích biến động trung hạn: SMA 50
Trang 34Trong đó:
Gi-Gn: là mức giá đóng cửa trong 1 chu kỳcần xác định biến động
vào cuối những năm 1970 Chỉ báo này dùng đểxác địnhđà của một cổ phiếu (hoặc
đã xảy ra trong quá khứ) MACD giúp các nhàgiao dịch phát hiện các diễm vào và
Đường MACD xác định xu hướng thị trường (tăng hoặcgiảm), có giá trị bằng
Đường tín hiệu là một EMA của đường MACD (thường là EMA của 9 giaiđoạn) Phân tích kết hợp EMA với đường MACD có thể phát hiện các điểm đảo
Biểu đồ được tính dựatrên sự chênh lệch giữahai đường MACD và đường tín
hiệu
Moving Average Covergence Divergence (MACD) ■ Chi báo trung binh biền đôi phân kỳ hôi tu 12 26 close 9 -1 59 - 1 23
Trang 35Chỉ báo Trung bình động Hội tụ Phân kỳ gồm có 3 bộ phận chính: đường MACD
hồng)
Đường MACDđược tạothành bằng cách lấy đường trung bình động luỹ tiến(EMA) 12 kỳ trừ cho một đường trung bình động nhỏ hon làEMA 26 kỳ
Đường tín hiệu là đường EMA 9 kỳ của đường MACD
Biểu đồtần suất cho thấy tưong quan chênh lệch giữa đườngMACD và đường tín hiệu
phương pháp phân tích kỹ thuật Nó được phát minh vào đầu năm 1980 bởi John
biến động mạnh/ nhẹ của thị trường mà2 dải trên dưới sẽ mởrộnghoặc thu hẹp
Trongdải Bollinger, siết chặtlà 1 khái niệm quan trọngchỉ trạng thái các dải đến gần
càng cao
Trang 36Hình 1.3 Bollinger bands
phátrên hay dưới các dải đều là một sự kiện lớn Tuy nhiên, cả siếtchặtvà điểm đột
pháđềukhông phải làmột tín hiệu giao dịch
Dải giữalà đườngtrung bình độngchu kỳ 20 ngày (SM A20), được tính bằng giá trị
Dải dưới = SMA20 ngày -2x Độ lệchchuẩn 20ngày
thiệu lần đầuvào 6/1978
Trang 37RSI không thể vượt qua đỉnh cũ Phânkỳ này là dấu hiệu cho thấy khả năng đảo chiều
đỉnh/đáy trước các đỉnh/đáy của giá cổphiếu
Failure Swings: Là hiện tượng giá/chỉ báo bứt phá qua ngưỡnghỗtrợ/khángcự nhưng
không thành côngvà quaytrở lại Mầu hình Failure Swings xuất hiện khi RSI vượt
Ngưỡng hỗtrợ/kháng cự: RSI đôi khi giúp nhận biết các ngưỡng kháng cự và hỗ trợ
» XAUUSOA130 1187.9« 1188.52 1187.08 1188.04
Aug 2018 3 Aug 01:00 3 Aug 05:00 3 Aug 09:00 3 Aug 13:00 3 Aug 17:00 3 Aug 2100 6 Aug 02:00 K Au] 08:00 8 Aug 10:00 8 Aug 14:00 6 Aug 18:00 6 Aug 22:00 7 Aug 03:00 7 Aug 0700 7 Aug 11:00 7 Aug 15:00 7 Aug 19:00
Trang 38Công thức tính RSI được tính hai bướcnhư sau :
1 +
100
Average gain Average loss.
(1-6)
Trong đó:
Average gain: Mức lãi trung bình
Average loss: Mứclỗ trung bình
Trang 39CHƯƠNG 2 KỸ THUẬT MÁY HỌC VÀ PHẲN TÍCH TIN TỨC TRONG THỊ TRƯỜNG CHỨNG KHOÁN
Trong chương này, chúng ta sẽ xem xét hai phần chính Phần đầu tiên tập trung vàogiới thiệu các mô hình máy học và học sâu, đặc biệt là những kỹ thuật phổ biến được
áp dụng trong mô hình dự đoán Phần thứ hai tập trung vào giới thiệu các mô hình
chú ý trong lĩnh vực xử lý ngôn ngữ tự nhiên
Với sự pháttriển của xã hội Máy học(Machine Learning)là một lĩnh vựccủa trítuệ
thống "học" tự độngtừ dữ liệu để giải quyết những vấn đề cụ thể Ví dụ nhưcác máy
(statistical inference) tuy có khác nhau vềthuậtngữ
Thị trường chứng khoán luôn thu hút các nhà đầu tư do khả năng sinh lời cao, tuy
giảm thiểu rủi ro với hy vọngcóthể tối đahóalợi nhuận Ngày nay, cácmô hình máy
học (Machine Learning) đã trở thành một công cụ phân tích mạnh mẽ được sửdụng
để trợ giúp và quản lý đầu tư hiệu quả Các mô hình này đã được sử dụng rộng rãi
trong lĩnh vực tài chính để cung cấp những phương pháp mới nhằm giúp các nhà đầu
tư đưara quyết định tốt hơn trong việc đầu tư chứng khoán
2.1 Các công trình nghiên cứu liên quan
Trang 40giữa mức độ dự đoán đúng giáchứng khoán vói việc sử dụng các phương pháp máy
thường được giải quyết bằng mô hình LSTM (Long Short Term Memory) Nghiên cứu [14] đã thử nghiệm mô hình LSTM áp dụng cho giá mở cửa (open price) hàng
sàn giao dịch chứng khoán New York (NYSE) Kết quả cho thấynếu dữ liệu đào tạo
ít nhưng cónhiều lớp mạng hơn có thể cải thiện kết quả thử nghiệm và cungcấp các
bài báo đã xuất bản từ năm 2015 đến đầu năm 2021 về giải quyết bài toán dự đoángiáchứngkhoán Bàibáo của họ đãđánhgiá các chỉ số hiệu năng chínhcủa mô hìnhgồm RMSE, MAPE, MAE, MSE, độ chính xác, tỷ lệ Sharpe và tỷ lệ hoàn vốn Bài
báonày đã chỉ ra rằng phần lớn cácnghiên cứu bài toán dự báo giáchứng khoán sử
Côngtrình [16] đãáp dụngmô hình mạng nơ-rơn tíchchập có cải tiến tính năng học
hơn 7,38% so với mô hình LSTMtruyềnthống Công trình [17] đãsử dụng các thuật
dụng các kỹ thuật Linear Regression, Multivariate Regression, Support Vector
Regression, Decision Tree, Random Forest Regressor and ExtraTree Regressor Ket
Random Forest chưacungcấp được giátrị dự đoán chính xác cao đối với bộ dữ liệu