Các yếu tố ảnh hưởng đến sai số trong dự báo tỷ suất sinh lời của cổ phiếu đơn lẻ Ứng dụng học máy với Spark MLlib Factor affecting the error in individual stock’s return forecasting Appling machine l[.]
Bùi Thành Khoa cộng HCMCOUJS-Kỹ thuật Công nghệ, 17(1), 519 Các yếu tố ảnh hưởng đến sai số dự báo tỷ suất sinh lời cổ phiếu đơn lẻ: Ứng dụng học máy với Spark MLlib Factor affecting the error in individual stock’s return forecasting: Appling machine learning with Spark MLlib Bùi Thành Khoa1,2,4*, Trần Trọng Huỳnh3, Thái Duy Tùng4, Nguyễn Ngọc Dụng5, Nguyễn Vũ Đức4 Trường Đại học Công nghệ Thông tin, Thành phố Hồ Chí Minh, Việt Nam Trường Đại học Quốc gia Việt Nam, Thành phố Hồ Chí Minh, Việt Nam Trường Đại học FPT, Hà Nội, Việt Nam Trường Đại học Cơng nghiệp Thành phố Hồ Chí Minh, Việt Nam Trường Đại học Kinh tế Thành phố Hồ Chí Minh, Việt Nam * Tác giả liên hệ, Email: buithanhkhoa@iuh.edu.vn; 19522611@gm.uit.edu.vn THÔNG TIN DOI:10.46223/HCMCOUJS tech.vi.17.1.2245.2022 Ngày nhận: 17/04/2022 Ngày nhận lại: 26/04/2022 Duyệt đăng: 27/04/2022 Từ khóa: học máy; mơ hình định giá tài sản vốn (CAPM); thuật toán hồi quy vector hỗ trợ (SVR); Spark MLlib TĨM TẮT Mơ hình định giá tài sản vốn (CAPM) lượng hóa mối quan hệ tuyến tính lợi nhuận rủi ro hệ thống tài sản rủi ro CAPM tảng lý thuyết ngành tài đại Tuy nhiên, tính thực nghiệm CAPM chủ đề gây tranh luận nhà nghiên cứu CAPM sử dụng nhiều giả định mà khó đáp ứng thực tế Xu hướng kết hợp trí tuệ nhân tạo lý thuyết tảng tài tạo nhiều mơ hình dự báo hiệu phù hợp thực nghiệm Nghiên cứu thực nhằm 02 mục tiêu chính: Sử dụng thuật toán Support Vector Regression (SVR) tảng CAPM để dự báo tỷ suất sinh lời cổ phiếu riêng lẻ xác định yếu tố tác động đến sai số dự báo mơ hình kết hợp Nghiên cứu sử dụng liệu cơng ty niêm yết thị trường chứng khốn Thành phố Hồ Chí Minh giai đoạn từ tháng 12/2012 đến tháng 09/2020, chu kỳ theo tháng Nghiên cứu chia liệu thành 02 giai đoạn: giai đoạn 01 sử dụng để tối ưu hóa tham số giai đoạn lại sử dụng để đánh giá sai số mơ hình dựa Spark MLlib Nghiên cứu mơ hình dự báo tỷ suất sinh lời cổ phiếu sử dụng thuật toán SVR hiệu so với CAPM; nữa, nghiên cứu phát yếu tố rủi ro đặc thù công ty (VAR), rủi ro tổng thể (SD), sai số CAPM (RMSECAPM) tỷ suất sinh lời trung bình (MEAN) yếu tố ảnh hưởng đến khác biệt sai số dự báo mơ hình SVR cổ phiếu đơn lẻ ABSTRACT The Capital Asset Pricing Model (CAPM) measures the linear connection between risky asset return and systematic risk CAPM is Bùi Thành Khoa cộng HCMCOUJS-Kỹ thuật Công nghệ, 17(1), 519 a theoretical underpinning for contemporary finance The empirical character of the CAPM, on the other hand, is a contentious subject among scholars since the CAPM makes several assumptions that are difficult to satisfy in reality In practice, the trend of mixing artificial intelligence with financial foundations theory has resulted in more efficient and appropriate forecasting models The primary goals of this research are as follows: Using the CAPM and the Support Vector Regression algorithm (SVR), anticipate the return of individual stocks and identify the elements influencing the prediction inaccuracy of this combined model The analysis makes use of data from firms listed on the Ho Chi Minh City Stock Exchange from December 2012 to September 2020, on a monthly period The data is divided into two stages in the study: the first is used to optimize the parameters, and the second is used to assess the error of the model based on Spark MLlib According to research, the stock return forecasting model based on the SVR algorithm is more effective than the CAPM; Keywords: additionally, the study discovered that company-specific risk machine learning; Capital Asset (VAR), overall risk (SD), CAPM error (RMSECAPM), and mean Pricing Model (CAPM); return (MEAN) are the main factors influencing the difference Support Vector Regression; between the forecast error of the SVR model for each individual Spark MLlib stock Giới thiệu Một nhiệm vụ quan trọng khó khăn sử dụng chuỗi thời gian dự báo thị trường chứng khoán (Chen, Xiao, Sun, & Wu, 2017) Dữ liệu chuỗi thời gian giá chứng khốn thơng thường chuỗi khơng dừng khó xác định (Tay & Cao, 2001; Zhang, Lin, & Shang, 2017) chúng chuỗi ngẫu nhiên có xu hướng phi tuyến tính bị ảnh hưởng kinh tế chung, đặc điểm ngành, trị chí tâm lý nhà đầu tư (Chen & ctg., 2017; Zhong & Enke, 2017) Giả thuyết thị trường hiệu (Efficient Market Hypothesis) cho giá chứng khoán bước ngẫu nhiên (Random Walk), khó đoán trước (Fama, 1970, 1991); việc nghiên cứu mơ hình dự báo tỷ suất sinh lợi thu hút nhiều quan tâm từ giới học thuật thực nghiệm (Weng, Ahmed, & Megahed, 2017) Nghiên cứu Atsalakis Valavanis (2009); Kumar Thenmozhi (2014); Malkiel (2003) nêu chứng trái ngược tính hiệu thị trường tài Các nghiên cứu gần đề xuất mơ hình nhằm tăng hiệu dự báo dựa liệu lịch sử Những phương pháp phổ biến sử dụng để dự báo kết báo trung bình động, mơ hình tự hồi quy, phân tích khác biệt mối tương quan (Kumar & Thenmozhi, 2014; Wang, Wang, Zhang, & Guo, 2012) Gần hơn, xu tập trung nghiên cứu việc dự đoán chuỗi thời gian học máy, nhằm xử lý liệu ngẫu nhiên phi tuyến tính (Chen & ctg., 2017) Nền tảng mơ hình định giá tài sản vốn (CAPM) đề xuất từ năm 1960 dựa lý thuyết đa dạng hóa lý thuyết quản lý danh mục đầu tư Markowizt (Bui & Thai, 2021; Treynor, 1961) Mơ hình CAPM lượng hóa mối quan hệ tuyến tính rủi ro hệ thống lợi nhuận kỳ vọng tài sản rủi ro Mơ hình CAPM theo phiên SharpeLintner- Black công cụ quản lý tài sản quan trọng năm gần nhờ lợi đơn giản dễ sử dụng Mặc dù vậy, việc sử dụng CAPM thực tiễn gây nhiều tranh cãi Những nghiên cứu CAPM minh chứng tồn mối quan hệ tuyến tính tỷ số sinh lời rủi ro hệ thống beta (Black, 1972; Bui & Tran, 2021) Một số nghiên cứu phát đường thị trường chứng khoán phẳng, thách thức khung lý thuyết CAPM (Amihud, Christensen, & Mendelson, 1992; Breen & Korajczyk, 1993; Fama & French, 2021; Jagannathan & McGrattan, 1995) Bên cạnh nghiên cứu ủng hộ lý thuyết CAPM, lại có nhiều nghiên cứu phủ nhận tính thực tiễn mơ hình (Banz, 1981; Basu, 1983; Chaudhary, 2017; Fama & James, 1973; Lohano & Kashif, 2018) Mặc dù có nhiều ý kiến trái chiều, CAPM trở thành khung lý thuyết tảng lý thuyết lĩnh vực tài đại, nữa, sử dụng phổ biến thực nghiệm Trong khảo sát với tham gia 400 CFOs, 75% số thừa nhận họ sử dụng CAPM để xác định tỷ suất sinh lời kỳ vọng thị trường khoản đầu tư cổ phiếu (Graham & Harvey, 2001) Học máy (Machine Learning) phần ngành khoa học liệu Thuật ngữ “học máy” đề cập đến lĩnh vực nghiên cứu tập trung vào việc sử dụng mơ hình để đưa dự báo Để xử lý khối lượng lớn liệu, có sẵn công cụ cho phép phân phối tác vụ tính tốn nút khác cụm máy tính, để khối lượng cơng việc cân thời gian xử lý giảm xuống Về vấn đề này, công cụ Apache Hadoop Apache Spark cho phép thuật tốn chạy theo mơ hình phân tán, giúp nhà phát triển tránh tất bất tiện mà điều gây ra, chẳng hạn đồng hóa, truyền liệu khả chịu lỗi, Đặc biệt, Apache Spark có thư viện Spark ML, chứa việc triển khai số thuật toán học máy mạng nơ-ron, định, Random Forest, hồi quy, máy véc-tơ hỗ trợ (SVM) thuật toán khác Kỹ thuật hồi quy vector hỗ trợ (SVR) dự báo lượng mây sản lượng điện hệ thống lượng mặt trời Nhật Bản Kết dự báo khả quan, sai số trung bình bình phương (Root Mean Squared Erorr - RMSE) khoảng 10% sai số tuyệt đối (Mean Absolute Error - MAE) xấp xỉ 6% (da Silva Fonseca & ctg., 2012) Một nghiên cứu liên quan đến ngành lượng sử dụng thuật toán SVR với hàm kernel mũ để dự báo lượng điện máy phát so sánh với giá trị thực tế, kết dự báo tốt (Ramedani, Omid, Keyhani, Shamshirband, & Khoshnevisan, 2014) Phân tích thực nghiệm mơ hình SVR với hàm kernel mũ có khả dự báo tốt Cách tiếp cận SVR máy học để ước tính chi tiêu mua máy bay quân sự, sử dụng hàm kernel dạng mũ, cho kết đáng kinh ngạc: sai số trung bình tối thiểu (MSE) 5.37%, R2 99%, kết tốt kỳ vọng (Tong, 2015) Ứng dụng máy học lĩnh vực tài đa dạng, ví dụ nghiên cứu việc sử dụng mơ hình Fama 03 05 nhân tố (Gogas, Papadimitriou, & Karagkiozis, 2018) Các tác giả so sánh SVR với phương pháp OLS mơ hình CAPM, mơ hình Fama 03 05 nhân tố, mơ hình lý thuyết kinh doanh chênh lệch giá (APT), sử dụng liệu từ thị trường chứng khoán Mỹ cho mơ hình Fama 03 nhân tố với 1062 quan sát (07/1926 - 12/2014), mơ hình Fama 05 nhân tố với 618 quan sát (07/1963 - 12/2014), mô hình APT với 346 quan sát (02/1986 - 12/2014) Hệ số R2 hiệu chỉnh MAPE sử dụng để đo lường chất lượng dự báo mơ hình Theo kết nghiên cứu, phương pháp sử dụng SVR với hàm kernel dạng mũ dạng đa thức tỏ vượt trội so với phương pháp hồi quy OLS truyền thống xét tới MAPE hệ số R2 hiệu chỉnh Henrique, Sobreiro, Kimura (2018) sử dụng SVR để ước tính giá cổ phiếu theo ngày với mơ hình hiệu chỉnh theo thời gian Bộ liệu NASDAQ-100 Abraham, Nath, Mahanti (2001) sử dụng, tác giả tiên phong sử dụng máy học nghiên cứu thực nghiệm thị trường chứng khoán Các thuật toán đưa so sánh bao gồm Phân tích thành phần (PCA), Mạng thần kinh nhân tạo (ANN), Mạng thần kinh bóng mờ tiến hóa (NFUZZ) (Abraham & ctg., 2001) Tương tự, ANN thuật toán Máy vector hỗ trợ (SVM) sử dụng thị trường Chicago dành cho 05 hợp đồng tương lai, tác giả sử dụng Sai số bình phương trung bình chuẩn hóa (NMSE), Độ cân xứng có hướng (DS), Sai số tuyệt đối trung (MAE) (Cao & Tay, 2003) Gần đây, kỹ thuật Hồi quy vector hỗ trợ (SVR) sử dụng để dự báo giá vàng (Yuan, Lee, & Chiu, 2020), thuật toán Di truyền - Hồi quy vector hỗ trợ bình phương nhỏ (GALSSVR) sử dụng để kiểm định độ nhạy đánh giá chất lượng mơ hình thơng qua số MAPE Kỹ thuật SVR phát mối quan hệ phi tuyến tính mà phương pháp OLS không thực Tại Việt Nam, K T Tran, Banh, Nguyen (2012) kết hợp giải thuật di truyền SVR để dự đoán giá cổ phiếu thị trường chứng khoán Việt Nam; Trinh (2013) ứng dụng kỹ thuật học máy SVR để xây dựng chương trình dự đốn xu hướng tăng giảm cổ phiếu dựa theo liệu từ tập liệu Twitter Do đó, nghiên cứu sử dụng SVR dựa mơ hình CAPM để dự báo tỷ suất sinh lời cổ phiếu đơn lẻ, đồng thời xác định yếu tố ảnh hưởng đến khác biệt sai số dự báo tỷ suất sinh lời cổ phiếu đơn lẻ Việt Nam hạn chế Do đó, thơng qua sử dụng Spark MLlib, nghiên cứu tận dụng lợi mơ hình CAPM với tính hiệu thuật tốn SVR việc kết hợp CAPM SVR, qua tạo kết dự báo xác so với nghiên cứu trước nhờ vào tính ưu việt mức độ phổ biến SVR Mơ hình kết hợp xem phương pháp thay mơ hình CAPM truyền thống Lợi mơ hình khả “học” để cải thiện độ xác thơng qua việc sử dụng thuật tốn máy học, kiểm soát nhiễu, khám phá thành phần ẩn liệu, ước tính hàm phi tuyến Mơ hình có sử dụng SVR tỏ vượt trội cách tiếp cận CAPM truyền thống nhờ vào điểm Ngồi phần giới thiệu, bố cục báo sau, tổng quan lý thuyết mơ hình CAPM thuật tốn SVR trình bày phần 2, phương pháp nghiên cứu giải thích phần 3, kết thực nghiệm đưa phần Cuối cùng, phần kết luận báo phần báo Cơ sở lý thuyết 2.1 Mơ hình CAPM CAPM tập hợp ước tính tỷ suất sinh lời kỳ vọng tài sản rủi ro trạng thái cân Nó hình thành tảng lý thuyết lựa chọn danh mục đầu tư (Markowitz, 1952; H T Tran, 2020) Các giả định mô hình bao gồm: •Các nhà đầu tư e ngại rủi ro ln chọn danh mục trung bình - phương sai - hiệu •Thời gian nắm giữ danh mục kỳ đơn lẻ •Kỳ vọng nhà đầu tư •Tất tài sản cơng khai, giao dịch đại chúng, chia nhỏ tùy ý cho phép bán khống •Các nhà đầu tư vay cho vay lượng tùy ý mức lãi suất phi rủi ro •Thơng tin có sẵn cơng khai •Khơng có thuế chi phí giao dịch Nghiên cứu bắt đầu với nhà đầu tư đặt tỷ trọng � tài sản thứ i − � danh mục thị trường (0 ≤ α ≤ 1) Khi tỷ suất sinh lợi hàm theo α sau: �(�) = ��� + (1 − �)�� (1) Tính giá trị kỳ vọng phương sai ta thu kết sau: 𝐸(�(�)) = �𝐸(��) + (1 − �)𝐸(��) �2(�(�)) = �2�2(��) + (1 − �)2�2(��) + 2�(1 − �) 𝑐𝑜�(��, ��) (2) (3) Khi α thay đổi, làm cho điểm (�(�(�)), 𝐸(�(�)))thay đổi đường cong màu đỏ cắt đường biên hiệu điểm M ứng với α = (Hình 1) Hình Đường thị trường vốn (Capital Market Line, CML) hội đầu tư α thay đổi Khi tất nhà đầu tư có kỳ vọng, họ chọn danh mục cho tối ưu hóa tỉ số Sharpe: �𝑎� � 𝐸(�(�))−�� Kết danh mục M lựa chọn (ứng với α = 0) �(�(�)) Vì đường CML tiếp xúc với đường màu đỏ M nên hệ số góc hai đường phải Để đơn giản ta đặt �(�) = 𝐸(�(�)), ℎ(�) = √�2(�(�)) f hàm biểu thị mối quan hệ �(�(�))và 𝐸(�(�)) đường cong màu đỏ, tức 𝐸(�(�)) = � (�(�(�))) Khi đó: �(�) = �(ℎ(�)) Lấy đạo hàm ta được: �′(�) = �′(ℎ(�))ℎ′(�) Do đó: �′(ℎ(�)) = �′(�) ℎ′ (�) Tính tốn đạo hàm g h sau: �(�) = �𝐸(��) + (1 − �)𝐸(��) ⇒ �′(�) = 𝐸(��) − 𝐸(��) (4) ℎ2(�) = �2�2(��) + (1 − �)2�2(��) + 2�(1 − �) 𝑐𝑜�(��, ��) ⇒ 2ℎ(�)ℎ′(�) = 2��2(��) + 2(� − 1)�2(��) + 2(1 − 2�) 𝑐𝑜�(��, ��) ⇒ ℎ′(�) = 2��2(��) + 2(� − 1)�2(��) + 2(1 − 2�) 𝑐𝑜�(��, ��) 2ℎ(�) (5) Với α = ta có hệ số góc đường màu đỏ là: 𝐸(��) − 𝐸(��) ′ ℎ (�) = (𝐸(��) − 𝐸(��))�(��) (6) = + 𝑐𝑜�(��, ��) 𝑐𝑜�(��, ��) − � (��) 2√�2(��) −2�2(��) Mặt khác, đường thẳng CML qua điểm (0, ��)và điểm �(�(��), 𝐸(��)) nên có hệ số góc là: 𝐸(��)−�� Vì M đường cong màu đỏ tiếp xúc với đường CML nên hệ số góc hai �(��) 𝐸(��)−�� biến đổi tương đương ta thu được: (𝐸(��)−𝐸(��))�(��) đường Do đó: 𝑐𝑜�(��,��)−�2(��) = �(��) 𝐸(��) − �� = 𝑐𝑜�(��,��) (𝐸(��) − ��) Đặt �� = 𝑐𝑜�(��,��) ta thu cơng thức mơ hình CAPM �2(��) �2(��) quen thuộc sau: 𝐸(��) = �� + ��(𝐸(��) − ��) (7) Rủi ro hệ thống chứng khoán thị trường đo hệ số beta, hệ số đo lường mức độ đóng góp cổ phiếu vào biến động tỷ suất sinh lời danh mục Hệ số beta chứng khoán tính với độ dài khoảng thời gian 24 tháng 2.2 Thuật toán hồi quy vector hỗ trợ (SVR) Phương pháp phân lớp dựa vào thuật toán Support Vector Machine (SVM) ánh xạ từ biến độc lập với N quan sát tới không gian nhiều chiều nhằm phân lớp nhóm Phương pháp đề xuất Vapnik, sử dụng tập huấn luyện {(��, ��)}�=1,� để xây dựng mơ hình tuyến tính với biên phân lớp phi tuyến Phân lớp nhóm thực cách sử dụng siêu phẳng tối ưu tính tốn dựa vào N quan sát, x biến độc lập, y biến phân loại (�� ∈ {−1,1}) Do đó, siêu phẳng phân lớp cho phương trình : 𝛨: ���(��) + 𝑏 = (8), �: �� → �� ánh xạ từ tập liệu gốc tới không gian chiều cao để hỗ trợ việc phân loại Nghiên cứu giả định khoảng cách ngắn điểm tới siêu phẳng (H) hai lớp nhờ điều chỉnh trọng số w hệ số b Bài toán SVM ước lượng tham số w, b theo phương pháp Giả sử siêu phẳng H phân loại tập liệu cách hồn hảo; từ đó, ��[� �(��) + 𝑏] ≥ (9) ∀k = 1,2,…, N, tham số tối ưu mơ hình ước tính cách tìm cực tiểu hàm mục tiêu ‖�‖ theo giá trị w b, điều kiện phân loại tương ứng dấu hàm ℎ(�) = ���(�) + 𝑏 (Vapnik, 2013) Mặc dù vậy, khó để tìm ánh xạ � chia tách hồn hảo Cortes Vapnik (1995) đề xuất ý tưởng cho phép gán sai tên số quan sát, phương pháp sử dụng biến bù �� để đo lường sai số quan sát thứ i Bài toán SVM trở thành: ��� (1 ‖�‖2 + � ��) (10), ∑� � �,𝑏,� �=1 với ��[���(��) + 𝑏] ≥ − ��, �� ≥ (11) Thuật toán SVR dựa ý tưởng tương tự SVM, ngoại trừ việc biến phụ thuộc biến liên tục theo giá trị thực Tuy nhiên, SVR sử dụng hàm hồi quy siêu phẳng (11) (Patel, Shah, Thakkar, & Kotecha, 2015; Qu & Zhang, 2016) Đường biên mô tả dạng: 0, |� − �(�, �)| ≤ � |� − �(�, �)|𝗌 = |� − �(�, �)| − �, |� − �(�, �)| >� Phương pháp SVR tìm cực tiểu R theo � ‖�‖2 phương trình: � = + �(∑� |� − �(��, �)|𝗌) (13) với C siêu tham số (12) ‖�‖2 �=1 Phương pháp nghiên cứu Spark công cụ hàng đầu Hệ sinh thái Hadoop MapReduce với Hadoop sử dụng để xử lý hàng loạt hoạt động liệu thời gian thực Spark hoạt động độc lập khuôn khổ Hadoop để tận dụng liệu lớn thực phân tích liệu thời gian thực mơi trường máy tính phân tán Học máy ứng dụng Spark Spark MLlib bao gồm thuật toán học máy phổ biến để hồi quy, phân loại, phân cụm, lọc cộng tác khai thác mẫu thường xuyên Nó cung cấp loạt tính để xây dựng đường ống (pipelines), lựa chọn điều chỉnh mơ hình, lựa chọn, khai thác chuyển đổi Các phiên Spark MLlib bao gồm giao diện lập trình ứng dụng (Application Programming Interface - API) dựa liệu phân tán linh hoạt (Resilient Distributed Dataset - RDD) API dựa DataFrame API cho Spark API dựa DataFrames giúp dễ dàng chuyển đổi tính cách cung cấp tính trừu tượng cấp cao để biểu diễn liệu dạng bảng tương tự bảng sở liệu quan hệ, làm cho trở thành lựa chọn tự nhiên để triển khai đường ống Nghiên cứu sử dụng phiên Hadoop Spark ML phiên 3.1.1 Nghiên cứu xây dựng hệ thống phân tích cổ phiếu để dự đốn mức tăng hàng ngày thị trường chứng khoán dựa liệu cafef.vn, vn.investing.com tài nguyên trực tuyến khác Nghiên cứu thu thập liệu từ Sở Giao dịch Chứng khốn Thành phố Hồ Chí Minh (Ho Chi Minh Stock Exchange, HOSE), nghiên cứu loại cổ phiếu niêm yết sau 12/2012 hủy niêm yết trước tháng 09/2020 Do đó, liệu nghiên cứu gồm giá cổ phiếu đóng cửa điều chỉnh 212 cổ phiếu, lãi suất trái phiếu phủ kỳ hạn 01 năm từ tháng 12/2012 đến tháng 09/2020 (gồm 94 tháng) Nghiên cứu chia liệu thu hàng ngày thành tập liệu đào tạo thử nghiệm để dự đốn cổ phiếu có mức tăng hàng ngày cao cách sử dụng mô-đun học máy Spark sau dự đốn mối tương quan giá cổ phiếu dựa hệ số mơ hình hồi quy Theo đó, liệu xử lý cách xóa bỏ liệu bị thiếu liệu ngoại lai Bảng mô tả biến Nghiên cứu sử dụng mơ hình CAPM kết hợp thuật tốn SVR Qua đó, quy trình nghiên cứu dự án xây dựng Hình gồm 02 bước: Bước 1: Đối với nhóm huấn luyện, nghiên cứu sử dụng 50 tháng (có nghĩa 50 * 212 liệu) để làm tập huấn luyện Có tổng cộng 60 mơ hình kiểm định với quan sát (cost = 1, 0.5, 0.1, 0.05, 0.01, 0.001; epsilon = 1, 0.8, 0.6, 0.2, 0.1 kernel = linear, radial, polynomial) Các quan sát từ 51 đến 60 sử dụng tập kiểm tra 01 nhằm lựa chọn mô hình có sai số MAE thấp 60 mơ hình Bước 2: Sử dụng quan sát từ 61 - 94 để làm tập kiểm tra 02 nhằm đánh giá hiệu việc kết SVR CAMP so mơ hình CAPM gốc để tính hiệu thuật tốn Cơng thức xác định kết đầu mơ hình SVR là: rit = rf + f(premiumit), với f hàm xác định thuật toán SVR nhờ tham số xác định Bước Sau xác định kết dự báo 02 mơ hình, nghiên cứu tính tốn độ lệch kết ước lượng với giá trị thực tế Cuối cùng, kiểm định Wilcoxon sử dụng để xác định tính hiệu mơ hình SVR so với mơ hình CAPM Hình Quy trình nghiên cứu Để đánh giá nhân tố tác động đến sai số mơ hình SVR, nghiên cứu sử dụng hồi quy liệu chéo theo phương trình (1) theo nguyên cứu trước H T Tran (2020) Phương trình (14) hàm ý sai số mơ hình SVR phụ thuộc vào sai số mơ hình lý thuyết CAPM (RMSECAPM) nhân tố có liên qua đặc trưng rủi ro tổng thể (SD), rủi ro đặc thù công ty (VAR), tỷ suất sinh lợi kỳ vọng (MEAN) đặc trưng rủi ro hệ thống (BETA) Phương trình hồi quy có dạng: RMSESVR� = �0 + �1RMSECAPM� + �2VAR� + �3SD� + �4MEAN� + �5BETA�+ε� (14) Bảng Mô tả biến Biến Cơng thức ��� 𝑉���𝑑𝑒�� − =𝑉���𝑑𝑒��−1 𝑉���𝑑𝑒��−1 365 × � Tỷ suất sinh lời danh mục đầu tư thị trường ( %/năm) 𝑝��𝑐𝑒�� − 𝑝��𝑐𝑒� (�−1) 365 𝑝��𝑐𝑒� � Tỷ suất sinh lời cổ phiếu thứ i thời điểm t (%/năm) ��� � �� � �� = × Mô tả (�−1) ft � ��� = premiumit RCAPMit ��� 𝑐𝑜�(���, ���) �𝑎�(���) DCAPMit DCAPMit =|rit –RCAPMit| MAE it Tỷ suất sinh lời kỳ vọng cổ phiếu thứ i thời điểm t theo ước tính SVR Sai số tuyệt đối dự báo theo CAPM Sai số tuyệt đối dự báo theo SVR it it DSVR = |r –RSVR | ��𝑆𝐸 = √ − � )2 1� � � �=1 � | �𝐴𝐸 = RMSESVRi 𝐷𝑆𝑉��� Tỷ suất sinh lời kỳ vọng cổ phiếu thứ i thời điểm t theo ước tính CAPM RCAPMit = rft + premiumit RSVRit = rft + f(premiumit) RMSE ∑(� Hệ số beta cổ phiếu thứ i thời điểm t (beta ước tính với liệu 24 tháng) 𝑝�𝑒��𝑢��� = ���(��� − ���) Phần bù rủi ro RSVRit DSVRit Lợi suất trái phiếu phủ kỳ hạn 01 năm thời điểm t ∑ �=1 � ��𝑆𝐸𝑆𝑉�� = � | Đo lường độ lệch giá trị dự báo so với giá trị thực tế �� − �� � � �=1 ∑ RMSE cổ phiếu thứ i mơ hình SVR Biến Công thức � ��𝑆𝐸𝑆𝑉�� = RMSECAPMi 𝐷𝑆𝑉��� Mô tả RMSE cổ phiếu thứ i mô hình CAPM ∑ � �=1 Phương sai phần dư hồi quy chuỗi thời gian ��� − ��� = �0 + ��(��� − ���) + ��� �𝑎�(���) VARi �𝐸𝐴�� = MEANi ��� � � Tỷ suất sinh lời trung bình cổ phiếu thứ i ∑ �=1 𝐵𝐸�𝐴 BETAi � 𝑐𝑜�(���, = ���) �𝑎�(���) Hệ số beta cổ phiếu thứ i bước Độ lệch chuẩn cổ phiếu thứ � 𝑆𝐷� = √ ∑(��� − �𝐸𝐴��)2 �− �=1 SDi i Nguồn: Tác giả tổng hợp Kết nghiên cứu Trong suốt giai đoạn 12/2012 - 09/2020, hệ số beta MEAN ổn định; hệ số beta biến động từ -0.641 tới 0.867, nửa quan sát giá trị âm Trong đó, MEAN dao động từ -0.387 tới 0.415 Hầu hết cổ phiếu có MEAN dương Dữ liệu cụ thể tổng hợp Bảng Bảng Thống kê mơ tả Biến Trung bình Độ lệch chuẩn Nhỏ Trung vị Lớn BETA -0.006 0.117 -0.489 0.002 0.394 VAR 4.680 1.303 0.103 2.143 229.493 MEAN 0.174 0.327 -0.482 0.120 2.810 rf 0.041 0.017 0.003 0.041 0.086 VNindex 0.135 0.703 -2.840 0.153 2.025 Nguồn: Kết phân tích tác giả Phân phối beta MEAN thể biểu đồ histogram (Hình 3) Phân phối beta có dạng đối xứng với trung bình trung vị xấp xỉ 0; hai giá trị ngoại biên nằm xa tương đối so với quan sát cịn lại Cổ phiếu KSB có hệ số beta thấp -0.489 tỷ suất trung bình tương ứng -0.387 (-38.7 %/năm) Ngoài ra, cổ phiếu KSB cổ phiếu có MEAN thấp số 212 công ty Ở chiều ngược lại, beta SVC 0.394, cao 212 mã cổ phiếu Nhìn chung, biến động tỷ suất sinh lời tất cổ phiếu thấp thị trường (tất beta nhỏ 1) Lý bắt nguồn từ việc chuỗi quan sát dài, làm tính nhạy cảm vốn có, tỷ suất sinh lời VNIndex đại diện tốt cho tỷ suất sinh lời danh mục thị trường Hình Phân phối hệ số beta Hình biểu đồ phân phối R (R = r – r f) phần bù rủi ro phân tán xung quanh Tương quan R phần bù rủi ro có ý nghĩa thống kê mức 5% độ lớn yếu (chỉ 0.16) Kết hàm ý biến động tỷ suất sinh lời vượt trội giải thích phần phần bù rủi ro theo mơ hình CAPM Biểu đồ phân tán Hình cho thấy có 02 kernel phù hợp, dạng tuyến tính dạng hàm mũ Vì vậy, tham số cần kiểm định bao gồm dạng kernel hàm tuyến tính hàm mũ, với cost nhận giá trị 1, 0.5, 0.1, 0.05, 0.01, 0.001 epsilon nhận giá trị 1, 0.8, 0.6, 0.2, 0.1 Tổng cộng có 60 mơ hình kiểm định thực hiện, cho kết hàm kernel dạng có cost 1, epsilon 0.1, với MAE thấp 0.8833, hàm kernel dạng tuyến tính có cost 0.001, epsilon 0.1 với MAE nhỏ 0.8834 Mặc dù kernel dạng mũ có MAE tốt so với dạng tuyến tính, chênh lệch khơng đáng kể; nữa, kernel tuyến tính có tốc độ xử lý nhanh vượt trội so với dạng hàm mũ Hình Phân phối tương quan R phần bù rủi ro Kết dự báo theo SVR CAPM tổng hợp theo số MAE RMSE 212 cổ phiếu Bảng mơ hình SVR dự báo tốt so với CAPM theo tiêu chí MAE RMSE Cụ thể là, sai số trung bình của dự báo SVR 0.9087, nhỏ so với giá trị tương tự CAPM 0.9251 Các giá trị thống kê khác SVR nhỏ so với CAPM, ngoại trừ giá trị cực tiểu RMSE Bảng Thống kê mô tả MAE RMSE Statistic SVR CAPM SVR CAPM Nhỏ 0.3539 0.3499 0.4396 0.4341 Q1 0.7065 0.7106 0.9917 0.9830 Trung vị MAE 0.9022 0.9060 RMSE 1.1965 1.1969 Trung bình 0.9087 0.9251 1.2257 1.2345 Q3 Lớn 1.0876 1.1277 1.4613 1.4571 1.6578 1.6567 2.0174 2.0554 Nguồn: Kết phân tích tác giả Nghiên cứu sử dụng kiểm định Wilcoxon để so sánh tính hiệu việc dự báo SVR CAPM Giả thuyết kiểm định khơng có khác sai số dự báo hai mơ hình (H0), giả thuyết đối mơ hình SVR có sai số nhỏ so với CAPM (H1) Kết kiểm định Wilcoxon Với p-value = 0.04848, nhỏ mức ý nghĩa 0.05; giả thuyết H bị bác bỏ Mơ hình SVR phù hợp mơ hình CAPM Kết phù hợp với nghiên cứu Gogas cộng (2018) Tuy nhiên, Gogas cộng (2018) sử dụng danh mục cổ phiếu thay cổ phiếu đơn lẻ, nên R2 có kết tốt hơn, khoảng từ 0.59 đến 0.75 Mơ hình SVR xây dựng dựa tảng mơ hình CAPM, nên khả dự báo SVR phụ thuộc vào độ xác CAPM Vì vậy, RMSECAPM tác động trực tiếp tới sai số dự báo SVR Bên cạnh đó, yếu tố ảnh hưởng tới khả dự báo CAPM trình bày Bảng Hầu hết biến có giá ý nghĩa mặt thống kê mức ý nghĩa 1%, ngoại trừ BETA Kết hàm ý biến động giá trị beta khơng tác động đến mức độ xác dự báo mơ hình Biến SD có ước lượng hệ số hồi quy cao vượt trội so với biến cịn lại, ngụ ý sai số mơ hình SVR phụ thuộc phần lớn vào rủi ro tổng thể cổ phiếu Hệ số ước lượng SD có giá trị 0.886 hàm ý nhân tố tác động khác không đổi, đơn vị rủi ro tổng thể tăng thêm dự báo sai số RMSESVR tăng thêm 0.886 đơn vị Hệ số ước lượng RMSECAPM có giá trị lớn thứ hai (0.1166) có p-value = 0.000 chứng tỏ sai số CAPM tác động có ý nghĩa thống kê đến sai số mơ hình SVR Cụ thể, đơn vị tăng thêm RMSECAPM giũ nguyên yếu tố lại, ta kỳ vọng RMSESVR tăng thêm 0.1166 đơn vị Các biến VAR, MEAN có hệ số ước lượng dương có ý nghĩa thống kê (mức 5%) cho thấy chúng tác động chiều với biến phụ thuộc Bên cạnh đó, hệ số xác định R2 = 0.999, cao, cho thấy biến độc lập giải thích phần lớn biến động RMSESVR Bảng Kết hồi quy RMSESVR β0 β1 β2 β3 β4 β5 RMSESVR� = �0 + �1RMSECAPM� + �2VAR� + �3SD� + �4MEAN� + �5BETA�+ε� Beta t-value p-value Adj R2 R2 0.0139 2.308 0.022 0.1166 5.551 0.000 0.0016 2.997 0.003 0.99 0.99 0.886 39.372 0.000 0.0919 10.002 0.000 0.0129 0.662 0.509 Nguồn: Kết phân tích tác giả Thảo luận kết luận 5.1 Thảo luận Trong nghiên cứu này, thuật toán SVR sử dụng với tham số khác để tìm tham số phù hợp nhất, cụ thể hàm kernel dạng tuyến tính có cost 0.001, epsilon 0.1 với MAE nhỏ 0.8834 Nghiên cứu kết hợp thuật tốn SVR mơ hình CAPM thay sử dụng riêng lẻ CAPM để dự báo tỷ suất sinh lợi cổ phiếu riêng lẻ Có tất 60 mơ hình dự báo từ tập huấn luyện, nên sử dụng để xử lý đạt hiệu cao mặt thời gian tính tốn kết Thuật tốn hồi quy KNN (K-Nearest Neighbors Algorithm) thuật toán hồi quy vectơ hỗ trợ chuyên sâu epsilon tuyến tính sử dụng để dự đốn giá đóng cửa hàng ngày cổ phiếu chọn DSE Việc xác nhận chéo, với trình lặp lại, thực để xác định siêu tham số tối ưu Chúng tơi đưa dự đốn sau chọn mơ hình tốt áp dụng vào liệu thử nghiệm Nghiên cứu cho thấy SVR tuyến tính có sai số nhỏ KNN SVR tuyến tính có giá trị cao điều chỉnh R2 giá trị kiểm tra huấn luyện Vì vậy, SVR tuyến tính hoạt động tốt sử dụng để dự đốn 01 ngày trước giá đóng cửa thị trường chứng khoán, cung cấp liệu lịch sử trước Tóm lại, thị trường chứng khốn lĩnh vực tài quan trọng, việc so sánh mơ hình chuỗi thời gian giúp xác định xem nên mua hay bán cổ phiếu mục đích quan trọng phục vụ với trợ giúp nghiên cứu so sánh thị trường chứng khoán đoán Trong nghiên cứu trước đây, thấy SVR tốt khơng tìm thấy tuyến tính hay phi tuyến không so sánh với KNN Chúng tơi nhận thấy SVR tuyến tính tốt KNN Nghiên cứu thực ba công ty chọn nghiên cứu thêm hiệu suất SVR, KNN nên kiểm tra cho liệu chuỗi thời gian khác Lựa chọn kernel phụ thuộc vào chất tập liệu, liệu tập trung thành cụm tròn kernel radial phù hợp nhất, liệu phân tán xung quanh siêu phẳng kernel linear phù hợp nhất, kernel polynomial phù hợp cho liệu phân tán theo hàm đa thức Nghiên cứu sử dụng kernel dạng tuyến tính, điều phù hợp với mối quan hệ biến mơ hình lý thuyết CAPM Tham số cost đặc trưng cho chi phí sai lệch, cost cao hàm ý cho phép sai lệch lớn (thường dẫn đến tượng underfitting) cost thấp cho phép sai lệch tập huấn luyện gây tượng overfitting Epsilon tham số điều chỉnh khoảng cách giá trị thực giá trị dự báo (khoảng cách nhỏ epsilon) Tham số gamma cho phép thay đổi hình dạng hàm mật độ Gausse kernel radial Sai số dự báo đo lường số RMSE mã chứng khoán phụ thuộc vào nhân tố: sai số mơ hình CAPM, rủi ro đặc thù, tỷ suất sinh lợi trung bình rủi ro tổng thể Nhân tố sai số CAPM đo lường RMSECAPM có hệ số vượt trội chiều với RMSESVR hàm ý sai lệch fitted CAPM cao kỳ vọng sai lệch fitted SVR cao tương ứng Nhân tố đặc trưng cho rủi ro hệ thống (BETA) lần khơng có tác động có ý nghĩa thống kê đến RMSESVR Khi sử dụng nhân tố giải thích cho biến động RMSESVR, hệ số R2 thu 0.99 cao hàm ý nhân tố giải thích hồn toàn biến động RMSESVR 5.2 Kết luận Kết phân tích hồi quy chứng tỏ hệ số ước lượng dương, nói cách khác, biến giải thích có tác động chiều với biến phụ thuộc Kết hàm ý việc kiểm soát biến độc lập theo hướng giảm kỳ vọng giảm sai số mơ hình SVR Mặc dù CAPM lý thuyết tảng quan trọng khả ứng dụng thực nghiệm nhiều tranh cải có nhiều giả định khó đảm bảo thực tế Mơ hình kết hợp SVR đề xuất mơ hình thay CAPM truyền thống Kết kiểm định Wilcoxon cho thấy mơ hình SVR dự báo tốt mơ hình CAPM truyền thống với giá trị p-value nhỏ 0.05 Một số nhân tố giải thích cho biến động RMSESVR, bao gồm RMSECAPM, VAR, SD, MEAN; RMSECAPM nhân tố có ảnh hưởng lớn nhất, hàm ý sai số dự báo SVR phụ thuộc phần lớn vào mơ hình CAPM Với kết thu từ nghiên cứu này, nghiên cứu khuyến nghị nội dung sau: •Đối với nhà đầu tư: nên xem xét mơ hình kết hợp SVR thay mơ hình CAPM truyền thống mơ hình kết hợp có độ xác cao •Đối với nhà nghiên cứu: Các thuật toán máy học khai thác hiệu mối quan hệ phức tạp biến so với mơ hình thống kê kinh tế lượng truyền thống Do đó, kết hợp mơ hình lý thuyết thuật toán máy học kỳ vọng tạo cách mạng lĩnh vực cơng nghệ tài (FINTECH) Trong nghiên cứu này, mơ hình kết hợp SVR CAPM cho hiệu dự báo tốt so với mơ hình CAPM đơn lẻ, nhiên sai số dự báo mức cao Do đó, nghiên cứu tiếp cận thơng q số thuật tốn học máy mạng nơ-ron hồi quy (Recurrent Neural Network - RNN), mạng nơ-ron nhân tạo (Artificial Neural Network ANN), mang nơ-ron tích chập (Convolutional Neural Network - CNN), … nhằm cải thiện độ xác dự báo Ngồi ra, nghiên cứu xem xét bối cảnh HOSE, cần mở rộng sang nhiều thị trường tài khác nhằm tăng độ tin cậy cho nghiên cứu Lý thuyết CAPM cịn gây tranh cải có q nhiều giả định khó đáp ứng, đó, cần thay mơ hình lý thuyết tốt mơ hình 05 nhân tố Tài liệu tham khảo Abraham, A., Nath, B., & Mahanti, P K (2001) Hybrid intelligent systems for stock market analysis Paper presented at the International Conference on Computational Science, San Francisco, California, USA Amihud, Y., Christensen, B J., & Mendelson, H (1992) Further evidence on the risk-return relationship (Vol 11) Stanford, CA: Stanford University Atsalakis, G S., & Valavanis, K P (2009) Surveying stock market forecasting techniques - Part II: Soft computing methods Expert Systems with Applications, 36(3), 5932-5941 Banz, R W (1981) The relationship between return and market value of common stocks Journal of Financial Economics, 9(1), 3-18 Basu, S (1983) The relationship between earnings’ yield, market value and return for NYSE common stocks: Further evidence Journal of Financial Economics, 12(1), 129-156 Black, F (1972) Capital market equilibrium with restricted borrowing The Journal of Business, 45(3), 444-455 Breen, W J., & Korajczyk, R A (1993) On selection biases in book-to-market based tests of asset pricing models Evanston, IL: Northwestern University Bui, K T., & Thai, T D (2021) Capital structure and trade-off theory: Evidence from Vietnam The Journal of Asian Finance, Economics, and Business, 8(1), 45-52 doi:10.13106/jafeb.2021.vol8.no1.045 Bui, K T., & Tran, H T (2021) Support vector regression algorithm under in the CAPM Framework Paper presented at the 2021 International Conference on Data Analytics for Business and Industry (ICDABI), Sakheer, Bahrain doi:10.1109/ICDABI53623.2021.9655797 Cao, L.-J., & Tay, F E H (2003) Support vector machine with adaptive parameters in financial time series forecasting IEEE Transactions on Neural Networks, 14(6), 1506-1518 Chaudhary, P (2017) Testing of CAPM in Indian context Business Analyst, 37(1), 1-18 Chen, H., Xiao, K., Sun, J., & Wu, S (2017) A double-layer neural network framework for high- frequency forecasting ACM Transactions on Management Information Systems (TMIS), 7(4), 1-17 Cortes, C., & Vapnik, V (1995) Support-vector networks Machine Learning, 20(3), 273-297 da Silva Fonseca, J G., Jr., Oozeki, T., Takashima, T., Koshimizu, G., Uchida, Y., & Ogimoto, K (2012) Use of support vector regression and numerically predicted cloudiness to forecast power output of a photovoltaic power plant in Kitakyushu, Japan Progress in Photovoltaics: Research and Applications, 20(7), 874-882 Fama, E F (1970) Efficient capital markets: A review of theory and empirical work The Journal of Finance, 25(2), 383-417 Fama, E F (1991) Efficient capital markets II The Journal of Finance, 46(5), 1575-1617 Fama, E F., & French, K R (2021) The cross-section of expected stock returns Chicago, IL: University of Chicago Press Fama, E F., & James, D (1973) Equilibrium: Empirical tests The Journal of Political Economy, 81(3), 607-636 Gogas, P., Papadimitriou, T., & Karagkiozis, D (2018) The Fama and Fama factor models under a machine learning framework Truy cập ngày 10/10/2021 https://ideas.repec.org/p/rim/rimwps/18-05.html Graham, J R., & Harvey, C R (2001) The theory and practice of corporate finance: Evidence from the field Journal of Financial Economics, 60(2/3), 187-243 Henrique, B M., Sobreiro, V A., & Kimura, H (2018) Stock price prediction using support vector regression on daily and up to the minute prices The Journal of Finance and Data Science, 4(3), 183-201 Jagannathan, R., & McGrattan, E R (1995) The CAPM debate Federal Reserve Bank of Minneapolis Quarterly Review, 19(4), 2-17 Kumar, M., & Thenmozhi, M (2014) Forecasting stock index returns using ARIMA-SVM, ARIMA-ANN, and ARIMA-random forest hybrid models International Journal of Banking, Accounting and Finance, 5(3), 284-308 Lohano, K., & Kashif, M (2018) Testing asset pricing models on the Pakistan stock exchange IBA Business Review, 13(2), 1-19 Malkiel, B G (2003) The efficient market hypothesis and its critics Journal of Economic Perspectives, 17(1), 59-82 Markowitz, H (1952) Portfolio selection Journal of Finance, 7(1), 77-91 Patel, J., Shah, S., Thakkar, P., & Kotecha, K (2015) Predicting stock market index using fusion of machine learning techniques Expert Systems with Applications, 42(4), 2162-2172 Qu, H., & Zhang, Y (2016) A new kernel of support vector regression for forecasting highfrequency stock returns Mathematical Problems in Engineering, 2016, 1-9 doi:10.1155/2016/4907654 Ramedani, Z., Omid, M., Keyhani, A., Shamshirband, S., & Khoshnevisan, B (2014) Potential of radial basis function based support vector regression for global solar radiation prediction Renewable and Sustainable Energy Reviews, 39, 1005-1011 Tay, F E., & Cao, L (2001) Application of support vector machines in financial time series forecasting Omega, 29(4), 309-317 Tong, J (2015) The price forecasting of military aircraft based on SVR Journal of Computer and Communications, 3(5), 234-238 Tran, H T (2020) Application of Machine Learning in CAPM (Master’s thesis, University of Economics Ho Chi Minh City, Ho Chi Minh City, Vietnam) Truy cập ngày 10/10/2021 https://opac.ueh.edu.vn/record=b1032827~S8 Tran, K T., Banh, T T., & Nguyen, A H T (2012) Dự đoán giá cổ phiếu thị trường chứng khoán Việt Nam phương pháp lai GA-SVR [Predicting stock prices on Vietnam stock market by hybrid method GA-SVR] Chuyên san Các cơng trình nghiên cứu, phát triển ứng dụng Công nghệ thông tin Truyền thông, V-1(7), 12-22 Treynor, J L (1961) Market value, time, and risk Truy cập ngày 10/10/2021 https://ssrn.com/abstract=2600356 Trinh, N T (2013) Dự đoán xu hướng thị trường chứng khoán cách sử dụng Twitter [Predict stock market trends using Twitter] (Master’s thesis) Vietnam National University Hanoi, Hanoi, Vietnam Vapnik, V (2013) The nature of statistical learning theory New York, NY: Springer Science & Business Media Wang, J.-J., Wang, J.-Z., Zhang, Z.-G., & Guo, S.-P (2012) Stock index forecasting based on a hybrid model Omega, 40(6), 758-766 Weng, B., Ahmed, M A., & Megahed, F M (2017) Stock market one-day ahead movement prediction using disparate data sources Expert Systems with Applications, 79, 153-163 Yuan, F.-C., Lee, C.-H., & Chiu, C (2020) Using market sentiment analysis and genetic algorithm-based least squares support vector regression to predict gold prices International Journal of Computational Intelligence Systems, 13(1), 234-246 Zhang, N., Lin, A., & Shang, P (2017) Multidimensional k-nearest neighbor model based on EEMD for financial time series forecasting Physica A: Statistical Mechanics and Its Applications, 477, 161-173 Zhong, X., & Enke, D (2017) Forecasting daily stock market return using dimensionality reduction Expert Systems with Applications, 67, 126-139 Creative Commons Attribution-NonCommercial 4.0 International License ... nghiên cứu sử dụng SVR dựa mơ hình CAPM để dự báo tỷ suất sinh lời cổ phiếu đơn lẻ, đồng thời xác định yếu tố ảnh hưởng đến khác biệt sai số dự báo tỷ suất sinh lời cổ phiếu đơn lẻ Việt Nam hạn... tốn SVR mơ hình CAPM thay sử dụng riêng lẻ CAPM để dự báo tỷ suất sinh lợi cổ phiếu riêng lẻ Có tất 60 mơ hình dự báo từ tập huấn luyện, nên sử dụng để xử lý đạt hiệu cao mặt thời gian tính tốn... kernel radial Sai số dự báo đo lường số RMSE mã chứng khoán phụ thuộc vào nhân tố: sai số mơ hình CAPM, rủi ro đặc thù, tỷ suất sinh lợi trung bình rủi ro tổng thể Nhân tố sai số CAPM đo lường