Một thuật toán lựa chọn danh mục đầu tư trực tuyến sử dụng phương pháp phân nhóm và xem xét chi phí giao dịch

ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Một thuật toán lựa chọn danh mục đầu tư trực tuyến sử dụng phương pháp phân nhóm xem xét chi phí giao dịch NGUYỄN VĂN KIÊN Kien.nv202266M@sis.hust.edu.vn Ngành Tốn Tin Giảng viên hướng dẫn: PGS.TS NGUYỄN THỊ THU THỦY Viện: Toán ứng dụng Tin học Hà Nội, tháng năm 2023 Chữ kí GVHD i BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC BÁCH KHOA HÀ NỘI Nguyễn Văn Kiên Một thuật toán lựa chọn danh mục đầu tư trực tuyến sử dụng phương pháp phân nhóm xem xét chi phí giao dịch Chuyên ngành: Toán Tin LUẬN VĂN THẠC SỸ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS NGUYỄN THỊ THU THỦY HÀ NỘI–4/2023 ii Lời cam đoan Tôi xin cam đoan nội dung trình bày luận văn trung thực Tôi xin cam đoan giúp đỡ cho việc thực luận văn cảm ơn thơng tin trích dẫn luận văn rõ nguồn gốc Hà Nội, ngày 08 tháng 04 năm 2023 Học viên Nguyễn Văn Kiên Xác nhận Xác nhận Viện nghiên cứu người hướng dẫn khoa học PGS.TS NGUYỄN THỊ THU THỦY iii Lời cảm ơn Kính gửi Nguyễn Thị Thu Thủy, Em xin gửi lời cảm ơn chân thành đến hướng dẫn nhiệt tình tâm huyết q trình em thực luận văn Viện Toán ứng dụng Tin học - Đại học Bách Khoa Hà Nội Cô sẵn sàng trợ giúp giải đáp thắc mắc em suốt q trình nghiên cứu, giúp em có cách tiếp cận khoa học với đề tài Cơ giúp em xác định vấn đề nghiên cứu, tìm kiếm tài liệu đưa phương pháp nghiên cứu hỗ trợ em trình viết chỉnh sửa thảo Qua hướng dẫn cô, em học nhiều kinh nghiệm quý báu không nghiên cứu khoa học mà cách quản lý tổ chức thời gian hợp lý, hiệu Em tin kiến thức kinh nghiệm tảng để em phát triển tương lai Một lần nữa, em xin bày tỏ lòng biết ơn chân thành đế hướng dẫn tận tình cảm hứng truyền cho em suốt q trình nghiên cứu viết luận văn Em chúc Cô khỏe mạnh thành cơng q trình giảng dạy! Em xin phép gửi tặng Cơ thơ ngắn, gói gém chút tình cảm em dành cho Cơ nhé: Cơ Thủy ơi, người thầy tuyệt vời Nhiệt tình hướng dẫn, tâm huyết truyền đời Khoa học, kiến thức cảm xúc Cô nguồn động lực cho bước chân trẻ trung Bàn tay cô vẽ đường nghiên cứu Cùng học trị bước qua khó khăn thử thách iv Một trí tuệ đầy mơ ước, ngày đêm cần cù Sáng tạo đưa đến tương lai rạng rỡ Cơ Thủy ơi, em biết cảm ơn Vì hi sinh giáo dục Nói lời cảm ơn khơng đủ cao vọng Nhưng lịng học trị cảm kích Cơ Thủy ơi, người Thầy dạy tận tình Hướng dẫn em vượt qua khó khăn Khiến em tin tưởng vào khả Và trưởng thành bàn tay tâm huyết Cô Cô nguồn cảm hứng đưa em đến Với tình yêu giáo dục mãnh liệt tim Cô dạy em không kiến thức mà cách sống Cùng với giá trị vơ giá khơng thể tìm thấy nơi Bao nhiêu lần em gặp khó khăn, bế tác, Cô bên cạnh, động viên em tiếp tục Và em đạt mục tiêu, niềm vui tràn ngập Cô người em muốn chia sẻ Cô Thủy ơi, học cô Sẽ em suốt đời Cảm ơn dạy em Một giảng viên tuyệt vời, gương sáng lòng em! Học viên Nguyễn Văn Kiên v Mục lục Trang phụ bìa i Lời cam đoan ii Lời cảm ơn iii Mục lục vi Danh mục ký hiệu, chữ viết tắt Danh sách bảng Mở đầu Chương Lựa chọn danh mục trực tuyến nguyên tắc đối sánh mẫu 1.1 1.2 Lựa chọn danh mục trực tuyến 1.1.1 Lựa chọn danh mục trực tuyến gì? 1.1.2 Nguyên lý lý thuyết lựa chọn danh mục 1.1.3 Tầm quan trọng lựa chọn danh mục 10 1.1.4 Cách tiếp cận để xây dựng thuật toán 11 Nguyên tắc đối sánh mẫu 13 1.2.1 Mục đích 13 1.2.2 Kỹ thuật chọn mẫu 14 vi 1.2.3 Kỹ thuật tối ưu danh mục đầu tư 15 1.2.4 Một vài kết hợp 17 Chương Thuật toán lựa chọn danh mục đầu tư trực tuyến 19 2.1 Bài toán lựa chọn danh mục đầu tư 19 2.2 Thuật toán lựa chọn danh mục đầu tư 22 2.3 2.2.1 Một số giả thiết 22 2.2.2 Mô tả thuật toán 25 Giải thích thủ tục thuật toán sơ đồ khối 26 2.3.1 Giải thích thủ tục thuật tốn 26 2.3.2 Sơ đồ khối 32 Chương Kết thực nghiệm đánh giá hiệu suất 36 3.1 Mô tả liệu 36 3.2 Xử lý liệu 40 3.3 Thực chương trình 40 3.4 Tiêu chí đánh giá 42 3.5 Tham số thuật toán 48 3.6 Hiệu suất thuật toán 48 3.6.1 Hiệu suất thuật toán chạy Tập liệu 50 3.6.2 Hiệu suất thuật toán chạy Tập liệu 51 Kết luận 53 Tài liệu tham khảo 56 Phụ lục 66 Danh mục ký hiệu, chữ viết tắt OLP S Online Portfolio Selection: Lựa chọn danh mục đầu tư trực tuyến GS Goldman Sachs: Cổ phiếu P AM R Passive-aggressive mean reversion: Đảo ngược trung bình tích cực thụ động OLM AR Online moving average reversion: Đảo ngược trung bình di chuyển trực tuyến Danh sách bảng 1.1 Các thuật toán đối sánh mẫu 18 3.1 Bảng danh mục mã chứng khoán Bất động sản 38 3.2 Bảng danh mục mã chứng khoán ngành Ngân hàng 39 3.3 Kết triển khai thuật toán Tập liệu 50 3.4 Kết triển khai thuật toán Tập liệu 52 Mở đầu Trong tài chính, hầu hết hướng tiếp cận đầu tư phân loại thành phân tích phân tích kỹ thuật Phân tích nhằm dự đốn lợi nhuận kỳ vọng cổ phiếu việc đo lường giá trị nội dựa yếu tố kinh tế, tài đo lường chất lượng, chẳng hạn báo cáo tài chính, báo cáo thường niên, tin tức trị, tin tức thị trường v.v Thay vào việc đo lường giá trị nội cổ phiếu, phân tích kỹ thuật lại tiếp cận theo hướng đặt niềm tin vào thể khứ cổ phiếu thị trường số đo lường hiệu cho tương lai chúng, thường áp dụng biểu đồ, số kỹ thuật công cụ khác để xác định đối tác (partern) mà giúp cho việc dự đốn giá cổ phiếu tương lai gợi ý hành động cho tương lai Ngày nay, tổ chức tài bao gồm quỹ tương hỗ, quỹ hưu trí nhà đầu tư cá nhân có xu hướng đầu tư vào thị trường tài hình thành danh mục đầu tư để tăng vốn họ Để làm điều này, họ thường áp dụng phân tích kỹ thuật phân tích cơng cụ khác để tìm kiếm hội đầu tư sinh lời Những phân tích thường thực thủ cơng cho cổ phiếu đó, hội đầu tư phát chậm Các nhà phân tích tính tốn giá trị nội cổ phiếu dựa báo cáo tài tỷ lệ so sánh giá trị tính tốn với giá cổ phiếu theo đó, định mua bán cổ phiếu Tuy nhiên, nhà 44 np random seed ( self random_state ) self centers = self X [ np random choice ( self X shape [0] , self n_clusters , 10 replace = False ) ] 11 12 def _ a s s i g n _ c l u s t e r s ( self ) : self labels = np argmin ( np linalg norm ( self X [: , np newaxis ] - self centers , 13 axis =2) , axis =1) 14 15 def _ up da t e_ c en te r s ( self ) : for i in range ( self n_clusters ) : 16 17 mask = self labels == i 18 if np any ( mask ) : self centers [ i ] = np mean ( self X [ mask ] , axis =0) 19 20 21 def predict ( self , X ) : return np argmin ( np linalg norm ( X [: , np newaxis ] - self centers , axis =2) , axis 22 =1) 23 24 25 def score ( self , X ) : return np mean ( np linalg norm ( X [: , np newaxis ] - self centers , axis =2) , axis =1) 26 27 def g e t _ s i m i l a r _ s u b _ m a t r i x ( self , recent_sub_matrix , X ) : 28 """ 29 Calculate the percentage of vectors in the same cluster over all iterations This should return a NxN matrix 30 with each cell i , j is the percentage of vectors in the same cluster over all iterations 31 : param X : 32 : return : 33 """ 34 self X = np vstack ([ X , r e c e n t _ s u b _ m a t r i x ]) 35 self _init_centers () 36 37 similar_rate = np zeros (( self X shape [0]) ) 38 for i in range ( self max_iter ) : 39 self _ a s s i g n _ c l u s t e r s () 40 self _u p da t e_ ce n te rs () 41 for i in range ( X shape [0]) : 42 43 if self labels [ i ] == self labels [ -1]: similar_rate [ i ] += 44 45 46 return self , similar_rate / self max_iter 45 • Phân cụm theo Spectral Clustering class S p e c t r a l C l u s t e r i n g ( object ) : def init ( self , n_clusters =8 , affinity = ’ nearest_neighbors ’ , n_neighbors =10 , random_state =42 , max_iter =300) : self n_clusters = n_clusters self affinity = affinity self n_neighbors = n_neighbors self random_state = random_state self max_iter = max_iter self X = None self A = None 10 11 def g e t _ s i m i l a r _ s u b _ m a t r i x ( self , recent_sub_matrix , X ) : 12 self X = np vstack ([ X , r e c e n t _ s u b _ m a t r i x ]) 13 self _ c o n s t r u c t _ a f f i n i t y _ m a t r i x () 14 self _ n o r m a l i z e _ a f f i n i t y _ m a t r i x () 15 self _ c o m p u t e _ l a p l a c i a n _ m a t r i x () 16 self _ c o m p u t e _ e i g e n _ v e c t o r s () 17 return self _run_kmeans () 18 19 20 def _ c o n s t r u c t _ a f f i n i t y _ m a t r i x ( self ) : if self affinity == ’ nearest_neighbors ’: 21 from sklearn neighbors import k n e i g h b o r s _ g r a p h 22 A = k n e i g h b o r s _ g r a p h ( self X , self n_neighbors , mode = ’ connectivity ’ , include_self = True ) 23 self A = A toarray () 24 elif self affinity == ’rbf ’: 25 26 27 28 from sklearn metrics pairwise import rbf_kernel self A = rbf_kernel ( self X ) else : raise ValueError ( ’ Invalid affinity type Supported types are : n e a r e s t _ n e i g h b o r s and rbf ’) 29 30 def _ n o r m a l i z e _ a f f i n i t y _ m a t r i x ( self ) : 31 D = np diag ( np sum ( self A , axis =1) ) 32 D_inv = np linalg inv ( D ) 33 self L = np matmul ( D_inv , self A ) 34 35 36 def _ c o m p u t e _ l a p l a c i a n _ m a t r i x ( self ) : self L = np diag ( np sum ( self L , axis =1) ) - self L 37 38 39 def _ c o m p u t e _ e i g e n _ v e c t o r s ( self ) : eigenvalues , eigenvectors = np linalg eigh ( self L ) 46 40 idx = np argsort ( eigenvalues ) [: self n_clusters ] 41 self eigenvectors = eigenvectors [: , idx ] 42 43 def _run_kmeans ( self ) : kmeans = KMeans ( n_clusters = self n_clusters , random_state = self random_state , 44 max_iter = self max_iter ) _kmeans , _sims = kmeans g e t _ s i m i l a r _ s u b _ m a t r i x ( X = self eigenvectors ) 45 46 return _kmeans , _sims 47 48 • Phân cụm theo Hierarchical Clustering class H i e r a r c h i c a l C l u s t e r i n g : def init ( self , n_clusters =2 , linkage = ’ ward ’) : self n_clusters = n_clusters self linkage = linkage self labels_ = None self distances_ = None def fit ( self , X ) : # Calculate the distances between all pairs of samples n_samples = X shape [0] 10 11 self distances_ = np zeros (( n_samples , n_samples ) ) 12 for i in range ( n_samples ) : for j in range ( i + , n_samples ) : 13 14 self distances_ [i , j ] = np linalg norm ( X [ i ] - X [ j ]) 15 self distances_ [j , i ] = self distances_ [i , j ] 16 17 # Initialize the clusters with one sample each 18 clusters = [[ i ] for i in range ( n_samples ) ] 19 20 # Perform agglomerative clustering 21 while len ( clusters ) > self n_clusters : 22 # Find the closest pair of clusters 23 min_distance = np inf 24 for i in range ( len ( clusters ) ) : for j in range ( i + , len ( clusters ) ) : 25 distance = self _ d i s t a n c e _ b e t w e e n _ c l u s t e r s ( clusters [ i ] , clusters [ j 26 ]) 27 if distance < min_distance : 28 min_distance = distance 29 c l o s e s t _ c l u s t e r s = (i , j ) 47 30 31 # Merge the closest pair of clusters 32 clusters [ c l o s e s t _ c l u s t e r s [0]] += clusters [ c l o s e s t _ c l u s t e r s [1]] 33 del clusters [ c l o s e s t _ c l u s t e r s [1]] 34 35 # Assign labels to the samples based on the final clusters 36 self labels_ = np zeros ( n_samples ) 37 for i , cluster in enumerate ( clusters ) : 38 for j in cluster : self labels_ [ j ] = i 39 40 41 return self 42 43 44 45 def predict ( self , X ) : if self distances_ is None : raise ValueError ( ’ The model has not been trained yet ’) 46 labels = np zeros ( X shape [0]) 47 for i in range ( X shape [0]) : 48 distances = [ self distances_ [i , j ] for j in range ( X shape [0]) ] 49 cluster = np argmin ( distances ) 50 labels [ i ] = self labels_ [ cluster ] 51 return labels 52 53 54 55 56 def _ d i s t a n c e _ b e t w e e n _ c l u s t e r s ( self , cluster1 , cluster2 ) : if self linkage == ’ ward ’: # Ward linkage return np sum ([( np mean ( self distances_ [i , cluster1 ]) - np mean ( self distances_ [i , cluster2 ]) ) **2 for i in cluster1 + cluster2 ]) 57 58 59 60 61 62 63 64 65 elif self linkage == ’ single ’: # Single linkage return np ([ self distances_ [i , j ] for i in cluster1 for j in cluster2 ]) elif self linkage == ’ complete ’: # Complete linkage return np max ([ self distances_ [i , j ] for i in cluster1 for j in cluster2 ]) else : raise ValueError ( ’ Invalid linkage method ’) 66 67 68 def get_params ( self , deep = True ) : return { ’ n_clusters ’: self n_clusters , ’ linkage ’: self linkage } 69 70 71 def set_params ( self , ** params ) : if ’ n_clusters ’ in params : 48 self n_clusters = params [ ’ n_clusters ’] 72 if ’ linkage ’ in params : 73 self linkage = params [ ’ linkage ’] 74 return self 75 76 3.5 Tham số thuật toán Bộ tham số sử dụng luận văn bao gồm: • Max intern: 1000 (số lượng vịng lặp) • Tỷ lệ Train ratio 0.75 • Time window: –> 10 • Số ngày test: M = 502 days • randoms tate = 42, maxi ter = 10 • Chi phí giao dịch cho việc mua • Chi phí giao dịch bán giả định 100 VNĐ • Phân cụm chép 10 lần lặp 3.6 Hiệu suất thuật toán Trong phần này, phương pháp đề xuất áp dụng cho liệu thực nghiệm thị trường Việt Nam kết so sánh với số điểm chuẩn thuật tốn có tài liệu dựa tiêu chí đánh giá sau: • Lợi tức tích lũy danh mục đầu tư (S), phép đo tiêu chuẩn để đánh giá chiến lược lựa chọn danh mục đầu tư trực tuyến, vào cuối giai đoạn đầu tư 49 Sn (bn1 ) = S0 n Y b⊤ t xt t=1 • Lợi suất phần trăm hàng năm biểu thị sau AP Y = √ y Sn−1, đó, y đường nằm ngang số năm đầu tư • Một phép đo khác sử dụng để xem xét rủi ro độ lệch chuẩn hàng tháng lợi nhuận danh mục đầu tư Độ lệch tiêu chuẩn hàng ngày tính tốn để tính độ lệch chuẩn hàng năm sau nhân với √ 252 (giả định năm có 252 ngày làm việc) • Một phép đo khác tỷ lệ Sharpe hàng năm tạo ngưỡng cân rủi ro lợi nhuận Tiêu chí tính SR = AP Y − Rf , đó, R, tỷ suất sinh lợi phi rủi ro • Sự phá vỡ vốn coi tiêu chí quan trọng để đánh giá thị trường vốn với giới hạn suy giảm từ đỉnh chức tích lũy danh mục đầu tư " # DD(t) = sup 0, sup Si − St i∈(0,t) Ngoài ra, mức vốn tối đa sử dụng để đo lường rủi ro định nghĩa là: MDD(n) = sup [DD(t)] t∈(0,n) • Tỷ lệ Calmar phép đo khác để cân rủi ro lợi nhuận: CR = AP Y M DD 50 Tiêu chí đánh giá KMNLOG KMDLOG SPCLOG HRCLOG 1.4170 1.5555 1.3053 1.5826 Năng suất phần trăm năm (APY) 75.45 % 85.27 % 70.39 % 99.46% Độ lệch chuẩn hàng năm lợi nhuận 0.2895 0.3238 0.3125 0.2955 Tỉ lệ tương đồng Sharpe (SR) 2.6585 3.3256 2.0253 3.9985 Rút tiền tối đa (MDD) 0.1551 0.1523 0.1678 0.1236 Tỉ lệ Calmar 5.0973 8.2575 5.16 8.8966 Hệ số trung bình chuẩn hóa 9.9996 9.875 9.808 10.223 Thời gian chạy thuật toán ngày 87.92 s 208.72 s 310.12 s 75.98 s 1.1171 % 1.1191 % 1.1122 % 1.1032 % Tổng lợi nhuận tích lũy (Sn ) MAPE Bảng 3.3: Kết triển khai thuật toán Tập liệu 3.6.1 Hiệu suất thuật toán chạy Tập liệu Trong thuật toán KMNLOG, KMDLOG, SPCLOG HRCLOG tác giả đề xuất, bước chọn mẫu thực tương ứng theo phương pháp k-mean, k-medoids phương pháp phân nhóm, hàm log-tối ưu sử dụng với chi phí giao dịch bước tối ưu hóa danh mục đầu tư Các thuật toán triển khai tập liệu 1, chứa danh mục đầu tư 34 cổ phiếu số cổ phiếu tích cực thị trường Bất động sản Việt Nam khoảng thời gian từ ngày tháng năm 2020 đến ngày 29 tháng 12 năm 2021 Bảng tiêu chí đánh giá tập liệu tổng hợp bảng sau: Qua bảng Bảng 3.3 ta thấy, kết tốt lợi nhuận tích lũy danh mục đầu tư (Sn ) 1.5826 thuộc thuật toán HRCLOG Nói cách khác, lợi nhuận thu thuật toán thử nghiệm khoảng 58.26% Theo phép đo APY, mong đợi, kết tốt thuộc thuật tốn HRCLOG đó, 99.46% lợi tức năm, lợi tức đáng kể Độ lệch tiêu chuẩn hàng năm tối thiểu lợi nhuận chứng khoán 0.2895 thuộc thuật toán KMNLOG thuật tốn thứ hai tiêu chí thuật 51 toán HRCLOG với độ lệch chuẩn hàng năm lợi nhuận chứng khoán 0.2955 Điều chứng minh thuật tốn HRCLOG có kết tốt rủi ro tổng lợi nhuận Tỷ lệ Sharpe hàng năm đại diện cho lợi nhuận tăng thêm thu khoản bù đắp cho rủi ro chấp nhận, đó, tỷ lệ Sharpe cao, lợi tức lớn so với rủi ro chấp nhận Một lần nữa, kết tốt cho tiêu chí thuộc thuật toán HRCLOG Một số khác đo lường rủi ro mức giảm tối đa, đó, giá trị tốt số thuộc thuật toán HRCLOG KMDLOG với 0.1236 0.1523 Tỷ lệ Calmar cho biết tỷ suất sinh lợi điều chỉnh so với tỷ lệ rủi ro Dễ thấy, giá trị cao tỷ lệ dẫn đến hiệu mơ hình tốt Trong tập liệu mã chứng khoán Bất động sản này, tỷ lệ tốt thuộc nhịp thuật toán HRCLOG KMNLOG Trong tất tiêu chí trên, khơng có khác biệt đáng kể hiệu suất thuật toán HRCLOG KMDLOG, xét thời gian chạy trung bình thuật tốn, thuật tốn HRCLOG có kết tốt KMDLOG Cuối cùng, tiêu chí để ước tính độ xác dự đốn, MAPE, đạt 1, 1032% cho thuật toán HRCLOG 3.6.2 Hiệu suất thuật toán chạy Tập liệu Trong tập liệu 2, thuật toán chạy với danh mục 24 mã cổ phiếu số cổ phiếu tích cực thị trường Ngân hàng Việt Nam giai đoạn từ ngày tháng năm 2020 đến ngày 29 tháng 12 năm 2021 Kết tiêu chí đánh giá thu từ thuật tốn đề xuất trình bày Bảng 3.4 Qua bảng liệu ta thấy, hiệu suất tốt tổng lợi nhuận thuộc thuật toán KMNLOG Một lần nữa, tiêu chí AP Y , Độ lệch chuẩn hàng năm lợi nhuận SR, thuật tốn KMNLOG có hiệu suất tốt thuật tốn cịn lại Xem xét thời gian chạy trung bình, kết luận thuật tốn HRCLOG 52 Tiêu chí đánh giá KMNLOG KMDLOG SPCLOG HRCLOG 1.4352 1.1196 1.3332 1.2065 Năng suất phần trăm năm (APY) 105.97 % 88.98 % 79.32 % 82.46% Độ lệch chuẩn hàng năm lợi nhuận 0.4046 0.4442 0.4349 0.4494 Tỉ lệ tương đồng Sharpe (SR) 2.6076 1.2689 2.9825 1.1568 Rút tiền tối đa (MDD) 0.1517 0.1468 0.7856 0.9854 Tỉ lệ Calmar 6.9853 3.2585 5.1638 4.5858 Hệ số trung bình chuẩn hóa 10.2545 9.6895 9.6895 10.3585 85.4 s 213.65 s 736.82 s 73.57 s 1.7059 % 1.6694 % 1.6785 % 1.6258 % Tổng lợi nhuận tích lũy (Sn ) Thời gian chạy thuật toán ngày MAPE Bảng 3.4: Kết triển khai thuật toán Tập liệu có hiệu suất tốt số thuật tốn đề xuất tập liệu 53 Kết luận Luận văn đạt mục tiêu đề Trình bày thuật tốn lựa chọn danh mục đầu tư trực tuyến dựa nguyên tắc đối sánh mẫu mà đưa định danh mục đầu tư tối ưu thời kỳ cập nhật danh mục đầu tư tối ưu bắt đầu thời kỳ Áp dụng thuật tốn trình bày vào liệu danh mục đầu tư chứng khoán bất động sản Việt Nam Thực hành nghiêm túc làm việc sáng tạo, tỉ mỉ, cầu toàn, độc lập tạo sản phẩm chất lượng Luận văn Kết luận văn Luận văn phân tích chi tiết thuật tốn lựa chọn danh mục đầu tư trực tuyến theo nguyên tắc đối sánh mẫu [15] đồng thời đưa thử nghiệm đánh giá hiệu suất thuật toán Cụ thể: Phân tích hai bước thuật tốn chọn mẫu tối ưu hóa nhằm xác định danh mục đầu tư tối ưu chu kỳ Phân tích liệu đầu vào, xử lý liệu, lập trình thuật tốn cho liệu ngành chứng khoán bất động sản ngành Ngân hàng Việt Nam Đánh giá ý nghĩa kết chương trình liên hệ ứng dụng sở công tác 54 Định hướng nghiên cứu tương lai - Bộ liệu: Thu thập thêm liệu từ trang web đầu tư danh mục trực tuyến, với thu thập thêm thuộc tính như: giá mua mà người mua kì vọng, giá bán mà người bán kỳ vọng, mã chứng khoán mà người chơi quan tâm, mã chứng khoản theo danh mục, mã chứng khoán mà kiểm soát thống liệu người mua người bán, liệu đầy đủ thơng tin xác Ngồi ra, cần tăng cường liệu nhiều danh mục đầu tư khác Đưa phương pháp để tận dụng thuộc tính mơ tả kỳ vọng nhà đầu tư - Thuật tốn: Phát triển thuật tốn quản lý rủi ro cách mà không ảnh hưởng hữu hình đến tổng lợi nhuận hấp dẫn Ngồi ra, tính khoản đưa vào mơ hình để làm cho thuật tốn trở nên thực tế Cũng xem xét chi phí giao dịch theo cách thực tế cách giảm bớt giả định đơn giản hóa thực chi phí giao dịch - Mơ hình Nghiên cứu thêm thuật toán lựa chọn danh mục đầu tư sau để cải thiện kết dự báo tốt Mua giữ (Buy-and-Hold) Mua nắm giữ tốt (Buy-and-Hold best) Danh mục đầu tư tái cân liên tục (Constant Rebalanced Portfolio) Danh mục đầu tư tái cân liên tục tốt (Best Constant Rebalanced Portfolio) Danh mục đầu tư phổ quát (Bìa 1991) (Universal Portfolio (Cover 1991)) Gradient hàm mũ (Helmbold et al 1998) (Exponential Gradient) Danh mục đầu tư tái cân liên tục liên tiếp (Gaivoronski Stella 2000) (Successive Constant Rebalanced Portfolio) 55 Anticor (Borodin, El-Yaniv, Gogan 2004) Đảo ngược trung bình tích cực thụ động (Li et al 2012) (Passive Aggressive Mean Reversion) 10 Sự thay đổi trung bình theo trọng số niềm tin (Li et al 2013) (Confidence Weighted Mean Reversion) 11 Thời gian biến động (Kirby Ostdiek 2012) (Volatility Timing) 56 Tài liệu tham khảo Tiếng Việt [1] https://www.tcbs.com.vn/home [2] V.H Tiệp, “Machine Learning nâng cao”, Kỹ thuật tính MAPE, 3(2), pp 102-157, 2020 Tiếng Anh [3] Abdi, M Najafi, “Online Portfolio Selection Using Spectral Pattern Matching”, Financial Engineering and Portfolio Management, 9(34), pp 175-192, 2018 [4] Blum, A Kalai, “Universal portfolios with and without transaction costs”, Machine Learning, 35(3), pp 193-205, 1999 [5] Brandes Institute (2004) Concentraded Portfolios: “An examination of their characteristics and effectiveness”, 3(6), pp 213-235, 2004 [6] Borodin, A.,Vincent, “Machine Learning and Markets, Can we learn to beat the best stock”, Journal of Artificial Intelligence Research, 21, pp 579-594, 2004 [7] Cover, T M., Ordentlich, “Universal Portfolios with Side Information”, IEEE Transactions on Information Theory, 42(2), pp 348-363, 1991 57 [8] Cover, T., Ordentlich Universal portfolios with short sales and margin, IEEE International Symposium on Information Theory - Proceedings, 174, 1998 https://doi.org/10.1109/ISIT.1998.708770 [9] Gyorfi, L., Lugosi, G., Udina, “Nonparametric kernel-based sequential investment strategies” Mathematical Finance 16(2), pp 337-357, 2006 [10] Gyăorfi, L., Urbỏn, A., Vajda, “Kernel-Based Semi-Log-Optimal Empirical Portfolio Selection Strategies”, International Journal of Theoretical and Applied Finance, 10(03), pp 505-516, 2007 [11] Gyăorfi, László, Udina, F., Walk, “Nonparametric nearest neighbor based empirical portfolio selection strategies”, Statistics and Decisions, 26(2), pp 145-157, 2008 [12] Gyăorfi, L., Vajda, Growth Optimal Investment with Transaction Costs, International Conference on Algorithmic Learning Theory, pp 108-122, 2008 [13] Henrique, B M., Sobreiro, V A., Kimura, “Literature review”, Machine learning techniques applied to financial market prediction R Expert Systems With Applications, 124, pp 226-251, 2019 [14] Kelly, “A new interpretation of information rate”, IRE Transactions on Information Theory, 2(3), pp 185-189, 1956 [15] Kimura, “Literature review”, Machine learning techniques applied to financial market prediction R Expert Systems With Applications, 124, pp 226251, 2020 [16] Majid Khedmati, Pejman Azin, “An online portfolio selection algorithm using clustering approaches and considering transaction costs”, 159, 30 November 2020, 1135462020 58 [17] Markowitz, “Portfolio Selection: Efficiency Diversification of Investment version 1.0”, 1952 [18] Markowitz, “Portfolio Selection: Efficiency Diversification of Investment”, Yale University Press, 1969 [19] Li, OLPS: “A Toolbox for On-Line Portfolio Selection”, 17, pp 1-5, 2014 [20] Li, B., Hoi, S C H., Gopalkrishnan, CORN: “Correlation-driven nonparametric learning approach for portfolio selection” ACM Transactions on Intelligent Systems and Technology, 2(3), pp 1-29, 2011 [21] Li, B., Hoi, S C H., Sahoo, D., Liu, “Moving average reversion strategy for on-line portfolio selection”, Artificial Intelligence, 222, pp 104-123, 2019 [22] Li, B., Hoi, S C H., Sahoo, D., Liu, “Moving average reversion strategy for on-line portfolio selection”, Artificial Intelligence, 222, pp 104-123, 2015 [23] Li, B., Hoi, S C H., Zhao, P., Gopalkrishnan, “Confidence Weighted Mean Reversion Strategy for Online Portfolio Selection”, ACM Transactions on Knowledge Discovery from Data, 7(1), pp 1-38, 2013 [24] Ottucsák, G., Vajda, “An asymptotic analysis of the mean-variance portfolio selection”, Statistics, Decisions, 25(1/2007), pp 901-923, 2007 [25] Zhang, Y., Yang, “Online Portfolio Selection Strategy Based on Combining Experts”, Advice Computational Economics, 50, pp 141-159, 2017

Định dạng
Số trang	73
Dung lượng	496,62 KB