1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian

119 4 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Thuật Toán Di Truyền Để Lựa Chọn Danh Mục Cổ Phiếu Trong Khu Vực Asian
Tác giả Quan Ngoc Linh
Người hướng dẫn TS. Lưu Thu Quang
Trường học Trường Đại Học Ngân Hàng Tp. Hồ Chí Minh
Chuyên ngành Tài Chính – Ngân Hàng
Thể loại khóa luận tốt nghiệp
Năm xuất bản 2021
Thành phố Tp.Hồ Chí Minh
Định dạng
Số trang 119
Dung lượng 13,68 MB

Cấu trúc

  • CHƯƠNG 1: GIỚI THIỆU (19)
    • 1.1. Tính cấp thiết của đề tài (19)
    • 1.2. Mục tiêu nghiên cứu (21)
      • 1.2.1. Mục tiêu nghiên cứu tổng quát (21)
      • 1.2.2. Mục tiêu nghiên cứu cụ thể (21)
    • 1.3. Câu hỏi nghiên cứu (21)
    • 1.4. Đối tượng và phạm vi nghiên cứu (22)
      • 1.4.1. Đối tượng nghiên cứu (22)
      • 1.4.2. Phạm vi nghiên cứu (22)
    • 1.5. Phương pháp nghiên cứu (22)
    • 1.6. Đóng góp của đề tài (23)
    • 1.7. Kết cấu bài nghiên cứu (23)
  • CHƯƠNG 2: TỔNG QUAN LÝ THUYẾT QUẢN LÝ DANH MỤC CỔ PHIẾU VÀ THUẬT TOÁN DI TRUYỀN (25)
    • 2.1. Cơ sở lý thuyết về quản lý danh mục cổ phiếu (25)
      • 2.1.1. Định nghĩa danh mục cổ phiếu (25)
      • 2.1.2. Định nghĩa quản lý danh mục cổ phiếu (25)
      • 2.1.3. Nội dung về quản lý danh mục đầu tư (26)
    • 2.2. Cơ sở lý thuyết về thuật toán di truyền (31)
      • 2.2.1. Giới thiệu về quá trình tiến hoá tự nhiên (31)
      • 2.2.2. Giới thiệu về thuật toán di truyền (32)
      • 2.2.3. Các quá trình chính trong thuật toán di truyền (34)
    • 2.3. Tổng quan các nghiên cứu trước (40)
    • 2.4. Giới thiệu các biến số kinh tế của các nước trong khu vực Đông Nam Á 26 TÓM TẮT CHƯƠNG 2 (44)
  • CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU VÀ CƠ SỞ DỮ LIỆU (24)
    • 3.1. Cơ sở dữ liệu (50)
    • 3.2. Phương pháp nghiên cứu (50)
  • CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU (63)
    • 4.1. Phương pháp thực nghiệm (63)
    • 4.2. Kết quả chương trình (64)
      • 4.2.1. Tổng tỷ suất sinh lời kỳ vọng và rủi ro toàn danh mục của 6 nước trong (64)
      • 4.2.2. Tỷ lệ Sharpe của các danh mục (66)
      • 4.2.3. Phân tích tỷ trọng phân bổ của các danh mục (68)
    • 4.3. So sánh kết quả với các nghiên cứu trước (75)
  • CHƯƠNG 5: KẾT LUẬN VÀ KIẾN NGHỊ (24)
    • 5.1. Kết luận (77)
    • 5.2. Hàm ý chính sách (78)
    • 5.3. Hạn chế của đề tài và hướng nghiên cứu mở rộng (80)
  • TÀI LIỆU THAM KHẢO (83)

Nội dung

GIỚI THIỆU

Tính cấp thiết của đề tài

Bên cạnh việc phát triển của thị trường tài chính nói chung thì việc bùng nổ thị trường chứng khoán vào những năm gần đây với một số lượng khá lớn các nhà đầu tư lớn nhỏ đã đổ xô gia nhập vào, điều này đồng nghĩa với việc một lượng vốn hoá lớn đã tạo thành một dòng tiền vào và ra kích thích tiềm năng phát triển của thị trường đầy sự biến động này Cùng với sự phát triển không ngừng ấy thì trên thế giới lần lượt xuất hiện các phương pháp phân tích đầu tư chứng khoán, đặc biệt là phương pháp phân tích kỹ thuật được sử dụng khá phổ biến và rộng rãi trên thế giới Nhưng đã có những nghiên cứu chỉ rằng phương pháp ấy có những hạn chế nhất định nên việc phân tích sẽ không còn đem lại hiệu quả như nghiên cứu của Trần Quốc Tuấn và Hoàng Thị Bảo Chi (2004), Bessembinder và Chan (1995) đã đề cập

Trong quá trình tìm hiểu đầu tư, việc tối ưu danh mục đầu tư là một trong những vấn đề thách thức nhất trong lĩnh vực tài chính Vì đó là một quá trình không chỉ đơn giản là việc kết hợp các mã chứng khoán riêng lẻ cùng với các tỷ trọng đầu tư không được xem xét mà nhà đầu tư cần tìm cách tối đa hoá khoản đầu tư sinh lời và hạn chế rủi ro bằng việc tìm hiểu thị trường và đặt cho mình một mức sinh lời mong muốn kèm mức rủi ro có thể chấp nhận được Đối phó với vấn đề này, gần đây một phương pháp dựa trên trí tuệ nhân tạo như thuật toán di truyền đã được áp dụng để khắc phục vấn đề này Thuật toán di truyền hay còn gọi là giải thuật di truyền (Genetic Algorithms) là một phương pháp tối ưu và được sử dụng rộng rãi trong rất nhiều lĩnh vực khác nhau như y tế, kỹ thuật, điện tử,… không riêng gì lĩnh vực phân tích đầu tư tài chính để tối ưu giá trị và giải quyết được những bài toán thông qua các quá trình cơ bản là chọn lọc, lai tạo và đột biến giữa các cá thể trong quần thể để tạo ra những cá thể đời sau tốt hơn, nâng cao khả năng thích nghi của cá thể đó trong môi trường tự nhiên hơn

Trong những năm gần đây, việc ứng dụng thuật toán di truyền để lập nên một danh mục cổ phiếu tiềm năng ngày càng có nhiều tác giả trên thế giới thực hiện Có thể điểm qua các nghiên cứu sau: nhóm tác giả Sefiane và Benbouziane (2012) hay tác giả Xiaolou Yang (2006) nghiên cứu quy trình của thuật toán di truyền và đo độ chính xác của thời gian khi chạy phân tích và đánh giá về việc ứng dụng thuật toán vào phân tích danh mục cổ phiếu; hoặc có nhóm tác giả Chou và các cộng sự (2017) với nghiên cứu tối ưu hoá danh mục đầu tư dựa trên hai cách là nguồn quỹ được tiêu chuẩn hoá và giải thuật di truyền; Dubinskas và Urbsiene (2017) có bài nghiên cứu cũng với phương pháp thuật toán tương tự và so sánh kết quả đạt được với phương pháp lập trình xác định hoặc ngẫu nhiên để đánh giá phương pháp nào mang lại lợi nhuận cao hơn và đáng mong đợi hơn Các kết quả đều cho thấy có sự khả quan và phù hợp khi áp dụng thuật toán di truyền vào việc phân tích danh mục cổ phiếu hiệu quả Tuy nhiên, phạm vi của các nghiên cứu trên đều ở thị trường nước ngoài, nơi các đặc điểm thị trường khá khác biệt so với thị trường chứng khoán ở Việt Nam, hơn nữa là khu vực Đông Nam Á, trong khi đó xét về việc mua và bán cổ phiếu hàng ngày của các nhà đầu tư trong nước mong muốn tiêu chuẩn hoá một danh mục tối ưu lại ngày càng phổ biến

Tại Việt Nam, các nghiên cứu về phương pháp thuật toán di truyền này đã được áp dụng và nghiên cứu ở nhiều lĩnh vực khác như y tế, sinh học, kỹ thuật, xây dựng, công nghệ thông tin, để giải quyết các bài toán khác nhau, việc ứng dụng phương pháp này vào lĩnh vực tài chính vẫn còn khá ít Vì thế, việc thực hiện nghiên cứu này ở thị trường trong khu vực Asian là một điều hoàn toàn cần thiết và có khả thi, đặc biệt là trong bối cảnh thị trường chứng khoán không kể gì Việt Nam mà các thị trường quốc tế cũng đang ngày càng phát triển và luôn biến động không ngừng

Bài nghiên cứu sẽ giúp trả lời câu hỏi: “Liệu có nên ứng dụng thuật toán di truyền vào việc lập một danh mục cổ phiếu hiệu quả không?” Để trả lời được câu hỏi đó, tác giả sẽ nghiên cứu, tìm hiểu và vận dụng các quy trình của thuật toán vào một danh mục gồm nhiều loại tài sản có mức độ rủi ro khác nhau để chọn lọc và tạo nên một danh mục cổ phiếu tiềm năng với tiêu chí lợi nhuận mang lại cao cùng với mức rủi ro phù hợp.

Mục tiêu nghiên cứu

1.2.1 Mục tiêu nghiên cứu tổng quát

Tìm hiểu phương pháp thuật toán di truyền để giải quyết một bài toán gồm các cổ phiếu với nhiều mức độ rủi ro khác nhau nhằm ứng dụng vào việc tìm một danh mục cổ phiếu với tiêu chí lợi nhuận thu được trên một đơn vị rủi ro cao nhất và giúp điều chỉnh chiến lược mua bán và đầu tư vào mỗi cổ phiếu với tỷ trọng phù hợp cho nhà đầu tư

1.2.2 Mục tiêu nghiên cứu cụ thể

- Tìm hiểu lý thuyết danh mục Markowitz nhằm hỗ trợ và giải quyết bài toán

- Tìm hiểu khái niệm và nghiên cứu cách thức hoạt động chính thông qua các quy trình cơ bản của phương pháp thuật toán di truyền

- Mô tả thuật toán bằng các dữ liệu thu thập vào giải quyết một danh mục các mã cổ phiếu

- Báo cáo kết quả thực nghiệm và đánh giá dựa trên tiêu chí ban đầu.

Câu hỏi nghiên cứu

Để thực hiện được các mục tiêu nghiên cứu, bài nghiên cứu tập trung trả lời các câu hỏi nghiên cứu chính:

Câu hỏi 1: Lý thuyết danh mục Markowitz là gì và gồm các công thức gì?

Các chỉ số giúp đo lường hiệu quả nhằm tạo ra giá trị có ý nghĩa cho một danh mục đầu tư như lợi nhuận, rủi ro, tỷ lệ Sharpe,…

Câu hỏi 2: Thuật toán di truyền là gì? Quy trình của thuật toán di truyền gồm các bước gì?

Thuật toán di truyền là một phương pháp cần tiếp cận và tìm hiểu với điều kiện ràng buộc bài toán nằm trên một không gian lớn và có mối quan hệ tiệm cận đến quá trình tiến hoá sinh học trong tự nhiên Quy trình của thuật toán di truyền bao gồm các bước cơ bản chọn lọc, lai ghép, đột biến

Câu hỏi 3: Làm thế nào để ứng dụng thuật toán vào việc mô tả một danh mục cổ phiếu?

Giải quyết bài toán dựa trên thuật toán di truyền để đưa ra kết quả cụ thể, chính xác và phù hợp Sau khi tìm hiểu rõ các quy trình và tuần tự của giải thuật di truyền và các kiến thức cơ bản thì sẽ ứng dụng mô hình vào danh mục các cổ phiếu khác nhau

Câu hỏi 4: Kết quả của các danh mục có đạt mục tiêu? Đánh giá và xem xét kết quả để lựa chọn danh mục cổ phiếu đáp ứng đầy đủ tiêu chí đảm bảo mức rủi ro phù hợp và lợi nhuận đáng kể.

Đối tượng và phạm vi nghiên cứu

1.4.1 Đối tượng nghiên cứu Đề tài tập trung nghiên cứu vào danh mục cổ phiếu trong khu vực Asian từ đó ứng dụng quy trình giải thuật toán di truyền để lựa chọn một danh mục gồm tổ hợp các cổ phiếu với mức lợi nhuận cao và rủi ro phù hợp

Về không gian: Phạm vi nghiên cứu bao gồm các mã cổ phiếu của các công ty được niêm yết trên thị trường chứng khoán Việt Nam, cụ thể gồm các công ty thuộc sàn VN30 tại Việt Nam Ngoài ra, nghiên cứu còn mở rộng danh mục bằng cách kết hợp 30 công ty có vốn hoá thị trường lớn nhất trong mỗi nước sau Singapore, Thailand, Malaysia, Indonesia và Philippine

Về thời gian: Nghiên cứu sẽ sử dụng dữ liệu thu thập theo tháng trong giai đoạn từ tháng 07/2018 đến tháng 04/2021 để làm căn cứ xây dựng danh mục đầu tư.

Phương pháp nghiên cứu

Bài nghiên cứu sử dụng phương pháp thuật toán di truyền bằng cách áp dụng các quy trình có trong việc giải thuật toán và kết hợp một ngôn ngữ lập trình Python chạy bằng môi trường web là Jupyter Notebook nhằm hỗ trợ phân tích dữ liệu Để có dữ liệu phục vụ cho bài nghiên cứu, tác giả đã sử dụng nguồn dữ liệu phong phú thu thập từ hệ thống datastream được cập nhật chi tiết và công khai trong giai đoạn từ tháng 07/2018 đến tháng 04/2021.

Đóng góp của đề tài

Về mặt thực tiễn: Sau khi nghiên cứu thành công, đề tài sẽ cung cấp thêm các thông tin, kiến thức về mô hình giải thuật di truyền cho những nhà tham khảo Đó là dựa trên cơ sở lý thuyết của phương pháp giải thuật di truyền để xác định và tạo lập danh mục cổ phiếu hiệu quả Hơn nữa, tác giả nghiên cứu với một không gian và thời gian được mở rộng để có được một cái nhìn khái quát, cụ thể và rộng hơn để tạo ra một danh sách cổ phiếu đa dạng trong và ngoài nước Từ đó, các nhà nghiên cứu không chỉ có thể tham khảo, sử dụng thông tin cho những nghiên cứu có liên quan mà còn có thể mở rộng và đào sâu thêm về nghiên cứu này

Về mặt khoa học: Đề tài góp phần thêm một góc nhìn khác khi ứng dụng thuật toán di truyền – một phương pháp trong trí tuệ nhân tạo vào lĩnh vực tài chính, đặc biệt là thị trường chứng khoán Đây là một điều khá thú vị và mới mẻ và đó cũng có thể là căn cứ giúp các nhà quản trị hoạch định và phân tích tốt hơn các dữ liệu, thông tin để ra quyết định đầu tư vào danh mục mang lại tỷ suất sinh lời cao.

Kết cấu bài nghiên cứu

Nội dung bài nghiên cứu thực hiện thành các phần nhằm giải đáp các câu hỏi nghiên cứu đã đặt ra Phần thứ nhất, tác giả sẽ giới thiệu đôi chút về đề tài nghiên cứu và đi sơ lược về mục tiêu và phương pháp nghiên cứu Phần thứ hai diễn giải các học thuyết kinh tế nhằm giải quyết bài toán đề ra, bên cạnh là cơ sở lý thuyết của thuật toán di truyền và tổng quan kinh tế của 6 nước nghiên cứu Phần thứ ba là mô tả phương pháp, quy trình thực hiện một thuật toán di truyền kết hợp các học thuyết liên quan bằng phần mềm nghiên cứu đã đề cập Phần thứ tư dựa trên nền tảng lý thuyết đã có, tác giả tiến hành nghiên cứu và khảo nghiệm kết quả thực nghiệm khi đã vận dụng thuật toán di truyền để tìm kiếm mức tỷ trọng phân bổ phù hợp cho các danh mục cổ phiếu trong khu vực Asian Cuối cùng, tác giả đề xuất một số hàm ý chính sách và hạn chế của bài nghiên cứu Cụ thể và chi tiết như sau:

Chương 1: Giới thiệu đề tài

Chương 1 sẽ trình bày về tính cấp thiết của đề tài nghiên cứu, mục tiêu nghiên cứu bao gồm mục tiêu tổng quát và mục tiêu cụ thể từ đó đề xuất các câu hỏi liên quan, đối tượng và phạm vi nghiên cứu, phương pháp nghiên cứu cũng như sự đóng góp về thực tiễn và khoa học của bài nghiên cứu cũng được tóm tắt trong chương này

Chương 2: Tổng quan lý thuyết về quản lý danh mục cổ phiếu và thuật toán di truyền

Chương 2 bắt đầu với việc giới thiệu về khái niệm quản lý danh mục đầu tư và trình bày lý thuyết danh mục Markowitz cùng các khái niệm liên quan Tiếp theo sẽ trình bày các quy chình chính trong thuật toán di truyền nhằm giải quyết bài toán xây dựng danh mục đầu tư hiệu quả Sau đó tác giả điểm sơ lược về tình hình kinh tế và vốn hoá thị trường tại 6 nước đã đề cập trong khu vực Asian

Chương 3: Phương pháp nghiên cứu và cơ sở dữ liệu

Chương này sẽ tập trung mô tả quy trình bài toán bằng các dữ liệu, phương pháp đã đề cập để xử lý dữ liệu và phân tích trên hệ thống dựa trên cơ sở lý thuyết chương 2 nhằm thu được kết quả phù hợp với mục tiêu đề ra

Chương 4: Kết quả thực nghiệm và đánh giá

Dựa trên nền tảng lý thuyết và cách sử dụng các đoạn mã tin học đã giới thiệu trong chương 2 và 3, tác giả tiến hành nghiên cứu và khảo nghiệm kết quả thực nghiệm thu được khi đã vận dụng thuật toán di truyền để chọn lọc một danh sách các cổ phiếu gồm các mức phân bổ tỷ trọng đầu tư vào danh mục sao cho lợi nhuận trên mức rủi ro là cao nhất trong khu vực Asian tiềm năng

Chương 5: Kết luận và kiến nghị

Chương 5 sẽ xem xét và tóm tắt kết quả nghiên cứu chính, bên cạnh đó là giải thích các câu hỏi nghiên cứu đã đặt ra trong bài Từ đó, đưa ra một số hàm ý chính sách nhằm nâng cao và khắc phục được một số ý kiến trái chiều trên thị trường làm ảnh hưởng đến giá cổ phiếu của các công ty Cuối cùng là nêu lên một số hạn chế của bài nghiên cứu và đề xuất hướng nghiên cứu tiếp theo.

TỔNG QUAN LÝ THUYẾT QUẢN LÝ DANH MỤC CỔ PHIẾU VÀ THUẬT TOÁN DI TRUYỀN

Cơ sở lý thuyết về quản lý danh mục cổ phiếu

2.1.1 Định nghĩa danh mục cổ phiếu

Danh mục cổ phiếu gồm một nhóm các mã cổ phiếu khác nhau dùng để sinh lời theo tỷ suất sinh lời kỳ vọng Lợi nhuận kỳ vọng này có mối liên kết trực tiếp với rủi ro dự kiến có thể xảy ra của toàn danh mục Hay nói cách khác, đầu tư vào một danh mục cổ phiếu là việc nắm giữ một lượng cổ phần của một hay nhiều công ty khác trên sàn chứng khoán Việc sắp xếp và chọn lọc cổ phiếu nằm trong danh mục có thể đầu tư phụ thuộc vào rất nhiều yếu tố khác nhau như số vốn đầu tư, thời gian đầu tư và khả năng chấp nhận rủi ro của các nhà đầu tư

Trong đầu tư chứng khoán, việc cực kỳ quan trọng đối với một nhà đầu tư đó là lựa chọn cổ phiếu Đó là quá trình xem xét hai vấn đề là rủi ro và lợi tức của cổ phiếu, ai ai cũng hiểu rằng hai yếu tố trên luôn đồng biến cùng nhau, tức có nghĩa là một cổ phiếu có lợi nhuận cao thường kéo theo rủi ro cao trong khi một cổ phiếu có rủi ro thấp thì lợi nhuận thấp Đó là một việc đánh đổi giữa việc mạo hiểm và không mạo hiểm trong đầu tư, nếu ta kỳ vọng lợi nhuận cao thì sẽ luôn đồng nghĩa với việc rủi ro cao Và đối với việc đầu tư, ai cũng mong muốn cổ phiếu mình nắm giữ sẽ có lợi nhuận trong tương lai với một mức độ rủi ro thấp Do đó bài nghiên cứu sẽ cung cấp một danh mục đầu tư đồng thời xem xét rủi ro và lợi nhuận bằng cách tổng hợp đa dạng nhiều mã cổ phiếu khác nhau trong một danh mục bởi vì nếu ta kết hợp các mã cổ phiếu tốt cùng nhau không những có thể làm hạn chế bớt rủi ro mà còn làm tăng lợi nhuận tổng thể của toàn bộ danh mục cổ phiếu

2.1.2 Định nghĩa quản lý danh mục cổ phiếu

Thực chất, việc quản lý danh mục cổ phiếu nằm trong khái niệm quản lý danh mục đầu tư vì nó bao gồm các loại đầu tư tài sản ngoài cổ phiếu như trái phiếu chính phủ, trái phiếu công ty, tín phiếu kho bạc, các loại quỹ và chứng chỉ tiền gửi

Do vậy, theo khái niệm được cung cấp trên trang web Investopedia thì quản lý danh mục đầu tư là việc lựa chọn và giám sát một danh mục đầu tư một cách nghệ thuật và khoa học nhằm đáp ứng các mục tiêu tài chính dài hạn và khả năng chấp nhận rủi ro của khách hàng, công ty hoặc tổ chức (Adam Hayes, 2021)

Trong lĩnh vực đầu tư thì việc quản lý danh mục nhằm đáp ứng các mục tiêu về tối đa hoá giá trị, hạn chế rủi ro xảy ra, sự cân bằng trong danh mục và số lượng các cổ phiếu phù hợp là rất quan trọng và mang tính thách thức Hơn nữa, quản lý danh mục đầu tư đòi hỏi về việc cân bằng điểm mạnh và điểm yếu, cơ hội và các mối đe doạ trên toàn bộ các khoản đầu tư Điều quan trọng là để tối ưu một danh mục mà chúng ta đang xây dựng thì không chỉ phải xét đến mối quan hệ làm cách nào để tối ưu mà danh mục đó cần phải đơn giản là đáp ứng các mục tiêu đầu tư mà chúng ta đã đặt ra ngay từ ban đầu đó là thiết lập một danh mục với lợi nhuận trên mức rủi ro cao, tức có nghĩa xem xét cả hai khía cạnh là lợi nhuận và cả rủi ro

2.1.3 Nội dung về quản lý danh mục đầu tư

2.1.3.1 Lý thuyết về danh mục Markowitz

Một lý thuyết danh mục đầu tư cơ bản không thể không nhắc đến được một nhà kinh tế học Hoa Kỳ đã sáng tác và phát triển là ông Harry Markowitz Ông đã phát triển một mô hình định lượng, còn được gọi là mô hình phương sai trung bình

Mô hình này thường được coi là sự tối thiểu hoá của một hàm mục tiêu đại diện cho phương sai danh mục đầu tư, hay còn được gọi là rủi ro của danh mục đầu tư, đi kèm đó là một mức sinh lời nhất định hoặc tối đa hoá một hàm mục tiêu đại diện cho mức lợi nhuận của danh mục đầu tư đối với một mức rủi ro nhất định Hơn nữa, mô hình này không có bất kỳ ràng buộc nào về việc đầu tư vào một số lượng tài sản khác nhau cũng không hạn chế số tiền đầu tư vào mỗi tài sản (Fernandez và Gomez, 2007)

Học thuyết do ông phát triển nhằm nhấn mạnh tầm quan trọng của việc quản lý danh mục đầu tư gồm 2 việc chính đó là kiểm soát rủi ro và đo lường mức độ tương quan giữa các cổ phiếu thông qua việc phân bổ tỷ trọng trong danh mục đầu tư Chính nhờ lý thuyết của ông đã hỗ trợ một phần nào vào việc xây dựng mô hình danh mục đầu tư đó là xác định được lượng rủi ro có thể xảy ra

2.1.3.2 Các khái niệm liên quan tới lý thuyết danh mục

➢ Tỷ suất sinh lời (Rate of Return)

Tỷ suất sinh lời là một đại lượng đo lường mức độ lợi nhuận mà nhà đầu tư sẽ có được khi họ bỏ vốn và đầu tư vào một loại tài sản và thu hồi vốn kèm phần tiền lãi khi đầu tư Giả sử chúng ta nắm giữ cổ phiếu bắt đầu từ thời điểm t đến thời điểm t + Δt, Δt là khoảng thời gian nhà đầu tư nắm giữ cổ phiếu đến lúc có dự định bán hoặc tính toán tỷ suất lợi nhuận Do vậy ở thời điểm t, ta sẽ có giá cổ phiếu là P(t) và ở thời điểm t + Δt, ta sẽ có giá cổ phiếu là P(t + Δt), và cổ tức nhận được trong suốt thời kỳ là d(t) Vậy tổng tỷ suất sinh lời của chứng khoán là:

➢ Lợi nhuận kỳ vọng (Expected Return)

Lợi nhuận kỳ vọng của một tài sản rủi ro là khoảng lợi nhuận mà nhà đầu tư mong đợi nhận được trong tương lai khi thực hiện khoản đầu tư này Lợi nhuận kỳ vọng có thể được tính bằng cách gán xác suất cho các khoản lợi nhuận có thể thu được từ khoản đầu tư hoặc sử dụng tỷ suất sinh lời trung bình của lợi nhuận lịch sử Đối với bài nghiên cứu, tác giả sử dụng công thức tính giá trị trung bình như sau:

- Ri là tỷ suất sinh lời của tài sản rủi ro trong trường hợp i

- T là tổng số chu kỳ nghiên cứu

Best và Grauer (1991) cho rằng lợi nhuận kỳ vọng sẽ có sự biến động rất lớn đến việc tối ưu trong danh mục đầu tư, chỉ cần một sự biến động nhỏ trong giá trị trung bình của một tài sản sẽ tác động đến một nửa số cổ phiếu trong danh mục đầu tư Do vậy, việc ước tính lợi nhuận kỳ vọng bằng việc tính toán lợi nhuận kỳ vọng của toàn danh mục là một điều cần thiết Tỷ suất sinh lời kỳ vọng đối với một danh mục đầu tư được tính theo công thức sau:

- E(Ri) là lợi nhuận kỳ vọng của tài sản i

- wi là tỷ trọng đầu tư tài sản i trong danh mục (điều kiện 0 ≤ wi ≤ 1)

➢ Phương sai và độ lệch chuẩn của tỷ suất sinh lời đối với một tài sản

Phương sai hay độ lệch chuẩn là một phép đo lường được sử dụng làm công cụ thống kê trong tài chính nhằm đo lường mức biến động của tài sản đó trong quá khứ Hay nói cách khác, phương sai là một phương pháp ước lượng chênh lệch của mức tỷ suất sinh lời có thể có Ri so với tỷ suất sinh lời kỳ vọng E(Ri) Đối với cổ phiếu, độ lệch chuẩn càng lớn hay phương sai giữa giá cổ phiếu và giá trị trung bình càng lớn cho thấy mức độ dao động càng rộng (Marshall Hargrave, 2021)

Phương sai (Variance) của một tỷ suất sinh lời kỳ vọng đối với một tài sản càng lớn đồng nghĩa với việc mức độ rủi ro của toàn danh mục càng lớn và tỷ suất lợi nhuận kỳ vọng cũng đồng biến với mức độ rủi ro đo lường trên toàn danh mục Đại lượng được đo lường như sau:

- E(Ri) là lợi nhuận kỳ vọng của tài sản thứ i

- Ri là tỷ suất sinh lời của tài sản rủi ro trong trường hợp i

- N là số cổ phiếu thực hiện trong danh mục Độ lệch chuẩn (Standard deviation):

Phương sai hay độ lệch chuẩn của một danh mục đầu tư là thước đo rủi ro về mức lợi nhuận tổng hợp thực tế của một nhóm gồm các chứng khoán riêng lẻ tạo nên một danh mục đầu tư Và theo lý thuyết của Harry Markowitz, độ lệch chuẩn của danh mục đầu tư được tính toán như sau:

- wi, wj là tỷ trọng đầu tư tài sản riêng lẻ trong danh mục

- là phương sai của tỷ suất sinh lời đối với tài sản i

- là hiệp phương sai giữa tỷ suất sinh lời đối với tài sản i và tài sản j trong danh mục đầu tư

Công thức độ lệch chuẩn của danh mục đầu tư bao gồm không chỉ phương sai của những tài sản riêng lẻ mà còn kèm theo là hiệp phương sai của các tài sản trong danh mục đầu tư Hơn nữa, để tính toán được rủi ro trong danh mục cổ phiếu thì cần phải xét qua các hiệp phương sai của từng mã chứng khoán trong danh mục

➢ Hiệp phương sai của những tỷ suất sinh lời

Cơ sở lý thuyết về thuật toán di truyền

2.2.1 Giới thiệu về quá trình tiến hoá tự nhiên Để có cái nhìn khái quát và hiểu thêm về thuật toán di truyền, ta hãy xét đến vài khái niệm cơ bản và các chi tiết quan trọng trong sự tiến hoá của sinh vật vì thuật toán di truyền bắt nguồn từ một phần đặc tính của sự tiến hoá giống loài Thuyết tiến hoá do chọn lọc tự nhiên cho biết quá trình biến đổi của các sinh vật qua thời gian và không gian do các thay đổi thể chất và hành vi di truyền (Đặng Vũ Tuấn Sơn, 2020)

Như chúng ta đều biết, trong cơ thể con người và sinh vật nói chung đều tồn tại các kiểu di truyền đặc biệt nhằm xác định và giới hạn khả năng sinh tồn cũng như phát triển cơ thể của mỗi loài Mỗi sinh vật và cá thể sẽ phản ứng như thế nào đối với các hoàn cảnh khác nhau trong môi trường sống, ngày qua ngày duy trì sự tồn tại trước những thử thách của thiên nhiên đều phụ thuộc vào kiểu di truyền đó

Và trong thuật toán di truyền, tính chất này sẽ được đo lường bởi một hệ số thích nghi Cha đẻ của thuyết tiến hoá – Charles Darwin đã có một câu nói rất hay được dịch rằng “Kẻ sống sót không phải là kẻ mạnh nhất hay thông minh nhất, mà là kẻ thích nghi nhất” Ông đã chứng minh được mọi loài vật trên thế giới qua thời gian khi trải qua sự tiến hoá từ đời tổ tiên đều sẽ qua một quá trình chọn lọc tự nhiên, tồn tại được hay không đều phụ thuộc vào sự thích nghi của loài vật

Thực tế cho thấy, quá trình tiến hoá tự nhiên là một quá trình phát triển mang đến sự tối ưu, cụ thể thế hệ sau bao giờ cũng tốt hơn các thế hệ trước Nhờ sự chọn lọc và lai ghép giúp thế hệ con mang tính chất di truyền từ cha mẹ hoặc mang những tính trạng hoàn toàn mới nhằm giúp thích nghi với môi trường Những cá thể nào thích nghi với môi trường sống hơn sẽ đồng nghĩa với việc tồn tại lâu hơn và có cơ hội truyền giống cho thế hệ kế tiếp, ngược lại, cá thể nào không thích ứng được sẽ bị đào thải Quá trình trên dù có ổn định nhưng không phải sự kết hợp nào cũng mang lại sự hoàn hảo do đó trong một số trường hợp mang lại kết quả không mấy khả quan, đó là do các cá thể trải qua quá trình đột biến, dù rằng xác suất xảy ra hiện tượng đột biến thấp hơn rất nhiều so với hiện tượng di truyền nhưng về lâu dài sự đột biến này sẽ có ảnh hưởng nghiêm trọng (Hoàng Kiếm và Lê Hoàng Thái, 2000)

2.2.2 Giới thiệu về thuật toán di truyền

Thuật toán di truyền (Genetic Algorithms – Gas) đã được các nhà sinh vật học phát biểu vào những năm 1950s, 1960s của thế kỷ XX Trong đó Box (1957) và Fraser (1957) là hai người đã nêu lên sự tương quan giữa thuật toán di truyền và sự tiến hoá của sinh vật để tồn tại và phát triển trong tự nhiên Fraser đã thực hiện mô phỏng các quy trình trong cách giải thuật toán di truyền bằng cách sử dụng máy tính Sau đó cụ thể vào năm 1962, Bremermann đã lấy đó làm nền tảng để phục vụ cho việc tính toán các hệ phương trình và nghiên cứu, trong bài nghiên cứu của ông thì lý thuyết ấy đã được củng cố và được áp dụng để giải các hệ phương trình Tuy nhiên, chính một nhà khoa học người Mỹ, John Henry Holland mới là người phát triển và nghiên cứu sâu về ý tưởng này Ông được xem là người cha của thuật toán di truyền và vào năm 1975, ông đã xuất bản quyển sách “Adaptation in Natural and Artificial Systems” nghiên cứu về thuật toán di truyền Sau đó đến năm 1989, ông cùng hai đồng nghiệp David và Kenneth hợp tác tạo nên một nền lý thuyết vững chắc và thực hiện các áp dụng của Gas để giải quyết các vấn đề phức tạp trong thực tế Và đề tài này thu hút các tác giả nghiên cứu khác trên thế giới như Bauer (1994), Berger (1998), Fichter (2000),…

Dubinskas và Urbšienė (2017) đã nêu nhận xét rằng do hệ thống tài chính kinh tế toàn cầu khá phức tạp nên hiện nay đã có một số nhà kinh tế đang cố gắng thay đổi hệ thống bằng các phương trình vi phân ngẫu nhiên được mô phỏng bằng máy tính Việc ứng dụng trí tuệ nhân tạo này không những đề ra được các giải pháp phù hợp và mang tính khả thi hơn mà còn làm tăng hiệu quả đưa ra giải pháp trong quá trình đầu tư Đồng quan điểm, Roberto Pereira (2000) cũng đã tuyên bố rằng các thuật toán di truyền phù hợp để giải quyết các vấn đề trong tài chính, đặc biệt là trong việc xây dựng một danh mục đầu tư tối ưu hoá hiệu quả và phức tạp thay vì các thuật toán xác định cổ điển khác

Nhóm tác giả Sefiane và Benbouziane (2012) cho rằng thuật toán di truyền là một phương pháp lặp đi lặp lại để tìm kiếm giải pháp tối ưu, nó sử dụng một quần thể với kích thước không đổi Quần thể này bao gồm các nhiễm sắc thể, mỗi nhiễm sắc thể là mã hóa của một giải pháp tiềm năng cho việc giải quyết các vấn đề, nó được tạo thành từ một tập hợp các yếu tố được gọi là gen Các nhiễm sắc thể phát triển qua các lần lặp lại liên tiếp, được gọi là thế hệ Ở mỗi lần lặp lại, một quần thể mới được tạo ra với cùng kích thước, thế hệ này bao gồm các nhiễm sắc thể tốt hơn và việc "thích nghi" với môi trường của chúng được biểu thị bằng chức năng chọn lọc Đây là phương pháp dựa trên trí tuệ nhân tạo thông qua các mẫu kỹ thuật ngẫu nhiên dựa trên các nguyên tắc chọn lọc tự nhiên và phương pháp này có thể giải quyết các vấn đề tối ưu hoá phi tuyến tính với mục tiêu có thể không rõ ràng và thậm chí là dữ liệu sử dụng có thể không liên tục do bị ngắt quãng (Lin và Gen, 2007)

Nói chung, thuật toán di truyền là một kỹ thuật của khoa học máy tính dựa trên cách hành xử và phản ứng của con người và sinh vật Thuật toán di truyền có thể ứng dụng trong lĩnh vực tài chính bằng cách dự báo lợi nhuận, giá cổ phiếu, tối ưu hoá danh mục đầu tư, xác định quy tắc giao dịch, định giá quyền chọn, Thuật toán di truyền bao gồm các phương thức biến hoá gồm chọn lọc, lai ghép, đột biến Việc xác định cá thể trong thế hệ hiện tại được giữ lại trong thế hệ tiếp theo được gọi là quá trình chọn lọc Việc ngẫu nhiên kết hợp hai cá thể khác nhau, dùng những thứ có sẵn ở thế hệ trước truyền lại cho thế hệ sau được gọi là quá trình lai ghép Việc ngẫu nhiên thay đổi cấu trúc của cá thể, biến hoá thành những cá thể mới được gọi là quá trình đột biến

2.2.3 Các quá trình chính trong thuật toán di truyền

2.2.3.1 Mã hóa dữ liệu Để có thể thực hiện được các bước trong thuật toán di truyền, việc quan trọng nhất là chọn một cấu trúc dữ liệu tương ứng và phù hợp Theo tìm hiểu, tác giả nhận thấy được có 3 loại cấu trúc dữ liệu thường được dùng trong thuật toán di truyền đó là chuỗi nhị phân, chuỗi số thực và cấu trúc cây Một sơ đồ đơn giản về mã hóa dữ liệu trong thuật toán di truyền được trình bày như sau:

Hình 2.1 Sơ đồ mã hóa dữ liệu thuật toán di truyền

Nguồn: Genetic Algorithm của Tom V Mathew Assistant Professor

Loại 1: Biểu diễn gen bằng chuỗi nhị phân

Thuật ngữ thuật toán di truyền như đã đề cập là một dạng về ứng dụng ngôn ngữ máy tính để có thể trình bày và giải thích các bước có trong thuật toán Ở đây, việc sử dụng chuỗi nhị phân để thể hiện cấu trúc gen của một cá thể nào đó và sâu xa hơn là để thực hiện quy trình đột biến và lai ghép

Loại 2: Biểu diễn gen bằng cấu trúc cây

Phương thức này khá phức tạp nên rất ít có tác giả sử dụng và thực nghiệm, đây là một loại cấu trúc sử dụng cho dữ liệu có dạng cây một nhánh hoặc hai nhánh

Loại 3: Biểu diễn gen bằng số thực Đây là dạng biểu diễn cải tiến hơn khi bài toán phải đối mặt có nhiều tham số mà dạng chuỗi nhị phân không thể giải quyết được vì độ phức tạp đa tham số của bài toán đó Cần có một quy tắc phải lưu ý trong cách biểu diễn này đó là “phải đảm bảo tiết kiệm không gian đối với từng thành phần gen”

Trong bài nghiên cứu, tác giả sẽ sử dụng phương thức biểu diễn gen bằng chuỗi nhị phân để có thể giải quyết bài toán đơn giản hơn

Như đã đề cập trước đây, thuật toán di truyền dựa vào nguyên tắc tồn tại của sinh học là cá thể nào phù hợp nhất sẽ được chọn để thực hiện quá trình sinh sản là lai ghép và đột biến Do vậy, thuật toán di truyền đương nhiên phù hợp để giải quyết các vấn đề liên quan đến tối ưu hóa, hay nói cách khác đây là các bài toán thực hiện việc biến đổi để phù hợp mục tiêu bài toán Tính chất phù hợp (thích nghi) là rất quan trọng quyết định xem đặc điểm cá thể đó có thể hoạt động tốt hay không, những cá thể có thể thích nghi cao hơn sẽ có xác suất cao hơn được chọn lọc để vào các bước di truyền sau Đối với một cá thể thì hàm thích nghi của chúng phải là một giá trị không âm Cheong (2017) đã nêu ý kiến rằng các giá trị thích nghi của các nhiễm sắc thể ngoài việc nhằm đánh giá độ tốt của nhiễm sắc thể đó còn đại diện cho trọng lượng của các cổ phiếu có trong danh mục

Tuỳ vào giá trị hàm thích nghi mà ta biết và đánh giá độ tốt của một cá thể, lấy một ví dụ về bài toán tìm cực đại khi giá trị càng lớn thì chứng tỏ cá thể đó sẽ sinh sống tốt và tương lai có thể có nhiều đời con được sinh sản và với một bài toán tìm giá trị cực tiểu thì nếu đáp án của bài toán ra kết quả càng nhỏ thì cá thể đó sẽ được đánh giá cao về mặt tốt (Lại Thị Nhung, 2011) Giả sử một quần thể có N nhiễm sắc thể ban đầu được ký hiệu x1, x2, x3,… xN được tạo ngẫu nhiên Giá trị thích nghi hay còn được gọi là mức độ phù hợp của mỗi nhiễm sắc thể được đánh giá như sau: f(x1), f(x2), f(x3),… f(xN) Các cặp nhiễm sắc thể có giá trị hàm thích nghi phù hợp sẽ cho thấy một xác suất tối đa để chọn lọc Việc thiết kế một hàm thích nghi là một việc rất quan trọng trong thuật toán di truyền, nếu việc chọn lựa hàm đánh giá không chính xác có thể làm mất đi các cá thể tốt trong quần thể

2.2.3.3 Toán tử chọn cá thể Đối với tiến trình chọn lọc, nhà nghiên cứu sẽ lựa chọn ngẫu nhiên một số cá thể trong nhóm quần thể ban đầu để phát triển ở lần lặp lại tiếp theo dựa trên ý tưởng các cá thể có giá trị thích nghi càng lớn thì khả năng cá thể đó được chọn để lai ghép vào thế hệ sau, thực hiện lại vòng lặp càng cao Các cá thể được chọn, được gọi là bố mẹ, sẽ sản sinh ra đời con cái cho lần lặp lại tiếp theo (Yang, 2006)

Tổng quan các nghiên cứu trước

Cụ thể trong các nghiên cứu gần đây, nghiên cứu của Yang (2006) bằng việc so sánh 3 phương pháp tiếp cận từ giải thuật di truyền, phương sai trung bình và phương pháp Bayes nhằm cải thiện danh mục đầu tư hiệu quả với mẫu nghiên cứu gồm tập dữ liệu MSCI (Morgan Stanley Capital International) gồm các chỉ số tổng lợi nhuận trên vốn chủ sở hữu của Canada, Pháp, Đức, Nhật Bản, Vương Quốc Anh, Mỹ gồm cổ phiếu, trái phiếu và trái phiếu châu Âu dựa trên giá trị đô la Mỹ trong thời gian từ tháng 1 năm 1975 đến tháng 12 năm 2004, lấy tỷ suất sinh lời phi rủi ro là lãi suất T-bill của 3 tháng Kết quả của bài toán đem lại là danh mục đầu tư có độ lệch chuẩn nhỏ hơn, lợi nhuận ngoài mẫu cũng có giá trị trung bình cao hơn đáng kể so với chiến lược danh mục đầu tư phương sai trung bình tiêu chuẩn và phương pháp tiếp cận Bayes Trọng số danh mục đầu tư sử dụng thuật toán di truyền ít bị mất cân bằng hơn và dao động ít hơn nhiều theo thời gian so với phương pháp phương sai trung bình chuẩn và phương pháp Bayes Hơn nữa, tác giả đã nhận định rằng thuật toán là mô hình kết hợp cả thông tin lịch sử và sự không chắc chắn trong tương lai nhằm cải thiện đáng kể độ chính xác trong ước lượng trung bình, giúp nâng cao hiệu suất của mô hình, khắc phục được những khó khăn về tính toán khi tiếp cận bằng phương pháp Bayes

Lin (2007) cũng với sự đồng tình rằng việc áp dụng thuật toán di truyền sẽ mang lại giá trị tối ưu cho việc lập một danh mục đầu tư Tác giả đã khẳng định rằng thuật toán di truyền được thiết kế để giải quyết các vấn đề tối ưu hoá tương ứng vì các phương pháp tối ưu hoá truyền thống hiện có không thể giải quyết hiệu quả được Và với việc nghiên cứu dựa trên một nhóm gồm 40 công ty mẫu được thu thập từ thị trường Đài Loan được sử dụng để chứng minh phương pháp được đề xuất với xác suất lai tạo và đột biến ngẫu nhiên

Nghiên cứu của nhóm tác giả Sefiane & Benbouziane (2012) đã tiến hành ứng dụng thuật toán di truyền vào việc tối ưu danh mục đầu tư gồm 5 cổ phiếu với dữ liệu gồm lợi nhuận trung bình toàn danh mục và phương sai của danh mục trong

5 năm từ 2007 đến 2011 Bằng việc chạy số liệu trên phần mềm Matlab, tác giả đã cho ra kết quả gồm 5 tỷ trọng đầu tư vào 5 mã cổ phiếu và chọn được một cách lai ghép bằng một điểm, hai điểm qua giai đoạn 3 lần lai ghép Kết thúc quá trình nghiên cứu, tác giả đã nhận xét rằng đây là một bài toán thu được kết quả vô cùng hiệu quả bằng việc rút ngắn được thời gian tính toán để có được một giải pháp đầu tư của toàn danh mục

Và một nghiên cứu của nhóm tác giả Dubinskas & Urbsiene (2017) cũng với mục tiêu ứng dụng và đánh giá phương pháp thuật toán di truyền cho dữ liệu gồm 18 mã cổ phiếu được thực hiện từ các doanh nghiệp Litva được niêm yết trên danh sách các công ty chính thức của NASDAQ OMX Baltic trong năm 2013 với mục tiêu là danh mục đầu tư dự kiến được xây dựng gồm 4 doanh nghiệp đại diện cho các lĩnh vực khác nhau Thông qua việc nghiên cứu, rút ra nhận xét rằng việc tối ưu hoá danh mục đầu tư bằng cách áp dụng phương pháp tiếp cận thuật toán tạo ra lợi nhuận cao hơn gấp 4 lần so với danh mục đầu tư được xây dựng bằng phương pháp lập trình xác định hoặc ngẫu nhiên Đi kèm với lợi nhuận cao thì việc đánh giá rủi ro hệ thống của danh mục được phân tích bằng thuật toán di truyền lại cao hơn so với danh mục đầu tư tối ưu hoá bằng lập trình xác định và ngẫu nhiên Nhưng khi đánh giá tổng quan, nhóm tác giả đã nhận xét rằng hiệu suất của danh mục đầu tư được tối ưu hoá bởi gen di truyền thuật toán có thể vượt quá hiệu suất thị trường

Và tác giả cũng đúc kết ra rằng nếu để tìm kiếm các kết luận đáng tin cậy hơn thì một bài nghiên cứu cần phải kiểm tra một số chu kỳ, đặc biệt nhấn mạnh vào việc áp dụng phương pháp thuật toán di truyền trong một thời kỳ suy thoái của thị trường

Bên cạnh tìm hiểu về những cách ứng dụng và so sánh thuật toán đã nêu ở trên, nghiên cứu của Chou và các cộng sự (2017) sử dụng hai phương pháp để chọn lọc thành một danh mục tối ưu, đó là phương pháp tiêu chuẩn hoá quỹ bằng việc tính toán thông qua giá cổ phiếu và phương pháp thuật toán di truyền với số liệu của các cổ phiếu cấu thành trong Taiwan 50 ETF được TWSE và FTSE công bố, thời gian thử nghiệm bắt đầu từ tháng 1/2010 đến tháng 6/2016 và sau khi có kết quả mô hình tác giả đã nhận xét rằng sử dụng việc tiêu chuẩn hoá quỹ để đánh giá chính xác rủi ro danh mục đầu tư vì nó có thể khắc phục hiệu quả những khiếm khuyết của cách tính rủi ro truyền thống Kết hợp thuật toán di tuyền và tỷ lệ Sharpe được tính toán bằng tiêu chuẩn hoá quỹ, có thể chọn ra danh mục đầu tư rủi ro thấp và lợi nhuận ổn định một cách hợp lý và tác giả cũng chứng minh được tỷ lệ sharpe của danh mục đầu tư tối ưu chắc chắn lớn hơn hoặc bằng tỷ lệ sharpe theo phương pháp truyền thống, tạo ra một danh mục có rủi ro thấp hơn vì độ biến động thấp và lợi nhuận cao hơn trên thị trường chứng khoán

Ngoài ra, còn có nghiên cứu của nhóm tác giả Cheong và các cộng sự (2017) cũng sử dụng phương pháp thuật toán di truyền để hỗ trợ tối ưu hoá danh mục đầu tư dựa trên thông tin của nhà đầu tư, đó chính là xây dựng danh mục bằng cách chọn các cổ phiếu được các nhà đầu tư tổ chức hoặc nước ngoài đầu tư nhiều hơn các cổ phiếu khác Thông qua dữ liệu thu được từ Tổng công ty Máy tính Chứng khoán Hàn Quốc (KOSCOM), cụ thể là 90 công ty hàng đầu của KOSPI 200 về vốn hoá thị trường từ ngày 01/09/2007 đến 30/05/2014 và qua quá trình phân tích, tác giả nhận xét rằng thông tin dài hạn vượt trội hơn thông tin trung hạn và ngắn hạn trên thị trường chứng khoán Hàn Quốc và nhằm xem xét các trọng số khác nhau khi sử dụng thuật toán di truyền ảnh hưởng như thế nào đến hiệu suất danh mục đầu tư Đặc biệt, kết quả nghiên cứu còn bổ sung thêm các hành vi và khuôn mẫu của nhà đầu tư có thể được sử dụng để đưa ra chiến lược đầu tư Các nhà đầu tư xây dựng danh mục đầu tư theo mức độ hoàn vốn rủi ro của họ trên khung phương sai trung bình và việc dựa trên chiến lược danh mục của các nhà đầu tư khác nhất định có thể nâng cao hiệu suất danh mục đầu tư Tuy nhiên tác giả cũng đề xuất nên lưu ý rằng trên thị trường chứng khoán Hàn Quốc, các nhà đầu tư tổ chức dự đoán lợi nhuận cao hơn và rủi ro thấp hơn, trong khi các nhà đầu tư nước ngoài chỉ xem xét rủi ro danh mục đầu tư

Nhóm tác giả Chong Liu và các cộng sự (2017) đã có một bài nghiên cứu chỉ ra nếu xét dữ liệu trên thế giới sẽ cho thấy thuật toán di truyền cho ra kết quả cung cấp danh mục đầu tư đáng tin cậy hơn trong cùng rủi ro và không cần giới thiệu hay đề cập về dữ liệu của từng đất nước, tác giả cho rằng chỉ cần quan tâm và thảo luận về tác động của độ dài chuỗi thời gian của mỗi cổ phiếu đối với việc xây dựng danh mục đầu tư và cải thiện hiệu quả thuật toán trong phân tích cổ phiếu thực tế Với mẫu dữ liệu khá bao quát gồm giá đóng cửa của 2317 cổ phiếu trên thị trường Trung Quốc từ 20/02/2016 đến 16/02/2017 có 250 ngày giao dịch Tác giả cũng có cùng quan điểm với những nhà nghiên cứu bên trên rằng thuật toán di truyền đã tối ưu hoá chiến lược danh mục đầu tư và tỷ lệ sharpe thu được tương đối cao, được cải thiện rõ rệt cùng với sự gia tăng số lần lặp, đồng nghĩa với việc khả năng thu được lợi nhuận vượt mức tăng dần Hơn nữa, tác giả cũng đã dùng phép so sánh khi sử dụng thêm hai phương pháp khác là phương pháp ngẫu nhiên và thuật toán K-mean để làm sự tương phản Và kết quả đưa ra là với sự gia tăng rủi ro, tỷ lệ lợi nhuận khi sử dụng thuật toán di truyền càng tăng, cho thấy được tính hiệu quả của thuật toán di truyền

Nghiên cứu của Naresh Elugala (2020) với đề tài nghiên cứu tối ưu hóa danh mục đầu tư bằng cách sử dụng thuật toán di truyền với mục tiêu phân bổ vốn hiệu quả mang lại lợi nhuận và mức rủi ro với kỳ vọng ban đầu đã cho ra kết quả khả quan mặc dù tỷ suất sinh lời kỳ vọng của toàn danh mục chưa đạt được kết quả mong muốn ban đầu là 30% nhưng tác giả đã đạt được mức rủi ro toàn danh mục nhỏ hơn gấp đôi so với kỳ vọng chỉ có 2.59% Bài nghiên cứu đã sử dụng dữ liệu giá đóng cửa của 6 cổ phiếu có trụ sở tại Ấn Độ với mức vốn hóa vô cùng lớn và mốc thời gian nghiên cứu từ tháng 06/2015 đến 06/2018 Tác giả đã tiếp cận phương pháp này bằng cách sử dụng ngôn ngữ lập trình Python, viết các đoạn code nhằm hỗ trợ nghiên cứu và ra kết quả

Nói chung, sau khi tham khảo và nghiên cứu các bài nghiên cứu trước, việc ứng dụng thuật toán di truyền vào chọn lọc và tạo nên một danh mục đầu tư tối ưu đều được rất nhiều tác giả đồng tình và khuyến nghị sử dụng vì hiệu quả mà thuật toán đem lại là vô cùng thuyết phục khi trải qua quá trình phân tích tạo ra một mức lợi nhuận kỳ vọng phù hợp và độ lệch chuẩn đúng với mức kỳ vọng.

PHƯƠNG PHÁP NGHIÊN CỨU VÀ CƠ SỞ DỮ LIỆU

Cơ sở dữ liệu

Dữ liệu sử dụng trong nghiên cứu này bao gồm các lịch sử giao dịch như mã chứng khoán, tháng giao dịch và giá đóng cửa được cung cấp tại hệ thống datastream Đối tượng được chọn trong dữ liệu nghiên cứu là các cổ phiếu đươc niêm yết trên các sàn chứng khoán của các nước Việt Nam, Thailand, Indonesia, Philippine, Malaysia, Singapore có các đặc điểm sau:

• Cổ phiếu được niêm yết trước thời điểm đưa vào danh mục ít nhất là 2 năm

• Cổ phiếu phải được giao dịch trong suốt thời kỳ chọn mẫu nghiên cứu

Dữ liệu gồm có 180 mã cổ phiếu, trong đó tại Việt Nam gồm 30 mã công ty trong sàn VN30 và 30 công ty có vốn hóa lớn nhất tại 5 nước còn lại (chi tiết xem tại phụ lục 01), tháng giao dịch bắt dầu từ 07/2018 đến 04/2021.

Phương pháp nghiên cứu

Như đã đề cập trong chương 1, bài nghiên cứu sẽ sử dụng phương pháp thuật toán di truyền với mục tiêu nghiên cứu là tối đa hóa lợi nhuận và hạn chế rủi ro thông qua hàm mục tiêu lợi nhuận trên mức rủi ro cao Tác giả sử dụng một ngôn ngữ lập trình là Python chạy bằng công cụ Jupyter Notebook để thực hiện xây dựng quy trình nghiên cứu Đây là phương pháp chạy bằng ngôn ngữ máy tính hay còn gọi là các đoạn mã tin học (code) dùng để thay thế ngắn gọn cho chuỗi ký tự hoặc câu lệnh nào đó Những code này mang giá trị về mặt kỹ thuật công nghệ thông tin, thay đổi trong code này không ảnh hưởng đến các giá trị và kết quả liên quan cũng như không giải thích được bất cứ ý nghĩa nào về mặt kinh tế Các mã code sử dụng trong bài được kế thừa và phát triển dựa theo các tác giả nghiên cứu trước có bài nghiên cứu đồng quan điểm với bài nghiên cứu này và các mã code chỉ nhằm hỗ trợ chạy hàm và đưa ra kết quả nghiên cứu Ở một số vị trí, tác giả đã thay đổi công thức code để phù hợp với hướng nghiên cứu của tác giả Thực chất, giải thích cho bài nghiên cứu chỉ xem xét đến các biến về lợi nhuận, rủi ro và mức phân bổ vốn sao cho phù hợp và mang lại một kết quả danh mục tối ưu nhất Quy trình nghiên cứu sẽ như sau: Điều kiện tiên quyết để ta có thể thực hiện được thuật toán đó là ta cần chèn thêm các thư viện phục vụ cho ngôn ngữ Python để giúp hỗ trợ tính toán nguồn dữ liệu có kích thước lớn như numpy, pandas, functools import numpy as np import pandas as pd from functools import reduce Đầu tiên, ta sẽ đọc dữ liệu của một nước gồm 30 công ty, cụ thể mã code như sau, tác giả lấy ví dụ về cách chạy mô hình của nước Việt Nam files=['VIETNAM.csv'] dfs=[] for file in files: temp=pd.read_csv(file) dfs.append(temp) stocks = reduce(lambda left,right: pd.merge(left,right,on='Date'), dfs) print(stocks.shape) stocks.head()

Bước thứ 2, tác giả sẽ tính toán lợi nhuận thông qua các giá trị giao dịch lịch sử là giá đóng cửa bằng trung bình từ 1 đến 33 tháng, lấy mốc thời gian 04/2021 làm quy định chuẩn tính lợi nhuận Công thức sử dụng là tỷ suất sinh lời đã được tác giả nêu tại chương 2, cụ thể là tổng lợi nhuận của cổ phiếu cộng với khoản cổ tức được trả và chia cho giá gốc của cổ phiếu Ở đây, chúng ta giả sử tỷ lệ cổ tức được chi trả là không có trong các công ty def hist_return(months): idx=[] df=pd.DataFrame() for mon in months: temp=(stocks.iloc[0,1:] - stocks.iloc[mon,1:])/(stocks.iloc[mon,1:]) idx.append(str(mon)+'_mon_return') df=pd.concat([df, temp.to_frame().T], ignore_index=True) df.index=idx return df hist_stock_returns=hist_return([1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18, 19,20,21,22,23,24,25,26,27,28,29,30,31,32,33]) hist_stock_returns

Bước thứ 3, ta sẽ xác định gen hay nói cách khác là mã hóa bài toán, trong bước này tác giả sẽ sử dụng một chuỗi nhị phân có chiều dài n-gen (với n là số lượng chứng khoán có trong danh mục) làm nhiễm sắc thể để biểu diễn một danh mục có n chứng khoán cần nghiên cứu Mỗi gen đại diện cho sự xuất hiện hoặc không xuất hiện của một mã cổ phiếu, thứ tự các gen này được quy định theo thứ tự bảng chữ cái gene = np.random.rand() gene import time def gen_mc_grid(rows, cols, n, N): np.random.seed(seed=int(time.time())) layouts = np.zeros((n, rows * cols), dtype=np.int32) positionX = np.random.randint(0, cols, size=(N * n * 2)) positionY = np.random.randint(0, rows, size=(N * n * 2)) ind_rows = 0 ind_pos = 0 while ind_rows < n: layouts[ind_rows, positionX[ind_pos] + positionY[ind_pos]*cols] =1 if np.sum(layouts[ind_rows, :]) == N: ind_rows += 1 ind_pos += 1 if ind_pos >= N * n * 2: print("Not enough positions") break return layouts def gen_mc_grid_with_NA_loc(rows, cols, n, N,NA_loc): np.random.seed(seed=int(time.time())) layouts = np.zeros((n, rows * cols), dtype=np.int32) layouts_NA= np.zeros((n, rows * cols), dtype=np.int32) for i in NA_loc: layouts_NA[:,i-1]=2 positionX = np.random.randint(0, cols, size=(N * n * 2)) positionY = np.random.randint(0, rows, size=(N * n * 2)) ind_rows = 0 ind_pos = 0

N_count=0 while ind_rows < n: cur_state=layouts_NA[ind_rows,positionX[ind_pos]+positionY[ind_pos] * cols] if cur_state!=1 and cur_state!=2: layouts[ind_rows, positionX[ind_pos] + positionY[ind_pos] * cols]=1 layouts_NA[ind_rows, positionX[ind_pos] + positionY[ind_pos] * cols] = 1 N_count+=1 if np.sum(layouts[ind_rows, :]) == N: ind_rows += 1

N_count=0 ind_pos += 1 if ind_pos >= N * n * 2: print("Not enough positions") break return layouts,layouts_NA gen_mc_grid(9, 9, 180, 90) gen_mc_grid_with_NA_loc(9, 9, 180, 90,range(10))

Bước thứ 4, ta sẽ tập hợp số cổ phiếu có trong danh mục và gán ngẫu nhiên tỷ trọng phân bổ vốn, các phần nhỏ của tổng số vốn được chỉ định cho mỗi cổ phiếu để thiết lập bộ trọng số phân bổ đầu tư Một danh mục cổ phiếu sẽ bao gồm các giá trị phân số hay số thập phân của tất cả các cổ phiếu sao cho tổng của các giá trị không lớn hơn 100% hay 1 Nói một cách đơn giản, danh mục đầu tư của ta có 30 cổ phiếu, tác giả sẽ tạo ngẫu nhiên ra 30 biến số tương ứng tỷ trọng đầu tư vào 30 cổ phiếu với tổng vốn là 1 đơn vị def chromosome(n): ch = np.random.rand(n) return ch/sum(ch) child=chromosome(30) print(child,sum(child))

Bước thứ 5, đây là bước bắt đầu trong thuật toán di truyền đó là khởi tạo quần thể Tiến trình này khá đơn giản, chúng ta chỉ cần tạo ra một quần thể gồm các nhiễm sắc thể, trong đó, mỗi nhiễm sắc thể là một vector nhị phân dài n-gen được tạo ngẫu nhiên Để có thể thực hiện việc này, ta cần tính xác suất ước lượng số lượng chứng khoán cho phép nghiên cứu trong danh mục, bởi vì việc có một danh mục với số lượng lớn chứng khoán sẽ không đem lại hiệu quả cao về mục tiêu Xác suất ấy được đo lường như sau:

- n là số lượng chứng khoán có trong danh mục kết quả

- pop_size là số lượng chứng khoán của toàn quần thể

Khi đó, quá trình khởi tạo được mô tả đại khái là tại mỗi gen của nhiễm sắc thể trong quần thể phát sinh một số thực r ngẫu nhiên trong đoạn [0,1] Khi r < p thì mã chứng khoán đó sẽ xuất hiện trong danh mục, tức là giá trị của gen đó bằng 1 Ngược lại thì gen bằng 0, mã chứng khoán đó sẽ không xuất hiện trong danh mục n0 pop_size0 population = np.array([chromosome(n) for _ in range(pop_size)]) print(population.shape) print(population)

Bước thứ 6, tác giả sẽ tính toán hàm mục tiêu đã nêu ở chương 2 là tỷ lệ

Sharpe, lấy tỷ lệ này là thước đo hiệu suất của toàn danh mục đầu tư, trong công thức tính toán, tỷ lệ này phụ thuộc vào biến số là lãi suất phi rủi ro, tác giả dựa vào lãi suất trái phiếu chính phủ của từng nước và tính tỷ lệ trung bình đạt 2% Để có thể tính toán được tỷ lệ Sharpe, ta sẽ tính toán các thành phần nhỏ như sau:

- Tính toán lợi nhuận trung bình, độ lệch chuẩn và hiệp phương sai của lợi nhuận cổ phiếu trong quá khứ o Trước hết, ta sẽ nhập và phổ quát lại tỷ suất sinh lời đã tính ở bước 2 print(hist_stock_returns.info()) cols=hist_stock_returns.columns hist_stock_returns[cols]=hist_stock_returns[cols].apply(pd.to_numeric,errors

='coerce') print(hist_stock_returns.info()) o Tính toán hiệp phương sai của lợi nhuận lịch sử, để có thể dễ tính toán, tác giả sẽ đặt hiệp phương sai của chính cổ phiếu đó bằng không cov_hist_return=hist_stock_returns.cov() print(cov_hist_return) for i in range(30): cov_hist_return.iloc[i][i]=0 cov_hist_return o Tính toán lợi nhuận lịch sử trung bình mean_hist_return=hist_stock_returns.mean() mean_hist_return o Tính toán độ lệch chuẩn của lợi nhuận lịch sử sd_hist_return=hist_stock_returns.std() sd_hist_return

- Tính toán tỷ suất sinh lời kỳ vọng và phương sai của toàn danh mục o Tính toán tỷ suất sinh lời kỳ vọng của danh mục def mean_portfolio_return(child): return np.sum(np.multiply(child,mean_hist_return)) mean_portfolio_return(population[0]) o Tính toán phương sai của danh mục def var_portfolio_return(child): part_1 = np.sum(np.multiply(child,sd_hist_return)**2) temp_lst=[] for i in range(30): for j in range(30): temp=cov_hist_return.iloc[i][j] * child[i] * child[j] temp_lst.append(temp) part_2=np.sum(temp_lst) return part_1+part_2 var_portfolio_return(population[0])

- Tính toán tỷ lệ Sharpe của danh mục def fitness_fuction(child): return(mean_portfolio_return(child)-rf)/np.sqrt(var_portfolio_return(child)) fitness_fuction(population[31])

Bước thứ 7, đây là bước khá quan trọng trong thuật toán di truyền đó là chọn lọc các cổ phiếu mà chúng ta sẽ sinh sản và thực hiện chu trình đột biến và lai ghép Như đã đề cập tại chương 2, trong bước này tác giả sẽ lọc các danh mục cổ phiếu có tỷ lệ Sharpe cao nhất được tính trong bước 6 Trong bước này tác giả đã mặc định xác suất chọn lọc là 0.3 và sau đó tác giả chọn ra 3 cổ phiếu đầu tiên trong danh mục để xem xét hàm mục tiêu của bài nghiên cứu def Select_elite_population(population, frac=0.3): population=sorted(population,key=lambdax:fitness_fuction(x),reverse=True ) percentage_elite_idx = int(np.floor(len(population)* frac)) return population[:percentage_elite_idx] print(len(Select_elite_population(population, frac=0.3)))

Select_elite_population(population, frac=0.3)

[fitness_fuction(x) for x in population][:3]

Bước thứ 8, ta sẽ đến quá trình đột biến các cá thể có trong danh mục, có thể nói đây là chức năng giúp cải thiện cá thể ngày càng khỏe hơn so với đời đầu Đặc biệt trong quy trình này, tác giả sẽ chọn ngẫu nhiên 2 cổ phiếu trong danh sách 30 cổ phiếu để tiến hành biến đổi, và đoạn mã tin học sau sẽ thực hiện lần lượt những lần đột biến sau def mutation(parent): child=parent.copy() n=np.random.choice(range(30),2) while (n[0]==n[1]): n=np.random.choice(range(30),2) child[n[0]],child[n[1]]=child[n[1]],child[n[0]] return child mutation(population[1]),population[1]

Bước thứ 9, tại bước này các mã cổ phiếu sẽ được giao nhau thông qua các tỷ trọng đầu tư có giá trị thực Trong tác vụ lai ghép, tác giả sử dụng phương pháp lai ghép số học để mang lại hiệu quả tối ưu nhất khi đã trình bày tại chương 2 def Arithmetic_crossover(parent1,parent2): alpha = np.random.rand() child1 = alpha * parent1 + (1-alpha) * parent2 child2 = (1-alpha) * parent1 + alpha * parent2 return child1,child2

Bước thứ 10, đây là bước giúp tạo ra một thế hệ gồm các mã cổ phiếu đi kèm với tỷ trọng tiềm năng hơn, thực hiện các quy trình đột biến hoặc trao đổi chéo dựa trên xác suất Tác giả đã mặc định xác suất đột biến là 0.4 và xác suất lai ghép là 0.6, trong các giai đoạn cuối cùng, xác suất đột biến sẽ giảm xuống 0.1 và xác suất lai ghép sẽ tăng lên 0.9 Tổng hai xác suất này luôn luôn bằng 1 và cần chú ý là xác suất lai ghép bao giờ cũng cần phải lớn hơn xác suất đột biến vì việc đột biến cần hạn chế, không phải lúc nào đột biến cũng ra các cá thể với tính trạng tốt và thích nghi được môi trường sống hay nói cách khác là tồn tại được trong danh mục Một lý do khác là xác suất lai ghép càng cao sẽ mang lại nhiều thế hệ đời con có tính trạng tốt hơn Đầu vào của quy trình này sẽ là tổng các cổ phiếu với mức tỷ trọng phân bổ đầu tư phù hợp, đầu ra sẽ là thế hệ tiếp theo với mức gen phù hợp hơn def next_generation(pop_size,elite,crossover=Arithmetic_crossover): new_population=[] elite_range=range(len(elite)) while len(new_population) < pop_size: if len(new_population) > 2*pop_size/3: mutate_or_crossover = np.random.choice([0, 1], p=[0.9, 0.1]) else: mutate_or_crossover = np.random.choice([0, 1], p=[0.4, 0.6]) if mutate_or_crossover: indx=np.random.choice(elite_range) new_population.append(mutation(elite[indx])) else: p1_idx,p2_idx=np.random.choice(elite_range,2) c1,c2=crossover(elite[p1_idx],elite[p2_idx]) chk=0 for gene in range(30): if c1[gene]0: p1_idx,p2_idx=np.random.choice(elite_range,2) c1,c2=crossover(elite[p1_idx],elite[p2_idx]) new_population.extend([c1,c2]) return new_population elite=Select_elite_population(population) next_generation(180,elite)[:3] elite=Select_elite_population(population) next_generation(180,elite,Arithmetic_crossover)[:3]

KẾT QUẢ NGHIÊN CỨU

Phương pháp thực nghiệm

Do các ràng buộc về mặt kỹ thuật và các yếu tố ngoại cảnh tác động nên thực nghiệm sẽ sử dụng các tham số có giá trị phù hợp Tổng các tham số tác giả mặc định mà chương trình sẽ sử dụng đó là:

- Số lượng cổ phiếu mỗi tập nghiên cứu: 30

- Tỷ suất sinh lời kỳ vọng: 20%

- Độ lệch chuẩn của danh mục kỳ vọng: 5%

- Tỷ lệ lãi suất phi rủi ro: 2%

- Số lần lặp (Số thế hệ sinh ra): 40 hoặc hơn

Tác giả đặt mục tiêu 20% tỷ suất lợi nhuận và 5% rủi ro là mức trung bình lợi nhuận và rủi ro phù hợp với thị trường chung cho các cổ phiếu khác nhau trong khu vực Đông Nam Á Đối với tỷ lệ lãi suất phi rủi ro, tác giả đã tính toán theo tỷ lệ trung bình của 6 nước trong mẫu nghiên cứu về lãi suất trái phiếu chính phủ được cập nhật vào ngày 23/5/2021 trong 3 năm (chi tiết xem tại phụ lục 02) Đối với 2 loại xác suất đột biến và xác suất lai ghép, hầu như các bài nghiên cứu trước đều sử dụng phần trăm xác suất tương ứng lai ghép và đột biến là 0.6 và 0.4 như nhóm tác giả Chou và các cộng sự (2017), Naresh Elugala (2020), Mirjalili (2019) Xác suất đột biến càng cao sẽ dẫn đến kết quả mang lại không tốt, ngoài ra xác suất lai ghép nên được cho tỷ lệ cao để mang lại nhiều thế hệ hơn (Mirjalili, 2019) Đối với số lần lặp 40 và xác suất chọn lọc 0.3 mà tác giả chọn được dựa trên kết quả mang lại khả quan của tác giả Naresh Elugala (2020) phù hợp với số lượng cổ phiếu lớn

Các tham số trên có thể thay đổi tùy thuộc vào mục tiêu lẫn nhu cầu của nhà đầu tư và các thiết bị hay cấu hình của máy tính để cho ra kết quả phù hợp Các nhà định lượng cần lưu ý rằng kết quả mô hình có thể là sai số và sẽ có mức chênh lệch khá nhỏ nên cần có một cái nhìn khái quát và mở rộng về khả năng chấp nhận mức lợi nhuận và rủi ro mà bài nghiên cứu mang lại.

Kết quả chương trình

4.2.1 Tổng tỷ suất sinh lời kỳ vọng và rủi ro toàn danh mục của 6 nước trong khu vực Đông Nam Á Để có thể nhìn nhận toàn cảnh 6 danh mục, trước tiên tác giả xem xét đến mức sinh lời và rủi ro mà từng danh mục có thể mang lại sau khi nghiên cứu để có cái nhìn cụ thể hơn Kết hợp bài nghiên cứu về tổng tỷ suất sinh lời và rủi ro của 6 nước chi tiết xem tại phụ lục 09

Hình 4.1 Tỷ suất sinh lời và mức rủi ro của danh mục cổ phiếu tại 6 nước trong khu vực Đông Nam Á

Nguồn: Tổng hợp của tác giả

Bài nghiên cứu sử dụng dữ liệu của 6 nước khác nhau trong khu vực Đông Nam Á tạo ra 6 danh mục đầu tư với mức tỷ suất sinh lời và rủi ro khác nhau Trong hình 4.1 cho ta thấy Việt Nam với danh mục cổ phiếu thuộc top VN30 đã cho ra một kết quả lợi nhuận kỳ vọng cao nhất trong 6 nước với tỷ lệ đáng kinh ngạc xấp xỉ gấp 3 lần tỷ suất lợi nhuận kỳ vọng là 60.23%, tiếp đến là Indonesia đạt mốc

53.13% và đứng thứ 3 là Thái Lan mang lại lợi nhuận vượt mục tiêu là 42.76% Tuy vậy, đi kèm lợi nhuận cao là một rủi ro cũng đáng lo ngại khi mang lại lợi nhuận cao nhất trong 6 nước được xem xét trong khu vực Đông Nam Á thì Việt Nam đứng thứ 2 về rủi ro toàn danh mục là 4.6%, tuy nhiên đáng kể đến là rủi ro danh mục 30 công ty trong thị trường Indonesia lại chiếm 6.04% cán mốc mức rủi ro cao nhất và không đạt mục tiêu kỳ vọng về rủi ro ban đầu của tác giả Vậy có thể rút ra nhận xét rằng khi so sánh 30 công ty đứng đầu trên thị trường chứng khoán với các mã cổ phiếu đạt mức vốn hóa lớn nhất trong mỗi nước thì danh mục của Việt Nam cho kết quả khả quan và đáng đầu tư hơn danh mục Indonesia với mức lợi nhuận cao hơn và rủi ro thấp hơn Nhưng có thật sự danh mục Việt Nam cho ra kết quả tốt nhất? Thực chất câu nói “Lợi nhuận càng cao đồng nghĩa rủi ro càng lớn” là một quy tắc bất di bất dịch khi nói về đầu tư, cái nào cũng có cái giá của hành động đó, trả giá mong muốn cho một mức sinh lời cao thì phải đánh đổi bằng việc mạo hiểm rủi ro càng cao

Khi xét đến việc đầu tư, bất kỳ nhà đầu tư nào cũng mong muốn mình sẽ sở hữu một danh mục với các mã cổ phiếu không những mang lại lợi nhuận cao mà rủi ro cũng phải là một biến số chấp nhận được Nói đến rủi ro thì kết quả bài nghiên cứu chỉ ra rằng cả 5 danh mục thỏa mãn và đáp ứng đủ mục tiêu kỳ vọng về độ lệch chuẩn mà danh mục mang lại ngoại trừ riêng 1 danh mục không đạt yêu cầu về rủi ro kỳ vọng đó là 30 công ty thuộc thị trường Indonesia đã đề cập trên Nhưng khi xét đến lợi nhuận thì cũng chỉ có 5 danh mục mang lại kết quả khả quan và đạt hơn mức kỳ vọng của tác giả đó là Việt Nam, Thái Lan, Indonesia, Philippine và Singapore; duy chỉ danh mục Malaysia lại chỉ đạt mức 19.46% tỷ suất lợi nhuận nhưng bù lại mức rủi ro mà danh mục khắc phục được lại chỉ chiếm gần 1%, một con số vô cùng đáng kinh ngạc, thực tế con số 19.46% vẫn là một con số có thể chấp nhận được và nếu ta chuyển hóa toàn bộ số vốn được phân phối vào các mã cổ phiếu dưới 1% vào các mã cổ phiếu có mức phân bổ cao hơn thì ta vẫn có thể nâng giá trị lợi nhuận toàn danh mục nhưng cũng đồng nghĩa với việc rủi ro chắc chắn sẽ tăng

Nhìn chung, sau kết quả nghiên cứu đúc kết từ 6 mẫu nghiên cứu thì chỉ có 4 mẫu là đáp ứng cả về mặt lợi nhuận và rủi ro kỳ vọng của tác giả đó là Việt Nam, Thái Lan, Philippine, Singapore Mặt khác, khi tác giả đặt mục tiêu kỳ vọng về mức tỷ suất sinh lời của danh mục là 20%, không quan trọng đến tính rủi ro toàn danh mục thì có 5 danh mục đáp ứng yêu cầu, theo thứ tự lợi nhuận giảm dần là Việt Nam, Indonesia, Thái Lan, Philippine và Singapore Khi tác giả chỉ xem xét đến rủi ro kỳ vọng của danh mục là 5%, tức có nghĩa đặt mức rủi ro quan trọng hơn mức lợi nhuận kỳ vọng thì có 5 danh mục đáp ứng yêu cầu được trình bày theo thứ tự rủi ro tăng dần đó là Malaysia, Singapore, Thái Lan, Philippine và Việt Nam Do đó, chúng ta khó có thể kỳ vọng một danh mục với lợi nhuận cao mà mức rủi ro thấp vì sự mạo hiểm trong đầu tư là việc kỳ vọng lợi nhuận mang về cao và quan trọng là việc chấp nhận được mức rủi ro có thể xảy ra không như ý muốn là điều cần phải chấp nhận và không cần bàn cãi

4.2.2 Tỷ lệ Sharpe của các danh mục

Ngày nay, khi có nhiều nghiên cứu chỉ xem xét trên một khía cạnh một là rủi ro hai là lợi nhuận mang lại khi đầu tư tài sản thì việc chỉ xét trên một phương diện có thể sẽ không khái quát được toàn bộ tình trạng chung của thị trường, vì vậy tác giả xem xét trên cả hai phương diện kết hợp đó là lợi nhuận và rủi ro kỳ vọng của danh mục trong tương lai Và một tỷ lệ có thể đem lại cái nhìn chung đó là tỷ lệ Sharpe của danh mục, như tác giả đã đề cập tại chương 2 Để có thể thống kê chi tiết 6 danh mục tại 6 thị trường Đông Nam Á, tác giả sử dụng tỷ lệ Sharpe sau khi có kết quả phân bổ danh mục tối ưu đã cho ra kết quả với cùng một dữ liệu về giá đóng cửa với mốc thời gian từ 07/2018 đến 04/2021 của 30 công ty có vốn hóa thị trường lớn nhất mỗi nước trong hình 4.2 đã cho ra một kết quả tỷ lệ Sharpe giảm dần như sau

Hình 4.2 Tỷ lệ Sharpe của 6 danh mục tại 6 thị trường trong khu vực Đông

Nguồn: Tổng hợp của tác giả Đứng đầu là Malaysia với 19.81, Singapore với 15.07, Việt Nam với 12.67, Thái Lan với 9.33, Indonesia với 8.46 và Philippine với 6.9 Tỷ lệ sharpe như tác giả đã trình bày trong chương 2 là một tỷ lệ thể hiện giá trị bồi thường của danh mục mà một nhà đầu tư sẽ nhận được trên 1 đơn vị rủi ro Tỷ lệ này càng nhỏ thì mức bù rủi ro càng nhỏ và ngược lại, tỷ lệ này càng lớn thì mức bù rủi ro càng lớn

Kết quả đã cho ta thấy mặc dù Việt Nam có mức lợi nhuận cao nhất và Malaysia mang lại lợi nhuận khá thấp nhưng thực chất đầu tư vào thị trường Malaysia vẫn bảo toàn lợi nhuận hơn rất nhiều so với các danh mục mang lại lợi nhuận cao khác Mặt khác, Philippine như đã phân tích ở tiểu mục trên về mức lợi nhuận và rủi ro mà thị trường mang lại thì với mức lợi nhuận mang lại mặc dù cao hơn 20% tỷ suất sinh lời kỳ vọng của tác giả thế nhưng thực chất rủi ro của thị trường này rất cao, đạt mốc 4.51% lấn át cả rủi ro tại thị trường Thái Lan (4.37%)

Do vậy, khi tính toán tỷ lệ Sharpe, Philippine là thị trường mà lợi nhuận điểu chỉnh trên mức rủi ro kém cạnh hơn rất nhiều so với thị trường Thái Lan

Và một điều có thể thấy rõ khi đặt trên bàn cân cả hai thị trường là Malaysia và Indonesia, khi cả hai thị trường này đều không đạt được mức tỷ suất sinh lời và rủi ro kỳ vọng của tác giả, thế nhưng thị trường Malaysia lại làm tốt hơn về việc đảm bảo mức bù rủi ro của thị trường này cao hơn rất nhiều so với thị trường Indonesia Do vậy, khi đầu tư không chỉ nên xem xét từng lợi nhuận hay mức rủi ro riêng lẻ mà cần phải kết hợp chúng để có cái nhìn khái quát hơn về giá trị của các thị trường là khác nhau

Một danh mục cũng đáng ngạc nhiên khi mức lợi nhuận và rủi ro mang lại đều không tối ưu bằng các danh mục khác nhưng tỷ lệ Sharpe lại đứng thứ 2 trong 6 thị trường, đó là 30 công ty trong thị trường Singapore Có vẻ như sâu sắc nhìn nhận rằng không thể nhận xét chỉ trên mặt yếu tố lợi nhuận và cả rủi ro mà cần tính toán xem mức lợi nhuận trên mức độ rủi ro là bao nhiêu mới thực sự là điều cần thiết khi thiết lập một danh mục tối ưu

4.2.3 Phân tích tỷ trọng phân bổ của các danh mục

Trong phần này, tác giả lấy mốc các mã cổ phiếu có tỷ trọng phân bổ trên 5% nhằm xem xét toàn bộ 6 danh mục để có thể nhận xét chung và so sánh dễ dàng hơn và tác giả sẽ đánh giá chung về các mã cổ phiếu cho ra kết quả phân bổ dưới 1% Nhìn chung, 6 biểu đồ thể hiện cho 6 danh mục trong các nước thuộc khu vực Đông Nam Á đã cho ta thấy rằng việc phân bổ trải đều từ 0.3% đến mức hơn 7% tùy danh mục, việc đa dạng hóa danh mục giúp ta đo lường được giữa các ngành khi đặt chung trong một rổ cổ phiếu sẽ được so sánh và giúp việc phân bổ vốn toàn diện hơn Ở đây, tác giả sẽ không phân biệt cổ phiếu nào là cổ phiếu nên đầu tư dài hạn hay cổ phiếu nào nên đầu tư ngắn hạn và cũng không nhận xét danh mục nào tối ưu hơn danh mục nào hay đáng đầu tư hơn thị trường nào mà chỉ đơn giản nhìn nhận trực quan về tình hình biến động của thị trường dựa vào lịch sử giá cả nói chung Tất cả các dữ liệu chi tiết về mức phân bổ tỷ trọng vốn đầu tư vào các mã cổ phiếu của từng danh có thể tham khảo chi tiết tại các phụ lục từ 03 đến 08 tại bước số 11

Danh mục cổ phiếu gồm 30 công ty được niêm yết trên sàn chứng khoán Việt Nam thuộc top chỉ số VN30 với mức vốn hóa thị trường và thanh khoản cao Danh mục cổ phiếu chủ yếu phần lớn bao gồm các lĩnh vực ngân hàng và ngành bất động sản Các lĩnh vực này cũng chủ yếu bao gồm các doanh nghiệp vốn hóa lớn và có thể nói đây là các mã cổ phiếu đầu ngành dẫn dắt và ảnh hưởng chính tới thị trường chung toàn nước

Nhìn chung, việc phân bổ đều được trải đều vào 30 mã cổ phiếu và không có bất kỳ cổ phiếu nào bị loại trừ sau khi phân bổ và đặc biệt trong rổ cổ phiếu VN30 không có cổ phiếu nào dưới mức phân bổ 1% Hầu hết các vốn đều được đổ dồn vào các công ty về bất động sản và ngân hàng

Hình 4.3 Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Việt Nam

Nguồn: Tổng hợp của tác giả

Sau 40 lần lặp, mô hình đã tìm ra được một giải pháp tối ưu về mặt lợi nhuận và hạn chế rủi ro, cho ra kết quả phân bổ vốn đầu tư vào các cổ phiếu thuộc rổ VN30 Kết quả đáng ngạc nhiên là trong các cổ phiếu với mức dữ liệu giá lịch sử được sử dụng làm nghiên cứu đã cho ra kết quả có 5 cổ phiếu có mức phân bổ trên 5% lần lượt là VPB, PDR, NVL, CTG và FPT với trọng số 6.01%, 5.95%, 5.51%, 5.50% và 5.48% tương ứng Năm mã cổ phiếu đứng đầu bảng phân bổ thuộc nhóm ngành bất động sản, công nghệ, ngân hàng Tuy nhiên, có 3 mã cổ phiếu mà danh mục cho kết quả phân bổ khá thấp đó là BVH, VHM và MWG lần lượt là 1%, 1.42% và 1.50%

Ngày đăng: 08/05/2024, 02:52

HÌNH ẢNH LIÊN QUAN

Hình 2.1. Sơ đồ mã hóa dữ liệu thuật toán di truyền - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 2.1. Sơ đồ mã hóa dữ liệu thuật toán di truyền (Trang 34)
Hình 2.2. Tốc độ tăng trưởng của các nước Đông Nam Á từ 2017 đến 2020 - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 2.2. Tốc độ tăng trưởng của các nước Đông Nam Á từ 2017 đến 2020 (Trang 44)
Hình 2.3. Tỷ lệ lạm phát của các nước Đông Nam Á từ năm 2017 đến 2020 - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 2.3. Tỷ lệ lạm phát của các nước Đông Nam Á từ năm 2017 đến 2020 (Trang 45)
Bảng 2.1. Vốn hóa thị trường của 6 nước trong khu vực Đông Nam Á từ năm  2018 đến 2020 - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Bảng 2.1. Vốn hóa thị trường của 6 nước trong khu vực Đông Nam Á từ năm 2018 đến 2020 (Trang 46)
Hình 2.4. Vốn hóa thị trường của các nước Đông Nam Á từ năm 2018 đến 2020 - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 2.4. Vốn hóa thị trường của các nước Đông Nam Á từ năm 2018 đến 2020 (Trang 47)
Hình 4.1. Tỷ suất sinh lời và mức rủi ro của danh mục cổ phiếu tại 6 nước  trong khu vực Đông Nam Á - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 4.1. Tỷ suất sinh lời và mức rủi ro của danh mục cổ phiếu tại 6 nước trong khu vực Đông Nam Á (Trang 64)
Hình 4.2. Tỷ lệ Sharpe của 6 danh mục tại 6 thị trường trong khu vực Đông  Nam Á - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 4.2. Tỷ lệ Sharpe của 6 danh mục tại 6 thị trường trong khu vực Đông Nam Á (Trang 67)
Hình 4.3. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Việt Nam - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 4.3. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Việt Nam (Trang 69)
Hình 4.4. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Thailand - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 4.4. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Thailand (Trang 70)
Hình 4.5. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Malaysia - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 4.5. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Malaysia (Trang 71)
Hình 4.6. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Indonesia - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 4.6. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Indonesia (Trang 72)
Hình 4.7. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Philippine - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 4.7. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Philippine (Trang 73)
Hình 4.8. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Singapore - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
Hình 4.8. Tỷ trọng phân bổ vốn đầu tư vào danh mục cổ phiếu tại Singapore (Trang 74)
PHỤ LỤC 09: Bảng tổng hợp kết quả lợi nhuận, rủi ro và tỷ lệ  Sharpe của 6 danh mục - Khóa luận tốt nghiệp: Ứng dụng thuật toán di truyền để lựa chọn danh mục cổ phiếu trong khu vực Asian
09 Bảng tổng hợp kết quả lợi nhuận, rủi ro và tỷ lệ Sharpe của 6 danh mục (Trang 118)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w