1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu thị trường chứng khoán việt namvà áp dụng khoa học dữ liệu khoa học nhằm đưa ra quyết định đầu tư dài hạn

51 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 51
Dung lượng 5,54 MB

Cấu trúc

  • CHƯƠNG 3: PHÂN TÍCH VÀ THẢO LUẬN 23 (23)
    • 3.1. Tổng quan về thị trường chứng khoán Việt Nam (TTCKVN): 23 (0)
    • 3.2. Phân cụm dữ liệu chưa có nhãn 25 (24)
    • 3.3 Mô hình nghiên cứu 36 (0)
      • 3.3.1. Xây dựng biến số dùng để nghiên cứu 36 (35)
      • 3.3.2. Mô hình nghiên cứu đề xuất 36 (37)
      • 3.3.3. Nguồn số liệu, phương pháp thu thập dữ liệu và nghiên cứu 36 (37)
      • 3.3.4. Mô tả bộ dữ liệu huấn luyện và dự báo 37 (37)
      • 3.3.5 Kết quả của bộ dữ liệu huấn luyện và dự báo 38 (39)
      • 3.3.6 Kết luận của kết quả nghiên cứu 44 (45)
  • CHƯƠNG 4: KẾT LUẬN 45 (46)
    • 4.1 Kết luận 45 (46)
    • 4.2 Hạn chế của đề tài và hướng nghiên cứu tiếp theo 46 (47)

Nội dung

Từ đó góp phần tạo nền tảng cho các nghiên cứu sau này.3.1 Đối tượng và phương pháp nghiên cứuMô hình khoa học dữ liệu và thuật toán phân lớp dữ liệu bảng bằng Neural Network để ứng dụng

PHÂN TÍCH VÀ THẢO LUẬN 23

Phân cụm dữ liệu chưa có nhãn 25

Dữ liệu ban đầu bao gồm 310 công ty, được lấy ngẫu nhiên trên Vietstock dữ liệu thu thập trong quý 3 gồm các chỉ số ROA, ROE, PE, EPS, BETA Ý nghĩa chỉ số:

● ROA: Tỷ suất sinh lợi ròng trên tài sản Chỉ số ROA càng cao thì các nhà đầu tư càng thích.

● ROE: Tỷ suất sinh lợi trên VCSH Hệ số ROE càng cao thì càng hấp dẫn các nhà đầu tư vì khi đó công ty đang sử dụng đồng vốn của cổ đông một cách hiệu quả

● PE: Hệ số giá trên thu nhập Chỉ số PE càng thấp thì mức độ hấp dẫn cổ phiếu càng cao và ngược lại.

● EPS: Tỷ suất thu nhập trên cổ phần EPS càng cao thì sẽ giữ chân được các nhà đầu tư hơn.

● BETA: Các chứng khoán có beta lớn hơn 1 sẽ hấp dẫn các nhà đầu tư hơn

H nh 3.1 Khai báo thuộc tính cho các biến

Nghiên có có 4 biến được ký hiệu trong phần mềm Orange như sau:

● ROE: Tỷ suất sinh lợi trên bình quân vốn chủ sở hữu, đơn vị %

● ROA: Tỷ suất sinh lợi trên bình quân tổng tài sản

● EPS: Thu nhập trên mỗi cổ phần

● beta: Chỉ số tương quan thị trường

● PE: Hệ số giá trên lợi nhuận một cổ phiếu

● MCK: mã cổ phiếu hay mã chứng khoán

H nh 3.2 Thông số điều chỉnh phương pháp K-means

Nghiên cứu phân ra làm 9 cụm, theo thuật toán K-Means, ta có được chỉ số Silhouette của 9 cụm lần lượt là 0.465, 0.488, 0.324, 0.341, 0.349, 0.348, 0.362, 0.287 Dựa vào kết quả trên, ta thấy ở phân cụm 2 và 3 cho kết quả tương đối tốt, chúng ta đang phân vân lựa chọn giữa 2 hay là 3 cụm. lớn hơn hoặc bằng 0.5 vì đây là chỉ số được đánh giá là tốt và hợp lý với dữ liệu nghiên cứu. Trong hình 3, dựa trên kết quả phân cụm (2 cụm), C1 bao gồm 249 mã chứng khoán và C2 bao gồm 61 mã chứng khoán, ta thấy ở cụm 1 có khoảng 15 dữ liệu thấp hơn 0.4 và các chỉ số còn lại nằm trong khoảng [0.5, 0.8], cụm 2 có khoảng 19 dữ liệu thấp hơn 0.4 và các chỉ số còn lại nằm trong khoảng [0.4, 0.6] Nhìn chung kết quả ở cụm 2 chưa hiệu quả do mức chỉ số Silhouette chiến tới 31% , nghiên cứu sẽ tiến hành quan sát chỉ số Silhouette ở phương pháp K-means khi phân ra 3 cụm.

H nh 3.4 Chỉ số Silhouette của các mã chứng khoán trong 3 cụm

Dựa vào hình 3.4, kết quả phân ra 3 cụm, ở C1 có 10 mã chứng khoán, C2 có 239 mã chứng khoán, C3 có 61 mã chứng khoán, các chỉ số Silhouette nằm ở cụm 2 tương đối thấp (dưới 0.4), ở cụm 1 thì cho chỉ số Silhouette đều nằm trên mức 0.8, còn lại ở cụm 3 có khoảng 29 dữ liệu ở dưới mức 0.4 Nhìn chung ở phương pháp này mặc dù tổng thể chỉ số Silhouette là0.488, tuy nhiên các thành phần của các cụm lại chưa có giá trị Silhouette phù hợp.Tóm lại, ở phương pháp K-means phân 2 cụm cho ta kết quả tốt nhất, với C1 gồm 249 mã chứng khoán và C2 gồm 61 mã chứng khoán và chỉ số Silhouette là 0.465.

H nh 3.5 Thiết lập khoảng cách cho phương pháp Hierarchical Clustering Để tiến hành phương pháp Hierarchical Clustering, trước hết ta cần chọn khoảng cách ước lượng, ở đây ta sử dụng khoảng cách Euclid hay còn gọi là độ đo Euclid Sau khi thiết lập ta dùng các phương pháp đo lường khác nhau để tìm đâu là phân cụm phù hợp nhất.

Với phương pháp Linkage Single:

H nh 3.6 Phương pháp Linkage single phù hợp với bộ dữ liệu.

H nh 3.7 Phương pháp Linkage Single biểu diễn bằng Silhouette Plot

Với phương pháp Linkage Average:

H nh 3.8 Phương pháp Linkage Average

Tương tự như phương pháp đo lường Single, nó cũng cho 2 cụm, tuy nhiên cũng chiếm số ít mã chứng khoán ở C1 Hình 8 cung cấp chỉ số Silhouette trong khoảng [-0.6,0.3), chỉ số này cho ta thấy các mã chứng khoán có khả năng nằm ngoài cụm 2 Như vậy giá trị chỉ sốSilhouette này chỉ ra phương pháp này không nên tin tưởng.

H nh 3.9 Phương pháp Linkage Average biểu diễn bằng Silhouette Plot

Với phương pháp Linkage Weighted:

H nh 3.10 Phương pháp Linkage WeightedPhương pháp đo lường Weighted cho ra hai cụm, trong đó cụm 2 chiến đa số Nghiên cứu sử

H nh 3.11 Phương pháp Linkage Weighted biểu diễn bằng Silhouette Plot

Với phương pháp Linkage Complete:

H nh 3.12 Phương pháp Linkage Complete

Với phương pháp đo lường Complete cho ra hai cụm, nhìn tổng quan phương pháp này cho kết quả với chỉ số Silhouette tốt hơn, C1 có số lượng mã cổ phiếu nhiều hơn C2, lần lượt là

248 và 62 Hình 3.13 cho thấy chỉ số Silhouette của từng mã chứng khoán trong hai cụm, chỉ số này nằm trong khoảng [0.4, 0.8] đối với C1, trong đó có khoảng 8 mã cổ phiếu có chỉ sốSilhouette thấp hơn 0.4 Còn đối với C2 có 34 mã chứng khoán có chỉ số trong khoảngSilhouette nằm trong khoảng (0.4,0.6), còn lại là dưới 0.4 Như vậy so với ba phương pháp trước đó, cách đo lường bằng Complete cho nhiều mã chứng khoán có chỉ số Silhouette tốt hơn.

H nh 3.13 Phương pháp Linkage Complete biểu diễn bằng Silhouette Plot

Với phương pháp Linkage Ward:

H nh 3.14 Phương pháp Linkage Ward

H nh 3.15 Phương pháp Linkage Ward biểu diễn bằng Silhouette Plot

Cả hai phương pháp đo lường Complete và Ward cho ra hai cụm gồm các mã cổ phiếu có chỉ số Silhouette tương tối tốt Nhằm đưa ra kết luận tốt hơn, nghiên cứu quan sát dữ liệu này dưới dạng bảng nhằm phân tích các biến và xem ảnh hưởng của chúng đến quyết định đầu tư qua cả hai phương pháp K-means và Hierarchical Clustering (Complete và Ward).

Dữ liệu bảng thông qua K-means, ta thấy C1 bao gồm các cổ phiếu có chỉ số ROA, ROE tương đối thấp hơn so với C2, điều này có nghĩa các công ty thuộc cụm 2 đa phần hoạt động hiệu quả trong quý gần đây, chỉ số ROA thể hiện việc đầu tư tài sản của doanh nghiệp mang lại tỷ suất sinh lợi tốt cho công ty, ta ngầm hiểu ROA càng cao ứng với việc lợi nhuận thu về trên tài sản là càng lớn, còn đối với ROE thì nó thể hiện tỷ suất sinh lợi mang lại cho các chủ sở hữu doanh nghiệp, nếu ROE cao hơn ROA ta hiểu rằng doanh nghiệp đó đang sử dụng đòn bẩy, trong tài chính nếu công ty duy trì mức đòn bẩy tốt sẽ mang lại sự tăng trưởng doanh thu cho doanh nghiệp ngược lại nếu mức đòn bẩy cao nó sẽ trực tiếp làm tăng rủi ro mà nhà đầu tư lẫn doanh nghiệp sẽ gánh chịu Còn chỉ số PE và EPS thể hiện được giá trị mà nhà đầu tư nhận được, ở các cổ phiếu thuộc C2 EPS cao hơn và ổn định hơn với C1, đa phần EPS ở C2 có giá trị dương và mang lại dòng tiền tốt cho nhà đầu tư, tuy nhiên chỉ số PE của C2 lại thấp hơn, tỷ số giá trên thu nhập ngầm ý thể hiện mức tăng trưởng của doanh nghiệp Tóm lại, các cổ phiếu thuộc C1 cho thấy giá trị đầu cơ cao còn C2 cho thấy giá trị về mặt đầu tư dài hạn.

Dữ liệu bảng thông qua phương pháp đo lường Complete, cũng cho kết quả tương tự như K- means khi các mã chứng khoán ở C1 mặc dù có chỉ số ROA, ROE thấp tuy nhiên biến động giá thể hiện ở Beta mạnh mẽ hơn nhiều.

Dữ liệu bảng thông qua phương pháp đo lường Ward cho phân cụm ngược lại với K-means và Complete tuy nhiên nhìn chung các cổ phiếu ở C1 là những cổ phiếu mang tính đầu tư dài hạn.

Kết luận cả 3 phương pháp điều cho ta hai cụm, các cổ phiếu trong dữ liệu quan sát được chia ra làm 2 dạng, một là những cổ phiếu rủi ro cao tuy nhiên biến động giá mạnh mẽ hơn tức là chúng thích hợp cho những nhà đầu cơ, hai là những cổ phiếu biến động thấp so với thị trường tuy nhiên các chỉ số sinh lợi về mặt tài chính lại tốt hơn tức là chúng thích hợp cho những người đầu tư có xu hướng nắm giữ cổ phiếu dài hạn Để thuận tiện cho nghiên cứu, nhóm tác giả thống nhất sử dụng dữ liệu phân cụm của phương pháp K-means và các cổ phiếu ở C2 sẽ là những cổ phiếu đáng để đầu tư.

H nh 3.16 Dữ liệu bảng sau khi phân cụm theo phương pháp K-means, có tổng cộng 2 cụm

Mô hình nghiên cứu 36

3.3.1 Xây dựng biến số dùng để nghiên cứu:

Khi đầu từ vào thị trường chứng khoán, một nhà đầu tư tối đa hóa được lợi nhuận và giảm thiểu rủi ro (rủi ro tài chính hay phi tài chính) xuống mức tối đa là một nhà đầu tư có hiệu quả Trong nghiên cứu này, biến phụ thuộc được sử dụng là đánh giá 310 mã chứng khoán đang niêm yết trên sàn chứng khoán Việt Nam, xem những mã này sẽ có sự ảnh hưởng như thế nào đến quyết định đầu tư hiệu quả

Bài nghiên cứu này tiến hành đánh giá khẩu vị đầu tư và mức độ chấp nhận rủi ro của nhà đầu tư trên sàn giao dịch chứng khoán Việt Nam, xem xét và đánh giá xem tâm lý đầu tư và hiệu quả của danh mục có tương quan như thế này trong mục tiêu đầu tư hiệu quả Kết quả thu được có thể giúp các nhà đầu tư tham khảo và chọn lọc để hỗ trợ cho những quyết định đầu tư của bản thân

Các nhà môi giới chứng khoán sẽ xếp hạng các mã cổ phiếu có thể đầu tư dài hạn Áp dụng vào mô hình này sẽ phân loại ra, những cổ phiếu sẽ được xem là tiềm năng và thích hợp để được đưa vào một danh mục đầu tư có hiệu quả và đầu tư dài hạn.

3.2.1.2.1 Thu nhập trên mỗi cổ phiếu (EPS):

Thu nhập trên mỗi cổ phiếu (EPS) được tính bằng lợi nhuận của công ty chia cho số cổ phiếu đang lưu hành của cổ phiếu phổ thông Con số kết quả phục vụ như là một chỉ số về lợi nhuận của một công ty Thông thường, một công ty sẽ báo cáo EPS được điều chỉnh cho các khoản mục bất thường và khả năng pha loãng cổ phiếu.

EPS = (Thu nhập ròng – Cổ tức cổ phiếu ưu đãi)/ Số lượng cổ phiếu bình quân đang lưu hành.

3.3.1.2.2 Hệ số giá trên thu nhập (P/E):

Tỷ lệ giá trên thu nhập (P/E) là một trong những công cụ được sử dụng rộng rãi nhất mà các nhà đầu tư và nhà phân tích sử dụng để xác định giá trị của cổ phiếu Tỷ lệ P/E là một chỉ số cho biết một cổ phiếu được định giá quá cao hay bị định giá thấp Ngoài ra, P/E của một công ty có thể được so sánh với các cổ phiếu khác trong cùng Tỉ số này được tính theo công thức:

Tỷ lệ P/E đo lường giá trị thị trường của một cổ phiếu so với thu nhập của công ty Tỷ lệ P/E phản ánh những gì thị trường sẵn sàng trả ngày hôm nay cho một cổ phiếu dựa trên thu nhập trong quá khứ hoặc tương lai của nó Tuy nhiên, tỷ lệ P/E có thể đánh lừa các nhà đầu tư, bởi vì thu nhập trong quá khứ không đảm bảo thu nhập trong tương lai sẽ giống như vậy

3.3.1.2.3 Tỷ số lợi nhuận ròng trên tài sản (ROA)

Thuật ngữ lợi nhuận ròng trên tài sản (ROA) đề cập đến một chỉ số tài chính cho biết mức độ sinh lời của một công ty so với tổng tài sản của nó Nhà quản lý, nhà phân tích và nhà đầu tư có thể sử dụng ROA để xác định mức độ hiệu quả của một công ty trong việc sử dụng tài sản của mình để tạo ra lợi nhuận.

ROA = Lợi nhuận ròng dành cho cổ đông thường / Tổng tài sản

ROA nên được so sánh giữa các công ty cùng ngành vì cùng các loại tài sản cơ bản như nhau. Chưa dùng lại ở đó, ROA bao gồm cả nợ vay và vốn chủ sở hữu, việc chỉ nhìn vào ROA có thể là thiếu trực quan vì đôi khi doanh nghiệp có phần lớn tài sản được hình thành từ vốn vay. Một chỉ số tiếp theo sẽ giúp chúng ta nhìn kĩ hơn về phân tích tài chính và đo lường khả năng sinh lợi đó là ROE.

3.3.1.2.4 Tỷ suất thu nhập trên vốn chủ sở hữu (ROE)

Lợi nhuận trên vốn chủ sở hữu (ROE) là thước đo hiệu quả tài chính được tính bằng cách chia thu nhập ròng trên vốn chủ sở hữu Bởi vì vốn chủ sở hữu của cổ đông bằng tài sản của công ty trừ đi nợ của công ty, ROE được coi là lợi tức trên tài sản.

ROE = Lợi nhuận ròng dành cho cổ đông thường / Vốn cổ phần thường

ROE được coi là thước đo khả năng sinh lời của một công ty và mức độ hiệu quả của nó trong việc tạo ra lợi nhuận ROE càng cao, quản lý của công ty càng hiệu quả trong việc tạo thu nhập và tăng trưởng từ nguồn vốn cổ phần

Hệ số beta hay beta là thước đo rủi ro hệ thống của một cổ phiếu hay toàn bộ danh mục đầu tư, thể hiện mức độ tương quan của biến động cổ phiếu hay danh mục so với sự biến động chung của thị trường Hệ số beta của thị trường mặc định bằng 1.

Beta được tính bởi công thức: Beta = Cov(Stock,Market) / Var(Market) ã Beta < 1: biến động giỏ chứng khoỏn thấp hơn so với biến động của thị trường. Các chứng khoán có beta lớn hơn 1 sẽ hấp dẫn các nhà đầu tư hơn vì khi đó chứng khoán tiềm ẩn rủi ro hơn nhưng lại có khả năng sinh lợi cao hơn (Theo nguyên tắc “High Risk, High Return”).

3.3.2 Mô hình nghiên cứu đề xuất:

Dựa trên cơ sở lý thuyết về khai phá dữ liệu, cụ thể là thuật toán phân lớp Neural network cùng lý thuyết về các biến được sử dụng trong mô hình, tôi tiến hành xây dựng mô hình nghiên cứu gồm các yếu tố chính sau đây: ã Biến phụ thuộc là mức độ đỏnh giỏ cú nờn quyết định đầu tư hiệu quả hay khụng đối với

300 công ty và được gán nhãn là “nên” hay “không nên đầu tư”. ã Biến độc lập: gồm 5 biến EPS, P/E, ROA, ROE và beta Trong đú, cỏc biến EPS, ROA, ROE, beta có quan hệ thuận chiều và biến PE có quan hệ nghịch chiều với quyết định đầu tư.

Có nghĩa là khi các chỉ số EPS, ROA, ROE, beta càng cao và biến P/E càng thấp sẽ càng thu hút các nhà đầu tư nên đầu tư hiệu quả.

3.3.3 Nguồn số liệu, phương pháp thu thập dữ liệu và nghiên cứu

Ngày đăng: 08/04/2024, 08:03

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w