1. Trang chủ
  2. » Tất cả

NGHIÊN cứu các PHƯƠNG PHÁP KHAI PHÁ dữ LIỆU và ỨNG DỤNG NEURAL NETWORK vào CHỈ số tài CHÍNH EPS để dự báo TÌNH HÌNH HOẠT ĐỘNG KINH DOANH của các CÔNG TY NIÊM yết TRÊN sàn GIAO DỊCH CHỨNG KHO

84 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 84
Dung lượng 1,28 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ TP HCM KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH TIỂU LUẬN CUỐI KỲ KHOA HỌC DỮ LIỆU NGHIÊN CỨU CÁC PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG NEURAL NETWORK VÀO C[.]

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ TP.HCM KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH TIỂU LUẬN CUỐI KỲ KHOA HỌC DỮ LIỆU NGHIÊN CỨU CÁC PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG NEURAL NETWORK VÀO CHỈ SỐ TÀI CHÍNH EPS ĐỂ DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CƠNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHOÁN TẠI VIỆT NAM GIẢNG VIÊN HƯỚNG DẪN: NCS.TS THÁI KIM PHỤNG MÃ HỌC PHẦN: 21C1INF50905915 – SÁNG THỨ SINH VIÊN THỰC HIỆN: NGUYỄN HOÀNG VINH MÃ SỐ SINH VIÊN: 31191026561 – STT: 36 – FNC05 – K45 Thành phố Hồ Chí Minh – Ngày 23 tháng 10 năm 2021 NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CÔNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO MỤC LỤC MỤC LỤC DANH MỤC CHỮ VIẾT TẮT I IV DANH MỤC BẢNG BIỂU – HÌNH VẼ VÀ BIỂU ĐỒ V Chương 1: GIỚI THIỆU 1.1 Lý lựa chọn đề tài 1.2 Mục tiêu nghiên cứu 1.3 Đối tượng nghiên cứu phương pháp nghiên cứu 1.4 Phạm vi nghiên cứu 1.5 Cấu trúc nghiên cứu Chương 2: CƠ SỞ LÝ LUẬN 2.1 Khai phá liệu 5 2.1.1 Khai phá liệu gì? 2.1.2 Các tính khai phá liệu 2.1.3 Quy trình khai phá liệu 2.1.4 Phương pháp khai phá liệu 2.1.5 Ứng dụng khai phá liệu đời sống 2.1.6 Công cụ khai phá liệu sử dụng nghiên cứu – Orange 2.2 Phân lớp liệu 2.2.1 Khái niệm phân lớp liệu 2.2.2 Quy trình phân lớp liệu 2.2.2.1 Xây dựng mơ hình phân lớp (Learning) NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CƠNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO 2.2.2.2 Ước lượng độ xác mơ hình phân lớp liệu (Classification) 2.2.3 Các phương pháp phân lớp liệu 10 2.2.3.1 Hồi quy Logistic (Logistic Regression) 10 2.2.3.2 SVM (Support Vector Machine) 12 2.2.3.3 Cây định (Decision Tree) 13 2.2.3.4 Neural Network 14 2.2.4 Chi tiết mơ hình khai phá liệu Neural Network 14 2.2.5 Các phương pháp đánh giá mơ hình phân lớp 17 2.2.5.1 Ma trận nhầm lẫn (Confusion Matrix) độ xác (Accuracy); ROC, AUC, Precision/Recall 17 2.2.5.2 Cross Validation: Holdout K-fold cross validation 20 Chương 3: PHÂN TÍCH DỮ LIỆU HUẤN LUYỆN VÀ DỰ BÁO 22 3.1 Sơ lược thị trường chứng khoán Việt Nam 22 3.2 Mơ hình nghiên cứu 24 3.2.1 Xây dựng biến số dùng nghiên cứu 24 3.2.1.1 Biến phụ thuộc 24 3.2.1.2 Biến độc lập 25 3.2.2 Mơ hình nghiên cứu đề xuất 26 3.3 Nguồn số liệu, phương pháp thu thập liệu nghiên cứu 26 3.4 Bộ liệu huấn luyện 27 3.5 Bộ liệu dự báo 28 3.6 Kết liệu huấn luyện 29 3.7 Kết liệu dự báo 33 NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CƠNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO 3.8 Kết luận kết nghiên cứu Chương 4: KẾT LUẬN VÀ HẠN CHẾ – GIẢI PHÁP 36 38 4.1 Kết luận 38 4.2 Hạn chế giải pháp 39 TÀI LIỆU THAM KHẢO I Tài liệu tham khảo nước I Tài liệu tham khảo nước II PHỤ LỤC 1: DANH SÁCH CÔNG TY NIÊM YẾT TRONG BỘ DỮ LIỆU HUẤN LUYỆN III PHỤ LỤC 2: DANH SÁCH CÁC CÔNG TY NIÊM YẾT TRONG BỘ DỮ LIỆU DỰ BÁO IX NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CƠNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO EPS: Earning Per Share DANH MỤC CHỮ VIẾT TẮT HOSE: Sàn giao dịch chứng khốn Thành phố Hồ Chí Minh HNX: Sàn giao dịch chứng khoán Hà Nội UPCOM: Sàn giao dịch chứng khốn Thành phố Hồ Chí Minh AUC: Area Under Curve ROC: Receiver Operating Characteristic SVM: Support Vector Machine MCU: Multipoint Control Unit ASEAN: Hiệp hội quốc gia Đông Nam Á SAR – COV – 2: Viết tắt đại dịch COVID – 19 PE: Price to Earning ratio ROA: Return on Assets ROE: Return on Equity BV: Price to Book value DE: Debt to Equity NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CƠNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO DANH MỤC BẢNG BIỂU – HÌNH VẼ VÀ BIỂU ĐỒ Hình 2.1 Quy trình khai phá liệu Hình 2.2 Quá trình phân lớp liệu – Xây dựng mơ hình phân lớp Hình 2.3 Quá trình phân lớp liệu – Ước lượng độ xác mơ hình Hình 2.4 Quá trình phân lớp liệu – Phân lớp liệu Hình 2.5 Mơ hình phân lớp nhị phân sử dụng phương pháp hồi quy logistic Hình 2.6 Biểu đồ thể giá trị Margin Support Vector Hình 2.7 Ví dụ mơ hình định lựa chọn làm việc ngày cụ thể Hình 2.8 Hình vẽ thể mạng lưới hoạt động Neural Network Hình 2.9 Đường cong ROC Hình 2.10 Diện tích đường cong ROC (độ đo AUC) Bảng 2.1 Ma trận nhầm lẫn Bảng 2.2 Độ đo AUC với độ xác mơ hình phân lớp Hình 3.1 Dữ liệu huấn luyện 20 cơng ty niêm yết Hình 3.2 Dữ liệu dự báo 20 công ty niêm yết Hình 3.3 Mơ tả thuộc tính biến Hình 3.4 Tổng quan quy trình huấn luyện dự báo sơ đồ Hình 3.5 Kết mơ hình đánh giá phân lớp Cross Validation Hình 3.6 Ma trận nhầm lẫn với Neural Network Hình 3.7 Các thuộc tính liệu dự báo Hình 3.8 Kết dự báo Neural Network Hình 3.9 Chỉ số Neural Network Biểu đồ 3.1 Biểu đồ thể số VN–INDEX Việt Nam giai đoạn 2018 – 2020 NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CÔNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO Chương 1: GIỚI THIỆU 1.1 Lý lựa chọn đề tài Cơng nghệ thơng tin đóng vai trị quan trọng việc phát triển kinh tế – xã hội, mặt văn hóa trị với góp phần hình thành nhân tố mới, người Công nghê thông tin Việt Nam ngày dần phát triển bùng nổ khiến cho việc thu thập lượng lớn liệu tăng lên nhanh chóng Mặc dù, có nhiều công cụ hỗ trợ cho việc thu nhập, lưu trữ khai phá liệu, song, với bùng nổ lớn mạnh thông tin thu thập vượt ngồi tầm kiểm sốt người để nắm bắt chúng xử lý kịp thời Cần phải có kỹ thuật khai phá liệu lớn, thế, khai phá liệu mối quan tâm hàng đầu nhà nghiên cứu năm gần Khai phá liệu ứng dụng nhiều lĩnh vực tài chính, ngân hàng, cơng nghệ thơng tin, y tế, giáo dục,… Đặc biệt, với phát triển không ngừng ngành tài nay, việc mà xử lý liệu lớn cần phải thực nhanh chóng, triệt để, tránh mát nhiều thời gian Ngày nay, công nghệ thông tin ngày phát triển đồng nghĩa với việc cần phải phát triển phần mềm, ứng dụng để nâng cao suất làm việc, thay cho kỹ thuật xử lý thơ sơ trước Chính thế, khai phá liệu cơng cụ phân tích, giúp cho việc xử lý liệu diễn nhanh chóng thơng minh Khai phá liệu cho phép người sử dụng phân tích liệu với nhiều góc độ khác nhau, phân loại liệu theo nhiều quan điểm riêng biệt từ đó, tổng kết mối quan hệ bóc tách Lĩnh vực tài lĩnh vực ngày tiếng qua nhiều giai đoạn, đặc biệt thị trường chứng khốn có sức hút nhiều người, kể bạn sinh viên học tập trường Đại học Cao Đẳng Khai phá liệu lĩnh vực tài sử dụng để tăng độ trung thành lượng lớn khách hàng thông qua việc thu thập thông tin cá nhân phân tích liệu hành vi khách hàng Lĩnh vực tài ngân hàng, họ sử dụng thông tin liên quan để dự báo hành vi khách hàng, từ đưa sản phẩm dịch vụ thích hợp Khơng mặt dự báo hành vi khách hàng, khai phá liệu chứng khốn giúp nhà tài có nhìn rõ mối tương quan NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CÔNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO số tài chính, giúp phát rủi ro cao từ hoạt động giao dịch thường ngày Đầu tư tài hoạt động diễn thị trường vốn với đóng góp đáng kể vào thu nhập quốc dân quốc gia Sở giao dịch chứng khốn Thành phố Hồ Chí Minh (HOSE) Sở giao dịch chứng khoán Hà Nội (HNX, UPCOM) thị trường vốn cho công cụ tài dài hạn khác giao dịch, dạng nợ vốn tự có Cổ phiếu công cụ thị trường vốn mà nhà đầu tư quan tâm Cổ phiếu dấu hiệu tham gia sở hữu cá nhân thực thể cơng ty hữu hạn cá nhân Trong đó, số EPS cổ phiếu quan trọng việc đánh giá cơng ty có hoạt động kinh doanh tốt hay không Tỷ lệ thu nhập cổ phiếu (EPS) sử dụng để đo lường thành công ban lãnh đạo việc đạt lợi nhuận cho chủ sở hữu công ty EPS mô tả khả sinh lời công ty phản ánh cổ phiếu Giá trị EPS cao lợi nhuận lớn có khả tăng lượng cổ tức mà cổ đông nhận Chứng tỏ EPS cao, mơ hình hoạt động kinh doanh cơng ty tốt Vì vậy, để kết hợp phương pháp khai phá liệu lĩnh vực công nghệ thông tin với phân tích dự báo số EPS lĩnh vực tài chính, tơi định chọn đề tài “Nghiên cứu phương pháp khai phá liệu ứng dụng Neural Network vào số tài EPS để dự báo tình hình hoạt động kinh doanh cơng ty niêm yết sàn giao dịch chứng khoán Việt Nam” 1.2 Mục tiêu nghiên cứu Bài nghiên cứu “Nghiên cứu phương pháp khai phá liệu ứng dụng Neural Network vào số tài EPS để dự báo tình hình hoạt động kinh doanh công ty niêm yết sàn giao dịch chứng khoán Việt Nam” nhằm tập trung mục tiêu đề cập đây:  Bài nghiên cứu tiến hành phân tích lý thuyết khai phá liệu nhằm tập trung làm rõ vấn đề nghiên cứu NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CÔNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO  Nghiên cứu phương pháp cụ thể, phương pháp phân lớp liệu (phương pháp phân lớp đưa dự báo, phân loại phân lớp đối tượng) Nghiên cứu đưa phương pháp phân lớp liệu, từ chọn phương pháp tối ưu đảm bảo cho trình dự báo liệu  Dự báo mơ hình hoạt động kinh doanh dựa vào liệu huấn luyện, từ đưa mơ hình hoạt động kinh doanh tốt cho doanh nghiệp niêm yết sàn chứng khoán  Qua kết liệu huấn luyện với dự báo mơ hình hoạt động kinh doanh thơng qua số EPS, đưa kết luận, với hạn chế nghiên cứu, sau đưa giải pháp tốt cho nghiên cứu 1.3 Đối tượng nghiên cứu phương pháp nghiên cứu Đối tượng nghiên cứu đề tài 337 doanh nghiệp niêm yết hai sàn chứng khoán Việt Nam bao gồm sàn giao dịch chứng khốn Thành phố Hồ Chí Minh (HOSE) sàn giao dịch chứng khoán Hà Nội (HNX, UPCOM) với số liệu tài Quý II năm 2021 (số liệu lấy từ 10 nhóm ngành khác nhau) Số liệu chia thành phần với 110 mẫu quan sát cho liệu huấn luyện (Ngành Thực Phẩm) 227 mẫu quan sát cho liệu dự báo nhóm ngành (Dịch vụ – Du lịch, Thương Mại, Ngành Thép, Thủy Sản, Nhóm Dầu Khí, Vật Liệu Xây Dựng, Bất Động Sản, Dầu Khí) Phương pháp nghiên cứu đề tài kết hợp phân tích định tính với phân tích định tượng (dự báo) Tôi thu thập liệu dựa nguồn cophieu68.vn thơng qua báo cáo tài chính, nguồn đánh giá tin cậy khả quan, việc tính tốn liệu thơng qua phần mềm khác Chúng sử dụng phương pháp thống kê, phân tích liệu, ứng dụng mơ hình hồi quy kinh tế định lượng để dự báo mơ hình kinh tế thơng qua số EPS với hỗ trợ chương trình Orange Excel (2016) 1.4 Phạm vi nghiên cứu Thời gian: Dữ liệu doanh nghiệp niêm yết sàn chứng khoán Việt Nam bao gồm sàn giao dịch chứng khốn Thành phố Hồ Chí Minh sàn giao dịch chứng khoán Hà Nội Quý II năm 2021 NGHIÊN CÁC PHƯƠNG KHAI PHÁEPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CÔNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO Không gian: Bài nghiên cứu thực dựa 337 doanh nghiệp nhiều lĩnh vực khác Dịch vụ – Du lịch, Thương Mại, Thực Phẩm, Ngành Thép, Thủy Sản, Nhóm Dầu Khí, Vật Liệu Xây Dựng, Bất Động Sản, Dầu Khí, có đầy đủ liệu cơng bố bảng báo cáo tài trang cophieu68.vn 1.5 Cấu trúc nghiên cứu Gồm có chương Chương 1: GIỚI THIỆU Chương 2: CƠ SỞ LÝ LUẬN Chương 3: PHÂN TÍCH VÀ DỰ BÁO Chương 4: KẾT LUẬN VÀ GIẢI PHÁP ... 2020 NGHIÊN CÁC PHƯƠNG KHAI PH? ?EPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CÔNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO. .. giải NGHIÊN CÁC PHƯƠNG KHAI PH? ?EPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CÔNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO. ..NGHIÊN CÁC PHƯƠNG KHAI PH? ?EPS DỮ ĐỂ LIỆU VÀ ỨNG DỤNG NEURALCỨU NETWORK VÀO CHỈPHÁP SỐ TÀI CHÍNH DỰ BÁO TÌNH HÌNH HOẠT ĐỘNG KINH DOANH CỦA CÁC CƠNG TY NIÊM YẾT TRÊN SÀN GIAO DỊCH CHỨNG KHO

Ngày đăng: 20/11/2022, 22:23

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w