Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 76 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
76
Dung lượng
1,77 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - PHÙNG ĐÌNH VŨ ĐỀ TÀI LUẬN VĂN Dự đoán xu thế, giá số chứng khoán Việt Nam VN-Index sử dụng phân tích hồi quy Gaussian Process mơ hình tự hồi quy trung bình động ARMA LUẬN VĂN THẠC SĨ KỸ THUẬT CHUYÊN NGÀNH CÔNG NGHỆ THÔNG TIN MÃ CHUYÊN NGÀNH: 60480201 Ngƣời hƣớng dẫn khoa học PGS.TS HUỲNH QUYẾT THẮNG Hà Nội – 2017 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn: Phùng Đình Vũ Đề tài luận văn: Dự đốn xu thế, giá số chứng khoán Việt Nam VN-Index sử dụng phân tích hồi quy Gaussian Process mơ hình tự hồi quy trung bình động ARMA Chuyên ngành: Công Nghệ Thông Tin Mã số SV: CB150301 Tác giả, Ngƣời hƣớng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 26 tháng 04 năm 2017 với nội dung sau: Phần mở đầu luận văn - Học viên viết lại phần mở đầu luận văn, thay đổi cách đặt vấn đề, trích dẫn phƣơng pháp có Việt Nam giới toán dự báo thị trƣờng chứng khốn (TTCK) Trình bày sơ lƣợc ƣu, nhƣợc điểm hai phƣơng pháp Gaussian Process ARMA tốn dự báo TTCK Tóm tắt mục đích phƣơng pháp kết hợp phƣơng pháp phƣơng pháp kết hợp GPR-ARMA đƣợc tác giả đề xuất - Bổ sung phần bố cục luận văn Chỉnh sửa chương - Mục 1.1: Bổ sung thêm thông tin số VN-Index đối tƣợng thu thập thông tin phƣơng pháp Bổ sung liệu đầu vào phƣơng pháp chuỗi thời gian giá đóng cửa số VN-Index qua ngày giao dịch - Mục 1.2: Lƣợc bỏ nội dung có Trình bày tổng quan, ngắn gọn phƣơng pháp tồn giải toán dự báo TTCK, tập trung tìm hiểu kết nghiên cứu có hai phƣơng pháp (riêng lẻ) áp dụng cho chuỗi thời gian (là đối tƣợng nghiên cứu luận văn): phân tích hồi quy Gaussian Process mơ hình tự hồi quy trung bình động ARMA (chuyển sang từ mục 2.1) - Mục 1.3: Lƣợc bỏ nội dung (khơng liên quan) phƣơng pháp phân tích hồi quy Tập trung trình bày lý thuyết ba mơ hình đƣợc sử dụng phƣơng pháp GPRARMA: mơ hình chuỗi thời gian, mơ hình tự hồi quy trung bình động ARMA phân tích hồi quy Gaussian Process Vẽ lại hình 1.1 mục (trang 14) - Mục 1.4: Thay phần kết luận cho chƣơng Chỉnh sửa chương - Đổi tên chƣơng thành “XÂY DỰNG PHƢƠNG PHÁP KẾT HỢP GPR-ARMA DỰ ĐOÁN CHUỖI THỜI GIAN” nhằm nhấn mạnh phạm vi toán dự báo chuỗi thời gian (áp dụng cho số chứng khoán) - Bổ sung mục 2.1.1 nhằm: Định nghĩa tập liệu đầu vào toán, xác định phạm vi đối tƣợng nghiên cứu luận văn Lý lựa chọn tập liệu tính thực tiễn việc nghiên cứu số VN-Index Chuyển mục 2.1.3 phân tách tập liệu thành tập huấn luyện tập kiểm thử mục 2.1.1 - Thay đổi mục 2.1.2 thành “Phân tích liệu lịch sử số VN-Index”, học viên tập trung vào q trình phân tích liệu kết phân tích để đƣa biến đổi liệu phù hợp cho phƣơng pháp đề xuất - Mục 2.2: Tập trung vào trình bày bƣớc thực theo trình tự phƣơng pháp đề xuất từ việc thu thập liệu đến bƣớc để tiến hành dự đoán đƣa kết dự đốn - Bổ sung mục 2.3 trình bày quy trình thực phƣơng pháp dự đốn Chuyển nội dung mục 2.1.3 phân tách tập liệu kiểm thử mơ hình vào mục 2.3 - Bổ sung mục 2.5 tổng kết chƣơng Chỉnh sửa chương - Mục 3.1 Bổ sung mô tả lớp chƣơng trình thu thập liệu, chức ngƣời dùng giao diện chƣơng trình thu thập liệu - Bổ sung mục 3.3.3 việc so sánh kết dự đoán phƣơng pháp kết hợp GPR-ARMA với phƣơng pháp dự đoán riêng lẻ GPR ARMA - Bổ sung mục 3.4 tổng kết chƣơng Chỉnh sửa phần kết luận - Thay phần liệt kê cách viết thành đoạn văn hoàn chỉnh Phần phụ lục - Lƣợc bỏ số nội dung (không liên quan) số dùng phƣơng pháp phân tích phân tích kĩ thuật Sửa số lỗi trình bày - Đánh lại số trang Sử dụng định dạng i, ii, v.v cho trang đầu gồm lời cam đoan, lời cảm ơn, mục lục, danh mục bảng hình vẽ Sử dụng định dang số 1, 2, v.v phần mở đầu luận văn - Các cơng thức, tên hình, tên bảng đƣợc đánh số theo chƣơng - Tên bảng đƣợc đƣa lên đầu bảng Tên hình vẽ đặt dƣới hình - Các lỗi tả, sửa liệt kê tài liệu tham khảo - Bổ sung, trích dẫn tài liệu gốc - Giải thích đại lƣợng đƣợc sử dụng công thức - Các thông tin ngày, tháng, năm đƣợc viết chữ rõ ràng để tránh nhầm lẫn cho ngƣời đọc - Đánh số lại đề mục cách hợp lý theo nội dung luận văn Ngày… tháng … năm 2017 Giáo viên hƣớng dẫn CHỦ TỊCH HỘI ĐỒNG Tác giả luận văn LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu riêng tơi có giúp đỡ lớn Thầy hƣớng dẫn PGS.TS Huỳnh Quyết Thắng, môn Công nghệ phần mềm, Viện Công nghệ thông tin truyền thông, Đại học Bách Khoa Hà Nội Các số liệu, kết nêu luận văn trung thực, rõ ràng chƣa đƣợc công bố cơng trình khác Trong luận văn tơi có tham khảo đến số tài liệu đƣợc liệt kê phần Tài liệu tham khảo cuối luận văn, nội dung trích dẫn ghi rõ nguồn gốc Hà Nội, ngày… tháng … năm 2017 Tác giả luận văn Phùng Đình Vũ i LỜI CẢM ƠN Lời xin gửi lời cám ơn chân thành sâu sắc tới Thầy PGS.TS Huỳnh Quyết Thắng, Bộ môn Công nghệ phần mềm, Viện Công nghệ thông tin truyền thông, Đại học Bách Khoa Hà Nội Trong trình thực luận văn, Thầy hƣớng dẫn bảo ân cần, cung cấp cho nhiều tài liệu quan trọng tảng để tìm tịi nghiên cứu sâu đề tài “Dự đoán xu thế, giá số chứng khoán Việt Nam VNIndex sử dụng phân tích hồi quy Gaussian Process mơ hình tự hồi quy trung bình động ARMA” Mỗi lời góp ý Thầy giúp tơi định hƣớng tốt hơn, đắn cho đề tài chọn Tôi xin gửi lời cám ơn tới Thầy, Cô Viện Công nghệ thông tin truyền thông, Viện Đào tạo sau đại học tận tình dạy dỗ, giúp đỡ, cung cấp cho nhiều kiến thức chuyên sâu, bổ ích cần thiết Để từ đó, tơi có đủ khả hiểu biết để thực hoàn thành luận văn cách tốt Lời xin gửi lời cám ơn chân thành sâu sắc tới Thầy, Cô hội đồng chấm luận văn thạc sỹ đƣa nhận xét, đánh giá, góp ý quý báu giúp tơi chỉnh sửa hồn thành luận văn cách tốt Cuối xin dành lời cảm ơn tới ngƣời thân gia đình tơi quan tâm, chăm sóc, ủng hộ vật chất tinh thần lớn lao để tơi có động lực theo đuổi đề tài ii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC BẢNG VÀ HÌNH VẼ v DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT vi MỞ ĐẦU CHƢƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Chỉ số chứng khoán VN-Index 1.2 Các phƣơng pháp phân tích TTCK 1.3 Mơ hình phân tích định lƣợng dựa chuỗi thời gian 1.3.1 Mơ hình chuỗi thời gian 1.3.2 Mô hình tự hồi quy trung bình động ARMA 1.3.3 Phân tích hồi quy Gaussian Process 13 1.4 Kết chƣơng 17 CHƢƠNG 2: XÂY DỰNG PHƢƠNG PHÁP KẾT HỢP GPR-ARMA DỰ ĐOÁN CHUỖI THỜI GIAN 19 2.1 Xây dựng mô hình liệu đầu vào 19 2.1.1 Mô tả tập liệu toán 19 2.1.2 Phân tích liệu lịch sử số VN-Index 22 2.2 Phƣơng pháp dự đoán chuỗi thời gian GPR-ARMA 27 2.3 Quy trình thực phƣơng pháp dự đoán 34 2.4 Đánh giá sai số cho phƣơng pháp dự đoán 36 2.5 Kết chƣơng 38 CHƢƠNG 3: CÀI ĐẶT VÀ ĐÁNH GIÁ THỰC NGHIỆM 39 3.1 Chƣơng trình thu thập liệu lịch sử số VN-Index 39 3.2 Chƣơng trình dự đốn theo phƣơng pháp GRP-ARMA 42 3.2.1 Cài đặt gói phần mềm đƣợc sử dụng 42 3.2.2 Thiết kế module chƣơng trình dự đốn 43 3.2.3 Triển khai chƣơng trình dự đốn 44 iii 3.3 Kết thử nghiệm chƣơng trình dự đốn 46 3.3.1 Đánh giá kết nội suy phƣơng pháp 46 3.3.2 Đánh giá kết ngoại suy phƣơng pháp 48 3.3.3 So sánh phƣơng pháp GPR-ARMA với phƣơng pháp riêng lẻ 54 3.4 Kết chƣơng 56 KẾT LUẬN VÀ ĐỊNH HƢỚNG PHÁT TRIỂN 57 Kết luận 57 Định hƣớng phát triển 60 DANH MỤC TÀI LIỆU THAM KHẢO 62 PHỤ LỤC 64 P1 Giải thuật Innovations 64 P2 Biểu đồ tự tƣơng quan phân phối thành phần xu 65 P3 Đánh giá khoảng tin cậy phân phối chuẩn 66 P4 Danh sách đăng ký máy chủ Google 66 iv DANH MỤC CÁC BẢNG VÀ HÌNH VẼ Danh mục hình vẽ Hình 1.1: Biểu diễn đồ thị cho phân tích hồi quy Gaussian Process 14 Hình 2.1: Biểu đồ liệu lịch sử giá đóng cửa số VN-Index 20 Hình 2.2: Biểu diễn thành phần chuỗi thời gian đầu vào 24 Hình 2.3: Biểu đồ tự tƣơng quan thành phần ngẫu nhiên 25 Hình 2.4: Phân phối giá trị thành phần ngẫu nhiên 25 Hình 2.5: Biểu đồ tự tƣơng quan thành phần biến đổi xu 26 Hình 2.6: Phân phối giá trị thành phần xu biến đổi 27 Hình 2.7: Các bƣớc thực phƣơng pháp GPR-ARMA 28 Hình 2.8: Quy trình thực phƣơng pháp dự đoán 35 Hình 3.1: Quá trình thu thập liệu lịch sử giá 40 Hình 3.2: Giao diện chƣơng trình thu thập liệu số VN-Index 41 Hình 3.3: Các module chƣơng trình dự đốn 43 Hình 3.4: Đồ thị kết dự đoán nội suy phƣơng pháp GPR-ARMA 47 Hình 3.5: Đồ thị kết dự đoán theo phƣơng pháp kết hợp GPR-ARMA 53 Hình 3.6: Đồ thị kết dự đốn theo phƣơng pháp Gaussian Process 54 Hình 3.7: Đồ thị kết dự đoán theo phƣơng pháp ARMA 55 Danh mục bảng Bảng 1.1: Một số hàm hiệp phƣơng sai Gaussian Process 15 Bảng 2.1: Bảng nhầm lẫn kết dự đoán xu 37 Bảng 3.1: Danh sách gói thƣ viện Python đƣợc cài đặt 42 Bảng 3.2: Cấu hình phân phối liệu kiểm thử cho máy chủ 45 Bảng 3.3: Đánh giá sai số nội suy phƣơng pháp GPR-ARMA 46 Bảng 3.4: Bảng nhầm lẫn nội suy với phân lớp tăng 46 Bảng 3.5: Bảng nhầm lẫn nội suy với phân lớp giảm 46 Bảng 3.6: Bảng nhầm lẫn nội suy tổng hợp phân lớp 46 Bảng 3.7: Giá trị tham số/siêu tham số mơ hình sau bƣớc lặp 48 Bảng 3.8: Kết dự đoán theo phƣơng pháp GPR-ARMA 50 Bảng 3.9: Kết dự đoán xu theo phƣơng pháp GPR-ARMA 50 Bảng 3.10: Bảng nhầm lẫn ngoại suy với phân lớp tăng 51 Bảng 3.11: Bảng nhầm lẫn ngoại suy với phân lớp giảm 52 Bảng 3.12: Bảng nhầm lẫn ngoại suy tổng hợp phân lớp 52 Bảng 3.13: Đánh giá sai số ngoại suy phƣơng pháp GRP-ARMA 52 Bảng 3.14: Đánh giá sai số ngoại suy phƣơng pháp Gaussian Process 55 Bảng 3.15: Đánh giá sai số ngoại suy phƣơng pháp ARMA 55 v DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT Chữ viết tắt Tiếng Anh Nghĩa Tiếng Việt TTCK Stock Market Thị trƣờng chứng khoán HOSE Ho Chi Minh Stock Exchanges Sở giao dịch chứng khoán TP Hồ Chí Minh HNX Hanoi Stock Exchanges Sở giao dịch chứng khoán Hà Nội UPCOM Unlisted Public Company Market Thị trƣờng giao dịch công ty đại chúng chƣa niêm yết CMV Current Market Value Tổng giá trị TTCK BMV Base Market Value Tổng giá trị sở TTCK ACF Auto Correlation Function Hàm tự tƣơng quan ARMA Autoregressive Moving Average Mơ hình tự hồi quy trung bình động ARIMA Autoregressive Integrated Moving Average Mơ hình tự hồi quy kết hợp trung bình động GPR Gaussian Process Regression Phân tích hồi quy Gaussian Process ANN Artificial Neural Network Mạng Nơron nhân tạo GA Genetic Algorithm Giải thuật di truyền BN Bayession Network Mạng Bayes SVM Support Vector Machine Máy vector hỗ trợ WN White Noise Nhiễu trắng RMSE Root Mean Square Error Căn bậc hai kỳ vọng sai số bình phƣơng MAPE Mean Absolute Percentage Error Kỳ vọng trị tuyệt đối sai số phần trăm AIC Akaike Information Criterion Tiêu chuẩn thông tin Akaike BIC Bayesian Information Criterion Tiêu chuẩn thông tin Bayes vi ... tìm tịi nghiên cứu sâu đề tài ? ?Dự đoán xu thế, giá số chứng khoán Việt Nam VNIndex sử dụng phân tích hồi quy Gaussian Process mơ hình tự hồi quy trung bình động ARMA? ?? Mỗi lời góp ý Thầy giúp tơi... pháp phân tích hồi quy Tập trung trình bày lý thuyết ba mơ hình đƣợc sử dụng phƣơng pháp GPRARMA: mơ hình chuỗi thời gian, mơ hình tự hồi quy trung bình động ARMA phân tích hồi quy Gaussian Process. .. hợp Trong phƣơng pháp GPR -ARMA, phân tích hồi quy Gaussian Process đƣợc áp dụng để dự đoán chuỗi xu thế, mơ hình tự hồi quy trung bình động ARMA đƣợc áp dụng để dự đoán chuỗi ngẫu nhiên Có thể