Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 14 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
14
Dung lượng
440,96 KB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM THỊ THẢO TÌMHIỂUMỘTSỐMƠHÌNHKHAIPHÁDỮLIỆUTHỜIGIANTHỰC ÁP DỤNGVÀOBÀI TỐN DỰBÁOỨNGDỤNGTRONGPHÂNTÍCHSỐLIỆUTÀICHÍNH LUẬN VĂN THẠC SĨ CƠNG NGHỆ THƠNG TIN HÀ NỘI - 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CƠNG NGHỆ PHẠM THỊ THẢO TÌMHIỂUMỘTSỐMƠHÌNHKHAIPHÁDỮLIỆUTHỜIGIANTHỰC ÁP DỤNGVÀOBÀITOÁNDỰBÁOỨNGDỤNGTRONGPHÂNTÍCHSỐLIỆUTÀICHÍNH Ngành: Cơng nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN HÀ NAM HÀ NỘI – 2015 LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Tìm hiểusốmơhìnhkhaipháliệuthờigianthực áp dụngvào tốn dựbáoứngdụngphântíchsốliệutài chính" cơng trình nghiên cứu riêng tơi Các số liệu, kết trình bày luận văn hồn tồn trung thực chưa cơng bố cơng trình khác Tơi trích dẫn đầy đủtàiliệu tham khảo, cơng trình nghiên cứu liên quan Ngoại trừ tàiliệu tham khảo này, luận văn hoàn toàn nghiên cứu riêng tơi Luận văn hồn thành thờigian học viên Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Hà Nội, ngày 25 tháng 05 năm 2015 Học viên Phạm Thị Thảo LỜI CẢM ƠN Lời đầu tiên, tơi xin gửi lời cảm ơn lòng biết ơn sâu sắc tới PGS.TS Nguyễn Hà Nam tận tình hướng dẫn tơi suốt q trình thực luận văn tốt nghiệp Tôi xin trân trọng cảm ơn Thầy, Cơ giáo tận tình dạy, cung cấp cho kiến thức quý báu ln nhiệt tình giúp đỡ, tạo điều kiện thuận lợi suốt q trình tơi học tập trường Đại học Công nghệ Tôi xin gửi lời cảm ơn tới bạn nhóm thầy Nguyễn Hà Nam hướng dẫn sát cánh hỗ trợ cho tơi suốt q trình học tập q trình làm luận văn Cuối cùng, tơi muốn gửi lời cảm ơn tới gia đình, đồng nghiệp bạn bè, người bên cạnh, động viên tạo điều kiện tốt cho suốt trình học tập thực luận văn tốt nghiệp Tôi xin chân thành cảm ơn! MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC BẢNG CÁC TỪ VIẾT TẮT DANH MỤC BẢNG BIỂU DANH MỤC CÁC HÌNH VẼ, BIỂU ĐỒ MỞ ĐẦU Chƣơng MỘTSỐ KIẾN THỨC CƠ BẢN VỀ TÀICHÍNH 10 1.1 Mộtsốkhái niệm tài 10 1.1.1 Phântíchtài 10 1.1.2 Phương pháp phântíchtài 10 1.1.3 Dựbáo tình hìnhtài Error! Bookmark not defined 1.2 Phântích kỹ thuật dựbáo thị trường chứng khoánError! not defined Bookmark 1.2.1 Thị trường chứng khoán Error! Bookmark not defined 1.2.2 Phântích kỹ thuật Error! Bookmark not defined 1.3 Kết luận Error! Bookmark not defined Chƣơng MỘTSỐMƠHÌNHTRONGBÀI TỐN DỰBÁO Error! Bookmark not defined 2.1 Tổng quan khaipháliệuthờigianthực Error! Bookmark not defined 2.2 Phân lớp liệu Error! Bookmark not defined 2.3 Mộtsốmơhìnhdùngkhaipháliệuthờigian thựcError! Bookmark not defined 2.3.1 Mơhình mạng nơ-ron nhân tạo (ANN – Artificial Neural Network)Error! Bookmark not defined 2.3.2 2.4 Môhình máy vector hỗ trợ (SVM) Error! Bookmark not defined Mơhình ARIMA Error! Bookmark not defined 2.4.1 Hàm tự tương quan ACF Error! Bookmark not defined 2.4.2 Hàm tự tương quan phần PACF Error! Bookmark not defined 2.4.3 Quá trình tự hồi quy AR(p) Error! Bookmark not defined 4 2.4.4 2.5 Quá trình trung bình trượt MA(q) Error! Bookmark not defined Kết luận Error! Bookmark not defined Chƣơng PHƢƠNG PHÁP GIẢI QUYẾT BÀITOÁN Error! Bookmark not defined 3.1 Giới thiệu toán Error! Bookmark not defined 3.2 Xây dựngmơhình Error! Bookmark not defined 3.3 Thu thập tiền xử lý liệu Error! Bookmark not defined 3.3.1 Thu thập liệu Error! Bookmark not defined 3.3.2 Tiền xử lý liệu Error! Bookmark not defined 3.4 Tổ chức liệu Error! Bookmark not defined 3.5 Huấn luyện mạng Error! Bookmark not defined 3.6 Đánh giá mơhìnhdựbáo kết Error! Bookmark not defined 3.7 Kết luận Error! Bookmark not defined Chƣơng THỰC NGHIỆM VÀ ĐÁNH GIÁ Error! Bookmark not defined 4.1 Môi trường thực nghiệm Error! Bookmark not defined 4.2 Dữliệudùngthực nghiệm Error! Bookmark not defined 4.3 Kết thực nghiệm Error! Bookmark not defined 4.3.1 Kết chạy với mơhình ANN Error! Bookmark not defined 4.3.2 Kết chạy với mơhình máy vector hỗ trợ (SVM)Error! not defined 4.3.3 Bookmark Kết chạy với mơhình ARIMA Error! Bookmark not defined 4.4 So sánh đánh giá kết Error! Bookmark not defined 4.5 Kết luận Error! Bookmark not defined KẾT LUẬN Error! Bookmark not defined TÀILIỆU THAM KHẢO 11 BẢNG CÁC TỪ VIẾT TẮT Tên đầyđủ Viết tắt MA EMA Moving Average Exponential Moving Average RSI Relative Strength Index NN Neural Network ANN Artificial Neural Network SVM Support Vector Machine KDD Knowledge Discorvery and Data Mining PTKT Phântích kỹ thuật DM Data mining MLP Multi-Layer Perceptron ARIMA Autoregressive integrated moving average DN Doanh nghiệp CK Chứng khoán PTKT Phântích kỹ thuật DANH MỤC BẢNG BIỂU Bảng 2.1 Các hàm chuyển Error! Bookmark not defined Bảng 3.1 Tổ chức liệu IBM Error! Bookmark not defined Bảng 3.2 Tổ chức liệumơhình Error! Bookmark not defined Bảng 4.1 Các trường hợp tham số đầu vào mạng nơ-ronError! defined Bookmark not Bảng 4.2 Kết độ xác mơhình ANN Error! Bookmark not defined Bảng 4.3 Kết độ xác mơhình SVM Error! Bookmark not defined Bảng 4.4 So sánh kết trung bình mơhình ANN SVMError! not defined Bookmark Bảng 4.5 Kết đưa lời khuyên cho người dùng Error! Bookmark not defined 8 DANH MỤC CÁC HÌNH VẼ, BIỂU ĐỒ Hình 1.1 Biểu đồ dạng đường Error! Bookmark not defined Hình 1.2 Biểu đồ dạng then chắn Error! Bookmark not defined Hình 1.3 Kí tự biểu đồ dạng then chắn Error! Bookmark not defined Hình 1.4 Biểu đồ dạng nến Error! Bookmark not defined Hình 2.1 Mơhìnhkhaipháliệu Error! Bookmark not defined Hình 2.2 Mơhình nơ-ron sinh học Error! Bookmark not defined Hình 2.3 Cấu trúc nơ-ron Error! Bookmark not defined Hình 2.4 Cách tính hàm tổng Error! Bookmark not defined Hình 2.5 Cấu trúc mạng nơ-ron Error! Bookmark not defined Hình 2.6 Hàm sigmoid Error! Bookmark not defined Hình 2.7 Siêu phẳng phân chia liệu theo phương pháp SVMError! Bookmark not defined Hình 2.8 Minh họa tốn phân lớp nhị phân phương pháp SVM Error! Bookmark not defined Hình 2.9 Ví dụ chiều hướng giảm khác [2]Error! defined Bookmark not Hình 3.1 Mơhìnhdựbáo đề xuất Error! Bookmark not defined Hình 3.2 Tạo tập huấn luyện mạng nơ-ron Error! Bookmark not defined Hình 3.3 Quá trình dự đốn mơhình mạng nơ-ronError! defined Bookmark not Hình 4.1 Giá đóng cửa số lượng giao dịch Error! Bookmark not defined Hình 4.2 Biểu đồ thể tính mùa vụ close volumeError! defined Bookmark not Hình 4.3 Đồ thị giá đóng cửa MA10, MA20 Error! Bookmark not defined Hình 4.4 Đồ thị biểu diễn giá đóng cửa, MA10 EMAError! defined Bookmark not Hình 4.5 Kết dự đốn mơhình mạng nơ-ron Error! Bookmark not defined Hình 4.6 Kết dự đốn mơhình mạng nơ-ron với tham số tối ưu Error! Bookmark not defined Hình 4.7 Mơhình mạng nơ-ron với tham số tối ưu theo phương pháp vét cạn Error! Bookmark not defined 9 Hình 4.8 Kết dự đốn mơhình SVM Error! Bookmark not defined Hình 4.9 Mơhìnhdự đốn SVM tối ưu theo phương pháp vét cạnError! not defined Hình 4.10 Sơ đồ trình kết hợp giải thuật GA –SVMError! defined Bookmark Bookmark not Hình 4.11 Kết mơhìnhdự đốn SVM tối ưu theo phương pháp GA Error! Bookmark not defined Hình 4.12 Kết dự đốn mơhình ARIMA kết hợp phương pháp vét cạn Error! Bookmark not defined MỞ ĐẦU Dữliệutài ln nguồn liệu vô phong phú giai đoạn Đặc biệt, phát triển mạnh mẽ công nghệ thông tin mạng internet giúp người dễ dàng tiếp cận với kho liệu khổng lồ Tuy nhiên, thực tế, người cần phải biết chắt lọc, chọn lựa thông tin có ích nhằm phân tích, khai thác, phát tri thức bên liệu cách hiệu Các phương pháp quản trị khai thác liệu thủ công, truyền thống tỏ hiệu trước nhu cầu khai thác phát thông tin giai đoạn Từ đó, kỹ thuật phát tri thứckhaipháliệu (KDD – Knowledge Discorvery and Data Mining) đời đem lại hiệu cao vấn đề khai thác phát tri thức, áp dụng nhiều lĩnh vực khác nhau, đặc biệt quản lý vĩ mô kinh doanh mà cụ thể thị trường chứng khoán Việc dự đoán thị trường chứng khoán toán nhiều người quan tâm Sự khơng tuyến tính thị trường kèm theo tác động nhiều yếu tố bên làm ảnh hưởng tới trình thay đổi thị trường chứng khốn Vì vậy, làm để dự đốn xác lên xuống thị trường toán mà nhà đầu tư quan tâm, tìm hiểu, nghiên cứu phântích Đã có nhiều nghiên cứu giới (trong có Việt Nam) tốn dựbáo thị trường chứng khốn sử dụngmơhìnhkhaipháliệu khác Năm 2001, Efstathios Kalyvas phântích thị trường chứng khốn sử dụngmơhình mạng nơ-ron đạt kết định Và đây, năm 2007 luận văn thạc sĩ học viên Phạm Thị Hoàng Nhung (ĐHQGHN) nghiên cứu mạng nơ-ron ứngdụngvàodựbáo lưu lượng nước đến hồ Hòa Bình với kết dựbáo xác lớn 80% Trong khn khổ luận văn, tác giả tập trung tìmhiểu nghiên cứu sốmơhìnhkhaipháliệuthờigianthực áp dụng cho tốn phântích thị trường chứng khốn, cụ thể mơhình mạng nơ-ron nhân tạo, mơhình máy vector hỗ trợ 10 mơhình arima Mục tiêu luận văn áp dụng giải thuật gen di truyền để tối ưu mơhình mạng nơ-ron mơhình máy vector hỗ trợ, từ so sánh, đánh giá để tìmmơhình phù hợp với liệu ban đầu Sau đó, luận văn đưa lời khuyên cho người chơi nên mua, bán hay giữ nguyên cổ phiếu phiên Luận văn trình bày chương sau: Chƣơng 1: Mộtsốkhái niệm tàiTrong chương này, tác giả giới thiệu sốkhái niệm tài thị trường chứng khốn Chương luận văn tập trung nghiên cứu số chứng khốn phântích kỹ thuật ứngdụngdựbáo chứng khoán Chƣơng 2: Tổng quan khaipháliệuthờigianthực Chương giới thiệu tổng quan khaipháliệuthờigianthựcsốmơhìnhdùngkhaipháliệumơhình mạng nơ-ron nhân tạo (ANN), mơhình máy vector hỗ trợ (SVM) mơhình Arima Chƣơng 3: Mơhìnhdựbáo thị trƣờng chứng khốn Chương tập trung vàotìmhiểumơhìnhdựbáo thị trường chứng khốn Nội dung chủ yếu lý thuyết tìmhiểu quy trình tốn khaipháliệu áp dụng cho dựbáo thị trường chứng khoán như: giới thiệu tốn, xây dựngmơ hình, thu thập tiền xử lý liệu, đánh giá môhình Chƣơng 4: Thực nghiệm đánh giá Nội dung chủ yếu chương ứngdụngmôhình nghiên cứu để dựbáo thị trường chứng khốn Mỗi mơhình chạy tham số ngẫu nhiên, tham số tối ưu sử dụng phương pháp vét cạn tham số sau tối ưu sử dụng phương pháp học máy (cụ thể phương pháp gen di truyền) Từ so sánh, đánh giá kết đưa lựa chọn mơhình phù hợp với liệu lời khuyên cho người dùng 11 Chƣơng MỘTSỐ KIẾN THỨC CƠ BẢN VỀ TÀICHÍNH 1.1 Mộtsốkhái niệm tài 1.1.1 Phântíchtài Các hệ thống tài chứa đựng kho liệu khổng lồ, phức tạp Việc phântíchtài nghiệp vụ cần thiết nhằm đánh giá tình hình kinh tế đất nước, ngành, địa phương sở xác định nhu cầu cần thiết xã hội có định hướng thỏa đáng Đối với doanh nghiệp nhà đầu tư việc đánh giá, phântích hoạt động kinh doanh nhằm nắm bắt tình hìnhtài chính, kinh doanh doanh nghiệp, giúp họ đưa phương hướng, định đắn hoạt động kinh doanh, giúp doanh nghiệp tồn phát triển theo hướng tốt Vậy Phântích hoạt động tài doanh nghiệp q trình thu thập, xử lý thơng tin kế tốn, nhằm xem xét, kiểm tra, đối chiếu, so sánh tài hành với q khứ, giúp người sử dụng thơng tin đánh giá tình hìnhtài DN, đánh giá tiềm năng, hiệu kinh doanh rủi ro tương lai Ý nghĩa việc phântíchtài có giá trị khác tùy thuộc vào mục đích, nhu cầu người sử dụng Đối với chủ doanh nghiệp nhà quản trị doanh nghiệp, mối quan tâm hàng đầu họ tìm kiếm lợi nhuận khả tài trợ Đối với nhà đầu tư mối quan tâm họ yếu tố rủi ro, thờigian hoàn vốn, mức sinh lãi khả toán vốn Một điều chung ta nhận họ quan tâm đến khả tạo dòng tiền, khả sinh lời, khả toán mức sinh lời tối đa Tuy nhiên, để phântích xác cần có thơng tin đầy đủ, xác để giúp họ có định đắn định đầu tư, cho vay, sản xuất Đây ý nghĩa quan trọng việc phântíchtài doanh nghiệp nói riêng phântích tình hìnhtài quốc gia nói chung 1.1.2 Phƣơng pháp phântíchtài Để tiến hành phântíchtài chính, thơng thường người ta sử dụng kết hợp nhiều phương pháp phântích để đánh giá tình hình doanh nghiệp cách xác thực tối ưu Phương pháp chủ yếu phương pháp so sánh phântích tỉ lệ [1] Phƣơng pháp so sánh: So sánh phương pháp sử dụng phổ biến phântích để xác định xu hướng, mức độ biến động tiêu phântích Vì để tiến hành so sánh phải giải vấn đề bản, cần phải đảm bảo điều kiện đồng để so sánh tiêu tài Như thống khơng gian, thời gian, nội dung, tính 12 TÀILIỆU THAM KHẢO Tiếng Việt [1] Hồi, N.T., Bình, P.T & Duy, N.K (2009), DựBáoPhânTíchDữLiệu Kinh Tế Tài Chính, NXB Thống Kê [2] Luận văn thạc sĩ Phạm Thị Hoàng Nhung, Ứngdụng mạng nơ-ron dựbáo lượng nước hồ Hòa Bình [3] TS Lê Văn Phùng; ThS Quách Xuân Trưởng (2012), Khaiphá liệu, NXB Thông tin Truyền thông Tiếng Anh [4] Abhishek Kar (Y8021), Stock Prediction using Artificial Neural Networks [5] D.E Goldberg (1989), Genetic Algorithm in Search, Optimization and Machine Learning, Addison Wesley, Reading, MA [6] Karl Nygren (2004), Stock Prediction – A Neural Network Approach [7] M TIM JONES, Artificial Intelligence- A Systems Approach [8] Rob J Hyndman, 2008, Time series and forecasting in R [9] Stuart J Russell and Peter Norvig, Artificial Intelligence- A moderm Approach – 2nt Edition [10] Vahid Khorani, Nafiseh Forouzideh, Ali Motie Nasrabadi (2011), Artificial Neural Network Weights Optimization Using ICA, GA, ICA-GA and R-ICA-GA: Comparing Performances [11] Wolfgang Karl Härdle, Dedy Dwi Prastyo, Christian Hafner, Support Vectơr Machines with Evolutionary Feature Selection for Default Prediction [12] http://bis.net.vn/ [13] http://vietstock.vn/2012/06/du-bao-thi-truong-chung-khoan-bang-phuong-phapdinh-luong-585-179888.htm [14] http://stackoverflow.com/ [15] http://neuron.eng.wayne.edu/tarek/MITbook/t_contents.html [16] http://www.obitko.com/tutorials/neural-network-prediction/training-set.html [17] http://www.liacc.up.pt/_ltorgo [18] http://www.rdatamining.com/ ... THẢO TÌM HIỂU MỘT SỐ MƠ HÌNH KHAI PHÁ DỮ LIỆU THỜI GIAN THỰC ÁP DỤNG VÀO BÀI TỐN DỰ BÁO ỨNG DỤNG TRONG PHÂN TÍCH SỐ LIỆU TÀI CHÍNH Ngành: Cơng nghệ thơng tin Chun ngành: Hệ thống thông tin Mã số: ... Tìm hiểu số mơ hình khai phá liệu thời gian thực áp dụng vào toán dự báo ứng dụng phân tích số liệu tài chính" cơng trình nghiên cứu riêng Các số liệu, kết trình bày luận văn hồn tồn trung thực. .. quan khai phá liệu thời gian thực Chương giới thiệu tổng quan khai phá liệu thời gian thực số mơ hình dùng khai phá liệu mơ hình mạng nơ-ron nhân tạo (ANN), mơ hình máy vector hỗ trợ (SVM) mơ hình