Dự báo giá Bitcoin bằng kết hợp mô hình Arima và mạng nơron

9 85 0
Dự báo giá Bitcoin bằng kết hợp mô hình Arima và mạng nơron

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết trình bày thử nghiệm một số mô hình dự báo như ARIMA, mạng nơron, kết hợp ARIMA và mạng nơron để dự báo giá đóng cửa (USD) của đồng Bitcoin trong ngày tiếp theo. Dữ liệu giá đóng cửa của đồng Bitcoin được thu thập từ ngày 28/04/2013 đến ngày 7/11/2017 gồm 1655 ngày trên website của cộng đồng Kaggle.

Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Huế, ngày 07-08/6/2019 DOI: 10.15625/vap.2019.00015 DỰ BÁO GIÁ BITCOIN BẰNG KẾT HỢP MƠ HÌNH ARIMA VÀ MẠNG NƠRON Lê Hữu Vinh1, Nguyễn Đình Thuân2 1,2 Trƣờng Đại học Công nghệ Thông tin, Đại học Quốc gia TP Hồ Chí Minh vinhlh.10@grad.uit.edu.vn, thuannd@uit.edu.vn TĨM TẮT: Trong năm gần đây, Bitcoin lên đồng tiền ảo sử dụng rộng rãi giới Bitcoin dùng để tốn trực tuyến đơn giản kênh đầu tư sinh lời Bitcoin gần không phụ thuộc vào biến động thị trường điều chỉnh phủ Giá Bitcoin thay đổi thường xuyên nên vấn đề dự báo gặp nhiều thử thách Trong báo này, thử nghiệm số mơ hình dự báo ARIMA, mạng nơron, kết hợp ARIMA mạng nơron để dự báo giá đóng cửa (USD) đồng Bitcoin ngày Dữ liệu giá đóng cửa đồng Bitcoin thu thập từ ngày 28/04/2013 đến ngày 7/11/2017 gồm 1655 ngày website cộng đồng Kaggle Kết dự báo mơ hình so sánh để xem xét mơ hình phù hợp việc dự báo giá Bitcoin Từ khóa: Chuỗi thời gian, ARIMA, mạng nơron, dự báo Bitcoin I GIỚI THIỆU Vào tháng 10 năm 2008, đồng tiền ảo Bitcoin đƣợc Satoshi Nakamoto lần giới thiệu báo cáo “Bitcoin: A Peer-to-Peer Electronic Cash System” [1] Năm 2009, Nakamoto phát hành phần mềm để tạo Bitcoin đến có cộng đồng rộng lớn sử dụng Bitcoin khắp giới Bitcoin loại tiền điện tử, giao dịch hồn tồn khơng thơng qua tổ chức tài nhƣ ngân hàng, quỹ đầu tƣ Ƣu điểm lớn Bitcoin đƣợc kiểm soát thuật toán giúp minh bạch hóa giao dịch Nakamoto tạo Bitcoin với mong muốn đồng tiền ảo thay loại tiền tệ đƣợc giao dịch thông qua ngân hàng tốn nhiều chi phí quản lý Với đặc trƣng mình, Bitcoin gần nhƣ khơng phụ thuộc vào biến động thị trƣờng điều chỉnh phủ Giá Bitcoin biến động thƣờng xuyên dẫn đến việc dự báo gặp nhiều khó khăn Nhƣng động lực cho nghiên cứu dự báo giá Bitcoin Devavrat Shah [2] trình bày phƣơng pháp hồi quy Bayes để dự đoán thay đổi giá Bitcoin sau 10 giây Dựa phƣơng pháp này, tác giả đƣa chiến lƣợc đơn giản để giao dịch Bitcoin Với chiến lƣợc đó, tác giả thực 2872 giao dịch mua bán Bitcoin, lợi nhuận đạt đƣợc 50 ngày khoảng 89% Siddhi Velankar [3] cố gắng dự báo giá Bitcoin sở xem xét yếu tố ảnh hƣởng đến giá trị Bitcoin Trong giai đoạn nghiên cứu, tác giả tìm hiểu lựa chọn đặc trƣng ảnh hƣởng đến giá Bitcoin Tác giả thu thập liệu giá Bitcoin từ Quandl CoinMarketCap Song song đó, Siddhi Velankar [3] tìm hiểu hai phƣơng pháp hồi quy Bayes GLM/Random forest để thực nghiệm sau sử dụng phƣơng pháp chuẩn hóa liệu nhƣ chuẩn hóa log, z-score, độ lệch chuẩn, Box-Cox sử dụng hàm „normc‟ MATLAB để chuẩn hóa liệu giá Bitcoin Trong cơng trình nghiên cứu tiếp theo, tác giả sử dụng hồi quy Bayes GLM/Random forest để thực nghiệm nhằm tìm phƣơng pháp cho kết dự báo tốt liệu giá Bitcoin Ngồi mơ hình hồi quy, mơ hình máy học đƣợc áp dụng dự báo Bitcoin João Almeida [4] áp dụng mạng nơron nhân tạo để dự báo xu hƣớng giá Bitcoin ngày dựa vào giá khối lƣợng giao dịch Bitcoin ngày trƣớc Các mơ hình mạng nơron đƣợc cài đặt thực nghiệm với thƣ viện Theano công cụ MATLAB liệu giá Bitcoin thu thập từ website Quandl Thực nghiệm cho thấy việc thêm khối lƣợng giao dịch Bitcoin để làm giá trị đầu vào cho mạng nơron lúc làm tăng độ xác dự báo Trong nghiên cứu gần đây, Huisu Jang [5] đề xuất sử dụng mạng nơron Bayes để phân tích biến động giá Bitcoin Song song đó, tác giả lựa chọn số đặc trƣng từ thơng tin Blockchain có liên quan đến cung cầu Bitcoin để cải thiện kết dự báo Tác giả thực nghiệm mạng nơron Bayes số phƣơng pháp tuyến tính phi tuyến tính khác liệu giá Bitcoin Kết thực nghiệm cho thấy, mạng nơron Bayes thực tốt việc dự báo giá Bitcoin mô tả đƣợc biến động lớn giá Bitcoin Việc dự báo giá Bitcoin đƣợc cộng đồng nghiên cứu quan tâm lợi ích giá trị kinh tế mà loại tiền điện tử mang lại Bài báo áp dụng mơ hình dự báo chuỗi thời gian nhƣ ARIMA, mạng nơron để dự báo giá Bitcoin ngày Những mơ hình dự báo nhƣ ARIMA, mạng FFNN (Feed Forward Neural Network), mạng CNN (Convolutional Neural Network), kết hợp ARIMA-FFNN, kết hợp ARIMA-CNN đƣợc cài đặt thực nghiệm nhằm xem xét mô hình phù hợp cho dự báo giá Bitcoin Lê Hữu Vinh, Nguyễn Đình Thn 111 II CÁC MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN A Mơ hình ARIMA (Autoregressive Integrated Moving Average) Mơ hình ARIMA mơ hình đƣợc sử dụng rộng rãi dự báo chuỗi thời gian Mơ hình đƣợc Box Jenkins giới thiệu lần đầu vào năm 1970 sách “Time-Series Analysis: Forecasting and Control” Theo đó, mơ hình ARIMA kết hợp q trình tự hồi quy (AR) trình trung bình trƣợt (MA) chuỗi thời gian dừng Một mơ hình ARIMA (p, d, q) gồm thành phần: AR (Autoregression) mơ hình tự hồi quy biểu diễn phụ thuộc điểm thời gian xét vào số điểm thời gian trƣớc (p) I (Integrated) số lần lấy sai phân để làm cho chuỗi thời gian có tính dừng (d) MA (Moving Average) mơ hình trung bình trƣợt biểu diễn phụ thuộc điểm thời gian xét vào vài số hạng sai số ngẫu nhiên giá trị trung bình điểm thời gian trƣớc (q) Một mơ hình tự hồi quy AR bậc p – AR(p) trình tuyến tính đƣợc xác định phƣơng trình: yt = c + ∑ + với yt giá trị thời điểm t, c số, hệ số tự tƣơng quan thời điểm t-1, t-2, , t-p trƣớc số hạng sai số ngẫu nhiên khơng tƣơng quan, có giá trị trung bình phƣơng sai không đổi Một mô hình trung bình trƣợt MA bậc q – MA(q) đƣợc xác định phƣơng trình: yt = µ + ∑ với µ giá trị trung bình chuỗi thời gian, trọng số số hạng sai số ngẫu nhiên thời điểm t, t-1, …, t-q, số hạng sai số ngẫu nhiên không tƣơng quan, có giá trị trung bình phƣơng sai không đổi Giả sử chuỗi thời gian tuân theo trình tự hồi quy trung bình trƣợt, kết hợp hai mơ hình lại với để biểu diễn chuỗi thời gian phƣơng trình: yt = c + ∑ + +∑ với ≠ 0, ≠ > Trên thực tế, mơ hình ARIMA có khả áp dụng chuỗi thời gian khơng có tính dừng chuỗi thời gian đƣợc lấy sai phân bậc d để chuyển đổi thành chuỗi thời gian có tính dừng Để xây dựng mơ hình ARIMA cho dự báo chuỗi thời gian, Box Jenkins đề xuất phƣơng pháp luận gồm bốn bƣớc sau: Bƣớc Nhận dạng mơ hình ARIMA (p, d, q): tìm giá trị thích hợp p q thông qua hàm tự tƣơng quan riêng phần (PACF) hàm tự tƣơng quan (ACF) Giá trị d số lần lấy sai phân để chuỗi thời gian có tính dừng Bƣớc Ƣớc lƣợng mơ hình: dựa vào liệu chuỗi thời gian để tìm tham số mơ hình tự hồi quy trung bình trƣợt Bƣớc Kiểm định mơ hình: xem xét mơ hình xây dựng có phù hợp với liệu hay không Các tiêu chuẩn AIC (Akaike information criterion), BIC (Bayesian information criterion), HQIC (Hannan–Quinn information criterion) hỗ trợ việc kiểm định Ngoài ra, cách kiểm định đơn giản khác xem xét phần dƣ ƣớc lƣợng từ mơ hình có tính ngẫu nhiên túy hay khơng Nếu có mơ hình đƣợc chấp nhận, cịn khơng phải thực lại bƣớc nhận dạng mơ hình ƣớc lƣợng mơ hình đến tìm đƣợc mơ hình chấp nhận đƣợc Bƣớc Dự báo chuỗi thời gian: sử dụng mơ hình vừa tìm đƣợc để dự báo giá trị thời điểm t tƣơng lai chuỗi thời gian B Mơ hình FFNN (Feedforward Neural Network) Trong năm gần đây, nhiều nghiên cứu áp dụng mơ hình mạng nơron nhân tạo dự báo chuỗi thời gian đạt đƣợc số kết định Bogdan Oancea [6] cài đặt mơ hình mạng nơron với hai kiến trúc mạng FFNN RNN (Recurrent Neural Network) cho việc dự báo chuỗi thời gian Tác giả chạy thực nghiệm tập liệu tỷ giá hối đoái đồng EUR/RON USD/RON Đầu tiên, tác giả chuẩn hóa liệu cơng thức logarit tự nhiên để nâng cao độ xác dự báo Sau đó, mơ hình FFNN đƣợc xây dựng với 20 nơron lớp đầu vào (input layer), 40 nơron lớp ẩn (hidden layer) nơron lớp đầu (output layer) giá trị dự báo cho thời gian t+1 Tác giả chia tập liệu với 80% cho huấn luyện (training) 20% cho thử nghiệm (testing) Kế tiếp, mạng RNN đƣợc cài đặt với 20 nơron lớp đầu vào, 10 nơron lớp ẩn hồi quy nơron lớp đầu Sau thực nghiệm, tác giả khẳng định mô hình RNN cho kết dự báo tốt FFNN tập liệu tỷ giá hối đoái DỰ BÁO GIÁ BITCOIN BẰNG KẾT HỢP MƠ HÌNH ARIMA VÀ MẠNG NƠRON 112 M Raeesi [7] sử dụng mạng nơron FFNN để dự báo liệu giao thông thành phố Monroe, bang Louisiana, Hoa Kỳ Nghiên cứu đề xuất mạng nơron sử dụng liệu giao thông ngày hôm nay, ngày hôm qua, tuần trƣớc, hai tuần trƣớc, ba tuần trƣớc tháng trƣớc để làm đầu vào cho dự báo lƣu lƣợng giao thông ngày mai Kết thực nghiệm cho thấy mơ hình mạng nơron xây dựng đƣợc sử dụng cho dự báo giao thông thành phố Monroe Tuy nhiên, vài trƣờng hợp có kết dự báo với sai số lớn yếu tố bất thƣờng tác động nhƣ tai nạn, thời tiết xấu,… Kumar Abhishek [8] sử dụng mạng nơron FFNN với giải thuật lan truyền ngƣợc (backpropagation) dự báo chứng khoán tập liệu tập đoàn Microsoft từ 1/1/2011 đến 31/12/2011 gồm lớp đơn giản mạng (10 nơron lớp đầu vào, nơron lớp đầu ra), độ xác dự báo lên đến 99% Mạng nơron nhân tạo lấy ý tƣởng từ việc mô hoạt động não ngƣời Mạng nơron nhân tạo có nhiều kiến trúc khác nhƣ mạng nơron truyền thẳng, mạng nơron tích chập, mạng nơron hồi quy Trong đó, mạng nơron truyền thẳng (FFNN) bao gồm lớp đầu vào (input layer), nhiều lớp ẩn (hidden layer), lớp đầu (output layer) Số đặc trƣng tập liệu tƣơng ứng với số nơron lớp đầu vào Tất nơron đƣợc kết nối với nơron lớp ẩn thông qua đƣờng liên kết gọi “khớp thần kinh” Mỗi “khớp thần kinh” đƣợc gán trọng số (weight) Các trọng số đƣợc điều chỉnh trình học mạng nơron nhân tạo để mơ hình hóa mối liên hệ lớp đầu vào đầu Trong lớp ẩn, nơron thực hàm kích hoạt (thƣờng hàm sigmoid, relu) có chức tính tốn giá trị đầu vào kết hợp với trọng số để gửi đến lớp đầu Lớp đầu nhận giá trị từ lớp ẩn tính giá trị đầu mơ hình Các giá trị thực tế tập huấn luyện giá trị đƣợc tính mơ hình mạng nơron có sai số (độ lỗi) Để mạng nơron mơ hình mối liên hệ lớp đầu vào đầu cách tốt mạng nơron trải qua trình học hỏi Bản chất q trình mơ độ lỗi dự báo phƣơng trình tìm giá trị cực tiểu phƣơng trình thơng qua việc cập nhật trọng số nơron mạng Quá trình học hỏi thƣờng đƣợc thực với giải thuật lan truyền ngƣợc kỹ thuật gradient descent Input layer Hidden layer Output layer yt-1 yt-2 yt yt-p Hình Kiến trúc mạng nơron truyền thẳng cho dự báo chuỗi thời gian [7] Trong dự báo chuỗi thời gian, mơ hình mạng nơron FFNN sử dụng đặc trƣng cho lớp đầu vào giá trị điểm thời gian trƣớc điểm thời gian dự báo Mối liên hệ giá trị đầu (yt) giá trị đầu vào (yt-1, yt-2, …, yt-p) đƣợc mơ hình phƣơng trình [10]: yt = +∑ ( +∑ )+ đó, (j=0, 1, 2, …, q) (i=0, 1, 2, …, p, j=1, 2, …, q) tham số mơ hình, p số nơron lớp đầu vào q số nơron lớp ẩn, sai số Hàm kích hoạt đƣợc sử dụng nơron lớp ẩn nhƣ hàm sigmoid [10]: g(x)= Do đó, mơ hình mạng nơron FFNN dự báo chuỗi thời gian mơ hình phi tuyến mơ tả mối quan hệ giá trị khứ (yt-1, yt-2, …, yt-p) giá trị tƣơng lai (yt) [10]: yt = f(yt-1, yt-2, …, yt-p, w) + với w vector chứa tất tham số mơ hình FFNN, f hàm số đƣợc xác định cấu trúc mạng tham số Việc chọn số nơron đầu vào p số nơron lớp ẩn q phụ thuộc vào tập liệu huấn luyện Mỗi tập liệu chuỗi thời gian huấn luyện với mô hình mạng nơron có p, q khác Chọn p, q để tìm đƣợc mơ hình dự báo chuỗi thời gian tốt phải qua thực nghiệm so sánh mơ hình Lê Hữu Vinh, Nguyễn Đình Thn 113 C Mơ hình CNN (Convolutional Neural Network) Mơ hình mạng nơron tích chập (CNN) mơ hình mạng nơron truyền thẳng (FFNN) Ngoài lớp đầu vào, lớp đầu ra, mạng nơron tích chập cịn có lớp đặc trƣng nhƣ lớp tích chập (convolutional), lớp lấy mẫu (pooling), lớp kết nối đầy đủ (fully connected) giống nhƣ lớp ẩn mạng FFNN Lớp đầu vào mô hình CNN ma trận có số chiều [rộng x cao x sâu] Tùy vào toán cụ thể, ma trận đầu vào bị giảm số chiều Với mạng CNN, ma trận đầu vào qua lớp tích chập thực phép tích chập (convolutional) với lọc (filters) để tạo ma trận có số chiều nhỏ ma trận đầu vào Ma trận vừa đƣợc tạo tiếp tục thực phép lấy mẫu (pooling) để giúp rút trích đặc trƣng quan trọng từ lớp đầu vào Ma trận kết phép lấy mẫu đƣợc làm phẳng (flatten) để làm đầu vào cho lớp kết nối đầy đủ thực nhƣ mạng nơron truyền thẳng đƣa kết dự báo Input layer Convolution layer Pooling layer Convolution layer Fully Connected layer Softmax layer 𝑥 class 𝑥 𝑥 𝑥 class 𝑛 Hình Kiến trúc mạng nơron tích chập thực nghiệm Sheng Chen [9] Mơ hình CNN đƣợc đề xuất với mục tiêu ban đầu nhằm phục vụ cho cơng việc xử lý, nhận dạng hình ảnh Thông thƣờng, đầu vào mạng CNN ma trận hai chiều ba chiều nhƣng áp dụng cho dự báo chuỗi thời gian mạng CNN phải xử lý liệu mảng chiều Tuy nhiên, với kết tốt mạng lại xử lý ảnh, số nghiên cứu thử nghiệm áp dụng mạng nơron tích chập dự báo chuỗi thời gian Chẳng hạn, nghiên cứu Sheng Chen [9], mơ hình CNN đƣợc áp dụng cho việc dự báo tăng giảm chứng khoán Mạng CNN đƣợc huấn luyện tập liệu chứng khoán với đầu vào gồm yếu tố đƣợc cho ảnh hƣởng đến tăng giảm giá chứng khoán giá mở cửa, giá đóng cửa, giá cao nhất, giá thấp khối lƣợng giao dịch ngày Với thực nghiệm mình, tác giả cho mơ hình CNN đáng tin cậy dự báo giá chứng khoán, phƣơng pháp đáng để thử nghiệm III MƠ HÌNH DỰ BÁO KẾT HỢP ARIMA VÀ MẠNG NƠRON Mơ hình ARIMA mơ hình mạng nơron đạt đƣợc thành công định dự báo chuỗi thời gian Tuy nhiên, mơ hình thƣờng phù hợp với số tập liệu định Mơ hình ARIMA phù hợp với dự báo liệu chuỗi thời gian dạng tuyến tính, cịn mơ hình mạng nơron lại phù hợp với dự báo liệu chuỗi thời gian dạng phi tuyến tính Do đó, mơ hình kết hợp ARIMA mạng nơron đƣợc đề xuất với kỳ vọng giúp tăng độ xác dự báo ứng dụng thực tế Ý tƣởng đƣợc G Peter Zhang giới thiệu nghiên cứu [10] Mơ hình kết hợp đƣợc tác giả thực nghiệm ba tập liệu Wolf‟s sunspot, Canadian lynx tỷ giá hối đoái British pound/US dollar Kết thực nghiệm cho thấy mơ hình kết hợp có độ lỗi dự báo đáng kể so với mơ hình ARIMA mạng nơron riêng lẻ Ý tƣởng mơ hình dựa việc xem xét liệu chuỗi thời gian kết hợp thành phần tuyến tính phi tuyến tính Hai thành phần đƣợc biểu diễn qua phƣơng trình: = với yt giá trị chuỗi thời gian, Lt thành phần tuyến tính, Nt thành phần phi tuyến tính Để dự báo giá trị chuỗi thời gian, mơ hình ARIMA đƣợc sử dụng để dự báo cho thành phần tuyến tính Những giá trị dự báo lỗi từ mơ hình ARIMA đƣợc dự báo mạng nơron Gọi et giá trị lại sau sử dụng mơ hình ARIMA để dự báo, et đƣợc xác định phƣơng trình: DỰ BÁO GIÁ BITCOIN BẰNG KẾT HỢP MƠ HÌNH ARIMA VÀ MẠNG NƠRON 114 ̂ = với ̂ giá trị dự báo cho thành phần tuyến tính thời điểm t Mơ hình mạng nơron đƣợc dùng để dự báo giá trị lại e t sau dự báo mơ hình ARIMA đƣợc mơ hình hóa hàm số: = , ,…, với f hàm phi tuyến đƣợc xác định mạng nơron, giá trị ngẫu nhiên thời điểm t Ký hiệu ̂ giá trị dự báo cho thành phần phi tuyến tính Kết giá trị dự báo thời điểm t ( ̂ đƣợc tính phƣơng trình: ̂ = ̂ ̂ Time Series Input Selection ARIMA on the input Time Series ANN on the residual generated by ARIMA model Predicted Values input Time Series Error Forecast input Time Series + Integrated Prediction input Time Series Performance Estimation Hình Mơ hình kết hợp ARIMA mạng nơron [12] Xuất phát từ ý tƣởng G Peter Zhang [10], nhiều nghiên cứu áp dụng mơ hình kết hợp d bỏo chui thi gian Durdu Oămer Faruk [11] xuất hƣớng tiếp cận kết hợp mơ hình ARIMA mạng nơron truyền thẳng để dự báo chất lƣợng nƣớc sông Büyük Menderes thuộc miền tây nam Thổ Nhĩ Kỳ tập liệu đƣợc thu thập từ năm 1996-2004 Kết thực nghiệm cho thấy mơ hình kết hợp cho kết dự báo tốt mô hình riêng lẻ Ngồi ra, nghiên cứu dự báo xu hƣớng giá chứng khoán, Nitin Merh [12] áp dụng mơ hình kết hợp ARIMA mạng nơron theo hai hƣớng tiếp cận Hƣớng tiếp cận thứ xây dựng mơ hình kết hợp ARIMA_ANN Mơ hình kết hợp giống với ý tƣởng G Peter Zhang [10] đề xuất, tức áp dụng mơ hình ARIMA để dự báo thành phần tuyến tính, sau sử dụng mơ hình mạng nơron dự báo lỗi mơ hình (thành phần phi tuyến) Hƣớng tiếp cận thứ hai xây dựng mơ hình kết hợp ANN_ARIMA Nitin Merh [12] thực kết hợp ngƣợc lại, xây dựng mơ hình mạng nơron cho dự báo sau áp dụng mơ hình ARIMA để dự báo lỗi mơ hình mạng nơron Kết thực nghiệm tập liệu chứng khoán nhƣ SENSEX, BSE IT, BSE Oil & Gas, BSE 100 and S& P CNX Nifty cho kết thú vị Hầu hết mô hình dự báo ANN_ARIMA có độ lỗi dự báo thấp mơ hình ARIMA_ANN IV THỰC NGHIỆM VÀ KẾT QUẢ A Tập liệu thực nghiệm Trong báo này, mơ hình dự báo chuỗi thời gian đƣợc cài đặt thực nghiệm tập liệu giá đóng cửa đồng Bitcoin đƣợc thu thập từ ngày 28/04/2013 đến ngày 7/11/2017 gồm 1655 ngày website cộng đồng Kaggle Dựa vào biểu đồ giá đóng cửa đồng Bitcoin hình 4, thấy giá đồng Bitcoin có biến động lớn, đặc biệt vào năm 2017 Tập liệu thực nghiệm đƣợc chia thành hai phần: 80% điểm thời gian đƣợc sử dụng để huấn luyện, 20% điểm thời gian lại đƣợc sử dụng cho thử nghiệm mơ hình Lê Hữu Vinh, Nguyễn Đình Thn 115 Hình Dữ liệu giá đóng cửa Bitcoin B Đánh giá mơ hình dự báo Để đánh giá chất lƣợng dự báo mơ hình, báo sử dụng độ đo lỗi RMSE (Root Mean Square Error) MAPE (Mean Absolute Percentage Error): RMSE = √ ∑ ̂ MAPE = ∑ với n số điểm thời gian thử nghiệm, | ̂ |*100 giá trị thực tế, ̂ giá trị dự báo từ mô hình C Mơ hình ARIMA cho dự báo giá Bitcoin Để tăng độ xác dự báo mơ hình ARIMA, chuỗi liệu thời gian đƣợc chuẩn hóa cách lấy logarit tự nhiên Dựa vào kiểm định Augmented Dickey Fuller (ADF), chuỗi liệu giá đóng cửa Bitcoin khơng phải chuỗi thời gian dừng Vì vậy, chuỗi liệu cần đƣợc biến đổi thành chuỗi thời gian dừng cách lấy sai phân bậc (d=1) Sai phân bậc đƣợc tính cơng thức: wt = với wt chuỗi thời gian sau lấy sai phân bậc 1, yt yt-1 giá trị chuỗi thời gian thời điểm t t-1 Sau kiểm định chuỗi thời gian wt chuỗi liệu giá đóng cửa Bitcoin dừng Sử dụng hàm ACF, PACF để xác định giá trị q, p thích hợp cho mơ hình Kết từ chuỗi liệu cho thấy q nhận giá trị 0, 4, 6, 11 p nhận giá trị 0, 4, 6, 11 Chúng ta cần tìm mơ hình ARIMA phù hợp để dự báo giá Bitcoin Các tiêu chuẩn AIC, BIC, HQIC đƣợc dùng để lựa chọn mơ hình phù hợp với tập liệu Mơ hình ARIMA có giá trị nhỏ đƣợc lựa chọn Bảng Các tiêu chuẩn kiểm định số mơ hình ARIMA Mơ hình AIC BIC ARIMA (6,1,0) -4604.38 -4562.88 ARIMA (0,1,6) -4601.13 -4559.63 ARIMA (11,1,0) -4540.98 -4608.42 Sau kiểm định mơ hình, mơ hình ARIMA (6,1,0) đƣợc chọn Bitcoin Mơ hình ARIMA (6,1,0) có dạng: yt = c + + + 3 + + HQIC -4588.82 -4585.58 -4583.14 làm mơ hình dự báo giá đóng cửa + + Các tham số c, , đƣợc ƣớc lƣợng dựa vào tập liệu huấn luyện Sau mơ hình đƣợc xây dựng, giá trị yt tƣơng lai đƣợc dự báo Giá trị dự báo giá trị thực tế có sai số, độ lỗi (phần dƣ) : = ̂ DỰ BÁO GIÁ BITCOIN BẰNG KẾT HỢP MƠ HÌNH ARIMA VÀ MẠNG NƠRON 116 Trong trƣờng hợp, độ lỗi số hạng sai số ngẫu nhiên mơ hình phù hợp với chuỗi liệu đƣợc dùng dự báo điểm thời gian tƣơng lai Nếu ngƣợc lại, mơ hình ARIMA khác đƣợc thử nghiệm đến tìm đƣợc mơ hình phù hợp với tập liệu D Mơ hình FFNN cho dự báo giá Bitcoin Chuỗi liệu giá Bitcoin đƣợc chuẩn hóa min-max để tăng độ xác dự báo hạn chế trƣờng hợp khớp liệu (overfitting) Việc chuẩn hóa min-max đƣợc áp dụng công thức: y’= với y‟ giá trị sau chuẩn hóa, y giá trị cần chuẩn hóa Để xây dựng mơ hình FFNN cho dự báo giá Bitcoin, việc cần xác định biến đầu vào biến đầu cho mơ hình Biến đầu vào giá trị liệu giá đóng cửa Bitcoin ngày trƣớc thời điểm dự báo Số lƣợng biến đầu vào đƣợc xác định dựa thực nghiệm để tìm giá trị phù hợp Biến đầu giá trị liệu giá Bitcoin đƣợc dự báo từ mô hình Việc xác định số lớp ẩn số nơron lớp ẩn Thông qua trình thực nghiệm để xác định đƣợc thơng số Với tốn dự báo giá Bitcoin, chúng tơi xây dựng mơ hình FFNN gồm có lớp: lớp đầu vào, lớp ẩn, lớp đầu Số biến lớp đầu vào (n) đƣợc thử nghiệm từ đến 30 (các điểm thời gian tháng trƣớc dự báo) Số nơron lớp ẩn đƣợc thử nghiệm từ đến 2n cho mơ hình FFNN Chúng tơi chọn số lần học q trình huấn luyện lần lƣợt 100, 200, 500, 1000 Các mô hình FFNN gồm lớp ẩn đƣợc thực nghiệm nhƣng kết không khả quan nhiều lớp ẩn dẫn đến tính tốn phức tạp xảy trƣờng hợp khớp liệu Sau kết thử nghiệm, mơ hình FFNN gồm 14 nơron lớp input (dựa vào giá Bitcoin 14 ngày trƣớc để dự báo giá ngày tiếp theo), 28 nơron lớp ẩn nơron lớp đầu đƣợc lựa chọn cho dự báo giá Bitcoin Bảng Độ lỗi dự báo số mơ hình FFNN Số nơron lớp đầu vào 14 21 30 14 21 Số nơron lớp ẩn thứ 12 14 28 42 60 24 42 Số nơron lớp ẩn thứ hai 14 30 Số nơron lớp đầu 1 1 1 1 RMSE MAPE (%) 291.72 541.09 221.27 147.20 213.94 161.97 785.24 286.85 488.41 6.69 10.15 6.37 3.41 7.08 3.68 23.01 8.19 14.29 E Mơ hình CNN cho dự báo giá Bitcoin Cũng giống nhƣ mơ hình FFNN, việc xác định số lƣợng biến đầu vào phải đƣợc xác định qua thực nghiệm Ngồi ra, mơ hình CNN cịn cần xác định số lớp tích chập (convolutional), số lớp lấy mẫu (pooling), số lớp kết nối đầy đủ (fully-connected) Trong dự báo chuỗi thời gian, lớp thƣờng đƣợc chọn với số lƣợng để hạn chế trƣờng hợp khớp liệu Trong thực nghiệm này, chúng tơi xây dựng mơ hình CNN cho dự báo giá Bitcoin với lớp tích chập gồm 64 lọc, hàm relu đƣợc sử dụng để phi tuyến tính giá trị đầu từ lớp tích chập, lớp lấy mẫu với ma trận lấy mẫu 2x1, thêm vào lớp kết nối đầy đủ Sau đó, lớp đầu có nơron để tính giá trị dự báo cho mơ hình Bảng Độ lỗi dự báo số mơ hình CNN Số nơron lớp đầu vào 3 7 Số lớp convolution 1 1 Số lớp pooling 1 1 Số nơron lớp fully connnected 30 50 70 100 Số nơron lớp đầu 1 1 RMSE MAPE (%) 276.99 252.89 262.47 378.71 4.22 4.09 4.20 6.48 F Mơ hình kết hợp ARIMA mạng nơron cho dự báo giá Bitcoin Mơ hình kết hợp ARIMA mạng nơron đƣợc thực nghiệm giống với mơ hình G Peter Zhang [10] đề xuất Với thực nghiệm kết hợp ARIMA-FFNN ARIMA-CNN, tập liệu huấn luyện đƣợc chia thành 10 khoảng liệu thời gian Trong đó, liệu thuộc khoảng thời gian đầu đƣợc dùng làm liệu huấn luyện cho mơ hình ARIMA Sau đó, liệu thuộc khoảng thời gian cịn lại đƣợc huấn luyện với mơ hình FFNN CNN để dự báo lỗi Lê Hữu Vinh, Nguyễn Đình Thn 117 cho mơ hình ARIMA vừa xây dựng Sử dụng mơ hình ARIMA huấn luyện để dự báo giá trị cho điểm thời gian tập liệu thử nghiệm Song song đó, mơ hình mạng nơron đƣợc sử dụng để dự báo lỗi cho mơ hình ARIMA tập liệu thử nghiệm Kết dự báo giá trị tổng hợp hai mơ hình Trong thực nghiệm với liệu giá Bitcoin, mơ hình ARIMA (6,1,0) tiếp tục đƣợc sử dụng cho dự báo Các mơ hình FFNN CNN đƣợc chạy thử nghiệm nhiều lần với tham số gồm số biến đầu vào, số lớp ẩn, số nơron lớp ẩn Kết thực nghiệm cho thấy mơ hình ARIMA (6,1,0) kết hợp với mơ hình FFNN-3-8-1 gồm biến đầu vào, nơron lớp ẩn nơron đầu cho độ lỗi dự báo thấp dựa độ đo RMSE MAPE Mơ hình kết hợp ARIMA-CNN tốt cho dự báo Bitcoin gồm mơ hình ARIMA (6,1,0) mơ hình CNN-4-1-1-6-1 với nơron lớp đầu vào, lớp tích chập gồm 64 lọc, lớp lấy mẫu với ma trận lấy mẫu 2x1, thêm vào lớp kết nối đầy đủ với nơron nơron lớp đầu Bảng Độ lỗi dự báo số mơ hình kết hợp ARIMA FFNN Mơ hình kết hợp FFNN-1-2-1 FFNN-2-4-1 ARIMA (6, 1, 0) FFNN-2-3-1 FFNN-3-8-1 FFNN-3-7-1 RMSE 128.54 128.37 130.26 126.66 131.24 MAPE (%) 2.94 3.01 2.98 2.94 2.97 Bảng Độ lỗi dự báo số mơ hình kết hợp ARIMA CNN Mơ hình kết hợp CNN-3-1-1-10-1 CNN-3-1-1-8-1 ARIMA (6, 1, 0) CNN-4-1-1-6-1 CNN-5-1-1-7-1 RMSE 130.96 130.66 128.30 135.85 MAPE (%) 3.06 3.08 2.94 3.19 G Kết thực nghiệm mơ hình dự báo giá Bitcoin Kết thực nghiệm mơ hình dự báo giá đóng cửa (USD) Bitcoin đƣợc trình bày bảng Bảng Bảng so sánh độ lỗi dự báo mơ hình Mơ hình RMSE MAPE (%) ARIMA 131.49 3.03 FFNN 147.20 3.41 CNN 252.89 4.09 ARIMA-FFNN 126.66 2.94 ARIMA-CNN 128.30 2.94 Kết thực nghiệm cho thấy mơ hình kết hợp ARIMA-FFNN cho kết dự báo tốt mơ hình khác dựa vào độ đo RMSE MAPE Ngồi ra, mơ hình ARIMA cho thấy kết dự báo tốt tập liệu Bitcoin Trong đó, mơ hình mạng nơron FFNN CNN tỏ không thật tốt để dự báo giá Bitcoin V KẾT LUẬN VÀ HƢỚNG NGHIÊN CỨU TRONG TƢƠNG LAI Dự báo chuỗi thời gian toán khó nhƣng quan trọng lĩnh vực kinh tế tài Gần đây, dự báo Bitcoin nhận đƣợc nhiều quan tâm nhà nghiên cứu kinh tế khoa học máy tính Với đặc trƣng mình, giá Bitcoin biến động thƣờng xuyên dẫn đến việc dự báo gặp nhiều khó khăn Bài báo thực nghiệm mơ hình dự báo ARIMA, FFNN, CNN, ARIMA-FFNN, ARIMA-CNN để dự báo giá đóng cửa Bitcoin ngày Kết thực nghiệm cho thấy, mơ hình kết hợp ARIMA mạng nơron có độ lỗi dự báo thấp mơ hình riêng lẻ, chứng tỏ mơ hình kết hợp cho dự báo tốt Trong đó, mơ hình kết hợp ARIMAFFNN cho độ lỗi dự báo thấp với độ đo RMSE MAPE Nhìn chung, với chuỗi liệu biến động lớn nhƣ giá Bitcoin, mô hình ARIMA mạng nơron cịn gặp nhiều khó khăn dự báo tập liệu Trong tƣơng lai, mơ hình Deep Learning đƣợc nghiên cứu thử nghiệm liệu giá Bitcoin với kỳ vọng mang lại kết dự báo tốt TÀI LIỆU THAM KHẢO [1] Satoshi Nakamoto, “Bitcoin: A Peer-to-Peer Electronic Cash System”, 2008 [2] Devavrat Shah, Kang Zhang, “Bayesian regression and Bitcoin”, arXiv preprint arXiv:1410.1231, 2014 [3] Siddhi Velankar, Sakshi Valecha, Shreya Maji, “Bitcoin price prediction using machine learning”, In Proceedings of the 2018 20th International Conference on Advanced Communication Technology (ICACT), Chuncheon-si, Korea, pp 144–147, 2018 118 DỰ BÁO GIÁ BITCOIN BẰNG KẾT HỢP MƠ HÌNH ARIMA VÀ MẠNG NƠRON [4] João Almeida, Shravan Tata, Andreas Moser, Vikko Smit, “Bitcoin prediction using ANN”, 2015 [5] Huisu Jang, Jaewook Lee, “An empirical study on modeling and prediction of Bitcoin prices with bayesian neural networks based on blockchain information”, IEEE Access, vol 6, pp 5427–5437, 2018 [6] Bogdan Oancea, ŞTefan Cristian Ciucu, “Time series forecasting using neural networks”, In Proceedings of the “Challenges of the Knowledge Society” Conference, eprint arXiv:1401.1333, pp 1402–1408, 2014 [7] M Raeesi, M S Mesgari, P Mahmoudi, “Traffic Time Series Forecasting by Feedforward Neural Network: a Case Study Based on Traffic Data of Monroe”, The International Archives of Photogrammetry, Remote Sensing and Spatial Information Sciences, 40(2), 219, 2014 [8] Kumar Abhishek, Anshul Khairwa, Tej Pratap, Surya Prkash, “A stock market prediction model using Artificial Neural Network”, Computing Communication & Networking Technologies (ICCCNT), 2012 [9] Sheng Chen, Hongxiang He, “Stock Prediction Using Convolutional Neural Network”, IOP Conference Series Materials Science and Engineering, 2018 [10] G Peter Zhang, “Times series forecasting using a hybrid ARIMA and neural network model”, Neurocomputing, vol 50, pp 159-75, 2003 [11] Durdu Oă mer Faruk, “A hybrid neural network and ARIMA model for water quality time series prediction”, Engineering Applications of Artificial Intelligence, 23(4), 586-594, 2010 [12] Nitin Merh, Vinod P Saxena, Kamal Raj Pardasani, “A comparison between hybrid approaches of ANN and ARIMA for Indian stock trend forecasting”, Journal of Business Intelligence, vol 3, no 2, pp 23-43, 2010 FORECASTING BITCOIN PRICE BY COMBINING ARIMA MODEL AND ARTIFICIAL NEURAL NETWORK Le Huu Vinh, Nguyen Dinh Thuan ABSTRACT: In the recent years, Bitcoin has emerged as the most widely used cryptocurrency in the world Bitcoin can be used for online payment or simply a profitable investment channel Bitcoin is not dependent on events in business or by intervening governments Bitcoin prices change frequently so the forecasting problem is challenging In this paper, we experiment several models such as ARIMA, neural network, hybrid ARIMA and neural network to predict the closing price (USD) of the Bitcoin in the next day The closing price data of Bitcoin is collected from April 28, 2013 to November 7, 2017, including 1655 days on the Kaggle community website The forecasted results of the models will be compared to consider which model is more suitable for forecasting Bitcoin prices ... mơ hình ARIMA để dự báo, et đƣợc xác định phƣơng trình: DỰ BÁO GIÁ BITCOIN BẰNG KẾT HỢP MƠ HÌNH ARIMA VÀ MẠNG NƠRON 114 ̂ = với ̂ giá trị dự báo cho thành phần tuyến tính thời điểm t Mơ hình mạng. .. F Mơ hình kết hợp ARIMA mạng nơron cho dự báo giá Bitcoin Mơ hình kết hợp ARIMA mạng nơron đƣợc thực nghiệm giống với mơ hình G Peter Zhang [10] đề xuất Với thực nghiệm kết hợp ARIMA- FFNN ARIMA- CNN,... nghiệm mơ hình dự báo ARIMA, FFNN, CNN, ARIMA- FFNN, ARIMA- CNN để dự báo giá đóng cửa Bitcoin ngày Kết thực nghiệm cho thấy, mơ hình kết hợp ARIMA mạng nơron có độ lỗi dự báo thấp mơ hình riêng

Ngày đăng: 30/09/2021, 15:31

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan