Dự đoán giá

Một phần của tài liệu Ứng dụng khai phá dữ liệu vào dự báo giá mặt hàng trên sang giao dịch (Trang 56 - 64)

Sau khi kết thúc huấn luyện, chúng ta kiểm tra khả năng của mạng trên bộ dữ liệu kiểm tra. Thực hiện nhập từ ngày kiểm tra tới ngày kết thúc kiểm tra trên “tab Predic”, sau đó nhấn nút “Predic” để ứng dụng thực hiện dự báo trên dữ liệu kiểm tra.

Hình 4.13: Giao diện ứng dụng kiểm tra dự đoán

Kết quả dự đoán đƣợc hiển thị trong grid với các cột ngày, giá trị thực tế, giá trị dự đoán và sai số tuyệt đối tƣơng ứng. Úng dụng cung cấp chức năng dự đoán từ một mạng đã học bằng cách đọc file mạng đã kết xuất trong tab Predic. Ngoài ra ứng dụng hỗ trợ kết xuất giá trị dự đoán của mạng ra file định dạnh csv. Để thực hiện kế xuất giá trị dự đoán, thực hiện nhấn nút “Export results” trên “tab Predic”. Khi nhấn nút “Predic” ứng dụng cũng hiển thị biểu đồ so sánh kết quả thực và kết quả dự đoán bên “tab Graph”. Biểu đồ thể hiện hai đƣờng màu đỏ là giá trị thực tế, đƣờng màu xanh là giá trị tính toán của mạng.

55

Hình 4.14: Giao diện tab Graph

Kết luận

Trong chƣơng này tác giả đã giới thiệu khái quát về thƣ viện "encog-dotnet- core" giúp hỗ trợ cài đặt mạng nơ ron. Tác giả nêu chi tiết các biến số sử dụng cho bài toán dự báo. Tiến hành thu thập dữ liệu từ nguồn, trình bày dữ liệu mẫu đƣợc sử dụng trong bài toán. Tác giả đã tiến hành thực nghiệm, tìm ra mô hình mạng đúng đắn. Tiến hành thực nghiệm, kiểm tra, đánh giá để tìm ra các thông số cần thiết cho mạng, tiến hành xây dựng ứng dụng mạng dự đoán giá trên sàn giao dịch, ứng dụng thể hiện rõ nét các bƣớc, thu thập dữ liệu, huân luyện, kiểm tra, hỗ trợ kết xuất dữ liệu, vẽ biểu đồ, phân tích lỗi trong quá trình học. Tác giả đã tiến hành đánh giá mô hình mạng thông qua mô hình mạng thông thƣờng. đánh giá kết quả dự báo trên mã giao dịch tiêu biểu. thông qua đó kết minh chứng cho khả năng của mạng trong dự báo giá một mặt hàng trên sàn giao dịch

56

KẾT LUẬN

Luận văn đã tập trung vào bài toán dự báo giá một mặt hàng trên sàn giao dịch hàng hóa tƣơng lai. Ứng dụng mạng nơ ron nhân tạo vào bài toán khai phá dữ liệu lịch sử. Ứng dụng dự đoán giá đóng cửa của một hàng hóa tƣơng lai trên sàn giao dịch. Bài toán dự báo giá trên sàn giao dịch có những đặc điểm riêng trên bộ dữ liệu lịch sử. Thông qua phân tích dữ liệu lịch sử tác giả đã đề xuất giải pháp, xây dựng mô hình mạng nơ ron phù hợp cho bài toán dự báo giá trên sàn giao dịch. Qua đó đƣa ra dự báo giá đóng cửa của hàng hóa trong ngày giao dịch tiếp theo.

Luận văn đã có những đóng góp sau:

1. Hệ thống lại nội dung về mạng nơ ron ảo, khái quát về giao dịch hàng hóa tƣơng lai, phân tích kỹ thuật trên giá lịch sử của hàng hóa.

2. Phân tích dữ liệu giá từ đó đề xuất mô hình nơ ron phù hợp cho bài toán dự đoán giá trên sàn giao dịch hàng hóa tƣơng lai.

3. Xây dựng ứng dụng dự báo giá hàng hóa trên sàn giao dịch.

4. Kết quả đự đoán đã cung cấp cho các nhà đầu tƣ trên sàn giao dịch một hƣớng nhìn mới, cách phân tích mới về thị trƣờng, phản ánh đúng đắn các tác động của thị trƣờng lên giá của một mặt hàng.

5. Kết quả của luận văn là bƣớc đầu trong việc xây dựng hệ thống áp dụng kỹ thuật học “deep learning” trong mạng nơ ron.

Hƣớng phát triển tiếp theo:

Kết quả dự báo của mô hình mạng nơ ron đã khẳng định mô hình và hƣớng tiếp cận dự báo là đúng đắn, tuy nhiên kết quả dự báo vẫn chƣa đƣợc chính xác cao nhất. Vì vậy, cần đƣợc nâng cao độ chính xác của bài toán để tiến gần tới kết quả thực nhất. Hai là dự báo giá mới dừng lại ở bƣớc dự báo giá close của ngày hôm sau. Mở rộng bài toán dự báo theo hƣớng xa hơn nhƣ một tuần, một tháng, 2 giờ tới trong ngày…

Một kỹ thuật mới đang đƣợc nghiên cứu, phát triển mạnh gần đây trong ứng dụng mạng nơ ron là áp dụng kỹ thuật “Deep learning”[21]. Bằng việc kết hợp nhiều lớp mạng nơ ron trong các bài toán chi tiết, để cuối cùng thu đƣợc một mô hình mạng nơ ron tổng quan trong bài toán.

Nghiên cứu các giải pháp mới để áp dụng trong bài toán dự báo giá trên sàn giao dịch nhằm mục đích khai phá đƣợc nhiều thông tin từ dữ liệu lịch sử nói riêng và dữ liệu giao dịch nói chung, theo đó nâng cao kết quả dự đoán trên từng hàng hóa.

57

TÀI LIỆU THAM KHẢO Tiếng Việt

1. Các Dealer, Công ty Môi Giới Hàng Hóa Tƣơng Lai Finex.

Tiếng Anh

2. T. Masters(1993), Practical Nearal Network Recipes in C++, Academic Press, New York,.

3. J.O Katz (1992), Developing neural network forecasters for trading, Technical Analysis of Stock and Commodities pp.58-70.

4. D. Baily and D.M. Thompson (1990), Developing neural network application, AI Expect, pp. 33-41.

5.Simon Haykin, A Comprehensive Foundation. McMaster Universtry, Hamilton, Ontario, Canada.

6. Rojas, R. (1996). Neural Networks: A Systematic Introduction, Springer, Berlin 7. John E.Hanke & Deam W.Wichem, (2005), Busuness Forecasting, 8th Edition, Chapter 9.

8. Hagan M. T., Demuth H. B., Beale M.(1996), Neural networks design, PWS Publishing Company, Boston, Ma.

9. Haykin, S. (1994), Neural networks, a comprehensive foundation, Macmillan New York,

10. Rune Aamodt (2010), Using Artificial Neural Networks To Forecast Financial Time Series, Master of Science in Computer Science, Norwegian University of Science and Technology. Charpter 2,3,4.

11. Hagan, Demuth. Beale, De jesus, Neural Network Design (2nd edition), Charpter 2,3.

12. Assia Lasfer (2013), Performance analysis of artificial nearal network in forecasting financial time series. A Thesis Presented to the Faculty of the American University.

13. Iebeling Kaastra and Milton Boyd (1996), Designing a neural network for forecasting financial and economic time series, Neurocomputing, vol. 10, no. 3, pp. 215-236.

14. Jakulin, A. (2003), Attribute interactions in machine learning. Master‟s thesis, University of Ljubljana, Faculty of Computer and Information Science.

58 15. Xianjun Ni (2008), Research of Data Mining Based on Neural Networks, World Academy of Science, Engineering and Technology, Charpter III.

16. Nelson, M.C. and Illingworth, W.T. (1991), A Practical Guide to Neural Nets, Reading, MA: Addison-Wesley.

17. Adhikari R., and R. K. Agrawal. (2013). A Combination of Artificial Neural Network and Random Walk Models for Financial Time Series Forecasting. Neural Computing and Applications

18. Aghababaeyan R., and N. TamannaSiddiqui (2011). Forecasting the Tehran Stock Market by Artificial Neural Network. International Journal of Advanced Computer Science and Applications, Special Issue on Artificial Intelligence

19. Butler M., and A. Daniyal. (2009). Multi-objective Optimization with an Evolutionary Artificial Neural Network for Financial Forecasting, Proceedings of the 11th Annual conference on Genetic and evolutionary computation pp. 1451- 1457

20. Cerna L., and M. Chytry. (2005). Supervised Classification of Plant Communities with Artificial Neural Networks, Journal of Vegetation Science 16 pp. 407-414

21. Li Deng and Dong Yu (2013), DeepLearning Methods and Applications, Foundations and Trends® in Signal Processing Vol. 7.

59

PHỤ LỤC

1. Một số mã hàng hóa giao dịch trên sàn

Mã Giao dịch Tên hàng hóa

KC Café CT Cotton SB Đƣờng CC Ca cao OJ Quả cam LS Gỗ

2. Ký hiệu tháng đáo hạn của hàng hóa.

Ký hiệu Tháng đáo hạn F 1 G 2 H 3 J 4 K 5 M 6 N 7 Q 8 U 9 V 10 X 11 Z 12

60

3. Cấu trúc ký hiệu của một mã giao dịch trên sàn.

Các giao dịch hàng hóa trên sàn đƣợc đánh số theo cấu trúc sau: <Mã giao dịch><Tháng đáo hạn><năm>

Ví dụ: Mã giao dịch đƣợc sét tới trong luân văn là KCZ13. Đây là giao dịch hàng hóa café, đáo hạn vào tháng 12 năm 2013.

4. Giới thiệu công cụ “DataCollector” thu thập dữ liệu từ nguồn

[www.barchart.com]

4.1.Sơ đồ xửlý thu thập dữ liệu.

Hình 1: Sơ đồ xử lý thu thập dữ liệu

Dữ liệu OHLC và dữ liệu value nằm trên hai biểu đồ khác nhau nên việc lọc dữ liệu đƣợc tách làm hai tiến trình xử lý khác nhau. Đầu vào cửa sơ đồ là trang nguồn có chứa biểu đồ lịch sử của mã giao dịch. Đầu ra là file dữ liệu OHLCV.csv.

4.2.Thực hiện thu thập dữ liệu

Thực hiện nhập địa chỉ URL nguồn vào công cụ. Nhƣ hình 2 là giao diện công cụ thu thập dữ liệu “Data Collector”. Mã giao dịch thực hiện thu thập là mã KCZ11. Địa chỉ URL của mã là http://www.barchart.com/charts/futures/KCZ11. Thực hiện thu thập dữ liệu qua các bƣớc sau.

Bƣớc 1: Tải dữ liệu từ nguồn.

Nhấn nút “LoadPage” để thực hiện tải trang về. Dữ liệu thu đƣợc dƣới dạng mã HTML. Sau khi kết thúc quá trình tải trang có thông báo “Tải trang web thành công” nhƣ hình 2.

Tải dữ liệu

Lọc OHLC

• Tách vùng dữ liệu OHLC • Thu dữ liệu OHLC

Lọc Volume

• Tách vùng dữ liệu Volume

• Thu dữ liệu Volume

Kết xuất kết quả ra file csv

61

Hình 2: Giao diện công cụ thu thập dữ liệu

Hình 3: Trang dữ liệu nguồn mã giao dich KCZ11

Bƣớc 2: Tách vùng dữ liệu OHLC.

Do dữ liệu tải về có chƣa các nội dung khác trên trang nên chúng ta cần tách dữ liệu, chỉ lấy dữ liệu vùng OHLC. Chúng ta sử dụng cấu trúc regex để tách đƣợc dữ liệu OHLC nhƣ Hình 4. Thực hiện nhấn nút “Regex O” để tác vùng dữ liệu. Sau khi tách thành công có thông báo “Loc thông tin OHLC thành công”. Dữ liệu thu đƣợc có dạng “'A', '[Mon. Dec 19, 2011]', 'KCZ11', '215.3000000', '215.3000000', '215.3000000', '215.3000000'”. „A‟ ký tự bắt đầu, tiếp theo là ngày giao dịch, tiếp theo là mã giao dịch, tiếp theo là các giá trị theo thứ tự OHLC.

Hình 4: Lọc vùng dữ liệu OHLC

Bƣớc 3: Thu dữ liệu OHLC.

Thực hiện nhấn nút “GetDataOHLC” để thu dữ liệu OHLC. Sau khi kết thúc thu dữ liệu, sẽ có thông báo “Lấy thông tin OHLC thành công”.

62

Bƣớc 4: Tách vùng dữ liệu Volumn.

Thực hiện nhấn nút “Regex V” để tách vùng dữ liệu Volume. Kết quả thu đƣợc nhƣ hình 5. Ứng dụng thông báo “Lấy thông tin Volume thành công”. Dữ liệu thu đƣợc có dạng “'A', '[Mon. Dec 19, 2011]', 'Volume', '8.0000000'”. Bắt đầu là ký tự đánh dấu A bắt đầu một bản ghi, tiếp theo là ngày giao dịch, tiếp theo là Volume, sau cùng là giá trị của Volume.

Hình 5: Tách vùng dữ liệu Volume

Bƣớc 4: Thu dữ liệu Volume.

Thực hiện nhấn nút “GetDataVolum” để thu dữ liệu về. Sau khi thu dữ liệu Volume thành công ứng dụng có thông báo lại “lấy thông tin Volum thành công”.

Bƣớc 5: Kết xuất kết quả ra file csv.

Thực hiện nhấn nút “save” để kết xuất kết quả thu đƣợc ra file csv. Sau khi lƣu thành công file vào ổ cứng nơi chứa file chạy ứng dụng có thông báo “Lƣu dữ liệu thành công”. Mở file csv ta có dữ liệu thu đƣợc dƣới dạng bảng sau.

Date Open High Low Close Volume

12/19/2011 215.3 215.3 215.3 215.3 8 12/16/2011 213.4 214.25 210.95 210.95 11 12/15/2011 215 215 213.75 213.75 1 12/14/2011 219.25 219.25 213.5 215.1 8 12/13/2011 221 221 218.65 218.65 29 12/12/2011 224 224 218 218.5 53 12/9/2011 225.5 226 224.65 224.65 14 12/8/2011 226.4 227.35 225.4 225.7 10 12/7/2011 231.7 231.7 226.75 226.75 23 12/6/2011 232.25 233.7 230.1 232.85 28 12/5/2011 229.4 235.2 228.5 233.95 28 12/2/2011 234 234 223.9 227.15 10 12/1/2011 233.2 235.7 231.55 233.2 78

Một phần của tài liệu Ứng dụng khai phá dữ liệu vào dự báo giá mặt hàng trên sang giao dịch (Trang 56 - 64)

Tải bản đầy đủ (PDF)

(64 trang)