Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 46 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
46
Dung lượng
7,29 MB
Nội dung
Đ IẠH C Ọ QUỐỐC GIA TP HỐỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CỐNG NGHỆ THỐNG TIN KHOA H ỆTHỐỐNG THỐNG TIN ĐỐỒ ÁN CUỐỐI KỲ ĐIỆN TOÁN ĐÁM MÂY ĐỀỒ TÀI DỰ BÁO GIÁ BITCOIN BẰỒNG THƯ VIỆN TENSORFLOW TRỀN GOOGLE COLAB Gi ảng viên h ướng dẫẫn: Hà Lê Hồi Trung Sinh viên thực hiện: Ngơ Bảo Thiên 19522260 Nguyêễn Thị Ngọc Thoại 19522297 Nguyêễn Thị Myễ Thanh 19522240 LỜI CẢM ƠN Chúng em xin chân thành cảm ơn Khoa Hệ thống thông tin, trường đại học Công nghệ Thông tin tạo điều kiện thuận lợi cho chúng em học tập thực đồ án tốt mơn Chúng em xin bày tỏ lịng biết ơn sâu sắc tới thầy Hà Lê Hoài Trung tận tình hướng dẫn bảo chúng em trình thực đề tài Chúng em xin chân thành cảm ơn q thầy khoa tận tình giảng dạy, trang bị cho em kiến thức quý báu kỳ vừa qua Chúng xin cảm ơn thành viên nhóm nỗ lực trình thực đồ án Mặc dù cố gắng hoàn thành đồ án phạm vi khả cho phép chắn không tránh khỏi thiếu sót Chúng em mong nhận thơng cảm, góp ý tận tình bảo quý thầy cô bạn NHẬN XÉT CỦA GIẢNG VIÊN ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ………………………………………………… Table of Contents I TỔNG QUAN ĐỀ TÀI Đặt Vấn Đề Mơ tả tốn .5 Mục tiêu Tổng quan liệu II CƠ SỞ LÝ THUYẾT Tensorflow 1.1 Khái niệm Tensorflow 1.2 Nguyên lý hoạt động 1.3 Ưu điểm Google Colab 2.1 Google Colab gì? 2.2 Tại nên sử dụng Google Colab III Các thuật toán ứng dụng 4.1 Naïve forecast .9 4.2 Dense layer 10 4.3 LSTM 10 4.4 Turkey Problem - Why forecasting is BullShit 11 PHÂN TÍCH HIỆN THỰC HĨA BÀI TỐN .12 Import liệu 12 Tạo tập train & test 15 Thí nghiệm mơ hình hóa 19 3.1 Module 0: Naïve forecast (baseline) 20 3.2 TensorFlow deep learning 24 3.3 Mơ hình 1: Dense model (window = 7, horizon = 1) 27 3.4 Mơ hình 2: RNN(LSTM) 31 3.5 Mơ hình 3: Turkey model (the turkey problem �) 34 So sánh mơ hình: 40 IV V ĐÁNH GIÁ MƠ HÌNH 41 TÀI LIỆU THAM KHẢO 42 I TỔNG QUAN ĐỀ TÀI Đặt Vấn Đề Sự bùng nổ Internet tảng cho phát triển loại tiền điện tử, tạo đa dạng cho nhà đầu tư tiền ảo Một loại tiền ảo dẫn đầu xu hướng Bitcoin – loại tiền ảo không xa lạ với nhà đầu tư năm trở lại Trước lợi nhuận khổng lồ thu từ việc đầu tư vào Bitcoin đòi hỏi nhiều nhà đầu tư phải quan tâm tra cứu kỹ rủi ro hiểu rõ vận hành Qua thuật tốn nhóm dự đốn giá bitcoin tương lai gần dựa theo phát triển lịch sử trước Mơ tả toán Sử dụng phương pháp machine learning với hỗ trợ thư viện Tensorflow đưa dự đoán tin cậy giá Bitcoin, làm tiền đề cho việc lựa chọn đầu tư Mục tiêu Import liệu giao dịch Bitcoin theo chuỗi thời gian Định dạng liệu Tạo tập Train & Test Biến đổi liệu thành supervised learning Thử nghiệm thuật tốn Đánh giá mơ hình Tổng quan liệu Dữ liệu lấy từ trang Price Bitcoin Coindesk (https://www.coindesk.com) Dữ liệu lấy từ ngày tháng 10 năm 2013 đến 18 tháng năm 2021 với 2787 dịng liệu thuộc tính Tên thuộc tính Date Currency Mơ tả Ngày giao dịch Lưu hành tiền tệ Ý nghĩa Ngày diễn giao dịch Loại tiền tệ lưu Closing Price Giá đóng cửa 24h Open Giá mở cửa ngày 24h High Giá cao ngày Giá thấp ngày 24h Low II hành Giá thị trường Bitcoin vào thời điểm kết thúc phiên giao dịch ngày Giá thị trường Bitcoin vào thời điểm thực lần giao dịch ngày Giá Bitcoin tăng cao ngày Giá Bitcoin giảm thấp giày CƠ SỞ LÝ THUYẾT Tensorflow 1.1 Khái niệm Tensorflow Tensorflow thư viện mã nguồn mở phục vụ cho hoạt động Machine Learning Nó xây dựng Google, yên tâm độ ổn định sử dụng 1.2 Nguyên lý hoạt động Về Tensorflow giúp người dùng tạo biểu đồ luồng liệu cấu trúc mô tả Đây lý Tensorflow coi framework Những khung sườn hướng dẫn liệu làm cách để qua biểu đồ series nodes xử lý Lúc này, nodes đại diện cho hoạt động tốn học cần xử lý Cịn kết nối edge coi tensor mảng liệu đa chiều Tensorflow vốn phát triển từ Python Vì thân Tensorflow ứng dụng Python Còn nodes tensor Tensorflow đối tượng thuộc Python Điều giúp ích nhiều cho lập trình viên Python vốn hệ thống dễ sử dụng, cho phép đối tượng trừu tượng bậc cao dễ dàng kết hợp với Chính nhờ giúp đỡ đắc lực này, trình phát triển phần mềm đơn giản hóa nhiều 1.3 Ưu điểm Thể góc nhìn tổng quan: khả phân tích abstraction cách tổng quan Dễ dàng chỉnh sửa định hướng – Tensorflow gì: Tensorflow trang bị tính Eager execution Nếu người dùng chưa cảm thấy hài lòng cách thức thực kết mà Tensorflow mang đến, họ trực tiếp chỉnh sửa operation biểu đồ hướng xử lý liệu Dựa tảng mạnh mẽ – Google Google Colab 2.1 Google Colab gì? Colaboratory hay cịn gọi Google Colab, sản phẩm từ Google Research, cho phép thực thi Python tảng đám mây, đặc biệt phù hợp với Data analysis, machine learning giáo dục Colab không cần yêu cầu cài đặt hay cấu hình máy tính, thứ chạy thơng qua trình duyệt, bạn sử dụng tài ngun máy tính từ CPU tốc độ cao GPUs TPUs cung cấp cho bạn Sử dụng Google Colab có lợi ích ưu việt như: sẵn sàng chạy Python thiết bị có kết nối Internet mà không cần cài đặt, chia sẻ làm việc nhóm dễ dàng, sử dụng miễn phí GPU cho dự án AI 2.2 Tại nên sử dụng Google Colab Các thư viện cài đặt sẵn Được lưu đám mây Sự hợp tác: cung cấp khả cộng tác với ứng dụng Google Sử dụng GPU TPU miễn phí Sự tổng quát: Google Colab phiên chuyên dụng Jupyter Notebook Các thuật tốn ứng dụng 4.1 Nạve forecast tf.random.set_seed(42) sử dụng cho tất mơ hình để giữ liệu suất Bước 19: Đánh giá mô hình liệu thử nghiệm => val_loss(dữ liệu hao hụt) tương tự val_loss epoch 100 Bước 20: Tiếp theo ta thử nghiệm với mơ hình lưu model_experiments => ta thấy sử dụng liệu ban đầu đem lại hiệu suất tốt Bước 21: Tiếp theo, để chạy thử nghiệm nhiều mơ hình ta tạo hàm dự đốn mơ hình: Sử dụng mơ hình Lấy liệu Train Dự đoán input_data Trả dự đoán Bước 22: có số giá trị dự đốn, sử dụng evaluate_preds() mà tạo trước để so sánh chúng => naïve model số lỗi số mase tốt mơ hình Điều cho thấy baseline đóng vai trị quan trọng dự án machine learning Bước 23: Ta vẽ biểu đồ cho mơ hình để hình dung rõ => Tập test dự đoán tốt sát với mơ hình 3.4 Mơ hình 2: RNN(LSTM) Bước 24: Sửa chức đánh giá để hoạt động với horizon lớn Bước 25: Định hình liệu tất train window sử dụng tf.keras.layers.Lamdba để đảm bảo mơ hình hoạt động tốt Bước 26: Tạo RNN hỗ trợ LSTM-cell để lập mơ hình liệu Bitcoin Tạo lớp tf.keras.layers.LSTM() có tensor với kích thước [batch, timesteps, feature] Sử dụng lớp tf.keras.layers.Lambda() để điều chỉnh hình dạng tensor đầu vào thành layer LSTM Bước 27: Sử dụng liệu thử nghiệm ban đầu đánh giá phiên tốt mơ hình Bước 28: Đánh giá mơ hình 3.5 Mơ hình 3: Turkey model (the turkey problem �) Turkey problem tương tự liệu quan sát bạn (dữ liệu lịch sử bạn) không nắm bắt kiện tương lai bất ngờ không nằm dự báo dẫn bạn đến thất bại Bước 29: Để làm vậy, tạo điểm liệu khó xảy giá lịch sử Bitcoin, giá giảm 100 lần ngày => giá trị cuối thấp 100 lần so với giá trị thực tế (hãy nhớ rằng, điểm liệu thực sự, để minh họa ảnh hưởng turkey problem) Bước 30: Bây có giá Bitcoin bao gồm điểm liệu turkey problem, lấy bước thời gian => thay đổi điểm liệu toàn tập liệu Nhưng kết giá Bitcoin xấu nhiều Bước 31: Trước xây dựng mơ hình, tạo số liệu có cửa sổ với liệu turkey Bước 32: Xây dựng mơ hình turkey (mơ hình dự đốn liệu turkey problem) Với liệu cập nhật chúng tôi, thay đổi giá trị Để giữ cho thứ so sánh với mơ hình trước đó, chúng tơi tạo turkey_model model_1(cùng kiến trúc, liệu khác nhau) Bằng cách đó, chúng tơi đánh giá turkey_model chúng tơi so sánh kết với model_1_results xem điểm liệu ảnh hưởng đến hiệu suất mơ hình đến mức Bước 33: Tải liệu tốt đánh giá liệu thử nghiệm => Chỉ cách thay đổi giá trị, MAE turkey_model tăng gần gấp 30 lần so với model_1 =>Ta thấy mơ hình khơng thể dự đốn turkey problem việc giá giảm 100 lần xảy =>Tuy nhiên kiện xảy bất ngờ tác động lớn đến hiệu suất dự đoán, dẫn đến hậu xấu So sánh mơ hình: Phần lớn mơ hình deep learning hoạt động ngang tốt chút so với naïve model Và mơ hình turkey, việc thay đổi điểm liệu phá hủy hiệu suất dự đoán Chỉ loại mơ hình hoạt động tốt khơng có nghĩa hoạt động tốt nơi khác Khi bạn dự đốn thị Bitcoin có ý định đầu tư vào đừng phụ thuộc vào kết dự đoán đạt Hãy dự trù trường hợp tiêu cực để có cách khắc phục tránh thua lỗ IV ĐÁNH GIÁ MƠ HÌNH V TÀI LIỆU THAM KHẢO https://teky.edu.vn/blog/tensorflow-la-gi/#Khai_niem_Tensorflow_la_gi https://filegi.com/tech-term/long-short-term-memory-lstm-10322/ https://200lab.io/blog/google-colab-la-gi/ https://colah.github.io/posts/2015-08-Understanding-LSTMs/ https://www.youtube.com/watch?v=hRwimmE2wEk https://en.wikipedia.org/wiki/The_Black_Swan:_The_Impact_of_the_High ly_Improbable#Reception https://www.linkedin.com/pulse/3-reasons-why-projections-bullshit-alanburak https://analyticsindiamag.com/a-complete-understanding-of-dense-layersin-neural-networks/