1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu bài toán chuỗi thời gian và cài đặt

50 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 50
Dung lượng 1,8 MB

Nội dung

Bài toán chuỗi thời gian (time series) là một lĩnh vực trong phân tích dữ liệu, nghiên cứu về việc phân tích và dự đoán các dữ liệu có sự phụ thuộc thời gian. Nó đặc biệt hữu ích trong việc phân tích dữ liệu lịch sử, dự đoán xu hướng và dự báo tương lai dựa trên dữ liệu quá khứ. Một chuỗi thời gian được định nghĩa là một dãy các giá trị được ghi lại trong các khoảng thời gian liên tiếp. Ví dụ, ví dụ một chuỗi thời gian có thể là các giá trị doanh thu hàng ngày của một công ty trong vòng một tháng. Các ví dụ khác có thể là các chuỗi thời gian của chỉ số tài chính, nhiệt độ hàng ngày hoặc các dữ liệu sinh học. Cài đặt và phân tích bài toán chuỗi thời gian có thể được thực hiện bằng cách sử dụng các thư viện và công cụ phân tích dữ liệu như sau: Python và các thư viện liên quan: Python cung cấp nhiều thư viện mạnh mẽ để xử lý và phân tích chuỗi thời gian như NumPy, Pandas và Matplotlib. NumPy cung cấp các hàm và cấu trúc dữ liệu để thao tác dữ liệu số học hiệu quả. Pandas cung cấp đối tượng DataFrame để thao tác dữ liệu chuỗi thời gian và thực hiện các phân tích thống kê. Matplotlib là một thư viện trực quan hóa dữ liệu, cho phép bạn tạo biểu đồ và biểu diễn các kết quả phân tích của bạn. Thư viện phân tích chuỗi thời gian: Có nhiều thư viện phân tích chuỗi thời gian mạnh mẽ như Statsmodels, Prophet và scikitlearn. Statsmodels cung cấp các phương pháp thống kê và mô hình hóa dữ liệu chuỗi thời gian. Prophet là một thư viện phân tích dự báo chuỗi thời gian phát triển bởi Facebook. Scikitlearn là một thư viện học máy phổ biến, cung cấp các thuật toán và công cụ để xây dựng các mô hình dự đoán chuỗi thời gian. Các phương pháp phân tích chuỗi thời gian: Có nhiều phương pháp phân tích chuỗi thời gian phổ biến như hồi quy tuy

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG KHOA CÔNG NGHỆ THÔNG TIN  BÁO CÁO THỰC TẬP CƠ SỞ ĐỀ TÀI : TÌM HIỂU BÀI TỐN CHUỖI THỜI GIAN VÀ CÀI ĐẶT THỬ NGHIỆM GVHD : Sinh viên : Lớp : CNTT K19 CLC Thái Nguyên, Tháng 3, 2023 MỤC LỤC Lời Mở Đầu CHƯƠNG : TỔNG QUAN VỀ CHUỖI THỜI GIAN Chuỗi thời gian gì? Tại quan tâm đến chuỗi thời gian? Các thành phần chuỗi thời gian .6 4. Mục tiêu chuỗi thời gian 10 5. Kỹ thuật dự báo chung 12 CHƯƠNG : MƠ HÌNH CHUỖI THỜI GIAN ARIMA .15 Giới thiệu tổng quan ARIMA 15 Các thành phần mơ hình ARIMA .15 2.1 Tự hồi quy ( autoregressive ) 16 2.2 Trung bình động (moving average) 18 2.3 Sai phân 20 Tính dừng khác biệt 21 3.1 Tính dừng 21 3.2 Sự khác biệt 22 3.3 Các kỹ thuật kiểm tra tính dừng 22 Các mơ hình ARIMA mở rộng 24 4.1 Các mơ hình ARIMA 24 4.2 Các mô hình ARIMA mở rộng 25 Ưu nhược điểm mơ hình ARIMA 28 CHƯƠNG 3: XÂY DỰNG MƠ HÌNH ARIMA TRONG R 30 Các bước chung để xây dựng mơ hình ARIMA 30 Giới thiệu R 31 2.1 Ngôn ngữ R ? 31 2.2 Tính R ? 31 2.3 Ưu điểm R 31 Demo mơ hình ARIMA dự báo thực tế 33 KẾT LUẬN 48 CÁC NGUỒN TÀI LIỆU THAM KHẢO 49 NHẬN XÉT CỦA GIẢNG VIÊN 50 MỤC LỤC HÌNH ẢNH VÀ CƠNG THỨC Hình : Biểu đồ cổ phiếu Google Hình : Biểu đồ theo dõi số lượng xe đạp Hình : Biểu đồ thể cấp độ Hình : Biểu đồ thể xu hướng Hình : Biểu đồ thể tính mùa vụ Hình : Biểu đồ thể thành phần ngẫu nhiên .9 Hình : Biểu đồ thể giá cổ phiếu Google theo thời gian 10 Hình : Biểu đồ thể xu hướng giá trị cổ phiếu Google 11 Hình : Biểu đồ thể hình tính mùa vụ giá trị cổ phiếu Google 11 Hình 10 : Các biểu đồ nhiễu ngẫu nhiên giá trị cổ phiếu Google 11 Hình 11 : Biểu đồ dự đốn giá trị cổ phiếu Google 12 Hình 12 : Biểu đồ sử dụng phương pháp hồi quy .13 Hình 13 : Biểu đồ sử dụng mơ hình ARIMA 14 Hình 14 : Biểu đồ mơ hình Tự hồi quy .16 Cơng thức mơ hình AR(p) : .17 Hình 15 : Biểu đồ mơ hình Trung bình động 19 Cơng thức mơ hình MA(q) : .19 Công thức kiểm tra KPSS: 23 Công thức kiểm tra ADF: 24 Bảng : Các trường hợp mơ hình ARIMA .24 Công thức mơ hình SARIMA : 26 Công thức mơ hình ARFIMA : 27 Hình 16 : Biểu đồ chuỗi thời gian liệu AirPassenger .36 Hình 17 : Biểu đồ chuỗi thời gian với đường thẳng tuyến tính 37 Hình 18 : Biểu đồ chuỗi thời gian AirPassengers fit với AR 40 Hình 19 : Biểu đồ dự đốn mơ hình AR 41 Hình 20 : Biểu đồ chuỗi thời gian AirPassengers fit với MA 43 Hình 21 : Biểu đồ dự đốn mơ hình MA 45 Hình 22 : Biểu đồ dự đoán dựa tham số ngẫu nhiên 47 Lời Mở Đầu Trong thời đại cách mạng công nghiệp 4.0, việc nghiên cứu áp dụng kỹ thuật xử lý chuỗi thời gian trở nên quan trọng Những chuỗi liệu thời gian sử dụng nhiều lĩnh vực khác nhau, từ kinh tế, tài chính, y tế hệ thống điện, giám sát môi trường nhiều lĩnh vực khác Bài toán chuỗi thời gian lĩnh vực nghiên cứu trọng tâm khoa học liệu trí tuệ nhân tạo Nó u cầu phương pháp cơng cụ chun sâu để phân tích dự báo chuỗi thời gian liệu Bài báo giới thiệu trình bày số kỹ thuật quan trọng xử lý chuỗi thời gian, tập trung vào phân tích, mơ hình hóa dự báo Chúng ta đề cập đến phương pháp phân tích phân tích thành phần kỹ thuật dự báo phổ biến ARIMA Kiến thức giúp bạn hiểu áp dụng hiệu vấn đề xử lý chuỗi thời gian thực tế Hy vọng báo cáo giúp bạn có nhìn tổng quan tốn chuỗi thời gian kỹ thuật phổ biến để xử lý chúng CHƯƠNG : TỔNG QUAN VỀ CHUỖI THỜI GIAN Chuỗi thời gian gì?   Chuỗi thời gian đơn giản tập hợp giá trị thực thể quan sát theo thời gian, thường khoảng thời gian cách nhau. Nó hàng tháng, hàng năm, hàng tuần, hàng ngày, hàng hàng phút.  Một số ví dụ chuỗi thời gian bao gồm giá xăng hàng tuần, thay đổi nhiệt độ thời tiết hàng năm, số lượng hành khách tàu hàng ứng dụng thị trường chứng khoán   Dưới ví dụ chuỗi thời gian sử dụng Cổ phiếu Google.  Hình : Biểu đồ cổ phiếu Google Tại quan tâm đến chuỗi thời gian? Để dự đốn điều tương lai hiểu xu hướng theo thời gian,ta cần sử dụng đến phân tích chuỗi thời gian.  Ví dụ: muốn theo dõi doanh số bán hàng dự đoán doanh số bán hàng tương lai. Có thể bạn muốn chia nhỏ doanh số bán hàng theo thời gian để xem liệu có xu hướng chu kỳ liên quan đến hay không. Bất kỳ loại liệu theo dõi theo thời gian sử dụng để phân tích chuỗi thời gian!  Dưới ví dụ khác chuỗi thời gian, theo dõi số lượng xe đạp hàng Hình : Biểu đồ theo dõi số lượng xe đạp Các thành phần chuỗi thời gian Các giá trị quan sát thực chia thành thành phần chính: Thành phần hệ thống Thành phần ngẫu nhiên. Các thành phần hệ thống liệu dự đoán được, thành phần ngẫu nhiên liệu khơng thể dự đốn được. Ta chia nhỏ thành phần hệ thống thành phần ngẫu nhiên loạt định nghĩa Thành phần hệ thống (S) – Dữ liệu dự báo. Các thành phần hệ thống chia nhỏ thành phần + Cấp độ (Level): Đây giá trị trung bình chuỗi thời gian thường coi thành phần Cấp độ thay đổi theo thời gian, thay đổi chậm so với thành phần khác.Cấp độ thường sử dụng làm đầu vào ban đầu cho mô hình dự báo Hình : Biểu đồ thể cấp độ + Xu hướng (Trend) : Đây thay đổi dài hạn chuỗi thời gian Nó cho biết chuỗi thời gian tăng hay giảm dần khoảng thời gian dài Hình : Biểu đồ thể xu hướng + Tính thời vụ (S) – Chúng dao động theo mùa không theo mùa dự đốn giá trị quan sát bạn, Nói cách khác, liệu có tính thời vụ, liệu có biến thể xảy theo khoảng thời gian đặn (hàng tuần, hàng tháng, v.v.) xuyên suốt năm.  Ví dụ: giá máy chơi game Nintendo Switch trò chơi giảm tháng lần, sau tăng trở lại sau tuần. Đây coi thành phần theo mùa Hình : Biểu đồ thể tính mùa vụ Thành phần ngẫu nhiên(R) – Đây hành vi bất thường, bất thường liệu biến thể khơng giải thích Là thành phần ngẫu nhiên chuỗi thời gian, khơng thể dự đốn gây ảnh hưởng đến phân tích dự báo chuỗi thời gian  Hình : Biểu đồ thể thành phần ngẫu nhiên 4. Mục tiêu chuỗi thời gian  Khi cung cấp chuỗi thời gian, muốn phân tách thành phần liệu chuỗi thời gian dự báo đưa dự đốn dựa liệu mình.   Phân tích (Decomposition) : q trình phân tích chuỗi thời gian thành thành phần để giúp hiểu rõ cấu trúc chuỗi thời gian giúp loại bỏ yếu tố phi tuyến đóng góp vào biến động chuỗi Phân tích phân tách giúp xác định yếu tố mùa vụ, xu hướng dao động ngẫu nhiên chuỗi thời gian Ví dụ : Có thể doanh số bán hàng dịch vụ có thành phần theo mùa theo chu kỳ chúng ta muốn sử dụng điều để cải thiện doanh số bán hàng vào thời điểm định mùa. Đó nơi mà việc phân tách chuỗi thời gian hữu ích. Ta hình dung xác định yếu tố xu hướng cụ thể liệu tác động đến tăng trưởng suy giảm nó.  Dưới bảng phân tích thành phần kho Google Hình : Biểu đồ thể giá cổ phiếu Google theo thời gian Hình : Biểu đồ thể xu hướng giá trị cổ phiếu Google Hình : Biểu đồ thể hình tính mùa vụ giá trị cổ phiếu Google 10

Ngày đăng: 13/05/2023, 09:24

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w