1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tự động hóa xây dựng mô hình arima để dự báo chuỗi thời gian

97 33 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA DƢƠNG HỚN MINH TỰ ĐỘNG HĨA XÂY DỰNG MƠ HÌNH ARIMA ĐỂ DỰ BÁO CHUỖI THỜI GIAN Chuyên ngành: Khoa Học Máy Tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 07 năm 2014 ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA DƢƠNG HỚN MINH TỰ ĐỘNG HĨA XÂY DỰNG MƠ HÌNH ARIMA ĐỂ DỰ BÁO CHUỖI THỜI GIAN Chuyên ngành: Khoa Học Máy Tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 07 năm 2014 CƠNG TRÌNH ĐƢỢC HOÀN THÀNH TẠI TRƢỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán hƣớng dẫn khoa học: PGS TS Dƣơng Tuấn Anh Cán chấm nhận xét 1: TS Phạm Văn Chung Cán chấm nhận xét 2: TS Lƣ Nhật Vinh Luận văn thạc sĩ đƣợc bảo vệ tại: Trƣờng Đại học Bách Khoa – ĐHQG TP.HCM, ngày 14 tháng 07 năm 2014 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: PGS TS Dƣơng Tuấn Anh TS Phạm Văn Chung TS Lƣ Nhật Vinh TS Huỳnh Tƣờng Nguyên TS Nguyễn Văn Minh Mẫn Xác nhận Chủ tịch Hội đồng đánh giá luận văn Trƣởng Khoa quản lý chuyên ngành sau luận văn đƣợc sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƢỞNG KHOA ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƢỜNG ĐẠI HỌC BÁCH KHOA Độc Lập - Tự Do - Hạnh Phúc _ NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: DƢƠNG HỚN MINH MSSV: 12070523 Ngày, tháng, năm sinh: 01/08/1989 Nơi sinh: An Giang Chuyên ngành: Khoa Học Máy Tính Mã số: 60.48.01 I TÊN ĐỀ TÀI: Tự động hóa xây dựng mơ hình ARIMA để dự báo chuỗi thời gian NHIỆM VỤ LUẬN VĂN: Tự động hóa xây dựng mơ hình ARIMA để dự báo liệu chuỗi thời gian môi trƣờng trực tuyến II NGÀY GIAO NHIỆM VỤ: 20/01/2014 III NGÀY HOÀN THÀNH NHIỆM VỤ: 20/06/2014 IV CÁN BỘ HƢỚNG DẪN: PGS TS Dƣơng Tuấn Anh Tp HCM, ngày 14 tháng 07 năm 2014 CÁN BỘ HƢỚNG DẪN PGS TS Dƣơng Tuấn Anh TRƢỞNG KHOA i LỜI CẢM ƠN Tơi xin tỏ lịng biết ơn sâu sắc chân thành đến thầy PGS TS Dƣơng Tuấn Anh tận tâm hƣớng dẫn tơi q trình thực luận văn cao học tạo điều kiện thuận lợi để tơi hồn thành luận văn Tơi xin chân thành cảm ơn quý Thầy Cô Khoa Khoa Học Máy Tính - Trƣờng Đại học Bách Khoa truyền đạt vốn kiến thức quý báu cho suốt thời gian học tập trƣờng Sau cùng, tơi xin kính chúc q Thầy Cơ Khoa Khoa Học Máy Tính thầy PGS TS Dƣơng Tuấn Anh thật dồi sức khỏe để tiếp tục truyền đạt kiến thức cho hệ mai sau ii TÓM TẮT Ngày nay, nhiều quốc gia phải vật lộn để phục hồi từ khủng hoảng tài tồn cầu Rõ ràng không muốn bị khủng hoảng nhƣ tƣơng lai Chúng ta phải nghiên cứu xảy khứ để ngăn chặn khủng hoảng tài tƣơng lai Qua đó, thấy việc dự báo dựa vào chuỗi liệu thời gian đóng vai trị quan trọng khơng kinh tế, tài mà cịn tất lĩnh vực khác nhƣ y tế, giáo dục, môi trƣờng, Nhiều phƣơng pháp đƣợc đề xuất, phƣơng pháp có ƣu nhƣợc điểm riêng Trong đó, mơ hình hồi qui tích hợp trung bình di động (ARIMA) đƣợc xem phổ biến dự báo liệu chuỗi thời gian Tuy nhiên, việc xây dựng mơ hình ARIMA phải trải qua nhiều bƣớc chi li, bƣớc địi hỏi phải có tham gia ngƣời Do mục tiêu luận văn tự động hóa q trình xây dựng mơ hình ARIMA để dự báo chuỗi thời gian Luận văn trình bày kết thực nghiệm mơ hình ARIMA đƣợc tự động sinh chƣơng trình so với phƣơng pháp làm trơn hàm mũ Winters so sánh mơ hình ARIMA có cập nhật lại hệ số không cập nhật lại hệ số môi trƣờng trực tuyến Luận văn thực thành cơng chƣơng trình tự động hóa q trình xây dựng mơ hình ARIMA để dự báo liệu chuỗi thời gian iii ABSTRACT Nowadays, many countries struggle to recover from the recent global financial crisis, Obviously, we not want to suffer another crisis in the future We must study the past in order to prevent future financial crisis Thus, we see that the time series prediction plays extremely important role not only in economic and financial field but also in other fields as health, education, environment,….Many methods have been proposed to solve this problem and the Autoregressive Integrated Moving Average model (ARIMA) is the popular model in time series forecasting problem However, ARIMA model needs many intermediate steps that require the participation of human decisions Thus, it’s necessary to automate the process of creating ARIMA model This thesis implements automatic program for creating ARIMA model and empirically compares with the Exponential Smoothing Winters method Furthermore, we compare the performance of ARIMA model without model-update to that of ARIMA model with model-update in online environment This thesis has completed the automatic program for building ARIMA model to forecast time series iv LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác nhƣ ghi rõ luận văn, cơng việc trình bày luận văn tơi thực chƣa có phần nội dung luận văn đƣợc nộp để lấy cấp trƣờng trƣờng khác Tp.HCM, ngày 14 tháng 07 năm 2014 Dƣơng Hớn Minh v DANH MỤC HÌNH ẢNH Hình Biểu đồ thể lƣợng mƣa hàng năm Los Angeles- California Hình 2 Thành phần xu hƣớng Hình Thành phần mùa Hình Thành phần chu kỳ Hình Cơ chế hoạt động đệm xoay vòng 18 Hình Các thành phần mơ hình SARIMA 20 Hình Lấy hiệu chuỗi liệu có tính mùa 23 Hình 3 Hai cấp lấy hiệu 24 Hình Phát mùa ACF 26 Hình Thành phần khử mùa xu hƣớng mơ hình SARIMA 29 Hình Q trình ƣớc lƣợng tham số mơ hình SARIMA 30 Hình Mơ hình kết hợp ARIMA mạng nơron 35 Hình Giao diện chƣơng trình .38 Hình Đồ thị chuỗi thời gian 39 Hình Hệ số tự tƣơng quan (ACF) chuỗi thời gian .40 Hình 4 Hệ số tự tƣơng quan riêng phần (PACF) chuỗi thời gian 40 Hình Bộ liệu mực nƣớc trung bình hàng tháng hồ nƣớc 42 Hình Bộ liệu nhiệt độ tối đa Melbourne 43 Hình Bộ liệu số lƣợng tạp chí hóa chất 43 Hình Bộ liệu số ca sinh tháng thành phố New York 44 Hình Bộ liệu số lƣợng sản xuất sữa bị nơng trại 45 Hình 10 Bộ liệu tổng mức tiêu thụ điện Mỹ .45 Hình 11 Bộ liệu nồng độ Ozone Arosa 46 Hình 12 Bộ liệu lƣợng tiêu thụ khí đốt Anh 46 Hình B Ví dụ định dạng liệu đầu vào B1 Hình B Giao diện chƣơng trình B2 Hình B Thể chiều dài chuỗi liệu B3 Hình B Hệ số tự tƣơng quan theo độ trễ B4 vi Hình B Hàm tự tƣơng quan riêng phần theo độ trễ B5 Hình B Đồ thị lỗi mơ hình ARIMA B7 Hình B Kiểm tra tính xác mơ hình ARIMA B8 Hình B 8: Nhập số thời đoạn cần dự báo B8 Hình B Kết dự báo B9 Hình B 10 Kết dự báo trực tuyến B10 Hình C Tuổi băng hà 42 vị vua liên tiếp Anh C3 Hình C Kết dự báo Holt-Winters C6 Hình C Kết dự báo doanh thu cho 48 tháng C7 B6 + Ƣớc lƣợng tự động Chế độ cho phép ta nhập vào hệ số mơ hình p, d, q, P, Q, D, S thông qua hộp kí tự “Regular differencing”, “Season differencing”, “Season Partern”, “AR Regular”, “MA Regular”, “AR Season”, “MA Season”.Chế độ cho phép ta ƣớc lƣợng nhiều lần thông qua nút “Process”: ƣớc lƣợng với hệ số cho, “Restore”: khôi phục lại chuỗi liệu nhƣ ban đầu + Ƣớc lƣợng tự động Để tự động ƣớc lƣợng hệ số mơ hình p, d, q, P, Q, D, S ta dùng nút “Auto Traning” + Xem đồ thị lỗi mơ hình SARIMA B7 Sau ƣớc lƣợng đƣợc hệ số cho mơ hình, ta đánh giá đƣợc độ xác mơ hình SARIMA.bằng cách chọn vào nút “Plot Error” để hiển thị đồ thị lỗi Hình B Đồ thị lỗi mơ hình ARIMA  Kiểm tra mơ hình SARIMA Chúng ta kiểm tra tính xác mơ hình thơng qua hệ số MSE, MAE, MAPE B8 Hình B Kiểm tra tính xác mơ hình ARIMA  Dự báo tính xác mơ hình ARIMA Chúng ta dự báo thơng qua nút “Forecast” nhập vào số thời đoạn cần dự báo Hình B 8: Nhập s thời đoạn cần dự báo Kết dự báo 34 phần tử B9 Hình B Kết dự báo  Dự báo trực tuyến Chúng ta dự báo trực tuyến thông qua nút “Forecast Online” nhập vào số thời đoạn cần dự báo B10 Hình B 10 Kết dự báo trực tuyến C1 PHỤ LỤC C: CÁC LỆNH THỰC THI MƠ HÌNH HOLT-WINTERS TRÊN R Tải phần mềm R website: http://cran.R-project.org [14] Các lệnh thực thi mô hình Holt-Winters R [13]  Đọc liệu Đầu tiên để phân tích liệu chuỗi liệu thời gian cầ phải đọc chuỗi liệu thời gian vào R, vẽ chuỗi liệu thời gian Bạn đọc liệu vào R cách sử dụng hàm scan() , giả định liệu bạn cho thời điểm tập tin văn đơn giản với cột Ví dụ, tập tin http://robjhyndman.com/tsdldata/misc/kings.dat chứa liệu độ tuổi băng hà vị vua liên tiếp Anh, bắt đầu với William the Conqueror (nguồn gốc: Hipel Mcleod, 1994) Chúng ta thấy tập tin dó có chứa nhận xét liệu – tập tin dòng cách sử dụng tham số “skip” hàm scan() bỏ qua dịng đọc liệu vào R > kings kingstimeseries births birthstimeseries plot.ts(kingstimeseries) C3 Hình C Tuổi băng h 42 vị vua liên tiếp Anh  L m trơn h m mũ Holt-WinterS Một ví dụ chuỗi thời gian mà đƣợc mơ tả mơ hình cộng với xu hƣớng mùa chuỗi thời gian nhật ký bán hàng hàng tháng cho cửa hàng lƣu niệm thị trấn nghỉ mát bãi biển Queensland, Australia Để đƣa dự báo, phải có mơ hình phù hợp với dự báo cách sử dụng hàm HoltWinters () Ví dụ, để phù hợp với mơ hình dự báo cho nhật ký doanh số bán hàng hàng tháng cửa hàng lƣu niệm, gõ: > souvenirtimeseriesforecasts souvenirtimeseriesforecasts Holt-Winters exponential smoothing with trend and additive seasonal component Smoothing parameters: alpha: 0.413418 C4 beta : gamma: 0.9561275 Coefficients: [,1] a 10.37661961 b 0.02996319 s1 -0.80952063 s2 -0.60576477 s3 0.01103238 s4 -0.24160551 s5 -0.35933517 s6 -0.18076683 s7 0.07788605 s8 0.10147055 s9 0.09649353 s10 0.05197826 s11 0.41793637 s12 1.18088423 Chúng ta thấy giá trị alpha, beta gamma đƣợc ƣớc tính lần lƣợt 0,41, 0,00, 0,96 Để xác dự báo, tính tổng bình thƣơng lỗi cho lỗi dự báo mẫu cách C5 > souvenirtimeseriesforecasts$SSE 2.011491 Để dự báo mơ hình nhân hay mơ hình cộng ta thêm vào thơng số seasonal = c("additive") seasonal = c("multiplicative") tƣơng ứng hàm HoltWinters () [16] Ví dụ để dự báo mơ hình cộng: >souvenirtimeseriesforecasts souvenirtimeseriesforecasts c("multiplicative")) >souvenirtimeseriesforecasts Chúng ta vẽ chuỗi thời gian ban đầu đƣờng màu đen giá trị dự báo đƣờng màu đỏ: > plot(souvenirtimeseriesforecasts) C6 Hình C Kết dự báo Holt-Winters Nhìn vào biểu đồ, thấy phƣơng pháp làm trơn hàm mũ Holt-Winters thành công việc dự báo đỉnh theo mùa, xảy khoảng tháng mƣời năm Để đƣa dự báo cho liệu tƣơng lai không bao gồm chuỗi thời gian ban đầu, sử dụng hàm “forecast.HoltWinters ()”trong gói " forecast " Ví dụ, liệu ban đầu cho việc bán hàng lƣu niệm từ tháng năm 1987 đến tháng 12 năm 1993 Nếu muốn đƣa dự báo cho tháng năm 1994 đến tháng 12 năm 1998 (48 tháng nữa), vẽ dự báo: > souvenirtimeseriesforecasts2 plot.forecast(souvenirtimeseriesforecasts2) C7 Hình C Kết dự báo doanh thu cho 48 tháng Giá trị dự báo đƣợc hiển thị đƣờng màu xanh, đổ bóng mờ màu cam màu vàng cho khoảng dự báo 80% 95% D1 LÝ LỊCH TRÍCH NGANG Họ tên: Dƣơng Hớn Minh Ngày tháng năm sinh : 01/08/1989 Nơi sinh: An Giang Địa liên lạc: C3/10 Phạm Hùng, Bình Hƣng, Bình Chánh, TP Hồ Chí Minh Email: duonghonminh@gmail.com E1 QU TRÌNH Đ O TẠO Chuyên ngành Bậc đào tạo 2007-2011 Đại học Cửu Long Công Nghệ Thông Tin Cử nhân 2012-2014 Đại học bách khoa TP.HCM Khoa học máy tính Thạc sỹ Thời gian Trƣờng đào tạo F1 Q TRÌNH CƠNG TÁC Thời gian Đơn vị cơng tác Vị trí 2013 - Trƣờng Đại Học Tơn Đức Thắng Giảng viên ... I TÊN ĐỀ TÀI: Tự động hóa xây dựng mơ hình ARIMA để dự báo chuỗi thời gian NHIỆM VỤ LUẬN VĂN: Tự động hóa xây dựng mơ hình ARIMA để dự báo liệu chuỗi thời gian môi trƣờng trực... luận văn tự động hóa xây dựng mơ hình ARIMA để dự báo liệu chuỗi thời gian môi trƣờng trực tuyến 1.4 Phương pháp nghiên cứu Dựa vào luận văn tự động hóa mơ hình ARIMA để dự báo chuỗi thời gian với... cao hiệu suất mô dự báo 3.3 Kết luận Tự động hóa q trình xây dựng mơ hình SARIMA theo đề xuất Nancy Ngoc Tran giúp ta tự động xây dựng đƣợc mơ hình SARIMA để dự báo chuỗi thời gian mà không cần

Ngày đăng: 01/02/2021, 00:11

Xem thêm:

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN