Sau khi học xong chương này, người học sẽ ● Phát biểu được chuỗi thời gian là gì ● Phân biệt được các khái niệm và các cách tiếp cận trong dự báo ● Thực hiện được các phương pháp dự báo dựa trên chuỗi thời gian: lượng tăng giảm tuyệt đối, tốc độ phát triển bình quân ● Thực hiện được một số phương pháp dự báo theo mô hình nhân © Nguyễn Tiến Dũng Thống kê ứng dụng 2 CÁC NỘI DUNG CHÍNH 14.1 Chuỗi thời gian 14.2 Các phương pháp dự báo dựa trên chuỗi thời gian 14.3 Dự báo bằng mô hình
CHƯƠNG 14 DỰ BÁO DỰA TRÊN DỮ LIỆU CHUỖI THỜI GIAN Ths Nguyễn Tiến Dũng Viện Kinh tế Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn MỤC TIÊU CỦA CHƯƠNG ● Sau học xong chương này, người học ● Phát biểu chuỗi thời gian ● Phân biệt khái niệm cách tiếp cận dự báo ● Thực phương pháp dự báo dựa chuỗi thời gian: lượng tăng giảm tuyệt đối, tốc độ phát triển bình quân ● Thực số phương pháp dự báo theo mô hình nhân © Nguyễn Tiến Dũng Thống kê ứng dụng CÁC NỘI DUNG CHÍNH 14.1 Chuỗi thời gian 14.2 Các phương pháp dự báo dựa chuỗi thời gian 14.3 Dự báo mô hình nhân © Nguyễn Tiến Dũng Thống kê ứng dụng 14.1 CHUỖI THỜI GIAN ● 14.1.1 Khái niệm ● 14.1.2 Các đại lượng mô tả chuỗi thời gian © Nguyễn Tiến Dũng Thống kê ứng dụng 14.1.1 Khái niệm ● Time-series data ● Chuỗi giá trị tiêu NC (đại lượng) xếp theo thứ tự thời gian ● Y = {Y1, Y2, Y3, Yn} ● Chuỗi số thời kỳ: ● DL thu thập kỳ ● Có tính cộng: cộng thời kỳ khác với ● TD ● Chuỗi số thời điểm ● DL thu thập thời điểm ● Không cộng lại với để đưa số tích luỹ ● TD © Nguyễn Tiến Dũng Thống kê ứng dụng Phân biệt DL thời kỳ DL thời điểm ● DL thời kỳ: có tính cộng ● Lượng bán, Doanh thu ● Chi phí SXKD, Lợi nhuận = Doanh thu – Chi phí ● GDP, thu nhập ● Chi tiêu sinh hoạt © Nguyễn Tiến Dũng ● DL thời điểm: tính cộng ● Số lao động ● ● ● ● ● doanh nghiệp Giá bán Tài sản, vốn chủ sở hữu, nợ phải trả CPI – Chỉ số giá tiêu dùng Điểm TB học tập học kỳ (GPA học kỳ) Mức độ hài lòng khách hàng – khảo sát theo quý Thống kê ứng dụng 14.1.2 Các đại lượng mô tả chuỗi thời gian ● 14.1.2.1 Giá trị TB ● Chuỗi thời kỳ n Y Yi n i 1 ● Chuỗi thời điểm ● Nếu khoảng cách thời điểm Y (0,5Y1 Y2 Y3 Yn 1 0,5Yn ) n 1 n ● Nếu khoảng cách thời điểm không nhau, thời gian NC liên tục © Nguyễn Tiến Dũng Y Y t i i i 1 n t i i 1 Thống kê ứng dụng 14.1.2.2 Lượng tăng giảm tuyệt đối (so sánh tuyệt đối) ● Lượng tăng giảm tuyệt đối liên hoàn ● Lượng tăng giảm tuyệt đối định gốc i Yi Yi 1 (i=2,n ) i Yi Y1 (i=2,n ) n n i i 2 ● Lượng tăng giảm tuyệt đối TB n i i n 1 n i 2 © Nguyễn Tiến Dũng Thống kê ứng dụng 14.1.2.3 Tốc độ phát triển Yi ti Yi 1 ● Tốc độ phát triển liên hoàn ● Tốc độ phát triển định gốc Yi Ti Y1 n Yn Tn ti Y1 i ● Liên hệ tốc độ phát triển liên hoàn tốc độ n t n 1 ti n 1 Tn phát triển định gốc i 2 ● Tốc độ phát triển TB © Nguyễn Tiến Dũng Thống kê ứng dụng 14.1.2.4 Tốc độ tăng trưởng ● Tốc độ tăng trưởng liên hoàn ● Tốc độ tăng trưởng định gốc ● Tốc độ tăng trưởng TB © Nguyễn Tiến Dũng Thống kê ứng dụng Yi Yi 1 ti Yi 1 Yi Y1 i Ai Ti Y1 Y1 a t 1 10 14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ● L: tầm xa dự báo (L = 1,2,3, ) ● Ft+L: giá trị dự báo thời gian t+L Fn L Yn L ● 𝛿: lượng tăng trưởng tuyệt đối TB ● TD t Y 100 118 121 ? - 18 delta (18 3) 10,5 F4 F31 Y3 1. 121 10,5 131,5 © Nguyễn Tiến Dũng Thống kê ứng dụng 16 14.2.2.2 Dự báo dựa vào tốc độ phát triển trung bình t Y 100 118 121 ? - 118/100 = 1,18 121/118 = 1,025 Tốc độ PT liên hoàn Fn L Yn ( t ) L t Y3 / Y1 121 / 100 1,1 (1,18).(1, 025) 1, 099 F4 F31 Y3 t 121 1,1 133,1 © Nguyễn Tiến Dũng Thống kê ứng dụng 17 14.2.2.3 Dự báo phương pháp trung bình trượt (Moving Average Method) ● Phạm vi áp dụng ý nghĩa: ● Chuỗi số liệu có thành phần xu hướng (tăng/giảm tuyến tính) có thành phần bất thường (nhiễu loạn) ● Số điểm lấy TB: ● m = 2k+1 m = 2k ● Nếu m lẻ, trung tâm hoá ● Nếu m chẵn, phải trung tâm hoá ● Chọn m bao nhiêu? ● Dãy số có mức độ biến động ít, chọn m nhỏ (TD, m=3) ● Dãy số có mức độ biến động nhiều, chọn m lớn (m = 5, .) ● Phương pháp “Trial-and-error”: thử giá trị m khác nhau, phương pháp có MSE nhỏ chọn ● m lớn, đường dự báo trơn © Nguyễn Tiến Dũng Thống kê ứng dụng 18 14.2.2.4 Mô hình ngoại suy xu ● Sử dụng mô hình hồi quy tuyến tính đơn biến đa biến để dự báo © Nguyễn Tiến Dũng Thống kê ứng dụng Yˆ b0 b1 X 19 14.3 DỰ BÁO BẰNG MÔ HÌNH NHÂN ● Mô hình nhân (Multiplication Model) ● Chuỗi số liệu theo thời gian: Y = {Y1, Y2, , Yn} ● Các thành phần có mặt: ● TP xu (Trend) Ti ● TP chu kỳ dài hạn (Cyclical) Ci ● TP mùa vụ (Seasonal) Si ● TP bất thường (Erratic) Ei ● Mô hình nhân: Yi=Ti.Ci.Si.Ei ● Quy trình dự báo theo mô hình nhân ● Nhận diện thành phần chuỗi ● Tách riêng thành phần ● Lắp ghép chúng lại để có giá trị dự báo mong muốn © Nguyễn Tiến Dũng Thống kê ứng dụng 20 Quy trình dự báo theo PP Holt-Winter Bước 1: Tính TB di động trung tâm hoá Bước 2: Tính số mùa St Bước 3: Lọc yếu tố bất thường Et Bước 4: Kiểm tra số mùa Bước 5: Hiệu chỉnh số mùa (St*) Bước 6: Xác định số mùa điểm liệu thiếu Bước 7: Loại bỏ yếu tố mùa khỏi chuỗi liệu gốc Bước 8: Sử dụng hồi quy tuyến tính xác định phương trình hồi quy dãy liệu dự báo Bước 9: Xác định giá trị dãy liệu dự báo chưa có thành phần mùa Bước 10: Nhân trả lại thành phần mùa để có dãy liệu dự báo có thành phần mùa © Nguyễn Tiến Dũng Thống kê ứng dụng 21 ● B1: Tách thành phần mùa vụ bất thường khỏi chuỗi liệu phương pháp trung bình trượt trung tâm hoá (Centered Moving Average) Yt Yt 1 Yt Yt 1 Yt 1 Yt Yt 1 Yt MAt 0,5 CMAt MAt 0,5 MAt 0,5 MAt 0,5 t3 ● Nếu DL theo quý, chọn số điểm lấy TB trượt m = 4, trung tâm hoá ● MA: Moving Average ● CMA: Centered Moving Average © Nguyễn Tiến Dũng Thống kê ứng dụng 22 ● Nếu liệu thu thập theo tháng, chọn số điểm lấy TB trượt 12, trung tâm hoá Yt 6 Yt 5 Yt Yt 3 Yt Yt 1 Yt Yt 1 Yt Yt Yt Yt 5 MAt 0,5 12 Yt 5 Yt Yt 3 Yt Yt 1 Yt Yt 1 Yt Yt Yt Yt 5 Yt MAt 0,5 12 CMAt MAt 0,5 MAt 0,5 t7 © Nguyễn Tiến Dũng Thống kê ứng dụng 23 TD: Tính TB trượt trung tâm hoá CMA điểm TT Yt Y1 Y2 MA2,5 - Y3 MA3,5 CMA3 Y4 MA4,5 CMA4 Y5 MA5,5 CMA5 Y6 MA6,5 CMA6 Y7 MA7,5 CMA7 Y8 MA8,5 CMA8 Y9 MA9,5 CMA9 10 Y10 MA10,5 CMA10 11 Y11 - 12 Y12 - © Nguyễn Tiến Dũng MAt CMAt - Thống kê ứng dụng 24 Lọc thành phần mùa vụ St bất thường Et ● St.Et = Yt/CMAt © Nguyễn Tiến Dũng Thống kê ứng dụng 25 14.4 DỰ BÁO BẰNG HÀM TĂNG TRƯỞNG MŨ ● Chuỗi thời gian có tốc độ tăng trưởng không đổi qua giai đoạn ● TD: Yt a.e bt ● Quy hoạch điện quốc gia ● Chuỗi nhà hàng Western Steakhouses 1978-1992 – Trang 444 © Nguyễn Tiến Dũng Thống kê ứng dụng 26 14.5 DỰ BÁO BẰNG SAN BẰNG HÀM SỐ MŨ ● 14.5.1 San hàm mũ đơn giản ● 14.5.2 Phương pháp Holt ● 14.5.3 Phương pháp Holt-Winter © Nguyễn Tiến Dũng Thống kê ứng dụng 27 14.5.1 Phương pháp san mũ đơn giản ● Exponential Smoothing Method Ft 1 Yt (1 ) Ft Ft+1 giá trị dự báo giai đoạn t+1 Yt giá trị thực tế giai đoạn t, t = 1,2,3, , n α hệ số làm trơn, < α < Giá trị dự báo: Fn+1 = αYn + (1- α)Fn Tư tưởng: GT dự báo TB có trọng số GT trước đó, quan sát gần có trọng số lớn ● Phạm vi áp dụng ● ● ● ● ● ● Dãy DL thành phần xu hướng mùa vụ © Nguyễn Tiến Dũng Thống kê ứng dụng 28 14.5.2 Phương pháp Holt ● Áp dụng: dãy DL có thành phần xu hướng, thành phần mùa vụ L1 Y1 b1 Y2 Y1 Lt Yt (1 )( Lt 1 bt 1 ) bt ( Lt Lt 1 ) (1 ).bt 1 Ft m Lt m.bt © Nguyễn Tiến Dũng Thống kê ứng dụng 29 14.5.3 Phương pháp Holt-Winter ● Phạm vi áp dụng: Dãy DL có tính xu hướng mùa vụ ● Các công thức tính Lt (Yt / S t s ) (1 )( Lt 1 bt 1 ) bt ( Lt Lt 1 ) (1 )bt 1 S t (Yt / Lt ) (1 ) S t s Ft m ( Lt m.bt ).S t s m ● s số giai đoạn vòng thời vụ (đối với DL quý s=4; với DL ● ● ● ● tháng s=12) Lt đại điện cho mức độ chuỗi thời gian bt thành phần đại diện cho xu hướng St thành phần mùa vụ Ft+m giá trị dự báo cho m thời đoạn sau © Nguyễn Tiến Dũng Thống kê ứng dụng 30 [...]... báo đang sử dụ ng U RMSE của mô hình dự báo ngây thơ (naive) © Nguyễn Tiến Dũng Thống kê ứng dụng 14 14.2.2 Các phương pháp DB đơn giản ● 14. 2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ● 14. 2.2.2 Dự báo dựa vào tốc độ phát triển TB ● 14. 2.2.3 Dự báo bằng phương pháp TB trượt (moving average) © Nguyễn Tiến Dũng Thống kê ứng dụng 15 14. 2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB ● L: tầm... Yt a.e bt ● Quy hoạch điện quốc gia ● Chuỗi nhà hàng Western Steakhouses 1978-1992 – Trang 444 © Nguyễn Tiến Dũng Thống kê ứng dụng 26 14. 5 DỰ BÁO BẰNG SAN BẰNG HÀM SỐ MŨ ● 14. 5.1 San bằng hàm mũ đơn giản ● 14. 5.2 Phương pháp Holt ● 14. 5.3 Phương pháp Holt-Winter © Nguyễn Tiến Dũng Thống kê ứng dụng 27 14. 5.1 Phương pháp san bằng mũ đơn giản ● Exponential Smoothing Method Ft 1 Yt (1 ) Ft... áp dụng ● ● ● ● ● ● Dãy DL khơng có thành phần xu hướng và mùa vụ © Nguyễn Tiến Dũng Thống kê ứng dụng 28 14. 5.2 Phương pháp Holt ● Áp dụng: dãy DL có thành phần xu hướng, khơng có thành phần mùa vụ L1 Y1 b1 Y2 Y1 Lt Yt (1 )( Lt 1 bt 1 ) bt ( Lt Lt 1 ) (1 ).bt 1 Ft m Lt m.bt © Nguyễn Tiến Dũng Thống kê ứng dụng 29 14. 5.3 Phương pháp Holt-Winter ● Phạm vi áp dụng: ... diễn trong tương lai © Nguyễn Tiến Dũng Thống kê ứng dụng 11 14. 2.1 Một số vấn đề liên quan đến dự báo ● 14. 2.1.1 Thời đoạn DB ● Là tần suất thời gian mà DL phục vụ dự báo được thu thập, như ngày, tuần, tháng, q, năm ● 14. 2.1.2 Tầm xa DB ● DB tức thì: dưới 1 tháng ● DB ngắn hạn: từ 1 đến 3 tháng ● DB trung hạn: từ 3 tháng đến hơn 1 năm ● DB dài hạn: từ 2 năm trở lên © Nguyễn Tiến Dũng Thống kê ứng dụng. .. Dũng Thống kê ứng dụng 23 TD: Tính TB trượt trung tâm hố CMA 4 điểm TT Yt 1 Y1 2 Y2 MA2,5 - 3 Y3 MA3,5 CMA3 4 Y4 MA4,5 CMA4 5 Y5 MA5,5 CMA5 6 Y6 MA6,5 CMA6 7 Y7 MA7,5 CMA7 8 Y8 MA8,5 CMA8 9 Y9 MA9,5 CMA9 10 Y10 MA10,5 CMA10 11 Y11 - 12 Y12 - © Nguyễn Tiến Dũng MAt CMAt - Thống kê ứng dụng 24 Lọc thành phần mùa vụ St và bất thường Et ● St.Et = Yt/CMAt © Nguyễn Tiến Dũng Thống kê ứng dụng 25 14. 4 DỰ BÁO... giá trị m khác nhau, phương pháp nào có MSE nhỏ nhất thì chọn ● m càng lớn, đường dự báo càng trơn © Nguyễn Tiến Dũng Thống kê ứng dụng 18 14. 2.2.4 Mơ hình ngoại suy xu thế ● Sử dụng các mơ hình hồi quy tuyến tính đơn biến và đa biến để dự báo © Nguyễn Tiến Dũng Thống kê ứng dụng Yˆ b0 b1 X 19 14. 3 DỰ BÁO BẰNG MƠ HÌNH NHÂN ● Mơ hình nhân (Multiplication Model) ● Chuỗi số liệu theo thời gian: Y... F31 Y3 1. 121 10,5 131,5 © Nguyễn Tiến Dũng Thống kê ứng dụng 16 14. 2.2.2 Dự báo dựa vào tốc độ phát triển trung bình t 1 2 3 4 Y 100 118 121 ? - 118/100 = 1,18 121/118 = 1,025 Tốc độ PT liên hồn Fn L Yn ( t ) L t Y3 / Y1 121 / 100 1,1 (1,18).(1, 025) 1, 099 F4 F31 Y3 t 121 1,1 133,1 © Nguyễn Tiến Dũng Thống kê ứng dụng 17 14. 2.2.3 Dự báo bằng phương pháp trung... © Nguyễn Tiến Dũng Thống kê ứng dụng 22 ● Nếu dữ liệu thu thập theo tháng, chọn số điểm lấy TB trượt là 12, rồi trung tâm hố Yt 6 Yt 5 Yt 4 Yt 3 Yt 2 Yt 1 Yt Yt 1 Yt 2 Yt 3 Yt 4 Yt 5 MAt 0,5 12 Yt 5 Yt 4 Yt 3 Yt 2 Yt 1 Yt Yt 1 Yt 2 Yt 3 Yt 4 Yt 5 Yt 6 MAt 0,5 12 CMAt MAt 0,5 MAt 0,5 t7 © Nguyễn Tiến Dũng Thống. .. Nguyễn Tiến Dũng Thống kê ứng dụng 12 14. 2.1.3 Các chỉ tiêu đánh giá mức độ phù hợp của mơ hình dự báo ● Sai số tuyệt đối TB – MAE (Mean Absolute Error) F {F1 ; F2 ; , Fn } n MAE | e i Y {Y1 ; Y2 ; , Yn } ei Yi - Fi | i 1 n ● Sai số phần trăm tuyệt đối TB – MAPE (Mean Absolute Percent Error) n MPAE © Nguyễn Tiến Dũng | e i | /Yi i 1 n Thống kê ứng dụng 13 ● Sai số bình phương TB – MSE... dự báo mong muốn © Nguyễn Tiến Dũng Thống kê ứng dụng 20 Quy trình dự báo theo PP Holt-Winter Bước 1: Tính TB di động và trung tâm hố Bước 2: Tính chỉ số mùa St Bước 3: Lọc yếu tố bất thường Et Bước 4: Kiểm tra chỉ số mùa Bước 5: Hiệu chỉnh chỉ số mùa (St*) Bước 6: Xác định các chỉ số mùa ở những điểm dữ liệu còn thiếu Bước 7: Loại bỏ yếu tố mùa khỏi chuỗi dữ liệu gốc Bước 8: Sử dụng hồi quy tuyến