DÙNG NGÔN NGỮ R VÀ SPSS THỰC HIỆN CÁC PHÉP TÍNH DỰ BÁO VỚI TẬP TIN DỮ LIỆU: GAS & ELECTRIC

Một phần của tài liệu BT5 Phân tích dữ liệu kinh doanh (Trang 25 - 32)

TẬP TIN DỮ LIỆU: GAS & ELECTRIC

3.1. Sử dụng SPSS

3.1.1. Đặt vấn đề: Dự đoán lượng gas và lượng điện sử dụng trong 12 tháng tiếp theo 3.1.2. Tiến hành:

• Chọn Analyze à Forecasting à Create Traditional Models

• Chọn Define Date and time.. để định dạng lại thời gian cho phù hợp với chuỗi thời gian của dataset

• Chọn chuỗi thời gian cho phù hợp với chuỗi thời gian của dataset. Trong chuỗi thời gian của dataset là tháng năm nên chọn Years, months và thiết lập năm bắt đầu và tháng bắt đầu trong ô Year và Month. Chọn OK

• Đưa biến cần dự báo là Gas Use, Electric Use vào Dependent Variables, chọn Method là Expert Modeler

• Chọn Tab Statistics, đánh dấu Root mean square error để tính RMSE của mô hình, đánh dấu chọn Display forecasts để thể hiện kết quả dự báo ra màn hình

• Chọn Tab Options à Chọn First case after end of estimation period through a specified date và nhập năm cần dự đoán vào ô Year và số lượng tháng cần dự đoán (từ 1 đến 12) vào ô Month à Chọn OK

• Ở bảng Model Statistics, ta có thể thấy RMSE của Gas-Use (Model 1) = 15.915, và RMSE của Electric Use (Model 2) = 31.158. Nếu muốn so sánh độ chính xác giữa các mô hình dự báo, chúng ta sẽ chọn mô hình nào có RMSE nhỏ hơn

• Ở bảng Forecast cho thấy kết quả dự báo điểm và kết quả dự báo khoảng ở độ tin cây 95%. Ví dụ ở tháng 1 năm 3 (tức tháng 1 của năm sau):

+ Lượng gas sử dụng sẽ là 238; nếu sử dụng dự báo khoảng, lượng gas sử dụng sẽ trong khoảng từ 205 đến 271

+ Lượng điện sử dụng sẽ là 1029; nếu sử dụng dự báo khoảng, lượng điện sử dụng sẽ trong khoảng từ 964 đến 1094

• Màu đỏ - Observed – là giá trị thực tế lượng gas hoặc hoặc lượng điện sử dụng từ tháng 1 năm 1 đến tháng 12 của năm 2

• Màu xanh dương (trước Jan 3) – Fit – là giá trị trung bình khoảng về lượng gas hoặc lượng điện sử dụng từ tháng 1 đến tháng 12 của năm thứ 3

• Hai đường nét đứt là khoảng giá trị về lượng gas hoặc lượng điện có thể sử dụng • Màu xanh dương (từ Jan 3) – Forecast – là giá trị dự báo về lượng gas hoặc lượng

điện có thể sử dụng từ tháng 1 đến tháng 12 của năm 3

3.2. Sử dụng R

3.2.1. Đặt vấn đề: Dự đoán lượng gas và lượng điện sử dụng trong 12 tháng tiếp theo 3.2.2. Tiến hành:

• Trước khi thực hiện các phép tính dự báo, ta cần chuyển dữ liệu từ dạng numberic vector sang dạng R time series object. Ta dùng hàm ts(vector, start=, end=,

frequency=)

Cột Gas Use

Cột Electric Use

• Tính toán HoltWinter, ta dùng lệnh HoltWinter(object) Cột Gas Use

Lượng điện

3.2.3. Nhận xét và giải thích

• Kết quả của câu lệnh forecast cho thấy kết quả dự báo điểm ở độ tin cây 95%. Ví dụ ở tháng 1 năm 3 (tức tháng 1 của năm sau):

+ Lượng gas sử dụng sẽ là 219.50685 + Lượng điện sử dụng sẽ là 967.7526

Một phần của tài liệu BT5 Phân tích dữ liệu kinh doanh (Trang 25 - 32)