Trang 12 1.3 Khảo sát dữ liệu1.3.1 Phương pháp đồ thịTrong phần mềm Eviews 8, thực hiện lệnh: line chepro, ta thu được hình sau:Hình 1.1 Đồ thị biểu diễn giá trị nhập khẩu sản phẩm hóa c
KHẢO SÁT DỮ LIỆU
Phương pháp thu thập số liệu và nguồn số liệu
Nhóm nghiên cứu đã tổng hợp được bộ số liệu phục vụ cho đề tài thông qua các báo cáo từ nguồn dữ liệu thứ cấp trên cổng thông tin chính thức của Tổng cụcThống kê Việt Nam: https://www.gso.gov.vn/ Bộ số liệu bao gồm 79 quan sát về giá trị nhập khẩu sản phẩm hóa chất của Việt Nam, được đặt tên biến là chepro (Đơn vị: 1000 USD), dữ liệu bao gồm từ tháng 1 năm 2015 đến tháng 7 năm 2021.
Mô tả thống kê bộ số liệu
Sau khi thu thập thành công bộ số liệu, nhóm tác giả có được bảng mô tả thống kê biến chepro thông qua phần mềm Eviews 8 như sau:
Trong cửa sổ Eviews 8: chọn chuỗi chepro/view/Descriptive Statistics & Test/ Histogram and Stats Qua chuỗi câu lệnh, ta thu được bảng kết quả:
Bảng 1.1 Mô tả thống kê biến chepro
Mẫu khẩu sát (đã mở rộng) 2015M01 → 2021M12
Giá trị trung bình (Mean) 408651,8
Giá trị lớn nhất (Maximum) 799622,8
Giá trị nhỏ nhất (Minimum) 189466,7 Độ lệch chuẩn (Std Dev) 109424,0
Nguồn: Nhóm tác giả tự tổng hợp trên phần mềm EVIEWS 8
Qua Bảng 1.1 với mục đích mô tả thống kê biến chepro, ta thấy biến chepro có giá trị nhập khẩu trung bình là 408651,8 nghìn USD, trong đó: giá trị trung vị là
4040008 nghìn USD, mức giá trị nhập khẩu lớn nhất là 799622 nghìn USD, nhỏ nhất là 189466,7 nghìn USD Độ lệch chuẩn của biến chepro là 109424, cho thấy sự biến động khá mạnh về giá trị nhập khẩu sản phẩm hóa chất giữa các tháng có quan sát.
LỰA CHỌN PHƯƠNG PHÁP DỰ BÁO
Phương pháp dự báo thô hiệu chỉnh xu thế và mùa vụ
Do quan sát thấy khuynh hướng xu hướng tăng của chuỗi dữ liệu, ta có thể áp dụng mô hình giản đơn mở rộng có xu thế tuyến tính Bên cạnh đó, chuỗi còn có tính mùa vụ, nên nhóm sẽ kết hợp 2 phương pháp dự báo thô hiệu chỉnh xu thế và dự báo thô hiệu chỉnh mùa vụ để dự báo cho chuỗi.
Bước 1: Dự báo thô hiệu chỉnh xu thế:
Bước 2: Dự báo thô hiệu chỉnh mùa vụ: Y t+1 = Y t+1−s
Bước 3: Kết hợp dự báo thô hiệu chỉnh xu thế và mùa vụ Y t+1 = Y t+1−s + (Y t+1−s − Y t+1−2s )
Trong đó: Yt+1 là giá trị dự báo cho giai đoạn t+1
Y t là giá trị thực tại thời điểm t
Yt-1 là giá trị thực tại thời điểm t – 1 s là số mùa vụ
Phương pháp dự báo san mũ Winters
San mũ Winters là phương pháp mở rộng của san mũ Holt (có yếu tố xu thế) đối với các dữ liệu chức có thêm yếu tố mùa vụ S.
Do chuỗi dữ liệu, như đã phân tích ở trên, chuỗi có yếu tố xu thế và mùa vụ, kết hợp với đồ thị thể hiện nhóm là mô hình nhân tính với số quan sát 79 (lớn hơn yêu
10 cầu về 50 quan sát), thời gian dự báo ngắn, nhóm thực hiện dự báo bằng phương pháp san mũ Winters cho mô hình nhân tính.
Mô hình Winters sử dụng 4 phương trình và 3 hằng số, thể hiện qua 4 bước sau: Bước 1: Ước lượng giá trị trung bình hiện tạiY t L t = α St−s + (1 − α)(L t−1 + T ) t−1
Bước 2: Ước lượng giá trị xu thế (độ dốc)
Bước 3: Ước lượng giá trị chỉ số mùa
Bước 4: Dự báo h giai đoạn trong tương lai
Trong đó: n là quan sát cuối cùng của chuỗi thời gian ban đầu
Y t là giá trị hiện tại của chuỗi số liệu
L t là giá trị trung bình ước lượng
Tt là giá trị xu thế ước lượng
Si là chỉ số thời vụ của mùa dự báo, s là số mùa vụ α, β, γ lần lượt là hệ số san mũ trung bình, hệ số san mũ xu thế và hệ số san mũ mùa vụ.
Phương pháp phân tích
Đáp ứng yêu cầu của một chuỗi dự báo có thể sử dụng phương pháp phân tích là các đặc điểm như: bộ số liệu có yếu tố xu thế, mùa vụ, tuân theo quy luật của mô hình nhân tính, số quan sát đáng kể với 79 quan sát, thời gian dự báo ngắn (cho 5 quan sát tiếp theo trong tương lai), nhóm tác giả đã tiến hành sử dụng phương pháp phân tích cho bộ số liệu của mình.
Phương pháp phân tích để dự báo cho các quan sát gần trong tương lai được thực hiện qua 4 bước chính.
Bước 1: Nhận dạng số liệu
Mô hình có cả yếu tố xu thế và yếu tố mùa vụ (thông qua thực hiện khảo sát dữ liệu ở chương 1) Bên cạnh đó, qua sự tương tác giữa các thành phần của chuỗi thời gian, thông qua quan sát đồ thị của biến chepro, như đã thực hiện ở phần Khảo sát dữ liệu ở đầu chương 1, ta thấy các thành phần của chuỗi chepro có phụ thuộc vào nhau hay mô hình của bộ số liệu cần dự báo là mô hình nhân tính.
Bước 2: Tách yếu tố mùa vụ S – hiệu chỉnh mùa vụ (SA)
Ta sử dụng phương pháp trung bình trượt trung tâm và hiệu chỉnh mùa vụ để triệt tiêu các yếu tố I và tách được S Chuỗi sau khi hiệu chỉnh chủ yếu phụ thuộc 2 thành phần chính là T và C Để thuận tiện cho quá trình nghiên cứu, ta giả định không có yếu tố C (C=1 do mô hình là mô hình nhân tính) Việc tách các yếu tố mùa vụ cho mô hình nhân tính gồm 5 bước nhỏ như sau:
1 Làm trơn số liệu bằng trung bình trượt trung tâm s điểm (với s là số mùa vụ trong năm) CMA, ta thu được chuỗi hiệu chỉnh là Y * t
2 Tính tỷ số chênh lệch: Yt
3 Tính giá trị trung bình tỷ số thời vụ của từng mùa vụ: M = E(S i i ).
4 Tính chỉ số thời vụ chung Scaling Factor (i= 1,s):
5.Hiệu chỉnh Yt để được ADYt (giá trị đã hiểu chỉnh thời vụ):
Bước 3: Ước lượng hàm xu thế và dự báo
− Ước lượng chuỗi đa hiệu chỉnh theo biến xu thế t:
− Kiểm định mô hình ước lượng:
• Kiểm định tự tương quan
• Kiểm định phương sai sai số thay đổi
• Kiểm định phân phối chuẩn của chuỗi nhiễu 12
Nếu mô hình ước lượng không vượt qua được các tiêu chuẩn của kiểm định, xem xét lại mô hình ở Bước 2, có thể thêm các biến độc lập như t , t hoặc các dạng 2 3 hàm khác của hàm xu thế (thường là dạng log).
Bước 4: Kết hợp yếu tố mùa vụ S để đưa ra kết quả dự báo cuối cùng với Yn là quan sát cuối cùng:
+ℎ = 1 + 2.( +ℎ) Đối với mô hình nhân:
Phương pháp dự báo bằng mô hình ARIMA (phương pháp Box – Jenkins) 13 CHƯƠNG 3 KẾT QUẢ DỰ BÁO
Do chuỗi dữ liệu có yếu tố mùa vụ, số quan sát là 79 (>50 quan sát theo yêu cầu của mô hình ARIMA), khoảng thời gian dự báo ngắn, và chuỗi sai phân bậc 1 của chuỗi là chuỗi dừng nên nhóm lựa chọn phương pháp dự báo bằng mô hình ARIMA tích hợp với mô hình hồi quy.
Mô hình ARIMA (p,d,q) được tạo bởi 3 thành phần chính là AR (thành phần tự hồi quy – bậc p), I (tính dừng của chuỗi thời gian), và MA (thành phần trung bình trượt – bậc q) Ngoài ra, đối với các chuỗi thời gian có yếu tố mùa vụ thì ta cần thực hiện thao tác hiệu chỉnh yếu tố mùa vụ rồi mới tiến hành dự báo bằng phương pháp ARIMA Do phương pháp dự báo ARIMA chỉ áp dụng được khi chuỗi số liệu có tính dừng, nên ở bài nghiên cứu, nhóm sử dụng chuỗi sai phân bậc 1 đã dừng của chuỗi chepro để thực hiện cho phương pháp ARIMA.
Với I(d) là chuỗi dừng kết hợp bậc d, ta có mô hình ARIMA (p,d,q) có dạng:p p
Trong đó: AR(p) là mô hình tự tương quan bậc p
∆Y là chuỗi dừng khi lấy sai phân bậc d
MA(q) là mô hình trung bình trượt bậc q
Box và Jenkins (1974) đã đưa ra một tập hợp các bước, các thủ tục ước lượng mô hình ARIMA cho chuỗi thời gian, hay còn gọi là mô hình Box – Jenkins, bao gồm
Bước 1: Kiểm tra chuỗi dữ liệu có dừng hay không? Nếu chuỗi không dừng, phải biến đổi thành chuỗi dừng (có thể sử dụng chuỗi sai phân bậc 1, bậc 2, bậc 3 hoặc chuỗi dạng log hoặc kết hợp cả 2).
Bước 2: Qua giản đồ tự tương quan, tìm bậc p của mô hình AR bằng giản đồ tự tương quan riêng phần (PACF) và bậc q của mô hình MA bằng giản đồ tự tương quan (ACF).
Bước 3: Ước lượng mô hình ARIMA bằng phương pháp bình phương nhỏ nhất OLS thông qua phần mềm EVIEWS 8.
Bước 4: Kiểm tra mô hình và các điều kiện giả định của mô hình.
• Độ trễ cao nhất có ý nghĩa thống kê hay không, nếu không giảm bớt độ trễ của p và q.
• Nhiễu trắng (tự tương quan, phương sai sai số thay đổi).
• Chất lượng dự báo (thông qua MAPE < 5%).
Bước 5: Dự báo ngoài mẫu
Xét 5 tiêu chí lựa chọn mô hình ARIMA tốt nhất:
Tiêu chí 1: Phần dư của mô hình phải là một chuỗi ngẫu nhiên (xác định qua giản đồ tự tương quan).
Tiêu chí 2: Các tiêu chí AIC, SBC, HQC càng nhỏ càng tốt.
Với các mô hình có biến phụ thuộc dạng logarit thì các giá trị AIC/SBC/HQC âm thì ta chuyển sang dạng exp(AIC/SBC/HQC).
Tiêu chí 3: Sai số dự báo (MAPE, RMSE) càng nhỏ càng tốt.
Tiêu chí 4: Vẽ đồ thị so sánh giá trị dự báo với giá trị thực tế:
• Xem xét các bước ngoặt.
• Xem xu hướng của giá trị dự báo và giá trị thực tế ở những giai đoạn gần hiện tại nhất.
Tiêu chí 5: Hệ số hồi quy có ý nghĩa thống kê không, ưu tiên sử dụng mô hình tất cả các biến đều có ý nghĩa thống kê (p-value của biến nhỏ hơn mức ý nghĩa 5%).
CHƯƠNG 3 KẾT QUẢ DỰ BÁO
Dự báo bằng phương pháp phân tích
Chọn chuỗi SI/View/Descriptive Statistics & Test/ Equality Test by
Classification/Series/Month/Test equality of: Median/ OK
Qua các bước trên, ta thu được kết quả: p-value = 0,0077 < 0,05 Vì vậy, ta bác bỏ giả thuyết H ở mức ý nghĩa 5%, hay chuỗi có yếu tố mùa vụ.0
Kết luận: Mô hình dự báo là mô hình nhân tính, có yếu tố xu thế T và yếu tố mùa vụ S.
1.3.2 Phân tích giản độ tự tương quan (ACF) và tự tương quan riêng phần (PACF) Chọn chuỗi chepro/View/Correlogram/Level: Ta có mô hình tự tương quan và tự tương quan riêng phần như sau:
Hình 1.3 Giản đồ tự tương quan và tự tương quan riêng của chuỗi số liệu
Nguồn: Nhóm tác giả tự tổng hợp thông qua phần mềm EVIEWS 8
Nhận xét: Hệ số tự tương quan của các giá trị gần nhau trong chuỗi thời gian có tương quan cao với nhau cho thấy chuỗi có yếu tố xu thế mạnh Thêm vào đó, các hệ số tự tương quan khác 0 và có ý nghĩa thống kê tại độ trễ bằng đúng số mùa vụ cho thấy chuỗi dữ liệu có tính mùa vụ Song, chuỗi có dấu hiệu là chuỗi dữ liệu chưa dừng với hệ số tự tương quan giữa các giá trị gần nhau rất mạnh và đều có ý nghĩa thống kê cao.
Vì vậy, bên cạnh tiến hành quan sát giản đồ tự tương quan và tự tương quan riêng của chuỗi, nhóm tiến hành quan sát thêm giản đồ tự tương quan và tự tương quan riêng của chuỗi với sai phân bậc 1.
Với sai phân bậc 1 của chuỗi, tại phần mềm Eviews 8 thực hiện như sau: Chọn chuỗi chepro/View/Correlogram/ 1 difference, ta thu được kết quả sau: st
Hình 1.4 Giản đồ tự tương quan và tự tương quan riêng của sai phân bậc 1 chuỗi số liệu
Nguồn: Nhóm tác giả tự tổng hợp thông qua phần mềm EVIEWS
Nhận xét: Ta có thể thấy các hệ số tự tương quan khác 0 và có ý nghĩa thống kê tại độ trễ bằng đúng số mùa vụ cho thấy chuỗi dữ liệu có tính mùa vụ Thêm vào đó, hệ số tự tương quan ở độ trễ đầu khác 0, các hệ số tự tương quan giảm xuống bằng 0 ở ngay các độ trễ tiếp theo, nên chuỗi sai phân bậc 1 của giá trị nhập khẩu sản phẩm hóa chất (d(chepro)) là chuỗi dữ liệu dừng.
1.3.3 Kiểm tra tính dừng của chuỗi Để kiểm tra tính dừng của chuỗi, nhóm sử dụng kiểm định Unit Root Test với cặp giả thuyết:
H 0 : Chuỗi không có tính dừng
H1: Chuỗi có tính dừng Trong Eviews: chọn chepro/View/Unit Root Test/Level/Intercept/OK. Với kết quả thu được: p-value = 0,9870 > 0,05 nên chuỗi dữ liệu không dừng
Vì thế, nhóm tiến hành kiểm định thêm chuỗi sai phân bậc 1 của chuỗi chepro để xét tính dừng của chuỗi này.
Với chuỗi sai phân bậc 1 của chepro, trong Eviews thực hiện như sau: chọn chepro/View/Unit Root Test/1 Difference/Intercept/OK st
Ta thu được giá trị p-value = 0,0000 < 0,05 nên chuỗi sai phân bậc 1 của chepro là chuỗi dừng.
Kết luận: Mô hình dự báo cho chuỗi chepro của nhóm là mô hình nhân tính, có tính xu thế, mùa vụ và chuỗi sai phân bậc 1 là chuỗi dừng.
CHƯƠNG 2 LỰA CHỌN PHƯƠNG PHÁP DỰ BÁO
Thông qua chương 1, nhóm đã thực hiện khảo sát chuỗi số liệu 79 quan sát, thu được các thành phần của chuỗi bao gồm: tính xu thế, mùa vụ và tính ngẫu nhiên, nhóm tác giả, vì vậy, tiến hành lựa chọn bốn phương pháp dự báo phù hợp với các đặc điểm trên là: phương pháp dự báo thô hiệu chỉnh yếu tố xu thế và mùa vụ, phương pháp san mũ Winters, phương pháp phân tích và phương pháp mô hình ARIMA để dự báo cho 5 tháng cuối năm 2021 về giá trị nhập khẩu sản phẩm hóa chất của Việt Nam.
2.1 Phương pháp dự báo thô hiệu chỉnh xu thế và mùa vụ
Do quan sát thấy khuynh hướng xu hướng tăng của chuỗi dữ liệu, ta có thể áp dụng mô hình giản đơn mở rộng có xu thế tuyến tính Bên cạnh đó, chuỗi còn có tính mùa vụ, nên nhóm sẽ kết hợp 2 phương pháp dự báo thô hiệu chỉnh xu thế và dự báo thô hiệu chỉnh mùa vụ để dự báo cho chuỗi.
Bước 1: Dự báo thô hiệu chỉnh xu thế:
Bước 2: Dự báo thô hiệu chỉnh mùa vụ: Y t+1 = Y t+1−s
Bước 3: Kết hợp dự báo thô hiệu chỉnh xu thế và mùa vụ Y t+1 = Y t+1−s + (Y t+1−s − Y t+1−2s )
Trong đó: Yt+1 là giá trị dự báo cho giai đoạn t+1
Y t là giá trị thực tại thời điểm t
Yt-1 là giá trị thực tại thời điểm t – 1 s là số mùa vụ
2.2 Phương pháp dự báo san mũ Winters
San mũ Winters là phương pháp mở rộng của san mũ Holt (có yếu tố xu thế) đối với các dữ liệu chức có thêm yếu tố mùa vụ S.
Do chuỗi dữ liệu, như đã phân tích ở trên, chuỗi có yếu tố xu thế và mùa vụ, kết hợp với đồ thị thể hiện nhóm là mô hình nhân tính với số quan sát 79 (lớn hơn yêu
10 cầu về 50 quan sát), thời gian dự báo ngắn, nhóm thực hiện dự báo bằng phương pháp san mũ Winters cho mô hình nhân tính.
Mô hình Winters sử dụng 4 phương trình và 3 hằng số, thể hiện qua 4 bước sau: Bước 1: Ước lượng giá trị trung bình hiện tạiY t L t = α St−s + (1 − α)(L t−1 + T ) t−1
Bước 2: Ước lượng giá trị xu thế (độ dốc)
Bước 3: Ước lượng giá trị chỉ số mùa
Bước 4: Dự báo h giai đoạn trong tương lai
Trong đó: n là quan sát cuối cùng của chuỗi thời gian ban đầu
Y t là giá trị hiện tại của chuỗi số liệu
L t là giá trị trung bình ước lượng
Tt là giá trị xu thế ước lượng
Si là chỉ số thời vụ của mùa dự báo, s là số mùa vụ α, β, γ lần lượt là hệ số san mũ trung bình, hệ số san mũ xu thế và hệ số san mũ mùa vụ.
2.3 Phương pháp phân tích Đáp ứng yêu cầu của một chuỗi dự báo có thể sử dụng phương pháp phân tích là các đặc điểm như: bộ số liệu có yếu tố xu thế, mùa vụ, tuân theo quy luật của mô hình nhân tính, số quan sát đáng kể với 79 quan sát, thời gian dự báo ngắn (cho 5 quan sát tiếp theo trong tương lai), nhóm tác giả đã tiến hành sử dụng phương pháp phân tích cho bộ số liệu của mình.
Phương pháp phân tích để dự báo cho các quan sát gần trong tương lai được thực hiện qua 4 bước chính.
Bước 1: Nhận dạng số liệu
Mô hình có cả yếu tố xu thế và yếu tố mùa vụ (thông qua thực hiện khảo sát dữ liệu ở chương 1) Bên cạnh đó, qua sự tương tác giữa các thành phần của chuỗi thời gian, thông qua quan sát đồ thị của biến chepro, như đã thực hiện ở phần Khảo sát dữ liệu ở đầu chương 1, ta thấy các thành phần của chuỗi chepro có phụ thuộc vào nhau hay mô hình của bộ số liệu cần dự báo là mô hình nhân tính.
Bước 2: Tách yếu tố mùa vụ S – hiệu chỉnh mùa vụ (SA)
Ta sử dụng phương pháp trung bình trượt trung tâm và hiệu chỉnh mùa vụ để triệt tiêu các yếu tố I và tách được S Chuỗi sau khi hiệu chỉnh chủ yếu phụ thuộc 2 thành phần chính là T và C Để thuận tiện cho quá trình nghiên cứu, ta giả định không có yếu tố C (C=1 do mô hình là mô hình nhân tính) Việc tách các yếu tố mùa vụ cho mô hình nhân tính gồm 5 bước nhỏ như sau:
1 Làm trơn số liệu bằng trung bình trượt trung tâm s điểm (với s là số mùa vụ trong năm) CMA, ta thu được chuỗi hiệu chỉnh là Y * t
2 Tính tỷ số chênh lệch: Yt
3 Tính giá trị trung bình tỷ số thời vụ của từng mùa vụ: M = E(S i i ).
4 Tính chỉ số thời vụ chung Scaling Factor (i= 1,s):
5.Hiệu chỉnh Yt để được ADYt (giá trị đã hiểu chỉnh thời vụ):
Bước 3: Ước lượng hàm xu thế và dự báo
− Ước lượng chuỗi đa hiệu chỉnh theo biến xu thế t:
− Kiểm định mô hình ước lượng:
• Kiểm định tự tương quan
• Kiểm định phương sai sai số thay đổi
• Kiểm định phân phối chuẩn của chuỗi nhiễu 12
Nếu mô hình ước lượng không vượt qua được các tiêu chuẩn của kiểm định, xem xét lại mô hình ở Bước 2, có thể thêm các biến độc lập như t , t hoặc các dạng 2 3 hàm khác của hàm xu thế (thường là dạng log).
Bước 4: Kết hợp yếu tố mùa vụ S để đưa ra kết quả dự báo cuối cùng với Yn là quan sát cuối cùng:
+ℎ = 1 + 2.( +ℎ) Đối với mô hình nhân:
2.4 Phương pháp dự báo bằng mô hình ARIMA (phương pháp Box – Jenkins)
Do chuỗi dữ liệu có yếu tố mùa vụ, số quan sát là 79 (>50 quan sát theo yêu cầu của mô hình ARIMA), khoảng thời gian dự báo ngắn, và chuỗi sai phân bậc 1 của chuỗi là chuỗi dừng nên nhóm lựa chọn phương pháp dự báo bằng mô hình ARIMA tích hợp với mô hình hồi quy.
Mô hình ARIMA (p,d,q) được tạo bởi 3 thành phần chính là AR (thành phần tự hồi quy – bậc p), I (tính dừng của chuỗi thời gian), và MA (thành phần trung bình trượt – bậc q) Ngoài ra, đối với các chuỗi thời gian có yếu tố mùa vụ thì ta cần thực hiện thao tác hiệu chỉnh yếu tố mùa vụ rồi mới tiến hành dự báo bằng phương pháp ARIMA Do phương pháp dự báo ARIMA chỉ áp dụng được khi chuỗi số liệu có tính dừng, nên ở bài nghiên cứu, nhóm sử dụng chuỗi sai phân bậc 1 đã dừng của chuỗi chepro để thực hiện cho phương pháp ARIMA.
Với I(d) là chuỗi dừng kết hợp bậc d, ta có mô hình ARIMA (p,d,q) có dạng:p p
Trong đó: AR(p) là mô hình tự tương quan bậc p
∆Y là chuỗi dừng khi lấy sai phân bậc d
MA(q) là mô hình trung bình trượt bậc q
Lựa chọn phương pháp dự báo
Chọn chuỗi SI/View/Descriptive Statistics & Test/ Equality Test by
Classification/Series/Month/Test equality of: Median/ OK
Qua các bước trên, ta thu được kết quả: p-value = 0,0077 < 0,05 Vì vậy, ta bác bỏ giả thuyết H ở mức ý nghĩa 5%, hay chuỗi có yếu tố mùa vụ.0