Nghiên cứu sử dụng số liệu thống kê về năng suất lúa từ 1995 – 2018 và sử dụng phần mềm Excel 2010 để nhập số liệu và Eview 10.0 SPSS 16.0 để chạy mô hình nhằm xây dựng mô hình dự báo ARIMA thích hợp cho dự báo sản lượng lúa ở Thừa Thiên Huế.
TẠP CHÍ KHOA HỌC & CƠNG NGHỆ NƠNG NGHIỆP ISSN 2588-1256 Tập 4(2)-2020:1915-1921 ỨNG DỤNG MƠ HÌNH ARIMA DỰ BÁO SẢN LƯỢNG LÚA TỈNH THỪA THIÊN HUẾ ĐẾN NĂM 2025 Phạm Thị Thảo Hiền*, Nguyễn Ngọc Ánh, Tôn Nữ Tuyết Trinh, Nguyễn Đức Hồng Tr ng i học N ng L m i học Hu *Tác giả liên hệ: phamthithaohien@huaf.edu.vn Nhận bài: 18/11/2019 Hoàn thành phản biện: 03/03/2020 Chấp nhận bài: 19/06/2020 TÓM TẮT Nghiên cứu sử dụng số liệu thống kê suất lúa từ 1995 – 2018 sử dụng phần mềm Excel 2010 để nhập số liệu Eview 10.0 SPSS 16.0 để ch y m hình nhằm x y dựng m hình dự báo ARIMA thích hợp cho dự báo sản l ợng lúa Thừa Thiên Hu Sử dụng tiêu chuẩn th ng tin BIC (Bayesian Information Criterion) để tìm m hình phù hợp k t cho thấy: m hình ARIMA (1 0) thích hợp để giải thích bi n động sản l ợng lúa tỉnh Thừa Thiên Hu giai đo n đ a dự báo sản l ợng lúa tỉnh Thừa Thiên Hu năm 2019 đ n 2025 Từ khóa: ARIMA, Dự báo Sản l ợng lúa APPLICATION OF ARIMA MODEL TO FORECAST THUA THIEN HUE’S PADDY OUTPUT Pham Thi Thao Hien, Nguyen Ngoc Anh, Ton Nu Tuyet Trinh, Nguyen Duc Hong University of Agriculture and Forestry, Hue University ABTRACT In this paper, the statistics on paddy output from 1995 to 2018 were used to build an ARIMA model aims to forecast Thua Thien Hue province’s paddy output in the coming years Using Bayesian Information Criterion (BIC) as the goodness of fit measure, the results showed that ARIMA (1, 1, 0) was the best model to explain the fluctuation of paddy output in above period and possible to make good prediction on Thua Thien Hue province’s paddy output from 2019 to 2025 Keywords: ARIMA, Forecast, Paddy output MỞ ĐẦU Lúa c y l ơng thực đ ợc canh tác kh ng n ớc ch u Á mà cịn đ ợc trồng nhiều nơi tồn th giới Ngày với gia tăng nhanh d n số làm cho tình hình an ninh l ơng thực bị ảnh h ởng ể đảm bảo nhu cầu l ơng thực cho ng i n ng cao suất c y trồng đặc biệt suất c y lúa đ ợc coi nh biện pháp để giải quy t vấn đề Dự báo sản l ợng lúa việc cần thi t cho việc phát triển ngành kinh t n ng nghiệp n ớc ta nói chung Thừa Thiên Hu nói riêng Dự http://tapchi.huaf.edu.vn/ đốn đ ợc sản l ợng lúa tăng giảm làm sở ho ch định sách n ng nghiệp sách xã hội khác Thừa Thiên Hu có tổng diện tích đất n ng nghiệp gần 412.000 có gần 70.000 dành cho trồng lúa hoa màu Năng suất lúa bình qu n đ t khoảng 55 t /ha Tuy nhiên suất lúa có khác biệt lớn vùng y u tố giống kỹ thuật canh tác Với tác động bi n đổi khí hậu kh ng làm giảm suất c y trồng mà giảm diện tích lúa vùng ven biển Việc dự báo sản l ợng lúa gặp nhiều khó khăn kh ng xác 1915 HUAF JOURNAL OF AGRICULTURAL SCIENCE & TECHNOLOGY Hiện có nhiều nghiên cứu thực nghiệm dự báo sản l ợng lúa đ ợc ti n hành nhiều nơi th giới (Box Jenkins, 1970; Sakamoto cs., 2015; Ramakrishna Vijaya 2017) Việc ứng dụng c ng nghệ GIS để dự báo suất sản l ợng lúa ồng S ng Hồng đ ợc ti n hành (D ơng Văn Khảm, 2006; Nguyễn Thị Hà 2008) Tuy nhiên với c ng nghệ cần nhiều số liệu khí t ợng số liệu suất sản l ợng c y trồng qua năm Võ Văn Tài (2012) sử dụng m hình tốn học khác hồi quy chuỗi th i gian ARIMA để dự báo sản l ợng lúa Việt Nam M hình ARIMA đ a k t dự báo phù hợp với sản xuất lúa Tuy nhiên với vùng khác bi n động suất lúa hồn tồn khác Xuất phát từ thực t chúng t i sử dụng ph ơng pháp Box-Jenkins để x y dựng m hình ARIMA (Autoregressive Integrated Moving Average) để dự báo bi n động sản l ợng lúa tỉnh Thừa Thiên Hu Từ làm sở đề x y dựng sách n ng nghiệp t i địa ph ơng PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Thu thập xử lý số liệu Số liệu phục vụ cho nghiên cứu đ ợc tổng hợp từ báo cáo t i trang th ng tin điện tử Tổng cục Thống kê Việt Nam (GSO) Cụ thể nghiên cứu thu thập số liệu sản l ợng lúa tỉnh Thừa Thiên Hu từ năm 1995 đ n năm 2018 Sau sử dụng phần mềm EXCEL 2013 để nhập số liệu Eview 10.0 SPSS 16.0 để ch y m hình 2.1 Các bước thực Box Jenkins (1970) lần giới thiệu m hình ARIMA (autoregressive integrated moving average) ph n tích chuỗi th i gian đ ợc hiểu ph ơng pháp Box-Jenkins M hình tự t ơng quan tích 1916 Vol 4(2)-2020: 1917-1923 ISSN 2588-1256 hợp với trung bình tr ợt ARIMA (p d q) có ph ơng trình tổng quát nh sau: p B 1 B yt q B ut d Trong p B 1 B p B p trình tự hồi quy bậc p ; q B 1 B q Bq trình trung bình tr ợt bậc q; 1 B d yt sai ph n bậc thứ d chuỗi quan sát yt ; B toán tử lùi : Byt yt 1 , B m yt yt m , yt yt 1 1 B yt ; ut nhiễu trắng ; Ph ơng pháp Box-Jenkins gồm bốn b ớc: Bước 1: Nhận dạng mơ hình Nhận d ng m hình ARIMA (p d q) thích hợp việc tìm giá trị thích hợp p d q (với d bậc sai ph n chuỗi liệu th i gian đ ợc khảo sát p bậc tự hồi quy q bậc trung bình tr ợt) Các giá trị đ ợc xác định dựa vào biểu đồ tự t ơng quan (ACF) biểu đồ tự t ơng quan riêng phần (PACF) Trong việc lựa chọn m hình AR(p) phụ thuộc vào biểu đồ PACF n u có giá trị cao t i độ trễ … p giảm đột ngột sau đồng th i d ng hàm ACF tắt lịm dần T ơng tự việc lựa chọn m hình MA(q) dựa vào biểu đồ ACF n u có giá trị cao t i độ trễ … q va giảm m nh sau q đồng th i d ng hàm PACF tắt lịm dần Bước 2: Ước lượng thơng số mơ hình ARIMA (p, d, q) Ti n hành ớc l ợng tham số cho m hình có khả phù hợp đ ợc nhận d ng Ở đ y m hình có khả phù hợp đ ợc nhận d ng M hình có hệ số xác định R tiêu chuẩn th ng tin BIC (Bayesian Information Criterion) sai số bình ph ơng trung bình RMSE Ph m Thị Thảo Hiền cs TẠP CHÍ KHOA HỌC & CƠNG NGHỆ NÔNG NGHIỆP (Root mean square error) nhỏ đ ợc coi m hình phù hợp Bên c nh để đánh giá độ tin cậy m hình dự báo nghiên cứu sử dụng số đánh giá độ xác m hình dự báo MAPE (Mean Absolute Percent Error) MAPE lớn 50% dự báo kh ng xác 20% - 50% hợp lệ 10%-20% dự báo tốt d ới 10% dự báo hoàn hảo Bước 3: Kiểm tra mơ hình M hình ớc l ợng sau phải đ ợc kiểm tra l i để đảm bảo tính đ i diện cho chuỗi liệu quan sát Việc đ ợc thực dãy giá trị sai số m hình nhằm xác định xem chúng có phải ISSN 2588-1256 Tập 4(2)-2020:1915-1921 sai số ngẫu nhiên trắng (white noise) hay kh ng Ở đ y biểu đồ ACF phần d cho phép kiểm tra tiêu chuẩn Ngoài kiểm định Breusch-Godfrey (BG) ARCH đ ợc thực phần d nhằm kiểm tra t ợng tự t ơng quan ph ơng sai số thay đổi Bước 4: Dự báo Dựa ph ơng trình m hình ARIMA ta ti n hành xác định khoảng tin cậy dự báo KẾT QUẢ NGHIÊN CỨU 3.1 Tổng quan liệu nghiên cứu Hình Sản l ợng lúa tỉnh Thừa Thiên Hu từ năm 2005 đ n năm 2018 Biểu đồ cho thấy tăng tr ởng liên tục sản l ợng lúa qua năm Bảng Thống kê m tả chuỗi sản l ợng lúa tỉnh Thừa Thiên Hu Sản l ợng lúa Observations 24 Mean 255,9708333 Median 256,1 Maximum 334,4 Minimum 166,6 Std.Dev 51,83534533 Skewness -0,071807645 Kurtosis -1,310794452 Shapiro – Wilk 0,943 P-valued 0,189 http://tapchi.huaf.edu.vn/ 1917 HUAF JOURNAL OF AGRICULTURAL SCIENCE & TECHNOLOGY Chuỗi liệu sản l ợng lúa có ph n phối chuẩn theo kiểm định Shapiro – Wilk mức ý nghĩa 5% (vì p-value > 0,05) Ngoài từ giá trị Skewness, Kurtosis chứng tỏ chuỗi bi n động kh ng nhiều có xu h ớng lệch trái 3.2 Mơ hình dự báo sản lượng lúa 3.2.1 Kiểm tra tính dừng chuỗi liệu sản lượng lúa Vol 4(2)-2020: 1917-1923 ISSN 2588-1256 Chuỗi liệu sử dụng ARIMA đ ợc giả định chuỗi dừng ta cần phải xem xét chuỗi liệu nghiên cứu có dừng hay ch a Ta ti n hành kiểm tra tính dừng th ng qua kiểm định phổ bi n: Augmented Dicjkey-Fuller (ADF) Perron-Phillips (PP) đ ợc gọi kiểm định nghiệm đơn vị (unit root test) Bảng K t kiểm tra ADF PP chuỗi liệu sản l ợng lúa Kiểm định Giá trị t P-value ADF -0,916870 0,7641 PP -0,885750 0,7742 So sánh p-value kiểm định ADF PP với 05 ta chấp nhận giả thi t: H : chuỗi liệu có nghiệm đơn vị tức chuỗi khơng dừng 3.2.2 Khắc phục tính dừng chuỗi số liệu Lấy sai ph n cấp chuỗi số liệu sản l ợng ta đ ợc chuỗi dlsanluong ti n hành kiểm tra tính dừng chuỗi Chuỗi số liệu sau lấy sai ph n có đồ thị nh sau: 40 30 20 10 -10 -20 2000 2005 2010 2015 DSANLUONG Hình Chuỗi dừng sau lấy sai ph n bậc Sau ta ti n hành kiểm tra tính dừng th ng qua kiểm định phổ bi n: Augmented Dicjkey-Fuller (ADF) Perron-Phillips (PP) cho chuỗi số dlsanluong Bảng K t kiểm tra ADF PP chuỗi số dlsanluong Kiểm định ADF PP Giá trị t -7,679048 -8,331381 Từ Bảng ta thấy chuỗi sai ph n bậc sản l ợng lúa tỉnh Thừa Thiên Hu chuỗi dừng 3.2.3 Xây dựng mơ hình ARIMA cho sản lượng lúa tỉnh Thừa Thiên Huế 1918 P-value 0,0000 0,0000 ể x y dựng m hình ARIMA chúng t i sử dụng chuỗi liệu 24 quan sát từ 1995 đ n năm 2018 Ph m Thị Thảo Hiền cs TẠP CHÍ KHOA HỌC & CƠNG NGHỆ NÔNG NGHIỆP Bước 1: Nhận dạng ( xác định giá trị p, d, q) Chuỗi liệu dừng sai ph n bậc ta có d = ISSN 2588-1256 Tập 4(2)-2020:1915-1921 Các giá trị p q đ ợc xác định dựa vào bảng hệ số tự t ơng quan (ACF) bảng hệ số tự t ơng quan riêng phần (PACF) Bảng Các hệ số tự t ơng quan ACF hệ số tự t ơng quan riêng PACF sai ph n bậc chuỗi sản l ợng lúa tỉnh Thừa Thiên Hu Autocorrelation Partial Correlation AC PAC Q-Stat Prob -0,469 -0,469 5,7551 0,016 -0,028 -0,318 5,7763 0,056 0,014 -0,217 5,7823 0,123 -0,065 -0,254 5,9118 0,206 0,137 -0,054 6,5107 0,260 -0,200 -0,260 7,8582 0,249 0,163 -0,098 8,8155 0,266 0,096 0,146 9,1710 0,328 -0,227 -0,065 11,281 0,257 10 -0,014 -0,244 11,290 0,335 11 0,044 -0,217 11,383 0,412 12 0,119 -0,071 12,124 0,436 Bước 2: Ước lượng mơ hình Từ Bảng ta sử dụng hệ số tự t ơng quan ACF để chọn bậc q cho MA hệ số tự t ơng quan riêng PACF để chọn bậc p cho AR Ta xét m hình sau: ARIMA (1, 1, 1), ARIMA (1, 1, 0), ARIMA (2, 1, 0), ARIMA (2, 1, 1), ARIMA (3, 1, 0), ARIMA (3, 1, 1), ARIMA (4, 1, 0), ARIMA (4, 1, 1) Các m hình nhận d ng đ ợc kiểm tra l i tính phù hợp dựa th ng số kiểm định: hệ số xác định R , tiêu chuẩn th ng tin BIC (Bayesian Information Criterion) sai số bình ph ơng trung bình RMSE số đánh giá độ xác m hình dự báo MAPE (Mean Absolute Percent Error) Bảng K t thống kê m t số tiêu chuẩn m hình ARIMA thử nghiệm M hình BIC RMSE MAPE R2 ARIMA (1,1,1) 0,960 5,277 10,651 3,370* ARIMA (1,1,0) 0,946 5,196* 11,726 3,902 ARIMA (2,1,0) 0,952 5,440 11,294 3,674 ARIMA (2,1,1) 0,961* 5,242 10,467* 3,450 ARIMA (3,1,0) 0,954 5,400 11,328 3,577 ARIMA (3,1,1) 0,961* 5,432 10,754 3,463 ARIMA (4,1,0) 0,959 5,485 11,042 3,458 ARIMA (4,1,1) 0,961* 5,623 11,050 3,507 *giá trị tốt dựa theo tiêu chuẩn lựa chọn Từ Bảng ta thấy m hình ARIMA (2 1) m hình thỏa mãn nhiều tiêu chuẩn sử dụng nh ng sau ti n hành x y dựng m hình thu đ ợc k t quả: m hình ARIMA (1 0) có ớc l ợng tham số có ý nghĩa thống kê (với p-value < 05) tiêu chuẩn BIC nhỏ Do m hình ARIMA (1 http://tapchi.huaf.edu.vn/ 0) m hình đ ợc sử dụng cho việc ớc l ợng ti p theo Bước 3: Kiểm tra mơ hình M hình sau đ ợc kiểm tra mức độ phù hợp với chuỗi liệu nghiên cứu cách ph n tích phần d 1919 HUAF JOURNAL OF AGRICULTURAL SCIENCE & TECHNOLOGY ISSN 2588-1256 Vol 4(2)-2020: 1917-1923 Bảng Các hệ số tự t ơng quan ACF hệ số tự t ơng quan riêng PACF bình ph ơng phần d m hình ARIMA(1 0) Autocorrelation Partial Correlation AC PAC Q-Stat Prob -0,155 -0,155 0,6288 0,428 -0,315 -0,347 3,3434 0,188 -0,042 -0,188 3,3942 0,335 -0,001 -0,198 3,3943 0,494 0,062 -0,081 3,5183 0,621 -0,133 -0,264 4,1210 0,660 0,187 0,088 5,3740 0,614 0,108 0,073 5,8189 0,668 -0,300 -0,213 9,5212 0,391 10 -0,135 -0,254 10,326 0,412 11 0,132 -0,149 11,162 0,430 12 0,260 0,069 14,703 0,258 ACF phần d Bảng cho thấy sai số ngẫu nhiên trắng Hơn k t kiểm định Breusch-Godfrey cho thấy kh ng tồn t i t ợng tự t ơng quan đồng th i kiểm định ARCH kh ng có t ợng ph ơng sai sai số thay đổi Bảng K t kiểm định Breusch-Godfrey kiểm định ARCH Kiểm định Thống kê F P-value Breusch-Godfrey 3,513267 0,076340 ARCH 0,372506 0,548873 K t kiểm tra cho thấy m hình ARIMA (1 0) thích hợp dự báo Bước 4: Dự báo Những dự báo sản l ợng lúa tỉnh Thừa Thiên Hu dựa m hình ARIMA đ ợc trình bày d ới bảng sau Bảng K t dự báo sản l ợng lúa tỉnh Thừa Thiên Hu từ năm 2019 đ n năm 2025 với độ tin cậy 95% V: nghìn Năm 2019 2020 2021 2022 2023 2024 2025 Giá trị dự báo Giới h n cận Giới h n cận d ới 341,6 365,8 317,3 348,7 376,1 321,3 355,8 388,7 322,9 362,9 399,3 326,5 370,0 410,1 329,9 377,1 420,4 333,8 384,2 430,6 337,9 Hình Biểu đồ dự báo sản l ợng lúa ph m vi mẫu nghiên cứu 1920 Ph m Thị Thảo Hiền cs TẠP CHÍ KHOA HỌC & CƠNG NGHỆ NƠNG NGHIỆP Từ Bảng ta nhận thấy sản l ợng lúa tỉnh Thừa Thiên Hu dự báo có xu h ớng tăng phù hợp với tình hình tỉnh Thừa Thiên Hu tái cấu n ng nghiệp theo h ớng n ng cao giá trị gia tăng phát triển bền vững ứng dụng c ng nghệ cao KẾT LUẬN Ứng dụng m hình arima dự báo sản l ợng lúa tỉnh Thừa Thiên Hu đ n năm 2025 cho thấy m hình ARIMA (2 1) m hình thỏa mãn nhiều tiêu chuẩn sử dụng nh ng sau ti n hành x y dựng m hình thu đ ợc k t m hình ARIMA (1 0) có ớc l ợng tham số có ý nghĩa thống kê (với p-value < 05) tiêu chuẩn BIC nhỏ M hình ARIMA (1 0) m hình phù hợp m hình thử nghiệm dùng để dự báo sản l ợng lúa tỉnh Thừa Thiên Hu K t từ m hình ARIMA (1 0) cung cấp th ng tin để làm sách việc tìm ki m giải pháp thích hợp để làm tăng suất lúa định h ớng sản xuất lúa t ơng lai gần TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt Võ Văn Tài (2012) Dự báo sản l ợng lúa Việt Nam m hình tốn học Tạp chí http://tapchi.huaf.edu.vn/ ISSN 2588-1256 Tập 4(2)-2020:1915-1921 Khoa học, Trường Đại học Cần Thơ, 23b, 125-134 Nguyễn Thị Hà (2008) Nghiên cứu dự báo suất ngô, đậu tương, lạc xây dựng quy trình giám sát khí tượng nơng nghiệp cho trồng (lúa, ngơ, lạc, đậu tương) thông tin mặt đất Việt Nam, Báo cáo tổng k t đề tài nghiên cứu khoa học c ng nghệ cấp bộ, Viện Khoa học Khí t ợng Thuỷ văn M i tr ng Hà Nội D ơng Văn Khảm (2006) Nghiên cứu áp dụng công nghệ viễn thám (RS) hệ thống thơng tin địa lý (GIS) khí tượng thủy văn Báo cáo tổng k t đề tài nghiên cứu khoa học c ng nghệ cấp bộ, Viện Khoa học Khí t ợng Thuỷ văn M i tr ng Hà Nội Tài liệu tiếng nước Box, G E P., & Jenkins, G (1970) Time Series Analysis, Forecasting and Control San Francisco: Holden-Day Ramakrishna, G., Vijaya, K R (2017) ARIMA model for forecasting of rice production in India by Sas International Journal of Applied Mathematics & Statistical Sciences (IJAMSS), 6(4), 67-72 Sakamoto, T., Masayuki Yokozawa, Hitoshi Toritani, Michio Shibayama, Naoki Ishitsuka, Hiroyuki Ohno (2005) A crop phenology detection method using timeseries MODIS data Remote Sensing of Environment, 96, 366-374 1921 ... thấy m hình ARIMA (1 0) thích hợp dự báo Bước 4: Dự báo Những dự báo sản l ợng lúa tỉnh Thừa Thiên Hu dựa m hình ARIMA đ ợc trình bày d ới bảng sau Bảng K t dự báo sản l ợng lúa tỉnh Thừa Thiên. .. ph n bậc sản l ợng lúa tỉnh Thừa Thiên Hu chuỗi dừng 3.2.3 Xây dựng mơ hình ARIMA cho sản lượng lúa tỉnh Thừa Thiên Huế 1918 P-value 0,0000 0,0000 ể x y dựng m hình ARIMA chúng t i sử dụng chuỗi... tình hình tỉnh Thừa Thiên Hu tái cấu n ng nghiệp theo h ớng n ng cao giá trị gia tăng phát triển bền vững ứng dụng c ng nghệ cao KẾT LUẬN Ứng dụng m hình arima dự báo sản l ợng lúa tỉnh Thừa Thiên