Ứng dụng thuật toán ANFIS trong dự báo dữ liệu chuỗi thời gian

MỤC LỤC

THUẬT TOÁN ANFIS VÀ BÀI TOÁN DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN

BÀI TOÁN DỰ BÁO

Dự báo hỗ trợ việc đề xuất chính sách: Dự báo cung cấp thông tin đầu vào cho các nhà hoạch định chính sách trong việc đề xuất các chính sách phát triển kinh tế và xã hội. Loại dự báo này đóng vai trò quan trọng trong việc phát triển dự án mới, định hình chiến lƣợc cho các cơ sở mới, chọn lựa công nghệ và thiết bị mới, mở rộng hoạt động kinh doanh hiện tại hoặc thành lập doanh nghiệp mới. Đây là loại dự báo quan trọng đối với các ngành công nghiệp có tính kỹ thuật cao nhƣ năng lƣợng nguyên tử, hàng không vũ trụ, công nghệ dầu lửa, máy tính, nghiên cứu không gian và điện tử.

Phương pháp định tính, hay còn được biết đến như phương pháp dự báo chuyên gia (phương pháp Delphi), là một phương pháp thu thập và xử lý đánh giá dự báo bằng cách tập hợp ý kiến từ các chuyên gia giỏi trong một lĩnh vực hẹp của khoa học, kỹ thuật hoặc sản xuất. Nhiệm vụ của phương pháp này là đưa ra những dự báo về tương lai phát triển của khoa học, kỹ thuật hoặc sản xuất dựa trên việc xử lý các đánh giá dự báo của các chuyên gia. - Trong các trường hợp dự báo trung hạn và dài hạn của đôi tượng dự báo phản ánh sự ảnh hưởng của nhiều nhân tố khó lượng hoá, đặc biệt là các nhân tố tâm lý xã hội hoặc tiến bộ khoa học kỹ thuật.

Quá trình áp dụng phương pháp chuyên gia thường đi qua ba giai đoạn lớn: lựa chọn chuyên gia, trƣng cầu ý kiến của chuyên gia, và thu thập, xử lý các đánh giá dự báo. Những phương pháp này tập trung vào việc xác định mối quan hệ giữa các biến độc lập và biến phụ thuộc, từ đó dự báo giá trị của biến phụ thuộc dựa trên các giá trị của các biến độc lập.

THUẬT TOÁN ANFIS

Ngoài việc sử dụng các luật chuyên gia, việc trích xuất luật từ dữ liệu cũng là một hình thức mô hình hóa hệ thống điều khiển tự động, đƣợc áp dụng trong các lĩnh vực nhƣ Nhận dạng, khai thác dữ liệu, v.v. Bên cạnh những ƣu điểm của hệ điều khiển mờ, cũng tồn tại một số hạn chế, nhƣ việc thiết kế và tối ƣu hóa hệ logic mờ đòi hỏi có kinh nghiệm về điều khiển đối tượng. Ngoài ra, việc xác định các tham số nhƣ số lƣợng và hình dạng của các tập mờ, vị trí của chúng, cũng nhƣ cách kết hợp chúng và trọng số của mỗi luật điều khiển cũng là những thách thức đối với người thiết kế.

Đối với những câu hỏi như số lượng và hình dạng của các tập mờ, cũng nhƣ cách kết hợp chúng và trọng số của mỗi luật điều khiển, việc tìm lời giải có thể gặp khó khăn nếu chỉ dừng lại ở tƣ duy logic mờ. Với sự hỗ trợ của các nhãn ngôn ngữ và các hàm thành viên, một luật mờ có thể dễ dàng biểu diễn qui luật điều khiển của con người và được mở rộng để áp dụng trong nhiều ứng dụng khác nhau.  Đơn vị thực hiện quyết định: Đây là bước thực hiện phép toán suy luận trên các luật, dựa trên cơ sở luật và cơ sở dữ liệu, để tạo ra kết quả dự báo hoặc quyết định.

 Suy luận mờ: Là quá trình chuyển đổi dữ liệu thô đầu vào thành các mức độ kết nối với biến ngôn ngữ dựa trên các quy tắc và hàm thành viên được xác định trước.  Kết hợp trọng số: Sử dụng toán tử chuẩn T-norm, thường là phép nhân hoặc phép lấy tối tiểu, để kết hợp các giá trị thành viên của các phần giả thiết và thu đƣợc trọng số của từng luật.

Trong loại này, dữ liệu đầu ra đƣợc tính bằng cách lấy trung bình trọng số của các giá trị đầu ra mờ từ mỗi luật, dựa trên ngƣỡng kích hoạt

Thông thường, trong hệ suy luận mờ, cơ sở luật và cơ sở dữ liệu được xây dựng dựa trên tri thức chuyên gia.  Mờ hóa: Đây là quá trình so sánh giá trị đầu vào với hàm thành viên của các tập ngữ nghĩa để tạo ra giá trị thành viên của các tập này. Bước này mở rộng dữ liệu đầu vào thành các giá trị mờ hoặc đo độ tương tự dựa trên mức độ tương đồng với các tập mờ đã được xác định trước.

Quá trình này giúp đánh giá mức độ quan trọng của mỗi luật trong quá trình suy luận.  Tạo kết luận: Quá trình này đƣa ra kết luận cho mỗi luật dựa trên trọng số của luật và các quy tắc logic mờ đã được định nghĩa trước đó trong cơ sở luật.  Giải mờ: Tổng hợp các giá trị kết luận để tạo ra kết quả cuối cùng, có thể là kết quả rừ ràng hoặc mờ tựy thuộc vào quỏ trỡnh lập luận trước đú.

Quỏ trỡnh này giỳp làm rừ và hiểu kết quả suy luận từ hệ suy diễn mờ.

Trong loại này, sử dụng các luật mờ theo mô hình Takagi và Sugeno. Dữ liệu đầu ra từ mỗi luật là một tổ hợp tuyến tính của các dữ liệu

DỮ LIỆU CHUỖI THỜI GIAN

Thực chất của phương pháp này là việc áp dụng các quy luật phát triển của đối tượng dự báo từ quá khứ và hiện tại sang tương lai, với giả định rằng các quy luật này vẫn còn giữ hiệu lực trong thời gian tới. Tính mùa vụ: Đại diện cho sự biến động của dữ liệu theo thời gian với các chu kỳ lặp lại đều đặn, do ảnh hưởng của môi trường xung quanh như tập quán sinh hoạt, hoạt động kinh tế xã hội. Ban đầu, để giải quyết bài toán dự báo chuỗi thời gian, phương pháp phổ biến là sử dụng các phương pháp làm trơn và ngoại suy trên toàn bộ miền thời gian, trong đó thực hiện làm khớp toàn cục (global fit) trên chuỗi dữ liệu.

Nhờ vào các tiến bộ trong lĩnh vực học máy, các mô hình phi tuyến dần đƣợc nghiên cứu và áp dụng cho các chuỗi thời gian phi tuyến tính, thậm chí với mức độ phức tạp cao. Điều này giúp tăng cường khả năng dự báo và phân tích các chuỗi thời gian không tuân theo quy luật tuyến tính, mở ra những tiềm năng mới trong việc nắm bắt và dự đoán xu hướng phức tạp của dữ liệu thời gian. Phương pháp trung bình động có trọng số là một phương pháp bình quân nhưng có tính đến ảnh hưởng của từng giai đoạn khác nhau đối với nhu cầu, thông qua việc sử dụng các trọng số.

Thực tế cho thấy, việc điều chỉnh các hệ số của mô hình dự báo thường xuyên có thể cải thiện độ chính xác của dự báo, làm cho phương pháp trung bình động có trọng số mang lại kết quả dự báo tốt hơn so với phương pháp trung bình động thông thường. - Giới hạn về dữ liệu quá khứ sử dụng trong dự báo: Để dự báo nhu cầu tại một thời điểm cụ thể t, các phương pháp này thường chỉ sử dụng n mức nhu cầu gần nhất từ kỳ t−1 trở về trước.

Hình 2.5 Phân loại các phương pháp dự báo chuỗi thời gian
Hình 2.5 Phân loại các phương pháp dự báo chuỗi thời gian

ỨNG DỤNG THUẬT TOÁN ANFIS VÀO BÀI TOÁN DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN

    Mục tiêu của mô hình dự báo là tạo ra dự đoán về LMV tại thời điểm t để giúp đưa ra các quyết định liên quan đến quản lý tài nguyên nước, kế hoạch tưới, và các hoạt động nông nghiệp khác. Dự đoán LMV chính xác có thể cung cấp thông tin quan trọng để đối phó với những thách thức liên quan đến biến đổi khí hậu và thời tiết, nhƣ hạn hán và lũ lụt, cũng nhƣ giúp tối ƣu hóa sử dụng tài nguyên nước và tối đa hóa sản xuất nông nghiệp. Sự lựa chọn chính xác của biến đầu ra LMV và hiệu suất của mô hình dự báo sẽ quyết định khả năng cung cấp thông tin dự báo hữu ích và đáng tin cậy cho các quyết định thực tế, đồng thời đóng góp vào sự phát triển và hiệu quả của các ngành liên quan.

    Tính chính xác của dự báo: Các biến đầu vào đƣợc chọn phải có mối quan hệ và tương tác thích hợp với biến đầu ra (LMV) để mô hình có khả năng dự đoán chính xác. Mô hình M1 là mô hình đơn giản nhất trong loạt mô hình, sử dụng chỉ hai biến đầu vào: lượng mưa trong một năm trước thời điểm dự báo ( ( )) và lượng mưa hai năm trước thời điểm dự báo ( ( )). Đây là một phép đo thống kê đƣợc sử dụng rộng rãi để đánh giá độ chệch giữa giá trị dự đoán và giá trị thực tế trong các mô hình dự đoán, đặc biệt là trong lĩnh vực dự báo và học máy.

    Nếu hệ số tương quan gần 1 hoặc -1, có thể ngụ ý rằng mô hình dự báo đang bắt chước mối quan hệ tuyến tính giữa biến dự đoán và biến thực tế trong chuỗi thời gian. Mô hình M3 có RMSE và CORR tốt trên tập đào tạo, nhƣng kết quả thử nghiệm không tốt bằng, cho thấy mô hình có thể không tổng quát hoá tốt cho dữ liệu mới.

    Bảng 3.1 Kết quả chỉ số đánh giá lƣợng mƣa vụ 1 tháng
    Bảng 3.1 Kết quả chỉ số đánh giá lƣợng mƣa vụ 1 tháng