Phân khoảng nhằm phân chia dữ liệu chuỗi thời gian trong tập nền U thành k
khoảng có độ dài bằng nhau hoặc khác nhau. Đây là một trong những bước quan trọng và ảnh hưởng rất lớn đến hiệu quả dự báo của mô hình chuỗi thời gian mờ. Có rất nhiều phương pháp phân khoảng khác nhau được đề xuất và sử dụng để phân tập dữ liệu chuỗi thời gian thành k khoảng ban đầu hoặc hiệu chỉnh các độ dài khoảng nhằm đạt được các khoảng tối ưu trong mô hình dự báo chuỗi thời gian mờ. Một trong các phương pháp phân khoảng đơn giản nhất là phân dữ liệu chuỗi thời gian thành k
khoảng có độ dài bằng nhau, hay gọi là phân khoảng theo lưới (Grid) [8-10, 73]. Phương pháp này được sử dụng đầu tiên bởi Song và Chissom [8, 9]. Sau đó, Chen [10] cũng sử dụng phương pháp này để chia tập nền U thành k khoảng có độ dài bằng nhau 𝑢1, 𝑢2,…,𝑢𝑘 với trung điểm tương ứng là 𝑚1, 𝑚2,…,𝑚𝑘. Nhận thấy phương pháp phân khoảng có độ dài bằng nhau không cho kết quả dự báo tốt, nhiều tác giả đã đề xuất những phương pháp phân khoảng có độ dài khác nhau. Cheng và cộng sự [55] sử dụng kỹ thuật entropy để xác định điểm giữa tốt nhất cho các tập mờ hình thang tương ứng với k khoảng cố định ban đầu. Các kỹ thuật phân cụm cũng được áp dụng để phân khoảng có độ dài khác nhau như Fuzzy C-Means [28], phân cụm tự động [17]. Bên cạnh đó, các phương pháp tính toán mềm cũng được thảo luận và đề xuất để tìm độ dài khoảng phù hợp như: Tối ưu bầy đàn được sử dụng trong các nghiên cứu [18, 32, 33, 74], thuật toán di truyền trong các công trình [16], kỹ thuật tôi luyện [34] và thuật toán tìm kiếm hòa âm [75]. Hình 2.5 minh họa cách phân khoảng sử dụng các phương pháp khác nhau trên cùng tập dữ liệu.
Hình 2.5: Minh hoạ các phương pháp phân khoảng khác nhau trên cùng tập mẫu.