Mô hình dự báo chuỗi thời gian mờ hai nhân tố (FTS-2NT)

Một phần của tài liệu Luận án một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ (Trang 58 - 64)

Trong dự báo chuỗi thời gian mờ, nhân tố dự báo có thể bị ảnh hưởng bởi một hoặc nhiều nhân tố khác, các nhân tố này phải có mối quan hệ tiềm năng và được kết hợp với nhau trong mô hình. Ví dụ: trong dự báo thời tiết hàng ngày của một vùng nào đó, nhân tố “nhiệt độ trung bình” có thể bị ảnh hưởng bởi các nhân tố khác như “mật độ của mây” hay “độ ẩm”, hoặc trong dự báo thị trường chứng khoán các nhân tố có quan hệ tiềm năng như “Open”, “High”, “Low” và “Close” cũng được kết hợp, v.v. Để cải thiện khả năng dự báo của mô hình một nhân tố, mục này luận án trình bày một mô hình dự báo mới dựa trên chuỗi thời gian mờ hai nhân tố bằng việc thêm nhân tố thứ hai để tham gia dự báo cho nhân tố chính, được đặt tên là FTS-2NT. Các bước của mô hình dự báo chuỗi thời gian mờ hai nhân tố được thể hiện trên Hình 2.4:

Để minh họa từng bước thực hiện dự báo của mô hình FTS-2NT, toàn bộ dữ liệu về nhiệt độ trung bình hàng ngày từ 01/06/1996 đến 30/09/1996 tại Đài Bắc Đài Loan (Taiwan Central Weather Bureau) trong tài liệu [54] được sử dụng. Trong đó, “nhiệt độ trung bình” đặt là nhân tố chính-𝐹𝐴(t) và “mật độ của mây” gọi là nhân tố thứ hai- 𝐹𝐵(t)) và được thể hiện trong Bảng 2.7. Các bước chi tiết của mô hình dự báo

FTS-2NT được trình bày như sau:

Bảng 2.7: Dữ liệu lịch sử về nhiệt độ trung bình hàng ngày và mật độ của mây từ 01/06/1996 đến 30/09/1996 tại Đài Bắc, Đài Loan

Ngày/ Tháng(T)

Nhiệt độ trung bình (Average temperature)(unit 0C)

Mật độ của mây (Cloud density) (unit %) Ngày T6 T7 T8 T9 T6 T7 T8 T9 1 26.1 29.9 27.1 27.5 36 15 100 29 2 27.6 28.4 28.9 26.8 23 31 78 53 3 29 29.2 28.9 26.4 23 26 68 66 4 30.5 29.4 29.3 27.5 10 34 44 50 5 30 29.9 28.8 26.6 13 24 56 53 6 29.5 29.6 28.7 28.2 30 28 89 63 7 29.7 30.1 29 29.2 45 50 71 36 8 29.4 29.3 28.2 29 35 34 28 76 9 28.8 28.1 27 30.3 26 15 70 55 10 29.4 28.9 28.3 29.9 21 8 44 31 11 29.3 28.4 28.9 29.9 43 36 48 31 12 28.5 29.6 28.1 30.5 40 13 76 25 13 28.7 27.8 29.9 30.2 30 26 50 14 14 27.5 29.1 27.6 30.3 29 44 84 45 15 29.5 27.7 26.8 29.5 30 25 69 38 16 28.8 28.1 27.6 28.3 46 24 78 24 17 29 28.7 27.9 28.6 55 26 39 19 18 30.3 29.9 29 28.1 19 25 20 39 19 30.2 30.8 29.2 28.4 15 21 24 14 20 30.9 31.6 29.8 28.3 56 35 25 3 21 30.8 31.4 29.6 26.4 60 29 19 38 22 28.7 31.3 29.3 25.7 96 48 46 70 23 27.8 31.3 28 25 63 53 41 71 24 27.4 31.3 28.3 27 28 44 34 70 25 27.7 28.9 28.6 25.8 14 100 29 40 26 27.1 28 28.7 26.4 25 100 31 30 27 28.4 28.6 29 25.6 29 91 41 34 28 27.8 28 27.7 24.2 55 84 14 59

29 29 29.3 26.2 23.3 29 38 28 83

30 30.2 27.9 26 23.5 19 46 33 38

31 26.9 27.7 95 26

Bước 1- Xác định tập nền cho hai nhân tố là 𝑼𝐴 và 𝑽𝐵

Giả sử 𝑼𝐴 = [𝑢𝑚𝑖𝑛𝐴, 𝑢𝑚𝑎𝑥𝐴] = [𝐷𝑚𝑖𝑛𝐴− 𝑁1𝐴, 𝐷𝑚𝑎𝑥𝐴+ 𝑁2𝐴] và 𝑽𝐵 = [𝑣𝑚𝑖𝑛𝐴, 𝑣𝑚𝑎𝑥𝐴] = [𝐷𝑚𝑖𝑛𝐵− 𝑁1𝐵, 𝐷𝑚𝑎𝑥𝐵 + 𝑁2𝐵] là hai tập nền chứa các dữ liệu lịch sử về “nhiệt độ trung bình ” và dữ liệu lịch sử về “mật độ của mây”. Để tìm hai tập nền này, trước tiên cần tìm giá trị dữ liệu nhỏ nhất 𝐷𝑚𝑖𝑛𝐴 và giá trị dữ liệu lớn nhất 𝐷𝑚𝑎𝑥𝐴 của chuỗi nhân tố chính và tìm giá trị dữ liệu nhỏ nhất 𝐷𝑚𝑖𝑛𝐵 và giá trị dữ liệu lớn nhất 𝐷𝑚𝑎𝑥𝐵 của chuỗi nhân tố thứ hai. Trong đó các cặp số ( 𝑁1𝐴, 𝑁2𝐴 ) và (𝑁1𝐵, 𝑁2𝐵) là các số dương được chọn một cách phù hợp sao cho giá trị dự báo được bao trọn vẹn trong hai tập nền 𝑼𝐴 và 𝑽𝐵 tương ứng.

Quan sát dữ liệu lịch sử trong Bảng 2.7, ta thấy rằng giá trị của nhiệt độ nhỏ nhất 𝐷𝑚𝑖𝑛𝐴 = 23.3 0C và giá trị của nhiệt độ lớn nhất 𝐷𝑚𝑎𝑥𝐴 = 31.6 0C, chọn giá trị cho hai số dương là 𝑁1𝐴 = 0.3 và 𝑁2𝐴 = 0.4 sao cho các giá trị dự báo được bao trọn trong tập nền. Từ đây, có được tập nền cho nhân tố chính là 𝑼𝐴 = [𝐷𝑚𝑖𝑛𝐴− 𝑁1𝐴, 𝐷𝑚𝑎𝑥𝐴 + 𝑁2𝐴] = [23.0, 32.0]. Một cách tương tự, chúng ta cũng xác định được tập nền cho nhân tố thứ hai 𝑽𝐵 = [𝑣𝑚𝑖𝑛𝐵, 𝑣𝑚𝑎𝑥𝐵] = [0, 100].

Bước 2- Phân chia tập nền 𝑼𝐴 và 𝑽𝐵 thành các khoảng có độ dài bằng nhau.

Hai tập nền 𝑼𝐴𝑼𝐵 của mỗi nhân tố được chia thành p q khoảng với độ dài bằng nhau, tương ứng là LA LB. Khi đó, các khoảng của hai nhân tố lần lượt được xác định là Ui = (𝑢𝑚𝑖𝑛𝐴 + (𝑖 − 1) ∗ 𝐿𝐴, 𝑢𝑚𝑖𝑛𝐴 + 𝑖 ∗ 𝐿𝐴 ] và Vj = (𝑣𝑚𝑖𝑛𝐵 +(j- 1)*LB, 𝑣𝑚𝑖𝑛𝐵+ j *LB ], với (1 ≤ 𝑖 ≤ 𝑝, 1 ≤ 𝑗 ≤ 𝑞).

Không mất tính tổng quát và có thể so sánh được với các mô hình dự báo trước đây, trong mô hình này, tác giả chọn số khoảng ban đầu cho mỗi nhân tố giống như các công trình nghiên cứu [34, 40, 54] là p = 9 và q = 7. Khi đó, lần lượt ta thu được 9 khoảng cho nhân tố chính “nhiệt độ trung bình” là 𝑢1 = (23, 24], 𝑢2 = (24,25], …, 𝑢8 = (30,31], 𝑢9 = (31, 32] và 7 khoảng của nhân tố thứ 2 “mật độ của mây” là 𝑣1 = (0, 14.29], 𝑣2 = (14.29, 28.57], …, 𝑣6 = (71.43,85.71], 𝑣7 = (85.71,100.0].

Các bước tiếp theo của mô hình dự báo FTS-2NT đề xuất, tác giả chọn dữ liệu lịch sử trong tháng 6 từ ngày 01/06/1996 đến 30/06/1996 làm minh họa cho quá trình dự báo.

Bước 3- Xác định các tập mờ cho từng nhân tố 𝐹𝐴(𝑡)và 𝐹𝐵(𝑡)

Mỗi khoảng đạt được trong Bước 2 được gán một nhãn ngôn ngữ với ngữ nghĩa được biểu thị bởi các tập mờ. Đối với p khoảng chia từ tập nền của nhân tố chính, ta xác định được p tập mờ 𝐴𝑖 theo công thức (2.6) như sau:

𝐴𝑖 =𝑎𝑖1 𝑢1 +𝑎𝑖2 𝑢2 + ⋯ +𝑎𝑖𝑗 𝑢𝑗 + ⋯ +𝑎𝑖𝑝 𝑢𝑝 (2.6) 𝑎𝑖𝑗 = { 1 𝑗 = 𝑖 0.5 𝑖𝑓 𝑗 = 𝑖 − 1, 𝑗 = 𝑖 + 1 0 Trường hợp còn lại } (2.7) Trong đó, 𝑎𝑖𝑗 ∈ [0, 1] được biểu thị là cấp độ thuộc của khoảng 𝑢𝑗 vào tập mờ 𝐴𝑖 với (1 ≤ 𝑖 ≤ 𝑝, 1 ≤ 𝑗 ≤ 𝑝). Để tiện cho việc giải mờ đầu ra dự báo, tác giả sử dụng hàm thuộc tam giác với cấp độ thuộc nhận ba giá trị 0, 0.5, 1 theo công thức (2.7).

Một cách tương tự đối với q khoảng chia của nhân tố thứ hai, ta cũng xác định được q tập mờ 𝐵𝑖 được xác định giống như công thức (2.6) với cấp độ thuộc 𝑏𝑖𝑗 nhận ba giá trị là 0, 0.5, 1.

Bước 4- Mờ hóa tất cả dữ liệu của chuỗi thời gian hai nhân tố

Việc mờ hóa có thể được coi là một quá trình xác định mối liên hệ giữa các giá trị lịch sử của chuỗi thời gian hai nhân tố với các tập mờ được xác định trong Bước 3. Để mờ hóa tất cả các giá trị dữ liệu của chuỗi thời gian hai nhân tố, mỗi mẫu dữ liệu được gán bởi các tập mờ theo cấp độ thuộc cao nhất mà chúng thuộc vào khoảng này. Toàn bộ dữ liệu sẽ được mờ hóa thành các tập mờ 𝐴i và 𝐵i, tương ứng với từng nhân tố.

Ví dụ 2.4: Giả sử mờ hóa dữ liệu hai nhân tố ngày 01/06/1996, dữ liệu quan sát về nhiệt độ trung bình là 26.10C và dữ liệu về mật độ của mây là 36% nằm trong hai khoảng tương ứng của nhân tố chính là khoảng 𝑢4 = (26.0, 27] và nhân tố thứ hai là khoảng 𝑣3= [28.57, 42.86] với cấp độ thuộc cao nhất được xác định theo công thức (2.7) là 1. Do đó, các tập mờ tương ứng được gán cho các khoảng này là 𝐴4 và 𝐵4 . Bằng cách tương tự, ta nhận được kết quả mờ hóa cho toàn bộ dữ liệu quan sát trong tháng 6 của hai nhân tố về “nhiệt độ trung bình” và “mật độ của mây” được liệt kê trong Bảng 2.8 như sau:

Bảng 2.8: Kết quả mờ hóa của nhân tố chính “nhiệt độ trung bình hàng ngày” và nhân tố thứ hai “mật độ của mây”

Ngày tháng Dữ liệu của nhân tố chính Tập mờ của nhân tố chính Dữ liệu của nhân tố thứ hai Tập mờ của nhân tố thứ 2 1/6/96 26.1 𝐴4 36 𝐵3 2/6/96 27.6 𝐴5 23 𝐵2 --- --- --- --- --- 29/6/96 29 𝐴7 29 𝐵3 30/6/96 30.2 𝐴8 19 𝐵2

Bước 5- Xác định tất cả các quan hệ mờ bậc m hai nhân tố

hóa, chúng ta có thể xác định được tất cả các quan hệ mờ hai nhân tố bậc mờ dựa trên Định nghĩa 1.4 theo dạng thức sau: (𝐹𝐴(𝑡 − 𝑚), 𝐹𝐵(𝑡 − 𝑚)),…, (𝐹𝐴(𝑡 − 2), 𝐹𝐵(𝑡 − 2)), (𝐹𝐴(𝑡 − 1), 𝐹𝐵(𝑡 − 1)) → 𝐹𝐴(𝑡); trong đó (𝐹𝐴(𝑡 − 𝑚), 𝐹𝐵(𝑡 − 𝑚)),…,

(𝐹𝐴(𝑡 − 2), 𝐹𝐵(𝑡 − 2)), (𝐹𝐴(𝑡 − 1), 𝐹𝐵(𝑡 − 1)) và 𝐹𝐴(𝑡) được gọi là trạng thái hiện tại của và trạng thái tương lai của quan hệ mờ. Sau đó các quan hệ này có thể được thay thế bởi các giá trị ngôn ngữ (các tập mờ) tương ứng.

Ví dụ 2.5: Từ dữ liệu được mờ hóa trong Bảng 2.8, giả sử xác định một quan hệ mờ bậc 3 (m=3) có liên hệ giữa chuỗi thời gian mờ hai nhân tố tại các thời điểm từ 01/6/1996 đến 04/61996, ta cần tìm quan hệ của bốn tập mờ liên tiếp trong mỗi chuỗi thời gian theo dạng sau: (𝐴4,𝐵3), (𝐴5,𝐵2), (𝐴7,𝐵2)→ 𝐴8. Từ Bảng 2.8, ta hoàn thành các quan hệ mờ bậc 3 hai nhân tố từ thời điểm 6/01/1996 đến 6/30/1996 và được chỉ ra trong cột 4 của Bảng 2.9.

Bảng 2.9: Kết quả biểu diễn mối quan hệ mờ bậc 3 hai nhân tố No Tập mờ của nhân tố chính Tập mờ của nhân tố thứ hai QHM hai nhân tố 𝐴4 𝐵3 𝐴5 𝐵2 𝐴7 𝐵2 1 𝐴8 𝐵1 (𝐴4, 𝐵3), (𝐴5, 𝐵2), (𝐴7, 𝐵2) → 𝐴8 2 𝐴8 𝐵1 (𝐴5, 𝐵2), (𝐴7, 𝐵2), (𝐴8, 𝐵1)𝐴8 3 𝐴7 𝐵3 (𝐴7, 𝐵2), (𝐴8, 𝐵1), (𝐴8, 𝐵1)𝐴7 --- --- --- --- 26 𝐴7 𝐵3 (𝐴5, 𝐵2), (𝐴6, 𝐵3), (𝐴5, 𝐵4)𝐴7 27 𝐴8 𝐵2 (𝐴6, 𝐵3), (𝐴5, 𝐵4), (𝐴7, 𝐵3)𝐴8 28 # (𝐴5, 𝐵4), (𝐴7, 𝐵3), (𝐴8, 𝐵2) → #

Bước 6- Thiết lập các nhóm quan hệ mờ phụ thuộc thời gian bậc m hai nhân tố. Theo Định nghĩa 2.3 tất cả các quan hệ mờ có cùng vế trái, tính từ thời điểm dự báo trở về trước có thể được gộp các thành phần bên vế phải thành một nhóm quan hệ để dự báo cho nhân tố chính.

Ví dụ 2.6: Giả sử có ba quan hệ mờ bậc 3 hai nhân tố tương ứng với từng thời điểm (t = 1, 2, 3) tương ứng sau: (𝐴4,𝐵3), (𝐴5, 𝐵2), (𝐴7, 𝐵2) → 𝐴8 ; (𝐴4, 𝐵3), (𝐴5, 𝐵2),

(𝐴7, 𝐵2) → 𝐴7; (𝐴5, 𝐵3); (𝐴5, 𝐵2), (𝐴7, 𝐵2) → 𝐴9, thì các quan hệ này có thể gộp thành một nhóm quan hệ mờ bậc 3 hai nhân tố theo vế trái của quan hệ với từng thời điểm dự báo: Giả sử tại thời điểm (t = 1), ta có nhóm (𝐴4, 𝐵3), (𝐴5, 𝐵2), (𝐴7, 𝐵2) → 𝐴8; với (t = 2) ta có nhóm (𝐴4, 𝐵3), (𝐴5, 𝐵2), (𝐴7, 𝐵2) → 𝐴8, 𝐴7. Dựa trên các quan hệ ở Bảng 2.9, ta xác định được tất cả các NQHM-PTTG bậc 3 hai nhân tố đưa ra tại cột 4 của Bảng 2.10. Trong cột 4 của Bảng 2.10, nhóm số 28 là nhóm có mẫu dữ liệu chưa biết và sử dụng dấu # để ký hiệu cho nhãn ngôn ngữ chưa được xác định. Nhóm

này xuất hiện trong giai đoạn kiểm thử để dự báo cho dữ liệu mới.

Bước 7- Tính toán giá trị và giải mờ đầu ra dự báo

Sau khi xác định được tất cả các NQHM-PTTG, giá trị dự báo cho các nhóm này được tính theo các quy tắc giải mờ sau đây:

Quy tắc 1: Nếu có một quan hệ mờ trong nhóm quan hệ mờ bậc m hai nhân tố có dạng: (𝐴𝑖 m, 𝐵𝑖𝑚), (𝐴𝑖 m−1, 𝐵𝑖𝑚−1), …, (𝐴𝑖 1, 𝐵𝑖1)→𝐴𝑗1, 𝐴𝑗2, …, 𝐴𝑗p. Giá trị đầu ra dự báo cho các nhóm quan hệ mờ có dạng này được tính theo công thức (2.4), đã được đề xuất trong Mục 2.2.1.

Quy tắc 2. Nếu có một quan hệ mờ trong nhóm quan hệ bậc m hai nhân tố có dạng: (𝐴𝑖 m, 𝐵𝑖𝑚), (𝐴𝑖 m−1, 𝐵𝑖𝑚−1), …, (𝐴𝑖 1, 𝐵𝑖1)→ #

Khi đó giá trị dự báo cho năm thứ i được tính dựa trên quy tắc trong công trình [40] và được biểu diễn theo công thức (2.8) như sau:

Giá trị_DB(dấu#) = 𝑀𝑖1 +∑ (𝑀𝑖(𝑘−1)−𝑀𝑖(𝑘))

𝑚 𝑘=2

2𝑘−1 (2.8)

Trong đó, 𝑀𝑖1, 𝑀𝑖2, … , 𝑀𝑖𝑘 là điểm giữa của các khoảng 𝑢𝑖1, 𝑢𝑖2, . . ., 𝑢𝑖𝑘 tương ứng với các tập mờ của nhân tố chính.

Từ hai quy tắc trên, kết quả tính toán cho các NQHM- PTTG bậc 3 hai nhân tố trên tập dữ liệu nhiệt độ trung bình tại Đài Bắc được chỉ ra trong cột 5 của Bảng 2.10.

Bảng 2.10: Kết quả tính toán giá trị cho mỗi NQHM-PTTG bậc 3 Số nhóm Tập mờ của nhiệt độ Tập mờ của độ dầy mây NQHM-PTTG bậc 3 Giá trị của nhóm 𝐴4 𝐵3 𝐴5 𝐵2 𝐴7 𝐵2 1 𝐴8 𝐵1 (𝐴4, 𝐵3),(𝐴5, 𝐵2),(𝐴7, 𝐵2) → 𝐴8 30.62 2 𝐴8 𝐵1 (𝐴5, 𝐵2), (𝐴7, 𝐵2), (𝐴8, 𝐵1)𝐴8 30.12 3 𝐴8 𝐵1 (𝐴7, 𝐵2), (𝐴8, 𝐵1), (𝐴8, 𝐵1)𝐴7 29.62 -- -- -- --- --- 26 𝐴7 𝐵3 (𝐴5, 𝐵2), (𝐴6, 𝐵3), (𝐴5, 𝐵4)𝐴7 29.12 27 𝐴8 𝐵2 (𝐴6, 𝐵3), (𝐴5, 𝐵4), (𝐴7, 𝐵3)𝐴8 30.12 28 # (𝐴5, 𝐵4), (𝐴7, 𝐵3), (𝐴8, 𝐵2) → # 31.5 Từ Bảng 2.10 và thông tin trong Bảng 2.8, ta có được kết quả dự báo nhiệt độ trung bình cho từng ngày trong tháng 6 của năm 1996 được thể hiện trong Bảng 2.11.

Bảng 2.11: Kết quả dự báo nhiệt độ trung bình hàng ngày trong tháng 6 năm 1996 tại Đài Bắc Đài Loan dựa vào chuỗi thời gian mờ hai nhân tố bậc 3.

Ngày tháng Dữ liệu về nhiệt độ Mờ hóa nhiệt độ Dữ liệu của mây Mờ hóa độ che phủ của mây Kết quả dự báo nhiệt độ 1/6/96 26.1 𝐴4 36 𝐵3

2/6/96 27.6 𝐴5 23 𝐵2 3/6/96 29 𝐴7 23 𝐵2 4/6/96 30.5 𝐴8 10 𝐵1 30.62 5/6/96 30 𝐴8 13 𝐵1 30.12 --- --- --- ---- --- ---- 29/6/96 29 𝐴7 29 𝐵3 29.12 30/6/96 30.2 𝐴8 19 𝐵2 30.12

1/7/96 N/A # N/A N/A 31.5

MSE 0.007

MAPE 0.27%

Một phần của tài liệu Luận án một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ (Trang 58 - 64)

Tải bản đầy đủ (PDF)

(132 trang)