Mô hình dự báo của Chen [10]

Chen [10] đã đề xuất mô hình FTS mới cho dự báo tuyển sinh bằng việc đưa

ra các phép tính đơn giản để tính toán giá trị rõ từ nhóm quan hệ mờ nhằm khắc phục

nhược điểm khi phải sử dụng nhiều phép toán max – min phức tạp trong Bước 5 và

Bước 6 của Song & Chissom [ 8, 9]. Nhóm quan hệ mờ này khiến mô hình trở nên

đơn giản và dễ giải thích hơn. Vì thế cấu trúc mô hình của Chen khác với mô hình của Song ởhai Bước 5 và Bước 6 trong việc thực hiện nhóm quan hệ mờ và giải mờ đầu ra dự báo: Kể từđó, mô hình này được sử dụng như một mô hình FTS nền tảng

và được xem là một cải tiến đầu tiên về nhóm quan hệ mờ. Các bước trong mô hình của Chen được minh họa thông qua tập dữ liệu về tuyển sinh đại học của trường Đại học Alabama [8] và kết quả của từng bước được tóm tắt trong Hình 1.8.

Mô hình dự báo của Chen bao gồm 7 bước chính sau:

Bước 1- Xác định tập nền U bao trọn các giá trị quan sát của chuỗi thời gian

Giống như mô hình của Song & Chissom, Chen đã sử dụng hai sốdương thích

hợp và giá trị lớn nhất và nhỏ nhất của chuỗi dữ liệu đểxác định tập nền như sau:

Tập nền được xác định bởi U= [𝑢𝑚𝑖𝑛, 𝑢𝑚𝑎𝑥 ] = [𝐷𝑚𝑖𝑛− 𝑁1, 𝐷𝑚𝑎𝑥+ 𝑁2], trong đó 𝐷𝑚𝑖𝑛, 𝐷𝑚𝑎𝑥 là giá trị nhỏ nhất và lớn nhất của chuỗi dữ liệu và 𝑁1, 𝑁2 là hai sốdương

chọn trước sao cho tập nền bao trọn vẹn chuỗi dữ liệu lịch sử. Từ tập dữ liệu tuyển sinh, tập nền được xác định là U = [13000, 20000].

Bước 2- Chia tập nền U thành các khoảng có độ dài bằng nhau.

Chia tập nền U thành 7 khoảng với độ dài bằng nhau, 𝐿 =𝑢𝑚𝑎𝑥−𝑢𝑚𝑖𝑛 7 . Các

khoảng được xác định bởi ui = (𝑢𝑚𝑖𝑛 +(𝑖 − 1) ∗ 𝐿, 𝑢𝑚𝑖𝑛 + 𝑖 ∗ 𝐿],với 1 ≤ 𝑖 ≤ 7.

Trong đó 𝑢1= [13000, 14000), 𝑢2= [14000, 15000), 𝑢3= [15000, 16000), 𝑢4=

[16000, 17000), 𝑢5= [17000, 18000), 𝑢6= [18000, 19000), 𝑢7= [19000, 20000]

Bước 3-Xác định các tập mờ trên mỗi khoảng

Dựa trên 7 khoảng đã chia, xác định được 7 hạng từ ngôn ngữđược biểu diễn

dưới dạng các tập mờ {𝐴1, 𝐴2, 𝐴3 , 𝐴4, 𝐴5, 𝐴6, 𝐴7}. Các tập mờđược xác định bởi công thức (1.5) sau: 𝐴𝑖 =𝑎𝑢𝑖1 1 +𝑎𝑢𝑖2 2 + ⋯ +𝑎𝑢𝑖𝑗 𝑗 + ⋯ +𝑎𝑢𝑖7 7 (1.5) 𝑎𝑖𝑗 = { 0.5 𝑗 = 𝑖 − 1,1 𝑗 = 𝑖𝑗 = 𝑖 + 1 0 trái lại (1.6) Trong đó, 𝑎𝑖𝑗 ∈[0,1] (1 ≤ 𝑖, 𝑗 ≤ 7) là cấp độ thuộc của khoảng 𝑢𝑖 vào tập mờ 𝐴𝑖 . Đểđơn gian trong việc tính toán, cấp độ thuộc được xác định bởi hàm thuộc tam giác nhận ba giá trị 0; 0.5; 1 theo công thức (1.6). Với 7 khoảng chia trên tập dữ liệu tuyển sinh thu được từBước 2, có 7 giá trị ngôn ngữ của biến ngôn ngữ“enrolments” được biểu diễn bởi các tập mờ với cấp độ thuộc khác nhau là 𝐴1= “not many”, 𝐴2=

“not too many”, 𝐴3= “many”, 𝐴4= “many many”, 𝐴5= “very many”, 𝐴6= “too many”, and 𝐴7= “too many many”.

Bước 4- Mờ hóa dữ liệu lịch sử

Sau khi các tập mờ được xác định công việc tiếp theo là chuyển đổi dữ liệu rõ thành dữ liệu mờ. Trước tiên cần gán giá trị ngôn ngữliên quan đến mỗi tập mờđã xác định vào mỗi khoảng tương ứng. Cách đơn giản là tìm ra một khoảng 𝑢𝑖 mà giá trị lịch sử của biến chuỗi thời gian tại thời điểm nào đó thuộc vào khoảng này mà có cấp độ thuộc cao nhất của khoảng 𝑢𝑖 xảy ra tại tập mờ 𝐴𝑖, khi đó dữ liệu lịch được mờ hóa là 𝐴𝑖.

Ví dụ 1.5: Giá trị lịch sử của năm 1972, Y(1972) là 13563 thuộc vào khoảng 𝑢1= (13000, 14000] mà cấp độ thuộc cao nhất của khoảng này xảy ra tại 𝐴1là 1. Vậy giá trị mờ hóa tại thời điểm t =1972, 𝐹(𝑡) =F(1972) là 𝐴1 có giá trị ngôn ngữ là “not many”.

Bước 5- Xác định các quan hệ mờ

Mối quan hệđược xác định từ dữ liệu lịch sửđã được mờ hóa. Nếu biến chuỗi thời gian 𝐹(𝑡 − 1)được mờ hóa thành 𝐴𝑘 và 𝐹(𝑡) là 𝐴𝑚, thì mối quan hệ giữa 𝐴𝑘với 𝐴𝑚 được biểu diễn là 𝐴𝑘 →𝐴𝑚, Trong đó 𝐴𝑘 là trạng thái tuyển sinh hiện tại và 𝐴𝑘

là trạng thái tuyển sinh tương lai. Các quan hệ mờ áp dụng trên tập dữ liệu tuyển sinh

như sau: 𝐴1 →𝐴1; 𝐴1 →𝐴2; 𝐴2 →𝐴3; 𝐴3 →𝐴3; 𝐴3 →𝐴4; 𝐴4 →𝐴4; 𝐴4 →𝐴3; 𝐴4 → 𝐴6; 𝐴6 → 𝐴6; 𝐴6 →𝐴7; 𝐴7 →𝐴7; 𝐴7 →𝐴6.

Bước 6- Thiết lập nhóm quan hệ mờ

Các QHM có cùng thành phần vế trái có thể gộp các thành phần bên vế phải thành một NQHM. Chen [10] cho rằng các quan hệ giống nhau chỉđược tính một lần. Từ các quan hệ mờ được xác định ở Bước 5, Bảng 1.1 biểu diễn các nhóm quan hệ

mờ từ tập dữ liệu tuyển sinh.

Bảng 1.1: Các nhóm quan hệ mờtừ tập dữ liệu tuyển sinh

Nhóm 1 𝐴1 →𝐴1, 𝐴2 Nhóm 2 𝐴2 →𝐴3 Nhóm 3 𝐴3 →𝐴3, 𝐴4 Nhóm 4 𝐴4 → 𝐴4,𝐴3, 𝐴6 Nhóm 5 𝐴6 →𝐴6, 𝐴7 Nhóm 6 𝐴7 →𝐴7, 𝐴6 Nhóm 7 𝐴6 → #

Bước 7- Giải mờ và tính toán giá trị đầu ra dự báo

Giả sử chuỗi dữ liệu tại thời điểm 𝐹(𝑡 − 1) được mờ hóa bởi các tập mờ 𝐴𝑖.

Đầu ra dự báo của 𝐹(𝑡) được xác định bởi các quy tắc sau đây:

1) Nếu tồn tại các quan hệ một - một trong nhóm quan hệ mờ của 𝐴𝑖 có dạng là 𝐴𝑖 → 𝐴𝑝1, thì giá trị dự báo là 𝐹𝑜𝑟𝑒𝑐𝑎𝑠𝑡𝑒𝑑 = 𝑚𝑝1. Trong đó 𝑚𝑝1 là

điểm giữa của khoảng 𝑢𝑝1

2) Nếu tồn tại một quan hệ rỗng trong nhóm quan hệ mờ 𝐴𝑖 có dạng là 𝐴𝑖 →

, và 𝐴𝑖 có mức độ thuộc cao nhất tại khoảng 𝑢𝑖, thì giá trị dựbáo là điểm giữa của 𝑢𝑖.

3) Nếu tồn tại các quan hệ một - nhiều trong nhóm quan hệ mờ của 𝐴𝑖, có dạng là 𝐴𝑖→ 𝐴𝑝1 , 𝐴𝑝2,…, 𝐴𝑝𝑛, và mức độ thuộc cao nhất của 𝐴𝑝𝑘 xảy ra tại

khoảng các khoảng 𝑢𝑝𝑘 tương ứng, thì đầu ra dựbáo được tính bằng trung

bình các điểm giữa 𝑚𝑝𝑘 của 𝑢𝑝𝑘 là: 𝐹𝑜𝑟𝑒𝑐𝑎𝑠𝑡𝑒𝑑 = ∑𝑛𝑘=1𝑚𝑝𝑘

𝑛 .

Hình 1.8: Tóm tắt các bướcthực hiệnmô hình dự báo của Chen [10] trên tập dữ liệu tuyển sinh của trường Đại học Alabama

Giai đoạn kiểm thử (Giai đoạn dự báo)

Mô hình dự báo của Song và Chissom [8,9]