Trƣớc hết ta định nghĩa lại nhóm quan hệ logic mờ. Nhận thấy rằng trong
Định nghĩa 3 nhóm quan hệ mờ không thấy xác định thời gian trong mỗi phần tử của tập mờ Ai. Chính vì vậy khi nào có nhóm quan hệ logic mờ dạng Ai Ai1,Ai2... Aip, thì ta xử lý giống nhƣ khi dự báo giải mờ cho phần tử Ai không kể phần tử này ứng với giá trị t khác nhau trong chuỗi thời gian mờ F(t). Đúng hơn ta phải viết rõ phụ thuộc thời gian F(t-1) = Ai (t). Khi đó trong vế phải của nhóm quan hệ mờ Ai
Ai1,Ai2... Aip phải viết lại thành Ai(t) Ai1(t1),Ai2(t2),...,Aip(tp). Khi đó theo mô hình của Chen, dự báo của phần tử Ai(t) liên quan đến các phần tử
Ai1(t1),Ai2(t2),...,Aip(tp) mà không chú ý đến thời điểm xuất hiện của các phần tử này. Nhƣ vậy có thể có những phần tử trong vế phải xuất hiện sau thời điểm t, tức là có thời điểm chẳng hạn t2 > t mà phần tử Ai2(t2) cũng tham gia vào dự báo. Điều này tỏ ra vô lý nên chỉ chấp nhận những phần tử nào có thời điểm xuất hiện trƣớc t
mà thôi. Do vậy, ta sẽ xác định lại nhóm quan hệ logic mờ qua định nghĩa sau.
Định nghĩa 8 (Nhóm quan hệ logic mờ phụ thuộc thời gian): Mối quan hệ mờ ta đều xác định từ quan hệ F(t-1)F(t). Nếu nhƣ trên ta đặt F(t) = Ai(t) và
F(t-1) = Aj (t-1) thì ta có mối quan hệ Aj (t-1) Ai(t). Nếu tại thời điểm t ta có các mối quan hệ mờ: Aj(t-1) Ai(t), Aj(t1-1) Ai2(t1) ,..., Aj(tp-1) Aip(tp) với các giá trị t1, t2, ...tp t (tức là các mối quan hệ mờ trên xảy ra tại các thời điểm trƣớc
Aj(t-1) Ai(t) ) thì ta có thể nhóm các mối quan hệ logic mờ thành Aj(t-1) Ai(t),Ai1(t1),Ai2(t2),...,Aip(tp)
Và mối quan hệ trên đƣợc gọi là nhóm quan hệ logic mờ phụ thuộc thời gian. Thực chất cách ghi Aj(t) vẫn là một tập mờ Aj đã xác định nhƣng chỉ muốn nhấn mạnh tập mờ này xuất hiện tại thời điểm
k m k m mi i ik ... 2 1 .... 2 1 1 2
Từ định nghĩa nhóm quan hệ logic này, chúng tôi đƣa ra thuật toán về cơ bản giống nhƣ thuật toán chuỗi thời gian mờ có trọng của Yu nhƣng sử dụng nhóm quan hệ mờ phụ thuộc thời gian thay cho nhóm quan hệ mờ chung của Chen. Thuật toán đó bao gồm các bƣớc sau :
1. Xác định tập nền. Tập nền U đƣợc xác định nhƣ sau: lấy giá trị lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian và U =[fmin-f1, fmax+f2] trong đó f1,f2 là những giá trị dƣơng nào đó. Chia đoạn U thành m khoảng con bằng nhau u1, u2,...um.
2. Xây dựng các tập mờ Ai tƣơng ứng với các khoảng con nhƣ trong trong bƣớc 2 và sử dụng các hàm thuộc tam giác cho mỗi khoảng con của phép chia và mờ hoá các giá trị chuỗi thời gian.
3. Xây dựng mối quan hệ mờ và xác định nhóm các quan hệ logic mờ theo
Định nghĩa 8.
4. Dự báo chuỗi thời gian mờ theo các luật sau:
Luật 1: Nếu nhóm quan hệ mờ Ai thì giá trị dự báo mờ tại thời điểm t sẽ là Ai
Luật 2: Nếu nhóm quan hệ logic mờ có dạng Ai Ak giá trị dự báo mờ tại thời điểm t sẽ là Ak
Luật 3: Nếu mối quan hệ mờ bậc cao có dạng Ai Ai1,Ai2... Aip, thì giá trị dự báo sẽ là: Ai1,Ai2... Aip
5. Giải mờ dựa vào các luật dự báo trên.
Luật 1: Nếu nhóm quan hệ mờ của là rỗng và giả sử mi1và mi2 là điểm giữa của khoảng ui1 và ui2 khi đó giá trị dự báo của F(t) là giá trị trung bình của hai điểm giữa trên, tức là:
forecast = (mi1 + mi2 )/2
Luật 2: Nếu nhóm quan hệ logic mờ có dạng Ai Akvà nếu điểm giữa của khoảng uk là mk thì forecast = mk
Luật 3: Nếu mối quan hệ mờ bậc cao có dạng Ai2 Ai1,Ai2... Aip, thì giá trị dự báo sẽ là:
forecast =
với mi1 , mi2,...miplà điểm giữa của các đoạn tƣơng ứng.
2.3.3.3 Áp dụng dự báo số lượng sinh viên nhập học
Để xem xét tính hiệu quả của định nghĩa mới về nhóm quan hệ logic mờ, chúng tôi sử dụng dữ liệu của bài báo Chen[10] về số lƣợng học sinh nhập học của Trƣờng đại học Alabama theo bảng sau :
Bảng 2.1 Số lượng sinh viên nhập học
Năm Số sinh viên Năm Số sinh viên
1971 13055 1982 15433 1972 13563 1983 15497 1973 13867 1984 15145 1974 14696 1985 15163 1975 15460 1986 15984 1976 15311 1987 16859 1977 15603 1988 18150 1978 15861 1989 18970 1979 16807 1990 19328 1980 16919 1991 19337 1981 16388 1992 18876
Thuật toán cải tiến cho chuỗi thời gian mờ bao gồm các bƣớc sau đây và áp dụng cho số liệu tại bảng trên.
Bước 1. Xây dựng tập nền U. Xác định giá trị lớn nhất và nhỏ nhất của chuỗi thời gian trên là 19337 và 13055 sinh viên. Do vậy tập nền U đƣợc xác định là giá trị trong khoảng [13000,20000]. Ta sẽ chia U thành 7 khoảng u1, u2, ..., u7 với độ rộng là 1000 nhƣ trong [4], nhƣ vậy các khoảng sẽ là: u1 = [13000,14000], u2 = [14000,15000], …, u7 = [19000,20000]. k m k m mi i ik ... 2 1 .... 2 1 1 2
Bước 2: Xây dựng các tập mờ xác định trên các biến ngôn ngữ là các khoảng đã chia.
Trong bƣớc này ta xác định lại các tập mờ Ai tƣơng ứng với từng khoảng và có thể gán lại các giá trị ngôn ngữ cho từng tập mờ này. Các tập mờ Ai i=1,2,...,7 đƣợc định nghĩa thông qua các hàm thuộc để đơn giản có dạng hình nón nhận 3 giá trị 0, 0.5 và 1 và đƣợc viết nhƣ sau:
A1 = 1/u1 + 0.5/u2 + 0/u3 +....+ 0/u6 + 0/u7 A2 = 0.5/u1 + 1/u2 + 0.5/u3 +...+ 0/u6 + 0/u7 ... A7 = 0/u1 + 0/u2 + ...+ 0/u5 + 0.5/u6 + 1/u7
Bước 3.Xác định mối quan hệ mờ và nhóm quan hệ mờ bậc cao
Theo định nghĩa phần trên ta lập chuỗi thời gian mờ tƣơng ứng với các tập mờ ở trên và xác định mối quan hệ mờ tại thời điểm t =1,2,...,22. Có thể thấy ngay đƣợc các mối quan hệ đầu tiên nhƣ sau: A1 A1, A1 A1, A1 A2 ,..., A7 A6.
Từ đây xác định nhóm các mối quan hệ mờ theo Định nghĩa 8 ở phần trên. Thí dụ ta có thể nhận đƣợc một nhóm quan hệ mờ liên quan đến vế trái A3 nhƣng tại thời điểm khác nhau t=7, t=8, t=9 ta lại có nhóm quan hệ logic mờ khác nhau: A3(7)
A3, A3, A3(8) A3,A3,A3 ; A3(9) A3,A3,A3,A4 . Toàn thể các nhóm quan hệ mờ sẽ đƣợc thể hiện dƣới Bảng 2. Bảng 2.2 Các nhóm mối quan hệ mờ Giá Trị Thời điểm Giá Trị mờ Nhóm QH mờ
Chen Nhóm QHLG mờ Yu Nhóm QH logic mờ mới
13055 t=1 A1
13563 t=2 A1 A1,A2 A1,A1,A2 A1
13867 t=3 A1 A1,A2 A1,A1,A2 A1,A1
14696 t=4 A2 A1,A2 A1,A1,A2 A1,A1,A2
15460 t=5 A3 A3 A3 A3
15311 t=6 A3 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3 15603 t=7 A3 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3,A3
15861 t=8 A3 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3,A3,A3 16807 t=9 A4 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3,A3,A3,A4
16919 t=10 A4 A3,A4,A6 A4,A4,A3,A6 A4
16388 t=11 A4 A3,A4,A6 A4,A4,A3,A6 A4,A4
15433 t=12 A3 A3,A4,A6 A4,A4,A3,A6 A4,A4,A3 15497 t=13 A3 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3,A3,A3,A4,A3 15145 t=14 A3 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3,A3,A3,A4,A3,A3 15163 t=15 A3 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3,A3,A3,A4,A3,A3,A3 15984 t=16 A3 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3,A3,A3,A4,A3,A3,A3,A3 16859 t=17 A4 A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4 A3,A3,A3,A4,A3,A3,A3,A3,A4
18150 t=18 A6 A3,A6 A4,A4,A3,A6 A4,A4,A3,A6
18970 t=19 A6 A6,A7 A6,A7 A6
19328 t=20 A7 A6,A7 A6,A7 A6,A7
19337 t=21 A7 A6,A7 A7,A6 A7
18876 t=22 A6 A6,A7 A7,A6 A7,A6
Nhìn vào bảng trên, ta thấy nhóm các quan hệ mờ của phƣơng pháp cải tiến phụ thuộc vào từng thời điểm chứ không cố định nhƣ các phƣơng pháp của Chen hay của Yu.
Bước 4, 5. Dự báo và giải mờ theo các luật đã mô tả ở trên có tính đến trọng số. Kết quả tính toán của phƣơng pháp cải tiến và các phƣơng pháp khác đƣợc đƣa ra trong bảng dƣới đây:
Bảng 2.3 Kết quả dự báo của các phương pháp khác nhau
Năm Số lƣợng SV Chen Method Yu Method Cải tiến
1971 13055 1972 13563 14000 14000 13500 1973 13867 14000 14000 13500 1974 14696 14000 14000 14000 1975 15460 15500 15500 15500 1976 15311 16000 15789 15500 1977 15603 16000 15789 15500 1978 15861 16000 15789 15500
1979 16807 16000 15789 15900 1980 16919 16833 17000 16500 1981 16388 16833 17000 16500 1982 15433 16833 17000 16000 1983 15497 16000 15789 15767 1984 15145 16000 15789 15690.5 1985 15163 16000 15789 15643 1986 15984 16000 15789 15611 1987 16859 16000 15789 15789 1988 18150 16833 17000 17000 1989 18970 19000 19167 18500 1990 19328 19000 19167 19167 1991 19337 19000 18833 19500 1992 18876 19000 18833 18833 MSE 407507 407322 267438
Để so sánh các kết quả dự báo theo các phƣơng pháp khác nhau, ta sử dụng sai số trung bình bình phƣơng MSE theo công thức:
trong đó fi là giá trị thực còn gilà giá trị dự báo.
Kết quả sai số theo các phƣơng pháp đƣợc đƣa ra trong bảng sau:
Bảng 2.4 So sánh hiệu quả thuật toán
Algorithms/MSE Thuật toán Chen Thuật toán Yu Thuật toán cải biên
MSE 407507.3 407321.5 267438.4
Kết quả tính toán cho thấy trong trƣờng hợp rất đơn giản chúng ta đã thu đƣợc sai số chỉ băng nửa so với thuật toán cơ bản trong khi thuật toán có trọng của Yu không khá hơn thuật toán Chen là bao.
n g f MSE n i i i 1 2 ) (
CHƢƠNG 3: MÔ HÌNH CHUỖI THỜI GIAN MỜ BẬC CAO HAI NHÂN TỐ VÀ TÍNH TOÁN THỬ NGHIỆM
Một trong các hƣớng đƣợc tập trung phát triển là sử dụng mối quan hệ mờ bậc cao trong mô hình chuỗi thời gian mờ. Chen [10-11] tiếp tục là ngƣời đi đầu khi xây dựng đƣợc thuật toán để xử lý mối quan hệ mờ bậc cao.Trong nghiên cứu các dãy số liệu tạo thành chuỗi thời gian, ngƣời ta nhận thấy rằng số liệu trong chuỗi thời gian chính có ảnh hƣởng bởi nhiều thông tin khác. Thí dụ chỉ số chứng khoán của Đài Loan, Hàn Quốc hay Việt Nam đều bị ảnh hƣởng bởi chỉ số chứng khoán Mỹ. Dãy số liệu đo nhiệt độ của một thành phố bị ảnh hƣởng lớn bởi mức độ che phủ của mây. Điều này làm nảy sinh ra ý tƣởng khi dự báo dãy số liệu chính có xét thêm một hay nhiều dãy số liệu phụ. Từ đó nảy sinh ra mô hình chuỗi thời gian mờ loại 2 khi đồng thời với chuỗi thời gian chính còn sử dụng số liệu của các tham số phụ để đƣa ra dự báo. Mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự báo của các phƣơng pháp đề xuất còn chƣa cao. Do đó việc tìm tòi các mô hình có độ chính xác cao hơn và thuật toán đơn giản hơn đang là một ƣu tiên. Trong những năm gần đây một số công trình đã đƣợc hoàn thành theo hƣớng nâng cao độ chính xác và giảm khối lƣợng tính toán trong mô hình chuỗi thời gian mờ nhƣ các công trình của Chen và Hsu, Huarng, Singh,... Mô hình chuỗi thời gian mờ bậc cao đã đƣợc xem xét nhiều và đƣợc coi là một công cụ đắc lực để nâng cao hiệu quả tính toán. Chƣơng này trình bầy về mô hình chuỗi thời gian mờ bậc cao hai nhân tố và ứng dụng mô hình này trong bài toán dự báo nhiệt độ và bài toán dự báo chỉ số chứng khoán [14-15]. Qua đó để thấy đƣợc hiệu quả dự báo của thuật toán bậc cao hai nhân tố so với một số thuật toán khác nhƣ: thuật toán của Chen, thuật toán của Huarng.
3.1 Khái niệm chuỗi thời gian mờ bậc cao
Định nghĩa 1: Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t. Nếu R(t-1, t) không phụ thuộc vào t thì F(t) đƣợc gọi là chuỗi thời gian mờ dừng, còn ngƣợc lại ta có chuỗi thời gian mờ không dừng.
Định nghĩa 2: Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),…, F(t-m) m>0 và là chuỗi thời gian mờ dừng. Khi đó mối quan hệ mờ có thể viết đƣợc F(t-1), F(t-2), …, F(t-m) F(t) và gọi đó là mô hình dự báo bậc m của chuỗi thời gian mờ.
Ví dụ: Mối quan hệ mờ bậc 2 nhƣ sau: giá trị tại thời điểm t-2 và t-1 của chuỗi thời gian mờ tƣơng ứng là Ai1 và Ai2 còn giá trị tại thời điểm t là Aj . Khi đó ta xác định mối quan hệ mờ Ai1, Ai2 Aj.
3.1.2 Khái niệm chuỗi thời gian mờ bậc cao hai nhân tố
Định nghĩa 3: Cho F(t) là một chuỗi thời gian mờ. Nếu F(t) đƣợc sinh ra bởi (F1(t-1), F2(t-1)), (F1(t-2), F2(t-2)),...., và (F1(t-n), F2(t-n)) thì mối quan hệ logic mờ đƣợc biểu diễn bởi:
(F1(t-n), F2(t-n)),…., (F1(t-2), F2(t-2)), (F1(t-1), F2(t-1)) F(t)
và nó đƣợc gọi là mô hình chuỗi thời gian mờ hai nhân tố bậc n. Khi đó F1(t) và F2(t) đƣợc gọi là nhân tố chính của chuỗi thời gian mờ và nhân tố thứ hai của chuỗi thời gian mờ, với t = (....,0,1,2,....).
3.2 Thuật toán trong mô hình chuỗi thời gian mờ bậc cao hai nhân tố
Thuật toán đƣợc đề xuất bao gồm các bƣớc sau:
Bước 1:
- Xác định tập nền U của nhân tố chính: U = [Dmin – D1, Dmax – D2], với Dmin và Dmax là giá trị nhỏ nhất và giá trị lớn nhất của chuỗi dữ liệu chính, tƣơng ứng D1 và D2 là những giá trị dƣơng nào đó thích hợp để phân chia tập nền U thành n đoạn có độ dài tƣơng đƣơng nhau: u1,u2,...., và un.
- Xác định tập nền V của nhân tố thứ hai: V = [Emin – E1, Emax – E2], với Emin và Emax là giá trị nhỏ nhất và giá trị lớn nhất của chuỗi dữ liệu thứ hai (chuỗi dữ liệu phụ), tƣơng ứng E1 và E2 là những giá trị dƣơng nào đó thích hợp để phân chia tập nền V thành m đoạn có độ dài tƣơng đƣơng nhau: v1,v2,...., và vm.
Bước 2:
A1 = 1/u1 + 0.5/u2 + 0/u3 + 0/u4 + 0/u5 +...+ 0/un-2 + 0/un-1 + 0/un A2 = 0.5/u1 + 1/u2 + 0.5/u3 + 0/u4 + 0/u5 +...+ 0/un-2 + 0/un-1 + 0/un A3 = 0/u1 + 0.5/u2 + 1/u3 + 0/u4 + 0/u5 +...+ 0/un-2 + 0/un-1 + 0/un ...
An = 0/u1 + 0/u2 + 0/u3 + 0/u4 + 0/u5 +...+ 0/un-2 + 0.5/un-1 + 1/un với A1, A2,...., và An là các giá trị mờ của nhân tố chính.
- Xác định các tập mờ Bj đại diện cho nhân tố thứ hai, với 1 j m, cụ thể nhƣ sau: B1 = 1/v1 + 0.5/v2 + 0/v3 + 0/v4 + 0/v5 +...+ 0/vm-2 + 0/vm-1 + 0/vm B2 = 0.5/v1 + 1/v2 + 0.5/v3 + 0/v4 + 0/v5 +...+ 0/vm-2 + 0/vm-1 + 0/vm B3 = 0/v1 + 0.5/v2 + 1/v3 + 0/v4 + 0/v5 +...+ 0/vm-2 + 0/vm-1 + 0/vm ... Bm = 0/v1 + 0/v2 + 0/v3 + 0/v4 + 0/v5 +...+ 0/vm-2 + 0.5/vm-1 + 1/vm với B1, B2,...., và Bm là các giá trị mờ của nhân tố thứ hai.
Bước 3: Mờ hóa các chuỗi dữ liệu cụ thể nhƣ sau:
- Tìm giá trị ui, với 1 i n, mà giá trị của nhân tố chính thuộc:
+ Trƣờng hợp 1: Nếu giá trị của nhân tố chính thuộc đoạn u1, thì giá trị mờ hóa của nhân tố chính là: 1/A1 + 0.5/A2, và đƣợc kí hiệu là X1.
+ Trƣờng hợp 2: Nếu giá trị của nhân tố chính thuộc đoạn ui, với 2 i n -1 thì giá trị mờ hóa của nhân tố chính là: 0.5/Ai-1 +1/Ai + 0.5/Ai+1, và đƣợc kí hiệu là Xi.
+ Trƣờng hợp 3: Nếu giá trị của nhân tố chính thuộc đoạn un, thì giá trị mờ hóa của nhân tố chính là: 0.5/An-1 +1/An, và đƣợc kí hiệu là Xn. - Tìm giá trị vj, với 1 j m, mà giá trị của nhân tố thứ hai thuộc:
+ Trƣờng hợp 1: Nếu giá trị của nhân tố thứ hai thuộc đoạn v1, thì giá trị mờ hóa của nhân tố thứ hai là: 1/B1 + 0.5/B2, và đƣợc kí hiệu là Y1.