MÔ HÌNHDỰ BÁO THEO TIẾP CẬN ĐẠI SỐ GIA TỬ

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng mô hình dự báo chuỗi thời gian bậc cao và thử nghiệm (Trang 31 - 42)

5. Kết cấu luận văn

2.3. MÔ HÌNHDỰ BÁO THEO TIẾP CẬN ĐẠI SỐ GIA TỬ

Đối với mô hình dự báo chuỗi thời gian mờ của Song & Chissom và Chen, có thể thấy rõ ba giai đoạn: mờ hóa, xác định quan hệ mờ và giải mờ. Như vậy, hoàn toàn có thể thay thế tiếp cận mờ với ba giai đoạn trên đây bằng tiếp cận đại số gia tử cũng với ba giai đoạn tương tự: ngữ nghĩa hóa, xác định nhóm quan hệ ngữ nghĩa và giải nghĩạ

Mô hình dự báo chuỗi thời gian mờ dựa trên đại số gia tử với dữ liệu đầu vào gồm n giá trị {y(t1), y(t2), …, y(tn)} ứng với các mốc thời gian t1, t2, …, tn có các bước cơ bản sau đây:

Bước 1. Xác định tập nền U = [Dmin, Dmax].

Bước 2. Xây dựng các khoảng sử dụng mô hình đại số gia tử và độ đo tính mờ trên tập nền Ụ

Bước 3. Định lượng các giá trị ngôn ngữ.

Bước 4. Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Bước 5. Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩạ Bước 6. Giải nghĩa đầu ra dự báo [6].

Các bước trên đây tương tự với các bước dự báo trong mô hình Chen nhưng trong tiếp cận đại số gia tử không sử dụng tập mờ mà dùng ngữ nghĩa định lượng mô tả trực tiếp ngữ nghĩa của giá trị ngôn ngữ. Ở đây, phép mờ hóa được thay bằng phép ngữ nghĩa hóa, quan hệ mờ được thay bằng quan hệ ngữ nghĩa và nhóm quan hệ mờ được thay bằng nhóm quan hệ ngữ nghĩạ Cuối cùng phép giải mờ được thay bằng phép giải nghĩạ

Chúng ta chọn bài toán dự báo sản lượng tiêu thụ xăng dầu của Cửa hàng 01 – Petrolimex thuộc Công ty xăng dầu Bình Định từ năm 2018 đến năm 2019 nhằm nghiên cứu mô hình chuỗi thời gian mờ để xây dựng quá trình dự báo dựa trên đại số gia tử và làm rõ hiệu quả dự báo của mô hình.

Bài toán được chọn

Bảng 2.1: Sản lượng xăng dầu tiêu thụ theo tháng (từ năm 2018 đến 2019) TT Năm Tháng Sản lượng bán Năm Tháng Sản lượng bán

1 2018 01 680.761 2019 01 736.869 2 02 655.999 02 644.362 3 03 684.228 03 710.859 4 04 666.487 04 702.023 5 05 703.654 05 697.007 6 06 675.894 06 697.120 7 07 704.357 07 719.812 8 08 697.979 08 709.985 9 09 647.129 09 683.733 10 10 664.976 10 693.460 11 11 650.895 11 661.889 12 12 675.282 12 715.524

Các bước tính toán dựa trên đại số gia tử cụ thể như sau:

Bước 1: Xác định tập nền, chia miền xác định của tập nền thành những khoảng bằng nhaụ Tập nền U được chọn tương tự mô hình Chen có khoảng xác định: [Dmin, Dmax] với Dmin và Dmax là sản lượng xăng dầu tiêu thụ thấp nhất và cao nhất theo dữ liệu lịch sử bán hàng của Cửa hàng 01 – Petrolimex thuộc Công ty xăng dầu Bình Định. Cụ thể Dmin = 644362 và Dmax = 736869. Khoảng U = [Dmin, Dmax] bao được hoàn toàn số sản lượng xăng dầu tiêu thụ, như vậy U= [644362, 736869].

Bước 2: Xây dựng các nhãn ngữ nghĩa (giá trị ngôn ngữ không biểu diễn dưới dạng tập mờ) của tiếp cận đại số gia tử trên tập nền. Để có thể dễ theo dõi và so sánh với các bước dự báo trong mô hình Chen, ở đây sử dụng

một số kí hiệu tương tự những kí hiệu Chen đã sử dụng nhưng với ý nghĩa của tiếp cận đại số gia tử. Giả sử A1, A2,…, Ak là các nhãn ngữ nghĩa được gán cho các khoảng u1, u2,…uk, k là số khoảng trên tập nền. Khác với tập mờ trong nghiên cứu của Chen, các nhãn ngữ nghĩa ở đây được xây dựng từ các phần tử sinh c-, c+ với các gia tử h ∈ H tạo thành các giá trị ngôn ngữ của biến ngôn ngữ “sản lượng xăng dầu tiêu thụ”. Khi đó các nhãn ngữ nghĩa A1, A2,…, Ak có dạng sau đây: A1= hA1c; A2= hA2c;….; Ak= hAkc, trong đó hAi, (i=1,2,…k) là chuỗi gia tử tác động lên c với c ∈{c-, c+}.

Trong bài toán dự báo sản lượng tiêu thụ xăng dầu này theo tiếp cận đại số gia tử, sử dụng 2 gia tử “very”, “little” tác động lên các phần tử sinh “small” và “large” để tạo ra các nhãn ngữ nghĩa tương ứng với các giá trị ngôn ngữ như sau: A1 =(very small), A2 = (small), A3 = (little small), A4 = (midle), A5 = (little large), A6 = (large) và A7 = (very large).

Xác định tập nền U được chia thành 7 khoảng u1, u2, …, u7. Trong đó u1 = [644362, 657577], u2 = [657578, 670792], u3 = [670793, 684007], u4 = [684008, 697223], u5 = [697224, 710438], u6 = [710439, 723653], u7 = [723654, 736869]

Bước 3: Định lượng các giá trị ngôn ngữ. Để xác định ngữ nghĩa định lượng cho các nhãn ngữ nghĩa A1, A2,..., A7 ở bước 2, ta dùng hàm v trong đại số gia tử. v(W)=θ=fm(c-), v(c-)=θ - αfm(c-)=βfm(c-), v(c+)=θ + αfm(c+)=1 - βfm(c+) v(hjx)= v(x) + sign(hjx) với

ν(very small) = θ(1-α)(1-α) ν(small) = θ(1-α) ν(little small) = θ(1-α+α2) ν(midle) = θ ν(little large) = θ+α(1-θ)(1-α) ν(large) = θ+(1-θ)α ν(very large) = θ+α(1-θ)(2-α)

Nếu chọn trước α = 0.5 và θ = 0.5, thì 7 phương trình trên trở thành: ν(very small) = 0.125 ν(small) = 0.25 ν(little small) = 0.375 ν(midle) = 0.5 ν(little large) = 0.625 ν(large) = 0.75 ν(very large) = 0.875

Kí hiệu: SA = Semantization (A) là giá trị ngữ nghĩa định lượng theo nhãn ngữ nghĩa A, khi đó: SA1 = ν(A1); SA2 = ν(A2); SA3 = ν(A3); SA4 = ν(A4); SA5 = ν(A5); SA6 = ν(A6); SA7 = ν(A7) là các giá trị ngữ nghĩa định lượng theo các tham số được chọn trước α, θ. Khi đó dễ dàng thấy rằng:

SA1 < SA2 < SA3 < SA4 < SA5 < SA6 < SA7

Tương tự như trên, có thể xây dựng các công thức tính toán các giá trị ngữ nghĩa định lượng theo các nhãn ngữ nghĩa khi có nhiều gia tử tác động lên phần tử sinh. Biểu thức SA1 < SA2 < SA3 < SA4 < SA5 < SA6 <SA7 thể hiện rõ những tính chất quan trọng sau đây:

1. Thứ tự ngữ nghĩa luôn được đảm bảọ

2. Các nhãn ngữ nghĩa Ai có giá trị ngữ nghĩa định lượng SAi và luôn có quan hệ ngữ nghĩa với nhau thông qua bộ tham số của đại số

gia tử α, θ, µ(hAi), I = 1, 2,…

Như vậy, trong các ứng dụng cụ thể của tiếp cận đại số gia tử, ảnh hưởng của bộ tham số mang tính hệ thống. Có nghĩa là tất cả các giá trị ngôn ngữ trong biến ngôn ngữ đều chịu ảnh hưởng bởi bộ tham số của đại số gia tử. Những tính chất trên đây tạo ra sự khác biệt giữa tiếp cận đại số gia tử và tiếp cận mờ. Có thể thấy rằng: trong tiếp cận mờ, các giá trị ngôn ngữ sử dụng tập mờ của biến ngôn ngữ hoàn toàn không có ràng buộc với nhaụ Sự khác biệt này đã đưa đến hiệu quả cao trong nhiều ứng dụng của tiếp cận đại số gia tử.

Bước 4: Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩạ Các quan hệ ngữ nghĩa được xác định trên cơ sở các dữ liệu lịch sử. Nếu đặt chuỗi thời gian mờ bậc k: F(t-k),…,F(t-2), F(t-1) ta được giá trị tích hợp là Aj và ngữ nghĩa định lượng tương ứng SAj còn F(t) là Am có ngữ nghĩa định lượng SAm, thì Aj có quan hệ với Am và quan hệ này được gọi là quan hệ ngữ nghĩa theo nhãn ngữ nghĩa và được kí hiệu là: Aj → Am.

Trong bài toán dự báo sản lượng tiêu thụ xăng dầu, ở đây Aj là nhãn ngữ nghĩa mô tả sản lượng tiêu thụ xăng dầu của k tháng hiện tại gần nhất với ngữ nghĩa định lượng SAj, Am là nhãn ngữ nghĩa mô tả sản lượng tiêu thụ xăng dầu của tháng tiếp theo với ngữ nghĩa định lượng SAm. Như vậy, trên cơ sở số liệu sản lượng xăng dầu tiêu thụ ở Bảng 2.1, có thể xác định được các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa (kể cả số lần trùng nhau) chẳng hạn với k = 3 ta có các quan hệ sau đây:

A3, A1, A4 → A2 A1, A4, A2 → A5 A4, A2, A5 → A3 A2, A5, A3 → A5 A5, A3, A5 → A5 A3, A5, A5 → A1

A5, A5, A1 → A2 A5, A1, A2 → A1 A1, A2, A1 → A3 A2, A1, A3 → A7 A1, A3, A7 → A1 A3, A7, A1 → A6 A7, A1, A6 → A5 A1, A6, A5 → A4 A6, A5, A4 → A4 A5, A4, A4 → A6 A4, A4, A6 → A5 A4, A6, A5 → A3 A6, A5, A3 → A4 A5, A3, A4 → A2 A3, A4, A2 → A6

Bước 5: Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩạ

Trước tiên cần tích hợp các giá trị vế trái bằng cách lấy trung bình cộng các giá trị ngữ nghĩa định lượng theo công thức:

Chẳng hạn SAj = (v(A3) + v(A1) + v(A4))/3 = (0,375 + 0.125 + 0.5) / 3 = 0.33. Từ giá trị này ta được nhãn ngôn ngữ tương ứng A3 trong đại số gia tử.

Tương tự như trên ta thu được hệ luật mới: A3 → A2

A2 → A5 A4 → A3

A3 → A5 A4 → A5 A4 → A1 A4 → A2 A3 → A1 A1 → A3 A2 → A7 A4 → A1 A4 → A6 A5 → A5 A4 → A4 A5 → A4 A4 → A6 A5 → A5 A5 → A3 A5 → A4 A4 → A2 A3 → A6

Sau khi xây dựng các luật bằng cách như trên, ta gộp các luật có cùng vế trái và thu được:

Nhóm 1: A1 → (A3) Nhóm 2: A2 → (A5, A7)

Nhóm 3: A3 → (A1, A2, A5, A6)

Nhóm 4: A4 → (A1, A1, A2, A2, A3, A4, A5, A6, A6) Nhóm 5: A5 → (A3, A4, A4, A5, A5)

Bước 6: Giải nghĩa đầu ra dự báo

F(t) được ngữ nghĩa hóa theo X(t)= (WSAiAj * SAi+ WSAkAj * SAk+…+ WSArAj * SAr) trên một khoảng giải nghĩa được chọn sao cho bao được ui, uk… ur và thuộc khoảng xác định của tập nền chuỗi thời gian mờ [Dmin, Dmax], thì xs= X(t). Trong đó WSAiAj, WSAkAj…, WSArAj là trọng số ngữ nghĩa của từng thành phần trong nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Aj và được tính bằng tỉ số giữa số dữ liệu thuộc khoảng ui và tổng số dữ liệu thuộc các khoảng ui, uk,…, ur của nhóm quan hệ ngữ nghĩạ Khi đó đầu ra dự báo của F(t) hay số sản lượng tiêu thụ xăng dầu dự báo tại tháng t được xác định theo các nguyên tắc (luật) sau đây:

1. Nếu tồn tại quan hệ 1-1 trong nhóm quan hệ ngữ nghĩa theo nhãn ngôn ngữ Aj như sau: Aj → Ak, theo hàm Nolinear Normalization (x) = f(xs,sp) = sp.xs(1-xs)+xs: Nonlinear Semantization (Aj) → Nonlinear Semantization (Ak)

Thì đầu ra dự báo được tính là: DSAj → Nonlinear Desemantization (SAk) trên khoảng giải nghĩa uk được chọn sao cho bao được uk và thuộc khoảng xác định của tập nền chuỗi thời gian mờ [Dmin, Dmax].

2. Nếu SAk là trống, SAj → ∅,

Thì đầu ra dự báo được tính sẽ là: DSAj → Nonlinear Desemantization (∅) trên khoảng giải nghĩa được chọn sao cho bao được uj và thuộc khoảng xác định của tập nền chuỗi thời gian mờ [Dmin, Dmax].

3. Nếu tồn tại quan hệ 1-nhiều trong nhóm quan hệ ngữ nghĩa (kể cả quan hệ trùng) theo nhãn ngôn ngữ Aj: SAj → (SAi,SAk,…, SAr), theo Nolinear Normalization (x) = f(xs,sp)=sp.xs(1-xs)+xs: NonlinearSemantization (Aj) → (NonlinearSemantization (Ai), NonlinearSemantization (Ak), …, NonlinearSemantization (Ar)),

Thì đầu ra dự báo được xác định theo ((b – Denormalization (f(xs,sp))) / (b-a) + Denormalization (f(xs,sp) cho từng dữ liệu lịch sử của nhóm quan hệ

ngữ nghĩa: DSAj → NonlinearDesemantization (WSAiAj * SAi+ WSAkAj * SAk+…+ WSArAj * SAr). Lưu ý rằng cách chọn khoảng giải nghĩa như trên luôn đảm bảo không phá vỡ nhóm quan hệ mờ nhưng đồng thời có thể cho phép tính toán dự báo cho từng điểm dự báo trong cùng nhóm quan hệ mờ.

Bảng 2.2: Giá trị đầu và giá trị cuối của các khoảng giải nghĩa được chọn. Các điểm dự báo Giá trị đầu khoảng Giá trị cuối khoảng Các điểm dự báo Giá trị đầu khoảng Giá trị cuối khoảng 01-2018 01-2019 697224 736869 02-2018 02-2019 644362 723653 03-2018 03-2019 644362 723653 04-2018 644362 723653 04-2019 670793 710438 05-2018 697224 736869 05-2019 644362 723653 06-2018 644362 723653 06-2019 670793 710438 07-2018 644362 723653 07-2019 644362 723653 08-2018 644362 723653 08-2019 670793 710438 09-2018 644362 723653 09-2019 670793 710438 10-2018 644362 723653 10-2019 670793 710438 11-2018 644362 723653 11-2019 644362 723653 12-2018 670793 684007 12-2019 644362 723653

Ví dụ tính toán dự báo sản lượng xăng dầu cho tháng 4/2018 với θ = 0.5, α = 0.5, sp = 0.3 và dp = - 0.2: Thực hiện các bước 1, 2, 3 và 4 bước như ở trên, sau đó tính toán ngữ nghĩa cho nhóm 3 tại bước 5 với nhóm quan hệ ngữ nghĩa A3 → (A1, A2, A5, A6) như sau:

Theo Bảng 2.2: Nhóm 3 có nhóm quan hệ ngữ nghĩa thuộc các khoảng u1 = [644362, 657577], u2 = [657578, 670792], u5 = [697224, 710438] và u6 = [710439, 723653]. Số dữ liệu thuộc khoảng, u1 gồm 4 giá trị: (655999, 647129, 650895 và 644362), u2 gồm 3 giá trị: (666487, 664976, 661889), u5 gồm 5 giá trị: (703654, 704357, 697979, 702023, 709985) và u6 gồm 3 giá

trị: (710859, 719812, 715524). Như vậy tổng số dữ liệu thuộc các khoảng u1, u2, u5, u6 của nhóm 3 là 15 và trọng số ngữ nghĩa của SA1 theo nhãn ngữ nghĩa A3 là WSA1A3 = 4/15, SA1 = 0.125; SA2 theo nhãn ngữ nghĩa A3 là WSA2A3 = 3/15, SA2 = 0.25; SA5 theo nhãn ngữ nghĩa A3 là WSA5A3 = 5/15, SA5 = 0.625; SA6 theo nhãn ngữ nghĩa A3 là WSA6A3 = 3/15, SA6 = 0.75. Vậy ngữ nghĩa của nhóm 4 là:

X(A3)=WSA1A3*SA1+WSA2A3*SA2+WSA5A3*SA5

+WSA6A3*SA6 = (4/15)*0.125 + (3/15)*0.25 + (5/15)*0.625 + (3/15)*0.75 = 0.441667

Khi đó: xs= (SA3) = 0.441667

Khoảng giải nghĩa dự báo được chọn cho tháng 4/2018 theo Bảng 2.1 là [644362, 723653].

Trước hết tính toán giá trị giải nghĩa tuyến tính cho phép ngữ nghĩa hóa phi tuyến theo hàm Denormalization (f(xs ,sp)) = (sp.x.(1-x)+x).(b-a) + a với

sp = 0.3: Denormalization (f(xs,sp)) = f(0.441667,0.3) = (0.3*0.441667*(1- 0.441667)+ 0.441667)*( 723653-644362) + 644362= 685248.101126

Tiếp tục tính giá trị giải nghĩa phi tuyến cho phép ngữ nghĩa hóa phi tuyến theo hàm (b – Denormalization (f(xs ,sp))) / (b-a) + Denormalization (f(xs ,sp))với dp = -0.2:

Nonlinear Denormalization (f(xs ,sps) = g(685248.101126,-0.2) g(685248.101126, -0.2) = (-0.2)*(685248.101126-644362)*(723653- 685248.101126)/(723653-644362)+ 685248.101126 = 681287.433259

Như vậy, giá trị dự báo sản lượng xăng dầu cho tháng 4/2018 theo hàm

((b – Denormalization (f(xs ,sp))) / (b-a) + Denormalization (f(xs ,sp))) là:

Kết luận Chương 2

Qua các bước minh họa trên có thể thấy cách tiếp cận theo đại số gia tử cho bài toán dự báo chuỗi thời gian phụ thuộc khá nhiều yếu tố: độ đo tính mờ của các gia tử, số nhãn ngôn ngữ được sử dụng (tương ứng số khoảng chia các đoạn), các tham số giải nghĩa… Để kiểm tra hiệu quả của phương pháp, chúng tôi sẽ thử nghiệm mô hình trong Chương 3.

CHƯƠNG 3. CÀI ĐẶT VÀ THỬ NGHIỆM

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng mô hình dự báo chuỗi thời gian bậc cao và thử nghiệm (Trang 31 - 42)

Tải bản đầy đủ (PDF)

(62 trang)