Biến ngôn ngữ và giá trị ngôn ngữ

Một phần của tài liệu (LUẬN văn THẠC sĩ) tiếp cận phân cụm chuỗi thời gian mờ trong dự báo tín dụng cho ngân hàng abbank (Trang 25)

Số mờ đóng vai trò quan trọng trong việc xây dựng biến mờ định lượng

là biến có trạng thái định bởi các số mờ. Khi các số mờ biểu diễn cáckhái niệm

𝜇𝐴(𝑥) = { 0 , 𝑥 < 𝑎 − 𝑐 (𝑥 − 𝑎 + 𝑐)/𝑐 , 𝑎 − 𝑐 ≤ 𝑥 < 𝑎 1 , 𝑎 ≤ 𝑥 ≤ b (𝑏 + 𝑑 − 𝑥)/𝑑 , 𝑏 < 𝑥 ≤ 𝑏 + 𝑑 0 , 𝑏 + 𝑑 < 𝑥 𝜇𝐴(𝑥) = { 𝑥 − 𝑎 𝑏 − 𝑎 , 𝑎 ≤ 𝑥 ≤ 𝑏 𝑐 − 𝑥 𝑐 − 𝑏 , 𝑏 ≤ 𝑥 ≤ 𝑐 0 , 𝑛ế𝑢 𝑘ℎô𝑛𝑔 𝑡ℎì

26

ngôn ngữ như rất nhỏ, nhỏ, trung bình, lớn, rất lớn,… trong một ngữ cảnh cụ thể, biến mờ được gọi là biến ngôn ngữ.

Biến ngôn ngữ được xác định theo một biến cơ sở trên một tập cơ sở là số thực trên một khoảng cụ thể. Biến cơ sở có thể là: điểm, tuổi, lãi suất,lương, nhiệt độ,…Trong một biến ngôn ngữ, các trị ngôn ngữ biểu diễn cácgiá trị xấp xỉ của biến cơ sở, các trị ngôn ngữ này là các số mờ.

Ví dụ 4: Xét biến ngôn ngữ là nhiệt độ của một lò. Biến cơ sở lànhiệt độ. Nhiệt độ lò từ 100oC đến 1000oC hay tập cơ sở X=[10,100]. Dải nhiệt độ từ 100oC đến 1000oC được chia thành các dải nhiệt độ rất thấp (RT), thấp (T), trung bình (TB), cao (C), rất cao (RC). Tập trị ngôn ngữ T={RT, T, TB, C, RC}. Các tập mờ cho các giá trị ngôn ngữ như hình sau:

Hình 1.12. Những tập mờ thuộc biến ngôn ngữ nhiệt độ 1.5 Giải mờ

Trong điều khiển mờ cũng như trong lập luận trong các hệ chuyên gia với các luật tri thức mở, dữ liệu đầu ra nhìn chung đều là những tập mờ. Thực tế cũng thường gặp nhu cầu chuyển đổi dữ liệu mờ đầu ra thành giá trị thực một cách phù hợp. Phương pháp chuyển đổi như vậy được gọi là phương pháp giải mờ.

27

Căn cứ theo những quan niệm khác nhau về phần tử đại diện xứng đáng mà ta sẽ có các phương pháp giải mờ khác nhau. Trong điều khiển người ta thường dùng hai phương pháp chính:

o Phương pháp điểm cực đại o Phương pháp điểm trọng tâm

1.5.1 Phương pháp điểm cực đại

Tư tưởng chính của phương pháp giải mờ điểm cực đại là tìm trong tập mờ có hàm thuộc µR(y), một phần tử 𝑦0với độ phụ thuộc lớn nhất, tức là:

𝑦0 = arg maxy µR (y) (1.1)

Tuy nhiên, việc tìm 𝑦0 theo công thức (1.1) có thể đưa đến vô số nghiệm (hình 1.13b), nên ta phải đưa thêm những yêu cầu cho phép chọn trong số các nghiệm đó một giá trị 𝑦0 cụ thể chấp nhận được. Việc giải mờ theo phương pháp cực đại gồm hai bước:

 Xác định miền chứa giá trị rõ 𝑦0. Giá trị rõ 𝑦0là giá trị mà tại đó hàm thuộc đạt giá trị cực đại (bằng độ thỏa mãn đầu vào H), tức là miền:

G = { y Y | µR(y) = H }

 Xác định 𝑦0 có thể chấp nhận được từ G

Trong hình 1.13b thì G là khoảng [ y1, y2] của tập nền R. Trường hợp có vô số nghiệm thì để tìm 𝑦0ta có hai cách:

o Cách 1: Xác định điểm trung bình: 𝑦0 =y1+ 𝑦2

2

Nếu các hàm thuộc đều có dạng hình tam giác hoặc hình thang thì điểm 𝑦0xác định theo phương pháp này sẽ không quá bị nhạy cảm với sự thay đổi của giá trị đầu vào rõ 𝑥0. Do đó rất thích hợp với các bài toán có nhiễu biên độ nhỏ tại đầu vào.

28

o Cách 2: Xác định điểm cận trái hoặc cận phải 𝑦0 = inf 𝑦∈𝐺(𝑦) Hoặc 𝑦0 = sup 𝑦∈𝐺 (𝑦)

Nếu các hàm thuộc đều có dạng hình tam giác hoặc hình thang thì điểm 𝑦0 sẽ phụ thuộc tuyến tính vào giá trị rõ 𝑥0 tại đầu vào

Hình 1.13. Giải mờ bằng phương pháp điểm cực đại

1.5.2 Phương pháp điểm trọng tâm

Phương pháp điểm trọng tâm sẽ cho kết quả 𝑦0 là hoành độ của điểm trọng tâm, miền được bao phủ bởi trục hoành và đường µR(y) - hình 1.14a Phương pháp điểm trọng tâm xuất phát từ ý tưởng mọi giá trị của S đều được đóng góp với trọng số vào việc xác định giá trị khử mờ của tập mờ R, ở đây trọng số của nó là độ thuộc của phần tử vào tập mờ R. Theo nghĩa thông thường của trọng tâm, công thức tính giá trị khử mờ có dạng sau:

𝑦0 = ∫ 𝑦µ𝑆 𝑅(𝑦)𝑑𝑦 ∫ µ𝑆 𝑅(𝑦)𝑑𝑦

Với S = supµR(y) = {y| µR(y) ≠0} là miền xác định của tập mờ R.

Đây là phương pháp ưa được sử dụng nhất. Nó cho phép ta xác định giá trị 𝑦0 với sự tham gia của tất cả các tập mờ đầu ra của luật điều khiển một cách bình

29

đẳng và chính xác. Tuy nhiên, phương pháp này lại không để ý được tới độ thỏa mãn của mệnh đề điều khiển cũng như thời gian tính lâu. Ngoài ra một trong những nhược điểm cơ bản của phương pháp này là giá trị 𝑦0xác định được lại có độ thuộc nhỏ nhất, thậm chí bằng 0 (hình1.14b).

30

CHƯƠNG 2: KHÁI NIỆM VỀ CHUỖI THỜI GIAN MỜ VÀ CÁC PHƯƠNG PHÁP

2.1 Khái niệm về chuỗi thời gian mờ

2.1.1 Định nghĩa chuỗi thời gian mờ

Giả sử U là không gian nền, không gian nền này xác định một tập hợp các đối tượng cần nghiên cứu. Nếu A là một tập con rõ của U thì ta có thể xác định chính xác một hàm đặc trưng:

𝜇𝐴(𝑥) = {

0 𝑛ế𝑢 𝑥 𝑛ằ𝑚 𝑛𝑔𝑜à𝑖 𝐴 1 𝑛ế𝑢 𝑥 𝑛ằ𝑚 𝑡𝑟𝑜𝑛𝑔 𝐴

Nhưng với một tập mờ B trong không gian nền U thì phần tử x không xác định chính xác được. Khi đó ta có định nghĩa:

𝜇𝐴 : U  [0.1]

𝜇𝐴 được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì hàm 𝜇𝐴(u) được gọi là độ thuộc của u vào tập mờ A. Giả sử Y(t) là chuỗi thời gian (t = 0, 1, 2,…)

U là tập nền chứa khoảng giá trị của chuỗi thời gian từ nhỏ nhất đến lớn nhất.

Xác định hàm thuộc 𝜇𝐴: U  [0.1] của tập mờ A, còn tập A trên không gian nền U được viết như sau:

A = {( 𝜇𝐴(u1) / u1, 𝜇𝐴(u2) / u2,…, 𝜇𝐴(un )/ un,: ui U; i = 1, 2, …, n}

𝜇𝐴(ui) là độ thuộc của uivào tập A hay cách viết khác: 𝐴 = 𝐴𝑢1 𝑢1 + 𝐴𝑢2 𝑢2 + ⋯ 𝐴𝑢𝑛 𝑢𝑛

31

2.1.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ

- Định nghĩa 1 :Y(t) (t =...0,1,2,...) là một tập con của R1. Y(t) là tập nền trên đó xác định các tập mờ fi(t). F(t) là tập chứa các tập fi(t) (i = 1,2,...). Khi đó ta gọi F(t)chuỗi thời gian mờ xác định trên tập nền Y(t).

- Định nghĩa 2:Tại các thời điểmtt-1có tồn tại một mối quan hệmờ giữa

F(t)F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) trong đó * là ký hiệu của một toán tử xác định trên tập mờ. R(t-1, t)mối quan hệ mờ. Ta cũng có thể ký hiệu mối quan hệ mờ giữa F(t)F(t-1) bằng F(t-1)F(t).

Nếu đặt F(t-1) = AiF(t) = Aj thì ta ký hiệu mối quan hệ logic mờ giữa chúng như sau: AiAj.

- Định nghĩa 3: Nhóm các mối quan hệmờ.

Các mối quan hệ logic có thể gộp lại thành một nhóm nếu trong ký hiệu trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải. Thí dụ nếu ta có các mối quan hệ: AiAk ; AiAm thì ta có thể gộp chúng thành nhóm các mối quanhệ logic mờ sau: Ai Ak,Am.

- Định nghĩa 4: Giả sử F(t) suy ra từ F(t-1)F(t) = F(t-1) * R(t-1, t) với mọi t. Nếu R(t-1, t) không phụ thuộc vào t thì F(t) được gọi là chuỗi thời gian mờ dừng, còn ngược lại ta có chuỗi thời gian mờ không dừng.

- Định nghĩa 5: Giả sửF(t)suy đồng thời từ F(t-1), F(t-2),…,F(t-m) m>0 và là chuỗi thời gian mờ dừng. Khi đó mối quan hệ mờ có thể viết được F(t-1), F(t-2),…, F(t-m) F(t) và gọi đó là mô hình dựbáo bậc m của chuỗi thời gian mờ.

32

2.2 Một số thuật toán dự báo trong mô hình chuỗi thời gian mờ

2.2.1 Thuật toán của Song & Chissom

Song et. al. và Chissom đã đưa ra đề xuất mô hình thuật toán mô tả chuỗi thời gian mờ vào năm 1993 [7]:

Giả sử U là không gian nền: U = {u1, u2,…, un}. Tập A là mờ trên không gian nền U nếu A được xác định bởi hàm:

𝜇𝐴: U  [0.1]

𝜇𝐴 được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì hàm 𝜇𝐴(u) được gọi là độ thuộc của u vào tập mờ A.

Tập mờ A trên không gian nền U được viết như sau: 𝐴 = 𝜇𝐴𝑢1 𝑢1 + 𝜇𝐴𝑢 2 𝑢2 + ⋯ 𝜇𝐴𝑢 𝑛 𝑢𝑛 Thuật toán gồm các bước như sau:

Bước1:Xác định tập vũ trụ U trên đó các tập mờ được xác định.

Bước 2: Chia các tập nền U thành một số các đoạn bằng nhau.

Bước 3: Xác định các biến ngôn ngữ để diễn tả các tập mờ trên các khoảng đã chia của tập nền.

Bước 4: Mờhoá các giá trị lịch sửcủa chuỗi thời gian.

Bước 5: Chọn tham số w >1 thích hợp và tính Rw(t,t-1) và dự báo theo công thức sau: F(t) = F(t - 1)*Rw(t, t - 1)

33

Trong đó F(t) là giá trị dự báo mờ tại thời điểm t còn F(t-1) là giá trị dự báo mờ tại thời điểm t -1. Mối quan hệ mờ được tính như sau:

Rw(t, t - 1) = FT(t – 2) × F(t - 1) FT(t - 3) × F(t - 2) FT(t - w) × F(t – w + 1)

Trong đó T là toán tử chuyển vị, dấu “×” là toán tử tích Cartesian còn w

được gọi là “tham số cơ sở” mô tả số lượng thời gian trước thời điểm t.

Bước 6: Giải mờgiá trịdựbáo mờ.

2.2.2 Thuật toán của Chen

Chen đã có một số cải tiến thay vì để tính mối quan hệ mờ bằng các phép tính min-max chỉ cần sử dụng các phép tính số học đơn giản [8]. Để thực hiện được công việc này, Chen đã đề xuất khái niệm nhóm quan hệ mờ và sử dụng khái niệm này như giá trị dự báo mờ. Công việc giải mờ thực hiện đơn giản là tính giá trị trung bình của tổng các điểm giữa của khoảng. Thuật toán của Chen bao gồm một số bước sau:

Bước 1: Xác định tập U bao gồm khoảng giá trị của chuỗi thời gian. Khoảng này xác định từ giá trị nhỏ nhất đến giá trị lớn nhất có thể của chuỗi thời gian.

Bước 2: Chia khoảng giá trị và xác định các tập mờ trên tập U.

Bước 3: Mờ hoá các dữ liệu chuỗi thời gian.

Bước 4: Thiết lập các mối quan hệ mờ và nhóm các quan hệ mờ.

Bước 5: Sử dụng các quy tắc xác định các giá trị dự báo trên nhóm các quan hệ mờ.

34

Bước 6: Dự báo và giải mờ. Trong bước dự báo chuỗi thời gian mờ được thực hiện như sau:

Trường hợp 1: Nếu AjAi và giá trị hàm thuộc của Aj đạt giá trị

maximum tại đoạn uivà điểm giữa của ui mi thì dự báo của chuỗi thời gian tại thời điểm imi.

Trường hợp 2: Nếu ta có các mối quan hệ logic mờ hình thành nhóm quan hệ logic mờ sau:

Ai Aj1,Aj2,...Ajp

thì giá trị dự báo sẽ là Ai1,Ai2, Aj1,...Ajp

Khi đó giải mờ giá trị dự báo sẽ là: 𝑚𝑗1+ 𝑚𝑗2+ ⋯ + 𝑚𝑗𝑝

𝑝

Trong đó mj1, mj2, ... m1p là điểm giữa của các đoạn ui

Trường hợp 3: Nếu vế phải của mối quan hệ mờ là trống như trường hợp sau:

Ai∅

thì giá trị dự báo sẽ là Ai và giải mờ giá trị này sẽ là trung điểm mi của đoạn ui.

2.3 Một số phương pháp chia khoảng

Trong phần này, tôi giới thiệu hai phương pháp chia khoảng dựa trên sự phân bố giá trị và dựa trên giá trị trung bình [9].

35

2.3.1 Phương pháp độ dài dựa trên sự phân bố giá trị

Đặc trưng của phương pháp chia khoảng này là: Dựa vào độ dài bảng cơ sở cho trước và sự tích lũy của hiệu các độ dài. Chọn độ dài của khoảng có sự tích lũy lớn nhất nhưng phải nhỏ hơn nửa số lượng tích lũy của các hiệu độ dài.

Phương pháp này được thực hiện như sau:

1.Tính toàn bộ hiệu số tuyệt đối giữa các giá trị fi + 1fi(i = 1, …, n - 1), hiệu số bậc một và trung bình của hiệu số bậc một.

2. Dựa vào trung bình của hiệu số bậc một, xác định cơ sở độ dài của khoảng dựa vào bảng ánh xạ cơ sở (Bảng 2.1)

Phạm vi Cơ sở 0.1-1.0 0.1 1.1- 10 1 11-100 10 101-1000 100 Bảng 2.1. Cơ sở ánh xạ

3.Lập bảng ghi lại sự phân bố tích lũy của sai phân cấp một.

4. Theo cơ sở xác định ở bước 2 và kết quả bước 3, chọn độ dài của khoảng có sự tích lũy lớn nhất nhưng phải nhỏ hơn nửa số lượng tích lũy của các hiệu độ dài của sự khác biệt.

2.3.2 Phương pháp độ dài dựa trên giá trị trung bình

Đặc trưng của phương pháp chia khoảng này là: Dựa vào một nửa trung bình của hiệu số bậc một và bảng cơ sở cho trước để xác định độ dài của khoảng.

36

1.Tính toàn bộ hiệu số tuyệt đối giữa các giá trị fi + 1fi (i = 1, …, n - 1), hiệu số bậc một và trung bình của hiệu số bậc một.

2.Lấy một nửa giá trị trung bình của hiệu số độ dài ở bước 1.

3.Theo độ dài trong bước 2, xác định cơ sở cho độ dài của khoảng bằng cách dựa vào (Bảng 2.1).

4.Làm tròn độ dài theo bảng cơ sở để xác định độ dài của khoảng.

2.4 Thuật toán mô hình dự báo dựa trên chuỗi thời gian mờ của Jens Rúni Poulsen (hay Jens Poulsen) Rúni Poulsen (hay Jens Poulsen)

Trong 15 năm gần đây, các mô hình chuỗi thời gian mờ (FTS) khác nhau đã được đề xuất. Các mô hình chuỗi thời gian mờ đã được sử dụng để đưa ra các dự đoán về thị trường chứng khoán, tuyển sinh đại học, tai nạn xe hơi ... Song và Chissom [7] đã giới thiệu khái niệm chuỗi thời gian mờ dựa trên lý thuyết tập mờ. Song và Chissom đã đưa ra dự báo về việc tuyển sinh của Đại học Alabama sử dụng chuỗi thời gian mờ bất biến thời gian và biến thiên thời gian. Sau đó, nhiều phương pháp dự báo mờ đã được trình bày với một mục tiêu là để tìm ra một kết quả dự báo tốt hơn hoặc để tính toán nhanh hơn. Sau khi xem xét các tài liệu, người ta nhận thấy rằng, các mô hình bậc cao hơn có khả năng nhận thức chính xác hơn. Mô hình có bậc càng tăng thì càng ít sử dụng dữ liệu hơn. Nhiều tác giả đã đưa ra chi tiết về sự mờ hóa của dữ liệu, nhưng chỉ có cách tiếp cận giải mờ đúng đắn đã được trình bày bởi Jens Poulsen [6]. Jens Poulsen đã phát triển một thuật toán của mô hình dự báo dựa trên chuỗi thời gian mờ, cung cấp tỷ lệ chính xác dự báo cao hơn so với các đối tượng bậc cao khác cũng như đề xuất phương pháp cải thiện việc sử dụng dữ liệu.

37

Bước 1: Xác định tập vũ trụ (tập nền) U và phân vùng nó vào khoảng cách tương đương nhau

Tập vũ trụ U được định nghĩa là [Xmin - X1, Xmax + X2] U = [Xmin - X1, Xmax + X2]

trong đó:

XminXmax là những giá trị lịch sử nhỏ nhất và lớn nhất.

Các biến X1X2 là hai số dương, được lựa chọn phù hợp theo giới hạn dữ liệu.

Bước 2: Mờ hóa dữ liệu lịch sử

Thuật toán mờ hóa (FA) đề xuất bởi Jens Rúni Poulsen [6] tạo ra một loạt các tập mờ hình thang từ một tập dữ liệu được sắp xếp trước và bắt đầu mối liên hệ giữa các giá trị trong tập dữ liệu và các tập mờ được tạo ra. Thuật toán này được lấy cảm hứng từ phương pháp mờ hóa hình thang đề xuất bởi Cheng và cộng sự [4]. Các tập mờ hình thang có ranh giới chồng chéo được sử dụng ở đây thay vì khoảng thời gian rõ nét, mà được định nghĩa bởi người sử dụng ở bước đầu tiên của thời gian mờ. Sự chồng chéo này hàm ý rằng một giá trị có thể thuộc nhiều tập. Nếu một giá trị thuộc nhiều tập hợp, nó sẽ được kết hợp với tập hợp mà ở đó mức độ thành viên của nó là tối đa. Thuật toán mờ hóa (FA) tự động tính toán các khoảng / tập mờ.

Ý tưởng cơ bản của thuật toán là lặp lại thủ tục mờ hóa khi tập dữ liệu được cập nhật. Thủ tục này là một quy trình gồm sáu bước như sau:

1. Sắp xếp các giá trị theo thứ tự tăng dần.

2. Tính khoảng cách trung bình giữa hai giá trị liên tiếp trong bộ dữ liệu

được sắp xếp và độ lệch tiêu chuẩn tương ứng. Khoảng cách trung bình được

Một phần của tài liệu (LUẬN văn THẠC sĩ) tiếp cận phân cụm chuỗi thời gian mờ trong dự báo tín dụng cho ngân hàng abbank (Trang 25)