Thuật toán mô hình dự báo dựa trên chuỗi thời gian mờ của Jens Rún

Một phần của tài liệu (LUẬN văn THẠC sĩ) tiếp cận phân cụm chuỗi thời gian mờ trong dự báo tín dụng cho ngân hàng abbank (Trang 36 - 40)

Rúni Poulsen (hay Jens Poulsen)

Trong 15 năm gần đây, các mô hình chuỗi thời gian mờ (FTS) khác nhau đã được đề xuất. Các mô hình chuỗi thời gian mờ đã được sử dụng để đưa ra các dự đoán về thị trường chứng khoán, tuyển sinh đại học, tai nạn xe hơi ... Song và Chissom [7] đã giới thiệu khái niệm chuỗi thời gian mờ dựa trên lý thuyết tập mờ. Song và Chissom đã đưa ra dự báo về việc tuyển sinh của Đại học Alabama sử dụng chuỗi thời gian mờ bất biến thời gian và biến thiên thời gian. Sau đó, nhiều phương pháp dự báo mờ đã được trình bày với một mục tiêu là để tìm ra một kết quả dự báo tốt hơn hoặc để tính toán nhanh hơn. Sau khi xem xét các tài liệu, người ta nhận thấy rằng, các mô hình bậc cao hơn có khả năng nhận thức chính xác hơn. Mô hình có bậc càng tăng thì càng ít sử dụng dữ liệu hơn. Nhiều tác giả đã đưa ra chi tiết về sự mờ hóa của dữ liệu, nhưng chỉ có cách tiếp cận giải mờ đúng đắn đã được trình bày bởi Jens Poulsen [6]. Jens Poulsen đã phát triển một thuật toán của mô hình dự báo dựa trên chuỗi thời gian mờ, cung cấp tỷ lệ chính xác dự báo cao hơn so với các đối tượng bậc cao khác cũng như đề xuất phương pháp cải thiện việc sử dụng dữ liệu.

37

Bước 1: Xác định tập vũ trụ (tập nền) U và phân vùng nó vào khoảng cách tương đương nhau

Tập vũ trụ U được định nghĩa là [Xmin - X1, Xmax + X2] U = [Xmin - X1, Xmax + X2]

trong đó:

XminXmax là những giá trị lịch sử nhỏ nhất và lớn nhất.

Các biến X1X2 là hai số dương, được lựa chọn phù hợp theo giới hạn dữ liệu.

Bước 2: Mờ hóa dữ liệu lịch sử

Thuật toán mờ hóa (FA) đề xuất bởi Jens Rúni Poulsen [6] tạo ra một loạt các tập mờ hình thang từ một tập dữ liệu được sắp xếp trước và bắt đầu mối liên hệ giữa các giá trị trong tập dữ liệu và các tập mờ được tạo ra. Thuật toán này được lấy cảm hứng từ phương pháp mờ hóa hình thang đề xuất bởi Cheng và cộng sự [4]. Các tập mờ hình thang có ranh giới chồng chéo được sử dụng ở đây thay vì khoảng thời gian rõ nét, mà được định nghĩa bởi người sử dụng ở bước đầu tiên của thời gian mờ. Sự chồng chéo này hàm ý rằng một giá trị có thể thuộc nhiều tập. Nếu một giá trị thuộc nhiều tập hợp, nó sẽ được kết hợp với tập hợp mà ở đó mức độ thành viên của nó là tối đa. Thuật toán mờ hóa (FA) tự động tính toán các khoảng / tập mờ.

Ý tưởng cơ bản của thuật toán là lặp lại thủ tục mờ hóa khi tập dữ liệu được cập nhật. Thủ tục này là một quy trình gồm sáu bước như sau:

1. Sắp xếp các giá trị theo thứ tự tăng dần.

2. Tính khoảng cách trung bình giữa hai giá trị liên tiếp trong bộ dữ liệu

được sắp xếp và độ lệch tiêu chuẩn tương ứng. Khoảng cách trung bình được cho bởi phương trình như sau:

38

 Khoảng cách trung bình (𝑥1… . . 𝑥𝑛) = 1

𝑛−1∑𝑛−1𝑖−1 |𝑥𝑝(𝑖) − 𝑥𝑝(𝑖+1)|

 Độ lệch tiêu chuẩn được tính là σ: 𝜎 = √1

𝑛∑ 𝑥𝑖

𝑛 𝑖−1

− 𝑘ℎ𝑜ả𝑛𝑔 𝑐á𝑐ℎ 𝑡𝑟𝑢𝑛𝑔 𝑏ì𝑛ℎ)

3. Loại bỏ các giá trị ngoại lai từ bộ dữ liệu được sắp xếp. Một giá trị

ngoại lai, trong ngữ cảnh này, được định nghĩa là một giá trị nhỏ hơn hoặc lớn hơn một độ lệch chuẩn so với mức trung bình.

4. Tính toán khoảng cách trung bình được sửa đổi giữa hai giá trị còn lại

tiếp theo trong tập dữ liệu được sắp xếp.

5. Tập vũ trụ được tính bằng cách lấy khoảng cách trung bình được sửa

đổi từ giá trị thấp nhất và thêm khoảng cách trung bình được sửa đổi vào giá trị cao nhất.

6. Tập dữ liệu mờ sử dụng phương pháp tiếp cận mờ hóa hình thang. Sử

dụng các hàm hình thang, mức độ thành viên, cho một hàm μA và một giá trị xác định x, được lấy theo phương trình sau đây:

𝝁𝑨 = { 𝑥 − 𝑎1 𝑎2− 𝑎1, 𝑎1 ≤ 𝑥 ≤ 𝑎2 1, 𝑎1 ≤ 𝑥 ≤ 𝑎2 𝑎4 − 𝑥 𝑎4 − 𝑎3, 𝑎3 ≤ 𝑥 ≤ 𝑎4 𝑧𝑒𝑟𝑜, 𝑛ế𝑢 𝑘ℎô𝑛𝑔 𝑡ℎì

Số lượng các tập con được xác định trên U và được tính bởi:

Ns = Ru - S / 2S

trong đó:

39

Trong phương trình này, S biểu diễn độ dài đoạn. S = Ru / 2 Ns +1. Phạm vi, Ru, được tính bởi = (Upper Bound - Lower Bound), ở đó các giới hạn trên = (Xmax + Khoảng cách trung bình đã được chỉnh sửa) và giới hạn dưới = (Xmax - Khoảng cách trung bình đã được chỉnh sửa) của U.

Độ dài đoạn, S tương đương với Khoảng cách trung bình đã được chỉnh sửa, từ đó tạo thành chiều dài của chiều dài lan truyền trái, chiều dài lõi và chiều dài lan truyền phải của hàm thành viên. Trong hàm thành viên hình thang chiều dài lan truyền trái, chiều dài lõi và chiều dài lan truyền phải là bằng với khoảng cách trung bình đã được chỉnh sửa.

Bước 3: Xác định các mối quan hệ mờ và các nhóm để dự đoán

Mối quan hệ được xác định từ các dữ liệu lịch sử đã được mờ hóa. Nếu biến chuỗi thời gian F(t-1) được mờ hóa thành AiF(t) thành Aj, thì Ai có liên quan đến Aj. Mối quan hệ này được gọi là Ai Aj, trong đó Ai là trạng thái hiện tại của sự kiện và Aj là trạng thái tiếp theo của sự kiện đó.

Tập hợp đầy đủ các mối quan hệ được xác định từ dữ liệu tập mờ. Tương tự mối quan hệ xảy ra nhiều hơn một lần được bỏ qua vì có thể chỉ có một sự kết hợp duy nhất. Việc thiết lập các nhóm mối quan hệ mờ được thực hiện bằng cách xác định các tập mờ với nhiều mối quan hệ tương tự và hợp nhất phía bên tay phải của mối quan hệ mờ.

Các nhóm quan hệ mờ bậc hai cũng được thiết lập bởi thuật toán này như

F(t-2), F(t-1), F(t). Tuy nhiên, nếu có hai (tập mờ) giống nhau khác tồn tại về bên trái cho một nhóm mối quan hệ mờ đặc biệt, thì quan hệ bậc ba tương ứng được thiết lập như F(t-3), F(t-2), F(t-1), F(t ).

Thuật toán lấy giá trị dự đoán từ tập số mờ dự đoán và do đó tất cả các dự đoán được thực hiện.

40

Một phần của tài liệu (LUẬN văn THẠC sĩ) tiếp cận phân cụm chuỗi thời gian mờ trong dự báo tín dụng cho ngân hàng abbank (Trang 36 - 40)