NGHIÊN CỨU MÔ HÌNH HỆ LUẬT MỜ VÀ HỆ LAI CHO CÔNG TÁC PHÂN TÍCH DỰ BÁO Vũ Thanh Nguyên* 1 Áp dụng mô hình hệ luật mờ và thuật toán di truyền trong công tác phân tích dự báo 1 1 Mô hình hệ luật mờ (Stan[.]
Tạp chí KHOA HỌC ĐHSP TP.HCM Số 10 năm 2007 NGHIÊN CỨU MƠ HÌNH HỆ LUẬT MỜ VÀ HỆ LAI CHO CƠNG TÁC PHÂN TÍCH DỰ BÁO Vũ Thanh Ngun* Áp dụng mơ hình hệ luật mờ thuật tốn di truyền cơng tác phân tích dự báo 1.1 Mơ hình hệ luật mờ (Standard Additive Model - SAM) Việc sử dụng mơ hình mạng neuron [4] cho tốn xấp xỉ cịn nhiều nhược điểm Trước hết khả học mạng neuron Hơn nữa, việc xác định cấu trúc mạng neuron phù hợp cho số liệu cơng việc khó khăn Chính hạn chế nói mạng neuron mà chuyên gia xây dựng cấu trúc đặc biệt để xây dựng hệ thống xấp xỉ, hệ luật mờ Có thể nói hướng tiếp cận thật mẻ chưa nhiều tác giả quan tâm Mơ hình hệ luật mờ cộng chuẩn : hệ luật mờ hệ thống m luật mờ dạng □ j : IF x = Aj THEN y = B j ; j = 1, m , hoạt động theo chế song song Tuy nhiên, đặc tính thuận lợi tính tốn (tính tích phân để xác định trọng tâm), báo đề cập đến hệ luật mờ hoạt động theo qui tắc kết hợp SUM-PRODUCT Trong hệ mờ SAM, ứng với giá trị vào x = x0 , luật thứ j : □ j kích hoạt cho kết tập mờ B′ j xác định theo Bj mức độ thỏa mãn vế trái a j (x0 ) dựa qui tắc PRODUCT B′ j = a j (x0 ) × Bj m kết B′ j luật hệ luật SAM kết hợp theo qui tắc SUM kết chung toàn hệ thống tập mờ B ta có : m B= ∑w j B′ j = j =1 m ∑ w j a j (x0 ).B j j=1 m B= (1) m ∑w j B′ j = ∑w j a j (x0 ).B j j=1 j=1 Giá trị B khử mờ để nhận giá trị rõ * TS, Sở Bưu Viễn thơng Tp.HCM Ứng dụng SAM cho xấp xỉ hàm phi tuyến : theo (1), hệ SAM hoạt động ánh xạ : F : □ n →□ p Chính nhờ đặc trưng mà với hàm phi tuyến liên tục giới hạn f (x) f : U ⊂ □ n →□ p , với U tập compact, ta ln có , thể xây dựng hệ mờ SAM : F : □ n →□ p cho phép xấp xỉ f F Cũng mô hình xấp xỉ khác, mơ hình xấp xỉ mờ hàm phi tuyến SAM tương ứng với giá trị sai số định Gọi e giá trị sai số mơ hình xấp xỉ SAM, ta có e = max{ f (x) − F(x) x∈X Giả sử f hàm số xấp xỉ, ε > cho trước Định nghĩa : ε − close = {F hệ mờ xấp xỉ f : f (x) − F(x) ≤ ε , ∀∈ X} Dưới góc độ khảo sát đồ thị, khả xấp xỉ hệ mờ F hàm phi tuyến y = f (x) thể sau : – Mỗi luật mờ hệ mờ hoạt động theo chế xấp xỉ cho phép tương ứng với tập mờ vào A j tập mờ kết Bj – Thơng qua việc kết hợp khối mờ hình thành từ luật mờ □ j lấy trung bình khối mờ chúng chồng lấp lẫn nhờ vào chế khử mờ phương pháp trọng tâm, hệ mờ SAM F bao phủ đồ thị biểu diễn hàm f (x) mà xấp xỉ Cơ chế học SAM : trình học SAM thơng thường bao gồm hai bước học cấu trúc học tham số Tuy nhiên, hiệu học hệ tốt hơn, nhóm nghiên cứu phối hợp thêm chế học tối ưu hệ luật Do đó, q trình học SAM bao gồm giai đoạn sau : – Tự phát sinh cấu trúc luật : thực theo chế tự học Bằng cách thực việc phân lớp mờ liệu học, hệ SAM tự phát luật mờ cần thiết cho việc xấp xỉ hàm phi tuyến cho số liệu học – Điều chỉnh thơng số : điều chỉnh thông số hệ luật : trọng số luật, trọng tâm kích thước tập mờ tham gia vế trái vế phải luật – Tối ưu hóa hệ luật : cho phép SAM phát loại bỏ luật mờ không cần thiết cho hoạt động xấp xỉ nó, nhằm tăng đáng kể tốc độ xử lí giảm nhiễu Học cấu trúc : giai đoạn bắt đầu hệ SAM chưa có tri thức Bài tốn học cấu trúc phát biểu sau : Cho trước liệu học vào {xj} kết mong muốn {y j } , j = 1, ntd ; với ntd : số liệu học Cho trước dạng hàm phụ thuộc tập mờ Hãy xây dựng phân lớp mờ P({xj | yj}) số liệu học Trên sở đó, xác định tập mờ hàm phụ thuộc tương ứng để từ phát sinh luật mờ hệ mờ SAM có khả xấp xỉ cách tốt hàm phi tuyến y = f (x) đặc trưng liệu học Việc giải toán tiến hành theo hai bước sau : Xác định tập mờ thuật toán phân lớp liệu mờ Gọi □ khơng gian vector có n thành phần thực Đặt n X = {x1 , x2 , , xntd}, x j ∈□ n tập hữu hạn số liệu học, ntd số liệu học Gọi V không gian vector ma trận c× n, c∈□ + c n cho trước, < c < n Xác định phân lớp mờ X biểu diễn vector trọng tâm : V = {v1 , v2 , , vc}, vi ∈ □ n Cho tương ứng với ma trận U = {uij}∈ Vcn , với uij giá trị thực đoạn [ 0,1] diễn tả mức độ phụ thuộc số liệu học x ứng với vector trọng tâm vi , thỏa hai điều j kiện sau : ∀x ∈ X, uij ∈[ 0,1] , c u ij = ∑ k=1 ntd ∀i, j = 1, c : 0< ∑ u ij < n j=1 Nhiệm vụ đặt toán phân lớp mờ phải làm giảm thiểu giá trị hàm mục tiêu J xác định U V có dạng sau : J(U, V) = ∑ ∑ ∑g[w(x ), u i=1 x j∈X k=1 i ij ]d(x j , v k ) : w(x ) trọng số khởi đầu xi, d(x , v ) độ đo biểu diễn mức độ i j k khác biệt x vector trọng tâm phân lớp thứ k v Độ đo chọn phải j k : thỏa hai tính chất sau : d(x j , vk ) > d(x j , vk ) = d(vk , x j) Hiện có nhiều thuật tốn đề cập đến vấn đề thuật toán phân lớp mờ trung bình (FCM) [1], thuật tốn FCM cải tiến với phân lớp mờ dẫn đầu [1]… Đa số thuật tốn có mục tiêu chung xác định V Giá trị U xác định cách tuyệt đối tương đối thông qua đại lượng khác nhằm mục đích hạn chế thao tác xử lí tài nguyên sử dụng Một phương pháp phân lớp theo hướng tiếp cận tựa FCM phương pháp dùng vector lượng tử thích nghi [1] Giống vector V thuật toán FCM, vector lượng tử dùng cơng cụ để dị tìm phân lớp mờ Xây dựng luật mờ : Sau thực trình phân lớp mờ, công việc xây dựng luật mờ từ phân lớp Dựa thơng tin phân lớp mờ : trọng tâm vector lượng tử qi , người ta tiến hành xây dựng luật mờ Trọng tâm tập mờ dễ dàng xác định thơng qua tọa độ vector lượng tử Nhưng để xác định dạng hàm thành viên đòi hỏi phải xác định độ rộng tập mờ Kosko [1] với đề nghị sử dụng luật mờ dạng ellipse thuật toán phân lớp mờ thông qua vector lượng tử với chế học cạnh tranh cung cấp chế giúp xác định xác độ rộng tập mờ thông qua tâm ellipse độ nghiêng chúng Tuy nhiên phương pháp có nhiều trở ngại mức độ phức tạp cài đặt Điều chỉnh thông số : luật mờ xác định, học điều chỉnh thông số giúp giảm sai số kết hệ kết mong muốn Bài toán phát biểu sau : Cho trước liệu học vào {x j} kết mong muốn {yj}, j = 1, ntd ; với ntd : số liệu học Cho hệ luật mờ SAM với luật mờ trọng số Hãy điều chỉnh thông số tập mờ vế trái, vế phải trọng số luật mờ cho sai số kết cho hệ luật mờ kết mong muốn ổn định nhỏ Quá trình học điều chỉnh thông số tiến hành dựa luật học sai số nhỏ Luật học sai số nhỏ áp dụng cho tham số ξ SAM có dạng : ξ (t +1) = ξ (t) − µ ∂ E t ∂ξ Trong µt hệ số học biến đổi theo thời gian có xu hướng giảm dần Mục đích giai đoạn học điều chỉnh thơng số tối thiểu bình phương sai số : E(x) = (f (x) − F(x))2 Sai số xấp xỉ hệ luật mờ phụ thuộc vào tham số tham gia vào hệ, bao gồm : tập mờ vế trái Aji , tập mờ vế phải Bj , trọng số w j Tối ưu hệ luật thuật toán di truyền (Genetic Algorithm - GA) Về mặt lí thuyết, hệ SAM có nhiều luật độ xác hoạt động xấp xỉ lớn Tuy nhiên, hệ có nhiều luật thời gian cho trình xử lí hệ luật yếu tố đáng quan tâm Một hệ luật tối ưu giữ lại số (hoặc tất cả) luật ban đầu hệ SAM Mỗi luật giữ lại cho tương ứng với giá trị 1, luật bị loại cho tương ứng với giá trị Bài toán tối ưu hệ luật phát biểu sau : Cho trước liệu học vào {x j} kết mong muốn {yj}, j = 1, ntd ; với ntd : số liệu học Cho hệ luật mờ SAM với luật mờ trọng số Hãy tìm số vị trí cho sai số kết cho hệ SAM kết mong muốn ổn định nhỏ Một số giải pháp cho toán phương pháp sử dụng thuật toán GA ([1], [5], [7], [8]) Phương pháp xem kết hợp luật nhiễm sắc thể, dùng lọc Kalman với hai tiêu chuẩn tối ưu đảm bảo xác để phát cá thể thích hợp Từ chọn cá thể tốt làm kết thuật tốn Q trình thực sau : – Biểu diễn nhiễm sắc thể : nhiễm sắc thể chuỗi giá trị nhị phân diễn tả trạng thái hoạt động luật tương ứng hệ SAM – Hàm thích nghi : mối qua hệ kích thước SAM độ xác xấp xỉ SAM giải hàm thích nghi sau : Fit(m) = ln ( σ2 ) + ∑ logn (m) ε ,σ2 = ε n n n j=1 (y )2 j d − F(x ) (2) j m : Số luật (trạng thái 1) sử dụng hệ SAM, n : Số số liệu học – Thuật toán : b1 Khởi tạo 10 nhiễm sắc thể, có nhiễm sắc thể biễu diễn đầy đủ luật b2 Tạo nhiễm sắc thể phương pháp : Lai nhị phân (Tỉ lệ 0.5) đột biến nhị phân (Tỉ lệ 0.01) b3 Dùng phương pháp bánh xe quay với hàm thích nghi (2) để giữ lại 10 nhiễm sắc thể tốt (có hàm Fit(.) →min) b4 Nếu điều kiện lặp chưa kết thúc, quay lại b2 b5 Chọn nhiễm sắc thể tốt 10 nhiễm sắc thể nhận làm kết trả Chuỗi nhị phân tìm dùng làm sở cho việc hủy bỏ luật không cần thiết hệ SAM 1.2 Mô hình hệ lai (kết hợp thuật tốn di truyền GA Mạng Neural Network) Các mơ hình hệ lai sử dụng thuật toán di truyền GA kết hợp mạng Neural Network ([1], [5], [8]) cách tiếp cận tương đối phổ biến có tính hiệu cao cho vấn đề nêu Điều xuất phát từ khả phân lớp nhờ thuật toán GA khả ghi nhớ, học mơ hình hệ lai Bên cạnh đó, tính ổn định mạng Neuron Network yếu tố quan trọng giúp chọn điều kiện quan trọng đặt cho tốn mơ hình Phép tốn chọn lọc Lượng giá nhiễm sắc thể Tính độ thích nghi nhiễm sắc thể Các độ thích nghi lớn – Tính độ thích nghi cho cá thể eval(vi ) (i :1 →GEMAX) vi = Tes tEr ror – Tính tổng giá trị thích nghi tồn quần thể F = Sigma(eval(vi )) (i:1 →GEMAX) – Tính xác suất chọn pi cho nhiễm sắc thể vi p = eval(vi ) i F qi = Sigma(pj ) ( j:1 →i) – Chọn GEMAX lần Với lần : + Phát sinh số ngẫu nhiên r (r : →1) + Nếu r < q1 : chọn v1 Ngược lại chọn vi : q(i−1) < r < qi Khởi tạo nhiễm sắc thể mạng nơ rôn (neural network) Các mạng nơ rôn không sử dụng file lưu kết riêng Toàn nhiễm sắc thể sử dụng chung file kết Phép toán lai Xác định xác suất lai pc = 0.25 Đối với nhiễm sắc thể quần thể : + Phát sinh số r khoảng [ 0,1] + Nếu r < pc Chọn nhiễm sắc thể để lai Ghép đôi nhiễm sắc thể chọn cách ngẫu nhiên + Phát sinh số ngẫu nhiên pos (pos :1 →n) n : chiều dài nhiễm sắc thể Phép toán đột biến Xác định xác suất đột biến pn = 0.01 Đối với nhiễm sắc thể quần thể hành, bit + Phát sinh số r khoảng [ 0,1] + Nếu r < pn Đột biến cá thể chọn (trọng số đột biến 0.1) 2 Lựa chọn ngành để dự báo Trong công tác phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt việc nắm bắt tối đa thông tin lĩnh vực dự báo Thơng tin hiểu cách cụ thể bao gồm : – Các số liệu khứ lĩnh vực dự báo – Diễn biến tình hình trạng động thái phát triển lĩnh vực dự báo – Đánh giá cách đầy đủ nhân tố ảnh hưởng định lượng lẫn định tính Trong tất lĩnh vực nghiên cứu, nhiều lĩnh vực gặp khó khăn lớn mặt thông tin, cụ thể phân chia theo ngành kinh tế, có nhiều ngành thiếu số liệu khứ, điều nhiều lí do, nêu : phân ngành kinh tế quốc dân chưa ổn định, hệ thống tiêu thông tin ngành thống kê chưa ổn định, việc thu thập số liệu thành phần kinh tế quốc doanh gặp nhiều khó khăn … Vì vậy, phần lớn đề tài nghiên cứu gặp nhiều khó khăn, đề tài có tính chất dự báo [3], thường xuyên phải sử dụng yếu tố định tính để phân tích dự báo, mà sử dụng yếu tố định tính lại lệ thuộc lớn vào nhận định chủ quan người phân tích, thường khơng đạt độ xác cao dự báo, khơng mang tính thuyết phục Một tìm phương pháp khả thi để dự báo tác nhân tích cực việc điều hành quản lí kinh tế Các chương trình dự báo Nhóm nghiên cứu tiến hành cài đặt chương trình máy tính dựa mơ hình hệ luật mờ hệ lai giới thiệu liệu thử nghiệm cho chương trình này, ứng dụng trực tiếp vào dự báo tăng trưởng kinh tế quốc dân Các chương trình có chức huấn luyện liệu, thử nghiệm liệu, dự báo liệu khoảng thời gian thực Các chương trình dự báo mức độ tăng trưởng cao nhất, thấp tốc độ tăng trưởng trung bình liệu cần dự báo Ngoài để kiểm tra so sánh khả dự báo mơ hình với phương pháp ứng dụng rộng rãi kinh tế, chương trình cài đặt thêm phương pháp dự báo chuỗi ARIMA ([2],[6]) mô hình phân tích dự báo kinh tế cổ điển sử dụng rộng rãi ngành dự báo kinh tế Việt Nam giới, nhằm đối chiếu so sánh phương pháp dự báo nghiên cứư báo với phương pháp dự báo chuỗi ARIMA 3.1 Dữ liệu thực nghiệm Dữ liệu thực nghiệm chọn lĩnh vực thị trường giá lĩnh vực có ảnh hưởng tác động lớn đến kinh tế thành phố nói riêng Việt Nam nói chung Vì lựa chọn phương án thử nghiệm cách sử dụng liệu giá số mặt hàng quan trọng, cụ thể : vàng, đô la, gạo, cà phê, xi măng Đây mặt hàng quan trọng kinh tế VN, biến động giá chúng có tác động lớn đến hoạt động kinh tế khác [1], [2] Dữ liệu giá mặt hàng cập nhật hàng ngày, sử dụng liệu từ nhiều năm trước, từ năm 1994 đến 2004, tức bao gồm khoảng 3000 số liệu cho liệu loại mặt hàng thử nghiệm Ngồi ra, nhóm nghiên cứu nhận thấy việc nghiên cứu giá mặt hàng vấn đề cần thiết nói quan trọng : – Giá vàng la thể rõ nét tình trạng sức khoẻ kinh tế Khi kinh tế xuống, người dân có hành vi tích trữ vàng, la …, đẩy giá lên Khi kinh tế phát triển, người dân không giữ vàng USD mà sẵn sàng bỏ vốn kinh doanh, làm ăn, vàng ổn định giá có xu hướng hạ giá – Gạo, cà phê xi măng ba số mặt hàng chiến lược nước ta phục vụ cho xuất ổn định kinh tế nước Sự ổn định giá mặt hàng thước đo có ý nghĩa cho ổn định phát triển kinh tế Vàng, đô la, gạo, cà phê xi măng có biến động giá tác động mạnh lên thị trường tất loại hàng hoá khác 3.2 Kết thử nghiệm 3.2.1 Ứng dụng mơ hình hệ luật mờ – Kết thử nghiệm (có đối chiếu với mơ hình ARIMA) Thử nghiệm liệu vàng (Lưu ý : đường màu xanh biểu diễn mơ hình liệu dự báo theo phương pháp ARIMA, đường màu đỏ theo phương pháp dự báo mơ hình hệ luật mờ) Thử nghiệm liệu gạo 3.2.2 Ứng dụng mơ hình kết hợp thuật toán di truyền mạng Neural Networrk – Kết thử nghiệm (có đối chiếu với mơ hình ARIMA) Thử nghiệm liệu cerment (Lưu ý : đường màu xanh biểu diễn mơ hình liệu dự báo theo phương pháp ARIMA, đường màu đỏ theo phương pháp dự báo mơ hình hệ lai kết hợp thuật toán di truyền mạng Neural Network) Thử nghiệm liệu tỉ giá ngoại tệ USD Kết luận Kết thử nghiệm loại liệu so sánh với phương pháp dự báo sử dụng trước ([1], [2], [4], [6]) (như phương pháp ARIMA, phương pháp định tính định lượng khác) chấp nhận Tuy nhiên, để kiểm tra thêm phương pháp dự báo cho công tác phân tích dự báo trung hạn dài hạn cần phải có thêm nhiều liệu đánh giá hết tính ổn định độ xác mơ hình hệ luật mờ mơ hình hệ lai thử nghiệm TÀI LIỆU THAM KHẢO [1] Vũ Thanh Nguyên (2003), Giải số vấn đề phân tích dự báo kinh tế ứng dụng ngành công nghiệp thành phố Hồ Chí Minh; Đề tài nghiên cứu khoa học Sở Khoa Học Công Nghệ thành phố Hồ Chí Minh Nghiệm thu 10/2003 [2] Nguyễn Quốc Tịng (200), Các phương pháp định tính định lượng ứng dụng cơng tác phân tích dự báo Viện Kinh Tế thành phố; Đề tài nghiên cứu khoa học Viện Kinh Tế Thành phố Hồ Chí Minh - Nghiệm thu 2000 [3] Nguyễn Thống (1999), Phân tích liệu áp dụng vào dự báo; Nhà xuất niên [4] Duc Truong Pham, Liu Xing (1998), Neural Networks for Identication, Prediction and Control Springer – Verlag London Limited [5] T.T Chow, Z.Lin and C.L Song (2001) Applying Neural Network and Genetic Algorithm In System Optimization 7th International IBPSA Conference [6] ARIMA Models to Predict Next-Day Electricity Price, IEEE 2003 [7] Vũ Thanh Nguyên, Nguyễn Thanh Phong (2000), Sử dụng thuật toán di truyền vấn đề thiết kế mạng Hội nghị khoa học lần thứ II – ĐHKHTN, 05/2000 [8] Vũ Thanh Nguyên, Fuzzy Measure, Fuzzy Integral and Using them with genetic algorithm in Hybrid System IT@EDU2000 Tóm tắt : Nghiên cứu mơ hình hệ luật mờ hệ lai cho cơng tác phân tích dự báo Hiện nay, cơng tác phân tích dự báo sử dụng mơ hình ứng dụng lí thuyết logic mờ, lí thuyết mạng Neural Network, thuật tốn di truyền đem lại kết tương đối khả quan Bài báo nghiên cứu mơ hình hệ luật mờ, cải tiến từ mơ hình mạng Neural kết hợp lí thuyết logic mờ thuật toán di truyền nhằm cải tiến khả học tối ưu hoá luật Ngồi báo cịn sử dụng mơ hình hệ lai kết hợp thuật toán di truyền mạng Neural Networrk ứng dụng cho cơng tác phân tích dự báo Abstract : Using models of fuzzy rule system and hybird system for forecast analysis At present, forecast analysis which applied models on theories of fuzzy logic, nueral network, genetic algorith, gains some relatively positive achievements This paper is about model of fuzzy rule system, improved from the model of Neural network with theory of fuzzy logic and genetic algorithm aiming at accelerating ability of learning and optimizing the rules In addition to this, the article is about the use of hybird model with the genetic algorithm and the Neural network for forecast analysis ... System IT@EDU2000 Tóm tắt : Nghiên cứu mơ hình hệ luật mờ hệ lai cho cơng tác phân tích dự báo Hiện nay, cơng tác phân tích dự báo sử dụng mơ hình ứng dụng lí thuyết logic mờ, lí thuyết mạng Neural... Bài báo nghiên cứu mơ hình hệ luật mờ, cải tiến từ mơ hình mạng Neural kết hợp lí thuyết logic mờ thuật toán di truyền nhằm cải tiến khả học tối ưu hố luật Ngồi báo cịn sử dụng mơ hình hệ lai. .. phương pháp dự báo chuỗi ARIMA ([2],[6]) mơ hình phân tích dự báo kinh tế cổ điển sử dụng rộng rãi ngành dự báo kinh tế Việt Nam giới, nhằm đối chiếu so sánh phương pháp dự báo nghiên cứư báo với