Bài viết đề xuất một phương pháp mới, sử dụng phép ngữ nghĩa hóa và giải ngữ nghĩa của đại số gia tử trong bài toán dự báo số lượng sinh viên nhập học của Trường Đại học Alabama. Mô hình dự báo, các kết quả và so sánh cũng sẽ được đưa ra thảo luận.
Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX ―Nghiên cứu ứng dụng Công nghệ thông tin (FAIR'9)‖; Cần Thơ, ngày 4-5/8/2016 DOI: 10.15625/vap.2016.00053 MỘT PHƯƠNG PHÁP MỚI DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN NGỮ NGHĨA NGÔN NGỮ Nguyễn Duy Hiếu1, Nghiêm Văn Tính2 , Vũ Như Lân3 Trƣờng Đại học Tây Bắc Trƣờng Đại học Kỹ thuật Công nghiệp, Đại học Thái Nguyên Trƣờng Đại học Thăng Long hieu3210@gmail.com, nghiemvantinh@tnut.edu.vn, vnlan@ioit.ac.vn TÓM TẮT— Dự báo chuỗi thời gian toán nhiều tác giả nước quan tâm nghiên cứu năm gần Tuy nhiên, việc dự báo liệu có biến đổi lớn, liệu ghi nhận nhãn ngôn ngữ tạo khó khăn giải phương pháp tốn học, thống kê truyền thống Vì vậy, Q Song B.S Chissom đề xuất mơ hình dự báo chuỗi thời gian mờ Kể từ tới có nhiều nghiên cứu theo hướng này, nhằm đưa phương pháp cải tiến phương pháp có nhằm tăng độ xác dự báo Trong nội dung báo này, đề xuất phương pháp mới, sử dụng phép ngữ nghĩa hóa giải ngữ nghĩa đại số gia tử toán dự báo số lượng sinh viên nhập học Trường Đại học Alabama Mơ hình dự báo, kết so sánh đưa thảo luận Từ khóa— Dự báo, chuỗi thời gian, chuỗi thời gian mờ, đại số gia tử, ngữ nghĩa, ngôn ngữ I MỞ ĐẦU Vấn đề dự báo tƣơng lai mong muốn, mơ ƣớc ngƣời từ xuất tới Dự báo trƣớc đƣợc việc, tƣợng xảy tƣơng lai giúp cho ngƣời hoạch định tốt cơng việc mình, giúp nâng cao hiệu quả, tiết kiệm thời gian giảm bớt công sức công việc Trong vài chục năm gần đây, có nhiều nghiên cứu nƣớc đƣợc đƣa nhằm giải tốn dự báo Những nghiên cứu dù theo hƣớng mục tiêu nhằm nâng cao độ xác kết dự báo giảm bớt khối lƣợng tính tốn tốn Những liệu ngƣời thu thập đƣợc có nhiều loại, liệu mà ngƣời dùng cho toán dự báo Dữ liệu dạng số liệu, rõ ràng xác thƣờng đƣợc dự báo phƣơng pháp toán học, thống kê với mơ hình điển hình nhƣ ARMA, ARIMA,… Tuy nhiên, với liệu có biến động lớn (nhƣ thị trƣờng chứng khoán) hay liệu thực tế đƣợc ghi nhận nhãn ngơn ngữ khó giải đƣợc phƣơng pháp tốn học, thống kê truyền thống Chính vậy, nghiên cứu Q Song B.S Chissom [1, 2, 3] đề xuất mơ hình dự báo chuỗi thời gian mờ nhằm dự báo cho liệu có đặc điểm nói Sau đó, S.M Chen [4] cải tiến phƣơng pháp dự báo chuỗi thời gian mờ nhằm đƣa cách tính tốn đơn giản hiệu Trong nghiên cứu sau này, nhiều tác giả sử dụng kỹ thuật khác nhƣ phân cụm, tối ƣu… làm cho độ xác kết dự báo ngày đƣợc nâng cao Trong toán dự báo chuỗi thời gian mờ, có hai yếu tố ảnh hƣởng tới kết dự báo, phép mờ hóa liệu giải mờ Đối với việc mờ hóa liệu, nhiều nghiên cứu rằng: số lƣợng khoảng, độ dài khoảng bậc chuỗi thời gian mờ ảnh hƣởng nhiều tới độ xác dự báo Nhiều tác giả đƣa kết nghiên cứu việc tối ƣu tham số với kết dự báo tốt Vấn đề giải mờ ảnh hƣởng lớn tới kết dự báo lựa chọn khoảng giải mờ khác Việc tối ƣu khoảng giải mờ cần đƣợc nghiên cứu để nâng cao độ xác dự báo Trong phép mờ hóa liệu cần lựa chọn số lƣợng khoảng chia phù hợp Nếu chọn số khoảng chia ít, dự báo cho độ xác thấp thiếu thơng tin; cịn chọn số khoảng chia q nhiều làm nghĩa tính mờ giá trị ngôn ngữ Đại số gia từ [12] (ĐSGT) đƣợc N Cat Ho W Wechler giới thiệu năm 1990 nhằm đƣa mơ hình tốn học phù hợp với liệu không chắn, theo giá trị ngữ nghĩa ngơn ngữ nằm trật tự định thứ tự tạo nên giá trị ngữ nghĩa từ ngơn ngữ Đại số gia tử đƣợc ứng dụng tốn điều khiển, hồi quy, trích rút tri thức, tính tốn từ[15, 16, 17, 18, 19, 20],… cho nhiều kết tốt đẹp Việc ứng dụng đại số gia tử toán dự báo đƣợc tác giả [21] giới thiệu với mơ hình dự báo cho kết tốt Trong nghiên cứu này, sử dụng phép ngữ nghĩa hóa giải ngữ nghĩa đại số gia tử sở việc chia tập thành 13 khoảng S.M Chen [6] Kết dự báo đƣợc so sánh trực tiếp với nghiên cứu nhằm tính ƣu việt phƣơng pháp đề xuất Nội dung báo đƣợc trình bày thành ba mục: sau mục phần MỞ ĐẦU, mục chúng tơi trình bày tổng quan MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ theo cách tiếp cận Q Song, B.S Chissom S.M 436 MỘT PHƢƠNG PHÁP MỚI DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN NGỮ NGHĨA NGÔN NGỮ Chen; mục giới thiệu tóm tắt LÝ THUYẾT ĐẠI SỐ GIA TỬ mục đề xuất phƣơng pháp DỰ BÁO CHUỖI THỜI GIAN MỜ SỬ DỤNG ĐSGT VỚI 13 KHOẢNG CHIA Các phƣơng pháp tính tốn kết toán dự báo số lƣợng sinh viên nhập học Trƣờng Đại học Alabama đƣợc đƣa so sánh thảo luận Cuối phần KẾT LUẬN II MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ 2.1 Một số khái niệm mơ hình dự báo chuỗi thời gian mờ Mơ hình chuỗi thời gian mờ lần đƣợc Q Song B.S Chissom đƣa [1, 2, 3] đƣợc S.M Chen cải tiến [4, 5, 6, 7] để xử lý phép tính số học đơn giản nhƣng xác, phù hợp với ứng dụng dự báo chuỗi thời gian mờ Có thể tóm lƣợc qua số khái niệm sau đây: Định nghĩa 2.1: Chuỗi thời gian mờ Giả sử Y(t), (t= , 0,1,2, ), tập số thực tập xác định tập mờ f i (t), (i=1,2 , ) Biến t thời gian Nếu F(t) chuỗi tập mờ f i (t), (i=1,2, ), F(t) đƣợc gọi chuỗi thời gian mờ Y(t), (t= , 0,1,2, ) Định nghĩa 2.2: Quan hệ mờ Nếu tồn quan hệ mờ R(t−1, t), cho F(t)=F(t−1)*R(t−1, t), dấu * ký hiệu tốn tử đó, F(t) đƣợc suy từ F(t−1) Quan hệ F(t) F(t−1) đƣợc xác định ký hiệu: F(t−1) F(t) (2.1) Ví dụ tốn tử * phép kết hợp MaxMin[2] MinMax[3] hay phép tính số học [4] Nếu F(t-1)=Ai and F(t)=Aj, quan hệ logic F(t) and F(t−1) đƣợc ký hiệu AiAj , Ai vế trái Aj vế phải quan hệ mờ mô tả tập mờ dự báo Định nghĩa 2.3: Quan hệ mờ bậc n Giả sử F(t) chuỗi thời gian mờ Nếu F(t) đƣợc suy từ F(t−1), F(t−2), , F(t−n), quan hệ mờ đƣợc biểu diễn biểu thức: F(t−n), ,F(t−2), F(t−1) F(t) (2.2) đƣợc gọi chuỗi thời gian mờ bậc n Định nghĩa 2.4: Chuỗi thời gian mờ dừng Giả sử F(t) đƣợc suy từ F(t−1) đƣợc ký hiệu F(t−1) F(t), quan hệ mờ F(t) F(t−1) đƣợc mô tả phƣơng trình: F(t)=F(t−1)*R(t−1, t) (2.3) Quan hệ mờ R thể mơ hình bậc F(t) Nếu R(t−1, t) không phụ thuộc t, cho với t1 t2 khác nhau, R(t1 , t1−1)=R(t2 ,t2−1), F(t) đƣợc gọi chuỗi thời gian mờ dừng, lại đƣợc gọi chuỗi thời gian mờ không dừng Định nghĩa 2.5: Nhóm quan hệ mờ (NQHM) Các quan hệ mờ với tập mờ bên vế trái đƣa vào nhóm gọi nhóm quan hệ mờ hay nhóm quan hệ logic mờ Giả sử có quan hệ mờ: Ai Aj1; Ai Aj2; ; Ai Ajn quan hệ mờ đƣa vào nhóm đƣợc ký hiệu nhƣ sau: Ai Aj1, Aj2, , , Ajn (2.4) Tập mờ Ajk ( k=1,2, , n) đƣợc xuất lần bên vế phải 2.2 Mơ hình dự báo Q Song B.S Chissom Mơ hình dự báo chuỗi thời gian mờ lần đƣợc Q Song B.S Chissom đƣa vào năm 1993 [1, 2, 3] đƣợc ứng dụng để dự báo số sinh viên nhập học Trƣờng Đại học Alabama với liệu lịch sử qua 22 năm kể từ năm 1971 đến 1992 Chuỗi thời gian lần đƣợc xem xét dƣới góc độ biến ngơn ngữ tốn dự báo có đƣợc cách nhìn hồn tồn quan điểm lý thuyết tập mờ Mơ hình dự báo mơ hình dự báo chuỗi thời gian mờ dừng [2, 3] đƣợc triển khai qua bƣớc sau đây: Bƣớc Xác định tập Nguyễn Duy Hiếu, Nghiêm Văn Tính, Vũ Nhƣ Lân 437 Bƣớc Chia miền xác định tập thành khoảng Bƣớc Xây dựng tập mờ tập Bƣớc Mờ hóa chuỗi liệu Bƣớc Xác định quan hệ mờ Bƣớc Dự báo phƣơng trình Ai=Ai−1* R, ký hiệu * toán tử MaxMin Bƣớc Giải mờ kết dự báo Trong bƣớc 5, quan hệ mờ R đƣợc xác định biểu thức , với quan hệ mờ As Aq, ⋃ Ở x toán tử min, phép chuyển vị (2.5) phép hợp 2.3 Mơ hình dự báo S.M Chen Do mơ hình dự báo chuỗi thời gian mờ Q Song B.S Chissom phức tạp bƣớc bƣớc 6, S.M Chen [4] cải tiến cách tính tốn xác cho mơ hình dự báo chuỗi thời gian sử dụng phép tính số học đơn giản sở thơng tin từ quan hệ mờ nhóm quan hệ mờ theo bƣớc sau đây: Bƣớc Chia miền xác định tập thành khoảng Bƣớc Xây dựng tập mờ tập Bƣớc Mờ hóa chuỗi liệu Bƣớc Xác định quan hệ mờ Bƣớc Tạo lập nhóm quan hệ mờ Bƣớc Giải mờ đầu dự báo 2.4 Luật dự báo chuỗi thời gian mờ [4] Luật dự báo phép giải mờ kết đầu dự báo nhƣ bƣớc mơ hình dự báo [4] Giả sử liệu chuỗi thời gian F(t-1) đƣợc mờ hóa Aj, Đầu dự báo F (t) đƣợc xác định theo luật (nguyên tắc) sau đây: Nếu tồn quan hệ - nhóm quan hệ Aj, ký hiệu Aj Ak , mức độ thuộc cao Ak khoảng uk, đầu dự báo F (t) điểm uk Nếu Ak trống, có nghĩa Aj Aj có mức độ thuộc cao khoảng uj, đầu dự báo điểm uj Nếu tồn quan hệ - nhiều nhóm quan hệ mờ Aj , ký hiệu Aj A1 , A2 ,…, An, mức độ thuộc cao A1 , A2 ,…, An khoảng u1 , u2 ,…, un tƣơng ứng, đầu dự báo đƣợc tính trung bình điểm m1 , m2,…,mn u1 , u2,…, un Đầu dự báo có dạng: (m1+m2+…+mn)/n III LÝ THUYẾT ĐẠI SỐ GIA TỬ Đại số gia tử đƣợc giới thiệu N.C Ho W Wechler [12, 13] nhằm giải vấn đề phƣơng pháp luận cung cấp mơ hình tốn học mềm dẻo, linh hoạt hiệu cho việc xử lý liệu mờ Đại số gia tử đƣợc ứng dụng thành cơng nhiều tốn khác nhƣ: điều khiển mờ, tính tốn từ, phân lớp, hồi quy [15, 16, 17, 18, 19]… với nhiều kết tốt cách tiếp cận trƣớc Trong phần chúng tơi trình bày tóm tắt lý thuyết đại số gia tử, quan trọng công thức để xác định mơ hình tính tốn đại số gia tử bao gồm phép ngữ nghĩa hóa giải ngữ nghĩa hóa Đây sở để ứng dụng đại số gia tử toán dự báo chuỗi thời gian mờ Trƣớc hết, xem xét số khái niệm đại số gia tử sau đây: Gọi AX = ( X, G, C, H, ) cấu trúc đại số, với X tập AX; G = {c-, c+} tập phần tử sinh; C = {0, W, 1}, 0, W tƣơng ứng phần tử đặc trƣng cận trái (tuyệt đối nhỏ), trung hòa cận phải (tuyệt đối lớn); H tập tốn tử ngơi đƣợc gọi gia tử; biểu thị quan hệ thứ tự giá trị ngôn ngữ Gọi H- tập hợp gia tử âm H+ tập hợp gia tử dƣơng AX Ký hiệu H- = {h-1, h-2, …h-q}, h-1 < h-2 < … < h-q H+ = {h1, h2, …, hp}, h1 < h2 < … < hp Định nghĩa 3.1: Độ đo tính mờ fm: X [0, 1] gọi độ đo tính mờ thỏa mãn điều kiện sau: +) fm(c-)+fm(c+) = ∑ = fm(x), với x X +) Với phần tử 0, W 1, fm(0) = fm(W) = fm(1) = (3.1) (3.2) MỘT PHƢƠNG PHÁP MỚI DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN NGỮ NGHĨA NGÔN NGỮ 438 +) Và với x,y X, hH, (3.3) Đẳng thức (3.3) không phụ thuộc vào phần tử x, y ta ký hiệu (h) độ đo tính mờ gia tử h Tính chất fm(x) (h) nhƣ sau: +) fm(hx) = (h)fm(x), xX (3.4) , với c{c-, c+} +) ∑ (3.5) +) ∑ (3.6) +) ∑ , với , > + = ∑ (3.7) Định nghĩa 3.2: Hàm dấu Hàm sign: X{-1, 0, 1} ánh xạ đƣợc gọi hàm dấu với h, h’H c {c-, c+} đó: +) sign(c-) = -1, sign(c+) = +1; (3.8) +) sign(hc) = - sign(c), h âm c; (3.9) +) sign(hc) = + sign(c), h dƣơng c; (3.10) +) sign(h’hx) = - sign(hx), h’hx ≠ hx h’ âm h; (3.11) +) sign(h’hx) = + sign(hx), h’hx ≠ hx h’ dƣơng h; (3.12) +) sign(h’hx) = h’hx = hx (3.13) Gọi fm độ đo tính mờ X, ánh xạ ngữ nghĩa định lƣợng : X [0, 1], đƣợc sinh fm X, đƣợc xác định nhƣ sau: +) v(W) fm(c ), (3.14) +) v(c ) fm(c ) fm(c ) , (3.15) +) v(c ) fm(c ) fm(c ) +) ( với ) ( (3.16) [∑ ) [ ( ) ( ] ) { ] (3.17) }, j [-q, p], j (3.18) Ngữ nghĩa hóa (Semantization) giải ngữ nghĩa hóa (Desemantization) Để thuận tiện cho việc biểu diễn ngữ nghĩa giá trị ngôn ngữ, giả sử miền tham chiếu thông thƣờng biến ngôn ngữ X đoạn [a, b] miền tham chiếu ngữ nghĩa Xs đoạn [as,bs] (0 ≤ as < bs ≤ 1) Việc chuyển đổi tuyến tính từ [a, b] sang [as,bs] đƣợc gọi phép ngữ nghĩa hóa tuyến tính (Linear Semantization) cịn việc chuyển ngƣợc lại từ đoạn [as,bs] sang [a, b] đƣợc gọi phép giải nghĩa tuyến tính (Linear Desemantization) Trong nhiều ứng dụng ĐSGT sử dụng miền ngữ nghĩa đoạn [as=0, bs=1], phép ngữ nghĩa hóa tuyến tính đƣợc gọi phép chuẩn hóa (Linear Semantization = Normalization) phép giải nghĩa tuyến tính đƣợc gọi phép giải chuẩn (Linear Desemantization = Denormalization ) Nhƣ biểu diễn phép ngữ nghĩa hóa tuyến tính phép giải nghĩa tuyến tính đơn giản nhƣ sau: Linear Semantization (x) = xs = as + ( bs – as ) ( x – a ) / ( b – a) (3.19a) Linear Desemantization (xs) = x = a + ( b – a ) ( xs – as ) / ( bs – as) (3.20a) Normalization (x) = xs = ( x – a ) / (b – a ) (3.19b) Denormalization (xs) = x = a + ( b – a )xs (3.20b) a, b số thực Nhiều ứng dụng ĐSGT lĩnh vực khoa học địi hỏi mở rộng khơng gian tham số phép ngữ nghĩa hóa phép giải nghĩa để có nhiều tham số lựa chọn mềm dẻo Điều có đƣợc mở rộng phép ngữ nghĩa hóa phép giải nghĩa từ tuyến tính đến phi tuyến Tƣơng tự trên, phép ngữ nghĩa hóa phi tuyến phép giải nghĩa phi tuyến đƣợc biểu diễn nhƣ sau: Nonlinear Semantization (x) = f(xs,sp) Với điều kiện: ≤ f(xs,sp) ≤ f(xs=0,sp) = f(xs=1,sp) = (3.19c) Nguyễn Duy Hiếu, Nghiêm Văn Tính, Vũ Nhƣ Lân 439 Nonlinear Desemantization (xs) = g(x,dp) (3.20c) Với điều kiện: a ≤ g(x,dp) ≤ b, g(x = a,dp) = a g(x = b,dp) = b Các hàm f(.) g(.) đƣợc chọn tùy theo ứng dụng hàm liên tục, đồng biến, sp[-1 1] tham số ngữ nghĩa hóa, dp [-1 1] tham số giải nghĩa Ví dụ chọn f(.) phi tuyến theo xs thể qua f(xs,sp) g(.) phi tuyến theo x thể qua Denormalization (f(xs,sp)) nhƣ sau: f(xs,sp) = sp*xs*(1-xs)+xs (3.19d) g(x,dp) = dp*(( Denormalization (f(xs,sp))–a )*(b – Denormalization (f(xs,sp))) / (b-a) + + Denormalization (f(xs,sp)) (3.20d) Denormalization (f(xs,sp)) = (sp*x*(1-x)+x )*(b-a) + a (3.20d1) Hàm f(xs,sp) hàm biểu diễn ngữ nghĩa phi tuyến phép giải nghĩa phi tuyến g(x.dp) chƣa đƣợc sử dụng ứng dụng ĐSGT Lƣu ý rằng: chọn hàm f(x s,sp) g(x,dp) độc lập với Khi sp=dp=0 tính phi tuyến bị loại bỏ biểu thức (3.19d) trở thành (3.19b) (3.20d) trở thành (3.20b) Cho trƣớc độ đo tính mờ gia tử (h) giá trị độ đo tính mờ phần tử sinh fm(c-), fm(c+) phần tử trung hồ (neutral) Khi mơ hình tính tốn ĐSGT đƣợc xây dựng sở biểu thức từ (3.1) đến (3.20) đƣợc kích hoạt thực tế đƣợc sử dụng hiệu nhiều ứng dụng Phép mờ hóa phép giải mờ tiếp cận mờ đƣợc thay tƣơng ứng phép ngữ nghĩa hóa phép giải nghĩa tiếp cận ĐSGT Hệ luật đƣợc thể siêu mặt làm sở cho trình suy luận xấp xỉ Một lƣu ý quan trọng trình tính tốn tiếp cận ĐSGT cần xác định tham số ban đầu nhƣ độ đo tính mờ phần tử sinh độ đo tính mờ gia tử biến ngôn ngữ cách thích hợp dựa sở phân tích ngữ nghĩa miền ngơn ngữ tốn ứng dụng cụ thể Khi mơ hình tính tốn tiếp cận ĐSGT cho kết hợp lý ứng dụng IV DỰ BÁO CHUỖI THỜI GIAN MỜ SỬ DỤNG ĐSGT VỚI 13 KHOẢNG CHIA Trong phần này, đề xuất việc sử dụng lý thuyết đại số gia tử, cụ thể sử dụng phép ngữ nghĩa hóa giải ngữ nghĩa hóa toán dự báo chuỗi thời gian mờ theo cách chia khoảng S.M Chen [6] Về việc ứng dụng đại số gia tử mơ hình chuỗi thời gian mờ cho toán dự báo số sinh viên nhập học đƣợc Nguyễn Duy Hiếu đề xuất [21] Trong nghiên cứu rõ việc sử dụng cơng thức tính tốn đại số gia tử để đƣa mơ hình dự báo theo bƣớc Trong nghiên cứu này, muốn thử nghiệm tính hiệu mơ hình với cách chia khoảng S.M Chen [6] toán dự báo số lƣợng sinh viên nhập học Trƣờng Đại học Alabama theo số liệu ghi nhận đƣợc nhƣ bảng sau: Bảng 4.1 Số sinh viên nhập học Trƣờng Đại học Alabama từ 1971 đến 1992 [2] Năm 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 Số sinh viên nhập học 13055 13563 13867 14696 15460 15311 15603 15861 16807 16919 16388 Năm 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 Số sinh viên nhập học 15433 15497 15145 15163 15984 16859 18150 18970 19328 19337 18876 Theo S.M Chen [6], chia lại tập thành 13 khoảng (không nhau) từ khoảng nhƣ cách chia trƣớc [2, 3, 4] sở thống kê số lƣợng điểm liệu thuộc khoảng Theo đó, khoảng có nhiều liệu lịch sử thuộc vào chia thành nhiều khoảng ngƣợc lại Cá biệt có khoảng khơng có liệu lịch sử thuộc vào bỏ Bảng 4.2 Thống kê lịch sử liệu cách chia khoảng Khoảng [13000,14000] [14000,15000] [15000,16000] [16000,17000] Số liệu [17000,18000] [18000,19000] [19000,20000] MỘT PHƢƠNG PHÁP MỚI DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN NGỮ NGHĨA NGÔN NGỮ 440 Theo S.M Chen [6], ta chia khoảng có liệu lịch sử thành khoảng con, khoảng có liệu lịch sử thành khoảng con, khoảng có liệu lịch sử thành khoảng con, khoảng liệu lịch sử thuộc vào bỏ đi, cịn lại giữ ngun Các nhãn giá trị ngơn ngữ đƣợc Chen dùng gồm: A1=very very very very few, A2=very very very few, A3=very very few, A4 =very few, A5 =few, A6 = moderate, A7=many, A8=many many, A9= very many, A10=too many, A11=too many many, A12=too many many many A13= too many many many many Khác với cách tiếp cận S.M Chen, đề xuất mơ hình đại số gia tử đƣợc xây dựng phần tử sinh c- (small) c+ (large) với tác động hai gia tử (Little, Very) thuộc H Việc lựa chọn giá trị ngữ nghĩa tƣơng ứng với cách chia khoảng Chen cụ thể nhƣ bảng 4.3 Stt 10 11 12 13 Bảng 4.3 Nhãn ngữ nghĩa khoảng Phân đoạn Kí hiệu Giá trị ngữ nghĩa u1,1 = [13000, 13500] A1 Very Very Small u1,2 = [13500, 14000] A2 Little Very Small u2 = [14000, 15000] A3 Small u3,1 = [15000, 15250] A4 Very Very Little Small u3,2 = [15250, 15500] A5 Little Very Little Small u3,3 = [15500, 15750] A6 Very Little Little Small u3,4 = [15750, 16000] A7 Little Little Little Small u4,1 = [16000, 16333] A8 Little Little Little Large u4,2 = [16333, 16667] A9 Little Little Large u4,3 = [16667, 17000] A10 Very Little Little Large u6,1 = [18000, 18500] A11 Very Little Large u6,2 = [18500, 19000] A12 Little Very Large u7 = [19000, 20000] A13 Very Large Trong đó, Ai, i=1 13 kí hiệu (nhãn ngữ nghĩa) tƣơng ứng giá trị ngữ nghĩa đƣợc chọn đại số gia tử Việc lựa chọn giá trị ngữ nghĩa đảm bảo tỉ lệ, mật độ chia khoảng Đối với giá trị ngữ nghĩa đƣợc chọn, giá trị ngữ ngữ nghĩa định lƣợng 13 nhãn ngữ nghĩa A1, A2,… A13 đƣợc tính tốn cụ thể theo công thức sau: SA1 = v(Very Very Small) = θ-3θα+3θα2- θα3; SA2 = v(Little Very Small) = θ-2θα+2θα2- θα3; SA3 = v(Small) = θ-θα; SA4 = v(Very Very Little Small) = θ-θα+θα2- 2θα3+θα4; SA5 = v(Little Very Little Small) = θ-θα+θα2- θα3+θα4; SA6 = v(Very Little Little Small) = θ-θα+2θα2- 2θα3+θα4; SA7 = v(Little Little Little Small) = θ-θα+3θα2- 3θα3+θα4; SA8 = v(Little Little Little Large) = θ+α- 3α2+3α3- α4-θα+3θα2- 3θα3+θα4; SA9 = v(Little Little Large) = θ+α- 2α2+α3-θα+2θα2- θα3; SA10 = v(Very Little Little Large) = θ+α- 2α2+2α3- α4- θα+2θα2- 2θα3+θα4; SA11 = v(Very Little Large) = θ+α- α2+α3-θα+θα2- θα3; SA12 = v(Little Very Large) = θ+2α- 2α2+α3-2θα+2θα2- θα3; SA13 = v(Very Large) = θ+2α- α2-2θα+θα2; Trong kí hiệu SAi = Semantization(Ai) giá trị ngữ nghĩa định lƣợng nhãn ngữ nghĩa Ai Nếu chọn trƣớc α=0.5 θ=0.5 giá trị ngữ nghĩa định lƣợng tính đƣợc nhƣ sau: SA1 = v(Very Very Small) = 0.0625; SA2 = v(Little Very Small) = 0.1875; SA3 = v(Small) = 0.25; SA4 = v(Very Very Little Small) = 0.28125; SA5 = v(Little Very Little Small) = 0.34375; SA6 = v(Very Little Little Small) = 0.40625; SA7 = v(Little Little Little Small) = 0.46875; SA8 = v(Little Little Little Large) = 0.53125; SA9 = v(Little Little Large) = 0.5625; SA10 = v(Very Little Little Large) = 0.59375; SA11 = v(Very Little Large) = 0.6875; SA12 = v(Little Very Large) = 0.8125; SA13 = v(Very Large) = 0.875; Nguyễn Duy Hiếu, Nghiêm Văn Tính, Vũ Nhƣ Lân 441 Chúng ta dễ thấy giá trị ngữ nghĩa định lƣợng đƣợc theo thứ tự: SA1 < SA2 < … < SA13 hay nói cách khác thứ tự ngữ nghĩa ln đƣợc đảm bảo Đây điểm khác biệt quan trọng lý thuyết đại số gia tử so với lý thuyết mờ đặt giá trị ngôn ngữ thứ tự nó, thứ tự tạo nên cấu trúc ngơn ngữ Kết hợp liệu bảng 4.1 với cách gán nhãn ngôn ngữ theo bảng 4.3 ta đƣợc bảng liệu sinh viên nhập học với nhãn ngữ nghĩa theo bảng 4.4 bên dƣới Bảng 4.4 Dữ liệu sinh viên nhập học với nhãn ngữ nghĩa tƣơng ứng Năm 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 Số SVNH 13055 13563 13867 14696 15460 15311 15603 15861 16807 16919 16388 Kí hiệu A1 A2 A2 A3 A5 A5 A6 A7 A10 A10 A9 Năm 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 Số SVNH 15433 15497 15145 15163 15984 16859 18150 18970 19328 19337 18876 Kí hiệu A5 A5 A4 A4 A7 A10 A11 A12 A13 A13 Từ bảng 4.4 ta tìm đƣợc nhóm quan hệ ngữ nghĩa nhƣ sau: Bảng 4.5 Các nhóm quan hệ ngữ nghĩa Nhãn Nhóm quan hệ A1 A1 A2 A2 A2 A2, A3 A3 A3 A5 A4 A4 A4, A7 A5 A5 A4, A5 (2 lần), A6 A6 A6 A7 A7 A7 A10 (2 lần) A8 khơng có quan hệ A9 A9 A5 A10 A10 A9, A10, A11 A11 A11 A12 A12 A12 A13 A13 A13 A13 Về việc lựa chọn khoảng giải nghĩa, lựa chọn cho khoảng giải nghĩa với điểm dự báo bên trái quan hệ ngữ nghĩa đƣợc chọn cho hai đầu khoảng bao đƣợc giá trị nằm bên phải nhóm quan hệ ngữ nghĩa Bảng 4.6 Khoảng giải nghĩa cho điểm dự báo Khoảng giải nghĩa Giá trị Giá trị Khoảng giải nghĩa Giá trị Giá trị cho điểm dự báo ( 1972 ) ( 1973 ) ( 1974 ) ( 1975 ) ( 1976 ) ( 1977 ) (1978 ) ( 1979 ) ( 1980 ) 10 ( 1981 ) 11 ( 1982 ) đầu khoảng 13100 13300 13400 14000 14000 14600 13900 14200 13500 13000 14600 cuối khoảng 15500 16000 19900 18600 18200 17700 18300 18800 19300 18700 17200 cho điểm dự báo 12 ( 1983 ) 13 ( 1984 ) 14 ( 1985 ) 15 ( 1986 ) 16 ( 1987 ) 17 ( 1988 ) 18 ( 1989 ) 19 ( 1990 ) 20 ( 1991 ) 21 ( 1992 ) đầu khoảng 13400 13200 14300 14100 15300 15500 16800 15600 15000 13000 cuối khoảng 20000 19300 16700 19500 18000 20000 19500 20000 20000 20000 Sử dụng mơ hình dự báo chuỗi thời gian mờ đại số gia tử với bƣớc đƣợc giới thiệu [21] với cách chia khoảng theo Chen [6], cách tính tốn ngữ nghĩa định lƣợng, nhóm quan hệ mờ, khoảng giải nghĩa nhƣ thu đƣợc kết dự báo nhƣ sau: MỘT PHƢƠNG PHÁP MỚI DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN NGỮ NGHĨA NGÔN NGỮ 442 Bảng 4.7 So sánh kết dự báo Stt Năm 10 11 12 13 14 15 16 17 18 19 20 21 22 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 MSE Số sinh viên nhập học 13055 13563 13867 14696 15460 15311 15603 15861 16807 16919 16388 15433 15497 15145 15163 15984 16859 18150 18970 19328 19337 18876 Phương pháp Chen [21] Phương pháp đề xuất 13750 13875 14750 15375 15313 15625 15813 16834 16834 16416 15375 15375 15125 15125 15938 16834 18250 18875 19250 19250 18875 5344 13500 13830 14676 15461 15334 15584 15852 16836 16950 16391 15426 15496 15137 15137 15983 16847 18177 18969 19424 19346 19084 2988 Chú ý bảng tổng hợp số liệu sử dụng kết S.M Chen [6] nhiên làm tròn đến phần nguyên theo quy tắc làm tròn cho hợp lý số lƣợng sinh viên (của Chen để số lẻ) Kết tính tốn theo phƣơng pháp đề xuất đƣợc làm tròn tƣơng tự Tham số ngữ nghĩa hóa (sp) tham số giải nghĩa (dp) dùng để tính tốn mơ hình dự báo theo đại số gia tử giới thiệu công thức (3.19c) (3.20c) đƣợc chọn tƣơng ứng 0.2 -0.3 Cơng thức xác định sai số bình phƣơng trung bình (MSE) là: ∑ (chỉ dự báo 21 năm từ 1972 tới 1992) V KẾT LUẬN Trong nghiên cứu này, sử dụng đại số gia tử toán dự báo chuỗi thời gian mờ theo cách chia tập toán dự báo sinh viên nhập học Alabama thành 13 khoảng theo S.M Chen Qua kết dự báo, ta dễ dàng thấy đƣợc phƣơng pháp đề xuất có kết dự báo tốt nhiều so với kết Chen Trong [21] so sánh kết dự báo theo cách chia truyền thống đoạn phƣơng pháp sử dụng đại số gia tử phƣơng pháp khác sử dụng lý thuyết mờ, thêm kết nghiên cứu cho thấy khả ứng dụng đại số gia tử toán dự báo chuỗi thời gian mờ hƣớng tốt, tiếp tục mở rộng nghiên cứu Chúng ta nghiên cứu việc sử dụng đại số gia tử toán dự báo chuỗi thời gian mờ với việc tối ƣu tham số đại số gia tử, tối ƣu khoảng chia áp dụng phƣơng pháp cho tập liệu khác để có đƣợc nhìn khách quan, tồn diện độ xác hiệu dự báo TÀI LIỆU THAM KHẢO [1] [2] [3] [4] [5] [6] Q Song, B.S Chissom Fuzzy time series and its models Fuzzy Sets and Syst 54 269–277, 1993 Q Song, B.S Chissom, Forecasting enrollments with fuzzy time series – part Fuzzy Sets and Syst 54, 1–9, 1993 Q Song, B.S Chissom, Forecasting enrollments with fuzzy time series – part Fuzzy Sets and Syst 62, 1–8, 1994 S.M Chen, Forecasting Enrollments Based on Fuzzy Time Series Fuzzy Sets and Syst 81, 311–319, 1996 S.M Chen, Forecasting Enrollments based on High Order Fuzzy Time Series Cybernetics and Systems: An International Journal 33,1-16, 2002 S.M Chen, C.C Hsu, A New Method to Forecast Enrollments using Fuzzy Time Series Int Journal Applied Science and Engineering 2, 234-244, 2004 Nguyễn Duy Hiếu, Nghiêm Văn Tính, Vũ Nhƣ Lân 443 [7] S M Chen and N.Y Chung, Forecasting enrollments using high-order fuzzy time series and genetic algorithms, Int Journal of Intelligent Systems 21, 485-501 2006 [8] S.M Chen, K Tanuwijaya, Multivariate fuzzy forecasting based on fuzzy time series and automatic clustering techniques Expert Systems with Applications 38, 10594–10605, 2011 [9] K Huarng, Heuristic models of fuzzy time series for forecasting Fuzzy Sets and Systems, 123: 369-386, 2001 [10] J R Hwang, S M Chen, and C H Lee, Handling forecasting problems using fuzzy time series Fuzzy Sets and Systems, 100: 217-228, 1998 [11] M H Lee, R Efendi, Z Ismad, Modified Weighted for Enrollments Forecasting Based on Fuzzy Time Series MATEMATIKA, 25(1), 67-78, 2009 [12] N Cat Ho and W Wechler, Hedge algebras: An algebraic approach to structures of sets of linguistic domains of linguistic truth variable, Fuzzy Sets and Systems, Vol 35,3, pp.281-293, 1990 [13] N Cat Ho and W Wechler, Extended hedge algebras and their application to Fuzzy logic, Fuzzy Sets and Systems 52, 259281, 1992 [14] Cat Ho N and H Van Nam: An algebraic approach to linguistic hedges in Zadeh's fuzzy logic, Fuzzy Set and System, 129, 229-254, 2002 [15] Nguyen Cat Ho, Vu Nhu Lan, Le Xuan Viet, Optimal hedge-algebras-based controller: Design and Application, Fuzzy Sets and Systems 159, 968– 989, 2008 [16] Dinko Vukadinović, Mateo Bašić, Cat Ho Nguyen, Nhu Lan Vu, Tien Duy Nguyen Hedge-Algebra-Based Voltage Controller for a Self-Excited Induction Generator, Control Engineering Practice, 30, 78–90, 2014 [17] Nguyen Dong Anh, Bui Hai Le, Vu Nhu Lan and Tran Duc Trung, Application of hedgealgebras-based fuzzy controller to active control of a structure against earthquake Struct Control Health Monit 20, 483–495, 2013 [18] Hai Le Bui, Duc Trung Tran, Lan Nhu Vu, Optimal fuzzy control of inverted pendulum Journal of Vibration and Control, 18 (14), 2097-2110, 2012 [19] Nguyen Dinh Duc, Vu Nhu Lan, Tran Duc Trung and Bui Hai Le A study on the application of hedge algebras to active fuzzy control of a seism-excited structure, Journal of Vibration and Control,18 (14), 2186–2200, 2012 [20] Nguyễn Công Điều, Một thuật tốn cho mơ hình chuỗi thời gian mờ, Tạp chí Khoa học Cơng nghệ, Tập 49, Số 4, 1125, 2011 [21] Nguyễn Duy Hiếu, Vũ Nhƣ Lân, Nguyễn Cát Hồ, Dự báo chuỗi thời gian mờ dựa ngữ nghĩa, Kỷ yếu Hội nghị Quốc gia lần thứ Nghiên cứu ứng dụng CNTT (FAIR), 232-243, 2015 A NEW METHOD TO FORECAST USING FUZZY TIME SERIES BASE ON LINGISTIC SEMANTICS Nguyen Duy Hieu, Nghiem Van Tinh, Vu Nhu Lan ABSTRACT— The time series forcasting problem has reseached by many authors in recent years But forcasting on data with large changes by time or data recorded by the linguistic labels caused many difficulties when solving it with traditional mathematical and statistical methods So Q Song and B.S Chissom proposed the fuzzy time series forcasting model Since then, there are many studies in this direction, in order to provide new methods or improve existing methods to increase the forcasting accuracy In this paper, we proposed a new method using hegde algebra semantization and desemantization to Alabama enrollments forcasting problem The forcasting model, the results and the comparisons will also be discussed Keywords— Forecasting, prediction, times series, fuzzy time series, hedge algebra, semantic, linguistic ...436 MỘT PHƢƠNG PHÁP MỚI DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN NGỮ NGHĨA NGÔN NGỮ Chen; mục giới thiệu tóm tắt LÝ THUYẾT ĐẠI SỐ GIA TỬ mục đề xuất phƣơng pháp DỰ BÁO CHUỖI THỜI GIAN MỜ SỬ DỤNG... mờ, khoảng giải nghĩa nhƣ thu đƣợc kết dự báo nhƣ sau: MỘT PHƢƠNG PHÁP MỚI DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN NGỮ NGHĨA NGÔN NGỮ 442 Bảng 4.7 So sánh kết dự báo Stt Năm 10 11 12 13 14 15 16 17 18... hóa chuỗi liệu Bƣớc Xác định quan hệ mờ Bƣớc Tạo lập nhóm quan hệ mờ Bƣớc Giải mờ đầu dự báo 2.4 Luật dự báo chuỗi thời gian mờ [4] Luật dự báo phép giải mờ kết đầu dự báo nhƣ bƣớc mơ hình dự báo