Dự báo chuỗi thời gian mờ dựa trên đại số gia tử và ứng dụng dự báo tuyển sinh cho trường cao đẳng sư phạm nam định

110 191 0
Dự báo chuỗi thời gian mờ dựa trên đại số gia tử và ứng dụng dự báo tuyển sinh cho trường cao đẳng sư phạm nam định

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LẠI VĂN LÃM DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG DỰ BÁO TUYỂN SINH CHO TRƯỜNG CAO ĐẲNG SƯ PHẠM NAM ĐỊNH LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2018 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LẠI VĂN LÃM DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG DỰ BÁO TUYỂN SINH CHO TRƯỜNG CAO ĐẲNG SƯ PHẠM NAM ĐỊNH Chuyên ngành: Khoa học máy tính Mã số: 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: TS NGUYỄN DUY MINH THÁI NGUYÊN - 2018 i LỜI CAM ĐOAN Tôi xin cam đoan kết đạt luận văn sản phẩm cá nhân hướng dẫn khoa học TS Nguyễn Duy Minh Trong toàn nội dung luận văn, nội dung trình bày cá nhân tổng hợp từ nhiều nguồn tài liệu khác Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Tôi xin chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan Thái Nguyên, tháng năm 2018 Tác giả Lại Văn Lãm i i LỜI CẢM ƠN Em xin gửi lời cảm ơn chân thành đến TS Nguyễn Duy Minh - người thầy, người hướng dẫn khoa học, định hướng nhiệt tình hướng dẫn, giúp đỡ em trình làm luận văn Em xin gửi lời biết ơn sâu sắc đến quý thầy cô giáo trường Đại học Công nghệ thông tin Truyền thông; Viện công nghệ thông tin thuộc Viện hàn lâm Khoa học Công nghệ Việt Nam truyền đạt kiến thức kinh nghiệm quý báu cho chúng em thời gian học tập Xin chân thành cảm ơn bạn bè, đồng nghiệp, ban cán học viên lớp cao học CK15B, người thân gia đình động viên, chia sẻ, tạo điều kiện giúp đỡ suốt trình học tập làm luận văn Thái Nguyên, tháng năm 2018 Tác giả Lại Văn Lãm iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC VIẾT TẮT v DANH MỤC BẢNG vi DANH MỤC HÌNH vii MỞ ĐẦU CHƯƠNG 1: LOGIC MỜ VÀ ĐẠI SỐ GIA TỬ 1.1 Những vấn đề mờ .4 sở lý thuyết tập mờ logic 1.1.1 Lý thuyết tập mờ 1.1.2 Logic mờ 1.2 Chuỗi thời mờ 10 gian 1.3 Quan mờ 13 hệ 1.3.1 Khái niệm quan hệ rõ 13 1.3.2 Các quan hệ mờ 13 1.3.3 Các phép toán quan hệ mờ 14 1.3.4 Hệ luật mờ 14 1.4 Giới thiệu ĐSGT chất 15 số tính 1.4.1 ĐSGT biến ngơn ngữ 15 1.4.2 Độ đo tính mờ ánh xạ định lượng ngữ nghĩa 18 1.5 Kết luận chương iv 24 CHƯƠNG 2: MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ 25 2.1 Một số mơ hình .25 chuỗi thời gian mờ 2.1.1 Thuật toán Song Chissom 25 2.1.2 Thuật toán Chen 26 2.2 Thử nghiệm mơ hình dự báo 28 v 2.2.1 Mơ hình dự báo sinh viên nhập học trường đại học Alabama Song Chissom 29 2.2.2 Mơ hình dự báo sinh viên nhập học trường đại học Alabama Chen .35 2.3 So sánh kết mô hình dự báo chuỗi thời gian mờ 42 2.4 Kết luận chương 44 CHƯƠNG 3: MƠ HÌNH DỰ BÁO SỬ DỤNG ĐSGT VÀ ỨNG DỤNG CHO TUYỂN SINH TRƯỜNG CAO ĐẲNG SƯ PHẠM NAM ĐỊNH 45 3.1 Mơ hình tính tốn thuật toán dự báo mờ dựa ĐSGT 45 3.2.Ứng dụng mơ hình dự báo chuỗi thời gian mờ sử dụng ĐSGT cho dự báo TS trường Cao đẳng Sư phạm Nam Định 57 3.2.1 Mô tả sở liệu cho mơ hình dự báo 57 3.2.2 Cài đặt thử nghiệm 58 3.3 Kết luận chương 65 KẾT LUẬN 66 TÀI LIÊU THAM KHAO 67 PHỤ LỤC 68 vi DANH MỤC VIẾT TẮT STT Ký hiệu viết tắt Ý nghĩa ĐSGT Đại số gia tử SV Sinh viên TS Tuyển sinh vi i DANH MỤC BẢNG Bảng 1.1: Các cặp T - chuẩn T - đối chuẩn Bảng 1.2: Một số phép kéo theo mờ thông dụng 10 Bảng 1.3: Ví dụ tính âm dương gia tử 17 Bảng 2.1: Số SV nhập học trường đại học Alabama 28 Bảng 2.2: Chuyển đổi giá trị lịch sử thành giá trị ngôn ngữ 31 Bảng 2.3: Xác định quan hệ thành viên 33 Bảng 2.4: Mờ hóa chuỗi liệu 36 Bảng 2.5: Quan hệ logic mờ liệu TS 37 Bảng 2.6: Các nhóm quan hệ logic mờ 38 Bảng 2.7: Bảng so sánh phương án dự báo 41 Bảng 2.8: So sánh phương pháp dự báo với khoảng chia 42 Bảng 3.1: Giá trị đầu giá trị cuối khoảng giải nghĩa chọn 54 Bảng 3.2: Kết tính toán dự báo số SV nhập học trường đại học Alabama từ 1971 đến 1992 theo tiếp cận ĐSGT 55 Bảng 3.3: So sánh phương pháp dự báo với khoảng chia 56 Bảng 3.4: Số SV nhập học trường Cao đẳng Sư phạm Nam Định từ 1990 đến 2017 57 Bảng 3.5: Bảng nhãn ngữ nghĩa tập 59 Bảng 3.6: Giá trị đầu giá trị cuối khoảng giải nghĩa chọn cho dự báo TS trường Cao đẳng Sư phạm Nam Định 62 Bảng 3.7: Kết tính tốn dự báo số SV nhập học Cao đẳng Sư phạm Nam Định từ 1990 đến 2017 theo tiếp cận ĐSGT 63 vi i DANH MỤC HÌNH Hình 1.1: Giao hai tập mờ Hình 1.2: Phép hợp hai tập mờ Hình 2.1: Số SV nhập học thực tế số SV nhập học dự báo theo mơ hình Song & Chissom 34 Hình 2.2: Số SV nhập học thực tế số SV nhập học dự báo theo mơ hình Chen 42 Hình 3.1: Số SV nhập học thực tế số SV nhập học dự báo sử dụng ĐSGT trường đại học Alabama 55 Hình 3.2: Số SV nhập học thực tế số SV nhập học dự báo sử dụng ĐSGT trường Cao đẳng Sư phạm Nam Định 65 Bước 4: Xác định quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Theo Bảng 3.5 ta có quan hệ ngữ nghĩa sau: SA1→SA1 (trùng lần); SA1→SA2(trùng lần) SA2→SA1 (trùng lần); SA2→SA2 (trùng lần); SA2→SA3 (trùng lần); SA2→SA4 SA3→SA2 (trùng lần); SA3→SA3 (trùng lần); SA4→SA3; SA4→SA6; SA6→SA4; SA6→SA7; SA7→SA6; Bước 5: Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Từ quan hệ theo nhãn ngữ nghĩa bước ta nhận nhóm quan hệ ngữ nghĩa sau đây: Nhóm 1: SA1 → (SA1,SA1,SA1,SA2,SA2) Nhóm 2: SA2 → (SA1,SA1,SA2,SA2,SA2,SA3,SA3,SA4,) Nhóm 3: SA3 → (SA2,SA2,SA2,SA3,SA3,SA3,SA3,SA3,SA3) Nhóm 4: SA4 → (SA3,SA6) Nhóm 5: SA6 → (SA4,SA7) Nhóm 6: SA7 → (SA6) Bước 6: Giải nghĩa đầu dự báo với giá trị định lượng ngữ nghĩa tưng nhãn ngữ nghĩa Trong toán dự báo số sinh viên nhập học trường Cao đẳng Sư phạm Nam Định, chọn đoạn giải nghĩa hợp lý với giá trị đầu vào, giá trị cuối Bảng 3.6 Bảng 3.6: Giá trị đầu giá trị cuối khoảng giải nghĩa chọn cho dự báo TS trường Cao đẳng Sư phạm Nam Định Khoảng giải Giá trị Giá trị Khoảng giải Giá trị Giá trị nghĩa cho đầu cuối nghĩa cho đầu cuối điểm dự báo khoảng khoảng điểm dự báo khoảng khoảng 100 300 100 400 100 400 200 500 100 500 200 600 200 600 200 600 200 600 200 600 200 500 200 500 200 500 100 300 ( 1990 ) ( 1991 ) ( 1992 ) ( 1993 ) ( 1994 ) ( 1995 ) (1996 ) ( 1997 ) ( 1998 ) 10 ( 1999 ) 11 ( 2000 ) 12 ( 2001) 13 ( 2002 ) 14 ( 2003 ) 15 ( 2004 ) 100 400 100 300 100 400 300 600 400 800 500 800 600 800 300 600 300 600 100 500 100 300 100 200 100 300 16 ( 2005 ) 17 ( 2006 ) 18 ( 2007 ) 19 ( 2008 ) 20 ( 2009 ) 21 ( 2010 ) 22 ( 2011 ) 23 ( 2012 ) 24 ( 2013 ) 25 (2014) 26 (2015) 27( 2016) 28(2017) Để đánh giá độ xác mơ hình dự báo dựa ĐSGT ta sử dụng số cách đánh giá sai số dự báo theo hàm sau: - Sai số tuyệt đối trung bình n MAE = et , với et tính theo (3.13) n t 1 (3.15) - Sai số bình phương trung bình gốc RMSE = MSE , với MSE tính theo (3.14) (3.16) - Phần trăm sai số  Y F  PEt   t t  100  Yt  (3.17) - Sai số phần trăm tuyệt đối MAPE  n PE nt 1 t (3.18) Tính tốn dự báo cho năm với tham số tự chọn  = 0.5, α= 0.5; sp= 0.3 dp = -0.2 dựa Mathlab 2014b (chương trình tính tốn xem phần Phụ lục) ta có kết mơ hình dự báo dựa ĐSGT cho năm Bảng 3.7 Bảng 3.7: Kết tính toán dự báo số SV nhập học Cao đẳng Sư phạm Nam Định từ 1990 đến 2017 theo tếp cận ĐSGT Năm Số SV nhập học thực tế Số SV nhập học dự báo Phần trăm sai số(PEt) 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 219 256 183 231 475 619 706 689 455 352 252 167 155 158 161 187 158 161 387 587 696 755 496 440 241 158 120 141 141 26.95 13.66 30.30 18.53 5.17 1.42 -9.58 -9.01 -25.00 4.37 5.39 22.58 10.76 12.42 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 213 298 364 265 357 319 354 365 380 363 317 289 213 161 187 287 241 317 341 341 341 341 306 306 306 158 24.41 37.25 21.15 9.06 11.20 -6.90 3.67 6.58 10.26 15.70 3.47 -5.88 25.82 Áp dụng cơng thức tính sai số từ 3.14 đến 3.18, ta tính sai số dự báo tuyển sinh cho trường Cao đẳng Sư phạm Nam Định theo tếp cận ĐSGT sau: MSE = 2493; MAE = 54; RMSE = 50; MAPE = 17.93 Từ Bảng 3.7 ta xây dựng đồ thị so sánh kết dự báo sử dụng ĐSGT trường Cao đẳng Sư phạm Nam Định so với thực tế Hình 3.2 Hình 3.2: Số SV nhập học thực tế số SV nhập học dự báo sử dụng ĐSGT trường Cao đẳng Sư phạm Nam Định 3.3 Kết luận chương Chương luận văn trình bày mơ hình tính tốn thuật toán dự báo sử dụng ĐSGT, thực cài đặt thử nghiệm phương pháp dự báo chuỗi thời gian mờ dựa ĐSGT số liệu nhập học trường đại học Alabama để so sánh với mơ hình dự báo Chen Qua bảng số liệu so sánh thấy rõ tính ưu việt tiếp cận ĐSGT so với tiếp cận mờ, từ ứng dụng mơ hình dự báo dựa ĐSGT để dự báo cho tuyển sinh trường Cao đẳng Sư phạm Nam Định KẾT LUẬN Dự báo chuỗi thời gian vấn đề nhiều nhà khoa học giới quan tâm nghiên cứu Q.Song B.S Chissom [3] lần đầu tên đưa quan niệm xem giá trị thực định lượng chuỗi thời gian từ góc độ định tính Tuy nhiên mơ hình tính tốn nhóm quan hệ mờ q phức tạp độ xác dự báo khơng cao Chen [6] thay đổi cách tính tốn nhóm quan hệ mờ mơ hình dự báovới phép tính số học đơn giản để thu kết dự báo xác Mơ hình dự báo dựa ĐSGT mơ hình mới, hồn tồn khác biệt, có khả dự báo chuỗi thời gian mờ với độ xác cao so với số mơ hình dự báo có Sự khác biệt thể phương pháp luận lần sử dụng phép ngữ nghĩa hóa phi tuyến thay cho phép mờ hóa, nhóm quan hệ ngữ nghĩa thay cho nhóm quan hệ mờ phép giải nghĩa phi tuyến thay cho phép giải mờ Mặc dù sử dụng mô hình chuỗi thời gian mờ bậc với khoảng chia liệu lịch sử trường đại học Alabama mơ hình dự báo đầu tên Chen, kết ứng dụng mơ hình dự báo dựa ĐSGT với tham số hóa nhãn ngữ nghĩa biến ngôn ngữ cho thấy rõ hiệu dự báo tốt Chính vậy, mơ hình chuỗi thời gian mờ sử dụng ĐSGT nhiều tác giả nghiên cứu, có nhiều triển vọng ứng dụng nhiều lĩnh vực Để thấy rõ tính hiệu nó,học viên cài đặt thử nghiệm cho toán dự báo cụ thể dự báo TS cho trường Cao đẳng Sư phạm Nam Định Tuy nhiên điều kiện thời gian trình độ hạn chế khơng thể tránh khỏi thiếu sót trình xây dựng dự báo cho TS trường Cao đẳng Sư phạm Nam Định Nếu điều kiện cho phép, tiếp tục nghiên cứu để tối ưu tham số ĐSGT để có kết dự báo xác mở rộng ứng dụng mơ hình dự báo dựa ĐSGT cho nhiều lĩnh vực khác chuỗi liệu thời tiết, nhiệt độ… để phát triển tiếp luận văn hướng đến thực tễn TÀI LIÊU THAM KHAO Tiếng việt [1] Nguyễn Cơng Điều: Một thuật tốn cho mơ hình chuỗi thời gian mờ Tạp chí Khoa học Công nghệ, Tập 49, Số 4, 2011, 11-25 [2] Nguyễn Duy Minh - Điều chỉnh ngữ nghĩa định lượng giá trị ngôn ngữ ĐSGT ứng dụng, Tạp chí Khoa học Cơng nghệ 49 (4) (2011) 2740 Tiếng anh [3] Song Q, Chissom B.S Fuzzy time series and its models Fuzzy Sets and Syst 54, 269–277, 1993 [4] Song Q, Chissom B.S: Forecasting enrollments with fuzzy time series – part Fuzzy Sets and Syst 54, 1–9, 1993 [5] Song Q, Chissom B.S.: Forecasting enrollments with fuzzy tme series – part Fuzzy Sets and Syst 62, 1–8, 1994 [6] Chen S.M.: Forecastng Enrollments Based on Fuzzy Time Series Fuzzy Sets and Syst 81, 311–319, 1996 [7] N.C Ho and W Wechler, Hedge algebras: An algebraic approach to structures of sets of linguistic domains of linguistic truth variable, Fuzzy Sets and Systems, 35, 281-293, 1990 [8] N.C Ho and W Wechler, Extended hedge algebras and their applicaton to Fuzzy logic, Fuzzy Sets and Systems, 52, 259-281, 1992 [9] Ho N C., Lan V N - Hedge Algebras – An order – based structure of terms – domains: - An algebraic approach to human reasoning, Journal of Science and Technology 45 (6) (2009) 77-108 [10] Huarng K, Efective lengths of intervals to improve forecasting in fuzzy tme series Fuzzy Sets and Systems 123 387–394, 2001 PHỤ LỤC % Chuong trinh tinh toan du bao truong dai hoc Alabama format long SV22=[13055;13563;13867;14696;15460;15311;15603;15861;16807;1 6919;16388;15433;15497;15145;15163;15984;16859;18150;18970;19 328;19337;18876] SV21=[13563;13867;14696;15460;15311;15603;15861;16807;16919;1 6388;15433;15497;15145;15163;15984;16859;18150;18970;19328;19 337;18876] xgmin=13000 xgmax=20000 WSA1A1=3/7 WSA2A1=1/7 WSA3A2=1 WSA3A3=9/71 WSA4A3=4/71 WSA4A4=4/20 WSA3A4=9/20 WSA6A4=3/20 WSA6A6=3/5 WSA7A6=2/5 WSA7A7=2/5 WSA6A7=3/5 % TETA=x(1) va Anpha=x(2) x(1)=0.5 x(2)=0.5 SA1=x(1)*(1-x(2))*(1-x(2)) SA2=x(1)*(1-x(2)) SA3=x(1)*(1x(2)+x(2)^2) SA4=x(1) SA5=x(1)+x(2)*(1-x(1))*(1-x(2)) SA6=x(1)+(1-x(1))*x(2) SA7=x(1)+x(2)*(1x(1))*(2-x(2)) SP(1)=WSA1A1*SA1*2+WSA2A1*SA2 SP(2)=SP(1) SP(3)=SP(1) SP(4)=WSA3A2*SA3 SP(5)=WSA3A3*SA3*7+WSA4A3*SA4*2 SP(6)=SP(5) SP(7)=SP(5) SP(12)=SP(5) SP(13)=SP(5) SP(14)=SP(5) SP(15)=SP(5) SP(8)=SP(5) SP(16)=SP(5) SP(9)=WSA4A4*SA4*2+WSA3A4*SA3+WSA6A4*SA6 SP(10)=SP(9) SP(11)=SP(9) SP(17)=SP(9) SP(18)=WSA6A6*SA6+WSA7A6*SA7 SP(19)=SP(18) SP(20)=WSA6A7*SA6+WSA7A7*SA7 SP(21)=SP(20) xmin=[13000;13000;13000;15000;14000;14000;15000;15000;15000;1 4000;13000;14000;14000;14000;15000;15000;15000;16000;17000;17 000;15000] xmax=[17000;18000;20000;16000;17000;18000;18000;19000;19000;1 9000;18000;18000;17000;17000;18000;19000;20000;20000;20000;20 000;20000] SPP=0.3 DPP=-0.2 lb=[0;0] ub=[1;1] for i=1:21, DeSP(i)=(SPP*SP(i)*(1-SP(i))+SP(i))*(xmax(i)- xmin(i))+xmin(i); DDeSP(i)=DPP*(DeSP(i)-xmin(i))*(xmax(i)-DeSP(i))/(xmax(i)- xmin(i))+DeSP(i); end DP=[1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21]; SAISO=SV21-DDeSP' SAISOBINHPHUONG=[SAISO(1)^2;SAISO(2)^2;SAISO(3)^2;SAISO(4)^2; SAISO(5)^2;SAISO(6)^2;SAISO(7)^2;SAISO(8)^2;SAISO(9)^2;SAISO( 10)^2;SAISO(11)^2;SAISO(12)^2;SAISO(13)^2;SAISO(14)^2;SAISO(1 5)^2;SAISO(16)^2;SAISO(17)^2;SAISO(18)^2;SAISO(19)^2;SAISO(20 )^2;SAISO(21)^2] T=sum(SAISOBINHPHUONG) MSE=T/21 y=MSE BANG=[ DP SV21 DDeSP' SAISOBINHPHUONG] % Chuong trinh tinh toan du bao truong CDSP Nam Dinh format short SV22=[219;256;183;231;475;619;706;689;455;352;252;167;155;158 ;161;213;298;364;265;357;319;354;365;380;363;317;289;213] SV21=[256;183;231;475;619;706;689;455;352;252;167;155;158;161 ;213;298;364;265;357;319;354;365;380;363;317;289;213] xgmin=100 xgmax=800 WSA1A1 = 5/33 WSA2A1 = 9/33 WSA1A2 = 5/57 WSA2A2 = 9/57 WSA3A2 = 9/57 WSA4A2 = 2/57 WSA2A3 = 9/81 WSA3A3 = 9/81 WSA3A4 = 9/11 WSA6A4 = 2/11 WSA4A6 = 2/3 WSA7A6 = 1/3 WSA6A7 = x(1)=2 x(2)=2 while x(1)1 x(1)=input('Nhap vao tham so teta(0

Ngày đăng: 03/10/2018, 12:29

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan