Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 67 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
67
Dung lượng
395,74 KB
Nội dung
1 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LƯU ĐỨC DŨNG TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TÍN DỤNG CHO NGÂN HÀNG ABBANK LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN, 2017 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ` LƯU ĐỨC DŨNG TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TÍN DỤNG CHO NGÂN HÀNG ABBANK Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học : PGS TS Lê Bá Dũng Thái Nguyên, 2017 MỤC LỤC MỤC LỤC DANH MỤC HÌNH ẢNH DANH MỤC BẢNG BIỂU MỞ ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ TẬP MỜ 1.1 Tập mờ 1.1.1Định nghĩa tậ 1.1.2Một số khái n 1.1.3Biểu diễn tập 1.2 Các phép toán tập mờ hệ luật mờ 1.2.1Phần bù 1.2.2Phép hợp 1.2.3Phép giao củ 1.2.4Tích Descart 1.2.5Tính chất 1.2.6Hệ luật mờ 1.3 Lập luận xấp xỉ tập mờ 1.3.1Logic mờ 1.3.2Quan hệ mờ 1.3.2.1 Khái niệm quan hệ rõ 1.3.2.2 Các quan hệ mờ 1.3.2.3 Các phép toán quan hệ mờ 1.3.3Suy luận xấp 1.4 Số học mờ 1.4.1Số mờ 1.4.1.1 Khái niệm số mờ 1.4.1.2 Dạng số mờ thường dùng 1.4.2Biến ngôn ng 1.5 Giải mờ 1.5.1 1.5.2 Phương phá Phương phá CHƯƠNG 2: KHÁI NIỆM VỀ CHUỖI THỜI GIAN MỜ VÀ CÁC PHƯƠNG PHÁP 2.1 Khái niệm chuỗi thời gian mờ 2.1.1 Định nghĩa 2.1.2 Một số định 2.2 Một số thuật tốn dự báo mơ hình ch 2.2.1 2.2.2 2.3 Thuật toán Thuật toán Một số phương pháp chia khoảng 2.3.1 Phương phá 2.3.2 Phương phá 2.4 Thuật tốn mơ hình dự báo dựa chuỗi Poulsen (hay Jens Poulsen) 2.5 Thuật toán phân cụm mờ - Thuật toán K-m CHƯƠNG 3: DỰ BÁO TÍN DỤNG ỨNG DỤNG CHUỖI THỜI GIAN MỜ SỬ DỤNG KỸ THUẬT PHÂN CỤM 3.1 Ứng dụng phương pháp chuỗi thời gian m 3.2 Tiếp cận phương pháp cho dự báo 3.3 Đánh giá phương pháp tiếp cận 3.4 Kết luận TÀI LIỆU THAM KHẢO DANH MỤC HÌNH ẢNH Hình 1.1 Hàm thuộccó mức chuyển đổi tuyến tính Hình 1.2 Hàm thuộc tập B Hình 1.3 Miền xác định miền tin cậy tập mờ A Hình 1.4 Biểu diễn tập mờ chiều cao Hình 1.5 Tập bù tập mờ A Hình 1.6 Hợp hai tập mờ có tập Hình 1.7 Giao hai tập mờ có tập vũ trụ Hình 1.8 Các loại hàm thành viên số mờ Hình 1.9 Phân loại hàm thành viên số mờ Hình 1.10 Số mờ hình thang Hình 1.11 Số mờ hình tam giác Hình 1.12 Những tập mờ thuộc biến ngơn ngữ nhiệt độ Hình 1.13 Giải mờ phương pháp điểm cực đại Hình 1.14 Giải mờ phương pháp điểm trọng tâm Hình 2.1 Các thiết lập để xác định ranh giới cụm ban đầu Hình 2.2 Tính tốn trọng tâm cụm Hình 2.3 Các bước thực thuật tốn K- means Hình 2.4 Thuật toán K-means chi tiết Hình 2.5 Ví dụ số hình dạng cụm liệu khám phá Kmeans Hình 3.1 Tín dụng tập mờ giá trị dự báo qua năm Hình 3.2 Giá trị dự báo mơ hình dự báo đề xuất so với giá trị dư nợ tín dụng thực tế DANH MỤC BẢNG BIỂU Bảng 1.1 Bảng biểu diễn tập mờ A Bảng 2.1 Cơ sở ánh xạ Bảng 3.1 Số liệu dư nợ tín dụng Ngân hàng ABBANK Bảng 3.4 Số liệu tín dụng tập mờ giá trị dự báo qua năm Bảng 3.5 Kết dự báo Bảng 3.6 Phân tích kết dự báo qua sai số tiêu chuẩn Bảng 3.7 Bảng so sánh kết dự báo mơ hình Bảng 3.8 Bảng sai số dự báo mơ hình Bảng 3.9 Bảng so sánh thước đo sai số mô hình LỜI CAM ĐOAN Tơi xin cam đoan luận văn nghiên cứu thực Các thông số, bảng biểu kết sử dụng luận văn hồn tồn có thật chưa công bố luận văn khác Thái Nguyên, ngày 14 tháng 04 năm 2017 Tác giả luận văn Lưu Đức Dũng MỞ ĐẦU Nghiên cứu chuỗi thời gian nói chung, chuỗi thời gian mờ nói riêng nghiên cứu, ứng dụng mạnh mẽ thành công nhiều lĩnh cực năm gần [4, 5, 6, 7] Các lớp toán lĩnh vực dự báo tín dụng, thị trường chứng khốn, dự báo mơ hệ thống điều khiển… sử dụng giải theo phương pháp truyền thống phương pháp thống kê, quy hoạch tuyến tính, … Phương pháp nghiên cứu chuỗi thời gian mờ hình thành có nhiều khả vượt trội việc tuyến tính hóa, dự báo, phân tích, đánh giá liệu, áp dụng thành công cho số lĩnh vực khoa học, kỹ thuật, kinh tế… Nhiều mơ hình chuỗi thời gian mờ (FTS) [6,7] đề xuất tài liệu khoa học thập kỷ qua Trong số mơ hình chuỗi thời gian mờ xác tìm thấy tài liệu mơ hình bậc cao Tuy nhiên, ba vấn đề cần phải giải liên quan đến mơ hình bậc cao Đầu tiên, phương pháp dự báo để cung cấp tỷ lệ xác đạt yêu cầu cho đầu giải mờ (dự báo) Thứ hai, liệu trở nên sử dụng tăng thứ bậc Thứ ba, dự báo xác nhạy cảm với phân vùng khoảng lựa chọn Nhằm giải vấn đề đề với gợi ý thầy hướng dẫn đề tài cho luận văn tốt nghiệp với tiêu đề là: “Tiếp cận phân cụm chuỗi thời gian mờ dự báo tín dụng cho ngân hàng ABBANK” Nội dung luận văn ứng dụng phương pháp chuỗi thời gian mờ cho dự báo tín dụng trình bày chương sau: Chương 1: Cơ sở lý thuyết tập mờ Chương 2: Khái niệm chuỗi thời gian mờ phương pháp Chương 3: Dự báo tín dụng ứng dụng chuỗi thời gian mờ sử dụng kỹ thuật phân cụm TÀI LIỆU THAM KHẢO Luận văn hoàn thành hướng dẫn tận tình thầy giáo PGS TS Lê Bá Dũng, em xin đặc biệt bày tỏ lòng biết ơn chân thành thầy Em chân thành cảm ơn thầy, cô giáo Viện Công nghệ thông tin, Trường Đại học Công nghệ Thông tin Truyền thông Đại học Thái Nguyên tham gia giảng dạy, giúp đỡ em suốt trình học tập nâng cao trình độ kiến thức Tuy nhiên điều kiện thời gian khả có hạn nên luận văn khơng thể tránh khỏi thiếu sót Em kính mong thầy giáo bạn đóng góp ý kiến để đề tài hoàn thiện 10 Đối tượng phạm vi nghiên cứu 1.1 - Đối tượng Tập trung tìm hiểu, tiếp cận chuỗi thời gian mờ lý thuyết, cấu trúc, phương pháp học hạn chế - Sau áp dụng phương pháp để đánh giá để đạt kết tối ưu cho dự báo tín dụng 1.2 Phạm vi nghiên cứu - Tìm hiểu tổng quan chuỗi thời gian mờ Tìm hiểu, so sánh phương pháp ứng dụng chuỗi thời gian mờ Trình bày phương pháp để dự báo tín dụng dựa kỹ thuật phân cụm K-means Hướng nghiên cứu đề tài giá Nắm bắt kiến thức phương pháp phân tích, đánh - Tiếp tục tìm hiểu sâu phương pháp khai phá liệu Một số mơ hình mờ, ứng dụng cho việc dự báo tín dụng Cài đặt thực nghiệm, ứng dụng vào toán cụ thể thực tiễn _ +1=_ 51 Giải thích: _ +1 giới hạn cụm m+1 _ giới hạn cụm m Trong đó: m = 1, 2,… k - Bởi khơng có cụm trước cụm khơng có cụm tiếp sau cụm cuối cùng, giới hạn _ cụm giới hạn _ cụm cuối tính sau: cluster _ uBoundk = cluster _ centerk + (cluster _ centerk - cluster _ lBoundk ) cluster _ lBound1 = cluster _ center1 - (cluster _ uBound1 - cluster _ center1 ) u1 = [56,733) u3 = [3835,6699) u5 = [9871,15820) u7 = [19326,21772) u9 = [24808,28442) u11 = [33471,38582) Bảng 3.3 Các giá trị cận cận cụm Bước 4: Định nghĩa tập mờ Ai dựa khoảng giá trị năm khứ thể bảng 3.1, giá trị ngơn ngữ số liệu tín dụng đại diện tập mờ qua sử dụng hàm tam giác Các tập mờ trường hợp biểu diễn A1, A2 … An thể 52 giá trị mờ cụm với hàm thuộc cần tính An+1 số liệu năm dự báo Như toán dự báo tín dụng là: A1 A2 A2 A3 … An-1 An Tìm An+1 hay Aj = ? Các tập mờ Ai, i = 1,2,…,11 định nghĩa thơng qua hàm thuộc, để đơn giản có dạng hình nón nhận giá trị 0, 0.5 1, viết sau: A1 = 1/u1 + 0.5/u2 + 0/u3 + + 0/u10 + 0/u11 A2 = 0.5/u1 + 1/u2 + 0.5/u3 + + 0/u10 + 0/u11 A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 + + 0/u10 + 0/u11 A4 = 0/u1 + 0/u2 + 0.5/u3 + 1/u4 + 0.5/u5 + + 0/u10 + 0/u11 A5 = 0/u1 + 0/u2 +… + 0.5/u4 + 1/u5 + 0.5/u6 + + 0/u10 + 0/u11 A6 = 0/u1 + 0/u2 +… + 0.5/u5 + 1/u6 + 0.5/u7 + + 0/u10 + 0/u11 A7 = 0/u1 + 0/u2 +… + 0.5/u6 + 1/u7 + 0.5/u8 + + 0/u10 + 0/u11 A8 = 0/u1 + 0/u2 +… + 0.5/u7 + 1/u8 + 0.5/u9 + + 0/u10 + 0/u11 A9 = 0/u1 + 0/u2 + + 0.5/u8 + 1/u9 + 0.5/u10 + 0/u11 A10 = 0/u1 + 0/u2 + + 0.5/u9 + 1/u10 + 0.5/u11 A11 = 0/u1 + 0/u2 + + 0/u9 + 0.5/u10 + 1/u11 Bước 5: Giải mờ giá trị dự báo = 53 Trong công thức (3.5) sử dụng để tính giá trị dự báo giá trị aj-1, aj, aj+1 giá trị trung bình khoảng mờ Aj-1, Aj, Aj+1 Các giá trị dùng để tính giá trị dự báo tín dụng tj Bảng 3.4 kết tính giá trị dự báo qua năm Tín dụng Năm thực tế 2003 158 2004 179 2005 906 2006 1131 2007 6858 2008 6539 2009 12883 CAC GIA TRI DU BAO o VA THUC _ Bảng 3.4 Số liệu tín dụng tập mờ giá trị dự báo qua năm 3.5 2.5 1.5 0.5 Hình 3.1 Tín dụng tập mờ giá trị dự báo qua năm 54 3.3 Đánh giá phương pháp tiếp cận Trong phần này, so sánh độ xác giá trị dự báo mơ hình tiếp cận nghiên cứu với mơ hình khác thực sở sai số giá trị dự báo Với Yt giá trị quan sát (thực tế) Ft giá trị dự báo tương ứng với thời điểm t, sai số dự báo xác định: = − ,=1, Khi ta có cơng thức tính phần trăm sai số: =( Việc tính tốn sai số dự báo thực qua tiêu chuẩn khác để xác định hiệu cho khả dự báo nó: Sai số trung bình (MBE - Mean Bias Error): = =1 Sai số tuyệt đối trung bình (MAE - Mean Absolute Error): = =1 Sai số bình phương trung bình (MSE - Mean Squared Error): = =1 Sai số phần trăm trung bình (MPE-Mean Percentage Error): 55 = =1 Sai số phần trăm tuyệt đối (MAPE-Mean Absolute Percentage Error): = =1 Sai số bình phương trung bình gốc (RSME - Root Mean Square Error) =√ =1 Với n số năm cần thiết để dự báo cho tín dụng So sánh sai số phương pháp tiếp cận với phương pháp khác Lấy số liệu thực dự báo qua phân cụm để tính tiêu chuẩn sai số 56 Năm 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Bảng 3.5 Kết dự báo 57 Dưới bảng phân tích kết dự báo mơ hình tiếp cận phân cụm chuỗi thời gian mờ cho dự báo tín dụng qua sai số tiêu chuẩn: T Năm d thự t 10 11 12 13 14 158 179 906 1131 6858 6539 12883 19877 19916 18756 23647 25969 30915 36026 Tổng Bias MAE MSE MPE MAPE RMSE Bảng 3.6 Phân tích kết dự báo qua sai số tiêu chuẩn 58 So sánh kết dự báo mơ hình tiếp cận với mơ hình dự báo khác Naive (dự báo thô), Moving averages (phương pháp bình quân di động), phương pháp dự báo nhân (Causal models or regression), giá trị dự báo mơ hình xác định sau: Mơ hình dự báo thơ (Naive): giá trị dự báo với giá trị trước +1= , =1, Mơ hình dự báo bình qn di động (Moving averages): = +1 Mơ hình dự báo nhân (Causal models or regression): Kết so sánh thể bảng 3.7 đây: t Năm 2003 2004 2005 2006 2007 2008 2009 2010 2011 10 2012 11 2013 12 2014 13 2015 14 2016 Bảng 3.7 Bảng so sánh kết dự báo mơ hình 59 t Năm 2003 2004 2005 2006 2007 2008 2009 2010 2011 10 2012 11 2013 12 2014 13 2015 14 2016 Bảng 3.8 Bảng sai số dự báo mơ hình 40000 35000 30000 25000 Dư nợ tín dụng (thực tế) Dự báo tiếp cận 20000 Naive Moving Averages (3MA) 15000 Regression 10000 5000 1011121314 Hình 3.2 Giá trị dự báo mơ hình dự báo tiếp cận so với giá trị dư nợ tín dụng thực tế 60 So sánh kết tất mơ hình dự báo thể bảng 3.9, nhận thấy sai số dự báo nhỏ trường hợp áp dụng mơ hình dự báo tiếp cận cho phân cụm chuỗi thời gian mờ Các sai số bao gồm: sai số trung bình (MBE - Mean Bias Error), sai số tuyệt đối trung bình (MAE - Mean Absolute Error), sai số bình phương trung bình (MSE - Mean Squared Error), sai số phần trăm trung bình (MPE-Mean Percentage Error), sai số phần trăm tuyệt đối (MAPE-Mean Absolute Percentage Error), sai số bình phương trung bình gốc (RSME - Root Mean Square Error): Thước đo Bias MAE MSE MPE MAPE RMSE Bảng 3.9 Bảng so sánh thước đo sai số mơ hình 3.4 Kết luận Tiếp cận đến phương pháp cho dự báo chuỗi thời gian mờ với độ xác cao Thuật toán K-means phương pháp tiếp cận đơn giản thực dễ dàng cách sử dụng phần mềm toán học Matlab Phương pháp thực dựa liệu khứ tín dụng Ngân hàng ABBANK để có nghiên cứu so sánh với phương pháp có Từ bảng 3.7 3.9 ta thấy phương pháp tiếp cận nghiên cứu có tỷ lệ xác dự báo cao phương pháp trình bày trước 61 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Lê Bá Dũng, Các hệ sở tri thức (knowledge based system) ứng dụng, Bài giảng ĐHBK Hà Nội – Genetic computer school joint education program [2] Bùi Cơng Cường, Nguyễn Dỗn Phước, “Lý thuyết mờ cơng nghệ tính tốn mềm”, Hệ mờ mạng nơron ứng dụng, Nhà xuất Khoa học Kỹ thuật, pp.53-89, 2006 [3] Nguyễn Cơng Điều “Một thuật tốn cho mơ hình chuỗi thời gian mờ heuristic dự báo chứng khốn”, Khoa học Cơng nghệ, Viện KH&CN VN 2011, 49(4) (2011) 11-25 Tiếng Anh [4] S M Chen (2002), “Forecasting Enrollments based on hightorder Fuzzy Time Series”, Int Journal: Cybernetic and Systems, N.33, pp 1-16 [5] Moddy J., Darken C J.: Fast learning in network of locally tuned processing units Neural Comput., 1, 1989, pp 281-294 [6] Jens Rúni Poulsen, “Fuzzy Time Series Forecasting”, AAUE, zovember 2009 [7] Q Song, B.S Chissom, (1993), “Fuzzy Time Series and its Model”, Fuzzy set and system, vol 54, pp 269-277 [8] S.M Chen, (1996), “Forecasting Enrollments based on Fuzzy Time Series,” Fuzzy set and system, vol 81, pp 311-319 62 [9] K Huarng , “Effective length of interval to improve forecasting in fuzzy time series”, Fuzzy set and Systems, (2001) vol 123, pp 387-394 [10] J R H Wang, S M Chen, C H Lee, “Handing forecasting problems using fuzzy time series”, Fuzzy Sets and Systems, 100 (1998) 217228 [11] T A Jilani, S M A Burney, C Ardil, “ Fuzzy metric approach for fuzzy time series forecasting based on frequency density based partitioning”, In: Proceedings of World Academy of Science, Engineering and Technology 23 (2009) 1307-6884 [12] Zhang, Z and Zhu, Q “Fuzzy Time Series Forecasting Based On K-Means Clustering” Open Journal of Applied Sciences, (2012) vol 2, pp 100-103 ... tài cho luận văn tốt nghiệp với tiêu đề là: ? ?Tiếp cận phân cụm chuỗi thời gian mờ dự báo tín dụng cho ngân hàng ABBANK? ?? Nội dung luận văn ứng dụng phương pháp chuỗi thời gian mờ cho dự báo tín dụng. .. mơ hình dự báo dựa chuỗi Poulsen (hay Jens Poulsen) 2.5 Thuật toán phân cụm mờ - Thuật toán K-m CHƯƠNG 3: DỰ BÁO TÍN DỤNG ỨNG DỤNG CHUỖI THỜI GIAN MỜ SỬ DỤNG KỸ THUẬT PHÂN CỤM ... ` LƯU ĐỨC DŨNG TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TÍN DỤNG CHO NGÂN HÀNG ABBANK Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng