BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ĐỖ THỊ TÂM MỘT SỐ THUẬT TOÁN CỤM MỜ VÀ BÀI TOÁN PHÂN TÍCH DỮ LIỆU KHÁCH HÀNG NGÂN HÀNG LUẬN VĂN THẠC SỸ KHOA HỌC Chuyên ngành Quản trị Kinh doanh NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TSKH BÙI CÔNG CƯỜNG HÀ NI - 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hµng Mơc lơc Mơc lơc Mở đầu Chương - Phân cụm mờ 1.1 Phân cụm mờ 1.2 ThuËt to¸n ph©n cơm mê FCM (Fuzzy C -means) 1.2.1 ThuËt to¸n 1.2.2 Ưu điểm nhược điểm thuật toán FCM 1.3 ThuËt to¸n §éc lËp §êng kÝnh – D©n sè (PDI) 1.3.1 ThuËt to¸n 1.3.2 So s¸nh víi tht to¸n FCM 1.4 Phân cụm hiệp phương sa i mờ (Fuzzy covariance clustering) 1.5 Ph©n cơm mê c-Elliptotypes (Fuzzy c-Elliptotypes - FCE) 11 1.6 Ph©n cơm ®êng bao ( She ll clustering) 11 Ch¬ng - XÕp loại tín dụng khách hàng doanh nghiệp ngân hàng 13 2.1 XÕp lo¹i tÝn dơng 13 2.2 Mục đích xếp loại tín dụng 13 2.3 Các bước xếp loại tín dụng 14 2.3.1 Thu thËp th«ng tin 14 2.3.2 Phân loại doanh nghiệp 14 Chương - Kết thực nghiệm 26 3.1 ChuÈn bị liệu 26 3.2 Đọc liệu 27 3.3 Lùa chän chØ tiªu 28 3.4 Cài đặt thuật toán phân cụm 29 3.4.1 ThuËt toán phân cụm mờ FCM 29 3.4.2 Xác định cụm 30 3.5 Phân cụm ngành nghề 31 3.6 Ph©n cơm Quy m« 34 3.7 Ph©n cơm doanh nghiƯp 38 KÕt luËn 42 Tµi liƯu tham kh¶o 43 Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hƯ thèng tÝnh to¸n , 2008 – 2010 Mét số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Mở đầu Hoạt động ngân hàng kinh tế thị tr ường hoạt động kinh tế chứa đầy rủi ro Rủi ro hoạt động ngân hàng gây tai họa cho kinh tế bất cử rủi ro loại hình hoạt động kinh tế khác, tính chất lây lan cã thĨ lµm rung chun toµn bé hƯ thèn g kinh tế Hoạt động ngân hàng thương mại gồm nhiều nghiệp vụ, lại, loại h×nh kinh doanh tiỊn tƯ – tÝn dơng cđa mét trung gian tài dựa sở thu hút tiền khách hàng với trách nhiệm hoàn trả sử dụng số tiền vay thực nghiệp vụ toán Như vậy, ngân hàng thương mại không kinh doanh nguồn vốn tự có mà kinh doanh nguồn vốn huy động từ khách hàng Do đó, ngân hàng không thu hồi số nợ mà họ đà cho vay ngân hàng không ch ỉ vốn tự có mà có nguy không hoàn trả số tiền đà huy động khách hàng Vì vậy, cho vay tiền, ngân hàng phải nhớ vốn họ tiền gửi khách hàng, điều quan trọng họ phải cho vay nơi mà rủi ro k hông trả nợ thấp Để tránh rủi ro hoạt động cho vay, nhiều ngân hàng n ay đà sử dụng kỹ thuật xếp loại tín dụng hay chấm điểm tín dụng để xếp hạng tín nhiệm khách hàng xin vay vốn, nhằm xác định đối tượng khách hàng có t hể cho vay được, không cho vay được, l·i s t cho vay, vÊn ®Ị thÕ chÊp, Có nhiều cách để xếp loại tín dụng dự tính mức xác suất rủi ro tín dụng khoản tín dụng cấp mô hình xác suất tuyến tính, mô hình logit mô hình probit, hay phân loại người vay vào mức độ rủi ro có liên quan đến tiêu phản ánh đặc điểm tài kinh doanh họ mô hình phân biệt tuyến tính Hay cách phân cụm khách hàng thành nhóm tín dụng dựa vào tiêu tài phản ánh đặc điểm tài tình hình kinh doanh họ Trong luận văn này, em trình bày số thuật toán phân cụm mờ v toán phân tích liệu khách hàng ngân hàng Nội dung luận văn gồm có số thuật toán phân cụm mờ, thực tế xếp loại tín dụng số ngân hàng Việt Nam Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng kết cài đặt thuật toán phân cụm mờ xếp loại tín dụng cho doanh nghiệp niêm yết sàn giao dịch chứng khoán thành phố Hồ Chí Minh Em xin chân thành cảm ơn thầy Bùi Công Cường đà tậ n tình hướng dẫn em làm luận văn này! Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Chương - Phân cụm mờ 1.1 Phân cụm mờ Phân cụm phương pháp phân loại đối tượng liệu vào nhóm (cụm) khác cho đối tượng liệu nhóm (cụm) tương tự nhóm khác l không tương tự Trong phân cụm rõ, đối tượng liệu thuộc vào cụm, áp dụng phù hợp trường hợp cụm có mật độ cao rời Tuy nhiên, thực tế, cụm liệu lại chồng lên nhau, nghĩa số đối tượng liệu thuộc nhiều cụm khác Do đó, để giải trường hợp này, người ta đà áp dụng lý thuyết tập mờ vào phân cụm liệu Trong phân cụm mờ, cụm xem tập mờ tập liệu Do vậy, đối tượng liệu gắn với cụm đại lượng gọi độ thuộc có giá trị đoạn [0, 1], thể mức độ thuộc đ ối tượng vào cụm 1.2 Thuật toán phân cụm mờ FCM (Fuzzy C-means) Thuật toán FCM có nhiều tên trước có tên FCM Đó Fuzzy ISODATA Fuzzy k-Means Ruspini (1969) giới thiệu khái niệm phân hoạch mờ để mô tả cấu trúc cụm tập liệu đề xuất thuật toán để tính toán tối ưu phân hoạch mờ Dunn (1973) mở rộng phương pháp phân cụm đà phát triển thuật toán phân cụm mờ ý tưởng thuật toán xây d ựng phương pháp phân cụm mờ dựa tối thiểu hóa hàm mục tiêu Bezdek (1981) cải tiến tổng quát hóa hàm mục tiêu mờ cách đưa trọng số mũ để xây dựng thuật toán phân cụm mờ chứng minh độ hội tụ thuật toán cực tiểu cục Thuật toán FCM đà áp dụng thành công số toán phân cụm liệu nhận dạng mẫu (nhận ng vân tay, ảnh), xử lý ảnh (phân tách cụm ảnh màu, cụm màu ), y học (phân loại bệnh, p hân loại triệu chứng), Tuy nhiên, nhược điểm lớn nhấ t thuật toán FCM nhạy cảm với nhiễu phần tử ngoại lai Để khắc phục nhược điểm FCM, đà có nhiều phương pháp Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng đề xuất như: Phân cụm dựa xác suất (Keller, 1993), phân cụm nhiễu mờ (Dave, 1991), phân cụm dựa toán tử L p Norm (Kerten, 1999), thuật toán Insensitive Fuzzy C-means (FCM) thuật toán FCM cải tiến 1.2.1 Thuật toán Thuật toán FCM phát biểu sau: Xác định biến P, U ®Ó t èi c N J FCM P, U , X , c, m uik dik2 xk , pi thiÓu hãa m i 1 k 1 (1.1) c víi rµng bc: u i 1 ik 1 k 1 N , (1.2) với X , c, m tham số đầu vào đà biết Trong X tập đối tượng c số cụm m lµ sè mị mê hãa, nÕu m , thuật toán phân cụm mờ trở thành thuật toán phân cụm rõ Giá trị m lớn giải pháp mờ Tuy nhiên, nhiều kết nghiên cứu m tốt Giá trị m có lợi đơn giản hóa phương trình cập nhật (sẽ trình bày phía sau) tăng tốc độ máy tính uik độ thuộc vector đặc trưng xk với cụm biểu diễn tâm cụm pi U uik ma trận phân hoạch mờ ( c N ) thỏa mÃn ràng buộc (1.2) N tổng số vector đặc trưng d ik2 khoảng cách vector đặc trưng xk tâm cụm pi dik2 xk , pi xk pi A xk pi A xk pi T với A ma trận xác định dương Trong công thức khoảng cách Euclidean, A ma trận đơn vị Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Người ta đà chứng minh rằ ng, giá trị P*, U * làm cực tiểu hóa J FCM P , U phương trình (1.1) với ràng buộc (1.2) phải thỏa mÃn phương trình cËp nhËt sau: N p * i u k 1 N u k 1 uik* m ik xk (1.3) m ik dik2 j 1 d jk c m (1.4) Thuật toán FCM dÃy phép lặp lặp lại phương trình cập nhật Khi phép lặp hội tụ, thu ma trận phân cụm mờ tâm cụm Thuật toán: Bước 1: Cố định c , c N Chọn công thức khoảng cách dik2 Cố định m , m Khởi tạo ma trận độ thuộc mờ, U Bước 2: Tìm c tâm cụm mờ (ma trận P ) theo phương trình (1.3) Bước 3: Cập nhật độ thuộc U theo phương trình (1.4) Bước 4: So sánh thay đổi giá trị ®é thc b»ng mét chn thÝch hỵp NÕu sù thay đổi nhỏ dừng Ngược lại, quay bước 1.2.2 Ưu điểm nhược điểm thuật toán FCM Ưu điểm: Thuật toán không phức tạp để lập trình Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Thuật toán sử dụng hàm mục tiêu trực quan dễ hiểu Với tập liệu tạo thành cụm tách rời có dạng siêu cầu FCM tìm cụm xác FCM dựa sở mờ, nên mạnh: hội tụ đến giải pháp, cung cấp giá trị độ thuộc thích hợp Ràng buộc phương trình (1.2) điều kiện cần thiết để chứng minh tính hội tụ tới giá trị cực tiểu địa phương thuật toán FCM Nhược điểm: FCM yêu cầu số cụm tiên nghiệm (priori) FCM tìm cụm có hình dạng (các cụm siêu cầu sử dụng metric Euclidean); hình dáng cụm khác không trộn vào Hàm mục tiêu FCM tiêu chuẩn phân cụm tốt cụm gần với cụm khác không kích thước số phần tử Độ xác FCM nhạy cảm với điểm nhiễu phần tử ngoại lai, nghĩa tâm cụm cã thĨ n»m xa so víi t©m thùc cđa cơm Do đó, cụm liệu khám phá có thĨ rÊt lƯch so víi c¸c cơm thùc tÕ Việc khử nhiễu phần tử ngoại lai vấn đề cần giải 1.3 Thuật toán Độc lập Đường kính Dân số (PDI) 1.3.1 Thuật toán Xác định biến U , P , để tối thiểu hóa hàm mụ c tiêu: N J PDI P , U , , X , c, m, r r uik i 1 i k 1 c m d ik2 xk , pi (1.5) với ràng buộc: c u 1 (1.6) 1 (1.7) i 1 ik c i i Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính to¸n , 2008 – 2010 Mét sè thuËt to¸n phân cụm mờ toán phân tích liệu khách hàng ngân hàng với i phần tử chuẩn hóa cụm i Bộ giá trị P* , U * , * lµm tèi thiĨu hãa hàm mục tiêu (1.5) thỏa mÃn ràng buộc (1.6) (1.7) thỏa mÃn phương trình cập nhật sau: ir m 1 2 d * uik ik c ir m 1 2 i 1 d ik (1.8) N p * i u k 1 N m ik u k 1 xk (1.9) m ik N m r 1 u ik dik * i k 1 c N m r 1 uik dik i 1 k (1.10) r thường chọn r 1.3.2 So s¸nh víi tht to¸n FCM Chóng ta hÃy xem xét hàm mục tiêu (OF) FCM: c Tèi thiÓu hãa N J FCM P, U , X , c, m uik dik2 xk , pi m i 1 k 1 c víi rµng bc (constraint) u i 1 ik k N Đây hàm dựa khoảng cách, tích lũy khoảng cách có trọng số nguyên mẫu điểm liƯu Cơm lín (theo nghÜa ®êng kÝnh) sÏ ®ãng gãp vào OF nhiều cụm nhỏ khoảng cách lớn Do vậy, khoảng cách tương đối cụm đóng vai trò v iệc xác định đóng góp cụm tới OF Nói chung, cụm lớn đóng góp nhiều cụm nhỏ Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng uik* dik2 j 1 d jk c k 1, , N , i 1, , c m 1 Những điểm nằm gần nguyên mẫu (prototype) có độ thuộc với tất nguyên mẫu khác Tuy nhiên, điểm nằm hai nguyên mẫu có độ thuộc xấp xỉ 0.5 Trong phương pháp này, chúng đóng góp cho OF hai nguyên mẫu Do đó, ta kết luận sơ miễn tách biệt cụm cao, FCM vấn đề phân cụm Mỗi số cụm mở rộng vào khu vực hai tâm cụm, FCM sinh kết xấu.Tỷ lệ dân số cụm giữ vai trò cấu hình đường kính làm cho lỗi nghiêm trọng Các cụm với dân số lớn đường kính lớn chiếm ưu giải pháp FCM Do FCM khả phân cụm cách xác tập liệu chứa cụm có dân số cao nhiều cụm có đường kính lớn (trong trường hợp hai cụm) ý tưởng thuật toán PDI chuẩn hóa đóng góp cụm vào hàm mục tiêu FCM cách, hàm mục tiêu PDI, ta chia đóng góp (FCM) cụm cho mét sè biĨu diƠn møc ®é ®ãng gãp KÕt phép chia cho đóng góp (PDI) cá c cụm 1.4 Phân cụm hiệp phương sai mê (Fuzzy covariance clustering) Gustafson vµ Kessel giíi thiƯu thay đổi hàm FCM cho phương trình 1.1 phương trình 1.11 Điều cho phép tìm cụm có sạng siêu elipxoit (hyperellipsoid ) thay tìm thấy cụm siêu cÇu (hypershere) nh FCM N c J P, U , ; X , c, m u ik x k p i k 1 i 1 m c u ik A i i 1 m x p A x p T k i i k i (1.11) Trong Ai ma trận đối xứng xác định dương, ràng buộc phương trình (1.2) thêm ràng buộc: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.4 Cài đặt thuật toán phân cụm Thuật toán phân cụm cài đặt Thuật toán phân cụm mờ FCM trình bày mục 1.2 3.4.1 Thuật toán phân cụm mờ FCM Bước 1: Cố ®Þnh sè cơm c, ≤ c < N o Khi phân cụm ngành nghề, số cụm c = ứng với bốn ngành nghề Công nghiệp, Nông lâm ngư nghiệp, Thương mại v dịch vụ, Xây dựng o Khi phân cụm quy mô, số cụm c = ứng với ba loại quy mô Nhỏ, Trung bình, Lớn o Khi phân cụm doanh nghiệp, số cơm ngêi dïng nhËp vµo tõ form F03 - Phân cụm chương trình, theo loại xếp hạng tín dụng mà người dùng muốn Công thức khoảng cách sử dụng khoảng cách Euclidean Hệ số mờ hóa chọn m = Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 29 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Khởi tạo ma trận độ thuộc mờ: Từ công thøc tÝnh ®é thc, ta thÊy ®é thc phơ thc vào khoảng cách dik2 vector k cụm i Do ta xác định tâm cụm ban đầu, sau ®ã tÝnh ma trËn ®é thuéc theo c«ng thøc (1.4) Việc xác định tâm cụm thực tiêu Đầu tiên, ta xếp giá trị theo chiều tăng dần Ta giả sử cụm ban đầu có số đối tượng Do tâm cụm i vị trí (i * (Tỉng sè c«ng ty / (2 * Sè cơm))) víi < i < Sè cơm Bíc 2: Tìm c tâm cụm mờ (ma trận P) theo phương trình (1.3) Bước 3: Cập nhật độ thuộc U theo phương trình (1.4) Bước 4: Chương trình có hai điều kiện dừng So sánh thay đổi giá trị độ thuộc chuẩn thích hợp o TÝnh hiƯu hai ma trËn ®é thc ta có ma trận độ thuộc sai số o Xác định phần tử có trị tuyệt đối lớn ma trận sai số o Nếu giá trị lớn nhỏ (cụ thể nhỏ Độ xác nhập vào form F03 - ) dừng thuật toán Nếu số vòng lặp lớn Số vòng lặp lớn nhập vào form F03 - 3.4.2 Xác định cụm Sau tính ma trận độ thuộc, ta xác định xem doanh nghiệp thuộc cụm (cụm ngành nghề, cụm quy mô, cụm hạng tín dụng) c ách: Các doanh nghiệp thuộc vào cụm có độ thuộc lớn Ngưỡng độ thuộc người dùng nhập vào form chương trình Các doanh nghiệp độ thuộc tới cụm lớn Ngưỡng độ thuộc không thuộc vào cụm Các cụm thể form với màu khác Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 30 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.5 Phân cụm ngành nghề Việc lựa chọn tiêu áp dụng vào phân cụm ngành nghề người dùng tự lựa chọn Trong chương trình, ta sử dụng c ác tiêu sau để phân doanh nghiệp vào ngành nghề/lĩnh vực kinh doanh: Tỷ trọng tài sản cố định chiếm tổng số tài sản : Tỷ lệ phản ánh đặc điểm khác ngành nghề kinh doanh, chẳng hạn, ngành công nghiệp thăm dò khai thác dầ u khí: 90%, ngành công nghiệp nặng: 70%, ngành thương mại, dịch vụ: 20%, Hệ số khả toán nhanh: Tính hợp lý hệ số phụ thuộc vào ngành nghề kinh doanh, ngành nghề có tài sản lưu động chiếm tỷ trọng cao (chẳng hạn Thương mại) tổng tài sản hệ số cao ngược lại Tỷ trọng hàng tồn kho chiếm tổng số tài sản: doanh nghiệp kinh doanh thương mại, tỷ trọng thường lớn đối tượng kinh doanh doanh nghiệp hàng hóa; ngược lại doanh nghiệp kinh doanh dịch vụ (khách sạn, giải trí, ), tỷ trọng hàng tồn kho thường thấp Giá vốn hàng bán Tiền khoản tương đương tiền Nguồn vốn chủ sở hữu Vòng quay hàng tồn kho Kỳ thu tiền bình quân Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 31 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Như đà trình bày phần trên, doanh nghiệp trước tiên phân vào ngành nghề: Công nghiệp , Nông lâm ngư nghiệp, Thương mại dịch vụ, Xây dựng Do chương trình xác định số cụm = Với thuật toán áp dụng thuật toán FCM (Fuzzy C-means), số vòng lặp tối đa 100 vòng lặp, độ xác 0,00001, ngưỡng độ thuộc 0.5 kết phâ n cụm sau: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính to¸n , 2008 – 2010 32 Mét sè thuËt to¸n phân cụm mờ toán phân tích liệu khách hàng ngân hàng Ngoài việc phân biệt bốn cụm ngành nghề thành bốn màu khác nhau, chương trình thể hiển số vòng lặp thực hiện, giá trị sai sè lín nhÊt cđa hai ma trËn ®é thc cũ vòng lặp này, giá trị sai số đạt cụm nào, ứng với doanh nghiệp trạng thái cuối form Trong trường hợp cụ thể này, Số vòng lặp thực 47, giá trị lớn ma trận hiệu độ thuộc 0.00000839, cụm 2, doanh nghiệp có mà DC4, tên doanh nghiệp Công ty Cỉ PhÇn DIC sè Ngêi dïng cã thĨ xem ma trận độ thuộc thời điểm dừng thuật toán click vào nút Hiển thị độ thuộc Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hƯ thèng tÝnh to¸n , 2008 – 2010 33 Mét số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.6 Phân cụm Quy mô Sau doanh nghiệp phân vào ngµnh nghỊ/lÜnh vùc kinh doanh Ta cã thĨ lùa chọn phân cụm Quy mô ngành n ghề, lựa chọn thực phân cụm quy mô nhiều ngành nghề nút Chọn ngành nghề Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 34 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Các tiêu lựa chọn để phân cụm quy mô là: Nguån vèn kinh doanh Doanh thu thuÇn Nộp ngân sách Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 35 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Việc thực phân cụm quy mô cụm ngành nghề không liên quan nhau, chúng thực song song Như đà trình bày trên, ta có quy mô là: Quy mô Lớn, Quy mô Trung bình, Quy mô Nhỏ Do số cụm đà xác định Với số vòng lặp lớn 100, Độ xác 0.00001, ngưỡng độ thuộc 0.5 thuật toán FCM cho kết phân cụm sau: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính to¸n , 2008 – 2010 36 Mét sè thuËt to¸n phân cụm mờ toán phân tích liệu khách hàng ngân hàng Các giá trị trạng thái cuối giá trị cho phân cụm quy mô, mà giá trị phân cụm ngành nghề Ma trận độ thuộc: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hƯ thèng tÝnh to¸n , 2008 – 2010 37 Mét số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.7 Phân cụm doanh nghiệp Sau phân vào ba l oại quy mô, doanh nghiệp xếp hạng tín dụng Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 38 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Các tiêu chọn để thực gồm có Hệ số toán nhanh, hệ số toán ngắn hạn, vòng quay hàng tồn kho, mục 2.3.2.3 Chương trình thực phân cụm cụm quy mô, thực song song nhiều quy mô Lựa chọn tiêu để phân cụm : Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 39 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Víi Sè cơm ngêi sư dơng nhËp b»ng 5, Ngưỡng độ thuộc 0.4 , Số vòng lặp lớn 100, độ xác 0.00001 thuật toán FCM cho kết phân cụm: Ma trận độ thuộc: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 40 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 41 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Kết luận Trong luận văn tác giả đà trình bày số thuật toán phân cụm mờ thuật toán Fuzzy C-means (FCM), thuật toán độc lập đường kính dân số (PDI) cải tiến thuật toán FCM Đồng thời giới thiệu quy trình xếp loại t ín dụng số ngân hàng Việt Nam ngân hàng Công thương, ngân hàng Ngoại Thương Dựa vào hai nội dung trên, tác giả thực cài đặt thuật toán phân cụm mờ FCM để xếp loại tín dụng doanh nghiệp theo bước, nội dung trình bày phần nghiệp vụ xếp loại tín dụng ngân hàng, đà đạt số kết Trong thời gian tiếp theo, tác giả tiếp tục cài đặt thuật toán phân cụm mờ khác ví dụ thuật toán PDI, tiếp tục tìm hiểu nghiệp vụ xếp loại tín dụng để thu kết tốt Em xin chân thành cảm ơn PGS.TSKH Bùi Công Cường đà tận tình hướng dẫn em làm luận văn này! Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hƯ thèng tÝnh to¸n , 2008 – 2010 42 Mét số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Tài liệu tham khảo Tiếng Việt Bùi Công Cường (2010), giảng Một số thuật toán phân cụm , chương Mấy vấn đề Hệ chuyên gia, Hà Nội Nguyễn Thành Huyên (2008), Hoàn thiện hệ thống xếp hạng tín dụng Vietcombank, Luận văn Thạc sĩ Kinh tế, trường Đại học Kinh tế Thành phố Hồ Chí Minh, Hồ Chí Minh Ngân hàng Nhà Nước Việt Nam (2002), Số 57/2001/QĐ -NHNN, Về việc triển khai thí điểm đề án phâ n tích, xếp loại tín dụng doanh nghiệp ., Hoàn thiện công tác chấm điểm tín dụng khách hàng doanh nghiệp Sở giao dịch I Ngân hàng Công thương Việt Nam , Luận văn Thạc sĩ tín dụng Tiếng Anh Ahmed Ismail Shihab (2000), Fuzzy Clustering alogrithms and their application to medical image analysis , Department of Computing, Imperial College of Science, Technology and Medicine University of London, London Website http://www.hsc.com.vn http://www.saga.vn http://www.scribd.com Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tÝnh to¸n , 2008 – 2010 43 ... bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Chương - Phân cụm mờ 1.1 Phân cụm mờ Phân cụm phương pháp phân. .. 2010 41 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Kết luận Trong luận văn tác giả đà trình bày số thuật toán phân cụm mờ thuật toán Fuzzy C-means (FCM), thuật toán độc... này, em trình bày số thuật toán phân cụm mờ v toán phân tích liệu khách hàng ngân hàng Nội dung luận văn gồm có số thuật toán phân cụm mờ, thực tế xếp loại tín dụng số ngân hàng Việt Nam Đỗ Thị