Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 44 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
44
Dung lượng
1,55 MB
Nội dung
B GIO DC V O TO TRNG I HC BCH KHOA H NI TH TM MT S THUT TON CM M V BI TON PHN TCH D LIU KHCH HNG NGN HNG LUN VN THC S KHOA HC Chuyờn ngnh Qun tr Kinh doanh NGI HNG DN KHOA HC: PGS.TSKH BI CễNG CNG H NI - 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Mục lục Mục lục Mở đầu Chương - Phân cụm mờ 1.1 Phân cụm mờ 1.2 Thuật toán phân cụm mờ FCM (Fuzzy C -means) 1.2.1 Thuật toán 1.2.2 Ưu điểm nhược điểm thuật toán FCM 1.3 Thuật toán Độc lập Đường kính Dân số (PDI) 1.3.1 Thuật toán 1.3.2 So sánh với thuật toán FCM 1.4 Phân cụm hiệp phương sa i mờ (Fuzzy covariance clustering) 1.5 Phân cụm mờ c-Elliptotypes (Fuzzy c-Elliptotypes - FCE) 11 1.6 Phân cụm đường bao ( She ll clustering) 11 Chương - Xếp loại tín dụng khách hàng doanh nghiệp ngân hàng 13 2.1 Xếp loại tín dụng 13 2.2 Mục đích xếp loại tín dụng 13 2.3 Các bước xếp loại tín dụng 14 2.3.1 Thu thập thông tin 14 2.3.2 Phân loại doanh nghiệp 14 Chương - Kết thực nghiệm 26 3.1 Chuẩn bị liệu 26 3.2 Đọc liệu 27 3.3 Lựa chọn tiêu 28 3.4 Cài đặt thuật toán phân cụm 29 3.4.1 Thuật toán phân cụm mờ FCM 29 3.4.2 Xác định cụm 30 3.5 Phân cụm ngành nghề 31 3.6 Phân cụm Quy mô 34 3.7 Phân cụm doanh nghiệp 38 Kết luận 42 Tài liệu tham khảo 43 Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Mở đầu Hoạt động ngân hàng kinh tế thị tr ường hoạt động kinh tế chứa đầy rủi ro Rủi ro hoạt động ngân hàng gây tai họa cho kinh tế bất cử rủi ro loại hình hoạt động kinh tế khác, tính chất lây lan làm rung chuyển toàn hệ thốn g kinh tế Hoạt động ngân hàng thương mại gồm nhiều nghiệp vụ, lại, loại hình kinh doanh tiền tệ tín dụng trung gian tài dựa sở thu hút tiền khách hàng với trách nhiệm hoàn trả sử dụng số tiền vay thực nghiệp vụ toán Như vậy, ngân hàng thương mại không kinh doanh nguồn vốn tự có mà kinh doanh nguồn vốn huy động từ khách hàng Do đó, ngân hàng không thu hồi số nợ mà họ cho vay ngân hàng không ch ỉ vốn tự có mà có nguy không hoàn trả số tiền huy động khách hàng Vì vậy, cho vay tiền, ngân hàng phải nhớ vốn họ tiền gửi khách hàng, điều quan trọng họ phải cho vay nơi mà rủi ro k hông trả nợ thấp Để tránh rủi ro hoạt động cho vay, nhiều ngân hàng n ay sử dụng kỹ thuật xếp loại tín dụng hay chấm điểm tín dụng để xếp hạng tín nhiệm khách hàng xin vay vốn, nhằm xác định đối tượng khách hàng có t hể cho vay được, không cho vay được, lãi suấ t cho vay, vấn đề chấp, Có nhiều cách để xếp loại tín dụng dự tính mức xác suất rủi ro tín dụng khoản tín dụng cấp mô hình xác suất tuyến tính, mô hình logit mô hình probit, hay phân loại người vay vào mức độ rủi ro có liên quan đến tiêu phản ánh đặc điểm tài kinh doanh họ mô hình phân biệt tuyến tính Hay cách phân cụm khách hàng thành nhóm tín dụng dựa vào tiêu tài phản ánh đặc điểm tài tình hình kinh doanh họ Trong luận văn này, em trình bày số thuật toán phân cụm mờ v toán phân tích liệu khách hàng ngân hàng Nội dung luận văn gồm có số thuật toán phân cụm mờ, thực tế xếp loại tín dụng số ngân hàng Việt Nam Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng kết cài đặt thuật toán phân cụm mờ xếp loại tín dụng cho doanh nghiệp niêm yết sàn giao dịch chứng khoán thành phố Hồ Chí Minh Em xin chân thành cảm ơn thầy Bùi Công Cường tậ n tình hướng dẫn em làm luận văn này! Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Chương - Phân cụm mờ 1.1 Phân cụm mờ Phân cụm phương pháp phân loại đối tượng liệu vào nhóm (cụm) khác cho đối tượng liệu nhóm (cụm) tương tự nhóm khác l không tương tự Trong phân cụm rõ, đối tượng liệu thuộc vào cụm, áp dụng phù hợp trường hợp cụm có mật độ cao rời Tuy nhiên, thực tế, cụm liệu lại chồng lên nhau, nghĩa số đối tượng liệu thuộc nhiều cụm khác Do đó, để giải trường hợp này, người ta áp dụng lý thuyết tập mờ vào phân cụm liệu Trong phân cụm mờ, cụm xem tập mờ tập liệu Do vậy, đối tượng liệu gắn với cụm đại lượng gọi độ thuộc có giá trị đoạn [0, 1], thể mức độ thuộc đ ối tượng vào cụm 1.2 Thuật toán phân cụm mờ FCM (Fuzzy C-means) Thuật toán FCM có nhiều tên trước có tên FCM Đó Fuzzy ISODATA Fuzzy k-Means Ruspini (1969) giới thiệu khái niệm phân hoạch mờ để mô tả cấu trúc cụm tập liệu đề xuất thuật toán để tính toán tối ưu phân hoạch mờ Dunn (1973) mở rộng phương pháp phân cụm phát triển thuật toán phân cụm mờ ý tưởng thuật toán xây d ựng phương pháp phân cụm mờ dựa tối thiểu hóa hàm mục tiêu Bezdek (1981) cải tiến tổng quát hóa hàm mục tiêu mờ cách đưa trọng số mũ để xây dựng thuật toán phân cụm mờ chứng minh độ hội tụ thuật toán cực tiểu cục Thuật toán FCM áp dụng thành công số toán phân cụm liệu nhận dạng mẫu (nhận ng vân tay, ảnh), xử lý ảnh (phân tách cụm ảnh màu, cụm màu ), y học (phân loại bệnh, p hân loại triệu chứng), Tuy nhiên, nhược điểm lớn nhấ t thuật toán FCM nhạy cảm với nhiễu phần tử ngoại lai Để khắc phục nhược điểm FCM, có nhiều phương pháp Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng đề xuất như: Phân cụm dựa xác suất (Keller, 1993), phân cụm nhiễu mờ (Dave, 1991), phân cụm dựa toán tử L p Norm (Kerten, 1999), thuật toán Insensitive Fuzzy C-means (FCM) thuật toán FCM cải tiến 1.2.1 Thuật toán Thuật toán FCM phát biểu sau: Xác định biến P, U để t ối c N J FCM P, U , X , c, m uik dik2 xk , pi thiểu hóa m i k (1.1) c với ràng buộc: u i ik k N , (1.2) với X , c, m tham số đầu vào biết Trong X tập đối tượng c số cụm m số mũ mờ hóa, m , thuật toán phân cụm mờ trở thành thuật toán phân cụm rõ Giá trị m lớn giải pháp mờ Tuy nhiên, nhiều kết nghiên cứu m tốt Giá trị m có lợi đơn giản hóa phương trình cập nhật (sẽ trình bày phía sau) tăng tốc độ máy tính uik độ thuộc vector đặc trưng xk với cụm biểu diễn tâm cụm pi U uik ma trận phân hoạch mờ ( c N ) thỏa mãn ràng buộc (1.2) N tổng số vector đặc trưng d ik2 khoảng cách vector đặc trưng xk tâm cụm pi dik2 xk , pi xk pi A xk pi A xk pi T với A ma trận xác định dương Trong công thức khoảng cách Euclidean, A ma trận đơn vị Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Người ta chứng minh rằ ng, giá trị P*, U * làm cực tiểu hóa J FCM P , U phương trình (1.1) với ràng buộc (1.2) phải thỏa mãn phương trình cập nhật sau: N p * i u k N u k uik* m ik xk (1.3) m ik dik2 j d jk c m (1.4) Thuật toán FCM dãy phép lặp lặp lại phương trình cập nhật Khi phép lặp hội tụ, thu ma trận phân cụm mờ tâm cụm Thuật toán: Bước 1: Cố định c , c N Chọn công thức khoảng cách dik2 Cố định m , m Khởi tạo ma trận độ thuộc mờ, U Bước 2: Tìm c tâm cụm mờ (ma trận P ) theo phương trình (1.3) Bước 3: Cập nhật độ thuộc U theo phương trình (1.4) Bước 4: So sánh thay đổi giá trị độ thuộc chuẩn thích hợp Nếu thay đổi nhỏ dừng Ngược lại, quay bước 1.2.2 Ưu điểm nhược điểm thuật toán FCM Ưu điểm: Thuật toán không phức tạp để lập trình Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Thuật toán sử dụng hàm mục tiêu trực quan dễ hiểu Với tập liệu tạo thành cụm tách rời có dạng siêu cầu FCM tìm cụm xác FCM dựa sở mờ, nên mạnh: hội tụ đến giải pháp, cung cấp giá trị độ thuộc thích hợp Ràng buộc phương trình (1.2) điều kiện cần thiết để chứng minh tính hội tụ tới giá trị cực tiểu địa phương thuật toán FCM Nhược điểm: FCM yêu cầu số cụm tiên nghiệm (priori) FCM tìm cụm có hình dạng (các cụm siêu cầu sử dụng metric Euclidean); hình dáng cụm khác không trộn vào Hàm mục tiêu FCM tiêu chuẩn phân cụm tốt cụm gần với cụm khác không kích thước số phần tử Độ xác FCM nhạy cảm với điểm nhiễu phần tử ngoại lai, nghĩa tâm cụm nằm xa so với tâm thực cụm Do đó, cụm liệu khám phá lệch so với cụm thực tế Việc khử nhiễu phần tử ngoại lai vấn đề cần giải 1.3 Thuật toán Độc lập Đường kính Dân số (PDI) 1.3.1 Thuật toán Xác định biến U , P , để tối thiểu hóa hàm mụ c tiêu: N J PDI P , U , , X , c, m, r r uik i i k c m d ik2 xk , pi (1.5) với ràng buộc: c u (1.6) (1.7) i ik c i i Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng với i phần tử chuẩn hóa cụm i Bộ giá trị P* , U * , * làm tối thiểu hóa hàm mục tiêu (1.5) thỏa mãn ràng buộc (1.6) (1.7) thỏa mãn phương trình cập nhật sau: ir m d * uik ik c ir m i d ik (1.8) N p * i u k N m ik u k xk (1.9) m ik N m r u ik dik * i k 1 c N m r uik dik i k (1.10) r thường chọn r 1.3.2 So sánh với thuật toán FCM Chúng ta xem xét hàm mục tiêu (OF) FCM: c Tối thiểu hóa N J FCM P, U , X , c, m uik dik2 xk , pi m i k c với ràng buộc (constraint) u i ik k N Đây hàm dựa khoảng cách, tích lũy khoảng cách có trọng số nguyên mẫu điểm liệu Cụm lớn (theo nghĩa đường kính) đóng góp vào OF nhiều cụm nhỏ khoảng cách lớn Do vậy, khoảng cách tương đối cụm đóng vai trò v iệc xác định đóng góp cụm tới OF Nói chung, cụm lớn đóng góp nhiều cụm nhỏ Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng uik* dik2 j d jk c k 1, , N , i 1, , c m Những điểm nằm gần nguyên mẫu (prototype) có độ thuộc với tất nguyên mẫu khác Tuy nhiên, điểm nằm hai nguyên mẫu có độ thuộc xấp xỉ 0.5 Trong phương pháp này, chúng đóng góp cho OF hai nguyên mẫu Do đó, ta kết luận sơ miễn tách biệt cụm cao, FCM vấn đề phân cụm Mỗi số cụm mở rộng vào khu vực hai tâm cụm, FCM sinh kết xấu.Tỷ lệ dân số cụm giữ vai trò cấu hình đường kính làm cho lỗi nghiêm trọng Các cụm với dân số lớn đường kính lớn chiếm ưu giải pháp FCM Do FCM khả phân cụm cách xác tập liệu chứa cụm có dân số cao nhiều cụm có đường kính lớn (trong trường hợp hai cụm) ý tưởng thuật toán PDI chuẩn hóa đóng góp cụm vào hàm mục tiêu FCM cách, hàm mục tiêu PDI, ta chia đóng góp (FCM) cụm cho số biểu diễn mức độ đóng góp Kết phép chia cho đóng góp (PDI) cá c cụm 1.4 Phân cụm hiệp phương sai mờ (Fuzzy covariance clustering) Gustafson Kessel giới thiệu thay đổi hàm FCM cho phương trình 1.1 phương trình 1.11 Điều cho phép tìm cụm có sạng siêu elipxoit (hyperellipsoid ) thay tìm thấy cụm siêu cầu (hypershere) FCM N c J P, U , ; X , c, m u ik x k p i k i m c u ik A i i m x p A x p T k i i k i (1.11) Trong Ai ma trận đối xứng xác định dương, ràng buộc phương trình (1.2) thêm ràng buộc: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.4 Cài đặt thuật toán phân cụm Thuật toán phân cụm cài đặt Thuật toán phân cụm mờ FCM trình bày mục 1.2 3.4.1 Thuật toán phân cụm mờ FCM Bước 1: Cố định số cụm c, c < N o Khi phân cụm ngành nghề, số cụm c = ứng với bốn ngành nghề Công nghiệp, Nông lâm ngư nghiệp, Thương mại v dịch vụ, Xây dựng o Khi phân cụm quy mô, số cụm c = ứng với ba loại quy mô Nhỏ, Trung bình, Lớn o Khi phân cụm doanh nghiệp, số cụm người dùng nhập vào từ form F03 - Phân cụm chương trình, theo loại xếp hạng tín dụng mà người dùng muốn Công thức khoảng cách sử dụng khoảng cách Euclidean Hệ số mờ hóa chọn m = Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 29 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Khởi tạo ma trận độ thuộc mờ: Từ công thức tính độ thuộc, ta thấy độ thuộc phụ thuộc vào khoảng cách dik2 vector k cụm i Do ta xác định tâm cụm ban đầu, sau tính ma trận độ thuộc theo công thức (1.4) Việc xác định tâm cụm thực tiêu Đầu tiên, ta xếp giá trị theo chiều tăng dần Ta giả sử cụm ban đầu có số đối tượng Do tâm cụm i vị trí (i * (Tổng số công ty / (2 * Số cụm))) với < i < Số cụm Bước 2: Tìm c tâm cụm mờ (ma trận P) theo phương trình (1.3) Bước 3: Cập nhật độ thuộc U theo phương trình (1.4) Bước 4: Chương trình có hai điều kiện dừng So sánh thay đổi giá trị độ thuộc chuẩn thích hợp o Tính hiệu hai ma trận độ thuộc ta có ma trận độ thuộc sai số o Xác định phần tử có trị tuyệt đối lớn ma trận sai số o Nếu giá trị lớn nhỏ (cụ thể nhỏ Độ xác nhập vào form F03 - ) dừng thuật toán Nếu số vòng lặp lớn Số vòng lặp lớn nhập vào form F03 - 3.4.2 Xác định cụm Sau tính ma trận độ thuộc, ta xác định xem doanh nghiệp thuộc cụm (cụm ngành nghề, cụm quy mô, cụm hạng tín dụng) c ách: Các doanh nghiệp thuộc vào cụm có độ thuộc lớn Ngưỡng độ thuộc người dùng nhập vào form chương trình Các doanh nghiệp độ thuộc tới cụm lớn Ngưỡng độ thuộc không thuộc vào cụm Các cụm thể form với màu khác Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 30 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.5 Phân cụm ngành nghề Việc lựa chọn tiêu áp dụng vào phân cụm ngành nghề người dùng tự lựa chọn Trong chương trình, ta sử dụng c ác tiêu sau để phân doanh nghiệp vào ngành nghề/lĩnh vực kinh doanh: Tỷ trọng tài sản cố định chiếm tổng số tài sản : Tỷ lệ phản ánh đặc điểm khác ngành nghề kinh doanh, chẳng hạn, ngành công nghiệp thăm dò khai thác dầ u khí: 90%, ngành công nghiệp nặng: 70%, ngành thương mại, dịch vụ: 20%, Hệ số khả toán nhanh: Tính hợp lý hệ số phụ thuộc vào ngành nghề kinh doanh, ngành nghề có tài sản lưu động chiếm tỷ trọng cao (chẳng hạn Thương mại) tổng tài sản hệ số cao ngược lại Tỷ trọng hàng tồn kho chiếm tổng số tài sản: doanh nghiệp kinh doanh thương mại, tỷ trọng thường lớn đối tượng kinh doanh doanh nghiệp hàng hóa; ngược lại doanh nghiệp kinh doanh dịch vụ (khách sạn, giải trí, ), tỷ trọng hàng tồn kho thường thấp Giá vốn hàng bán Tiền khoản tương đương tiền Nguồn vốn chủ sở hữu Vòng quay hàng tồn kho Kỳ thu tiền bình quân Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 31 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Như trình bày phần trên, doanh nghiệp trước tiên phân vào ngành nghề: Công nghiệp , Nông lâm ngư nghiệp, Thương mại dịch vụ, Xây dựng Do chương trình xác định số cụm = Với thuật toán áp dụng thuật toán FCM (Fuzzy C-means), số vòng lặp tối đa 100 vòng lặp, độ xác 0,00001, ngưỡng độ thuộc 0.5 kết phâ n cụm sau: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 32 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Ngoài việc phân biệt bốn cụm ngành nghề thành bốn màu khác nhau, chương trình thể hiển số vòng lặp thực hiện, giá trị sai số lớn hai ma trận độ thuộc cũ vòng lặp này, giá trị sai số đạt cụm nào, ứng với doanh nghiệp trạng thái cuối form Trong trường hợp cụ thể này, Số vòng lặp thực 47, giá trị lớn ma trận hiệu độ thuộc 0.00000839, cụm 2, doanh nghiệp có mã DC4, tên doanh nghiệp Công ty Cổ Phần DIC số Người dùng xem ma trận độ thuộc thời điểm dừng thuật toán click vào nút Hiển thị độ thuộc Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 33 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.6 Phân cụm Quy mô Sau doanh nghiệp phân vào bốn ngành nghề/lĩnh vực kinh doanh Ta lựa chọn phân cụm Quy mô ngành n ghề, lựa chọn thực phân cụm quy mô nhiều ngành nghề nút Chọn ngành nghề Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 34 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Các tiêu lựa chọn để phân cụm quy mô là: Nguồn vốn kinh doanh Doanh thu Nộp ngân sách Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 35 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Việc thực phân cụm quy mô cụm ngành nghề không liên quan nhau, chúng thực song song Như trình bày trên, ta có quy mô là: Quy mô Lớn, Quy mô Trung bình, Quy mô Nhỏ Do số cụm xác định Với số vòng lặp lớn 100, Độ xác 0.00001, ngưỡng độ thuộc 0.5 thuật toán FCM cho kết phân cụm sau: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 36 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Các giá trị trạng thái cuối giá trị cho phân cụm quy mô, mà giá trị phân cụm ngành nghề Ma trận độ thuộc: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 37 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.7 Phân cụm doanh nghiệp Sau phân vào ba l oại quy mô, doanh nghiệp xếp hạng tín dụng Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 38 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Các tiêu chọn để thực gồm có Hệ số toán nhanh, hệ số toán ngắn hạn, vòng quay hàng tồn kho, mục 2.3.2.3 Chương trình thực phân cụm cụm quy mô, thực song song nhiều quy mô Lựa chọn tiêu để phân cụm : Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 39 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Với Số cụm người sử dụng nhập 5, Ngưỡng độ thuộc 0.4 , Số vòng lặp lớn 100, độ xác 0.00001 thuật toán FCM cho kết phân cụm: Ma trận độ thuộc: Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 40 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 41 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Kết luận Trong luận văn tác giả trình bày số thuật toán phân cụm mờ thuật toán Fuzzy C-means (FCM), thuật toán độc lập đường kính dân số (PDI) cải tiến thuật toán FCM Đồng thời giới thiệu quy trình xếp loại t ín dụng số ngân hàng Việt Nam ngân hàng Công thương, ngân hàng Ngoại Thương Dựa vào hai nội dung trên, tác giả thực cài đặt thuật toán phân cụm mờ FCM để xếp loại tín dụng doanh nghiệp theo bước, nội dung trình bày phần nghiệp vụ xếp loại tín dụng ngân hàng, đạt số kết Trong thời gian tiếp theo, tác giả tiếp tục cài đặt thuật toán phân cụm mờ khác ví dụ thuật toán PDI, tiếp tục tìm hiểu nghiệp vụ xếp loại tín dụng để thu kết tốt Em xin chân thành cảm ơn PGS.TSKH Bùi Công Cường tận tình hướng dẫn em làm luận văn này! Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 42 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Tài liệu tham khảo Tiếng Việt Bùi Công Cường (2010), giảng Một số thuật toán phân cụm , chương Mấy vấn đề Hệ chuyên gia, Hà Nội Nguyễn Thành Huyên (2008), Hoàn thiện hệ thống xếp hạng tín dụng Vietcombank, Luận văn Thạc sĩ Kinh tế, trường Đại học Kinh tế Thành phố Hồ Chí Minh, Hồ Chí Minh Ngân hàng Nhà Nước Việt Nam (2002), Số 57/2001/QĐ -NHNN, Về việc triển khai thí điểm đề án phâ n tích, xếp loại tín dụng doanh nghiệp ., Hoàn thiện công tác chấm điểm tín dụng khách hàng doanh nghiệp Sở giao dịch I Ngân hàng Công thương Việt Nam , Luận văn Thạc sĩ tín dụng Tiếng Anh Ahmed Ismail Shihab (2000), Fuzzy Clustering alogrithms and their application to medical image analysis , Department of Computing, Imperial College of Science, Technology and Medicine University of London, London Website http://www.hsc.com.vn http://www.saga.vn http://www.scribd.com Đỗ Thị Tâm - Đảm bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 43 ... bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng Chương - Phân cụm mờ 1.1 Phân cụm mờ Phân cụm phương pháp phân. .. bảo Toán học cho máy tính hệ thống tính toán , 2008 2010 28 Một số thuật toán phân cụm mờ toán phân tích liệu khách hàng ngân hàng 3.4 Cài đặt thuật toán phân cụm Thuật toán phân cụm cài đặt Thuật. .. này, em trình bày số thuật toán phân cụm mờ v toán phân tích liệu khách hàng ngân hàng Nội dung luận văn gồm có số thuật toán phân cụm mờ, thực tế xếp loại tín dụng số ngân hàng Việt Nam Đỗ Thị