ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THƠNG TIN ĐỒN HUẤN PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP NHẬN DIỆN VÀ PHÂN TÍCH RỦI RO THEO HƯỚNG TIẾP CẬN GOM CỤM MỜ CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 62 48 01 01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS NGUYỄN ĐÌNH THUÂN PGS TS HỒ BẢO QUỐC PHẢN BIỆN ĐỘC LẬP: PGS TS NGUYỄN ĐỨC DŨNG PGS TS LÊ HỒNG THÁI TP HỒ CHÍ MINH NĂM 2019 LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu thân tơi Các kết nghiên cứu, liệu kết luận luận án trung thực không chép từ nguồn khác hình thức Việc tham khảo nguồn tài liệu thực trích dẫn theo qui định Tp HCM, Ngày 02 tháng 10 năm 2019 Tác giả luận án Đồn Huấn LỜI CẢM ƠN Tơi xin bày tỏ lòng biết ơn sâu sắc đến PGS TS Nguyễn Đình Thuân, PGS TS Hồ Bảo Quốc, Hai thầy tận tình hướng dẫn, định hướng động viên tơi vượt qua khó khăn học thuật để hồn thành luận án Tơi xin chân thành cảm ơn Ban giám hiệu, thầy cô trường Đại học Công nghệ Thông tin - Đại học Quốc gia Tp Hồ Chí Minh, Khoa Khoa học máy tính, Khoa Hệ thống Thơng tin, Phịng Đào tạo Sau Đại học Khoa học Công nghệ giúp đỡ, hỗ trợ tơi q trình nghiên cứu, học tập Trường Tôi gửi lời cảm ơn đến chuyên gia Công ty Chứng khoán Bản Việt (VietCapital) tư vấn lĩnh vực quản lý rủi ro làm sở cho việc nghiên cứu Tôi gửi lời cảm ơn đến Ban Tổng Giám đốc Công ty Hồng Ký cho phép sử dụng tài liệu, liệu từ sở liệu hệ thống phần mềm EnterERP để tiến hành thực nghiệm luận án Kính dâng luận án lên Người cha cố Người mẹ sinh thành dưỡng dục Thân tặng luận án cho vợ, em gia đình tơi thay cho lời cảm ơn động viên, giúp đỡ tơi nhiều thời gian dài nghiên cứu thực luận án Sài gòn, Đầu mùa hè năm 2018 Tác giả luận án Đồn Huấn MỤC LỤC DANH MỤC HÌNH iv DANH MỤC BẢNG vi DANH MỤC CÁC THUẬT NGỮ VÀ TỪ VIẾT TẮT viii CHƯƠNG TỔNG QUAN 1.1 Dẫn nhập .1 1.2 Động nghiên cứu .2 1.3 Mục tiêu nghiên cứu .4 1.4 Phạm vi nghiên cứu qui ước 1.5 Đóng góp luận án 1.6 Tầm quan trọng nghiên cứu 1.7 Bố cục luận án CHƯƠNG 2.1 RỦI RO VÀ BÀI TOÁN QUẢN LÝ RỦI RO 10 Rủi ro 10 2.1.1 Sơ lược lịch sử quản lý rủi ro 10 2.1.2 Định nghĩa rủi ro 10 2.2 Bài toán quản lý rủi ro tổ chức, doanh nghiệp 11 2.2.1 Định nghĩa quản lý rủi ro .11 2.2.2 Phân loại rủi ro tổ chức, doanh nghiệp 11 2.2.3 Các tiêu chuẩn quản lý rủi ro .13 2.2.4 Các giai đoạn trình quản lý rủi ro 14 2.2.5 Các kỹ thuật nhận diện rủi ro phân tích rủi ro truyền thống 15 2.3 Bài toán quản lý rủi ro kỹ thuật ngành Khoa học máy tính 17 2.3.1 Phân loại rủi ro nghiên cứu quản lý rủi ro kỹ thuật ngành Khoa học máy tính 17 2.3.2 Tình hình nghiên cứu toán quản lý rủi ro kỹ thuật ngành Khoa học máy tính 18 2.3.3 Tóm tắt số phân tích đánh giá 23 2.4 Tóm lược tổng hợp phương pháp nhận diện phân tích rủi ro .25 2.5 Một số lựa chọn làm sở nghiên cứu luận án 26 2.5.1 Chọn loại rủi ro phù hợp để tiến hành nghiên cứu 26 2.5.2 Chọn giai đoạn phù hợp trình quản lý rủi ro để tiến hành nghiên cứu 27 2.5.3 Chọn kỹ thuật ngành Khoa học máy tính phù hợp cho toán quản lý rủi ro .28 2.6 Kết luận chương 30 CHƯƠNG ĐỀ XUẤT MỘT FRAMEWORK VÀ XÂY DỰNG MỘT SỐ PHƯƠNG PHÁP NHẬN DIỆN VÀ PHÂN TÍCH RỦI RO TIỀM ẨN TRONG DỮ LIỆU 31 3.1 Giới thiệu 31 3.2 Đề xuất lưu đồ nhận diện phân tích rủi ro dựa kỹ thuật khám phá tri thức .32 3.3 Đề xuất framework nhận diện phân tích rủi ro tiềm ẩn liệu 34 3.4 Xây dựng phương pháp nhận diện phân tích rủi ro rõ 35 3.4.1 Xây dựng định nghĩa rủi ro rõ 35 3.4.2 Một ví dụ minh họa hàm xác định rủi ro rõ f(oi) 36 3.4.3 Xây dựng phương pháp nhận diện phân tích rủi ro rõ 37 3.5 Xây dựng phương pháp nhận diện phân tích rủi ro mờ 42 3.5.1 Xây dựng định nghĩa rủi ro mờ 42 3.5.2 Hàm thành viên cho tập rủi ro mờ H 43 3.5.3 Xây dựng phương pháp nhận diện phân tích rủi ro mờ 44 3.6 Kết luận chương 49 CHƯƠNG PHÁT TRIỂN MỘT SỐ THUẬT TOÁN GOM CỤM MỜ HỖ TRỢ CHO VIỆC PHÂN TÍCH RỦI RO 50 4.1 Phát triển thuật toán gom cụm mờ FCM-E 50 4.1.1 Giới thiệu 50 4.1.2 Khảo sát số phương pháp xác định số lượng cụm .51 4.1.3 Một số khái niệm 53 4.1.4 Xây dựng hệ số phân tích 54 4.1.5 Xây dựng thuật toán FCM-E .57 4.1.6 Đánh giá độ phức tạp tính tốn thuật tốn FCM-E .59 4.1.7 Thực nghiệm thuật toán FCM-E 60 4.1.8 So sánh đánh giá số 𝜸 thuật toán FCM-E 64 ii 4.2 Xây dựng độ đo mức độ rủi ro để xếp hạng cụm Phát triển thuật toán gom cụm mờ FCM-R 67 4.2.1 Giới thiệu 67 4.2.2 Xây dựng độ đo xếp hạng rủi ro cụm tích hợp vào thuật toán gom cụm 69 4.2.3 Tích hợp độ đo mức độ rủi ro để xây dựng thuật toán gom cụm mờ FCM-R hỗ trợ phân tích rủi ro 70 4.2.4 Đánh giá độ phức tạp tính tốn thuật toán FCM-R .72 4.2.5 Thực nghiệm thuật toán cải tiến FCM-R 73 4.3 Kết luận chương 73 CHƯƠNG THỰC NGHIỆM CÁC PHƯƠNG PHÁP NHẬN DIỆN VÀ PHÂN TÍCH RỦI RO TIỀM ẨN TRONG DỮ LIỆU 75 5.1 Giới thiệu 75 5.2 Thực nghiệm tập liệu thực doanh nghiệp 75 5.2.1 Thực nghiệm phương pháp nhận diện phân tích rủi ro rõ .75 5.2.2 Thực nghiệm phương pháp nhận diện phân tích rủi ro mờ 85 5.3 Thực nghiệm tập liệu UCI Machine Learning Repository 96 5.4 Kết luận chương .106 CHƯƠNG KẾT LUẬN 107 6.1 Kết luận 107 6.2 Hướng phát triển .110 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CƠNG BỐ 112 TÀI LIỆU THAM KHẢO 114 PHỤ LỤC 1: THƯ XÁC NHẬN CUNG CẤP Ý KIẾN VỀ QUẢN LÝ RỦI RO 121 PHỤ LỤC 2: GIẤY PHÉP SỬ DỤNG DỮ LIỆU 123 iii DANH MỤC HÌNH Hình 2.1 Mơ tả trình quản lý rủi ro theo ISO 31000 [1] 13 Hình 2.2 Mơ tả trình quản lý rủi ro theo COSO 2004 [2] 14 Hình 2.3 Phân loại rủi ro theo tác giả Tsumoto Hong [11] 18 Hình 2.4 Sơ đồ tóm lược tổng hợp phương pháp nhận diện phân tích rủi ro truyền thống kỹ thuật ngành Khoa học máy tính 26 Hình 2.5 Hai mơ hình khai phá liệu [38] 29 Hình 3.1 Lưu đồ nhận diện phân tích rủi ro kỹ thuật khám phá tri thức 33 Hình 3.2 Framework nhận diện phân tích rủi ro tiềm ẩn liệu 34 Hình 3.3 Lưu đồ mô tả việc xây dựng phương pháp nhận diện phân tích rủi ro rõ 40 Hình 3.4 Sơ đồ mơ tả bước thực phương pháp nhận diện phân tích rủi ro rõ 41 Hình 3.5 Lưu đồ mơ tả việc xây dựng phương pháp nhận diện phân tích rủi ro mờ dựa framework đề xuất 47 Hình 3.6 Sơ đồ mô tả bước thực phương pháp nhận diện phân tích rủi ro mờ 48 Hình 4.1 Hình dáng cụm không gian hai chiều 54 Hình 4.2 Thuật tốn FCM-E 58 Hình 4.3 Đồ thị 𝛾(c) tập liệu Iris 61 Hình 4.4 Đồ thị 𝛾(c) tập liệu Wine 62 Hình 4.5 Đồ thị 𝛾(c) tập liệu Breast Cancer Wisconsin 63 Hình 4.6 Đồ thị 𝛾(c) tập liệu normalized Glass 64 Hình 4.7 So sánh kết số 𝛾 phương pháp đề xuất luận án với số đánh giá việc gom cụm Zalik Iris 66 Hình 4.8 So sánh kết số 𝛾 phương pháp đề xuất luận án với số đánh giá việc gom cụm Zalik normalized Glass 67 Hình 4.9 Thuật toán FCM-R 71 Hình 5.1 Cây định với rủi ro tốn cơng nợ phải thu khách hàng 80 iv Hình 5.2 Sơ đồ số số cụm thích hợp 81 Hình 5.3 Sơ đồ vị trí số cụm thích hợp số VPBMF 85 Hình 5.4 Hàm thành viên dạng hình thang trái 87 Hình 5.5 Sơ đồ vị trí số cụm thích hợp FCM-R 92 Hình 5.6 Sơ đồ vị trí số cụm thích hợp số VPBMF 96 Hình 5.7 Cây định từ tập liệu huấn luyện 99 Hình 5.8 Sơ đồ số số cụm thích hợp 101 v DANH MỤC BẢNG Bảng 2.1 Bảng phân loại rủi ro theo Jasmin Harvey cộng [24] 12 Bảng 2.2 Các kỹ thuật nhận diện, phân tích đánh giá rủi ro [27] [28] [29] [30] 15 Bảng 2.3 Tóm tắt cơng trình nhận diện phân tích rủi ro kỹ thuật ngành Khoa học máy tính 24 Bảng 3.1 Bảng liệu đối tượng khách hàng với thuộc tính liên quan rủi ro tốn cơng nợ phải thu gán nhãn rủi ro 37 Bảng 3.2 Biến ngôn ngữ, giá trị miền giá trị 44 Bảng 4.1 Bảng thống kê giá trị 𝛾 với tập liệu Iris 60 Bảng 4.2 Trọng số thuộc tính tập liệu Wine 61 Bảng 4.3 Bảng thống kê giá trị 𝛾 với tập liệu Wine 61 Bảng 4.4 Trọng số thuộc tính tập liệu Breast Cancer Wisconsin 62 Bảng 4.5 Bảng thống kê giá trị 𝛾 với tập liệu Breast Cancer Wisconsin 62 Bảng 4.6 Trọng số thuộc tính tập liệu normalized Glass 63 Bảng 4.7 Bảng thống kê giá trị 𝛾 với tập liệu normalized Glass 64 Bảng 4.8 So sánh kết phương pháp đề xuất H Capitaine C Frélicot 65 Bảng 4.9 So sánh kết phương pháp đề xuất 𝛾 Yan M Ye K 66 Bảng 5.1 Tỷ lệ phân lớp kỹ thuật 78 Bảng 5.2 Các cụm khách hàng xếp hạng theo độ đo mức độ rủi ro từ cao đến thấp 83 Bảng 5.3 Kết tính tốn số VPBMF 84 Bảng 5.4 Bảng liệu đối tượng khách hàng với thuộc tính liên quan rủi ro tốn cơng nợ phải thu chưa gán nhãn rủi ro 86 Bảng 5.5 Bảng mô tả biến ngôn ngữ, tập mờ, miền giá trị khoảng cận biên 87 Bảng 5.6 Các đối tượng khách hàng sau xác định mức độ rủi ro lưu vào thuộc tính Risk 91 Bảng 5.7 Các cụm xếp hạng theo độ đo mức độ rủi ro từ cao đến thấp 94 vi Bảng 5.8 Kết tính toán số VPBMF 95 Bảng 5.9 Mô tả thuộc tính tập liệu: default of credit card clients 97 Bảng 5.10 Mơ tả độ xác thuật toán định 100 Bảng 5.11 Các cụm khách hàng xếp hạng theo độ đo mức độ rủi ro từ cao đến thấp 101 Bảng 5.12 Bảng tổng hợp việc phân tích đánh giá rủi ro cụm khách hàng theo độ đo mức độ rủi ro từ cao đến thấp 105 vii xây dựng phương pháp nhận diện phân tích rủi ro mờ công bố [CT3][CT5] 3) Phát triển số thuật toán nhằm hỗ trợ cho việc xây dựng số phương pháp nhận diện phân tích rủi ro tiềm ẩn liệu Phát triển thuật toán gom cụm mờ FCM-E với hướng cải tiến xây dựng thuật tốn tự động xác định số lượng cụm thích hợp tập liệu đầu vào q trình gom cụm Mục đích việc cải tiến nhằm khắc phục nhược điểm bắt buộc người sử dụng phải tự xác định trước số cụm thuật toán FCM Việc xác định trước số cụm tập liệu cách chủ quan mà khơng vào thơng tin nội dẫn đến kết gom cụm khơng tốt Với định hướng cải tiến trên, luận án đề xuất xây dựng hai hệ số: hệ số cụm α ̅ hệ số cụm β̅ dựa phần tử biên cụm để làm sở xây dựng số xác định số cụm thích hợp γ̅ Tích hợp số γ̅ vào thuật toán FCM tạo thuật toán đặt tên FCM-E, có khả tự động xác định số lượng cụm thích hợp tập liệu trình gom cụm Có thể γ̅ dựa thông tin bên cụm (hệ số α ̅) bên cụm (hệ số β̅) nên chứng tỏ việc xác định số cụm tốt trình thực nghiệm (xem mục 4.1.7) cho kết tốt so sánh với số phương pháp xác định số cụm khác (xem mục 4.1.8) Từ kết đáng khích lệ đó, luận án sử dụng thuật toán FCM-E làm sở cho việc phát triển thuật tốn FCM-R nhằm làm cơng cụ cho giai đoạn phân tích rủi ro số phương pháp nhận diện phân tích rủi ro tiềm ẩn liệu Cơng việc phát triển thuật tốn gom cụm mờ FCM-E việc tiến hành thực nghiệm đánh giá cơng bố [CT1][CT6] Phát triển thuật tốn gom cụm mờ FCM-R để phân tích rủi ro Đầu tiên luận án xây dựng độ đo xếp hạng cụm nhằm mục đích xếp hạng cụm thu sau trình gom cụm giúp cho người sử dụng dựa vào dễ dàng 109 đánh giá phân tích liệu thu từ cụm Độ đo thường trung bình tổng giá trị thuộc tính liên quan đến tiêu chí đo lường cụm đối tượng cụm Nếu chọn thuộc tính đối tượng tương quan dương với rủi ro để tính độ đo xếp hạng cụm thành độ đo mức độ rủi ro cụm Tích hợp độ đo mức độ rủi ro cụm vào FCM-E để xây dựng thuật tốn gom cụm mờ FCM-R, thuật tốn vừa có khả tự động xác định số lượng cụm thích hợp tập liệu, vừa có khả xếp hạng cụm thu theo độ đo mức độ rủi ro Nhờ tính mà FCM-R chọn làm công cụ cho giai đoạn phân tích rủi ro số phương pháp nhận diện phân tích rủi ro Cơng việc xây dựng độ đo mức độ rủi ro để xếp hạng cụm phát triển thuật tốn FCM-R cơng bố [CT2], [CT4] Thực nghiệm phương pháp nhận diện phân tích rủi ro xây dựng luận án số tập liệu: tập liệu thực, trích xuất từ CSDL doanh nghiệp tập liệu công bố UCI Machine Learning Repository Kết thực nghiệm thu từ phương pháp cho thấy hiệu ý nghĩa mặt ứng dụng thực tế phương pháp đề xuất 6.2 Hướng phát triển Bên cạnh kết đạt được, để mở rộng phạm vi ứng dụng kết nghiên cứu luận án vấn đề cần phát triển sau: (1) Nghiên cứu mở rộng việc triển khai ứng dụng phương pháp nhận diện phân tích rủi ro tiềm ẩn liệu dựa kỹ thuật khám phá tri thức cho đối tượng khác lĩnh vực khác (2) Phát triển thêm phương pháp nhận diện phân tích rủi ro tiềm ẩn liệu kỹ thuật khám phá tri thức dựa việc khai thác nguồn liệu phi cấu trúc văn bản, âm thanh, hình ảnh… 110 (3) Trong việc phát triển thuật toán gom cụm FCM để làm sở cho việc xây dựng phương pháp nhận diện phân tích rủi ro tiềm ẩn liệu dựa kỹ thuật khám phá tri thức cần nghiên cứu thêm việc xây dựng số xác định số cụm độ đo xếp hạng cụm cho đối tượng có thuộc tính khác giá trị số Ngồi nghiên cứu thêm việc xây dựng độ đo xếp hạng cụm dựa thuộc tính tương quan âm với tiêu chí xếp hạng (4) Nghiên cứu phát triển thuật toán gom cụm khác thuật toán FCM để bổ sung số xác định số lượng cụm thích hợp độ đo xếp hạng cụm 111 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ Tạp chí chuyên ngành quốc tế [CT1] H Doan and T D Nguyen, "A Method for Finding the Appropriate Number of Clusters," The International Arab Journal of Information Technology (IAJIT), Vol 15, No 4, (2018) pp 675-682 (ISI, IF: 0.724, SCImago: Q2) [CT2] H Doan, T D Nguyen and Q B Ho, “A Framework for Identifying and Analyzing the Latent Risk Based on the Knowledge Discovery Techniques”, International Journal of Applied Engineering Research (IJAER), Volume 13, Number 2, (2018) pp 1336-1343 (Scopus: 2010-2017) [CT3] H Doan and T D Nguyen, " A Method for Identifying and Analyzing the Risk based on the Fuzzy Logic and the Algorithm FCM-R,“, Advances in Information Sciences and Service Sciences (AISS): An International Journal of Research and Innovation, Korea Vol 9, No 2, (2017) pp 19-28 Hội nghị chuyên ngành quốc tế [CT4] H Doan, T D Nguyen and Q B Ho, "Building a Measure to Integrate Into a Hybrid Data Mining Method to Analyze the Risk of Customer," in Advanced Computer and Communication Engineering Technology, vol 362 of the series Lecture Notes in Electrical Engineering, Springer International Publishing Switzerland, 2015, pp 843-851 [CT5] H Doan and T D Nguyen, "Building a Hybrid Method for Analyzing the Risk by Integrating the Fuzzy Logic and the Improved Fuzzy Clustering Algorithm FCM-R," in Information Science and Applications (ICISA) 2016, vol 376 of the series Lecture Notes in Electrical Engineering, Springer Science+Business Media Singapore, 2016, pp 923-932 112 [CT6] H Doan and T D Nguyen, "An Adaptive Method to Determine the Number of Clusters in Clustering Process," in The International Conference on Computer & Information Sciences, ICCOINS 2014, Kuala Lumpur, IEEE, ISBN 978-1-4799-4391-3., 2014 pp 142-147 [CT7] T D Nguyen and H Doan, "An Approach to determine the Number of Clusters for Clustering Algorithms," in Computational Collective Intelligence Technologies and Applications-ICCCI 2012, Vols LNAI 7653 of the series Lecture Notes in Computer Science, Part I, Springer-Verlag Berlin Heidelberg, 2012, p 485–494 Hội thảo chuyên ngành nước [CT8] Đoàn Huấn Nguyễn Đình Thuân, "Một hướng tiếp cận tốn phân tích rủi ro," Hội thảo Quốc gia lần thứ XVIII "Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông, HCM, 2015 Nhà xuất Khoa học Kỹ thuật, 2015, p 156-161 113 TÀI LIỆU THAM KHẢO Tiếng Anh [1] ISO 31000:2009 (en), "Risk management — Principles and guidelines," 2009 [2] COSO, "Enterprise Risk Management – Integrated Framework," 2004, 2004 [3] G K Bharathy and , M K McShane, "Applying a Systems Model to Enterprise Risk Management," Engineering Management Journal-EMJ, vol 26, no 4, pp 38-46, December 2014 [4] P Bromiley, M McShane, A Nair and E Rustambekov, "Enterprise Risk Management: Review, Critique, and Research Directions," Long Range Planning, vol 48, pp pp.265-276, 2015 [5] S Rajagopal, "Customer Data Clustering Using Data Mining Technique," International Journal of Database Management Systems (IJDMS), vol 3, no 4, pp 1-11, November 2011 [6] E W S d Angelos, O R Saavedra, O A C Cortés and A N d Souza, "Detection and Identification of Abnormalities in Customer Consumptions in Power Distribution Systems," IEEE Transactions On Power Delivery, vol 26, no 4, October 2011 [7] W Chen, G Xiang, Y Liu and K Wang, "Credit risk Evaluation by hybrid data mining technique," Systems Engineering Procedia, vol 3, p 194 – 200, 2012 [8] M A Farajian and S Mohammadi, "Mining the Banking Customer Behavior Using Clustering and Association Rules Methods," International Journal of Industrial Engineering & Production Research, vol 21, no 4, pp 239-245, December 2010 [9] E D Madyatmadja and M Aryuni, "Comparative Study of Data Mining Model for Credit Card Application Scoring in Bank," Journal of Theoretical and Applied Information Technology 20th Vol No.2., vol 59, no 2, pp 269274, January 2014 [10] D K Cao and P Do, "Applying Data Mining in Money Laundering Detection 114 for the Vietnamese Banking Industry," in Lecture Notes in Computer Science, vol 7197 Springer, Berlin, Heidelberg, 2012 [11] S Tsumoto and T.-P Hong, "Special issue on data mining for decision making and risk management," J Intell Inf Syst, vol 36, p 249–251, 2011 [12] S Tsumoto, T Washio, S Miyamoto and H Tsubaki, "Towards risk sciences (in Japanese)," Magazine for Japanese Society for Artif icial Intelligence, vol 22, no 5, pp 630-632, 2007 [13] IRM, "A Risk Management Standard https://www.theirm.org/media/886059/ARMS_2002_IRM.pdf," 2002 [Accessed Feb 2018] [14] H.-P Berg, "Risk Management: Procedures, Methods and Experiences," RT&A # 2(17), vol 1, pp 79-95, 2010 [15] Team FME, SWOT Analysis, http://www.free-management-ebooks.com/, 2013 [Accessed Apr 2018] [16] The Economist Intelligence Unit, "Strategies for managing customer and supplier risks," August 2013 [17] D D Wu and D L Olson, "Introduction to the Special Section on “Optimizing Risk Management: Methods and Tools”," Human and Ecological Risk Assessment: An International Journal, pp 220-226, 2009 [18] R S Kenett and Y Raanan, Eds., Operational Risk Management: a practical approach to intelligent data analysis, John Wiley & Sons Ltd ISBN: 978-0470-74748-3., 2011 [19] V T Covello and J Mumpower, "Risk Analysis and Risk Management: An Historical Perspective," Risk Analysis, Vol 5, No 2, , vol 5, no 2, pp 103120, 1985 [20] Bureau of Strategic Planning-UNESCO, Risk Management Training Handbook, Paris: UNESCO, 2010 [21] B Ray, C Apte, K McAuliffe and L Deleri, "Harnessing Uncertainty: The Future of Risk Analytics," IBM Research Report, 2008 115 [22] ISO/Guide 73:2009 (en), "Risk management — Vocabulary," 2009 [23] D W Hubbard, The Failure of Risk Management: Why It's Broken and How to Fix It, John Wiley & Sons, 2009, p 10 [24] J Harvey and Technical Information Service, "Introduction to managing risk," The Chartered Institute of Management Accountants-CIMA, London, 2008 [25] M Drew, "Information risk management and compliance-expect the unexpected," BT Technology Journal, vol 25, no 1, pp 19-29, January 2007 [26] Casualty Actuarial Society and Enterprise Risk Management Committee, "Overview of Enterprise Risk Management," 2003 [27] AIRMIC, Alarm and IRM, "A structured approach to Enterprise Risk Management (ERM) and the requirements of ISO 31000," 2010 [28] V N Gupta and C H Y, "Hazard Operability Analysis (HAZOP): A Quality Risk Management tool," International Journal of PharmTech Research, vol 9, no 3, pp pp 366-373, 2016 [29] R D Snee and W F Rodebaugh, "Failure Modes and Effects Analysis," Encycelopedia of Statistics in Quality and Reliability., pp 1-6, 2008 [30] Team FME, PESTLE Analysis, 2013 [31] L.-C Chen, C.-H Chen, H.-M Chen and V S Tseng, "Hybrid data mining approaches for prevention of drug dispensing errors," Journal of Intelligent Information Systems, vol 36, no 3, p 305–327, 2011 [32] C.-H Cheng and Y.-S Chen, "Classifying the segmentation of customer value via RFM model and RS theory," Expert Systems with Applications, vol 36, no 3, p 4176–4184, 2009 [33] P Ravisankar, V Ravi, R G Rao and I Bos, "Detection of financial statement fraud and feature selection using data mining techniques," Decision Support Systems, Elsevier B.V, vol 50, no 2, p 491–500, 2011 [34] M Jans, N Lybaert and K Vanhoof, "Internal fraud risk reduction: Results of a data mining case study," International Journal of Accounting Information Systems, vol 11, p 17–41, 2010 116 [35] L Pokorádi, "Fuzzy logic-based risk assessment," Academic and Applied Research in Military Science-AARMS, vol 1, no 1, p 63–73, 2002 [36] M Ingle, M Atique and S O Dahad, "Risk Analysis Using Fuzzy Logic," International Journal of Advanced Engineering Technology E-ISSN 09763945., vol 2, no 3, pp 96-99, July-September (2011) [37] E Ngai and F Wat, "Fuzzy decision support system for risk analysis in ecommerce development," Decision Support Systems, Elsevier B.V., vol 40, no 2, p 235–255, August 2005 [38] R Gerritsen, "Assessing Loan Risks: A Data Mining Case Study," IT Professional, vol 1, no 6, pp 16-21, 1999 [39] J Han, M Kamber and J Pei, Data Mining-Concepts and Techniques, Waltham: Morgan Kaufmann , 2012 [40] L A Zadeh, "Is there a need for fuzzy logic," Information Sciences , vol 178, p pp 2751–2779, 2008 [41] P N Tan, M Steibach and V Kumar, Introduction Data Mining, Boston: Pearson Addison-Wesley, 2006 [42] J Terence, "Conceptual Mapping of Risk Management to Data Mining," in In Proceedings of the ICETET, PP 636-641, © IEEE, 2010 [43] C C Aggarwal and C K Reddy, Data clustering: algorithms and applications, Boca Raton: CRC Press, Taylor & Francis Group, 2014 [44] C Sugar and G James, "Finding the number of clusters in a data set: An information theoretic approach," Journal of the American Statistical Association, vol 98, no 1, pp 750-763, 2003 [45] G Hamerly and C Elkan, "Learning the k in k-means," in NIPS'03 Proceedings of the 16th International Conference on Neural Information Processing Systems, Whistler, British Columbia, Canada , 2003 [46] J C Bezdek, R Ehrlich and W Full, "FCM: The Fuzzy C-Means Clustering Algorithm," Computers & Geosciences, vol 10, no 2-3, pp 191-203, 1984 [47] R J Hathaway and J C Bezdek, "Recent Convergence Results for the Fuzzy 117 c-Means Clustering Algorithms," Joumal of Classificanon, vol 5, no 2, pp 237-247, 1988 [48] C Rosenberger and K Chehdi, "Unsupervised clustering method with optimal estimation of the number of clusters: application to image segmentation," in 15th International Conference on Pattern Recognition, Barcelona, 2000 [49] R Tibshirani, G Walther and T Hastie , "Estimating the number of clusters in a data set via the gap statistic," Standford University, 2000 [50] S Salvador and P Chan , "Determining the Number of Clusters/Segments in Hierarchical Clustering/Segmentation Algorithms," in Tools with Artificial Intelligence ICTAI 2004 16th IEEE International Conference, 2004 [51] H Sun, S Wang and Q Jiang, "FCM-Based Model Selection Algorithms for Determining the Number of Clusters," Pattern Recognition, vol 37, p 2027– 2037, 2004 [52] Q Shao and Y Wu, "A consistent procedure for determining the number of clusters in regression clustering," Journal of Statistical Planning and Inference, vol 135, p 461–476., 2005 [53] G Sanguinetti, J Laidler and D Lawrence, "Automatic determination of the number of clusters using spectral Algorithms," in Machine Learning for Signal Processing, IEEE Workshop, 2005 [54] T Pham, S Dimov and D Nguyen, "Selection of K in K-means clustering," Proc IMechE Part C: J Mechanical Engineering Science., vol 219, pp 103119, 2005 [55] I Kyrgyzov, O Kyrgyzov, H Maıtre and M Campedel, "Kernel MDL to Determine the Number of Clusters," in Machine Learning and Data Mining in Pattern Recognition, Lecture Notes in Computer Science, vol 4571, Springer Berlin Heidelberg, 2007, pp 203-217 [56] M Yan and K Ye , "Determining the Number of Clusters Using the Weighted Gap Statistic," Biometrics, vol 63, p 1031–1037, 2007 [57] Y Cheong and H Lee, "Determining the number of clusters in cluster analysis," Journal of the Korean Statistical Society, vol 37, pp 135-143, 2008 118 [58] H Capitaine and C Frélicot, "A Fuzzy Modeling Approach to Cluster Validity," in Fuzzy Systems, IEEE International Conference, Jeju Island, 2009 [59] Q Zhao, V Hautamaki and P Fränti, "Knee Point Detection in BIC for Detecting the Number of Clusters," in Advanced Concepts for Intelligent Vision Systems, ACIVS 2008, LNCS 5259, e a In Blanc-Talon, Ed., SpringerVerlag Berlin Heidelberg, 2008, p 664–673 [60] K Zalik, "Cluster validity index for estimation of fuzzy clusters of different sizes and densities," Pattern Recognition, vol 43, no 10, p 3374–3390, 2010 [61] T Nguyen and H Doan, "An Approach to determine the Number of Clusters for Clustering Algorithms," in Computational Collective Intelligence Technologies and Applications-ICCCI 2012, Vols 7653 of the series Lecture Notes in Computer Science, Part I, Springer-Verlag Berlin Heidelberg, 2012, p 485–494 [62] T D Nguyen and H Doan, "Sử dụng thuật toán gom cụm mờ khai phá sở liệu ERP doanh nghiệp dược phẩm," in Một số vấn đề chọn lọc công nghệ thông tin truyền thông, Cần Thơ, 2011 [63] P Do, Giáo trình Khai thác Dữ liệu, Hồ Chí Minh: Đại học Quốc gia Tp Hồ Chí Minh, 2009 [64] M Lichman, "UCI Machine Learning Repository," Irvine, CA: University of California, School of Information and Computer Science, 2013 [Online] Available: http://archive.ics.uci.edu/ml [Accessed 2013, 2018] [65] Z Bar-Yossef, I Guy, R Lempel, Y S Maarek and V Soroka, "Cluster ranking with an application to mining mailbox networks," Knowledge and Information Systems, vol 14, no 1, pp 101-139, January 2008 [66] "RuleQuest data mining tools," RuleQuest Research, [Online] Available: https://www.rulequest.com/see5-info.html [Accessed May 2014] [67] J Bezdek, Pattern Recognition in Handbook of Fuzzy Computation, Chapter F6, Boston, Ny: IOP Publishing Ltd., 1998 [68] M K Pakhira, S Bandyopadhyay and U Maulik, "Validity index for crisp and fuzzy clusters," Pattern Recognition, Elsevier B.V., vol 37, no 3, pp 487-501, 119 March 2004 [69] W Wang and Y Zhang, "On fuzzy cluster validity indices," Fuzzy Sets and Systems, Elsevier B.V., vol 158, no 14, p 2095–2117, October 2007 [70] H Doan, T D Nguyen and Q B Ho, "Building a Measure to Integrate Into a Hybrid Data Mining Method to Analyze the Risk of Customer," in Advanced Computer and Communication Engineering Technology, vol 362 of the series Lecture Notes in Electrical Engineering, Springer International Publishing Switzerland, 2015, pp 843-851 [71] H Doan and T D Nguyen, "Building a Hybrid Method for Analyzing the Risk by Integrating the Fuzzy Logic and the Improved Fuzzy Clustering Algorithm FCM-R," in Information Science and Applications (ICISA) 2016, vol 376 of the series Lecture Notes in Electrical Engineering, Springer Science+Business Media Singapore, 2016, pp 923-932 [72] H Doan and T D Nguyen, "An Adaptive Method to Determine the Number of Clusters in Clustering Process," in The International Conference on Computer & Information Sciences, ICCOINS 2014, Kuala Lumpur, IEEE, ISBN 978-14799-4391-3 pp 142-147, 2014 [73] H Doan and T D Nguyen, "Một hướng tiếp cận tốn phân tích rủi ro," in Hội thảo Quốc gia lần thứ XVIII "Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông, HCM, Nhà xuất Khoa học Kỹ thuật, 2015 pp 156-161, 2015 [74] H Doan and T D Nguyen, "A Method for Finding the Appropriate Number of Clusters," The International Arab Journal of Information Technology (IAJIT), vol 15, no 4, pp 675-682, 2018 [75] P Do, Giáo trình Khai thác liệu, Ho Chi Minh: Đại học Quốc gia Thành phố Hồ Chí Minh, 2009 120 PHỤ LỤC 1: THƯ XÁC NHẬN CUNG CẤP Ý KIẾN VỀ QUẢN LÝ RỦI RO 121 122 PHỤ LỤC 2: GIẤY PHÉP SỬ DỤNG DỮ LIỆU 123 ... pháp nhận diện phân tích rủi ro tiềm ẩn liệu dựa framework Cụ thể phương pháp nhận diện phân tích rủi ro rõ phương pháp nhận diện phân tích rủi ro mờ Chương Mô tả chi tiết bước luận án phát triển. .. luận án 2.4 Tóm lược tổng hợp phương pháp nhận diện phân tích rủi ro Từ việc khảo sát phương pháp nhận diện phân tích rủi ro truyền thống phương pháp nhận diện phân tích rủi ro kỹ thuật ngành Khoa. .. tốn tích hợp thêm độ đo xếp hạng mức độ rủi ro cụm vào thuật toán FCM-E Chương Tiến hành thực nghiệm hai phương pháp nhận diện phân tích rủi ro rõ phương pháp nhận diện phân tích rủi ro mờ tập