Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 90 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
90
Dung lượng
1,53 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NHƯ NA VỀ TÍNH HIỆU QUẢ CỦA CÁC THUẬT TOÁN TỐI ƯU TIẾN HÓA CHO PHÂN CỤM MỜ VÀ ỨNG DỤNG TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NHƯ NA VỀ TÍNH HIỆU QUẢ CỦA CÁC THUẬT TOÁN TỐI ƯU TIẾN HÓA CHO PHÂN CỤM MỜ VÀ ỨNG DỤNG TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Lê Hoàng Sơn Hà Nội – 2015 LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu độc lập riêng tôi, không chép công trình luận văn, luận án tác giả khác Các số liệu, kết nêu luận văn trung thực chưa công bố công trình khác Các trích dẫn, số liệu kết tham khảo dùng để so sánh có nguồn trích dẫn rõ ràng Tôi xin hoàn toàn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan Hà Nội, tháng năm 2015 Tác giả luận văn Nguyễn Thị Như Na i LỜI CẢM ƠN Để hoàn thành tốt luận văn này, em xin bày tỏ lòng biết ơn chân thành sâu sắc đến Tiến sĩ Lê Hoàng Sơn, người tận tình trực tiếp hướng dẫn em suốt trình triển khai nghiên cứu đề tài, tạo điều kiện để em hoàn thành luận văn Thứ hai, em xin bày tỏ lòng biết ơn chân thành tới toàn thể thầy cô giáo khoa Công nghệ thông tin, trường Đại học Công nghệ Hà Nội, Đại học Quốc gia Hà Nội dạy bảo tận tình em suốt trình em học tập khoa Thứ ba, em xin gửi lời cảm ơn tới thầy cô, anh chị bạn Trung tâm Tính toán Hiệu cao, trường Đại học Khoa học tự nhiên giúp đỡ em suốt thời gian làm luận văn Cuối em xin chân thành cảm ơn tới gia đình, bạn bè, đồng nghiệp bên em cổ vũ, động viên, giúp đỡ em suốt trình học tập thực luận văn Luận văn thực tài trợ đề tài NAFOSTED, mã số: 102.05-2014.01 Mặc dù cố gắng hoàn thành luận văn phạm vi khả cho phép chắn không tránh khỏi thiếu sót Em mong góp ý chân thành thầy cô bạn để em hoàn thiện luận văn Xin chân thành cảm ơn! Hà Nội, ngày tháng năm 2015 Học viên Nguyễn Thị Như Na ii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH SÁCH HÌNH VẼ vi DANH SÁCH BẢNG vi DANH MỤC CÁC KÝ HIỆU VIẾT TẮT vii 1/ ĐẶT VẤN ĐỀ 2/ MỤC ĐÍCH CỦA LUẬN VĂN 3/ BỐ CỤC CỦA LUẬN VĂN CHƯƠNG 1: TỔNG QUAN VỀ PHÂN CỤM MỜ 1.1 Tập mờ 1.1.1 Lý thuyết mờ 1.1.2 Tập mờ 1.2 Giới thiệu phân cụm mờ 1.2.1 Khái quát phân cụm 1.2.2 Độ đo gần gũi 10 1.2.3 Các bước phân cụm 12 1.2.4 Phân cụm mờ 13 1.3 Thuật toán Fuzzy C – Means (FCM) 15 1.3.1 Thuật toán Fuzzy C - Means 16 1.3.2 Cài đặt chương trình 18 1.4 Kết luận chương 24 iii CHƯƠNG 2: CÁC THUẬT TOÁN TỐI ƯU TIẾN HÓA CHO PHÂN CỤM MỜ 25 2.1 Tính toán tiến hóa 25 2.2 Các dạng thuật toán tiến hóa 27 2.2.1 Thuật toán lập trình tiến hóa 28 2.2.2 Chiến lược tiến hóa 29 2.2.3 Thuật toán di truyền 29 2.2.4 Lập trình di truyền 31 2.2.5 Tiến hóa vi phân 32 2.2.6 Thuật toán văn hóa 32 2.3 Một số thuật toán cụ thể 33 2.3.1.Tìm kiếm cục 33 2.3.2 Thuật toán tìm kiếm Tabu 37 2.3.3 Tìm kiếm lân cận biến đổi (VNS) 40 2.3.4 Tối ưu bầy đàn PSO 42 2.4 Áp dụng thuật toán tối ưu tiến hóa cho phân cụm mờ 46 2.4.1 Thuật toán Fuzzy J – Means heuristic (FJM) 46 2.4.2 Thuật toán VNS 54 2.4.3 Thuật toán tối ưu bầy đàn cho phân cụm mờ (FPSO) 56 Cài đặt chương trình 58 2.5 Kết luận chương 61 CHƯƠNG 3: SO SÁNH HIỆU NĂNG THUẬT TOÁN TỐI ƯU TIẾN HÓA 62 3.1 Thiết lập môi trường thực nghiệm 62 iv 3.1.1 Dữ liệu 62 3.1.2 Cấu hình cài đặt 62 3.1.3 Kết thực nghiệm 63 3.1.4 So sánh hiệu thuật toán 65 3.2 Ứng dụng 66 3.2.1 Bài toán 66 3.2.2 Dữ liệu 66 3.2.3 Kết chạy thực nghiệm toán 68 3.3 Kết luận chương 75 KẾT LUẬN 76 TÀI LIỆU THAM KHẢO 78 v DANH SÁCH HÌNH VẼ Hình 1.1 Tập mờ biểu diễn tập mờ Hình 1.2 Ví dụ tập mờ Hình 1.3 Số mờ hình thang Hình 1.4 Số mờ hình tam giác Hình 1.5 Các dạng hình học khác cụm không gian R Hình 2.1 Cá thể cập nhật vị trí Hình 3.1 Minh họa liệu đầu vào thử nghiệm lưu tệp excel Hình Tóm tắt trường liệu đầu vào Hình 3 Tóm tắt trường liệu đầu vào Hình Tóm tắt trường liệu đầu vào Hình 3.5 Minh họa liệu đầu vào cho toán ứng dụng lưu tệp exel Hình 3.6 Ma trận mờ thuộc DANH SÁCH BẢNG Bảng 3.1: Kêt thực nghiệm trường hợp Bảng 3.2: Kêt thực nghiệm trường hợp Bảng 3.3: Kêt thực nghiệm trường hợp Bảng 3.4: Kêt thực nghiệm trường hợp vi Bảng 3.5: Bệnh viện thuộc cụm Bảng 3.6: Bệnh viện thuộc cụm Bảng 3.7: Bệnh viện thuộc cụm Bảng 3.8: Không gian tham chiếu thuộc tính DANH MỤC CÁC KÝ HIỆU VIẾT TẮT Từ cụm từ Từ Từ Tiếng Anh viết tắt Phân cụm mờ C - Means FCM Fuzzy C – Means Phân cụm mờ J - Means FJM Fuzzy J – Means Tìm kiếm lân cận biến đổi VNS Variable neighbourhood search Tối ưu bầy đàn PSO vii Particle Swarm Optimization Tối ưu bầy đàn mờ FPSO Fuzzy Particle Swarm Optimization Lập trình tiến hóa EP Evolutionary Programming Chiến lược tiến hóa ES Evolutionary Strategies Thuật toán di truyền GA Genetic Algorithms Thuật toán tiến hóa EA Evolutionary Algorithms Tập mờ FS Fuzzy Set Thuật toán tìm kiếm Tabu TS Tabu search viii 3.2 Ứng dụng 3.2.1 Bài toán Một công ty chuyên cung cấp thiết bị y tế cho 500 bệnh viện [26] Mỹ Công ty muốn tìm giải pháp để tăng doanh số bán hàng Công ty muốn tìm bệnh viện có mức tiêu thụ cao thiết bị y tế 3.2.2 Dữ liệu Dữ liệu đầu vào file Customer.xls biểu diễn gồm: 19 trường 4000 ghi Các trường: ZIP: Mã bưu điện HID: ID bệnh viện CITY: Tên thành phố STATE: Tên tiểu bang BEDS: Số giường bệnh RBEDS: Số giường chỉnh hình OUT-V: số lượt khám ngoại trú ADM: Chi phí hành (1000 $/năm) SIR: Thu từ nội trú 10 SALESY: Bán trang thiết bị phục hồi chức từ ngày tháng 11 SALES12: Bán trang thiết bị phục hồi chức cuối tháng 12 12 HIP95: Số hoạt động cho hông năm 1995 13 KNEE95: Số hoạt động đầu gối năm 1995 14 TH: Có hoạt động dạy học không? 0, 15 TRAUMA: Có chấn thương không? 0, 66 16 REHAB: Có chỉnh hình không? 0, 17 HIP96: Số hoạt động cho hông cho năm 1996 18 KNEE96: Số hoạt động đầu gối cho năm 1996 19 FEMUR96: Số hoạt động cho xương đùi cho năm 1996 Tóm tắt trường liệu đầu vào: Hình Tóm tắt trường liệu đầu vào Hình 3 Tóm tắt trường liệu đầu vào (tiếp) 67 Hình Tóm tắt trường liệu đầu vào (tiếp) Dữ liệu xử lý: Hình 3.5 Minh họa liệu đầu vào cho toán ứng dụng lưu tệp exel 3.2.3 Kết chạy thực nghiệm toán Sau xử lý liệu, thực gom cụm liệu thuật toán FJM với liệu sau: Thuật toán chạy với tham số cụm c=3 với nhãn cụm sau: Bệnh viện có mức tiêu thiết bị y tế thấp; Bệnh viện có mức tiêu thụ thiết bị y tế trung bình; Bệnh viện có mức tiêu thụ thiết bị y tế cao Tham số mờ m=2, tiêu chuẩn hội tụ (epsilon) Eps = 0.01, số lần lặp tối đa MaxTest =1000 68 Hình 3.6 Ma trận mờ thuộc Với quy tắc, khách hàng thuộc cụm mà có độ thuộc lớn Nếu có từ hai độ thuộc lớn trở lên chọn số cụm để đưa vào Cụm 1: Gồm khách hàng bệnh viện có mã bệnh viện ID độ thuộc: ID(37011) với độ thuộc (0.3723); ID (55511) độ thuộc (0.3728); ID(24016) độ thuộc (0.3698); ID(2016) độ thuộc (0.3763); ID(53016) độ thuộc (0.3764); ID BEDS RBEDS OUT -V ADM SIR SALESY SALES12 HIP95 KNEE95 TH TRAUMA REHAB HIP96 KNEE96 FEMUR96 37011 250 12 107297 9203 5503 1 66 46 1 91 47 62 5551 236 25 263189 7891 6748 3 66 56 1 65 70 52 24016 155 10 53398 7530 6426 1 38 24 1 54 39 57 2016 475 13 63656 17424 10940 0 154 112 1 147 124 137 53016 320 18 48556 11935 11185 16 126 47 1 145 80 127 Bảng 3.5 Bệnh viện thuộc cụm 69 Cụm 2: Gồm khách hàng bệnh viện có mã bệnh viện ID độ thuộc: ID(1104) với độ thuộc ( 0.4234); ID(1602) với độ thuộc (0.4517 ); ID(1605) với độ thuộc (0.2738 ); ID(1801) với độ thuộc (0.4082 ); ID(1830) với độ thuộc (0.4662 ); ID(1841) với độ thuộc (0.4303 ); ID BEDS RBEDS OUT -V ADM SIR SALESY SALES12 HIP95 KNEE95 TH TRAUMA REHAB HIP96 KNEE96 FEMUR96 1104 324 95702 10406 13648 28 29 122 94 0 152 95 116 1602 80 80 907 318 491 0 0 0 1605 211 9275 7571 15766 277 513 209 143 0 207 178 177 1801 82 82 440 50 82 0 0 0 1830 151 25550 6199 5257 12 16 40 15 0 39 19 87 1841 290 92768 8662 5388 56 96 55 26 0 49 40 80 Bảng 3.6 Bệnh viện thuộc cụm Cụm 3: Gồm khách hàng bệnh viện có mã bệnh viện ID độ thuộc: ID(43014) với độ thuộc (0.4406); ID(21514) độ thuộc (0.4469); ID(46014) với độ thuộc (0.4402); ID(62014) với độ thuộc (0.4859); ID(78014) với độ thuộc (0.4938); ID(20901) với độ thuộc (0.48844); ID(153014) với độ thuộc (0.4874); ID(174014) với độ thuộc (0.4083); 70 ID BEDS RBEDS 43014 1005 21514 710 46014 OUT -V ADM SIR SALESY SALES12 HIP95 KNEE95 TH TRAUMA REHAB HIP96 KNEE96 FEMUR96 504125 34214 27830 504 271 1 519 289 303 421456 37745 25796 0 461 458 1 437 372 169 219 47036 7829 9163 18 663 463 0 618 410 51 62014 391 0 14594 8852 13 82 49 1 80 47 77 78014 290 72061 11767 7426 0 78 51 0 101 53 103 209014 275 118791 8788 6473 15 51 30 0 52 32 68 153014 321 66061 17475 9375 0 104 93 1 102 60 109 Bảng 3.7 Bệnh viện thuộc cụm Xây dựng hàm thuộc cho biến ngôn ngữ: - Xác định biến ngôn ngữ: RBEDS = {RBEDS thấp; RBEDS cao} OUT_V = {OUT_V thấp; OUT_V cao} ADM ={ADM thấp; ADM cao} SIR = {SIR thấp; SIR cao} SALESY = {SALESY thấp; SALESY cao} SALES12 = {SALES12 thấp; SALES12 cao} HIP95 = {HIP95 thấp; HIP95 cao} KNEE95 = {KNEE95 thấp; KNEE95 cao} HIP96 = {HIP96 thấp; HIP96 cao} KNEE96 = {KNEE96 thấp; KNEE96 cao} FEMUR96 ={FEMUR96 thấp; FEMUR96 cao} 71 Không gian tham chiếu thuộc tính bảng 3.8 BEDS RBEDS OUT -V ADM SIR SALESY SALES12 HIP95 KNEE95 TH TRAUMA REHAB HIP96 KNEE96 FEMUR96 Min 0 0 0 0 0 0 0 Max 1476 850 70300 1209 2770 1421 868 1 1373 1081 489 1987000 66440 Bảng 3.8 Không gian tham chiếu thuộc tính - Xác định hàm thuộc cho biến ngôn ngữ: Với biến X, không gian tham chiếu U = [0,u] Khi đó: X cao ( x ) x / u;0 x u X thấp ( x ) x / u Ví dụ: Với thuộc tính BEDS: BEDS 1476; với BEDS = 1001 BEDS cao (1001) =1001/ 1476 = 0.678184; BEDS thấp = 1- 0.678184 Tương tự với thuộc tính lại - Xác định luật mờ: (theo MISO - với n đầu vào đầu ra) Luật 1: Nếu BEDS cao RBEDS cao OUT_V cao REHAB cao Tiêu thụ mức cao Luật 2: Nếu RBED cao OUT_V cao SIR cao HIP95 cao Tiêu thụ mức cao Luật 3: Nếu BEDS cao RBEDS thấp HIP95 cao KNEE95 cao Tiêu thụ mức trung bình Luật 4: Nếu BEDS thấp RBEDS cao HIP95 thấp KNEE95 thấp Tiêu thụ mức thấp 72 Luật 5: Nếu BEDS cao RBEDS thấp HIP96 cao KNEE96 cao Tiêu thụ mức trung bình Luật 6: Nếu BEDS thấp RBEDS cao HIP96 thấp KNEE96 thấp Tiêu thụ mức thấp Luật 7: Nếu BEDS thấp RBEDS cao OUT_Vcao REHAB thấp Tiêu thụ mức thấp Luật 8: Nếu BEDS thấp RBEDS thấp TH cao REHAB cao Tiêu thụ mức Trung bình Luật 9: Nếu BEDS cao RBEDS thấp TH cao REHAB cao Tiêu thụ mức cao Luật 10: Nếu BEDS cao RBEDS thấp HIP96 cao KNEE96 cao Tiêu thụ mức cao Luât 11: Nếu BEDS thấp RBEDS thấp SALELY cao SALES12 cao Tiêu thụ mức thấp Luật 12: Nếu BEDS cao RBEDS cao SALELY cao SALES12 cao Tiêu thụ mức cao Qua tính toán với số liệu cụ thể bảng cho thấy: Cụm nhóm bệnh viện có số RBEDS (số giường chỉnh hình) cao số REHAB (có chỉnh hình) thường xuyên, có số TH (có hoạt động dạy học) thường xuyên Các số khác thuộc tính mức trung bình Cụm cụm bệnh viện có mức tiêu thụ thiết bị y tế mức trung bình Cụm nhóm bệnh viện có số SALELY (bán trang thiết bị phục hồi chức ngày tháng 1) số SALES12 (bán trang thiết bị phục hồi chức 73 cuối tháng 12) cao Các số khác thuộc tính mức thấp Cụm cụm bệnh viện có mức tiêu thụ thiết bị y tế mức thấp Cụm nhóm bệnh viện có số ADM (chi phí hành chính), SIR (thu từ nội trú), HIP95 (số hoạt động cho hông năm 1995), KNEE95 (số hoạt động cho đầu gối năm 1995), TH (có hoạt động dạy học), HIP96 (số hoạt động cho hông năm 1996), KNEE96 (số hoạt động cho đầu gối năm 1996), FEMUR96 (số hoạt động cho xương đùi năm 1996) cao Cụm cụm bệnh viện có mức tiêu thụ thiết bị y tế mức cao Vậy để tăng doanh thu cho công ty kinh doanh thiết bị y tế, công ty tập trung vào nhóm khách hàng với chiếm lược khác cho nhóm: Với nhóm 1, công ty tập trung vào cung cấp thiết bị liên quan đến hoạt động chỉnh hình thiết bị phục vụ cho trình học tập đào tạo chuyên môn Với nhóm 2, công ty tập trung cung cấp trang thiết bị liên quan đến phục hồi chức Với nhóm 3, có chi phí hành chính, thu từ nội trú cao, số khác tương đối cao so với hai nhóm trên, nói nhóm nhóm khách hàng tiềm có khả tiêu thụ nhiều thiết bị y tế phục vụ cho hoạt động chữa bệnh như: Hoạt động cho hông, hoạt động cho đầu gối, hoạt động cho xương đùi, trang thiết bị liên quan đến hoạt động học tập đào tạo chuyên môn Cung cấp phân phối thiết bị y tế phù hợp cho nhóm trên, công ty kinh doanh nhanh chóng thúc đẩy trình bán hàng từ doanh thu tăng cao 74 3.3 Kết luận chương Chương luận văn chạy thực nghiệm thuật toán FCM, FJM, VNS FPSO liệu toán cụ thể Từ đó, so sánh hiệu thuật toán dựa hàm mục tiêu thời gian tính toán để có thuật toán tối ưu Sử dụng thuật toán tối ưu có để giải toán phân tích nhu cầu khách hàng công ty cung cấp thiết bị y tế cho bệnh viện 75 KẾT LUẬN Phân cụm mờ quan tâm nghiên cứu ứng dụng rộng rãi để giải toán thực tế Những nhược điểm phân cụm mờ quan tâm nhiều song nghiên cứu chưa quan tâm đến việc xác định nghiệm tối ưu toàn cục toán phân cụm, hàm mục tiêu toán Chính vậy, với đề tài "Về tính hiệu thuật toán tối ưu tiến hóa cho phân cụm mờ ứng dụng phân tích nhu cầu khách hàng", luận văn tập trung tìm hiểu, nghiên cứu đạt số kết sau: Trình bày kiến thức phân cụm mờ, bước phân cụm mờ Trình bày thuật toán phân cụm mờ FCM Trình bày thuật toán tối ưu tiến hóa cụ thể ba thuật toán: thuật toán tìm kiếm cục (local search), thuật toán tìm kiếm theo lân cận biến đổi (variable neighborhood search) thuật toán tối ưu bầy đàn (particle swarm optimization) cho toán phân cụm mờ Áp dụng phương pháp tối ưu tiến hóa cho phân cụm mờ, cách khảo sát phương pháp cụ thể: thuật toán tìm kiếm cục (Fuzzy J-Means – FJM), thuật toán tìm kiếm theo lân cận biến đổi (Variable Neighborhood Search - VNS) thuật toán tối ưu bầy đàn cho phân cụm mờ (Fuzzy Particle Swarm Optimization – FPSO) Các thuật toán cài đặt Matlab kiểm chứng với liệu cụ thể Thực nghiệm theo miền tham số khác để chứng tỏ tính khách quan kết thu được thực Từ đó, so sánh hiệu thuật toán tối ưu tiến hóa 76 Ứng dụng thuật toán tối ưu tiến hóa có hiệu tốt cho toán phân tích nhu cầu khách hàng sở liệu thực tế thống kê doanh số bán hàng công ty kinh doanh thiết bị y tế cho bệnh viện Hướng phát triển đề tài nghiên cứu theo hướng sau: - Nghiên cứu phương pháp khắc phục tính hội tụ sớm thuật toán tối ưu tiến hóa - Xác định số cụm tối ưu thuật toán phân cụm mờ - Áp dụng thuật toán cho xử lý ảnh, phân tích khách hàng, v.v 77 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] Bùi Công Cường, Nguyễn Doãn Phước (2006), Hệ mờ, mạng nơron ứng dụng, Nhà xuất Khoa học kỹ thuật [2] Đường Võ Hùng (2014), "Ứng dụng giải thuật Tabu cho toán cân dây chuyền sản xuất dạng 2", tạp chí phát triển KH&CN, tập 14, số [3] Huỳnh Văn Nam (1999), Một sở đại số cho logic mờ Zadeh tính toán từ, Luận án tiến sĩ khoa học, Trường Đại học Bách khoa Hà Nội [4] Nguyễn Tấn Trần Minh Khang, Triệu Tráng Khôn, Đặng Thị Thanh Nguyên, Trần Thị Huệ Nương (2011), “Khảo sát số giải thuật Tabu giải toán Xếp thời khóa biểu”, Tạp chí trường ĐH Sài Gòn [5] Phan Tấn Quốc Nguyễn Đức Nghĩa (2013), "Thuật toán tìm kiếm TABU giải toán khung với chi phí định tuyến nhỏ nhất", Tập V-1, Số 10 (30), tháng 12/2013, Các công trình nghiên cứu, phát triển ứng dụng CNTT-TT Tài liệu tiếng Anh [6] Angeline, P J (1995) Adaptive and self-adaptive evolutionary computations In Computational intelligence: a dynamic systems perspective [7] Babuška, R (2005) Perspectives of fuzzy systems and control Fuzzy clustering algorithms, 156(3), 432-444 [8] Bezdek, J C (1981) Pattern recognition with fuzzy objective function algorithms Kluwer Academic Publishers [9] Brimberg, J., Hansen, P., Mladenovic, N., & Taillard, E D (2000) Improvements and comparison of heuristics for solving the uncapacitated multisource Weber problem Operations Research, 48(3), 444-460 78 [10] Du Merle, O., Hansen, P., Jaumard, B., & Mladenovic, N (1999) An interior point algorithm for minimum sum-of-squares clustering SIAM Journal on Scientific Computing, 21(4), 1485-1505 [11] Fischetti, M., Lancia, G., & Serafini, P (2002) Exact algorithms for minimum routing cost trees Networks, 39(3), 161-173 [12] Hall, L O., Ozyurt, I B., & Bezdek, J C (1999) Clustering with a genetically optimized approach Evolutionary Computation, IEEE Transactions on, 3(2), 103-112 [13] Hansen, P., & Jaumard, B (1997) Cluster analysis and mathematical programming Mathematical programming, 79(1-3), 191-215 [14] Hansen, P., & Mladenović, N (1999) An introduction to variable neighborhood search (pp 433-458) Springer US [15] Hansen, P., & Mladenović, N (2001) J-means: a new local search heuristic for minimum sum of squares clustering Pattern recognition, 34(2), 405413 [16] Hansen, P., & Mladenović, N (2001) Variable neighborhood search: Principles and applications European journal of operational research, 130(3), 449-467 [17] Ho, N C., & Wechler, W (1990) Hedge algebras: an algebraic approach to structure of sets of linguistic truth values Fuzzy sets and systems, 35(3), 281293 [18] Ho, N C., & Wechler, W (1992) Extended hedge algebras and their application to fuzzy logic Fuzzy sets and systems, 52(3), 259-281 [19] Horst, R., & Tuy, H (1996) Global optimization: Deterministic approaches Springer Science & Business Media [20] Mladenović, N., & Hansen, P (1997) Variable neighborhood search.Computers & Operations Research, 24(11), 1097-1100 79 [21] Mustafa Mohammed Rashid (2013), Tabu search, University of Gaziantep [22] Siddique, N., & Adeli, H (2013) Computational intelligence: synergies of fuzzy logic, neural networks and evolutionary computing John Wiley & Sons [23] Stefanowski, J (2009) Data Mining-Clustering University of Technology, Poland [24] Sri Phani Venkata Siva Krishna Madani (2010), Fuzzy Clustering Analysis, Blekinge Institute of Technology [25] Zadeh, L A (1965) Fuzzy sets Information and control, 8(3), 338-353 [26] http://www.rci.rutgers.edu/~cabrera/sc/cs8/cs8.html 80 [...]... bày về khái niệm tập mờ, phân cụm mờ, thuật toán phân cụm mờ và thuật toán kinh điển FCM Trong chương 2 luận văn sẽ trình bày các thuật toán tối ưu tiến hóa cho bài toán phân cụm mờ xuất phát từ cơ sở lý thuyết chương 1 24 CHƯƠNG 2: CÁC THUẬT TOÁN TỐI ƯU TIẾN HÓA CHO PHÂN CỤM MỜ 2.1 Tính toán tiến hóa Trên trái đất sự sống rất đa dạng có hàng triệu loài, mỗi loài có những hành vi và đặc điểm riêng Tất... vấn đề phân cụm trên tập mờ đó là thuật toán Fuzzy C – Means (FCM) Từ thuật toán này chúng tôi sẽ khảo sát các thuật toán tối ưu tiến hóa cho bài toán phân cụm mờ Chương 2: Các thuật toán tối ưu tiến hóa cho phân cụm mờ Trong chương này, các khái niệm cơ bản về tối ưu tiến hóa sẽ được nhắc lại ở đầu chương Tiếp theo, chúng tôi sẽ trình bày thuật toán Fuzzy J – Means (FJM) được phát triển từ thuật toán. .. cụm, và hàm mục tiêu của bài toán hay cách thức phân chia dữ liệu vẫn được sử 1 dụng chung cho mọi bài toán Để xác định nghiệm tối ưu toàn cục của bài toán phân cụm, các thuật toán tối ưu tiến hóa như thuật toán di truyền, tối ưu bầy đàn, v.v được áp dụng trong việc tìm nghiệm tối ưu toàn cục của bài toán tối ưu Và trong khuôn khổ luận văn này sẽ tìm hiểu vấn đề đó trên cơ sở khảo sát một số thuật toán. .. (PSO) Nhận xét chung các thuật toán cũng được nhắc trong chương này Chương 3: So sánh hiệu năng thuật toán tối ưu tiến hoá Trong chương này, chúng tôi cài đặt và đánh giá hiệu năng các thuật toán: FCM, FJM, VNS và FPSO theo các tiêu chí về chất lượng phân cụm thông qua giá trị hàm mục tiêu và thời gian tính toán Từ đây, hiệu quả của các thuật toán tối ưu tiến hóa cho phân cụm mờ được khẳng định 3 4... tiết về các chức năng chính của bài toán phân tích nhu cầu khách hàng 2 3/ BỐ CỤC CỦA LUẬN VĂN Luận văn gồm 3 chương, có phần mở đầu, phần kết luận, phần mục lục, phần tài liệu tham khảo Các nội dung cơ bản của luận văn được trình bày theo cấu trúc như sau: Chương 1: Tổng quan về phân cụm mờ Trong chương này, luận văn sẽ trình bày tổng quan về tập mờ, bài toán phân cụm và phân cụm mờ và thuật toán. .. khách hàng và mức độ hài lòng về sản phẩm và dịch vụ của doanh nghiệp Cụ thể với một cơ sở dữ liệu mẫu về thống kê doanh doanh số bán hàng của một công ty kinh doanh thiết bị y tế cho khoảng 500 bệnh viện [26] được sử dụng làm dữ liệu đầu vào cho các thuật toán trên Qua đây, tính hiệu quả của các thuật toán tối ưu tiến hóa cho bài toán phân cụm mờ theo các tiêu chí về chất lượng và thời gian tính toán. .. thuật toán này sẽ được áp dụng cho bài toán phân tích nhu cầu khách hàng – là mục tiêu quan trọng của bất kỳ doanh nghiệp nào trong việc xác định các khách hàng tiềm năng, nhu cầu của nhóm khách hàng đó và mức độ hài lòng về sản phẩm và dịch vụ Từ đó hỗ trợ doanh nghiệp đưa ra quyết định trong chiếm lược kinh doanh trong tương lai dựa vào kết quả của quá trình phân tích khách hàng tiềm năng, nhu cầu của. .. toán tối ưu tiến hóa cho bài toán phân cụm mờ, cụ thể là thuật toán Fuzzy J Means, Variable Neighbourhood Search và Fuzzy Particle Swarm Optimization 2/ MỤC ĐÍCH CỦA LUẬN VĂN Trong luận văn này chúng tôi khảo sát môt số thuật toán tối ưu tiến hóa cho bài toán phân cụm mờ, cụ thể là thuật toán Fuzzy J – Means (FJM), Variable Neighbourhood Search (VNS) và Fuzzy Particle Swarm Optimization (FPSO) Các thuật. .. dữ liệu và xử lý dữ liệu lớn là kỹ thuật phân cụm dữ liệu Phân cụm đặc biệt hiệu quả khi ta không biết về thông tin của các cụm, hoặc khi ta quan tâm tới những thuộc tính của cụm mà chưa biết hoặc biết rất ít về những thông tin đó Phân cụm được coi như một công cụ độc lập để xem xét phân bố dữ liệu, làm bước tiền xử lý cho các thuật toán khác Việc phân cụm dữ liệu có rất nhiều ứng dụng như trong lập... Một số phương pháp phân cụm điển hình Dựa trên cách tiếp cận và thuật toán sử dụng, người ta phân các thuật toán phân cụm theo các phương pháp chính sau: - Phân cụm phân hoạch - Phân cụm phân cấp - Phân cụm dựa trên mật độ - Phân cụm dựa trên lưới - Phân cụm dựa trên mô hình - Phân cụm có ràng buộc 11 1.2.3 Các bước phân cụm - Chọn lựa đặc trưng: Các đặc trưng phải được chọn lựa một cách hợp lý để có ... TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NHƯ NA VỀ TÍNH HIỆU QUẢ CỦA CÁC THUẬT TOÁN TỐI ƯU TIẾN HÓA CHO PHÂN CỤM MỜ VÀ ỨNG DỤNG TRONG PHÂN TÍCH NHU CẦU KHÁCH HÀNG Ngành: Công nghệ thông tin Chuyên ngành:... toán tối ưu tiến hóa cho toán phân cụm mờ Chương 2: Các thuật toán tối ưu tiến hóa cho phân cụm mờ Trong chương này, khái niệm tối ưu tiến hóa nhắc lại đầu chương Tiếp theo, trình bày thuật toán. .. toán phân cụm mờ thuật toán kinh điển FCM Trong chương luận văn trình bày thuật toán tối ưu tiến hóa cho toán phân cụm mờ xuất phát từ sở lý thuyết chương 24 CHƯƠNG 2: CÁC THUẬT TOÁN TỐI ƯU TIẾN