Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 70 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
70
Dung lượng
1,42 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC VINH PHẠM THỊ THẮNG QUAN HỆ MỜ VÀ ỨNG DỤNG TRONG PHÂN CỤM ĐỐI TƯỢNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Nghệ An, tháng 8/2017 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC VINH PHẠM THỊ THẮNG QUAN HỆ MỜ VÀ ỨNG DỤNG TRONG PHÂN CỤM ĐỐI TƯỢNG Chuyên ngành: Công nghệ thông tin Mã số: 60 48 02 01 Người hướng dẫn: TS Phan Anh Phong Nghệ An, tháng 8/2017 LỜI CÁM ƠN Để hồn thành đề tài luận văn thạc sĩ cách hoàn chỉnh, bên cạnh cố gắng tích cực thân cịn có hướng dẫn nhiệt tình q Thầy Cơ, động viên ủng hộ gia đình bạn bè suốt thời gian học tập nghiên cứu thực luận văn thạc sĩ Tôi xin chân thành bày tỏ lòng biết ơn trân trọng đến TS Phan Anh Phong người thầy hướng dẫn thực đề tài, hết lòng giúp đỡ tạo điều kiện tốt cho tơi hồn thành luận văn Xin chân thành bày tỏ lòng biết ơn đến tồn thể q thầy khoa CNTT - Đại học Vinh tận tình truyền đạt kiến thức quý báu tạo điều kiện thuận lợi cho tơi suốt q trình học tập nghiên cứu thực đề tài luận văn Cuối xin chân thành cảm ơn đồng nghiệp, đơn vị công tác giúp đỡ tơi q trình học tập thực Luận văn Vinh , tháng năm 2017 Học viên Phạm Thị Thắng LỜI CAM ĐOAN Tôi xin cam đoan kết nghiên cứu có luận văn q trình tìm hiểu, nghiên cứu tơi hướng dẫn thầy giáo – TS Phan Anh Phong Nội dung luận văn có tham khảo, sử dụng thông tin, tài liệu từ nguồn liệt kê danh mục tài liệu tham khảo Các kết nghiên cứu đề tài trung thực chưa công bố đâu Học viên Phạm Thị Thắng MỤC LỤC MỞ ĐẦU 1 Sự cần thiết vấn đề nghiên cứu Mục tiêu nghiên cứu Đối tượng phạm vi nghiên Nội dung nghiên cứu Chương TỔNG QUAN VỀ TẬP MỜ VÀ PHÂN CỤM DỮ LIỆU 1.1 Tổng quan lý thuyết tập mờ 1.1.1 Các khái niệm 1.1.2 Các phép toán tập mờ 1.1.3 T-norm T-cornorm 10 1.1.4 Số mờ 12 1.1.5 Độ đo khoảng cách độ đo tương tự 14 1.2 Phân cụm liệu 16 1.2.1 Các phương pháp phân cụm 18 1.2.2 Tiếp cận phân cụm sử dụng tập mờ 22 1.3 Kết luận chương 23 Chương PHÂN CỤM ĐỐI TƯỢNG SỬ DỤNG QUAN HỆ MỜ 24 2.1 Quan hệ mờ 24 2.1.1 Các khái niệm 24 2.1.2 Quan hệ liên kết, hợp thành mờ 28 2.2 Bao đóng quan hệ mờ 31 2.3 Phân cụm đối tượng sử dụng quan hệ tương tự 35 2.4 Phân cụm đối tượng sử dụng quan hệ không tương tự 38 2.5 Kết luận chương 45 Chương MỘT SỐ THỬ NGHIỆM 46 3.1 Phân tích chiến lược cơng ty vận chuyển hàng hóa 46 3.1.1 Mơ tả tốn 46 3.1.2 Thực phân cụm cơng ty với số mờ hình thang 49 3.2 Phân tích tác động môi trường đến sức khỏe cảnh sát giao thông 54 KẾT LUẬN 60 TÀI LIỆU THAM KHẢO 61 DANH MỤC CÁC TỪ VIẾT TẮT Thuật ngữ Giải thích FCM Fuzzy C-means FCMs Phân cụm mờ Fuzzy C-means DANH MỤC CÁC BẢNG Bảng 3.1 Các yếu tố chiến lược tiêu chí nhà giao nhận hàng không Đài Loan 46 Bảng 3.2 Kết đánh giá công ty 51 Bảng 3.3 Kết đánh giá 30 công ty 52 Bảng 3.4 Giá trị L theo mức 53 DANH MỤC CÁC HÌNH VẼ Hình 1.1: Hàm thuộc µA( x) có mức chuyển đổi tuyến tính Hình 1.2: Hàm thuộc tập B Hình 1.3: Miền tin cậy miền xác định tập mờ A Hình 1.4: Tập bù A tập mờ A Hình 1.5: Hợp hai tập mờ có khơng gian Hình 1.6: Giao hai tập mờ có khơng gian Hình 1.7: Phép co phép dãn tập mờ 10 Hình 1.8: Số mờ Singleton 12 Hình 1.9: Số mờ tam giác 13 Hình 1.10: Số mờ hình thang 13 Hình 1.11: Phân cụm liệu 17 Hình 2.1 Quá trình (1) (2) tương đương 31 MỞ ĐẦU Sự cần thiết vấn đề nghiên cứu Khai phá liệu bước trình khám phá tri thức, gồm thuật toán khai thác liệu phù hợp nhằm tìm mẫu mơ hình liệu Nói cách khác, mục tiêu khai phá liệu tìm kiếm mẫu mơ hình tiềm ẩn sở liệu với khối lượng lớn liệu Phân cụm liệu kỹ thuật lớp toán khai phá liệu nhằm tìm kiếm, phát cụm, mẫu liệu tự nhiên quan trọng tập liệu lớn để từ cung cấp thơng tin, tri thức cho việc định Q trình nhóm tập đối tượng tương tự tập liệu vào cụm cho đối tượng thuộc cụm tương đồng đối tượng thuộc cụm khác không tương đồng Chính phân cụm cơng cụ phân loại hữu ích ứng dụng nhiều phân loại sản phẩm, phân loại bệnh tật, xây dựng chiến lược, nghiên cứu phân khúc thị trường lập kế hoạch kinh doanh Ngày nay, có nhiều tiếp cận nghiên cứu toán này, phân cụm sử dụng thống kê, xác suất Lý thuyết tập mờ tiếp cận phù hợp với liệu mờ, liệu khơng chắn, liệu ngơn ngữ… phương pháp phân cụm mờ nghiên cứu phát triển 20 năm qua Phương pháp phân cụm mờ trình bày Dunn, sau đó, Bezdek [3] phát triển thuật tốn phân cụm mờ (fuzzy c-means - FCMs) để phân loại đối tượng thành cụm với đối tượng Tuy nhiên FCM thường phải yêu cầu xác định số cụm c và tham số tính mờ m Để khắc phục nhược điểm phương pháp FCMs mà xem xét đồng cụm bỏ qua tài sản tách biệt, Wang cộng [10] đề xuất mở rộng FCMs để đối phó với vấn đề phân nhóm Các phương pháp dựa FCMs yêu cầu số cụm phải định, bất lợi Lee đề xuất thuật tốn phân cụm theo mức alpha, sau kết hợp cách tiếp cận xác định phù hợp số lượng cụm Klir Yuan [11] trình bày phương pháp phân cụm dựa mối quan hệ mờ để đối phó với vấn đề số cụm, mong muốn số lượng cụm không định Xuất phát với lý luận văn tập trung nghiên cứu “Quan hệ mờ ứng dụng phân cụm đối tượng” Mục tiêu nghiên cứu - Nghiên cứu tập mờ kỹ thuật phân cụm liệu - Nghiên cứu quan hệ mờ ứng dụng phân cụm liệu - Thực gom nhóm đối tượng sử dụng quan hệ tương tự quan hệ không tương tự Đối tượng phạm vi nghiên - Đối tượng nghiên cứu: + Lý thuyết tập mờ + Phân cụm liệu + Phân cụm đối tượng sử dụng quan hệ mờ - Phạm vi nghiên cứu Căn vào điều kiện khả thực đề tài sâu vào nghiên cứu phân cụm sử dụng quan hệ mờ, sau thực tính tốn liệu thử nghiệm nhằm phân cụm đối tượng Nội dung nghiên cứu - Về lý thuyết: + Khai phá liệu + Tập mờ quan hệ mờ + Các tiếp cận phân cụm liệu sử dụng tập mờ - Về thử nghiệm: + Thực phân cụm đối tượng sử dụng quan hệ mờ + Áp dụng phân cụm mẫu liệu 48 Dựa vào nhân tố tiêu chí tương ứng, công ty đánh giá nhãn ngôn ngữ tập W sau đây: W={VL, B.VL&L,L,B.L&M,M,M,B.M&H,H,B.H&V.H,VH} Trong đó: VL = thấp, VL&L = thấp thấp, L= thấp, B.L&M= Giữa thấp trung bình, M= trung bình, B.M&H= trung bình cao, H= cao, B.H&VH= Cao Rất Cao, VH= cao Trong toán này, sử dụng số mờ hình thang với tham số (c, a, b, d) để đặc tả nhãn ngơn ngữ (xem thêm hình 1.10 Chương 1), cụ thể là: VL = (0,0,0,0.2), B.VL& L = (0,0,0.2,0.4), L = (0,0.2, 0.2,0.4), B.L& M =(0,0.2,0.5,0.7), M = (0.3,0.5,0.5,0.7), B.M & H = (0.3,0.5,0.8,1), H = (0.6,0.8,0.8,1), B.H & VH = (0.6,0.8,1,1), VH = (0.8,1,1,1) Để xây dựng quan hệ mờ công ty, khái niệm mức độ phân biệt đề xuất Kaufmann Gupta sử dụng [7] Giả sử Ai=(ci,ai,bi,di) Ak=(ck,ak,bk,dk) hai số mờ hình thang tương ứng với nhãn ngơn ngữ tập W Ký hiệu D(Ai,Ak) khoảng cách số mờ hình thang Khi đó: D( Ai , Ak ) (| ai ak | | bk bk | d , Trong đó: ai ci (ai ci ), bi di (bi di ), ai ck (ak ck ), bk d k (b k d k ), [0,1] Đặt: h1 | ci ck | /(ci ck | | ak |), h2 | di d k | /(di d k | | bi bk |), Lúc này, D(Ai,Ak) chia thành trường hợp: Trường hợp 1: 49 Nếu ((ci < ck < ak ) ( ci > ck > ak)) ((bi < bk di < dk) (bi > bk di > dk)) D(Ai, Ak)= {|ci – ck| + |ai – ak| + |di – dk| + |bi – bk|}/2 Trường hợp 2: Nếu ((ck ≤ ci ≤ ak ) ( ci ≤ ck ak ≤ ai)) ((bi < bk di < dk) (bi > bk di > dk)) D(Ai, Ak)= {h1|ci – ck|+ (1 – h1)|ai – ak| + |di – dk| + |bi – bk|}/2 Trường hợp 3: Nếu ((ci < ck < ak ) ( ci > ck > ak)) ((bk ≤ bi di ≤ dk) (bi ≤ bk di ≥ dk)) D(Ai, Ak)= {|ci – ck|+ |ai – ak| + h2|di – dk| + (1h2)|bi – bk|}/2 Trường hợp 4: Nếu ((ck ≤ ci ≤ ak ) ( ci ≤ ck ak ≤ ai)) ((bk ≤ bi di ≤ dk) (bi ≤ bk di ≥ dk)) D(Ai, Ak)= {h1|ci – ck|+ (1 – h1)|ai – ak| + h2|di – dk| + (1- h2)|bi – bk|}/2 3.1.2 Thực phân cụm cơng ty với số mờ hình thang Giả sử có n đối tượng A1, A2 , Ai, An thuộc tính m (các yếu tố) B1, B2 , Bi, Bn Cho tập hợp X={ X1, X2 , Xi, Xn} Xi vector, tức Xi={ Xi1, Xi2 , Xij, Xim} Xij= (cij, aij, bij, dij), i=1,2 n; j=1,2 m thuộc tính Bj đối tượng thứ Ai Phương pháp phân cụm tóm tắt sau Bước Chuẩn hóa liệu thuộc tính Với thuộc tính ban đầu Xij, sau chuẩn hóa thành X ta thu tập : ij mờ hình thang sau: X : ij cij cj / t j , aij cj / t *j , bij c*j / t *j ,(dij cij* ) / t *j Trong đó, t *j d *j c*j , d *j max{dij}, i c*j min{cij} i 50 Bước Xây dựng quan hệ mờ R X Theo hàm tính khoảng cách hai số mờ hình thang, quan hệ mờ R thu là: m R( X i , X k ) d X ij: , X kj: j 1 Trong giá trị nghịch đảo khoảng cách lớn X, tức là: m max d X ij: , X kj: i ,k j 1 1 Bước Tìm bao đóng bắc cầu max-min củ RT cách áp dụng thuật toán 2.1 Bước Tìm tất cụm khả thi cách lấy giá trị thích hợp Để lựa chọn số cụm tốt phân cụm, tức chọn mức phù hợp, thử nghiệm sử dụng số L theo kết tài liệu [14] Với phân cụm bước ta sử dụng số L để xác định số lượng tốt ứng dụng L nhỏ phân cụm cách tách biệt đôi tượng cụm có tương đồng cao Bước Xác định phân cụm tốt Tính số theo cơng thức L Trong đó, T n d 51 Ai: đối tượng thứ i, h: số lượng cụm, n: số đối tượng cần phân cụm, m: số thuộc tính, X X i: ( X i:1 , X ij: , X im: ), : ij chuẩn hóa đối tượng Ai với tất thuộc tính, tức Vr: : vector trọng tâm cụm Cr, tức : Vr: (Vr:1 , Vrj: , Vrm ) Cr: cụm thứ r, d22 ( X ij: , Vrj: ): Khoảng cách X ij: Vrj: với tham số p=2, d22 ( X qj: , Vrj: ): Khoảng cách Vqj: Vrj: với tham số p=2 Vì tính tốn phức tạp cho 30 mẫu, đưa ví dụ đơn giản với mẫu để phân cụm sử dụng quan hệ tương tự (xem bảng 3.2) Bảng 3.2 Kết đánh giá công ty Bằng cách sử dụng bước phương pháp trên, mối quan hệ đối tượng thu ma trận R sau: 0.415 0.242 0.389 0.080 R 0.415 0.389 0.050 0.242 0.080 0.050 0.679 0.108 0.292 0.590 0.679 0.108 0.292 0.590 Sau đó, bước 3, ta tìm bao đóng max-min R, ta thu kết RT: 0.389 RT 0.415 0.590 0.679 0.389 0.415 0.590 0.679 0.389 0.389 0.389 0.389 0.415 0.415 0.389 0.415 0.590 0.389 0.415 0.590 52 Dựa đặc điểm ma trận RT, ta tìm thấy năm khoảng: [0, 0.389], (0.389, 0.415], (0.415, 0.590], (0.590, 0.679] (0.679, 1], phù hợp để tạo cụm theo mức Cuối cùng, cách lấy [0,1] thích hợp áp dụng nguyên tắc phân cụm theo R, nhóm chiến lược có liên quan đạt Chẳng hạn, với (0.590,0.679], R là: 1 0 R 0 0 1 0 1 0 0 0 0 0 Và nhóm chiến lược liên quan {C1, C5}, {C2}, {C3} {C4} Bảng 3.3 Kết đánh giá 30 công ty 53 Bảng 3.3 liệu đánh giá 30 công ty Sau chuyển đánh giá theo giá trị ngơn ngữ thành số mờ hình thang, sử dụng phương pháp phân cụm mờ trình bày để thực Với [0,1] thích hợp ta xác định số cụm số phân cụm L tương ứng với khoảng Các kết phân cụm thể Bảng 3.4, giá trị L nhỏ 30 công ty chia thành cụm Bảng 3.4 Giá trị L theo mức Khoảng Số cụm Giá trị L (0.4, 0.5) 1.565 (0.5, 0.6) 1.292 (0.6, 0.7) 0.099 (0.7, 0.8) 0.111 Theo kết phân tích tác giả tài liệu [], thơng tin cụ thể nhóm mơ tả sau: Nhóm 1: Chiến lược nâng cấp hiệu suất So với nhóm khác, đối tượng nhóm tập trung nhiều đến tiêu chí chiến lược cho nhóm khác Đặc biệt, tiêu chí "quản lý tổ chức" "công nghệ thông tin" quan trọng họ Nhóm 2: Chiến lược nguồn lực cốt lõi Có nhiều đối tượng thuộc nhóm Trong nhóm này, chiến lược "năng lực cốt lõi" 'Lợi khác biệt' Công nghệ định giá công nghệ thông tin không quan trọng họ Vì vậy, thấy cơng 54 ty thuộc nhóm trưởng thành có thị trường ổn định Vì thế, họ khơng tập trung vào cạnh tranh giá Nhóm 3: Chiến lược giá Trong nhóm này, giá chiến lược Các chiến lược 'Vũ khí cạnh tranh' “Đổi phát triển” không quan trọng họ Hoạt động tài nhóm khơng thực tốt Như vậy, cho thấy chiến lược giá khơng phải sách tốt thị trường hàng không Đài Loan Nhóm 4: Chiến lược phức tạp Đặc điểm nhóm khơng có chiến lược cụ thể để hoạt động Các nhà quản lý cho tất mục chiến lược quan trọng Và hoạt động tài nhóm khơng phải thành công ngành giao nhận hàng hàng không Nhóm 5: Chiến lược lợi khác biệt Lợi khác biệt chiến lược điều hành cho nhóm Chiến lược khác biệt giảm rủi ro cho khách hàng Trên sở nghiên cứu Thương mại Tồn cầu, an tồn hàng hố Vì vậy, nhóm tập trung vào việc theo dõi hàng hóa đảm bảo cho lơ hàng Sử dụng chiến lược này, công ty trẻ làm tăng lợi nhuận họ điều kiện để họ tiếp tục phát triển 3.2 Phân tích tác động mơi trường đến sức khỏe cảnh sát giao thông Trong toán này, sử dụng phương pháp phân cụm theo quan hệ tương tự để phân tích mối nguy từ môi trường làm việc đến sức khỏe cảnh sát giao thông Ấn Độ Cảnh sát giao thông nhóm dễ bị tổn thương dễ mắc bệnh đường hô hấp Vấn đề nghiêm trọng thành phố, khu thị có nhiễm khơng khí từ tơ thải mật độ 55 tham gia giao thông cao Sự ô nhiễm không khí khu vực thị tính toán dựa phân tán phân bố giao thông dân số Các nghiên cứu dịch tễ học nhiễm khơng khí có liên quan đến gia tăng bệnh tật số ca tử vong hô hấp bệnh tim mạch cao Tổ chức Y tế Thế giới (WHO) ước tính nhiễm khơng khí thị ngun nhân cho khoảng 800.000 người chết 4.6 triệu người giảm tuổi thọ tồn cầu (WHO, 2002) Giao thơng phần quan trọng sống đại Sự tự du lịch ngắn khoảng cách xa mở chân trời cho phát triển cá nhân hoạt động chuyên môn, làm tăng lựa chọn cho giải trí ngày lễ, cho phép tiếp xúc tốt người Sự phát triển kinh tế toàn khu vực phụ thuộc vào tiếp cận dễ dàng người dân hàng hoá đảm bảo công nghệ vận chuyển đại Do linh hoạt nó, vận tải đường phương thức vận tải chính, tơ phương tiện yêu thích phổ biến Thật khơng may, khía cạnh tích cực có liên quan chặt chẽ với nguy hiểm môi trường sức khoẻ người giao thông vận tải, đặc biệt giao thơng đường an tồn lao động hiệp hội Y tế (OSHA) thiết lập 90 dBA làm trung bình theo trọng số (TWA) tiếng ồn làm việc ngày Giới hạn theo Viện An toàn Sức khoẻ Lao động Quốc gia (NIOSH) 85 dBA (trung bình) Âm giao thông thành phố khoảng 60-100 dB người quan sát chặt chẽ Thính giác gây tiếng ồn (NIHL) trì, lặp lặp lại tiếp xúc với mức âm mức Nó tích luỹ thường khơng ý đến quan chức cảnh sát giao thông Ấn Độ phải chịu đựng âm thầm Các vấn đề sức khoẻ cho cảnh sát giao thông báo động đỏ chúng yêu cầu phải 56 đứng hàng phơi bày với tình trạng nhiễm xe cộ môi trường căng thẳng Một số bệnh ngày tăng cảnh sát giao thông bị chứng tĩnh mạch giãn, bệnh đau đớn thường phát triển áp lực cao đứng Bốn chuyên gia xem xét Bác sĩ, từ lĩnh vực khác nhau, chuyên gia ENT, bác sĩ đa khoa, nhà thần kinh học chuyên gia ung thư học Họ liệt kê điều sau: Chính bệnh mà người cảnh sát thường bị ảnh hưởng đạt đến mức độ định Bất kỳ hình thức tiếp xúc âm dẫn đến NIHL có đủ cường độ thời gian phơi sáng từ đến10 Tiếng ồn ảnh hưởng xấu dường làm thay đổi cân sinh thái Ô nhiễm tiếng ồn thành phố Ấn Độ coi vấn đề quan trọng xúc nhất, đa số tiếng ồn tiếng động Qua khảo sát với cảnh sát giao thơng Ấn Đơ, có loại bệnh sau đây: D1- Nghẹt thở khó thở: Cảm thấy khơng thoải mái thiếu khơng khí lành thở dốc đột ngột, khó thở D2-Ung thư phổi: Ung thư hình thành mơ phổi thường tế bào lót đường thở Hai loại ung thư phổi tế bào nhỏ ung thư phổi khơng phải tế bào nhỏ D3-Thính giác mệt mỏi: Mức độ tiếng ồn cao dẫn đến mệt mỏi Giảm độ nhạy, ngưỡng nghe sau tiếp xúc với âm D4-Buồn nôn: Sự buồn nôn bụng, tượng nơn mửa Buồn nơn gây nhiều nguyên nhân, bao gồm hệ thống bệnh (như bệnh cúm), thuốc, đau, tai 57 D5-Giãn tĩnh mạch: Các tĩnh mạch giãn mạch máu bị cong, mà bạn nhìn thấy bề mặt da Những tĩnh mạch thường xuất chân, chúng hình thành phận khác thể D6-Asthama: Suyễn bệnh phổi mãn tính (lâu dài) làm phồng thu hẹp đường thở Suyễn gây đợt thở khò khè thường xuyên (tiếng huýt sáo thở), ngực, thở hụt hơi, ho Ho thường xuất vào ban đêm sáng sớm D7-Viêm phế quản: Viêm phế quản chứng viêm lớp lót ống phế quản, mang khơng khí đến từ phổi Những người bị viêm phế quản thường ho chất nhờn dày, bị đổi màu D8-Điếc thần kinh điếc đột ngột: Điếc điếc đột ngột xuất thính giác khơng rõ ràng, nhanh chóng tai lúc qua nhiều ngày D9-Mất tập trung giao tiếp: Nếu tiếng ồn ảnh hưởng đến giao tiếp họ, họ ngừng nói chuyện, nội dung trò chuyện họ bị thay đổi, thường xuyên lặp lại Để giải toán này, số mờ tam giác dùng để biểu diễn nhãn ngôn ngữ khoảng cách cách Euclide hai số mờ tam giác dùng để xây dựng ma trận quan hệ mờ Khoảng cách Ơclit hai số mờ tam giác A = (a1, b1, c1) B(a2, b2, c2) định nghĩa là: D(A, B) 1/ 6[(a1 b1 ) 4(a2 b2 ) (a3 b3 ) ] Theo mô tả nhãn ngôn ngữ Li [6], số mờ tam giác định nghĩa sau: 58 Nhãn ngôn ngữ Số mờ hình tam giác Rất thấp (0,0,0.25) Thấp (0,0.25,0.5) Trung bình (0.25,0.5,0.75) Cao (0.5,0.75,1) Rất cao (0.75,1,1) Việc chuẩn hóa số mờ tam giác (a, b, c) định nghĩa tài liệu [6] là: bi ci ri max , max , max ^1 bi ci i = 1,2, m m số thuộc tính mờ D1 D2 D3 D4 D5 D6 D7 D8 D9 Xk1 H VL M H L L H L M Xk2 VH L M M L VL VH M M Xk3 H VL L M VL L H L H Xk4 VH L L H VL VL VH M H Bằng cách áp dụng bước 1, 2, thuật toán, ma trận quan hệ tương tự là: 0.0005 0.5090 0.7254 R 0.2399 0.1615 0.9235 0.4910 0.6010 0.0005 0.5090 0.7254 0.2399 0.1615 0.9235 0.4910 0.6010 0.0816 0.2039 0.0816 0.0816 0.0741 0.3877 0.2039 0.0816 0.5992 0.6939 0.3877 0.4776 0.6938 0.4495 0.2039 0.5992 0.3016 0.3018 0.6489 0.5992 0.7416 0.0816 0.6939 0.3016 0.3877 0.2079 0.3877 0.1606 0.0816 0.3877 0.3018 0.3877 0.1295 0.0816 0.3017 0.0741 0.4776 0.6489 0.2079 0.1295 0.5539 0.6489 0.3877 0.6938 0.5992 0.3877 0.0816 0.5539 0.6489 0.2039 0.4495 0.7416 0.1606 0.3017 0.6489 0.5992 59 0.3877 0.5992 0.7254 RT 0.5992 0.3877 0.9235 0.5992 0.7254 0.3877 0.5992 0.7254 0.5992 0.3877 0.9235 0.5992 0.3877 0.3877 0.3877 0.5992 0.3877 0.6939 0.3877 0.3877 0.3877 0.5992 0.3877 0.6939 0.3877 0.5992 0.5992 0.3877 0.7254 0.5992 0.3877 0.6939 0.5992 0.3877 0.5992 0.6939 0.3877 0.3877 0.3877 0.5992 0.3877 0.7254 0.3877 0.5992 0.3877 0.3877 0.3877 0.5992 0.3877 0.6939 0.5992 0.6939 0.3877 0.5992 0.3877 0.5992 0.7416 0.5992 0.3877 0.7254 0.5992 0.7254 0.3877 0.5992 0.7416 0.5992 0.3877 0.7254 0.5992 Dựa vào RT tìm thấy sáu khoảng sau (0,0.3877), (0.3877,0.5992), (0.5992,0.6939), (0.6939,0.7254), (0.7254,0.7416), (0.7416.0.9235) sử dụng để tạo cụm Giả sử lấy ma trận lát cắt R Các cụm {D1, D4.D7, D9}, {D3, D5, D8}, {D2}, {D6} Theo α = 0,6 loại bệnh nhóm lại sau Nhóm1: Trong nhóm có bốn chứng bệnh: ngạt thở buồn nôn, buồn nôn, viêm phế quản Tất bệnh nhóm nhiễm khơng khí tiếng ồn gây Nhóm 2: Trong nhóm bệnh cấp tính, mệt mỏi thính giác, điếc tạm thời gây ô nhiễm tiếng ồn Việc đứng lâu phố gây tĩnh mạch giãn tĩnh mạch, suy tĩnh mạch Nhóm 3: Bệnh ung thư phổi hen suyễn khơng nhóm lại, số người bị ảnh hưởng bệnh Nếu giá trị α nhỏ hai thuộc nhóm Đối với hai bệnh nguyên nhân chủ yếu ô nhiễm môi trường 60 KẾT LUẬN Như biết, phân cụm cơng cụ gom nhóm thật hữu ích Chính kỹ thuật ứng dụng nhiều phân loại sản phẩm, phân loại bệnh tật… hay tổng quát phân loại đối tượng dựa đặc điểm, đặc trưng chúng, để từ hỗ trợ định… Bản luận văn nghiên cứu kiến thức tập mờ, công cụ cho phép xử lý với liệu mờ, liệu ngơn ngữ theo ứng dụng quan hệ mờ phân cụm đối tượng, phân tích liệu Cụ thể hơn, luận văn trình bày ý nghĩa tập mờ, cách biểu diễn, phép toán, số mờ biểu diễn số mờ tiếp cận phân cụm mờ Trọng tâm luận văn nằm Chương - nghiên cứu quan hệ mờ tương tự, không tương tự, phép hợp thành xây dựng thuật tốn tính bao đóng quan hệ mờ dựa vào phép hợp thành max-min max-product Theo làm sở cho việc phân cụm đối tượng sử dụng quan hệ tương tự quan hệ khơng tương tự Một vài ví dụ thử nghiệm lựa chọn từ báo phân cụm đối tượng theo quan hệ mờ làm rõ ý nghĩa khoa học thực tiễn phương pháp tiếp cận (Chương 3) Một hướng nghiên cứu tương lai mở rộng cách phân cụm mờ với t-norm khác thử nghiệm ứng dụng toán lĩnh vực y học – lĩnh vực có nhiều liệu khơng xác, liệu không chắn, liệu ngôn ngữ 61 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Phan Anh Phong, Tập mờ loại hai đại số gia tử, Nhà xuất ĐH Vinh, 2016 [2] Nguyễn Trung Đức, Tiếp cận mờ phân cụm liệu, Luận văn Thạc sĩ, Đại học Quốc gia Hà Nội, 2013 Tiếng Anh [3] Timothy J Ross, Fuzzy logic with engineering Applications, University of New Mexico, USA, rd edition 2010 [4] H.J.Zimmermann: Fuzzy set theory-and its applications, th Edition, Kluwer Acad Pub, Dodrech, 2001 [5] Berkhin, P.P., A Survey of Clustering Data Mining Techniques, Heidelberger, Berlin, Germany, Springer Berlin Heidelberg, 2006 [6] Dr.A Praveen Prakash, Ms N Vanathi, “A New Fuzzy Clustering Method Based on Fuzzy Equivalence Relation”, 2014, [7] Gin-Shuh Liang, Tsung-Yu Chou, Tzeu-Chen Han, “Cluster analysis based on fuzzy equivalence relation”, European Journal of Operational Research 166 (2005) 160–171 [8] Miin-Shen Yang, Hsing-Mei Shih, “Cluster analysis based on fuzzy relations”, Fuzzy Sets And Systems, 2001 [9] Yuh-Yuan Guha, Miin-Shen Yang, Rung-Wei Poc “Establishing performance evaluation structures by fuzzy relation-based cluster analysis”, Computers and Mathematics with Applications 56 (2008) [10] Wen-Liang Hunga and De-Hua Chenb, “Clustering algorithm for proximity-relation matrix and its applications”, Journal of Applied Statistics, 2013 62 [11] G.J Klir, B Yuan, Fuzzy Sets and Fuzzy Logic Theory and Application, Prentice Hall PTR, Upper Saddle River, NJ, 1995 [12] H.S Lee, Automatic clustering of business process in business systems planning, European Journal of Operational Research 114 (1999) 354–362 [13] S Heilpern, Representation and application of fuzzy numbers, Fuzzy Sets and Systems 91 (1997) 259–268 [14] X.L Xie, G Beni, A validity measure for fuzzy clustering, IEEE Transportation of Pattern Analysis and Machine Intelligence 13 (1991) 841–847 ... pháp phân cụm liệu có phân cụm sử dụng tập mờ 24 Chương PHÂN CỤM ĐỐI TƯỢNG SỬ DỤNG QUAN HỆ MỜ 2.1 Quan hệ mờ Một khái niệm mở rộng quan trọng có nhiều ứng dụng lý thuyết mờ quan hệ mờ Các quan hệ. .. ứng dụng phân cụm đối tượng? ?? Mục tiêu nghiên cứu - Nghiên cứu tập mờ kỹ thuật phân cụm liệu - Nghiên cứu quan hệ mờ ứng dụng phân cụm liệu - Thực gom nhóm đối tượng sử dụng quan hệ tương tự quan. .. phân cụm liệu sử dụng tập mờ - Về thử nghiệm: + Thực phân cụm đối tượng sử dụng quan hệ mờ + Áp dụng phân cụm mẫu liệu Chương TỔNG QUAN VỀ TẬP MỜ VÀ PHÂN CỤM DỮ LIỆU 1.1 Tổng quan lý thuyết tập mờ