Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 70 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
70
Dung lượng
1,74 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐỖ THỊ PHƢƠNG LAN ỨNG DỤNG PHƢƠNG SAI TRONG PHÂN CỤM DỮ LIỆU MỜ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: PGS.TS Nguyễn Tân Ân THÁI NGUYÊN Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tôi xin cam đoan kết đạt luận văn sản phẩm cá nhân, không chép lại người khác Trong toàn nội dung luận văn, điều trình bày cá nhân tổng hợp từ nhiều nguồn tài liệu Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Tơi xin chịu trách nhiệm hình thức kỷ luật theo quy định cho lời cam đoan Thái Nguyên, tháng 10 năm 2013 Tác giả luận văn Đỗ Thị Phƣơng Lan Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Em xin chân thành cảm ơn thầy PGS.TS Nguyễn Tân Ân tận tình hướng dẫn khoa học bảo em hoàn thành tốt luận văn tốt nghiệp Em xin bày gửi lời cảm ơn tới thầy giáo, cô giáo bảo truyền đạt kiến thức cho em suốt trình học tập nghiên cứu Thái Nguyên, tháng 10 năm 2013 Tác giả luận văn Đỗ Thị Phƣơng Lan Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT v DANH MỤC CÁC HÌNH vi DANH MỤC CÁC BẢNG vii CHƢƠNG 1: BÀI TOÁN PHÂN CỤM DỮ LIỆU 1.1 Khái quát chung 1.2 Các kiểu liệu độ đo khoảng cách 1.2.1 Các kiểu liệu 1.2.2 Độ đo tương tự phi tương tự 1.2.3 Các biến tỷ lệ khoảng cách 1.2.4 Các biến nhị phân 11 1.2.5 Các biến tên, có thứ tự dựa tỷ lệ 14 1.2.6 Các biến có pha trộn kiểu 16 1.3 Các đặc trưng để phân cụm liệu 18 1.3.1 Các yêu cầu phân cụm liệu 18 1.3.2 Các đặc trưng để phân cụm liệu 20 1.4 Những phương pháp tiếp cận phân cụm liệu 21 1.4.1 Phương pháp phân cụm phân hoạch 21 1.4.2 Phương pháp phân cụm phân cấp 22 1.4.3 Phương pháp phân cụm dựa mật độ 24 1.4.4 Phương pháp phân cụm dựa mô hình 25 1.4.5 Phương pháp phân cụm dựa lưới 25 1.4.6 Phương pháp phân cụm có liệu ràng buộc 26 Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ iv 1.5 Các ứng dụng phân cụm liệu 28 1.6 Kết luận 28 CHƢƠNG 2: ỨNG DỤNG PHƢƠNG SAI TRONG PHÂN CỤM DỮ LIỆU MỜ 30 2.1 Thuật toán Fuzzy C-Means chuẩn 30 2.2 Thuật toán Fuzzy C-Means cải tiến 34 2.2.1 Cấu trúc khoảng cách 34 2.2.2 Thuật toán Fuzzy C-Means cải tiến 37 2.3 Kết luận 51 CHƢƠNG 3: CHƢƠNG TRÌNH THỰC NGHIỆM 52 3.1 Giới thiệu toán 52 3.2 Thiết kế chương trình 55 KẾT LUẬN 61 TÀI LIỆU THAM KHẢO 62 Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ v DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT FCM : Fuzzy C-Means CSDL : Cơ sở liệu PCDL : Phân cụm liệu KPDL : Khai phá liệu Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ vi DANH MỤC CÁC HÌNH Hình 1.1: Ví dụ phân cụm liệu Hình 1.2: So sánh khoảng cách Euclid khoảng cách Manhattan 11 Hình 1.3: Các bước trình phân cụm 21 Hình 1.4: chiến lược phân cụm phân cấp 23 Hình 1.5: Các cụm liệu khám phá Cure 24 Hình 1.6: Cấu trúc phân cụm liệu dựa lưới 26 Hình 1.7: Các cách mà cụm đưa 27 Hình 2.1: Ví dụ thể giới hạn khoảng cách Euclid dựng hình theo hàm Gaussian 36 Hình 2.2: Phân cụm sử dụng thuật toán FCM chuẩn 48 Hình 2.3: Phân cụm sử dụng thuật tốn FCM cải tiến 48 Hình 2.4: Khoảng cách từ cụm liệu tới trung tâm cụm sử dụng khoảng cách (2.7) trường hợp thuật tốn FCM chuẩn với tập hợp ba cụm 48 Hình 2.5: Khoảng cách từ cụm liệu tới trung tâm cụm sử dụng khoảng cách (2.7) trường hợp sử dụng thuật toán FCM cải tiến với tập hợp ba cụm 49 Hình 2.6: Khoảng cách từ cụm liệu tới trung tâm cụm sử dụng khoảng cách (2.7) trường hợp thuật toán FCM chuẩn với tập hợp hai cụm 49 Hình 2.7: Khoảng cách từ cụm liệu tới trung tâm cụm sử dụng khoảng cách (2.7) trường hợp thuật toán FCM cải tiến với tập hợp hai cụm 50 Hình 3.1 Gan thể người 52 Hình 3.2: Giao diện thực chương trình 57 Hình 3.3: Chức khỏi chương trình 58 Hình 3.4: Cập nhật danh sách bệnh nhân 58 Hình 3.5: Thiết lập thơng số đầu vào để phân cụm 58 Hình 3.6: Quá trình phân cụm 59 Hình 3.7: Kết phân cụm 59 Hình 3.8: Đưa kết tốn giấy 60 Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ vii DANH MỤC CÁC BẢNG Bảng 1.1: Bảng ngẫu nhiên cho biến nhị phân 12 Bảng 1.2: Bảng quan hệ chứa hầu hết thuộc tính nhị phân 13 Bảng 2.1: Thuật toán FCM 34 Bảng 2.2: Bảng thuật toán FCM cải tiến 46 Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ MỞ ĐẦU Ngày nay, với phát triển công nghệ thông tin lượng thơng tin mà người thu thập ngày lớn Trong kho liệu khổng lồ chứa kho tàng tri thức quý báu Con người nhận điều từ phương pháp để khai thác liệu đời Trong khai phá liệu (KPDL), phân cụm liệu (PCDL) kỹ thuật nghiên cứu mở rộng với nhiều khả ứng dụng thực tế Phân cụm đối tượng để đối tượng cụm nhận được quan tâm giống nhau, chịu phương pháp tác động giống Ví dụ phân cụm học sinh để học sinh cụm nhận phương pháp giáo dục Phân cụm ngân hàng để ngân hàng cụm nhận đầu tư giống nhau… Như vậy, phân cụm việc khó Mỗi đối tượng tham gia vào trình phân cụm thường đặc trưng nhiều thuộc tính Dựa vào giá trị thuộc tính đó, qua phương pháp thích hợp, người ta chia đối tượng vào cụm khác cho hai đối tượng cụm phải giống đối tượng cụm so với đối tượng cụm khác Trong phân cụm việc xác định mức độ giống hai đối tượng có ảnh hưởng lớn tới chất lượng phân cụm Trong trường hợp đối tượng biểu diễn nhiều thuộc tính, số thuộc tính lại thuộc tính mờ, việc biểu diễn đối tượng, việc xác định độ giống đối tượng phức tạp Khi hệ thống phân cụm phải hệ thống xử lý tín hiệu mờ Đã có nhiều phương pháp PCDL, nhiên khơng có phương pháp đủ tổng qt để mang lại hiệu tốt cho trường hợp Do tầm quan Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ trọng phân cụm, người ta tìm kiếm phương pháp phân cụm cải thiện phương pháp phân cụm có nhằm nâng cao hiệu phân cụm Luận văn trình bày số vấn đề PCDL - kỹ thuật để KPDL Đây hướng nghiên cứu có triển vọng sơ lược việc tìm hiểu khai thác thơng tin hữu ích cịn tiềm ẩn hiểu ý nghĩa thực tiễn liệu Trong khuôn khổ luận văn thạc sỹ, chọn đề tài: “Ứng dụng phương sai phân cụm liệu mờ” nhằm kết hợp việc phân cụm với lý thuyết xác suất nhằm nâng cao hiệu phân cụm Luận văn trình bày chương: Chƣơng 1: Trình bày tổng quan tốn PCDL, kiểu liệu số kỹ thuật tiếp cận PCDL Qua ta thấy đƣợc ứng dụng PCDL hoạt động đời sống xã hội; Chƣơng 2: Giới thiệu, phân tích đánh giá thuật tốn Fuzzy CMeans (FCM) chuẩn thuật toán FCM cải tiến; Chƣơng 3: Demo chƣơng trình thử nghiệm Kết luận: Tóm lược vấn đề tìm hiểu luận văn vấn đề liên quan luận văn, đưa phương hướng nghiên cứu Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 48 Trong ví dụ sau: liệu sinh ngẫu nhiên quanh trung tâm cụm hình 2.2 Có thể biểu thị liệu phương sai, biểu thị hình 2.2 hình 2.3 kết sử dụng thuật tốn FCM chuẩn thuật tốn FCM cải tiến Hình 2.2: Phân cụm sử dụng thuật tốn FCM chuẩn Hình 2.3: Phân cụm sử dụng thuật toán FCM cải tiến Đặc biệt, liệu, xác định cụm mà thuộc vào theo ma trận U cách xác định cụm thứ j Uij đạt cực đại, tức xác định liệu i Sử dụng vịng trịn, ký hiệu + hình vuông để thể cho cụm, biểu thị vị trí trung tâm cụm cách in đậm theo ký hiệu FCM chuẩn hình 2.2 FCM cải tiến hình 2.3 Hình 2.4: Khoảng cách từ cụm liệu tới trung tâm cụm sử dụng khoảng cách (2.7) trường hợp thuật toán FCM chuẩn với tập hợp ba cụm Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 49 Hình 2.5: Khoảng cách từ cụm liệu tới trung tâm cụm sử dụng khoảng cách (2.7) trường hợp sử dụng thuật toán FCM cải tiến với tập hợp ba cụm Để giải khắc phục vấn đề này, hình 2.4 hình 2.5, khoảng cách từ liệu tới trung tâm cụm 1, 2, theo khoảng cách biểu thức (2.7) Các giá trị khoảng cách chuẩn hóa khoảng đơn vị Nó thể đồ thị cụm gắn liền với liệu theo ma trận U đề cập trước Trong hình này, khoảng cách tới cụm biểu thị đường liên tục, khoảng cách tới cụm biểu thị đường đứt quãng, khoảng cách tới cụm biểu thị đường liên tục đậm Hình 2.6: Khoảng cách từ cụm liệu tới trung tâm cụm sử dụng khoảng cách (2.7) trường hợp thuật toán FCM chuẩn với tập hợp hai cụm Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 50 Hình 2.7: Khoảng cách từ cụm liệu tới trung tâm cụm sử dụng khoảng cách (2.7) trường hợp thuật toán FCM cải tiến với tập hợp hai cụm Với thể đồ thị này, cần ý thuật toán FCM chuẩn bỏ qua (không phân cụm) mẫu (mẫu 10) ta thấy trực tiếp hình liệu không liên kết với cụm mà khoảng cách từ liệu tới cụm nhỏ nhất; FCM cải tiến khơng có nhược điểm Hình 2.6 2.7 kết giống xử lý phân làm cụm Cụ thể, hàm thành viên Gaussian sinh ngẫu nhiên quanh cụm, số liệu có trị số trung bình giống Hơn nữa, hai hàm thành viên Gaussian sinh Bảng sau cho ta đánh giá biểu thị hai thuật toán FCM chuẩn FCM cải tiến Bảng 2.3: So sánh giá trị kết thuật toán FCM chuẩn FCM cải tiến FCM chuẩn Trường hợp 1: phân cụm Trường hợp 2: phân cụm Số hóa trung tâm học liệu FCM cải tiến Số lượng lặp lại 09 04 H(U,c) 0,42 0,14 Số lượng lặp lại 07 03 H(U,c) 0,31 0,13 http://www.lrc-tnu.edu.vn/ 51 Ngược lại, có phần tử bị loại nhầm trường hợp tập cụm mờ chuẩn, tất mẫu phân cụm cách xấp xỉ theo khoảng cách (2.7) việc phân cụm mờ cải tiến[13] 2.3 Kết luận Thuật toán FCM chuẩn áp dụng thành công giải số lớn toán PCDL xử lý ảnh, y học,… Tuy nhiên nhược điểm lớn FCM nhạy cảm với nhiễu phần tử ngoại lai liệu, tức trung tâm cụm nằm xa với trung tâm thực cụm vài liệu khơng thuộc cụm liệu hết Thuật tốn FCM cải tiến đề xuất cách thay khoảng cách Euclid chuẩn khoảng cách phân kỳ Điều cho phép tính tốn phương sai-hiệp phương sai liệu dẫn tới trọng tâm, mà trọng tâm đóng góp vào thành phần phương sai - hiệp phương sai Điều xây dựng nên cầu nối tới khoảng cách xác suất, thường sử dụng lý thuyết thơng tin, xây dựng góp phần kết nối ngành Sự tối ưu hóa hàm mục tiêu kiểm tra Kết nhận dạng tâm cụm thành phần thứ k tâm cụm phụ thuộc vào thành phần thứ k liệu Đối với thành phần, vấn đề trường hợp phương sai liệu vào không nhau, cách giải phương trình bậc bốn, phương trình mà nghiệm chứng minh dải liệu Đối với trường hợp phương sai liệu vào nhau, phương sai thành phần liệu vào nhau, nghiệm với tư cách phần tử mẫu chọn làm tâm cụm (khơng có phương sai) trùng với nghiệm thuật tốn FCM chuẩn phương sai xác định phép Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 52 CHƢƠNG 3: CHƢƠNG TRÌNH THỰC NGHIỆM 3.1 Giới thiệu tốn Gan quan lớn thứ hai thể (sau da) Gan đóng nhiều vai trị quan trọng khác việc bảo tồn sức khỏe Tùy theo kích thước trọng lượng cá nhân, gan có sức nặng từ 1.100 đến 1.800 gram Gan phụ nữ nhỏ gan đàn ông Gan nằm lồng ngực phải, cách phổi hồnh cách mơ Theo truyền thống, gan chia thành thùy chính), thùy phải thùy trái, dựa theo vị trí dây chằng liềm Dây chằng nối liền gan với hoành cách mô thành bụng trước Tuy nhiên, phân chia không tương ứng với cấu gan, nên ngày nay, người ta chia gan thành khúc dựa vào phân phối mạch máu Hình 3.1 Gan thể người Gan bao bọc chung quanh vỏ bên chứa đựng nhiều dây thần kinh, tên Gibson's Capsule Với cấu hệ mạch phức tạp, gan xem quan kỳ diệu Tuy thế, tế bào gan khơng có dây thần kinh cảm giác, nên bị tổn thương, bệnh thường không gây triệu chứng Chỉ trừ trường hợp, gan bị "sưng phồng" lên, vỏ Gibson bị kéo căng ra, gây đau "tưng tức" khó chịu vùng bụng nằm bên phải, giáp giới với lồng ngực Ðây số trường hợp viêm gan cấp tính gan "sưng lớn" bị suy tim bên phải Gan Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 53 che chở bảo vệ xương sườn, nên trường hợp bị té ngã tai nạn, đỡ bị dập nát quan khác bụng tụy tạng, lách, v.v Gan quan thể lúc tiếp nhận máu từ nguồn khác nhau: 30% từ tim 70% từ tĩnh mạch cửa Máu từ tim với dưỡng khí nhiên liệu nuôi dưỡng tế bào gan Máu đến từ tĩnh mạch cửa nhận máu từ quan bao tử, lách, tụy tạng, túi mật, ruột non, ruột già, quan khác bụng Vì gan quan đầu tiên, tiếp nhận chất dinh dưỡng hóa tố khác hấp thụ từ hệ thống tiêu hóa, gan trở thành "nhà máy lọc máu" quan trọng thể Thức ăn tất nhiên liệu, thế, phải qua gan trước để lọc biến chế thành vật liệu khác Ðây nguyên nhân mà ung thư từ nhiều quan phận khác lan sang gan cách dễ dàng[7] Chức gan[7]: Gan đóng nhiều vai trị quan trọng việc bảo trì sức khỏe Gan quan để lọc độc tố Gan quan quan trọng việc chuyển hóa thức ăn dự trữ nhiên liệu nhiều dạng khác Gan quan bào chế số chất đạm, chất mật, chất acid mỡ, v.v Có nhiều bệnh lý gan như[9]: Viêm gan tượng viêm gan gây nên nhiều virus khác số độc chất, bệnh tự miễn di truyền Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 54 Xơ gan hình thành tổ chức xơ gan thay cho nhu mô gan bị chết Nguyên nhân gây chết tế bào gan kể viêm gan virus, ngộ độc rượu số hóa chất độc hại với gan khác Nhiễm huyết sắc tố bệnh di truyền gây nên tích trữ sắt thể cuối đưa đến tổn thương gan Ung thư gan: ung thư gan tiên phát ung thư đường mật ung thư di căn, thường từ ung thư đường tiêu hóa Bệnh Wilson: mộ bệnh lý di truyền gây nên tích trữ mức đồng thể Viêm đường mật xơ hóa tiên phát: bệnh lý viêm đường mật có chất tự miễn … Tổ chức Y tế Thế giới ước lượng có khoảng 350 triệu người mang siêu vi B toàn giới Riêng Việt Nam nghiên cứu gần cho thấy khoảng 10% - 15% dân số bị nhiễm siêu vi B Và Siêu vi B nguyên nhân hàng đầu gây bệnh xơ gan[10] Có cách để phân loại bệnh xơ gan, phân biệt dựa hình thái học phân loại theo nguyên nhân gây bệnh xơ gan[8] *) Theo hình thái học: có loại xơ gan: - Xơ gan cục tái tạo nhỏ (micro-nodular), có tên xơ gan cửa (portal cirrhosis), tên cũ xơ gan Laennec: cục tái tạo lại kích thước đặn, nhỏ, đường kính bé 5mm - Xơ gan cục tái tạo to (macro-nodular) gọi xơ gan sau hoại tử (postnecrotic) Các cục tái tạo to, nhỏ khơng đều, nhiều hịn cục to xen kẽ với vùng xẹp Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 55 - Xơ gan mật (biliary): gan thường màu xanh ứ mật, có nhiều đám mật ứ tiểu quản mật xoang (sinusoid) Các cục tái tạo mô xơ không rõ loại xơ gan trên, cục tái tạo nhỏ Về hình thái người ta cịn phân chia thành loại: xơ gan phì đại, xơ gan teo, xơ gan có lách to *) Phân loại theo nguyên nhân: - Xơ gan sau viêm gan virut B C - Xơ gan rượu - Xơ gan mật: tiên phát - thứ phát - Xơ gan hoá chất thuốc -… Nếu bác sĩ nghi ngờ người bệnh bị xơ gan ngồi việc chuẩn đốn mắt thường da vàng, mắt vàng, đau hạ sườn phải, bụng chướng, mệt mỏi,… người bệnh cần làm số xét nghiệm sau[11]: + Xét nghiệm máu gan + Xét nghiệm bilirubin + Siêu âm gan + Chụp cắt lớp vi tính (CT) + Chụp cộng hưởng từ (MRI) + Sinh thiết gan +… 3.2 Thiết kế chƣơng trình Chương trình thực nghiệm phân cụm bệnh nhân xơ gan thực dựa số liệu CSDL bệnh án bệnh xơ gan lưu trữ bệnh viện lớn Việt Nam năm 2005 Dữ liệu đầu vào: Một tệp liệu hồ sơ bệnh án bệnh xơ gan Mỗi bệnh án bao gồm nhiều triệu chứng Dữ liệu đầu ra: Đưa k cụm nhóm bệnh án để hỗ trợ việc điều trị cho bệnh nhân Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 56 Các triệu chứng bệnh án coi tập liệu hỗn hợp, xây dựng ba kiểu liệu là: thuộc tính số, thuộc tính thứ tự thuộc tính định danh Mỗi triệu chứng bao gồm thông tin tên triệu chứng, trọng số, kiểu liệu giá trị có triệu chứng Danh sách số triệu chứng thường tìm thấy bệnh xơ gan: Bảng 3.1 Một số triệu chứng bệnh xơ gan Tên triệu chứng Trọng số Kiểu liệu Hội chứng suy nhược thể (mệt mỏi, ăn, ngủ ít,… 100 Thứ tự Đau hạ sườn phải 100 Thứ tự Bụng chướng 50 Thứ tự Hoàng đảm (vàng da, vàng mắt) 50 Thứ tự Bờ gan 100 Thứ tự Lách 50 Thứ tự Dịch ổ bụng 150 Thứ tự Đường mật 20 Thứ tự Nồng độ Biliburin nước tiểu 59 Thứ tự 10 HGB (Nồng độ hemoglobin máu) 10 Số 11 Rối loại tiêu hóa 100 Định danh 12 … STT Số hóa trung tâm học liệu Các giá trị có Bình thường Thể Thể nhiều Khơng đau Hơi đau Đau Đau nhiều Khơng chướng Chướng Chướng nhiều Bình thường Thể Thể nhiều Bình thường Mấp mơ Rất thơ Bình thường Hơi to Rất to Khơng có Có Có nhiều Bình thường Giãn Giãn nhiều 1+ 2+ 3+ 110 - 450 Khơng Có http://www.lrc-tnu.edu.vn/ 57 Chương trình sử dụng thuật tốn FCM lập trình dựa ngơn ngữ lập trình C# Visual Studio 2010 hệ quản trị CSDL Microsoft SQL Server 2008 kết hợp với việc thiết kế giao diện sử dụng cơng cụ Developer Express Chương trình thực nghiệm phân cụm bệnh nhân xơ gan gồm chức năng: + Cập nhật bệnh nhân: thêm, sửa, xóa bệnh nhân + Thiết lập phân cụm: đưa thông tin để phân cụm số cụm cần phân, sai số cho phép, số mờ Sau thiết lập xong trình phân cụm ta xem bệnh nhân thuộc cụm Từ đưa pháp đồ điều trị bệnh giống Giao diện chạy chương trình là: Hình 3.2: Giao diện thực chương trình Khi khởi động chương trình chức cụm bệnh nhân hình ảnh sau phân cụm không thao tác, chức khác thao tác Khi muốn kết thúc chương trình nhấn chọn chức khỏi chương trình Một thơng báo nhấn Yes No để lựa chọn Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 58 Hình 3.3: Chức khỏi chương trình Hình 3.4: Cập nhật danh sách bệnh nhân Khi thiết lập trình phân cụm cần nhập thơng số như: số cụm (có giá trị lớn 2), tham số (có giá trị lớn 2), sai số (có giá trị từ đến 1) Hình 3.5: Thiết lập thông số đầu vào để phân cụm Theo chuyên gia nên phân chia thành cụm với tham số sai số 0.0001 để dễ dàng cho việc phân loại nhóm bệnh nhân xơ gan Ta Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 59 đưa kết danh sách bệnh nhân phân vào cụm danh sách trung tâm cụm: Hình 3.6: Quá trình phân cụm Hình 3.7: Kết phân cụm Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 60 Cho phép đưa kết toán giấy bao gồm thông số đầu vào, thông tin trung tâm cụm danh sách bệnh nhân phân cụm nhấn vào nút chức In kết quả: Hình 3.8: Đưa kết tốn giấy Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 61 KẾT LUẬN Trong q trình tìm hiểu hồn thành luận văn tốt nghiệp với đề tài “Ứng dụng phương sai phân cụm liệu mờ”, dù đạt kiến thức định, em nhận thấy PCDL KPDL nói chung PCDL mờ nói riêng lĩnh vực nghiên cứu rộng lớn nhiều triển vọng Đề tài có gắng tập trung tìm hiểu, nghiên cứu trình bày số kỹ thuật tiếp cận PCDL, trình bày thuật tốn FCM chuẩn số cải tiến thuật toán FCM cải tiến dựa phương pháp có, cài đặt thử nghiệm thuật toán FCM chuẩn dựa phương pháp có với ứng dụng phân cụm bệnh nhân xơ gan Tuy nhiên, hạn chế tài liệu thời gian nên em tìm hiểu số kỹ thuật điển hình phân cụm đặc biệt phân cụm mờ, cài đặt thử nghiệm thuật tốn FCM cịn số kỹ thuật khác chưa tìm hiểu khai thác, cài đặt thử nghiệm chưa áp dụng cho toán phân cụm tổng quát Trong thời gian tới, em tiếp tục nghiên cứu thêm số kỹ thuật phân cụm đặc biệt thuật toán phân cụm mờ kết hợp song song ứng dụng vào số toán thực tế Việt Nam Và hy vọng đưa kiến thức có từ đề tài sớm trở thành thực tế, phục vụ cho sống Học viên thực Đỗ Thị Phƣơng Lan Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ 62 TÀI LIỆU THAM KHẢO I Tiếng Việt [1] http://vi.wikipedia.org/wiki/Ph%C6%B0%C6%A1ng_sai [2] http://vi.wikipedia.org/wiki/Khai_ph%C3%A1_d%E1%BB%AF_li%E1 %BB%87u [3] http://vi.wikipedia.org/wiki/Gi%C3%A1_tr%E1%BB%8B_k%E1%BB% B3_v%E1%BB%8Dng [4] http://bis.net.vn/forums/p/366/628.aspx [5] http://vi.wikipedia.org/wiki/Ma_tr%E1%BA%ADn_hi%E1%BB%87p_p h% C6%B0%C6%A1ng_sai [6] http://vi.wikipedia.org/wiki/Hi%E1%BB%87p_ph%C6%B0%C6%A1ng _sai [7] http://maxreading.com/?chapter=33538 [8] http://phongkham12kimma.vn/phan-loai-benh-xo-gan/ [9] http://vi.wikipedia.org/wiki/Gan [10] http://vietbao.vn/Suc-khoe/Sieu-vi-B-Nguyen-nhan-hang-dau-gay-xogan/2131642550/250/ [11] http://suckhoe.24h.com.vn/xo-gan/chan-doan-va-xet-nghiem/cac-xetnghiem-chan-doan-benh-xo-gant1f0w43c570pc558a6691ht4.html#gsc.tab=0&gsc.q=Xo-an&gsc.page=1 [12].http://vi.wikipedia.org/wiki/Kho%E1%BA%A3ng_c%C3%A1ch_Manha ttan II Tiếng Anh [13] M Oussalah, Samia Nefti (2001), On the use of divergence distance in fuzzy clustering, vol (2008), 147 - 167 Số hóa trung tâm học liệu http://www.lrc-tnu.edu.vn/ ... phân cụm liệu 20 1.4 Những phương pháp tiếp cận phân cụm liệu 21 1.4.1 Phương pháp phân cụm phân hoạch 21 1.4.2 Phương pháp phân cụm phân cấp 22 1.4.3 Phương pháp phân cụm. .. lượng liệu khổng lồ thực tế[4] Trong KPDL phân cụm phương pháp quan trọng trình khai thác liệu[ 2] Chưa có khái niệm cụ thể phân cụm hiểu phân cụm liệu hay phân cụm, gọi phân tích cụm, phân tích phân. .. lược phân cụm phân cấp Trên thực tế, có nhiều trường hợp kết hợp hai phương pháp phân cụm phân hoạch phân cụm phân cấp, nghĩa kết thu phương pháp phân cấp cải tiến thơng qua bước phân cụm phân