Tìm hiểu các phương pháp phân cụm dữ liệu ứng dụng xây dựng bản đồ phân bố bệnh trên địa bàn tỉnh thái nguyên

74 173 0
Tìm hiểu các phương pháp phân cụm dữ liệu ứng dụng xây dựng bản đồ phân bố bệnh trên địa bàn tỉnh thái nguyên

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG NGUYỄN MINH TÚ TÌM HIỂU CÁC PHƯƠNG PHÁP CỤM DỮ LIỆU ỨNG DỤNG XÂY DỰNG BẢN ĐỒ PHÂN BỐ BỆNH TRÊN ĐỊA BÀN TỈNH THÁI NGUYÊN Mã số: 60480101 Người hướng dẫn khoa học: TS NGUYỄN MINH HẢI LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 http://www.lrc.tnu.edu.vn LỜI CẢM ƠN Em xin chân thành cảm ơn Trường Đại học Công nghệ Thông tin Truyền thông – Đại học Thái Nguyên tạo điều kiện cho em thực luận văn Em xin gửi lời cảm ơn sâu sắc tới thầy giáo TS Nguyễn Hải Minh, trưởng khoa Công nghệ thông tn – Trường Đại học Công nghệ Thông tn Truyền thông – Đại học Thái Nguyên trực tếp hướng dẫn em trình thực luận văn Em xin gửi lời cảm ơn tới thầy, có ý kiến đóng góp bổ ích tạo điều kiện tốt cho em suốt thời gian thực luận văn Xin cảm ơn bạn học đồng khóa thường xuyên động viên, giúp đỡ tơi q trình học tập Cuối cùng, em xin gửi lời cảm ơn đến gia đình đồng nghiệp ủng hộ động viên dành cho em suốt trình học tập thực luận văn Thái Nguyên, tháng 11 năm 2015 Học viên Nguyễn Minh Tú http://www.lrc.tnu.edu.vn LỜI CAM ĐOAN Em xin cam đoan nội dung đồ án tốt nghiệp với tên đề tài “Tìm hiểu phương pháp phân cụm liệu ứng dụng xây dựng đồ phân bố bệnh địa bàn tỉnh Thái Nguyên” không chép nội dung từ luận văn khác, hay sản phẩm tương tự mà em làm Sản phẩm luận văn thân em tm hiểu xây dựng nên Nếu có sai em xin chịu hình thức kỷ luật Trường Đại học Công nghệ Thông tn Truyền thông – Đại học Thái Nguyên Thái Nguyên, tháng 11 năm 2015 Học viên Nguyễn Minh Tú http://www.lrc.tnu.edu.vn MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN iii MỤC LỤC iv DANH MỤC BẢNG vi DANH MỤC CÁC HÌNH VẼ vii MỞ MÔT SÔ KÊT QUA NGHIÊN CƯU KHAC CHƯƠNG I KHAI PHÁ DỮ LIỆU 1.1 Tổng quan khai phá liệu 1.2 Quá trình khám phá tri thức khai phá liệu 1.2.1 Quá trình khám phá tri thức 1.2.2 Quá trình khai phá liệu 1.3 Các kỹ thuật khai phá liệu 1.4 Môt sô thach thưc khai pha dư liêu 10 CHƯƠNG II PHÂN CUM DƯ LIÊU VA CAC THUÂT TOANPHÂN CUM 12 2.1 Khái niệm phân cụm liệu 13 2.1.1 Một số định nghĩa 13 2.1.2 Dữ liệu độ đo 13 2.2 Các yêu cầu phương pháp phân cụm liệu 14 2.3 Các kỹ thuật phân cụm 16 2.3.1 Các kỹ thuật phân cụm 16 2.3.2 Các kỹ thuật phân cụm khác 17 2.3.3 Một số têu chuẩn đánh giá hiệu phân cụm 23 2.4 Một số thuật toán phân cụm liệu 24 2.4.1 Các thuật toán phân cụm phân hoạch 24 2.4.2 Các thuật toán phân cụm phân cấp 32 2.4.3 Các thuật toán phân cụm dựa mật độ 38 http://www.lrc.tnu.edu.vn ĐẦU 2.4.3 Các thuật toán phân cụm dựa vào lưới 42 2.4.4 Các thuật toán phân cụm dựa mơ hình 44 CHƯƠNG 3: XÂY DƯNG BAN ĐÔ PHÂN BÔ BÊNH 46 3.1 Bài toán phân cụm liệu hồ sơ bệnh án 46 3.2 Dữ liệu têu chí xác định 46 3.2.1 Một số đặc điểm tập liệu gốc 46 3.2.2 Tiền xử lý liệu gốc 48 3.3 Lựa chọn phương pháp phân cụm 54 3.4 Kết phân cụm liệu mẫu 55 3.5 Biểu điễn kết phân bố bệnh đồ 61 KÊT LUÂN 63 TÀI LIỆU THAM KHẢO 65 http://www.lrc.tnu.edu.vn DANH MỤC BẢNG Bảng 3.1: Các loại bệnh ký hiệu 55 Bảng 3.2: Các khu vực hành ký hiệu 56 Bảng 3.3: Dữ liệu đầu vào cho phân cụm phân cấp 56 Bảng 3.4: Biểu diễn kết phân cụm chi tết 59 Bảng 3.5: Biểu diễn kết phân cụm theo têu chí bệnh 61 http://www.lrc.tnu.edu.vn DANH MỤC CÁC HÌNH VẼ Hình 1.1: Các giai đoạn trình khám phá tri thức Hình 1.2: Quá trình khai phá liệu Hình 2.1: Ví dụ phân cụm theo mật độ[4] 18 Hình 2.2: Cấu trúc phân cụm dựa lưới[4] 19 Hình 2.3: Ví dụ phân cụm dựa mơ hình[4] 20 Hình 2.4: Cách mà cụm đưa .22 Hình 2.5: Thuật tốn k-means 25 Hình 2.6: Sự thay đổi tâm cụm k-means có phần tử ngoại lai 28 Hình 2.7: Phân cụm phân cấp tập theo phương pháp “dưới lên” [4] 33 Hình 2.8: Single link 33 Hình 2.9: Complete link 33 Hình 2.10: Các bước AGNES[4] 35 Hình 2.11: Các bước DIANA[4] 36 Hình 2.12: Cấu trúc CF .37 Hình 2.13: Hình dạng cụm khám phá thuật tốn DBSCAN .40 Hình 2.14: Sắp xếp cụm OPTICS phụ thuộc vào [4] 41 Hình 3.1: Sơ đồ khối giải toán 46 Hình 3.2: Phân tch liệu gốc, thuộc tnh “HO TEN” 49 Hình 3.3: Dữ liệu gốc sau loại bỏ thuộc tnh thừa liệu trùng lặp 50 Hình 3.4: Phân tch liệu gốc, thuộc tnh “QUAN HUYEN” .51 Hình 3.5: Loại bỏ số giá trị thuộc tnh “QUAN HUYEN” 52 Hình 3.6: Dữ liệu trước sau lọc thuộc tính “CHUAN DOAN DAU RA” .53 Hình 3.7: Cấu phân bố liệu mẫu 58 Hình 3.8: Thiết lập tham số thuật toán K-means 58 Hình 3.9: Kết phân cụm chi tết 59 Hình 3.10: Kết phân cụm dựa loại bệnh .60 http://www.lrc.tnu.edu.vn Hình 3.11: Bản đồ phân bố bệnh khu vực 62 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn MỞ ĐẦU Đề tài tìm hiểu phương pháp phân cụm liệu, đánh giá ưu nhược điểm phương pháp để tm phương pháp phù hợp áp dụng tập liệu mẫu Kết dùng để xây dựng đồ phân bố bệnh địa bàn tỉnh Thái Nguyên nhằm hỗ trợ công tác lên kế hoạch dự trù sở vật chất, thuốc trang thiết bị khác cho trung tâm y tế Tỉnh Thái Nguyên tỉnh trung du miền núi thuộc vùng Đông Bắc Việt Nam với diện tích 3500 km dân số khoảng triệu người; bao gồm đơn vị hành chính: Thành phố Thái Ngun; Thị xã Sơng Cơng huyện: Phổ Yên, Phú Bình, Đồng Hỷ, Võ Nhai, Định Hóa, Đại Từ, Phú Lương Trong đó, tổng số gồm 180 xã, có 125 xã vùng cao miền núi, lại xã đồng trung du.Tỉnh Thái Nguyên có nhiều dân tộc anh em sinh sống Tuy nhiên, dân cư phân bố không đều, vùng cao vùng núi dân cư thưa thớt, thành thị đồng dân cư lại dày đặc Mật độ dân số thấp huyện Võ Nhai 72 người/ km , cao Thành phố Thái Nguyên với mật độ 1.260 người/ km Do khác biệt lớn cấu dân số, lối sống, trình độ dân trí nên có khác biệt đáng kể hình thức bệnh khu vực hành khác Nếu thơng tn hình thức bệnh vấn đề sức khỏe khu vực hành thu thập đầy đủ, sẽ giúp việc phân bổ nguồn lực hiệu để phát triển sách y tế cơng cộng cho khu vực khác Luận văn sử dụng kỹ thuật khai thác liệu để phân tch liệu y tế thuộc Đại học Y Dược Thái Nguyên trongbốn tháng đầu năm 2015 Hy vọng việc sử dụng công cụ cách hiệu phân tch điều tra hình thức bệnh khu vực hành khác Thái Nguyên để tếp tục xây dựng đồ y tế cho tỉnh Thái Nguyên http://www.lrc.tnu.edu.vn MÔT SÔ KÊT QUA NGHIÊN CƯU KHAC Ching-Kuo Wei et al [2] Nghiên cứu sử dụng kỹ thuật khai phá liệu điều tra loại bệnh khu vực hành khác phân tích khác khu vực hành để tiếp tục xây dựng đồ phân bố bệnh Nghiên cứu hy vọng giúp xây dựng tương lai chiến lược y tế phân bố nguồn lực cách thích hợp Lavrac [4] đề xuất số kỹ thuật khai thác liệu áp dụng y học, đặc biệt số kỹ thuật máy học bao gồm chế mà làm cho chúng phù hợp cho việc phân tch sở liệu y tế (nguồn gốc quy tắc mang tnh biểu tượng, sử dụng kiến thức nền, độ nhạy độ đặc hiệu giới thiệu gây ra) Tầm quan trọng thông dịch kết phân tch liệu thảo luận minh họa ứng dụng y tế chọn Lavrac et al [5] đề xuất phương pháp khai thác liệu công nghệ trực quan sử dụng để hỗ trợ việc định liên quan đến sức khỏe cộng đồng Slovenia.Mục đích nhằm khai thác sở liệu y tế công cộng để xác định khả đáp ứng dịch vụ y tế công cộng khu vực Các kết sử dụng để phát triển sách chăm sóc sức khỏe quan y tế http://www.lrc.tnu.edu.vn Hình 3.4: Phân tch liệu gốc, thuộc tnh “QUAN HUYEN” Sau lọc bỏ giá trị không cần thiết thuộc tnh “QUAN HUYEN” ta kết hình liệu giảm xuống 4452 ghi Hình 3.5: Loại bỏ số giá trị thuộc tnh “QUAN HUYEN” Tuy nhiên để liệu phù hợp với mục đích tốn, tếp tục loại bỏ bớt giá trị không phù hợp thuộc tnh “CHUAN DOAN DAU RA”: bệnh khơng phổ biến, có tnh chất cấp tnh, chấn thương, khơng phù hợp với u cầu tốn Hình thể liệu trước loại bỏ số giá trị thuộc tnh “CHUAN DOAN DAU RA”; lúc liệu 4452 ghi Kết liệu sau thực việc lọc bỏ liệu thể hình; liệu lúc gồm 2765 ghi Hình 3.6: Dữ liệu trước sau lọc thuộc tính “CHUAN DOAN DAU RA” Sau tến hành bước tền xử lý liệu gốc thu tập liệu với 2765 ghi; lưu trữ thông tn tên tuổi, khu vực sinh sống kết luận bệnh bệnh nhân Tập liệu dùng làm tập liệu mẫu để triển khai thuật toán phân cụm liệu cho bước tếp theo 3.3 Lựa chọn phương pháp phân cụm Bài toán sử dụng phương pháp phân cụm hai bước Trong bước thứ nhất, sử dụng thuật toán phân cụm phân cấp Agglomerative Hierarchical Clustering (AHC) để đưa cụm tốt Sau đó, sử dụng thuật toán phân cụm phân hoạch Kmeans để tếp thực phân cụm đưa kết Bước thứ nhất: Dùng thuật toán AHC để tến hành phân cụm Ban đầu, xem đối tượng cụm nhóm hai đối tượng gần thành cụm Lặp lại trình tất đối tượng nhóm vào cụm cuối Để xác định khoảng cách đối tượngta dùng nhiêu phương pháp Nhưng luận văn dụng công thưc Euclidean để xác định khoảng cách đó: dij = , (i,j = 1,2,….,n) dij:Khoảng cách đối tượng i j(Khoảng cách Euclidean khu vực hành chính) m: số lượng biến n: số lượng mẫu Các bước thực phân cụm: Chuyển đặc trưng, thuộc tính đối tượng vào ma trận khoảng cách Xem đối tượng cụm Gộp hai cụm gần nhất, dùng công thức Ecuclide Distance để xác định khoảng cách đối tượng, hai cụm gần hai cụm có khoảng cách nhỏ Cập nhật lại ma trận khoảng cách Lặp lại bước tất đối tượng gộp vào cụm Bước thứ hai: Tiếp tục sử dụng thuật toán k-means phân cụm phân hoạch để thực phân nhóm Các bước thực hiện: Chọn K tâm cho K cụm Mỗi cụm đại diện tâm cụm (Trong bước thực phân cụm phân cấp để định chọn số lượng cụm chọn tâm cụm) Tính khoảng cách đối tượng đến K tâm (dùng khoảng cách Euclidean) Nhóm đối tượng vào nhóm gần Xác định lại tâm cho nhóm Thực lại bước thứ hai khơng có thay đổi nhóm đối tượng Cuối sau thực thủ tục hai bước đưa kết phân cụm 3.4 Kết phân cụm liệu mẫu Dựa liệu mẫu têu chí ban đầu đặt việc phân tch liệu, xác định lăm loại bệnh phổ biến để đưa vào làm tiêu chí phân cụm xác định số mẫu liên quan đến bệnh Bảng 3.1: Các loai bệnh ký hiệu ICD Loai bệnh N20.1 Sỏi niệu quản N18 Suy thận mãn K29 Viêm dày tá tràng C34 Bướu ác phổi phế quản I10 Cao huyết áp Tiến hành phân cụm khu vực hành thuộc tỉnh Thái Nguyên Bảng 3.2: Các khu vực hành ký hiệu Ký hiệu Khu vực hành A TP Thái Nguyên B Huyện Đồng Hỷ C Huyện Phú Bình D Huyện Võ Nhai E Huyện Đại Từ F Huyện Định Hóa G Huyện Phú Lương H Huyện Phổ Yên I TX Sông Công Luận văn sử dụng phương pháp phân nhóm hai bước, ta xét kết phân nhóm bước A Bước thứ Xét têu chí số lượng mẫu bệnh khu vực hành làm têu chí đầu xác định liệu đầu vào Bảng 3.3: Dữ liệu đầu vào cho phân cụm phân cấp Khu vực N20.1 N18 K29 I10 C34 A (số lượng 23 mẫu) 20 43 32 27 B 19 11 13 13 C 17 D E 8 12 F 4 G 10 H 0 I 1 0 Kết phân cụm bước thứ nhất(thứ tự phân cụm): A, B, C, D, E, F, G, H, I A, B, C, D, E, (F,H), G, I A, B, C, (D,E), (F,H), G, I A, B, C, (D,E), ((F,H),I), G A, B, C, (D,E), (((F,H),I),G) A, B, (C,(D,E)), (((F,H),I),G) A, B, ((C,(D,E)),(((F,H),I),G))) A, (B,((C,(D,E)),(((F,H),I),G)))) (A,(B,((C, (D,E)),(((F,H),I),G))))) B Bước thứ hai Trong bước dùng thuật toán K-means để tến hành phân cụm dựa Data Mining Software WeKa Tập liệu thu sau bước tền xử lý liệu với 2700 ghi, đến bước cần lấy ghi liên quan đến loại bệnh phổ biến Dữ liệu cuối dùng để phân cụm bước tập liệu mẫu có tên ytn5b.final.arffbao gồm 350 bệnh nhân với ba thuộc tnh Cấu trúc phân bố liệu thể bảng Hình 3.7: Cấu phân bố liệu mẫu Dựa kết phân cụm bước thứ chọn số cụm Nhiệm vụ cần thực dùng thuật toán K-means để phân nhóm số bệnh nhân vào nhóm(cụm) dựa vào tương tự thuộc tnh họ Thiết lập tham số cho thuật toán K-means số cụm(K=5), lựa chọn phương pháp tnh khoảng cách(khoảng cách Euclidean), … hình dươi Hình 3.8: Thiết lập tham số thuật toán K-means Kết phân cụm chi tiết hình Hình 3.9: Kết phân cụm chi tiết Dựa vào kết phân cụm chi tết lấy từ phần mềm Weka ta xây dựng bảng biểu diễn kết Bảng 3.4: Biểu diễn kết phân cụm chi tiết Cụm Tâm cụm - TP Thái Nguyên - K29 (Viêm dày tá tràng) - Huyện Phú Bình - N20.1 (Sỏi niệu quản) - TP Thái Nguyên - N18 (Suy thận mãn) - Huyện Đại Từ - C34 (Bướu ác phổi phế quản) - Huyện Đồng Hỷ - N20.1 (Sỏi niệu quản) Số lượng mẫu % 183 52 48 14 48 14 51 14 22 Theo kết thể hình bảng 3.4, bệnh phổ biến khu vực viêm dày tá tràng(K29) với lượng người mắc bệnh nhiều tập trung khu vực TP Thái Nguyên Trong cụm thứ nhất, cụm có số lượng mẫu lớn chiếm 52% với tâm cụm TP Thái Nguyên (68%), bệnh phổ biến viêm dày tá tràng (K2950%), bệnh phổ biến tếp theo cao huyết áp (I10-22%), bệnh bướu ác phế quản phổi (C34-14%) sỏi niệu quản (N20.112%) Trong cụm thứ hai, tâm cụm thuộc huyện Phú Bình với bệnh phổ biến là: sỏi niệu quản (N20.1-52%), bệnh bướu ác phế quản phổi (C34-35%) bệnh suy thận mãn (N18-10%) Trong cụm thứ ba, tâm cụm nằm khu vực TP Thái Nguyên bệnh phổ biến bệnh suy thận mãn(N18-100%) Cụm thứ tư, tâm cụm thuộc khu vực huyện Đại Từ với bệnh phổ biến bệnh bướu ác phế quản phổi (C34-94%) Cụm thứ lăm, tâm cụm thuộc khu vực huyện Đồng Hỷ với bệnh phổ biến sỏi niệu quản (N20.1-86%) cao huyết áp(I10-13%) Dựa vào kết hình dung phân bố số bệnh phổ biến khu vực hành (cấp quận, huyện) tỉnh Thái Nguyên Tuy nhiên, cụm thứ cụm thứ ba có tâm cụm thuộc khu vực TP Thái Nguyên Với kết phân cụm chưa đáp ứng yêu cầu phân bố bệnh theo khu vực hành (cấp quận huyện) tỉnh Do ta tến hành phân cụm tập liệu mẫu theo têu chí “bệnh” để xem phân bố bệnh khu vực hành Kết phân cụm theo têu chí bệnh thể hiển hình dươi Hình 3.10: Kết phân cụm dựa loại bệnh Dựa vào kết phân cụm chi tết lấy từ phần mềm Weka ta xây dựng bảng biểu diễn kết Bảng 3.5: Biểu diễn kết phân cụm theo tiêu chí bệnh Cụm ICD K29 Bệnh Viêm dày tá tràng Khu vực Huyện Võ Nhai, huyện Định Hóa, TX Sơng Cơng, Huyện Phổ n, Huyện Phú Lương C34 Bướu ác phế quản phổi Huyện Phú Bình I10 Cao huyết áp TP Thái Nguyên N18 Suy thận mãn Huyện Đại Từ N20.1 Sỏi niệu quản Huyện Đồng Hỷ Theo kết thể hình bảng 3.5, ta xem phân cụm khu vực theo hình thức bệnh Trong cụm thứ nhất, bệnh viêm đại tràng phổ biến phân bố chủ yếu huyện Võ Nhai, Định Hóa, Phổ n, Phú Lương TX Sơng Công Trong cụm thứ hai, bệnh bướu ác phế quản phổi phổ biến phân bố chủ yếu huyện Phú Bình Trong cụm thứ ba, bệnh cao huyết áp phổ biến tập trung chủ yếu TP Thái Nguyên Trong cụm bôn, bệnh suy thận mãn phổ biến phân bố chủ yếu huyện Đại Từ Trong cụm thứ lăm, bệnh sỏi niệu quản phổ biến phân bố chủ yếu huyện Đồng Hỷ Trên kết thu sau tến hành phân cụm liệu mẫu Kết biểu diễn dạng đồ để có nhìn tổng quan phân bố bệnh phổ biến khu vực hành thuộc tỉnh Thái Nguyên 3.5 Biểu điễn kết phân bố bệnh đồ Các loại bệnh phổ biến hiển thị dạng đồ phân bố khu vực hành tỉnh Thái Nguyên hình Hình 3.11:Bản đồ phân bố bệnh khu vực Hy vọng với kết thu với đồ phân bố bệnh khu vực thuộc tỉnh Thái Nguyên giúp ích cho chuyên gia, nhà quản lý y tế việc lên kế hoạch dự trù sở vật chất, thuốc trang thiết bị khác cho trung tâm y tế Tỉnh KÊT LN Trong q trình tìm hiểu hồn thành luận văn tốt nghiệp với tên đề tài “Tìm hiểu phương pháp phân cụm liệuứng dụng xây dựng đồ phân bố bệnh địa bàn tỉnh Thái Nguyên”, dù đạt số kết định mặt tìm hiểu lý thuyết tảng, kiến thức, mảng ứng dụng xây dựng thực nghiệm, nhiên khai phá liệu nói chung phân cụm liệu nói riêng lĩnh vực nghiên cứu rộng lớn với nhiều phương pháp, kỹ thuật, hướng nghiên cứu khác để tìm hiểu xây dựng ứng dụng hữu ích thực tế Tác giả thu số kết sau: - Về lý thuyết: + Tìm hiểu lý thuyết tảng, số mảng ứng dụng khai phá liệu phân cụm liệu + Tìm hiểu phương pháp, thuật tốn phân cụm liệu điển hình + Tìm hiểu đề tài tương tự công bố số tạp chí quốc tế để tham khảo phương pháp thực nghiệm phù hợp + Dựa phương pháp tìm hiểu sử dụng số thuật toán để cài đặt thực nghiệm tập liệu hồ sơ bệnh án Đại học Y Dược Thái Nguyên, từ đưa số kết luận quan trọng để xây dựng đồ phân bố bệnh địa bàn tỉnh Tuy nhiên, trình thực nhận thấy luận văn nhiều điểm hạn chế: - Về lý thuyết chưa: Chưa tìm hiểu thuât toan lọc bỏ nhiễu, tiền xử lý liệu tối ưu - Về liệu: Kết phân cụm giúp đưa số đánh giá tập liệu Tuy nhiên kết có chưa thực khách quan nguồn liệu Đại học Y Dược Thái Nguyên chưađây đủ để đưa kết đánh giá cho toàn tỉnh Hướng phát triển Sẽ tếp tục tìm hiểu để kết hợp phương pháp phân cụm áp dụng cho tập liệu mẫu Tìm hiểu thêm thuật toán lọc bỏ nhiễu, tền xử lý liệu từ xây dựng cơng cụ cho việc tền xử lý liệu Đối với liệu phục vụ cho việc xây dựng đồ phân bố cần tổng hợp từ nhiều nguồn, nhiều sở y tế lớn tồn tỉnh có đánh giá khách quan Xây dựng công cụ riêng để tến hành phân tch, phân cụm liễu đưa liệu làm đầu vào tốt để biểu diễn đồ phân bố bệnh Trên số kết đạt hướng phát triển tếp theo đề tài Tuy nhiên, thời gian trình độ nhiều giới hạn nên đề tài nhiều thiếu sót hạn chế, mong đóng góp nhiều thầy cô chuyên gia lĩnh vực khai phá liệu TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Lê Văn Phùng, Quách Xuân Trưởng, Khai phá liệu, NXB Thông tn truyền thông, 2012 Tiếng Anh: [2] Ching-Kuo Wei & Syi Su & Ming-Chin Yang,“Application of Data Mining on the Development of a Disease Distributon Map of Screened Community Residents of Taipei County in Taiwan”, DOI 10.1007/s10916-011-9664-7, J Med Syst (2012) 36:2021–2027 [3] Jiawei Han and Micheline Kamber “Data Mining Concepts and Techniques” 2007 Chapter & Chapter (Intelligent Database Systems Research Lab School of Computng Science Simon Fraser University, Canada) [4] Nada Lavrac, “Selected techniques for data mining in medicine”, Department of Intelligent Systems, J Stefan Insttute, 1000 Ljubljana, Slovenia, 1998 [5] Nada Lavrac a,b,* Marko Debeljak , Marko Bohanec a a , Andrej Kobler , Aleksander Pur e c , Bojan Cestnik a,d , , “Data mining and visualizaton for decision support and modeling of public health-care resources”, Journal of Biomedical Informatcs 40 (2007) 438–447, 2006 [6] Martn Brown, Data mining techniques, htp://www.ibm.com/developerworks/library/ba-data-mining-techniques/ ... LỜI CAM ĐOAN Em xin cam đoan nội dung đồ án tốt nghiệp với tên đề tài Tìm hiểu phương pháp phân cụm liệu ứng dụng xây dựng đồ phân bố bệnh địa bàn tỉnh Thái Nguyên không chép nội dung từ luận... áp dụng, có nhiều trường hợp kết hợp hai phương pháp phân cụm phân hoạch phân cụm phân cấp, nghĩa kết thu phương pháp phân cấp cải tến thơng qua bước phân cụm phân hoạch Phân cụm phân hoạch phân. .. 3.11: Bản đồ phân bố bệnh khu vực 62 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn MỞ ĐẦU Đề tài tìm hiểu phương pháp phân cụm liệu, đánh giá ưu nhược điểm phương pháp để tm phương

Ngày đăng: 05/06/2018, 19:11

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan