1. Trang chủ
  2. » Luận Văn - Báo Cáo

Gom cụm dữ liệu chuỗi thời gian bằng phương pháp leader single link

75 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƢỜNG ĐẠI HỌC BÁCH KHOA TRẦN VĂN TRIẾT GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK Ngành: KHOA HỌC MÁY TÍNH Mã số : 60.48.01.01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 06 năm 2018 CƠNG TRÌNH ĐƢỢC HỒN THÀNH TẠI TRƢỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán hƣớng dẫn khoa học: PGS TS DƢƠNG TUẤN ANH Cán chấm nhận xét 1: TS VÕ THỊ NGỌC CHÂU Cán chấm nhận xét 2: TS NGUYỄN ĐỨC CƢỜNG Luận văn thạc sĩ đƣợc bảo vệ Trƣờng Đại học Bách Khoa, ĐHQG Tp HCM ngày 18 tháng 07 năm 2018 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: 1.PGS TS QUẢN THÀNH THƠ (CT) 2.TS VÕ THỊ NGỌC CHÂU (PB1) 3.TS NGUYỄN ĐỨC CƢỜNG (PB2) 4.TS NGUYỄN ĐỨC DŨNG (UV) 5.TS NGUYỄN AN KHƢƠNG (TK) CHỦ TỊCH HỘI ĐỒNG PGS TS QUẢN THÀNH THƠ TRƢỞNG KHOAKH&KTMT ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT TRƢỜNG ĐẠI HỌC BÁCH KHOA NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: TRẦN VĂN TRIẾT MSHV: 7140262 Ngày, tháng, năm sinh: 14/12/1985 Nơi sinh: Tây Ninh Ngành: KHOA HỌC MÁY TÍNH Mã số : 60480101 I TÊN ĐỀ TÀI: Gom cụm liệu chuỗi thời gian phƣơng pháp Leader Single-link (l-SL) II NHIỆM VỤ VÀ NỘI DUNG:  Tìm hiểu độ đo Euclid, phƣơng pháp gom cụm: phân hoạch (Partition) phân cấp (Hierarchical) tiêu biểu giải thuật: k-Means Single-link  Tìm hiểu giải thuật gom cụm tăng dần (Incremental clustering) tiêu biểu giải thuật Leader  Nghiên cứu giải thuật Leader Single-link thực gom cụm với liệu chuỗi thời gian, kết hợp hai giải thuật Leader Single-link  Hiện thực giải thuật I-Kmeans Keogh, đánh giá so sánh kết gom cụm giải thuật: Leader Single-link, k-Means I-Kmeans  Cải tiến giải thuật Leader Single-link III NGÀY GIAO NHIỆM VỤ : 15/01/2018 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 17/06/2018 V CÁN BỘ HƢỚNG DẪN: PGS TS DƢƠNG TUẤN ANH Tp HCM, ngày tháng năm 2018 CÁN BỘ HƯỚNG DẪN TRƯỞNG KHOA KH & KTMT (Họ tên chữ ký) (Họ tên chữ ký) PGS TS DƢƠNG TUẤN ANH GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK LỜI CẢM ƠN Lời chân thành gửi lời cảm ơn đến thầy PGS TS Dƣơng Tuấn Anh tận tình hƣớng dẫn, định hƣớng đề tài nhƣ phƣơng pháp nghiên cứu có hƣớng dẫn cụ thể, kịp thời giúp đỡ tơi hồn thành tốt đề tài Tơi xin cảm ơn đến thầy cô khoa tận tình hƣớng dẫn trình học tập nghiên cứu trƣờng để có đủ kiến thức, kỹ hoàn thành đề tài Chân thành cảm ơn đến cha mẹ tạo điều kiện thuận lợi để có thời gian học tập, nghiên cứu nhƣ lời động viên trình thực đề tài i GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK TÓM TẮT Trong nghiên cứu liệu chuỗi thời gian (time series data), ngƣời ta thƣờng quan tâm đến chuỗi gồm nhiều giá trị đƣợc đo liên tục nhiều thời điểm không quan tâm đến giá trị thời điểm cụ thể Do đó, liệu chuỗi thời gian đƣợc xem liệu nhiều chiều, với chiều giá trị quan sát đƣợc thời điểm cụ thể Số chiều lên đến vài chục vài trăm tùy vào nguồn liệu nhƣ giá trị chứng khoán, liệu điện tim bệnh nhân đặt thách thức lớn cho nhà nghiên cứu việc trích xuất thơng tin cho nguồn liệu thô Tiêu biểu giải thuật gom cụm để trích xuất đặc trƣng liệu nhằm mục đích dự báo Giải thuật áp dụng cho gom cụm liệu thơng thƣờng có nhiều so với giải thuật gom cụm liệu chuỗi thời gian Do lý trên, đề tài nghiên cứu vấn đề gom cụm liệu chuỗi thời gian, cụ thể áp dụng giải thuật gom cụm liệu thông thƣờng vào việc gom cụm liệu chuỗi thời gian Dữ liệu chuỗi thời gian có đặc trƣng riêng, khác biệt so với liệu thơng thƣờng với ba đặc điểm chính: số chiều lớn, tính tƣơng quan liệu cao liệu có nhiễu Do đặc điểm riêng làm cho nhiều giải thuật làm việc hữu hiệu liệu thông thƣờng không làm việc tốt liệu chuỗi thời gian Đề tài áp dụng giải thuật Leader Single-link gom cụm liệu thông thƣờng vào việc gom cụm liệu thời gian, qua so sánh đánh giá với giải thuật đƣợc thử nghiệm nhiều liệu chuỗi thời gian, tiêu biểu hai giải thuật gom cụm: kMeans I-kMeans Kết thực nghiệm cho thấy giải thuật Leader Single-link đem lại chất lƣợng gom cụm tƣơng đối thời gian thực thi tốt k-Means I-kMeans Chúng đề xuất giải thuật gọi I-Leader Single-link mà có chất lƣợng thời gian thực thi tốt giải thuật gốc ii GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK ABSTRACT In the study of time series data, it is often the case that a series of values are continuously measured at multiple times, regardless of the value at each particular point in time Therefore, the time series data can be considered as multidimensional data, with each dimension being an observed value at a particular time Dimensions may be up to several tens or hundreds depending on the data source, such as stock values and patient's electrocardiographic data, posing a major challenge for researchers in extracting information for this raw data sources Typically, clustering algorithms for data extraction are for predictive purposes The algorithms applied to clustering ordinary data typically overwhelm the clustering algorithms in time series data For the reasons mentioned above, we will study the problem of clustering time series data, more specifically applying the normal data clustering algorithm to clustering time series data Since time series data are distinct from normal data with three main characteristics: the high number of dimensions, the correlation between data sets is very high and the data might have noise Because these particular characteristics make many algorithms that work well on normal data but can not work well on time series data This thesis will apply the normal data clustering algorithm to Leader Single-link clustering of time series data, thereby comparing the evaluation with the algorithms that have been extensively tested on the time series data, two clustering algorithms: k-Means and IkMeans The experimental results show that Leader Single-link brings out the same clustering quality and better time efficiency We propose a new algorithm called I-Leader Single-link that it brings out higher clustering quality and better time efficiency iii GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK LỜI CAM ĐOAN Tơi xin cam đoan trình bày đề tài cơng sức, kiến thức, nghiên cứu, học tập trình đào tạo trƣờng, hồn tồn khơng chép từ luận án, luận văn khác, nguồn tham khảo bên ghi rõ tài liệu tham khảo đề tài Nếu có sai trái, khơng với trình bày đề tài tơi hồn tồn chịu trách nhiệm iv GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK Mục lục Chƣơng : GIỚI THIỆU TỔNG QUAN ĐỀ TÀI 1.1 Xu hƣớng liệu 1.2 Giới thiệu vấn đề Chƣơng : CƠ SỞ LÝ THUYẾT 2.1 Dữ liệu chuỗi thời gian 2.2 Độ đo khoảng cách 2.3 Phƣơng pháp gom cụm 2.3.1 Khái niệm 2.3.2 Khoảng cách liệu gom cụm 2.3.3 Gom cụm phân hoạch 2.3.4 Gom cụm phân cấp 10 2.4 Rời rạc hóa liệu chuỗi thời gian 11 2.5 Các giải thuật gom cụm thông dụng 13 2.5.1 Giải thuật gom cụm phân cấp Single-link 13 2.5.2 Giải thuật gom cụm Leader 15 2.5.3 Giải thuật gom cụm k-Means 16 2.6 Các tiêu chí đánh giá chất lƣợng gom cụm 16 2.6.1 Đánh giá nội 17 2.6.2 Đánh giá ngoại 17 Chƣơng : NHỮNG CƠNG TRÌNH LIÊN QUAN 20 3.1 Giải thuật Leader Single-link 20 3.1.1 Chọn Leader ngƣỡng 20 3.1.2 Leader Single-link, biến thể Single-link 20 3.1.3 Quan hệ giải thuật Single-link Leader Single-link: 21 3.2 Giải thuật I-kMeans 22 3.2.1 Phân rã Haar wavelet 23 3.2.2 Thuật tốn có thời gian thực thi tùy chọn 24 3.2.3 Giải thuật I-kMeans 24 Chƣơng 4: HỆ THỐNG GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN 27 4.1 Đặt vấn đề 27 4.2 Hƣớng giải 27 4.2.1 Giảm thời gian thực thi giải thuật gom cụm 27 4.2.2 Gom cụm 27 4.2.3 Xác định thông số tối ƣu 28 4.3 Cài đặt giải thuật 28 v GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK 4.3.1 Giải thuật k-Means 28 4.3.2 Giải thuật I-kMeans 28 4.3.3 Giải thuật Leader Single-link 29 4.3.4 Giải thuật cải tiến I-Leader Single-link 29 4.4 Kiến trúc hệ thống 30 Chƣơng 5: THỰC NGHIỆM 33 5.1 Tập liệu thực nghiệm 33 5.2 Lựa chọn thông số tối ƣu 34 5.3 Chất lƣợng thời gian thực thi gom cụm 35 5.3.1 Giải thuật Leader Single-link 35 5.3.2 Giải thuật cải tiến I-Leader Single-link 49 5.4 Kết luận 55 Chƣơng KẾT LUẬN 57 6.1 Tổng kết 57 6.2 Đóng góp đề tài 57 6.3 Hƣớng phát triển 57 TÀI LIỆU THAM KHẢO 59 PHỤ LỤC A: BẢNG ĐỐI CHIẾU THUẬT NGỮ ANH VIỆT A PHỤ LỤC B: PHẦN LÝ LỊCH TRÍCH NGANG B vi GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK Danh mục hình ảnh Hình 1.1 Gom cụm liệu Hình 2.1 Lƣu lƣợng nƣớc đo trạm gần Luang Prabang (Lào) từ năm 2002- Hình 2.2 Biên độ hai chuỗi thời gian áp dụng độ đo khoảng cách Euclid Hình 2.3 Khoảng cách cụm gom cụm liệu Hình 2.4 Gom cụm phân hoạch giải thuật k-Means với k=4 Hình 2.5 Phƣơng pháp gom cụm phân cấp 10 Hình 2.6 Biểu diễn liệu chuỗi thời gian với 10 điểm liệu 12 Hình 2.7 PAA với w=7 12 Hình 2.8 Minh họa biểu diễn từ chuỗi thời gian gốc C sang chuỗi C’ qua 13 Hình 2.9 Tiêu chí trộn cụm Single-link (trái) trình gom cụm phân 14 Hình 3.1 Quan hệ giải thuật Leader Single-link single-link 22 Hình 3.2 Haar wavelet trình bày nhiều mức phân rã khác 23 Hình 3.3 Phân rã Haar wavelet biến đổi chuỗi thời gian A Sang B, giả 24 Hình 3.4 k-Means thực thi mức phân rã Haar wavelet bắt đầu mức 25 Hình 4.1 Kiến trúc hệ thống gom cụm 30 Hình 4.2 Giao diện chƣơng trình 31 Hình 4.3 Giao diện kết gom cụm chƣơng trình 32 Hình 5.1 Chất lƣợng gom cụm tập liệu 37 Hình 5.2 Chất lƣợng gom cụm tập liệu 50words 37 Hình 5.3 Thời gian gom cụm tập liệu 50words 38 Hình 5.4 Chất lƣợng gom cụm tập liệu CBF 38 Hình 5.5 Thời gian gom cụm tập liệu CBF 39 Hình 5.6 Trực quan hóa kết gom cụm tập CBF 39 Hình 5.7 Chất lƣợng gom cụm tập liệu ECG200 40 Hình 5.8 Thời gian gom cụm tập liệu ECG200 40 Hình 5.9 Trực quan hóa kết gom cụm tập ECG200 41 Hình 5.10 Chất lƣợng gom cụm tập liệu FaceAll 41 Hình 5.11 Thời gian gom cụm tập liệu FaceAll 42 Hình 5.12 Chất lƣợng gom cụm tập liệu Gun Point 42 Hình 5.13 Thời gian gom cụm tập liệu Gun Point 43 Hình 5.14 Trực quan hóa kết gom cụm tập Gun Point 43 Hình 5.15 Chất lƣợng gom cụm tập liệu OliveOil 44 Hình 5.16 Thời gian gom cụm tập liệu OliveOil 44 Hình 5.17 Trực quan hóa kết gom cụm tập OliveOil 45 Hình 5.18 Chất lƣợng gom cụm tập liệu Trace 45 Hình 5.19 Thời gian gom cụm tập liệu Trace 46 Hình 5.20 Trực quan hóa kết gom cụm tập Trace 46 Hình 5.21 Chất lƣợng gom cụm tập liệu Two Patterns 47 Hình 5.22 Thời gian gom cụm tập liệu Two Patterns 47 Hình 5.23 Chất lƣợng gom cụm tập liệu Stock 48 Hình 5.24 Thời gian gom cụm tập liệu Stock 48 Hình 5.25 Thời gian thực thi số leader giải thuật Leader Single-link 50 Hình 5.26 Thời gian thực thi số leader giải thuật I-Leader Single-link 50 Hình 5.27 Chất lƣợng gom cụm tập liệu 50words 51 vii GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK  Hầu hết liệu giải thuật I-kMeans k-Means có độ xác cao (trừ tập OliveOil), nhƣng chênh lệch không lớn (trừ tập FaceAll)  Với thời gian thực thi giải thuật Leader Single-link thời gian thực thi thấp (do số leader thấp nhiều so với liệu gốc)  Thời gian thực thi giải thuật Leader Single-link phụ thuộc nhiều vào số leader tạo bước trước (giải thuật gom cụm leader) 5.3.2 Giải thuật cải tiến I-Leader Single-link Giải thuật Leader Single-link I-Leader Single-link có thời gian thực thi gom cụm phụ thuộc nhiều vào giai đoạn trộn cụm, độ phức tạp giải thuật giai đoạn giảm số liệu nhỏ so với bƣớc trộn cụm để thu kết qua gom cụm cuối cùng, Bảng 5.5 sau thể thời gian thực thi giải số leader giải thuật Leader Single-link I-Leader Single-link Hình 5.25 Hình 5.26 cho ta thấy mối liên hệ số leader thời gian thực thi gom cụm hai giải thuật Leader Single-link I-Leader Single-link, số leader lớn thời gian thực thi giải thuật chậm Dataset 50words CBF ECG200 FaceAll Gun_Point OliveOil Trace Two_Patterns Giải thuật Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Time 9.42 8.8 0.58 0.56 0.64 0.62 1.60 3.96 0.78 0.52 1.32 0.68 0.74 1.1 1.46 1.64 Num of leaders 54 51 15 28 10 5 Bảng 5.5 Thời gian thực thi số leader giải thuật Leader Single-link I-Leader Single-link 49 GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK Values Leader Single-link 60 50 40 30 20 10 54 15 10 Time 5 Leader Hình 5.25 Thời gian thực thi số leader giải thuật Leader Single-link Values I-Leader Single-link 60 50 40 30 20 10 51 28 Time Leader Hình 5.26 Thời gian thực thi số leader giải thuật I-Leader Single-link Tập liệu 50words Độ xác thời gian thực thi giải thuật I-Leader Single-link tập 50words tốt so với giải thuật gốc Leader Single-link (ngoại trừ số RI), nhiên chênh lệch độ xác thời gian hai giải thuật không đáng kể, Hình 5.27 Hình 5.28 cho ta độ xác thời gian thực thi liệu 50words 50 GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK 1.0 0.9347 0.8 0.9368 Acuracy 50words 0.6 0.2501 0.2349 0.2847 0.2679 0.2 0.1656 0.1547 0.4 0.0 RI Jaccard Leader Single-link FM ARI I-Leader Single-link Hình 5.27 Chất lƣợng gom cụm tập liệu 50words Time (milliseconds) 50words 20 18 16 14 12 10 9.42 8.8 Leader Single-link I-Leader Single-link Hình 5.28 Thời gian gom cụm tập liệu 50words Tập liệu OliveOil Độ xác thời gian thực thi giải thuật I-Leader Single-link tập liệu tốt so với giải thuật Leader Single-link Hình 5.29 Hình 5.30 thể độ xác thời gian thực thi liệu OliveOil 51 GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK 0.6555 0.5557 0.7565 0.6803 0.4 0.6076 0.6 0.5155 0.8 0.8575 1.0 0.8207 Acuracy OliveOil 0.2 0.0 RI Jaccard Leader Single-link FM ARI I-Leader Single-link Hình 5.29 Chất lƣợng gom cụm tập liệu OliveOil Time (milliseconds) OliveOil 10 1.32 Leader Single-link 0.68 I-Leader Single-link Hình 5.30 Thời gian gom cụm tập OliveOil Tập liệu FaceAll Trong tập liệu này, kết gom cụm giải thuật I-Leader Single-link có độ xác cao nhƣng thời gian thực thi cao giải thuật Leader Single-link có số leader cao gấp đôi giải thuật Leader Single-link (10 so với 5) Hình 5.31 5.32 thể chất lƣợng thời gian thực thi gom cụm hai giải thuật tập liệu FaceAll 52 Acuracy GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK FaceAll 1.0 0.7820 0.8506 0.8 0.6 0.1435 0.0945 0.2279 0.2143 0.2 0.1232 0.1037 0.4 0.0 RI Jaccard Leader Single-link FM ARI I-Leader Single-link Hình 5.31 Chất lƣợng gom cụm tập liệu FaceAll Time (milliseconds) FaceAll 10 3.96 1.60 Leader Single-link I-Leader Single-link Hình 5.32 Thời gian gom cụm tập FaceAll Tập liệu Stock Kết gom cụm thời gian thực thi tập liệu chƣa phân lớp giải thuật Leader Single-link có độ xác hàm mục tiêu thấp nhƣng thời gian thực thi thấp so với giải thuật I-Leader Single-link, Hình 5.33 5.34 chất lƣợng gom cụm thời gian thực hai giải thuật thi tập liệu Stock 53 GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK Obj Func Stock 3000 2500 2115 2011 2000 1500 1000 500 Leader Single-link I-Leader Single-link Hình 5.33 Chất lƣợng gom cụm tập liệu Stock Time(milliseconds) Stock 10 1.96 2.08 Leader Single-link I-Leader Single-link Hình 5.34 Thời gian gom cụm tập Stock Một số tập liệu khác Bảng 5.6 kết gom cụm số liệu mẫu lại, qua kết ta thấy kết gom thời gian thực thi giải thuật I-Leader Single-link tốt giải thuật Leader Single-link (3/5 liệu) 54 GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK Dataset CBF ECG200 Gun_Point Trace Two_Patterns Giải thuật Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link Leader Single-link I-Leader Single-link RI Jaccard FM ARI Time 0.6023 0.2939 0.4577 0.1488 0.58 0.5977 0.2886 0.4514 0.1390 0.56 0.6018 0.5537 0.7246 0.1283 0.64 0.6533 0.5428 0.7039 0.2870 0.62 0.5102 0.4450 0.6329 0.0308 0.78 0.5102 0.4450 0.6329 0.0308 0.52 0.7519 0.4317 0.6161 0.4334 0.74 0.7552 0.4242 0.6055 0.4281 1.1 0.6278 0.1473 0.2568 0.0085 1.46 0.6301 0.1502 0.2612 0.0145 1.64 Bảng 5.6 Chất lƣợng thời gian thực thi gom cụm giải thuật I-Leader Single-link số tập liệu 5.4 Kết luận Từ kết thực nghiệm cho thấy giải thuật Leader Single-link thực gom cụm tƣơng đối tốt liệu chuỗi thời gian, thêm lựa chọn cho ngƣời dùng gom cụm liệu chuỗi thời gian Giải thuật cải tiến I-Leader Single-link có kết gom cụm với độ xác thời gian thực thi tốt giải thuật Leader Single-link, đáp ứng gom cụm với liệu lớn hiệu hơn, ta giới hạn đƣợc số leader trình thu giảm liệu nhƣng kết gom cụm đảm bảo tối ƣu Chất lƣợng gom cụm phụ thuộc vào loại liệu, thứ tự duyệt liệu nên cần cân nhắc việc đánh đổi thời gian thực thi chất lƣợng gom cụm cho phù hợp cho liệu cụ thể Chất lƣợng gom cụm làm việc liệu nhiễu hai giải thuật Leader Single-link I-Leader Single-link tốt hai giải thuật kMeans I-kMeans ta 55 GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK đƣa liệu nhiễu cụm riêng kết gom cụm dựa vào ngưỡng (T) giải thuật Việc chọn ngưỡng cho giải thuật Leader Single-link I- Leader Single-link quan trọng, ảnh hƣởng lớn đến chất lƣợng kết gom cụm cuối 56 GOM CỤM DỮ LIỆU CHUỖI THỜI GIAN BẰNG PHƢƠNG PHÁP LEADER SINGLE-LINK Chương KẾT LUẬN Chƣơng tổng kết lại kết đạt đƣợc, đóng góp nhƣ hƣớng phát triển đề tài 6.1 Tổng kết Trong trình nghiên cứu, tìm hiểu, xây dựng chƣơng trình gom cụm liệu chuỗi thời gian với giải thuật thực nghiệm liệu thông thƣờng (Leader Single-link), cài đặt thực giải thuật để áp dụng vào gom cụm liệu chuỗi thời gian, đồng thời thực giải thuật k-Means khung giải thuật (frames) I-kMeans Keogh cộng đề xuất, từ đánh giá độ hiệu giải thuật: Leader Single-link, k-Means I-kMeans, đề xuất giải thuật cải tiến có độ xác thời gian thực thi tốt 6.2 Đóng góp đề tài  Xây dựng chƣơng trình gom cụm dùng giải thuật Leader Single-link cho toán gom cụm liệu chuỗi thời gian  Kết giải thuật cải tiến I-Leader Single-link có độ xác cao tƣơng đƣơng nhƣng có thời gian thực thi thấp giải thuật Leader Single-link, xác định đƣợc số leader tối ƣu cho giải thuật nhỏ (

Ngày đăng: 21/04/2021, 11:01

Xem thêm: