Bài giảng Khai phá dữ liệu gồm có những nội dung chính sau: Một số tài nguyên khai phá dữ liệu, khai phá quy trình, khai phá dữ liệu: học suốt đời. Mời các bạn cùng tham khảo để biết thêm nội dung chi tiết.
BÀI GIẢNG KHAI PHÁ DỮ LIỆU Nội dung bổ sung Khai phá liệu PGS TS Hà Quang ThụyHÀ NỘI, 10-2018 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI http://uet.vnu.edu.vn/~thuyhq/ Nội dung Một số tài nguyên khai phá liệu Khai phá quy trình Khai phá liệu: Học suốt đời Tài nguyên KPDL: kiểu công cụ ▪ Data mining suites (DMS): Gói chứa nhiều phương pháp ▪ Business intelligence packages (BIs): Không tập trung chuyên ▪ ▪ ▪ ▪ ▪ ▪ Ralf Mikut, Markus Reischl (2011) Data mining tools, Wiley Interdisc Rew.: Data Mining and Knowledge Discovery 1(5): 431-443 (2011) ▪ KPDL mà hướng tới chức KPDL bản, đặc biệt thống kê ứng dụng kinh doanh Mathematical packages (MATs): Không tập trung chuyên KPDL mà hướng tới tập lớn mở rộng thuật toán thủ tục trực quan hóa Integration packages (INTs): gói mở rộng nhiều thuật tốn nguồn mở khác nhau/phần mềm độc lập (chủ yếu dựa Java) EXT: tiện ích bổ sung nhỏ cho công cụ khác Excel, Matlab, R… với chức hạn chế song hữu dụng Data mining libraries (LIBs): thực thi phương pháp KPDL gói chức Specialties (SPECs): tương tự LIB song gồm nhóm phương pháp chuyên biệt (mạng nơron, …) RES: thường thi hành lần thuật tốn mới, cách tân Solutions (SOLs): nhóm cơng cụ tùy biến cho lĩnh vực ứng dụng hẹp khai phá văn (GATE), xử lý hình July 12, ảnh (ITK, ImageJ) 202 Tài nguyên KPDL: Công cụ TM Data mining suites BI packages Mathematical packages Integration packages Specialties RES Ralf Mikut, Markus Reischl (2011) Data mining tools, Wiley Interdisc Rew.: Data Mining and Knowledge Discovery 1(5): 431-443 (2011) July 12, 202 Tài nguyên KPDL: Công cụ TM BI packages Mathematical packages Integration packages Specialties July RES Data mining suites 12, Ralf Mikut, Markus Reischl (2011) Data mining tools, Wiley Interdisc Rew.: Data 202 Mining and Knowledge Discovery 1(5): 431-443 (2011) Tài nguyên KPDL: Công cụ nguồn mở Data mining suites BI packages Mathematical packages Integration packages Specialties RES July 12, Ralf Mikut, Markus Reischl (2011) Data mining tools, Wiley Interdisc Rew.: Data 202 Mining and Knowledge Discovery 1(5): 431-443 (2011) Tài nguyên KPDL: Công cụ nguồn mở Data mining suites BI packages Mathematical packages Integration packages Specialties RES July 12, Ralf Mikut, Markus Reischl (2011) Data mining tools, Wiley Interdisc Rew.: Data 202 Mining and Knowledge Discovery 1(5): 431-443 (2011) Tài nguyên KPDL: Dữ liệu mẫu July 12, Kho chứa liệu nhóm học máy University of California, Irvine – UCI (UC 202 Irvine Machine Learning Repository) http://archive.ics.uci.edu/ml/ (11/2015) http://kdd.org/ : Trang web công đồng DM July 12, 202 10 http://kdd.org/awards/sigkdd-dissertation-award Winner: Mining Latent Entity Structures From Massive Unstructured and Interconnected Data Chi Wang (student) and Jiawei Han (advisor) at University of Illinois at Urbana-Champaign Runner-up: Modeling Large Social Networks in Context Qirong Ho (student) and Eric Xing (advisor) at Carnegie Mellon University July Runner-up: Computing Distrust in Social Media Jiliang Tang (Student) 12, and Huan Liu (Advisor) at Arizona State University Định hướng Khóa 202 luận đại học K56: Thái Thị Hoài, Nguyễn Quỳnh Nga, Mai Công Đạt .. .Nội dung Một số tài nguyên khai phá liệu Khai phá quy trình Khai phá liệu: Học suốt đời Tài nguyên KPDL: kiểu cơng cụ ▪ Data mining suites (DMS): Gói chứa nhiều phương pháp ▪ Business... Distributed and Parallel Databases 31(4): 47 1-5 07 18 Khai phá quy trình: cầu nối Triết lý “đường mòn” [Aalst11] khai phá liệu với khoa học quy trình 19 Vai trị khai phá quy trình ▪ Quản lý quy trình nghiệp... ký ghi kiện, bổ sung vào tiếp cận có để quản lý quy trình tác nghiệp (Business Process Management : BPM) Kết hợp khai phá liệu quản lý quy trình tác nghiệp Triết lý “đường mịn” khai phá quy trình