1. Trang chủ
  2. » Tất cả

KPDL_C1

70 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU CHƯƠNG 1. GIỚI THIỆU CHUNG VỀ KHAI PHÁ DỮ LIỆU

  • Nội dung

  • 1. Nhu cầu về khai phá dữ liệu

  • Bùng nổ dữ liệu: Luật Moore

  • Luật Moore & công nghiệp điện tử

  • Luật Moore: Bộ xử lý Intel

  • Giá trị, cách đọc các bội và ước điển hình

  • Thiết bị thu thập – lưu trữ dữ liệu

  • PowerPoint Presentation

  • Slide 10

  • Công nghệ CSDL: Một số CSDL lớn

  • Bùng nổ dữ liệu: Công nghệ mạng

  • Bùng nổ dữ liệu: Tác nhân tạo mới

  • Bùng nổ dữ liệu: Giá thành và thể hiện

  • Slide 15

  • Slide 16

  • Kinh tế tri thức

  • Kinh tế dịch vụ: Từ dữ liệu tới giá trị

  • Ngành kinh tế định hướng dữ liệu

  • 2. Khái niệm KDD và KPDL

  • Quá trình KDD [FPS96]

  • Các bước trong quá trình KDD

  • Các khái niệm liên quan

  • Mô hình quá trình KDD lặp [CCG98]

  • Mô hình CRISP-DM 2000

  • Mô hình tích hợp DM-BI [WW08]

  • Dữ liệu và Mẫu

  • Tính có giá trị

  • Tính mới và hữu dụng tiềm năng

  • Tính hiểu được, tính hấp dẫn và tri thức

  • Kiến trúc điển hình hệ thống KPDL

  • 3. Khai phá dữ liệu và quản trị CSDL

  • Khái niệm KPDL: câu hỏi DMS

  • Hệ thống CSDL và Hệ thống KPDL

  • KPDL và Thông minh kinh doanh

  • 4. KPDL: các kiểu dữ liệu

  • Kiểu dữ liệu được phân tích/khai phá http://www.kdnuggets.com/polls/2010/data-types-analyzed.html

  • Kích thước dữ liệu và lương KPDL http://www.kdnuggets.com/polls/2010/data-types-analyzed.html

  • 5. KPDL: Kiểu mẫu được khai phá

  • KPDL: Sơ đồ phân loại (Chức năng)

  • Các bài toán KPDL: Chức năng KPDL

  • Slide 42

  • KPDL: Sơ đồ phân loại chức năng (2)

  • Slide 44

  • Slide 45

  • KPDL: Sơ đồ phân loại (2)

  • Khung nhìn đa chiều của KPDL

  • Mọi mẫu khai phá được đều hấp dẫn?

  • Tìm được tất cả và chỉ các mẫu hấp dẫn?

  • 6. KPDL: Các công nghệ chính

  • KPDL: Các công nghệ chính

  • Thống kê toán học với KPDL

  • Slide 53

  • Học máy với KPDL

  • Tìm kiếm thông tin với KPDL

  • 7. Ứng dụng cơ bản của KPDL

  • Phân tích và quản lý thị trường

  • Phân tích doanh nghiệp & Quản lý rủi ro

  • Phân tích kinh doanh: Khai phá quá trình

  • Phát hiện gian lận và khai phá mẫu hiếm

  • Ứng dụng khác

  • Slide 62

  • 8. Vấn đề chính trong KPDL

  • Slide 64

  • Sơ lược cộng đồng KPDL

  • KPDL: tốp 20 từ khóa hàng đầu

  • Các chủ đề liên quan KPDL là thời sự !

  • Trang web KDD; KPDL & biến đổi khí hậu

  • Vấn đề chính trong KPDL

  • Một số yêu cầu ban đầu

Nội dung

BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU CHƯƠNG GIỚI THIỆU CHUNG VỀ KHAI PHÁ DỮ LIỆU PGS TS HÀ QUANG THỤY HÀ NỘI 09-2013 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI Nội dung Nhu cầu khai phá liệu (KPDL) Khái niệm KPDL phát tri thức CSDL KPDL xử lý CSDL truyền thống Kiểu liệu KPDL Kiểu mẫu khai phá Công nghệ KPDL điển hình Một số ứng dụng điển hình Các vấn đề KPDL 2 Nhu cầu khai phá liệu  Sự bùng nổ liệu     Lý công nghệ Lý xã hội Thể Ngành kinh tế định hướng liệu  Kinh tế tri thức  Phát tri thức từ liệu Bùng nổ liệu: Luật Moore  Xuất xứ   Gordon E Moore (1965) Cramming more components onto integrated circuits, Electronics, 38 (8), April 19, 1965 Một quan sát dự báo “Phương ngôn 2x    Số lượng bán dẫn tích hợp chíp tăng gấp đơi sau khoảng hai năm Chi phí sản xuất mạch bán dẫn với tính giảm nửa sau hai năm Phiên 18 tháng: rút ngắn chu kỳ thời gian Luật Moore & công nghiệp điện tử  Dẫn dắt ngành công nghệ bán dẫn  Mơ hình cho ngành cơng nghiệp mạch bán dẫn  “Định luật Moore tạo khả cho phát triển chúng tơi, hiệu lực tốt Intel… Định luật Moore khơng mạch bán dẫn Nó cách sử dụng sáng tạo mạch bán dẫn” Paul S Otellini, Chủ tịch Giám đốc điều hành Tập đoàn Intel  “tồn chu trình thiết kế, phát triển, sản xuất, phân phối bán hàng coi có tính bền vững tuân theo định luật Moore… Nếu đánh bại định luật Moore, thị trường hấp thụ hết sản phẩm mới, kỹ sư bị việc làm Nếu bị tụt sau định luật Moore, khơng có để mua, gánh nặng đè lên đôi vai chuỗi nhà phân phối sản phẩm” Daniel Grupp, Giám đốc PT công nghệ tiên tiến, Acorn Technologies, Inc (http://acorntech.com/)  Thúc đẩy công nghệ xử lý, lưu giữ truyền dẫn liệu  Công nghệ bán dẫn tảng công nghiệp điện tử  Định luật Moore với công nghiệp phần cứng máy tính: xử lý Intel 40 năm qua (trang tiếp theo)  Bùng nổ lực xử lý tính tốn lưu trữ liệu  Tác động tới phát triển công nghệ sở liệu (tổ chức quản lý liệu) công nghệ mạng (truyền dẫn liệu) Luật Moore: Bộ xử lý Intel “Another decade is probably straightforward There is certainly no end to creativity” Gordon Moore, Intel Chairman Emeritus of the Board Speaking of extending Moore’s Law at the International Solid-State Circuits Conference (ISSCC), February 2003 Hệ thống ước bội đơn vị đo Giá trị, cách đọc bội ước điển hình Thiết bị thu thập – lưu trữ liệu  Năng lực số hóa  Thiết bị số hóa đa dạng  Mọi lĩnh vực Quản lý, Thương mại, Khoa học…  Một ví dụ điển hình: SDSS  Sloan Digital Sky Survey  http://www.sdss.org/  Đã tạo đồ 3-chiều có chứa 930.000 thiên hà 120.000 quasar  Kính viễn vọng  Làm việc từ 2000  Vài tuần đầu tiên: thu thập liệu thiên văn học = toàn khứ Sau 10 năm: 140 TB  Kính viễn vọng  Large Synoptic Survey Telescope  Bắt đầu hoạt động 2016 Sau ngày có 140 TB Tiến hóa Cơng nghệ CSDL: năm 2006  Tiến hóa cơng nghệ CSDL [HK0106]: Hệ CSDL mở rộng, KDL & KPDL, Hệ CSDL dựa Web Tiến hóa Cơng nghệ CSDL: năm 2011  Tiến hóa cơng nghệ CSDL [HKP11]: Hệ CSDL mở rộng Phân tích liệu mở rộng (có KPDL) 10

Ngày đăng: 21/05/2017, 23:13

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN