Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 18 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
18
Dung lượng
2,73 MB
Nội dung
DATA MINING KHAI PHÁ DỮ LIỆU CHƯƠNG 2: TIỀN XỬ LÝ DỮ LIỆU NỘI DUNG Tại phải tiền xử lý liệu Làm liệu (data cleaning) Tích hợp liệu (data integration) Biến đổi liệu (data tranformation) Giảm bớt / rút gọn liệu (data reduction) 1 TẠI SAO PHẢI TIỀN XỬ LÝ DỮ LIỆU TẠI SAO PHẢI TIỀN XỬ LÝ DỮ LIỆU CÁC BƯỚC CỦA TIỀN XỬ LÝ DỮ LIỆU CÁC BƯỚC CỦA TIỀN XỬ LÝ DỮ LIỆU LÀM SẠCH DỮ LIỆU LÀM SẠCH DỮ LIỆU LÀM SẠCH DỮ LIỆU LÀM SẠCH DỮ LIỆU 10 LÀM SẠCH DỮ LIỆU 11 a) ĐIỀN DỮ LIỆU THIẾU 12 ĐIỀN DỮ LIỆU THIẾU: Các giải pháp 13 b) DỮ LIỆU NHIỄU 14 DỮ LIỆU NHIỄU: Các giải pháp 15 PHÂN KHOẢNG 16 PHÂN KHOẢNG: Ví dụ 17 PHÂN KHOẢNG: tập Cho liệu giá ($) sau: 15, 17, 19, 25, 29, 31, 33, 41, 42, 45, 45, 47, 52, 52, 64 Số khoảng: Dùng phương pháp phân chia theo ñộ rộng ñộ sâu 18 HỒI QUY 19 PHÂN CỤM 20 10 c) DỮ LIỆU MÂU THUẪN 21 TÍCH HỢP DỮ LIỆU 22 11 TÍCH HỢP DỮ LIỆU 23 BIẾN ĐỔI DỮ LIỆU 24 12 GIẢM BỚT DỮ LIỆU 25 GIẢM BỚT DỮ LIỆU 26 13 GIẢM SỐ CHIỀU 27 GIẢM SỐ CHIỀU 28 14 Phân tích thành phần 29 Phân tích thành phần 30 15 Lựa chọn tập thuộc tính 31 KẾT HỢP KHỐI DỮ LIỆU 32 16 NÉN DỮ LIỆU 33 LẤY MẪU DỮ LIỆU 34 17 Các phương pháp lấy mẫu 35 Các phương pháp lấy mẫu 36 18 ... 33, 41, 42, 45, 45, 47, 52, 52, 64 Số khoảng: Dùng phương pháp phân chia theo ñộ rộng ñộ sâu 18 HỒI QUY 19 PHÂN CỤM 20 10 c) DỮ LIỆU MÂU THUẪN 21 TÍCH HỢP DỮ LIỆU 22 11 TÍCH HỢP DỮ LIỆU 23 BIẾN... LIỆU 24 12 GIẢM BỚT DỮ LIỆU 25 GIẢM BỚT DỮ LIỆU 26 13 GIẢM SỐ CHIỀU 27 GIẢM SỐ CHIỀU 28 14 Phân tích thành phần 29 Phân tích thành phần 30 15 Lựa chọn tập thuộc tính 31 KẾT HỢP KHỐI DỮ LIỆU 32 16... THIẾU 12 ĐIỀN DỮ LIỆU THIẾU: Các giải pháp 13 b) DỮ LIỆU NHIỄU 14 DỮ LIỆU NHIỄU: Các giải pháp 15 PHÂN KHOẢNG 16 PHÂN KHOẢNG: Ví dụ 17 PHÂN KHOẢNG: tập Cho liệu giá ($) sau: 15, 17, 19, 25 , 29 ,