Đăng nhập
Hoặc tiếp tục với email
Nhớ mật khẩu
Đang tải... (xem toàn văn)
Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
THÔNG TIN TÀI LIỆU
Cấu trúc
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT
1.1. Tổng quan về khai thác dữ liệu
1.1.1. Mục tiêu của khai thác dữ liệu
1.1.2. Quá trình phát hiện tri thức từ cơ sở dữ liệu
Hình 1.1. Quá trình phát hiện tri thức từ CSDL [3]
1.1.3. Kiến trúc của một hệ thống khai thác dữ liệu
Hình 1.2. Khám phá tri thức trong CSDL điển hình
1.1.4. Các phương pháp khai thác dữ liệu
1.1.5. Ứng dụng của khai thác dữ liệu
Hình 1.3. Một số lĩnh vực liên quan đến khai thác dữ liệu
1.1.6. Một số khó khăn trong việc khai thác dữ liệu
1.2. Tổng quan về khai thác dữ liệu song song
1.2.1. Cấu trúc hệ thống song song
1.2.1.1. Định nghĩa xử lý song song
1.2.1.2. Phân biệt xử lý song song và xử lý tuần tự
1.2.1.3. Mục đích của xử lý song song
1.2.1.4. Ba yếu tố chính dẫn đến việc xây dựng các hệ thống xử lý song song
1.2.2. Phân loại các kiến trúc song song
Bảng 1.1. Mô tả phân loại kiến trúc của Flynn
1.2.2.1. Kiến trúc đơn dòng lệnh đơn luồng dữ liệu (SISD)
Hình 1.4. Mô hình kiến trúc máy SISD
1.2.2.2. Kiến trúc đơn dòng lệnh đa luồng dữ liệu (SIMD)
Hình 1.5. Mô hình kiến trúc máy SIMD
1.2.2.3. Kiến trúc đa dòng lệnh đơn dữ liệu (MISD)
Hình 1.6. Mô hình kiến trúc máy MISD
1.2.2.4. Kiến trúc đa dòng lệnh đa luồng dữ liệu (MIMD)
Hình 1.7. Mô hình kiến trúc máy MIMD
1.2.3. Các chiến lược khai thác dữ liệu song song
1.3. Một số khái niệm về cơ sở dữ liệu giao dịch và tập phổ biến
1.3.1. Cơ sở dữ liệu giao dịch
Bảng 1.2. Cơ sở dữ liệu mẫu
1.3.2. Khái niệm về tập phổ biến
1.3.3. Các tính chất của tập phổ biến
1.3.4. Một số phương pháp biểu diễn cơ sở dữ liệu trong khai thác dữ liệu
1.3.4.1. Biểu diễn cơ sở dữ liệu theo chiều ngang
Bảng 1.3. Bảng dữ liệu sắp xếp theo chiều ngang
1.3.4.2. Biểu diễn cơ sở dữ liệu theo chiều dọc
Bảng 1.4. Bảng dữ liệu sắp xếp theo chiều dọc
CHƯƠNG 2. MỘT SỐ PHƯƠNG PHÁP KHAI THÁC TẬP PHỔ BIẾN
1.
2.
2.1. Thuật toán Apriori
2.1.1. Ý tưởng thuật toán
2.1.2. Nội dung thuật toán:
Bảng 2.2. Các tập phổ biến có 2 mục
Bảng 2.3. Các tập phổ biến có 3 mục
Bảng 2.4. Các tập phổ biến có 4 mục
2.1.3. Nhận xét thuật toán Apriori
2.2. Thuật toán Eclat
2.2.1. Ý tưởng thuật toán.
2.2.2. Nội dung thuật toán Eclat
Hình 2.1. Thuật toán Eclat [3]
2.2.3. Nhận xét thuật toán Eclat
2.3. Thuật toán FP-Growth
2.3.1. Ý tưởng thuật toán
2.3.2. Cấu trúc cây FP – Tree
2.3.3. Phép chiếu trên cây FP-tree:
2.3.4. Nội dung thuật toán FP-Growth:
Hình 2.2. Cây Tree0
Bảng 2.5. Nội dung CSDL {T}
Hình 2.3. Tree{T}cục bộ tương ứng với CSDL {T}
Hình 2.4. Tree{TD} cục bộ tương ứng với CSDL{TD}
Bảng 2.6. Nội dung CSDL{TA}
Hình 2.5. Tree{TA} cục bộ tương ứng với CSDL{TA}
Bảng 2.7. Nội dung CSDL{TW}
Hình 2.6. Tree{TW} cục bộ tương ứng với CSDL{TW}
Bảng 2.8. Nội dung CSDL{D}
Hình 2.7. Tree{D} cục bộ tương ứng với CSDL{D}
Bảng 2.9. Nội dung CSDL{A}
Hình 2.8. Tree{A} cục bộ tương ứng với CSDL{A}
Bảng 2.10. Nội dung CSDL{W}
Hình 2.9. Tree{W} cục bộ tương ứng với CSDL{W}
Bảng 2.11. Kết quả tập phổ biến thỏa ngưỡng minSup = 2
2.3.5. Nhận xét thuật toán FP-Growth
CHƯƠNG 3. THUẬT TOÁN KHAI THÁC SONG SONG TẬP PHỔ BIẾN DỰA TRÊN MẢNG SYSTOLIC
3.
1.1
3.1. Bài toán khai thác song song tập phổ biến dựa trên mảng Systolic
3.1.1. Cấu trúc mảng Systolic
Hình 3.1. Một bộ xử lý trong mảng Systolic [4]
3.1.2. Mục đích sử dụng và hiệu quả của mảng Systolic
3.1.3. Mô tả chi tiết mảng Systolic
Hình 3.2. Kiến trúc bộ xử lý mảng Systolic
Hình 3.3. Một số cấu hình phổ biến của mảng Systolic: (a) mảng tuyến tính, (b) mảng hình tam giác, (c) mảng hai chiều hình vuông
Hình 3.4. Kiến trúc SA để thực hiện nhân hai ma trận
3.2. Thuật toán khai thác tập phổ biến sử dụng mảng Systolic
3.2.1. Mã hóa dữ liệu bằng ma trận bit
1.1.
1.2.
3.3.
Bảng 3.1. CSDL có các phần tử được ký hiệu theo chữ cái
Hình 3.5. Ma trận bit của tập dữ liệu
Hình 3.6. Ma trận bit rút gọn với minsup = 2
3.2.2. Xây dựng cấu trúc mảng Systolic để khai thác tập phổ biến
Hình 3.7. Chức năng của một bộ xử lý trong mảng Systolic 1 chiều [4]
Hình 3.8. Ma trận bit chuyển đổi từ tập phần tử tương ứng với hình 3.5
3.3. Phương pháp khai thác song song dựa trên mảng Systolic
3.3.1. Phương pháp tiếp cận chia để trị
3.3.2. Mảng Systolic 2 chiều
Hình 3.9. Khởi tạo ban đầu của mảng systolic để khai thác tập phần tử có chứa “a”
3.4. Thuật toán khai thác dựa trên mảng Systolic
Hình 3.9. Khởi tạo ban đầu của mảng Systolic [4]
Hình 3.10. Lần di chuyển đầu tiên của mảng Systolic [4]
Hình 3.11. Lần di chuyển thứ hai của mảng Systolic [4]
Hình 3.12. Lần di chuyển thứ 3 của mảng Systolic [4]
CHƯƠNG 4. XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM
4.
4.1. Môi trường cài đặt
Bảng 4.1. Cơ sở dữ liệu thử nghiệm
4.2. Kết quả của thuật toán
Hình 4.1. Thời gian thực hiện trên tập dữ liệu Accident
Hình 4.2. Thời gian thực hiện trên tập dữ liệu Chess
Hình 4.3. Thời gian thực hiện trên tập dữ liệu Connect
4.3. Nhận xét
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Kết luận
Hướng phát triển
Nội dung
Ngày đăng: 11/07/2021, 16:52
HÌNH ẢNH LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU CÙNG NGƯỜI DÙNG
TÀI LIỆU LIÊN QUAN