1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ĐỒ án môn học KHAI PHÁ dữ LIỆU ỨNG DỤNG PHẦN mềm RAPIDMIN ER để THỰC HIỆN KHAI PHÁ dữ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG

83 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 83
Dung lượng 7,64 MB

Nội dung

BỘ TÀI CHÍNH TRƯỜNG ĐẠI HỌC TÀI CHÍNH – MARKETING KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN MÔN HỌC KHAI PHÁ DỮ LIỆU Đề tài: ỨNG DỤNG PHẦN MỀM RAPIDMIN ER Giảng viên hướng dẫn: ThS Nguyễn Thị Trần Lộc ĐỂ THỰC Nguyễn Võ Quốc Huy – MSSV: 1921006708 – Mã HP: 5903 HIỆN Trần Kim Tấn Lợi – MSSV: 1921006728 – Mã HP: 5903 KHAI PHÁ DỮ LIỆU TRONG TP HCM, THÁNG 12 NĂM 2021 VIỆC ĐÁNH GIÁ Danh sách nhóm sinh viên thực hiện: CHẤT ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TƠ TRÍCH YẾU Trong thời đại cơng nghệ 4.0 nay, quản lý doanh nghiệp công việc vơ phức tạp khó khăn, khơng phải quản lý nhiều loại thông tin, liệu khác nhau, doanh nghiệp cịn phải tìm cách tối ưng hóa thơng tin liệu có nhằm đạt tiêu, mong muốn mà doanh nghiệp đề Chính lẽ việc khai phá liệu hiệu quả, xác điều vơ trọng yếu cần thiết việc vận hành doanh nghiệp Thông qua khai phá liệu ta biết việc như: xu hướng mua hàng khách hàng, thói quen làm việc nhân viên biến động thị trường Qua đó, doanh nghiệp dự đốn đề chiến lược kinh doanh, quản trị cần thiết giúp đưa doanh nghiệp ngày lên lớn mạnh, phù hợp với xu hướng thị trường, dần hồn thiện cơng tác quản lý nội Chình hiểu quan trọng khai phá liệu kinh doanh nay, chúng em định thực đề tài này, nhằm ứng dụng phần mềm vào việc khai phá liệu, để có nhìn tổng quan việc khai phá liệu hiệu mang lại Phần mềm chúng em chọn RapidMiner với thao tác đơn giản dễ sử dụng việc thực hành học tập phần mềm giúp chúng em có nhìn sơ lược khai phá liệu Bên cạnh chúng em chọn tập liệu việc đánh giá chất lượng xe tơ Qua tụi em có nhìn đa chiều việc đánh giá chất lượng xe ô tô Kết hợp tất yêu tố tụi em hình thành đề tài: “Ứng dụng phần mềm RapidMiner để thực khai phá liệu việc đánh giá chất lượng xe ô tô” i ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ MỤC LỤC TRÍCH YẾU .i MỤC LỤC ii LỜI CẢM ƠN v DANH MỤC TỪ VIẾT TẮT vi DANH MỤC THUẬT NGỮ ANH – VIỆT vii DANH MỤC CÁC HÌNH ẢNH .viii DANH MỤC CÁC BẢNG BIỂU .xi DẪN NHẬP  Mục tiêu đồ án  Phân công công việc  Kế hoạch thực đồ án CHƯƠNG 1: TỔNG QUAN 1.1 Lý hình thành đồ án 1.2 Mục tiêu đồ án .4 1.3 Dự kiến kết đạt .4 CHƯƠNG 2: 2.1 CƠ SỞ LÝ THUYẾT Giới thiệu khai phá liệu 2.1.1 Khái niệm 2.1.2 Vai trò khai phá liệu kinh doanh 2.1.3 Quy trình khai phá liệu .7 2.2 Kho liệu 2.2.1 Kiến trúc luồng liệu 2.2.2 Kho liệu khai phá liệu BI 10 2.2.2.1 Kho liệu .10 2.2.2.2 Khai phá liệu BI 13 2.3 2.3.1 Các phương pháp khai phá liệu 15 Phương pháp phân lớp 15 ii ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ 2.3.2 Phương pháp gom cụm 18 2.3.3 Phương pháp luật kết hợp .20 2.4 Giới thiệu phần mềm RapidMiner 21 2.4.1 Tổng quan phần mềm RapidMiner 22 2.4.1.1 Ưu điểm 22 2.4.1.2 Hạn chế 22 2.4.2 Cách sử dụng phần mềm RapidMiner 22 2.4.2.1 Giới thiệu giao diện 22 2.4.2.1.1 Cách cài đặt phần mềm .22 2.4.2.1.1 Giao diện phần mềm RapidMiner .25 2.4.2.2 Cách thức tiến hành phương pháp khai phá liệu 26 2.4.2.2.1 Phương pháp phân lớp 26 2.4.2.2.1 Phương pháp gom cụm .32 2.4.2.2.1 Phương pháp luật kết hợp 35 CHƯƠNG 3: 3.1 ỨNG DỤNG PHẦN MỀM RAPIDMINER 40 Mô tả tập liệu 40 3.1.1 Mô tả chung 40 3.1.2 Mô tả chi tiết 40 3.1.2.1 Các thuộc tính tập liệu 40 3.1.2.2 Ưu điểm tập liệu 42 3.1.2.3 Nhược điểm tập liệu 42 3.2 Tiền xử lý liệu .42 3.3 Thêm tâp liệu vào phần mềm RapidMiner 44 3.4 Phương pháp phân lớp .49 3.4.1 Mục tiêu 49 3.4.2 Thực thuật toán 49 3.4.3 Kết 55 3.5 Phương pháp gom cụm 55 3.5.1 Mục tiêu 55 3.5.2 Thực thuật toán 55 iii ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ 3.5.3 3.6 Kết 59 Phương pháp luật kết hợp 59 3.6.1 Mục tiêu 59 3.6.2 Thực thuật toán 59 3.6.3 Kết 65 CHƯƠNG 4: KẾT LUẬN 66 4.1 Kết đạt 66 4.2 Hạn chế 66 TÀI LIỆU THAM KHẢO .67 iv ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ LỜI CẢM ƠN Đầu tiên, cho em gởi lời cảm ơn đến thầy cô, người mang đến cho em đề tài này, hội để thân em nói riêng bạn sinh viên khoa Cơng Nghệ Thơng Tin nói chung có dịp vận dụng kiến thức học trường vào thực tiễn Em xin chân thành cảm ơn giúp đỡ thầy cô trường Đại Học Tài Chính Marketing Nhất thầy khoa Cơng Nghệ Thông Tin Cho em gởi lời cảm ơn đến cô Nguyễn Thị Trần Lộc người tận tính giúp đỡ, hướng dẫn cách thực đề tài em để em hoàn thành đề tài Và gởi lời cảm ơn đến bạn nhiệt huyết giúp đỡ, nhận xét, đóng góp ý kiến cho thời gian thực đề tài Mặc dù cố gắng tìm tịi học hỏi thiếu xót điều tránh khỏi, mong nhận xét góp ý thầy bạn bè Một lần xin cảm ơn thầy cô bạn bè ! TP.Hồ Chí Minh, tháng 12 năm 2021 Sinh viên thực Nguyễn Võ Quốc Huy - Trần Kìm Tấn Lợi v ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ DANH MỤC TỪ VIẾT TẮT CSDL Cơ sở liệu KPDL Khai phá liệu vi ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ DANH MỤC THUẬT NGỮ ANH – VIỆT Data mining Khai phá liệu Streaming Systems Hệ thống xử lý luồng vii ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ DANH MỤC CÁC HÌNH ẢNH Hiình 2-1: Phương pháp phân lớp – bước học 16 Hiình 2-2: Phương pháp phân lớp – bước phân lớp 16 Hiình 2-3: Decision Tree – Cây định 17 Hiình 2-4: Phương pháp gom cụm 19 Hiình 2-5: Quá trình khai phá luật kết hợp 20 Hiình 2-6: Phần mềm RapidMiner 21 Hiình 2-7: Trang chủ phần mềm RapidMiner 23 Hiình 2-8: Di chuyển đến trang download phần mềm .23 Hiình 2-9: Đăng ký tài khoản 24 Hiình 2-10: Download phần mềm 24 Hiình 2-11: File setup phần mềm RapidMiner .24 Hiình 2-12: Giao diện phần mềm RapidMiner 25 Hiình 2-13: Phân lớp đữ liệu với định – Bước 26 Hiình 2-14: Phân lớp đữ liệu với định – Bước 27 Hiình 2-15: Phân lớp đữ liệu với định – Bước 28 Hiình 2-16: Phân lớp đữ liệu với định – Bước 29 Hiình 2-17: Phân lớp đữ liệu với định – Bước 30 Hiình 2-18: Phân lớp đữ liệu với định – Bước 30 Hiình 2-19: Phân lớp đữ liệu với định – Bước 31 Hiình 2-20: Phân lớp đữ liệu với định – Bước 32 Hiình 2-21: Phương pháp gom cụm thuật toán K-Means – Bước 32 Hiình 2-22: Phương pháp gom cụm thuật tốn K-Means – Bước 33 Hiình 2-23: Phương pháp gom cụm thuật toán K-Means – Bước 34 Hiình 2-24: Phương pháp gom cụm thuật tốn K-Means – Bước 35 Hiình 2-25: Phương pháp luật kết hợp thuật toán FP Growth – Bước 35 Hiình 2-26: Phương pháp luật kết hợp thuật tốn FP Growth – Bước 36 Hiình 2-27: Phương pháp luật kết hợp thuật toán FP Growth – Bước 37 Hiình 2-28: Phương pháp luật kết hợp thuật toán FP Growth – Bước 37 Hiình 2-29: Phương pháp luật kết hợp thuật toán FP Growth – Bước 38 viii ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 2-30: Phương pháp luật kết hợp thuật toán FP Growth – Bước 39 Hiình 2-31: Phương pháp luật kết hợp thuật tốn FP Growth – Bước 39 Hiình 3-1: Tập liệu gốc 43 Hiình 3-2: Tập liệu sau tiền xử lý 44 Hiình 3-3: Khởi động phần mềm RapidMiner 45 Hiình 3-4: Thêm tập liệu vào phần mềm 46 Hiình 3-5: Tìm tập liệu thêm vào phần mềm .46 Hiình 3-6: Chọn tập liệu .46 Hiình 3-7: Định dạng kiểm tra tập liệu 47 Hiình 3-8: Thay đổi kiểu liệu thuộc tính phù hợp trước thêm vào phần mềm 48 Hiình 3-9: Hồn thành việc thêm liệu vào phần mềm 48 Hiình 3-10: Dữ liệu hoàn tất đưa vào phần mềm 49 Hiình 3-11: Thực thi thuật toán C4.5 vẽ định – “Đưa liệu vào” .49 Hiình 3-12: Thực thi thuật tốn C4.5 vẽ định – “Chọn thuộc tính cần dùng” 50 Hiình 3-13: Thực thi thuật tốn C4.5 vẽ định – “Đặt nhãn cho thuộc tính phân lớp” 51 Hiình 3-14: Thực thi thuật toán C4.5 vẽ định – “Phân chia liệu” .52 Hiình 3-15: Thực thi thuật toán C4.5 vẽ định – “Vẽ định” 52 Hiình 3-16: Thực thi thuật tốn C4.5 vẽ định – “Tạo mẫu áp dụng” .53 Hiình 3-17: Thực thi thuật toán C4.5 vẽ định – “Tính độ đưa kết dự đốn” 53 Hiình 3-18: Thực thi thuật tốn C4.5 vẽ định – “Chạy thuật toán” 54 Hiình 3-19: Thực thi thuật tốn C4.5 vẽ định – “Cây định” 54 Hiình 3-20: Thực thi thuật toán C4.5 vẽ định – “Bảng độ xác kết dự đốn” 55 Hiình 3-21: Thực thi thuật tốn K-Means gom cum tập liệu – “Đưa liệu vào” 57 ix ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ + Độ xác decision (mức độ đánh giá chất lượng) có giá trị unacc (khơng thể chấp nhận) chiếm 73.39% + Độ xác decision (mức độ đánh giá chất lượng) có giá trị acc (có chấp nhận) chiếm 37.84% + Độ xác decision (mức độ đánh giá chất lượng) có giá trị vgood (cực kì tốt) chiếm 0% + Độ xác decision (mức độ đánh giá chất lượng) có giá trị good (tốt) chiếm 0% - Tóm lại, ta thay đổi tiêu chí phân lớp để thực phương pháp phân lớp với nhiều thuật tốn khác để có dự đốn kết phù hợp thực tế 3.5 Phương pháp gom cụm 3.5.1 Mục tiêu Hiện có nhiều thuật toán áp dụng để thực phương pháp gom cụm đồ án thực thuật toán K-Means để gom cụm tập liệu thành cụm theo mong muốn Từ cụm gom đươc tìm tương quan liệu đánh giá tập liệu cách nhanh chóng Đối với tập liệu sử dụng đồ án phương pháp gom cụm thuật tốn K-Means hỗ trợ tìm tương quan xe tơ từ đánh giá chất lượng xe ô tô cách nhanh chóng 3.5.2 Thực thuật tốn Bước 1: Đưa tập liệu “Car Evaluation” vào “Process” 57 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ Hiình 3-1: Thực thi thuật tốn K-Means gom cum tập liệu – “Đưa liệu vào” Bước 2: Tìm phương thức “Select Attributes” “Operators” kéo vào “Process” chọn thuộc tính cần dùng để thực gom cụm tập liệu phù hợp 58 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3-2: Thực thi thuật toán K-Means gom cum tập liệu – “Chọn thuộc tính” Bước 3: Tìm phương thức “K-Means” “Operators” kéo vào “Process” để thực thuật toán K-Means gom tập liệu thành cụm theo mong mà có tương quan với Hiình 3-3: Thực thi thuật toán K-Means gom cum tập liệu – “Thực gom cụm tập liệu” 59 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TƠ Bước 4: Chạy thuật tốn cách chọn “Start the execution” Hiình 3-4: Thực thi thuật tốn K-Means gom cum tập liệu – “Chạy thuật toán” Bước 5: Hiển thị kết chạy thuật toán K-Means gom tập liệu thành cụm Hiình 3-5: Thực thi thuật toán K-Means gom cum tập liệu – “Kết sau gom cụm tập liệu” 60 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ Hiình 3-6: Thực thi thuật tốn K-Means gom cum tập liệu – “Bảng trọng tâm thuộc tính” Hiình 3-7: Thực thi thuật tốn K-Means gom cum tập liệu – “Biểu đồ biểu diễn cụm gom” 3.5.3 Kết - Sau thực phương pháp gom cụm thuật toán K-Means, kết thu cụm, cụm chứa dòng liệu có tương đồng với Nhờ vào việc gom dòng liệu tập liệu thành cụm ta tìm tương quan dòng liệu với tập liệu dựa vào nhiều tiêu chí khác - Sau thực thuật toán K-Means ta thu kết hình 4-25, ta gom thành cụm từ 1728 dòng liệu: cụm (cluster 0) có 1296 dịng 61 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ liệu, cụm (cluster 1) có dịng liệu cụm (cluster 2) có 432 dịng liệu Đối với bảng trọng tâm thuộc tính (hình 4-26) hiển thị vị trí trọng tâm thuộc tính tập liệu - Ngồi ra, phần mềm RapidMiner cịn hỗ trợ hiển thị cụm gom thực thuật tốn K-Means lên biểu đồ hình -27 nhằm cho ta có nhìn trực quan tập liệu để ta nắm rõ tương quan xe tơ dựa nhiều tiêu chí khác từ ta phân loại mức độ đánh giá chất lượng xe ô tô Trong biểu đồ biểu diễn cụm gom (hình 4-27) ta chọn tiêu chí đánh sau: trục hồnh thuộc tính safety (mức độ an tồn) trục tung (cột giá trị) thuộc tính decision (mức độ đánh giá chất lượng xe tơ) Từ đó, ta có số kết luận sau: + Khi safety (mức độ an tồn) có giá trị low (thấp) cụm tập trung phân bố trục tung (decision - mức độ đánh giá chất lượng) có giá trị unacc (khơng thể chấp nhận) + Khi safety (mức độ an tồn) có giá trị med (trung bình) cụm tập trung phân bố nhiều trục tung có giá trị unacc (khơng thể chấp nhận) acc (có thể chấp nhận), tập trung phân bố trục trung có giá trị good (tốt) không phân bố trục tung có giá trị vgood (rất tốt) + Khi safety (mức độ an tồn) có giá trị high (cao) cụm tập trung phân bố nhiều trục tung có giá trị unacc (khơng thể chấp nhận) acc (có thể chấp nhận), tập trung phân bố trục trung có giá trị good (tốt) vgood (rất tốt) - Tóm lại, ta chọn nhiều tiêu chí đánh giá khác để thực phương pháp gom cụm nhiều thuật tốn khác tùy thuộc vào mục đích mà ta muốn gom cụm thực tế 3.6 Phương pháp luật kết hợp 3.6.1 Mục tiêu Phương pháp luật kết hợp có nhiều thuật tốn áp dụng để tạo quy luật kết hợp đồ án thực thuật toán FP-Growth để thực tạo 62 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ quy luật kết hợp Từ quy luật kết tìm đưa đánh giá phù hợp tìm thuộc tính có ảnh hưởng nhiều tập liệu Đối với tâp liệu sử dụng đồ án phương pháp luật kết hợp thuật tốn FP-Growth giúp tìm thuộc tính có ảnh hưởng nhiều đến việc đánh giá chất lượng xe ô tô tạo luật kết hợp nhằm tìm thơng số xe tơ thường xuyên xuất chung với mức độ đánh giá xe tơ 3.6.2 Thực thuật tốn Bước 1: Đưa tập liệu “Car Evaluation” vào “Process” Hiình 3-1: Thực thi thuật toán FP-Growth tạo luật kết hợp – “Đưa liệu vào” Bước 2: Tìm phương thức “Select Attributes” “Operators” kéo vào “Process” chọn thuộc tính cần dùng để thực tạo quy luật kết hợp 63 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3-2: Thực thi thuật toán FP-Growth tạo luật kết hợp – “Chọn thuộc tính” Bước 3: Tìm phương thức “Discretize By Frequency” “Operators” kéo vào “Process” để thực đổi kiểu liệu thuộc tính tập liệu thành kiểu liệu nominal 64 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3-3: Thực thi thuật toán FP-Growth tạo luật kết hợp – “Đổi kiểu liệu thành Nominal” Bước 4: Tìm phương thức “Nominal To Binominal” “Operators” kéo vào “Process” để thực đổi kiểu liệu thuộc tính tập liệu thành kiểu liệu binominal (Do thuật toán FP-Growth thực kiểu liệu binominal) 65 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3-4: Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Đổi kiểu liệu thành Binominal” Bước 5: Tìm phương thức “FP-Growth” “Operators” kéo vào “Process” để thực thuật tốn FP-Growth tìm tập hợp thuộc tính thường xuất hay cịn gọi tập mục thường xun Hiình 3-5: Thực thi thuật toán FP-Growth tạo luật kết hợp – “Tìm tập mục thường xuyên” Bước 6: Tìm phương thức “Create Association Rules” “Operators” kéo vào “Process” để tạo quy luật kết hợp từ tập hợp thuộc tính thường xuất 66 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ Hiình 3-6: Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Tạo luật kết hợp” Bước 7: Chạy thuật tốn cách chọn “Start the execution” Hiình 3-7: Thực thi thuật toán FP-Growth tạo luật kết hợp – “Chạy thuật toán” Bước 8: Hiển thị kết chạy thuật toán FP-Growth tạo quy luật kết hợp 67 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3-8: Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Tập hợp thuộc tính xuất nhau” Hiình 3-9: Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Các quy luật kết hợp tập liệu” 3.6.3 Kết - Sau thực phương pháp luật kết hợp thuật toán FP-Growth, kết đạt ta tìm tập hợp chứa mục mà mục đại diện cho tập hợp chứa thuộc tính thường xuất chung với bô liệu Từ tập hợp mà ta tìm làm sở để tìm quy luật kết hợp để biết nhân tố có ảnh hưởng nhiều đến mức độ đánh giá chất lượng xe ô tơ (decision) - Trong hình 4-35, ta nhận kết sau chạy thuật toán FP-Growth bảng chứa tập hợp mục chứa thuộc tính thường xuất nhau, ta tìm 44 mục từ liệu Mỗi mục có độ hỗ trợ khác nhau, mục chứa thuộc tính nhiều hai thuộc tính mục chứa thuộc tính thuộc tính - Từ tập hợp kiếm hình 4-35, ta tìm hai quy luật kết hợp dựa vào hình 4-36 cụ thể sau: 68 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ + Đối với xe tơ với thuộc tính numberOfPersons (số lượng người chứa xe) có giá trị (chứa tối đa người) decision (mức độ đánh giá chất lượng) có giá trị unacc (khơng thể chấp nhận) với độ hỗ trợ (Support) chiếm 33.33% độ tin cậy (Confidence) chiếm 100% + Đối với xe tơ với thuộc tính safety (mức độ an tồn) có giá trị low (thấp) decision (mức độ đánh giá chất lượng) có giá trị unacc (không thể chấp nhận) với độ hỗ trợ (Support) chiếm 33.33% độ tin cậy (Confidence) chiếm 100% - Tóm lại, ta thay đổi độ hỗ trợ tối thiểu (Min Support) độ tin cậy tối thiếu (Min Confidence) để thực phương pháp luật kết hợp nhiều thuật tốn kh để tìm luật kết hợp phù hợp với mục đích người dùng thực tế 69 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ CHƯƠNG 4: KẾT LUẬN 4.1 Kết đạt - Vận dụng sở lý thuyết môn khai phá liệu, kết đạt được:  Tổng quan khai phá liệu  Tìm hiểu phương pháp khai phá liệu (phương pháp phân lớp, phương pháp gom cụm, phương pháp luật kết hợp)  Tìm hiểu phần mềm RapidMiner  Tìm hiểu tập liệu đánh giá chất lượng xe ô tô  Thực phương pháp khai phá liệu liệu thực tế 4.2 Hạn chế - Một số hạn chế tồn động:  Chưa khai phá hết tiềm ứng dụng  Chưa áp dụng vào thực tiễn  Tập liệu chưa đủ lớn , mức độ xác chưa ổn định 70 ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ TÀI LIỆU THAM KHẢO [1] RapidMiner | Best Data Science & Machine Learning Platform 71 ... tích liệu xe tơ để đánh giá chất lượng xe ô tô ấy, chúng em định chọn đề tài ? ?Ứng dụng phần mềm RapidMiner để thực khai phá liệu việc đánh giá chất lượng xe ô tô” nhằm thực phương pháp khai phá liệu. .. thạo phần mềm RapidMiner cho việc phân tích khai phá liệu - Xử lý liệu gốc hợp lý, phù hợp với thuật toán phương pháp khai phá liệu ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG. .. Cơ sở liệu KPDL Khai phá liệu vi ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ DANH MỤC THUẬT NGỮ ANH – VIỆT Data mining Khai phá liệu Streaming

Ngày đăng: 16/04/2022, 11:46

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w