Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 84 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
84
Dung lượng
15,46 MB
Nội dung
BỘ TÀI CHÍNH TRƯỜNG ĐẠI HỌC TÀI CHÍNH – MARKETING KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN MÔN HỌC KHAI PHÁỨNGDỮ LIỆU DỤNG Đề tài: PHẦN MỀM RAPIDMIN ER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU Nguyễn Võ Quốc Huy – MSSV: 1921006708 – Mã HP: 5903 Giảng viên hướng dẫn: ThS Nguyễn Thị Trần Lộc Danh sách nhóm sinh viên thực hiện: Trần Kim Tấn Lợi TRONG–MSSV:1921006728 – Mã HP: 5903 VIỆC ĐÁNH GIÁ TP HCM, CHẤTTHÁNG12NĂM 2021 LƯỢNG CỦA XE Ô TÔ TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ TRÍCH YẾU Trong thời đại cơng nghệ 4.0 nay, quản lý doanh nghiệp cơng việc vơ phức tạp khó khăn, phải quản lý nhiều loại thông tin, liệu khác nhau, doanh nghiệp cịn phải tìm cách tối ưng hóa thơng tin liệu có nhằm đạt tiêu, mong muốn mà doanh nghiệp đề Chính lẽ việc khai phá liệu hiệu quả, xác điều vô trọng yếu cần thiết việc vận hành doanh nghiệp Thông qua khai phá liệu ta biết việc như: xu hướng mua hàng khách hàng, thói quen làm việc nhân viên biến động thị trường Qua đó, doanh nghiệp dự đốn đề chiến lược kinh doanh, quản trị cần thiết giúp đưa doanh nghiệp ngày lên lớn mạnh, phù hợp với xu hướng thị trường, dần hồn thiện cơng tác quản lý nội Chình hiểu quan trọng khai phá liệu kinh doanh nay, chúng em định thực đề tài này, nhằm ứng dụng phần mềm vào việc khai phá liệu, để có nhìn tổng quan việc khai phá liệu hiệu mang lại Phần mềm chúng em chọn RapidMiner với thao tác đơn giản dễ sử dụng việc thực hành học tập phần mềm giúp chúng em có nhìn sơ lược khai phá liệu Bên cạnh chúng em chọn tập liệu việc đánh giá chất lượng xe ô tơ Qua tụi em có nhìn đa chiều việc đánh giá chất lượng xe ô tô Kết hợp tất yêu tố tụi em hình thành đề tài: “Ứng dụng phần mềm RapidMiner để thực khai phá liệu việc đánh giá chất lượng xe ô tô” i TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ MỤC LỤC TRÍCH YẾU MỤC LỤC LỜI CẢM ƠN DANH MỤC TỪ VIẾT TẮT DANH MỤC THUẬT NGỮ ANH – VIỆT DANH MỤC CÁC HÌNH ẢNH DANH MỤC CÁC BẢNG BIỂU DẪN NHẬP Mục tiêu đồ án Phân công công việc Kế hoạch thực đồ án CHƯƠNG 1: 1.1 1.2 1.3 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1 2.1.1 2.1.2 2.1.3 2.2 2.2.1 2.2.2 2.2.2.1 2.2.2.2 Khai phá liệu BI 2.3 2.3.1 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ 2.3.2Phương pháp gom cụm 2.3.3Phương pháp luật kết hợp 2.4 Giới thiệu phần mềm RapidMiner 2.4.1Tổng quan phần mềm Rap 2.4.2Cách sử dụng phần mềm Ra 2.4.2.1.1 Cách cài đặt phần 2.4.2.1.1 Giao diện củ 2.4.2.2 Cách thức tiến hành phương pháp khai phá liệu 2.4.2.2.1 Phương pháp gom CHƯƠNG 3: ỨNG DỤNG PHẦN MỀM RAPIDMINER 3.1 Mô tả tập liệu 3.1.1Mô tả chung 3.1.2Mô tả chi tiết 3.1.2.1 Các thuộc tính tập liệu 3.1.2.2 Ưu điểm tập liệu 3.1.2.3 Nhược điểm tập liệu 3.2 Tiền xử lý liệu 3.3 Thêm tâp liệu vào phần mềm RapidMiner 3.4 Phương pháp phân lớp 3.4.1Mục tiêu 3.4.2Thực thuật toán 3.4.3 3.5 Phương pháp gom cụm 3.5.1Mục tiêu 3.5.2Thực thuật toán iii TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ 3.5.3Kết 3.6 Phương pháp luật kết hợp 3.6.1Mục tiêu 3.6.2Thực thuật toán 3.6.3Kết CHƯƠNG 4: KẾT LUẬN 4.1 Kết đạt 4.2 Hạn chế TÀI LIỆU THAM KHẢO iv TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ LỜI CẢM ƠN Đầu tiên, cho em gởi lời cảm ơn đến thầy cô, người mang đến cho em đề tài này, hội để thân em nói riêng bạn sinh viên khoa Cơng Nghệ Thơng Tin nói chung có dịp vận dụng kiến thức học trường vào thực tiễn Em xin chân thành cảm ơn giúp đỡ thầy cô trường Đại Học Tài Chính Marketing Nhất thầy khoa Cơng Nghệ Thơng Tin Cho em gởi lời cảm ơn đến cô Nguyễn Thị Trần Lộc người tận tính giúp đỡ, hướng dẫn cách thực đề tài em để em hoàn thành đề tài Và gởi lời cảm ơn đến bạn nhiệt huyết giúp đỡ, nhận xét, đóng góp ý kiến cho thời gian thực đề tài Mặc dù cố gắng tìm tịi học hỏi thiếu xót điều tránh khỏi, mong nhận xét góp ý thầy bạn bè Một lần xin cảm ơn thầy cô bạn bè ! TP.Hồ Chí Minh, tháng 12 năm 2021 Sinh viên thực Nguyễn Võ Quốc Huy - Trần Kìm Tấn Lợi v TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ CSDL KPDL vi TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ DANH MỤC THUẬT NGỮ ANH – VIỆT Data mining Khai phá liệu Streaming Systems Hệ thống xử lý luồng vii TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TƠ DANH MỤC CÁC HÌNH ẢNH Hiình 2-1: Phương pháp phân lớp – bước học 16 Hiình 2-2: Phương pháp phân lớp – bước phân lớp 16 Hiình 2-3: Decision Tree – Cây định 17 Hiình 2-4: Phương pháp gom cụm 19 Hiình 2-5: Quá trình khai phá luật kết hợp 20 Hiình 2-6: Phần mềm RapidMiner 21 Hiình 2-7: Trang chủ phần mềm RapidMiner 23 Hiình 2-8: Di chuyển đến trang download phần mềm 23 Hiình 2-9: Đăng ký tài khoản 24 Hiình 2-10: Download phần mềm 24 Hiình 2-11: File setup phần mềm RapidMiner 24 Hiình 2-12: Giao diện phần mềm RapidMiner 25 Hiình 2-13: Phân lớp đữ liệu với định – Bước 26 Hiình 2-14: Phân lớp đữ liệu với định – Bước 27 Hiình 2-15: Phân lớp đữ liệu với định – Bước 28 Hiình 2-16: Phân lớp đữ liệu với định – Bước 29 Hiình 2-17: Phân lớp đữ liệu với định – Bước 30 Hiình 2-18: Phân lớp đữ liệu với định – Bước 30 Hiình 2-19: Phân lớp đữ liệu với định – Bước 31 Hiình 2-20: Phân lớp đữ liệu với định – Bước 32 Hiình 2-21: Phương pháp gom cụm thuật toán K-Means – Bước 32 Hiình 2-22: Phương pháp gom cụm thuật tốn K-Means – Bước 33 Hiình 2-23: Phương pháp gom cụm thuật toán K-Means – Bước 34 Hiình 2-24: Phương pháp gom cụm thuật toán K-Means – Bước 35 Hiình 2-25: Phương pháp luật kết hợp thuật toán FP Growth – Bước 35 Hiình 2-26: Phương pháp luật kết hợp thuật tốn FP Growth – Bước 36 Hiình 2-27: Phương pháp luật kết hợp thuật toán FP Growth – Bước 37 Hiình 2-28: Phương pháp luật kết hợp thuật toán FP Growth – Bước 37 Hiình 2-29: Phương pháp luật kết hợp thuật toán FP Growth – Bước 38 viii TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 2-30: Phương pháp luật kết hợp thuật toán FP Growth – Bước 39 Hiình 2-31: Phương pháp luật kết hợp thuật toán FP Growth – Bước 39 Hiình 3-1: Tập liệu gốc 43 Hiình 3-2: Tập liệu sau tiền xử lý 44 Hiình 3-3: Khởi động phần mềm RapidMiner 45 Hiình 3-4: Thêm tập liệu vào phần mềm 46 Hiình 3-5: Tìm tập liệu thêm vào phần mềm 46 Hiình 3-6: Chọn tập liệu 46 Hiình 3-7: Định dạng kiểm tra tập liệu 47 Hiình 3-8: Thay đổi kiểu liệu thuộc tính phù hợp trước thêm vào phần mềm 48 Hiình 3-9: Hồn thành việc thêm liệu vào phần mềm 48 Hiình 3-10: Dữ liệu hồn tất đưa vào phần mềm 49 Hiình 3-11: Thực thi thuật tốn C4.5 vẽ định – “Đưa liệu vào” 49 Hiình 3-12: Thực thi thuật tốn C4.5 vẽ định – “Chọn thuộc tính cần dùng” 50 Hiình 3-13: Thực thi thuật toán C4.5 vẽ định – “Đặt nhãn cho thuộc tính phân lớp” 51 Hiình 3-14: Thực thi thuật toán C4.5 vẽ định – “Phân chia liệu” 52 Hiình 3-15: Thực thi thuật tốn C4.5 vẽ định – “Vẽ định” 52 Hiình 3-16: Thực thi thuật tốn C4.5 vẽ định – “Tạo mẫu áp dụng” 53 Hiình 3-17: Thực thi thuật toán C4.5 vẽ định – “Tính độ đưa kết dự đốn” 53 Hiình 3-18: Thực thi thuật toán C4.5 vẽ định – “Chạy thuật tốn” 54 Hiình 3-19: Thực thi thuật tốn C4.5 vẽ định – “Cây định” 54 Hiình 3-20: Thực thi thuật tốn C4.5 vẽ định – “Bảng độ xác kết dự đoán” 55 Hiình 3-21: Thực thi thuật toán K-Means gom cum tập liệu – “Đưa liệu vào” 57 ix TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ + Độ xác decision (mức độ đánh giá chất lượng) có giá trị unacc (khơng thể chấp nhận) chiếm 73.39% + Độ xác decision (mức độ đánh giá chất lượng) có giá trị acc (có chấp nhận) chiếm 37.84% + Độ xác decision (mức độ đánh giá chất lượng) có giá trị vgood (cực kì tốt) chiếm 0% + Độ xác decision (mức độ đánh giá chất lượng) có giá trị good (tốt) chiếm 0% - Tóm lại, ta thay đổi tiêu chí phân lớp để thực phương pháp phân lớp với nhiều thuật tốn khác để có dự đốn kết phù hợp thực tế 3.5 Phương pháp gom cụm 3.5.1 Mục tiêu Hiện có nhiều thuật toán áp dụng để thực phương pháp gom cụm đồ án thực thuật toán K-Means để gom cụm tập liệu thành cụm theo mong muốn Từ cụm gom đươc tìm tương quan liệu đánh giá tập liệu cách nhanh chóng Đối với tập liệu sử dụng đồ án phương pháp gom cụm thuật tốn K-Means hỗ trợ tìm tương quan xe tơ từ đánh giá chất lượng xe ô tô cách nhanh chóng 3.5.2 Thực thuật tốn Bước 1: Đưa tập liệu “Car Evaluation” vào “Process” 57 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3.5.2.1.1:Thực thi thuật toán K-Means gom cum tập liệu – “Đưa liệu vào” Bước 2: Tìm phương thức “Select Attributes” “Operators” kéo vào “Process” chọn thuộc tính cần dùng để thực gom cụm tập liệu phù hợp 58 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ Hiình 3.5.2.1.2:Thực thi thuật tốn K-Means gom cum tập liệu – “Chọn thuộc tính” Bước 3: Tìm phương thức “K-Means” “Operators” kéo vào “Process” để thực thuật toán K-Means gom tập liệu thành cụm theo mong mà có tương quan với Hiình 3.5.2.1.3:Thực thi thuật toán K-Means gom cum tập liệu – “Thực gom cụm tập liệu” 59 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ Bước 4: Chạy thuật tốn cách chọn “Start the execution” Hiình 3.5.2.1.4:Thực thi thuật toán K-Means gom cum tập liệu – “Chạy thuật toán” Bước 5: Hiển thị kết chạy thuật tốn K-Means gom tập liệu thành cụm Hiình 3.5.2.1.5:Thực thi thuật toán K-Means gom cum tập liệu – “Kết sau gom cụm tập liệu” 60 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3.5.2.1.6:Thực thi thuật toán K-Means gom cum tập liệu – “Bảng trọng tâm thuộc tính” Hiình 3.5.2.1.7:Thực thi thuật toán K-Means gom cum tập liệu – “Biểu đồ biểu diễn cụm gom” 3.5.3 Kết - Sau thực phương pháp gom cụm thuật toán K-Means, kết thu cụm, cụm chứa dịng liệu có tương đồng với Nhờ vào việc gom dòng liệu tập liệu thành cụm ta tìm tương quan dịng liệu với tập liệu dựa vào nhiều tiêu chí khác - Sau thực thuật toán K-Means ta thu kết hình 4-25, ta gom thành cụm từ 1728 dịng liệu: cụm (cluster 0) có 1296 dịng 61 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ liệu, cụm (cluster 1) có dịng liệu cụm (cluster 2) có 432 dịng liệu Đối với bảng trọng tâm thuộc tính (hình 4-26) hiển thị vị trí trọng tâm thuộc tính tập liệu - Ngồi ra, phần mềm RapidMiner hỗ trợ hiển thị cụm gom thực thuật toán K-Means lên biểu đồ hình -27 nhằm cho ta có nhìn trực quan tập liệu để ta nắm rõ tương quan xe ô tô dựa nhiều tiêu chí khác từ ta phân loại mức độ đánh giá chất lượng xe ô tô Trong biểu đồ biểu diễn cụm gom (hình 4-27) ta chọn tiêu chí đánh sau: trục hồnh thuộc tính safety (mức độ an tồn) trục tung (cột giá trị) thuộc tính decision (mức độ đánh giá chất lượng xe ô tơ) Từ đó, ta có số kết luận sau: + Khi safety (mức độ an tồn) có giá trị low (thấp) cụm tập trung phân bố trục tung (decision - mức độ đánh giá chất lượng) có giá trị unacc (khơng thể chấp nhận) + Khi safety (mức độ an tồn) có giá trị med (trung bình) cụm tập trung phân bố nhiều trục tung có giá trị unacc (khơng thể chấp nhận) acc (có thể chấp nhận), tập trung phân bố trục trung có giá trị good (tốt) khơng phân bố trục tung có giá trị vgood (rất tốt) + Khi safety (mức độ an tồn) có giá trị high (cao) cụm tập trung phân bố nhiều trục tung có giá trị unacc (khơng thể chấp nhận) acc (có thể chấp nhận), tập trung phân bố trục trung có giá trị good (tốt) vgood (rất tốt) - Tóm lại, ta chọn nhiều tiêu chí đánh giá khác để thực phương pháp gom cụm nhiều thuật toán khác tùy thuộc vào mục đích mà ta muốn gom cụm thực tế 3.6 Phương pháp luật kết hợp 3.6.1 Mục tiêu Phương pháp luật kết hợp có nhiều thuật tốn áp dụng để tạo quy luật kết hợp đồ án thực thuật toán FP-Growth để thực tạo 62 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ quy luật kết hợp Từ quy luật kết tìm đưa đánh giá phù hợp tìm thuộc tính có ảnh hưởng nhiều tập liệu Đối với tâp liệu sử dụng đồ án phương pháp luật kết hợp thuật tốn FP-Growth giúp tìm thuộc tính có ảnh hưởng nhiều đến việc đánh giá chất lượng xe ô tô tạo luật kết hợp nhằm tìm thông số xe ô tô thường xuyên xuất chung với mức độ đánh giá xe ô tô 3.6.2 Thực thuật toán Bước 1: Đưa tập liệu “Car Evaluation” vào “Process” Hiình 3.6.2.1.1:Thực thi thuật toán FP-Growth tạo luật kết hợp – “Đưa liệu vào” Bước 2: Tìm phương thức “Select Attributes” “Operators” kéo vào “Process” chọn thuộc tính cần dùng để thực tạo quy luật kết hợp 63 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ Hiình 3.6.2.1.2:Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Chọn thuộc tính” Bước 3: Tìm phương thức “Discretize By Frequency” “Operators” kéo vào “Process” để thực đổi kiểu liệu thuộc tính tập liệu thành kiểu liệu nominal 64 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3.6.2.1.3:Thực thi thuật toán FP-Growth tạo luật kết hợp – “Đổi kiểu liệu thành Nominal” Bước 4: Tìm phương thức “Nominal To Binominal” “Operators” kéo vào “Process” để thực đổi kiểu liệu thuộc tính tập liệu thành kiểu liệu binominal (Do thuật toán FP-Growth thực kiểu liệu binominal) 65 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3.6.2.1.4:Thực thi thuật toán FP-Growth tạo luật kết hợp – “Đổi kiểu liệu thành Binominal” Bước 5: Tìm phương thức “FP-Growth” “Operators” kéo vào “Process” để thực thuật toán FP-Growth tìm tập hợp thuộc tính thường xuất hay gọi tập mục thường xun Hiình 3.6.2.1.5:Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Tìm tập mục thường xuyên” Bước 6: Tìm phương thức “Create Association Rules” “Operators” kéo vào “Process” để tạo quy luật kết hợp từ tập hợp thuộc tính thường xuất 66 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3.6.2.1.6:Thực thi thuật toán FP-Growth tạo luật kết hợp – “Tạo luật kết hợp” Bước 7: Chạy thuật toán cách chọn “Start the execution” Hiình 3.6.2.1.7:Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Chạy thuật toán” Bước 8: Hiển thị kết chạy thuật toán FP-Growth tạo quy luật kết hợp 67 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ơ TƠ Hiình 3.6.2.1.8:Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Tập hợp thuộc tính xuất nhau” Hiình 3.6.2.1.9:Thực thi thuật tốn FP-Growth tạo luật kết hợp – “Các quy luật kết hợp tập liệu” 3.6.3 Kết - Sau thực phương pháp luật kết hợp thuật toán FP-Growth, kết đạt ta tìm tập hợp chứa mục mà mục đại diện cho tập hợp chứa thuộc tính thường xuất chung với bô liệu Từ tập hợp mà ta tìm làm sở để tìm quy luật kết hợp để biết nhân tố có ảnh hưởng nhiều đến mức độ đánh giá chất lượng xe ô tơ (decision) - Trong hình 4-35, ta nhận kết sau chạy thuật toán FP-Growth bảng chứa tập hợp mục chứa thuộc tính thường xuất nhau, ta tìm 44 mục từ liệu Mỗi mục có độ hỗ trợ khác nhau, mục chứa thuộc tính nhiều hai thuộc tính mục chứa thuộc tính thuộc tính - Từ tập hợp kiếm hình 4-35, ta tìm hai quy luật kết hợp dựa vào hình 4-36 cụ thể sau: 68 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ + Đối với xe tơ với thuộc tính numberOfPersons (số lượng người chứa xe) có giá trị (chứa tối đa người) decision (mức độ đánh giá chất lượng) có giá trị unacc (không thể chấp nhận) với độ hỗ trợ (Support) chiếm 33.33% độ tin cậy (Confidence) chiếm 100% + Đối với xe ô tô với thuộc tính safety (mức độ an tồn) có giá trị low (thấp) decision (mức độ đánh giá chất lượng) có giá trị unacc (khơng thể chấp nhận) với độ hỗ trợ (Support) chiếm 33.33% độ tin cậy (Confidence) chiếm 100% - Tóm lại, ta thay đổi độ hỗ trợ tối thiểu (Min Support) độ tin cậy tối thiếu (Min Confidence) để thực phương pháp luật kết hợp nhiều thuật toán kh để tìm luật kết hợp phù hợp với mục đích người dùng thực tế 69 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ CHƯƠNG 4: KẾT LUẬN 4.1 Kết đạt - Vận dụng sở lý thuyết môn khai phá liệu, kết đạt được: Tổng quan khai phá liệu Tìm hiểu phương pháp khai phá liệu (phương pháp phân lớp, phương pháp gom cụm, phương pháp luật kết hợp) Tìm hiểu phần mềm RapidMiner Tìm hiểu tập liệu đánh giá chất lượng xe ô tô Thực phương pháp khai phá liệu liệu thực tế 4.2 Hạn chế - Một số hạn chế tồn động: Chưa khai phá hết tiềm ứng dụng Chưa áp dụng vào thực tiễn Tập liệu chưa đủ lớn , mức độ xác cịn chưa ổn định 70 TIEU LUAN MOI download : skknchat123@gmail.com ỨNG DỤNG PHẦN MỀM RAPIDMINER ĐỂ THỰC HIỆN KHAI PHÁ DỮ LIỆU TRONG VIỆC ĐÁNH GIÁ CHẤT LƯỢNG CỦA XE Ô TÔ TÀI LIỆU THAM KHẢO [1] RapidMiner | Best Data Science & Machine Learning Platform 71 TIEU LUAN MOI download : skknchat123@gmail.com ... tích liệu xe tơ để đánh giá chất lượng xe ô tô ấy, chúng em định chọn đề tài ? ?Ứng dụng phần mềm RapidMiner để thực khai phá liệu việc đánh giá chất lượng xe ô tô? ?? nhằm thực phương pháp khai phá liệu. .. tích liệu xe tơ để đánh giá chất lượng xe ô tô ấy, chúng em định chọn đề tài ? ?Ứng dụng phần mềm RapidMiner để thực khai phá liệu việc đánh giá chất lượng xe tơ” nhằm thực phương pháp khai phá liệu. .. trường xe mô tô Nắm bắt cấp thiết việc phân tích liệu xe tơ để đánh giá chất lượng xe ô tô ấy, chúng em định chọn đề tài ? ?Ứng dụng phần mềm RapidMiner để thực khai phá liệu việc đánh giá chất lượng