Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 33 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
33
Dung lượng
1,05 MB
Nội dung
LOGO BIDS – Khách hàng tiềm năng www.ntvx.com www.ntvx.com Nội dung Giới thiệu 1 Kỹ thuật 2 Kết luận từ mô hình 3 www.ntvx.com Giới thiệu Dữ liệu được thu thập và lưu trữ trong các CSDL đã vượt ra ngoài khả năng của con người có thể hiểu được chúng nếu không có những công cụ hỗ trợ tốt. Điều này đã đặt chúng ta trong hoàn cảnh nhiều dữ liệu nhưng thiếu thông tin, thiếu tri thức. Chính vì vậy, có một kỹ thuật mới ra đời đó là “Khai phá dữ liệu”. www.ntvx.com Giới thiệu Một số hệ thống khai phá dữ liệu: Intelligent Miner (IBM) Microsoft data mining tools (Microsoft SQL Server 2000/2005/2008) Oracle Data Mining (Oracle 9i/10g/11g) Enterprise Miner (SAS Institute) Weka (the University of Waikato, New Zealand, www.cs.waikato.ac.nz/ml/weka) … www.ntvx.com Giới thiệu Để thực hiện bài tập lớn môn học lần này nhóm chúng tôi gồm có các thành viên sau: Hồ Lý Minh Nghĩa, Phan Thị Thu Thủy, Nguyễn Minh Tường Vi, Lê Anh Xuân. Đã chọn SQL server 2008 cùng với bộ công cụ của nó để mô tả cho ý tưởng của chúng tôi như sau: www.ntvx.com Giới thiệu Công ty của chúng tôi là một công ty kinh doanh về địa ốc, chúng tôi đã có 1 lượng lớn khách hàng ( KH) đã từng mua sản phẩm đất nền phân lô trong các dự án trước đây của chúng tôi. Tuy nhiên, do tình hình thị trường bất động sản có nhiều chuyển biến trong thời gian gần đây, nên công ty của chúng tôi muốn tung ra sản loại phẩm mới đó là biệt thự xây dựng sẵn. Công ty muốn tổ chức 1 hội nghị khách hàng để giới thiệu sản phẩm. www.ntvx.com Giới thiệu Vấn đề là, kinh phí để tổ chức cũng hạn hẹp, không đủ điều kiện để mời tất cả KH. Do đó bộ phận bán hàng, đề nghị chỉ mời các KH tiềm năng, nghĩa là KH có thể sẽ mua sản phẩm mới của công ty. Lúc này, gánh nặng xác định đâu là KH tiềm năng được trao cho bộ phận marketing của NTVX. Và mọi chuyện bắt đầu. www.ntvx.com Nội dung Giới thiệu 1 Kỹ thuật 2 Quá trình khám phá tri thức Data Cleaning Data Integration Data Sources Data Warehouse Knowledge Task-relevant Data Selection/Transformation Data Mining Pattern Evaluation/ Presentation Patterns www.ntvx.com www.ntvx.com Kỹ thuật Các vấn đề chuẩn bị: Dữ liệu. Lựa chọn công cụ thực hiện. Quá trình thực hiện. [...]... định trường dữ liệu nào là khóa, dữ liệu vào dùn để huấn luyện và trường dữ liệu dùng để dự báo (Nút Suggest cho phép hệ thống tự chọn các trường dữ liệu phù hợp) ->Next www.ntvx.com Kỹ thuật – Mining structures Màn hình Specify Columns Content and Data Type cho chúng ta chỉ định nội dung của trường dữ liệu cấu trúc KPDL và kiểu dữ liệu của chúng Nút Detect cho phép hệ thống tự phát hiện dữ liệu liên... phép hệ thống tự phát hiện dữ liệu liên tục hay theo khoảng) -> Next www.ntvx.com Kỹ thuật – Mining structures Màn hình Create Testing Set xuất hiện, cho chúng ta chỉ định % dữ liệu được dùng để kiểm tra độ chính xác của mô hình ( lúc này dữ liệu được chia thành 2 tập Tập HL và tập KT) ->Next www.ntvx.com Kỹ thuật – Mining structures Đặt tên cho cấu trúc của mô hình và tên mô hình -> Nhấn Finish Để chạy... tất cả họ có thể là KH tiềm năng Đường xanh lá: đồ thị biểu diễn của mô hình, có nghĩa là liên hệ với 3% KH thì sẽ có khoảng 62% trong đó có tiềm năng www.ntvx.com Kết luận từ mô hình Mining Legend ( chú thích): Predict probability: gía trị ngưỡng của mô hình, có ý nghĩa là nếu dùng mô hình này để dự đoán thì cần có Predict probability >=27,74% mới đáng tin cậy www.ntvx.com Kết luận từ mô hình Tạo dự... Next www.ntvx.com Kỹ thuật – Mining structures Cửa sổ Create the Data Mining Structure xuất hiện, chọn mô hình Microsoft Decision Trees -> Next www.ntvx.com Kỹ thuật – Mining structures Chọn DSV vừa tạo trước đó -> Next Chọn bảng chính ( case ) và bảng phụ ( nested) Ở đây do dữ liệu của chúng ta chỉ lấy từ 1 bảng nên hệ thống đã chọn mặc định -> Next www.ntvx.com Kỹ thuật – Mining structures Màn hình... -> Run Cho đến khi có thông báo như hình sau: www.ntvx.com Kỹ thuật – Mining structures www.ntvx.com Nội dung 1 Giới thiệu 2 Kỹ thuật 3 Kết luận từ mô hình www.ntvx.com Kết luận từ mô hình Xem mô hình vừa tạo: thẻ Mining Model Viewer www.ntvx.com Kết luận từ mô hình Đánh giá hiệu quả mô hình: thẻ Mining Accuracy Chart www.ntvx.com Kết luận từ mô hình Thanh trượt dọc: thể hiện % các liên hệ với KH (hiện... hiện Chọn New Cấu hình nguồn dữ liệu bằng cách chọn server name và chọn Database Nhấn Ok www.ntvx.com Kỹ thuật - DataSource Quay lại màn hình Select how to define the connection, chọn Next Nhập user name và pasword cho connetion vừa tạo rồi nhấn Next Đặt tên cho Data Source và nhấn Finish Như vậy chúng ta đã có nguồn dữ liệu cho các tác vụ tiếp theo www.ntvx.com Kỹ thuật – DataSource View Trong cửa... Vào thẻ Mining Model Prediction, trải qua các bước chọn mô hình, bảng dữ liệu để ánh xạ các trường thông tin, ta sử dụng công cụ Prediction Query Builder Ta được hình sau: www.ntvx.com Kết luận từ mô hình Nhấp chuột vào nút chuyển đổi chế độ (design / query / result ) Ta được kết quả như hình sau: KH này có thể là KH tiêm năng với khả năng dự đoán đúng là 52% www.ntvx.com LOGO CẢM ƠN! www.NTVX.com ... tạo lúc trước ->Next Màn hình Select Table and views xuất hiện Chọn table Dulieu_vao ->Next www.ntvx.com Kỹ thuật – DataSource View Đặt tên cho Data Source view và nhấn Finish Như vậy chúng ta đã có khung nhìn nguồn dữ liệu Công việc tiếp theo là tạo mô hình huấn luyện www.ntvx.com Kỹ thuật – Mining structures Tại cửa sổ Solution Explorer nhấp chuột phải vào Mining Structures -> New Mining Structure Cửa...Kỹ thuật Dữ liệu gốc ( mẫu): DonVi BDHTA BDHDA CDBDT CDBDT CDBDT CDBDT CDBDT PL_KH 23 23 23 23 21 21 21 MKH BDG000000233 BDG000000247 BDG000000249 BDG000000255 BDG000000256 BDG000000258 BDG000000258 doanhthu 220000... BDG000000028 1 186030 0 CDBDT 21 BDG000000036 1 0 0 BDHDA 21 BDG000000037 1 25671 0 BDHDA 23 BDG000000053 2 393179 0 CDBDT 21 BDG000000093 1 28390 0 CDBDT 23 BDG000000154 1 55651 0 www.ntvx.com Kỹ thuật – Tạo Project Khởi động Microsoft Visual Studio -> chọn menu File ->New -> Project Chọn Business Intelligence Projects -> Analysis Services Project Tại mục Name ta đặt tên cho Project là KhachHangTiemNang, . LOGO BIDS – Khách hàng tiềm năng www.ntvx.com www.ntvx.com Nội dung Giới thiệu 1 Kỹ thuật 2 Kết luận từ mô hình 3 www.ntvx.com Giới thiệu Dữ liệu được thu thập và lưu. thức. Chính vì vậy, có một kỹ thuật mới ra đời đó là Khai phá dữ liệu . www.ntvx.com Giới thiệu Một số hệ thống khai phá dữ liệu: Intelligent Miner (IBM) Microsoft data mining tools. bộ phận bán hàng, đề nghị chỉ mời các KH tiềm năng, nghĩa là KH có thể sẽ mua sản phẩm mới của công ty. Lúc này, gánh nặng xác định đâu là KH tiềm năng được trao cho bộ phận marketing của