Ứng dụng xác định khách hàng cho công ty Adventrure Work

Một phần của tài liệu Đồ án tốt nghiệp đại học các giải thuật khai phá dữ liệu trên SQL server 2005 và ứng dụng (Trang 54 - 58)

1.Định nghĩa vấn đề

Vấn đề đặt ra của bài toán cho ứng dụng đợc trình bày trong phần II để giải thích nguyên tắc của hai thuật toán Naive Bayes và Cây quyết định:

Trong chiến lợc quảng cáo về mẫu xe đạp mới của phòng Marketing thuộc công ty Adventure Works Cycle, họ quyết định dùng cách phát tờ rơi. Để giảm chi phí, họ muốn chỉ gửi đến những khách hàng quan tâm đến mặt hàng này. Bằng cách xây dựng mô hình dự báo từ dữ liệu về khách hàng của công ty.

Dữ liệu về khách hàng của công ty Adventure Cycle gồm 18484 khách hàng.

Hình 4.13: Dữ liệu về khách hàng đã mua hàng tại công ty.

Với các thuộc tính:

Thuộc tính Diễn giải

Age Tuổi

BikeBuyer Có mua xe không?

CommuteDistance K/C từ nhà đến nới làm việc

CustomerKey Mã khách hàng

EnglishEducation Trình độ tiếng anh

Gender Giới tính

HouseOwnerFlag Có là chủ nhà không?

MaritalStatus Tình trạng hôn nhân

NumberCarsOwned Số xe hơi sở hữu

NumberChildrenAtHome Số đứa trẻ ở nhà

EnglishOccupation Việc làm với tiếng anh

Region Vùng

TotalChildren Tổng số đứa trẻ

YearlyIncome Thu nhập hàng năm

3. Khám phá dữ liệu

Tơng tự với ứng dụng dự đoán giá cổ phiếu trình bày ở trên, với đối t- ợng Data Suorces: Adventure Works.ds và Data Source Views: Adventure Works.dsv

4. Xây dựng mô hình

ứng dụng sử dụng hai mô hình TM Naive Bayes và TM Decision Tree đợc xây dựng sãn trong Project Adventrure Work đính kèm bộ cài SQL Server 2005 với cấu trúc nh sau:

Hình 4.14: Cấu trúc mô hình TM Decision Tree và TM NaiveBayes

5. Khai thác và đánh giá mô hình

Xem phần nguyên tắc của thuật toán MS Decision và MS Naive Bayes.

6. Xây dựng ứng dụng Adventure Work

ứng dụng đợc xây dựng ở tab Adventure Work của chơng trình.

Sau khi chọn các đặc điểm về : Age, Total children, Commute Distance, Number Cars Owned của một khách hàng và click vào nút Dự đoán, chơng trình sẽ đa ra các xác suất (Hình 4.15). (adsbygoogle = window.adsbygoogle || []).push({});

Với mô hình NaiveBayes đa ra:

- Trong số những ngời mua xe, xác suất một ngời có đặc điểm đã chọn.( hình 4.15: trong số những ngời mua xe tại công ty, thì xác

suất một khách hàng có Age=52, TotalChidre=4, Commute Distance = 2-5 Miles và Number Cars Owned=0 là 61,47%. )

- Trong số những ngời không mua xe tại công ty, xác suất một khách hàng có những đặc điểm đã chọn. ( hình 4.15: trong số những ngời không mua xe, xác suất một khách hàng có Age=52, TotalChidre=4, Commute Distance = 2-5 Miles và Number Cars Owned=0 là 38,53%.)

Với mô hình Decision Tree đa ra:

- Xác suất khách hàng này mua xe của công ty.( hình 4.15: Xác suất một khách hàng có Age=52, TotalChidre=4, Commute Distance = 2-5 Miles và Number Cars Owned=0 sẽ mua xe là 39,77%)

- Xác suất khách hàng này mua xe của công ty.( hình 4.15: Xác suất một khách hàng có Age=52, TotalChidre=4, Commute Distance = 2-5 Miles và Number Cars Owned=0 sẽ mua xe là 60,23%)

Hình 4.15: Giao diện ứng dụng Adventure Work

Với ứng dụng này phòng marketing của công ty Adventure Work, có thể xác định sẽ tập trung giới thiệu loại xe đạp mới vào những đối tợng khách hàng nào, để giảm kinh phí cho chiến dịch quảng cáo bằng cách phát tờ rơi.

Chơng V

Kết luận

Data mining đang nhanh chóng trở thành một kỹ thuật phân tích đợc sử dụng rộng rãi. Báo cáo này tôi đã trình bày ba thuật toán data mining trong SQL Server 2005 Analysis Services: Microsoft Naive Bayes, Microsoft Decision Trees và Microsoft Time Series. Báo cáo cũng trình bày cách xây dựng các mô hình data mining giúp giải quyết các vấn đề trong thực tiễn và cách phát triển ứng dụng với ba mô mình khai phá đợc xây dựng bằng ba thuật toán đã nghiên cứu, qua kiểm tra chơng trình đa ra kết quả dự đoán khá chính xác giúp nhà kinh doanh có thể tham khảo khi đ- a ra các quyết định.

Với SQL Server 2005 Analysis Services, data mining không còn là đặc quyền của các nhà thống kê. Ngời sử dụng không cần biết đến các phức tạp của các thuật toán data mining. Mỗi ngời phát triển CSDL đều có khả năng tạo và huấn luyện các mô hình data mining và nhúng các tính năng nâng cao vào các ứng dụng của họ.

TàI LIệU THAM KHảO

[1]. ZhaoHui Tang and Jamie MacLennan, Data Mining with SQL Server 2005.

[2]. Các ý kiến của các chuyên gia Data Mining trong diễn đàn MSDN Forums tại website: http://social.msdn.microsoft.com

Một phần của tài liệu Đồ án tốt nghiệp đại học các giải thuật khai phá dữ liệu trên SQL server 2005 và ứng dụng (Trang 54 - 58)