Trình bày kết quả

Một phần của tài liệu Khám phá tri thức trong dữ liệu không gian dựa trên mật độ (Trang 71)

III – ÁP DỤNG THỰC TIỄ N:

6- Trình bày kết quả

Trong phần trƣớc, chúng ta xem xét các bƣớc theo đó để có đƣợc kết quả khai phá bằng cách sử dụng những phƣơng pháp khai phá dự đoán khác nhau. Bƣớc 6 trong phƣơng pháp khai phá là giải thích những kết quả chúng ta thu đƣợc và xác định cách nào để hƣớng chúng vào công việc kinh doanh. Khi lần đầu tiên chúng ta đƣơng đầu với những kết quả này, câu hỏi đầu tiên đƣợc đặt ra là “tất cả những điều này có ý nghĩa gì? ”

Trong phần này, chúng ta diễn tả cách để hiểu và giải thích các kết quả dựa theo những phƣơng pháp khác nhau.

Mô hình đƣợc xây dựng nhờ cây thƣ mục RBF, mạng dự đoán Nơron và sau đó mô hình đƣợc so sánh bằng các biểu đồ lợi ích. Trong phần tiếp theo, chúng ta nhìn nhận chi tiết từ viễn cảnh kinh doanh.

Cây thƣ mục:

Cây thƣ mục đƣa ra một mô hình cây với một ma trận lẫn lộn để xem kết quả của mô hình nhƣ chỉ ra trong hình 19

Trong trƣờng hợp này, toàn bộ lỗi chiếm 26,12% điều này nghĩa là:

o Trong 1053 khách hàng là những ngƣời khuấy động; 523 ngƣời đƣợc phân

loại chính xác và 530 còn lại thì không .

o Trong 2967 khách hàng không phải là ngƣời khuấy động: 2447 đƣợc phân

loại chính xác và 520 ngƣời còn lại thì không.

o Trong 4020 khách hàng : 1050 khánh hàng đã bị phân loại sai.

Chúng ta có thể thực hiện nhiều lần tiến trình này để cải tiến tỉ lệ lỗi của mô hình cây bằng cách sử dụng nhiều chọn lựa khác nhau trong mô hình dữ liệu khuấy động để xây dựng cây và kiểm tra cây sử dụng cột dữ liệu kiểm tra.

Một tỉ lệ lỗi chấp nhận đƣợc có thể đƣợc quyết định bằng cách xác minh mô hình với những cột dữ liệu kiểm tra khác để xem tỉ lệ lỗi có ổn định hay

không và thông qua môi trƣờng kinh doanh ví dụ nhƣ tỉ lệ khuấy động và khả năng của chƣơng trình tiếp thị.

Trƣờng hợp này, tỉ lệ khuấy động thực tế thấp hơn 5% và nhƣ chúng ta thấy độ chính xác mô hình là 74%, độ chính xác trong số những ngƣời khuấy động lên tới 50%(1053 có kết quả trái ngƣợc với 523). Sử dụng cột dữ liệu kiểm tra, tỉ lệ lỗi tăng lên từ từ. Tuy nhiên, nhịp độ lỗi khá ổn định trong nhiều cột dữ liệu kiểm tra.

Kết quả đồ thị của mô hình cây đƣợc biểu diễn ở hình 20

Cây bắt đầu từ đỉnh và mở rộng cành cho tới khi nó đạt đƣợc kết quả phân loại tối ƣu. Có những lúc lá ở tầng dƣới khi cây tiến tới mức độ tối ƣu và chia ra khách hàng theo những qui tắc nào đó.

Thông qua quá trình trực quan hóa của Cây thƣ mục, chúng ta có thể thấy cách phân loại cho mỗi nút lá và biến dữ liệu quan trọng nhất để xây dựng qui tắc. Nhƣ chúng ta thấy trong hình 5-6 OUTSPHERE đƣợc coi nhƣ là biến dữ liệu quan trọng nhất sau đó là HANDSET, CUSTOMER RATEv.v…., Bởi vì những dữ liệu biến đó xuất hiện nhiều trong phần đầu cây. Bây giờ nhƣ là ví dụ xem xét

một nút là đƣợc sắp xếp nhƣ là những ngƣời không khuấy động. nhƣ trong hình trên theo những qui ƣớc đƣợc trình bày đây là những ngƣời khách hàng mà:

o Sử dụng 3 hoặc nhiều hơn số lƣợng số điện thoại dùng để gọi ra máy khác

(OUTSPHERE)

o Sử dụng kiểu máy điện thoại cũ (HANDSET)

o Hoặc là không có thời hạn giao ƣớc hợp đồng từ đầu hoặc là hợp đồng chƣa hết hạn (CONTRACT-DUR)

o Có tỉ lệ gọi thành công cao (CALL QUALITY)

Nút lá này có 81,3% thuần khiết

Chúng ta có thể xem trên nút HANDSET của cây, chúng không có cành nào mà hầu hết là ngƣời không khuấy động rẽ từng nút. Đây là những khách hàng 3 hoặc nhiều hơn số điện thoại gọi đi nếu máy điện thoại của họ loại mới (HANDSET), khi đó có lẻ họ sẽ tiếp tục cộng tác với công ty. Qui định này có 91,6% thuần khiết.

o Theo những qui luật trình bày, đây là những khách hàng mà 3 qui định đầu tiên giống với những khách hàng không khuấy động ngoại trừ những khác biệt sau:thấp hoặc trung bình

o Không có nhiều cuộc gọi không tính khung thời gian, đêm, ngày lễ và đặc

biệt không tính đối với khung thời gian tron ngày. Họ rất trẻ (từ 20 - 20), hay rất già (70 - 80)

o Tỉ lệ gọi thành công

Độ thuần khiết của nút này là 36,7%

Cần đƣợc điều tra kỹ hơn nhằm tìm ra tại sao những cuộc gọi không tính cƣớc so với tổng số cuộc gọi có liên hệ tới sự khuấy động của khách hàng đặc biệt là giới trẻ. Trong trƣờng hợp này, Công ty có những cuộc gọi không tính cƣớc cho giới trẻ trong khung thời gian nào đó, điều này có ý nghĩa kinh tế trong công cuộc cạnh tranh thƣơng mại. tuy vậy, những khách hàng này không sử dụng

nhiều cuộc gọi không tính cƣớc khung thời gian và có thể cũng không biết về kế họach miễn cƣớc đặc biệt này, vì thế cải tiến này vô hiệu. Hơn nữa, họ lại sử dụng máy điện thoại cũ, do đó chất lƣợng cuộc gọi không tốt điều này khiến họ ngừng công tác với Công ty mặc dù thời hạn hợp đồng chƣa kết thúc. Đây có thể là một kết quả.

Chúng ta có thể tìm thấy một qui định khác chống khuấy động ở phần trên của cây, diễn giải rằng những khách hàng này sử dụng mẫu điện thoại cũ và nếu hợp đồng đã hết hạn. Điều này chỉ ra độ khuấy động của khách hàng, phần trăm thuần khiết của nút này là 48%.

Chúng ta chỉ nghiên cứu phần bên phải của cây vì phần bên trái có nhiều dữ liệu biến hầu nhƣ chỉ liên quan tới ngƣời sử dụng. Nếu khách hàng không sử dụng điện thoại nhiều, họ có khả năng rời Công ty cao.

Nếu chúng ta có thể tìm đƣợc nhiều biến có ƣu thế từ viễn cảnh tiếp thị để chỉ ra độ viễn cảnh của khách hàng từ đó tận dụng những dữ liệu các biến này trong mô hình dự đoán.

Trƣờng hợp này, loại máy và loại mô hình đảm nhiệm quá trình. RBF

Bằng cách sử dụng RBF chúng ta chia kết quả thành từng miền hay trong “quantiles”

Để có một cái nhìn “quantiles” khách hàng đƣợc sắp đặt dựa theo giá trị dự đoán và sự phân chia của “quantiles” của kết quả dự đoán. Ví dụ nhƣ, dãy đầu tiên trong hình 23 chỉ ra thông tin thống kê “bivariate” trong số 2% đầu tiên của kết quả dự đoán, và dãy cuối chỉ ra 2% cuối cùng của kết quả dự đoán.

Nếu chúng ta so sánh 2 “quantiles” này cùng nhau, chúng ta sẽ có ý tƣởng về đặc điểm cá nhân khác giữa ngƣời khuấy động và ngƣời không khuấy động trong mô hình chúng ta đã sử dụng.

Xem xét chi tiết ”quantiles” 98-100%, ở hình 24, điểm này tƣợng trƣng cho những khách hàng mà:

o Đƣờng dây giống nhƣ là không còn họat động hay đã bị đình chỉ (STATUS)

o Giảm xu hƣớng gọi trong 6 tháng gần đây (CALL-TREND)

o Sử dụng tới 40-50% cuộc gọi miễn cƣớc trong tổng số cuộc gọi

(DISCOUT-RATE)

o Sử dụng 5 hoặc ít hơn những số điện thoại gọi đi(OUTSPHERE)

o Đặc biệt, dùng loại máy cũ.

Chúng ta cũng có thể thấy những dữ liệu biến khác mục đích để hiểu dấu hiệu của 2% đầu dự đoán của mô hình RBF nhƣ CUSTOMER_RATE, PAY_METHOD, AGE, SVC_NOFREE, TOTAL_DUR, GENDER, TENURE, AGENT, giới tính (GENDER) đƣợc sử dụng làm dữ liệu biến bổ sung diễn tả mỗi nhóm khách hàng không phải là dữ liệu biến sử dụng cho RBF hình 24 chỉ ra “quatiles’ từ 0-2% nhận ra ngƣời không khuấy động.

Những khách hàng có tỉ lệ cao (CUSTOMER_RATE) và sử dụng mẫu điện thoại mới (HANDSET), có khả năng sử dụng điện thoại (TOTAL_DUR), phần đa là nam, thời hạn hợp đồng là 26 tháng hoặc hơn có tỉ lệ thành công cao.

Sau khi kiểm tra mẫu sử dụng RBF, chúng ta có thể xác minh chất lƣợng mẫu cột dữ liệu kiểm tra.

Chúng ta có thể thấy mỗi dữ liệu biến đƣợc so sánh với hình dƣới đây:

Kiểm tra mạng lƣới Nơron:

Kết quả dự đoán Nơron cũng cho ra kết quả giống nhƣ RBF, kết quả mà khung cảnh “quantiles” dựa vào kết quả dự đoán. Cách sử dụng mô hình cây, ví dụ nhƣ, ở phần trên và dƣới 10% khách hàng phụ thuộc vào giá trị dự đoán để nhận diện đặc điểm ngƣời không khuấy động.

b) So Sánh Cách Trình Bày:

Bây giờ, sử dụng dự đoán cây thƣ mục, RBF và mạng Nơron động của khách hàng. Chúng ta có thể nhìn thấy kết quả nhờ 3 phƣơng pháp cho ra một chiến dịch duy trì. Tính chính xác của mô hình , nói cách khác khả năng dự đoán

là nhân tố quan trọng cho việc triển khai các giai đoạn trong thực tế. Chúng ta có tự tin rằng mô hình dự đoán khách hàng dự định rời đi của chúng ta là đúng hay không ? Chúng ta cần so sánh thực hiện của mỗi mô hình và chọn cái tốt nhất. Chúng ta có thể so sánh giá trị thân bằng biểu đồ lợi ích hoặc điều hành những chiến dịch kiểm tra dựa vào danh sách khách hàng đƣa ra của mỗi mô hình.

Dựa vào biểu đồ lợi ích

Dƣới đây là biểu đồ lợi ích để ƣớc lƣợng mô hình.

Biểu đồ này hàm ý những nội dung sau:

Nếu chúng ta chọn ngẫu nhiên 10% khách hàng nhƣ là khách hàng mục đích cho chiến dịch của chúng ta (biểu thị là dòng cơ sở màu trắng) , sau đó chúng ta sẽ tiến tới chính xác 10% ngƣời khuấy động trong tƣơng lai.

o Nếu chúng ta chọn 10% khách hàng dựa vào mô hình cây nhƣ là khách

hàng đích (biểu diễn dòng màu đen từ trên xuống), Sau đó chúng ta sẽ có chính xác 30% ngƣời khuấy động trong tƣơng lai

o Riêng đối với mô hình dự đoán RBF và Nơron chúng ta sẽ có 25% ngƣời khuấy động trong tƣơng lai.

Dựa vào biểu đồ lợi ích, mô hình thƣ mục cây biểu diễn RBF. Tuy nhiên, chỉ có sự đánh giá kỹ thuật dựa vào dữ liệu trƣớc đây không đổi để ƣớc lƣợng độ chính xác của mô hình cho việc triển khai chắc chắn.

Dựa vào chiến dịch thử nghiệm

Việc thực hiện dự đoán trên thực tế không thể đƣợc ƣớc lƣợng dễ dàng. Thông qua chiến dịch thử nghiệm, chúng ta có thể xem mô hình dự đoán là chiến dịch duy trì có hỗ trợ nhau để đạt hiệu quả hay không? chiến dịch thử nghiệm có thể đƣợc thực hiện nhờ vào danh sách khách hàng đƣa ra ở mỗi mô hình mà có xác xuất rơi trong khoảng chỉ số nào đó. Bảng sau đây chỉ ra các trƣờng hợp đã đƣợc ƣớc lƣợng và tính toán khi mô hình đƣợc ƣớc lƣợng dựa vào chiến dịch thử nghiệm.

Một phần của tài liệu Khám phá tri thức trong dữ liệu không gian dựa trên mật độ (Trang 71)

Tải bản đầy đủ (PDF)

(85 trang)