.10 Các quy tắc kết hợp cấp 4 được sắp xếp theo độ tin cậy

Một phần của tài liệu (LUẬN văn THẠC sĩ) phương pháp thống kê trong kinh doanh và tài chính (Trang 86 - 89)

xcii Ta thấy một số kết hợp cấp 2 trong bảng 3.7 cũng xuất hiện trong bảng 3.9. Bảng 3.10 cho thấy các kết quả tương đồng, lần này được sắp xếp theo độ tin cậy. Chú ý rằng những giá trị độ tin cậy bây giờ là khá cao. Chẳng hạn nếu 1 giao dịch chứa tomato souce, oil và crackers thì nó sẽ chắc chắn chứa pasta với độ tin cậy 100%. Tuy nhiên giá

của quy tắc này chỉ bằng 1,41%.

3.1.5 So sánh mơ hình

Thật khó khăn để đánh giá các mơ hình địa phương vì một độ đo tồn diện của sự đánh giá mâu thuẫn với bản chất địa phương của mơ hình. Hơn nữa vì ý tưởng của việc tìm kiếm các mơ hình địa phương và các quy tắc là rất mới, nên có rất ít sự đồng thuận trong các tài liệu khai thác dữ liệu về cách đo tính hiệu quả của chúng. Một ý tưởng tự nhiên là đo sự tiện ích của các mơ hình – chúng dành cho các nhà phân tích. Vì thật khó khăn để mơ hình hóa đánh giá của một nhà phân tích nên ta thường giả sử một tình huống đánh giá khơng có dạng đầy đủ. Các độ đo cho một quy tắc do đó có thể được sử dụng để đánh giá hiệu suất. Trong nghiên cứu này, ta đã xét giá và độ tin cậy như là các độ đo chính, xác nhận một tập các quy tắc kết hợp. Nhưng những nhu cầu của người dùng sẽ điều chỉnh một độ đo tốt nhất trong 2 độ đo đó cho việc chọn 1 tập các quy tắc. Giá có thể được sử dụng để đánh giá tầm quan trọng của 1 quy tắc về khả năng xuất hiện trong cơ sở dữ liệu; độ tin cậy có thể được sử dụng để điều tra sự phụ thuộc giữa các biến.

Cuối cùng là, một tập quy tắc phải được đánh giá về khả năng đáp ứng các mục tiêu phân tích. Ở đây các mục tiêu chủ yếu là tổ chức lại cách bố trí của một đại lý bán hàng và để lên kế hoạch quảng cáo nhằm tăng doanh thu. Một khi các kết hợp được xác định thì có thể tổ chức các chương trình quảng cáo trong đại lý để các sản phẩm đưa ra chào hàng được đặt cùng với các sản phẩm khác không kết hợp. Tương ứng với việc đặt một sản phẩm để quảng cáo ta sẽ làm tăng doanh số bán hàng của các sản phẩm kết hợp.

Ở đầu chương ta đã thấy rằng các tỷ số chênh và các mơ hình loga tuyến tính cũng có thể được dùng để xác định một cấu trúc kết hợp toàn diện giữa các biến mua hàng; trong trường hợp này, các độ đo thống kê truyền thống như G2 hay AIC và BIC có thể được dùng để đánh giá chất lượng tổng thể của một mơ hình. Dù các quy tắc kết hợp dễ phát hiện và dễ hiểu hơn nhiều, nhưng tơi tin rằng mơ hình hóa tồn diện sẽ tốt khi được

xciii biểu thị bởi các mơ hình loga tuyến tính, nó cho phép các kết luận ổn định và chặt chẽ hơn.

3.2. Ứng dụng 2: Quản lý quan hệ khách hàng

3.2.1 Mục tiêu phân tích

Nghiên cứu này xem xét các khía cạnh thống kê về quản lý quan hệ khách hàng (CRM – customer relationship management). Trong phạm vi này một cơng ty phải có vì một mục tiêu cơ bản là khuyến khích lịng trung thành của khách hàng để thu được từ họ lợi nhuận nhiều nhất có thể. Sự cần thiết của việc có các khách hàng trung thành thúc đẩy các công ty hiểu biết về khách hàng nhiều hơn. Một cách để làm điều này là sử dụng quản lý thích hợp và xử lý cơ sở dữ liệu khách hàng. Các phương pháp khai thác dữ liệu thể hiện một cách tiếp cận hợp lý để trích xuất thơng tin q giá từ một cơ sở dữ liệu như vậy và sau đó thơng tin được sử dụng để quản lý các mối quan hệ khách hàng hiện tại và tương lai. Các công ty ngày càng cá nhân hóa các dịch vụ của mình để phù hợp với từng

xciv đối tượng khách hàng. Dữ liệu trong nghiên cứu này là của một công ty ở Ý, đối tượng mà tác giả Giudici đã nghiên cứu.

Mục đích là nghiên cứu hành vi mua hàng của khách hàng, cụ thể là để hiểu được các nhân tố ban đầu có thể tạo lên một người mua ngẫu nhiên hoặc người mua trung thành như thế nào. Điều này cho biết ở một giai đoạn sớm, khách hàng nào sẽ thực sự đem lại lợi nhuận và ở đó tập trung mọi nỗ lực tiếp thị. Về mặt khai thác dữ liệu, ta quan tâm đến bài toán phân lớp dự báo.

3.2.2 Mô tả dữ liệu

Thông tin quần thể tham chiếu – các khách hàng hiện thời của công ty được phân phối trên 3 cơ sở dữ liệu riêng biệt: danh sách khách hàng và các đặc điểm của khách hàng, danh sách các đơn đặt hàng và danh sách các lệnh mua hàng. Tất cả 3 cơ sở dữ liệu chứa các biến về khách hàng, chủ yếu là các biến xã hội nhân khẩu học và các biến hành vi. Các biến này đề cập tới các cách trong đó quan hệ thương mại đầu tiên được thiết lập.

Để đạt được các mục tiêu phân tích, ta phải phân tích một quần thể đồng nhất của những người tiêu dùng, tức là phải phân tích hành vi của những người mà quan hệ thương mại đầu tiên của họ với công ty xảy ra gần như cùng thời điểm. Điều này giúp loại bỏ các hiệu ứng sai lệch có thể có do sự thay đổi cơ cấu trong nền kinh tế, hoặc trong cơ cấu của công ty. Đầu tiên ta xét tất cả 210.085 khách hàng đã tham gia vào cơ sở dữ liệu khách hàng từ năm 1992 đến năm 1996. Sẽ rất tốn kém tiền bạc và thời gian để phân tích tồn bộ tập dữ liệu nên ta sẽ lấy một mẫu phân tầng và phân tích nó. Ta sẽ lấy số lượng khách hàng như nhau từ mỗi khoảng thời gian ngắn; mẫu này chứa tổng số 2470 khách hàng.

Cuối cùng, khi dữ liệu được trải rộng trên 3 cơ sở dữ liệu ta cần xây dựng một cơ sở dữ liệu tiếp thị tổ chức tất cả các thông tin ta yêu cầu. Ta cần thu được một tập dữ liệu gắn kết và có nhiều thơng tin hơn. Kết quả cuối cùng là 1 ma trận dữ liệu có 1 hàng cho mỗi khách hàng và 1 cột cho mỗi đặc tính khách hàng (biến thống kê). Sau một quá trình dài quản lý cơ sở dữ liệu, ta thu được các biến trong bảng 3.11

Một phần của tài liệu (LUẬN văn THẠC sĩ) phương pháp thống kê trong kinh doanh và tài chính (Trang 86 - 89)

Tải bản đầy đủ (PDF)

(132 trang)