1. Trang chủ
  2. » Luận Văn - Báo Cáo

Quản Trị Quan Hệ Khách Hàng Chương 12- Sử Dụng Cơ Sở Dữ Liệu Khách Hàng.pdf

47 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Sử Dụng Cơ Sở Dữ Liệu Khách Hàng
Tác giả Võ Ngọc Châu Anh, Hồ Thị Liểu, Phùng Thị Bích Vân
Người hướng dẫn Ts. Lê Phước Cửu Long
Trường học Trường Đại Học Công Nghệ Thông Tin Và Truyền Thông Việt – Hàn
Chuyên ngành Quản Trị Quan Hệ Khách Hàng
Thể loại Báo Cáo Giữa Kỳ
Năm xuất bản 2023-2024
Thành phố Đà Nẵng
Định dạng
Số trang 47
Dung lượng 6,53 MB

Cấu trúc

  • I. Giới thiệu (6)
  • II. Phân tích chiến lược và chiến thuật CRM (8)
  • III. Phân tích qua hành trình khách hàng (9)
  • IV. Phân tích dữ liệu có cấu trúc và phi cấu trúc (14)
  • V. Phân tích dữ liệu lớn (17)
  • VI. Những yếu tố cần thiết cho công nghệ (20)
  • VII. Phân tích dữ liệu cấu trúc (21)
  • VIII. Thang đo danh nghĩa, thứ bậc, khoảng và tỷ lệ (21)
  • IX. Ba cách để tạo ra hiểu quả phân tích (23)
    • 1. Báo cáo chuẩn (23)
    • 2. Xử lý phân tích trực tuyến (OLAP) (24)
    • 3. Khai thác dữ liệu (26)
  • X. Quy trình khai thác dữ liệu (30)
  • XI. Trí tuệ nhân tạo (AI), học máy (ML) và học sâu (DL) (36)
  • XII. Học sâu (Deep learning) (39)
    • XIII.V ấn đề riêng tư (40)
  • KẾT LUẬN (43)
  • TÀI LIỆU THAM KHẢO (44)

Nội dung

SỬ DỤNG CƠ SỞ DỮ LIỆU KHÁCH HÀNGPhân tích dữ liệu liên quan đến khách hàng có thể giúp trả lời các câu hỏi quantrọng về hoạt động CRM như: chúng tôi nên sử dụng kênh nào để giao tiếp với

Giới thiệu

CRM phân tích là quá trình chuyển đổi thông tin khách hàng thành những hiểu biết có thể hành động cho mục đích chiến lược hoặc chiến thuật Quy trình này bao gồm thu thập, nâng cao, chuẩn bị, phân tích và cung cấp dữ liệu Với sự phát triển của trí tuệ nhân tạo (AI) và tự động hóa tiếp thị, ranh giới giữa phân tích và hành động ngày càng trở nên mờ nhạt, cho phép toàn bộ quy trình diễn ra trong thời gian thực mà không cần can thiệp thủ công Các nhà khoa học dữ liệu phát triển các thuật toán để thúc đẩy quy trình này.

Phân tích dữ liệu giúp các tổ chức hiểu rõ hơn về khách hàng, từ đó cải thiện kết quả CRM như giá trị khách hàng, sự hài lòng và mức độ tương tác, đồng thời giảm tỷ lệ rời bỏ và chi phí phục vụ Sự bùng nổ dữ liệu từ khách hàng, thông qua tìm kiếm trực tuyến, mua sắm, vị trí và hoạt động trên mạng xã hội, mang đến cái nhìn sâu sắc và khả năng dự đoán hành vi khách hàng Trong lĩnh vực B2B, công nghệ như thiết bị thông minh, chuỗi khối và hệ thống hậu cần giúp các công ty có cái nhìn tổng thể hơn về quy trình và giá trị của khách hàng khi họ sử dụng sản phẩm và dịch vụ Nhờ vào công nghệ hiện đại, doanh nghiệp có thể khai thác và phân tích dữ liệu hiệu quả hơn, mang lại lợi ích cho việc ra quyết định.

Phân tích dữ liệu khách hàng hỗ trợ cả CRM chiến lược và hoạt động, giúp doanh nghiệp phát triển mô hình kinh doanh lấy khách hàng làm trung tâm để giành giữ khách hàng có khả năng sinh lời Việc này cho phép trả lời các câu hỏi quan trọng về chiến lược CRM, như: ai là khách hàng mục tiêu, tỷ lệ chi tiêu của họ cho sản phẩm, cảm nhận của họ về trải nghiệm với doanh nghiệp, và so sánh giá trị đề xuất của mình với đối thủ Ngoài ra, phân tích cũng giúp xác định đối thủ cạnh tranh chính cùng điểm mạnh, điểm yếu của họ, và cách khách hàng sử dụng dịch vụ, từ đó tối ưu hóa giá trị mà doanh nghiệp mang lại cho khách hàng.

Phân tích dữ liệu khách hàng giúp trả lời các câu hỏi quan trọng về hoạt động CRM, như lựa chọn kênh giao tiếp hiệu quả, thời điểm và nội dung đề xuất phù hợp Nó cũng cho phép đánh giá sự khác biệt trong hiệu suất bán hàng giữa các vùng lãnh thổ và sản phẩm, cũng như tìm cách khắc phục các vấn đề phát sinh Ngoài ra, việc quản lý đường dẫn cơ hội và mức độ hài lòng của khách hàng với dịch vụ hiện tại là những yếu tố quan trọng để cải thiện dịch vụ.

Hầu hết các ứng dụng phần mềm CRM cho phép người dùng tạo báo cáo mô tả đơn giản, nhưng để có cái nhìn sâu sắc hơn, cần đến các hình thức phân tích khác Dữ liệu từ nhiều nguồn như hệ thống CRM, ERP và các nguồn khác được lưu trữ trong kho dữ liệu Phần mềm phân tích được tích hợp giúp người dùng trong các lĩnh vực tiếp thị, bán hàng, dịch vụ và quản lý truy vấn và hiểu dữ liệu lưu trữ Thông tin chi tiết được cung cấp qua thiết bị của họ dưới dạng báo cáo, bao gồm cả đầu ra chuẩn hóa, OLAP và báo cáo khai thác dữ liệu Chúng ta sẽ khám phá thêm về các dạng đầu ra này trong các phần tiếp theo của chương.

2Hình 12 1 Cấu trúc dữ liệu cơ bản cho phân tích CRM

Phân tích chiến lược và chiến thuật CRM

Khung thời gian là điểm khác biệt chính giữa chiến lược và chiến thuật Từ

"Chiến lược" xuất phát từ tiếng Hy Lạp "stratègia" (Generalship) và được hiểu là một kế hoạch hành động nhằm đạt được mục tiêu dài hạn Trong khi đó, chiến thuật là những hành động cụ thể thực hiện để đạt được các mục tiêu này Các chương trình CRM thường nhắm đến một hoặc nhiều trong ba mục tiêu chiến lược chính: tăng doanh thu, giảm chi phí, hoặc nâng cao lòng trung thành, sự hài lòng và sự gắn kết của khách hàng.

Một công ty sử dụng CRM để tăng doanh thu sẽ thực hiện các chiến dịch tiếp thị bán chéo và bán thêm nhằm vào khách hàng hiện tại, từ đó xây dựng mối liên kết chặt chẽ với những khách hàng giá trị nhất Điều này giúp tạo ra nhiều khách hàng tiềm năng hơn, thu hút thêm khách hàng mới và nắm bắt nhiều cơ hội hơn Các chiến thuật để xây dựng lòng trung thành, sự hài lòng và sự gắn kết, hoặc cắt giảm chi phí có thể rất đa dạng, như được minh họa trong Bảng 12.1.

Xây dựng doanh thu Giảm chi phí Tăng cường lòng trung thành/ sự hài lòng

Chiến dịch bán kèm Tự động hóa quy trình bán hàng

Tăng cường giải quyết khiếu nại

Chiến dịch bán thêm Phục vụ khách hàng trực tuyến

Cải thiện dịch vụ khách hàng

Bảo vệ các mối quan hệ có giá trị

Cải thiện khả năng tự phục vụ của khách hàng

Cải thiện quy trình thực hiện đơn hàng Tạo khách hàng tiềm năng bán hàng

Loại bỏ những khách hàng không mang lại lợi nhuận

Cải thiện trải nghiệm trực tuyến

Có được khách hàng mới Cải thiện năng suất của đại diện bán hàng

Cải thiện đề xuất giá trị Đóng nhiều cơ hội hơn Cải thiện chất lượng dẽ liệu

Giới thiệu sự hài lòng của khách hàng

Bảng 12 1 Mục tiêu chiến lược CRM (in nghiêng) và các chiến thuật liên quan (không in nghiêng)

Các loại phân tích cần thiết cho từng mục đích sử dụng chiến lược và chiến thuật của CRM sẽ khác nhau Ví dụ, một nhà tiếp thị muốn tăng doanh thu từ khách hàng hiện tại thông qua các chiến dịch bán kèm cần thực hiện phân tích và nhận báo cáo về những vấn đề quan trọng trước khi quyết định về phương tiện truyền thông, hoạt động và thời gian.

3 thư trực tiếp hoặc email làm phương tiện (kênh) liên lạc, cô ấy muốn có câu trả lời cho những câu hỏi như sau:

• Có bao nhiêu hồ sơ khách hàng của chúng tôi chứa chính xác địa chỉ bưu chính và địa chỉ email hiện tại?

• Phương tiện truyền thông ưa thích của khách hàng để tiếp nhận đề xuất tiếp thị là gì?

• Hiệu quả tương đối của mỗi kênh trong việc tạo ra doanh số bán hàng gia tăng trước đây là gì?

Chi phí cố định và biến đổi cho các chiến dịch marketing trên từng kênh là rất quan trọng Để xác định sản phẩm hoặc dịch vụ nên cung cấp, các nhà tiếp thị cần trả lời những câu hỏi liên quan đến chi phí này.

• Những loại đề xuất nào đã thành công trong quá khứ?

• Những hình thức thực hiện chiến dịch nào đã thành công trước đây?

• Chúng ta có nên triển khai chiến dịch “đề xuất tốt nhất tiếp theo” được tùy chỉnh cho từng khách hàng không?

Những hạn chế tổ chức xung quanh đề xuất bao gồm tình trạng sẵn có của hàng hóa, chính sách liên hệ với khách hàng như giới hạn một chiến dịch mỗi tháng cho mỗi khách hàng, và yêu cầu về doanh số phải tăng dần.

Câu trả lời cho những câu hỏi này phụ thuộc vào các loại dữ liệu khác nhau liên quan đến khách hàng và các phương pháp phân tích khác nhau Chẳng hạn, việc lập báo cáo về số lượng khách hàng có dữ liệu trong trường "địa chỉ email" sẽ cung cấp thông tin quý giá cho quá trình phân tích.

Việc xác định “địa chỉ nhà” trong hồ sơ khách hàng là một nhiệm vụ tương đối đơn giản, thông qua việc phân tích tỷ lệ thư trả lại và tỷ lệ mở của email để đánh giá hiệu quả Tuy nhiên, để đưa ra “đề xuất tốt nhất tiếp theo” cho từng khách hàng, doanh nghiệp cần xem xét khả năng lập mô hình và tính sẵn có của dữ liệu lịch sử phù hợp nhằm xây dựng, thử nghiệm và áp dụng các mô hình dự đoán cho từng khách hàng.

Phân tích qua hành trình khách hàng

Hành trình của khách hàng được chia thành ba giai đoạn chính: thu hút, giữ chân và phát triển Mỗi giai đoạn yêu cầu các loại phân tích khác nhau để hỗ trợ chiến lược của công ty Để thu hút khách hàng mới, cần xác định và đánh giá họ thông qua việc chấm điểm dựa trên phân tích dữ liệu Những khách hàng tiềm năng có điểm cao hơn thường có triển vọng tốt hơn, và việc chấm điểm này xem xét nhiều thuộc tính thị trường khác nhau.

Bảng 12.2 chỉ ra rằng có bốn tổ chức, cá nhân, quan hệ và hành vi quan trọng trong việc quản lý khách hàng tiềm năng Mặc dù có thể tính điểm khách hàng tiềm năng một cách thủ công, nhưng hầu hết các ứng dụng quản lý khách hàng tiềm năng hiện nay đều tự động hóa quy trình này Điều này giúp người quản lý bán hàng dễ dàng tạo báo cáo điểm số và đảm bảo rằng đại diện bán hàng theo dõi khách hàng tiềm năng một cách hiệu quả nhất.

Thị trường Tổ chức Cá nhân Quan hệ Hành vi

Quy mô thị trường Doanh thu Thâm niên Khách hàng cũ

Khách truy cập trang web? Tăng trưởng thị trường

Lợi nhuận Vai trò quyết định

Cơ hội mất đi? Đăng ký?

Phân chia thị trường Chi tiêu theo danh mục

Ngân sách chủ sở hữu

Nguồn khách hàng tiềm năng – trang web hoặc quảng cáo

Ký hợp đồng với nhà cung cấp hiện tại? Đối thủ cạnh tranh mới

Chứng nhận Ảnh hưởng Giới thiệu? Lượt xem video?

Số lượng đối thủ cạnh tranh

Tham gia mạng xã hội

Mới sử dụng cơ sở dữ liệu?

Giai đoạn giữ chân khách hàng trong vòng đời yêu cầu phân tích để xác định khách hàng có giá trị vòng đời tiềm năng cao nhất và phân nhóm khách hàng nhằm phát triển các chiến lược quản lý phù hợp Cần xem xét các yếu tố như khách hàng nào có nguy cơ chấm dứt hợp đồng, chi phí phục vụ cho mỗi khách hàng, và lợi ích chi phí của chương trình khách hàng thân thiết.

Phân tích CRM đóng vai trò quan trọng trong việc cung cấp dữ liệu cần thiết để nâng cao khả năng sinh lời, đặc biệt là trong việc giữ chân những khách hàng có giá trị vòng đời lớn Giá trị vòng đời của khách hàng (CLV) được định nghĩa là giá trị hiện tại của tất cả lợi nhuận ròng từ mối quan hệ với khách hàng hoặc nhóm khách hàng Tuy nhiên, việc tính toán CLV gặp nhiều thách thức về dữ liệu, như đã được nêu trong Chương 2 Các công ty cần xác định xác suất để tối ưu hóa chiến lược giữ chân khách hàng.

Trong tương lai, 5 khách hàng sẽ quyết định mua hàng, mang lại tỷ suất lợi nhuận gộp từ doanh thu bán hàng Chi phí phục vụ khách hàng sẽ được trừ khỏi lợi nhuận gộp, giúp tính toán lợi nhuận ròng Để xác định giá trị hiện tại, lợi nhuận ròng này sẽ được chiết khấu.

Dự báo doanh số bán hàng trong tương lai là một nhiệm vụ quan trọng trong phân tích CLV, và các nhà phân tích có thể áp dụng nhiều phương pháp khác nhau tùy thuộc vào bối cảnh kinh doanh và dữ liệu có sẵn Họ có thể sử dụng phân tích dữ liệu định tính từ ước tính doanh số của nhóm, hoặc thực hiện phân tích định lượng thông qua các khảo sát về ý định mua sắm của khách hàng Ngoài ra, phân tích chuỗi thời gian từ dữ liệu bán hàng trước đây có thể được thực hiện bằng các phương pháp như trung bình động, san bằng hàm mũ và phân rã chuỗi thời gian Các phương pháp phân tích nguyên nhân dựa trên chỉ số hàng đầu, hồi quy và phân tích dự đoán như máy học và mạng thần kinh cũng là những công cụ hữu ích trong việc dự đoán doanh số.

Phát triển khách hàng là giai đoạn thứ ba trong hành trình khách hàng, nhằm tăng giá trị kinh doanh thông qua bán chéo và bán thêm, cũng như điều chỉnh dịch vụ để nâng cao lợi nhuận Trong môi trường doanh nghiệp với doanh nghiệp, quản lý tài khoản đóng vai trò quan trọng trong việc xác định cơ hội và thúc đẩy chúng theo quy trình đã định với sự hỗ trợ của công cụ CRM Các nhà quản lý cấp cao thường quyết định mức độ dịch vụ phù hợp cho khách hàng, với nhiều chiến lược CRM cung cấp dịch vụ cá nhân hóa cho khách hàng có giá trị cao hơn Trong bối cảnh doanh nghiệp với người tiêu dùng, phân tích CRM cần trả lời các câu hỏi như đề xuất tiếp theo cho khách hàng là gì và những sự kiện nào có thể kích hoạt giao tiếp với khách hàng.

Phát triển khách hàng là giai đoạn quan trọng trong hành trình khách hàng, nhằm tăng giá trị kinh doanh thông qua việc bán chéo và bán thêm, đồng thời điều chỉnh dịch vụ để nâng cao lợi nhuận Trong môi trường doanh nghiệp với doanh nghiệp, quản lý tài khoản đóng vai trò quan trọng trong việc xác định và thúc đẩy các cơ hội kinh doanh, hỗ trợ bởi các công cụ CRM Các nhà quản lý cấp cao sẽ quyết định mức độ dịch vụ cung cấp cho khách hàng, với nhiều chiến lược CRM áp dụng các cấp độ dịch vụ khác nhau, bao gồm dịch vụ cá nhân hóa cho khách hàng có giá trị cao hơn Trong môi trường doanh nghiệp với người tiêu dùng, phân tích CRM cần giải quyết các câu hỏi liên quan đến dữ liệu lớn để tối ưu hóa trải nghiệm khách hàng.

Chúng ta nên đưa ra những đề xuất cụ thể cho khách hàng để thu hút sự chú ý của họ Việc xác định các sự kiện quan trọng có thể giúp kích hoạt giao tiếp hiệu quả với khách hàng, từ đó tăng cường mối quan hệ và cải thiện trải nghiệm của họ.

Việc áp dụng hành động tốt nhất tiếp theo (NBA) trong lĩnh vực B2C đang ngày càng trở nên phổ biến, kết hợp thông tin chi tiết về khách hàng và bối cảnh để đưa ra các đề xuất hành động Các công ty đặc biệt quan tâm đến việc thực hiện các đề xuất bán thêm hoặc bán chéo nhằm gia tăng giá trị khách hàng Tuy nhiên, bối cảnh sẽ quyết định việc đưa ra đề xuất, nội dung của đề xuất và thời điểm thích hợp để thực hiện NBA cũng đóng vai trò quan trọng trong quảng cáo có lập trình, cho phép nhà quảng cáo theo dõi hành vi người tiêu dùng theo thời gian thực, từ đó xác định được NBA, bao gồm thông điệp quảng cáo, nội dung cần chú trọng hoặc chương trình khuyến mãi cá nhân hóa.

Các điều kiện ngữ cảnh thường kích hoạt phản ứng của tổ chức, như việc khách hàng có khiếu nại chưa được giải quyết có thể dẫn đến sự thiếu quan tâm đến trải nghiệm của họ NBA nên thực hiện cuộc gọi dịch vụ khách hàng để hiểu mong đợi của khách hàng, như giải quyết khiếu nại hoặc đề xuất bồi thường cho trải nghiệm không đạt yêu cầu Đề xuất có thể dựa trên phân tích giỏ hàng hoặc mô hình tuần tự, và cũng có thể được kích hoạt qua dữ liệu di động khi khách hàng ở gần nhà bán lẻ Tuy nhiên, việc sử dụng dữ liệu cần tuân thủ luật bảo vệ dữ liệu để tránh khai thác quá mức Ban quản lý nhạy cảm với bối cảnh có thể không muốn đưa ra đề xuất, ngay cả khi quy tắc kinh doanh cho phép Ví dụ, một khách hàng không thanh toán hóa đơn đúng hạn nhưng lại đặt hàng lớn có thể dẫn đến phản hồi mâu thuẫn giữa việc nhắc nhở về khoản nợ và cảm ơn khách hàng.

Bảy hàng hóa thiết yếu cho doanh nghiệp Các công cụ đề xuất thường dựa vào những quy tắc đơn giản và phân tích dự đoán, nhưng lại thiếu sự xem xét bối cảnh, điều này có thể dẫn đến những quyết định không tốt cho công ty.

"Đề xuất tốt nhất tiếp theo" (NBO) là một phần của NBA, bắt nguồn từ Amazon với các gợi ý "những người mua cái này cũng mua cái kia" Hiện nay, mô hình NBO đã trở nên phức tạp hơn, dựa vào phân tích dự đoán tinh vi và nhạy cảm với ngữ cảnh, giúp đưa ra các đề xuất phù hợp tại thời điểm và kênh thích hợp Các công cụ hỗ trợ NBO được gọi là công cụ đề xuất.

TRƯỜNG HỢP MINH HỌA 12.1 ĐỘNG TỐT NHẤT TIẾP THEO TẠI NGÂN HÀNG ING 1

ING, một trong những công ty dịch vụ tài chính hàng đầu ở Châu Âu, thực hiện chiến dịch tiếp thị trực tiếp quy mô lớn với khoảng 60 triệu thư mỗi năm Tuy nhiên, ngân hàng nhận thấy rằng các chiến dịch này đang trở nên kém hiệu quả do chương trình chiến dịch ban đầu chỉ phù hợp với thư trực tiếp, trong khi hiện tại, ngân hàng đang chuyển hướng mạnh mẽ sang kênh trực tuyến trong bối cảnh đa kênh.

ING đã triển khai một dự án kéo dài 15 tháng với ngân sách trên 5 triệu và khoảng 50 nhân viên từ các bộ phận tiếp thị, CNTT, thông tin khách hàng và các kênh khác nhau Mục tiêu của dự án là xây dựng một chương trình tiếp thị trực tiếp hiện đại, nhằm vượt qua những thách thức của chương trình cũ.

Phân tích dữ liệu có cấu trúc và phi cấu trúc

Phân tích CRM cho dữ liệu có cấu trúc đòi hỏi các quy trình thống kê cơ bản như tính tổng, trung bình và phương sai, đóng vai trò quan trọng trong việc tạo ra các báo cáo tiêu chuẩn Khi các câu hỏi trở nên phức tạp hơn, việc phân tích cũng cần nâng cao để cung cấp những câu trả lời sâu sắc hơn OLAP và khai thác dữ liệu là hai phương pháp chính để truy vấn dữ liệu, giúp người dùng hiểu rõ hơn về các yếu tố ảnh hưởng đến hiệu suất OLAP cho phép phân tích lý do sâu xa của dữ liệu, trong khi khai thác dữ liệu áp dụng các quy trình thống kê như hồi quy và phân cụm để tạo ra các hiểu biết giá trị Mặc dù cuốn sách này không trình bày chi tiết về các quy trình thống kê, nhưng sẽ giới thiệu ứng dụng của một số kỹ thuật trong CRM ở các phần sau.

Dữ liệu phi cấu trúc, như đã đề cập trong Chương 11, là loại dữ liệu không có mô hình định sẵn, bao gồm các tệp văn bản và phi văn bản như bảng tính, tài liệu, PDF, ghi chú viết tay, cũng như dữ liệu hình ảnh, âm thanh, video và đa phương tiện Loại dữ liệu này thường tồn tại bên ngoài doanh nghiệp trong các kho lưu trữ.

Dữ liệu truyền thông xã hội ngày càng trở nên phong phú và đa dạng, dẫn đến khái niệm “dữ liệu lớn” Việc phân tích các loại dữ liệu này vẫn đang trong quá trình phát triển, mở ra nhiều cơ hội mới cho nghiên cứu và ứng dụng trong các lĩnh vực khác nhau.

Phân tích văn bản là hình thức phân tích dữ liệu phi cấu trúc tiên tiến nhất hiện nay, cho phép trích xuất thông tin từ các tài liệu phi cấu trúc và chuyển đổi thành thông tin có cấu trúc Dữ liệu văn bản phi cấu trúc tồn tại trong nhiều nguồn như ghi chú của nhân viên trung tâm cuộc gọi, email, tài liệu web, blog, tweet, và các nhận xét của khách hàng Việc sử dụng ngôn ngữ tự nhiên với nhiều yếu tố như tiếng lóng, phương ngữ và lỗi chính tả tạo ra thách thức cho các nhà phân tích Tuy nhiên, các công cụ khai thác văn bản như SAS giúp chuyển đổi văn bản và âm thanh thành định dạng dễ dàng trích xuất thông tin, phát hiện các chủ đề và khái niệm ẩn Goutam Chakraborty chỉ ra rằng phân tích văn bản có nhiều ứng dụng tiềm năng trong quản lý quan hệ khách hàng (CRM).

Dữ liệu phi cấu trúc từ khách hàng cá nhân có thể cải thiện độ chính xác của các mô hình dự đoán Những dữ liệu này, như phản hồi khảo sát về sản phẩm hoặc dịch vụ, phản ánh trải nghiệm của khách hàng, từ đó giải thích quyết định của họ trong việc tiếp tục sử dụng dịch vụ hay rời bỏ.

Phân tích văn bản đóng vai trò quan trọng trong việc định tuyến tự động, với nhiều ứng dụng nổi bật như chuyển tiếp e-mail và phát hiện thư rác Những công nghệ này giúp tối ưu hóa quy trình xử lý thông tin và nâng cao hiệu quả giao tiếp trực tuyến.

Phân tích nguyên nhân gốc rễ (RCA) là một phương pháp hiệu quả để xác định nguyên nhân chính gây ra lỗi hoặc vấn đề Việc phân tích các văn bản liên quan đến dịch vụ khách hàng và hồ sơ khiếu nại có thể giúp phát hiện những vấn đề cốt lõi, từ đó đưa ra giải pháp khắc phục hiệu quả.

Phân tích khuynh hướng là phương pháp giúp hiểu cách các thực thể thay đổi theo thời gian, chẳng hạn như số lượng thiết bị bị lỗi, số sê-ri thiết bị bảo trì, và loại yêu cầu dịch vụ khách hàng Phương pháp tiêu chuẩn để thực hiện phân tích này là lập biểu đồ và so sánh các thực thể thường xuyên nhất trong một khoảng thời gian ngắn (như một phút, một giờ, một ngày) với khoảng thời gian dài hơn (như một tuần, một tháng, hoặc một năm).

Phân tích cảm xúc trong dữ liệu văn bản giúp hiểu rõ hơn về cảm nhận và suy nghĩ của khách hàng, bao gồm cả khách hàng cũ, khách hàng tiềm năng, đối thủ cạnh tranh và đối tác Điều này cho phép doanh nghiệp nắm bắt được nhận thức của người tiêu dùng về công ty, thương hiệu, sản phẩm hoặc dịch vụ, từ đó xác định được cảm xúc tích cực, tiêu cực hay trung tính mà họ đang có.

Khách hàng có cảm nhận tích cực hay tiêu cực về các thuộc tính của sản phẩm như chất lượng, giá cả, độ bền, an toàn và dễ sử dụng Sự hài lòng với sản phẩm thường dẫn đến cảm xúc tích cực, trong khi nhận thức kém có thể tạo ra cảm xúc tiêu cực Nếu khách hàng không có ý kiến rõ ràng, cảm xúc của họ sẽ được coi là trung lập.

Hình 12 2 Phân tích cảm xúc trên mạng xã hội

PHÂN TÍCH VĂN BẢN TRONG NGÀNH Ô TÔ

Bảo hành tiêu tốn khoảng 35 tỷ USD mỗi năm cho các công ty ô tô Mỹ, do đó tối ưu hóa chi phí là rất quan trọng Một phương pháp ít được khai thác để giảm chi phí bảo hành là lắng nghe ý kiến từ kỹ thuật viên dịch vụ Việc phân tích các nhận xét này có thể cung cấp thông tin quý giá về lỗi thành phần, giúp các nhà sản xuất ô tô ngăn chặn các vấn đề tương tự trong tương lai Những câu hỏi kinh doanh quan trọng có thể được giải đáp thông qua việc khai thác ý kiến của kỹ thuật viên.

1 Những vấn đề chính mà người bán hàng gặp phải là gì?

2 Năm thành phần nào được nhắc đến là vấn đề thường xuyên nhất?

3 Có hình thái hư hỏng theo mùa nào của thành phần không?

4 Có mối liên hệ nào giữa lỗi bộ phận và chi phí bảo hành của bộ phận đó không?

5 Bộ phận nào bị lỗi thường xuyên được nhận xét trong thời gian bảo hành xe?

Giải pháp khai thác văn bản sử dụng bốn loại dữ liệu phi cấu trúc, bao gồm nhận xét của kỹ thuật viên về hệ thống quản lý đại lý, nhận xét của khách hàng về hệ thống CRM, nhận xét từ người dùng trên mạng xã hội và đánh giá xe từ các tạp chí thương mại Ứng dụng này cho ra ba kết quả đầu ra: danh sách các từ khóa, trừu tượng hóa các từ khóa thành các chủ đề lỗi chính của phương tiện, và danh sách các từ khóa có rủi ro cao như “rò rỉ dầu”.

Kết quả cho phép các công ty ô tô thực hiện một số hành động để giảm bào mòn chi phí liên quan đến bảo hành:

Các nhà sản xuất ô tô cần quyết định tìm nguồn cung ứng linh kiện phù hợp Việc chia sẻ kết quả với các nhà cung cấp sản phẩm sẽ giúp cải thiện chất lượng và thực hiện các sáng kiến chung nhằm giảm tỷ lệ lỗi trong quá trình sản xuất.

Thiết kế lại quy trình sản xuất nội bộ là cần thiết để nâng cao hiệu quả Nếu một thành phần được sản xuất trong nội bộ, quy trình này có thể được xem xét và điều chỉnh nhằm loại bỏ sự tái diễn, từ đó cải thiện chất lượng và năng suất sản xuất.

• Tối ưu hóa hàng tồn kho Tần suất xuất hiện các phụ tùng ô tô bị hỏng có thể được sử dụng để dự báo nhu cầu về phụ tùng.

Phân tích dữ liệu lớn

Với sự bùng nổ của dữ liệu lớn, nhiều chuyên gia đã mô tả lĩnh vực này qua ba thuộc tính chính, được gọi là ba chữ V: khối lượng, vận tốc và sự đa dạng, do META Group phát triển Ngoài ra, các nhà khoa học dữ liệu của IBM đã chỉ ra chữ V thứ tư - tính xác thực, nhằm giải quyết vấn đề chất lượng của dữ liệu lớn Việc hiểu rõ ba chữ V ban đầu giúp đơn giản hóa và tiết kiệm trong việc phân tích dữ liệu.

Khối lượng dữ liệu đang gia tăng nhanh chóng, khiến các cơ sở dữ liệu quan hệ truyền thống không còn đủ khả năng xử lý Ví dụ, hệ thống CRM có thể ghi nhận 15 trường thông tin cho 25 triệu khách hàng, nhưng khi theo dõi hành vi trực tuyến của họ với 200 nhấp chuột mỗi ngày, lượng dữ liệu trở nên quá lớn để quản lý Điều này cho thấy sự cần thiết phải chuyển đổi sang các giải pháp lưu trữ và xử lý dữ liệu hiện đại hơn.

Trong thời đại số hiện nay, với sự gia tăng nhanh chóng của nhiều loại dữ liệu trực tuyến, xã hội và di động, cơ sở dữ liệu quan hệ không còn phù hợp để xử lý những thay đổi liên tục này.

Dữ liệu truyền thống trong các hệ thống CRM thường được cấu trúc như bảng tính, trong khi dữ liệu lớn lại đa dạng và khó định dạng thành hàng và cột Sự không đồng nhất của dữ liệu lớn thể hiện qua nhiều loại hình như bài đăng trên mạng xã hội, video, hình ảnh, blog, dữ liệu vị trí và cảm biến Việc chuyển đổi các dạng dữ liệu không tương xứng này thành dữ liệu quan hệ là một trong những thách thức lớn trong việc xử lý dữ liệu lớn.

Vận tốc của dữ liệu lớn không chỉ bao gồm xử lý theo lô mà còn bao gồm xử lý theo luồng, cho phép sản xuất dữ liệu trong thời gian thực Dữ liệu theo luồng không chỉ nằm yên trong cơ sở dữ liệu quan hệ mà còn sẵn sàng cho việc phân tích định kỳ, với khả năng cập nhật liên tục.

Các nhà quản lý khách hàng đang chuyển từ nghiên cứu định kỳ sang phân tích dữ liệu giao dịch trong môi trường đa kênh, nơi khối lượng dữ liệu do người tiêu dùng tạo ra tăng nhanh chóng Dự kiến, khối lượng dữ liệu này sẽ tiếp tục gia tăng nhờ vào các công nghệ mới, bao gồm smartphone và Internet kết nối vạn vật (IoT) Năm 2013, Apple giới thiệu iBeacon, cho phép các nhà bán lẻ theo dõi khách hàng tại cửa hàng theo thời gian thực, từ đó xác định mẫu lưu lượng truy cập, các điểm quan tâm của người tiêu dùng và hỗ trợ các chương trình khuyến mãi kịp thời dựa trên hành vi mua sắm của khách hàng.

Hồ sơ Giao dịch Bảng, trường

VẬN TỐC Lô Thời gian thực Luồng ĐA DẠNG

Có cấu trúc Phi cấu trúc Bán cấu trúc

Hình 12.3 trình bày 3Vs của dữ liệu lớn, cho thấy cách các vật thể "ngu ngốc" kết nối với nhau để tạo ra các giải pháp thông minh Sự giảm giá chip RFID giúp các công ty logistics gán nhãn cho từng mặt hàng, cho phép theo dõi vị trí của chúng trong thời gian thực, từ đó giảm sai sót và tăng độ chính xác Khi dữ liệu được quản lý hiệu quả, khách hàng có thể truy cập thông tin về đơn hàng mà không cần gọi dịch vụ, tiết kiệm chi phí Tuy nhiên, một số chuyên gia dữ liệu đã chỉ trích các nhà tiếp thị vì sử dụng phán đoán cá nhân thay vì dựa vào mô hình phân tích và mô phỏng để đưa ra quyết định chính xác hơn.

Các công ty và nhà khoa học dữ liệu đang đối mặt với thách thức trong việc diễn giải và sử dụng dữ liệu phi cấu trúc, đồng thời tích hợp dữ liệu có cấu trúc và phi cấu trúc để tối ưu hóa giá trị Điều này vượt xa việc chỉ phân tích dữ liệu phi cấu trúc Nhiều tên tuổi lớn trong lĩnh vực CNTT và Trí tuệ doanh nghiệp như IBM, SAS, và Oracle đang đầu tư mạnh mẽ vào phần mềm và bí quyết để giúp các doanh nghiệp khai thác giá trị từ dữ liệu lớn Đặc biệt, IBM đã chi hơn 14 tỷ USD để mua lại các công ty phân tích như SPSS và Cognos.

Phân tích dữ liệu lớn giúp các nhà quản lý nhận diện tín hiệu quan trọng và xu hướng giữa cơn bão dữ liệu nhiễu eBay Inc đã áp dụng giải pháp này để phát hiện xu hướng mua giày bóng rổ nam thông qua việc phân tích hàng chục nghìn đôi giày bán ra mỗi ngày và dữ liệu từ mạng xã hội Thông tin này được truyền đạt ngay lập tức tới các nhà bán hàng tiềm năng, tạo ra doanh thu cho eBay Trong khi nghiên cứu truyền thống có thể mất đến một tháng để thu thập thông tin tương tự, giải pháp dữ liệu lớn cho phép xác định tín hiệu chỉ trong một ngày, nâng cao tính hữu ích và sự phù hợp của thông tin chuyên sâu.

Các giải pháp dữ liệu lớn mới nổi giúp các công ty phân tích nhanh chóng các luồng dữ liệu từ dịch vụ khách hàng, như bản ghi cuộc gọi, blog, tweet và diễn đàn, để phát hiện các vấn đề dịch vụ quan trọng trong thời gian thực Chẳng hạn, một công ty phát hành phần mềm mới có thể sử dụng phân tích dữ liệu lớn để nhanh chóng nhận diện các vấn đề phát sinh trong cơ sở hạ tầng máy tính của người dùng, thay vì chờ đợi phản hồi từ doanh số hoặc báo cáo từ trung tâm dịch vụ khách hàng Việc này cho phép công ty có biện pháp khắc phục kịp thời, cải thiện trải nghiệm khách hàng và tăng cường hiệu suất dịch vụ.

14 thiện trải nghiệm của khách hàng, thúc đẩy lòng trung thành và giảm chi phí dịch vụ bằng cách giải quyết vấn đề nhanh hơn.

Nhiều công ty thực hiện phân tích truyền thông xã hội để nắm bắt thông tin về những gì đang được nói về họ, ai là người nói và tác động của những thông tin đó Bằng cách kết hợp dữ liệu từ truyền thông xã hội với bản ghi cuộc gọi dịch vụ và dữ liệu bán hàng, các công ty có thể xác định rõ hơn giá trị của quảng bá tích cực trên mạng xã hội, cũng như thiệt hại từ các khiếu nại mạnh mẽ của khách hàng.

PHÂN TÍCH DỮ LIỆU LỚN TẠI BRITISH AIRWAYS 14

British Airways (BA) đã nâng cấp chương trình CRM của mình thông qua giải pháp dữ liệu lớn mang tên “Know Me”, tích hợp dữ liệu từ chương trình khách hàng thân thiết, hành vi trực tuyến, dữ liệu hoạt động và lịch sử mua hàng Chương trình này cho phép phi hành đoàn chào đón những khách hàng tốt nhất bằng tên riêng hoặc gửi lời xin lỗi cá nhân nếu chuyến bay của họ bị trì hoãn Việc quản lý hiệu quả các ứng dụng này giúp cá nhân hóa dịch vụ và phân biệt nhà cung cấp dịch vụ với những khách hàng có giá trị nhất, đáp ứng mục tiêu của nhiều chương trình khách hàng thân thiết/CRM.

Những yếu tố cần thiết cho công nghệ

Giải pháp dữ liệu lớn tập trung vào việc lưu trữ và xử lý khối lượng lớn dữ liệu với chi phí hợp lý, trong đó Hadoop là nền tảng chính, cho phép tính toán nhanh chóng trên nhiều máy tính Ngoài Hadoop, còn có nhiều ứng dụng phân tích nguồn mở và các công cụ phần mềm thương mại hỗ trợ quản lý và quyết định, giúp tổ chức dễ dàng tích hợp dữ liệu phi cấu trúc với cơ sở dữ liệu quan hệ Mặc dù một số công nghệ như phân tích văn bản đã phát triển mạnh mẽ, nhưng nhiều giải pháp dữ liệu lớn vẫn phức tạp trong việc cài đặt và quản lý Các tổ chức cần nguồn lực nội bộ đáng kể hoặc hợp tác với bên thứ ba để hỗ trợ việc thực hành CRM, và các nhà quản lý cần tích cực phối hợp với các bộ phận chức năng và nhà cung cấp CNTT để định hướng chiến lược cho việc sử dụng dữ liệu lớn.

Phân tích dữ liệu cấu trúc

Trong cơ sở dữ liệu quan hệ, có nhiều loại dữ liệu khác nhau được lưu trữ Để đưa ra quyết định chính xác dựa trên kết quả phân tích CRM, các nhà quản lý cần đánh giá kỹ lưỡng các loại dữ liệu này, nhằm xác định xem các quy trình thống kê phù hợp đã được áp dụng trong phân tích hay chưa.

Dữ liệu phân loại, hay còn gọi là dữ liệu rời rạc, là loại dữ liệu liên quan đến các thực thể có thể được phân chia thành các nhóm hoặc danh mục cụ thể, chẳng hạn như loại sản phẩm, giới tính và quốc gia Sự khác biệt cơ bản giữa dữ liệu phân loại và dữ liệu liên tục nằm ở cách thức tổ chức và phân loại thông tin.

Dữ liệu phân loại không có thứ tự được gọi là dữ liệu danh nghĩa, như tên khách hàng, trong khi dữ liệu phân loại có thứ tự là dữ liệu thứ bậc, ví dụ như danh sách khách hàng sắp xếp theo doanh thu Dữ liệu liên tục có thể nhận bất kỳ giá trị nào trong khoảng xác định và chia thành dữ liệu khoảng và dữ liệu tỷ lệ Dữ liệu khoảng không có điểm 0 cố định, như thang đo nhiệt độ, trong khi dữ liệu tỷ lệ có điểm 0 có nghĩa là không có biến đó, ví dụ như chiều cao.

Thang đo danh nghĩa, thứ bậc, khoảng và tỷ lệ

Stanley Stevens đã mở rộng hiểu biết của chúng ta về hệ thống phân cấp của bốn loại dữ liệu: danh nghĩa, thứ bậc, khoảng và tỷ lệ Việc hiểu hệ thống phân cấp này là rất quan trọng đối với các nhà quản lý và 16 nhà khoa học dữ liệu, vì nó quyết định các loại phân tích có thể thực hiện trên dữ liệu Mỗi cấp độ trong hệ thống phân cấp này không chỉ bao gồm tất cả các thuộc tính của cấp độ trước mà còn có thêm những thuộc tính riêng Chúng tôi sẽ thảo luận về một số quy trình phân tích trong các trang tiếp theo, nhưng trước hết, điều quan trọng là bạn cần nắm rõ sự khác biệt giữa các loại dữ liệu.

Dữ liệu danh nghĩa là loại dữ liệu cơ bản nhất, chủ yếu được sử dụng để phân loại và xác định thông tin Nhiều dữ liệu khách hàng thuộc dạng này, chẳng hạn như mã số khách hàng duy nhất, phân loại giới tính và địa chỉ email Ví dụ, trong cơ sở dữ liệu, một khách hàng sở hữu ô tô có thể được gán nhãn '1', trong khi người không sở hữu được gán nhãn '0' Tuy nhiên, điều này không phản ánh bất kỳ thứ tự hay xếp hạng nào giữa các giá trị, tức là không có nghĩa là 1 lớn hơn 0.

Dữ liệu thứ bậc xếp hạng biến là công cụ hữu ích để so sánh các trường hợp quan sát, cho phép chúng ta nhận biết sự khác biệt về đặc điểm giữa chúng Mặc dù dữ liệu này không chỉ ra mức độ khác biệt cụ thể, nhưng nó cho thấy rằng đối tượng xếp hạng cao nhất có nhiều đặc tính đo được hơn so với các đối tượng khác.

Trong danh sách khách hàng xếp hạng từ 1 đến n theo doanh thu bán hàng, có 16 đối tượng được xếp hạng thứ hai Tuy nhiên, chúng ta không thể xác định liệu đối tượng này ở vị trí gần hay xa so với khách hàng đứng đầu Mặc dù khách hàng xếp hạng số một tạo ra phần lớn doanh số, khoảng cách giữa vị trí thứ nhất và thứ hai trong thứ tự xếp hạng vẫn không được rõ ràng.

Dữ liệu khoảng giải quyết vấn đề “thứ tự độ lớn” liên quan đến số đo thứ tự, cho phép xác định thứ tự xếp hạng và khoảng cách giữa các thứ hạng Nhiều công cụ khảo sát sử dụng thang đo khoảng để đo lường thái độ và ý kiến, với đặc điểm là không có điểm 0 cố định Ví dụ, thang đo nhiệt độ độ C và độ F là những thước đo sử dụng dữ liệu khoảng nhưng có điểm 0 tùy ý Mặc dù sự khác biệt giữa các giá trị trong dữ liệu khoảng có ý nghĩa, nhưng tỷ lệ giữa chúng thì không Chẳng hạn, chênh lệch giữa 20°C và 10°C tương tự như chênh lệch giữa 60°C và 50°C, nhưng không thể khẳng định rằng 20°C hơn 10°C một cách tuyệt đối.

Dữ liệu tỷ lệ có điểm 0 cố định và tuyệt đối, khác với dữ liệu khoảng Nó bao gồm tất cả các tính chất của thước đo danh nghĩa, thứ tự và khoảng, cho phép phân loại, xếp hạng và so sánh sự khác biệt giữa các đối tượng Ví dụ, chi tiêu của khách hàng, độ tuổi, cân nặng và chiều cao đều được đo bằng thang tỷ lệ Trong khi chỉ có phép cộng và phép trừ được áp dụng cho dữ liệu khoảng, dữ liệu tỷ lệ cho phép thực hiện cả phép nhân và phép chia Điều này có nghĩa là nếu một khách hàng chi 150 USD cho một phòng, họ đã chi tiêu gấp đôi so với khách hàng chỉ chi 75 USD.

Việc phân biệt giữa các loại dữ liệu là cần thiết vì quy trình phân tích phụ thuộc vào loại dữ liệu Dữ liệu phân loại thường sử dụng các thủ tục không tham số như hồi quy logistic, trong khi dữ liệu liên tục áp dụng các thủ tục tham số như hồi quy tuyến tính Các phương pháp kiểm tra mối tương quan giữa dữ liệu thứ tự khác với dữ liệu khoảng Mặc dù các nhà nghiên cứu tiếp thị thường sử dụng thang đo thứ tự, như thang đo Likert để đo lường sự hài lòng của khách hàng, họ lại phân tích dữ liệu như thể chúng là dữ liệu liên tục Việc sử dụng các quy trình phân tích dành cho dữ liệu khoảng để hiểu dữ liệu thứ tự đang gây ra nhiều tranh cãi trong cộng đồng nghiên cứu.

Chúng tôi xem xét một số quy trình thống kê trong phần đánh giá sắp tới về khai thác dữ liệu của chương.

Ba cách để tạo ra hiểu quả phân tích

Báo cáo chuẩn

Báo cáo là yếu tố quan trọng trong hệ thống CRM hiệu quả, giúp hiểu và phân biệt khách hàng thông qua thông tin chi tiết Các báo cáo có thể từ danh sách đơn giản như tài khoản chính và doanh thu hàng năm đến các phân tích phức tạp về hiệu suất Hầu hết công nghệ CRM hiện nay cho phép tự động tạo báo cáo định kỳ, như báo cáo hàng tháng cho quản lý bán hàng về hoạt động và hiệu suất của đại diện so với hạn ngạch, cũng như báo cáo hàng ngày về hoạt động của trung tâm cuộc gọi.

Báo cáo có thể được chia thành hai loại: chuẩn hóa và dựa trên truy vấn Các báo cáo chuẩn hóa thường được tích hợp vào phần mềm CRM, nhưng cần tùy chỉnh để đáp ứng nhu cầu cụ thể của tổ chức Một số tùy chỉnh có thể thực hiện khi chạy báo cáo, như chọn tùy chọn hoặc tiêu chí lọc, tuy nhiên, kết quả cuối cùng vẫn bị giới hạn bởi thiết kế ban đầu của báo cáo Ví dụ, hình 12.4 minh họa một báo cáo tiêu chuẩn liệt kê các tài khoản đang hoạt động của một đại diện bán hàng.

Báo cáo dựa trên truy vấn cung cấp cho người dùng nhiều công cụ linh hoạt để xây dựng báo cáo phù hợp với vai trò của họ Đây là một công cụ mạnh mẽ, cho phép người dùng yêu cầu các báo cáo cụ thể, chẳng hạn như: “cho tôi xem tất cả các khách hàng đã hết hạn bảo trì thỏa thuận, trong lãnh thổ của tôi, với doanh thu hàng năm trên 50.000 USD.”

Các báo cáo tiêu chuẩn thường được trình bày dưới dạng các công cụ trực quan hóa như bảng, biểu đồ, đồ thị, sơ đồ, bản đồ và trang tổng quan Người dùng có thể xuất báo cáo sang các ứng dụng khác như Excel để thực hiện phân tích sâu hơn.

Hình 12.4 minh họa ví dụ về báo cáo tiêu chuẩn 18 Khi nhu cầu phân tích dữ liệu tăng cao, thông tin trong cơ sở dữ liệu khách hàng thường không được cấu trúc một cách hiệu quả Do đó, xử lý phân tích trực tuyến (OLAP) đã trở thành yếu tố quan trọng trong quản lý quan hệ khách hàng (CRM).

Xử lý phân tích trực tuyến (OLAP)

Công nghệ OLAP cho phép phân tích dữ liệu trong siêu thị dữ liệu thông qua các quy trình như cắt lát, truy sâu và tổng hợp Trung tâm dữ liệu là một tập hợp con trong kho dữ liệu lớn hơn, phản ánh trách nhiệm của các đơn vị kinh doanh hoặc nhóm cụ thể Chẳng hạn, bộ phận bán hàng có trung tâm dữ liệu riêng chứa thông tin liên quan đến doanh thu và lợi nhuận OLAP mang lại giá trị cho nhiều người dùng CRM với các câu hỏi khác nhau về dữ liệu Nhân viên bán hàng có thể phân tích doanh thu theo khách hàng, trong khi nhân viên phục vụ có thể xem xét tỷ lệ và thời gian phản hồi cuộc gọi Ngoài ra, người quản lý đối tác có thể đánh giá hiệu suất của đối tác bằng cách so sánh quỹ tiếp thị với doanh thu do họ tạo ra.

Dữ liệu OLAP được lưu trữ trong các giản đồ hình sao, phân tách thành các dữ kiện và thứ nguyên Dữ kiện là dữ liệu định lượng như doanh thu và khối lượng bán hàng, trong khi thứ nguyên cho phép phân tích dữ liệu theo các khía cạnh khác nhau như địa lý và thời gian Các thứ nguyên có thể được phân cấp, ví dụ, thứ nguyên địa lý bao gồm các cấp độ như quốc gia, tiểu bang và thành phố, trong khi thứ nguyên thời gian có thể phân chia theo năm, tháng và ngày.

Hình 12 5 Ví dụ về lược đồ hình sao:bảng dữ kiện và các thứ nguyên 19

OLAP cho phép người dùng phân tích lý do đằng sau các dữ liệu bằng cách tham chiếu đến các thứ nguyên Chẳng hạn, khi doanh số bán hàng ở Đức gặp khó khăn, người dùng có thể xem xét doanh số theo từng quốc gia và khu vực đô thị để xác định vấn đề có tập trung ở một khu vực cụ thể hay không Qua việc phân tích theo các cấp độ phân cấp, nguồn gốc của vấn đề có thể được phát hiện Nếu không có dấu hiệu vấn đề ở khu vực đô thị, nhà phân tích có thể tiếp tục khám phá các yếu tố khác như thời gian và loại sản phẩm.

Lược đồ hình sao là một cấu trúc dữ liệu bao gồm một bảng dữ kiện trung tâm được bao quanh bởi các bảng thứ nguyên, tạo hình dạng giống như một ngôi sao Cấu trúc này cho phép thực hiện nhiều loại phân tích khác nhau, giúp người dùng dễ dàng tìm kiếm câu trả lời cho các câu hỏi dựa trên các bảng dữ liệu.

1 Khách hàng X được giảm giá gì?

2 Số lượng vận chuyển thay đổi như thế nào qua các năm?

3 Tổng doanh thu của sản phẩm ABC là bao nhiêu?

Kho dữ liệu khác với data mart, thường bao gồm nhiều lược đồ sao, mỗi lược đồ được tổ chức xung quanh một bảng dữ kiện trung tâm liên quan đến khách hàng, cơ hội, yêu cầu dịch vụ và hoạt động Ví dụ, lược đồ khách hàng có thể lưu trữ thông tin chi tiết về khách hàng.

Số lượng Vận chuyển Giảm giá

Thứ nguyên thời gian Ngày đặt hàng Năm Qúy Tháng

Thứ nguyên sản phẩm Tên Danh mục Giá cả

Thứ nguyên nhân lực Tên Lãnh đạo

Bộ phận Vùng Lãnh thổ

Thứ nguyên khách hàng Tên Địa chỉ Thành phố

Mã bưu chính đóng vai trò quan trọng trong việc quản lý số liệu doanh thu bán hàng, khối lượng bán hàng, chi phí bán hàng, tỷ suất lợi nhuận, chiết khấu và chi phí khuyến mại của khách hàng.

Các công cụ OLAP hỗ trợ ra quyết định theo thời gian thực, ví dụ như việc cung cấp thông tin về xu hướng mua hàng cho đại lý trung tâm cuộc gọi trong khi khách hàng đang trò chuyện Điều này giúp đưa ra các đề nghị phù hợp, tăng khả năng nhận được phản hồi tích cực từ khách hàng.

Một yếu tố quan trọng trong phân tích CRM là cơ chế cung cấp thông tin, có thể thông qua giao diện trình duyệt web trên máy tính để bàn với bố cục đồ họa chi tiết, yêu cầu người dùng tìm kiếm kết quả Một phương thức phân phối khác là thiết lập các điểm kích hoạt, như khi khách hàng thực hiện nhiều cuộc gọi dịch vụ trong tháng, sau đó ứng dụng sẽ tự động gửi thông tin liên quan qua email, SMS hoặc các cơ chế cảnh báo khác.

“xuất bản và đăng ký”, là một công cụ quản lý mạnh mẽ.

Trên thị trường phân tích kinh doanh, nhiều người chơi cung cấp chức năng OLAP cho người dùng, trong đó có các nhà cung cấp lớn như Tableau, Qlik, Microsoft, IBM, SAS, SAP và Oracle Ngoài ra, các nhà cung cấp cơ sở dữ liệu cũng tích hợp chức năng OLAP vào dịch vụ của họ.

Khai thác dữ liệu

Khai thác dữ liệu là phương pháp thứ ba để thẩm vấn dữ liệu khách hàng Trong bối cảnh CRM, khai thác dữ liệu được định nghĩa là quá trình phân tích và khai thác thông tin từ dữ liệu khách hàng để tối ưu hóa mối quan hệ và nâng cao trải nghiệm khách hàng.

Khai thác dữ liệu là quá trình phân tích mô tả và dự đoán các tập dữ liệu lớn, nhằm hỗ trợ hiệu quả cho các hoạt động tiếp thị, bán hàng và dịch vụ.

Việc khai thác dữ liệu thường được thực hiện trên các bộ dữ liệu ổn định trong các trung tâm dữ liệu hoặc kho dữ liệu, mặc dù có thể áp dụng cho cơ sở dữ liệu vận hành Tốc độ xử lý cao, chi phí lưu trữ giảm và các gói phân tích cải tiến đã khiến khai thác dữ liệu trở nên hấp dẫn và tiết kiệm hơn Bên cạnh đó, khối lượng dữ liệu lớn cũng làm cho việc khai thác dữ liệu trở nên hữu ích, thậm chí cần thiết hơn.

Phân tích khai thác dữ liệu có thể thực hiện theo nhiều cách như mô tả, trực quan hóa, phân loại, ước tính, dự đoán, nhóm mối quan hệ và phân cụm Mục đích của phân tích thường là để mô tả hiện tượng, chẳng hạn như việc phân tích một cơ sở dữ liệu khách hàng khổng lồ với hàng triệu hồ sơ nhằm giúp các nhà quản lý hiểu rõ hơn về hành vi mua sắm của khách hàng Phân tích mô tả giúp trả lời câu hỏi "chuyện gì đang xảy ra ở đây?" và thông qua một mô tả tốt, độ phức tạp của tập dữ liệu được giảm thiểu, khuyến khích người dùng tìm kiếm lời giải thích sâu hơn.

Bài viết này trình bày một phân tích so sánh mô tả về doanh số bán hàng của các nhãn hiệu hotdog khác nhau, cho thấy thương hiệu dẫn đầu có doanh số cao hơn 300% so với thương hiệu xếp thứ hai Điều này sẽ thúc đẩy các nhà quản lý tìm hiểu nguyên nhân, có thể bao gồm chiến dịch tiếp thị hiệu quả hơn, hệ thống phân phối mạnh mẽ, hương vị ưu việt và mức giá hấp dẫn Phân tích sâu hơn sẽ cần thiết để đưa ra lời giải thích Sau khi hoàn thành mô tả, nhiều gói phân tích cung cấp các công cụ trực quan hóa như biểu đồ, đồ thị và bản đồ, giúp người dùng hiểu rõ hơn về thông tin Kết quả từ phân tích cũng có thể được xuất sang các gói trực quan hóa dữ liệu khác.

Phân tích dữ liệu giúp cung cấp thông tin chuyên sâu bằng cách phân loại các thực thể mới vào sơ đồ phân loại đã xác định Ví dụ, bạn có thể phân loại khách hàng mới theo giới tính hoặc phát triển một hệ thống phân cấp dựa trên giá trị trọn đời của khách hàng (CLV) Khi xác định khách hàng tiềm năng, bạn có thể đánh giá và chỉ định họ vào nhóm tương tự, từ đó ước lượng giá trị tiềm năng của họ Hệ thống phân cấp hiện tại hoạt động như một tập huấn luyện rõ ràng với các ví dụ đã được phân loại trước.

KHAI THÁC DỮ LIỆU TẠI MARKS & SPENCER

Khai thác dữ liệu đã trở thành một chiến lược thành công cho Marks & Spencer, nhà bán lẻ hàng đầu của Anh, với việc công ty phục vụ 10 triệu khách hàng mỗi tuần tại hơn 300 cửa hàng Nhờ vào việc phân tích khối lượng lớn dữ liệu này, Marks & Spencer có thể xây dựng mối quan hệ một-một với từng khách hàng, giúp họ nhận biết chính xác những sản phẩm phù hợp để tối ưu hóa lợi nhuận khi khách hàng đến cửa hàng.

Marks & Spencer tin rằng có hai yếu tố quan trọng trong khai thác dữ liệu: chất lượng dữ liệu và mục tiêu kinh doanh rõ ràng Chất lượng dữ liệu cao hơn khi danh tính khách hàng được biết, thường thông qua theo dõi thương mại điện tử hoặc chương trình khách hàng thân thiết Công ty sử dụng khai thác dữ liệu để phân loại khách hàng thành các nhóm “lợi nhuận cao”, “lợi nhuận trung bình” và “lợi nhuận thấp”, từ đó lập hồ sơ khách hàng “có lợi nhuận cao” Hồ sơ này giúp hướng dẫn các hoạt động giữ chân khách hàng thông qua quảng cáo và khuyến mãi được nhắm mục tiêu chính xác.

22 lợi nhuận trung bình” hoặc “lợi nhuận thấp”, những khách hàng có tiềm năng phát triển thành khách hàng “có lợi nhuận cao”.

Khi phân loại xử lý các danh mục rời rạc, việc ước tính cho các biến liên tục là rất quan trọng Một ngân hàng có thể phát triển chiến dịch tiếp thị cho sản phẩm mới bằng cách sử dụng mô hình ước tính để đánh giá và chấm điểm khách hàng từ 0 đến 1, dựa trên xác suất phản hồi tích cực với lời đề nghị Những ước tính này cho phép xếp hạng khách hàng để quyết định ai sẽ nhận được ưu đãi, với những khách hàng dưới ngưỡng nhất định sẽ không được tham gia Mô hình rời bỏ là công cụ phổ biến trong thực hành CRM, sử dụng các mô hình ước tính để tối ưu hóa chiến dịch tiếp thị.

Dự đoán là ứng dụng của phân loại hoặc ước lượng, với các vấn đề dự đoán được phân loại thành biến phân loại hoặc liên tục Trong CRM, việc dự đoán hành vi khách hàng như giới thiệu bạn bè, tăng chi tiêu hay chuyển sang ứng dụng trả phí là rất quan trọng Tính năng dự đoán sử dụng các ví dụ đào tạo với giá trị biến đã biết, từ đó xây dựng mô hình dựa trên dữ liệu lịch sử và áp dụng cho khách hàng có hành động dự đoán.

Các nhà phân tích sử dụng thủ tục phân nhóm tương đồng để tìm ra mối liên kết giữa dữ liệu Trong lĩnh vực bán lẻ, việc phân tích giỏ hàng giúp phát hiện những sở thích chung của khách hàng, như mối liên hệ giữa việc mua món tráng miệng ít béo với các sản phẩm chăm sóc sức khỏe Ví dụ, một nhà phân tích tại Wal*Mart phát hiện mối tương quan giữa doanh số bán tã lót và bia vào ngày thứ Sáu, cho thấy các ông bố thường mua cả hai sản phẩm cùng lúc Công ty đã tận dụng thông tin này để sắp xếp các mặt hàng gần nhau, dẫn đến doanh thu tăng mạnh cho cả hai sản phẩm.

Phân tích giỏ hàng thường dựa vào dữ liệu chéo, trong khi một hình thức phân nhóm sở thích khác xem xét mối liên hệ giữa dữ liệu theo thời gian Các mô hình tuần tự có thể được xác định thông qua phân tích, nơi các nhà phân tích tìm kiếm quy tắc “nếu…thì” trong hành vi của khách hàng.

Nếu khách hàng mua giày đi bộ vào tháng 11, có 40% khả năng họ sẽ mua áo mưa trong vòng 6 tháng tới Quy tắc này cho thấy mối liên hệ giữa các sản phẩm và hành vi mua sắm của khách hàng, giúp doanh nghiệp dự đoán nhu cầu và tối ưu hóa chiến lược tiếp thị.

Phân tích phân cụm là một phương pháp quan trọng trong việc tìm kiếm các nhóm tự nhiên trong tập dữ liệu đa dạng, không giống như phân loại, nơi các trường hợp mới được ghép vào một mô hình đã xác định Mục tiêu của phân cụm là tối thiểu hóa sự khác biệt giữa các thành viên trong cùng một cụm và tối đa hóa sự khác biệt giữa các cụm khác nhau Kỹ thuật này sử dụng một phạm vi biến xác định trong quá trình phân cụm, thường được áp dụng trong quản lý quan hệ khách hàng (CRM) để phân nhóm hồ sơ khách hàng Ví dụ, dự án phân khúc khách hàng có thể sử dụng dữ liệu giao dịch, nhân khẩu học và hành vi để tạo ra các nhóm khác nhau Có nhiều kỹ thuật phân cụm, bao gồm phân tích cụm, CART và CHAID Sau khi các cụm đồng nhất được hình thành, việc diễn giải chúng là cần thiết, với các phân khúc thị trường phong cách sống thường được mô tả bằng các nhãn như “Gia đình trẻ thuộc tầng lớp lao động” hay “Dân ngoại ô giàu có” để phản ánh bản chất của từng cụm.

Có nhiều cách tiếp cận khác nhau để khai thác dữ liệu, và chúng có thể được áp dụng theo nhiều trình tự khác nhau Một ví dụ là sử dụng phân cụm để tạo ra các phân khúc khách hàng, sau đó áp dụng dữ liệu giao dịch trong từng phân khúc để dự đoán hoạt động mua hàng và giá trị khách hàng trọn đời (CLV) trong tương lai.

Quy trình khai thác dữ liệu

Chúng tôi giới thiệu một số kỹ thuật dữ liệu phổ biến, được phân loại theo cách sử dụng trong khai thác dữ liệu có hướng dẫn và không có hướng dẫn, như tóm tắt trong bảng 12.1 Danh sách này không đầy đủ tất cả các kỹ thuật mà người khai thác dữ liệu sử dụng, và chúng tôi cũng không khám phá tất cả các nhánh của những kỹ thuật này Độc giả quan tâm nên tham khảo các cơ quan chuyên môn về khai thác dữ liệu hoặc thống kê kinh doanh để tìm hiểu thêm.

Kỹ thuật khai thác dữ liệu có hướng Kỹ thuật khai thác dữ liệu vô hướng

Cây quyết định Phân cụm phân cấp

Hồi quy Logistic Thuật toán K – mean

Hồi quy bội Phân cụm 2 bước

Phân tích biệt số Phân tích nhân tố

Mạng nơ – ron nhân tạo

Bảng 12 trình bày ba kỹ thuật khai thác dữ liệu phổ biến mà các nhà phân tích thường sử dụng Trong đó, chúng tôi sẽ tập trung vào các kỹ thuật khai thác dữ liệu có hướng Cần lưu ý rằng một số kỹ thuật này chỉ áp dụng cho những loại dữ liệu nhất định, bao gồm dữ liệu định danh, thứ tự, khoảng hoặc dữ liệu.

Cây quyết định là một mô hình đồ họa có cấu trúc gốc và nhánh đảo ngược, hoạt động thông qua quy trình đệ quy phân vùng Khi dự đoán một tập dữ liệu, chẳng hạn như việc mua bảo hiểm nhân thọ, các biến độc lập được xác định để giải thích quyết định mua hàng Thuật toán cây quyết định tiến hành phân vùng dữ liệu thành các nhóm dựa trên quy tắc tối đa hóa tính đồng nhất hoặc độ tinh khiết của biến phản hồi trong mỗi nhóm Mỗi bước phân vùng sử dụng các biến giải thích bổ sung để tiếp tục phân chia các nhóm, và quá trình này diễn ra đệ quy cho đến khi không còn phân vùng nào khả thi.

Quá trình phân vùng đệ quy dẫn đến việc hình thành cây quyết định, một công cụ hữu ích trong phân tích dữ liệu Ví dụ, trong bài 5, chúng ta đã sử dụng cây quyết định để dự đoán rủi ro tín dụng Phương pháp này cũng có thể áp dụng để dự đoán tỷ lệ rời bỏ của khách hàng, phản hồi từ các chiến dịch tiếp thị, hoặc sự giới thiệu từ bạn bè Cây quyết định có khả năng xử lý cả dữ liệu phân loại (danh nghĩa hoặc thứ tự) và dữ liệu liên tục (khoảng hoặc tỉ lệ).

Hồi quy logistic là phương pháp đo lường ảnh hưởng của một hoặc nhiều biến độc lập liên tục lên một biến phụ thuộc phân loại Mô hình này cho phép báo cáo các hệ số hồi quy, thể hiện tác động của các biến độc lập đến biến mục tiêu Ví dụ, quyết định nâng cấp thiết bị mới của khách hàng có thể được dự đoán dựa trên các yếu tố như số năng sử dụng mô hình trước đó, số lượng bạn bè trên Facebook, chi tiêu cho dữ liệu và số lượng tin nhắn gửi và nhận Một mô hình đào tạo có thể được xây dựng từ tập dữ liệu chứa các thông tin này, với các hệ số được tính toán phản ánh ảnh hưởng tương đối của từng biến độc lập Việc bổ sung hoặc loại bỏ các biến có thể cải thiện khả năng dự đoán hành vi khách hàng Mô hình hồi quy logistic cung cấp xác suất khách hàng tham gia vào hành động mục tiêu, từ đó giúp định hình các chiến lược tiếp thị hiệu quả hơn.

Hồi quy bội là một kỹ thuật phân tích sử dụng nhiều biến dự đoán để dự đoán một biến phụ thuộc liên tục, như doanh thu bán hàng hoặc tỷ lệ mua hàng lặp lại Ví dụ, để dự đoán số lượng người đăng ký kênh truyền hình trực tuyến, các yếu tố như cường độ tín hiệu, số hộ gia đình trong khu vực, số kênh cạnh tranh, thời gian quảng cáo và chi phí đăng ký có thể được xem xét Mô hình hồi quy bội sẽ xác định mức độ ảnh hưởng của từng biến và có thể cải thiện bằng cách loại bỏ các biến ít quan trọng, đảm bảo rằng tất cả các biến còn lại đều có ý nghĩa thống kê Hãy nhớ rằng quy tắc "rác vào, rác ra" luôn đúng trong phân tích này.

26 biến phụ thuộc nó không cho ban biết liệu mô hình giả thuyết của bạn có đúng hay không.

Phân tích biệt số (DA) là một kỹ thuật mạnh mẽ trong việc phân cụm các quan sát thành nhiều lớp, giúp xác định biến nào có ảnh hưởng lớn nhất đến sự khác biệt giữa các nhóm Khác với hồi quy, DA không chỉ tính điểm mà còn có khả năng gán các trường hợp mới vào các nhóm đã xác định Ví dụ, DA có thể sử dụng điểm số của một cá nhân trên nhiều biến dự đoán để xác định nhóm giá trị trọn đời của khách hàng, từ đó phân loại khách hàng thành các nhóm như cao, trung bình hoặc thấp.

Mạng nơ-ron nhân tạo là công cụ hữu ích trong việc điều chỉnh mô hình dữ liệu để phân loại, ước tính và dự đoán Dù có phép ẩn dụ về chức năng của não, nền tảng của mạng nơ-ron nhân tạo sẽ được khám phá chi tiết hơn trong bài viết này.

Mạng nơ-ron nhân tạo (hay mạng lưới nơ-ron trong trí tuệ nhân tạo) có khả năng tạo ra những dự đoán chính xác từ các bộ dữ liệu lớn và phức tạp, mặc dù chúng thường khó hiểu do sử dụng các phương trình toán học phức tạp Để hoạt động hiệu quả, mạng nơ-ron cần được đào tạo để nhận diện mẫu từ dữ liệu mẫu, và sau khi hoàn tất quá trình này, chúng có thể dự đoán hành vi của khách hàng dựa trên dữ liệu mới Theo Michael Berry và Gordon Linop, mạng nơ-ron nhân tạo thường là lựa chọn tối ưu cho các nhiệm vụ phân loại và dự đoán, đặc biệt khi kết quả của mô hình quan trọng hơn việc hiểu cách thức hoạt động của nó.

DỰ ĐOÁN CHUYỂN SỬ DỤNG MẠNG NƠ – RON NHÂN TẠO

Sử dụng dữ liệu từ nhà cung cấp dịch vụ điện thoại di động, một mô hình dự đoán tỷ lệ rời bỏ đã được phát triển thông qua phân tích mạng nơ-ron nhân tạo Tập dữ liệu bao gồm 20 trường thông tin của 2427 khách hàng, kèm theo thông tin về việc khách hàng có rời bỏ công ty hay không Phần mềm khai thác dữ liệu SPSS, hiện thuộc sở hữu của IBM, đã được sử dụng để thực hiện phân tích này.

1 Tiểu bang: biế phân loại, dành cho 50 tiểu bang và quận Columbia

2 Độ dài tài khoản: biến có giá trị nguyên cho biết tài khoản đã hoạt động được bao lâu.

3 Mã vùng: biến phân loại

4 Số điện thoại: về cơ bản là chìa khoá thay thế để nhận dạng khách hàng.

5 Quốc tế kế hoạch: phân loại nhị phân có giá trị hoặc không có giá trị

6 Gói thư thoại: biến phân loại phân đôi có giá trị “có” hoặc “không”.

7 Số lượng tin nhắn thư thoại: biến có giá trị nguyên.

8 Tổng số phút trong ngày: biến liên tục cho số phút khách hàng đã sử dụng dịch vụ trong ngày.

9 Tổng số cuộc gọi trong ngày: biến có giá trị nguyên.

10 Tổng phí ngày: biến đổi liên tục dựa trên hai biến số trên.

11 Tổng số phút buổi tối: biến liên tục theo số phút khách hàng đã sử dụng dịch vụ trong buổi tối

12 Tổng số cuộc gọi buổi tối: biến có giá trị nguyên.

13 Tổng phí buổi tối: biến liên tục dựa trên hai biên trước đó.

14 Tổng số phút ban đêm: biến liên tục để lưu trữ số phút khách hàng đã sử dụng phục vụ trong đêm

15 Tổng số cuộc gọi ban đêm: biến có giá trị nguyên

16 Tổng phí đêm: biến đổi liên tục dựa trên hai biến số trên

17 Tổng số phút gọi quốc tế: biến đổi liên tục theo số phút khách hàng đã sử dụng dịch vụ gọi quốc tế

18 Tổng số cuộc gọi quốc tế: biến có giá trị nguyên

19 Tổng cước quốc tế: biến đổi liên tục dựa trên hai biến số trên.

20 Số lượng cuộc gọi đến dịch vụ khách hàng: biến có giá trị nguyên

Mạng nơ-ron nhân tạo sử dụng dữ liệu để dự đoán tình trạng rời bỏ của khách hàng với độ chính xác lên đến 92,35%, dựa trên 2.427 trường hợp Mô hình này giúp các nhà cung cấp dịch vụ di động nhận diện những khách hàng có khả năng rời bỏ, từ đó thực hiện các biện pháp chủ động nhằm giữ chân những khách hàng giá trị.

Chúng ta sẽ khám phá các kỹ thuật khai thác dữ liệu vô hướng, đặc biệt là phân cụm để xác định các nhóm tự nhiên trong tập dữ liệu Ví dụ, khách hàng có thể được phân nhóm dựa trên sự tương đồng trong hành vi mua sắm Phân tích giỏ hàng cũng áp dụng phương pháp phân cụm để xác định các mặt hàng thường được mua cùng nhau Khi thêm yếu tố thời gian, kỹ thuật phân cụm giúp phát hiện các mô hình trong chuỗi hành vi mua sắm Quan trọng là, trong các kỹ thuật phân cụm, không có lớp hay danh mục nào được xác định trước, mà các nhóm được ghi lại dựa trên dữ liệu đầu vào Do đó, việc xem xét cẩn thận các trường hợp dữ liệu khi lập mô hình cụm là rất cần thiết.

Phân cụm theo phân cấp bậc được coi là “mẹ của tất cả các mô hình phân cụm” Phương pháp này hoạt động dựa trên giả định rằng mỗi bản ghi ban đầu là một cụm riêng lẻ, sau đó tiến hành nhóm các bản ghi lại với nhau một cách dần dần.

Kết quả được trình bày trong một bảng hoặc chương trình dendro, cho thấy sự phân nhóm các thị trường xuất khẩu thành các cụm dựa trên doanh số lịch sử và cơ cấu doanh số bán hàng Hình 12.6 minh họa sơ đồ phân nhóm này, giúp dễ dàng nhận diện các cụm hồ sơ liên quan.

Giá trị quản lý của phân tích cụm này nằm ở khả năng quan sát các cấp độ khác nhau Nhà phân tích đã xác định được ba cụm: A, B và C Cụm A bao gồm các quốc gia từ Bắc Ireland đến Hy Lạp, cụm B từ Philippines đến Bangladesh, và cụm C từ Botswana đến Uganda.

Trí tuệ nhân tạo (AI), học máy (ML) và học sâu (DL)

Cộng đồng doanh nghiệp đang rất phấn khởi về tiềm năng của trí tuệ nhân tạo (AI), nhưng vẫn còn nhiều nhầm lẫn cần làm rõ Mặc dù AI, học máy (ML) và học sâu (DL) thường được thảo luận trong bối cảnh quản lý quan hệ khách hàng (CRM), nhưng thực tế, ứng dụng của chúng còn rộng hơn rất nhiều.

Ba thuật ngữ AI, ML và DL được sử dụng thay thế cho nhau, đặc biệt là AI và

AI, ML và DL là những thuật ngữ quan trọng trong việc phát triển công nghệ thông minh Chúng xuất hiện tuần tự khi các nhà khoa học nỗ lực cải thiện khả năng của máy tính Ban đầu, máy tính chỉ thực hiện các tác vụ cụ thể theo chương trình hoặc hướng dẫn đã được viết sẵn Tuy nhiên, với sự tiến bộ trong công nghệ, máy móc đang dần trở nên thông minh hơn, vượt ra ngoài khả năng thực hiện lệnh đơn giản.

Vào những năm 1950, các nhà khoa học đã bắt đầu nghiên cứu khả năng phát triển trí thông minh nhân tạo cho máy tính, nhằm tạo ra một hệ thống có thể thực hiện nhiều nhiệm vụ khác nhau mà không cần lập trình cụ thể cho từng nhiệm vụ Họ đã đặt ra câu hỏi về khả năng cung cấp trí thông minh tổng quát cho máy tính, cho phép nó học hỏi và thích ứng với nhiều tình huống khác nhau Thuật ngữ "trí tuệ nhân tạo" ra đời để phản ánh những nỗ lực này trong việc phát triển một loại mã máy tính tinh vi hơn, có khả năng tự động hóa và cải thiện hiệu suất công việc.

Có nhiều phương pháp khác nhau mà các nhà khoa học đang nghiên cứu để phát triển trí tuệ nhân tạo (AI), tuy nhiên, tiến độ vẫn diễn ra rất chậm Một trong những phương pháp đầu tiên được lấy cảm hứng từ cấu trúc của não người, đặc biệt là từ khoa học thần kinh, với nhận thức rằng bộ não được tổ chức như một mạng lưới các tế bào thần kinh Điều này đặt ra câu hỏi liệu chúng ta có thể thiết lập một hệ thống máy tính mô phỏng trí thông minh của con người hay không Mạng lưới thần kinh nhân tạo (ANN) ra đời như một phương tiện để vận hành AI, với khả năng ban đầu là nhận diện và phân loại các đối tượng, như xác định các loài động vật hoặc nhận dạng chữ viết tay Ví dụ, ANN có khả năng quét hình ảnh động vật và phân loại chính xác các loài với độ chính xác cao.

 Mạng lưới nơ – ron nhận đầu vào.

 Nó xác định tầm quan trọng hoặc trọng số để cung cấp cho mỗi đầu vào.

Nó phát triển một thuật toán nhằm đánh giá các đầu vào có trọng số trong lớp ẩn Các trọng số này được xác định trong quá trình huấn luyện, khi mạng nhận đầu vào và đầu ra, từ đó tính toán các trọng số để đạt được sự kết hợp tối ưu giữa chúng.

 Nó tạo ra đầu ra.

Dự đoán loài mèo là một quá trình phức tạp do sự đa dạng về hình dạng tai, loại lông, kích thước và hình dạng khuôn mặt Để huấn luyện mạng nơ-ron, nhà khoa học dữ liệu cần cung cấp một lượng lớn hình ảnh, bao gồm các biến thể mèo trong nhiều môi trường, ánh sáng và góc nhìn khác nhau Tập dữ liệu lớn giúp mạng nơ-ron cải thiện khả năng dự đoán, vì nó học từ dữ liệu, dẫn đến khái niệm học máy.

ANN đang ngày càng phổ biến trong phân tích CRM, như đã đề cập trước đó Thay vì phân loại động vật, các chuyên gia CRM tập trung vào việc phân loại và dự đoán khách hàng hiện tại và tiềm năng.

Mô hình ANN (Mạng nơ-ron nhân tạo) cho phép doanh nghiệp khai thác dữ liệu nội bộ và bên ngoài, bao gồm nhân khẩu học, tâm lý học, và dữ liệu từ hệ thống điểm bán lẻ cũng như mạng xã hội Sự phát triển của dữ liệu di động và Internet kết nối (IoT) đã tạo điều kiện cho việc kết nối các thiết bị với Internet, từ điện thoại di động đến máy khoan dầu Một ưu điểm nổi bật của ANN là khả năng tự học mà không cần lý thuyết trước, giúp các chuyên gia CRM xác định yếu tố quan trọng và dự đoán khách hàng có khả năng rời bỏ cao Nhờ đó, doanh nghiệp có thể tập trung nỗ lực quảng cáo vào những khách hàng có nguy cơ cao nhất, từ đó nâng cao hiệu quả quản lý khách hàng.

Mặc dù mạng nơ-ron nhân tạo (ANN) mang lại nhiều lợi ích, nhưng cũng tồn tại một số hạn chế Đầu tiên, ANN yêu cầu một lượng lớn dữ liệu và sức mạnh tính toán, mặc dù những yếu tố này ngày càng trở nên dễ tiếp cận hơn Thứ hai, việc sử dụng ANN đòi hỏi các nhà khoa học dữ liệu có kỹ năng cao, mặc dù số lượng chuyên gia này đang gia tăng Quan trọng hơn, ANN hoạt động như những "hộp đen", cho phép người dùng thấy đầu vào và đầu ra nhưng không thể hiểu cách các đầu vào tương tác qua các lớp nơ-ron, dẫn đến khả năng giải thích hạn chế Trong khi ANN có khả năng dự đoán tốt, nó lại không cung cấp nhiều thông tin chi tiết như các phương pháp học máy khác, ví dụ như cây quyết định, khi cần hiểu lý do tại sao một số khách hàng được giữ chân lâu hơn.

Mặc dù mạng nơ-ron nhân tạo (ANN) là hình thức triển khai trí tuệ nhân tạo (AI) ban đầu, các phương pháp học máy khác như cây quyết định đã trở nên phổ biến hơn trong nghiên cứu và phát triển do yêu cầu tính toán thấp hơn Tuy nhiên, ANN đã trải qua một sự hồi sinh mạnh mẽ trong những năm gần đây nhờ vào những tiến bộ công nghệ, nâng cao khả năng tính toán và khắc phục những hạn chế trong việc áp dụng ANN.

Ngày nay, sự phát triển trong lĩnh vực toán học và dữ liệu đã khẳng định vai trò quan trọng của Machine Learning (ML) Với những máy tính xách tay thông thường, bạn có thể dễ dàng xây dựng Mạng Nơ-ron Nhân tạo (ANN) chỉ trong vài giây bằng cách sử dụng các gói phần mềm thống kê phổ biến.

Một mô hình đơn giản với ba đầu vào và hai lớp có thể chạy trên điện thoại di động, nhưng khi số lượng đầu vào tăng lên hàng triệu và sử dụng hàng trăm lớp ẩn, yêu cầu về sức mạnh tính toán sẽ tăng lên đáng kể.

Hình 12 8 Mạng lưới nơ-ron hai lớp ẩn đơn giản (biểu diễn đơn giản) Input: đầu vào

Học sâu (Deep learning)

ấn đề riêng tư

Việc thu thập, lưu trữ, phân tích và sử dụng dữ liệu khách hàng là một vấn đề quan trọng đối với các cơ quan quản lý, trong khi quyền riêng tư và bảo vệ dữ liệu đang là mối quan tâm lớn của các nhà lập pháp toàn cầu Khách hàng ngày càng lo ngại về lượng thông tin mà các tổ chức thương mại nắm giữ và cách sử dụng thông tin đó Thực tế, nhiều người tiêu dùng không nhận thức được khối lượng thông tin mà các công ty có thể thu thập Khi bạn sử dụng Internet, các cookie có thể được tải xuống từ các trang web, với một số trang yêu cầu sự cho phép của người dùng trước khi thực hiện Để đáp ứng những lo ngại về quyền riêng tư, đã có hai phản hồi chính: tự điều chỉnh từ các công ty và hiệp hội, với nhiều công ty công khai chính sách bảo mật và áp dụng quy tắc thực hành trong các lĩnh vực như tiếp thị trực tiếp, quảng cáo và nghiên cứu thị trường.

Vào năm 1980, Tổ chức Hợp tác và Phát triển Kinh tế (OECD) đã xây dựng một bộ nguyên tắc bảo vệ dữ liệu cá nhân, cung cấp một khuôn khổ quyền riêng tư quan trọng trên toàn cầu Những nguyên tắc này đã được áp dụng rộng rãi trong các luật bảo vệ dữ liệu và quyền riêng tư hiện có cũng như mới nổi tại Cộng đồng Châu Âu, đồng thời đóng vai trò nền tảng cho việc phát triển các chương trình bảo mật và nguyên tắc thực hành tốt nhất.

Tám nguyên tắc của OECD như sau

1 Nguyên tắc hạn chế thu thập Dữ liệu cá nhân phải được lấy bằng các phương tiện hợp pháp và công bằng và khi thích hợp, với sự hiểu biết hoặc đồng ý của chủ thể dữ liệu.

2 Nguyên tắc chất lượng dữ liệu Dữ liệu cá nhân phải phù hợp với mục đích sử dụng và trong phạm vi cần thiết cho những mục đích đó, dữ liệu phải chính xác, đầy đủ và được cập nhật.

3 Nguyên tắc đặc tả mục đích Mục đích thu thập dữ liệu cá nhân phải được xác định không muộn hơn thời điểm thu thập dữ liệu và việc sử dụng tiếp theo chỉ giới hạn ở việc thực hiện các mục đích đó hoặc các mục đích sử dụng khác tương thích với các mục đích đó.

4 Sử dụng nguyên tắc giới hạn Dữ liệu cá nhân không được tiết lộ, cung cấp hoặc sử dụng cho các mục đích khác ngoài những mục đích được chỉ định ngoại trừ a) với sự đồng ý của chủ thể dữ liệu; hoặc b) theo thẩm quyền của pháp luật.

5 Nguyên tắc bảo vệ an ninh Dữ liệu cá nhân phải được bảo vệ bằng các biện pháp bảo vệ an ninh hợp lý chống lại các rủi ro như mất mát hoặc truy cập trái phép, phá hủy, sử dụng, sửa đổi hoặc tiết lộ dữ liệu.

6 Nguyên tắc công khai Phải có chính sách chung cởi mở về sự phát triển, thực tiễn và chính sách liên quan đến dữ liệu cá nhân Phải có sẵn các phương tiện để thiết lập sự tồn tại và bản chất của dữ liệu cá nhân cũng như mục đích sử dụng chính của chúng, cũng như danh tính và nơi cư trú thường xuyên của người kiểm soát dữ liệu.

7 Nguyên tắc tham gia của cá nhân Một cá nhân phải có quyền: a) lấy từ bộ điều khiển dữ liệu hoặc nói cách khác là xác nhận liệu bộ điều khiển dữ liệu có dữ liệu liên quan đến mình hay không; b) đã thông báo cho anh ta những dữ liệu liên quan đến anh ta i) trong một khoảng thời gian hợp lý; ii) với một khoản phí, nếu có, không quá cao; iii) một cách hợp lý; và iv) ở dạng mà anh ta dễ hiểu; c) được cung cấp lý do nếu yêu cầu được đưa ra theo các điểm (a) và (b) bị từ chối và có thể phản đối sự từ chối đó; và d) thách thức dữ liệu liên quan đến anh ta và, nếu thử thách thành công, dữ liệu sẽ bị xóa, chỉnh sửa, hoàn thành hoặc sửa đổi.

8 Nguyên tắc trách nhiệm giải trình Người kiểm soát dữ liệu phải chịu trách nhiệm tuân thủ các biện pháp có hiệu lực đối với các nguyên tắc nêu trên.

Bộ Thương mại Hoa Kỳ đã xây dựng khung pháp lý tự chứng nhận Cảng An toàn nhằm giúp các tổ chức Hoa Kỳ tuân thủ Chỉ thị Bảo vệ Dữ liệu của EC Khung này được thiết kế để phù hợp chặt chẽ với các nguyên tắc của OECD, bao gồm bảy nguyên tắc cơ bản của Cảng An toàn.

1 Chú ý Các tổ chức phải thông báo cho các cá nhân về mục đích thu thập và sử dụng thông tin về họ họ phải cung cấp thông tin về cách các cá nhân có thể liên hệ với tổ chức khi có bất kỳ thắc mắc hoặc khiếu nại nào, các loại bên thứ ba mà tổ chức tiết lộ thông tin cũng như các lựa chọn và phương tiện mà tổ chức vận hành để hạn chế việc sử dụng và tiết lộ thông tin.

2 Sự lựa chọn Các tổ chức phải cho các cá nhân cơ hội lựa chọn (không tham gia) xem thông tin cá nhân của họ sẽ được tiết lộ cho bên thứ ba hay được sử dụng cho mục đích không phù hợp với mục đích mà thông tin đó được thu thập ban đầu hoặc được cá nhân ủy quyền sau đó.

3 Chuyển tiếp (chuyển cho bên thứ ba) Để tiết lộ thông tin cho bên thứ ba, tổ chức phải áp dụng nguyên tắc thông báo và lựa chọn Khi một tổ chức muốn chuyển thông tin cho bên thứ ba đóng vai trò là đại lý, tổ chức đó có thể làm như vậy nếu đảm bảo rằng bên thứ ba tuân thủ các nguyên tắc bảo mật của Cảng An toàn hoặc tuân theo Chỉ thị hoặc các quy định phù hợp khác Để thay thế, tổ chức có thể ký kết thỏa thuận bằng văn bản với bên thứ ba đó yêu cầu bên thứ ba cung cấp ít nhất cùng mức độ bảo vệ quyền riêng tư như được yêu cầu bởi các nguyên tắc liên quan.

4 Truy cập Các cá nhân phải có quyền truy cập vào thông tin cá nhân về họ mà tổ chức nắm giữ và có thể sửa, sửa đổi hoặc xóa thông tin đó nếu thông tin đó không chính xác, trừ khi gánh nặng hoặc chi phí cung cấp quyền truy cập sẽ không tương xứng với những rủi ro đối với quyền riêng tư của cá nhân, hoặc khi quyền của những người không phải là cá nhân sẽ bị vi phạm.

Ngày đăng: 19/12/2024, 14:25

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
11. www.forbes.com/ sites/ gregsatell/ 2014/ 01/ 03/ why- most- marketers- will- fail- in- the- era- of- big- data/ and www.digitaltonto.com/ 2013/ what- is- big- data- and- what- do- we- do- with- it/ . Accessed January 2014 Khác
12. Eaton, C., Deroos, D., Deutsch, T., Lapis, G. and Zikopoulos, P. (2012).Understanding big data: ana lytics for enterprise class Hadoop and streaming data.New York: McGraw- Hill Khác
13. www.sapbigdata.com/ stories/ ebays- early- signal- detection- system- runs- machine- learning- predictive- powered- by- sap- hana/ . Accessed January 7, 2014 Khác
14. www.informationweek.com/ big- data/ big- data- analytics/ big- data- success- 3- companies- share- secrets/ d/ d- id/ 1111815?page_number=1. Accessed January 7, 2014 Khác
15. For more information, http:/ / hadoop.apache.org/ index.html. We note that IBM’s publicity focuses on the value IBM adds to the open- source Hadoop, whereas SAP focuses upon its own solution (HANA) but identi es where and how it works with Hadoop; www.sapbigdata.com/ analytics/ Khác
16. Stephens, S. S. (1951). Mathematics, measurement and psychophysics. In S. S.Stephens (ed.). Hand book of Experimental Psychology. New York: Wiley, pp. 1–49 Khác
17. Zikmund, W. G., McLeod, R. Jr., and Gilbert, F. W. (2003). Customer relationship management: inte grating marketing strategy and information technology. Hoboken, NJ: John Wiley Khác
18. http:/ / richardsbusinessblog.wordpress.com/ category/ bi/ . Accessed June 8, 2014 Khác
20. www.gartner.com/technology/reprints.do?id=1-1QLGACN&ct=140210&st=sb.Accessed June 8, 2014 Khác
21. Berry, M. J. A. and Lino , G. S. (2000). Data mining: the art and science of customer relationship management. New York: John Wiley Khác
23. Saunders, J. (1994). Cluster analysis. In G. J. Hooley and M. K. Hussey (eds.).Quantitative methods in marketing. London: Dryden Press, pp. 13–28 Khác
24. Berry, M. J. A. and Lino , G. S. (2000). Data mining: the art and science of customer relationship management. New York: John Wiley Khác
25. See, for example, Berry, M. J. A. and Lino , G. S. (2000). Data mining: the art and science of customer relationship management. New York: John Wiley; Tsiptsis, K. and Chorianooulos, A. (2009). Data mining techniques in CRM. Chichester, UK: John Wiley & Sons; Giudici, P. (2003). Applied data mining. Chichester, UK: John Wiley &Sons Khác
26. Berry, M. J. A. and Lino , G. S. (2000). Data mining: the art and science of customer relationship management. New York: John Wiley Khác
27. Berry, M. J. A. and Lino , G. S. (2000). Data mining: the art and science of customer relationship management. New York: John Wiley, p. 128 Khác
28. Sharma, Anuj and Panigrahi, Prabin (2011). A neural network based approach for predicting cus tomer churn in cellular network services. International Journal of Computer Applications, 27(11), 26–31 Khác
29. Tsiptsis, K. and Chorianooulos, A. (2009). Data mining techniques in CRM.Chichester, UK: John Wiley & Sons Khác
30. http:/ / thejuicepress.wordpress.com/ about- marketing- research/ cluster- analysis/dendrogram/ . Accessed June 11, 2014 Khác
31. www.mathworks.com/ matlabcentral/ leexchange/ 24616- kmeans- clustering.Accessed June 6, 2014 Khác
32. See www.sas.com/ en_us/ soware/ analytics.html, www- 01.ibm.com/ soware/ au/analytics/ spss/, www.tableausoware.com/ , www.qlik.com/ , www.sap.com/ pc/analytics/ strategy.html, www.mic roso .com/ en- au/ server- cloud/ audience/ business- analytics.aspx# id=CN0jGPCbOlx. Accessed June 10, 2014 Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w