a. Kiểm tra phân tách (A/B Testing)
Kiểm tra phân tách (A/B testing hay split testing) là một kỹ thuật trong đó một nhóm đối chứng được so sánh với nhiều nhóm thử nghiệm khác nhau để xác định phương án tác động nào sẽ cải thiện một biến khách quan nhất định, ví dụ tỷ lệ phản hồi của khách hàng. Một ứng dụng ví dụ là xác định văn bản, bố cục, hình ảnh hoặc màu sắc nào sẽ làm tăng tỷ lệ chuyển đổi trên một website thương mại điện tử (tỷ lệ chuyển đổi là tỷ lệ mà khách hàng thực hiện một hành động mong muốn nào đó).
Big Data cho phép thực hiện và phân tích số lượng lớn các bài kiểm tra, đảm bảo rằng các nhóm có đủ kích cỡ để phát hiện sự khác biệt có ý nghĩa (có ý nghĩa
thao tác đồng thời trong quá trình xử lý và áp dụng mô hình thống kê, sự tổng quát đa chiều của kỹ thuật gọi là thử nghiệm “A/B/N”.
b. Luật kết hợp (Association Rule)
Luật kết hợp là một tập hợp các kỹ thuật để phát hiện các mối quan hệ (quy tắc kết hợp) giữa các biến trong các cơ sở dữ liệu lớn. Các kỹ thuật này bao gồm nhiều thuật toán để tạo ra và kiểm tra các quy tắc có thể xảy ra.
Ví dụ một ứng dụng là phân tích giỏ hàng, trong đó một nhà bán lẻ có thể xác định sản phẩm nào thường xuyên được mua lại, các sản phẩm nào thường được mua cùng với nhau và sử dụng thông tin này để tiếp thị.
c. Phân nhóm (Cluster Analysis)
Kỹ thuật phân nhóm (phân cụm) là một phương pháp thống kê nhằm phân loại các đối tượng trong một nhóm đa dạng thành các nhóm nhỏ có đặc điểm tương đồng dựa vào một vài tiêu chí đã được xác định trước. Ứng dụng điển hình của kỹ thuật phân nhóm là phân chia người tiêu dùng thành các nhóm nhỏ khách hàng mục tiêu, tìm hiểu hành vi khách hàng, nhận dạng các cơ hội cho sản phẩm mới hay lựa chọn phân khúc để thử nghiệm các chiến lược khác nhau.
d. Khai phá chuỗi (Sequential/Temporal Patterns)
Khai phá chuỗi thời gian là kỹ thuật tương tự như khai phá luật kết hợp nhưng có thêm tính thứ tự và tính thời gian. Hướng tiếp cận này được ứng dụng nhiều trong lĩnh vực tài chính và thị trường chứng khoán vì có tính dự báo cao.
e. Khai thác tài nguyên đám đông (Crowdsourcing)
Khai thác tài nguyên đám đông là kĩ thuật dùng để thu thập thông tin từ một nhóm lớn người hoặc một cộng đồng thông qua các cuộc điều tra (phỏng vấn) mở, thường sử dụng giao thức web. Ứng dụng kỹ thuật này kết hợp với truyền thông xã hội (social media) đang trở thành một xu hướng mới trong việc thu thập và xử lý các dữ liệu kinh tế vĩ mô, góp phần thúc đẩy tiến trình minh bạch hóa và tự do hóa thông tin - nguồn nguyên liệu đầu vào cho cỗ máy kinh tế dựa trên nền tảng thị trường.
f. Khai phá dữ liệu (Data Mining)
Khai phá dữ liệu là một tập hợp các kỹ thuật để trích xuất các mẫu từ các bộ dữ liệu lớn bằng cách kết hợp các phương pháp từ thống kê tới học máy (machine learning: là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống có thể học tự động từ dữ liệu để giải quyết những vấn đề cụ thể) với quản lý cơ sở dữ liệu. Khai phá dữ liệu đưa ra nhiều ứng dụng hiệu quả, bao gồm khai phá dữ liệu khách hàng để xác định các phân đoạn thị trường có nhiều khả năng phản ứng một hành động marketing, khai phá dữ liệu nguồn nhân lực để xác định đặc điểm của những nhân viên thành công nhất hoặc phân tích giỏ hàng để mô hình hóa hành vi mua hàng của khách hàng.
g. Xử lý ngôn ngữ tự nhiên (Natural Language Processing)
Xử lý ngôn ngữ tự nhiên là một tập hợp các kỹ thuật sử dụng các thuật toán máy tính để phân tích ngôn ngữ tự nhiên của con người. Trong các lĩnh vực của trí tuệ nhân tạo thì xử lý ngôn ngữ là một phần mang tính phức tạp cao do liên quan đến ý nghĩa của ngôn ngữ - công cụ hoàn hảo nhất của giao tiếp và tư duy. Một ứng dụng của xử lý ngôn ngữ tự nhiên là phân tích tình cảm trên phương tiện truyền thông xã hội để xác định xem khách hàng đang phản ứng như thế nào với các chiến dịch xây dựng thương hiệu.
h. Mạng Nơ-ron (Neural Networks)
Mạng Nơ-ron là một mô hình tính toán, xử lý thông tin được xây dựng mô phỏng dựa trên cấu trúc và hoạt động của hệ thống thần kinh sinh học (tức là các tế bào và các kết nối bên trong bộ não), bao gồm số lượng lớn các tế bào nơ-ron được gắn kết để xử lý thông tin. Mạng Nơ-ron giống như bộ não con người, được hoàn thiện thông qua thông qua huấn luyện, có khả năng lưu giữ những tri thức và sử dụng những tri thức đó trong việc dự đoán các dữ liệu chưa biết.
Mạng Nơ-ron rất phù hợp để tìm các mô hình phi tuyến. Kỹ thuật này có thể được sử dụng để nhận biết và tối ưu hóa mẫu. Ví dụ về ứng dụng của mạng Nơ-ron như xác định khách hàng có nguy cơ tử bỏ sử dụng sản phẩm của doanh nghiệp
i. Phân tích cảm xúc (Sentiment Analytics)
Phân tích cảm xúc là ứng dụng xử lý ngôn ngữ tự nhiên và các kỹ thuật phân tích khác để xác định và trích xuất các thông tin chủ quan từ nguồn dữ liệu, nói một cách khác là lắng nghe và thấu hiểu những gì các phương tiện truyền thông xã hội đang nói về nhãn hiệu, sản phẩm, thương hiệu của doanh nghiệp, tích cực hay hiêu cực, tích cực về mặt nào và tiêu cực về mặt nào.
Những vấn đề chính của phân tích cảm xúc bao gồm xác định tính năng, khía cạnh hoặc sản phẩm mà trong đó diễn ra tình cảm và xác định loại cảm xúc (tích cực, tiêu cực hoặc trung lập), mức độ và sức mạnh của tình cảm. Ví dụ về ứng dụng như doanh nghiệp áp dụng phương pháp phân tích tình cảm đối với các phương tiện truyền thông xã hội (blog, mạng xã hội…) để xác định các phân đoạn khách hàng và các bên liên quan khác nhau phản ứng như thế nào với sản phẩm của doanh nghiệp, qua đó doanh nghiệp có được cái nhìn tổng quan về thái độ của khách hàng đối với sản phẩm của mình tại một thời điểm nhất định.