Kỹ thuật hiển thị dữ liệu

Một phần của tài liệu tìm hiểu tổng quan về khai phá dữ liệu (Trang 44)

Kỹ thuật hiển thị dữ liệu là một phương pháp rất hữu hiệu trong việc phát hiện các mẫu trong tập dữ liệu và có thể dùng khi bắt đầu tiến trình khai phá dữ liệu để có thể cảm nhận được giá trị của tập dữ liệu và các mẫu sẽ được tìm thấy ở đâu. Những khả năng này được cung cấp bằng các công cụ hiển thị hướng đối tượng 3 chiều cho phép người sử dụng khai phá các cấu trúc tương tác 3 chiều.

Hiện nay, kỹ thuật đang được phát triển bằng kỹ thuật đồ họa cao cấp trong thực tế ảo, cho phép người quan sát không gian dữ liệu nhân tạo, cùng lúc biến đổi tập dữ liệu. Tuy nhiên đối với hầu hết người sử dụng kỹ thuật này không thể truy xuất mà phải nhờ vào các kỹ thuật đồ họa đơn giản có trong đó những công cụ truy vấn tin hoặc những công cụ data mining. Phương pháp đơn giản này có thể cung cấp một lượng thông tin có giá trị. Một kỹ thuật cơ bản và có giá trị cao là lược đồ phân tán: trong kỹ thuật này thông tin trên hai thuộc tính được hiển thị trong không gian Descartes. Các lược đồ phân tán có thể được sử dụng để nhận dạng tập con dữ liệu đáng quan tâm, vì thế chúng ta chỉ còn tập trung vào phần còn lại của quá trình data mining.

Hình 3.6: Đồ thị dựa vào hai độ đo

Trong ví dụ hình trên, chúng ta đã tạo đồ thị dựa vào hai độ đo: thu nhập và tuổi. Ta thấy rằng những người tuổi trung bình có thu nhập thấp sẽ có khuynh hướng đọc các tạp chí âm nhạc. Một phương pháp khám phá tập dữ liệu tốt hơn rất nhiều là thông qua môi trường tương tác 3 chiều và hình 3.7 minh họa khả năng này.

Hình 3.7: Đồ thị tương tác 3 chiều

Một phần của tài liệu tìm hiểu tổng quan về khai phá dữ liệu (Trang 44)