Tình hình ứng dụng khai phá dữ liệu

Một phần của tài liệu KHAI PHÁ DỮ LIỆU VÀ KỸ THUẬT PHÂN LỚP DỮ LIỆU (Trang 27)

Mặc dù còn rất nhiều vấn đề mà khai phá dữ liệu cần phải tiếp tục nghiên cứu để giải quyết nhưng tiềm năng của nó đã được khẳng định bằng sự ra đời của rất nhiều ứng dụng.

Khai phá dữ liệu được ứng dụng rất thành công trong “cơ sở dữ liệu thị trường” (database marketing), đây là một phương pháp phân tích cơ sở dữ liệu khách hàng, tìm kiếm các mẫu trong số các khách hàng và sử dụng các mẫu này để lựa chọn các khách hàng trong tương lai. Các ứng dụng khác của khai phá dữ liệu trong kinh doanh như phân tích chứng khoán và các văn kiện tài chính; phân tích và báo cáo những thay đổi trong dữ liệu, bao gồm Coverstory của IRI (Schmitz, Armstrong, & Little 1990), Spotlight của A.C Nielsen (nand & Kahn 1992) đối với các dữ liệu bán hàng trong siêu thị, KEFIR của GTE cho cơ sở dữ liệu y tế (Matheus, Piatetsky- Shapiro, & McNeil); phát hiện và phòng chống gian lận cũng thường là bài toán của khai phá dữ liệu và phát hiện tri thức. Ví dụ như hệ thống phát hiện gian lận trong dịch vụ y tế đã được Major và Riedinger phát triển tại Travelers insurance năm 1992. Internal Revenue Service đã phát triển một hệ thống chọn thuế thu để kiểm toán. Nestor FDS (Blanchard 1994) được phát triển dựa trên mạng neuron để phát hiện ra gian lận trong thẻ tín dụng.

Các ứng dụng của khai phá dữ liệu trong khoa học cũng được phát triển. Ta có thể đưa ra một số ứng dụng trong khoa học như:

+ Thiên văn học: Hệ thống SKICAT do JPL/Caltech phát triển được sử dụng cho các nhà thiên văn để tự động xác định các vì sao và các dải thiên hà trong một bản khảo sát lớn để có thể phân tích và phân loại (Fayyad, Djorgovski, & Weir).

+ Phân tử sinh học: Hệ thống tìm kiếm các mẫu trong cấu trúc phân tử (Conklin, Fortier, và Glasgow 1993) và trong các dữ liệu gen (Holder, Cook, và Djoko 1994).

+ Mô hình hóa những thay đổi thời tiết: các mẫu không thời gian như lốc, gió xoáy được tự động tìm thấy trong các tập lớn dữ liệu mô phỏng và quan sát được (Stolorz et al. 1994).

Một phần của tài liệu KHAI PHÁ DỮ LIỆU VÀ KỸ THUẬT PHÂN LỚP DỮ LIỆU (Trang 27)

Tải bản đầy đủ (DOC)

(76 trang)
w