II. Khai phá dữ liệu
7. Hình ứng dụng khai phá dữ liệu
Mặc dù còn rất nhiều vấn đề mà khai phá dữ liệuquyết nhưng tiềm năng của nó đã được khẳng định bằng sự ra đời của nhiều ứng dụng.
Khai phá dữ liệu được ứng dụng rất thành công trong “cơ sở dữ liệu thị trường” (database marketing), đây là một phương pháp phân tích cơ sở dữ liệu khách hàng, tìm kiếm các mẫu trong số các khách hàng và sử dụng các mẫu này để lựa chọn các khách hàng trong tương lai. Tạp chí Business Week của Mỹ đã đánh giá hơn 50% các nhà bán lẻ đang và có ý định sử dụng “cơ sở dữ liệu thị trường” cho hoạt động kinh doanh của họ (Berry 1994). Kết quả ứng dụng cho thấy số lượng thẻ tín dụng American Express bán ra đã tăng 15% - 20% (Berry 1994). Các ứng dụng khác của khai phá dữ liệu trong kinh doanh như phân tích chứng khoán và các văn kiện tài chính; phân tích và báo cáo những thay đổi trong dữ liệu, bao gồm Coverstory của IRI (Schmitz, Armstrong, & Little 1990), Spotlight của A.C Nielsen (nand & Kahn 1992) đối với các dữ liệu bán hàng trong siêu thị, KEFIR của GTE cho cơ sở dữ liệu y tế (Matheus, Piatetsky-Shapiro, & McNeil); phát hiện và phòng chống gian lận cũng thường là bài toán của khai phá dữ liệu và phát hiện tri thức. Ví dụ như hệ thống phát hiện gian lận trong dịch vụ y tế đã được Major và Riedinger phát triển tại Travelers insurance năm 1992. Internal Revenue Service đã phát triển một hệ thống chọn thuế thu để kiểm toán. Nestor FDS (Blanchard 1994) được phát triển dựa trên mạng neuron để phát hiện ra gian lận trong thẻ tín dụng. Các ứng dụng của khai phá dữ liệu trong khoa học cũng được phát triển. Ta có thể đưa ra một
•
Thiên văn h ọ c : Hệ thống SKICAT do JPL/Caltech phát triển được sử dụng cho các nhà thiên văn để tự động xác định các vì sao và các dải thiên hà trong một bản khảo sát lớn để có thể phân tích và phân loại (Fayyad, Djorgovski, & Weir).
Phân t ử sinh h ọ c: Hệ thống tìm kiếm các mẫu trong cấu trúc phân tử (Conklin, Fortier, và Glasgow 1993) và trong các dữ liệu gen (Holder, Cook, và Djoko 1994).
•
Mô hình hóa nh ữ ng thay đ ổ i th ờ i ti ế t : các mẫu không thời gian như lốc, gió xoáy được tự động tìm thấy trong các tập lớn dữ liệu mô phỏng và quan sát được (Stolorz et al. 1994).__
Phôt HẢO HẢO
ĐỐI DIỆN TRƯỜNG ĐH THỦ DẦU MỘT. CHỈNH SỮA VĂN BẢN, IN MÀU...