Khái niệm tập mờ trong lĩnh vực khai phá dữ liệu

Một phần của tài liệu Khai phá luật kết hợp mờ và ứng dụng trong cơ sở dữ liệu cước điện thoại (Trang 45)

Dữ liệu trong thực tế thường không chính xác và không chắc chắn. Những dữ liệu này cần phải được chuyển đổi để hoàn toàn xác định và không nhập

nhằng, nhờ đó nó có thể được xử lý với một mô hình dữ liệu quan hệ chuẩn. Ví dụ, nhiều mở rộng tới một mô hình quan hệ chuẩn đã được đề xuất để hỗ trợ dữ liệu số. Cách tiếp cận mờ đại diện cho một giải pháp mạnh mẽ để chuyển đổi dữ liệu. Thay vì xác định "giá trị null" đặc biệt hoặc các toán tử đại số quan hệ cụ thể, các tập mờ và CSDL mờ được sử dụng [4].

Tri thức được trình bày bởi các tập mờ không chỉ dễ hiểu hơn với con người mà còn thường súc tích và thiết thực hơn. Hơn nữa, khai phá luật kết hợp dựa vào tập mờ có thể xử lý dữ liệu số, không chỉ cung cấp sự hỗ trợ cần thiết để sử dụng dạng dữ liệu không chắc chắn bằng các thuật toán hiện có, mà còn tạo ra đường biên “mịn” hơn giữa các khoảng của giá trị số. Như vậy, cách tiếp cận mờ là một giải pháp tốt cho cả dữ liệu chính xác và không chính xác [37].

Việc sử dụng logic mờ trong mô hình quan hệ cung cấp một cách hiệu quả để xử lý dữ liệu số với các thông tin không chính xác, không chắc chắn hoặc không đầy đủ. Lý thuyết tập mờ ngày càng được sử dụng nhiều và thường xuyên hơn trong các hệ thống thông minh bởi vì mối quan hệ của nó với cách lập luận của con người và sự đơn giản của các khái niệm [36]. Một số nghiên cứu đã chứng minh được hiệu suất vượt trội của logic mờ trong KPDL và kho dữ liệu [36].

Một phần của tài liệu Khai phá luật kết hợp mờ và ứng dụng trong cơ sở dữ liệu cước điện thoại (Trang 45)