Lý thuyết tập thụ

Một phần của tài liệu Xử lý văn bản tiếng việt theo mô hình tập thô dung sai (Trang 35 - 36)

Lý thuyết tập thụ[2][3] được đưa ra bởi Z. Pawlak vào năm 1980, đõy là một hướng tiếp cận toỏn học mới cho bài toỏn tri thức chưa hồn chỉnh – imperfect knowledge; bài toỏn này đĩ được tỡm cỏch giải quyết trong một thời gian dài bởi cỏc nhà khoa học. Gần đõy lý thuyết này đĩ trở thành một hướng nghiờn cứu quan trọng trong khoa học mỏy tớnh, đặc biệt là trong lĩnh vực trớ tuệ nhõn tạo. Cú rất nhiều hướng tiếp cận khỏc nhau cho bài toỏn “làm thế nào để hiểu và vận dụng được cỏc tri thức chưa hồn chỉnh”, một trong số những hướng thành cụng nhất phải kể đến lý thuyết tập mờ (fuzzy sets theory) được đưa ra bởi Lotfi Zadeh. Lý thuyết tập thụ (rough sets theory) hiện tại vẫn là một hướng tiếp cận khỏc cho bài toỏn kể trờn, lý thuyết này thu hỳt được sự quan tõm nghiờn cứu của rất nhiều nhà khoa học trờn tồn thế giới trong việc phỏt triển và ứng dụng nú. Lý thuyết tập thụ phủ lờn nhiều lý thuyết khỏc, tuy nhiờn ởđõy chỳng ta vẫn đề cập đến sự liờn hệ giữa chỳng; mặc dầu vậy, lý thuyết tập thụ cú thểđược xem như là một ngành độc lập của riờng nú.

Lý thuyết tập thụ cú nhiều ứng dụng to lớn, nú dường như là một nền tảng quan trọng trong trớ tuệ nhõn tạo và cỏc ngành khoa học khỏc liờn quan đến nhận thức, đặc biệt là trong lĩnh vực học mỏy (machine learning), thu nhận tri thức (knowledge acquisition) , phõn tớch quyết định (decision analysis), phỏt hiện tri thức từ cơ sở dữ liệu (knowledge discovery from databases), hệ chuyờn gia (expert

Nội dung chớnh sẽ trỡnh bày:

Mụ hỡnh toỏn học và một số khỏi niệm trong lý thuyết tập thụ.

Một số ứng dụng của lý thuyết tập thụ.

systems), lập luận dựa trờn quy nạp (inductive reasoning) và phỏt hiện mẫu (pattern recognition)…

Ưu điểm chớnh của lý thuyết tập thụ trong phõn tớch dữ liệu là nú khụng cần bất cứ thụng tin khơi mào hay thụng tin đớnh kốm nào về dữ liệu. Hướng tiếp cận tập thụ cú thểđem lại những kết quả sau:

- đề xuất cỏc giải thuật hiệu quả cho việc tỡm kiếm cỏc mẫu ẩn chứa trong dữ liệu (hidden patterns)

- đuyết định tập tối thiểu cho dữ liệu (rỳt gọn dữ liệu – data reduction) - đỏnh giỏ sự quan trọng của dữ liệu

- tạo ra cỏc tập luật quyết định (decision rules) từ dữ liệu - mụ hỡnh hỡnh thức húa dễ hiểu

- dễ dàng diễn dĩi cỏc kết quả thu nhận được - …

Cỏc phần tiếp theo sẽ trỡnh bày cỏc khớa cạnh chi tiết trong lý thuyết tập thụ.

Một phần của tài liệu Xử lý văn bản tiếng việt theo mô hình tập thô dung sai (Trang 35 - 36)