Thể hiện bằng khung

Một phần của tài liệu Hỗ trợ hệ chuyên gia cho khai phá luật kết hợp (Trang 26)

Một khung cho biết thông tin đa dạng về đối tượng, người ta có thể dùng khung đế thể hiện những nét điến hình của các đối tượng. Khung bao gồm các thành phần:

Tên khung cChuỗi tên khung> Thuộc tính 1 <Giá trị 1>

Thuộc tính 2 <Giá trị 2>

Thuộc tính n <Giá trị n>

1.2.3.2 Thể hiện các sự kiện không chắc chắn

Phương pháp truyền thống trong hệ chuyên gia khi quản lí thông tin không chắc chắn là sử dụng nhân tố chắc chắn. Nhân tố chắc chắn, kí hiệu là CF (Certainty factor), là giá trị bằng số gán cho mệnh đề thể hiện mức độ tin cậy vào mệnh đề đó.

1.2.3.3 Thể hiện các sự kiện mò’

Logic mờ dùng các luật mờ để tạo ra tập mờ. Một luật mờ có các tập mờ trong cả phần IF và THEN.

1.2.3.4 Thể hiên tri thức nhờ các luật

Định nghĩa luật (rule): Luật là cấu trúc tri thức dùngđế liên kết thông tin đã biết

với các thông tin khác giúp đưara các suy luận, kết luận tù’ những thông tin đã biết.

Tri thức dưới dạng luật được xếp vào loại tri thức thủ tục. Luật gắn thông tin đã cho với một vài hoạt động. Các hoạt động này có thể là khẳng định về thông tin mới hay là thủ tục sẽ được thực hiện. Bằng cách này luật sẽ IĨ1Ô tả cách giải vấn đề.

Việc xử lí các luật trong hệ thống dựa trên luật được quản lí bằng mođun gọi là bộ suy diễn.

1.2.3.5 Khai thác một thủ tục

Đe thực hiện các thao tác phức tạp hơn, nhiều hệ chuyên gia truy nhập các thủ tục bên ngoài hệ thống. Chúng có thế được viết bằng các ngôn ngữ lập trình hay các lệnh trên bảng tính.

1.2.3.6 Các dạng khác nhau của luật

Các luật thể hiện tri thức có thể được phân loại theo loại tri thức: tri thức quan hệ, tri thức khuyến cáo, tri thức hướng dẫn,...

Các luật cũng có thể được phân loại theo bản chất của chiến lược giải quyết vấn đề, thường được gọi là cách thức giải quyết vấn đề. Các luật điển hình theo phân loại là các luật theo cách thức diễn giải, cách thức chuẩn đoán, hay cách thức thiết kế.

Dùng biến trong luật: Sử dụng biến trong các luật phù hợp với các ứng

dụng thực hiện cùng một số thao tác trên tập các đối tượng tương tự nhau. Thông thường với mỗi phát biểu về tri thức liến quan đến nhiều sự kiện, người ta dùng nhiều luật. Neu viết một luật đơn cho mỗi đối tượng thì số lượng các luật rất nhiều, như yậy không hiệu quả và hệ thống khó quản lý các luật tương tự nhau. Việc khớp luật có sử dụng biến cho phép xử lí thông tin một cách hiệu quả. Người ta có thế viết một luật thay cho nhiều luật,

thuận lợi cho việc mã hóa và bảo trì cơ sở luật.

Các luật không chẳc chan: Mệnh đề phát biểu về các sự kiện, hay bản thân

sự kiện có thế không chắc chắn. Người ta đã dùng hệ số chắc chắn CF đối với các sự kiện không chắc chắn. Đã có sự kiện không chắc chắn thì cũng có kết luận cũng không chắc chắn. Luật này thiết lập quan hệ không chính xác giữa giả thiết và kết luận.

Các luật meta (luật mô tả cách thức các luật khác)’. Khi giải vấn đề, các

chuyên gia cũng cần cả tri thức lĩnh vực lẫn tri thức hướng dẫn sử dụng các tri thức lĩnh vực. Tri thức lĩnh vực đặc trưng cho lĩnh vực tri thức hướng dẫn đặc trưng cho việc sử dụng tri thức. Tri thức hướng dẫn dùng tri thức lĩnh vực để xác định cách giải quyết vấn đề tốt nhất. Loại tri thức này được gọi là tri thức meta (tri thức về cách sử dụng và điều khiến tri thức lĩnh vực).

1.3 KỂT LUẬN CHƯƠNG

Trong hệ thống xử lý thông tin, dữ liệu tăng lên không ngừng, đòi hỏi phải có kỹ thuật lưu trữ và khai thác thông tin một cách có hiệu quả. Từ đó có thế khai phá ra các tri thức phục vụ cho hoạt động sản xuất, kinh doanh và hỗ trợ ra quyết định. Giải pháp cho tất cả các vấn đề nêu trên chính là kỹ thuật khai phá dữ liệu (KDD- Knowledge Discovery and Data Mining) có sự hỗ trợ của hệ chuyên gia.

Hỗ trợ hệ chuyên gia trong khai phá dữ liệu cho phép khai thác được những thông tin mới mà các cơ sở dữ liệu tác nghiệp thông thường không thể có được. Từ đó thế hiện độ chắc chắn trong sự kiện và luật khai phá luật kết hợp: sử dụng công cụ truy vấn, xây dựng cây quyết định, dựa theo khoảng cách (K-láng giềng gần), giá trị trung bình, phát hiện luật kết hợp, ...

CHƯƠNG 2 HỎ TRỢ HỆ CHUYÊN GIA TRONG KHAI LUẬT KÉT HỢP

2.1 PHƯƠNG PHÁP TÌM LUẬT KÉT HỢP TRONG KHAI PHÁ DŨ LIỆU

2.1.1 Vài nét về khai phá luật kết hợp (adsbygoogle = window.adsbygoogle || []).push({});

mà trong đó sự xuất hiện của tập các thuộc tính s nào đó trong các bản ghi (records) của D sẽ kéo theo sự xuất hiện của một tập những thuộc tính khác u cũng trong những bản ghi đó. Mỗi luật kết hợp được đặc trưng bởi một cặp tỉ lệ hỗ trợ (support ration). Mỗi tỉ lệ hỗ trợ được biếu diễn bằng tỉ lệ % những bản ghi trong D chứa cả

s và u.

Vấn đề khám phá luật kết hợp được phát biểu như sau:

Cho trước tỉ lệ hỗ trợ (support ration) 9 và độ tin cậy (confidence) p Đánh số tất cả các luật trong D có các giá trị tỉ lệ hỗ trợ và tin cậy lớn hơn 0 và |3 tương ứng.

Vấn đề phát hiện luật kết hợp được thực hiện như sau:

Liệt kê (đếm) tất cả những qui luật chỉ ra sự xuất hiện một số các mục sẽ kéo theo một số mục khác.

Chỉ xét những qui luật mà tỉ lệ hỗ và tin cậy lớn hơn 9 và p tương ứng.

2.1.2 Luật kết hợp

2.1.2.1 Mô hình hình thức

Kí hiệu I = {II, 12, Im} là tập m khoản mục (item), một giao dịch (transaction) T được định nghĩa như một tập con (subset) của các khoản mục trong I (T ç; I). Có thể coi chúng đã được sắp xếp theo thứ tự từ điển của các mục.

Gọi D là cơ sở dữ liệu của n giao dịch và mỗi giao dịch được đánh nhãn với một định danh duy nhất (Unique Transasction Identifier). Nói rằng, một giao dịch T G D hỗ trợ (support) cho một tập Xçl nếu nó chứa tất cả các item của X, nghã là XÇT, trong một số trường hợp người ta dùng ký hiệu T(X) để chỉ tập các giao dịch hỗ trợ cho X. Kí hiệu support(X) (hoặc sup(X), s(X)) là tỷ lệ phần trăm của các giao dịch hỗ trợ X trên tổng các giao dịch trong D, nghĩa là:

I DI

Độ hỗ trợ tối thiểu (minimum support) minsup là một giá trị cho trước bởi người sử dụng. Neu tập mục X có sup(X) > minsup thì ta nói X là một tập các mục phổ biến (hoặc large itemset). Một tập phổ biến được sử dụng như một tập đáng quan tâm trong các thuật toán, ngược lại, những tập không phải tập phổ biến là những tập không đáng quan tâm. Trong các trình bày sau này, ta sẽ sử dụng những cụm từ khác như “X có độ hỗ trợ tối thiểu”, hay “X không có độ hỗ trợ tối thiểu” cũng để nói lên rang X thỏa mãn hay không thỏa mãn support(X) > minsup.

Một phần của tài liệu Hỗ trợ hệ chuyên gia cho khai phá luật kết hợp (Trang 26)