III 2.2.3 Biểu diễn văn bản HyperText theo mụ hỡnh quan hệ
3.3.3. Phõn lớp dựa vào cõy quyết định
Học cõy quyết định là phươgn phỏp được sử dụng rộng rĩi cho việc học quy nạp từ một mẫu lớn. Đõy là phương phỏp xấp xỉ hàm mục tiờu cú giỏ trị rời rạc. Mặt khỏc, cõy quyết định cũn cú thể chuyển sang dạng biểu diễn tương đương dưới dạng tri thức là cỏc luật If-then. Trong cỏc thuật toỏn học cõy quyết định thỡ ID3 và C4.5 là hai thuậta toỏn nổi tiếng nhất. Sau đõy là nội dung thuật toỏn ID3.
ID3 (Example, Target attributes, Attributes) 1.Tạo một nỳt gốc Root cho cõy quyết định
2. Nếu tồn bộ Examples đều là cỏc vớ dụ dương, tả lại cõy Root một nỳt đơn, với nhĩn +.
3. Nếu tồn bộ Examples đều là cỏc vớ dụ õm, trả lại cõy Root một nỳt đơn, với nhĩn -.
4. Nếu Attributes là rỗng thỡ trả lại cõy Root một nỳt đơn với gàn nhĩn bằng giỏ trị phổ biến nhất của Target_attribute trong Example.
5. Ngược lại Begin
5.1. A<= thuộc tớnh từ tập Attribute mà phõn loại tốt nhất tập Examples
5.2. Thuộc tớnh quyết định cho Root<=A 5.3. For mỗi giỏ trị cú thể cú vi của A
5.3.1. Cộng thờm một nhỏnh cõy con ở dưới Root, phự hợp với biểu thức kiểm tra A=vi.
5.3.2. Đặt Examplesvi là một tập con của tập cỏc vớ dụ cú giỏ trị vi cho A
5.3.3. Nếu Examplesvi rỗng
-Dưới mỗi nhỏnh mới thờm một nỳt lỏ với nhẵn bằng giỏ trị phổ biến nhất của Target_attribute trong tập Examples
-Ngược lại thỡ dưới nhỏnh mới này thờm một cõy con ID3(Examples, target_attribute, Attribute-{A}).
End
Thuộc tớnh tốt nhất là thuộc tớnh cú độ lấy thụng tin lớn nhất.
Phương phỏp học mỏy dựng cõy quyết định và dựa trờn cõy quyết định là rất hiệu quả bởi vỡ nú cú thể làm việc được với một số lượng lớn cỏc thuộc tớnh, và hơn nữa từ cõy quyết định cú thể rỳt ra được một hệ thống luật học được