Hình thức hĩa TBL

Cĩ thể thấy ý tưởng chính của phương pháp học dựa trên sự chuyển trạng thái là học ra được một danh sách luật cĩ thứ tự. Tập luật này cĩ khả năng cải tiến dần dần trạng thái hiện tại của tập huấn luyện. Trạng thái khởi đầu dựa trên những thống kê đơn giản, sau đĩ các luật được học theo cách thức “tham lam” để sửa những lỗi sai. Các luật dần được rút ra cho đến khi khơng thể cải thiện thêm được nữa.

Một số ký hiệu : S : Khơng gian mẫu C : Tập hợp các nhãn cĩ thể cĩ của các mẫu C[s] : Nhãn của mẫu s T[s] : Nhãn đúng của s p : Vị từđược định nghĩa trên S r : luật gồm cĩ một cặp(cắp) vị từ - nhãn lớp (p,t), trong đĩ t∈C là đích của luật r R : tập hợp tất cả các luật Nếu r=(p,t) , prbiểu diễn cho thành phần p và trbiểu diễn cho thành phần t trong luật r.

Luật r=(pr,tr) áp dụng được lên mẫu s nếu như ps(s) = true và tr ≠C[ ]s

Nhưđã trình bày trong phần 1, để sử dụng phương pháp học này, cần cĩ: Bộ gán nhãn cơ sở

Các khung luật cĩ thể cĩ

Hàm lượng giá f cho việc học. Khác những thuật tốn học khác, hàm lượng giá cho TBL sẽ trực tiếp tối ưu hố hàm đánh giá. Một ví dụđiển hình của hàm lượng giá là f(r)=good(r)−bad(r)

Trong đĩ [ ] [ ]( ) ( ) {s C s T s Cr s T s} r good( )= / ≠ [ ]Λ = [ ] [ ]( ) ( ) {s C s T s Cr s T s} r bad( )= / = [ ]Λ ≠

Những luật cho giá trị hàm lượng giá âm đồng nghĩa với luật đĩ làm cho ngữ

liệu chuyển sang trạng thái sai hơn trước, và đương nhiên sẽ bị loại bỏ. Do đĩ chúng ta chỉ quan tâm đến những luật cĩ giá trị hàm lượng giá dương. Như vậy, ta cĩ thể thay đổi cách tiếp cận của thuật tốn như sau:

1. Sử dụng tập khung luật để tạo ra các luật cĩ khả năng sửa ít nhất một lỗi

good(r) > 0, bằng cách xem xét các mẫu sai (Mẫu sai s là mẫu cĩ

[ ] [ ]s T s C ≠ )

2. Tính giá trị bad(.) cho mỗi luật r thoảđiều kiện good(r) > f(b), lưu luật b cĩ

điểm cao nhất lại, và trong quá trình tính bad(r), ta tiếp tục tính cho luật khác nếu như f(r)< f(b)

Do đĩ, hệ thống sẽ học ra một danh sách luật theo kiểm “tham lam”. Khi khơng cịn luật nào cĩ thể cải thiện được trạng thái hiện hành của tập huấn luyện, hoặc khả năng cải thiện quá thấp (điểm nhỏ hơn ngưỡng đặt trước) thì ngừng quá trình học. Trong quá trình áp dụng, tập đánh giá sẽ được gán nhãn cơ sở bằng bộ

gán nhãn cơ sở. Sau đĩ, từng luật trong tập luật được áp dụng theo thứ tự lên tập

đánh giá. Khi tất cả luật đã được áp dụng, ta sẽđược trạng thái kết quả.

Hướng tiếp cận sử dụng case-frame

Thuật tốn học TBL của Eric Brill