Giới thiệu công cụ Thebeast

Một phần của tài liệu Học cấu trúc mạng logic markov và ứng dụng trong bài toán phân lớp (Trang 47)

“Markov Thebeast” là một công cụ phần mềm phiên bản 0.0.2 đƣợc đƣa ra bởi Sebastian Riedel – June 14, 2008. Nó là một phần mềm học quan hệ thống kê trên logic Markov. Nó cho phép chúng ta thực hiện học quan hệ và dự đoán cấu trúc các vấn đề nhƣ thực thể, dự đoán liên kết, phân tích cú pháp phụ thuộc, nhãn ngữ nghĩa, nén câu, vv bằng định nghĩa một mô hình đơn giản và cung cấp dữ liệu huấn luyện cho nó. Học tập và suy diễn đều đƣợc xử lý bởi Thebeast. Thebeast sử dụng logic Markov nhƣ là ngôn ngữ để mô tả mạng Markov phức tạp. So với công cụ khác, thebeast sử dụng một kỹ thuật suy diễn MAP.

Các tính năng

 Suy diễn MAP nhanh và chính xác bằng cách sử dụng Cutting Planes kết hợp với Integer Linear Programming (hoặc Max-Walk-Sat).

 Đào tạo phân loại trực tuyến bằng cách sử dụng MIRA

 Các trọng số của tham số: sử dụng một công thức để mô tả hàng triệu các tính năng với các trọng số riêng lẻ

 Shell: Sử dụng một hàm thông dịch để chỉnh sửa và kiểm tra mô hình. Cho phép phân tích các lỗi, kiểm tra tính năng các trọng số và điểm số.

 Hạn chế các yếu tố trong tập hợp: lập báo cáo về một số điều kiện nhất định thƣờng xuyên nhƣ thế nào nên giữ trong một giải pháp.

Ta sử dụng một trong các tính năng của Thebeast trên ứng dụng trong bài toán gán nhãn vai nghĩa. Để mô tả việc thực hiện công việc trong Thebeast thƣờng có ba file cơ bản là: toy.pml, train.pml, test.pml. Toy.pml giúp chúng ta có một cái nhìn tổng quan bao quát nhất, nó phản ánh một quy trình làm việc bình thƣờng của học máy. Thông thƣờng chúng ta sẽ đào tạo một mô hình và sau đó chạy thử nghiệm với mô hình tƣơng tự trên một số bộ dữ liệu. Tuy nhiên, với toy.pml chúng ta cần phải

48

đào tạo lại mọi lúc khi chúng ta muốn thử nghiệm trên một mô hình với bộ dữ liệu thử nghiệm mới.

Một phần của tài liệu Học cấu trúc mạng logic markov và ứng dụng trong bài toán phân lớp (Trang 47)