Mẫu phụ thuộc

Một phần của tài liệu nhận dạng thực thể định danh từ văn bản ngắn tiếng việt và đánh giá thực nghiệm (Trang 30 - 31)

Chúng ta khởi tạo các mối quan hệ phụ thuộc sử dụng các bước dưới đây:

1. Với mỗi quan hệ phụ thuộc, thay từ hiện tại (governor word hoặc từ phụ thuộc) và từ loại của nĩ bằng một ký tự đại diện khi chúng ta đã cĩ thuộc tính từ (W) và từ loại (P) như thuộc tính Label-dimension đã trình bày ở phần trước.

2. Thay thế từ ngữ cảnh (context word) – từ khác với từ thứ t trong mỗi mối quan hệ phụ thuộc bằng một nhãn tri thức để tạo thành một mẫu quan hệ tổng quát. Ta cĩ tập các khía cạnh được chú thích trong dữ liệu huẩn luyện là , nếu từ ngữ cảnh xuất hiện trong , chúng ta sẽ thay nĩ bằng một nhãn “A” (aspect) và “O” (other) cho trường hợp ngược lại.

Ví dụ: Chúng ta đang làm việc với câu sau:

“Chất lượng camera của Samsung ngày càng tuyệt vời”

Giả sử “Samsung” đã được trích xuất trong các lần học trước đĩ và lưu vào . Ta cĩ mẫu phụ thuộc tổng quát của camera như sau:

Thay thế từ hiện Thay thế từ ngữ cảnh bằng nhãn Quan hệ phụ thuộc tại bằng một ký tự "A" hoặc "O" phụ

đại diện "*" thuộc vào Kt

Sau đây, luận văn sẽ trình bày thêm về vấn đề tại sao mẫu phụ thuộc lại cĩ thể làm tăng tính chính xác của mơ hình CRFs bằng việc sử dụng các kiến thức trong quá khứ. Điều then chốt ở đây là nhãn tri thức “A” được dùng để đánh dấu một thực thể là tiềm năng. Quay lại bài tốn trích xuất thực thể định danh từ 1 miền mới sử dụng mơ hình M đã được huấn luyện trước đĩ, chúng ta đã thực hiện nhận dạng thực thể từ nhiều miền trước và lưu lại tập các thực thể trích xuất được . Sau đĩ chúng ta cĩ thể khai thác các thực thể tin cậy và thêm chúng vào , cho phép cĩ nhiều nhãn kiến thức cho các mẫu phụ thuộc của dữ liệu mới do cĩ sự chia sẻ các thực thể

giữa các miền. Điều này làm phong phú thêm các thuộc tính mẫu phụ thuộc, cho phép trích xuất được nhiều thực thể hơn từ miền .

Một phần của tài liệu nhận dạng thực thể định danh từ văn bản ngắn tiếng việt và đánh giá thực nghiệm (Trang 30 - 31)