Chúng ta khởi tạo các mối quan hệ phụ thuộc sử dụng các bước dưới đây:
1. Với mỗi quan hệ phụ thuộc, thay từ hiện tại (governor word hoặc từ phụ thuộc) và từ loại của nĩ bằng một ký tự đại diện khi chúng ta đã cĩ thuộc tính từ (W) và từ loại (P) như thuộc tính Label-dimension đã trình bày ở phần trước.
2. Thay thế từ ngữ cảnh (context word) – từ khác với từ thứ t trong mỗi mối quan hệ phụ thuộc bằng một nhãn tri thức để tạo thành một mẫu quan hệ tổng quát. Ta cĩ tập các khía cạnh được chú thích trong dữ liệu huẩn luyện là , nếu từ ngữ cảnh xuất hiện trong , chúng ta sẽ thay nĩ bằng một nhãn “A” (aspect) và “O” (other) cho trường hợp ngược lại.
Ví dụ: Chúng ta đang làm việc với câu sau:
“Chất lượng camera của Samsung ngày càng tuyệt vời”
Giả sử“Samsung” đã được trích xuất trong các lần học trước đĩ và lưu vào . Ta cĩ mẫu phụ thuộc tổng quát của camera như sau:
(nmod,camera,NN,Samsung,NN) (nmod,*,Samsung,NN) (nmod,*,A,NN) Quan hệ phụ thuộc tại bằng một ký tự Thay thế từ hiện
đại diện "*"
Thay thế từ ngữ cảnh bằng nhãn "A" hoặc "O" phụ
Sau đây, luận văn sẽ trình bày thêm về vấn đề tại sao mẫu phụ thuộc lại cĩ thể làm tăng tính chính xác của mơ hình CRFs bằng việc sử dụng các kiến thức trong quá khứ. Điều then chốt ở đây là nhãn tri thức “A” được dùng để đánh dấu một thực thể là tiềm năng. Quay lại bài tốn trích xuất thực thể định danh từ 1 miền mới sử dụng mơ hình M đã được huấn luyện trước đĩ, chúng ta đã thực hiện nhận dạng thực thể từ nhiều miền trước và lưu lại tập các thực thể trích xuất được . Sau đĩ chúng ta cĩ thể khai thác các thực thể tin cậy và thêm chúng vào , cho phép cĩ nhiều nhãn kiến thức cho các mẫu phụ thuộc của dữ liệu mới do cĩ sự chia sẻ các thực thể giữa các miền. Điều này làm phong phú thêm các thuộc tính mẫu phụ thuộc, cho phép trích xuất được nhiều thực thểhơn từ miền .