Định nghĩa CRF

Một phần của tài liệu Tìm hiểu mô hình crf và ứng dụng trong trích chọn thông tin trong tiếng việt (Trang 26 - 28)

Trước khi xem định nghĩa trường ngẫu nhiên điều kiện ta xem định nghĩa thế nào là một trường ngẫu nhiên [9]

Cho một đồ thị vô hướng không có chu trình G(V,E), ở đây V là tập các đỉnh của đồ thị và E là tập các cạnh vô hướng nối các đỉnh của đồ thị nếu thỏa mãn:

đ , ) ( |đ , )

|

(vi vj vi vj P vi vk vk vi

P ≠ = ≈ thì V gọi là trường ngẫu nhiên (2.5)

Y 5 Y 1 Y 4 Y 3 Y 2 Y

Hình 9. Một trường ngẫu nhiên

P(Y5| | Yi)=P(Y5|Y4,Y6) . Vậy Y={Y5, Y4,Y6} là trường ngẫu nhiên.

Tiếp đến chúng ta định nghĩa trường ngẫu nhiên có điều kiện như sau: X là biến ngẫu nhiên nhận giá trị là chuỗi dữ liệu cần phải gán nhãn.Y là biến ngẫu nhiên nhận giá trị là chuỗi nhãn tương ứng. Mỗi thành phần Yi của Y là một biến ngẫu nhiên nhận giá trị trong tập hữu hạn các trạng thái S. Các đỉnh V biểu diễn các thành phần của biến ngẫu nhiên Y sao cho tồn tại ánh xạ một – một giữa các đỉnh và một thành phần Yv của Y. Ta nói:

CRF được định nghĩa: (Y | X) là một trường ngẫu nhiên điều kiện (Conditional Random Field) với điều kiện X khi ta chỉ tính được xác xuất có điệu kiện P(Yi | Xi) với Yi

YXiX và với mỗi Xi ta chọn được argmaxYiP(Yi | Xi).

Trong bài toán dữ liệu dạng chuỗi, G có thể được biểu diễn như sau: G = ( V={1,2,3,…m}, E={i,i+1}i=1…m-1).

Kí hiệu X=(X1, X2…Xn), Y=(Y1, Y2,…Yn). Ta có mô hình đồ thị vô hướng của CRF có dạng sau:

Hình 10. Đồ thị vô hướng mô tả cho CRF

Gọi C là tập hợp tất cả các đồ thị con đầy đủ của đồ thị G (đồ thị biểu diễn cấu trúc của một CRF). Theo kết quả của Hammerly-Clifford cho các trường Markov, ta thừa số hóa được p(y | x) – xác suất của chuỗi nhãn với điều kiện biết chuỗi dữ liệu quan sát – thành tích các hàm tiềm năng:

P(y|x)=∏ ∈C A

A(A| x)

ψ (2.6)

Có thể mô phỏng như hình sau:

Yt+1 Y t

Hình 11. Mô tả các hàm tiềm năng

Tính chất của trường ngẫu nhiên có điệu kiện là:

 Mô hình phân biệt (discriminative models)  Mô hình chuỗi (sequential models)

 Mô hình đồ thị vô hướng (Undirected graphical models)

Một phần của tài liệu Tìm hiểu mô hình crf và ứng dụng trong trích chọn thông tin trong tiếng việt (Trang 26 - 28)