M U
2. 3M ts ph ng pháp gi i quy t
4.2 Gói OpenNLP
OpenNLP là tên chung c a m t nhóm các d$ án mã ngu7n m0 liên quan t i x lý ngôn ng t$ nhiên (NLP), và th vi n các công c) NLP vi t b>ng ngôn ng Java c a Jason Baldridge, Tom Morton, và Gann Bierner. Th vi n OpenNLP vi t b>ng ngôn ng Java s d)ng th vi n MaxEnt ã trình bày 0 ph,n trên, th vi n này cung c"p m t s công c) x lý ngôn ng t$ nhiên d$a trên các mô hình entropy c$c
#i [26].
Th vi n OpenNLP vi t b>ng ngôn ng C# s d)ng th vi n SharpEntropy d$a trên phiên b n 1.2.0 c a các công c) OpenNLP vi t b>ng ngôn ng Java, phát hành tháng 4 n m 2005. Trong ph,n này lu n v n ch y u trình bày cách s d)ng th vi n C# OpenNLP. Vì th vi n OpenNLP vi t b>ng ngôn ng Java .c xu"t b n theo gi"y phép LGPL, th vi n OpenNLP vi t b>ng ngôn ng C# c9ng .c xu"t b n theo gi"y phép LGPL.
Các công c) trong th vi n C# là: m t b tách câu, m t b tách t2, m t b gán nhãn t2 lo#i, m t b phân tách c)m t2 lo#i, m t b phân tích cú pháp, và m t b
tìm tên th$c th . T"t c các công c) ó s d)ng các mô hình entropy c$c #i .c sinh b0i th vi n SharpEntropy.
Tuy nhiên, các công c) ó .c xây d$ng chB ph)c v) ngôn ng ti ng Anh. Vi c áp d)ng vào ngôn ng ti ng Vi t là khó kh n do s$ khác bi t v (c thù ngôn ng . Trong th-i gian có h#n, lu n v n m i chB t p trung xây d$ng .c ph,n d li u và b công c) cho bài toán tách câu và bài toán gán tìm tên th$c th pháp lu t, áp d)ng cho các v n b n pháp lu t Vi t Nam. Ph,n ti p theo s= gi i thi u chi ti t các k t qu mà lu n v n #t .c trong th-i gian qua.