Thông tin pháp lut Vit Nam

Một phần của tài liệu Chiết lọc thông tin pháp luật trong dữ liệu văn bản (Trang 47)

M U

3.1Thông tin pháp lut Vit Nam

2. 3M ts ph ng pháp gi i quy t

3.1Thông tin pháp lut Vit Nam

3.1.1 H th ng các v n b n pháp lu+t Vi t Nam

Pháp lu t n c ta .c ban hành b0i các c quan có th6m quy n trong b máy hành chính nhà n c.

Các n v% hành chính c a n c C ng hoà xã h i ch ngh/a Vi t Nam .c phân %nh nh sau:

N c chia thành tBnh, thành ph tr$c thu c trung ng;

TBnh chia thành huy n, thành ph thu c tBnh và th% xã thành ph tr$c thu c trung ng chia thành qu n, huy n và th% xã;

Huy n chia thành xã, th% tr"n; thành ph thu c tBnh, th% xã chia thành ph -ng và xã qu n chia thành ph -ng.

Vi c thành l p H i 7ng nhân dân và UC ban nhân dân 0 các n v% hành chính do lu t %nh.

M8i c quan, t2 trung ng n %a ph ng u có quy n ban hành các v n b n pháp lu t tu5 theo c"p b c và nhi m v) c a t2ng t ch c. Các v n b n pháp lu t r"t quan tr ng trong -i s ng xã h i b0i vì nó quy %nh quy n và ngh/a v) c a các t ch c, cá nhân, nh h 0ng n toàn b ho#t ng trong xã h i. M8i ngày có th có n hàng ch)c v n b n pháp lu t .c ban hành. Do ó kho d li u v v n b n pháp lu t r"t l n và phong phú, a d#ng.

M t s lo#i v n b n pháp lu t và c quan ban hành trong h th ng lu t Vi t Nam: Hi n pháp n c C ng hoà xã h i ch ngh/a Vi t Nam là lu t c b n c a Nhà n c, có hi u l$c pháp lý cao nh"t. - M i v n b n pháp lu t khác ph i phù h.p v i hi n pháp. - Hi n pháp do Qu c h i ban hành. - ChB có Qu c h i m i có quy n s a i Hi n pháp.

C n c vào Hi n pháp, lu t, ngh quy t c a Qu c h i, pháp l nh, ngh quy t

c a UC ban th -ng v) Qu c h i, l nh, quy t nh c a Ch t%ch n c, Chính

ph ra ngh quy t, ngh nh, Th t ng Chính ph ra quy t nh, ch th và

C n c vào Hi n pháp, lu t và ngh quy t c a Qu c h i, pháp l nh, ngh

quy t c a UC ban th -ng v) Qu c h i, l nh, quy t nh c a Ch t%ch n c, các v n b n c a Chính ph và Th t ng Chính ph , B tr 0ng, các thành viên khác c a Chính ph , Th tr 0ng các c quan thu c Chính ph ra quy t

nh, ch th , thông t và ki m tra vi c thi hành các v n b n ó i v i t"t c các ngành, các %a ph ng và c s0.

C n c vào Hi n pháp, lu t, v n b n c a c quan Nhà n c c"p trên, H i 7ng nhân dân ra ngh quy t v các bi n pháp b o m thi hành nghiêm

chBnh Hi n pháp và pháp lu t 0 %a ph ng; v k ho#ch phát tri n kinh t - xã h i và ngân sách; v qu c phòng, an ninh 0 %a ph ng; v bi n pháp n %nh và nâng cao -i s ng c a nhân dân, hoàn thành m i nhi m v) c"p trên giao cho, làm tròn ngh/a v) i v i c n c.

3.1.2 Các c i m c a thông tin pháp lu+t Vi t Nam

Lu n v n t p trung nghiên c u trên t p các v n b n pháp lu t Vi t Nam v i ngôn ng ti ng Vi t. B"t k5 m t ngôn ng nào c9ng có các (c tr ng riêng, h n n a ti ng Vi t còn là ngôn ng r"t a d#ng, phong phú v t2 ng , ng pháp...M t s (c

i m c a Ti ng Vi t .c li t kê d i ây:

Ti ng Vi t thu c ngôn ng n l p, t c là m8i m t ti ng (âm ti t) .c phát âm tách r-i nhau và .c th hi n b>ng m t ch vi t.

(c i m ng âm: Trong ti ng Vi t có m t lo#i n v% (c bi t g i là "ti ng". V m(t ng âm m8i ti ng là m t âm ti t.

(c i m t2 v$ng: m8i ti ng, nói chung, là m t y u t có ngh/a. Ti ng là n v% c s0 c a h th ng các n v% có ngh/a c a ti ng Vi t. T2 ti ng ng -i ta t#o ra các n v% t2 v$ng khác %nh danh s$ v t, hi n t .ng nh- ph ng pháp ghép và láy t2... V n t2 v$ng t i thi u c a ti ng Vi t ph,n l n là các t2 n ti t (m t âm ti t, m t ti ng). S$ linh ho#t trong s d)ng, vi c t#o ra các t2 ng m i n t cách d dàng ã t#o i u ki n thu n l.i cho s$ phát tri n v n t2, v2a phong phú v s l .ng, v2a a d#ng trong ho#t ng. Cùng m t s$ v t, hi n t .ng, m t ho#t ng hay m t (c tr ng, có th .c bi u th% theo nhi u cách khác nhau.

(c i m ng pháp: T2 c a ti ng Vi t không bi n i hình thái khi k t h.p các t2 làm thành k t c"u nh ng , câu ti ng Vi t r"t coi tr ng tr t t$ t2 và h t2.

Vi c s:p x p các t2 theo m t tr t t$ nh"t %nh là cách ch y u bi u th% các quan h cú pháp. Trong ti ng Vi t, nói "Anh ta l#i n" là khác v i nói "L#i n anh ta". Khi các t2 cùng lo#i k t h.p v i nhau the quan h chính ph) thì t2 ng tr c gi vai trò chính, t2 ng sau gi vai trò ph). Nh- tr t t$ k t h.p t2 mà ta th"y "c m tình" khác v i "tình c m". Tr t t$ ch ng ng tr c, v% ng ng sau là tr t t$ ph bi n c a k t c"u câu ti ng Vi t.

Ph ng th c h t2 c9ng là ph ng pháp ph bi n trong ti ng Vi t. Nh- h t2 mà t h.p t2 "anh c a em" khác v i t h.p t2 "anh và em" hay "anh vì em".

Ngoài nh ng (c i m chung c a ti ng Vi t, v n b n pháp lu t Vi t Nam còn có nh ng (c i m riêng, ch@ng h#n có ch a nh ng t2, c)m t2 (c tr ng nh :

S hi u m t v n b n có d#ng: 30/2006/Q -TTg, 12/2005/N -CP,...

Ch a các c)m t2 (c tr ng c a lu t pháp nh "pháp nhân", "ngh a v dân

s ", "trách nhi m dân s$", "quan h dân s ",...

Ví d): (adsbygoogle = window.adsbygoogle || []).push({});

" i u 9. Nguyên t c thi n chí, trung th c

Trong quan h dân s , các bên ph i thi n chí, trung th c, không ch quan tâm,

ch m lo n quy n, l i ích h p pháp c a mình mà còn ph i tôn tr ng, quan tâm n l i ích c a Nhà n c, l i ích công c ng, quy n, l i ích h p pháp c a ng i khác, giúp , t o i u ki n cho nhau th c hi n quy n, ngh a v dân s , không bên nào

c l a d i bên nào; n u m t bên cho r ng bên kia không trung th c, thì ph i có ch ng c .

i u 10. Nguyên t c ch u trách nhi m dân s

Các bên ph i nghiêm ch nh th c hi n ngh a v dân s c a mình và t ch u trách

nhi m v vi c không th c hi n ho c th c hi n không úng ngh a v ; n u không t nguy n th c hi n, thì có th b c ng ch th c hi n theo quy nh c a pháp lu t."

(Trích B lu t Dân s$ (1995)/ Ph,n 1) Ng pháp trong các v n b n pháp lu t c9ng tuân theo các nguyên t:c chung c a ng pháp ti ng Vi t, ngoài ra có m t s khác bi t, ch@ng h#n, d"u k t thúc câu trong ti ng Vi t th -ng chB là (.), (?), (!) , nh ng trong các v n b n pháp lu t các d"u (:), (;) c9ng có th là d"u k t thúc câu...

Chúng tôi s= i sâu vào các (c i m c a thông tin pháp lu t, th$c th pháp lu t trong ph,n ti p theo xây d$ng các hàm (c tr ng cho vi c nh n d#ng tên th$c th .

3.2 Áp d ng MEM vào bài toán chi t l c thông tin pháp lu t

3.2.1 Bài toán chi t l c thông tin pháp lu+t

Bài toán:

Cho vào m t o#n v n b n (text), trong v n b n ó có th có ch a m t s các thông tin v pháp lu t (có th .c bi u #t d i d#ng 1 tên riêng NE)

Xác %nh t"t c các tên riêng pháp lu t trong v n b n ó Phân lo#i t"t c các th lo#i v pháp lu t ó.

Ví d), a vào m t v n b n có c)m t2 "quy n th2a k " thì ch ng trình ph i nh n ra .c c)m t2 này và x p nó vào lo#i tên riêng thu c lu t dân s$.

3.2.2 Mô hình ME cho bài toán chi t l c thông tin pháp lu+t

xây d$ng .c bài toán chi t l c thông tin pháp lu t nh trên, tr c h t chúng ta c,n th$c hi n tách câu v n b n, v i m8i câu, chúng ta l#i th$c hi n nh n d#ng ra tên các th$c th xu"t hi n trong câu. Các b c trong quá trình chi t l c thông tin .c th$c hi n nh sau:

V i m8i t p v n b n ,u vào b"t k5, thông qua mô un tách câu, v n b n .c tách thành các câu, m8i câu trên m t hàng. V i m8i câu trong v n b n .c tách, s d)ng mô un nh n d#ng tên th$c th a ra các câu v i các th$c th

.c nh n tên.

Nh v y, có hai bài toán c b n c,n gi i quy t, bài toán tách câu ti ng Vi t và bài toán nh n d#ng, phân l p tên th$c th pháp lu t. gi i quy t các bài toán này, lu n v n s d)ng mô hình Entropy c$c #i ã .c trình bày chi ti t 0 ch ng 2. Mô hình entropy c$c #i ã .c ng d)ng cho khá nhi u bài toán khác nhau nh phân tích cú pháp, gán nhãn t2 lo#i,...[27, 28] tuy nhiên vi c áp d)ng mô hình này cho nh n d#ng tên th$c th và phân tách câu ti ng Vi t v4n ch a .c c p t i. V i mô hình entropy c$c #i, m t trong nh ng v"n quan tr ng c,n gi i quy t là ph i xây d$ng t p các thu c tính. Vi c xây d$ng các thu c tính này th$c s$ không h d dàng, ã .c chúng tôi ã th nghi m nhi u l,n m i a ra .c t p các thu c tính t ng i (c tr ng. Quá trình th$c hi n .c trình bày chi ti t 0 ph,n ti p theo i v i t2ng bài toán c) th .

3.2.2.1 Bài toán tách câu (Sentence Detection)

Tr c ây, h,u h t các công vi c nghiên c u ngôn ng t$ nhiên nh gán nhãn t2 lo#i và phân tích t2 lo#i u gi s r>ng v n b n ã .c chia thành các câu

n và không trình bày thu t toán chính xác th$c hi n công vi c này.

Bài toán tách câu nghe có vA khá n gi n, chB d$a trên các d"u k t thúc câu xác %nh các câu riêng r=, tuy nhiên các d"u câu nh (.), (!), (?) không chB .c dùng riêng chuyên k t thúc câu, ch@ng h#n d"u (.) có th dùng trong ch s th p phân, trong tên vi t t:t (nh 192.21, PGS.TS. Nguy n V n H), trong email,.. D"u (!) và (?) không có nhi u s$ nh p nh p nh>ng nh d"u (.) nh ng chúng c9ng có th xu"t hi n trong tên riêng hay .c s d)ng nhi u l,n nh"n m#nh k t thúc m t câu.

Chúng ta có th li t kê t p các lu t d$a trên t2 v$ng và a ra m t danh sách dùng tránh nh p nh>ng trong các tr -ng h.p nêu trên, tuy nhiên, danh sách này không th bao g7m h t t"t c các tr -ng h.p, m(t khác n u có quá nhi u lu t có th d4n t i tr -ng h.p các lu t nh h 0ng x"u l4n nhau. H n n a vi c xây d$ng s l .ng l n các lu t t2 v$ng b>ng tay g(p nhi u khó kh n và m"t r"t nhi u th-i gian.

Mô hình entropy c$c #i là m t l$a ch n t t cho vi c tách câu, v i mô hình này, h th ng chB yêu c,u m t s thông tin g.i ý và m t t p v n b n ã .c tách câu m t cách chính xác. Mô hình ME s= hu"n luy n d dàng và chính xác trong tách câu là có th so sánh .c v i các h th ng yêu c,u m t l .ng thông tin l n.

s d)ng mô hình entropy c$c #i, c,n ph i xác %nh các ,u ra, các thu c tính ng c nh t2 ó xây d$ng các hàm (c tr ng fi (hàm thu c tính), và c,n xây d$ng t p ví d) hu"n luy n tách câu.

H th ng s= quét qua v n b n xác %nh v% trí c a các ký t$ có kh n ng là d"u k t thúc câu. i v i v n b n bình th -ng, các d"u có th là k t thúc câu th -ng chB là (.), (!), (?), tuy nhiên trong v n b n pháp lu t th -ng không xu"t hi n các (!), (?), trong khi ó các d"u (;), (:) l#i xu"t hi n r"t nhi u và c9ng có th là d"u k t thúc câu, do ó h th ng s= quét qua v n b n và xác %nh v% trí xu"t hi n c a t"t c các ký t$ ó.

* Các ,u ra

,u ra c a h th ng i v i vi c tách câu chB là 2 tr#ng thái: "có" ho(c "không". V i m8i ký t$ có kh n ng là k t thúc câu: (adsbygoogle = window.adsbygoogle || []).push({});

H th ng cho k t q a là "có" (T) n u ó th$c s$ là k t thúc câu. Cho k t qu là "không" (F) n u ó không ph i là k t thúc câu.

* Các thu c tính ng c nh: là n i dung các ký t$, các t2 tr c và sau ký t$ có kh n ng là k t thúc câu t2 ó xác %nh xem ký t$ ó có th$c s$ là d"u k t thúc câu hay không.

Các thu c tính ng c nh này .c l$a ch n d$a vào các tr -ng h.p k t thúc câu th -ng x y ra, ch@ng h#n nh n u sau ký t$ ó là m t ký t$ tr:ng, t2 ng sau l#i có ch cái ,u vi t hoa thì có th ch:c ch:n ký t$ ó là k t thúc câu. V i m8i ký t$ có kh n ng là d"u k t thúc câu (coi m8i t2 ch a các ký t$ có kh n ng k t thúc câu là m t Candidate) các thu c tính ng c nh .c xét là:

Ký t$ ó có là ký t$ k t thúc câu hay không (end of sentence - eos)

Ph,n ng tr c ký t$ (c bi t g i là Prefix (ti n t -x),

Ph,n ti p theo c a ký t$ (c bi t g i là Suffix (h u t -s) .

Ch cái ,u c a Suffix và Prefix có .c vi t hoa không (IsFirrstUpper-

xcap, scap)?

T2 ng tr c Candidate (previous token - v)

T2 ng sau Candidate (next token - n)

ng tr c ký t$ .c xét có ph i là d"u cách không (space previous - sp)

ng sau ký t$ .c xét có ph i là d"u cách hay không (space next - sn)

Ch@ng h#n v i o#n v n b n sau:

"Ði u 60. Ði u ki n c a cá nhân làm ng i giám h

1. Có n ng l c hành vi dân s !y ;

2. Có t cách o c t t; không ph i là ng i ang b truy c u trách nhi m hình s ho c ng i b k t án nh ng ch a c xoá án tích v m t trong các t i c ý xâm ph m tính m ng, s c kho", danh d , nhân ph#m, tài s n c a ng i khác;

3. Có i u ki n c!n thi t b o m th c hi n vi c giám h ."

(Trích B lu t Dân s$ (1995)/Ph,n 1) Ký t$ (;) th 2 trong o#n v n b n trên có các thu c tính ng c nh (contextual predicates) là: "eos" "x=t t" "s= " "v= c" "n=không" "sn" * Xác nh các hàm hàm c tr ng (features) + i v i m8i ký t$ có th là d"u k t thúc câu (.), (:), (;), (?), (!) m)c ích c a chúng ta là c l .ng m t phân ph i xác su"t p i v i m8i ký t$ và ng c nh c a ký t$ ó. Phân ph i xác su"t s d)ng 0 ây là mô hình ME có d#ng:

( , ) 1 1 ( | ) ( ) j k f a b j j p a b Z b α = = ∏

trong ó a là outcome và b là context

D$a vào các thu c tính ng c nh chúng ta xây d$ng các hàm (c tr ng i

Một phần của tài liệu Chiết lọc thông tin pháp luật trong dữ liệu văn bản (Trang 47)