Đang tải... (xem toàn văn)
Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt
Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t Ch ng C S LÝ THUY T NGÔN NG TI NG VI T 2.1 Gi i thi u Ch ng trình bày v n nghiên c u ph v ng pháp ti ng Vi t nh m ph c v vi c ng pháp rút trích c m t Do ng pháp ti ng Vi t v n nhi u v n c tr ng ng ngh a cho câu ti ng Vi t tranh lu n ch a t t i s nh t quán gi a nhà ngôn ng h c nên c ng cịn nhi u khó kh n vi c t 19 Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t ng hóa phân tích ti ng Vi t Trong ph m vi nghiên c u c a lu n án, ch ch c p ng n khái ni m, tính ch t, quan i m chung c a nhà ngôn ng h c, nh m xác nh rõ c s lý thuy t v ngôn ng ti ng Vi t ph c v cho m c tiêu c a lu n án C th , ch ng trình bày v n ngh a cho câu ti ng Vi t, m c lo i, c m t câu nh c m t nh th c m t c tr ng ng tiêu chí ng ngh a c a CT TNN c ng nh t làm c s lý thuy t v ngôn ng h c cho ph ng pháp xác c tr ng ng ngh a cho câu ti ng Vi t 2.2 C s lý thuy t 2.2.1 C m t c tr ng ng ngh a Trong ti ng Vi t, câu n v nh nh t m nhi m ch c n ng thông báo tr n v n thông tin b ng ngôn ng (Di p Quang Ban, 2004) T thân có ngh a C m t n v nh nh t t n v nh h n câu nh ng l n h n t v m t ý ngh a ng pháp (câu > c m t > t ) Tuy không thông báo tr n v n n i dung thông tin nh ng c m t có kh n ng d báo, nh h ng n i dung thông tin c a v n b n Trong vi c nghiên c u v ngôn ng h c, nhà nghiên c u u có m t quan i m chung v c u trúc cú pháp c a thành ph!n câu ch c n ng ph c a chúng (Cao Xuân H o, 1992; H" Lê, 1993; Nguy#n Kim Th n ng H u Qu$nh, 2001; Di p Quang Ban, 2004…) Thành ph!n câu khái ni m chung c a nhi u ngôn ng , không nêu phân nh thành ph!n câu d a vào %c c thù t ng ngôn ng riêng bi t Tiêu chu&n %c d a vào quan h ý ngh a gi a t câu c tr ng hình th c c a t câu Trong m t câu nói l p, tách r'i tình hu(ng nói n ng, s có m t c a thành t( có tính ch t b)t bu c Thành t( gi vai trị quan tr ng v ng pháp (i v i c m t Thành t( thành t( i di n cho tồn b c m t m(i liên h v i y u t( khác n m c m t Do ó, ch c n ng cú pháp c a toàn b c m t ki n trúc l n h n s* g)n bó m t thi t v i vai trò cú pháp c a thành t( Trong quan h n i b c m t , thành t( chi ph(i t t c thành t( tr c ti p ph thu c vào mình, quy t thành t( ph có liên quan 20 nh ch c n ng cú pháp c a t t c Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t V ý ngh a, thành t( quy t nh kh n ng gia nh p c u trúc l n h n c a toàn b c m t M t khác c ng n i dung - ngh a c a thành t( quy t nh kh n ng xu t hi n ki u thành t( ph Nh' ó có th d a vào kh n ng xu t hi n c a thành t( ph nh d a vào m t d u hi u hình th c xác nh t lo i, ti u lo i th m chí c ý ngh a c a l p t hay c a t gi vai trị thành t( Xét v q trình c hi u ng ngh a c a v n b n bình di n d ng pháp, m t n i dung c a câu bi u ng ngh a c a t hay c m t t (hay ngh a bi u th ), ây c p m nhi m (nh m t c m t c m danh t , c m ng t hay c m tính t ) (Cao Xuân H o, 1992) C p (i t %ng (s ch ) %c nói cao h n nh n n câu v n b n, (i t %ng nh b i c m danh t (C m t %c xác c tr ng ng ngh a - CT TNN) m(i quan h c a chúng Ch+ng h n nh câu “cho bi t quê h xét c p ng c a Ch t ch H Chí Minh ?” N u ng ngh a c a c m t , quê h ng ch m t c m danh t ch n i ch(n, Ch t ch H Chí Minh c ng c m danh t ch tên riêng Tuy nhiên, n u xét thêm m(i quan h c a chúng, quê h quê h ng câu ch n (i t %ng ng c a Ch t ch H" Chí Minh ch khơng ph i c a khác; ó, c m danh t Ch t ch H Chí Minh ch n (i t %ng v Ch t ch H" Chí Minh c a chúng ta, nh ng (i t %ng Ch t ch H Chí Minh (i t %ng ph câu ang xét Nó óng vai trị gi i h n ph m vi c a (i t %ng quê h ng câu V i m t góc nhìn nh v y, ng ngh a câu, hay ng ngh a v n b n %c th hi n rõ nét !y h n l nh v c x, lý ngôn ng t nhiên b ng máy tính.Vì v y, có th nói, m t ph m trù ó, CT TNN m i quan h c a chúng t o thành n i dung n ng c t- ng ngh a c a m t câu hay m t v n b n Câu th c hi n ch c n ng công c t duy, công c giao ti p thông qua ngh a c a Ngh a c a câu không n gi n m t phép c ng ngh a c a t câu Ngh a c a câu m t c u trúc có nhi u t!ng Các t!ng ngh a câu ph(i h%p v i t o ngh a hình th c c a câu Ngh a c a câu có th th y b m t c a nh ng nhi u ch th y %c b sâu c a Nh ng dù b m t (hi n ngôn) hay b sâu (hàm ngơn), ngh a câu ch có th ngh a hình th c 21 Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t câu có s ch Mu(n xác nh s ch c a câu ph i hi u s ch c a thành ph!n t o câu tình hu(ng c a phát ngơn Tách kh i câu, t ng v n có ngh a nh ng khơng có s ch (Cao Xn H o, 1992) Nh v y, m t i u không th ph nh n m t câu có nh ng t , nhóm t m nhi m ch c n ng c a vi c chuy n t i thông tin phát ngôn Thu t ng lu n án dùng ch nh ng t , nhóm t có ch c n ng nh C m t ng ngh a c a câu %c nh ngh a nh sau nh ngh a 2.1 C m t g n xác ch c tr ng c tr ng ng ngh a c m t mà c tr ng mơ t ng)n %c th o lu n v n b n ng)n nh t (câu) Ngoài c p ng ngh a c a t hay c m t m nhi m (nh m t c m t c m danh t , c m ng t hay c m tính t ), c p cao h n nh n (i t %ng (s ch ) %c nói n câu v n b n (Cao Xuân H o, 1992) D a vào c s trên, lu n án trình bày tiêu chí ng ngh a Tiêu chí ng ngh a c a c m t nh it ng (s ch ) %c Ví d 2.1: Máy tính có dung l xác nh CT TNN cho câu nh sau c tr ng ng ngh a c a câu -./ c m t xác c p n thông tin c a câu ng RAM l n nh t ây, theo tiêu chí ng ngh a “dung l ng RAM l n nh t ” c m t c tr ng ng ngh a cho câu Quan h thành ph!n gi a c m danh t “máy tính này” c m danh t “dung l c p ng RAM l n nh t” cho phép xác nh (i t %ng %c n thơng tin c a câu dung l %ng RAM l n nhât Vì dung l %ng RAM dung l %ng c a m t thi t b b nh ( %c g i tên RAM) c a máy tính (trong l nh v c chuyên bi t máy tính), nên khơng c!n c m t “máy tính này” c m t “dung l %ng RAM l n nh t” c ng mang (ng ngh a) c a câu %c n i dung n"ng c(t ví d 2.1 Vi c nghiên c u c m t c tr ng ng ngh a có t!m quan tr ng cho vi c tìm hi u thơng tin c ng nh s, d ng chúng h th(ng ngôn ng C u t o c a c m t mang nh ng d u hi u t ó có th phân nh t lo i, ti u lo i c a t ( c i m không bi n hình t c a ti ng Vi t) C u t o c a c m t giúp n)m %c cách tri n khai câu b ng vi c m r ng thành ph!n câu ho c ng %c 22 Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t l i nh rút g n câu, mơ hình hố câu, hay giúp cho vi c tìm hi u câu, v n b n %c d# dàng thu n l%i h n 2.2.2 Câu Câu -./ n 1/2 a nghiên c u ngôn ng /23/c u 4o ng /567p (bên 1./bên 89:.i) t /l p 1./ng / i u k t 46;c, mang m t 7/2 a ng 'i 83i, ho c 23/th /?@m theo 467i 83i, 9>;p 6Anh 46.nh 1./bi u hi n, truy n tt t , s / 7nh 9>7/2 a ng 'i ng, 4Anh m Câu -./ n 1/86 / nh t chuy n t i m t thông tin tr n v n nh t b ng ngôn ng (Di p Quang Ban, 2004) Theo quan i m c a Cao Xuân H o (1998), câu -./ c a ngôn t , c a v n b n Nó n 1/c b n c a l'i nói, n v nh nh t có th s, d ng vào vi c giao t Nói cách khác, câu ngôn b n (v n b n) nh nh t n v câu c ng %c chia thành nhi u d ng th c i m chung nh t c a nhi u quan ni m v ý ngh a ng pháp c a nhi u ngôn ng b n t!ng khái quát nh t T n v t , câu v n %c phân lo i thành danh t , ng t , tính t , i t , ph t , k t t , tr% t , c m t , ti u lo i c a chúng … nh quan i m c a nhà ngôn ng h c (By ban Khoa h c Xã h i Vi t Nam, 1983) Câu %c phân lo i theo m c ích phát ngơn, c u trúc,… Nhi u quan i m v phân lo i câu ã %c a Theo quan i m H" Lê (1993), tác gi phân lo i câu nh sau: Phân i theo c u o ng p Câu - thuy t Câu g i tên Câu p Câu t ng thu t Câu Phân i theo c ch i Câu nghi v n Câu c m thán Câu c u n 23 Câu –v Câu - ng Câu cách th chành ng Câu i u ki n-h qu Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t Theo quan i m Nguy#n Kim Th n ng H u Qu$nh (2001), tác gi phân lo i câu theo m c ích nói gi(ng v i quan i m c a H" Lê Tuy nhiên, cách phân lo i theo c u t o ng pháp l i khác, c th là: Nguyên nhânk t qu Có quan h qua l i Câu ph c h%p Phân i theo c u o ng p Liên h%p H)n h%p Liên hoàn Nh %ng b -t(ng ti n Câu i u ki n-h qu Câu 'n gi n Câu Câu t ng thu t Câu nghi v n Phân i theo c ch n i Câu c m thán Câu c u n Quan i m c a Cao Xuân H o (1992), phân lo i câu có th trình bày tóm t)t: Câu Phân i theo c u trúc cú p -thuy t Câu ghép Câu &c bi t Câu nghi v n Câu Phân i theo l!c ngôn trung Câu tr n thu t có giá tr ngơn trung %c ánh d u Câu ngôn hành Phân i theo l!c ngôn trung ngh"a bi#u hi n Câu ch$ hành Phân i theo ngh"a bi#u hi n c a khung v ng ng Câu ch$ trình Câu ch$ tr ng thái Câu ch$ quan h Các cơng trình nghiên c u v lo i câu c a nhà ngôn ng h c u th hi n quan i m, m c ích lu n ch ng riêng M t i m thu n l%i ph m vi 24 Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t nghiên c u c a lu n án ch t p trung vào d ng câu n Và theo quan i m c a nhà nghiên c u ngơn ng h c cách phân lo i câu theo m c ích nói t ng (i gi(ng C th , cách phân lo i câu nghi v n Câu t Câu nghi v n toàn b ng thu t Dùng câu t Câu nghi v n l!a ch n ng thu t Câu nghi v n Phân lo i theo c ch i %c trình bày nh sau: Câu nghi v n b ph n Dùng t* nghi v n Câu c m thán u Câu nghi v n l!a ch n b ph n Câu c u n T cách phân lo i theo m c ích nói nh tiêu chí ng ngh a ( ngh a m c 2.2.1), CT TNN %c xác %c nh nh ti u lo i c a câu nghi v n (dùng câu t 'ng thu t) nh sau: 1) Câu nghi v n tồn b CT TNN c m danh t Ví d 2.2: Máy tính h r"i à? Ch ng c a cô nh th nào? 2) Câu nghi v n l a ch n CT TNN c m danh t Ví d 2.3: Ph n c ng h hay ph n m m h ? Máy tính c a anh có h hay khơng? 3) Câu nghi v n b ph n CT TNN c m danh t ho c c m ng t Ví d 2.4: Tác gi cu n sách AI ai? Máy tính v!n hành nh th nào? V!n hành c a máy tính nh th nào? 4) Câu nghi v n l a ch n b ph n CT TNN c m danh t Ví d 2.5: Anh mua sách AI hay sách PL? Nh phân tích ví d trên, c m danh t CT TNN chi m t l cao h n c m t khác ti u lo i c a câu nghi v n (dùng câu t 'ng thu t) H n n a, theo kh o sát th c nghi m c a lu n án 437 câu nghi v n câu t 'ng thu t %c rút trích tài li u truy n ng)n báo chí khoa h c ( 25 %c trình bày Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t chi ti t Ph l c F) CT TNN c m danh t chi m 87,12% (còn c m ng t chi m 12,88%) Xét v m t ngh a (By ban Khoa h c Xã h i Vi t Nam, 1983; Nguy#n Tài C&n, 1996), c m t m t c u t o có tác d ng làm cho ngh a c a t( %c th c t i hố, t c có liên h v i th c t i Trong c m danh t , ngh a th c t i hố ngh a v tính xác nh c a it ng Còn c m ng t , c m tính t , ngh a th c t i hoá ch ngh a v tính tình thái Nh v y, xác "ng th'i c ng xác danh t nh nh %c c m danh t %c b n ch t ý ngh a c a s v t g)n v i c m ó V i s phân tích nh n c m danh t xác nh nh trên, lu n án ch t p trung nghiên c u c tr ng ng ngh a cho câu nh %c c m danh t c tr ng ng ngh a cho câu, trình th c hi n ph i phân o n câu thành t v i s thích t lo i c a chúng D a vào t lo i c u t o c a m t c m danh t , trình ti p t c nh n di n c m danh t câu (g i c m danh t d n) Ti p theo, trình ph i xác c m danh t nh c tr ng ng ngh a (CDT TNN) c m danh t d n d a c u trúc câu t quan h gi a c m danh t Nh v y, v m t ngôn ng h c, c!n xác nh rõ khái ni m c i m c a t lo i, c mt 2.2.3 T lo i S phân lo i t lo i (gán nhãn t lo i), theo quan i m nhà ngôn ng h c c a By ban Khoa h c Xã h i Vi t Nam (1983) có th phân lo i t theo c u t o c a chúng câu, ó s phân lo i t gán nhãn t lo i cho chúng (nh Danh t , ng t , Tính t , ) Các t có m t nhãn t lo i có ngh a khái quát gi(ng c i m ng pháp gi(ng Ví d : - Tơi ã n c m - Tôi ang n c m - Tôi ang n u c m Qua nh ng ví d trên, có th nh n th y r ng t quát c i m ng pháp, m t lo i ( 26 n, n u, xét theo ngh a khái %c gán m t nhãn t lo i) Mơ hình rút trích c m t Các t c tr ng ng ngh a ti ng Vi t ã, ang c ng rõ ràng m t lo i, %c gán m t nhãn t lo i khác, so v i n n u… S phân lo i t theo t lo i c!n thi t chúng óng góp vào vi c xác nh ngh a c a câu C!n l u ý ba i u sau Th nh t, ngh a khái quát c a t ti ng Vi t pháp c a Nh ng Vi t, khơng hi n hi n %c th hi n qua c i m ng c i m ng pháp y, m t ngơn ng n l p nh ti ng hình th c ng âm c a t mà ch y u kh n ng k t h%p c a v i t khác Ví d : t v m c n có ngh a v ho t ng khơng th (khơng th nói "r t n c m"); nh ng t có th dùng v i t r t (có th nói: "r t xét xem c i m ng pháp khác v i m t t Y c i m này, có th coi t X Y thu c hai t lo i khác Nh ng gi a nh ng t nh ng p có ngh a v tính ch t p") Th hai, m t t X có th có nh ng C n c vào nh ng ng sau t r t t có ngh a y c ng có th có nh ng c i m gi(ng C n c c i m này, l i có th coi t X thu c m t t lo i v i t Y V y, ph i c i m y u i u quan tr ng không nên phân lo i phân lo i, nên th y r ng m c ích c a s phân lo i, nh ã nói, mà bi t cách dùng t câu Cu(i cùng, t ti ng Vi t có th thay Ci ngh a "ng th'i thay Ci ng pháp Ví d : t khó kh n có th có ngh a v tính ch t, dùng c i m %c v i t r t ("công vi c r t khó kh n"); c ng có th có ngh a v s v t dùng v i t nh ng ("nh ng khó kh n công vi c này") lo i" Trong ti ng Vi t, hi n t %ng c!n %c ó hi n t %ng "chuy n %c ý, phC bi n Tóm l i, v i quan i m này, có th phân t c a ti ng Vi t thành tám t lo i chính: danh t , ng t , tính t , i t , ph t , k t t , tr t , c m t ti"u lo i c a chúng (By ban Khoa h c Xã h i Vi t Nam, 1983) 2.2.4 C m t C m t n v ng pháp c a c m t c!n thi t có th nh n rõ thêm b c trung gian gi a t câu S tìm hi u c u t o hi u c u trúc cú pháp c a câu Qua c u t o c a c m t , c i m ng pháp c a t lo i ti u lo i Lo i c m t danh t làm t( g i c m danh t Lo i c m t t , tính t làm t( g i c m ng t , c m tính t 27 ng Mơ hình rút trích c m t c tr ng ng ngh a ti ng Vi t S c u t o nòng c(t (N) c a câu N = a+b nh t b c dùng t c u t o thành c m t ; b %c di#n qua hai b c: th c th hai dùng c m t c u t o thành nòng c(t câu Nh ng ng 'i cơng nhân y Ví d : p p c ang xây d ng nhà máy p -a - p c p b - V i p thành t( ph , c thành t( D m danh t -./tC/h%p t /t /do không 23/k t t / ng !u, 23/quan h /26Enh 56 /gi a 46.nh t(/26E nh v i 46.nh t(/56 /1./46.nh t(/26Enh -./danh t (By ban Khoa h c Xã h i Vi t Nam, 1983) FE / G : Nh ng 27nh "ng th m 897t Trong ó, thành t( #$nh ng thành t( ph nh ng th m %&$t C u 4o chung a m danh t / g"m 23/ ph!n: Ph!n ph tr c t t c nh ng Trong ph!n 56 /tr t /nh t c H7c Ph!n trung tâm Ph!n ph sau Em h c sinh ch m ngoan y nh ba 1/4 =E/?67c nh 0/ph!n 56 /sau th 'ng nh n Ph!n 56 /tr %c s)p x p theo m t tr t %c hai 1/4 =E/23/tr t t /Cn c a m danh t /chuyên GIng nh /26/s(/l %ng a s /v t nêu / trung tâm, ph!n 56 /sau 26 /y u GIng 26/ch t l %ng a s /v t nêu /ph!n trung tâm C7c 1/ =E/ 4i 27c ph!n t tc %c qui c 7nh s( nh l %c "/ sau: nh ng -2 -1 -3 mèo en y Trong ó: - Ph!n trung tâm - Ph!n 56 / tr %c ánh s( th t c H7c - Ph!n 56 / sau H7c nh nh %c ba 1/ =E/ %c ánh s( th t -3,-2 -1 %c hai/ 1/ 4=E/ %c ánh s( theo th t a Ph n trung tâm 28 Mơ hình rút trích c m t Khi J.n c tr ng ng ngh a ti ng Vi t n ph!n trung tâm a m danh t /c!n 26;/