Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt
Trang 1Ch ng 2
C S LÝ THUY T NGÔN NG TI NG VI T
2.1 Gi i thi u
Ch ng này trình bày các v n v ng pháp ti ng Vi t nh m ph c v vi c nghiên c u ph ng pháp rút trích c m t c tr ng ng ngh a cho câu ti ng Vi t Do ng pháp ti ng Vi t v n còn nhi u v n tranh lu n ch a t t i s nh t quán gi a các nhà ngôn ng h c nên chúng ta c ng còn nhi u khó kh n trong vi c t
Trang 2ng hóa phân tích ti ng Vi t Trong ph m vi nghiên c u c a lu n án, ch ng 2 ch c p n các khái ni m, tính ch t, và quan i m chung c a các nhà ngôn ng h c, nh m xác nh rõ c s lý thuy t v ngôn ng ti ng Vi t ph c v cho m c tiêu c a lu n án
C th , ch ng 2 trình bày các v n nh th nào là c m t c tr ng ng ngh a cho câu ti ng Vi t, m c và tiêu chí ng ngh a c a CT TNN c ng nh t lo i, c m t và câu làm c s lý thuy t v ngôn ng h c cho ph ng pháp xác
nh c m t c tr ng ng ngh a cho câu ti ng Vi t
2.2 C s lý thuy t
2.2.1 C m t c tr ng ng ngh a
Trong ti ng Vi t, câu là n v nh nh t m nhi m ch c n ng thông báo tr n
v n thông tin b ng ngôn ng (Di p Quang Ban, 2004) T là n v nh nh t t thân có ngh a C m t là n v nh h n câu nh ng l n h n t v m t ý ngh a ng
pháp (câu > c m t > t ) Tuy không thông báo tr n v n n i dung thông tin
nh ng c m t có kh n ng d báo, nh h ng n i dung thông tin c a v n b n
Trong vi c nghiên c u v ngôn ng h c, các nhà nghiên c u u có m t quan i m chung v c u trúc cú pháp c a thành ph!n câu và ch c n ng chính ph c a
Qu$nh, 2001; Di p Quang Ban, 2004…) Thành ph!n câu là khái ni m chung c a nhi u ngôn ng , không nêu %c c thù t ng ngôn ng riêng bi t Tiêu chu&n phân nh thành ph!n câu %c d a vào quan h ý ngh a gi a các t trong câu và d a vào các c tr ng hình th c c a t trong câu
Trong m t câu nói cô l p, tách r'i tình hu(ng nói n ng, s có m t c a thành t( chính có tính ch t b)t bu c Thành t( chính gi vai trò quan tr ng v ng pháp (i v i c m t Thành t( chính là thành t( i di n cho toàn b c m t trong m(i liên h v i các y u t( khác n m ngoài c m t Do ó, ch c n ng cú pháp c a toàn b c m t trong ki n trúc l n h n s* g)n bó m t thi t v i vai trò cú pháp c a thành t( chính Trong quan h n i b c m t , thành t( chính chi ph(i t t c các thành t( tr c ti p ph thu c vào mình, nó quy t nh ch c n ng cú pháp c a t t c các
Trang 3V ý ngh a, thành t( chính quy t nh kh n ng gia nh p các c u trúc l n h n
quy t nh kh n ng xu t hi n ki u thành t( ph Nh' ó chúng ta có th d a vào kh n ng xu t hi n c a các thành t( ph nh là d a vào m t d u hi u hình th c xác nh t lo i, ti u lo i và th m chí c ý ngh a c a l p t hay c a t gi vai trò thành t( chính
ngoài m t n i dung c a các câu bi u t (hay ngh a bi u th ), ây chính là c p ng ngh a c a t hay c m t m nhi m (nh m t c m t là c m danh t , c m ng t hay c m tính t ) (Cao Xuân H o, 1992) C p cao h n là nh n ra các
nh b i c m danh t (C m t c tr ng ng ngh a - CT TNN) và các m(i quan
h c a chúng
Ch+ng h n nh câu “cho bi t quê h ng c a Ch t ch H Chí Minh ?” N u xét c p ng ngh a c a c m t , quê h ng ch là m t c m danh t ch n i ch(n, và Ch t ch H Chí Minh c ng là c m danh t ch tên riêng Tuy nhiên, n u xét thêm m(i quan h c a chúng, thì quê h ng trong câu này ch n (i t %ng là
quê h ng c a Ch t ch H" Chí Minh ch không ph i c a ai khác; trong ó, c m
danh t Ch t ch H Chí Minh ch n (i t %ng là v Ch t ch H" Chí Minh c a chúng ta, nh ng (i t %ng Ch t ch H Chí Minh là (i t %ng ph trong câu ang
m t góc nhìn nh v y, ng ngh a câu, hay ng ngh a v n b n %c th hi n rõ nét và !y h n trong l nh v c x, lý ngôn ng t nhiên b ng máy tính.Vì v y, có
th nói, trong m t ph m trù nào ó, các CT TNN và các m i quan h c a chúng
t o thành n i dung n ng c t- ng ngh a c a m t câu hay m t v n b n
Câu th c hi n ch c n ng công c t duy, công c giao ti p thông qua ngh a
c a nó Ngh a c a câu không n gi n là m t phép c ng ngh a c a các t trong câu Ngh a c a câu là m t c u trúc có nhi u t!ng Các t!ng ngh a trong câu ph(i h%p v i nhau t o ra ngh a hình th c c a câu Ngh a c a câu có th th y trên b m t c a nó nh ng nhi u khi ch th y %c trong b sâu c a nó Nh ng dù là b m t (hi n ngôn) hay trong b sâu (hàm ngôn), ngh a câu ch có th là ngh a hình th c
Trang 4khi câu có s ch Mu(n xác nh s ch c a câu thì ph i hi u s ch c a các thành ph!n t o câu và tình hu(ng c a phát ngôn Tách ra kh i câu, t ng v n có ngh a nh ng không có s ch (Cao Xuân H o, 1992)
Nh v y, m t i u không th ph nh n là trong m t câu có nh ng t , nhóm t
m nhi m ch c n ng chính c a vi c chuy n t i thông tin phát ngôn Thu t ng
Tiêu chí ng ngh a c a c m t c tr ng ng ngh a c a câu -./c m t xác
nh i t ng (s ch ) chính %c c p n trong thông tin c a câu.
Ví d 2.1: Máy tính này có dung l ng RAM l n nh t
0 ây, theo tiêu chí ng ngh a thì “dung l ng RAM l n nh t ” là c m t c tr ng ng ngh a cho câu Quan h thành ph!n gi a c m danh t “máy tính này” và c m danh t “dung l ng RAM l n nh t” cho phép xác nh (i t %ng chính %c
c p n trong thông tin c a câu là dung l %ng RAM l n nhât Vì dung l %ng RAM là dung l %ng c a m t thi t b b nh trong ( %c g i tên là RAM) c a máy tính (trong l nh v c chuyên bi t là máy tính), nên không c!n c m t “máy tính này” thì c m t “dung l %ng RAM l n nh t” c ng mang %c n i dung n"ng c(t (ng ngh a) c a câu ví d 2.1
Vi c nghiên c u c m t c tr ng ng ngh a có t!m quan tr ng cho vi c tìm
hi u thông tin c ng nh s, d ng chúng trong h th(ng ngôn ng C u t o c a c m t mang nh ng d u hi u t ó có th phân nh t lo i, ti u lo i c a t ( c
i m không bi n hình t c a ti ng Vi t) C u t o c a c m t giúp chúng ta n)m
Trang 5l i nh rút g n câu, mô hình hoá câu, hay giúp cho vi c tìm hi u câu, v n b n
2.2.2 Câu
Câu -./ n 1/2 a nghiên c u ngôn ng /23/c u 4o ng /567p (bên trong 1./bên
, s / 7nh 9>7/2 a ng 'i 83i, ho c 23/th /?@m theo 467i , s / 7nh 9>7/2 a ng 'i
nh t chuy n t i m t thông tin tr n v n nh t b ng ngôn ng (Di p Quang Ban, 2004)
Theo quan i m c a Cao Xuân H o (1998), câu -./ n 1/c b n c a l'i nói, c a ngôn t , c a v n b n Nó là n v nh nh t có th s, d ng vào vi c giao t Nói cách khác, câu là ngôn b n (v n b n) nh nh t.
n v câu c ng %c chia thành nhi u d ng th c i m chung nh t c a nhi u quan ni m v ý ngh a ng pháp c a nhi u ngôn ng thì n v t , câu trong v n b n t!ng khái quát nh t T %c phân lo i thành danh t , ng t , tính t , i t , ph t , k t t , tr% t , c m t , và các ti u lo i c a chúng … nh quan i m c a các nhà ngôn ng h c (By ban Khoa h c Xã h i Vi t Nam, 1983) Câu %c phân lo i theo m c ích phát ngôn, c u trúc,… Nhi u quan i m v phân lo i câu ã
Theo quan i m H" Lê (1993), tác gi phân lo i câu nh sau:
Câu
Phân i theo c u o
ng p
Phân i theo c ch i
Câu p Câu - thuy t Câu g i tên
Câu tng thu t Câu nghi v n Câu c m thán Câu c u khi n
Câu –v Câu - ng Câu cách th c-hành ng
Câu i u kin-h qu
Trang 6Theo quan i m Nguy#n Kim Th n và ng H u Qu$nh (2001), các tác gi phân lo i câu theo m c ích nói thì gi(ng v i quan i m c a H" Lê Tuy nhiên, cách phân lo i theo c u t o ng pháp l i khác, c th là:
Quan i m c a Cao Xuân H o (1992), phân lo i câu có th trình bày tóm t)t:
p
Phân i theo l!c ngôn trung và
Câu ch$ quá trình Câu ch$ tr ng thái
Câu ch$ quan hPhân i theo
l!c ngôn trung
Phân i theo ngh"a bi#u hin c a
khung v ng
Câu nghi v n
Câu tr n thu t có giá tr ngôn trung
%c ánh d u
Câu ngôn hành Câu -thuy t
Câu ghép Câu &c bit
Câu
Phân i theo c u o
ng p
Phân i theo c ch n i
Câu 'n gi n Câu ph c
h%p
Câu tng thu t Câu nghi v n Câu c m thán Câu c u khi n
Nguyên nhân- k t qu Liên hoàn Nh%ng b -t(ng ti n
Câu i u kin-hqu
Có quan hqua l i Liên h%p
H)n h%p
Trang 7nghiên c u c a lu n án ch t p trung vào các d ng câu n Và theo quan i m c a các nhà nghiên c u ngôn ng h c trên thì cách phân lo i câu theo m c ích nói
T cách phân lo i theo m c ích nói nh trên và tiêu chí ng ngh a ( %c nh ngh a m c 2.2.1), các CT TNN %c xác nh trong các ti u lo i c a câu nghi v n (dùng câu t 'ng thu t) nh sau:
1) Câu nghi v n toàn b thì CT TNN là c m danh t
Ví d 2.2: Máy tính này h r"i à?
Ch ng c a cô nh th nào?
2) Câu nghi v n l a ch n thì CT TNN là c m danh t
Ví d 2.3: Ph n c ng h hay ph n m m h ?
Máy tính c a anh có h hay không?
3) Câu nghi v n b ph n thì CT TNN là c m danh t ho c c m ng t
Ví d 2.4: Tác gi cu n sách AI này là ai? Máy tính này v!n hành nh th nào?
V!n hành c a máy tính này nh th nào?
4) Câu nghi v n l a ch n b ph n thì CT TNN là c m danh t
Ví d 2.5: Anh mua sách AI hay sách PL?
Nh phân tích các ví d trên, c m danh t là CT TNN chi m t l cao h n c m t khác trong các ti u lo i c a câu nghi v n (dùng câu t 'ng thu t) H n n a, theo kh o sát th c nghi m c a lu n án trên 437 câu nghi v n và câu t 'ng thu t
Phân lo i theo c ch i
Trang 8chi ti t trong Ph l c F) thì CT TNN là c m danh t chi m 87,12% (còn c m ng t chi m 12,88%)
Xét v m t ngh a (By ban Khoa h c Xã h i Vi t Nam, 1983; Nguy#n Tài C&n, 1996), c m t là m t c u t o có tác d ng làm cho ngh a c a chính t( %c th c t i hoá, t c là có liên h v i th c t i Trong c m danh t , ngh a th c t i hoá là ngh a
v tính xác nh c a i t ng Còn trong c m ng t , c m tính t , thì ngh a th c t i hoá ch là ngh a v tính tình thái Nh v y, khi xác nh %c c m danh t thì
"ng th'i chúng ta c ng xác nh %c b n ch t ý ngh a c a s v t g)n v i c m danh t ó
V i s phân tích và nh n nh nh trên, lu n án ch t p trung nghiên c u các
c m danh t c tr ng ng ngh a cho câu
xác nh %c c m danh t c tr ng ng ngh a cho câu, quá trình th c hi n ph i phân o n câu thành các t v i s chú thích t lo i c a chúng D a vào
t lo i và c u t o c a m t c m danh t , quá trình ti p t c nh n di n các c m danh t trong câu (g i là c m danh t d tuy n) Ti p theo, quá trình ph i xác nh các
c m danh t c tr ng ng ngh a (CDT TNN) trong các c m danh t d tuy n
này d a trên c u trúc câu và t quan h gi a các c m danh t Nh v y, v m t
Các t có cùng m t nhãn t lo i thì có ngh a khái quát gi(ng nhau và c i m ng pháp gi(ng nhau Ví d :
- Tôi ã n c m - Tôi ang n c m
Qua nh ng ví d trên, có th nh n th y r ng các t n, n u, xét theo ngh a khái
Trang 9Các t ã, ang c ng rõ ràng là cùng m t lo i, và %c gán m t nhãn t lo i khác, so v i n và n u… S phân lo i các t theo t lo i là c!n thi t vì chúng óng góp
vào vi c xác nh ngh a c a câu C!n l u ý ba i u sau
Th nh t, ngh a khái quát c a t ti ng Vi t %c th hi n qua c i m ng pháp c a nó Nh ng c i m ng pháp y, trong m t ngôn ng n l p nh ti ng Vi t, không hi n hi n hình th c ng âm c a t mà ch y u kh n ng k t h%p c a nó v i t khác
Ví d : t n có ngh a v ho t ng không th ng sau t r t là t có ngh a v m c (không th nói "r t n c m"); nh ng t p có ngh a là v tính ch t thì có th dùng v i t r t (có th nói: "r t p")
Th hai, m t t là X có th có nh ng c i m ng pháp khác v i m t t là Y C n c vào nh ng c i m này, có th coi các t X và Y thu c hai t lo i khác nhau Nh ng gi a nh ng t y c ng có th có nh ng c i m gi(ng nhau C n c nh ng c i m này, l i có th coi t X thu c cùng m t t lo i v i t Y V y, ph i xét xem c i m nào là chính y u i u quan tr ng là không nên phân lo i mà phân lo i, nên th y r ng m c ích c a s phân lo i, nh ã nói, là bi t cách dùng t trong câu
Cu(i cùng, t ti ng Vi t có th thay Ci ngh a và "ng th'i thay Ci c i m ng pháp Ví d : t khó kh n có th có ngh a v tính ch t, và dùng %c v i t r t ("công vi c này r t khó kh n"); nó c ng có th có ngh a v s v t và dùng %c v i t nh ng ("nh ng khó kh n trong công vi c này") ó là hi n t %ng "chuy n
lo i" Trong ti ng Vi t, hi n t %ng này c!n %c chú ý, vì khá phC bi n
Tóm l i, v i quan i m này, có th phân các t c a ti ng Vi t thành tám t lo i
Lo i c m t do danh t làm chính t( g i là c m danh t Lo i c m t do ng t , tính t làm chính t( g i là c m ng t , c m tính t
Trang 10S c u t o nòng c(t (N) c a câu là N = a+b %c di#n ra qua hai b c: th nh t là b c dùng t c u t o thành c m t ; b c th hai là dùng c m t c u t o thành nòng c(t câu
Ví d : Nh ng ng 'i công nhân y ang xây d ng nhà máy p p c p p c p -a - -b - V i p là thành t( ph , c là thành t( chính
Trang 11Khi J.n n ph!n trung tâm 2 a 2 m danh t /c!n 26;/</phân bi t hai tr 'ng h%p:
- Ph!n trung tâm không ch a ph!n 56 /tr c - Ph!n trung tâm 23/ph!n 56 /tr c
B t c /danh t /8.o (danh t /tCng h%p, danh t /không tCng h%p, danh t /26/v t th … ) 1./b t c /c m danh t /8.o 2 ng u 23/th /gi /vai 4=K/46.nh t(/26Enh 2 a
Trong -;c 3/46A//2 m danh t /23/ph!n 56 /tr c, danh t /–/46.nh t(/26Enh ng /ph!n trung tâm Ki 6 i nh ng i u ki n ?67/ch t 26* Ch+ng 6 n 23/nh ng l p con danh t /26/23/th / ng /ph!n trung tâm sau m t danh t /26/-: i
b Ph n '( )tr c
Trong ph!n 56 /tr c 2 a 2 m danh t /23/th /"ng th'i 23/m t nhi u 46.nh t(
danh t /23/t(i a -./ba 1/4=E Trong th c t , ba 1/4=E/8.y 23/th / %c th /hi n b ng
1/4=E/8.o %c th /hi n ra
Ba 1/4=E/trong ph!n 56 /tr c 23/tr t t /r t Cn nh, 26;ng không th /chuy n
th 'ng g p 4i 1/4=E/8.y -./t /#$i F /4=E/li n ngay tr c t /26/xu t -./1/4=E/2 a t /
Trang 12CT TNN cho các lo i câu n ti ng Vi t là c m danh t c tr ng ng ngh a (do c m danh t bi u th ngh a v tính xác nh i t ng, và là c m t chi m s(
l %ng l n nh t trong ti ng Vi t "ng th'i, theo k t qu kh o sát th c nghi m c a lu n án v i trên 437 câu nghi v n và câu t 'ng thu t thì CT TNN là c m danh t chi m 87,12%, c m ng t chi m 12,88%) Vì v y ph m vi nghiên c u c a lu n
Vi t