Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt 03

12 477 6
Tài liệu đã được kiểm tra trùng lặp
Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt 03

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt

Trang 1

Ch ng 2

C S LÝ THUY T NGÔN NG TI NG VI T

2.1 Gi i thi u

Ch ng này trình bày các v n v ng pháp ti ng Vi t nh m ph c v vi c nghiên c u ph ng pháp rút trích c m t c tr ng ng ngh a cho câu ti ng Vi t Do ng pháp ti ng Vi t v n còn nhi u v n tranh lu n ch a t t i s nh t quán gi a các nhà ngôn ng h c nên chúng ta c ng còn nhi u khó kh n trong vi c t

Trang 2

ng hóa phân tích ti ng Vi t Trong ph m vi nghiên c u c a lu n án, ch ng 2 ch c p n các khái ni m, tính ch t, và quan i m chung c a các nhà ngôn ng h c, nh m xác nh rõ c s lý thuy t v ngôn ng ti ng Vi t ph c v cho m c tiêu c a lu n án

C th , ch ng 2 trình bày các v n nh th nào là c m t c tr ng ng ngh a cho câu ti ng Vi t, m c và tiêu chí ng ngh a c a CT TNN c ng nh t lo i, c m t và câu làm c s lý thuy t v ngôn ng h c cho ph ng pháp xác

nh c m t c tr ng ng ngh a cho câu ti ng Vi t

2.2 C s lý thuy t

2.2.1 C m t c tr ng ng ngh a

Trong ti ng Vi t, câu là n v nh nh t m nhi m ch c n ng thông báo tr n

v n thông tin b ng ngôn ng (Di p Quang Ban, 2004) T là n v nh nh t t thân có ngh a C m t là n v nh h n câu nh ng l n h n t v m t ý ngh a ng

pháp (câu > c m t > t ) Tuy không thông báo tr n v n n i dung thông tin

nh ng c m t có kh n ng d báo, nh h ng n i dung thông tin c a v n b n

Trong vi c nghiên c u v ngôn ng h c, các nhà nghiên c u u có m t quan i m chung v c u trúc cú pháp c a thành ph!n câu và ch c n ng chính ph c a

Qu$nh, 2001; Di p Quang Ban, 2004…) Thành ph!n câu là khái ni m chung c a nhi u ngôn ng , không nêu %c c thù t ng ngôn ng riêng bi t Tiêu chu&n phân nh thành ph!n câu %c d a vào quan h ý ngh a gi a các t trong câu và d a vào các c tr ng hình th c c a t trong câu

Trong m t câu nói cô l p, tách r'i tình hu(ng nói n ng, s có m t c a thành t( chính có tính ch t b)t bu c Thành t( chính gi vai trò quan tr ng v ng pháp (i v i c m t Thành t( chính là thành t( i di n cho toàn b c m t trong m(i liên h v i các y u t( khác n m ngoài c m t Do ó, ch c n ng cú pháp c a toàn b c m t trong ki n trúc l n h n s* g)n bó m t thi t v i vai trò cú pháp c a thành t( chính Trong quan h n i b c m t , thành t( chính chi ph(i t t c các thành t( tr c ti p ph thu c vào mình, nó quy t nh ch c n ng cú pháp c a t t c các

Trang 3

V ý ngh a, thành t( chính quy t nh kh n ng gia nh p các c u trúc l n h n

quy t nh kh n ng xu t hi n ki u thành t( ph Nh' ó chúng ta có th d a vào kh n ng xu t hi n c a các thành t( ph nh là d a vào m t d u hi u hình th c xác nh t lo i, ti u lo i và th m chí c ý ngh a c a l p t hay c a t gi vai trò thành t( chính

ngoài m t n i dung c a các câu bi u t (hay ngh a bi u th ), ây chính là c p ng ngh a c a t hay c m t m nhi m (nh m t c m t là c m danh t , c m ng t hay c m tính t ) (Cao Xuân H o, 1992) C p cao h n là nh n ra các

nh b i c m danh t (C m t c tr ng ng ngh a - CT TNN) và các m(i quan

h c a chúng

Ch+ng h n nh câu “cho bi t quê h ng c a Ch t ch H Chí Minh ?” N u xét c p ng ngh a c a c m t , quê h ng ch là m t c m danh t ch n i ch(n, và Ch t ch H Chí Minh c ng là c m danh t ch tên riêng Tuy nhiên, n u xét thêm m(i quan h c a chúng, thì quê h ng trong câu này ch n (i t %ng là

quê h ng c a Ch t ch H" Chí Minh ch không ph i c a ai khác; trong ó, c m

danh t Ch t ch H Chí Minh ch n (i t %ng là v Ch t ch H" Chí Minh c a chúng ta, nh ng (i t %ng Ch t ch H Chí Minh là (i t %ng ph trong câu ang

m t góc nhìn nh v y, ng ngh a câu, hay ng ngh a v n b n %c th hi n rõ nét và !y h n trong l nh v c x, lý ngôn ng t nhiên b ng máy tính.Vì v y, có

th nói, trong m t ph m trù nào ó, các CT TNN và các m i quan h c a chúng

t o thành n i dung n ng c t- ng ngh a c a m t câu hay m t v n b n

Câu th c hi n ch c n ng công c t duy, công c giao ti p thông qua ngh a

c a nó Ngh a c a câu không n gi n là m t phép c ng ngh a c a các t trong câu Ngh a c a câu là m t c u trúc có nhi u t!ng Các t!ng ngh a trong câu ph(i h%p v i nhau t o ra ngh a hình th c c a câu Ngh a c a câu có th th y trên b m t c a nó nh ng nhi u khi ch th y %c trong b sâu c a nó Nh ng dù là b m t (hi n ngôn) hay trong b sâu (hàm ngôn), ngh a câu ch có th là ngh a hình th c

Trang 4

khi câu có s ch Mu(n xác nh s ch c a câu thì ph i hi u s ch c a các thành ph!n t o câu và tình hu(ng c a phát ngôn Tách ra kh i câu, t ng v n có ngh a nh ng không có s ch (Cao Xuân H o, 1992)

Nh v y, m t i u không th ph nh n là trong m t câu có nh ng t , nhóm t

m nhi m ch c n ng chính c a vi c chuy n t i thông tin phát ngôn Thu t ng

Tiêu chí ng ngh a c a c m t c tr ng ng ngh a c a câu -./c m t xác

nh i t ng (s ch ) chính %c c p n trong thông tin c a câu.

Ví d 2.1: Máy tính này có dung l ng RAM l n nh t

0 ây, theo tiêu chí ng ngh a thì “dung l ng RAM l n nh t ” là c m t c tr ng ng ngh a cho câu Quan h thành ph!n gi a c m danh t “máy tính này” và c m danh t “dung l ng RAM l n nh t” cho phép xác nh (i t %ng chính %c

c p n trong thông tin c a câu là dung l %ng RAM l n nhât Vì dung l %ng RAM là dung l %ng c a m t thi t b b nh trong ( %c g i tên là RAM) c a máy tính (trong l nh v c chuyên bi t là máy tính), nên không c!n c m t “máy tính này” thì c m t “dung l %ng RAM l n nh t” c ng mang %c n i dung n"ng c(t (ng ngh a) c a câu ví d 2.1

Vi c nghiên c u c m t c tr ng ng ngh a có t!m quan tr ng cho vi c tìm

hi u thông tin c ng nh s, d ng chúng trong h th(ng ngôn ng C u t o c a c m t mang nh ng d u hi u t ó có th phân nh t lo i, ti u lo i c a t ( c

i m không bi n hình t c a ti ng Vi t) C u t o c a c m t giúp chúng ta n)m

Trang 5

l i nh rút g n câu, mô hình hoá câu, hay giúp cho vi c tìm hi u câu, v n b n

2.2.2 Câu

Câu -./ n 1/2 a nghiên c u ngôn ng /23/c u 4o ng /567p (bên trong 1./bên

, s / 7nh 9>7/2 a ng 'i 83i, ho c 23/th /?@m theo 467i , s / 7nh 9>7/2 a ng 'i

nh t chuy n t i m t thông tin tr n v n nh t b ng ngôn ng (Di p Quang Ban, 2004)

Theo quan i m c a Cao Xuân H o (1998), câu -./ n 1/c b n c a l'i nói, c a ngôn t , c a v n b n Nó là n v nh nh t có th s, d ng vào vi c giao t Nói cách khác, câu là ngôn b n (v n b n) nh nh t.

n v câu c ng %c chia thành nhi u d ng th c i m chung nh t c a nhi u quan ni m v ý ngh a ng pháp c a nhi u ngôn ng thì n v t , câu trong v n b n t!ng khái quát nh t T %c phân lo i thành danh t , ng t , tính t , i t , ph t , k t t , tr% t , c m t , và các ti u lo i c a chúng … nh quan i m c a các nhà ngôn ng h c (By ban Khoa h c Xã h i Vi t Nam, 1983) Câu %c phân lo i theo m c ích phát ngôn, c u trúc,… Nhi u quan i m v phân lo i câu ã

Theo quan i m H" Lê (1993), tác gi phân lo i câu nh sau:

Câu

Phân i theo c u o

ng p

Phân i theo c ch i

Câu p Câu - thuy t Câu g i tên

Câu tng thu t Câu nghi v n Câu c m thán Câu c u khi n

Câu –v Câu - ng Câu cách th c-hành ng

Câu i u kin-h qu

Trang 6

Theo quan i m Nguy#n Kim Th n và ng H u Qu$nh (2001), các tác gi phân lo i câu theo m c ích nói thì gi(ng v i quan i m c a H" Lê Tuy nhiên, cách phân lo i theo c u t o ng pháp l i khác, c th là:

Quan i m c a Cao Xuân H o (1992), phân lo i câu có th trình bày tóm t)t:

p

Phân i theo l!c ngôn trung và

Câu ch$ quá trình Câu ch$ tr ng thái

Câu ch$ quan hPhân i theo

l!c ngôn trung

Phân i theo ngh"a bi#u hin c a

khung v ng

Câu nghi v n

Câu tr n thu t có giá tr ngôn trung

%c ánh d u

Câu ngôn hành Câu -thuy t

Câu ghép Câu &c bit

Câu

Phân i theo c u o

ng p

Phân i theo c ch n i

Câu 'n gi n Câu ph c

h%p

Câu tng thu t Câu nghi v n Câu c m thán Câu c u khi n

Nguyên nhân- k t qu Liên hoàn Nh%ng b -t(ng ti n

Câu i u kin-hqu

Có quan hqua l i Liên h%p

H)n h%p

Trang 7

nghiên c u c a lu n án ch t p trung vào các d ng câu n Và theo quan i m c a các nhà nghiên c u ngôn ng h c trên thì cách phân lo i câu theo m c ích nói

T cách phân lo i theo m c ích nói nh trên và tiêu chí ng ngh a ( %c nh ngh a m c 2.2.1), các CT TNN %c xác nh trong các ti u lo i c a câu nghi v n (dùng câu t 'ng thu t) nh sau:

1) Câu nghi v n toàn b thì CT TNN là c m danh t

Ví d 2.2: Máy tính này h r"i à?

Ch ng c a cô nh th nào?

2) Câu nghi v n l a ch n thì CT TNN là c m danh t

Ví d 2.3: Ph n c ng h hay ph n m m h ?

Máy tính c a anh có h hay không?

3) Câu nghi v n b ph n thì CT TNN là c m danh t ho c c m ng t

Ví d 2.4: Tác gi cu n sách AI này là ai? Máy tính này v!n hành nh th nào?

V!n hành c a máy tính này nh th nào?

4) Câu nghi v n l a ch n b ph n thì CT TNN là c m danh t

Ví d 2.5: Anh mua sách AI hay sách PL?

Nh phân tích các ví d trên, c m danh t là CT TNN chi m t l cao h n c m t khác trong các ti u lo i c a câu nghi v n (dùng câu t 'ng thu t) H n n a, theo kh o sát th c nghi m c a lu n án trên 437 câu nghi v n và câu t 'ng thu t

Phân lo i theo c ch i

Trang 8

chi ti t trong Ph l c F) thì CT TNN là c m danh t chi m 87,12% (còn c m ng t chi m 12,88%)

Xét v m t ngh a (By ban Khoa h c Xã h i Vi t Nam, 1983; Nguy#n Tài C&n, 1996), c m t là m t c u t o có tác d ng làm cho ngh a c a chính t( %c th c t i hoá, t c là có liên h v i th c t i Trong c m danh t , ngh a th c t i hoá là ngh a

v tính xác nh c a i t ng Còn trong c m ng t , c m tính t , thì ngh a th c t i hoá ch là ngh a v tính tình thái Nh v y, khi xác nh %c c m danh t thì

"ng th'i chúng ta c ng xác nh %c b n ch t ý ngh a c a s v t g)n v i c m danh t ó

V i s phân tích và nh n nh nh trên, lu n án ch t p trung nghiên c u các

c m danh t c tr ng ng ngh a cho câu

xác nh %c c m danh t c tr ng ng ngh a cho câu, quá trình th c hi n ph i phân o n câu thành các t v i s chú thích t lo i c a chúng D a vào

t lo i và c u t o c a m t c m danh t , quá trình ti p t c nh n di n các c m danh t trong câu (g i là c m danh t d tuy n) Ti p theo, quá trình ph i xác nh các

c m danh t c tr ng ng ngh a (CDT TNN) trong các c m danh t d tuy n

này d a trên c u trúc câu và t quan h gi a các c m danh t Nh v y, v m t

Các t có cùng m t nhãn t lo i thì có ngh a khái quát gi(ng nhau và c i m ng pháp gi(ng nhau Ví d :

- Tôi ã n c m - Tôi ang n c m

Qua nh ng ví d trên, có th nh n th y r ng các t n, n u, xét theo ngh a khái

Trang 9

Các t ã, ang c ng rõ ràng là cùng m t lo i, và %c gán m t nhãn t lo i khác, so v i n và n u… S phân lo i các t theo t lo i là c!n thi t vì chúng óng góp

vào vi c xác nh ngh a c a câu C!n l u ý ba i u sau

Th nh t, ngh a khái quát c a t ti ng Vi t %c th hi n qua c i m ng pháp c a nó Nh ng c i m ng pháp y, trong m t ngôn ng n l p nh ti ng Vi t, không hi n hi n hình th c ng âm c a t mà ch y u kh n ng k t h%p c a nó v i t khác

Ví d : t n có ngh a v ho t ng không th ng sau t r t là t có ngh a v m c (không th nói "r t n c m"); nh ng t p có ngh a là v tính ch t thì có th dùng v i t r t (có th nói: "r t p")

Th hai, m t t là X có th có nh ng c i m ng pháp khác v i m t t là Y C n c vào nh ng c i m này, có th coi các t X và Y thu c hai t lo i khác nhau Nh ng gi a nh ng t y c ng có th có nh ng c i m gi(ng nhau C n c nh ng c i m này, l i có th coi t X thu c cùng m t t lo i v i t Y V y, ph i xét xem c i m nào là chính y u i u quan tr ng là không nên phân lo i mà phân lo i, nên th y r ng m c ích c a s phân lo i, nh ã nói, là bi t cách dùng t trong câu

Cu(i cùng, t ti ng Vi t có th thay Ci ngh a và "ng th'i thay Ci c i m ng pháp Ví d : t khó kh n có th có ngh a v tính ch t, và dùng %c v i t r t ("công vi c này r t khó kh n"); nó c ng có th có ngh a v s v t và dùng %c v i t nh ng ("nh ng khó kh n trong công vi c này") ó là hi n t %ng "chuy n

lo i" Trong ti ng Vi t, hi n t %ng này c!n %c chú ý, vì khá phC bi n

Tóm l i, v i quan i m này, có th phân các t c a ti ng Vi t thành tám t lo i

Lo i c m t do danh t làm chính t( g i là c m danh t Lo i c m t do ng t , tính t làm chính t( g i là c m ng t , c m tính t

Trang 10

S c u t o nòng c(t (N) c a câu là N = a+b %c di#n ra qua hai b c: th nh t là b c dùng t c u t o thành c m t ; b c th hai là dùng c m t c u t o thành nòng c(t câu

Ví d : Nh ng ng 'i công nhân y ang xây d ng nhà máy p p c p p c p -a - -b - V i p là thành t( ph , c là thành t( chính

Trang 11

Khi J.n n ph!n trung tâm 2 a 2 m danh t /c!n 26;/</phân bi t hai tr 'ng h%p:

- Ph!n trung tâm không ch a ph!n 56 /tr c - Ph!n trung tâm 23/ph!n 56 /tr c

B t c /danh t /8.o (danh t /tCng h%p, danh t /không tCng h%p, danh t /26/v t th … ) 1./b t c /c m danh t /8.o 2 ng u 23/th /gi /vai 4=K/46.nh t(/26Enh 2 a

Trong -;c 3/46A//2 m danh t /23/ph!n 56 /tr c, danh t /–/46.nh t(/26Enh ng /ph!n trung tâm Ki 6 i nh ng i u ki n ?67/ch t 26* Ch+ng 6 n 23/nh ng l p con danh t /26/23/th / ng /ph!n trung tâm sau m t danh t /26/-: i

b Ph n '( )tr c

Trong ph!n 56 /tr c 2 a 2 m danh t /23/th /"ng th'i 23/m t nhi u 46.nh t(

danh t /23/t(i a -./ba 1/4=E Trong th c t , ba 1/4=E/8.y 23/th / %c th /hi n b ng

1/4=E/8.o %c th /hi n ra

Ba 1/4=E/trong ph!n 56 /tr c 23/tr t t /r t Cn nh, 26;ng không th /chuy n

th 'ng g p 4i 1/4=E/8.y -./t /#$i F /4=E/li n ngay tr c t /26/xu t -./1/4=E/2 a t /

Trang 12

CT TNN cho các lo i câu n ti ng Vi t là c m danh t c tr ng ng ngh a (do c m danh t bi u th ngh a v tính xác nh i t ng, và là c m t chi m s(

l %ng l n nh t trong ti ng Vi t "ng th'i, theo k t qu kh o sát th c nghi m c a lu n án v i trên 437 câu nghi v n và câu t 'ng thu t thì CT TNN là c m danh t chi m 87,12%, c m ng t chi m 12,88%) Vì v y ph m vi nghiên c u c a lu n

Vi t

Ngày đăng: 07/11/2012, 12:13

Tài liệu cùng người dùng

Tài liệu liên quan