Khi biểu diễn ngữ nghĩa của một câu hay một mệnh dé, chúng ta phải xác định được vị từ tương ứng với thành phan trung tâm của câu hay mệnh dé, vai nghĩacủa các thành phần bổ nghĩa cho th
Trang 1ĐẠI HỌC QUOC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
LÊ VĂN CƯƠNG
CHO VIỆC XỬ LÝ NGÔN NGỮ TỰ NHIÊN
LUẬN VĂN THẠC SĨ NGÔN NGỮ HỌC
Hà Nội - 2024
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
LÊ VĂN CƯƠNG
Chuyên ngành Ngôn ngữ học
Mã số: 8229020.01
LUẬN VĂN THẠC SĨ NGÔN NGỮ HỌC
Người hướng dẫn khoa học: TS Nguyễn Thị Minh Huyền
Hà Nội - 2024
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Nghiên cứu biểu điên ràng buộc cu pháp — ngữ
nghĩa của một so động từ cho việc xử ly ngôn ngữ tự nhiên” là công trình nghiên
cứu của riêng tôi, kêt quả nghiên cứu được trình bày trong luận văn này là xác thực,
chưa từng được công bố ở bất kỳ công trình nào khác
Ha Nội, ngày 9 tháng 5 năm 2024
Tác giả luận văn
Lê Văn Cương
Trang 4LOI CAM ON
Đề hoàn thành luận văn này, tôi đã nhận được sự giúp đỡ, động viên, khích
lệ của thầy cô cũng như bạn bè, người thân
Trước tiên, tôi xin chân thành cảm ơn TS Nguyễn Thị Minh Huyền đã nhiệttình hướng dẫn và chỉ bảo tôi hoàn thành tốt luận văn này
Nhân đây, tôi cũng xin chân thành cảm ơn các thầy cô trong Khoa Ngôn ngữhọc - Trường Đại học Khoa học Xã hội và Nhân văn - Đại học Quốc gia Hà Nội đã
truyền đạt cho tôi kiến thức và tạo điều kiện học tập cho tôi trong suốt thời gian tôi
học ở trường Bên cạnh đó, tôi cũng xin gửi lời cảm ơn tới các thầy cô trong KhoaToán - Cơ - Tin học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
Sau cùng, tôi cũng xin cảm ơn gia đình, bạn bẻ, những người đã động viên
khích lệ và tao mọi điều kiện tốt nhất dé tôi có thé hoàn thành luận văn này
Học viên
Lê Văn Cương
Trang 5MỤC LỤCLỜI CAM ĐOAN
LOI CAM ON
MỤC LUC 2 ecccccccssccessccesssecesscceessececssecessecceseecesseecessececssecesseceesesesseeeens 1
DANH MỤC CAC CHU VIET TẮTT 2-5 +S£2E£+EE£EE£EEE2EE£EEeEEerEerrkrrkerkeee 3
DANH SÁCH BANG BIỂU 2-2-5221 ‡EEEE2E1221271711211211271 21.21 1E xe 4
DANH SÁCH HÌNH -2 ©2222E2EE9EE1E221271127117112711111211 11.11 xee 5
96271172257 -:: 6
1 Tổng quan tình hình nghiên Cứu - 2 ¿+ s+EE2+EE+E£+E£+E££Ee£Eerkerezrezrezsez 7
2 Mục đích và nhiệm vụ nghién CỨU - - + 23c 3+ ‡***‡EESseESeeerseeereeserreere 9
3 Đối tượng và phạm vi nghiên cứu - s¿+5e+2++x+£xt£E+EEerxerkerrkerserxees 9
4 Phương pháp và quy trình nghiên CỨU 5 SE #vEEeEreessersrsersre 9
5 Ý nghĩa của luận văn - 2-5 ©s£+E2EE£EEEEEEEE1211271711211211 1111.211111 10
6 Bồ cục của luận VĂI - ¿+ 211 1E 1322331111111 833311 11119930111 kg 1 key 11
CHƯƠNG 1 KIÊN THỨC CƠ SỞ -.2-2¿ 22 ©2+22E22EE2EEtEEEerkesrxrrrrees 12
1.1 Một số vấn đề về động từ ¿5252 2 2E1271212112117121211 211 11x 121.2 Một số vấn đề về vai nghĩa - 2 2+2 £+EE£EE+EE£EEEEEEEEEEEEEEEEEEErkrrkerreee 18
1.3 /-i0 0 24
1.4 Từ điển tiếng Việt dành cho máy tính (VCLL) -2- 2-52 5z+sz+s+s>sz+z 251.5 TreeBank tiếng Việt (ViettreeBAnk) cccsescsesssesssesssssesssesssecsssssesssecssecstssseessecs 28
CHUONG 2 MÔ HÌNH VIVERBNET 2-2222 SEcSEEc2EEeEExerkrrrkerrreee 30
PO Vad mghia a Ô 30
2.2 Khung CU 01117 36
2.3 Rang bUGC CU Phap 0n 38
2.4 Rang bu6c ngtt nghia ri (ca 4I
Trang 6CHƯƠNG 3 KHẢO SÁT NGHĨA CON VÀ KHUNG CÚ PHÁP CỦA ĐỘNG
TỪ DỰA VÀO VCL, VÀ V'TE - 2 2+2s Ex EE2E2E127171711211211 1121.211 x ke 49
3.1 Tiêu chí lựa chọn động tỪ - - + +1 + 1123119111 11911 111g ng ng grry 49
3.2 Phương pháp khảo sát nghĩa con và khung cú pháp động từ dựa vào VCL và
1 51
3.3 Khao sát nghĩa con và khung cú pháp động từ trong VCL va VTB 53
Chương 4 NGHIEN CUU BIEU DIEN RANG BUỘC CU PHAP VÀ NGỮ
NGHĨA CAC ĐỘNG TU “đi”, “đánh”, “Cho” .c.cccccccsssessesseessesssessseeseeees 70
4.1 Biểu diễn ràng buộc cú pháp eeccecceccecscssesssesessessesssessessessessssssesseesesstessesseesees 71
4.2 Biểu diễn ràng buộc ngữ nghĩa - 2-5552 EEEEEE2 2221212 erkrrrrer 75
CONG TRÌNH ĐÃ CÔNG BÓ - c cntnnhhtrrrrrrrrrrrre 93
TÀI LIEU THAM KHẢO -2- 2 2S SE2E2EE2EEEEE2E12E122121 21121121 cre, 94
NGU LIỆU 2-55 SSSE2EEEE2E23212212212112112111211211211111111.11 1.111 y 98
10800 90 99
Trang 7DANH MỤC CÁC CHỮ VIET TAT
NLP Natural Language Processing
Xử lý ngôn ngữ tự nhiên
VCL Vietnamese Computational Lexicon
Từ điển tiếng Việt dành cho máy tinh
viVerbNet Mạng ngữ nghĩa động từ dành cho tiếng Việt
VTB Vietnamese Treebank
Ngân hang câu tiếng Việt được chú giải cú pháp
Trang 8DANH SÁCH BANG BIEU
Bảng 1.1: Một lớp động từ trong VerbiNet -. Sc s3 neirerrexee 24
Bảng 1.2: Nghĩa của từ “yêu” (love) trong VCL 5c +ss*s++ssseeeeeeesesee 26
Bảng 2.1: Phân biệt dest, dest_conf, dest_dir, đr - 5+5 s << ++ecs+eesexs 45
Bang 3.1: Mô tả tính toán độ tương tự nghĩa cON - 5 5 55 + s sisireerree 53
Bang 3.2: Nghĩa con động từ của từ "di" trong VCL - 55555 s+xcsssecsees 55
Bảng 3.3: Phan bố và tần suất xuất hiện các nghĩa con cua từ động từ “di” trong
ai 57
Bảng 3.4: Các lớp động từ trong VerbNet tương đương với các nghĩa con động
"0 :-a AAA Ẽ.ăäăäă 58
Bang 3.5: Khung cú pháp động từ “đi” trong viVerbiNet <ccs<cc+s 59
Bang 3.6: Nghia con động từ cua từ "danh" trong VC 555 ++*csc+ 60
Bảng 3.7: Phân bố và tần suất xuất hiện các nghĩa con của từ động từ "đánh" trong
2i Ô 62
Bảng 3.8: Các lớp động từ trong VerbNet tương đương với các nghĩa con động
Bảng 3.9: Khung cú pháp động từ “đánh” trong viVerbNet -‹ -‹+- 64
Bảng 3.10: Nghĩa con động từ của từ “cho” trong VC -s<+<<s++ss2 65
Bảng 3.11: Phân bố và tần suất xuất hiện các nghĩa con của từ động từ “cho”
trong VITT -c cọ TT ch 66
Bang 3.12: Các lớp động từ trong VerbNet tương đương với các nghĩa con từ “cho” 67
Bang 3.13: Khung cú pháp động từ “cho” trong vIVerbiNet « «+- 68
Trang 9DANH SÁCH HÌNH
Hình 0.1: Quy trình làm vVIỆC - 5 2c 321132111 1111351111111 1 1E rrrkre 10
Hình 1.1: Biểu diễn ràng buộc ngữ nghĩa của nghĩa con đi (5) trong VCL 28Hình 2.1: Cây ràng buộc ngữ nghĩa của VerbNet tiếng Anh - 43
Hình 2.2: Rang buộc ngữ nghĩa cho lớp send- Ï Ï Í ¿- - +s+c+c+esrsrerererxes 44
Hình 2.3: Cây phân cấp các ràng buộc vai nghĩa dành cho giới từ miêu tả không
SVAN oe 45
Hình 3.1: Sơ đồ các bước đánh giá độ tương tự các nghĩa con động từ 51
Trang 10MỞ DAU
Cùng với sự phát triển như vũ bão của khoa học công nghệ, nhu cầu về xử lý
ngôn ngữ tự nhiên trong lĩnh vực trí tuệ nhân tao (Artificial Intelligence) cũng ngày
càng gia tăng Ngôn ngữ là phương tiện giúp mã hóa thông tin, biểu đạt và lưu giữtri thức, kinh nghiệm của con người Xử lý ngôn ngữ tự nhiên (NLP) liên quan đếnkhả năng tự động hiểu và tạo sinh ngôn ngữ
Việc hiểu tự động văn bản viết bang ngôn ngữ tự nhiên đòi hỏi phải có cácphương pháp giải quyết các bài toán phân tích ngôn ngữ ở các tầng bậc khác nhau
như phân tích hình thái, phân tích cú pháp, phân tích ngữ nghĩa, phân tích ngữ
dung, Phân tích và biéu diễn ngữ nghĩa là một chủ đề nghiên cứu day thách thức
và có tính thời sự Các hội nghị khoa học thường niên hàng đầu trong lĩnh vực xử lýngôn ngữ tự nhiên trên thé giới trong những năm gần đây luôn có các hội thảo
chuyên đề về vấn dé này như hội thảo DMR! (Designing Meaning Representation),ISA’ (Interoperable Semantic Annotation)
Khi biểu diễn ngữ nghĩa của một câu hay một mệnh dé, chúng ta phải xác
định được vị từ tương ứng với thành phan trung tâm của câu hay mệnh dé, vai nghĩacủa các thành phần bổ nghĩa cho thành phần trung tâm, và các ràng buộc cú pháp -
ngữ nghĩa của các thành phần này Các ràng buộc ngữ nghĩa giúp quy định đặcđiểm ngữ nghĩa của các hiện tượng, sự vật đảm nhiệm vị trí vai nghĩa trong câu
Còn các ràng buộc cú pháp giúp quy định khả năng kết hợp và thứ tự của các thành
tố ngữ pháp trong câu Một trong những tài nguyên vô cùng quan trọng cho xử lý
ngữ nghĩa trong ngôn ngữ tự nhiên chính là kho từ vựng bao hàm các đặc tả ràng
buộc cú pháp - ngữ nghĩa cho các tham thé gắn với từng đơn vị từ vựng có thé đóng
vai trò vi từ trung tâm.
Các ràng buộc cú pháp và ngữ nghĩa ở các ngôn ngữ luôn có những đặc điểm
tương đồng và khác biệt, phụ thuộc vào cách tri nhận thế giới của người bản ngữ và
các đặc trưng ngữ pháp của ngôn ngữ Luận văn này tập trung vào vấn đề xây dựng
Ị https://dmr2024.github.1o/index.html
? https://sigsem.uvt.nl/isa20/
Trang 11mô tả vai nghĩa và các ràng buộc cú pháp và ngữ nghĩa của các thành phần bé nghĩa
cho vị từ trung tâm trong câu tiếng Việt trên quan điểm đối sánh với tiếng Anh
Trong phần mở đầu này, luận văn sẽ giới thiệu tổng quan tình hình nghiêncứu trước khi đi vào giới thiệu mục tiêu và nội dung nghiên cứu cụ thể
1 Tổng quan tình hình nghiên cứu
Trên thế giới đã có nhiều nghiên cứu xây dựng các tài nguyên từ vựng cungcấp các thông tin về quan hệ và ràng buộc cú pháp - ngữ nghĩa phục vụ cho xử lý
ngôn ngữ tự nhiên Có thé kế đến một số tài nguyên tiêu biểu cho tiếng Anh như
WordNet [33], FrameNet [25], VerbNet [28].
WordNet? là tài nguyên từ vựng tiếng Anh lớn gồm 117.000 synset (tdp hợpnghĩa) Các synset này được liên kết với nhau bằng quan hệ ngữ nghĩa như đồng
nghĩa, trái nghĩa, thượng danh, hạ danh, WordNet là một tài nguyên từ vựng cực
kì hữu ích trong việc phân tích nghĩa và liên kết nghĩa
FrameNet* là một kho ngữ liệu gồm hơn 13.000 đơn vi từ vựng kèm theo
khung ngữ nghĩa Hơn 200.000 câu được chú giải thủ công với hơn 1.200 khung
ngữ nghĩa vị từ trong FrameNet cung cấp một tập ngữ liệu đào tạo cho nhiều ứngdụng dịch máy, phân tích nghĩa, trích xuất thông tin,
VerbNet” là tài nguyên từ vựng tiếng Anh cung cấp các thông tin về khung
cú pháp, biểu diễn vai nghĩa, ngữ nghĩa và các ràng buộc cú pháp — ngữ nghĩa của
9344 động từ được phân loại thành 329 lớp con” Tài nguyên từ vựng này có liên
kết với các nguồn tài nguyên từ vựng khác như WordNet, FrameNet VerbNet được
sử dụng rộng rãi trong các kho văn bản có chú giải ngữ nghĩa, phục vụ các ứng
dụng về biểu diễn và phân tích ngữ nghĩa của ngôn ngữ tự nhiên
Đối với tiếng Việt, Từ điển tiếng Việt dành cho máy tính” (VCL) [2] là một
tài nguyên từ vựng máy tính gồm có 42.000 mục từ vựng VCL có mô tả về từ loại
Trang 12gắn với từng nghĩa con của mỗi mục từ Đối với các động từ có thê làm vị từ trung
tâm, VCL có chứa thông tin về các khung vị từ, vai nghĩa và một số ràng buộc ngữ
nghĩa, ngữ pháp Tuy nhiên các thông tin này còn chưa đầy đủ, cũng chưa có phânlớp các động từ theo các ràng buộc về nghĩa Do vậy, có thé nói là tiếng Việt chưa
có một tài nguyên từ vựng nao tương đương với VerbNet dé phục vụ cho phân tích
ngữ nghĩa sâu ngôn ngữ tự nhiên Việc xây dựng một mạng động từ dành cho tiếngViệt với các thuộc tính tương đương với VerbNet tiếng Anh là cấp thiết và có ý
nghĩa thực tiễn cao.
Mặc dù từ điển VCL đã có nhiều thông tin cơ bản và quan trọng về ngữ pháp
và ngữ nghĩa, việc xây dựng một mạng ngữ nghĩa như VerbNet là điều không hềđơn giản Do ngữ pháp tiếng Việt và tiếng Anh có rất nhiều sự khác biệt, không thê
sử dụng hoàn toàn các biểu diễn của VerbNet tiếng Anh cho tiếng Việt Bên cạnh
đó, việc tri nhận về sự vật, sự việc, hiện tượng giữa tiếng Anh và tiếng Việt cũng cónhiều sự tương đồng và khác biệt nên các ràng buộc về ngữ nghĩa của của hai ngônngữ cũng có sự khác biệt Ví dụ như khi sử dụng giới từ, tiếng Anh sử dụng giới từ
“in” trong câu “There are a lot of cloud in the sky”, tiếng Việt lại sử dụng giới từ
“trên”, cụ thé hơn trong câu “Có nhiều mây trên bau trời ”
Việc xây dựng mạng động từ cho tiếng Việt (viVerbNet) đã được các tác giảbước đầu xây dựng từ năm 2020 [5][30] Nhóm tác giả đã trích rút 6652 động từ củaVCL, sử dụng thuật toán phân cum dé chia các động từ nay thành 1000 nhóm có độ
tương đồng ngữ nghĩa caoŸ Sau đó, các tác giả trích ra 100 nhóm dé khảo sát, xây
dựng khung cú pháp ngữ nghĩa dựa trên cơ sở đối chiếu với các nhóm động từ
tương đương của VerbNet Tuy nhiên, nghiên cứu này vẫn chưa có đầy đủ các mô
tả chi tiết của các ràng buộc ngữ nghĩa và cú pháp cụ thé cho từng lớp động từ tiếng
Việt.
Từ tình hình nghiên cứu trên, vấn đề đặt ra đối với luận văn này là đóng góp
vào việc xây dựng các mô tả ràng buộc cú pháp — ngữ nghĩa cho các lớp động từ
8 Mỗi động từ có một biểu diễn véc-tơ (word embedding) được xác định dya vào tat cả các ngữ cảnh của từ
đó trong một kho văn bản kích thước lớn Độ tương đông ngữ nghĩa giữa 2 từ được tính dựa trên khoảng cách của các véc-tơ này.
Trang 13trong viVerbNet.
2 Mục đích và nhiệm vụ nghiên cứu
Mục đích cụ thê của luận văn là nghiên cứu biểu diễn ràng buộc cho một sỐđộng từ tiếng Việt dựa trên các đặc trưng về cú pháp tiếng Việt, kết hợp với việc đối
chiếu với các ràng buộc cú pháp - ngữ nghĩa của các động từ tiếng Anh tương
đương trong VerbNet nhằm thuận tiện trong việc chia sẻ các tài nguyên
Với mục đích nghiên cứu đã được đặt ra như trên, luận văn cần phải thực
hiện được một số nhiệm vụ sau:
- Trích xuất các khung cú pháp từ văn bản tiếng Việt phục vụ cho việc biểu
diễn ràng buộc cú pháp và ngữ nghĩa cho các động từ đại diện một số lớp
động từ cơ bản.
- _ Xây dựng bộ nhãn ràng buộc cú pháp - ngữ nghĩa của viVerbNet dựa trên co
sở đối chiếu và ánh xạ với VerbNet
3 Đối tượng và phạm vi nghiên cứu
Trong khuôn khổ luận văn, học viên lựa chon ba động từ làm đại diện cho balớp động từ có khung cú pháp tiêu biểu là động từ nội động (intransitive), động từ
ngoại động đơn (monotransitive), động từ ngoại động kép (ditransitive) - bao ham các động từ trao nhận Ba động từ được chon là “đi”, “đánh” và “cho” Cac động
từ này đều là những động từ có nhiều nghĩa con cần được khảo sát
4 Phương pháp và quy trình nghiên cứu
Bên cạnh các phương pháp nghiên cứu chung như phân tích tài liệu, liệt kê,
luận văn còn sử dụng các phương pháp nghiên cứu sau:
- Phuong pháp mô tả: Được sử dụng dé mô tả khung cú pháp và quan hệ cú
pháp của đối tô và vị tố là động từ chính của câu, đồng thời mô tả các ràngbuộc về cú pháp và ngữ nghĩa trong câu đó
- Phương pháp đối chiếu: Luận văn sẽ đối chiếu tiếng Anh và tiếng Việt trên
hai bình điện chính: ngữ pháp và ngữ nghĩa Về ngữ pháp, luận văn đối chiếu
các đặc điểm tương đồng và khác biệt trong ngữ pháp tiếng Anh và tiếng
Việt Vê ngữ nghĩa, luận văn đôi chiêu các đặc điêm tri nhận về sự vật, hiện
Trang 14tượng giữa hai ngôn ngữ Anh và Việt.
- Phuong pháp anh xạ: viVerbNet được xây dựng dựa trên khung mô hình của
VerbNet nên việc đảm bảo tính tương thích được đặt lên hàng đầu để đảmbảo việc chia sẻ và khai thác các tai nguyên về sau được diễn ra thuận lợi.Chính vì vậy mà việc ánh xạ các thông tin về sự tương đồng trong biêu diễnràng buộc cú pháp và ngữ nghĩa giữa tiếng Anh và tiếng Việt rất được chú
trọng Các đặc điểm khác biệt sẽ được biểu diễn tương thích với mô hình
VerbNet.
Ngoài ra, luận văn còn sử dụng các ứng dụng của khoa hoc công nghệ ma
đặc biệt là ngành khoa học dữ liệu trong việc đánh giá độ tương tự của các động từ
trong ngữ cảnh cụ thé Sơ đồ trong Hinh 0.1 biểu diễn quy trình thực hiện nghiên
Luận văn sẽ khảo sát các nghĩa con động từ được trích xuất từ VCL trên cơ
so so sánh độ tương tự với các động từ được trích xuất từ kho đữ liệu được gánnhãn cú pháp VietTreebank (V7B) Sau đó, phân loại về nghĩa con và trích xuất cáckhung cú pháp động từ Cuối cùng, biểu diễn các ràng buộc cú pháp và ràng buộc
ngữ nghĩa trên cơ sở ngữ pháp tiếng Việt kết hợp với việc ánh xạ từ VCL vàVerbNet tiếng Anh
5 Ý nghĩa của luận văn
Luận văn này có ý nghĩa quan trọng trong việc xây dựng biểu diễn ràng buộc
cú pháp và ngữ nghĩa phù hợp với các đặc điêm của tiêng Việt có đôi chiêu với
10
Trang 15tiếng Anh, phục vụ cho các ứng dụng xử lý ngôn ngữ tự nhiên.
Ngoài ra, sau khi hoàn thiện, viVerbNet có thể được ứng dụng vảo trong việcgiảng dạy tiếng Việt dành cho người nước ngoài Do các lớp động từ được liên kết
với nhau về ngữ nghĩa va cú pháp nên khi người học biét được cách sử dụng một
động từ sẽ có thể biết được cách sử dụng của tất cả động từ cùng nhóm
6.
sau:
Bô cục của luận văn
Ngoài các phan mở đâu, kết luận, nội dung của luận văn gôm ba chương như
Chương 1 Kiến thức cơ sở: Trinh bày khái niệm động từ, các cách phân loạiđộng từ; khái niệm vai nghĩa, các cach phân loại vai nghĩa; một sỐ thông tin
về các nguồn tài nguyên như VerbNet, VCL, VTB
Chương 2: Mô hình viVerbNet: Trình bày một số thay đổi trong cách biểudiễn các thành phan của viVerbNet so với VerbNet tiếng Anh
Chương 3 Khảo sát nghĩa con và khung cu pháp cua động từ dựa vào VCL
va VTB: Chương này sẽ nghiên cứu về các nghĩa con của ba động từ “di”,
“đánh” và “cho” Sau đó trích xuất và mô tả các khung cú pháp của các
động từ nay.
Chương 4 Nghiên cứu biểu diễn ràng buộc cú pháp và ngữ nghĩa cho động
từ tiếng Việt: Trình bày về biểu diễn ràng buộc cú pháp và ràng buộc ngữ
nghĩa cho các động từ “di”, “đánh” và “cho”.
11
Trang 16Chương 1 KIÊN THỨC CƠ SỞ
hạt nhân ngữ nghĩa của câu (có vị ngữ), giúp kết nối các thành phần tham tố tham
gia vào việc biêu diễn ngữ nghĩa của một câu Theo đó ngữ nghĩa của một câu đượcbiểu diễn dựa vào mối quan hệ của vị từ đối với các tham tô xung quanh nó
Vị từ là những từ có thể trực tiếp làm vị ngữ trong câu, nó là động từ, tính từ
và thậm chí là một danh từ Nghiên cứu về viVerbNet sẽ tập trung chủ yếu vào động
từ, và mỗi quan hệ ngữ nghĩa của chúng đối với các vai nghĩa
Về khái niệm động từ, có rất nhiều định nghĩa xoay quanh khái niệm này
Theo Từ điển tiếng Việt của Hoàng Phê, động từ là “tr chuyên biểu thị hành động,
trạng thái, hay qua trình, thường làm vị ngữ trong cau” [18, tr 346] Định nghĩa
này được học viên nhận định là định nghĩa khái quát nhất về động từ và nhận được
sự tán thành của rất nhiều nhà nghiên cứu khác
Trong cuốn Ngữ pháp tiếng Việt (từ loại) tac giả Dinh Văn Đức đã định
nghĩa: “Đồng từ chỉ các hành động (tôi chạy, nó đọc); trạng thải (tôi ngủ, nó thức),
các liên hệ dưới dạng tiễn trình (tôi yêu quê hương, tôi hiểu bạn bè) có moi quan hệvới chủ thể và diễn ra trong một khoảng thời gian” [1, tr 127]
Cùng chung quan điểm như vậy, tác giả Diệp Quang Ban và Hoàng VănThung (Ngữ pháp tiếng Việt (tập 1)) cũng đã cho rằng: “Động từ là những từ biểu
thị ý nghĩa khái quát về quá trình — ý nghĩa quá trình thể hiện trực tiếp đặc trưngvận động của thực thể Đó là ý nghĩa hành động, ý nghĩa trạng thái được khái quát
12
Trang 17hóa trong mối liên hệ với vận động của thực thể trong thời gian và không gian ” [4,
tr 90].
Các quan điểm về định nghĩa động từ của các nhà ngôn ngữ học ở Việt Nam
có độ tương tự rất cao Chúng ta có thể nói một cách ngắn gọn lại như sau: Động tu
là từ dùng để biểu thị hành động, trạng thái, hay quá trình của một sự vật, hiện
Theo quan điểm phân loại của Diệp Quang Ban trong cuốn Ngữ pháp tiếng
Việt (tập 1): “việc phân loại phải dựa vào khả năng kết hợp của động từ với nhóm
từ tình thái có tác dụng “dạng thức hóa” động từ và khả năng kết hợp với các thực
từ biểu thị nội dung “chỉ phối của động từ, hoặc biểu thị nội dung đòi hỏi của động
+ Ý nghĩa tình thái về sự cần thiết: “cẩn”, “nên”, “phải ”,
+ Ý nghĩa tình thái về khả năng: “có thé”, “không thể”, “chưa thể”,
Id 66 ^ 66 ”
+ Chỉ ý nghĩa tình thái về ý chí: “toan”, “định”, “no”, “dám ”,
+ Chỉ ý nghĩa tình thái mong muốn: “mong muốn”, “wóc”, “mong ước”,
“ước muốn ””,
+ Chỉ tình thái tiếp thụ, chịu đựng: “bi”, “mắc”, “phải”, “được ”,
+ Chỉ ý nghĩa tình thái đánh giá nhận định: “cho”, “xem”, “thấy”,
- Nhóm động từ quan hệ:
N99 66
+ Chi quan hệ đồng nhất hiểu rộng: “/a”, “lam”
13
Trang 18“ 3
+ Chỉ quan hệ tồn tại (xuất hiện, ton tại hoặc tiêu biểu): “co”, “con”,
“biến”, “mắt”, “sinh” (ra)
+ Chỉ quan hệ sở hữu: “có ”
+ Chỉ quan hệ biến hóa: “hành”, “hóa”, “hóa ra”, “hóa thành”, “trở
thành ”,
r 99
+ Chỉ quan hệ diễn biến theo thời gian: “bat dau”, “tiếp tục”, “kết thúc”,
+ Chỉ quan hệ so sánh, đôi chiêu: “giống”, “khác”, “như”, “tựa”, “in”,
“hãy”, “đừng”, “chớ” và với “quá”, “lắm”; (2) — không kết hợp được với
“rất”, “hơi”, “khá”: “viết, “đánh”, “di”, “làm”, Động từ chỉ hành độngcòn kết hợp được với “xong”: “nói”, “nghe”, “suy nghĩ”, “sửa chữa ”,
+ Nhóm động từ chỉ trạng thái: những động từ kết hợp được với “hay”,
lê bì
“đừng”, “chớ”; với “lam”, “qua” và với “rat”, “hơi”: “yêu”, “ghét”,
r A22
“thương”, “giận”, ; những động từ kết hợp được với “xong”: “thay”,
“hiểu”, “moi”, “biết ”,
Các nhóm động từ phân loại theo các thực từ đi kèm:
+ Nhóm động từ không doi hỏi thực từ đi kèm: “noi”, “cười”, “khóc”,
,
“ngồi”, “đứng”, “bò”, thường chỉ hành động cơ thể (vận động sinh lý)
hoặc chỉ trạng thái tâm lý Những động từ này được gọi là động từ nội động.
+ Nhóm động từ có thực từ đi kèm biểu thị đối tượng tác động: “đánh”
(giặc) “trồng” (cây), “viết” (báo) Nhóm động từ nay còn được gọi là
động từ ngoại động.
+ Nhóm động từ có hai thực từ đi kèm biểu thị đối tượng phát/nhận và đối
tượng được lợi hay bị thiệt hại do tác động của hành động nêu ở động từ:
14
Trang 19“cho” (em) (một gói qua), “gửi” (bạn) (một bức thw), Day cũng là những động từ ngoại động.
+ Nhóm động từ có hai thực từ đi kèm biểu thị đối tượng sai khiến và nộidung sai khiến: “nhờ” (bạn) (xách nước), “bảo” (con) (hoc), “cử” (người)(tiép khách) Là những động từ khiến động thuộc lớp ngoại động
+ Nhóm động từ có thực từ đi kèm chỉ hướng dời chuyền hoặc hướng kết nối
của hành động nêu ở động từ; hoặc chỉ dời chuyển của hành động, hoặc nêuđối tượng bị tác động dời chuyên: “lăn” (vào), “chạy” (ra), “di” (xuống),
“buộc ” (vào), “cởi thảo ” (ra), “chạy” (ra pho), “lên ” (gác), “ra” (phô)
Động từ nội động: “ngủ”, “tam”, “cười ”,
Động từ cảm nghĩ: “nghe”, “ biết”, “tin”,
Động từ phương hướng: “di”, “chạy”, “học”,
động từ đó theo lớp, loạt mà nó có quan hệ và đưa ra phân loại động từ thành một số
tiêu loại cơ bản như:
Trang 20- Cac động từ tong hop: “di đứng”, “nói năng”, “chờ đợi”, “bai cãi”, “trò
chuyện ”, “viết lách ”, “dàn xếp "
- Cac động từ chuyền động: “di”, “chạy”, “trượt”, “lướt”,
[7 tr 136-143]
Cao Xuân Hạo (2006) đã áp dụng các quan điểm các các nhà ngôn ngữ như
L Tesniére, C.J Fillmore, W.L Chafe, S.C Dik, M.A.K Halliday, v.v dé phanbiệt các sự tinh trong tiếng Việt Ong đã áp dụng các tiêu chí co ban của Dik déphân loại sự tình Tuy nhiên có bé sung thêm sự tình /7ồn tai] ngang hàng với các
sự tình cơ bản là /Bién cd] và [Tình hình] Cách phân loại sự tình nay cũng làmhình thành lên các kiểu câu khác nhau: Câu tồn tại, câu chỉ hành động (vô tac,
chuyển tác), câu chỉ quá trình (vô tác, chuyển tác), câu chỉ trạng thái, câu chỉ quan
hệ Từ đó có thê suy ra được các nhóm vi từ đặc trưng cho từng kiểu câu Tuy nhiênđây là một nghiên cứu về động từ nên luận văn sẽ chỉ liệt kê các nhóm động từ cơ
bản của tác giả như sau:
- _ Nhóm động từ chỉ sự ton tại: “có”, “ngôi ” “treo ”,
- _ Nhóm động từ chỉ hành động vô tác: “chạy”, “vào”, “rời”,
- _ Nhóm động từ chỉ hành động chuyển tac: “lau”, “đóng”, “đánh”, “cho”
«
- Nhóm động từ chỉ quá trình vô tac: “rụng”, “ngả”, “tái”, “toát”,
- _ Nhóm động từ chỉ quá trình chuyên tác: “mở”, “mo tung”, “huy diét”’,
Id 66
- Nhom động từ chỉ trang thái: “yêu”, “thương”, “ghét”, “vui”, “lo”
- _ Nhóm động từ chỉ quan hệ: “/dm cho”, “cản trở”, “quy định”, “khiến ”,
[13, tr 430-447]
Cách phân loại của Levin (1993) lại có những đặc điểm nổi bật riêng Tácgiả quan tâm đến các tiêu chí như ý nghĩa, khả năng kết hợp, khả năng chuyên hóa,khả năng thay đổi trạng thái và các ràng buộc ngữ nghĩa của chúng Có nghĩa là cácnhóm động từ được Levin phân loại ngoài việc có chung những đặc điểm chungnhất về nghĩa con thì phải cùng chia sẻ một bộ khung cú pháp chung Theo đó,Levin đã phân loại thủ công 3024 động từ tiếng Anh với 4186 nghĩa con ra thành
192 nhóm động từ cơ bản, trong đó có các lớp con của các nhóm này Chúng ta có
16
Trang 21thé kề tên một số nhóm tiêu biểu như:
- Nhóm động từ thể hiện hành động loại bỏ (Verbs of Removing): “loại”,
“bỏ”, “xóa ”,
- Nhóm động từ thé hiện hành động đặt (Verbs of Putting): “đặt”, “dé”,
“reo ”,
- Nhóm động từ thể hiện hành động gửi và mang (Verbs of Sending and
Carrying): “gửi”, “mang”,
- _ Nhóm động từ thé hiện sự thay đổi sở hữu (Verbs of Change of Possession):
“cho”, “đổi”, “tặng ”, [31]
Cách phân loại này của Levin là một cách tiếp cận khá mới và hữu hiệu trong
việc phân loại động từ, cách phân loại này của tác giả cũng được ứng dụng một
cách rất rộng rãi trong rất nhiều nghiên cứu ngôn ngữ học và nghiên cứu về xử lýngôn ngữ tự nhiên mà VerbNet tiếng Anh là một điển hình Tuy nhiên cách phân
loại này vẫn còn một số điểm hạn chế sau:
Thứ nhất, cách phân loại này của Levin phần lớn dựa trên cấu trúc ngữ phápcủa động từ, tức là khả năng kết hợp của nó trong câu với một số đặc điểm về nghĩa
con mà không chú trọng đến yếu tô ngữ cảnh, điều này có thé làm mat đi sự đa dang
về nghĩa của động từ khi mà có sự thay đôi về ngữ cảnh
Thứ hai, cách phân loại của Levin chưa đưa ra được các hướng dẫn phân loại
cụ thê nhất của từng động từ tùy thuộc theo từng ngữ cảnh, điền này cũng khiến độcgiả gặp khó khăn trong việc tiếp cận và lý giải vấn đề
Thứ ba, vẫn còn xuất hiện tình trạng một sé động từ không rõ thuộc vàonhóm nao, điều này có thé khiến cho việc phân loại có thé trở nên mơ hồ và khó
Trang 22phân loại động từ Vì thế, luận văn sẽ kết hợp cách phân loại này với các quan điểmphân chia của các nhà ngôn ngữ học dé hình thành lên cách phân loại cho các động
từ tiếng Việt Khi thực hiện phân loại cũng như biểu diễn ngữ nghĩa của động từ,luận văn vẫn giữ quan điểm là đề cao hai tiêu chí về ngữ pháp và ngữ nghĩa, songviệc đánh giá về ngữ nghĩa và ngữ cảnh sẽ được chú trọng hơn đề khắc phục tối đahạn chế của Levin
1.2 Một số vấn đề về vai nghĩa
1.2.1 Khái niệm vai nghĩa
Vấn đề vai nghĩa là một lĩnh vực nghiên cứu đã được khá nhiều nhà ngônngữ học trên toàn thế giới quan tâm, nghiên cứu Tesnière được xem là người đầutiên nghiên cứu về vai nghĩa và cho răng cấu trúc cú pháp của câu bao gồm vị từlàm trung tâm, xoay quanh là những tham tố biểu thị những vai nghĩa đó Nghĩa của
vị từ quy định ngữ trị (hay khung tham to) của nó, tức là số lượng và tính chất của
các tham tố chỉ các vai nghĩa tham gia vào sự tình mà câu đó biểu hiện [Dẫn theo
10, tr 474].
Đồng tình với quan điểm Ấy, C.J Fillmore cho rang, một su tinh bao gom
một vi từ trung tâm và các ngữ đoạn quanh nó biểu thị cho các vai nghĩa hoặc cáchngữ nghĩa khác nhau Ông cũng đưa ra một định nghĩa về vai nghĩa rất phô biến vàphố quát, “Y niệm về cách bao gồm một tập hợp khái niệm pho quát, được giả định
là bẩm sinh, xác định những kiểu tri nhận nào đó của con người về những sự tìnhđang diễn ra quanh họ, tri nhận những van dé như ai thực hiện nó, nó xảy ra đốivới ai, và cái gì thay doi” [ Dẫn theo 15, tr 41]
Theo tác giả Cao Xuân Hạo, câu biểu hiện một sự tình (hay sự thê) Nội dung
(nghĩa biểu hiện) của nó có thể hình dung như một “cảnh ” (một màn kịch ngắn)diễn trên sân khấu Cái “cản” ay có một nội dung nhất định: trên sân khấu hiện raquang cảnh nào đây (một sự tình tĩnh), rồi lại điễn ra một sự việc nào day (một sự
tình động) Các nhan/vat (đọc là “nhân và vật” hoặc là “nhân hay vật”) có mặt trên
sân khẩu được gọi là tham tổ của sự tình hay vai (“vai nghĩa”) [10; tr 51]
Tác giả Nguyễn Văn Hiệp còn đưa ra một nguyên tac: “Vai nghĩa mà một
18
Trang 23thực thé đảm nhiệm trong sự tình luôn luôn phụ thuộc vào bản chất của sự tình đó,
và thuc là vô nghĩa nếu ta tách biệt các vai nghĩa khỏi sự tình mà trong đó chúng
xuất hiện ” [15, tr 47] Nguyên tắc này là rất quan trọng trong việc phân định vàtrừu tượng vai nghĩa Khi xác định vai nghĩa cho một thực thể trong một sự tình, tacần phải lưu ý rằng vai nghĩa đó phụ thuộc vào bản chat của sự tình đó và không thétach ra khỏi nó Việc tách ra khỏi sự tình sẽ dan đến hiểu sai vai nghĩa của thực thé
đó trong sự tình đó Do đó, trong quá trình phân tích vai nghĩa, chúng ta cần luôn
cân nhắc và giữ nguyên mối liên hệ giữa vai nghĩa và sự tình
Như vậy, từ những phân tích trên, chúng ta có thể đưa ra một định nghĩachung cho khái niệm của vai nghĩa như sau: Vai nghĩa là tập hợp các tham to ngữnghĩa xung quanh vị từ, có moi quan hé vé mat ngữ nghĩa đối với các vị từ và thể
hiện ý nghĩa của câu Các vai nghĩa này mặc dù tôn tại độc lập với một ngôn ngữ
cụ thé nào nhưng lại có tinh gắn bó khang khít với sự tình, không thé tách biệt ra
khỏi sự tình và có tính pho quát (phổ niệm) đối với tat cả các ngôn ngữ
1.2.2 Phân loại vai nghĩa
Tesnière, người đầu tiên nghiên cứu về vai nghĩa đã nhận định rằng một câu
có một vị từ làm trung tâm và các tham tô xoay quanh nó biéu thị những vai nghĩa
đó và nghĩa của vị từ được xác định bởi ngữ trị (hay khung tham tổ) của nó Ôngnhận định rằng việc phân tích câu thành chủ ngữ và vi ngữ là sai lầm hoàn toàn, bởiđây là kết quả của việc lẫn lộn cau trúc của câu với cau trúc mệnh dé Theo ông:
“Cấu trúc cú pháp của câu xoay quanh vị từ và các diễn tô (actants) làm bồ ngữcho nó Chủ ngữ chẳng qua là một trong các bồ ngữ đó Mỗi vị từ biểu hiện “một
màn kịch nhỏ”, nó có một diễn trị (valence) riêng được thể hiện trong số lượng các
dién tổ của no.” [Dẫn theo 15, tr 82] Các vị từ khác nhau cơ bản về số lượng diễn
tố trong vị ngữ, dựa trên tiềm lực cú pháp - ngữ nghĩa của vị từ để phân loại chúngthành:
- Vị từ vô trị (avalents) không có dién tô nào trong câu, ví dụ như vị từ pleut,
il pleut “mưa” không có diễn tô nào
- Vị từ don trị (monovalents) là vị từ có một diễn tố, ví dụ như tomber “ngã”
19
Trang 24- Vi từ song tri (bivalents) là vi từ có hai diễn tố, ví dụ như frapper “đánh”.
- Vị từ tam trị (trivalents) là vi từ có ba diễn tố, ví dụ như đonner “cho”
Lý thuyết của Tesniére phân biệt diễn tố và chu tố Trong đó, diễn tố (actant)
là những vai nghĩa bắt buộc sẽ được hiện thực hoá thông qua những ngữ đoạn, còn
những vai nghĩa tuỳ nghị thì được hiện thực hoá thông qua những ngữ đoạn được
gọi là chu tô (circonstant) Việc đánh giá một vai nghĩa là bắt buộc hay tuỳ nghỉphải đặt trong quan hệ với vị từ trung tâm: một vai nghĩa có thê là tuỳ nghỉ với vị từnày, nhưng lại là bắt buộc với vị từ khác
Có nhiều điểm tương đồng với Tesniére, C.J Fillmore cũng cho rang một sựtình gồm một vị từ trung tâm và quây xung quanh nó là các ngữ đoạn biểu thị những
cách ngữ nghĩa hay vai nghĩa (semantic role) nào đó [Dẫn theo 15, tr 41].
Những năm 1960, 1970, C.J Fillmore viết một loạt bài trong đó nổi tiếng
nhất là bài viết mang tên The case ƒor case (Đề biện hộ cho cách) được công bố
năm 1968 Trong các nghiên cứu của mình, Fillmore chú trọng việc xây dựng một
tập hợp các mối quan hệ cách (case relationships) giữa một vị từ và các tham tố(arguments) của nó Mỗi động từ đều có các nghĩa con thé hiện các đặc trưng khung
(frame features) nêu rõ các khung “cách” mà các vị từ đó có thé được đặt vào Các
mỗi quan hệ mà Fillmore gọi là quan hệ cách này theo ông có tính chất phô quát và
có số lượng hữu han Fillmore đã giới thiệu 6 cách sau:
- Agentive (Tác cách), chi vai chủ thé của hành động do động từ biểu thị
- Instrument (Công cu cách), chỉ vai công cụ của hành động do động từ biểu
- Locative (Vi tri), chi vi trí của trang thái hay hành động do vi từ biểu thị
- Objective (Đối tong), là cách trung hòa nhất về nghĩa, chỉ bat kỳ vật gì được
biểu thị băng một danh từ mà vai trò trong hành động hay trạng thái được động từ
20
Trang 25biểu thị được chính cách thuyết minh nghĩa của động từ quy định.
- Time, chỉ thời điểm của trạng thái hay hành động do vị từ biểu thị
- Source, chỉ chỗ xuất phát của sự chuyền động do vị từ biểu thi
- Goal, chỉ mục tiêu của sự chuyển động do vi từ biểu thị
- Direction, chỉ phương hướng của sự chuyên động do vị từ biểu thị
- Exent, chỉ tầm xa của sự chuyển động hay thời gian kéo dài của một trạng
thái hay hành động do vị từ biéu thị.
[Dẫn theo 15, tr 84]
Trong cuốn Cơ sở ngữ nghĩa phân tích cú pháp (2008), Nguyễn Văn Hiệpcũng đã định nghĩa khái niệm vai nghĩa theo quan điểm của Fillmore (1968), đưa radanh sách các vai nghĩa của Fillmore và danh sách các vai nghĩa cơ bản được hauhết các nhà nghiên cứu thừa nhận Không chỉ dừng lại ở đó, tác giả cho thấy sự thêhiện hình thức của vai nghĩa và đánh dấu các vai nghĩa, phân loại các kiểu sự tình,
sự đối chiếu của cấu trúc vai nghĩa lên cấu trúc cú pháp Danh sách các vai nghĩaphô biến được Nguyễn Văn Hiệp liệt kê và được hầu hết các nhà nghiên cứu chấpnhận gồm có: Vai tác thé (Agent), Vai nghiệm thé (Experiencer), Vai tiếp thé(Recipient), Vai kẻ hưởng lợi (Benefactive), Vai lực tự nhiên (Force), Vai bi thé
(Patient), Vai công cu (Instrument), Vai thực hiện hành động (Effector), Vai dia
diém, vi tri (Location hay Locative), Vai diém xuat phat, hay nguồn của trạng thái(Source), Vai điểm đến (Goal), Vai kẻ tham chiếu (Reference), Vai kẻ cùng hành
động (Comitant), Vai hướng chuyên động (Direction) hay lỗi di (Path), Vai thờiđiểm (Temporal), Vai chủ sở hữu (Possessor), Vai thời lượng (Duration), Vai nội
21
Trang 26dung (Content), Vai thé chuyên động (Theme) Một số vai khác có tính chất ngoại vi
cũng được tác giả thừa nhận, như: vai nguyên nhân (Reason), vai mục đích (Purpose), vai cách thức (Manner).
[15, tr 42-44]
Một số nghiên cứu khác lại có một lối đi khác so với Fillmore, trong suốtthập kỷ 70 và thập kỷ 80 của thế kỷ trước, nhiều công trình nghiên cứu ngữ phápcách (case grammar) độc lập khác đã gây ra được một số tiếng vang nhất định.Trong số những công trình này phải kế đến W Chafe (1970), S.C Dik (1978), S
Starosta (1988)
Theo S.C Dik, chức năng ngữ nghĩa của chu tô bao gồm:
- Cac chỉ định phụ thêm cho sự tinh hạt nhân: Phương thức, Đặc trưng, Công
Cụ;
- Cac quan hệ cua sự tình với các tham tố khác: Lợi thể, Liên đới thé; Các
quan hệ của sự tình trong các chiều kích thời gian: Thdi gian, Thời đoạn, Tansố;
- Các quan hệ của sự tinh trong các chiều kích không gian: Vi tri, Nguồn,
Phương hướng, Lỗi di:
- Cac quan hệ của sự tình với các sự tình khác: Chu cảnh, Nguyên nhân, Ly do,
Mục dich, Kết quả
[Dẫn theo 4]
M A K Halliday (1985), một chuyên gia về ngữ pháp chức năng cho rằngbình diện nghĩa câu ở bậc nghĩa là nghĩa biểu hiện tức là cái nội dung nghĩa phảnánh sự tình trong thế giới được miêu tả
Ủng hộ quan điểm chức năng hệ thống của Halliday, trong công trình Wgữ
pháp kinh nghiệm cú tiếng Việt, nhà nghiên cứu Hoàng Văn Vân (2005) đã liệt kê
bộ vai nghĩa tiếng Việt như sau: hành thể, đích thể, lợi thể, tiếp thể, khách thể, khiếnthể, cảm thể, hiện tượng, đương thể, thuộc tính, tạo thuộc tính thể, giá trị, biểu hiện,
bị dong nhát thể, đông nhất thé, hiện hữu thể, phát ngôn thể, tiếp ngôn thể, ngônthể, dung môi, cuong Vực, ứng thể, chu cảnh gom pham vi, dinh vi, phong cach,
22
Trang 27nguyên nhân, dong hành, van dé, vai diễn và quan điểm.
Trong nghiên cứu Vj tir hành động tiếng Việt và các tham tố của nó (So sánhvới tiếng Nga và tiếng Anh), Nguyễn Thị Quy (1995) đã chỉ xem xét một số thamthể như: đối tượng bị tác động, đích, nơi chốn, thời gian, người hưởng lợi, công cụ,người tiếp nhận
Ngoài công trình nêu trên, có thể kế đến công trình Tiếng Việt - Sơ thảo ngữ
pháp chức năng của Cao Xuân Hạo (2006) Cao Xuân Hạo có đưa ra danh sách
gồm các vai nghĩa cần yếu/bắt buộc: hành thé, hay kẻ hành động (actor), tac thé
(agents), đối thé hay bị thé (goal hay patients), nhận thé, đích, tạo thé (factitive),động thé hay quá thé, lực, nghiệm thé Ngoài những vai nghĩa - diễn tổ trên, CaoXuân Hạo còn đưa ra một số vai nghĩa - chu tô như: vai nguồn, vai đích, vai công
Cụ, vai Vị fri,
Nhìn chung, các tác giả trong và ngoài nước đã có nhiều điểm tương đồng
trong quan niệm phân chia vai nghĩa, tuy nhiên sự sai biệt theo từng ý chí chủ quan
của mỗi tác giả là có và điều này làm phức tạp hóa việc đưa ra một lý thuyết phổquát phục vụ quá trình phân chia vai nghĩa đáp ứng cho cho việc biểu diễn ngữnghĩa theo cấu trúc vị từ tham thé
Vì có nhiều quan điểm khác nhau về vai nghĩa nên việc định nghĩa một tậpvai nghĩa chuẩn mực là rất khó khăn Trong lĩnh vực xử lý ngôn ngữ tự nhiên, các bộngữ liệu khác nhau thường sử dụng các tập vai nghĩa khác nhau Chăng hạn VerbNet
phiên bản 3.2” sử dung tập 30 vai nghĩa, phiên bản 3.3'° sử dung tập 39 vai nghĩa
PropBank [30] chỉ sử dụng các vai nghĩa tổng quát và tham chiếu chỉ tiết tới VerbNet.FrameNet sử dụng tập nhãn rat chỉ tiết gắn liền với đặc trưng của từng khung
Về bản chất, gán nhãn vai nghĩa chỉ là một bài toán trung chuyên, chứ khôngthật sự là nền tang của một ứng dụng xử lý ngôn ngữ tự nhiên cụ thé nào Tuynhiên, đây lai là một bước cần thiết không thé bỏ qua trong các ứng dụng liên quanđến ngôn ngữ tự nhiên Việc xác định đúng vai nghĩa của các thành phần trong câu
7 https://verbs.colorado.edu/verb-index/vn/reference.php
10 https://verbs.colorado.edu/verb-index/vn3.3/vn/reference.php
23
Trang 28là một vấn đề trung tâm của mọi hệ xử lý ngôn ngữ tự nhiên.
1.3 VerbNet
VerbNet là một công cụ biểu diễn ngữ nghĩa động từ, có liên kết tới các tài
nguyên từ vựng khác như WordNet, FrameNet và PropBank Đây là mạng động từ
tiếng Anh lớn nhất, đặc tả khung cú pháp, vai nghĩa, ràng buộc cú pháp - ngữ nghĩa
và biểu diễn nghĩa của 329 lớp động từ với tong số 9344 động từ thành viên.VerbNet dựa trên phân loại động từ của Levin (1993) để xây dựng các lớp động từ
Bang 1.1 dưới day là một vi dụ về một lớp động từ được biểu diễn trong VerbNet
Bang 1.1: Một lớp động từ trong VerbNet
Lớp Put-9.1
Vai nghĩa và ràng buộc | Agent [+animate]
vai nghĩa Theme [+concrete]
Initial_Location [+location]
Destination [+location & -region]
Các động từ thành viên | arrange, emplace, immerse, implant, lodge, mount,
position, situate, sling, superimpose, station, tack_on,
nghĩa motion(during(E), Theme)
Ngữ nghĩa path_rel(start(E), Theme, Imtial_Location, ch_of_loc,
prep)
path_rel(end(E), Theme, Destination, ch_of_loc, prep)
cause(Agent, E)
24
Trang 29VerbNet là sự kết hợp của động từ truyền thống và các vai nghĩa, các ràngbuộc của các vai nghĩa và khung cấu trúc cú pháp và tham thể Cấu trúc của Put-9.1
của VerbNet được thể hiện một cách chỉ tiết như sau:
- Cac động từ thành viên của các nhóm động từ: arrange, emplace, immerse,
implant, lodge, mount, position, situate, sling, superimpose, station, tack_on,
wharf.
- Danh sách vai nghĩa liên quan tới: Agent, Theme, Destination.
- Các ràng buộc vai nghĩa và các vai nghĩa: Agent [+animate], Theme
[+concrete], Initial_Location [+location], Destination [+location &
Vị du: J put the book on/under/near the table
Vai nghĩa": Agent V Theme {{+loc}} Destination
Một tập hợp các vi từ biểu diễn ngữ nghĩa: motion(during(E), Theme)
path_rel(start(E), Theme, Iniial Locaton, ch of lọc, prep)
path_rel(end(E), Theme, Destination, ch_of_loc, prep) cause(Agent,
E)
Một lớp động từ trong VerbNet được xác định bởi một tap hợp các thành
viên, vai nghĩa và các ràng buộc vai nghĩa của các tham thê được phân loại bởi các
thành viên này, cũng như các mô tả cú pháp và ngữ nghĩa liên quan đến khung ngữnghĩa của chúng Các thành phan của VerbNet sẽ được luận văn mô tả cụ thé hơn
trong chương 2.
1.4 Từ điển tiếng Việt dành cho máy tính (VCL)
Từ điển tiếng Việt dành cho máy tính (VCL) là tài nguyên từ vựng lớn nhất
và quan trọng nhất cho NLP với khoảng 42.000 mục từ vựng Nó được cấu trúc theo
khung chú giải từ vựng (Lexical Markup Framework) - một siêu mô hình trừu
tượng được xây dựng bởi tiểu ban kỹ thuật ISO TC 37/SC 4 nhằm cung cấp một bộ
lĨnx v¿ : T2 z kek vn Ũ h
Đặc ta vai nghĩa của các đối tô của khung cú pháp
25
Trang 30khung cho phát triển các từ vựng hướng tới NLP Từ điển này bao gồm tất cả thông
tin (dạng từ, từ loại, định nghĩa, vi dụ) từ Tir điển tiếng Việt [18], một từ điển in
được coi là tốt nhất ở thời điểm hiện tại
Bên cạnh đó, VCL cũng cung cấp thông tin về mỗi mục từ theo ba khía cạnh:hình thái, cú pháp và ngữ nghĩa Vì tiếng Việt không thay đổi về hình thái, thông tin
về hình thái trong VCL tập trung vào cấu tạo từ Ví dụ, một từ có thể là từ đơn, từghép, từ lay, từ mượn, từ viết tắt hoặc ký hiệu Bảng 1.2 cho thấy một ví dụ về một
mục từ trong VCL, cung cấp thông tin không chỉ về cấp hình thái mà còn về cấp độ
FrameSet Sub + V + Dob
Before R: rat (very)
Semantic Logical constraint Categorial Meaning:
Emotion
Antonym: Ghét (hate)
Semantic constraint Sub: Agt {Person}
Definition Có tình cảm dễ chịu khi tiếp xúc với một đôi tượng nào đó,
muốn gần gũi và thường sẵn sàng vì đối tượng đó mà hếtlòng
Example Tôi yêu mẹ (J love mom)
VCL là một nguồn tài nguyên từ vựng quan trọng cho các tác vụ NLP cơ
26
Trang 31bản, được thiết kế dé dé dàng cập nhật và mở rộng va tương thích tốt với các ngôn
ngữ khác Tuy nhiên, VCL vẫn có một số hạn chế so với VerbNet như sau:
VCL chứa khoảng 6.652 động từ (8.689 ngữ cảnh) và tông cộng 20 khungphân loại liên quan đến những động từ này Tuy nhiên, thông tin này khôngđầy đủ về mặt cú pháp và ngữ nghĩa, hầu hết các động từ chỉ được gắn vàomột khung và thông tin về mỗi khung thường không đầy đủ Cụ thể cáckhung động từ của VCL chưa có sự phân biệt rõ ràng về địa điểm, điểm đến,
điểm bắt đầu của hành động VCL đang có xu hướng gộp các thành phần này
lại thành Location (dia điểm), trong khi khung cú pháp động từ của VerbNetlại có những sự phân biệt rõ ràng thành: địa điểm diễn ra hành động
(Loaction), điểm đến (Destination), nơi xuất phát (Initial_Location), hướng
hành động (Trajectory).
VCL sử dụng một tập hợp 16 vai nghĩa như: Agent (Tác nhân), Experiencer
(Nghiệm thé), Possessor (Người sở hitu), Điều này khá hạn chế so với
VerbNet.
Các ràng buộc ngữ nghĩa và logic được xây dựng thủ công nhưng nó vẫn còn
vài trường hợp chưa được đề cập trong từ điền
Theo cây ngữ nghĩa ” (Semantic Tree) của VCL, các vai nghĩa được ràng
buộc bởi hai thuộc tố chính đó là vật thể (ConcreteThing) va tri tượng(Abstraction) Rang buộc ngữ nghĩa vật thé còn được phân chia thành vật hữu sinh(LivingThing) và vật vô sinh (None-livingThing) còn năm trong ràng buộc trừu
tượng còn có trạng thái (State), hiện tượng (Phenomenon), sự kiện trừu tượng
(AbstractThing) Cũng như Verbnet, các ràng buộc này giúp giới hạn về ngữ
nghĩa cho các vai nghĩa khi kết hợp với một số động từ nhất định.
Vi dụ: Với nghĩa con di (5): phương tiện vận tai] di chuyển trên một bê mặt,
chủ ngữ cua câu được gan cho ràng buộc ngữ nghĩa {Vehicle} — phương tiện giao
thông Xem hình dưới đây:
'? https://vlsp.hpda.vn/demo/vel/SemanticTree.htm
27
Trang 32* Semantic
+-Logical constraint
+-CategorialMeaning > Move
| +-Synonym > chay
+-Def > [phương tiện vận tải] di chuyển trên một bể mặt
+-Exa > xe đi chậm ri ri ~ ca nỗ đi nhanh hơn thuyền
Hình 1.1: Biểu diễn ràng buộc ngữ nghĩa của nghĩa con di (5) trong VCL
Như đã trình bày ở trên thì các ràng buộc của VCL được xây dựng thủ công
và còn có trường hợp chưa được đề cập đến trong từ điển Việc kết hợp biểu diễn
ràng buộc ngữ nghĩa — cú pháp của hai nguồn tài nguyên từ vựng này sẽ là mộttrong những thao tác mà luận văn sẽ thực hiện nhằm kế thừa những kết quả nghiên
cứu trước đó từ các tài nguyên từ vựng Bên cạnh đó, qua việc đối chiếu hai ngôn
ngữ, và ánh xạ từ các nguồn tài nguyên từ vựng, luận văn cũng sẽ có những điềuchỉnh phù hợp, vừa đảm bảo tính đồng nhất với VerbNet tiếng Anh vừa đảm bảođặc trưng về tri nhận và ngữ nghĩa của tiếng Việt
1.5 TreeBank tiếng Việt (ViettreeBank)
Treebank tiếng Việt (ViettreeBank) [21] là một ngân hàng gồm khoảng10.000 câu tiếng việt được chú giải về ngữ pháp Đây là một kho ngữ liệu quan
trọng trong việc nghiên cứu và phát triển công nghệ xử lý ngôn ngữ tự nhiên chotiếng Việt
Nguồn tài nguyên này bao gồm các tai liệu được gan nhãn về cú pháp thành
phan, dau câu, từ loại, Việc gan nhãn ngày giúp xác định các tính chất của từ, từ
loại, loại từ Đồng thời cũng giúp ích trong việc xây dựng các công cụ xử lý ngônngữ tự nhiên cho tiếng Việt, bao gồm cả việc phân tích cú pháp, tách từ và gán nhãn
từ loại Kho ngữ liệu này được thu thập từ các bài báo của báo Tuổi Trẻ điện tử, cụthé hơn là các chủ đề Chính trị - Xã hội, Kinh tế, Tin học,
Dữ liệu ViettreeBank (V7) đã được chỉnh sửa lại vào năm 2022 Nội dung
sửa đổi là: nhãn từ loại, tach từ, quan hệ cú pháp thành phần Luận văn thể khai thác
28
Trang 33các khung cú pháp thành phần từ VTB để nghiên cứu cụ thể đối với trường hợp
từng động từ.
Tiểu kết:
Trong chương 1 này, luận văn đã cung cấp các kiến thức cơ bản như:
Khái quát về các khái niệm của động từ và cách phân loại động từ của một sốnhà ngôn ngữ học ở Việt Nam và thế giới Trong đó, luận văn có đề cập đến cáchphân loại của Levin, cách phân loại nền tảng để xây dựng lên VerbNet tiếng Anh
Luận văn cũng đã đưa ra một số đánh giá và nhận xét cơ bản của cách phân loại này
của Levin khi áp dụng vào trong việc xây dựng VerbNet tiếng Việt (viVerbNe)
Luận văn khái quát các định nghĩa và quan điểm phân loại các vai nghĩakhông chỉ của các nhà ngôn ngữ học mà còn có các quan điểm dưới góc nhìn của
các chuyên gia về khoa học công nghệ nói chung hay các chuyên gia về xử lý ngôn
ngữ tự nhiên nói riêng Trong đó, đáng chú ý hơn cả là cách phân loại vai nghĩa của
VerbNet tiếng Anh, cách phân loại này sẽ được đối chiếu và ánh xạ trong quá trình
xây dựng tập vai nghĩa cho viVerbNet.
Ngoài ra, luận văn còn cung cấp một vài thông tin liên quan đến ba tải
nguyên từ vựng chính sẽ được sử dụng trong quá trình nghiên cứu như: VerbNet,
Từ dién tiếng Việt dành cho máy tính (VCL), TreeBank Tiếng Việt (V7B)
Trên cơ sở những van đề liên quan đến kiến thức cơ sở, luận văn sẽ đi sâu
vào mô tả mô hình viVerbNet trong chương 2; nghiên cứu và khảo sát nghĩa con và
khung cú pháp động từ dựa vào VTB và VCL trong chương 3; biểu diễn ràng buộc
cú pháp và ràng buộc ngữ nghĩa của một số động từ tiếng Việt trong chương 4
29
Trang 34Chương 2 MÔ HÌNH viVERBNET
viVerbNet là mạng ngữ nghĩa động từ tiếng Việt được xây dựng dựa trênnhững thành phan cốt lõi từ VerbNet tiếng Anh như: lớp các động từ, vai nghĩa,khung cú pháp, ràng buộc cú pháp ngữ nghĩa, vị từ ngữ nghĩa và cách biểu diễn ngữ
nghĩa Khai thác các đặc trưng tương đồng trong ngữ pháp và ngữ nghĩa giữa tiếng
Anh và tiếng Việt, viVerbNet có thể sử dụng một số đặc trưng của VerbNet phục vụcho việc biểu diễn ngữ nghĩa động từ tiếng Việt
Bên cạnh đó, sự khác biệt trong ngữ pháp, ngữ nghĩa giữa tiếng Anh và tiếngViệt khiến cho viVerbNet không thé áp dụng trực tiếp cách biểu diễn tất cả cácthành phần trong VerbNet Chương này, bên cạnh việc mô tả cụ thể các thànhphần của VerbNet và việc ánh xạ một số thành phần trong VerbNet, luận văn sẽbiểu diễn một số thay đổi trong cách biểu diễn khung cú pháp, nhãn ràng buộc cúpháp, cách biểu diễn ràng buộc ngữ nghĩa để phù hợp với đặc điểm ngữ pháp,ngữ nghĩa tiếng Việt
2.1 Vai nghĩa
Vai nghĩa giúp xác định mối quan hệ ngữ nghĩa của các tham thê đối với
động từ là vị ngữ chính của một câu VerbNet qua nhiều phiên bản khác nhau sử
dụng các tập vai nghĩa khác nhau với số lượng và các vai nghĩa thành phần khácnhau Phiên bản đang được sử dụng hiện nay là VerbNet phiên bản 3.3 gồm có 39vai nghĩa `” Dé tăng khả năng đối chiếu, viVerbNet lựa chọn sử dụng tập vai nghĩacủa phiên bản mới nhất VerbNet 3.3 dé biéu diễn ngữ nghĩa cho các đối tố của các
động từ Các vai nghĩa được mô tả cụ thể như sau:
- Agent (Tác nhân/ tác thô): Người chủ động của một hành động hoặc sự kiện
Ví dụ: “Binh đánh Nam”, “Binh” mang nhãn Agent.
- Asset (Giá trị mang tính chêm xen bổ sung): Vai nghĩa chi giá trị là một đối
tượng, tân ngữ cụ thé Vai nghĩa này biểu thị giá trị của tham thể trước nó
nhưng lại không có mối quan hệ với động từ chính của câu Vai nghĩa này
l3 https://verbs.colorado.edu/verb-index/vn3.3/vn/reference.php Truy cập ngày 30/12/2023
30
Trang 35lưỡng phân với Value (Giá tri).
Ví dụ: “Tôi mua cái túi 20 nghìn”, “20 nghìn” mang nhãn Asset bỗ
sung ý - nghĩa cho “cái túi” chứ không có quan hệ với động từ chính “mua”.
Attribute (7huộc tinh): Vai nghĩa chỉ thực thé mang một tính chất nào đóđược biểu thị trong câu
Ví dụ: “Giá dau tăng vọt”, “Giá dau” mang nhãn vai nghĩa là
Attribute.
Beneficiary (Lợi thé): Vai nghĩa biểu thị kẻ được hưởng thành quả (loi ích,bắt lợi) từ một hành động do một ai đó thực hiện hoặc trạng thái, sự việc
33c
Vi dụ: “Tôi tặng mẹ hoa”, “me” mang nhãn Beneficiary.
Causer (Nguyén nhân): Vai nghĩa chỉ hành thé trong một sự việc (có thé có
tính động hoặc không có tính động) khởi xướng sự việc hành động nhưng
hành động một cách không có chủ tâm hay có ý thức Nó tồn tại độc lập vàkhông phụ thuộc vào sự kiện.
Ví dụ: “Thay giáo giới han dé tài”, “Thay giáo” mang nhãn Cause
Destination (Điểm đến): Đích đến của hành động là một vi trí cụ thể
Ví dụ: Nó di vào nhà
Agent V Destination
Experlencer (Nghiệm thê): Vai nghĩa được đặc trưng là nhận thức hoặc trải
nghiệm điều gì đó
Ví dụ: “7ï yêu mẹ”, “Tdi” mang nhãn Experiencer.
Extent (Mức độ): Giá trị cho biết mức độ thay đổi có thể đo lường được của
các thành phần tham gia trong suốt quá trình diễn ra sự kiện
Ví dụ: “Giá dau tăng 10%”, “10%” mang nhãn Extent
Goal (Dich thé): Muc dich cudi cùng của hành động tồn tại độc lập với sự
=A
viéc.
31
Trang 36Ví dụ: “Tôi đột lửa dé sưởi am”, “(dé) sưởi am” mang nhãn Goal.
Initial_Location (Dia điểm bat dau): Vai nghĩa của chỉ ra vi trí một cách cụ
thé nơi mà sự kiện bắt đầu hoặc một trạng thái thành sự thật
Vi dụ: “Tôi mang cơm hộp từ nha”; “nhà” mang nhãn vai nghĩa
Initial_Location.
Instrument (Công cu): Vai nghĩa chỉ công cu được sử dung dé tác động hoặctạo ra sự thay đôi trong một thứ gì đó Thường là một công cụ được sử dụngbởi một tác nhân có tính động dé mang lại sự thay đổi
Ví dụ: “Tôi đào đất bằng xẻng” thì “xẻng ” mang nhãn Instrument
Location (Địa điểm): Vai nghĩa chỉ vị trí cụ thể hay hướng không gian củatrạng thái hay hành động do vị từ đảm nhiệm, thường được nhận diện bangmột giới từ dang trước
Ví dụ: “Cô ấy ăn trưa ở nhà”, “nhà ” mang nhãn vai nghĩa Location.Material (Vật chất): Vai nghĩa chỉ vật chất ban đầu, cái mà thay đổi thôngqua sự việc thành các thực thé mới, cụ thé hoặc trừu tượng Vai nghĩa thường
được sử dụng với các động từ mang nghĩa sáng tạo, tạo lập
Ví dụ: “Chiếc túi này làm bang vải”, “vải” mang nhãn vai nghĩaMaterial.
Patient (Bị thé): Tham thé tham gia trải qua một quá trình hoặc bị ảnh hưởng
bởi một hành động, nhấn mạnh vào thay đôi trạng thái.
Ví dụ: “Binh đánh Nam”, “Nam” mang nhãn Patient.
Predicate (Vi ngØ): Vai nghĩa biểu thị một sự kiện, trạng thái thứ hai, phụthuộc vào sự kiện chính, được mô tả băng động từ thứ hai trong câu
Ví dụ: “Mẹ bắt tôi ăn rau”, “ăn rau” mang nhãn Predicate
Pivot (Trạng thê): Tham thể trong một trạng thái được mô tả là ở một vi tríhoặc điều kiện nhất định trong suốt trạng thái, và có vai trò hoặc tác động lớn
hoặc trung tâm trong trạng thái đó Một pivot có vai trò trung tâm hơn một
32
Trang 37tham thể với vai trò chủ đề.
Ví dụ: “Tôi yêu cô ấy”, “Tồi ” mang nhãn Pivot
Produet (Sản phẩm): Vai nghĩa chỉ kết quả cuối cùng của hoạt động, kết quả
của quá trình thay déi, có quan hệ lưỡng phân với vai nghĩa Material, một cái
là điểm xuất phát còn một cái là kết quả
Ví dụ: “Nghệ nhân làm gốm bằng đất sét”, “gốm ” mang nhãn
Product
Recipient (Tiép thé): Vai nghĩa chi đối tượng cuối của hoạt động trao tặng
Ví dụ: “4nh Nam tặng hoa cho cô ấy”, “cô ấy” mang nhãn Recipient
Result (Kết quả): Vai nghĩa chỉ kết quả được xảy ra là kết quả quả việc một
hành động được thực hiện.
Ví dụ: “Cửa kính ô tô bi đập vỡ”, “vỡ” mang nhãn Result.
Source (Nguồn gốc): Vai nghĩa biéu hiện điểm bắt đầu của hành động: tồn tại
độc lập với sự kiện.
Ví dụ: “Dai phun nước phun nước ”, “dai phun nước ” mang nhãn vai
nghĩa Source.
Stimulus (Kích thích thê): Vai nghĩa chỉ sự kiện hoặc đối tượng mang lại
phản ứng tâm lý cho Nghiệm thẻ
Ví dụ: “7ôi thích bức tranh đó”, “bức tranh đó” mang nhãn
Stimulus.
Time (Thoi gian): Vai nghĩa chỉ thành phần tham gia cho biết ngay lập tức
hoặc một khoảng thời gian trong đó một trạng thái tồn tại hoặc một sự kiện
đã diễn ra.
Ví dụ: “76i đến trường lúc 8 giờ”, “(hic) 8 giờ” mang vai nghĩa Time
Theme (Thể chuyền động): Tham thể được đặt ở một nơi hoặc được coi là di
chuyên từ nơi này sang nơi khác, nhắn mạnh vào thuộc tính vị trí (hoặc sở hữu)
33
Trang 38Ví dụ: “Hon đá lăn xuống đôi”, “Hon đá ” mang vai nghĩa Theme.
Topic (Chủ dé): Vai nghĩa chi chủ đề của các hoạt động giao tiếp, truyền đạt
thông tin.
DÀNG:
Ví dụ: “Công an thông báo về vụ việc với người nhà nạn nhân”, “vụ
việc ” mang nhãn Topic.
Trajectory (Quy đạo): Vai nghĩa chỉ đường đi hoặc một khu vực mà chuyênđộng đi qua, thé hiện sự thay đôi vị trí
Ví dụ: “Con ngựa nhảy qua hàng rào”, “hang rao” mang nhãn vai
Affector (Tác nhân ảnh hưởng): Đóng vai trò là nguyên nhân gây ra sự thay
đổi trạng thái của một thực thê khác
Vi dụ: “Troi mưa đường ướt”, “trời mưa” mang nhãn vai nghĩa
Affector.
Axis (Trục): Chỉ ra trục mà một hành động diễn ra.
Ví dụ: “Trái Đất quay quanh Mặt trời”, “Mặt trời” mang vai nghĩa
Axis.
Context (Ngi# cảnh): Cung cap thông tin về bối cảnh hoặc điều kiện mà một
hành động diễn ra.
Ví du: “Anh ấy đã bị kiện trong vụ án này”, “trong vụ án này” mang
vai nghĩa Context.
Initial_State (Trang thái ban dau): Mô tả trạng thái của một thực thể trước
khi xảy ra sự kiện
Ví du: “Anh dy chuyén từ Đạo Phật sang Đạo Thiên Chia”, “Đạo
Phật” mang vai nghĩa Initial_ State.
34
Trang 39- Path (Lối di): Mô tả đường đi hoặc quỹ đạo của một đối tượng.
Ví dụ: “Con sông chảy qua đồng bằng”, “dong bằng” mang vai
nghĩa Path.
- Precondition (Tién dé): Vai nghĩa nêu ra những điều kiện cần thiết để một
hành động có thê được xảy ra
Ví dụ: “Những nỗ lực của chúng tôi đã đảm bảo việc thực hiện dự án
diễn ra thuận lợi”, “Những nỗ lực của chúng tôi” mang vai nghĩa
Precondition.
- Reflexive (Phan thân): Chi ra rang tác nhân và đối tượng của hành động là
cùng một thực thể
Ví dụ: “Em dy tự nấu com”, “tw” mang nhãn vai nghĩa Reflexive
- Duration (khoảng thời gian): Chỉ ra thời gian diễn ra của một sự kiện.
Ví dụ: “4nh ấy đã làm việc suốt cả ngày”, “suốt cả ngày” mang vai
nghĩa Duration.
- Final Time (thoi gian kết thúc): Chi ra thời điểm kết thúc của một sự kiện
Ví du: “Budi họp kết thúc lúc 5 giờ”, “lúc 5 giờ” mang vai nghĩaFinal_Time
- Manner (Cách thức): Mô ta cach thức thực hiện một hành động.
Ví dụ: “Cô ấy chạy rất nhanh”, “rất nhanh” mang nhãn vai nghĩaManner.
Ngoài ra còn một số nhãn có tính tương tự như các nhãn Theme, Patient,Agent lần lượt là: Co-Theme (Đồng thể chuyển động); Co-Patient (Đồng bị thé);
Co-Agent (Đồng fác thể) Các nhãn Co-* này tham gia vào câu cũng cùng đảm
nhiệm chức năng, tính chất ngang bằng với cái nhãn tương ứng.
Ví dụ:
Mẹ nóichuyện với tdi
Agent Vv {with} Co-Agent
Di ghẻ trộn gạo nếp VỚI gạo tẻ
Agent Vv Patient {with} Co-Paitent
35
Trang 402.2 Khung cú pháp
Khung cú pháp là cấu trúc cú pháp cơ bản được tạo nên bởi các thành phần
nòng cốt, gan liền với các đặc trưng về cú pháp của một ngôn ngữ Khung cú phápcũng là nền tảng cho việc phân tích ngữ pháp và xây dựng các mô hình ngôn ngữ.Khung cú pháp động từ là khung cú pháp gắn liền với động từ đảm nhiệm chức
năng là vị ngữ chính.
VerbNet phiên bản 3.3 đang sử dụng 309 khung cú pháp động từ chính Các
khung cú pháp này sử dụng các thành tố như: NP (danh ngữ), V (động từ), PP (giới
ngữ), ADỊP (tính ngữ), S (bố ngữ là câu đơn/cú), S_ING (bồ ngữ là động ngữ đặcbiệt có dạng V-ing), S_INF (bồ ngữ là động ngữ có động từ nguyên thê)
Vị dụ:
NP V NP PP.instrument: Paula hit the ball with a stick
NP V S_ING: I tried exercising.
NP V S_INF: J tried to exercise
NP V NP ADJP: John took the radio apart.
NP V NPS: John informed me that his situation had changed.
Trong một số khung cú pháp có thé xuất hiện các thành phần mở rộng saudấu “.” biểu thị loại vai nghĩa cụ thể được sử dụng đối với mỗi đối tố(PP.instrument) Các nội dung về cú pháp cũng sẽ được chú giải một cách chỉ tiếthơn về nghĩa và vị trí ngữ nghĩa của các thành phần cú pháp trong câu bằng cáchthêm các thành phần phụ như: Công cụ (Instrument), Điểm đến (Destination), Tácthé (Agent), Đồng tác thể (Co-agent), Địa điểm ban đầu (Initial_location), Đỗi
tượng trao nhận (Recipien?)
Ví dụ:
Ông cho vào bao những cọng dây đồng
NP V PP.Destination NP.Theme
Khi vị trí của các thành phan theo đúng cau trúc S — V — O (tc là: S — đối
tượng thực hiện hành động, V — hành động, O — đối tượng chịu tác động của hànhđộng), khung cú pháp sẽ ở dạng đơn thuần, không chứa các thành phần, yếu tố phụ
36