1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Ngôn ngữ học: Nghiên cứu biểu diễn ràng buộc cú pháp – ngữ nghĩa của một số động từ cho việc xử lý ngôn ngữ tự nhiên

127 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu biểu diễn ràng buộc cú pháp – ngữ nghĩa của một số động từ cho việc xử lý ngôn ngữ tự nhiên
Tác giả Lê Văn Cương
Người hướng dẫn TS. Nguyễn Thị Minh Huyền
Trường học Trường Đại học Khoa học Xã hội và Nhân văn - Đại học Quốc gia Hà Nội
Chuyên ngành Ngôn ngữ học
Thể loại Luận văn Thạc sĩ
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 127
Dung lượng 24,46 MB

Nội dung

Khi biểu diễn ngữ nghĩa của một câu hay một mệnh dé, chúng ta phải xác định được vị từ tương ứng với thành phan trung tâm của câu hay mệnh dé, vai nghĩacủa các thành phần bổ nghĩa cho th

Trang 1

ĐẠI HỌC QUOC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN

LÊ VĂN CƯƠNG

CHO VIỆC XỬ LÝ NGÔN NGỮ TỰ NHIÊN

LUẬN VĂN THẠC SĨ NGÔN NGỮ HỌC

Hà Nội - 2024

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN

LÊ VĂN CƯƠNG

Chuyên ngành Ngôn ngữ học

Mã số: 8229020.01

LUẬN VĂN THẠC SĨ NGÔN NGỮ HỌC

Người hướng dẫn khoa học: TS Nguyễn Thị Minh Huyền

Hà Nội - 2024

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn “Nghiên cứu biểu điên ràng buộc cu pháp — ngữ

nghĩa của một so động từ cho việc xử ly ngôn ngữ tự nhiên” là công trình nghiên

cứu của riêng tôi, kêt quả nghiên cứu được trình bày trong luận văn này là xác thực,

chưa từng được công bố ở bất kỳ công trình nào khác

Ha Nội, ngày 9 tháng 5 năm 2024

Tác giả luận văn

Lê Văn Cương

Trang 4

LOI CAM ON

Đề hoàn thành luận văn này, tôi đã nhận được sự giúp đỡ, động viên, khích

lệ của thầy cô cũng như bạn bè, người thân

Trước tiên, tôi xin chân thành cảm ơn TS Nguyễn Thị Minh Huyền đã nhiệttình hướng dẫn và chỉ bảo tôi hoàn thành tốt luận văn này

Nhân đây, tôi cũng xin chân thành cảm ơn các thầy cô trong Khoa Ngôn ngữhọc - Trường Đại học Khoa học Xã hội và Nhân văn - Đại học Quốc gia Hà Nội đã

truyền đạt cho tôi kiến thức và tạo điều kiện học tập cho tôi trong suốt thời gian tôi

học ở trường Bên cạnh đó, tôi cũng xin gửi lời cảm ơn tới các thầy cô trong KhoaToán - Cơ - Tin học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội

Sau cùng, tôi cũng xin cảm ơn gia đình, bạn bẻ, những người đã động viên

khích lệ và tao mọi điều kiện tốt nhất dé tôi có thé hoàn thành luận văn này

Học viên

Lê Văn Cương

Trang 5

MỤC LỤCLỜI CAM ĐOAN

LOI CAM ON

MỤC LUC 2 ecccccccssccessccesssecesscceessececssecessecceseecesseecessececssecesseceesesesseeeens 1

DANH MỤC CAC CHU VIET TẮTT 2-5 +S£2E£+EE£EE£EEE2EE£EEeEEerEerrkrrkerkeee 3

DANH SÁCH BANG BIỂU 2-2-5221 ‡EEEE2E1221271711211211271 21.21 1E xe 4

DANH SÁCH HÌNH -2 ©2222E2EE9EE1E221271127117112711111211 11.11 xee 5

96271172257 -:: 6

1 Tổng quan tình hình nghiên Cứu - 2 ¿+ s+EE2+EE+E£+E£+E££Ee£Eerkerezrezrezsez 7

2 Mục đích và nhiệm vụ nghién CỨU - - + 23c 3+ ‡***‡EESseESeeerseeereeserreere 9

3 Đối tượng và phạm vi nghiên cứu - s¿+5e+2++x+£xt£E+EEerxerkerrkerserxees 9

4 Phương pháp và quy trình nghiên CỨU 5 SE #vEEeEreessersrsersre 9

5 Ý nghĩa của luận văn - 2-5 ©s£+E2EE£EEEEEEEE1211271711211211 1111.211111 10

6 Bồ cục của luận VĂI - ¿+ 211 1E 1322331111111 833311 11119930111 kg 1 key 11

CHƯƠNG 1 KIÊN THỨC CƠ SỞ -.2-2¿ 22 ©2+22E22EE2EEtEEEerkesrxrrrrees 12

1.1 Một số vấn đề về động từ ¿5252 2 2E1271212112117121211 211 11x 121.2 Một số vấn đề về vai nghĩa - 2 2+2 £+EE£EE+EE£EEEEEEEEEEEEEEEEEEErkrrkerreee 18

1.3 /-i0 0 24

1.4 Từ điển tiếng Việt dành cho máy tính (VCLL) -2- 2-52 5z+sz+s+s>sz+z 251.5 TreeBank tiếng Việt (ViettreeBAnk) cccsescsesssesssesssssesssesssecsssssesssecssecstssseessecs 28

CHUONG 2 MÔ HÌNH VIVERBNET 2-2222 SEcSEEc2EEeEExerkrrrkerrreee 30

PO Vad mghia a Ô 30

2.2 Khung CU 01117 36

2.3 Rang bUGC CU Phap 0n 38

2.4 Rang bu6c ngtt nghia ri (ca 4I

Trang 6

CHƯƠNG 3 KHẢO SÁT NGHĨA CON VÀ KHUNG CÚ PHÁP CỦA ĐỘNG

TỪ DỰA VÀO VCL, VÀ V'TE - 2 2+2s Ex EE2E2E127171711211211 1121.211 x ke 49

3.1 Tiêu chí lựa chọn động tỪ - - + +1 + 1123119111 11911 111g ng ng grry 49

3.2 Phương pháp khảo sát nghĩa con và khung cú pháp động từ dựa vào VCL và

1 51

3.3 Khao sát nghĩa con và khung cú pháp động từ trong VCL va VTB 53

Chương 4 NGHIEN CUU BIEU DIEN RANG BUỘC CU PHAP VÀ NGỮ

NGHĨA CAC ĐỘNG TU “đi”, “đánh”, “Cho” .c.cccccccsssessesseessesssessseeseeees 70

4.1 Biểu diễn ràng buộc cú pháp eeccecceccecscssesssesessessesssessessessessssssesseesesstessesseesees 71

4.2 Biểu diễn ràng buộc ngữ nghĩa - 2-5552 EEEEEE2 2221212 erkrrrrer 75

CONG TRÌNH ĐÃ CÔNG BÓ - c cntnnhhtrrrrrrrrrrrre 93

TÀI LIEU THAM KHẢO -2- 2 2S SE2E2EE2EEEEE2E12E122121 21121121 cre, 94

NGU LIỆU 2-55 SSSE2EEEE2E23212212212112112111211211211111111.11 1.111 y 98

10800 90 99

Trang 7

DANH MỤC CÁC CHỮ VIET TAT

NLP Natural Language Processing

Xử lý ngôn ngữ tự nhiên

VCL Vietnamese Computational Lexicon

Từ điển tiếng Việt dành cho máy tinh

viVerbNet Mạng ngữ nghĩa động từ dành cho tiếng Việt

VTB Vietnamese Treebank

Ngân hang câu tiếng Việt được chú giải cú pháp

Trang 8

DANH SÁCH BANG BIEU

Bảng 1.1: Một lớp động từ trong VerbiNet -. Sc s3 neirerrexee 24

Bảng 1.2: Nghĩa của từ “yêu” (love) trong VCL 5c +ss*s++ssseeeeeeesesee 26

Bảng 2.1: Phân biệt dest, dest_conf, dest_dir, đr - 5+5 s << ++ecs+eesexs 45

Bang 3.1: Mô tả tính toán độ tương tự nghĩa cON - 5 5 55 + s sisireerree 53

Bang 3.2: Nghĩa con động từ của từ "di" trong VCL - 55555 s+xcsssecsees 55

Bảng 3.3: Phan bố và tần suất xuất hiện các nghĩa con cua từ động từ “di” trong

ai 57

Bảng 3.4: Các lớp động từ trong VerbNet tương đương với các nghĩa con động

"0 :-a AAA Ẽ.ăäăäă 58

Bang 3.5: Khung cú pháp động từ “đi” trong viVerbiNet <ccs<cc+s 59

Bang 3.6: Nghia con động từ cua từ "danh" trong VC 555 ++*csc+ 60

Bảng 3.7: Phân bố và tần suất xuất hiện các nghĩa con của từ động từ "đánh" trong

2i Ô 62

Bảng 3.8: Các lớp động từ trong VerbNet tương đương với các nghĩa con động

Bảng 3.9: Khung cú pháp động từ “đánh” trong viVerbNet -‹ -‹+- 64

Bảng 3.10: Nghĩa con động từ của từ “cho” trong VC -s<+<<s++ss2 65

Bảng 3.11: Phân bố và tần suất xuất hiện các nghĩa con của từ động từ “cho”

trong VITT -c cọ TT ch 66

Bang 3.12: Các lớp động từ trong VerbNet tương đương với các nghĩa con từ “cho” 67

Bang 3.13: Khung cú pháp động từ “cho” trong vIVerbiNet « «+- 68

Trang 9

DANH SÁCH HÌNH

Hình 0.1: Quy trình làm vVIỆC - 5 2c 321132111 1111351111111 1 1E rrrkre 10

Hình 1.1: Biểu diễn ràng buộc ngữ nghĩa của nghĩa con đi (5) trong VCL 28Hình 2.1: Cây ràng buộc ngữ nghĩa của VerbNet tiếng Anh - 43

Hình 2.2: Rang buộc ngữ nghĩa cho lớp send- Ï Ï Í ¿- - +s+c+c+esrsrerererxes 44

Hình 2.3: Cây phân cấp các ràng buộc vai nghĩa dành cho giới từ miêu tả không

SVAN oe 45

Hình 3.1: Sơ đồ các bước đánh giá độ tương tự các nghĩa con động từ 51

Trang 10

MỞ DAU

Cùng với sự phát triển như vũ bão của khoa học công nghệ, nhu cầu về xử lý

ngôn ngữ tự nhiên trong lĩnh vực trí tuệ nhân tao (Artificial Intelligence) cũng ngày

càng gia tăng Ngôn ngữ là phương tiện giúp mã hóa thông tin, biểu đạt và lưu giữtri thức, kinh nghiệm của con người Xử lý ngôn ngữ tự nhiên (NLP) liên quan đếnkhả năng tự động hiểu và tạo sinh ngôn ngữ

Việc hiểu tự động văn bản viết bang ngôn ngữ tự nhiên đòi hỏi phải có cácphương pháp giải quyết các bài toán phân tích ngôn ngữ ở các tầng bậc khác nhau

như phân tích hình thái, phân tích cú pháp, phân tích ngữ nghĩa, phân tích ngữ

dung, Phân tích và biéu diễn ngữ nghĩa là một chủ đề nghiên cứu day thách thức

và có tính thời sự Các hội nghị khoa học thường niên hàng đầu trong lĩnh vực xử lýngôn ngữ tự nhiên trên thé giới trong những năm gần đây luôn có các hội thảo

chuyên đề về vấn dé này như hội thảo DMR! (Designing Meaning Representation),ISA’ (Interoperable Semantic Annotation)

Khi biểu diễn ngữ nghĩa của một câu hay một mệnh dé, chúng ta phải xác

định được vị từ tương ứng với thành phan trung tâm của câu hay mệnh dé, vai nghĩacủa các thành phần bổ nghĩa cho thành phần trung tâm, và các ràng buộc cú pháp -

ngữ nghĩa của các thành phần này Các ràng buộc ngữ nghĩa giúp quy định đặcđiểm ngữ nghĩa của các hiện tượng, sự vật đảm nhiệm vị trí vai nghĩa trong câu

Còn các ràng buộc cú pháp giúp quy định khả năng kết hợp và thứ tự của các thành

tố ngữ pháp trong câu Một trong những tài nguyên vô cùng quan trọng cho xử lý

ngữ nghĩa trong ngôn ngữ tự nhiên chính là kho từ vựng bao hàm các đặc tả ràng

buộc cú pháp - ngữ nghĩa cho các tham thé gắn với từng đơn vị từ vựng có thé đóng

vai trò vi từ trung tâm.

Các ràng buộc cú pháp và ngữ nghĩa ở các ngôn ngữ luôn có những đặc điểm

tương đồng và khác biệt, phụ thuộc vào cách tri nhận thế giới của người bản ngữ và

các đặc trưng ngữ pháp của ngôn ngữ Luận văn này tập trung vào vấn đề xây dựng

Ị https://dmr2024.github.1o/index.html

? https://sigsem.uvt.nl/isa20/

Trang 11

mô tả vai nghĩa và các ràng buộc cú pháp và ngữ nghĩa của các thành phần bé nghĩa

cho vị từ trung tâm trong câu tiếng Việt trên quan điểm đối sánh với tiếng Anh

Trong phần mở đầu này, luận văn sẽ giới thiệu tổng quan tình hình nghiêncứu trước khi đi vào giới thiệu mục tiêu và nội dung nghiên cứu cụ thể

1 Tổng quan tình hình nghiên cứu

Trên thế giới đã có nhiều nghiên cứu xây dựng các tài nguyên từ vựng cungcấp các thông tin về quan hệ và ràng buộc cú pháp - ngữ nghĩa phục vụ cho xử lý

ngôn ngữ tự nhiên Có thé kế đến một số tài nguyên tiêu biểu cho tiếng Anh như

WordNet [33], FrameNet [25], VerbNet [28].

WordNet? là tài nguyên từ vựng tiếng Anh lớn gồm 117.000 synset (tdp hợpnghĩa) Các synset này được liên kết với nhau bằng quan hệ ngữ nghĩa như đồng

nghĩa, trái nghĩa, thượng danh, hạ danh, WordNet là một tài nguyên từ vựng cực

kì hữu ích trong việc phân tích nghĩa và liên kết nghĩa

FrameNet* là một kho ngữ liệu gồm hơn 13.000 đơn vi từ vựng kèm theo

khung ngữ nghĩa Hơn 200.000 câu được chú giải thủ công với hơn 1.200 khung

ngữ nghĩa vị từ trong FrameNet cung cấp một tập ngữ liệu đào tạo cho nhiều ứngdụng dịch máy, phân tích nghĩa, trích xuất thông tin,

VerbNet” là tài nguyên từ vựng tiếng Anh cung cấp các thông tin về khung

cú pháp, biểu diễn vai nghĩa, ngữ nghĩa và các ràng buộc cú pháp — ngữ nghĩa của

9344 động từ được phân loại thành 329 lớp con” Tài nguyên từ vựng này có liên

kết với các nguồn tài nguyên từ vựng khác như WordNet, FrameNet VerbNet được

sử dụng rộng rãi trong các kho văn bản có chú giải ngữ nghĩa, phục vụ các ứng

dụng về biểu diễn và phân tích ngữ nghĩa của ngôn ngữ tự nhiên

Đối với tiếng Việt, Từ điển tiếng Việt dành cho máy tính” (VCL) [2] là một

tài nguyên từ vựng máy tính gồm có 42.000 mục từ vựng VCL có mô tả về từ loại

Trang 12

gắn với từng nghĩa con của mỗi mục từ Đối với các động từ có thê làm vị từ trung

tâm, VCL có chứa thông tin về các khung vị từ, vai nghĩa và một số ràng buộc ngữ

nghĩa, ngữ pháp Tuy nhiên các thông tin này còn chưa đầy đủ, cũng chưa có phânlớp các động từ theo các ràng buộc về nghĩa Do vậy, có thé nói là tiếng Việt chưa

có một tài nguyên từ vựng nao tương đương với VerbNet dé phục vụ cho phân tích

ngữ nghĩa sâu ngôn ngữ tự nhiên Việc xây dựng một mạng động từ dành cho tiếngViệt với các thuộc tính tương đương với VerbNet tiếng Anh là cấp thiết và có ý

nghĩa thực tiễn cao.

Mặc dù từ điển VCL đã có nhiều thông tin cơ bản và quan trọng về ngữ pháp

và ngữ nghĩa, việc xây dựng một mạng ngữ nghĩa như VerbNet là điều không hềđơn giản Do ngữ pháp tiếng Việt và tiếng Anh có rất nhiều sự khác biệt, không thê

sử dụng hoàn toàn các biểu diễn của VerbNet tiếng Anh cho tiếng Việt Bên cạnh

đó, việc tri nhận về sự vật, sự việc, hiện tượng giữa tiếng Anh và tiếng Việt cũng cónhiều sự tương đồng và khác biệt nên các ràng buộc về ngữ nghĩa của của hai ngônngữ cũng có sự khác biệt Ví dụ như khi sử dụng giới từ, tiếng Anh sử dụng giới từ

“in” trong câu “There are a lot of cloud in the sky”, tiếng Việt lại sử dụng giới từ

“trên”, cụ thé hơn trong câu “Có nhiều mây trên bau trời ”

Việc xây dựng mạng động từ cho tiếng Việt (viVerbNet) đã được các tác giảbước đầu xây dựng từ năm 2020 [5][30] Nhóm tác giả đã trích rút 6652 động từ củaVCL, sử dụng thuật toán phân cum dé chia các động từ nay thành 1000 nhóm có độ

tương đồng ngữ nghĩa caoŸ Sau đó, các tác giả trích ra 100 nhóm dé khảo sát, xây

dựng khung cú pháp ngữ nghĩa dựa trên cơ sở đối chiếu với các nhóm động từ

tương đương của VerbNet Tuy nhiên, nghiên cứu này vẫn chưa có đầy đủ các mô

tả chi tiết của các ràng buộc ngữ nghĩa và cú pháp cụ thé cho từng lớp động từ tiếng

Việt.

Từ tình hình nghiên cứu trên, vấn đề đặt ra đối với luận văn này là đóng góp

vào việc xây dựng các mô tả ràng buộc cú pháp — ngữ nghĩa cho các lớp động từ

8 Mỗi động từ có một biểu diễn véc-tơ (word embedding) được xác định dya vào tat cả các ngữ cảnh của từ

đó trong một kho văn bản kích thước lớn Độ tương đông ngữ nghĩa giữa 2 từ được tính dựa trên khoảng cách của các véc-tơ này.

Trang 13

trong viVerbNet.

2 Mục đích và nhiệm vụ nghiên cứu

Mục đích cụ thê của luận văn là nghiên cứu biểu diễn ràng buộc cho một sỐđộng từ tiếng Việt dựa trên các đặc trưng về cú pháp tiếng Việt, kết hợp với việc đối

chiếu với các ràng buộc cú pháp - ngữ nghĩa của các động từ tiếng Anh tương

đương trong VerbNet nhằm thuận tiện trong việc chia sẻ các tài nguyên

Với mục đích nghiên cứu đã được đặt ra như trên, luận văn cần phải thực

hiện được một số nhiệm vụ sau:

- Trích xuất các khung cú pháp từ văn bản tiếng Việt phục vụ cho việc biểu

diễn ràng buộc cú pháp và ngữ nghĩa cho các động từ đại diện một số lớp

động từ cơ bản.

- _ Xây dựng bộ nhãn ràng buộc cú pháp - ngữ nghĩa của viVerbNet dựa trên co

sở đối chiếu và ánh xạ với VerbNet

3 Đối tượng và phạm vi nghiên cứu

Trong khuôn khổ luận văn, học viên lựa chon ba động từ làm đại diện cho balớp động từ có khung cú pháp tiêu biểu là động từ nội động (intransitive), động từ

ngoại động đơn (monotransitive), động từ ngoại động kép (ditransitive) - bao ham các động từ trao nhận Ba động từ được chon là “đi”, “đánh” và “cho” Cac động

từ này đều là những động từ có nhiều nghĩa con cần được khảo sát

4 Phương pháp và quy trình nghiên cứu

Bên cạnh các phương pháp nghiên cứu chung như phân tích tài liệu, liệt kê,

luận văn còn sử dụng các phương pháp nghiên cứu sau:

- Phuong pháp mô tả: Được sử dụng dé mô tả khung cú pháp và quan hệ cú

pháp của đối tô và vị tố là động từ chính của câu, đồng thời mô tả các ràngbuộc về cú pháp và ngữ nghĩa trong câu đó

- Phương pháp đối chiếu: Luận văn sẽ đối chiếu tiếng Anh và tiếng Việt trên

hai bình điện chính: ngữ pháp và ngữ nghĩa Về ngữ pháp, luận văn đối chiếu

các đặc điểm tương đồng và khác biệt trong ngữ pháp tiếng Anh và tiếng

Việt Vê ngữ nghĩa, luận văn đôi chiêu các đặc điêm tri nhận về sự vật, hiện

Trang 14

tượng giữa hai ngôn ngữ Anh và Việt.

- Phuong pháp anh xạ: viVerbNet được xây dựng dựa trên khung mô hình của

VerbNet nên việc đảm bảo tính tương thích được đặt lên hàng đầu để đảmbảo việc chia sẻ và khai thác các tai nguyên về sau được diễn ra thuận lợi.Chính vì vậy mà việc ánh xạ các thông tin về sự tương đồng trong biêu diễnràng buộc cú pháp và ngữ nghĩa giữa tiếng Anh và tiếng Việt rất được chú

trọng Các đặc điểm khác biệt sẽ được biểu diễn tương thích với mô hình

VerbNet.

Ngoài ra, luận văn còn sử dụng các ứng dụng của khoa hoc công nghệ ma

đặc biệt là ngành khoa học dữ liệu trong việc đánh giá độ tương tự của các động từ

trong ngữ cảnh cụ thé Sơ đồ trong Hinh 0.1 biểu diễn quy trình thực hiện nghiên

Luận văn sẽ khảo sát các nghĩa con động từ được trích xuất từ VCL trên cơ

so so sánh độ tương tự với các động từ được trích xuất từ kho đữ liệu được gánnhãn cú pháp VietTreebank (V7B) Sau đó, phân loại về nghĩa con và trích xuất cáckhung cú pháp động từ Cuối cùng, biểu diễn các ràng buộc cú pháp và ràng buộc

ngữ nghĩa trên cơ sở ngữ pháp tiếng Việt kết hợp với việc ánh xạ từ VCL vàVerbNet tiếng Anh

5 Ý nghĩa của luận văn

Luận văn này có ý nghĩa quan trọng trong việc xây dựng biểu diễn ràng buộc

cú pháp và ngữ nghĩa phù hợp với các đặc điêm của tiêng Việt có đôi chiêu với

10

Trang 15

tiếng Anh, phục vụ cho các ứng dụng xử lý ngôn ngữ tự nhiên.

Ngoài ra, sau khi hoàn thiện, viVerbNet có thể được ứng dụng vảo trong việcgiảng dạy tiếng Việt dành cho người nước ngoài Do các lớp động từ được liên kết

với nhau về ngữ nghĩa va cú pháp nên khi người học biét được cách sử dụng một

động từ sẽ có thể biết được cách sử dụng của tất cả động từ cùng nhóm

6.

sau:

Bô cục của luận văn

Ngoài các phan mở đâu, kết luận, nội dung của luận văn gôm ba chương như

Chương 1 Kiến thức cơ sở: Trinh bày khái niệm động từ, các cách phân loạiđộng từ; khái niệm vai nghĩa, các cach phân loại vai nghĩa; một sỐ thông tin

về các nguồn tài nguyên như VerbNet, VCL, VTB

Chương 2: Mô hình viVerbNet: Trình bày một số thay đổi trong cách biểudiễn các thành phan của viVerbNet so với VerbNet tiếng Anh

Chương 3 Khảo sát nghĩa con và khung cu pháp cua động từ dựa vào VCL

va VTB: Chương này sẽ nghiên cứu về các nghĩa con của ba động từ “di”,

“đánh” và “cho” Sau đó trích xuất và mô tả các khung cú pháp của các

động từ nay.

Chương 4 Nghiên cứu biểu diễn ràng buộc cú pháp và ngữ nghĩa cho động

từ tiếng Việt: Trình bày về biểu diễn ràng buộc cú pháp và ràng buộc ngữ

nghĩa cho các động từ “di”, “đánh” và “cho”.

11

Trang 16

Chương 1 KIÊN THỨC CƠ SỞ

hạt nhân ngữ nghĩa của câu (có vị ngữ), giúp kết nối các thành phần tham tố tham

gia vào việc biêu diễn ngữ nghĩa của một câu Theo đó ngữ nghĩa của một câu đượcbiểu diễn dựa vào mối quan hệ của vị từ đối với các tham tô xung quanh nó

Vị từ là những từ có thể trực tiếp làm vị ngữ trong câu, nó là động từ, tính từ

và thậm chí là một danh từ Nghiên cứu về viVerbNet sẽ tập trung chủ yếu vào động

từ, và mỗi quan hệ ngữ nghĩa của chúng đối với các vai nghĩa

Về khái niệm động từ, có rất nhiều định nghĩa xoay quanh khái niệm này

Theo Từ điển tiếng Việt của Hoàng Phê, động từ là “tr chuyên biểu thị hành động,

trạng thái, hay qua trình, thường làm vị ngữ trong cau” [18, tr 346] Định nghĩa

này được học viên nhận định là định nghĩa khái quát nhất về động từ và nhận được

sự tán thành của rất nhiều nhà nghiên cứu khác

Trong cuốn Ngữ pháp tiếng Việt (từ loại) tac giả Dinh Văn Đức đã định

nghĩa: “Đồng từ chỉ các hành động (tôi chạy, nó đọc); trạng thải (tôi ngủ, nó thức),

các liên hệ dưới dạng tiễn trình (tôi yêu quê hương, tôi hiểu bạn bè) có moi quan hệvới chủ thể và diễn ra trong một khoảng thời gian” [1, tr 127]

Cùng chung quan điểm như vậy, tác giả Diệp Quang Ban và Hoàng VănThung (Ngữ pháp tiếng Việt (tập 1)) cũng đã cho rằng: “Động từ là những từ biểu

thị ý nghĩa khái quát về quá trình — ý nghĩa quá trình thể hiện trực tiếp đặc trưngvận động của thực thể Đó là ý nghĩa hành động, ý nghĩa trạng thái được khái quát

12

Trang 17

hóa trong mối liên hệ với vận động của thực thể trong thời gian và không gian ” [4,

tr 90].

Các quan điểm về định nghĩa động từ của các nhà ngôn ngữ học ở Việt Nam

có độ tương tự rất cao Chúng ta có thể nói một cách ngắn gọn lại như sau: Động tu

là từ dùng để biểu thị hành động, trạng thái, hay quá trình của một sự vật, hiện

Theo quan điểm phân loại của Diệp Quang Ban trong cuốn Ngữ pháp tiếng

Việt (tập 1): “việc phân loại phải dựa vào khả năng kết hợp của động từ với nhóm

từ tình thái có tác dụng “dạng thức hóa” động từ và khả năng kết hợp với các thực

từ biểu thị nội dung “chỉ phối của động từ, hoặc biểu thị nội dung đòi hỏi của động

+ Ý nghĩa tình thái về sự cần thiết: “cẩn”, “nên”, “phải ”,

+ Ý nghĩa tình thái về khả năng: “có thé”, “không thể”, “chưa thể”,

Id 66 ^ 66 ”

+ Chỉ ý nghĩa tình thái về ý chí: “toan”, “định”, “no”, “dám ”,

+ Chỉ ý nghĩa tình thái mong muốn: “mong muốn”, “wóc”, “mong ước”,

“ước muốn ””,

+ Chỉ tình thái tiếp thụ, chịu đựng: “bi”, “mắc”, “phải”, “được ”,

+ Chỉ ý nghĩa tình thái đánh giá nhận định: “cho”, “xem”, “thấy”,

- Nhóm động từ quan hệ:

N99 66

+ Chi quan hệ đồng nhất hiểu rộng: “/a”, “lam”

13

Trang 18

“ 3

+ Chỉ quan hệ tồn tại (xuất hiện, ton tại hoặc tiêu biểu): “co”, “con”,

“biến”, “mắt”, “sinh” (ra)

+ Chỉ quan hệ sở hữu: “có ”

+ Chỉ quan hệ biến hóa: “hành”, “hóa”, “hóa ra”, “hóa thành”, “trở

thành ”,

r 99

+ Chỉ quan hệ diễn biến theo thời gian: “bat dau”, “tiếp tục”, “kết thúc”,

+ Chỉ quan hệ so sánh, đôi chiêu: “giống”, “khác”, “như”, “tựa”, “in”,

“hãy”, “đừng”, “chớ” và với “quá”, “lắm”; (2) — không kết hợp được với

“rất”, “hơi”, “khá”: “viết, “đánh”, “di”, “làm”, Động từ chỉ hành độngcòn kết hợp được với “xong”: “nói”, “nghe”, “suy nghĩ”, “sửa chữa ”,

+ Nhóm động từ chỉ trạng thái: những động từ kết hợp được với “hay”,

lê bì

“đừng”, “chớ”; với “lam”, “qua” và với “rat”, “hơi”: “yêu”, “ghét”,

r A22

“thương”, “giận”, ; những động từ kết hợp được với “xong”: “thay”,

“hiểu”, “moi”, “biết ”,

Các nhóm động từ phân loại theo các thực từ đi kèm:

+ Nhóm động từ không doi hỏi thực từ đi kèm: “noi”, “cười”, “khóc”,

,

“ngồi”, “đứng”, “bò”, thường chỉ hành động cơ thể (vận động sinh lý)

hoặc chỉ trạng thái tâm lý Những động từ này được gọi là động từ nội động.

+ Nhóm động từ có thực từ đi kèm biểu thị đối tượng tác động: “đánh”

(giặc) “trồng” (cây), “viết” (báo) Nhóm động từ nay còn được gọi là

động từ ngoại động.

+ Nhóm động từ có hai thực từ đi kèm biểu thị đối tượng phát/nhận và đối

tượng được lợi hay bị thiệt hại do tác động của hành động nêu ở động từ:

14

Trang 19

“cho” (em) (một gói qua), “gửi” (bạn) (một bức thw), Day cũng là những động từ ngoại động.

+ Nhóm động từ có hai thực từ đi kèm biểu thị đối tượng sai khiến và nộidung sai khiến: “nhờ” (bạn) (xách nước), “bảo” (con) (hoc), “cử” (người)(tiép khách) Là những động từ khiến động thuộc lớp ngoại động

+ Nhóm động từ có thực từ đi kèm chỉ hướng dời chuyền hoặc hướng kết nối

của hành động nêu ở động từ; hoặc chỉ dời chuyển của hành động, hoặc nêuđối tượng bị tác động dời chuyên: “lăn” (vào), “chạy” (ra), “di” (xuống),

“buộc ” (vào), “cởi thảo ” (ra), “chạy” (ra pho), “lên ” (gác), “ra” (phô)

Động từ nội động: “ngủ”, “tam”, “cười ”,

Động từ cảm nghĩ: “nghe”, “ biết”, “tin”,

Động từ phương hướng: “di”, “chạy”, “học”,

động từ đó theo lớp, loạt mà nó có quan hệ và đưa ra phân loại động từ thành một số

tiêu loại cơ bản như:

Trang 20

- Cac động từ tong hop: “di đứng”, “nói năng”, “chờ đợi”, “bai cãi”, “trò

chuyện ”, “viết lách ”, “dàn xếp "

- Cac động từ chuyền động: “di”, “chạy”, “trượt”, “lướt”,

[7 tr 136-143]

Cao Xuân Hạo (2006) đã áp dụng các quan điểm các các nhà ngôn ngữ như

L Tesniére, C.J Fillmore, W.L Chafe, S.C Dik, M.A.K Halliday, v.v dé phanbiệt các sự tinh trong tiếng Việt Ong đã áp dụng các tiêu chí co ban của Dik déphân loại sự tình Tuy nhiên có bé sung thêm sự tình /7ồn tai] ngang hàng với các

sự tình cơ bản là /Bién cd] và [Tình hình] Cách phân loại sự tình nay cũng làmhình thành lên các kiểu câu khác nhau: Câu tồn tại, câu chỉ hành động (vô tac,

chuyển tác), câu chỉ quá trình (vô tác, chuyển tác), câu chỉ trạng thái, câu chỉ quan

hệ Từ đó có thê suy ra được các nhóm vi từ đặc trưng cho từng kiểu câu Tuy nhiênđây là một nghiên cứu về động từ nên luận văn sẽ chỉ liệt kê các nhóm động từ cơ

bản của tác giả như sau:

- _ Nhóm động từ chỉ sự ton tại: “có”, “ngôi ” “treo ”,

- _ Nhóm động từ chỉ hành động vô tác: “chạy”, “vào”, “rời”,

- _ Nhóm động từ chỉ hành động chuyển tac: “lau”, “đóng”, “đánh”, “cho”

«

- Nhóm động từ chỉ quá trình vô tac: “rụng”, “ngả”, “tái”, “toát”,

- _ Nhóm động từ chỉ quá trình chuyên tác: “mở”, “mo tung”, “huy diét”’,

Id 66

- Nhom động từ chỉ trang thái: “yêu”, “thương”, “ghét”, “vui”, “lo”

- _ Nhóm động từ chỉ quan hệ: “/dm cho”, “cản trở”, “quy định”, “khiến ”,

[13, tr 430-447]

Cách phân loại của Levin (1993) lại có những đặc điểm nổi bật riêng Tácgiả quan tâm đến các tiêu chí như ý nghĩa, khả năng kết hợp, khả năng chuyên hóa,khả năng thay đổi trạng thái và các ràng buộc ngữ nghĩa của chúng Có nghĩa là cácnhóm động từ được Levin phân loại ngoài việc có chung những đặc điểm chungnhất về nghĩa con thì phải cùng chia sẻ một bộ khung cú pháp chung Theo đó,Levin đã phân loại thủ công 3024 động từ tiếng Anh với 4186 nghĩa con ra thành

192 nhóm động từ cơ bản, trong đó có các lớp con của các nhóm này Chúng ta có

16

Trang 21

thé kề tên một số nhóm tiêu biểu như:

- Nhóm động từ thể hiện hành động loại bỏ (Verbs of Removing): “loại”,

“bỏ”, “xóa ”,

- Nhóm động từ thé hiện hành động đặt (Verbs of Putting): “đặt”, “dé”,

“reo ”,

- Nhóm động từ thể hiện hành động gửi và mang (Verbs of Sending and

Carrying): “gửi”, “mang”,

- _ Nhóm động từ thé hiện sự thay đổi sở hữu (Verbs of Change of Possession):

“cho”, “đổi”, “tặng ”, [31]

Cách phân loại này của Levin là một cách tiếp cận khá mới và hữu hiệu trong

việc phân loại động từ, cách phân loại này của tác giả cũng được ứng dụng một

cách rất rộng rãi trong rất nhiều nghiên cứu ngôn ngữ học và nghiên cứu về xử lýngôn ngữ tự nhiên mà VerbNet tiếng Anh là một điển hình Tuy nhiên cách phân

loại này vẫn còn một số điểm hạn chế sau:

Thứ nhất, cách phân loại này của Levin phần lớn dựa trên cấu trúc ngữ phápcủa động từ, tức là khả năng kết hợp của nó trong câu với một số đặc điểm về nghĩa

con mà không chú trọng đến yếu tô ngữ cảnh, điều này có thé làm mat đi sự đa dang

về nghĩa của động từ khi mà có sự thay đôi về ngữ cảnh

Thứ hai, cách phân loại của Levin chưa đưa ra được các hướng dẫn phân loại

cụ thê nhất của từng động từ tùy thuộc theo từng ngữ cảnh, điền này cũng khiến độcgiả gặp khó khăn trong việc tiếp cận và lý giải vấn đề

Thứ ba, vẫn còn xuất hiện tình trạng một sé động từ không rõ thuộc vàonhóm nao, điều này có thé khiến cho việc phân loại có thé trở nên mơ hồ và khó

Trang 22

phân loại động từ Vì thế, luận văn sẽ kết hợp cách phân loại này với các quan điểmphân chia của các nhà ngôn ngữ học dé hình thành lên cách phân loại cho các động

từ tiếng Việt Khi thực hiện phân loại cũng như biểu diễn ngữ nghĩa của động từ,luận văn vẫn giữ quan điểm là đề cao hai tiêu chí về ngữ pháp và ngữ nghĩa, songviệc đánh giá về ngữ nghĩa và ngữ cảnh sẽ được chú trọng hơn đề khắc phục tối đahạn chế của Levin

1.2 Một số vấn đề về vai nghĩa

1.2.1 Khái niệm vai nghĩa

Vấn đề vai nghĩa là một lĩnh vực nghiên cứu đã được khá nhiều nhà ngônngữ học trên toàn thế giới quan tâm, nghiên cứu Tesnière được xem là người đầutiên nghiên cứu về vai nghĩa và cho răng cấu trúc cú pháp của câu bao gồm vị từlàm trung tâm, xoay quanh là những tham tố biểu thị những vai nghĩa đó Nghĩa của

vị từ quy định ngữ trị (hay khung tham to) của nó, tức là số lượng và tính chất của

các tham tố chỉ các vai nghĩa tham gia vào sự tình mà câu đó biểu hiện [Dẫn theo

10, tr 474].

Đồng tình với quan điểm Ấy, C.J Fillmore cho rang, một su tinh bao gom

một vi từ trung tâm và các ngữ đoạn quanh nó biểu thị cho các vai nghĩa hoặc cáchngữ nghĩa khác nhau Ông cũng đưa ra một định nghĩa về vai nghĩa rất phô biến vàphố quát, “Y niệm về cách bao gồm một tập hợp khái niệm pho quát, được giả định

là bẩm sinh, xác định những kiểu tri nhận nào đó của con người về những sự tìnhđang diễn ra quanh họ, tri nhận những van dé như ai thực hiện nó, nó xảy ra đốivới ai, và cái gì thay doi” [ Dẫn theo 15, tr 41]

Theo tác giả Cao Xuân Hạo, câu biểu hiện một sự tình (hay sự thê) Nội dung

(nghĩa biểu hiện) của nó có thể hình dung như một “cảnh ” (một màn kịch ngắn)diễn trên sân khấu Cái “cản” ay có một nội dung nhất định: trên sân khấu hiện raquang cảnh nào đây (một sự tình tĩnh), rồi lại điễn ra một sự việc nào day (một sự

tình động) Các nhan/vat (đọc là “nhân và vật” hoặc là “nhân hay vật”) có mặt trên

sân khẩu được gọi là tham tổ của sự tình hay vai (“vai nghĩa”) [10; tr 51]

Tác giả Nguyễn Văn Hiệp còn đưa ra một nguyên tac: “Vai nghĩa mà một

18

Trang 23

thực thé đảm nhiệm trong sự tình luôn luôn phụ thuộc vào bản chất của sự tình đó,

và thuc là vô nghĩa nếu ta tách biệt các vai nghĩa khỏi sự tình mà trong đó chúng

xuất hiện ” [15, tr 47] Nguyên tắc này là rất quan trọng trong việc phân định vàtrừu tượng vai nghĩa Khi xác định vai nghĩa cho một thực thể trong một sự tình, tacần phải lưu ý rằng vai nghĩa đó phụ thuộc vào bản chat của sự tình đó và không thétach ra khỏi nó Việc tách ra khỏi sự tình sẽ dan đến hiểu sai vai nghĩa của thực thé

đó trong sự tình đó Do đó, trong quá trình phân tích vai nghĩa, chúng ta cần luôn

cân nhắc và giữ nguyên mối liên hệ giữa vai nghĩa và sự tình

Như vậy, từ những phân tích trên, chúng ta có thể đưa ra một định nghĩachung cho khái niệm của vai nghĩa như sau: Vai nghĩa là tập hợp các tham to ngữnghĩa xung quanh vị từ, có moi quan hé vé mat ngữ nghĩa đối với các vị từ và thể

hiện ý nghĩa của câu Các vai nghĩa này mặc dù tôn tại độc lập với một ngôn ngữ

cụ thé nào nhưng lại có tinh gắn bó khang khít với sự tình, không thé tách biệt ra

khỏi sự tình và có tính pho quát (phổ niệm) đối với tat cả các ngôn ngữ

1.2.2 Phân loại vai nghĩa

Tesnière, người đầu tiên nghiên cứu về vai nghĩa đã nhận định rằng một câu

có một vị từ làm trung tâm và các tham tô xoay quanh nó biéu thị những vai nghĩa

đó và nghĩa của vị từ được xác định bởi ngữ trị (hay khung tham tổ) của nó Ôngnhận định rằng việc phân tích câu thành chủ ngữ và vi ngữ là sai lầm hoàn toàn, bởiđây là kết quả của việc lẫn lộn cau trúc của câu với cau trúc mệnh dé Theo ông:

“Cấu trúc cú pháp của câu xoay quanh vị từ và các diễn tô (actants) làm bồ ngữcho nó Chủ ngữ chẳng qua là một trong các bồ ngữ đó Mỗi vị từ biểu hiện “một

màn kịch nhỏ”, nó có một diễn trị (valence) riêng được thể hiện trong số lượng các

dién tổ của no.” [Dẫn theo 15, tr 82] Các vị từ khác nhau cơ bản về số lượng diễn

tố trong vị ngữ, dựa trên tiềm lực cú pháp - ngữ nghĩa của vị từ để phân loại chúngthành:

- Vị từ vô trị (avalents) không có dién tô nào trong câu, ví dụ như vị từ pleut,

il pleut “mưa” không có diễn tô nào

- Vị từ don trị (monovalents) là vị từ có một diễn tố, ví dụ như tomber “ngã”

19

Trang 24

- Vi từ song tri (bivalents) là vi từ có hai diễn tố, ví dụ như frapper “đánh”.

- Vị từ tam trị (trivalents) là vi từ có ba diễn tố, ví dụ như đonner “cho”

Lý thuyết của Tesniére phân biệt diễn tố và chu tố Trong đó, diễn tố (actant)

là những vai nghĩa bắt buộc sẽ được hiện thực hoá thông qua những ngữ đoạn, còn

những vai nghĩa tuỳ nghị thì được hiện thực hoá thông qua những ngữ đoạn được

gọi là chu tô (circonstant) Việc đánh giá một vai nghĩa là bắt buộc hay tuỳ nghỉphải đặt trong quan hệ với vị từ trung tâm: một vai nghĩa có thê là tuỳ nghỉ với vị từnày, nhưng lại là bắt buộc với vị từ khác

Có nhiều điểm tương đồng với Tesniére, C.J Fillmore cũng cho rang một sựtình gồm một vị từ trung tâm và quây xung quanh nó là các ngữ đoạn biểu thị những

cách ngữ nghĩa hay vai nghĩa (semantic role) nào đó [Dẫn theo 15, tr 41].

Những năm 1960, 1970, C.J Fillmore viết một loạt bài trong đó nổi tiếng

nhất là bài viết mang tên The case ƒor case (Đề biện hộ cho cách) được công bố

năm 1968 Trong các nghiên cứu của mình, Fillmore chú trọng việc xây dựng một

tập hợp các mối quan hệ cách (case relationships) giữa một vị từ và các tham tố(arguments) của nó Mỗi động từ đều có các nghĩa con thé hiện các đặc trưng khung

(frame features) nêu rõ các khung “cách” mà các vị từ đó có thé được đặt vào Các

mỗi quan hệ mà Fillmore gọi là quan hệ cách này theo ông có tính chất phô quát và

có số lượng hữu han Fillmore đã giới thiệu 6 cách sau:

- Agentive (Tác cách), chi vai chủ thé của hành động do động từ biểu thị

- Instrument (Công cu cách), chỉ vai công cụ của hành động do động từ biểu

- Locative (Vi tri), chi vi trí của trang thái hay hành động do vi từ biểu thị

- Objective (Đối tong), là cách trung hòa nhất về nghĩa, chỉ bat kỳ vật gì được

biểu thị băng một danh từ mà vai trò trong hành động hay trạng thái được động từ

20

Trang 25

biểu thị được chính cách thuyết minh nghĩa của động từ quy định.

- Time, chỉ thời điểm của trạng thái hay hành động do vị từ biểu thị

- Source, chỉ chỗ xuất phát của sự chuyền động do vị từ biểu thi

- Goal, chỉ mục tiêu của sự chuyển động do vi từ biểu thị

- Direction, chỉ phương hướng của sự chuyên động do vị từ biểu thị

- Exent, chỉ tầm xa của sự chuyển động hay thời gian kéo dài của một trạng

thái hay hành động do vị từ biéu thị.

[Dẫn theo 15, tr 84]

Trong cuốn Cơ sở ngữ nghĩa phân tích cú pháp (2008), Nguyễn Văn Hiệpcũng đã định nghĩa khái niệm vai nghĩa theo quan điểm của Fillmore (1968), đưa radanh sách các vai nghĩa của Fillmore và danh sách các vai nghĩa cơ bản được hauhết các nhà nghiên cứu thừa nhận Không chỉ dừng lại ở đó, tác giả cho thấy sự thêhiện hình thức của vai nghĩa và đánh dấu các vai nghĩa, phân loại các kiểu sự tình,

sự đối chiếu của cấu trúc vai nghĩa lên cấu trúc cú pháp Danh sách các vai nghĩaphô biến được Nguyễn Văn Hiệp liệt kê và được hầu hết các nhà nghiên cứu chấpnhận gồm có: Vai tác thé (Agent), Vai nghiệm thé (Experiencer), Vai tiếp thé(Recipient), Vai kẻ hưởng lợi (Benefactive), Vai lực tự nhiên (Force), Vai bi thé

(Patient), Vai công cu (Instrument), Vai thực hiện hành động (Effector), Vai dia

diém, vi tri (Location hay Locative), Vai diém xuat phat, hay nguồn của trạng thái(Source), Vai điểm đến (Goal), Vai kẻ tham chiếu (Reference), Vai kẻ cùng hành

động (Comitant), Vai hướng chuyên động (Direction) hay lỗi di (Path), Vai thờiđiểm (Temporal), Vai chủ sở hữu (Possessor), Vai thời lượng (Duration), Vai nội

21

Trang 26

dung (Content), Vai thé chuyên động (Theme) Một số vai khác có tính chất ngoại vi

cũng được tác giả thừa nhận, như: vai nguyên nhân (Reason), vai mục đích (Purpose), vai cách thức (Manner).

[15, tr 42-44]

Một số nghiên cứu khác lại có một lối đi khác so với Fillmore, trong suốtthập kỷ 70 và thập kỷ 80 của thế kỷ trước, nhiều công trình nghiên cứu ngữ phápcách (case grammar) độc lập khác đã gây ra được một số tiếng vang nhất định.Trong số những công trình này phải kế đến W Chafe (1970), S.C Dik (1978), S

Starosta (1988)

Theo S.C Dik, chức năng ngữ nghĩa của chu tô bao gồm:

- Cac chỉ định phụ thêm cho sự tinh hạt nhân: Phương thức, Đặc trưng, Công

Cụ;

- Cac quan hệ cua sự tình với các tham tố khác: Lợi thể, Liên đới thé; Các

quan hệ của sự tình trong các chiều kích thời gian: Thdi gian, Thời đoạn, Tansố;

- Các quan hệ của sự tinh trong các chiều kích không gian: Vi tri, Nguồn,

Phương hướng, Lỗi di:

- Cac quan hệ của sự tình với các sự tình khác: Chu cảnh, Nguyên nhân, Ly do,

Mục dich, Kết quả

[Dẫn theo 4]

M A K Halliday (1985), một chuyên gia về ngữ pháp chức năng cho rằngbình diện nghĩa câu ở bậc nghĩa là nghĩa biểu hiện tức là cái nội dung nghĩa phảnánh sự tình trong thế giới được miêu tả

Ủng hộ quan điểm chức năng hệ thống của Halliday, trong công trình Wgữ

pháp kinh nghiệm cú tiếng Việt, nhà nghiên cứu Hoàng Văn Vân (2005) đã liệt kê

bộ vai nghĩa tiếng Việt như sau: hành thể, đích thể, lợi thể, tiếp thể, khách thể, khiếnthể, cảm thể, hiện tượng, đương thể, thuộc tính, tạo thuộc tính thể, giá trị, biểu hiện,

bị dong nhát thể, đông nhất thé, hiện hữu thể, phát ngôn thể, tiếp ngôn thể, ngônthể, dung môi, cuong Vực, ứng thể, chu cảnh gom pham vi, dinh vi, phong cach,

22

Trang 27

nguyên nhân, dong hành, van dé, vai diễn và quan điểm.

Trong nghiên cứu Vj tir hành động tiếng Việt và các tham tố của nó (So sánhvới tiếng Nga và tiếng Anh), Nguyễn Thị Quy (1995) đã chỉ xem xét một số thamthể như: đối tượng bị tác động, đích, nơi chốn, thời gian, người hưởng lợi, công cụ,người tiếp nhận

Ngoài công trình nêu trên, có thể kế đến công trình Tiếng Việt - Sơ thảo ngữ

pháp chức năng của Cao Xuân Hạo (2006) Cao Xuân Hạo có đưa ra danh sách

gồm các vai nghĩa cần yếu/bắt buộc: hành thé, hay kẻ hành động (actor), tac thé

(agents), đối thé hay bị thé (goal hay patients), nhận thé, đích, tạo thé (factitive),động thé hay quá thé, lực, nghiệm thé Ngoài những vai nghĩa - diễn tổ trên, CaoXuân Hạo còn đưa ra một số vai nghĩa - chu tô như: vai nguồn, vai đích, vai công

Cụ, vai Vị fri,

Nhìn chung, các tác giả trong và ngoài nước đã có nhiều điểm tương đồng

trong quan niệm phân chia vai nghĩa, tuy nhiên sự sai biệt theo từng ý chí chủ quan

của mỗi tác giả là có và điều này làm phức tạp hóa việc đưa ra một lý thuyết phổquát phục vụ quá trình phân chia vai nghĩa đáp ứng cho cho việc biểu diễn ngữnghĩa theo cấu trúc vị từ tham thé

Vì có nhiều quan điểm khác nhau về vai nghĩa nên việc định nghĩa một tậpvai nghĩa chuẩn mực là rất khó khăn Trong lĩnh vực xử lý ngôn ngữ tự nhiên, các bộngữ liệu khác nhau thường sử dụng các tập vai nghĩa khác nhau Chăng hạn VerbNet

phiên bản 3.2” sử dung tập 30 vai nghĩa, phiên bản 3.3'° sử dung tập 39 vai nghĩa

PropBank [30] chỉ sử dụng các vai nghĩa tổng quát và tham chiếu chỉ tiết tới VerbNet.FrameNet sử dụng tập nhãn rat chỉ tiết gắn liền với đặc trưng của từng khung

Về bản chất, gán nhãn vai nghĩa chỉ là một bài toán trung chuyên, chứ khôngthật sự là nền tang của một ứng dụng xử lý ngôn ngữ tự nhiên cụ thé nào Tuynhiên, đây lai là một bước cần thiết không thé bỏ qua trong các ứng dụng liên quanđến ngôn ngữ tự nhiên Việc xác định đúng vai nghĩa của các thành phần trong câu

7 https://verbs.colorado.edu/verb-index/vn/reference.php

10 https://verbs.colorado.edu/verb-index/vn3.3/vn/reference.php

23

Trang 28

là một vấn đề trung tâm của mọi hệ xử lý ngôn ngữ tự nhiên.

1.3 VerbNet

VerbNet là một công cụ biểu diễn ngữ nghĩa động từ, có liên kết tới các tài

nguyên từ vựng khác như WordNet, FrameNet và PropBank Đây là mạng động từ

tiếng Anh lớn nhất, đặc tả khung cú pháp, vai nghĩa, ràng buộc cú pháp - ngữ nghĩa

và biểu diễn nghĩa của 329 lớp động từ với tong số 9344 động từ thành viên.VerbNet dựa trên phân loại động từ của Levin (1993) để xây dựng các lớp động từ

Bang 1.1 dưới day là một vi dụ về một lớp động từ được biểu diễn trong VerbNet

Bang 1.1: Một lớp động từ trong VerbNet

Lớp Put-9.1

Vai nghĩa và ràng buộc | Agent [+animate]

vai nghĩa Theme [+concrete]

Initial_Location [+location]

Destination [+location & -region]

Các động từ thành viên | arrange, emplace, immerse, implant, lodge, mount,

position, situate, sling, superimpose, station, tack_on,

nghĩa motion(during(E), Theme)

Ngữ nghĩa path_rel(start(E), Theme, Imtial_Location, ch_of_loc,

prep)

path_rel(end(E), Theme, Destination, ch_of_loc, prep)

cause(Agent, E)

24

Trang 29

VerbNet là sự kết hợp của động từ truyền thống và các vai nghĩa, các ràngbuộc của các vai nghĩa và khung cấu trúc cú pháp và tham thể Cấu trúc của Put-9.1

của VerbNet được thể hiện một cách chỉ tiết như sau:

- Cac động từ thành viên của các nhóm động từ: arrange, emplace, immerse,

implant, lodge, mount, position, situate, sling, superimpose, station, tack_on,

wharf.

- Danh sách vai nghĩa liên quan tới: Agent, Theme, Destination.

- Các ràng buộc vai nghĩa và các vai nghĩa: Agent [+animate], Theme

[+concrete], Initial_Location [+location], Destination [+location &

Vị du: J put the book on/under/near the table

Vai nghĩa": Agent V Theme {{+loc}} Destination

Một tập hợp các vi từ biểu diễn ngữ nghĩa: motion(during(E), Theme)

path_rel(start(E), Theme, Iniial Locaton, ch of lọc, prep)

path_rel(end(E), Theme, Destination, ch_of_loc, prep) cause(Agent,

E)

Một lớp động từ trong VerbNet được xác định bởi một tap hợp các thành

viên, vai nghĩa và các ràng buộc vai nghĩa của các tham thê được phân loại bởi các

thành viên này, cũng như các mô tả cú pháp và ngữ nghĩa liên quan đến khung ngữnghĩa của chúng Các thành phan của VerbNet sẽ được luận văn mô tả cụ thé hơn

trong chương 2.

1.4 Từ điển tiếng Việt dành cho máy tính (VCL)

Từ điển tiếng Việt dành cho máy tính (VCL) là tài nguyên từ vựng lớn nhất

và quan trọng nhất cho NLP với khoảng 42.000 mục từ vựng Nó được cấu trúc theo

khung chú giải từ vựng (Lexical Markup Framework) - một siêu mô hình trừu

tượng được xây dựng bởi tiểu ban kỹ thuật ISO TC 37/SC 4 nhằm cung cấp một bộ

lĨnx v¿ : T2 z kek vn Ũ h

Đặc ta vai nghĩa của các đối tô của khung cú pháp

25

Trang 30

khung cho phát triển các từ vựng hướng tới NLP Từ điển này bao gồm tất cả thông

tin (dạng từ, từ loại, định nghĩa, vi dụ) từ Tir điển tiếng Việt [18], một từ điển in

được coi là tốt nhất ở thời điểm hiện tại

Bên cạnh đó, VCL cũng cung cấp thông tin về mỗi mục từ theo ba khía cạnh:hình thái, cú pháp và ngữ nghĩa Vì tiếng Việt không thay đổi về hình thái, thông tin

về hình thái trong VCL tập trung vào cấu tạo từ Ví dụ, một từ có thể là từ đơn, từghép, từ lay, từ mượn, từ viết tắt hoặc ký hiệu Bảng 1.2 cho thấy một ví dụ về một

mục từ trong VCL, cung cấp thông tin không chỉ về cấp hình thái mà còn về cấp độ

FrameSet Sub + V + Dob

Before R: rat (very)

Semantic Logical constraint Categorial Meaning:

Emotion

Antonym: Ghét (hate)

Semantic constraint Sub: Agt {Person}

Definition Có tình cảm dễ chịu khi tiếp xúc với một đôi tượng nào đó,

muốn gần gũi và thường sẵn sàng vì đối tượng đó mà hếtlòng

Example Tôi yêu mẹ (J love mom)

VCL là một nguồn tài nguyên từ vựng quan trọng cho các tác vụ NLP cơ

26

Trang 31

bản, được thiết kế dé dé dàng cập nhật và mở rộng va tương thích tốt với các ngôn

ngữ khác Tuy nhiên, VCL vẫn có một số hạn chế so với VerbNet như sau:

VCL chứa khoảng 6.652 động từ (8.689 ngữ cảnh) và tông cộng 20 khungphân loại liên quan đến những động từ này Tuy nhiên, thông tin này khôngđầy đủ về mặt cú pháp và ngữ nghĩa, hầu hết các động từ chỉ được gắn vàomột khung và thông tin về mỗi khung thường không đầy đủ Cụ thể cáckhung động từ của VCL chưa có sự phân biệt rõ ràng về địa điểm, điểm đến,

điểm bắt đầu của hành động VCL đang có xu hướng gộp các thành phần này

lại thành Location (dia điểm), trong khi khung cú pháp động từ của VerbNetlại có những sự phân biệt rõ ràng thành: địa điểm diễn ra hành động

(Loaction), điểm đến (Destination), nơi xuất phát (Initial_Location), hướng

hành động (Trajectory).

VCL sử dụng một tập hợp 16 vai nghĩa như: Agent (Tác nhân), Experiencer

(Nghiệm thé), Possessor (Người sở hitu), Điều này khá hạn chế so với

VerbNet.

Các ràng buộc ngữ nghĩa và logic được xây dựng thủ công nhưng nó vẫn còn

vài trường hợp chưa được đề cập trong từ điền

Theo cây ngữ nghĩa ” (Semantic Tree) của VCL, các vai nghĩa được ràng

buộc bởi hai thuộc tố chính đó là vật thể (ConcreteThing) va tri tượng(Abstraction) Rang buộc ngữ nghĩa vật thé còn được phân chia thành vật hữu sinh(LivingThing) và vật vô sinh (None-livingThing) còn năm trong ràng buộc trừu

tượng còn có trạng thái (State), hiện tượng (Phenomenon), sự kiện trừu tượng

(AbstractThing) Cũng như Verbnet, các ràng buộc này giúp giới hạn về ngữ

nghĩa cho các vai nghĩa khi kết hợp với một số động từ nhất định.

Vi dụ: Với nghĩa con di (5): phương tiện vận tai] di chuyển trên một bê mặt,

chủ ngữ cua câu được gan cho ràng buộc ngữ nghĩa {Vehicle} — phương tiện giao

thông Xem hình dưới đây:

'? https://vlsp.hpda.vn/demo/vel/SemanticTree.htm

27

Trang 32

* Semantic

+-Logical constraint

+-CategorialMeaning > Move

| +-Synonym > chay

+-Def > [phương tiện vận tải] di chuyển trên một bể mặt

+-Exa > xe đi chậm ri ri ~ ca nỗ đi nhanh hơn thuyền

Hình 1.1: Biểu diễn ràng buộc ngữ nghĩa của nghĩa con di (5) trong VCL

Như đã trình bày ở trên thì các ràng buộc của VCL được xây dựng thủ công

và còn có trường hợp chưa được đề cập đến trong từ điển Việc kết hợp biểu diễn

ràng buộc ngữ nghĩa — cú pháp của hai nguồn tài nguyên từ vựng này sẽ là mộttrong những thao tác mà luận văn sẽ thực hiện nhằm kế thừa những kết quả nghiên

cứu trước đó từ các tài nguyên từ vựng Bên cạnh đó, qua việc đối chiếu hai ngôn

ngữ, và ánh xạ từ các nguồn tài nguyên từ vựng, luận văn cũng sẽ có những điềuchỉnh phù hợp, vừa đảm bảo tính đồng nhất với VerbNet tiếng Anh vừa đảm bảođặc trưng về tri nhận và ngữ nghĩa của tiếng Việt

1.5 TreeBank tiếng Việt (ViettreeBank)

Treebank tiếng Việt (ViettreeBank) [21] là một ngân hàng gồm khoảng10.000 câu tiếng việt được chú giải về ngữ pháp Đây là một kho ngữ liệu quan

trọng trong việc nghiên cứu và phát triển công nghệ xử lý ngôn ngữ tự nhiên chotiếng Việt

Nguồn tài nguyên này bao gồm các tai liệu được gan nhãn về cú pháp thành

phan, dau câu, từ loại, Việc gan nhãn ngày giúp xác định các tính chất của từ, từ

loại, loại từ Đồng thời cũng giúp ích trong việc xây dựng các công cụ xử lý ngônngữ tự nhiên cho tiếng Việt, bao gồm cả việc phân tích cú pháp, tách từ và gán nhãn

từ loại Kho ngữ liệu này được thu thập từ các bài báo của báo Tuổi Trẻ điện tử, cụthé hơn là các chủ đề Chính trị - Xã hội, Kinh tế, Tin học,

Dữ liệu ViettreeBank (V7) đã được chỉnh sửa lại vào năm 2022 Nội dung

sửa đổi là: nhãn từ loại, tach từ, quan hệ cú pháp thành phần Luận văn thể khai thác

28

Trang 33

các khung cú pháp thành phần từ VTB để nghiên cứu cụ thể đối với trường hợp

từng động từ.

Tiểu kết:

Trong chương 1 này, luận văn đã cung cấp các kiến thức cơ bản như:

Khái quát về các khái niệm của động từ và cách phân loại động từ của một sốnhà ngôn ngữ học ở Việt Nam và thế giới Trong đó, luận văn có đề cập đến cáchphân loại của Levin, cách phân loại nền tảng để xây dựng lên VerbNet tiếng Anh

Luận văn cũng đã đưa ra một số đánh giá và nhận xét cơ bản của cách phân loại này

của Levin khi áp dụng vào trong việc xây dựng VerbNet tiếng Việt (viVerbNe)

Luận văn khái quát các định nghĩa và quan điểm phân loại các vai nghĩakhông chỉ của các nhà ngôn ngữ học mà còn có các quan điểm dưới góc nhìn của

các chuyên gia về khoa học công nghệ nói chung hay các chuyên gia về xử lý ngôn

ngữ tự nhiên nói riêng Trong đó, đáng chú ý hơn cả là cách phân loại vai nghĩa của

VerbNet tiếng Anh, cách phân loại này sẽ được đối chiếu và ánh xạ trong quá trình

xây dựng tập vai nghĩa cho viVerbNet.

Ngoài ra, luận văn còn cung cấp một vài thông tin liên quan đến ba tải

nguyên từ vựng chính sẽ được sử dụng trong quá trình nghiên cứu như: VerbNet,

Từ dién tiếng Việt dành cho máy tính (VCL), TreeBank Tiếng Việt (V7B)

Trên cơ sở những van đề liên quan đến kiến thức cơ sở, luận văn sẽ đi sâu

vào mô tả mô hình viVerbNet trong chương 2; nghiên cứu và khảo sát nghĩa con và

khung cú pháp động từ dựa vào VTB và VCL trong chương 3; biểu diễn ràng buộc

cú pháp và ràng buộc ngữ nghĩa của một số động từ tiếng Việt trong chương 4

29

Trang 34

Chương 2 MÔ HÌNH viVERBNET

viVerbNet là mạng ngữ nghĩa động từ tiếng Việt được xây dựng dựa trênnhững thành phan cốt lõi từ VerbNet tiếng Anh như: lớp các động từ, vai nghĩa,khung cú pháp, ràng buộc cú pháp ngữ nghĩa, vị từ ngữ nghĩa và cách biểu diễn ngữ

nghĩa Khai thác các đặc trưng tương đồng trong ngữ pháp và ngữ nghĩa giữa tiếng

Anh và tiếng Việt, viVerbNet có thể sử dụng một số đặc trưng của VerbNet phục vụcho việc biểu diễn ngữ nghĩa động từ tiếng Việt

Bên cạnh đó, sự khác biệt trong ngữ pháp, ngữ nghĩa giữa tiếng Anh và tiếngViệt khiến cho viVerbNet không thé áp dụng trực tiếp cách biểu diễn tất cả cácthành phần trong VerbNet Chương này, bên cạnh việc mô tả cụ thể các thànhphần của VerbNet và việc ánh xạ một số thành phần trong VerbNet, luận văn sẽbiểu diễn một số thay đổi trong cách biểu diễn khung cú pháp, nhãn ràng buộc cúpháp, cách biểu diễn ràng buộc ngữ nghĩa để phù hợp với đặc điểm ngữ pháp,ngữ nghĩa tiếng Việt

2.1 Vai nghĩa

Vai nghĩa giúp xác định mối quan hệ ngữ nghĩa của các tham thê đối với

động từ là vị ngữ chính của một câu VerbNet qua nhiều phiên bản khác nhau sử

dụng các tập vai nghĩa khác nhau với số lượng và các vai nghĩa thành phần khácnhau Phiên bản đang được sử dụng hiện nay là VerbNet phiên bản 3.3 gồm có 39vai nghĩa `” Dé tăng khả năng đối chiếu, viVerbNet lựa chọn sử dụng tập vai nghĩacủa phiên bản mới nhất VerbNet 3.3 dé biéu diễn ngữ nghĩa cho các đối tố của các

động từ Các vai nghĩa được mô tả cụ thể như sau:

- Agent (Tác nhân/ tác thô): Người chủ động của một hành động hoặc sự kiện

Ví dụ: “Binh đánh Nam”, “Binh” mang nhãn Agent.

- Asset (Giá trị mang tính chêm xen bổ sung): Vai nghĩa chi giá trị là một đối

tượng, tân ngữ cụ thé Vai nghĩa này biểu thị giá trị của tham thể trước nó

nhưng lại không có mối quan hệ với động từ chính của câu Vai nghĩa này

l3 https://verbs.colorado.edu/verb-index/vn3.3/vn/reference.php Truy cập ngày 30/12/2023

30

Trang 35

lưỡng phân với Value (Giá tri).

Ví dụ: “Tôi mua cái túi 20 nghìn”, “20 nghìn” mang nhãn Asset bỗ

sung ý - nghĩa cho “cái túi” chứ không có quan hệ với động từ chính “mua”.

Attribute (7huộc tinh): Vai nghĩa chỉ thực thé mang một tính chất nào đóđược biểu thị trong câu

Ví dụ: “Giá dau tăng vọt”, “Giá dau” mang nhãn vai nghĩa là

Attribute.

Beneficiary (Lợi thé): Vai nghĩa biểu thị kẻ được hưởng thành quả (loi ích,bắt lợi) từ một hành động do một ai đó thực hiện hoặc trạng thái, sự việc

33c

Vi dụ: “Tôi tặng mẹ hoa”, “me” mang nhãn Beneficiary.

Causer (Nguyén nhân): Vai nghĩa chỉ hành thé trong một sự việc (có thé có

tính động hoặc không có tính động) khởi xướng sự việc hành động nhưng

hành động một cách không có chủ tâm hay có ý thức Nó tồn tại độc lập vàkhông phụ thuộc vào sự kiện.

Ví dụ: “Thay giáo giới han dé tài”, “Thay giáo” mang nhãn Cause

Destination (Điểm đến): Đích đến của hành động là một vi trí cụ thể

Ví dụ: Nó di vào nhà

Agent V Destination

Experlencer (Nghiệm thê): Vai nghĩa được đặc trưng là nhận thức hoặc trải

nghiệm điều gì đó

Ví dụ: “7ï yêu mẹ”, “Tdi” mang nhãn Experiencer.

Extent (Mức độ): Giá trị cho biết mức độ thay đổi có thể đo lường được của

các thành phần tham gia trong suốt quá trình diễn ra sự kiện

Ví dụ: “Giá dau tăng 10%”, “10%” mang nhãn Extent

Goal (Dich thé): Muc dich cudi cùng của hành động tồn tại độc lập với sự

=A

viéc.

31

Trang 36

Ví dụ: “Tôi đột lửa dé sưởi am”, “(dé) sưởi am” mang nhãn Goal.

Initial_Location (Dia điểm bat dau): Vai nghĩa của chỉ ra vi trí một cách cụ

thé nơi mà sự kiện bắt đầu hoặc một trạng thái thành sự thật

Vi dụ: “Tôi mang cơm hộp từ nha”; “nhà” mang nhãn vai nghĩa

Initial_Location.

Instrument (Công cu): Vai nghĩa chỉ công cu được sử dung dé tác động hoặctạo ra sự thay đôi trong một thứ gì đó Thường là một công cụ được sử dụngbởi một tác nhân có tính động dé mang lại sự thay đổi

Ví dụ: “Tôi đào đất bằng xẻng” thì “xẻng ” mang nhãn Instrument

Location (Địa điểm): Vai nghĩa chỉ vị trí cụ thể hay hướng không gian củatrạng thái hay hành động do vị từ đảm nhiệm, thường được nhận diện bangmột giới từ dang trước

Ví dụ: “Cô ấy ăn trưa ở nhà”, “nhà ” mang nhãn vai nghĩa Location.Material (Vật chất): Vai nghĩa chỉ vật chất ban đầu, cái mà thay đổi thôngqua sự việc thành các thực thé mới, cụ thé hoặc trừu tượng Vai nghĩa thường

được sử dụng với các động từ mang nghĩa sáng tạo, tạo lập

Ví dụ: “Chiếc túi này làm bang vải”, “vải” mang nhãn vai nghĩaMaterial.

Patient (Bị thé): Tham thé tham gia trải qua một quá trình hoặc bị ảnh hưởng

bởi một hành động, nhấn mạnh vào thay đôi trạng thái.

Ví dụ: “Binh đánh Nam”, “Nam” mang nhãn Patient.

Predicate (Vi ngØ): Vai nghĩa biểu thị một sự kiện, trạng thái thứ hai, phụthuộc vào sự kiện chính, được mô tả băng động từ thứ hai trong câu

Ví dụ: “Mẹ bắt tôi ăn rau”, “ăn rau” mang nhãn Predicate

Pivot (Trạng thê): Tham thể trong một trạng thái được mô tả là ở một vi tríhoặc điều kiện nhất định trong suốt trạng thái, và có vai trò hoặc tác động lớn

hoặc trung tâm trong trạng thái đó Một pivot có vai trò trung tâm hơn một

32

Trang 37

tham thể với vai trò chủ đề.

Ví dụ: “Tôi yêu cô ấy”, “Tồi ” mang nhãn Pivot

Produet (Sản phẩm): Vai nghĩa chỉ kết quả cuối cùng của hoạt động, kết quả

của quá trình thay déi, có quan hệ lưỡng phân với vai nghĩa Material, một cái

là điểm xuất phát còn một cái là kết quả

Ví dụ: “Nghệ nhân làm gốm bằng đất sét”, “gốm ” mang nhãn

Product

Recipient (Tiép thé): Vai nghĩa chi đối tượng cuối của hoạt động trao tặng

Ví dụ: “4nh Nam tặng hoa cho cô ấy”, “cô ấy” mang nhãn Recipient

Result (Kết quả): Vai nghĩa chỉ kết quả được xảy ra là kết quả quả việc một

hành động được thực hiện.

Ví dụ: “Cửa kính ô tô bi đập vỡ”, “vỡ” mang nhãn Result.

Source (Nguồn gốc): Vai nghĩa biéu hiện điểm bắt đầu của hành động: tồn tại

độc lập với sự kiện.

Ví dụ: “Dai phun nước phun nước ”, “dai phun nước ” mang nhãn vai

nghĩa Source.

Stimulus (Kích thích thê): Vai nghĩa chỉ sự kiện hoặc đối tượng mang lại

phản ứng tâm lý cho Nghiệm thẻ

Ví dụ: “7ôi thích bức tranh đó”, “bức tranh đó” mang nhãn

Stimulus.

Time (Thoi gian): Vai nghĩa chỉ thành phần tham gia cho biết ngay lập tức

hoặc một khoảng thời gian trong đó một trạng thái tồn tại hoặc một sự kiện

đã diễn ra.

Ví dụ: “76i đến trường lúc 8 giờ”, “(hic) 8 giờ” mang vai nghĩa Time

Theme (Thể chuyền động): Tham thể được đặt ở một nơi hoặc được coi là di

chuyên từ nơi này sang nơi khác, nhắn mạnh vào thuộc tính vị trí (hoặc sở hữu)

33

Trang 38

Ví dụ: “Hon đá lăn xuống đôi”, “Hon đá ” mang vai nghĩa Theme.

Topic (Chủ dé): Vai nghĩa chi chủ đề của các hoạt động giao tiếp, truyền đạt

thông tin.

DÀNG:

Ví dụ: “Công an thông báo về vụ việc với người nhà nạn nhân”, “vụ

việc ” mang nhãn Topic.

Trajectory (Quy đạo): Vai nghĩa chỉ đường đi hoặc một khu vực mà chuyênđộng đi qua, thé hiện sự thay đôi vị trí

Ví dụ: “Con ngựa nhảy qua hàng rào”, “hang rao” mang nhãn vai

Affector (Tác nhân ảnh hưởng): Đóng vai trò là nguyên nhân gây ra sự thay

đổi trạng thái của một thực thê khác

Vi dụ: “Troi mưa đường ướt”, “trời mưa” mang nhãn vai nghĩa

Affector.

Axis (Trục): Chỉ ra trục mà một hành động diễn ra.

Ví dụ: “Trái Đất quay quanh Mặt trời”, “Mặt trời” mang vai nghĩa

Axis.

Context (Ngi# cảnh): Cung cap thông tin về bối cảnh hoặc điều kiện mà một

hành động diễn ra.

Ví du: “Anh ấy đã bị kiện trong vụ án này”, “trong vụ án này” mang

vai nghĩa Context.

Initial_State (Trang thái ban dau): Mô tả trạng thái của một thực thể trước

khi xảy ra sự kiện

Ví du: “Anh dy chuyén từ Đạo Phật sang Đạo Thiên Chia”, “Đạo

Phật” mang vai nghĩa Initial_ State.

34

Trang 39

- Path (Lối di): Mô tả đường đi hoặc quỹ đạo của một đối tượng.

Ví dụ: “Con sông chảy qua đồng bằng”, “dong bằng” mang vai

nghĩa Path.

- Precondition (Tién dé): Vai nghĩa nêu ra những điều kiện cần thiết để một

hành động có thê được xảy ra

Ví dụ: “Những nỗ lực của chúng tôi đã đảm bảo việc thực hiện dự án

diễn ra thuận lợi”, “Những nỗ lực của chúng tôi” mang vai nghĩa

Precondition.

- Reflexive (Phan thân): Chi ra rang tác nhân và đối tượng của hành động là

cùng một thực thể

Ví dụ: “Em dy tự nấu com”, “tw” mang nhãn vai nghĩa Reflexive

- Duration (khoảng thời gian): Chỉ ra thời gian diễn ra của một sự kiện.

Ví dụ: “4nh ấy đã làm việc suốt cả ngày”, “suốt cả ngày” mang vai

nghĩa Duration.

- Final Time (thoi gian kết thúc): Chi ra thời điểm kết thúc của một sự kiện

Ví du: “Budi họp kết thúc lúc 5 giờ”, “lúc 5 giờ” mang vai nghĩaFinal_Time

- Manner (Cách thức): Mô ta cach thức thực hiện một hành động.

Ví dụ: “Cô ấy chạy rất nhanh”, “rất nhanh” mang nhãn vai nghĩaManner.

Ngoài ra còn một số nhãn có tính tương tự như các nhãn Theme, Patient,Agent lần lượt là: Co-Theme (Đồng thể chuyển động); Co-Patient (Đồng bị thé);

Co-Agent (Đồng fác thể) Các nhãn Co-* này tham gia vào câu cũng cùng đảm

nhiệm chức năng, tính chất ngang bằng với cái nhãn tương ứng.

Ví dụ:

Mẹ nóichuyện với tdi

Agent Vv {with} Co-Agent

Di ghẻ trộn gạo nếp VỚI gạo tẻ

Agent Vv Patient {with} Co-Paitent

35

Trang 40

2.2 Khung cú pháp

Khung cú pháp là cấu trúc cú pháp cơ bản được tạo nên bởi các thành phần

nòng cốt, gan liền với các đặc trưng về cú pháp của một ngôn ngữ Khung cú phápcũng là nền tảng cho việc phân tích ngữ pháp và xây dựng các mô hình ngôn ngữ.Khung cú pháp động từ là khung cú pháp gắn liền với động từ đảm nhiệm chức

năng là vị ngữ chính.

VerbNet phiên bản 3.3 đang sử dụng 309 khung cú pháp động từ chính Các

khung cú pháp này sử dụng các thành tố như: NP (danh ngữ), V (động từ), PP (giới

ngữ), ADỊP (tính ngữ), S (bố ngữ là câu đơn/cú), S_ING (bồ ngữ là động ngữ đặcbiệt có dạng V-ing), S_INF (bồ ngữ là động ngữ có động từ nguyên thê)

Vị dụ:

NP V NP PP.instrument: Paula hit the ball with a stick

NP V S_ING: I tried exercising.

NP V S_INF: J tried to exercise

NP V NP ADJP: John took the radio apart.

NP V NPS: John informed me that his situation had changed.

Trong một số khung cú pháp có thé xuất hiện các thành phần mở rộng saudấu “.” biểu thị loại vai nghĩa cụ thể được sử dụng đối với mỗi đối tố(PP.instrument) Các nội dung về cú pháp cũng sẽ được chú giải một cách chỉ tiếthơn về nghĩa và vị trí ngữ nghĩa của các thành phần cú pháp trong câu bằng cáchthêm các thành phần phụ như: Công cụ (Instrument), Điểm đến (Destination), Tácthé (Agent), Đồng tác thể (Co-agent), Địa điểm ban đầu (Initial_location), Đỗi

tượng trao nhận (Recipien?)

Ví dụ:

Ông cho vào bao những cọng dây đồng

NP V PP.Destination NP.Theme

Khi vị trí của các thành phan theo đúng cau trúc S — V — O (tc là: S — đối

tượng thực hiện hành động, V — hành động, O — đối tượng chịu tác động của hànhđộng), khung cú pháp sẽ ở dạng đơn thuần, không chứa các thành phần, yếu tố phụ

36

Ngày đăng: 08/10/2024, 02:40

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w