Quy tắc gan nhãn

Một phần của tài liệu Khóa luận tốt nghiệp Khoa học máy tính: Xây dựng kho ngữ liệu cho bài toán phân tích cú pháp phụ thuộc tiếng Việt (Trang 62 - 66)

Trong tài liệu hướng dẫn này, chúng tôi mô tả các mối quan hệ ngữ pháp của các nhãn phụ thuộc mang tính đặc trưng trong tiếng Việt cùng với những ví dụ cụ thể. Không chỉ vậy, chúng tôi còn liệt

kê và đưa ra các dấu hiệu nhận biết để phân biệt các trường hợp bị nhập nhằng với nhau. Chúng tôi

48

nêu ra 61 quy tắc gán nhãn tương ứng với 61 nhãn phụ thuộc mà chúng tôi đã đề xuất. Các quy tắc

nay sẽ được trình bày theo từng nhóm chức năng ngữ pháp của chúng.

4.4.1 Chủ ngữ

Chủ ngữ được xem là thành phần chính trong câu mang đặc trưng hay quan hệ được nêu ở vị ngữ, tạo thành mối quan hệ chặt chẽ với vị ngữ về mặt nghĩa. Vi trí ràng buộc về mặt hình thức luôn phải trực tiếp đứng trước vị ngữ để nêu ra cái đề tài làm cơ sở cho sự triển khai ý nói ở vị ngữ. Nhóm nhãn thể hiện mối quan hệ chủ ngữ được phân thành 5 loại lần lượt là: chủ ngữ tính từ (ASUBJ), chủ ngữ mệnh đề (CSUBJ), chủ ngữ danh từ (NSUBJ), chủ ngữ danh từ bị động (NSUBJ_ PASS), chủ ngữ

động từ (VSUBJ).

e ASUBJ: Ngữ tinh từ làm chủ ngữ của câu. Net tính từ này đề cập đến các đặc trưng như trang

thái, tính chất để miêu tả các sự vật, hiện tượng được nói đến trong vị ngữ. Trong mối quan hệ

này, tính từ trung tâm phụ thuộc với root của câu.

Ví dụ:

1. [Khó khă NSUBJ(1a, Khó _ khăn)

2. [Nóng| dé ABUBJ(dé_chiu, Nóng)

e CSUBJ: Mệnh dé ò chủ ngữ của câu. Trong đó động

từ chính trong ú : cA câu trong mối quan hệ này.

Ví dụ:

ang gọi đến chủ kèo để bắt độ. CSUBJ(gọi, là)

2. |Lũ ống xua 60 lở núi] đổ ào xuống trại. CSUBJ(đổ, xuất _ hiện)

e NSUBJ: Là một ngữ danh từ để miêu tả về người hay sự vật làm chủ sự việc được dùng cho vị trí chủ ngữ. Trong trường hợp ngữ danh từ bao gồm danh từ, đại từ nhân xưng, và các đại từ thay thế sẽ trực tiếp phụ thuộc với root của câu.

Ví dụ:

1. Nhưng hơn một năm nay[chúng _ tdi] chưa có kế hoạch tuyển người. N§SUBJ(có, chúng_ tôi)

2. [Ba mẹ_ con] chỉ biết sống dựa vào nhau. NSUBJ(biết, mẹ_ con)

e NSUBJ_ PASS: Ngữ danh từ làm chủ ngữ trong câu bị động. Trong đó danh từ, dai từ nhân

xưng, và các đại từ thay thế đó là thành phần phụ thuộc của mối quan hệ này với từ "bị" hoặc

"được" trong câu.

Ví dụ:

49

1. [Những bạn hang] quen_ thuộc còn được tặng quà. NSUBJ_ PASS(được, bạn_ hàng)

2. [Anh_ em] đã bị đánh dạt ra thành nhiều tốp. NSUBJ_ PASS(bi, anh_ em)

e VSUBJ: Ngữ động từ được đặt làm chủ ngữ cho câu. Động từ chính trong ngữ động từ này phụ thuộc với root của câu.

Ví dụ:

1. [Đi học] không mất tiền mà lại có lương. _VSUBJ(mất, di)

2. [Có tai] thôi chưa đủ. VSUBJ(đủ, có)

4.4.2 Tân ngữ và Bổ ngữ

4.4.2.1 Tan ngữ

Tan ngữ là tên gọi khác của bổ ngữ (theo lên ti iét) đóng vai trò như thành phần phụ của từ trong câu. Tân ngữ trong tiếng Vị wm động từ, hay tính từ. Xét về mặt nghĩa chính là sự chuyển tác [ thuc thé néu 6 tan ngit thong

qua một hành động trong ha 6 tả mối qian hệ tan Bet được chia thành 3 loại bao gồm: tõn ngữ giỏn tiộp(IO, ực ti ), nềữ giới từlẽàm tõn ngữ giỏn tiếp(PIOBJ).

e DOBJ: Ngữ dan ] Ộ wg tiếp/bởi một hành động cu thể. Thông

thường được đặt,

Ví dụ:

1. Các cán bộ Tham

2. 44.000 ha đất nông TẾ

61 cháu] thật sự của má như thế. OBJ(trở, thành, con_ cháu) han] về nguồn nước. OBJ(gặp, khó_ khăn)

e IOBJ: Ngữ danh từ chỉ thực thể nhận vật được trao hoặc hành động xảy ra đối với thực thể

đó. Thông thường được đặt sau và phụ thuộc với động từ root của câu trong mối quan hệ này.

Ví dụ:

1. 80 triệu đồng ủng hộ [bệnh_ nhân] nghèo. IOBJ(ủng hộ, bệnh_ nhân)

2. Sau đó y mới cho [chi] đến một chủ nhà mới. IOBJ(cho, chi)

e PIOBJ: Ngữ giới từ làm tân ngữ gián tiếp đứng sau và phụ thuộc vào động từ đang tham chiếu

hoặc ảnh hưởng tới ngữ giới từ đó.

Ví dụ:

50

1. Họ xây nhà tình thương [cho] người nghèo. POBJ(xay, cho)

4.4.2.2 Complement

Complement cũng là thành phần phụ trong câu bổ nghĩa cho thành phần trung tâm ngữ nghĩa của câu. Tuy nhiên khác với vai trò của tân ngữ chỉ đề cập đến thực thể, thành phần bổ ngữ này có thể bao gồm cả thực thể, sự việc, tính chất, ... Không chỉ vậy, thành phần này bắt buộc phải có trong câu để tạo thành cấu trúc ngữ pháp hoàn chỉnh. Nhóm nhãn thành phần bổ ngữ bao gồm 11 loại: ngữ tính từ làm thuộc tính (AATTR), bổ ngữ là ngữ tính từ (ACOMP), ngữ danh từ làm thuộc tính (ATTR), bổ ngữ là mệnh đề (CCOMP), bổ ngữ là mệnh dé trong câu bị động (CCOMP_ PASS), bổ ngữ là ngữ danh từ (NCOMP), ngữ giới từ làm thuộc tính (PATTR), bổ ngữ là ngữ giới từ (PCOMP), ngữ động từ làm thuộc tính (VATTR), bổ ngữ là ngữ động từ (VCOMP), bổ ngữ là ngữ động từ trong câu bị động (VCOMP_ PASS), bổ ngữ là mệnh đề khuyết chủ ngữ (XCGOMP), bổ ngữ của giới

từ (PREP_COMP).

e ACOMP: Ngữ tính từ là thành phần bổ ngữ của động từ. Khi kết hợp với động từ đứng gần

kề trước sẽ tạo ra được một cụ ới có nghĩa giúp câu trở nên có nghĩa.

ứ rong đó "biến" hết cả rồi ẹhụng?

Va h làm [từ_ thién].

Ví dụ:

1. Nhưng có

2. Chi hội

AdDMP(có, thật) AÊOMP(làm, từ _ thiện)

an hóa| NCOMP(có, văn hóa)

e PCOMP: Ngữ giới từ là thành phần bổ ngữ của động từ.

Ví dụ:

1. Tình hình tội phạm liên quan [dén] thé ngày càng gia tăng. PCOMP(lên_ quan, đến)

e VCOMP: Ngữ động từ là thành phần bổ ngữ của động từ. Ngữ động từ này đứng kề sau một động từ khác tạo thành một cụm động từ hoàn chỉnh về mặt ý nghĩa (ý nghĩa hành động, hoạt động hay trạng thái).

Ví dụ:

e CCOMP: Mệnh đề con có đầy đủ hai thành phần chủ - vị bổ ngữ cho động từ. Trong đó chủ

ngữ của mệnh đề con có thể đóng vai trò như tân ngữ của động từ. Và root của mệnh đề con

51

1. Trên nền trời xám xịt, tôi bắt đầu [nghe] tiếng chim kêu quàng_ quạc bay về núi. VCOMP(bat_ đầu, nghe)

2. Vậy nên vùng đất tuyệt đẹp kia vẫn mãi nằm lặng lẽ, quyến _ rũ, gọi [mời]. VCOMP(goi, mời)

sẽ phụ thuộc với động từ mà mệnh đề đó bổ ngữ. Ngoài ra, mệnh đề đầy đủ đứng sau từ liên kết và dấu câu (dấu hai chấm, dấu nháy kép) thì cũng được xem là mệnh đề bổ ngữ. Cũng có trường hợp mệnh đề bổ ngữ chỉ đứng sau dấu câu hoặc sau từ liên kết.

Ví dụ:

1. Điều này khiến [đối phương lầm tưởng là [nó sắp thua]]. CCOMP(khiến, lầm), CCOMP(la, thua)

2. Có [một thế_ hệ sinh_ viên đã vào trận như thé). CCOMP(Gó, vào)

3. Bác sĩ Dung gid sổ đọc to: [anh Kiều 5 lạng, bác Vui 3, chi Hoa 4 ...] CCOMP(đọc, lang)

4. Trường cho biết:"[Tôi là người phải chịu ở dưới nước lâu nhất, kinh hãi lắm ...]" CCOMP(biét, là)

5. Người cha già nhắn tin rằng:"[Sao các con đi làm chuyện thất _ đức vay]. CCOMP(nhắn, đi)

6. Ít ai biết rằng [đằng sau cuộc hành_ trình đi tìm chân_ lý của anh lại có dấu ấn]... CCOMP(biét, có)

e XCOMP: Mệnh đề con làm bổ ngữ cho động từ hay tính từ nhưng không có chủ ngữ riêng mà

thay vào đó chủ ngữ có thể là tân ngữ hoặc chủ ngữ của mệnh đề chính. Root của mệnh đề con

bổ nghĩa. Tươae

sẽ phụ thuộc với động từ mà mện ng với thành phần vị ngữ của mệnh

1. Khi ngữ tính từ x Lhà ân W ủ ệnh đề con sẽ được gán nhãn

COMP:AC

2. Khi ngữ động ệnh đề con sẽ được gán nhãn

Một phần của tài liệu Khóa luận tốt nghiệp Khoa học máy tính: Xây dựng kho ngữ liệu cho bài toán phân tích cú pháp phụ thuộc tiếng Việt (Trang 62 - 66)

Tải bản đầy đủ (PDF)

(101 trang)