Xây dựng bộ quan hệ ngữ pháp tiếng Việt

Một phần của tài liệu Luận án tiến sĩ: Xử lý tiếng việt (Trang 73 - 80)

Đối với tiếng Việt, chúng ta chưa có kho ngữ liệu lớn đã phân tích cú pháp nên phải sử dụng khả năng thứ hai để xây dựng tập các quan hệ ngữ pháp. Hệ hình thức dùng cho các quan hệ ngữ pháp của Sketch Engine dựa trên cơ sở các mẫu xâu theo biểu thức chính quy, do đó phù hợp với các ngôn ngữ có trật tự từổn định, như

58

trò quan trọng, về cấu trúc ngữ pháp cơ bản tiếng Việt được tham khảo tại tài liệu [12, 16]. Sau đây sẽ trình bày bộ quan hệ ngữ pháp tiếng Việt thông qua các truy vấn tương ứng với cấu trúc ngữ pháp cơ bản tiếng Việt mà luận án đã xây dựng, đó là, cụm danh từ, cụm động từ, cụm phó từ, cụm giới từ, liên hợp và câu đơn.

4.2.2.1. Cụm danh từ

Cụm danh từ là một ngữ mà danh từ làm chính tố

Cấu tạo của cụm danh từ: <Phần phụ trước>< Phần Trung tâm><Phần phụ

sau> a. Phần phụ trước Phần này có tối đa ba thành phần: <vị trí -3> <vị trí -2> <vị trí -1> Ở vị trí -3 là định từ chỉ tổng lượng như “tất cả”, “hết thảy”, v.v. Ở vị trí -2 là số từ. Ở vị trí -1 là danh từ chỉ loại.

Sau đây là các truy vấn quan hệ ngữ pháp trong trường hợp bắt lấy phần phụ

phía trước bổ nghĩa cho danh từ và bắt lấy danh từđược bổ nghĩa bởi các phần phụ ởở phía trước. *DUAL #nhân kép #(Nc-H Mảnh) (N đất) (PP (E-H của) (NP (N-H đạn) (N-H bom)))) =N_after_Nucleus/N_front_Nucleus 1:"Nc|Nu" 2:"Np|N" 1:"Nc" 2:"N" *DUAL =front_modifies_N/N_after_modifier 2:"M|L|P" "M|L|P"{0,2} 1:"N.?" b. Phần phụ sau Phần này gồm có hai loại phụ tố: <Phụ tố hạn định> < phụ tố chỉ định>

59

Phụ tố hạn định có thể do nhiều từ loại khác nhau đảm nhiệm: Tính từ, danh từ, động từ, danh từ số lượng.

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy phần phụ phía sau bổ nghĩa cho danh từ và bắt lấy danh từđược bổ nghĩa bởi phần phụ phía sau.

*DUAL =after_modifies_N/N_front_modifier 1:"N" "N"{0,1} 2:"A" #năm 1996 1:"N" 2:"M" 1:"N" "N"{0,1} 2:N.?" 1:"N" "Nc"{0,1}" 2:"Np" # Cái máy tính của cơ quan #Bài hát của hải quân Việt Nam

1:"N" "V|E"{0,2} 2:"Np|N" 1:"Ny" 2:"Np" 1:"Nu" 2:"N|Np" # Cái ăn, cái mặc 1:"Nc" 2:"V" 4.2.2.2. Cụmđộng từ Cụm động từ là một ngữ mà động từ làm chính tố

Cấu tạo một động ngữ : <phần phụ trước> <động từ trung tâm> <phần phụ

sau>

a. Phần phụ trước

Phần phụ trước của động từ thường là phó từ

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy phần phó từ phía trước bổ nghĩa cho động từ và bắt lấy động từđược bổ nghĩa bởi phần phó từ phía trước.

60 =R_front_modifies/V_after_modifier 2:"R""R"{0,3} 1:"V" b.Phần phụ sau Động từ có khả năng kết hợp với các từ loại khác một cách rất đa dạng. Mỗi cách kết hợp có thể coi như một mẫu cú pháp của động từ: nội động từ, động từđi với danh từ, động từđi với cụm giới từ.

Sau đây là các truy vấn quan hệ ngữ pháp trong trường hợp có 2 đến 3 động từđi liền nhau để bắt lấy động từ phía sau phụ thuộc vào động từ phía trước và ngược lại.

*DUAL

=after_dependence_V/dependence_V # Khen thưởng

1:"V" "V"{0,1} 2:"V"

Tiếp theo là các truy vấn quan hệ ngữ pháp bắt lấy phần phụ phía sau là các

đối trực tiếp (đối gián tiếp) của động từ và bắt lấy các động từ mà phần phụ phía sau là đối trực tiếp (đối gián tiếp). *DUAL =object/object_of #Tặng hoa bạn 1:"V" 2:"N.?" *DUAL =object_indirect/object_indirect_of #Tặng hoa cho bạn 1:"V" "N" "E|V" 2:"N" 1:"V" "E" 2:"N"

Tiếp theo là các truy vấn quan hệ ngữ pháp bắt lấy phần phía sau bổ nghĩa cho động từ và bắt lấy các động từđược thành phần phía sau bổ nghĩa.

61 *DUAL =E_after_modifies/V_front_modifier #đi ra ngoài 1:"V" 2:"E" =R_after_modifies/V_front_modifier 1:"V" "V|E|N.?"{0,3} 2:"R" =A_after_modifies_A/V_front_modifier_A 1:"V" "R"{0,3} 2:"A" 4.2.2.3. Cụm tính từ Là ngữ có tính từ làm trung tâm Cấu tạo một cụm tính từ về cơ bản như sau:

< phần phụ trước> <tính từ trung tâm> <phần phụ sau>

a.Phần phụ trước

Phần phụ trước của tính từ thường là phó từ chỉ mức độ. (adsbygoogle = window.adsbygoogle || []).push({});

Tiếp theo là các truy vấn quan hệ ngữ pháp bắt lấy phần phụ phía trước bổ

nghĩa cho tính từ và bắt lấy các tính từđược phần phó từ phía trước bổ nghĩa.

*DUAL

=R_front_modifies_A/A_after_modifier_R 2:"R" "R"{0,1} 1:"A"

b. Phần phụ sau

Phần phụ sau có thể là phó từ, danh từ, động từ, tính từ và giới từ.

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy phần phụ phía sau bổ nghĩa cho tính từ và các tính từđược phần phụ phía sau bổ nghĩa.

*DUAL

=A_after_modifies_A/A_front_modifier_A 1:"A" "A"{0,3}2:"A"

62 1:"A" 2:"R|V|E" #=N_after_modifies_A/A_front_modifier_N #1:"A""M"{0,1} 2:"Nu" #1:"A" 2:"N" 4.2.2.4. Cụm phó từ Cụm phó từ chủ yếu tạo bởi sự kết hợp giữa các phó từ với nhau.

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy phần phụ là phó từ phía sau bổ nghĩa cho phó từ phía trước và phó từ phía trước được bổ nghĩa bởi phó từ phía sau.

*DUAL

=R_after_modifies_R/R_front_modifier_R 1:"R" 2:"R"

4.2.2.5. Cụm giới từ

Cấu tạo chung : <giới từ> <cụm danh từ>

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy phần phụ phía sau bổ nghĩa cho giới từ và các giới từ phía trược được bổ nghĩa bởi phần phụ phía sau.

*DUAL

=after_modifies_E/ front_modifier 1: “E” "Nc|Nu|M|L|P"{0,5} 2:”N.?”

4.2.2.6. Liên hợp

Liên hợp là cấu tạo ngữ pháp có ít nhất hai từ hay hai ngữ kết hợp với nhau theo quan hệ liên hợp, bình đẳng, cùng nhau đảm nhiệm một vai trò ngữ pháp nhất

định trong câu hay ngữ.

Sau đây là các truy vấn quan hệ ngữ pháp cho danh từ, động từ, tính từ. Việc kết hợp được thể hiện qua các liên từ “và”, “hoặc”, “hay”, “cùng”, “cùng với”, “với”, “cũng như”, dấu ”,”.

*SYMMETRIC =conjunction

63

1:"N.?|P" [word="và"|word="hoặc"|word="hoặc

là"|word="hay"|word="với"|word="cùng"|word="cùng với"|word="cũng như"] "M|D"{0,2} 2:"N.?|P"

1:"V" "R"{0,1} [word="và"|word="hoặc"|word="rồi"|word="hoặc là"|word="hay"|word="với"|word="cùng"|word="cùng với"|word="cũng như"] "R"{0,2} 2:"V"

# Em đó rất ngoan cũng rất xinh đẹp

1:"A" "R"{0,2} [word="và"|word="hoặc"|word="hoặc

là"|word="hay"|word="với"|word="cùng"|word="cùng với"|word="cũng như"] "R"{0,2} 2:"A" (adsbygoogle = window.adsbygoogle || []).push({});

*TRINARY =part_pp__%s

# Bán cho họ

# pha 2 cốc cà phê với một thìa sữa # giỏi về môn toán

1:"N.?|A|V" "M|L|T|R"{0,3} 3:"E" "M|L|T"{0,3} 2:"N.?"

4.2.2.7. Câu đơn

Theo quan điểm coi cấu trúc chủ-vị là cấu trúc chủđạo của câu tiếng Việt [1], một câu trần thuật gồm hai phần là chủ ngữ và vị ngữ : <chủ ngữ> <vị ngữ> Trong đó chủ ngữ thường là cụm danh từ, còn vị ngữ thường là cụm động từ

hoặc cụm tính từ.

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy các vị ngữ mà thành phần phía trước làm chủ ngữ và thành các chủ ngữ của vị ngữ phía sau

*DUAL

=subject_of/subject

1:"P|N|Np|Nc" "|A|R"{0,4} 2:"V|A" 1:"N.?" "R|P"{1,4} 2: "A"

64

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy phần vị ngữ là số từ =M_predicate

1:"N" "P|R"{0,4} 2: "M""N.?" 1:"P" "R"{0,3} 2:”M”"N.?"

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy trường hợp “tobe”

=tobe

1:"N.?|P|A|V" [tag="V" & word="là"][tag="M|L"]{0,2} 2: "N.?|A|V"

Sau đây là các truy vấn quan hệ ngữ pháp bắt lấy trường hợp một vật làm bằng cái gì đấy

=madeOF

1:"N.?" [tag="V" & word="bằng"][tag="M|L"]{0,2} 2: "N.?"

Một phần của tài liệu Luận án tiến sĩ: Xử lý tiếng việt (Trang 73 - 80)