Văn phạm liên kết cho Tiếng Việt

Một phần của tài liệu Gán nhãn từ tiếng việt qua phân tích cú pháp liên kết (Trang 31 - 45)

Trong phần này chúng ta xem xét quá trình xây dựng VPLK cho tiếng Việt dựa trên những đặc điểm cú pháp của tiếng Việt. VPLK mà chúng ta đề cập dưới đây không hoàn toàn giống và đầy đủ với văn phạm được mô tả trong từ điển dùng cho chương trình thử nghiệm. [2], [8].

3.1. Danh từ và cụm danh từ

Phần đầu cụm danh từ Thành phần phụ thứ 3 (-1)

Danh từ có kết nối TDT3- và các từ “cái” có liên kết TDT1+

bàn, ghế : {TDT3-}

cái : TDT3+

Với luật như vậy, các cụm từ sau sẽ được đoán nhận: - cái bàn, cái ghế

31

Thành phần phụ thứ 2 (-2)

Danh từ có kết nối TDT2-:

bàn, ghế: {TDT2-}

Kết hợp với kết nối đã xây dựng ở trên ta có:

bàn, ghế: {TDT3-} & {TDT2-}

Chú ý ở đây là kết nối TDT2 ở bên phải kết nối TDT3 vì các từ trong nhóm 2 đứng xa hơn về bên trái của danh từ so với các từ trong nhóm 3.

Các từ thuộc nhóm 2 có kết nối TDT2+:

những, các, mỗi, mọi, từng: TDT2+ Như vậy, các cụm từ sau được đoán nhận: - những cái bàn, từng cái ghế

Số từ trước danh từ

Danh từ có kết nối: ST_DT- Số từ có kết nối: ST_DT+

Chúng ta để ý rằng số từ đứng trước danh từ không thể cùng xuất hiện với các từ thuộc nhóm 2 (những, các, mỗi, mọi,…), vậy ta có các kết nối:

bàn, ghế: {TDT3-} & {TDT2- or ST_DT-}

một, hai, ba, bốn: ST_DT+

Những cụm từ sau sẽ được đoán nhận: - ba cái bàn, hai cái ghế

32

Và những cụm từ sau sẽ không được đoán nhận: * những ba cái bàn * mọi bốn cái ghế Thành phần phụ thứ nhất (-3) Danh từ có kết nối TDT1-: bàn, ghế: {TDT3-} & {TDT2- or ST_DT-} & {TDT1-} Các từ trong nhóm thành phần phụ thứ nhất có liên kết TDT1+

tất cả, tất thảy, toàn bộ, toàn thể: TDT1+ Các luật này giúp ta đoán nhận được: - tất cả những cái bàn

- toàn bộ mọi cái ghế - tất cả ba cái bàn - toàn bộ bốn cái ghế

Thành phần sau danh từ Thành phần sau danh từ thứ nhất (1)

Danh từ phụ đứng sau danh từ trung tâm ở vị trí sau thứ nhất có kết nối SDT1-. Danh từ có thêm kết nối SDT1+ để kết nối với thành phần phụ này. Khi danh từ đã có kết nối SDT1- thì không thể kết nối với các thành phần phụ trước và sau kể trên, vì vậy ta có:

bàn, ghế, giường, lò xo: SDT1- or ({TDT3-} & {TDT2- or ST_DT-} & {TDT1-} & {SDT1+})

33

Luật này cho phép đoán nhận trường hợp như trên và tránh trường hợp nhập nhằng khi các thành phần phụ đứng trước và sau của danh từ thứ nhất được đoán nhận là bổ nghĩa cho danh từ phụ đứng sau (như trong ví dụ trên từ “cái” không được liên kết với “lò xo”). (adsbygoogle = window.adsbygoogle || []).push({});

Thành phần sau danh từ thứ ba (3)

Thành phần phụ này kết hợp với danh từ trung tâm bằng quan hệ từ “bằng” hoặc “về” theo dạng: N1 + bằng/về + N2. Với trường hợp này, ta xây dựng luật như sau:

Danh từ có thêm kết nối SDT3+:

bàn, ghế, giường, lò xo: SDT1- or ({TDT3-} & {TDT2- or ST_DT-} & {TDT1-} & {SDT1+} & {SDT3+})

Các từ “bằng”, “về” có kết nối SDT3-. Để kết nối các quan hệ từ này với danh từ phụ đứng sau ta dùng liên kết đặt tên là GT_DT để kết nối các giới từ và danh từ đi sau. Như vậy, các quan hệ từ này có thêm kết nối GT_DT+:

bằng, về: SDT3- & GT_DT+ Danh từ có thêm kết nối GT_DT-:

bàn, ghế, giường, lò xo: SDT1- or ({TDT3-} & {TDT2- or ST_DT-} & {TDT1-} & {SDT1+} & {SDT3+} & {GT_DT-})

34

Thành phần sau danh từ thứ tư (4)

Thành phần phụ này kết hợp với trung tâm bằng quan hệ từ “của”, “ở”: N1 + của/ở + N2. Danh từ ta thêm kết nối SDT4+:

bàn, ghế, giường, lò xo: SDT1- or ({TDT3-} & {TDT2- or ST_DT-} & {TDT1-} & {SDT1+} & {SDT3+} & {SDT4+} & {GT_DT-})

Quan hệ từ “của”, “ở” có kết nối SDT4- và GT_DT+:

của, ở: SDT4- & GT_DT+

35

Ở đây ta thấy có sự nhập nhằng, ở trường hợp thứ nhất từ “của” bổ nghĩa cho “gỗ”, và ở trường hợp thứ hai từ “của” bổ nghĩa cho “bàn”.

Thành phần sau danh từ thứ sáu (6)

Danh từ có kết nối SDT6+:

bàn, ghế, giường, lò xo: SDT1- or ({TDT3-} & {TDT2- or ST_DT-} & {TDT1-} & {SDT1+} & {SDT3+} & {SDT4+} & {SDT6+} & {GT_DT-})

Các từ thuộc nhóm này có kết nối SDT6-:

ấy, đấy, kia, này: SDT6-

Danh từ tổng hợp

Những danh từ tổng hợp cũng có các kết nối như trên, ngoại trừ các kết nối: TDT3- (cái), TDT2- (những, mỗi, mọi,…), ST_DT- (một, hai, ba,…)

đất đá, núi non, sông biển, trăng sao: SDT1- or {TDT1-} & {SDT1+} & {SDT3+} & {SDT4+} & {SDT6+} & {GT_DT-})

3.2. Động từ và cụm động từ

Phần đầu của cụm động từ Nhóm 1 (-4)

36 Động từ có kết nối TĐT4-.

đi, đứng, chạy, làm : {TĐT4-}

Các từ trong nhóm này có kết nối TĐT4+.

cũng, còn, vẫn, cứ: TĐT4+.

Nhóm 2 (-3) (adsbygoogle = window.adsbygoogle || []).push({});

Động từ có thêm kết nối TĐT3-.

đi, đứng, chạy, làm: {TĐT3-} & {TĐT4-} Các từ trong nhóm này có kết nối TĐT3+.

đã, đang, sẽ, vừa, mới, sắp, sắp sửa: TĐT3+.

Nhóm 5 (-2)

Động từ có thêm kết nối TĐT2_1-.

đi, đứng, chạy, làm: {TĐT2_1-} & {TĐT3-} & {TĐT4-} Các từ trong nhóm này có kết nối TĐT2_1+.

37

Chú ý: Chúng ta ký hiệu liên kết này là TĐT2_1 mà không phải là TĐT2 để phân biệt với một liên kết thuộc nhóm 4 cũng ở vị trí này mà ta sẽ mô tả ở dưới.

Nhóm 4 (-2)

Động từ có thêm kết nối TĐT2_2-. Kết nối này không cùng tồn tại với kết nối TĐT2_1-. Chỉ có một số động từ mới có khả năng liên kết với các từ trong nhóm này:

mong, mong chờ, tiếc, hối tiếc, sợ, lo lắng, nhớ, mơ, ước, quên: {TĐT2_1- or TĐT2_2- } & {TĐT3-} & {TĐT4-}

Các từ trong nhóm này có kết nối TĐT2_2+.

rất, hơi, khá: TĐT2_2+.

Nhóm 3 (-1)

Động từ có thêm kết nối TĐT1-.

đi, đứng, chạy, làm: { TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-} Các từ trong nhóm này có kết nối TĐT1+.

38

Nhóm 6

Thành phần nhóm 6 mang ý nghĩa sai khiến, khuyên nhủ. Khi động từ kết hợp với các từ trong nhóm này thì nó không thể kết hợp với các thành phần phụ trên.

Động từ có thêm kết nối TĐT5-. Kết nối này có liên hệ or với các liên kết còn lại của động từ.

đi, đứng, chạy, làm: ({TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}

đừng, chớ: TĐT5+

Phần sau cụm động từ

Các từ “lắm”, “quá” thường đi sau một số động từ. Đây cũng là những động từ có thể kết hợp với “rất”, “hơi”, “khá”.

Các động từ đó có kết nối SĐT+

mong, mong chờ, tiếc, hối tiếc, sợ, lo lắng, nhớ, mơ, ước, quên: {TĐT2_1- or TĐT2_2- } & {TĐT3-} & {TĐT4-} & {SĐT+}

39

3.3. Tính từ và cụm tính từ

Phần đầu và phần sau của cụm tính từ khá giống với phần đầu và phần sau của cụm động từ. Tuy nhiên, tính từ không đi với “đừng”, “chớ”. Do đó, các thành phần trước và sau động từ có thêm các kết nối tương ứng đến tính từ.

cũng, còn, vẫn, cứ: TĐT4+ or TTT4+ (adsbygoogle = window.adsbygoogle || []).push({});

đã, đang, sẽ, vừa, mới, sắp, sắp sửa: TĐT3+ or TTT3+

không, chẳng, chưa: TĐT2_1+ or TTT2_1+

rất, hơi, khá: TĐT2_2+ or TTT2_2+

thường, hay: TĐT1+ or TTT1+

lắm, quá: SĐT- or STT-

Các kết nối cho tính từ:

tốt, đẹp, đỏ, xanh: {TTT1-} & {TTT2_1- or TTT2_2-} & {TTT3-} & {TTT4-} & {STT+}

3.4. Các liên kết giữa cụm danh từ, cụm động từ và cụm tính từ

Trong phần này chúng ta tìm hiểu việc xây dựng các liên kết để kết nối các thành phần cụm danh từ, cụm động từ, cụm tính từ lại với nhau để tạo thành câu. Để thống nhất, trong phần này, ta nói danh từ (động từ, tính từ) để đồng thời chỉ cụm danh từ (cụm động từ, cụm tính từ).

Liên kết giữa danh từ và động từ

Trong mẫu câu đơn đơn giản C(N) + V, vị ngữ có thể là động từ mô tả hành động của danh từ đứng trước nó. Danh từ có thêm kết nối DT_ĐT+ và động từ có kết nối DT_ĐT-

tôi, bạn, bàn, ghế, giường, lò xo: SDT1- or ({TDT3-} & {TDT2- or ST_DT-} & {TDT1- } & {SDT1+} & {SDT3+} & {SDT4+} & {SDT6+} & {GT_DT- or DT_ĐT+})

đi, đứng, chạy, làm: (({TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}) & {DT_ĐT-}

40

Danh từ cũng có thể đứng sau động từ làm đối tượng trực tiếp cho hành động (bổ ngữ). Do đó động từ có thêm kết nối ĐT_DT+ và danh từ có kết nối ĐT_DT-. Chỉ có những động từ có thể kết hợp với danh từ đứng sau mới có kết nối này. Một số động từ không đòi hỏi phải có bổ ngữ thì không có kết nối này (VD: khóc, cười, ngủ,…)

tôi, bạn, bàn, ghế, giường, lò xo: SDT1- or ({TDT3-} & {TDT2- or ST_DT-} & {TDT1- }& {SDT1+} & {SDT3+} & {SDT4+} & {SDT6+} & {GT_DT- or ĐT_DT- or DT_ĐT+})

học, làm, ăn, đọc, viết, nghe, gặp, thấy: (({TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}) & {DT_ĐT-} & {ĐT_DT+}

Danh từ và động từ cũng có thể liên kết với nhau qua giới từ theo dạng: V + giới từ + N. Với liên kết này, ta thêm kết nối ĐT_GT+ cho động từ và với các giới từ ta thêm kết nối ĐT_GT-. Giới từ kết nối với danh từ bằng liên kết GT_DT mà ta đã xây dựng ở trên.

học, làm, ăn, đọc, viết, nghe, gặp, thấy: (({TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}) & {DT_ĐT-} & {ĐT_DT+} & {ĐT_GT+}

bằng, về : (SDT3- or ĐT_GT-) & GT_DT+

ở, dưới, trước, sau : (ĐT_GT- or SDT4-) & GT_DT+

41

Ở động từ, ta để kết nối ĐT_GT+ có quan hệ & với ĐT_DT+. Điều này cho phép ta đoán nhận dạng câu: V + N1 + giới từ + N2.

Liên kết giữa danh từ và tính từ

Xét câu đơn dạng C(N) + V(A), tính từ làm vị ngữ bổ nghĩa cho danh từ làm chủ ngữ. Vì vậy ta thêm kết nối DT_TT+ cho danh từ và DT_TT- cho tính từ:

tôi, bạn, bàn, ghế, giường, lò xo: SDT1- or ({TDT3-} & {TDT2- or ST_DT-} & {TDT1- }& {SDT1+} & {SDT3+} & {SDT4+} & {SDT6+} & {GT_DT- or ĐT_DT- or DT_ĐT+ or DT_TT+})

tốt, đẹp, đỏ, xanh: {TTT1-} & {TTT2_1- or TTT2_2-} & {TTT3-} & {TTT4-} & {DT_TT-} & {STT+}

Liên kết giữa động từ và tính từ

Các tính từ có thể đi sau động từ để bổ nghĩa cho tính từ. Chúng biểu thị trạng thái, thể cách của động từ.

42 (adsbygoogle = window.adsbygoogle || []).push({});

học, làm, ăn, đọc, viết, nghe, gặp, thấy: (({TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}) & {DT_ĐT-} & {ĐT_DT+} & {ĐT_TT+} & {ĐT_GT+}

tốt, đẹp, đỏ, xanh: {TTT1-} & {TTT2_1- or TTT2_2-} & {TTT3-} & {TTT4-} & {DT_TT- or ĐT_TT-} & {STT+}

Ở động từ, kết nối ĐT_TT+ có quan hệ & và đứng “bên phải” kết nối ĐT_DT+. Điều này cho phép ta đoán nhận cấu trúc câu: N + V + A

Liên kết giữa động từ và động từ

Một số động từ như các động từ tình thái (phải, dám, nên, định,…) đòi hỏi phải có động từ trực tiếp đứng sau nó. Với những động từ này ta thêm kết nối ĐT_ĐT+. Các động từ còn lại ngoài động từ tình thái ta thêm kết nối ĐT_ĐT-.

phải, dám, nỡ, nên, có thể, định: (({TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}) & {DT_ĐT-} & ĐT_ĐT+ & {ĐT_TT+}

học, làm, ăn, đọc, viết, nghe, gặp, thấy: (({TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}) & {DT_ĐT- or ĐT_ĐT-} & {ĐT_DT+} & {ĐT_TT+} & {ĐT_GT+}

43

Các động từ sai khiến cũng có thể có động từ theo sau nhưng không bắt buộc. VD: Thầy giáo đề nghị (học sinh) giữ trật tự.

ra lệnh, bắt, bắt buộc, ép, nài ép, hỏi, đòi hỏi, cấm, cho phép, yêu cầu, đề nghị: (({TĐT1-} & {TĐT2_1- or TĐT2_2-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}) & {DT_ĐT-} & {ĐT_DT+} & {ĐT_ĐT+}

Chú ý: động từ tình thái và động từ sai khiến có một số đặc điểm khác với các động từ còn lại nên luật kết nối của chúng cũng khác. Chúng ta sẽ đề cập đến điều này rõ hơn trong các phần sau này.

Các động từ chỉ sự bắt đầu và kết thúc cũng có thể đòi hỏi động từ theo sau hoặc không. Những động từ này có thể đi sau động từ khác nên chúng có kết nối ĐT_ĐT-.

bắt đầu, tiếp tục, thôi, dừng, kết thúc, dừng: (({TĐT1-} & {TĐT2_1-} & {TĐT3-} & {TĐT4-}) or {TĐT5-}) & {DT_ĐT- or ĐT_ĐT-} & {ĐT_DT+ or ĐT_ĐT+} & {ĐT_TT+} & {ĐT_GT+}

44

CHƯƠNG IV: GÁN NHÃN TỪ DỰA TRÊN VĂN PHẠM

LIÊN KẾT

Một phần của tài liệu Gán nhãn từ tiếng việt qua phân tích cú pháp liên kết (Trang 31 - 45)