Câu trần thuật là một tít báo

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Ứng dụng ngôn ngữ truy vấn PML -TQ trong truy vấn Treebank Tiếng Việt (Trang 44 - 48)

PML-TQ là ngôn ngữ báo cáo mạnh mẽ, qua kết quả trên đã chứng minh phần nào, không chỉ đƣa ra các câu trần thuật, nó còn có khả năng thống kê số lƣợng và đƣa ra cấu trúc câu trần thuật.

3.3.3.2 Mệnh đềphụkết

Ký hiệu:SBAR

Mệnh đềphụkết đóng vai trò bổnghĩa cho danh từ, động từ, hay tính từ. Bản thân nó không thể đứng độc lập làm thành một câu. Vềcơbản cấu trúc của mệnh đềphụbao gồm một liên từphụkết và một mệnh đề(ký hiệu S).

VD: Quyển sách mà anh mƣợn (NP (Nc-H Quyển) (N sách) (SBAR (C mà) (S (NP-SUB (N-H anh)) (VP (V-H mượn))))) Câu hỏi:

Thống kê các chức năng cú pháp của thành phần phụ kết

Câu truy vấn:

nonterminal $p := [ cat = 'SBAR' ]; >> give $p.functions

>> for $1 give count(),$1 sort by $1 desc

Ý nghĩa câu truy vấn: Tìm tất cả các nút không kết thúc là thành phần phụ kết (cat=‟SBAR‟). Bộ lọc đầu tiên đƣa ra các chức năng đảm nhiệm trong câu của thành phần phụ kết (>>give $p.function). Bộ lọc thứ hai đếm kết quả của $p.function, sắp xếp theo thứ tự giảm dần mức độ xuất hiện của nhãn chức năng, biến $1 thay thế cho $p.function.

Số lần Nhãn Chú giải

5144 Không có nhãn chức năng

992 PRP Phụ ngữ chỉ mục đích hoặc lý do

437 DOB Chức năng tân ngữ gián tiếp

133 CND Phụ ngữ chỉ điều kiện

26 PRD Chức năng vị ngữ không phải là cụm

động từ

18 CNC Phụ ngữ chỉ ý nhƣợng bộ

10 TMP Chỉ thời gian

8 TH Thành phần thuyết của câu (nhãn này

không dùng nữa) 4 MNR Chỉ cách thức 3 ADV Trạng ngữ 3 TPC Chủ đề 2 SUB Chủ ngữ 1 PRR Không có trong tập nhãn

Bảng 13. Tổng hợp các nhãn chức năng đi kèm với nhãn SBAR

Câu hỏi:

Thống kê các nhãn mà có SBAR làm thành phần bổ nghĩa

Câu truy vấn:

nonterminal $p := [ nonterminal

[ cat = 'SBAR' ] ]; >> give $p.cat

>> for $1 give count(),$1 sort by $1 desc

Ý nghĩa câu lệnh: Tìm các nút không kết thúc mà có con. Con của nó chứa mệnh đề phụ kết (cat=‟SBAR‟). Bộ lọc kết quả thứ nhất đƣa ra nhãn phân loại của nút cha (>>give $p.cat). Bộ lọc kết quả thứ hai đếm và sắp xếp kết quả của bộ lọc đầu tiên. Kết quả truy vấn nhƣ sau:

Số lần Nhãn Chú giải 3082 VP Cụm động từ 1335 NP Cụm danh từ 329 S Câu trần thuật 153 AP Cụm tính từ 37 PP Cụm phó từ 4 SQ Câu hỏi 3 QP Cụm từ chỉ số lƣợng

3 XP Cụm từ chƣa đƣợc phân loại

3 WHRP Cụm danh từ nghi vấn hỏi về thời gian, nơi chốn...

1 WHNP Cụm danh từ nghi vấn (ai, cái gì, con gì...) 1 WHPP Cụm giới từ nghi vấn (với ai, bằng cách nào...)

Bảng 14. Tổng hợp các nhãn chức năng có SBAR làm bổ ngữ 3.3.3.3 Câu hỏi 3.3.3.3 Câu hỏi

Ký hiệu: SQ Câu hỏi:

Tìm câu hỏi có chứa cụm từ nghi vấn [WH]

Loại câu hỏi này đƣợc dùng đểhỏi vềngƣời, vật, địa điểm, thời gian, v.v. Câu truy vấn:

nonterminal $p := [ cat = 'SQ', *

[ cat ~ 'WH' ] ];

Ý nghĩa truy vấn: (*) là thống kê tất cả các loại nút kết thúc và không kết thúc. ~ là tìm kiếm theo mẫu các nhãn có chứa„WH‟. Câu truy vấn có nghĩa là tìm tất cả các nút không kết thúc có nhãn phân loại là câu hỏi (cat =‟SQ‟), có nút con. Nút con có thể là nút kết thúc hoặc không kết thúc. Nhãn của nút con có chứa thành phần WH, có thể là WHNP, WHAP, WHRP, WHPP.

Câu hỏi:

Tìm câu hỏi có-không (yes-no question):

Câu hỏi dạng này sử dụng cặp phụ từ trái nghĩa “có… không”, “đã… chƣa”, v.v… Câu truy vấn: nonterminal $p := [ cat = 'SQ', child $vp ]; * $vp := [ child $r1, child $r2 ];

* $r1 :=

[ pos = 'R', form = 'có' ];

* $r2 :=

[ form = 'không', (pos = 'R' and lbrothers() > 1) ];

Ý nghĩa truy vấn: tìm các nút không kết thúc có nhãn phân loại là các câu hỏi (cat = „SQ‟), có con. Nút con 1 chứa từ có nhãn từ loại là phụ từ (pos = „R‟, từ „có‟), nút con 2 chứa từ có nhãn từ loại cũng là phụ từ (pos = „R‟, từ=‟không‟) và nhiều hơn một từ bên trái nó (lbrothers() > 1).

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Ứng dụng ngôn ngữ truy vấn PML -TQ trong truy vấn Treebank Tiếng Việt (Trang 44 - 48)

Tải bản đầy đủ (PDF)

(84 trang)