Câu hỏi có – không

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Ứng dụng ngôn ngữ truy vấn PML -TQ trong truy vấn Treebank Tiếng Việt (Trang 48 - 52)

Tƣơng tự nhƣ vậy ta có thể tìm kiếm, thống kê, đƣa ra cấu trúc câu cảm thán (S-EXC), hoặc câu mệnh lệnh (S-CMD), câu tít báo (TTL)…

3.3.4 Tìm các nhãn chức năng

Chúng ta sẽ đi truy vấn một số câu hỏi mang tính chất tổng hợp.

3.3.4.1 Câu có tân ngữ trực tiếp và tân ngữ gián tiếp bổ nghĩa cho động từ

VD: Tôi tặng bạn quyển sách . (S (NP-SUB (P-H Tôi)) (VP (V-H tặng) (NP-DOB (N-H bạn)) (NP-IOB (Nc-H quyển) (N sách))) (. .)) Câu hỏi:

Tìm câu có tân ngữ trực tiếp và tân ngữ gián tiếp bổ nghĩa cho động từ

Câu truy vấn:

nonterminal $p :=

[ cat = 'VP', child $c, child $d ];

* $c :=

[ functions = 'DOB', sibling{1,1} $d ];

* $d :=

[ functions = 'IOB' ];

>> give $p,$p.cat,first_defined($c.cat & "-" & $c.functions ,$c.pos),first_defined($d.cat & "-" & $d.functions ,$d.pos)

>> give $2 & " -> " & concat($3," " over $1)& ", "&concat($4," " over $1)

>> for $1 give count(),$1 sort by $1 desc

Ý nghĩa truy vấn:Tìm nút không kết thúc, có nhãn phân loại là cụm động từ (cat=‟VP‟), có hai con.Con thứ nhất ($c) là nút kết thúc hoặc không kết thúc có chức năng là tân ngữ trực tiếp (functions = 'DOB'), có quan hệ lân cận ngay sau nó (sibling {1,2}) là $d, con thứ hai ($d) là nút kết thúc hoặc không kết thúc có tân ngữ gián tiếp (functions = 'IOB'). Bộ lọc đầu tiên đƣa ra cấu trúc của cha, nhãn phân loại của cha, nhãn phân loại của con thứ nhất cũng nhƣ chức năng của con thứ nhất, nhãn phân loại của con thứ hai cũng nhƣ chức năng của con thứ hai. Bộ lọc thứ hai đƣa ra cấu trúc lại của bộ lọc thứ nhất theo cấu trúc dễ hiểu. Bộ lọc thứ ba điếm số lần xuất hiện của cấu trúc dựa trên bộ lọc thứ hai, sắp xếp kết quả hiển thị theo thứ tự giảm dần số lần xuất hiện của các cấu trúc.

Số lần Mẫu câu

184 VP -> NP-DOB, VP-IOB 171 VP -> NP-DOB, PP-IOB

18 VP -> NP-DOB, NP-IOB 9 VP -> NP-DOB, AP-IOB 3 VP -> QP-DOB, PP-IOB

2 VP -> NP-DOB NP-DOB, VP-IOB VP-IOB 2 VP -> PP-DOB, PP-IOB

2 VP -> NP-DOB, SBAR-IOB

2 VP -> NP-DOB NP-DOB, PP-IOB PP-IOB 1 VP -> NP-DOB, QP-IOB

1 VP -> NP-DOB, XP-IOB 1 VP -> PP-DOB, VP-IOB 1 VP -> VP-DOB, VP-IOB 1 VP -> VP-DOB, PP-IOB

Bảng 15. Mẫu Câu có tân ngữ trực tiếp, gián tiếp bổ nghĩa cho động từ động từ

Hình 16. Câu có tân ngữ trực tiếp và tân ngữ gián tiếp bổ nghĩa cho động từ.

Tƣơng tự nhƣ vậy với các thành phần phụ ngữ chỉ thời gian(TMP), nơi chốn(LOC), hƣớng(DIR), cách thức hay phƣơng tiện(MNR), mục đích hay lý do(PRP), chỉ điều kiện(CND), nhƣợng bộ(CNC), trạng ngữ(ADV)

Một số yêu cầu tìm kiếm và các câu lệnh đi kèm nó sẽ đƣợc trình bày trong phần phụ lục I.

3.3.4.2 Câu ghép song song

Dấu hiệu nhận biết câu ghép này là câu có từhai cụm chủvịtrởlên. Các cụm chủvịnày đƣợc nối với nhau bằng dấu phảy hoặc kết từ đẳng lập.

Ví dụ: Chim kêu, vƣợn hú. (S (S (NP-SUB (N-H Chim)) (VP (V-H kêu))) (, ,) (S (NP-SUB (N-H vượn)) (VP (V-H hú))) (. .)) Câu hỏi:

Tìm câu ghép song song

Câu truy vấn: nonterminal $p := [ cat ~ 'S', child $s1 ]; * $s1 := [ cat ~ 'S', sibling{1,1} $s2 ]; * $s2 := [ pos in {'C',','}, sibling{1,1} $s3 ]; * $s3 := [ cat ~ 'S' ];

Ý nghĩa câu truy vấn: Tìm các nút không kết thúc có nhãn phân loại là câu trần thuật „S‟, có con là $s1. Con $s1 có thể là nút kết thúc hoặc không, có nhãn phân loại là câu trần thuật „S‟, có lân cận ngay kề là $s2. $s2 có thể là

nút kết thúc hoặc không, có nhãn từ loại liền kề là „C‟ hoặc „,‟, có lân cận ngay kề là $s3. $s3 có nhãn phân loại là câu trần thuật „S‟

Một trong các kết quả:

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Ứng dụng ngôn ngữ truy vấn PML -TQ trong truy vấn Treebank Tiếng Việt (Trang 48 - 52)

Tải bản đầy đủ (PDF)

(84 trang)