Đặc trưng câu hỏi liên quan đến thực thể tên người trong tiếng Việt

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu nhận dạng thực thể có tên và thực thể biểu hiện trong văn bản và ứng dụng (Trang 55 - 57)

10 http://www.spokeo.com/

2.5.2. Đặc trưng câu hỏi liên quan đến thực thể tên người trong tiếng Việt

Để đƣa ra một khái niệm rõ ràng về các câu hỏi đƣợc giải quyết trong hệ thống hỏi đáp, nghiên cứu sinh đã tìm hiểu theo hai hƣớng: hƣớng nghiên cứu về định nghĩa câu hỏi trong hệ thống hỏi đáp tiếng Anh và hƣớng nghiên cứu các đặc trƣng trong câu hỏi tiếng Việt. Từ hai hƣớng nghiên cứu này nghiên cứu sinh đã đƣa ra một số khái niệm cụ thể về loại câu hỏi tiếng Việt liên quan về thực thể tên ngƣời áp dụng trong hệ thống hỏi đáp.

54

Đối với hướng nghiên cứu về định nghĩa câu hỏi trong hệ thống hỏi đáp tiếng Anh, hầu nhƣ các nghiên cứu về hệ thống hỏi đáp hiện nay phần lớn tập trung

vào việc giải quyết ba loại câu hỏi do hội thảo TREC đƣa ra là câu hỏi đơn giản (factoid question), câu hỏi danh sách (list question), câu hỏi định nghĩa (definition question) [Vo03]. Nghiên cứu của Giampiccolovà cộng sự (2008) chỉ ra rằng các loại câu hỏi với câu trả lời là chỉ có một tên ngƣời (thực thể tên ngƣời) đƣợc xếp vào loại câu hỏi đơn giản (factoid question) [GFH08]. Theo định nghĩa từ hội thảo TREC, câu hỏi đơn giản (factoid question) là những câu hỏi về các sự vật, sự kiện đơn lẻ,.. có câu trả lời là những đoạn văn bản ngắn nằm sẵn trong tài liệu [Vo03].

Đối với các nghiên cứu về đặc trƣng câu hỏi trong tiếng Việt, Phan và cộng sự (2010)đã đƣa ra một số phân tích về các dạng câu hỏi trong tiếng Việt, nghiên cứu cũng chỉ ra một số thành phần đặc trƣng chính của câu hỏi nhƣ chủ thể, hành động, tân ngữ trực tiếp, tân ngữ gián tiếp [PNH10]. Từ nghiên cứu này, có thể thấy các câu hỏi về ngƣời nằm ở hai dạng chính: dạng hai lớp tân ngữ và dạng ba lớp tân ngữ, ở đây chủ thể cũng đƣợc xem nhƣ là một tân ngữ của câu hỏi.

Dạng hai lớp tân ngữ có các cấu trúc sau: - Chủ thể + Hành động + Tân ngữ trực tiếp

Ví dụ: Ai là ngƣời viết cuốn sách Harry Potter? - Tân ngữ trực tiếp + Chủ thể + Hành động

Ví dụ: Cuốn sách Harry Potter đƣợc ai viết? - Tân ngữ trực tiếp + Hành động + Chủ thể

Ví dụ: Cuốn sách Harry Potter đƣợc viết bởi ai?

Ở đây,Tác giả (chủ thể hỏi) và sách (Harry Potter) là hai lớp tân ngữ, viết là

hành động.

Dạng ba lớp tân ngữ có các cấu trúc sau:

- Cấu trúc 1: Chủ thể + Hành động + Tân ngữ trực tiếp + Tân ngữ gián tiếp Ví dụ: Ai là nhà văn viết cuốn Harry Potter xuất bản năm 2004?

- Cấu trúc 2: Chủ thể + Tân ngữ trực tiếp + Tân ngữ gián tiếp Ví dụ: Ai là nhà văn của cuốn Harry Potter xuất bản năm 2004?

55

Ở đây, Tác giả (nhà văn), sách (Harry Potter), năm (năm 2004) là ba lớp

tân ngữ, viết là hành động.

Từ hai hƣớng nghiên cứu trên cũng nhƣ thông qua việc khảo sát các câu hỏi về ngƣời trong tiếng Việt, nghiên cứu sinh đƣa ra khái niệm về dạng câu hỏi đơn giản liên quan đến thực thể tên ngƣời nhƣ trong định nghĩa 2.1.

Định nghĩa 2.1: Câu hỏi đơngiản về thực thể tên ngƣời tiếng Việt (gọi tắt là

câu hỏi đơn giản hỏi ngƣời) là một câu hỏigồm một thành phần chủ-vị, ngồi ra cịn có thể có thêm thành phần bổ ngữ và chỉ duy nhất hỏi về một ý và có câu trả lời là thực thể chỉ ngƣời. Xét về đặc trƣng, câu hỏi dạng này gồm có các đặc trƣng sau: loại câu hỏi, tân ngữ, cụm danh từ tác động lên tân ngữ, cụm động từ tác động lên tân ngữ, cụm tính từ tác động lên tân ngữ, bổ nghĩa về mặt chức vụ/nghề nghiệp, bổ nghĩa về mặt thời gian, địa điểm.

Ví dụ câu hỏi đơn giản hỏi về ngƣời: ―Ai là ngƣời viết Tun ngơn Độc lập?‖ Ví dụ câu hỏi không phải là câu hỏi đơn giản hỏi ngƣời: ―Ai là người đọc và

viết Tuyên ngôn Độc lập?‖ (Câu này chứa hai ý hỏi: ―ai là người đọc Tuyên ngôn Độc lập‖ và ―ai là người viết Tuyên ngôn Độc lập‖).

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu nhận dạng thực thể có tên và thực thể biểu hiện trong văn bản và ứng dụng (Trang 55 - 57)

Tải bản đầy đủ (PDF)

(137 trang)