CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN
2.1. CÁC THÀNH PHẦN CƠ BẢN CỦA DRT
2.1.1 Tổng quan về DRT
Giả sử ta biểu diễn ngữ nghĩa cho diễn ngôn sau:
(3) A delegate arrived. She registered.
Ta có thể biểu diễn ngữ nghĩa cho từng câu rồi ghép lại thành công thức sau:
Biểu diễn này chứa biến tự do y nên không phải là một câu trong logic vị từ cấp một. Hơn nữa nó không thể hiện được yếu tố ngữ cảnh là đại từ “she” ở câu sau chỉ đến “delegate” ở câu trước.
Như vậy ta phải có một cách thức khác để biểu diễn ngữ nghĩa cho diễn ngôn. DRT giải quyết được tình huống trên. DRT có sử dụng một công cụ để cấu trúc hóa diễn ngôn, đó là cấu trúc biểu diễn diễn ngôn (DRS: discourse representation structure). Ta có các định nghĩa sau:
22
Định nghĩa 2.1.1 (Tham chiếu diễn ngôn) Tham chiếu diễn ngôn là các thực thể được nhắc đến trong diễn ngôn mà sau đó có thể dùng đại từ để tham chiếu lại.
Trong ví dụ (3) có hai tham chiếu diễn ngôn là x và y (lần lượt thay thế cho “delegate” và “she”).
Định nghĩa 2.1.2 (Cấu trúc biểu diễn diễn ngôn) Cấu trúc biểu diễn diễn ngôn
<U, Con> là một cấu trúc dữ liệu gồm hai thành phần:
- Tập các tham chiếu diễn ngôn U (còn gọi là “không gian” của DRS),
- Tập các điều kiện Con, mô tả các ràng buộc giữa các tham chiếu.
Trong cấu trúc biểu diễn diễn ngôn, tập tham chiếu diễn ngôn cho ta thông tin về các đối tượng được nhắc đến trong diễn ngôn còn tập điều kiện cho ta biết các thuộc tính, quan hệ, hoạt động của các đối tượng do tham chiếu diễn ngôn chỉ đến. Ví dụ câu đầu tiên trong (3) tương ứng với DRS sau:
<{x}, {delegate(x), arrive(x)}>
Hoặc ta có thể dùng dạng biểu diễn hình hộp:
Phiên bản gốc DRT do Kamp đề xuất năm 1981 thiết lập biểu diễn lần lượt từng phần diễn ngôn. Giả sử ta cần xử lý một chuỗi câu S1, S2,…, Sn, ta thực hiện lần lượt (theo hướng từ trên xuống):
S1 => DRS K1
S1, S2 => S2, K1 => DRS K1,2
…
S1, S2,…,Sn => … => DRS K1,2,…,n
x delegate(x)
arrive(x)
23
Cách thức xử lý như vậy thể hiện phần ngữ nghĩa động của DRT. Mỗi bước trên đều trải qua hai giai đoạn:
- Xây dựng biểu diễn ngữ nghĩa thông qua cấu trúc biểu diễn diễn ngôn (DRS) từ diễn ngôn đầu vào.
- Tạo mô hình biểu diễn cho các cấu trúc biểu diễn diễn ngôn đó.
Đầu những năm 1990, Van Der Sandt và Geurts đề xuất cấu trúc DRT mới dựa trên cách xử lý ngữ nghĩa tổng quát bằng tiền giả định (presupposition).
Định nghĩa 2.1.3 (Tiền giả định) Tiền giả định là một giả thiết ngầm về tri thức hiện thực hoặc hoàn cảnh xung quanh có liên quan đến một phát ngôn và xác định đúng trong diễn ngôn.
Ta xét một số ví dụ:
Diễn ngôn Tiền giả định
Jane no longer writes fiction. Jane once wrote fiction
John saw the man with two heads. There exists a man with two heads.
Robert’s children are very noisy. Robert has children.
Ta có thể mô tả tiền giả định là một yêu cầu mà câu văn đưa ra cho ngữ cảnh. Nếu ngữ cảnh không thỏa mãn các tiền giả định của câu thì nó có thể biến đổi thành ngữ cảnh mới qua quá trình thích nghi. Nếu ngữ cảnh không thỏa tất cả các tiền giả định cũng không thể biến đổi thành một ngữ cảnh thỏa mãn tiền giả định nào đó thì biểu diễn bị loại bỏ. Thủ tục xử lý các tiền giả định gồm hai trạng thái:
- Khởi tạo một biểu diễn cho riêng từng câu, trong đó các tiền giả định là các biểu diễn hiện được cho trước.
24
- Kiểm chứng lại biểu diễn trên qua ngữ cảnh. Nếu cần và có thể thực hiện được, ta sẽ biến đổi ngữ cảnh cho phù hợp (thích nghi).
Khi tất cả các tiền giả định đã thỏa mãn, phần còn lại của biểu diễn khởi tạo (không phải phần tiền giả định) được hợp nhất với ngữ cảnh. Kết quả là một DRS chứa cả thông tin ngữ cảnh và phần đóng góp từ câu văn bản.
Phiên bản DRT mới xây dựng biểu diễn theo hướng từ dưới lên: các biểu diễn khởi tạo được xây dựng từ các cây phân tích cú pháp bằng cách gán các biểu diễn ngữ nghĩa cho các lá, sau đó xây dựng các biểu diễn cho các thành phần phức tạp bằng cách kết nối các biểu diễn của các phần cú pháp liền kề. Luận văn chú trọng mô tả phiên bản DRT mới.