CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN
2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN
2.2.2 Ngữ nghĩa chủ đích, mệnh đề, trạng thái thông tin và khả năng thay đổi ngữ cảnh
Ngoài hai tài liệu [7] và [10], phần này còn tham khảo thêm tài liệu của tác giả K. von Fintel [11]. Ta xét ví dụ sau:
(4) It is raining (in Hanoi).
Câu này mô tả hiện tượng đang xảy ra tại thời điểm hiện tại ở đây (Hà Nội).
Ta có thể thêm một số yếu tố vào câu đang xét để đưa ra một phát ngôn trong các tình huống khác (tình huống thay thế: displacement). Giả sử ta thay đổi thời gian thành:
(4’) At noon yesterday, it was raining in Hanoi.
Nói chung ngôn ngữ tự nhiên không giới hạn chỉ trong những diễn ngôn mô tả vị trí và thời điểm của người nói. Ngôn ngữ tự nhiên có khả năng gọi tên các thực thể và tham chiếu tới chúng trong trường hợp các thực thể không ở vị trí người nói hay xuất hiện tại thời điểm người đưa ra phát ngôn. Ví dụ:
(5) In the world of Sherlock Holmes, a detective lives at 221B Baker Street.
Câu trên không nói về một nhân vật trong thế giới thực mà là thế giới được mô tả trong tiểu thuyết Sherlock Holmes của Sir Arthur Conan Doyle. Câu hỏi
33
đặt ra là: Làm cách nào ngôn ngữ tự nhiên có thể nắm bắt được các hiện tượng thay thế? Làm thế nào ta có thể quản lý được các phát ngôn về các thế giới giả thiết nào đó? Ngữ nghĩa chủ đích là một giải pháp được trình bày sau đây.
Định nghĩa 2.2.12 (Thế giới giả thiết) Thế giới giả thiết là một cách thức nào đó khiến cho sự vật, sự việc có khả năng tồn tại hay diễn ra.
Ví dụ trong tình huống thực tế (xét trong thế giới hiện thực) đang có 2 cốc cà phê trên bàn. Nhưng vẫn có những trường hợp có thể có nhiều hay ít hơn (tình huống giả thiết). Như vậy có một thế giới giả thiết nào đó tồn tại trường hợp có 17 cốc cà phê trên bàn chứ không phải 2.
Khi xây dựng biểu diễn diễn ngôn ở các phần trên, ta đã xét một miền các thực thể cùng các giá trị sự thật và mối quan hệ giữa chúng. Trong phần này ta sẽ kết hợp với khái niệm mới về thế giới giả thiết.
Ban đầu mục đích của ngữ nghĩa lý thuyết mô hình là giải thích ý nghĩa dưới dạng các điều kiện sự thật và tham chiếu. Mục đích này được thực hiện qua một thủ tục gồm hai bước:
- Biểu diễn ngôn ngữ đối tượng được gán một dạng logic hoặc “biểu diễn ngữ nghĩa” – một biểu diễn phụ thuộc vào một số ngôn ngữ chuẩn tắc.
- Ta cho trước định nghĩa lý thuyết mô hình về các điều kiện sự thật cho các biểu diễn ngữ nghĩa dạng logic trên. Trong trường hợp đó các điều kiện sự thật của một biểu diễn của ngôn ngữ đối tượng là các điều kiện sự thật của các biểu diễn chuẩn tắc được gán cho nó.
Với DRT ta cũng thực hiện thủ tục trên:
- Gán biểu diễn chuẩn tắc (DRS) cho các bit ngôn ngữ tự nhiên
34
- Chỉ rõ định nghĩa sự thật khi áp dụng cho DRS.
Các DRS được gán các điều kiện sự thật, còn các điều kiện sự thật của DRS được hiểu là các điều kiện sự thật của bit ngôn ngữ nó biểu diễn, và do đó như là nội dung mệnh đề của bit ngôn ngữ này.
DRS còn làm được nhiều hơn:
- Biểu diễn nội dung mệnh đề
- Ngoài ra DRS còn cung cấp ngữ cảnh mà qua đó các câu mới trong diễn ngôn được phiên dịch.
Trong DRT tất cả các câu mới của một diễn ngôn đều đóng góp và và lần lượt được phiên dịch qua một ngữ cảnh được xem xét liên tục. Khái niệm mới về ý nghĩa như cập nhật ngữ cảnh và phiên dịch trong ngữ cảnh là dấu hiện nhật biết của ngữ nghĩa “động” từ thời điểm phát triển sơ khai đã được DRT khởi xướng. Một khía cạnh của sự phụ thuộc các câu vào ngữ cảnh trong các văn bản hay diễn ngôn nối liền là trong cấu trúc xử lý theo hướng từ dưới lên, DRS xây dựng từ một câu nào đó thường không có tính phù hợp: nó sẽ chứa tham chiếu diễn ngôn tự do (nhưng thuộc vào không gian của DRS ngữ cảnh;
tình huống này xảy ra khi một đại từ được xử lý trong ngữ cảnh). Trong các trường hợp này, định nghĩa xác nhận 2.2.10 và định nghĩa sự thật 2.2.11 chỉ gán các điều kiện sự thật được định nghĩa tốt cho tổng trộn của DRS mới với DRS ngữ cảnh.
Một câu hỏi đặt ra là: Ta có thể giải thích cách thức câu mới cập nhật ngữ cảnh mà câu được phiên dịch trong đó bằng cách gán một hàm ứng với các điều kiện sự thật của ngữ cảnh DRS với ngữ cảnh mới cập nhật không? Với lý thuyết tập hợp mở rộng ta sẽ xét sau đây (mô hình chủ đích), vấn đề trở thành:
35
Ta có thể gắn với mỗi DRS không phù hợp K một hàm CCP (context change potential: khả năng thay đổi ngữ cảnh) đi từ tiền giả định đến tiền giả định sao cho nếu Pc là tiền giả định biểu diễn bởi DRS ngữ cảnh Kc thì CCPK(Pc) là tiền giả định biểu diễn bởi ngữ cảnh cập nhật, nhận được từ phép trộn Kc và K không?
Phần này trình bày các khái niệm cho ngôn ngữ DRS đơn giản L trong định nghĩa 2.2.1. Để đơn giản ta giả sử với mỗi mô hình, tất cả các thế giới giả thiết (gọi tắt là thế giới) đều thuộc cùng không gian, các tên gọi chỉ ký hiệu một lần trong toàn mô hình. Tuy nhiên các quan hệ được định nghĩa cho riêng từng thế giới. Riêng quan hệ truy cập được là quan hệ thỏa mãn toàn không gian.
Định nghĩa 2.2.13 (Mô hình chủ đích) Mô hình chủ đích M là bộ ba , trong đó:
(i) WM là tập các thế giới
(ii) UM là tập khác rỗng các cá thể trong thế giới (iii) – Với tên gọi,
- Với các quan hệ n ngôi,
Định nghĩa 2.2.14 (Đối tượng chèn xác nhận (định nghĩa toàn cục)) Trong mô hình M, với nào đó, một đối tượng chèn xác nhận
được định nghĩa như sau:
Định nghĩa 2.2.15 (Ngữ nghĩa chủ đích) Ngữ nghĩa chủ đích cho các DRS và các điều kiện DRS của L là:
36
(i) khi và chỉ khi và
(ii) (iii) (iv) (v) (vi) (vii)
Định nghĩa 2.2.16 (Tính đúng của DRS trong mô hình) Một DRS phù hợp K là đúng trong M tại một thế giới khi và chỉ khi tồn tại một đối tượng chèn h của UK sao cho .
Định nghĩa 2.2.17 (Mệnh đề) Cho một DRS phù hợp K, mệnh đề biểu diễn bởi K liên quan đến M được định nghĩa như sau: .
Khái niệm ngữ nghĩa chủ đích giúp DRT mở rộng được danh mục các điều kiện DRS phức hợp. Các mô hình chủ đích có thể mô hình hóa ngữ nghĩa động cho DRS theo nghĩa nào đó khác với các phiên bản đã nêu ở trên. Trong DRT, các biểu diễn ngữ nghĩa được xây dựng theo dạng DRS ngữ cảnh, trong đó cứ một phần diễn ngôn mới thêm vào được xét trong ngữ cảnh đã có lại cập nhật ngay ngữ cảnh đó thành ngữ cảnh mới cho các phần diễn ngôn tiếp theo.
Các DRS liên kết với điều kiện sự thật và mô hình chủ đích đã có để định nghĩa ra mệnh đề biểu diễn bởi một DRS như tập các thế giới định nghĩa đúng DRS đó. Tuy nhiên có nhiều ví dụ cho thấy chỉ dùng các điều kiện sự thật (và các giá trị ngữ nghĩa động dựa trên các hàm đi từ mệnh đề vào mệnh đề) vẫn
37
chưa đủ để nắm bắt ý nghĩa động của biểu diễn ngữ nghĩa. Ta xét cặp ví dụ sau (biến thể của ví dụ nổi tiếng Barbara Partee):
(6) Exactly nine of the ten coins are in the bag and exactly one of the ten marbles is not. It is under the sofa.
(7) Exactly nine of the ten marbles are in the bag and exactly one of the ten coins is not. It is under the sofa.
Các DRS của hai câu đầu trong (6) và (7) xét về điều kiện sự thật là tương đương, nghĩa là chúng xác định cùng một mệnh đề. Tuy nhiên trong ngữ cảnh đã có của câu đầu, hai câu sau khi được phiên dịch lại cho ra các kết quả khác nhau. Với (6) “It” tham chiếu tới marble còn “It” trong (7) tham chiếu tới coin. Sự khác biệt giữa hai câu đầu của (6) và (7) không thể hiện trong điều kiện sự thật nhưng lại liên quan tới đối tượng sẽ được tham chiếu trong các câu tiếp theo. Để thể hiện điểm khác biệt này, ta sử dụng khái niệm Trạng thái thông tin.
Định nghĩa 2.2.18 (Trạng thái thông tin) Cho một DRS phù hợp K, trạng thái thông tin biểu diễn bởi K theo mô hình chủ đích M được định nghĩa như sau:
Các đối tượng chèn xác nhận f trong một DRS ngữ cảnh K cho trước ghi lại các tham chiếu diễn ngôn có sẵn trong UK khi trong câu thuộc ngữ cảnh của K xuất hiện các đối tượng được tham chiếu. Các hàm chèn f xuất hiện trong trạng thái thông tin biểu diễn bởi một DRS K trong M sẽ có cùng miền xác định (UK): nếu thì Dom(f) = UK. Ta chấp nhận giả thiết sau như ràng buộc chung cho trạng thái thông tin: với mỗi trạng thái thông tin I luôn tồn tại một tập X các tham chiếu diễn ngôn sao cho
38
, Dom(f) = X, X gọi là cơ sở của I và ký hiệu là XI. Cho một DRS K, mệnh đề định nghĩa bởi K (nghĩa là tập các thế giới có thể có xác định K đúng) có thể suy ra từ trạng thái thông tin
. Rõ ràng ánh xạ từ trạng thái thông tin vào mệnh đề là ánh xạ nhiều-một: hai câu có thể biểu diễn cùng một mệnh đề nhưng lại có trạng thái thông tin khác nhau. Không giống mệnh đề, trạng thái thông tin ghi nhận những tham chiếu diễn ngôn do ngữ cảnh cung cấp như các đối tượng được NP trong các câu thuộc ngữ cảnh tham chiếu.
Định nghĩa 2.2.19 (Các loại trạng thái thông tin) Cho một mô hình chủ đích M, một DRS K và một tập các tham chiếu diễn ngôn X, ta định nghĩa:
(i) I là trạng thái thông tin liên quan đến M và X khi và chỉ khi
(ii) I là trạng thái thông tin liên quan đến M khi và chỉ khi tồn tại X sao cho I là trạng thái thông tin liên quan đến M và X
(iii) I là trạng thái thông tin liên quan đến M và X, X được gọi là cơ sở của I và ký hiệu là XI
(iv) Trạng thái thông tin rỗng liên quan đến M,
(v) Mệnh đề Prop(I) được xác định bởi I:
* Khả năng thay đổi ngữ cảnh (CCP: context change potential)
Cho một DRS ngữ cảnh Ki và một DRS K cho một câu được phiên dịch trong ngữ cảnh biểu diễn bởi Ki dẫn tới một ngữ cảnh mới K0. Giá trị ngữ nghĩa động (CCP) liên kết với K có thể chuyển đổi ngữ cảnh đầu vào Ki thành
39
ngữ cảnh đầu ra K0 bằng cách sử dụng K để cập nhật Ki. Ví dụ sau cho thấy K không cần là DRS phù hợp:
(8) John owns a donkey. It loves him.
Ki là DRS phù hợp nhưng K thì không vì nó chứa biến x, y tự do, DRS kết quả K0 vẫn bảo toàn tính phù hợp. Vậy K là yếu tố cập nhật Ki. Ta có thể giải thích bằng công thức như sau:
( với mô hình M bất kì)
Điều kiện này là nguyên tắc chung cho đặc tính của CCP của một DRS K liên quan đến mô hình M nào đó: đó là một hàm định nghĩa trên các trạng thái thông tin I liên quan đến mô hình M sao cho và gán cho mỗi I có dạng một trạng thái thông tin biểu diễn bởi . Tổng quát hóa cho trạng thái thông tin bất kỳ ta có định nghĩa sau:
Định nghĩa 2.2.20 (Khả năng thay đổi ngữ cảnh (CCP)) Khả năng thay đổi ngữ cảnh (hay ngữ nghĩa động của một biểu diễn) của DRS K liên quan đến mô hình M được định nghĩa là một hàm thành phần từ trạng thái thông tin đến trạng thái thông tin sao cho:
(i) được định nghĩa cho các trạng thái thông tin I liên quan đến M sao cho
40
(ii) Nếu thì
Với ví dụ (8), , nghĩa là áp dụng giá trị ngữ nghĩa động liên quan đến K cho trạng thái thông tin biểu diễn bởi Ki cho câu đầu ta sẽ được trạng thái thông tin biểu diễn bởi K0 cùng với DRS biểu diễn cả hai câu.
Chú ý trong trường hợp K là DRS phù hợp thì là hàm toàn phần, nghĩa là nếu K phù hợp thì được định nghĩa cho cả trạng thái thông tin rỗng
.
* Tiểu kết
Trên đây chúng ta vừa giới thiệu một số khái niệm giúp mô hình hóa yếu tố ngữ cảnh cho ngôn ngữ DRS mở rộng bậc một. Sau đây, ta sẽ tìm hiểu các kĩ thuật tích hợp những yếu tố ngôn ngữ học vào DRS.