Chương 1 : NHỮNG VẤN ĐỀ LÝ LUẬN CHUNG
b) Việc nghiên cứu các vai nghĩa (hay tham tố) trong Việt ngữ học
1.2. Khái quát chung về TAG và LTAG
1.2.2. Định nghĩa hình thức của văn phạm TAG
Văn phạm TAG là một văn phạm có mô hình lí thuyết gồm một bộ năm (, N, I, A, S), trong đó:
o : tập các kí hiệu kết thúc (bảng chữ cái chính) - tập từ vựng của ngôn ngữ
o N: tập các kí hiệu không kết thúc (bảng chữ cái phụ) - tập các từ loại, ngữ đoạn, câu
o I: tập các cây khởi đầu (initial tree) - cây thể hiện những thành phần bắt buộc, thực chất là những thành phần nòng cốt
o A: tập các cây phụ trợ (auxiliary tree) - cây thể hiện những thành phần phụ, thành phần không bắt buộc
o S: tiên đề (S N) - tương đương với câu
Trong văn phạm này, các cây cơ sở đều là các cây mà mỗi nút được đánh dấu (đặt tên) bằng một kí hiệu kết thúc (terminal) hoặc không kết thúc (nonterminal). Các nút được đánh dấu bằng một kí hiệu kết thúc đều là các nút lá của cây.
Bên cạnh đó, hai thao tác được sử dụng trong văn phạm TAG là phép nối (adjoining) và phép thế (substitution).
Đối với các cây khởi đầu, mỗi nút lá có kí hiệu không kết thúc có đánh dấu
thể hiện khả năng thực hiện phép thế tại các nút đó. Nếu như có xuất hiện dấu ở các cây thì ở đó thể hiện sự ràng buộc về mặt cấu trúc, tức là sự bắt buộc phải xuất hiện.
Đối với các cây phụ trợ, mỗi cây đều có chứa một nút lá trùng tên với nút gốc (mang kí hiệu không kết thúc - nonterminal). Ở nút lá này được đánh dấu bằng kí hiệu * và được gọi là nút chân của cây phụ trợ. Mỗi cây phụ trợ chỉ có một nút chân.
Dưới đây là sơ đồ mô tả:
Cây khởi đầu với các nút thay thế ở lá Cây cơ sở phụ trợ với nút chân
Hình 1.1: Cây cơ sở
Phép nối được thực hiện tại một nút X trong một cây khởi đầu với một cây phụ trợ có nút gốc là X. Sau đây là sơ đồ mô tả phép nối:
Hình 1.2: Sơ đồ phép nối
Phép thế được thực hiện ở nút lá X trong cây khởi đầu với một cây khởi đầu khác có nút gốc là X. Do đó, chúng ta có sơ đồ mô tả phép thế như sau:
Hình 1.3: Sơ đồ phép thế
Ở các nút trong cây muốn ràng buộc thì tuyệt đối không được thực hiện phép nối. Điều này có nghĩa là phép kết nối không phải được dùng để mô tả sự ràng buộc và sẽ quy ước viết thêm kí hiệu NA.
Khi phân tích một câu với hệ hình thức TAG, kết quả thu được gồm có 2 cây: cây cú pháp biểu diễn phụ thuộc ngữ pháp giữa các thành phần, và cây dẫn xuất biểu thị phụ thuộc ngữ nghĩa. Ở đây cần chú ý là nếu như trong văn phạm phi ngữ cảnh khi cho cây cú pháp thì ta có thể suy ra được ngay các dẫn xuất đã thực hiện, còn đối với TAG - một văn phạm cảm ngữ cảnh thì khi cho cây cú pháp, ta
X X* X X X X X X
điều này. Cây dẫn xuất có cấu tạo như sau: các nút trên cây được đánh dấu bằng tên của các cây cơ sở tham gia vào dẫn xuất, mỗi cung nối giữa 2 nút của cây được đánh dấu bằng thao tác thực hiện trên 2 cây tương ứng với 2 nút đó (phép nối hay phép thế) và vị trí thực hiện thao tác trên cây cơ sở. Các vị trí trên mỗi cây cơ sở được đánh số như sau: nút gốc được đánh số 0; các nút thuộc tầng có độ sâu 1 được đánh số từ 1 trở đi; các nút thuộc tầng n+1 (n >=1) được đánh số n.1, n.2, v.v.
Theo Abeillé thì có 4 nguyên tắc xây dựng cây cơ sở trong mô hình TAG: - Nguyên tắc thứ nhất là nguyên tắc từ vựng hoá hay “neo” từ vựng: theo nguyên tắc này thì tất cả các cây cơ sở đều có ít nhất một trung tâm từ vựng khác rỗng.
- Nguyên tắc thứ hai là nguyên tắc đồng xuất hiện vị từ và đối hay chia phạm trù: mọi vị từ chứa trong cấu trúc cơ sở của nó ít nhất một nút cho mỗi đối mà nó chia phạm trù.
- Nguyên tắc thứ ba là nguyên tắc ngữ nghĩa nhất quán tức là mọi cây ngữ pháp cơ sở đều có một ngữ nghĩa tương ứng khác rỗng.
- Nguyên tắc thứ tư là nguyên tắc phi hỗn hợp: mỗi cây cơ sở chỉ tương ứng với một đơn vị ngữ nghĩa.
Các tính chất ngữ pháp ràng buộc khả năng thực hiện các thao tác kết nối hay thay thế được thể hiện qua các cấu trúc đặc trưng (feature structure) gắn với mỗi nút trên cây ngữ pháp. Cấu trúc đặc trưng của một đối tượng là một tập hợp các cặp thuộc tính và giá trị thuộc tính gắn với đối tượng đó. Mỗi khi thực hiện phép thế hay phép nối, người ta cũng thực hiện phép hợp nhất (unification) các cấu trúc đặc trưng (tức là hợp nhất các giá trị cho mỗi thuộc tính trong các cấu trúc đặc trưng được xét) tại nút nối hay nút thế. Nếu phép hợp nhất không thành công (sinh ra các thuộc tính có giá trị không nhất quán) thì thao tác đó không được phép thực hiện và ngược lại, nếu phép hợp nhất đó sinh ra các thuộc tính có giá trị nhất quán thì điều đó có nghĩa là phép hợp nhất đã thành công. Trong mô hình TAG, các thuộc tính trong mỗi cấu trúc có thể được phân loại: thuộc tính trên và thuộc tính dưới. Việc phân loại này có ý nghĩa đối với phép thế và phép nối. Khi thực hiện phép nối ở một nút nào đó, thì các thuộc tính trên của nút đó được hợp nhất với các thuộc tính trên của nút gốc
trong cây phụ trợ, còn các thuộc tính dưới của nút đó được hợp nhất với các thuộc tính dưới của nút chân trong cây phụ trợ. Dưới đây là sơ đồ minh hoạ nguyên tắc kết hợp thuộc tính cho phép thế và phép nối.
Hình 1.4: Sơ đồ phép thế với cấu trúc đặc trưng
Hình 1.5: Sơ đồ phép nối cây với cấu trúc đặc trưng Chú thích: Trong hai hình 1.4 và 1.5 có một số từ viết tắt t: top feature structure - cấu trúc đặc trưng ở phía trên
tr: top feature structure of the root - cấu trúc đặc trưng ở gốc
br: bottom feature structure of the root - cấu trúc đặc trưng phía dưới của gốc U: unification - hợp nhất
tf: top feature structure of the foot - cấu trúc đặc trưng phía trên ở chân bf: bottom feature structure of the foot - cấu trúc đặc trưng phía dưới ở chân Ví dụ: Thuở ban đầu, anh dựng một cái chòi trên cồn.
X X* X X X X tr br t b tf bf t U tr br tf b U bf X X X X t tr br t U tr br
[17 năm trên ốc đảo, 4]
: thuở ban đầu, anh, dựng, một, cái, chòi, trên, cồn N: thuở ban đầu, anh, dựng, một cái chòi, trên cồn Cây cơ sở:
α1 S α2 NP α3 NP NP↓ VP
V NP↓ anh một cái chòi dựng Cây phụ trợ: β1 S β2 VP Advtime S* VP* PP P NP
Thuở ban đầu trên cồn Cây dẫn xuất: α1 S β2 VP VP* PP β1 S NP↓ VP P NP Advtime S* NP V NP↓ α2 trên cồn α3 NP
Cây cú pháp: S Advtime S NP VP VP PP V NP P NP
Thuở ban đầu anh dựng một cái chòi trên cồn