Chuyển đổi văn phạm TAG sang RCG

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng hệ thống phân tích cú pháp – ngữ nghĩa tiếng việt với công cụ tulipa (Trang 46 - 47)

3.2 Công cụ TuLiPA

3.2.1 Chuyển đổi văn phạm TAG sang RCG

Việc chuyển đổi văn phạm TAG sang RCG được đề xuất bởi Boullier (1999) và được thảo luận chi tiết trong các tài liệu [26], [27]. Ý tưởng chính: RCG sử dụng các vị từ dạnghαi(X) và hβi(L, R) để biểu diễn các cây khởi tạo α và cây phụ trợ β tương ứng trong TAG. Biến X biểu diễn các từ neo và tất cả các cây có thể thế vàoα. L vàR biểu diễn các thành phần bên trái và bên phải sau khi tiến hành phép kết nối tại vị trí nút chân trong cây β. Quá trình chuyển đổi được thực hiện theo các bước:

• Xây dựng các mệnh đề có dạngS(X) → hαii(X) cho các cây khởi tạo TAG tương ứng

• Xây dựng các mệnh đề RCG để chỉ ra các phép thế và kết nối có thể thực hiện trong văn phạm TAG ban đầu

• Trường hợp trên cây αi, βj tồn tại một nút không bắt buộc thực hiện các phép thế và kết nối, chúng ta có các mệnh đề αi(ǫ) =ǫ, βj(ǫ, ǫ) =ǫ

Ví dụ: Văn phạm TAG trong hình 3.2 có thể biểu diễn bởi văn phạm RCG tương đương với các mệnh đề:

α1 SN A S ǫ a F α2 F d α3 F e β S b S∗ c N A Hình 3.2: Văn phạm TAG

• S(X) → hα1i(X) | hα2i(X) | hα3i(X)

• hα1i(aF) → hα2i(F) | hα3i(F) (Nút F trong câyα1 có thể được thế bởi các cây α2 hoặc α3)

• hα1i(aB1B2F) → hβi(B1, B2)hα2i(F) | hβi(B1, B2)hα3i(F) (Có thể thực hiện các thao tác: Kết nối cây β vào α1 và thế α2 hoặc α3 vào nút F trong α1)

• hβi(B1b, cB2) → hβi(B1, B2) (Thực hiện phép kết nối tại nút gốc của cây β, B1, B2 lần lượt là phần bên trái và bên phải nút chân của cây được kết nối)

• hα2i(d) → ǫ hα3i(e)→ ǫ hβi(b, c) →ǫ

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng hệ thống phân tích cú pháp – ngữ nghĩa tiếng việt với công cụ tulipa (Trang 46 - 47)

Tải bản đầy đủ (PDF)

(71 trang)