Phân tích từ trên xuống cho mạng chuyển đệ quy

Một phần của tài liệu Tài liệu Luận văn tốt nghiệp "Xử lý các văn bản tiếng Việt" ppt (Trang 35 - 38)

Trạng thái phân tích tại một thời điểm nào đó được biểu diễn như sau:

¾ Vị trí hiện tại. Lưu lại phần nào của câu đã được phân tích rồi

¾ Nút hiện tại. Nút ta đang dừng lại để phân tích

¾ Ðiểm quay lại (trở về). Ta đang nằm trong một mạng (B) bởi lời gọi từ

một nút nào đó của mạng (A). Khi đó điểm trở về là nút của mạng A, để

khi quay ra ta lại tiếp tục quá trình phân tích.

Trước hết, ta xét thuật toán đơn giản tìm kiếm trên một mạng chuyển đệ quy. Giả

sử rằng nếu ta có thể đi qua một cung nào đó thì cung đó sẽ là đúng đắn trong phân tích cuối cùng; và giả sử ta chỉ xét các cung cat, push, và pop. Sau đó ta sẽ sửa đổi thuật toán này để tìm tất cả các đường đi bằng kỹ thuật quay lui.

Giả sử ta đang đứng ở một nút trung gian nào đó và biết 3 thông tin đã qua. Ta thử đi theo một cung để ra khỏi nút hiện tại. Có các trường hợp sau xảy ra

¾ Nếu cung này là cung cat và từ kế tiếp trong câu thuộc vào lớp từ loại đó, thì

- cập nhật lại vị trí hiện tại là từ kế tiếp;

- cập nhật lại nút hiện tại là đích của cung này;

¾ Nếu cung này là cung pushđẩy tới một mạng N thì - đưa đích của cung này vào danh sách các điểm trở về; - cập nhật lại nút hiện tại là nút bắt đầu của mạng N;

¾ Nếu cung này là cung pop và danh sách các điểm trở về chưa rỗng thì cập nhật nút hiện tại là điểm đầu tiên trong danh sách này;

¾ Nếu cung này là cung pop, danh sách các điểm trở về là rỗng và không còn từ nào cả thì việc phân tích là thành công;

Hình 13. Mạng chuyển đệ quy làm ví dụ trong phân tích từ trên xuống cùng với bộ từ vựng

ART the, a NUMBER one PRONOUN one

ADJ wild, green

NOUN dogs, man, saw, green

VERB cried, saw, broke, faded, man Khi đó, câu

1 The 2 wild 3 dogs 4 cried 5

sẽđược phân tích như trên Bảng 3.

Bước Nốt hiện tại Vị trí hiện tại Ðiểm trả về Cung được đi

1. S 1 nil S/1 2. NP 1 {S1} NP/1 3. NP1 2 {S1} NP1/1 4. NP1 3 {S1} NP1/2 5. NP2 4 {S1} NP2/1 6. S1 4 nil S1/1 7. S2 5 nil N2/1

Câu The green faded sẽ không thể phân tích tích được bằng văn phạm này, bởi đầu tiên trình phân tích coi green là một tính từ, cho nên sau đó nó không tìm

được một danh từ. Xét câu

1 One 2 saw 3 the 4 man 5,

Ban đầu, trình phân tích thử phân tích câu với cụm danh từone saw, nhưng sau

đó thất bại khi tìm một động từ tiếp theo, nó quay lại và tìm ra cách phân tích thành công với cụm danh từ là one. Quá trình phân tích như trên Bảng 4.

Bước Trạng thái hiện tại Ði theo cung Các trạng thái được lưu lại

1. (S,1,nil) S/1 nil

2. (NP,1,{S1}) NP/2 (và NP/3 để lưu) nil

3. (NP1,2,{S1}) NP1/2 {NP2,2, {S1}} 4. (NP2,3,{S1}) NP2/1 {NP2,2, {S1}} 5. (S1,3,{nil}) không thể đi theo

cung nào cả {NP2, 2, {S1}} 6. (NP2,2,{S1}) NP2/1 nil 7. (S1,2,nil) S1/1 nil 8. (S2,3,nil) S2/2 nil 9. (NP,3,{S2}) NP/1 nil 10. (NP1,4,{S2}) NP1/2 nil 11. (NP2,5,{S2}) NP2/1 nil 12. (S2,5,nil) S2/1 nil

13. phân tích thành công nil

Bảng 4. Phân tích từ trên xuống kết hợp quay lui cho mạng chuyển đệ quy

Trong bước 2, có hai cung ra khỏi nút NP có thể chấp nhận one. Cung NP/2 coi

one là một số (number) và sinh ra nút kế tiếp; đồng thời one cũng là một đại từ

(pronoun), nên trình phân tích lưu lại khả năng đi qua cung NP/3 đểđến nút NP2, như

thế trình phân tích lưu trạng thái (NP2,2,{S1}). Tại bước 6, nó dùng lại trạng thái này, bởi nhận thấy rằng không có cung nào đi ra khỏi S1 chấp nhận từthe.

Với những ví dụ phức tạp hơn, sẽ có cả một danh sách các điểm được lưu. Tuỳ

theo danh sách này được tổ chức theo thứ tự ra sao, trình phân tích sẽ sinh ra những thứ tự phân tích khác nhau.

Chương 4. Xây dng văn phm tiếng Vit

Một phần của tài liệu Tài liệu Luận văn tốt nghiệp "Xử lý các văn bản tiếng Việt" ppt (Trang 35 - 38)

Tải bản đầy đủ (PDF)

(64 trang)