Bảng 4-2 Ví dụ minh họa về trọng số của các đặc trƣng trong các phép chiếu.
Phép chiếu đầu tiên được luận văn đề xuất có tên gọi là Grammar Projection (GP), ký hiệu là , là một ý tưởng được người làm luận văn đề xuất dựa trên nghiên cứu cùng tên của Klein và Manning (2003)[4] về thuật toán A* ứng dụng cho phân tích cú pháp PCFG. Ý tưởng cơ bản của phép chiếu này là tìm cách thu gọn không gian gốc D bằng cách khái quát hóa lại các nhãn cú pháp gốc. Như trong hệ thống của luận văn, nội dung của phép chiếu này rất đơn giản: xác nhập tất cả các nhãn cụm từ trong tập luật cú pháp thành một nhãn duy nhất X (vẫn giữ nguyên tất cả các nhãn từ loại).Lấy ví dụ như trong Bảng 4-2, ta có là véc tơ trọng số gốc, còn là véc tơ trọng số trong không gian chiếu GP. Ta có thể thấy, như hình minh họa bên dưới, sau khi thực hiện phép chiếu GP, ba đặc trưng f1, f2, f3 sẽ được chiếu thành một đặc trưng duy nhất f*. Ngoài ra, nguyên tắc cơ bản của các phép chiếu là luôn lấy giá trị nhỏ nhất của trọng số, suy ra trọng số của f* trong không gian GP sẽ là :
Lê Quang Thắng – CNTT.KH.2012B 45
Hình 4-3 Ví dụ minh họa về một số đặc trƣng sau khi thực hiện phép chiếu GP.
Độ phức tạp thuật toán trong không gian GP là O(n4.|g|3|k|), với |g| và |k| là kích thước và số nhãn cú pháp tương ứng của tập luật mới sau khi chiếu, con số này gần như không đáng kể nên thời gian cho việc tìm kiếm đường đi ngắn nhất được rút ngắn đi rất nhiều.