3.1.4.Nhận xét về thuật toán beam search
3.4. Nhận xét thuật toán A* lelightwin prunning
Ưu điểm:
• Tốc độ nhanh (gấp khoảng 3,4 lần so với giải thuật A* lelightwin thông thường khi áp dụng cho phân tích cú pháp) do số lượng bước phải đi qua ít và không bị bùng nổ tổ hợp qua mỗi bước. Và nhất là việc xử lí tối ưu các trường hợp sinh chuỗi nhờ thuật toán cắt tỉa.
• Không sử dụng phần tử không hoàn chỉnh (phần tử với biến wait) để phân tích nên việc đánh giá độ ưu tiên giữa các nút sẽ trở nên chính xác hơn vì các nút được xét ưu tiên lúc này là nút hoàn chỉnh thật sự, đồng thời việc tính inside – outside trở nên đơn giản do không phải xét thêm trường hợp nút ảo. Nhược điểm:
• Tốn khá nhiều dung lượng bộ nhớ do phải lưu trữ tất cả các chuỗi sinh ra trong quá trình phân tích.
• Số lượng tổ hợp ghép nối càng nhiều thì thời gian cho mỗi bước càng tăng lên.
• Ngoài ra, thuật toán có một nhược điểm là quá phức tạp để cài đặt và kiểm thử.
3.5. Kết chương
Như vậy, để giải quyết những khó khăn của bài toán phân tích cú pháp tiếng Việt, đồ án đã thực hiện được những công việc sau
• Đề xuất sử dụng thuật toán CYK-Beam search dựa trên mô hình PCFG nhằm tăng tốc độ cho bộ phân tích cú pháp.
• Đề xuất ra việc sử dụng thuật toán A* để giải quyết những khó khăn của thuật toán CYK-Beam search có thể cải tiến tối đa đầu ra của bộ phân tích cú pháp mà vẫn có thể đảm bảo cho bộ phân tích về mặt tốc độ.
• Đưa ra được 3 cách tính hàm ưu tiên cho A*
o Không sử dụng outside với thuật toán Dijkstra.
o Sử dụng cách tính ước lượng bằng outside một tầng.
o Sử dụng phương pháp tính ước lượng bằng cách rút gọn tập luật.
• Đặc biệt là ở nửa cuối chương 3, đồ án đã trình bày về một ý tưởng do chính đồ án sáng tạo ra: thuật toán lelightwin cắt tỉa. Thuật toán này nhằm mục đích giúp cải tiến tốc độ của bộ phân tích cú pháp lên một mức cao hơn. Hiện tại do giới hạn trong thời gian làm đồ án, nên chương trình mới chỉ xây dựng được thuật toán lelightwin ở mức cơ bản, chưa có cắt tỉa. Nhưng đồ án đã được trình bày rất rõ ràng đến từng bước thực hiện của thuật toán lelightwin cắt tỉa. Chính vì vậy, việc xây dựng thuật toán này trong tương lai là chắc chắn có thể.
Sau đây, chúng ta sẽ đi sâu phần cài đặt chương trình Chương 4 – Phát triển, thử nghiệm và đánh giá hệ thống phân tích cú pháp tiếng Việt.