3.1.2.Thuật toán tìm kiếm beam search

Một phần của tài liệu Phân tích cú pháp trong tổng hợp tiếng nói tiếng việt (Trang 31)

Với một nút, xác suất trong của một nút là khả năng đối nội trong vùng mà nó bao phủ, còn xác suất ngoài của một nút là khả năng ngoại giao, là khả năng nó kết hợp với vùng bên ngoài vùng bao phủ của nó và dẫn đến kết quả. Cho nên, nếu kết hợp cả hai xác suất này lại nó sẽ trở thành tiêu chí để đánh giá xem nút nào có giá trị hơn về mặt thuật toán. Cụ thể:

P(nút) = inside(nút) + outside(nút). (1)

Nút nào có P(nút) càng lớn thì nút đó sẽ càng là ứng cử viên nặng ký cần phải xét duyệt. Ngược lại, nút nào có P(nút) bé thì đó rất có thể sẽ là một nút thừa, không thể hướng đến đích.

Chính vì lẽ đó, để giảm bớt số lượng các phương án cần xét duyệt, đồ án quyết định sử dụng phương pháp beam search. Với phương pháp này tại mỗi bước của thuật toán CYK, ta chỉ xét một số lượng phương án n cho trước, với n được gọi là bề rộng của beam.

Ý tưởng của thuật toán beam search áp dụng cho phân tích cú pháp: với mỗi một bước lặp của thuật toán, chúng ta sẽ sắp xếp các nút hay các ứng cử viên thứ tự từ cao đến thấp của p(nút) và chỉ lấy n ứng cử viên sáng nhất, những ứng cử viên thấp hơn sẽ bị loại đi. Bề rộng này có thể thay đổi hoặc không thay đổi tùy vào sự tinh tế của người sử dụng.[8].

Giả sử tại một bước có n ứng cử viên và max là nút ứng cử viên sang giá nhất Nếu P(max) –P(núti) > threshold thì loại bỏ nút i với i=1,n

Trực quan về thuật toán beam search có thể được mô phỏng bởi hình vẽ dưới đây, với các nút xanh là các nút được xét, còn các nút màu đen là các nút bị cắt tỉa đi bởi beam search.

Hình 3-7. Minh họa vui cho thuật toán cắt tỉa beam search.

Như vậy, trong mỗi bước của CYK, chúng ta có thể loại đi một cơ số những phương án được cho là không thể dẫn đến đích. Số lượng tổ hợp bùng nổ cũng vì thế mà giảm đi rất nhiều.

Một phần của tài liệu Phân tích cú pháp trong tổng hợp tiếng nói tiếng việt (Trang 31)

Tải bản đầy đủ (DOCX)

(89 trang)
w