Gán nhãn tự động

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Áp dụng phương pháp P-SOLA trong tổng hợp tiếng nói tiếng Việt Luận văn ThS. Công nghệ thông tin 1 01 10 (Trang 59 - 60)

5. CHƢƠNG 5: XÂY DỰNG CƠ SỞ DỮ LIỆU ÂM

5.3 Gán nhãn cơ sở dữ liệu

5.3.2 Gán nhãn tự động

Tuy nhiên với một CSDL âm lớn thì việc gán nhãn bằng tay là một cơng việc địi hỏi rất nhiều thời gian, do vậy chúng ta phải tự động hố quá trình gán nhãn này. Hiện phƣơng pháp gán nhãn cƣỡng bức đƣợc sử dụng khá phổ biến.

Tuy nhiên phƣơng pháp tự động thƣờng khơng cho kết quả nhƣ ý muốn bởi nĩ phụ thuộc rất nhiều vào chất lƣợng của âm cũng nhƣ chất giọng ngƣời đọc, một giải pháp trung hồ đƣợc đặt ra là kết hợp giữa gán nhãn tự động và gán nhãn bằng tay. Ta cĩ thể chia ra các bƣớc để thực hiện cơng việc này nhƣ sau:

Bƣớc 1: Phiên âm chính tả: Ghi lại nội dung của file tiếng nĩi, sau đấy chuyển ra dƣới dạng text. Thơng thƣờng bƣớc này làm thủ cơng hoặc dựa một hệ thống nhận dạng tiếng nĩi.

Bƣớc 2: Tự động phân đoạn và gán nhãn ở mức độ âm tiết cĩ gắn với thời gian nhƣng chƣa chính xác thơng qua việc phân tích phổ trên mỗi khung tín hiệu. Đây là bƣớc nhận dạng phiên âm chính tả của từng âm tiết.

Bƣớc 3: Hiệu chỉnh bằng tay kết quả đã đạt đƣợc ở bƣớc 2.

Bƣớc 4: Tiếp tục quá trình tự động gán nhãn ở mức âm vị cĩ gắn với thời gian. Đây là bƣớc nhận dang phiên âm âm vị học của từng âm tiết.

Bƣớc 5: Hiệu chỉnh bằng tay kết quả đã đạt đƣợc ở bƣớc 4. Đây cũng là cơng đoạn địi hỏi sự tỉ mỉ và chính xác của ngƣời thực hiện.

Tuy nhiên để thực hiện đƣợc các bƣớc này, tại mỗi bƣớc đều là các quá trình địi hỏi xây dựng cơng phu và áp dụng các thuật tốn phức tạp. Đối với các quá trình thực hiện bằng tay cần phải xây dựng các tiêu chí phân đoạn và mức độ chính xác mà quá trình tổng hợp địi hỏi. Đối với quá trình thực hiện tự động phải xây dựng các thuật tốn tự động phân đoạn gán nhãn ở mức âm tiết và thuật tốn tự động phân đoạn và gán nhãn ở mức âm vị.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Áp dụng phương pháp P-SOLA trong tổng hợp tiếng nói tiếng Việt Luận văn ThS. Công nghệ thông tin 1 01 10 (Trang 59 - 60)

Tải bản đầy đủ (PDF)

(83 trang)