0
Tải bản đầy đủ (.pdf) (75 trang)

6 Giải thuật TD-PSOLA

Một phần của tài liệu ĐỒ ÁN TỐT NGHIỆP KỸ SƯ :" XÂY DỰNG HỆ THỐNG TRẢ LỜI TỰ ĐỘNG " DOCX (Trang 39 -44 )

2. 1 7 Cấu trúc các lớp của TAPI

2.2. 6 Giải thuật TD-PSOLA

Như ñã ñề cập trong phần trước, người ta có thể tổng hợp tiếng nói theo nhiều phương pháp như mô phỏng hệ thống phát âm của con người, tổng hợp formant và tổng hợp ghép nối. Mỗi phương pháp ñều có những ưu, nhược ñiểm riêng. Phương pháp mô phỏng hệ thống phát âm của con người cho chất lượng tốt, song rất khó mô phỏng một cách hoàn hảo bộ máy phát âm. Phương pháp tổng hợp bằng formant lại không cho chất lượng cao. Trong ba phương pháp này thì tổng hợp tiếng nói bằng ghép nối ñược sử dụng rộng rãi hơn cả. PSOLA là giải thuật dùng cho phương pháp ghép nối. Trước hết tiếng nói ñược phân tích thành các tín hiệu thành phần, sau ñó, khi cộng xếp chồng các thành phần này ta sẽ ñược tín hiệu tiếng nói tổng hợp. Phương pháp này thao tác trực tiếp với tín hiệu trên miền thời gian nên có chi phí tính toán thấp. Người ta kéo dãn thời gian trong tín hiệu tổng hợp bằng cách lặp lại các ñoạn tín hiệu thành phần.

PSOLA có thể hiểu như sau:

• Tổng hợp tín hiệu từ các thành phần, trong ñó mỗi thành phần có một tần số cơ bản.

• Tổng hợp dựa trên mô hình nguồn-lọc (source-filter). Với phương pháp này tín hiệu phải ñiều hoà (harmonic) và phải thích hợp cho việc phân tích thành các tín hiệu thành phần khi sử dụng cửa sổ, ñiều này có nghĩa là năng lượng của tín hiệu phải tập trung xung quanh một khoảng thời gian nào ñó trong mỗi chu kỳ.

a. Phân tích PSOLA

Phân tích PSOLA bao gồm việc phân tích một tín hiệu s(t) thành các tín hiệu thành phần si(t) bằng cách sử dụng cửa sổ h(t) :

Sinh Viên : Trần Thành ðức - Lớp : 46TH Trang 39

trong ñó miñược gọi là các ñiểm mốc (markers) phải thoả mãn các ñiều kiện sau:

mi− mi-1 phải gần với chu kỳ cơ bản.

Phải gần với ñiểm có biên ñộ cực ñại (maxima energy). ðiều kiện này ñược ñưa ra ñể tránh làm hỏng tín hiệu khi lấy cửa sổ. Sau khi tìm ñược chu kỳ cơ bản T 0(t) và hàm năng lượng e(t).

b. Tng hp PSOLA

Tổng hợp PSOLA ñược thực hiện bằng cách cộng xếp chồng các tín hiệu

thành phần si(t) ñược sắp xếp theo các thời ñiểm mi

ở ñây mi là các ñiểm mốc gần nhất với tín hiệu vào. Chu kỳ cơ bản ñược ñiều chỉnh từ T 0(t ) tới T (t) bằng cách thay ñổi khoảng cách giữa các ñoạn tín hiệu liên tiếp m j − m j−1=T (t). Với PSOLA việc co dãn trên miền thời gian ñược thực hiện bằng cách lặp lại các ñoạn tín hiệu.

Sinh Viên : Trần Thành ðức - Lớp : 46TH Trang 40 Hình 2. 6. Cộng xếp chồng các ñoạn tín hiệu

Tuy nhiên, khi thời gian ñược kéo giãn nhiều bằng cách lặp lại các tín hiệu thành phần có thể làm cho tín hiệu tổng hợp không liên tục. Giải thuật TD – PSOLA (Time Domain PSOLA)ñược trình bày ở phần tiếp theo sẽ khắc phục nhược ñiểm này. Hiện nay TD-PSOLA còn ñược mở rộng ñể sử dụng cho các phương pháp tổng hợp ghép nối khác, bởi vì nó là phương pháp tổng hợp chất lượng cao và chạy tốt ở cả những máy tính tốc ñộ thấp (tổng hợp thời gian thực có thể ñược thực hiện với bộ vi xử lý Intel 386).

c. Gii Thut TD-PSOLA.

Giả sử rằng s(n) là tín hiệu tuần hoàn, S(n ) là tín hiệu s(n) sau khi ñã thay ñổi tần số bằng cách lấy tổng của các khung OLA của si(n). w(n) là cửa sổ, sự thay ñổi chu kỳ tần số gốc T0 tới chu kỳ tần số T tạo ra sự thay ñổi của si( n), s~(n) :

Sinh Viên : Trần Thành ðức - Lớp : 46TH Trang 41

Nếu T≠T0 thì ta phải làm hài hoà lại si(n) với tần số cơ bản là

T

1

Công thức trên rất hiệu quả khi muốn thay ñổi tần số của tín hiệu tuần hoàn.

Hình 2. 7 Quá trình làm thay ñổi tần số của tín hiệu

Nếu T=T0 và cửa sổ phân tích ñủ hẹp, tín hiệu tổng hợp gần như trùng với tín hiệu gốc

Trong trường hợp ñặc biệt với cửa sổ tam giác thì kích thước của cửa sổ ñược chọn bằng 2 lần chu kỳ cơ bản, khi ñó dấu gần ñúng của biểu thức trên sẽ tịnh tiến tới dấu bằng với K=1. Rõ ràng, với giải thuật này, cơ sở dữ liệu phải ñược lưu trữ dưới dạng danh sách tham số (một danh sách cho mỗi ñoạn). Trên thực tế, ñối với TD-PSOLA, thì các danh sách này chứa chuỗi các ñiểm mốc (markers) là tâm các cửa sổ xếp chồng ηi. Vị trí các ñiểm mốc này

Sinh Viên : Trần Thành ðức - Lớp : 46TH Trang 42

ñược sắp xếp ñồng bộ với tần số cơ bản của phần hữu thanh trong ñoạn tín hiệu, nhờ vào một thuật toán xác ñịnh tần số cơ bản nào ñó. ðối với phần vô thanh thì khoảng cách giữa các vị trí này là ñều nhau.

Sinh Viên : Trần Thành ðức - Lớp : 46TH Trang 43

Chương III: PHÂN TÍCH THIT K VÀ TRIN

KHAI H THNG

Ngày nay, việc sử dụng ñiện thọai ñã trở nên phổ biến trong cuộc sống hiện ñại. Nó thực sự ñơn giản và dễ sử dụng, với chi phí cực thấp.

Ta cần biết ñiểm của bản thân, hay ñịa ñiểm học, hay những tin tức mới nhất của nhà trường, của khoa, hay của lớp trong khi chúng ta ñang ở ngoài ñường, hay trên xe bus. Chúng ta không thể bỏ máy tính ra xem, hoặc ñến tận trường. Khi ñó chỉ cần gọi ñiện hay gửi một tin nhắn ñến hệ thống là Ta ñã có ngay những thông tin cần thiết

Xuất phát ñiểm từ nhu cầu của thực tế trên, em ñã nghiên cứu và xây dựng nên hệ thống trả lời tự ñộng. Hệ thống này sẽ cung cấp những thông tin cần thiết như ñiểm thi, thời khoá biểu, lịch thi tại bất cứ ñâu có ñiện thoại (kể cả di ñộng lẫn cố ñịnh) một cách chính xác và nhanh chóng nhất.

Hình 3. 1 Sơðồ Hệ hống

Một phần của tài liệu ĐỒ ÁN TỐT NGHIỆP KỸ SƯ :" XÂY DỰNG HỆ THỐNG TRẢ LỜI TỰ ĐỘNG " DOCX (Trang 39 -44 )

×