2.3 Mã hoá theo mô hình phân tích bởi tổng hợp tín hiệu hình sin
2.3.2 Mã hoá kích thích đa băng
Mô hình bộ mã hoá kích thích đa băng MBE dựa trên ý t−ởng coi phổ tiếng nói trong thời gian ngắn là sản phẩm của sự kết hợp giữa phổ kích thích và đ−ờng bao dạng tiếng nói. Mặc dù mô hình biểu diễn phổ kiểu này đã có trong mô hình hệ thống nguồn hai trạng thái (hữu thanh/vô thanh) cổ điển nh−ng điểm khác biệt ở chỗ coi phổ kích thích là sự kết hợp của tín hiệu điều hoà và nhiễu, điều đó có nghĩa là tính hữu thanh/ vô thanh là phụ thuộc vào tần số. Cách tiếp cận của mô hình kết hợp này dựa trên thực tế là phổ của những âm hỗn hợp bao gồm cả các vùng hữu thanh và vùng vô thanh.
Nh− vậy, phổ đ−ợc chia thành các băng tần nhỏ và mỗi vùng này đ−ợc quyết
định là vô thanh hay hữu thanh. Số l−ợng vùng lớn hơn nhiều so với bộ mã hoá băng con truyền thống và có thể chọn bằng với số l−ợng các dao động điều hoà.Theo mô
hình MBE, phổ của tín hiệu tiếng nói tổng hợp là:
| (2.61)
) (
| ) ( ) (
^ Ω = H Ω X Ω
S
trong đó: H(Ω) là đường bao phổ tiếng nói, |X ( )| là biên độ phổ kích thích. Ω
Đ−ờng bao phổ H(Ω) biểu diễn cách làm trơn phổ tiếng nói thời gian ngắn và có thể nhận đ−ợc bằng nội suy tuyến tính giữa các mẫu điều hoà của phổ. Phổ thời gian ngắn của tiếng nói, đ−ờng bao phổ và phổ kích thích đ−ợc cho trên Hình 2.18.
Phổ thời gian ngắn tổng hợp là kết quả của sự kết hợp giữa đ−ờng bao phổ Hình 2.18(b) và phổ kích thích MBE Hình 2.18(d). Các tham số dùng trong mô
hình MBE là tần số cơ bản, đ−ờng bao phổ, thông tin về tính hữu thanh của mỗi dao
động và thông tin về pha chỉ với các dao động hữu thanh. Để −ớc l−ợng , phương pháp trung bình phương tối thiểu (LMS) được dùng để phân tích và tổng hợp, nghĩa là các tham số kích thích và đường bao được ớc lư ượng đồng thời bằng cách giảm thiểu sai số (LMS) giữa phổ gốc và phổ tổng hợp:
) ( S
^ Ω
) ( S
^ Ω
(2.62)
(2.63) với φ1,m ; φ2,m là hai giới hạn của băng con thứ m. Nếu chỉ quan tâm tới biên độ thì:
(2.64)
Hình 2.18 Phổ thời gian ngắn của tiếng nói, cơ quan phát âm và kích thích a) Các vùng vô thanh của phổ tiếng nói b) Đ−ờng bao phổ nội suy tuyến tính c) Phổ kích thích hữu thanh điều hoà d) Phổ kích thích hữu thanh/vô thanh MBE
Mô hình MBE trên là dạng thông th−ờng nhất, trong thực tế, các thành phần liên quan đến hữu thanh đ−ợc tính trong miền thời gian còn liên quan đến vô thanh
đ−ợc tính trong miền trị số nh− trên Hình 2.19. Quá trình phân tích bao gồm việc xác định:
a) Chu kú pitch
b) Các tham số đ−ờng bao vô thanh/hữu thanh c) Thông tin về tính hữu thanh cho mỗi băng con
d) Lựa chọn các tham số đ−ờng bao vô thanh/hữu thanh cho mỗi băng
Chu kỳ pitch ban đầu đ−ợc ớc l− −ợng bằng cách dùng ph−ơng pháp tự t−ơng quan và bám pitch thì dùng −ớc l−ợng đ−ợc làm trơn để đảm bảo tính liên tục của các khung. Đó chính là quá trình quyết định pitch ở miền tần số. Đường bao phổ
đ−ợc mô tả bởi các mẫu tại các dao động hài của tần số cơ bản.
Hình 2.19 Phân tích-Tổng hợp MBE
Với các dao động hữu thanh, biên độ và pha của các mẫu đường bao xác định bởi quá trình bình phương tối thiểu. Với dao động vô thanh chỉ cần xác định biên
độ. Các băng con đ−ợc định tâm xung quanh các tần số pitch và tính hữu thanh đ−ợc quyết định bằng cách so sánh sai số chuẩn hoá:
(2.65) và một giá trị mà nếu ε−MB(m) bé hơn thì các dao động đó sẽ đ−ợc cho là hữu thanh (giá trị này bằng 0,2 do D. Griffin và J.Lim đề xuất). ở đây cần chú ý rằng việc quyết định sẽ hiệu quả hơn nếu dựa trên xem xét các nhóm ba dao động.
Quá trình tổng hợp đ−ợc biểu diễn nh− trong Hình 2.19(b). Thành phần hữu thanh đ−ợc tổng hợp ở miền thời gian với việc sử dụng bộ dao động tạo các tín hiệu dạng sin điều hoà. Biên độ của dao động được lấy từ các mẫu đường bao tín hiệu hữu thanh, dùng kỹ thuật nội suy tuyến tính tương tự như trong STC, biên độ này
đ−ợc thiết lập bằng 0 với tín hiệu vô thanh. Pha của thành phần hữu thanh đ−ợc quyết định bởi thuật toán dự đoán pha tương tự như nội suy pha trong STC. Thành phần vô thanh đ−ợc đ a tới bộ FFT d− −ới dạng các đoạn nhiễu trắng, các mẫu biến
đổi được chuẩn hoá bằng cách nhân với đường bao phổ và tín hiệu vô thanh thu được bằng ph−ơng pháp tổng chồng lấp có trọng số.
Các kết quả đạt đ−ợc với mã hoá tham số MBE đã có ở các tốc độ 8 kb/s; 6,4 kb/s; 4,8kb/s và 2,4 kb/s với chíp AT & DSP32C xử lý thời gian thực và bộ mã hoá
đa tốc độ này là một phần của tiêu chuẩn thông tin di động vệ tinh Australia (AUSSAT) và tiêu chuẩn thông tin di động quốc tế (Inmarsat-M) với độ trễ thuật toán 78,75ms và MOS đạt 3,4.