0
Tải bản đầy đủ (.doc) (76 trang)

Phân tách dạng sóng đặc trn g( tách CWs thành SEW và REW)

Một phần của tài liệu LUẬN VĂN KỸ THUẬT MÃ HÓA TIẾNG NÓI (Trang 63 -66 )

- Hai thay đổi cho thủ tục tìm trong bảng mã:

phơng pháp mã hoá nội suy 2,8-4kbps 4.1 Các khái niệm

4.1.4. Phân tách dạng sóng đặc trn g( tách CWs thành SEW và REW)

Căn cứ vào phân tích về tiếng nói, ta thấy rằng: Đoạn tiếng nói bao gồm cả thành phần thoại và phi thoại. Các đặc điểm đợc cảm nhận khác nhau của hai thành phần đó gợi ra rằng nếu phân tách dạng sóng đặc trng của tiếng nói thành dạng sóng biến đổi chậm và dạng sóng biến đổi nhanh thì có thể xử lý linh hoạt hơn. Mô tả ngắn gọn nh sau: Dạng sóng đặc trng CWs trong không gian 3 chiều sẽ đợc tách thành

sóng biến đổi nhanh REW và sóng biến đổi chậm SEW lần lợt lấy đợc sau các bộ lọc thông cao HPF và bộ lọc thông thấp LPF.

Thành phần SEW đặc trng cho tiếng thoại biến đổi chậm theo thời gian. Do vậy nó có thể đợc mã hoá với độ phân giải thấp theo thời gian, và độ phân giải cao theo tần số. Thành phần REW đặc trng cho tiếng phi thoại biến đổi nhanh theo thời gian. Nó có thể đợc mã hoá với độ phân giải cao theo thời gian và độ phân giải thấp theo tần số.

Hình vẽ sau mô tả việc phân tách hai thành phần trên.

REW r(n) CWs

SEW

Hình 19: Sơ đồ khối tách đặc trng trong mã hoá nội suy

Hình 20 : Biểu diễn dạng sóng SEW và REW theo không gian 3 chiều 2-D Trích dẫn

dạng sóng CWs Phân táchSEW - REW

HPF LPF

SEW

Tín hiệu đặc trng cho thành phần d r(n) đợc lấy ra từ bộ lọc dự đoán tuyến tính LPC. Sau khi đã tách đợc riêng hai thành phần trên ta có thể lợng tử chúng riêng biệt vì vậy hiệu qủa tăng lên rõ rệt.

Sau đây ta đi vào phân tích sơ đồ và các thuật toán của phơng pháp mã hoá nội suy dạng sóng và nội suy dạng sóng tăng cờng với tốc độ 2,8 đến 4 kbit giây. Bộ mã hoá WI 4kbit giây đã đợc Tiến sỹ Gottesman và Tiến sỹ Allen Gersho tại trờng đại học Califonia Hoa kỳ đa ra vào năm 1999. Nó đợc hãng điện thoại Nokia đánh giá rất cao tại hội thảo khoa học về mã hoá tiếng nói tại Châu âu. Đến năm 2000 bằng việc kết hợp phơng pháp trên với phân tích bằng tổng hợp (Analyis by Syntheis - AbS ) và lợng tử véc tơ (Vector Quantization - VQ) tốc độ mã hoá đã đạt đến 2,8 kbit giây cho chất lợng thoại cao tơng đơng chuẩn G.723.1 6.3kbit giây.

Vì chuỗi DTFS là một biến đổi tuyến tính, mạch lọc thông thấp trong miền thời gian tơng đơng với mạch lọc trong miền tần số để lọc các hệ số của chuỗi. các mạch lọc lọc các hệ số một cách trực tiếp và đợc tính toán theo công thức sau:

Hình biểu diễn đặc tính của bộ lọc thông thấp tách đặc trng. Hình trên biểu diễn độ lớn của đáp ứng theo tần số 0-200Hz. Hình dới biểu diễn đáp ứng theo thời gian rời rạc. Điểm cắt ở khoảng 0.125 trên thang tần số đã chuẩn hoá.

4.2. Phân tích sơ đồ

Một phần của tài liệu LUẬN VĂN KỸ THUẬT MÃ HÓA TIẾNG NÓI (Trang 63 -66 )

×