MÃ hóa TIẾNG nói,các mô HÌNH,CÁC CHUẨN mã hóa TIẾNG nói TRONG TRUYỀN THÔNG đa PHƯƠNG TIỆN ( ví dụ TRONG VOIP )

5 282 1
MÃ hóa TIẾNG nói,các mô HÌNH,CÁC CHUẨN mã hóa TIẾNG nói TRONG TRUYỀN THÔNG đa PHƯƠNG TIỆN ( ví dụ TRONG VOIP )

Đang tải... (xem toàn văn)

Thông tin tài liệu

Ket-noi.com diễn đàn công nghệ, giáo dục Nhóm 1: Trần Văn Toàn Mai Văn Tuấn Đề tài Thảo Luận: Mã hóa tiếng nói,các mô hình,các chuẩn mã hóa tiếng nói truyền thông đa Phương tiện(ví dụ VoiP) I GIỚI THIỆU Tiếng nói phương tiện chủ yếu mà người sử dụng để liên lạc giao tiếp ngày Ngày phương tiện truyền thông phát triển số người sử dụng phương tiện liên lạc tăng lên mã hoá tiếng nói nghiên cứu ứng dụng rộng rãi gọi điện thoại truyền thống, gọi qua mạng di dộng, qua mạng Internet, qua vệ tinh, v.v Mặc dù với phát triển công nghệ truyền thông qua cáp quang làm cho băng thông không vấn đề lớn giá thành gọi truyền thống Tuy nhiên, băng thông gọi đường dài, gọi quốc tế, gọi qua vệ tinh hay gọi di động cần phải trì băng thông mức định Vì việc mã hoá tiếng nói cần thiết, giúp giảm thiểu số lượng tín hiệu cần truyền đường truyền đảm bảo chất lượng gọi II CÁC VẤN ĐỀ CƠ BẢN TRONG MÃ HOÁ TIẾNG NÓI Mô hình hoá trình tạo tiếng nói Ket-noi.com diễn đàn công nghệ, giáo dục Khi không khí bị ép từ phổi lên qua dây âm dao động (theo điều khiển não bộ) dọc theo quan phát âm tạo tiếng nói Sự dao động dây âm tạo đóng mở tương tự cánh cửa (thanh môn) Sự đóng mở làm cho luồng không khí từ phổi lên bị ngắt quãng khác nhau, làm cho tiếng nói tạo khác Ngoài tác động dây âm, tiếng nói tạo phụ thuộc vào thay đổi quan phát âm gồm: vòm họng, lưỡi, miệng, khoang mũi mũi Các tính chất tiếng nói người Trong kỹ thuật mã hoá tiếng nói, dựa vào dao động dây âm người ta chia tiếng nói thành hai loại âm sau đây: + Âm hữu (voiced sound): âm hữu tạo dây âm dao động đóng mở làm ngắt quãng luồng không khí ngắt quãng xem gần tuần hoàn tác động lên quan phát âm Theo thực nghiệm chu kì tuần hoàn khoảng từ 20ms Do với âm hữu thanh, tín hiệu kích thích mô hình hoá xung tuần hoàn + Âm vô (unvoiced sound): âm vô tạo luồng không khí qua môn tác động lên quan phát âm không theo qui luật (không tuần hoàn) Do với âm vô thanh, tín hiệu kích thích mô hình hoá tương tự nhiễu Nhìn chung, âm tiếng nói hai loại âm kết hợp chúng Theo thống kê, người ta xác định hầu hết âm hữu Các phương pháp mã hoá tiếng nói Ket-noi.com diễn đàn công nghệ, giáo dục Mã hoá tiếng nói chia thành ba loại mã hoá dạng sóng, mã hoá nguồn mã hoá lai a Mã hoá dạng sóng: người ta chia mã hoá dạng sóng làm hai loại Trong miền thời gian: mã hoá điều biến xung mã (PCM), điều biến xung mã sai lệch (DPCM) điều biến xung mã sai lệch thích nghi (ADPCM) Trong miền tần số: mã hoá băng SBC (subband coding) mã hoá biến đổi thích nghi ATC (Adaptive Transform Coding) b Mã hoá nguồn: Mã hoá nguồn sử dụng mô hình trình tạo nguồn tín hiệu khai thác thông số mô hình để mã hoá tín hiệu Những thông số mô hình truyền đến giải mã Đối với tiếng nói, mã hoá nguồn gọi vocoder hoạt động dựa mô hình quan phát âm nói kích thích với nguồn nhiễu trắng đoạn tiếng nói vô kích thích dãy xung có chu kì chu kì pitch đoạn tiếng nói hữu Do thông tin gởi đến giải mã thông số kỹthuật lọc, thông tin định đoạn tiếng nói hữu hay vô thanh, thay đổi cần thiết tín hiệu kích thích chu kì pitch đoạn tiếng nói hữu Có nhiều kỹ thuật để mã hoá nguồn như: mã hoá kênh, mã hoá formant, mã hoá tham số mã hoá đồng hình Tuy nhiên, chủ yếu tập trung vào nghiên cứu phát triển mã hoá tham số mã hoá dự đoán tuyến tính kích thích hai trạng thái (mã hoá LPC), Ket-noi.com diễn đàn công nghệ, giáo dục ứng dụng Tốc độ bít (kbps) Băng thông Kí hiệu chuẩn (kHz) Điện thoại 64 3,2 g.711 thông thường 32 3,2 g.726 Hội nghị qua 48 -64 g.722 điện thoại 16 3,2 g.728 Điện thoại 13 3,2 Full-rate di động số 12,2 3,2 Efr 8,0 3,2 IS-54 6,5 3,2 Half-rate 8,0 3,2 g.729 4,15 3,2 M 3,6 3,2 Mini-m Điện thoại qua vệ tinh mã hoá dự đoán tuyến tính có kích thích kết hợp MELP mã hoá dự đoán tuyến tính kích thích tín hiệu sau dự đoán RELP Các mã hoá tham số thường dùng cho điện thoại qua vệ tinh quân đội c Mã hoá lai Mã hóa lai có nhiều phương pháp phương pháp phổ biến mã hoá phân tích cách tổng hợp AbS (Analysis-by-Synthesis) Bộ mã hoá sử dụng mô hình quan phát âm người giống mã hoá nguồn Tuy nhiên, thay sử dụng mô hình tín hiệu Ket-noi.com diễn đàn công nghệ, giáo dục kích thích đơn giản mã hoá nguồn tín hiệu kích thích chọn cho cố gắng đạt dạng sóng tiếng nói tái tạo giống với dạng sóng tiếng nói ban đầu tốt Đây đặc tính phân biệt khác mã hoá kiểu AbS Thuật toán tìm dạng sóng kích thích định tới độ phức tạp mã hoá chuẩn mã hóa tiếng nói truyền thông đa Phương tiện

Ngày đăng: 13/05/2016, 13:06

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan