Nén âm thanh tiếng nói thoại theo chuẩn ITU

31 1.4K 10
Nén âm thanh tiếng nói thoại theo chuẩn ITU

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ──────── * ─────── BÁO CÁO XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN NHÓM 16: NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU Giáo viên hướng dẫn : PGS.TS Nguyễn Thị Hoàng Lan Sinh viên thực : Phạm Thành Đạt – 20121503 Đỗ Xuân Cường – 20121358 Doãn Tuấn Vũ - 20122814 Trương Văn Lai - 20101751 MỤC LỤC LỜI NÓI ĐẦU Hiện nay, Voice over IP (hay viết tắt VoIP) nghĩa truyền giọng nói giao thức IP công nghệ hỗ trợ đắc lực cho doanh nghiệp lĩnh vực truyền thông Sử dụng giao thức TCP/IP, sử dụng gói liệu IP mạng LAN, WAN hay Internet để truyền tải âm dạng mã hóa VoIP ITU-T xây dựng chuẩn cập nhật nên ngày hoàn chỉnh Chính vậy, chúng em định chọn đề tài số 16 - NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU Nội dung báo cáo gồm phần chính: Phần 1: Tìm hiểu số khái niệm sound đặc điểm hai loại tín hiệu audio: tín hiệu tiếng nói thoại audio HiFi Phần 2: Tìm hiểu chuẩn ITU dùng ứng dụng VOIP Phần 3: Phân tích sơ đồ mã hóa tiếng nói thoại theo chuẩn ITU G726 Phần 4: Xây dựng thuật toán mã hóa theo sơ đồ phân tích trên, đặt thực nghiệm đo lường hiệu giải pháp nén Do thời gian nghiên cứu trình độ nhóm có hạn nên chắn trình thực đề tài không tránh khỏi sai lầm, thiếu sót nội dung lẫn hình thức Trong suốt trình thực hiện, nhóm liên tục nhận nhắc nhở, góp ý từ cô Nguyễn Thị Hoàng Lan - giảng viên hướng dẫn nhóm Chúng em xin chân thành cảm ơn cô! A- Một số khái niệm sound đặc điểm hai loại tín hiệu audio Tìm hiểu chung âm thoại Âm (Sound) dao động học phần tử, nguyên tử hay hạt vật chất lan truyền không gian, cảm nhận trực tiếp qua tai người va đập vào màng nhĩ kích thích não Sóng âm tần đặc trưng biên độ, tần số (bước sóng) vận tốc lan truyền Đối với tai người, âm cảm nhận sóng có dao động dải tần từ 20Hz đến 20kHz Tín hiệu âm chia thành loại dựa dải tần: - Âm dải tần sở (âm tiếng nói thoại, gọi tắt âm thoại): có dải tần từ 300Hz đến 4kHz - Âm dải rộng (tiếng nói trình diễn, hát, âm nhạc…): có dải tần số từ 100Hz đến 20kHz Audio âm thu nhận, xử lý tái tạo thiết bị điện tử, đối tượng truyền thông đa phương tiện Âm đầu vào trình nén file mp3 âm dải rộng So sánh đặc điểm: Âm tiếng nói thoại Audio HiFi - Giới hạn dải phổ tín hiệu 300Hz 4kHz - Tần số lấy mẫu fs = 8kHz tương đương với chu kỳ Te = 125µs - Mỗi mẫu mã hóa 8bits - Tốc độ cần thiết = 8bit x 8kHz = 64Kbit/s - Giới hạn phổ tín hiệu: 20KHz - Tần số lấy mẫu fs = 44.1 kHz , fs chuyên dụng: 48kHz - Mỗi mẫu mã hóa 16bits kênh stereo - Tốc độ liệu stereo: 176 Kbyte/s Các phương pháp mã hóa tiếng nói Mã hóa tiếng nói gồm phương pháp chính: 2.1 Phương pháp mã hóa sóng (waveform) + Mã hóa dạng sóng kỹ thuật trì hình dạng ban đầu sóng tín hiệu Nguyên lý mã hóa dạng sóng : Tại phía phát nhận tín hiệu tiếng nói tương tụ liên tục mã hóa thành tín hiệu số Tại phía thu, giải mã đảm nhận nhiệm vụ ngược lại để khôi phục tiếng nói, lỗi truyền dẫn dạng sóng tiếng nói khôi phục giống vơi tiếng nói gốc + Bao gồm loại chính: Mã hóa miền thời gian: bao gồm chuẩn từ G.710 đến G.719 o Mã hóa điều xung mã Pulse Code Modulation – PCM – lương tử hóa chuẩn hóa với chuẩn G.711 Điều chế mã xung (PCM) sử dụng rộng rãi hầu hết kỹ thuật mã hóa dạng sóng Tổ chức ITU-T (International Telecommunication Union – Telecommunication Standardization Sector) đưa khuyến nghị G.711 quy định thuật toán để mã hóa tiếng nói định dạng PCM - PCM – kỹ thuật mã hóa dựa định lý Nyquist, định lý nói tín hiệu lấy mẫu thống nhất gấp đôi tần số cao nhất, tái tạo mà biến dạng Tần số cao tín hiệu thoại 4kHz, cần phải mẫu dạng sóng 8.000 mẫu / giây, 1/8000th giây (125 micro giây) - ITU-T tiêu chuẩn G.711 quy định chế mã hóa tín hiệu thoại Tín hiệu tiếng nói có giới hạn băng thông 4kHz, lấy 8.000 mẫu / giây, mẫu thể bit Do đó, cách sử dụng PCM, tín hiệu thoại mã hoá 64kbps o Mã hóa dự đoán – điều xung mã sai phân Differential Pulse Code Modulation - DPCM - - DPCM (Differential pulse code modulation) điều xung mã vi phân trình chuyển đổi tín hiệu tương tự sang tín hiệu số cách lấy mẫu tín hiệu tương tự sau lượng tử vi phân giá trị tín hiệu thực giá trị dự đoán (dự đoán giá trị sở mẫu trước hay mẫu) mã hóa thành giá trị số Từ mã DPCM miêu tả vi phân mẫu không PCM từ mã mô tả giá trị mẫu o Mã hóa dự đoán thích nghi – điều xung mã sai phân thích nghi Adaptive Differential Pulse Code Modulation - ADPCM với chuẩn G.726 - Một cách đơn giản mà sửa đổi chế độ PCM mã hóa khác biệt hai mẫu hay mã hóa mẫu cách trực tiếp Kỹ thuật gọi điều chế xung mã vi sai - Một đặc tính tín hiệu thoại sử dụng giá trị mẫu dự đoán từ giá trị mẫu khứ Ở phía truyền, dự đoán giá trị mẫu tìm thấy khác biệt giá trị dự báo giá trị thực tế sau gửi giá trị khác biệt Kỹ thuật gọi điều chế thích nghi xung mã vi sai (ADPCM) Sử dụng ADPCM, tín hiệu thoại mã hoá 32kbps mà không cần xuống cấp chất lượng so với PCM - ITU-T khuyến nghị G.721 quy định thuật toán mã hóa Trong ADPCM, giá trị mẫu lời thoại không truyền, khác biệt giá trị dự báo mẫu giá trị thực tế truyền Nói chung, coder ADPCM lấy liệu mã hoá tiếng nói PCM chuyển đổi thành liệu ADPCM Mã hóa miền tần số: o Mã hóa dải tần Subband Coding – SBC với chuẩn G.722 Đối với âm thanh, thực nghiệm cho thấy tai người có số hiệu ứng âm hiệu ứng che tần số, che thời gian, Do tiết kiệm liệu cách loại thành phần tín hiệu bị che, mã hoá phần nghe thấy Hiệu ứng che tai người khác thành phần tần số, ta cần chia tín hiệu âm thành thành phần tần số (dải băng con) xác định thành phần bị che không bị che tín hiệu dải tần số để xử lý Đó tư tưởng mã hoá SBC Mã hóa SBC chia tín hiệu gốc thành thành phần tín hiệu thuộc dải tần (sub-band) để xử lý mã hóa riêng biệt thành phần sau gửi Việc nhận tín hiệu, giải mã khôi phục tín hiệu ban đầu thực theo trình tự ngược lại Các dải băng không chồng chập lên (mà thực chất liền kề nhau), tín hiệu thu dải tần giải tương quan, nhờ mã hoá riêng biệt mà khôi phục thành tín hiệu ban đầu Mã hoá SBC ứng dụng rộng rãi nén liệu audio, video, đặc biệt chuẩn nén liệu MPEG Mã hoá SBC gồm bước sau: Lọc phân tích: tín hiệu đưa qua lọc nhằm chia tín hiệu thành thành phần tín hiệu ứng với dải tần không chồng Đáp ứng xung lọc sau lọc trước nhân với hàm số cos (để dịch đáp ứng khoảng) Tín hiệu dải tần giảm tần số lấy mẫu M lần (M số dải tần chia tín hiệu) Việc giảm tần số lấy mẫu làm phổ rộng ra, trải hết trục tần số Số mẫu lúc giảm theo Giảm tần số lấy mẫu thực dựa theo định lý lấy mẫu Nyquist hệ định lý Nyquist Tỷ lệ giảm tần số lấy mẫu phụ thuộc vào tỷ lệ dải thông lọc với dải tần tín hiệu vào Thực lượng tử hoá mã hoá riêng dải tần số Lựa chọn phương pháp lượng tử hoá mã hoá, thực phân phối bit dựa tính chất dòng tín hiệu sau lọc Đây bước mang lại hiệu nén cho toàn trình mã hoá SBC Phân phối bit việc phân chia số bit có cho mã hoá dải, dựa theo tín hiệu dải dải, lượng thông tin khác Phân phối bit ảnh hưởng lớn đến khôi phục liệu sau trình gửi nhận liệu.Giải mã, tổng hợp SBC thực theo trình tự ngược lại: - Tín hiệu nhận được phân kênh xử lý với dải tần tương ứng - Giải mã tín hiệu, sử dụng hệ số trình lượng tử hoá mã hoá trước - Tăng tần số lấy mẫu lên M lần - Đi qua lọc để tín hiệu có xung giống lúc sau qua lọc phần mã hoá - Ghép tín hiệu lại thành tín hiệu ban đầu o Mã hóa dựa phép biến đổi Transform Coding Kết luận: Ưu điểm mã hóa dạng sóng có khả cung cấp thoại tốt tiếng nói gốc hiệu tốc độ bit cao 2.2 Phương pháp mã hóa nguồn: o Nguyên lý mã hóa nguồn dựa mô hệ thống phát âm người Vocoder, tạo âm tiếng nói từ tập tham số Vocoder làm việc với kiểu nguồn kích thích nguồn xung tạo âm hữu nguồn nhiễu trắng tạo âm vô Từ đó, mô hệ thống phát âm hệ thống lọc dự đoán tuyến tính LPC kích thích hai trạng thái nguồn o Ưu điểm phương pháp đạt tốc độ dòng bit thấp, phân tích tham số nguồn kích thích, sửa đổi nội dung tiếng nói theo ý muốn Tuy nhiên, nhược điểm tiếng nói nhận tiếng nói tổng hợp giọng nói người 2.3 Phương pháp mã hóa lai: o Mã hóa lai dùng để lấp khoảng cách ranh giới mã hóa dạng sóng mã hóa nguồn mã hóa dạng sóng có khả cung cấp thoại tốt bị giới hạn sử dụng tốc độ thấp mã hóa nguồn hoạt động tốc độ tấp tạo âm trung thực tốc độ o Mã hóa lai phổ biến mã hóa dựa kết hợp phân tích cách tổng hợp Analysis-by-Synthesis AbS: + Phương pháp sử dụng mô hình dự đoán tuyến tính ( giống LPC) tạo âm tiếng nói nhờ tập tham số không ứng dụng mô hình trạng thái đơn giản ( hữu thanh- vô thanh) + Mô hình cố gắng giảm tối đa độ sai lệch với dạng sóng tín hiệu vào cách tìm kiếm tín hiệu kích thích ký tưởng + Thuật toán tìm sóng kích thích định độ phức tạp mã hóa o Các loại mã hóa lai khác theo kỹ thuật phân tích tạo tín hiệu kích thích CELP, RPE-LTP, MPE… Đánh giá chung phương pháp:  Mã hóa dạng sóng nói chung không cho phép đạt chất lượng tiếng nói tốt tốc độ bit 16Kbps Nhưng tiếng nói nhận giống với tiếng nói ban đầu Mã hóa Vocoder đạt tốc độ bit thấp tiếng nói nhận tiếng nói tổng hợp không giống với tiếng nói ban đầu  Mã hóa lai cải thiện nhược điểm mã hóa sóng mã hóa nguồn, tương đối phức tạp thường dùng theo chuẩn GSM B- Các chuẩn ITU dùng ứng dụng VOIP Hiệp hội viễn thông quốc tế ITU-T (International Telecommunication Union - Telecommunication) đưa chuẩn nén âm G728, G729, G723.1 … dành cho băng thông thoại thấp với tần số 300Hz đến 3.4 kHz Tất chuẩn dựa chuẩn mã hóa CELP (Code – Excited Linear Prediction) Chuẩn nén âm tiêu chuẩn hóa mã ANSI-C với lý chính: - Độ tin cậy tương tác thiết bị - Giá thành thấp tiện ích thực thi dựa 16 bit fixpoint DSP  Một vài chuẩn nén âm thoại ITU :  Sử dụng thiết bị đường dây số  G.711 ( a-law u-law hàm lượng tử hóa PCM tốc độ 64kbits/s)  G.721 (ADPCM tốc độ 32 kbits/s)  G.723 (ADPCM tốc độ 40, 24 kbits/s)  G.726 (ADPCM tốc độ 16, 24, 32, 40 kbits/s)  Sử dụng thiết bị di động  G.728 (tốc độ 16 Kbps, độ trễ < 2ms, chất lượng giống tốt G.721)  G.723.1 (CELP tốc độ 5.3 6.4 kbits/s)  G.729 (CELP tốc độ kbits/s)  GMS 06.10 ( tốc độ 13 6.5 kbits/s) Chuẩn G.711 G.711 chuẩn nén –giãn âm ITU-T thường sử dụng điện thoại Chuẩn đưa sử dụng vào năm 1972.Tên thức chuẩn G.711 phương pháp điều biến mã xung cho tần số giọng nói “Pulse Code Modulation _PCM” có phiên Uu-law sử dụng cho Bắc Mỹ Nhật Bản a-law sử dụng cho quốc gia lại Chuẩn G.711 khuyên dùng nhiều công nghệ khác H.320 , H.323 G.711 codec đặc trưng cho mã hóa dạng sóng G.711 yêu cầu cung cấp bang thông 64kbit/s truyền tín hiệu thoại khoảng từ 300-3400Hz lấy mẫu chúng với tốc độ 8000 mẫu/s Về sau có phát triển thành phiên G.711.0 G.711.1 bổ sung phương pháp nén liệu để giảm bang thông tang chất lượng âm Ứng dụng thực tế: - - - G.711 chuẩn ITU-T dùng cho thoại cho tổng đài , phát hành thức vào năm 1972 G.711 trình bày mẫu điều chế xung mũ logarit cho tín hiệu bang tần thoại ,tần số lấy mẫu 8000 mẫu s Có thuật thức được định nghĩa chuẩn , giải thuật µ-law dung cho khu vực Bắc Mỹ, Nhật giải thuật A-law dùng cho khu vực châu Âu nước lại giải thuật mã hóa dạng mẫu PCM tuyến tính 14-bit Alaw 13-bit với mẫu 8-bit.Như mã hóa G.711 tạo luồng liệu bit có tốc độ 64kbit/s với tần số lấy mẫu 8kHz G.711 thường sử dụng Voice over Internet Protocol (VoIP), gọi điện thoại Internet Chuẩn G722 G.722 chuẩn codec âm dải rộng ITU-T hoạt động đa dạng bang thông 48 , 56 64kbit/s công bố năm 1988 cải tiến sử dụng công nghệ codec băng ADPCM Trong mã hóa băng tín hiệu chia băng tần sử dụng lọc mã hóa băng sử dụng số liệu thống kê để mã hóa tín hiệu băng tần sử dụng số lượng khác bit Tiêu chuẩn G.722 ITU sử dụng chủ yếu hội nghị qua điện thoại , sử dụng hệ thống truyền thông không dây , dịch vụ thông tin liên lạc cá nhân Ứng dụng thực tế: 10 dln(k) =log2 (dl (k)- y(k))  Ví dụ tốc độ 40kbps dùng bit nhị phân (4 bit biên độ bit dấu)  Tín hiệu vi phân D(n) (3) qua lượng tử hóa thích nghi gồm phần LOG chuyển tín hiệu tuyến tính sang miền logarit DL,DS.Khối SUBTB nhận đầu vào tín hiệu DL sau đầu –DLN Khối Quan( nhận đầu vào –DLN,DS đầu tín hiệu ADPCM ký hiệu C(n) (4) Tốc độ 40kbps l(k) nằm 31 giá trị khác l(k) nghịch đảo lượng tử thích ứng Bảng giá trị tham khảo giá trị cảu l(k) tốc độ 40kbps (nguồn tham khảo có kèm tài liệu tham khảo) 17 Bộ lượng tử hóa thích ứng đảo tạo tín hiệu khác biệt lượng tử từ 5,4,3,2 chữ số nhị phân tương ứng Dq(n) Ở tín hiệu sinh từ dq(k) giá trị tạo cách chuyển giá trị miền logarit theo công thức dq(k)= 2dq ^ln ((k)+Y (k)) Có nguyên tắc khối Nhanh cho tín hiệu:(thoại ) sản xuất tín hiệu khác biệt với biến dộng lớn Làm chậm tín hiệu (voiceband) sản xuát tín hiệu khác biệt nhỏ Các tính toán miền logarit với ví dụ tốc độ 40kbps Theo công thức yu(k)=(1-2^-5)y(k)+2^-5W[i(k)] Với yu(k) giá trị :1.06=13, SSQ=SS&8191 • Với LAW=1 (luật A) SSS=SS>>12, SSM=SS&4095, SSQ=SSM13 SLI = • SES=SE>>14 SEI = • D= (SLI + 65536 − SEI) & 65535 Khối lượng tử thích nghi 19 Tín hiệu vi phân d(k) tính toán cách trừ giá trị ước lượng tín hiệu vào nó: d(k)=(k)-(k) (k): Tín hiệu PCM đồng dạng (k): Tín hiệu ước lượng - Bộ lượng tử thích nghi 31-, 15-,7- ,4- sử dụng 5, 4, bit nhị phân tương ứng, dùng để lượng tử hóa tín hiệu vi phân d(k) với tốc độ bit 40, 32, 24 16kbps - Hình ảnh: Khối lượng tử thích nghi - Gồm khối: LOG, SUBTB, QUAN LOG: • Đầu vào: Tín hiệu vi phân D tính toán SUBTA khối biến đổi PCM đồng dạng • Đầu ra: (Tín hiệu vi phân ) - DL, bit dấu tín hiệu sai phân (Sign bit of difference signal- DS) • Có chức chuyển đổi tín hiệu sai phân từ tuyến tính sang miền logarit • DS = D >> 15 DQM = • Tính toán hệ số mũ: EXP = • Tính toán xấp xỉ MANT = ((DQM > EXP) & 127 • Kết hợp bit giá trị bit phần mũ: DL = (EXP > 2)) & 4095 Khối lượng tử hóa thích ứng đảo: Giá trị sau lượng tử tín hiệu vi phân truyền đến phía thu Một lượng tử hóa thích ứng đảo tạo tín hiệu vi phân lượng tử từ mẫu bit Tín hiệu ước lượng cộng vào tín hiệu vi phân lượng tử để phục hồi lại dạng tín hiệu Cả hai tín hiệu hồi phục tín hiệu vi phân lượng tử đưa vào tiên đoán tương thích, có tác dụng ước lượng tín hiệu đầu vào hoàn thành vòng lặp - Gồm khối con: RECONST, ADDA, ANTILOG - ADDA: Hình ảnh: Khối lượng tử hóa thích ứng đảo 21 • Đầu vào: (normalized quantized difference) – DQLN, Y • Đầu ra: (quantized difference signal)- DQL • Có chức thêm hệ số tỉ lệ vào giá trị logarit tín hiệu vi phân lượng tử DQL = (DQLN + (Y >> 2)) & 4095 ANTILOG: • Đầu vào: DQL, bit dấu tín hiệu vi phân lượng tử (Sign bit of quantized difference signal - DQS) • Đầu ra: Tín hiệu vi phân lượng tử (Quantized difference signalDQ) • Có chức chuyển tín hiệu vi phân lượng tử miền logarit sang miền tuyến tính • Lấy bit số mũ : DS = DQL >> 11 DEX = (DQL >> 7) & 15 • Lấy bit giá trị: DMN = DQL & 127 • Chuyển đổi giá trị sang tuyến tính, sử dụng xấp xỉ : DQT = (1 = tempstep) code = bitor(code, 4); diff = diff - tempstep; end tempstep = bitshift(tempstep, -1); if (diff >= tempstep) code = bitor(code, 2); diff = diff - tempstep; end tempstep = bitshift(tempstep, -1); if (diff >= tempstep) code = bitor(code, 1); end diffq = bitshift(step, -3); if (bitand(code, 4)) diffq = diffq + step; end if (bitand(code, 2)) diffq = diffq + bitshift(step, -1); end if (bitand(code, 1)) diffq = diffq + bitshift(step, -2); 25 end if (bitand(code, 8)) predsample = predsample - diffq; else predsample = predsample + diffq; end if (predsample > 32767) predsample = 32767; elseif (predsample < -32768) predsample = -32768; end index = index + IndexTable(code+1); if (index < 1) index = 1; end if (index > 89) index = 89; end prevsample = predsample; previndex = index; adpcm_y(n) = bitand(code, 15); %adpcm_y(n) = code; n = n + 1; end HUFFMAN histogram = hist(y, max(y)-min(y)+1); p = histogram/length(y); symbols = [0:15]; [dict, avglen] = huffmandict(symbols,p); compressed = huffmanenco(y, dict); HUFFMAN-1 X=adpcm_decoder(x); DECODE function raw_y = adpcm_decoder(adpcm_y) IndexTable = [-1, -1, -1, -1, 2, 4, 6, 8, -1, -1, -1, -1, 2, 4, 6, 8]; 26 StepSizeTable = [7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 19, 21, 23, 25, 28, 31, 34, 37, 41, 45, 50, 55, 60, 66, 73, 80, 88, 97, 107, 118, 130, 143, 157, 173, 190, 209, 230, 253, 279, 307, 337, 371, 408, 449, 494, 544, 598, 658, 724, 796, 876, 963, 1060, 1166, 1282, 1411, 1552, 1707, 1878, 2066, 2272, 2499, 2749, 3024, 3327, 3660, 4026, 4428, 4871, 5358, 5894, 6484, 7132, 7845, 8630, 9493, 10442, 11487, 12635, 13899, 15289, 16818, 18500, 20350, 22385, 24623, 27086, 29794, 32767]; prevsample = 0; previndex = 1; Ns = length(adpcm_y); n = 1; while (n 32767) predsample = 32767; elseif (predsample < -32768) predsample = -32768; 27 end index = index + IndexTable(code+1); if (index < 1) index = 1; end if (index > 89) index = 89; end prevsample = predsample; previndex = index; raw_y(n) = predsample / 32767; n = n + 1; end Phần 2:Thử nghiệm ứng dụng thực tế Sử dụng phần mềm Cool Edit Pro : phần mềm chuyên dùng để thu âm mix nhạc Cho phép định dạng xuất file âm kiểu mã hóa PCM,ADPCM, Giao diện : 28 Lựa chọn thông số cho chất lượng âm thanh,ở chọn Rate 64000,Resolution 32 bit Sau ghi âm xong,ta lưu lại file âm chọn định dạng kèm theo chuẩn mã hóa - Dưới hình ảnh cho file sử dụng ADPCM PCM: 29  Ở file âm lưu lại với định dạng file wma,ta thấy khác lớn dung lượng file cách mã hóa PCM ADPCM  Mã hóa PCM : 3,1 Mb  Mã hóa ADPCM : 399 KB  Khi phát hai file âm chất lượng âm nghe không khác  Vậy nên ứng dụng chuẩn mã hóa ADPCM nhiều chuẩn mã hóa PCM sử dụng mạng điện thoại hệ thống phát TÀI LIỆU THAM KHẢO 30 - Giáo trình Truyền thông đa phương tiện (IT 4681) – PGS.TS Nguyễn Thị Hoàng Lan - G.726 Adaptive Differential Pulse Code Modulation (ADPCM) on the TMS320C54x DSP- TexasInstrument Application Report ,SPRA118 - May 2002 - 40, 32, 24, 16 kbit/s ADAPTIVE DIFFERENTIAL PULSE CODE MODULATION (ADPCM)- Recommendation G.726INTERNATIONAL TELECOMMUNICATION UNION 31 [...]... lâu đời G.726 Là chuẩn mã hóa tiếng nói ITU- T ADPCM truyền âm thanh với các 16,24,32và 40 kbps (thay thế cho G.721(32kbps) và G.723(24vs 40 kbps)) Hoạt động với tần số 16kbps.Bốn tốc độ bit thường sử dụng cho chuẩn G.726 tương ứng với kích thước của 1 mẫu là 2-bits, 3-bits, 4bits, 5-bits Tốc độ thường dùng 32kbps Ứng dụng thực tế: - Là 1 chuẩn ITU- T mã hóa âm thoại bang tần rộng , là chuẩn mở rộng của... chuyên dùng để thu âm và mix nhạc Cho phép định dạng xuất của file âm thanh và kiểu mã hóa PCM,ADPCM, Giao diện chính : 28 Lựa chọn các thông số cơ bản cho chất lượng âm thanh, ở đây chọn Rate 64000,Resolution 32 bit Sau khi đã ghi âm xong,ta sẽ lưu lại file âm thanh này và chọn định dạng kèm theo chuẩn mã hóa - Dưới đây là hình ảnh cho ra 2 file sử dụng ADPCM và PCM: 29  Ở đây file âm thanh trên đã được...- - Là chuẩn ITU- T dung cho mã hóa tiếng nói bang tần rộng hoạt động với tốc độ truyền 32-64 kbit/giây Công nghệ mã hóa dựa trên việc phân chia bang tần ADPCM Chuẩn G.722 và dữ liệu mẫu âm thanh 16kHz, gấp đôi tốc độ xử lý tại các giao tiếp thoại truyền thông, kết quả chất lượng thoại tốt hơn Chuẩn G.722 được các nhà cung cấp VOIP sử dụng Ngoài ra G.722... thiết bị nhân mạch số ( hiện nay chuẩn này bị thay thế bới G.726 ) 4 Chuẩn G.726 - Chuẩn G.726 chủ yếu dung trong các ứng dụng Voice overIP( vì yêu cầu băng thông thấp ) 11 - Là chuẩn mã hóa tiếng nói ITU- T ADPCM truyền âm thanh với các 16,24,32và 40 kbps(thay thế cho cả G.721(32kbps) G.723(24vs 40 kbps) G.726 hoạt động với tần số 16kbps.Bốn tốc độ bit thường sử dụng cho chuẩn G.726 tương ứng với kích... thường dùng 32kbps 5 Chuẩn G.729 G.729 là : 1 giải thuật nén dữ liệu âm thanh dùng cho tín hiệu thoại, nén tín hiệu âm thanh với khung 10 mili giây Đa số dùng trong các ứng dụng Voice overIP với yêu cầu bang tần thấp Chuẩn G.729 hoạt động với tốc độ 8kbps(6.4kbps vs 11.8kbps) Nó có 2 dạng là G.729a và G.729b Cả 2 dạng đều hoạt động ở băng tần thấp và ngày nay người ta phát triển chuẩn G.729.1 hoạt động... nhân, ứng dụng hội nghị truyền hình và General Packet Radio Service (GPRS) 3 Chuẩn G723 G.723 cũng giống như chuẩn G.722 là chuẩn mã hóa âm thoại băng tần rộng , nó là chuẩn mở rộng của G.711 điều chế xung sai phân thích ứng với tốc độ truyền là 24 và 40kbit/s ,nó vẫn chưa đáp ứng được mục tiêu của ITU là chuẩn mã hóa âm thoại băng tần rộng hoạt động trên dải 16, 24 và 32 kbit/s Nên nó không được sử... Ứng dụng thực tế: - Là 1 giải thuật nén dữ liệu âm thanh dùng cho tín hiệu thoại, nén tín hiệu âm thanh với khung 10 mili giây - Đa số dung trong các ứng dụng Voice overIP với yêu cầu bang tần thấp .Chuẩn G.729 hoạt động với tốc độ 8kbps(6.4kbps vs 11.8kbps) - G.729a, G.729b Những năm gần đây G.729 được nghiên cứu để mở rộng cho tín hiệu bang tần rộng (G.729.1) 6 Chuẩn GMS GSM là hệ thống thông tin... năm 1989 nó sử dụng 13kbit/s cho mã hóa âm thoại và 9.8 kbit/s cho mã hóa kênh FR là bộ codec mặc định cho cung cấp dịch vụ thoại GSM -Bộ HR codec tiết kiệm dung lượng kênh hoạt động ở 5.6kbit/s cho mã hóa thoại và 5.8kbit/s cho mã hóa kênh chất lượng thoại vấn như chuẩn codec FR -Bộ ERF codec được sử dụng đầu tiên ở Mỹ vào năm 1996 sử dụng 12.2 kbit/s mã hóa âm thoại và 10.6kbit/s mã hóa kênh -Bộ AMR... AMR-WB codec là bộ mã hóa cuối cùng gần nhất đặc trưng cho thoại 3G, băng tần rộng giúp cải tiến chất lượng âm thanh thoại Ứng dụng thực tế: - "libgsm" đã được phát triển 1992-1994 của Jutta Degener và Carsten Bormann, sau đó tại Technische Universität Berlin dựa vào chuẩn GSM 06.10 - Các codec libgsm miễn phí có thể mã hóa và giải mã GSM Full Rate âm thanh - Ngoài ra còn có một plugin Winamp cho GSM 06,10... các chuẩn nén ITU: RPELTP PCM MICDA Đánh giá hiệu năng (Standar) G.711 G.726 ETSI GMS 06 -10 DOD FS1016 G729 DOD LPC 10 FS 1015 Tốc độ sau nén (Debit) 64 kbit/s 32 kbit/s 13kbit/ s 4.8 kbit/s 8 kbit/s 2.4 kbit/s Chất lượng (MOS) 4.2 4.0 3.6 3.5 4.0 2.3 Độ trễ (Delay) 125µs 300µs 50ms 50ms 30ms 50ms MISP 0.1 12.0 2.5 16.0 20.0 7.0 14 CELP CSACELP Encoder LPC C- Phân tích một sơ đồ mã hóa tiếng nói thoại

Ngày đăng: 08/06/2016, 23:56

Từ khóa liên quan

Mục lục

  • LỜI NÓI ĐẦU

  • A- Một số khái niệm sound và đặc điểm của hai loại tín hiệu audio

    • 1. Tìm hiểu chung về âm thanh thoại

    • 2. Các phương pháp mã hóa tiếng nói

      • 2.1 Phương pháp mã hóa sóng (waveform)

      • 2.2 Phương pháp mã hóa nguồn:

      • 2.3 Phương pháp mã hóa lai:

      • B- Các chuẩn ITU dùng trong các ứng dụng VOIP

        • 1. Chuẩn G.711

        • 2. Chuẩn G722

        • 3. Chuẩn G723

        • 4. Chuẩn G.726

        • 5. Chuẩn G.729

        • 6. Chuẩn GMS

        • C- Phân tích một sơ đồ mã hóa tiếng nói thoại theo chuẩn ITU G726

        • D- Xây dựng thuật toán mã hóa theo sơ đồ phân tích trên, đặt thực nghiệm và đo lường hiệu năng giải pháp nén này

          • I. Thuật toán mã hóa ADPCM:

          • II. Xây dựng thử nghiệm trên matlab sử dụng bộ CODEC theo chuẩn G.726 (sử dụng phương pháp mã hóa ADPCM) và đánh giá hiệu năng

          • TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan