Âm thanh (Sound) là các dao động cơ học của các phần tử, nguyên tử hay các hạt vật chất lan truyền trong không gian, được cảm nhận trực tiếp qua tai người bởi sự va đập vào màng nhĩ và kích thích bộ não. Sóng âm tần được đặc trưng bởi biên độ, tần số (bước sóng) và vận tốc lan truyền. Đối với tai người, âm thanh cảm nhận được bởi sóng có dao động trong dải tần từ 20Hz đến 20kHz. Tín hiệu âm thanh được chia thành 2 loại dựa trên dải tần: Âm thanh dải tần cơ sở (âm thanh tiếng nói thoại, gọi tắt là âm thanh thoại): có dải tần từ 300Hz đến 4kHz. Âm thanh dải rộng (tiếng nói trình diễn, hát, âm nhạc…): có dải tần số từ 100Hz đến 20kHz
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ──────── * ─────── BÁO CÁO TRUYỀN THÔNG ĐA PHƯƠNG TIỆN ĐỀ TÀI: PHƯƠNG PHÁP MÃ HÓA TIẾNG NÓI THOẠI Giáo viên hướng dẫn : PGS.TS Nguyễn Thị Hoàng Lan Sinh viên thực : Phạm Thành Đạt - 20121503 Đỗ Xuân Cường - 20121358 Nguyễn Trung Dũng - 20121422 Doãn Tuấn Vũ - 20122814 Phạm Minh Tuấn - 20122711 Hà Nội tháng 12/2015 MỤC LỤC LỜI NÓI ĐẦU Hiện nay, Voice over IP (hay viết tắt VoIP) nghĩa truyền giọng nói giao thức IP công nghệ hỗ trợ đắc lực cho doanh nghiệp lĩnh vực truyền thông Sử dụng giao thức TCP/IP, sử dụng gói liệu IP mạng LAN, WAN hay Internet để truyền tải âm dạng mã hóa VoIP ITU-T xây dựng chuẩn cập nhật nên ngày hoàn chỉnh Chính vậy, chúng em định chọn đề tài số "Phương pháp mã hóa âm tiếng nói thoại” Nội dung báo cáo gồm phần chính: Phần 1: Tìm hiểu chung âm thoại, giới thiệu phương pháp mã hóa tiếng nói Phần 2: Khảo sát số chuẩn mã hóa nén âm thoại theo chuẩn ITU - GSM phân tích ứng dụng thực tế chuẩn ITU Phần 3: Phân tích sơ đồ nén tiếng nói thoại theo chuẩn G nhận xét ảnh hưởng chất lượng âm dịch vụ VOIP Do thời gian nghiên cứu trình độ nhóm có hạn nên chắn trình thực đề tài không tránh khỏi sai lầm, thiếu sót nội dung lẫn hình thức Trong suốt trình thực hiện, nhóm liên tục nhận nhắc nhở, góp ý từ cô Nguyễn Thị Hoàng Lan - giảng viên hướng dẫn nhóm Chúng em xin chân thành cảm ơn cô! A- Các phương pháp sở mã hóa âm thoại ứng dụng truyền thông Tìm hiểu chung âm thoại Âm (Sound) dao động học phần tử, nguyên tử hay hạt vật chất lan truyền không gian, cảm nhận trực tiếp qua tai người va đập vào màng nhĩ kích thích não Sóng âm tần đặc trưng biên độ, tần số (bước sóng) vận tốc lan truyền Đối với tai người, âm cảm nhận sóng có dao động dải tần từ 20Hz đến 20kHz Tín hiệu âm chia thành loại dựa dải tần: - Âm dải tần sở (âm tiếng nói thoại, gọi tắt âm thoại): có dải tần từ 300Hz đến 4kHz - Âm dải rộng (tiếng nói trình diễn, hát, âm nhạc…): có dải tần số từ 100Hz đến 20kHz Audio âm thu nhận, xử lý tái tạo thiết bị điện tử, đối tượng truyền thông đa phương tiện Âm đầu vào trình nén file mp3 âm dải rộng Trong báo cáo đề cập đến âm tiếng nói thoại Một số đặc điểm âm thoại ra: - Giới hạn dải phổ tín hiệu, nói ~ 4kHz - Tần số lấy mẫu fs = 8kHz tương đương với chu kỳ Te = 125µs - Lượng tử hóa giá trị với mã hóa 8bit - Tốc độ cần thiết = 8bit x 8kHz = 64Kbit/s Các thành phần chủ yếu hệ thống mã hóa Tín hiệu âm thoại tương tự liên tục từ nguồn cho trước ( speech source) số hóa qua lọc Filter ( loại bỏ băng tần thừa tần số cao),bộ lấy mẫu sampler ( biến đổi thành tín hiệu rời rạc theo thời gian) biến đổi tín hiệu tương tự sang dạng số A/D converter sau mã hóa nén: trình mã hóa nguồn Sau đó, tín hiệu tiếp tục mã hóa để thêm khả chống lỗi độ ưu tiên để truyền dẫn qua kênh( mã hóa kênh – channel encoder) Sau qua kênh, đầu thu, giải mã kênh ( channel decoder) tách sửa lỗi trình truyền dẫn giải nén giải mã nguồn ( source decoder) cho tìn hiệu thông qua D/A conventer Filter Tín hiệu không giống tín hiệu ban đầu không tùy vào trình nén ( không tổn thất bị tổn thất) Hình Hệ thống mã hóa tiếng nói Ứng dụng truyền thông: Tín hiệu số có nhiều ưu điểm so với tín hiệu tương tự việc truyền dẫn xử lí tín hiệu khả chống lỗi đường truyền Do đó, Hệ thống mã hóa dùng để nén tiếng nói thoại cần thiết cho ứng dụng điện thoại di động ứng dụng cho phép truyền liệu tốc độ thấp, hay ứng dụng truyền thoại qua IP (VoIP), thoại hội nghị… để giảm băng thông sử dụng mạng internet Các phương pháp mã hóa tiếng nói Mã hóa tiếng nói gồm phương pháp chính: 3.1 Phương pháp mã hóa tín hiệu dạng sóng (waveform), + Mã hóa dạng sóng kỹ thuật trì hình dạng ban đầu sóng tín hiệu Nguyên lý mã hóa dạng sóng : Tại phía phát nhận tín hiệu tiếng nói tương tụ liên tục mã hóa thành tín hiệu số Tại phía thu, giải mã đảm nhận nhiệm vụ ngược lại để khôi phục tiếng nói, lỗi truyền dẫn dạng sóng tiếng nói khôi phục giống vơi tiếng nói gốc + Bao gồm loại chính: Mã hóa miền thời gian: bao gồm chuẩn từ G.710 đến G.719 o Mã hóa điều xung mã Pulse Code Modulation – PCM – lương tử hóa chuẩn hóa với chuẩn G.711 o Mã hóa dự đoán – điều xung mã sai phân Differential Pulse Code Modulation - DPCM Mã hóa dự đoán thích nghi – điều xung mã sai phân thích nghi Adaptive Differential Pulse Code Modulation ADPCM với chuẩn G.726 Mã hóa miền tần số: o Mã hóa dải tần Subband Coding – SBC với chuẩn G.722 o Mã hóa dựa phép biến đổi Transform Coding + Ưu điểm có khả cung cấp thoại tốt tiếng nói gốc hiệu tốc độ bit cao 3.2 Phương pháp mã hóa nguồn: o Nguyên lý mã hóa nguồn dựa mô hệ thống phát âm người Vocoder, tạo âm tiếng nói từ tập tham số Vocoder làm việc với kiểu nguồn kích thích nguồn xung tạo âm hữu nguồn nhiễu trắng tạo âm vô Từ đó, mô hệ thống phát âm hệ thống lọc dự đoán tuyến tính LPC kích thích hai trạng thái nguồn o Ưu điểm phương pháp đạt tốc độ dòng bit thấp, phân tích tham số nguồn kích thích, sửa đổi nội dung tiếng nói theo ý muốn Tuy nhiên, nhược điểm tiếng nói nhận tiếng nói tổng hợp giọng nói người 3.3 Phương pháp mã hóa lai: o Mã hóa lai dùng để lấp khoảng cách ranh giới mã hóa dạng sóng mã hóa nguồn mã hóa dạng sóng có khả cung cấp thoại tốt bị giới hạn sử dụng tốc độ thấp mã hóa nguồn hoạt động tốc độ tấp tạo âm trung thực tốc độ o Mã hóa lai phổ biến mã hóa dựa kết hợp phân tích cách tổng hợp Analysis-by-Synthesis AbS: + Phương pháp sử dụng mô hình dự đoán tuyến tính ( giống LPC) tạo âm tiếng nói nhờ tập tham số không ứng dụng mô hình trạng thái đơn giản ( hữu thanh- vô thanh) + Mô hình cố gắng giảm tối đa độ sai lệch với dạng sóng tín hiệu vào cách tìm kiếm tín hiệu kích thích ký tưởng + Thuật toán tìm sóng kích thích định độ phức tạp mã hóa o Các loại mã hóa lai khác theo kỹ thuật phân tích tạo tín hiệu kích thích CELP, RPE-LTP, MPE… Đánh giá chung phương pháp: Mã hóa dạng sóng nói chung không cho phép đạt chất lượng tiếng nói tốt tốc độ bit 16Kbps Nhưng tiếng nói nhận giống với tiếng nói ban đầu Mã hóa Vocoder đạt tốc độ bit thấp tiếng nói nhận tiếng nói tổng hợp không giống với tiếng nói ban đầu Mã hóa lai cải thiện nhược điểm mã hóa sóng mã hóa nguồn, tương đối phức tạp thường dùng theo chuẩn GSM B- Khảo sát số chuẩn mã hóa nén âm thoại theo chuẩn ITU - GSM phân tích ứng dụng thực tế chuẩn ITU - Asterisk tảng mở mạnh mẽ cho việc xây dựng ứng dụng đa phương tiện Viết ngôn ngữ C chạy hệ điều hành linux Thực tất tính tổng đài PBX dịch vụ gia tăng Hiện Asterisk đà phát triển nhiều doanh nghiệp triển khai ứng dụng SIP Asterisk hỗ trợ codec theo chuẩn ITU: G.711 m-law/a-law, G.722, G.723.1, G.726, G.729 Trong môi trường thực hành môn phần mềm ekiga có đỗ trợ chuẩn GSM 06.10, MS-GSM G.711 m-law/a-law, G.722, G.723.1, G.726, G.729, GSM-ARM Chuẩn G.711 G.711 chuẩn nén –giãn âm ITU-T thường sử dụng điện thoại Chuẩn đưa sử dụng vào năm 1972.Tên thức chuẩn G.711 phương pháp điều biến mã xung cho tần số giọng nói “Pulse Code Modulation _PCM” có phiên Uu-law sử dụng cho Bắc Mỹ Nhật Bản a-law sử dụng cho quốc gia lại Chuẩn G.711 khuyên dùng nhiều công nghệ khác H.320 , H.323 G.711 codec đặc trưng cho mã hóa dạng sóng G.711 yêu cầu cung cấp bang thông 64kbit/s truyền tín hiệu thoại khoảng từ 300-3400Hz lấy mẫu chúng với tốc độ 8000 mẫu/s Về sau có phát triển thành phiên G.711.0 G.711.1 bổ sung phương pháp nén liệu để giảm bang thông tang chất lượng âm Ứng dụng thực tế: - - - G.711 chuẩn ITU-T dùng cho thoại cho tổng đài , phát hành thức vào năm 1972 G.711 trình bày mẫu điều chế xung mũ logarit cho tín hiệu bang tần thoại ,tần số lấy mẫu 8000 mẫu s Có thuật thức được định nghĩa chuẩn , giải thuật µ-law dung cho khu vực Bắc Mỹ, Nhật giải thuật A-law dùng cho khu vực châu Âu nước lại giải thuật mã hóa dạng mẫu PCM tuyến tính 14-bit Alaw 13-bit với mẫu 8-bit.Như mã hóa G.711 tạo luồng liệu bit có tốc độ 64kbit/s với tần số lấy mẫu 8kHz G.711 thường sử dụng Voice over Internet Protocol (VoIP), gọi điện thoại Internet Chuẩn G722 G.722 chuẩn codec âm dải rộng ITU-T hoạt động đa dạng bang thông 48 , 56 64kbit/s công bố năm 1988 cải tiến sử dụng công nghệ codec băng ADPCM Trong mã hóa băng tín hiệu chia băng tần sử dụng lọc mã hóa băng sử dụng số liệu thống kê để mã hóa tín hiệu băng tần sử dụng số lượng khác bit Tiêu chuẩn G.722 ITU sử dụng chủ yếu hội nghị qua điện thoại , sử dụng hệ thống truyền thông không dây , dịch vụ thông tin liên lạc cá nhân - - Ứng dụng thực tế: Là chuẩn ITU-T dung cho mã hóa tiếng nói bang tần rộng hoạt động với tốc độ truyền 32-64 kbit/giây Công nghệ mã hóa dựa việc phân chia bang tần ADPCM Chuẩn G.722 liệu mẫu âm 16kHz, gấp đôi tốc độ xử lý giao tiếp thoại truyền thông, kết chất lượng thoại tốt Chuẩn G.722 nhà cung cấp VOIP sử dụng - Ngoài G.722 sử dụng hệ thống truyền thông không dây, dịch vụ thông tin liên lạc cá nhân, ứng dụng hội nghị truyền hình General Packet Radio Service (GPRS) Chuẩn G723 G.723 giống chuẩn G.722 chuẩn mã hóa âm thoại băng tần rộng , chuẩn mở rộng G.711 điều chế xung sai phân thích ứng với tốc độ truyền 24 40kbit/s ,nó chưa đáp ứng mục tiêu ITU chuẩn mã hóa âm thoại băng tần rộng hoạt động dải 16, 24 32 kbit/s Nên không sử dụng rộng rãi mà sử dụng cho thiết bị nhân mạch số lâu đời G.726 Là chuẩn mã hóa tiếng nói ITU-T ADPCM truyền âm với 16,24,32và 40 kbps (thay cho G.721(32kbps) G.723(24vs 40 kbps)) Hoạt động với tần số 16kbps.Bốn tốc độ bit thường sử dụng cho chuẩn G.726 tương ứng với kích thước mẫu 2-bits, 3-bits, 4-bits, 5-bits Tốc độ thường dùng 32kbps Ứng dụng thực tế: - Là chuẩn ITU-T mã hóa âm thoại bang tần rộng , chuẩn mở rộng G.721 điều chế xung sai phân tương thích với tốc độ truyền 24 40 kbps cho ứng dụng thiết bị nhân mạch số ( chuẩn bị thay bới G.726 ) Chuẩn G.726 - Chuẩn G.723.1 chủ yếu dung ứng dụng Voice overIP( yêu cầu băng thông thấp ) Là chuẩn mã hóa tiếng nói ITU-T ADPCM truyền âm với 16,24,32và 40 kbps(thay cho G.721(32kbps) G.723(24vs 40 kbps) G.726 hoạt động với tần số 16kbps.Bốn tốc độ bit thường sử dụng cho chuẩn G.726 tương ứng với kích thước mẫu 2-bits, 3-bits, 4bits, 5-bits Tốc độ thường dùng 32kbps Chuẩn G.729 G.729 : giải thuật nén liệu âm dùng cho tín hiệu thoại, nén tín hiệu âm với khung 10 mili giây Đa số dùng ứng dụng Voice overIP với yêu cầu bang tần thấp Chuẩn G.729 hoạt động với tốc độ 8kbps(6.4kbps vs 11.8kbps) Nó có dạng G.729a G.729b Cả dạng hoạt động băng tần thấp ngày người ta phát triển chuẩn G.729.1 hoạt động băng tần rộng Ứng dụng thực tế: - Là giải thuật nén liệu âm dùng cho tín hiệu thoại, nén tín hiệu âm với khung 10 mili giây - Đa số dung ứng dụng Voice overIP với yêu cầu bang tần thấp.Chuẩn G.729 hoạt động với tốc độ 8kbps(6.4kbps vs 11.8kbps) - G.729a, G.729b Những năm gần G.729 nghiên cứu để mở rộng cho tín hiệu bang tần rộng (G.729.1) Chuẩn GMS GSM hệ thống thông tin di động toàn cầu (global system for mobile communications) công nghệ dùng cho mạng thông tin di động Dịch vụ GSM sử dụng cho tỷ người 212 quốc gia vùng lãnh thổ( thống kê năm 2012 ).Các mạng thông tin di động GSM cho phép giao tiếp với sử dụng rộng rãi vùng lãnh thổ GSM chuẩn phổ biến điện thoại di động GSM khác với chuẩn tiền thân tín hiệu , tốc độ , chất lượng gọi Nó xem hệ thống điện thoại di động hệ thứ GSM chuẩn mở phát triển.Thuận lợi khả triển khai thiết bị từ nhiều người cung cấp Một số đặc tính GSM là: -Nói chuyện quốc tế -Chất lượng thoại cao -Tính bảo mật cao -Giá thành rẻ -Tiện lợi -Nhiều dịch vụ -tương thích cao Hiện có mã hóa GSM bao gồm : Full-Rate codec Half-Rate codec Enhanced Full-Rate codec Adaptive Multi-Rate codec Adaptive Multi Wideband –Rate codec -Bộ FR codec mã hóa GSM Được sử dung lần đầu vào năm 1989 sử dụng 13kbit/s cho mã hóa âm thoại 9.8 kbit/s cho mã hóa kênh FR codec mặc định cho cung cấp dịch vụ thoại GSM -Bộ HR codec tiết kiệm dung lượng kênh hoạt động 5.6kbit/s cho mã hóa thoại 5.8kbit/s cho mã hóa kênh chất lượng thoại vấn chuẩn codec FR 10 -Bộ ERF codec sử dụng Mỹ vào năm 1996 sử dụng 12.2 kbit/s mã hóa âm thoại 10.6kbit/s mã hóa kênh -Bộ AMR codec phát triển vượt bậc GSM mã hóa mặc định cho chế độ 3G -Bộ AMR-WB codec mã hóa cuối gần đặc trưng cho thoại 3G, băng tần rộng giúp cải tiến chất lượng âm thoại Ứng dụng thực tế: - "libgsm" phát triển 1992-1994 Jutta Degener Carsten Bormann, sau Technische Universität Berlin dựa vào chuẩn GSM 06.10 - Các codec libgsm miễn phí mã hóa giải mã GSM Full Rate âm - Ngoài có plugin Winamp cho GSM 06,10 dựa libgsm - Các GSM 06,10 sử dụng phần mềm VoIP, ví dụ Ekiga, QuteCom, Linphone, Asterisk (PBX), Ventrilo phần mềm khác C- Phân tích sơ đồ nén tiếng nói thoại theo chuẩn G nhận xét ảnh hưởng chất lượng âm dịch vụ VOIP 11 Phân tích Sơ đồ mã hóa AS-ACELP Nguyên lý giải mã CS-ACELP Sơ đồ mã hóa AS-ACELP : Các trình thực mã hóa: 12 Tín hiệu đầu vào đưa qua tiền xử lý, có hai chức năng: lọc thông cao tính toán tín hiệu.Tín hiệu đầu tiền xử lý tín hiệu đầu vào khối tổng hợp tiếp sau Sự tổng hợp dự báo tuyến tính (LP) thực lần khung 10 ms để tính hệ số lọc dự báo tuyến tính (LPC) Các hệ số biến đổi thành cặp vạch phổ (LSP) lượng tử phương pháp lượng tử hóa vectơ dự báo hai bước (VQ) 18 bit Các tham số kích thích gồm bảng mã cố định bảng mã thích ứng xác định qua khung 5ms (tương đương 40 mẫu) Các hệ số lọc LP lượng tử chưa lượng tử sử dụng cho phân khung thứ 2, phân khung thứ hệ số lọc LP nội suy sử dụng ( hai trường hợp lượng tủ chưa) Độ trễ bước mạch vòng hở tính toán lần khung 10ms dựa độ lớn tín hiệu thoại Tín hiệu ban đầu x(n) tính lọc độ dư LP thông qua lọc tổng hợp W(z)/A(z) Trạng thái ban đầu lọc tín hiệu lỗi hiệu dư LP tín hiệu kích thích Sự phân tích bước mạch vòng đóng thực sau (để tìm độ trễ mã thích ứng độ khuếch đại) dùng tín hiệu ban đầu x(n) đặc tuyến xung h(n), cách làm tròn giá trị độ trễ bước mạch vòng hở Độ trễ bước mã hóa mã bit phân khung thứ nhất, độ vi sai độ trễ mã hóa mã bit phân khung thứ Tín hiệu x’(n) tín hiệu tín hiệu: tín hiệu ban đầu x(n) tín hiệu mã thích ứng – tín hiệu mã cố định Tín hiệu dùng việc tìm kiếm tín hiệu kích 13 thích tối ưu Giá trị kích thích mã cố định mã hóa mã đại số 17 bit ( số bảng mã cố định mã hóa băng tự mã C1, C2-12 bit Dấu bảng mã cố định mã hóa từ mã S1, S2-3 bit ) Các khuếch đại bảng mã cố định bảng mã thích ứng lượng tử hóa vector bit, bước mã hóa từ mã GA1, GA2- 3bit bước mã hóa từ mã GB1, GB2- 4bit Tại đây, dự đoán trung bình động MA (Moving Average) cho khuếch đại mã cố định, cuối cùng, dựa vào nhớ lọc xác định tín hiệu kích thích Phân tích dự đoán tuyến tính: Sử dụng lọc thực 10ms cho khung Sử dụng cửa sổ để phân tích LP: w(n)= Nguyên lý giải mã CS-ACELP: Đầu tiên, số tham số trích từ luồng bit thu Các số giải mã để thu lại tham số mã hóa khung tiếng nói 10 ms Các tham số hệ số LSP, phần độ trễ bước ( độ trễ bước độ vi sai độ trễ bước), vecto bảng mã cố định ( số mã cố định số bảng mã cố định ) tập hợp độ khuếch đại bảng mã cố định bảng mã thích ứng Các hệ số LSP nội suy chuyển thành hệ số lọc LP cho phân khung, sau đó, phân khung thự bước Giá trị kích thích khôi phục tổng vecto bảng mã cố định bảng mã thích ứng nhân với giá trị khuếch đại tương ứng chúng Tiếng nói khôi phục cách lọc giá trị kích thích thông qua lọc tổng hợp LP Tín hiệu tiếng nói khôi phục đưa qua bước xử lý trạm, bao gồm lọc thích ứng dựa sở lọc tổng hợp ngắn hạn dài hạn, sau qua lọc thông cao nâng tín hiệu Độ trễ: Kích cỡ khung:10ms Tiêu đề: 5ms Ảnh hưởng chất lượng âm dịch vụ VoIP: 2.1 Kịch – Thực hiện: 14 Thực gọi thoại theo mô hình PC to PC mạng LAN, PC cài đặt phần mềm X-Lite Cấu trúc gồm máy chủ Asterisk, PC, tất nối mạng LAN Cài đặt cấu hình máy chủ Asterisk, X-Lite PC giống thực hành số Máy chủ asterisk cài thêm Codec G.723, G.729 Trước thực gọi, cấu hình Softphone X-Lite: Softphone -> Preferences Chuyển chuẩn Audio Codecs từ trạng thái Available sang trạng thái Enabled codecs Chọn G711 uLaw -> OK Sau thực gọi Softphone với nhau, đánh giá chất lượng âm thoại theo chuẩn qua tai thường Lần lượt thực với chuẩn Audio Codecs G.722, G.726, G.729, GSM 2.2 Đánh giá chất lượng âm thanh: Các chuẩn cho chất lượng âm tương đối tốt Chuẩn G.711, G.722, G.729 có chất lượng âm tương đương Chuẩn GSM có chất lượng âm Thực gọi nhiều lần phát sinh trường hợp bị nhiễu tiếng, tạp âm Chất lượng tiếng nói theo thang MOS chuẩn G.711 4.3, chuẩn G.722 4.1, chuẩn G729 2.3 Các yếu tố ảnh hưởng đến chất lượng âm VoIP - Băng thông: Là tốc độ truyền thông tin, băng thông lớn tốt Mạng VoIP thực việc nén thoại để giảm băng thông so với chuyển mạch kênh 15 truyền thống Chuẩn G.729 giải vấn đề giảm băng thông xuống mức cho phép mà đảm bảo chất lượng thoại - Trễ: Có thể chia trễ mạng VoIP thành loại trễ: trễ xử lý, trễ mạng trễ đệm Trễ xử lý bao gồm trễ mã hoá & trễ đóng gói Bộ xử lý thuật toán mã hóa dự đoán tuyến tính mã đại số cấu trúc thích hợp (CS-ACELP) có độ trễ thấp với kích thước khung 10ms, xem trước 5ms, độ trễ thuật toán tổng cộng 15ms Trễ mạng trễ truyền dẫn phụ thuộc vào khoảng cách, dung lượng trạng thái liên kết mạng Trễ mạng thường thay đổi khó biết trước, phụ thuộc vào nhiều phần tử mạng, khó xử lý Trễ đệm trễ sinh đệm phía thu, gói tranh chấp để giành quyền đọc trước Điều khắc phục việc nâng cấp lực đệm TÀI LIỆU THAM KHẢO 16 - - Giáo trình Truyền thông đa phương tiện (IT 4681) – PGS.TS Nguyễn Thị Hoàng Lan Tài liệu thực hành môn Truyền thông đa phương tiện http://searchunifiedcommunications.techtarget.com/ /G711 http://searchunifiedcommunications.techtarget.com/ /G722 http://searchunifiedcommunications.techtarget.com/ /G729 https://wikipedia.org https://www.google.com 17 [...]... bảng mã cố định được mã hóa băng tự mã C1, C2-12 bit Dấu bảng mã cố định được mã hóa bằng từ mã S1, S2-3 bit ) Các bộ khuếch đại bảng mã cố định và bảng mã thích ứng được lượng tử hóa bằng vector 7 bit, trong đó ở bước 1 được mã hóa bằng từ mã GA1, GA2- 3bit ở bước 2 được mã hóa bằng từ mã GB1, GB2- 4bit Tại đây, sự dự đoán trung bình động MA (Moving Average) cho bộ khuếch đại mã cố định, cuối cùng,... được mã hóa bằng mã 8 bit trong phân khung thứ nhất, độ vi sai của độ trễ được mã hóa bằng mã 5 bit trong phân khung thứ 2 Tín hiệu x’(n) là tín hiệu của 2 tín hiệu: tín hiệu ban đầu x(n) và tín hiệu mã thích ứng – là tín hiệu mã cố định Tín hiệu này được dùng trong việc tìm kiếm tín hiệu kích 13 thích tối ưu Giá trị kích thích mã cố định được mã hóa bằng mã đại số 17 bit ( trong đó chỉ số bảng mã cố...-Bộ ERF codec được sử dụng đầu tiên ở Mỹ vào năm 1996 sử dụng 12.2 kbit/s mã hóa âm thoại và 10.6kbit/s mã hóa kênh -Bộ AMR codec là sự phát triển vượt bậc của GSM đây là bộ mã hóa mặc định cho chế độ 3G -Bộ AMR-WB codec là bộ mã hóa cuối cùng gần nhất đặc trưng cho thoại 3G, băng tần rộng giúp cải tiến chất lượng âm thanh thoại Ứng dụng thực tế: - "libgsm" đã được phát triển 1992-1994 của Jutta Degener... giải mã CS-ACELP: Đầu tiên, các chỉ số của các tham số được trích ra từ luồng bit thu Các chỉ số này sẽ được giải mã để thu lại các tham số của bộ mã hóa trong 1 khung tiếng nói 10 ms Các tham số đó là các hệ số LSP, 2 phần độ trễ bước ( độ trễ bước và độ vi sai của độ trễ bước), 2 vecto bảng mã cố định ( chỉ số mã cố định và chỉ số bảng mã cố định ) và tập hợp độ khuếch đại bảng mã cố định và bảng mã. .. mã hóa và giải mã GSM Full Rate âm thanh - Ngoài ra còn có một plugin Winamp cho GSM 06,10 dựa trên libgsm - Các GSM 06,10 cũng được sử dụng trong phần mềm VoIP, ví dụ như trong Ekiga, QuteCom, Linphone, Asterisk (PBX), Ventrilo và những phần mềm khác C- Phân tích một sơ đồ nén tiếng nói thoại theo chuẩn G và nhận xét ảnh hưởng của chất lượng âm thanh trong dịch vụ VOIP 11 1 Phân tích Sơ đồ bộ mã hóa. .. đó, cứ mỗi phân khung thự hiện các bước tiếp theo Giá trị kích thích được khôi phục là tổng của vecto bảng mã cố định và bảng mã thích ứng nhân với các giá trị khuếch đại tương ứng của chúng Tiếng nói được khôi phục bằng cách lọc giá trị kích thích này thông qua bộ lọc tổng hợp LP Tín hiệu tiếng nói khôi phục đưa qua bước xử lý trạm, bao gồm bộ lọc thích ứng dựa trên cơ sở các bộ lọc tổng hợp ngắn hạn... Mạng VoIP thực hiện việc nén thoại để giảm băng thông so với chuyển mạch kênh 15 truyền thống Chuẩn G.729 giải quyết được vấn đề là giảm băng thông xuống mức cho phép mà vẫn đảm bảo chất lượng thoại - Trễ: Có thể chia trễ trong mạng VoIP thành 3 loại trễ: trễ xử lý, trễ mạng và trễ bộ đệm Trễ xử lý bao gồm trễ mã hoá & trễ đóng gói Bộ xử lý thuật toán mã hóa dự đoán tuyến tính mã đại số cấu trúc thích... trong khung 10 ms để tính các hệ số của bộ lọc dự báo tuyến tính (LPC) Các hệ số này được biến đổi thành các cặp vạch phổ (LSP) và được lượng tử bằng phương pháp lượng tử hóa vectơ dự báo hai bước (VQ) 18 bit Các tham số kích thích gồm bảng mã cố định và bảng mã thích ứng được xác định qua từng khung con 5ms (tương đương 40 mẫu) Các hệ số của bộ lọc LP đã được lượng tử và chưa được lượng tử được sử dụng... sơ đồ nén tiếng nói thoại theo chuẩn G và nhận xét ảnh hưởng của chất lượng âm thanh trong dịch vụ VOIP 11 1 Phân tích Sơ đồ bộ mã hóa AS-ACELP và Nguyên lý của bộ giải mã CS-ACELP Sơ đồ bộ mã hóa AS-ACELP : Các quá trình thực hiện mã hóa: 12 Tín hiệu đầu vào đưa qua bộ tiền xử lý, bộ này có hai chức năng: lọc thông cao và tính toán tín hiệu.Tín hiệu đầu ra bộ tiền xử lý là tín hiệu đầu vào của các khối... thanh thoại theo các chuẩn qua tai thường Lần lượt thực hiện với các chuẩn Audio Codecs G.722, G.726, G.729, GSM 2.2 Đánh giá chất lượng âm thanh: Các chuẩn đều cho chất lượng âm thanh tương đối tốt Chuẩn G.711, G.722, G.729 có chất lượng âm thanh tương đương nhau Chuẩn GSM có chất lượng âm thanh kém hơn Thực hiện cuộc gọi nhiều lần phát sinh trường hợp bị nhiễu tiếng, tạp âm Chất lượng tiếng nói theo ... thông sử dụng mạng internet Các phương pháp mã hóa tiếng nói Mã hóa tiếng nói gồm phương pháp chính: 3.1 Phương pháp mã hóa tín hiệu dạng sóng (waveform), + Mã hóa dạng sóng kỹ thuật trì hình... tiếng nói tốt tốc độ bit 16Kbps Nhưng tiếng nói nhận giống với tiếng nói ban đầu Mã hóa Vocoder đạt tốc độ bit thấp tiếng nói nhận tiếng nói tổng hợp không giống với tiếng nói ban đầu Mã hóa. .. 3.3 Phương pháp mã hóa lai: o Mã hóa lai dùng để lấp khoảng cách ranh giới mã hóa dạng sóng mã hóa nguồn mã hóa dạng sóng có khả cung cấp thoại tốt bị giới hạn sử dụng tốc độ thấp mã hóa nguồn