Tổng quan về mã hóa tín hiệu thoạ

Một phần của tài liệu BÀI GIẢNG XỬ LÝ ÂM THANH VÀ HÌNH ẢNH docx (Trang 31 - 33)

4. Các dải băng tần tới hạn

2.2.2.Tổng quan về mã hóa tín hiệu thoạ

Từ những năm 1930, mã hoá tiếng nói được phát triển trở thành một đặc tính quan trọng của những nhà vận hành hệ thống điện thoại ngày ngày. Sự mã hóa tiếng nói bây giờ được ứng dụng trong truyền thông tế bào, những hệ thống máy tính, tự động hóa, truyền thông quân sự, những hệ thống sinh địa, và ở khắp nơi mà thông tin số chiếm giữ. Mã hoá tiếng nói bao gồm lấy mẫu và lượng tử hóa biên độ tín hiệu tiếng nói. Mục tiêu là sẽ sử dụng một cực tiểu số lượng mẫu, trong khi giữ gìn chất lượng tiếng nói

được xây dựng lại tại phía thu. Nghiên cứu mã hoá bây giờ tập trung vào các kỹ thuật tốc

độ thấp (8 tới 2.4 kbits/s) và tốc độ rất thấp (ở dưới 2.4 kbits/s).

Hình 2.12 minh họa sơ đồ khối một hệ thống mã tiếng nói. Ở đây, tín hiệu thoại tương tự và liên tục theo thời gian từ một nguồn thoại đã cho (chưa nén) được số hóa thông qua bộ lọc (loại bỏ băng tần thừa ở tần số cao), bộ lấy mẫu (biến đổi thành tín hiệu rời rạc theo thời gian) và bộ biến đổi tương tự/số (lượng tử hóa) và sau đó được mã hoá (nén): đó là quá trình mã hoá nguồn. Tín hiệu đã mã hoá nguồn sau đó được tiếp tục mã hoá để thêm khả năng chống lỗi (mã hoá kênh) và độưu tiên để truyền dẫn qua một kênh.

26

Tại đầu thu, một bộ giải mã kênh sẽ tách và (hoặc) sửa những lỗi trong quá trình truyền dẫn và một bộ giải mã nguồn sẽ giải nén tín hiệu. Tín hiệu đã được giải nén có thể giống hệt như tín hiệu ban đầu (nén không tổn thất) hoặc nó cũng có thể bị méo hoặc suy biến theo một vài cách nào đó (nén có tổn thất).

Hình 2.12: Sơđồ khối hệ thống mã hóa thoại

Thông thường, đa số những hệ thống mã tiếng nói được thiết kế để hỗ trợ những

ứng dụng viễn thông, với tần số giới hạn trong khoảng 300 - 3400Hz. Theo định lý Nyquist, tần số lấy mẫu phải lớn hơn ít nhất là hai lần băng thông của tín hiệu liên tục để

tránh méo, nên 8 kHz thường được chọn là tần số mẫu tiêu chuẩn (cho) tiếng nói. Nếu sử

dụng từ mã 8 bít/ mẫu thì tốc độ đầu ra của kênh thoại số sẽ là 64 Kbit/s.

Như ta đã biết, tín hiệu số ưu điểm hơn hẳn so với tín hiệu tương tự trong việc truyền dẫn và xử lý tín hiệu nhất là khả năng chống lỗi đường truyền. PCM là kỹ thuật

điều chế xung mã được sử dụng rất phổ biến trong mạng thoại truyền thống để biến đổi tín hiệu tương tự thành tín hiệu số. Bình thường, một kênh thoại tương tựđược biến đổi thành một kênh PCM cơ sở có tốc độ 64 Kbit/s. Kỹ thuật PCM (chuẩn G.711) sử dụng trong mạng thoại truyền thống đảm bảo chất lượng âm khá trung thực nhưng băng tần sử

dụng còn khá lớn. Cho nên, nén thoại là cần thiết cho các ứng dụng như điện thoại di

động (tốc độ của một cuộc gọi càng thấp thì càng cung cấp được thêm các dịch vụ khác- dữ liệu; hình ảnh; video) và và các ứng dụng cho phép truyền dữ liệu tốc độ thấp (thường thấp hơn <16 Kbit/s). Ngoài ra, nén thoại cũng cần thiết cho các ứng dụng như truyền thoại qua IP (VoIP), thoại hội nghị… để giảm băng thông sử dụng trên mạng Internet.

Một kỹ thuật nén khác cũng thường được sử dụng là điều chế xung mã vi sai thích

ứng (ADPCM) theo chuẩn G.726 ITU-T. ADPCM chỉ sử dụng các mẫu 4 bit để mã hóa (tạo ra băng thông 32 Kbit/s). Khác với PCM, 4 bit không phải do trực tiếp mã hóa biên

Bộ lọc Bộ lấy mẫu Bộ biến đổi A/D Bộ mã hóa nguồn Bộ mã hóa kênh Nguồn thoại Kênh truyền Bộ giải mã kênh Bộ giải mã nguồn Bộ biến đổi D/A Bộ lọc Thoại đầu ra

27

độ xung lấy mẫu mà là mã hóa sự khác nhau giữa biên độ các xung, cũng như tốc độ thay

đổi các biên độđó sử dụng phương pháp dựđoán tuyến tính trước.

Vấn đề đặt ra là giảm băng thông hơn nữa mà vẫn đảm bảo chất lượng dịch vụđể

phù hợp với mạng VoIP, từđó xuất hiện một số kỹ thuật mã hóa và nén tín hiệu thoại tốc

độ thấp cụ thể như trong GSM: G.723.1, G.729. PCM và ADPCM đều là kỹ thuật mã hóa theo dạng sóng. Kỹ thuật nén mới (mã hóa nguồn) được phát triển cách đây 10 đến 15 năm dựa vào sự nhận biết các đặc tính nguồn của tín hiệu thoại phát ra. Kỹ thuật này sử

dụng thủ tục xử lý tín hiệu và nén thoại bằng việc chỉ gửi đi thông tin ở dạng các tham số đã được đơn giản hóa về việc kích thích tín hiệu nguồn dạng của giọng nói do vậy đòi hỏi ít băng thông hơn.

Một phần của tài liệu BÀI GIẢNG XỬ LÝ ÂM THANH VÀ HÌNH ẢNH docx (Trang 31 - 33)