Xử lý âm thanh và thoại

Một phần của tài liệu Hệ thống thông tin di động W-CDMA (Trang 133 - 138)

4.2.2.1 Thuật toán CELP

Có ba ph−ơng pháp mã hoá thoại thông dụng là: mã hoá dạng sóng âm (waveform), mã hoá giọng nói (vocoder) và mã hoá kết hợp (Hybrid).

M∙ hoá dạng sóng âm: Giống nh− PCM và APCM, mã hoá dạng sóng âm thực hiện mã hoá dạng sóng tín hiệu ở mức chính xác nhất có thể, không phụ thuộc vào tính chất tự nhiên của tín hiệu nên khi tốc độ bit đủ lớn thì chất l−ợng là tốt nhất (16kbit/s), tuy nhiên khi tốc độ bít giảm thì chất l−ợng sẽ giảm đi rất nhanh chóng.

M∙ hoá giọng nói: Ph−ơng pháp này dựa vào một mô hình tạo tiếng nói và phân tích, mã hoá các tham số của mô hình này. Mặc dù ph−ơng pháp này cho phép tốc độ bit thấp (2kbit/s), nh−ng rất khó để cải thiện chất l−ợng tiếng nói ngay cả khi tốc độ bít đ−ợc nâng cao vì chất l−ợng tiếng nói phụ thuộc rất lớn vào mô hình tạo tiếng nói.

M∙ hoá kết hợp: Là ph−ơng pháp kết hợp hai ph−ơng pháp trên. Phân tích các tham số của bộ tạo tiếng nói và mã hoá dạng sóng đối với phần thông tin còn lại. CELP là ph−ơng pháp mã hoá tiêu biểu cho ph−ơng pháp này và đ−ợc dùng rộng rãi trong thông tin di động.

Hình 4.6 mô tả một bộ tạo tiếng nói trong ph−ơng pháp mã hoá CELP. Bộ mã hoá và giải mã CELP có cùng cấu trúc bên trong. Bộ giải mã gồm có: bộ lọc tổng hợp dự đoán tuyến tính và hai bộ tham chiếu (bảng mã) tạo tín hiệu điều khiển bộ lọc. Bộ lọc đóng vai trò nh− khoang miệng tái tạo lại phổ của tín hiệu tiếng nói, tín hiệu điều khiển đóng vai trò nh− âm thanh của thanh quản. CELP tái tạo lại hệ thống phát âm của con ng−ời.

Phần tiếp theo mô tả các kỹ thuật cơ bản đ−ợc dùng trong CELP.

Phân tích dự đoán tuyến tính.

Dựa vào tính t−ơng quan tạm thời của tín hiệu thoại và dự đoán tín hiệu dựa vào các tín hiệu tr−ớc đó. Sự khác nhau giữa tín hiệu dự đoán đ−ợc và tín hiệu gốc gọi là phần d− dự đoán.

Mã hoá CELP tính toán độ t−ơng quan của các tín hiệu thoại và hệ số dự đoán tuyến tính αi. Bậc của hệ số dự đoán trong băng tần thoại thông th−ờng chỉ là 10. Vì vậy khó xác định sự ổn định của bộ lọc, các hệ số của bộ lọc đ−ợc chuyển đổi thành các hệ số t−ơng đ−ơng và hệ số ổn định, ví dụ nh− các hệ số phản hồi, sau đó đ−ợc l−ợng tử hoá để truyền đi. Bộ giải mã tạo thành một bộ lọc tổng hợp với hệ số truyền dẫn αi điều khiển bộ lọc và phần d− dự đoán tái tạo tín hiệu thoại. Đặc tính tần số của bộ lọc t−ơng đ−ơng với đ−ờng bao phổ tín hiệu thoại.

Bộ lọc tải theo độ nhạy (Perceptual Weighing Filter)

CELP mã hoá tín hiệu bằng cách tìm các mẫu và độ lớn trong mỗi bảng mã (codebook) sao cho lỗi giữa tín hiệu thoại tổng hợp và tín hiệu thoại đầu vào là nhỏ nhất, kỹ thuật này đ−ợc gọi là phân tích bằng tổng hợp (A-b-S) là một trong những đặc tính của CELP.

Hình 4.6 Cách tạo giọng nói trong ph−ơng pháp mã hoá CELP

Phổ giọng nói

Tần số Dạng sóng của giọng nói Thanh âm (dây thanh quản) (vòm miệng)Phụ âm

Nguồn âm (giọng nói) Nguồn phụ âm Bộ lọc tổng hợp Thông tin kích thích Phổ tin tức Công su ất

Hình 4.7 Ph−ơng pháp phân tích dự đoán tuyến tính

Bảng m∙ t−ơng thích

Bảng mã t−ơng thích l−u trữ các tín hiệu kích thích tr−ớc đó trong bộ nhớ và thay đổi chúng một cách linh động. Nếu tín hiệu kích thích là tuần hoàn, giống nh− tiếng nói, tín hiệu kích thích có thể đ−ợc biểu diễn hiệu một cách hiệu quả khi sử dụng bảng mã vì tín hiệu này lặp lại tại đỉnh chu kỳ t−ơng ứng với đỉnh của giọng nói.

4.2.2.2 Các công nghệ ngoại vi dùng trong thông tin di động

Trong thông tin di động, các công nghệ ngoại vi đ−ợc áp dụng để đáp ứng đ−ợc với các điều kiện đặc biệt nh−: sử dụng các đ−ờng truyền vô tuyến, sử dụng dịch vụ các dịch vụ ngoài trời hoặc trong khi di chuyển.

Công nghệ sửa lỗi

Mã sửa lỗi dùng để sửa các lỗi do quá trình truyền dẫn tạo ra trên các kênh vô tuyến. Ph−ơng pháp sửa lỗi đ−ờng truyền lựa chọn bít (BS-FEC) hay ph−ơng pháp chống lỗi không đồng đều ( UEP) sửa lỗi khá hiệu quả vì chúng sử dụng các mã sửa lỗi với các khả năng khác nhau phụ thuộc vào độ nhạy với lỗi của bit thông tin mã hoá thoại.

Công nghệ ẩn lỗi

Nếu một lỗi không thể sửa đ−ợc bằng các ph−ơng pháp trên, hoặc thông tin bị mất thì không thể giải mã chính xác đối với tín hiệu thu. Trong tr−ờng hợp này thì phần bị lỗi của tín hiệu thoại đ−ợc tái tạo bằng phép nội suy giá trị dựa vào các thông tin thoại đã biết, để giảm thiểu sự suy giảm chất luợng thoại. Đây là công nghệ ẩn lỗi. Các

Các thông số dự đoán Giá trị dự đoán Bộ lọc tổng hợp Bộ lọc đảo Phần d− dự đoán Thời gian Hàm truyền Bộ lọc dự đoán tuyến tính

giá trị đ−ợc nội suy bao gồm: hệ số dự đoán tuyến tính, chu kỳ âm độ và hệ số khuếch đại. Các giá trị này có mức độ t−ơng quan về thời gian rất cao.

Truyền dẫn gián đoạn

Truyền dẫn gián đoạn (DTX) không gửi hoặc gửi rất ít thông tin trong khoảng thời gian không có tín hiệu thoại. Điều này rất hiệu quả để tiết kiệm pin của các máy di động và giảm nhiễu. Bộ tách tín hiệu thoại tích cực (VAD) sử dụng các thông số thoại để xác định lúc nào có tín hiệu thoại, lúc nào không. Trong khoảng lặng thì nhiễu nền đ−ợc tạo ra (dựa trên thông tin cơ bản về nhiễu nền) gồm một l−ợng thông tin nhỏ hơn thông tin thoại nhằm làm giảm độ "mất tự nhiên" của tín hiệu gây ra bởi DTX.

Triệt tạp âm

Nh− đã đề cập ở phần 4.2.2.1, do thuật toán CELP sử dụng mô hình phát âm giọng nói của con ng−ời nên nó đòi hỏi quá trình triệt tạp âm (không phải giọng nói của con ng−ời) để cải thiện chất l−ợng thoại.

4.2.2.3 M∙ hóa thoại đa tốc độ thích ứng (AMR) trong IMT-2000 Tiêu chuẩn hóa

Với sự thành lập của ủy ban nghiên cứu IMT-2000 trong Hiệp hội công nghiệp và th−ơng mại vô tuyến (ARIB) năm 1997, Nhật Bản trở thành một trong những n−ớc đầu tiên trên thế giới bắt đầu tiêu chuẩn hóa bộ CODEC cho hệ thống thông tin di động thế hệ thứ 3. Nhóm đặc trách cho vấn đề này, d−ới sự chỉ đạo của Uỷ ban nghiên cứu IMT- 2000, đ−ợc giao nhiệm vụ lựa chọn CODEC cho IMT-2000. Do có vài ph−ơng pháp mã hóa thoại đ−ợc các công ty thành viên của nhóm đề xuất nên ng−ời ta đã phác thảo ra quy trình đánh giá và đánh giá sơ bộ. Trong quá trình thử nghiệm, dự án hợp tác 3G (3GPP) đ−ợc hình thành vào cuối năm 1998 với sự tham gia của ARIB, Uỷ ban công nghệ thông tin (TTC), Hiệp hội ngành viễn thông (TIA) và Viện tiêu chuẩn viễn thông Châu Âu (ETSI) v.v... Cuối cùng, 3GPP đã thống nhất lựa chọn thuật toán mã hoá thoại AMR là một thuật toán mã hoá thoại bắt buộc theo chuẩn của 3GPP.

Tổng quan về thuật toán

AMR là một ph−ơng thức mã hóa thoại đa tốc độ dựa trên cơ sở ACELP. Ph−ơng

10,2 kbit/s, 7,95 kbit/s, 7,4 kbit/s, 6,7 kbit/s, 5,9 kbit/s, 5,15 kbit/s và 4,75 kbit/s). Trong đó 12,2kbit/s, 7,4kbit/s và 6,7kbit/s có cùng thuật toán với các kỹ thuật mã hóa thoại đã đ−ợc tiêu chuẩn hóa giống các tiêu chuẩn khu vực khác.

Về cơ bản thuật toán này giống với G.729 và có một số phát minh mới về đa tốc độ. Chiều dài khung đ−ợc cố định ở 20ms ở mọi chế độ. Khả năng đa tốc độ đạt đ−ợc bằng cách thay đổi số l−ợng khung phụ và số bit l−ợng tử. Các hệ số dự báo tuyến tính đ−ợc phân tích 2 lần trên mỗi khung ở tốc độ 12,2kbit/s. ở chế độ khác, việc phân tích đ−ợc thực hiện một lần trên mỗi khung và l−ợng tử hóa vectơ đ−ợc thực hiện trên mỗi số đ−ợc chia sau khi thực hiện dự báo ở vùng LSD.

Chất l−ợng

Hình 4.8 mô tả một phần đánh giá về AMR, do DoCoMo thực hiện dựa trên qui trình đo kiểm của ARIB và đệ trình lên 3GPP. Quá trình đo kiểm đ−ợc thực hiện trong điều kiện BER của W-CDMA đặt ở 0,1%. Kết quả cho thấy 12,2 kbit/s là tốt hơn bất kỳ tốc độ mã hóa nào và nó cho thấy −u điểm hơn hẳn so với các ph−ơng pháp mã hóa khác có tốc độ bít t−ơng đ−ơng.

Ngoài ra, chất l−ợng của AMR đã đ−ợc báo cáo ở tiêu chuẩn TR 26.975 của 3GPP.

Hình 4.8 Kết quả đánh giá chất l−ợng của AMR

Sử dụng cho các ứng dụng Thoại-Phi thoại

AMR đ−ợc chọn làm thuật toán mã hóa thoại bắt buộc cho 3G-324 M, nghĩa là cho các dịch vụ thoại đa ph−ơng tiện chuyển mạch kênh của 3GPP, do AMR có cấu trúc linh hoạt và chất l−ợng tuyệt hảo. Tổ chức đặc nhiệm kỹ thuật Internet (IETF)

Giá trị trung bình Bộ mã hoá thoại tốc độ biến thiên nâng cao

cũng quy định ra một định dạng tải giao thức thời gian thực (RTP) để áp dụng AMR vào VoIP. Do đó, ngoài các dịch vụ thoại IMT-2000, AMR cũng đ−ợc sử dụng rất rộng rãi.

Xu h−ớng t−ơng lai

Tháng3/2001, 3GPP cấp phép cho AMR băng rộng (AMR-WB) là một phiên bản băng rộng hơn (lên tới 7kHz) của AMR. Phiên bản này đã t−ơng thích với ph−ơng pháp mã hóa thoại băng rộng của ITU-T. ITU-T cũng đang nghiên cứu tiêu chuẩn mã hóa thoại 4kbit/s có chất l−ợng t−ơng đ−ơng với các đ−ờng điện thoại chuyển mạch công cộng.

Mặt khác, khả năng ứng dụng VoIP hoặc mã hóa thoại vào các dịch vụ cũng đ−ợc tích cực thảo luận, để cung cấp các dịch vụ thoại chất l−ợng t−ơng đ−ơng với các mạng chuyển mạch kênh trên nền mạng IP, căn cứ vào thực trạng các mạng thông tin đ−ợc định h−ớng theo IP. Ng−ời ta đang tiến hành tiêu chuẩn hóa mạng VoIP theo các tổ chức nh−: Mạng phối hợp IP và viễn thông của ETSI, thoại IP của IETF (IPTEL) và truyền tải âm thanh/hình ảnh (AVT). Trong lúc đó, 3 GPP tiếp tục tiêu chuẩn hóa cùng với những tổ chức này để phát triển IP qua các mạng di động.

Một phần của tài liệu Hệ thống thông tin di động W-CDMA (Trang 133 - 138)

Tải bản đầy đủ (PDF)

(183 trang)