Xử lý âm thanh và thoại

Một phần của tài liệu hệ thống thông tin di động w-cdma - ks. nguyễn văn thuận (Trang 133 - 138)

Ch−ơng 4 : Các kỹ thuật xử lý đa ph−ơng tiện

4.2 Các kỹ thuật xử lý tín hiệu đa ph−ơng tiện

4.2.2 Xử lý âm thanh và thoại

4.2.2.1 Thuật tốn CELP

Có ba ph−ơng pháp mã hố thoại thơng dụng là: mã hố dạng sóng âm (waveform), mã hố giọng nói (vocoder) và mã hố kết hợp (Hybrid).

M∙ hố dạng sóng âm: Giống nh− PCM và APCM, mã hố dạng sóng âm thực

hiện mã hố dạng sóng tín hiệu ở mức chính xác nhất có thể, khơng phụ thuộc vào tính chất tự nhiên của tín hiệu nên khi tốc độ bit đủ lớn thì chất l−ợng là tốt nhất (16kbit/s), tuy nhiên khi tốc độ bít giảm thì chất l−ợng sẽ giảm đi rất nhanh chóng.

M∙ hố giọng nói: Ph−ơng pháp này dựa vào một mơ hình tạo tiếng nói và phân

tích, mã hố các tham số của mơ hình này. Mặc dù ph−ơng pháp này cho phép tốc độ bit thấp (2kbit/s), nh−ng rất khó để cải thiện chất l−ợng tiếng nói ngay cả khi tốc độ bít đ−ợc nâng cao vì chất l−ợng tiếng nói phụ thuộc rất lớn vào mơ hình tạo tiếng nói.

M∙ hố kết hợp: Là ph−ơng pháp kết hợp hai ph−ơng pháp trên. Phân tích các

tham số của bộ tạo tiếng nói và mã hố dạng sóng đối với phần thơng tin cịn lại. CELP là ph−ơng pháp mã hoá tiêu biểu cho ph−ơng pháp này và đ−ợc dùng rộng rãi trong thông tin di động.

Hình 4.6 mơ tả một bộ tạo tiếng nói trong ph−ơng pháp mã hố CELP. Bộ mã hố và giải mã CELP có cùng cấu trúc bên trong. Bộ giải mã gồm có: bộ lọc tổng hợp dự đốn tuyến tính và hai bộ tham chiếu (bảng mã) tạo tín hiệu điều khiển bộ lọc. Bộ lọc đóng vai trị nh− khoang miệng tái tạo lại phổ của tín hiệu tiếng nói, tín hiệu điều khiển đóng vai trị nh− âm thanh của thanh quản. CELP tái tạo lại hệ thống phát âm của con ng−ời.

Phần tiếp theo mô tả các kỹ thuật cơ bản đ−ợc dùng trong CELP.

Phân tích dự đốn tuyến tính.

Dựa vào tính t−ơng quan tạm thời của tín hiệu thoại và dự đốn tín hiệu dựa vào các tín hiệu tr−ớc đó. Sự khác nhau giữa tín hiệu dự đốn đ−ợc và tín hiệu gốc gọi là phần d− dự đốn.

Mã hố CELP tính tốn độ t−ơng quan của các tín hiệu thoại và hệ số dự đốn tuyến tính αi. Bậc của hệ số dự đốn trong băng tần thoại thơng th−ờng chỉ là 10. Vì vậy khó xác định sự ổn định của bộ lọc, các hệ số của bộ lọc đ−ợc chuyển đổi thành các hệ số t−ơng đ−ơng và hệ số ổn định, ví dụ nh− các hệ số phản hồi, sau đó đ−ợc l−ợng tử hố để truyền đi. Bộ giải mã tạo thành một bộ lọc tổng hợp với hệ số truyền dẫn αi điều khiển bộ lọc và phần d− dự đốn tái tạo tín hiệu thoại. Đặc tính tần số của bộ lọc t−ơng đ−ơng với đ−ờng bao phổ tín hiệu thoại.

Bộ lọc tải theo độ nhạy (Perceptual Weighing Filter)

CELP mã hố tín hiệu bằng cách tìm các mẫu và độ lớn trong mỗi bảng mã (codebook) sao cho lỗi giữa tín hiệu thoại tổng hợp và tín hiệu thoại đầu vào là nhỏ nhất, kỹ thuật này đ−ợc gọi là phân tích bằng tổng hợp (A-b-S) là một trong những đặc tính của CELP.

Hình 4.6 Cách tạo giọng nói trong ph−ơng pháp mã hố CELP

Phổ giọng nói

Tần số Dạng sóng của giọng nói Thanh âm (dây thanh quản) (vịm miệng)Phụ âm

Nguồn âm (giọng nói) Nguồn phụ âm Bộ lọc tổng hợp Thơng tin kích thích Phổ tin tức Cơng su ất

Hình 4.7 Ph−ơng pháp phân tích dự đốn tuyến tính

Bảng m∙ t−ơng thích

Bảng mã t−ơng thích l−u trữ các tín hiệu kích thích tr−ớc đó trong bộ nhớ và thay đổi chúng một cách linh động. Nếu tín hiệu kích thích là tuần hồn, giống nh− tiếng nói, tín hiệu kích thích có thể đ−ợc biểu diễn hiệu một cách hiệu quả khi sử dụng bảng mã vì tín hiệu này lặp lại tại đỉnh chu kỳ t−ơng ứng với đỉnh của giọng nói.

4.2.2.2 Các cơng nghệ ngoại vi dùng trong thông tin di động

Trong thông tin di động, các công nghệ ngoại vi đ−ợc áp dụng để đáp ứng đ−ợc với các điều kiện đặc biệt nh−: sử dụng các đ−ờng truyền vô tuyến, sử dụng dịch vụ các dịch vụ ngoài trời hoặc trong khi di chuyển.

Công nghệ sửa lỗi

Mã sửa lỗi dùng để sửa các lỗi do q trình truyền dẫn tạo ra trên các kênh vơ tuyến. Ph−ơng pháp sửa lỗi đ−ờng truyền lựa chọn bít (BS-FEC) hay ph−ơng pháp chống lỗi không đồng đều ( UEP) sửa lỗi khá hiệu quả vì chúng sử dụng các mã sửa lỗi với các khả năng khác nhau phụ thuộc vào độ nhạy với lỗi của bit thơng tin mã hố thoại.

Công nghệ ẩn lỗi

Nếu một lỗi không thể sửa đ−ợc bằng các ph−ơng pháp trên, hoặc thông tin bị mất thì khơng thể giải mã chính xác đối với tín hiệu thu. Trong tr−ờng hợp này thì phần bị lỗi của tín hiệu thoại đ−ợc tái tạo bằng phép nội suy giá trị dựa vào các thông tin thoại đã biết, để giảm thiểu sự suy giảm chất luợng thoại. Đây là công nghệ ẩn lỗi. Các

Các thơng số dự đốn Giá trị dự đoán Bộ lọc tổng hợp Bộ lọc đảo Phần d− dự đoán Thời gian Hàm truyền Bộ lọc dự đốn tuyến tính

giá trị đ−ợc nội suy bao gồm: hệ số dự đốn tuyến tính, chu kỳ âm độ và hệ số khuếch đại. Các giá trị này có mức độ t−ơng quan về thời gian rất cao.

Truyền dẫn gián đoạn

Truyền dẫn gián đoạn (DTX) khơng gửi hoặc gửi rất ít thơng tin trong khoảng thời gian khơng có tín hiệu thoại. Điều này rất hiệu quả để tiết kiệm pin của các máy di động và giảm nhiễu. Bộ tách tín hiệu thoại tích cực (VAD) sử dụng các thơng số thoại để xác định lúc nào có tín hiệu thoại, lúc nào khơng. Trong khoảng lặng thì nhiễu nền đ−ợc tạo ra (dựa trên thông tin cơ bản về nhiễu nền) gồm một l−ợng thông tin nhỏ hơn thông tin thoại nhằm làm giảm độ "mất tự nhiên" của tín hiệu gây ra bởi DTX.

Triệt tạp âm

Nh− đã đề cập ở phần 4.2.2.1, do thuật toán CELP sử dụng mơ hình phát âm giọng nói của con ng−ời nên nó địi hỏi q trình triệt tạp âm (khơng phải giọng nói của con ng−ời) để cải thiện chất l−ợng thoại.

4.2.2.3 M∙ hóa thoại đa tốc độ thích ứng (AMR) trong IMT-2000 Tiêu chuẩn hóa

Với sự thành lập của ủy ban nghiên cứu IMT-2000 trong Hiệp hội công nghiệp và th−ơng mại vô tuyến (ARIB) năm 1997, Nhật Bản trở thành một trong những n−ớc đầu tiên trên thế giới bắt đầu tiêu chuẩn hóa bộ CODEC cho hệ thống thơng tin di động thế hệ thứ 3. Nhóm đặc trách cho vấn đề này, d−ới sự chỉ đạo của Uỷ ban nghiên cứu IMT- 2000, đ−ợc giao nhiệm vụ lựa chọn CODEC cho IMT-2000. Do có vài ph−ơng pháp mã hóa thoại đ−ợc các cơng ty thành viên của nhóm đề xuất nên ng−ời ta đã phác thảo ra quy trình đánh giá và đánh giá sơ bộ. Trong quá trình thử nghiệm, dự án hợp tác 3G (3GPP) đ−ợc hình thành vào cuối năm 1998 với sự tham gia của ARIB, Uỷ ban công nghệ thông tin (TTC), Hiệp hội ngành viễn thông (TIA) và Viện tiêu chuẩn viễn thông Châu Âu (ETSI) v.v... Cuối cùng, 3GPP đã thống nhất lựa chọn thuật toán mã hoá thoại AMR là một thuật toán mã hoá thoại bắt buộc theo chuẩn của 3GPP.

Tổng quan về thuật toán

AMR là một ph−ơng thức mã hóa thoại đa tốc độ dựa trên cơ sở ACELP. Ph−ơng

10,2 kbit/s, 7,95 kbit/s, 7,4 kbit/s, 6,7 kbit/s, 5,9 kbit/s, 5,15 kbit/s và 4,75 kbit/s). Trong đó 12,2kbit/s, 7,4kbit/s và 6,7kbit/s có cùng thuật tốn với các kỹ thuật mã hóa thoại đã đ−ợc tiêu chuẩn hóa giống các tiêu chuẩn khu vực khác.

Về cơ bản thuật tốn này giống với G.729 và có một số phát minh mới về đa tốc độ. Chiều dài khung đ−ợc cố định ở 20ms ở mọi chế độ. Khả năng đa tốc độ đạt đ−ợc bằng cách thay đổi số l−ợng khung phụ và số bit l−ợng tử. Các hệ số dự báo tuyến tính đ−ợc phân tích 2 lần trên mỗi khung ở tốc độ 12,2kbit/s. ở chế độ khác, việc phân tích đ−ợc thực hiện một lần trên mỗi khung và l−ợng tử hóa vectơ đ−ợc thực hiện trên mỗi số đ−ợc chia sau khi thực hiện dự báo ở vùng LSD.

Chất l−ợng

Hình 4.8 mơ tả một phần đánh giá về AMR, do DoCoMo thực hiện dựa trên qui trình đo kiểm của ARIB và đệ trình lên 3GPP. Quá trình đo kiểm đ−ợc thực hiện trong điều kiện BER của W-CDMA đặt ở 0,1%. Kết quả cho thấy 12,2 kbit/s là tốt hơn bất kỳ tốc độ mã hóa nào và nó cho thấy −u điểm hơn hẳn so với các ph−ơng pháp mã hóa khác có tốc độ bít t−ơng đ−ơng.

Ngồi ra, chất l−ợng của AMR đã đ−ợc báo cáo ở tiêu chuẩn TR 26.975 của 3GPP.

Hình 4.8 Kết quả đánh giá chất l−ợng của AMR

Sử dụng cho các ứng dụng Thoại-Phi thoại

AMR đ−ợc chọn làm thuật tốn mã hóa thoại bắt buộc cho 3G-324 M, nghĩa là cho các dịch vụ thoại đa ph−ơng tiện chuyển mạch kênh của 3GPP, do AMR có cấu trúc linh hoạt và chất l−ợng tuyệt hảo. Tổ chức đặc nhiệm kỹ thuật Internet (IETF)

Giá trị trung bình Bộ mã hố thoại tốc độ biến thiên nâng cao

cũng quy định ra một định dạng tải giao thức thời gian thực (RTP) để áp dụng AMR vào VoIP. Do đó, ngồi các dịch vụ thoại IMT-2000, AMR cũng đ−ợc sử dụng rất rộng rãi.

Xu h−ớng t−ơng lai

Tháng3/2001, 3GPP cấp phép cho AMR băng rộng (AMR-WB) là một phiên bản băng rộng hơn (lên tới 7kHz) của AMR. Phiên bản này đã t−ơng thích với ph−ơng pháp mã hóa thoại băng rộng của ITU-T. ITU-T cũng đang nghiên cứu tiêu chuẩn mã hóa thoại 4kbit/s có chất l−ợng t−ơng đ−ơng với các đ−ờng điện thoại chuyển mạch công cộng.

Mặt khác, khả năng ứng dụng VoIP hoặc mã hóa thoại vào các dịch vụ cũng đ−ợc tích cực thảo luận, để cung cấp các dịch vụ thoại chất l−ợng t−ơng đ−ơng với các mạng chuyển mạch kênh trên nền mạng IP, căn cứ vào thực trạng các mạng thông tin đ−ợc định h−ớng theo IP. Ng−ời ta đang tiến hành tiêu chuẩn hóa mạng VoIP theo các tổ chức nh−: Mạng phối hợp IP và viễn thông của ETSI, thoại IP của IETF (IPTEL) và truyền tải âm thanh/hình ảnh (AVT). Trong lúc đó, 3 GPP tiếp tục tiêu chuẩn hóa cùng với những tổ chức này để phát triển IP qua các mạng di động.

Một phần của tài liệu hệ thống thông tin di động w-cdma - ks. nguyễn văn thuận (Trang 133 - 138)

Tải bản đầy đủ (PDF)

(183 trang)