1. Trang chủ
  2. » Luận Văn - Báo Cáo

Các phương pháp mã hóa thoại trong các bộ vocoder

89 148 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Hà Nội – Năm 2010 Mẫu 1b MẪU TRANG PHỤ BÌA LUẬN VĂN BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI DỖN THANH BÌNH CÁC PHƯƠNG PHÁP MÃ HÓA THOẠI TRONG CÁC BỘ VOCODER Chuyên ngành : KỸ THUẬT ĐIỆN TỬ LUẬN VĂN THẠC SĨ KHOA HỌC KỸ THUẬT ĐIỆN TỬ NGƯỜI HƯỚNG DẪN KHOA HỌC : TS NGUYỄN HỮU TRUNG Lời Cam Đoan Tôi xin cam đoan luận văn thân thực dựa kiến thức học dựa kinh nghiệm thực tiễn trình làm việc, hướng dẫn TS.Nguyễn Hữu Trung Tơi xin chịu hồn tồn trách nhiệm nội dung luận văn Hà Nội, ngày 25 tháng 10 năm 2010 Học Viên Dỗn Thanh Bình i Mục Lục Trang Trang phụ bìa Mục lục Lời cam đoan i Danh mục ký hiệu, chữ viết tắt ii Danh mục bảng iii Danh mục hình vẽ, đồ thị iv Mở Đầu vi Chương – CÁC ĐẶC TRƯNG CƠ BẢN CỦA TÍN HIỆU THOẠI 1.1 Đặc trưng âm tương tự 1.2 Q trình tạo tiếng nói 1.2.1 Mơ hình hóa q trình tạo tiếng nói 1.2.2 Tính chất q trình tạo tiếng nói Chương – TỔNG QUAN VỀ QUÁ TRÌNH XỬ LÝ TÍN HIỆU THOẠI 2.1 Hệ thống số xử lý âm 5 2.1.1 Mơ hình hóa tín hiệu âm 2.1.2 Kiến trúc hệ thống số xử lý âm 2.1.3 Mơ hình xử lý âm 2.2 Tổng quan bước xử lý tín hiệu thoại 19 2.2.1 Lấy mẫu 19 2.2.2 Lượng tử hóa 20 2.2.3 Mã hóa 20 2.2.4 Nén giọng nói 20 2.3 Các tiêu chí đánh giá 20 2.3.1 Các tiêu chuẩn đánh giá Codec 20 2.3.2 Chỉ tiêu đánh giá thuật tốn mã hóa 21 Chương – CÁC PHƯƠNG PHÁP XỬ LÝ TÍN HIỆU THOẠI 22 3.1 Mã hóa dạng sóng 22 3.1.1 PCM – G711 23 3.1.2 DM 24 3.1.2 DPCM 25 3.1.3 ADPCM – G726 25 3.2 Mã hóa tiếng nói kiểu Vocoder 26 3.3 Mã hóa lai 27 Chương – PHÂN TÍCH DỰ ĐỐN TUYẾN TÍNH 4.1 Dự đốn tuyến tính 28 28 4.1.1 Bài tốn dự đốn tuyến tính 29 4.1.2 Dự đốn tuyến tính xử lý thoại 31 4.2 Mơ hình xử lý tín hiệu thoại 32 4.3 Cấu trúc giải thuật dùng mơ hình LPC 35 4.3.1 Bộ mã hóa Encoder 35 4.3.2 Tính tốn cơng suất 36 4.3.3 Bộ giải mã 37 4.3.4 Giới hạn mơ hình LPC 37 Chương – PHƯƠNG PHÁP MÃ HĨA MELP/MELPe TRONG BỘ VOCODER 38 5.1 Mơ tả tổng quan 38 5.2 Thuật toán Vocoder MELP/MELPe 39 5.2.1 Khối nén tiếng nói 41 5.2.2 Khối giải mã 48 Chương – PHƯƠNG PHÁP MÃ HÓA CELP/ACELP TRONG BỘ VOCODER 54 6.1 Nguyên lý chung nén CELP 54 6.2 Phương pháp nén LD-CELP 56 6.3 Kỹ thuật nén CS-ACELP G729 59 6.3.1 Nguyên lý kỹ thuật nén CS-ACELP 59 6.3.2 Nguyên lý giải nén CS-ACELP 62 6.3.3 G729A 63 6.3.4 G729B 65 6.4 Kỹ thuật nén G723.1 67 6.4.1 Nguyên lý nén G723.1 68 6.4.2 Nguyên lý giải nén G723.1 70 Chương – PHƯƠNG PHÁP MÃ HÓA AMBE/IMBE TRONG BỘ VOCODER 71 7.1 Tổng quan 71 7.2 Kỹ thuật MBE 72 Chương – KẾT QUẢ MÔ PHỎNG MỘT SỐ CHUẨN 73 8.1 LPC Vocoder 73 8.2 G729 Vocoder 74 KẾT LUẬN 77 TÀI LIỆU THAM KHẢO 78 Danh mục bảng Bảng 2.1 Các chuẩn mã hóa âm thoại 18 Bảng 6.2 Sự phân bố bit tham số thuật toán CS-ACELP tốc độ 8Kbit/s 59 (Khung 10ms) Các tham số nén giải nén CS-ACELP 63 Bảng 6.3 Các thông số WMOPS MIPS G 729 G 729A Bảng 6.1 iii 65 Danh mục ký hiệu chữ viết tắt A/D Analog/Digital ACELP Algebraic Code Excited Linear Prediction ADPCM Adaptive Differential Pusle Code Modulation AMBE Advanced Multi- Band Excitation AR Autoregressive CDMA Code Division Multiple Access CELP Code Excited Linear Prediction CS_ACELP Conjugate Structure Algebraic Code Excited Linear Prediction DM Delta Modulation DPCM Differential Pusle Code Modulation DSVD Digital Simultaneous Voice and Data GSM Groupe Speciale Mobile IMBE Improved Multi-Band Excitation LD_CELP Low Delay Code Excited Linear Prediction LP Linear Prediction LPC Linear Prediction Coding LSF Line spectrum frequency MELP Mixed - Excitation Linear Predictive PCM Pusle Code Modulation SID Silence Insertion Descriptor VAD Voice Activity Detector ii Danh mục hình vẽ, đồ thị Hình 1.1 Dạng sóng tín hiệu ghi nhận từ âm người Hình 1.2 Mơ hình học quan phát âm người Hình 1.3 Mơ hình dạng ống quan phát âm người Hình 2.1 Dạng sóng âm ngun thủy Hình 2.2 Dạng sóng tín hiệu Hình 2.3 Ngõ chuyển đổi tín hiệu tương tự sang tín hiệu số Hình 2.4 Thực việc lấy mẫu Hình 2.5 Kết việc lấy mẫu giá trị Hình 2.6 Dạng sóng tái tạo lại Hình 2.7 Mơ hình hệ thống xử lý tín hiệu tương tự phương pháp số Hình 2.8 Phân tích thành phần hình Sin Stochastic 12 Hình 2.9 Cơ cấu tổ chức cho việc biểu diễn việc truyền tín hiệu âm nhạc 12 Hình 2.10 Phân tích tín hiệu âm theo mơ hình Sin + Nhiễu + Nốt đệm 13 Hình 2.11 Tổng hợp LPC 14 Hình 2.12 Sơ đồ khối phân rã trình thay đổi tần số lấy mẫu 15 Hình 2.13 Ví dụ thay đổi tần số lấy mẫu với L/M = 3/2 16 Hình 3.1 Mơ hình tổng hợp tiếng nói theo phương pháp LPC 23 Hình 4.1 Hệ thống nhận dạng dạng dự đốn tuyến tính 29 Hình 4.2 Bộ lọc lỗi dự đốn 30 Hình 4.3 Mơ hình LPC tổng hợp tiếng nói 33 Hình 4.4 Hình vẽ khung phi thoại 33 Hình 4.5 Sơ đồ khung âm phi thoại 34 Hình 4.6 Sơ đồ khung tín hiệu âm thoại 34 Hình 4.7 Sơ đồ khung âm thoại 35 Hình 4.8 Sơ đồ khối mã hóa LPC 36 Hình 5.1 Sơ đồ khối giải mã MELP 39 iv Hình 6.1 Sơ đồ nguyên lý phương pháp tổng hợp CELP 54 Hình 6.2 Sơ đồ khối nén giải nén LD_CELP 58 Hình 6.3 Sơ đồ khối nén CS_ACELP 60 Hình 6.4 Sơ đồ khối giản nén CS_ACELP 62 Hình 8.1 Mơ LPC Vocoder 73 Hình 8.2 Tín hiệu ngun thủy 75 Hình 8.3 Tín hiệu tái tạo 76 v Mở đầu Tiếng nói phương tiện chủ yếu mà người sử dụng để liên lạc giao tiếp ngày Ngày phương tiện truyền thông phát triển số người sử dụng phương tiện liên lạc tăng lên mã hố tiếng nói nghiên cứu ứng dụng rộng rãi gọi điện thoại truyền thống, gọi qua mạng di dộng, qua mạng Internet, qua vệ tinh, v.v Với xuất cáp quang băng thông dành cho dịch vụ truyền thông cải thiện cách đáng kể Tuy nhiên, băng thông gọi đường dài, gọi quốc tế, gọi qua vệ tinh hay gọi di động cần phải trì mức định Ngoài ra, việc sử dụng nhiều ứng dụng dịch vụ đường truyền dẫn đến nhu cầu cấp thiết cần phải tối ưu hóa dịch vụ Chính việc mã hố tiếng nói vơ cần thiết, giúp giảm thiểu số lượng tín hiệu cần truyền đường truyền đảm bảo chất lượng gọi Trong số cơng nghệ mã hóa thoại cơng nghệ Vocoder cơng nghệ ưu việt giúp nén tín hiệu thoại số xuống tốc độ thấp mà chất lượng thoại đảm bảo mức cao Xuất phát từ vấn đề nên định chọn đề tài : "Nghiên cứu phương pháp mã hóa thoại Vocoder" với mục đích tìm hiểu q trình xử lý số tín hiệu thoại nói chung đặc biệt số chuẩn nén công nghệ Vocoder Trong trình làm luận văn tốt nghiệp, tơi cố gắng nhiều trình độ khả nghiên cứu nhiều hạn chế nên khơng thể tránh khỏi sai sót Tơi mong nhận phê bình, hướng dẫn giúp đỡ thầy cơ, bạn bè vi thích ứng giống G729 Các thay đổi thuật toán so với G729 tổng kết sau : - Bộ lọc trọng số thụ cảm sử dụng tham số lọc LP lượng tử biểu diễn W( z ) = A( z ) / A( A( z / γ )) với giá trị γ =0.75 - Phân tích độ lên giọng mạch vịng hở đơn giản hóa cách sử dụng phương pháp decimation (có nghĩa trích lấy 10 mẫu) tính tương quan tiếng nói trọng số - Các tính tốn phản ứng xung lọc đơn giản hóa Việc tìm cực đại hóa giá trị tương quan kích thích trước tín hiệu ban đầu lọc trước (năng lượng kích thích trước lọc khơng đáng kể) - Việc tìm bảng mã thích ứng đơn giản hóa Việc tìm cực đại hóa giá trị tương quan kích thích trước tín hiệu ban đầu lọc trước (năng lượng kích thích trước lọc khơng đáng kể) - Việc tìm bảng mã cố định đơn giản hóa Thay tập trung mạch vịng tổ ong, giải pháp tìm sơ đồ hình độ sâu trước sử dụng - Tại giải mã, đơn giản lọc cách sử dụng độ trễ nguyên Cả hai mã hóa G729 G729A thử nghiệm vi mạch T1TMS320C50 DSP Trong thử nghiệm USH, thuật tốn mã hóa song công G729A yêu cầu 12,4 MIPS G729 yêu cầu 22,3 MIPS Việc giảm độ phức hợp hai mã hóa G729 G729A đưa bảng 6.3 cho hai phần mã hóa giải mã Độ phức tạp thể qua số hạng: C50 MIPS WOPS thuật toán sở Về yêu cầu G.729A yêu cầu 2k RAM 10k ROM G.729 yêu cầu khoảng 2k RAM 11k ROM Hiển nhiên với việc sử dụng G.729 giảm khoảng 50% độ phức tạp so với G.729, với việc giảm chất lượng trường hợp đơi (mã hóa/giải mã) trường hợp có tạp âm Các thơng số so sánh G 729 G 729A cung cấp bảng 6.3 64 Bảng 6.3 : Các thông số WMOPS MIPS G 729 G 729A WPOPS Chức C50MIPS G.729 G.729A G.729 G.729A Tiền xử lý 0.20 0.20 0.226 0.226 Phân tích LP 1.63 1.28 1.957 1.696 Lượng tử hóa nội suy LSP 0.95 0.95 1.390 1.390 Biến đổi LSP thành A(z) trọng số 0.30 0.12 0.461 0.173 Lên giọng mạch vòng hở 1.45 0.82 1.563 0.955 Lên giọng mạch vịng đóng 5.83 1.55 3.453 1.778 Bảng mã đại số 6.35 1.86 8.406 3.046 Lượng tử hóa khuyếch đại 0.46 0.46 0.643 0.643 Tìm kích thích cập nhật nhớ 0.21 0.08 0.278 0.112 Tổng Cộng (mã hóa) 14.38 7.32 18.377 10.019 Giải mã 0.68 0.68 1.133 1.133 Bộ lọc sau 2.13 0.73 2.539 1.000 Xử lý sau 0.22 0.22 0.266 0.226 Tổng Cộng (giải mã) 3.03 1.63 3.938 2.399 Tổng Cộng (giải mã + mã hóa) 17.41 8.95 22.315 12.418 6.3.4 G729B G.729B đưa nguyên lý nén im lặng tốc độ bit thấp thiết kế tối ưu hóa để làm việc chung với G.729 G.729A phức tạp thấp Để đạt việc nén im lặng tốc độ bit thấp chất lượng tốt, module dò hoạt động thoại khung yếu tố cần thiết để dị khung thoại khơng tích cực, gọi kkhung tạp âm khung im lặng Đối với loại khung thoại không tích 65 cực dị này, module truyền gián đoạn đo thay đổi theo thời gian đặc tính tín hiệu thoại khơng tích cực định xem có khung mơ tả thơng tin im lặng khơng gửi để trì chất lượng tái tạo tạp âm đầu thu Nếu có khung yêu cầu, tham số lượng phổ mô tả đặc tính cảm nhận tạp âm mã hóa truyền cách hiệu dùng 15b/khung Tại đầu cuối thu, module tạo tạp âm phù hợp tạo tạp âm đầu sử dụng tham số cập nhật phát tham số có trước Tạp âm tổng hợp đạt cách lọc dự báo tuyến tính tín hiệu kích thích giả trắng tạo nội mức điều khiển Phương pháp mã hóa tạp âm tiết kiệm tốc độ bit cho tiếng nói mã hóa tốc độ bit trung bình thấp 4kbps đàm thoại tiếng nói bình thường để trì chất lượng đàm thoại Đối với ứng dụng DSVD (Digital Simultaneous Voice and Data :Thoại số liệu đồng thời số hóa) độ nhạy tốc độ bit khác, G.729B điều kiện tối cần thiết để giảm tốc độ bit cách sử dụng cơng nghệ nén im lặng Khi khơng có tiếng nói , tốc độ bit giảm , giải phóng dung lượng kênh cho ứng dụng xảy đồng thời, ví dụ đường truyền tiếng khác điện thoại tế bào đa truy nhập phân kênh theo mã/theo thời gian (TDMA/CDMA) truyền số liệu đồng thời Một phần đáng kể đàm thoại thông thường im lặng, trung bình lên tới 60% đàm thoại chiều Trong suốt trình im lặng, thiết bị đầu vào tiếng, ví dụ tai nghe, thu thông tin từ môi trường ồn Mức đặc tính ồn thay đổi đáng kể, từ phòng im lặng tới đường phố ồn từ ô tô chuyển động nhanh Tuy nhiên, hầu hết nguồn tạp âm thường mang thông tin thơng tin tiếng Vì vậy, chu kỳ khơng tích cực tỷ số nén cao Nhiều ứng dụng điển hình, ví dụ hệ thống tồn cầu điện thoại di động GSM, sử dụng việc dị tìm chu kỳ im lặng chèn tạp âm phù hợp để tạo hiệu mã hóa cao Xuất phát từ quan niệm dị tìm yên lặng chèn tạp âm phù hợp dẫn đến cơng nghệ mã hóa tiếng mẫu kép Các mẫu khác tín hiệu đầu vào, 66 hiển thị là: thoại tích cực tiếng nói thoại khơng tích cực im lặng tạp âm nền, xác định phân loại tín hiệu.Sự phân loại thực bên bên ngồi mã hóa tiếng nói Bộ mã hóa tiếng tồn tốc có tác dụng q trình tiếng thoại khơng tích cực ,sử dụng bít hơn,tỷ số nén trung bình cao hơn.Sự phân loại gọi chung dò hoạt động thoại (VAD: Voice Activity Detector) đầu gọi mức hoạt động thoại Mức hoạt động thoại có mặt hoạt động thoại khơng có hoạt động thoại Thuật tốn VAD mã hóa tiếng nói khơng tích cực, giống với mã hóa G.729 G.729A, thực khung tiếng nói số hóa Để phù hợp kích thước khung giống dùng cho sơ đồ khơng có độ trễ thêm vào tạo thuật toán VAD mã hóa thoại khơng tích cực nén cao Đầu vào mã hóa tiếng nói tín hiệu tiếng nói đến số hóa Với khung tiếng nói đầu vào, VAD đưa mức hoạt động thoại, mức dùng chuyển mạch mã hóa thoại tích cực khơng tích cực Khi mã hóa thoại tích cực có tác dụng, luồng bit thoại tích cực gửi tới giải mã tích cực cho khung Tuy nhiên chu kỳ khơng tích cực, mã hóa thoại khơng tích cực chọn để gửi thông tin gọi mô tả việc chèn im lặng (SID: Silence Insertion Descriptor) tới giải mã khơng tích cực khơng gửi Kỹ thuật có tên truyền gián đoạn (DTX: Discontinuous Transmission) Với khung ,đầu giải mã dùng làm tín hiệu khôi phục 6.4 Kỹ thuật nén MP-MLQ &ACELP G723.1 (Multi Pulse – Maximum Likelihood Quantization ACELP) Khuyến nghị G723.1 đưa mã hóa tiêu chuẩn dùng để nén tín hiệu tiếng nói tín hiệu audio khác dịch vụ đa phương tiện tốc độ thấp, giống với phần tiêu chuẩn họ H323 67 Về tốc độ bit : Bộ mã hóa có tốc độ bit 5,3 kbps 6,3 kbps Bộ mã hóa có tốc độ bit cao có chất lượng cao Bộ mã hóa có tốc độ bit thấp đem lại chất lượng tốt cộng thêm tính linh hoạt, cung cấp cho nhà thiết kế hệ thống Bộ mã hóa giải mã bắt buộc phải có hai tốc độ bit Chúng chuyển mạch hai tốc độ bit đường biên giới khung Khi tín hiệu phi thoại lựa chọn tốc độ bit biến thiên truyền khơng liên tục điều khiển khoảng trống Tín hiệu đầu vào mã hóa tối ưu hóa tín hiệu tiếng nói với chất lượng cao tốc độ bit nói với độ hạn chế độ phức tạp Bộ mã hóa dùng để mã hóa tiếng nói tín hiệu audio khác với khung dùng kỹ thuật mã hóa phân tích tổng hợp dự báo tuyến tính Tín hiệu kích thích mã hóa tốc độ bit cao lượng tử hóa cực đại đa xung (MP-MLQ) mã hóa có tốc độ bit thấp ,là dự đốn tuyến tính kích thích mã đại số (ACELP) Kích thích khung 30ms, cộng thêm 7,5 ms look-ahead, tạo trễ xử lý thuật toán tổng cộng 37,5 ms Tồn trễ thêm vào mã hóa tổng :trễ xử lý, trễ truyền dẫn đường truyền thông tin trễ đệm giao thức ghép kênh 6.4.1 Nguyên lý nén G723.1 Tín hiệu PCM 64 kbps đầu vào (theo luật A µ ) mã hóa này, lấy mẫu tần số 8kHz, sau qua chuyển đổi thành tín hiệu PCM đến 16 bit đưa tới đầu vào mã hóa Tín hiệu đầu giải mã chuyển đổi thành tín hiệu PCM (theo luật A µ ) theo tín hiệu đầu vào Các đặc tính đầu vào/đầu khác, giống tín hiệu PCM 64 kbps (theo khuyến nghị ITU-G711) ,sẽ chuyển đổi thành tín hiệu PCM 16 bit đầu vào mã hóa, tín hiệu PCM 16 bit chuyển đổi thành tín hiệu PCM theo quy định tín hiệu vào giải mã trình bày chi tiết sau Bộ mã hóa dựa nguyên lý mã hóa phân tích tổng hợp dự đốn tuyến tính cố gắng cực tiểu hóa sai số có tính trọng số thụ cảm Bộ mã hóa 68 thực theo khung 240 mẫu Điều tương ứng với chu kỳ khung 30 ms tần số lấy mẫu 8kHz Tại khối, tín hiệu đưa qua lọc thông cao để loại bỏ thành phần tín hiệu chiều DC sau chia thành khung Với khung sử dụng tín hiệu đầu vào chưa xử lý để tính tốn lọc mã hóa tuyến tính dự báo tuyến tính bậc 10 (LPC).Bộ lọc LPC khung cuối lượng tử hóa Vector phân chia dự báo (PSVQ) Các hệ số LPC chưa lượng tử dùng để khôi phục lọc trọng số thụ cảm ngắn hạn.Với hai phân khung (120 mẫu ), sử dụng tiếng nói trọng số để tính tốn chu kỳ lên giọng tiếng nói mạch vịng kín LOL Chu kỳ lên giọng tiếng nói tính khoảng từ 18 đến 142 mẫu Sau tín hiệu tiếng nói xử lý theo phân khung 60 mẫu Sử dụng đánh giá chu kỳ lên giọng tiếng nói trước để khôi phục lọc dạng ồn họa ba Phản ứng xung tạo việc đấu nối lọc tổ hợp LPC, lọc có tính trọng số thụ cảm formant lọc dạng tạp âm họa ba Người ta sử dụng phản ứng xung cho phép tính sau Bộ dự đốn chu kỳ lên giọng mạch vịng kín tính tốn cách sử dụng đánh giá chu kỳ lên giọng, LOL ,và phản ứng xung Người ta sử dụng dự đoán lên giọng bậc Chu kỳ lên giọng tính gần giá trị vi sai nhỏ đánh giá lên giọng mạch vòng hở Thành phần thêm vào dự đốn lên giọng sau loại bỏ khỏi vector ban đầu Cả hai giá trị chu kỳ lên giọng giá trị vi sai truyền phía giải mã Cuối cùng, thành phần khơng dự đốn tín hiệu kích thích lấy gần Đối với mã hóa có tốc độ bit cao, người ta sử dụng giá trị kích thích lượng tử hóa gần cực đại đa xung (MP-MLQ) mã hóa có tốc độ bit thấp, người ta sử dụng giá trị kích thích mã đại số (ACELP) 6.4.2 Nguyên lý giải nén G723.1 Bộ giải mã thực nguyên lý khung Đầu tiên số LPC giải mã, sau giải mã khơi phục lọc tổng hợp LPC.Đối với phân khung, hai giá trị kích thích bảng mã cố định giá trị 69 bảng mã thích ứng giải mã đưa tới đầu vào lọc tổ hợp LPC Bộ lọc sâu thích ứng bao gồm formant lọc sâu lên giọng phía sau-phía trước (forward-backward) Tín hiệu kích thích đưa tới đầu vào lọc sâu lên giọng, đầu lọc sâu lên giọng đưa tới đầu vào lọc tổng hợp đầu lọc tổng hợp đưa tới đầu vào lọc sâu formant 6.5 Kỹ thuật nén GSM 06.10 Đầu vào nén GSM 06.10 bao gồm khung 160 mẫu tín hiệu PCM tuyến tính lấy mẫu tần số 8KHz Chu kỳ khung 20ms, khoảng chu kỳ môn người có giọng nói cực thấp khoảng 10 chu kỳ mơn người có giọng nói cao Đây khoảng thời gian ngắn khoảng sóng tiếng nói khơng thay đổi nhiều Độ trễ truyền dẫn thơng tin tính tổng thời gian xử lý kích thước khung thuật tốn Bộ mã hóa thực nén khung tín hiệu đầu vào 160 mẫu (20ms) vào khung 260 bit Như 1s thực nén (tương đương 1625 byte) Do để nén 1Mbyte tín hiệu cần thời gian chưa đầy 10 phút Trung tâm q trình xử lý tín hiệu lọc Đầu lọc phụ thuộc nhiều vào giá trị đầu vào đơn Khi có dãy giá trị đưa qua lọc dãy tín hiệu dùng để kích thích lọc Dạng nén GSM 06.10 dùng để nén tín hiệu tiếng nói bao gồm hai lọc giá trị kích thích ban đầu Bộ lọc ngắn hạn dự báo tuyến tính, đặt tầng trình nén tầng cuối suốt trình giải nén, giả sử tuân theo quy luật âm mũi quan phát Nó kích thích đầu lọc dự báo dài hạn (LTP) 70 CHƯƠNG 7: PHƯƠNG PHÁP MÃ HÓA AMBE/IMBE TRONG BỘ VOCODER 7.1 Tổng quan Thuật toán nén thoại IMBE (Improved Multi-Band Excitation) AMBE (Advanced Multi- Band Excitation) thường sử dụng hệ thống nén thoại tốc độ thấp Công nghệ dựa MBE cung cấp chất lượng thoại tốt hơn, lại địi hỏi MIPS nhớ mã hóa khác Thêm vào đó, mã hóa thoại thiết kế quan tâm hai vấn đề nhiễu lỗi kênh Mã hóa thoại IMBE AMBE lựa chọn cho nhiều chuẩn giao tiếp di động quốc tế, bao gồm chuẩn thông tin vệ tinh, hệ thống thoại khơng thương mại sóng vơ tuyến di động số Chúng sử dụng rộng rãi nhiều ứng dụng khác bảo mật thông tin, lưu trữ thoại hội nghị video (Video Conference) Những hệ thống sử dụng IMBE AMBE cung cấp thực cao mã hóa thoại Ví dụ, năm 1992 mã hóa thoại bốn lần thời gian thực 7.2 kbits/sec đánh giá TIA (Telecommunications Industry Association) mục đích lựa chọn mã hóa thoại cho dự án APCO Mã hóa thoại 7.2 kbits/sec DVSI gồm 4.4 kbits/sec mã hóa thoại 2.8 kbits/sec mã sửa lỗi sai Thêm vào đó, tham gia thêm VSELP, STC CELP Ngồi việc cải thiện chất lượng tín hiệu thoại tốt hơn, mã hóa thoại IMBE cịn biểu ưu điểm khác cách đáng kể đơn giản hóa việc tính tốn Dựa kết kiểm thử ấn tượng này, mã hóa thoại IMBe lựa chọn TIA chuẩn mã thoại cho dự án APCO 25 họ Hiện nay, kỹ thuật trở thành chuẩn nhiều hệ thống thông tin giới 71 7.2 Kỹ thuật MBE Một nhân tố mà góp phần vào thành cơng mã hóa thoại kiểu IMBE AMBE chúng sử dụng kỹ thuật khác so với mã hóa chuẩn Kỹ thuật kết tự nhiên công việc bắt đầu Học viện kỹ thuật Massachusetts đầu năm 1980 Thành công công việc phát triển mơ hình thoại mạnh tốt mơ hình thoại dự đốn tuyến tính sử dụng mơ hình thoại truyền thống Kết cơng việc mơ hình thoại đa băng (MBE) Mơ hình thoại cung cấp framework mã hóa thoại tạo số lượng ưu điểm dự đoán tuyến tính dựa mã hóa thoại CELP, RELP, VSELP, LPC 10 Hầu hết mã hóa thoại CELP tạo xác định đơn liệu đoạn thoại tín hiệu có tuần hồn (voiced) nhiễu (unvoiced) Phần dư chia nhỏ thành phần nhỏ vector sau tìm codebook để tìm code vector mà phù hợp Một cách đáng tiếc, việc tìm kiếm codebook kích thước vừa phải công việc phức tạp.Hơn nữa, codebook cụ thể thiết kế để vận hành tốc độ liệu cố định không dễ dàng chuyển sang tốc độ liệu khác Mã hóa thoại IMBE AMBE khơng có vấn đề chúng khơng dựa dự đốn tuyến tính Thay vào đó, chúng sử dụng mơ hình thoại kích thích đa băng để cung cấp thoại chất lượng cao mà không cần tín hiệu dư Và giữ cho tiếng nói có tính dễ hiểu tự nhiên mức thấp 2.4kbits/sec Thêm vào đó, mã hóa MBE khơng yêu cầu sử dụng codebook Do đó, hệ thống IMBE địi hỏi tính tốn CELP hay VSELP Cuối cùng, mã hóa thoại IMBE AMBE dễ dàng đưa tới tốc độ 2.4kbits/sec 72 CHƯƠNG 8: KẾT QUẢ MÔ PHỎNG MỘT SỐ CHUẨN Sau trình nghiên cứu lý thuyết xử lý tín hiệu thoại chuẩn mã hóa ứng dụng Vocoder, thực số mơ Matlab qua nhằm đánh giá chất lượng tín hiệu thoại thu được, qua đề xuất số phương án cải tiến 8.1 LPC Vocoder LPC vocoder mã hóa dự báo tuyến tính có khả thực tốc độ bits thấp cỡ 2kbps Kết mơ cho thấy tín hiệu thu gần giống tín hiệu gốc rè Ta thay đổi số thơng số Frame Overload, Window … để có chất lượng tín hiệu thoại cải thiện a/ 73 b/ Hình 8.1 Mơ LPC Vocoder a/ Hiển thị đầy đủ b/Hiển thị tín hiệu nguyên thủy tín hiệu tái tạo 8.2 G729 Vocoder Trên môi trường Matlab 7.5 thực mơ G729 Vocoder Q trình thực sau : - Để mã hóa ,chạy G729code.m folder G729code Kết ghi vào file coding.bit - Để giải mã, copy file coding.bit vào folder G729decode Chạy main.m G729decode Kết file tái tạo ghi vào file syn_speech So sánh file tái tạo với file nguyên thủy : nghe nhận biết Tuy nhiên file tái tạo nhiễu tiếng bé file gốc 74 Hình 8.2 Tín hiệu ngun thủy (file s1.wav) 75 Hình 8.3 Tín hiệu tái tạo (file syn_speech.wav) 76 KẾT LUẬN Hiện nay, xử lý tín hiệu thoại có nhiều ứng dụng sống, thông tin liên lạc Đặc biệt việc xử lý số tín hiệu có ứng dụng quan trọng cơng nghệ VoIP, tiết kiệm băng thơng truyền tải tín hiệu xác Phạm vi nghiên cứu lĩnh vực rộng thú vị Thông qua việc nghiên cứu đề tài thời gian làm luận văn vừa qua, tơi học hỏi tìm hiểu nhiều kiến thức bổ ích Qua đó, hiểu rõ phương pháp mã hóa tín hiệu thoại, phương pháp dự đốn tuyến tính chuẩn sử dụng công nghệ Vocoder: AMBE/IMBE, CELP/ACELP, MELP/MELPe…Đồng thời thực mô số mã hóa thoại Tuy nhiên thời gian nghiên cứu có hạn nên tơi chưa đề xuất cải tiến phương pháp mã hóa thoại Vocoder Đây hướng nghiên cứu sau Tôi nghiên cứu thêm để có tác động làm cho tín hiệu thoại thu có chất lượng cao Nghiên cứu thêm cách thay đổi kiểu tín hiệu đầu vào (các kiểu giọng nói) loại nhiễu qua để đánh giá tín hiệu đầu vào có vai trị định với tín hiệu thoại đầu Cuối cùng, xin cám ơn thầy giáo TS Nguyễn Hữu Trung thầy cô giáo khoa Điện Tử -Viễn Thông trường Đại Học Bách Khoa Hà Nội bảo giúp đỡ tơi hồn thành tốt đề tài luận văn Rất mong nhận góp ý thầy để tơi hồn thành tốt vấn đề nghiên cứu 77 TÀI LIỆU THAM KHẢO Atlanta Signal Processors, Inc , MELP Vocoder Algorithm D.W.Griffin (1984), A Speech Spectral Analysis/Synthesis System, pp.5.1.15.1.2 Jason Woodard, Voice and Audio Compression for Wireless Communnications John R.Deller, John H.L Hansen, John G.Proakis, Discrete (1999), Time Processing of Speech Signals Lajos Hanzo, F Clare Somervillie, Jason Woodard (2007), Voice and Audio Compression for Wireless Communication Robert Rudolph, Eddie Yu , IMBE and AMBE Speech Compression Swaminathan, Kumar (1986) Analysis and demonstration of the quantile vocoder PGS.TS Nguyễn Quốc Trung (NXB KHKT, 2004), Xử lý tín hiệu lọc số TS Nguyễn Thanh Bình, Th.s Võ Nguyễn Quốc Bảo (2007), Xử lý âm thanh, hình ảnh 10 http://www.mathworks.com/matlabcentral 11 http://www.gaoresearch.com/products/speechsoftware 12 http://www.edaboard.com 78 ... ưu việt mã hóa thoại Vocoder lý mã hóa thoại ứng dụng rộng rãi 3.1 Mã hóa dạng sóng Nguyên lý mã hóa dạng sóng tìm cách số hóa dạng sóng tiếng nói theo cách thích hợp Tại phía phát, mã hóa nhận... CHƯƠNG : CÁC PHƯƠNG PHÁP XỬ LÝ TÍN HIỆU THOẠI Trong chương 3, nội dung chủ yếu trình bày phương pháp xử lý tín hiệu thoại Về mã hóa tiếng nói có ba loại :mã hóa dạng sóng (Waveform), mã hóa nguồn... Chương – PHƯƠNG PHÁP MÃ HÓA MELP/MELPe TRONG BỘ VOCODER 38 5.1 Mơ tả tổng quan 38 5.2 Thuật tốn Vocoder MELP/MELPe 39 5.2.1 Khối nén tiếng nói 41 5.2.2 Khối giải mã 48 Chương – PHƯƠNG PHÁP MÃ HÓA

Ngày đăng: 28/02/2021, 07:32

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w