1. Trang chủ
  2. » Luận Văn - Báo Cáo

THÔNG TIN DI ĐỘNG voice coding

20 26 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 668,48 KB

Nội dung

Đại Học Quốc Gia Thành Phố Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA ✪ BÀI TẬP LỚN MÔN: THÔNG TIN DI ĐỘNG VOICE CODING Giảng Viên Hướng Dẫn: Th.S Tạ Trí Nghĩa PAGE \* MERGEFORMAT MỤC LỤC Giơi thiêu: І.Mã hố dạng sóng ІІ.Mã hố tham số nguồn (mã hóa Vocoder) ІІІ.Mã hố lai I/ Mã Hóa Dạng Sóng 1.Mã hóa vùng thời gian: 1.1.Phương pháp mã hóa PCM (Khơng vi phân): 1.2.Phương pháp mã hóa DPCM ( Điều xung mã vi sai): 1.3.Phương pháp DM 10 1.4.Điều chế Deta tự thích nghi (ADM): 10 1.5.Phương pháp mã hóa ADPCM (Điều chế xung mã vi sai thích ứng) (ADAPTIVE DIFFERENTIAL PULSE CODE MODULATION): 11 2.Mã hóa vùng tần số (Frequence Domain Coding of speech) 13 2.1.Phương pháp mã hóa SBC-APCM: 13 2.2.Mã biến đổi thích nghi (ATC) 13 II/ Phương Pháp Mã Hóa Tham Số Nguồn (Mã Hóa Vocoder) 14 1.Bộ mã hố nguồn theo kênh: 15 2.Bộ mã nguồn tiếng nói formant 15 3.Bộ mã nguồn tiếng nói phổ tách 15 4.Phương pháp dự đốn tuyến tính LPC 16 III/ Mã Hóa Lai 19 1.Sơ đồ chung mã hố tiếng nói dùng phương pháp mã hoá lai AbS 19 Dự đoán tuyến tính (LP) dựa mơ hình phát âm 19 3.Dự đoán thời gian ngắn (STP)và dự đoán thời gian dài (LTP) 20 4.Bộ lọc nhấn cảm nhận 20 5.Một số loại mã hoá lai dùng liên lạc di động 20 5.1.Mã hoá kích thích xung RPE-LTP: 21 5.2.Mã hoá kích thích mã CELP ACELP: 21 5.3.Mã hoá kích thích tổng vectơ VSELP: 21 PAGE \* MERGEFORMAT Giới thiệu: Mã hố tiếng nói chia thành ba loại mã hố dạng sóng, mã hố nguồn mã hố lai Tốc độ bit chất lượng tiếng nói sau tổng hợp lại mã hoá biểu diễn hình І.Mã hố dạng sóng Người ta chia mã hố dạng sóng làm hai loại + Trong miền thời gian: mã hoá điều biến xung mã (PCM), điều xung mã vi sai(DPCM), phương pháp DM (điều chế delta), điều chế delta tự thích nghi (ADM) điều chế xung mã vi sai thích ứng (ADPCM) + Trong miền tần số: mã hoá dải nhỏ SBC (subband coding) mã hố biến đổi thích nghi ATC (Adaptive Transform Coding) - Tại phía phát: mã hóa nhận tín hiệu tiếng nói tương tự mã hóa thành tín hiệu số trước truyền - Tại phía thu: Làm ngược lại để khơi phục tiếng nói Mã hố dạng sóng có khả khơi phục tín hiệu sóng giống tín hiệu gốc Độ phức tạp, giá thành, độ trễ công suất tiêu thụ thấp Tuy nhiên mã hóa dạng sóng tạo tiếng nói chất lượng cao tốc độ lớn 16kbps,k hơng tạo tiếng nói chất lượng cao tốc độ nhỏ 16kbps ІІ.Mã hoá tham số nguồn (mã hóa Vocoder) Mã hố nguồn sử dụng mơ hình q trình tạo nguồn tín hiệu khai thác thơng số mơ hình để mã hố tín hiệu Những thơng số mơ hình truyền đến giải mã Đối với tiếng nói, mã hoá nguồn gọi vocoder hoạt động dựa mơ hình quan phát âm kích thích với nguồn nhiễu trắng đoạn tiếng nói vơ kích thích dãy xung có chu kì chu kì pitch đoạn tiếng nói hữu Do thông tin gởi đến giải mã thông số kỹ thuật lọc, thông tin định đoạn tiếng nói hữu hay vơ thanh, thay đổi cần thiết tín hiệu kích thích chu kì pitch đoạn tiếng nói hữu Có nhiều kỹ thuật để mã hố nguồn như: mã hoá nguồn theo kênh, mã hoá formant, mã hóa nguồn tiếng nói phổ tách, phương pháp dự đốn tuyến tính LPC, mã hóa nguồn tiếng nói âm PAGE \* MERGEFORMAT kích thích Tuy nhiên, chủ yếu tập trung vào nghiên cứu phát triển mã hoá tham số mã hố dự đốn tuyến tính kích thích hai trạng thái (mã hố LPC), mã hố dự đốn tuyến tính có kích thích kết hợp MELP mã hố dự đốn tuyến tính kích thích tín hiệu sau dự đoán RELP Các mã hoá tham số thường dùng cho điện thoại qua vệ tinh quân đội Mã hóa Vocoder có chất lượng phụ thuộc nhiều vào mơ hình thoại, Vocoder phát âm giả tạo, vocoder nhạy cảm với lỗi Có thể cung cấp thoại số với tốc độ nhỏ 2kbps ІІІ.Mã hố lai Mã hóa lai có nhiều phương pháp phương pháp phổ biến mã hố phân tích cách tổng hợp AbS (Analysis-by-Synthesis) Bộ mã hố sử dụng mơ hình quan phát âm người giống mã hoá nguồn Tuy nhiên, thay sử dụng mơ hình tín hiệu kích thích đơn giản mã hố nguồn tín hiệu kích thích chọn cho cố gắng đạt dạng sóng tiếng nói tái tạo giống với dạng sóng tiếng nói ban đầu tốt Đây đặc tính phân biệt khác mã hoá kiểu AbS Thuật toán tìm dạng sóng kích thích định tới độ phức tạp mã hố Ngồi AbS (Analysis-by-Synthesis) mã hóa lai có số dạng khác RPE-LTP, CELP, ACELP, CS-CELP… Mã hóa lai sử dụng cơng nghệ mã hố dạng sóng mã hố Vocoder, đạt chất lượng thoại tốt tốc độ bít 2-16kbps PAGE \* MERGEFORMAT I/ Mã Hóa Dạng Sóng 1.Mã hóa vùng thời gian: 1.1.Phương pháp mã hóa PCM (Khơng vi phân): a) Cấu hình kiểu truyền tin PCM: Mã hóa trình so giá trị rời rạc nhận q trình lượng tử hóa với xung mã Phần lớn kí hiệu mã so sánh tín hiệu vào với điện áp chuyển để đánh giá xem có tín hiệu khơng Như vậy, phận chuyển đổi D/A giải mã cần thiết cho việc tạo điện áp chuẩn Trong liên lạc cơng cộng PCM, tiếng nói biểu diễn với bits Các từ PCM nhận được, chuyển đổi thành tín hiệu PAM giải mã phía thu, xung tương ứng với kênh chọn lọc từ dãy xung ghép kênh để tạo tín hiệu PAM Rồi, tín hiệu tiếng nói phục hồi lọc thơng thấp Q trình lượng tử hố, nén mã hố tín hiệu PAM gọi q trình mã hố q trình chuyển đổi tín hiệu PCM thành D/A, sau đó, lọc chúng sau giãn để đưa tiếng nói ban đầu gọi q trình giải mã Cấu hình sở hệ thống truyền dẫn PCM việc thay đổi tín hiệu tương tự thành tín hiệu xung mã để truyền Trước tiên tín hiệu đầu vào lẫy mẫu cách tuần tự, sau lượng tử hố thành giá trị rời rạc trục biên độ Các giá trị lượng tử hoá đặc trưng mã nhị phân Các mã nhị phân mã hố thành dạng mã thích hợp tuỳ theo đặc tính đường truyền dẫn Thiết bị đầu cuối mã hố chuyển đổi tín hiệu thơng tin tiếng nói thành tín hiệu số PCM Khi tín hiệu thơng tin tín hiệu tương tự, việc chuyển đổi A/D tiến hành việc chuyển đổi D/D tiến hành trường hợp tín hiệu số Đơi khi, q PAGE \* MERGEFORMAT trình nén mã hố băng tần rộng tiến hành cách triệt dư thừa trình tiến hành chuyển đổi A/D D/D) b) Lấy mẫu: Nguyên tắc điều xung mã trình chuyển đổi tín hiệu liên tục tiếng nói thành tín hiệu số rời rạc sau tái tạo chúng lại thành thông tin ban đầu Để tiến hành việc này, phần tử thông tin rút từ tín hiệu tương tự cách Q trình gọi cơng việc lấy mẫu Q trình lấy mẫu Có hai kiểu lấy mẫu tuỳ theo dạng đỉnh độ rộng xung, lấy mẫu tự nhiên lấy mẫu đỉnh phẳng Lấy mẫu tự nhiên tiến hành cách lý tưởng phổ tần số sau lấy mẫu trùng với phổ tín hiệu ban đầu Tuy nhiên hệ thống thực tế, điều khơng thể có Khi tiến hành lấy mẫu đỉnh phẳng, nén gọi hiệu ứng biên độ lấy mẫu làm xuất méo Ngoài ra, phần tử tín hiệu đầu vào vượt độ rộng dải tần KHz, xuất nén nếp gấp Vì vậy, việc lọc băng rộng tín hiệu đầu vào phải tiến hành trước lấy mẫu c) Lượng tử hoá: PAM với biên độ tương tự chuyển đổi thành tín hiệu số tín hiệu rời rạc sau qua q trình lượng tử hố Khi thị biên độ tiếng nói liên tục với số lượng hạn chế, đặc trưng với dạng sóng xấp xỉ bước Tạp âm lượng tử NQ = Q - S tồn dạng sóng ban đầu (S) dạng sóng lượng tử (Q); bước nhỏ tạp âm lượng tử giảm số lượng bước đầu cần thiết cho lượng tử tồn dải tín hiệu đầu vào trở nên rộng Vì số lượng dãy số mã hố tăng lên PAGE \* MERGEFORMAT Tạp âm lượng tử theo biên độ tín hiệu đầu vào Tạp âm tạo biên độ tín hiệu đầu vào vượt dãy lượng tử gọi tạp âm tải hay tạp âm bão hoà S/NQ sử dụng đơn vị để đánh giá ưu điểm nhược điểm phương pháp PCM Khi số lượng dãy số mã hoá mẫu tăng lên bit, S/NQ mở rộng thêm dB d) Sự nén giãn: Như phương pháp tiến hành mã hố giải mã, mã đường, mã khơng phải mã đường mã đánh giá lựa chọn theo kiểu nguồn thông tin Mã đường trình triệt số lượng tạp âm lượng tử sinh thông tin gửi bất chấp mức đầu vào Nó sử dụng hệ thống giá trị tuyệt đối số lượng tạp âm tới hạn S/NQ Mã mã đường sử dụng rộng dãi hệ thống S/N hệ thống thu quan trọng số lượng tuyệt đối tạp âm tiếng nói Khi bước lượng tử số, S/N thay đổi theo mức tín hiệu Chất lượng gọi trở nên xấu mức tín hiệu thấp Vì tín hiệu mức thấp, bước lượng tử giảm tín hiệu mức cao tăng để nhiều cân S/N với mức tín hiệu đầu vào Những vấn đề tiến hành cách nén biên độ Một cách lý tưởng, tín hiệu mức thấp đường cong nén giãn truyến tính 1.2.Phương pháp mã hóa DPCM ( Điều xung mã vi sai): Đây phương pháp dựa tính chất tương quan tín hiệu tiếng nói, truyền độ lệch mẫu cạnh tín hiệu tiếng nói: PAGE \* MERGEFORMAT Tín hiệu tiếng nói tương tự vào qua lọc thông thấp, hạn chế băng tần tín hiệu vào (thường nửa tần số lấy mẫu), lượng tử mã hóa lượng tử chênh lệch xung lấy mẫu tương tự xn tín hiệu dự đoỏn xn lấy từ đầu dự đoán x`n giá trị dự đoán mẫu có nhờ ngoại suy từ p giá trị mẫu cho trước: hệ số dự đoán, độ chênh lệch xung lấy mẫu đầu vào tín hiệu lấy mẫu là: Đây giá trị dựng để lượng tử hóa truyền đi, phía thu tiến hành hồi phục lại tín hiệu sai số tích phân lại cộng với tín hiệu hồi phục trước đó, nhiên để giảm lỗi cộng lại nhiều lần ta dựng phia thu dự đốn giống với phía phát Nếu giá trị nhỏ chất lượng tiếng nói tốt PAGE \* MERGEFORMAT 1.3.Phương pháp DM Điều chế DM loại điều chế DPCM từ mã có bit nhị phân Tin hiệu thoại sau lọc băng tần ((0,3-3,4)Khz) rời rạc hóa tạo thành tín hiệu PAM xn, so sánh tín hiệu với tín hiệu dự đốn x`n, độ lệch hai giá trị (en) lượng tử thành hai giá trị -∆ +∆ Phía lượng tử hoạ truyền bit nhị phân cho xung lấy mẫu Tại phía thu giá trị ±∆ cộng với giá trị dự đốn tức thời phía giải mó khơi phục lại tiếng nói ban đầu Tốc độ bit điều chế delta tốc độ tần số lấy mẫu, tức 8kbps 1.4.Điều chế Deta tự thích nghi (ADM): Phương pháp gọi phương pháp điều chế delta có độ dốc thay đổi liên tục Phương pháp khắc phục cho điều chế delta khả dải động, phương pháp dựa phương pháp thay đổi động hệ số khuyếch đại tách phức hợp với mức cụng suất trung bình tín hiệu vào PAGE \* MERGEFORMAT 1.5.Phương pháp mã hóa ADPCM (Điều chế xung mã vi sai thích ứng) (ADAPTIVE DIFFERENTIAL PULSE CODE MODULATION): SBC-ADPCM codec mã hóa băng với PCM delta thích nghi Trong sơ đồ này, tiếng nói lối vào chia thành băng số có băng truyền Các tín hiệu băng mã hóa mã vi sai với đánh giá ngược thích nghi để đối lại với SBCAPCM đề nghị, đánh giá thuận thích nghi sử dụng ấn định bít băng đặt cố định, khơng có thơng tin biên truyền đi, nhờ làm cho hệ thống thích nghi với tạp nhiễu không cần mã FEC Tốc độ mã codec 15 kbps PAGE \* MERGEFORMAT PAGE \* MERGEFORMAT 2.Mã hóa vùng tần số (Frequence Domain Coding of speech) 2.1.Phương pháp mã hóa SBC-APCM: SBC-APCM codec mã hóa băng với PCM thích nghi theo khối Codec sử dụng lọc gương cầu phương (QMF: Quadrature Mirror Filter) để phân tách tín hiệu lối vào thành 16 băng rộng 250 Hz, hai băng cao số khơng truyền ấn định bít thích nghi sử dụng băng sở tỷ lệ công suất loạt băng cấu thành nên thông tin biên cần truyền Tốc độ truyền dẫn tổng cộng tín hiệu băng 10 kb/s, thông tin biên kb/s mà chúng bảo vệ độ dư thừa kb/s sửa lỗi hướng (FEC: Foward Error Correction) 2.2.Mã biến đổi thích nghi (ATC) Mã hóa biến đổi thích nghi l kỹ thuật phạm vi tần số khác dựng để mã hóa tiếng nói thành cụng tốc độ bit phạm vi từ 9,6kbit/s đến 20kbit/s Đây kỹ thuật phức tạp bao gồm việc biến đổi khối đoạn lối vào chia cửa sổ dạng sóng tiếng nói Mỗi đoạn biểu diễn tập hợp hệ số biến đổi, hệ số lượng tử hóa phát riêng rẽ thu, hệ số lượng tử hóa biến đổi ngược lại để sinh đoạn lối vào gốc Một dạng biến đổi hay dựng hiệu cho mã hóa tiếng nói biến đổi cosin rời rạc (DCT) Hầu hết sơ đồ mã hóa biến đổi thực tế làm thay đổi việc phân phối bit số khácc cách thích nghi từ khung sang khung khác, số bit tổng cộng không đổi Việc phân phối bit động điều khiển thống kê thay đổi theo thời gian phát thơng tin phụ Điều tạo thành tổng phí khoảng 2kbit/s Khung N mẫu biến đổi hay biến đổi ngược, tích luỹ đệm phát hay tương ứng phía thu II/ Phương Pháp Mã Hóa Tham Số Nguồn (Mã Hóa Vocoder) Bộ mã hố nguồn tiếng nói loại mã hố tín hiệu tiếng nói phân tích phát, phát thơng số suy từ phép phân tích sau tổng hợp phía thu nhờ thơng số Mọi hệ thống mã hoá mã nguồn tiếng nói thực mơ tả q trình phát âm q trình động để tìm thơng số Nhìn chung kỹ thuật thực so với phương pháp dạng sóng phức tạp nhiều thuật tốn u cầu tốc độ, lý thuyết có từ lâu nhiên phức tạp thuật toán thực đáp ứng thời gian thực đòi hỏi tốc độ xử lý mạch điện phải thật nhanh theo tính tốn phương pháp CELP cần khoảng 500 triệu phép tính giây, số vi xử lý thực phép nhân chia cần hai chu kỳ máy, tốc độ vi xử lý phải cần đạt cỡ > 10 Mhz, phải khoảng đầu năm 80 kỷ trước hệ vi xử lý chế tạo theo công nghệ CMOS, NMOS đạt yêu cầu Nhìn chung kỹ thuật đạt hiệu mặt băng tần nhiên chất lượng chúng phụ thuộc nhiều vào người nói, kỹ thuật hoàn thiện (thể việc hãng lớn demos sản phẩm điện thoại di động với độ trung thực âm ngày cao) Các phương pháp mã hoá sau dựa chuẩn ứng dụng thực tế ITU-T, IS-54, IMT-2000 Các loại mã hoá mã nguồn tiếng nói bao gồm mã hố tiên đốn tuyến tính (LPC), mã hố nguồn tiếng nói theo kênh, mã nguồn tiếng nói formant, mã nguồn tiếng nói phổ tách, mã hố nguồn dự đốn tuyến tính kích thích (CELP) Hình vẽ trình bày mơ hình phát tiếng nói, sở tất phương pháp mã hoá nguồn, chế phát âm tạo thành “nguồn” phân tích cách tuyến tính từ lọc phận phát âm, với đặc điểm điều chỉnh tham số cách “thông minh” tương ứng với thay đổi q trình phát âm Tín hiệu tiếng nói giả thiết tạo thành từ hai nguồn âm kêu (thanh - voiced), âm không kêu (unvoiced - vô thanh), âm kêu kết dao động gần tuần hoàn dây quản (như m, n, a, h ), âm khơng kêu âm sinh luồng khí thổi qua mơn (vị trí lỗ thắt) (như âm s, sh, f) Các thông số gắn với mơ hình bao gồm độ cao âm, chu kỳ cao độ (trễ cao độ - picth delay) âm kêu, tần số cực mạch lọc điều chế thông số biên độ tương ứng Tần số cao độ đa số người thường khoảng 300 hz nên việc lấy thông số khó khăn đòi hỏi cảm biến tần số phải thật tốt, cộng thêm thủ thuật tính tốn phải có biến đổi hợp lý Với người trưởng thành tần số cực (còn gọi formant) thường tập trung quanh 500hz, 1500hz, 2500hz, 3500hz (có thể dùng máy phân tích phổ để quan sát minh chứng này) Như cách điều chỉnh hợp lý thơng số tổng hợp tiếng nói tốt 1.Bộ mã hố nguồn theo kênh: Đây mã hố hệ thống phân tích tổng hợp chứng minh cách thực tế Bộ mã hố nguồn tiếng nói theo kênh mã hố tiếng nói theo phạm vi tần số, xác định tình hình khung tín hiệu thời gian từ (10-30)ms thông số lấy lượng dải, định âm kêu/ không kêu, tần số cao độ cho âm kêu tham số mã hoá phát 2.Bộ mã nguồn tiếng nói formant Về nguyên tắc gần giống với mã hố nguồn tiếng nói theo kênh nhiên thơng số điều khiển hơn(nên tốc độ thấp hơn), khơng gửi thơng tin đường bao phổ công suất mà gửi vị trí đỉnh hình bao phổ cơng suất, thơng thường phải có ba đỉnh đại diện cho chu kỳ âm kêu, nhiên phương pháp có khó khăn việc xác định vị trí formant, có dịch chuyển tiếng nói người(dịch chuyển ít) nên chúng không thành công tốc độ demos khoảng 1,2kbps 3.Bộ mã nguồn tiếng nói phổ tách Thực việc phân tách phổ kích thích phổ phận phát âm ghép biến đổi furie ngược phổ độ lớn- loga để tạo nên phổ tách tín hiệu Các hệ số số thấp phổ tách ứng với hình bao phổ phận phát âm với hệ số kích thích tần số cao tạo thành dãy xung thời điểm bội số chu kỳ lấy mẫu Sự lọc tuyến tính áp dụng để tách hệ số phổ tách phận tách âm khỏi hệ số kích thích Tại phía giải mã, hệ số phổ tách phận tách âm biến đổi furie để tạo nên đáp ứng xung phận tách âm Bằng cách nhân chập đáp ứng xung với tín hiệu kích thích tổng hợp (nhiễu ngẫu nhiên hay chuỗi xung tuần hồn), tiếng nói ngun khơi phục lại 4.Phương pháp dự đốn tuyến tính LPC Một phương thức phân tích mạnh kỹ thuật phân tích dự đốn tuyến tính Phương pháp mang lại ưu vượt trội cho việc ước lượng thông số tiếng nói cao độ, formants, phổ,…và mã hố bít thấp để truyền dẫn lưu trữ Điều quan trọng phương pháp khả thực ước lượng thông số cách xác mối liên hệ việc tính tốn tín hiệu tiếng nói Ý tưởng việc phân tích dự đốn tuyến tính mẫu tiếng nói xấp xỉ cách tuyến tính với mẫu trước Bằng việc tối thiểu hóa tổng bình phương khác mẫu thực mẫu dự đoán được, hệ số dự đoán định việc truyền tới thiểu hoá Đây phương pháp chọn phương pháp coi tín hiệu tiếng nói hệ thống thay đổi chậm theo thời gian kích thích xung tựa tuần hồn nhiễu ngẫu nhiên Phương pháp cung cấp phương thức mạnh, đáng tin cậy xác để ước lượng Phương pháp LPC phương pháp mã hoá CELP, ta chọn tham số (khi bắt đầu hội thoại), dùng tham số để tổng hợp tiếng nói, so sánh tín hiệu với tín hiệu gốc cho sai số nhỏ theo quy tắc cực tiểu hoá sai số trung bình bình phương, sau tham số mã hố truyền đi, phía giả mã ta làm ngược lại tức dùng thông số để tổng hợp lại tiếng nói Sau sơ đồ phương pháp mã hoá LPC: Bộ mã hóa loại bao gồm phía truyền : Thực chức phân tích LPC, phát cao độ mã hố khung số Phía thu giải mã thơng số tiến hành tổng hợp dạng sóng từ chúng Căn phân tích LPC số hệ số đoán thứ P: chu kỳ cao độ, thông số âm kêu , không kêu, thông số biên độ Chu kỳ cao độ dùng bít đủ, với chuyển mạch kêu khơng kêu dùng bit với biên độ tổng số bit tổng số bit 6+1+5=12 bit Mặc dù thông số lượng tử trực tiếp từ hệ số tiên đoán, nhiên không chắn đảm bảo sửa định đa thức chuẩn đốn , cần thay đổi nhỏ làm cho có thay đổi lớn vị trí điểm cực.Giải pháp đưa dùng thông số nghiệm đa thức đoán ký hiệu “∝” hệ số phản xạ, lượng tử hoá nghiệm thực kết đa thức ổn định , nghiệm đường tròn đơn vị Người ta chứng minh dùng bit cho lượng tử hoá nghiệm đảm bảo chất lượng tín hiệu hồi phục Dùng mẫu mã hoá vậy, tổng tốc độ bit 72.Fs bit/s , Fs số khung giây mà lưu truyền Các giá trị mơ hình Fs 100,67 33, tương úng có tốc độ bit 7200kbps, 4800kbps, 2400kbps Các nhược điểm LPC: - Giới hạn 1: Trong số trường hợp, khung âm phân loại thành hữu vô - Giới hạn 2: Việc sử dụng hoàn toàn nhiễu ngẫu nhiên hồn tồn chuỗi xung có chu kỳ tạo kích thích khơng phù hợp với thực tế - Giới hạn 3: Thơng tin pha tín hiệu nguyên thủy không xem xét - Giới hạn 4: Phương pháp thực việc tổng hợp khung thoại, chuỗi xung dùng để kích thích lọc tổng hợp với hệ số có từ việc phân tích LP vi phạm tảng mơ hình AR III/ Mã Hóa Lai Hầu hết tiêu chuẩn mã hố tiếng nói liên lạc di động sử dụng phương pháp mã hoá lai AbS 1.Sơ đồ chung mã hố tiếng nói dùng phương pháp mã hoá lai AbS Trong mã hố lai, thơng số hệ thống xác định kỹ thuật dự đốn tuyến tính mã hoá tham số(ở phương pháp mã hoá nguồn) tín hiệu kích thích xác định vòng kín (phân tích cách tổng hợp) Hình mã hố lai điển hình Hệ thống bao gồm lọc dự đoán thời gian ngắn (STP) A(z), bộlọc dự đoán thời gian dài (LTP) AL(z), lọc nhấn cảm nhận W(z), giảm thiểu sai số cung cấp thông tin cần thiết cho tạo tín hiệu kích thích Trong đó, tạo tín hiệu kích thích quan trọng tạo hay chọn tín hiệu kích thích cho sai số bình phương trung bình qua W(z) nhỏnhất Tuỳ theo loại mã hoá mà tạo tín hiệu kích thích khác Mặc dù sơ đồ chung cho mã hố lai số loại khơng sử dụng lọc LTP vị trí STP LTP thay đổi Dự đốn tuyến tính (LP) dựa mơ hình phát âm Dự đốn tuyến tính cơng cụ quan trọng xử lí số tín hiệu Nó cung cấp cho kỹ thuật mạnh để ước lượng thông số đoạn tiếng nói pitch, tần số formant, phổ, với độ xác cao tốc độ tính tốn nhanh Dựa hàm truyền đạt biểu diễn mơ hình quan phát âm bỏ qua yếu tố khác tác động đến q trình phát âm mơi, khoang mũi mơ hình phát âm biểu diễn cách gần hình Ở hình biểu diễn hai trình tổng hợp phân tích tiếng nói Giả sử tín hiệu kích thích u[n] nhiễu trắng tín hiệu e[n] phải nhiễu trắng H(z) hàm truyền đạt toàn cực, khơng có điểm khơng 3.Dự đốn thời gian ngắn (STP)và dự đoán thời gian dài (LTP) Bộ dự đoán thời gian ngắn thực chất lọc tổng hợp tiếng nói Bộ lọc thực việc tổng hợp tiếng nói có tín hiệu kích thích đưa đến ngõ vào Các hệ số lọc xác định phương pháp dự đốn tuyến tính đề cập Các đoạn tiếng nói hữu có dạng sóng tuần hồn tuần hồn khai thác để trợ giúp cho q trình dự đốn tiếng nói Từ điều người ta đưa khái niệm dự đoán thời gian dài hay dự đoán pitch Cũng giống STP, LTP dự đốn tuyến tính STP thực việc dự đoán dựa mẫu kề LTP dựa mẫu từ hay nhiều chu kì pitch trước Đây lí gọi dự đốn thời gian dài 4.Bộ lọc nhấn cảm nhận Ngồi việc khai thác tính chất tiếng nói để mã hố, người ta khai thác cảm nhận âm tai người (tai người không cảm nhận âm bị che âm khác có lượng lớn mức định) mã hố tiếng nói khái niệm lọc nhấn cảm nhận Sự tác động lọc biểu diễn hình Ta thấy phổ nhiễu có hai vùng nằm phía đáp ứng tần số lọc LPC tần số nằm vùng bị nhiễu che Bộ lọc nhấn cảm nhận W(z) nâng biên độ nhiễu vùng tần số formant (vùng đỉnh đáp ứng tần số lọc LPC) nén biên độ nhiễu vùng trũng đáp ứng tần số Phổ nhiễu sau qua W(z) có dạng đường liền nét mảnh (có hình dạng phổ tương tự phổ bộlọc LPC) nhiễu dễd àng bị tần số formant che (năng lượng tần số formant che lượng nhiễu) Tóm lại, W(z) định dạng nhiễu hay sai sốsao cho chúng bị che tần số formant lượng cao 5.Một số loại mã hoá lai dùng liên lạc di động Tuỳ theo cách tạo tín hiệu kích thích mà người ta đưa loại mã hố lai khác mã hoá đa xung MPE, mã hố xung RPE, mã hố kích thích mã CELP, mã hố kích thích vectơ tổng VSELP Trong tiêu chuẩn dùng cho liên lạc di động có ba loại sau thường sửdụng là: RPE-LTP, ACELP VSELP 5.1.Mã hố kích thích xung RPE-LTP: Đây loại mã hố sử dụng tín hiệu kích thích kết hợp xung tín hiệu sau dự đốn từ chu kỳ pitch trước (được xác định dự đoán thời gian dài LTP để tính chu kì pitch độ lợi pitch cho tín hiệu kích thích) 5.2.Mã hố kích thích mã CELP ACELP: Mã hố kích thích mã hay vectơ CELP mã hố tiếng nói tốc độ bit thấp mã hố RPE-LTP tiếng nói tổng hợp có chất lượng cao tương đương với mã hố dạng sóng có tốc độ bit trung bình nhiên độ phức tạp mã hoá CELP cao Trong thuật toán CELP, người ta đưa khái niệm codebook Đây nơi chứa vectơ (hay từ mã) kích thích vectơ có độ dài cố định Các vectơ tạo thành từ dãy nhiễu Gauss Tín hiệu kích thích cho đoạn tiếng nói tìm kiếm codebook Do đó, vectơ kích thích codebook có số phần tử với sốmẫu đoạn tiếng nói Ngồi codebook chứa vectơ tín hiệu kích thích thường gọi stochastic codebook, có codebook khác liên quan đến dự đoán LTP gọi codebook thích nghi (adaptive codebook) Codebook thích nghi chứa giá trị độ trễ T (có giá trị từ 20 đến147) Việc tìm giá trị T độ lợi pitch B cho lọc LTP trình tìm giá trị thích hợp cho tín hiệu kích thích tổng hợp đưa vào bộlọc STP tốt nhất, tức làm cho sai số dự đoán nhỏ Mã hố kích thích mã đại sốACELP (Algebraic CELP) dạng mã hoá CELP Tuy nhiên, vectơ stochastic codebook ởACELP tạo thành từ giá trị nhị phân (chỉ gồm hai giá trị) tam phân (chỉ gồm ba giá trị) 5.3.Mã hố kích thích tổng vectơ VSELP: Thuật tốn VSELP Gerson Jasiuk đề xuất ứng dụng truyền thông di động Thuật tốn sử dụng codebook có cấu trúc tốt để giảm thiểu độ phức tạp tính tốn Tín hiệu kích thích VSELP kết hợp vectơ từ ba codebook gồm codebook thích nghi hai stochastic codebook có cấu trúc tốt ... thích ứng (ADPCM) + Trong miền tần số: mã hoá dải nhỏ SBC (subband coding) mã hố biến đổi thích nghi ATC (Adaptive Transform Coding) - Tại phía phát: mã hóa nhận tín hiệu tiếng nói tương tự mã... vocoder hoạt động dựa mơ hình quan phát âm kích thích với nguồn nhiễu trắng đoạn tiếng nói vơ kích thích dãy xung có chu kì chu kì pitch đoạn tiếng nói hữu Do thông tin gởi đến giải mã thông số kỹ... tục tiếng nói thành tín hiệu số rời rạc sau tái tạo chúng lại thành thông tin ban đầu Để tiến hành việc này, phần tử thông tin rút từ tín hiệu tương tự cách Q trình gọi cơng việc lấy mẫu Q trình

Ngày đăng: 09/04/2019, 17:32

TỪ KHÓA LIÊN QUAN

w