1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Nghiên cứu phương pháp mã hóa tiếng nói,nội suy dạng sóng tốc độ 4kbps

61 192 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

LỜI CẢM ƠN Sau em nghiên cứu đề tài, trình thực đồ án nỗ lực, cố gắng thân em nhận đƣợc giúp đỡ hƣớng dẫn phía từ thầy giáovà bạn bè Em xin gửi lời cảm ơn trân thành đến: Thầy giáo Ts Phạm Văn Phƣớc trực tiếp giúp em định hƣớng đề tài đồ án nhƣ tận tình hƣớng dẫn, giải đáp thắc mắc.Thầy chia sẻ kiến thức chuyên môn sâu kinh nghệm quý báu giúp em hoàn thành đồ án Đồng thời em xin cám ơn đến thầy giáo, cô giáo môn bạntrong lớp ĐTV52-DH1 nhiệt tình chia sẻ, giúp đỡ động viên suốt trình làm đồ án Cho dù em cố gắng, nỗ lực trình thực nhƣng đồ án có nhiều kiến thức Cho nên tránh khỏi thiếu sót câu văn dịch từ tiếng anh không đƣợc rõ nghĩa Em mong nhận đƣợc góp ý, bảo tận tình quý thầy giáo, cô giáo bạn đồng môn Hải Phòng, tháng năm 2016 Sinh viên thực Nguyễn Duy Phƣơng i LỜI CAM ĐOAN Em xin cam đoan đề tài nghiên cứu em thực hiện.Các số liệu kết luận nghiên cứu đƣợc trình bày đồ án chƣa đƣợc công bố nghiên cứu khác Em xin chịu trách nhiệm đồ án Hải Phòng, tháng năm 2016 Sinh viên thực Nguyễn Duy Phƣơng ii MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN ii MỤC LỤC iii DANH MỤC CÁC HÌNH vi MỞ ĐẦU CHƢƠNG I:GIỚI THIỆU 1.1 Khái niệm hóa tiếng nói 1.2 Thành phần hóa tiếng nói 1.2.1 Các thành phần hóa tiếng nói 1.2.2 Khái niệm Khung khung phụ 1.2.3 Yếu tố thực 1.2.4 Lƣợng tử hóa 1.3 Thành phần thuộc tính tiếng nói 1.4 Nhận thức thính giác ngƣời CHƢƠNG II: 10 HÓA TIẾNG NÓI BẰNG DỰ ĐOÁN TUYẾN TÍNH 10 2.1 hóa tiếng nói dự đoán tuyến tính 10 2.2 Xác định hệ số LP 12 2.2.1 Phƣơng pháp tự tƣơng quan 12 2.2.2 Phƣơng pháp đồng phƣơng sai 13 2.3 Nội suy hệ số dự đoán tuyến tính 14 2.4 Sự mở rộng băng thông 15 2.5 Nhấn mạnh tiếng nói 16 CHƢƠNG III 17 QUÁ TRÌNH NỘI SUY DẠNG SÓNG 17 3.1 Nền tảng nguyên tắc hóa nội suy dạng sóng 17 3.2 Tổng quan khối hóa nội suy dạng sóng 18 3.3 Đại diện dạng sóng đặc trƣng 19 3.4 Giai đoạn phân tích 23 iii 3.4.1 Phân tích dự đoán tuyến tính LP 24 3.4.2 Ƣớc lƣợng thành phần độ cao 25 3.4.3 Nội suy thành phần độ cao 27 3.4.4 Trích dẫn dạng sóng đặc trƣng 30 3.4.5 Sắp sếp dạng sóng đặc trƣng 33 3.4.6 CW điện tính toán chuẩn hóa 40 3.4.7 Đầu lớp phân tích 43 3.5 Giai đoạn tổng hợp tiếng nói 43 3.5.1 Khôi phục công xuất hàng dạng sóng đặc trƣng 44 3.5.2 Tạo thành phần độ cao sóng đặc trƣng đồng thời 44 3.5.3 Đánh giá thứ tự pha 48 3.5.4 Phép biến đổi 2-D 1-D 50 3.5.5 Tổng hợp dự đoán tuyến tính 51 3.6 Thực lớp phân tích tổng hợp 51 3.7 Phần tích thành phần dƣ tổng hợp tiếng nói 52 KẾT LUẬN 54 TÀI LIỆU THAM KHẢO 55 iv CÁC CHỮ VIẾT TẮT CW Characteristic Waveform: Dạng sóng đặc trƣng DTFS Discrete-Time Fourier Series: Chuỗi Furier rời rạc thời gian LP Linear Prediction: Dự đoán tuyến tính LPC Linear Predictive Coding: hóa dự đoán tuyến tính LSF Line Spectral Frequency: Tần số vạch phổ LSP Line Spectral Pair: Cặp vạch phổ MOS Mean Opinion: Điểm đánh giá hóa trung bình MSE Mean Square Error: Sai số trung bình bình phƣơng PCM Pulse Code Modulation: Điều chế xung PWI Prototype Waveform Interplation: Nội suy dạng sóng nguyên mẫu REW Rapidly Evolving Waveform: Dạng sóng biến đổi nhanh SEW Slowly Evolving Waveform: Dạng sóng biến đổi chậm SNR Signal-to-Noise Ratio: Tỷ số tín hiệu tạp âm V/UV Voiced/Unvoiced: Âm hƣu thanh/âm vô WI Waveform Interpolation: Nội suy dạng sóng v DANH MỤC CÁC HÌNH STT Hình 1.1 Hình 1.2 Tên hình Sơ đồ khối hệ thống lƣu trữ truyền tiếng nói Biểu diễn thành phần hữu vô theo thời Trang gian tần số Hình 2.1 Các lọc tổng hợp LP 11 Hình 2.2 Các lọc phân tích LP 11 Hình 3.1 Sơ đồ khối hóa tiếng nói nội suy dạng sóng 20 Hình 3.2 Một ví dụ bề mặt dạng sóng đặc trƣng 23 Hình 3.3 Một sơ đồ khối khối phân tích WI (bộ xử lý 100) 24 Hình 3.4 Nội suy thành phần độ cao trƣờng hợp tăng 30 gấp đôi Hình 3.5 Hình biểu diễn đoạn tiếng nói có pitch-tăng gấp đôi tín hiệu 31 dƣ Hình 3.6 Một điểm trích dẫn 33 Hình 3.7 Cửa sổ trích dẫn với n=60 34 Hình 3.8 Sơ đồ khối xử lý xếp dạng sóng 35 Hình 3.9 Chia tỷ lệ thời gian dạng sóng đặc trƣng-CW 39 Hình 3.10 Mô tả việc chèn mẫu phổ 41 Hình 3.11 Sơ đồ khối giải hóa-WI 46 Hình3.12 Sơ đồ khối xử lý nội suy 47 Hình3.13 Nội suy dạng sóng đặc trƣng khoảng khung 49 Hình 3.14 Biến đổi bề mặt dạng sóng đặc trƣng thành tín hiệu dƣ 53 Hình3.15 55 Một lựa chọn hóa WI chuyển 2-D 1-D dạng sóng đặc trƣng miền tiếng nói vi MỞ ĐẦU Con ngƣời giao tiếp ngôn ngữ với để trao đổi thông tin,rồi ngƣời nghĩ nhiều phƣơng pháp khác để phục vụ cho sống hàng ngày Vì thong tin liên lạc ngày phát triển Với xu đó,nghiên cứu nắm bắt kỹ thuật áp dụng thong tin liên lạc ngày quan trọng.Mã hóa tiếng nói kỹ thuật nhƣ hóa tiếng nói tốc độ thấp công nghệ cở hệ thống thông tin tổ ong số phát triển nhanh vài năm qua đƣa công nghệ đến giai đoạn có ứng dụng thực tiễn lớn Để sâu vào vấn đề Đồ án em làm với đề tài là: “Nghiên cứu phương pháp hóa tiếng nói,nộisuy dạng sóng tốc độ 4kbps” Đề tài em giải vấn đề sau: Chƣơng 1: Giới thiệu hóa tiếng nói Chƣơng nêu tảng thông tin hóa tiếng nói nêu thành phần tín hiệu tiếng nói sơ cho hóa.Mục đích phân tích phƣơng pháp nội suy dạng sóng với chất lƣợng tƣơng đƣơng thoại cố định tốc độ 4kpbs Chƣơng 2: hóa tiêng nói dự đoán tuyến tính Chƣơng phân tích tổng quan phân tích hóa dự đoán tuyến tính khoảng ngắn Các khái niệm tần số phổ vạch.mở rộng băng thông nhấn trƣớc Chƣơng 3: Phƣơng pháp nội suy dạng sóng Chƣơng phân tích tảng khái niệm hóa nội suy dạng sóng.Phân tích thuật toán liên quan,lớp phân tích tổng hợp phân tích sở toán học thuật toán Em chân thành cảm ơn thầy giáo T.S Phạm Văn Phƣớc thầy khoa Điện tận tình bảo,hƣớng dãn giúp đỡ em hoàn thành Luận án tốt nghiệp CHƢƠNG I:GIỚI THIỆU 1.1 Khái niệm hóa tiếng nói Trong hệ thống kỹ thuật số đại, tín hiệu tiếng nói đƣợc biểu diễn định dạng kỹ thuật số chuỗi bit nhị phân Nó thƣờng mong muốn cho tín hiệu đƣợc đại diện nhƣ vài bit Đối với việc lƣu trữ, sử dụng bít thông tin tốn nhớ Đối với ứng dụng truyền tải, làm tăng dung lƣợng kênh truyền đơn vị băng thông ,công xuất nhớ Do đó,việc sử dụng thuật toán nén hóa tiếng nói làm tăng hiệu hệ thống lƣu trữ truyền phát.Mã hóa tiếng nói công nghệ ứng dụng cho thuật toán nén Mặc dù băng thông lớn trở nên có sẵn truyền thông nhƣ kết phát triển nhanh chóng phƣơng tiện truyền thông truyền dẫn quang, nhƣng nhu cầu băng thông ngày tăng, đặc biệt lĩnh vực vô tuyến vệtinh Đồng thời, với xu hƣớng phát triển truyền thông đa phƣơng tiện ứng dụng giọng nói liên quan khác nhƣ máy trả lời kỹ thuật số, nhu cầu nhớ bảo tồn hệ thống lƣu trữ giọng nói ngày tang.Mã hóa tiếng nói với tốc độ bít thấp chất lƣợng ngày đặt thách thức tƣơng lai Ngoài ra, xuất vi xử lý DSP nhanh nhiều cung cấp phát biểu nhà nghiên cứu hóa ƣu đãi nhiều cho việc cải tiến hóa ngôn luận thuật toán, thuật toán đƣợc phép có nhiều tính hết trƣớc 1.2 Thành phần hóa tiếng nói 1.2.1 Các thành phần hóa tiếng nói Một khối hóa tiếng nói luôn bao gồm khối hóa khối giải mã.Các hóa chức nén giải có chác khôi phục liệu tồn hệ thống lƣu trữ tiếng nói điển hình Hình 1.1 minh họa ví dụ hệ thống nhƣ Ở giai đoạn nén,bài phát biểu hóa tín hiệu tiếng nói kỹ thuật số ban đầu tạo tỷ lệ bit thấp chuỗi bit sau đƣợc truyền đến ngƣời nhận thiết bị lƣu trữ giai đoạn giải nén, giải lời nói cố gắng để hoàn tác hóa đƣợc thực xây dựng xấp xỉ tín hiệu ban đầu từ chuỗi bít nén liệu Nhƣ vậy, giải phải đƣợc cấu trúc nghịch đảo gần hóa Hình 1.1 Sơ đồ khối hệ thống lưu trữ truyền tiếng nói 1.2.2 Khái niệm Khung khung phụ Tiếng nói tín hiệu thời gian khác Để phân tích tín hiệu tiếng nói cách hiệu khối hóa tiếng nói liên tiếp phân vùng tín hiệu thành khối liên tiếp nhƣ mẫu khối đƣợc coi ổn định Những khối đƣợc gọi khung Hơn nữa, số bƣớc xử lý yêu cầu thời gian giải nhu cầu cao để đƣợc thực khối nhỏ hơn.Nhữngkhối nhỏ thƣờng đƣợc gọi khung phụ 1.2.3 Yếu tố thực Trong việc lựa chọn hóa tiếng nói, khía cạnh hiệu suất định phải đƣợc xem xét thƣơng mại cần phải đƣợc thực hiện.các ứng dụng khác đòi hỏi khối hóa đƣợc tối ƣu hóa cho kích thƣớc khác số cân kích thƣớc Chúng ta chọn tám khía cạnh quan trọng số đƣợc mô tả ngắn gọn nhƣ sau: (i) tốc độ bit trung bình: Thông số thƣờng đƣợc đo bit giây (bps).Từ “trung bình” đƣợc sử dụng số trình hoạt động với tốc độ bit thay đổi,cũng nhƣ với tốc độ xác định Tốc độ bit đƣợc nói tới không bao gồm tốc độ bit đƣa vào sử dụng cho khối sửa lỗi (ii) Chất lượng tiếng nói: Một phƣơng pháp phổ biến để đánh giá chất lƣợng tiếng nói làphép kiểm tra đánh giá chủ quan.Ngƣời ngheđƣợc hỏi để đƣa đánh giá chất lƣợng tiếng nói dựa năm điểm xấu, nghèo, công bằng, tốt tuyệt vời Bởi khác biệt lớn ngƣời nghe với nhau, kiểm tra đòi hỏi số lƣợng lớn tiếng nói liệu, hệ thống loa ngƣời nghe để có đƣợc xếp hạng xác khối hóa Tại Bắc Mỹ, tỷ lệ triệu phép tính giây từ 4.5 thƣờng có nghĩa điện thoại chất lƣợng chất lƣợng tổng hợp giảm xuống dƣới 3,5.Ngoài có phép đo khách quan thông số tín hiệu tạp âm-SNR (iii) Khối nhớ: Nhƣ đề cập trƣớc đó, hầu hết lập trình viên phát biểu có xu hƣớng để xử lý mẫu khối, đó, thời gian trễ thƣờng tồn gốc tiếng nói đƣợc hóa Trong bối cảnh hóa giọng nói, chậm trễ thời gian đƣợc gọi chậm trễ thuật toán thƣờng đƣợc nói tới tổng (i) độ dài khối xử lý tiếng nói (ii) độ dài nhìn phía trƣớc cần thiết để xử lý mẫu khối Trong số ứng dụng nhƣ điện thoại, thƣờng có giới hạn nghiêm ngặt thời gian trễ.Trong hệ thống khác nhƣ hệ thống lƣu trữ giọng nói, chậm trễ đƣợc chấp nhận (iv) Tính phức tạp tính toán: thuật toán hóa tiếng nói thƣờng phảichạy chip đơn xử lý tín hiệu Do sử dụng nhớ tốc độ có hai vấn đề làm cho phức tạp Cách sử dụng thuật toán có độ phức tạp cao không yếu cầu mức độ nhanh chip để lập thời gian thực.Đó lý tiêu thụ công suất lớn thách thức lớn phần cứng hệ thống xách tay (v) Độ nhạy lỗi kênh: Tham số xác định chống lại lỗi kênh, lỗi thƣờng đƣợc gây diện tiếng ồn tín hiệu fading Các kênh lỗi vấn đề trở nên ngày quan trọng hóa tiếng nói nhƣ Kể từ xử lý với lời nói thật mẫu lại, {Ak(n)} {Bk (n)}sẽ luôn đƣợc thực dẫn tới: Ngoài ra, với mục đích đơn giản, bỏ qua số n từ biểu thức xử lý số thời gian đặc biệt Ψ(n) trở thành: Qua việc trao đổi thứ tự đầu tổng đại lƣợng, có đƣợc: Bây giờ, sử dụng (3.3) (3.4) xây dựng: Phƣơng trình 3.23 công thức xử lý 180 dùng cho xác định lƣợng dạng sóng đặc trƣng từ hệ số chuỗi Furie DTFS Nhƣ xử lý 190 thực chuẩn hóa lƣợng, đƣợc đƣa vào công thức nhƣ sau Chia (3.23) cho Ψ ,có thể có đƣợc lƣợng đơn vị bên trái: 41 Việc kết hợp Ψ vào hệ số chuỗi Furie DTFS,(3.24) trở thành : Do đó, thủ chuẩn hóa đơn giản chia hệ số DTFS bậc hai công suất trung bình, 𝛹 Tóm lại, với dạng sóng đặc trƣng đến, khối lƣợng 180 sử dụng (3.23) để tính toán lƣợng Ψ từ hệ số chuỗi Furie DTFS nó.Khối chuẩn hóa 190 sau chia hệ số chuỗi Furie DTFScho thừa số theo (3.25) để có đƣợc có đƣợc lƣợng đơn vị dạng sóng đặc trƣng Nhận xét việc bình thƣờng hóa lƣợng - Phƣơng trình 3.23 lƣợng trung bình dạng sóng đặc trƣnglà tƣơng ứng với tổng nguồn lƣợng tất thành phần hài Điều giải thích lý thêm vào hài biên độ vào phổ dạng sóng đặc trƣng lại bảo toàn lƣợng ban đầu (hình 3.9c, 3.10b 3.10c) Điều giải thích việc giảm lƣợng từ việc cắt hài hình 3.9b - Không có khác biệt xử lý 170đƣợc đặt sau trƣớc khối chuẩn hóa lƣợng 180 Nói cách khác, không quan trọng liên kếtđƣợc thực dạng sóng đặc trƣng chuẩn hóa không chuẩn hóa 42 - Khối chuẩn hóa lƣợng180nên bị vô hiệu lƣợng dạng sóng đặc trƣng (tínhtrong xử lý170) nhỏ đáng kể dấu hiệu biểu thị đoạn tiếng thoại Nếu không, tính toán dễ xảy xuốt thủ tục chuẩn hóa 3.4.7 Đầu lớp phân tích Tóm lại, lớp phân tích phân hủy đoạn tiếng nóithành thông số ,thành phần độ cao,tần số vạch phổ- LSFs, công suất dạng sóng đặc trƣng Hai thông số đƣợc cập nhật lần cho khung , hai thông số sau đƣợc tính toán lần khung phụ (tám lần khung hình).Các dạng sóng đặc trƣng tạo thành dạng sóng biến đổi theo thời gian hai chiều bề mặt Thông thƣờng, bốn thông số đƣợc gửi đến vi xử lý 300 400cho lƣợng tửvà giải lƣợng tử, đƣợc đề cập Tuy nhiên, khối hóa thiết lập để chạy có lớp phân tích tổng hợp, thông số đƣợc gửi trực tiếp để xử lý 200 3.5 Giai đoạn tổng hợp tiếng nói Từ tần số phổ vạch, thành phần độ cao, công suất dạng sóng đặc trƣng chuẩn hóa, tín hiệu tiếng nói có thểxây dựng lại xử lý tổng hợp 200 Lƣu ý khối tổng hợp thu phiên lƣợng tử thông số Một sơ đồ xử lý tổng hợp đƣợc thể hình 3.11.Giống nhƣ khối xử lý bên hóa, tần suất thực thay đổi từ vi xử lý để xử lý lớp tổng hợp Một số vi xử lý hoạt động sở khung, mộ số khác lại đƣợc thực lần khung phụ chí lần cho mẫu Các vi xử lý 240 270 giống hệt để xử lý 150 120 tƣơng ứng, mô tả chức họ không đƣợc lặp lại phần 43 Hình 3.11 Sơ đồ khối giải hóa-WI 3.5.1 Khôi phục công xuất hàng dạng sóng đặc trƣng Công suất sóng đặc trƣng đƣợc trả nguyên khối 210.Sử dụng thông tin thành phần độ cao đƣa tới từ khối nội suy 240 để xác định độ dài dạng sóng đặc trƣng Để khôi phục công suất CW, biến đổi ngƣợc trình làm (3.25) cách nhân hệ số Furie- DTFS 𝛹.Sau dạng sóng đặc trƣng đƣợc phục hồi công suất, chúng đƣợc gửi đến khôi phục hàng 220.Nếu khối hóa thực lƣợng tử thông sốcác dạng sóng đặc trƣng liền không đƣợc xếp sau đƣợc giải 3.5.2 Tạo thành phần độ cao sóng đặc trƣng đồng thời Hiện dựng lại hoàn toàn, phù hợp dạng sóng đặc trƣng thành phần độ cao khung phụ Trong mô hình nội suy dạng sóng, dạng sóng đạc trƣng chiều dài thành phần độ cao điểm mẫu làcần thiết để tái tạo lại tín hiệu lại chiều.Các giá trị tức thời đƣợc tạo vi xử lý 230 44 Nội suy tuyến tính đƣợc sử dụng để dựng lại mẫu dạng sóng đặc trƣng.Khi dựng lại mẫu hai dạng sóng đặc trƣng cócùng kích thƣớc, nội suy đơn giản đƣợc áp dụng Tuy nhiên, hai dạng sóng đặc trƣng không kích thƣớc bội ƣớc số ,phải sử lý thêm để đảm bảo nội suy trơn tru Việc nội suy dẫn đến trình thực khối 150 lớp phân tích.Nội suy tuyến tính nhƣng không áp dụng phƣơng trình thành phần độ cao nhân hay chia theo (3.10) (3.11).Giá trị thành phần độ cao tức thời nội suy tƣơng ứng với độ dài dạng sóng đặc trƣng tức thời Hình 3.12 khối nội suy 230 có khả xử lý sóng đặc trƣng nội suy thành phần độ cao theo tình huống:có kích thƣớc,khác kích thƣớc thành phần độ cao nhân chia Hình 3.12.Sơ đồ khối xử lý nội suy Tình 1: Nội suy với kích thƣớc Đầu tiên, giả định nội suy đƣợc thực hai CWS chiều dài P Nhƣ kết giả định này, vi xử lý 231, 232 Và 234 không đƣợc thực thi Nếu ký n0 n1 khoảnh khắc thời gian ranh giới khoảng nội suy ,dạng sóng đặc trƣng tức thời, S(n; m), Tại sốcó thể tính cách nội suy giữaS(n0; m) vàS(n1; m) Trong miền thời gian, nội suy đƣợc thể nhƣ: 45 Thay (3.5) vào (3.26), ta có đƣợc: Nói cách khác, nội suy tuyến tính hai dạng sóng đặc trƣng miền thời gian tƣơng đƣơng nội suy tuyến tính chuỗi Furie- DTFS Các nội suy thực sở khung phụ, n1- n2 =Lsf= 20 Khi dạng sóng đặc trƣng biên độđộ dài,cácdạng sóng đặc trƣng nội suy chúng có chiều dài tốt Kết là, đƣờng viền thành phần độ cao liên tục Kết xử lý 235 Tình 2: Nội suy với kích thƣớc khác Nói chung,thành phần độ cao thay đổi khoảng thời gian dạng sóng đặc trƣng đƣờng biên có độ dài khác (số lƣợng hệ số khác {Ak ,Bk} ) Để tạo điều kiện phép nội suy trƣờng hợp này, ta chọn tỷ lệ thời gian dạng sóng đặc trƣng ngắn theo độ dài thời gian dạng sóng đặc trƣng dài trƣớc nội suy Nhƣ nêu mục 3.4.5, trình chọn tỷ lệ thời gian tƣơng đƣơng với việc đệm hài “0” để mô tả chuỗi Furie - DTFS Vì thế,bộ vi xử lý 232 đƣợc thiết lập để đệm số vào dạng sóng đặc trƣng ngắn phù hợp với khoảng thời gian dạng sóng đặc trƣng dài Sau đó, xử lý 233 nội suy dạng sóng đăc trƣng với mẫu tƣơng tự nhƣ trƣờng hợp để thu đƣợc dạng sóng đặc trƣng tức thời Bộ vi xử lý 231vẫn chƣa hoạt động 46 Hình 3.13.Nội suy dạng sóng đặc trưng khoảng khung Ở khối xử lý 235, nội suy tuyến tính nhƣ phƣơng trình (3.9) đƣợc sử dụng để dựng lại mẫu thành phần độ cao Tuy nhiên, giá trị thành phần độ cao kết từ trình không phù hợp với độ dài thành phần độ cao dạng sóng đặc trƣng nội suy (sản lƣợng 233), kết đệm thêm khối xử lý 232 Để tránh mâu thuẫn này, ngƣời thiết lập vi xử lý 234 để gắn kết thời gian dạng sóng đặc trƣng để phù hợp vớikhoảng thời gian xác định đƣờng viền thành phần độ cao nội suy Một ví dụ hoạt động đƣợc thể hình 3.13 với hệ số {Ak} nơi nội suy đƣợc thực 47 hai dạng sóng đặc trƣng có độ dài 26 34 Các hoạt động tƣơng tự đƣợc áp dụng cho hệ số {Bk}.Chúng ta nên nhớ lại từ Mục 3.4.5 co thời gian mộtdạng sóng đặc trƣng đạt đƣợc cách cắt xén hệ số chuỗi Furie DTFS nó.Ngoài ra, nhƣ nói mục 3.4.6, cắt bớt hệ số chuỗi Furie- DTFS dẫn đến giảm công suất dạng sóng đặc trƣng.Để trì mức công suất sau nén thời gian, cần chọn tỷ lệ với hệ số chuỗi Furie DTFS hệ số phù hợp Tình 3: Nội suy với thành phần độ cao tăng giảm Nếu dạng sóng đặc trƣng dài ngắn hơndạng sóng đặc trƣng trƣớc đó, xuất nhân chia thành phần độ cao Bộ vi xử lý 231 đƣợc thiết lập phù hợp lần xuất Tƣơng tự nhƣ xử lý 170, xử lý sử dụng số C nhƣ tiêu chí định nhiều thành phần độ cao Nếu thành phần độ cao tăng giảm (C>1) khoảng thời gian khung phụ, vi xử lý lặp lặp lại dạng sóng đặc trƣng ngắn với số nguyên lần nhƣ phù hợp dạng sóng đặc trƣng dài hơn.Thủ tục tƣơng đƣơng với chèn hài biên độ hài gốc biểu diễn chuỗi Furie DTFS.Sau chèn bit vào, dạng sóng đặc trƣng sau đƣợc gửi đến vi xử lý 232 xử lý cách nhƣ tình Kể từ bít chèn vào vi xử lý 231 bị bỏ lại dạng sóng đặc trƣng sẽsau đƣợc gửi đến vi xử lý 260 , vi xử lý 235 nội suy theo chiều dài thành phần độ cao sau bít đƣợc chèn (Hình 3.15) dạng sóng đặc trƣng Bằng cách này, thành phần độ cao tức thời xử lý 250 phản ánh xác độ dài tức dạng sóng đặc trƣng đến xử lý 260 3.5.3 Đánh giá thứ tự pha Trong phần này, có liên quan với vi xử lý 250 mục tiêu để chuyển đổi giá trị thành phần độ cao vào trật tự pha Các đƣờng đƣợc sử dụng vi xử lý 260 để biến đổi bề mặt dạng sóng đặc trƣng hai chiều trở lại vào chiều lại Vì có giá trị thành phần độ cao 48 điểm mẫu, đƣờng pha đƣợc tính cách bƣớc tổng hợp diện tích dƣới đƣờng cong theo dõi tần số F(n) Mối quan hệ F(n) P(n) Có thể đƣợc thể nhƣ: 𝑃 𝑛 = 𝐹 𝑛 (3.28) Nếu ∅(.) đƣờng pha ,đƣờng bao pha thời điểm mẫu cso thể đƣợc cập nhật cở sở mẫu 𝑛 ∅ 𝑛 =∅ 𝑛−1 + 𝑛 −1 2𝜋 𝑑𝑛′ ′ 𝑃(𝑛 ) (3.29) Trong ∅ 𝑛 ∅ 𝑛 − giá trị pha trƣớc đó.tích phân tƣơng ứng với vùng phụ trội khoảng (n-1) n.Giả sử thành phần độ cao biến đổi tuyến tính trân khoảng tích phân,có thể khai triển (3.29) nhƣ sau: Và tiếp tục,phép tích phân dẫn tới Thực (3.31) theo mẫu,khối xử lý 250 biến đổi theo dạng sóng P(.) thành dạng theo pha.Thấy ∅(𝑛) hàm tăng,tích phân (3.30) đƣa kết dƣơng Toán tử ln( ) (3.31) tính toán phức tạp ,thực lần mẫu Để đơn giản với tích phân (3.29),tích phân 𝑛 2𝜋 𝑑𝑛′ 𝑛−1 𝑃(𝑛 ′ ) gần hình chữ nhật có chiều cao chiều rộng độ dài nột mẫu tín hiệu (3.32) biểu diễn trung bình hai giá trị tần số liên tục 49 1 + 𝑃(𝑛 − 1) 𝑃(𝑛) (3.32) 3.5.4 Phép biến đổi 2-D 1-D Khối xử lý 260 chuyển đổi bề mặt dạng sóng đặc trƣng theo 2-D {Ak,Bk} thành tín hiệu dƣ r(.) miền 1-D (hai chiều).Phép chuyển đổi đƣợc thực mẫu Hình 3.14.Biến đổi bề mặt dạng sóng đặc trưng thành tín hiệu dư Hình 3.14 biểu thị trình khôi phục đoạn thành phần dƣ Đƣờng pha nội suy tƣơng ứng với đoạn dƣ (tù khối xử lý 250) đƣợc minh họa nhƣ hình 3.14a Hình 3.14b bề mặt dạng sóng đặc trƣng nội suy ,tại sóng đặc trƣng đƣợc chuẩn hóa khoảng cách 2π Để biến đổi chập đồ thị hình chiều cắt theo mặt phẳng trực giao (các đƣờng pha gặp bề mặt dạng sóng đặc trƣng ) lên trục pha r(n) 50 Sự chuyển đổi thực biến đổi ngƣợc chuỗi Furie DTFS.Chính xác r(n) đƣợc xác định (3.7) ∅ hàm n 3.5.5 Tổng hợp dự đoán tuyến tính Các tín hiệu lại xây dựng lại đƣợc sử dụng để kích thích lọc tổng hợp LP xử lý 280 để có đƣợc tín hiệu tiếng nói thức.Hàm truyền lọc tƣơng đƣơng với hiển thị hình 2.1 hệ số lọc đƣợc tính nhƣ kết nội suy vạch phổ tần- LSF vi xử lý 270 Các tiếng nói đƣợc tái cấu trúc đƣợc nhấn mạnh với giá trị nhƣ đƣợc sử dụng khối xử lý 130 3.6 Thực lớp phân tích tổng hợp Sự không đồng thời gian Phƣơng pháp nội suy dạng sóng chƣơng không trì đồng thời gian tiếng nói gốc tiếng nói khôi phục.Nó có nguyên nhân không xác ƣớc lƣợng đƣờng biểu diễn pha thành phần độ cao xử lý chia tỷ lệ thời gian xuốt trình nội suy dạng sóng (khối xử lý 230).Tuy nhiên khôi phục hoàn hảo phép nội suy dạng sóng thực điều kiện sau thỏa mãn: 1,Trích dẫn sóng đặc trƣng lần điểm lấy mẫu thay lần khung phụ 2,Đạt đƣợc đƣờng pha ∅(𝑛) xác 3,Nhận đƣợc giá trị xác cảu độ lệch pha khởi đầu ∅(0) 4,Nén điểm trích dẫn,có nghĩa 𝜀=0.0 5,Duy trì thành phần chiều dạng sóng đặc trƣng 51 3.7 Phần tích thành phần dƣ tổng hợp tiếng nói Phƣơng pháp nội suy dạng sóng thực hóa miền dƣ Từ hình 3.12 ,đƣờng biên phổ tín hiệu biểu diễn hệ số dự đoán tuyến tính đƣợc thêm tín hiệu dƣ tái tạo thông qua lọc tổng hợp dự đoán tuyến tính khối xử lý 280.Có thể thêm vào đƣờng biên phổ dạng sóng đặc trƣng riêng việc biến đổi dạng sóng đặc trƣng miền dƣ sóng đặc trƣng miền tiếng nói trƣớc nội suy dạng sóng đƣợc diễn khối xử lý 230 Hình 3.15 Một lựa chọn hóa WI chuyển 2-D 1-D dạng sóng đặc trưng miền tiếng nói Hình 3.15 sơ đồ thực tƣơng tự,cấu trúc giải đƣợc trình bầy hình 3.12.Sự khác chủ yếu khối xử lý 230 260 hoạt động với dạng sóng đặc trƣng miền tiếng nói Khối xử lý 290 đƣợc đƣa để biến đổi dạng sóng đặc trƣng miền tiếng nói cách thêm đƣờng bao phổ chúng.Khối xử lý 290 thực việc thêm phép tích chập dạng sóng đặc trƣng {Ak,Bk} với hệ số dự tuyến tính {ak} Công thức yêu cầu cho tích chập là: 52 Trong k= 1,2… ,[P(n)/2] {Ck(n),Dk(n)} đại diện cho hệ số chuỗi Furie DTFS dạng sóng đặc trƣng tiếng nói thời điểmn.{a1;a2,…,aN} hệ số nội suy dự đoán tuyến tính tạo vi xử lý 270 Lƣu ý a0 luôn (xem hình 2.1) Nghịch đảo (3.35) tồn nên: Trong k=1,2,….,[P(n)/2].(3.35) (3.36) đƣợc sử dụng để thêm vào loại bỏ cấu trúc đƣờng bao phổ từ sóng đặc trƣng 53 KẾT LUẬN Sau sâu vào tìm hiểu đề tài :“Nghiên cứu phương pháp hóa tiếng nói ,nội suy dạng sóng tốc độ 4kbps” Nhờ hƣớng dẫn tận tình thầy giáo TS.Phạm Văn Phƣớc em hiểu thêm cách thức tiếng nói tốc độ dạng sóng thực tế Hiện hóa tiếng nói dựa nguyên lý dự đoán tuyến tính LPC với việc lƣợng tử hóa vecto tiến với tốc độ hóa giảm xuống nhỏ 54 TÀI LIỆU THAM KHẢO 1.Waveform Interpolation Speech Coder at kb/s_Eddie L T Choy 55 ... N+1 P(z) Q(z)

Ngày đăng: 13/10/2017, 02:06

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w