Nghiên cứu phương pháp mã hóa tiếng nói,nội dung dạng sóng tốc độ 4kbps

60 475 0
Nghiên cứu phương pháp mã hóa tiếng nói,nội dung dạng sóng tốc độ 4kbps

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CẢM ƠN Sau em nghiên cứu đề tài, trình thực đồ án nỗ lực, cố gắng thân em nhận giúp đỡ hướng dẫn phía từ thầy giáovà bạn bè Em xin gửi lời cảm ơn trân thành đến: Thầy giáo Ts Phạm Văn Phước trực tiếp giúp em định hướng đề tài đồ án tận tình hướng dẫn, giải đáp thắc mắc.Thầy chia sẻ kiến thức chuyên môn sâu kinh nghệm quý báu giúp em hoàn thành đồ án Đồng thời em xin cám ơn đến thầy giáo, cô giáo môn bạn lớp ĐTV52-DH1 nhiệt tình chia sẻ, giúp đỡ động viên suốt trình làm đồ án Cho dù em cố gắng, nỗ lực trình thực đồ án có nhiều kiến thức Cho nên tránh khỏi thiếu sót câu văn dịch từ tiếng anh không rõ nghĩa Em mong nhận góp ý, bảo tận tình quý thầy giáo, cô giáo bạn đồng môn Hải Phòng, tháng năm 2016 Sinh viên thực Nguyễn Duy Phương LỜI CAM ĐOAN Em xin cam đoan đề tài nghiên cứu em thực hiện.Các số liệu kết luận nghiên cứu trình bày đồ án chưa công bố nghiên cứu khác Em xin chịu trách nhiệm đồ án Hải Phòng, tháng năm 2016 Sinh viên thực Nguyễn Duy Phương MỤC LỤC CÁC CHỮ VIẾT TẮT CW Characteristic Waveform: Dạng sóng đặc trưng DTFS Discrete-Time Fourier Series: Chuỗi Furier rời rạc thời gian LP Linear Prediction: Dự đoán tuyến tính LPC Linear Predictive Coding: Mã hóa dự đoán tuyến tính LSF Line Spectral Frequency: Tần số vạch phổ LSP Line Spectral Pair: Cặp vạch phổ MOS Mean Opinion: Điểm đánh giá mã hóa trung bình MSE Mean Square Error: Sai số trung bình bình phương PCM Pulse Code Modulation: Điều chế mã xung PWI Prototype Waveform Interplation: Nội suy dạng sóng nguyên mẫu REW Rapidly Evolving Waveform: Dạng sóng biến đổi nhanh SEW Slowly Evolving Waveform: Dạng sóng biến đổi chậm SNR Signal-to-Noise Ratio: Tỷ số tín hiệu tạp âm V/UV Voiced/Unvoiced: Âm hưu thanh/âm vô WI Waveform Interpolation: Nội suy dạng sóng DANH MỤC CÁC HÌNH STT Tên hình Tran g Hình 1.1 Sơ đồ khối hệ thống lưu trữ truyền tiếng nói Hình 1.2 Biểu diễn thành phần hữu vô theo thời gian tần số Hình 2.1 Các lọc tổng hợp LP 11 Hình 2.2 Các lọc phân tích LP 11 Hình 3.1 Sơ đồ khối mã hóa tiếng nói nội suy dạng sóng 21 Hình 3.2 Một ví dụ bề mặt dạng sóng đặc trưng 24 Hình 3.3 Một sơ đồ khối khối phân tích WI (bộ xử lý 100) 25 Hình 3.4 31 Hình 3.5 Nội suy thành phần độ cao trường hợp tăng gấp đôi Hình biểu diễn đoạn tiếng nói có pitch-tăng gấp đôi tín hiệu dư Hình 3.6 Một điểm trích dẫn 34 Hình 3.7 Cửa sổ trích dẫn với n=60 35 Hình 3.8 Sơ đồ khối xử lý xếp dạng sóng 36 Hình 3.9 Chia tỷ lệ thời gian dạng sóng đặc trưng-CW 40 32 Hình 3.10 Mô tả việc chèn mẫu phổ 42 Hình 3.11 Sơ đồ khối giải mã mã hóa-WI 47 Hình3.12 Hình 3.12.Sơ đồ khối xử lý nội suy 48 Hình3.13 Nội suy dạng sóng đặc trưng khoảng khung 50 Hình 3.14 Biến đổi bề mặt dạng sóng đặc trưng thành tín hiệu dư 54 Hình 3.15 Một lựa chọn mã hóa WI chuyển 2-D 1-D dạng sóng đặc trưng miền tiếng nói 56 MỞ ĐẦU Con người giao tiếp ngôn ngữ với để trao đổi thông tin,rồi người nghĩ nhiều phương pháp khác để phục vụ cho sống hàng ngày Vì mà thong tin liên lạc ngày phát triển Với xu đó,nghiên cứu nắm bắt kỹ thuật áp dụng thong tin liên lạc ngày quan trọng.Mã hóa tiếng nói kỹ thuật Mã hóa tiếng nói tốc độ thấp công nghệ cở hệ thống thông tin tổ ong số phát triển nhanh vài năm qua đưa công nghệ đến giai đoạn có ứng dụng thực tiễn lớn Để sâu vào vấn đề Đồ án em làm với đề tài là: “Nghiên cứu phương pháp mã hóa tiếng nói,nội dung dạng sóng tốc độ 4kbps” Đề tài em giải vấn đề sau: Chương 1: Giới thiệu mã hóa tiếng nói Chương nêu tảng thông tin mã hóa tiếng nói nêu thành phần tín hiệu tiếng nói sơ cho mã hóa.Mục đích phân tích phương pháp nội suy dạng sóng với chất lượng tương đương thoại cố định tốc độ 4kpbs Chương 2: Mã hóa tiêng nói dự đoán tuyến tính Chương phân tích tổng quan phân tích mã hóa dự đoán tuyến tính khoảng ngắn Các khái niệm tần số phổ vạch.mở rộng bang thông nhấn trước Chương 3: Phương pháp nội suy dạng sóng Chương phân tích tảng khái niệm mã hóa nội suy dạng sóng.Phân tích thuật toán liên quan,lớp phân tích tổng hợp phân tích sở toán học thuật toán Em chân thành cảm ơn thầy giáo T.S Phạm Văn Phước thầy khoa Điện tận tình bảo,hướng dãn giúp đỡ em hoàn thành Luận án tốt nghiệp CHƯƠNG I:GIỚI THIỆU 1.1 khái niệm mã hóa tiếng nói Trong hệ thống kỹ thuật số đại, tín hiệu tiếng nói biểu diễn định dạng kỹ thuật số chuỗi bit nhị phân Nó thường mong muốn cho tín hiệu đại diện vài bit Đối với việc lưu trữ, sử dụng bít thông tin tốn nhớ Đối với ứng dụng truyền tải, làm tăng dung lượng kênh truyền đơn vị băng thông ,công xuất nhớ Do đó,việc sử dụng thuật toán nén mã hóa tiếng nói làm tang hiệu hệ thống lưu trữ truyền phát Mã hóa tiếng nói công nghệ ứng dụng cho thuật toán nén Mặc dù băng thông lớn trở nên có sẵn truyền thông kết phát triển nhanh chóng phương tiện truyền thông truyền dẫn quang, nhu cầu băng thông ngày tăng, đặc biệt lĩnh vực vô tuyến vệ tinh Đồng thời, với xu hướng phát triển truyền thông đa phương tiện ứng dụng giọng nói liên quan khác máy trả lời kỹ thuật số, nhu cầu nhớ bảo tồn hệ thống lưu trữ giọng nói ngày tang.Mã hóa tiếng nói với tốc độ bít thấp chất lượng ngày đặt thách thức tương lai Ngoài ra, xuất vi xử lý DSP nhanh nhiều cung cấp phát biểu nhà nghiên cứu mã hóa ưu đãi nhiều cho việc cải tiến mã hóa ngôn luận thuật toán, thuật toán phép có nhiều tính hết trước Một vụ nổ công trình nghiên cứu phát biểu mã hóa dự kiến nhìn thấy đến thiên niên kỷ 1.2 Thành phần mã hóa tiếng nói 1.2.1 Các thành phần mã hóa tiếng nói Một khối mã hóa tiếng nói luôn bao gồm khối mã hóa khối giải mã Các mã hóa chức nén giải mã có chác khôi phục liệu tồn hệ thống lưu trữ tiếng nói điển hình Hình 1.1 minh họa ví dụ hệ thống Ở giai đoạn nén, phát biểu mã hóa tín hiệu tiếng nói kỹ thuật số ban đầu tạo tỷ lệ bit thấp chuỗi bit sau truyền đến người nhận thiết bị lưu trữ giai đoạn giải nén, giải mã lời nói cố gắng để hoàn tác mã hóa thực xây dựng xấp xỉ tín hiệu ban đầu từ chuỗi bít nén liệu Như vậy, giải mã phải cấu trúc nghịch đảo gần mã hóa Hình 1.1 Sơ đồ khối hệ thống lưu trữ truyền tiếng nói 1.2.2 Khái niệm Khung khung phụ Tiếng nói tín hiệu thời gian khác Để phân tích tín hiệu tiếng nói cách hiệu khối mã hóa tiếng nói liên tiếp phân vùng tín hiệu thành khối liên tiếp mà mẫu khối coi ổn định Những khối gọi khung Hơn nữa, số bước xử lý yêu cầu thời gian giải nhu cầu cao để thực khối nhỏ Những nhỏ khối thường gọi khung phụ 1.2.3 Yếu tố thực Trong việc lựa chọn mã hóa tiếng nói, khía cạnh hiệu suất định phải xem xét thương mại cần phải thực ứng dụng khác đòi hỏi khối mã hóa tối ưu hóa cho kích thước khác số cân kích thước Chúng ta chọn tám khía cạnh quan trọng số mô tả ngắn gọn sau: (i) tốc độ bit trung bình: Thông số thường đo bit giây (bps).Từ “trung bình” sử dụng số trình hoạt động với tốc độ bit thay đổi,cũng với tốc độ xác định Tốc độ bit nói tới không bao gồm tốc độ bit đưa vào sử dụng cho khối mã sửa lỗi (ii) Chất lượng tiếng nói: Một phương pháp phổ biến để đánh giá chất lượng phát biểu thước đo chủ quan Người nghe hỏi để cung cấp cho đánh giá chất lượng phát biểu dựa thang điểm năm điểm xấu, nghèo, công bằng, tốt tuyệt vời Bởi khác biệt lớn người nghe với nhau, kiểm tra đòi hỏi số lượng lớn phát biểu liệu, hệ thống loa người nghe để có xếp hạng xác coder phát biểu Tại Bắc Mỹ, tỷ lệ triệu phép tính giây từ 4.5 thường có nghĩa điện thoại chất lượng chất lượng tổng hợp giảm xuống 3,5.Ngoài có phép đo khách quan thông số tín hiệu tạp âm-SNR Nói chung, phép đo khách quan dài tốn người chủ quan, trước không hoàn toàn chiếm cảm nhận đặc tính hệ thống thính giác người (iii) Khối nhớ : Như đề cập trước đó, hầu hết lập trình viên phát biểu có xu hướng để xử lý mẫu khối, đó, thời gian trễ thường tồn gốc phát biểu mã hóa Trong bối cảnh mã hóa giọng nói, chậm trễ thời gian gọi chậm trễ thuật toán mà thường defned tổng (i) độ dài khối xử lý ngôn luận (ii) độ dài nhìn phía trước mà cần thiết để xử lý mẫu khối Trong số ứng dụng điện thoại, thường có giới hạn nghiêm ngặt thời gian trễ Trong người khác hệ thống lưu trữ giọng nói, chậm trễ chấp nhận (iv) Tính phức tạp tính toán: thuật toán mã hóa tiếng nói thường phải chạy chip đơn xử lý tín hiệu Do sử dụng nhớ tốc độ có hai vấn đề Làm cho phức tạp Cách sử dụng thuật toán có độ phức tạp cao không yếu cầu mức độ nhanh chip để lập mã thời gian thực.Đó lý tiêu thụ công suất lớn thách thức lớn phần cứng hệ thống xách tay (v) Độ nhạy lỗi kênh: Tham số xác định chống lại lỗi kênh, lỗi thường gây diện tiếng ồn kênh, tín hiệu fading nhiễu xuyên ký hiệu Các kênh lỗi vấn đề trở nên ngày quan trọng phát biểu mã hóa nhiều triển lập trình ngôn sử dụng truyền thong vô tuyến Trong hệ thống vậy, tiếng nói phải có khả cung cấp cho chất lượng phát biểu hợp lý với tỷ lệ lỗi cao 10% (vi) Khả chống nhiễu ,tạp âm: Trong ứng dụng từ thực tế, phải đối mặt với loại tiếng ồn âm âm ôtô, tiếng ồn nơi làm việc Do đó, điều quan trọng thực thuật toán mã hóa tiếng nói không chịu ảnh hưởng mức từ môi trường bên Các vấn đề tiếng ồn xung quanh trở nên đặc biệt quan trọng nói đến thông tin liên lạc quân di động Trong thực tế, năm 1996 khối giải 2.4 kbps quốc phòng Mỹ yêu cầu tất thuật toán để có hiệu suất tốt hai môi trường yên tĩnh ồn (vii) Băng thông khối mã hóa tiếng nói: Điều có nghĩa băng thông tín hiệu tiếng nói khối thực mã hóa tiếng nói Khối mã hóa băng hẹp trình bày nói truyền tải qua điện thoại thông thường đòi hỏi băng thông 200-3400Hz Mặt khác, ứng dụng lời nói băng rộng từ đến 20 kHz bao gồm truyền tải âm thanh, hội nghị từ xa dạy học qua thoại (viii) Những đặc tính âm thanh: Khối mã hóa tiếng nói nến tiếng nói tốt cách xử lý tiếng nói.Ví dụ cảu đặc tính theo bước giảm bớt định dạng tái tạo tiếng nói nhanh chậm,điều khiển tiếng nói mà không cần tới thành phần độ cao , vv… 10 Kể từ xử lý với lời nói thật mẫu lại, {A k(n)} {Bk (n)}sẽ luôn thực dẫn tới: Ngoài ra, với mục đích đơn giản, bỏ qua số n từ biểu thức xử lý số thời gian đặc biệt Ψ(n) trở thành: Qua việc trao đổi thứ tự đầu tổng đại lượng, có được: Bây giờ, sử dụng (3.3) (3.4) xây dựng: Phương trình 3.23 công thức xử lý 180 dùng cho xác định lượng dạng sóng đặc trưng từ hệ số chuỗi Furie DTFS 46 Như xử lý 190 thực chuẩn hóa lượng, đưa vào công thức sau Chia (3.23) cho Ψ ,có thể có lượng đơn vị bên trái: Việc kết hợp Ψ vào hệ số chuỗi Furie DTFS,(3.24) trở thành : Do đó, thủ tục bình thường đơn giản chia hệ số DTFS bậc hai công suất trung bình, Tóm lại, với dạng sóng đặc trưng đến, khối lượng 180 sử dụng (3.23) để tính toán lượng Ψ từ hệ số chuỗi Furie DTFS Khối chuẩn hóa 190 sau chia hệ số chuỗi Furie DTFS cho thừa số theo (3.25) để có có lượng đơn vị dạng sóng đặc trưng Nhận xét việc bình thường hóa lượng - Phương trình 3.23 lượng trung bình dạng sóng đặc trưng tương ứng với tổng nguồn lượng tất thành phần hài Điều giải thích lý thêm vào hài biên độ vào phổ dạng sóng đặc trưng lại bảo toàn lượng ban đầu (hình 3.9c, 3.10b 3.10c) Điều giải thích việc giảm lượng từ việc cắt hài hình 3.9b 47 - Không có khác biệt xử lý 170 đặt sau trước khối chuẩn hóa lượng 180 Nói cách khác, không quan trọng liên kết - thực dạng sóng đặc trưng chuẩn hóa không chuẩn hóa Khối chuẩn hóa lượng 180 nên bị vô hiệu lượng dạng sóng đặc trưng (tính xử lý 170) nhỏ đáng kể dấu hiệu biểu thị đoạn câm thoại Nếu không, tràn tính toán dễ xảy xuốt thủ tục chuẩn hóa 3.4.7 Đầu lớp phân tích Tóm lại, lớp phân tích phân hủy đoạn tiếng nói thành thông số ,thành phần độ cao,tần số vạch phổ- LSFs, công suất dạng sóng đặc trưng Hai có tốc độ cập nhật lần cho khung , hai thông số sau tính toán lần khung phụ (tám lần khung hình).Các dạng sóng đặc trưng tạo thành dạng sóng biến đổi theo thời gian hai chiều bề mặt Thông thường, bốn thông số gửi đến vi xử lý 300 400 cho lượng tử giải lượng tử, mà đề cập Chương Tuy nhiên, khối mã hóa thiết lập để chạy có lớp phân tích tổng hợp, thông số gửi trực tiếp để xử lý 200 3.5 Giai đoạn tổng hợp tiếng nói Từ tần số phổ vạch, thành phần độ cao, công suất dạng sóng đặc trưng chuẩn hóa, tín hiệu tiếng nói xây dựng lại xử lý tổng hợp 200 Lưu ý khối tổng hợp thu phiên lượng tử thông số Một sơ đồ xử lý tổng hợp thể hình 3.11.Giống khối xử lý bên mã hóa, tần suất thực thay đổi từ vi xử lý để xử lý lớp tổng hợp Một số vi xử lý hoạt động sở khung, mộ số khác lại thực lần khung phụ chí lần cho mẫu Các vi xử lý 240 270 giống hệt để xử lý 150 120 tương ứng, mô tả chức họ không lặp lại phần 48 Hình 3.11 Sơ đồ khối giải mã mã hóa-WI 3.5.1 Khôi phục công xuất hàng dạng sóng đặc trưng Công suất sóng đặc trưng trả nguyên khối 210.Sử dụng thông tin thành phần độ cao đưa tới từ khôi nội suy 240 để xác định độ dài dạng sóng đặc trưng Để khôi phục công suất CW, biến đổi ngược trình mà làm (3.25) cách nhân hệ số Furie- DTFS Sau dạng sóng đặc trưng phục hồi công suất, chúng gửi đến khôi phục hàng 220 Nếu khối mã hóa thực lượng tử thông sốcác dạng sóng đặc trưng liền không xếp sau giải mã 3.5.2 Tạo thành phần độ cao sóng đặc trưng đồng thời Hiện dựng lại hoàn toàn, phù hợp dạng sóng đặc trưng thành phần độ cao khung phụ Trong mô hình nội suy dạng sóng, dạng sóng đạc trưng chiều dài thành phần độ cao điểm mẫu cần thiết để tái tạo lại tín hiệu lại chiều.Các giá trị tức thời tạo vi xử lý 230 49 Nội suy tuyến tính sử dụng để dựng lại mẫu dạng sóng đặc trưng Khi dựng lại mẫu hai dạng sóng đặc trưng cócùng kích thước, nội suy đơn giản áp dụng Tuy nhiên, hai dạng sóng đặc trưng không kích thước bội ước số ,phải sử lý thêm để đảm bảo nội suy trơn tru Việc nội suy dẫn đến trình thực nahu tring khối 150 lớp phân tích.Nội suy tuyến tính không áp dụng phương trình thành phần độ cao nhân hay chia theo (3.10) (3.11).Giá trị thành phần độ cao tức thời nội suy tương ứng với độ dài dạng sóng đặc trưng tức thời Hình 3.12 khối nội suy 230 có khả xử lý sóng đặc trưng nội suy thành phần đọ cao theo tình huống:có kích thước,khác kích thước thành phần độ cao nhân chia Hình 3.12.Sơ đồ khối xử lý nội suy Tình 1: Nội suy với kích thước Đầu tiên, giả định nội suy thực hai CWS chiều dài P Như kết giả định này, vi xử lý 231, 232 Và 234 không thực thi Nếu ký n0 n1 khoảnh khắc thời gian ranh giới khoảng thời gian suy, tức CW, S(n; m), Tại sốncó thể tính cách nội suy giữaS(n0; m) vàS(n1; m) Trong miền thời gian, điều nội suy thể như: 50 Thay (3.5) vào (3.26), ta có được: Nói cách khác, nội suy tuyến tính hai dạng sóng đặc trưng miền thời gian tương đương nội suy tuyến tính chuỗi Furie- DTFS họ Các nội suy thực sở khung phụ, n 1- n2 =Lsf= 20 Khi dạng sóng đặc trưng biên độ có độ dài ,cácdạng sóng đặc trưng nội suy có chiều dài tốt Kết là, đường viền thành phần độ cao liên tục Kết xử lý 235 Tình 2: Nội suy với kích thước khác Nói chung,thành phần độ cao thay đổi khoảng thời gian dạng sóng đặc trưng đường biên có độ dài khác (số lượng hệ số khác {Ak ,Bk} ) Để tạo điều kiện phép nội suy trường hợp này, ta chọn tỷ lệ thời gian dạng sóng đặc trưng ngắn theo độ dài thời gian dạng sóng đặc trưng dài trước nội suy Như nêu mục 3.4.5, qus trình chọn tỷ lệ thời gian tương đương với việc đệm hài “0” để mô tả chuỗi Furie - DTFS Vì thế,vi xử lý 232 thiết lập để đệm số vào dạng sóng đặc trưng ngắn phù hợp với khoang thời gian dạng sóng đặc trưng dài Sau đó, xử lý 233 nội suy dạng sóng đăc trưng với mẫu tương tự trường hợp để thu dạng sóng đặc trưng tức thời Bộ vi xử lý 231vẫn chưa hoạt động 51 Hình 3.13.Nội suy dạng sóng đặc trưng khoảng khung Ở khối xử lý 235, nội suy tuyến tính nhử phương trình (3.9) sử dụng để dựng lại mẫu thành phần độ cao Tuy nhiên, giá trị sân kết từ trình không phù hợp với độ dài thành phần độ cao dạng sóng đặc trưng nội suy (sản lượng 233), kết đệm thêm khối xử lý 232 Để tránh mâu thuẫn này, người thiết lập vi xử lý 234 để gắn kết thời gian dạng sóng đặc trưng để phù hợp vớikhoảng thời gian xác định đường viền thành phần độ cao nội suy Một ví dụ hoạt động thể hình 3.13 với hệ số {A k} nơi nội suy thực hai dạng sóng đặc 52 trưng có độ dài 26 34 Các hoạt động tương tự áp dụng cho hệ số {B k} Chúng ta nên nhớ lại từ Mục 3.4.5 co thời gian mộtdạng sóng đặc trưng đạt cách cắt xén hệ số chuỗi Furie DTFS Ngoài ra, nói mục 3.4.6, cắt bớt hệ số chuỗi Furie- DTFS dẫn đến giảm công suất dạng sóng đặc trưng Để trì mức công suất sau nén thời gian, cần chọn tỷ lệ vói hệ số chuỗi Furie DTFS hệ số phù hợp Tình 3: Nội suy với thành phần độ cao tăng giảm Nếu dạng sóng đặc trưng dài ngắn hơndạng sóng đặc trưng trước đó, xuất nhân chia thành phần độ cao Bộ vi xử lý 231 thiết lập phù hợp lần xuất Tương tự xử lý 170, xử lý sử dụng số C tiêu chí định nhiều thành phần độ cao Nếu thành phần độ cao tăng giảm (C>1) khoảng thời gian khung phụ, vi xử lý lặp lặp lại dạng sóng đặc trưng ngắn với số nguyên lần mà phù hợp dạng sóng đặc trưng dài Thủ tục tương đương với chèn hài biên độ hài gốc biểu diễn chuỗi Furie DTFS Sau chèn bit vao, dạng sóng đặc trưng sau gửi đến vi xử lý 232 xử lý cách tình Kể từ bít chèn vào vi xử lý 231 bị bỏ lại dạng sóng đặc trưng sau gửi đến vi xử lý 260 , vi xử lý 235 nội suy theo chiều dài thành phần độ cao sau bít chèn (Hình 3.15) dạng sóng đặc trưng Bằng cách này, thành phần độ cao tức thời xử lý 250 phản ánh xác độ dài tức dạng sóng đặc trưng mà đến xử lý 260 3.5.3 Đánh giá thứ tự pha Trong phần này, có liên quan với vi xử lý 250 mục tiêu mà để chuyển đổi giá trị thành phần độ cao vào trật tự pha Các đường sử dụng vi xử lý 260 để biến đổi bề mặt dạng sóng đặc trưng hai chiều trở lại vào chiều lại Vì có giá trị thành phần độ cao 53 điểm mẫu, đường pha tính cách bước tổng hợp diện tích đường cong theo dõi tần số F(n) Mối quan hệ F(n) P(n) Có thể thể như: Nếu (.) đường pha ,đường bao pha thời điểm mẫu cso thể cập nhật cở sở mẫu Trong giá trị pha trước đó.tích phân tương ứng với vùng phụ trội khoảng (n-1) n.Giả sử thành phần độ cao biến đổi tuyến tính trân khoảng tích phân,có thể khai triển (3.29) sau: Và tiếp tục,phép tích phân dẫn tới Thực (3.31) theo mẫu,khối xử lý 250 biến đổi theo dạng sóng P(.) thành dạng theo pha.Thấy hàm tăng,tích phân (3.30) đưa kết dương Toán tử (3.31) tính toán phức tạp ,thực lần mẫu Để đơn giản với tích phân (3.29),tích phân gần hình chữ nhật có chiều cao chiều rộng độ dài nột mẫu tín hiệu (3.32) biểu diễn trung biinhf hai giá trị tần số lien tục 54 3.5.4 Phép biến đổi 2-D 1-D Khối xử lý 260 chuyển đổi bề mặt dạng sóng đặc trưng theo 2-D {A k,Bk} thành tín hiệu dư r(.) miền 1-D (hai chiều).Phép chuyển đổi thực mẫu Hình 3.14.Biến đổi bề mặt dạng sóng đặc trưng thành tín hiệu dư Hình 3.14 biểu thị trình khôi phục đoạn thành phần dư Đường pha nội suy tương ứng với đoạn dư (tù khối xử lý 250) minh họa hình 3.14a Hình 3.14b bề mặt dạng sóng đặc trưng nội suy ,tại sóng đặc trưng chuẩn hóa khoảng cách 2π Để biến đổi chập đồ thị hình chiều cắt theo mặt phẳng trực giao (các đường pha gặp bề mặt dạng sóng đặc trưng ) lên trục pha r(n) Sự chuyển đổi thực biến đổi ngược chuỗi Furie DTFS.Chính xác r(n) xác định (3.7) hàm n 55 3.5.5 Tổng hợp dự đoán tuyến tính Các tín hiệu lại xây dựng lại sử dụng để kích thích lọc tổng hợp LP xử lý 280 để có tín hiệu tinegs nói thức Hàm truyền lọc tương đương với hiển thị hình 2.1 hệ số lọc tính kết nọi suy vạch phổ tần- LSF vi xử lý 270 Các tiếng nói tái cấu trúc nhấn mạnh với giá trị sử dụng khối xử lý 130 3.6 Thực lớp phân tích tổng hợp Sự không đồng thời gian Phương pháp nội suy dạng sóng chương không trì đồng thời gian tiếng nói gốc tiếng nói khôi phục.Nó có nguyên nhân không xác ươc lượng đường biểu diễn pha thành phần độ cao xử lý chia tỷ lệ thời gian xuốt trình nội suy dạng sóng (khối xử lý 230).Tuy nhiên khôi phục hoàn hảo phép nội suy dạng sóng thực điều kiện sau thỏa mãn: 1,Trích dẫn sóng đặc trưng lần điểm lấy mẫu thay lần khung phụ 2,Đạt đường pha xác 3,Nhận giá trị xác cảu độ lệch pha khởi đầu 4,Nén điểm trích dẫn,có nghĩa =0.0 5,Duy trì thành phần chiều dạng sóng đặc trưng 3.7 Phần tích thành phần dư tổng hợp tiếng nói Phương pháp nội suy dạng sóng thực mã hóa miền dư 56 Từ hình 3.12 ,đường biên phổ tín hiệu biểu diễn hệ số dự đoán tuyến tính thêm tín hiệu dư tái tạo thong qua lọc tổng hợp dự đaons tuyến tính khối xử lý 280.Có thể thêm vào đường biên phổ dạng sóng đặc trưng riêng việc biến đổi dạng sóng đặc trưng miền dư sóng đặc trưng miền tiếng nói trước nội suy dạng sóng diễn khối xử lý 230 Hình 3.15 Một lựa chọn mã hóa WI chuyển 2-D 1-D dạng sóng đặc trưng miền tiếng nói Hình 3.15 sơ đồ thực tương tự,cấu trúc giải mã trình bầy hình 3.12.Sự khác chủ yếu khối xử lý 230 260 hoạt động với dạng sóng đặc trưng miền tiếng nói Khối xử lý 290 đưa để biến đổi dạng sóng đặc trưng miền tiếng nói cách thêm đường bao phổ chúng.Khối xử lý 290 thực việc thêm phép tích chập dạng sóng đặc trưng {Ak,Bk} với hệ số dự tuyến tính {ak} Công thức yêu cầu cho tích chập là: 57 Trong k= 1,2… ,[P(n)/2] {Ck(n),Dk(n)} đại diện cho hệ số chuỗi Furie DTFS dạng sóng đặc trưng tiếng nói thời điểm n.{a 1;a2,…,aN} hệ số nội suy dự đoán tuyến tính tạo vi xử lý 270 Lưu ý a luôn (xem hình 2.1) Nghịch đảo (3.35) tồn nên: Trong k=1,2,….,[P(n)/2].(3.35) (3.36) sử dụng để thêm vào loại bỏ cấu trúc đường bao phổ từ sóng đặc trưng 58 KẾT LUẬN Sau sâu vào tìm hiểu đề tài : “Nghiên cứu phương pháp mã hóa tiếng nói ,nội dung dạng sóng tốc độ 4kbps” Nhờ hướng dẫn tận tình thầy giao TS.Phạm Văn Phước em hiểu thêm cách thức mã tiếng nói tốc độ dạng song thực tế Hiện mã hóa tiếng nói dựa nguyên lý dự đoán tuyến tính LPC với việc lượng tử hóa vecto tiến với tốc độ mã hóa giảm xuống nhỏ 59 TÀI LIỆU THAM KHẢO 1.Waveform Interpolation Speech Coder at kb/s_Eddie L T Choy 60 [...]... III QUÁ TRÌNH NỘI SUY DẠNG SÓNG 3.1 Nền tảng và nguyên tắc mã hóa nội suy dạng sóng Tính chất chu kỳ trong tiếng nói hữu thanh đã thúc đẩy sự phát triển của kỹ thuật mã hóa bằng phương pháp nội suy dạng sóng Phiên bản dầu được gọi là nội suy dạng sóng nguyên mẫu chỉ mã hóa các đoạn tiếng nói hữu thanh Vì vậy bản này kết hợp với các mô hình khác nhau để mã hóa các đoạn vô thanh Dạng sóng nội suy nguyên... thành nội suy dạng sóng- WI có khả năng mã hóa cả hai lên âm hữu thanh và âm vô thanh Tương tự như các nguyên tắc của PWI, WI đại diện cho một tín hiệu tiếng nói với một chuỗi các dạng sóng phát triển Đối với bài phát biểu lên tiếng, các dạng sóng chỉ đơn giản là sân-chu kỳ Và đối với bài phát biểu bị mất tiếng và tiếng ồn nên các dạng sóng là độ dài khác nhau và chứa tín hiệu chủ yếu là tiếng ồn như thế... học thích hợp cho những dạng song đặc trưng Chúng ta sẽ tìm hiểu sau đó, một phần lớn của các tính toán nội suy dạng sóng có liên quan với các dạng sóng đặc trưng, vì vậy nó rất quan trọng để mô tả một cách thích hợp để giảm thiểu sự phức tạp của các khối mã hóa Các dạng sóng đặc trưng được sử dụng để xây dựng một mặt hai chiều mô tả sự tiến hóa dạng sóng Vì vậy, nội suy dạng sóng mà chúng tôi đang... thời gian của các dạng sóng chu kỳ độ cao trong đoạn hưu thanh Điều này tiến triển chậm chạp của các dạng sóng cho thấy chúng ta không cần phải truyền mỗi 21 chu kỳ thành phần độ cao để các bộ giải mã; thay vào đó, chúng ta có thể chuyển chúng vào khoảng Tại bộ giải mã, các dạng sóng sân chu kỳ phi truyền có thể sau đó được rút ra bằng phương tiện của suy Bằng cách này, mức độ lên tiếng nói pe-riodicity... lên tiếng có thể thu được Trong PWI,chu kỳ độ cao được lựa chọn để truyền được gọi là dạng sóng nguyên mẫu- Prototype Waveforms Tuy nhiên với đoạn tiếng vô thanh thì phương pháp này được kết hợp với các kỹ thuật khác.Vì vậy việc chuyển đổi các khối mã hóa trở nên thường xuyên và giảm đáng kể năng lượng của khối mã hóa Năm 1994, PWI-nội suy dạng song nguyên mẫu đã được cải tiến để trở thành nội suy dạng. .. cách hiệu quả bởi phân tích Cholesky 18 Phương pháp đồng phương sai-Covariance không dung cửa sổ cho tín hiệu tiếng đầu vào.Đây là ưu điểm với các ưng dụng đánh giá phân tích phổ với độ phân giải cao.Tuy vậy nó không đảm bảo độ ổn định cho mô hình mạch lọc toàn cực các cực nằm ngoài đường tròn đơn vị do đó phương pháp này không được chọn cho mã hóa nội suy dạng sóng 2.3 Nội suy của các hệ số dự đoán... gia tăng tỷ lệ lấy mẫu dạng sóng đến tại các chi phí của sự gia tăng tốc độ bit Để đối phó với vấn đề này, WI phân hủy các CW một dạng sóng suốt tiến hóa (SEW) và một dạng sóng phát triển nhanh chóng (REW) Các SEW đại diện cho các thành phần bán kỳ của tín hiệu tiếng nói trong khi REW đại diện cho các thành phần không định kỳ và tiếng ồn còn lại trong tín hiệu Kể từ khi hai dạng sóng có yêu cầu nhận... dự toán cho {ak} 2.2 Xác định hệ số LP Có hai phương pháp phổ biến trong việc ước tính các hệ số LP, phương pháp tự tương quan và phương pháp phương sai Cả hai phương pháp sử dụng cổ điển bình phương nhỏ nhất kỹ thuật và chọn{ak} như vậy mà có nghĩa là năng lượng của kết quả tín hiệu còn lại được giảm thiểu 2.2.1 Phương pháp tự tương quan Các tín hiệu tiếng nói x(n) lần được nhân với một cửa sổ phân... khác nhau, chúng có thể được lượng tử hóa riêng biệt để tăng cường mã hóa hiệu quả 22 3.2 Tổng quan về khối mã hóa nội suy dạng sóng Hình 3.1 trình bày một sơ đồ của các khối mã hóa nội suy dạng sóng Nó có thể cấu trúc chia thành hai lớp: lớp phân tích tổng hợp và lớp lượng tử Trong lớp cũ, khối phân tích (bộ xử lý 100) Đầu tiên thực hiện một LPC phân tích tín hiệu tiếng nói đến và có được những tín... suy dạng sóng thành phần độ cao (bộ xử lý 150 ) để tính toán các giá trị thành phần độ caotrung gian.Kỹ thuật nội suy dạng sóng truyền thống phù hợp với phương pháp nội suy dạng sóng( WI) Nếu chúng ta định nghĩa P(n1) và P(n2) là các giá trị sân ở ranh giới của khung hiện tại nơi n1

Ngày đăng: 21/05/2016, 16:01

Từ khóa liên quan

Mục lục

  • LỜI CẢM ƠN

  • LỜI CAM ĐOAN

  • MỤC LỤC

  • CÁC CHỮ VIẾT TẮT

  • DANH MỤC CÁC HÌNH

  • MỞ ĐẦU

  • CHƯƠNG I:GIỚI THIỆU

    • 1.1 khái niệm mã hóa tiếng nói

    • 1.2 Thành phần của mã hóa tiếng nói

      • 1.2.1 Các thành phần trong bộ mã hóa tiếng nói

      • 1.2.2 Khái niệm về một Khung và khung phụ

      • 1.2.3 Yếu tố thực hiện

      • 1.2.4 Lượng tử hóa

      • 1.3 Thành phần và thuộc tính tiếng nói

      • 1.4 Nhận thức thính giác của con người

      • CHƯƠNG II:

      • MÃ HÓA TIẾNG NÓI BẰNG DỰ ĐOÁN TUYẾN TÍNH

        • 2.1 Mã hóa tiếng nói bằng dự đoán tuyến tính

        • 2.2 Xác định hệ số LP

          • 2.2.1 Phương pháp tự tương quan

          • 2.2.2 Phương pháp đồng phương sai

          • 2.3 Nội suy của các hệ số dự đoán tuyến tính

          • 2.4 Sự mở rộng của băng thông

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan