Nghiên cứu phương pháp mã hóa tiếng nói,nộisuy dạng sóng tốc độ 4kbps

70 420 0
Nghiên cứu phương pháp mã hóa tiếng nói,nộisuy dạng sóng tốc độ 4kbps

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CẢM ƠN Sau em nghiên cứu đề tài, q trình thực đồ án ngồi nỗ lực, cố gắng thân em nhận giúp đỡ hướng dẫn phía từ thầy giáovà bạn bè Em xin gửi lời cảm ơn trân thành đến: Thầy giáo Ts Phạm Văn Phước trực tiếp giúp em định hướng đề tài đồ án tận tình hướng dẫn, giải đáp thắc mắc.Thầy chia sẻ kiến thức chuyên môn sâu kinh nghệm quý báu giúp em hoàn thành đồ án Đồng thời em xin cám ơn đến thầy giáo, cô giáo môn bạn lớp ĐTV52-DH1 nhiệt tình chia sẻ, giúp đỡ động viên suốt trình làm đồ án Cho dù em cố gắng, nỗ lực q trình thực đồ án có nhiều kiến thức Cho nên tránh khỏi thiếu sót câu văn dịch từ tiếng anh không rõ nghĩa Em mong nhận góp ý, bảo tận tình quý thầy giáo, cô giáo bạn đồng môn Hải Phòng, tháng năm 2016 Sinh viên thực Nguyễn Duy Phương LỜI CAM ĐOAN Em xin cam đoan đề tài nghiên cứu em thực hiện.Các số liệu kết luận nghiên cứu trình bày đồ án chưa công bố nghiên cứu khác Em xin chịu trách nhiệm đồ án Hải Phòng, tháng năm 2016 Sinh viên thực Nguyễn Duy Phương MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN .ii MỤC LỤC iii DANH MỤC CÁC HÌNH vi MỞ ĐẦU .1 CHƯƠNG I:GIỚI THIỆU 1.1 Khái niệm hóa tiếng nói .3 1.2 Thành phần hóa tiếng nói .3 1.2.1 Các thành phần hóa tiếng nói 1.2.2 Khái niệm Khung khung phụ 1.2.3 Yếu tố thực 1.2.4 Lượng tử hóa 1.3 Thành phần thuộc tính tiếng nói 1.4 Nhận thức thính giác người CHƯƠNG II: .11 HÓA TIẾNG NÓI BẰNG DỰ ĐỐN TUYẾN TÍNH .11 2.1 hóa tiếng nói dự đốn tuyến tính .11 2.2 Xác định hệ số LP 13 2.2.1 Phương pháp tự tương quan .13 2.2.2 Phương pháp đồng phương sai 14 2.3 Nội suy hệ số dự đốn tuyến tính 15 2.4 Sự mở rộng băng thông .16 2.5 Nhấn mạnh tiếng nói 17 CHƯƠNG III .18 Q TRÌNH NỘI SUY DẠNG SĨNG 18 3.1 Nền tảng nguyên tắc hóa nội suy dạng sóng .18 3.2 Tổng quan khối hóa nội suy dạng sóng 19 3.3 Đại diện dạng sóng đặc trưng 20 3.4 Giai đoạn phân tích 24 3.4.1 Phân tích dự đốn tuyến tính LP 25 3.4.2 Ước lượng thành phần độ cao 26 3.4.3 Nội suy thành phần độ cao 29 3.4.4 Trích dẫn dạng sóng đặc trưng 32 3.4.5 Sắp sếp dạng sóng đặc trưng 35 3.4.6 CW điện tính tốn chuẩn hóa 42 3.4.7 Đầu lớp phân tích 45 3.5 Giai đoạn tổng hợp tiếng nói 45 3.5.1 Khôi phục công xuất hàng dạng sóng đặc trưng 46 3.5.2 Tạo thành phần độ cao sóng đặc trưng đồng thời 46 3.5.3 Đánh giá thứ tự pha 50 3.5.4 Phép biến đổi 2-D 1-D 52 3.5.5 Tổng hợp dự đốn tuyến tính .53 3.6 Thực lớp phân tích tổng hợp 53 3.7 Phần tích thành phần dư tổng hợp tiếng nói 54 KẾT LUẬN .56 TÀI LIỆU THAM KHẢO 57 CÁC CHỮ VIẾT TẮT CW Characteristic Waveform: Dạng sóng đặc trưng DTFS Discrete-Time Fourier Series: Chuỗi Furier rời rạc thời gian LP Linear Prediction: Dự đoán tuyến tính LPC Linear Predictive Coding: hóa dự đốn tuyến tính LSF Line Spectral Frequency: Tần số vạch phổ LSP Line Spectral Pair: Cặp vạch phổ MOS Mean Opinion: Điểm đánh giá hóa trung bình MSE Mean Square Error: Sai số trung bình bình phương PCM Pulse Code Modulation: Điều chế xung PWI Prototype Waveform Interplation: Nội suy dạng sóng nguyên mẫu REW Rapidly Evolving Waveform: Dạng sóng biến đổi nhanh SEW Slowly Evolving Waveform: Dạng sóng biến đổi chậm SNR Signal-to-Noise Ratio: Tỷ số tín hiệu tạp âm V/UV Voiced/Unvoiced: Âm hưu thanh/âm vô WI Waveform Interpolation: Nội suy dạng sóng DANH MỤC CÁC HÌNH STT Hình 1.1 Hình 1.2 Tên hình Sơ đồ khối hệ thống lưu trữ truyền tiếng nói Biểu diễn thành phần hữu vô theo thời Trang Hình 2.1 gian tần số Các lọc tổng hợp LP 11 Hình 2.2 Các lọc phân tích LP 11 Hình 3.1 Sơ đồ khối hóa tiếng nói nội suy dạng sóng 20 Hình 3.2 Một ví dụ bề mặt dạng sóng đặc trưng 23 Hình 3.3 Một sơ đồ khối khối phân tích WI (bộ xử lý 100) 24 Hình 3.4 Nội suy thành phần độ cao trường hợp tăng 30 Hình 3.5 gấp đơi Hình biểu diễn đoạn tiếng nói có pitch-tăng gấp đơi tín hiệu 31 Hình 3.6 dư Một điểm trích dẫn 33 Hình 3.7 Cửa sổ trích dẫn với n=60 34 Hình 3.8 Sơ đồ khối xử lý xếp dạng sóng 35 Hình 3.9 Chia tỷ lệ thời gian dạng sóng đặc trưng-CW 39 Hình 3.10 Mơ tả việc chèn mẫu phổ 41 Hình 3.11 Sơ đồ khối giải hóa-WI 46 Hình3.12 Sơ đồ khối xử lý nội suy 47 Hình3.13 Nội suy dạng sóng đặc trưng khoảng khung 49 Hình 3.14 Biến đổi bề mặt dạng sóng đặc trưng thành tín hiệu dư 53 Hình 3.15 Một lựa chọn hóa WI chuyển 2-D 1-D dạng 55 sóng đặc trưng miền tiếng nói MỞ ĐẦU Con người giao tiếp ngôn ngữ với để trao đổi thơng tin,rồi người nghĩ nhiều phương pháp khác để phục vụ cho sống hàng ngày Vì thong tin liên lạc ngày phát triển Với xu đó,nghiên cứu nắm bắt kỹ thuật áp dụng thong tin liên lạc ngày quan trọng.Mã hóa tiếng nói kỹ thuật hóa tiếng nói tốc độ thấp cơng nghệ cở hệ thống thông tin tổ ong số phát triển nhanh vài năm qua đưa cơng nghệ đến giai đoạn có ứng dụng thực tiễn lớn Để sâu vào vấn đề Đồ án em làm với đề tài là: “Nghiên cứu phương pháp hóa tiếng nói,nội suy dạng sóng tốc độ 4kbps” Đề tài em giải vấn đề sau: Chương 1: Giới thiệu hóa tiếng nói Chương nêu tảng thơng tin hóa tiếng nói nêu thành phần tín hiệu tiếng nói sơ cho hóa.Mục đích phân tích phương pháp nội suy dạng sóng với chất lượng tương đương thoại cố định tốc độ 4kpbs Chương 2: hóa tiêng nói dự đốn tuyến tính Chương phân tích tổng quan phân tích hóa dự đốn tuyến tính khoảng ngắn Các khái niệm tần số phổ vạch.mở rộng băng thông nhấn trước Chương 3: Phương pháp nội suy dạng sóng Chương phân tích tảng khái niệm hóa nội suy dạng sóng.Phân tích thuật tốn liên quan,lớp phân tích tổng hợp phân tích sở tốn học thuật toán Em chân thành cảm ơn thầy giáo T.S Phạm Văn Phước thầy khoa Điện tận tình bảo,hướng dãn giúp đỡ em hoàn thành Luận án tốt nghiệp CHƯƠNG I:GIỚI THIỆU 1.1 Khái niệm hóa tiếng nói Trong hệ thống kỹ thuật số đại, tín hiệu tiếng nói biểu diễn định dạng kỹ thuật số chuỗi bit nhị phân Nó thường mong muốn cho tín hiệu đại diện vài bit Đối với việc lưu trữ, sử dụng bít thơng tin tốn nhớ Đối với ứng dụng truyền tải, làm tăng dung lượng kênh truyền đơn vị băng thơng ,cơng xuất nhớ Do đó,việc sử dụng thuật tốn nén hóa tiếng nói làm tăng hiệu hệ thống lưu trữ truyền phát hóa tiếng nói cơng nghệ ứng dụng cho thuật toán nén Mặc dù băng thơng lớn trở nên có sẵn truyền thông kết phát triển nhanh chóng phương tiện truyền thơng truyền dẫn quang, nhu cầu băng thông ngày tăng, đặc biệt lĩnh vực vô tuyến vệ tinh Đồng thời, với xu hướng phát triển truyền thông đa phương tiện ứng dụng giọng nói liên quan khác máy trả lời kỹ thuật số, nhu cầu nhớ bảo tồn hệ thống lưu trữ giọng nói ngày tang.Mã hóa tiếng nói với tốc độ bít thấp chất lượng ngày đặt thách thức tương lai Ngoài ra, xuất vi xử lý DSP nhanh nhiều cung cấp phát biểu nhà nghiên cứu hóa ưu đãi nhiều cho việc cải tiến hóa ngơn luận thuật tốn, thuật tốn phép có nhiều tính hết trước 1.2 Thành phần hóa tiếng nói 1.2.1 Các thành phần hóa tiếng nói Một khối hóa tiếng nói ln ln bao gồm khối hóa khối giải Các hóa chức nén giải có chác khơi phục liệu tồn hệ thống lưu trữ tiếng nói điển hình Hình 1.1 minh họa ví dụ hệ thống Ở giai đoạn nén, phát biểu hóa tín hiệu tiếng nói kỹ thuật số ban đầu tạo tỷ lệ bit thấp chuỗi bit sau truyền đến người nhận thiết bị lưu trữ giai đoạn giải nén, giải lời nói cố gắng để hồn tác hóa thực xây dựng xấp xỉ tín hiệu ban đầu từ chuỗi bít nén liệu Như vậy, giải phải cấu trúc nghịch đảo gần hóa Hình 1.1 Sơ đồ khối hệ thống lưu trữ truyền tiếng nói 1.2.2 Khái niệm Khung khung phụ Tiếng nói tín hiệu thời gian khác Để phân tích tín hiệu tiếng nói cách hiệu khối hóa tiếng nói liên tiếp phân vùng tín hiệu thành khối liên tiếp mẫu khối coi ổn định Những khối gọi khung Hơn nữa, số bước xử lý yêu cầu thời gian giải nhu cầu cao để thực khối nhỏ Những khối nhỏ thường gọi khung phụ 1.2.3 Yếu tố thực Trong việc lựa chọn hóa tiếng nói, khía cạnh hiệu suất định phải xem xét thương mại cần phải thực ứng dụng khác đòi hỏi khối hóa tối ưu hóa cho kích thước khác số cân kích thước Chúng ta chọn tám khía cạnh quan trọng số mô tả ngắn gọn sau: (i) tốc độ bit trung bình: Thơng số thường đo bit giây (bps).Từ “trung bình” sử dụng số trình hoạt động với tốc độ bit thay đổi,cũng với tốc độ xác định Tốc độ bit nói tới khơng bao gồm tốc độ bit đưa vào sử dụng cho khối sửa lỗi phần hài Điều giải thích lý thêm vào hài biên độ vào phổ dạng sóng đặc trưng lại bảo tồn lượng ban đầu (hình 3.9c, 3.10b 3.10c) Điều giải thích việc giảm lượng từ việc cắt hài hình 3.9b - Khơng có khác biệt xử lý 170 đặt sau trước khối chuẩn hóa lượng 180 Nói cách khác, khơng quan trọng liên kết thực dạng sóng đặc trưng chuẩn hóa khơng chuẩn hóa - Khối chuẩn hóa lượng 180 nên bị vơ hiệu lượng dạng sóng đặc trưng (tính xử lý 170) nhỏ đáng kể dấu hiệu biểu thị đoạn tiếng thoại Nếu khơng, tính tốn dễ xảy xuốt thủ tục chuẩn hóa 3.4.7 Đầu lớp phân tích Tóm lại, lớp phân tích phân hủy đoạn tiếng nói thành thơng số ,thành phần độ cao,tần số vạch phổ- LSFs, công suất dạng sóng đặc trưng Hai thơng số cập nhật lần cho khung , hai thơng số sau tính tốn lần khung phụ (tám lần khung hình).Các dạng sóng đặc trưng tạo thành dạng sóng biến đổi theo thời gian hai chiều bề mặt Thông thường, bốn thông số gửi đến vi xử lý 300 400 cho lượng tử giải lượng tử, đề cập Tuy nhiên, khối hóa thiết lập để chạy có lớp phân tích tổng hợp, thơng số gửi trực tiếp để xử lý 200 50 3.5 Giai đoạn tổng hợp tiếng nói Từ tần số phổ vạch, thành phần độ cao, cơng suất dạng sóng đặc trưng chuẩn hóa, tín hiệu tiếng nói xây dựng lại xử lý tổng hợp 200 Lưu ý khối tổng hợp thu phiên lượng tử thông số Một sơ đồ xử lý tổng hợp thể hình 3.11.Giống khối xử lý bên hóa, tần suất thực thay đổi từ vi xử lý để xử lý lớp tổng hợp Một số vi xử lý hoạt động sở khung, mộ số khác lại thực lần khung phụ chí lần cho mẫu Các vi xử lý 240 270 giống hệt để xử lý 150 120 tương ứng, mô tả chức họ không lặp lại phần 51 Hình 3.11 Sơ đồ khối giải hóa-WI 3.5.1 Khơi phục cơng xuất hàng dạng sóng đặc trưng Cơng suất sóng đặc trưng trả nguyên khối 210.Sử dụng thông tin thành phần độ cao đưa tới từ khối nội suy 240 để xác định độ dài dạng sóng đặc trưng Để khôi phục công suất CW, biến đổi ngược trình làm (3.25) cách nhân hệ số Furie- DTFS Sau dạng sóng đặc trưng phục hồi công suất, chúng gửi đến khôi phục hàng 220 Nếu khối hóa thực lượng tử thơng sốcác dạng sóng đặc trưng liền khơng xếp sau giải 3.5.2 Tạo thành phần độ cao sóng đặc trưng đồng thời Hiện dựng lại hoàn toàn, phù hợp dạng sóng đặc trưng thành phần độ cao khung phụ Trong mơ hình nội suy dạng sóng, dạng sóng đạc trưng chiều dài thành phần độ cao điểm mẫu cần thiết để tái tạo lại tín hiệu lại chiều.Các giá trị tức thời tạo vi xử lý 230 Nội suy tuyến tính sử dụng để dựng lại mẫu dạng sóng đặc trưng Khi dựng lại mẫu hai dạng sóng đặc trưng có kích thước, nội suy đơn giản áp dụng Tuy nhiên, hai dạng sóng đặc trưng khơng kích thước bội ước số ,phải sử lý thêm để đảm bảo nội suy trơn tru Việc nội suy dẫn đến trình thực khối 150 lớp phân tích.Nội suy tuyến tính khơng áp dụng phương trình thành phần độ cao nhân hay chia theo (3.10) (3.11).Giá trị thành phần độ cao tức thời nội suy tương ứng với độ dài dạng sóng đặc trưng tức thời 52 Hình 3.12 khối nội suy 230 có khả xử lý sóng đặc trưng nội suy thành phần độ cao theo tình huống:có kích thước,khác kích thước thành phần độ cao nhân chia Hình 3.12.Sơ đồ khối xử lý nội suy Tình 1: Nội suy với kích thước Đầu tiên, giả định nội suy thực hai CWS chiều dài P Như kết giả định này, vi xử lý 231, 232 Và 234 không thực thi Nếu ký n0 n1 khoảnh khắc thời gian ranh giới khoảng nội suy , dạng sóng đặc trưng tức thời, S(n; m), Tại số tính cách nội suy giữaS(n0; m) vàS(n1; m) Trong miền thời gian, nội suy thể như: Thay (3.5) vào (3.26), ta có được: 53 Nói cách khác, nội suy tuyến tính hai dạng sóng đặc trưng miền thời gian tương đương nội suy tuyến tính chuỗi Furie- DTFS Các nội suy thực sở khung phụ, n 1- n2 =Lsf= 20 Khi dạng sóng đặc trưng biên độđộ dài ,các dạng sóng đặc trưng nội suy chúng có chiều dài tốt Kết là, đường viền thành phần độ cao liên tục Kết xử lý 235 Tình 2: Nội suy với kích thước khác Nói chung,thành phần độ cao thay đổi khoảng thời gian dạng sóng đặc trưng đường biên có độ dài khác (số lượng hệ số khác {Ak ,Bk} ) Để tạo điều kiện phép nội suy trường hợp này, ta chọn tỷ lệ thời gian dạng sóng đặc trưng ngắn theo độ dài thời gian dạng sóng đặc trưng dài trước nội suy Như nêu mục 3.4.5, trình chọn tỷ lệ thời gian tương đương với việc đệm hài “0” để mơ tả chuỗi Furie - DTFS Vì thế,bộ vi xử lý 232 thiết lập để đệm số vào dạng sóng đặc trưng ngắn phù hợp với khoảng thời gian dạng sóng đặc trưng dài Sau đó, xử lý 233 nội suy dạng sóng đăc trưng với mẫu tương tự trường hợp để thu dạng sóng đặc trưng tức thời Bộ vi xử lý 231vẫn chưa hoạt động 54 Hình 3.13.Nội suy dạng sóng đặc trưng khoảng khung Ở khối xử lý 235, nội suy tuyến tính phương trình (3.9) sử dụng để dựng lại mẫu thành phần độ cao Tuy nhiên, giá trị thành phần độ cao kết từ trình khơng phù hợp với độ dài thành phần độ cao dạng sóng đặc trưng nội suy (sản lượng 233), kết đệm thêm khối xử lý 232 Để tránh mâu thuẫn này, người thiết lập vi xử lý 55 234 để gắn kết thời gian dạng sóng đặc trưng để phù hợp với khoảng thời gian xác định đường viền thành phần độ cao nội suy Một ví dụ hoạt động thể hình 3.13 với hệ số {A k} nơi nội suy thực hai dạng sóng đặc trưng có độ dài 26 34 Các hoạt động tương tự áp dụng cho hệ số {Bk} Chúng ta nên nhớ lại từ Mục 3.4.5 co thời gian mộtdạng sóng đặc trưng đạt cách cắt xén hệ số chuỗi Furie DTFS Ngồi ra, nói mục 3.4.6, cắt bớt hệ số chuỗi Furie- DTFS dẫn đến giảm cơng suất dạng sóng đặc trưng Để trì mức cơng suất sau nén thời gian, cần chọn tỷ lệ với hệ số chuỗi Furie DTFS hệ số phù hợp Tình 3: Nội suy với thành phần độ cao tăng giảm Nếu dạng sóng đặc trưng dài ngắn dạng sóng đặc trưng trước đó, xuất nhân chia thành phần độ cao Bộ vi xử lý 231 thiết lập phù hợp lần xuất Tương tự xử lý 170, xử lý sử dụng số C tiêu chí định nhiều thành phần độ cao Nếu thành phần độ cao tăng giảm (C>1) khoảng thời gian khung phụ, vi xử lý lặp lặp lại dạng sóng đặc trưng ngắn với số nguyên lần phù hợp dạng sóng đặc trưng dài Thủ tục tương đương với chèn hài biên độ hài gốc biểu diễn chuỗi Furie DTFS Sau chèn bit vào, dạng sóng đặc trưng sau gửi đến vi xử lý 232 xử lý cách tình Kể từ bít chèn vào vi xử lý 231 bị bỏ lại dạng sóng đặc trưng sau gửi đến vi xử lý 260 , vi xử lý 235 nội suy theo chiều dài thành phần độ cao sau bít chèn (Hình 3.15) dạng 56 sóng đặc trưng Bằng cách này, thành phần độ cao tức thời xử lý 250 phản ánh xác độ dài tức dạng sóng đặc trưng đến xử lý 260 3.5.3 Đánh giá thứ tự pha Trong phần này, chúng tơi có liên quan với vi xử lý 250 mục tiêu để chuyển đổi giá trị thành phần độ cao vào trật tự pha Các đường sử dụng vi xử lý 260 để biến đổi bề mặt dạng sóng đặc trưng hai chiều trở lại vào chiều lại Vì có giá trị thành phần độ cao điểm mẫu, đường pha tính cách bước tổng hợp diện tích đường cong theo dõi tần số F(n) Mối quan hệ F(n) P(n) Có thể thể như: Nếu (.) đường pha ,đường bao pha thời điểm mẫu cso thể cập nhật cở sở mẫu Trong giá trị pha trước đó.tích phân tương ứng với vùng phụ trội khoảng (n-1) n.Giả sử thành phần độ cao biến đổi tuyến tính trân khoảng tích phân,có thể khai triển (3.29) sau: Và tiếp tục,phép tích phân dẫn tới 57 Thực (3.31) theo mẫu,khối xử lý 250 biến đổi theo dạng sóng P(.) thành dạng theo pha.Thấy hàm tăng,tích phân (3.30) ln đưa kết dương Tốn tử (3.31) tính tốn phức tạp ,thực lần mẫu Để đơn giản với tích phân (3.29),tích phân gần hình chữ nhật có chiều cao chiều rộng độ dài nột mẫu tín hiệu (3.32) biểu diễn trung bình hai giá trị tần số liên tục 3.5.4 Phép biến đổi 2-D 1-D Khối xử lý 260 chuyển đổi bề mặt dạng sóng đặc trưng theo 2-D {A k,Bk} thành tín hiệu dư r(.) miền 1-D (hai chiều).Phép chuyển đổi thực mẫu 58 Hình 3.14.Biến đổi bề mặt dạng sóng đặc trưng thành tín hiệu dư Hình 3.14 biểu thị q trình khơi phục đoạn thành phần dư Đường pha nội suy tương ứng với đoạn dư (tù khối xử lý 250) minh họa hình 3.14a Hình 3.14b bề mặt dạng sóng đặc trưng nội suy ,tại sóng đặc trưng chuẩn hóa khoảng cách 2π Để biến đổi chập đồ thị hình chiều cắt theo mặt phẳng trực giao (các đường pha gặp bề mặt dạng sóng đặc trưng ) lên trục pha r(n) Sự chuyển đổi thực biến đổi ngược chuỗi Furie DTFS.Chính xác r(n) xác định (3.7) hàm n 59 3.5.5 Tổng hợp dự đốn tuyến tính Các tín hiệu lại xây dựng lại sử dụng để kích thích lọc tổng hợp LP xử lý 280 để có tín hiệu tiếng nói thức Hàm truyền lọc tương đương với hiển thị hình 2.1 hệ số lọc tính kết nội suy vạch phổ tần- LSF vi xử lý 270 Các tiếng nói tái cấu trúc nhấn mạnh với giá trị sử dụng khối xử lý 130 3.6 Thực lớp phân tích tổng hợp Sự không đồng thời gian Phương pháp nội suy dạng sóng chương khơng trì đồng thời gian tiếng nói gốc tiếng nói khơi phục.Nó có ngun nhân khơng xác ước lượng đường biểu diễn pha thành phần độ cao xử lý chia tỷ lệ thời gian xuốt q trình nội suy dạng sóng (khối xử lý 230).Tuy nhiên khơi phục hồn hảo phép nội suy dạng sóng thực điều kiện sau thỏa mãn: 1,Trích dẫn sóng đặc trưng lần điểm lấy mẫu thay lần khung phụ 2,Đạt đường pha xác 60 3,Nhận giá trị xác cảu độ lệch pha khởi đầu 4,Nén điểm trích dẫn,có nghĩa =0.0 5,Duy trì thành phần chiều dạng sóng đặc trưng 3.7 Phần tích thành phần dư tổng hợp tiếng nói Phương pháp nội suy dạng sóng thực hóa miền dư Từ hình 3.12 ,đường biên phổ tín hiệu biểu diễn hệ số dự đốn tuyến tính thêm tín hiệu dư tái tạo thông qua lọc tổng hợp dự đốn tuyến tính khối xử lý 280.Có thể thêm vào đường biên phổ dạng sóng đặc trưng riêng việc biến đổi dạng sóng đặc trưng miền dư sóng đặc trưng miền tiếng nói trước nội suy dạng sóng diễn khối xử lý 230 Hình 3.15 Một lựa chọn hóa WI chuyển 2-D 1-D dạng sóng đặc trưng miền tiếng nói 61 Hình 3.15 sơ đồ thực tương tự,cấu trúc giải trình bầy hình 3.12.Sự khác chủ yếu khối xử lý 230 260 hoạt động với dạng sóng đặc trưng miền tiếng nói Khối xử lý 290 đưa để biến đổi dạng sóng đặc trưng miền tiếng nói cách thêm đường bao phổ chúng.Khối xử lý 290 thực việc thêm phép tích chập dạng sóng đặc trưng {Ak,Bk} với hệ số dự tuyến tính {ak} Cơng thức u cầu cho tích chập là: Trong k= 1,2… ,[P(n)/2] {Ck(n),Dk(n)} đại diện cho hệ số chuỗi Furie DTFS dạng sóng đặc trưng tiếng nói thời điểm n.{a 1;a2,…,aN} hệ số nội suy dự đốn tuyến tính tạo vi xử lý 270 Lưu ý a luôn (xem hình 2.1) Nghịch đảo (3.35) tồn nên: 62 Trong k=1,2,….,[P(n)/2].(3.35) (3.36) sử dụng để thêm vào loại bỏ cấu trúc đường bao phổ từ sóng đặc trưng KẾT LUẬN Sau sâu vào tìm hiểu đề tài : “Nghiên cứu phương pháp hóa tiếng nói ,nội suy dạng sóng tốc độ 4kbps” Nhờ hướng dẫn tận tình thầy giáo TS.Phạm Văn Phước em hiểu thêm cách thức tiếng nói tốc độ dạng sóng thực tế Hiện hóa tiếng nói dựa ngun lý dự đốn tuyến tính LPC với việc lượng tử hóa vecto tiến với tốc độ hóa giảm xuống nhỏ 63 TÀI LIỆU THAM KHẢO 1.Waveform Interpolation Speech Coder at kb/s_Eddie L T Choy 64 ... đề tài là: Nghiên cứu phương pháp mã hóa tiếng nói,nội suy dạng sóng tốc độ 4kbps Đề tài em giải vấn đề sau: Chương 1: Giới thiệu mã hóa tiếng nói Chương nêu tảng thơng tin mã hóa tiếng nói nêu... DẠNG SÓNG 3.1 Nền tảng nguyên tắc mã hóa nội suy dạng sóng Tính chất chu kỳ tiếng nói hữu thúc đẩy phát triển kỹ thuật mã hóa phương pháp nội suy dạng sóng Phiên trước tiên gọi nội suy dạng sóng. .. tiến mã hóa ngơn luận thuật tốn, thuật tốn phép có nhiều tính hết trước 1.2 Thành phần mã hóa tiếng nói 1.2.1 Các thành phần mã hóa tiếng nói Một khối mã hóa tiếng nói ln ln bao gồm khối mã hóa khối

Ngày đăng: 09/03/2018, 16:48

Mục lục

  • DANH MỤC CÁC HÌNH

  • CHƯƠNG I:GIỚI THIỆU

    • 1.1 Khái niệm mã hóa tiếng nói

    • 1.2 Thành phần của mã hóa tiếng nói

      • 1.2.1 Các thành phần trong bộ mã hóa tiếng nói

      • 1.2.2 Khái niệm về một Khung và khung phụ

      • 1.2.3 Yếu tố thực hiện

      • 1.3 Thành phần và thuộc tính tiếng nói

      • 1.4 Nhận thức thính giác của con người

      • MÃ HÓA TIẾNG NÓI BẰNG DỰ ĐOÁN TUYẾN TÍNH

        • 2.1 Mã hóa tiếng nói bằng dự đoán tuyến tính

        • 2.2 Xác định hệ số LP

          • 2.2.1 Phương pháp tự tương quan

          • 2.2.2 Phương pháp đồng phương sai

          • 2.3 Nội suy của các hệ số dự đoán tuyến tính

          • 2.4 Sự mở rộng của băng thông

          • 2.5 Nhấn mạnh tiếng nói

          • QUÁ TRÌNH NỘI SUY DẠNG SÓNG

          • 3.1 Nền tảng và nguyên tắc mã hóa nội suy dạng sóng

            • 3.2 Tổng quan về khối mã hóa nội suy dạng sóng

            • 3.3 Đại diện của dạng sóng đặc trưng

            • 3.4 Giai đoạn phân tích

              • 3.4.1 Phân tích dự đoán tuyến tính LP

              • 3.4.2 Ước lượng thành phần độ cao

              • 3.4.3 Nội suy thành phần độ cao

              • 3.4.4 Trích dẫn dạng sóng đặc trưng

Tài liệu cùng người dùng

Tài liệu liên quan