Kĩ thuật mã hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp

26 914 2
Kĩ thuật mã hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Kĩ thuật mã hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp

K thut mó hoỏ ting núi d oỏn tuyn tớnh phõn tớch nh tng hp Cao Tin Vit _ Lp K40VT _ Khoa in T _ Trng i hc KTCN 1 Lời nói đầu Mặc với sự phát triển của công nghệ truyền thông qua cáp quang làm cho băng thông không còn là vấn đề lớn trong giá thành của các cuộc gọi truyền thống . Tuy nhiên , băng thông trong các cuộc gọi đờng dài , các cuộc gọi quốc tế , các cuộc gọi qua vệ tinh hay các cuộc gọi di động thi cần phải duy trì băng thông ở một mức nhất định . Vì vậy việc hoá tiếng nói là rất cần thiết , giúp giảm thiểu số lợng tín hiệu cần truyền trên đờng truyền nhng vẫn đảm bảo chất lợng cuộc gọi . Vì vậy , mục đích của đề tài là nghiên cứu một trong các thuật hoá tiếng nói hiện đang đợc sử dụng chủ yếu là thuật hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp . Sau một thời gian đợc sự hớng dẫn tận tình của cô: Đoàn Thanh Hải bộ môn Điện tử Viễn thông, đồng thời vận dụng những kiến thức đã học ở lớp , thông qua bạn bè và tài liệu tham khảo đến nay đề tài này đã hoàn thành. Do vấn đề nghiên cứu còn rộng và bản thân còn nhiều hạn chế nên trong đề tài không tránh khỏi những thiếu sót hoặc thiếu chính xác. Rất mong nhận đợc sự đóng góp của các thầy giáo, cô giáo và các bạn để đề tài thực sự có chất lợng hơn. Chúng em rất cảm ơn tới cô: Đoàn Thanh Hải bộ môn Điện tử viễn thông, đã giảng dạy và hớng dẫn chúng em hoàn thành đề tài này. Sinh viên thực hiện Cao Tiến Việt K thut mó hoỏ ting núi d oỏn tuyn tớnh phõn tớch nh tng hp Cao Tin Vit _ Lp K40VT _ Khoa in T _ Trng i hc KTCN 2 Ni dung 1. Gii thiu v õm thanh, ting núi v c im 1.1 c im vt lý ca õm thanh 1.2 c im õm hc ca õm thanh , ting núi 1.3 Phõn loi n gin dng súng ting núi 2. Cỏc đặc trng ca tớn hiu ting núi. 2.1. Dng súng tớn hiu ting núi. 2.2. Phõn b biờn khụng ng u. 2.3. Tng quan gia cỏc phn t ri r c. 2.4. Tớnh tun hon ca tớn hiu ting núi. 2.5. Tớnh khụng hu hiu ca tớn hiu ting núi. 2.6. Ph trung bỡnh ca tớn hiu ting núi. 2.7. Ph thc thi ca tớn hiu ting núi. 3. Kờnh thoi v cỏc phng phỏp mó hoỏ ting núi. 4. Thụng tin bng ting núi. 4.1. Mụ hỡnh quỏ trỡnh to ting núi 4.2. Mụ hỡnh húa b mỏy phỏt thanh ca con ngi 4.3. Mụ hỡnh tng quỏt ca mó hoỏ ting núi theo phng phỏp phõn tớch bng tng hp. 4.4. Nguyờn lý chung ca b mó hoỏ CELP( Code Excited Linear Prediction) 5. Kt lun K thut mó hoỏ ting núi d oỏn tuyn tớnh phõn tớch nh tng hp Cao Tin Vit _ Lp K40VT _ Khoa in T _ Trng i hc KTCN 3 1. Gii thiu v õm thanh, ting núi v c im 1.1.1 c im vt lý ca õm thanh Bn cht õm thanh ting núi l súng c hc nờn nú cú cỏc tớnh cht c bn ca súng c hc. nhận dạng tiếng nóiSản xuất tiếng nói Tạo thông điệp ngôn ngữ Các lệnh thần kinh vận động ống dẫn âm Dây thanh Hiểu thông điệp ngôn ngữ Qúa trình thần kinh Tai trong sóng âm thanh Ngời nói ngời nghe Hỡnh 1.1 S biu din quỏ trỡnh sn xut v thu nhn ting núi ca con ngi Hỡnh 1.1 a ra mt s khi ca quỏ trỡnh sn xut ting núi/nhn thc ting núi ca con ngi. Quỏ trỡnh sn xut ting núi bt u khi ngi núi to ra mt thụng ip (trong ý ngh ca anh ta) v mun chuyn ti nú cho ngi nghe thụng qua ting núi. T chc thn kinh tng ng ch u trỏch nhim to ra thụng ip di dng vn bn biu din cỏc t ca thụng ip. Bc tip theo ca quỏ trỡnh l chuyn i thụng ip sang dng mt mó ngụn ng. iu ny gn nh tng ng vi vic chuyn i cỏc biu din vn bn ca thụng ip thnh mt chui cỏc õm v tng ng vi nhng õm thanh t o nờn cỏc t; ng thi vi vic ghi nhn õm iu nhm xỏc nh s kộo di, s nhn mnh, v trng õm cao thp ca õm thanh. Khi mt mó ngụn ng ó c la chn, ngi núi phi thc hin mt lot cỏc lnh thn kinh vn ng lm cho cỏc dõy thanh dao ng, ng thi cu trỳc hỡnh dng ng dn õm nhm phỏt ra mt chui cỏc õm thuật hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp Cao Tiến Việt _ Lớp K40ĐVT _ Khoa Điện Tử _ Trường Đại học KTCN 4 thanh. Như vậy, đầu ra cuối cùng của quá trình là một tín hiệu âm học. Các lệnh thần kinh vận động phải điều khiển một cách đồng bộ tất cả các khâu vận động như sự hoạt động của môi, hàm, lưỡi . Khi tín hiệu tiếng nói đã được sinh ra và được truyền cho người nghe, quá trình thu nhận tiếng nói bắt đầu. Đầu tiên, người nghe xử lý tín hiệu âm thanh thông qua màng nền của tai trong; nó có khả nă ng cung cấp một phân tích phổ cho tín hiệu tới. Một quá trình xử lý thần kinh chuyển đổi tín hiệu phổ tại đầu ra của màng nền thành các tín hiệu hoạt động đối với thần kinh thính giác; có thể coi đây như một quá trình lấy ra các đặc trưng. Bằng một phương pháp đặc biệt (chưa được hiểu một cách thấu đáo), các tín hiệu hoạt động đi qua hệ thần kinh thính giác được chuyể n đổi thành một ngôn ngữ cho những trung tâm xử lý cao cấp hơn bên trong bộ não; và cuối cùng là việc hiểu được nội dung thông điệp. Qua đó ta thấy tín hiệu âm thanh tiếng nói là tín hiệu ngẫu nhiên không dừng, tuy nhiên những đặc tính của nó là tương đối ổn định khi xét trong một khoảng thời gian ngắn(vài chục mili giây). Trong khoảng thời gian đó tín hiệu gần như tuần hoàn. Âm thanh tiếng nói con người có các đặc tính vật lý sau đây: • Độ cao(Pitch) Độ cao hay độ trầm bổng của âm thanh chính là tần số của sóng cơ học của âm thanh. Âm thanh nào cũng phát ra ở một độ cao nhất định. Độ cao của âm thanh phụ thuộc vào tần số dao động. Đối với tiếng nói, tần số dao động của dây thanh quy định độ cao giọng nói của con người. Mỗi người có một độ cao giọng nói khác nhau, độ cao của nữ giới thường cao hơn nam giới và độ cao của trẻ em thường cao hơn của người lớn. • Cường độ Cường độ chính là độ to nhỏ của âm thanh. Cường độ càng lớn thì âm thanh có thể truyền đi được càng xa. Xét trên phương diện sóng cơ học thì cường thuật hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp Cao Tiến Việt _ Lớp K40ĐVT _ Khoa Điện Tử _ Trường Đại học KTCN 5 độ chính là biên độ của dao động sóng âm, nó quyết định năng lượng của sóng âm. Trong tiếng nói cường độ của nguyên âm phát ra thường lớn hơn của phụ âm. Do vậy chúng ta thường dễ phát hiện ra nguyên âm hơn là phụ âm. Đối với tai người, giá trị tuyệt đối của cường độ âm I thường không quan trọng người ta quan tâm giá trị tỷ số của I so với một giá trị chuẩn I 0 nào đó, đó chính là mức cường độ âm và được tính như sau: L(B) = lg(I/I 0 ) • Trường độ Trường độ hay độ dài của âm phụ thuộc vào sự chấn động lâu hay nhanh của các phần tử không khí. Cùng một âm nhưng trong các từ khác nhau thì độ dài khác nhau. • Âm sắc Âm sắc là bản sắc, sắc thái riêng của âm. Cùng một nội dung, độ cao nhưng khi nói mỗi người có một âm vị khác nhau. 1.1.2 Đặc tính âm học của âm thanh, tiếng nói Tín hiệu tiếng nói là tín hiệu tương tự, biểu diễn cho thông tin v ề mặt ngôn ngữ và được thể hiện bằng các âm vị khác nhau. Số lượng các âm vị tuỳ thuộc vào từng ngôn ngữ, vào khoảng 20 đến 30 và không vượt quá 50. Đối với từng loại âm vị nó có đặc tính âm thanh khác nhau. Các âm vị được chia thành hai loại là nguyên âm và phụ âm. Tổ hợp các âm vị tạo nên âm tiết. Âm tiết đóng vai trò một từ chọn vẹn mang ngữ nghĩa. • Nguyên âm Các nguyên âm có thể được coi là lớp thú vị nhấ t trong các lớp âm thanh tiếng nói, đặc biệt đối với Tiếng Anh. Tầm quan trọng của chúng trong lĩnh vực nhận dạng tiếng nói là rất lớn; hầu hết các hệ thống nhận dạng dựa trên cơ sở nhận dạng nguyên âm đều có tính năng tốt. thuật hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp Cao Tiến Việt _ Lớp K40ĐVT _ Khoa Điện Tử _ Trường Đại học KTCN 6 Trong khi nói, nguyên âm được tạo ra bằng cách kích thích một ống dẫn âm thanh có hình dạng cố định bằng các xung áp lực khí giả tuần hoàn do sự rung động của dây thanh sinh ra. Hình dạng của từng vùng cục bộ dọc theo ống dẫn âm xác định các tần số cộng hưởng (các formants) và âm thanh sẽ được tạo ra. Việc tạo ra nguyên âm cụ thể nào là được quyết định bởi vị trí của lưỡi, hàm, môi . Các nguyên âm nói chung là có thời gian tồn tại dài (so với các ph ụ âm) và dễ xác định phổ. Chính vì thế sẽ dễ dàng cho việc nhận dạng, cả đối với con người và máy móc. Có một số cách biểu diễn đặc trưng nguyên âm, bao gồm cấu hình khoang miệng, các đồ thị dạng sóng tín hiệu và các đồ thị phổ. ở đây chúng ta chỉ quan tâm tới dạng biểu diễn đồ thị phổ. Về mặt lý thuyết, các cực đại của biểu diễn phổ của tín hiệu nguyên âm chính là các tần số cộng hưởng (formants) tạo nên nguyên âm. Giá trị của các các formant đầu tiên (2 hoặc 3 formants đầu tiên) là yếu tố quyết định cho phép chúng ta nhận dạng được nguyên âm. Do nhiều yếu tố biến thiên như sự khác nhau về giới tính, về độ tuổi, tình trạng tinh thần của người nói và nhiều yếu tố ngoại cảnh khác, đối với một nguyên âm xác định các giá trị formant cũng có một sự biến thiên nhất định. Tuy nhiên sự khác biệt về giá trị các fornants giữa các nguyên âm khác nhau lớn hơn nhiều; và trong không gian formant chúng ta có thể xác định một cách tương đối các vùng riêng biệt cho từng nguyên âm. Hình 1.2 minh họa một đồ thị kinh điển của các giá trị formant đầu tiên và thứ hai của 10 nguyên âm cùng với sự phân vùng cho các nguyên âm. ở đây chúng ta cũng thấy có những sự nhập nhằng trong phát âm thể hiện ở một số chỗ chồng chéo lên nhau giữa các vùng. thuật hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp Cao Tiến Việt _ Lớp K40ĐVT _ Khoa Điện Tử _ Trường Đại học KTCN 7 i I ε ae ε Λ a c u U 0 200 400 600 800 1000 1200 1400 1000 1500 2000 2500 3000 3500 4000 F 1 (Hz) F 2 (H Z ) Hình 1.2 Đồ thị theo các formant F1, F2 cho 10 nguyên âm được thực hiện với nhiều đối tượng người nói khác nhau • Phụ âm Phụ âm được tạo ra bởi các dòng khí hỗn loạn được phát ra gần những điểm co thắt của đường dẫn âm thanh do cách phát âm tạo thành. Dòng không khí tại chỗ đóng của vòm miệng tạo ra phụ âm bật. Những phụ ân xát được tạo ra từ chỗ co thắt lớn nhất và các âm tắc xát được t ạo ra từ khoảng giữa. Phụ âm có đặc tính hữu thanh và vô thanh tuỳ thuộc vào dây thanh có dao động để trở thành cộng hưởng hay không. Đặc tính của phụ âm tuỳ thuộc vào tính chu kỳ của dạng sóng, phổ tần số, thời gian tồn tại và sự chuyển dẫn âm. • Tỷ suất thời gian Trong khi nói chuyện, các khoảng nói chuyện và khoảng nghỉ xen kẽ nhau. Phần trăm thời gian nói trên tổng thời gian nói và nghỉ đượ c gọi là tỷ suất thời gian. Giá trị này biến đổi tuỳ thuộc vào tốc độ nói và từ đó ta có thể phân loại thành nói nhanh, nói chậm hay trung bình. • Hàm năng lượng thời gian ngắn Hàm năng lượng thời gian ngắn được tính bằng cách chia tín hiệu tiếng nói thành nhiều khung có chứa N mẫu và tính diện tích trung bình của tổng các thuật hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp Cao Tiến Việt _ Lớp K40ĐVT _ Khoa Điện Tử _ Trường Đại học KTCN 8 mẫu tín hiệu trong mỗi khung. Các khung này được đưa qua một cửa sổ có dạng như sau: ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ≠ ≤≤ = n NnnW nW 0 0)( )( Thông thường có ba dạng cửa sổ được sử dụng, đó là cửa sổ chữ nhật, cửa sổ Hanning và Hamming. Hàm năng lượng thời gian ngắn được tính như sau: {} ∑ − = += 1 0 2 )(*)( N n m nWmnxE Hàm năng lượng thời gian ngắn cho âm hữu thanh thường lớn hơn âm vô thanh. • Tần số vượt điểm không Tần xuất vượt qua điểm không là số lần biên độ tín hiệu tiếng nói vượt qua giá trị không trong một khoảng thời gian cho trước. Thông thường giá trị này đối với âm vô thanh lớn hơn âm hữu thanh do đặc tính ngẫu nhiên của âm vô thanh. Do đó tần suất vượt qua điể m không là tham số quan trọng để phân loại âm vô thanh và âm hữu thanh. • Phát hiện điểm cuối Trong sử lý tín hiệu tiếng nói, việc xác định khi nào bắt đầu và kết thúc quá trình nói là một công việc hết sức quan trọng. Trong một môi trường có nhiều tiếng ồn và môi trường có nhiều người nói thì việc phát hiện điểm cuối là hết sức khó khăn. Đã có một số phương pháp để phát hiện điểm cu ối của tiếng nói. • Tần số cơ bản Dạng sóng của tiếng nói bao gồm hai phần: Phần giống nhiễu trong đó biên độ thay đổi ngẫu nhiên và phần tuần hoàn. Phần tín hiệu có tính chất chu kỳ thuật hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp Cao Tiến Việt _ Lớp K40ĐVT _ Khoa Điện Tử _ Trường Đại học KTCN 9 có chứa các thành phần tần số có dạng điều hoà. Tần số thấp nhất là tần số cơ bản và chính là tần số dao động của dây thanh. Đối với những người nói khác nhau thì tần số cơ bản cũng khác nhau và tần số cơ bản của trẻ em thường cao hơn của người lớn và của nữ giới thì cao hơn của nam giới. Bảng 1: Một số giá tr ị của tần số cơ bản ứng với giới tính và tuổi Người nói Giá trị tần số cơ bản Nam 80-200 Nữ 150-450 Trẻ em 200-600 Đối với hai âm có cùng cường độ, cùng độ cao sẽ được phân biệt bởi tính tuần hoàn. Một âm hữu thanh có tín hiệu gần như tuần hoàn, khi được phân tích phổ sẽ xuất hiện một vạch tại vùng tần số rất thấp. Vạch này đặc trưng cho tính tuần hoàn cơ bản hay đó chính là tần số cơ bản của âm. trong khi giao tiếp bình thường tần số cơ bản thay đổi liên tục t ạo nên ngữ điệu cho tiếng nói. • Formant Trong phổ tần số của tín hiệu tiếng nói, mỗi đỉnh có biên dộ cao nhất xét trong một khoảng nào đó(còn được gọi là cực trị địa phương) xác định một formant. Ngoài tần số, formant còn được xác định bởi biên độ và dải thông của chúng. Về mặt vật lý, các tần số formant tương ứng với các tần số cộng hưởng củ a tuyến âm. trong xử lý tiếng nói, để mô phỏng lại tuyến âm người ta phải xác định được tham số formant đối với từng loại âm vị. Do đó việc đánh giá và ước tính formant là rất quan trọng. Tần số formant biến đổi trong một khoảng rộng phụ thuộc vào giới tính của người nói và phụ thuộc vào âm vị tương ứng với formant đó. Đồng thời formant còn phụ thuộc vào âm vị trước và sau đó. Về cấu trúc tự nhiên, tần số formant có liên hệ chặt chẽ với hình dạng và kích thước của tuyến âm , thông thường trong phổ tần số của tín hiệu có khoảng 6 formant, nhưng chỉ có 3 thuật hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp Cao Tiến Việt _ Lớp K40ĐVT _ Khoa Điện Tử _ Trường Đại học KTCN 10 formant đầu tiên là ảnh hưởng quan trọng đến đặc tính âm vị. Các formant có giá trị trong khoảng từ vài trăm đến vài nghìn Hz. Tần số formant đặc trưng cho các nguyên âm biến đổi tuỳ thuộc vào người nói trong điều kiện phát âm nhất định. Mặc phạm vi của các tần số formant tương ứng với mỗi nguyên âm có thể trùng lên nhau, nhưng vị trí giữa formant là không đổi và sự xê dịch các formant là song song. Ngoài formant, các âm mũi còn có các tần số bị suy giảm g ọi là phản formant (anti-formant). Phản formant được tạo nên khi luồng khí đi qua khoang mũi. Các formant tương ứng với các điểm cực của hàm truyền đạt vì tại lân cận các điểm cực trị giá trị của hàm truyền đạt là rất lớn, tương tự các phản formant tương ứng với các điểm không của hàm truyền đạt. 1.1.3 Phân loại đơn giản dạng sóng tiếng nói Tiếng nói của con ngườ i tạo ra bao gồm hai thành phần: • Phần gần tuần hoàn hầu như lặp lại cùng chu kỳ được gọi là tiếng nói hữu thanh. Chu kỳ lặp lại đó gọi là chu kỳ cơ bản T 0 , nghịch đảo của T 0 chính là F 0 . Âm hữu thanh được phát ra bởi một luồng khí cực mạnh từ thanh môn thổi qua dây thanh làn rung dây thanh, sự dao động của dây thanh tạo nên nguồn tuần hoàn. Nguồn tuần hoàn kích thích tuyến âm tạo nên âm hữu thanh. Vùng âm hữu thanh chiếm thành phần chủ yếu của sóng tiếng nói, chứa đựng lượng tin nhiều nhất và thời gian lớn nhất trong quá trình nói. Phần tín hiệu có dạng gần giống như tạp âm nhiễu có biên độ ngẫu nhiên gọi là âm vô thanh . Tiếng nói vô thanh được tạo ra do sự co thắt theo một dạng nào đó của tuyến âm và luồng khí chạy qua chỗ thắt với tốc độ lớn tạo nên nhiễu loạn, ví dụ như khi ta nói thì thào. Năng lượng của nguồn nhiễu loạn tạo nên sẽ kích thích tuyến âm tạo nên âm vô thanh, năng lượng của tiếng nói vô thanh nhỏ hơn so với năng lượng của tiếng nói hữu thanh. Ta có thể phát hiện ra tiếng nói hữu thanh là khi dây thanh rung còn âm vô thanh khi nói dây thanh không rung. Khi nói thì thào thì ở xa không nghe thấy được vì đó là âm vô thanh. [...]... c(n)*h(n) là phản ứng trạng thái không của bộ lọc tổng hợp đã tính trọng số với từ c(n) đợc lựa chọn từ bảng thích ứng Sai số đã tính trọng số giữa tiếngtổng hợptiếng nói gốc đợc cho bởi: e- (n) = s (n) s * (n) Trong đó: s*(n) : Tín hiệu tiếng nói tổng hợp s(n) : Tín hiệu tiếng nói gốc ew(n) : Tín hiệu sai số Sau đó sai số này sẽ đợc cực tiểu hoá bằng phơng pháp sai lệch bình phơng trung... tính đến trọng số thụ cảm, giữa tiếng nói gốc và tiếng nói tổng hợp Việc đa ra mô hình này đã gây chú ý và đó là mô hình đầu tiên của một thế hệ mới của các bộ điều chế tiếng nói phân tích bằng tổng hợp (Analisis-by-synthesis) Chúng có khả năng cho tiếng nói chất lợng cao tại tốc độ quang 10kbps và có thể tới tận 4,8 kbps Tín hiệu kích thích sẽ đợc tối u hóa một cách kỹ lỡng và ngời ta sử dụng kỹ thuật. .. bảng thích ứng ( bao gồm có tăng ích và độ trễ lên giọng) thì tiếngtổng hợp đã tính trọng số s*(n) đợc cho là : s * (n) = ck (n) * h(n) + Gy (n) + s0 * (n) Trong đó : Tích chập là không nhớ ck(n) là từ kích thích với chỉ số k là hệ số tỷ lệ h(n) là phản ứng xung của bộ lọc tổng hợp đã tính trọng số W(z) s0*(n) là phản ứng lối vào của bộ lọc tổng hợp đã tính trọng số G là tăng ích của bảng mã. .. dạng sóng đơn giản nhất là điều chế xung (PCM), điều chế Delta (DM) Tuy nhiờn, nhợc điểm của bộ hóa dạng sóng là không tạo đợc tiếng nói chất lợng cao ti tốc độ dới 16 kbit/s Bộ hóa nguồn khắc phục đợc nhợc điểm này Nguyên lý của hóa nguồn là hóa kiểu phát âm (vocoder), ví dụ nh bộ hóa bằng dự đoán tuyến tính (Linear Prediction Coding-PLC) Các bộ hóa này có thể thực hiện đợc tại tốc... nhiờn ngi ta s chn c tớn hiu kớch thớch ca mt khung ting núi di N mu Bộ lọc tổng hợp đã tính trọng số đợc cho bởi : P w( z ) = 1 / A( z / ) = 1 /(1 (ak k z k ) k =1 Trong đó : là một phân số từ 0 đến 1 {ak} là các tham số bộ lọc tổng hợp LPC hay còn gọi là hệ số dự đoán P là bậc của bộ lọc tổng hợpLPC hay bậc của bộ dự đoán Cao Tin Vit _ Lp K40VT _ Khoa in T _ Trng i hc KTCN 24 K thut mó hoỏ ting... phõn tớch nh tng hp 4.3 Mụ hỡnh tng quỏt ca mó hoỏ ting núi theo phng phỏp phõn tớch bng tng hp Tiếng nói gốc a/ B mó hoỏ Bộ tạo tín hiệu kích thích u(n) Bộ lọc tổng hợp S*(n) e(n) Tính trọng ew (n) số sai số Cực tiểu hoá sai số b/ Bộ Giải Bộ tạo tín hiệu kích thích Bộ lọc tổng hợp S* (n) Tiéng nói tông hợp Hỡnh 1.12 Mụ hỡnh mó hoỏ ting núi LPC phõn tớch bng tng hp Cú ba loi thut toỏn mó hoỏ thoi... hp phát, bộ hóa sẽ nhận các tín hiệu nói tơng tự liên tục và chuyển thành tín hiệu số trớc khi truyền đi Tại phía thu sẽ làm nhiệm vụ ngợc lại để khôi phục tín hiệu tiếng nói Khi không có lỗi truyền dẫn thì dạng sóng của tiếng nói khôi phục rất giống với dạng sóng của tiếng nói gốc Ưu điểm của loại hóa này là: độ phức tạp, giá thành thiết kế, độ trễ và công suất tiêu thụ thấp Bộ hóa dạng sóng... (Linear Prediction Coding-PLC) Các bộ hóa này có thể thực hiện đợc tại tốc độ bit > 2kbps Hạn chế chủ yếu của hóa kiểu phát âm PLC là việc mô phỏng ngun kích thích còn đơn giản nên tiếng nói tái tạo đợc là tiếng nói dạng tổng hợp, chất lợng không cao và khó có thể nhận ra giọng ngời nói chuyện S cn thit phi to c ting núi cht lng chuụng ti cỏc tc bit thp di 10kb/s cho cỏc ng dng trờn cỏc kờnh... hp CELP c a ra trong hỡnh 1.14 Cao Tin Vit _ Lp K40VT _ Khoa in T _ Trng i hc KTCN 23 K thut mó hoỏ ting núi d oỏn tuyn tớnh phõn tớch nh tng hp Bảng thích ứng Khuếch đại u(n) Bộ lọc tổng hơp S*(n) Tiếng nói tổng hợp Trễ khung con Khuếch đại Bảng ngẫu nhiên Hỡnh1.14 S nguyờn lý ca phng phỏp tng hp CELP Ti phớa phỏt v thu cú mt bng mó kớch thớch khỏc nhau Sau khi phõn tớch phn phỏt b tham s... dng 3 Kờnh thoi v Các phơng pháp mã hóa tiếng nói Trong mng in thoi thụng thng tớn hiu ting núi c mó hoỏ PCM theo lut A hoc lut vi tc 64kbs.Vi cỏch mó hoỏ ny, sn phm phỏt thanh cu con ngi c em i mó hoỏ v cho phộp khụi phc mt cỏch tng i trung thc cỏc õm thanh trong gii tn ting núi Nguyên lý của hóa dạng sóng là tìm cách số hóa dạng sóng của tiếng nói theo cách thích hợp Tại phía Cao Tin Vit _ Lp K40VT . một trong các kĩ thuật mã hoá tiếng nói hiện đang đợc sử dụng chủ yếu là kĩ thuật mã hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng hợp . Sau một. thuộc tính phân tích Tần số-thời gian làm cho chúng phù hợp với mã tín hiệu tiếng nói. Kĩ thuật mã hoá tiếng nói dự đoán tuyến tính phân tích nhờ tổng

Ngày đăng: 25/04/2013, 14:11

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan