1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tín hiệu tiếng nói và các phương pháp mã∙ hoá

158 729 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • Mục lục

  • Lời nói đầu

  • Chương I . Tín hiệu tiếng nói

    • 1. Quá trình phát âm của con người:

    • Thính giác :

    • 2. Đặc tính thống kê của tín hiệu tiếng nói:

      • 2.1, Hàm phân bố mật độ xác suất(pdf).

      • ​ , Hàm tự tương quan(ACF).

      • ​ , Hàm mật độ phổ công suất PSD

    • 3. Các mô hình biểu diễn

      • a. Cơ quan phát âm (vocal tract)

      • b. Mô hình sự kích thích

    • Bộ m∙ hoá tiếng nói

  • Chương II . M∙ hoá vùng thời gian.

    • 1. Công nghệ PCM:

      • ​ Cấu hình cơ bản của kiểu truyền tin PCM:

      • ​ Lấy mẫu:

    • Quá trình lấy mẫu.

    • Phổ trước và sau quá trình lẫy mẫu

      • ​ Lượng tử hoá:

      • ​ Sự nén và gi∙n:

    • Các đặc tính S/NQ của các phương pháp mã hoá.

    • Bảng. ỡ =255 Mã hoá và Giải mã

      • ​ M∙ hoá và Giải m∙:

    • Mã hoá từ PCM.

    • Quá trình giải mã Phổ của tín hiệu đã lấy mẫu.

    • Quá trình giải mã và phổ.

    • 2. Các phương pháp mã hoá khác:

      • ​ phương pháp m∙ hoá DPCM ( Điều xung m∙ vi sai):

      • ​ Phương pháp DM ( điều chế delta):

      • 2.3. Điều chế Deta tự thích nghi (ADM):

      • ​ Tổng quan:

    • Sơ đồ khối bộ mã hoá và giải mã

      • ​ Nguyên lý m∙ hóa ADPCM( ADPCM encoder principles):

    • Bảng2. Đặc tính vào , ra bộ lượng tử hoá tiêu chuẩn 32 kbit/s

    • Bảng3. Đặc tính vào ra bộ lượng tử hoá tiêu chuẩn 24 kbit/s

      • 3.3. Nguyên lý giải m∙ ADPCM(ADPCM decoder principles):

  • Chương III . M∙ hoá vùng tần số

    • 1. Mã hoá dải nhỏ(Sbc).

    • 2. Mã hoá biến đổi thích nghi (ATC).

  • chương IV. Phương pháp m∙ hoá tham số nguồn

  • (resourd parameters method)

    • 1. Bộ mã hoá nguồn theo kênh:

    • 2. Bộ mã nguồn tiếng nói formant

    • 3. Bộ mã nguồn tiếng nói phổ tách.

    • 4 Phương pháp dự đoán tuyến tính LPC

      • Nguyên lý căn bản của phân tích dự đoán tuyến tính:

    • 5. Bộ mã hoá nguồn tiếng nói âm thanh được kích thích.

      • LPC kích thích đa xung (MPE-LPC)

    • Mã hoá CELP

      • A. RPE- LPT (Bộ lập m∙ và giải m∙ tiên đoán thời hạn dài kích thích xung đều đặn).

      • B. V-CELP (m∙ hoá tiên đoán kích thích xung tổng hợp):

      • C. Phương pháp LD-CELP(m∙ hoá tiên đoán kích thích xung có độ trễ

      • nhỏ).

    • 1. Tổng quan:

    • 2. Mã hoá LD-CELP

    • 3. Giải mã LD-CELP:

    • Mã hoá:

      • Hình vẽ

    • Giải mã:

      • D. Phương pháp CS-ACELP

      • 1. Giới thiệu:

      • 2. Tổng quan:

      • 3. Bộ mã hoá

      • 4. Sự trễ của các phép tính :

      • 5. Các hàm thực hiện mã hoá:

    • (pt.2)

    • Tín hiệu tiếng nói và các phương pháp m∙ hoá

    • 1(z) = A(z) + Z

    • 2(z) = A(z) -Z

    • ) (pt10)

    • (pt11)

    • Chương V. Phương pháp đánh giá:

      • I. Kiểm tra định lượng

        • 1. Tính tỉ số tín hiệu trên nhiễu(SNR):

        • 2 Chỉ số độ rõ AI (articulation index):

        • 3. Khoảng phổ Log.

      • II. Phương pháp đánh giá định tính :

        • 1. Kiểm tra độ dễ hiểu :

        • 2. Kiểm tra chất lượng:

      • Đo chất lượng tiếng nói theo cảm nhận (PSQM)

      • Các phương pháp khác

    • Kết luận

    • Mục lục

Nội dung

Tín hiệu tiếng nói phương pháp mã∙ hố Mục lục Lời nói đầu Chương I Tín hiệu tiếng nói Quá trình phát âm người: Đặc tính thống kê tín hiệu tiếng nói: 2.1, Hàm phân bố mật độ xác suất(pdf) 10 2.2, Hàm tự tương quan(ACF) 10 2.3, Hàm mật độ phổ công suất PSD 11 Các mơ hình biểu diễn 13 a Cơ quan phát âm (vocal tract) 13 b Mơ hình kích thích 14 Chương II Mã hoá vùng thời gian 18 Công nghệ PCM: 18 Cấu hình kiểu truyền tin PCM: 18 Lấy mẫu: 19 Lượng tử hoá: 21 Sự nén giãn: 22 Mã hoá Giải mã: 25 2.Các phương pháp mã hoá khác: 27 phương pháp mã hoá DPCM ( Điều xung mã vi sai): 27 Phương pháp DM ( điều chế delta): 29 2.3 Điều chế Deta tự thích nghi (ADM): 31 Phương pháp mã hố ADPCM (Điều chế xung mã vi sai thích ứng) (DAPTIVE DIFFERENTIAL PULSE CODE MODULATION ): 32 Tổng quan: 32 3.1.1 Mã hoá ADPCM(ADPCM encoder): 34 3.1.2 Giải mã ADPCM (ADPCM decoder): 34 Trường ĐHGTVT - Hà Nội Tín hiệu tiếng nói phương pháp mã∙ hố Ngun lý mã hóa ADPCM( ADPCM encoder principles): 35 Trường ĐHGTVT - Hà Nội Biến đổi định dạng đầu vào(Input PCM format conversion): 35 Tính tốn tín hiệu vi sai (Difference signal computation): 35 Bộ lượng tử tương thích (Adaptive quantizer): 35 3.2.3.1 Tốc độ 40 kbps(Operation at 40 kbit/s): 35 3.2.3.2 Tốc độ 32 kbps(Operation at 32 kbit/s): 36 3.2.3.3 Tốc độ 24kbps(Operation at 24 kbit/s): 37 3.2.3.4 Tốc độ 16 kbps(Operation at 16 kbit/s): 38 Bộ lượng tử hố tương thích ngược( Inverse adaptive quantizer): 38 Tương thích hệ số phân thang lượng tử (Quantizer scale factor adaptation): 39 Điều khiển tương thích tiếng nói(Adaptation speed control): 40 Bộ tinh tốn tín hiệu hồi phục đốn tương thích (Adaptive predictor and reconstructed signal calculator): 42 3.2.8 Bộ phát truyền tone (Tone and transition detector): 43 Nguyên lý giải mã ADPCM(ADPCM decoder principles): 43 Bộ lượng tử thích ứng đảo (Inverse adaptive quantizer): 43 3.3.2.Bộ lượng tử tương thích hệ số thang (Quantizer scale factor adaptation): 44 Điều khiển tốc độ thích ứng ( Adaptation speed control): 44 Bộ tính tín hiệu hồi phục tiến đốn tương thích (Adaptive predictor and reconstructed signal calculator): 44 Phát truyền tone (Tone and transition detector): 45 Biến đổi định dạng đầu PCM (Output PCM format conversion): 45 Điều chỉnh mã hoá đồng (Synchronous coding adjustment): 45 Chương III Mã hoá vùng tần số 46 Mã hoá dải nhỏ(Sbc) 47 Mã hố biến đổi thích nghi (ATC) 53 chương IV Phương pháp mã hoá tham số nguồn (resourd parameters method) 55 Bộ mã hoá nguồn theo kênh: 57 Bộ mã nguồn tiếng nói formant 57 Bộ mã nguồn tiếng nói phổ tách 58 Phương pháp dự đốn tuyến tính LPC 58 Bộ mã hố nguồn tiếng nói âm kích thích 64 • Mã hố CELP 65 A RPE- LPT (Bộ lập mã giải mã tiên đốn thời hạn dài kích thích xung đặn) 68 B V-CELP (mã hố tiên đốn kích thích xung tổng hợp): 70 C Phương pháp LD-CELP(mã hố tiên đốn kích thích xung có độ trễ nhỏ) 73 D Phương pháp CS-ACELP 90 Chương V Phương pháp đánh giá: 107 I Kiểm tra định lượng 109 Tính tỉ số tín hiệu nhiễu(SNR): 109 Chỉ số độ rõ AI (articulation index): 111 Khoảng phổ Log 112 II Phương pháp đánh giá định tính : 113 Kiểm tra độ dễ hiểu : 113 Kiểm tra chất lượng: 116 Kết luận 120 Mục lục 121 Tr−ờng ĐHGTVT - Hà Nội http://www.ebook.edu.vn Lời nói đầu Vào năm 1892 Alexander Graham Bell khai trương tuyến điện thoại thương mại giới gần người coi điện thoại công cụ truyền tin hữu hiệu Nhờ điện thoại mà người có khả trao đổi thông tin điểm khác toàn giới cách dễ dàng Ngoài ưu khả truyền thông tin theo thời gian thực dễ sử dụng, mạng điện thoại ngày có ưu điểm bản, phổ biến tồn cầu, giúp ta có khả liên lạc điểm trái đất, thời gian đáp ứng ngắn thuận tiện cho người sử dụng Cũng từ tín hiệu tiếng nói trở thành đối tượng nguồn tải lớn mạng viễn thông, với phát triển kỹ thuật số, cơng nghệ bán dẫn phương pháp mã hố tín hiệu tiếng nói phát triển mạnh, lý thuyết mà nhà khoa khọc đưa từ nhiều thập kỷ trước thực Đặc biệt khoảng 10 năm trở lại với phát triển mạnh mạng viễn thơng tồn cầu, mạng Internet dịch vụ viễn thơng tích hợp thoại, hình , số liệu băng tần truyền dẫn ngày trở nên hạn chế, việc phát triển cơng nghệ truyền dẫn có hiệu cao SDH,VLSI , xu hướng làm giảm băng tần truyền dẫn từ nguồn tín hiệu xem biện pháp khả thi kinh tế, hãng liên tiếp đưa cải tiến, đề xuất phương thức mã hoá MPX, Q-CELP, LD-CELP,V-CELP, SBC Việt nam lĩnh vực mẻ, nghiên cứu đặc tính tín hiệu tiếng nói phương pháp xử lý mã hố cơng việc cần thiết Trong đề tài tôt nghiệp, em giao nhiệm vụ nghiên cứu “đặc tính tín hiệu tiếng nói phương pháp mã hố” Em xin trình bày luận án tốt nghiệp với nội dung sau: • • • • Chương :Nghiên cứu trình phát âm đặc tính âm Chương :Phương pháp mã hoá vùng thời gian Chương :Phương pháp mã hoá vùng tần số Chương :Các kỹ thuật mã hoá sử dụng phổ biến cho Tr−ờng ĐHGTVT - Hà Nội http://www.ebook.edu.vn dịch vụ tiên tiến Tr−ờng ĐHGTVT - Hà Nội http://www.ebook.edu.vn • Chương :Tổng quan phương thức đánh giá phương thức mã hố tín hiệu tiếng nói Cuối em xin chân thành cảm ơn thầy cô khoa Điện Điện Tử, Trường đại học giao thông vận tải Hà nội, đặc biệt xin chân thành cảm ơn thầy giáo Tiến sỹ Trần Quốc Thịnh giúp đỡ em hồn thành đề tài Do trình độ, thời gian hạn chế đề tài khơng thể tránh khỏi thiếu sót, em mong nhận đóng góp thầy Tr−ờng ĐHGTVT - Hà Nội http://www.ebook.edu.vn Chương I Tín hiệu tiếng nói Q trình phát âm người: Q trình phát âm người mơ tả sau: áp lực tạo từ phổi làm cho quản phát rung động Lỗ giãn quản gọi môn, mơn giống nút cổ chai, khơng khí qua có áp suất thay đổi đột ngột tạo thành xung lực, ảnh hưởng mơn phóng chuỗi khơng khí bị nén đến hốc cộng hưởng âm với tần số thay đổi theo giãn nở này(do thần kinh điều khiển) Luồng khí xuyên qua hốc, phản xạ lên vật chắn (là phận giới hạn quan phát âm cơ), qua hốc cộng hưởng cuối phát môi lỗ mũi dạng sóng áp lực, gọi sóng áp lực âm tiếng nói Thanh quản bị làm cứng, nới lỏng (do thần kinh điều khiển cơ) để thay đổi tốc độ dãn Cơ quan chắn khoang mũi khoang miệng hoạt động cổng hốc âm mũi hốc âm miệng, đóng để lập hay mở để kết hợp với hốc âm miệng cách hài hoà tình khác (ví dụ hát, nói chuyện, nói thầm) ngơn ngữ khác (ví dụ tiếng Pháp thường phát nhiều âm mũi tiếng Việt) Lưỡi, quai hàm, răng, mơi thay đổi vị trí khơng gian để thay đổi hình dạng (tức thay đổi tần số cộng hưởng) hốc âm miệng, sóng áp lực âm phát từ miệng phụ thuộc vào liên kết âm phát suy hao quan phản xạ Sóng áp lực âm tồn dạng di chuyển liên tục luồng khí, đến quan thính giác phản ánh qua thông số: độ rõ, âm sắc, độ cao, độ lớn âm Cơ quan phát âm kích thích luồng khí từ phổi, nguồn kích thích tạo âm kêu khơng kêu âm kêu ứng với q trình sau: Thanh đới dao động tần số gọi “tần số bản”, hay gọi độ cao âm, trực tiếp kiểm tra cách đặt ngón tay vào cổ họng nói, có rung động sang tay âm kêu Còn âm khơng kêu ứng với q trình sau: Khi đới không dao động, tức bị “làm cứng” cơ, luồng khí phát quan phát âm bị môn chặn lại hiệu ứng chúng có hỗn loạn luồng khí qua quan Bởi thời gian xem xét sóng âm phát kết hợp âm âm vô h1 Cấu tạo quan phát âm Liên quan đến trình phát âm, ta có khái niệm formant, đặc điểm quan trọng lĩnh vực xử lý tín hiệu tiếng nói, hiểu sau: Formant tần số cổng hưởng quan phát âm, phụ thuộc vào cỡ, hình dạng toàn quan phát âm Năng lượng tần số tăng cường có phản xạ đồng thời thành phần khác, lượng thành phần tần số khác có khuynh hướng suy Trong hệ số hệ số đốn theo phương pháp trình bày , sau ta có hệ sơ ceptral, ci tính sau: c1= - a1 ci = - + i ư1 ∑ k =1 p ci= iưk iưk ak i= 2, ,p i i kc i k ak k =1 i ∑ c i= p+1, N Còn c0 lượng tín hiệu, mối tương quan khơng trễ tạo ra(tức thời điểm đó) Khi khoảng cách Log - phổ dLS tính: N 1/2 dLS = [(c0-c`0) + ∑ – c`k ) ] (ck k =1 ci c`i hệ số ceptral H1 H2 Trong phương pháp đo định lượng dùng số như: Tỉ lệ gần IJAKURA, khoảng cách Euclidean II Phương pháp đánh giá định tính : Như trình bày sau thoả mãn yêu cầu bước ta tiến hành bước kiểm tra định tính, phương pháp dựa ứng dụng thực tế,tức đem thử nghiệm Với trình lại chia thành hai giai đoạn : kiểm tra độ dễ hiểu kiểm tra chất lượng Kiểm tra độ dễ hiểu : Kiểm tra độ dễ hiểu dựa khả người nghe phân biệt phonemes với đặc tính thơng thường, sử dụng bảng cặp từ với tính chất có phonemes phụ âm, kiểm tra cách người nghe nghe từ hỏi xem từ từ cặp từ Phương pháp kiểm tra chuẩn đốn có vần DRTC (Diagrostic Rhyme Test) veal-feel bean-peen zoo-sue dune-tune meat-beat vee-beat vee-bee zee-thee weed-reed yield-weild gin-chin mitt-bit vill-bill jilt-gilt bid-did hit-fit zed-said mead-bead then-den jest-guest met-peg vast-fast mad-bad than-dan jab-gab bank-dank gat-bat need-deed sheet-cheat cheep-keep peak-teak tey-tea dint-tint nip-dip thick-tick sing-thing fin-thin gill-dill dense-tense neck-deck fence-pence chair-care pent-tent hen-wren gaff-calf nab-dab shad-chad sank-thank fad-thad shag-sag moot-boot foo-pooh juice-goose moon-noon coop-poop vole-foal moan-mone those-doze joe-go bowl-dole ghost-boast vault-fault moss-boss thong-tong jaws-gauze fought-thought browl-wall jock-chock mom-bomb von-bon jot-got wad-rod hop-fop news-dues shoes-shoose chew-choo pool-tool you-rue goat-coat note-dote though-dough sole-thole fore-thor show-so daunt-taunt gnaw-daw shaw-chaw saw-thaw bong-dong caught-taught bond-pond knock-dock vox-box chop-cop pot-tot got-dot Phương pháp có đặc tính tín hiệu tiếng nói cần kiểm tra : giọng, âm mũi, sustention, âm gió, graveness, đọng Tiến hành lập bảng cách đánh dấu với ý nghĩa: + có nghĩa từ nhận dạng từ biến thể từ trung lập Phần trăm đánh giá tính: P = R-W T % R : số câu trả lời W: số câu trả lời sai T : Tổng số từ kiểm tra Giá trị thông thường là( 75-95) % Hệ thống tốt 90% Số người kiểm tra thường , nam nữ (để đảm bảo tính khách quan cấu tạo quan phát âm nam nữ khác nhau) Ta thấy cặp vần kiểm tra khơng mang tính quy định hồn tồn xây dựng mẫu cho tiếng việt cặp vần : co-có; mang- mạng; sung – súng Phương pháp kiểm tra thay đổi âm vần MRT(Modified Rhyme Test) Dựa triết lý kiểm tra khác hai cộng hưởng (formant), phương pháp này, người nghe yêu cầu chọn từ nghe sáu từ, bảng từ kiểm tra: Phần I âm bắt đầu cộng hưởng 10 11 12 13 14 15 16 17 18 19 20 21 22 bat tab pun teach hear cut fill bun rave peage dig sing map kick sad sud came sake pass seep late pill bad tan puff tear heath cub fic bus rake peas dip sit mat king sass sum cape sale pat seen lake pick back tam pup tease heal cuff fin but race peak did sin math kid sag sub cane save pack seetthe lay pip bass tang puck teal heave cup fizz buff rate peal dim sip man kit sack sun cake sane pad seed lace pig ban tack pus team heat cud fib buck raze peat dill sick mass kin sap sup cave safe path seem lane pin bath tap pub teak heap cuss fit bug ray peach din sill map kill sat sung case same pan seek lame pit 23 duck dud dung dub dug dun 24 25 page bean pane beach pace beat pay beam pale bead pave beak Phần II âm kết thúc cộng hưởng 26 led shed 27 raw paw 28 sip rip 29 way may 30 will hill 31 book took 32 peel reel 33 dig wig 34 top hop 35 rang fang 36 hark dark 37 nest vest 38 ten pen 39 foil coil 40 kit jit 41 bust bust 42 Kick lick 43 meat feat 44 Sun nun 45 Hot got 46 fame same 47 Tent bent 48 Gale male 49 Pin sin 50 Sold told Kiểm tra chất lượng: red law tip say kill shook feel big pog gang mark west den boil fit rust sick heat gun not game went tale tin hold bed jaw dip gay till cook heel rig cop bang lark test hen oil rit hust pick seat fun pot name dent bale win fold fed thaw hip day fill hook keel pig mop sang park best then toil git pust wick beat bun lot tame rent sale din gold wed saw lip pay bill look eel fig shop hang bark rest men soil hit dust tick neat run tot game sent pale fin cold Tuân theo khuyến nghị P800 ITU-T, phương pháp sau: Sau liệt kê tham số tác động đến chất lượng m∙ hoá nguyên tắc phần phân tích khả đo so sánh chất lượng thoại m∙ hố, đo chất lượng nhờ sử dụng kỹ thuật đo khác Phương pháp điểm đánh giá trung bình MOS (MOS-Mean Opinion Score) Được mô tả Khuyến nghị P.800 ITU-T, MOS phép đo chất lượng thoại tiếng Đây phương pháp đo chất lượng mang tích chất chủ quan Có hai phương pháp trắc nghiệm: đánh giá đàm thoại đánh giáđộ nghe Trắc nghiệm xét đoán chất lượng hệ thống truyền dẫn thoại việc tiến hành đàm thoại việc nghe mẫu tiếng nói Sau người ta xếp chất lượng theo cấp độ sau đây: Thang chất lượng Điểm Thang cố gắng nghe Rất tốt Không cần cố gắng nghe Tốt Không cần cố gắng nghe đáng kể Tạm Phải cố gắng vừa phải Tồi Phải cố gắng nghe đáng kể Xấu Không hiểu nghĩa cố gắng hợp lý Sau đó, MOS tính tốn việc lấy trung bình điểm đối tượng trắc nghiệm Sử dụng cấp độ này, điểm đánh giá trung bình coinhư chất lượng đường dài Lúc đầu MOS thiết kế để đánh giá chất lượng tiêu chuẩn mã hóa khác Dưới tóm lược MOS cho thuật tốn mã hóa khác : Tiêu chuẩn mã hóa MOS PCM 4,3 (64kbit/s) ADPCM 4,1 (32kbit/s) QCELP13 4,2 (14,4kbit/s) CELP 3,7(8kbps) GSM 3,54(13kbps) QCELP 3,54(9,6kbps) CELP 3(4,8kbps) LPC 2,5(2,4kbps) MOS trắc nghiệm thích hợp nhất, sử dụng mạng thoại người tính điểm đánh giá người Tuy nhiên trắc nghiệm chủ quan kéo theo chủ thể người thời gian Do vậy, người ta ý nhiều đến việc tìm phép đo thử khách quan sử dụng để đánh giá gần với cảm nhận người chất lượng thoại • Đo chất lượng tiếng nói theo cảm nhận (PSQM) Được mô tả P.861 ITU-T, PSQM (hình 6) sử dụng mơ hình âm tâm lý học (Psychoacoustic) để tính tốn theo tốn học khác tín hiệu vào tín hiệu Sử dụng phương pháp này, tín hiệu đầu vào đầu giống nhau, điểm số PSQM khơng Sự khác lớn điểm số cao, tới mức tối đa sẽlà 6,5 Tuy nhiên, không giống số đo truyền thống khác, chẳng hạn tỷ so ỏtín hiệu tạp âm (SNR), tầm quan trọng PSQM chỗ khác tác động tới cảm nhận người chất lượng tiếng nói Một trích PSQM chỗ lúc ban đầu thiết kế để đo chất lượng tiêu chuẩn mã hóa Do vậy, khơng tính đến cách đầy đủ tác động cố truyền dẫn khác PSQM+ đề xuất vào tháng 12 năm 1997 có tính đến: - Những cảm nhận khác méo âm lượng - Tiếng nói có đoạn bị Với PSQM+, mối tương quan điểm đánh giá khách quan MOS cải thiện • Các phương pháp khác Có nhiều phép đo khách quan khác đề xuất sử dụng, bao gồm: - Các khối tiêu chuẩn hóa phép đo (MNB-Measuring Normalizing Blocks) mô tả phụ lục II P.861 - Hệ thống đo phân tích cảm nhận (PAMS-Perceptual Analysis Measurement System) hệ thống độc quyền phát triển viễn thông Anh - Đánh giá cảm nhận chất lượng thoại (PESQ-Perceptual Evalution of Speech Quality) - Một tiêu chuẩn đề xuất ITU-T xem xét Kết luận Với phát triển mạnh công nghệ chế tạo phần cứng xử lý tín hiệu số nói chung xử lý tín hiệu tiếng nói nói riêng đạt nhiều thành tựu, giúp cho thực thuật tốn tinh vi phức tạp Kết khơng thực cho thiết bị đầu cuối phức tạp mà góp phần định cho lý thuyết viễn thông vào thực tế chẳng hạn công nghệ điện thoại hệ thứ ba (3G), điện thoại IP đa dịch vụ qua vệ tinh Gần người ta ý nhiều đến việc áp dụng kỹ thuật phân tích Walets vào lĩnh vực xử lý tín hiệu số có tín hiệu thoại (các phương thức trình bày áp dụng biến đổi Furier truyền thống), có nhiều chương trình nghiên cứu quốc gia hãng lớn, tương lai không xa kỹ thuật xử lý dựa công nghệ chắn giới thiệu Việt nam lĩnh vực xử lý tín hiệu tiếng nói gần ý, tháng 7-2001 phần mềm nhận dạng tiếng việt giới thiệu viện công nghệ thông tin, phương thức phân tích tổng hợp tiếng nói formant giới thiệu tác giả Lê Hồng Minh (tạp chí bưu viễn thơng tháng 3-2002) Tuy chúng khơng phải sản phẩm mã hố tốc độ thấp kết phân tích nghiên cứu chất ngơn ngữ tiếng Việt Vì cơng tác nghiên cứu tiếng việt cần triển khai với vấn đề xây dựng đặc tính thống kê cho tiếng việt, xây dựng sổ mã chuẩn cho tiếng việt tiếp sản xuất sản phẩm mã hoá tốc độ thấp cho Việt nam Ta tự tin mà nghĩ sản phẩm mã hoá tốc độ thấp cho Việt nam đời thời gian không xa Mục lục Lời nói đầu Chương I Tín hiệu tiếng nói Quá trình phát âm người: Đặc tính thống kê tín hiệu tiếng nói: 2.1, Hàm phân bố mật độ xác suất(pdf) 10 2.2, Hàm tự tương quan(ACF) 10 2.3, Hàm mật độ phổ công suất PSD 11 Các mơ hình biểu diễn 13 a Cơ quan phát âm (vocal tract) 13 b Mơ hình kích thích 14 Chương II Mã hoá vùng thời gian 18 Công nghệ PCM: 18 Cấu hình kiểu truyền tin PCM: 18 Lấy mẫu: 19 Lượng tử hoá: 21 Sự nén giãn: 22 Mã hoá Giải mã: 25 2.Các phương pháp mã hoá khác: 27 phương pháp mã hoá DPCM ( Điều xung mã vi sai): 27 Phương pháp DM ( điều chế delta): 29 2.3 Điều chế Deta tự thích nghi (ADM): 31 Phương pháp mã hố ADPCM (Điều chế xung mã vi sai thích ứng) (DAPTIVE DIFFERENTIAL PULSE CODE MODULATION ): 32 Tổng quan: 32 3.1.1 Mã hoá ADPCM(ADPCM encoder): 34 Tr−ờng ĐHGTVT - Hà Nội 121 http://www.ebook.edu.vn 3.1.2 Giải mã ADPCM (ADPCM decoder): 34 Tr−ờng ĐHGTVT - Hà Nội 122 http://www.ebook.edu.vn Nguyên lý mã hóa ADPCM( ADPCM encoder principles): 35 Biến đổi định dạng đầu vào(Input PCM format conversion): 35 Tính tốn tín hiệu vi sai (Difference signal computation): 35 Bộ lượng tử tương thích (Adaptive quantizer): 35 3.2.3.1 Tốc độ 40 kbps(Operation at 40 kbit/s): 35 3.2.3.2 Tốc độ 32 kbps(Operation at 32 kbit/s): 36 3.2.3.3 Tốc độ 24kbps(Operation at 24 kbit/s): 37 3.2.3.4 Tốc độ 16 kbps(Operation at 16 kbit/s): 38 Bộ lượng tử hố tương thích ngược( Inverse adaptive quantizer): 38 Tương thích hệ số phân thang lượng tử (Quantizer scale factor adaptation): 39 Điều khiển tương thích tiếng nói(Adaptation speed control): 40 Bộ tinh tốn tín hiệu hồi phục đốn tương thích (Adaptive predictor and reconstructed signal calculator): 42 3.2.8 Bộ phát truyền tone (Tone and transition detector): 43 Nguyên lý giải mã ADPCM(ADPCM decoder principles): 43 Bộ lượng tử thích ứng đảo (Inverse adaptive quantizer): 43 3.3.2.Bộ lượng tử tương thích hệ số thang (Quantizer scale factor adaptation): 44 Điều khiển tốc độ thích ứng ( Adaptation speed control): 44 Bộ tính tín hiệu hồi phục tiến đốn tương thích (Adaptive predictor and reconstructed signal calculator): 44 Phát truyền tone (Tone and transition detector): 45 Biến đổi định dạng đầu PCM (Output PCM format conversion): 45 Điều chỉnh mã hoá đồng (Synchronous coding adjustment): 45 Chương III Mã hoá vùng tần số 46 Mã hoá dải nhỏ(Sbc) 47 Mã hố biến đổi thích nghi (ATC) 53 chương IV Phương pháp mã hoá tham số nguồn (resourd parameters method) 55 Bộ mã hoá nguồn theo kênh: 57 Bộ mã nguồn tiếng nói formant 57 Bộ mã nguồn tiếng nói phổ tách 58 Phương pháp dự đốn tuyến tính LPC 58 Bộ mã hố nguồn tiếng nói âm kích thích 64 • Mã hố CELP 65 A RPE- LPT (Bộ lập mã giải mã tiên đốn thời hạn dài kích thích xung đặn) 68 B V-CELP (mã hoá tiên đốn kích thích xung tổng hợp): 70 C Phương pháp LD-CELP(mã hố tiên đốn kích thích xung có độ trễ nhỏ) 73 D Phương pháp CS-ACELP 90 Chương V Phương pháp đánh giá: 107 I Kiểm tra định lượng 109 Tính tỉ số tín hiệu nhiễu(SNR): 109 Chỉ số độ rõ AI (articulation index): 111 Khoảng phổ Log 112 II Phương pháp đánh giá định tính : 113 Kiểm tra độ dễ hiểu : 113 Kiểm tra chất lượng: 116 Kết luận 120 Mục lục 121 ... mẻ, nghiên cứu đặc tính tín hiệu tiếng nói phương pháp xử lý mã hố cơng việc cần thiết Trong đề tài tôt nghiệp, em giao nhiệm vụ nghiên cứu “đặc tính tín hiệu tiếng nói phương pháp mã hố” Em xin... thường Các phương pháp tiếp cận đối tượng khác cho ta phương pháp mã hoá khác nhau, vào cách tiếp cận đối tượng ta chia phương pháp mã hố hình vẽ: Sự phân tầng mã hố tiếng nói Bộ m∙ hố tiếng nói. .. pdf tín hiệu tiếng nói lối vào cách dùng nhiều mức lượng tử vùng có xác suất cao mức lượng tử vùng có xác suất nhỏ , Hàm tự tương quan(ACF) Tính chất có ích khác tín hiệu tiếng nói phân tích tính

Ngày đăng: 09/04/2019, 17:32

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w