1. Trang chủ
  2. » Luận Văn - Báo Cáo

Mã hóa và giải mã tín hiệu tiếng nói trong mạng điện thoại ố định và di động

98 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Mã Hóa Và Giải Mã Tín Hiệu Tiếng Nói Trong Mạng Điện Thoại Cố Định Và Di Động
Tác giả Phan Quốc Thắng
Người hướng dẫn PGS.TS. Trịnh Văn Loan
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Mạng Máy Tính Và Truyền Thông Dữ Liệu
Thể loại luận văn thạc sĩ kỹ thuật
Năm xuất bản 2018
Thành phố Hà Nội
Định dạng
Số trang 98
Dung lượng 3,59 MB

Cấu trúc

  • 1.1 Tín hi u ti ng nói ......................................................................................................... 9 ệ ế (0)
  • 1.2 Quá trình x lý ti ng nói trong h ử ế ệ thố ng truy n thông .............................................. 11 ề (13)
  • 1.3 Gi i thi u v các d ng mã hóa ti ng nói .................................................................... 12 ớ ệ ề ạ ế CHƯƠNG II MÃ HÓA VÀ GIẢ I MÃ TI NG NÓI TRONG MẠNG ĐIỆẾ N THO I C NH . ẠỐ ĐỊ 17 (0)
  • 2.1 Mã hóa d ng sóng PCM ............................................................................................. 17 ạ (19)
  • 2.2 Nén và gi i nén lu t A/Mu trong PCM ...................................................................... 28 ả ậ (0)
  • 2.3 Đánh giá tín hiệu PCM (33)
  • CHƯƠNG III MÃ HÓA VÀ GI I MÃ TIẾNG NÓI TRONG M Ả ẠNG ĐIỆ N THO ẠI DI ĐỘNG 32 (0)
    • 3.1 Phương pháp mã hóa và giả i mã ti ng nói trong m ế ạng di độ ng (34)
    • 3.2 Nguyên lý b mã hóa và gi i mã RPE-LTP ............................................................... 34 ộ ả (36)
      • 3.2.1 Nguyên lý b mã hóa RPE-LTP .......................................................................... 38 ộ (40)
      • 3.2.2 Nguyên lý b ộ giả i mã RPE-LTP (42)
      • 3.2.3 Các dãy thông s quan tr ng c a b mã RPE-LTP ............................................. 40 ố ọ ủ ộ (0)
    • 3.3 Chi ti t ch ế ức năng bộ mã hóa và gi i mã ti ng nói RPE-LTP ................................... 42 ả ế (44)
      • 3.3.1 Chi ti t các ch ế ức năng củ a b mã hóa RPE- ộ LTP (0)
      • 3.3.2 Chi ti t các ch ế ức năng củ a b ộ giả i mã RPE- LTP (0)
  • CHƯƠNG IV XÂY D ỰNG CHƯƠNG TRÌNH MÔ PHỎ NG (61)
    • 4.1 Mô ph ng mã hóa và gi i mã ti ng nói trong m ỏ ả ế ạng điệ n tho i c nh ..................... 59 ạ ố đị (61)
    • 4.2 Mô ph ng mã hóa và gi i mã ti ng nói trong m ỏ ả ế ạng điệ n tho ại di độ ng (65)
      • 4.2.1 Th c hi n tính toán b mã hóa RPE LTP ......................................................... 66 ự ệ ộ – (68)
      • 4.2.2 Th c hi n tính toán b ự ệ ộ giả i mã RPE LTP (85)
      • 4.2.3 Các b ảng đượ c dùng trong quá trình tính toán (89)
      • 4.2.4 K t qu ế ả chương trình mô phỏ ng mã RPE- LTP (91)

Nội dung

Trang 1 PHAN QUỐC THẮNGBỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI --- Phan Quốc Thắng MẠNG MÁY TÍNH VÀTRUYỀN THƠNG DỮ LIỆUMÃ HÓA VÀ GIẢI MÃ TÍN HIỆU TIẾNG NÓI TRONG MẠNG ĐIỆN

Quá trình x lý ti ng nói trong h ử ế ệ thố ng truy n thông 11 ề

Mô hình h ệ thống truy n thông s ề ố

Việc phân tích và thi t k m t h th ng truy n thông s ế ế ộ ệ ố ề ố liên quan đến vi c truyền ệ tải thông tin ở ạ d ng s t ngu n t o thông tin t i mố ừ ồ ạ ớ ột hoặc nhiều điểm đến

Trong một hệ thống truyền thông số, thông điệp được phát từ nguồn sẽ được chuyển đổi thành một dãy nhị phân, loại bỏ các bit dư thừa không cần thiết, nhằm giảm băng thông truyền dẫn Quá trình chuyển đổi tín hiệu nguồn thành dãy nhị phân này được gọi là mã hóa nguồn và nén dữ liệu.

Hình 1.2 Quá trình x ửlý tiếng nói trong h th ng truy n thông ệ ố ề

Chuỗi dãy s nh phân t b mã hóa ngu n ố ị ừ ộ ồ là thông tin được truyền qua mã hóa kênh, quá trình này liên quan đến việc chèn thêm các bit dư vào chuỗi ký tự theo một quy luật nhất định Mục đích của mã hóa kênh là bảo vệ dòng tín hiệu khỏi các nhiễu từ nhiều kênh thông tin khác Các bit thêm vào sẽ được bên thu sử dụng để phát hiện và sửa lỗi trên kênh truyền, từ đó tăng cường độ tin cậy của tín hiệu nhận được.

Chuỗi nh phân t b ị ừ ộ mã hóa kênh là giao diện c a kênh truy n thông, giúp chuy n t i b ể ớ ộ điều ch sế ố Nó gủ ề ở ần như tấ ảt c các kênh truy n thông ề g p trong th c th có kh ặ ự ế ả năng truyền tín hiệu điện (d ng sóng) Mạ ục đích chính của điều ch s gán thông tin nhế ốlà ị phân vào m t t i tin đ truyộ ả ể ền đi.

Kênh truyền thông là môi trường vật lý dùng để truyền tín hiệu từ máy phát đến máy thu Trong truyền dẫn không dây, kênh thường là không khí, trong khi đó, các kênh điện thoại thường sử dụng nhiều phương tiện vật lý khác nhau, bao gồm dây đồng, cáp quang và công nghệ không dây.

Phương tiện vật lý sử dụng để truyền dẫn thông tin có thể bị ảnh hưởng bởi nhiều yếu tố, như tạp âm, nhiễu điện từ và tiếng ồn do con người tạo ra Ở đầu cuối của hệ thống truyền thông, bộ giải mã chịu trách nhiệm tách biệt tín hiệu thông tin ra khỏi sóng mang cao tần Dữ liệu này sau đó được chuyển đến bộ giải mã kênh, nơi tái tạo lại dãy thông tin ban đầu từ các mã bit được thêm vào trong quá trình mã hóa kênh.

Bí quyết mã hóa tín hiệu bao gồm việc sử dụng mã hóa kênh và mã hóa nguồn để tái tạo lại tín hiệu ban đầu Khi áp dụng mã hóa kênh và mã hóa nguồn một cách hiệu quả, tín hiệu đầu ra có thể được giải mã để phục hồi chính xác tín hiệu gốc.

- Thuật toán mã hóa nguồn đóng vai trò quan tr ng trong t l mã hóa cao hay ọ ỉ ệ thấp

- B mã hóa kênh thêm vào s ộ ự dư thừa trong d u ữ liệ

- Điều ch ế đóng vai trò quan trọng trong quyết định t l d u và kh ỉ ệ ữ liệ ả năng hạn chế ỗ l i gây ra b i kênh truy n ở ề

1.3 Giớ i thi u v các d ng mã hóa ti ng nói ệ ề ạ ế

Mã hóa và giải mã tín hiệu âm thanh nhằm giảm thiểu băng thông truyền tải và không gian lưu trữ, từ đó tiết kiệm chi phí Có ba kỹ thuật nén tiếng nói cơ bản: mã hóa dựa trên sóng (waveform-based), mã hóa tham số (parametric-based) và mã hóa lai (hybrid coding).

Các b mã hóa ti ng nói có s khác nhau tộ ế ự ở ốc độ bit, độ ph c tứ ạp, độ trễ và chất lượng c m nh n c a ti ng nói sau khi tái t o ả ậ ủ ế ạ

Mã hóa dạng sóng được th c hi n tự ệ ở ốc độ bit cao và cho chất lượng ti ng nói t t ế ố

Mã hóa tham s ố thực hi n tệ ở ốc độ bit th p, t o ra ti ng nói v i chấ ạ ế ớ ất lượng nhân t o ạ

Mã hóa lai kết hợp giữa phương pháp mã hóa dạng sóng và mã hóa tham số, mang lại chất lượng tín hiệu tốt hơn và hiệu suất xử lý cao hơn trong truyền tải dữ liệu.

Chất lư ng ti ng nói đư c đợ ế ợ ịnh lượng b ng thông s MOS (Mean Opinion Score) ằ ố

Hình 1.3 Quan h chệ ất lư ngợ và tốc đ các phương pháp mã hóa tiếng nóiộ [6]

Mã hóa dòng sóng là kỹ thuật mã hóa nhằm loại bỏ sự dư thừa trong dòng sóng tín nói và tái tạo dòng sóng tín nói phía giải mã sao cho giống với dạng sóng ban đầu Các kỹ thuật mã hóa dòng sóng thường đơn giản, có độ phức tạp thấp và cho tỷ lệ nén khá cao Tốc độ bit điển hình của mã hóa dòng sóng thường dao động từ 64 kb/s đến 16 kb/s Ở tốc độ bit thấp hơn 16 kb/s, lỗi lượng tín hiệu cho mã hóa dòng sóng rất lớn, điều này sẽ dẫn đến chất lượng âm thanh thấp hơn.

Mã hóa dạng sóng bao gồm hai phương pháp chính: Điều chế xung PCM (Pulse Code Modulation) và Điều chế mã xung vi sai thích nghi ADPCM (Adaptive Differential PCM) Các phương pháp này thường được áp dụng trong việc mã hóa tín hiệu âm thanh, đặc biệt là trong lĩnh vực điện thoại và truyền thông.

Mã hóa tham số là kỹ thuật dựa trên nguyên lý tiếng nói được tạo ra, còn được gọi là mã hóa nguồn Kỹ thuật này dựa vào các đặc tính của tiếng nói, trong đó tín hiệu âm thanh ổn định trong khoảng thời gian ngắn (khoảng 20ms) Trong khoảng thời gian này, một đoạn tiếng nói có thể được chia thành âm vô thanh hoặc âm hữu thanh Các đặc tính của tín hiệu âm thanh có thể được đại diện bởi một bộ lọc số biến đổi theo thời gian Đối với mỗi đoạn tiếng nói, các tham số của tín hiệu âm thanh sẽ xác định âm vô thanh hay hữu thanh, cùng với các tham số chu kỳ cao độ và độ tăng ích được thu thập qua phân tích tiếng nói Những tham số này sau đó được mã hóa thành luồng bit và truyền qua kênh Giải mã phía nhận sẽ tái tạo tiếng nói dựa trên các tham số đã nhận được.

Mã hóa dòng sóng và mã hóa tham số có độ phức tạp cao hơn, giúp đạt được hiệu quả nén tốt hơn Một trong những codec mã hóa tham số điển hình là Mã dự đoán tuyến tính (LPC), với tốc độ bit từ 1.2 đến 4.8 kb/s, thường được sử dụng trong hệ thống truyền thông di động không dây nhờ vào khả năng tiết kiệm băng thông.

Mã hóa tham số không thể đạt được chất lượng tín hiệu nói cao vì nó phân loại đơn giản các đoạn tín hiệu thành âm hữu thanh và âm vô thanh Để cải thiện điều này, mã hóa lai đã ra đời, kết hợp các tính năng của mã hóa dạng sóng và mã hóa tham số.

Nó giữ vai trò quan trọng trong việc mã hóa tham số âm thanh, bao gồm phân tích chu kỳ và quyết định âm thanh có thanh hay vô thanh Thay vì sử dụng một dãy xung tuần tự đơn giản để biểu diễn tín hiệu kích thích cho âm thanh hữu thanh, nó sử dụng tín hiệu kích thích dạng sóng cho cả âm thanh hữu thanh và vô thanh Nhiều kỹ thuật khác nhau đã được phát triển để cải thiện quá trình này.

Kích thích đa xung (multi-pulse excitation), kích thích mã (codebook excitation) và lượng tử vectơ là ba phương pháp chính trong việc tối ưu hóa tín hiệu Trong số đó, CELP (Codebook Excitation Linear Prediction) đã chứng minh hiệu quả vượt trội, cho phép mã hóa âm thanh với tốc độ từ 4.8 kb/s đến 16 kb/s cho các ứng dụng di động, không dây và vệ tinh Phương pháp này đạt chất lượng đánh giá MOS trên 3.5, cho thấy khả năng truyền tải âm thanh chất lượng cao trong điều kiện băng thông hạn chế.

Các tiêu chuẩn nén điển hình được đưa ra bởi các t ổ chức, Liên minh Vi n thông ễ

Mã hóa d ng sóng PCM 17 ạ

Trước h t, ta c n bi t lý do t i sao c n ph i biế ầ ế ạ ầ ả ến đổi tín hiệu tương tự sang d ng s , ạ ố vì tín hi u s : ệ ố

- có thế ử x lý t ng (b ng máy tính) ự độ ằ

- cho phép sao lưu nhiề ầu l n mà chất lượng không thay đổi

- các b x lý tín hi u s ộ ử ệ ố DSP khi được ch t o hàng lo t có chế ạ ạ ất lượng x ử lý đồng nh t và ch t lư ng x lý không thay đ i theo th i gian ấ ấ ợ ử ổ ờ

Xu hướng hiện nay là chuyển đổi tín hiệu tương tự sang tín hiệu số, trong đó phương pháp mã hóa xung PCM đóng vai trò quan trọng PCM là quá trình chuyển đổi tín hiệu tương tự thành tín hiệu số, nơi thông tin được chứa trong các mẫu của tín hiệu tương tự và được đại diện bằng các mã trong một dòng bit liên tiếp Quá trình mã hóa xung PCM bao gồm ba bước chính để số hóa tín hiệu tương tự.

- Mã hóa nh phân (Binary encoding) ị

Trước khi thực hiện lymu, tín hiệu được cho qua bộ lọc thông thấp (Low Pass Filter) để giảm thiểu tần số cao, nhằm đảm bảo định lý lymu Shannon được áp dụng chính xác.

Hình 2.1 Quá trình mã hóa PCM

Biên độ ủ của tín hiệu tương tự là một quá trình liên tục theo thời gian, trong đó mẫu được lấy từ tín hiệu tại các khoảng thời gian nhất định Quá trình này dẫn đến việc các mẫu thu được sẽ gián đoạn theo thời gian Dãy mẫu này tạo thành tín hiệu điều biên xung PAM (Pulse Amplitude Modulation) Khoảng thời gian lấy mẫu được gọi là chu kỳ lấy mẫu Ts, với tần số lấy mẫu Fs = 1/Ts.

Hình 2.2 Quá trình l y m u tín hi u ấ ẫ ệ

19 Để th c hi n quá trình l y m u tín hi u b t k ph i dự ệ ấ ẫ ệ ấ ỳ ả ựa vào định lý Nyquist- Shannon, n i dung cộ ủa định lý được phát biểu như sau:

N u tín hi u g c là hàm liên t c theo th i gian có t n s gi i h n t ế ệ ố ụ ờ ầ ố ớ ạ ừ 0 đến fmax, khi l y m u, t n s l y m u ph i lấ ẫ ầ ố ấ ẫ ả ớn hơn hoặc b ng hai l n t n s l n nh t trong tín ằ ầ ầ ố ớ ấ hi u g c: Fs >= 2fmaxệ ố

Mạch truyền dẫn quan trọng trong lý thuyết mạch là việc phát lặp tín hiệu tương tự theo tần số nào đó, nhằm cho phía thu có thể tái tạo lại được tín hiệu ban đầu Theo định lý Nyquist-Shannon, bằng cách lấy mẫu tín hiệu tương tự theo tần số cao hơn ít nhất hai lần tần số cao nhất của tín hiệu, ta có thể tái tạo lại đúng tín hiệu ban đầu từ các mẫu đó Đối với tín hiệu thoại hoạt động ở băng tần 0.3 - 3.4kHz, tần số lấy mẫu là 8kHz để đáp ứng yêu cầu về chất lượng truyền dẫn, phía thu sẽ khôi phục tín hiệu với độ méo trong phạm vi cho phép.

Quá trình lấy mẫu là chuỗi các xung với giá trị khác nhau, nằm trong khoảng giữa giá trị nhỏ nhất và lớn nhất Cần phân tích các giá trị biên độ và tổng hợp các giá trị đã biết Điều này được thực hiện bằng cách chia khoảng cách giữa giá trị nhỏ nhất và lớn nhất thành q vùng, mỗi vùng có độ rộng đồng đều Điểm giữa mỗi vùng được gán giá trị từ 0 đến q-1 Các giá trị của mẫu tín hiệu (các xung PAM) rơi vào một vùng nào đó sẽ được quy đổi về giá trị của điểm giữa Đây là quá trình làm tròn, trong đó mỗi giá trị được quy đổi về giá trị gần nhất.

Lý do để ấ l y x p x ấ ỉ điểm gi a là đ gi m thi u t i đa lữ ể ả ể ố ỗi lượng t ử

Giả ử s có m t tín hiộ ệu điện áp v i biên đ : Vmin = -20V, Vmax = +20V ớ ộ

Ta mu n dùng q=8 mố ức lượng t Chi u r ng mử ề ộ ỗi vùng: ∆ = (20- -20)/8 = 5

Ta có 8 vùng: -20 đến -15, -15 đến -10, -10 đến -5, -5 đến 0, t ừ 0 đến 5, t ừ 5 đến 10, t ừ 10 đến 15, t ừ 15 đến 20 Điểm gi a m i vùng: -17,5; -12,5; -7,5; -2,5; 2,5; 7,5; ,5; 17,5 ữ ỗ 12

M i mỗ ột vùng được gán v i m t mã nh phân ớ ộ ị

S ố bit được yêu cầu để mã hóa mỗi vùng hay s bit trên m i m u, v= log2(q) ố ỗ ẫ

Với ví dụ này thì s ố bit được yêu c u là: v = logầ 2 (8) = 3

Các mã nh ị phân đại di n cho 8 vùng (8 m c) là: 000, 001, 010, 011, 100, 101, 110, ệ ứ

111 Ánh x các mã t i các vùng: 000 s tham chi u t i vùng -ạ ớ ẽ ế ớ 20 đến 15, 001 tham chiếu tới vùng 15 đế- n -10,

Hình 2.3 Ví dụ quá trình lượng tử hóa

Khi giả sử lượng dữ liệu cần lưu trữ là 16 (2^4), số bit cần thiết để đại diện cho mỗi giá trị là 4 bit Nếu lượng dữ liệu không phải là một lũy thừa của 2, ví dụ như 10, thì cần phải sử dụng các phương pháp phân biệt khác để lưu trữ.

21 lượng t (2ử 3 > 15, và mult(-32768, -32768) cũng được xử lý tương tự.

= 32767 mult_r(var1, var2): giống như mult nhưng có làm tròn Ví dụ: mult_r(var1, var2) ((var1* var2)+ 16384) >> 15 và mult_r(-32768, -32768) 32767 abs(var1): giá tr tuyị ệt đố ủi c a var1; abs(-32768) = 32767

Hàm L_mult(var1, var2) thực hiện phép nhân hai biến var1 và var2, cho ra kết quả là một số 32 bit Kết quả được tính bằng công thức L_mult(var1, var2) = (var1 * var2) 1;

| IF ( r[i] < 0 ) THEN LAR[i] = sub ( 0, LAR[i] );

4.2.1.7 Lượng tử và mã hóa các tỉ số log tiết diện

Quá trình này cần sử dụng 4 bảng, các tính toán sau thực các co dãn tối ưu cho các hằng số

/* A[1 8] = integer( real_A[1 8]*1024) ; 8 giá trị (bảng 4.1)*/

/* B[1 8] = integer( real_B[1 8]*512) ; 8 giá trị (bảng 4.1)*/

/* MAC[1 8] = max của LARc[1 8] ; 8 giá trị (bảng 4.1)*/

/* MIC[1 8] = min của LARc[1 8] ; 8 giá trị (bảng 4.1)*/

Tính toán cho lượng t và mã hóa LAR[1…8] dựa vào phương trình (3.6 ) ử

| Kiểm tra n u LARc[i] không nế ằm trong MIN và MAX

| IF ( LARc[i] > MAC[i] ) THEN LARc[i] = MAC[i];

| IF ( LARc[i] < MIC[i] ) THEN LARc[i] = MIC[i];

| LARc[i] = sub ( LARc[i], MIC[i] ); // LARC >= 0

LỌC PHÂN TÍCH NGẮN HẠN

4.2.1.8 Giải mã các tỉ số tiết diện log được lượng tử hóa

Quá trình này sẽ thực hiện hiệu quả với 2 bảng (4.2) và (4.1)

/* INVA[1 8] = integer ((32768*8)/ (real_A[1 8]); 8 giá trị (bảng 4.2)*/ /* MIC[1 8] = min ( LARc[1 8]); 8 giá trị (bảng 4.1)*/ Tính LARpp[1…8] dựa vào phương trình (3.7)

4.2.1.9 Tính toán các hệ số phản xạ được lượng tử hóa

Mỗi khung 160 mẫu tín hiệu tiếng nói sẽ được phân tích thông qua bộ lọc tổng hợp ngắn hạn, sử dụng 4 bộ hệ số khác nhau Những hệ số này được suy ra từ bộ LAR đã được giải mã trước (LARpp(j 1)) và bộ LAR hiện tại (LARpp(j)).

4.2.1.9.1 Nội suy LARpp[1…8] thành LARp[1…8]

Dựa trên cơ sở b ng 3.3 ả

Giá trị khởi tạo: LARpp(j-1)[1…8] = 0;

Tính toán các giá trị rp[1…8] từ các hệ số LARp[1…8] đã được nội suy là bước quan trọng trong quá trình phân tích Đầu vào của quá trình này là mủ ảng LARp[1…8] đã nội suy Các hệ số phân tích và tổng hợp được sử dụng trong báo cáo để đảm bảo tính chính xác và hiệu quả trong công việc.

Tính toán dựa trên phương trình (3.5)

| IF ( temp < 11059 ) THEN temp = temp dmax ) THEN dmax = temp;

Khởi tạo m t m ng ộ ả wt[0…39] phục vụ tính toán

Tìm giá trị ớ l n nh t cấ ủa tương quan chéo và mã hóa hệ sô tr ễLTP – Nc

Nc = 40; (chỉ ố s cho giá tr l n nh t ị ớ ấ tương quan chéo)

| L_temp = L_mult( wt[k], dp[k-lambda] );

Khởi tạo m t m ng ph c vụ tính toán wt[0…39]ộ ả ụ

Tính năng lượng c a tín hiủ ệu dư ngắn hạn được tái tạo dp[…]

Chuẩn hóa L_max và L_power

Mã hóa hệ ố tăng ích s LTP

B ng 4ả 3a đượ ử ụng để thu được s d c mức DLB[i] cho quá trình lượng t hóa h s ử ệ ố tăng ích LTP b thành h s ệ ố được mã hóa bc

| IF (R xmax ) THEN xmax = temp;

Lượng t và mã hóa xmax thành xmaxc ử exp = 0; temp = xmax >> 9; itest = 0;

| IF( itest == 0 ) THENexp = add ( exp, 1 ) ;

|== NEXT i: temp = add ( exp, 5 ) ; xmaxc = add ( ( xmax >> temp ), ( exp 15 ) THENexp = sub ( ( xmaxc >> 3 ), 1 ) ;

Chuẩn hóa phần cơ số 0

Ngày đăng: 22/01/2024, 16:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w