DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮTHệ số nội suy của bộ lọc nội suy Hệ số phân chia của bộ lọc phân chiaBậc của bộ lọc Hệ số phân chia của băng con thứ iTần số đơn vị Hz Tần số góc ch
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-Lê Thị Huyền Trang
MÃ HÓA BĂNG CON ỨNG DỤNG TRONG XỬ LÝ TIẾNG VIỆT
LUẬN VĂN THẠC SĨ KỸ THUẬT Chuyên ngành: Kỹ thuật viễn thông
Hà Nội - 2016
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-Lê Thị Huyền Trang
MÃ HÓA BĂNG CON ỨNG DỤNG TRONG XỬ LÝ TIẾNG VIỆT
LUẬN VĂN THẠC SĨ KỸ THUẬT Chuyên ngành: Kỹ thuật viễn thông
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS NGUYỄN QUỐC TRUNG
Hà Nội - 2016
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan:
Những kết quả nghiên cứu, các số liệu, hình vẽ, bảng biểu, kết quả tính toán được trình bày trong luận văn là hoàn toàn trung thực, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và pháp luật Việt Nam
TÁC GIẢ LUẬN VĂN
Lê Thị Huyền Trang
Trang 4DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Hệ số nội suy của bộ lọc nội suy
Hệ số phân chia của bộ lọc phân chiaBậc của bộ lọc
Hệ số phân chia của băng con thứ iTần số (đơn vị Hz)
Tần số góc chuẩn hóa (đơn vị rad)Tốc độ bit trong SBC
Lỗi khôi phục trong mã hóa băng con
Adaptive Transform CodingBandpass Filter
Digital FilterDelta ModulationDifferential PCMDiscrete Fourier TransformFast Fourier TransformFinite Impulse ResponseFrequence Modulation – In Band On Channel
Highpass FilterInfinite Impulse ResponseInternational Organization for Standardization
Lowpass Filter
PCM vi sai thích nghiChuẩn phát thanh số trên băng tần AM truyền thống
Mã hóa biến đổi thích nghi
Bộ lọc thông dải
Bộ lọc sốĐiều chế DeltaPCM vi saiBiến đổi Fourier rời rạcBiến đổi Fourier nhanhĐáp ứng xung hữu hạnChuẩn phát thanh số trên băng tần FM truyền thống
Bộ lọc thông caoĐáp ứng xung vô hạn
Tổ chức tiêu chuẩn quốc tế
Bộ lọc thông thấp
Trang 5Motion Picture Experts Group/audio
Pulse Code ModulationQuadrature Mirror FilterSubBand Coding
Nhóm chuyên gia hình ảnh chuyển động/âm thanhĐiều xung mã
Bộ lọc gương cầu phương
Mã hóa băng con
Trang 6DANH MỤC CÁC BẢNG
Trang
Bảng 3.1: Bảng giá trị e trong SBC(88444) và SBC(8842), bTB=8bit/mẫu
với tiếng nói Tiếng Việt
Hình 1.7: Bộ biến đổi nhịp lấy mẫu
Hình 1.8: Bộ biến đổi nhịp lấy mẫu hệ số M/L
Hình 1.9: Bộ lọc với hệ số lấy mẫu hữu tỷ
Hình 1.10: Sơ đồ bộ lọc biến đổi nhịp lấy mẫu
Hình 1.11: Bank lọc số phân tích
Hình 1.12: Bank lọc số tổng hợp
Hình 1.13: Bank lọc số nhiều nhịp hai kênh QMF
Hình 1.14: Đáp ứng biên độ
Hình 1.15: Sơ đồ tổng quát của bank lọc số M kênh
Hình 1.16: Cấu trúc dạng cây đơn phân giải của bank lọc phân tích
Hình 1.17: Cấu trúc dạng cây phân giải đều của bank lọc tổng hợp
Hình 1.18: Cấu trúc tương đương dạng cây phân giải đều
Hình 1.19: Cấu trúc dạng cây đa phân giải của bank lọc phân tích
Hình 1.20: Cấu trúc dạng cây đa phân giải của bank lọc tổng hợp
Hình 1.21: Cấu trúc tương đương dạng cây đa phân giải
4468810121215161819202225272828293031
Trang 7Chương 2:
Hình 2.1: Mô phỏng quá trình truyền tiếng nói trong không khí
Hình 2.2: Tín hiệu và phổ của tín hiệu
Hình 2.3: Bộ máy phát âm của con người
Hình 2.4: Mô tả dây thanh âm
Hình 2.5: Mô hình hệ xử lý biến đổi tín hiệu vào x(n) thành tín hiệu ra y(n)
Hình 2.6: Mô hình tạo tiếng nói (Fant – 1960)
Hình 2.7: Mô hình tạo tiếng nói
Hình 2.8: Biểu diễn tín hiệu tiếng nói
Hình 2.9: Chất lượng tiếng nói so với tốc độ bit của các bộ mã hoá
Hình 2.10: Mô hình tạo tiếng nói được sử dụng bởi mã hóa nguồn
Hình 2.11: Kiến trúc của mã hóa AbS (a) Mã hóa (b) Giải mã
3237394041444445495253
Chương 3:
Hình 3.1: Sơ đồ mã hóa băng con tổng quát M kênh
Hình 3.2: Một đoạn file ghi âm tiếng dân tộc Tày (nam)
Hình 3.3: Một đoạn file ghi âm tiếng dân tộc Tày (nữ1)
Hình 3.4: Một đoạn file ghi âm tiếng dân tộc Tày (nữ2)
Hình 3.5: Biểu diễn formant f0, f1
Hình 3.6: Các băng con tương ứng với tổ hợp phân chia [88444]
Hình 3.7: Sơ đồ mã hóa băng con 5 kênh
Hình 3.8: Phổ tần của tín hiệu vào x(n)
Hình 3.9: Phổ tần của 5 tín hiệu băng con tại đầu ra các bộ lọc
Hình 3.10: Phổ tần của năm tín hiệu băng con tại đầu ra các bộ phân chia
Hình 3.11: Phổ tần của năm tín hiệu băng con tại đầu ra các bộ nội suy
Hình 3.12: Đáp ứng tần số của dàn lọc QMF
Hình 3.13: So sánh phổ của tín hiệu đầu vào và tín hiệu đã khôi phục
Hình 3.14: So sánh tín hiệu đầu vào và tín hiệu ra sau mã hóa băng con
Hình 3.15: Phổ của các băng con trong miền tần số
555858595961626263656769707071
Trang 8MỤC LỤC
Trang
Lời cam đoan
Danh mục các ký hiệu, các chữ viết tắt
iii
1.2.3 Bank lọc hai kênh QMF
1.3 Mã hóa băng con của tín hiệu tiếng nói
1.3.1 Cấu trúc dạng cây phân giải đều
1.3.2 Cấu trúc dạng cây đa phân giải
1.4 Kết luận chương
338111718181925262831
2.1 Tiếng nói và đặc điểm của tiếng nói
2.1.1 Đặc tính vật lý của âm thanh
Trang 92.1.2.2 Phụ âm
2.1.2.3 Tỷ suất thời gian
2.1.2.4 Hàm năng lượng thời gian ngắn
2.1.2.5 Tần số vượt qua điểm không
2.1.2.6 Phát hiện điểm cuối
2.1.2.7 Tần số cơ bản
2.1.2.8 Formant
2.1.3 Phân loại đơn giản dạng sóng tiếng nói
2.1.4 Bộ máy phát âm và cơ chế phát âm
2.1.4.1 Bộ máy phát âm
2.1.4.2 Cơ chế phát âm
2.2 Một số kiến thức chung về xử lý tín hiệu rời rạc
2.2.1 Mô hình hệ xử lý tín hiệu rời rạc
2.2.2 Phép biến đổi Z
2.3 Mô hình tạo tiếng nói
2.4 Biểu diễn số tiếng nói
2.4.1 Xác định tần số lấy mẫu tín hiệu tiếng nói
2.4.2 Lượng tử hoá
2.4.3 Nén tín hiệu tiếng nói
2.5 Mã hóa tiếng nói
3.1 Giới thiệu
3.2 Mã hóa băng con trong xử lý tiếng Việt
5556
Trang 103.2.1 Nguyên lý của mã hóa băng con
3.2.2 Điều kiện để tăng hệ số nén tín hiệu tiếng Việt trong SBC
3.2.3 Lựa chọn tần số lấy mẫu
3.2.4 Số bit trung bình trên một mẫu
3.3 Ứng dụng mã hóa băng con [88444] trong xử lý tiếng Việt
Trang 11MỞ ĐẦU
Trong lịch sử phát triển, một trong những tiến bộ quan trọng nhất trong mã hóa âm thanh là việc phát minh ra bộ mã hóa băng con (SubBand Coding – SBC) Ứng dụng đầu tiên của mã hóa băng con trong xử lý âm thanh số theo tiêu chuẩn MPEG/audio Chuẩn này được ra đời vào năm 1990 bởi ISO/IEC, được ứng dụng rộng rãi trong phát thanh số vô tuyến Các hệ thống phát thanh số hiện nay trên thế giới đều dùng kỹ thuật mã hóa băng con để nén tín hiệu âm thanh, với tỷ lệ nén rất cao Mã hóa băng con là một trong những thuật toán mã hóa nén dữ liệu có tổn hao,
đã được ứng dụng trong mã hóa âm thanh Bên cạnh đó, việc phân tích phổ của tín hiệu âm thanh, tiếng nói cho thấy rằng năng lượng phổ tín hiệu thường phân bố không đồng đều trên toàn bộ dải tần số Năng lượng của phổ tiếng nói chủ yếu tập trung ở tần số thấp, còn ở miền tần số cao năng lượng của phổ âm thanh rất nhỏ
Hiện nay lĩnh vực xử lý tiếng nói đặc biệt là tiếng Việt, trong đó có tiếng Việt chính thống và tiếng các dân tộc đang được rất nhiều các nhà khoa học quan tâm, nhà nước ta đã chi rất nhiều tiền cho các đề tài nghiên cứu tiếng Việt Vì vậy, việc nghiên cứu SBC trong xử lý tiếng Việt để nén dữ liệu có ý nghĩa rất quan trọng
trong việc định hướng cho phát thanh số ở Việt Nam Do đó, tôi đã chọn đề tài “Mã
hóa băng con ứng dụng trong xử lý tiếng Việt”, nhằm góp phần hoàn thiện kiến
thức và có thông tin đầy đủ hơn về kỹ thuật mã hóa băng con trong nén tín hiệu tiếng nói
Đề tài được trình bày thành 3 chương:
Chương 1: Lý thuyết mã hóa băng con
Chương này trình bày các vấn đề cơ bản về kỹ thuật lọc số nhiều nhịp gồm
có phép phân chia và phép nội suy, bộ lọc biến đổi nhịp lấy mẫu gồm có bộ lọc phân chia và bộ lọc nội suy từ đó ứng dụng để tạo ra các bank lọc số Đồng thời nghiên cứu về bank lọc số QMF 2 kênh ứng dụng trong xử lý tiếng nói với cấu trúc dạng cây đơn phân giải và đa phân giải
Trang 12Chương 2: Kiến thức cơ bản về tiếng nói
Chương này trình bày một số đặc điểm cơ bản của tiếng nói gồm có đặc tính vật lý, đặc tính âm học của âm thanh Đưa ra một số kiến thức chung về xử lý tín hiệu rời rạc, mô hình tạo tiếng nói, cách biểu diễn số tiếng nói cũng như các dạng
mã hóa tiếng nói khác nhau
Chương 3: Ứng dụng mã hóa băng con trong xử lý tiếng Việt
Chương này trọng tâm đi sâu vào việc phân tích đặc trưng của tiếng nói nói chung và tiếng Việt nói riêng, cụ thể là tiếng dân tộc Tày-Nùng từ đó đưa ra phương
án thiết kế bank lọc số SBC có hệ số phân chia [88444] phù hợp So sánh kết quả của bank lọc này với các bank lọc đang ứng dụng trong phát thanh số hiện nay
Trang 13CHƯƠNG 1 LÝ THUYẾT MÃ HÓA BĂNG CON
Mã hoá băng con là quá trình phân chia tín hiệu thành nhiều dải tần số thông qua các bộ lọc thông thấp, thông dải và thông cao Các dải tần này gọi là các băng con Sau đó, các băng con này sẽ được lượng tử và mã hoá độc lập nhau, tuỳ thuộc vào tính chất thống kê và mật độ năng lượng của từng dải mà số bit mã hoá khác nhau.
1.1 CÁC HỆ THỐNG LỌC SỐ NHIỀU NHỊP [4] [5] [7]
Kỹ thuật lọc số nhiều nhịp ngày càng được ứng dụng nhiều trong lĩnh vực xử
lý số tín hiệu, như là nó có thể dùng để tăng tốc độ tính toán trong các bộ lọc sốbằng cách giảm số phép nhân thực hiện được trong một giây
Trong quá trình xử lý tín hiệu thì bề rộng của dải tần số có thể thay đổi, như
là các phép lọc có thể triệt tiêu các thành phần tần số không mong muốn, khi đó bềrộng dải tần của tín hiệu xử lý sẽ giảm đi, vậy chúng ta có thể giảm tần số lấy mẫu cho phù hợp với bề rộng phổ của tín hiệu do đó chúng ta đã giảm được số phép tính trong bộ lọc số
Do tính chất ưu việt của bộ lọc số nhiều nhịp này mà nó đã được nghiên cứu
và ứng dụng nhiều trong kỹ thuật viễn thông, đặc biệt là trong xử lý tín hiệu số: Xử
lý tiếng nói, xử lý hình ảnh, các hệ thống antenna, kỹ thuật audio số Đặt biệt hơn là ứng dụng chính của nó là mã hóa băng con (subband coding) trong xử lý tiếng nói,
ta sẽ nghiên cứu ở phần sau
Hệ thống xử lý số nhiều nhịp là hệ thống xử lý số tín hiệu mà tần số (hoặc nhịp) lấy mẫu được thay đổi trong quá trình xử lý
1.1.1 Bộ lọc phân chia
Hệ thống mà giảm tần số lấy mẫu từ F S tới F S' F S /M (M>1, nguyên dương) là bộ phân chia
Trang 14Hình 1.1: Bộ phân chia
Tần số lấy mẫu của tín hiệu rời rạc x(n) sau khi qua bộ phân chia sẽ giảm
đi M lần, tức là:
M M
F F
F M
F
S S
S S
S S
W P
P W
S S F
S S
F
M
Tần số lấy mẫu giảm đi M lần sau khi tín hiệu đi qua bộ phân chia theo hệ số
M, nên tín hiệu ra yØM (n) chỉ lấy giá trị của các tín hiệu vào x(n) ở các mẫu n.M (n,
M nguyên dương)
Vậy chiều dài của tín hiệu bị co lại M lần: [ ]
n y L
n x L
M
Ø ( )
) (
Phép phân chia trong miền Z có thể biểu diễn như trong hình 1.1
Hình 1.2: Bộ phân chia trong miền Z
S
F
M
ØX(z) YØM (z)
M: hệ số phân chia
M
Øx(n)
'
S
W
TS
Trang 15Trong miền biến số độc lập ta có: yØM (n) = x(n.M)
-Ø
n
n n
n M
Ï
0
.1
11
)(
M
o l
M
o l
lm M j lm
M
M n l e
M
W M
m
p
l¹icßnlvíi
víi
(1.4)Đặt m = n.M n=m/M thay vào (1.3) ta có:
-m
M
o l
M
m lm
M j m
M m
M z
m P m x z
Y
1 2
)
(
1
1)(
M
l
l M j M
M z
(z) M Y jω e M Y
e
¯
ˆ Á Ë Ê
Vậy ta có mối quan hệ sau:
¯
ˆÁÁ
Ë
0
2 1
0
2
1
l
l M j M j j
M e
e X M e
Y
w w
Chúng ta thấy rằng, qua phép phân chia kết quả cho thấy tín hiệu x(n) khi đi qua mạch phân chia hệ số M, trong miền tần số sẽ tạo ra M-1 thành phần hư danh, các thành phần hư danh này sẽ gây ra hiện tượng chồng phổ Nhưng nếu x(n) có dải
Trang 16phân chia ØM một mạch lọc thông thấp (Low pass filter) có Mạch lọc
thông thấp này có nhiệm vụ loại bỏ các thành phần tần số
w · , như vậy sẽ tránh được hiện tượng chồng phổ Sơ đồ tổng quát
của mạch lọc phân chia:
h(n) là đáp ứng xung của mạch lọc thông thấp
Hình 1.3: Mạch lọc phân chia
Biểu diễn toán tử:
Trong miền biến số n ta có phép lọc phân chia:
x k
Trang 17
1
M M l
M M M
M W
z Y M z Y
Để đánh giá X(z), H(z), YH(z) và YHØM(z) trên vòng tròn đơn vị trong mặt phẳng z ta có thể biểu diễn phép lọc phân chia trong miền tần số:
0
2 2
.1
1 M
l
M
l j M
l
M
l j M
l j H j
M
M e
Y M e
Y
w w
w w
¯
ˆÁÁË
Ê
˜˜
¯
ˆÁÁË
Ê
j M
j l
j M
M e
Y
w w
H(z) YHØM(z)
Trang 18( ) X e
M e
l j M
¯
ˆÁÁË
S S S
S
hoặc chu kỳ lấy mẫu TS =1/FS sẽ giảm đi L lần T S' T S /L vậy nếu tín hiệu vào
¯
ˆÁË
Do tần số lấy mẫu được tăng lên L lần, nên khi tín hiệu qua mạch nội suy có
hệ số L thì chiều dài của tín hiệu bị giãn ra L lần:
( ) [y n ] L[ ]x( )n L
L ≠L /
Phép nội suy trong miền z:
Hình 1.5: Biểu diễn phép nội suy trong miền Z
Trang 19Trong miền biến số độc lập n ta có:
( )
Ô Ó
Ô Ì
˜
¯
ˆ Á Ë
Ê
≠
lai còn n voi
L L n
voi L
n x n
y L
0
2 , , 0
-≠
¯
ˆÁË
Ê
n n
L
L
n x z
n y z
-≠
m L ml
L ˜˜¯
ˆÁÁË
z X e X
1 ảnh phụ mà không gây hiện tượng chồng phổ Như vậy phép nội suy ≠L không làm méo thông tin Nhưng để nội suy ra các mẫu có biên độ 0 ta phải đặt sau mạch
nội suy một mạch lọc có
L
C
p
nội suy ra các mẫu biên độ 0 Còn trong miền tần số nó loại bỏ các ảnh phụ cơ bản
Sơ đồ tổng quát của mạch lọc nội suy được biểu diễn trên hình 1.6
Trang 20¯
ˆ Á Ë
Ê
≠
l¹i cßn n víi
2L
L, 0, n víi 0
L
n x n
˜
¯
ˆÁË
Ê-
k k
L
L L
LH
L L
k k n h L
k x k
n h k y
n y n h n h n y
n
y
2,,0
Trang 21LH e Y e H e X e H e
1.1.3 Bộ lọc biến đổi nhịp lấy mẫu với hệ số hữu tỉ
Trong kĩ thuật nhiều khi thực hiện một nhiệm vụ nào đó chúng ta cần phải thay đổi nhịp lấy mẫu với hệ số hữu tỉ M/L Để thực hiện nhiệm vụ này chúng ta sẽ ghép nối tiếp hai bộ nội suy và phân chia với nhau, bộ này gọi là bộ biến đổi nhịp với hệ số M/L
Ta thấy rằng tần số lấy mẫu FS của tín hiệu vào x(n) sau khi qua bộ biến đổi nhịp với hệ số M/L thì tần số lấy mẫu sẽ bị thay đổi L/M lần, tức là:
x L
x L
M yØ≠M L
n x
/
/
)(
Trang 22Hình 1.7: Bộ biến đổi nhịp lấy mẫu
Hình 1.8: Bộ biến đổi nhịp lấy mẫu hệ số M/L
y y
S S
S S
L M
L M M L
F F
y y
S S
S S
L M L
M
L M M L
Bộ biến đổi nhịp ≠ØM/L và bộ biến đổi nhịp Ø≠M/L
) (
"
"
/
T T
F F
y
S S
S S
L M
L
M n x n x M L
) (
"
"
/
T T
F F y
S S
S S
L M
L
M n x n x M L
n
Ø≠
) (
) ( "
"
T T
F F
S S
S S
nM x n
x M
Trang 23Bộ phân chia và bộ nội suy không có tính chất giao hoán nên ta phải phân biệt thứ tự trước sau của bộ nội suy và bộ phân chia Mặt khác bộ phân chia, bộ nội suy và bộ biến đổi nhịp không phải là những hệ thống bất biến theo biến số n mà là
hệ thống thay đổi theo biến số n
Trong hệ số M/L thì tử số là hệ số của bộ phân chia, mẫu số là hệ số của bộ nội suy
Nếu M>L thì bộ thay đổi nhịp làm nhiệm vụ nén tín hiệu theo tỷ lệ M/L.Nếu M<L thì bộ thay đổi nhịp làm nhiệm vụ giãn tín hiệu theo tỷ lệ M/L.Dùng biến đổi Z để nghiên cứu quan hệ vào ra của các bộ biến đổi nhịp và giải thích tính chất của phép biến đổi nhịp lấy mẫu
Xét quan hệ vào ra của bộ biến đổi nhịp Ø≠M/L ta có:
)()
(
/
/
n n
x K L y M L
Ø≠
Ø≠æ Æææ
và trong miền Z:
[ ]( ) ( ) ( ) [ ( )]
/ /
/
n ZT
z z
X n x
Ø Ø
ØæÆæ
-Ø
1 0
2 1
)(
1)(
M
l
l M j M
M z
/ /
) (
1 ) ( )
(
) ( )
( )
(
M
l
l M j M L
M L
M
L M L
M L
M
e z z
Y Y
y Y
Y
X M z
n ZT
z z
1 M
l
l M
Mw z
X M
Xét quan hệ vào ra của bộ biến đổi nhịp ≠ØM/L:
Phép biến đổi nhịp như sau:
) ( )
(
/
/
n n
≠Ø
≠Øæ Æ æ æ
Trang 24Trong miền Z:
) ( )
) ( )
( )
(
/ /
z Y
y Y
l L
L M L
M L
X z
n ZT
z z
M j M L
M
l
l M j M L L
M
e z e
z Y
e z Y Y
X
M z
)(
)(
)(
1)(
2 1 2
1
1
0
2 1 /
p p
)(
1
)(
1)(
M
l
Ll M M L
M
l
Ll M j M L L
M
W z
e z Y
X M
X M z
e Y
e
j L M
¯
ˆÁ
Ë
Ê
1 0
2
l
M l L je
X M
p w
(1.22)
e Y
e
j L M
M Ll L j
e
X M
p w
(1.23)
Trang 25Bộ lọc biến đổi nhịp lấy mẫu với hệ số hữu tỷ:
Chúng ta xây dựng bộ lọc biến đổi nhịp lấy mẫu với hệ số hữu tỷ có thể đảm bảo biến đổi nhịp với hệ số không nguyên, nhưng không gây hiện tượng chồng phổ tức là không làm hư thông tin của chúng ta
Bộ lọc này được xây dựng bằng cách ghép nối tiếp hai bộ lọc nội suy và bộ lọc phân chia như hình sau:
Hình 1.9: Bộ lọc với hệ số lấy mẫu hữu tỷ
Như hình trên ta thấy bộ lọc hL(n) được ghép nối tiếp với bộ lọc hM(n), vậy ta
có thể kết hợp hai bộ lọc này thành một bộ lọc chung có đáp ứng xung h(n) Bộ lọc h(n) này phải làm cả hai nhiệm vụ đối với phép nội suy và phép phân chia, do đó ta phải chọn h(n) sao cho cùng một lúc thực hiện được cả hai nhiệm vụ này
Hai bộ lọc này được ghép nối tiếp nên đáp ứng tần số H(ejw)= FT[h(n)] là:
với HL(ejw) = FT[ hL(n)] và HM(ejw) = FT [hM(n)]
Vậy ta có:
)()
()
j L j
H H
Ï
£
£-
˜
¯
ˆÁ
H j
w
pwpp
pw
w
0
,min0
Trang 26Kết quả ta được bộ lọc biến đổi nhịp hệ số M/L với chỉ một bộ lọc thông thấp có đáp ứng xung h(n) và đáp ứng tần số H(ejw) Từ đó ta có sơ đồ khối của bộ lọc này như sau:
Hình 1.10: Sơ đồ bộ lọc biến đổi nhịp lấy mẫu
Chúng ta có thể dùng toán tử để biểu diễn:
)()
()
()
(
/ n n
n n
LH H
Hoặc ngắn gọn hơn:
y H M L
L M H
n x
/
/
)(
Ø
≠ Ø
≠æææÆ
Mô tả:
)()
()
()
(
/ )
(
n n
n n
LH n
h L
LH
kL n h k x
k n h k n
h n
y
)(
)(
)()()
()()
≠ Ø
≠
k
L L
M H
kL n h k x M
n h n M
y
)(
)(
)()()
( )
( )
M LH
z H L
y(n)
Trang 27(
)()
(
)()
(
/ / z ZT y n Y
n y ZT z Y
n h ZT z H
n x ZT z X
L M H L
M H
LH LH
Ø
≠ Ø
()(
)()(
z H z X z Y
z X z Y
L LH
L L
) (
1
) ( ).
( )
(
1 1
0
/
W z W
z
z Y
l M M M
l
lL M M L
L L
M H
H X
M
z H X
M z
()
()
(
/ )
(
e Y
e Y e
Y
M j
LH H
j L L
1)(
2 1
0
l j M
l LH j
L M
H
M
p w
-≠ Ø
)(
)(
l
M Ll L j
H X
M
p w p
Trang 281.2.1 Bank lọc số phân tích
Bank lọc số phân tích là tập hợp các bộ lọc số có đáp ứng tần số là Hk(e jw)được nối với nhau theo kiểu một đầu vào và nhiều đầu ra, cấu trúc của bank lọc số phân tích được miêu tả trên hình (1.11)
Tín hiệu x(n) đưa vào đầu vào và được phân tích thành M tín hiệu ở đầu ra là
xk(n) (0£k £M -1), như vậy trong miền tần số mỗi tín hiệu xk(n) là một dải tần số con trong dải tần số x(n) nên M tín hiệu xk(n) được gọi là tín hiệu band con(subband)
Hình 1.11: Bank lọc số phân tích
Các bộ lọc số có:H0(e jw)là bộ lọc thông thấp, H1(e jw)đến H M-2(e jw) sẽ là các bộ lọc số thông dải còn H M-1(e jw)sẽ là bộ lọc thông cao mà các tần số cắt của các bộ lọc này là sẽ kế tiếp nhau Như vậy các bộ lọc H0(e jw), H1(e jw), …,
x1 ; 1
Trang 291.2.3 Bank lọc hai kênh QMF
Chúng ta đã phân tích tín hiệu x(n) thành các tín hiệu băng con (subband)
)
(n
x k (0£k £M -1) và tổng hợp các tín hiệu băng con này từ bank lọc số tổng hợp được tín hiệu lối ra xˆ( )n Bây giờ chúng ta sẽ kết hợp bank lọc số phân tích và bank lọc số tổng hợp với các bộ phân chia và bộ nội suy để tạo ra bank lọc số nhiều nhịp QMF (Quadrature mirror filter bank) hay bank lọc số gương cầu phương
Với hệ số phân chia M = 2 và hệ số nội suy L = 2 ta sẽ có bank lọc số nhiều nhịp hai kênh QMF như hình (1.13)
ˆ n
x
Trang 30Hình 1.13: Bank lọc số nhiều nhịp hai kênh QMF
Ta thấy tín hiệu lối vào x( )n được phân tích thành hai tín hiệu băng con
( )n
x0 và x1( )n nhờ bank lọc số phân tích gồm hai bộ lọc, H0(z) bộ lọc thông thấp và
H1(z) bộ lọc thông cao có tần số cắt là p/2, và được đưa vào bộ giảm tần số lấy mẫu với hệ số là 2 Tại đầu thu các tín hiệu v0( )n và v1( )n , được đưa vào bộ tăng tần
số lấy mẫu với hệ số là 2, y0( )n và y1( )n qua bank lọc tổng hợp gồm hai bộ lọc
Quan hệ giữa các tín hiệu trong bank lọc số hai kênh QMF:
Xét mối quan hệ giữa các tín hiệu trong miền Z
G0(z)
G1(z)2
tổng hợpNội suy
Trang 31Xk(z) = Hk(z).X(z) (1.35)Tín hiệu sau khi phân chia Vk(z):
Í Î
È
˜˜
¯
ˆ ÁÁ Ë
Ê - +
˜˜
¯
ˆ ÁÁ Ë
Ê
˜˜
¯
ˆ ÁÁ
2
1
2
1
z X z X e
z X z
l
l j k
V z Y
k k
k k
k k
k k
-
-+
+
-
212
X
-
+ +
-+
1 1
0 0
1 1
0 0
2
1
.
2
1 ˆ
È
˙
˚
˘ Í
Î
È
-
-z G
z G z H z H
z H z H z X z X z X
1 0 1
0
1 0
.
È
˙
˚
˘ Í
Î
È
-
-˙
˚
˘ Í
Î
È
z G z G z H z H
z H z H z
H z X
z X z X
1 0 1
0
1 0
Bây giờ chúng ta sẽ xét các sai số trong bank lọc này Như đã nói ở trên thì bank lọc QMF này có ba loại sai số có thể sinh ra là: Sai số do thành phần hư danh, sai số do méo biên độ, sai số do méo pha
Trang 32Sai số do thanh phần hư danh:
Chúng ta hãy sẽ mô tả một vài trường hợp của đáp ứng biên độ ( )jw
w p
w j
-j
e H e
Trang 33Hãy tưởng tượng đặt một gương phẳng vào vị trí p/2 trên trục tần số w thì
k e
dải chắn trong trường hợp này đúng bằng p/2, bề rộng của dải quá độ Dw 0
Hình (1.14d) là trường hợp không lý tưởng nhưng cũng không gây ra hiện tượng chồng phổ đối với , bề rộng dải thông nhỏ hơn và bề rộng dải chắn sẽ lớn hơn Trong trường hợp này nếu chọn bề rộng dải quá độ rất hẹp thì
sẽ gần đạt lý tưởng và không gây chồng phổ
Còn hình (1.14c,d) sẽ gây ra hiện tượng chồng phổ tức có thành phần hư
Tuy nhiên thành phần hư danh có thể khử được nếu ta thiết kế banh lọc tổng hợp để bù lại
Muốn khử thành phần hư danh X(-z) ta chỉ cần triệt tiêu đại lượng đứng trước X(-z) trong biểu thức (1.37), tức là:
( ) ( ). 0 1( ) ( )1 0
0 z H -z +G z H -z G
Ó Ì
Ï
-
-z H z G
z H z G
0 1
1 0
Để khử thành phần hư danh thì T1( )z = 0
( ) ( )z X z [G ( ) ( )z H z G ( ) ( )z H z ]X( )z T
z
2
1
) (
( )jw
k e V
Trang 34Sai số do méo biên độ và méo pha:
Ï
-
)()
-(
)()(
0 1
1 0
z H z G
z H z G
vào T0(z)
2
1)
) ( 0
0(e jw) T (e jw).e jjwT
)()
()(e jw T0 e jw e jj(w)X e jwX
) (e jw c e jawX e jw
- )
) ( ) (z c z X z
X) -a
(1.49)Vậy trong miền n ta có: x)(n) c.x(n-a)
(1.50)Lúc đó bank lọc số QMF là bank lọc số khôi phục hoàn hảo (PR QMF) vì tín hiệu ra chỉ sai khác tín hiệu vào theo tỉ lệ c và trễ đi một lượng là a
Thuật ngữ bank lọc số gương cầu phương (QMF) được giải thích đối với bank lọc số 2 kênh, nhưng sau này ta cũng dùng thuật ngữ này đối với bank lọc số
M kênh
Bank lọc số nhiều nhịp M kênh.
Phần trên chúng ta đã nghiên cứu bank lọc số nhiều nhịp hai kênh Trong phần này chúng ta tổng quát hóa cho trường hợp bank lọc số nhiều nhịp M kênh
Sơ đồ tổng quát của bank lọc số M kênh được cho trên hình 1.15
Trang 35Hình 1.15: Sơ đồ tổng quát của bank lọc số M kênh
Nhận xét
Ta thấy rằng tất cả các tín hiệu có phổ phân bố không đều, nhưng qua các mạch lọc ta có thể chia các dải tần số ra làm hai dải: Dải tần số thấp và dải tần số cao Vậy ở dải thấp ta có thể tăng tần số lấy mẫu lên, còn ở dải tần cao ta có thể hạ xuống bằng các mạch hạ nhịp và tăng nhịp Do đó khi kết hợp mạch hạ nhịp và tăng nhịp cùng với các mạch lọc hay bank lọc số QMF thì phổ của tín hiệu có thể triệt tiêu được các thành phần tần số không mong muốn Và bề rộng của dải tần số của tín hiệu cần xử lý sẽ giảm, vậy chúng ta có thể giảm tần số lấy mẫu cho phù hợp với tín hiệu Tín hiệu cũng được khôi phục chính xác hơn Cho nên nó rất phù hợp cho
xử lý tín hiệu tiếng nói
1.3 MÃ HÓA BĂNG CON CỦA TÍN HIỆU TIẾNG NÓI [4] [7]
Ở trên chúng ta đã định nghĩa thế nào là band con Sau đây chúng ta sử dụng một phương pháp này để số hóa tín hiệu âm thanh trong truyền phát và lưu trữ Mã hóa băng con rất thuận tiện cho việc nén tín hiệu âm thanh, vì thông thường năng lượng của phổ tín hiệu phân bố không đều, năng lượng của phổ tiếng nói tập trung ở miền tần số thấp, còn ở miền tần số cao năng lượng của phổ âm thanh rất nhỏ Do
Trang 36vậy, chúng ta sẽ mã hóa dải tần thấp với số bit lớn hơn ở dải tần cao Phương pháp
mã hóa băng con là sự phân chia dải tần của tín hiệu âm thanh thành nhiều dải tần nhỏ và mỗi dải sẽ được mã hóa với số bít riêng
Ở đây chúng ta sử dụng bank lọc số nhiều nhịp để phân chia dải tần của tín hiệu thành nhiều băng con để mã hóa băng con và giải mã băng con Đơn giản nhất
là chúng ta dùng bank lọc số 2 kênh QMF (bộ lọc gương cầu phương) để mã hóa thành 2 băng con Có hai phương pháp mã hóa băng con là sử dụng cấu trúc dạng cây đơn phân giải và cấu trúc dạng cây đa phân giải
1.3.1 Cấu trúc dạng cây phân giải đều
Năng lượng của phổ tín hiệu thường phân bố rất không đồng đều trên toàn bộ dải tần số vậy để mã hóa băng con hiệu quả cao chúng ta sẽ mã hóa làm nhiều tầng
Tín hiệu âm thanh đã được lấy mẫu với tần số F được chia ra làm nhiều tầng Tầng thứ nhất tín hiệu x(n) cho qua bộ lọc thông thấp H (z) và và bộ lọc
Tầng thứ hai cho qua bộ lọc thông thấp H (z), H (z) và và bộ lọc thông cao H (z), H (z) như miêu tả hình (1.16), chia hai băng con của tầng thứ nhất thành các băng con có bề rộng bằng nửa tầng thứ nhất, mỗi dải tần có bề rộng bằng và cứ tiếp tục như vậy chúng ta sẽ phân dải phổ của tín hiệu làm rất nhiều băng con và sau khi ra khỏi bank lọc phân tích bề rộng phổ của tín hiệu băng con là bằng nhau nên gọi là phân giải đều
Hình (1.16a) tín hiệu sau khi qua hai tầng được phân chia ra làm 4 băng conbằng nhau mỗi dải là , chúng ta sẽ mã hóa với số bít khác nhau đối với mỗi băng con này
Chúng ta đã phân chia tín hiệu thành các băng con và mã hóa với số bít khác nhau, do đó vấn đề đặt ra là giải mã và tổng hợp băng con của tín hiệu
S
F
Trang 37Hình 1.16: Cấu trúc dạng cây đơn phân giải của bank lọc phân tích
Hình (1.17) là cấu trúc bộ tổng hợp các băng con của tín hiệu Tín hiệu băng con qua các bộ giải mã rồi đưa tới các bank lọc số QMF tương ứng G (z), G (z),
G (z), G (z) Tương tự như bộ phân chia được chia làm nhiều tầng thì bộ tổng hợp cũng được chia làm nhiều tầng, tín hiệu thông thấp và tín hiệu thông cao liền kề nhau được cộng lại, lọc ra và được tổng hợp lại, tức là ở tầng thứ nhất tín hiệu qua bank lọc G (z), G (z) được cộng lai rồi qua bank lọc G (z) ở tầng 2 và tín hiệu qua bank lọc G (z), G (z) cộng lại rồi qua bank lọc G (z) ở tầng 2 Tín hiệu qua bank lọc G (z) và G (z) được tổng hợp lại là
2Ø
2Ø
2Ø
2Ø
Channel
Trang 38Hình 1.17: Cấu trúc dạng cây phân giải đều của bank lọc tổng hợp
Chúng ta có thể sử dụng cấu trúc dạng cây phân giải đều tương đương của bank lọc số 4 kênh phân tích và tổng hợp như hình (1.18)
Hình 1.18: Cấu trúc tương đương dạng cây phân giải đều
1.3.2 Cấu trúc dạng cây đa phân giải
Trong tín hiệu âm thanh thì phổ năng lượng tập trung ở tần số thấp và không đều nhau nên chúng ta có thể phân tín hiệu thành các tín hiệu băng con có bề rộng phổ không bằng nhau, do đó ta gọi là đa phân giải Chúng ta cũng phân tách tín hiệu thành nhiều tầng
G0(z)
4Ø
H2(z)
H1(z)
H3(z)
4Ø
4Øx(n)
Bank lọc tổng hợp, giả mãBank lọc phân tích, mã hóa
( )n xˆ
Trang 39Hình 1.19: Cấu trúc dạng cây đa phân giải của bank lọc phân tích
Ở tầng thứ nhất, tín hiệu x(n) đã được lấy mẫu với tần số lấy mẫu F , qua bộ lọc thông thấp H0(z) và bộ lọc thông cao H1(z)chia làm hai dải tần số: Dải tần số
nhất được tách ra tiếp tục cho qua bộ lọc thông thấp H01(z) và bộ lọc thông cao
)
(
02 z
bộ lọc thông thấp H (z) và bộ lọc thông cao H (z) chia ra làm hai dải tần: Dải tần
phân chia dải tần số thấp lại được tách ra và cho qua bộ lọc thông thấp và bộ lọc thông cao chia ra thành các dải tần nhỏ Như vậy sau 3 lần phân chia được 4 dải tần con Chúng ta sẽ mã hóa 4 dải tần con này với các bít khác nhau Do năng lượng của tín hiệu phổ phân bố không đồng đều trên toàn bộ các băng con nên chúng ta
1 01
[0 ,F S / 8] [F S / 8 ,F S / 4]
Trang 40cũng có thể làm giảm tỉ lệ bít của tín hiệu âm thanh bằng việc mã hóa số bít khác nhau với những dải tần khác nhau Cấu trúc dạng cây đa phân giải của bank lọc số tổng hợp 3 tầng được minh họa như trên hình (1.19).
Ở phần tổng hợp tín hiệu các băng con thu được đưa vào bộ giải mã rồi qua
chia làm nhiều tầng như ở phần phân chia nhưng khác với cấu trúc dạng cây phân giải đều là: tín hiệu dải tần số thấp sẽ được cộng lần lượt với dải tần số cao Nghĩa
lọc ở tầng thứ 2, tín hiệu qua tiếp tục cộng với tín hiệu đầu ra của
ra của bank lọc được tín hiệu như cấu trúc dạng cây đa phân giải của bank lọc số tổng hợp 3 tầng như hình (1.20)
Hình 1.20: Cấu trúc dạng cây đa phân giải của bank lọc tổng hợp
Ta có thể tổng hợp cấu trúc dạng cây đa phân giải tương đương của bank lọc
số 3 tầng phân tích và tổng hợp như hình (1.21)
) ( 0
01 z
G G101(z) )
(
01 z
) (
02 z
) (
1 z