1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng bộ lọ gương cầu phương chebyshev trong xử lý tiếng nói

82 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Bộ Lọc Gương Cầu Phương Chebyshev Trong Xử Lý Tiếng Nói
Tác giả Nguyễn Hoàng Minh
Người hướng dẫn PGS.TS Nguyễn Quốc Trung
Trường học Trường Đại học Bách khoa Hà Nội
Chuyên ngành Kỹ thuật viễn thông
Thể loại Luận văn thạc sĩ
Năm xuất bản 2018
Thành phố Hà Nội
Định dạng
Số trang 82
Dung lượng 3,42 MB

Cấu trúc

  • Chương 1: CƠ BẢ N V B L C S VÀ BANK L C S QMF [1] [2] .............. 11 Ề Ộ Ọ Ố Ọ Ố 1.1. GI I THI U ................................................................................................. 11 ỚỆ 1.2. THI T K B LẾ Ế Ộ ỌC SỐ Ừ Ộ ỌC TƯƠNG TỰ T B L CHEBYSHEV (9)
    • 1.2.1. Đa thứ c Chebyshev (14)
    • 1.2.2. B l ộ ọc tương tự Chebyshev lo ạ i 1 (16)
    • 1.2.3. B l ộ ọc tương tự Chebyshev lo ại 2 (23)
    • 1.3. CÁC PHƯƠNG PHÁP TỔ NG H P B L C S IIR T B L Ợ Ộ Ọ Ố Ừ Ộ ỌC TƯƠNG TỰ (0)
      • 1.3.1. Phương pháp bấ t bi n xung ....................................................................... 30 ế 1.3.2. Phương pháp biến đổ i song tuy n ............................................................. 32 ế 1.3.3. Phương pháp tương đương vi phân (32)
    • 1.4. BANK L C S QMF ................................................................................... 33 Ọ Ố 1. Bank l ọc số phân tích (0)
      • 1.4.2. Bank l ọ c s ố ổ t ng h p ................................................................................. 34 ợ 1.4.3. Bank l c hai kênh QMF ............................................................................ 35 ọ 1.4.4. Bank l ọc số nhi u nh p M kênh ................................................................. 40 ềị 1.5. K ết luận chương (36)
    • 2.1. MÔ HÌNH T O TI Ạ ẾNG NÓI (0)
    • 2.2. BI U DI N S Ể Ễ Ố TI Ế NG NÓI (0)
      • 2.2.1. Xác đị nh t n s l y m u tín hi u ti ng nói ................................................ 45 ầ ố ấ ẫ ệ ế 2.2.2. Lượ ng t hoá ............................................................................................. 46 ử 2.2.3. Nén tín hi u ti ng nói ................................................................................ 46 ệế 2.3. MÃ HÓA TI NG NÓI.................................................................................. 47 Ế 2.3.1. Gi ới thiệ u (47)
      • 2.3.2. Các phương pháp mã hoá tiế ng nói (50)
    • 2.4. MÃ HÓA BĂNG CON CỦ A TÍN HI U TI NG NÓI [3] [4] ..................... 52 Ệ Ế 1. C u trúc d ng cây phân giấạ ải đề u [5] (0)
      • 2.4.2. C u trúc d ấ ạng cây đa phân giả i [5] (0)
    • 2.5. K T LU Ế ẬN CHƯƠNG (60)
  • Chương 3. Ứ NG D ỤNG MÃ HÓA BĂNG CON TRONG XỬ LÝ TI NG NÓI [3] [4] Ế [5] [6] 59 3.1. GI I THI U ................................................................................................. 59 ỚỆ 3.2. MÃ HÓA BĂNG CON TRONG XỬ LÝ TI NG NÓI ............................... 60 Ế 3.2.1. Nguyên lý c ủa mã hóa băng con ............................................................... 60 3.2.2. Điề u ki ện để tăng hệ ố s nén tín hi u ti ng nói trong SBC ........................ 61 ệế 3.2.3. L ựa chọ ầ n t n s l y m u............................................................................ 62 ố ấẫ 3.2.4. S bit trung bình trên m t m u .................................................................. 63 ốộẫ 3.3. Ứ NG D ỤNG MÃ HÓA BĂNG CON [88444] TRONG XỬ LÝ TI NG NÓI [3] .... 64 Ế (9)

Nội dung

Trang 1 NGUYỄN HOÀNG MINHBỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI--- Nguyễn Hồng MinhKỸ THUẬT VIỄN THƠNGỨNG DỤNG BỘ LỌC GƯƠNG CẦU PHƯƠNG CHEBYSHEV TRONG XỬ LÝ TIẾNG NÓI Tra

CƠ BẢ N V B L C S VÀ BANK L C S QMF [1] [2] 11 Ề Ộ Ọ Ố Ọ Ố 1.1 GI I THI U 11 ỚỆ 1.2 THI T K B LẾ Ế Ộ ỌC SỐ Ừ Ộ ỌC TƯƠNG TỰ T B L CHEBYSHEV

Đa thứ c Chebyshev

Các đa thức Chebyshev được định nghĩa như sau:

Xuất phát từ công thức lượng giác sau đây: x

(1.2) Quan hệ 2) (1 ở trên cho phép chúng ta bi u diể ễn đa thức Chebyshev theo x bắt đầ ừ hai đa thức đầu t u tiên và như sau:

Ngượ ạc l i chúng ta có th bi n x có s ể ế ố mũ bấ ỳt k dưới dạng đa thức Chebyshev như sau:

B l ộ ọc tương tự Chebyshev lo ạ i 1

Định nghĩa: B lộ ọc tương tự Chebyshev lo i 1 là b lạ ộ ọc có đáp ứng biên độ ợ g n sóng ở ả d i thông và giảm đơn điệ ở ảu d i ch n ắ

Vậy chúng ta có bình phương của đáp ứng biên độ ủa bộ ọc tương tự c l Chebyshev loại

(1.6) Ở đây: n là bậc c a b l c (ho c b c củ ộ ọ ặ ậ ủa đa thức Chebyshev) ε là tham số xác định biên độ ủ c a g n sóng d i thông ợ ở ả

Dao động giữa 0 và 1 với sự tăng trưởng đơn điệu sẽ dẫn đến sự xuất hiện của sóng giữa 1 và các giá trị khác Sự thay đổi này diễn ra một cách đồng nhất với các biến số liên quan.

Đối với các bậc ổn định, các điểm cực (-s) phải nằm bên trái trục ảo trong mặt phẳng s Điều này đảm bảo rằng các điểm cực (-s) sẽ luôn ở bên trái trục ảo, phản ánh tính ổn định của hệ thống.

• Xác định (s) và v ị trí các điểm cực của (s)

15 Để tìm hàm truyền đạ ủt c a (s) của bộ ọc ổn đị l nh chúng ta có th viể ết như sau:

Với Đố ớ ộ ọ ổn địi v i b l c nh ta có hàm truyền đạt (s) như sau:

; là hằng s ố Chúng ta có thể ế vi t lại và (s) bằng cách đổi bi n s ế ố như sau: e = k − n k = e + n u

H ng s ằ ố có thể được ch n bọ ằng cách sau đây:

Chúng ta có thể ế vi t:

Với n lẻ thì gở ốc tọa độ | ( )| = 1

Với n chẵn thì gở ốc tọa độ | ( )| =

• B lộ ọc tương tự Chebyshev loại 1 ở ầ t n s không chu n hóaố ẩ

Chúng ta biết rẳng t n s chuở ầ ốω ẩn hóa b i ở theo biểu th c (1.6) ta có: ứ

Vậy trong trường h p t n s ợ ầ ố không chu n hóa ta có: ẩ Ở đây:

Nhận xét v ề (s) và trong trường h p ợ không chuẩn hóa

Chúng ta biết rằng t n s chu n hóa ta có: ở ầ ố ẩ

Vậy ở ầ t n s không chu n hóa ta có: ố ẩ

Dẫn đến các điểm c c cự ủa (s) (-s) chính là nghiệm của :

Vậy phương trình hình ellipse có dạng sau đây:

Hình 1.1 Đồ hình ellipse thị

Theo biểu th c (1.11) t n s không chuứ ở ầ ố ẩn hóa chúng ta đã có: Ở ả d i thông ta có: Ở ả d i ch n ta có: ắ

Tính toán tiế ụp t c ta có:

Chú ý: Chúng ta chọn n là s nguyên ố

Như vậy, ta có th ểthiế ế ộ ọc tương tựt k b l Chebyshev theo các tham s ố ởtrên Sau đó chúng ta dùng các phép biến đổ ểi đ chuy n v b l c s ể ề ộ ọ ố

B l ộ ọc tương tự Chebyshev lo ại 2

Bộ lọc Chebyshev loại 2 là một loại bộ lọc có đáp ứng biên độ tốt trong dải tần số và giảm thiểu độ gợn sóng ở dải dừng, ngược lại với bộ lọc loại 1.

V m t toán h c ta có (ề ặ ọ L ) được cho b i bi u thở ể ức sau đây:

(1.16) Ở đây: là tần s giố ới hạn d i ch n ả ắ ε: là một tham s ố

T ừ đây ta có đáp ứng biên độ ủ c a bộ ọc tương tự l Chebyshev loại 2 như sau:

Mà ε và là các hằng s , vố ậy:

dao động giữa 0 và 1 trong dải chắn Ngoài ra ta có th vi ể ết:

22 dở ải chắn s ẽ dao động giữa hai giá trị 0 và

Chúng ta thường gọi độ ợ g n sóng d i ch n là ở ả ắ (hoặc ) Vậy:

V y tậ ại gố ọc t a độ ta có:

Tức là tại gốc tọa độ thì:

Các điểm cực và các điểm không

Vật ta thấ ằy r ng của bộ ọ l c Chebyshev lo i 2 chạ ứa tất cả các điểm không và các điểm c c ự

Các điểm không là nghi m cệ ủa phương trình sau:

Các điểm c c là nghi m cự ệ ủa phương trình sau:

Chúng ta giải phương trình sau đây:

Theo định nghĩa của đa thức Chebyshev ta có:

Chúng ta có th tính trong kho ng ể ả ho c trong kho ng ặ ả , ta sẽ thu được kết quả như nhau Giả ử s ta tính trong kho ng ả :

Gọi các điểm không là

Vậy các điểm không s n m trên trẽ ằ ục ảo

Chúng ta giải phương trình sau:

V y lậ ọi dụng k t qu cế ả ủa bộ ọ l c Chebyshev loại 1, chúng ta đặt:

T ừ đây ta có thể ết: vi

V y quan h giậ ệ ữa và với và như sau:

Cũng giống trường h p c u b l c Chebyshev lo i 1 ta có: ợ ả ộ ọ ạ

V y c p (ậ ặ ) sẽ ằm trên đườ n ng ellipse cps dạng sau đây:

Hình 1.2 Đồ hình ellipse thị

Ta có thể ế vi t và dưới dạng sau đây:

T ng kổ ết lại ta có: cặp ( ) nằm trên đường ellipse có bán kính là và như sau:

CÁC PHƯƠNG PHÁP TỔ NG H P B L C S IIR T B L Ợ Ộ Ọ Ố Ừ Ộ ỌC TƯƠNG TỰ

1.3 CÁC PHƯƠNG PHÁP TỔNG HỢP BỘ Ọ L C SỐ IIR T B LỪ Ộ ỌC TƯƠNG

Trong phần này chúng ta s nghiên c u m t sẽ ứ ộ ố phương pháp chuyển đổi hàm truyền đạt của m t h ộ ệthống tương tự sang hàm truyền đạt của hệthống s ( ) ốH z

Như vậy việc đầu tiên chúng ta phải tổng hợp được hàm truyền đạ ủt c a h thệ ống tương t ự

M t s ộ ố phương pháp chuyển đổi từ ệ h thống tương tựsang hệthống s ố như sau:

- Phương pháp 1: Phương pháp bất bi n xung ế

- Phương pháp 2: Phương pháp biến đổi song tuyến

- Phương pháp 3: Phương pháp tương đương vi phân

1.3.1 Phương pháp bất bi n xung ế

Nội dung của phương pháp là xác định đáp ứng xung (h n) của bộ ọc số ằ l b ng cách lấy mẫu đáp ứng xung của bộ ọc tương tự l :

Giả thi t hàm truyế ền đạt của bộ ọc tương tự l có d ng: ạ Ở đây là điểm cực đơn của

Hàm truyền đạt H z) cả( u b lộ ọc số được chuyển tương đương theo phương pháp bất biến xung là:

• Tính ổn định của bộ lọc:

B lộ ọc tương tự B lộ ọc số

N u tế ất cả các điểm cực của nằm bên trái m t ph ng s thì h s ặ ẳ ệ ẽ ổn định

N u tế ất cả các điểm cực của nằm bên trong vòng tròn đơn vịthì hệ ẽ ổ s n định

Các điểm cực của hàm số cũng chính là các điểm cực của đạo hàm Khi z = 0, ta nhận thấy rằng điểm này là điểm cực của hàm số, và cũng là điểm cực của đạo hàm Do đó, có thể kết luận rằng các điểm cực của hàm số được biến đổi trực tiếp thành các điểm cực của đạo hàm.

Các điểm cực n nằm bên trái mặt phẳng s sẽ dẫn đến việc các điểm cực tương ứng nằm trong vòng tròn đơn vị Điều này đảm bảo rằng điều kiện ổn định vẫn được duy trì khi chúng ta chuyển đổi theo phương pháp bất biến xung.

Hình 1.3: Hai mi n ề ổn định trong mặt phẳng và m s ặt phẳng c z ủa phương pháp bất biến xung

1.3.2 Phương pháp biến đổi song tuy n ế

Nội dung phương pháp là phép ánh xạ ặ m t ph ng cẳ s ủa bộ ọc tương tự l sang mặt ph ng c a b l c s ẳ z ủ ộ ọ ố

Hàm truyền đạt của b lộ ọc có thểnhận được từ hàm truyền đạt bộ ọc l tương tự , n u ta thay: ế

Hay quan h gi a hàm truyệ ữ ền đạt và là:

1.3.3 Phương pháp tương đương vi phân

Nội dung của phương pháp là chuyển phương trình vi phân của bộ ọc tương tự l tương đương thành phương trình sai phân của b l c s ộ ọ ố

Hàm truyền đạt của b lộ ọc có thểnhận được từ hàm truyền đạt bộ ọc l tương tự , n u ta thay: ế

Hay quan h gi a hàm truyệ ữ ền đạt và là:

Bank lọc số là m t t p h p các b lộ ậ ợ ộ ọc số ớ v i cùng chung mộ ầt đ u vào và nhi u ề đầu ra ho c v i nhiặ ớ ều đầu vào và mộ ầt đ u ra

Bank lọc số được chia ra làm hai loại là bank lọc số phân tích và bank lọc số t ng h p ổ ợ

1.4.1 Bank lọc số phân tích

Ngân hàng lọc số phân tích là một hệ thống các bộ lọc số có khả năng đáp ứng tính năng đầu vào và nhiều đầu ra, được mô tả qua cấu trúc cụ thể Cấu trúc của ngân hàng lọc số phân tích được minh họa trong hình (1.11).

Tín hiệu (x n) đưa vào đầu vào và được phân tích thành M tín hi u u ra là ệ ở đầ

(n) (0 k M -1), như vậy trong mi n t n s mề ầ ố ỗi tín hiệu ( ) là m t d i t n s n ộ ả ầ ố

MÔ HÌNH T O TI Ạ ẾNG NÓI

Hình 1.1 Đồ hình ellipse thị

Hình 1.2.Đồ hình ellipse thị

Hình 1.3: Hai mi n ề ổn định trong mặt phẳng và m s ặt phẳng c z ủa phương pháp bất bi n xungế

Hình 1.4.Đồ hình ellipse thị

Hình 1.5: Bank lọc số ổ t ng h p ợ

Hình 1.6: Bank lọc số nhi u nh p hai kênh QMF ề ị

Hình 1.7: Đáp ứng biên độ và a) trường hợp bộ lọc lý tưởng; b), c), d) không lý tưởng

Hình 1.8: Sơ đồ ổ t ng quát c a bank l c s kênh ủ ọ ốM

Hình 2.1: Mô hình t o ti ng nói (Fant 1960) ạ ế –

Hình 2.2: Mô hình t o ti ng nói ạ ế

Hình 2.3: Biểu di n tín hi u ti ng nói ễ ệ ế

Hình 2.4: Chất lượng ti ng nói so v i tế ớ ốc độ bit c a các bủ ộmã hoá

Hình 2.5: Mô hình t o tiạ ếng nói được sử ụ d ng b i mã hóa ngu n ở ồ

Hình 2.6: Cấu trúc tương đương dạng cây đa phân giải

Hình 3.1: Sơ đồ mã hóa băng con tổng quát M kênh

Hình 3.2: Một đoạn file ghi âm ti ng ế

Hình 3.3: Các băng con tương ứng v i tớ ổ ợ h p phân chia [88444]

Hình 3.4: Sơ đồ mã hóa băng con 5 kênh

Hình 3.5: Phổ ầ t n c a tín hi u vào x(n) ủ ệ

Hình 3.3: Các băng con tương ứng v i tổ ợớ h p phân chia [88444]

Hình 3.6: Phổ ầ t n c a 5 tín hiủ ệu băng con tại đầu ra các b l c ộ ọ

Hình 3.7 và 3.8 minh họa phổ tần của năm tín hiệu băng con tại đầu ra các bộ phân chia, trong khi Hình 3.9 thể hiện đáp ứng tần số của dàn lọc QMF.

Hình 3.10 thể hiện sự so sánh giữa phổ của tín hiệu đầu vào và tín hiệu đã được khôi phục Hình 3.11 minh họa sự khác biệt giữa tín hiệu đầu vào và tín hiệu đầu ra sau quá trình mã hóa băng con Cuối cùng, Hình 3.12 trình bày phổ của các băng con trong miền tần số số.

Khi mô hình toán học quá lớn, việc thiết kế các mạch điện trở nên phức tạp và khó khăn Nếu có thể thiết kế, việc hiệu chỉnh trở thành thách thức lớn do cần điều chỉnh nhiều phần tử, dẫn đến tính khả thi bị hạn chế Điều này tạo ra nhu cầu cấp thiết trong việc giảm sự phức tạp trong tính toán, thiết kế và đáp ứng thời gian thực.

Trong lịch sử phát triển công nghệ âm thanh, việc phát minh ra mã hóa băng con (SubBand Coding - SBC) đóng vai trò quan trọng trong việc cải thiện chất lượng âm thanh Ứng dụng đầu tiên của SBC trong xử lý âm thanh đã được thực hiện theo tiêu chuẩn số, mang lại những tiến bộ đáng kể trong lĩnh vực này.

MPEG/audio, được phát triển vào năm 1990 bởi ISO/IEC, đã trở thành tiêu chuẩn phổ biến trong phát thanh và truyền thông hiện đại Các hệ thống phát thanh trên toàn cầu hiện nay đều áp dụng kỹ thuật mã hóa băng con để nén tín hiệu âm thanh, mang lại hiệu suất nén cao Mã hóa băng con là một trong những thuật toán nén dữ liệu có tính chất ổn hao, giúp tối ưu hóa việc truyền tải âm thanh.

Mã hóa âm thanh có 10 ứng dụng chính, trong đó việc phân tích tín hiệu âm thanh và tiếng nói cho thấy rằng năng lượng phổ tín hiệu thường phân bố không đồng đều trên toàn bộ dải tần số Năng lượng của phổ âm thanh ở tần số thấp thường tập trung nhiều hơn, trong khi ở tần số cao, năng lượng của phổ âm thanh lại rất nhạt.

Hiện nay, lĩnh vực xử lý tiếng nói, đặc biệt là tiếng Việt, đang thu hút sự quan tâm lớn từ các nhà khoa học, với sự đầu tư mạnh mẽ từ nhà nước cho các nghiên cứu liên quan Việc nghiên cứu ứng dụng SBC trong xử lý tiếng Việt có vai trò quan trọng trong việc định hướng cho phát thanh tại Việt Nam Do đó, tôi đã chọn đề tài “Ứng dụng bậc cực gương cầu phương Chebyshev trong xử lý tiếng nói”, nhằm góp phần hoàn thiện kiến thức và cung cấp thông tin đầy đủ hơn về kỹ thuật mã hóa băng con trong nén tín hiệu tiếng nói Đề tài được trình bày thành 3 chương.

Chương 1: CƠ BẢN V B L C S VÀ BANK L C S QMF Ề Ộ Ọ Ố Ọ Ố

Chương này đề cập đến các vấn đề liên quan đến bộ lọc Chebyshev và thiết kế bộ lọc tương tự Đồng thời, nghiên cứu cũng phân tích và tổng hợp các bộ lọc QMF 2 kênh, cũng như các bộ lọc số nhiều nhịp M kênh.

Chương 2: ỔT NG QUAN C A TÍN HI U TI NG NÓI Ủ Ệ Ế

Chương này trình bày các kiến thức cơ bản về xử lý tín hiệu âm thanh, bao gồm mô hình tổng quát tiếng nói, cách biểu diễn và xử lý tiếng nói, cũng như các dạng mã hóa tiếng nói khác nhau Nội dung cũng đề cập đến ứng dụng trong xử lý tiếng nói với cấu trúc dữ liệu dạng cây đơn phân giải và đa phân giải.

Chương 3: ỨNG D NGỤ MÃ HÓA BĂNG CON TRONG X LÝ TI NG NÓI Ử Ế

Chương này tập trung phân tích đặc trưng của tiếng nói chung và tiếng Việt nói riêng, từ đó đề xuất phương án thiết kế ngân hàng ngữ âm số SBC với hệ thống phân chia rõ ràng.

[88444] phù h p So sánh k qu c a bank l c này v i các bank lợ ết ả ủ ọ ớ ọc đang ứng d ng ụ trong phát thanh số ệ hi n nay

Chương 1 CƠ BẢ : N V B L C S VÀ BANK L C S QMF Ề Ộ Ọ Ố Ọ Ố

Kỹ thuật lọc số nhiễu đang ngày càng được ứng dụng rộng rãi trong lĩnh vực xử lý tín hiệu, giúp tăng tốc độ tính toán trong các bộ lọc số bằng cách giảm số phép nhân thực hiện trong một giây.

Trong quá trình xử lý tín hiệu, dải tần số của tín hiệu có thể thay đổi do các phép lọc triệt tiêu các thành phần không mong muốn, dẫn đến bề rộng dải tần của tín hiệu xử lý giảm đi Điều này cho phép chúng ta giảm thiểu số phép tính trong bộ lọc số, từ đó tối ưu hóa hiệu suất xử lý tín hiệu.

Bộ lọc số nhiều nhề đã chứng minh tính ưu việt của mình trong lĩnh vực viễn thông, đặc biệt trong xử lý tín hiệu Các ứng dụng nổi bật bao gồm xử lý tiếng nói, xử lý hình ảnh, hệ thống antenna và kỹ thuật audio số Một trong những ứng dụng chính của nó là mã hóa băng con (subband coding) trong xử lý tiếng nói, mà chúng ta sẽ nghiên cứu sâu hơn trong phần tiếp theo.

H ệthống x lý s nhi u nh p là h ử ố ề ị ệ thống x lý s ử ốtín hiệu mà t n s ầ ố (hoặc nhịp) l y mấ ẫu được thay đổi trong quá trình x ử lý.

1.2 THIẾT KẾ Ộ Ọ B L C SỐ Ừ Ộ ỌC TƯƠNG TỰ T B L CHEBYSHEV Để ổ t ng h p các b l c s chúng ta có th chia ra làm hai l i chính: th nh t là ợ ộ ọ ố ể ạ ứ ấ chuy n t vi c thiể ừ ệ ết kếcác bộ ọc tương tự l sang b lộ ọc số ức là chúng ta phả, t i thi t k ế ế b lộ ọc tương tự sau đó dùng phương pháp chuyển đổi tương đương để thu được b lộ ọc số; loại thứ hai là các phương pháp tìm tối ưu nhờ ự s tham gia c a máy tính (ủ phương pháp này ít đượ ử ục s d ng) Chúng ta ch nghiên c u lo i th nh t ỉ ứ ạ ứ ấ

MÃ HÓA BĂNG CON CỦ A TÍN HI U TI NG NÓI [3] [4] 52 Ệ Ế 1 C u trúc d ng cây phân giấạ ải đề u [5]

Hình 1.1 Đồ hình ellipse thị

Hình 1.2.Đồ hình ellipse thị

Hình 1.3: Hai mi n ề ổn định trong mặt phẳng và m s ặt phẳng c z ủa phương pháp bất bi n xungế

Hình 1.4.Đồ hình ellipse thị

Hình 1.5: Bank lọc số ổ t ng h p ợ

Hình 1.6: Bank lọc số nhi u nh p hai kênh QMF ề ị

Hình 1.7: Đáp ứng biên độ và a) trường hợp bộ lọc lý tưởng; b), c), d) không lý tưởng

Hình 1.8: Sơ đồ ổ t ng quát c a bank l c s kênh ủ ọ ốM

Hình 2.1: Mô hình t o ti ng nói (Fant 1960) ạ ế –

Hình 2.2: Mô hình t o ti ng nói ạ ế

Hình 2.3: Biểu di n tín hi u ti ng nói ễ ệ ế

Hình 2.4: Chất lượng ti ng nói so v i tế ớ ốc độ bit c a các bủ ộmã hoá

Hình 2.5: Mô hình t o tiạ ếng nói được sử ụ d ng b i mã hóa ngu n ở ồ

Hình 2.6: Cấu trúc tương đương dạng cây đa phân giải

Hình 3.1: Sơ đồ mã hóa băng con tổng quát M kênh

Hình 3.2: Một đoạn file ghi âm ti ng ế

Hình 3.3: Các băng con tương ứng v i tớ ổ ợ h p phân chia [88444]

Hình 3.4: Sơ đồ mã hóa băng con 5 kênh

Hình 3.5: Phổ ầ t n c a tín hi u vào x(n) ủ ệ

Hình 3.3: Các băng con tương ứng v i tổ ợớ h p phân chia [88444]

Hình 3.6: Phổ ầ t n c a 5 tín hiủ ệu băng con tại đầu ra các b l c ộ ọ

Hình 3.7 thể hiện phổ tần của năm tín hiệu băng con tại đầu ra các b phân chia ộ Hình 3.8 mô tả phổ tần của năm tín hiệu băng con tại đầu ra các b n i suy ộ ộ Cuối cùng, Hình 3.9 trình bày đáp ứng tần số của dàn lọc QMF ầ ố ủ ọ.

Hình 3.10 thể hiện sự so sánh giữa phổ của tín hiệu đầu vào và tín hiệu đã được khôi phục Hình 3.11 so sánh tín hiệu đầu vào với tín hiệu đầu ra sau quá trình mã hóa băng con Cuối cùng, Hình 3.12 trình bày phổ của các băng con trong miền tần số.

Hiện nay, mạng viễn thông đang phát triển nhanh chóng và rộng rãi, tạo ra một hệ thống phức tạp với nhiều nút mạng và môi trường truyền dẫn đa dạng Để xử lý các vấn đề phức tạp này, cần đảm bảo chất lượng và độ chính xác cao Việc mô tả các hệ thống trong viễn thông thường dựa trên mô hình toán học, nhưng việc xây dựng mô hình này rất phức tạp do yêu cầu về độ chính xác và kích thước lớn của nó Mô hình toán học phức tạp đòi hỏi thời gian tính toán dài, có thể lên đến vài ngày trên máy tính cá nhân, điều này ảnh hưởng đến tính thời gian thực và chất lượng của hệ thống Do đó, thiết kế và tính khả thi của hệ thống viễn thông là rất quan trọng.

Trong các mô hình toán học lớn, việc thiết kế mạch điện để đáp ứng trở nên quá phức tạp, thậm chí không thể thực hiện được Ngay cả khi thiết kế được, việc hiệu chỉnh cũng gặp nhiều khó khăn do phải điều chỉnh nhiều phần tử, điều này không khả thi Vì vậy, giảm sự phức tạp trong tính toán, thiết kế và đáp ứng thời gian thực là một vấn đề quan trọng cần được giải quyết.

Trong lịch sử phát triển mã hóa âm thanh, một trong những tiến bộ quan trọng nhất là sự ra đời của công nghệ mã hóa băng con (SubBand Coding - SBC) Ứng dụng đầu tiên của SBC trong xử lý âm thanh đã tạo ra tiêu chuẩn mới cho việc truyền tải và lưu trữ âm thanh hiệu quả hơn.

MPEG/audio là một chuẩn âm thanh được phát triển vào năm 1990 bởi ISO/IEC, và hiện nay được sử dụng rộng rãi trong lĩnh vực phát thanh Các hệ thống phát thanh trên toàn thế giới hiện nay đều áp dụng kỹ thuật mã hóa băng con để nén tín hiệu âm thanh, mang lại hiệu quả nén cao Mã hóa băng con là một trong những thuật toán nén dữ liệu có tổn hao, đã được công nhận và áp dụng rộng rãi.

Mã hóa âm thanh có nhiều ứng dụng quan trọng, đặc biệt trong việc phân tích tín hiệu âm thanh và tiếng nói Năng lượng phổ tín hiệu thường phân bố không đồng đều trên toàn bộ dải tần số, với năng lượng của tín hiệu nói tập trung chủ yếu ở tần số thấp Ngược lại, ở tần số cao, năng lượng của phổ âm thanh thường rất thấp.

Chương 1: CƠ BẢN V B L C S VÀ BANK L C S QMF Ề Ộ Ọ Ố Ọ Ố

Chương này đề cập đến các vấn đề liên quan đến bộ lọc số, thiết kế bộ lọc số theo phương pháp Chebyshev Đồng thời, nghiên cứu về ngân hàng lời và phân tích, tổng hợp ngân hàng lọc QMF với hai kênh, cũng như ngân hàng lọc số nhiều nhịp M kênh.

Chương 2: ỔT NG QUAN C A TÍN HI U TI NG NÓI Ủ Ệ Ế

Chương này trình bày các kiến thức cơ bản về xử lý tín hiệu âm thanh, bao gồm mô hình tổng quát tiếng nói, cách biểu diễn tín hiệu âm thanh, các dạng mã hóa tiếng nói khác nhau, và ứng dụng trong xử lý tiếng nói với cấu trúc cây đơn phân giải và đa phân giải.

Chương 3: ỨNG D NGỤ MÃ HÓA BĂNG CON TRONG X LÝ TI NG NÓI Ử Ế

Chương này tập trung phân tích đặc trưng của tiếng nói chung và tiếng Việt nói riêng, từ đó đề xuất phương án thiết kế ngân hàng ngữ âm SBC với hệ thống phân chia rõ ràng.

[88444] phù h p So sánh k qu c a bank l c này v i các bank lợ ết ả ủ ọ ớ ọc đang ứng d ng ụ trong phát thanh số ệ hi n nay

Chương 1 CƠ BẢ : N V B L C S VÀ BANK L C S QMF Ề Ộ Ọ Ố Ọ Ố

Kỹ thuật lọc số nhiễu ngày càng được ứng dụng rộng rãi trong lĩnh vực xử lý tín hiệu, giúp tăng tốc độ tính toán trong các bộ lọc số bằng cách giảm số phép nhân thực hiện trong một giây.

Trong quá trình xử lý tín hiệu, băng tần của dải tần có thể thay đổi do các phép lọc tiêu cực các thành phần không mong muốn Khi đó, bề rộng dải tần của tín hiệu xử lý sẽ bị giảm, giúp giảm thiểu tần số mất mát cho phù hợp với băng thông của tín hiệu Nhờ vậy, chúng ta có thể giảm số phép tính trong bộ lọc số.

Bộ lọc số nhiều nhịp có tính chất ưu việt, được nghiên cứu và ứng dụng rộng rãi trong kỹ thuật viễn thông, đặc biệt là trong xử lý tín hiệu Nó bao gồm các lĩnh vực như xử lý tiếng nói, xử lý hình ảnh, hệ thống antenna và kỹ thuật audio số Đặc biệt, mã hóa băng con (subband coding) là ứng dụng chính của nó trong xử lý tiếng nói, mà chúng ta sẽ nghiên cứu sâu hơn trong phần sau.

H ệthống x lý s nhi u nh p là h ử ố ề ị ệ thống x lý s ử ốtín hiệu mà t n s ầ ố (hoặc nhịp) l y mấ ẫu được thay đổi trong quá trình x ử lý.

1.2 THIẾT KẾ Ộ Ọ B L C SỐ Ừ Ộ ỌC TƯƠNG TỰ T B L CHEBYSHEV Để ổ t ng h p các b l c s chúng ta có th chia ra làm hai l i chính: th nh t là ợ ộ ọ ố ể ạ ứ ấ chuy n t vi c thiể ừ ệ ết kếcác bộ ọc tương tự l sang b lộ ọc số ức là chúng ta phả, t i thi t k ế ế b lộ ọc tương tự sau đó dùng phương pháp chuyển đổi tương đương để thu được b lộ ọc số; loại thứ hai là các phương pháp tìm tối ưu nhờ ự s tham gia c a máy tính (ủ phương pháp này ít đượ ử ục s d ng) Chúng ta ch nghiên c u lo i th nh t ỉ ứ ạ ứ ấ

Ứ NG D ỤNG MÃ HÓA BĂNG CON TRONG XỬ LÝ TI NG NÓI [3] [4] Ế [5] [6] 59 3.1 GI I THI U 59 ỚỆ 3.2 MÃ HÓA BĂNG CON TRONG XỬ LÝ TI NG NÓI 60 Ế 3.2.1 Nguyên lý c ủa mã hóa băng con 60 3.2.2 Điề u ki ện để tăng hệ ố s nén tín hi u ti ng nói trong SBC 61 ệế 3.2.3 L ựa chọ ầ n t n s l y m u 62 ố ấẫ 3.2.4 S bit trung bình trên m t m u 63 ốộẫ 3.3 Ứ NG D ỤNG MÃ HÓA BĂNG CON [88444] TRONG XỬ LÝ TI NG NÓI [3] 64 Ế

Hình 2.1: Mô hình t o ti ng nói (Fant 1960) ạ ế –

Hình 2.2: Mô hình t o ti ng nói ạ ế

Hình 2.3: Biểu di n tín hi u ti ng nói ễ ệ ế

Hình 2.4: Chất lượng ti ng nói so v i tế ớ ốc độ bit c a các bủ ộmã hoá

Hình 2.5: Mô hình t o tiạ ếng nói được sử ụ d ng b i mã hóa ngu n ở ồ

Hình 2.6: Cấu trúc tương đương dạng cây đa phân giải

Hình 3.1: Sơ đồ mã hóa băng con tổng quát M kênh

Hình 3.2: Một đoạn file ghi âm ti ng ế

Hình 3.3: Các băng con tương ứng v i tớ ổ ợ h p phân chia [88444]

Hình 3.4: Sơ đồ mã hóa băng con 5 kênh

Hình 3.5: Phổ ầ t n c a tín hi u vào x(n) ủ ệ

Hình 3.3: Các băng con tương ứng v i tổ ợớ h p phân chia [88444]

Hình 3.6: Phổ ầ t n c a 5 tín hiủ ệu băng con tại đầu ra các b l c ộ ọ

Hình 3.7 và Hình 3.8 minh họa phổ tần của năm tín hiệu băng con tại đầu ra các b phân chia và b n i suy ộ ộ Trong khi đó, Hình 3.9 thể hiện đáp ứng tần số của dàn lọc QMF.

So sánh ph cổ của tín hiệu đầu vào và tín hiệu đã khôi phục cho thấy sự khác biệt đáng kể, trong khi so sánh tín hiệu đầu vào và tín hiệu ra sau mã hóa băng con cũng cho thấy sự khác biệt tương tự Phổ của các băng con trong miền tần số cũng được trình bày, giúp minh họa quá trình mã hóa và khôi phục tín hiệu Các hình ảnh này cung cấp cái nhìn tổng quan về quá trình mã hóa và khôi phục tín hiệu, giúp người đọc hiểu rõ hơn về các giai đoạn khác nhau của quá trình này.

Hiện nay, mạng viễn thông đang phát triển nhanh chóng và rộng rãi, dẫn đến sự hình thành của nhiều hệ thống phức tạp với nhiều nút mạng và môi trường truyền dẫn đa dạng Để xử lý những vấn đề phức tạp này, yêu cầu về chất lượng và độ chính xác là rất cao Thông thường, việc mô tả các hệ thống viễn thông dựa trên mô hình toán học của đối tượng, nhưng việc xây dựng mô hình này thường rất phức tạp Mô hình toán học để mô tả các hệ thống vật lý trong viễn thông thường có kích thước lớn và phức tạp, đòi hỏi thời gian tính toán lâu, thậm chí lên đến vài ngày trên máy tính cá nhân Điều này ảnh hưởng đến tính thời gian thực và chất lượng của hệ thống, làm cho việc thiết kế và tính khả thi trở thành yếu tố rất quan trọng trong thực thi hệ thống viễn thông.

Khi mô hình toán học quá phức tạp, việc thiết kế các mạch điện để đáp ứng trở nên rất khó khăn Nếu có thể thiết kế, vấn đề hiệu chỉnh lại rất phức tạp, vì cần phải điều chỉnh nhiều phần tử Điều này dẫn đến việc giảm sự phức tạp trong tính toán, thiết kế và đáp ứng thời gian thực trở thành một thách thức lớn.

Trong lịch sử phát triển công nghệ âm thanh, mã hóa băng con (SubBand Coding - SBC) là một trong những tiến bộ quan trọng nhất SBC đã được ứng dụng đầu tiên trong xử lý âm thanh theo tiêu chuẩn số, giúp nâng cao chất lượng âm thanh và tối ưu hóa băng thông truyền tải.

MPEG/audio là một chuẩn âm thanh được phát triển vào năm 1990 bởi ISO/IEC, và hiện nay được sử dụng rộng rãi trong phát thanh và truyền hình Các hệ thống phát thanh hiện đại trên toàn cầu đều áp dụng kỹ thuật mã hóa băng con để nén tín hiệu âm thanh, mang lại hiệu quả nén rất cao Mã hóa băng con là một trong những thuật toán mã hóa nén dữ liệu có tổn hao, đã được công nhận và ứng dụng phổ biến.

Mã hóa âm thanh là một lĩnh vực quan trọng với nhiều ứng dụng Phân tích tín hiệu âm thanh và tiếng nói cho thấy rằng năng lượng phổ tín hiệu thường phân bố không đồng đều trên toàn bộ dải tần số Cụ thể, năng lượng của phổ âm thanh trong tiếng nói thường tập trung ở tần số thấp, trong khi ở tần số cao, năng lượng của phổ âm thanh lại giảm đi đáng kể.

Chương 1: CƠ BẢN V B L C S VÀ BANK L C S QMF Ề Ộ Ọ Ố Ọ Ố

Chương 2: ỔT NG QUAN C A TÍN HI U TI NG NÓI Ủ Ệ Ế

Chương này trình bày các kiến thức chung về xử lý tín hiệu âm thanh, bao gồm mô hình tổng quát tiếng nói, cách biểu diễn và xử lý tiếng nói, cũng như các dạng mã hóa tiếng nói khác nhau Ngoài ra, chương cũng đề cập đến ứng dụng trong xử lý tiếng nói với cấu trúc dữ liệu dạng cây đơn và đa phân giải.

Chương 3: ỨNG D NGỤ MÃ HÓA BĂNG CON TRONG X LÝ TI NG NÓI Ử Ế

Chương này tập trung phân tích đặc điểm của tiếng nói chung và tiếng Việt nói riêng, từ đó đề xuất phương án thiết kế bảng lược đồ số SBC với hệ thống phân chia hợp lý.

[88444] phù h p So sánh k qu c a bank l c này v i các bank lợ ết ả ủ ọ ớ ọc đang ứng d ng ụ trong phát thanh số ệ hi n nay

Chương 1 CƠ BẢ : N V B L C S VÀ BANK L C S QMF Ề Ộ Ọ Ố Ọ Ố

Kỹ thuật lọc số nhiều nhấp ngày càng được ứng dụng rộng rãi trong lĩnh vực xử lý tín hiệu Nó có khả năng tăng tốc độ tính toán trong các bộ lọc số bằng cách giảm số phép nhân thực hiện trong một giây.

Trong quá trình xử lý tín hiệu, băng tần của dải tần số có thể thay đổi do các phép lọc loại bỏ các thành phần không mong muốn Khi đó, bề rộng dải tần của tín hiệu xử lý sẽ giảm, giúp giảm thiểu tần số không cần thiết cho phù hợp với băng thông của tín hiệu Nhờ vậy, chúng ta có thể giảm số phép tính trong bộ lọc số một cách hiệu quả.

Bộ lọc số nhiều nhịp có tính chất ưu việt, đã được nghiên cứu và ứng dụng rộng rãi trong kỹ thuật viễn thông, đặc biệt trong xử lý tín hiệu Các lĩnh vực áp dụng bao gồm xử lý tiếng nói, xử lý hình ảnh, hệ thống antenna và kỹ thuật audio số Đặc biệt, mã hóa băng con (subband coding) là ứng dụng chính trong xử lý tiếng nói, mà chúng tôi sẽ nghiên cứu sâu hơn trong phần sau.

H ệthống x lý s nhi u nh p là h ử ố ề ị ệ thống x lý s ử ốtín hiệu mà t n s ầ ố (hoặc nhịp) l y mấ ẫu được thay đổi trong quá trình x ử lý.

Để thiết kế bộ lọc số tương tự như bộ lọc Chebyshev, chúng ta có hai phương pháp chính: phương pháp đầu tiên là thiết kế bộ lọc tương tự và sau đó chuyển đổi sang bộ lọc số, trong khi phương pháp thứ hai sử dụng các kỹ thuật tối ưu hóa với sự hỗ trợ của máy tính, mặc dù phương pháp này ít được sử dụng Chúng ta sẽ tập trung nghiên cứu vào phương pháp đầu tiên.

Ngày đăng: 22/01/2024, 17:06

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w