Mở đầuthuật mã hóa băng con để nén tín hiệu âm thanh, với tỷ lệ nén rất dữ liệu có tổn hao, đã được ứng dụng trong mã hóa âm thanh.. Lý thuyết mã hóa băng conMã hoá băng con là quá trình
Trang 1Mã hóa băng con ứng dụng trong xử lý tiếng Việt
1
Trình bày: Lê Thị Huyền Trang
Trang 2Nội dung
2
Trang 3Mở đầu
thuật mã hóa băng con để nén tín hiệu âm thanh, với tỷ lệ nén rất
dữ liệu có tổn hao, đã được ứng dụng trong mã hóa âm thanh.
rất nhiều các nhà khoa học quan tâm, nhà nước ta đã chi rất nhiều tiền cho các đề tài nghiên cứu tiếng Việt Vì vậy, tôi đã chọn
đề tài “Mã hóa băng con ứng dụng trong xử lý tiếng Việt”.
Trang 41 Lý thuyết mã hóa băng con
4
Câu hỏi:
- Mã hóa băng con là gì?
- Tại sao phải mã hóa băng con?
- Kỹ thuật mã hóa băng con như thế nào?
- Mã hóa băng con của tín hiệu tiếng nói?
Trang 51 Lý thuyết mã hóa băng con
Mã hoá băng con là quá trình phân chia tín hiệu thành
nhiều dải tần số thông qua các bộ lọc thông thấp, thông dải
và thông cao Các dải tần này gọi là các băng con.
Các băng con này sẽ được lượng tử và mã hoá độc lập
nhau, tuỳ thuộc vào tính chất thống kê và mật độ năng lượng
của từng dải mà số bit mã hoá khác nhau.
Mã hóa băng con là gì?
Trang 61 Lý thuyết mã hóa băng con
6
Tại sao phải mã hóa băng con?
- Tín hiệu tiếng nói: Thông thường năng lượng của phổ tín hiệu phân bốkhông đều Năng lượng phổ tiếng nói chủ yếu tập trung ở miền tần số thấp,còn miền tần số cao năng lượng của phổ tiếng nói rất nhỏ
- Tín hiệu hình ảnh: Phổ năng lượng của tín hiệu hình ảnh cũng phân bốkhông đều nhau vì vậy mỗi dải phổ sẽ có năng lượng khác nhau Dải nào cónăng lượng lớn sẽ được mã hoá với số bit lớn còn dải nào có năng lượngnhỏ sẽ được mã hoá với số bit ít hơn
việc nén tín hiệu.
Trang 71 Lý thuyết mã hóa băng con
Kỹ thuật mã hóa băng con như thế nào?
- Ứng dụng quan trọng của dàn lọc số nhiều nhịp là dùng để mã hóa băngcon
- Hệ thống lọc số nhiều nhịp: Là một hệ thống xử lý tín hiệu mà có tần số(hay nhịp) lấy mẫu được thay đổi trong quá trình xử lý => Tăng tốc độ tínhtoán của các bộ lọc
Trang 81 Lý thuyết mã hóa băng con
8
Kỹ thuật mã hóa băng con như thế nào?
Trang 91 Lý thuyết mã hóa băng con
Kỹ thuật mã hóa băng con như thế nào?
- Bank lọc số là một tập hợp các bộ lọc số với cùng chung một đầu vào vànhiều đầu ra hoặc nhiều đầu vào và một đầu ra
Trang 101 Lý thuyết mã hóa băng con
10
Kỹ thuật mã hóa băng con như thế nào?
số phân tích và bank lọc số tổng hợp với các bộ phân chia và bộ nội suy đểtạo ra bank lọc số nhiều nhịp
Trang 111 Lý thuyết mã hóa băng con
Mã hóa băng con của tín hiệu tiếng nói?
- Có 2 phương pháp:
+ Cấu trúc dạng cây đơn phân giải
a) Cấu trúc dạng cây đơn phân giải của
bank lọc phân tích b) Cấu trúc dạng cây đơn phân giải của bank lọc tổng hợp
Trang 121 Lý thuyết mã hóa băng con
12
Mã hóa băng con của tín hiệu tiếng nói?
- Có 2 phương pháp:
+ Cấu trúc dạng cây đa phân giải
a) Cấu trúc dạng cây đa phân giải của
bank lọc phân tích b) Cấu trúc dạng cây đa phân giải của bank lọc tổng hợp
Trang 131 Lý thuyết mã hóa băng con
Mã hóa băng con của tín hiệu tiếng nói?
- Tổng hợp bank lọc 4 kênh phân tích và tổng hợp:
a) Dạng cây đơn phân giải b) Dạng cây đa phân giải
Trang 142 Kiến thức cơ bản về tiếng nói
14
- Tiếng nói là phương tiện trao đổi thông tin
của con người
- Bản chất tiếng nói chính là sóng âm thanh
lan truyền trong không khí
- Tai người cảm nhận được các sóng âm có
Trang 152 Kiến thức cơ bản về tiếng nói
- Tỷ suất thời gian
- Hàm năng lượng thời gian ngắn
- Tần số vượt điểm không
- Phát hiện điểm cuối
- Tần số cơ bản
- Formant
Trang 162 Kiến thức cơ bản về tiếng nói
16
-Tín hiệu tiếng nói là tín hiệu
tương tự, việc biểu diễn và lưu
trữ sao cho không bị mất mát
thông tin là vấn đề quan trọng
trong các hệ thống thông tin số
sử dụng tiếng nói
- Biểu diễn theo dạng số tuân
theo lý thuyết lấy mẫu
- Quá trình rời rạc hóa tín hiệu
tiếng nói gồm 3 bước:
+ Lấy mẫu (tần số f0)
+ Lượng tử hóa (q)
+ Mã hóa và nén tín hiệu
Trang 172 Kiến thức cơ bản về tiếng nói
- Các phương pháp mã hóa tiếng nói:
+ Mã hóa dạng sóng: Miền thời gian (PCM, DPCM, ADPCM, DM )
Miền tần số (SBC, ATC)+ Mã hóa nguồn
+ Mã hóa lai
Trang 183 Ứng dụng SBC trong xử lý tiếng Việt
18
- Sơ đồ khối bộ mã hóa băng con M kênh tổng quát
Trang 193 Ứng dụng SBC trong xử lý tiếng Việt
- Nguyên lý mã hóa băng con:
+ SBC là thuật toán dùng mô hình tâm lý thính giác để lượng tử hóathích nghi những thành phần tín hiệu mà tai người nghe được
+ Tín hiệu âm thanh miền thời gian được lấy trên những khoảngngắn liên tiếp đưa vào bank lọc số Bank lọc phân chia tín hiệu thành các
băng con (độ rộng và phân bố của các băng con càng gần dải tới hạn của
tai người càng tốt)
+ Sau đó lượng tử hóa và mã hóa theo từng băng (tùy thuộc vàonăng lượng tín hiệu trong băng mà mã hóa với số bit khác nhau)
Trang 203 Ứng dụng SBC trong xử lý tiếng Việt
20
- Điều kiện để tăng hệ số nén tín hiệu tiếng Việt:
+ Tăng số kênh M (tăng độ phân giải tần số), dẫn đến cấp phát bitcàng phù hợp cho các băng con
+ Cùng số kênh, cùng mức chất lượng tín hiệu: Chọn tổ hợp phânchia phù hợp để tăng hệ số nén
+ Dựa vào phân bố phổ năng lượng của tín hiệu tiếng nói
Trang 213 Ứng dụng SBC trong xử lý tiếng Việt
- Tiếng dân tộc Tày:
+ Là một trong các ngôn ngữ của 54 dân tộc Việt Nam
+ Cũng là một ngôn ngữ đơn âm tiết giống tiếng dân tộc Kinh, nên không
có hiện tượng nối âm, nuốt âm hay đồng hóa xảy ra giống như tiếng Anh
+ Năng lượng phổ tín hiệu phân bố không đồng đều: 80% năng lượng tập
trung dưới 5kHz
+ Đối với băng hẹp từ 300Hz đến 3400Hz chất lượng tiếng nói chiếm 56%thông tin âm thanh
Trang 223 Ứng dụng SBC trong xử lý tiếng Việt
22
- Tiếng dân tộc Tày: Qua phân tích ta thấy phổ của tín hiệu tiếng nói trải rộngtrong khoảng 12kHz, tần số lấy mẫu tối thiểu là 24kHz Để tiện cho quá trìnhphần tích sử dụng file âm thanh đuôi *.wav, mã hóa PCM 16 bit/mẫu, mono,tốc độ 325kbps
Trang 233 Ứng dụng SBC trong xử lý tiếng Việt
- Tiếng dân tộc Tày:
+ Ví dụ minh họa formant-dải tần số được tăng cường do hiện tượng cộnghưởng (đặc trưng cho âm sắc của mỗi nguyên âm): f0 xấp xỉ 893Hz, f1 xấp
xỉ 1891Hz, f2 xấp xỉ 3401Hz…
Hình vẽ: Biểu diễn formant f0, f1, f2 (nữ)
Trang 243 Ứng dụng SBC trong xử lý tiếng Việt
24
- Ứng dụng SBC (88444) trong xử lý tiếng Việt: Từ các phân tích ngôn
ngữ trên luận văn chọn tổ hợp phân chia [88444] để phân chia tín hiệu
Trang 253 Ứng dụng SBC trong xử lý tiếng Việt
- Sơ đồ mã hóa băng con 5 kênh:
Trang 263 Ứng dụng SBC trong xử lý tiếng Việt
26
- Sơ đồ mã hóa băng con 5 kênh:
+ Với tín hiệu tiếng nói có tần số lấy mẫu fs=22025Hz (file *.wav, PCM,mono) qua SBC(88444) ta có tần số lấy mẫu các tín hiệu băng con lần lượt
là 2756Hz (băng 0,1) và 5513Hz (băng 2,3,4)
+ Nếu SBC(88444) tốc độ bit là 132kbps, thì tốc độ bit trung bình là:
+ Tỷ lệ nén dữ liệu là:
Trang 273 Ứng dụng SBC trong xử lý tiếng Việt
- So sánh tín hiệu đầu vào và đầu ra khi mã hóa băng con
Trang 283 Ứng dụng SBC trong xử lý tiếng Việt
28
- Phổ của 5 băng con tương ứng:
Như vậy: Mã hóa băng con rất thuận
tiện cho việc nén và lưu trữ thông tin.
- Đối với băng tần hẹp: Việc chia băng thích hợp sẽ giảm tỷ lệ số bit mã hóa -> Tổng số bit truyền sẽ nhỏ hơn rất nhiều
so với việc mã hóa toàn bộ dải thông với số bit như nhau.
- Đối với băng tần rộng thì ngoài việc giảm số bit, ta có thể loại bỏ bớt 1 vài băng tần cao mà chất lượng thông tin vẫn chấp nhận được.
Trang 293 Ứng dụng SBC trong xử lý tiếng Việt
- Đề xuất ứng dụng SBC(88444) trong phát thanh số qua Internet:
+ Nếu cùng tốc độ bit 132kbps thì SBC(88444) có lỗi khôi phục nhỏ hơnSBC(8842) đang sử dụng
- Đề xuất ứng dụng trong hệ thống phát thanh số IBOC:
+ AM-IBOC: Sử dụng SBC(88444) tốc độ bit 132kbps, dải thông cần thiết đểtruyền BAM-IBOC=33kHz (<phổ tần của AM 37,5Hz) Chất lượng tín hiệu tươngđương với phát thanh số trên Internet dùng SBC(8842) Bank lọc đơn giảnhơn so với bank lọc 32 kênh
+ FM-IBOC: Sử dụng SBC(88444) tốc độ bit 256kbps, dải thông truyền nằmtrong phổ tần của FM Chất lượng tín hiệu cao hơn so với phát thanh sốInternet Bank lọc đơn giản hơn so với bank lọc 32 kênh
Trang 304 Kết luận
30
- Phân tích được bản chất và đặc tính vật lý cơ bản của tiếng Việt nói chung
và tiếng dân tộc Tày nói riêng
- Đề xuất và chứng minh được căn cứ để lựa chọn tổ hợp phân chia tối ưu(88444) trong mã hóa băng con 5 kênh, rất thuận tiện cho việc nén và lưu trữthông tin
- Đề xuất phương án ứng dụng SBC (88444) vào phát thanh số ở Việt Nam
* Kiến nghị về hướng nghiên cứu tiếp theo:
- Nghiên cứu ứng dụng SBC(88444) vào phát thanh số theo hệ thống IBOCtrên thực nghiệm
- Tìm ra bộ mã hóa băng con với các tổ hợp phân chia mới, đảm bảo hàihòa giữa tham số tỷ lệ nén dữ liệu, chất lượng âm thanh và độ phức tạpcủa bank lọc, tùy theo từng mục đích và ứng dụng cụ thể
- Nghiên cứu về thực hành và xử lý trên mạch điện cụ thể để đưa mã hóabăng con đa phân giải tuyệt đối ứng dụng trong thực tế
Trang 315 Tài liệu tham khảo
1 Mai Ngọc Chừ, Vũ Đức Nghiệu, Hoàng Trọng Phiến (1999), Cơ sở ngôn ngữ học và tiếng Việt,
NXB ĐH & GD Chuyên nghiệp, Hà Nội.
2 John Phan Dương, Khoa Á Đông học, Đại học Cornell, Hoa Kỳ, Praat và việc phân tích ngữ âm
ngôn ngữ các dân tộc thiểu số tại Việt Nam, Tài liệu thuyết trình tại Khoa Ngôn ngữ học, Đại học
Khoa học xã hội và nhân văn, ĐHQG HN.
3 Đài tiếng nói Việt Nam, Phát thanh số, Quản lý khai thác thiết bị phát thanh AM, FM, Đầu thu
RRO.
4 PGS.TS Nguyễn Quốc Trung (2008), Xử lý tín hiệu và lọc số - tập 1 và 2 - tập 3(2011), NXB khoa
học và kỹ thuật, Hà Nội.
5 PGS.TS Hồ Anh Túy, Xử lý tín hiệu số, NXB Khoa học và kỹ thuật.
6 Ngô Thái Trị (2000), Audio số, Tạp trí Kỹ thuật phát thanh – truyền hình.
7 Nguyễn Xuân Trường (2009), Xử lý tín hiệu áp dụng trong phát thanh số, Luận án Tiến sĩ Kỹ
thuật, Đại học Bách Khoa Hà Nội, Hà Nội.
8 Jusub Kim (2003), Fiter bank design and subband coding, ENEE624 Advanced Digital
Processing Instrutor: Dr Babis Papadopoulos.
9 Martin Vetterli & Jelena Kovacevic (2007), Wavelet and Subband Coding, Originally published by
Prentice Hall PTR, Englewood Cliff, New Jersey University of Berlin, Germany.
10 Peter Noll (2000), MPEG digital audio coding standards, Technical University of Berlin, Germany.
Trang 3232