Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 32 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
32
Dung lượng
1,63 MB
Nội dung
Mã hóa băng ứng dụng xử lý tiếng Việt Trình bày: Lê Thị Huyền Trang Nội dung Lý thuyết mã hóa băng Kiến thức tiếng nói Ứng dụng mã hóa băng xử lý tiếng Việt Kết luận Tài liệu tham khảo Mở đầu Các hệ thống phát số giới dùng kỹ thuật mã hóa băng để nén tín hiệu âm thanh, với tỷ lệ nén cao Mã hóa băng thuật tốn mã hóa nén liệu có tổn hao, ứng dụng mã hóa âm Bên cạnh lĩnh vực xử lý tiếng nói đặc biệt tiếng Việt, có tiếng Việt thống tiếng dân tộc nhiều nhà khoa học quan tâm, nhà nước ta chi nhiều tiền cho đề tài nghiên cứu tiếng Việt Vì vậy, tơi chọn đề tài “Mã hóa băng ứng dụng xử lý tiếng Việt” Lý thuyết mã hóa băng Câu hỏi: - Mã hóa băng gì? - Tại phải mã hóa băng con? - Kỹ thuật mã hóa băng nào? - Mã hóa băng tín hiệu tiếng nói? Lý thuyết mã hóa băng Mã hóa băng gì? Mã hố băng q trình phân chia tín hiệu thành nhiều dải tần số thông qua lọc thông thấp, thông dải thông cao Các dải tần gọi băng Các băng lượng tử mã hố độc lập nhau, tuỳ thuộc vào tính chất thống kê mật độ lượng dải mà số bit mã hoá khác Lý thuyết mã hóa băng Tại phải mã hóa băng con? - Tín hiệu tiếng nói: Thơng thường lượng phổ tín hiệu phân bố khơng Năng lượng phổ tiếng nói chủ yếu tập trung miền tần số thấp, miền tần số cao lượng phổ tiếng nói nhỏ - Tín hiệu hình ảnh: Phổ lượng tín hiệu hình ảnh phân bố khơng dải phổ có lượng khác Dải có lượng lớn mã hoá với số bit lớn dải có lượng nhỏ mã hố với số bit => Nói chung tín hiệu thực tế có phân bố lượng khơng nhau, mã hố băng thuận lợi cho việc nén tín hiệu Lý thuyết mã hóa băng Kỹ thuật mã hóa băng nào? - Ứng dụng quan trọng dàn lọc số nhiều nhịp dùng để mã hóa băng - Hệ thống lọc số nhiều nhịp: Là hệ thống xử lý tín hiệu mà có tần số (hay nhịp) lấy mẫu thay đổi trình xử lý => Tăng tốc độ tính tốn lọc - Gồm có: + Bộ lọc phân chia + Bộ lọc nội suy + Bank lọc phân tích + Bank lọc tổng hợp + Bank lọc kênh QMF Lý thuyết mã hóa băng Kỹ thuật mã hóa băng nào? a Bộ lọc phân chia b Bộ lọc nội suy Lý thuyết mã hóa băng Kỹ thuật mã hóa băng nào? - Bank lọc số tập hợp lọc số với chung đầu vào nhiều đầu nhiều đầu vào đầu a Bank lọc phân tích b Bank lọc tổng hợp Lý thuyết mã hóa băng Kỹ thuật mã hóa băng nào? - Bank lọc QMF (bank lọc số gương cầu phương): Là kết hợp bank lọc số phân tích bank lọc số tổng hợp với phân chia nội suy để tạo bank lọc số nhiều nhịp 10 Ứng dụng SBC xử lý tiếng Việt - Sơ đồ khối mã hóa băng M kênh tổng quát 18 Ứng dụng SBC xử lý tiếng Việt - Nguyên lý mã hóa băng con: + SBC thuật tốn dùng mơ hình tâm lý thính giác để lượng tử hóa thích nghi thành phần tín hiệu mà tai người nghe + Tín hiệu âm miền thời gian lấy khoảng ngắn liên tiếp đưa vào bank lọc số Bank lọc phân chia tín hiệu thành băng (độ rộng phân bố băng gần dải tới hạn tai người tốt) + Sau lượng tử hóa mã hóa theo băng (tùy thuộc vào lượng tín hiệu băng mà mã hóa với số bit khác nhau) 19 Ứng dụng SBC xử lý tiếng Việt - Điều kiện để tăng hệ số nén tín hiệu tiếng Việt: + Tăng số kênh M (tăng độ phân giải tần số), dẫn đến cấp phát bit phù hợp cho băng + Cùng số kênh, mức chất lượng tín hiệu: Chọn tổ hợp phân chia phù hợp để tăng hệ số nén + Dựa vào phân bố phổ lượng tín hiệu tiếng nói 20 Ứng dụng SBC xử lý tiếng Việt - Tiếng dân tộc Tày: + Là ngôn ngữ 54 dân tộc Việt Nam + Cũng ngôn ngữ đơn âm tiết giống tiếng dân tộc Kinh, nên tượng nối âm, nuốt âm hay đồng hóa xảy giống tiếng Anh + Năng lượng phổ tín hiệu phân bố khơng đồng đều: 80% lượng tập trung 5kHz + Đối với băng hẹp từ 300Hz đến 3400Hz chất lượng tiếng nói chiếm 56% thơng tin âm 21 Ứng dụng SBC xử lý tiếng Việt - Tiếng dân tộc Tày: Qua phân tích ta thấy phổ tín hiệu tiếng nói trải rộng khoảng 12kHz, tần số lấy mẫu tối thiểu 24kHz Để tiện cho q trình phần tích sử dụng file âm *.wav, mã hóa PCM 16 bit/mẫu, mono, tốc độ 325kbps 22 Ứng dụng SBC xử lý tiếng Việt - Tiếng dân tộc Tày: + Ví dụ minh họa formant-dải tần số tăng cường tượng cộng hưởng (đặc trưng cho âm sắc nguyên âm): f0 xấp xỉ 893Hz, f1 xấp xỉ 1891Hz, f2 xấp xỉ 3401Hz… Hình vẽ: Biểu diễn formant f0, f1, f2 (nữ) 23 Ứng dụng SBC xử lý tiếng Việt - Ứng dụng SBC (88444) xử lý tiếng Việt: Từ phân tích ngôn ngữ luận văn chọn tổ hợp phân chia [88444] để phân chia tín hiệu thành băng con: Băng 1: Dải tần từ 0Hz đến 1378Hz Băng 2: Dải tần từ 1378Hz đến 2756Hz Băng 3: Dải tần từ 2756Hz đến 5513Hz Băng 4: Dải tần từ 5513Hz đến 8269Hz Băng 5: Dải tần từ 8269Hz đến 11025Hz 24 Ứng dụng SBC xử lý tiếng Việt - Sơ đồ mã hóa băng kênh: 25 Ứng dụng SBC xử lý tiếng Việt - Sơ đồ mã hóa băng kênh: + Với tín hiệu tiếng nói có tần số lấy mẫu fs=22025Hz (file *.wav, PCM, mono) qua SBC(88444) ta có tần số lấy mẫu tín hiệu băng 2756Hz (băng 0,1) 5513Hz (băng 2,3,4) + Nếu SBC(88444) tốc độ bit 132kbps, tốc độ bit trung bình là: + Tỷ lệ nén liệu là: 26 Ứng dụng SBC xử lý tiếng Việt - So sánh tín hiệu đầu vào đầu mã hóa băng a)So sánh phổ tín hiệu đầu vào tín hiệu khơi phục b) So sánh tín hiệu đầu vào tín hiệu sau SBC 27 Ứng dụng SBC xử lý tiếng Việt - Phổ băng tương ứng: Như vậy: Mã hóa băng thuận tiện cho việc nén lưu trữ thông tin - Đối với băng tần hẹp: Việc chia băng thích hợp giảm tỷ lệ số bit mã hóa -> Tổng số bit truyền nhỏ nhiều so với việc mã hóa tồn dải thơng với số bit - Đối với băng tần rộng ngồi việc giảm số bit, ta loại bỏ bớt vài băng tần cao mà chất lượng thông tin chấp nhận 28 Ứng dụng SBC xử lý tiếng Việt - Đề xuất ứng dụng SBC(88444) phát số qua Internet: + Nếu tốc độ bit 132kbps SBC(88444) có lỗi khơi phục nhỏ SBC(8842) sử dụng - Đề xuất ứng dụng hệ thống phát số IBOC: + AM-IBOC: Sử dụng SBC(88444) tốc độ bit 132kbps, dải thông cần thiết để truyền BAM-IBOC=33kHz (