1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Mã hóa băng con ứng dụng trong xử lý tiếng Việt

32 223 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 1,63 MB

Nội dung

Mở đầuthuật mã hóa băng con để nén tín hiệu âm thanh, với tỷ lệ nén rất dữ liệu có tổn hao, đã được ứng dụng trong mã hóa âm thanh.. Lý thuyết mã hóa băng conMã hoá băng con là quá trình

Trang 1

Mã hóa băng con ứng dụng trong xử lý tiếng Việt

1

Trình bày: Lê Thị Huyền Trang

Trang 2

Nội dung

2

Trang 3

Mở đầu

thuật mã hóa băng con để nén tín hiệu âm thanh, với tỷ lệ nén rất

dữ liệu có tổn hao, đã được ứng dụng trong mã hóa âm thanh.

rất nhiều các nhà khoa học quan tâm, nhà nước ta đã chi rất nhiều tiền cho các đề tài nghiên cứu tiếng Việt Vì vậy, tôi đã chọn

đề tài “Mã hóa băng con ứng dụng trong xử lý tiếng Việt”.

Trang 4

1 Lý thuyết mã hóa băng con

4

Câu hỏi:

- Mã hóa băng con là gì?

- Tại sao phải mã hóa băng con?

- Kỹ thuật mã hóa băng con như thế nào?

- Mã hóa băng con của tín hiệu tiếng nói?

Trang 5

1 Lý thuyết mã hóa băng con

Mã hoá băng con là quá trình phân chia tín hiệu thành

nhiều dải tần số thông qua các bộ lọc thông thấp, thông dải

và thông cao Các dải tần này gọi là các băng con.

Các băng con này sẽ được lượng tử và mã hoá độc lập

nhau, tuỳ thuộc vào tính chất thống kê và mật độ năng lượng

của từng dải mà số bit mã hoá khác nhau.

Mã hóa băng con là gì?

Trang 6

1 Lý thuyết mã hóa băng con

6

Tại sao phải mã hóa băng con?

- Tín hiệu tiếng nói: Thông thường năng lượng của phổ tín hiệu phân bốkhông đều Năng lượng phổ tiếng nói chủ yếu tập trung ở miền tần số thấp,còn miền tần số cao năng lượng của phổ tiếng nói rất nhỏ

- Tín hiệu hình ảnh: Phổ năng lượng của tín hiệu hình ảnh cũng phân bốkhông đều nhau vì vậy mỗi dải phổ sẽ có năng lượng khác nhau Dải nào cónăng lượng lớn sẽ được mã hoá với số bit lớn còn dải nào có năng lượngnhỏ sẽ được mã hoá với số bit ít hơn

việc nén tín hiệu.

Trang 7

1 Lý thuyết mã hóa băng con

Kỹ thuật mã hóa băng con như thế nào?

- Ứng dụng quan trọng của dàn lọc số nhiều nhịp là dùng để mã hóa băngcon

- Hệ thống lọc số nhiều nhịp: Là một hệ thống xử lý tín hiệu mà có tần số(hay nhịp) lấy mẫu được thay đổi trong quá trình xử lý => Tăng tốc độ tínhtoán của các bộ lọc

Trang 8

1 Lý thuyết mã hóa băng con

8

Kỹ thuật mã hóa băng con như thế nào?

Trang 9

1 Lý thuyết mã hóa băng con

Kỹ thuật mã hóa băng con như thế nào?

- Bank lọc số là một tập hợp các bộ lọc số với cùng chung một đầu vào vànhiều đầu ra hoặc nhiều đầu vào và một đầu ra

Trang 10

1 Lý thuyết mã hóa băng con

10

Kỹ thuật mã hóa băng con như thế nào?

số phân tích và bank lọc số tổng hợp với các bộ phân chia và bộ nội suy đểtạo ra bank lọc số nhiều nhịp

Trang 11

1 Lý thuyết mã hóa băng con

Mã hóa băng con của tín hiệu tiếng nói?

- Có 2 phương pháp:

+ Cấu trúc dạng cây đơn phân giải

a) Cấu trúc dạng cây đơn phân giải của

bank lọc phân tích b) Cấu trúc dạng cây đơn phân giải của bank lọc tổng hợp

Trang 12

1 Lý thuyết mã hóa băng con

12

Mã hóa băng con của tín hiệu tiếng nói?

- Có 2 phương pháp:

+ Cấu trúc dạng cây đa phân giải

a) Cấu trúc dạng cây đa phân giải của

bank lọc phân tích b) Cấu trúc dạng cây đa phân giải của bank lọc tổng hợp

Trang 13

1 Lý thuyết mã hóa băng con

Mã hóa băng con của tín hiệu tiếng nói?

- Tổng hợp bank lọc 4 kênh phân tích và tổng hợp:

a) Dạng cây đơn phân giải b) Dạng cây đa phân giải

Trang 14

2 Kiến thức cơ bản về tiếng nói

14

- Tiếng nói là phương tiện trao đổi thông tin

của con người

- Bản chất tiếng nói chính là sóng âm thanh

lan truyền trong không khí

- Tai người cảm nhận được các sóng âm có

Trang 15

2 Kiến thức cơ bản về tiếng nói

- Tỷ suất thời gian

- Hàm năng lượng thời gian ngắn

- Tần số vượt điểm không

- Phát hiện điểm cuối

- Tần số cơ bản

- Formant

Trang 16

2 Kiến thức cơ bản về tiếng nói

16

-Tín hiệu tiếng nói là tín hiệu

tương tự, việc biểu diễn và lưu

trữ sao cho không bị mất mát

thông tin là vấn đề quan trọng

trong các hệ thống thông tin số

sử dụng tiếng nói

- Biểu diễn theo dạng số tuân

theo lý thuyết lấy mẫu

- Quá trình rời rạc hóa tín hiệu

tiếng nói gồm 3 bước:

+ Lấy mẫu (tần số f0)

+ Lượng tử hóa (q)

+ Mã hóa và nén tín hiệu

Trang 17

2 Kiến thức cơ bản về tiếng nói

- Các phương pháp mã hóa tiếng nói:

+ Mã hóa dạng sóng: Miền thời gian (PCM, DPCM, ADPCM, DM )

Miền tần số (SBC, ATC)+ Mã hóa nguồn

+ Mã hóa lai

Trang 18

3 Ứng dụng SBC trong xử lý tiếng Việt

18

- Sơ đồ khối bộ mã hóa băng con M kênh tổng quát

Trang 19

3 Ứng dụng SBC trong xử lý tiếng Việt

- Nguyên lý mã hóa băng con:

+ SBC là thuật toán dùng mô hình tâm lý thính giác để lượng tử hóathích nghi những thành phần tín hiệu mà tai người nghe được

+ Tín hiệu âm thanh miền thời gian được lấy trên những khoảngngắn liên tiếp đưa vào bank lọc số Bank lọc phân chia tín hiệu thành các

băng con (độ rộng và phân bố của các băng con càng gần dải tới hạn của

tai người càng tốt)

+ Sau đó lượng tử hóa và mã hóa theo từng băng (tùy thuộc vàonăng lượng tín hiệu trong băng mà mã hóa với số bit khác nhau)

Trang 20

3 Ứng dụng SBC trong xử lý tiếng Việt

20

- Điều kiện để tăng hệ số nén tín hiệu tiếng Việt:

+ Tăng số kênh M (tăng độ phân giải tần số), dẫn đến cấp phát bitcàng phù hợp cho các băng con

+ Cùng số kênh, cùng mức chất lượng tín hiệu: Chọn tổ hợp phânchia phù hợp để tăng hệ số nén

+ Dựa vào phân bố phổ năng lượng của tín hiệu tiếng nói

Trang 21

3 Ứng dụng SBC trong xử lý tiếng Việt

- Tiếng dân tộc Tày:

+ Là một trong các ngôn ngữ của 54 dân tộc Việt Nam

+ Cũng là một ngôn ngữ đơn âm tiết giống tiếng dân tộc Kinh, nên không

có hiện tượng nối âm, nuốt âm hay đồng hóa xảy ra giống như tiếng Anh

+ Năng lượng phổ tín hiệu phân bố không đồng đều: 80% năng lượng tập

trung dưới 5kHz

+ Đối với băng hẹp từ 300Hz đến 3400Hz chất lượng tiếng nói chiếm 56%thông tin âm thanh

Trang 22

3 Ứng dụng SBC trong xử lý tiếng Việt

22

- Tiếng dân tộc Tày: Qua phân tích ta thấy phổ của tín hiệu tiếng nói trải rộngtrong khoảng 12kHz, tần số lấy mẫu tối thiểu là 24kHz Để tiện cho quá trìnhphần tích sử dụng file âm thanh đuôi *.wav, mã hóa PCM 16 bit/mẫu, mono,tốc độ 325kbps

Trang 23

3 Ứng dụng SBC trong xử lý tiếng Việt

- Tiếng dân tộc Tày:

+ Ví dụ minh họa formant-dải tần số được tăng cường do hiện tượng cộnghưởng (đặc trưng cho âm sắc của mỗi nguyên âm): f0 xấp xỉ 893Hz, f1 xấp

xỉ 1891Hz, f2 xấp xỉ 3401Hz…

Hình vẽ: Biểu diễn formant f0, f1, f2 (nữ)

Trang 24

3 Ứng dụng SBC trong xử lý tiếng Việt

24

- Ứng dụng SBC (88444) trong xử lý tiếng Việt: Từ các phân tích ngôn

ngữ trên luận văn chọn tổ hợp phân chia [88444] để phân chia tín hiệu

Trang 25

3 Ứng dụng SBC trong xử lý tiếng Việt

- Sơ đồ mã hóa băng con 5 kênh:

Trang 26

3 Ứng dụng SBC trong xử lý tiếng Việt

26

- Sơ đồ mã hóa băng con 5 kênh:

+ Với tín hiệu tiếng nói có tần số lấy mẫu fs=22025Hz (file *.wav, PCM,mono) qua SBC(88444) ta có tần số lấy mẫu các tín hiệu băng con lần lượt

là 2756Hz (băng 0,1) và 5513Hz (băng 2,3,4)

+ Nếu SBC(88444) tốc độ bit là 132kbps, thì tốc độ bit trung bình là:

+ Tỷ lệ nén dữ liệu là:

Trang 27

3 Ứng dụng SBC trong xử lý tiếng Việt

- So sánh tín hiệu đầu vào và đầu ra khi mã hóa băng con

Trang 28

3 Ứng dụng SBC trong xử lý tiếng Việt

28

- Phổ của 5 băng con tương ứng:

Như vậy: Mã hóa băng con rất thuận

tiện cho việc nén và lưu trữ thông tin.

- Đối với băng tần hẹp: Việc chia băng thích hợp sẽ giảm tỷ lệ số bit mã hóa -> Tổng số bit truyền sẽ nhỏ hơn rất nhiều

so với việc mã hóa toàn bộ dải thông với số bit như nhau.

- Đối với băng tần rộng thì ngoài việc giảm số bit, ta có thể loại bỏ bớt 1 vài băng tần cao mà chất lượng thông tin vẫn chấp nhận được.

Trang 29

3 Ứng dụng SBC trong xử lý tiếng Việt

- Đề xuất ứng dụng SBC(88444) trong phát thanh số qua Internet:

+ Nếu cùng tốc độ bit 132kbps thì SBC(88444) có lỗi khôi phục nhỏ hơnSBC(8842) đang sử dụng

- Đề xuất ứng dụng trong hệ thống phát thanh số IBOC:

+ AM-IBOC: Sử dụng SBC(88444) tốc độ bit 132kbps, dải thông cần thiết đểtruyền BAM-IBOC=33kHz (<phổ tần của AM 37,5Hz) Chất lượng tín hiệu tươngđương với phát thanh số trên Internet dùng SBC(8842) Bank lọc đơn giảnhơn so với bank lọc 32 kênh

+ FM-IBOC: Sử dụng SBC(88444) tốc độ bit 256kbps, dải thông truyền nằmtrong phổ tần của FM Chất lượng tín hiệu cao hơn so với phát thanh sốInternet Bank lọc đơn giản hơn so với bank lọc 32 kênh

Trang 30

4 Kết luận

30

- Phân tích được bản chất và đặc tính vật lý cơ bản của tiếng Việt nói chung

và tiếng dân tộc Tày nói riêng

- Đề xuất và chứng minh được căn cứ để lựa chọn tổ hợp phân chia tối ưu(88444) trong mã hóa băng con 5 kênh, rất thuận tiện cho việc nén và lưu trữthông tin

- Đề xuất phương án ứng dụng SBC (88444) vào phát thanh số ở Việt Nam

* Kiến nghị về hướng nghiên cứu tiếp theo:

- Nghiên cứu ứng dụng SBC(88444) vào phát thanh số theo hệ thống IBOCtrên thực nghiệm

- Tìm ra bộ mã hóa băng con với các tổ hợp phân chia mới, đảm bảo hàihòa giữa tham số tỷ lệ nén dữ liệu, chất lượng âm thanh và độ phức tạpcủa bank lọc, tùy theo từng mục đích và ứng dụng cụ thể

- Nghiên cứu về thực hành và xử lý trên mạch điện cụ thể để đưa mã hóabăng con đa phân giải tuyệt đối ứng dụng trong thực tế

Trang 31

5 Tài liệu tham khảo

1 Mai Ngọc Chừ, Vũ Đức Nghiệu, Hoàng Trọng Phiến (1999), Cơ sở ngôn ngữ học và tiếng Việt,

NXB ĐH & GD Chuyên nghiệp, Hà Nội.

2 John Phan Dương, Khoa Á Đông học, Đại học Cornell, Hoa Kỳ, Praat và việc phân tích ngữ âm

ngôn ngữ các dân tộc thiểu số tại Việt Nam, Tài liệu thuyết trình tại Khoa Ngôn ngữ học, Đại học

Khoa học xã hội và nhân văn, ĐHQG HN.

3 Đài tiếng nói Việt Nam, Phát thanh số, Quản lý khai thác thiết bị phát thanh AM, FM, Đầu thu

RRO.

4 PGS.TS Nguyễn Quốc Trung (2008), Xử lý tín hiệu và lọc số - tập 1 và 2 - tập 3(2011), NXB khoa

học và kỹ thuật, Hà Nội.

5 PGS.TS Hồ Anh Túy, Xử lý tín hiệu số, NXB Khoa học và kỹ thuật.

6 Ngô Thái Trị (2000), Audio số, Tạp trí Kỹ thuật phát thanh – truyền hình.

7 Nguyễn Xuân Trường (2009), Xử lý tín hiệu áp dụng trong phát thanh số, Luận án Tiến sĩ Kỹ

thuật, Đại học Bách Khoa Hà Nội, Hà Nội.

8 Jusub Kim (2003), Fiter bank design and subband coding, ENEE624 Advanced Digital

Processing Instrutor: Dr Babis Papadopoulos.

9 Martin Vetterli & Jelena Kovacevic (2007), Wavelet and Subband Coding, Originally published by

Prentice Hall PTR, Englewood Cliff, New Jersey University of Berlin, Germany.

10 Peter Noll (2000), MPEG digital audio coding standards, Technical University of Berlin, Germany.

Trang 32

32

Ngày đăng: 12/05/2018, 12:22

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Mai Ngọc Chừ, Vũ Đức Nghiệu, Hoàng Trọng Phiến (1999), Cơ sở ngôn ngữ học và tiếng Việt, NXB ĐH &amp; GD Chuyên nghiệp, Hà Nội Sách, tạp chí
Tiêu đề: Cơ sở ngôn ngữ học và tiếng Việt
Tác giả: Mai Ngọc Chừ, Vũ Đức Nghiệu, Hoàng Trọng Phiến
Nhà XB: NXB ĐH & GD Chuyên nghiệp
Năm: 1999
2. John Phan Dương, Khoa Á Đông học, Đại học Cornell, Hoa Kỳ, Praat và việc phân tích ngữ âm ngôn ngữ các dân tộc thiểu số tại Việt Nam, Tài liệu thuyết trình tại Khoa Ngôn ngữ học, Đại học Khoa học xã hội và nhân văn, ĐHQG HN Sách, tạp chí
Tiêu đề: Praat và việc phân tích ngữ âm"ngôn ngữ các dân tộc thiểu số tại Việt Nam
4. PGS.TS Nguyễn Quốc Trung (2008), Xử lý tín hiệu và lọc số - tập 1 và 2 - tập 3(2011), NXB khoa học và kỹ thuật, Hà Nội Sách, tạp chí
Tiêu đề: Xử lý tín hiệu và lọc số - tập 1 và 2 - tập 3(2011)
Tác giả: PGS.TS Nguyễn Quốc Trung (2008), Xử lý tín hiệu và lọc số - tập 1 và 2 - tập 3
Nhà XB: NXB khoahọc và kỹ thuật
Năm: 2011
3. Đài tiếng nói Việt Nam, Phát thanh số, Quản lý khai thác thiết bị phát thanh AM, FM, Đầu thu RRO Khác
5. PGS.TS Hồ Anh Túy, Xử lý tín hiệu số, NXB Khoa học và kỹ thuật Khác
6. Ngô Thái Trị (2000), Audio số, Tạp trí Kỹ thuật phát thanh – truyền hình Khác
7. Nguyễn Xuân Trường (2009), Xử lý tín hiệu áp dụng trong phát thanh số, Luận án Tiến sĩ Kỹ thuật, Đại học Bách Khoa Hà Nội, Hà Nội Khác
8. Jusub Kim (2003), Fiter bank design and subband coding, ENEE624 Advanced Digital Processing Instrutor: Dr. Babis Papadopoulos Khác
9. Martin Vetterli &amp; Jelena Kovacevic (2007), Wavelet and Subband Coding, Originally published by Prentice Hall PTR, Englewood Cliff, New Jersey. University of Berlin, Germany Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w