Nguyên lý số hóa âm thanh

Một phần của tài liệu (LUẬN văn THẠC sĩ) tìm hiểu, nghiên cứu và ứng dụng một số thuật toán nén tiếng nói luận văn ths công nghệ thông tin 60 48 05001 (Trang 38 - 39)

 Sound Card có nhiệm vụ lấy giá trị mẫu tín hiệu.

 Phần mềm mã hóa có nhiệm vụ mã hóa giá trị mẫu tín hiệu thành con số. Khi số hóa, âm thanh được ghi dưới dạng tệp,có rất nhiều dạng tệp âm thanh khác nhau, nhưng có 3 dạng chính sau đây:

 Dạng tự nhiên: Như các tệp có đuôi WAV, AIF,…các tệp này cho âm thanh tốt song thời gian truyền lâu.

 Dạng nén: Các tệp Shock wave, Quick Time, MPEG,…để phát lại cần có phần mềm đặc biệt. Ưu điểm là kích thước nhỏ, nhưng mất thời gian giải nén, và chất lượng giảm.

 Dạng MIDI: là file chứa chương trình phát ra âm thanh do đó kích thước nhỏ, thuận lợi trong việc soạn thảo âm thanh, nhưng chất lượng phụ thuộc vào thiết bị chuyên dụng.

Nói chung, các tệp âm thanh số được lưu trữ trong một khuân dạng tương ứng với header của loại đó. Một số khuôn dạng lưu trữ như sau:

AU: Là các tệp có đuôi “.au”. Hỗ trợ các tệp dạng mono và stereo với độ

phân giải từ 8 bít tới 16 bít ,tần số lấy mẫu trong khoảng 8 KHz tới 48 KHz. Nguyên gốc trên nền UNIX, song cũng hỗ trợ bởi các ứng dụng PC và MAC.

AIFF: Là các tệp có đuôi “.aif “ (tức là audio interchange file format). Hỗ

trợ tệp âm thanh không nén dạng mono, stereo hoặc khuông dạng đa kênh (Multichanel). Độ phân giải và tần số lẫy mẫu trong phạm vi rất rộng đạt tới chất lượng CD (16 bít, lấy mẫu 44KHz). Nguyên gốc trên nền Macintosh nhưng cũng hỗ trợ trên PC và Unix.

WAV: Là các tệp có đuôi “.wav” (waveform audio). Hỗ trợ dạng mono,

stereo hoặc khuôn dạng đa kênh với tần số lấy mẫu 44 KHz, 16 bít lấy mẫu. Khuông dạng Wav nguyên gốc trên nền Windown, hiện nay đây là dạng tệp âm thanh phổ biến trên internet. WAV tương tự cấu trúc của “.aif “ nhưng khác phần đầu thông tin (Header).

3.2.File WAVE

Đây là dạng của Microsoft Windows. Các tệp của windows ứng dụng cho cả 2 dạng tệp âm thanh nổi (Stereo) và dạng đơn (mono) với độ phân giải và tần số lấy mẫu khác nhau. Kiểu tệp này cho phép sự định rõ RIFF (Resource Information File Format), và cho phép thông tin phụ của người sử dụng được nhúng vào cùng với tệp âm thanh. Dạng âm thanh PCM dùng cho Windows chuẩn chứa dữ liệu đã được mã hóa, dữ liệu đã được xác định theo kiểu điều biến mã xung dạng không bị nén.

3.2.1.Cấu trúcfile Wave

Đây là khuôn dạng phổ biến nhất để lưu trữ âm thanh số trong thế giới PC. Nó được thiết kế cho các ứng dụng Multimedia chạy dưới Microsoft Windows. Tệp wav tự mã hóa và mô tả dữ liệu của nó trong phần mềm mà ta sử dụng. Nó không giới hạn độ dài tệp, có thể lên tới 4 GB.

Một tệp Wave là một dạng đặc biệt của tệp RIFF, là nhóm nội dung của tệp tin thành các khối riêng biệt đồng thời mỗi khối sẽ gồm một Header (dùng đề qui định kiểu và kích thước của khối) và các byte dữ liệu, và mọi tệp RIFF đều bắt đầu với các ký tự RIFF. Tiếp theo đó là 4 byte độ dài và mã định dạng. Tệp Wav theo cấu trúc RIFF nên cấu trúc gồm các phần tử nhỏ gọi là khúc (chunk). Có 2 loại khúc được dùng trong tệp wav là khúc dữ liệu (data chunk), như một định danh biểu diễn độ dài và bản thân dữ liệu; và khúc định dạng (format chunk) chứa các dữ liệu mô tả thông tin trong nó.

Khuôn dạng chung tệp Wave như trong Hình 3.3:

R I F F Kích thước W A V E Khúc fmt Khúc data

Các byte kích thước

Một phần của tài liệu (LUẬN văn THẠC sĩ) tìm hiểu, nghiên cứu và ứng dụng một số thuật toán nén tiếng nói luận văn ths công nghệ thông tin 60 48 05001 (Trang 38 - 39)