2.2- Các định dạng âm thanh thực tế
2.2.1- Các định dạng âm thanh không nén : WAVE, AIFF
Là chuẩn định dạng tập tin âm thanh do IBM và Microsoft phát triển để lưu trữ dữ liệu âm thanh trên máy tính cá nhân chạy hệ điều hành Windows. Đây là chuẩn âm thanh có chất lượng cao nhất hiện nay.
Cả WAV và AIFF đều đựợc coi là các định dạng âm thanh “không thể mất”. Chúng được tạo ra dựa trên nền tảng PCM với một số thay đổi nhỏ trong bộ dữ liệu lưu trữ, ngoài ra hai định dạng này có thể chuyển đổi được cho nhau mà không hề bị giảm chất lượng âm thanh. Khác với dạng nén "mất", nén "không mất" (lossless) giữ gần như nguyên vẹn âm thanh gốc. Việc chuyển qua lại giữa các định dạng âm thanh "lossless" hầu như không làm mất âm thanh gốc.
Trong nhóm các định dạng âm thanh nén "không mất" thì Wave là định dạng đảm bảo tính trung thực âm thanh gốc cao nhất .Thực chất thì Wave là định dạng âm thanh không nén, là lựa chọn tốt nhất cho việc chuyển các đĩa CD nhạc thành file để lưu trữ trên máy tính. Bitrate của tập tin dạng này đa số được cố định là 1411kps, đôi khi cũng có chênh lệch, nhưng không đáng kể. Do chất lượng cao nên dung lượng rất lớn. Trung bình 1 phút âm thanh thì có dung lượng khoảng 10MB, 1 bài nhạc khoảng 4phút thì cũng hơn 40MB = 10 lần MP3 và 40 lần WMA chất lượng trung bình.
Do vấn đề về dung lượng nó quá lớn nên hiện tại không có trang web nhạc nào nghe trực tuyến.
2.2.2- Các định dạng âm thanh có nén không mất dữ liệu :
Lớp II Lớp II Lớp III Tần số Thấp Mono và stereo 18; 22,05; 24kHz Lớp II Lớp II Lớp III MPEG 1 Mono và stereo 32; 44,1; 48 kHz Lớp II Lớp II Lớp III MC 5 kênh 32; 44,1; 48 kHz MPEG 2
2.2.2.1- FLAC (Free Lossless Audio Codec)
FLAC là một định dạng dùng để nén các dữ liệu âm thanh. Không giống như định dạng MP3, ACC hay Vorbis, FLAC là một kỹ thuật nén âm thanh không mất thông tin. Cũng như các kỹ thuật nén nói chung, lợi ích lớn nhất của FLAC là làm giảm đáng kể nhu cầu về khả năng đường truyền và dung lượng lưu trữ. Hơn nữa khi một nguồn âm thanh được ghi với dạng FLAC, có thể được giải nén để tạo lại nguồn gốc trước khi nén. Các nguồn âm thanh thông thường khi nén với FLAC sẽ giảm kích thước từ 50 đến 60 %.
FLAC vừa thích hợp cho việc thưởng thức hàng ngày và vừa thích hợp cho việc lưu trữ âm thanh lâu dài. Vì FLAC là một kỹ thuật miễn phí và tự do cho nên được sự hỗ trợ của nhiều phần mềm tin học.
Hiện nay, các máy phát thanh lưu động có hỗ trợ FLAC còn ít. Tuy nhiên sự hỗ trợ FLAC trên các máy điện tử lưu động đang tiếp tục phát triển. Dạng nhạc này hiện tại là chưa có web nhạc nào nghe trực tuyến cả. Mọi người chỉ chia sẻ đường dẫn tải về nghe ở máy. Do vấn đề về bộ giải mã – codec - và dung lượng khá lớn so với dạng MP3 và WMA. Chất lượng cao hơn nhiều so với 2 loại MP3 và WMA kia. Bitrate của dạng FLAC nằm trong khoảng 500kps – 1050kps, cao hay thấp là do sao chép nhạc từ đĩa CD ra tùy chỉnh. Và dung lượng một tập tin nhạc dài 4phút 56giây, với bitrate là 1024kps là 36.2MB
2.2.2.2- ALAC (Apple Lossless Audio Codec)
Real Audio ( .ra, .ram, .rm ) Là định dạng độc quyền của Real Networks, được thiết kế chủ yếu cho nhạc phát trực tuyến vì có mức nén cao ( nhưng cũng có thể nghe “offline”). Phiên bản đầu tiên xuất hiện năm 1995, từ phiên bản 10 có thêm dạng nén “lossless”.
2.2.3- Các định dạng âm thanh có nén mất dữ liệu 2.2.3.1- WMA (Windows Media Audio) 2.2.3.1- WMA (Windows Media Audio)
WMA là chuẩn nén âm thanh được Microsoft phát triển, dùng cho Windows Media Player, chất lượng tương đương MP3 với bit rate thấp hơn 50% (vì vậy dung lượng file giảm hơn 50% ). Đây cũng là công nghệ nén nhạc độc quyền của công nghệ Windows Media. .Định dạng này đầu tiên được phát triển và sử dụng nhằm tránh những vấn đề giấy phép cho các sản phẩm sử dụng định dạng MP3. Tuy nhiên, nhờ những cải tiến liên tục cùng khả năng tương thích với các hệ thống kiểm duyệt quyền quản lý kĩ thuật số (DRM), WMA vẫn rất phổ biến
Ngày nay định dạng WMA đang là đối thủ cạnh tranh với MP3, Real Audio và ACC mặc dù những thiết bị cho định dạng này còn ít. MA Pro, 1 chương trình hỗ trợ nén nhạc thành WMA với những kỹ thuật codec tiên tiến, hỗ trợ nhiều kênh và âm
thanh độ phân giải cao.WMA Lossless, chuyển đổi sang WMA mà không mất dữ liệu (lossy).
2.2.3.2- MP3 (MPEG 1- Layer 3)
MPEG-1 Audio Player 3 (MP3) được học viện Fraunhofer Institute ( Đức ) phát triển vào cuối thập niên 1980. MP3 là định dạng nhạc nén “già” nhất và phổ biến nhất, gần như tất cả máy nghe nhạc đều hỗ trợ định dạng này.
MP3 là một dạng tập tin nén bằng cách loại bỏ một phần dữ liệu từ tập tin gốc (gọi là "nhạc nén"). Mục đích của việc này là để có được một tập tin nhạc có dung lượng nhỏ, có thể lưu trữ với số lượng lớn với chất lượng âm thanh có thể chấp nhận được.
Để có được file nhạc với kích thước nhỏ, MP3 sử dụng thuật toán để mã hoá và tái tạo track nhạc trên CD, loại bỏ một số âm thanh "ít quan trọng" - những âm thanh mà tai người thường không cảm thụ được (ví dụ như âm thanh nằm ngoài dải tần 20- 20.000 Hz). Các định dạng âm thanh nén khác cũng sử dụng cách thức tương tự, chỉ khác nhau về thuật toán (được gọi là "codec").
Một tập tin mp3 có nhiều bitrate khác nhau, bitrate càng cao thì chất lượng càng cao, và dung lượng lớn. Phổ biến là 32-64-128-195 kps, cao nhất của định dạng MP3 là 320 kps (kilobyte per second – số byte dữ liệu xử lý mỗi giây).
MP3PRO (.mp3pro). MP3PRO là thế hệ tiếp theo của MP3,dựa trên công nghệ của Coding Technologies (có kết hợp với Fraunhofer Institute ), có khả năng nén gấp đôi MP3 với chất lượng tương đương.
2.2.3.3- AAC (Advanced Audio Coding)
Advanced Audio Coding (AAC) - (ISO 14496-3) là một định dạng âm thanh đa năng nén kiểu lossy được định nghĩa theo tiêu chuẩn MPEG-2 và được phát triển bởi liên minh Fraunhofer, Dolby, Sony và AT&T. AAC được phát triển nhằm thay thế cho định dạng âm thanh MP3 để tích hợp trong container MP4 (một container của MPEG- 4 tiêu chuẩn hỗ trợ đầy đủ các tính năng phụ)
Dạng định này được phát triển để xóa đi những chỗ yếu của MP3 và nâng cao phương pháp mã hóa đã có. Do vậy những tín hiệu thu của âm thanh hay tiếng động sẽ được nhận biết và mã hóa 1 cách hiệu quả hơn hoặc những vấn đề của Pre-Echo sẽ giảm xuống nhiều.
AAC có thể tích hợp tới 48 kênh âm thanh (sample rate 96KHz) cộng thêm 15 kênh âm thanh tần số thấp (Low Frequency Enhancement-LFE) giới hạn sample rate ở 120 Hz.
- Low Complexity (LC) nghĩa là “ít phức tạp”. Ở mức độ Bitrate trung bình đến cao, được sử dụng trong hệ thống nhạc trực tuyến của Apple và RealNetWorks hoặc được cài sẵn trong phần cứng.
- High Efficiency (HE) nghĩa là “hiệu quả cao”. HE-AAC cũng được hiểu theo cách khác là AACPlus, AAC+ hay AAC SBR(Spectral Band Replication)... HE-AAC được phát triển nhằm sử dụng trong việc mã hóa với bitrate thấp – đặc biệt có tác dụng với tập tin âm thanh đa kênh (multichannel).
- Low Delay (LD) nghĩa là "Thời gian trễ thấp". Được sử dụng cho thời gian trễ nhỏ (khoảng 20ms) ở mức Bitrate trung bình đến mức độ cao. Được sử dụng trong lĩnh vực liên lạc, ví dụ như trong hệ thống Video Họp.
- Main Profile - Profile chính
Scalable Sample Rate (SSR) - dành cho "Streaming" hay "coi trực tuyến". Nó cho phép đưa lại dự liệu liên tục mà không bị vấp bằng cách giảm độ Bitrate, nếu như băng thông đường truyền không cho phép, hoặc độ băng thông cho phép thay đổi giảm mạnh
AAC là dạng định nén âm có tiêu hao về chất lượng, được sử dụng rộng rãi qua các kênh nhạc trực tuyến như iTunes Store, Real Music Store, LiquidAudio được gắn kèm với hệ thống chống sao chép DRM (ví dụ như FairPlay của Apple).
Trên máy iPod của Apple hay máy điện thoại di động của Nokia, Samsung, Sony Ericsson, Siemens có thể chơi những dữ liệu dạng AAC này. AAC đem lại độ nén cao hơn so với những dạng định khác với mức nén có thể tới 1:16. Vì vậy tốc độ 64 kbit/sec thì đã đạt được mức chất lượng khá cao, ở tốc độ 128 kbit/sec thì có thể ngang với chất lượng CD
Trong hệ thống phát sóng audio vệ tinh sử dụng bộ nén audio số AC-3, có thể mã hóa từ kênh 1 đến 5.1 của nguồn tín hiệu audio tại đầu ra bộ mã hóa PCM tạo thành dòng bít nối tiếp, với tốc độ số liệu thay đổi trong phạm vi 32 đến 640kbit/s. Trong hình 2.16, một chương trình audio số kênh 5.1, được tạo thành từ bộ mã hóa PCM điển hình, với tốc độ dòng bít trên 5Mbit/s (6 kênh audio x 48 kHz x 18bit = 5,184Mbit/s). Sau khi qua bộ mã hóa AC-3 thành dòng số liệu có tốc độ 384kbit/s. Các thiết bị truyền dẫn, điều chế dòng bit này thành dạng sóng tại tần số vô tuyến, sau đó được đưa tới bộ phát đáp phát sóng lên vệ tinh. Tổng cộng công suất và dải thông trong đường truyền theo đó được giảm đi bởi hệ số nén 13 trong hệ thống nén AC-3.
Tại bên thu tín hiệu được giải điều chế để thu lại dòng bit 384 Kbit/s, sau đó cho qua bộ giải mã AC-3, ta thu được chương trình audio kênh 5.1 gốc đã phát đi bên phát.