Spectral Band Replication – SBR - Xây dựng hệ thốn- 123docz.net

Trong mã hoá âm thanh truyền thống, khoảng thông tin có ý nghĩa được dùng để mã hoá tần số cao. Sự ra đời của SBR dựa trên ý tưởng về sự nhận biết được sự tương đồng mạnh giữa vùng tần số cao và vùng tần số thấp của tín hiệu âm thanh, một sự xấp xỉ tốt của tính hiệu âm thanh gốc cao có thể đạt được bằng một chuyển đổi từ tín hiệu âm thanh ở dải tần thấp.

Hình 3.24: Việc chuyển đổi trong quá trình tạo ra dãy tần số cao

Bên cạnh việc chuyển đổi thông thường này, việc tái tạo lại âm thanh ở dải tần cao cần phải được chỉ dẫn bởi những thông tin chuyển đổi nhưđường bao phổ của tín hiệu đầu vào để bù đắp những những thiếu xót quan trọng khác của các thành phần tần số cao. Những hướng dần này được xem như là dữ liệu của SBR. Như vậy hiệu quả của đóng gói dữ liệu SBR rất quan trọng để đạt được tốt độ bit như yêu cầu.

Phía mã hoá, tín hiệu đầu vào cần phải được phân tích, đường biên của dải tần số cao và các đặc tính của nó trong sự liên quan tới dải tần số thấp được mã hoá và kết quả này là dữ liệu của SBR sẽ tiếp tục được ghép vào luồng dữ liệu chung cần truyền đi. Ở phía nhận cần phải tách dữ liệu SBR ra, sau đó nhân giải mã bắt đầu hoạt động dựa trên luồng dữ liệu kết quả của phía phát kết hợp với việc sử dụng dữ liệu của SBR. Một giải mã không hỗ trợ SBR vẫn đó thể tương thích được nhưng kết quả sẽ bị giới hạn vể băng tần tín hiệu.

Hình 3.25: Chỉnh đường biên của dãy tần số cao

Cách tiếp cận của SBR tuy có vẻ đơn giản, nhưng để làm cho cách tiếp cận này làm việc hiệu quả và có thểđáp ứng được các yêu cầu sau thì quả là không đơn giản:

• Độ phân giải phổ phù hợp

• Khoảng thời gian tồn tại của dải tần sốđủ lâu để tránh hiện tượng pre-echo

• Trường hợp độ tương đồng giữa tần số cao và thấp trong âm thanh giọng nói của con người không đạt yêu cầu thì cần phải tinh chỉnh đường biên và sự

chuyển đổi sao cho phù hợp

• Tốc độ dữ liệu thấp cần phải đáp ứng đểđạt được băng thông như yêu cầu. Trong các nghiên cứu và thử nghiệm cách tiếp cận trên đã đem lại kết quả tốt và đáp ứng được đầy đủ tiêu chuẩn trên. Sự kết hợp của AAC va SBR được biết với tên HE-AAC v1 đã được tiêu chuẩn hoá trong MPEG-4 năm 2003

3.3.3.3. Parametric Stereo (PS)

Kỹ thuật PS là bước chính tiếp theo để tăng hiệu quả nén cho âm thanh ở tốt độ bit thấp. PS được tiêu chuẩn hoá trong MPEG-4. PS được tối ưu cho khoảng tốc độ bit 16-40 kbps và sẽđạt chất lượng cao ở tốc độ bit khoảng 24 kbps.

Dựa trên ý tưởng của SBR, khả năng làm việc của SBR sẽ tăng cao nếu tín hiệu âm thanh đầu vào có độ tương đồng cao về tần số. Bộ mã hoá PS tách phần âm thanh nền của tín hiệu âm thanh gốc nên sự tương đồng của tín hiệu sẽ cao giúp ích cho quá trình mã hoá âm thanh ở SBR.

Ở bộ mã hoá, tín hiệu của nhiều kênh âm thanh sau khi tách phần âm thanh nền sẽđược trộn lại thành một kênh âm thanh duy nhất. Việc này sẽ giúp ích nhiều cho việc nén âm thanh hơn là nén từng kênh âm thanh riêng lẻ. Bộ mã hoá âm thanh PS sau khi đã trộn các kênh âm thanh lại với nhau sẽ gửi đi kèm với dữ liệu về phần âm thanh đã được tách.

Ở bộ giải mã, tín hiệu âm thanh sẽ được tách ra thành những kênh như ban đầu rồi kết hợp lại với thông tin về âm thanh nền được gửi kèm đi. Hình … miêu tả nguyên lý cơ bản của quá trình xử lý của PS.

Hình 3.27: Biểu đồ bộ mã hoá HE-AAC

Hình 3.28: Biểu đồ bộ mã hoá HE-AAC

Điều cần phải lưu ý là chất lượng của các tín hiệu âm thanh sau khi bị nén phụ thuộc rất nhiều vào tốc độ bit. Hình … sẽ đưa ra các nhìn tổng quan về chất lượng âm thanh sau khi được nén với các chuẩn nén của họ AAC. Trong hình ta thấy ở tốc độ bit 48 kbps thì chất lượng của HE-AAC v2 và HE-AAC v1 tương đương nhau.

Hình 3.29: So sánh hiệu quả của các chuẩn nén họ AAC

Năm 2003, liên đoàn phát thanh châu Âu đã tổng kết những kết quả thử nghiệm của nhiều chuẩn nén khác nhau gồm có HE-AAC, AAC ở tốc độ bit 48 kbps. Trong kết quả thử nghiệm ưu thế thuộc về HE-AAC, tiếp theo là mp3Pro (một sự kết hợp giữa mp3 và SBR)

Hình 3.30: So sánh hiệu quả giữa chuẩn nén HE-AAC và các chuẩn nén khác

3.4. Chuẩn nén hình ảnh MPEG-4/H.264 3.4.1. Số hoá hình ảnh

Cũng như âm thanh hình ảnh trước khi truyền trên mạng số thì cũng cần được số hóa. Đối với các máy quay phim tương tự hay các máy ảnh phim thì chúng ta cần đưa dữ liệu qua các thiết bị chuyển đổi sang tín hiệu số, còn đối với máy

quay phim kĩ thuật số hay máy ảnh kĩ thuật số thì tín hiệu đầu ra đã là tín hiệu số nên không cần phải chuyển đổi.

3.4.2. Nén hình ảnh

Bao gồm nén ảnh và nén nhiều ảnh liên tiếp trong một đoạn Video. Phương pháp nén thường dùng đối với ảnh là JPEG (Joint Photographic Experts Group), đối với nhiều ảnh liên tiếp trong một đoạn Video là MPEG (Moving Picture Experts Group). Hai phương pháp này có đặc điểm chung là sử dụng phép biến đổi Cosine rời rạc DCT (Discrete Cosine Transform) và tiếp theo là một thuật toán mã hóa như RLC (Run Length Coding), VLC (Variable Length Coding),…Đối với nén MPEG thì người ta sử dụng thêm một số kĩ thuật nén chuyển động…

Spectral Band Replication – SBR

Chuẩn nén âm thanh HE-AAC

Đặc tính âm học của tai người