PHƯƠNG PHÁP mã hóa các GIẢI tần CON (SUBBAND CODING –SBC )

30 1.5K 5
PHƯƠNG PHÁP mã hóa các GIẢI tần CON  (SUBBAND CODING –SBC )

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ──────── * ─────── BÀI TẬP LỚN BỘ MÔN XỬ LÍ DỮ LIỆU ĐA PHƯƠNG TIỆN ĐỀ TÀI : PHƯƠNG PHÁP MÃ HÓA CÁC GIẢI TẦN CON (SUBBAND CODING –SBC ) VÀ ÁP DỤNG Giáo viên hướng dẫn : PGS.TS Nguyễn Thị Hoàng Lan Sinh viên thực : Lớp Nguyễn Trung Đức 20111423 Phạm Gia Lâm 20111745 Nguyễn Duy Tuấn 20112434 Vũ Ngọc Bình 20111178 : CNTT&TT 1.2 –K56 Hà Nội 5-2015 Mục lục Phân công công việc Họ tên MSSV Lớp Nhiệm vụ Nguyễn Trung Đức 20111423 CNTT-TT 1.2 Tìm hiểu chung nguyên tắc mã hóa giải tần Phạm Gia Lâm 20111175 CNTT-TT 1.2 Phân tích sơ đồ áp dụng mã hóa SBC nén ảnh (video) Nguyễn Duy Tuấn 20112434 CNTT-TT 1.2 Tìm hiểu mã hóa SBC nén audio Vũ Ngọc Bình 20111174 CNTT-TT 1.2 Sơ đồ thực nén audio thử nghiệm I Nguyên tắc chung mã hóa SBC: Nguyên tắc chung: Có nhiều nguyên nhân hướng tiếp cận dẫn đến việc sử dụng phương pháp mã hoá dải tần (Subband coding- SBC) Hiện có nhiều phương pháp mã hoá nén (lượng tử hoá mã hoá) tín hiệu âm thanh, hình ảnh, dựa phân bố tín hiệu theo dạng Chẳng hạn tín hiệu có biên độ phân cụm, người ta hay sử dụng lượng tử hoá vector; tín hiệu có biên độ chênh lệch không nhiều, người ta dùng lượng tử hoá vi sai DPCM Tuy nhiên dạng phân bố tín hiệu hoàn toàn ngẫu nhiên, khó chọn phương pháp mã hoá nén tối ưu cho toàn tín hiệu Do đó, người ta đưa ý tưởng chia tín hiệu làm nhiều phần nhỏ, mã hoá phần theo cách khác để’ đạt hiệu nén cao Mặt khác, âm thanh, thực nghiệm cho thấy tai người có số hiệu ứng âm hiệu ứng che tần số, che thời gian, Do có thể’ tiết kiệm liệu cách loại thành phần tín hiệu bị che, mã hoá phần nghe thấy Hiệu ứng che tai người khác thành phần tần số, ta cần chia tín hiệu âm thành thành phần tần số (dải băng con) xác định thành phần bị che không bị che tín hiệu dải tần số để xử lý Đó tư tưởng mã hoá SBC Mã hoá SBC chia tín hiệu gốc thành thành phần tín hiệu thuộc dải tần (sub-band) để xử lý mã hoá riêng biệt thành phần sau gửi Việc nhận tín hiệu, giải mã khôi phục tín hiệu ban đầu thực theo trình tự ngược lại Các dải băng không chồng chập lên (mà thực chất liền kề nhau), tín hiệu thu dải tần giải tương quan, nhờ mã hoá riêng biệt mà khôi phục thành tín hiệu ban đầu Mã hoá SBC ứng dụng rộng rãi nén liệu audio, video, đặc biệt chuẩn nén liệu MPEG 1.1 Nguyên tắc chung mã hóa SBC (1D discrete signal) 1.1 Two-band filter band Biểu diễn mô hình lọc miền số phức: X’(z) = 1/2Go(z)[Ho(z)X(z) + Ho(-z)X(-z)] + 1/2G1(z)[H1(z)X(z) + H1(-z)X(-z)] = ½[Go(z)Ho(z) + G1(z)H1(z)]X(z) + ½[Go(z)Ho(-z) + G1(z)H1(-z)]X(-z) Đầu vào tín hiệu cần mã hóa X[n] phân tích thành thành phần qua lọc thông thấp (H0) thông cao (H1) Tại tần số tín hiệu giảm lần (down-sampling) chu kỳ(T) tín hiệu tang lần => số mẫu giảm ta thu subband Sauk hi thu subband thực phương pháp mã hóa dải tần phục hồi tín hiệu ban đầu (coding) Hiệu giải pháp nén đánh giá qua: • Tỉ số nén: phụ thuộc vào trình subband coding • Độ tổn hao phụ thuộc vào lượng tử hóa Q (bộ lọc tốt có hệ số lẻ) 1.2 Kỹ thuật lọc thông thấp thông cao: Thường dung mã hóa nén ảnh, video, âm thoại Việc chia dải tần tùy thuộc vào ứng dụng nhu cầu 1.3 Kỹ thuật lọc thông dải: Thường dung mã hóa nén âm mp3 Hệ thống phân tách M dải tần dung M lọc thông dải đồng thời, tần số lấy mẫu giảm M lần Quy trình chung phương pháp: - Lọc phân tích: tín hiệu đưa qua lọc nhằm chia tín hiệu thành thành phần tín hiệu ứng với dải tần không chồng Đáp ứng xung lọc sau lọc trước nhân với hàm số cos (để’ dịch đáp ứng khoảng) - Tín hiệu dải tần giảm tần số lấy mẫu M lần (M số dải tần chia tín hiệu) Việc giảm tần số lấy mẫu làm phổ rộng ra, trải hết trục tần số Số mẫu lúc giảm theo Giảm tần số lấy mãu thực dựa theo định lý lấy mẫu Nyquist hệ định lý Nyquist Tỷ lệ giảm tần số lấy mẫu phụ thuộc vào tỷ lệ dải thông lọc với dải tần tín hiệu vào - Thực lượng tử hoá mã hoá riêng dải tần số Lựa chọn phương pháp lượng tử hoá mã hoá, thực phân phối bit dựa tính chất dòng tín hiệu sau lọc Đây bước mang lại hiệu nén cho toàn trình mã hoá SBC Phân phối bit việc phân chia số bit có cho mã hoá dải, dựa theo tín hiệu dải dải, lượng thông tin khác Phân phối bit ảnh hưởng lớn đến khôi phục liệu sau trình gửi nhận liệu Giải mã, tổng hợp SBC thực theo trình tự ngược lại: - Tín hiệu nhận được phân kênh xử lý với dải tần tương ứng - Giải mã tín hiệu, sử dụng hệ số trình lượng tử hoá mã hoá trước - Tăng tần số lấy mẫu lên M lần - Đi qua lọc để’ tín hiệu có xung giống lúc sau qua lọc phần mã hoá - Ghép tín hiệu lại thành tín hiệu ban đầu Khi sử dụng để nén âm SBC khai thác ngưỡng nghe hệ thống thẩm âm người Tai người thường nhạy cảm với khoảng tần số, tín hiệu đủ lớn tần số đó, tai không nghe thấy tín hiệu yếu tần số gần Chúng ta nói ngưỡng tín hiệu lớn mềm dẻo Các điểm tín hiệu gọi ngưỡng nghe Ý tưởng SBC phép giảm liệu cách loại bỏ thông tin tần số mà người khả nghe Kết khác với tín hiệu ban đầu, thông tin bị loại bỏ chọn lựa chuẩn xác chi tiết người nghe không thấy khác biệt Tư tưởng mã hóa SBC chia tín hiệu gốc thành thành phần tín hiệu thuộc dải tần để xử lý mã hóa riêng biệt thành phần nhằm làm tăng hiệu nén II Ứng dụng mã hoá dải tần nén ảnh (video) Video chuỗi frame ảnh ( gọi khung hình), xuất liên tiếp tạo cảm thụ chuyển động theo thời gian Quan hệ thời gian frame biễu diễn ảnh động Nén video sử dụng kỹ thuật bản, Interframe Intraframe : • Mã hóa Intraframe kỹ thuật nén ảnh tĩnh giảm độ dư thừa không gian • Mã hóa Interframe kỹ thuật đánh giá chuyển động mã hóa để giảm độ dư thừa thời gian Đối với mã hóa Intraframe, frame (Khung hình) video nén ảnh tĩnh JPEG với điều kiện đảm bảo tốc độ khung hình Vì vậy, Subband coding áp dụng nén video chất Subband coding áp dụng ảnh gốc Mô hình tổng quan : Dữ liệu ảnh đầu vào ảnh đầu Băng lọc phân tích Lượng tử hóa mã hóa Lượng tử hóa mã hóa ngược Tổng hợp liệu Mô hình tổng quan mã hóa giải tần nén ảnh Phần Subband : Tư tưởng mã hóa SBC chia tín hiệu gốc thành thành phần tín hiệu thuộc dải tần để xử lý mã hóa riêng biệt thành phần nhằm làm tăng hiệu nén Tư tưởng áp dụng nén ảnh sau : Dữ liệu ảnh cho qua băng lọc (filter bank) gọi băng lọc phân tích nhằm chia tín hiệu thành thành phần ứng với dải tần không chồng Do liệu ảnh bao gồm thành phần riêng biệt : thành phần thô chứa phần lớn liệu ảnh thường nằm thành phần tần số thấp thành phần biên chứa thông tin đường nét ảnh thường nằm thành phần tần số cao Vì nén ảnh thông thường, người ta sử dụng lọc thông thấp lọc thông cao để tiến hành chia dải tần Do sau qua hai lọc, liệu ảnh chia làm dải tần nên theo nguyên tắc chung SBC, dải tần giảm tần số lấy mẫu lần Giả sử ảnh lúc đầu có kích thước N x N Trước hết áp dụng lọc theo chiều ngang cho dòng liệu ảnh với lọc thông thấp lọc thông cao Sau giảm tần số lấy mẫu đầu lọc lần, ta có kích thước (N x N)/2 Tiếp theo đó, áp dụng lọc thông thấp thông cao theo chiều dọc ảnh Ở đầu bô lọc tiếp tục giảm tần số lấy mẫu lần, ta thu ảnh có kích thước N/2 x N/2 Sau qua băng lọc, ta thu ảnh với ký hiệu sau : LL HL LH HH Trong : - LL : Thành phần sau qua lọc thông thấp, chứa phần lớn liệu ảnh gốc Đây thành phần thô ảnh LH : Thành phần qua lọc thông thấp đến lọc thông cao - HL : Thành phần qua lọc thông cao đến lọc thông thấp, chứa phần lớn 10 liệu biên ảnh gốc - HH : Thành phần sau qua lọc thông cao, chứa liệu ảnh gốc Sau thu thành phần, thành phần LH HH chứa liệu ảnh gốc thành phần LL HL chứa phần lớn liệu ảnh gốc biên nên bước sau đó, ta loại bỏ thành phần LH HH, xử lý thành phần LL HL Thành phần LL, chứa phần lớn liệu ảnh gốc Do thành phần chứa liệu ảnh qua lọc thông thấp nên độ chênh lệch mẫu tín hiệu thành phần không cao, thành phần LL thường mã hóa phương pháp mã hóa dự đoán DPCM Trong thành phần HL lượng tử hóa phương pháp lượng tử hóa vô hướng (Scalar Quantization) Đây giai đoạn định hiệu nén cho toàn trình Phần coding : Phần liệu sau qua băng lọc mã hóa mã hóa huffman để chuyển đổi tín hiệu tương tự sang tín hiệu số Hiệu SBC nén ảnh : Nén ảnh sử dụng SBC đem lại hiệu nén cao liệu ảnh phân làm dải tần lựa chọn số dải tần chứa nhiều thông tin dải tần để áp dụng phương pháp mã hóa lượng tử hóa phù hợp Áp dụng mã hóa dải tần nén video , video ảnh xuất liên tiếp cảm thụ chuyển động nên việc ứng dụng mã hóa dải tần nén ảnh ứng dụng nén video Khi hiệu nén ảnh cao hiệu nén video tăng lên 16 lọc thường sử dụng dãy lọc có cấu trúc Độ rộng dải tần mức độ down sampling nhánh phụ thuộc vào độ sâu nhánh Khác với kiểu băng lọc với loại băng lọc tín hiệu đưa qua nhiều tầng lọc với tín hiệu đầu lọc tầng đầu vào lọc tầng Băng lọc thường áp dụng cho tín hiệu mà ta biết trước phân bố lượng Do loại băng lọc áp dụng tốt cho tín hiệu audio số thường hầu hết lượng audio số nằm tần số thấp nhiều so với tần số lấy mẫu Tuy nhiên khác với tín hiệu ảnh với miền tần số cao thấp phân chia rõ ràng với miền tần số cao cạnh đường nét, miền tần số thấp vùng ảnh sau qua băng lọc ta loại bỏ phần (Low-High High-High) tín hiệu âm phân chia rõ ràng Các âm miền tần số thấp cao với tín hiệu âm bị loại bỏ có mức lượng nhỏ ngưỡng che Các âm có tần số cao hoàn toàn nội dung tín hiệu có lượng lớn Số lượng dải tần chia từ tín hiệu gốc việc chia hay không phụ thuộc vào chuẩn mà ta sử dụng Thường số dải tần chia lũy thừa để dễ tiến hành tính toán ; chia nhiều dải tần chia dải tần không hiệu nén cao nhiên chi phí tính toán tăng lên Ví dụ với hệ thống mã hóa Dolby AC-2 ta chia làm 256 dải tần ; với ISO(MPEG) Layer 1,2 MUSICAM 32 dải tần với độ rộng nhau; với ISO Layer 576 subbands độ rộng dải tần không Một ví dụ loại băng lọc : 17 Sơ đồ thể băng lọc với 32 subbands có độ rộng sau cho tín hiệu gốc qua băng lọc Với s(n) tín hiệu đầu vào Si tới S32 subband tương ứng sau qua băng lọc Tín hiệu subband có tần số lấy mẫu giảm 32 lần so với tín hiệu gốc s(n).Với đáp ứng lọc : hsub(k)(n) = h(n) c o s k+-) — + (p(k)+ với M = 32 ; k = 0,1, , 31, Trong h(n) lọc thông thấp Sơ đồ thể’ băng lọc với subband đầu sau cho tín hiệu gốc x(n) qua băng lọc Subband có độ rộng dải tần / độ rộng dải tần tín hiệu đầu có tần số lấy mẫu giảm lần Subband thứ có độ rộng dải tần / tần số lấy mẫu giảm lần Tương tự tới subband số có độ rộng dải tần giảm 32 lần tần số lấy mẫu giảm 32 lần so với tín hiệu gốc Với Ho lọc thông thấp Hi lọc thông cao + Khối Psychoacoustic Model : khối có đầu vào tín hiệu gốc tín hiệu sau chia thành subbands Khối sử dụng để tính toán hiệu ứng che tín hiệu đưa vào dựa vào mô hình cảm thụ âm người Tín hiệu đưa vào khối tính toán để tìm thành phần tần số có lượng nhỏ ngưỡng nghe thành phần tần số bị che thành phần tần số dải tần khác Từ tính ngưỡng che cho dải tần đưa tới khối lượng tử hóa để’ tiến hành lượng tử Độ rộng thời gian khối tín hiệu đưa vào khối Psychoacoustic Model để tiến hành phân tích lớn ta thu hiệu nén cao (Temporal masking tính toán tốt hơn).Masking threshold tính xác lượng thông tin không cần mã hóa cao Tuy nhiên việc làm tăng độ trễ trình mã hóa 18 + Khối lượng tử hóa mã hóa (Quantizer and Coding) : Khối có đầu vào subband chia sau tín hiệu gốc qua băng lọc hiệu ứng che tính toán từ khối Psychoacoustic Model Nhiệm vụ khối tiến hành lượng tử hóa tín hiệu subbands cách phù hợp cho số bit sử dụng cho subband (tất nhiên cần đảm bảo chất lượng tín hiệu) sau mã hóa tín hiệu subband với phương pháp mã hóa huffman, mã hóa đại số Ta có sai số lượng tử với trường hợp lượng tử bước lượng tử Q gần xấp xỉ với phân bố khoảng ( — Q/2 , Q/2 ) với phương sai Q2/ (Đây nhiễu gây lượng tử) Giả sử tín hiệu gốc có phân phối khoảng B Với R bits/mẫu ta có R mức lượng tử có thể’ sử dụng Mối liên hệ bước lượng tử Q R : Q = B/(2 R) Nhiễu lượng tử hóa giảm dB với việc ta sử dụng thêm bit cho việc lượng tử : ơf S N R = 101og10-^ q ơị = 12 = (B/2R)2/12 = B2/12 * 2_2R ơ2( R) S N R ( R + 1) — S N R ( R ) = logi0 ’ “ (R q T 1) 2-2(R) = 01 o g 2_2(R+1} = l o g 10 2 = dB Như ta biết subband có ngưỡng che riêng Khối lượng tử hóa làm nhiệm vụ lượng tử tín hiệu subband với đủ số bit để trì khoảng cách nhiễu lượng tử ngưỡng che subband (Giữ cho nhiễu lượng tử nhỏ ngưỡng che subband để thành phần nhiễu nghe thấy tai người) Như ta giảm số bit cần để lượng tử hóa mẫu tín hiệu subband tùy thuộc vào ngưỡng che subband tương ứng nhờ ta tăng hiệu nén liệu (Việc giảm bit làm tăng nhiễu lượng tử lên dB ta cần giữ cho giá trị nhiễu nhỏ ngưỡng che) Bên cạnh đó, ta thấy giới hạn mã hóa tín hiệu âm nhiễu lượng tử hóa vượt ngưỡng che trở thành phần tín hiệu âm mà tai nghe Ta phải cố gắng giảm số bit sử dụng để lượng tử hóa giá trị mẫu cho giá trị nhiễu lượng tử xấp xỉ với giá trị ngưỡng che phải nhỏ giá trị ngưỡng che Ví dụ : Ta có 16 32 dải tần sau Band Level (db)Q 12 10 6789 10 11 12 13 14 15 16 10 60 35 20 15 23 53 19 Với dải tần số có giá trị biên độ 60dB giả sử dải tần gây hiệu ứng che cho dải tần bên cạnh :12dB với dải tần số 15 dB với dải tần số Ta thấy giá trị biên độ dải tần số7 10 dB 15 dB ngưỡng che ta tiến hành mã hóa gửi Giả sử tín hiệu bau đầu đưa vào biểu diễn với bits/mẫu Với giá trị ngưỡng che 15 dB ta có thể’ giảm số bit sử dụng cho mẫu bit (Sai số lượng tử tăng lên 12 dB nhiên nhỏ ngưỡng che kết có thể’ chấp nhận được) Sau tiến hành lượng tử hóa với số bit tương ứng cho subband ta tiến hành encode cho subband phương pháp mã hóa nêu + Khối Frame Packing : Dữ liệu sau ta lượng tử mã hóa đưa vào khối để’ đóng gói thành frame chuyển hệ thống mạng + Các khối trình giải mã bên nhận : Tại bên nhận ta làm ngược lại với trình mã hóa nhiên việc giải mã với SBC đơn giản việc mã hóa ta không cần tới khối Psychoacoustic Model Ta unpacking frame, giải mã đưa tín hiệu subband vào băng lọc để’ tổng hợp lại tín hiệu ban đầu Sơ đồ giải nén Audio SBC Quá giải nén Audio làm ngược lại với trình má hóa: unpacking frame, giải mã decoder liệu tần số lấy mẫu tăng lần đưa tín hiệu subband vào băng lọc để tổng hợp lại tín hiệu ban đầu Thử nghiệm áp dụng phương pháp mã hóa SBC nén tìn hiệu audio • Phần mềm sử dụng: Công cụ mô thực nghiệm MATLAB phiên 20 7.10.0(R201a) công ty MathWorks thiết kế • Nội dung thử nghiệm: + Đọc file tín hiệu âm gốc đầu vào định dạng speech.wav (tín hiệu âm sau thu chưa nén) + Xây dựng mô lọc lp(thông thấp) hp(thông cao) + Cho tín hiệu âm gốc qua lọc để tách thành 4suband ta thu file wav tương ứng với dải tần số • Phần chưa làm được: + Khi tách tín hiệu âm gốc thành suband thử nghiệm, chúng em chưa xử lý phần coding – chưa tính toán ngương che cho dải tần số Và không lượng tử hóa,mã hóa để tổng hợp lại thành tín hiệu đầu Chúng em xin phép tìm hiểu thêm thời gian tới a Giới thiệu chung công cụ sử dụng mô MATLAB MATLAB (Matrix Laboratory) phần mềm khoa học thiết kế để cung cấp việc tính toán số hiển thị đồ họa ngôn ngữ lập trình cấp cao MATLAB cung cấp tính tương tác tuyệt vời cho phép người sử dụng thao tác liệu linh hoạt dạng mảng ma trận để tính toán quan sát Các liệu vào MATLAB nhập từ "Command line" từ "mfiles", tập lệnh cho trước MATLAB MATLAB cung cấp cho người dùng toolbox tiêu chuẩn tùy chọn Người dùng tạo hộp công cụ riêng gồm "mfiles" viết cho ứng dụng cụ thể Chúng ta sử dụng tập tin trợ giúp MATLAB cho chức lệnh liên quan với toolbox có sẵn b Thử nghiệm  Màn hình sau khởi động MATLAB bao gồm khung cửa sổ cửa sổ quản lý file, cửa sổ nhập dòng lệnh, vùng làm việc Workspace hình 21 Tại cửa số dòng lênh nhập vào lệnh >>help plot (kiểm tra MATLAB làm việc với toolbox có sẵn):   Bước xây dựng lọc LP LH cho tín hiệu đầu vào cần xử lý qua lọc theo kịch Nhập code cửa sổ lệnh Command Window Đọc file từ đường dẫn C:\Users\Harish\Destktop\Vicom profect\Javani\speech.wav xây dựng lọc LH LP hiển figure(1) hiển thị tin tín hiệu đầu vào lọc 22 23 Tiếp theo cho tín hiệu đầu vào x(n) qua lọc LP LH 24 Từ bước ta thu dải tần b0,b1,b2,b3 Sau ghi dải tần file wav để kiểm tra kết 25 Kết figure(1) hiển thị tín hiệu đầu miền thời gian lọc LP, LH 26 figure(2) hiển thị phổ tín hiệu đầu vào, phổ tín hiệu sau qua lọc thông thấp thông cao 27 28 Figure(3) 4subband tách qua lọc LP, LH Figure(4) sau tách tín hiệu đầu vào thành dải tần B0,B1,B2,B3 ta ghi tín hiệu thu đươc file wav kết file b0.wav, b1.wav, b2.wav, b3.wav 29 c Kết luận + Trong mã hóa SBC tín hiệu tiếng nói sau vào hệ thống xử lý qua lọc thông để tách thành nhiều dải tần số + Mỗi tín hiệu subband thu sau qua lọc mã hóa xử lý riêng Trong tín hiệu subband tính toán để tìm thành phần tần số có lượng nhỏ ngưỡng nghe thành phần tân số bị che thành phần tần số subband lân cận khác Từ tính ngưỡng che cho dải tần tiến hành lượng tử hóa mã hóa tín hiệu + Các subband sau xử lý kết hợp lại để tạo thành tín hiệu đầu + Dung lượng tín hiệu đầu giảm đáng kể, mã hóa SBC đạt tỉ số nén cao Là mã hóa SBC loại bỏ liệu dư thừa tín hiệu audio(thành phần bị che) mã hóa lượng tử hóa thành phần nằm ngưỡng nghe Và tùy thuộc vào phương pháp mã hóa, lượng tử hóa tín hiệu audio ảnh hưởng đến tỉ số nén audio + Trong mã hóa SBC áp dụng nén audio thành phần dư thừa bị loại bỏ không ảnh hưởng đến khả cảm thụ âm tai người 30 V – Tài liệu tham khảo [...]... bằng các phương pháp mã hóa đã nêu + Khối Frame Packing : Dữ liệu sau khi ta lượng tử và mã hóa được đưa vào khối này để’ đóng gói thành các frame và chuyển đi trong hệ thống mạng + Các khối trong quá trình giải mã tại bên nhận : Tại bên nhận ta làm ngược lại với quá trình mã hóa tuy nhiên việc giải mã với SBC đơn giản hơn việc mã hóa vì ta không cần tới khối Psychoacoustic Model Ta unpacking frame, giải. .. tín hiệu đầu ra sẽ được giảm đáng kể, mã hóa SBC đạt được tỉ số nén cao Là do mã hóa SBC đã loại bỏ được dữ liệu dư thừa của tín hiệu audio(thành phần bị che) chỉ mã hóa và lượng tử hóa các thành phần nằm trong ngưỡng nghe Và còn tùy thuộc vào phương pháp mã hóa, lượng tử hóa tín hiệu audio sẽ ảnh hưởng đến tỉ số nén của audio + Trong mã hóa SBC áp dụng nén audio các thành phần dư thừa bị loại bỏ nhưng... tử hóa tín hiệu trên các subbands một cách phù hợp sao cho số bit sử dụng cho mỗi subband là ít nhất (tất nhiên vẫn cần đảm bảo chất lượng tín hiệu) và sau đó mã hóa tín hiệu trên các subband với các phương pháp mã hóa như huffman, mã hóa đại số Ta có sai số lượng tử với trường hợp lượng tử đều và bước lượng tử là Q gần như xấp xỉ với phân bố đều trong khoảng ( — Q/2 , Q/2 ) với phương sai là Q2/ 1... dụng mã hoá dải tần trong nén audio 1 Tổng quan Âm thanh có bản chất là tín hiệu ; dựa trên dải tần của tín hiệu âm thanh được chia ra làm hai loại : • • Âm thanh dải tần cơ sở : âm thanh tiếng nói thoại có dải tần số từ 300Hz - 4KHz Âm thanh dải rộng : tiếng nói trình diễn, hát, âm nhạc có dải tần số từ 100Hz -20KHz Phương pháp mã hóa các dải tần subband coding được sử dụng chủ yếu trong mã hóa âm... che) Trong trường hợp che chênh lệch các tín hiệu ở tần số cao lại có tác dụng che phủ lớn hơn nhiều so với các tín hiệu ở tần số thấp 3 Subband coding trong mã hóa audio 3.1 Ý tưởng cơ bản SBC trong mã hóa audio dựa trên mô hình cảm thụ âm thanh của con người Như đã trình bày ở trên tai con người có độ nhạy cảm khác nhau với các tần số khác nhau Do đó khi ta nghe một tín hiệu âm thanh với dải tần. .. khác (Frequency masking) và tín hiệu trong các thời điểm khác (Temporal masking) Sau khi tiến hành phân tích ta thu được năng lượng của các tín hiệu trong từng dải tần và một ngưỡng che (masking threshold) tương ứng cho từng dải tần Dựa vào năng lượng và ngưỡng che của từng dải tần ta tiến hành lượng tử hóa và mã hóa một cách phù hợp : • Với các dải tần có các tín hiệu với mức năng lượng nhỏ hơn ngưỡng... con người với các tần số âm thanh Tai có thể’ được coi như 1 băng lọc với 25 dải dải tần có tần số từ 20Hz - 20KHz Các dải tần số này không phân bố đều (độ rộng của các dải là khác nhau) và không liên tục (các dải này có phần chồng lên nhau).Tai chúng ta không thể’ phân biệt được các âm thanh ở trong cùng 1 dải khi chúng xuất hiện đồng thời Mỗi dải này được gọi là 1 critical band (dải tần giới hạn)... 3.2 Các bước thực hiện SBC Phân chia một tín hiệu thành các dải tần riêng biệt sử dụng băng lọc như đã trình bày trong các phần trước Sau khi thực hiện xong việc phân chia, ta có thể xử lí từng dải tần số đó một cách riêng rẽ Các tín hiệu trong mỗi dải tần này được tiến hành phân tích năng lượng và tính toán các hiệu ứng che trong mỗi dải tần bởi tín hiệu trong các dải tần khác (Frequency masking) và... s(n).Với đáp ứng của từng bộ lọc : hsub(k)(n) = h(n) c o s 2 k+ -) — + (p(k)+ với M = 32 ; k = 0,1, , 31, Trong đó h(n) là bộ lọc thông thấp Sơ đồ trên thể’ hiện một băng lọc với 6 subband đầu ra sau khi cho tín hiệu gốc x(n) qua băng lọc Subband đầu tiên có độ rộng dải tần bằng 1 / 2 độ rộng dải tần của tín hiệu đầu và có tần số lấy mẫu giảm 2 lần Subband thứ 2 có độ rộng dải tần bằng 1 / 4 và tần. .. unpacking frame, giải mã và đưa tín hiệu của các subband vào băng lọc để’ tổng hợp lại tín hiệu ban đầu Sơ đồ giải nén Audio trong SBC Quá giải nén Audio thì làm ngược lại với quá trình má hóa: unpacking frame, giải mã decoder dữ liệu tần số lấy mẫu tăng 2 lần và đưa tín hiệu của các subband vào băng lọc để tổng hợp lại tín hiệu ban đầu 4 Thử nghiệm một áp dụng của phương pháp mã hóa SBC trong nén tìn ... chung mã hóa SBC (1D discrete signal) 1.1 Two-band filter band Biểu diễn mô hình lọc miền số phức: X’(z) = 1/2Go(z)[Ho(z)X(z) + Ho(-z)X(-z)] + 1/2G1(z)[H1(z)X(z) + H1(-z)X(-z)] = ½[Go(z)Ho(z) +... G1(z)H1(z)]X(z) + ½[Go(z)Ho(-z) + G1(z)H1(-z)]X(-z) Đầu vào tín hiệu cần mã hóa X[n] phân tích thành thành phần qua lọc thông thấp (H 0) thông cao (H 1) Tại tần số tín hiệu giảm lần (down-sampling)... chung mã hóa SBC: Nguyên tắc chung: Có nhiều nguyên nhân hướng tiếp cận dẫn đến việc sử dụng phương pháp mã hoá dải tần (Subband coding- SBC) Hiện có nhiều phương pháp mã hoá nén (lượng tử hoá mã

Ngày đăng: 07/04/2016, 22:52

Từ khóa liên quan

Mục lục

  • I. Nguyên tắc chung của mã hóa SBC:

    • 1. Nguyên tắc chung:

      • 1.1. Nguyên tắc chung của mã hóa SBC (1D discrete signal)

      • 1.2. Kỹ thuật lọc thông thấp thông cao:

        • 1.3. Kỹ thuật lọc thông dải:

        • 2. Quy trình chung của phương pháp:

        • II. Ứng dụng mã hoá dải tần trong nén ảnh (video)

        • III. Ứng dụng mã hoá dải tần trong nén audio

          • 1. Tổng quan

          • 2. Mô hình cảm thụ âm thanh hệ thống thính giác của con người

            • 2.1. Phân chia dải tần

            • 2.1. Các hiệu ứng che

            • 3. Subband coding trong mã hóa audio

              • 3.1. Ý tưởng cơ bản

              • 3.2. Các bước thực hiện SBC

              • 3.3. Sơ đồ thực hiện SBC

              • 4. Thử nghiệm một áp dụng của phương pháp mã hóa SBC trong nén tìn hiệu audio

                • Tiếp theo cho tín hiệu đầu vào x(n) đi qua 2 bộ lọc LP và LH.

                • Từ các bước trên ta thu được 4 dải tần b0,b1,b2,b3. Sau đó ghi 4 dải tần này ra file wav để kiểm tra kết quả.

                • Kết quả của figure(1) hiển thị tín hiệu đầu trong miền thời gian và 2 bộ lọc LP, LH.

                • figure(2) hiển thị phổ của tín hiệu đầu vào, phổ của tín hiệu sau khi đi qua 2 bộ lọc thông thấp và thông cao.

                • Figure(3) là 4subband con khi đã tách được qua 2 bộ lọc LP, LH Figure(4) sau khi đã tách được tín hiệu đầu vào thành 4 dải tần B0,B1,B2,B3 thì ta ghi tín hiệu thu đươc ra file .wav và được kết quả là 4 file b0.wav, b1.wav, b2.wav, b3.wav. c. Kết luận

                • V – Tài liệu tham khảo

Tài liệu cùng người dùng

Tài liệu liên quan