1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nén tín hiệu âm thang số sử dụng mã hoá băng con

129 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 129
Dung lượng 1,37 MB

Nội dung

Bộ giáo dục đào tạo Trường Đại học Bách Khoa Hà Nội - LUẬN VĂN THẠC SĨ KHOA HỌC NÉN TÍN HIỆU ÂM THANH SỐ SỬ DỤNG MÃ HĨA BĂNG CON NGƠ QUANG THUẬN Ln Văn Thạc Sĩ Khoa Học CHUYấN NGNH: IN T VIN THễNG Hà Nội - 2005 Bộ giáo dục đào tạo Trường Đại học Bách Khoa Hà Nội - LUẬN VĂN THẠC SĨ KHOA HỌC NÉN TÍN HIỆU ÂM THANH SỐ SỬ DỤNG MÃ HÓA BĂNG CON NGễ QUANG THUN Luận Văn Thạc Sĩ Khoa Học CHUYấN NGÀNH: ĐIỆN TỬ VIỄN THÔNG NGƯỜI HƯỚNG DẪN PGS – TS Hµ Néi - 2005 MỤC LỤC LỜI NĨI ĐẦU Chương 1: TÍN HIỆU VÀ LỌC SỐ 3 TÍN HIỆU VÀ HỆ THỐNG XỬ LÝ TÍN HIỆU 1.1 Tín hiệu liên tục 1.2 Tín hiệu rời rạc 1.3 Hệ thống xử lý tín hiệu TỔNG QUAN VỀ BỘ LỌC 2.1 Khái niệm 2.2 Phân loại lọc số CÁC BỘ LỌC SỐ LÝ TƯỞNG 3.1 Bộ lọc số thông thấp lý tưởng 3.2 Bộ lọc số thông cao lý tưởng 3.3 Bộ lọc số thông dải lý tưởng 3.4 Bộ lọc số dải chắn lý tưởng Chương 2: LỌC SỐ NHIỀU NHỊP 11 THAY ĐỔI TẦN SỐ LẤY MẪU 11 1.1 Khái niệm 11 1.2 Phép chia phân chia 12 1.2.1 Biểu diễn miền n 12 1.2.2 Biểu diễn miền z 13 1.2.3 Biểu diễn miền tần số 14 1.3 Bộ lọc phân chia 15 1.3.1 Biểu diễn lọc phân chia miền biến số n 16 1.3.2 Biểu diễn phép lọc phân chia miền z 16 1.3.3 Biểu diễn phép lọc phân chia miền tần số 17 1.4 Phép nội suy 19 1.4.1 Khái niệm 19 1.4.2 Biểu diễn phép nội suy miền biến số n 20 1.4.3 Biểu diễn phép nội suy miền z 20 1.4.4 Biểu diễn phép nội suy miền tần số 21 1.5 1.5.1 Biểu diễn phép lọc nội suy miền biến số n 23 1.5.2 Biểu diễn phép lọc nội suy miền z 23 1.5.3 Biểu diễn phép lọc nội suy miền tần số 24 1.6 Thay đổi nhịp lấy mẫu với hệ số M/L 26 1.6.1 Biểu diển miền biến số n 26 1.6.2 Biểu diễn miền z 27 1.6.3 Biểu diễn phép biến đổi nhịp miền tần số 28 1.7 Bộ lọc nội suy 22 Bộ lọc biến đổi nhịp lấy mẫu với hệ số M/L 29 1.7.1 Tổng quan 29 1.7.2 Biểu diễn miền n 30 1.7.3 Biểu diễn miền z 30 1.7.4 Biểu diễn miền tần số 31 PHÂN HOẠCH NHIỀU PHA 32 2.1 Phân hoạch nhiều pha hai thành phần 32 2.1.1 Phân hoạch hàm truyền đạt H(z) 32 2.1.2 Cấu trúc nhiều pha hai thành phần 33 2.2 Phân hoạch nhiều pha M thành phần 33 2.2.1 Phân hoạch hàm truyền đạt H(z) 33 2.2.2 Cấu trúc nhiều pha M thành phần 34 2.3 Phân hoạch nhiều pha loại hai 35 2.3.1 Phân hoạch nhiều pha loại hai hàm H(z) 35 2.3.2 Cấu trúc nhiều pha loại hai 35 2.4 Cấu trúc nhiều pha lọc biến đổi nhịp lấy mẫu 36 2.4.1 Cấu trúc nhiều pha lọc phân chia 36 2.4.2 Cấu trúc nhiều pha lọc nội suy 38 2.5 Cấu trúc nhiều pha lọc biến đổi nhịp hệ số M/L 41 2.5.1 Tổng quan 41 2.5.2 Cấu trúc nhiều pha loại lọc biến đổi nhịp 41 2.5.3 Cấu trúc nhiều pha loại hai lọc biến đổi nhịp 43 Chương 3: MÃ HOÁ BĂNG CON 45 BANK LỌC SỐ 45 1.1 1.1.1 Định nghĩa 45 1.1.2 Biểu diễn nhiều pha loại bank lọc số phân tích 46 1.2 Định nghĩa 47 1.2.2 Biểu diễn nhiều pha loại hai bank lọc số tổng hợp 48 Băng lọc số nhiều nhịp 49 BĂNG LỌC KHÔI PHỤC HOÀN HẢO 52 2.1 Bank lọc số tổng hợp 47 1.2.1 1.3 Bank lọc số phân tích 45 Băng lọc số nhiều nhịp kênh khơi phục hồn hảo 52 2.1.1 Khử thành phần hư danh 54 2.1.2 Méo biên độ méo pha 54 2.2 Băng lọc QMF kênh khơi phục phục hồn hảo 55 2.3 Biểu diễn nhiều pha bank lọc số QMF 59 MÃ HOÁ BĂNG CON 61 3.1 Cấu trúc dạng đơn phân giải 62 3.2 Cấu trúc dạng đa phân giải 64 Chương 4: NÉN ÂM THANH SỐ DÙNG MÃ HOÁ BĂNG CON 67 NGUYÊN LÝ NÉN ÂM THANH 68 1.1 Phương pháp nén thông thường 68 1.2 Độ nhạy tai người 68 1.3 Hiệu ứng che lấp (Hiệu ứng mặt nạ) 69 1.4 Chia băng thông thành dải nhỏ 70 1.5 1.5.1 Dùng lọc tương tự 71 1.5.2 Dùng lọc số nhiều nhịp 72 1.6 Sử dụng lọc số nhiều nhịp để tránh nhiễu dải tần 70 Cấp phát bit 74 CÁC CHUẨN NÉN ÂM THANH SỐ 76 2.1 Tổng quan 76 2.1.1 Đánh giá chuẩn hoá chất lượng MPEG 77 2.1.2 Cấu trúc mơ hình mã hố âm dùng tiêu chuẩn giác quan 77 2.1.3 Băng lọc số 78 2.1.4 Khái niệm mã hoá chung 79 2.1.5 Psycho - acoustic Models 80 CHUẨN MPEG-1 LAYER I VÀ LAYER II 81 3.1 3.1.1 Đặc điểm mơ hình layer I 82 3.1.2 Đặc điểm mơ hình layer II 83 3.1.3 Psycho-acoustic model 84 3.1.4 Băng lọc số 84 3.1.5 Xác định mã hoá hệ số tỉ lệ 85 3.1.6 Cấp phát bit mã hố thơng tin cấp phát bit 85 3.1.7 Lượng tử hoá mã hoá mẫu băng 86 3.2 Mơ hình mã hố layer I layer II 81 Mơ hình giải mã hoá layer I layer II 87 CHUẨN MPEG-1 LAYER III 88 4.1 Mơ hình mã hoá layer III 88 4.1.1 Băng lọc phân tích 89 4.1.2 Băng lọc lai nhiều pha MDCT 90 4.1.3 FFT 91 4.1.4 Psycho – acoustic Model 91 4.1.5 Lượng tử hoá 93 4.1.5.1 Vòng lặp điều khiển tỷ lệ 94 4.1.5.2 Vòng lặp điều khiển méo 94 4.1.6 4.2 Phân tích tổng hợp 94 Cấu trúc dòng bit 95 4.2.1 Phần mào đầu 95 4.2.2 CRC 99 4.2.3 Thông tin bổ sung 99 4.2.4 Dữ liệu 104 4.2.5 Dữ liệu phụ thuộc 106 4.3 Mô hình giải mã hố layer III 107 4.3.1 Đồng khung 107 4.3.2 Giải mã Huffman 108 4.3.3 Descaling 110 4.3.4 Quá trình xử lý Stereo 110 4.3.4.1 MS Stereo 111 4.3.4.2 Intensity Stereo 111 4.3.5 Inverse Modified DCT (IMDCT) 111 4.3.6 Tối ưu hoá IMDCT 113 4.3.6.1 Phương pháp trực tiếp 113 4.3.6.2 Thuật toán DCT nhanh 113 4.3.6.3 Tối ưu ma trận DCT 113 4.3.7 Đảo tần 114 4.3.8 Băng lọc nhiều pha kết hợp 114 KẾT LUẬN 116 TÀI LIỆU THAM KHẢO 117 DANH MỤC CÁC TỪ VIẾT TẮT Viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt ACC Advanced Audio Coding Mã hoá âm tiên tiến ADC Anaog Digital Converter Bộ biến đổi tương tự - số CRC Cyclic Redundancy Check Kiểm tra mã vòng DAC Digital Analog Converter Bộ biến đổi số - tương tự DCT Discrete Cosine Transform Biến đổi cosin rời rạc DSP Digital Signal Processor Bộ xử lý tín hiệu số FFT Fast Fourier Transform Biến đổi Fourier nhanh FIR Finitite Duration Impulse Response Bộ lọc có đáp ứng xung chiều dài hữu hạn IIR Infinitite Duration Impulse Response Bộ lọc có đáp ứng xung chiều dài vô hạn IMDCT Inverse Modified Discrete Cosine Transform Biến đổi cosin rời rạc ngược MDCT Modified Discrete Cosine Transform Biến đổi cosin rời rạc MNR Mask to Noise Ratio Tỷ lệ ngưỡng mặt nạ tạp âm MPEG Moving Picture Experts Group Chuẩn nén tín hiệu số PCM Pulse Code Modulation Điều chế xung mã PR Perfect Recontruction Băng lọc khơi phụ hồn hảo QMF Quadrature Mirror Filter bank Băng lọc số cầu phương SMR Signal to Mask Ratio Tỷ lệ tín hiệu ngưỡng mặt nạ SNR Signal to Noise Ratio Tỷ lệ tín hiệu tạp âm DANH MỤC HÌNH VẼ Hình 1.1.1: Tín hiệu liên tục Hình 1.2.1: Bộ lọc số Hình 1.3.1: Đáp ứng xung lọc thơng thấp lý tưởng Hình 1.3.2: Bộ lọc thông cao lý tưởng Hình 1.3.3: Bộ lọc thơng dải lý tưởng Hình 1.3.3: Bộ lọc chắn dải lý tưởng 10 Hình 2.1.1: Bộ chia 12 Hình 2.1.2: Dạng tín hiệu vào/ra miền biến số rời rạc 13 Hình 2.1.3: Biểu diễn phép chia miền tần số 15 Hình 2.1.4: Bộ lọc phân chia 15 Hình 2.1.5: Sự đồng lọc phân chia 17 Hình 2.1.6: Bộ nội suy 19 Hình 2.1.7: Biểu diễn phép nội suy miền biến số rời rạc 20 Hình 2.1.8: Biểu diễn phép nội suy miền tần số 22 Hình 2.1.9: Bộ lọc nội suy 22 Hình 2.1.10: Sự đồng lọc nội suy 24 Hình 2.1.11: Dạng phổ tín hiệu lọc nội suy 25 Hình 2.1.12: Bộ biến đổi nhịp loại 26 Hình 2.1.13: Bộ biến đổi nhịp loại 27 Hình 2.1.14: Bộ lọc biến đổi nhịp 29 Hình 2.1.15: Bộ lọc biến đổi nhịp 30 Hình 2.2.1: Cấu trúc nhiều pha hai thành phần 33 Hình 2.2.2: Cấu trúc nhiều pha M thành phần 34 Hình 2.2.3: Cấu trúc nhiều pha loại hai 36 Hình 2.2.4: Cấu trúc nhiều pha lọc phân chia 37 Hình 2.2.5: Cấu trúc nhiều pha lọc phân chia 37 Hình 2.2.6: Cấu trúc nhiều pha lọc phân chia 38 Hình 2.2.7: Cấu trúc nhiều pha lọc nội suy 39 Hình 2.2.8: Cấu trúc nhiều pha lọc nội suy 39 Hình 2.2.9: Sơ đồ tương đương nội suy 40 Luận văn cao học Chương 4: Nén âm số (block_type = {0, 1, 3}) granule chia thành 21 băng hệ số tỷ lệ Nếu dùng cửa sổ ngắn (block_type =2) chia granule thành 12 băng hệ số tỷ lệ Sau hệ số tỷ lệ chia thành nhóm 0-10, 11-20 cửa sổ dài 0-6, 7-11 cửa sổ ngắn Giá trị trường scalefac_compress tương ứng hình 4.4.17 Slen slen đưa số lượng bit định cho nhóm thứ nhóm thứ hai băng hệ số liên quan Global gain (8 bits, 16 bits) Chỉ rõ kích thước bước lượng tử Điều cần thiết cho khối giải lượng tử hoá giải mã hoá Block_type (2 bits, bits) Trường sử dụng trường Windows_switching flag thiết lập định loại cửa sổ sử dụng cho granule (Xem hình 4.4.18) Giá trị 00 tương ứng với forbidden có nghĩa block_type dùng cửa sổ khác loại normal sử dụng Block_type 00 01 10 11 Windows type forbidden Start window short windows Stop window Hình 4.4.18: Định nghĩa block-type Windows_switching flag (1 bit, bits) cửa sổ khác normal sử dụng Các trường block_type, mix_block_flag subblock_gain sử dụng trường thiết lập Mixed_blockflag (1 bit, bits) trường sử dụng trường Windows_switching flag thiết lập Nó loại cửa sổ khác dùng tần số thấp cao Nếu mixed_blockflag thiết lập hai băng thấp - 103 - Luận văn cao học Chương 4: Nén âm số truyền dùng cửa sổ normal 30 băng lại truyền dùng cửa sổ định giá trị block-type Table_select (10 bits, 20 bits) (15 bits, 30 bits) Có 32 bảng mã hố Huffman Giá trị trường đưa bảng Huffman sử dụng giải mã hố có kích thước bits Table_select cho biết bảng Huffman dùng giải mã hoá vùng big_values Subblock_gain (9 bits, 18 bits) Trường dùng windows_switching_flag thiết lập block_type = 10 truyền độc lập với block_type Count1table_select (1 bit, bits) Hai bảng mã hoá Huffman thay đổi cho vùng count1 trường bảng mã Huffman sử dụng 4.2.4 Dữ liệu Dữ liệu bao gồm mã hoá hệ số tỷ lệ liệu mã hoá Huffman Hệ số tỷ lệ sử dụng để khơi phục dịng liệu gốc từ thơng tin liệu Huffman Kích thước liệu Huffman phần khung thay đổi kích thước khung khơng đổi Điều có nghĩa có phần khơng gian khơng dùng đến điểm kết thúc liệu điểm kết thúc khung Phần không gian mở rộng gọi kho chứa mẫu Kho chứa sử dụng để cất giữ liệu thuộc điểm bắt đầu khung Khi giải mã khung, điểm bắt đầu liệu phải tìm thấy Có trỏ bit thơng tin bổ sung trỏ vào vị trí bắt đầu liệu - 104 - Luận văn cao học Chương 4: Nén âm số Hình 4.4.19: Phần liệu khung Layer III Trên hình vẽ, cho thấy liệu sếp thay đổi khung Một điều quan trọng trỏ liệu ln ln nhỏ khơng Trong từ khác giải mã khung, liệu khung thời kho chứa mẫu khung trước Hệ số tỷ lệ Header CRC Main data Granule Granule Left channel Right channel Left channel Right channel Ancillary data Left channel Right channel Left channel Right channel Hình 4.4.20: Cách tổ chức hệ số tỷ lệ granule kênh - 105 - Luận văn cao học Chương 4: Nén âm số Mục đích hệ số tỷ lệ giảm tạp âm lượng tử Mỗi hệ số tỷ lệ cho băng hệ số tỷ lệ truyền trường “scfsi” định hệ số tỷ lệ có chia sẻ giữ granule hay khơng Thực tế bit cấp cho hệ số tỷ lệ phụ thuộc vào trường scalefac_compress Việc chia quang phổ thành băng hệ số tỷ lệ cố định cho loại cửa sổ tần số lấy mẫu lưu trữ bảng mã hoá giải mã Hình 4.4.20 mơ tả cách tổ chức hệ số tỷ lệ granule kênh Huffman code bits Phần khung bao gồm bit mã hố Huffman, thơng tin cách mã hố tìm thấy phần thơng tin bổ sung 4.2.5 Dữ liệu phụ thuộc Dữ liệu phụ thuộc tuỳ chọn số lượng bit có khả sử dụng không rõ Dữ liệu phụ thuộc định vị sau bit mã hoá Huffman có phạm vi tới điểm “Main_data_begin” khung - 106 - Luận văn cao học Chương 4: Nén âm số Encoded Audio Bitstream 2*32 Kb/s … 2*192Kb/s Huffman Decoding Descaling Inverse MDCT Inverse filterbank 32 Subbands Stereophonic Audio Signal 2*768Kb/s 48Hz Decoding of Side Infomation Demultiplexing and Error check 4.3 Mơ hình giải mã hố layer III Q trình giải mã hố để tạo mẫu tín hiệu PCM từ dòng bit MP3 MP3 dựa gói nhỏ khung Một khung bao gồm cách giải mã hoá cách liệu âm nén Sơ đồ giải mã hoá layer III hình 4.4.21 Hình 4.4.21: Sơ đồ khối giải mã hoá âm Layer III (hai kênh) 4.3.1 Đồng khung Trước thực giải mã, từ đồng khung phải tìm thấy Một từ đồng bao gồm mẫu 12 bit ‘1111 1111 1111’ đặt vị trí bắt đầu phần mào đầu Có khả mẫu bít khác giống từ đồng tồn vị trí khác khung, giải mã khơng thể phân biệt tìm từ đồng liệu ngẫu nhiên Nếu CRC dùng khẳng định tính đắn phần mào đầu tìm thấy Nếu CRC khơng dùng, giải mã tạo mẫu để khẳng định tính hợp lý từ đồng cách tìm kiếm trường kết hợp lỗi phần mào đầu - 107 - Luận văn cao học Chương 4: Nén âm số Phần mào đầu bao gồm đầy đủ thơng tin để tính tốn kích thước khung điểm bắt đầu khung Nếu khung bị lỗi khơng có khả tìm vị trí khung Điều lý từ đồng khung đặt tất khung 4.3.2 Giải mã Huffman Giải mã Huffman mơ hình giải mã liệu nhất, cung cấp mã Huffman từ mẫu đầu vào Bảng ánh xạ để thực mã hoá Huffman dựa sở nội dung thông tin chuỗi tín hiệu đầu vào Các mẫu xuất với tần suất lớn mã hoá với đoạn mã ngắn, mẫu xuất mã hố với đoạn mã dài Kết giảm bớt sư dư thừa điều thực có ý nghĩa vài chuỗi đầu vào kết hợp xuất nhiều mẫu khác Thủ tục giải mã dựa sở vài bảng Huffman sử dụng cho ánh xạ mã hoá Huffman mẫu Bộ giải mã so sánh chuỗi đầu vào với thông tin bảng Huffman Nếu tìm thấy mẫu phù hợp mẫu đầu tương ứng đưa Có mẫu cho chuỗi đầu vào Trong MP3, có 32 bảng Huffman khác Các bảng định nghĩa trước dựa sở thông tin phù hợp thông tin âm nén Thông tin phụ định rõ bảng Huffman sử dụng cho việc giải mã khung Đầu từ giải mã hoá 576 đường tần số, tương ứng với giá trị nguyên Các đường tần số chia thành phần: Big-values, count zero 576 đường tần số Big-values Count * Big-values * Big-values + * count - 108 - rzero Luận văn cao học Chương 4: Nén âm số Big-values bao gồm đường tần số thấp mã hoá với độ xác cao phạm vi Big-values ± 15 Phần count mã hoá với giá trị 0, – Phần cuối zero miêu tả đường tần số bị loại bỏ mã hố điền giá trị giải mã hoá Ranh giơi phần rõ phần thông tin phụ lựa chọn psycho acountics q trình mã hố Khi giải mã hoá big-values, bảng Huffman cung cấp hai đường tần số cho chuỗi đầu vào với count cung cấp đường tần số cho chuỗi đầu vào Có thể gửi big-values lớn 15 cần tăng độ xác Nó thực với khối gọi escape sequence có khả cho big-values Nếu giải mã hố tìm thấy giá trị 15, điều cho thấy escape sequence dùng đọc số bit từ dòng bit Giá trin escape thêm trực tiếp để giá trị gốc 15 Số lượng bit đọc escape - 109 - Luận văn cao học Chương 4: Nén âm số sequence rõ bảng Huffman dùng gọi linbits 4.3.3 Descaling Các mẫu từ giải mã hố Huffman khơi phục đường tần số gốc cách dùng hệ số tỷ lệ phần thơng tin phụ Trong q trình mã hố đường tần số chia cho hệ số tỷ lệ giá trị nguyên nhỏ khoảng từ - 15 đến 15 Hệ số tỷ lệ lưu riêng rẽ số nguyên mã hoá Huffman với hệ số tỷ lệ liệu mã hoá Huffman tạo thành liệu Hình 4.4.22: Descaling Khơng phải có hệ số tỷ lệ cho đường tần số Thay điều đường tần số chia thành 21 nhóm gọi băng hệ số tỷ lệ, băng dùng hệ số tỷ lệ Số lượng đường tần số băng phụ thuộc vào băng tần Một băng hệ số tỷ lệ tần thấp bao gồm đường tần số băng hệ số tỷ lệ tần cao Q trình descaling dùng thơng tin tỷ lệ từ phần thông tin phụ ứng dụng cho tất nhóm Mỗi hệ số trog 21 hệ số tỷ lệ áp dụng cho nhóm riêng 4.3.4 Q trình xử lý Stereo Có loại kênh khác MP3: single channel, Dual channel, MS Stereo Intensity Stereo Khi dùng Single channel Dual channel khơng u cầu q trình sử lý Stereo Dual channel có nghĩa có hai kênh hai kênh mã hoá cách độc lập - 110 - Luận văn cao học Chương 4: Nén âm số 4.3.4.1 MS Stereo Middle/side Stereo (MS Stereo) phương pháp loại bỏ dư thừa kênh Điều đạt cách mã hoá tổng hiệu hai kênh thay mã hố kênh trái kênh phải Li = M i + Si Ri = M i − Si Mi Là tổng hai kênh Si hiệu hai kênh Li Ri mẫu đầu 4.3.4.2 Intensity Stereo Intensity Stereo phương pháp phức tạp mã hoá stereo Nó chia thành phần cường độ phần vị trí stereo Intensity ảnh hưởng tới mã hố đường tần cao đường tần số thấp mã hoá kênh trái/phải MS stereo Các bước tính tốn sau: is _ ratio = tan(is _ pos sb Li = Li Ri = Li π 12 ) is _ ratio + is _ ratio 1 + is _ ratio Vị trí intensity stereo is_possb đọc từ hệ số tỷ lệ kênh trái kênh phải 4.3.5 Inverse Modified DCT (IMDCT) IMDCT dùng MP3 DCT 18 điểm, cung cấp 36 giá trị đầu từ 18 giá trị đầu vào Nó khơng đưa thêm thơng tin phải đưa kết từ tính tốn với số lượng lớn giá trị Đây lý giới hạn thay đổi sử dụng DCT biến đổi ngược đưa mẫu từ đường tần số - 111 - Luận văn cao học Chương 4: Nén âm số Việc biến đổi từ miền tần số miền thời gian thực kết hợp băng lọc nhiều pha Thay cung cấp mẫu miền thời gian cách trực tiếp, IMDCT tạo mẫu băng lọc nhiều pha từ đường tần số vào 36 giá trị từ IMDCT phải nhân với 36 điểm cửa sổ trước sử dụng cho bước trình giải mã hố Có loại cửa sổ khác áp dụng cho mẫu đầu Cửa sổ sử dụng dựa loại khối, loại khối tìm thấy vùng thơng tin phụ Lý việc tạo 36 giá trị đầu IMDCT dùng 50% chồng lấp cửa sổ 18 giá trị thấp đưa vào với 18 giá trị cao khung trước dùng đầu 18 giá trị cao sau lưu trữ sử dụng theo cách giống khung giải mã hố Hình 4.4.23: Các bước q trình IMDCT Việc tính tốn IMDCT dựa biểu thức sau: Một cửa sổ khác áp dụng cho đầu từ IMDCT Mỗi giá trị đầu tỉ lệ với giá trị tương đương cửa sổ Loại cửa sổ dựa chuỗi tín hiệu đầu vào tương đương cửa sổ bình thường, ngắn, bắt đầu dừng - 112 - Luận văn cao học Chương 4: Nén âm số 4.3.6 Tối ưu hoá IMDCT IMDCT dùng MP3 loại DCT 18 điểm, cung cấp 36 giá trị đầu từ 18 giá trị đầu vào IMDCT hoạt động theo nhiều cách Ba phương pháp mô tả sau đây, phương pháp tối ưu ma trận DCT sử dụng cho giải mã 4.3.6.1 Phương pháp trực tiếp Trên thực tế DCT ma trận nhân, phải thực 18x36 phép nhân 17x36 phép cộng Tính trực tiếp giải pháp khơng tốt khơng hiệu Hình 4.4.24: Tính DCT dùng ma trận 4.3.6.2 Thuật tốn DCT nhanh Có thuật tốn cho việc tính DCT nhanh giống biến đổi Fourier tính nhanh với FFT Vấn đề áp dụng cho DCT có độ dài 2k Một DCT có độ dài khác 2k phức tạp dùng DCT nhanh cần vài thay đổi thực dựa thuật tốn, tính DCT 18 điểm dùng 244 phép nhân khoảng 100 phép cộng 4.3.6.3 Tối ưu ma trận DCT Phương pháp thứ ba tối ưu ma trận Một chương trình phát triển với mục đích nghiên cứu ma trận DCT tạo mã nguồn cách trực tiếp Chương trình cố gắng tối thiểu số lượng phép nhân cách giữ lại tính tốn trước Nếu tìm thấy hai phép nhân giống hệt kết phép nhân thứ gán cho phép nhân sau Nó tìm thấy tổng hai phép nhân giống hệt nhau, bỏ qua hai phép nhân - 113 - Luận văn cao học Chương 4: Nén âm số lấy kết trước Điều tăng đáng kể tốc độ tính tốn số lượng phép nhân yêu cầu từ 648 tới 256 Với kiến trúc xử lý ARM, phép cộng thực song song dùng thị MLA (Multiply and Accumulate) Băng lọc tổng hợp nhiều pha dùng đầu từ IMDCT Theo chuẩn ISO/IEC 11172-3 băng lọc tổng hợp nhiều pha phải hoán vị đầu vào trước sử dụng Để tránh điều này, đầu DCT xếp lại đưa trực tiếp vào băng lọc tổng hợp nhiều pha 4.3.7 Đảo tần Việc xếp lại tần số tích hợp vào IMDCT Nó cải thiện tham số khơng định hoạt động IMDCT Trước đến băng lọc nhiều pha kết hợp, tất mẫu lẻ tất băng lẻ phải bị loại bỏ Điều thực nhằm bù đảo tần băng lọc nhiều pha kết hợp 4.3.8 Băng lọc nhiều pha kết hợp Băng lọc nhiều pha kết hợp hay băng lọc kết hợp bước cuối q trình giải mã hố Nó cung cấp 32 mẫu PCM dùng mẫu đầu vào từ băng lọc Một giản đồ lưu lượng hoàn chỉnh băng lọc kết hợp hình vẽ 4.4.25: - 114 - Luận văn cao học Chương 4: Nén âm số Hình 4.4.25: Băng lọc nhiều pha kết hợp - 115 - Luận văn cao học KẾT LUẬN Bài luận văn đề cập ứng dụng quan trọng mã hố băng con, ứng dụng việc nén tín hiệu âm số Trong Chương 1, chương chương trình bày lý thuyết xử lý tín hiệu số, lọc số nhiều nhịp mã hoá băng Đây tảng, sở để thực việc nén tín hiệu số trình bày chương Chương trình bày tín hiệu số lọc số Chương trình bày kỹ thuật lọc số nhiều nhịp Đây sở hình thành băng lọc số Các mơ hình băng lọc số Chương trình bày mơ hình khác băng lọc số ứng dụng để mã hoá băng Đưa mơ hình khơi phục tín hiệu cách hồn hảo, khử thành phần hư danh tạo lọc biến đổi nhịp Trong chương luận văn sâu chuẩn nén tín hiệu MPEG-1 Đưa mơ hình xử lý tín hiệu, kỹ thuật sử dụng để tăng chất lượng âm sau nén Đưa sơ đồ mã hoá giải mã hoá phương thức nén Layer I, Layer II Layer III Đồng thời chương đưa sở lý thuyết khối sơ đồ qua thấy nguyên lý hoạt động phương thức nén MPEG-1 - 116 - Luận văn cao học TÀI LIỆU THAM KHẢO Tiếng việt [1] Xử lý tín hiệu lọc số Tập - Nguyễn Quốc Trung 1999 [2] Xử lý tín hiệu lọc số Tập - Nguyễn Quốc Trung 2001 Tiếng Anh [3] [4] [5] [6] [7] [8] Ted Painter, Andreas Spanias “A Review of Algorithms for Perceptual Coding of Digital Audio Signals” K Salomonsen “Degisn and Implementation of an MPEG/Audio Layer III Beatream Processor ” Master thessis, Aalborg University, Denmark 1997 R.G.van der Wal, R.N.J.Veldhuis “Subband Coding of Stereophonic Digital Audio Signals”, Proc of the ICASSP 1991 J.Prince, A Johnson, A Bradley “Subband/ Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation”, Proc Of the ICASSP 1990 MP3 Tech http://www.mp3-tech.org B.Edler “Coding of Audio Signals with Overlapping Block Transform and Adaptive Window Function” 1991 - 117 - ... tài ? ?Nén tín hiệu âm số sử dụng mã hoá băng con? ?? tơi muốn nghiên cứu lĩnh vực nén tín hiệu, mà cụ thể nén tín hiệu âm số sử dụng cơng nghệ mã hố băng Luận văn nghiên cứu cách xử lý tín hiệu số, ... học tín hiệu ta chia tín hiệu rời rạc làm hai loại: Tín hiệu lấy mẫu tín hiệu số Tín hiệu lấy mẫu tín hiệu rời rạc có biên độ liên tục Thơng thường ta ký hiệu tín hiệu lấy mẫu xs(nTs) Tín hiệu số. .. t t (a) Tín hiệu tương tự (b) Tín hiệu lượng tử Hình 1.1.1: Tín hiệu liên tục -3- Luận văn cao học Chương 1: Tín hiệu lọc số 1.2 Tín hiệu rời rạc Một tín hiệu coi tín hiệu rời rạc biến số hàm

Ngày đăng: 28/02/2021, 07:40

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w