Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 20 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
20
Dung lượng
453,02 KB
Nội dung
Chương Xử lý âm Đặc tính âm • Âm giới tự nhiên chất sóng âm tạo từ dao động vật thể truyền mơi trường truyền âm định • Âm tiếng nói, tương tự, sóng âm tạo từ dao động phận máy phát âm truyền môi trường truyền âm 2.1 Các đặc trưng vật lý âm • Ðộ cao (hauteur /pitch): tần số dao động dây và/hoặc phận khác máy phát âm định Tần số dao động (số chu kì dao động giây) lớn âm cao ngược lại Ðơn vị để đo độ cao âm Hertz (viết tắt Hz) • Ðộ mạnh (intensité/intensity): biên độ dao động vật thể định Biên độ dao động trị số lớn mà dao động đạt tới nửa chu kì Biên độ dao động lớn, âm vang to ngược lại Ðơn vị đo độ mạnh âm décibel (viết tắt dB) Các đặc trưng vật lý âm - Ðộ dài (durée/length): thời gian dao động vật thể định - Âm sắc (timbre): phụ thuộc vào độ cao, độ dài độ mạnh tham gia bổ sung vào thành phần kết cấu âm Các đặc điểm hệ thống thính giác người Sự cảm thụ tai người âm • Khoảng cách dải âm lớn yếu mà tai người nghe 120dB, tức dải triệu lần biên độ Người nghe phát thay đổi độ ồn âm tín hiệu bị thay đổi khoảng 1dB (biên độ thay đổi 12%) • Nhận biết mức độ ồn liên quan mật thiết với công suất âm theo bậc mũ 1/3 - Nếu tăng công suất âm lên 10 lần, người nghe nhận độ ồn tăng lên tầm lần (101/3≈2 lần) - Dải nghe người thông thường từ 20Hz đến 20kHz, độ nhạy âm lớn từ 1kHz đến 4kHz - Khả xác định hướng nguồn âm tốt xác định khoảng cách đến nguồn âm Ngưỡng nghe Mặt nạ thời gian Mặt nạ tần số Chuẩn nén audio • MP3 (MPEG layer 3): đời năm 1980 từ viện nghiên cứu Fraunhoufer Institute (Đức) • ACC: Ra đời năm 1997 từ Fraunhofer Institue (Đức) kết hợp với số công ty AT&T, Sony, Dolby, định dạng cải tiến MP3 • OGG: Là định dạng nguồn mở Xiph.org Foundation đề xuất năm 1993, nén tốt có chất lượng tốc độ bit thấp Chuẩn nén audio • Realaudio: Định dạng cơng ty RealNetworks, chủ yếu dùng cho phát nhạc trực tuyến, định dạng đời năm 1995, đến có RealAudio 10 • WMA: Định dạng âm Microsoft, mắt năm 1999, lý thuyết nén 96 kbps với chất lượng MP3 128 kbps WMA phổ biến giới âm phát trực tuyến Các lớp MPEG/audio Có lớp: MPEG-1 Các giải thuật nén âm Nén khơng tổn thất • Mã hóa Huffman • Mã hóa Huffman sửa đổi • Mã hóa số học • Giải thuật Lempel – Ziv – Welch (LZW) Các giải thuật nén âm Nén có tổn thất • Các phương pháp nén âm đơn giản: LCP(Linear Predictive Coding) CELP (Code Excited Linear Predictor) • Nén âm dùng mơ hình âm – tâm lý (Psychoacoustics): Hệ thống nghe phát âm người Che tần số Băng giới hạn Che thời • Nén âm MPEG Nén audio MP3 • MP3 nhóm MPEG-1 lớp cung cấp chất lượng audio gần giống với chất lượng CD tốc độ bit thấp • MP3 hỗ trợ tần số lấy mẫu khác như: 32kHz; 44,1kHz; 48kHz; tốc độ bit thay đổi từ 32 đến 448kbps Nén audio MP3 • Mã hóa audio cảm quan kỹ thuật lợi dụng đặc điểm cảm quan tai người để đạt tỉ lệ nén cao với chất lượng tốt Nén audio MP3 • Hiệu ứng mặt nạ tần số: Hai âm mạnh yếu khác với tần số khác xảy lúc • Hiệu ứng mặt nạ thời gian: Âm yếu phát trước sau âm mạnh Bộ mã hóa MP3 Kết so sánh chất lượng file MP3