Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 73 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
73
Dung lượng
2,12 MB
Nội dung
LỜI MỞ ĐẦU Lý chọn đề tài Sự phát triển ngành khoa học kỹthuật từ sản xuất thiết bị âm chuyên dụng dân dụng dựa công nghệ số Khi dung lượng lưu trữ độ rộng kênh truyềnsố liệu quan tâm mức, tốc độ dòng liệu tínhiệuâm có đủ độ lớn để giữ lại mức âm trung thực Tuy nhiên, khó khăn gặp phải thời gian lưu trữ giá thành thiết bị tăng cao Do đó, để giảm giá thành tốc độ lưu trữ số liệu, phương pháp đưa nén dòng số liệu âmsố Nguyên tắc kỹthuậtnén giảm thông tin dư thừa không cần thiết tínhiệuâmTrong thực tế, tùy theo mục đích khác ta phải giải mâu thuẫn tỷ lệ nén chất lượng âm cho đảm bảo tiêu chuẩn Chính vậy, vấn đề nénmãhóatínhiệuâm thiết bị xử lý, lưu trữ truyền dẫn vấn đề đặc biệt quan tâm ngành truyền thông nói chung ngành truyềnhình nói riêng Xuất phát từ lý đó, chọn đề tài: “ Kỹthuậtmãhóanéntínhiệuâmứngdụngtruyềnhình số” cho luận văn Mục đích nghiên cứu luận văn - Hiểu rõ lý thuyết âm - Hiểu rõ sở lý thuyết sốhóatínhiệu - Các kỹthuậtmãhóanéntínhiệuâm - Các kỹthuậtnénâm MP3 AAC Phương pháp nghiên cứu - Nghiên cứu kỹthuậtnén liệu như: kỹthuậtmãhóa Huffman, kỹthuậtnén LZW (Lempel - Zip Welch)… - Nghiên cứu phương pháp nén liệu nén bảo toàn liệu (lossless data compression) nén mát liệu (lossy data compression) - Nghiên cứu kỹkỹthuậtnén MP3 ACC i - Đánh giá hiệukỹthuậtnénâm MP3 AAC truyềnhìnhsố Nội dung luận văn gồm chương, trình bày vấn đề sau: - Chương I: Trình bày kiến thức sởâm thanh: đặc điểm sóng âm thanh, việc chuyển tínhiệuâm tương tự sang tínhiệuâmsố - Chương II: Các kỹthuậtmãhóanénâm - Chương III: Kỹthuậtmãhóaâm MP3 AAC - Chương IV: Thực nghiệm đánh giá kết kỹthuậtmãhóa MP3 AAC Để hoàn thành luận văn này, em học hỏi kiến thức vô quý báu từ thầy, cô giáo trường Đại học Bách Khoa Hà Nội suốt năm năm học đại học năm học cao học vừa qua Em vô biết ơn dạy dỗ, bảo tận tình thầy, cô thời gian học tập nghiên cứu trường Em đặc biệt bày tỏ lòng biết ơn tới thầy PGS.TS Phạm Văn Bình – Viện Điện Tử Viễn Thông – Trường Đại Học Bách Khoa Hà Nội bảo định hướng cho em nghiên cứu đề tài Thầy cho em lời khuyên bổ ích quý báu suốt trình hoàn thành luận văn Do hạn chế thời gian, tài liệu trình độ thân, luận văn em tránh khỏi thiếu sót, mong thầy cô góp ý củng cố đề luận văn hoàn thiện Em xin chân thành cảm ơn! ii MỤC LỤC LỜI MỞ ĐẦU i MỤC LỤC iii DANH SÁCH CÁC TỪ VIẾT TẮT v DANH SÁCH CÁC HÌNH VẼ, BẢNG vi CHƯƠNG I- KIẾN THỨC CƠ SỞ 1 Âm 1.1 Định nghĩa 1.2 Quá trình truyền lan sóng âm 1.3 Các đặc trưng vật lý âm 1.4 Sự cảm thụ tai người âm 1.5 Phân tích thực nghiệm tínhiệu tiếng nói nốt nhạc 1.6 Các yếu tố ảnh hưởng tới âmTínhiệuâm tương tự 10 2.1 Định nghĩa 10 2.2 Sự chuyển đổi sóng âm sang tínhiệu điện ngược lại 10 2.3 Các thông sốtínhiệu tương tự 14 Tínhiệuâmsố 15 3.1 Định nghĩa 15 3.2 Chuyển đổi tínhiệuâm tương tự sang tínhiệuâmsố 15 Xu hướng sốhóa chương trình truyềnhình giới 21 CHƯƠNG II - KỸTHUẬTMÃHÓAVÀNÉNÂMTHANH 24 Nền tảng lý thuyết thông tin 24 Các giải thuậtnénâm 25 2.1 Giới thiệu 25 2.2 Giải thuậtnén bảo toàn liệu 25 2.3 Giải thuậtnén có liệu 29 Các định dạng âm thực tế 45 3.1 Các định dạng âm không nén: WAVE, AIFF 45 iii 3.2 Các định dạng âmnén không liệu: FLAC, ALAC, APE 45 3.3 Các định dạng âmnén bị liệu: WMA, MP3, AAC 46 Tìm hiểu chuẩn âmtruyềnhình HD 46 4.1 Dolby 46 4.2 DTS (Digital Theater Systems) : 47 CHƯƠNG III - KỸTHUẬTMÃHÓAÂMTHANH MP3 VÀ AAC 48 Kỹthuậtmãhóaâm MP3 48 3.1 Lịch sử phát triển tiêu chuẩn MP3 48 3.2 Thuật toán mãhóa MP3 50 3.3 Sơ đồ khối tổng quát mãhóa MP3 52 Kỹthuậtmãhóaâm AAC 53 4.1 Lịch sử phát triển 53 4.2 Sơ đồ khối mãhóa theo tiêu chuẩn AAC 54 CHƯƠNG IV – ĐÁNH GIÁ KẾT QUẢ KỸTHUẬTMÃHÓA MP3 VÀ ACC 56 Chất lượng mãhóa 56 Tốc độ bít 56 Kết so sánh MP3 AAC thực nghiệm 56 Nhận xét 57 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO 60 PHỤ LỤC iv DANH SÁCH CÁC TỪ VIẾT TẮT LPC Linear Predictive Coding FLAC Free Lossless Audio Codec ALAC Apple Lossless Audio Codec WMA Windows Media Audio PCM Pulse Code Modulation DPCM Differential Pulse Code Modulation ADC Analog Digital Converter DAC Digital Analog Converter ACELP Algebraic Code Excited Linear Prediction CS-ACELP Conjugate Structure– ACELP MPEG Moving Picture Experts Group AAC Advanced Audio Coding LP Linear Prediction Analysis DTS Digital Theater Systems ITU International Telecommunication Union v DANH SÁCH CÁC HÌNH VẼ, BẢNG Hình 1.1 - Tínhiệu ghi nguyên âm A 4 Hình 1.2 - Phổ nguyên âm A dải tần số - 10kHz 4 Hình 1.3 - Phổ nguyên âm A dải tần số - 5kHz 5 Hình 1.4 - Tínhiệu nốt nhạc violon 5 Hình 1.5 - Phổ nốt nhạc violon 5 Hình 1.6 - Phổ tiếng sáo 6 Hình 1.7 - Tínhiệu tiếng trống cơm 7 Hình 1.8 - Phổ tiếng trống cơm 7 Hình 1.9 - Sơ đồ nguyên lý chuyển đổi tínhiệu Microphone điện dung 11 Hình 1.10- Sơ đồ nguyên lý chuyển đổi tínhiệu Microphone tụ điện 12 Hình 1.11- Sơ đồ cấu tạo loa 13 Hình 1.12- Quá trình chuyển đối tínhiệu tương tự sang tínhiệusố 15 Hình 1.13- Hàm lượng tử với bước lượng tử q = 18 Hình 1.14- Lỗi lượng tử hóa 19 Hình 1.15- Sơ dồ mãhóa giải mã DPCM 21 Hình 2.1 - Hình tổng hợp tiếng nói 30 Hình 2.2 - Bộ mãhóa giải mã theo chuẩn G.279 31 Hình 2.3 - Phân tích LP 33 Hình 2.4 - phân tích diễn đạt (tính chất âm thanh) 34 Hình 2.1 - Hiệuứng che thời 40 Hình 2.6 – Sơ đồ mãhóa giải mã MPEG 43 Hình 3.1 - Sơ dồ khối tổng quát bô mãhóa MP3 52 Hình 3.2 - Sơ đồ khối mãhóa chuẩn AAC 55 Bảng 4.1 - Kết so sánh file MP3 57 Bảng 4.2 - Kết so sánh file AAC 58 vi CHƯƠNG I- KIẾN THỨC CƠ SỞÂm 1.1 Định nghĩa Âm dao động học phân tử, nguyên tử hay hạt làm nên vật chất lan truyền vật chất sóng Con người cảm nhận âm dải tần từ 20 Hz đến 20kHz 1.2 Quá trình truyền lan sóng âm Sóng âm từ vật thể rung động phát ra, lan truyền không khí, tới tai ta làm rung màng nhĩ theo nhịp rung vật thể phát tiếng, nhờ mà tai nghe âmTrong không khí, âm lan truyền dạng sóng dọc Trong chất rắn, dạng sóng dọc, âm lan truyền dạng sóng ngang Trong không khí, sóng âm lan truyền từ nguồn âm tất hướng Nếu nguồn âm có kích thước nhỏ so với bước sóng ta coi nguồn âm điểm sóng âm lan tỏa từ điểm không gian hình cầu lớn dần Dạng sóng âm gọi sóng cầu Năng lượng sóng âm giảm tỷ lệ với bình phương khoảng cách 1.3 Các đặc trưng vật lý âm 1.3.1 Tốc độ âmTrong vật chất định nào, âm không thay đổi tốc độ rời khỏi nơi xuất phát Ví dụ nước, âm di chuyển nhanh lần so với không khí Trong sắt hay thép, tốc độ âm nhanh khoảng 15 lần so với không khí Như vậy, tốc độ âm phụ thuộc vào môi trường truyềnâm Môi trường vật chất mà khoảng cách phần tử ngắn tốc độ âm cao Trong không khí, tốc độ âm khoảng 340m/s Tốc độ âm thay đổi theo nhiệt độ, độ ẩm áp suất khí quyển, trừ yếu tố ảnh hưởng tới tính chất vật lý không khí 1.3.2 Áp suất âm Độ dao động áp suất khí bị sóng âm tác động gọi áp suất âm Áp suất âm hay gọi áp đại lượng cực nhỏ, thí dụ khoảng cách 1m người nói bình thường tạo phần triệu áp suất khí Thanh áp tác động lên hướng không gian Độ lớn áp biểu thị đơn vị Pascal [ Pa ] Trong trường gần, áp biến đổi theo tỷ lệ nghịch với khoảng cách không phụ thuộc vào tần sốTrong thực tế, người ta biểu thị áp dạng mức: mức áp với đơn vị đo dB Trong đó: p: áp Po: áp lấy làm chuẩn, trị số áp ngưỡng nghe 1.3.3 Tốc độ dao động âm Khi có tác động sóng âm thanh, phần tử không khí dao động xung quanh vị trí cân Tốc độ dao động phần tử không khí tác động âm gọi tốc độ dao động âm ( kýhiệu v [m/s] ) Cần phân biệt tốc độ dao động với tốc độ lan truyềnâm 1.3.4 Công suất âm Công suất âm lượng âm qua đơn vị diện tích S khoảng thời gian 1s 1.3.5 Cường độ âm Cường độ âm công suất âm qua đơn vị diện tích đặt vuông góc với phương truyềnâm đơn vị thời gian 1.3.6 Tần số Tần sốsố lần dao động giây Đơn vị đo tần số Hz Tần sốâm đơn số lần dao động không khí truyền dẫn âm giây 1.4 Sự cảm thụ tai người âm Tai người nghe âm dải tần số từ 20 Hz đến 20kHz Siêu âmâm dao động 20kHz Hạ âmâm dao động 20 Hz Tai người không nghe siêu âm hạ âm Tai người phân biệt 130 mức áp khác nhau, mức cách dB Tai người nghe nhạy với âm có tần số nằm khoảng 500 Hz đến 5000 Hz Tiếng nói (voice, speech) âm phát từ miệng người, truyền không khí đến tai người nghe Dải tần số tiếng nói đủ nghe rõ từ 300 Hz đến 3500 Hz, dải tần tiêu chuẩn áp dụng cho điện thoại Còn dải tần tiếng nói có chất lượng cao từ 200 Hz-7000 Hz, áp dụng cho ampli hội trường Âm nhạc (music) âm phát từ nhạc cụ Dải tần sốâm nhạc từ 20 Hz đến 15000 Hz Tiếng kêu âm phát từ mồm động vật Tiếng Cá Heo (dolphins) loại âm dảy tần số 1-164 kHz, Con Dơi (bats) 20 115 kHz, Cá Voi (whale) 30-8000 Hz (Cần xác minh lại số liệu) Tiếng động âm phát từ va chạm vật Thí dụ tiếng va chạm cốc, tiếng va chạm cánh cửa, tiếng sách rơi Tiếng ồn (noise) âm không mong muốn Nhìn chung lại, xét phương diện tínhiệu cảm thụ tai người, có hai loại âm: Tuần hoàn bao gồm tiếng nói, âm nhạc Không tuần hoàn tínhiệu tạp nhiễu, số phụ âm tắc xát sh, s 1.5 Phân tích thực nghiệm tínhiệu tiếng nói nốt nhạc Sau hìnhtínhiệu thu qua microphone vào máy tính nguyên âm A Hình 1.1 - Tínhiệu ghi nguyên âm A phổ tínhiệu (trục hoành trục tần số) Trục đo tần số 10.000Hz Hình 1.2 - Phổ nguyên âm A dải tần số - 10kHz Nhìn vào hình vẽ tín hiệu, ta thấy rõ nguyên âm A hàm tuần hoàn, chu kì To xấp xỉ = 10ms, Fo=100 Hz Song bên chu kì To, ta nhìn thấy dao động tần số cao Nhìn vào đồ thị phổ tín hiệu, ta thấy phổ vạch, khoảng cách hai vạch Fo=1/To Bên cạnh bạn nhìn thấy đỉnh cộng hưởng, formants Qua đồ thị phổ tínhiệu nguyên âm A, ta thấy rõ dải phổ tínhiệu không vượt 4000 Hz, tức 4000 Hz, lượng coi Nếu đo phổ với trục đo tần số tập trung vào khoảng 0-5.000Hz, ta thấy rõ vạch phổ rời rạc, cách Fo hóasố bít yêu cầu cho mãhóa Huffman đủ nhỏ, dẫn đến tốc độ bit tínhiệu MP3 đủ nhỏ - Vòng lặp hay vòng lặp điều khiển nhiễu (Distortion control loop): hiệu chỉnh hệ số tỷ lệ để giảm dần nhiễu lượng tử hóa, lúc số mức lượng tử hóa tăng dần lên, làm tốc độ bit tăng dần lên, dẫn đến vòng lặp phải hiệu chỉnh độ lợi Nếu không đồng thời thỏa mãn yêu cầu tốc độ bit chất lượng audio hai vòng lặp điểm hội tụ Để tránh trường hợp này, phải hiệu chỉnh thông sốmãhóamãhóa hoạt động tốc độ bit khác - Định dạng dòng bít (Bitstream formatting): dòng bit MP3 định dạng theo khung, gồm hệ số phổ mã hóa, đầu khung header gồm: từ mã đồng bộ, tốc độ bit, tần số lấy mẫu, lớp, mode mãhóa Do thông tin lặp lại tất khung nên ta giải mã vào lúc Kỹthuậtmãhóaâm AAC Tiêu chuẩn AAC (Advanced Audio Coding) – Mãhóaâm tiên tiến tiêu chuẩn mãhóa cho việc nénâmkỹthuậtsố có tổn hao (lossy) Nó thiết kế với mục tiêu tích hợp nhiều kiểu mãhóaâm khác như: Âm tự nhiên với âm nhân tạo, truyền tải tốc độ bít thấp với tốc độ bít cao, lời thoại với âm nhạc, ghi âm phức tạp với ghi âm đơn giản, nội dung đơn giản với nội dung thực tế ảo (virtual-reality) 4.1 Lịch sử phát triển ACC phát triển với hợp tác đóng góp nhiều công ty AT&T Bell, Fraunhofer IIS, Dolby, Sony Nokia Năm 1997, AAC thức tiêu chuẩn hóa Phần tiêu chuẩn MPEG-2 (MPEG-2 Part hay tiêu chuẩn ISO/IEC 13818-7:1997) Nhóm chuyên gia mãhóa phim ảnh (Moving Picture Coding Experts Group – MPEG, thành lập năm 1988 với hợp tác tổ chức ISO (International Organization for Standardization – Tổ chức tiêu chuẩn quốc tế) IEC (International Electrotechnical Commission - Ủy ban Kỹthuật điện quốc tế)) So sánh với thuật toán nénâm thời đó, MPEG-2 AAC có chất lượng âm bật tỉ lệ nén có, nhờ khả 53 néntínhiệu có tốc độ bít thấp nên trở thành tiêu chuẩn mã hóa/giải mã hàng đầu cho ứngdụng phát quảng bá (broadcasting), dịch vụ Internet ứngdụng di động Năm 1999, MPEG-4 AAC thông qua Nhóm MPEG, tiêu chuẩn ISO/IEC 14496-3:1999, với số cải tiến Nó xây dựng dựa tiêu chuẩn MPEG-2 AAC, giữ lại tối đa khả tương thích cú pháp bitstream (chuỗi bit mãhóa giải mã phần chứa đoạn mãhóa liệu ngẫu nhiên) tiêu chuẩn MPEG-2 AAC Nói cách khác, giải mã MPEG-4 ACC có khả giải mã bitstream tiêu chuẩn MPEG-2 AAC Mặt khác, MPEG-4 AAC cải thiện khả mở rộng (scalability), khả phục hồi lỗi (error resilience) bổ sung thêm số đặc tính xử lý phổ (spectral) Năm 2003, nhóm MPEG giới thiệu tiêu chuẩn HE-AAC (High Efficiency AAC), thuật toán mở rộng AAC với mục tiêu hướng tới ứngdụng có tốc độ bít thấp đạt hiệumãhóa cao HE-AAC cung cấp công cụ có tên gọi Sao chép dải phổ (Spectral Band Replication – SBR), công cụ xây dựng lại tínhiệu đầu có dải tần số cao dựa liệu có dải tần số thấp số thông tin khác Năm 2004, HE-AAC phiên Nhóm MPEG giới thiệu HEAAC sử dụng công cụ Parametric Stereo (cơ dựa SBR HE-AAC), công cụ có khả xây dựng lại tínhiệuâm stereo (sử dụng hai nhiều kênh độc lập để tái tạo âm từ nhiều hướng khác nhau) dựa tínhiệu mono (tất tínhiệuâm pha trộn với định tuyến thông qua kênh âm nhất) hỗn hợp vài tham số khác 4.2 Sơ đồ khối mãhóa theo tiêu chuẩn AAC AAC có kiến trúc tương tự MP3 khác với MP3 chỗ ÂC dùng phương pháp modul hóa, phát triển thêm nhiều công cụ mãhóa mới, giúp cải tiến chất lượng audio tốc độ bít thấp: 54 Hình 3.2 - Sơ đồ khối mãhóa chuẩn AAC - Giàn lọc: AAC thay giàn lọc MP3 MDCT với kích thước cửa sổ dài 1024 ( thay cho 576 MP3) Điều làm tăng độ phân giải tần sốso với MP3 - TNS (Temporal Noise Shapping): công nghệ thành công việc cải thiện chất lượng tiếng nói tốc độ bit thấp TNS tạo dạng nhiễu miền thời gian vòng lặp hở dự đoán miền tần số - Dự đoán (prediction): dùng khối dự đoán để tăng tỷ lệ nén cách hướng cho lượng tử hóa tập trung vào mẫu tínhiệu quan tâm - Mãhóa audio: mãhóa MS (middle/side) ghép cặp (coupling) mềm dẻo MP3, cho phép giảm tốc độ bit - Mãhóa Huffman: dùng từ mã có độ dài thay đổi để giảm độ dư hệ số tỷ lệ giá trị vạch phổ lượng tử hóa - Bitstream multiplexer: tương tự Mp3, dòng bit AAC định dạng thành khung, khung AAC có từ mã đồng tham sốmãhóa không gắn liền với thay đổi tùy ứngdụng cụ thể 55 CHƯƠNG IV – ĐÁNH GIÁ KẾT QUẢ KỸTHUẬTMÃHÓA MP3 VÀ ACC Chất lượng mãhóa Để đánh giá chất lượng mãhóatínhiệu audio, có phương pháp là: nghe thử (đánh giá chủ quan), đánh giá khách quan đo cảm quan - Cho đến nghe thử phương pháp đơn giản hiệu để đánh giá chất lượng thuật toán mãhóa audio khác ITU-R phát viên nhóm MPEG audio đề xuất loạt quy tắc phức tạp để đánh giá chất lượng cách nghe thử - Đánh giá khách quan phương pháp dựa vào tỷ sốtínhiệu nhiễu SNR Tuy nhiên làm xem không tuân theo mục đích mãhóa cảm quan mãhóa cảm quan cải thiện chất lượng audio cách thêm miền thời gian tần số dựa chế cảm quan tai, nên dẫn đến SNR thấp - ITU-R chuẩn hóa phương pháp đánh giá chất lượng gọi đo cảm quan dựa vào mô hình cảm quan tai để đánh giá chất lượng tínhiệu audio nén Tốc độ bít MPEG không làm việc với tốc độ bít cố định mà người dùng tùy chọn tốc độ bit Tốc độ bít thấp dẫn đến tỷ lệ nén tốt chất lượng thấp Tuy nhiên, ta tìm tốc độ bit đặc biệt gọi “ sweet spot”, thuật toán làm việc tốt Tạo tốc độ bit lớn “ sweet spot”, chất lượng tínhiệu audio tăng chậm, tốc độ bit thấp hơn, chất lượng lại giảm nhanh Kết so sánh MP3 AAC thực nghiệm Dùng chức “Recoring” phần mềm thu hòaâm chuyên nghiệp Protools để ghi âm 20 file âm nhạc dạng *.wav, có 10 file nhạc cổ điển 10 file nhạc Rap Chế độ thu chọn stereo, tần số lấy mẫu 32kHz 44.1kHz Sau tiến hành nén file wavlần lượt chọn thuật 56 toán nén MP3 AAC Đối với MP3, tiến hành nén tốc độ bit 32kbps, 64kbps 128kbps Đối với AAC, tiến hành nén tốc độ bit 64kbps, 128kbps 192kbps Sau đó, so sánh chất lượng phương pháp nghe thử nhằm kiểm tra tiếng ồn, độ méo, cao độ nốt, ổn định,…, kết sau: Tốc độ bít 32 kbps Nhạc cổ điển lấy Nhạc cổ điển lấy kbps Nhạc RAP lấy mẫu 32 kHz mẫu 44.1 kHz mẫu 32 kHz mẫu 44.1 kHz Rất méo, ồn Không cải thiện Rất méo, ồn Không cải thiện nốt dài so với tần số nói so với tần số bị đứt đoạn lấy mẫu 32 kHz dài bị đứt đoạn lấy mẫu 32 kHz Méo bị đứt 64 Nhạc RAP lấy Vẫn méo ồn đoạn nốt dài nốt dài, tốt bị đứt đoạn so với tần số lấy mẫu 32 kHz Tốt so với Vẫn méo ồn RAP lấy mẫu nốt tần số 32 kHz dài bớt bị đứt đoạn nhận méo, ồn đứt đoạn Còn méo ít, Chất lượng gần Còn méo, ồn Chất lượng gần 128 với file gốc, khó bị đứt đoạn với file gốc , khó kbps nốt dài không phân biệt với file phân biệt với file bị đứt đoạn wav chấp nhận gốc Bảng 4.1 _ Kết so sánh file MP3 Nhận xét Kết đánh giá chất lượng file nén MP3 bảng cho thấy: thu âm tần số lấy mẫu 32kHz chất lượng âm nhạc tệ Cả hai loại nhạc thử nghiệm đạt chất lượng chấp nhận tần số lấy mẫu 44.1kHz tốc độ bit 64kbps, muốn chất lượng phải nén tốc độ bit 128kbps Lúc tỷ lệ nén đạt cao là: 1.411 (Mbps) : 128 (kbps) = 11 : 57 Đối với AAC, kết trình bày bảng 2, nhạc cổ điển thu âm tần số lấy mẫu 44.1kHz nén tốc độ bit 64kbps có chất lượng chấp nhận tốt so với Rap, nốt cao nghe rõ hơn; đoạn nói nhạc Rap bị méo nhiều so với nhạc Cả hai loại nhạc thử nghiệm thu âm tần số lấy mẫu 44.1kHz nén tốc độ bit 128kbps 192kbps cho chất lượng tuyệt, đặc biệt khó phân biệt chất lượng tốc độ 128kbps 192kbps Tốc độ bít 64 kbps 128 kbps 192 kbps Nhạc cổ điển lấy Nhạc cổ điển lấy Nhạc RAP lấy Nhạc RAP lấy mẫu 32 kHz mẫu 44.1 kHz mẫu 32 kHz mẫu 44.1 kHz Rất méo, ồn Rất nhiễu, nốt cao bị méo, nghe bị phô tốt Gần với chất Gần với chất Gần với chất Gần với chất lượng file gốc, lượng file gốc, lượng file gốc, lượng file gốc, Còn ồn nốt cao bị phô Còn ồn số nốt cao bị phô khó phân biệt với khó phân biệt với khó phân biệt với khó phân biệt với file không nén file không nén file không nén file không nén wav wav wav wav Gần với chất Gần với chất Gần với chất Gần với chất lượng file gốc, lượng file gốc, lượng file gốc, lượng file gốc, khó phân biệt với khó phân biệt với khó phân biệt với khó phân biệt với file tốc độ 128 file tốc độ 128 file tốc độ 128 file tốc độ 128 kbps kbps kbps kbps Bảng 4.2 _ Kết so sánh file AAC 58 KẾT LUẬN - Trong luận văn, tìm hiểu kiến thức lý thuyết âm thanh,kỹ thuậtmãhóanénâmsố chuẩn nénâm sử dụngtruyềnhình HD - Cả hai chuẩn mãhóa MP3 AAC néntínhiệu audio với chất lượng gần chất lượng CD Trong hai chuẩn trên: MP3 phức tạp AAC AAC cung cấp chất lượng tốt MP3 với tần số lấy mẫu tỷ lệ nén - Tuy nhiên, tùy thuộc vào ứngdụng thực tế, khả lưu trữ, băng thông đường truyền hệ thống mà ta chọn phương pháp nén phù hợp - Hướng phát triển luận văn: Hiện nay, kỹthuậttruyềnhình phát triển mức cao hơn, không truyềnhình với hình ảnh c HD mà chuyển sang 4K, 8K Để đáp ứng nhu cầu khán giả âm sống động, gần với thực tế người ta sử dụngâm vòm (surround) cho chương trình truyềnhình Vì vậy, kiến nghị phát triển luận văn việc nghiên cứu kỹthuậtmã hóa, nén phương pháp truyềntínhiệuâm vòm 59 TÀI LIỆU THAM KHẢO Tài liệu tham khảo tiếng Anh [1] Jenq-Neng Hwang, “Multimedia Networking”, Cambridge University Press 2009 [2] Karl Heinz Brandenburg, “MP3 and AAC explained”, AES 17th International Conference on High Quality Audio Coding [3] Stephen Bunting, “A subjective comparison of MPEG-4 AAC codecs”, 4B Technical Project 2004 [4] C Colomes, C Schmidmer, and W.C Treurniet, “Perceptual quality assessment for digital audio: PEAQ-the proposed ITU standard for objective measurement of perceived audio quality”, AES 17th International Conference Tài liệu tham khảo tiếng Việt [5] Hoàng Lê Uyên Thục, Phạm Văn Tuấn (2010), Bài về: Tổng quan kỹthuậtnén audio chất lượng cao MP3 ACC dùng thiết bị số nay, TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(39).2010 [6] Nguyễn Quốc Trung (2004), Xử lý tínhiệu lọc số, Tập 1, Nhà xuất Khoa học kỹthuật [7] Trần Công Chí(1999), Âm lập thể nguyên lý công nghệ, Nhà xuất Khoa học kỹthuật [8] Trần Thị Minh Huệ (2012), Luận án mãhoánéntínhiệuâmứngdụng phát số 60 PHỤ LỤC Giới thiệu phần mềm Protools HD 11 - Phần mềm ProTools đánh giá công cụ lý tưởng cho tất yêu cầu sản xuất âm nhạc, phát hậu kỳâm chuyên nghiệp - Phần mềm kỹ xảo tích hợp phần mềm_Plug in: phần bổ sung thêm công cụ xử lý tiếng, làm kỹ xảo tiếng để làm cho âm có nhiều màu sắc Nó làm việc hoà nhập với phần mềm Pro Tools Người khai thác có khả chọn lựa nhiều Plug-Ins khác hãng tiếng giới, từ Plug-Ins có chức đơn giản EQ tạo vang Plug-Ins đặc biệt hỗ trợ cho Pro Tools Phương pháp tiến hành thực nghiệm - Sử dụng chức Record phần mềm để ghi lại tín hiệu: âm A, tiếng sáo, tiếng trống cơm - Sử dụng plugin PAZ_Frequency để phân tích phổ tínhiệu - Kết thu phổ tínhiệu hình: Hình 1.1 - Tínhiệu ghi nguyên âm A Hình 1.2 - Phổ nguyên âm A dải tần số - 10kHz Hình 1.3 - Phổ nguyên âm A dải tần số - 5kHz Hình 1.4 - Tínhiệu nốt nhạc violon Hình 1.5 - Phổ nốt nhạc violon Hình 1.6 - Phổ tiếng sáo Hình 1.7 - Tínhiệu tiếng trống cơm Hình 1.8 - Phổ tiếng trống cơm - Dùng chức “Recording” phần mềm thu hòaâm chuyên nghiệp Protools để ghi âm 20 file âm nhạc dạng *.wav, có 10 file nhạc cổ điển 10 file nhạc Rap Chế độ thu chọn stereo, tần số lấy mẫu 32kHz 44.1kHz - Sau tiến hành nén file wav chọn thuật toán nén MP3 Đối với MP3, tiến hành nén tốc độ bit 32kbps, 64kbps 128kbps - Sau nén xong ta thu file nhạc MP3 với thông số sau: - Đối với AAC, tiến hành nén tốc độ bit 64kbps, 128kbps 192kbps - Sau nén xong ta thu file nhạc mãhóa AAC với thông số sau: - Tiến hành làm tương tự với file thu, ta file mãhóa MP3 AAC tốc độ khác - Nghe file sau nén ta có kết bảng: Bảng 4.1 _ Kết so sánh file MP3 Bảng 4.2 _ Kết so sánh file AAC ... hiệu âm tương tự sang tín hiệu âm số - Chương II: Các kỹ thuật mã hóa nén âm - Chương III: Kỹ thuật mã hóa âm MP3 AAC - Chương IV: Thực nghiệm đánh giá kết kỹ thuật mã hóa MP3 AAC Để hoàn thành... sang tín hiệu âm số 15 Xu hướng số hóa chương trình truyền hình giới 21 CHƯƠNG II - KỸ THUẬT MÃ HÓA VÀ NÉN ÂM THANH 24 Nền tảng lý thuyết thông tin 24 Các giải thuật nén âm ... nghiệm tín hiệu tiếng nói nốt nhạc Sau hình tín hiệu thu qua microphone vào máy tính nguyên âm A Hình 1.1 - Tín hiệu ghi nguyên âm A phổ tín hiệu (trục hoành trục tần số) Trục đo tần số 10.000Hz Hình