Nyquist ngày xưa làm việc cho graham bell lab trong quá trình chế tạo điện thoại nên phải nghiên cứu về truyền dẫn thông tin, sau này shannon dựa trên đấy mở rộng ra nên còn được gọi là nyquistshannon. Lý thuyết đó chỉ đơn giản để tái tạo hoàn thiện 1 tín hiệu analogue thì sampling rate phải = ít nhất 2x frequency của tín hiệu đó. tai người nghe dc tối đa 20khz, tức là 20k lần rung giao động của không khí trong 1 giây, mà sau đó được biểu diễn dưới đồ thị sine với biên độ = voltage thì số lần lấy mẫu của cái đồ thị đó phải ít nhất 2 lần mới có thể tái tạo hoàn hảo lại cái sóng sine đó i.e. min 40khz. Tuy nhiên thường ta chọn tần số lấy mẫu là là 44.1khz thay vì chính xác 40khz vì trước khi dc lấy mẫu tín hiệu phải bị cắt đi đoạn 20khz = phân tần (filtercrossover). ai có build crossover thì biết với 1st order roll off chỉ là 6dboctave. nói nôm na là khi bị cắt tín hiệu sẽ nhỏ dần chứ ko phải là cụt ngay ở cut off frequency (20hz và 20khz). muốn tăng độ roll off thì cái filter phải phức tạp > tăng chi phí sản xuất tuy nhiên điều bắt buộc là từ 20hz20khz sau khi qua phải được bảo toàn y chang như tín hiệu gốc, mà để giảm giá thành filter thường dc làm đơn giản nhất có thể => sampling rate phải tăng lên thành 44.1khz chứ ko còn là 40khz nữa.
Các định dạng cho file âm Để tìm hiểu cách biểu diễn âm thành âm máy tính (âm số), trước hết ta phải hiểu mơ hình chuyển âm từ dạng tương tự sang dạng số - mơ hình PCM (Pulse code modulation) mơ hình PCM - nguồn internet Dữ liệu tự nhiên (âm thanh, hình ảnh) kiểu tương tự (hàm giá trị làm liên tục theo thời gian) Chúng ta biểu diễn trực tiếp giá trị vào máy tính giới hạn không gian nhớ Trước hết liệu rời rạc hóa theo miền thời gian, cách khoảng thời gian T lại lấy giá trị tín hiệu, số lượng mẫu lấy giây 1/T gọi sample rate - tần số lấy mẫu Sau lấy mẫu, thu chuỗi giá trị tín hiệu, để biểu diễn chuỗi vào máy tính ta mã hóa số lượng bit định, số lượng bit dùng để mã hóa gọi bit depth Theo Nyquist Shannon tần số lẫy mẫu bit depth có quan hệ mật thiết với tín hiệu thu gần giống với tín hiệu ban đầu Nyquist làm việc cho graham bell lab trình chế tạo điện thoại nên phải nghiên cứu truyền dẫn thông tin, sau shannon dựa mở rộng nên gọi nyquist-shannon Lý thuyết đơn giản để tái tạo hồn thiện tín hiệu analogue sampling rate phải = 2x frequency tín hiệu tai người nghe dc tối đa 20khz, tức 20k lần rung giao động khơng khí giây, mà sau biểu diễn đồ thị sine với biên độ = voltage số lần lấy mẫu đồ thị phải lần tái tạo hồn hảo lại sóng sine i.e 40khz Tuy nhiên thường ta chọn tần số lấy mẫu là 44.1khz thay xác 40khz trước dc lấy mẫu tín hiệu phải bị cắt đoạn 20khz = phân tần (filter/crossover) có build crossover biết với 1st order roll off 6db/octave nói nơm na bị cắt tín hiệu nhỏ dần ko phải cụt cut off frequency (20hz 20khz) muốn tăng độ roll off filter phải phức tạp -> tăng chi phí sản xuất nhiên điều bắt buộc từ 20hz-20khz sau qua phải bảo tồn y chang tín hiệu gốc, mà để giảm giá thành filter thường dc làm đơn giản => sampling rate phải tăng lên thành 44.1khz ko 40khz Theo chuẩn thu âm quốc tế sample rate /bit depth cân đối phải 44100Hz/24bit, đĩa CD thu âm 44100Hz/16bit Bit rate (Bit per second) tốc độ truyền liệu nhỏ file âm (thường đo kbps (kilo bit per second)) Với loại mã hóa dùng CBR (Constant Bit Rate - số bit mã hóa cố định) ta tính Bit rate, ví dụ CD: 44.1kHz, 16-bit, channel bitrate 44100 * 16 * = 1411200 bps ~ 1.35Mbps Như âm chất lượng cao băng thơng mạng phải lớn chuyển tải liệu 128kbps: Lúc khoảng từ 0-128kbps này, phải mã hóa hết mà thu vào: Tiếng trống, guitar, tiếng vocal chật hẹp nên khơng thể mã hóa hết Các thu 128kbps không đạt độ chi tiết cần thiết Nếu chọn cao (tất nhiên tốn dung lượng), ví dụ: 1411kbps (1000 kilobit giây) có nhiều thơng tin mã hóa Và thu chi tiết hơn, trung thực Bitrate nói lên âm mô tả trung thực đến đâu (Càng cao trung thực Với nhạc cố định bit rate cao âm gần với thực tế phòng thu nhiêu) Các định dạng file âm File âm lưu trữ nén, có loại thuật tốn nén nén có mát thơng tin (lossy) nén không mát thông tin (lossless) Lossy: Loại lưu trữ có đánh thơng tin trình lưu trữ: Nếu nhạc chất lượng thấp, lượng thơng tin bị đánh nhiều; tai thường nhận Nếu nhạc chất lượng cao lượng thơng tin bị đánh ít, loại tai dơi thiết bị xịn phân biệt Những định dạng lossy phổ biến: mp3 ( MPEG-1 Audio Layer 3), m4a (advance Audio Coding), wma Lossless: cách lưu trữ lại gần với âm gốc Tại lại "gần tất cả" mà "tất cả"? ==> Những định dạng nhạc coi "lossless - Không thông tin" phải có tần số lấy mẫu gấp đơi ngưỡng nghe người: >= 20kHz x = 40kHz Vậy nên tần số lấy mẫu file lossless thường gặp 44100Hz, 48kHz, 96kHz, 192kHz, 384kHz Những định dạng lossless phổ biến: WAV (Windows Wave, audio file format for IBM-compatible personal computers), AIFF, FLAC (Free Lossless Audio Codec), ALAC (Apple Lossless Audio Codec) Kỹ thuật phân tích phổ - Spectrum Analyzer Để đánh giá chất lượng thu âm ta dùng kỹ thuật phân tích phổ để xem lưu trữ có gốc hay khơng Có nhiều phần mềm chun nghiệp để phân tích phổ Adobe Audition, đơn giản Spek File nhạc làm mẫu nên có định dạng WAV Định dạng Audiophile coi định dạng chuẩn mực dành cho lossless Điều không cần phải bàn cãi (Tuy nhiên dung lượng cao, khơng tags, lý mà flac, alac đời) Mẫu chọn Baby can I hold you - Marianna Leporace.wav, có link: http://www.mediafire.com/?2idql3yhb1mg9w2 Phần mềm chuẩn mực dùng để convert định dạng nhạc dbPowerAmp Các bạn tìm hiểu tại: http://www.dbpoweramp.com/ Phổ file gốc WAV 30,632KB Phổ convert wav > Flac 19,427KB Phổ convert wav >m4a (alac) 19,672KB Chúng ta thấy phổ chúng Và giới kỹ thuật lẫn Audiophile từ lâu cơng nhận Lossless định dạng Nhưng WAV không hỗ trợ tags dung lượng nặng nhiều, nên bạn chọn FLAC, ALAC Phổ convert wav >mp3 (lame128) 2,725KB: Bị cắt tầm 16kHz cut-off hẳn tầm 17kHz Phổ convert wav >mp3 (lame256kbps) 5,474KB Bị cắt tầm 19kHz cut-off hẳn tầm 19.5kHz Bởi định dạng 256kbps phổ biến Phổ convert wav >mp3 (lame320) 6,835KB Bị cut-off 20kHz! Vừa với ngưỡng nghe người, ngưỡng đủ tốt (cân chất lượng dung lượng) Phổ convert wav >m4a (AAC256) 5,518KB: Kém mp3 256kbps (Tuy nhiên dùng convert iTunes - Apple) Phổ convert wav >m4a (AAC256 with iTunes encode) 5,964KB ... rate (Bit per second) tốc độ truyền liệu nhỏ file âm (thường đo kbps (kilo bit per second)) Với loại mã hóa dùng CBR (Constant Bit Rate - số bit mã hóa cố định) ta tính Bit rate, ví dụ CD: 44.1kHz,... Như âm chất lượng cao băng thơng mạng phải lớn chuyển tải liệu 128kbps: Lúc khoảng từ 0-128kbps này, phải mã hóa hết mà thu vào: Tiếng trống, guitar, tiếng vocal chật hẹp nên khơng thể mã hóa. .. trung thực Bitrate nói lên âm mô tả trung thực đến đâu (Càng cao trung thực Với nhạc cố định bit rate cao âm gần với thực tế phòng thu nhiêu) Các định dạng file âm File âm lưu trữ nén, có loại thuật