Đĩa CD là một trong những ứng dụng đầu tiên của công nghệ audio số. Nó đã chiếm lĩnh thị trường băng đĩa thu âm và tạo ra bước đột phá của máy tính cá nhân thông qua ổđĩa CD-ROM và một vài ứng dụng khác.
1.14.1. Đĩa compact (CD)
Công nghệ ghi đĩa quang được phát triển vào những năm 70 và xuất hiện lần
đầu tiên ở dạng analog là đĩa hình laser (LVD). Sản phẩm này chưa bao giờ xuất hiện trên thị trường tiêu dùng nhưng lại đóng một vai trò rất quan trọng trong lĩnh vực giáo dục và đào tạo. Vì trong lĩnh vực này khả năng truy cập ngẫu nhiên của đĩa ghi phù hợp hơn băng ghi.
Đĩa CD, được Sony và Philip phát triển và giới thiệu vào đầu những năm 80, vẫn áp dụng công nghệ LVD để ghi số trên đĩa nhựa có kích thước 12cm. Ở đây chúng ta chỉ đề cập đến các thông số lấy mẫu. Sự lựa chọn các tiêu chuẩn của CD cho audio số (CD-DA) phải đảm bảo yêu cầu về chất lượng, độ rộng band tần ít nhất
là 18KHz và SNR phải lớn hơn 90 đồng bộ, chuyển sang tần số lấy mẫu là 44,1KHz và 16 bit/mẫu, mã hóa sử dụng điều chế xung mã (PCM) và không có nén. Mã hóa kênh để chống lỗi bao gồm mã khối Reed-Solomon và chèn mã.
Tiêu chuẩn CD-DA đã cho ra đời một hệ thống tương đối mạnh nhưng chỉ
dùng để đọc. Nhờ sự tiến bộ của kỹ thuật số, giá thành mọi thiết bị với đầy đủ các tính năng kỹ thuật đã giảm đáng kể.
1.14.2. Băng âm thanh số
Tiếp theo những thành công của đĩa chuyển đổi, một hệ thống băng từđã được phát triển và tạo ra một hệ thống có khả năng ghi đọc phối hợp các chỉ tiêu của đĩa CD. Đây chính là băng âm thanh số. DAT được sử dụng trước tiên trong lĩnh vực thu âm chuyên nghiệp hoặc được sử dụng để lưu trữ dữ liệu trong máy vi tính cá nhân, nó có khả năng lưu trữ với dung lượng trên 4 GB.
1.14.3. Âm thanh trong PC
Máy tính cá nhân có khả năng lưu trữ và xử lý bất cứ tín hiệu thuộc về kỹ thuật số. Do vậy, xử lý âm thanh số với các PC là một điều hoàn toàn tự nhiên. Những PC trước đây không có phần cứng (A/D và D/A) để xử lý các âm thanh analog chất lượng cao tại card âm thanh. Ngày nay, mọi PC đều có card âm thanh.
Tuy nhiên, dữ liệu được tạo ra theo tiêu chuẩn CD-DA (9MB/phút) là quá nhiều cho khả năng lưu trữ của hầu hết các PC, do vậy các tiêu chuẩn âm thanh đặc biệt của PC đã được xây dựng để cho phép điều chỉnh chất lượng âm thanh phù hợp với kích cỡ của dữ liệu ở một vài cấp độ. Tiêu chuẩn thấp nhất đưa ra có tần số lấy mẫu là 11,05 KHz ở 8bit/mẫu, nó chỉ phù hợp với lời nói sử dụng tốc độ dữ liệu ở
0,66 MB/phút. Tần số lấy mẫu và số bit/mẫu được nhân đôi khi áp dụng cho âm nhạc. Tiêu chuẩn này cũng có thể dùng cho âm thanh nổi (stereo) với tốc độ dữ liệu lên tới 4,5 MB/phút.
Các tiêu chuẩn audio cho PC cũng bao gồm phần nén, dựa trên thuật toán AD- PCM. Thuật toán AD-PCM có thể giảm tốc độ dữ liệu đi 4 lần trong khi chất lượng giảm không đáng kể. Cần lưu ý là, đặc điểm phi cấu trúc của một tín hiệu audio sẽ đưa ra khả năng nén dữ liệu ít hơn nhiều so với tín hiệu video.
1.14.4. Tổng hợp nhạc
Có hai yêu cầu khác nhau cho các bộ tổng hợp. Mục đích thứ nhất là tái tạo các dụng cụ phát âm ở mức chuẩn nhất có thể, hai là tạo ra những âm thanh mới và kỳ lạ
không có trong tự nhiên. Cả hai mục đích này đều quan trọng như nhau.
Phương pháp tốt nhất để tổng hợp âm thanh tự nhiên như là âm thanh của các bộ khí cụ nhạc được gọi là bộ tổng hợp sóng âm. Ở phương pháp này, các nhạc cụ
được lấy mẫu theo kỹ thuật số, đọc mỗi lần một nốt, thường chỉở một vài điểm trên phạm vi tần số của nhạc cụ đó. Những mẫu này được lưu trữ trong bộ nhớ của bộ
tổng hợp và khi một nốt nhạc được đọc, mẫu gần nhất được chọn từ bộ nhớ sẽ dịch chuyển tần số nhờ quá trình xử lý số, ở một hệ thống được thiết kế hoàn chỉnh, âm tổng hợp sẽ rất trung thực.
Có rất nhiều loại hình tổng hợp khác nhau, tuy nhiên loại hình được sử dụng nhiều nhất là tổng hợp FM, ở loại hình này FM sẽ là biến điệu tần số. Nguyên lý của phương pháp này là một hoặc nhiều bộ dao động có tần số bị biến điệu bởi tần số
khác để tạo ra phổ của dải band tần. Phổ này sẽđược lọc để tạo nên âm thanh ở đầu ra. Âm thanh được tổng hợp theo loại hình này rất mềm dẻo. Tuy nhiên, việc lập chương trình cho âm thanh là rất phức tạp và không thuộc về lĩnh vực trực giác ngay cảđối với nhạc sĩ. Song, nó vẫn phổ biến nhờ khả năng truyền tải nhiều tính năng ở
mức giá thấp. Dù vậy, nó cũng không tốt bằng quá trình lấy mẫu để tổng hợp âm thanh thực của nhạc cụ.
1.15. AUDIO ĐA KÊNH
Hai hoặc nhiều kênh mô phỏng những âm thanh từ cùng một nguồn với cùng sự phân bổ không gian tạo ra những âm thanh gần với thực tiễn hơn vì người nghe có thể thụ cảm được tính có hướng của âm thanh. Mặc dù nhiều thiết bị đa hợp các kênh audio để phù hợp cho ghi hoặc phân bổ nhưng mục đích thường vẫn là giữ cho các kênh độc lập với nhau chỉ với việc trộn kênh xảy ra trong không gian, nơi âm thanh được thu. Với cách này, cảm giác nhưở trong một khoảng không gian thật sẽ
tăng lên rõ rệt. Audio hai kênh được gọi là âm thanh nổi. Nó được sử dụng rộng rãi trong quá trình ghi và quảng bá cả phát thanh lẫn truyền hình. Các kênh được gọi là trái (L) và phải (R) tương ứng với vị trí của loa.
Cảm giác âm thanh như trong không gian thực có thể tăng lên khi cho thêm một hoặc vài kênh mô phỏng phát âm ở phía sau người nghe. Đây là nguyên lý của âm vòm, được sử dụng rộng rãi trong khi chiếu phim và đã nhanh chóng được áp dụng ở HDTV số. Hệ thống này cung cấp “5.1” kênh, với 5 kênh có độ rộng band tần lớn nhất và một kênh dùng loa lợi trầm phụ. Một vài máy thu TV cung cấp âm vòng mô phỏng rất hiệu quả ngay cả khi truyền hình chỉ phát bằng âm nổi.
Chương 2
SỐ HÓA TÍN HIỆU AUDIO VÀ VIDEO
2.1 GIỚI THIỆU
Hầu hết các tín hiệu audio và video tự nhiên là ở dạng tương tự, nhưng hầu hết các thiết bị lưu trữ và truyền tải tín hiệu hiện nay được thực hiện dựa trên phương thức số, cho nên chuyển đổi tín hiệu tương tự sang số là một một yêu cầu cần thiết. Chất lượng tín hiệu tối đa của một hệ thống audio và video số hầu nhưđược quyết
định toàn bộở bộ chuyển đổi tương tự sang số ADC. Còn các phần tử khác trong hệ
thống số có thể có khả năng tái tạo lại một hoàn hảo tín hiệu nhưng không thể cải thiện được chất lượng hình ảnh và âm thanh tốt hơn tín hiệu số hóa sau bộ ADC. Hiểu được đầy đủ những hạn chế của bộ ADC là rất quan trọng trong việc thiết kế
và sử dụng các hệ thống số và đây cũng là mục đích của chương này.
2.2. CÁC BƯỚC CỦA ADC
Các bước chuyển đổi bao gồm quá trìn lọc trước để loại bỏ những tần số quá cao không thể số hóa được tại đầu vào, quá trình lấy mẫu dùng để rời rạc hóa tín hiệu theo thời gian, quá trình lượng tử hóa để chuyển biên độ tín hiệu tương tự sang dạng số, và cuối cùng là quá trình mã hóa để chỉ rõ cách thức biểu diễn của các giá trị số. Mỗi một quá trình này được đề cập trong các phần dưới đây. Ở phần cuối của một hệ thống số, tín hiệu anolog ban đầu sẽđược phục hồi từ chuỗi các mẫu nhờ bộ
chuyển đổi số sang tương tự, bộ ADC có nhiệm vụ chuyển các mẫu thành các xung
điều chế biên độ, sau đó bộ lọc thông thấp loại bỏ các thành phần ở tần số lấy mẫu cao hơn.
Tiền lọc Lấy mẫu Ltửượ hóa ng Mã hóa Tín hiệu analog Tín hiệu digital 0111 0110 0101 0100 0011 0010 0001 0000 Hình 2.1. Sơđồ khối ADC
Như trên hình 2.1, trình bày một sơ đồ khối khái quát của khối ADC, quá trình lấy mẫu và lượng tử hóa làm việc dựa trên các đặc tính trực giao của tín hiệu (thời gian và biên độ), điều này có nghĩa là chúng độc lập với nhau. Vì vậy, cả hai bước này có thể được thực hiện theo cả hai trật tự, tức là có thể lượng tử hóa trước thay bằng cách lấy mẫu trước như trong hình.
2.2.1. Tiền lọc và lấy mẫu
Lấy mẫu là quá trình đọc các giá trị của tín hiệu tương tự theo chu kỳ xác định. Thông thường các mẫu có xu hướng nhất thời, có nghĩa là mẫu được lấy trong khoảng thời gian ngắn hơn chu kỳ của tần số lấy mẫu. Độ rộng của một mẫu là số
phần trăm của chu kỳ tần số lấy mẫu, trên chu kỳ này mẫu được lấy trung bình.
Đầu ra của quá trình lấy mẫu là một chuỗi các giá trị tương tự (các mẫu) tương
ứng với các điểm ở dạng sóng, nơi diễn ra quá trình lấy mẫu. Nó thường là các dạng xung ở tần số lấy mẫu, và biên độ của tần số lấy mẫu biểu thị các giá trị của mẫu.
Tần số lấy mẫu cao Tần số lấy mẫu theo Nyquist Tần số lấy mẫu thấp Hình 2.2. Giới hạn tần số lấy mẫu Quá trình lấy mẫu được thực hiện ở một tần số ổn định, fS là tần số lấy mẫu. Theo lý thuyết lấy mẫu, tần số lấy mẫu phải cao, đủ để tạo được các thành phần tần số cần thiết cao nhất của sóng đầu vào. Theo tiêu chuẩn Nyquist thì tần số lấy mẫu
được xác định bởi:
fS ≥ 2 fMAX
Trong đó: fMAX là tần số cao nhất phải được tạo ra.
Việc lọc đầu vào được sử dụng để đảm bảo sẽ không có các thành phần tần số
khăn nên fS được thiết lập phần nào cao hơn tiêu chuẩn Nyquist. Lấy mẫu ở 2,2 đến 2,5fH là thông dụng nhất. Một vài hệ thống lấy mẫu với tần số cao hơn nhiều được gọi là lấy mẫu tần cao sẽ bàn đến trong phần 2.3.1 fs 2fs fs 2fs 2fs fs Dải tần cơ bản của video Chồng phổ Tần số lấy mẫu cao Tần số lấy mẫu thấp Tần số lấy mẫu theo Nyquist Hình 2.3. Phổ lấy mẫu
Ví dụ trên hình 2.2, trình bày quá trình lấy mẫu dưới, trên và tại tần số của tiêu chuẩn Nyquist. Nội dung của một chuỗi mẫu có thể được xác định bằng cách nối các đỉnh mẫu theo một đường thẳng. Hình 2.2 cũng chỉ ra rằng các mẫu tạo ra tần số
tín hiệu chính xác cho đến khi tần số tín hiệu vượt quá 1,5 tần số lấy mẫu. Ở điểm này, tần số đầu ra sẽ tạo nên sự khác nhau giữa tần số lấy mẫu và tần số tín hiệu.
Đây là một kết quả sai và ngoài mong muốn được gọi là hiện tượng chồng phổ. Mức
độ thiệt hại của nó phụ thuộc vào ứng dụng. Ví dụ trong các hệ thống audio, tần số
chồng phổ được coi như là những tần số không liên quan và vì vậy có thể loại bỏ. Còn đối với video, chồng phổ gây ra các hình trên ảnh được tạo có thể thiệt hại hoặc không.
Tiêu chuẩn Nyquist cũng có thểđược quan sát trên miền tần số. Một chuỗi các mẫu có thểđược coi như là một hàm xung định kỳở tần số lấy mẫu mà biên độ của nó được điều chế bởi các giá trị lấy mẫu. Phổ của một xung định kỳ bao gồm một thành phần tần số lấy mẫu cộng với các thành phần cân bằng biên độ ở tần số lặp lại và các sóng hài của nó. Mỗi một thành phần có dải band tần biểu thị sự điều chế
bằng các tần số tín hiệu biểu diễn trên hình 2.3 với ba điều kiện ứng với hình 2.2. Chồng phổ xảy ra khi dải band tần của thành phần tần số lấy mẫu chồng lên dải band tần của thành phần tần số lấy mẫu bằng 0. Nếu hiện tượng chồng xảy ra sẽ
không có cách nào để loại bỏ nó sau khi lấy mẫu, phải ngăn chặn ngay từ quá trình tiền lọc đầu vào. Từ hình vẽ ta nhận thấy, có thể xảy ra hiện tượng chồng lắp bất cứ
khi nào tần số tín hiệu tối đa cao hơn 1,5 lần tần số lấy mẫu, vì vậy đây chỉ là một cách biểu thị khác của tiêu chuẩn Nyquist.
Khi cần thiết phải xử lý các tần số tín hiệu ở gần giới hạn Nyquist, yêu cầu đặt ra cho bộ lọc đầu vào trở nên khó khăn. Như trên hình 2.3b, độ dốc của bộ lọc phải nhọn để tránh xảy ra hiện tượng méo tín hiệu cần thiết trong quá trình khử các tần số
gây chồng phổ.
2.2.1.1 Quá trình lấy mẫu trong mảng hai chiều
Sóng video analog thu được từ quá trình quét sẽ được lấy mẫu theo từng dòng quét. Quá trình lấy mẫu này trong bộ ADC biển diễn một mảng hai chiều (chi tiết dòng). Nó có thểđược quan sát trong giới hạn của ảnh như chỉ ra trong hình 2.4. Để
tránh nhiễu, tần số lấy mẫu thường được đồng bộ với tần số quét dòng. Nếu đây là một mối quan hệ có tính chính xác thì quá trình lấy mẫu sẽ xảy ra tại các điểm giống nhau trong mỗi dòng (còn gọi là lấy mẫu trực giao) như hình 2.4a.
Hình 2.4a minh họa quá trình lấy mẫu quincunx, quá trình này được thực hiện bằng cách lấy tần số lấy mẫu là một bội số lẽ của hai lần tần số quét dòng. Các ảnh trong quá trình lấy mẫu khác nhau có thể xảy ra với những mối quan hệ phức tạp hơn, và trên ảnh sẽ xuất hiện hiện tượng nhiễu nhiều hơn.
Trực giao quincunx
Hình 2.4. Mô hình lấy mẫu không gian
Quá trình lấy mẫu quincunx có nhiều ưu điểm do tạo ra độ phân giải cao ở mọi hướng, nhưng lại không được sử dụng nhiều bởi ví nó làm cho quá trình xử lý số
của các tín hiệu trở nên khó khăn hơn.
Hình 2.5 biểu diễn dạng của chồng phổ trên một đường chéo đen với nền màu trắng. Hình 2.5a biểu diễn một đường ảnh bị che bởi một hình lấy mẫu trực giao, và Hình 2.5b biểu diễn kết quả lấy mẫu khi đầu ra chỉ dựa vào màu sắc (đen hay trắng) tại thời điểm lấy mẫu. Đây là dòng nhọn quen thuộc thường xuất hiện trên màn hình máy tính khi hiển thị các dòng kề ngang, kề dọc hoặc các biên.
Hình 2.5. Hiện tượng chồng phổ
Hình 2.5c biểu diễn hiệu ứng của hiện tượng tránh chồng phổ, tại đó các giá trị
của đầu ra được dựa vào số lượng của các vùng lấy mẫu chứa dòng (một hình chữ
nhật biểu thị ở chu kỳ lấy mẫu sẽ cộng ra trong mỗi mảng và đưa về trung tâm của
điểm lấy mẫu). Nếu hình ảnh được quan sát từ khoảng cách xa thì người ta có thể
nhận thấy dòng được tránh chồng phổ dễ chịu hơn các các dòng nhọn.
Khi sử dụng một bộ lọc đặt trước bộ lấy mẫu, thì kết quả cho như hình 2.5c. Từ khi bộ lọc loại bỏ các thành phần tần số trên giới hạn Nyquist, thì các biên của dạng sóng tín hiệu sẽ bị dốc tại điểm thời gian tăng lên xấp xỉ bằng một chu kỳ lấy mẫu. Quá trình lấy mẫu tức thời của biên dốc này sẽ tựđộng tạo ra các biên độ trung gian chính xác cho các điểm ảnh tại các biên của ảnh.
2.2.1.3 Độ rộng lấy mẫu
Việc lấy trung bình giá trị các mẫu trên phần trăm có nghĩa của chu kỳ lấy mẫu