Lấy mẫu và lượng tử hóa tín hiệu Video

Một phần của tài liệu BÀI GIẢNG XỬ LÝ ÂM THANH VÀ HÌNH ẢNH docx (Trang 79 - 84)

Mầu Đỏ (R)

3.2.3.2. Lấy mẫu và lượng tử hóa tín hiệu Video

Trong những năm gần đây công nghệ phần cứng và những hoạt động chuẩn hóa đã phát triển tới mức có tính khả thi trong việc truyền tải, lưu trữ, xử lý, và xem những tín hiệu video được lưu ở dạng số, và trong việc chia sẻ tín hiệu video giữa các ứng dụng khác nhau. Đó là sự phát triển tự nhiên vì thay đổi tạm thời thường có liên quan đến chuyển động của vài kiểu là thuộc tính quan trọng nhất của một tín hiệu trực quan.

74

Theo lý thuyết, một tín hiệu video tương tựI(x, y, t) trong đó (x, y) là tọa độ không gian liên tục và t là thời gian liên tục thì liên tục trong cả hai chiều thời gian và không gian, vì thông lượng bức xạ vốn có ở độ cảm biến video là liên tục ở mức quan sát bình thường.

Video số là hiển thị của một hiện tượng tự nhiên trực quan (thế giới thực), được lấy mẫu theo không gian và thời gian. Một hiện tượng được lấy mẫu ở một điểm thời gian

để tạo ra khung (là hiển thị của hiện tượng trực quan một cách đầy đủ tại thời điểm đó) hoặc một trường (bao gồm các dãy các mẫu về không gian được đánh số chẵn lẻ). Lấy mẫu được lặp lại theo chu kì (ví dụ, chu kì 1/25 hoặc 1/30 giây) để tạo ra tín hiệu video

động. Có 3 bộ mẫu (các thành phần) được yêu cầu chủ yếu để hiển thị một hiện tượng theo màu sắc. Như vậy mỗi một mẫu không gian – thời gian (yếu tố hình ảnh hay pixel)

được hiển thị như là một số hay một bộ các số mô tảđộ chói và màu sắc của mẫu.

Hình 3.31: Lấy mẫu theo không gian và thời gian của một chuỗi video

Ly mu không gian

Đầu ra của một mảng CCD là một tín hiệu tương tự, một tín hiệu điện biến đổi hiển thị hình ảnh video. Lấy mẫu tín hiệu tại một thời điểm tạo ra một hình ảnh hay khung hình được lấy mẫu xác định giá trị trong tập các điểm lấy mẫu. Định dạng phổ

biển nhất cho một ảnh lấy mẫu là một hình chữ nhật với điểm lấy mẫu nằm trên một hình vuông hay lưới chữ nhật. Hình 3.32 chỉ ra một khung liên tục với 2 lưới lấy mẫu khác nhau được đặt chồng lên nhau. Việc lấy mẫu xảy ra tại một trong các điểm giao nhau trên lưới và hình ảnh được lấy mẫu có thể được tái tạo lại bởi việc hiển thị từng mẫu như là một yếu tố hình ảnh vuông (pixel).

75

Hình 3.32: Hình ảnh với 2 lưới lấy mẫu

Chất lượng hiển thị của hình ảnh bị ảnh hưởng bởi số lượng các điểm lấy mẫu. Lựa chọn một lưới lấy mẫu “thô” (lưới màu đen trong hình 3.32) tạo ra hình ảnh được lấy mẫu có độ phân giải thấp (hình 3.33) trong khi tăng số lượng điểm lấy mẫu (lưới màu xám, hình 3.34) tăng đáng kểđộ phân giải của hình ảnh được lấy mẫu.

76

Hình 3.34: Hình ảnh được lấy mẫu ởđộ phân giải tốt hơn (lưới lấy mẫu màu xám)

Ly mu thi gian

Một hình ảnh video chuyển động được chụp bởi việc chụp theo điểm chữ nhật của tín hiệu theo các chu kì thời gian. Chiếu lại một loạt các khung tạo ra sự chuyển động. Tốc độ lấy mẫu cao hơn (tốc độ khung) cho ta sự chuyển động mượt mà hơn trong cảnh video nhưng yêu cầu nhiều mẫu được chụp và lưu nhiều hơn. Tốc độ khung dưới 10 khung trên giây thường được sử dụng cho thông tin video tốc độ bit thấp (vì số lượng thông tin tương đối nhỏ) nhưng sự chuyển động thì khá giật và không tự nhiên ở tốc độ

này. Từ 10 đến 20 khung trên giây thì thông dụng hơn cho thông tin video tốc độ bit thấp; hình ảnh trơn tru hơn nhưng chuyển động bị giật có thể xảy ra trong các phần hình ảnh chuyển động nhanh. Lấy mẫu ở 25 đến 30 hình trên giây là chuẩn cho hình ảnh truyền hình (sựđan xen vào nhau để cải thiện hình ảnh chuyển động, xem bên dưới); 50 đến 60 khung trên giây sự chuyển động mượt mà (tuy nhiên chi phí cao cho tốc rất cao này).

Các dng ly mu YCbCr

Hình 3.35 thể hiện 3 cách lấy mẫu cho Y, Cb và Cr theo chuẩn MPEG-4 và H.264. Lấy mẫu 4:4:4 có nghĩa 3 thành phần (Y,Cb và Cr) là tương đương, và do đó mẫu của mỗi thành phần tồn tại tại mọi vị trí điểm ảnh.

Các tham số chỉ ra mối quan hệ tốc độ lấy mẫu của mỗi thành phần trong mặt phẳng nằm ngang, ví dụ lấy 4 mẫu độ chói có 4 mẫu Cb và 4 mẫu Cr. Lấy mẫu 4:4:4 đảm bảo tính trung thực của mỗi thành phần. Với lấy mẫu 4:2:2 ( đôi khi được gọi là YUY2) các thành phần có cùng tỉ lệ theo phương thẳng đứng tuy nhiên có một nửa tỉ lệ theo phương nằm ngang, ví dụ lấy 4 mẫu độ chói có 2 mẫu Cb và 2 mẫu Cr.

77

Với định dạng 4:2:0 phổ biến (YV12), Cb và Cr mỗi thành phần có giá trị bằng một nửa tỉ lệ theo chiều ngang và theo chiều dọc của Y. Do mỗi thành phần màu sắc riêng biệt bao gồm một phần tư số lượng mẫu trong thành phần Y, 4:2:0 video yêu cầu chính xác một nửa số lượng mẫu của 4:4:4 video.

Ví dụ với 1 ảnh 720 x 576 pixels.

Độ phân giải Y 720 x 576 mẫu, mỗi mẫu được thể hiện với 8 bits. 4:4:4: Độ phân giải Cb, Cr : 720 x 576 mẫu, mỗi mẫu 8 bits.

Tổng số bits : 720 x 576 x 8 x 3 = 9953280 bits.

4:2:0: Độ phân giải Cb, Cr : 360 x 288 mẫu, mỗi mẫu 8 bits.

Tổng số bits : (720 × 576 × 8) + (360 × 288 × 8 × 2) = 4976640bits. 4:2:0: video yêu cầu chính xác một nửa số lượng mẫu của 4:4:4 video.

78

Mẫu 4:2:0 đôi khi được gọi là 12 bits trên một điểm ảnh. Với một nhóm bao gồm 4 điểm ảnh, sử dụng mẫu 4:4:4 có tổng cộng 12 mẫu, 4 cho mỗi tham số Y, Cb, Cr, yêu cầu tổng cộng 12 x 8 = 96 bits, trung bình 96 / 4 = 24 bits/ 1 điểm ảnh. Với mẫu 4:2:0 chỉ

sử dụng 6 mẫu trong đó 4 cho Y và 1 cho mỗi Cb và Cr, yêu cầu tổng cộng 6 x 8 = 48 bits, trung bình 48 / 4 = 12 bits/ điểm ảnh.

Tiếp theo lấy mẫu là quá trình lượng tử hóa. Sự lượng tử hóa là quá trình chuyển một ảnh có giá trị liên tục, có một khoảng liên tục (tập các giá trị nó có thể nhận) thành

ảnh có giá trị rời rạc, có một khoảng rời rạc. Việc này thường được thực hiện bởi quy trình cắt tròn, cắt xén hoặc một vài quá trình không tuyến tính, không thể đảo ngược của sự phá hủy thông tin. Lượng tử hóa là tiền thân của việc xử lý số vì các cường độ ảnh phải được biểu diễn với giới hạn chính xác (được giới hạn bởi độ dài của từ) trong bất kỳ

bộ xử lý số nào.

Không giống như việc lấy mẫu, sự lượng tử hóa rất khó phân tích vì nó không tuyến tính. Hơn nữa hầu hết các phương pháp mang tính lý thuyết của việc xử lý số đều giả thiết rằng các tín hiệu nghiên cứu không được lượng tử hóa, vì điều này dường như sẽ

làm phức tạp sự phân tích. Trái lại, lượng tử hóa là một phần thiết yếu của bất kỳ phép toán nén tín hiệu nào, ở đó mục tiêu có thểđược xem như việc tìm một chiến lược lượng tử hóa tối ưu mà cùng một lúc giảm lượng dữ liệu có trong tín hiệu trong khi gần như giữ

nguyên độ trung thực của tín hiệu.

Một phần của tài liệu BÀI GIẢNG XỬ LÝ ÂM THANH VÀ HÌNH ẢNH docx (Trang 79 - 84)

Tải bản đầy đủ (PDF)

(151 trang)