1. Trang chủ
  2. » Công Nghệ Thông Tin

Bước đột phá trong kỹ thuật nén hình ảnh

4 397 2
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 4
Dung lượng 48 KB

Nội dung

MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh Theo AG Tổng hợp 12:56 - Thứ sáu, 05/01/2007 Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của internet, thì việc tìm ra một phương pháp nén ảnh nhằm giảm bớt không gian lưu trữ thông tin và truyền thông trên mạng là yêu cầu cấp thiết. Các kỹ thuật nén Video đều cố gắng giảm lượng thông tin cần thiết cho một chuỗi các bức ảnh, mà không làm giảm chất lượng ảnh. Mục đích của nén video là giảm bớt số bít khi lưu trữ và truyền bằng cách loại bỏ lượng thông tin dư thừa trong từng frame và dùng kỹ thuật mã hoá để tối thiểu hoá lượng thông tin quan trọng cần lưu giữ. Công nghệ nén hình phổ biến hiện nay Với một thiết bị lưu hình kỹ thuật số thông thường, ảnh sau khi được số hoá sẽ được nén lại. Quá trình nén sẽ xử lý các dữ liệu trong ảnh để đưa hình ảnh vào một không gian hẹp hơn như trong thiết bị nhớ kỹ thuật số hoặc qua đường dây điện thoại, Với thị trường lưu hình kỹ thuật số hiện nay, các chuẩn nén phổ biến là Motion JPEG (MJPEG), Wavelet, H.261/ H.263/ H.263+/ H.263++ và MPGE1/ MPGE2/ MPGE4. Nhìn chung, có hai nhóm tiêu chuẩn chủ yếu: nhóm một gồm định dạng nén MJPEG và Wavelet; và nhóm hai gồm các định dạng chuẩn còn lại. Sơ lược nguyên tắc nén ảnh áp dụng ở MJPEG và Wavelet Tính chất chung của các ảnh số là tương quan giữa các pixel ở cạnh nhau lớn, điều này dẫn tới dư thừa thông tin để biểu diễn ảnh. Việc dư thừa thông tin dẫn tới việc mã hoá không tối ưu. Do vậy, ta cần tìm phương án biểu diễn ảnh với tương quan nhỏ nhất, để giảm thiểu độ dư thừa thông tin của ảnh. Có 2 kiểu dư thừa thông tin như sau: - Dư thừa trong miền không gian: là tương quan giữa không gian pixel của ảnh (các pixel lân cận của ảnh có giá trị gần giống nhau, trừ những pixel ở giáp đường biên ảnh) - Dư thừa trong miền tần số: là tương quan giữa những dải màu hoặc các dải phổ khác nhau. Trọng tâm của các nghiên cứu về nén ảnh là giảm bớt một số bit để biểu diễn ảnh bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng nhiều càng tốt. Các chuẩn nén MJPEG và Wavelet đều tuân theo nguyên tắc tìm ra các phần tử dư thừa miền không gian (mỗi Frame nén tự động). Trong khi đó, đặc trưng của các chuẩn nén thuộc nhóm 2 là loại bỏ dư thừa ở cả miền không gian và miền tần số của ảnh. MJPEG là định dạng nén ảnh lâu đời nhất và đã được dùng phổ biến. Khi dùng chuẩn nén MJPEG, ảnh được phân chia thành các khối vuông ảnh, mỗi khối vuông có kích thước 8 x 8 pixel và biểu diễn mức sám của 64 điểm ảnh. Mã hoá biến đổi cosin rời rạc DCT (Discrete Cosin Tranform) trong chuẩn nén này khai thác sự tương đồng giữa các pixel trong mỗi khối, để lấy ra các biểu diễn ảnh với tương quan nhỏ. Chuỗi biểu diễn sẽ bị rút ngắn, tuỳ theo mức nén của hệ thống hiện hành với qui trình rút ngắn chuỗi biểu diễn. Vì vậy, hình ảnh sau khi giải nén thường có nhiều sai lệch so với ảnh gốc. ở chuẩn nén Wavelet, thay vì mã hoá theo từng khối 8 x 8, việc thực hiện trên toàn bộ bề mặt ảnh, một loạt các bộ phận lọc ở khâu chuyển đổi sẽ phân tích các dữ kiện về từng điểm ảnh và cho ra một tập các hệ số. Do chuẩn Wavelet có tác dụng với toàn bộ bề mặt ảnh, nên các sai lệch ở ảnh giải nén sẽ khác với MJPEG. Hiệu ứng ghép mảnh không xảy đến với ảnh được quan sát, nhưng độ phân giải hình ảnh giảm cũng như một vài vết mờ sẽ xuất hiện. Các định dạng Wavelet và MJPEG đều gây ra hiện tượng mất thông tin ở ảnh giải nén. Sự dư thừa khả năng lưu ảnh ở mắt người cảm thụ khi dùng chuẩn nén Wavelet ít hơn MJPEG 30%. Sơ lược về chuẩn mã hoá H.26x và MPEGx MPEG không phải là một công cụ nén đơn lẻ, mà ưu điểm của ảnh nén dùng MPEG là ở chỗ MPEG có một tập hợp các công cụ mã hoá chuẩn, chúng có thể kết hợp với nhau một cách linh động để phục vụ cho một loạt các ứng dụng khác nhau. Nguyên lý chung của nén tín hiệu video là loại bỏ sự dư thừa về không gian (spatial redunancy) và sự dư thừa về thời gian (temporal redunancy). Trong MPEG, việc loại bỏ sự dư thừa về thời gian (nén liên ảnh), được thực hiện trước hết nhờ sử dụng tính chất giữa các ảnh liên tiếp. Chúng ta dùng tính chất này để tạo ra các bức ảnh mới nhờ vào thông tin từ những bức ảnh gửi trước đó. Do vậy ở phía bộ mã hoá ta chỉ cần giữ lại những ảnh có sự thay đổi so với ảnh trước, sau đó ta dùng phương pháp nén về không gian trong những bức ảnh sai khác này. Nói một cách cụ thể, nguyên lý chung của các chuẩn nén là phỏng đoán trước chuyển động của các frame ở bộ mã hoá. Mỗi frame ở tại một thời điểm nhất định sẽ có nhiều khả năng giống với các frame đứng ngay trước và sau đó. Các bộ mã hoá sẽ tiến hành quét lần lượt những phần nhỏ trong mỗi frame (marco blocks) và phát hiện ra marco block nào không thay đổi từ frame này tới frame khác. Phía bên thu, tức bộ giải mã đã lưu trữ sẵn những thông tin không thay đổi từ frame này tới frame khác, chúng được dùng để điền thêm vào vị trí trống trong ảnh được khôi phục. Tuy nhiên, do sự tương đồng giữa các frame là rất lớn, nên sự phát hiện ra các sai lệch là rất khó. Do vậy ảnh khôi phục khó đạt được như ảnh gốc. Điều này đồng nghĩa với việc chất lượng ảnh cũng tương tự như khi dùng chuẩn Wavelet và MJPEG, nhưng dung lượng kênh truyền và không gian lưu trữ của các chuẩn nén H.26x và MPEGx là nhỏ hơn (ví dụ như không gian lưu trữ của chuẩn H.263 nhỏ hơn Motion JPEG từ 3 tới 5 lần). Sự khác biệt giữa các chuẩn nén này (như ở H.26x và MPEGx) chủ yếu nằm ở khâu tiên đoán các frame mới và cách thức tính toán sai lệch giữa các frame hiện tại và frame phỏng đoán. Chuẩn nén H.26x (gồm các thế hệ H.261, H.262 và H.263 .), thường có tốc độ mã hoá tín hiệu thấp hơn MPEGx (khoảng 1.5 Mbit/s với độ phân giải hình 352 x 288) do dùng chủ yếu trong viễn thông. Trong khi đó, chuẩn MPEG2 dùng cho thị trường giải trí có độ phân giải hình cao hơn, và mang lại chất lượng hình ảnh tốt (cao hơn 1,5Mb/s với độ phân giải 352x288 hoặc 6Mb/s cho phân giải hoàn chỉnh). Sơ lược định dạng nén ảnh MPEG4 So với các chuẩn nén đã nêu ở trên, chuẩn MPEG4 là định dạng nén hình ảnh tiên tiến nhất, đáp ứng những đòi hỏi về kỹ thuật cũng như phù hợp với nhiều loại thị trường. Với nỗ lực không ngừng để đưa ra thị trường sản phẩm ưu việt nhất của ngành công nghiệp . Máy ghi hình kỹ thuật số chuẩn MPEG4 với bản chất là một thiết bị thu hình kỹ thuật số có hiệu suất cao, được chọn để đáp ứng nhu cầu cấp thiết của thị trường về một định dạng nén ảnh hoàn hảo với tính năng nổi trội là, có thể thu được hệ thống lớn các nguồn hình ảnh. MPEG4 thực sự là một dạng nén ảnh mang tính đột phá của công nghệ nén hình đương đại, thể hiện rõ nét ở những tiêu chuẩn sau: - áp dụng những tiêu chuẩn có tính mở cao với sự hỗ trợ đắc lực từ ngành công nghiệp an ninh và công nghiệp máy tính. - Hiệu suất lớn. - Khả năng truyền theo dòng và mạng lưới. - Tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực của ảnh. Định dạng nén ảnh MPEG4 Chuẩn MPEG4 cung cấp các phân bộ trong kết cấu logic và năng lực giải mã từng dòng bits riêng rẽ. Một profile là một phân bộ xác định trên toàn bit stream (điều chỉnh bitstream và bộ phân giải màu) một level sẽ xác định một số tiêu chí bắt buộc cho tham số của bức ảnh (kích thước ảnh, số lượng bit ). Những chuẩn nén MPEG4 có profile dạng đơn giản chiếm lĩnh đa phần thị trường. MPEG4 mà Daicat tư vấn đã được phát triển và hoàn thiện trở thành định dạng nén hình tiên tiến, hoàn hảo, với tiêu chí tập trung phát triển những nhân tố giúp tăng cường chất lượng hình ảnh, cũng như phục vụ đắc lực cho các thiết bị giám sát có các frame dạng chữ nhật. Mỗi bitstream hiển thị trong định dạng nén MPEG4 cung cấp một mô tả mang tính phân tầng về hình ảnh hiển thị. Từng lớp dữ liệu được đưa vào bit stream bởi những mật mã đặc biệt gọi là mật mã khởi nguồn. Mỗi vật thể ảnh có thể được mã hoá dưới dạng đa lớp (scalable) hoặc đơn lớp (non scalable) VOL (video object layer) sẽ hỗ trợ quá trình mã hoá đa lớp. Một vật thể ảnh được mã hoá dưới dạng đa lớp không gian hoặc đa lớp thời gian, đi từ phân giải thô tới phân giải tinh. Bộ phận giải mã có thể đạt được độ phân giải hình mong muốn, tuỳ theo những thông số như giải thông tần hiện có, hiệu su t máy và theo mong muốn của người dùng. Có hai loại VOL, loại thứ nhất mang đầy đủ chức năng của định dạng nén MPEG4, loại còn lại với những chức năng được giảm bớt (VOL với header dạng ngăn). Loại VOL này giúp bitstream tương thích với đường biên ở H.263. VOP (video object plane)- ảnh đựoc mã hoá độc lập hoặc mã hoá trên cơ sở tham khảo các ảnh khác qua khâu bù chuyển động ở bộ giải mã. Mỗi frame ảnh thông thường có thể được biểu diễn bởi một VOP dạng chữ nhật. Với chuẩn nén MPEG4, có 3 kiểu khác nhau để mã hoá cho khối ảnh. 1 . VOP được mã hoá độc lập. Trong trường hợp này VOP được mã hoá gọi là Intra VOP (I-VOP). 2. VOP được tiên đoán qua kỹ thuật bù chuyển động nhờ một VOP khác đã được tiên đoán trước đó. Đó là loại P-VOP (Predicted VOP). 3. VOP được tiên đoán dựa trên các VOP trước và sau nó thuộc dạng B-VOP ( Bi - directiional Interpolated VOP). B-VOP được thêm vào dựa trên I-VOP và P-VOP. Ngoài việc có thể nâng cao chất lượng hình ảnh khi dùng, một ưu điểm khác của B-VOP là dùng kỹ thuật đa lớp thời gian. Với kỹ thuật này, Frame dữ liệu hiển thị được tăng cường. Những lớp tăng cường đưa thông tin vào giữa các lớp frame. Định dạng nén ảnh MPEG4 hỗ trợ quá trình lượng tử hoá, do vậy cũng giúp đáp ứng những đòi hỏi khác nhau về tốc độ bít. Lượng tử hoá đã có ở các chuẩn nén như H263 và MPEG1, MPEG2. Bộ phận mã hoá ở định dạng nén mà Daicat tư vấn tương thích với những bộ mã hóa trước đây trong các chuẩn nén . MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh Theo AG Tổng hợp 12:56 - Thứ sáu, 05/01/2007 Cùng với sự phát triển mạnh mẽ của máy. thông thường, ảnh sau khi được số hoá sẽ được nén lại. Quá trình nén sẽ xử lý các dữ liệu trong ảnh để đưa hình ảnh vào một không gian hẹp hơn như trong thiết

Ngày đăng: 19/10/2013, 15:15

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w