Đồ án xử lý ảnh: CÁC CHUẨN BIỂU DIỄN VÀ NÉN ẢNH,CHUẨN NÉN JPEG,CHUẨN NÉN JPEG2000,CHUẨN NÉN FAX

TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CÔNG NGHIỆP KHOA CÔNG NGHỆ THÔNG TIN TRUYỀN THÔNG ĐA PHƯƠNG TIỆN Đề tài:CÁC CHUẨN BIỂU DIỄN VÀ NÉN ẢNH : CHUẨN NÉN JPEG CHUẨN NÉN JPEG2000 CHUẨN NÉN FAX Giáo viên hướng dẫn:TRẦN THỊ BÍCH THẢO Sinh viên thực hiện:Nhóm 14 1.Vũ Đức Chiến 2.Phạm Vĩnh Lộc 3. Phạm Văn Cương A. MỞ ĐẦU. Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việc tìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyền thông tin trên mạng nhanh chóng đang là một yêu cầu cần thiết. Trong những năm gần đây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực hiện nén ảnh. Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với dung lượng ít nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực của ảnh. Và JPEG là một trong những phương pháp nén ảnh khá hiệu quả. B. NỘI DUNG. I. CÔNG NGHỆ JPEG. 1. JPEG là gì? JPEG viết tắt của Joint Photographic Experts Group, một nhóm các nhà nghiên cứu đã phát minh ra định dạng này để hiển thị các hình ảnh đầy đủ màu hơn (fullcolour) cho định dạng di động mà kích thước file lại nhỏ hơn. Đây là một phương pháp nén ảnh hiệu quả, nó cho phép làm việc với các ảnh có nhiều màu và kích cỡ lớn, tỷ lệ nén ảnh đạt mức so sánh tới vài chục lần (chứ không phải phần trăm). 2. Phương pháp nén ảnh JPEG. 2.1. Khái quát về phương pháp nén ảnh tĩnh Có nhiều cách để nén ảnh, nhưng dựa vào yếu tố bảo toàn thông tin có thể phân chia thành 2 phương pháp nén ảnh tĩnh, đó là: Nén không mất mát thông tin: sử dụng các phương pháp mã hóa dữ liệu Nén có mất mát thông tin: Phương pháp nén dựa trên phép biến đổi ảnh Quá trình nén ảnh được mô tả theo sơ đồ:

Trang 1

TRƯỜNG ĐẠI HỌC KINH TẾ - KỸ THUẬT CÔNG NGHIỆP

KHOA CÔNG NGHỆ THÔNG TIN

TRUYỀN THÔNG ĐA PHƯƠNG TIỆN

Đề tài: CÁC CHUẨN BIỂU DIỄN VÀ NÉN ẢNH :

- CHUẨN NÉN JPEG

- CHUẨN NÉN JPEG2000

- CHUẨN NÉN FAX

Giáo viên hướng dẫn: TRẦN THỊ BÍCH THẢO

Sinh viên thực hiện: Nhóm 14

1 Vũ Đức Chiến

2 Phạm Vĩnh Lộc

3 Phạm Văn Cương

Trang 2

A MỞ ĐẦU

Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việc tìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyền thông tin trên mạng nhanh chóng đang là một yêu cầu cần thiết Trong những năm gần đây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực hiện nén ảnh Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với dung lượng ít nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực của ảnh Và JPEG là một trong những phương pháp nén ảnh khá hiệu quả

B NỘI DUNG.

I CÔNG NGHỆ JPEG.

1 JPEG là gì?

JPEG viết tắt của Joint Photographic Experts Group, một nhóm các nhà nghiên

cứu đã phát minh ra định dạng này để hiển thị các hình ảnh đầy đủ màu hơn (full-colour) cho định dạng di động mà kích thước file lại nhỏ hơn Đây là một phương pháp nén ảnh hiệu quả, nó cho phép làm việc với các ảnh có nhiều màu và kích cỡ lớn, tỷ lệ nén ảnh đạt mức so sánh tới vài chục lần (chứ không phải phần trăm)

2 Phương pháp nén ảnh JPEG.

2.1 Khái quát về phương pháp nén ảnh tĩnh

Có nhiều cách để nén ảnh, nhưng dựa vào yếu tố bảo toàn thông tin có thể phân chia thành 2 phương pháp nén ảnh tĩnh, đó là:

- Nén không mất mát thông tin: sử dụng các phương pháp mã hóa dữ liệu

- Nén có mất mát thông tin: Phương pháp nén dựa trên phép biến đổi ảnh

Quá trình nén ảnh được mô tả theo sơ đồ:

Trang 3

Các phương pháp mã hóa dữ liệu có thể kể đến:

- Mã hang loạt(RLE): Dùng số đếm để thay thế các đặc diểm giống nhau lặp lại.

- Mã Shannon-Fano: Dùng các cụm bít có độ dài thay đổi để mã hóa

- Mã Huffman: Sử dụng các đặc điểm mã hóa của Shannon-Fano với ý tưởng:

Kí hiệu có khả năng xuất hiện nhiều có từ mã ngắn

- Mã Lemple- Ziv: Dựa trên việc xây dựng và tra từ điển

- Mã dự đoán: Dựa trên quá trình tạo điểm tuần tự và luật dự đoán.

Các phép biến đổi áp dụng trong nén ảnh bao gồm:

- Phép biến đổi Cosin rời rạc(DCT): Biểu diễn các giá trị điểm ảnh trên miền

tần số, tập trung năng lượng vào một số hệ số DCT sử dụng trong các chuẩn JPEG và MPEG

- Phép biến đổi Wavelet rời rạc(DWT): sử dụng các bộ lọc thông dải xử lý phân

tích đa phân trong phép DWT

- Phép biến đổi Fractal: Sử dụng các phép biến đổi hình học.

Nén ảnh tĩnh dựa trên phép biến đổi ảnh được mô tả trong sơ đồ:

Trang 4

2.2 Phương pháp nén ảnh theo chuẩn JPEG

a Phép biến đổi DCT (Discrete Cosin Transform)

Như chúng ta đã nói ở trên, phép biến đổi DCT được sử dụng trong phương pháp nén ảnh theo chuẩn JPEG Vì vậy trước khi đi vào tìm hiểu về phương pháp nén ảnh JPEG chúng ta cùng khái quát sơ qua về phép biến đổi DCT

b Phương pháp nén ảnh theo chuẩn JPEG

Trang 5

Phương pháp nén ảnh theo thuẩn JPEG có thể cho hệ số nén tới 80:1 hay lớn hơn, nhưng bạn phải chịu mất thông tin (ảnh sau khi bung nén khác với ảnh ban đầu), lượng thông tin mất mát tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này không bị làm một cách cẩu thả JPEG tiến hành sửa đổi thông tin ảnh khi nén sao cho ảnh mới gần giống như ảnh cũ, khiến phần đông mọi người không nhận thấy sự khác biệt Và bạn hoàn toàn có thể quản lý sự mất mát này bằng cách hạn chế hệ số nén Như thế người dùng có thể cân nhắc giữa cái lợi của việc tiết kiệm bộ nhớ và mức độ mất thông tin của ảnh, để chọn phương án thích hợp

Phương pháp nén ảnh JPEG dựa trên nguyên lý sau: ảnh màu trong không gian của 3 màu RGB (red Green Blue) được biến đổi về hệ YUV (hay YCBCr) (điều này không phải là nhất thiết, nhưng nếu thực hiện thì cho kết quả nén cao hơn) theo công thức :

YUV = 0.615R − 0.515G − 0.100B

Y= 0.299R + 0.587G + 0.114B

U= 0.492(B − Y)= = − 0.147R − 0.289G + 0.436B

V= 0.877(R − Y)

Hệ YUV là kết quả nghiên cứu của các nhà sản xuất vô tuyến truyền hình hệ Pal, Secam

và NTSC, nhận thấy tín hiệu video có thể phân ra 3 thành phần Y, U, V (cũng như phân theo màu chuẩn đỏ, xanh lá cây và xanh da trời) Và một điều thú vị là hệ nhãn thị của

Trang 6

con người rất nhạy cảm với thành phần Y và kém nhạy cảm với hai loại U và V Phương pháp JPEG đã nắm bắt phát hiện này để tách những thông tin thừa của ảnh Hệ thống nén thành phần Y của ảnh với mức độ ít hơn so với U, V, bởi người ta ít nhận thấy sự thay đổi của U và V so với Y

Giai đoạn tiếp theo là biến đổi những vùng thể hiện dùng biến đổi cosin rời rạc (thông thường là những vùng 8x8 pixel) Khi đó thông tin về 64 pixel ban đầu sẽ biến đổi thành ma trận có 64 hệ số thể hiện "thực trạng" các pixel Điều quan trọng là ở đây

hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khả năng đó giảm rất nhanh với các hệ số khác Nói cách khác thì lượng thông tin của 64 pixel tập trung chủ yếu ở một số hệ số ma trận theo biến đổi trên Trong giai đoạn này có sự mất mát thông tin, bởi không có biến đổi ngược chính xác Nhưng lượng thông tin bị mất này chưa đáng kể

so với giai đoạn tiếp theo Ma trận nhận được sau biến đổi cosin rời rạc được lược bớt sự khác nhau giữa các hệ số Đây chính là lúc mất nhiều thông tin vì người ta sẽ vứt bỏ những thay đổi nhỏ của các hệ số Như thế khi bung ảnh đã nén bạn sẽ có được những tham số khác của các pixel Các biến đổi trên áp dụng cho thành phần U và V của ảnh với mực độ cao hơn so với Y (mất nhiều thông tin của U và V hơn) Sau đó thì áp dụng phương pháp mã hóa của Hoffman: Phân tích dãy số, các phần tử lặp lại nhiều được mã hóa bằng ký hiệu ngắn (marker)

(1) (2)

Khi bung ảnh người ta chỉ việc làm lại các bước trên theo quá trình ngược lại cùng với các biến đổi ngược

Trang 7

Vì phương pháp này thực hiện với các vùng ảnh (thông thường là 8 x 8 pixel) nên hay xuất hiện sự mất mát thông tin trên vùng biên của các vùng (block) này Hiện nay người ta đã giải quyết vấn đề này bằng cách làm trơn ảnh sau khi bung nén để che lấp sự khác biệt của biên giới giữa các block Một hệ nén ảnh theo chuẩn JPEG cùng algorithm làm trơn ảnh đã được công ty ASDG đưa ra trong hệ Art Department Professional

2.3 Ưu nhược điểm của phương pháp nén ảnh JPEG.

a Ưu điểm:

JPEG cho phép nén ảnh với tỉ số nén lên đến 80:1 hoặc cao hơn, hiển thị các hình ảnh đầy đủ màu hơn (full-colour) cho định dạng di động mà kích thước file lại nhỏ hơn JPEG cũng được sử dụng rất nhiều trên Web Lợi ích chính của chúng là chúng có thể hiển thị các hình ảnh với màu chính xác true-colour (chúng có thể lên đến 16 triệu màu), điều đó cho phép chúng được sử dụng tốt nhất cho các hình ảnh chụp và hình ảnh minh họa có số lượng màu lớn

b Nhược điểm

Trang 8

Nhược điểm chính của định dạng JPEG là chúng được nén bằng thuật toán lossy

(mất dữ liệu) Điều này có nghĩa rằng hình ảnh của bạn sẽ bị mất một số chi tiết khi

chuyển sang định dạng JPEG Đường bao giữa các khối màu có thể xuất hiện nhiều điểm mờ, và các vùng sẽ mất sự rõ nét, tỉ số nén càng cao thì sự mất mát thông tin trên ảnh JPEG càng lớn Nói một cách khác, định dạng JPEG thực hiện bảo quản tất cả thông tin màu trong hình ảnh đó, tuy nhiên với các hình ảnh chất lượng màu cao high-colour như hình ảnh chụp thì điều này sẽ không hề hấn gì

Các ảnh JPEG không thể làm trong suốt hoặc chuyển động - trong trườn hợp này bạn sẽ sử dụng định dạng GIF (hoặc định dạng PNG để tạo trong suốt)

II JPEG 2000

Như đã trình bày, kỹ thuật nén JPEG sẽ làm mất thông tin lúc giải nén, càng nén với hệ

số cao thì thông tin càng mất nhiều khi bung Vì vậy để giải quyết vấn đề này, tháng 12/1999 một bản phác thảo tiêu chuẩn nén hình ảnh theo công nghệ mới JPEG2000 Tháng 8/2000, bản phác thảo về tiêu chuẩn JPEG2000 đã được lưu hành trong giới chuyên gia hình ảnh Sau đó nó đã được công nhận là tiêu chuẩn quốc tế vào tháng 12/2000 và được ISO hợp thức hóa năm nay để cho phép ứng dụng vào các hệ xử lý, phân phối

Với JPEG2000 kỹ thuật xử lý hình ảnh sẽ đạt được những kết quả rất ngoạn mục vì có thể nén nhỏ từ 100-200 lần mà hình ảnh không sai sót bao nhiêu so với hình ảnh gốc Nhưng đâu là điểm khác biệt để kỹ thuật JPEG2000 vượt trội hơn hẳn so với JPEG?

JPEG2000 là hệ thống mã hóa hình ảnh mà kỹ thuật nén dựa trên kỹ thuật sóng ngắn Là một tiện ích toán học cho phép mô tả bằng một công thức đơn giản những gì xảy ra tại một thời điểm chính xác của tín hiệu Với một chuỗi sóng ngắn, chỉ cần biểu diễn bằng vài công thức, đường biểu diễn không đều mà không cần phải mô tả đặc tính của từng điểm một Và lẽ dĩ nhiên sẽ rất đắc lực khi phân tích tỉ mỉ một file ảnh kỹ thuật số

Thuật toán trong kỹ thuật JPEG2000 là chọn một số nhỏ các sóng ngắn, các sóng này được lập lại ở những nơi khác nhau, tỷ lệ khác nhau đã mô tả chính xác tín hiệu của hình ảnh File ảnh nén không chứa nhiều hơn số lượng chỉ vị trí và giãn nở của từng sóng ngắn Và kỹ thuật mã hóa theo từng khối, theo từng khu vực ưu tiên của hình ảnh (ROI -Regional Of Interest) được áp dụng cũng là một tiến bộ đáng kể trong thuật toán mã hóa JPEG2000

Trang 9

Các điểm chú ý trong JPEG2000

3.1-Sự thay đổi các thành phần màu

Ban đầu hình ảnh phải được chuyển đổi từ không gian màu RGB sang không gian màu khác, dẫn đến sự tách biệt của 3 thành phần màu này.Có 2 sự lựa chọn:

a.Không thể đảo màu(Irreversible Color Transform -ICT): sử dụng không gian màu YC

B C R

b.Có thể đảo màu(Reversible Color Transform-RCT):sử dụng không gian màu YUV

đã sửa đổi mà không thực hiện các lỗi lượng tử cho nên nó có thể đảo màu Thực hiện đúng các yêu cầu RCT tức là số được làm tròn theo quy định mà không thể được thể hiện chính xác dưới dạng ma trận Quá trình chuyển đổi là:

Trang 10

3.2-Lát(Tiling)

Sauk hi chuyển đổi màu sắc,bức ảnh được phân chia-gọi là các lát,các vùng vuông của ảnh đó được chuyển đổi và mã hóa riêng biệt nhau.Lát có nhiều kích cỡ, và nó có thể coi các lát của ảnh như 1 lát duy nhất.Khi kích thước được chọn, tất cả các lát sẽ có cùng kích thước(ngoại trừ những lát bên phải và phía dưới đường bao).Việc chia hình ảnh thành nhìu lát là có lợi,các bộ giải mã cần ít bộ nhở hơn để giải mã bức ảnh và nó có thể lựa chọn chỉ giải mã lát được chọn để giải mã 1 phần của bức ảnh.Bất lợi của phương pháp này là chất lượng hình ảnh giảm thấp hơn tín hiệu tốt nhất đến tỷ số truyền( peak signal to noise ratio) Sử dụng nhiều lát có thể tạo khối ảnh hưởng giống chuẩn JPEG 1992

3.3-Hàm biến thiên chuyển đổi(Wavelet Trasform)

Những lát này sau đó được biến đổi đến độ sâu tùy ý,trái với JPEG 1992-sử dụng biến đổi cosin vùng ảnh kích thước 8x8 :JPEG 2000 sử dụng 2 biến đổi wavelet

1.Không thể đảo ngược: nó được gọi là không thể đảo bởi nó sử dụng kĩ thuật lượng tử hóa phụ thuộc vào độ chính xác của bộ giải mã

2.Đảo ngươc:Nó chỉ sử dụng hệ số nguyên,cho nên đầu ra không yêu cầu làm tròn số(lượng tử) và vì vậy nó không thực hiện bất kì sai số lượng tử nào.Nó được sử dụng trong mã hóa không mất mát thông tin

3.4-Lượng tử hóa(Quantization )

Sau khi biến đổi wavelet transform,các hệ số là vô hướng-đã được lượng tử hóa để giảm

số lượng các bit ,tại các điểm tổn hao của mất mát lượng tử.Đầu ra là 1 tập hợp các số nguyên phải được mã hóa bit-by-bit.Các tham số có thể được thay đổi để đạt chất lượng cuối cùng là bước lượng tử hóa:các bước quan trọng hơn là bước nén và sự mất mát thông tin lượng tử.Với 1 bước lượng tử bằng 1,không có quá trình lượng tử nào được thực hiện(nó được gọi là nén không mất mát)

Trang 11

3.5-Siêu dữ liệu(Metadata)

Đối với JPEG truyền thống, bổ sung các siêu dữ liệu: lưu trữ các thông tin về bức

ảnh( kích cỡ,độ sâu màu,độ phân giải, ngày tạo bức ảnh…)

3.6- Motion JPEG 2000

Motion JPEG quy định việc sử dụng định dạng JPEG 2000 cho các trình tự tính thời gian của hình ảnh (tự động), có thể kết hợp với âm thanh, và tạo ra cách trình bày tổng

thể Tên file mở rộng cho các tệp video Motion JPEG 2000 là mj2 mjp2 Motion JPEG

2000 (thường được biết đến như MJ2 hoặc MJP2) cũng đang được xem xét như là một định dạng lưu trữ kỹ thuật số của Library of Congress Nó là một tiêu chuẩn quốc tế mở

và cập nhật những thuận lợi cho MJPEG (hoặc MJ), được dựa trên những thành tựu của định dạng JPEG Không giống như các định dạng video phổ biến, chẳng hạn như

MPEG-4 Part 2, WMV, và H.264 thì MJ2 không sử dụng các khung nội suy (inter-frame) Thay vào đó, mỗi frame là một thực thể độc lập được mã hóa bởi một biến thể hoặc mất dữ liệu hay không giảm chất lượng của JPEG 2000 Nó là 1 cấu trúc vật lý không phụ thuộc vào time ordering,nhưng nó sử dung những profile riêng biệt để bổ sung dữ liệu Đối với âm thanh, nó hỗ trợ LPCM mã hóa, cũng như biến thể khác của MPEG-4 , như là dữ liệu thô "hoặc bổ sung dữ liệu"

3.7-JPEG2000 Security–JPSEC

Vấn đề an ninh,bản quyền trong sao chép,truyền thông ảnh được xử lý trong JPSEC:Mật mã,nguồn chứng thực,toàn vẹn dữ liệu,điều kiện truy cập,bảo vệ quyền sở hữu

3.8-JPEG2000 Wireless-JPWL

Cải tiến JPEG2000 cho phù hợp với các ứng dụng đa phương tiện không dây

3.9-JPXML

Hình ảnh được nhúng vào XML sử dụng ngôn ngữ đánh dấu (Geography Markup

Language-GML)

3.10-JP3D

Đây là phần mở rộng cho hình ảnh không gian 3 chiều(thể tích hình ảnh)

Định dạng
Số trang	11
Dung lượng	424,62 KB