TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CÔNG NGHIỆP KHOA CÔNG NGHỆ THÔNG TIN TRUYỀN THÔNG ĐA PHƯƠNG TIỆN Đề tài:CÁC CHUẨN BIỂU DIỄN VÀ NÉN ẢNH : CHUẨN NÉN JPEG CHUẨN NÉN JPEG2000 CHUẨN NÉN FAX Giáo viên hướng dẫn:TRẦN THỊ BÍCH THẢO Sinh viên thực hiện:Nhóm 14 1.Vũ Đức Chiến 2.Phạm Vĩnh Lộc 3. Phạm Văn Cương A. MỞ ĐẦU. Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việc tìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyền thông tin trên mạng nhanh chóng đang là một yêu cầu cần thiết. Trong những năm gần đây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực hiện nén ảnh. Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với dung lượng ít nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực của ảnh. Và JPEG là một trong những phương pháp nén ảnh khá hiệu quả. B. NỘI DUNG. I. CÔNG NGHỆ JPEG. 1. JPEG là gì? JPEG viết tắt của Joint Photographic Experts Group, một nhóm các nhà nghiên cứu đã phát minh ra định dạng này để hiển thị các hình ảnh đầy đủ màu hơn (fullcolour) cho định dạng di động mà kích thước file lại nhỏ hơn. Đây là một phương pháp nén ảnh hiệu quả, nó cho phép làm việc với các ảnh có nhiều màu và kích cỡ lớn, tỷ lệ nén ảnh đạt mức so sánh tới vài chục lần (chứ không phải phần trăm). 2. Phương pháp nén ảnh JPEG. 2.1. Khái quát về phương pháp nén ảnh tĩnh Có nhiều cách để nén ảnh, nhưng dựa vào yếu tố bảo toàn thông tin có thể phân chia thành 2 phương pháp nén ảnh tĩnh, đó là: Nén không mất mát thông tin: sử dụng các phương pháp mã hóa dữ liệu Nén có mất mát thông tin: Phương pháp nén dựa trên phép biến đổi ảnh Quá trình nén ảnh được mô tả theo sơ đồ:
TRƯỜNG ĐẠI HỌC KINH TẾ - KỸ THUẬT CÔNG NGHIỆP KHOA CÔNG NGHỆ THÔNG TIN TRUYỀN THÔNG ĐA PHƯƠNG TIỆN Đề tài: CÁC CHUẨN BIỂU DIỄN VÀ NÉN ẢNH : - CHUẨN NÉN JPEG - CHUẨN NÉN JPEG2000 - CHUẨN NÉN FAX Giáo viên hướng dẫn: TRẦN THỊ BÍCH THẢO Sinh viên thực hiện: Nhóm 14 1. Vũ Đức Chiến 2. Phạm Vĩnh Lộc 3. Phạm Văn Cương 1 A. MỞ ĐẦU. Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việc tìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyền thông tin trên mạng nhanh chóng đang là một yêu cầu cần thiết. Trong những năm gần đây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực hiện nén ảnh. Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với dung lượng ít nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực của ảnh. Và JPEG là một trong những phương pháp nén ảnh khá hiệu quả. B. NỘI DUNG. I. CÔNG NGHỆ JPEG. 1. JPEG là gì? JPEG viết tắt của Joint Photographic Experts Group, một nhóm các nhà nghiên cứu đã phát minh ra định dạng này để hiển thị các hình ảnh đầy đủ màu hơn (full- colour) cho định dạng di động mà kích thước file lại nhỏ hơn. Đây là một phương pháp nén ảnh hiệu quả, nó cho phép làm việc với các ảnh có nhiều màu và kích cỡ lớn, tỷ lệ nén ảnh đạt mức so sánh tới vài chục lần (chứ không phải phần trăm). 2. Phương pháp nén ảnh JPEG. 2.1. Khái quát về phương pháp nén ảnh tĩnh Có nhiều cách để nén ảnh, nhưng dựa vào yếu tố bảo toàn thông tin có thể phân chia thành 2 phương pháp nén ảnh tĩnh, đó là: - Nén không mất mát thông tin: sử dụng các phương pháp mã hóa dữ liệu - Nén có mất mát thông tin: Phương pháp nén dựa trên phép biến đổi ảnh Quá trình nén ảnh được mô tả theo sơ đồ: 2 Các phương pháp mã hóa dữ liệu có thể kể đến: - Mã hang loạt(RLE): Dùng số đếm để thay thế các đặc diểm giống nhau lặp lại. - Mã Shannon-Fano: Dùng các cụm bít có độ dài thay đổi để mã hóa - Mã Huffman: Sử dụng các đặc điểm mã hóa của Shannon-Fano với ý tưởng: Kí hiệu có khả năng xuất hiện nhiều có từ mã ngắn. - Mã Lemple- Ziv: Dựa trên việc xây dựng và tra từ điển - Mã dự đoán: Dựa trên quá trình tạo điểm tuần tự và luật dự đoán. Các phép biến đổi áp dụng trong nén ảnh bao gồm: - Phép biến đổi Cosin rời rạc(DCT): Biểu diễn các giá trị điểm ảnh trên miền tần số, tập trung năng lượng vào một số hệ số. DCT sử dụng trong các chuẩn JPEG và MPEG - Phép biến đổi Wavelet rời rạc(DWT): sử dụng các bộ lọc thông dải xử lý phân tích đa phân trong phép DWT. - Phép biến đổi Fractal: Sử dụng các phép biến đổi hình học. Nén ảnh tĩnh dựa trên phép biến đổi ảnh được mô tả trong sơ đồ: 2.2. Phương pháp nén ảnh theo chuẩn JPEG a. Phép biến đổi DCT (Discrete Cosin Transform) Như chúng ta đã nói ở trên, phép biến đổi DCT được sử dụng trong phương pháp nén ảnh theo chuẩn JPEG. Vì vậy trước khi đi vào tìm hiểu về phương pháp nén ảnh JPEG chúng ta cùng khái quát sơ qua về phép biến đổi DCT. 3 b. Phương pháp nén ảnh theo chuẩn JPEG Phương pháp nén ảnh theo thuẩn JPEG có thể cho hệ số nén tới 80:1 hay lớn hơn, nhưng bạn phải chịu mất thông tin (ảnh sau khi bung nén khác với ảnh ban đầu), lượng thông tin mất mát tăng dần theo hệ số nén. Tuy nhiên sự mất mát thông tin này không bị làm một cách cẩu thả. JPEG tiến hành sửa đổi thông tin ảnh khi nén sao cho ảnh mới gần giống như ảnh cũ, khiến phần đông mọi người không nhận thấy sự khác biệt. Và bạn hoàn toàn có thể quản lý sự mất mát này bằng cách hạn chế hệ số nén. Như thế người dùng có thể cân nhắc giữa cái lợi của việc tiết kiệm bộ nhớ và mức độ mất thông tin của ảnh, để chọn phương án thích hợp. 4 Phương pháp nén ảnh JPEG dựa trên nguyên lý sau: ảnh màu trong không gian của 3 màu RGB (red Green Blue) được biến đổi về hệ YUV (hay YCBCr) (điều này không phải là nhất thiết, nhưng nếu thực hiện thì cho kết quả nén cao hơn) theo công thức : YUV. = 0.615R − 0.515G − 0.100B Y= 0.299R + 0.587G + 0.114B U= 0.492(B − Y)= = − 0.147R − 0.289G + 0.436B V= 0.877(R − Y) Hệ YUV là kết quả nghiên cứu của các nhà sản xuất vô tuyến truyền hình hệ Pal, Secam và NTSC, nhận thấy tín hiệu video có thể phân ra 3 thành phần Y, U, V (cũng như phân theo màu chuẩn đỏ, xanh lá cây và xanh da trời). Và một điều thú vị là hệ nhãn thị của con người rất nhạy cảm với thành phần Y và kém nhạy cảm với hai loại U và V. Phương pháp JPEG đã nắm bắt phát hiện này để tách những thông tin thừa của ảnh. Hệ thống nén thành phần Y của ảnh với mức độ ít hơn so với U, V, bởi người ta ít nhận thấy sự thay đổi của U và V so với Y. Giai đoạn tiếp theo là biến đổi những vùng thể hiện dùng biến đổi cosin rời rạc (thông thường là những vùng 8x8 pixel). Khi đó thông tin về 64 pixel ban đầu sẽ biến đổi thành ma trận có 64 hệ số thể hiện "thực trạng" các pixel. Điều quan trọng là ở đây hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khả năng đó giảm rất nhanh với các hệ số khác. Nói cách khác thì lượng thông tin của 64 pixel tập trung chủ yếu ở một số hệ số ma trận theo biến đổi trên. Trong giai đoạn này có sự mất mát thông tin, bởi không có biến đổi ngược chính xác. Nhưng lượng thông tin bị mất này chưa đáng kể so với giai đoạn tiếp theo. Ma trận nhận được sau biến đổi cosin rời rạc được lược bớt sự 5 khác nhau giữa các hệ số. Đây chính là lúc mất nhiều thông tin vì người ta sẽ vứt bỏ những thay đổi nhỏ của các hệ số. Như thế khi bung ảnh đã nén bạn sẽ có được những tham số khác của các pixel. Các biến đổi trên áp dụng cho thành phần U và V của ảnh với mực độ cao hơn so với Y (mất nhiều thông tin của U và V hơn). Sau đó thì áp dụng phương pháp mã hóa của Hoffman: Phân tích dãy số, các phần tử lặp lại nhiều được mã hóa bằng ký hiệu ngắn (marker). (1) (2) Với và Khi bung ảnh người ta chỉ việc làm lại các bước trên theo quá trình ngược lại cùng với các biến đổi ngược. Vì phương pháp này thực hiện với các vùng ảnh (thông thường là 8 x 8 pixel) nên hay xuất hiện sự mất mát thông tin trên vùng biên của các vùng (block) này. Hiện nay người ta đã giải quyết vấn đề này bằng cách làm trơn ảnh sau khi bung nén để che lấp sự khác biệt của biên giới giữa các block. Một hệ nén ảnh theo chuẩn JPEG cùng algorithm làm trơn ảnh đã được công ty ASDG đưa ra trong hệ Art Department Professional. 6 2.3 Ưu nhược điểm của phương pháp nén ảnh JPEG. a. Ưu điểm: JPEG cho phép nén ảnh với tỉ số nén lên đến 80:1 hoặc cao hơn, hiển thị các hình ảnh đầy đủ màu hơn (full-colour) cho định dạng di động mà kích thước file lại nhỏ hơn. JPEG cũng được sử dụng rất nhiều trên Web. Lợi ích chính của chúng là chúng có thể hiển thị các hình ảnh với màu chính xác true-colour (chúng có thể lên đến 16 triệu màu), điều đó cho phép chúng được sử dụng tốt nhất cho các hình ảnh chụp và hình ảnh minh họa có số lượng màu lớn. b. Nhược điểm. Nhược điểm chính của định dạng JPEG là chúng được nén bằng thuật toán lossy (mất dữ liệu). Điều này có nghĩa rằng hình ảnh của bạn sẽ bị mất một số chi tiết khi chuyển sang định dạng JPEG. Đường bao giữa các khối màu có thể xuất hiện nhiều điểm mờ, và các vùng sẽ mất sự rõ nét, tỉ số nén càng cao thì sự mất mát thông tin trên ảnh JPEG càng lớn. Nói một cách khác, định dạng JPEG thực hiện bảo quản tất cả thông tin màu trong hình ảnh đó, tuy nhiên với các hình ảnh chất lượng màu cao high-colour như hình ảnh chụp thì điều này sẽ không hề hấn gì. Các ảnh JPEG không thể làm trong suốt hoặc chuyển động - trong trườn hợp này bạn sẽ sử dụng định dạng GIF (hoặc định dạng PNG để tạo trong suốt). II. JPEG 2000 Như đã trình bày, kỹ thuật nén JPEG sẽ làm mất thông tin lúc giải nén, càng nén với hệ số cao thì thông tin càng mất nhiều khi bung. Vì vậy để giải quyết vấn đề này, tháng 12/1999 một bản phác thảo tiêu chuẩn nén hình ảnh theo công nghệ mới JPEG2000. Tháng 8/2000, bản phác thảo về tiêu chuẩn JPEG2000 đã được lưu hành trong giới chuyên gia hình ảnh. Sau đó nó đã được công nhận là tiêu chuẩn quốc tế vào tháng 12/2000 và được ISO hợp thức hóa năm nay để cho phép ứng dụng vào các hệ xử lý, phân phối. Với JPEG2000 kỹ thuật xử lý hình ảnh sẽ đạt được những kết quả rất ngoạn mục vì có thể nén nhỏ từ 100-200 lần mà hình ảnh không sai sót bao nhiêu so với hình ảnh gốc. Nhưng đâu là điểm khác biệt để kỹ thuật JPEG2000 vượt trội hơn hẳn so với JPEG? JPEG2000 là hệ thống mã hóa hình ảnh mà kỹ thuật nén dựa trên kỹ thuật sóng ngắn. Là một tiện ích toán học cho phép mô tả bằng một công thức đơn giản những gì xảy ra tại một thời điểm chính xác của tín hiệu. Với một chuỗi sóng ngắn, chỉ cần biểu diễn bằng 7 vài công thức, đường biểu diễn không đều mà không cần phải mô tả đặc tính của từng điểm một. Và lẽ dĩ nhiên sẽ rất đắc lực khi phân tích tỉ mỉ một file ảnh kỹ thuật số. Thuật toán trong kỹ thuật JPEG2000 là chọn một số nhỏ các sóng ngắn, các sóng này được lập lại ở những nơi khác nhau, tỷ lệ khác nhau đã mô tả chính xác tín hiệu của hình ảnh. File ảnh nén không chứa nhiều hơn số lượng chỉ vị trí và giãn nở của từng sóng ngắn. Và kỹ thuật mã hóa theo từng khối, theo từng khu vực ưu tiên của hình ảnh (ROI -Regional Of Interest) được áp dụng cũng là một tiến bộ đáng kể trong thuật toán mã hóa JPEG2000. Các điểm chú ý trong JPEG2000 3.1-Sự thay đổi các thành phần màu Ban đầu hình ảnh phải được chuyển đổi từ không gian màu RGB sang không gian màu khác, dẫn đến sự tách biệt của 3 thành phần màu này.Có 2 sự lựa chọn: a.Không thể đảo màu(Irreversible Color Transform -ICT): sử dụng không gian màu YC B C R 8 b.Có thể đảo màu(Reversible Color Transform-RCT):sử dụng không gian màu YUV đã sửa đổi mà không thực hiện các lỗi lượng tử cho nên nó có thể đảo màu. Thực hiện đúng các yêu cầu RCT tức là số được làm tròn theo quy định mà không thể được thể hiện chính xác dưới dạng ma trận. Quá trình chuyển đổi là: 3.2-Lát(Tiling) Sauk hi chuyển đổi màu sắc,bức ảnh được phân chia-gọi là các lát,các vùng vuông của ảnh đó được chuyển đổi và mã hóa riêng biệt nhau.Lát có nhiều kích cỡ, và nó có thể coi các lát của ảnh như 1 lát duy nhất.Khi kích thước được chọn, tất cả các lát sẽ có cùng kích thước(ngoại trừ những lát bên phải và phía dưới đường bao).Việc chia hình ảnh thành nhìu lát là có lợi,các bộ giải mã cần ít bộ nhở hơn để giải mã bức ảnh và nó có thể lựa chọn chỉ giải mã lát được chọn để giải mã 1 phần của bức ảnh.Bất lợi của phương pháp này là chất lượng hình ảnh giảm thấp hơn tín hiệu tốt nhất đến tỷ số truyền( peak signal to noise ratio). Sử dụng nhiều lát có thể tạo khối ảnh hưởng giống chuẩn JPEG 1992. 3.3-Hàm biến thiên chuyển đổi(Wavelet Trasform) Những lát này sau đó được biến đổi đến độ sâu tùy ý,trái với JPEG 1992-sử dụng biến đổi cosin vùng ảnh kích thước 8x8 :JPEG 2000 sử dụng 2 biến đổi wavelet 1.Không thể đảo ngược: nó được gọi là không thể đảo bởi nó sử dụng kĩ thuật lượng tử hóa phụ thuộc vào độ chính xác của bộ giải mã. 2.Đảo ngươc:Nó chỉ sử dụng hệ số nguyên,cho nên đầu ra không yêu cầu làm tròn số(lượng tử) và vì vậy nó không thực hiện bất kì sai số lượng tử nào.Nó được sử dụng trong mã hóa không mất mát thông tin. 3.4-Lượng tử hóa(Quantization ) Sau khi biến đổi wavelet transform,các hệ số là vô hướng-đã được lượng tử hóa để giảm số lượng các bit ,tại các điểm tổn hao của mất mát lượng tử.Đầu ra là 1 tập hợp các số nguyên phải được mã hóa bit-by-bit.Các tham số có thể được thay đổi để đạt chất lượng cuối cùng là bước lượng tử hóa:các bước quan trọng hơn là bước nén và sự mất mát thông tin lượng tử.Với 1 bước lượng tử bằng 1,không có quá trình lượng tử nào được thực hiện(nó được gọi là nén không mất mát) 3.5-Siêu dữ liệu(Metadata) 9 Đối với JPEG truyền thống, bổ sung các siêu dữ liệu: lưu trữ các thông tin về bức ảnh( kích cỡ,độ sâu màu,độ phân giải, ngày tạo bức ảnh…) 3.6- Motion JPEG 2000 Motion JPEG quy định việc sử dụng định dạng JPEG 2000 cho các trình tự tính thời gian của hình ảnh (tự động), có thể kết hợp với âm thanh, và tạo ra cách trình bày tổng thể. Tên file mở rộng cho các tệp video Motion JPEG 2000 là .mj2 .mjp2 Motion JPEG 2000 (thường được biết đến như MJ2 hoặc MJP2) cũng đang được xem xét như là một định dạng lưu trữ kỹ thuật số của Library of Congress. Nó là một tiêu chuẩn quốc tế mở và cập nhật những thuận lợi cho MJPEG (hoặc MJ), được dựa trên những thành tựu của định dạng JPEG. Không giống như các định dạng video phổ biến, chẳng hạn như MPEG-4 Part 2, WMV, và H.264 thì MJ2 không sử dụng các khung nội suy (inter- frame). Thay vào đó, mỗi frame là một thực thể độc lập được mã hóa bởi một biến thể hoặc mất dữ liệu hay không giảm chất lượng của JPEG 2000. Nó là 1 cấu trúc vật lý không phụ thuộc vào time ordering,nhưng nó sử dung những profile riêng biệt để bổ sung dữ liệu. Đối với âm thanh, nó hỗ trợ LPCM mã hóa, cũng như biến thể khác của MPEG-4 , như là dữ liệu thô "hoặc bổ sung dữ liệu". 3.7-JPEG2000 Security–JPSEC Vấn đề an ninh,bản quyền trong sao chép,truyền thông ảnh được xử lý trong JPSEC:Mật mã,nguồn chứng thực,toàn vẹn dữ liệu,điều kiện truy cập,bảo vệ quyền sở hữu 3.8-JPEG2000 Wireless-JPWL Cải tiến JPEG2000 cho phù hợp với các ứng dụng đa phương tiện không dây. 3.9-JPXML Hình ảnh được nhúng vào XML sử dụng ngôn ngữ đánh dấu (Geography Markup Language-GML) 3.10-JP3D Đây là phần mở rộng cho hình ảnh không gian 3 chiều(thể tích hình ảnh) 10 . cao hơn) theo công thức : YUV. = 0.615R − 0.515G − 0.100B Y= 0.299R + 0.587G + 0.114B U= 0.492(B − Y)= = − 0 .147 R − 0.289G + 0.436B V= 0.877(R − Y) Hệ YUV là kết quả nghiên cứu của các nhà sản. NÉN JPEG2000 - CHUẨN NÉN FAX Giáo viên hướng dẫn: TRẦN THỊ BÍCH THẢO Sinh viên thực hiện: Nhóm 14 1. Vũ Đức Chiến 2. Phạm Vĩnh Lộc 3. Phạm Văn Cương 1 A. MỞ ĐẦU. Cùng với sự phát triển