Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 28 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
28
Dung lượng
1,23 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG * BÁO CÁO XỬ LÍ DỮ LIỆU ĐA PHƯƠNG TIỆN ĐỀ TÀI : CÁC PHƯƠNG PHÁP MÃ HÓA NÉN ẢNH GIẢNG VIÊN HƯỚNG DẪN : PGS.TS Nguyễn Thị Hoàng Lan SINH VIÊN THỰC HIỆN : Phan Minh Tân 20104834 Trần Khánh Duy 20111350 Đặng Anh Minh 20111853 Hà nội 5/2015 Mục Lục Phân công công việc Trần Khánh Duy Phan Minh Tân Đặng Anh Minh Nhóm -Tìm hiểu khái qt loại liệu đa phương tiện - Tìm hiểu phương pháp má hóa nén ảnh - Tổng hợp làm slide, báo cáo -Tìm hiểu phương pháp nén ảnh JPEG PNG - So sánh định dạng liệu ảnh JPEG PNG -Thử nghiệm ứng dụng, so sánh hiệu giải thích Page Phần : Các loại liệu đa phương tiện, liệu ảnh số Các phương pháp mã hóa nén ảnh Dữ liệu đa phương tiện 1.1 Dữ liệu đa phương tiện gì? Thơng thường thường nhận thơng tin dạng văn bản, văn đươc mã hóa lưu trữ máy tính, có liệu dạng văn Một câu hỏi đặt thông tin thu nhận dạng khác âm (voice), hình ảnh (image) liệu dạng nào? Chính điều dẫn đến khái niệm ta gọi liệu đa phương tiện Dữ liệu đa phương tiện liệu biểu diễn thông tin đa phương tiện Ví dụ liệu đa phương tiện liệu dạng thông tin - Âm - Hình ảnh - Văn - Kết hợp dạng 1.2 Các loại liệu đa phương tiện Khi nghiên cứu liệu dạng thông tin trên, người ta nhận cần phải phân chia liệu đa phương tiện nhỏ Bởi liệu dạng âm thanh, hình ảnh q trình “vận động” theo thời gian có tính chất khác so với dạng tĩnh Điều địi hỏi kĩ thuật, cơng nghệ xử lý khác Người ta chia loại liệu đa phương tiện thành : • Dữ liệu khơng phụ thuộc thời gian : - Văn ( text) - Đồ thị (graphic) - Ảnh đồ họa Nhóm Page Dữ liệu phụ thuộc thời gian- tín hiệu số : Âm (audio) , tiếng nói, ấm nhạc Ảnh (image) , video, ảnh động (motion) Hoạt hình (nimation) • - Dữ liệu ảnh số • Dữ liệu ảnh số: giá trị điểm ảnh x (0,1,2,…) • Cấu trúc ảnh số: ma trận phần tử ảnh (pixel), pixel đặc trưng - tọa độ (vị trí), mặt phẳng (m,n) giá trị điểm ảnh vị trí I(m,n) Cấu trúc liệu ảnh số: chia làm ba loại : Ảnh xám (đa mức xám ) Ảnh màu Ảnh nhị phân Tìm hiểu chung phương pháp nén ảnh truyền thơng Nhóm Page • • Nén khơng mát thơng tin : phương pháp mã hóa liệu Nén có tổn hao : mã hóa nén dựa phép biến đổi ảnh Phân tích sơ đồ khối nén • Khối FDCT : khối biến đổi cosin rời rạc, biến đổi liệu từ miền • • • • Nhóm số nguyên sang miền số thực Khối lượng tử hóa : khối biến đổi liệu sau DCT thành số nguyên, khối gây mát thơng tin Khối mã hóa : thực biến đổi liệu sau lượng tử hóa thành cách từ mã Bảng lượng tử hóa: ma trận 8x8 sử dụng cho việc biến đổi liệu từ số thực sang số nguyên, bảng mã hóa kèm với liệu sau lượng tử hóa Bảng mã hóa : luật mã hóa liệu số nguyên sau lượng tử hóa thành từ mã Page Phần : Phương pháp nén ảnh JPEG PNG I.Phương pháp nén ảnh JPEG Giới thiệu JPEG JPEG viết tắt Joint Photographic Expert Group( nhóm chuyên gia phát triển chuẩn ảnh này) Chuẩn JPEG công nhận chuẩn ảnh quốc tế năm 1990 phục vụ ứng dụng truyền ảnh cho lĩnh vực y học, khoa học kỹ thuật, ảnh nghệ thuật… vv Phương pháp nén ảnh JPEG phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần nhiên ảnh sau giải nén khác với ảnh ban đầu chất lượng ảnh bị suy giảm sau nén, suy giảm tăng dần theo hệ số nén Nhưng mát thơng tin chấp nhận việc loại bỏ thông tin không cần thiết dựa nghiên cứu hệ nhãn thị mắt người Nguyên lý phương pháp nén JPEG là: cắt hình ảnh thành khối nhỏ, phân tích tất liệu màu sắc, độ sáng mà khối chứa phương trình ma trận Ảnh màu khơng gian RGB( red, green, blue) chuyển đổi qua hệ YCbCr Trong thị giác người lại nhạy cảm với hệ Y, nhạy cảm nhiều với hệ Cb,Cr Dẫn đến hệ thống nén thành phần Y ảnh mức độ nhiều so với Cb Cr dụng biến đổi Cosin rời rạc, sau q trình lượng tử hóa mã hóa Khi giải nén ảnh bước thực thi làm ngược lại q trình nói Quy trình nén ảnh JPEG Trước biến đổi ảnh xử lý phân tích thành ảnh đơn sắc số hóa theo tiêu chuẩn hành.Sau ảnh chuyển đổi không gian màu : RGB sang YUV CrYCb tùy vào thiết bị hiển thị • Chuẩn nén JPEG ban đầu phân ảnh khối x Việc xử lý khối liệu nhỏ làm tăng độ xác tính tốn giảm thiểu phần tính tốn • Nhóm Page Tiếp đến khối qua giai đoạn biến đổi Cosin( DCT ) phép biến đổi Cosine rời rạc biến đổi thông tin ảnh từ miền không gian sang miền tần số để biểu diễn dạng gọn • Tiếp sau trình biến đổi Cosine rời rạc trình lượng tử hóa: q trình làm giảm số lượng bít cần để lưu trữ hệ số biến đổi việc giảm độ xác hệ số ( q trình mát thơng tin) • Tiếp đến q trình mã hóa, q trình tách biệt việc xử lý hai thành phần đặc trưng: thành phần hệ số chiều DC đặc trưng cho phần lớn tín hiệu ảnh thành phần hệ số xoay chiều đặc trưng cho thông tin chi tiết ảnh • 2.1 Chuyển đổi khơng gian màu - Đầu vào ảnh phân tích thành ảnh đơn sắc số hóa theo tiêu chuẩn hành - Đầu ảnh chuyển không gian màu từ RGB sang YUV CrYCb tùy vào thiết bị hiển thị Nhóm Page Trước tiên ảnh chuyển đổi từ RGB tới không gian màu khác gọi YCbCr Nó có thành phần Y, Cb,Cr, thành phần Y miêu tả ánh sáng điểm ảnh, thành phần Cb Cr miêu tả “ chrominance”(phân loại thành phần xanh đỏ) Sự chuyển đổi không gian màu YcbCr cho phép nén ảnh lớn cho chất lượng ảnh Tuy nhiên nhiều ảnh JPEG chất lượng cao không áp dụng trường hợp thay giữ chúng khơng gian màu RGB, vùng màu nén lượng tử hóa tách biệt với giới hạn chất lượng • Downsampling: Mắt người nhìn thấy nhiều chi tiết thành phần Y(ánh sáng) Cb(xanh cây) Cr(xanh dương) Từ q trình nén làm giảm thành phần Cb Cr (được gọi là: downsampling” hay “Chroma subsampling”) Tỉ số mà việc lấy mẫu xuống thực hiên LPE 4:4:4( không lấy mẫu xuống), 4:2:2(giảm bớt chia theo hướng \nằm ngang), thường sử dụng I 4:2:0(giảm bớt chia theo hướng nằm ngang đứng) ngưng trình lấy mẫu Y, Cb, Cr sử lý tách biệt loại Lấy mẫu xuống thành phần Chroma lưu giữ 33% 50% không gian lấy ảnh 2.2 Phân phối Sau “ subsampling” kênh phải bị tách đặt khối 8x8( pixel) Nếu liệu cho kênh không mô tả số nguyên khối việc giải mã phải làm đầy vùng cịn lại khối khơng đầy đủ với số hình thức liệu giả: làm đầy pixel với màu quy định (màu đen) tạo vùng tối dọc phần nhìn thấy rõ khung Cách tốt làm đầy pixel sử dụng màu sắc mà qui định hệ số DCT pixel nhìn thấy rõ tần số thấp Nhóm Page Miêu tả hàm truyền cosine 8x8 ảnh nhỏ trình bầy mặt xám 8bit Việc phân ảnh khối 8x8 đem lại nhiều thuận lợi quy trình Nó giúp cho cơng đoạn biến đổi nhanh hai chiều cho khối 8x8 hiệu hơn, biến đổi Cosine cho khối có kích cỡ giảm phần tính tốn chung Ngồi biến đổi Cosine khối có kích thước nhỏ làm tăng độ xác tính tốn với số dấu phẩy tĩnh, giảm thiểu sai số làm tròn sinh Mặt khác, điểm ảnh hàng xóm có độ tương quan cao phép biến đổi Cosine cho khối nhỏ tập trung lượng thấp khối nên tạo mát thông tin cục giúp nâng cao chất lượng ảnh 2.3 Nhóm Biến đổi DCT Page Chuẩn JPEG sử dụng biến đổi Cosin Phép biến đổi Cosin tập trung lượng khối ảnh vào hệ số tương ứng với vùng tần số thấp Dẫn đến cho hệ số vùng tần số cao gần mà ảnh hưởng không đáng kể đến chất lượng ảnh Mỗi thành phần (Y,Cb,Cr) khối 8x8 chuyển đến vùng tần số sử dụng biến đổi Cosine rời rạc 2-D(DCT) Ngun tắc phương pháp mã hóa biến đổi tập giá trị pixel ảnh miền không gian sang tập giá trị khác miền tần số cho hệ số tập giá trị có tương quan điểm ảnh gần nhỏ Phép biến đổi Cosin rời rạc chiều định nghĩa bởi: phép biến đổi cosin hai chiều: Biến đổi công đoạn lớn phương pháp nén sử dụng phép biến đổi Nhiệm vụ công đoạn biến đổi tập trung lượng vào số hệ số biến đổi công thức biến đổi cho khối: Trong đó: Mỗi khối 64 điểm ảnh sau biến đổi DCT thuận nhận 64 hệ số thực hệ số có chứa 64 thành phần tần số không gian hai chiều Hệ số với tần số không theo hai hướng ( tương ứng với k1 k2 0) gọi hệ số chiều DC, hệ số giá trị trung bình 64 điểm ảnh khối 63 hệ số lại gọi hệ số xoay chiều AC Hệ số chiều DC tập trung phần lớn lượng ảnh Nhóm Page 10 phần tần số thấp chứa nhiều thông tin phần tần số cao để đạt độ nén cao ta dùng nhiều bit để lưu giữ giá trị thành phần tần số thấp dùng bit để lưu trữ hệ số tần số cao Điều dẫn tới việc thiết kế bảng lượng tử với hệ số khác Một bảng lượng tử hóa tốt cần phải có tính chất sau: Giá trị Q(m,n) nhỏ Khi hệ số X(m,n) sau làm trịn tới số nguyên gần chứa byte • Hệ số X(0,0) trung bình ảnh khơng để sai lệch q nhiều • Khi ảnh ảnh đồ họa có vùng lớn giá trị điểm ảnh nên hệ số AC=0 Cịn chứa biên giá trị AC lớn Q(m,n) nên lấy nhỏ để độ nén cao đường biên khơng bị nhịe • 2.5 Mã hóa Đầu vào q trình mã hóa người ta chia tách biệt hai thành phần để xử lý Với thành phần hệ số chiều DC người ta mã hóa hệ số theo phương pháp DPCM Còn với thành phần xoay chiều AC người ta xếp lại theo phương pháp Zigzag mã hóa Huffman 2.5.1 Mã hóa thành phần DC Thành phần DC mã hóa DPCM sau mã hóa Huffman Tất hệ số DC khối 8x8 xếp thành chuỗi để mã hóa dự đốn.Hệ số DC dự đoán theo sai khác với thành phần trước nó: DiffDC(blocki) = DC(blocki) – DC(blocki–1) Ví dụ:giả sử thành phần DC bảng 1216 1232 1224 1248 1248 1208 Trước mã hóa: 1216 → 1232 → 1224 → 1248 → 1248 → 1208 Nhóm Page 14 Sau mã hóa :1216 → +16 → -8 → +24 → → -40 Sau q trình mã hóa dự đốn q trình mã hóa Huffman Các hệ số DC (sau DPCM) phân nhóm Ví dụ, -7 đến -4 4-7 xếp vào nhóm (mã số "00").Dưới bảng mã Huffman Ví dụ Example: -9: thuộc nhóm Do Base code = 101 (-9) = 1C(1001) = 0110 Code word = 101 + 0110 = 1010110 2.5.2 Mã hóa thành phần AC • • • Thành phần hệ số xoay chiều chứa thông tin chi tiết ảnh Để nâng cao hiệu nén cho hệ số khối người ta xếp lại chúng theo thứ tự Zigzag Có thể hình dung hình Zigzag bảng sau: Nhóm Page 15 Sau hệ số AC mã hóa Huffman Ví dụ 0 –1 mã hóa thành: 100101 11100110 110110 Number Run/Category Base code Length Final code 0/3 100 100 101 02 1/2 111001 111001 10 00-1 2/1 11011 11011 Quy trình giải nén JPEG Thực chất trình giải mã hiển thị ảnh q trình ngược mã hóa JPEG Nhóm Page 16 Sơ đồ giải mã JPEG Để giải nén được, phải ghi lại thơng tin như: kích thước ảnh, kích thước khối, ma trận T, độ lệch tiêu chuẩn, mức tạo lại, hai bảng mã Huffman, kích thước khối nén chiều, kích thước khối nén xoay chiều… ghi nối tiếp vào hai file nén hai thành phần hệ số Q trình bắt đầu với cơng đoạn giải mã Entropy, sau trình ta ma trận 8x8 Lấy ma trận hệ số DCT ( sau cộng hệ số DC khác): Quá trình giải lượng tử phía giải mã thực hiên ngược lại Các hệ số sau giải mã entropy nhân với bước nhảy bảng lượng tử (bảng lượng tử đặt phần header ảnh JPEG) Kết sau đưa vào biến đổi DCT ngược Nhóm Page 17 Kết sau giải mã lượng tử Nó gần giống với ma trận hệ số DCT nguyên thủy cho nửa phía trái Tiếp đến q trình biến đổi ngược DCT,áp dụng cơng thức biến đổi ngược cho khối 8x 8: Cho ta kết quả: Cộng 128 tới “ entry”: Nhóm Page 18 Đây ảnh nhỏ không bị nén so sánh với ảnh nhỏ nguyên thủy, ảnh giải nén có khác : ảnh gốc ảnh sau giải nén A Khuôn dạng ảnh JPEG Cấu trúc ảnh JPEG: Các byte đánh dấu FF D8 FF FE FF E0 FF DB FF C0 FF C4 FF DA Nhóm Giải thích Bắt đầu File Chú giải khơng có Byte đánh dấu liệu ứng dụng Định nghĩa bảng lượng tử Bắt đầu Baseline DCT Định nghĩa bảng Huffman Bắt đầu liệu ảnh Page 19 XX XX FF D9 Dữ liệu mã hóa Kết thúc ảnh II Phương pháp nén ảnh PNG Tổng quan PNG (Portable Network Graphics) dạng hình ảnh sử dụng phương pháp nén liệu - không làm liệu gốc PNG tạo nhằm cải thiện thay định dạng ảnh GIF với định dạng hình ảnh khơng địi hỏi phải có giấy phép quyền sử dụng PNG hỗ trợ thư viện tham chiếu libpng , thư viện tảng độc lập bao gồm hàm C để quản lý hình ảnh PNG PNG hỗ trợ bảng màu 24bit-RGB , 32 bit RGB[A], ảnh xám, ảnh full-color non-palette-based RGB[A] Những tập tin PNG thường có phần mở rộng PNG png gán kiểu chuẩn MIME image/png (được công nhận vào ngày 14 tháng 10 năm 1996), công bố chuẩn ISO/IEC vào năm 2004 Quá trình nén ảnh PNG PNG sử dụng trình nén giai đoạn: - Pre-compression: lọc (dự đoán) - Compression : Deflate 2.1 Lọc Trước Deflate, liệu Pre-compression, thông qua phương pháp dự đoán :Một phương pháp lọc sử dụng cho tồn hình ảnh, dịng hình ảnh, loại lọc chọn để liệu biến đổi dễ dàng nén Chỉ có phương pháp lọc dựa đặc điểm kỹ thuật PNG ( ký hiệu 0).Đối với phương pháp này, lọc dự đoán giá trị điểm ảnh dựa giá trị điểm ảnh lân cận trước đó, sai số màu dự đoán điểm ảnh so với giá trị thực tế, DPCM Có loại lọc cho phương pháp lọc 0: Tên lọc (Filter name) None Sub Nhóm Miêu tả ( Description) Mỗi byte không thay đổi Mỗi byte thay sai khác byte tương ứng bến Page 20 Up Average (Trung bình) Paeth 2.2 trái Mỗi byte thay sai khác byte (trong dịng trước đó, trước lọc) Mỗi byte thay sai khác trung bình byte tương ứng bên trái Mỗi byte thay sai khác yếu tố dự báo Paeth byte tương ứng với bên trái phía trên, phía bên trái Nén: Deflate Một tập hợp liệu nén bao gồm loạt khối, tương ứng đến khối tiếp liệu đầu vào Các kích thước khối tùy ý,ngoại trừ khối uncompressible giới hạn cho 65.535 bytes Mỗi khối nén sử dụng kết hợp thuật tốn LZ77 Huffman mã hóa Các Huffman cho khối độc lập với khối cho trước tiếp theo; thuật toán LZ77 sử dụng tham chiếu đến chuỗi trùng lặp xảy khối trước đó,lên đến 32Kb đưa vào trước Mỗi khối gồm có hai phần: cặp Huffman mã mô tả đại diện phần liệu nén, phần liệu nén Các liệu nén bao gồm loạt các yếu tố hai loại: byte chữ (các chuỗi mà khơng phát nhân đơi vịng trước 32Kb đầu vào), trỏ đến chuỗi trùng lặp, nơi trỏ biểu diễn cặp Các đại diện sử dụng "Deflate" giới hạn định dạng khoảng cách đến 32Kb độ dài tới 258 byte, không giới hạn kích thước khối,trừ khối uncompressible.Mỗi loại có giá trị (literals, distances, and lengths ) nén liệu đại diện cách sử dụng mã Huffman, cách sử dụng mã số cho literals độ dài mã riêng biệt cho khoảng cách I Cấu trúc ảnh PNG Một tập tin PNG bao gồm 8-byte kí hiệu (89 50 4E 47 0D 0A 1A 0A viết hệ thống có số 16, chứa chữ "PNG" dấu xuống dòng, xếp theo số lượng thành phần, thành phần chứa thơng tin hình ảnh Cấu trúc dựa thành phần thiết kế cho phép định dạng PNG tương thích với phiên cũ sử dụng PNG cấu trúc chuỗi thành phần, thành phần chứa kích thước, kiểu,dữ liệu, mã sửa lỗi CRC Chuỗi gán tên chữ phân biệt chữ hoa chữ thường.Sự phân biệt giúp giải mã phát chất chuỗi khơng nhận dạng Vỡi chữ đầu, viết hoa thể chuỗi cần thiết.Chuỗi chứa thông tin cần thiết để đọc tệp giải mã không nhận dạng chuỗi này, việc đọc tệp hủy Thành phần bản: Nhóm Page 21 -IHDR phải thành phần đầu tiên, chứa đựng header -PLTE chứa đựng bảng màu (danh sách màu) -IDAT chứa đựng ảnh Ảnh chia nhỏ chứa nhiều phần IDAT Điều làm tăng kích cỡ tệp lên làm cho việc phát sinh ảnh PNG mượt (streaming manner) -IEND đánh dấu điểm kết thúc ảnh Phần : Thử nghiệm ứng dụng so sánh hiệu phương pháp nén ảnh JPEG PNG Tóm tắt Sử dụng phần mềm FastStone Photo Resizer Đường Link download : http://www.faststone.org/FSResizerDownload.htm Đầu vào ảnh Dùng phần mềm nén ảnh theo Jpeg png Sau dựa vào thơng số kết luận giải thích Tiến hành - - Nhóm Giao diện phần mềm Page 22 - Nhóm Trước hết ta imput ảnh cần nén Page 23 - Sau có list định dạng cho chúng chọn để nén - Sau chọn xong định dạng nén convert chờ kết Nhóm Page 24 - Sau nén xong bảng thơng số Nén JPEG Nén PNG Kết Ảnh gốc 4324kb Nhóm Page 25 Sau nén JPEG Nén JPEG: New Size= 444kb Quality 50% -Tỉ số nén= Hiệu = (1-tỉ số nén)*100%=90% Sau nén PNG Nén PNG: – Colors 24bit – Ratio 1/13.5 Nhóm Page 26 Tỉ số nén= Hiệu = (1-tỉ số nén)*100%= -1250% Kết Luận : Khi nén ảnh cơng nghệ JPG chất lượng hình ảnh giảm rõ rệt Khi chất lượng hình ảnh bị sụt giảm ta thấy điểm mờ khối màu, nét vùng ảnh Khi nén ảnh định dạng PNG, ảnh khơng bị giảm chất lượng Chính dung lượng ảnh PNG lớn Giải Thích : Nén ảnh Jpeg dựa phương pháp nén mát thơng tin cịn Png dạng hình ảnh sử dụng phương pháp nén liệu mà không làm thông tin Phần : Tài liệu tham khảo phần mềm thực nghiệm - Nhóm Slide tryền thơng đa phương tiện Slide xử lí liệu đa phương tiện Sayood, K Giới thiệu nén liệu, San Francisco, CA: Nhà xuất Morgan Kaufmann, 1996 Page 27 - Link tham khảo : ww.libpng.org/pub/png/book/chapter09.html Sử dụng phần mềm FastStone Photo Resizer Đường Link download : http://www.faststone.org/FSResizerDownload.htm Nhóm Page 28 ... : Các loại liệu đa phương tiện, liệu ảnh số Các phương pháp mã hóa nén ảnh Dữ liệu đa phương tiện 1.1 Dữ liệu đa phương tiện gì? Thơng thường thường nhận thơng tin dạng văn bản, văn đươc mã hóa. .. hiểu khái quát loại liệu đa phương tiện - Tìm hiểu phương pháp má hóa nén ảnh - Tổng hợp làm slide, báo cáo -Tìm hiểu phương pháp nén ảnh JPEG PNG - So sánh định dạng liệu ảnh JPEG PNG -Thử nghiệm... đổi liệu từ số thực sang số nguyên, bảng mã hóa kèm với liệu sau lượng tử hóa Bảng mã hóa : luật mã hóa liệu số nguyên sau lượng tử hóa thành từ mã Page Phần : Phương pháp nén ảnh JPEG PNG I.Phương