Đang tải... (xem toàn văn)
số của một yếu tố bình thường và làm tròn hệ số giá trị số nguyên gần nhất.JPEG đạt tiêu chuẩn bao gồm hai bảng lượng tử mặc định hoặc tùy chỉnh .Nói chung, tăng cường độ với tần số kh[r]
(1)ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN : MẠNG VÀ TRUYỀN THÔNG
BÀI BÁO CÁO : MULTIMEDIA
(2)Image Compression
3.4.1 Graphics Interchange format(GIF) 3.4.2 Tagged image file format(TIFF) 3.4.3 Digitized documents
(3)Image Compression
Hình ảnh có loại :
Do máy tính tạo (Graphical) Hình ảnh số hóa
Hình ảnh biểu diễn ma trận chiều bao gồm thành phần
được gọi điểm ảnh(pixel)
Hình ảnh chương trình(phần mềm) tạo tốn nhớ so với hình
(4)Image Compression(cont.)
Khi truyền hình ảnh trương trình tạo biểu diễn theo
định dạng chương trình sử dụng thuật tốn nén tương ứng ví dụ : jpeg thuật tốn nén ảnh jpeg
Có nhiều thuật toán nén khác chủ yếu sử dụng phương án + Dựa kết hợp mã hóa vi sai mã hóa thống kê
+ Dựa biến đổi ,phép tính vi phân mã hóa vi sai phát
(5)3.4.1 Graphics Interchange format(GIF)
Định dạng ảnh GIF sử dụng rộng dãi Internet cho việc biểu
diễn nén ảnh Graphical
Màu sắc ảnh bao gồm 24 bit 8 bit Red, bit Green, bit Blue
GIF giảm số lượng màu mà biểu diễn việc lựa chọn 256
màu từ 224 màu gốc
Bảng màu chứa 256 mục,mỗi mục chứa giá trị 24 bit màu
Do thay truyền điểm ảnh giá trị 24 bit màu truyền
bit số bảng màu phù hợp với màu gốc (co gọn 224màu lại
256 màu; với màu a,b gần giống thay truyền màu thay số màu)
Tỷ lệ nén 3:1
(6)(7)3.4.1 Graphics Interchange format(GIF) cont.
Dữ liệu nén chia làm nhóm (Figure 3.10) ,đầu tiên 1/8 tổng số
(8)3.4.1 Graphics Interchange format(GIF) cont.
Bảng màu liên quan tới toàn ảnh gọi Golbal color table
Bảng màu gửi qua mạng với liệu nén số thông tin
khác Local color table
(9)3.4.1 Graphics Interchange format(GIF) cont.
Nếu giới hạn mục bảng 24bit biểu diễn chuỗi
giá trị điểm ảnh bảng mở rộng
Thông thường bảng màu chứa 256 mục ban đầu 512 mục
GIF cho phép hình ảnh lưu trữ truyền mạng chế độ
xen kẽ
Điều có lợi truyền hình ảnh qua kênh có tốc độ thấp GIF sử dụng mã hóa : LZW coding
(10)3.4.1 Graphics Interchange format(GIF) cont.
(11)3.4.2 Tagged image file format(TIFF).
Sử dụng rộng rãi ,sử dụng 48 bít để biểu diễn 16 bits Red, 16 bits Green,
16 bits Blue
Dự định để truyền hình ảnh tài liệu số hóa
Do liệu lưu trữ truyền theo số định dạng khác Mỗi định dạng sử dụng code number khác
(12)3.4.3 Digitized documents
Trong 2.4.3 thảo luận máy quét máy fax để số hóa ảnh
bitonal
Nguyên tắc quét máy quét là:từ trái qua phải ,từ xuống Chỉ sử dụng bít để biểu diễn điểm ảnh
+ trắng + đen
Với độ phân giải xấp xỉ điểm ảnh /mm luồng bits không bị nén
Trong hầu hết trường hợp liệu truyền qua moden PSTN tốc
độ thấp tốn thời gian
(13)3.4.3 Digitized documents (cont.)
Tổ chức ITU-T đưa chuẩn
+ T2(Group 1) sử dụng + T3(Group 2)
+ T4(Group 3) PSTN + T6(Group 4) ISDN
Các chuẩn sd thuật toán nén huffman Tỷ lệ nén 10:1
Sau phân tích tần số xuất bits trắng đen liền kề
đưa codeword
+ termination-codes table : biểu diễn mã vi sai màu trắng màu
đen từ 063 điểm ảnh bước điểm ảnh
+ make-up codes table : biểu diễn mã vi sai màu trắng màu đen
(14)(15) Quét ảnh từ xuống, từ trái sang phải xem có bn bit bd
cho màu trắng, bn bit bd cho màu đen
Ở bảng a sd codeword để thay cho while run-lengh
black run-lengh
Ở bảng b, độ dài bit trắng liền bội 64,
muốn bd độ dài mà ko nằm bảng a b lấy số tg ứng bảng a+b để tạo thành
Vd: để bd cho đoạn có độ dài 140 lấy codeword 128+
(16)3.4.3 Digitized documents (cont.)
Kỹ thuật overscaning sử dụng nghĩa tất dịng bắt đầu với
nhất bit trắng Bên nhận biết codeword luôn liên quan tới màu trắng thay màu trắng or màu đen sử dụng bảng termination-codes table make-up codes table gọi : modified Huffman codes
Nếu khơng có giao thức check lỗi PSTN ,khi sảy lỗi đường
truyền bên nhận bắt đầu dịch codeword ranh giới bit bị lỗi
bên nhận bất đồng không thể giải mã
Để cho phép đồng lại kết thúc dòng chèn thêm mã EOL(end of
line)
(17)3.4.3 Digitized documents (cont.)
Mỗi dòng quét mã hóa độc lập One-dimensinal coding
One-dimensinal coding làm việc tốt tài liệu chứa ký tự vẽ negative compression ratio : số bít gửi nén lớn số bits
khơng nén
Vì lý mã hóa T6(Group 4) định nghĩa.Nó tùy chọn
trong Group 3(máy fax) lại bắt buộc Group4
Khi hỗ trợ máy Group ,EOL code thêm vào cuối dịng + Nếu bít dòng Group
(18)3.4.3 Digitized documents (cont.)
Ký tự gọi modified – modified READ(MMR) coding
hoặc two-dimensional coding (2D)
Mã hóa MMR liên quan tới mã hóa vi sai với dịng xác định
bằng việc so sánh nội dung dòng gọi : coding Line(CL)
(19)3.4.3 Digitized documents (cont.)
Có chế độ mã hóa vi sai : + Pass mode
(20)(21)3.4.4 Digitized pictures
Hình ảnh bao gồm dạng : + Đơn sắc
+ Ảnh màu
Dung lượng vào khoảng 307kb đến 2.4Mb Ảnh hưởng đến ứng dụng
tương tác
Dùng nén two-deminsional để giảm thời gian truyền
Hầu hết phương pháp nén số hóa hình ảnh dựa tiêu chuẩn
(22)3.4.5 JPEG
Phương pháp nén ảnh JPEG (Joint Photographic Experts Group
ISO/ITU/IEC) phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần Tuy nhiên ảnh sau giải nén khác với ảnh ban đầu định nghĩa tiêu chuẩn IS 10918
Nén mát thông tin
Baseline mode :dùng việc nén hình ảnh đơn sắc số hóa
ảnh màu, sử dụng ứng dụng truyền thông đa phương tiện
Các giai đoạn nén ảnh : giai đoạn
Image/Block Preparation (chuẩn bị hình ảnh, khối) Forward DCT (Chuyển tiếp DTC)
(23)3.4.5 JPEG(cont.)
(24)3.4.5 JPEG(cont.)
Dùng ma trận chiều để biểu diễn hình ảnh
Trong trường hợp ảnh đơn sắc sử dụng ma trận chiều để thiết lập
(25)3.4.5 JPEG(cont.)
Ảnh màu : CLUT sử dụng đại diện
bởi R,G,B ta thay bằng: Y ,Cb,Cr
(26)3.4.5 JPEG(cont.)
Một file hình ảnh gốc lựa chọn chuẩn bị tập hợp giá trị
được nén riêng biệt cách sử dụng DCT.Nó tốn thời gian ma trận chia tập ma trận nhỏ (8x8) gọi ma trận phụ
(27)3.4.5 JPEG(cont.)
2.Forward DCT
DCT : Chuyển đổi ma trận hai chiều giá trị điểm ảnh vào ma trận
tương đương thành phần tần số
Mỗi giá trị điểm ảnh sử dụng bít Từ đến 255 cho giá trị mức xám
(28)(29)3.4.5 JPEG(cont.)
Trong DCT
Tất 64 mục giá trị ma trận input P [x, y] đóng góp cho mục
trong ma trận chuyển đổi F [i, j]
Đối với i = j = 0, cos (0) = giá trị vị trí F [0,0] giá trị trung
bình tất 64 giá trị ma trận biết đến hệ số DC
Tất giá trị khác ma trận chuyển đổi có tần số hệ số liên quan với
chúng - ngang (x = 17 y = 0), theo chiều dọc (x = y = 17) hai (x = 17 cho y = l7) gọi hệ số AC
Đối với j = có hệ số tần số quét ngang có mặt gia tăng tần số cho i
= 17
(30)(31)3.4.5 JPEG(cont.)
3 Quantization: lượng tử hóa
Mắt phản ứng chủ yếu để DC thành phần tần số thấp
thay đổi theo tần số không gian ngưỡng giá trị sử dụng khác cho tổng số 64 hệ số DCT
Lượng tử hố q trình làm giảm tầm quan trọng trình DC Lượng tử hoá làm giảm tầm quan trọng DC hệ số AC để
giảm băng thông
Các tính tốn hệ số lượng liên quan đến việc phân chia hệ
(32)3.4.5 JPEG(cont.)
Chúng ta suy từ số quantization error tối đa cộng
(33)3.4.5 JPEG(cont.)
(34)3.4.5 JPEG(cont.)
Entropy Coding :
Giai đoạn mã hóa liệu ngẫu nhiên bao gồm bước sau:
1 Vectoring
(35)3.4.5 JPEG(cont.)
Các thuật tốn mã hóa liệu Entropy hoạt động ma trận
chiều một véc tơ Tuy nhiên, sản lượng lượng tử 2-D.Vì vậy, giá trị đại diện hình thức đơn kích thước véc tơ
Ngoài ra, tất hệ số tần số cao trình tự để làm cho hình thức
đại diện thích hợp cho nén
(36)3.4.5 JPEG(cont.)
(37)3.4.5 JPEG(cont.)
Differential encoding :
Các giá trị luôn liên quan tới
Các giá trị khác sau mã hóa ttheo định dạng (SSS, giá trị) + Trường SSS cho biết số bit cần thiết để mã hóa giá trị
+ Trường giá trị bit thực tế đại diện cho giá trị
(38)(39)3.4.5 JPEG(cont.)
Như thấy:
Số lượng bit cần thiết để mã hóa giá trị xác định độ lớn
của
Các giá trị âm mã hóa bít nhị phân khơng dấu Các giá trị dương giá trị chúng
lưu ý giá trị khơng mã hóa cách sử dụng bit
(40)(41)3.4.5 JPEG(cont.)
Huffman encoding :
Nén thu cách thay chuỗi dài chữ số nhị phân
của chuỗi codewords ngắn nhiều, (liên quan tới tần số xuất hiện)
Huffman thuật tốn mã hóa.Giống mã hóa Differential mã hóa vi sai
bằng cách thay codeword ngắn
Đối với hệ số DC mã hóa Differential bít trường SSS khơng
(42)(43)3.4.5 JPEG(cont.)
(44)(45)3.4.5 JPEG(cont.)
Giải thích ví dụ 3.8 sau
Để giải mã luồng bít nhận bên nhận tìm bit trái cho
codeword hợp lệ
Trường SSS dùng để xác định số bit trường giá trị mã hóa vi sai
sau đọc giải mã q trình lặp lặp lại tới bit cuối nhận (EOB)
Bởi việc sử dụng codewords có chiều dài thay đổi giai
(46)(47)3.4.5 JPEG(cont.)
Frame Building : Frame Header :
+ Nói chung chiều rộng chiều cao hình ảnh pixel
+ Số lượng loại thành phần sử dụng để biểu diễn cho
hình ảnh (CLUB, RGB, YCbCr)
+ Số hóa liệu định dạng sử dụng: (4:2:2,4; 2, 0, vv) Scan Header :
+ Xác định thành phần (RGB vv)
+ Số lượng bit sử dụng để số hóa thành phần
(48)(49)(50)