Đồng thời giải thuật nâng cao chất lượng ảnh giải nénJPEG sử dụng bộ lọc fuzzy cải thiện đáng ké chất lượng hiền thị so với các giải thuậtkhác đã được đề xuất trước đây.. Điều nay sẽ làm
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA
ở
NGUYEN MINH HAI
LUONG ANH NEN
CHUYEN NGANH: KY THUAT DIEN TU
MA SO: 60.52.70
LUAN VAN THAC SI
TP HO CHI MINH — 07/2014
Trang 2TRƯỜNG ĐẠI HỌC BACH KHOA —ÐĐHQG -HCM
Cán bộ hướng dẫn khoa học: TS Võ Trung Dũng
(Ghi rõ họ, tên, hoc ham, học vi và chữ ký)
Cán bộ cham nhận xét 1: PGS TS Lê Tiến Thường
(Ghi rõ họ, tên, hoc ham, học vi và chữ ký)
Cán bộ chấm nhận xét 2: PGS TS Đặng Thành Tín
(Ghi rõ họ, tên, hoc ham, học vi và chữ ký)
Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHỌG Tp HCMngày 15 tháng 7 năm 2014
Thành phan Hội đồng đánh giá luận văn thạc sĩ gồm:(Ghi rõ họ, tên, học hàm, học vi của Hội đồng châm bảo vệ luận văn thạc sĩ)
1 TS Vũ Phan Tu2 TS Hà Hoàng Kha
3 PGS TS Lê Tiến Thường
4 PGS TS Đặng Thành Tín5 TS Võ Trung Dũng
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên
ngành sau khi luận văn đã được sửa chữa (nêu có).
CHỦ TỊCH HỘI DONG TRƯỞNG KHOA ĐIỆN-ĐIỆN TỬ
Trang 3TRƯƠNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự do - Hạnh phúc
NHIỆM VỤ LUẬN VĂN THẠC SĨHọ tên học viên: Nguyễn Minh Hải MSHV: 11140013
Ngày, tháng, năm sinh: 09/01/1984 Nơi sinh: Lâm ĐôngChuyên ngành: Kỹ Thuật Điện Tử Mã số: 605270I TÊN ĐÈ TÀI: Xây dựng ban đồ nhiễu blocking và ringing ứng dụng trong nâng
cao chât lượng ảnh nén
Il NHIEM VỤ VÀ NỘI DUNG:
e Khảo sát các dạng nhiễu (artifact) trong quá trình nén ảnh JPEG
e Xây dựng bản đồ nhiễu gây ra bởi quá trình nén JPEG bao gồm nhiễu blocking
_ Tp HCM, ngay tháng năm 2014
CAN BO HUONG DAN CHU NHIEM BO MON ĐÀO TAO
(Họ tên va chữ ky) (Họ tên và chữ ký)
TRƯỞNG KHOA ĐIỆN - ĐIỆN TỬ
(Họ tên và chữ ký)
Ghi chú: Học viên phải đóng tờ nhiệm vụ này vào trang đâu tiên của tập thuyết minh LV
Trang 4LỜI CÁM ON
Em xin gởi đến thay Ts Võ Trung Dũng lời cảm ơn chân thànhvới sự trân trọng và lòng biết ơn sâu sắc về sự hướng dẫn đâychu đáo và nhiệt tình Thay đã dẫn dắt, tạo cho em cách tư duyva làm việc một cách khoa học, hướng em đến các dé tài khoahọc mới mỏ, tiếp cận với các công nghệ hiện đại
Em xin chân thành cẩm ơn các thầy cô ngành Kỹ Thuật Điện Tửđã hết lòng dạy dỗ và truyền đạt cho em những kiến thức quý
báu.
Con xin gởi đến cha mẹ lòng kính trọng và biết ơn sâu sắc nhất.Cha mẹ đã nuôi nấng, dạy dỗ con nên người và là chỗ dựa tỉnhthần vững chắc cho con trong cuộc đời
Tôi xin cẩm ơn các bạn đã cùng học tập, giúp đỡ, động viên và
cùng tôi bước trên con đường nghiên cứu này.
Tp Hồ Chí Minh, tháng 7 năm 2014
Học viên
Nguyễn Minh Hải
Trang 5Trong luận văn này, các dạng nhiễu gây ra bởi quá trình nén ảnh JPEG đặc biệt là khi
được nén ở các tốc độ bít thấp được xem xét Hai dạng nhiều ảnh hưởng lớn đến chấtlượng hiển thị của ảnh nén ở tốc độ bít thấp là nhiễu blocking và nhiễu ringing Luậnvăn sẽ nghiên cứu xây dựng các bản đồ hai loại nhiễu này này Các đặc tính mặt nạcủa hệ thống thị giác người cũng được xem xét ở đây nhăm nâng cao tính chính xáccủa giải thuật xây dựng bản đồ nhiễu Khi các vùng nhiễu đã được định vị, bộ lọcfuzzy thích nghi được sử dụng để làm giảm nhiễu Đối với nhiễu blocking, bộ lọcfuzzy một chiều được sử dụng Còn đối với nhiễu ringing, bộ lọc hai chiều sẽ đượcsử dụng Kết quả thử nghiệm cho thây giải thuật xây dựng bản đồ nhiễu phát hiện kháchính xác các vùng nhiễu Đồng thời giải thuật nâng cao chất lượng ảnh giải nénJPEG sử dụng bộ lọc fuzzy cải thiện đáng ké chất lượng hiền thị so với các giải thuậtkhác đã được đề xuất trước đây Kết quả tính toán PSNR và SSIM cũng chứng tỏ giảithuật đề xuất trong nghiên cứu này hiệu quả hơn so với các giải thuật khác đã được
nghiên cứu trước đây.
ABSTRACT
In this thesis, the artifact caused by JPEG compression, especially when compressedat low bit rates will be considered Two compressed artifacts that greatly affect thedisplayed quality of compressed images in low bit rates are blocking and ringingartifacts The thesis will investifate the processes to build the artifact maps for thesetwo artifacts The masking properties of human visual system are considered here inorder to improve the accuracy of the algorithm After the artifacts have been located,adaptive fuzzy filter 1s used to remove the artifact For blocking artifact, one-dimensional fuzzy filter will be used For ringing artifact, two-dimensional fuzzyfilter will be implemented Experimental results show that the artifact mapcontruction algorithms can effectively detect the artifact regions Simultaneously, theproposed algorithm using fuzzy filter can help improving decompressed imagequality significantly compared to other previous algorithms Calculated results of thePSNR and SSIM also demonstrate that the proposed algorithm is more effective thanother algorithms.
Trang 6Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả Các kết quảnghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ batkỳ một nguồn nào và dưới bat kỳ hình thức nào Việc tham khảo các nguôn tài liệu(nếu có) đã được thực hiện trích dẫn và ghi nguôn tài liệu tham khảo đúng theo yêu
cau.
Tac gia luan an
Nguyễn Minh Hải
Trang 7DANH MỤC HINH VẼ - ST E1 1EE1112111121111111 1111 11101 11101110111 rsa ivDANH MỤC BANG BIEU -.- - 1 SE 1 1E111121111211111 21111 11111011111 yg viDANH MỤC TỪ VIET TẮTT 52k EE E11 1E1111111211111111 11111111111 11 ru viiChương 1 MỞ ĐẦU - + 1 1 11 E2 111E12111111Ẹ1111111101 E1 111111 111111 eg |1.1 Giới thiệu để tài s ST 1 1E 1121111111112 111111121111 En roi |12 Mục tiêu dé tài - ST 1 1 E112 21111211111 thui |1.3 Câu trúc luận văn + sTs 1EEEE111E11111111111112111111 211111011 tri |Chuong2 TONG QUAN TINH HINH NGHIÊN CỨU -2-7s+x+cczzxce 32.1 Chuẩn Nén Ảnh JPEG vocccciccccccccscccscescscsssscscssssssessvsssetsesessvsesecevssessnsenevees 32.1.1 Chuyên đổi không gian mau occ eccccccsecsecscsesececsceteececevsvsesesevseeeees 42.1.2 Giảm mẫu thành phần mau ccc ccccccccsecesecsesesessescsesesecevsvseeeseeseeeees 42.1.3 Biến đổi cosin rời LAC Lc eccecccccccecccceccssscsssecsesetsssacsevesesacstcatstcssvacseeceteeeens 6
2.1.4 Lượng tử hoa cecccccccccscsesscsessssesesecsessesecsvsecsssecsscevsesevsesevsetstsesseseeees 6“h9 742 ⁄/ 15 ẢẢ 7
2.1.6 Mã hóa độ sai biệt của các hệ số DC 5c c2 12211121 Ecrxe 82.1.7 Mã hóa độ dai chạy (RLE) các hệ số AC oooceececccccscsessesesesesessesvssetseeees 8
2.1.8 Ma hóa Huffman cceeeceseeeeeceecccesssessssseuaaeeeeeeseeseeesess 9
2.2 Các Dạng Nhiéu Lam Giảm Chat Lượng Ảnh Nén JPEG 10
2.2.1 Nhiễu blocking - cà ST E18111110 811111111111 kg 112.2.2 Nhiễu ringing ee eee cececececce cece ceeseececececeeeceveveteeetevesevevevetesesesesesesesen 12
2.3 Kỹ thuật nâng cao chất lượng ảnh nén - eeeceseesesesececseseeeeeseseees 12
2.3.1 Làm giảm nhiễu blocking - 5c S11 11212311111121111111 111111 EeC 12
2.3.1.1 Phương pháp sử dụng khối chong lân - 5s s+s+zvzszszx+2 13
2.3.1.2 Giải thuật hậu xử lý làm giảm nhiễu blocking 5-5-5: 15
2.3.2 Làm glảm TITBITĐ - 11112121111 111113581 1111115881111 xke 19
Trang 8¬— cece ee eee ee eeesaeeeesaeeeesaeeeesGeeeCA GEES EA EECCA GEE CEA GEE SEA GEC SEAGECctAGEESEaGEeetaGEeetaGeeenaaeeena: 202.3.2.2 Phương pháp su dung bộ loc fuzzy định hướng 21
Chuong 3 XÂY DỰNG BAN ĐỎ NHIÊU BLOCKING VA RINGING 243.1 Mô hình hệ thống thi giác trong xử lý AM oo ceeeeceeceeeeseseeseeeeeeeeeeees 243.1.1 Đặc tính hệ thống thị giác của con người s-s+scxcrersrxererered 243.1.2 Mối liên hệ giữa HVS và đặc tính không gian của ảnh nén JPEG 253.1.2.1 Cạnh thuộc đường bao khối - ¿2 scs x+x‡EEEEEEEEEEEererkrkea 253.1.2.2 Khoảng cách giữa hai cạnh liên tiếp cùng khối - 263.1.2.3 Hiệu ứng mặt nạ miền không gian của ảnh eee 293.2 Bản đồ nhiễu Blocking 5: c3 E1 1111111111111 1111 EErrrei 32
3.2.1 Xác định vùng nhiễu blocking 5c sSs SE EEEEErrrrg 333.2.2 Ước lượng mức độ nhiễu blocking ¿+ + 2S ‡E‡E‡EexrxeEekekrxes 353.2.2.1 Nhiễu blocking cục bộ - s s1 EE E11 E11 rrưg 35
3.2.2.2 Ảnh hưởng của hiệu ứng mặt nạ vùng chỉ tiẾt s55: 363.2.2.3 Ảnh hưởng của hiệu ứng mặt nạ độ chói -s+s+s+zzs+xz2 373.3 Bản đồ nhiễu ringing 5s 1 x11 E1 1111E1E111111111111111E1 11 EErrtei 38
3.3.1 Xác định vùng nhiễu ringing -s sc SE Ea 393.3.2 Ước lượng mức độ nhiễu ringing ¿+ + 2S cE‡E‡EEkrkekrkekrke 413.3.2.1 Cường độ nhiễu ringing cục bộ ¿+ c sSS tt rrerg 41
3.3.2.2 Ảnh hưởng của hiệu ứng mặt nạ vùng chỉ tiẾt 5-5: 423.3.2.3 Ảnh hưởng của hiệu ứng mặt nạ độ chói s+s+c+zzs+sz2 43Chương 4 UNG DỤNG BẢN ĐỎ NHIÊU NANG CAO CHAT LƯỢNG ANH
NEN JPEC Q20 111211112 111121 1110111111111 E9 1E KH KHE k KH KHE kg 444.1 Bộ (0008 LL A TQ HH HS HH TT TT HT KHE 44
4.2 Làm giảm blocking băng bộ lọc fuzzy một ChidU ¿52 csczscs¿ 464.3 Làm giảm ringing băng bộ loc fuzzy hai chiểu 5-5 sccsczxcxezere2 47
Trang 95.2 Kết quả làm giảm blocking bằng bộ lọc fuzzy 1D - 7-55 cc2ccccc 515.3 Kết quả xây dựng bản đồ nhiễu ringing oo ccc ecceeeeseseeeseseseseeeeeeeen 575.4 _ Kết quả làm giảm nhiễu ringing c2 5s EEEESEEEEEEEEEEEEEEEEEEEkskrkee 58Chương6 KẾT LUẬN VÀ HUONG PHAT TRIỂN 7255ccccscxcrsrxzrrred 606.1 Kết Lutron ccc cscsscscsscscssscscssescssecsvsseusasevsvsusecsesavevssevevseseessesevees 606.2 Hướng Phát Triển Dé Tài - S1 1 1E 1E11151E1E712111E211111111 E1 tte 60TÀI LIEU THAM KHẢO - 5S s Es 1EE121E1121E11111101111012111 0111011 1tr 61LY LICH TRÍCH NGANG oioecceccecsecscsscscscseesessesesevsessessestsevsssetsessesesesssesseneeseveess 64
Trang 10Hình 2.1 — Sơ đồ khối bộ mã hóa JPEG 2: S1 1 1E 121111212211121E1111E111x 1c 3Hình 2.2 — Sơ đồ khối bộ giải mã JPEG - SE 121 1221112111111 11 xe 4
Hình 2.3 — Ba định dạng màu thường được sử dụng trong nén JPEG 5
Hình 2.4 — Ảnh lena với các định dang màu khác nhau - -<<+++5: 5
Hirh 2.5 — Quet 218 -ZaG 0 aAdlA_¬ aăãẴ 8
Hình 2.6 — Mã hóa các hệ số DC của các khối 8x8 liên tiếp ooo ceeeeeeeseeeeeeeeees 8
Hình 2.7 — Nhiéu blocking do nén JPEG với các mức độ khác nhau IIHình 2.8 — Nhiéu ringing trong ảnh nén JPEG 2 - + £E£E2E2E2EzErEerrree 12
Hình 2.9 — Giải thuật tính toán nhanh LOT với kích thước khối là 8x8 14Hình 2.10 — Lưu đồ tính toán nhanh LOT cho toàn bộ chuỗi dif liệu - 15Hình 2.11 — Ví dụ về khối dịch chuyển ðj“,(0,v) .-2cc2ccccccsrrcree 17
Hình 2.12 — Hai ví dụ của khung deblocking B(Sr }xe - 222cc cccS<<ss2 19
Hình 2.13 — Giải thuật nâng cao chat lượng ảnh nén băng ban đồ phương sai va bộloc fuzzy đồng nhât - - 5c t1 E111151E11111111 11111111 1111111011111 1tr 20Hình 2.14 — Vi dụ về suy giảm chất lượng có hướng - + s+x+xercrxzxcxee 21Hình 2.15 — Tham số phân bồ của bộ lọc fuzzy định hướng -5- s5 22
Hình 2.16 —- Góc Ø và @ của bộ lọc fuzzy định hướng -c5+s-<ss>› 23
Hình 2.17 — Lưu đồ bộ lọc fuzzy định hướng 5-52 SSE‡E‡EE2EEEEEeErrkekered 23Hình 3.1 — Cạnh năm trên đường bao khối 8xÑ + x+xcE‡EEE+E2E£EEE+Ezxre 25Hình 3.2 — Khoảng cách giữa hai cạnh là một điểm ảnh - 2 scccszccce2 26Hình 3.3 — Khoảng cách giữa hai cạnh liên tiếp là hai điểm ảnh - 27Hình 3.4 — Khoảng cách giữa hai cạnh liên tiếp là ba điểm ảnh -. -¿ 27Hình 3.5 — Khoảng cách giữa hai cạnh liên tiếp là bốn điểm ảnh 28Hình 3.6 — Ảnh hưởng của hiệu ứng mặt nạ vùng chi tiết kết cấu -.- se san ce: 29Hình 3.7 — Độ chênh lệch mức xám hai bên cạnh bằng 15 - 25x55 30Hình 3.8 — Độ chênh lệch mức xám hai bên cạnh bằng TẾT LG n HH HH TT ren 30Hình 3.9 — Độ chênh lệch mức xám hai bên cạnh bằng 150 - 25-555 31Hình 3.10 — Độ chênh lệch mức xám hai bên cạnh bang 195 -2-5- s5 31Hình 3.11 — Độ chênh lệch mức xám hai bên cạnh bang 255 - 2-5-5 5 32Hình 3.12 — Sơ đồ khối giải thuật xây dựng bản đồ nhiễu blocking 33Hình 3.13 — Lưu đô giải thuật phát hiện nhiễu blocking - 52 5s+szscs 34
Trang 11thăng đứng - - s tt E1 111111 1111111 11111101 1111111011111 11111111 rreg 36
Hình 3.15 — Sở đồ khối giải thuật xây dựng bản đồ nhiễu ringing 38
Hình 3.16 — So sánh bộ tiền lọc tăng cường cạnh Guided va Gaussian 40
Hình 3.17 — Miền nên cục bộ của điểm ảnh thuộc vùng nhiễu ringing 42
Hình 4.1 — Sơ đồ khối hệ thống nâng cao chất lượng ảnh nén thông thường 44
Hình 4.2 — Sơ đồ khối hệ thống nâng cao chất lượng ảnh nén dé xuắt 44
Hình 4.3 — Lưu đồ giải thuật làm giảm nhiễu blocking 2 +scczsz+xzxcc 47Hình 4.4 — Lưu đồ giải thuật làm giảm nhiễu ringing cece + scx2x xxx 48Hình 5.1 — Kết quả xây dựng bản đồ nhiễu blocking cho ảnh mobile 49
Hình 5.2 — Kết quả xây dựng bản đồ nhiễu blocking cho ảnh lena 50
Hình 5.3 — Bản đồ cường độ nhiễu blocking - -sSExcE‡E‡EEEEEE2EeEEEzEexre 51Hình 5.4 — Chat lượng hiền thi của ảnh nén lena với các giải thuật deblocking khác¡00 ằ ` ằ 52Hình 5.5 — Chất lượng hiển thị ảnh nén mobile với các giải thuật deblocking 53Hình 5.6 — Tap anh gốc sử dụng trong mô phỏng ¿2 k+svEEE+E+E£EEE+xzxre 54Hình 5.7 — PSNR theo tốc độ bit của ảnh mobile với các giải thuật xử lý khác nhau
Trang 12Bang 2.1 — Bang phân nhóm giả tri và từ mã c2 2222111111122 1xSxxxea 9
Bảng 2.2 — Bang mã hoa Huffman các hệ số AC thành phan độ chói 10
Bảng 2.3 — Bảng mã Huffman hệ số DC thành phân độ chói 5-5 55¿ 10Bảng 5.1 — So sánh PSNR của các giải thuật làm giảm nhiễu blocking 56
Bảng 5.2 — So sánh SSIM của các giải thuật làm giảm nhiễu blocking 56
Bảng 5.3 — So sánh PSNR đối của các giải thuật làm giảm ringing 59
Bảng 5.4— So sánh SSIM đối của các giải thuật làm giảm ringing 59
Trang 13SSIMWSSAP
Adaptive Separable Median FilterDiscrete Cosine Transform
End of BlockHuman Visual SystemJoint Photographic Expert GroupLapped Orthogonal TransformMoving Picture Experts GroupPeak Signal to Noise RatioRank Conditioned Rank SelectionRun-length Encoding
Structural SIMIlarityWeighted Sums of Symmetrically Aligned Pixels
Trang 14Chuong 1 MỞ ĐẦU1.1 Giới thiệu đề tài
Cùng với sự phát triển mạnh mẽ của mạng internet với các mạng xã hội, nhu cầu chiasẻ và lưu trữ hình ảnh, video clip của người dùng ngày càng tăng nhanh Đề đáp ứngđược nhu cau ngày càng gia tăng mà không cần tăng băng thông cũng như dung lượnglưu trữ, vốn là tài nguyên hữa han Các chuẩn nén thường được sử dụng dé làm giảmdung lượng của ảnh như JPEG [1] và video như H.263 [2], MPEG-x nhăm giảm dunglượng lưu trữ và nhu cầu băng thông cần thiết khi truyền qua mạng Biến đổi cosin
rời rac (DCT) thường được sử dụng như là công cụ chính trong những giải thuật nén
trên nhờ khả năng tập trung năng lượng cao của nó Tuy nhiên để đạt được tỉ số néncao và số lượng bit cho mỗi điểm ảnh thap các giải thuật nén phải loại bỏ nhiều thôngtin dư thừa hơn Điều nay sẽ làm giảm chất lượng hién thị của ảnh do các dạng nhiễusinh ra trong quá trình nén như: nhiễu blocking, nhiễu ringing Các dạng giảm chấtlượng này gây khó chịu đối với thị giác đặc biệt là khi nén với tốc độ bít thấp Trongsố các dạng nhiễu do nén thì nhiễu blocking va ringing là thường gap nhất và cũngcó ảnh hưởng lớn đến cảm nhận hình ảnh Do đó nâng cao chất lượng ảnh và videonén là nhu cầu cấp thiết nhăm cải thiện chat lượng hiển thị của ảnh và video nén vớitốc độ bít thấp Việc định vị được vùng nhiễu là bước đi đâu tiên, quan trọng ảnhhưởng lớn đến khả năng loại bỏ nhiễu và nâng cao chất lượng hiện thị Đó cũng chínhlà lý do “xây dựng bản đồ nhiễu blocking và nhiễu ringing ứng dụng trong nâng caochất lượng ảnh nén” được chọn làm đề tài luận văn thạc sĩ này
1.2 Mục tiêu đề tàiTrên cở sở những báo cáo khoa học liên quan tìm hiểu đề xuất giải thuật phát hiện,xây dựng ban đồ nhiễu gây ra bởi quá trình nén JPEG bao gồm nhiễu blocking vanhiễu ringing Trên cơ sở bản đồ nhiễu đã xây dựng, dé xuất giải thuật nâng cao chat
Trang 15VY Chương 2 — Giới thiệu chuân nén ảnh phô biến JPEG, các dạng nhiễu gây ra
do quá trình nén, nguyên nhân của các dạng nhiễu và khảo sát các nghiên cứu
nâng cao chất lượng giảm nhiễu do nén đã được báo cáo trong các tải liệu
Y Chương 3 — Khao sát các đặc tính mô hình thị giác người (HVS) ảnh hưởng
đến mức độ hiển thi của các dạng nhiễu gây ra trong qua trình nén Trên cơ sởđặc điểm xuất hiện của nhiễu gây ra do nén và đặc tính hệ thông HVS đối vớinhiễu dé xuất cách thức định vị các dạng nhiễu va cách thức ước lượng mức
*x Chương 6 — Trinh bày kết luận dé tài va đề xuất hướng phát triển
Trang 16Chuong 2 TONG QUAN TINH HÌNH NGHIÊN CỨU
2.1 Chuan Nén Anh JPEGJPEG (Joint Photographic Expert Group) [1] [3] là tên của một tổ chức nghiên cứuvề các chuẩn nén ảnh được thành lập vào năm 1982 Năm 1986, JPEG chính thứcđược thiết lập nhờ sự kết hợp giữa nhóm ISO/IEC và ITV Tiêu chuẩn này đã đượcứng dụng trong nhiều lĩnh vực như: lưu trữ ảnh, Fax màu, truyền ảnh báo chí, ảnhcho y học, camera số
Chuan nén JPEG có thé thực hiện bởi bốn phương pháp mã hóa đó là:e Mã tuần tự (sequential DCT-based): ảnh được mã hóa theo kiểu quét từ trái
qua phải, từ trên xuống dưới dựa trên biến đôi DCT của các khối.e Mã hóa lũy tiến (progressive DCT-based): anh được mã hóa băng kiểu quét
phức hợp theo chế độ phân giải không gian.e Ma hóa không tốn that (lossless): ảnh được đảm bảo khôi phục chính xác cho
mỗi giá trị mau của nguồn Thông tin không can thiết mới cắt bỏ cho nên hiệuquả nén thập hon so với phương pháp có tôn that
e Mã hóa phân cấp (hierarchical): ảnh được mã hóa ở chế độ phân giải khônggian phức hop, để cho những ảnh có độ phân giải thap có thé được truy xuấtvà hiển thị mà không can giải nén như những ảnh có độ phân giải trong không
gian cao hơn.
BG
Re Chuyén sang Giảm mẫu thành
> tọa độ màu > phần màu v
Ảnh YVU (4:2:2 hoặc 4:2:0) FDCT |
> Quét zigza > Ma hoas86 Huffman
>| Lượngtử — Chuỗi bit
3 _| Mã hóa độ sai _| Mãhóa
biệt DC HuffmanBảng lượng tử
Hình 2.1 — Sơ đô khối bộ mã hóa JPEG
Trang 17Giải mã _| Quét Zigzag
Huffman nguoc
Chuỗi bit "| Giải lượng tử [>
Giải mã ¬ +Huffman Giải mã DC
- 8X8 Nang mau thanh Chuyén doi a
phan mau sang tọa độ ' Ảnh giải
IDCT (4:2:2 hoặc 4:2:0) mau RGB nén
Hình 2.2 — Sơ đồ khối bộ giải mã JPEGTrong số các phương pháp mã hóa JPEG thì mã hóa có tổn hao được sử dụng phốbiến nhất Hình 2.1 và Hình 2.2 trình bay cau trúc bộ mã hóa và giải mã JPEG có tonhao Phân tiếp theo sẽ đề cập chỉ tiết từng khối trong quá trình nén JPEG
2.1.1 Chuyến đỗi không gian màuĐề đạt được hiệu suất nén cao, dau tiên sự tương quan giữa các thành phần màu cầnđược giảm xuống băng các chuyền đôi từ không gian màu RGB sang không gian mau
không tương quan như YC;C> theo công thức sau:
Y 0.299000 0.587000 0.114000 || R 0
C, |=| —0.168736 —0.331264 0.500002 || G |+|125 (2.1)
C, 0.500000 —0.418688 —0.081312 || B 128
Quá trình chuyển đổi ngược từ không gian mau YC;C; sang không gian mau RGB
được thực hiện như sau:
(a) Định dạng 4:4:4: thành phần độ chói và thành phần màu có cùng độ phân giải
ở cả hai chiêu.
Trang 18(b) Định dạng 4:2:2: thành phần màu có cùng độ phân giải với thành phần độ chóiở phương thắng đứng và bằng một nửa ở phương ngang.
(c) Định dạng 4:2:0: độ phân giải của thành phần màu ở cả hai chiều đều bằngmột nửa so với thành phan độ chói
(a) Ảnh gốc lena (b) Ảnh lena hệ màu YCbCr
(c) Ảnh lena YCbCr4:2:2 (d) Anh lena YCbCr 4:2:0Hình 2.4 — Anh lena với các định dang màu khác nhau
Trang 192.1.3 Biên đôi cosin ròi rac
Bước tiếp theo của quá trình nén JPEG là thực hiện biến đổi cosin rời rac (DCT:Discrete Cosine Transform) Đề thực hiện biến đổi DCT, ảnh được chia thành cáckhối 8x8 Quá trình chia ảnh thành khối được thực hiện từ trái sang phải từ trên xuốngdưới Định nghĩa toán học của biến đổi DCT như sau:
Biến đổi DCT thuận:
7 7 ]
F(uv)= CWCOYY fx, »)eos| SA | =—=— (2.3)
x=0 y=0
1/42 với k=0Voi u=0, ,7, v=0, ,7 Va C(k) =
Trang 20Mục dich của quá trình lượng tử là làm giảm hau hết các hệ số DCT tần số cao khôngquan trọng về giá trị 0, càng nhiều hệ số DCT bằng 0 thì ty số nén sẽ càng cao Déđạt được điều nay ma trận lượng tử Q thường có giá trị nhỏ ở phan góc trái phía trênvà giá trị lớn ở phần góc phải phía dưới Trong quá trình giải lượng tử, mặc dù cácthành phan tan số cao bị loại bỏ, biến đổi DCT ngược vẫn có thé xấp xỉ gần đúng matrận của khối ban đầu Chuan JPEG giới thiệu ma trận lượng tử chuẩn hóa đạt đượchiệu quả cao gan với điều kiện tôi wu cho thành phan độ chói và thành phan màu như
công thức (2.9) và (2.10)
l6 11 10 16 24 40 51 6l12 12 14 19 26 58 60 55l4 13 16 24 40 57 69 5614 17 22 29 51 87 80 62 (2.9)18 22 37 56 68 109 103 77
24 35 55 64 81 104 113 9249 64 78 87 103 121 120 10172 92 95 98 112 100 103 9917 18 24 47 99 99 99 9918 21 26 66 99 99 99 9924 26 56 99 99 99 99 9947 66 99 99 99 99 99 99 (2.10)
99 99 99 99 99 99 99 9999 99 99 99 99 99 99 9999 99 99 99 99 99 99 9999 99 99 99 99 99 99 99
Tuy nhiên, Các mức độ nén khác nhau (tương ứng với các hệ số chất lượng q khácnhau) có thé đạt được bằng cách nhân ma trận lượng tử chuẩn với một hệ số K được
xác định như sau:
_= q>5050 (2.11)
K=—, q<50q
2.1.5 Quét Zig-Zag
Sau khi thực hiện biến d6i DCT va lượng tử các giá trị của khối 8x8, chúng ta sẽ cónhững khối 8x8 mới Sau đó, khối 8x8 sẽ được quét zig-zag như Hình 2.5 Sau khithực hiện quét zig-zag, chung ta sẽ được một véc tơ với 64 hệ số (0,1 ,63) Mục
Trang 21đích của việc quét zig-zag là nhằm sắp xếp các thành phan tan số không gian theo thứtự tăng dan.
Trang 22thi từ mã EOB sẽ được su dụng ở vi trí đó EOB tương ứng với (0, 0).2.1.8 Mã hóa Huffman
Thay vì lưu trữ giá trị thực, để làm giảm tối đa kích thước ảnh chuẩn JPEG thực hiệnphân loại giá trị thành từng nhóm và lưu trữ chỗi bít biểu diễn giá trị như Bang 2.1
Bang 2.1 — Bang phán nhóm giả trị và từ mã
Nhóm Giá trị Chuỗi bít mã hóa giá trị
| -1,1 0,12 -3,-2,2,3 00,01,10,113 -7,-6,-5,-4,4,5,6,7 000,001,010,011,100,101,110,1114 -15, ,-8,8, ,15 0000, ,0111,1000, ,11115 -31, ~16,16, 31 00000, ,01111,10000, ,111116 -63, -32,32, 63 000000, ,011111,100000, ,1111117 -127 ,-64,64., ,127 0000000 0111111,1000000, ,11111118 -255, ,-128,128, ,255
9 -511, -256,256, 51110 -1023 -5 12,5 12 102311 -2047 -1024.1024 2047
Với các hệ số AC như ví dụ ở phan 2.1.7:
(0,57) ; (0,45) ; (4.23); (1,-30); (0,-8); (2,1) ; (0,0)
Chúng ta chi ma hóa gia trị bên phải Vi dụ gia trị 57 thuộc nhóm 6 va chỗi bít mã
hóa của nó là 111001, nên chúng ta sẽ mã hóa giá tri 57 thành 6,111001 Tướng tự
cho các giá trị khác chúng ta có thê viết lại chuỗi mã hóa các hệ số AC như sau:
(0,6,111001) ; (0,6,101101) ; (4,5,10111); (1,5,00001) ; (0/4/0111); (2,1,1); (0,0)
Hai giá trị đầu trong dâu ngoặc don có thé biéu diễn thành hai byte bởi vi giá trị củanó năm trong tam 0, 1, 2 15 Chuỗi bit tạo bởi 2 byte này được mã hóa Huffman
Trang 23như Bang 2.2 Vi dụ mã Huffman cua byte (0,6) là 1111000, byte (4,5) là
1111111110011000, như vậy chuỗi bit duoc lưu trữ trong file JPEG cho 63 hệ số
AC của vi du trên sé là:1111000 111001, 1111000 101101, TIIIIIIIIOOIIOOO 10111, 1111111011000001, 1011 O111, 11100 1, 1010
Bang 2.2 — Bang mã hóa Huffman các hệ số AC thành phan độ chói
run/category Độ dai từ ma Tu ma
0/0 4 10100/6 7 11110000/10 16 1111111110000011
1/1 4 1100A/5 16 111111111001100015/10 16 1111111111111110
Đối với độ sai biệt của các hệ số DC liên tiếp, độ sai biệt được biéu diễn ở dang phân
nhóm và giả tri bit sau đó được mã hoa Huffman như Bang 2.3 Ví dụ độ sai biệt hệ
số DC băng -511, nó sẽ được biểu diễn thành (9,000000000) và chuỗi bit được lưutrữ trong file JPEG cho hệ số DC sẽ lả: 1111110 000000000
Bang 2.3 — Bang mã Huffman hệ số DC thành phần độ chóiNhóm Đô dài từ mã Từ mã
0 2 001 3 0102 3 0113 3 1004 3 1015 3 1106 4 11107 5 111108 6 1111109 7 111111010 8 11111110
2.2 Các Dang Nhiễu Lam Giảm Chat Lượng Anh Nén JPEGNhiễu do nén anh là kết quả tác động của các co chế nén anh có ton hao lên dữ liệuảnh Các cơ chế nén thường loại bỏ đi một số thông tin dư thừa nhằm làm giảm dung
Trang 24lượng lưu trữ Tuy nhiên, trong quả trình giải nén các thông tin dư thừa không được
khôi phục hoặc làm sai biệt một sỐ thông tin dữ liệu ảnh Do đó, Quá trình nén thườngtạo ra một số dạng nhiễu Các dạng nhiễu này gây ảnh hưởng đến cảm nhận hình ảnhcủa hệ thống thị giác người Hai dạng nhiễu phổ biến trong ảnh nén JPEG được trình
bày sau đây:
2.2.1 Nhiễu blocking
Nhiéu blocking là dang nhiễu thường gặp và cũng gây anh hưởng lớn nhất đối voicác cơ chế nén dựa trên các khối và sử dụng biến đổi DCT như nén JPEG Nhiễublocking là hiện tượng biến dạng xuất hiện trên bề mặt ảnh nén dưới dạng các khốiđiểm ảnh lớn bất thường làm giảm chất lượng và gây khó chịu đối với cảm nhận củamat người Khối ô vuông thường xuất hiện ở đường biên của các khối lân cận khichúng được xử lý độc lập và lượng tử các hệ số DCT một cách thô Điều này làm chocác thành phan tần số cao của các khối trong anh hay khung video bị loại bỏ va tạora một số nhiễu lượng tử đối với các thành phan tan số thấp
(c) Ảnh nén hệ số chất lượng q = 10 (d) Ảnh nén hệ số chất lượng q = 30Hình 2.7 — Nhiễu blocking do nén JPEG với các mức độ khác nhau
Trang 25Hình 2.7 miêu tả một ví dụ về nhiễu blocking trong nén JPEG với ảnh gốc “lena” vàcác ảnh nén với các mức độ khác nhau của nó Chúng ta có thể nhận thay có nhiềukhối 6 vuông trong ảnh nén khi hệ số chất lượng thấp (Hình 2.7 (a) và Hình 2.7 (b))và it được cảm nhận hơn khi hệ số chất lượng cao (Hình 2.7 (c)).
2.2.2 Nhiéu ringing
Trong xử ly ảnh số, nhiễu ringing xuất hiện như các tín hiệu giả gan các vùng có thayđổi lớn của tín hiệu Về mặt toán học nó được gọi là hiện tượng Gibbs Nó hiển thịdưới dạng vòng gan các cạnh của ảnh Nguyên nhân chính gây ra nhiễu ringing là domat hoặc bi sai lệch các thành phần tần số cao khi lượng tử các hệ số DCT với bước
lượng tử không min.
Hình 2.8 là vi dụ về nhiễu ringing trong ảnh nén JPEG Chúng ta có thé nhận thay
nhiễu ringing xuất hiện dọc theo đường biên giữa hai dải màu liên tiếp
(a) Ảnh gốc (b) Ảnh nén bị giảm chất lượngHình 2.8 — Nhiéu ringing trong ảnh nén JPEG
2.3 Kỹ thuật nâng cao chat lượng ảnh nén
2.3.1 Lam giảm nhiễu blocking
Đề làm giảm ảnh hưởng của nhiễu blocking, nhiều giải thuật đã được nghiên cứu đềxuất Chúng ta có thé chia chúng ra làm hai hướng giải pháp Hướng thứ nhất, làm
giảm ảnh hưởng của nhiễu blocking thực hiện ở bộ mã hóa Tuy nhiên, các phương
thức này không phù hợp với các chuẩn đã tồn tại như JPEG, MPEG do chúng làmthay đối cầu trúc bộ mã hóa và giải mã Ở hướng thứ hai, ảnh sau khi khôi phục sẽđược xử lý nhăm nâng cao chat lượng hiển thị mà không cần bat kỳ thay đổi nào ởbộ mã hóa hay giải mã Điều này làm nó phù hợp với các chuẩn mã hóa đã được đềcập ở trên Bởi vì ưu điểm này mà hâu hết các giải thuật được đề xuất gần đây đều đi
Trang 26theo hướng thứ hai Phan tiếp theo chúng ta sẽ xem xét một số giải pháp làm giảmnhiễu blocking đã được đề cập trong các tải liệu.
2.3.1.1 Phương pháp sử dụng khối chồng lanThông thường trong xử lý theo khối, ảnh thường được phân thành một số khối khôngchéng lấp va mỗi khối sẽ được chuyển đổi và lượng tử riêng lẽ Tác giả Malvar [4]dé xuất giải thuật dựa trên các khối chồng lấn nhau được gọi là biến đồi trực Ø1ao xếpchồng (LOT: Lapped Orthogonal Transform) Đối với LOT, các khối được chồng lấplên nhau một phần nhỏ vì vậy một số thông tin dư thừa về các điểm ảnh tại đườngbao của khối sẽ được truyền đi
Giả sử tín hiệu thời gian rời rac một chiều là chỗi của MN mẫu, với N là kích thướckhối và M là số lượng khối Chúng ta ký hiệu tín hiệu gốc là xo và hệ số biến đổi củanó là yo Mối quan hệ giữa xo và yo được biểu diễn trong công thức (2 13)
Tạ = Tx, (2.13)
Với 7 là ma trận chuyển đôi kích thước MNxMN
T= Ẫ (2.14)
Trong đó P,, h va P, là các ma trận kích thước LxN Ma trận P và P, được định
nghĩa khác với P, bởi vì 2 đường bao của khối gốc chỉ có một khối lân cận.Ma trận tự tương quan của tín hiệu đầu vào được ký hiệu là R
Trang 271 Na 2
20 0 DD) ạ 1 11! -!Ì0 Z
| 1 -I|Ì0 0.
Trong đó: Z = T7; -T,,; ¡.D, và D, là các ma trận kích thước NxN/2 chứa các hàm
số DCT chan và lẻ Ma trận xoay 7 được định nghĩa như sau:
Hình 2.9 — Giải thuật tính toán nhanh LOT với kích thước khối là 8x8
Trang 28Hình 2.10 trình bày lưu đồ tính toán LOT cho toàn bộ ảnh.
Hình 2.10 — Luu đô tính toán nhanh LOT cho toàn bộ chuỗi dữ liệu
Ky hiệu trong Hình 2.10 được định nghĩa như sau:
J= „ (2.20)
Với giải thuật tính toán nhanh LOT, chúng ta có thể tính toán các hệ số DCT của mỗikhối sau đó thực hiện các phép toán +/- va Z để có LOT Do đó, độ phức tap tính toancủa LOT là không quá cao so với DCT, mà có thể làm giảm blocking hiệu quả
2.3.1.2 Giải thuật hậu xử lý làm giảm nhiễu blocking
Các giải thuật hậu xử lý là những phương pháp phô biến nhất nhằm tăng chất lượnghình ảnh và video đồng thời làm giảm các ảnh hưởng khó chịu của nhiễu khối(blocking artifact) Mặt khác, các giải thuật hậu xử lý có thể đạt được mục tiêu làmgiảm nhiễu blocking mà không cần biết thông tin về ảnh và video gốc, vì vậy khônglàm thay đổi bộ mã chuẩn cho anh và video Phan này sẽ giới thiệu một số giải thuậthậu xử lý để làm giảm ảnh hưởng của nhiễu blocking Giải thuật hậu xử lý ảnh giảinén có thé thực hiện ở miền không gian hay miễn tần số Thuật ngữ mién không giandé cập đến bề mặt ảnh va với hướng tiếp cận này thi các giải thuật xử lý sẽ tác động
Trang 29lên từng điểm ảnh Phan lớn các kỹ thuật hậu xử lý được dé xuất trong các tài liệuđược thực hiện trong miền không gian Các kỹ thuật này có thể chia làm các nhóm
như sau:
Phương thức sử dụng bộ lọc thích nghĩ
Phương thức dựa trên lý thuyết ước lượng
Phương thức dựa trên POCS (Projections Onto Convex Sets)
Nhiéu blocking không liên tục dọc theo đường biên của khối, chúng có thé được xemnhư nhiễu tần số cao Để loại bỏ nhiễu này, sử dụng bộ lọc thông thấp sẽ là giải phápđơn giản nhất Phương thức sử dụng bộ loc bat biến miền không gian được dé xuấtlần đâu tiên bởi Reeve và Lim [5] Tác giả giới thiệu phương thức lọc miền khônggian Gaussian hai chiều 3x3 đối xứng trên các điểm ảnh dọc theo đường biên khối.Tuy nhiên, phương pháp này lại gây ra ảnh hưởng không mong muốn là làm ảnh bịnhòe Phương pháp sử dụng bộ lọc thay đổi không tuyến tính miền không gian đượcgiới thiệu bởi Ramamurthi và Gersho [6] thích ứng với nhiều dạng phổ tín hiệu cụcbộ nên nó có thé chỉ làm giảm nhiễu cục bộ ngoài dải Đối với mỗi pixel thuộc ảnh
trước tiên xác định nó thuộc vung đơn điệu hay vùng cạnh dựa trên các pixel baoquanh khối, việc xác định này được thực hiện một lần và quyết định cho tất cả cácpixel thuộc khối đang phân tích nhăm giảm khối lượng tính toán Nếu pixel thuộcvùng cạnh thì xác định hướng của nó Đề làm giảm suy giảm chất lượng dạng khối,giải thuật này sử dụng bộ lọc hai chiều (2-D) ở các vung xa cạnh và dùng bộ lọc 1chiều (1-D) song song cạnh với vùng gan cạnh của ảnh Tác giả Hsu va Chen [7] déxuất bộ lọc trung vị thích ứng (ASMF: Adaptive Separable Median Filter) giúp làmgiảm blocking mà vẫn duy trì độ sac nét của cạnh Trong phương thức được dé xuấtbởi Kuo và Hsieh [8], đầu tiên khối có sự hiện diện của blocking được định vị, sauđó bản đồ cạnh được tạo ra và sau cùng bộ lọc thích ứng theo bản đồ cạnh được thựchiện Bộ lọc này thực hiện lọc thông thấp đối với các điểm ảnh ở một bên của cạnhkhông tác động đến các điểm ảnh thuộc cạnh
Đề làm giảm ảnh hưởng của blocking mà vẫn duy tri được độ chi tiết của ảnh đòi hỏibộ lọc phải thích ứng với đặc tính thống kê cục bộ của ảnh Ý tưởng làm cho bộ lọc
thích ứng với đặc tính cục bộ của ảnh được thực hiện ảnh hưởng của hiệu ứng mặt
nạ Bởi vì thị giác của con người thường ít nhạy cảm với các dạng giảm chất lượngtrong vùng chỉ tiết hơn so với vùng trơn Nhận định trên là động lực cho nhiều phươngthức lọc thích nghi được nghiên cứu đề xuất Tác giả Kim [9] đề xuất phương thức
Trang 30lọc với hai chế độ lọc cho miền trơn và lọc cho các miền khác Chế độ lọc được xácđịnh cho mỗi hàng của đường bao thắng đứng của khối hoặc mỗi cột của đường baonăm ngang của khối dựa trên độ phẳng của hàng hoặc cột tương ứng Lọc đối vớivùng trơn được thực hiện bằng bộ lọc thông thấp 1 chiều bậc 9 Đối với các vùngkhác bộ lọc chỉ tác động lên các điểm ảnh lân cận đường bao của khối Tác giả TaoChen [10], Shizhong Liu [11] và Ci Wang [12] dé xuất các giải pháp lọc thích nghỉmiền DCT Tác giả Averbuch [13] đề xuất giải thuật làm giảm blocking sử dụng cácđiểm ảnh đối xứng dọc theo đường bao của khối.
Sau đây chúng ta sẽ xem xét chi tiết hơn một vài giải pháp được dé cập ở trên đây:2.3.1.2.1 Làm giảm nhiễu blocking trong miền DCT
Trong phan nay, chúng ta sẽ giới thiệu các giải thuật hậu xử lý miền DCT [10] [11][12] Chúng ta ký hiệu 4,,,(u,v) là khối 8x8 thứ (m,n) trong ảnh nén và B,, ,(u,v) làcác hệ số DCT của 8,,,(u,v) ð”.(w„v) là khối dịch với độ dịch theo hướng x là k pixelvà dịch chuyên theo hướng y là / pixel so với khối ð„ (u,v), và BY (u,v) là các hệ sốDCT của khối ð“,(w,v) Hình 2.11 trình bày một ví dụ về khối dịch
Hình 2.11 — Vi du về khối dich chuyển b (u,v)Trong ảnh gốc, các hệ số DCT lân cận ở cùng tan số rất giống nhau va không thayđối triệt để trong một phạm vi nhỏ Vì vậy, chúng ta có thé sử dụng bộ lọc thông thapcho các hệ số DCT ở mỗi tần số dé loại bỏ thành phần tần số cao Các thành phần tầnsố cao chính là nguyên nhân gây ra hiệu ứng blocking Tuy nhiên phương thức này
Trang 31có thể làm mờ đường biên thật của ảnh gốc Vì vậy chúng ta cần có cơ chế để xácđịnh độ thay đổi pixel trong khối và áp dụng bộ lọc với cường độ tương ứng.
Bộ lọc miền DCT được sử dụng để hiệu chỉnh lại khối Ö,„ „(w„v) duoc thực hiện như
bộ lọc được xác định trong công thức (2.23).
wy, =1, k,l=—2, 2 (2.23)
Đối với các khối với độ thay đổi lớn, nhiễu blocking ít xuất hiện, vì vậy chúng ta ápdụng bộ lọc với cường độ yếu dé làm mịn blocking mà vẫn duy trì được các cạnh thậtcủa ảnh Các hệ số của bộ lọc được xác định từ công thức (2.24)
— h với (k,l) = (0,0) 2.24)
1, với các giá trị khác của (k,/)
2.3.1.2.2 Làm giảm blocking sử dụng tổng có trọng số các điểm ảnh được đồng
chỉnh đối xứngNhư đã được giới thiệu ở phan trước, tác giả Averbuch [13] dé xuất giải thuật làmgiảm blocking sử dụng các pixel đối xứng dọc theo đường bao của khối Giải thuậtlàm giảm blocking này sử dụng tong có trọng số của các pixel xếp đối xứng và được
ký hiệu là WSSAP (Weighted Sums of Symmetrically Aligned Pixels).Ky hiệu anh với kích thước RxC như sau:
7=fPp,,},0<¡i<R-1,0<7<C-I (2.25)
Ảnh sốc được chia thành các khối con kích thước 8x8 Bre
K < (2.26)
B = { Papsis8et =0 0 <r< 8° O <c<
Trang 32Tac giả định nghĩa khung deblocking B(Sr);.e với kích thước là S<S;.
B(S,),„={ }, 0<m<-S—, 0<n<-= (2.27)
Sự Sự
Với Bre ={p8r+(m=2)S Hi 8eH(n-5)S, +71, O<i<S,-1 O<j<S,-1
Hình 2.12 trình bày hai ví dụ của khung deblocking như công thức (2.27).
: : B Bre “Ce enegeectess! ie
Br
PEC L)
(a) Sp=4 (b) Sp=8
Hình 2.12 — Hai vi du cua khung deblocking B(Sy)+.c
Đề đơn giản thành phan 8r+(m-(1/2))S; va 8c+(n-(1/2))S; trong công thức (2.27)được bỏ qua và (2.27) được viết lại như sau:
Trang 33Phương thức được dé xuât két hop chặt chẽ giữa thông tin từ các khung lận cận tạmthời cũng như thông tin từ các điểm anh lân cận nhăm tính toán các tham sô điêukhiên bộ lọc fuzzy Gân đây tác giả Dũng Trung Võ, Truong Q Nguyen, Sehoon Yeavà Anthony Vetro [19] dé xuất bộ lọc fuzzy thích ứng dựa trên đặc tính có hướng của
nhiễu ringing dọc theo các cạnh lớn của ảnh
2.3.2.1 Phương pháp sử dụng bản đô phương sai và bộ lọc fuzzy đông nhấtPhương sai cục bộ có thê biêu diễn hiệu quả đặc tính cục bộ của ảnh do đó tác giảHao Song Kong [15] đã dé xuất giải thuật nâng cao chat lượng ảnh nén dựa trên banđô phương sai dé phân vùng ảnh và thực hiện lọc băng bộ loc fuzzy đông nhất như
Hình 2.13.
> Tron /-—> Chitiét +Anh giai nén
JPEG > Canh x)
| Trich xuat = Ban đồ =~ Phan loai = Phan loai > Loại bỏ nhiễuđặc tính Variance điểm ảnh khôi Ringing
V2Phat hién
nhiéu blocking > Loại 0 F
`,Loại bỏ nhiễu > Loại Ï -
Dựa trên bản đô phương sai các diém anh được phân loại dựa trên ngưỡng như sau:
Trang 34[Joại _0 nếu o° (x,y)<ngudng_1
Điểm anh (x,y) =< loai_1 néu Ơˆ (x, y)>ngudng_2
Trong đó ø” (x,y) là phương sai cục bộ của điểm ảnh tại vị trí(x, y); các điểm ảnhloại _0 là những điểm ảnh có phướng sai thap tương ứng với vùng trơn; các điểm ảnhloai_1 có phương sai lớn tương ứng với vùng cạnh; và các điểm ảnh loại 2 có phươngsai trung bình chỉ ra điểm ảnh thuộc vùng chi tiết Hai mức ngưỡng được tác giả lựachọn lần lượt là 10 và 400
Trên cơ sở phân loại điểm ảnh, các khối 8x8 sẽ được phân loại thành khối trơn, khốicạnh và khối chỉ tiết trong ứng khi có ít nhất một điểm ảnh thuộc khối thuộc loại 0,
loại l hay loại 2.
Do nhiễu ringing chủ yếu xuất hiện gần cạnh lớn của ảnh nên giải thuật đề xuất chỉtác động lên các khối cạnh mà thôi Dé duy trì độ sắc nét của ảnh, bộ lọc được sửdụng là bộ lọc fuzzy đồng nhất trên cửa số kích thước 5x5
2.3.2.2 Phương pháp sử dụng bộ lọc fuzzy định hướng
2.3.2.2.1 Tham số phân bó định hướng của bộ loc fuzzyVới các mức độ nén cao, nhiễu ringing trong ảnh JPEG thường xuất hiện dọc theocác cạnh Vì vậy, cường độ lọc cần phải thích ứng với sự thay đối hướng của cạnh[19] Hình 2.14 là một ví dụ về tính có hướng của suy giảm chất lượng trong ảnhJPEG Bộ lọc cần có cường độ mạnh theo phương ngang bởi vì nhiễu ringing ở đâygân như không có liên hệ gi với ảnh gốc trong khi đó ở phương đứng bộ lọc can cócường độ nhẹ hơn vì ở hướng nay có sự thay đối cạnh của ảnh
(a) Ảnh gốc (b) Ảnh nénHình 2.14 — Vi dụ về suy giảm chất lượng có hướng
Trang 35Dạng ham cosine của tham sô phan bô đáp ứng được yêu câu trên là:
ơ(60)=ø, (a + B cos” (9)) (2.29)Trong đó: Ø là phương giữa điểm ảnh đang xem xét /[m,n| và các điểm ảnh baoquanh nó /[m+m,n+n'| như Hình 2.15; o,, là biên độ của tham số phân bố; a và Blà hệ số tỉ lệ điều khiến độ mạnh của bộ lọc Trong công thức (2.29), ơ (0) dat giá trịnhỏ nhất o,,, = œø,„ ở phương thắng đứng và dat giá trị lớn nhất ø„„ =(a@+B)o,, ở
1 0 1, (-1 -2 -1,
Các cạnh của anh có thé được nhận diện băng độ lớn của gradientG = \JG) +Gˆ.Nó
tương ứng với chiêu được xác định bdid, = atan(G, / G,) Tham số phân bố trong
trường hợp này xác định bởi góc (Ø-Ø,) thay vì Ø trong công thức (2.29), trong đó
Ø và 6 được định nghĩa như Hinh 2.16.
Trang 36l[m+m,n+n ]® 9
gradient
Hình 2.16 — Góc @ va @ của bộ loc fuzzy định Hướng
Đề thích nghi với các mức độ chi tiết của anh, độ lệch chuân STD (J (m,n)) cua diémanh trong cua số W với trung tâm là điểm ảnh / (m,n) duoc su dung dé diéu khién
biên độ của tham sô phan bô ø„ như sau:
ơ„ [m.n]=ø,Với STD,,X
va STD_ la giả tri lon nhat va nhỏ nhat trong so tat ca các gia tri
STD(I[m,n]), oy là giá trị lớn nhất của tham số phân bô và z là hệ sô tỉ lệ thuộc}0, 1] Bang cach diéu chinh Ø, va y chung ta có thê điều khiến được độ cân băng
o1ữa mức độ loại bỏ suy giam chat lượng va độ sac của ảnh Cải thuật cua bộ lọc
được đê xuât như sau:
G > NgưỡngCanh
Trang 37Chương 3 XÂY DUNG BAN ĐỎ NHIÊU BLOCKING VA
RINGING
3.1 Mô hình hệ thống thị giác trong xử lý ảnh3.1.1 Đặc tính hệ thống thị giác của con ngườiHau hết các hình anh kỹ thuật số cuối cùng đều được xem và đánh giá bởi con người.Do đó một van dé quan trong cần được xem xét đối với các hệ thống hình ảnh số lànó cần được thiết kế dựa trên cơ sở quan sát đánh giá về hoạt động của hệ thống thigiác người HVS (Human Visual System) Điều nay đảm bảo rang chỉ có thông tinliên quan can thiết được nhận bởi người xem, như vậy sẽ loại bỏ được các chi phí
không cân thiệt cho việc lưu trữ, truyền tải va sử dụng.
Trong quá khứ, các kiến thức về đặc tính cơ bản của HVS đã được sử dụng trong mộtsố lượng lớn các ứng dụng hình ảnh Ví dụ như việc giảm mẫu các thành phần màutrong truyền hình tương tự cho phép giảm một nửa băng thông truyền với một mứcđộ giảm chất lượng tôi thiểu Ké từ những năm 1960, các hiểu biết về hoạt động củaHVS đã được tăng lên đáng kể, và sự tương tác nhiều hơn giữa các kỹ sư và các nhàkhoa học trong lĩnh vực thị giác máy tính (Computer vision) đã dẫn đến việc sử dụngrộng rãi hơn các đặc tinh HVS trong các hệ thống xử lý hình anh kỹ thuật sé
Giới hạn của hệ thống thị giác người HVS thường được sử dụng để giới hạn tốc độdữ liệu ở các điểm sau [20]:
e Độ nhạy tần số không gian (Spatial frequency sensitivity): phan ảnh có độ chitiết của ảnh (các thành phân tần số cao) thường ít có thé nhìn thay rõ
e Hiệu ứng mặt nạ vùng chi tiết (Texture masking): các sai lỗi điểm anh ganvùng chi tiết thường khó có thé nhận biết
e Hiệu ứng mặt nạ vùng cạnh (Edge masking): các sai lỗi điểm ảnh gần vùngcạnh có độ tương phản cao thường khó có thể nhận biết
e Hiệu ứng mặt nạ độ chói (Luminance masking): mức ngưỡng kha năng hiểnthị tăng theo độ chói của miền nên ảnh
e Hiệu ứng mặt nạ độ tương phan (Contrast masking): làm giảm tầm nhìn củamột chi tiết trong sự hiện diện của chi tiết khác
Trang 38e Tần số nhiễu (Noise frequency): Độ nhạy hệ thông HVS thấp với nhiễu tan số
cao
e Độ nhạy tần số thời gian (Temporal frequency sensitivity): các tần số dưới50Hz hiệu ứng nhấp nháy là đáng chú ý đối với hệ thong HVS Cường độ sángcao làm tăng khả năng nhận biết hiệu ứng nhấp nháy
e Spatial frequency content: Tân số không gian thấp làm giảm độ nhạy với hiệuứng nhấp nháy
3.1.2 Mối liên hệ giữa HVS và đặc tính không gian của ảnh nén JPEG3.1.2.1 Cạnh thuộc đường bao khối
Đề khảo sát chat lượng ảnh giải nén khi các cạnh của ảnh nằm trên đường bao củacác khối 8x8 Chúng ta thực hiện nén ảnh mẫu như Hình 3