Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng màu với ảnh đen trắng trong chương trình thực nghiệm .... Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng mà
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan đây là kết quả nghiên cứu của riêng tôi.Các kết quả đƣa
ra là trung thực và chƣa từng đƣợc ai công bố trong bất kỳ một tài liệu nào khác Tôi xin cam đoan tất cả những thông tin đƣợc trích dẫn trong luận văn đã đƣợc ghi rõ nguồn gốc
Hải Phòng, ngày 07 tháng 9 năm 2015
Trang 2LỜI CẢM ƠN
Để hoàn thành cuốn luận văn tốt nghiệp này, tôi xin được gửi lời cảm ơn đến toàn thể các thầy cô thuộc khoa Công nghệ thông tin đã tận tình giảng dạy trong suốt thời gian vừa qua đặc biệt là thầy TS Nguyễn Duy Trường Giang- người luôn nhiệt tình và nghiêm khắc trong quá trình dạy và hướng dẫn để tôi có thể hoàn thành cuốn luận văn này
Một lần nữa, tôi xin chân thành cảm ơn!
Trang 3MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU v
DANH MỤC CÁC BẢNG vi
DANH MỤC CÁC HÌNH vii
MỞ ĐẦU 1
1 Tính cấp thiết của đề tài 1
2 Mục tiêu của đề tài 2
3 Đối tượng và phạm vi nghiên cứu 2
4 Phương pháp nghiên cứu 2
5 Dự kiến kết quả đạt được 2
CHƯƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG 3
ỨNG DỤNG CỦA NÓ 3
1.1 Giới thiệu chung 3
1.2 Ứng dụng của XLA 5
1.3 Các vấn đề cơ bản trong XLA 7
1.3.1 PEL và ảnh số 7
1.3.2 Độ phân giải của ảnh 8
1.3.4 Mức xám của ảnh 9
1.3.5 Tăng cường ảnh 9
1.3.6 Khôi phục ảnh 10
1.3.7 Phân tích ảnh 11
1.3.8 Nén ảnh 12
CHƯƠNG II: CÁC BỘ LỌC KHÔNG GIAN 13
2.1 Lọc song phương 13
2.1.1 Giới thiệu 14
2.1.2 Ý tưởng 16
2.1.3 Trường hợp Gaussian 18
2.1.4 Lọc song phương so với phạm vi 19
2.1.5 Lọc song phương với ảnh đen trắng 21
Trang 42.1.6 Lọc song phương với ảnh màu 24
2.2 Bộ lọc NLM 26
2.2.1 Giới thiệu 26
2.2.2 Phương pháp nhiễu 28
2.2.3 Bộ lọc Gaussian 28
2.2.4 Lọc lân cận 28
2.2.5 Thuật toán NLM 29
2.3 So sánh hiệu quả của các bộ lọc 32
2.4 Bộ lọc làm sắc nét tuyến tính (Linear sharpen) 35
2.4.1 Mục đích và ý nghĩa 35
2.4.2 Bộ lọc làm sắc nét tuyến tính 35
2.5 Kỹ thuật cân bằng màu 38
2.5.1 Giới thiệu 38
2.5.2 Giả thiết Gray World 38
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM VỚI CÁC BỘ LỌC KHÔNG GIAN VÀ KỸ THUẬT CÂN BẰNG MÀU 40
3.1 Mục đích 40
3.2 Xây dựng chương trình thử nghiệm 40
3.2.1 Giới thiệu về OpenCV 40
3.2.2 Các bước tiến hành 41
3.3 Kết quả thực nghiệm 46
3.3.1 Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng màu với ảnh đen trắng trong chương trình thực nghiệm 46
3.3.2 Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng màu với ảnh màu trong chương trình thực nghiệm 48
KẾT LUẬN 51
TÀI LIỆU THAM KHẢO 52
Trang 5DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU
Trang 6DANH MỤC CÁC BẢNG
Trang 7DANH MỤC CÁC HÌNH
1.3 Hình ảnh mạch trước và sau khi được làm nổi 6
2.11 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 33 2.12 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 33 2.13 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 35
Trang 8MỞ ĐẦU
1 Tính cấp thiết của đề tài
Công nghệ thông tin (CNTT) đang giữ một vai trò quan trọng không chỉ trong các ngành công nghiệp, quân sự, nghiên cứu, giải trí…mà ngay cả trong đời sống và nhu cầu ngày ngày của con người.Có rất nhiều các chuyên ngành khác nhau trong công nghệ công tin và trong số đó XLA là một chuyên ngành quan trọng và đã có từ rất lâu đời
Xử lý ảnh (XLA) là một lĩnh vực mang tínhcông nghệvà khoa học Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, thu hút các trung tâm nghiên cứu, ứng dụng, đặc biệt
là máy tính chuyên dụng dành riêng cho nó.XLA được ứng dụng để đáp ứng nhu cầu thiết yếu của con người và xã hội Các ứng dụng nổi bật của XLA như nhận dạng vân tay, phục chế ảnh, giám sát thực thể, nhận dạng khuôn mặtdựng ảnh 3D…đã đem lại nhiều lợi ích trong nhiều lĩnh vực
Con người thu nhận thông tin bằng thị giác, vì thế bất cứ ai cũng mong muốn thu nhận được hình ảnh có chất lượng tốt Để có được những hình ảnh như vậy, bức ảnh ban đầu phải trải qua rất nhiều công đoạn và rất nhiều các kỹ thuật được sử dụng để thay đổi và giúp nó có chất lượng tốt hơn như làm trơn, làm sắc nét, lọc nhiễu, cân bằng màu… Tiêu biểu và quan trọng trong số đó là
sử dụng các bộ lọc không gian
Hình ảnh thu được từ các thiết bị thu nhận số như camera, camcoder thường bị ảnh hưởng bởi các nhiễu và điều kiện sáng nên có thể bị mờ, quá tối hoặc quá sáng hoặc không nhấn mạnh được đối tượng chụp Điều đó gây khó khăn rất nhiều cho các công tác học tập, nghiên cứu và ứng dụng thực tiễn, nó khiến cho hiệu quả công việc giảm và độ chính xác không cao đặc biệt là trong các lĩnh vực đòi hỏi sự tỉ mỉ và chính xác Để khắc phục điều này, các bộ lọc không gian như lọc song phương, lọc Nonlocal-mean (NLM) và Linear sharpen cùng kỹ thuật cân bằng màu sắc là những giải pháp tốt
Xuất phát từ thực tế đó, tôi lựa chọn đề tài: “Cải thiện chất lượng ảnh dựa trên các bộ lọc không gian” Đây là vấn đề đã và đang được quan tâm và hứa
Trang 9hẹn sẽ được tiếp tục phát triển trong tương lai phù hợp với thực tiễn và cuộc sống, đặc biệt là trong giai đoạn đất nước đang từng bước phát triển và đi lên, CNTT đang thực sự bùng nổ như ngày nay
2 Mục tiêu của đề tài
Mục tiêu của đề tài là sử dụngcác bộ lọc không gian, kỹ thuật cân bằng màu để nâng cao chất lượng hình ảnh từ các ảnh tĩnh và video Từ một bức ảnh đầu vào với chất lượng hình ảnh kém như bị nhiễu, mờ, không sắc nét, màu sắc
xa với thực tế, sau khi sử dụng các bộ lọc không gian và kỹ thuật cân bằng màu
sẽ đưa ra một kết quả tốt hơn: sắc nét, mượt,đảm bảo được các đường nét ban đầu không mất đi và màu sắc gần hơn với thực tế
3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài:
Các bộ lọc không gian: Lọc song phương, NLM, Linear sharpen tập trung chủ yếu vào các thuật toán được sử dụng trong bộ lọc và cách thức hoạt động của chúng
Kỹ thuật cân bằng màu sắc
4 Phương pháp nghiên cứu
Trước tiên, nghiên cứu sẽ đưa ra các lý thuyết về XLA và các bộ lọc không gian, kỹ thuật cân bằng màu được đề cập đến.Dựa trên nền tảng lý thuyết để xây dựng một chương trình thử nghiệmvới ảnh tĩnh và video
5 Dự kiến kết quả đạt được
Đưa ra được kết quả nghiên cứu về mặt lý thuyết: Ý nghĩa và ứng dụng của XLA nói chung và các bộ lọc không gian, kỹ thuật cân bằng màu nói riêng trong khoa học công nghệ và đời sống.Đưa ra được kết quả của việc áp dụng lý thuyết trên vào các hình ảnh thực tế thông qua chương trình thử nghiệm
Trang 10CHƯƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG
ỨNG DỤNG CỦA NÓ 1.1 Giới thiệu chung
Khoảng hơn mười năm trở lại đây, XLA đã được đưa vào giảng dạy trong chương trình đại học ở nước ta.Nó là môn học có liên quan đến nhiều lĩnh vực
và cần nhiều kiến thức cơ sở khác nhau Đầu tiên là xử lý tín hiệu số, đây là một môn học cơ bản cho xử lý tín hiệu chung, các khái niệm về các bộ lọc hữu hạn,tích chập, các biến đổi Fourier, Laplace, … Thứ hai, các công cụ toán như đại số tuyến tính, sác xuất thống kê Bên cạnh đó là một số kiến thức cần thiết như trí tuệ nhân tao, mạng nơ ron nhân tạo cũng được nhắc đến trong quá trình phân tích và nhận dạng ảnh Tiền đề của các phương pháp XLA là các ứng dụng: nâng cao chất lượng ảnh và phân tích ảnh Ứng dụng đi đầu được biết đến
là nâng cao chất lượng ảnh báo truyền qua cáp từ London đến NewYork từ những năm 1920
Nâng cao chất lượng ảnh có liên quan đến việc phân bố mức sáng và độ phân giải của ảnh Nâng cao chất lượng ảnh phát triển vào khoảng những năm 1955.Điều này là vì sau chiến tranh thế giới thứ hai, máy tính phát triển nhanh tạo điều kiện thuận lợi cho quá trình XLA số phát triển Năm 1964, máy tính đã
có khả năng xử lý, nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của
Mỹ cụ thể là: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện nâng cao và xử lý nâng cao chất lượng, nhận dạng ảnh đã phát triển không ngừng Các phương pháp tri thức nhân tạo như các thuật toán xử lý cải tiến,mạng nơ ron nhân tạo, các công cụ nén ảnh đã ngày càng được áp dụng rộng rãi và gặt hái được nhiều kết quả khả quan Trước đây ảnh thu qua Camera
là các ảnh tương tự (loại Camera ống CCIR) Gần đây, với sự phát triển của công nghệ, ảnh được lấy ra từ camera là ảnh đen trắng hoặc màu, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (Ví dụ điển hình là máy ảnh số).Mặt khác, ảnh cũng có thể tiếp nhận qua vệ tinh, có thể được quét từ ảnh chụp bằng máy quét ảnh
Trang 11 Biến đổi ảnh: Sau bướcthu nhận, ảnh được biến đổi bằng việc sử dụng các kỹ thuật nâng cao chất lượng ảnh để thu được ảnh có chất lượng tốt, chứa đựng nhiều thông tin và có thể quan sát bằng mắt
Nhận dạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước Nội suy là phán đoán dựa trên ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt nét gạch ngang và chữ số trên phong bì có thể được nội suy thành loại mã điện thoại Có nhiều cách phân loai ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân loại theo hai dạng nhận dạng ảnh cơ bản: Nhận dạng theo cấu trúc vànhận dạng theo tham số Một
số đối tượng nhận dạng phổ biến hiện nay được áp dụng trong khoa học và công
nội suy
Cơ sở tri thức
Cơ sở tri thức
Cơ sở tri thức
Trang 12nghệ là: nhận dạng văn bản (Text),nhận dạng ký tự (chữ in, chữ ký điện tửchữ viết tay), nhận dạng mã vạch, nhận dạng vân tay, nhận dạng mặt người…
Ảnh là một đối tượng khá phức tạp về độ sáng tối, đường nét, dung lượng PEL, môi trường để thu ảnh phong phú kèm theo nhiễu Trong nhiều khâu phân tích và XLA ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn học hỏi quy trình tiếp nhận và XLAtheo cách của con người Trong các bước xử lý đó, nhiều khâu đã xử lý theo các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy
1.2 Ứng dụng của XLA
XLA có ứng dụng trong việc lưu trữ dữ liệu, tra cứu thông tin: Để giảm dung lượng lưu trữ ảnh, ảnh được nén dưới dạng *.jpg, *tif
Ứng dụng trong việc nhận dạng: Nhận dang khuôn mặt, vân tay, chữ số, ký
tự, biển số xe…Ứng dụng trong việc xác thực: Xác thực đăng nhập windown 8 bằng hình ảnh…
Hình 1.2: Nhận dạng biển số xe
Trong y học, XLA cũng có vai trò rất quan trọng trong việc đưa ra những hình ảnh có chất lượng cao, rõ nét, giúp cho việc chẩn đoán bệnh khách quan, nhanh chóng và chính xác hơn Trong đó, việc làm nổi các chi tiết trong ảnh là một trong những ứng dụng quan trọng và có ỹ nghĩa
Trang 13Hình 1.3: Hình ảnh mạch trước và sau khi được làm nổi (từ trái qua phải)
Trong công nghiệp, XLA có ứng dụng trong việc xấy dựng các hệ thống máy nhìn công nghiệp để kiểm tra và điều khiển các sản phẩm: Hệ thống phân tích hình ảnh nhằm phát hiện bọt khí bên trong vật thể đƣợc đúc bằng nhựa, phát hiện các linh kiện không đạt tiêu chuẩn trong sản xuất, từ camera quan sát, đếm đƣợc sản phẩm dựa vào hệ thống đếm sản phẩm
Hình 1.4: Ứng dụng của XLA trong công nghiệp
Trang 14XLA còn có ứng dụng hiệu quả trong việc dấu dữ liệu để phục vụ cho việc trao đổi thông tin mật Cụ thể như : Dấu tin trong ảnh, dấu video trong ảnh hay dấu ảnh trong ảnh
Hình 1.5: Ảnh giấu tin : Ảnh bên trái là được giấu tin, đoạn văn bản bên
phải là đoạn văn bản được giấu trong ảnh
1.3 Các vấn đề cơ bản trong XLA
1.3.1 PEL và ảnh số
Gốc của ảnh hay gọi là ảnh tự nhiê là ảnh liên tục về độ sáng và không gian Để xử lý bằng máy tính (số) thì hình ảnh cần phải được số hoá.Sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về độ sáng (mức xám)vàvị trí (không gian) gọi là số hóa ảnh Khoảng cách giữa các PEL này được thiết lập sao cho mắt người không thể phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong phạm vi ảnh hai chiều, mỗi pixel ứng với tọa độ (x, y)
Định nghĩa: PEL (pixel) là một phần tử có toạ độ (x, y) của ảnh số với độ màu hoặc xám nhất định Kích thước và khoảng cách giữa các PEL đó được chọn phù hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật.Mỗi một phần tử trong ma trận được xem là một phần tử ảnh
Ảnh số là tập hợp các PEL với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật
Trang 151.3.2 Độ phân giải của ảnh
Định nghĩa: Độ phân giải của ảnh là mật độ PEL được ấn định trên một ảnh
số
Theo định nghĩa, khoảng cách giữa các PEL phải được thiết lập sao cho mắt người thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách phù hợp tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân bố theo trục
y và trong không gian hai chiều
Ví dụ: Độ phân giải của ảnh trên màn hình CGA là một lưới điểm theo chiều ngang màn hình: 320 điểm theo chiều dọc * 200 PEL (320*200) Thực tế
là, cùng màn hình CGA 12 inh ta nhận thấy mịn hơn màn hình CGA 17 inh độ phân giải 320*200 Lý do là vì cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các PEL) kém hơn
Hình 1.6: Sự phân bố PEL: Số lượng PEL phân bố tăng dần trên cùng một
kích thước ảnh
Trang 161.3.4 Mức xám của ảnh
Một PEL (một pixel) có hai đặc trưng cơ bản là độ xám của nóvà vị trí (x, y) của PEL.Dưới đây là một số khái niệm và thuật ngữ thường được đề cập tới trong XLA
Định nghĩa: Mức xám của PEL là cường độ sáng của PEL được gán bằng giá trị số tại điểm đó
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 Mức 256
là mức phổ dụng nhất
Ảnh đen trắng: là ảnh có hai màu trắng và đen(không chứa màu khác) với mức xám ở các PEL có thể khác nhau
Ảnh nhị phân: ảnh chỉ có 2 mức trắng đen phân biệt tức là dùng 1 bit
mô tả 21 mức khác nhau Nóitheo một cách khác: mỗi PEL của ảnh nhị phân chỉ
có thể là 1 hoặc 0
Ảnh màu: trong phạm vi lý thuyết ba màu RBG(Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈ 16,7 triệu màu
1.3.5 Tăng cường ảnh
Tăng cường ảnh là việc giảm nhiễu ảnh, tăng độ tương phản giữa các cấu trúc Các kỹ thuật tăng cường ảnh còn tăng cường các thuộc tính cảm nhận làm cho ảnh tốt lên, tiện phục vụ cho các xử lý tiếp theo
Các kỹ thuật tăng cường ảnh gồm kỹ thuật phi tuyến, tuyến tính, thích nghi, cố định, kỹ thuật dựa vào pixel hay kỹ thuật đa mức Các kỹ thuật được chia làm hai nhóm: Nhóm tăng cường ảnh trong miền không gian và nhóm phục hồi ảnh trong miền tần số
Các thao tác chính: Làm sắc nét đường biên, lọc phi tuyến, lọc tuyến tính, phóng to, thu nhỏ, làm trơn, thay đổi độ tương phản, sửa đổi mức xám đồ…
Thay đổi độ tương phản: Trong thực tế, khi hai đối tượng có cùng độ sáng đặt ở hai nền khác nhau thì sẽ cho ta những cảm nhận khác nhau Chính vì vậy,
độ tương phản thể hiện sự thay đổi độ sáng của đối tượng so với nền, hiểu
Trang 17theomột cách khác thì độ tương phản là độ nổi của PEL so hay một vùng ảnh so với nền Do điều kiện sáng tối khác nhau hay do biến động của bộ cảm nhận ảnh mà ảnh của độ tương phản khác nhau Để thay đổi độ tương phản của ảnh thì ta phải thay đỏi biên độ trên toàn dải bằng cách biến đổi tuyến tính biên độ đầu vào hay phi tuyến
Lọc tuyến tính: Bao gồm lọc thông thấp, đồng hình và trung bình, loại lọc này được dùng cho các loại nhiễu phân bố khắp ảnh (nhiễu cộng và nhiễu nhân)
Lọc phi tuyến: Bao gồm lọc trung vị, giả trung vị và lọc ngoài Loại lọc này dùng cho các loại nhiễu gây đột biến tại một PEL (nhiễu xung)
có được ảnh gần nhất với ảnh gốc.Nguyên nhân gây ra sự suy giảm ảnh có rất nhiều và khôi phục ảnh là một trong những lĩnh vực quan trọng trong xử lý hình ảnh.Nguyên nhân của sự suy giảm thường bao gồm mờ và nhiễu Mờ có thể do đối tượng trong hình ảnh bị mất nét khi phơi sáng, trong khi chuyển động mờ có thể được gây ra khi một đối tượng di chuyển so với máy ảnh khi phơi sáng Mục đích của phục hồi hình ảnh là để " bù" hoặc "khôi phục" sai hỏng- những cái đã làm suy giảm hình ảnh Suy giảm có nhiều hình thức như chuyển động làm mờ, nhiễu, mất tiêu cự camera Trong trường hợp như làm mờ chuyển động, có thể
Trang 18đưa ra một ước lượng rất tốt so với mờ thực tế và "khôi phục" mờ để khôi phục lại hình ảnh gốc.Trường hợp ảnh bị lỗi bởi nhiễu, có thể thực hiện bù nhiễu
Hình 1.8: Khôi phục ảnh Từ trái qua phải: phần ảnh trước và sau khi được khôi phục
1.3.7 Phân tích ảnh
Mục đích: Đưa ra ra các đặc trưng của ảnh, xây dựng mối quan hệ giữa chúng dựa vào các đặc trưng cục bộ.Tìm biên, tách biên, , phân vùng ảnh,làm mảnh đường biên và phân loại đối tượng là các thao tác chính trong phân tích ảnh Các phương pháp chính là phát hiện biên cục bộ, dò biên theo quy hoạch động, phân vùng theo miền đồng nhất, phân vùng dựa theo đường biên
Như chúng ta biết, biên là vẫn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh dựa trên biên là chủ yếu.Tập hợp các điểm biên tạo lên biên của hình ảnh, mỗi PEL có thể xem là điểm biên nếu có sự thay đổi mức xám đột ngột ở đó Có hai phương pháp phát hiện biên chính là: Phát hiện biên gián tiếp
và phát hiện biên trực tiếp
Biên ảnh là những vùng có cường độ tương phản mạnh, dò biên giúp lọc ra những thông tin hữu ích trong ảnh mà vẫn giữ được những thuộc tính cấu trúc của hình ảnh.Gradient và Laplacian là hai phương pháp dò biên cơ bản Gradient
dò biên bằng việc tìm kiếm giá trị lớn nhất và giá trị bé nhất trong đạo hàm bậc nhất của ảnh, còn Laplacian thì tìm kiếm các vạch không trong đạo hàm bậc hai của ảnh
Trang 19Hình 1.9:Kết quả của một phép dò biên
1.3.8 Nén ảnh
Nén ảnh là một kỹ thuật mã hoá các ảnh số hoá để giảm số lượng các bit
dữ liệu cần thiết để biểu diễn ảnh, giảm đi chi phí trong việc lưu trữ ảnh và chi phí về mặt thời gian để truyền ảnh đi xa trong truyền thông nhưng vẫn đảm bảo được chất lượng của ảnh
Nén ảnh thực hiện được là do: thông tin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, tổ chức.Vì thế nếu làm rõ được trật tự, cấu trúc đó thì sẽ biết phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và gửi đi với số lượng bit ít hơn so với ảnh gốc mà vẫn đảm thông tin có được một cách đầy đủ
Ở bên nhận quá trình giải mã sẽ sắp xếp và tổ chức lại được bức ảnh xấp xỉ gần chính xác so với ảnh gốc nhưng vẫn thỏa mãn chất lượng yêu cầu
Nén ảnh có được bằng cách loại bỏ các phần dư thừa trong ảnh đã được số hoá.Dư thừa có thể là dư thừa về cấp xám, dư thừa thông tin về không gian hay
dư thừa về thời gian
Có hai phương pháp nén ảnh cơ bản là: Nén không mất thông tin, nén mất thông tin
Nén mất thông tin: Khai thác các thông tin dư thừa và các thông tin không liên quan
Nén không mất thông tin: Khai tác các thông tin dư thừa Hiện nay có một số chuẩn nén hay dùng như: JPEG, MPEG…
Trang 20CHƯƠNG II: CÁC BỘ LỌC KHÔNG GIAN
Trong quá trình XLA chúng ta có thể sử dụng các mặt nạ không gian nhằm làm thay đổi cấu trúc ảnh gọi là các bộ lọc không gian
Một bộ lọc không gian là một hoạt động ảnh mà trong đó mỗi giá trị PEL𝐼(𝑢, 𝑣) bị thay thế bởi một hàm của cường độ các PEL trong vùng lân cận của (𝑢, 𝑣)
Hình 2.1: Ví dụ về hoạt động của bộ lọc không gian
Bên cạnh việc giảm nhiễu, làm mượt hình ảnh,các bộ lọc không gian còn làm sắc nét các chi tiết và giữ lại những cấu trúc đẹp trong hình ảnh.Dưới đây là các bộ lọc được đề cập đến trong đề tài
2.1 Lọc song phương
Song phương là một bộ lọc vừa làm mượt ảnh đồng thời vẫn giữ được các đường nét của ảnh bằng sự k ết hợp phi tuyến tính của các giá trị PEL lân cận.Phương pháp này không lặp đi lặp lại, cục bộ và đơn gi ản Nó kết hợp các mức mức xám hoặc màu sắc dựa trên cả sự mật thiết hình học và tương tự về trắc quang của chú ng, và ưu tiên giá trị gần hơn giá trị xa trong cả miền và phạm
vi Ngược lại với các bộ lọc hoạt động riêng biệt trên ba dải c ủa một ảnh màu,
bộ lọc song phương có thể thực thi các số liệu cơ bản về nhận thức màu Lab, làm mịn màu, và giữ gìn các đườ ng nét đ ể phù hợp với nhận thức của con người Ngoài ra, trong sự tương phản với việc lọc tiêu chuẩn, lọc song phương không tạo ra màu sắc ảo d ọc theo các đường nét t rong ảnh màu mà làm giảm màu sắc ảo xuất hiện trong hình ảnh ban đầu
Trang 21CIE-2.1.1 Giới thiệu
Lọc có lẽ là hoạt động cơ bản nhất của XLA và thị giác máy tính Trong ý nghĩa rô ̣ng của thuật ngữ "lọc", các giá trị của hình ảnh được lọc tại một điểm là một hàm của các giá trị ảnh đầu vào trong một tập hợp giá tri ̣ lân câ ̣n c ủa cùng một vị trí Đặc biệt, lọc thông thấp Gaussian tính toán trung bình các giá trị PEL được đánh trọng số trong một tâ ̣p hợp giá tri ̣ lân câ ̣n , trong đó, trọng số giảm theo khoảng cách từ khu trung tâm lân cận Mặc dù những lời giải thích chính thức và mang tính định lượng về việc suy giảm trọng số đã được đưa ra, theo trực giác hình ảnh thường thay đổi từ từ trong không gian, vì thế các PEL gần nhau có thể có các giá trị tương tự, và vì vậy việc tính trung bình chúng là thích hợp Giá trị nhiễu làm hỏng các PEL ở gần nó là có ít tương quan lẫn nhau hơn
so với giá trị tín hiệu, vì vậy nhiễu đư ợc lấy trung bình trong khi tín hiệu được giữ nguyên Các giả định về các biến thể không gian thất bại tại các đườ ng nét những cái bị làm mờ đi bởi bộ lọc thông thấp.Nhiều nỗ lực đã được cống hiến để giảm ảnh hưởng không mong muốn này Một câu hỏi đặt ra là: Làm thế nào chúng ta có thể ngăn chặn việc trung bình hóa trên các đường nét , trong khi vẫn trung bình hóa trong các khu vực cần làm mịn?
Sự khuếch tán bất đẳng hướng là một câu trả lời phổ biến: biến hình ảnh cục bộ đư ợc đo tại mọi điểm, và giá trị PEL được tính trung bình từ các vùng lân cận nơi mà kích thước và hình dạng của nó phụ thuộc vào biến cục bô ̣ Phương pháp khuếch tán tính trung bình trên các vùng miền được mở rộng bằng cách giải quyết từng phần phương trình vi phân , và được l ặp đi lặp lại Việc lặp
đi lặp lại có thể làm tăng các v ấn đề về tính ổn định và tùy thuộc vào hiệu quả của kỹ thuật tính toán Một phương pháp không lặp đi lặp lại được đề xuất cho việc duy trì độ mịn của đường nét
Nếu ba dải màu sắc hình ảnh được lọc riêng rẽ ra từ một cái khác, màu sắc
bị hỏng gần đườ ng biên ảnh Trong thực tế, các dải khác nhau có mức độ khác nhau của sự tương phản, và chú ng được làm mịn khác nhau Làm mịn tách biệt xáo trộn sự cân bằng màu sắc, và sự kết hợp màu sắc không mong đợi xuất hiện Nhưng với bộ lọc song phương, nó có thể hoạt động trên ba dải cùng m ột lúc,
Trang 22và có thể đưa ra một cách rõ ràng rằng màu sắc nào là tương t ự và màu sắc nào
là không
Ý tưởng lọc song phương cơ bản là để thực hiện trong phạm vi của một hình ảnh những gì mà các bộ lọc truyền thống làm trong phạm vi của nó Hai PEL có thể được gép với nhau để chiếm vị trí không gian kế bên, hoặc có thể là tương tự như nhau để có các giá trị kế bên, có thể trong một cách có ý nghĩa về mặt nhận thức Việc gắn kết liên quan đến vùng lân cận trong miền, tương tự với vùng lân cận trong phạm vi Lọc truyền thống là lọc miền, thực thi việc gắn kết bằng việc đánh trọng số các giá trị PEL với hệ số dưới với khoảng cách.Tương
tự như vậy, chúng tôi xác định phạm vi lọc mà trong đó trung bình giá tri ̣ PEL với tr ọng số phân rã không giống nhau Lọc phạm vi là phi tuy ến vì trọng số của chúng phụ thuộc vào cường độ hoặc màu sắc hình ảnh Tính toán, chúng có
vẻ gì phức tạp hơn các bộ lọc tiêu chuẩn không tách rời.Nhưng quan trọng nhất, chúng có thể giữ lại các đường nét hình ảnh
Miền không gian vẫn là một khái niệm rất quan trọng Trong thực tế, chúng
ta thấy rằng lọc phạm vi tự nó làm biến dạng bản đồ màu sắc của hình ảnh Khi kết hợp lọc phạm vi và miền, thấy rằng s ự kết hợp là khá thú v ị Đó gọi là lọc song phương Do lọc song phương giả định một khái niệm rõ ràng về khoảng cách trong phạm vi và trong giớ i ha ̣n chức năng ảnh, chúng có thể được áp dụng cho bất kỳ chức năng nào khi mà hai kho ảng cách có thể được xác định Đặc biệt, bộ lọc song phương có thể được áp dụng cho ảnh màu dễ dàng như áp dụng cho ảnh đen trắng Các không gian màu CIE-Lab tạo ra không gian màu sắc với một phương pháp có ý nghĩa nhâ ̣n thức tương t ự màu sắc, trong đó khoảng cách Euclide ngắn tương quan mạnh mẽ với màu sắc mà con người có thể phân bi ệt
Vì vậy, nếu chúng ta sử dụng số liệu này trong bộ lọc song phương, hình ảnh sẽ được làm mịn và đường nét đư ợc giữ theo cách đó được điều chỉnh tới cách thể hiê ̣n của con người Chỉ có màu sắc tương tự về nhận thức được tính trung bình với nhau, và chỉ những đường nét có tính nh ận thức và có th ể nhìn thấy mới được giữ lại Các khái niệm về lọc song phương sẽ được đề cập dưới đây
Trang 23là không thiên vị nếu nó chỉ phụ thuộc vào sự khác biệt 𝑓 𝜉 − 𝑓(𝑥) Sự phân
bố không gian của các cường độ ảnh không có vai trò trong lọc phạm vi được thực hiện bởi chính nó Kết hợp cường độ từ toàn bộ ảnh, tuy nhiên, làm ít hơn,
vì giá trị hình ảnh xa x nên không ảnh hưởng đến giá trị cuối cùng tại x Ngoài
ra, lọc phạm vi chỉ đơn thuần là thay đổi bản đồ màu của một hình ảnh, và do đó
ít được sử dụng Các giải pháp thích hợp là kết hợp lọc miền và lọc phạm vi,
Trang 24qua đó thực thi cả hai miền hình học và trắc quang Lọc kết hợp có thể được mô
Bây giờ một ranh giới rõ ràng giữa một vùng tối và vùng sáng, như trong hình 2.2(a) Khi bộ lọc song phương được tập trung, nói rằng, trên một PEL ở bên sáng của đư ờng biên, các hàm tương tự s của các giá trị giả định gần 1 cho các PEL trên cùng một bên, và gần 0 cho các PEL ở bên tối Các hàm tương tự được thể hiện trong hình 2.2(b) cho một bộ lọc hỗ trợ 23 × 23 tập trung hai PEL bên phải của các bước trong hình 2.2(a) Việc chuẩn hóa thuật ngữ 𝑘(𝑥) đảm bảo rằng các trọng số cho tất cả các PEL tăng thêm một Kết quả là, các bộ lọc thay thế các PEL sáng trung tâm bằng trung bình của các PEL sáng trong vùng lân cận của nó, và về cơ bản bỏ qua các PEL tối Ngược lại, khi bộ lọc tập trung vào một PEL tối, các PEL sáng được bỏ qua thay thế Vì vậy, như thể hiện trong hình 2.2(c), việc lọc được thực hiện tốt tại các ranh giới, nhờ vào thành phần của lọc miền, và các cạnh sắc nét được giữ lại đồng thời, nhờ thành phần của lọc phạm vi
Trang 25Hình 2.2: Lọc song phương (a) Một bước cấp độ màu xám 100 bị nhiễu loạn bởi nhiễu Gaussian với 𝜎 = 10 các mức xám (b) Kết hợp trọng số tương
tự 𝑐 𝛿, 𝑥 𝑠 𝑓 𝛿 , 𝑓 𝑥 cho một vùng lân cận 23 × 23 tập trung hai PEL-bên
phải của bước (a) Các thành phần của lọc phạm vi ngăn chặn hiệu quả các PEL trên bên tối (c) Bước (a) sau khi lọc song phương với 𝜎𝑟 = 50 mức xám và
𝜎𝑑 = 5 PEL
2.1.3 Trường hợp Gaussian
Một trường hợp đơn giản và quan trọng của lọc song phương là lọc Gaussian thay đổi bất biến, trong đó cả hai hàm tương đồng 𝑐(𝛿, 𝑥) và hàm tương tự 𝑠(𝜙, 𝑓) là những hàm Gaussian của khoảng cách Euclide giữa các đối
số đó Cụ thể hơn, c là đối xứng xuyên tâm
𝑐 𝜉, 𝑥 = 𝑒−
1
2 (𝑑 𝜉,𝑥
𝜎𝑑 )2 (2.7) Trong đó :
𝛿 𝜙, 𝑓 = 𝛿 𝜙 − 𝑓 = 𝜙 − 𝑓 (2.9)
là một phương pháp đo phù hợp củ a khoảng cách giữa hai giá trị cường độ
𝜙 và f Trong các trường hợp vô hướng, điều này có thể đơn giản là chênh lệch tuyệt đối của sự khác biệt PEL hay vì nhiễu tăng với cường độ ảnh, một phiên bản phụ thuộc cường độ của nó
Trang 26Sự mở rộng hình học 𝜎𝑑 trong miền được lựa chọn dựa trên số lượng mong muốn của lọc thông thấp.Một lượng lớn 𝜎𝑑 sẽ làm mờ nhiều hơn, có nghĩa
là, nó kết hợp các giá trị từ vị trí xa hình ảnh Ngoài ra, nếu một hình ảnh được thu nhỏ hoặc phóng to, 𝜎𝑑 phải được điều chỉnh cho phù hợp để có được kết quả tương đương Tương tự như vậy, sự mở rộng trắc quang 𝜎𝑟 trong phạm vi hình ảnh được thiết lập để đạt được số lượng mong muốn các PEL được kết hợp Có thể nói, PEL có giá trị gần hơn với cái khác 𝜎𝑟 được trộn lẫn với nhau và giá trị
xa hơn 𝜎𝑟 thì không.Nếu ảnh bị khuếch đại hoặc suy giảm , 𝜎𝑟 phải được điều chỉnh cho phù hợp để kết quả không thay đổi
2.1.4 Lọc song phương so với phạm vi
Khi ta kết hợp việc lọc phạm vi với việc lọc miền để tạo ra các bộ lọc song phương Ta thấy rằng sự kết hợp này là điều cần thiết Để kí hiệu đơn giản, lý thuyết giới hạn với hình ảnh đen trắng, nhưng những kết quả tương tự vẫn áp dụng tốt cho hình ảnh gồm nhiều dả Điểm chính ở đây là cho thấy việc lọc phạm vi chỉ đơn thuần là thay đổi bản đồ xám của ảnh được áp dụng Đây là một
hệ quả trực tiếp của thực tế là một bộ lọc phạm vi không có khái niệm về không gian
Hãy xem 𝑣(𝜙) là được sự phân bố tần số của các mức xám trong những hình ảnh đầu vào Trong trường hợp rời rạc 𝑣(𝜙) là biểu đồ các cấp độ màu xám 𝜙: là một số nguyên điển hình nằm trong dải từ 0 đến 255, và 𝑣(𝜙) là một phần của PEL có giá trị màu xám của 𝜙 Trong trường hợp liên tục 𝑣(𝜙)𝑑(𝜙) là một phần của vùng ảnh có giá trị xám giữa 𝜙 và 𝜙 + 𝑑𝜙
Thao tác đơn giản, bỏ qua cho sự thiếu hụt về không gian, chỉ ra r ằng các biểu thức cho bộ lọc phạm vi có thể được kết hợp như sau:
= 𝜙𝜏(∞
0
𝜙, 𝑓)𝑑𝜙 (2.10) Trong đó :
𝜏 𝜙, 𝑓 = 𝑠 𝜙,𝑓 𝑣(𝜙)
𝑠 𝜙,𝑓 𝑣 𝜙 𝑑𝜙0∞ (2.11)
Trang 27độc lập với vị trí x Phương trình (7) cho thấy việc lọc phạm vi là một chuyển đổi đơn giản về mức độ xám Các ánh xạ hạt nhân 𝜏 𝜙, 𝑓 là hàm mật độ, trong đó nó là không âm và có đơn vị tích phân.Nó bằng với biểu đồ 𝑣 𝜙 được đánh trọng số hàm tương tự s được tập trung tại f và chuẩn hóa cho đơn vị diện tích Trong đó 𝜏 chính thức là một hàm mật độ
Hình 2.3: Biểu đồ cường độ ảnh(a)Mộtbiểu đồ ảnh đơn thức 𝑣 (solid), và
chức năng tương tự Gaussian s(nét đứt) Sản phẩm chuẩn hóa của chúng 𝜏
(chấm) là bị lệch sang bên phải (b) Biểu đồ (solid) của cường độ ảnh cho các bước trong hình 2.2(a) và (nét đứt) cho ảnh được lọc trong hình 2.2(c) (c) Biểu
đồ của cường độ ảnh cho ảnh trong hình 2.6(a)(solid) và cho các ảnh đầu ra với
𝜎𝑟=100, 𝜎𝑑=3 (nét đứt) và với 𝜎𝑟=100, 𝜎𝑑=10 (chấm) từ hình 2.4
Trong thực tế, giả sử rằng các biểu đồ 𝑣(𝑓)của hình ảnh đầu vào là một đường cong đứtnhư trong hình 2.3 (a), và xem xét giá trị đầu vào của f nằm ở cả hai bên của đường cong hình chuông này Trong đó các hàm tương tự đối xứng s được tâ ̣p trung tại f, trên sườn lên của biểu đồ, các sản phẩm 𝑠𝑣 sản xuất mật độ lệch 𝜏(𝜙, 𝑓) Ở phía bên trái của chiếc chuông, 𝜏 bị nghiêng về bên ph ải, và ngược lại.Kể từ khi chuyển đổi giá trị là trung bình của mật độ lệch này, chúng ta có > 𝑓 ở phía bên trái và < 𝑓 ở phía bên phải.Như vậy, hai cánh của biểu đồ được nén lại với nhau
Lúc đầu, kết quả cho thấy rằng lọc phạm vi là một ánh xạ đơn giản của bản
đồ màu xám dường như làm cho lọc phạm vi khá không hiệu quả Mọi thứ khác
đi khi lọc phạm vi được kết hợp với bộ lọc miền để tạo thành lọc song phương, như thể hiện trong phương trình (5) và (6) Trong thực tế, xem xét đầu tiên một hàm miền tương đồng c là h ằng số trong một cửa sổ tâm tại x, và là 0 ở chỗ
Trang 28khác Sau đó, các bộ lọc song phương chỉ đơn giản là một bộ lọc phạm vi áp dụng cho các cửa sổ Ảnh được lọc vẫn là kết quả của một ánh xạ cục bộ c ủa bản đồ màu xám, nhưng rất thú vị, bởi vìánh xạ là khác nhau tại các điểm khác nhau trong hình ảnh
2.1.5 Lọc song phương với ảnh đen trắng
Chúng ta tiếp tục phân tích hiệu suất của bộ lo ̣c song phương trên hình ảnh đen trắng Hình 2.6(a) và 2.6(b) bên đưới cho thấy khả năng của bộ lọc song phương cho việc loại bỏ cáccấu trúc Một số lượng lượng tử hóa mức xám có thể được nhìn thấy trong hình 2.6(b), nhưng điều này là do quá trình in ấn, không phải bởi bộ lọc Những hình ảnh "đơn giản hóa" minh họa bằng hình 2.6(b) có thể cho thấy ích lợicủa việc nén dữ liệu mà không mất đặc tính hình dạng tổng thể trong các ứng dụng như truyền hình ảnh, chỉnh sửa hình ảnh và thao tác, mô
tả hình ảnh cho phục hồi Chú ý rằng trong bức ảnh con vượn châu Phi thì râu của nó mỏng hơn so với cửa sổ của bộ lọc và vẫn còn sắc nét sau khi lọc Các giá trị cường độ PEL tối được tính trung bình từ cả hai phía của râu, trong khi các PEL sáng từ râu được bỏ qua bởi vì các thành phần phạm vi của bộ lọc Ngược lại, khi các bộ lọc tập trung ở đâu đó trên râu thì chỉ có giá trị PEL tại râu được tính trung bình với nhau
Hình 2.4 cho thấy ảnh hưởng của các giá trị khác nhau của thông số 𝜎𝑑và
𝜎𝑟trên ảnh kết quả Các hàng tương ứng với số lượng khác nhau của lọc miền, cột là số lượng khác n hau của lọc phạm vi Khi giá trị của hằng số lọc phạm vi
𝜎𝑟 là lớn (100 hoặc 300) đối với các giá trị phạm vi tổng thể trong ảnh (từ 1 đến 254), các thành phần phạm vi của các bộ lọc có tác dụng rất ít tới 𝜎𝑑 : tất cả các giá trị PEL trong bất kỳ khu vực có cùng trọng số từ lọc phạm vi, và lọc miền hoạt động như một bộ lọc Gaussian chuẩn Hiệu ứng này có thể được nhìn thấy trong hai cột cuối cùng của hình 2.4 Đối với giá trị nhỏ hơn thông số lọc dải 𝜎𝑟(10 hoặc 30), lọc phạm vi chiếm ưu thế về mặt nhận thức, vì nó duy trì đườ ng nét
Tuy nhiên, cho 𝜎𝑑 = 10, chi tiết hình ảnh đã được loại bỏ bởi giá trị nhỏ hơn 𝜎𝑑 lại xuất hiện Điều này dường như là nghịch lý hiệu quả có thể được
Trang 29nhận thấy ở hàng cuối cùng của hình 2.4, và trong mẫu đặc biệt ấn tượng cho 𝜎𝑟
= 100, 𝜎𝑑 = 10 này hình ảnh sinh động hơn ở trên, mặc dù hơi mờ Đây là kết quả của việc chuyển đổi bản đồ màu xám và kết quả nén biểu đồ Trong thực tế,
𝜎𝑑 = 10 là một Gaussian rộng, và bộ lọc song phương một bộ lọc phạm vi Vì giá trị cường độ chỉ được ánh xạ bởi một bộ lọc phạm vi, việc mất đi các chi tiết không xảy ra Hơn nữa, kể từ khi một bộ lọc phạm vi nén các biểu đồ hình ảnh, những hình ảnh đầu ra dường như là mơ hồ Hình 2.3(c) cho thấy các biểu đồ cho các hình ảnh đầu vào và cho hai hình ảnh đầu ra cho 𝜎𝑟= 100, 𝜎𝑑 = 3, và cho 𝜎𝑟=100, 𝜎𝑑 = 10 Hiệu quả nén là hiển nhiên
Hình 2.4: Chi tiết từ hình 2.6(a) được xử lý với các bộ lọc song phương với các
giá trị phạm vi và các thông số miền khác nhau
Lọc song phương với các thông số 𝜎𝑟= 3 và 𝜎𝑟 = 50 giá trị cường độ PELđược áp dụng cho các hình ảnh trong hình 2.5(a) và 2.5(b) Chú ý rằng hầu hết các cấu trúc tốt đã được lọc đi, và tất cả các đường nét là sắc nét như trong ảnh gốc