Histogram là một đồ thị. Histogram thể hiện tần số của mọi thứ. Thông thường Histogram có các thanh đại diện cho tần số xuất hiện của dữ liệu hay nói cách khác là Histogram hiển thị sự phân bố tần số của một tập dữ liệu. Một Histogram có hai trục: trục x và trục y. Trục x chứa các điểm có sự phân bố tần số. Trục y chứa tần số. Các độ cao khác nhau của thanh cho thấy tần số khác nhau của sự xuất hiện của dữ liệu. Ứng dụng của Histogram dùng để phân tích hình ảnh, cân bằng một hình ảnh, tạo ngưỡng cho ảnh. Dự đoán về một hình ảnh bằng cách chỉ nhìn vào biểu đồ của nó.
Histogram equalization là một phương pháp phổ biến được dùng để tăng chất lượng của ảnh, cụ thể là tăng độ tương phản.
16
Xem xét một hàm moment liên tục, và đặt biến r đại diện cho mức xám của ảnh cần được nâng cao chất lượng. Trong phần đầu giả sử rằng r được chuẩn hóa trong khoảng [0,1], với 𝑟 = 0 là màu đen và 𝑟 = 1 là màu trắng. Sau đó, xem xét công thức rời rạc và cho phép giá trị pixel trong khoảng [0, 𝐿 − 1].
Đối với r bất kì thỏa mãn điều kiện đề cập trên đây, ta tập trung sự chú ý trên sự biến đổi của dạng:
𝑠 = 𝑇(𝑟) 0 ≤ 𝑟 ≤ 1 (3.1)
Điều này tạo ra một mức 𝑠 cho mọi giá trị pixel 𝑟 trong ảnh gốc. Giả sử rằng hàm chuyển đổi T(r) thỏa mãn các điều kiện dưới đây:
(a) 𝑻(𝒓) là giá trị đơn và đồng biến tăng trong khoảng 𝟎 ≤ 𝒓 ≤ 𝟏; và (b) 𝟎 ≤ 𝑻(𝒓) ≤ 𝟏 với 𝟎 ≤ 𝒓 ≤ 𝟏.
Yêu cầu trong (a) rằng 𝑇(𝑟) là giá trị đơn là cần thiết để đảm bảo rằng biến đổi ngược sẽ tồn tại, và điều kiện đồng biến đảm bảo sự tăng bậc từ đen sang trắng trong ảnh đầu ra. Một hàm biến đổi mà không đồng biến tăng có thể dẫn đến ít nhất một phần của khoảng độ sáng bị đảo ngược, từ đó tạo ra một số mức xám bị đảo ngược trong ảnh đầu ra. Trong khi điều này có thể là một tác dụng mong muốn trong một số trường hợp đặc biệt, nó không được đề cập ở đây. Cuối cùng, điều kiện (b) đảm bảo rằng các mức xám ngõ ra sẽ nằm trong cùng một khoảng như các mức ngõ vào. Hình 5.1 là một ví dụ của hàm chuyển đổi thỏa mãn cả 2 điều kiện (a) và (b) này. Biến đổi ngược từ s trở về r được định nghĩa như sau:
17
Hình 3.3: Một hàm chuyển đổi mức xám mà có giá trị đơn và đồng biến tăng
Mức xám trong một ảnh có thể được xem như những biến ngẫu nhiên trong khoảng [0,1]. Một trong những bộ mô tả cơ bản nhất của một biến ngẫu nhiên là hàm mật độ xác suất (PDF). Đặt 𝑝𝑟(𝑟) và 𝑝𝑠(𝑠) lần lượt là các hàm mật độ xác suất của các biến ngẫu nhiên r và s, trong đó chỉ số này được đặt dưới p nhằm định nghĩa rằng 𝑝𝑟 và 𝑝𝑠 là hai ham fkhasc nhau. Một kết quả cơ bản từ một lý thuyết xác suất sơ cấp là nếu 𝑝𝑟(𝑟) và 𝑇(𝑟) biết trước và 𝑇−1(𝑠) thỏa điều kiện (a), từ đó hàm mật độ xác suất 𝑝𝑠(𝑠) của biến được chuyển đổi s có thể thư được bằng cách sử dụng công thức sau:
𝑝𝑠(𝑠) = 𝑝𝑟(𝑟) |𝑑𝑟𝑑𝑠| (3.3)
Do đó, hàm mạ độ xác suất của biến được chuyển đổi 𝑠 được xác định bởi hàm mật độ xác suất mức xám của ảnh đầu vào và bằng hàm biến đổi cho trước.
Một hàm chuyển đổi quan trọng trong xử lí ảnh có dạng:
𝑠 = 𝑇(𝑟) = ∫0𝑟𝑝𝑟(𝑤)𝑑𝑤 (3.4)
Trong đó w là một biến giả của tích phân. Vế phải phương trình (2.4) được nhận ra như là hàm phân bố tích lũy của biến ngẫu nhiên 𝑟. Vì các hàm mật độ xác suất luôn luôn dương, và nhắc rằng tích phân của một hàm là diện tích vùng dưới hàm, dẫn đến hàm chuyển đổi này có giá trị đơn và đồng biến tăng, và từ đó thỏa mãn điều kiện (a). Tương tự, tích phân của hàm mật độ xác suất đối với các biến trong khoảng [0, 1] cũng
18
nằm trong khoảng [0,1] nên điều kiện (b) cũng thỏa mãn. Cho hàm chuyển đổi 𝑇(𝑟), tìm ra 𝑝𝑠(𝑠) bằng cách áp dụng phương trình (3.3). Biết được từ phép tính cơ bản (Leibiniz’s rule) rằng vi phân của một tích phân hữu hạn theo giới hạn trên là tích phân được tính ở giới hạn đó. Cụ thể là:
𝑑𝑠
𝑑𝑟=𝑑𝑇(𝑟)𝑑𝑟 =𝑑𝑟𝑑 [∫ 𝑝𝑟(𝑤)0𝑟 ] = 𝑝𝑟(𝑟) (3.5)
Thay kết quả này cho 𝑑𝑟/𝑑𝑠 vào phương trình (5.3), và lưu ý rằng tất cả các giá trị là dương, thu được:
𝑝𝑠(𝑠) = 𝑝𝑟(𝑟) |𝑑𝑟
𝑑𝑠| = 𝑝𝑟(𝑟) | 1
𝑝𝑟(𝑟)| = 1 (3.6)
(0 ≤ 𝑠 ≤1)
Vì 𝑝𝑠(𝑠) là hàm mật dộ xác suất, dẫn đến nó phải bằng 0 bên ngoài khoảng [0,1], trong trường hợp này bởi vì tích phân của nó trên tất cả giá trị của s phải bằng 1. Ta nhận ra dạng của 𝑝𝑠(𝑠) được cho trong phương trình (3.6) như là hàm mật độ xác suất đồng bộ. Nói một cách đơn giản, ta đã chứng minh rang thực hiện hàm chuyển đổi được cho trong (3.4) thu được một biến ngẫu nhiên s được đặc trưng bởi một hàm mật độ xác suất đồng bộ. Một lưu ý quan trọng từ phương trình (3.4) rằng 𝑇(𝑟) phụ thuộc vào 𝑝𝑟(𝑟), nhưng như đã được đề cập trước đó trong phương trình (3.4), 𝑝𝑠(𝑠) tính được luôn đồng bộ, độc lập với 𝑝𝑟(𝑟). Đối với các giá trị rời rạc ta xử lí xác suất và tổng hợp thay vì hàm mật độ xác suất và tích phân. Xác suất xảy ra của mức xám 𝑟𝑘 trong một ảnh được xấp xỉ bởi:
𝑝𝑟(𝑟𝑘) =𝑛𝑘
𝑛 𝑘 = 0,1,2, … , 𝐿 − 1 (3.7) Trong đó, như đã được nói đến trong phần trên, 𝑛 là số pixel của ảnh, 𝑛𝑘 là số pixel có mức xám 𝑟𝑘, và 𝐿 là số mức xám của ảnh. Hàm biến đổi rời rạc của phương trình (2.4) là:
𝑠𝑘 = 𝑇(𝑟𝑘) = ∑𝑘 𝑝𝑟(𝑟𝑗)
𝑗=0 = ∑𝑘 𝑛𝑛𝑗
𝑗=0 (3.8)
19
Do đó, một ảnh đã được xử lí thu được bởi việc mapping các pixel với mức 𝑟𝑘 trong ảnh đầu vào tới một pixel tương ứng với mức 𝑠𝑘 trong ảnh ngõ ra qua phương trình (2.8). Như được trình bày trước đó, sự biểu diễn 𝑟𝑘 đ ược gọi là histogram. Sự chuyển đổi (mapping) được cho trong phương trình (2.8) được gọi là cân bằng histogram (histogram equalization hay histogram linearization).
Không giống như bản sao liên tục của nó, nó có thể được chứng minh một cách tổng quát rằng biến đổi rời rạc sẽ tạo ra sự tương đương rời rạc của một hàm mật độ xác suất đồng dạng, được gọi là histogram đồng dạng. Tuy nhiên, việc sử dụng phương trình (5.8) có xu hướng chung là trải histogram của ảnh đầu vào từ đó các mức của ảnh được cân bằng histogram sẽ trải đều hơn trên khoảng mức xám.
Nhiều ưu điểm của việc có các mức xám bao phủ cả miền giá trị đã được trình bày. Bên cạnh việc tạo ra các mức xám cso xu hướng này, phương pháp này có ưu điểm nữa là nó hoàn toàn tự động. Nói cách khác, cho một ảnh, quá trình cân bằng histogram bao gồm việc thực hiện (5.8), dựa trên thông tin có thể được trích ra trực tiếp từ ảnh cho trước, không cần thêm thông tin cụ thể. Sự đơn giản của việc tính toán cũng là một ưu điểm để kĩ thuật này được ứng ụng rộng rãi.
Biến đổi ngược từ s trở về r được định nghĩa bởi:
𝑟𝑘 = 𝑇−1(𝑠𝑘), 𝑘 = 0,1,2, … , 𝐿 − 1 (3.9) Phương pháp này thường tăng độ tương phản toàn cục của nhiều ảnh, đặc biệt khi dữ liệu được sử dụng của ảnh được biể diễn bởi các giá trị tương phản gần nhau. Thông qua sự điềuc hỉnh này, độ sáng có thể được cải thiện trên hsstogram. Điều này cho phép các khu vực có độ tương phản cục bộ thấp hơn thu được tương phản cao hơn. Cân bằng histogram đạt được điều này bằng cách trải ra một cách hiệu quả các giá trị độ sáng có tần suất xuất hiện nhiều nhất.
20