CHƢƠNG 2 CƠ SỞ NGHIÊN CỨU
2.1 Giới thiệu ảnh số
Một ảnh thật là một hàm liên tục F(x,y) với (x,y) là các giá trị tọa độ trong không gian và biên độ của hàm F(x,y) chính là độ chói tƣơng ứng của điểm ảnh đang xét. Theo đó một ảnh số F(u,v) là một tập hợp hữu hạn các điểm đƣợc gọi là Pixel. Ảnh số đƣợc tạo ra từ quá trình lấy mẫu (sampling) và lƣợng tử hóa (quantization) một ảnh thật.
Hình 2.1 bên dƣới trình bày q trình lấy mẫu của một tín hiệu liên tục theo thời gian S(t). Theo đó mỗi điểm Si chính là giá trị của S(t) đƣợc thu thập sau mỗi một chu kì T. Chu kì T càng nhỏ thì mật độ các điểm Si sẽ tăng lên, và khi đó ta sẽ có biểu diễn gần đúng của S(t). Quá trình tƣơng tự cũng xảy ra đối với ảnh thật, tuy nhiên trên ảnh thật, việc lấy mẫu sẽ đƣợc thực hiện đồng thời ở hai trục tọa độ không gian Ox, Oy bởi một mạng cảm biến đƣợc tích hợp trong các camera. Mật độ các cảm biến quyết định chất lƣợng ảnh ngõ ra của camera.
Hình 2.1: Quá trình lấy mẫu
Nếu quá trình lấy mẫu là q trình hữu hạn hóa một tín hiệu liên tục để tạo ra một tập hữu hạn các điểm. Thì quá trình lƣợng tử là việc biểu diễn các giá trị tại các
16
điểm đƣợc lấy mẫu. Một đại lƣợng quan trong trong q trình lƣợng tử đó là số bit lƣợng tử. Số bit lƣợng tử càng lớn thì ta càng biểu diễn chính xác giá trị biên độ của tín hiệu thực và ngƣợc lại. Hình 2.2 và Hình 2.3 biểu diễn sự khác nhau giữa việc sử dụng hai bit và ba bit lƣợng tử để biểu diễn biên độ của tín hiệu liên tục (đƣờng màu đỏ). Ta có thể thấy rằng, đƣờng giá trị sau khi đƣợc lƣợng tử (đƣờng màu xanh) ở trƣờng hợp 3 bit biểu diễn chính xác hơn giá trị của tín hiệu liên tục.
Hình 2.2: Lƣợng tử hai bit
Hình 2.3: Lƣợng tử 3 bit
Việc tăng số lƣợng bit lƣợng tử sẽ tăng độ chính xác của ảnh. Tuy nhiên nó cũng đồng thời làm tăng kích thƣớc ảnh, gây khó khăn cho việc lƣu trữ, xử lý ảnh trong các thiết bị điện tử. Trên thực tế, hầu hết các ứng dụng đều sử dụng ảnh với số bit lƣợng tử là 8 bit. Các ảnh có số bit lƣợng tử lớn hơn (16 hoặc 32) thƣờng chỉ đƣợc sử dụng cho những ứng dụng có yêu cầu cao về chất lƣợng ảnh nhƣ: y tế, quan
17
trắc … Trong phạm vi luận văn này, học viên sử dung ảnh với 8 bit lƣợng tử, đây là ảnh có thể dễ dàng thu thập từ các camera thông dụng.
Một ảnh số thƣờng đƣợc biểu diễn dƣới đạng một ma trận có kích thƣớc “MxN” với M, N tƣơng ứng là số lƣợng pixel trên chiều dài và chiều rộng của ảnh. Và các ảnh số thƣờng đƣợc phân loại thành: ảnh nhị phân, ảnh đa mức xám, ảnh màu.
2.1.1 Ảnh màu
Ảnh màu là ảnh thể hiện đƣợc màu sắc của đối tƣợng chụp. Có nhiều hệ màu có thể đƣợc áp dụng để thể hiện đƣợc màu sắc của ảnh chụp ví dụ nhƣ: RGB, YUV, YCbCr, YMCK, HSV … Tuy nhiên thông dụng nhất vẫn là RGB. Trong hệ màu RGB, tất cả các màu sắc đều có thể đƣa về thành một bộ 3 giá trị màu cơ bản là Đỏ (Red), Xanh lá (Green) và Xanh dƣơng (Blue). Theo đó mỗi Pixel sẽ gồm 3 giá trị màu riêng biệt R, G và B tƣơng ứng với độ nhạy sáng đối với ba loại ánh sáng: đỏ, xanh lục và xanh lá.
Hình 2.4: Hệ màu RGB
Một ảnh màu sử dụng hệ màu RGB sẽ đƣợc biểu diễn bởi một ma trận 3 chiều “M x N x 3” với M, N là kích thƣớc ảnh, và 3 chính là số thành phần màu.
2.1.2 Ảnh xám
Ảnh xám là ảnh biểu diễn độ nhạy sáng đối với ánh sáng trắng. Theo đó mỗi pixel sẽ chứa thông tin cƣờng độ của ánh sáng trắng, và ta có thể chuyển đổi dễ dàng từ ảnh RGB sang ảnh xám bằng công thức:
18
Hình 2.5: Ảnh xám
Hinh 2.6: Đồ thị mức xám của vết nứt
Một ảnh xám đƣợc biểu diễn bởi một ma trận hai chiều có kích thƣớc mà MxN. Hình 2.5 và Hinh 2.6 biểu diễn ảnh mức xám, cũng nhƣ đồ thị mức xám đối với vết nứt trên ảnh.
Ta có thể thấy rằng, đối với ảnh xám của hình chụp vết nứt. Phần khơng nứt sẽ có giá trị độ sáng lớn hơn so với phần bị nứt. Vì thế ta có thể chuyển đổi ảnh vết nứt sang ảnh xám rồi dựa vào sự khác biệt về cƣờng độ giữa vùng nứt và không nứt để phát hiện vết nứt.
19
2.1.3 Ảnh nhị nhân
Ảnh đƣợc biểu diễn bởi một ma trận hai chiều thuộc kiểu logical. Mỗi điểm ảnh chỉ có thể nhận một trong hai giá trị là 0 (đen) hoặc 1 (trắng).
Hình 2.7: Ảnh nhị phân biểu diễn dƣới dạng số 2.2 Nhị phân hóa 2.2 Nhị phân hóa
2.2.1 Phân ngƣỡng nhị phân
Khi xem xét ảnh xám của vết nứt nhƣ ở Hình 2.5, ta có thể dễ dàng nhận ra rằng phần vết nứt sẽ có màu tối hơn thành phần bê tơng khơng có vết nứt. Khi đó ta có thể phân đoạn vết nứt trên ảnh I(x,y) bằng cách lựa chọn một ngƣỡng k thích hợp. Theo đó
Hình 2.8 minh họa việc chọn ngƣỡng k dựa trên histogram của một ảnh I(x,y). Về căn bản, Histogram là đồ thị thể hiện tần số phân bố của các giá trị trên ảnh (trong trƣờng hợp này chính là các giá trị cƣờng độ của ảnh xám I(x,y)). Giá trị phân ngƣỡng K nên đƣợc chọn để có thể phân tách đƣợc hai vùng có histogram lớn nhất. Và theo nhƣ nhận xét ở trên, thì vùng có vết nứt sẽ “tối” hơn vùng bình thƣờng do đó phần vết nứt sẽ là vùng Class 0 trên đồ thị.
( ) { ( )
20
Hình 2.8: Hình ảnh phân ngƣỡng