Kỹ thuật kết nhóm

4.5.1 Khởi tạo nhóm

Kỹ thuật được sử dụng để khởi tạo nhóm chính là thuật toán K-means, thuật toán này dựa vào dữ liệu trên cơ sở phân tích histogram của ảnh, để tránh trường hợp có quá nhiều nhóm có các pixel giống nhau, mà lẽ ra nó phải được kết hợp trong một không gian màu đồng nhất, là do ta chọn số lượng quá lớn các nhóm. Trong trường hợp ảnh màu ba chiều thì cách tiếp cận dựa vào histogram là thuận lợi, vì chỉ cần kết hợp bằng một mã để

thực hiện mà không cần một vị trí rỗng để nhớ bất kỳ của phần tử

nào cho Histogram. Ý tưởng cơ bản để thực hiện cho Histogram 3-D bằng cách sử dụng 1-D và mỗi pixel chỉ tính các phần tử đồng nhất nhau. Từ các giá trị trong không gian RGB theo công thức 4.1 ta sẽ tính được phần tử đồng nhất này

“Unique number”[i] = R[i] + G[i]*L + B[i]*L2 (4.1)

Ởđây i là các pixel đồng nhất nhau và L là giá trị cực đại của mức xám trên ảnh mà thông thường là 255

Để tối thiểu hoá bộ nhớ lưu trữ và truy cập dữ liệu một cách nhanh không bị mất thông tin, ta lưu trữ dữ liệu theo cấu trúc cây cân bằng (B-tree). Nhằm thực hiện để lưu trữ histogram 1-D. Ý tưởng về cấu trúc dữ liệu B-tree được xây dựng dựa trên cây cân bằng multi-way, với mỗi lần truy cập sẽ trao quyền lại cho multi- point, mỗi khối được giải mã sẽ truy cập lại, từ khối này sẽ quyết

định một multi-way được thực thi cho khối kế tiếp truy cập. Chú ý rằng từ dạng lưu trữ dữ liệu một chiều, để đảm bảo việc lưu trữ đặc trưng của cấu trúc và thông tin chứa trong đó không bị mất.

Trường hợp chọn giá trị khởi tạo ban đầu nhỏ, có thể các nhóm sẽ không được mô tả đầy đủ, chúng ta áp dụng một kỹ thuật khởi tạo có hiệu quả liên quan đến dữ liệu tốc độ cao. Dựa vào

đặc tính và phân bố dữ liệu mà ta có thể mô tả dữ liệu bằng chiều và giá trị riêng của nó, đó cũng là cách thay đổi kiểu phân bố theo các trục tương ứng. Phân tích các thành phần chính (PCA) của một ảnh cho ta phân bố màu của nó có dạng hình thon dài như

hình 4.6 với trục dài nhất của nó mô tả mức xám theo đường chéo trong không gian màu RGB, từ đường này chúng ta có thể chọn theo mức xám. Trong ứng dụng của chúng ta chọn theo thành phần chính, nhằm đủ số lượng để mô tả tất cả các sắc màu khác nhau cho các kết cấu thay đổi mạnh, như ở hình 4.4c chỉ sự phân bố màu của vị trí 25 điểm cốt lõi, được sử dụng phân chia cho giá trị khởi tạo tương ứng cho 25 nhóm. Mỗi lần lặp trọng tâm của nhóm được tính lại và đánh dấu lại các nhóm mới cho đến khi nào sự phân chia dữ liệu không thay đổi, khi đó mới hoàn tất công việc.

4.5.2 Kết hợp các nhóm màu giống nhau

Giai đoạn khởi tạo nhóm sẽ tạo ra số lượng lớn các nhóm nhỏ mà nó được xem như cùng màu với nhau. Để đồng nhất các

nhóm màu được xem như giống nhau về màu sắc, chúng ta phải biến đổi dữ liệu sang không gian màu CIE. Bước này rất cần thiết, bởi gì như đã phân tích ở mục 4.4, khoảng cách Euclidean trong không gian RGB thì không phản ánh được sự giống nhau của các màu sắc. Việc biến đổi dữ liệu thu được trong giai đoạn khởi tạo nhóm chỉ giữ lại các nhãn tương ứng của lớp đó. Ta đo

được sự khác biệt về màu sắc của tất cả các màu trong toàn bộ

các nhóm mà chúng thể hiện, từ các giá trị trung bình và trị riêng của từng nhóm, chúng ta kết hợp các nhóm với các màu khác nhau và giá trị này không lớn hơn giá trị của ngưỡng đã được

định trước. Khi hai nhóm bất kỳ được kết hợp lại, một nhãn mới của nhóm được ký hiệu lại, để tiếp tục kết nhóm cho nhóm mới. Nhóm mới này có trị trung bình là μkđược tính theo biểu thức

j i j j i i k N N N N + + = μ μ μ (4.2) Với μi,μj là trị trung bình của nhóm và Ni,Njlà số của các pixel trong nhóm thứ i và thứ j. Việc tính toán để cập nhật lại giá trị mới, nhằm tạo ra cho phép kết nhóm phù hợp hơn và cũng phù hợp với khoảng cách hình học trong không gian màu mà khi quan sát có thể phân biệt được sự khác nhau về màu sắc. Quá trình kết hợp là quá trình truy hồi và được lập lại nhiều lần đến khi không bỏ sót nhóm nào và đồng thời giảm nhỏ giá trị ngưỡng. Cuối cùng kết thúc quá trình kết hợp từng nhóm con, nhãn của nhóm từ các quá trình trên được lưu lại

4.5.3 Làm nhẵn đường biên theo phương pháp hình học

Điểm đáng chú ý là cả giai đoạn tạo dữ liệu chuẩn và giai

là loại ảnh màu được phân tích thành từng nhóm của các ảnh nhị

phân theo các giá trung bình của nhóm màu trên ảnh. Quá trình này chỉ dựa vào phân bố của không gian đặc trưng mà không xem xét đến không gian phân bố của các pixel. Do đó kết quả các

ảnh nhị phân có thể có các lỗ nhỏ và các pixel riêng lẻ không rõ ràng, điều này có thể tạo ra cho ta cảm giác như là một kết cấu dạng sợi, ngược lại để kết cấu có dạng các vùng màu giống nhau mà khi một người nhìn vào chúng sẽ thấy được đó là các vùng khác nhau. Vì thế mỗi ảnh nhị phân được làm trơn bằng phương pháp hình học. Hai thuật toán chủ yếu được thực hiện đó là thuật toán mở và thuật toán đóng được giới thiệu ở mục 2.3 .

• Thuật toán mở: là thuật toán dùng để làm trơn tru cho các

đường bao của một vùng, làm liền các nơi gấp khúc hẹp và loại bỏ đi những nơi nhô ra

• Thuật toán đóng: thuật toán này được thực hiện để làm trơn tru các đoạn của một vùng nhưng ngược lại với thuật toán mở

nó làm lì các vết bẻ gãy hẹp và kéo dài thêm vùng lỏm vào nhằm loại trừ các lỗ nhỏ, và điền đầy khoảng trống trong vùng. Sau đây thuật toán đóng(A•B) và mở (AoB)được thực hiện dựa vào loại màu của ảnh biến đổi dạng ảnh nhị phân

¾ (AoB) là thuật toán mở được định nghĩa như sau

(A Θ B) ⊕ B = dilate[ errode (A, B), B] (4.3a)

¾ (A•B) là thuật toán đóng được định nghĩa như sau

(A ⊕ B) Θ B = errode [dilate (A, -B), -B] (4.3b)

Ở đây A là một ảnh lớp nhị phân, B là một mặt nạ dạng ma trận đơn vị 3x3, trong trường hợp của chúng ta -B thì giống như B và ⊕, Θ là phép cộng và trừ Minkowski. Mỗi khi phép toán hình

học được thực hiện, một ảnh nhị phân của các lớp sẽ được loại bỏ nhiễu và các lớp được định nghĩa tốt hơn

4.6 CHỌN NGƯỠNG THEO KẾT CẤU ẢNH [19], [23], [24]

Trong phần này chúng ta mô tả theo cách khác, một kỹ thuật để

kết nhóm nhanh hơn trong công việc phân lớp ảnh màu. Trong phương pháp này. Đầu tiên chúng ta lượng tử hoá ảnh màu RGB thành một ảnh xám bằng công thức (4.4) b g r G . I . I . I I =0299 +0587 +0114 (4.4)

Ở đây Ir, Ig, Ib là cường độ sáng của ảnh trong không gian RGB, và IG là cường độ sáng của ảnh xám

Tiếp theo chúng ta sẽ tính toán histogram của ảnh xám. Sử dụng giá trị đỉnh “peak” của histogram, ảnh sẽđược chọn ngưỡng từ hai giá trị peak±b của ảnh nhị phân, ở đây b là một số nguyên nhỏ. Trong

ứng dụng này nó được chọn bằng 5, tuy nhiên điều này có thể thay

đổi để phù hợp cho từng kết cấu ảnh, và nó được thực hiện trong giai

đoạn tạo dữ liệu chuẩn. Vấn đề này sẽ loại bỏ hai giá trị lớn nhất của các pixel có cùng mức xám từ giá trị ngưỡng chọn được xem vùng đó như là một bóng đổ hay màu nền

Trong khi đặt hai giá trị ngưỡng cho ảnh ta sẽ gặp một vài lỗi có cường độ sáng hay tối. Khi chọn ngưỡng lỗi màu sáng và một vài lỗi nhỏ có thể xuất hiện lỗi trong vùng nền. Bằng cách xem hai giá trị

ngưỡng của ảnh theo thuật toán dilation và erosion ở mục 2.3 các lỗi sáng và tối này sẽ được xác định. Tuy nhiên kỹ thuật này không phân biệt được chính xác ranh giới của các màu khác nhau như trong kỹ

Một lần nữa chúng ta thực hiện phép làm nhẵn bề mặt theo

đường hình học cho ảnh, điều này sẽ bỏ sót hai nhóm có kết cấu thay

đổi theo vùng nền hay bóng đổ mà chúng ta coi đó như một lớp màu

Đây là cách để đánh giá lỗi mà ngõ vào của ảnh được xấp xỉ dựa trên tính chất thay đổi của kết cấu trong một vài loại màu. Điều này rất hiệu quả nó cho phép chúng ta thực hiện phân đoạn nhiều màu sắc trong không gian màu

4.7 CÁC PHƯƠNG PHÁP TÌM LỖI [18], [22], [25], [26] 4.7.1 Tìm lỗi màu bằng luật quyết định Bayes 4.7.1 Tìm lỗi màu bằng luật quyết định Bayes

Trong giai đoạn cuối cùng chúng ta chia phần nhận dạng lỗi ra hai giai đoạn chính đó là giai đoạn kiểm định màu sắc và nhận dạng lỗi

Chúng ta giả sử rằng điều kiện mật độ xác suất của các lớp cho mỗi loại màu là wk(wk ={ωi;i=1,...n}) được liên tục bằng hàm một hàm multi-modal

Mỗi nhóm con của một loại màu có giá trị trung bình là μi và xác suất tại một thời điểm i là P( )ωi cho một pixel sẽ bằng Ni/N. Các chế độ của hàm multi-modal này sẽ được thiết lập liên tục giai đoạn huấn luyện và được mô tả lại bằng các thống kê màu trong giai đoạn tách các lớp màu

Việc đánh giá màu theo kỹ thuật này, được sử dụng phương pháp tính sai số tối thiểu Bayes theo biểu thức sau

( ) ( ) ( i) T i i f f f J = −μ −μ 2 1 ∀f ∈ωi (4.5)

Ở đây f là vector đặc trưng trong không gian RGB của mỗi pixel trong gian đoạn kiểm tra ảnh. Luật quyết định Bayes phân lớp một pixel trong một loại màu sắc wknếu và chỉ nếu

( ) ( )f J f

Jj > i Ởđây ωj∈wk,∀(i≠ j) (4.6) Và cờ báo dạng nhị phân cho mỗi pixel sẽ chọn loại màu

tương ứng. Khi đó một nhóm của các lớp màu sẽ tạo thành một

ảnh nhị phân. Các pixel mà giá trị thuộc Ji ở tất cả các lớp wk

nhỏ hơn mức ngưỡng thì không được chấp nhận và nó được xem như là một lỗi màu

4.7.2 Tìm lỗi bằng kỹ thuật truy hồi trạng thái hình học

Kỹ thuật này được quan tâm chủ yếu cho công việc dò tìm lỗi từ các lớp màu thông thường. Chúng ta xét ảnh có dạng kết cấu tổng quát và kích thước của lỗi thì lớn hơn các đặc trưng chung của một kết cấu ngẫu nhiên. Ở điểm này hầu hết các ảnh được kết nhóm dạng nhị phân bao gồm các lớp nhỏ mô tả bề mặt tổng quát của kết cấu, và sẽ có các lớp màu của một hay nhiều nhóm có thể lớn hơn kích thước chuẩn một ít. Bằng cách thực hiện truy hồi của phép toán làm xói mòn (Erosion) cho mỗi nhóm, các nhóm chứa lỗi đòi hỏi phải có số lần lặp lớn hơn K để thực hiện hoàn thành ta so sánh nhóm lỗi với nhóm đối chiếu được tạo từ

trong giai đoạn tạo dữ liệu chuẩn. Độ lớn của K và sự khác biệt về số lượng các pixel ở mỗi lần lặp sẽ được xác định nếu như lớp

đó có lỗi. Đôi khi thông tin trên mỗi lớp của mỗi nhóm cũng thay

đổi, chúng ta sẽ quay lại nhóm đã làm sai để xác định chính xác vị trí của lớp bị lỗi

Trong trường hợp ngược lại, lỗi nhỏ hơn đặc trưng của kết cấu tổng quát. Sự kết hợp các loại lớp sẽ thu được bằng việc phủ

nhận các lớp nguyên thuỷ và việc dò lỗi sẽ theo phương pháp lập và phép toán làm dãn ra (Dilation)

Vì thế chúng ta thực hiện quá trình truy hồi trạng thái hình học dựa vào các ảnh mẫu tốt, sau đó ghi nhận thông tin xem như

số lần lặp được yêu cầu trước, mỗi ảnh kết nhóm nhị phân được sử dụng hết và sẽ đếm các pixel còn dư thừa tại mỗi giai đoạn. Sau đó mỗi ảnh kiểm tra sau khi phân lớp màu và sử dụng giá trị

khởi tạo 0

A ảnh nhị phân cho nhóm i, chúng ta thực hiện phép Erosion hay Dilation truy hồi trạng thái hình học cho mỗi nhóm màu. Trong thuật toán Erosion được tính theo công thức (4.7)

{d E :d b An b B} i ∀ ∈ ∈ + ∈ = 2 (4.7)

B là thành phần cơ sở và E mô tả trong không gian hai chiều (không gian Enclidean)

4.7.3 Tìm lỗi bằng kỹ thuật so sánh diện tích các lớp màu

Phương pháp này dựa vào các thành phần trong giai đoạn kết nhóm đã được gán nhãn và ký hiệu trước. Việc kết hợp các thành phần được gán nhãn nhằm đưa ra vị trí bất thường vì chúng có giá trị trung bình của các lớp quá lớn, giá trị này cũng chính là các đặc tính chung cho các điểm dữ liệu có lỗi của một kết cấu. Sự kết hợp các thành phần đã được gán nhãn của ảnh nhị phân được thực hiện như sau

o Chúng ta xác định vùng lớn nhất được coi là hình nền và nó sẽ không được quan tâm.

o Chúng ta đánh dấu vùng P1 và P2 xem như là hai vùng lớn nhất. Hai vùng này được tạo ra một cách tự nhiên thậm chí

cả kết cấu ngẫu nhiên, trong gian đoạn tạo dữ liệu chuẩn, tỉ

số của hai vùng P1 và P2 này sẽ tiến gần đến 1

o Trong giai đoạn tìm lỗi nếu gạch tạo ra có lỗi bất thường lớn thì tỉ số này sẽ lớn hơn giá trị cho phép và vì thế ảnh cũng

được đánh giá là có lỗi

o Trong giai đoạn tìm lỗi chúng ta có thể sử dụng giá trị P1 của giai đoạn tạo dữ liệu chuẩn thay vì sử dụng P1 của chính ảnh kiểm tra

Điểm thuận lợi trong kỹ thuật này là ta có thể loại bỏ không cần giai đoạn tạo dữ liệu chuẩn

Điều bất lợi của phương pháp này là nó chỉ phù hợp cho các kết cấu ảnh đặc biệt, ở những nơi các lỗi lớn hơn đặc tính tổng quát của kết cấu sẽ không phát hiện được

Đặc biệt kỹ thuật này sử dụng giống như phương pháp ở

mục 4.6 với yêu cầu thời gian xử lý nhanh hơn các kỹ thuật khác. Vì thế nó cũng được chú ý và tìm các kết cấu ảnh phù hợp. Chú ý vị trí của các lỗi cũng tìm được bằng phương pháp này, bằng cách quay ngược lại thành phần nguyên thuỷ hay định ngưỡng cho ảnh sử dụng vùng có nhãn P1. Hơn thế nữa giai đoạn huấn luyện trong kỹ thuật này thật sự không cần thiết. Tuy nhiên nếu chúng ta thực hiện giai đoạn này thì cũng được xem xét rất cẩn thận

4.7.4 Khoanh vùng phần bị lỗi

Kết quả cuối cùng sau khi tìm được lỗi trên bề mặt, đôi khi ta chỉ cần xác định sản phẩm có lỗi hay không có lỗi là đủ, điều này sẽ giúp ta giảm thời gian xử lý và nó cũng rất phù hợp với công việc tìm lỗi cho các sản phẩm di chuyển trên băng tải

Tuy nhiên khi sản phẩm có lỗi nhất là lỗi về màu, thì vấn đề

kiểm tra và sửa chữa các thiết bị pha trộn màu của máy móc cũng rất cần thiết. Vì lẽ đó nếu ta thực hiện một hệ thống tìm lỗi hoàn chỉnh thì khi hệ thống báo có lỗi đến một mức độ nào đó không thể chấp nhận, ta phải khoanh vùng nơi bị lỗi để xác định chính xác màu bị lỗi để thay thế hay sửa chữa lại hệ thống

Để khoanh vùng các điểm bị lỗi trên một ảnh, có rất nhiều phương pháp thực hiện tuy nhiên trong đề tài này kỹ thuật được áp dụng dựa vào các pixel bị lỗi đã tìm, ta sử dụng một cửa sổ

Các phép toán hình học cơ bản

Các phương pháp phân lớp ảnh