Phát hiện lỗi màu trên gạch men

Kỹ thuật tìm lỗi màu trên gạch men, phân tích các thành phần của ảnh theo kết cấu, phương pháp sử dụng thuật toán K-means trong đề tài này cũng là một kỹ thuật được áp dụng khá rộng rãi,

Trang 1

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

NGƯỜI HƯỚNG DẪN KHOA HỌC

PGS TS NGUYỄN HỮU PHƯƠNG

Tp.HCM – 2008

Trang 2

Tôi xin chân thành cảm ơn thầy PGS TS Nguyễn Hữu Phương, người

đã hướng dẫn, tận tình chỉ bảo và tạo điều kiện thuận lợi cho tôi hoàn thành tốt luận văn tốt nghiệp

Tôi xin chân thành cảm ơn quý thầy cô khoa điện tử viễn thông của trường Đại Học Khoa Học Tự Nhiên, đã hết lòng giảng dạy và truyền đạt kiến thức giúp đỡ tôi trong suốt thời gian ở trường, đồng thời tôi cũng cảm

ơn Th.S Đặng Quang Vinh người hỗ trợ và giúp đỡ tôi thực hiện hoàn thành tốt đề tài

Cuối cùng, tôi cũng xin gửi lời cảm ơn gia đình, bạn bè cùng lớp và đồng nghiệp đã hỗ trợ động viên tôi trong suốt quá trình học tập và thực hiện luận văn tốt nghiệp này

Tác giả

Trang 3

Mục lục

Danh mục các ký hiệu và các chữ viết tắt

Danh mục các bảng

Danh mục các hình vẽ, đồ thị

LỜI NÓI ĐẦU

Chương 1 – GIỚI THIỆU TỔNG QUAN

1.1 Tổng quan về phương pháp tìm lỗi bề mặt 1

1.2 Màu sắc và kết cấu bề mặt của gạch 3

1.3 Các nghiên cứu trước đây 4

1.3.1 Phương pháp biến đổi DWHT (Directional Walsh-Hadamard Transform) 4

1.3.2 Phương pháp dùng lọc Gabor 6

1.3.3 Phương pháp GLCM (Grey Level Co-occurrence Matrices) 9

1.3.4 Phương pháp tìm lỗi dùng mạng neural 11

Chương 2 – CƠ SỞ PHÂN TÍCH 2.1 Chuyển đổi giữa các không gian màu 13

2.2 Phân tích các thành phần chính (PCA) 20

2.2.1 Thành phần chính 20

2.2.2 Tối thiểu hóa sự sai biệt của PCA 25

2.2.3 Tính bình phương sai số tối thiểu của PCA 27

2.2.4 Chọn thành phần chính 28

2.3 Các phép toán hình học cơ bản 30

2.4 Luật quyết định Bayes 36

Chương 3 – PHÂN TÍCH ĐẶC TRƯNG KẾT CẤU 3.1 Giới thiệu các loại đặc trưng kết cấu ảnh 47

3.2 Các phương pháp phân lớp ảnh 49

Trang 4

3.2.2 Phân lớp KNN (K-Nearest Neighbourhood) 52

3.2.3 Phân lớp bằng thuật toán kết nhóm K-means 55

Chương 4 – PHÁT HIỆN LỖI TRÊN GẠCH MEN 4.1 Các lỗi ở gạch men 67

4.2 Cơ sở dữ liệu 69

4.3 Các bước thực hiện 71

4.4 Phân lớp màu theo kết cấu 77

4.5 Kỹ thuật kết nhóm 79

4.5.1 Khởi tạo nhóm 79

4.5.2 Kết hợp các nhóm màu giống nhau 80

4.5.3 Làm nhẵn đường biên theo phương pháp hình học 81

4.6 Chọn ngưỡng theo kết cấu ảnh 83

4.7 Các phương pháp tìm lỗi 84

4.7.1 Tìm lỗi màu bằng luật quyết định Bayes 84

4.7.2 Tìm lỗi bằng kỹ thuật truy hồi trạng thái hình học 85

4.7.3 Tìm lỗi bằng kỹ thuật so sánh diện tích các lớp màu 86 4.7.4 Khoanh vùng phần bị lỗi 87

4.7.5 Tìm lỗi sai kích thước 88

Chương 5 – KẾT QUẢ THỰC HIỆN 5.1 Các kết quả khảo sát thuật toán kết nhóm Kmeans 95

5.1.1 Kết nhóm ảnh phong cảnh 95

5.1.2 Kết nhóm các ảnh gạch men 96

5.2 Tìm lỗi bằng kỹ thuật truy hồi từ trạng thái hình học 97

5.2.1 Gạch bị lỗi do vết dơ 97

5.2.2 Gạch bị các lỗ đinh nhỏ 98

5.2.3 Gạch lỗi màu không đồng nhất 99

5.2.4 Gạch bị lỗi màu 100

Trang 5

5.3.1 Lỗi vết dơ ố 101

5.3.2 Gạch lỗi bị mờ, bị bóng che khuất 102

5.3.3 Gạch lỗi bị mờ, không đều về màu 103

5.3.4 Gạch lỗi do trầy xước, bong tróc màu 104

5.3.5 Một số kết quả từ ảnh quay từ Quickcam 105

5.4 Tìm lỗi kích thước 106

5.5 Nhận xét kết quả 108 KẾT LUẬN

TÀI LIỆU THAM KHẢO

Trang 6

CA Classification Accuracy

CO Co-occurrence

CIE Commission Internationale de Léclairage

CMY Cygan Magenta Yellow

DWHT Directional Walsh-Hadamard Transform

FIS Fuzzy Inference System

FFT Fast Fourier Transform

FIDM First-Order Inverse Element Difference Moment FDM First-Order Element Difference Moment

GLCM Grey Level Co-occurrence Matrices

HVS Human Visual System

KNN K-Nearest Neighbourhood

LVQ Learning Vector Quantization

LMS Least Mean – Square

MSMD Multi-Scale and Multi-Directional

MLP Multi-Layer Perceptron

MC Mean Convergence

MSE Mean Square Error

PCA Principal Component Analysis

PMF Probability Mass Function

RBFNN Radial Basis Function Neural Networks

SDM Second-Order Element Difference Moment

SIDM Second-Order Inverse Element Difference Moment SVM Support Vector Machines

SOM Self Organising Maps

VxC TSG Tiles for Surface Grading

TFN Text Feature Number

Trang 7

Bảng 3.1 Thuộc tính các đối tượng K=1 55

Bảng 4.1 Các loại gạch men của VxC TSG 70

Bảng 4.2 Các loại gạch chụp từ QuickCam 71

Bảng 5.1 Kết quả tham khảo [1] sử dụng lọc Gabor và DWHT 109

Bảng 5.2 Kết quả thời gian thực nghiệm của tài liệu [1] 109

Bảng 5.3 Kết quả thực nghiệm tìm lỗi màu 111

Bảng 5.4 Kết quả thời gian thực hiện tìm lỗi màu 112

Bảng 5.5 Kết quả thực nghiệm tìm lỗi kích thước cùng loại gạch 114

Bảng 5.6 Kết quả thực nghiệm tìm lỗi các loại gạch khác nhau 115

Trang 8

Hình 1.1 Các loại gạch men 3

Hình 1.2 Ảnh a, c, e, g ảnh không lỗi, b, d, f, h ảnh bị lỗi 4

Hình 1.3 Mô tả không gian màu RGB 4

Hình 2.1 Bước sóng và phổ trong không gian RGB 15

Hình 2.2 Không gian màu CIE hai chiều 16

Hình 2.3 Biểu diễn không gian màu (a) XYZ (b )xyY 17

Hình 2.4 Không gian màu (a) CIE L*a*b* (b) CIE L*u*v* 18

Hình 2.5 Biểu diễn trong hệ toạ độ cực (a) CIE L*a*b* (b) CIE L*u*v* 19

Hình 2.6 Tập dữ liệu mô tả vector đặc trưng 24

Hình 2.7 (a) trước khi Dilation, (b) sau khi Dilation 31

Hình 2.8 (a) trước khi Erosion, (b) sau khi Erosion 31

Hình 2.9 (a) trước khi Opening, (b) sau khi Opening 34

Hình 2.10 (a) trước khi Closing, (b) sau khi Closing 35

Hình 2.11 Mật độ xác suất 37

Hình 2.12 Sơ đồ mô tả thuật toán học 39

Hình 2.13 Tập dữ liệu kết nhóm 40

Hình 2.14 Trung bình argmin 41

Hình 2.15 khoảng cách Euclidean 42

Hình 2.16 Ví dụ hai loại cá hồi và cá mú 42

Hình 2.17 Biến đổi không gian theo tỉ lệ (scale) 43

Hình 2.18 Các phép biến đổi trong không gian Euclidean 43

Hình 2.19 Tính khoảng cách Mahalanobis 44

Hình 2.20 Không gian Mahalanobis 45

Hình 2.21 Không gian Gaussian 45

Hình 3.1 Các loại texture 49

Hình 3.2 Cấu trúc RBFNN 50

Hình 3.3 Phân lớp KNN với n = 3, k = 7 52

Hình 3.4 Lưu đồ giải thuật cho thuật toán K-means 56

Trang 9

Hình 3.6 Khởi tạo giá trị lần lặp đầu tiên 58

Hình 3.7 Xác định trọng tâm lần lặp thứ nhất 60

Hình 3.8 Xác định trọng tâm lần lặp thứ hai 61

Hình 3.9 Tối thiểu thuộc tính 65

Hình 4.1 Các loại lỗi ở gạch men 68

Hình 4.2 Mô hình băng tải tạo cơ sở dữ liệu ảnh gạch men 69

Hình 4.3 Sơ đồ mô tả hệ thống 72

Hình 4.4 Mô hình thực hiện của hệ thống dò tìm lỗi bề mặt 72

Hình 4.5 Sơ đồ khối mô tả các quá trình thực hiện 73

Hình 4.6 Kết nhóm và chọn giá trị khởi tạo kết nhóm 77

Hình 5.1 Giao diện mô phỏng lỗi màu 94

Hình 5.2 Giao diện mô phỏng lỗi kích thước 94

Hình 5.3 Kết nhóm ảnh phong cảnh theo phương pháp K-means 95

Hình 5.4 Kết nhóm ảnh gạch theo phương pháp K-means 96

Hình 5.5 Gạch bị lỗi vết màu 97

Hình 5.6 Gạch bị lỗi lỗ đinh 98

Hình 5.7 Gạch bị lỗi màu không đồng đều 99

Hình 5.8 Gạch bị lỗi màu 100

Hình 5.9 Tìm lỗi gạch bị vết dơ 101

Hình 5.10 Tìm lỗi gạch bị mờ bóng che 102

Hình 5.11 Tìm lỗi gạch bị mờ không đồng màu 103

Hình 5.12 Gạch lỗi do trầy xước, bong tróc màu 104

Hình 5.13 Kết quả của các ảnh quay từ Quickcam 105

Hình 5.14 Kết quả tìm lỗi kích thước ảnh cho loại gạch Agata 106

Hình 5.15 Kết quả tìm lỗi kích thước ảnh cho loại gạch Antique 106

Hình 5.16 Kết quả tìm lỗi kích thước ảnh cho loại gạch Berlin 107

Hình 5.17 Kết quả tìm lỗi kích thước ảnh cho loại gạch Campinya 107

Hình 5.18 Kết quả tìm lỗi kích thước ảnh cho loại gạch Mediterranea 108

Trang 10

trong việc tìm lỗi bề mặt của sản phẩm công nghiệp thường được ứng dụng trong các sản phẩm như: tìm lỗi vải, thép, gỗ, đá hoa cương, hay trong lĩnh vực khảo cổ học… đã và đang là những đề tài vẫn còn trong giai đoạn nghiên cứu theo nhiều lĩnh vực áp dụng khác nhau, và cũng đang là nhu cầu cần thiết cấp bách cho các ngành công nghiệp trên nhiều nước

Để phát hiện được các lỗi chính xác và nhanh, ta phải phân tích kết cấu ảnh hay phân tích các lớp màu càng chính xác thì kết quả tìm lỗi sẽ càng tối ưu Đồng thời để thực hiện nhanh phù hợp với việc xử lý thời gian thực dữ liệu xử lý càng ít càng tốt, vì thế phương pháp tốt nhất để dữ liệu ít

là tìm đặc trưng của từng lớp màu Công việc tìm lỗi chỉ thực hiện trên các tập đặc trưng Kỹ thuật tìm lỗi màu trên gạch men, phân tích các thành phần của ảnh theo kết cấu, phương pháp sử dụng thuật toán K-means trong đề tài này cũng là một kỹ thuật được áp dụng khá rộng rãi, nhưng trong lĩnh vực tìm lỗi màu trên bề mặt sản phẩm thuật toán K-means là một nghiên cứu ứng dụng mới Thuật toán K-means thực hiện để phân tích ảnh màu theo phương pháp kết nhóm mà các giá trị khởi tạo ban đầu được thực hiện theo hai cách: chọn bằng tay và chọn lựa nhờ vào kỹ thuật phân tích các thành phần chính (PCA) Việc sử dụng phép biến đổi không gian màu CIE

để tách các màu theo các lớp mà theo trực giác của con người cho là khác màu nhau, sau đó ta sử dụng các phép toán Minkowski để làm trơn tru các đường bao của các lớp màu vừa tách Từ các thành phần của các lớp màu khác nhau này ta sẽ dễ dàng phát hiện các lỗi về màu sắc trên ảnh của gạch theo các phương pháp

• Phân tích tìm lỗi màu bằng luật quyết định Bayes

• Tìm lỗi màu bằng kỹ thuật truy hồi từ trạng thái hình học

• Tìm lỗi màu bằng kỹ thuật so sánh diện tích các lớp màu

• Tìm lỗi sai kích thước bằng cách tính trọng tâm

Trang 11

• Chương 1: Giới thiệu tổng quan

Giới thiệu tổng quan về lỗi màu sắc trên gạch men, đặc trưng về màu của gạch men và các nghiên cứu trước đây

• Chương 2: Cơ sở phân tích

Giới thiệu phép biến đổi trong không gian màu CIE và các phép toán học cơ bản được áp dụng để phân tích các thành phần của ảnh, các kỹ thuật trích rút đặc trưng nhằm áp dụng cho các phương pháp tìm lỗi kết cấu

• Chương 3: Phân tích đặc trưng của kết cấu và lỗi của gạch men Đưa ra các phương pháp phân tích trích rút đặc trưng màu của ảnh kết cấu, và phân tích các dạng lỗi của gạch, từ cơ sở đó có thể minh chứng cho việc chọn lựa phương pháp phân tích màu phù hợp với các đặc điểm kiểm tra lỗi trên ảnh gạch

• Chương 4: Phát hiện lỗi màu trên gạch men

Đây là chương trọng tâm của đề tài, chương này đã xây dựng cơ sở

và phân tích toàn bộ các bước thực hiện tìm lỗi dựa trên các cơ sở phân tích được chọn lọc Quá trình thực hiện gồm hai giai đoạn, mỗi giai đoạn thực hiện ba bước: tạo dữ liệu chuẩn, tạo dữ liệu kiểm tra và phát hiện lỗi

• Chương 5: Kết quả thực nghiệm

Chương này trình bày các kết quả thực hiện của đề tài, bao gồm kết quả của kỹ thuật kết nhóm K-means, kết quả tìm lỗi màu và kết quả tìm lỗi kích thước, các lỗi sẽ được khoanh các vùng trên ảnh kết quả

Thành công của đề tài mở ra một hướng ứng dụng trong lĩnh vực phát hiện lỗi bề mặt sản phẩm Kết quả nghiên cứu không dừng lại ở thực nghiệm mô phỏng trên matlab mà còn phát triển phần cứng để phục vụ trong các dây chuyền sản xuất cho các ngành công nghiệp

Tp.HCM, tháng 05 năm 2008

Trang 12

Chương 1 GIỚI THIỆU TỔNG QUAN

Phần giới thiệu tổng quan trong chương này trình bày khái quát

về phương pháp dò tìm lỗi cho gạch men, phân tích các kết cấu màu trên ảnh cho nhiều loại gạch men có các kết cấu màu khác nhau, đồng thời giới thiệu chi tiết các nghiên cứu trước đây đã thực hiện trong việc tìm lỗi bề mặt để có thể đưa ra một phương pháp tốt nhất

1.1 TỔNG QUAN VỀ PHƯƠNG PHÁP TÌM LỖI BỀ MẶT [1], [2]

Vấn đề nghiên cứu các phương pháp và các kỹ thuật cho việc kiểm tra đánh giá lỗi bề mặt trong sản xuất theo dây chuyền tự động, cũng như vai trò của việc kiểm tra và đánh giá chất lượng cho sản phẩm là rất quan trọng, nhưng hiện nay các nghiên cứu để áp dụng cho các ứng dụng này vẫn chưa phổ biến, chủ yếu là các phương pháp truyền thống thường được thực hiện do con người trực tiếp quan sát bề mặt của sản phẩm, để đánh giá phân loại chất lượng cho các sản phẩm Với công nghệ hiện đại và kỹ thuật phát triển rất cao trong các ngành sản xuất công nghiệp theo dây chuyền tự động, đòi hỏi việc kiểm tra đánh giá sản phẩm phải được thực hiện một cách chính xác, tốc độ nhanh và phải thực hiện thường xuyên trong một môi trường với các loại nhiễu

Vì thế một ứng dụng trong công nghiệp quan trọng là kiểm tra đánh giá bề mặt sản phẩm, phân loại sản phẩm bằng hệ thống quan sát tự động từ các sản phẩm di chuyển trên băng truyền tải với số lượng, thời gian tạo sản phẩm nhanh Ví dụ các sản phẩm được áp dụng như: sản xuất gỗ, thép, gạch men, vải Mục đích nhằm nâng cao chất lượng sản phẩm, như các sản phẩm không đủ tiêu chí sẽ bị loại và đồng thời cũng cần phải tăng năng suất sản xuất

Mặc dù việc nghiên cứu lý thuyết và thực nghiệm trong những năm qua cũng phát triển khá mạnh mẽ, nhưng vẫn chưa thể đáp ứng

Trang 13

được công việc kiểm tra đánh giá cho mọi sản phẩm Đã có các nghiên cứu thực hiện tự động dò tìm các lỗi bề mặt cho các sản phẩm như: lỗi bề mặt của thép, đá kim cương, gỗ lót sàn, bông vải, gạch men…các nghiên cứu đã đưa ra nhiều mô hình và các phương pháp tính toán kết hợp phân tích ảnh, tuy nhiên các phương pháp này đa phần xử lý dựa trên việc phân tích mức xám của ảnh (ảnh đen trắng) mà hiện tại trong nhiều sản phẩm cần được đánh giá ở khía cạnh màu sắc

Đề tài ‘Phát hiện lỗi màu trên gạch men’ nhằm nghiên cứu để

đánh giá và phân loại chất lượng về màu của gạch men Ở đây việc kiểm tra đánh giá được thực hiện trên ảnh tĩnh, đề tài chỉ thực hiện

mô phỏng bằng Matlab, không thực hiện trên phần cứng và hệ thống thiết bị Tuy nhiên đề tài cũng chọn lọc các thuật toán, phương pháp

xử lý tín hiệu và xử lý ảnh để có thể thực hiện được trong thời gian thực (ảnh được chụp từ camera trong khi sản phẩm di chuyển trên băng tải) Gạch được thực hiện là các loại gạch men có nhiều màu sắc và có kết cấu đa dạng Phương pháp thực hiện dựa trên phân tích kết cấu và các đặc trưng của màu, có nhiều phương pháp được thực hiện để đánh giá sự giống và khác nhau về màu sắc của gạch men như được trình bày ở chương 3

Đề tài này sau khi nghiên cứu và nếu tiếp tục phát triển để hoàn chỉnh phần cứng có thể được ứng dụng phân loại gạch trong các nhà máy sản xuất gạch men, nó vẫn có thể mở rộng cho các hệ thống dò tìm sai lỗi trong các ngành sản xuất khác như: sản xuất gỗ, nhựa, thép… và có thể mở rộng cho các lĩnh vực khác như: nông nghiệp, y học, quân sự…

Trang 14

1.2 MÀU SẮC VÀ KẾT CẤU BỀ MẶT CỦA GẠCH [1], [3]

Đây là đề tài mà mục tiêu cuối cùng là xử lý các màu sắc của gạch

từ ảnh màu được chụp sau đó lưu lại để làm cơ sở dữ liệu Cho nên vấn đề màu sắc cũng là vấn đề cần được quan tâm và tìm hiểu rất kỹ trước khi thực hiện

Màu sắc là thành phần rất quan trọng trong việc kiểm tra và phát hiện lỗi bề của gạch men hay việc tìm lỗi trên bề mặt trong các ứng dụng tự động kiểm tra phân loại sản phẩm Để so sánh màu sắc của gạch bị lỗi so với gạch tốt, vấn đề đặt ra đầu tiên phải tìm các đặc trưng của màu (thành phần đại diện của một vùng màu) để mô tả cho thông tin màu đó Tuy nhiên có nhiều lỗi gây nhầm lẫn trong việc đánh giá phân biệt giữa gạch tốt và gạch xấu, như trong các ảnh có nhiều kết cấu, các kết cấu trên ảnh phức tạp có quá nhiều vùng màu khác nhau đan xen lẫn nhau gây ra các điểm lỗi trên ảnh của một lớp này có thể không phải là điểm lỗi ở lớp khác Hình 1.1 trình bày một

số gạch men khác nhau về phân bố màu sắc và kết cấu

Trang 15

Hình 1.2 Ảnh a,c,e,g ảnh không lỗi, b, d, f, h ảnh bị lỗi

Phân bố cho ảnh màu dựa trên nhiều không gian màu khác nhau như: không gian RGB (Red Green Blue), không gian màu CIE

Hình 1.3 Mô tả không gian màu RGB [8]

Phân bố cho ảnh màu dựa trên nhiều không gian khác nhau như hình 1.3 không gian RGB gọi là không gian màu sơ cấp, các không gian màu khác như: CIE, Ohta… được biến đổi từ không gian màu RGB, cường độ màu trong các không gian màu này được biến đổi theo một tỉ lệ nào đó của ba thành phần màu trong không gian RGB theo một tỉ lệ mà nó phụ thuộc vào không gian mới Mục tiêu nghiên cứu hướng tới việc thực hiện đánh giá lỗi dựa trên các màu cơ bản của gạch men với sự kết hợp đặc trưng của màu và kết cấu của ảnh

Trang 16

1.3 CÁC NGHIÊN CỨU TRƯỚC ĐÂY [3], [4], [5], [6]

1.3.1 Phương pháp biến đổi DWHT (Directional Walsh-Hadamard

Transform) [3]

Đây cũng là một nghiên cứu mới, trong mục này chúng ta mô

tả một phương pháp để phân tích đặc trưng kết cấu dựa vào biến

đổi DWHT Hầu hết các phép biến đổi là tuyến tính và trực giao

của tín hiệu trong miền thời gian hoặc không gian Các phép thực

hiện đều dựa vào các hàm lỏi của tín hiệu sin cơ bản (ví dụ biến

đổi Fourier, biến đổi cosine) Biến đổi Walsh được định nghĩa

1

0 1

đổi của làm lỏi ( ).

1ψ

− Biến đổi Walsh là một trong những ngoại lệ

mà được gọi là “phân tích hài” nó chỉ ra tần số cơ bản cho hàm

lỏi và phân tích tín hiệu vào bên trong cửa sổ vuông của dạng

sóng nguyên thủy trong miền biến đổi Hàm lỏi có thể được chọn

từ xác suất của một tập thay đổi Ví dụ trong phép biến đổi

DWHT tự nhiên (thành phần của các họ Walsh) ψ là

,x,v,u

với bi(z) là bit thứ i của z trong mô tả số nhị phân Dạng DWHT

của tần số hay tần số chính Các tần số ngang qua các zero hoặc

các tín hiệu thay đổi theo tần số trong biến đổi Fourier Tuy nhiên

tần số này bằng hai lần kích thước tần số của một tín hiệu

)()

(x Freq x Seq = ở đây x là tín hiệu trong miền thời gian hay miền

không gian và chỉ tập trực giao của các dạng sóng trong cửa sổ

chữ nhật được tạo ra từ DWHT, hàm lỏi chỉ có thể là dạng sóng

sin, tổng các trọng số của các phần tử các thành phần sóng

Trang 17

vuông của nó, khi đó chúng ta nhận được các đặc trưng từ phương pháp DWHT mà nó mô tả cho kết cấu loại yếu tốt hơn so với phương pháp FFT hay lọc Gabor Những báo cáo gần đây cũng đã chứng minh có nhiều phương pháp đã thực hiện nhưng vẫn kém hơn DWHT trong cách phân lớp kết cấu Trong cả hai trường hợp lọc trong miền không gian sử dụng lọc có kích thước nhỏ (3x3 hay 5x5), do vậy nó có cấu trúc trơn tru hơn, ví dụ lọc cosine có cấu trúc dạng 0-1 thực hiện tốt hơn lọc DWHT Vấn đề này là vấn đề tiêu biểu cho việc mô tả tín hiệu của hàm cơ sở hình chữ nhật, khi chúng ta áp dụng phép biến đổi DWHT và sử dụng các số hạng tần số cao hơn, tuy nhiên từ các hàm có tần số cao hơn có thể làm nhẵn và điều hoà các ngõ ra để mô tả các hệ

số suy giảm của sai số Trở lại vấn đề tổng hợp của tín hiệu hình sin, và liên quan đến hạng cao hơn (hạng 8) trong hàm Walsh, nhằm giảm bớt sai số

1.3.2 Phương pháp dùng lọc Gabor [3]

Lọc Gabor được sử dụng rộng rãi trong phân tích dữ liệu ảnh theo nhiều chiều và nhiều tỉ lệ khác nhau Trong lĩnh vực xử lý ảnh, phương pháp này thường được dùng để trích đặc trưng hay phân đoạn ảnh kết cấu cho độ chính xác cao Lọc Gabor thực hiện rất hiệu quả trong phân tích kết cấu theo các chiều khác nhau Bằng các lọc thấp qua cho từng kết cấu ảnh vào, các lọc này sẽ trích các đặc trưng của mỗi kết cấu ảnh theo một hướng định trước trong một dãy tần số quan sát Vì thế bất lợi lớn nhất của lọc Gabor là việc tính toán phức tạp mất nhiều thời gian Về

cơ bản lọc Gabor có thể định nghĩa để thực hiện cả trong miền không gian và miền tần số, tuy nhiên lọc Gabor thực trong miền tần số sẽ nhanh hơn và đặc biệt đối với ảnh có kích thước lớn

Trang 18

Lọc Gabor trong miền tần số được biểu diễn theo công thức (1.3)

( ) j ( x u y v )

v ue.e

v,u

p x p

0 0 2

2 2 2

trong đó up và vp là hai thành phần thay đổi vị trí trên hệ trục tọa

độ trong mặt phẳng tần số, ωx,ωy là tần số trung tâm của lọc

(thừa số điều chế) theo hai chiều x và y θ là tham số định hướng

cho lọc σx,σy là độ lệch chuẩn (độ rộng băng thông) của lọc theo

và đồng thời lọc theo nhiều hướng khác nhau Sự thay đổi về tần

số và hướng khác nhau của dãy lọc sẽ cho phép ta trích ra một số

lượng các thông tin cần thiết của mỗi kết cấu ảnh Trong thực

nghiệm thường được sử dụng lọc Gabor bao gồm một dãy 12 lọc

được sắp xếp theo 3 tần số và 4 chiều như sau

135904502

4

,,

i j

Trang 19

Ở đây ΩM là không gian tần số cực đại Việc chọn tần số trung tâm trong miền tần số với đường biên của hai loại kết cấu thấp

hơn 50% (xem mục 3.1), miền tần số này được chọn theo tỉ lệ của

hàm log2 Trong các lọc Gabor chúng ta lấy tần số trung tâm tăng

theo bậc 2 và bằng ½ mức năng lượng của dải băng thông, phổ

tần số Muốn thực hiện phương pháp này một cách chính xác, từ

phương pháp lọc Gabor cơ bản MSMD (Scale and

Multi-Directional) ta phải phân lớp theo kết cấu trên ảnh của gạch men,

để có thể xác định sự khác biệt và nhận dạng được lỗi Nhiều

nghiên cứu đã được giới thiệu bằng cách thực hiện lọc Gabor

trong phân lớp kết cấu ảnh Trong việc tìm khuyết tật của gạch

men thường chọn hướng với độ phân giải là 0

45

=

Δθ , chọn tần số trung tâm theo hàm mũ 2 và bằng một nửa mức năng lượng của

dải thông Tập đặc trưng của lọc Gabor đầu tiên được trích từ 12

,8

,

16 là tần số cực đại trong miền tần số, 12 phổ từ lọc trung bình xây dựng thành vector

đặc trưng đầu tiên 1

8

,g

Trang 20

0 0 0 0 2

135 90 45 0 2

4

135 90 45 0 2

4 8

, , , ,

, , ,

g F

, , , ,

, , ,

g F

M M M ,

Gabor

M M M ,

Gabor

θω

μ

θω

μ

θ ω

, ) g max(

), g ( ), g ( F

M M M

, ,

, Gabor

điều này được mô tả bằng phương pháp GLCM (ma trận tương

quan của các mức xám) GLCM là một phương pháp thống kê cổ

điển, nhưng trong hầu hết các thuật toán phân lớp kết cấu ảnh

thường được áp dụng

Cho một ảnh x có n mức xám, ma trận tương quan của các mức xám được ký hiệu là Φd,θ( )x chính là một ma trận vuông n x

n, các phần tử của ma trận được tạo thành từ các cặp pixel có

cường độ sáng liên quan nhau trong một khoảng cách d và

Trang 21

Ma trận CO được biểu diễn như (1.11) sẽ chứa các đặc tính chung của mỗi kết cấu Ví dụ nếu các giá trị tập hợp xung quanh

đường chéo của Φd,*( )x lớn thì kết cấu của ảnh x thuộc dạng

Coarse texture (xem mục 3.1) theo cách đánh giá dựa vào

khoảng cách d Từ một ảnh đơn giản, nếu kết hợp các thay đổi

của tham số d và θ lại với nhau ta có thể tạo ra nhiều ma trận

GLCM khác nhau, điều này nói lên rằng ma trận GLCM không thể

sử dụng trực tiếp để mô tả kết cấu Do đó vector đặc trưng của

kết cấu ảnh được mô tả bằng một số hàm giả chuẩn

(pseudo-standard) cho ma trận GLCM Haralick et al [31] trình bày 14 hàm

GLCM giả chuẩn Trong phương pháp này được chọn 6 hàm phổ

j ,i

j i

j i j,

j ,i

j,ijiCON

f

ji

j,iIDM

f

j,ij

iCOR

f

j,ilogj,iENT

f

j,iASM

f

j,iMaxMAX

f

2 6

2 5

4 3

2 2

1

σσ

μ

Mỗi một hàm sẽ mô tả một đặc tính nào đó cho một kết cấu

• Hàm MAX (Maximun) và hàm ASM (Angular Second

Moment) là thống kê cơ sở của Φ Hàm ASM đo tính đồng nhất của ảnh, nó phù hợp để phát hiện cho các kết cấu ngẫu nhiên Trong kết cấu ảnh phân bố không đồng đều, giá trị của ASM cho ra sẽ nhỏ hơn ảnh có kết cấu đều

• Hàm ENT (Entropy) dùng để đo độ phức tạp của ảnh Ảnh có

độ phức tạp càng nhiều thì ENT càng lớn

Trang 22

• Hàm COR (Correlation) đo đặc tính đường kẻ trên ảnh, nếu đặc tính của ảnh có đường theo một chiều θ nào đó càng nhiều thì giá trị tương quan sẽ càng lớn Hàm này thường

được dùng để đo ảnh Coarseness

• Hàm IDM (Inverse Difference Moment) dùng để đo các vùng

có các tone màu giống nhau xung quanh các lân cận nó

• Hàm CON (Contrast) dùng để đo các đặc tính khác nhau của kết cấu

1.3.4 Phương pháp tìm lỗi dùng mạng neural: [5], [6]

Mạng neural được sử dụng khá phổ biến, trước đây kỹ thuật này từng được thực hiện để phân lớp và tìm các lỗi, khuyết tật trên sản phẩm Đây là phương pháp rất thuận lợi cho việc tìm lỗi,

vì các tham số cần thiết để thực hiện huấn luyện cho mạng không cần nhiều như các phương pháp khác, cũng không giả định thuộc tính của dữ liệu tạo ra ở thời điểm trước đó Có nhiều kỹ thuật theo phương pháp mạng neural đã được thực hiện cho công việc tìm lỗi như: MLP (Multi-Layer Perceptron), SOM (Self Organising Maps), RBFNN (Radial Basis Function Neural Networks), SVM (Support Vector Machines)…

• Phương pháp MLP (Multi-Layer Perceptron)

MLP là phương pháp phổ biến và cho kết quả tốt nhất sử dụng phân lớp bằng mạng neural, nhưng trong trường hợp mạng không tạo ra được các lớp có đường bao khép kín, việc xác định

các lỗi là nhiệm vụ quan trọng Năm 1995 Vascocelos đã đưa ra

cách phân lớp sử dụng mạng neural Việc phân lớp dữ liệu của mạng không theo các lớp đã biết đến một trong các lớp đó không theo bất kỳ ràng buộc nào Điều này sẽ đưa từng lớp huấn luyện

sử dụng hyper-planes định dạng đường bao kín giữa các lớp

Trang 23

• Phương pháp RBF (Radial Basis Function)

RBF mô tả cách phân lớp quan trọng của các mạng neural

Ở đây hoạt động của tầng ẩn được xác định bằng khoảng cách giữa một vector dữ liệu vào với vector dữ liệu mẫu đầu tiên

Năm 1994 Fredrickson sử dụng RBFNN bằng các hàm cơ bản

Gaussian để tìm lỗi dị thường Các trọng tâm và ma trận phương sai được xác định bằng thuật toán kết nhóm không giám sát K-means, các trọng số của ngõ ra được tính bằng phương pháp học có giám sát như LMS (Least Mean – Square) hay ma trận giả ngược (pseudo - inversion) để giảm độ dốc Các ngõ ra của mạng được ước tính xác suất xảy ra tại một thời điểm bằng thuật toán Bayes Công việc tìm lỗi được xác định từ các giá trị của mạng qua các bước sau

Bước 1: xác định khoảng cách tối thiểu bằng hàm thống kê Mahalanobis Sau khi kiểm tra dữ liệu mẫu, khoảng cách tối thiểu Mahalanobis của mẫu với phổ cực đại của hàm lỏi

sẽ chọn

Bước 2: là phương pháp tìm lỗi dị thường dựa vào phép hình học ánh xạ sử dụng RBF từ các hàm lỏi cho tầng ẩn

và ma trận giả ngược

Bước 3: sử dụng các cửa sổ để tìm các lỗi dị thường cho

dữ liệu kiểm tra

Tóm lại: Các phương pháp trước đây mặc dù cũng có rất nhiều tác giả

nghiên cứu với nhiều kỹ thuật khác nhau Sau cùng nó vẫn còn rất nhiều khuyết điểm như: các phương pháp chưa thực sự phổ biến với ảnh màu, tốn quá nhiều cửa sổ, mất nhiều thời gian xử

lý, do đó vẫn chưa có một mô hình cụ thể nào có thể áp dụng vào thực tế Đề tài này hướng đến các phương pháp nhằm khắc phục các vấn đề trên

Trang 24

Chương 2 CƠ SỞ PHÂN TÍCH

Cơ sở chung trong vấn đề phân tích, xử lý và phát hiện lỗi bề mặt, đồng thời xác định các phương pháp phân tích để chọn các phương pháp và các thuật toán phân tích chính xác cho công việc tìm lỗi Trong vấn đề kiểm tra mà đặc biệt là tìm lỗi dựa vào hệ thống quan sát bề mặt bằng máy Đồng thời có thể xác định chính xác các lỗi trên bề mặt của gạch men ta cần quan tâm các vấn đề sau

• Xem kết cấu bề mặt ảnh theo hướng xử lý dựa vào sắc tố và kết cấu của ảnh

• Kết cấu của ảnh nhìn chung được phân chia thành hai dạng chính: dạng vĩ mô và dạng vi mô, trong xử lý ta xem kết cấu ảnh dưới dạng vĩ mô, tức các ảnh được phân chia bằng các lớp màu khác nhau, sự khác nhau này được phân biệt bằng phép biến đổi sang không gian màu CIE

Từ đó ta phải phân tích các ảnh cần xử lý theo đúng yêu cầu đặt

ra, ta dựa vào các phương pháp phân tích, đồng thời ứng dụng các phép toán học sau

2.1 CHUYỂN ĐỔI GIỮA CÁC KHÔNG GIAN MÀU [1], [7], [8]

Biến đổi không gian màu là một giai đoạn rất quan trọng và cần thiết trong kỹ thuật phân lớp ảnh Khi quan sát một ảnh ta dễ dàng nhận thấy có các màu khác nhau Nhưng làm thế nào có thể phân biệt

vị trí đường biên chính xác cho các vùng màu đó thật rất khó Mà điều này lại cần thiết trong việc tách các lớp thành các phần riêng biệt cho công việc tìm lỗi

Trong tất cả các không gian màu thường được sử dụng trong phân tính ảnh màu, chúng ta quan tâm đến hai loại không gian màu: không gian màu độc lập và không gian màu phụ thuộc

Trang 25

• Không gian màu phụ thuộc là không gian màu mà màu sắc phụ

thuộc vào thiết bị và cơ cấu tạo nên chúng Ví dụ như màu tạo ra

các giá trị của các pixel là RGB = (250,134,67) ta có thể thay đổi

độ sáng hay độ tương phản của chúng khi hiển thị Giống như thế

nếu ta thay đổi các chất phát quang màu đỏ, xanh lá và màu xanh

đậm của màn hình thì cũng thay đổi được độ sáng khác nhau hay

các màu khác nhau Vì thế RGB là không gian màu phụ thuộc vào

hệ thống đang sử dụng

• Không gian màu CIE (Commission Internationale de Léclairage)

được định nghĩa dựa vào HVS (Human Visual System) hệ thống

cảm nhận bằng mắt, sử dụng hệ thống này chúng ta có thể phân

biệt bất kỳ màu nào trong hệ trục mô tả CIE

• Không gian màu độc lập là không gian màu sử dụng trong một hệ

trục tọa độ để chỉ rõ của một màu nào đó và sự tương đồng của

chúng trong hệ tọa độ đang xét Ví dụ như không gian màu CIE

L*a*b* là không gian màu độc lập, không gian màu này dựa vào

hệ thống quan sát của con người HVS Hệ thống CIE thực hiện

dựa vào sự liên kết theo thừa số phân bố phổ công suất ba màu

sơ cấp RGB của một đối tượng, các hàm này sẽ tính độ cảm nhận

về màu theo quan sát chuẩn về độ sáng theo độ dài từng bước

sóng khác nhau Các trọng số được thực hiện trên phổ của giác

quan có bước sóng từ 360nm đến 830nm

• Giá trị của ba tác nhân kích thích T cho một ánh sáng phức I( )λ

(ánh sáng này thì không đơn sắc) có thể được tính từ tham số P

với màu tương ứng bằng hàm Pi( )λ là

λ λ

λ

dI

Pd

I

PTdI

PT

Trang 26

Hình 2.1 Bước sóng và phổ trong không gian RGB [8]

• Hệ tọa độ màu: Trong trường hợp tính giá trị T của một thành phần màu trong một tập nguyên thuỷ chúng ta cần biết đến hình dạng phổ và hàm tính toán cho các tham số màu Giá trị của các tham số được tính theo các thừa số nguyên của các hàm tính toán màu và các yếu tố ảnh hưởng từ chiều dài sóng Giá trị của ba yếu tố mô tả độ nhạy cảm của tập nguyên thuỷ bao gồm trị tuyệt đối cường độ của ba yếu tố cần thiết để tính các ảnh hưởng Dĩ nhiên độ chói cũng là thành phần ảnh hưởng và nó có thể thay đổi Tương ứng cho vấn đề này hệ tọa độ màu được hình thành từ không gian hai chiều khi đó độ chói được lờ đi

3 2 1

1 1

T T T

T c

+ +

3 2 1

2 2

T T T

T c

+ +

=

3 2 1

3 3

T T T

T c

+ +

Và ta không cần quan tâm đến trục thứ ba bởi gì: c1 +c2 +c3 =1

Trang 27

• Không gian màu: Màu là kết quả của quá trình quan sát ánh sáng trong một vùng tạo thành phổ có chiều dài bước sóng từ 380nm đến 780nm Võng mạc của mắt người có ba dạng tế bào hình nón nhận kích thích ánh sáng màu, nó phụ thuộc theo các đường cong phổ khác nhau Nên cần phải chính xác cho ba dạng tế bào cảm nhận ánh sáng kích thích nói trên Ba thành phần này rất cần thiết

để mô tả cho một màu

Hình 2.2 Không gian màu CIE hai chiều [7]

• Năm 1931 CIE định nghĩa một hệ thống màu chuẩn có khả năng

mô tả chính xác các màu theo giác quan của con người mà nó được gọi là không gian màu CIE XYZ, hay không gian màu XYZ

Hệ thống màu chuẩn CIE dựa vào các màu tượng trưng đầu tiên trong không gian XYZ Nó không có đặc tính vật lý, chỉ là lý thuyết và độc lập với các gam màu nhưng lại phụ thuộc trong không gian RGB hay CMY (Cygan Magenta Yellow) Tuy có các màu cảm nhận ban đầu được chọn lựa từ tất cả các màu đã được quan sát bằng mắt Hệ thống XYZ dựa vào đường cong phổ từ quá trình cảm nhận ba màu của mắt

Trang 28

Không gian màu XYZ Hình 2.3 (a) là không gian màu 3D đồng nhất, và khó có thể xử lý trực tiếp trên không gian màu này, nhìn chung trong các đề tài thường chọn không gian này có dạng X +Y+Z =1, sau cùng chúng được hiểu như là không gian 2D như ở hình 2.2

Hình 2.3 Biểu diễn không gian màu (a) XYZ(b )xyY [8]

Các tọa độ của không gian này được tính theo các công thức sau

ZYX

Xx

++

=

ZYX

Yy

++

=

ZYX

Zz

++

Trang 29

X A B G

X

.

B

G R

057311 1

204043 0

055648 0

041556 0

875992 1

969256 0

498535 0

537150 1

24079 3

R

.Z

Y

0573111

2040430

0556480

0415560

8759921

9692560

4985350

5371501

240793

• Không gian màu CIE L* a* b* và không gian màu CIE L* u* v*

Hai không gian màu này dựa vào không gian màu CIE XYZ, mà khả năng quan sát một khối màu đồng nhất theo từng vector đơn

vị khác nhau [8],[17], nó không tuyến tính và các phép biến đổi vẫn

có thể tính theo phép biến đổi ngược Thông tin về màu sắc có thể

liên kết đến điểm sáng của màu trong hệ thống Mối liên hệ phi

tuyến trong CIE L* a* b* thì không giống CIE L* u* v*

Hình 2.4 Không gian màu (a) CIE L* a* b* (b) CIE L* u* v* [8]

Trang 30

0 0

0

3 1

0

500500

3903

16116

Z

ZfY

Yfb

Y

YfX

Xfa

Y

Y.L

Y

YL

XZ

,Y,XU

315

4++

ZYX

YZ

,Y,XV

315

9++

0 0 0 0

3 1

0

13 13

3 903

16 116

Z , Y , X V Z , Y , X V L v

Z , Y , X U Z , Y , X U L u

Y

Y L

Y

Y L

f = Nếu U > 0 008856

( )

116

16787

= UU

Trang 31

2.2 PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA) [9], [10], [11], [12]

Phương pháp phân tích thành phần chính (PCA), là một trong

những kỹ thuật truyền thống trong phân tích dữ liệu thống kê, trích rút

đặc trưng, và nén dữ liệu Khi đưa vào một chuỗi giá trị đo rời rạc, mục

đích là tìm ra một chuỗi biến số có kích thước nhỏ hơn với thông tin bị

mất là ít nhất, nhằm tạo một đại diện tốt nhất có thể Trong PCA độ dư

thừa có thể đo được bởi sự tương quan giữa các nhân tố dữ liệu Mối

tương quan thực hiện dựa trên cơ sở thống kê bậc 2

2.2.1 Thành phần chính [9], [10]

Xem vector dữ liệu x được biểu diễn ngẫu nhiên có n phần tử rời rạc Những phần tử đại diện của x là các giá trị được lấy từ

các giá trị của tín hiệu hay các giá trị mức xám của ảnh tại những

thời điểm khác nhau Điều này cũng rất cần thiết vì phép biến đổi

PCA cần mối tương quan giữa các đại diện với nhau, nếu các

phần tử là độc lập thì quá trình PCA không còn hiệu quả nữa

Các mẫu dữ liệu được biểu diễn như công thức 2.9

n

x, ,x,x

với trị trung bình của vector x được định nghĩa là

{ }x E

x E x x

Các thành phần của Cx được định nghĩa bằng thừa số c ij,

mô tả các hiệp phương sai giữa các thành phần biến đổi ngẫu

nhiên của x i và x j

Thành phần c ii là biến đổi của thành phần xi Khi biến đổi một

Trang 32

phần đó xung quanh giá trị trung bình của nó Nếu hai thành phần

xi và xj của dữ liệu không tương quan nhau, khi đó phương sai

của nó sẽ bằng không (cij =cji =0) Lúc này ma trận hiệp phương

sai luôn đối xứng

• Từ tập dữ liệu của vector x1, x2, , xM, chúng ta có thể tính

trung bình và ma trận hiệp phương sai của tập dữ liệu này,

đó cũng chính là phép ước lượng theo trị trung bình và ma trận hiệp phương sai của tập dữ liệu đó

• Từ ma trận đối xứng của ma trận hiệp phương sai, chúng ta

có thể tính cơ sở trực giao bằng cách tìm giá trị riêng và vector riêng của nó Vector riêng là e i và giá trị riêng tương ứng là λ được tính theo biểu thức (2.12) i

n , , , i, e e

ở đây I là ma trận đơn vị có cùng bậc với Cx, chú ý . là định thức

của ma trận Nếu vector dữ liệu có n phần tử thì công thức tính

đặc trưng có bậc là n, điều này sẽ dễ dàng thực hiện nếu n nhỏ

Việc giải để tìm giá trị riêng tương ứng với vector riêng là một

công việc rất phức tạp Thường cách để tìm giá trị riêng được giải

bằng cách sử dụng mạng neural, dữ liệu được đưa vào ngõ vào

của mạng neural và giá trị hội tụ chính là giá trị ta muốn tìm

• Sự sắp xếp các vector riêng theo giá trị riêng giảm dần, sẽ tạo ra

một cơ sở trực giao với vector riêng đầu tiên cho ta khác biệt lớn

Trang 33

nhất theo chiều của tập dữ liệu đó Trong trường hợp này chúng

ta có thể tìm số chiều mà tập dữ liệu có thể chứa các thành phần

năng lượng quan trọng đại diện được cho tập dữ liệu đó

Giả sử rằng một tập dữ liệu có trị trung bình và ma trận hiệp phương sai của các mẫu đã được tính toán Với A là một ma trận

bao gồm các vector riêng của ma trận hiệp phương sai theo các

vector hàng Bằng phép biến đổi cho vector dữ liệu x

A

đó chính là một điểm được xác định bởi các vector riêng trong hệ

trục tọa độ trực giao Các thành phần của y có thể được xem như

là các trục tọa độ trong cơ sở trực giao Chúng ta có thể xây

dựng vector dữ liệu nguyên thuỷ x từ vector y như sau

x

TyA

sử dụng tính chất của ma trận trực giao A−1 =AT, với AT là ma

trận chuyển của A Vector nguyên thuỷ x được xác định bằng

cách chiếu trên các trục tọa độ của cơ sở trực giao, vector

nguyên thủy được xây dựng dựa vào cách kết hợp tuyến tính của

các vector trong cơ sở trực giao

Vì thế nếu sử dụng tất cả các vector riêng của ma trận hiệp phương sai Chúng ta có thể mô tả một tập dữ liệu bằng các thừa

số của một vector cơ sở theo cở sở trực giao Nếu chúng ta định

nghĩa ma trận có K vector riêng đầu tiên của các hàng là A K

chúng ta có thể tạo ra một phép biến đổi như trên

K x A

KyA

Điều này chính là chúng ta đã tạo ra một vector trực giao nguyên thủy từ các hệ trục tọa độ có K chiều và biến đổi lại vector

Trang 34

bằng phép biến đổi kết hợp tuyến tính của các vector cơ sở Điều này được tối thiểu hoá bằng trung bình bình phương sai số giữa

dữ liệu và các thành phần của vector riêng

• Nếu dữ liệu được quan tâm trong không gian con là tuyến tính, phép biến đổi PCA cho dữ liệu này chính là cách để nén dữ liệu

mà thông tin không mất và mô tả đơn giản hơn Bằng cách chọn các vector riêng theo giá trị riêng lớn nhất chúng ta sẽ mất ít thông tin dương theo đặc tính về bình phương trung bình Một cách có thể chọn cố định thành phần của các vector riêng và các giá trị riêng tương ứng để phù hợp cách thể hiện hay rút trích dữ liệu Với ràng buộc này sẽ làm thay đổi giá trị các mức năng lượng của dữ liệu gốc Vì thế chúng ta chỉ có thể chọn xấp xỉ với giá trị của mức năng lượng, và thay đổi một giá trị của vector riêng tương ứng với giá trị riêng đó Khi đó sẽ trả về một giá trị xấp xỉ với giá trị để mô tả thông tin, cách thay đổi sẽ làm giảm số chiều của không gian con

• Ở đây chúng ta phải đối mặt với các mục đích trái ngược nhau Thứ nhất là chúng ta cần giảm bớt dữ liệu bằng cách giảm số chiều Nhưng khi đó chúng ta muốn đảm bảo đầy đủ nội dung của thông tin gốc Theo đề nghị của PCA để thuận lợi trong khi điều khiển cân bằng giữa các yếu tố, giảm lượng thông tin và đơn giản cho công việc làm bằng tay, vì thế phải tạo ra các cửa sổ tuyến tính, sau đó chia dữ liệu đầu vào thành các vùng nhỏ và điều chỉnh các chế độ phù hợp cho từng vị trí dữ liệu cục bộ

• Bây giờ ta xét một ví dụ để chỉ các đặc tính của vector riêng Dữ liệu được tạo ra theo cách nhân tạo, nó được mô tả như hình vẽ 2.6 bao gồm các điểm nhạt và các điểm đậm trong một tập dữ liệu

Trang 35

Hình 2.6 Tập dữ liệu mô tả vector đặc trưng [9]

Giá trị trung bình và ma trận hiệp phương sai của các dữ liệu

có thể dễ dàng tính được từ dữ liệu này Các vector riêng và giá trị riêng thì được tính từ ma trận hiệp phương sai Chiều của các vector riêng được vẽ như trên hình 2.6 bằng hai đường Vector riêng đầu tiên có các điểm trị riêng lớn nhất theo chiều biến đổi lớn nhất (từ bên phải và hướng lên trên) Ngay cả vector riêng thứ hai thì trực giao đến vector thứ nhất (điểm từ trái hướng lên trên) Trong ví dụ này giá trị riêng đầu tiên tương ứng tới vector riêng thứ nhất là λ1 = 0 1737, trong khi đó giá trị thứ hai là

0001 0

2 =

λ có được bằng cách so sánh trị số của từng trị riêng đến tổng tất cả của các trị riêng Chúng ta có nhiều cách để có thể tính đến năng lượng theo từng vector riêng khác nhau Trong trường hợp vector riêng đầu tiên chứa hầu hết tất cả các mức năng lượng thì dữ liệu có thể xấp xỉ tốt để mô tả trong không gian một chiều

Trang 36

2.2.2 Tối thiểu hóa sự sai biệt của PCA [11], [12]

Xét công thức toán học, tổ hợp tuyến tính

k x w xw

y

1

1 1

của các hệ số x1, x2, …, xn của vector x Các giá trị w11, , wn1 là

các hệ số vô hướng hay trọng số, các thành phần của vector n

chiều w1,w1T là ma trận chuyển vị của w1

Thừa số y1 được gọi là thành phần chính thứ nhất của x, sự sai biệt của y1 được tối thiểu hóa Bởi vì sự sai biệt phụ thuộc vào

cả trị chuẩn và hướng của vector trọng số w1, ta tìm vector trọng

số w1 bằng cách cực đại hóa theo chuẩn PCA

( ) { } ( ) { } 1 { } 1 1 1

2 1

2 1 1

e2,…, en của ma trận Cx Trật tự của các vector riêng này cũng

tương ứng với trị riêng d1, d2,…, dn, thỏa mãn d1 > d2 >…> dn Để

giải quyết vấn đề cực đại hóa, ta gán w1 = e1; Do đó thành phần

chính đầu tiên của x là y eTx

1

1 =Tiêu chuẩn đánh giá JPCA1 theo công thức (2.18) có thể được tổng quát hóa thành m thành phần chính (m là số bất kỳ từ 1 đến

Trang 37

n) Tìm thành phần chính thứ m (1 ≤ m ≤ n)y wTx

m

m = , wm tương ứng là vector trọng số đơn vị chuẩn, vi phân ym cực đại hóa dưới

điều kiện ym không tương quan với các thành phần chính được

Điều kiện (2.22) chỉ ra:

{ }= { ( )( ) }= T x k =0

m

T k

T m k

my E w x w x w C wy

Đối với thành phần chính thứ 2, ta có điều kiện sau

0

1 2 1 1

trong không gian con vuông góc với vector đặc trưng thứ nhất Cx

Giải pháp được đưa ra là

2

2 e

w =Tương tự ta có

k

k =Với cùng kết quả đó ta sẽ thu được wi nếu độ sai biệt của yi

được cực đại hóa với điều kiện các vector thành phần chính trực

giao

hoặc T j ij

i w

Trang 38

2.2.3 Tính bình phương sai số tối thiểu của PCA [11], [12]

Các thành phần chính được xác định là tổng trọng số các hệ

số x với độ vi phân cực đại (trong điều kiện các trọng số đã được chuẩn hóa và các thành phần chính không có các mối tương quan với nhau) Chúng ta xét dãy m các vector cơ bản trực giao (không gian con n chiều), do đó sai số trung bình bình phương giữa x và hình chiếu của nó lên không gian con là tối thiểu Với các vector cơ sở w1, w2, , wm, giả sử

ij j

T

i w

w =δHình chiếu của x lên không gian con được trải rộng bởi

PCA MSE E x w x w

PCA MSE E x E w x J

1

2 2

T j

x w C w C

Tuy nhiên công thức này không đặc trưng cho tất cả thành phần cơ bản của không gian con Vài thành phần cơ bản trực pha của không gian con có thể có cùng hướng nén tối ưu Sự nhập nhằng này có thể là điều bất lợi, ta có thể thấy rằng có thể có một

Trang 39

số công thức khác tạo ra các thành phần cơ bản của không gian

con PCA thích hợp hơn

Giá trị trung bình bình phương sai số được cho bởi công thức

PCA MSE dJ

1

tổng các trị riêng tương ứng với các vector riêng em+1,…, en

Điều kiện trực giao

jk k k

Từ các kết quả trên vector cơ bản thành phần chính wi chính

là các vector riêng ei của Cx như sau

{ } {ym EemTxxTem} eTmCxem dm