Kỹ thuật tìm lỗi màu trên gạch men, phân tích các thành phần của ảnh theo kết cấu, phương pháp sử dụng thuật toán K-means trong đề tài này cũng là một kỹ thuật được áp dụng khá rộng rãi,
Trang 1TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS TS NGUYỄN HỮU PHƯƠNG
Tp.HCM – 2008
Trang 2Tôi xin chân thành cảm ơn thầy PGS TS Nguyễn Hữu Phương, người
đã hướng dẫn, tận tình chỉ bảo và tạo điều kiện thuận lợi cho tôi hoàn thành tốt luận văn tốt nghiệp
Tôi xin chân thành cảm ơn quý thầy cô khoa điện tử viễn thông của trường Đại Học Khoa Học Tự Nhiên, đã hết lòng giảng dạy và truyền đạt kiến thức giúp đỡ tôi trong suốt thời gian ở trường, đồng thời tôi cũng cảm
ơn Th.S Đặng Quang Vinh người hỗ trợ và giúp đỡ tôi thực hiện hoàn thành tốt đề tài
Cuối cùng, tôi cũng xin gửi lời cảm ơn gia đình, bạn bè cùng lớp và đồng nghiệp đã hỗ trợ động viên tôi trong suốt quá trình học tập và thực hiện luận văn tốt nghiệp này
Tác giả
Trang 3Mục lục
Danh mục các ký hiệu và các chữ viết tắt
Danh mục các bảng
Danh mục các hình vẽ, đồ thị
LỜI NÓI ĐẦU
Chương 1 – GIỚI THIỆU TỔNG QUAN
1.1 Tổng quan về phương pháp tìm lỗi bề mặt 1
1.2 Màu sắc và kết cấu bề mặt của gạch 3
1.3 Các nghiên cứu trước đây 4
1.3.1 Phương pháp biến đổi DWHT (Directional Walsh-Hadamard Transform) 4
1.3.2 Phương pháp dùng lọc Gabor 6
1.3.3 Phương pháp GLCM (Grey Level Co-occurrence Matrices) 9
1.3.4 Phương pháp tìm lỗi dùng mạng neural 11
Chương 2 – CƠ SỞ PHÂN TÍCH 2.1 Chuyển đổi giữa các không gian màu 13
2.2 Phân tích các thành phần chính (PCA) 20
2.2.1 Thành phần chính 20
2.2.2 Tối thiểu hóa sự sai biệt của PCA 25
2.2.3 Tính bình phương sai số tối thiểu của PCA 27
2.2.4 Chọn thành phần chính 28
2.3 Các phép toán hình học cơ bản 30
2.4 Luật quyết định Bayes 36
Chương 3 – PHÂN TÍCH ĐẶC TRƯNG KẾT CẤU 3.1 Giới thiệu các loại đặc trưng kết cấu ảnh 47
3.2 Các phương pháp phân lớp ảnh 49
Trang 43.2.2 Phân lớp KNN (K-Nearest Neighbourhood) 52
3.2.3 Phân lớp bằng thuật toán kết nhóm K-means 55
Chương 4 – PHÁT HIỆN LỖI TRÊN GẠCH MEN 4.1 Các lỗi ở gạch men 67
4.2 Cơ sở dữ liệu 69
4.3 Các bước thực hiện 71
4.4 Phân lớp màu theo kết cấu 77
4.5 Kỹ thuật kết nhóm 79
4.5.1 Khởi tạo nhóm 79
4.5.2 Kết hợp các nhóm màu giống nhau 80
4.5.3 Làm nhẵn đường biên theo phương pháp hình học 81
4.6 Chọn ngưỡng theo kết cấu ảnh 83
4.7 Các phương pháp tìm lỗi 84
4.7.1 Tìm lỗi màu bằng luật quyết định Bayes 84
4.7.2 Tìm lỗi bằng kỹ thuật truy hồi trạng thái hình học 85
4.7.3 Tìm lỗi bằng kỹ thuật so sánh diện tích các lớp màu 86 4.7.4 Khoanh vùng phần bị lỗi 87
4.7.5 Tìm lỗi sai kích thước 88
Chương 5 – KẾT QUẢ THỰC HIỆN 5.1 Các kết quả khảo sát thuật toán kết nhóm Kmeans 95
5.1.1 Kết nhóm ảnh phong cảnh 95
5.1.2 Kết nhóm các ảnh gạch men 96
5.2 Tìm lỗi bằng kỹ thuật truy hồi từ trạng thái hình học 97
5.2.1 Gạch bị lỗi do vết dơ 97
5.2.2 Gạch bị các lỗ đinh nhỏ 98
5.2.3 Gạch lỗi màu không đồng nhất 99
5.2.4 Gạch bị lỗi màu 100
Trang 55.3.1 Lỗi vết dơ ố 101
5.3.2 Gạch lỗi bị mờ, bị bóng che khuất 102
5.3.3 Gạch lỗi bị mờ, không đều về màu 103
5.3.4 Gạch lỗi do trầy xước, bong tróc màu 104
5.3.5 Một số kết quả từ ảnh quay từ Quickcam 105
5.4 Tìm lỗi kích thước 106
5.5 Nhận xét kết quả 108 KẾT LUẬN
TÀI LIỆU THAM KHẢO
Trang 6CA Classification Accuracy
CO Co-occurrence
CIE Commission Internationale de Léclairage
CMY Cygan Magenta Yellow
DWHT Directional Walsh-Hadamard Transform
FIS Fuzzy Inference System
FFT Fast Fourier Transform
FIDM First-Order Inverse Element Difference Moment FDM First-Order Element Difference Moment
GLCM Grey Level Co-occurrence Matrices
HVS Human Visual System
KNN K-Nearest Neighbourhood
LVQ Learning Vector Quantization
LMS Least Mean – Square
MSMD Multi-Scale and Multi-Directional
MLP Multi-Layer Perceptron
MC Mean Convergence
MSE Mean Square Error
PCA Principal Component Analysis
PMF Probability Mass Function
RBFNN Radial Basis Function Neural Networks
SDM Second-Order Element Difference Moment
SIDM Second-Order Inverse Element Difference Moment SVM Support Vector Machines
SOM Self Organising Maps
VxC TSG Tiles for Surface Grading
TFN Text Feature Number
Trang 7Bảng 3.1 Thuộc tính các đối tượng K=1 55
Bảng 3.2 Thuộc tính các đối tượng K=2 57
Bảng 3.3 Thuộc tính các đối tượng K=3 62
Bảng 4.1 Các loại gạch men của VxC TSG 70
Bảng 4.2 Các loại gạch chụp từ QuickCam 71
Bảng 5.1 Kết quả tham khảo [1] sử dụng lọc Gabor và DWHT 109
Bảng 5.2 Kết quả thời gian thực nghiệm của tài liệu [1] 109
Bảng 5.3 Kết quả thực nghiệm tìm lỗi màu 111
Bảng 5.4 Kết quả thời gian thực hiện tìm lỗi màu 112
Bảng 5.5 Kết quả thực nghiệm tìm lỗi kích thước cùng loại gạch 114
Bảng 5.6 Kết quả thực nghiệm tìm lỗi các loại gạch khác nhau 115
Trang 8Hình 1.1 Các loại gạch men 3
Hình 1.2 Ảnh a, c, e, g ảnh không lỗi, b, d, f, h ảnh bị lỗi 4
Hình 1.3 Mô tả không gian màu RGB 4
Hình 2.1 Bước sóng và phổ trong không gian RGB 15
Hình 2.2 Không gian màu CIE hai chiều 16
Hình 2.3 Biểu diễn không gian màu (a) XYZ (b )xyY 17
Hình 2.4 Không gian màu (a) CIE L*a*b* (b) CIE L*u*v* 18
Hình 2.5 Biểu diễn trong hệ toạ độ cực (a) CIE L*a*b* (b) CIE L*u*v* 19
Hình 2.6 Tập dữ liệu mô tả vector đặc trưng 24
Hình 2.7 (a) trước khi Dilation, (b) sau khi Dilation 31
Hình 2.8 (a) trước khi Erosion, (b) sau khi Erosion 31
Hình 2.9 (a) trước khi Opening, (b) sau khi Opening 34
Hình 2.10 (a) trước khi Closing, (b) sau khi Closing 35
Hình 2.11 Mật độ xác suất 37
Hình 2.12 Sơ đồ mô tả thuật toán học 39
Hình 2.13 Tập dữ liệu kết nhóm 40
Hình 2.14 Trung bình argmin 41
Hình 2.15 khoảng cách Euclidean 42
Hình 2.16 Ví dụ hai loại cá hồi và cá mú 42
Hình 2.17 Biến đổi không gian theo tỉ lệ (scale) 43
Hình 2.18 Các phép biến đổi trong không gian Euclidean 43
Hình 2.19 Tính khoảng cách Mahalanobis 44
Hình 2.20 Không gian Mahalanobis 45
Hình 2.21 Không gian Gaussian 45
Hình 3.1 Các loại texture 49
Hình 3.2 Cấu trúc RBFNN 50
Hình 3.3 Phân lớp KNN với n = 3, k = 7 52
Hình 3.4 Lưu đồ giải thuật cho thuật toán K-means 56
Trang 9Hình 3.6 Khởi tạo giá trị lần lặp đầu tiên 58
Hình 3.7 Xác định trọng tâm lần lặp thứ nhất 60
Hình 3.8 Xác định trọng tâm lần lặp thứ hai 61
Hình 3.9 Tối thiểu thuộc tính 65
Hình 4.1 Các loại lỗi ở gạch men 68
Hình 4.2 Mô hình băng tải tạo cơ sở dữ liệu ảnh gạch men 69
Hình 4.3 Sơ đồ mô tả hệ thống 72
Hình 4.4 Mô hình thực hiện của hệ thống dò tìm lỗi bề mặt 72
Hình 4.5 Sơ đồ khối mô tả các quá trình thực hiện 73
Hình 4.6 Kết nhóm và chọn giá trị khởi tạo kết nhóm 77
Hình 5.1 Giao diện mô phỏng lỗi màu 94
Hình 5.2 Giao diện mô phỏng lỗi kích thước 94
Hình 5.3 Kết nhóm ảnh phong cảnh theo phương pháp K-means 95
Hình 5.4 Kết nhóm ảnh gạch theo phương pháp K-means 96
Hình 5.5 Gạch bị lỗi vết màu 97
Hình 5.6 Gạch bị lỗi lỗ đinh 98
Hình 5.7 Gạch bị lỗi màu không đồng đều 99
Hình 5.8 Gạch bị lỗi màu 100
Hình 5.9 Tìm lỗi gạch bị vết dơ 101
Hình 5.10 Tìm lỗi gạch bị mờ bóng che 102
Hình 5.11 Tìm lỗi gạch bị mờ không đồng màu 103
Hình 5.12 Gạch lỗi do trầy xước, bong tróc màu 104
Hình 5.13 Kết quả của các ảnh quay từ Quickcam 105
Hình 5.14 Kết quả tìm lỗi kích thước ảnh cho loại gạch Agata 106
Hình 5.15 Kết quả tìm lỗi kích thước ảnh cho loại gạch Antique 106
Hình 5.16 Kết quả tìm lỗi kích thước ảnh cho loại gạch Berlin 107
Hình 5.17 Kết quả tìm lỗi kích thước ảnh cho loại gạch Campinya 107
Hình 5.18 Kết quả tìm lỗi kích thước ảnh cho loại gạch Mediterranea 108
Trang 10trong việc tìm lỗi bề mặt của sản phẩm công nghiệp thường được ứng dụng trong các sản phẩm như: tìm lỗi vải, thép, gỗ, đá hoa cương, hay trong lĩnh vực khảo cổ học… đã và đang là những đề tài vẫn còn trong giai đoạn nghiên cứu theo nhiều lĩnh vực áp dụng khác nhau, và cũng đang là nhu cầu cần thiết cấp bách cho các ngành công nghiệp trên nhiều nước
Để phát hiện được các lỗi chính xác và nhanh, ta phải phân tích kết cấu ảnh hay phân tích các lớp màu càng chính xác thì kết quả tìm lỗi sẽ càng tối ưu Đồng thời để thực hiện nhanh phù hợp với việc xử lý thời gian thực dữ liệu xử lý càng ít càng tốt, vì thế phương pháp tốt nhất để dữ liệu ít
là tìm đặc trưng của từng lớp màu Công việc tìm lỗi chỉ thực hiện trên các tập đặc trưng Kỹ thuật tìm lỗi màu trên gạch men, phân tích các thành phần của ảnh theo kết cấu, phương pháp sử dụng thuật toán K-means trong đề tài này cũng là một kỹ thuật được áp dụng khá rộng rãi, nhưng trong lĩnh vực tìm lỗi màu trên bề mặt sản phẩm thuật toán K-means là một nghiên cứu ứng dụng mới Thuật toán K-means thực hiện để phân tích ảnh màu theo phương pháp kết nhóm mà các giá trị khởi tạo ban đầu được thực hiện theo hai cách: chọn bằng tay và chọn lựa nhờ vào kỹ thuật phân tích các thành phần chính (PCA) Việc sử dụng phép biến đổi không gian màu CIE
để tách các màu theo các lớp mà theo trực giác của con người cho là khác màu nhau, sau đó ta sử dụng các phép toán Minkowski để làm trơn tru các đường bao của các lớp màu vừa tách Từ các thành phần của các lớp màu khác nhau này ta sẽ dễ dàng phát hiện các lỗi về màu sắc trên ảnh của gạch theo các phương pháp
• Phân tích tìm lỗi màu bằng luật quyết định Bayes
• Tìm lỗi màu bằng kỹ thuật truy hồi từ trạng thái hình học
• Tìm lỗi màu bằng kỹ thuật so sánh diện tích các lớp màu
• Tìm lỗi sai kích thước bằng cách tính trọng tâm
Trang 11• Chương 1: Giới thiệu tổng quan
Giới thiệu tổng quan về lỗi màu sắc trên gạch men, đặc trưng về màu của gạch men và các nghiên cứu trước đây
• Chương 2: Cơ sở phân tích
Giới thiệu phép biến đổi trong không gian màu CIE và các phép toán học cơ bản được áp dụng để phân tích các thành phần của ảnh, các kỹ thuật trích rút đặc trưng nhằm áp dụng cho các phương pháp tìm lỗi kết cấu
• Chương 3: Phân tích đặc trưng của kết cấu và lỗi của gạch men Đưa ra các phương pháp phân tích trích rút đặc trưng màu của ảnh kết cấu, và phân tích các dạng lỗi của gạch, từ cơ sở đó có thể minh chứng cho việc chọn lựa phương pháp phân tích màu phù hợp với các đặc điểm kiểm tra lỗi trên ảnh gạch
• Chương 4: Phát hiện lỗi màu trên gạch men
Đây là chương trọng tâm của đề tài, chương này đã xây dựng cơ sở
và phân tích toàn bộ các bước thực hiện tìm lỗi dựa trên các cơ sở phân tích được chọn lọc Quá trình thực hiện gồm hai giai đoạn, mỗi giai đoạn thực hiện ba bước: tạo dữ liệu chuẩn, tạo dữ liệu kiểm tra và phát hiện lỗi
• Chương 5: Kết quả thực nghiệm
Chương này trình bày các kết quả thực hiện của đề tài, bao gồm kết quả của kỹ thuật kết nhóm K-means, kết quả tìm lỗi màu và kết quả tìm lỗi kích thước, các lỗi sẽ được khoanh các vùng trên ảnh kết quả
Thành công của đề tài mở ra một hướng ứng dụng trong lĩnh vực phát hiện lỗi bề mặt sản phẩm Kết quả nghiên cứu không dừng lại ở thực nghiệm mô phỏng trên matlab mà còn phát triển phần cứng để phục vụ trong các dây chuyền sản xuất cho các ngành công nghiệp
Tp.HCM, tháng 05 năm 2008
Trang 12Chương 1 GIỚI THIỆU TỔNG QUAN
Phần giới thiệu tổng quan trong chương này trình bày khái quát
về phương pháp dò tìm lỗi cho gạch men, phân tích các kết cấu màu trên ảnh cho nhiều loại gạch men có các kết cấu màu khác nhau, đồng thời giới thiệu chi tiết các nghiên cứu trước đây đã thực hiện trong việc tìm lỗi bề mặt để có thể đưa ra một phương pháp tốt nhất
1.1 TỔNG QUAN VỀ PHƯƠNG PHÁP TÌM LỖI BỀ MẶT [1], [2]
Vấn đề nghiên cứu các phương pháp và các kỹ thuật cho việc kiểm tra đánh giá lỗi bề mặt trong sản xuất theo dây chuyền tự động, cũng như vai trò của việc kiểm tra và đánh giá chất lượng cho sản phẩm là rất quan trọng, nhưng hiện nay các nghiên cứu để áp dụng cho các ứng dụng này vẫn chưa phổ biến, chủ yếu là các phương pháp truyền thống thường được thực hiện do con người trực tiếp quan sát bề mặt của sản phẩm, để đánh giá phân loại chất lượng cho các sản phẩm Với công nghệ hiện đại và kỹ thuật phát triển rất cao trong các ngành sản xuất công nghiệp theo dây chuyền tự động, đòi hỏi việc kiểm tra đánh giá sản phẩm phải được thực hiện một cách chính xác, tốc độ nhanh và phải thực hiện thường xuyên trong một môi trường với các loại nhiễu
Vì thế một ứng dụng trong công nghiệp quan trọng là kiểm tra đánh giá bề mặt sản phẩm, phân loại sản phẩm bằng hệ thống quan sát tự động từ các sản phẩm di chuyển trên băng truyền tải với số lượng, thời gian tạo sản phẩm nhanh Ví dụ các sản phẩm được áp dụng như: sản xuất gỗ, thép, gạch men, vải Mục đích nhằm nâng cao chất lượng sản phẩm, như các sản phẩm không đủ tiêu chí sẽ bị loại và đồng thời cũng cần phải tăng năng suất sản xuất
Mặc dù việc nghiên cứu lý thuyết và thực nghiệm trong những năm qua cũng phát triển khá mạnh mẽ, nhưng vẫn chưa thể đáp ứng
Trang 13được công việc kiểm tra đánh giá cho mọi sản phẩm Đã có các nghiên cứu thực hiện tự động dò tìm các lỗi bề mặt cho các sản phẩm như: lỗi bề mặt của thép, đá kim cương, gỗ lót sàn, bông vải, gạch men…các nghiên cứu đã đưa ra nhiều mô hình và các phương pháp tính toán kết hợp phân tích ảnh, tuy nhiên các phương pháp này đa phần xử lý dựa trên việc phân tích mức xám của ảnh (ảnh đen trắng) mà hiện tại trong nhiều sản phẩm cần được đánh giá ở khía cạnh màu sắc
Đề tài ‘Phát hiện lỗi màu trên gạch men’ nhằm nghiên cứu để
đánh giá và phân loại chất lượng về màu của gạch men Ở đây việc kiểm tra đánh giá được thực hiện trên ảnh tĩnh, đề tài chỉ thực hiện
mô phỏng bằng Matlab, không thực hiện trên phần cứng và hệ thống thiết bị Tuy nhiên đề tài cũng chọn lọc các thuật toán, phương pháp
xử lý tín hiệu và xử lý ảnh để có thể thực hiện được trong thời gian thực (ảnh được chụp từ camera trong khi sản phẩm di chuyển trên băng tải) Gạch được thực hiện là các loại gạch men có nhiều màu sắc và có kết cấu đa dạng Phương pháp thực hiện dựa trên phân tích kết cấu và các đặc trưng của màu, có nhiều phương pháp được thực hiện để đánh giá sự giống và khác nhau về màu sắc của gạch men như được trình bày ở chương 3
Đề tài này sau khi nghiên cứu và nếu tiếp tục phát triển để hoàn chỉnh phần cứng có thể được ứng dụng phân loại gạch trong các nhà máy sản xuất gạch men, nó vẫn có thể mở rộng cho các hệ thống dò tìm sai lỗi trong các ngành sản xuất khác như: sản xuất gỗ, nhựa, thép… và có thể mở rộng cho các lĩnh vực khác như: nông nghiệp, y học, quân sự…
Trang 141.2 MÀU SẮC VÀ KẾT CẤU BỀ MẶT CỦA GẠCH [1], [3]
Đây là đề tài mà mục tiêu cuối cùng là xử lý các màu sắc của gạch
từ ảnh màu được chụp sau đó lưu lại để làm cơ sở dữ liệu Cho nên vấn đề màu sắc cũng là vấn đề cần được quan tâm và tìm hiểu rất kỹ trước khi thực hiện
Màu sắc là thành phần rất quan trọng trong việc kiểm tra và phát hiện lỗi bề của gạch men hay việc tìm lỗi trên bề mặt trong các ứng dụng tự động kiểm tra phân loại sản phẩm Để so sánh màu sắc của gạch bị lỗi so với gạch tốt, vấn đề đặt ra đầu tiên phải tìm các đặc trưng của màu (thành phần đại diện của một vùng màu) để mô tả cho thông tin màu đó Tuy nhiên có nhiều lỗi gây nhầm lẫn trong việc đánh giá phân biệt giữa gạch tốt và gạch xấu, như trong các ảnh có nhiều kết cấu, các kết cấu trên ảnh phức tạp có quá nhiều vùng màu khác nhau đan xen lẫn nhau gây ra các điểm lỗi trên ảnh của một lớp này có thể không phải là điểm lỗi ở lớp khác Hình 1.1 trình bày một
số gạch men khác nhau về phân bố màu sắc và kết cấu
Trang 15
Hình 1.2 Ảnh a,c,e,g ảnh không lỗi, b, d, f, h ảnh bị lỗi
Phân bố cho ảnh màu dựa trên nhiều không gian màu khác nhau như: không gian RGB (Red Green Blue), không gian màu CIE
Hình 1.3 Mô tả không gian màu RGB [8]
Phân bố cho ảnh màu dựa trên nhiều không gian khác nhau như hình 1.3 không gian RGB gọi là không gian màu sơ cấp, các không gian màu khác như: CIE, Ohta… được biến đổi từ không gian màu RGB, cường độ màu trong các không gian màu này được biến đổi theo một tỉ lệ nào đó của ba thành phần màu trong không gian RGB theo một tỉ lệ mà nó phụ thuộc vào không gian mới Mục tiêu nghiên cứu hướng tới việc thực hiện đánh giá lỗi dựa trên các màu cơ bản của gạch men với sự kết hợp đặc trưng của màu và kết cấu của ảnh
Trang 161.3 CÁC NGHIÊN CỨU TRƯỚC ĐÂY [3], [4], [5], [6]
1.3.1 Phương pháp biến đổi DWHT (Directional Walsh-Hadamard
Transform) [3]
Đây cũng là một nghiên cứu mới, trong mục này chúng ta mô
tả một phương pháp để phân tích đặc trưng kết cấu dựa vào biến
đổi DWHT Hầu hết các phép biến đổi là tuyến tính và trực giao
của tín hiệu trong miền thời gian hoặc không gian Các phép thực
hiện đều dựa vào các hàm lỏi của tín hiệu sin cơ bản (ví dụ biến
đổi Fourier, biến đổi cosine) Biến đổi Walsh được định nghĩa
1
0 1
đổi của làm lỏi ( ).
1ψ
− Biến đổi Walsh là một trong những ngoại lệ
mà được gọi là “phân tích hài” nó chỉ ra tần số cơ bản cho hàm
lỏi và phân tích tín hiệu vào bên trong cửa sổ vuông của dạng
sóng nguyên thủy trong miền biến đổi Hàm lỏi có thể được chọn
từ xác suất của một tập thay đổi Ví dụ trong phép biến đổi
DWHT tự nhiên (thành phần của các họ Walsh) ψ là
,x,v,u
với bi(z) là bit thứ i của z trong mô tả số nhị phân Dạng DWHT
của tần số hay tần số chính Các tần số ngang qua các zero hoặc
các tín hiệu thay đổi theo tần số trong biến đổi Fourier Tuy nhiên
tần số này bằng hai lần kích thước tần số của một tín hiệu
)()
(x Freq x Seq = ở đây x là tín hiệu trong miền thời gian hay miền
không gian và chỉ tập trực giao của các dạng sóng trong cửa sổ
chữ nhật được tạo ra từ DWHT, hàm lỏi chỉ có thể là dạng sóng
sin, tổng các trọng số của các phần tử các thành phần sóng
Trang 17vuông của nó, khi đó chúng ta nhận được các đặc trưng từ phương pháp DWHT mà nó mô tả cho kết cấu loại yếu tốt hơn so với phương pháp FFT hay lọc Gabor Những báo cáo gần đây cũng đã chứng minh có nhiều phương pháp đã thực hiện nhưng vẫn kém hơn DWHT trong cách phân lớp kết cấu Trong cả hai trường hợp lọc trong miền không gian sử dụng lọc có kích thước nhỏ (3x3 hay 5x5), do vậy nó có cấu trúc trơn tru hơn, ví dụ lọc cosine có cấu trúc dạng 0-1 thực hiện tốt hơn lọc DWHT Vấn đề này là vấn đề tiêu biểu cho việc mô tả tín hiệu của hàm cơ sở hình chữ nhật, khi chúng ta áp dụng phép biến đổi DWHT và sử dụng các số hạng tần số cao hơn, tuy nhiên từ các hàm có tần số cao hơn có thể làm nhẵn và điều hoà các ngõ ra để mô tả các hệ
số suy giảm của sai số Trở lại vấn đề tổng hợp của tín hiệu hình sin, và liên quan đến hạng cao hơn (hạng 8) trong hàm Walsh, nhằm giảm bớt sai số
1.3.2 Phương pháp dùng lọc Gabor [3]
Lọc Gabor được sử dụng rộng rãi trong phân tích dữ liệu ảnh theo nhiều chiều và nhiều tỉ lệ khác nhau Trong lĩnh vực xử lý ảnh, phương pháp này thường được dùng để trích đặc trưng hay phân đoạn ảnh kết cấu cho độ chính xác cao Lọc Gabor thực hiện rất hiệu quả trong phân tích kết cấu theo các chiều khác nhau Bằng các lọc thấp qua cho từng kết cấu ảnh vào, các lọc này sẽ trích các đặc trưng của mỗi kết cấu ảnh theo một hướng định trước trong một dãy tần số quan sát Vì thế bất lợi lớn nhất của lọc Gabor là việc tính toán phức tạp mất nhiều thời gian Về
cơ bản lọc Gabor có thể định nghĩa để thực hiện cả trong miền không gian và miền tần số, tuy nhiên lọc Gabor thực trong miền tần số sẽ nhanh hơn và đặc biệt đối với ảnh có kích thước lớn
Trang 18Lọc Gabor trong miền tần số được biểu diễn theo công thức (1.3)
( ) j ( x u y v )
v ue.e
v,u
p x p
0 0 2
2 2 2
trong đó up và vp là hai thành phần thay đổi vị trí trên hệ trục tọa
độ trong mặt phẳng tần số, ωx,ωy là tần số trung tâm của lọc
(thừa số điều chế) theo hai chiều x và y θ là tham số định hướng
cho lọc σx,σy là độ lệch chuẩn (độ rộng băng thông) của lọc theo
và đồng thời lọc theo nhiều hướng khác nhau Sự thay đổi về tần
số và hướng khác nhau của dãy lọc sẽ cho phép ta trích ra một số
lượng các thông tin cần thiết của mỗi kết cấu ảnh Trong thực
nghiệm thường được sử dụng lọc Gabor bao gồm một dãy 12 lọc
được sắp xếp theo 3 tần số và 4 chiều như sau
135904502
4
,,
i j
Trang 19Ở đây ΩM là không gian tần số cực đại Việc chọn tần số trung tâm trong miền tần số với đường biên của hai loại kết cấu thấp
hơn 50% (xem mục 3.1), miền tần số này được chọn theo tỉ lệ của
hàm log2 Trong các lọc Gabor chúng ta lấy tần số trung tâm tăng
theo bậc 2 và bằng ½ mức năng lượng của dải băng thông, phổ
tần số Muốn thực hiện phương pháp này một cách chính xác, từ
phương pháp lọc Gabor cơ bản MSMD (Scale and
Multi-Directional) ta phải phân lớp theo kết cấu trên ảnh của gạch men,
để có thể xác định sự khác biệt và nhận dạng được lỗi Nhiều
nghiên cứu đã được giới thiệu bằng cách thực hiện lọc Gabor
trong phân lớp kết cấu ảnh Trong việc tìm khuyết tật của gạch
men thường chọn hướng với độ phân giải là 0
45
=
Δθ , chọn tần số trung tâm theo hàm mũ 2 và bằng một nửa mức năng lượng của
dải thông Tập đặc trưng của lọc Gabor đầu tiên được trích từ 12
,8
,
16 là tần số cực đại trong miền tần số, 12 phổ từ lọc trung bình xây dựng thành vector
đặc trưng đầu tiên 1
8
,g
Trang 200 0 0 0 2
135 90 45 0 2
4
135 90 45 0 2
4 8
, , , ,
, , ,
g F
, , , ,
, , ,
g F
M M M ,
Gabor
M M M ,
Gabor
θω
μ
θω
μ
θ ω
θ ω
, ) g max(
), g ( ), g ( F
M M M
, ,
, Gabor
điều này được mô tả bằng phương pháp GLCM (ma trận tương
quan của các mức xám) GLCM là một phương pháp thống kê cổ
điển, nhưng trong hầu hết các thuật toán phân lớp kết cấu ảnh
thường được áp dụng
Cho một ảnh x có n mức xám, ma trận tương quan của các mức xám được ký hiệu là Φd,θ( )x chính là một ma trận vuông n x
n, các phần tử của ma trận được tạo thành từ các cặp pixel có
cường độ sáng liên quan nhau trong một khoảng cách d và
Trang 21Ma trận CO được biểu diễn như (1.11) sẽ chứa các đặc tính chung của mỗi kết cấu Ví dụ nếu các giá trị tập hợp xung quanh
đường chéo của Φd,*( )x lớn thì kết cấu của ảnh x thuộc dạng
Coarse texture (xem mục 3.1) theo cách đánh giá dựa vào
khoảng cách d Từ một ảnh đơn giản, nếu kết hợp các thay đổi
của tham số d và θ lại với nhau ta có thể tạo ra nhiều ma trận
GLCM khác nhau, điều này nói lên rằng ma trận GLCM không thể
sử dụng trực tiếp để mô tả kết cấu Do đó vector đặc trưng của
kết cấu ảnh được mô tả bằng một số hàm giả chuẩn
(pseudo-standard) cho ma trận GLCM Haralick et al [31] trình bày 14 hàm
GLCM giả chuẩn Trong phương pháp này được chọn 6 hàm phổ
j ,i
j i
j i j,
j ,i
j ,i
j,ijiCON
f
ji
j,iIDM
f
j,ij
iCOR
f
j,ilogj,iENT
f
j,iASM
f
j,iMaxMAX
f
2 6
2 5
4 3
2 2
1
1
σσ
μ
Mỗi một hàm sẽ mô tả một đặc tính nào đó cho một kết cấu
• Hàm MAX (Maximun) và hàm ASM (Angular Second
Moment) là thống kê cơ sở của Φ Hàm ASM đo tính đồng nhất của ảnh, nó phù hợp để phát hiện cho các kết cấu ngẫu nhiên Trong kết cấu ảnh phân bố không đồng đều, giá trị của ASM cho ra sẽ nhỏ hơn ảnh có kết cấu đều
• Hàm ENT (Entropy) dùng để đo độ phức tạp của ảnh Ảnh có
độ phức tạp càng nhiều thì ENT càng lớn
Trang 22• Hàm COR (Correlation) đo đặc tính đường kẻ trên ảnh, nếu đặc tính của ảnh có đường theo một chiều θ nào đó càng nhiều thì giá trị tương quan sẽ càng lớn Hàm này thường
được dùng để đo ảnh Coarseness
• Hàm IDM (Inverse Difference Moment) dùng để đo các vùng
có các tone màu giống nhau xung quanh các lân cận nó
• Hàm CON (Contrast) dùng để đo các đặc tính khác nhau của kết cấu
1.3.4 Phương pháp tìm lỗi dùng mạng neural: [5], [6]
Mạng neural được sử dụng khá phổ biến, trước đây kỹ thuật này từng được thực hiện để phân lớp và tìm các lỗi, khuyết tật trên sản phẩm Đây là phương pháp rất thuận lợi cho việc tìm lỗi,
vì các tham số cần thiết để thực hiện huấn luyện cho mạng không cần nhiều như các phương pháp khác, cũng không giả định thuộc tính của dữ liệu tạo ra ở thời điểm trước đó Có nhiều kỹ thuật theo phương pháp mạng neural đã được thực hiện cho công việc tìm lỗi như: MLP (Multi-Layer Perceptron), SOM (Self Organising Maps), RBFNN (Radial Basis Function Neural Networks), SVM (Support Vector Machines)…
• Phương pháp MLP (Multi-Layer Perceptron)
MLP là phương pháp phổ biến và cho kết quả tốt nhất sử dụng phân lớp bằng mạng neural, nhưng trong trường hợp mạng không tạo ra được các lớp có đường bao khép kín, việc xác định
các lỗi là nhiệm vụ quan trọng Năm 1995 Vascocelos đã đưa ra
cách phân lớp sử dụng mạng neural Việc phân lớp dữ liệu của mạng không theo các lớp đã biết đến một trong các lớp đó không theo bất kỳ ràng buộc nào Điều này sẽ đưa từng lớp huấn luyện
sử dụng hyper-planes định dạng đường bao kín giữa các lớp
Trang 23• Phương pháp RBF (Radial Basis Function)
RBF mô tả cách phân lớp quan trọng của các mạng neural
Ở đây hoạt động của tầng ẩn được xác định bằng khoảng cách giữa một vector dữ liệu vào với vector dữ liệu mẫu đầu tiên
Năm 1994 Fredrickson sử dụng RBFNN bằng các hàm cơ bản
Gaussian để tìm lỗi dị thường Các trọng tâm và ma trận phương sai được xác định bằng thuật toán kết nhóm không giám sát K-means, các trọng số của ngõ ra được tính bằng phương pháp học có giám sát như LMS (Least Mean – Square) hay ma trận giả ngược (pseudo - inversion) để giảm độ dốc Các ngõ ra của mạng được ước tính xác suất xảy ra tại một thời điểm bằng thuật toán Bayes Công việc tìm lỗi được xác định từ các giá trị của mạng qua các bước sau
Bước 1: xác định khoảng cách tối thiểu bằng hàm thống kê Mahalanobis Sau khi kiểm tra dữ liệu mẫu, khoảng cách tối thiểu Mahalanobis của mẫu với phổ cực đại của hàm lỏi
sẽ chọn
Bước 2: là phương pháp tìm lỗi dị thường dựa vào phép hình học ánh xạ sử dụng RBF từ các hàm lỏi cho tầng ẩn
và ma trận giả ngược
Bước 3: sử dụng các cửa sổ để tìm các lỗi dị thường cho
dữ liệu kiểm tra
Tóm lại: Các phương pháp trước đây mặc dù cũng có rất nhiều tác giả
nghiên cứu với nhiều kỹ thuật khác nhau Sau cùng nó vẫn còn rất nhiều khuyết điểm như: các phương pháp chưa thực sự phổ biến với ảnh màu, tốn quá nhiều cửa sổ, mất nhiều thời gian xử
lý, do đó vẫn chưa có một mô hình cụ thể nào có thể áp dụng vào thực tế Đề tài này hướng đến các phương pháp nhằm khắc phục các vấn đề trên
Trang 24Chương 2 CƠ SỞ PHÂN TÍCH
Cơ sở chung trong vấn đề phân tích, xử lý và phát hiện lỗi bề mặt, đồng thời xác định các phương pháp phân tích để chọn các phương pháp và các thuật toán phân tích chính xác cho công việc tìm lỗi Trong vấn đề kiểm tra mà đặc biệt là tìm lỗi dựa vào hệ thống quan sát bề mặt bằng máy Đồng thời có thể xác định chính xác các lỗi trên bề mặt của gạch men ta cần quan tâm các vấn đề sau
• Xem kết cấu bề mặt ảnh theo hướng xử lý dựa vào sắc tố và kết cấu của ảnh
• Kết cấu của ảnh nhìn chung được phân chia thành hai dạng chính: dạng vĩ mô và dạng vi mô, trong xử lý ta xem kết cấu ảnh dưới dạng vĩ mô, tức các ảnh được phân chia bằng các lớp màu khác nhau, sự khác nhau này được phân biệt bằng phép biến đổi sang không gian màu CIE
Từ đó ta phải phân tích các ảnh cần xử lý theo đúng yêu cầu đặt
ra, ta dựa vào các phương pháp phân tích, đồng thời ứng dụng các phép toán học sau
2.1 CHUYỂN ĐỔI GIỮA CÁC KHÔNG GIAN MÀU [1], [7], [8]
Biến đổi không gian màu là một giai đoạn rất quan trọng và cần thiết trong kỹ thuật phân lớp ảnh Khi quan sát một ảnh ta dễ dàng nhận thấy có các màu khác nhau Nhưng làm thế nào có thể phân biệt
vị trí đường biên chính xác cho các vùng màu đó thật rất khó Mà điều này lại cần thiết trong việc tách các lớp thành các phần riêng biệt cho công việc tìm lỗi
Trong tất cả các không gian màu thường được sử dụng trong phân tính ảnh màu, chúng ta quan tâm đến hai loại không gian màu: không gian màu độc lập và không gian màu phụ thuộc
Trang 25• Không gian màu phụ thuộc là không gian màu mà màu sắc phụ
thuộc vào thiết bị và cơ cấu tạo nên chúng Ví dụ như màu tạo ra
các giá trị của các pixel là RGB = (250,134,67) ta có thể thay đổi
độ sáng hay độ tương phản của chúng khi hiển thị Giống như thế
nếu ta thay đổi các chất phát quang màu đỏ, xanh lá và màu xanh
đậm của màn hình thì cũng thay đổi được độ sáng khác nhau hay
các màu khác nhau Vì thế RGB là không gian màu phụ thuộc vào
hệ thống đang sử dụng
• Không gian màu CIE (Commission Internationale de Léclairage)
được định nghĩa dựa vào HVS (Human Visual System) hệ thống
cảm nhận bằng mắt, sử dụng hệ thống này chúng ta có thể phân
biệt bất kỳ màu nào trong hệ trục mô tả CIE
• Không gian màu độc lập là không gian màu sử dụng trong một hệ
trục tọa độ để chỉ rõ của một màu nào đó và sự tương đồng của
chúng trong hệ tọa độ đang xét Ví dụ như không gian màu CIE
L*a*b* là không gian màu độc lập, không gian màu này dựa vào
hệ thống quan sát của con người HVS Hệ thống CIE thực hiện
dựa vào sự liên kết theo thừa số phân bố phổ công suất ba màu
sơ cấp RGB của một đối tượng, các hàm này sẽ tính độ cảm nhận
về màu theo quan sát chuẩn về độ sáng theo độ dài từng bước
sóng khác nhau Các trọng số được thực hiện trên phổ của giác
quan có bước sóng từ 360nm đến 830nm
• Giá trị của ba tác nhân kích thích T cho một ánh sáng phức I( )λ
(ánh sáng này thì không đơn sắc) có thể được tính từ tham số P
với màu tương ứng bằng hàm Pi( )λ là
λ λ
λ
dI
Pd
I
PTdI
PT
Trang 26Hình 2.1 Bước sóng và phổ trong không gian RGB [8]
• Hệ tọa độ màu: Trong trường hợp tính giá trị T của một thành phần màu trong một tập nguyên thuỷ chúng ta cần biết đến hình dạng phổ và hàm tính toán cho các tham số màu Giá trị của các tham số được tính theo các thừa số nguyên của các hàm tính toán màu và các yếu tố ảnh hưởng từ chiều dài sóng Giá trị của ba yếu tố mô tả độ nhạy cảm của tập nguyên thuỷ bao gồm trị tuyệt đối cường độ của ba yếu tố cần thiết để tính các ảnh hưởng Dĩ nhiên độ chói cũng là thành phần ảnh hưởng và nó có thể thay đổi Tương ứng cho vấn đề này hệ tọa độ màu được hình thành từ không gian hai chiều khi đó độ chói được lờ đi
3 2 1
1 1
T T T
T c
+ +
3 2 1
2 2
T T T
T c
+ +
=
3 2 1
3 3
T T T
T c
+ +
Và ta không cần quan tâm đến trục thứ ba bởi gì: c1 +c2 +c3 =1
Trang 27• Không gian màu: Màu là kết quả của quá trình quan sát ánh sáng trong một vùng tạo thành phổ có chiều dài bước sóng từ 380nm đến 780nm Võng mạc của mắt người có ba dạng tế bào hình nón nhận kích thích ánh sáng màu, nó phụ thuộc theo các đường cong phổ khác nhau Nên cần phải chính xác cho ba dạng tế bào cảm nhận ánh sáng kích thích nói trên Ba thành phần này rất cần thiết
để mô tả cho một màu
Hình 2.2 Không gian màu CIE hai chiều [7]
• Năm 1931 CIE định nghĩa một hệ thống màu chuẩn có khả năng
mô tả chính xác các màu theo giác quan của con người mà nó được gọi là không gian màu CIE XYZ, hay không gian màu XYZ
Hệ thống màu chuẩn CIE dựa vào các màu tượng trưng đầu tiên trong không gian XYZ Nó không có đặc tính vật lý, chỉ là lý thuyết và độc lập với các gam màu nhưng lại phụ thuộc trong không gian RGB hay CMY (Cygan Magenta Yellow) Tuy có các màu cảm nhận ban đầu được chọn lựa từ tất cả các màu đã được quan sát bằng mắt Hệ thống XYZ dựa vào đường cong phổ từ quá trình cảm nhận ba màu của mắt
Trang 28 Không gian màu XYZ Hình 2.3 (a) là không gian màu 3D đồng nhất, và khó có thể xử lý trực tiếp trên không gian màu này, nhìn chung trong các đề tài thường chọn không gian này có dạng X +Y+Z =1, sau cùng chúng được hiểu như là không gian 2D như ở hình 2.2
Hình 2.3 Biểu diễn không gian màu (a) XYZ(b )xyY [8]
Các tọa độ của không gian này được tính theo các công thức sau
ZYX
Xx
++
=
ZYX
Yy
++
=
ZYX
Zz
++
Trang 29X A B G
X
.
.
.
.
B
G R
057311 1
204043 0
055648 0
041556 0
875992 1
969256 0
498535 0
537150 1
24079 3
R
.Z
Y
0573111
2040430
0556480
0415560
8759921
9692560
4985350
5371501
240793
• Không gian màu CIE L* a* b* và không gian màu CIE L* u* v*
Hai không gian màu này dựa vào không gian màu CIE XYZ, mà khả năng quan sát một khối màu đồng nhất theo từng vector đơn
vị khác nhau [8],[17], nó không tuyến tính và các phép biến đổi vẫn
có thể tính theo phép biến đổi ngược Thông tin về màu sắc có thể
liên kết đến điểm sáng của màu trong hệ thống Mối liên hệ phi
tuyến trong CIE L* a* b* thì không giống CIE L* u* v*
Hình 2.4 Không gian màu (a) CIE L* a* b* (b) CIE L* u* v* [8]
Trang 300 0
0
3 1
0
500500
3903
16116
Z
ZfY
Yfb
Y
YfX
Xfa
Y
Y.L
Y
YL
XZ
,Y,XU
315
4++
ZYX
YZ
,Y,XV
315
9++
0 0 0 0
3 1
0
13 13
3 903
16 116
Z , Y , X V Z , Y , X V L v
Z , Y , X U Z , Y , X U L u
Y
Y L
Y
Y L
f = Nếu U > 0 008856
( )
116
16787
= UU
Trang 312.2 PHÂN TÍCH THÀNH PHẦN CHÍNH (PCA) [9], [10], [11], [12]
Phương pháp phân tích thành phần chính (PCA), là một trong
những kỹ thuật truyền thống trong phân tích dữ liệu thống kê, trích rút
đặc trưng, và nén dữ liệu Khi đưa vào một chuỗi giá trị đo rời rạc, mục
đích là tìm ra một chuỗi biến số có kích thước nhỏ hơn với thông tin bị
mất là ít nhất, nhằm tạo một đại diện tốt nhất có thể Trong PCA độ dư
thừa có thể đo được bởi sự tương quan giữa các nhân tố dữ liệu Mối
tương quan thực hiện dựa trên cơ sở thống kê bậc 2
2.2.1 Thành phần chính [9], [10]
Xem vector dữ liệu x được biểu diễn ngẫu nhiên có n phần tử rời rạc Những phần tử đại diện của x là các giá trị được lấy từ
các giá trị của tín hiệu hay các giá trị mức xám của ảnh tại những
thời điểm khác nhau Điều này cũng rất cần thiết vì phép biến đổi
PCA cần mối tương quan giữa các đại diện với nhau, nếu các
phần tử là độc lập thì quá trình PCA không còn hiệu quả nữa
Các mẫu dữ liệu được biểu diễn như công thức 2.9
n
x, ,x,x
với trị trung bình của vector x được định nghĩa là
{ }x E
x E x x
Các thành phần của Cx được định nghĩa bằng thừa số c ij,
mô tả các hiệp phương sai giữa các thành phần biến đổi ngẫu
nhiên của x i và x j
Thành phần c ii là biến đổi của thành phần xi Khi biến đổi một
Trang 32phần đó xung quanh giá trị trung bình của nó Nếu hai thành phần
xi và xj của dữ liệu không tương quan nhau, khi đó phương sai
của nó sẽ bằng không (cij =cji =0) Lúc này ma trận hiệp phương
sai luôn đối xứng
• Từ tập dữ liệu của vector x1, x2, , xM, chúng ta có thể tính
trung bình và ma trận hiệp phương sai của tập dữ liệu này,
đó cũng chính là phép ước lượng theo trị trung bình và ma trận hiệp phương sai của tập dữ liệu đó
• Từ ma trận đối xứng của ma trận hiệp phương sai, chúng ta
có thể tính cơ sở trực giao bằng cách tìm giá trị riêng và vector riêng của nó Vector riêng là e i và giá trị riêng tương ứng là λ được tính theo biểu thức (2.12) i
n , , , i, e e
ở đây I là ma trận đơn vị có cùng bậc với Cx, chú ý . là định thức
của ma trận Nếu vector dữ liệu có n phần tử thì công thức tính
đặc trưng có bậc là n, điều này sẽ dễ dàng thực hiện nếu n nhỏ
Việc giải để tìm giá trị riêng tương ứng với vector riêng là một
công việc rất phức tạp Thường cách để tìm giá trị riêng được giải
bằng cách sử dụng mạng neural, dữ liệu được đưa vào ngõ vào
của mạng neural và giá trị hội tụ chính là giá trị ta muốn tìm
• Sự sắp xếp các vector riêng theo giá trị riêng giảm dần, sẽ tạo ra
một cơ sở trực giao với vector riêng đầu tiên cho ta khác biệt lớn
Trang 33nhất theo chiều của tập dữ liệu đó Trong trường hợp này chúng
ta có thể tìm số chiều mà tập dữ liệu có thể chứa các thành phần
năng lượng quan trọng đại diện được cho tập dữ liệu đó
Giả sử rằng một tập dữ liệu có trị trung bình và ma trận hiệp phương sai của các mẫu đã được tính toán Với A là một ma trận
bao gồm các vector riêng của ma trận hiệp phương sai theo các
vector hàng Bằng phép biến đổi cho vector dữ liệu x
A
đó chính là một điểm được xác định bởi các vector riêng trong hệ
trục tọa độ trực giao Các thành phần của y có thể được xem như
là các trục tọa độ trong cơ sở trực giao Chúng ta có thể xây
dựng vector dữ liệu nguyên thuỷ x từ vector y như sau
x
TyA
sử dụng tính chất của ma trận trực giao A−1 =AT, với AT là ma
trận chuyển của A Vector nguyên thuỷ x được xác định bằng
cách chiếu trên các trục tọa độ của cơ sở trực giao, vector
nguyên thủy được xây dựng dựa vào cách kết hợp tuyến tính của
các vector trong cơ sở trực giao
Vì thế nếu sử dụng tất cả các vector riêng của ma trận hiệp phương sai Chúng ta có thể mô tả một tập dữ liệu bằng các thừa
số của một vector cơ sở theo cở sở trực giao Nếu chúng ta định
nghĩa ma trận có K vector riêng đầu tiên của các hàng là A K
chúng ta có thể tạo ra một phép biến đổi như trên
K x A
KyA
Điều này chính là chúng ta đã tạo ra một vector trực giao nguyên thủy từ các hệ trục tọa độ có K chiều và biến đổi lại vector
Trang 34bằng phép biến đổi kết hợp tuyến tính của các vector cơ sở Điều này được tối thiểu hoá bằng trung bình bình phương sai số giữa
dữ liệu và các thành phần của vector riêng
• Nếu dữ liệu được quan tâm trong không gian con là tuyến tính, phép biến đổi PCA cho dữ liệu này chính là cách để nén dữ liệu
mà thông tin không mất và mô tả đơn giản hơn Bằng cách chọn các vector riêng theo giá trị riêng lớn nhất chúng ta sẽ mất ít thông tin dương theo đặc tính về bình phương trung bình Một cách có thể chọn cố định thành phần của các vector riêng và các giá trị riêng tương ứng để phù hợp cách thể hiện hay rút trích dữ liệu Với ràng buộc này sẽ làm thay đổi giá trị các mức năng lượng của dữ liệu gốc Vì thế chúng ta chỉ có thể chọn xấp xỉ với giá trị của mức năng lượng, và thay đổi một giá trị của vector riêng tương ứng với giá trị riêng đó Khi đó sẽ trả về một giá trị xấp xỉ với giá trị để mô tả thông tin, cách thay đổi sẽ làm giảm số chiều của không gian con
• Ở đây chúng ta phải đối mặt với các mục đích trái ngược nhau Thứ nhất là chúng ta cần giảm bớt dữ liệu bằng cách giảm số chiều Nhưng khi đó chúng ta muốn đảm bảo đầy đủ nội dung của thông tin gốc Theo đề nghị của PCA để thuận lợi trong khi điều khiển cân bằng giữa các yếu tố, giảm lượng thông tin và đơn giản cho công việc làm bằng tay, vì thế phải tạo ra các cửa sổ tuyến tính, sau đó chia dữ liệu đầu vào thành các vùng nhỏ và điều chỉnh các chế độ phù hợp cho từng vị trí dữ liệu cục bộ
• Bây giờ ta xét một ví dụ để chỉ các đặc tính của vector riêng Dữ liệu được tạo ra theo cách nhân tạo, nó được mô tả như hình vẽ 2.6 bao gồm các điểm nhạt và các điểm đậm trong một tập dữ liệu
Trang 35Hình 2.6 Tập dữ liệu mô tả vector đặc trưng [9]
Giá trị trung bình và ma trận hiệp phương sai của các dữ liệu
có thể dễ dàng tính được từ dữ liệu này Các vector riêng và giá trị riêng thì được tính từ ma trận hiệp phương sai Chiều của các vector riêng được vẽ như trên hình 2.6 bằng hai đường Vector riêng đầu tiên có các điểm trị riêng lớn nhất theo chiều biến đổi lớn nhất (từ bên phải và hướng lên trên) Ngay cả vector riêng thứ hai thì trực giao đến vector thứ nhất (điểm từ trái hướng lên trên) Trong ví dụ này giá trị riêng đầu tiên tương ứng tới vector riêng thứ nhất là λ1 = 0 1737, trong khi đó giá trị thứ hai là
0001 0
2 =
λ có được bằng cách so sánh trị số của từng trị riêng đến tổng tất cả của các trị riêng Chúng ta có nhiều cách để có thể tính đến năng lượng theo từng vector riêng khác nhau Trong trường hợp vector riêng đầu tiên chứa hầu hết tất cả các mức năng lượng thì dữ liệu có thể xấp xỉ tốt để mô tả trong không gian một chiều
Trang 362.2.2 Tối thiểu hóa sự sai biệt của PCA [11], [12]
Xét công thức toán học, tổ hợp tuyến tính
k x w xw
y
1
1 1
của các hệ số x1, x2, …, xn của vector x Các giá trị w11, , wn1 là
các hệ số vô hướng hay trọng số, các thành phần của vector n
chiều w1,w1T là ma trận chuyển vị của w1
Thừa số y1 được gọi là thành phần chính thứ nhất của x, sự sai biệt của y1 được tối thiểu hóa Bởi vì sự sai biệt phụ thuộc vào
cả trị chuẩn và hướng của vector trọng số w1, ta tìm vector trọng
số w1 bằng cách cực đại hóa theo chuẩn PCA
( ) { } ( ) { } 1 { } 1 1 1
2 1
2 1 1
2 1 1
e2,…, en của ma trận Cx Trật tự của các vector riêng này cũng
tương ứng với trị riêng d1, d2,…, dn, thỏa mãn d1 > d2 >…> dn Để
giải quyết vấn đề cực đại hóa, ta gán w1 = e1; Do đó thành phần
chính đầu tiên của x là y eTx
1
1 =Tiêu chuẩn đánh giá JPCA1 theo công thức (2.18) có thể được tổng quát hóa thành m thành phần chính (m là số bất kỳ từ 1 đến
Trang 37n) Tìm thành phần chính thứ m (1 ≤ m ≤ n)y wTx
m
m = , wm tương ứng là vector trọng số đơn vị chuẩn, vi phân ym cực đại hóa dưới
điều kiện ym không tương quan với các thành phần chính được
Điều kiện (2.22) chỉ ra:
{ }= { ( )( ) }= T x k =0
m
T k
T m k
my E w x w x w C wy
Đối với thành phần chính thứ 2, ta có điều kiện sau
0
1 2 1 1
trong không gian con vuông góc với vector đặc trưng thứ nhất Cx
Giải pháp được đưa ra là
2
2 e
w =Tương tự ta có
k
k =Với cùng kết quả đó ta sẽ thu được wi nếu độ sai biệt của yi
được cực đại hóa với điều kiện các vector thành phần chính trực
giao
hoặc T j ij
i w
Trang 382.2.3 Tính bình phương sai số tối thiểu của PCA [11], [12]
Các thành phần chính được xác định là tổng trọng số các hệ
số x với độ vi phân cực đại (trong điều kiện các trọng số đã được chuẩn hóa và các thành phần chính không có các mối tương quan với nhau) Chúng ta xét dãy m các vector cơ bản trực giao (không gian con n chiều), do đó sai số trung bình bình phương giữa x và hình chiếu của nó lên không gian con là tối thiểu Với các vector cơ sở w1, w2, , wm, giả sử
ij j
T
i w
w =δHình chiếu của x lên không gian con được trải rộng bởi
PCA MSE E x w x w
PCA MSE E x E w x J
1
2 2
T j
x w C w C
Tuy nhiên công thức này không đặc trưng cho tất cả thành phần cơ bản của không gian con Vài thành phần cơ bản trực pha của không gian con có thể có cùng hướng nén tối ưu Sự nhập nhằng này có thể là điều bất lợi, ta có thể thấy rằng có thể có một
Trang 39số công thức khác tạo ra các thành phần cơ bản của không gian
con PCA thích hợp hơn
Giá trị trung bình bình phương sai số được cho bởi công thức
PCA MSE dJ
1
tổng các trị riêng tương ứng với các vector riêng em+1,…, en
Điều kiện trực giao
jk k k
Từ các kết quả trên vector cơ bản thành phần chính wi chính
là các vector riêng ei của Cx như sau
{ } {ym EemTxxTem} eTmCxem dm
Độ vi phân của các thành phần chính là trị riêng của Cx Lưu ý: vì các thành phần chính có giá trị trung bình là 0, nên các trị
riêng nhỏ (độ biến thiên nhỏ) dm (giá trị tương ứng của thành
phần chính ym) hầu hết đều tiến về không
Ứng dụng quan trọng của PCA là nén dữ liệu Vector x trong chuỗi dữ liệu gốc (đã được trung tâm hóa bằng cách trừ với giá trị
trung bình) được xấp xỉ bằng cách khai triển PCA thu gọn
Trang 40bằng không, khi m = n Vấn đề thực sự khó khăn là chọn m như
thế nào trong công thức (2.31), đó là mối quan hệ giữa sai số và
khối lượng dữ liệu cần thiết cho quá trình khai triển Đôi khi chúng
ta chỉ cần một số lượng nhỏ các thành phần chính là đủ
Điều kiện (2.30) thường được sử dụng trong các ứng dụng tìm số lượng thành phần chính m, nếu biết các trị riêng Dãy trị
riêng d1, d2,…, dn của ma trận tương quan trong dữ liệu đo đạc
của thế giới thực thường có dạng suy giảm, dựa vào đó ta có thể
đặt các giới hạn cho các trị riêng Các giới hạn này xác định bao
1
Với m < n, trong đó ai là các vector được điều chỉnh và hệ số
si là các số ngẫu nhiên mà có giá trị trung bình bằng không và
không tương quan Chúng ta có thể giả định phương sai của
chúng được hình thành trong vector ai, vì vậy chúng có dạng
phương sai đơn vị Ký hiệu n là nhiễu trắng
Do đó các vector ai sẽ mở rộng ra thành không gian con, gọi
là vùng không gian tín hiệu, sẽ có ít chiều hơn là toàn bộ không
gian do các vector x tạo ra Vùng không gian (tạo ra bởi nhiễu)
trực giao với không gian tín hiệu được gọi là không gian nhiễu
Dễ dàng chỉ ra ma trận tương quan của x có dạng đặc biệt sau
Ia
a
i
T i i