Giới thiệu về ICA

X 200x320 512000 double array

1. Giới thiệu về ICA

Hãy thử tưởng tượng bạn ở trong phịng mà trong đó có 3 người đang nói chuyện với nhaụ Bạn dùng 3 micro, đặt tại 3 vị trí khác nhaụ Các microphone sẽ thu được 3 tín hiệu đồng thờị Ta phải xác định được x1(t),

x2(t) và x3(t) với x1 ,x2, x3 là cường độ âm thanh, t là thời gian. Chúng ta có thể biểu diễn nó bằng hệ phương trình tuyến tính [1]:

1 11 1 12 2 13 32 21 1 22 2 23 3 2 21 1 22 2 23 3 3 31 1 32 2 33 3 ( ) ( ) ( ) x t a s a s a s x t a s a s a s x t a s a s a s = + + = + + = + +

Trong đó a a a a a a a a a11, 12, 13, 21, 22, 23, 31, 32, 33 là các chỉ số phụ thuộc vào khoảng cách từ microphone đến người nóị Điều này rất tiện lợi trong việc xấp xỉ 3 nguồn tín hiệu gốc ( tiếng nói của 3 người trong phòng ) s1(t), s2(t) và s3(t) từ các tín hiệu thu được x1(t), x2(t) và x3(t). Ví dụ này được gọi là bài toán cocktail-partỵ Theo thời gian ta có thể bỏ qua thời gian trễ và nhiễu thêm vào từ mơ hình trộn đơn giản.

Hình 2.2 Tín hiệu trộn

Dĩ nhiên chúng khơng phải là tín hiệu tiếng nói thực nhưng cũng đủ cho minh họa nàỵ Tín hiệu tiếng nói gốc có thể giống như hình 2.1 và tín hiệu trộn có dạng như 2.2. vấn đề ở đây là chúng ta cần khơi phục lại tín hiệu gốc như 2.1 từ tín hiệu trộn 2.2.

Nếu như chúng ta biết các hệ số aij, chúng ta có thể giải hệ phương trình tuyến tính trên theo phương pháp thơng thường và tìm đươc các tín hiệu ban đầụ Tuy nhiên ở đây ta khơng biết các hệ số aij do đó bài tốn trở nên phức tạp. Một hướng để giải quyết bài tốn là sử dụng thơng tin đặc trưng thống kê của tín hiệu si(t) để xấp xỉ aij. Và điều lưu ý tiếp theo là tín hiệu s1(t), s2(t) và s3(t), tại mỗi thời điểm t, là các độc lập thống kê. Tuy nhiên trong thực tế khơng hồn tồn chính xác như vậỵ Các hướng phát triển gần đây của kĩ thuật phân tích thành phần độc lập ICA có thể xấp xỉ aij dựa trên các thơng tin độc lập của chính tín hiệu đó. Điều này cho phép chúng ta chia các tín hiệu gốc từ tín hiệu đã trộn x1(t), x2(t) và x3(t).

Hình 2.3 Tín hiệu phục hồi

Ví dụ như tín hiệu điện não được thể hiện bằng điện não đồ (EEG). Dữ liệu EEG bao gồm các tín hiệu thu được từ các điện cực gắn tại các vị trí khác nhau trên vùng đầu ngườị Những tín hiệu thu được từ các điện cực này chỉ là thông tin tổng hợp từ các thành phần của hoạt động nãọ Vấn đề này cũng tương tự như bài tốn cocktail- party: chúng ta cần tìm ra các thành phần gốc của hoạt động não, nhưng chúng ta chỉ có thể quan sát các tín hiệu trộn lẫn của các thành phần nàỵ ICA có thể phát hiện thơng tin hoạt động não bằng cách tìm các thành phần độc lập nàỵ

Một ví dụ khác, ICA được dùng để là trích các đặc trưng. Vấn đề quan trọng trong xử lý tín hiệu số là tìm ra biễu diễn phù hợp cho hình ảnh, âm thanh hoặc các loại dữ liệu khác thích hợp. Biểu diễn dữ liệu thường dựa vào biến đổi tuyến tính. Biến đổi tuyến tính được ứng dụng rộng rãi trong xử lý ảnh số như biến đổi Fourier Haar, biến đổi cosin. Mỗi phép biến đổi có ưu điểm riêng.

Tất cả các ứng dụng trên đây có thể được xây dựng thành mơ hình tốn học thống nhất, ICẠ Đây là một giải pháp được ứng dụng cho nhiều mục đích khác nhau trong việc xử lý tín hiệu và phân tích dữ liệụ

Phân tích thành phần độc lập (ICA)

Sự độc lập thống kê 1 Bất tương quan