X 200x320 512000 double array
2. Phân tích thành phần độc lập (ICA)
Để định nghĩa ICA ta có thể dùng mơ hình thống kê “làm chậm biến số”- ”latent varialbe”. Giả sử, ta quan sát n tổ hợp tuyến tính x1,…,xn của n thành phần độc lập [1].
1 1 2 2 ...
j j j jn n
x =a s +a s + +a s (2.1)
Chúng ta bỏ qua chỉ số thời gian t (trong mơ hình ICA), ta giả sử mỗi tổ hợp xj ứng với mỗi thành phần độc lập sk là biến ngẫu nhiên, thay cho tín hiệu theo thời gian thích hợp. Giá trị quan xj(t), những tín hiệu thu được từ microphone trong bài toán cocktail-party, là mẫu của biến số ngẫu nhiên. Khơng mất tính tổng qt, ta giả sử cả biến trộn lẫn và thành phần độc lập có giá trị trung bình khơng. Nếu thực tế khơng đúng, có thể đưa các biến số quan sát xi về gía trị trung tâm bằng cách trừ với mẫu trung bình.
Điều đó rất thuận tiện khi dùng ký hiệu ma trận vector thay cho dạng tổng như các công thức trước đâỵ Điều này cho thấy với vector ngẫu nhiên x, các thành phần của nó là tổ hợp x x1, ,...,2 xn tương tự như vector ngẫu nhiên s với các thành phần s s1, ,...,2 sn. Chúng ta quan sát ma trận A với các phần tử aij .Tất cả các vector được được hiểu như vector cột; do đó xT là chuyển vị của x ,là vector hàng, sử dụng ký hiệu ma trận vector, mơ hình hỗn hợp ở trên sẽ được viết lại là:
x= As (2.2)
Thỉnh thoảng, chúng ta cần cột của ma trận A; điều đó có nghĩa là mơ hình aj
có thể được viết lại như sau
1n n i i i X a s = =∑ (2.3)
Mơ hình thống kê (2.2) được gọi là phân tích các thành phần độc lập, hay mơ hình ICẠ Mơ hình ICA mơ tả cách thức tạo ra dữ liệu quan sát bằng quá trình trộn các đối tượng si . Các đối tượng độc lập là các biến số ẩn, có nghĩa là ta không thể quan sát chúng một cách trực tiếp. Vì vậy ma trận trộn cũng
được xem như là khơng biết. Tất cả những gì ta quan sát được chỉ là vector ngẫu nhiên x, và chúng ta phải dùng x để xấp xỉ cả A và s.
Điểm khởi đầu của ICA là sự thừa nhận rất đơn giản rằng các thành phần si là độc lập thống kê. Tiếp theo chúng ta phải thừa nhận các thành phần độc lập phải có phân bố khơng Gauss. Tuy nhiên, ở mơ hình cơ bản chúng ta khơng cần biết sự phân bố nàỵ Một cách đơn giản, chúng ta chỉ cần giả thiết ma trận trộn chưa biết là ma trận vng. Sau đó ta xấp xỉ ma trận A, chúng ta có thể tính ma trận ngược (là W), các thành phần độc lập có thể được tính bằng cơng thức:
S = Wx (2.4)
ICA cũng tương tự phương pháp “phân chia nguồn mù” (BBS) hoặc phân chia tín hiệu chưa biết.”Nguồn” có nghĩa là các tín hiệu gốc, là các thành phần độc lập, tương tự như trong bài tốn cocktail-partỵ”Mù” có nghĩa là biết rất ít. ICA là một phương pháp có thể được ứng dụng rất rộng rãi trong việc trình bày quá trình phân chia nguồn mù.
Trong nhiều ứng dụng, chúng ta giả thiết có thêm nhiễu trong q trình đo đạc, có nghĩa là phải thêm thành phần nhiễu vào mơ hình tính tốn. Để đơn giản đơi khi ta có thể bỏ qua thành phần nhiễụ
Các điểm khơng xác định trong ICA:
Trong mơ hình ICA (2.2), chúng ta có thể thấy các điểm khơng xác định như sau:
Chúng ta không thể xác định được thành phần biến (số cột ma trận tương quan) của các thành phần độc lập.
Lý do là cả S và A đều không được biết, phép nhân vơ hướng của nguồn si có thể khử bằng cách chia cho cột tương ứng ai của A với cùng hướng
(2.3). Hệ quả, chúng ta phải hiệu chỉnh biên độ của thành phần độc lập; như ta biết, các ICA đều là các biến ngẫu nhiên, cách đơn giản ta giả sử mỗi nguồn đều có thành phần biến số đơn vị. Sau đó ma trận A sẽ đáp ứng với phương pháp giải ICA để khắc phục các hạn chế nàỵ Ta có thể loại bỏ những dấu hiệu bất định này: ta có thể nhân thành phần độc lập với -1
T
mà khơng làm ảnh hưởng đến mơ hình tính. Trong hầu hết các ứng dụng yếu tố dấu khơng có nghĩạ
Chúng ta không thể xác định được thứ tự của các thành phần độc lập Lý do là cả S và A đều khơng được biết, chúng ta có thể thay đổi tùy ý trật tự của phép tính trong cơng thức (2.3), và có thể gọi bất cứ thành phần độc lập nào là thành phần đầu tiên. Ma trận hoán vị P và phép biến đổi ngược của nó có thể được thay thế trong cơng thức x AP Ps= −1 . Các phần tử của Ps là các thành phần biến độc lập gốc sj , nhưng theo thứ tự khác. Ma trận AP-1 được biết như là một ma trận trộn mới chưa biết được dùng để giải bài toán ICA .