Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 73 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
73
Dung lượng
2,36 MB
Nội dung
Chương 7: Phân tích nhân tố Mở đầu Cá thể X1 X2 ………… Xp … i … n Cá thể i X(i) Rp Cần nhận biết giống (khác) từ phân nhóm, xếp hạng • - Vấn đề phân tích cá thể với p biến: Các biến tương quan tuyến tính lẫn Độ đo khác Số lượng biến lớn Trực giao hóa Bảo tồn thơng tin tối đa Chuẩn hóa Giảm số chiều Lựa chọn hệ trục tọa độ 7.1 Bài toán 7.1.1 Với cá thể Xác định r véc tơ n chiều đơi trực giao có dạng Ck ( X, Uk ) uk1X1 uk2 X2 ukp Xp (k=1, ,r p) Mỗi véc tơ Uk gọi nhân tố (hay gọi biến tiềm ẩn) Các tổ hợp tuyến tính gọi thành phần chính, ký hiệu Ck (hay Fk ) Ảnh cá thể i Ck : cki R1 cki Xi Rp Xv ckv Bảo tồn bao nhiêu% khác biệt cá thể Thông tin biến động tổng thể • Thông tin biến động tổng thể = Sự khác biệt cá thể • Khác biệt cá thể = Khoảng cách Xác định khoảng cách 7.1.2 Bài toán với biến Xác định m véc tơ p chiều đơi trực giao có dạng Vl ( XT , Ql ) ql1X1T ql X2T qln XnT (l=1, ,m n) Cá thể ………… n X1 X2 …… Xp Biến j X(j) Rn 7.2 Phân tích nhân tố (EFA) phương pháp thành phần 7.2.1 Bài tốn: Tìm hệ trục tọa độ r- vng góc cho hình chiếu n cá thể lên khơng gian tạo hệ trục bảo tồn tối đa khác biệt cá thể ban đầu Xuất phát toán toán giảm số chiều không gian 7.2.2 Cấu trúc: Mỗi chiều không gian chiếu tương ứng véc tơ phương k – gọi trục {k } trực giao Mỗi cá thể (i) có ảnh trục k : cik Ck =(cik) gọi thành phần thứ k Phép biến đổi tuyến tính: Ck=Xuk = uk1X1 + uk2X2 +…+ ukpXp uk gọi nhân tố thứ k Tìm {k } {uk } cho độ biến động {Ck } lớn 7.3 MƠ TẢ, TĨM TẮT SỐ LIỆU 7.3.1 Số liệu đặc trưng 7.3.1.1 Bảng số liệu Biến Cá thể X1 X2 … Xp x11 x12 x1p x21 x22 x2p xn1 xn2 xnp … n Tương ứng ma trận X cấp n x p Ký hiệu: - Xj cột thứ j X; Xi* dòng thứ i X - Chuyển vị a aT Trong không gian Rp: cá thể điểm; n điểm lập thành đám mây điểm (đám mây cá thể hay đám mây số liệu) 7.3.1.2 Ma trận trọng số: Ma trận số D quan sát ma trận đường chéo cấp nxn Với đường chéo trọng số cá thể pi (i=1, ,n) p1 D= … 0 p2 … 0 p3 … … … … … … 0 0 pn Trọng số mặc định: pi=1/n D E n 7.3.1.3 Tâm đám mây số liệu ma trận trung tâm hóa Tâm đám mây số liệu: Trung bình véc tơ dịng X(nxp) D(nxn) I(nx1) Mơ tả đại số: Gọi I véc tơ n chiều có tất thành phần Tâm đám mây số liệu véc tơ: g = XT DI g(1xp) (7.1) Ma trận trung tâm hóa (Y) ma trận lập từ X với tất véc tơ dòng trừ véc tơ trung bình chúng Y(nxp) Mơ tả đại số: Y= X - IgT (7.2) g X g Y 10 ... Trực giao hóa Bảo tồn thơng tin tối đa Chuẩn hóa Giảm số chiều Lựa chọn hệ trục tọa độ 7.1 Bài to? ?n 7.1.1 Với cá thể Xác định r véc tơ n chiều đôi trực giao có dạng Ck ( X, Uk ) uk1X1 uk2... tổng thể = Sự khác biệt cá thể • Khác biệt cá thể = Khoảng cách Xác định khoảng cách 7.1.2 Bài to? ?n với biến Xác định m véc tơ p chiều đôi trực giao có dạng Vl ( XT , Ql ) ql1X1T ql X2T... hình chiếu n cá thể lên không gian tạo hệ trục bảo tồn tối đa khác biệt cá thể ban đầu Xuất phát to? ?n tốn giảm số chiều khơng gian 7.2.2 Cấu trúc: Mỗi chiều không gian chiếu tương ứng véc tơ phương