1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Xử lý thống kê với phần mềm SPSS - Bài 8: Thống kê nhiều chiều

4 126 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 4
Dung lượng 169,29 KB

Nội dung

Bài giảng cung cấp cho người học các kiến thức: Thống kê nhiều chiều, thống kê mô tả, phân tích thành phần chính,...Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.

Bài 8-THỐNG KÊ NHIỀU CHIỀU Trong chương trước nghiên cứu vấn đề liên quan đến biến định lượng nhật đồ, thống kê, ước lượng, kiểm định giá trị trung bình, kiểm định phương sai, so sánh hai trung bình, so sánh nhiều trung bình (phân tích phương sai) Khi có nhiều biến để hiểu người học phải có hiểu biết sâu toán học đặc biệt vấn đề trình bầy đại số tuyến tính khơng gian vectơ, ánh xạ tuyến tính, dạng tồn phương, giá trị riêng vectơ riêng v v Sau số phần trình bầy thống kê nhiều chiều 1-Thống kê mô tả Giả thiết thường đưa k biến phân phối chuẩn nhiều chiều (Multivariate Normal distribution) N(µ, ), µ véctơ trung bình (kỳ vọng), là ma trận hiệp phương sai Từ ma trận phương sai tìm ma trận tương quan  Nếu lấy mẫu quan sát gồm n véctơ ngẫu nhiên khơng gian k chiều tính véctơ trung bình cộng ma trận hiệp phương sai mẫu S Việc nghiên cứu phân phối phân phối S (thường gọi phân phối Wishart) mở rộng toán nghiên cứu phân phối trung bình cộng phương sai mẫu s2 trường hợp biến chuẩn N(µ,σ2) Việc tìm ước lượng véctơ µ ma trận  nghiên cứu tính chất ước lượng mở rộng tốn ước lượng µ σ2 biến chuẩn N(µ,σ2) Việc tìm miền tin cậy (thường gọi elipsoit tin cậy) véctơ µ mở rộng tốn tìm khoảng tin cậy trung bình µ biến chuẩn Việc so sánh véctơ trung bình µ1 µ2 mở rộng toán so sánh trung bình µ1 µ2 biến chuẩn tổng thể Ở phân chia thành so sánh lấy mẫu độc lập so sánh lấy mẫu theo cặp Việc so sánh nhiều véctơ trung bình trình bầy phần phân tích phương sai nhân tố nhiều chiều (One way Manova) mở rộng tốn phân tích 109 phương sai nhân tố (One way Anova) nhân tố có nhiều mức Sau phân tích phương sai so sánh trung bình mức nhân tố với nhiều tiêu chuẩn (Test) so sánh Có thể mở rộng sang phân tích phương sai nhân tố (Two way multivariate analysis of variance) 2-Hồi quy bội tuyến tính nhiều chiều (Multivariate Linear regression models) Phần trình bầy lại tốn hồi quy bội tuyến tính hồi quy đa thức biến phụ thuộc y với cách nhìn thống kê nhiều chiều Tiếp theo mở rộng toán tương quan hồi quy tuyến tính biến (một chiều) sang hồi quy bội tuyến tính nhiều chiều với nội dung khảo sát mơ hình, cách tính hệ số hồi quy, tìm phân phối hệ số hồi quy, dự báo 3-Phân tích thành phần (Principal components) Có thể nhìn phương pháp thành góc độ: + Giảm số chiều để có hình ảnh trơng thấy được(Data reduction) Đám mây quan sát gồm n điểm không gian k chiều Với k > không nhìn thấy đám mây Để có hình ảnh trơng thấy phải chọn hệ tọa độ trực giao khơng gian k chiều cho hình chiếu n điểm trục thứ (thành phần 1) có biến động (phương sai) lớn (so với đường thẳng - trục không gian k chiều), trục thứ hai (thành phần thứ hai) có biến động lớn trục vng góc với trục thứ nhất, trục thứ ba (thành phần thứ 3) vng góc với mặt phẳng trục đầu Chiếu đám mây quan sát (n điểm quan sát) lên mặt phẳng thành phần thành phần hình ảnh gần tốt (trung thành nhất) đám mây quan sát Dựa hình ảnh chiều để phân tích đám mây quan sát, phân tích bổ sung hình chiếu mặt phẳng thành phần – thành phần hình chiếu mặt phằng thành phần – thành phần + Coi phương pháp thành phần nhiều phương pháp phân tích nhân tố (Factor analysis) Phương pháp phân tích nhân tố cho có k biến chúng khơng độc lập, quan hệ chúng, thể qua ma trận phương sai S, lý giải chúng chung số nhân tố (Factor) Cần tìm nhân tố chung để tái lại ma trận hiệp phương sai S 110 4-Phân tích tắc (Canonical Correlation analysis) Khi có nhóm biến lấy cặp gồm gồm biến nhóm biến nhóm Tìm cặp có cho hệ số tương quan lớn tất cặp tìm Cặp biến gọi cặp biến tắc Tiếp theo tìm cặp biến có hệ số tương quan lớn số cặp biến không tương quan (uncorrelated) với cặp đầu gọi cặp biến tắc thứ v v Có thể rút gọn việc khảo sát mối quan hệ nhóm biến việc khảo sát số cặp biến tắc 5- Phân tích phân biệt tốn xếp loại (Discrimination and classification) Nếu đám mây quan sát bao gồm r nhóm khác tìm cách tách biệt (phân biệt) chúng số hàm gọi hàm phân biệt (Discriminant function) Hay dùng hàm phân biệt tuyến tính (Còn gọi hàm phân biệt Fisher - linear discriminant function) Căn vào giá trị hàm để phân biệt nhóm với nhóm khác Bây có quan sát nên xếp vào nhóm r nhóm nói Bài tốn gọi chung tốn xếp loại (Classifiction) Có nhiều phương pháp khác với tiêu chuẩn khác để xếp loaị Nhung có hàm phân biệt dùng giá trị hàm điểm quan sát để xếp loại 6- Phân tích chùm (Cluster anlysis) Có n điểm quan sát, ghép điểm lại thành số nhóm hay khơng? Vấn đề gọi chung phân tích chùm Có rât nhiều phương pháp hay dùng ghép thành (Hierachical cluster analysis) Coi điểm lá, gần ghép lại thành nhánh con, nhánh gần ghép lại thành cành nhỏ, cành nhỏ gần ghép lại thành cành to, cành to ghép lại thành Có giai đoạn: Đối với điểm (2 lá) phải định nghĩa khoảng cách điểm để sau tìm điểm (2 lá) gần Có nhiều định nghĩa khoảng cách điểm biến định lượng biến định tính 111 Khi ghép điểm (lá) thành nhánh sau thành cành nhánh, cành nhóm điểm (lá), phải định nghĩa khoảng cách nhóm (2 cành) Cũng có rât nhiều định nghĩa khoảng cách nhóm Việc chọn khoảng cách điểm khoảng cách nhóm dẫn đến cách ghép nhóm thành khác Phân tích chùm dùng rộng rãi sinh học đem lại cách phân loại ngành học liên quan đến sinh học 112 ... variance) 2-Hồi quy bội tuyến tính nhiều chiều (Multivariate Linear regression models) Phần trình bầy lại tốn hồi quy bội tuyến tính hồi quy đa thức biến phụ thuộc y với cách nhìn thống kê nhiều chiều. .. hình ảnh chiều để phân tích đám mây quan sát, phân tích bổ sung hình chiếu mặt phẳng thành phần – thành phần hình chiếu mặt phằng thành phần – thành phần + Coi phương pháp thành phần nhiều phương... trực giao khơng gian k chiều cho hình chiếu n điểm trục thứ (thành phần 1) có biến động (phương sai) lớn (so với đường thẳng - trục không gian k chiều) , trục thứ hai (thành phần thứ hai) có biến

Ngày đăng: 30/01/2020, 17:38

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w