TK7 . phan tich hoi qui tuyen tinh

8 215 0
TK7 . phan tich hoi qui tuyen tinh

Đang tải... (xem toàn văn)

Thông tin tài liệu

PHÂN TÍCH HỒI QUI TUYẾN TÍNH ĐƠN GIẢN (Simple Linear Regression Analysis) Phân tích hồi qui tuyến tích đơn giản tìm liên hệ biến số độc lập (biến dự đốn) trục hồnh x với biến số phụ thuộc (biến kết cục) trục tung y Sau vẻ đường thẳng hồi qui từ phương trình đường thẳng ta dự đốn biến y (ví dụ: cân nặng) có x (ví dụ: tuổi) Ví dụ 1: Ta có mẫu gồm trẻ từ 1-6 tuổi, có cân nặng bảng sau: Tuổi Cân nặng (kg) 10 12 14 16 18 20 Nối cặp (x,y) ta thấy có dạng phương trình bậc nhất: y=2x+8 (trong độ dốc điểm cắt trục tung y x=0) Trong thống kê phương trình đường thẳng (bậc nhất) viết dạng: y= x +  [1] D6ay phương trình hối qui tuyến tính,  gọi slope (độ dốc)  intercept (điểm cắt trục tung) Thực phương trình hồi qui tuyến tính có lý thuyết, nghĩa trị số xi (i=1,2,3,4,5,6) yi tương ứng liên hệ 100% (hoặc hệ số tương quan R=1) Trong thực tế có sư liên hệ 100% mà thường có sai lệch trị số quan sát yi trị số yi’ ước đoán nằm đường hối qui Ví dụ 2: Ta có mẫu gồm trẻ em khác có cân nặng theo bảng sau: Tuổi Cân nặng (kg) 11 11 14 16 18 20 Khi vẽ đường thẳng hồi qui, ta thấy trị số quan sát y3, y4, y5, y6 y1 y2 không nằm trên đường thẳng liên hệ xi yi khơng 100% mà 97% có sai lệch y1 y2 Sự sai lệch thống kê gọi phần dư (Residual) Errors Gọi y1, y2, y3, y4, y5, y6 trị số quan sát y’1, y’2, y’3, y’4, y’5, y’6 trị số ước đoán nằm đường hồi qui, 1, 2, 3, 4, 5, 6 phần dư Như 1= y1 –y’1 2 = y2 –y’2 3 = y3 –y’3 4 = y4 –y’4 5 = y5 – y’5 6 = y6 –y’6 Khi phương trình hồi qui tuyến tính viết dạng tổng quát sau: y’= βxi + i+ i [2] Như phần dư i nhỏ liên hệ x,y lớn ngược lại Phần liên hệ đượi gọi phần hồi qui Mơ hình hồi qui tuyến tích mơ tả: Dữ liệu= Hồi qui (Regression) + Phần dư (Residual) Ví dụ 3: Nếu chọn mẫu thực tế gồm 30 em từ 1-6 tuổi kết cân nặng tương ứng 30 em vẻ biểu đồ sau: Lúc ta nối 30 điểm biểu đồ mà phải vẽ đường thẳng gần với tất điểm tốt Như đường thẳng biểu đồ ta chọn đường thẳng nào? Nguyên tắc chọn đường thẳng gần 30 điểm, có nghĩa để tổng phần dư i nhỏ nhất:  i=  (yi- βx – α) tổng bình phương phần dư:  (i)2=  (yi- βx – α)2 Đây phương trình bậc theo x Trong tốn học, muốn tìm trị cực tiểu phương trình bậc 2, người ta lấy đạo hàm cho đạo hàm triệt tiêu (bằng 0) tím trị cực tiểu x Giải phương trình này, ta tính thơng số   từ thông số ta vẽ đường thẳng hồi qui Phương pháp tốn học gọi phương pháp bình phương nhỏ (least square method) Giải phương trình ta có: = r Sy Sx (r hệ số tương quan; Sy độ lệch chuẩn y Sx độ lệch chuẩn x) r= xi- x yi- y ( )( ) n-1 Sx Sy = y - x phương trình hồi qui tuyến tính y theo x (bình phương nhỏ nhất) là: y’ = βxi +  Dùng phần mềm SPSS để vẻ đường hồi qui đồng thời tính phần hồi qui phần dư mơ hình Nhập số liệu tuổi cân nặng cân 30 trẻ 1-6 tuổi vào SPSS: Nhập số liệu vào SPSS Vào menu >Analyze> Regression> Linear Bảng Tóm tắt mơ hình Hệ số tương quan R=0,918 R2=0,843 Bảng Phân tích ANOVA với biến phụ thuộc cân nặng Tổng bình phương phần hồi qui (Regression)=336,14 Tổng bình phương phần dư (Residual)=62,8 Trung bình bình phương hồi qui: 336,14/ (bậc tự do)=336,14 Trung bình bình phương phần dư: 62,8/ 28(bậc tự do=n-2)=2,24 F= 336,14 = 149,8 p

Ngày đăng: 21/12/2017, 12:01

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan