PHÂNTÍCHHỒIQUITUYẾNTÍNH ĐƠN GIẢN (Simple Linear Regression Analysis) Phântíchhồiquituyếntích đơn giản tìm liên hệ biến số độc lập (biến dự đốn) trục hồnh x với biến số phụ thuộc (biến kết cục) trục tung y Sau vẻ đường thẳng hồiqui từ phương trình đường thẳng ta dự đốn biến y (ví dụ: cân nặng) có x (ví dụ: tuổi) Ví dụ 1: Ta có mẫu gồm trẻ từ 1-6 tuổi, có cân nặng bảng sau: Tuổi Cân nặng (kg) 10 12 14 16 18 20 Nối cặp (x,y) ta thấy có dạng phương trình bậc nhất: y=2x+8 (trong độ dốc điểm cắt trục tung y x=0) Trong thống kê phương trình đường thẳng (bậc nhất) viết dạng: y= x + [1] D6ay phương trình hốiquituyến tính, gọi slope (độ dốc) intercept (điểm cắt trục tung) Thực phương trình hồiquituyếntính có lý thuyết, nghĩa trị số xi (i=1,2,3,4,5,6) yi tương ứng liên hệ 100% (hoặc hệ số tương quan R=1) Trong thực tế có sư liên hệ 100% mà thường có sai lệch trị số quan sát yi trị số yi’ ước đoán nằm đường hốiqui Ví dụ 2: Ta có mẫu gồm trẻ em khác có cân nặng theo bảng sau: Tuổi Cân nặng (kg) 11 11 14 16 18 20 Khi vẽ đường thẳng hồi qui, ta thấy trị số quan sát y3, y4, y5, y6 y1 y2 không nằm trên đường thẳng liên hệ xi yi khơng 100% mà 97% có sai lệch y1 y2 Sự sai lệch thống kê gọi phần dư (Residual) Errors Gọi y1, y2, y3, y4, y5, y6 trị số quan sát y’1, y’2, y’3, y’4, y’5, y’6 trị số ước đoán nằm đường hồi qui, 1, 2, 3, 4, 5, 6 phần dư Như 1= y1 –y’1 2 = y2 –y’2 3 = y3 –y’3 4 = y4 –y’4 5 = y5 – y’5 6 = y6 –y’6 Khi phương trình hồiquituyếntính viết dạng tổng quát sau: y’= βxi + i+ i [2] Như phần dư i nhỏ liên hệ x,y lớn ngược lại Phần liên hệ đượi gọi phầnhồiqui Mơ hình hồiquituyếntích mơ tả: Dữ liệu= Hồiqui (Regression) + Phần dư (Residual) Ví dụ 3: Nếu chọn mẫu thực tế gồm 30 em từ 1-6 tuổi kết cân nặng tương ứng 30 em vẻ biểu đồ sau: Lúc ta nối 30 điểm biểu đồ mà phải vẽ đường thẳng gần với tất điểm tốt Như đường thẳng biểu đồ ta chọn đường thẳng nào? Nguyên tắc chọn đường thẳng gần 30 điểm, có nghĩa để tổng phần dư i nhỏ nhất: i= (yi- βx – α) tổng bình phương phần dư: (i)2= (yi- βx – α)2 Đây phương trình bậc theo x Trong tốn học, muốn tìm trị cực tiểu phương trình bậc 2, người ta lấy đạo hàm cho đạo hàm triệt tiêu (bằng 0) tím trị cực tiểu x Giải phương trình này, ta tính thơng số từ thông số ta vẽ đường thẳng hồiqui Phương pháp tốn học gọi phương pháp bình phương nhỏ (least square method) Giải phương trình ta có: = r Sy Sx (r hệ số tương quan; Sy độ lệch chuẩn y Sx độ lệch chuẩn x) r= xi- x yi- y ( )( ) n-1 Sx Sy = y - x phương trình hồiquituyếntính y theo x (bình phương nhỏ nhất) là: y’ = βxi + Dùng phần mềm SPSS để vẻ đường hồiqui đồng thời tínhphầnhồiquiphần dư mơ hình Nhập số liệu tuổi cân nặng cân 30 trẻ 1-6 tuổi vào SPSS: Nhập số liệu vào SPSS Vào menu >Analyze> Regression> Linear Bảng Tóm tắt mơ hình Hệ số tương quan R=0,918 R2=0,843 Bảng Phântích ANOVA với biến phụ thuộc cân nặng Tổng bình phương phầnhồiqui (Regression)=336,14 Tổng bình phương phần dư (Residual)=62,8 Trung bình bình phương hồi qui: 336,14/ (bậc tự do)=336,14 Trung bình bình phương phần dư: 62,8/ 28(bậc tự do=n-2)=2,24 F= 336,14 = 149,8 p