Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 31 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
31
Dung lượng
358,1 KB
Nội dung
TIN HỌC ỨNG DỤNG TRONG KHXH Giảng viên: Lâm Thị Ánh Quyên Khoa Xã hội học- Công tác xã hộiĐông Nam Á Trường đại học Mở TPHCM TƯƠNG QUAN VÀ HỒI QUI Mục tiêu học • Đo mối tương quan (dính líu, liên hệ với nhau- khơng nhân quả) biến định lượng; • Hồi qui: Tác động biến độc lập lên biến phụ thuộc (cả hai biến có thang định lượng) TƯƠNG QUAN/CORRELATION • Thường xun dùng nước rau có nguy bị bệnh Alzheimer (bệnh sa sút trí tuệ) • Thường xun tắm nước nóng bị bệnh tiểu đường • Thị trường chứng khốn ảm đạm, số người bị nhồi máu tim nhiều … TƯƠNG QUAN/correlation Bivariate Correlation (Tương quan kép)- Tương quan hai biến số A↔B Sự tương quan: tồn nhờ vào tồn nhờ vào SỬ DỤNG KHI HAI BIẾN CĨ THANG ĐO KHOẢNG/TỶ LỆ TƯƠNGQUAN/CORRELATION • Phân tích tương quan sử dụng: -có mối tương quan hai biến (sự thay đổi biến có quan hệ với thay đổi biến ngược lại?) -xác định cường độ mối quan hệ hai biến -hướng mối tương quan Quan hệ kép (bivariate Relationships) Correlationscoefficient (Hệ số tương quan r): -1 –> - > +1 • r +: Tương quan thuận Khi có tăng (giảm) biến có tăng (giảm) biến Người có điểm IQ thấp điểm thi đại học thấp Người cao nặng ký • r -: Tương quan nghịch Khi có tăng (giảm) biến có giảm (tăng) biến Học vấn cao xem truyền hình Học vấn thấp xem truyền hình nhiều Các giá trị hai biến thu thập từ nhóm dân số Cân nặng chiều cao SV Phục vụ để kiểm định loại giả thuyết: Càng… càng… ĐO CƯỜNG ĐỘ CỦA MỐI TƯƠNG QUAN • < r < 0,2: Tương quan yếu • 0,2 ≤ r < 0,5: Tương quan yếu/trung bình • 0,5 ≤ r < 0,7: Tương quan trung bình/mạnh • 0,7 ≤ r < 0,9: Tương quan mạnh • r = 1: Tương quan hồn hảo • r = 0: Khơng có tương quan Correlations So nam di hoc nhieu nhat cua Cha So nam di hoc nhieu nhat cua Me Pearson Correlation Sig (2-tailed) N Pearson Correlation Sig (2-tailed) N So nam di hoc nhieu nhat cua Cha 1068 672** 000 972 ** Correlation is significant at the 0.01 level (2-tailed) So nam di hoc nhieu nhat cua Me 672** 000 972 1232 Thống kê • Hồi qui bước sau tương quan • Cần đốn giá trị biến (biến phụ thuộc/dependent variable/outcome variable) (trục tung y) dựa giá trị biến kia/biến độc lập (trục hồnh x) Ví dụ: Tiêu dùng thuốc đoán dựa thời gian hút thuốc lá; kết thi đốn dựa thời gian ôn thi… Sự phụ thuộc chiều cao Y (biến phụ thuộc) theo tuổi tác X (biến độc lập) người Sự phụ thuộc gọi hồi qui Y lên X Vấn đề cần làm: P h ả i t ì m m ộ t p h n g trình, mơ tả theo phương t h ứ c sá n g sủ a mối quan hệ tuyến tính- theo đường thẳng biến số độc lập- biến số phụ thuộc (đường thẳng qua hết tất điểm) VD: Bán kem nhiệt độ Tốn học: Phương pháp bình phương nhỏ tổng độ lệch bình phương điểm/trường hợp biến phụ thuộc so với đường hồi qui => Phương trình hồi qui tuyến tính y theo x (bình phương nhỏ nhất) là: Yi = a + b.Xi Yi = a + bXi • Yi điểm số biến phụ thuộc/giá trị dự đoán thứ i biến phụ thuộc • Xi giá trị dự đốn thứ i biến độc lập • a giao điểm (the intercept/hệ số chặn), điểm cắt trục tung, tức giá trị y x=0 (a nằm trục tung) • b: Hệ số hồi quy - Regression coefficent- độ dốc/hệ số góc (slope) Đo lường thay đổi biến phụ thuộc y tương ứng với thay đổi đơn vị biến độc lập x Dấu b (+ -) cho ta biết hướng thay đổi Phép tính tốn hồi quy: Phục vụ việc kiểm định giả thuyết- Các giả thuyết nêu lên định đề mối quan hệ mang tính chất số lượng (loại mệnh đề “càng… càng”) X lớn, Y lớn/ nhỏ Correlations So gio su dung Internet tb Internet anh huong den cuoc song cua ban? Pearson Correlation Sig (2-tailed) N Pearson Correlation Sig (2-tailed) N ** Correlation is significant at the 0.01 level (2-tailed) So gio su dung Internet tb 120 355** 000 120 Internet anh huong den cuoc song cua ban? 355** 000 120 210 VD1 • Biến độc lập: Số sử dụng Internet tb • Biến phụ thuộc: Internet ảnh hưởng đến sống bạn b Variables Entered/Removed Model Variables Entered So gio su dung Internet tb Variables Removed a Method a All requested variables entered b Dependent Variable: Internet anh huong den cuoc song cua ban? Enter Model Summary Model R 355a R Square 126 Adjusted R Square 119 Std Error of the Estimate 914 a Predictors: (Constant), So gio su dung Internet tb R²=0,126 => Mối quan hệ hai biến mức trung bình R² giải thích 12,6% biến thiên “Internet ảnh hưởng đến sống bạn” “Số sử dụng Internet tb” • R Square: Hệ số x/định tỷ lệ biến thiên chung biến phụ thuộc giải thích biến độc lập/ảnh hưởng biến độc lập với biến phụ thuộc (giảm tỷ lệ sai biệt) • RSquare=1-(ESS/TSS) Tồn biến thiên biến phụ thuộc chia làm hai phần: phần biến thiên hồi quy phần biến thiên khơng hồi quy( cịn gọi phần dư) Regression Sum of Squares(RSS): tổng độ lệch bình phương giải thích từ hồi quy Residual Sum of Squares(ESS): tổng độ lệch bình phương phần dư Total Sum of Squares(TSS): tổng độ lệch bình phương tồn R