Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 62 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
62
Dung lượng
3,58 MB
Nội dung
GIỚI THIỆU SƠ LƯỢC VỀ PHÂN TÍCH SỐ LIỆU VỚI SPSS ThS Nguyễn Trọng Hiến (hiennt@pnt.edu.vn) NTH SPSS1 (2019) / 123 NỘI DUNG CHÍNH Giới thiệu sơ lược SPSS Nhập liệu liệu Quản lý liệu Mô tả liệu Kiểm định giả thuyết Tương quan hồi qui tuyến tính đơn NTH SPSS1 (2019) / 123 GIỚI THIỆU VỀ SPSS SPSS: Statistical Package for Social Sciences Xuất vào 1968 Norman H Nie, Dale H Bent, and C Hadlai Hull Năm 1975, thành lập công ty SPSS để phát triển kinh doanh SPSS Năm 2009, công ty IBM mua lại (1,2 tỷ USD) (Tham khảo https://en.wikipedia.org/wiki/SPSS) NTH SPSS1 (2019) / 123 SỐ LIỆU DÙNG CHO THỰC HÀNH Các nhà NC nhà hộ sinh tiến hành thu thập số liệu 586 trẻ sinh Các trẻ sinh cân để xác định cân nặng sơ sinh, nhà NC ghi nhận số thông tin tiền sử thai sản (tuổi thai) thông tin mẹ (tuổi, huyết áp, nghề nghiệp) (Sưu tầm Internet) NTH SPSS1 (2019) / 123 Mà HỐ TRƯỚC KHI NHẬP LIỆU Ví dụ: Nghề nghiệp: 1= Tự do, 2= Công nhân, = Viên chức Huyết áp: 1= Tăng huyết áp, = Bình thường Giới tính: = bé gái, 1= bé trai NTH SPSS1 (2019) / 123 GIAO DIỆN SPSS: Variable view NTH SPSS1 (2019) / 123 GIAO DIỆN SPSS: Variable view (tt) NTH SPSS1 (2019) / 123 GIAO DIỆN SPSS: Data view NTH SPSS1 (2019) / 123 THỰC HÀNH Một nghiên cứu tiến hành thu thập số liệu trẻ sơ sinh thông tin người mẹ Hãy khai báo biến số: Mã số, tuổi mẹ, nghề nghiệp (1= tự do, = cơng nhân, = viên chức), tình trạng huyết áp (1 = bình thường, = tăng), tuổi thai (tuần), giới tính (0 = bé gai, = bé trai), cân nặng sơ sinh (g) Thực nhập liệu minh họa cho trường hợp Khai báo biến số phiếu khảo sát ý kiến người bệnh ngoại trú (Mẫu số 2, Bộ Y tế) NTH SPSS1 (2019) / 123 NHẬP LIỆU CHO CÂU HỎI NHIỀU LỰA CHỌN Trong năm qua Anh, Chị mắc bệnh đây? Cảm Sốt rét Bướu cổ Da liễu Kiết lỵ Lưu ý: Có thể mắc nhiều bệnh NTH SPSS1 (2019) 10 / 123 Mà HOÁ DẠNG: Category NTH SPSS1 (2019) 11 / 123 Mà HOÁ DẠNG: Category (tt) NTH SPSS1 (2019) 12 / 123 NHÓM CÁC BIẾN Analyze => Multiple Response =>Define variable sets NTH SPSS1 (2019) 13 / 123 Mà HOÁ DẠNG: Dichotomy NTH SPSS1 (2019) 14 / 123 CHUYỂN Mà HOÁ DẠNG Category THÀNH Dichotomy Transform => count Value within Cases NTH SPSS1 (2019) 15 / 123 THỰC HÀNH Khai báo biến câu hỏi: Trong năm qua Anh, Chị mắc bệnh đây? 1=Cảm 2=Sốt rét 3=Bướu cổ 4=Da liễu 5=Kiết lỵ Nhập liệu minh họa cho trường hợp NTH SPSS1 (2019) 16 / 123 MỘT SỐ CHƯƠNG TRÌNH NHẬP DỮ LIỆU MS Excel Google Form, Google Sheet Epi Data NTH SPSS1 (2019) 17 / 123 Một số lưu ý khai báo biến số nhập số liệu EXCEL Dòng Excel tên biến số Hiệu chỉnh định dạng kiểu ngày Chức Freeze Panes: cố định dòng Chức Data Validation: Tạo buộc NTH SPSS1 (2019) 18 / 123 NẠP DỮ LIỆU TỪ EXCEL VÀO SPSS NTH SPSS1 (2019) 19 / 123 NẠP DỮ LIỆU TỪ EXCEL VÀO SPSS(tt) NTH SPSS1 (2019) 20 / 123 LIÊN HỆ GIỮA HAI BIẾN ĐỊNH LƯỢNG Hiệp phương sai (Covariance) Cov (x, y ) = n−1 n i=1 (xi − x¯) (yi − y¯) Hệ số tương quan (correlation coefficent) r = cor (x, y ) = cov (x, y ) Sx Sy −1 ≤ r ≤ |r | −→ 1: Hai biến có tương quan tuyến tính chặt |r | −→ 0: Hai biến khơng có tương quan tuyến tính (khơng có tương quan tương quan phi tuyến) r > 0: Giá trị x tăng cao y tăng, ngược lại r < 0: Giá trị x tăng cao y giảm, ngược lại NTH SPSS1 (2019) 95 / 123 TƯƠNG QUAN TUYẾN TÍNH Giả thuyết H0 : ρ = Kiểm định t=r n−2 − r2 Bậc tự (degrees of freedom, kí hiệu df): df = n-2 NTH SPSS1 (2019) 96 / 123 TƯƠNG QUAN TUYẾN TÍNH (tt) Analyze => correlate => Bivarite NTH SPSS1 (2019) 97 / 123 TƯƠNG QUAN TUYẾN TÍNH (tt) NTH SPSS1 (2019) 98 / 123 BIỂU ĐỒ SCATTER Graphs=> Chart Builder => legacy Dialogs =>Scatter/dot=>Simple Scatter NTH SPSS1 (2019) 99 / 123 SPSS1 (2019) 100 / 123 BIỂU ĐỒ SCATTER (tt) NTH TƯƠNG QUAN TỪNG PHẦN (Partial Correlation) Nghiên cứu mối quan hệ tuyến tính hai biến có loại trừ ảnh hưởng yếu tố khác PCor = NTH rYX − rYZ rXZ )(1 − r ) (1 − rYZ XZ SPSS1 (2019) 101 / 123 TƯƠNG QUAN TỪNG PHẦN (tt) Analyze => correlate => Partial NTH SPSS1 (2019) 102 / 123 TƯƠNG QUAN TỪNG PHẦN (tt) NTH SPSS1 (2019) 103 / 123 THỰC HÀNH Sử dụng tập tin thuchanh_ck.sav , xét mối liên hệ tuổi mẹ, tuổi thai trọng lượng trẻ sơ sinh theo yêu cầu: Vẽ biểu đồ Scatter Tính hệ số tương quan Pearson, kiểm định tương quan NTH SPSS1 (2019) 104 / 123 HỒI QUI TUYẾN TÍNH ĐƠN (Simple Linear Regression) Mơ hình lý thuyết: Yi = β1 Xi + β0 + ǫi Xi : Quan sát thứ i biến độc lập Yi : Giá trị dự đoán thứ i biến phụ thuộc ǫi : Sai số (error) quan sát thứ i, nghĩa giải thích khác cho Y ngồi X, bao gồm biến độc lập khác (khơng diện mơ hình) sai số (ví dụ sai số đo lường) β0 , β1 : Hệ số hồi quy NTH SPSS1 (2019) 105 / 123 SLR (9 GIẢ ĐỊNH) Giả định mối quan hệ X Y Quan hệ tuyến tính: Yi = β1 Xi + β0 + ǫi Giả định Y Y biến định lượng Các quan sát Yi độc lập Giả định X Các giá trị Xi cố định X đo lường không sai số Giả định ǫi ǫi ∼ N(µǫ ; σǫ2 ) E (ǫi ) = Var (ǫi ) = σǫ2 Cov (ǫi , ǫj ) = 0, i = j NTH SPSS1 (2019) 106 / 123 DIỄN GIẢI MƠ HÌNH µYi |Xi = E (Yi |Xi ) = E (β1 Xi + β0 + ǫi ) = β1 Xi + β0 β1 : Sự biến đổi giá trị trung bình Yi Xi tăng thêm đơn vị, yếu tố khác không đổi β0 : Giá trị trung bình Yi Xi = NTH SPSS1 (2019) 107 / 123 ƯỚC LƯỢNG MƠ HÌNH SLR DỰA VÀO DỮ LIỆU MẪU Phương pháp OLS dùng để tính βˆ0 , βˆ1 giá trị ước lượng β0 , β1 cách cực tiểu hoá biến thiên phần dư n n ei2 = SSe = i=1 i=1 ⇒ NTH n (yi − yˆi )2 = βˆ1 = i=1 n x )(yi −¯ y) i=1 (xi −¯ n x) i=1 (xi −¯ yi − βˆ0 + βˆ1 xi S = r Syx βˆ0 = y¯ − βˆ1 x¯ SPSS1 (2019) 108 / 123 HỆ SỐ XÁC ĐỊNH R Biến thiên SSy y (tổng biến thiên) gồm hai phần: Biến thiên hồi qui SSr biến thiên phần dư SSe : n n n i=1 (yi − y¯) = i=1 (ˆ yi − y¯) + i=1 (yi − yˆi )2 Hay SSy = SSr + SSe ⇒ R2 = SSr SSe =1− SSy SSy R dùng để đánh giá độ phù hợp mơ hình Trong mơ hình SLR: R = r NTH SPSS1 (2019) 109 / 123 KIỂM ĐỊNH R Để kiểm tra giả thuyết H0 : R = 0, sử dụng kiểm định F Nguồn Biến thiên df Trung bình Hồi qui SSr MSr = Phần dư SSe n-2 MSe = NTH SPSS1 (2019) SSr SSe n−2 F-test F = MSr MSe 110 / 123 KIỂM ĐỊNH βˆ0 , βˆ1 tβˆ0 = tβˆ1 βˆ0 σ ˆβˆ0 βˆ1 = σ ˆβˆ1 Trong σ ˆβˆ0 = σ ˆβˆ1 = σ ˆ2 n n i=1 xi n x )2 i=1 (xi −¯ σ ˆ2 n x )2 i=1 (xi −¯ σ ˆ = n−2 SSe = df=n-2 NTH n−2 n i=1 (yi − y¯)2 SPSS1 (2019) 111 / 123 SRL VỚI SPSS Analyze => Regression => linear NTH SPSS1 (2019) 112 / 123 SRL VỚI SPSS (tt) NTH SPSS1 (2019) 113 / 123 KIỂM TRA MỘT SỐ GIẢ ĐỊNH NTH SPSS1 (2019) 114 / 123 KIỂM TRA MỘT SỐ GIẢ ĐỊNH (tt) NTH SPSS1 (2019) 115 / 123 KIỂM TRA MỘT SỐ GIẢ ĐỊNH (tt) NTH SPSS1 (2019) 116 / 123 MỘT SỐ DẠNG BIỂU ĐỒ PHẦN DƯ NTH SPSS1 (2019) 117 / 123 SPSS1 (2019) 118 / 123 BIẾN ĐỔI TUYẾN TÍNH Mơ hình tuyến tính Y = β0 + β1 X + ǫ Y = β0 + β1 X + β2 X + ǫ √ Y = β0 + β1 X + ǫ Y = β0 + β1 logX + ǫ Mơ hình khơng tuyến tính Y = β + e β1 X + ǫ √ Y = β0 + β1 X + ǫ NTH BIẾN ĐỔI TUYẾN TÍNH (tt) Hàm: Y = αe βX Phép biến đổi:Y ′ = lnY Dạng tuyến tính: Y ′ = lnα + βX NTH SPSS1 (2019) 119 / 123 BIẾN ĐỔI TUYẾN TÍNH (tt) Hàm: Y = α + βlogX Phép biến đổi:X ′ = logX Dạng tuyến tính: Y = α + βX ′ NTH SPSS1 (2019) 120 / 123 BIẾN ĐỔI TUYẾN TÍNH (tt) α+βX e Hàm: Y = 1+e α+βX Y Phép biến đổi:Y ′ = ln 1−Y Dạng tuyến tính: Y ′ = α + βX NTH SPSS1 (2019) 121 / 123 THỰC HÀNH Sử dụng tập tin thuchanh_ck.sav , xét mối liên hệ tuổi thai trọng lượng trẻ sơ sinh theo yêu cầu: Thiết lập phương trình hồi qui dự đốn trọng lượng trẻ sơ sinh theo tuần tuổi thai Giải thích ý nghĩa hệ số mơ hình Kiểm tra đáp ứng giả định mơ hình NTH SPSS1 (2019) 122 / 123 NGUỒN THAM KHẢO Chan YH (2003) Biostatistics 101: Data presentation, Singapore Medical Journal; Vol 44(6):280-5) Lê Trường Giang (2011), Thống kê Y học, NXB Y học Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008), Phân tích liệu nghiên cứu với SPSS (tập 1), NXB Hồng Đức Nguyễn Văn Tuấn (2014), Phân tích liệu với R, NXB tổng hợp TPHCM Barton, B and Peat, J (2014), Medical statistics : a guide to SPSS, data analysis and critical appraisal, Wiley IBM, IBM SPSS 20 (trials), nguồn: http://www.ibm.com/analytics/us/en/technology/spss NTH SPSS1 (2019) 123 / 123 ... 1= bé trai NTH SPSS1 (2019) / 123 GIAO DIỆN SPSS: Variable view NTH SPSS1 (2019) / 123 GIAO DIỆN SPSS: Variable view (tt) NTH SPSS1 (2019) / 123 GIAO DIỆN SPSS: Data view NTH SPSS1 (2019) / 123... Independent samples Objective: chọn Automatically compare distributions across groups Fields: chọn Use custom field assignments, Test Fields: tl_sosinh, Group: gioi Settings: Chọn Choose tests => Customize... Analyze=>Descriptive Statistic=>Crosstab NTH SPSS1 (2019) 84 / 123 KẾT QUẢ (TẦN S? ??, TỶ LỆ) Analyze=>Descriptive Statistic=>Crosstab=> Cells NTH SPSS1 (2019) 85 / 123 KẾT QUẢ (KIỂM ĐỊNH Chi-Square) Analyze=>Descriptive