Để nghiên cứu mối liên hệ giữa cân nặng, độ tuổi có tác động và ảnh hưởng đến sức khỏe; người ta chọn ngẫu nhiên 200 đối tượng đang được điều trị (nội trú và ngoại trú) tại bệnh viện đa khoa Thanh Hóa trong khoảng thời gian nhất định, có độ tuổi từ 1 đến 70 đều được cân, ngoài các nghiên cứu ghi nhận một số thông tin như nồng độ huyết áp, nhiệt độ, thời gian mắc bệnh … yêu cầu tìm hiểu hồi quy giữa mối liên hệ Tuổi – Cân nặng.
Số liệu có tên là “Dulieuhoiquy” được nhập từ file excel Hồi quy đơn biến hàm tuyến tính tuổi – cân nặng:
Chạy SPSS mở file dữ liệu, vào Data/Select Case.. xuất hiện hộp thoại, đặt điều kiện chọn nhóm tuổi dưới 13.
50 Nhấn Continue, hộp thoại ban đầu xuất hiên, nhấn Ok để chấp nhận chọn nhóm tuổi.
Sau đó vào Analyze, vào Regression vào Linear…
Để vào hộp thoại Linear Regression, chuyển biến tuổi và cân nặng như hình vẽ, nhấp Ok
51 nhận thấy khi tuổi <13 tuổi, hàm hồi quy giữa tuổi tới cân nặng có dạng:
Cân nặng = 6,582 + 2,680 * tuổi
Nghĩa là, khi tuổi tăng sẽ làm cân nặng tăng,
Hệ số b1 thực sự có ý nghĩa (sig = 0,00 <0,05). Mô hình thực sự có ý nghĩa. Vào Menu SPSS, vào Data/Select Case.. để bỏ lọc bằng lệnh Reset.
Tương tự như lệnh lọc với nhóm tuổi <13, bây giờ lọc cho nhóm tuổi với điều kiện tuổi >40
nghĩa là chọn từ 40 tuổi trở lên, Nhấn Ok để chấp nhận chọn nhóm tuổi, sau đó vào Analyze, vào Regression vào Linear, kết quả Coefficients trong bảng Output.
Hàm hồi quy có dạng:
Cân nặng = 45,444 + 0,123 * tuổi
Mô hình này có Sig(b1) = 0,225 > 0,05 hệ số b1 có thể bằng 0 Mô hình chưa thực sự có ý nghĩa. Khi đó, mối liên hệ giữa tuổi và cân nặng không còn theo hàm tuyến tính nữa mà có thể là đường cong.
Theo yêu cầu của đề bài, chạy hồi quy bậc 2 để đánh giá và so sánh giữa hàm bậc nhất và hàm bậc 2.
Bỏ lọc bằng lệch Reset để chọn tất cả nhóm tuổi trong Data/Select Case.. của hộp thoại Selech Case… sau đó nhấn Ok.
52 Vào Menu Analyze/ Regression/
Curve Estimation…
Để vào hộp thoại Curve Estimation…
Nhấn Ok. Kết quả bảng Output, nhận thấy: Hàm bậc nhất có dạng:
Hệ số b1 có ý nghĩa (sig=0,00); R2 hiệu chỉnh =0,400; R2 = 0,403 và R = 0,635.
53
Hệ số b1, b2 có ý nghĩa (sig đều =0,00); R2 hiệu chỉnh=0,618; R2= 0,621 và R= 0,788
Qua 2 mô hình, nhận thấy R2, R2 hiệu chỉnh, hệ số tương quan của mô hình
parabol đều lớn hơn mô hình tuyến tính, trong đó: R2 hiệu chỉnh (Adjusted R Square) cho biết mức độ (%) sự biến thiên của biến phụ thuộc được giải thích bởi biến độc lập.
Nghĩa là nếu theo mô hình hàm bậc 2, mô hình sẽ giải thích được 61,8% sự biến đổi cân nặng cho sự biến đổi về tuổi (đo bằng kg) nhiều hơn so với tỷ lệ
40,0% của hàm bậc nhất chọn mô hình hàm bậc 2 để nêu lên mối liên hệ giữa
tuổi tới cân nặng.
Nếu chạy hàm bậc nhất và hàm bậc 2 theo nhóm tuổi, kết quả cũng tương tự như vậy.
54
KẾT LUẬN
Sau khi hoàn chỉnh luận văn, bản thân tôi đã thực hiện được những vấn đề sau:
Trình bày một cách hệ thống những khái niệm và kiến thức cơ sở nhằm
phục vụ cho việc nghiên cứu các vấn đề có liên quan trong luận văn. Cụ thể đã trình bày các vấn đề: những khái niệm và nội dung cần thiết của cơ sở lý thuyết xác suất và thống kê.
Nghiên cứu chuyên sâu về phần mềm SPSS ứng dụng các chương trình mang tính chất lý thuyết như: Xác xuất thống kê, kinh tế lượng… theo một cách nhìn khác vào ứng dụng công nghệ thông tin để vận dụng lý thuyết khoa học vào thực tiễn.
Khái quát nội dung nghiên cứu trong lĩnh vực khoa học, thông qua phần
mềm SPSS để đánh giá đưa ra kết luận mang tính khoa học.
Đề tài có thể dùng cho học sinh, sinh viên, bổ sung lượng kiến thức vận
dụng về mặt lý thuyết môn học để ứng dụng khoa học vào thực tiễn.
SPSS là một phần mềm đa năng và mềm dẻo trong việc phân tích và xử lý số liệu. Mặc dù vẫn còn những hạn chế nhất định, như khả năng xử lý đối với những vấn đề ước lượng phức tạp và do đó khó đưa ra được các ước lượng sai số đối với các ước lượng này. Hơn nữa, SPSS cũng không hỗ trợ các công cụ phân tích dữ liệu theo lược đồ mẫu, nhưng SPSS vẫn là công cụ hữu hiệu giúp ích cho người sử dụng trong việc phân tích và nghiên cứu của mình. Trong một tương lai không xa, chúng ta có thể hi vọng vào một thế hệ SPSS mới ít hạn chế.
Khi có điều kiện cho phép, chúng tôi sẽ tiếp tục nghiên cứu về việc sử dụng SPSS để tìm hiểu hồi quy đa biến của một số chỉ tiêu sinh lý.
55
TÀI LIỆU THAM KHẢO
[1] Nguyễn Duy Tiến (2001), Các mô hình xác suất và ứng dụng, NXB Quốc
gia Hà Nội.
[2] Nguyễn Cao Văn, Trần Thái Ninh (2008), Lý thuyết xác suất và thống kê
toán, NXB Đại học Kinh tế quốc dân.
[3] Ngô Thị Thuận (2006), Nguyên lý thống kê kinh tế (Dùng cho sinh viên các ngành: Kinh tế, Kế toán, Kinh doanh và Quản trị doanh nghiệp), NXB Nông nghiệp.
[4] Nguyễn Ngọc Rạng (2012), Thiết kế nghiên cứu và thống kê Y học, NXB Y
học Chi nhánh TP Hồ Chí Minh.
[5] Phần mềm SPSS 16.
[6] Hoàng Minh Hằng, Ngô Bích Nguyệt (2011), Lý thuyết SPSS và ứng dụng
trong Y – Sinh học, Trường Đại học Y Hà Nội.
[7] Hoàng Minh Hằng, Ngô Bích Nguyệt (2011),Thực hành SPSS và ứng dụng
trong Y – Sinh học, NXB Hồng Đức.
[8] Hướng dẫn làm quen sử dụng SPSS để phân tích dữ liệu, Hà Nội tháng 3