Khống chế nhiễu khi phân tích số liệ u

Một phần của tài liệu Giáo trình thống kê (sử dụng SPSS) - Đại học Y tế công cộng (Trang 171)

Trong phân tích, có hai cách để khống chế các tác động của các biến nhiễu: phân tích phân tầng và mô hình hồi quy đa biến.

6.3.3.1 Phân tích phân tầng

Phân tích phân tầng trong giai đoạn phân tích sẽ cho ta kết quả tương đương với ghép cặp trong thiết kế nghiên cứu. Phân tầng có nghĩa tiến hành phân tích hai biến phụ

thuộc và biến độc lập trong theo các phân nhóm của biến nhiễu. Bằng cách phân tầng và xem xét trong phân nhóm của biến nhiễu bạn làm cho mọi đối tượng trong từng phân nhóm có mối liên quan với biến nhiễu tương tự như nhau, vì thế biến này không còn là biến nhiễu nữa theo nhưđịnh nghĩa trong phần 6.3.1.

6.3.3.2 Mô hình hồi quy đa biến

Với những phân tích đơn giản, các phân tích phân tầng thích hợp hơn trong việc thăm dò nhiễu. Tuy nhiên, thường có rất nhiều biến nhiễu cần phải khống chế, phân tích phân tầng rất nhanh chóng trở nên đơn điệu - khi cứ phải lặp lại sự phân tích hai biến trong rất, rất nhiều phân nhóm. Một cách nâng cao hơn để khống chếđa nhiễu là sử dụng

mô hình hồi quy đa bíên. Mô hình này dạng mở rộng của hồi qui tuyến tính đơn giản, mô hình này sử dụng nhiều hơn một biến độc lập để giải thích sự thay đổi trong một biến phụ thuộc. Mặc dù các mô hình đa biến đều có thể làm được điều tương tự (điều chỉnh đa nhiễu), trên thực tế có rất nhiều dạng khác nhau của mô hình đa biến. Giống như sự lựa chọn của kiểm định thống kê cơ bản trong phần 4, lựa chọn mô hình đa biến dựa trên độ đo của biến phụ thuộc. Trong phần này sẽ chỉđề cập đến một dạng của mô hình đa biến (hồi qui đa tuyến tính), nhưng nguyên lý có thểđược khái quát hoá cho tất cả các mô hình khác. Giống như một phân tích phương sai cơ bản, chúng phân chia sự biến thiên của biến phụ thuộc thành các biến thiên thành phần: ảnh hưởng của nhóm (biến độc lập), biến nhiễu 1, biến nhiễu 2, v..v. Kiểm soát các ảnh hưởng của nhiễu cho phép có một lượng giá “tinh” hơn vềảnh hưởng của các biến độc lập, và sựảnh hưởng này được coi là các ước lượng có hiệu chỉnh. Ước lượng mà chúng ta hay dùng trước đây vẫn thường

được gọi là ước lượng hay ước lượng không hiệu chỉnh. “ước lượng ” là thuật ngữ

thông thường cho một giá trị thống kê được rút ra từ phân tích như– trung bình, tỷ lệ, tỷ

suất chênh, tương quan...

Một phần của tài liệu Giáo trình thống kê (sử dụng SPSS) - Đại học Y tế công cộng (Trang 171)