Trong nhiều nghiên cứu, các nhà khoa học đã thực hiện phân tích hồi quy đơn biến để xem xét sự phụ thuộc của một biến (biến phụ thuộc) vào một biến khác (biến giải thích) để ước lượng hay dự đoán giá trị trung bình của biến phụ thuộc trên cơ sở giá trị biết trước của các biến giải thích. Đây là việc làm thường xuyên của các nhà khoa học, tuy nhiên họ chưa đưa ra những căn cứ khoa học lựa cho việc lựa chọn mô hình của mình. Tác giả đã tìm hiểu và giới thiệu 11 dạng mô hình hồi quy đơn biến, đồng thời cung cấp những cơ sở khoa học giúp các nhà khoa học, học viên lựa chọn mô hình hồi quy đơn biến phù hợp nhất cho nghiên cứu của mình.
Tạp chí Khoa học - Cơng nghệ Thủy sản Số 2/2015 VẤN ĐỀ TRAO ĐỔI GIẢI PHÁP LỰA CHỌN MƠ HÌNH HỒI QUY ĐƠN BIẾN SOLUTION FOR SELECTING UNIVARIATE REGRESSION MODEL Phạm Văn Thông1 Ngày nhận bài: 27/8/2014; Ngày phản biện thơng qua: 27/11/2014; Ngày duyệt đăng: 10/6/2015 TĨM TẮT Trong nhiều nghiên cứu, nhà khoa học thực phân tích hồi quy đơn biến để xem xét phụ thuộc biến (biến phụ thuộc) vào biến khác (biến giải thích) để ước lượng hay dự đốn giá trị trung bình biến phụ thuộc sở giá trị biết trước biến giải thích Đây việc làm thường xuyên nhà khoa học, nhiên họ chưa đưa khoa học lựa cho việc lựa chọn mô hình Tác giả tìm hiểu giới thiệu 11 dạng mơ hình hồi quy đơn biến, đồng thời cung cấp sở khoa học giúp nhà khoa học, học viên lựa chọn mơ hình hồi quy đơn biến phù hợp cho nghiên cứu Từ khóa: Hồi quy đơn biến ABSTRACT In many studies, scientists have conducted univariate regression analyses to examine the dependence of a variable (a dependent variable) on another variable (an explanatory variable) Then they can estimate or predict the average value of dependent variables basing on known-value of the explanatory variables Scientists have carried out in this way frequently; however, they have not shown scientific foundations of their univariate regression models The author have studied and introduced 11 types of univariate regression models, and provided scientific foundations in order to help scientists and students choose the best univariate regression models in their researches Keyword: Univariate Regression I MỞ ĐẦU Hồi quy đơn biến mơ hình thống kê sử dụng để dự đoán giá trị biến phụ thuộc (dependence variable) hay gọi biến kết dựa vào giá trị biến độc lập (independence variable) hay gọi biến nguyên nhân Hiện nay, nhà nghiên cứu, học viên cao học… thường hồi quy theo mơ hình đường thẳng (linear) mà chưa đưa sở lý luận khoa học để giải thích chọn mơ hình đường thẳng hay dạng mơ hình khác Một số khác đưa dẫn chứng chưa thuyết phục dạng mơ hình đơn giản, dễ tính tốn Bài báo cung cấp cho nhà nghiên cứu, học viên cao học độc giả nói chung sở lý luận khoa học đắn giải thích cho việc lựa mơ hình hồi quy II NỘI DUNG Phân tích dạng mơ hình Với phát triển mạnh mẽ công nghệ thông tin, việc hồi quy khơng cần nhiều thời gian tính tốn trước mà trợ giúp nhiều phần mềm từ đơn giản Microsoft Excel đến phần mềm PASW Statistics 18 hay phần mềm R, phần mềm Eview, phần mềm Stata… Tuy nhiên báo tơi muốn đề cập số khía cạnh hai phần mềm đơn giản thông dụng Microsoft Excel 2010 PASW Statistics 18 - Microsoft Excel 2010 cơng cụ phổ thơng, đơn giản tính tốn, có hỗ trợ hồi quy đơn biến, nhiên số lượng mơ hình mà Excel 2010 đưa (chỉ dạng mơ hình) Khi hồi quy từ Excel 2010, kết chỏ có phương trình hồi quy với hệ số tương quan biến độc lập biến phụ thuộc mà chưa cung cấp số để đánh giá mơ hình ThS Phạm Văn Thơng: Viện Khoa học Công nghệ khai thác thủy sản - Trường Đại học Nha Trang 194 • TRƯỜNG ĐẠI HỌC NHA TRANG Tạp chí Khoa học - Cơng nghệ Thủy sản Số 2/2015 Logistic: Y = / (1/u + (b0 * (b1X)) ln(1/y-1/u)= ln (b0) + (ln(b1)*X) u giá trị giới hạn trên, mang giá trị dương lớn giá trị lớn biến phụ thuộc Ví dụ giá trị lớn biến phụ thuộc 100 u chọn 101 (u=101) 10 Growth: Y = e(b0 + (b1 * X)) ln(Y) = b0 + (b1 * X) 11 Exponential: Y = b0 * (e(b1 * X)) ln(Y) = ln(b0) + (b1 * X) Chú giải: b0 số; b1 hệ số hồi quy được; X biến độc lập; Y biến phụ thuộc Tiêu chí đánh giá [1,2]: - Tham số R bình phương hiệu chỉnh (adjusted R square) cho biết mức độ % biến thiên biến phụ thuộc giải thích biến độc lập R bình phương hiệu chỉnh cao tốt biến độc lập giải thích nhiều cho biến phụ thuộc - Giá trị Sig (P-value) bảng anova dùng để đánh giá phù hợp (tồn tại) mơ hình Giá trị Sig nhỏ (thường