Hồi qui thường được xếp vào loại bài toán tối ưu vì chúng ta nỗ lực để tìm kiếm mộtgiải pháp để cho sai số và phần dư là tốt nhất. Phương pháp sai số chung nhất được sửdụng là phương pháp bình phương cực tiểu: phương pháp này tương ứng với một hàmhợp lý dạng Gauss của các dữ liệu quan sát khi biết biến ngẫu nhiên (ẩn). Về một mặtnào đó, bình phương cực tiểu là một phương pháp ước lượng tối ưu OLS.Để giải quyết bài toán tối ưu trong hồi qui thường dùng các giải thuật như giải thuậthạ bậc gradient gradient descent, giải thuật GaussNewton, và giải thuật LevenbergMarquardt.Các giải thuật xác suất như RANSAC có thể được dùng để tìm một phù hợptốt cho tập mẫu, khi cho trước một mô hình tham số hóa của hàm đường cong.Hồi qui có thể được biểu diễn bằng phương pháp hàm hợp lý ước lượng các tham số củamột mô hình nào đó. Tuy nhiên, với một lượng nhỏ dữ liệu, ước lượng này có thể có phươngsai lớn (high variance). Các phương pháp Bayesian có thể được sử dụng để ước lượng cácmô hình hồi qui. Các tham số có một phân phối điều kiện được giả định trước, nó baogồm mọi thông tin thống kê đã biết trước về các biến. (Ví dụ, nếu một tham số được biếtlà không âm thì một phân phối không âm sẽ được gán cho nó.) Phân phối được giả địnhtrước này sau đó được áp dụng cho vector tham số. Phương pháp Bayes có ưu điểm là khai1thác được toàn bộ các thông tin đã có và nó là ước lượng chính xác, không phải ước lượngchệch và do đó rất tốt cho các tập số liệu nhỏ. Trong thực hành, người ta sử dụng phươngpháp MAP maximum a posteriori, phương pháp này đơn giản hơn phân tích Bayes đầy đủ.Trong khuôn khổ của bài viết này, phần đầu tác giả đặc biệt chú trọng trình bày vềhồi qui bội và những vấn đề liên quan gồm phương pháp ước lượng bình phương cực tiểuOLS, các điều kiện giả thiết mô hình hồi qui, các đặc trưng thông kế OLS, ý nghĩa quantrọng của các hệ số xác định, hệ số tương quan của mô hình, các loại kiểm định giả thuyếtcủa hồi qui bội, dự báo. Ở phần sau là những giới thiệu về các mô hình hồi qui phi tuyếnthường gặp và những phương pháp ước lượng nhằm tuyến tính hóa chúng. Trong quátrình làm việc dù đã rất cố gắng nhưng không thể tránh những sai sót, hi vọng nhận đượcnhững ý kiến đóng góp chân thành từ bạn đọc.
Trang 1BÀI THUYẾT TRÌNH MÔN XÁC SUẤT THỐNG KÊ 2
Trang 2 I HỒI QUI BỘI
Mô hình hồi qui bội
Phương pháp bình phương cực tiểu OLS
Các điều kiện giả thiết, đặc trưng thống kê OLS
Hệ số xác định, hệ số xác định điều chỉnh
Kiểm định (mô hình tổng thể, hệ số hồi qui riêng)
Khoảng tin cậy của các hệ số hồi qui
Dự đoán trong phân tích hồi qui bội
2
NỘI DUNG CHÍNH
Trang 3 II HỒI QUI PHI TUYẾN
Mô hình hồi qui phi tuyến
Hồi qui phi tuyến dạng tích
Hồi qui phi tuyến dạng đa thức
Phương pháp OLS trong hồi qui phi tuyến
3
NỘI DUNG CHÍNH
Trang 4Giới thiệu
4
Hồi qui bội dùng để xem xét mối liên hệ tuyến tính giữa các biến ngẫu nhiên độc lập (biến ảnh hưởng) với biến ngẫu
nhiên phụ thuộc (biến chịu ảnh hưởng)
Mục tiêu phân tích hồi qui nhằm mô hình hóa mối liên hệ, nghĩa là từ các dữ liệu mẫu thu thập được từ ta cố gắng xây
dựng một mô hình toán học nhằm thể hiện một cách tốt nhất mối liên hệ giữa các biến độc lập với biến phụ thuộc Kết
quả của phân tích hồi qui được dùng để dự đoán
I HỒI QUI BỘI
Trang 5VÍ DỤ
Trang 6Mô hình hồi qui bội là mô hình trong đó biến phụ thuộc chịu ảnh hưởng của ít nhất hai biến độc lập
(biến giải thích).
Các dạng mô hình gồm:
- Mô hình hồi qui bội tổng thể
- Mô hình hồi qui bội mẫu.
6
1 MÔ HÌNH HỒI QUI BỘI
Trang 71.1 MÔ HÌNH HỒI QUI BỘI TỔNG THỂ
Trang 8
12
x
Trang 99
Trang 101.2 MÔ HÌNH HỒI QUI BỘI MẪU
Trang 1111
Trang 12,
Trang 13
13
Trang 162 PHƯƠNG PHÁP
BÌNH PHƯƠNG CỰC TIỂU (OLS)
)
Trang 1717
Trang 19VÍ DỤ 4
Trang 21Liệu rằng các biến X_1,X_2, ,X_k có ảnh hưởng lẫn nhau ?
Hiện tượng đa cộng tính này dẫn đến việc chỉ khảo sát sự ảnh hưởng của các biến độc lập đến Y trong mô hình hồi qui không đầy đủ.
Câu hỏi đặt ra
Trang 22 Ý tưởng giải pháp cho vấn đề này là các biến độc lập ảnh hưởng chỉ tương quan với biến phụ thuộc
chịu ảnh hưởng nhưng không có tương quan với nhau (many-to-one).
Và còn nhiều vấn đề khác về giả thiết ảnh hưởng đến ý nghĩa của mô hình hồi qui bội Do đó ta cần
phải có các điều kiện xác định như sau
22
Trang 233 CÁC ĐIỀU KIỆN GIẢ THIẾT
Trang 24 Khi các giả thiết trên được thỏa mãn thì các hệ số ước lượng thu được theo phương pháp bình phương tối tiểu OLS sẽ là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng không chệch.
Nói cách khác khi các giả thiết này được đảm bảo thì các ước lượng tính được bằng phương pháp OLS là các ước lượng tốt nhất và hiệu quả nhất của hàm hồi qu tổng thể.
Ta nói, ước lượng OLS là ước lượng BLUE (Best Linear Unbiased Estimator).
24
ĐỊNH LÝ GAUSS-MARKOV
Trang 2525
Trang 26TÍNH CHẤT ƯỚC LƯỢNG OLS
Trang 27PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN
CỦA ƯỚC LƯỢNG OLS
Trang 2828
Trang 30Mô hình hồi qui tuyến tính được xây dựng để giải thích sự biến thiên biến phụ thuộc với biến độc lập
• Nhưng mô hình này đã thể hiện tốt nhất mối liên hệ giữa chúng hay chưa ?
• Bao nhiêu phần trăm biến thiên của biến phụ thuộc được giải thích bởi các
biến ngẫu nhiên độc lập?
Câu hỏi đặt ra
Trang 3131
Trang 32SST=SSR+SSE
Trang 334 HỆ SỐ XÁC ĐỊNH
Trang 34VÍ DỤ 5 Tìm hệ số tất định của mô hình trong ví dụ 4
Trang 355 HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNH
Trang 36HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNH
Trang 37VÍ DỤ 6
Trang 38SST n
Trang 406 HỆ SỐ HỒI QUI TỪNG PHẦN
Trang 417 KIỂM ĐỊNH GIẢ THUYẾT CỦA MÔ HÌNH
HỒI QUI BỘI ĐỐI VỚI HỆ SỐ HỒI QUI
Trang 4242
Trang 46VÍ DỤ 7
Trang 47VÍ DỤ 8
Một công ty muốn mở rộng thị trường tại một thành phố nên đả
nghiên cứu thị trường bằng cách tiến hành quảng cáo và chào bán
sản phẩm của mình Thu thập số liệu trong 10 tuần về số sản phầm
bán được trong một tuần(Y), giá sản phầm là X_1(ngàn đồng) chí
phí quảng cáo là X_2 (ngàn đồng), ta có bảng số liệu sau:
Trang 4848
Trang 49VÍ DỤ 8
Trang 508 KIỂM ĐỊNH GIẢ THUYẾT ĐỒNG THỜI CỦA MÔ HÌNH HỒI QUI
Trang 5151
Trang 52Với mức ý nghĩa α=5% hãy kiểm định tổng quát ý nghĩa mô hình hồi qui VD6
VÍ DỤ 9
Trang 530.128 0.67 0.756 0.753
Y = + X − X + X
Trang 5555
Trang 579 KHOẢNG TIN CẬY CỦA CÁC
HỆ SỐ HỒI QUI
Trang 58VÍ DỤ 10 Xét ví dụ 6 Tìm ước lượng khoảng của hệ số hồi qui riêng với độ tin cậy 95%
NX: kiểm định hệ số bằng khoảng tin cậy
0.128 4.303*0.415
4.303*0.045
4.
3 ( )
3 3
Trang 5959
Trang 619 DỰ ĐOÁN TRONG PHÂN TÍCH HỒI QUI
Trang 62VÍ DỤ 11
Trang 63II HỒI QUI PHI TUYẾN
Trang 64MÔ HÌNH HỒI QUI PHI TUYẾN
Trang 6565
Trang 66MỘT SỐ DẠNG HỒI QUI PHI TUYẾN
Trang 671 HÀM HỒI QUI PHI TUYẾN DẠNG TÍCH
Trang 6868
Trang 702 HÀM HỒI QUI PHI TUYẾN ĐA THỨC
Trang 7171
Trang 743 PHƯƠNG PHÁP OLS CHO HỒI QUI PHI TUYẾN
Trang 7575
Trang 77VÍ DỤ
X là số ngày nằm viện
Y là chỉ số dự đoán cho sự hồi phục lâu dài sau xuất viện
Trang 7878
Trang 88CẢM ƠN CÔ
VÀ CÁC BẠN
ĐÃ CHÚ Ý LẮNG NGHE