Mục đích nghiên cứu
Nghiên cứu được thực hiện nhằm các mục đích sau:
Giới thiệu một khung lý thuyết về phương pháp ước lượng Lasso
Giới thiệu các tình huống thực nghiệm với bộ dữ liệu Việt Nam bằng cách áp dụng phương pháp ước lượng Lasso Qua đó, chứng minh khả năng cải thiện dự báo của Lasso so với phương pháp ước lượng OLS trong bài toán hồi quy và so với mô hình hồi quy Logistic trong bài toán phân loại.
Đối tƣợng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Cơ sở lý thuyết và ứng dụng của phương pháp ước lượng Lasso trong bài toán hồi quy và phân loại
Cơ sở toán học cho lời giải của phương pháp Lasso, các thuật toán tìm lời giải Lasso, tính chất của các ước lượng từ phương pháp Lasso
Ứng dụng Lasso trong lĩnh vực Tài chính – Ngân hàng trên bài toán hồi quy và phân loại.
Phương pháp nghiên cứu
Nghiên cứu tiến hành phân tích, tổng hợp các tài liệu khoa học liên quan đến phương pháp ước lượng Lasso, tập trung vào các khía cạnh chính: thuật toán để tìm ước lượng Lasso, nền tảng toán học của thuật toán và các đặc tính của ước lượng Lasso đã tìm được.
Đối với nội dung ứng dụng Lasso, nghiên cứu sử dụng phương pháp định lượng với các mô hình phân tích hồi quy, mô hình phân loại dữ liệu Các ước lượng mô hình được thực hiện trên ngôn ngữ lập trình R.
Những đóng góp mới của đề tài
Phổ biến một phương pháp chọn biến của mô hình hồi quy và phân loại trong phân tích kinh tế, tài chính, ngân hàng Phương pháp này vừa có khả năng xây dựng một mô hình đơn giản, ít biến giải thích, đồng thời có thể cải thiện khả năng dự báo so với các phương pháp truyền thống
Thông qua ví dụ ứng dụng Lasso cho bài toán phân loại, nghiên cứu đề xuất một mô hình đánh giá tín dụng có hiệu quả cao hơn các phương pháp phân loại phổ biến
CƠ SỞ LÝ THUYẾT CỦA PHƯƠNG PHÁP LASSO
Các kiến thức liên quan
1.1.1 Hàm lồi và các tính chất
Tập lồi Một tập được gọi là tập lồi nếu với mọi và với mọi số thực , - ( )
Hàm lồi Hàm số được gọi là hàm lồi nếu tập xác định của là tập lồi và với mọi thuộc miền xác định của , với mọi số thực ( ), ( ( ) ) ( ) ( ) ( )
Nếu với mọi bất đẳng thức trong định nghĩa trên là dấu bất đẳng thức chặt (