Đề tài nghiên cứu khoa học: Phương pháp ước lượng Lasso: Cơ sở toán học và ứng dụng

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề	Phương pháp ước lượng Lasso: Cơ sở toán học và ứng dụng
Tác giả	Bùi Thị Thiện Mỹ, Trần Thị Thu Hương, Nguyễn Thị Yến
Trường học	Trường Đại học Ngân hàng TP Hồ Chí Minh
Chuyên ngành	Toán học
Thể loại	Đề tài khoa học cấp cơ sở
Năm xuất bản	2021
Thành phố	TP Hồ Chí Minh

Định dạng
Số trang	68
Dung lượng	1,6 MB

Cấu trúc

1. Lý do chọn đề tài (6)
2. Mục đích nghiên cứu (8)
3. Đối tƣợng và phạm vi nghiên cứu (8)
4. Phương pháp nghiên cứu (9)
5. Những đóng góp mới của đề tài (9)
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT CỦA PHƯƠNG PHÁP LASSO (10)
- 1.1. Các kiến thức liên quan (10)
  - 1.1.1. Hàm lồi và các tính chất (10)
  - 1.1.2. Điều kiện cần và đủ để hàm lồi đạt cực tiểu (11)
- 1.2. Phương pháp Lasso cho mô hình hồi quy tuyến tính (12)
  - 1.2.1 Bài toán tổng quát (12)
  - 1.2.2. Cơ sở toán học của phương pháp Lasso (14)
  - 1.2.3. Thuật toán tìm ước lượng Lasso (15)
- 1.3. Phương pháp Lasso cho bài toán phân loại (19)
  - 1.3.1. Mô hình hồi quy Logistic (LR) (19)
  - 1.3.2. Mô hình hồi quy Lasso-Logistic (LL) (20)
- 1.4. Tính chất của ƣớc lƣợng Lasso (0)
  - 1.4.1. Bậc tự do (21)
  - 1.4.2. Tính duy nhất (21)
  - 1.4.3. Tính chệch (22)
  - 1.4.4. Tính vững (22)
CHƯƠNG 2. ỨNG DỤNG LASSO TRÊN BÀI TOÁN HỒI QUY (23)
- 2.1. Mô hình nghiên cứu và các biến (23)
- 2.2 Quy trình tính toán (25)
- 2.3. Kết quả tính toán (26)
- 2.4. Kết luận (30)
CHƯƠNG 3. ỨNG DỤNG LASSO TRÊN BÀI TOÁN PHÂN LOẠI (31)
- 3.1. Giới thiệu (31)
- 3.2. Khung phân tích vấn đề xây dựng mô hình đánh giá tín dụng (32)
  - 3.2.1. Khái niệm đánh giá tín dụng (32)
  - 3.2.2. Các yếu tố đầu vào (33)
- 3.3. Các phương pháp thống kê trong xây dựng mô hình đánh giá tín dụng . 29 1. Các phương pháp thống kê truyền thống (34)
  - 3.3.2. Các mô hình học máy trong đánh giá tín dụng (36)
- 3.4. Vấn đề mất cân bằng dữ liệu trong bài toán phân loại (37)
  - 3.4.1. Phương pháp CSL (38)
  - 3.4.2. Các kỹ thuật tái chọn mẫu (38)
- 3.6. Kết quả thực nghiệm (41)
  - 3.6.1. Dữ liệu thực nghiệm (41)
  - 3.6.2. Các độ đo đánh giá hiệu quả của mô hình (42)
  - 3.6.3. Hiệu quả mô hình SMOTE-Lasso-Logistic (44)
  - 3.6.4 Nhận xét (49)
TÀI LIỆU THAM KHẢO (51)
PHỤ LỤC (56)
- 1. Dữ liệu tỉ suất sinh lợi và các yếu tố nội tại của ngân hàng (56)
- 2. Dữ liệu khách hàng tín dụng (60)
- 3. Mã code chương 2 (62)
- 4. Mã code chương 3 (67)

Nội dung

Kết quả các nghiên cứu bằng phương pháp định lượng này bị ảnh hưởng bởi các yếu tố đầu vào như độ tin cậy của dữ liệu, tần suất lấy dữ liệu, các biến số trong mô hình, định dạng mô hình…

Mục đích nghiên cứu

Nghiên cứu được thực hiện nhằm các mục đích sau:

 Giới thiệu một khung lý thuyết về phương pháp ước lượng Lasso

 Giới thiệu các tình huống thực nghiệm với bộ dữ liệu Việt Nam bằng cách áp dụng phương pháp ước lượng Lasso Qua đó, chứng minh khả năng cải thiện dự báo của Lasso so với phương pháp ước lượng OLS trong bài toán hồi quy và so với mô hình hồi quy Logistic trong bài toán phân loại.

Đối tƣợng và phạm vi nghiên cứu

Đối tượng nghiên cứu: Cơ sở lý thuyết và ứng dụng của phương pháp ước lượng Lasso trong bài toán hồi quy và phân loại

 Cơ sở toán học cho lời giải của phương pháp Lasso, các thuật toán tìm lời giải Lasso, tính chất của các ước lượng từ phương pháp Lasso

 Ứng dụng Lasso trong lĩnh vực Tài chính – Ngân hàng trên bài toán hồi quy và phân loại.

Phương pháp nghiên cứu

Nghiên cứu tiến hành phân tích, tổng hợp các tài liệu khoa học liên quan đến phương pháp ước lượng Lasso, tập trung vào các khía cạnh chính: thuật toán để tìm ước lượng Lasso, nền tảng toán học của thuật toán và các đặc tính của ước lượng Lasso đã tìm được.

 Đối với nội dung ứng dụng Lasso, nghiên cứu sử dụng phương pháp định lượng với các mô hình phân tích hồi quy, mô hình phân loại dữ liệu Các ước lượng mô hình được thực hiện trên ngôn ngữ lập trình R.

Những đóng góp mới của đề tài

Phổ biến một phương pháp chọn biến của mô hình hồi quy và phân loại trong phân tích kinh tế, tài chính, ngân hàng Phương pháp này vừa có khả năng xây dựng một mô hình đơn giản, ít biến giải thích, đồng thời có thể cải thiện khả năng dự báo so với các phương pháp truyền thống

Thông qua ví dụ ứng dụng Lasso cho bài toán phân loại, nghiên cứu đề xuất một mô hình đánh giá tín dụng có hiệu quả cao hơn các phương pháp phân loại phổ biến