.21 So sánh các chỉ số Gini về hiệu suất

Một phần của tài liệu (LUẬN văn THẠC sĩ) phương pháp thống kê trong kinh doanh và tài chính (Trang 102 - 106)

cviii

0,4375 0,4445

Như vậy kết luận rằng, mơ hình cây nên được chọn trong trường hợp khơng có sự xem xét về chi phí (và các cân nhắc cắt bỏ) hoặc khi sai lầm loại 1 tốn kém hơn. Nếu sai lầm loại 2 là tốn kém hơn, thì một mơ hình hồi quy logistic cũng tốt.

cix

3.3. Ứng dụng 3: Tính điểm tín dụng

3.3.1 Mục tiêu phân tích

Nghiên cứu này áp dụng các phương pháp khai thác dữ liệu vào bài tốn tính điểm tín dụng cho tín dụng tiêu dùng. Nó xem xét cách đánh giá độ tin cậy của cá nhân – người u cầu tín dụng khi mua hàng hóa hoặc dịch vụ. Các nhà khai thác tín dụng khác nhau nhận hàng ngàn đơn tín dụng mỗi ngày, nên họ cần một hệ thống để giúp họ chấp nhận hoặc từ chối yêu cầu. Các nghiên cứu gần đây đã đề xuất các hệ thống hỗ trợ quyết định hay các mơ hình tính điểm. Chúng nhanh chóng, khách quan, không tốn kém và cực kỳ hiệu quả. Điều này đặc biệt đúng đối với tín dụng tiêu dùng, ở đó các giá trị của mỗi khoản vay là khá nhỏ. Ta sẽ lấy dữ liệu khách hàng từ một ngân hàng quan trọng ở miền nam nước Đức và sử dụng nó để xây dựng lên một mơ hình tính điểm cho tín dụng tiêu dùng. Đây là đối tượng mà tác giả Giudici đã nghiên cứu.

Thuật ngữ “tính điểm tín dụng” mơ tả các phương pháp thống kê được sử dụng để phân loại những người đi vay thành 2 loại: tốt và xấu. Các mơ hình thống kê cho tính điểm tín dụng thường được gọi là các mơ hình phiếu ghi điểm, sử dụng các biến giải thích thu được từ thông tin về người nộp đơn để ước lượng xác suất của một khoản vay khơng hồn trả. Một u cầu tín dụng được chấp nhận hoặc bị từ chối sau khi so sánh xác suất ước lượng với một ngưỡng thích hợp. Các phương pháp thống kê hầu hết được sử dụng để phát triển các phiếu ghi điểm là các mạng thần kinh (neural network), hồi quy logistic và các cây phân lớp. Luận văn này khơng nói về mạng thần kinh.

cx dụng, thì dữ liệu khách hàng được so sánh với phiếu ghi điểm để phân lớp người nộp đơn mới vào một trong số các nhóm theo hành vi được quan sát và xác định một điểm số dự báo. Thường thì một mơ hình ghi điểm có thể gán một điểm số với mỗi đặc tính đo được của người nộp đơn. Các điểm số này sau đó được tổng hợp để sinh ra một điểm số tổng thể.

3.3.2 Mô tả dữ liệu

Tập dữ liệu là 1000 quan sát trên 1000 người nộp đơn tín dụng tới một ngân hàng lớn ở miền Nam nước Đức (xem Fashrmeir và Hamerle (1994) để có một mơ tả dữ liệu chi tiết hơn). Ta xét 21 biến, một trong số các biến đó là biến nhị thức Y: credit reliability (Y 0 đối với sự tin cậy, Y 1 đối với sự không tin cậy) mà ta xét như là biến phản ứng. 20 biến khác được xử lý như là các biến giải thích. Sau đây là danh sách các biến giải thích và bảng mơ tả sơ bộ dữ liệu.

 Các biến xã hội nhân khẩu học:

1. sex & marital status: giới tính và tình trạng hơn nhân 2. age: độ tuổi

3. residence: số năm cư trú tại nhà ở hiện nay

 Các biến cá nhân và tài chính:

4. account: sở hữu tài khoản ngân hàng 5. bank book: sở hữu một tập chi phiếu 6. previous rep: lịch sử trả nợ

7. debt: số tiền nợ trước

8. concurrent: các kinh phí khác được yêu cầu 9. employment: loại việc làm

10. working years: số năm làm việc

11. forreign: có phải là lao động nước ngồi hay khơng 12. family: số người ăn theo

 Các biến đặc trưng cho khoản vay: 13. loan: lượng tiền vay

cxi 14. purpose: mục đích vay

15. deadline: thời hạn vay

16. monthly interest: lãi suất hàng tháng 17. others: con nợ đồng thời khác

 Các chỉ số về tài sản:

18. house: sở hữu của một ngôi nhà 19. effects: sự bảo lãnh cá nhân khác

20. telephone: điện thoại có liên lạc được hay không

Một phần của tài liệu (LUẬN văn THẠC sĩ) phương pháp thống kê trong kinh doanh và tài chính (Trang 102 - 106)

Tải bản đầy đủ (PDF)

(132 trang)