Phần 1: Đề tài nhóm 1.1 Tổng quan về cơ sở dữ liệu Financial Services hay dịch vụ tài chính là những dịch vụ có liên quan chặt chẽ đến quá trình lưu chuyển và sử dụng vốn, tiền tệ trong
ĐỀ TÀI NHÓM
T ỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
Financial Services hay dịch vụ tài chính là những dịch vụ có liên quan chặt chẽ đến quá trình lưu chuyển và sử dụng vốn, tiền tệ trong nền kinh tế
Ngành dịch vụ tài chính gồm nhiều loại hình kinh doanh, bao gồm các công ty thẻ tín dụng, công ty môi giới và nhà cung cấp dịch vụ thế chấp
Financial Services được chia thành 2 nhóm chính:
Dịch vụ bảo hiểm và những dịch vụ liên quan tới bảo hiểm: o Bảo hiểm trực tiếp (bao gồm cả đồng bảo hiểm); o Tái bảo hiểm và nhượng tái bảo hiểm; o Trung gian bảo hiểm như môi giới, đại lí; o Các dịch bổ trợ bảo hiểm như tư vấn thống kê bảo hiểm Dịch vụ ngân hàng và những dịch vụ tài chính khác: o Những dịch vụ ngân hàng thông thường:
Dịch vụ nhận tiền gửi và các nguồn tài chính phải hoàn trả khác từ nhân dân;
Dịch vụ cho vay dưới các hình thức, bao gồm tín dụng tiêu dùng, tín dụng thế chấp, mua nợ và tài trợ các dịch vụ cho hoạt động giao dịch thương mại;
Dịch vụ bảo lãnh và thế chấp;
Dịch vụ cho thuê tài chính o Những dịch vụ tài chính khác:
Dịch vụ kinh doanh chứng khoán và các sản phẩm phái sinh như hợp đồng tương lai, hợp đồng quyền chọn, Dịch vụ ngoại hối;
Dịch vụ thanh toán và thanh toán bù trừ đóng vai trò quan trọng trong hệ thống tài chính, đảm bảo giao dịch thuận lợi cho các tài sản tài chính như chứng khoán, công cụ phái sinh và các công cụ tài chính thỏa thuận khác.
Các dịch vụ quản lý tài sản bao gồm quản lý tiền mặt, đầu tư gián tiếp, hình thức đầu tư tập thể, quản lý quỹ hưu trí, dịch vụ tín thác, gửi tiền và lưu kho tiền tệ.
Dịch vụ cung cấp và chuyển giao thông tin tài chính và xử lí dữ liệu tài chính và các phần mềm có liên quan do nhà cung cấp dịch vụ tài chính khác cung cấp.
T HÔNG TIN CSDL
Cơ sở dữ liệu được download từ trang Kaggle.com thống kê dữ liệu của ngân hàng quốc gia Eagle năm 1999 với kích thước khoảng 163MB
1.2.1 Thông tin số lượng bản ghi của các bảng dữ liệu
Tên bảng Số lượng bản ghi Mô tả
Account 4526 Tài khoản của khách hàng
Client 5388 Thông tin của khách hàng
Card 892 Thông tin về thẻ cứng của khách hàng
Luxury_loan_portfolio 1266 Thông tin chi tiết các khoản vay lớn
CRM_Reviews 500 Những đánh giá của khách hàng theo từng khu vực
Crm events 21076 Thông tin các khiếu nại, vấn đề khi giao dịch
Crm call center logs 2993 Quản lí nhật kí cuộc gọi khách hàng
Orders 6456 Mô tả các đơn đặt hàng
Trans 748287 Mô tả các giao dịch
Loan 682 Thông tin các khoản vay
District 77 Mô tả chi tiết địa chỉ của khách hàng
Disposition 5538 Bảng phân loại tài khoản
BÁO CÁO GIỮA KÌ 7 1.2.2 Lược đồ E-R diagram
1.2.4 Đánh giá mức độ chuẩn hóa
Vì các trường thuộc tính đều là nguyên tố và không chứa giá trị phức, giá trị tính toán nên hầu hết các bảng trong cơ dữ liệu đều đạt chuẩn 1 trừ bảng crm_call_center, chứa trường thuộc tính được tính toán từ trường thuộc tính khác
Hình ảnh bảng crm_call_center
Chuẩn 2 Để đạt chuẩn 2 thì quan hệ đó:
Là 1NF Các thuộc tính không khóa phải phụ thuộc hàm đầy đủ vào khóa chính
Ta nhận thấy các bảng đã đạt chuẩn 1 đều đã đạt chuẩn 2 và trừ bảng crm_call_center vì chưa đạt chuẩn 1
Một quan hệ đạt chuẩn 3NF nếu quan hệ đó:
Là 2NF Các thuộc tính không khóa phải phụ thuộc trực tiếp vào khóa chính
Các bảng đạt chuẩn 3 gồm có: orders, trans, crm_events, disposition
Các bảng còn lại không đạt chuẩn 3 ví dụ bảng account không đạt chuẩn vì các cột year, month, day không phụ thuộc trực tiếp vào khóa chính
Một quan hệ ở dạng chuẩn BCNF nếu quan hệ đó:
Là 3NF Không có thuộc tính khóa mà phụ thuộc hàm vào thuộc tính không khóa
Các bảng đạt chuẩn BCNF là: crm_events, disposition, orders Để tiếp tục chuẩn hóa các bảng ta sẽ phải tách bảng tuy nhiên trong thực tế sẽ khiến bảng ER bị dư thừa; quá trình truy vấn hay cập nhật dữ liệu không bị ảnh hưởng vì thế ta sẽ không chuẩn hóa tiếp.
TRUY VẤN DỮ LIỆU
T RUY VẤN DỮ LIỆU
1.1 Kiểm tra các tài khoản còn nợ cho đến hiện tại
Output: Thông tin các tài khoản còn nợ cho đến thời điểm hiện tại
SELECT loan_id, account_id, amount, duration, timestampdiff(month, fulldate, curdate()) AS 'Total past payments', amount- payments*timestampdiff(month, fulldate, curdate())
AS 'Loan balance', status, fulldate, location
WHERE timestampdiff(month, fulldate, curdate())3, 1, 0 )) AS good,
SUM(IF (stars