Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 55 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
55
Dung lượng
154,77 KB
Nội dung
• TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI ••• KHOA CÔNG NGHỆ THÔNG TIN ■ NGUYỄN VIỆT DŨNG ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LOẠI KHÁCH HÀNG VAY VỐN CỦA NGÂN HÀNG TMCP NGOẠI THƯƠNG CHI NHÁNH VIỆT TRÌ KHÓA LUẬN TÓT NGHIỆP ĐẠI HỌC • ••• Chuyên ngành: Khoa học máy tính • HÀ NỘI - 2015 TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI • • • KHOA CÔNG NGHÊ THÔNG TIN NGUYỄN VIỆT DŨNG ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐẺ PHÂN LOẠI KHÁCH HÀNG VAY VỐN CỦA NGÂN HÀNG TMCP NGOẠI THƯƠNG CHI NHÁNH VIỆT TRÌ KHÓA LUÂN TÓT NGHIÊP ĐAI HOC • • • • Chuyên ngành: Khoa học máy tính Người hướng dẫn khoa học TS. LƯU THI BÍCH HƯƠNG HÀ NỘI – 2015 ■ LỜI CẢM ƠN Để hoàn thành khóa luận này, trước hết em xin gửi lòi cảm ơn sâu sắc tới TS. Lưu Thị Bích Hương tận tình hướng dẫn, bảo, định hướng, đóng góp ý kiến quý báu cho em suốt trình thực hiện. Em xin chân thành cảm ơn thầy, cô giáo khoa Công nghệ Thông tin, trường Đại học Sư phạm Hà Nội quan tâm giảng dạy giúp đõ em suốt bốn năm học vừa qua thòi gian em làm khóa luận này. Là sinh viên khoa Công nghệ Thông tin, em tự hào khoa học, thầy cô giáo mình. Em xin kính chúc thầy, cô mạnh khỏe, hạnh phúc thành công. Chúc khoa Công nghệ Thông tin ngày khang trang, vững mạnh, góp phần to lớn nghiệp đào tạo chuyên nghiệp trường Đại học Sư phạm Hà Nội 2. Lần đầu nghiên cứu khoa học, chắn đề tài em không tránh khỏi thiếu sót, hạn chế. Vì vậy, em mong đóng góp ý kiến thầy cô giáo bạn để đề tài em hoàn thiện. Hà Nội, tháng 05 năm 2015 Sinh viên Nguyễn Việt Dũng LỜI CAM ĐOAN Tên em là: Nguyễn Việt Dũng Sinh viên: K37A - CNTT, trường Đại học Sư phạm Hà Nội 2. Em xin cam đoan: 1. Đề tài “ửng dụng định để phân loại khách hàng vay vốn Ngân hàng thương mại cổ phần Ngoại thương, nhánh Việt Trì” kết tìm hiểu nghiên cứu riêng em, hướng dẫn TS. Lưu Thị Bích Hương. 2. Khóa luận hoàn toàn không chép từ tài liệu có sẵn công bố khác. 3. Kết không trùng vói tác giả khác. Nếu sai em xin hoàn toàn chịu trách nhiệm. Hà Nội, tháng 05 năm 2015 Người cam đoan Nguyễn Việt Dũng MỤC LỤC MỤC LỤC HÌNH ẢNH MỞ ĐẦU 1. Lý chọn đề tài ứng dụng Công nghệ Thông tin vào lĩnh vực đời sống, kinh tế xã hội ngày phổ biến. Điều đồng nghĩa với việc liệu lưu trữ quan, xí nghiệp, trường học, . ngày khổng lồ. Tuy nhiên theo thống kê có lượng nhỏ liệu (khoảng từ 5% đến 10%) phân tích, số lại họ phải làm làm với liệu này, họ tiếp tục thu thập lưu trữ hy yọng liệu cung cấp cho họ thông tin quý giá cách nhanh chóng để đưa định kịp thời vào lúc đó. Chính vậy, phương pháp quản tri khai thác sở liệu truyền thống ngày không đáp ứng thực tế. Từ làm phát triển khuynh hướng kỹ thuật kỹ thuật phát tri thức khai phá liệu (KDD Knowledge Discovery and Data Mining). Cho đến nay, khai phá liệu ngày nghiên cứu, phát triển đạt thành tựu đáng kể lĩnh vực: kinh doanh, y tế, công nghệ sinh học, quân sự, bưu viễn thông, xây dựng, . Rất nhiều tổ chức công ty lớn giới áp dụng kỹ thuật khai phá liệu vào hoạt động sản xuất kinh doanh thu lợi ích to lớn. Ngành công nghiệp ngân hàng bắt đầu nhận cần thiết kỹ thuật khai phá liệu, kỹ thuật giúp họ cạnh tranh thị trường. Các ngân hàng sử dụng công cụ khai phá liệu cho việc phân khúc khách hàng lọi nhuận, chấm điểm tín dụng, phê duyệt, quảng bá bán sản phẩm, phát giao dịch gian lận, .Việc sử dụng phương pháp khai phá tri thức từ liệu để phân loại khách hàng vay vốn phương pháp nhằm giảm nguy rủi ro tín dụng. Với mong muốn nghiên cứu việc ứng dụng định để phân loại khách hàng ngân hàng thương mại cổ phần Ngoại thương, em chọn đề tài “ủng dụng định để phân lom khách hàng vay vốn Ngân hàng thương mại cổ phần Ngoại thương, chi nhánh Việt Trì” làm khóa luận tốt nghiệp. 2. Mục đích, nhiệm vụ nghiên cứu + lìm hiểu khai phá liệu, ứng dụng khai phá liệu lĩnh vực ngân hàng. + Cây định, thuật toán ID3. + Xây dựng ứng dụng định để phân loại khách hàng vay vốn ngân hàng thương mại cổ phần Ngoại thương, chi nhánh Việt Trì. 3. Đối tượngvà phạm vi nghiền cứu Đối tượng nghiên cứu khóa luận định, ứng dụng khai phá liệu lĩnh vực ngân hàng (Marketing, quản lý rủi ro, phát sai lệch, xâm nhập, .). Phạm vi nghiên cứu: + Thuật toán ID3. + Khách hàng vay vốn ngân hàng thương mại cổ phàn Ngoại thương, chi nhánh Việt Trì. 4. Ý nghĩa khoa học thực tiễn Đóng góp vào hệ thống thông tin ứng dụng hỗ ừợ việc định. Được sử dụng để phân tích liệu, đưa nhìn tổng quan cho người quản lý ước lượng rủi ro dễ dàng hơn. Phân loại khách hàng vay vốn giúp cho việc lựa chọn áp dụng quy định pháp luật phù hợp để giải quyền lợi bên tín dụng thuận lợi nhanh chóng hơn, tiết kiệm thời gian tiền bạc cho bên. 5. Phương pháp nghiên cứu a. Phương pháp nghiên cứu lý luận Nghiên cứu qua việc đọc sách, báo tài liệu liên quan nhằm xây dựng sở lý thuyết khóa luận biện pháp cần thiết để giải vấn đề khóa luận. Phân tích tổng họp tài liệu khai phá liệu sử dụng thuật toán Decision Tree có thuật toán ID3, phân loại liệu, mô hình dự báo. b. Phương pháp chuyên gia Tham khảo ý kiến chuyên gia để thiết kế chương trình phù hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng yêu càu ngày cao người sử dụng. c. Phương pháp thực nghiệm Thông qua quan sát thực tế, yêu càu sở, lý luận nghiên cứu kết đạt qua phương pháp trên. ứng dụng kết họp kỹ thuật phân loại mô hình định để phân loại khách hàng vay vốn Ngân hàng thương mại. 6. Cấu trúc khóa luân Ngoài lời cảm ơn, mở đàu, kết luận hướng phát triển, tài liệu tham khảo, khóa luận có nội dung sau: Chương 1: Cơ sở lý thuyết - Chương nghiên cứu tổng quan thuật toán định. Phát biểu toán xây dựng định việc phân loại khách hàng vay vốn ngân hàng. Chương 2: Khai phá liệu - Tìm hiểu khám phá tri thức, khai phá liệu số phương pháp khai phá liệu thông dụng. Chương đưa ứng dụng cụ thể khai phá liệu ngân hàng. Chương 3: ửng dụng khai phá liệu để phân loại khách hàng Chương tìm hiểu thuật toán ID3 để xây dựng định; nghiên cứu tổng quan quy trình tín dụng từ xây dựng chương trình mô định việc phân loại khách hàng vay vốn. CHƯƠNG 1: Cơ SỞ LÝ THUYẾT 1.1. Giới thiệu Trong lĩnh vực học máy, định kiểu mô hình dự báo (predictive model), nghĩa ánh xạ từ quan sát vật/hiện tượng tới kết luận giá trị mục tiêu vật/hiện tượng. Mỗi nút (internal node) tương ứng với biến; đường nối vói nút thể giá tri cụ thể cho biến đó. Mỗi nút đại diện cho giá ữị dự đoán biến mục tiêu, cho trước giá tri biến biểu diễn đường từ nút gốc tới nút đó. Kỹ thuật học máy dùng định gọi học định, hay gọi với tên ngắn gọn định. Học định phương pháp thông dụng khai phá liệu. Khi đó, định mô tả cấu trúc cây, đó, đại diện cho phân loại cành đại diện cho kết họp thuộc tính dẫn tói phân loại đó. Một định học cách chia tập họp nguồn thành tập dựa theo kiểm tra giá tri thuộc tính, trình lặp lại cách đệ qui cho tập dẫn xuất. Quá trình đệ qui hoàn thành tiếp tục thực việc chia tách nữa, hay phân loại đơn áp dụng cho phàn tử tập dẫn xuất. Một phân loại rừng ngẫu nhiên (random forest) sử dụng số định để cải thiện tỉ lệ phân loại. Cây định phương tiện có tính mô tả dành cho việc tính toán xác suất có điều kiện. Cây định mô tả kết hợp kỹ thuật toán học tính toán nhằm hỗ trợ việc mô tả, phân loại tổng quát hóa tập liệu cho trước. Dữ liệu cho dạng ghi có dạng: (x, y) = (xh x2, x3, ., xh y) Biến phụ thuộc (dependant variable) y biến cần tìm hiểu, phân loại hay tổng quát hóa. xh x2, x3, . biến giúp thực công việc phân lớp liệu. Cây định cấu trúc phân cấp nút nhánh (mang giá trị thuộc tính). CÓ3 loại nút cây: + Nút gốc + Nút nội bộ: mang tên thuộc tính CSDL + Nút lá: mang tên lớp Cị Cây định sử dụng phân lớp cách duyệt từ nút gốc đụng đến nút lá, từ rút lớp đối tượng cần xét. Ví dụ: Cây định phân lớp mức lương. Hình 1.1: Cây định phân lớp mức lương 1.2. Các kiểu định Cây định có hai tên khác hồi quy phân loại. + Cây hồi quy (Regression tree) ước lượng hàm có giá trị số thực thay sử dụng cho nhiệm vụ phân loại, ví dụ: ước tính giá nhà khoảng thòi gian bệnh nhân nằm viện. + Đây phương pháp thống kê mà giá trị kỳ vọng hay nhiều biến ngẫu nhiên dự đoán dựa vào điều kiện biến ngẫu nhiên (đã tính toán) khác. Cụ thể, có hồi qui tuyến tính, hồi qui lôgic, hồi qui Poisson học có giám sát. Phân tích hồi qui không trùng khớp đường cong (lựa chọn đường cong mà vừa khớp với tậpđiểm liệu); phải trùng khớp vói mô hình, vói thành phần ngẫu nhiên xác định {deterministic and stochastic components). Thành phần xác định gọi dự đoán (predictor) thành phần ngẫu nhiên gọi phần sai số {error term). +Phân loại (Classification): Là phương pháp dự báo, cho phép phân loại đối tượng vào lớp cho trước. Phân loại thống kê thủ tục thống kê ừong cá thể riêng biệt vào nhóm dựa số lượng thông tin hay nhiều tính chất kế thừa cá thể (được xem điểm, biến, đặc điểm, .) dựa vào tập huấn luyện cá thể đánh nhãn sẵn. + mặt hình thức, toán diễn giải sau: cho sẵn tập huấn luyện f(xj,y), .,(xmy)} cần tạo phân loại h: X—» Y mà ánh xạ đối tượng X eX vào nhãn phân loại y eY. Ví dụ, toán lọc spam, Xi biểu diễn cho thư điện tử y "Spam" "Không Spam". Các giải thuật phân loại thống kê thường sử dụng hệ thống nhận dạng mẫu. 1.3. Ưu điểm định So với phương pháp khai phá liệu khác, định phương pháp có số ưu điểm: + Cây định dễ hiểu. Người ta hiểu mô hình định sau giải thích ngắn gọn. + Việc chuẩn bị liệu cho định không cần thiết. Các kỹ thuật khác thường đòi hỏi chuẩn hóa liệu, cần tạo biến phụ (dummy variable) loại bỏ giá trị rỗng. + Cây định xử lý liệu có giá trị số liệu có giá tn tên thể loại. Các kỹ thuật khác thường chuyển để phân tích liệu gồm loại biến. Chẳng hạn, luật quan hệ dùng cho biến tên, mạng nơ-ron dùng cho biến có giá tri số. + Cây định mô hình hộp trắng. Nếu quan sát tình cho trước ữong mô hình dễ dàng giải thích điều kiện —CTACK - MI *> --.VU 35Ú .HMJ30-1235A 3(1-12«AMINE PEIS S44 05-012010:141 CASUALLY 3565 DCCIDC SA 4488 «S-UI2011:11.2 RA 3565 PUV KL 44»« L’OITIPTL PO LE 3565 20I1:I3.Í 30-12REGISTER 4521 30-122010:14.3 E&UMINE REQUEST LE 3565 MI 4522 ,10-122010; CIISUNLL 3565 CHECK KE EL 4524 06-012010:10 TICKET LE 3565 DECIDE SA 4525 ■06-01201 N 3565 REINITIAT SA 4526 06-012011:12.1 EXAMINE E M 3565 SE 4527 08-01201J: THOROUG AN 3565 CHECK PIL 4530 €9-012011:11.4 DECIDE TICKET SA E 3565 4531 201 RA . 15-01PAY HI I5FI COMPEIIS PE FE 3565 201 06-01REGISTER 4641 REQUEST 3565 2011:15,0 07-01CHCCK TE MI 4643 08-QI2011:12 TWUNUIK' LICKEL LE 35& SC 54Ủ AN 35(1 2GLL;K4 09-1)1- THOROUG DECIDE SAM 5464 201 3505 12-01REJECT EL 4(47 RCQUCSL LE 3565 2011:15.4 4)6-01- REGISTER KL 4711 REQUEST LE 3565 201 07-01EXAMINE MI 4712 UH-NI2011:10,1 CUMJ UL PEL KE 35654 CLTECK 71-L 201 111 LICKEL T 35& 10-01DCCIDC SAR 547I 2011:13.2 A 3565 1-1)1REIIIILI SAR 4716 14-01 201 JIE A 3565 CHECK KL 471 -2011:14. LICKEL LE .HI 100 41MJ 200 2IM) . . 50 41H) 100 200 2U0 400 100 200 21HJ 50 100 400 2M) 200 SO 400 (H) 200 2WJ 1(H) Discovery techniques can be used to find a control-flow model (in this case in Performance information (forexample, the average time between two subsequent activities) can be BPMN) that describes the observed behavior best. extracted from the event log and visualized on topofthe model. Hình 2.6: Quản trị quan hệ khách hàng Trong thời đại cạnh tranh khốc liệt ngày nói chung, đặc biệt ngành ngân hàng nói riêng, khách hàng luôn nhân tố quan ữọng định tồn phát triển họ. Khai phá liệu hữu ích tất ba giai đoạn chu kỳ mối quan hệ khách hàng: Tìm kiếm khách hàng, tăng giá trị khách hàng trì khách hàng. Quản lý quan hệ khách hàng cung cấp hệ thống đáng tin cậy, giúp quản lý khách hàng nhân viên, cải thiện mối quan hệ nhân viên với khách hàng. Một sách quan hệ khách hàng hợp lý bao gồm chiến lược đào tạo nhân viên, điều chỉnh phương pháp kinh doanh áp dụng hệ thống công nghệ thông tin phù hợp. Quan hệ khách hàng không đơn phần mềm hay công nghệ mà chiến lược kinh doanh bao gồm chiến lược tiếp thị, đào tạo dịch yụ mà doanh nghiệp cung ứng tới khách hàng. Doanh nghiệp lựa chọn giải pháp quan hệ khách hàng họp lý dựa tiêu chí đặt khách hàng vị trí trung tâm, quan tâm tới nhu càu khách hàng nhằm đạt mục đích trì mối quan hệ tốt với khách hàng đạt lọi nhuận tối đa kinh doanh. 2.3.5. Phân tích liệu tài (Financial Data Analysis) Dữ liệu tài ngân hàng ngành tài c hính nói chung thường đáng tin cậy có chất lượng cao, tạo điều kiện cho khai phá liệu. Dưới số ứng dụng điển hình khai phá liệu tài chính: + Dự đoán khả vay toán khách hàng, phân tích sách tín dụng khách hàng. + Phân tích hành vi khách hàng (vay, gửi tiền). + Phân loại phân nhóm khách hàng mục tiêu cho tiếp thị tàichính. + Phát hoạt động rửa tiền tội phạm tài khác. 2.3.6. Phát xâm nhập bất hợp pháp (Intrusion Detection) Xâm nhập bất họp pháp hành động đe dọa tính toàn vẹn, bảo mật tính sẵn sàng tài nguyên mạng. Trong giới kết nối, bảo mật trở thành vấn đề lớn đối vói tồn hệ thống. Với phát triển internet sẵn có công cụ, thủ thuật trợ giúp cho xâm nhập công mạng, yêu cầu kiểm soát truy cập bất họp pháp yếu tố quan trọng đảm bảo cho ổn định hệ thống. Dưới số ứng dụng khai phá liệu áp dụng để phát xâm nhập: + Phát triển thuật toán khai phá liệu để phát xâm nhập. + Phân tích kết họp, tương quan khác biệt để phát xâm nhập. + Phân tích dòng liệu liệu (Analysis of Stream data) để phát bất thường. Theo kết thăm dò Kdnuggets (www.knuggets.com), khai phá liệu ứng dụng thành công ừong lĩnh vực ngân hàng. CHƯƠNG 3: ỨNG DỤNG KHAI PHÁ DỮ LIỆU ĐẺ PHÂN LOẠI KHÁCH HÀNG 3.1. Quy trình tín dụng 3.1.1. Khái niệm quy trình tín dụng Để chuẩn hoá trình tiếp xúc, phân tích, cho vay thu nợ khách hàng, ngân hàng thường đặt quy trình phân tích tín dụng. Đó bước (hoặc nội dung công việc) mà cán tín dụng, phòng ban có liên quan ngân hàng phải thực làm việc cho khách hàng. 3.1.2. Ý nghĩa quy trình tín dụng Việc thiết lập quy trình tín dụng không ngừng hoàn thiện đặc biệt quan ttọng ngân hàng thương mại. mặt hiệu quả, quy trình tín dụng hợp lý giúp cho ngân hàng nâng cao chất lượng tín dụng giảm thiểu rủi ro tín dụng. mặt quản lý, quy trình tín dụng có tác dụng: + Làm sở cho việc phân định quyền, trách nhiệm cho phận hoạt động tín dụng. + Làm sở để thiết lập hồ sơ, thủ tục vay vốn. 3.1.3. Quy trình tín dụng Bước 1: Lập hồ sơ vay vốn Bước cán tín dụng thực sau tiếp xúc khách hàng. Nhìn chung hồ sơ vay vốn cần phải thu thập thông tin như: + Năng lực pháp lý, lực hành vi dân khách hàng. + Khả sử dụng vốn vay. + Khả hoàn trả nợ vay (vốn vay y lãi). Bước 2: Phân tích tín dụng Phân tích tín dụng xác định khả tương lai khách hàngtrong việc sử dụng vốn vay hoàn trả nợ vay với mục tiêu: + Tìm kiếm tình xảy dẫn đến rủi ro cho ngân hàng, dự đoán khả khắc phục rủi ro đó, dự kiến biện pháp giảm thiểu rủi ro hạn chế tổn thất cho ngân hàng. + Phân tích tính chân thật thông tin thu thập từ phía khách hàng bước 1, từ nhận xét thái độ, thiện chí khách hàng làm sở cho việc định cho vay. Bước 3: Ra định tín dụng Trong khâu này, ngân hàng định đồng ý từ chối cho vay hồ sơ vay vốn khách hàng. Bước 4: Giải ngân Nguyên tắc giải ngân: phải gắn liền vận động tiền tệ vói vận động hàng hóa dịch vụ có liên quan, nhằm kiểm ữa mục đích sử dụng vốn vay khách hàng đảm bảo khả thu nợ. Bước 5: Giám sát tín dụng Nhân viên tín dụng thường xuyên kiểm ưa việc sử dụng vốn vay thực tế khách hàng, trạng tài sản đảm bảo, tình hình tài khách hàng . để đảm bảo khả thu nợ. Bước 6: Thanh lý hợp đồng tín dụng. 3.1.4. Thử nghiệm dự đoán rủi ro tín dụng Để nghiên cứu việc ứng dụng khai phá liệu dự đoán rủi ro tín dụng, sử dụng tập liệu ngẫu nhiên gồm: 32 000 khoản vay khứ sau ngày đáo hạn. Những thông tin khoản vay sử dụng để khai phá liệu gồm: + Loại hình doanh nghiệp khách hàng. + Địa khách hàng. + Thành phàn kinh tế. + Ngành kinh tế. + Đánh giá khách hàng. + Khách hàng chiến lược ngân hàng. 43 + Khách hàng có quan hệ với nhiều tổ chức túi dụng. + Sản phẩm khoản vay. + Thời hạn khoản vay. + Loại đồng tiền khoản vay. + Số tiền xin vay. + Mục đích vay vốn. + Khoản vay tuần hoàn. + Hình thức bảo đảm. + Phần trăm tài sản bảo đảm cho khoản vay. + Nhóm tài sản bảo đảm. + Chi nhánh cho vay. Sau sử dụng kỹ thuật khai phá liệu thu 1400 luật. Trong có luật sau: + Nếu [...]... hệ khách hàng không những là một công nghệ mà còn là một chi n lược kinh doanh, trong đó bao gồm cả quản lý phòng ngừa rủi ro tín dụng Tại ngân hàng thương mại cổ phần Ngoại thương chi nhánh Việt Trì, có bài toán đặt ra là: Để phòng ngừa rủi ro cho vay tín dụng, các chuyên gia ngân hàng thu thập các thông tin của khách hàng vay vốn, phân tích và đánh giá các thông tin này để quyết định xem khách hàng. .. + Cây quyết định (Decision Tree) Các kỹ thuật phân lớp sử dụng cây quyết định để phân tách các dữ liệu cho đến khi mỗi phần chứa đựng hầu hết các mẫu từ một lớp đặc trưng, kết quả của quá trình sẽ cho ra một cây quyết định Điểm phân tách trong cây quyết định là một nút (không phải là nút lá) sẽ sử dụng một số điều kiện để quyết định dữ liệu được phân tách như thế nào Các nút cuối cùng trong cây quyết. .. mang lại lợi nhuận và khách hàng nào không mang lại lợi nhuận Marketing: Xác định các nhóm khách hàng (khách hàng tiềm năng, khách hàng giá trị, phân loại và dự đoán hành vi khách hàng, ) sử dụng sản phẩm hay dịch vụ của ngân hàng để giúp chi nhánh có chi n lược kinh doanh hiệu quả hơn 2.3.2 Quản lý rủi ro Hàng ngày, ngân hàng tiếp nhận nhiều thông tin từ nhiều nguồn khác nhau, vì thế kho dữ liệu ngày... lĩnh vực ngân hàng 2.3.1 Marketing Một trong những lĩnh vực được ứng dụng rộng rãi nhất cho ngành ngân hàng của kỹ thuật khai phá dữ liệu đó là lĩnh vực quảng bá sản phẩm Bộ phận tiếp thị và bán hàng của các ngân hàng có thể sử dụng kỹ thuật khai phá dữ liệu để phân tích cơ sở dữ liệu về khách hàng Kỹ thuật khai thác dữ liệu cũng giúp xác định khách hàng nào sẽ mang lại lợi nhuận và khách hàng nào... quá phức tạp để có thể hiểu được + Thẩm định một mô hình bằng các kiểm tra thống kê + Cây quyết định có thể xử lý tốt một lượng dữ liệu lớn trong thời gian ngắn Có thể dùng máy tính cá nhân để phân tích các lượng dữ liệu lớn trong một thời gian đủ ngắn để cho phép các nhà chi n lược đưa ra quyết định dựa trên phân tích của cây quyết định + Khả năng sinh ra các quy tắc hiểu được Cây quyết định có khả... yếu từ các phần tử của cùng một lớp Lựa chọn thuộc tính để tạo nhánh thông qua Entropy và Gain Học bằng cây quyết định cũng là một phương pháp thông dụng trong khai phá dữ liệu Khi đó, cây quyết định mô tả một cấu trúc cây, trong đó, các lá đại diện cho các phân loại còn cành đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó Một cây quyết định có thể được học bằng cách chia tập hợp nguồn... tiêu chuẩn phân chia (splitting criteria) trên cây quyết định: mỗi nhánh tương ứng vói từng phân tách tập dữ liệu theo giá tri của thuộc tính được chọn để phát triển tại nút đó Các thuộc tính liên tục cũng dễ dàng phân chia bằng việc chọn ra một số gọi là ngưỡng ưong tập các giá trị đã sắp xếp của thuộc tính đó Sau khi chọn được ngưỡng tốt nhất, tập dữ liệu phân chia theo test nhị phân của ngưỡng đó... tệ, các công vụ phái sinh, dịch vụ thẻ, ngân hàng điện tử Trong một vài năm gần đây nền kinh tế của các nước cũng như ở Việt Nam đang bị suy thoái, đặc biệt là ngành ngân hàng, khách hàng luôn luôn là nhân tố quan trọng quyết định sự tồn tài và phát triển của họ Dựa vào hệ thống quản lý quan hệ khách hàng, ngân hàng có thể thu thập được các thông tin của khách hàng như thông tin về tài khoản, nhu cầu,... độ, của ngày hôm nay và các ngày trước đó Hay nhờ các luật về xu hướng mua hàng của khách hàng trong siêu thị, các nhân viên kinh doanh có thể ra những quyết sách đúng đắn về lượng mặt hàng cũng như chủng loại bày bán Một mô hình dự đoán có thể dự đoán được lượng tiền tiêu dùng của các khách hàng tiềm năng dựa trên những thông tín về thu nhập và nghề nghiệp của khách hàng Trong những năm qua, phân. .. sự ổn định và phát triển của kinh tế đất nước, phát huy tốt vai ữò của một ngân hàng đối ngoại chủ lực, phục yụ hiệu quả cho phát triển kinh tế ừong nước, đồng thời tạo những ảnh hưởng quan trọng đối vói cộng đồng tài chính khu vực và toàn cầu Ngày 22/09/2011, đã khai trương hoạt động chi nhánh Vietcombank Việt Trì, tỉnh Phú Thọ Đây là chi nhánh thứ 76 trong hệ thống và là chi nhánh đầu tiên của Vietcombank . quyết định để phân loại khách hàng của ngân hàng thương mại cổ phần Ngoại thương, em đã chọn đề tài “ủng dụng cây quyết định để phân lom khách hàng vay vốn của Ngân 5 hàng thương mại cổ phần Ngoại. CÔNG NGHỆ THÔNG TIN ■ NGUYỄN VIỆT DŨNG ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LOẠI KHÁCH HÀNG VAY VỐN CỦA NGÂN HÀNG TMCP NGOẠI THƯƠNG CHI NHÁNH VIỆT TRÌ KHÓA LUẬN TÓT NGHIỆP ĐẠI HỌC • • • • Chuyên. dựng ứng dụng cây quyết định để phân loại khách hàng vay vốn của ngân hàng thương mại cổ phần Ngoại thương, chi nhánh Việt Trì. 3. Đối tượngvà phạm vi nghiền cứu Đối tượng nghiên cứu của khóa luận