1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng xử lý dữ liệu với SPSS hồ thanh trí

97 431 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

XỬ LÝ DỮ LIỆU VỚI SPSS Hồ Thanh Trí THANG ĐO ĐỊNH DANH(NOMINAL SCALE)     Là loại thang đo mà số đo dùng để xếp loại Dùng cho liệu định tính Có thể gán ký tự,trị số…để mã hóa liệu Các số ý nghĩa lượng CÁC DẠNG CÂU HỎI CỦA THANG ĐO ĐỊNH DANH Câu hỏi nhiều lựa chọn THANG ĐO THỨ BẬC(ORDINAL SCALE)       Là loại thang đo số đo dùng để so sánh thứ tự Dùng cho liệu định tính Không đo lường chênh lệch thứ bậc Không có ý nghĩa lượng Có thể gán ký tự,trị số….để mã hóa liệu Các mã số không mang ý nghĩa THANG ĐO THỨ BẬC(ORDINAL SCALE) TIẾNG VIỆT THEO UNICODE  EditOptionsGeneralMục Character Encoding for Data and Syntax click chọn UnicodeOk TIẾNG VIỆT THEO UNICODE TIẾNG VIỆT THEO UNICODE LÀM SẠCH DỮ LIỆU  Xác định giá trị vô nghĩa:giá trị khác với giá trị mã hóa  Xác định giá trị khuyết:câu hỏi câu trả lời  Xác định mối quan hệ không logic câu trả lời LÀM SẠCH DỮ LIỆU  Bước 1: lập bảng tần số biến,để tìm số liệu bất thường AnalyzeDescriptive StatisticsFrequencies  Bước 2: Xắp xếp liệu theo biến bất thường.Chú ý quan trọng : Click trỏ vào cột biến có số liệu bất thường.Sau dùng lệnh: DataSort Cases(từ lớn đến nhỏ ngược lại)  Bước 3: kiểm tra chỉnh sửa số liệu Đề xuất mô hình xếp hạng tín dụng cá nhân cho Ngân hàng TMCP Sài Gòn  Mô hình đảm bảo tất hệ số hồi quy tìm mô hình có ý nghĩa Trong mô hình tượng đa cộng tuyến biến thunhap tietkiem (đã loại khỏi mô hình biến tietkiem ý nghĩa thống kê có số Sig lớn 0.744)  Ta nhận thấy tiêu thống kê mức độ phù hợp mô hình, mức độ xác dự báo mô hình vượt trội nhất, thích hợp cho mô hình XHTD Vì vậy, tác giả xin đề xuất mô hình mô hình XHTD cá nhân cho Ngân hàng TMCP Sài Gòn Tiến hành phân tích nhận xét mô hình 2: Độ phù hợp mô hình 2:  Kết kiểm định giả thuyết độ phù hợp tổng quát Bảng 2.15 có mức ý nghĩa quan sát (Sig OB = 0.00 < α) nên an toàn ta bác bỏ giả thuyết: H0: β2 = β2 = β4 = β5 = β7 = β10 = β11 = β12 = β13 = β14 = β15 =0 Bảng 2.15: Omnibus Tests of Model Coefficients Step Chi-square df Sig Step 82.629 0.000 Block 82.629 0.000 Model 82.629 0.000 Bảng 2.16 cho thấy giá trị – 2LL = 74.668 không cao lắm, thể độ phù hợp tốt mô hình tổng thể Bảng 2.16: Model Summary Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 74.688a 0.403 0.644 a Estimation terminated at iteration number because parameter estimates changed by less than 001 Mức độ xác dự báo Mức độ xác dự báo thể qua bảng Classification Table (Bảng 2.17) Bảng 2.17: Classification Tablea Predicted Khả trả nợ Observed Step Khả trả nợ Không có khả trả nợ Có khả trả nợ Overall Percentage Không có khả trả nợ Có khả trả nợ Percentage Correct 21 10 67.7 124 96.1 90.6 a The cut value is 500 Bảng cho thấy 26 trường hợp thực tế không trả nợ mô hình dự đoán trúng 21 trường hợp, tỷ lệ trúng 67.7% Còn 134 trường hợp thưc tế có trả nợ mô hình dự đoán sai 10 trường hợp, tỷ lệ trúng 96.1% Từ ta tính tỷ lệ dự đoán toàn mô hình 90.6% Kiểm định ý nghĩa hệ số hồi quy tổng thể Bảng 2.18: Variables in the Equation Step 1a B S.E Wald df Sig Gioitinh 704 750 880 348 Tuoi 084 048 3.084 079 TĐHV -1.277 751 2.890 089 TCCV -1.993 745 7.149 008 Honnhan 2.683 1.189 5.095 024 TTNO -.260 786 110 740 Thoigianlamviec -.023 013 3.407 065 Songuoiphuthuoc -.690 455 2.302 129 LichsuTD -.483 762 402 526 Sodichvu 1.449 610 5.641 018 Thunhap 672 343 3.834 050 Tietkiem -.141 431 106 744 Tienvay -.014 003 17.191 000 Taisan 004 001 9.589 002 TLNTTS 10.727 3.540 9.181 002 Kiểm định Wald ý nghĩa cũa hệ số hồi quy tổng thể biến tuổi, tính chất công việc, hôn nhân, thời gian làm việc, số dịch vụ, thu nhập, tiền vay, tài sản, tỷ lệ dư nợ vay tổng giá trị tài sản có mức ý nghĩa sig nhỏ 0.05 nên ta an toàn bác bỏ giả thuyết H0: β2 = β2 = β4 = β5 = β7 = β10 = β11 = β12 = β13 = β14 = β15 = Như vậy, hệ số hồi quy tìm có ý nghĩa mô hình đưa sử dụng tốt Từ hệ số hồi quy ta viết phương trình 𝑃 ( 𝑌 = 1) Log e [ ] 𝑃 ( 𝑌=0 ) = - 8.793 + 0.097 tuoi – 1.259 TCCV + 1.259 honnhan – 0.020 thoigianlamviec + 1.138 sodichvu + 0.585 thunhap – 0.013 tienvay + 0.003 taisan + 8.193 TLNTTS (1.1) Có thể diễn dịch ý nghĩa hệ số hồi quy Binary Logistic là: Hệ số hồi quy Tuổi (Tuoi): hệ số Tuổi làm tăng khả trả nợ khách hàng Điều lý giải thực tế ngân hàng e ngại cho khách hàng trẻ vay sợ rủi ro, cho khách hàng lớn tuổi vay rủi ro Tính chất công việc (TCCV): hệ số tính chất công việc lớn (khách hàng khả trả nợ cao Trên thực tế, biến tính chất công việc tác giả phân loại thành nhóm: Cấp quản lý; cấp chuyên viên hay kinh doanh có đăng ký; lao động đào tạo, công nhân, kinh doanh tự do; lao động thời vụ, thất nghiệp, nghỉ hưu Điều cho thấy khách hàng có địa vị, chức vụ hay khách hàng kinh doanh có đăng ký thường có công việc mức thu nhập ổn định có khả trả nợ cao hai nhóm tính chất công việc lại  Tình trạng hôn nhân (Honnhan): kết kiểm định mô hình cho thấy khách hàng lập gia đình có rủi ro có nhiều uy tín tín dụng, họ có trách nhiệm người độc thân Một yếu tố khác làm cho người lập gia đình có nhiều uy tín tín dụng thu nhập gấp đôi  Thời gian làm công việc (Thoigianlamviec): hệ số thời gian làm việc cao có khả trả nợ Khi có thâm niên công việc tại, thường có thu nhập cao  Số dịch vụ sử dụng (Sodichvu): khách hàng sử dụng nhiều dịch vụ ngân hàng chứng tỏ khách hàng có mối quan hệ thân thiết uy tín với ngân hàng  Thu nhập hàng tháng (Thunhap): hệ số thu nhập cao khả trả nợ cao tăng theo tỷ lệ tương ứng với mức thu nhập Thu nhập thường sử dụng đại diện cho giàu có tài khả trả nợ người vay (Đinh & Kleimeier, 2007)  Số tiền vay (Tienvay): khoản vay tăng, khả trả nợ khách giảm  Giá trị tài sản (Taisan): tài sản chấp hình thức đảm bảo cho khoản vay khách hàng Đặc biệt, khoản vay sử dụng tài sản chấp nhà ở, xác suất không trả nợ thấp người vay không muốn nhà họ đồng thời tài sản chấp làm giảm rủi ro ngân hàng Giá trị tài sản chấp nói lên giàu có tài khách hàng có mối tương quan đáng kể với thu nhập khách hàng vay (Đinh & Kleimeier, 2007)  Tỷ lệ nợ tổng tài sản (TLNTTS): kết kiểm định mô hình cho thấy tỷ lệ nợ tổng tài sản cao khả trả nợ cao (trái dấu với giả thuyết) Điều giải thích, giá trị tài sản chấp nói lên giàu có tài khách hàng có mối tương quan đáng kể với thu nhập khách hàng vay (Đinh & Kleimeier, 2007) nên khách hàng có giá trị tài sản chấp mức thu nhập cao nhu cầu chi tiêu tiêu dùng đời sống xã hội cao nên họ thường vay ngân hàng với số tiền vay lớn cho mục đích tiêu dùng khác (sửa chữa, mua nhà, mua ôtô, bổ sung vốn kinh doanh….), làm cho tỷ lệ nợ tổng tài sản cao Tổng giá trị tài sản cao người vay có trách nhiệm với khoản vay thiện chí trả nợ cao  Ta hoàn thiện hệ thống đánh giá xếp hạng tín dụng cá nhân dựa dự đoán xác suất thực thông qua hàm hồi quy Binary Logistic ước lượng từ mẫu  Năm hạng mức tín nhiệm đưa A, A1, B, B1, C dựa loại khách hàng mà ngân hàng TMCP Sài Gòn áp dụng, tương ứng với xác suất trả nợ theo bảng sau: Bảng 2.19: Tiêu chuẩn phân bổ cá thể theo mức rủi ro Loại Xếp hạng tín nhiệm Xác suất trả nợ (%) Mức độ rủi ro A 91 – 100 Rất thấp A1 90 – 75 Thấp B 74 – 65 Trung Bình B1 64 – 35 Cao C 34 – Rất cao Vận dụng mô hình Binary Logistic cho mục đích dự báo Ví dụ: Chấm điểm xếp hạng tín dụng cá nhân Khách hàng Nguyễn Văn A (Kết xếp hạng A1, điểm tín dụng 315 điểm) Bảng 2.20: Thông tin xếp hạng khách hàng Nguyễn Văn A Chỉ tiêu Thông tin Hệ số Hằng số Tuổi 42 0.097 -8.739 Tính chất công việc -1.259 Hôn nhân 1.909 125 -0.02 Số dịch vụ 1.138 Thu nhập 11 0.585 Tiền vay 173 -0.013 Tài sản 709 0.003 0.2434 8.193 Thời gian làm việc Tỷ lệ nợ tổng tài sản  Xác suất trả nợ khách hàng Nguyễn Văn A là: E(Y/X)= 𝑒 −8.739+0.097∗42−1.259∗2+1.909∗1−0.02∗125+1.138∗1+0.585∗11−0.013∗173+0.003∗709+8.193∗0.2434 1+𝑒 −8.739+0.097∗42−1.259∗2+1.909∗1−0.02∗125+1.138∗1+0.585∗11−0.013∗173+0.003∗709+8.193∗0.2434 = 5.318 1+5.318 = 0.8417 Như vậy, mô hình Binary Logistic dự đoán khả trả nợ khách hàng Nguyễn Văn A 84.17% Theo quy định bảng 2.18 xác suất trả nợ khách hàng tương ứng với mức rủi ro A1 phù hợp với mức xếp hạng liệu Như vậy, ngân hàng cho khách hàng Nguyễn Văn A vay khả thu hồi nợ cao Khách hàng Nguyễn Thị B (Kết xếp hạng B, điểm tín dụng 285 điểm) Bảng 2.21: Thông tin xếp hạng khách hàng Nguyễn Thị B Chỉ tiêu Thông tin Hệ số Tuổi 48 0.097 Tính chất công việc -1.259 Hôn nhân 1.909 Thời gian làm việc 128 -0.02 Số dịch vụ 1.138 Thu nhập 0.585 Tiền vay 60 -0.013 Tài sản 130 0.003 Hằng số -8.739 TỷXác trả tài nợsản khách hàng 0.4604 Nguyễn Thị B8.193 là: lệ nợ suất tổng E(Y/X) = 𝑒 −8.739+0.097∗48−1.259∗3+1.909∗1−0.02∗128+1.138∗1+0.585∗8−0.013∗60+0.003∗130+8.193∗0.4604 1+𝑒 −8.739+0.097∗48−1.259∗3+1.909∗1−0.02∗128+1.138∗1+0.585∗8−0.013∗60+0.003∗130+8.193∗0.4604 1.992 = = 0.6658 1+1.992 Như vậy, mô hình Binary Logistic dự đoán khả trả nợ khách hàng Nguyễn Văn A 66.58% Theo quy định bảng 2.18 xác suất trả nợ khách hàng tương ứng với mức rủi ro B phù hợp với mức xếp hạng liệu Như vậy, ngân hàng cho khách hàng Nguyễn Văn A vay khả thu hồi nợ cao THANKS [...]... do cộng dồn NHẬP LIỆU VỚI CÂU HỎI NHIỀU LỰA CHỌN  Bạn cho biết các loại điện thoại di động mà bạn đã sử dụng qua  Nokia  Samsung  Motorola  Iphone  Mobel  ……  Có thể lựa chọn nhiều hơn 1 phương án làm sao để nhập dữ liệu được? NHẬP LIỆU VỚI CÂU HỎI NHIỀU LỰA CHỌN  Vào cửa sổ Variable view  click chọn thuộc tính value của biến cần khai báo.(kiểm tra số lựa chọn) THỐNG KÊ VỚI CÂU HỎI NHIỀU... Response  Define Variable set THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN  Analyze  Multiple Response  Frequencies THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN KẾT QUẢ THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN (PHÂN TÍCH 2 BIẾN)  Analyze  Multiple Response  Crosstabs THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN (PHÂN TÍCH 2 BIẾN) KẾT QUẢ ĐỔ BẢNG MÔ TẢ VỚI BIẾN ĐỊNH LƯỢNG  Analyze  Descriptive... VỚI BIẾN ĐỊNH LƯỢNG ĐỔ BẢNG MÔ TẢ BIẾN ĐỊNH LƯỢNG (BIẾN PHỤ THUỘC) TRONG MỐI QUAN HỆ VỚI CÁC BIẾN ĐỊNH TÍNH KHÁC (BIẾN ĐỘC LẬP)  Chọn công cụ Compare Means / Means THỐNG KÊ MÔ TẢ VỚI CUSTOM TABLES Vào AnalyzeTablesCustom Tables HÌNH THÀNH CÁC BẢNG BIỂU HÌNH THÀNH CÁC BẢNG BIỂU THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN  Analyze  Tables  Multipe Response THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN THỐNG KÊ VỚI... THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN THỐNG KÊ VỚI CÂU HỎI NHIỀU LỰA CHỌN  Sau đó quay trở về bảng Custom Table và thực hiện bình thường với biến vừa tạo HỒI QUY TUYẾN TÍNH(REGRESSION)  Áp dụng trong trường hợp biến phụ thuộc là biến định lượng  AnalyzeRegressionLinear HỒI QUY(REGRESSION)

Ngày đăng: 20/05/2016, 22:23

Xem thêm: Bài giảng xử lý dữ liệu với SPSS hồ thanh trí

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN