1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu kỹ thuật thống kê Hồi quy Logistic

23 168 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 23
Dung lượng 1,27 MB

Nội dung

Báo cáo trình bày về mô hình hồi quy logistic. Nội dung chính bao gồm: Lý thuyết về mô hình hồi quy logistic như khái niệm, mục đích sử dụng, cách kiểm định giả thuyết, ưu điểm nhược điểm; Hướng dẫn thực hành mẫu với phần mềm SPSS và phân tích kết quả thu được.

BÁO CÁO TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC CHƯƠNG 3 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC LÝ THUYẾT MƠ HÌNH HỒI QUY LOGISTIC 1.1 Khái niệm Hồi quy logistic phương pháp thống kê để phân tích tập liệu có nhiều biến độc lập xác định kết Kết đo biến nhị phân (trong có hai kết xảy ra) 4 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Trên thực tế, có nhiều tượng tự nhiên, tượng kinh tế, xã hội,…mà cần dự đốn khả xảy nó: chiến dịch quảng cáo có chấp nhận hay khơng, người vay có trả nợ hay khơng, cơng ty có phá sản hay khơng, khách hàng có mua sản phẩm hay khơng,… Những biến nghiên cứu có biểu mã hóa thành giá trị (được gọi biến nhị phân) Khi biến phụ thuộc dạng nhị phân khơng thể phân tích dạng hồi quy thơng thường vi phạm giả định, dễ thấy biến phụ thuộc có biểu thị khơng phù hợp giả định phần dư có phân phối chuẩn, mà thay vào có phân phối nhị thức, điều làm hiệu lực thống kê kiểm định phép hồi quy thông thường Hồi quy logistic hoạt động giống với hồi quy tuyến tính, với biến phản ứng nhị thức Ưu điểm lớn so sánh với Mantel-Haenszel OR sử dụng biến giải thích liên tục việc xử lý đồng thời nhiều hai biến giải thích dễ dàng Hồi quy logistic mơ hình hóa hội kết dựa đặc điểm cá nhân Bởi kết tỷ lệ, mơ hình hóa thực logarit kết đưa bởi: log ( π1 - π) =β0+ β1x1+ β2x2+ βmxm Trong π xác suất kiện β i hệ số hồi quy liên quan đến nhóm tham chiếu biến giải thích xi Tại thời điểm này, khái niệm quan trọng phải làm bật Nhóm tham chiếu, biểu thị β0, tạo thành cá nhân trình bày mức tham chiếu biến x m  Phương trình hồi quy Binary Logistic: Trong hồi quy tuyến tính đơn, biến độc lập Xi phụ thuộc Y biến số liên tục liên hệ qua phương trình: Trong hồi quy Logistic, biến phụ thuộc Y có trạng thái Muốn đổi biến số liên tục người ta tính xác suất trạng thái Nếu gọi P xác suất để biến cố xảy ra, 1-P xác suất để biến cố khơng xảy Phương trình hồi quy Logistic phát biểu: Trong đó: TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC P(Y=1) = P0: Xác suất xảy kiện P(Y=0) = 1- P0: Xác suất xảy kiện Xi: Các biến độc lập  Ý nghĩa: Giả định X1: số năm học chủ hộ (năm); hệ số hồi quy B1 = 0.308 Nếu chủ hộ gia đình tăng thêm năm học, với điều kiện yếu tố khác khơng đổi, Log tỷ lệ xác suất cải thiện thu nhập so với xác suất không cải thu nhập tăng thêm 0.308 lần Cách giải thích khơng rõ nghĩa lắm, phân tích kinh tế có cách giải thích thay sau; Đặt P0: Xác suất ban đầu; P1: Xác suất thay đổi P1 tính theo cơng thức sau: Khi B = 0.308; P0 = 10%; e = 2.714 vào tính P1 kết sau: Như vậy, chủ hộ gia đình tăng thêm năm học, xác suất cải thiện thu nhập hộ tăng lên 13.1% tức tăng thêm 3.1% so với xác suất ban đầu 10% Khái quát: Khi yếu tố Xk tăng lên đơn vị xác suất cải thiện thu nhập hộ gia đình chuyển dịch từ P0 sang P1  Tham số tỷ số nguy (Odds Ratio - OR) Chỉ số thống kê quan trọng hồi qui Logistics tỷ số nguy (Odds Ratio – OR) Trong tiếng anh odd có nghĩa nguy hay khả Nói cách khác odd tỷ số giá trị biến nhị phân Do đó, OR tỷ số hai odds Ví dụ : Bảng liệu thu thập để nghiên mối tương quan tình trạng phơi nhiễm chất độc gia cam (Agent Orange – AO) ung thư tuyến tiền liệt Phơi nhiễm AO Ung thư (47) Đối chứng (144) 11 17 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Không phơi nhiễm AO 36 127 Trong bảng liệu trên, ta có: odd mắc ung thư nhóm phơi nhiễm AO 11/17 = 0.647 odd mắc ung thư nhóm khơng bị phơi nhiễm AO 36/127 = 0.283 Và Odds Ratio (OR) mắc ung thư nhóm bị phơi nhiễm AO so với nhóm không bị phơi nhiễm 0.647/0.283= 2.28 Thực tính OR đơn giản = (11x127)/(36x17) = 2.28 OR = 2.28 cho biết nguy mắc ung thư tuyến tiền liệt người phơi nhiễm AO cao gấp 2.8 lần người không bị phơi nhiễm AO 1.2 Mục đích sử dụng Nhằm giải thích mối quan hệ biến nhị phân phụ thuộc nhiều biến độc lập danh nghĩa, thứ tự, khoảng tỷ lệ độc lập Nghiên cứu mối tương quan (hay nhiều) yếu tố nguy (risk factor) đối tượng phân tích (outcome) Chẳn hạn nghiên cứu mối tương quan thói quen hút thuốc nguy mắc ung thư phổi yếu tố nguy thói quen hút thuốc đối tượng phân tích nguy mắc ung thư phổi Trong hồi qui logistic đối tượng nghiên cứu thường thể qua biến số nhị phân (binary) xảy ra/ khơng xảy ra; chết/sống; có/khơng,… cịn yếu tố nguy thể qua biến số liên tục (tuổi, huyết áp,…) biến nhị phân (giới tính) hay biến thứ bậc (thu nhập : Cao, trung bình, thấp) Vấn đề đặt cho nghiên cứu dạng là để ước tính độ tương quan yếu tố nguy đối tượng phân tích Các phương pháp phân tích hồi qui tuyến tích khơng áp dụng biến phụ thuộc biến liên tục mà biến nhị phân Nhà thống kê học David R Cox phát triển mơ hình có tên Logistic Regression Model (1970s) để phân tích biến nhị phân 1.3 Các lưu ý sử dụng Trong hồi qui logistic đối tượng nghiên cứu thường thể qua biến số nhị phân (binary) xảy ra/ khơng xảy : chết/sống ; có/khơng,… cịn yếu tố nguy thể qua biến số liên tục (tuổi, huyết áp,…) biến nhị phân (giới tính) hay biến thứ bậc (thu nhập: Cao, trung bình, thấp) 7 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Tỷ lệ xác suất sử dụng đồng nghĩa chúng không giống Xác suất tỷ lệ số lượng kiện có lợi cho số kết tổng số kiện Mặt khác, tỷ lệ cược tỷ lệ xác suất: xác suất kiện có lợi cho kết xác suất kiện so với kết tương tự Xác suất bị ràng buộc và tỷ lệ cược bị ràng buộc vô Và tỷ lệ cược tỷ lệ tỷ lệ cược Tầm quan trọng điều tỷ lệ chênh lệch lớn (OR) đại diện cho xác suất nhỏ ngược lại OR lớn có nghĩa hội nhóm cụ thể lớn nhiều so với nhóm tham chiếu Nhưng hội nhóm tham chiếu nhỏ, OR lớn xác suất nhỏ Một vấn đề lớn xây dựng mơ hình logistic chọn biến cần đưa vào Khi nghiên cứu họ thường đưa thật nhiều biến vào sau đưa tất chúng vào mơ hình cố gắng tìm thứ có ý nghĩa Cách tiếp cận làm tăng xuất hai tình Đầu tiên, nhiều biến số có ý nghĩa thống kê mức độ quan trọng, nhà nghiên cứu khơng có lý thuyết để liên kết biến số có ý nghĩa mối quan hệ với kiện mơ hình hóa Tình thứ hai mơ hình có nhiều biến thể sức mạnh thống kê Vì vậy, có mối liên quan biến giải thích xuất kiện, nhà nghiên cứu bỏ lỡ hiệu ứng mơ hình bão hịa (những mơ hình chứa tất biến giải thích có thể) khơng đủ nhạy cảm để phát Vì vậy, phải thận trọng với việc lựa chọn biến để đưa vào mơ hình Phải ý đến việc thiết lập mức tham chiếu Nếu khơng có quy tắc rõ ràng xuất phát từ liệu kiến thức trước giá trị biến, khuyến nghị lại chọn mức tham chiếu với cỡ mẫu tối thiểu, phép công suất thống kê đầy đủ Một khuyến nghị khác giúp việc giải thích dễ dàng chọn danh mục có mối quan hệ với kiện quan tâm Vấn đề đặt cho nghiên cứu dạng để ước tính độ tương quan yếu tố nguy đối tượng phân tích Các phương pháp phân tích hồi qui tuyến tích khơng áp dụng biến phụ thuộc biến liên tục mà biến nhị phân 1.4 Cách thức kiểm định giả thuyết Hồi quy Binary Logistic đòi hỏi kiểm định giả thuyết hệ số hồi quy khác Nếu hệ số hồi quy tỷ lệ chênh lệch xác suất 1, tức xác suất để kiện xảy hay không xảy nhau, lúc mơ hình hồi quy vơ dụng việc dự đốn 8 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Trong hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuyết H0 Còn với hồi quy Binary Logistic, đại lượng Wald Chi Square sử dụng để kiểm định ý nghĩa thống kê hệ số hồi quy tổng thể Cách thức sử dụng, mức ý nghĩa Sig cho kiểm định Wald theo quy tắc thông thường Wald Chi Square tính cách lấy ước lượng hệ số hồi quy biến độc lập mơ hình (hệ số hồi quy mẫu) Binary Logistic chia cho sai số chuẩn hệ số hồi quy sau bình phương lên Ở hồi quy Binary Logistic, tổ hợp liên hệ tuyến tính tồn hệ số moo hình ngoại trừ số kiểm định xem có thực có ý nghĩa việc giải thích cho biến phụ thuộc khơng Với hồi quy tuyến tính bội ta dùng thống kê F để kiểm định giả thuyết H0: p1=p1=…=0, với hồi quy Binary Logistic ta dùng kiểm định Chi bình phương Căn vào mức ý nghĩa mà SPSS đưa bảng Omnibus Tests of model Coefficients để định bác bỏ hay chấp nhận H0 1.4.1 Kiểm định hệ số hồi quy Trong kiểm định ta sử dụng kiểm dịnh Wald để kiểm tra xem biến độc lập có ảnh hưởng tới biến phụ thuộc hay nói cách khác hay nói cách khác biến tương quan có ý nghĩa với biến phụ thuộc hay không ? Ta ý vào cột Sig, ta xét giá trị sig với mức ý nghĩa 5%, sig ≥ 0.05 ta loại biến, ngược lại 9 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Ví dụ ta có Biến TNGHIEP có sig = 0.382 > 0.05 Do đó, biến TNGHIEP tương quan khơng có ý nghĩa với biến QDINH Vì ví dụ có thất nghiệp hay khơng, định mua bảo hiểm y tế khơng ảnh hưởng gì, ta mở rộng, khoảng tiền bảo hiểm y tế khơng cao nên phụ hợp với nhiều người, người thất nghiệp (thất nghiệp VN người làm lao động phổ thông, công việc không ổn đinh….) Tiếp, ta xét biến HVAN có sig= 0.00 < 0.005 Do đó, biến HVAN tương quan có ý nghĩa với biến QDINH với độ tin cậy 95% Tương tự với biến lại 1.4.2 Kiểm định mức độ phù hợp mơ hình (Kiểm định Omnibus) a Mức độ dự báo xác Kiểm định mức độ dự báo xác dựa bảng phân loại (Clasification table) SPSS đưa ra, bảng so sánh số trị số thực trị số dự đốn cho biểu tính tỷ lệ dự đoán kiện Theo kết ví dụ trên, người khơng mua 78 người, mơ hình dự báo 67 người nên ta có tỉ lệ dự báo xác 84,8 % 10 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC người mua 122 người mơ hình dự báo 110 tức chiếm 90.9% Và mơ hình dự báo xác 88.5% (Mơ hình cần 50% chấp nhận được, cịn bên sức khỏe cần phải cao hơn) b Mức độ phù hợp mơ hình Đối với kiểm định Omnibus, ta xét sig model 0.00, < 0.01 (với độ tin cậy 99%) Như biến độc lập có quan hệ tuyến tính với biến phụ thuộc tổng thể ngược lại Nói cách khác, mơ hình lựa chọn phù hợp Ngồi kiểm định mức độ giải thích mơ hình cịn cịn thể qua bảng Model Summary Đo lường dựa tiêu -2LL (viết tắt -2 log likelihood) Quy tắc đánh giá độ phù hợp -2LL ngược với quy tắc dựa hệ số xác định mơ hình R bình phương, nghĩa giá trị -2LL nhỏ thể độ phù hợp cao Giá trị nhỏ -2LL (tức khơng có sai số), mơ hình có độ phù hợp hồn hảo 1.4.3 Ước tính khả tối đa Có thể sử dụng gói thống kê để tính tốn ước tính, mơ tả ngắn gọn quy trình Hàm khả cho n viết sai quan sát nhị thức độc lập sản phẩm mật độ đưa phương trình logL(β)=∑{yilog(πi)+(ni−yi)log(1−πi)} Trong πi phụ thuộc vào hiệp phương sai xi vectơ thông số β thơng qua chuyển đổi logit phương trình Tại thời điểm này, thực cơng cụ phái sinh thứ hai dự kiến để có ma trận điểm thông tin phát triển quy trình chấm điểm Fisher để tối đa hóa khả đăng nhập Như thể Phụ lục B, quy trình tương đương với bình phương tối thiểu có trọng số lặp lại (IRLS) Với ước tính β^ thơng số, tính tốn dự đốn tuyến tính η^=x′iβ giá trị trang bị μ^= =logit-1(η) Với giá trị này, tính tốn biến phụ thuộc làm việc z, có yếu tố: zi=η^i+[[(yi−μ^i)/(ni−μ^i)] x ni] 11 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Trong ni mẫu số nhị thức, sau hồi quy z phép tính tính tốn ước lượng bình phương nhỏ có trọng số β^=(X′WX)−1X′Wz Trong W ma trận chéo trọng số với mục wii=μ^i(ni−μ^i)/ni Ước tính kết β sử dụng để thu giá trị phù hợp cải thiện quy trình lặp lại để hội tụ Các giá trị ban đầu phù hợp thu cách áp dụng liên kết đến liệu Để tránh vấn đề với số lượng ni viết sai (mà luôn trường hợp với cá nhân zero-một liệu), chúng tơi tính tốn logits thực nghiệm thêm ½ cho tử số mẫu số zi=log[(yi+1/2)/ (ni−yi+1/2)] sau hồi quy số lượng xi để có ước tính ban đầu β Ước tính kết phù hợp phương sai mẫu lớn đưa var(β^)=(X′WX)−1 Trong w ma trận trọng số đánh giá lần lặp cuối Các lựa chọn thay cho ước tính khả tối đa bao gồm bình phương tối thiểu có trọng số, sử dụng với liệu nhóm phương pháp giảm thiểu thống kê chi bình phương Pearson, sử dụng với liệu nhóm riêng lẻ 1.5 Các số cần quan tâm sử dụng hồi quy logistic Sau lắp mơ hình, có khả nhà nghiên cứu muốn kiểm tra đóng góp yếu tố dự đoán riêng lẻ Để làm vậy, họ muốn kiểm tra hệ số hồi quy Trong hồi quy tuyến tính, hệ số hồi quy đại diện cho thay đổi tiêu chí cho thay đổi đơn vị dự báo Tuy nhiên, hồi quy logistic, hệ số hồi quy đại diện cho thay đổi logit cho thay đổi đơn vị dự báo Cho logit khơng trực quan, nhà nghiên cứu có khả tập trung vào hiệu ứng yếu tố dự đoán hàm số mũ hệ số hồi quy - tỷ lệ chênh lệch Trong hồi quy tuyến tính, tầm quan trọng hệ số hồi quy đánh giá cách tính tốn kiểm tra Trong hồi quy logistic, có số thử nghiệm khác thiết kế để đánh giá tầm quan trọng yếu tố dự đoán riêng lẻ, đáng ý thử nghiệm tỷ lệ khả thống kê Wald 12 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC • Thu nhập hộ gia đình (Thu nhập; làm trịn đến $ 1.000,00 gần nhất) • Giới tính (IsFirting = người nữ, khơng) • Tình trạng nhân (IsMarried = kết hơn, khơng) • Giáo dục đại học (HasCol phe = có nhiều năm học đại học, khơng) • Được tuyển dụng nghề nghiệp (IsProf Professional = tuyển dụng nghề nghiệp, khơng) • Đã nghỉ hưu (IsRetired = nghỉ hưu, khơng) • Khơng tuyển dụng (Thất nghiệp = không tuyển dụng, không) • Thời gian cư trú thành phố (Độ dài; tính năm) • Thu nhập kép kết hôn (Dual = thu nhập kép, khác) • Trẻ em (Trẻ vị thành niên = trẻ em 18 tuổi gia đình, khơng) • Quyền sở hữu nhà (Sở hữu = cư trú riêng, khơng) • Loại cư trú (Nhà = nơi cư trú nhà gia đình, khơng) • Chủng tộc (Trắng = đua màu trắng, khơng) • Ngơn ngữ (Tiếng Anh = ngơn ngữ gia đình tiếng Anh, không) 1.6 Ưu điểm nhược điểm hồi quy logistic 1.6.1 Ưu điểm: Đây kỹ thuật sử dụng rộng rãi hiệu quả, khơng địi hỏi q nhiều tài ngun tính tốn, dễ hiểu, khơng u cầu tính đầu vào phải thu nhỏ, khơng u cầu điều chỉnh, dễ dàng thường xuyên đầu xác suất dự đoán hiệu chuẩn tốt Hồi quy logistic hoạt động tốt bạn loại bỏ thuộc tính không liên quan đến biến đầu thuộc tính giống (tương quan) với Do đó, Engineering Engineering đóng vai trị quan trọng liên quan đến hiệu suất Logistic hồi quy tuyến tính 13 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Do tính đơn giản thực tế thực tương đối dễ dàng nhanh chóng, Logistic Regression sở tốt mà bạn sử dụng để đo hiệu suất Thuật toán phức tạp khác 1.6.2 Nhược điểm: Logistic Regression thuật tốn mạnh có dễ dàng vượt trội thuật toán phức tạp Ngồi ra, khơng thể giải vấn đề phi tuyến tính hồi quy logistic bề mặt định tuyến tính Hồi quy logistic không hoạt động tốt với biến độc lập không tương quan với biến mục tiêu giống tương quan với 14 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC CHƯƠNG THỰC HÀNH MƠ PHỎNG VỚI PHẦN MỀM SPSS 2.1 Mơ hình mẫu nghiên cứu Trong khn khổ báo cáo này, việc phân tích hồi quy logistic thực phần mềm SPSS Mơ hình đưa nghiên cứu ngân hàng nhằm xem xét khả trả nợ cá nhân để định có nên cho họ vay vốn hay không Biến phụ thuộc (TRANO) mang giá trị, biểu ý nghĩa Không trả nợ, biểu ý nghĩa trả nợ Có biến độc lập mơ hình tác động lên biến phụ thuộc (TRANO) gồm: - Trình độ học vấn (HOCVAN) - Độ tuổi (TUOI) - Thu nhập hàng tháng (THUNHAP) – ĐVT: Triệu đồng Với mục đích tìm hiểu cách thức quy trình thực hành kỹ thuật thống kê hồi quy Logistic, nên mô hình nghiên cứu đơn giản hóa mẫu nghiên cứu nhóm đưa ngẫu nghiên, cụ thể gồm 100 quan sát đưa vào phân tích S T T Biến độc lập Trình độ học vấn Cao đẳng Đại học Sau đại học Cao đẳng Đại học Đại học Đại học Biến phụ thuộc Độ tuổi Thu nhập hàng tháng 18 20 30 32 22 25 27 10 30 25 14 19 Trả nợ Không trả nợ Trả nợ Trả nợ Trả nợ Không trả nợ Không trả nợ Trả nợ 15 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC 11 2 2 … THPT Đại học Đại học Đại học THPT Đại học Cao đẳng Sau đại học Đại học Cao đẳng Đại học Đại học THPT Cao đẳng Đại học Đại học Cao đẳng Sau đại học Đại học Đại học Đại học Đại học Cao đẳng … 17 40 20 10 Trả nợ Trả nợ 38 Trả nợ 29 15 Không trả nợ 32 Không trả nợ 31 Không trả nợ 25 12 Không trả nợ 23 14 Trả nợ 22 30 Trả nợ 22 18 Trả nợ 26 22 Không trả nợ 27 13 Trả nợ 19 Không trả nợ 30 Không trả nợ 33 Trả nợ 36 Trả nợ 26 14 Không trả nợ 39 15 Trả nợ 45 19 Không trả nợ 30 Trả nợ 21 21 Trả nợ 18 33 Trả nợ 19 27 Khơng trả nợ … … … 16 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC 2.2 Hướng dẫn thực hành 2.2.1 Tạo biến nhập liệu vào SPSS  Khai báo biến Đầu tiên phải thực việc mã hoá liệu, bao gồm tên biến lựa chọn cho biến trước thực thao tác SPSS Sau thực khai báo vào bảng Variable view Đối với biến phụ thuộc (TRANO) tương ứng với giá trị (0 = “Khơng trả nợ; = trả nợ) Biến Trình độ học vấn (HOCVAN) tương ứng với giá trị từ 1-4 (1 = “THPT”; = “Cao đẳng”; = “Đại học”; = “Sau đại học”) Biến Độ tuổi (TUOI) biến Thu nhập hàng tháng (THUNHAP) tương ứng với giá trị cụ thể dựa thang đo Scale  Nhập số liệu 17 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Sau thực xong bước khai báo tất biến vào SPSS sheet Variable View, chuyển qua làm việc sheet Data View để tiến hành nhập liệu Màn hình Data View sau khai báo biến hình dưới, hàng tên biến mã hố, click vào để chuyển sang Variable View để xem định dạng kiểu mã nhập liệu cho biến Cuối tiến hành nhập số liệu vào SPSS cho biến 2.2.2 Tiến hành chạy phân tích cơng cụ Binary Logistic Mở hộp thoại Logistic Regression cách vào Analyze  Regression  Binary Logistic 18 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Sau đưa biến phụ thuộc TRANO vào mục Dependent Đưa biến độc lập vào mục Covariates Tại mục Save Tích vào Probabilities để đưa dự đoán xác xuất trả nợ 19 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC Tại mục Options Tích hàng Classification plots để đưa biểu đồ phân loại giá trị trả nợ hay Không trả nợ Nhấp vào Continue để quay lại cửa sổ ban đầu Tại mục Method, chọn phương pháp Enter Cuối nhấp vào OK để xuất bảng kết 20 TÌM HIỂU KỸ THUẬT THỐNG KÊ HỒI QUY LOGISTIC 2.3 Phân tích kết Bảng Case Processing Summary cho thông tin mô tả đặc điểm liệu đưa vào phân tích hồi quy nhị phân Cụ thể có 100 quan sát đưa vào phân tích (Included in Analysis), khơng có quan sát bị thiếu số liệu (Missing Cases), khơng có quan sát không chọn (Unselected Cases) Case Processing Summary Unweighted Casesa Included in Analysis Selected Missing Cases Cases Total Unselected Cases Total N Percent 100 100.0 0 100 100.0 100 100.0 Bảng Dependent Variable Encoding cho biết biến phụ thuộc mang hai giá trị “ Khơng trả nợ” mã hóa “ Trả nợ ” mã hóa Dependent Variable Encoding Original Value Internal Value Không trả nợ Trả nợ Bảng Omnibus Tests of Model Coefficients cho kết phân tích hệ số mơ hình Step bước thứ chạy mơ hình Logistic Do dùng phương pháp Enter đưa biến độc lập vào lần nên xuất Step kết thống kê Trường hợp dùng phương pháp khác bảng bảng có thêm Step tùy số lượng biến đưa vào Cột Chi-squre Sig thể kết kiểm định Chi bình phương, kiểm định để xem hệ số hồi quy biến độc lập có đồng thời hay khơng Do sử dụng phương pháp Enter nên giá trị sig Trong trường hơp Sig số 0.000

Ngày đăng: 07/05/2021, 20:53

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w