Hồi qui logistic Hồi qui logistic c.

Một phần của tài liệu PHÂN TÍCH dữ LIỆU KINH DOANH đề tài báo cáo LAB 3 (Trang 27 - 32)

 Báo cáo Lab 3 – Nhóm 14  

   Bước 3: TínhBước 3: Tính (( ) ) bằng hàm Minverse trong Excel bằng hàm Minverse trong Excel

 Hình 26: Ma trận  Hình 26: Ma trận ((   )  )    

   Bước 4: TínhBước 4: Tính (( ) )     bằng hàm bằng hàm Mmult troMmult trong Excelng Excel

 Hình 27: Ma trận

 Hình 27: Ma trận (( ) )    

   Bước 5: TínhBước 5: Tính (( ) )     bằng hàm bằng hàm Mmult troMmult trong Excelng Excel

 Hình 28: Ma trận

 Hình 28: Ma trận (( ) )    

   Ta thu được kết quả:Ta thu được kết quả:

Coefficients Coefficients Intercept 0.678821 Intercept 0.678821 Bác Bác sĩ sĩ 0.7859190.785919 Y Y sĩ sĩ 0.2093150.209315    Phương trình:Phương trình: GiuongBenh = 0.678821 + 0.785919*ln(BacSi) +

GiuongBenh = 0.678821 + 0.785919*ln(BacSi) + 0.209315*ln(YSi)0.209315*ln(YSi)

3.

3.   Hồi qui logisticHồi qui logisticc. c.

c.   Định nghĩa:Định nghĩa:

   Phân tích hồi qui logistic là một kỹ thuật thống kê để xem xét mối liên hệPhân tích hồi qui logistic là một kỹ thuật thống kê để xem xét mối liên hệ giữa biến độc lập (biến số hoặc biến

giữa biến độc lập (biến số hoặc biến phân loại) với biến phụ thuộc là biến nhị phân(0phân loại) với biến phụ thuộc là biến nhị phân(0 hoặc 1).

hoặc 1).

  =  =  + +  + ℯ + ℯ  --   Trong đó:Trong đó: --   Trong đó:Trong đó:

+

+  là biến phụ thuộc nhị phân. là biến phụ thuộc nhị phân. +

+  là biến độc lập. là biến độc lập.

d.

d.   Đặt vấn đề:Đặt vấn đề:

--   Khi biến phụ thuộc ở dạng nhị phân thì khơng thể phân tích với dạng hồi quyKhi biến phụ thuộc ở dạng nhị phân thì khơng thể phân tích với dạng hồi quy thơng thường vì sẽ vi phạm các giả định, dễ thấy nhất là khi biến phụ thuộc chỉ thơng thường vì sẽ vi phạm các giả định, dễ thấy nhất là khi biến phụ thuộc chỉ có hai biểu hiện như: Có gia đình/ chưa có gia đình, có việc làm/ thất nghiệp, có hai biểu hiện như: Có gia đình/ chưa có gia đình, có việc làm/ thất nghiệp, hút thuốc/ khơng hút thuốc… thì khơng phù hợp khi giả định rằng phần dư có hút thuốc/ khơng hút thuốc… thì khơng phù hợp khi giả định rằng phần dư có  phân phối c

 phân phối chuẩn, mà huẩn, mà thay vào thay vào đó nó đó nó sẽ có sẽ có phân phối nhị phân phối nhị thức, điều thức, điều này sẽ này sẽ làmlàm mất hiệu lực thống kê của c

mất hiệu lực thống kê của các kiểm định trong phép hồi quy thông thường.ác kiểm định trong phép hồi quy thông thường.

e.

e.   Các bước thực hiệnCác bước thực hiện

--    Nếu gọi P  Nếu gọi P là xác là xác suất để suất để một biến cố một biến cố A xảy A xảy ra, thì 1-p ra, thì 1-p là xác là xác suất để suất để biến cố Abiến cố A không xảy ra, theo luật phân phối nhị thức ta

không xảy ra, theo luật phân phối nhị thức ta được :được : =

= 11 −−  

    Nếu ODDs > 1 xác suất biến cố A xảy ra khả năng cao hơn biến cố đối Nếu ODDs > 1 xác suất biến cố A xảy ra khả năng cao hơn biến cố đối của nó.

của nó.

    Nếu ODDs <1 xác suất biến cố A xảy ra khả năng thấp hơn biến cố đối Nếu ODDs <1 xác suất biến cố A xảy ra khả năng thấp hơn biến cố đối của nó.

của nó.

    Nếu ODDs = 1 xác suất biến cố A xảy ra khả năng bằng biến cố đối của Nếu ODDs = 1 xác suất biến cố A xảy ra khả năng bằng biến cố đối của nó

--   Từ chỉ số ODDs, ta được Từ chỉ số ODDs, ta được phương trình hồi quy logistic như sau :phương trình hồi quy logistic như sau : log

 Báo cáo Lab 3 – Nhóm 14  Báo cáo Lab 3 – Nhóm 14  

Trong đó : Trong đó :

+

+    là lolà log p1-p g p1-p của biến của biến phụ thphụ thuộc khi uộc khi x =0x =0 +

+  là log(odds ratio) liên quan đến 1 đơn vị tăng  là log(odds ratio) liên quan đến 1 đơn vị tăng của xcủa x

--   Từ phương trình này, ta có thể tính xác suấTừ phương trình này, ta có thể tính xác suất tiên đốn P theo trị số của t tiên đoán P theo trị số của x.x. 

11−−  ==          == 11+ +             == 11+ +           

f.

f.   Ví dụ minh họa : Graduate School SurveyVí dụ minh họa : Graduate School Survey

--   Bộ dữ liệu có các thơng tin khảo sáBộ dữ liệu có các thơng tin khảo sát bao gồm :t bao gồm :

o

o   Gender : giới tính ( 1: Nam , 0 : Gender : giới tính ( 1: Nam , 0 : Nữ)Nữ)

o

o   Married : Tình trạng hơn nhân ( 1: Đã Married : Tình trạng hơn nhân ( 1: Đã kết hôn, 2: Chưa kết hôn)kết hôn, 2: Chưa kết hơn)

o

o   Undergraduate GPA : Điểm trung bình tích lũy khi chưa tốt nghiệp đạiUndergraduate GPA : Điểm trung bình tích lũy khi chưa tốt nghiệp đại học

học

o

o   Plan to attend graduate school : Có dự định học bậc sau đại học ( 1: Có,Plan to attend graduate school : Có dự định học bậc sau đại học ( 1: Có, 0: Không)

0: Không) Gender

Gender Married Married UndergraduateUndergraduate GPA

GPA Plan to attendPlan to attendgraduategraduate school school 1 1 1 1 2.9 2.9 11 1 1 1 1 3.1 3.1 11 1 1 0 0 3 3 00 1 1 0 0 3.5 3.5 11 1 1 0 0 3.2 3.2 11

 Báo cáo Lab 3 – Nhóm 14  Báo cáo Lab 3 – Nhóm 14  

1 1 1 1 3.7 3.7 11 1 1 0 0 2.8 2.8 00 1 1 1 1 2.6 2.6 11 1 1 1 1 3.3 3.3 00 1 1 0 0 3.3 3.3 11 1 1 0 0 3.5 3.5 11 1 1 1 1 3.2 3.2 00 1 1 0 0 2.9 2.9 11 1 1 0 0 4 4 11 1 1 1 1 4 4 11 0 0 0 0 3.6 3.6 11 0 0 0 0 3.3 3.3 11 0 0 1 1 2.9 2.9 11 0 0 0 0 3.4 3.4 11 0 0 1 1 3 3 00 0 0 1 1 3.2 3.2 00 0 0 0 0 4 4 11 0 0 1 1 3 3 00 0 0 1 1 2.5 2.5 00 0 0 1 1 4 4 11 0 0 0 0 4 4 11 0 0 1 1 2.7 2.7 00 0 0 0 0 3.7 3.7 11 0 0 1 1 3.2 3.2 00 0 0 1 1 2.8 2.8 00

 Bảng 2. Dữ liệu của Graduate School Survey

 Bảng 2. Dữ liệu của Graduate School Survey

Trong đó : Trong đó :

 Báo cáo Lab 3 – Nhóm 14  Báo cáo Lab 3 – Nhóm 14  

--   Biến độc lập : Gender, Married, Undergraduate GPABiến độc lập : Gender, Married, Undergraduate GPA --   Biến phụ Biến phụ thuộc: thuộc: Plan to attPlan to attend graduate school.end graduate school.

   Câu hỏi đặt raCâu hỏi đặt ra : Các biến trong khảo sát :  : Các biến trong khảo sát : giới tính (Gender), tình trạng hơn nhângiới tính (Gender), tình trạng hơn nhân ( Married),

( Married), điểm trung bình tđiểm trung bình tích lũy khi ích lũy khi chưa tốt nghiệp đại chưa tốt nghiệp đại học (Undergraduatehọc (Undergraduate GPA

GPA)) có liên quan như thế nào vcó liên quan như thế nào với dự định học bậc sau đại ới dự định học bậc sau đại học?học?  

  Cần tìm ra mức độ ảnh hưởng, liên quan giữa các biến độc lập (Gender, Married,Cần tìm ra mức độ ảnh hưởng, liên quan giữa các biến độc lập (Gender, Married, Undergraduate GPA) tới biến phụ thuộc ( Plan to a

Undergraduate GPA) tới biến phụ thuộc ( Plan to attend graduate school)ttend graduate school)

--   Vì biến phụ thuộc (Plan to attend graduate scVì biến phụ thuộc (Plan to attend graduate school) là một biến nhị phân hool) là một biến nhị phân nhận giánhận giá trị 1 cho việc có dự đị

trị 1 cho việc có dự định học sau đại học nh học sau đại học và 0 người khơng có dự định và 0 người khơng có dự định nên chúngnên chúng ta khơng thể áp dụng mơ hình hồi quy tuyến tính ( mơ hình hồi quy tuyến tính ta khơng thể áp dụng mơ hình hồi quy tuyến tính ( mơ hình hồi quy tuyến tính áp dụng cho các biến phụ thuộc

áp dụng cho các biến phụ thuộc là biến liên tục).là biến liên tục).

  Để tìm mối liên hệ giữa biến phụ thuộc và biến độc lập trong trường hợp nàyĐể tìm mối liên hệ giữa biến phụ thuộc và biến độc lập trong trường hợp này chúng ta sử dụng mơ hình hồi quy logistic.

chúng ta sử dụng mơ hình hồi quy logistic.

   Tiến hành phân tíchTiến hành phân tích

Gọi Y là dự định học bậc

Gọi Y là dự định học bậc sau đại họcsau đại học Y = 1: Có dự định học bậc

Y = 1: Có dự định học bậc sau đại họcsau đại học

Y = 0 : Khơng có dự định học bậc sau đại học Y = 0 : Khơng có dự định học bậc sau đại học Gọi p là xác xuất một người có

Gọi p là xác xuất một người có dự định học bậc sau đại học. dự định học bậc sau đại học. Ta có p = Pr( Y Ta có p = Pr( Y = 1).= 1).

Odds là khả năng của một người có dự định học bậc sau đại học được định nghĩa bằng tỉ Odds là khả năng của một người có dự định học bậc sau đại học được định nghĩa bằng tỉ số xác suất một người có dự địn

số xác suất một người có dự định học bậc sau đại học trên xác suất một người h học bậc sau đại học trên xác suất một người khơng cókhơng có dự định học bậc sau đại học. Ta có:

Một phần của tài liệu PHÂN TÍCH dữ LIỆU KINH DOANH đề tài báo cáo LAB 3 (Trang 27 - 32)