Sử dụng phương pháp cổ điển

Một phần của tài liệu (LUẬN văn THẠC sĩ) mô hình hồi quy cho biến định tính và ứng dụng (Trang 41 - 44)

2.3 Kiểm tra sự phù hợp của mô hình

2.3.1 Sử dụng phương pháp cổ điển

Xét bài toán kiểm định:

Giả thiết: H0: Mơ hình là phù hợp.

Đối thiết: H1: Mơ hình là khơng phù hợp.

Các phương pháp tiêu chuẩn cho việc đánh giá sự phù hợp của mơ hình tập trung vào độ lệch thống kê. Không giống với các mơ hình trong đó phương sai là một tham số, phương sai của các quan sát nhị thức được xác định bởi giá trị trung bình của chúng và vì vậy độ lệch thống kê thường cung cấp một thống kê “ trung thực” để đánh giá sự phù hợp và so sánh mơ hình.

Độ lệch dùng để đo lường sự phù hợp của một mơ hình hồi quy nhị phân với dữ liệu đã quan sát được cho bởi:

D = 2∑ ̂ ( – )

̂

,

trong đó: ̂i = ni ̂i.

Nếu mơ hình là phù hợp thì độ lệch D tuân theo một phân phối tiệm cận χ2 với n - q bậc tự do, trong đó n là số quan sát nhị thức và q là số chiều của tham số hồi quy. Như vậy, với mức ý nghĩa α, chúng ta bác bỏ giả thiết khi:

D (α).

Tuy nhiên, đối với các quan sát Bernoulli và các trường hợp khác mà cỡ mẫu nhị thức ni là nhỏ thì độ lệch thống kê là khơng thuộc phân phối tiệm cận χ2 .

So sánh hai mơ hình:

Chúng ta xét trường hợp hai mơ hình M1 và M2, trong đó M1 được lồng trong M2, có nghĩa là tất cả các tham số trong mơ hình M1 cũng được bao gồm trong mơ hình M2.

Ta xét bài tốn kiểm định:

Giả thiết K0: Mơ hình M1 là phù hợp hơn mơ hình M2.

Đối thiết K1: Mơ hình M2 là phù hợp hơn mơ hình M1.

Giả sử mơ hình M1 có độ lệch D1với df1 bậc tự do; mơ hình M2 có độ lệch D2 với df2 bậc tự do. Sự sai khác giữa hai giá trị độ lệch: |D1 – D2|được xem như là một biến ngẫu nhiên có phân phối χ2 với df1 – df2 bậc tự do. Khi đó mơ hình M1 sẽ bị loại bỏ nếu sự sai khác giữa hai độ lệch trên là tương đối lớn đối với giá trị được kỳ vọng của phân phối . Như vậy ta bác bỏ giả thiết nếu:

|D1 – D2| (α).

Ví dụ1: Chúng ta xem xét lại dữ liệu của bảng 2.1 (chương 2).

Xét mơ hình:

Log (

) = β0 + β1 × SAT-Mi.

Trong mơ hình logistic được trình bày ở trên, các mức điểm của môn học tiên quyết bị bỏ qua. Tuy nhiên các mức điểm của mơn học này có thể được suy xét một cách hợp lý để dự đốn việc thi đậu lớp học thống kê và vì vậy biến giải thích này cũng có thể được cân nhắc để đưa vào trong bất kỳ mơ hình nào đối với các xác suất thi đậu.

Các mức điểm của môn học tiên quyết có thể được đưa vào trong mơ hình hồi quy logistic với một số cách:

Một khả năng là tạo ra một biến nhân tố trong đó mỗi mức điểm được giả sử là có một ảnh hưởng mà được được ước lượng một cách độc lập. Mơ hình nhân tố này có thể được xác định như sau:

log[pi/(1 – pi)] = { – – – – – .

Một cách khác là sử dụng các mã hóa chuẩn GPA. Nói cách khác, A sẽ được gán giá trị là 4.0; B sẽ được gán giá trị là 3.0; C sẽ được gán giá trị là 2.0; D sẽ được gán giá trị là 1.0 và F thì được gán giá trị là 0. Kí hiệu các giá trị được mã hóa của các mức điểm bởi GRADEi, chúng ta thu được một mơ hình như sau:

log (

) = β0 + β1 SAT-Mi + β2 GRADEi.

Một bảng AOD so sánh ba mơ hình này và mơ hình liên tục khơng có biến giải thích được cung cấp trong Bảng 2.3.

Bảng 2.3 : Bảng phân tích độ lệch đối với dữ liệu thi đậu/ thi trượt.

hình Các biến giải thích Độ lệch D Bậc tự do - Khơng có 36.65 29 (2.14) SAT-M 22.27 28

(2.15) SAT-M, Điểm mơn tiên quyết được mã hóa GPA 21.95 27 (2.16) SAT-M, Điểm môn học tiên quyết được xem như là

biến nhân tố

18.92 24

Để thấy biến SAT-M nên được bao gồm trong mơ hình, chúng ta so sánh các mơ hình SAT và mơ hình liên tục trong bảng trên. Sự sai khác về độ lệch giữa mơ hình liên tục (D1) và mơ hình chỉ bao gồm biến SAT-M (D2) là:

Giá trị 13.38 là có ý nghĩa thống kê đối với biến χ2

có bậc tự do là 1. Như vậy, dựa vào bảng AOD chúng ta kết luận rằng: số điểm SAT-M là không thể bị loại bỏ khỏi mơ hình .

Tiếp theo, chú ý rằng mơ hình (2.14) được lồng trong cả hai mơ hình (2.15) và (2.16) và do đó ta sử dụng kiểm định tỷ số hợp lý để so sánh những mơ hình này . Trong việc so sánh mơ hình (2.14) với mơ hình (2.16), kiểm định thống kê có phân phối xấp xỉ χ2 với 28 – 24 = 4 bậc tự do. Thống kê cho việc so sánh mơ hình (2.14) và mơ hình (2.15) trên danh nghĩa là χ2 với 28-27 =1 bậc tự do. Trong cả hai trường hợp, giá trị của kiểm định thống kê là khơng có ý nghĩa đối với phân phối khi bình phương và do đó mơ hình đơn giản hơn mà chỉ bao gồm biến SAT-M thì được chấp nhận hơn.

Một phần của tài liệu (LUẬN văn THẠC sĩ) mô hình hồi quy cho biến định tính và ứng dụng (Trang 41 - 44)

Tải bản đầy đủ (PDF)

(79 trang)