MƠ HÌNH NGUY CƠ THEO Tỷ Lệ

Một phần của tài liệu (LUẬN văn THẠC sĩ) phương pháp phân tích sự kiện dùng đánh giá các biến động trong quá trình học tập của sinh viên trường đại học thủy lợi hà nội (Trang 26)

2.1 Giới thiệu về mơ hình nguy cơ theo tỷ lệ 2.1.1 Giới thiệu

Trong chương trước chúng ta đã được biết đến phân tích sống sót và các mơ hình tham số, phi tham số của nó. Mơ hình phi tham số thì có ước lượng Kaplan – Meier, mơ hình tham số thì có kiểm định Log – rank, cịn một loại mơ hình bao gồm cả tham số và phi tham số hay gọi là mơ hình bán tham số đó là “Cox model” hay “the Cox proportional hazards model”, ta dịch là mơ hình Cox (hay mơ hình nguy cơ theo tỷ lệ (Cox PHM hay Coxph).

Mơ hình này sẽ giúp chúng ta sẽ đi tìm hiểu hai vấn đề:

• Kết hợp các biến số liên tục vào phân tích sự tồn tại của đối tượng. • Phân tích tác động của các biến đến sự tồn tại.

2.1.2 Tác giả mơ hình Cox

David Roxbee Cox là nhà thống kê người Anh. Ông sinh ngày 15 tháng 7 năm 1924. Cox nghiên cứu toán học tại trường Cao đẳng St John, Cambridge, là tiến sĩ năm 1949 từ Đại học Leeds, sau đó là Giáo sư thống kê tại Brikbeck College London.

Ơng đã có những đóng góp tiên phong và quan trọng trong lĩnh vực thống kê và xác suất ứng dụng, trong đó nổi tiếng nhất là mơ hình tỷ lệ nguy cở, được sử dụng rộng rãi trong việc phân tích các dữ liệu tồn tại.

Ơng đã có hơn 300 bài báo hay cuốn sách về một loạt các chủ đề, đã tư vấn cho chính phủ, đã được phong tước là hiệp sĩ vì những đóng góp cho khoa học, và ông nhận được nhiều học bổng cùng giải thưởng khoa học.

Vào giữa khoảng thập niên 1970s, David R. Cox, giáo sư thống kê học thuộc Đại học Imperial College (London, Anh) phát triển một phương pháp phân tích dựa vào mơ hình hồi quy và bảng sống. Phương pháp phân tích này sau này được gọi là Mơ hình Cox. Mơ hình Cox được đánh giá là một trong những phát triển quan trọng nhất của khoa học nói chung trong thế kỉ 20. Bài viết của ông giới thiệu tỷ lệ nguy

cơ và suy luận cho nó, các mơ hình hồi quy và bảng sống, (1972, JRStat.Soc.B), đã được trích dẫn hơn 12.000 lần, theo google học giả.

2.1.3 Mơ hình Cox

Với 𝑋 là biến nguy cơ (hay biến giải thích),có thể liên tục hay khơng liên tục. Mơ hình Cox phát biểu rằng :

𝑕 𝑡, 𝑋 = 𝑕0 𝑡 . exp⁡(𝛽𝑇𝑋)

𝑕 𝑡, 𝑋 là hàm nguy cơ tại thời điểm 𝑡, 𝑕0(𝑡) là hàm nguy cơ bản tại thời điểm 𝑡, 𝛽là hệ số nguy cơ liên quan tới 𝑋.

Đây là Cox PHM. Vẻ đẹp của mơ hình này, theo quan sát của Cox là nếu ta sử dụng mơ hình mẫu này, và ta quan tâm đến những ảnh hưởng của biến trên sự tồn tại, thì ta khơng cần phải xác định các hình dạng của 𝑕0(𝑡). Cịn nếu khơng làm như vậy thì ta phải ước lượng 𝛽. Cox PHM là như vậy, nó gọi là mơ hình bán tham số.

Để xem lý do tại sao nó được gọi là Cox PHM, hãy xem xét hai đối tượng với các biến số tương ứng là 𝑋1, 𝑋2. Khi đó tỷ lệ nguy cơ của họ tại thời điểm 𝑡 là :

𝑕 𝑡, 𝑋1 𝑕 𝑡, 𝑋2 = 𝑕0 𝑡 . exp⁡(𝛽𝑇𝑋1) 𝑕0 𝑡 . exp⁡(𝛽𝑇𝑋2)= exp⁡(𝛽𝑇𝑋1) exp⁡(𝛽𝑇𝑋2)= exp 𝛽(𝑥1− 𝑥2)

Tức là 𝑕 𝑡, 𝑋1 tỷ lệ thuận với 𝑕 𝑡, 𝑋2 và tỷ lệ các hàm nguy cơ là không phụ thuộc vào thời gian. Nguy cơ của đối tượng có biến𝑋1 là exp 𝛽(𝑥1 − 𝑥2) lần nguy cơ của đối tượng có biến 𝑋2. Còn exp 𝛽(𝑥1 − 𝑥2) được gọi là tỷ lệ nguy cơ giữa 𝑋1, 𝑋2.

Nếu 𝛽 = 0 thì tỷ lệ nguy cơ giữa các biến là 1, tức là các biến khơng ảnh hưởng đến sự sống cịn. Do đó chúng ta có thể sử dụng khái niệm về tỷ lệ nguy cơ để kiểm tra nếu biến số ảnh hưởng sống còn.

Tuy nhiên lưu ý rằng đây là một mơ hình đó có thể là sai. Có thể có một tương tác giữa biến số và thời gian.

Ta đi xem xét hàm nguy cơ theo tỷ lệ trong các trường hợp sau : • Một biến liên tục;

• Hai biến số liên tục; a. Một biến đơn liên tục

𝑕 𝑡, 𝑥 = 𝑕0 𝑡 . exp⁡(⁡𝛽𝑥)

Và hàm nguy cơ theo tỷ lệ cho hai đối tượng với hai biến 𝑥1, 𝑥2là exp 𝛽(𝑥1 − 𝑥2) . Nếu 𝑥1 = 𝑥 + 1, 𝑥2 = 𝑥 thì tỷ lệ nguy cơ

𝑕 𝑡, 𝑥1

𝑕 𝑡, 𝑥2 = 𝑒𝛽 → log

𝑕 𝑡, 𝑥1

𝑕 𝑡, 𝑥2 = 𝛽

Do đó chúng ta có thể giải thích β như sự gia tăng trong 𝑙𝑜𝑔 của tỷ lệ nguy cơ. Ví dụ : Tuổi của người nghiện ma túy. Cho 𝑥𝑖 là tuổi của đối tượng nghiện ma túy i khi bắt đầu kiểm duyệt và tỷ lệ nguy hiểm là:

𝑕 𝑡, 𝑥 = 𝑕0 𝑡 . exp⁡(⁡−0,013𝑥)

Như vậy, tỷ lệ nguy cơ về tuổi của người nghiện ma túy qua mỗi năm gấp

𝑒−0,013 = 0,99.

b. Hai biến số liên tục

Cho hai biến độc lập (𝑥1, 𝑥2) ∈ ℝ2 (𝑥1, 𝑥2 khơng có sự tương tác), tham số (𝛽1, 𝛽2) ∈ ℝ2, hoặc tham số (𝛽1, 𝛽2, 𝛽12) ∈ ℝ3 nếu có sự tương tác giữa 𝑥1, 𝑥2.

 Khi khơng có sự tương tác

Hàm nguy cơ là 𝑕 𝑡, 𝑥1, 𝑥2 = 𝑕0 𝑡 exp(𝛽1𝑥1 + 𝛽2𝑥2) và Tỷ lệ nguy cơ của hai đối tượng với các biến (𝑥11, 𝑥1), (𝑥22 , 𝑥2) :

exp{𝛽1(𝑥1 − 𝑥2)}

Tăng 𝑥1 lên một đơn vị, giữ cố định 𝑥2 = 𝑥1 ta có tỷ lệ nguy cơ là exp 𝛽1. Ngược lại ta có exp 𝛽1.

 Khi có sự tương tác, hàm nguy cơ

𝑕 𝑡, 𝑥1, 𝑥2 = 𝑕0 𝑡 exp 𝛽1𝑥1 + 𝛽2𝑥2 + 𝛽12𝑥1𝑥2 . 2.1.4 Hàm sống sót của Cox PHM Ta đã biết rằng 𝑕 𝑡 = 𝑓(𝑡) 𝑆(𝑡) Mà 𝑓(𝑡) 𝑆(𝑡) = − 𝑑 𝑑𝑡log 𝑆(𝑡) → 𝑆 𝑡 = exp⁡ − 𝑕(𝑢)𝑑𝑢𝑡 0

Tổng quát cho Cox PHM ta có 𝑆 𝑡, 𝑥 = exp − 𝑕0 𝑢 exp 𝛽𝑇𝑥 𝑑𝑢 𝑡 0 = exp − 𝑕𝑡 0 𝑢 𝑑𝑢 0 exp 𝛽𝑇𝑥 = 𝑆0(𝑡)exp ⁡(𝛽𝑇𝑥) 𝑆0 𝑡 là hàm sống sót ban đầu.

2.1.5 Ƣớc lƣợng các tham số của Cox PHM

Với 𝛿𝑖 = 1 nếu đối tượng 𝑖 không bị kiểm duyệt, 𝛿𝑖 = 0 nếu đối tượng 𝑖 là kiểm duyệt phải, 𝑖 = 1,2, … , 𝑚, khi đó ta có mơ hình hàm hợp lý tổng qt với tham số 𝛼, 𝛽 như sau:

𝑓 𝑡 𝛽, 𝑥 = 𝑕 𝑡𝑖 𝛽, 𝑥 𝛿𝑖𝑆 𝑡𝑖 𝛽, 𝑥 𝑚

𝑖=1 Cụ thể, đối với Cox PHM chúng ta có

𝑓 𝑡 𝛽, 𝑥 = 𝑕 𝑡𝑖 𝛽, 𝑥 𝛿𝑖𝑆 𝑡𝑖 𝛽, 𝑥 𝑚 𝑖=1 = 𝑕0 𝑡𝑖 𝛿𝑖exp 𝛽𝑇𝑥 𝛿𝑖𝑆0(𝑡𝑖)exp ⁡(𝛽𝑇𝑥) 𝑚 𝑖=1 log 𝑓 𝑡 𝛽, 𝑥 = 𝛿𝑖log 𝑕0 𝑡𝑖 + 𝑚 𝑖=1 𝛿𝑖𝛽𝑇𝑥 + exp 𝛽𝑇𝑥 log 𝑆0(𝑡𝑖)

Chúng ta khơng thể cực đại hóa hàm này khi khơng có dạng xác định hàm nguy cơ ban đầu. Do đó ta sẽ xem xét hàm hợp lý từng phần. Ở đây chúng taxác định tập nguy cơ ℛ(𝑡) là tập của tất cả các đối tượng 𝑖 với 𝑡𝑖 > 𝑡 tức là những người đã không chết hoặc đã qua kiểm duyệt.

Nếu thời gian sống sót liên tục, chúng ta có thể hy vọng rằng tại bất kỳ điểm nào trong thời gian, chỉ có một đối tượng có thể ngay lập tức thất bại. Tuy nhiên, vì hầu hết các quan sát là trong thực tế nên có khoảng thời gian bị kiểm duyệt.

2.2 Hàm hợp lý từng phần

Ta ký hiệu 𝜓𝑖 = exp 𝛽𝑇𝑥𝑖 (đây là ký hiệu từ Collett, 1994, p. 64), 𝜓𝑖là tỷ lệ thuận với tỷ lệ nguy hiểm cho đối tượng 𝑖. Hàm hợp lý từng phần cho 𝛽 là

ℒ𝑝 𝛽, 𝑥 = 𝜓𝑖 𝜓𝑗 𝑗 ∈ℛ(𝑡𝑖) 𝛿𝑖 𝑚 𝑖=1

𝛿𝑖 có nghĩa rằng ta chỉ xem xét sự đóng góp từ cái chết, số lần thất bại, khơng từ số lần kiểm duyệt phải. Tử số là tỷ lệ thuận với nguy hiểm cho đối tượng 𝑖, một trong đó đã thất bại tại thời điểm 𝑡𝑖. Mẫu số là tỷ lệ thuận với tổng số nguy cơ của tất cả các đối tượng (bao gồm đối tượng 𝑖) có nguy cơ thất bại tại thời điểm 𝑡𝑖. Vì vậy, phân số được xem như là xác suất đối tượng 𝑖 so với một vài đối tượng khác thất bại tại thời điểm 𝑡𝑖.

Có hai lý do tại sao nó là hợp lý từng phần: • Nó khơng phải là hợp lý tồn phần cho 𝛽;

• Nó khơng thực sự sử dụng các dữ liệu đầy đủ: thực tế thời gian xảy ra sự kiện là không quan trọng, chỉ xếp hạng của họ. Nếu đối tượng 𝑖, 𝑗 và 𝑘 thất bại tương ứng ở lần 1, 2 và 3, điều này sẽ cung cấp cho các ước lượng tham số tương tự như nếu họ đã thất bại ở lần 100, 300, 1500, tương ứng.

Vì thế, ít mạnh mẽ hơn một mơ hình đầy đủ tham số. Tuy nhiên, nó địi hỏi giả định ít hơn và như vậy là mạnh hơn.

2.2.2 Hàm hợp lý từng phần cho lần thất bại lặp đi lặp lại

Trường hợp khi hai hoặc nhiều đối tượng được ghi nhận là thất bại ở cùng thời gian là phức tạp hơn. Hàm hợp lý từng phần chính xác cho 𝛽 được xem xét cuối cùng.

Đầu tiên xem xét hai lần xấp xỉ. Các ký hiệu sẽ được đơn giản nhất nếu chúng ta sử dụng các ký hiệu sau đây:

 𝑡(𝑖) là đặt thời gian thất bại duy nhất thứ 𝑖 (ví dụ nếu bốn thất bại xảy ra tại lần 1, 1, 3, 3 thì 𝑡 1 = 1, 𝑡 2 = 3;

 𝐼 là tổng số thời gian thất bại duy nhất;

 𝒟(𝑡) là tập các đối tượng thất bại tại thời gian 𝑡. Có ba phương pháp xác định hàm hợp lý từng phận:

1) Phương pháp Breslow

ℒ𝑝 𝛽, 𝑥 = 𝑗 ∈𝒟(𝑡 𝑖 )𝜓𝑗

( 𝑗 ∈ℛ(𝑡(𝑖))𝜓𝑗) 𝒟(𝑡(𝑖))

𝐼

𝑖=1

𝒟(𝑡(𝑖)) là số các đối tượng thất bại tại thời gian 𝑡(𝑖). Phương pháp Breslow là mặc định cho nhiều phần mềm thống kê như SAS. Nhưng nó khơng là mặc định cho R. R sử dụng hàm hợp lý từng phần của Efron, vì nó được coi là một xấp xỉ với một hợp lý từng phần chính xác. Hàm hợp lý từng phần chính xác yêu cầu thời gian là liên tục, các mối quan hệ là một kết quả đo khơng chính xác thời gian.

2) Phương pháp Efron: ℒ𝑝 𝛽, 𝑥 = 𝑗 ∈𝒟(𝑡 𝑖 )𝜓𝑗 𝜓𝑗 − 𝒟(𝑡𝑘−1 (𝑖)) 𝑗 ∈𝒟(𝑡 𝑖 )𝜓𝑗) 𝑗 ∈ℛ(𝑡(𝑖)) 𝒟(𝑡(𝑖)) 𝑘=1 𝐼 𝑖=1

3) Phương pháp chính xác (Exact method):

ℒ𝑝 𝛽, 𝑥 = 𝑗 ∈𝒟(𝑡 𝑖 )𝜓𝑗 Φ𝑞

𝑞∈𝒬𝑖

𝐼

𝑖=1

Trong đó 𝒬𝑖 là tập tất cả 𝒟(𝑡(𝑖)) - bộ dữ liệu có thể được lựa chọn từ ℛ(𝑡(𝑖)) và Φ𝑞 là tích của 𝜓𝑗 với tất cả các 𝑗 của 𝒟(𝑡(𝑖)) – dữ liệu 𝑞.

Ví dụ

Giả sử các đối tượng có nhãn từ 1đến 5 là có nguy cơ tại thời điểm 𝑡(𝑖) trong ℛ(𝑡(𝑖)), trong số đó, các đối tượng từ 1 đến 3 thất bại tại thời điểm 𝑡(𝑖). Khi đó, hàm hợp lý từng phần của từng phương pháp có dang

Phương pháp Breslow

𝜓1𝜓2𝜓3

(𝜓1 + 𝜓2 + 𝜓3 + 𝜓4 + 𝜓5)3 Phương pháp Efron đưa ra

𝜓1𝜓2𝜓3

(𝜓1+ 𝜓2 + 𝜓3+ 𝜓4 + 𝜓5) 32𝜓1+23𝜓2 +23𝜓3+ 𝜓4 + 𝜓5 13𝜓1+31𝜓2+13𝜓3+ 𝜓4+ 𝜓5

𝜓1𝜓2𝜓3

𝜓1𝜓2𝜓3 + 𝜓1𝜓2𝜓4 + 𝜓1𝜓2𝜓5 + ⋯ + 𝜓3𝜓4𝜓5

Ta có thể thấy rằng các phương pháp chính xác nhanh chóng trở nên tính tốn chun sau khi có một số lượng lớn các mối quan hệ.

2.3 Ƣớc lƣợng các tham số

Ba phương pháp của hàm hợp lý tồn phần mơ tả ở trên là khá khó khăn để phù hợp với phân tích. May mắn thay, một phần mềm có thể làm điều đó cho chúng ta, đó là R. R sử dụng phương pháp Newton-Raphson để ước tính các tham số. Đây là một phương pháp thường không hội tụ tới ước lượng hợp lý cực đại. Bởi vì nó khơng ln ln thành cơng, nó là giá trị có một cái nhìn tổng quan của phương pháp.

Phương pháp Newton-Raphson là xác định, lặp đi lặp lại thủ tục. Nó xác định bởi vì khơng có yếu tố ngẫu nhiên trong việc tìm kiếm các phương án tối ưu. Nó được lặp đi lặp lại bởi vì nó bao gồm một loạt các bước lặp, với dự toán (hy vọng) nhận được tốt hơn ở mỗi lần lặp.

Nói chung, nếu chúng ta có một véc tơ tham số 𝜃 của kích thước 𝑝 và muốn tìm 𝜃 ta cực đại hóa hàm 𝑙 𝜃 = 𝑙𝑜𝑔 (hàm hợp lý) (đăng nhập hàm hợp lý), thuật toán là: 1. Cho 𝑘 = 0. 2. Chọn 𝜃(𝑘) bất kì. 3. Giải 𝐼 𝜃 𝑘 𝜃(𝑘+1)− 𝜃(𝑘) = 𝑈(𝜃(𝑘)) cho 𝜃(𝑘+1) 4. Tăng 𝑘 lên một.

5. Quay lại bước 3 và lặp lại cho đến khi hội tụ. Ở đây ta đã sử dụng các ký hiệu :

 𝜃(𝑘) là giá trị của tham số tại lần lặp 𝑘.  Hàm 𝑈 𝜃 = 𝜕𝑙(𝜃) 𝜕𝜃1 , … , 𝜕𝑙(𝜃) 𝜕𝜃𝑝  Ma trận thông tin

𝐼 𝜃 = − 𝜕2𝑙(𝜃) 𝜕𝜃12 ⋯ 𝜕2𝑙(𝜃) 𝜕𝜃1𝜕𝜃𝑝 ⋮ ⋱ ⋮ 𝜕2𝑙(𝜃) 𝜕𝜃𝑝𝜕𝜃1 ⋯ 𝜕2𝑙(𝜃) 𝜕𝜃𝑝2  𝜃𝑞 là phần tử thứ 𝑞 của 𝜃. Lưu ý:

 Mặc dù chọn 𝜃(0) là bất kì, hơn nữa nó từ 𝜃 , ít khả năng cho thuật toán là hội tụ về𝜃 .

 𝑙(𝜃) có thể được thay thế bởi log ℒ𝑝(𝜃)

 Trong trường hợp Cox PHM, chúng ta có thể viết 𝛽 thay vì 𝜃. Ví dụ:

Xem xét một biến 𝑥𝑖 liên tục, ứng với đối tượng 𝑖. Chúng ta có 9 đối tượng mắc bệnh đau tim; 𝑡𝑖 là thời gian chết của đối tượng 𝑖 trong thời gian theo dõi mắc bệnh, tính bằng ngày. Dữ liệu là: 𝑖 𝑡𝑖 𝑥𝑖 1 6 31.4 2 98 21.5 3 189 27.1 4 374 22.7 5 1002 35.7 6 1205 30.7 7 2065 26.5 8 2201 28.3 9 2421 27.9

Để phù hợp với mơ hình 𝑕 𝑡, 𝑥𝑖 = 𝑕0(𝑡)𝑒𝛽 𝑥𝑖 với các dữ liệu sử dụng hợp lý tối đa. Khơng có mối quan hệ trong thời gian tồn tại, vì vậy chúng tơi có thể sử dụng 𝑙𝑜𝑔 hàm hợp lý từng phần đơn giản nhất. 𝑙 𝛽 = 𝛽 𝑥𝑖 − log 𝑒𝛽𝑥𝑗 𝑗 ∈ℛ(𝑡(𝑖)) 9 𝑖=1 9 𝑖=1

𝑑𝑙 𝛽 𝑑𝛽 = 𝑥𝑖 − 𝑥𝑗𝑒𝛽𝑥𝑗 𝑗 ∈ℛ 𝑡 𝑖 𝑒𝛽𝑥𝑗 𝑗 ∈ℛ 𝑡 𝑖 9 𝑖=1 9 𝑖=1 𝑑2𝑙(𝛽) 𝑑𝛽2 = − 𝑥𝑗 2𝑒𝛽𝑥𝑗 𝑗 ∈ℛ(𝑡(𝑖)) 𝑒𝛽𝑥𝑗 𝑗 ∈ℛ(𝑡(𝑖)) − 𝑥𝑗𝑒𝛽𝑥𝑗 𝑗 ∈ℛ(𝑡(𝑖)) 2 𝑒𝛽𝑥𝑗 𝑗 ∈ℛ(𝑡(𝑖)) 2 9 𝑖=1

Mặc dù nhìn phức tạp nhưng chúng ta có thể dễ dàng tính tốn chúng khi cho giá trị cụ thể của 𝛽. Nếu ta cho 𝑈 𝛽 = 𝑑𝑙(𝛽)/𝑑𝛽 và 𝐼 𝛽 = 𝑑2𝑙(𝛽)/𝑑𝛽2, công thức

Newton-Raphson đơn giản là

𝛽(𝑘+1)− 𝛽 𝑘 = 𝑈(𝛽 𝑘 )/𝐼(𝛽(𝑘)) Cho 𝛽(0) = 0, ta có 𝑈 0 = −2.51; 𝐼 0 = 77.13. Khi đó 𝛽 1 = 𝛽 0 +𝑈 𝛽 0 𝐼 𝛽 0 = 0 − 2.51 77.13 = −0.0326 𝛽 2 = 𝛽 1 +𝑈 𝛽 1 𝐼 𝛽 1 = −0.0326 −0.069 72.83= −0.0335 𝛽 3 = 𝛽 2 +𝑈 𝛽 2 𝐼 𝛽 2 = −0.0335 −0.000061 72.70 = −0.0335 = 𝛽(2)

Chúng ta có thể dừng lại ở đây nếu mức độ chính xác là đủ. Phương pháp này hiệu quả nếu giá trị bắt đầu được đủ gần đến mục tiêu giá trị. Cịn nếu khơng, nó có thể dẫn đến nhảy lớn cách xa mục tiêu giá trị. Để hạn chế điều đó, chúng ta có thể thay đổi bước

𝐼 𝜃 𝑘 𝜃(𝑘+1)− 𝜃(𝑘) = 𝜉𝑈(𝜃(𝑘))

Với 𝜉 < 1 nhằm hạn chế kích thước của bước nhảy. Điều này làm tăng số lần lặp cần thiết để đạt được giá trị mục tiêu.

2.4 Kiểm định giả thuyết cho PHM

Có ba cách kiểm tra thường được sử dụng để giải bài toán kiểm định giả thuyết

𝐻0: 𝛽 = 0 𝐻1: 𝛽 ≠ 0 Cho mơ hình 𝑕 𝑡, 𝑥𝑖 = 𝑕0 𝑡 exp(𝛽𝑥𝑖)

 Kiểm định Wald là

𝑧2 = 𝛽 2

𝑉 (𝛽 ) = 𝛽 2𝐼(𝛽 )

Nếu 𝐻0 đúng, 𝑧2~ 𝜒12. Giá trị lớn nhất của 𝑧2 chịu sự thay thế của giả thuyết  Các số liệu thống kê (the score test statistic) là

(𝑧∗)2 = 𝑈 0 2𝐼(𝛽 )−1 𝑈 0 = 𝜕𝑙(𝜃) 𝜕𝜃1 , … , 𝜕𝑙(𝜃) 𝜕𝜃𝑝 (0) Nếu (𝑧∗)2~𝜒12 thì 𝐻0 là đúng.

 Tỷ lệ hợp lý (the likelihood ratio test statistic) là 𝐺 = 2 𝑙 𝛽 − 𝑙(0) Nếu 𝐺~𝜒12 thì 𝐻0 là đúng.

Cả ba cách kiểm tra trên đều đưa ra giá trị 𝑝 (p-values)

Ta không cần sử dụng tất cả ba cách kiểm tra trên, ta trình bày ở đây bởi vì tất cả thường được cung cấp bởi các gói phần mềm. Ta sẽ sử dụng cách kiểm tra tỷ lệ hàm hợp lý vì nó tổng quát hơn và dễ dàng hơn để áp dụng.

Chúng ta xét vectơ 𝛽 có 𝑝 chiều, giả sử khơng mất tính tổng qt, để kiểm tra giả thuyết rằng thành phần đầu tiên 𝑞 (1 ≤ 𝑞 ≤ 𝑝) của 𝛽 là bằng 𝛽𝑗∗ 𝑗 = 0, … , 𝑞 , 𝑝 − 𝑞 thành phần còn lại là tham số tự do. Giả thuyết khác cho rằng ít nhất một trong các 𝑞 tham số không bằng giá trị giả thuyết.

Lưu ý:

• Các trường hợp đặc biệt nêu trên có thể được xảy ra khi 𝑝 = 𝑞 = 1, 𝛽𝑗∗ = 0

Một phần của tài liệu (LUẬN văn THẠC sĩ) phương pháp phân tích sự kiện dùng đánh giá các biến động trong quá trình học tập của sinh viên trường đại học thủy lợi hà nội (Trang 26)

Tải bản đầy đủ (PDF)

(71 trang)