Giới thiệu
Trong nghiên cứu sinh học và con người, chúng ta thường làm việc với nhiều loại dữ liệu, bao gồm dữ liệu quan sát và dữ liệu có cấu trúc Ví dụ, khi nghiên cứu con người và động vật, các cá thể được nhóm thành gia đình dựa trên hệ thống phân cấp tự nhiên Những cá nhân có cùng cha mẹ thường chia sẻ nhiều đặc điểm về thể chất và tính cách hơn so với những người không cùng cha mẹ Do đó, cá thể trong gia đình là đơn vị cấp một trong cấu trúc hai cấp, với cấp hai là gia đình, hoặc học sinh là đơn vị cấp một với cấp hai là trường Mặc dù các thành viên trong nhóm có thể hoạt động khác nhau, nhưng vẫn tồn tại sự tương tác giữa họ Việc bỏ qua mối quan hệ này có thể dẫn đến việc không nhận thấy tầm quan trọng của tác động nhóm, từ đó gây ra những kết quả không hợp lý khi áp dụng các kỹ thuật phân tích cổ điển trong nghiên cứu mối quan hệ giữa các cá thể.
Hệ thống trường học được tổ chức theo cấu trúc phân cấp, với học sinh được chia thành các lớp học trong trường Các nhà khoa học nghiên cứu thành tích học tập của học sinh nhằm nâng cao chất lượng giáo dục và trách nhiệm chung Họ tiến hành điều tra kết quả học tập cuối năm từ một số trường phổ thông để phân tích mối liên hệ giữa việc giảng dạy các môn học và kết quả học tập Ngoài ra, tiêu chí đánh giá đầu vào của học sinh cũng được xem xét để làm cơ sở phân tích thành tích học tập.
Phương pháp truyền thống để phân tích dữ liệu là phân tích hồi quy, giúp nghiên cứu mối quan hệ giữa việc phân mức hiện tại và thành tích học tập của học sinh thông qua việc sử dụng điểm số.
Mô hình nhiều mức mang lại nhiều ưu điểm cho nghiên cứu, bao gồm khả năng ước lượng chính xác hệ số hồi quy Bằng cách sử dụng thông tin phân mức, mô hình này cải thiện độ chính xác của độ lệch tiêu chuẩn, khoảng tin cậy và tiêu chuẩn kiểm định so với phương pháp cổ điển Hơn nữa, nó cho phép tính toán hiệp phương sai ở từng mức, giúp xác định nguyên nhân khác biệt trong kết quả học tập giữa các trường, liệu do phương thức giáo dục hay đặc điểm học sinh Ngoài ra, mô hình còn mở rộng nghiên cứu đến các sinh viên từ các trường khác nhau, chẳng hạn như phân tích sự khác biệt về thành tích học tập giữa sinh viên có đầu vào cao và thấp.
Mô hình hai mức
Mô hình hồi quy tuyến tính đơn hai mức
Bài viết phân tích dữ liệu học sinh từ một số trường cấp 3, tập trung vào điểm thi toán vào lớp 10 và điểm thi tốt nghiệp Dữ liệu có cấu trúc nhiều mức, trong đó học sinh là đơn vị mức 1 và trường là đơn vị mức 2 Mô hình hồi quy tuyến tính đơn mức được áp dụng cho từng trường, thể hiện mối quan hệ giữa điểm thi toán tốt nghiệp và điểm thi toán vào lớp 10 với công thức y i =α+βx i +e i, trong đó α là hệ số chặn, β là hệ số dốc và e i là phần dư Để mô tả mối liên hệ cho nhiều trường, công thức được điều chỉnh thành y ij =α j +β j x ij +e ij, trong đó j đại diện cho đơn vị mức 2 và i cho đơn vị mức 1.
Mô hình (1.2) mặc dù là mô hình một mức, nhưng vẫn có sự mô tả tách biệt cho từng trường Khi số lượng trường được chọn ít hoặc tập trung vào một số trường cụ thể, mô hình này yêu cầu ước lượng 2n + 1 tham số, bao gồm (α j , β j ) với j = 1,2, , n và σ e 2 Giả thiết cho rằng phương sai phần dư là chung và đường thẳng hồi quy cho mỗi trường là khác biệt Để mở rộng nghiên cứu ra các trường khác, cần coi các trường này có đặc tính tương tự như trường đã chọn, từ đó lựa chọn mẫu ngẫu nhiên của cá thể để cung cấp thông tin về tình hình chung Nghiên cứu một mẫu có thể ước lượng phương sai và hiệp phương sai giữa các trường Tuy nhiên, khi số lượng trường lớn, việc ước lượng tham số theo mô hình (1.2) có thể dẫn đến sai số, đặc biệt là với các trường có ít học sinh Trong trường hợp này, các trường sẽ được coi là phần tử của đám đông và sử dụng các ước lượng, kỳ vọng, phương sai mẫu để có được ước lượng chính xác hơn Để chuyển mô hình (1.2) sang dạng hai mức, ta coi α j , β j là các biến ngẫu nhiên và thay thế α j bằng β 0j , β j bằng β 1j, với giả sử β 0j = β 0 + u 0j và β 1j = β 1 + u 1j.
(1.3) với u 0j , u 1j là các biến nhiên sao cho
E(u 0j ) = E(u 1j ) = 0 var(u 0j ) = σ u0 2 , var(u 1j ) = σ u1 2 , cov(u 0j , u 1j ) =σ u01 Khi đó (1.2) được viết lại thành y ij =β 0 +β 1 x ij + (u 0j +u 1j x ij +e 0ij ), var(e ij ) = σ 2 e0
Ta vừa biểu diễn y ij như tổng thành phần cố định và phần ngẫu nhiên. Thành phần cố định được viết dưới dạng ma trận như sau
E(y ij ) = X ij β = (Xβ) ij , X ={X ij }. Đặc biệt khi kí hiệu gộp lại u j = (u 0j , u 1j ) T ; x ij = (1, x ij ) T ; β = (β 0 , β 1 ) T , z ij =x ij thì (1.4) được viết lại thành y ij =x T ij u i +z ij T β +e ij (1.5)
Các biến ngẫu nhiên được coi là phần dư trong mô hình một mức Cụ thể, phần dư mức 1, ký hiệu là e 0ij, chính là phần dư trong mô hình tuyến tính thông thường.
Mô hình hồi quy (1.4) khác với mô hình thông thường bởi sự xuất hiện của nhiều thành phần số dư, yêu cầu phương pháp ước lượng tham số đặc biệt cho hai hệ số β0 và β1 Trong bối cảnh này, phương sai và hiệp phương sai được coi là các biến ngẫu nhiên Chúng ta bắt đầu với mô hình hai mức đơn giản nhất chỉ bao gồm hai tham số σu0² và σe0², từ đó có thể xác định thành phần dự báo.
V ar y ij |β 0 , β 1 , x ij = var(u 0j +e 0ij )
Phương sai tổng thể được xác định bằng tổng phương sai mức một và phương sai mức hai, được biểu thị qua công thức σ u0 2 + σ e0 2 Trong đó, phương sai ở mức một cho từng cá thể là hằng số, và hiệp phương sai giữa hai cá thể trong một đơn vị mức hai được tính theo công thức cov(u 0j + e 0i 1 j; u 0j + e e0i 2 j).
Mối tương quan giữa hai cá thể trong cùng một đơn vị mức 2 được xác định bởi công thức ρ = σ u0 2 / (σ u0 2 + σ e0 2), trong đó các số dư ở mức 1 được giải thích độc lập với nhau Hệ số này được coi là hệ số tương quan nội tại của đơn vị mức hai.
Ước lượng các tham số cho mô hình đơn biến hai mức
Xét mô hình phương sai thành phần đơn biến hai mức y ij =β 0 +β 1 x ij +u 0j +e 0ij (1.7)
Trong mô hình này, chỉ có hệ số chặn là ngẫu nhiên Giả sử đã biết các giá trị của phương sai, ta sử dụng phương pháp bình phương bé nhất tổng quát để ước lượng hệ số cố định βˆ, được tính bằng công thức βˆ = (X T V −1 X) −1 X T V −1 Y (1.8).
Quá trình ước lượng bắt đầu từ các giá trị β 0 và β 1 được xác định qua phương pháp bình phương nhỏ nhất, thường với giả định σ u0 2 = 0 Phần dư được tính theo công thức ˜ y ij = y ij −βˆ 0 −βˆ 1 x ij Vectơ hàng biểu diễn phần dư có thể được viết lại để phân tích sâu hơn trong nghiên cứu.
Kỳ vọng của ma trận Y˜Y˜ T là V, và ma trận này có thể được sắp xếp lại thành một vectơ ký hiệu là V ec( ˜YY˜ T) Tương tự, cấu trúc Vec(V) của ma trận V cũng có thể được xây dựng Mối quan hệ giữa hai vectơ này có thể được biểu diễn thông qua một mô hình tuyến tính.
Trong mô hình tuyến tính, vecto phần dư R được biểu diễn qua công thức (1.11), cho phép ước lượng các hệ số σ²u0 và σ²e0 bằng phương pháp bình phương bé nhất Qua đó, ta có thể tính toán ma trận liên quan.
Để tính toán giá trị ước lượng β, chúng ta sẽ sử dụng ma trận V mới ước lượng từ (1.8) Sau đó, thay giá trị β̂ vào công thức (1.10) và lặp lại quy trình này Quá trình lặp sẽ tiếp tục cho đến khi đạt được giá trị ước lượng ổn định.
Phần dư trong mô hình hai mức
Trong mô hình (1.1), ước lượng thông thường cho phần dư \( e_i \) chỉ là \( \tilde{y}_i \) Tuy nhiên, trong mô hình nhiều mức, các tham số phần dư sẽ khác nhau ở từng mức Chúng ta sẽ tiến hành ước lượng cho phần dư tại từng mức cụ thể Để ước lượng các tham số phần dư, chúng ta định nghĩa \( u_{0j} \) là sai số mô hình thành phần ở mức 2 Cụ thể, mô hình 2 mức sẽ được biểu diễn qua công thức \( \hat{u}_{0j} = E(u_{0j} | Y, \beta, \hat{\Omega}) \).
Nếu bỏ qua phương sai mẫu mà chỉ ước lượng các tham số trong (1.12) ta có cov(˜y ij , u 0j ) = cov(y ij −βˆ 0 −βˆ 1 x ij ;u 0j )
=var(u 0j ) = σ 2 u0 cov(˜y ij , e 0ij ) = cov(u 0j +u 1j x ij +e 0ij , e 0ij )
=var(e0ij) = σ e0 2 var(˜y ij ) = cov(˜y ij ,y˜ ij ) = cov(u 0j +u 1j x ij +e 0ij ;u 0j +u 1j x ij +e 0ij )
Mô hình hồi quy tuyến tính (1.12) cho biến u 0j trên các đơn vị hai mức {y˜ ij } với chỉ số j đại diện cho mức 2, trong khi (1.7) xác định các đại lượng cần thiết để ước lượng hệ số hồi quy Đối với mô hình phương sai thành phần, ta có thể tính được u 0j = u j σ u 2.
Hệ số co được định nghĩa là giá trị trung bình nhiều mức y˜ j của phần dư thứ j, với công thức (n j σ u 2 −σ e0 2 )y˜ j ˜ e 0ij = ˜y ij −uˆ 0j ˜ y j = (Xy˜ ij )/n j, trong đó n j là số lượng phần tử ở mức 1 Phần dư được ước lượng là phù hợp và giá trị của hệ số co luôn nhỏ hơn hoặc bằng 1.
Gán trọng số cho các đơn vị
Xét mô hình hai mức, kí hiệu w j để chỉ trọng số đơn vị mức 2 thứ j và kí hiệu w i|j để chỉ trọng số mức 1 thứ i trong mức 2 thứ j sao cho
X i w i|j =n j ; X j w j =J (1.13) với J là số đơn vị mức 2 và N =P j n j là số đơn vị mức 1 Ta viết
Kí hiệuZ u , Z e tương ứng là tập hợp các biến giải thích xác định trong mức
Z e ∗ =W j Z e , W ij = diag{w j −0.5 } Đối với mô hình 3 mức ta có
Kí hiệu V ∗ là ma trận trọng số trong phân tích.
Để ước lượng sử dụng Z u ∗ và Z e ∗ như hệ số cố định, ta áp dụng ma trận hiệp phương sai theo quy trình đã nêu ở mục 1.2.3 Công thức ước lượng βˆ được xác định bởi βˆ = (X T V ∗ X) −1 X T V ∗−1 Y, với hiệp phương sai cov(ˆβ) = (X T V ∗ X) −1 X T V ∗−1 V V ∗−1 (X T V ∗ X) −1 Để tính phần dư, ta có thể ước lượng bằng ˆ p 2 = Ω 2 Z u ∗ T V ∗−1 Y˜ và hiệp phương sai cov(ˆp 2 ) = Ω 2 Z u ∗ T V ∗−1 (V)V ∗−1 Z u ∗ Ω 2.
Ước lượng Jacknife và ước lượng Bootstrap
Cho đến nay, chúng ta thường giả định rằng các biến phụ thuộc có phân bố chuẩn, điều này rất quan trọng trong phân tích dữ liệu Tuy nhiên, dữ liệu thực tế thường rời rạc hoặc không đối xứng Mặc dù ước lượng các tham số cố định và ngẫu nhiên vẫn có thể áp dụng khi giả định về phân bố chuẩn không được thỏa mãn, nhưng sai số tiêu chuẩn không thể được sử dụng để tính khoảng tin cậy hoặc kiểm định giả thuyết trừ khi kích thước mẫu đủ lớn.
Để khắc phục vấn đề ước lượng, chúng ta cần phát triển các phương pháp dựa trên giả định phân phối khác Trong chương tới, chúng ta sẽ áp dụng phương pháp này cho dữ liệu rời rạc và dữ liệu có thứ tự Một phương pháp thay thế là điều chỉnh cách tính sai số tiêu chuẩn và khoảng tin cậy để giảm sự phụ thuộc vào phân phối ban đầu của dữ liệu Tuy nhiên, nhược điểm của phương pháp này là kết quả kiểm định và khoảng tin cậy có thể bị mở rộng hơn so với dữ liệu có phân phối cụ thể Đầu tiên, chúng ta sẽ xem xét phần cố định của mô hình và ước lượng lặp bình phương bé nhất tổng quát cho các tham số cố định thông qua ước lượng cho các tham số ngẫu nhiên.
Ma trận hiệp phương sai của ước lượng được xác định bởi công thức cov( ˆβ) = (X T Vˆ −1 X) −1 X T Vˆ −1 {cov(Y) ˆV −1 X(X T Vˆ −1 X) −1 }, trong đó cov(Y) = V là chưa biết Việc sử dụng thủ tục thông thường để ước lượng thường dẫn đến sai số tiêu chuẩn quá nhỏ Để khắc phục, phương pháp ước lượng Jackknife được áp dụng bằng cách lần lượt loại bỏ một quan sát khỏi mẫu và sử dụng mẫu đã tỉa để ước lượng tham số, từ đó thu được n giá trị ước lượng (với n là cỡ mẫu) và xác định khoảng tin cậy cho tham số cần ước lượng.
Phương pháp Bootstrap là một kỹ thuật linh hoạt trong ước lượng thống kê, dựa vào nguyên lý chọn mẫu có hoàn lại để ước tính các thông số mà các phương pháp thống kê truyền thống không giải quyết được Các bước chính của ước lượng Bootstrap bao gồm việc tạo ra nhiều mẫu từ dữ liệu gốc để tính toán các chỉ số thống kê, từ đó đưa ra các ước lượng chính xác hơn.
1 Sinh ra các mẫu Bootstrap ngẫu nhiên có hoàn lại kích thước N từ mẫu ban đầu
2 Tính các thống kê đặc trưng cho mẫu được sinh ra (kỳ vọng, phương sai, độ lệch chuẩn, )
3 Lặp lại bước 1 và bước 2 với số lần lớn
4 Sử dụng các ước lượng thống kê Bootstrap đã tính ở bước 2 để đánh giá độ chính xác các ước lượng thống kê của mẫu.
Các nhà thống kê đã phát triển phương pháp Bootstrap nâng cao, bao gồm phương pháp Bootstrap tham số đầy đủ, sử dụng giả thuyết phân phối ban đầu để tạo ra các giá trị thông qua mô phỏng, nhằm ước lượng các tham số bootstrap Trong mô hình hai mức đơn giản với giả thuyết rằng các biến ngẫu nhiên có phân phối chuẩn, ta có y_ij = (Xβ)_ij + u_j + e_ij, với var(u_j) = σ²_u và var(e_ij) = σ²_e Để tạo mẫu Bootstrap, ta chọn ngẫu nhiên từ N(0, σ²_u) một tập giá trị mức hai u*_j và từ mỗi giá trị này, ta tạo ra tập e*_ij tương ứng.
Các bổ sung N(0, σ²u) được thêm vào để kết hợp với tập hợp giá trị Bootstrap của X và y ij, nhằm ước lượng các tham số βˆ ∗, σˆ u ∗ 2, và σˆ ∗ e 2 thông qua các thủ tục mẫu thông thường.
Mô hình hồi quy đa biến hai mức
Chúng ta mở rộng (1.4) bằng cách thêm vào các biến độc lập y ij = β 0 +β 1 x ij + p
X h=2 β h x hij + (u 0j +u 1j x ij +e 0ij ) và viết gọn lại thành y ij =X ij β +
X h=0 u hj z hij +e 0ij z 0ij ở đây ta dùng các biến độc lập cho thành phần ngẫu nhiên của mô hình
Trong bài viết này, Z 1 = {x ij} đại diện cho vectơ chứa các thành phần có giá trị bằng 1 Ký hiệu Ω 1 là ma trận hiệp phương sai của các biến ngẫu nhiên ở mức 1, trong khi Ω 2 là ma trận hiệp phương sai của các hệ số ngẫu nhiên ở mức 2.
Mở rộng mô hình hai mức
Một khía cạnh quan trọng của mô hình nhiều mức là khả năng điều chỉnh các mối quan hệ có điều kiện ở từng cấp độ, tùy thuộc vào mục tiêu nghiên cứu Ví dụ, chúng ta có thể phân tích cách mà các đặc điểm của môi trường ảnh hưởng đến thành tích học tập của học sinh Mô hình hai mức có thể được điều chỉnh như sau: β 0j = β 0 + β 01 z i + u 0j và β 1j = β 1 + β 11 z i + u 1j Từ đó, mô hình sẽ được trình bày dưới dạng y ij = (β 0 + β 01 z i + u 0j ) + (β 1 + β 11 z i + u 1j )x ij + e ij.
Số hạng β 11 z i x ij thể hiện tác động liên kết giữa biến mức 1 x ij và biến mức z i, phản ánh sự tương tác giữa các mức Để mở rộng mô hình với nhiều biến giải thích, ta có thể viết lại mô hình như sau: y ij = x T 1ij β 1 + z T 1ij β i + e ij, trong đó x 1ij và z 1ij đại diện cho tập hợp các biến mức 1 liên kết với các biến khác Mô hình mức 2 được thể hiện qua β i = (X 2i β 2 + u i), với kỳ vọng Eu i = 0 Kết hợp các phương trình này, ta có y ij = x T 1ij + z 1ij T (X 2i β 2 + u i) + e ij.
=x T ij β +z ij T u i +e ij , với x T ij = (x T 1ij z 1ij T X 2i ); z ij = z 1ij , β = (β 1 T β 2 T ).
Mô hình nhiều mức giúp đánh giá hiệu quả phối hợp giữa các mức khác nhau, cho phép phân tích các hệ thống phức tạp thông qua việc xác định "đơn vị phân tích" đa dạng trong cùng một vấn đề Khả năng ước lượng hiệu quả phối hợp này là một lợi thế nổi bật của mô hình nhiều mức so với các chiến lược phân tích riêng lẻ cho từng mức.
Mô hình nhiều mức cấp hai và các cấp cao hơn cho phép ước lượng cấu trúc phương sai, từ đó cải thiện hiểu biết về mô hình tổng thể Việc cải thiện này thường dẫn đến độ chính xác cao hơn trong ước lượng so với các mô hình hồi quy truyền thống.
Mô hình nhiều mức
Mô hình nhiều mức
Việc mở rộng mô hình ra nhiều mức hơn được thực hiện tương tự như mô hình hai mức Trong đó, mô hình mức 1 được biểu diễn bằng công thức: y ijk = x T 1ijk β 1 + z 1ijk T β ij + e 1ijk (1.17).
Hệ số y đại diện cho thành tích học tập của học sinh, trong đó i là chỉ số trường (i = 1, 2, , n), j là chỉ số lớp trong trường thứ i (j = 1, , J i), và k là chỉ số sinh viên trong lớp thứ i (k = 1, , K ij).
Biến giải thích x 1ijk và z 1ijk chịu ảnh hưởng từ nhiều yếu tố như sinh viên (giới tính, thu nhập gia đình), lớp học (đặc điểm giáo viên, cơ sở vật chất) và trường học (quy mô, cấu trúc, địa điểm) Các tham số phụ thuộc vào trường i và lớp j được thể hiện trong vectơ β ij, trong khi các tham số hằng số nằm trong vectơ β 1 Trung bình và phương sai có điều kiện của thành phần ngẫu nhiên e 1ijk là 0 và hằng số cho tất cả học sinh, lớp và trường Mô hình cấp 2 mô tả biến động tại lớp học với công thức β ij =X 2ij β 2 +Z 2ij γ i +e 2ij, trong đó Z 2ij và X 2ij có thể phụ thuộc vào lớp hoặc trường nhưng không phụ thuộc vào học sinh Các tham số kết hợp với biến giải thích Z 2ij là γ i phụ thuộc vào trường i, còn các tham số kết hợp X 2ij là hệ số Trung bình và phương sai có điều kiện của thành phần ngẫu nhiên e 2ij cũng bằng 0 và hằng số.
Mô hình mức 3 miêu tả các biến động cấp trường, do tham số γ i có thể thay đổi nhưng không ngẫu nhiên hoặc ngẫu nhiên Mô hình 3 mức có dạng γ i =X 3i β 3 +e 3i (1.19)
Biến giải thích X 2ij và Z 2ij có thể phụ thuộc vào trường, với trung bình và phương sai có điều kiện của thành phần ngẫu nhiên e 3i tương ứng bằng 0 và hằng số trên các trường Kết hợp các phương trình (1.17), (1.18) và (1.19), ta có công thức y ijk = x T 1ijk β 1 + [X 2ij β 2 + Z 2ij (X 3i β 3 + e 3i ) + e 2ij ]z 1ijk T + e 1ijk.
=x T 1ijk β 1 +z 1ijk T X 2ij β 2 +z T 1ijk Z 2ij X 3i β 3 +z T ijk Z 2ij e 3i +z 1ijk T e 2ij +e 1ijk
=x T ijk β +z ijk T u ij +e 1ijk với x T ijk = (x T 1ijk ; z 1ijk T X 2ij ; z 1ijk T Z 2ij X 3i ), β = (β 1 T ;β 2 T ; β 3 T ).
Biểu thức này thể hiện mô hình 3 mức là mô hình hiệu quả tuyến tính hỗn hợp.
Ước lượng các tham số
Xét mô hình nhiều mức có dạng y ij =x T ij β +z ij T u i +e ij
Chúng ta xem xét hàm hồi quy có điều kiện dạng
E(y ij |u i ) = x T ij β +z ij T u i Biểu thức này được viết chi tiết dưới dạng
E(y ij |u i ) = β 1 x ij1 +β 2 x ij2 + +β k x ijk +u i1 z ij1 +u i2 z ij2 + +u iq z ijq Dạng ma trận tương ứng là
Giả sử var(y i |u i ) = R i, chúng ta chấp nhận sự tồn tại của tương quan và tính không đồng nhất của phương sai Giả định rằng {u i} là độc lập với nhau, với E(u i) = 0 và ma trận hiệp phương sai var(u i) = D, là ma trận xác định dương kích thước q × q Các cột Z i thường là một tập con của các cột X i.
Ta xét mô hình tuyến tính nhiều mức với các giả thiết sau
2 {x ij1 ; ;x ijk } và z ij1 ; ;z ijk là biến không ngẫu nhiên;
4 {y i } là những vectơ ngẫu nhiên độc lập có điều kiện trên {u 1 , ;u n };
5 {y i } có phân phối chuẩn có điều kiện trên {u 1 ; ;u n };
6 Eu i = 0, var(u i ) = D và {u 1 , ;u n } độc lập;
V ar(y i ) =Z i DZ i T +R i =V i (τ) = V i (1.20) Bằng phương pháp ước lượng bình phương bé nhất tổng quát ta thu được ước lượng của β là βˆ GLS = ( n
X i T V i −1 y i (1.21) và phương sai V arˆ(β) GLS = ( n
X i T V i −1 X i ) −1 Chúng ta xem xét hàm hợp lý trên từng đối tượng đơn lẻ có giá trị là l i (β;τ) = −1
2(T i ln(2π) +lndetV i ) + (y i −X i β) T V i −1 (y i −X i β) và hàm log hợp lý trên toàn bộ dữ liệu sẽ là
Ta lấy ra hàm log hợp lý đặc trưng có dạng
T i ln(2π) +lndetV i + (ErrorSS) i (τ) (1.22) ở đây tổng bình phương sai số đối với đối tượng thứ i là
Ta ước lượng hệ số hồi quy β và thành phần phương sai bằng cách bắt đầu từ giá trị ban đầu của D và R Từ đó, ta tính V theo công thức (1.18) Sau khi có V, ta thay vào công thức (1.19) để thu được ước lượng β Với β đã được ước lượng, ta tiếp tục thay vào các công thức (1.20) và (1.21) để xác định thành phần phương sai.
V i Quá trình trên được tiến hành lặp đi lặp lại cho đến khi thu được một ước lượng hội tụ.
Xác định giá trị ban đầu của quá trình lặp
Để ước lượng hệ số hồi quy và thành phần phương sai, cần xác định giá trị ban đầu cho quá trình lặp Phương pháp moment Swamy được sử dụng với giả thiết x ij = z ij và R i = σ i² I i để xác định giá trị ban đầu này, sau đó thực hiện các bước tiếp theo.
1 Tính toán ước lượng bình phương bé nhất của σ i 2 s 2 i = 1
T i −Ky i T (I i −X i (X i T X i ) −1 X i T )y i Trong ước lượng này chúng ta tạm thời bỏ qua D = V ar(β i ).
2 Tiếp theo, tính toán b i = (X i T X i ) −1 X i T y i , như một dự báo của β+u i
3 Cuối cùng, ước lượng D bằng
X i=1 b i Ước lượng của D được gợi ý đưa ra bằng cách kiểm tra phương sai của b i
(b i −¯b)(b i −¯b) 0 và s 2 i là ước lượng của V ar(b i ) vàσ i 2 tương ứng, kéo theo D SW AM Y là một ước lượng của D.
Kiểm định sự phù hợp của mô hình
Kiểm định một hệ số hồi quy
Trong phân tích thống kê, kiểm định giả thuyết đóng vai trò quan trọng trong việc xác định xem hệ số hồi quy có bằng một giá trị cụ thể hay không Chúng ta thường kiểm tra giả thuyết H0: βj = βj,0 và giả thuyết K: βj ≠ βj,0, trong đó βj,0 thường được giả định là bằng 0.
Thủ tục thông thường bắt đầu bằng việc lập thống kê \( t_{β_j, GLS} = \frac{βˆ_{j, GLS} - β_{j,0}}{se(βˆ_{j, GLS})} \), trong đó \( βˆ_{j, GLS} \) là thành phần thứ j của \( βˆ_{j, GLS} \) trong biểu thức, và \( se(βˆ_{j, GLS}) \) là căn bậc hai của thành phần đường chéo thứ j của ma trận.
Để đánh giá giả thuyết H0, cần so sánh thống kê t với một biến ngẫu nhiên có phân phối t-Student, với số bậc tự do phù hợp dựa trên dữ liệu ban đầu và mục đích phân tích Trong thực tế, khi kích thước mẫu đủ lớn, phân phối t-Student gần giống với phân phối chuẩn, vì vậy có thể thay thế phân phối t-Student bằng phân phối chuẩn Nguyên tắc này thường được áp dụng trong các phần mềm phân tích nhiều mức.
Kiểm định sự phù hợp của mô hình
Để kiểm tra giả thuyết liên quan đến các hệ số hồi quy đồng thời, phương pháp phổ biến là sử dụng kiểm định tỷ số hợp lý Cụ thể, ta xem xét giả thuyết H0: Cβ = d, trong đó C là ma trận p×k có hạng p, d là vectơ p×1 (thường là vectơ 0), và β là vectơ k×1 của các hệ số hồi quy Giả thuyết này được kiểm tra so với đối thuyết H1: Cβ ≠ d Quy trình kiểm định tham số hợp lý được thực hiện theo các bước cụ thể.
1 Sử dụng mô hình không có ràng buộc, tính toán ước lượng hợp lí cực đại và hàm log hợp lý tương ứng, kí hiệu là L M LE
2 Đối với mô hình có ràng buộc thì sử dụng giả thuyết H 0 : Cβ = d, tính toán ước lượng hợp lí cực đại và hàm log hợp lý tương ứng, kí hiệu L Reduced
3 Tính hàm log tỉ số hợp lý để kiểm định hiểu quả, LRT = 2(L M LE −
4 Bác bỏ H 0 nếu LRT lớn hơn phân vị tương ứng (thường được chọn bằng5%) của phân phốiKhi - bình phương vớipbậc tự do Tất nhiên, ta có thể dùng giá trị p để hiệu chỉnh mức ý nghĩa của kiểm tra.
Phân tích thành phần chính
Khi làm việc với tập dữ liệu có n cá thể và p chỉ tiêu, việc p lớn có thể làm cho số liệu trở nên cồng kềnh và khó hiểu Để đơn giản hóa hình ảnh của dữ liệu mà vẫn giữ được thông tin quan trọng, người ta thường tìm cách xây dựng một biểu diễn dễ hiểu hơn Phân tích thành phần chính là một phương pháp hiệu quả nhằm mục đích này, giúp làm nổi bật đám mây số liệu mà không làm mất đi thông tin ban đầu.
Cho một vecto ngẫu nhiên p chiều X mà ta có n quan sát độc lập
X 1 , X 2 , , X n của vecto ngẫu nhiên đó Khi ấy
X j T = (x 1j , x 2j , x nj ) với j = 1, p và x T i = (x i1 , x i2 , x ip ) Giả sử các biến X j có kỳ vọng E(X j ) = 0, tức là n 1 Pn i=1X ij = 0 Khi đó, gốc O(0,0, ,0) của hệ trục tọa độ sẽ trùng với trọng tâm của đám mây n điểm.
Trong phân tích thành phần chính, biến chính đầu tiên là đường thẳng ∆1 đi qua tâm O, tối ưu hóa tổng bình phương khoảng cách từ các điểm của đám mây đến nó Biến chính thứ hai, đường thẳng ∆2, trực giao với ∆1, cũng nhằm giảm thiểu tổng bình phương khoảng cách từ đám mây Cả hai đường thẳng này tạo thành mặt phẳng chính, thể hiện đám mây một cách rõ nét nhất Thành phần chính thứ ba, đường thẳng ∆3, trực giao với mặt phẳng chính đầu tiên, tiếp tục tối ưu hóa tổng bình phương khoảng cách Quá trình này dẫn đến một hệ k vector trực giao, hình thành siêu phẳng k chiều, giúp thể hiện đám mây một cách rõ ràng nhất.
Gọi ∆là đường thẳng qua tâm O, là giá của vecto đơn vị u, u T u = 1.Gọi
M i là điểm thuộc đám mây trong không gian R p , H i là hình chiếu của M i lên ∆, khi đó độ dài OH i là ||OH i || = (OM i )u =X i u.
Bài toán được đặt ra là tìm vector u₁ sao cho u₁^T X^T Xu₁ đạt giá trị tối đa, với điều kiện u₁^T u₁ = 1 Để giải quyết vấn đề này, ta sử dụng ma trận hiệp phương sai M₀ = 1/n X^T X và tìm u₁ sao cho u₁^T M₀ u₁ - λ(u₁^T u₁ - 1) đạt giá trị tối đa, trong đó λ là nhân tử Lagrange Điều này tương đương với việc tối đa hóa hàm mục tiêu liên quan đến ma trận hiệp phương sai.
Giá trị riêng λ và vecto riêng u1 của ma trận M0 cho thấy rằng ma trận hiệp phương sai là nửa xác dương, dẫn đến các giá trị riêng không âm Các giá trị riêng này có thể được sắp xếp theo thứ tự giảm dần: λ1 ≥ λ2 ≥ λ3 ≥ λk > 0.
Với λ 1 là giá trị riêng lớn nhất, ta gọi Y 1 là thành phần chính thứ nhất.Khi đó
Vậy Y 1 = u T 1 X với u 1 là vecto riêng tương ứng với giá trị riêng lớn nhất λ 1 của M 0 Tiếp tục ta tìm thành phần chính Y 2 bằng cách giải hệ
u T 2 M 2 u 2 → max u T 2 u 2 = 1 u T 2 u 1 = 0 Áp dụng phương pháp nhân tử Lagrange ta cần phải giải phương trình
Để giải phương trình vỡ M 0 u 1 −λu 1 = 0 với điều kiện u T 1 u 1 = 1, ta có thể xác định rằng M 0 u 2 −λu 2 = 0, dẫn đến |M 0 −λ|u 2 = 0 Giá trị riêng thứ hai λ 2 tương ứng với véc tơ riêng u 2 là lời giải cho phương trình này, do đó D(Y 2 ) = λ 2 và Y 2 = u T 2 X Để tìm thành phần chính thứ k, ta cần giải hệ phương trình tương ứng.
u T M 0 u = 0 u T u = 1 u T u j = 0, ∀j = 1,2, , k −1 Kết quả lại cho λ k là nghiệm của phương trình
|M 0 −λI|= 0Khi đó D(Y j ) = λ j ∀j = 1, k Vậy Y j =u T j X với j = 1, kPhương sai mẫu tổng cộng là D(Y) = λ 1 +λ 2 + +λ k
Phân tích tình hình chăm sóc sức khỏe cộng đồng huyện Thái Thụy
Vài nét về lịch sử phát triển, tự nhiên xã hội huyện Thái Thụy
xã hội huyện Thái Thụy
Huyện Thái Thụy, thành lập ngày 17/6/1969, là huyện ven biển lớn nhất tỉnh Thái Bình với diện tích 25.773,4 ha, bao gồm 47 xã và 1 thị trấn Huyện có 15.246 ha đất nông nghiệp và 1.189 ha mặt nước nuôi trồng thủy sản, phục vụ cho dân số 266.513 người, mật độ 1.038 người/km2 Thái Thụy sở hữu 27 km bờ biển, gần 10.000 ha bãi bồi ven biển, cùng với 3 cửa sông và cảng biển Diêm Điền Địa hình huyện phức tạp, không bằng phẳng, với đất nhiễm chua mặn và gặp khó khăn trong thủy lợi, thường xuyên chịu tác động từ thủy triều dâng, biến đổi khí hậu, thiên tai và bão lụt hàng năm.
Các hoạt động kinh tế chính của huyện bao gồm sản xuất nông nghiệp, nuôi trồng và đánh bắt thủy hải sản, công nghiệp xây dựng cơ bản và thương mại dịch vụ Trong đó, sản xuất nông nghiệp được coi là ngành chủ lực, chiếm tỷ trọng lớn trong nền kinh tế Giá trị sản xuất nuôi trồng và khai thác thủy hải sản đạt khoảng 48,7% tổng giá trị sản xuất nông nghiệp Kinh tế thủy hải sản phát triển theo ba hướng chính: nuôi trồng, khai thác và chế biến hải sản Gần đây, huyện cũng đã mở rộng ngành công nghiệp đóng tàu và vận tải biển.
Mỗi xã và thị trấn trong huyện đều sở hữu trường mầm non, trường tiểu học, trung học cơ sở và một trạm y tế, trong đó có 95 trường đạt chuẩn quốc gia Đặc biệt, 44 trên 48 xã đã đạt chuẩn quốc gia về y tế, khẳng định sự phát triển bền vững của hệ thống giáo dục và y tế tại địa phương.
Mô tả số liệu
Số liệu trong nghiên cứu này được thu thập tại trung tâm y tế dự phòng huyện Thái Thụy, bao gồm số liệu trong hai năm 2011 và 2012 của
48 xã trong huyện Mỗi báo cáo là kết quả chăm sóc sức khỏe của một xã, được thống kê trong một năm qua 8 bảng biểu bao gồm
• Đơn vị hành chính, dân số và tình hình sinh tử
• Tình hình nhân lực đội ngũ y tế xã
• Hoạt động chăm sóc sức khỏe bà mẹ trẻ em và kế hoạch hóa gia đình
• Hoạt động khám chữa bệnh
Thông tin trong các bảng đó được tổ chức thành các biến có tên và ý nghĩa theo mô tả dưới đây
+ Các biến mô tả dân số, sinh tử:
Thutu: Thứ tự các xã trong huyện.
Tenxa: Tên các xã trong huyện.
Dtich: Diện tích các xã.
Sothonb: Số thôn, bản trong xã.
Dso: Dân số của xã tính đến ngày 1/7 trong năm.
Nu: Số nữ của xã tính đến ngày 1/7 trong năm.
Tính đến ngày 1/7 hàng năm, số trẻ em dưới 1 tuổi được ghi nhận là Tred1, trong khi số trẻ em dưới 5 tuổi là Tred5 Đối với trẻ em dưới 6 tuổi, con số này được biểu thị là Tred6, và trẻ em dưới 15 tuổi được xác định qua Tred15 Tổng số trẻ sinh sống trong năm được gọi là Tress.
Tregaiss: Số trẻ sinh sống là nữ Chet: Tổng số người chết trong năm.
Trong năm, số trẻ em chết dưới 1 tuổi là một chỉ số quan trọng, trong đó số trẻ nữ chết dưới 1 tuổi cũng được ghi nhận Bên cạnh đó, tổng số trẻ em chết dưới 5 tuổi và số trẻ nữ chết dưới 5 tuổi cũng phản ánh tình hình sức khỏe và dinh dưỡng của trẻ em trong cộng đồng Các biến mô tả nhân lực đóng vai trò quan trọng trong việc phân tích và hiểu rõ hơn về các yếu tố ảnh hưởng đến tỷ lệ tử vong ở trẻ em.
Tại trạm y tế, số bác sĩ (Bacsy) đảm nhận vai trò quan trọng trong việc khám và điều trị bệnh nhân Y sĩ (Ysy) cũng là một phần không thể thiếu, hỗ trợ bác sĩ trong các công tác y tế Bên cạnh đó, số dược sĩ và kỹ thuật viên thuốc (Dsyktvtc) có trách nhiệm cung cấp thuốc và tư vấn về sử dụng thuốc cho bệnh nhân Cuối cùng, số dược tá (Duocta) góp phần vào việc quản lý và phân phối thuốc tại trạm y tế, đảm bảo người dân nhận được sự chăm sóc y tế tốt nhất.
Ddtc là số điều dưỡng trung học làm việc tại trạm y tế, trong khi Ddsc chỉ số điều dưỡng sơ cấp tại cùng một địa điểm Hostc đại diện cho số hộ sinh trung học công tác tại trạm y tế, và Luongy là số lượng y sĩ hiện có.
Cbkhac: Số lượng cán bộ làm việc tại trạm y tế Ngân sách trạm y tế bao gồm các biến mô tả ngân sách nhà nước cấp cho hoạt động y tế trong năm và ngân sách từ xã cấp cho hoạt động y tế trong năm.
Thubhyt đề cập đến số tiền thu từ bảo hiểm y tế, trong khi Thukcb là số tiền thu từ dịch vụ khám chữa bệnh Thukhac liên quan đến số tiền thu từ các nguồn khác Chi tiêu cho cán bộ y tế được thể hiện qua Chiluong, còn Muasam là số tiền dùng để mua sắm chuyên môn Chidtpt phản ánh số tiền chi cho đầu tư phát triển, và Chikhac là các khoản chi khác.
+ Các biến mô tả hoạt động tiêm chủng mở rộng Tethuocdt: Số trẻ em thuộc diện tiêm trong năm
Trong năm qua, số trẻ em được tiêm chủng đạt được nhiều kết quả đáng khích lệ Số trẻ đã tiêm BCG trong năm cho thấy sự quan tâm trong việc phòng ngừa bệnh lao Đặc biệt, số trẻ tiêm đủ 4 mũi vaccine trong năm cũng tăng lên, điều này phản ánh sự chú trọng đến việc bảo vệ sức khỏe trẻ em Ngoài ra, số trẻ tiêm phòng sởi trong năm cũng đáng ghi nhận, góp phần vào việc kiểm soát dịch bệnh Thống kê cho thấy, số trẻ tiêm phòng viêm gan B trong vòng 24 giờ sau sinh đạt tỷ lệ cao, trong khi số trẻ tiêm muộn hơn 24 giờ vẫn cần được cải thiện Cuối cùng, số trẻ tiêm đủ 9 mũi vaccine trong năm cho thấy nỗ lực không ngừng trong việc đảm bảo sức khỏe cho thế hệ tương lai.
Tiemmnao: Số trẻ tiêm phòng viêm màng não Tiemta: Số trẻ tiêm phòng tả
Pntiemuv: Số phụ nữ có thai được tiêm UV 2+
+ Các biến mô tả hoạt động chăm sóc sức khỏe bà mẹ, trẻ em và kế hoạch hóa gia đình:
Cothai: Số phụ nữ có thai trong năm Cothaivt: Sô trường hợp có thai vị thành niên trong năm Khamthai: Số lần khám thai trong năm
Khthaipn: Số lần khám thai của phụ nữ đẻ trong nămPndedqly: Số phụ nữ đẻ được quản lí trong năm
Pndetuv: Số phụ nữ đẻ tiêm UV đủ liều trong năm Pnde: Số phụ nữ đẻ trong năm
Pndektdu: Số phụ nữ đẻ được kiểm tra đủ trong năm Sconth3: Số phụ nữ sinh con thứ 3 trong năm
Trong năm qua, Cbytedo ghi nhận số lượng phụ nữ sinh nở được cán bộ y tế hỗ trợ, trong khi Decsyte cho thấy tổng số phụ nữ sinh tại các cơ sở y tế Bên cạnh đó, Mecsss chỉ ra số mẹ được chăm sóc sau sinh, còn Mecstd tập trung vào số mẹ được chăm sóc trong tuần đầu sau khi sinh Cuối cùng, Phathai thống kê số lượt phá thai trong năm.
Pthaid7t: Số lượt phá thai dưới 7 tuần trong năm Chetth22: Số lượt chết thai nhi dưới 22 tuần trong năm Chet1t: Số trẻ chết dưới 1 tuổi trong năm
Trong năm, số trẻ chết dưới 7 ngày (Chet7ng) và số trẻ chết dưới 5 tuổi (Chet5t) là những chỉ số quan trọng phản ánh tình trạng sức khỏe trẻ em Bên cạnh đó, số lần khám phụ khoa (Khampk) và số lần chữa phụ khoa (Chuapk) cũng đóng vai trò thiết yếu trong việc theo dõi sức khỏe sinh sản Tổng số thực hiện biện pháp tránh thai (Thbptrt) và số lần đặt vòng (Datvong) là những yếu tố quan trọng trong việc nâng cao nhận thức về kế hoạch hóa gia đình và sức khỏe phụ nữ.
Trong năm qua, số người sử dụng thuốc tránh thai đã tăng lên đáng kể, với nhiều người lựa chọn viên tránh thai Bên cạnh đó, số lượng người tiêm tránh thai cũng ghi nhận sự gia tăng, cho thấy sự phổ biến của phương pháp này Hơn nữa, việc cấy tránh thai đã thu hút một số lượng người dùng nhất định Ngoài ra, bao cao su vẫn là một lựa chọn phổ biến trong cộng đồng, với số người sử dụng tăng lên Cuối cùng, số người triệt sản trong năm cũng cho thấy một xu hướng đáng chú ý trong việc kiểm soát sinh sản.
Trong năm, số liệu về triệt sản nữ cho thấy tầm quan trọng của việc kiểm soát sinh sản TressSKSS cho biết tổng số trẻ sinh sống trong năm, trong khi Trenuss chỉ ra số trẻ nữ trong số đó Trecan cung cấp thông tin về số trẻ được cân, và Tred2500 nêu rõ số trẻ sinh ra với trọng lượng dưới 2,5 kg Những biến mô tả này phản ánh hoạt động khám chữa bệnh trong cộng đồng.
Tổng số giường bệnh tại trạm y tế Giuongdt đóng vai trò quan trọng trong việc cung cấp dịch vụ chăm sóc sức khỏe Lankham thể hiện tổng số lần khám bệnh, cho thấy sự quan tâm của người dân đến sức khỏe Khamyhct ghi nhận số lượt khám y học cổ truyền, phản ánh xu hướng tìm kiếm phương pháp điều trị tự nhiên Khamd6t chỉ ra số lượt khám cho trẻ em dưới 6 tuổi, nhấn mạnh tầm quan trọng của chăm sóc sức khỏe nhi khoa Cuối cùng, Dtnoitru cho biết số lần điều trị nội trú, là một chỉ số quan trọng trong việc đánh giá chất lượng dịch vụ y tế.
Dtntyhct: Số lần điều trị nội trú YHCT Dtntte6t: Số lần điều trị nội trú trẻ em dưới 6t Ngaydtnt: Số ngày điều trị nội trú
Số ngày điều trị nội trú YHCT (Y học cổ truyền) là một chỉ số quan trọng trong việc đánh giá hiệu quả điều trị Đối với trẻ em, số ngày điều trị nội trú thường được theo dõi riêng để đảm bảo sức khỏe và sự phát triển của trẻ Tổng số lần điều trị ngoại trú cũng là một yếu tố cần xem xét, bao gồm cả số lần điều trị ngoại trú YHCT và số lần điều trị dành riêng cho trẻ em dưới 6 tuổi Ngoài ra, số lần siêu âm cũng đóng vai trò quan trọng trong quá trình chẩn đoán và theo dõi sức khỏe bệnh nhân.
Chuyent: Số lượt chuyển tuyến Khamdphg: Số lần khám dự phòng Khamtu: Số lượt khám tư
Trong bài viết này, chúng tôi sẽ đề cập đến các biến mô tả bệnh thông thường, bao gồm số người mắc tiêu chảy trong năm (Tchaym), số người mắc thủy đậu trong năm (Thdaum), số người mắc thủy đậu chết trong năm (Thdauc) và số người mắc quai bị trong năm (Quaibim) Những thông tin này giúp theo dõi tình hình sức khỏe cộng đồng và đánh giá mức độ lây lan của các bệnh này.
Trong năm qua, số người chết do quai bị (Quaibic) đã gây lo ngại, trong khi số ca mắc viêm hô hấp (Viemhhtm) cũng tăng cao Bên cạnh đó, tình trạng viêm phế quản (Viempqm) và viêm phổi (Viemphoi) cũng ghi nhận nhiều trường hợp mắc mới Những con số này nhấn mạnh tầm quan trọng của việc nâng cao nhận thức và phòng ngừa các bệnh lý hô hấp trong cộng đồng.
Một số kết quả phân tích
Phân tích tác động đến tỷ lệ trẻ em chết dưới 1 tuổi
Mô hình hồi quy tuyến tính nhiều mức với biến phụ thuộc "Tlechetd1" được xây dựng dựa trên các quan sát trong một năm ở cấp độ 1 và xã ở cấp độ 2 Bài viết này sẽ phân tích các yếu tố ảnh hưởng đến tỷ lệ tử vong trẻ em dưới 1 tuổi.
Bảng 2.9a: Mô hình phân tích các tác động lên tỷ lệ trẻ em chết dưới 1 tuổi
Trong nghiên cứu này, các biến độc lập và hệ số xác suất hồi quy được phân tích để xác định ý nghĩa của chúng Biến tlescont3 có hệ số -2.23 với xác suất 0.026, cho thấy mối liên hệ tiêu cực có ý nghĩa Biến tledvtrt cũng có hệ số -2.09 và xác suất 0.037, tương tự như vậy Ngược lại, biến tlephathai có hệ số 1.86 với xác suất 0.064, cho thấy một mối liên hệ tích cực mặc dù không hoàn toàn có ý nghĩa Các biến khác như tletiemtrt (-2.08, 0.038) và tlephatt7t (-1.28, 0.201) cũng được xem xét, với một số biến như tlebcstrt (-2.15, 0.031) và chuapkhoa (1.29, 0.198) cho thấy kết quả khác nhau Biến tlesinhthcan nổi bật với hệ số 3.01 và xác suất 0.003, chỉ ra mối liên hệ tích cực mạnh mẽ, trong khi biến thtrthai (-2.04, 0.041) cũng cho thấy kết quả có ý nghĩa Hệ số của hằng số (_ cons) là 1.44 với xác suất 0.151, không có ý nghĩa thống kê.
Bảng 2.9b trình bày phân tích hiệu quả ngẫu nhiên của mô hình dự báo tỷ lệ chết dưới 1 tuổi, với ước lượng tham số sd(_cons) đạt 4.156896 và sai số chuẩn là 1.044517, trong khoảng tin cậy từ 2.5403 đến 6.802261 Bên cạnh đó, sd(Residual) có giá trị 5.403879 với sai số chuẩn 0.6259777, nằm trong khoảng tin cậy từ 4.306293 đến 6.781216.
Dựa vào bảng 2.9a ta thấy có biến độc lập “tlescont3”, “thtrthai”, “tletiemtrt”,
Các yếu tố như "tlebcstrt", "tledvtrt", "tletrsan" và "tlesinhthcan" có ảnh hưởng đáng kể đến tỷ lệ trẻ em chết dưới 1 tuổi với xác suất ý nghĩa nhỏ hơn 5% Cụ thể, tỷ lệ sinh con thứ 3 có tác động tích cực, làm giảm tỷ lệ chết ở trẻ dưới 1 tuổi; nếu tỷ lệ sinh con thứ 3 tăng 1%, tỷ lệ chết sẽ giảm 2,23% Ngoài ra, việc áp dụng biện pháp tránh thai cũng giúp giảm tỷ lệ chết ở trẻ dưới 1 tuổi Ngược lại, tỷ lệ trẻ sinh ra thiếu cân lại làm tăng tỷ lệ chết; nếu tỷ lệ trẻ sinh thiếu cân tăng 1%, tỷ lệ chết ở trẻ dưới 1 tuổi sẽ tăng 3,01%.
Kết quả phân tích trong Bảng 2.9b cho thấy các tham số thống kê và hiệu quả ngẫu nhiên trong mô hình hồi quy nhiều mức Hệ số chặn, ký hiệu là “cont”, có giá trị ước lượng 1,14 với độ lệch chuẩn 4.156896 Sai số tiêu chuẩn này có khoảng tin cậy 95% được ước lượng là (2.5403; 6.802261), không chứa điểm 0, cho thấy sự biến động đáng kể về tỷ lệ tử vong ở trẻ dưới 1 tuổi giữa các xã Điều này chứng tỏ giả thiết về tính phương sai không đổi trong mô hình tuyến tính cổ điển không được thỏa mãn, và phần dư trong mô hình cũng không có tính độc lập, thuần nhất và có sự thay đổi đáng kể giữa các xã.
Phân tích tác động đến tỷ lệ sinh con thứ 3
Mô hình hồi quy tuyến tính nhiều mức được xây dựng với biến phụ thuộc "Tlesconth3", trong đó các quan sát trong một năm là đơn vị mức 1 và xã là đơn vị mức 2 Mục tiêu của nghiên cứu là phân tích các yếu tố ảnh hưởng đến tỷ lệ sinh con thứ 3.
Bảng 2.10a trình bày mô hình phân tích các yếu tố ảnh hưởng đến tỷ lệ sinh con thứ 3 Các biến độc lập như tletiemtrt có hệ số hồi quy 2.20 với ý nghĩa 0.028, cho thấy ảnh hưởng tích cực đến tỷ lệ sinh Ngược lại, biến tletpvgant24 có hệ số hồi quy -2.83 và ý nghĩa 0.005, cho thấy ảnh hưởng tiêu cực Các biến khác như tledvong (-1.80, p = 0.072) và tletpbcg (0.32, p = 0.751) không có ảnh hưởng đáng kể Tổng thể, mô hình chỉ ra rằng một số yếu tố có thể tác động rõ rệt đến quyết định sinh con thứ 3.
Kết quả phân tích cho thấy hai biến độc lập “tlet- pvgant24” và “tletiemtrt” ảnh hưởng đến tỷ lệ sinh con thứ 3 với xác suất ý nghĩa dưới 5% Hệ số hồi quy của “tlet- pvgant24” là -2,83, trong khi của “tletiemtrt” là 2,2.
Bảng 2.10b trình bày mô hình phân tích các tác động đến tỷ lệ sinh con thứ 3 với hiệu quả ngẫu nhiên Các ước lượng tham số cho sd(_cons) là 3.180064 với sai số chuẩn 0.6804562 và khoảng tin cậy từ 2.090737 đến 4.836957 Đối với sd(Residual), giá trị ước lượng là 3.803292, sai số chuẩn 0.430066 và khoảng tin cậy nằm trong khoảng từ 3.04725 đến 4.746912.
Kết quả phân tích từ Bảng 2.10b cho thấy các tham số thống kê và hiệu quả ngẫu nhiên trong mô hình hồi quy tuyến tính nhiều mức với biến phụ thuộc là tỷ lệ sinh con thứ 3 Hệ số chặn, ký hiệu là “cont” trong Bảng 2.10a, có giá trị ước lượng là 1,91 với độ lệch chuẩn 3.180064 Sai số tiêu chuẩn này có khoảng tin cậy 95% được ước lượng là (2.090737; 4.836957), không chứa điểm 0, cho phép khẳng định rằng có sự biến động đáng kể về tỷ lệ sinh con thứ 3 giữa các xã.
Phân tích sự tác động đến tỷ lệ phá thai
Chúng tôi đã tiến hành phân tích tác động của các yếu tố đến tỷ lệ phá thai bằng mô hình hồi quy tuyến tính nhiều mức, với biến phụ thuộc là “tlephathai” Các biến độc lập bao gồm tỷ lệ sử dụng biện pháp tránh thai và tỷ lệ sinh con thứ ba Đơn vị quan sát là từng năm (mức 1) và xã (mức 2) Kết quả từ phân tích mô hình nhiều mức cho thấy những ảnh hưởng rõ rệt đến tỷ lệ phá thai.
Bảng 2.11a: Mô hình nhiều mức phân tích sự tác động đến tỷ lệ phá thai
Biến độc lập Hệ số hồi quy Xác suất ý nghĩa tlescont3 -2.08 0.038 thtrthai -0.30 0.766 tledvong -0.29 0.773 tledvtrt -0.22 0.828 tletiemtrt -0.20 0.845 tlebcstrt -0.68 0.494 tletrsan -0.03 0.976 tleadkhh 0.29 0.769
Kết quả từ bảng 2.11a chỉ ra rằng tỷ lệ phá thai không bị ảnh hưởng bởi các yếu tố liên quan đến việc sử dụng biện pháp tránh thai, nhưng lại bị tác động bởi tỷ lệ sinh con thứ 3 Cụ thể, khi tỷ lệ sinh con thứ 3 tăng 1%, tỷ lệ phá thai sẽ giảm 2.08% với xác suất ý nghĩa nhỏ hơn 5% Bảng 2.11b trình bày phân tích hiệu quả ngẫu nhiên của mô hình dự báo tỷ lệ phá thai.
Hiệu quả ngẫu nhiên Ước lượng tham số Sai số chuẩn Khoảng tin cậy sd(_cons) 11.51379 1.581491 (8.796311; 15.0708) sd(Residual) 7.591874 0.842383 ( 6.108025 ; 9.436199)
Kết quả phân tích cho thấy rằng độ lệch tiêu chuẩn của hệ số chặn và phần dư đều khác 0 một cách có ý nghĩa, chỉ ra sự biến động giữa các xã Điều này chứng minh rằng giả thiết về phương sai phần dư không đổi trong mô hình hồi quy cổ điển không được thỏa mãn Vì vậy, mô hình nhiều mức trở nên quan trọng hơn để đánh giá chính xác các yếu tố ảnh hưởng đến tỷ lệ phá thai.
Mô hình phân tích ba mức được áp dụng để nghiên cứu các yếu tố ảnh hưởng đến tỷ lệ phá thai Mức 1 bao gồm các quan sát theo từng năm, mức 2 là các xã, và mức 3 là các nhóm xã Các xã được phân loại thành ba nhóm: nhóm 1 là các xã chuyên làm kinh tế biển, nhóm 2 là các xã có người tham gia vào kinh tế biển.
Mô hình nghiên cứu bao gồm ba xã thuần nông, trong đó biến phụ thuộc là “tlephathai” Các biến độc lập được sử dụng để mô tả nhân lực y tế và việc áp dụng các biện pháp tránh thai Kết quả chi tiết được trình bày trong Bảng 2.11c và 2.11d.
Bảng 2.11c: Mô hình 3 mức phân tích các tác động đến tỷ lệ phá thai
Trong phân tích hồi quy, các biến độc lập như Hs và Xs thể hiện ý nghĩa khác nhau Biến lgytsdan có hệ số hồi quy -1.00 với giá trị p 0.315, cho thấy không có ý nghĩa thống kê Biến hstsdan với hệ số -1.72 và p 0.085 gần mức ý nghĩa, trong khi chuapkhoa có hệ số 2.58 và p 0.010, cho thấy ý nghĩa mạnh mẽ Các biến khác như ddtsdan (-0.35, p 0.728) và tledvong (0.41, p 0.684) cũng không đạt yêu cầu về ý nghĩa Biến tlebcstrt (-2.80, p 0.005) cho thấy mối liên hệ đáng kể, trong khi các biến tledvtrt (1.69, p 0.090) và tletiemtrt (0.44, p 0.659) có ý nghĩa trung bình.
Bảng 2.11d trình bày phân tích hiệu quả ngẫu nhiên của mô hình dự báo tỷ lệ phá thai Kết quả ước lượng tham số cho tên xã là 8.717714 với sai số chuẩn 148.7494 và khoảng tin cậy từ 2.61e-14 đến 2.91e+15 Đối với nhóm, ước lượng tham số cũng là 8.717677 với sai số chuẩn tương tự là 148.75 và khoảng tin cậy giống như trên Cuối cùng, sd(Residual) được ước lượng là 7.1062 với sai số chuẩn 0.8146243 và khoảng tin cậy từ 5.676222 đến 8.896425.
Kết quả phân tích trong Bảng 2.11c và 2.11d cho thấy có hai biến độc lập có tác động một cách có ý nghĩa đến tỷ lệ phá thai là “chuapkhoa” và
Hệ số hồi quy của "tlebcstrt" lần lượt là 2,58 và -2,8 Tuy nhiên, phân tích trong Bảng 10d chỉ ra rằng độ lệch tiêu chuẩn của hệ số chặn cho thấy sự biến động giữa các đơn vị mức 2 và mức 3, tức là giữa các xã và các nhóm, với khoảng tin cậy gần 0 Sai số tiêu chuẩn lớn khiến chúng ta không thể khẳng định khoảng ước lượng này có tách biệt với điểm 0 hay không Điều này chỉ ra rằng không có sự khác biệt về phương sai giữa các nhóm trong mô hình, và mô hình 3 mức này không thực sự có ý nghĩa.
Phân tích tác động đến bệnh viêm phổi
Kết quả phân tích mô hình nhiều mức với biến phụ thuộc "tleviemphoi" cho thấy, ở mức 1, các quan sát được thực hiện trong từng năm tại mỗi xã, trong khi xã là đơn vị ở mức 2 Kết quả chi tiết của phân tích này được trình bày trong Bảng 2.12a.
Bảng 2.12a: Mô hình hồi quy nhiều mức đánh giá tác động của các nhân tố đến bênh viêm phổi
Kết quả hồi quy cho thấy biến độc lập "bsytsdan" có hệ số hồi quy -0.85 với giá trị ý nghĩa 0.394, trong khi "soluotdtnoitr" có hệ số 3.90 và giá trị ý nghĩa 0.000, cho thấy sự ảnh hưởng mạnh mẽ Biến "dsytsdan" có hệ số -0.72 và giá trị ý nghĩa 0.473, còn "songaydtnoitr" có hệ số -1.75 với giá trị 0.080, gần ngưỡng ý nghĩa Biến "ddtsdan" có hệ số 1.90 và giá trị 0.057, cho thấy tiềm năng ảnh hưởng "solandtngtru" có hệ số 1.03 nhưng giá trị ý nghĩa 0.304 không đủ thuyết phục Biến "hstsdan" có hệ số -0.14 và giá trị 0.889, không có ý nghĩa "solansieuam" có hệ số 1.08 với giá trị 0.280, trong khi "lgytsdan" có hệ số 0.16 và giá trị 0.870, cả hai đều không có ý nghĩa thống kê "tlekhduphong" có hệ số -0.07 và giá trị 0.946, và "slankbtb" có hệ số -2.93 với giá trị 0.003, cho thấy sự ảnh hưởng đáng kể Cuối cùng, "slankhduphong" có hệ số 0.15 và giá trị 0.883, trong khi "solankbyht" có hệ số 1.25 với giá trị 0.210 Hằng số (_cons) có giá trị 3.66 và giá trị ý nghĩa 0.000, cho thấy mô hình có ý nghĩa tổng thể.
Kết quả phân tích cho thấy các biến độc lập “slankbtb” và “soluotdtnoitrtb” ảnh hưởng đến tỷ lệ mắc bệnh viêm phổi với xác suất ý nghĩa nhỏ hơn 5% Hệ số hồi quy cho thấy số lần điều trị trung bình làm giảm 2,93% tỷ lệ mắc bệnh viêm phổi, trong khi số lượt điều trị nội trú lại tăng 3,9 lượt khi tỷ lệ mắc bệnh viêm phổi tăng 1% Điều này cho thấy mối quan hệ ngược chiều giữa số lần khám bệnh và tỷ lệ mắc bệnh viêm phổi.
Bảng 2.12b trình bày phân tích hiệu quả ngẫu nhiên trong mô hình dự báo tỷ lệ mắc bệnh viêm phổi Kết quả ước lượng tham số cho sd(_cons) là 14.21445 với sai số chuẩn 1.821189, khoảng tin cậy nằm trong khoảng (11.05789 ; 18.27208) Đối với sd(Residual), giá trị ước lượng là 8.298291, sai số chuẩn là 0.9151534, và khoảng tin cậy là (6.685228 ; 10.30056).
Kết quả phân tích cho thấy độ lệch tiêu chuẩn của hệ số chặn và phần dư đều khác 0 một cách có ý nghĩa, cho phép khẳng định sự biến động đáng kể về tỷ lệ mắc bệnh viêm phổi giữa các xã Khoảng tin cậy các ước lượng tách biệt so với 0, chứng minh sự khác biệt trong tỷ lệ mắc bệnh.
Phân tích các tác động đến tỷ lệ xét nghiệm sốt rét
Chúng tôi tiến hành phân tích các yếu tố tác động đến tỷ lệ mắc bệnh sốt rét thông qua mô hình hồi quy tuyến tính nhiều mức Biến phụ thuộc trong nghiên cứu là "xnsotret", trong khi các biến độc lập bao gồm số lượng cán bộ y tế cấp địa phương và tình hình tiêm phòng.
Phân tích trong Bảng 2.13a cho thấy hai biến độc lập “tletpbcg” và “tletpvgant24” có ảnh hưởng đến tỷ lệ xét nghiệm sốt rét với xác suất ý nghĩa dưới 5%, với hệ số hồi quy lần lượt là 2,75 và 3,46 Trong khi đó, các biến mô tả đội ngũ cán bộ y tế không có tác động ý nghĩa đến tỷ lệ xét nghiệm sốt rét.
Bảng 2.13a: Mô hình nhiều mức phân tích tác động đến tỷ lệ xét nghiệm sốt rét
The regression analysis reveals significant insights regarding independent variables and their effects Notably, the variable "tyssinh" shows a strong positive correlation with a coefficient of 1.18 and a p-value of 0.240 Conversely, "tletpvgant24" has a significant impact, with a coefficient of 3.46 and a p-value of 0.001 Other variables such as "dsytsdan" and "hstsdan" demonstrate weaker relationships, with coefficients of 0.48 and 0.35, respectively, and high p-values indicating lack of significance The variable "tletpbcg" also stands out with a coefficient of 2.75 and a p-value of 0.006, indicating a strong significance Overall, the analysis highlights varying degrees of significance among the independent variables, suggesting further investigation is warranted for those with p-values approaching conventional thresholds.
Bảng 2.13b: Phân tích hiệu quả ngẫu nhiên mô hình dự báo tỷ lệ mắc sốt rét
Hiệu quả ngẫu nhiên Ước lượng tham số Sai số chuẩn Khoảng tin cậy sd(_cons) 13.75269 2.056254 (10.25933 ; 18.43555) sd(Residual) 9.514757 1.19852 (7.433215 ; 12.1792)
Kết quả phân tích cho thấy độ lệch tiêu chuẩn của hệ số chặn và phần dư đều khác 0 một cách có ý nghĩa Khoảng tin cậy của các ước lượng tách biệt so với 0, điều này khẳng định sự biến động đáng kể về tỷ lệ mắc sốt rét giữa các xã.
Phân tích các tác động đến tỷ lệ nhiễm HIV
Mô hình nhiều mức với biến phụ thuộc “tlemachiv” được xây dựng với các quan sát theo năm là đơn vị mức 1 và xã là đơn vị mức 2 Bài viết sẽ phân tích các yếu tố ảnh hưởng đến tỷ lệ nhiễm HIV.
Theo Bảng 2.14a, các biến độc lập "dsytsdan", "tletp4m", "tlepnde", "tlepndeql" và "tlektdupnql" có ảnh hưởng đáng kể đến tỷ lệ nhiễm HIV, với xác suất ý nghĩa dưới 5% và hệ số hồi quy lần lượt là -2,49 và -2,89.
Tỷ lệ phụ nữ sinh con có ảnh hưởng tích cực đến tỷ lệ nhiễm HIV, trong khi tỷ lệ dược sĩ trên vạn dân, tỷ lệ tiêm phòng đầy đủ 4 mũi, tỷ lệ phụ nữ sinh con được quản lý và tỷ lệ kiểm tra phụ nữ được quản lý lại có tác động tiêu cực, giúp giảm tỷ lệ nhiễm HIV Đặc biệt, tỷ lệ kiểm tra dự phòng cho phụ nữ được quản lý có tác động giảm mạnh nhất, với mỗi 1% tăng lên sẽ làm giảm 5,46% tỷ lệ mắc bệnh HIV.
Bảng 2.14a: Mô hình phân tích các tác động đến tỷ lệ mắc bệnh HIV
The regression analysis revealed several independent variables with varying significance levels Notably, "tlepnde" showed a strong positive correlation with a significance of 0.007, while "tlepndeql" had an even more significant negative correlation at 0.000 Other variables like "dsytsdan" and "tletp4m" also demonstrated significance with values of 0.013 and 0.004, respectively In contrast, variables such as "hs" and "lgytsdan" exhibited high p-values, indicating a lack of significant impact Overall, the analysis highlights key independent variables that warrant further investigation for their influence on the dependent variable.
Bảng 2.14b trình bày phân tích hiệu quả ngẫu nhiên của mô hình dự báo tỷ lệ mắc HIV Kết quả cho thấy hiệu quả ngẫu nhiên ƯL tham số là 9.334757 với sai số chuẩn 0.9791024, khoảng tin cậy từ 7.600153 đến 11.46525 Đối với sai số chuẩn của phần dư, giá trị là 0.7499289 với sai số chuẩn 0.1026473, khoảng tin cậy nằm trong khoảng từ 0.5734704 đến 0.9806842.
Kết quả phân tích cho thấy độ lệch tiêu chuẩn của hệ số chặn và phần dư đều khác 0 một cách có ý nghĩa Khoảng tin cậy của các ước lượng tách biệt so với 0, khẳng định sự biến động đáng kể về tỷ lệ mắc HIV giữa các xã.
2.3.7 Phân tích các tác động ảnh hưởng đến tỷ lệ mắc bệnh tiêu chảy
Mô hình nhiều mức với biến phụ thuộc “tletieuchay” được xây dựng dựa trên các quan sát hàng năm ở cấp độ 1 và xã ở cấp độ 2 Nghiên cứu này sẽ phân tích các yếu tố tác động đến tỷ lệ mắc bệnh tiêu chảy.
Bảng 2.15a: Mô hình phân tích sự tác động đến tỷ lệ mắc bệnh tiêu chảy
Kết quả hồi quy cho thấy các biến độc lập có ảnh hưởng khác nhau đến biến phụ thuộc Biến "ddtsdan" có hệ số hồi quy 2.48 và ý nghĩa thống kê với p-value 0.013, cho thấy mối quan hệ tích cực và có ý nghĩa Biến "slankbtb" cũng thể hiện tác động mạnh với hệ số 2.83 và p-value 0.005 Ngược lại, biến "slankhduphong" có hệ số -2.45 và p-value 0.014, cho thấy mối quan hệ tiêu cực và có ý nghĩa Các biến khác như "soluotdtnoitru", "dsytsdan", và "solansieuam" không có ý nghĩa thống kê cao với p-values lần lượt là 0.770, 0.526 và 0.750 Tổng thể, các kết quả này chỉ ra rằng không phải tất cả các biến độc lập đều có ảnh hưởng rõ rệt đến biến phụ thuộc trong mô hình hồi quy.
Kết quả phân tích trong Bảng 2.15a cho ta thấy các biến độc lập “ddtsdan”,
Nghiên cứu cho thấy "slankbtb" và "slankhduphong" có ảnh hưởng đáng kể đến tỷ lệ mắc bệnh tiêu chảy, với xác suất dưới 5% và hệ số hồi quy lần lượt là 2.48 và 2.83 Điều này chỉ ra rằng tỷ lệ điều dưỡng và số lần khám bệnh trung bình làm tăng nguy cơ mắc bệnh tiêu chảy, trong khi số lần khám dự phòng lại có tác động giảm tỷ lệ mắc bệnh Vì vậy, bệnh tiêu chảy cần được chăm sóc và điều trị tích cực tại các cơ sở y tế địa phương, và việc thực hiện khám dự phòng hiệu quả sẽ góp phần giảm thiểu tỷ lệ mắc bệnh này.
Bảng 2.15b trình bày phân tích hiệu quả ngẫu nhiên của mô hình dự báo tỷ lệ mắc bệnh tiêu chảy Kết quả ước lượng tham số cho sd(_cons) là 17.95972 với sai số chuẩn 2.322888, khoảng tin cậy từ 13.93818 đến 23.14157 Đối với sd(Residual), giá trị ước lượng là 8.611842, sai số chuẩn 1.019504 và khoảng tin cậy nằm trong khoảng từ 6.828534 đến 10.86087.
Kết quả phân tích cho thấy độ lệch tiêu chuẩn của hệ số chặn và phần dư đều khác 0 một cách có ý nghĩa Khoảng tin cậy các ước lượng tách biệt so với 0, khẳng định có sự biến động đáng kể về tỷ lệ mắc tiêu chảy giữa các xã.
2.3.8 Phân tích các tác động lên bệnh thông thường
Để phân tích tác động của các yếu tố đến bệnh thông thường, chúng tôi sử dụng mô hình nhiều mức với biến phụ thuộc là thành phần chính của bệnh Các quan sát hàng năm được xem là biến ở mức 1, trong khi đơn vị mức 2 là xã Kết quả phân tích được trình bày trong Bảng 2.16a.
Bảng 2.16a: Mô hình phân tích sự tác động của các yếu tố đến các bệnh thông thường
The regression analysis reveals significant independent variables influencing the model Notably, "dsytsdan" shows a strong negative correlation with a significance level of 0.034, indicating its importance Conversely, variables such as "tletpvgand24," "tletpdu9," and "tletpmnao" demonstrate non-significant relationships, with p-values of 0.144, 0.929, and 0.275, respectively Additionally, "ybsytsdan" and "tletp4m" present marginal significance with p-values of 0.098 and 0.154 Overall, the analysis highlights the varying levels of significance among the independent variables, emphasizing the need for further investigation into their impacts on the dependent variable.
Kết quả phân tích chỉ ra rằng biến độc lập “dsytsdan” có ảnh hưởng đáng kể đến bệnh thông thường với xác suất ý nghĩa dưới 5% Hệ số hồi quy là -2,13, cho thấy việc tăng thêm 1 dược sĩ trên mỗi 10.000 dân có khả năng giúp giảm tỷ lệ mắc bệnh.
Tỷ lệ người mắc các bệnh thông thường đạt 2,13%, cho thấy vai trò quan trọng của dược sĩ tại các cơ sở địa phương trong việc phòng ngừa và kiểm soát các bệnh này.
Bảng 2.16b: Phân tích hiệu quả ngẫu nhiên mô hình dự báo tỷ lệ mắc bệnh thông thường
Hiệu quả ngẫu nhiên ƯL tham số Sai số chuẩn Khoảng tin cậy sd(_cons) 0.8572119 0.1104256 (0.6659427 ; 1.103417) sd(Residual) 0.4077217 0.0532315 (0.3156693 ; 0.5266176)