Chương 1 sẽ trình bày cơ sở lý thuyết,phương pháp thống kê được sử dụng trong nghiên cứu này, đó là phươngpháp phân tích nhiều mức được trình bày dựa trên cơ sở phân tích hồi quybội một
Trang 1Mục lục
1.1 Giới thiệu 5
1.2 Mô hình hai mức 7
1.2.1 Mô hình hồi quy tuyến tính đơn hai mức 7
1.2.2 Ước lượng các tham số cho mô hình đơn biến hai mức 10
1.2.3 Phần dư trong mô hình hai mức 11
1.2.4 Gán trọng số cho các đơn vị 12
1.2.5 Ước lượng Jacknife và ước lượng Bootstrap 14
1.2.6 Mô hình hồi quy đa biến hai mức 16
1.2.7 Mở rộng mô hình hai mức 17
1.3 Mô hình nhiều mức 18
1.3.1 Mô hình nhiều mức 18
1.3.2 Ước lượng các tham số 19
1.3.3 Xác định giá trị ban đầu của quá trình lặp 21
1.4 Kiểm định sự phù hợp của mô hình 22
1.4.1 Kiểm định một hệ số hồi quy 22
1.4.2 Kiểm định sự phù hợp của mô hình 23
1.5 Phân tích thành phần chính 24
2 Phân tích tình hình chăm sóc sức khỏe cộng đồng huyện Thái Thụy 27 2.1 Vài nét về lịch sử phát triển, tự nhiên xã hội huyện Thái Thụy 27
2.2 Mô tả số liệu 28
2.3 Một số kết quả phân tích 42
2.3.1 Phân tích tác động đến tỷ lệ trẻ em chết dưới 1 tuổi 42
2.3.2 Phân tích tác động đến tỷ lệ sinh con thứ 3 43
2.3.3 Phân tích sự tác động đến tỷ lệ phá thai 45
2.3.4 Phân tích tác động đến bệnh viêm phổi 47
2.3.5 Phân tích các tác động đến tỷ lệ xét nghiệm sốt rét 49
2.3.6 Phân tích các tác động đến tỷ lệ nhiễm HIV 50
Trang 22.3.7 Phân tích các tác động ảnh hưởng đến tỷ lệ mắc bệnh tiêu
chảy 512.3.8 Phân tích các tác động lên bệnh thông thường 532.4 Bàn luận và kiến nghị 54
Trang 3ở huyện Thái Thụy, đồng thời tác giả cũng mạnh dạn đưa ra những kiếnnghị để có được những biện pháp tích cực phù hợp với thực tế địa phương,cải thiện tình hình chăm sóc sức khỏe cộng đồng.
Luận văn bao gồm hai chương Chương 1 sẽ trình bày cơ sở lý thuyết,phương pháp thống kê được sử dụng trong nghiên cứu này, đó là phươngpháp phân tích nhiều mức được trình bày dựa trên cơ sở phân tích hồi quybội một mức rồi mở rộng cho mô hình hai mức và tương tự cho các mứccao hơn Chương 2 mô tả số liệu và trình bày một số kết quả phân tíchcác yếu tố ảnh hưởng đến tỷ lệ tử vong, tỷ lệ sinh con thứ 3 và các loạibệnh tật Sau đó sẽ tập trung vào lý giải các kết quả có được và đưa ramột số kiến nghị nhằm xây dựng chiến lược y tế sao cho phù hợp với nhucầu và yêu cầu thực tế của xã hội
Luận văn được hoàn thành dưới sự hướng dẫn của PGS – TS Hồ Đăng
Trang 4Phúc, Viện Toán Học – Viện Hàn Lâm Khoa Học Và Công Nghệ ViệtNam Tôi xin bày tỏ lòng biết ơn chân thành và sâu sắc tới thầy, người đãchỉ dẫn tận tình và giúp đỡ tôi trong suốt quá trình hoàn thành luận vănnày.
Đặc biệt, tôi xin gửi lời cảm ơn chân thành đến Ban giám đốc TrungTâm Y Tế Dự phòng Huyện Thái Thụy đã tận tình giúp đỡ và cung cấp
số liệu đầy đủ cho nghiên cứu, nếu thiếu số liệu quý báu này thì luận vănnày sẽ không thể thực hiện được
Tôi xin gửi lời cảm ơn sâu sắc đến gia đình đã tạo mọi điều kiện để tôi
có thể hoàn thành luận văn Đồng thời tôi xin cảm ơn đến anh chị em lớpcao học Lý thuyết xác suất và Thống kê toán học khóa 2011 – 2013 đã cónhững đóng góp chân thành giúp tôi hoàn thành luận văn của mình.Tuy đã có nhiều cố gắng nhưng bản luận văn này không tránh khỏinhững thiếu xót, tôi rất mong nhận được sự đóng góp ý kiến của các thầy
cô, các nhà nghiên cứu Xác suất Thống kê và độc giả quan tâm để bảnluận văn này được hoàn thiện hơn Tôi xin chân thành cảm ơn
Hà Nội, tháng 10 năm 2014
Trang 5về con người và động vật với hệ thống phân mức tự nhiên mà mỗi cá thểđược nhóm thành các gia đình Những con người có cùng cha mẹ sinh ra
sẽ có những đặc tính giống nhau về thể chất, tính cách hơn những ngườikhông cùng cha mẹ sinh ra Do đó cá thể trong gia đình nói trên là đơn
vị mức một trong cấu trúc hai mức mà mức hai có đơn vị là gia đình, hayhọc sinh có thể là đơn vị mức một trong cấu trúc hai mức mà mức hai
có đơn vị là trường Các thành viên trong nhóm cũng có xu hướng hoạtđộng khác nhau, tuy nhiên luôn tồn tại sự tác động qua lại giữa các thànhviên trong nhóm Nếu bỏ qua mối quan hệ đó có thể không thấy được tầmquan trọng của tác động nhóm, từ đó dẫn đến những kết quả không hợp
lý khi sử dụng kỹ thuật phân tích cổ điển trong việc nghiên cứu các mối
Trang 6quan hệ giữa chúng.
Hệ thống trường học cho chúng ta cái nhìn rõ ràng về cấu trúc phânmức, với học sinh được phân thành nhóm hoặc được ghép với nhau thànhlớp học Các lớp lại được tổ chức trong một đơn vị mức cao hơn là trường.Các nhà khoa học thường quan tâm đến việc so sánh thành tích học tậpcủa học sinh, việc so sánh đó nhằm nâng cao thành tích học tập và tráchnhiệm chung trong giáo dục Họ đã chọn ngẫu nhiên một số trường phổthông và tiến hành điều tra kết quả học tập vào cuối năm để biết việcgiảng dạy mỗi môn học cụ thể trong trường có liên hệ như thế nào đến vớikết quả cuối năm học Người ta còn có những tiêu chí đánh giá đầu vàocủa học sinh khi bắt đầu nhập học làm cơ sở để phân tích thành tích họctập của học sinh
Phương pháp truyền thống để phân tích dữ liệu kiểu này là phân tíchhồi quy, dựa vào điểm số để nghiên cứu quan hệ giữa việc phân mức hiệntại và thành tích học tập của học sinh
Phân tích chỉ ra rằng mô hình nhiều mức có nhiều ưu điểm hơn Đầutiên, nó cho phép các nhà nghiên cứu có được ước lượng hiệu quả của hệ
số hồi quy Thứ hai, bằng cách sử dụng thông tin phân mức ta có thể thuđược một cách đúng hơn độ lệch tiêu chuẩn, khoảng tin cậy và tiêu chuẩnkiểm định Các kết quả này thường chính xác hơn so với phương pháp
cổ điển mà trong đó bỏ qua sự ảnh hưởng của phân mức Thứ ba, bằngphương pháp này ta có thể tính được hiệp phương sai ở từng mức, điềunày giúp các nhà nghiên cứu chỉ ra sự khác biệt về kết quả học tập giữacác trường là do phương thức giáo dục hay đặc điểm học sinh Ngoài ra ta
có thể nghiên cứu mở rộng ra các đối tượng sinh viên ở các trường khácnhau Chẳng hạn liệu sự khác biệt giữa sinh viên đầu vào cao hơn so vớicác trường có đầu vào thấp hơn có là nhân tố để giải thích sự khác nhau
về thành tích học tập trong quá trình học tập của sinh viên hay không
Trang 71.2 Mô hình hai mức
1.2.1 Mô hình hồi quy tuyến tính đơn hai mức
Xét tập dữ liệu bao gồm thông tin học sinh của một số trường cấp 3.Người ta xem xét điểm thi toán vào lớp 10 và điểm thi tốt nghiệp của họcsinh các trường đó, dữ liệu đó có cấu trúc nhiều mức Có thể coi học sinh
là đơn vị của mức 1, mỗi trường là đơn vị của mức 2 Xét mô hình hồi quytuyến tính đơn mức cho một trường nào đó đã được chọn, thể hiện quan
hệ giữa điểm thi toán tốt nghiệp so với điểm thi toán vào lớp 10
với α là hệ số chặn, β là hệ số dốc, ei là phần dư Đây được gọi là môhình một mức Để mô tả mối liên hệ đồng thời cho nhiều trường, chẳnghạn trường j ta viết
Ở đây j được đánh dấu cho đơn vị mức 2, chỉ số i đánh dấu cho đơn vịmức 1
Về mặt hình thức thì (1.2) vẫn là mô hình một mức dù sự mô tả táchbiết cho mỗi trường Trong một vài trường hợp, chẳng han như có ít trườngđược chọn hoặc sự quan tâm tập trung vào một số trường nào đó, mô hình(1.2) được sử dụng để phân tích, khi đó cần ước lượng 2n + 1 tham số đó
là (αj, βj) với j = 1, 2, , n và σe2
Giả thiết ở đây là mô hình có chung phương sai phần dư và đườngthẳng hồi quy biểu diễn cho mỗi trường là khác biệt Nếu mong muốnkhông chỉ tập trung vào các trường này mà còn mở rộng ra nghiên cứu ởcác trường khác thì chúng ta cần coi các trường cần nghiên cứu mang cácđặc tính của trường được chọn Như vậy ta chỉ chọn các mẫu ngẫu nhiêncủa cá thể để cung cấp nghiên cứu đưa ra các kì vọng lí thuyết, vì vậymỗi mẫu ngẫu nhiên các trường được chọn có thể cung cấp thông tin về
Trang 8tình hình chung của tất cả các trường Nói riêng, nghiên cứu một mẫu cóthể đưa ra ước lượng phương sai, hiệp phương sai giữa các trường Mộttrường hợp quan trọng xuất hiện khi ta mong muốn thông tin về từngtrường trong mẫu nhưng do số lượng các trường trong mẫu lớn nên (1.2)đòi hỏi phải ước lượng rất nhiều tham số Hơn nữa, một số trường khá íthọc sinh và việc áp dụng (1.2) sẽ dẫn đến các ước lượng thiếu chính xác.Trong trường hợp đó ta coi trường này như phần tử của đám đông và sửdụng các ước lượng, kỳ vọng, phương sai mẫu ta có thể ước lượng chínhxác hơn.
Để đưa (1.2) về hai mức ta coi αj, βj là các biến ngẫu nhiên Ta thay
αj bởi β0j, βj bởi β1j Giả sử
var(u0j) = σ2u0, var(u1j) = σu12 , cov(u0j, u1j) = σu01
Khi đó (1.2) được viết lại thành
yij = β0 + β1xij + (u0j + u1jxij + e0ij),var(eij) = σe02
Trang 9thì (1.4) được viết lại thành
yij = xTijui + zijTβ + eij (1.5)Các biến ngẫu nhiên được xem như phần dư và trong trường hợp môhình một mức, phần dư mức 1 làe0ij trở thành phần dư của mô hình tuyếntính thông thường
Mô hình hồi quy (1.4) khác biệt so với mô hình thông thường là sự cómặt nhiều hơn một thành phấn số dư Điều đó đưa đến việc phải có cáchđặc biệt hơn để ước lượng các tham số Nó đòi hỏi ước lượng như vậy chohai hệ số β0 và β1 Chúng ta xem phương sai và hiệp phương sai như cácbiến ngẫu nhiên Ta bắt đầu với mô hình hai mức đơn giản nhất chỉ gồmhai tham số σ2u0, σe02 Khi đó thành phần dự báo có được là
σ2 u0 + σ2
e0
(1.6)
đại lượng này được xem như hệ số tương quan nội tại đơn vị mức hai
Trang 101.2.2 Ước lượng các tham số cho mô hình đơn biến
hai mức
Xét mô hình phương sai thành phần đơn biến hai mức
yij = β0 + β1xij + u0j + e0ij (1.7)Trong mô hình này chỉ có hệ số chặn là ngẫu nhiên Giả sử đã biết các giátrị của phương sai, dùng phương pháp bình phương bé nhất tổng quát đểtìm được ước lượng βˆ của hệ số cố định
Trang 11được biểu diễn bằng mô hình tuyến tính sau
Đưa ma trận V mới ước lượng về (1.8) ta sẽ tính được β.ˆ Tiếp đó thay βˆ
vào (1.10) và lặp lại quá trình trên Quá tình lặp được thực hiện cho đếnkhi nhận được giá trị ước lượng ổn định
1.2.3 Phần dư trong mô hình hai mức
Trong mô hình (1.1) ước lượng thông thường cho phần dư ei chỉ là y˜i
Tuy nhiên trong mô hình nhiều mức ta sẽ có tham số phần dư ở các mứckhác nhau Ta sẽ ước lượng cho phần dư ở từng mức cụ thể Cho trướctham số cần ước lượng, ta đi ước lượng các tham số phần dư, gọi u0j làsai số mô hình thành phần ở mức 2 Cụ thể, ta xét mô hình 2 mức
ˆ
u0j = E(u0j|Y, ˆβ, ˆΩ) (1.12)
Trang 12Nếu bỏ qua phương sai mẫu mà chỉ ước lượng các tham số trong (1.12) tacó
cov(˜yij, u0j) = cov(yij − ˆβ0 − ˆβ1xij; u0j)
= cov[(β0 − ˆβ0) + (β1 − ˆβ1)xij + u0j + u1jxij + e0ij; u0j]
= cov[(u0j + u1jxij + e0ij); u0j]
= var(u0j) = σu02cov(˜yij, e0ij) = cov(u0j + u1jxij + e0ij, e0ij)
= var(e0ij) = σ2e0var(˜yij) = cov(˜yij, ˜yij) = cov(u0j + u1jxij + e0ij; u0j + u1jxij + e0ij)
= cov(u0j, u0j) + cov(e0ij, e0ij)
= σu02 + σe02
Ta thấy (1.12) là mô hình hồi quy tuyến tính của u0j trên các đơn vị haimức {˜yij}với chỉ số j dùng cho mức 2 và (1.7) xác định các đại lượng cầnthiết để ước lượng hệ số hồi quy Đối với mô hình phương sai thành phần
ta thu được
u0j = ujσ
2 u
(njσ2
u− σ2 e0)y˜j
1.2.4 Gán trọng số cho các đơn vị
Xét mô hình hai mức, kí hiệu wj để chỉ trọng số đơn vị mức 2 thứ j và
kí hiệu wi|j để chỉ trọng số mức 1 thứ i trong mức 2 thứ j sao cho
Trang 13với J là số đơn vị mức 2 và N = jnj là số đơn vị mức 1 Ta viết
Kí hiệu V∗ là ma trận trọng số trong phân tích
Dưới đây ta đưa ra quy tắc ước lượng để sử dụng Zu∗, Ze∗ như là hệ số cốđịnh và ma trận hiệp phương sai được ước lượng theo thủ tục tương tựnhư đã trình bày ở mục 1.2.3, ta sử dụng công thức
ˆ
β = (XTV∗X)−1XTV∗−1Ycov( ˆβ) = (XTV∗X)−1XTV∗−1V V∗−1(XTV∗X)−1
Để tính phần dư ta có thể ước lượng như sau
ˆ2 = Ω2Zu∗TV∗−1Y˜cov(ˆp2) = Ω2Zu∗TV∗−1(V )V∗−1Zu∗Ω2
V = E( ˜Y ˜YT)
Trang 141.2.5 Ước lượng Jacknife và ước lượng Bootstrap
Cho đến thời điểm này ta luôn giả thiết rằng các biến phụ thuộc đều cóphân bố chuẩn và việc xuất phát từ các phân bố chuẩn là có ý nghĩa quantrọng Tuy nhiên, ta thấy rằng các dữ liệu thu thập từ thực tế thường là
dữ liệu rời rạc hoặc không đối xứng Ước lượng của các tham số cố định
và các tham số ngẫu nhiên vẫn phù hợp khi tính chuẩn không thỏa mãn,nhưng sai số tiêu chuẩn không thể được sử dụng để tính khoảng tin cậyhoặc kiểm định giả thuyết trừ khi mẫu rất lớn
Cách để khắc phục vấn đề này là phát triển các phương pháp ước lượngdựa trên các giả định phân phối khác Trong chương sau chúng ta sẽ ápdụng phương pháp đó khi làm việc với dữ liệu rời rạc và dữ liệu có thứ tự.Phương pháp thay thế khác là thay đổi cách tính sai số tiêu chuẩn vàkhoảng tin cậy sao cho chúng ít phụ thuộc vào phân phối ban đầu của dữliệu Một trong các nhược điểm của phương pháp này là kết quả kiểm định
và khoảng tin cậy sẽ bị mở rộng hơn so với các dữ liệu có phân phối cụthể
Đầu tiên ta xét phần cố định của mô hình và ước lượng lặp bình phương
bé nhất tổng quát thông thường cho các tham số cố định dựa trên ướclượng cho các tham số ngẫu nhiên
Trang 15được khoảng tin cậy của tham số cần ước lượng.
Phương pháp linh hoạt hơn là phương pháp Bootstrap Phương pháp ướclượng Bootstrap là tập hợp một số kỹ thuật phân tích dựa vào nguyên lýchọn mẫu có hoàn lại để ước tính các thông số mà thống kê thường khônggiải được Các bước chính của ước lượng Bootstrap bao gồm:
1 Sinh ra các mẫu Bootstrap ngẫu nhiên có hoàn lại kích thước N từmẫu ban đầu
2 Tính các thống kê đặc trưng cho mẫu được sinh ra (kỳ vọng, phươngsai, độ lệch chuẩn, )
3 Lặp lại bước 1 và bước 2 với số lần lớn
4 Sử dụng các ước lượng thống kê Bootstrap đã tính ở bước 2 để đánhgiá độ chính xác các ước lượng thống kê của mẫu
Các nhà thống kê còn phát triển phương pháp Bootstrap cao cấp hơnchẳng hạn như phương pháp Bootstrap tham số đầy đủ Phương pháp này
sử dụng giả thiết phân phối ban đầu để thông qua mô phỏng tạo ra cácgiá trị dùng để ước lượng các tập bootstrap các tham số Xét mô hình haimức đơn giản với giả thiết các giá trị các biến ngẫu nhiên có phân phốichuẩn tắc
yij = (Xβ)ij + uj + eijvar(uj) = σu2, var(eij) = σe2
Để tạo ra mẫu Bootstrap ta chọn ngẫu nhiên từ N (0, σu2) một tậpgiá trị mức hai u∗j và ứng với mỗi giá trị mức hai này tạo ra tập e∗ij từ
N (0, σu2) Những bổ sung này được bổ sung để kết hợp với tập hợp cácgiá trị Bootstrap của X và yij tạo ra từ mẫu để ước lượng các tham số
ˆ
β∗, ˆσ∗u2, ˆσe∗2 bằng cách sử dụng các thủ tục cho mẫu thông thường
Trang 161.2.6 Mô hình hồi quy đa biến hai mức
Chúng ta mở rộng (1.4) bằng cách thêm vào các biến độc lập
uhjzhij + e0ijz0ij
ở đây ta dùng các biến độc lập cho thành phần ngẫu nhiên của mô hình
Z = {Z0 Z1}
Z0 = {1}
Z1 = {xij}
trong đó {1} dùng để chỉ vectơ chứa các thành phần bằng 1 Kí hiệu Ω1 là
ma trận hiệp phương sai của các biến ngẫu nhiên ở mức 1, Ω2 là ma trậnhiệp phương sai của các hệ số ngẫu nhiên ở mức 2
Ω1 = (σ2e0), Ω2 = σ
2 u0 σu01
Trang 17Một khía cạnh mong muốn khác của mô hình nhiều mức là là chúng
ta có thể sửa đổi quan hệ có điều kiện ở mỗi mức của mô hình, tùy thuộcvào sự quan tâm nghiên cứu Chẳng hạn, chúng ta có thể hiểu được đặcđiểm của trường ảnh hưởng đến thành tích học tập của học sinh như thếnào Ta hiệu chỉnh mô hình 2 mức trong biểu thức (1.3) như sau
Số hạng β11zixij là tác động liên kết giữa biến mức 1 xij và biến mức zi,
được coi là tương tác giữa các mức
Để xét mô hình với nhiều biến giải thích, ta mở rộng mô hình (1.2)
như sau:
yij = xT1ijβ1 + z1ijT βi + eij, (1.15)trong đó x1ij và z1ij biểu diễn tập các biến mức 1 liên kết với các biến khác(trên mức 1) Khi đó mô hình mức 2 có dạng
βi = (X2iβ2 + ui), Eui = 0 (1.16)Kết hợp (1.13) và (1.14) ta được
yij = xT1ij + z1ijT (X2iβ2 + ui) + eij
= xTijβ + zijTui+ eij,
Trang 18với xTij = (xT1ij z1ijT X2i); zij = z1ij, β = (β1T β2T).
Mô hình nhiều mức cho phép chúng ta đánh giá tầm quan trọng củahiệu quả phối hợp các mức Trong các nghiên cứu thống kê nhiều mức cónhiều cách đưa ra “đơn vị phân tích” khác nhau trong cùng một vấn đề,
do đó cho phép mô hình hóa các hệ thống rất phức tạp Vì vậy khả năngước lượng hiệu quả phối hợp các mức là một ưu điểm của mô hình nhiềumức so với chiến lược phân tích riêng rẽ cho từng mức
Mô hình nhiều mức cấp hai và các mức cao hơn cũng cung cấp chochúng ta khả năng để ước lượng cấu trúc phương sai Việc cải thiện cấutrúc phương sai này cung cấp cho chúng ta hiểu biết tốt hơn về toàn bộ
mô hình và thường đưa đến kết quả trong việc cải thiện độ chính xác củaước lượng so với mô hình hồi quy thông thường
1.3 Mô hình nhiều mức
1.3.1 Mô hình nhiều mức
Việc mở rộng ra số mức nhiều hơn cũng được làm tương tự như đối với
mô hình hai mức Chúng ta xét mô hình mức 1 là:
yijk = xT1ijkβ1 + z1ijkT βij + e1ijk (1.17)Trong đó hệ số y là thành tích học tập của học sinh, i = 1, 2, , n là chỉ
số trường, j = 1, , Ji là chỉ số lớp trong trường thứ i và k = 1, , Kij làchỉ số sinh viên trong lớp thứ i (trong trường j)
Biến giải thích x1ijk, z1ijk có thể phụ thuộc vào sinh viên (giới tính, thunhập gia đình, ), phụ thuộc vào lớp (đặc điểm giáo viên, cơ sở vật chất,lớp học, ) hay trường (quy mô, cấu trúc, địa điểm, ) Các tham số màvừa phụ thuộc vào trường i, lớp j thì xuất hiện như một phần của vectơ
βij, trong khi các tham số là hằng số thì xuất hiện trong vectơ β1
Trung bình và phương sai có điều kiện theo trường và lớp của thành
Trang 19phần ngẫu nhiên e1ijk là bằng 0 và hằng số trên tất cả học sinh, lớp vàtrường Mô hình mức 2 mô tả biến động tại mức lớp học có dạng
βij = X2ijβ2 + Z2ijγi+ e2ij (1.18)
tương tự Z2ij và X2ij có thể phụ thuộc vào lớp hoặc trường nhưng khôngphụ thuộc vào học sinh các tham số kết hợp với biến giải thích Z2ij là γi
thì phụ thuộc vào trường i, các tham số kết hợp X2ij là hệ số Trung bình
và phương sai có điều kiện theo trường hợp của thành phần ngẫu nhiên
e2ij = 0 tương ứng bằng 0 và hằng số
Mô hình mức 3 miêu tả các biến động cấp trường, do tham số γi cóthể thay đổi nhưng không ngẫu nhiên hoặc ngẫu nhiên Mô hình 3 mức códạng
Biến giải thích X2ij và Z2ij có thể phụ thuộc vào trường Trung bình vàphương sai có điều kiện của thành phần ngẫu nhiên e3i tương ứng bằng 0
và hằng số trên các trường Kết hợp (1.17), (1.18), (1.19) ta được
yijk = xT1ijkβ1 + [X2ijβ2 + Z2ij(X3iβ3 + e3i) + e2ij]z1ijkT + e1ijk
= xT1ijkβ1 + z1ijkT X2ijβ2 + z1ijkT Z2ijX3iβ3 + zTijkZ2ije3i+ z1ijkT e2ij + e1ijk
= xTijkβ + zijkT uij + e1ijk
với xTijk = (xT1ijk; z1ijkT X2ij; z1ijkT Z2ijX3i), β = (β1T; β2T; β3T)
Biểu thức này thể hiện mô hình 3 mức là mô hình hiệu quả tuyến tính hỗnhợp
1.3.2 Ước lượng các tham số
Xét mô hình nhiều mức có dạng
yij = xTijβ + zijTui + eij
Trang 20Chúng ta xem xét hàm hồi quy có điều kiện dạng
E(yij|ui) = xTijβ + zijTui
Biểu thức này được viết chi tiết dưới dạng
E(yij|ui) = β1xij1+ β2xij2 + + βkxijk + ui1zij1+ ui2zij2+ + uiqzijq
4 {yi} là những vectơ ngẫu nhiên độc lập có điều kiện trên{u1, ; un};
5 {yi} có phân phối chuẩn có điều kiện trên {u1; ; un};
6 Eui = 0, var(ui) = D và {u1, ; un} độc lập;
7 {ui} có phân phối chuẩn
Khi đó
V ar(yi) = ZiDZiT + Ri = Vi(τ ) = Vi (1.20)Bằng phương pháp ước lượng bình phương bé nhất tổng quát ta thu đượcước lượng của β là
Trang 21và phương sai V arˆ(β)GLS = (
sau đó thay Vi tính được vào công thức (1.19) ta thu được β.ˆ Với βˆ đã
được ước lượng ta thay vào (1.20), (1.21) thu được thành phần phương sai
Vi Quá trình trên được tiến hành lặp đi lặp lại cho đến khi thu được mộtước lượng hội tụ
1.3.3 Xác định giá trị ban đầu của quá trình lặp
Để ước lượng hệ số hồi quy và thành phần phương sai đòi hỏi ta cần cógiá trị ban đầu cho quá trình lặp Để xác định được giá trị ban đầu này, ta
sử dụng phương pháp moment Swamy với giả thiết xij = zij và Ri = σi2Ii,
sau đó tiến hành qua các bước sau
1 Tính toán ước lượng bình phương bé nhất của σi2
Trang 222 Tiếp theo, tính toán bi = (XiTXi)−1XiTyi, như một dự báo của β + ui.
3 Cuối cùng, ước lượng D bằng
1.4 Kiểm định sự phù hợp của mô hình
1.4.1 Kiểm định một hệ số hồi quy
Trong nhiều phân tích thống kê, mục tiêu chính của kiểm định là đánhgiá xem hệ số hồi quy có bằng giá trị đặc biệt nào đó hay không Ta quantâm đến việc kiểm định giả thuyết: H0 : βj = βj,0/K : βj 6= βj,0 (thườngthì βj,0 được cho bằng 0)
Thủ tục thông thường bắt đầu bằng việc lập thống kê
t =
ˆ
βj,GLS − βj,0se( ˆβj,GLS)
Trang 23trong đóβˆj,GLS là thành phần thứj củaβˆj,GLS trong biểu thức vàse( ˆβj,GLS)
là căn bậc hai của thành phần đường chéo thứ j của (
n
P
i=1
XiTVi−1Xi)−1
Sau đó đánh giá H0 bằng cách so sánh thống kê tvới một biến ngẫu nhiên
có phân phối t - Student với số bậc tự do thích hợp phụ thuộc vào dữ liệuban đầu và mục đích phân tích Trong thực hành, do phân phối t - Studentxấp xỉ phân phối chuẩn tắc khi mẫu đủ lớn nên ta có thể thay thế phânphối t-student bằng phân phối chuẩn tắc Nguyên tắc này được áp dụngtrong các phần mềm phân tích nhiều mức
1.4.2 Kiểm định sự phù hợp của mô hình
Để kiểm tra giả thuyết liên quan đến một vài hệ số hồi quy đồng thời,thủ tục thông thường là kiểm định tỷ số hợp lý Ta có thể xem xét giảthuyết H0 : Cβ = d trong đó C là ma trận p × k với hạng bằng p, d là làmột vectơ p × 1 (thường là vectơ 0) và β là một vectơ k × 1 của các hệ sốhồi quy Giả thuyết này được kiểm tra so sánh với đối thuyết H1 : Cβ 6= d
Thủ tục kiểm định tham số hợp lý được tiến hành theo các bước sau
1 Sử dụng mô hình không có ràng buộc, tính toán ước lượng hợp lí cựcđại và hàm log hợp lý tương ứng, kí hiệu là LM LE
2 Đối với mô hình có ràng buộc thì sử dụng giả thuyết H0 : Cβ = d,
tính toán ước lượng hợp lí cực đại và hàm log hợp lý tương ứng, kíhiệu LReduced
3 Tính hàm log tỉ số hợp lý để kiểm định hiểu quả, LRT = 2(LM LE −
Trang 241.5 Phân tích thành phần chính
Giả sử ta có một tập dữ liệu từ một mẫu bao gồm ncá thể, mỗi cá thểđược đo p chỉ tiêu Khi p rất lớn thì số liệu cồng kềnh và khó thấy nhữngthông tin chứa trong đó Để có được hình ảnh đỡ phức tạp của dữ liệungười ta mong muốn xây dựng một biểu diễn đơn giản hơn sao cho trongbiểu diễn đó đám mây số liệu được thể hiện rõ nhất và không làm mấtđáng kể thông tin ban đầu Phân tích thành phần chính là một phươngpháp nhằm mục đích như vậy
Cho một vecto ngẫu nhiên p chiều X mà ta có n quan sát độc lập
X1, X2, , Xn của vecto ngẫu nhiên đó Khi ấy
từ các điểm của đám mây đến nó là nhỏ nhất Thành phần chính thứ hai
là biến trực giao với thành phần chính thứ nhất và có biểu diễn là đườngthẳng ∆2 sao cho tổng bình phương khoảng cách từ các điểm trên đámmây đến nó là nhỏ nhất Khi đó ∆1 và ∆2 tạo ra một mặt phẳng chính màđám mây được thể hiện rõ nhất so với mọi mặt phẳng khác Thành phầnchính thứ ba là biến trực giao với mặt phẳng chính thứ nhất và được biểudiễn bởi đường thẳng ∆3 sao cho tổng bình phương khoảng cách các điểmtrên đám mây đến nó là nhỏ nhất, Tiếp tục quá trình ta thu được một
Trang 25hệ k vecto trực giao, tạo thành siêu phẳng k chiều mà đám mây được thểhiện rõ nhất.
Gọi ∆ là đường thẳng qua tâm O, là giá của vecto đơn vị u, uTu = 1 Gọi
Mi là điểm thuộc đám mây trong không gian Rp, Hi là hình chiếu của Mi
lên ∆, khi đó độ dài OHi là ||OHi|| = (OMi)u = Xiu
tức là tìm max (Xu)TXu Như vậy bài toán đặt ra là tìm ∆1 sao cho
uT1XTXu1 → max với điều kiện uT1u1 = 0
Đặt n1XTX = M0 là ma trận hiệp phương sai Ta tìmu1sao chouT1M0u1 →
max, uT1u = 1 Điều đó tương đương với việc tìm u1 sao cho
Trang 26Vậy Y1 = uT1X với u1 là vecto riêng tương ứng với giá trị riêng lớn nhất
Vì M0u1− λu1 = 0 và uT1u1 = 1 nên µ = 0 Từ đó uy ra M0u2− λu2 = 0,
hay |M0− λ|u2 = 0.Giá trị riêng thứ hai λ2 cho tương ứng với vecto riêng
u2 chính là lời giải của phương trình đó Do đóD(Y2) = λ2,vậy Y2 = uT2X
Khi đó D(Yj) = λj ∀j = 1, k Vậy Yj = uTj X với j = 1, k
Phương sai mẫu tổng cộng là D(Y ) = λ1 + λ2 + + λk
Trang 27Chương 2
Phân tích tình hình
chăm sóc sức khỏe cộng đồng huyện Thái Thụy
2.1 Vài nét về lịch sử phát triển, tự nhiên
xã hội huyện Thái Thụy
Huyện Thái Thụy được thành lập ngày 17/6/1969, là huyện ven biểnthuộc tỉnh Thái Bình, có diện tích tự nhiên 25.773,4 ha, với 47 xã và 1 thịtrấn Huyện có 15.246 ha đất nông nghiệp và 1.189 ha mặt nước nuôi trồngthuỷ sản Dân số của huyện 266.513 người với mật độ 1.038 người/km2.Đây là huyện có diện tích, dân số lớn nhất tỉnh Thái Bình Huyện TháiThụy có 27 km bờ biển và gần 10.000 ha bãi bồi ven biển, có 3 cửa sông
và cảng biển Diêm Điền
Đất Thái Thụy được hình thành chủ yếu do quá trình bồi tụ, địa hìnhphức tạp, không bằng phẳng, nhiễm chua mặn, thuỷ lợi khó khăn, hàngnăm luôn chịu ảnh hưởng nặng nề của thủy triều dâng, biến đổi khí hậu,
Trang 28thiên tai, bão lụt.
Các hoạt động kinh tế chính của huyện bao gồm sản xuất nông nghiệp,nuôi trồng và đánh bắt thủy hải sản, công nghiệp xây dựng cơ bản vàthương mại dịch vụ Sản xuất nông nghiệp được xác định là ngành quantrọng, chiếm tỷ trọng lớn Giá trị sản xuất nuôi trồng, khai thác thủy hảisản đạt xấp xỉ 48, 7% giá trị sản xuất nông nghiệp Kinh tế thủy hải sảnphát triển theo 3 hướng: nuôi trồng, khai thác, chế biến hải sản Ngoài ragần đây huyện còn phát triển thêm ngành công nghiệp đóng tàu, vận tảibiển
Văn hóa xã hội: Mỗi xã và thị trấn trong huyện đều có trường mầmnon, trường tiểu học, trung học cơ sở và một trạm y tế Trong đó có 95trường đạt chuẩn quốc gia, 44/48 xã đạt chuẩn quốc gia về y tế
Trang 29• Bệnh đặc biệt
Thông tin trong các bảng đó được tổ chức thành các biến có tên và ý nghĩatheo mô tả dưới đây
+ Các biến mô tả dân số, sinh tử:
Thutu: Thứ tự các xã trong huyện
Tenxa: Tên các xã trong huyện
Dtich: Diện tích các xã
Sothonb: Số thôn, bản trong xã
Dso: Dân số của xã tính đến ngày 1/7 trong năm
Nu: Số nữ của xã tính đến ngày 1/7 trong năm
Tred1: Số trẻ em dưới 1 tuổi tính đến thời điểm ngày 1/7 trong nămTred5: Số trẻ em dưới 5 tuổi tính đến thời điểm ngày 1/7 trong nămTred6: Trẻ em dưới 6 tuổi tính đến thời điểm ngày 1/7 trong năm
Tred15: Trẻ em dưới 15 tuổi tính đến thời điểm ngày 1/7 trong nămTress: Tổng số trẻ sinh sống trong năm
Tregaiss: Số trẻ sinh sống là nữ
Chet: Tổng số người chết trong năm
Chetd1: Số chết dưới 1 tuổi trong năm
Chetnud1: Số chết nữ dưới 1 tuổi trong năm
Chetd5: Số chết dưới 5 tuổi trong năm
Chetnud5: Số chết nữ dưới 5 tuổi trong năm
+ Các biến mô tả nhân lực
Bacsy: Số bác sĩ công tác tại trạm y tế
Ysy: Số y sĩ công tác tại trạm y tế
Dsyktvtc: Số dược sĩ/ KTV TH dược công tác tại trạm y tế
Duocta: Số dược tá công tác tại trạm y tế
Ddtc: Số điều dưỡng trung học công tác tại trạm y tế
Ddsc: Số điều dưỡng sơ cấp công tác tại trạm y tế
Hostc: Số hộ sinh trung học công tác tại trạm y tế
Luongy: Số lương y
Trang 30Cbkhac: Số cán bộ khác công tác tại trạm y tế
+ Các biến mô tả ngân sách trạm y tế
Ngansach: Ngân sách nhà nước cấp trong năm cho hoạt động y tế
Nstuxa: Ngân sách từ xã cấp trong năm cho hoạt động y tế
Thubhyt: Số tiền thu bảo hiểm y tế
Thukcb: Số tiền thu dịch vụ khám chữa bệnh
Thukhac: Số tiền thu từ các nguồn khác
Chiluong: Số tiền chi lương cán bộ y tế
Muasam: Số tiền mua sắm chuyên môn
Chidtpt: Số tiền chi đầu tư phát triển
Chikhac: Chi khác
+ Các biến mô tả hoạt động tiêm chủng mở rộng
Tethuocdt: Số trẻ em thuộc diện tiêm trong năm
Tedtiem: Số trẻ em được tiêm trong năm
Tiembcg: Số trẻ đã tiêm BCG trong năm
Tiem4m: Số trẻ tiêm đủ 4 mũi trong năm
Tiemsoi: Số trẻ tiêm phòng sởi trong năm
Tganbd24: Số trẻ tiêm phòng viêm gan B ss < 24h
Tganbt24: Số trẻ tiêm phòng viêm gan B ss > 24h
Tiemdu9: Số trẻ tiêm đủ 9 mũi trong năm
Tiemmnao: Số trẻ tiêm phòng viêm màng não
Tiemta: Số trẻ tiêm phòng tả
Pntiemuv: Số phụ nữ có thai được tiêm UV 2+
+ Các biến mô tả hoạt động chăm sóc sức khỏe bà mẹ, trẻ em
và kế hoạch hóa gia đình:
Cothai: Số phụ nữ có thai trong năm
Cothaivt: Sô trường hợp có thai vị thành niên trong năm
Khamthai: Số lần khám thai trong năm
Khthaipn: Số lần khám thai của phụ nữ đẻ trong năm
Pndedqly: Số phụ nữ đẻ được quản lí trong năm
Trang 31Pndetuv: Số phụ nữ đẻ tiêm UV đủ liều trong nămPnde: Số phụ nữ đẻ trong năm
Pndektdu: Số phụ nữ đẻ được kiểm tra đủ trong nămSconth3: Số phụ nữ sinh con thứ 3 trong năm
Cbytedo: Số phụ nữ đẻ do cán bộ y tế đỡ trong nămDecsyte: Số phụ nữ đẻ tại cơ sở y tế trong năm
Mecsss: Số mẹ được chăm sóc sau sinh trong năm
Mecstd: Số mẹ được chăm sóc tuần đầu trong nămPhathai: Số lượt phá thai trong năm
Pthaid7t: Số lượt phá thai dưới 7 tuần trong năm
Chetth22: Số lượt chết thai nhi dưới 22 tuần trong nămChet1t: Số trẻ chết dưới 1 tuổi trong năm
Chet7ng: Số trẻ chết dưới 7 ngày trong năm
Chet5t: Số trẻ chết dưới 5 tuổi trong năm
Khampk: Số lần khám phụ khoa trong năm
Chuapk: Số lần chữa phụ khoa trong năm
Thbptrt: Tổng số thực hiện BPTT trong năm
Datvong: Số lần đặt vòng trong năm
Thuoctrt: Số người dùng thuốc tránh thai trong nămVientrt: Số người dùng viên tránh thai trong năm
Tiemtrt: Số người tiêm tránh thai trong năm
Caytrth: Số người cấy tránh thai trong năm
Baocaosu: Số ngươì sử dụng bao cao su trong nămTrietsan: Số người triệt sản trong năm
Tsannu: Số triệt sản nữ trong năm
TressSKSS: Số trẻ sinh sống trong năm
Trenuss: Số trẻ nữ sinh sống trong năm
Trecan: Số trẻ sinh được cân trong năm
Tred2500: Số trẻ sinh dưới 2,5 kg trong năm
+ Các biến mô tả hoạt động khám chữa bệnh
Trang 32Giuongdt: Tổng số giường bệnh tại trạm y tế
Lankham: Tổng số lần khám bệnh tại trạm
Khamyhct: Số lượt khám y học cổ truyền
Khamd6t: Số lượt khám trẻ em dưới 6 tuổi
Dtnoitru: Số lần điều trị nội trú
Dtntyhct: Số lần điều trị nội trú YHCT
Dtntte6t: Số lần điều trị nội trú trẻ em dưới 6tNgaydtnt: Số ngày điều trị nội trú
Ndtntyh: Số ngày điều trị nội trú YHCT
Ndtntte: Số ngày điều trị nội trú của trẻ em
Dtngtru: Tổng số lần điều trị ngoại trú
Ngtrdgy: Số lần điều trị ngoại trú YHCT
Ngtte6t: Số lần điều trị ngoại trú trẻ em dưới 6 tuổiSieuam: Số lần siêu âm
Chuyent: Số lượt chuyển tuyến
Khamdphg: Số lần khám dự phòng
Khamtu: Số lượt khám tư
+ Các biến mô tả bệnh thông thường
Tchaym: Số người mắc tiêu chảy trong năm
Thdaum: Số người mắc thủy đậu trong năm
Thdauc: Số nguời mắc thủy đậu chết trong nămQuaibim: Số người quai bị mắc trong năm
Quaibic: Số người quai bị chết trong năm
Viemhhtm: Số người viêm hô hấp mắc trong nămViempqm: Số người viêm phế quản mắc trong nămViemphoi: Số người viêm phổi trong năm
Camcumm: Số người cảm cúm mắc trong nămTnangtm: Số vụ tai nạn giao thông trong năm
Tnangtc: Số vụ tai nạn giao thông chết trong nămTnanldm: Số vụ tai nạn lao động trong năm