1. Trang chủ
  2. » Giáo án - Bài giảng

Ứng Dụng SPSS Trong Phân Tích Các Nhân Tố Ảnh Hưởng Tới Tỉ Suất Chết Của Trẻ Dưới 1 Tuổi Trên Thế Giới

32 543 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 901,96 KB

Nội dung

Ứng Dụng SPSS Trong Phân Tích Các Nhân Tố Ảnh Hưởng Tới Tỉ Suất Chết Của Trẻ Dưới 1 Tuổi Trên Thế Giới Lựa chọn các chỉ tiêu và phương pháp phân tích Các Biến Đưa Vào Phân Tích Phương Pháp Phân Tích Phân Tích Đặt Điểm Tỉ Suất Chết Của Trẻ em dưới 1 tuổi trên thế giới

Trang 1

1 tuổi (IMR) Đây là tương quan giữa số trẻ em dưới 1 tuổi bị chết trong năm so với số trẻ em sinh ra còn sống ở cùng thời điểm, đơn vị tính là phần nghìn (‰)

Ngày nay, với sự phát triển của khoa học - công nghệ kĩ thuật, việc ứng dụng các phần mềm trong nghiên cứu và giảng dạy Địa lí, đặc biệt là nghiên cứu và giảng dạy Địa lí kinh tế - xã hội theo hướng định lượng ngày càng trở nên phổ biến và mang lại hiệu quả cao mà một trong số đó là phần mềm SPSS (Statistical Products for the Social Services) Thông qua việc sử dụng các ứng dụng của SPSS, các nhân tố ảnh hưởng đến

tỉ suất chết của trẻ em dưới 1 tuổi trên phạm vi toàn thế giới cũng như mức độ ảnh hưởng của nó sẽ được làm rõ, từ đó đề ra được các biện pháp nhằm giảm tỉ suất chết của trẻ em dưới 1 tuổi

Các số liệu lấy từ các bảng thống kê trong Encarta được kết nối và xử lí qua các phần mềm Microsoft Office Excel 2003, SPSS 11.5 và MapInfo 9.0 Tuy nhiên các số liệu từ Microsoft Encarta Premium 2009 không đồng nhất cả về mặt thời gian và không gian Chính vì vậy, trong phân tích này, tác giả chỉ giữ lại số lượng 162 quốc gia trên thế giới và coi các chỉ tiêu này đồng nhất là của năm 2008 Mặc dù số lượng các quốc gia chưa thật đầy đủ nhưng điều đó cũng không ảnh hưởng nhiều đến kết quả của nghiên cứu Ngoài ra, các dữ liệu về thế giới còn được lấy trong World Development Indicator (WDI) của Ngân hàng Thế giới (WB)

Trang 2

1.2 Các biến đưa vào phân tích

Để phân tích tỉ suất chết của trẻ em dưới 1 tuổi của thế giới, tác giả lựa chọn các biến sau:

- Tỉ suất chết của trẻ em dưới 1 tuổi (‰) (imr)

- Tỉ suất sinh thô (‰) (cbr)

- Tỉ suất chết thô (‰) (cdr)

- Số dân trung bình/1 bác sĩ (dân) (bac_si)

- Tỉ lệ dùng nước sạch trong tổng dân số (%) (nuoc_sach)

- GNP bình quân theo đầu người (USD) (GNP_bq)

Có thể thấy các chỉ tiêu trên thuộc các nhân tố thể hiện sự phát triển của ngành Y tế

và công tác chăm sóc sức khỏe ở mỗi quốc gia (như số dân trung bình/ 1 bác sĩ, tỉ lệ người dân được sử dụng nước sạch), các nhân tố thể hiện đặc điểm về nhân khẩu học (như tỉ suất chết của trẻ em dưới 1 tuổi, tỉ suất sinh thô, tỉ suất chết thô) và các nhân tố

về kinh tế (GNP bình quân theo đầu người)

1.3 Phương pháp phân tích

Trong nghiên cứu này, tác giả sử dụng các phương pháp phân tích số liệu thống kê trong SPSS sau:

- Thủ tục Frequency để thu được các mô tả chi tiết về tỉ suất chết của trẻ em dưới 1 tuổi

- Thủ tục Descriptives để thu được các thống kê cơ bản

- Tương quan nhị biến để phân tích mối tương quan của tỉ suất chết của trẻ em dưới 1 tuổi với các nhân tố ảnh hưởng

- Hồi quy tuyến tính đơn giản và hồi quy tuyến tính bội để dự báo sự thay đổi của

tỉ suất chết của trẻ em dưới 1 tuổi

- Phân tích cụm (Cluster Analysis) để phân kiểu các nước trên thế giới theo các chỉ tiêu đã đưa ra

Để trực quan hóa phân tích, kết nối dữ liệu từ SPSS với phần mềm Microsoft Office Excel và MapInfo thành lập các bản đồ:

- Tỉ suất chết của trẻ em dưới 1 tuổi trên thế giới năm 2008

- Tỉ suất chết của trẻ em dưới 1 tuổi trên thế giới năm 2008 theo phương pháp hồi quy bội

- Sự chênh lệch tỉ suất chết của trẻ em dưới 1 tuổi theo thực tế và theo phương pháp hồi quy bội

- Phân kiểu các quốc gia trên thế giới theo tỉ suất chết của trẻ em dưới 1 tuổi và các nhân tố ảnh hưởng

Trang 3

2 PHÂN TÍCH ĐẶC ĐIỂM TỈ SUẤT CHẾT CỦA TRẺ EM DƯỚI 1 TUỔI TRÊN THẾ GIỚI

2.1 Khái quát chung

Tỉ suất chết của trẻ em dưới 1 tuổi là thước đo đặc biệt quan trọng trong phân tích mức chết của dân cư, vì nó phản ánh điều kiện sống, trình độ nuôi dưỡng, chăm sóc sức khoẻ của trẻ em và có ảnh hưởng rất lớn đến mức chết chung và tuổi thọ trung bình của dân cư

Để phân tích thực trạng tỉ suất suất chết của trẻ em dưới 1 tuổi của các quốc gia

trên thế giới ta sử dụng thủ tục Frequencies trong SPSS: Menu/ Analyze/ Descriptive

Statistics/ Frequencies

- Chọn biến (Variable): imr

- Nhấn nút Statistics:

+ Trong Central Tendency: chọn Mean, Meadian, Mode

+ Trong Percentile values: add 10 và 90

+ Trong Distribution: chọn Skewness, Kutoris

+ Trong Dispersion: chọn Std deviation, Minimum, Maximum, Range

- Nhấn nút Chart: chọn Histogram, With normal curve

Ta thu được các kết quả như sau:

a Multiple modes exist The smallest value is shown

Qua bảng trên ta thấy:

- Số lượng các quốc gia được phân tích là 162

Trang 4

- Tỉ suất chết của trẻ em dưới 1 tuổi trung bình của toàn thế giới là 37,658 ‰ Tỉ suất chết của trẻ em dưới 1 tuổi trung vị là 23,750 ‰ Như vậy sẽ có 1/2 số nước được phân tích có tỉ suất chết của trẻ em dưới 1 tuổi cao hơn 23,750 ‰ và 1/2 số nước còn lại

có tỉ suất chết của trẻ em dưới 1 tuổi thấp hơn 23,750 ‰ Tỉ suất chết của trẻ em dưới 1 tuổi trung bình cao hơn trung vị cho thấy mẫu có phân phối không cân xứng

- Độ lệch chuẩn mẫu (Std Deviation) là 34,3 cho thấy độ lệch của phân phối

- Nhiều quốc gia có chung giá trị, tuy nhiên giá trị phổ biến nhất (có tần số lớn nhất) là 11,7‰ Quốc gia có tỉ suất chết của trẻ em dưới 1 tuổi thấp nhất thế giới đạt 2,3‰ trong khi quốc gia có tỉ suất chết của trẻ em dưới 1 tuổi cao nhất thế giới đạt 182,3‰ Khoảng biến thiên thực tế (Range) là 180,0

- 10% số nước có tỉ suất tử thô thấp nhất chỉ đạt từ 4,530 ‰ trở xuống; 10% số nước có tỉ suất tử thô cao nhất đạt từ 87,97 ‰ trở lên

Để xác định các quốc gia có tỉ suất chết của trẻ em dưới 1 tuổi cao nhất, thấp nhất

thế giới, ta thực hiện các bước như sau: Menu/ Data/ Select Cases/ If condition is satisfield, chọn biến imr ≤ 4,53 hoặc imr ≥ 87,97 ta có bảng sau:

10% số nước có tỉ suất chết của trẻ em dưới 1 tuổi thấp nhất thế giới (≤ 4,53 ‰)

10% số nước có tỉ suất chết của trẻ em dưới 1 tuổi cao nhất thế giới (≥ 87,97 ‰)

Trang 5

9 Biểu đồ thể hiện tần suất tỉ suất chết của trẻ em dưới 1 tuổi trên thế giới

TØ suÊt chÕt cña trÎ em d−íi 1 tuæi

180.

0

170 0

0 90.0 80.0 70.

0 60.0 50.0 40.0 30.0 20.0 10.0 0.0

TØ suÊt chÕt cña trÎ em d−íi 1 tuæi

N = 162.00

Qua quan sát biểu đồ và bảng Statistics ta thấy:

- Độ lệch (Sknewness) của biểu đồ là 1,354 Kết quả mang giá trị dương chỉ ra rằng phân phối bị lệch phải Tỉ số giữa độ lệch và sai số chuẩn của nó (Skewness/Std Error of Skewness): 1,354/0,191 = 7,089 cho thấy phân phối bị lệch với đuôi phải khá dài

- Độ nhọn (Kurtosis) là 1,926 và tỉ số giữa độ nhọn với sai số chuẩn của nó (Kurtosis/ Std Error of Kurtosis): 1,926/0,379 = 5,08 chỉ ra rằng đuôi của phân phối dài hơn đuôi của phân phối chuẩn

Để biểu đồ cân xứng hơn, ta tiến hành logarit cơ số 10 của biến imr và lập một biểu đồ tần xuất cho trị số này Thực hiện như sau: vào Transform/ Compute

- Trong ô Target Variable: nhập log_imr

- Đến khoang Function: dùng thanh cuốn dọc tìm đến hàm LG10[numexpr],

chọn biến imr

- Chạy Frequencies như ở phần trên nhưng với biến (Variable) là log_imr

Trang 6

2.25 2.13 2.00 1.88 1.75 1.63 1.50 1.38 1.25 1.13 1.00 88 75 63 50 38

Logarit cña tØ suÊt chÕt cña trÎ em d−íi 1 tuæi

- Sử dụng công cụ Analyze/ Descriptive Statistics/ Descriptive/ chọn biến imr

Tiếp tục nhấn vào Options và kích chọn các thẻ: Mean, Std devation, Minimum, Maximum Kết quả của phép phân tích cho ta bảng:

Descriptive Statistics

TØ suÊt cña chÕt cña trÎ em d−íi 1 tuæi

Trang 7

Cách làm: Menu/ Graph/ Boxplot Chọn Simple, Define Trong Variable: chọn biến imr ; trong Category Axis: chọn biến chau_luc ; trong Label cases by: chọn biến country, ta sẽ được kết quả sau:

10 13

18 38

49 34

N =

Ch©u lôc

Oceania

South America North America

Asia Africa

Liberia Sierra Leone Angola

Bulgaria Albania Armenia Romania Turkey Azerbaijan

Từ bảng số liệu và biểu đồ trên ta thấy:

- Châu Phi là châu lục có tỉ suất chết của trẻ em dưới 1 tuổi cao nhất thế giới với các giá trị trung bình, cực đại, cực tiểu là 74,339 ‰, 13,7‰, 182,3‰ đều cao hơn

so với các châu lục khác Khoảng biến thiên tứ phân vị (chiều cao của hộp) khá lớn chứng tỏ tỉ suất chết của trẻ em dưới 1 tuổi có sự chênh lệch giữa các nước

- Châu Âu là châu lục có tỉ suất chết của trẻ em dưới 1 tuổi thấp nhất thế giới với trung bình là 9,921 ‰ Khoảng biến thiên tứ phân vị không lớn chứng tỏ giữa các nước ít có sự chênh lệch

- Tiếp theo là đến Bắc Mĩ, châu Đại Dương, Nam Mĩ và châu Á Trong đó châu

Á là châu lục có giá trị cực tiểu thấp nhất (2,3‰) nhưng khoảng biến thiên tứ phân vị lại lớn nhất, thậm chí hơn cả châu Phi

- Biểu đồ hộp cũng cung cấp cho chúng ta thấy được các trường hợp ngoại lai ở mỗi châu lục Châu Âu là châu lục có nhiều trường hợp ngoại lai nhất với các quốc gia Azerbaijan, Turkey, Romania, Armenia, Albania, Bungaria Ngoài ra các châu lục khác cũng có các trường hợp ngoại lai như châu Phi có Angola, Sierra Leon và

Trang 8

Liberia; Bắc Mĩ có Haiti ; Nam Mỹ có Bolivia, Chile và Châu Đại Dương có Vanuatu Chỉ riêng châu Á là không có trường hợp ngoại lai nào

Để thấy rõ hơn mức độ phân hóa của tỉ suất chết của trẻ em dưới 1 tuổi theo các châu lục, ta có thể phân chia ra các nhóm

Tiến hành thao tác Menu/ Transform/ Recode/ Recode into Different và xếp tỉ

suất chết của trẻ em dưới 1 tuổi thành các nhóm:

- Nhóm 1: thấp (dưới 10‰)

- Nhóm 2: trung bình (từ 10‰ đến 40‰)

- Nhóm 3: cao (từ 40‰ đến 80‰)

- Nhóm 4: rất cao (trên 80‰)

Khi đó, ta sẽ có thêm 1 biến mới là nhom_imr

Sau khi thực hiện thao tác trên, để phân tích ta chạy bảng Menu/ Analyze/ Table/ General table Chọn row: chau_luc, col: nhom_imr; trong ô Edit Statistics chọn

“count” và “row%” Kết quả cho bảng sau:

phân nhóm imr

Trang 9

2.2 Các châu lục

Để phân tích đặc điểm tỉ suất chết của trẻ em dưới 1 tuổi theo châu lục từng, ta

thực hiện thao tác gộp nhóm các quốc gia theo châu lục bằng lệnh Select Case: Menu/ Data/ Select Cases/ chọn If condition is satisfield/ chọn biến chau_luc và tương ứng

với các chữ số (1, 2, 3, 4, 5, 6)

Ở đây tác giả chỉ thực hiện phân tích hai châu lục có tỉ suất chết của trẻ em dưới

1 tuổi thấp nhất và cao nhất là châu Âu và châu Phi

Trang 10

TØ suÊt chÕt cña trÎ em d−íi 1 tuæi

55.0 50.0 45.0 40.0 35.0 30.0 25.0 20.0 15.0 10.0 5.0

TØ suÊt chÕt cña trÎ em d−íi 1 tuæi

N = 34.00

Qua bảng và biểu đồ trên ta thấy châu Âu là châu lục có tỉ suất chết của trẻ em dưới 1 tuổi là 9,921‰, thấp hơn nhiều so với mức trung bình toàn thế giới (37,658‰) Phân phối bị lệch phải khá lớn, đuôi phải dài hơn so với phân phối chuẩn

Trang 11

TØ suÊt chÕt cña trÎ em d−íi 1 tuæi

180.

0 170.0 160.

0 150.0 140.0 130.

0 120.0 110.

0 100.0 90 0 80.

0 70 0 60.

0 50 0 40.

0 30.0 20.

0 10.0

TØ suÊt chÕt cña trÎ em d−íi 1 tuæi

N = 49.00

Qua bảng và biểu đồ trên ta thấy châu Phi là châu lục có tỉ suất chết của trẻ em dưới 1 tuổi là 74,339‰, cao hơn nhiều so với mức trung bình toàn thế giới (37,658‰) Phân phối bị lệch phải, đuôi phải dài hơn so với phân phối chuẩn

3 PHÂN TÍCH MỐI TƯƠNG QUAN GIỮA TỈ SUẤT CHẾT CỦA TRẺ EM DƯỚI

1 TUỔI VỚI CÁC NHÂN TỐ ẢNH HƯỞNG

Tỉ suất chết của trẻ em dưới 1 tuổi chịu tác động của nhiều nhân tố Trong phân

tích này, tỉ suất chết của trẻ em dưới 1 tuổi (imr) được xem là biến phụ thuộc, các biến độc

lập được đưa vào mô hình gồm:

- Tỉ suất sinh thô (‰) (cbr)

- Tỉ suất chết thô (‰) (cdr)

- Số dân trung bình/1 bác sĩ (dân) (bac_si)

- Tỉ lệ dùng nước sạch trong tổng dân số (%) (nuoc_sach)

- GNP bình quân theo đầu người (USD) (GNP_bq)

Để tìm hiểu mức độ tác động cũng như mối quan hệ giữa các nhân tố trên, ta sử dụng phân tích tương quan nhị biến

Cách làm: Menu/ Analyze/ Correlate/ Bivariate, hộp thoại hiện ra,

- Chọn biến imr và 5 biến trên là cbr, cdr, bac_si, nuoc_sach, GNP_bq

- Chọn hệ số tương quan hạng Pearson

- Chọn Two-tailed (do chưa biết mối quan hệ là thuận hay nghịch)

- Ở Options chọn Excluces cases listwise để loại bỏ tất các các trường hợp có giá trị khuyết thiếu ở ít nhất một trong các biến nghiên cứu

Kết quả của phép phân tích cho ta bảng sau:

Correlations(a)

Trang 12

Tỉ suất chết của trẻ em dưới 1 tuổi

Tỉ suất sinh thô chết thô Tỉ suất

Số dân trung bình trên 1 bác sĩ

Tỉ lệ dùng nước sạch trong tổng số dân

GNP bình quân theo đầu người

Do phân bố của GNP bình quân theo đầu người lệch phải mạnh nên ta sử dụng

phép biến đổi logarit của biến này để phân bố của nó trở nên cân xứng hơn

Correlations(a)

Tỉ suất chết của trẻ em dưới 1 tuổi

Tỉ suất sinh thô

Tỉ suất chết thô

Số dân trung bình trên 1 bác sĩ

Tỉ lệ dùng nước sạch trong tổng số dân

Logarit của GNP_bq

Tỉ suất sinh thô

Trang 13

- Tỉ suất chết thô (cdr) 0,667 44,49

- Tỉ lệ dùng nước sạch trong tổng dân số (nuoc_sach) -0,777 60,37

- Logarit của GNP bình quân theo đầu người (log_gnp) -0,742 55,06

Các hệ số tương quan giữa các biến cho ta biết mức độ ảnh hưởng của chúng Theo

kết quả của bảng trên thì nhân tố tỉ lệ dùng nước sạch trong tổng số dân và tỉ suất sinh

thô có vai trò lớn nhất với tương ứng 60,37% và 58,98% sự biến thiên của biến imr

được giải thích bởi hai biến này

Ngoài ra các hệ số tương quan còn cho thấy mối quan hệ thuận nghịch giữa các

biến Nếu hệ số tương quan r mang giá trị dương thì quan hệ giữa hai biến là thuận và

ngược lại Như vậy tỉ suất chết của trẻ em dưới 1 tuổi có quan hệ thuận với tỉ suất sinh

thô, tỉ suất chết thô, số dân trung bình /1 bác sĩ và quan hệ nghịch với tỉ lệ dùng nước

sạch trong tổng dân số và GNP bình quân theo đầu người

Bên cạnh đó có thể quan sát tương quan giữa các biến khi dùng hệ số tương quan

hạng Spearman Vào Menu/ Analyze/ Correlate/ Bivariate, thực hiện các thao tác như

trên, chỉ thay bằng hệ số tương quan hạng Spearman

Correlations(a)

Tỉ suất chết của trẻ em dưới 1 tuổi

Tỉ suất sinh thô chết thô Tỉ suất

Số dân trung bình trên 1 bác

Tỉ lệ dùng nước sạch trong tổng

số dân

Logarit của GNP_bq Spearman's

** Correlation is significant at the 0.01 level (2-tailed)

* Correlation is significant at the 0.05 level (2-tailed)

a Listwise N = 162

Trang 14

Do dùng các trật tự hạng (rank) để đưa vào tính tương quan thay cho giá trị thực nên hệ số tương quan hạng Spearman không chịu ảnh hưởng mạnh của tính chuẩn của phân phối cũng như của các giá trị ngoại lai hay cực trị

Ta có thể quan sát rõ hơn tương quan giữa các biến qua ma trận các đồ thị phân tán

của các biến Thực hiện lệnh: Graph/ Scatter

- Trong Scatterplot: chọn Matrix

- Trong Define: ở Matrix Variable chọn các biến imr, cbr, cdr, bac_si, nuoc_sach, log_gnp ; ở Set markers by chọn chau_luc ; ở Labels case by chọn country

Ma trận các đồ thị phân tán của các biến

Africa Europe

4 DỰ BÁO SỰ THAY ĐỔI CỦA TỈ SUẤT CHẾT CỦA TRẺ EM DƯỚI 1 TUỔI

Tỉ suất chết của trẻ em dưới 1 tuổi phụ thuộc vào nhiều nhân tố với các mức độ ảnh hưởng khác nhau Dựa vào mối quan hệ giữa các biến, ta có thể dự báo tỉ suất chết của trẻ em dưới 1 tuổi theo một hay nhiều biến có liên quan bằng phương pháp hồi quy tuyến tính

4.1 Hồi quy tuyến tính đơn giản

Trang 15

Phương pháp này cho ta dự báo tỉ suất chết của trẻ em dưới 1 tuổi trong quan hệ với một biến độc lập

Chẳng hạn để xem xét mối quan hệ giữa tỉ suất chết của trẻ em dưới 1 tuổi và tỉ

suất sinh thô, ta thực hiện như sau: vào Menu/ Analyze/ Regression/ Linear, hộp thoại

hiện ra:

- Dependent: chọn imr

- Independent: chọn cbr

- Case labels: country

- Trong Statistics chọn Model fit

- Trong Save: chọn Unstandardized và Standardized

Trong Variable View xuất hiện 2 biến mới là pre_1 và res_1 Đây chính là phần

dự báo mối quan hệ tuyến tính và phần chênh thực tế so với dự đoán

Kết quả phân tích cho ta một số bảng sau:

Model Summary(b)

Model R R Square R Square Adjusted the Estimate Std Error of

a Predictors: (Constant), Tỉ suất sinh thô

b Dependent Variable: Tỉ suất chết của trẻ em dưới 1 tuổi

Trị số R2 = 0,590 ở bảng trên cho biết tỉ suất sinh thô giải thích 59% sự biến thiên của tỉ suất chết của trẻ em dưới 1 tuổi

Coefficients(a)

Model

Unstandardized Coefficients Standardized Coefficients t Sig

a Dependent Variable: Tỉ suất chết của trẻ em dưới 1 tuổi

Từ bảng trên có thể viết được phương trình hồi quy tuyến tính đơn giản như sau:

imr = cdr * 2,229 - 11,358

Mối tương quan giữa tỉ suất chết của trẻ em dưới 1 tuổi và tỉ suất chết thô được thể hiện qua biểu đồ sau:

Trang 16

TØ suÊt sinh th«

60 50

40 30

20 10

0 -10

Như vậy, ta thấy tỉ suất sinh thô có quan hệ thuận với tỉ suất chết của trẻ em dưới

1 tuổi Tỉ suất sinh thô càng tăng thì tỉ suất chết của trẻ em dưới 1 tuổi cũng tăng lên

Vì vậy để giảm bớt tỉ suất chết của trẻ em dưới 1 tuổi thì phải tiến hành các biện pháp giảm tỉ suất sinh

Tương tự, có thể chọn các biến khác để phân tích

4.2 Hồi quy tuyến tính bội

Phương pháp này cho ta mô hình dự báo tỉ suất chết của trẻ em dưới 1 tuổi trong quan hệ với nhiều biến độc lập

Thực hiện như sau: vào Menu/ Analyze/ Regression/ Linear Hộp thoại hiện ra:

- Dependent: chọn imr

- Independent: chọn cbr, cdr, bac_si, nuoc_sach, log_gnp

- Case labels: country

- Trong Statistics chọn các tham số như sau:

+ Trong Save: chọn các tham số sau:

Ngày đăng: 08/05/2016, 21:30

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w