Nghiên cứu ứng dụng một số phương pháp và mô hình dự báo ngắn hạn để dự báo các chỉ tiêu thống kê xã hội chủ yếu. Nâng cao dân trí trở thành mục tiêu của nhiều quốc gia, bởi vì dân trí càng cao nền dân chủ càng vững và sự phát triển kinh tế xã họi càng nhanh
Trang 1TỔNG CỤC THỐNG KÊ VIỆN KHOA HỌC THỐNG KÊ
BÁO CÁO CHUYÊN ĐỀ:
PHƯƠNG PHÁP VÀ MÔ HÌNH DỰ BÁO SỐ
LƯỢNG HỌC SINH, SINH VIÊN, SỐ NĂM ĐI HỌC BÌNH QUÂN
Thuộc đề tài: Nghiên cứu ứng dụng các phương pháp dự báo để dự báo một số chỉ tiêu thống kê xã hội chủ yếu ở Việt nam
Người biên sọan:
Lê Văn Dụy Nguyễn Thị Thu Huyền
HÀ NỘI, 10/ 2009
Trang 2MỞ ĐỀ
Nâng cao dân trí trở thành mục tiêu của nhiều quốc gia, bởi vì dân trí càng cao nền dân chủ càng vững và sự phát triển kinh tế xã hội càng nhanh và bền Phát triển giáo dục phổ thông và đại học là một trong những con đường chủ yếu
để nâng cao dân trí Với lý do này các quốc gia luôn trú trọng đến việc mở trường lớp và khuyến khích vị thành niên và thanh niên đến trường và theo học các chương trình đại học và trên đại học Cũng với lý do này các chỉ tiêu thống
kê số học sinh, sinh viên và số năm đi học bình quân trở thành các chỉ tiêu thống
kê xã hội quan trọng Đây cũng chính là các chỉ tiêu mục tiêu quốc gia và là chỉ tiêu nằm trong hệ thống kế hoạch của Đảng và Nhà Nước Biết trước số lượng học sinh, sinh viên và số năm đi học bình quân của dân số sẽ giúp cho Nhà Nước đánh giá được tình hình giáo dục của quốc gia và khả năng đạt được mục tiêu nâng cao trình độ dân trí của dân cư Để làm được điều đó người ta tiến hành dự báo các chỉ tiêu này Sau đây trình bày các phương pháp dự báo cho các chỉ tiêu trên
I KHÁI NIỆM VÀ ĐỊNH NGHĨA
1.1 Định nghĩa số học sinh
Là những người đang học ở các cơ sở giáo dục phổ thông, các trường trung cấp chuyên nghiệp
1.2 Số sinh viên
Là những người đang học cao đẳng, đại học;
1.3 Số học viên
Là những người đang học các cơ sở dạy nghề, các lớp xoá mù chữ, các lớp giáo dục tiếp tục sau biết chữ; những học viên học chương trình để lấy văn bằng của hệ thống giáo dục quốc dân
Trang 3II CÁC PHƯƠNG PHÁP DỰ BÁO SỐ LƯỢNG HỌC SINH VÀ SINH VIÊN
Để dự báo lực lượng học sinh và sinh viên thường người ta sử dụng một trong hai phương pháp, đó là dự báo theo dãy số thời gian hoặc dự báo theo phương pháp nhân khẩu học (phương pháp dự báo thành phần) Mỗi một phương pháp có một ưu điểm riêng Phương pháp dãy số thời gian đơn giản, dễ làm đặc biệt là trong bối cảnh ngày nay đã có nhiều chương trình phân tích thống kê mạnh như SPSS, STATA, SAS,… Phương pháp thành phần đòi hỏi phải tiến hành nhiều bước và nhiều thông tin khác nhau, song lại có ưu điểm lứon là dễ cho kết quả sát thực, đồng thời lại cung cấp các thông tin chi tiết hơn
so với phương pháp dãy số thời gian
2.1 Dự báo số lượng học sinh và sinh viên theo phương pháp dãy số thời gian
Để dự báo số lượng học sinh, sinh viên bằng phương pháp dãy số thời gian cần thực hiện các bước sau:
+ Thu thập thông tin về hai chỉ tiêu này theo thời gian với thời kỳ thống nhất (thường là theo năm) Các số liệu này cũng phải đồng nhất về mặt phạm vi
có như vậy chúng mới phản ánh đúng xu thế phát triển của chỉ tiêu
+ Xác định một phương trình toán học (mô hình) khả dĩ có thể mô tả tốt quy luật phát triển của dãy số và sử dụng nó để dự đoán
Việc ước lượng các tham số của phương trình thường dựa vào phương pháp bình phương nhỏ nhất
Như đã trình bày, dự báo số lượng học sinh, sinh viên theo dãy số thời gian có các ưu điểm sau:
Thứ nhất, nó đơn giản, dễ làm;
Trang 4Thứ hai, nhanh chóng cho ra kết quả dự báo cần thiết
Tuy nhiên, nó có các nhược điểm sau đây:
Thứ nhất, khó thu thập thông tin cho một dãy số liệu dài Mặt khác, các
thông tin có được thường mức độ sát thực thấp và số liệu giữa các thời kỳ thường có phạm vi không đồng nhất do vậy kết quả dự báo thu được cũng có mức độ sát thực thấp
Thứ hai, số liệu dự báo thu được chỉ là một con số tổng hợp mà không
tách ra được theo giới tính và nhóm tuổi nên tác dụng của dự báo cũng bị hạn chế theo
Thí dụ, dựa vào dãy số liệu thống kê về số học sinh trung học phổ thông
do TCTK công bố cho giai đoạn 2000-2008 ta sẽ tiến hành dự báo số học sinh trung học phổ thông cho các năm 2009, 2010 và 2011
Bảng 1: Số học sinh trung học phổ thông giai đoạn 1995-2008 và kết quả dự đoán cho niên khóa 2008-2009, 2009-2010, 2010-2011
04-05 10 2761.1 2774.5 05-06 11 2975.3 2900.0 06-07 12 3075.2 3009.8 07-08 13 3021.6 3103.9 2008-2009 14 2927.6(*) 3182.3
(*) số ước tính của Vụ theo dõi chỉ tiêu này
2
856 7 52 290 91
654 t t
996
0
R ; R2 0 993 Sai số tuyệt đối bình quân bằng 55,9 nghìn người; sai số tương đối bằng 2,5%
Trang 5Hình 1: Số học sinh trung học phổ thông giai đoạn 1995-2008 và kết quả dự đoán cho niên khóa 2008-2009
0
500
1000
1500
2000
2500
3000
3500
Sử dụng chương trình SPSS đã xác định được hàm số bậc hai mô tả tốt nhất quy luật phát triển theo thời gian của chỉ tiêu số học sinh trung học phổ thông Điều này thể hiện rất rõ thông qua hệ số tương quan R và hệ số mô tả R2 ước lượng được Hệ số tương quan thu được bằng R 0 996 Kết qủa này cho thấy giữa chỉ tiêu số học sinh trung học phổ thông và biến thời gian có mối quan hệ rất chặt Hệ số mô tả thu đươc: R2 0 993 Điều này cho thấy biến thời gian mô tả được tới 99,3% sự biến động của chỉ tiêu số học sinh trung học phổ thông Hơn thế nữa, sai số dự báo tuyệt đối và tương đối đều ở mức độ thấp (các con số tương ứng là 55,9 nghìn học sinh và 2,5%) Như vậy, ta có thể kết luận là hàm số bậc hai phù hợp với việc mô tả sự biến động theo thời gian của chỉ tiêu
số học sinh trung học phổ thông và có thể yên tâm sử dụng nó để dự báo
Theo kết quả tính toán, niên khoá 2008-2009 số học sinh trung học phổ thông của Việt nam là 3182,3 nghìn em, còn vào niên khóa 2009-2010 là 3245 nghìn em Với mức độ tin cậy là 95%, số lượng học sinh trung học phổ thông
Trang 6niên khoá 2008-2009 và 2009-2010 sẽ nằm trong các khoảng tương ứng sau: (3072,8;3291,8) và (3135,5;3354,5)
2.2 Dự báo số lượng học sinh, sinh viên theo phương pháp thành phần
Đây là phương pháp thường hay được các nhà nhân khẩu học áp dụng khi tiến hành dự báo số lượng học sinh và sinh viên của một quốc gia Phương pháp này kết hợp giữa dự báo dân số theo giới tính và nhóm tuổi theo phương pháp thành phần và dự báo tỷ lệ đi học ở các nhóm tuổi
Việc dự báo tỷ lệ đi học ở các nhóm tuổi thường được thực hiện theo theo cách: chấp thuận tỷ lệ đi học đặc trưng theo nhóm tuổi không thay đổi và sử dụng chúng để tính số học sinh và sinh viên đi học
Phương pháp dự báo số học sinh và sinh viên theo phương pháp thành phần có ưu điểm là:
Thứ nhất, nó tận dụng được kết quả của dự báo dân số và các ưu điểm
của dự báo dân số theo phương pháp thành phần (kết quả dự báo dân số theo phương pháp thành phần thường sát với thực tế hơn các phương pháp khác)
Thứ hai, nó cho biết phân bố của số học sinh và sinh viên theo giới tính và
nhóm tuổi Thông tin này rất bổ ích cho những người làm công tác hoạch định các chính sách về số học sinh và sinh viên
Với các ưu điểm trên, phương pháp thành phần thường hay được sử dụng trong dự báo số học sinh và sinh viên
Bên cạnh các ưu điểm trên, phương pháp dự báo số học sinh và sinh viên theo phương pháp thành phần có các nhược điểm là nó tiến hành phức tạp, đòi hỏi phải thu thập nhiều loại thông tin hơn so với phương pháp dãy số thời gian
Trang 7Thí dụ, thông qua dự báo dân số thu được dân số theo giới tính và nhóm tuổi được trình bày ở bảng 2 ta sẽ tiến hành dự báo số học sinh và sinh viên cho niên khóa 2008-20091 Có hai phương án dự báo Thứ nhất, chỉ dự báo tổng số học sinh và sinh viên Thứ hai, dự báo số học sinh và sinh viên theo giới tính và nhóm tuổi
Để thực hiện phương án thứ nhất, cần dự báo tỷ lệ học sinh và sinh viên trong dân số từ 6 tuổi đến 24 tuổi (nhóm tuổi này là bộ phận cấu thành lớn nhất của học sinh, sinh viên) Còn để thực hiện dự báo theo phương án thứ hai, cần tính được tỷ lệ đi học theo giới tính và nhóm tuổi
Bảng 2: Kết quả dự báo dân số năm 2009 theo phương pháp thành phần cho các nhóm tuổi đang ở độ tuổi đi học
Đơn vị: nghìn người
Nhóm
tuổi
Dân số dự báo Tỷ lệ đi học dự báo Số người đi học dự báo
10-14 3636 3423 0.841 0.832 3058 2848 5906 15-19 4564 4338 0.344 0.321 1570 1392 2963 20-24 4561 4342 0.283 0.252 1291 1094 2385
Tổng 16679 15740 8595 7815 16410
Bảng 2 trình bày kết quả dự báo số người đang đi học của các nhóm tuổi vào năm 2009 theo phương pháp thành phần Cả ba cột lớn đều là các con số dự báo Cột lớn thứ nhất được lấy từ dự báo dân số theo phương pháp thành phần Cột lớn thứ hai được lấy từ dự báo tỷ lệ đang đi học của các nhóm tuổi Cột lớn thứ ba là kết quả tổng hợp của hai dự báo trên Theo kết quả dự báo, năm 2009 Việt Nam có 16,41 triệu người trong độ tuổi từ 5-24 đang đi học, trong đó nam
là 8,6 triệu người còn nữ là 7,81 triệu người
1 Do chưa có số liệu của năm 2009 nên sử dụng số liệu của TĐTDS 1999 làm cơ sở dự báo thử nghiệm
Trang 8Số liệu dự báo về số người đang đi học theo nhóm tuổi là cơ sở cho công tác lập kế hoạch xây dựng trường lớp cho học sinh ở các cấp học khác nhau Mặt khác nó cũng cho biết khả năng nâng cao trình độ dân trí của nước ta như thế nào trong tương lai
III CÁC PHƯƠNG PHÁP DỰ BÁO SỐ NĂM ĐI HỌC BÌNH QUÂN
Số năm đi học bình quân là một chỉ tiêu thường được quan tâm trong lĩnh vực giáo dục Lý do dễ thấy là nó phản ánh một phần trình độ dân trí nói chung của dân cư Nhìn chung, số năm đi học càng nhiều trình độ dân trí càng cao Vì vậy việc dự đoán chỉ tiêu này có tầm quan trọng trong việc hoạch định chính sách về giáo dục quốc gia Có nhiều phương pháp khác nhau được sử dụng để
dự báo số năm đi học bình quân của một quốc gia Tuy nhiên, về mặt tổng quát
có thể coi có hai phương pháp cơ bản là phương pháp dãy số thời gian và phương pháp tương quan hồi quy đa nhân tố Dưới đây chúng tôi giới thiệu những nét cơ bản của hai phương pháp này
3.1 Phương pháp dự báo số năm đi học bình quân theo dãy số thời gian
Mỗi một phương pháp dự báo đều có yêu cầu riêng của mình Phương pháp dự báo theo dãy số thời gian có các yêu cầu cơ bản sau:
+ Phải có dãy số liệu phản ánh sự biến động của số năm đi học bình quân của dân số liên tục và đủ dài, thường là từ 10 năm (thời kỳ) trở lên Điều kiện này nhằm đảm bảo để phát hiện ra quy luật phát triển của hiện tượng, trên cơ sở
đó tiến hành dự báo theo quy quật này
+ Các thông tin phản ánh về số năm đi học bình quân phải có cùng phạm
vi tính toán, ví dụ nếu là số liệu của toàn quốc thì số liệu của các năm đều phải
là của toàn quốc Phạm vi tính toán không đúng sẽ dẫn đến phát hiện quy luật sai
Trang 9và thậm chí không phát hiện được quy luật phát triển của chỉ tiêu số năm đi học bình quân
Trên cơ sở dãy số liệu phản ánh sự phát triển theo thời gian xác định một phương trình tóan học mô tả thích hợp sự phát triển này sau đó ước lượng các tham số của hàm số, đánh giá mức độ phù hợp và cuối cùng là tiến hành dự báo nếu mức độ phù hợp của hàm số là cao Việc ước lượng các tham số của phương trình thường dựa vào phương pháp bình phương nhỏ nhất Phương pháp này thường được cài đặt trong các chương trình phân tích số liệu thống kê như SPSS, STATA, SAS,
3.2 Phương pháp tương quan hồi quy đa nhân tố
Ở phương pháp này trước tiên xác định mối quan hệ giữa số năm đi học của các cá nhân và các yếu tố (biến) kinh tế xã hội khác nhau có liên quan đến
họ ví dụ như tuổi tác, điều kiện kinh tế gia đình, giới tính, dân tộc,…Sau khi xác định được các yếu tố có ảnh hưởng tới số năm đi học, tiến hành thu thập thông tin của các yếu tố này tính tóan ma trận hệ số tương quan để tiến hành lựa chọn các yếu tố đưa vào mô hình dự báo Thông thường, do tầm dự báo thường ngắn, nên hàm tuyến tính đa biến được chọn làm mô hình dự báo Tức là mô hình dạng sau đây được sử dụng để dự báo:
k
k X a X
a X a a
Y 0 1 1 2 2
Trong đó, Y là tỷ lệ thất nghiệp, a , i=1,2, , k là tham số của mô mình, i X , i=1,2, , i
k là các biến có quan hệ với số năm đi học (Y)
Trong thực tế dự báo, mô hình trên có thể ứng dụng theo không gian và cũng có thể được dụng theo thời gian Theo không gian có nghĩa là thông tin về các biến được thu thập cho các cá nhân hoặc tỉnh, thành phố trên phạm vi toàn quốc để từ đó ước lượng các thông số của mô hình Khi các thông số của mô hình đã được ước lượng có thể tiến hành dự báo Để dự báo, trước tiên phải dự
Trang 10báo các biến của mô hình sau đó lắp vào mô hình để tính số năm đi học Theo thời gian có nghĩa là số liệu của các biến phải thu thập theo thời gian để ước lượng các tham số của mô hình, sau đó để tiến hành dự báo phải tiến hành một bước tiếp theo là dự báo từng yếu tố của mô hình và lắp vào phương trình dự báo
Thí dụ, dựa vào số liệu thu được từ tổng điều tra dân số năm 1989 của các tỉnh thành phố chúng tôi tiến hành xây dựng mô hình mô tả mối quan hệ giữa chỉ tiêu (biến) “Số năm đi học bình quân (SONAMDH)” với các chỉ tiêu “Số người bình quân một hộ (SN1H)”, “Tỷ lệ nữ là chủ hộ (TLNUCHUH) ”, “Tuổi kết hôn lần đầu bình quân của Nam (TUOIKH)” và “Tỷ lệ sinh thô (CBR)”
Để tiến hành xây dựng mô hình đầu tiên chúng tôi tính ma trận tương quan Bảng 3 cho thấy chỉ tiêu số năm đi học bình quân có mối quan hệ nghịch biến với với số người bình quân một hộ, tức là số người bình quân một hộ càng cao,
số năm đi học bình quân càng thấp Mối quan hệ này tương đối chặt, đạt mức R=- 0,805 Chỉ tiêu số năm đi học bình quân cũng có mối quan hệ nghịch biến với tỷ lệ sinh thô Mối quan hệ này cũng tương đối chặt Tuy nhiên chỉ tiêu này lại có mối quan hệ đồng bioến với chỉ tiêu tuổi kết hôn lần đầu bình quân của nam giới và tỷ lệ nữ giới làm chủ hộ
Bảng 3: Ma trận hệ số tương quan
** Correlation is significant at the 0.01 level (2-tailed)
* Correlation is significant at the 0.05 level (2-tailed)
Trang 11Để tránh hiện tượng đa cộng tuyến, khi xây dựng mô hình chúng tôi loại biến tuổi kết hôn lần đầu bình quân của nam giới ra vì nó có quan hệ khá chặt với chỉ tiêu tỷ lệ nữ giới làm chủ hộ Kết quả thu được như sau:
Hệ số mô tả của mô hình là 70,4% phương trình mô tả mối quan hệ giữa số năm
đi học bình quân (Y) với số người bình quân một hộ (X1), tỷ lệ nữ giới làm chủ
hộ (X2) và tỷ lệ sinh thô (X3):
Y= 9,57- 1,048X1+ 0,022X2 – 0,022X3
Để dự báo theo không gian chỉ cần xác định giá trị của X1, X2 và X3 rồi thay vào mô hình sẽ tính đưocự số năm đi học bình quân Cũng bằng phương pháp này có thể tiến hành dự báo theo thời gian, chỉ có điều khác là phải dự báo được các chỉ tiêu X1, X2 và X3 ở năm cần dự báo rồi thay vào mô hình để tính Đây
là cách làm đã được nhiều nước sử dụng
Từ mô hình trên có thể dự báo số năm đi học bình quân của năm 2009 Xác định được số người bình quân một hộ của năm 2009 X1= 4,1; tỷ lệ nữ giới làm chủ
hộ X2= 37,8%; Tỷ lệ sinh thô X3= 18,3 phần nghìn, vậy số năm đi học bình quân của tòn quốc năm này Y= 5,7 năm
IV KẾT LUẬN
Chỉ tiêu số học sinh, sinh viên và số năm đi học bình quân của dân số có ý nghĩa lớn trong công tác lập kế hoạch của đất nước Biết trước được số người đang đi học sẽ giúp cho việc tính toán số giáo viên, số phòng học cũng như số trường lớp sát với thực tế từ đó góp phần nâng cao chất lượng giáo dục; Biết được số năm đi học bình quân cho phép đánh giá bước đầu về trình độ dân trí của đất nước Đây là một việc làm quan trọng vì qua phân tích định tính thấy trình độ dân trí tỷ lệ thuân tốc độ phát triển của một quốc gia Trình độ dân trí càng cao, tốc độ phát triển của đất nước càng nhanh và vững chắc