2. Nguồn lực vật chất, nguồn nhân lực khi xử lý Tổng điều tra dân số và nhà
2.1. Nghiên cứu, đề xuất nguồn lực vật chất khi ứng dụng công nghệ ICR
lý Tổng điều tra dân số và nhà ở 1/4/2009
Nguồn lực vật chất gồm máy móc thiết bị tin học, mặt bằng lắp đặt thiết bị, kho chứa phiếu điều tra liên quan trực tiếp tới công tác xử lý thông tin Tổng điều tra dân số và nhà ở thời điểm 1/4/2009 bằng công nghệ ICR ở 3 Trung tâm Tin học thuộc Tổng cục Thống kê.
a) Các căn cứ dự tính
- Ước lượng dân số ở thời điểm Tổng điều tra để tính ra số hộ, số phiếu (phiếu dài, phiếu ngắn)
- Mẫu phiếu sơ bộ do Vụ Thống kê Dân số và Lao động thiết kế - Các khuyến cáo của chuyên gia Úc
- Kết quả thí điểm cơng nghệ ICR 2007, 2008 ở Trung tâm Tin học Thống kê
+) Ước lượng dân số ở thời điểm Tổng điều tra để tính ra số hộ, số phiếu (phiếu dài, phiếu ngắn)
Theo Niên giám Thống kê năm 2006, dân số trung bình nước ta năm 2006 là 84 155,8 nghìn người (niên giám thống kê trang 39), mỗi năm tăng trung bình 1049,5 nghìn người. Như vậy, năm 2007 là 85205,3 nghìn người, năm 2008 là 86254,8 nghìn người, năm 2009 là 87304,3 nghìn người.
Số nhân khẩu bình quân 1 hộ, theo kết quả điều tra biến động dân số, nguồn lao động năm 2007 số nhân khẩu bình quân 1 hộ là: 4,09. Như vậy, tới thời điểm điều tra cả nước sẽ có 21346 nghìn hộ (87304,3 : 4,09).
+) Mẫu phiếu sơ bộ do Vụ Thống kê Dân số và Lao động thiết kế
Mẫu phiếu sơ bộ do Vụ Thống kê Dân số và Lao động thiết kế gồm 2 loại:
- Phiếu ngắn (điều tra toàn bộ) được thiết kế trên khổ giấy A3 in 2 mặt cho 6 nhân khẩu
- Phiếu dài (điều tra mẫu) được thiết kế trên khổ giấy A4 gồm 6 tờ (12 trang) đóng thành cuốn cho 6 nhân khẩu
- Tỷ lệ điều tra mẫu được Vụ Thống kê Dân số và Lao động khẳng định là 15%.
Trong thực tế theo kết quả Điều tra biến động dân số năm 2007 có 11% số hộ có trên 6 người (phải dùng 2 phiếu). Như vậy, số phiếu thực sẽ = số hộ thực tế nhân với 111%.
Với các dữ kiện trên số phiếu, số tờ và số trang phiếu được tính tốn sơ bộ như sau:
Bảng: Số hộ, số phiếu, số tờ
Số phiếu (đã tính hộ 2 phiếu)
1000 P Số tờ (đã tính hộ 2 phiếu) 1000P
Số hộ Chia ra: Chia ra:
(nghìn hộ) Tổng số Phiếu ngắn A3 (85%) Phiếu dài A4 (15%) Tổng số Phiếu ngắn A3 (85%) Phiếu dài A4 (15%) 21 346 23 694 20140 3554 41464 20140 21324 b) Dự tính về thiết bị, phần mềm Về thiết bị:
Để thực hiện Kế hoạch, trên cơ sở thử nghiệm chúng tơi sơ bộ dự tính các thiết bị chính như sau
+) Máy quét (scanner)
Số lượng máy phụ thuộc 3 yếu tố: số lượng tờ phiếu; tốc độ máy quét; số giờ làm việc /ngày, số ngày làm việc/tháng và số tháng dự tính để quét.
- Về số lượng tờ phiếu đã có ở bảng trong mục trước
- Về tốc độ máy quét. Cục Thống kê Úc sử dụng máy quét có tốc độ lý thuyết là 160tờ A4 /phút nhưng thực tế vận hành có tải, trong môi trường mạng và các thao tác được quy chuẩn (người vận hành máy quét tay phải đưa tập phiếu mới vào khay dưới, đồng thời tay trái đưa tập phiếu đã quét xong vào hộp. Thao tác này mục đích để máy vận hành liên tục (khơng có thời gian dừng) thì tốc độ của máy cũng chỉ đạt 60% tốc độ lý thuyết.
Ở Việt Nam, theo chúng tơi có thể dùng loại máy quét có tốc độ lý thuyết 100tờ A4/ phút như vậy tốc độ thực (có tải) sẽ ở mức 55 tờ/phút cho loại phiếu khổ A4 và 40 tờ/phút cho loại phiếu khổ A3.
Ở Úc thông tin ghi trên phiếu bằng bút bi, khâu chuẩn bị phiếu đưa vào máy quét rất tốt nên phiếu sạch khơng có bụi chì, bụi tẩy nhưng cứ sau 2 giờ chạy máy họ phải làm vệ sinh máy 1 lần bằng thợ được đào tạo chuyên nghiệp (mỗi lần vệ sinh mất khoảng 5 phút).
Ở Việt Nam sử dụng bút chì, tẩy sẽ cịn nhiều bụi bẩn nên theo chúng tơi cứ sau 1giờ 30 phút làm vệ sinh 1 lần, mỗi lần 6 phút. Vì vậy giờ máy chạy thực là 56 phút/giờ
- Về số giờ làm việc trong ngày. Theo chúng tôi, để khai thác khả năng của thiết bị, mỗi ngày sẽ làm việc 2 ca. Do cường độ làm việc rất cao mỗi ca chỉ làm việc 6 giờ trong đó giờ vận hành máy quét thực là 5giờ/ca (hay 10 giờ/ngày- đã trừ thời gian chuẩn bị và nghỉ giữa ca)
- Về số ngày làm việc trong tuần: 6/7 ngày (chỉ nghỉ ngày chủ nhật và ngày lễ)
- Mục tiêu về thời gian quét. Kỳ tổng điều tra dân số 1/4/1999 tổ chức nhập tin bằng bàn phím thì riêng khâu nhập tin thơ mất 12 tháng. Cuộc Tổng điều tra kỳ này chúng tôi đặt mục tiêu thời gian quét cần phấn đấu là 6 tháng (180 ngày – 26 ngày chủ nhật, lễ = 154 ngày)
Từ các dữ kiện nêu trên có thể tính ra các dữ kiện để tính số máy quét cần dùng là:
- Thời gian thực để quét hết số phiếu:
9 Phiếu ngắn: 20 140 000 tờ A3 : 40tờ/phút = 503 500 phút
9 Phiếu dài: 21 324 000 tờ A4: 50 tờ/phút = 426 480 phút ---------------
Tổng cộng 929 980 phút
- Thời gian thực để 1 máy quét làm việc trong ngày (2 ca, mỗi ca 6 giờ, mỗi giờ 56 phút (đã trừ giờ dừng máy làm vệ sinh)
10 giờ x 56 phút/giờ = 560 phút
- Thời gian thực để 1 máy quét quét hết số phiếu – ngày 929 980 phút: 560 phút = 1661 ngày
- Để đạt mục tiêu quét trong 6 tháng số máy quét thực cần dùng là
1661 ngày : 154 ngày = 10, 8 máy
Tuy nhiên 10,8 máy theo tính tốn nói trên là trong điều kiện máy vận hành thơng suốt. Trong thực tế khi làm thử trên máy quét Fujitsu fi-5900C thời gian máy có sự cố chiếm tỷ lệ khá lớn (Hiện TTTHTK và Công ty cung cấp máy chưa tìm ra ngun nhân). Ngồi ra cịn phải mất thời gian giải quyết kẹt giấy, thời gian nhập thơng tin về các địa bàn. Vì vậy, thời gian quét chỉ đạt khoảng 70% thời gian vận hành của máy. Do vậy, cần trang bị 14 máy quét có tốc độ bằng hoặc lớn hơn 100 tờ A4/phút.
Để 14 máy thực hiện quét liên tục, những phiếu phải quét lại được chuyển
tới máy quét khác có tốc độ chậm hơn. Dự tính số lượng các phiếu này không nhiều nên chỉ trang bị tại mỗi Trung tâm 01 máy quét tốc độ thấp.
+) Máy chủ
Số lượng máy chủ phụ thuộc vào khối lượng thông tin cần xử lý, tổ chức xử lý và quy trình xử lý (quét phiếu, nhận dạng, sửa dữ liệu, chuyển đổi dữ liệu, tổng hợp…). Theo tính tốn của chúng tơi để xử lý thơng tin ở 3 TTTH cần 9 máy chủ và chia thành 2 loại
- 3 Máy chủ mạnh: 02 máy cho 2 TTTH có khối lượng xử lý lớn, 01
máy dành riêng cho khâu tiếp nhận và tổng hợp thơng tin - 6 Máy chủ trung bình (mỗi Trung tâm 2 máy)
+) Máy trạm (PC)
Theo quy trình xử lý và để phục vụ 14 máy quét, số lượng máy PC cần sử dụng khoảng 180 máy được phân chia theo chức năng như sau: 14 PC dành để nhận thông tin từ máy quét, 10 PC phục vụ việc nhận dạng ký tự, 5 PC làm nhiệm vụ chuyển đổi dữ liệu, 77 PC dùng để sửa dữ liệu, 33 PC nhập phiếu không nhận dạng được, 13 PC kiểm, sửa logic, 10 PC phục vụ khâu chuẩn bị số liệu đầu vào, 5 PC quản lý dữ liệu, 10 PC phục vụ khâu lập trình và test thử phần mềm, 3 PC dùng cho máy quét nhỏ để quét các phiếu lỗi.
Các PC sử dụng để xử lý lơ có khối lượng lớn (qt, nhận dạng, chuyển
đổi) phải có tối thiểu 1GB RAM, tốt nhất là 2GB RAM. Tốc độ CPU của
những PC này cao nhất ở mức có thể. Cần có màn hình LCD 19’’ xoay được 180 độ để có thể hiển thị toàn bộ tờ phiếu khổ A3 với độ room 80-90%
+) Máy in
Cần 3 loại máy in cho toàn hệ thống: - 3 Máy in nhanh để in kết quả tổng hợp
- 6 máy in thường để in kiểm tra lỗi và các tài liệu thông thường - 1 máy in màu dùng để phát triển các sản phẩm kết quả tổng điều tra. +) Máy cắt giấy
Do phiếu được đóng thành cuốn nên khi đưa vào máy quét cần được cắt rời. Kinh nghiệm cho thấy sử dụng máy cắt cỡ nhỏ (dao xén khoảng 65-70cm) hiệu quả hơn vì thao tác nhanh hơn. Mỗi máy cắt sẽ phục vụ được 2 máy quét như vậy nếu sử dụng 14 máy quét thì cần sử dụng 7 máy cắt. Nhưng do xử lý ở 3 TTTH nên số lượng máy cắt cần thiết là 8 máy (TTTH Hà Nội, TP HCM mỗi đơn vị 3 máy, Đà Nẵng 2 máy)
+) Lưu điện
Lưu điện chỉ phục vụ cho máy chủ. Tùy vị trí lắp đặt máy chủ để bố trí thiết bị lưu điện. Tổng số thiết bị lưu điện dự tính là 4 cái.
Tại mỗi TTTH, các máy chủ, máy trạm, máy in đều được lắp thành 1 mạng LAN riêng biệt. Mạng LAN này cần được lắp đặt với các Switch có các cổng tốc độ cao (Gigabit Ethernet) nối tới tất cả các máy chủ, máy PC thực hiện các công việc quét, nhận dạng, chuyển đổi. Dự kiến cần: 10 Switch 24 ports, 10 Path panel 24 ports, 3 tủ mạng, cáp mạng và các vật tư đi kèm.
+) Thiết bị backup
Với điều kiện môi trường cũng như điều kiện kỹ thuật như hiện nay thì
việc xây dựng hệ thống Backup dùng hệ thống SAN là phù hợp hơn cả. Để triển khai một hệ thống Backup cần phải có thiết bị Backup và phần mềm kèm theo.
+) Máy hút ẩm
Số lượng máy hút ẩm được ưu tiên cho các phòng đặt máy chủ và máy quét. Dự kiến cần 10 máy hút ẩm cho cả 3 Trung tâm.
+) Máy Photocopy
Máy Photocopy dành để nhân bản kết quả điều tra. Số lượng máy Photocopy cần mua là 01 chiếc trang bị cho TTTHTK.
+) Máy điều hòa nhiệt độ
Điều hòa nhiệt độ phụ thuộc vào số phòng lắp đặt thiết bị, diện tích phịng. Dự kiến có khoảng 23 máy điều hòa nhiệt độ cần mua sắm mới cho cả 3 Trung tâm.
+) Phụ tùng linh kiện thay thế
Phụ tùng linh kiện thay thế được tính trên cơ sở độ bền của linh kiện mà nhà sản xuất thiết bị đã ghi trong catalog của thiết bị. Các linh kiện thiết bị cần thay thế là các rulo kéo giấy của máy quét,.. Số lượng cụ thể phụ thuộc vào từng loại máy cụ thể.
Phần mềm:
+) Phần mềm hệ thống
Hiện tại cả 3 TTTH đều sử dụng hệ điều hành Windows Server 2003 SP2 cho máy chủ, Windows XP cho máy trạm, sử dụng hệ quản trị CSDL SQL Server 2003. Nhưng từ nay đến năm 2009 cần xem xét và cập nhật lại.
+) Phần mềm quét
Từ 2006 Trung tâm Tin học Thống kê khi thí điểm đã sử dụng phần mềm Form 5.2 của Công ty ReadSoft Thụy Điển. Nếu tiếp tục mua phần mềm của Công ty này cho xử lý TĐT DS 1/4/2009 là tốt nhất.
c) Dự kiến phân bổ thiết bị cho 3 Trung tâm Tin học
tâm Tin học khu vực III đảm nhận 16 tỉnh miền Trung, Tây nguyên và Ninh Thuận; Trung tâm Tin học khu vực II đảm nhận 20 tỉnh còn lại. Theo cơ cấu dân số các tỉnh năm 2006 (Niên giám thống kê 2006 trang 37, 38) thì cơ cấu như sau: Các tỉnh do TTTHTK đảm nhận chiếm 44%, do TTTHKV III đảm nhận chiếm 19,6%, TTTHKVII đảm nhận chiếm 36,4%
Ngoài ra, Trung tâm Tin học Thống kê Hà Nội cịn đóng vai trị chỉ đạo trong việc xây dựng chương trình, nhận các file dữ liệu từ 2 Trung tâm còn lại, tổng hợp theo kế hoạch và quản lý toàn bộ hệ thống xử lý. Dự kiến phân bố thiết bị như sau:
Dự kiến phân bố thiết bị 3 Trung tâm Tin học
STT Tên thiết bị Tổng số TTTH TK TTTHTK III TTTHTK II
I Thiết bị
1 Máy Scanner
- Máy quét tốc độ cao 14 6 3 5
- Máy quét tốc độ thấp 3 1 1 1 2 Máy chủ - Máy chủ mạnh 2 1 - 1 - Máy chủ trung bình 7 3 2 2 3 Máy PC 180 83 31 66 4 Máy in
- Máy in Laser tốc độ cao 3 3 - -
- Máy in Laser thường 6 2 2 2
- Máy in Laser màu 1 1 - -
5 Lưu điện UPS 10 KVA 4 2 1 1
6 Thiết bị mạng
- Switch Gigabit Ethernet 24 ports 14 6 3 5
- Path Panel 24 ports 11 5 2 4
- Tủ mạng 3 1 1 1
- Cáp mạng và vật tư khác (*)
8 Thiết bị Backup 3 1 1 1
8 Máy hút ẩm 10 4 2 4
9
Máy điều hòa nhiệt độ 24.000
BTU 26 13 5 8
10 Máy cắt 8 3 2 3
11 Máy Photocopy 1 1 - -
12 Linh kiện phụ tùng thay thế (**)
II Phần mềm
1 Phần mềm hệ thống
2 Phần mềm nhận dạng ICR
Ghi chú:
(*) Cáp mạng và vật tư khác được tính dựa trên vị trí lắp đặt cụ thể của mỗi
LAN
(**) Phụ tùng linh kiện thay thế của máy quét tính trên cơ sở độ bền của linh kiện mà nhà sản xuất thiết bị đã ghi trong catalog của thiết bị. Các linh kiện thiết bị
cần thay thế là các rulo kéo giấy của máy quét,.. Số lượng cụ thể phụ thuộc vào từng loại máy cụ thể
d) Mặt bằng lắp đặt thiết bị
Với phương án xử lý tập trung ở 3 Trung tâm Tin học của ngành, việc bố trí mặt bằng để lắp đặt thiết bị là một vấn đề rất quan trọng. Hiện trạng, trụ sở làm việc của 3 Trung tâm Tin học như sau:
+) Trung tâm Tin học thống kê -54 nguyễn Chí Thanh - Hà Nội
Trung tâm Tin học Thống kê sẽ được Tổng cục Thống kê bố trí làm việc tại 1 phần tầng 4, một phần tầng 5, tầng 6 và tầng 7 của nhà 7 tầng tại 54 Nguyễn Chí Thanh- Hà Nội với diện tích xây dựng khoảng 1000 m2. Diện tích mặt bằng này, theo chúng tôi, đã đáp ứng được các yêu cầu lắp đặt thiết bị để phục vụ xử lý kết quả tổng điều tra.
+) Trung tâm Tin học khu vực II (tại TP Hồ Chí Minh)
Trung tâm Tin học khu vực II hiện chưa xây dựng xong trụ sở làm việc và đang phải đi th với diện tích rất hẹp. Đây là khó khăn rất lớn khi tiếp nhận máy móc thiết bị. Hiện Trung tâm đang phối hợp chặt chẽ với Tổng cục để thúc đẩy nhanh việc xây dựng trụ sở mới.
+) Trung tâm Tin học khu vực III (tại 54 Trần Quốc Toản, TP Đà Nẵng)
Trụ sở làm việc đã được sửa chữa và nâng cấp đạt yêu cầu để lắp đặt thiết bị phục vụ xử lý kết quả Tổng điều tra.
e) Kho chứa phiếu
Kho chứa phiếu điều tra là nơi tiếp nhận, lưu giữ, bảo quản, luân chuyển trong suốt thời gian xử lý và thời gian lưu giữ cần thiết khi kết thúc các quy trình xử lý. Kho chứa phiếu phải đạt các yêu cầu sau:
+) Các yêu cầu về kho chứa phiếu
- Phải đủ diện tích chứa phiếu ở từng khu vực theo tiêu chuẩn: Xếp riêng phiếu cho từng tỉnh/huyện/xã để dễ tìm; khơng xếp cao quá để dễ lấy… - Kho phải là nơi cao ráo (không ẩm thấp khơng thấm dột)
- Phải có kệ kê (không để phiếu trực tiếp trên sàn nhà, nền nhà)
- Phải có phương tiện chống mối, mọt; chống trộm cắp, chống cháy nổ - Phải là nơi thuận tiện cho việc vận chuyển (vào/ra)
+) Dự tính về diện tích kho
Trong kỳ Tổng điều tra này, theo dự tính có khoảng 600 tấn phiếu. Nếu mỗi m2 xếp được 500 kg thì cần khoảng 1200 m2. Nhưng để thuận tiện cho khâu vận chuyển, tìm kiếm cần phải để lại lối ra/vào. Lối ra/vào chiếm khoảng
1/3 diện tích. Như vậy tổng diện tích kho cần thiết khoảng 1800m2. Diện tích kho chứa phiếu ở từng TTTHTK là:
- Trung tâm Tin học thống kê: 792 m2