Thực hiện xử lý

Một phần của tài liệu nckh_orc_8315 (Trang 75 - 80)

3. Thử nghiệm công nghệ ICR trong xử lý điều tra thử nghiệm lần 3 Tổng

3.2. Thực hiện xử lý

+) Tiếp nhận và chuẩn bị phiếu

Điều đáng nói nhất là việc sắp xếp phiếu không đúng yêu cầu cho xử lý bằng ICR. Mặc dù trong cả 2 điều tra năm 2007 (điều tra BĐDS và LĐVL), TTTH đã đưa ra và nhắc nhở rất nhiều về yêu cầu sắp xếp phiếu là không được gấp đôi từng tờ phiếu, không lồng/kẹp các phiếu/tập phiếu vào nhau (của các hộ có nhiều tờ/tập phiếu). Tuy nhiên lần nay, cũng giống như với tình trạng xảy ra trong năm 2007, tất cả các phiếu khổ A3 đều gập đôi từng từ phiếu, phiếu khổ A4 thì lồng/kẹp vào nhau. Vấn đề này cần phải được giải quyết trong

TĐTDS 2009, bởi với khối lượng phiếu lớn việc phải mở ra từng tờ phiếu, vuốt và ép phẳng lại nếp gấp sẽ rất tốn kém nhân công và làm chậm lại tồn bộ q trình xử lý.

+) Cắt phiếu

Việc cắt phiếu phải thực hiện đối với loại phiếu dài (điều tra mẫu) để làm cho tập phiếu rời ra từng tờ. Như đã nói ở trên, đối với phiếu điều tra thử lần 3 này, việc cắt phiếu gặp rất nhiều khó khăn. Do lần này phiếu thiết kế theo phương thẳng đứng chứ không xoay ngang như phiếu điều tra LĐVL 2007, phía lề phải cắt là chiều dài của phiếu nên chiều dài dao cắt chỉ có thể cắt 1 tập phiếu mỗi lần chứ khơng thể cắt cùng lúc cắt 2 tập phiếu như điều tra LĐVL. Lề phiếu lại quá nhỏ, chỉ cần khi dao cắt đẩy xơ lệch các tập phiếu chút ít là đã bị cắt lẹm vào các ơ thơng tin. Chính vì thế, người vận hành máy cắt phải chia nhỏ lô phiếu (địa bàn), mỗi lần cắt chỉ đặt vào từ 12 đến 15 tập phiếu. Thêm nữa máy cắt trong năm 2007 đã có lần gặp sự cố (dao cắt tự rơi xuống khi không bấm nút điện) nên để tránh xảy ra tai nạn lao động một cách đáng tiếc, phải sử dụng 2 lao động cho 1 máy cắt, một người đứng trước máy điều khiển, một người đứng phía sau đặt giấy và lấy giấy ra để tránh việc đưa tay qua phía dưới dao cắt. Chính vì thế việc cắt phiếu đã chậm mà lại tốn thêm nhân công.

Để cắt 704 tập phiếu 6 tờ 12 trang (phiếu dài) với 2 người phục vụ đã mất 111 phút. Tính trung bình mỗi tập phiếu mất 0,1577 phút. Việc cắt phiếu ảnh hưởng nhất định đến tốc độ quét phiếu và chất lượng nhận dạng tờ phiếu. Khi cắt phiếu quá chéo góc thì khi qt vào máy, các tờ phiếu dễ bị không nhận dạng được. Mặc dù các tờ phiếu khi cắt có thể bị xén nhiều ít miễn là còn cách một khoảng nhỏ đến trường định vị hoặc trường thông tin nhưng trên thực tế nếu cùng một địa bàn (một lơ phiếu) mà có độ rộng hẹp chênh lệnh đáng kể (do các lần cắt khác nhau) thì khi quét hay bị kẹt giấy.

Việc tính tốn thiết bị cắt, nhân lực cắt phiếu cần phải được xem xét lại một cách thật cẩn thận. Máy cắt nếu mua loại hiện đại rất đắt tiền nhưng vẫn chưa hoàn toàn phù hợp việc việc cắt mỗi lần một/một vài địa bàn điều tra, thêm nữa những máy cắt này được thiết kế cho cắt giấy/ sách phẳng khơng bị phồng do đóng ghim giữa như phiếu điều tra. Vì thế dù đặt mua máy cắt loại nào cũng cần có thiết kế gia cơng lắp ráp thêm vào những bộ phận bổ sung phù hợp với việc chặn các tập giấy không để cho độ phồng của việc ghim và gập giấy đẩy xô lệch khi cắt. Thiết kế lề phiếu dài phía phải cắt cũng phải được xem xét bởi độ rộng lề phiếu sẽ tỷ lệ thuận với tốc độ cắt phiếu do lề càng hẹp thì mỗi địa bàn sẽ càng phải chia làm nhiều tập khi cắt.

Việc cắt phiếu chỉ cần đối với phiếu dài trong TĐTDS nên để đạt hiệu quả kinh tế, sau khi xác định chính xác tỷ lệ phiếu mẫu cần tính tốn tìm hiểu các loại máy cắt, giá cả xác định số lượng máy cắt cần thiết, có thể phải thay đổi cả kế hoạch, quy trình xử lý do cơng việc cắt phiếu không thể theo kịp tiến độ xử

loại phiếu dài và ngắn, chấp nhận việc hoàn thành xử lý phiếu mẫu chậm hơn dự tính nhưng vẫn đảm bảo tiến độ xử lý chung).

+) Quét phiếu (Scan)

Sau một vài lần thử số lượng phiếu đơn lẻ hoặc một vài địa bàn, hai lần quét chính thức sau đây được thống kê thời gian. Quy trình quét cũng thay đổi. Trong các thử nghiệm năm 2007, mỗi khi bị kẹt giấy hoặc tờ phiếu không nhận dạng được do những ly do khác nhau, người thực hiện quét phiếu đều dừng lại, xác định tờ phiếu hỏng, tìm tờ hỏng trong tập phiếu và quét tiếp lại vào cùng lô (batch) địa bàn. Cách làm này dễ dàng hơn cho việc quản lý, nhất là khi quản lý cịn thủ cơng nhưng khơng đảm bảo cơng suất tối đa cho máy quét. Quy trình quét lần này theo nguyên tắc, người quét phiếu liên tục quét phiếu khơng để máy qt dừng lại lâu, khi có lỗi vẫn chuyển sang tập khác, một người khác sẽ tìm kiếm, xác định những tờ phiếu gặp trục trặc, tập hợp lại để xử lý sau.

Một số thông số chính thiết lập cho module quét lần thử nghiệm này là: Contract: 60, Light: 25, DPI: 300. Đối với phiếu ngắn khổ A3, mỗi phiếu là 1 tờ A3 hai mặt, tốc độ quét trung bình 1 phiếu là 1,1145 giây. Đối với phiếu dài khổ A4, mỗi phiếu là 6 tờ 12 trang A4, tốc độ quét trung bình mỗi tờ là 1,48008 giây.

Nhận xét chung:

- Công việc quét phiếu lần này đạt được tốc độ quét phiếu cao hơn những lần trước và máy cũng không bị hỏng trong quá trình làm việc. Tuy nhiên cũng phát sinh một số trục trặc: phiếu bị cắt lệch, máy cuốn nhiều tờ cùng lúc làm kẹt giấy nhiều hơn và nhất là việc ảnh các trang phiếu bị lệch chưa xác định được chính xác nguyên nhân.

- Việc quét phiếu đóng thành tập khổ A4 khó khăn hơn rất nhiều so với phiếu

đơn rời từng tờ khổ A3. Các khó khăn đều xuất phát từ loại phiếu này: máy

cuốn nhiều tờ, kẹt giấy nhiều, mỗi khi bị kẹt giấy hoặc 1 phiếu không nhận dạng được việc xử lý cũng tốn nhiều thời gian do việc phải liên kết các tờ phiếu với nhau, khi hỏng 1 tờ phải xóa và làm lại cả tập, v.v...

- Mặc dù đặt giấy theo các chiều khác nhau hệ thống đều có thể xoay phiếu về đúng vị trí nhưng người vận hành máy quét cần đặt giấy theo đúng chiều phiếu đã định dạng để đạt được tốc độ quét phiếu cao nhất.

- Khi đặt giấy vào khay của máy quét, phiếu càng được dỗ thẳng thì càng ít xảy ra trường hợp tờ phiếu không nhận dạng được.

- Tốc độ quét phụ thuộc vào nhiều yếu tố như: tốc độ tối đa của máy quét, máy chủ, máy PC thực hiện công việc quét, kết nối giữa các máy, tốc độ truy cập CSDL, phần mềm quét phiếu và số lượng ô cần cắt thành từng ảnh trên mỗi trang phiếu. Khi tính tốn lập kế hoạch cho TĐTDS 2009, cần so sánh phiếu thiết kế cuối cùng với các mẫu phiếu đã làm thử đồng thời đánh giá ảnh hưởng

của đường truyền và tốc độ truy cập CSDL khi có nhiều máy, nhiều module khác nhau chạy đồng thời.

+) Nhận dạng (Interpret)

Công việc nhận dạng được thực hiện 3 lần, lần thứ nhất và hai đều thực hiện với các ảnh của lần quét thứ nhất, lần thứ ba thực hiện với lần quét thứ hai. Riêng với phiếu A4 cịn có thêm một lần thực hiện nhận dạng cho 4 địa bàn làm lại do lần thực hiện đầu tiên có quá nhiều tập phiếu không nhận dạng được. Tốc độ thực hiện nhận dạng trung bình của 3 lần với phiếu ngắn (A3) là 36,43 tờ/phút và với phiếu dài (A4) là 90,15 tờ/phút.

Một số thông số đã lựa chọn khi định nghĩa các mẫu phiếu ảnh hưởng đến kết quả nhận dạng như sau:

- Security: 5 (ở mức độ cân bằng giữa Security và Interpret). Với mức độ an toàn của nhận dạng này thì sẽ bớt đi số lưọng trường không nhận dạng được (nghĩa là phần lớn các trường đều đã được gán giá trị nhận dạng), nhưng do thuộc tính xác thực theo đống/lơ (Mass Verify) được chọn là kiểm tra lại 100% các trường ngay cả khi phần mềm đã coi là nhận dạng chắc chắn nên vẫn đảm bảo độ an tồn chính xác cao nhất cho số liệu.

- Việc loại bỏ các vết bẩn (bôi quá bẩn) hoặc loại bỏ những vết mờ khi điều tra viên tẩy xóa khơng hết thơng tin với việc áp dụng thuộc tính Detect Strikeout (phát hiện những trường đã xóa) và Detect Noise (phát hiện các tạp chất/vết bẩn) được thiết lập như sau: Với loại phiếu A3 viết bút chì thường: Detect Strikeout: 90%; Detect Noise 20%.

Với phiếu A4 viết bằng bút chì kim mờ hơn những thiết lập trên có thể làm mất những thông tin ghi quá mờ nên không áp dụng, nghĩa là mọi dấu vết gì phát hiện trong các ô phiếu đều được nhận dạng và đưa ra cho người kiểm tra xem xét.

- Tỷ lệ nhận dạng được tính trên tỷ lệ giữa những ơ mà phần mềm nhận dạng xác định chắc chắn dữ liệu đã số hóa (cả ơ đánh dấu và ơ ký tự) trên tổng số ơ có ghi thơng tin cần phải nhận dạng. Những trường phần mềm không nhận dạng được hoặc đã nhận dạng nhưng không chắc chắn là những trường mà người kiểm tra xác thực số liệu sẽ phải kiểm tra và nhập thông tin vào. Tỷ lệ nhận dạng trung bình được đối với phiếu ngắn (A3) là 99,44 %, phiếu dài (A4) là 99,52%.

Nhận xét về việc ghi phiếu: các phiếu của điều tra này có màu chì tương

đối đậm, lên ảnh rõ, thuận lợi cho việc nhận dạng và cho người kiểm tra xác

thực dữ liệu, viết đúng vào các ô. Tuy nhiên chữ viết của nhiều phiếu vẫn còn cẩu thả, việc tẩy các thông tin sai chưa được cẩn thận, vẫn cịn rất nhiều các nét chì mờ và các nét chì cịn lại này trở thành các ký tự không nhận dạng được mà người kiểm tra số liệu sau này phải thực hiện thao tác xóa dữ liệu.

Trong điều tra thử nghiệm này, loại bút chì sử dụng phân biệt cho 2 loại phiếu: bút chì thường được sử dụng cho loại phiếu ngắn, bút chì kim sử dụng cho loại phiếu dài. Từ tỷ lệ nhận dạng ta nhận thấy hầu như khơng có sự khác biệt đáng kể về tỷ lệ nhận dạng giữa 2 loại phiếu dài và phiếu ngắn, hay nói một cách khác, việc sử dụng bút chì kim hay bút chì thường vỏ gỗ hầu như khơng ảnh hưởng đến tỷ lệ nhận dạng. Việc lựa chọn loại bút chì nào cần xác định từ chính những người sử dụng: các điều tra viên và những người thực hiện ký mã phiếu điều tra.

+) Xác thực và kiểm tra số liệu (Verify)

Đây là bước kiểm tra, xác thực dữ liệu sau khi nhận dạng sử dụng lao động thủ công. Đối với điều tra thử lần này, không kết hợp các kiểm tra logic phức tạp trong chức năng kiểm tra (Verify). Toàn bộ số liệu được tiến hành 2 lần kiểm tra, xác thực dữ liệu theo 2 cách khác nhau: lần thứ nhất bao gồm cả kiểm tra theo lô ký tự (Mass Verify), lần thứ hai bỏ chức năng Mass Verify trong kiểm tra. Do điều tra này có số lượng phiếu nhỏ, mỗi đợt tiến hành Verify mỗi người chỉ thực hiện một vài địa bàn nên tốc độ làm việc không thể cao được. Thêm nữa đối với điều tra thật thì việc thực hiện Verify phải thực hiện đồng thời tất cả các loại kiểm tra, bao gồm cả Mass Verify và kiểm tra logic phiếu. Vì thế thống kê về tốc độ dưới đây chỉ mang tính tham khảo: Tốc độ Verify trung bình là 7,87 phiếu/phút (có cả mass verify) và 16,15 phiếu/phút (khơng có mass verify) đối với phiếu ngắn (A3); và là 1,58 phiếu/phút (có cả mass verify) và 5,09 phiếu/phút (khơng có mass verify) đối với phiếu dài (A4).

Từ những thống kê trên đây ta có thể thấy, tỷ lệ nhận dạng được với phiếu ĐT này khá cao từ 99,4 đến 99,5% . Hệ thống nhận dạng tính chung sai gần 5 phần nghìn, số lỗi này có thể và phải được phát hiện và sửa chữa bởi người kiểm tra xác thực dữ liệu với chức năng Mass Verify. Người thực hiện kiểm tra xác thực dữ liệu còn để lại khoảng gần 0,3 phần nghìn ký tự sai. Đương nhiên những lỗi của hệ thống nhận dạng hay của người kiểm tra xác thực dữ liệu có phần nguyên nhân từ việc ghi phiếu.

+) Chuyển đổi số liệu (Transfer)

Trong các thử nghiệm năm 2007, tốc độ chuyển đổi dữ liệu của các phiếu

điều tra chỉ gồm 1 tờ phiếu (điều tra BĐ DS & KHHGĐ) có tốc độ khá cao,

nhưng tốc độ thực hiện với phiếu điều tra là một tập nhiều tờ (điều tra LĐVL) rất chậm. Tuy nhiên với việc nghiên cứu thay đổi cách thức cũng như chương trình chuyển đổi, tốc độ chuyển đổi số liệu đã tăng lên nhiều lần. Đối với phiếu ngắn (A3) tốc độ chuyển đổi trung bình là 398,48 phiếu/phút; phiếu dài (A4) tốc độ chuyển đổi trung bình là 95,36 phiếu/phút. Tốc độ này khá cao một phần cũng do module Transfer được chạy ngay trên máy chủ.

+) Kiểm tra số liệu sau khi chuyển đổi

Các chương trình kiểm tra logic được xây dựng và sử dụng để kiểm tra phát hiện các lỗi sai logic, in ra biên bản kiểm tra và đem đối chiếu với phiếu

gốc. Tuy nhiên, do trước đó phiếu đã được chạy qua hệ thống nhận dạng nhiều lần, so sánh với nhau và phát hiện các lỗi do hệ thống nhận dạng sai hoặc do thiếu sót của người thực hiện kiểm tra xác thực dữ liệu nên các lỗi in ra của các chương trình này đều là lỗi ghi phiếu.

Bảng thống kê lỗi do ghi phiếu có trong Phụ lục số 3. Qua bảng thống kê có thể thấy số lượng lỗi ghi phiếu khá cao, trong đó lỗi việc xác định sai bước nhảy khi ghi phiếu chiếm tỷ lệ quan trọng. Các trường hợp giá trị xác định bước nhảy chính là giá trị cận để xác định (ví dụ tuổi bằng 5, 13, 15, 19 hay lớp phổ thông bằng 5,...) thường dễ bị xảy ra lỗi chuyển bước nhảy sai. Đây là vấn đề cần rút kinh nghiệm trong việc đào tạo, kiểm tra giám sát điều tra.

Một phần của tài liệu nckh_orc_8315 (Trang 75 - 80)

Tải bản đầy đủ (PDF)

(134 trang)