CHƯƠNG 3: ỨNG DỤNG CÁC THUẬT TOÁN PHÂN CỤM VỚI DỮ LIỆU NGÀNH BẢO HIỂM XÃ HỘI
3.2. Cơ sở dữ liệu bảo hiểm xã hội
Do đặc thù của ngành bảo hiểm xã hội, hiện nay dữ liệu của ngành đang đƣợc chia thành 2 nhóm chính nhƣ sau:
3.2.1. Cơ sở dữ liệu người đang tham gia BHXH, BHYT
Cơ sở dữ liệu này còn đƣợc gọi là cơ sở dữ liệu thu BHXH (tạo nguồn thu cho cơ quan BHXH).
Do mức độ phức tạp và độ lớn của dữ liệu này, hiện nay mới chỉ có một số tỉnh nhất định có được cơ sở dữ liệu đầy đủ của người lao động tham gia BHXH và BHYT, số các tỉnh còn lại vẫn chƣa đủ khả năng, chƣa đủ điều kiện
để xây dựng đƣợc. Do vậy, Cơ quan BHXH Việt Nam cho đến thời điểm hiện tại vẫn chưa có được cơ sở dữ liệu đầy đủ của người lao động đóng BHXH và người tham gia BHYT.
Dữ liệu loại này đƣợc chia làm 2 loại nhƣ sau:
+ Người lao động đồng thời tham gia cả BHXH và BHYT.
+ Người chỉ tham gia BHYT.
3.2.1.1. Dữ liệu người lao động đồng thời đóng cả BHXH và BHYT
Loại dữ liệu này chiếm phần lớn (về mặt dung lƣợng) trong cở sở dữ liệu của ngành BHXH. Tính cho đến hết quý 2 năm 2007, BHXH Việt Nam đang quản lý khoảng trên 8 triệu người lao động đồng thời tham gia cả BHXH và BHYT. Loại dữ liệu này đƣợc chia làm 2 phần thông tin chính nhƣ sau:
a. Phần thông tin quá khứ của người lao động
Lưu lại quá trình công tác của người lao động qua mỗi lần có sự thay đổi về mức đóng BHXH, BHYT, thay đổi về nơi làm việc,.. nói chung là lưu lại tất cả những thay đổi của người lao động từ quá khứ cho đến thời điểm hiện tại. Phần thông tin này được tính bắt đầu từ khi người lao động tham gia BHXH cho đến thời điểm hiện tại.
b. Phần thông tin hiện tại của người lao động
Lưu thông tin về tình trạng hiện tại của người lao động: làm ở đơn vị nào, nghề nghiệp, chức vụ gì, mức lương hàng tháng,…
Chia thông tin của người lao động ra thành 2 phần như vậy bởi vì quản lý thông tin của một người lao động từ lúc họ bắt đầu tham gia BHXH cho đến khi người đó không còn tham gia BHXH nữa thì lại chuyển sang quản lý thông tin của người đó ở lĩnh vực khác (hưởng các chế độ BHXH hàng tháng). Do vậy, thông tin cần lưu trữ là rất lớn và rất lâu (lên đến hàng chục năm) và phần thông tin phía trước là hầu như không thay đổi, chỉ có phần thông tin hiện tại là sẽ có sự thay đổi cho nên toàn bộ thông tin của người lao động đƣợc tách ra để dễ quản lý.
Tính phức tạp của loại dữ liệu này là việc ta phải lưu trữ được toàn bộ thông tin của người lao động từ khi họ bắt đầu tham gia BHXH cho đến khi
họ không tham gia BHXH nữa để chuyển sang hưởng các chế độ BHXH tương ứng, đến thời điểm này ta vẫn phải lưu phần thông tin liên quan đến việc hưởng các chế độ BHXH hàng tháng của họ, đến khi chết.
Trong quá trình người lao động tham gia BHXH, họ có thể được hưởng các chế độ BHXH ngắn hạn hoặc dài hạn. Khi người lao động hưởng các chế độ BHXH thì căn cứ vào quá trình tham gia BHXH của họ để thực hiện việc xét hưởng chế độ của họ, khi không đủ điều kiện hưởng các chế độ BHXH hàng tháng thì người lao động được hưởng các chế độ BHXH ngắn hạn hoặc một lần.
3.2.1.2. Dữ liệu người chỉ tham gia BHYT
Tính đến quý 2 năm 2007, BHXH Việt Nam hiện đang quản lý khoảng gần 40 triệu người chỉ tham gia BHYT (bao gồm cả BHYT bắt buộc và BHYT tự nguyện). Tuy chiếm số lƣợng lớn trong cơ sở dữ liệu nhƣng về mặt dung lượng lưu trữ thì loại dữ liệu của đối tượng chỉ tham gia BHYT này lại chiếm phần ít hơn (do thông tin lưu trữ đơn giản hơn rất nhiều so với loại dữ liệu của người lao động đồng thời tham gia cả BHXH và BHYT), cơ sở dữ liệu của người chỉ tham gia BHYT chỉ bao gồm những thông tin hiện tại về bản thân của người tham gia BHYT (không phải lưu thông tin về quá khứ của người tham gia BHYT) cho nên dung lượng của cơ sở dữ liệu loại này nhỏ hơn rất nhiều so với cơ sở dữ liệu của người đồng thời tham gia cả BHXH và BHYT.
Bao gồm những loại đối tƣợng sau:
a. Người tham gia BHYT bắt buộc
+ Những người đang hưởng các chế độ BHXH hàng tháng.
+ Người nghèo.
+ Đại biểu hội đồng nhân dân các cấp.
+ Một số khác: nạn nhân chất độc màu da cam, người có công,…
Mức đóng hàng tháng được tính như sau: 3% của mức lương tối thiểu tại thời điểm hiện tại. Số tiền này được trích từ ngân sách nhà nước chuyển sang quỹ của BHXH, người tham gia BHYT loại này không phải đóng tiền.
b. Người tham gia BHYT tự nguyện + Học sinh, sinh viên.
+ Hộ gia đình, thành viên các tổ chức, hội, đoàn thể.
Đối với người chỉ tham gia BHYT tự nguyện thì mức đóng được cố định theo năm (không tính hàng tháng nhƣ đối với BHYT bắt buộc), từng loại đối tƣợng tham gia khác nhau thì có mức đóng khác nhau: học sinh, sinh viên có mức đóng khác với hộ gia đình, khác với các tổ chức, hội, đoàn thể. Số tiền đóng BHYT này do người tham gia BHYT tự đóng.
Do tính chất xã hội của loại đối tƣợng này cho nên dữ liệu này có mức độ thay đổi ít cả về số lượng và các thông tin đi kèm. Dữ liệu thường được phát sinh theo chu kỳ hàng năm.
+ Người nghèo: hàng năm căn cứ vào mốc để xác định người nghèo, sở lao động thương binh và xã hội các tỉnh, thành phố lập danh sách gửi sang cơ quan BHXH tỉnh, thành phố cùng cấp. Sau đó cơ quan BHXH thực hiện việc in thẻ BHYT theo danh sách đó và chuyển lại cho sở lao động thương binh và xã hội để chuyển cho người tham gia. Việc này được thực hiện vào khoảng tháng 11 hoặc tháng 12 hàng năm.
+ Học sinh, sinh viên: các trường học lập danh sách học sinh mua BHYT và chuyển cho cơ quan BHXH, cơ quan BHXH thực hiện việc in thẻ BHYT và chuyển lại cho các trường học để chuyển cho học sinh, sinh viên.
Việc này đƣợc thực hiện theo chu kỳ hàng năm vào khoảng tháng 7 hoặc tháng 8 (chuẩn bị bước vào năm học mới).
+ Các loại khác cũng được thực hiện tương tự,…
+ Chỉ có dữ liệu tham gia BHYT của người đang hưởng các chế độ BHXH hàng tháng là đƣợc cập nhật mỗi khi có biến đổi: khi có thêm một người được hưởng các chế độ BHXH hàng tháng thì cơ quan BHXH phải thực hiện ngay việc in một cái thẻ BHYT cho người đó.
3.2.2. Cơ sở dữ liệu người đang hưởng các chế độ BHXH hàng tháng
Cơ sở dữ liệu này còn đƣợc gọi là cơ sở dữ liệu chi BHXH. Hiện nay BHXH hiện đang quản lý hơn 2 triệu người đang hưởng các chế độ BHXH hàng tháng.
Có 2 loại dữ liệu của người hưởng các chế độ BHXH hàng tháng:
+ Cơ sở dữ liệu của toàn bộ người lao động sau khi ngừng tham gia BHXH và chuyển sang hưởng các chế độ BHXH hàng tháng. Không phải người lao động nào sau khi ngừng tham gia BHXH cũng được chuyển sang hưởng các chế độ BHXH hàng tháng mà phải có đủ các điều kiện (thời gian công tác, điều kiện làm việc, tuổi đời) thì mới được hưởng các chế độ BHXH tương ứng. Những thông tin này được lấy từ cơ sở dữ liệu thu BHXH của người lao động. Căn cứ vào toàn bộ quá trình công tác, mức lương tham gia BHXH, điều kiện làm việc, thời gian làm việc,…mới có thể xác định đƣợc mức hưởng BHXH hàng tháng cho người lao động đó.
+ Cơ sở dữ liệu của người vẫn còn làm việc nhưng lại được hưởng các chế độ BHXH hàng tháng nhƣ: chế độ tai nạn lao động hàng tháng, chế độ bệnh nghề nghiệp hàng tháng. Sau khi bị tai nạn lao động hoặc bị bệnh nghề nghiệp mà đủ điều kiện để hưởng chế độ hàng tháng, người lao động đó vẫn tiếp tục công tác và tham gia BHXH. Tuy nhiên, hai loại dữ liệu này là độc lập với nhau, không phụ thuộc hay có ảnh hưởng đến nhau (dữ liệu của người tham gia BHXH và dữ liệu cũng của người đó nhưng là dữ liệu hưởng chế độ BHXH hàng tháng).
Trong cơ sở dữ liệu chi BHXH này, thông thường một người chỉ được hưởng một chế độ, tuy nhiên trường hợp đặc biệt có thể có một người hưởng đồng thời 2 chế độ: hưởng đồng thời chế độ hưu trí hàng tháng và chế độ tai nạn lao động hàng tháng hoặc chế độ bệnh nghề nghiệp hàng tháng.
Hiện nay Cơ quan BHXH đang thực hiện việc chi trả lương hưu và trợ cấp BHXH hàng tháng thuộc 5 chế độ nhƣ sau:
+ Chế độ hưu trí hàng tháng.
+ Trợ cấp MSLĐ.
+ Chế độ tai nạn lao động hàng tháng.
+ Chế độ bệnh nghề nghiệp hàng tháng.
+ Chế độ tử tuất hàng tháng.
Từ năm 1999, cơ quan BHXH Việt Nam đã xây dựng đƣợc hoàn chỉnh cơ sở dữ liệu của người đang hưởng các chế độ BHXH hàng tháng trên phạm vi toàn quốc. Tuy nhiên dữ liệu vẫn chỉ tồn tại cục bộ ở từng tỉnh, thành phố, chƣa quản lý tập trung tại trung ƣơng, chỉ quản lý đƣợc ở cấp tỉnh, thành phố.
Số lượng người đang hưởng các chế độ BHXH hàng tháng hiện nay vào khoảng trên 2 triệu người được phân chia cho 64 tỉnh, thành phố trong cả nước. Sự phân bố không đồng đều, có những địa phương thì số lượng người hưởng tập trung rất lớn (Hà Nội, Hải Phòng, Nghệ An, Thanh Hoá, TP Hồ Chí Minh), một số lại rất ít (những tỉnh miền núi, những tỉnh nhỏ, mức độ phát triển chậm).
BHXH Việt Nam cũng đã xây dựng được chương trình quản lý các đối tượng hưởng BHXH hàng tháng, về cơ bản đã đáp ứng được các yêu cầu quản lý và thống kê của Nhà nước và của ngành đặt ra.