CHƯƠNG 1. CƠ SỞ LÝ LUẬN VỀ CHẤT LƯỢNG CUỘC SỐNG
3.2. Đề xuất phươ ng pháp tính chỉ số tổng hợp chất lượng cuộc sống ở Việt Nam
3.2.1. Chuẩn hóa dữ liệu
Chuẩn hóa là bước cần phải thực hiện trước khi tổng hợp một hệ thống gồm nhiều chỉ tiêu với các đặc điểm, tính chất khác nhau. Với các chỉ tiêu có đơn vị tính khác nhau, chuẩn hóa giúp chuyển các chỉ tiêu về cùng đơn vị tính để có thể so sánh và tổng hợp được với nhau. Đây cũng là một bước cần thiết khi trong hệ thống chỉ tiêu đo lường hiện tượng có những chỉ tiêu nghịch. Những chỉ tiêu này sau khi được chuẩn hóa sẽ trở thành những chỉ tiêu thuận, tức sự tăng lên của chúng sẽ tương ứng với sự tăng lên trong chỉ
số tổng hợp. Cuối cùng, chuẩn hóa cũng giúp điều chỉnh cho các khoảng biến thiên khác nhau của các chỉ tiêu.
Về cơ bản, các phương pháp chuẩn hóa được chia thành 3 loại: (1) chuẩn hóa tuyến tính, trong đó có hai phương pháp được sử dụng phổ biến là chuyển đổi z-scores và chuyển đổi Min-Max; (2) chuẩn hóa thứ bậc, ví dụ như xếp hạng và các thang phân loại;
và (3) chuẩn hóa tỷ lệ, chẳng hạn qua tính khoảng cách so với một giá trị tham chiếu hay tốc độ tăng hàng năm (Weziak-Bialowolska, 2014).
Để lựa chọn thủ tục chuẩn hóa phù hợp, trước hết phải xem xét phương pháp đó có phù hợp với khung lý thuyết và đặc tính của số liệu hay không. Bên cạnh đó, cần phải xem xét sự có mặt của các dữ liệu đột xuất trong bộ dữ liệu vì chúng có thể trở thành các ngưỡng không mong đợi và có thể có tác động lớn đến cấu trúc tương quan. Ngoài ra, cần phải cân nhắc một số vấn đề khác như liệu có muốn so sánh với một đơn vị tham chiếu (quốc gia, tỉnh, vùng…); hay có muốn giữ điểm số của các chỉ tiêu đã được chuẩn hóa và liệu chỉ số tổng hợp có phụ thuộc theo thời gian.
Với những phân tích của Mazziotta và Pareto (2013) đưa ra trong mục 3.1.3 ở trên, phương pháp chuyển đổi Min-Max được lựa chọn để chuẩn hóa dữ liệu trong luận án này. Cách chuyển đổi này dễ giải thích vì nó đưa giá trị của chỉ tiêu về dải biến động [0,1] nhưng không nhất thiết có cùng phương sai. Điểm số của chỉ tiêu chuẩn hóa càng cao chứng tỏ kết quả càng tốt.
Giá trị chuẩn hóa = Giá trị thực tế-Giá trị tối thiểu
Giá trị tối đa-Giá trị tối thiểu (3.1)
So với chuyển đổi z-scores, chuẩn hóa Min-Max có thể mở rộng khoảng biến thiên của các chỉ tiêu có khoảng giá trị nhỏ, cho phép phân biệt giữa các đơn vị có cùng mức thực hiện tương tự, tăng ảnh hưởng lên chỉ số tổng hợp nhiều hơn. Tuy nhiên, nhược điểm của cách chuyển đổi này là các giá trị cực biên/hoặc giá trị đột xuất có thể làm biến dạng chỉ tiêu được chuyển đổi. Do vậy, cần phải có biện pháp để tránh các giá trị cực biên làm sai lệch kết quả.
Vì vậy, với các chỉ tiêu có độ biến thiên lớn, phân phối lệch nhiều nên lấy logarit cho các giá trị thực tế, giá trị tối thiểu và giá trị tối đa trước khi áp dụng công thức chuẩn hóa ở trên. Khi đó, công thức chuẩn hóa sẽ là:
Giá trị chuẩn hóa= ln(Giá trị thực tế)-ln(Giá trị tối thiểu)
ln(Giá trị tối đa)-ln(Giá trị tối thiểu) (3.2)
Với các chỉ tiêu có định hướng tiêu cực, mặc dù đã cố gắng giảm bớt những chỉ tiêu loại này cho phù hợp với tiêu chí lựa chọn chỉ tiêu theo định hướng tích cực, tuy nhiên, trong một số trường hợp, luận án vẫn phải sử dụng vì không có chỉ tiêu thuận phù hợp. Kết quả chuẩn hóa sẽ giúp chuyển giá trị về dạng thuận để đảm bảo khả năng so sánh. Khi đó, kết quả chuẩn hóa được xem như là khoảng cách đến giá trị tối đa của chỉ tiêu. Khoảng cách càng xa thì giá trị của chỉ tiêu nghịch càng thấp, CLCS càng tốt. Công thức chuẩn hóa cho các chỉ tiêu nghịch như sau:
Giá trị chuẩn hóa=1- Giá trị thực tế-Giá trị tối thiểu
Giá trị tối đa-Giá trị tối thiểu (3.3)
Với các chỉ tiêu hướng tâm, là trường hợp mà giá trị của nó cao quá hay thấp quá đều không tốt, chẳng hạn như ‘tỷ lệ che phủ rừng’. Về cơ bản, giá trị của những chỉ tiêu này càng gần với một giá trị trung tâm nào đó (ngưỡng tối ưu) càng tốt. Do vậy, bên cạnh việc xác định giá trị tối thiểu và giá trị tối đa, cần xác định cả giá trị trung tâm. Khi đó, công thức chuẩn hóa sẽ là:
Giá trị chuẩn hóa=1- Giá trị thực tế-Giá trị trung tâm
Giá trị tối đa-Giá trị tối thiểu (3.4) Mặc dù có những nhược điểm trên nhưng trong các phương pháp chuẩn hóa dữ liệu, chuyển đổi Min-Max vẫn được sử dụng phổ biến hơn cả. Điểm mấu chốt của phương pháp này chính là xác định các giá trị tối thiểu và giá trị tối đa phù hợp. Tuy nhiên, trong phạm vi hiểu biết của tác giả, chưa có tài liệu nào đưa ra những hướng dẫn cụ thể cho việc chọn các giá trị này. Về cơ bản, việc xác định các giá trị tối thiểu và giá trị tối đa thường phụ thuộc vào điều kiện số liệu sẵn có và kinh nghiệm thực tế trong việc tính và công bố những chỉ số mang tính toàn cầu như HDI và một số chỉ số khác.
Trên cơ sở tham khảo một số gợi ý của Tăng Văn Khiên (2014), tác giả đề xuất cách xác định các giá trị tối thiểu và tối đa cho từng chỉ tiêu, như sau:
Với các chỉ tiêu thuộc dạng số tuyệt đối, số tương đối cường độ hay số bình quân:
Nếu giá trị của chỉ tiêu nằm trong một dải biến động nhất định thì giá trị tối thiểu và giá trị tối đa là giá trị nhỏ nhất và lớn nhất tương ứng. Ví dụ, chỉ tiêu ‘mức độ an toàn, trật tự ở địa bàn đang sinh sống’, giá trị nhỏ nhất là 0 - không an toàn và lớn nhất là 3- rất an toàn.
Nếu giá trị của chỉ tiêu không nằm trong một dải biến động nhất định, có thể căn cứ vào mức độ thực tế đạt được trong nhiều năm và nhiều đơn vị để xác định giá trị tối thiểu và giá trị tối đa. Có thể tham khảo các mức tối thiểu và tối đa do các tổ chức quốc
tế đưa ra đối với những chỉ tiêu đã công bố và áp dụng, chẳng hạn chỉ tiêu ‘tuổi thọ bình quân tính từ lúc sinh’.
Với một số chỉ tiêu như ‘thu nhập bình quân đầu người trong một tháng’, nên dự đoán để mở rộng khoảng cách đạt được của chỉ tiêu để có thể sử dụng giá trị tối thiểu và giá trị tối đa trong nhiều năm, đảm bảo tính so sánh được của chỉ số qua thời gian.
Với các chỉ tiêu thuộc dạng số tương đối kết cấu: Các chỉ tiêu này có đơn vị tính là %, với giá trị nhỏ nhất là 0 và giá trị lớn nhất là 100 về lý thuyết. Có hai cách chọn giá trị tối thiểu và giá trị tối đa trong trường hợp này.
Cách thứ nhất chọn 0 là giá trị tối thiểu và 100 là giá trị tối đa. Các chỉ tiêu thuận có giá trị lớn nhất là 100 chẳng hạn như ‘tỷ lệ hộ gia đình có nhà ở kiên cố’, ‘tỷ lệ học sinh hoàn thành cấp học’, ‘tỷ lệ người dân trực tiếp đi bầu đại biểu Quốc hội’ …; trong khi các chỉ tiêu nghịch có giá trị nhỏ nhất là 0, như ‘tỷ lệ hộ nghèo’, ‘tỷ lệ trẻ em dưới 5 tuổi suy dinh dưỡng’ … Các giá trị này cho biết thành tích tốt nhất đạt được trong đảm bảo CLCS và cũng là đích cần hướng tới của các chỉ tiêu. Ưu điểm của cách đặt này là đơn giản, dễ thực hiện và đảm bảo tính so sánh giữa các chỉ số qua các năm vì giá trị tối thiểu và giá trị tối đa là cố định. Cách tính này cũng sẽ hạn chế hơn khả năng chỉ số riêng biệt sau chuẩn hóa có giá trị bằng 0 khi có số liệu thực tế bằng với mức tối thiểu hoặc tối đa của chỉ tiêu. Nhược điểm của cách chọn này là trên thực tế, có nhiều chỉ tiêu không bao giờ đạt ngưỡng này, chẳng hạn, ‘tỷ lệ hộ nghèo’ là 100% hay ‘tỷ lệ dân số từ 15 tuổi trở lên biết chữ’ là 0%.
Cách thứ hai chọn giá trị tối thiểu hoặc tối đa dựa trên giá trị thực tế đạt được ở nhiều địa phương trong một khoảng thời gian. Ví dụ, với chỉ tiêu ‘tỷ lệ hộ nghèo’, mức cao nhất được xác định từ năm 2010 trở lại đây là ở tỉnh Điện Biên, với 50,8% hộ gia đình là nghèo. Do đó, có thể lấy mức 50,8 là giá trị tối đa của chỉ tiêu này. Tuy nhiên, hạn chế của cách xác định này là khi các mức tối thiểu và tối đa thay đổi thì sẽ không đảm bảo tính so sánh giữa các chỉ số qua các năm. Hơn nữa, trong điều kiện số liệu thực tế hiện nay, nhiều chỉ tiêu chưa phân tổ được đến cấp tỉnh để có thể xác định được mức tối thiểu và tối đa theo cách này. Do vậy, luận án ưu tiên chọn giá trị tối thiểu và giá trị tối đa theo cách thứ nhất.
Một điểm cần lưu ý là các giá trị tối thiểu và tối đa không nhất thiết phải giữ nguyên mà có thể điều chỉnh tùy thuộc vào điều kiện phát triển KTXH của đất nước ở các giai đoạn khác nhau. Khi các giá trị này được điều chỉnh, các giá trị của chỉ tiêu chuẩn hóa chắc chắn sẽ thay đổi theo. Vì thế, để đảm bảo tính so sánh giữa dữ liệu hiện tại và dữ liệu mới, chỉ số tổng hợp theo dữ liệu hiện tại cần phải được tính toán lại.