1. Trang chủ
  2. » Luận Văn - Báo Cáo

ỨNG DỤNG ƯỚC LƯỢNG BAYESIAN PHÂN TÍCH VỀ TỶ LỆ NGHÈO CỦA CÁC TỈNH Ở VIỆT NAM

10 17 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 61,45 KB

Nội dung

Vấn đề ước lượng tham số nhị thức (binomial parameter) đã thu hút sự quan tâm của các nhà thống kê và những người khác trong lĩnh vực ước lượng tỷ trọng. Mọi người đều biết rằng khi ước lượng các số tỷ trọng thường cần một cỡ mẫu lớn để đạt được độ chính xác chấp nhận được của ước lượng. Các ước lượng cỡ mẫu thường dựa vào cách tính toán cổ điển về khoảng tin cậy, đôi khi được điều chỉnh theo các thiết kế mẫu đặc biệt. Công trình nghiên cứu gần đây của Brown (2001) đã tập trung sự chú ý vào những khiếm khuyết của những khoảng tin cậy này, đặc biệt vào thực tế là trong nhiều trường hợp “khoảng tin cậy 95%” có độ bao phủ ít hơn 95%.

ỨNG DỤNG ƯỚC LƯỢNG BAYESIAN PHÂN TÍCH VỀ TỶ LỆ NGHÈO CỦA CÁC TỈNH Ở VIỆT NAM Dominique Haughton(*) Nguyễn Phong(**) Vấn đề ước lượng tham số nhị thức (binomial parameter) thu hút quan tâm nhà thống kê người khác lĩnh vực ước lượng tỷ trọng Mọi người biết ước lượng số tỷ trọng thường cần cỡ mẫu lớn để đạt độ xác chấp nhận ước lượng Các ước lượng cỡ mẫu thường dựa vào cách tính tốn cổ điển khoảng tin cậy, điều chỉnh theo thiết kế mẫu đặc biệt Cơng trình nghiên cứu gần Brown (2001) tập trung ý vào khiếm khuyết khoảng tin cậy này, đặc biệt vào thực tế nhiều trường hợp “khoảng tin cậy 95%” có độ bao phủ 95% Ước lượng tỷ lệ nghèo ước lượng tham số nhị thức tỷ lệ nghèo nói chung xác định tỷ trọng hộ có mức chi tiêu dùng bình qn đầu người hàng năm thấp chuẩn nghèo cho trước Trong phần lớn nội dung viết này, giả sử chuẩn nghèo không ngẫu nhiên việc xác định hộ nghèo hay không nghèo thực xác Chúng ta thảo luận hàm ý việc xác định khơng xác chuẩn nghèo phần sau viết Ước lượng tỷ lệ nghèo cho tỉnh Việt Nam phù hợp với phân tích Bayesian: thơng tin tiên nghiệm (ví dụ ý kiến chuyên gia tỷ lệ nghèo) thường có sẵn cỡ mẫu cấp tỉnh có xu hướng nhỏ điều tra lớn thường tốn bị ảnh hưởng sai số phi chọn mẫu Những nhà thống kê chọn mẫu người khác có liên quan đến thiết kế phân tích điều tra (ở Việt Nam nơi khác) không sử dụng phân tích Bayesian với tỷ lệ nghèo (xem Glewwe Yansaneh phân tích đặc thù lĩnh vực này) Trong mức độ xác ước lượng cao sử dụng thông tin tiên nghiệm hợp lý chuẩn nghèo biết Chúng minh hoạ kết (*)(*) Đại học Bentley, Hoa Kỳ, (**) Tổng cục Thống kê - Việt Nam mẫu thành thị giàu (thành phố Hồ Chí Minh) mẫu nông thôn nghèo (Nghệ An) Tuy nhiên, để đảm bảo có kết này, điều cần lưu ý xác định nghèo/không nghèo sai xảy ra, mà thực tế xảy ra, độ bao phủ trung bình khoảng xác suất rộng điểm % không đạt tới 0,95, với cỡ mẫu lớn, đạt tới 0,95 khoảng xác suất rộng điểm % Ước lượng Bayesian tỷ lệ nghèo chuẩn nghèo biết Ở khu vực thành thị thành phố Hồ Chí Minh, mẫu Khảo sát Mức sống Dân cư Việt Nam năm 1998 có 433 hộ, có hộ nghèo Các tính tốn có quyền số thơng thường (frequentist) (theo quyền số chọn mẫu) cho tỷ lệ nghèo 0,00462, với độ lệch chuẩn 0,00334 (hệ số biến thiên khoảng 0,7) Để thực phân tích Bayesian, chúng tơi sử dụng hỗn hợp phân phối bêta làm tiên nghiệm cho tỷ lệ nghèo chưa biết, gợi ý kỹ thuật Nandram Sedransk Điều chứng minh cơng trình nghiên cứu Dalal Hall (1983), tiên nghiệm xấp xỉ hỗn hợp Sau chúng tơi áp dụng cơng thức dạng đóng Nandram Sedransk giá trị trung bình hậu nghiệm độ lệch chuẩn hậu nghiệm tỷ lệ nghèo thiết kế mẫu chùm hai bước Trong trường hợp nước ta, giả sử xã/phường chọn ngẫu nhiên, sau hộ chọn ngẫu nhiên từ xã/phường Trong thực tế có thêm bước thiết kế mẫu: thôn/cụm chọn ngẫu nhiên từ xã/phường, sau hộ chọn ngẫu nhiên từ thôn/cụm Chúng dự kiến đề cập đến vấn đề chọn mẫu chùm ba bước tương lai, khơng có sẵn cơng thức dạng đóng giá trị trung bình độ lệch chuẩn hậu nghiệm tỷ lệ nghèo Mặc dù vậy, không nghĩ việc thêm bước chọn mẫu tạo khác biệt lớn phân tích xấp xỉ với thực tế Tiếp theo, sử dụng WINBUGS để mô phân phối hậu nghiệm, với lệnh (code) công bố Congdon (2001; ví dụ 5.18 trang 196) Ngồi số liệu hộ nghèo/không nghèo từ xã/phường điều tra, phân tích cịn sử dụng số liệu số hộ xã/phường tương ứng khu vực thành thị thành phố Hồ Chí Minh khu vực nơng thơn Nghệ An Mơ hình phân tích tính tỷ lệ nghèo riêng xã/phường sau kết hợp tỷ lệ nghèo vào tỷ lệ nghèo chung tỉnh Trong Bảng Hình 1, chúng tơi trình bày kết từ bốn tiên nghiệm khác cho khu vực thành thị thành phố Hồ Chí Minh Trong Bảng Hình 2, chúng tơi trình bày kết từ hai tiên nghiệm khác cho khu vực nông thôn Nghệ An Các giá trị trung bình độ lệch chuẩn hậu nghiệm tỷ lệ nghèo chung toàn khu vực (khu vực thành thị thành phố Hồ Chí Minh khu vực nông thôn Nghệ An) Hỗn hợp phân phối bêta sử dụng làm tiên nghiệm cho véc tơ  N tỷ lệ nghèo N xã/phường Nandram Sedransk đưa sau: Trong k tỷ lệ nghèo tỉnh thứ k, B ký hiệu hàm Bêta Giá trị wr, ar  phải lựa chọn suy tiên nghiệm Lưu ý giá trị trung bình phân phối bêta hỗn hợp a r/, giá trị  điều khiển độ lệch chuẩn phân phối bêta:  cao, độ lệch chuẩn nhỏ Hai tiên nghiệm cho khu vực thành thị thành phố Hồ Chí Minh cách lỏng lẻo vào tỷ lệ nghèo độ lệch chuẩn chúng tỉnh Việt Nam Baulch đồng ước lượng, sử dụng số liệu từ Tổng điều tra Dân số Nhà năm 1999 phương trình hồi quy dựa số liệu Khảo sát mức sống dân cư Những ước lượng sử dụng để định nghĩa beans tập trung vào giá trị trình bày cột “Giá trị trung bình” Bảng cho riêng cấu thành xác suất tiên nghiệm bin tương ứng 0,07; 0,43; 0,43; 0,07 Lưu ý giá trị R chọn phần mang tính áp đặt nhằm tiện lợi linh hoạt tính tốn Tiên nghiệm khác giá trị , độ lệch chuẩn Các cấu thành tiên nghiệm tách rời nhau, Hình Kết từ hai tiên nghiệm gần nhau, tỷ lệ nghèo hậu nghiệm khoảng 0,01 với độ lệch chuẩn khoảng 0,005, cải thiện (hệ số biến thiên khoảng 0,5) so với ước lượng thơng thường Hình cho thấy hai mật độ hậu nghiệm từ tiên nghiệm gần nhau, cho phần lớn xác suất hậu nghiệm thành hai phận tương ứng với xã giàu xã nghèo Tiên nghiệm tương ứng với tiên nghiệm từ ý kiến chuyên gia (của số tác giả) “chúng chắn đến 95% tỷ lệ nghèo khu vực thành thị thành phố Hồ Chí Minh nằm khoảng 0,01 đến 0,03” Giống với tiên nghiệm 2, bin tạo cho tiên nghiệm 3, tập trung vào giá trị đưa Bảng với độ rộng phù hợp với tiên nghiệm theo ý kiến chuyên gia Những thống kê tóm tắt tỷ lệ nghèo hậu nghiệm gần với kết theo tiên nghiệm Tiên nghiệm tiên nghiệm tản mạn, trường hợp này, tỷ lệ nghèo hậu nghiệm khơng xác (độ lệch chuẩn 0,008) dự kiến Trong trường hợp này, chúng tơi có biểu thức dạng đóng giá trị trung bình độ lệch chuẩn hậu nghiệm, lẫn khả sử dụng WINBUGS để tạo mẫu từ hậu nghiệm Kết từ hai phân tích dự kiến gần nhau, thực tế Chúng lưu ý phát cấu thành bêta tách rời cấu thành gần chuỗi MCMC WINBUGS bị “tắc” cấu thành cho giá trị trung bình hậu nghiệm không Vấn đề thực tế không gây ngạc nhiên cho tác giả WINBUGS (N Best, personal communication), khắc phục cách kiểm tra kết WINBUGS dựa vào công thức dạng đóng dùng cho thiết kế mẫu chùm hai bước tiên nghiệm cho, sau chuyển sang thiết kế điều tra phức tạp cần thiết Đối với khu vực nông thôn tỉnh Nghệ An có 225 hộ mẫu, có 110 hộ nghèo Các ước lượng có quyền số thơng thường cho tỷ lệ nghèo 0,489 với độ lệch chuẩn 0,104 Tiên nghiệm lại cách lỏng lẻo vào ước lượng Baulch đồng sự; đưa giá trị trung bình hậu nghiệm tỷ lệ nghèo 0,5 với độ lệch chuẩn 0,05, cải thiện độ xác so với phân tích thơng thường Tiên nghiệm vào tỷ lệ nghèo 0,2 theo ước tính Bộ Lao động Thương binh Xã hội để tạo bin với độ rộng tiên nghiệm Tỷ lệ nghèo tiên nghiệm 0,2 thấp, thật thú vị xem phân tích Bayesian sử dụng số liệu để sửa thơng tin tiên nghiệm này: chuỗi MCMC tập trung gần riêng vào phận cao để đưa giá trị trung bình hậu nghiệm tỷ lệ nghèo 0,42 với độ lệch chuẩn khoảng 0,01 BẢNG 1: GIÁ TRỊ TRUNG BÌNH VÀ ĐỘ LỆCH CHUẨN TIÊN NGHIỆM VÀ HẬU NGHIỆM CỦA KHU VỰC THÀNH THỊ CỦA THÀNH PHỐ HỒ CHÍ MINH W Wi Tiên nghiệm Tiên nghiệm =200 =80 Giá trị TB Độ lệch chuẩ n Giá trị TB Độ lệch chuẩ n 0,0 Cấu thành 0,005 0,005 0,005 0,008 0,4 Cấu thành 0,015 0,009 0,015 0,4 Cấu thành 0,045 0,015 0,0 Cấu thành 0,075 0,031 Tổng Tiên nghiệm Tiên nghiệm =80 =40 Độ lệch chuẩ n Giá trị TB Độ lệch chuẩn 0,009 0,010 0,005 0,011 0,014 0,016 0,014 0,025 0,024 0,045 0,023 0,024 0,017 0,080 0,042 0,019 0,075 0,029 0,031 0,019 0,140 0,054 0,023 0,031 0,027 0,020 0,017 0,055 0,051 Giá trị TB Giá Độ Giá Độ Độ Giá trị lệch trị lệch lệch trị TB TB chuẩ TB chuẩ chuẩ hậu hậu n hậu hậu n hậu n hậu nghiệ nghiệ nghiệ nghiệ nghiệ nghiệ m m m m m m Độ Giá lệch trị TB chuẩn hậu hậu nghiệ nghiệ m m Dạng đóng 0,009 872 0,004 982 0,010 765 0,004 0,0136 911 84 0,004 561 0,008 841 0,007 801 Winbug s 0,009 664 0,004 964 0,010 611 0,004 0,0135 910 30 0,004 508 0,010 130 0,008 632 BẢNG 2: GIÁ TRỊ TRUNG BÌNH VÀ ĐỘ LỆCH CHUẨN TIÊN NGHIỆM VÀ HẬU NGHIỆM CỦA KHU VỰC NÔNG THÔN TỈNH NGHỆ AN wi Tiên nghiệm Tiên nghiệm =40 =30 Giá trị trung bình Độ lệch chuẩn Giá trị trung bình Độ lệch chuẩn 0,07 Cấu thành 0,225 0,065 0,050 0,039 0,43 Cấu thành 0,375 0,076 0,125 0,059 0,43 Cấu thành 0,525 0,078 0,275 0,080 0,07 Cấu thành 0,675 0,073 0,425 0,089 Tổng 0,450 0,133 0,205 0,122 Giá trị trung bình hậu nghiệm Độ lệch chuẩn hậu nghiệm Giá trị trung bình hậu nghiệm Dạng đóng 0,499810 0,055138 0,424697 0,008203 Winbugs 0,503400 0,051560 0,424500 0,009934 Độ lệch chuẩn hậu nghiệm HÌNH 1: MẬT ĐỘ KERNEL TIỀN NGHIỆM VÀ HẬU NGHIỆM; KHU VỰC THÀNH THỊ TP HỒ CHÍ MINH Tiền nghiệm Hậu nghiệm 300 35 30 25 200 Density 20 15 100 10 -5 0.05 0.1 0.15 0.2 01 02 P 03 04 Kernel Density Estimate Tiền nghiệm Hậu nghiệm 300 35 30 200 25 Density 20 15 100 10 0 -5 0.05 0.1 0.15 0.2 01 02 P 03 04 Kernel Density Estimate Tiền nghiệm Hậu nghiệm 35 300 30 25 20 200 15 Density 10 100 -5 0.05 0.1 0.15 0.2 0 01 02 P Kernel Density Estimate Tiền nghiệm Hậu nghiệm 03 04 300 35 30 25 200 Density 20 15 100 10 0 0,05 0,1 0,15 0,2 0 01 02 P 03 04 Kernel Density Estimate HÌNH 2: MẬT ĐỘ KERNEL TIỀN NGHIỆM VÀ HẬU NGHIỆM; KHU VỰC NÔNG THÔN NGHỆ AN Tiền nghiệm Hậu nghiệm 100 3,5 Density 2,5 50 1,5 0,5 0 -0,5 0,2 0,4 0,6 0,8 Tiền nghiệm 2 P Kernel Density Estimate Hậu nghiệm 100 3,5 2,5 Density -5 50 1,5 0,5 -0,5 0 0,2 0,4 0,6 0,8 P Kernel Density Estimate Ước lượng Bayesian với trường hợp có phân loại sai Chúng ta xét tình có sai số việc xác định hộ nghèo hộ không nghèo (có phân loại sai) Nguyên nhân thực tế khó tính xác chuẩn nghèo mà phần lớn khó thu thập xác số liệu giá hàng hoá Vấn đề xác định hộ nghèo tương tự chẩn đốn bệnh dựa xét nghiệm khơng hồn hảo Ở chúng tơi sử dụng cơng trình nghiên cứu Rahme đồng ứng dụng vào lĩnh vực y tế thực xác định cỡ mẫu Bayesian cho tham số nhị thức với giả thiết có phân loại sai Trong phạm vi vấn đề này, việc kiểm tra tình trạng nghèo có độ nhạy (xác suất hộ nghèo phân loại nghèo) đặc trưng (xác suất hộ không nghèo phân loại không nghèo), với phân phối tiên nghiệm bêta dựa theo Rahme đồng sự, tỷ lệ nghèo cho phân phối tiên nghiệm bêta Minh hoạ cách tiếp cận với khu vực nông thôn Nghệ An, với định nghĩa phân phối tiên nghiệm bêta cho tỷ lệ nghèo có tham số =70,32 =77,1 dựa sở ước lượng cho tỷ lệ nghèo độ lệch chuẩn cơng trình nghiên cứu Baulch đồng Lấy phân phối bêta làm tiên nghiệm cho độ nhạy đặc trưng phân loại nghèo/không nghèo từ ý kiến cho độ nhạy trung bình đặc trưng khoảng 0,95 chắn 95% độ nhạy đặc trưng nằm khoảng 0,9 đến Ý kiến cho tham số bêta giá trị nêu bảng Bảng trình bày độ bao phủ trung bình khoảng xác suất hai độ rộng khoảng khác ba cỡ mẫu khác nhau, tính tốn từ chương trình S-plus Rahme đồng công bố Rõ ràng độ bao phủ không đạt đến 0,95 độ rộng điểm %, với cỡ mẫu lớn Độ bao phủ khả thi với khoảng có độ rộng 0,08 với cỡ mẫu lớn Tuy nhiên, lưu ý kỹ thuật Rahme đồng giả thiết mẫu độc lập tạo từ phân phối (independent identically distributed sample - mẫu iid), tình hình xấu sử dụng thiết kế điều tra phức tạp BẢNG 3: ĐỘ BAO PHỦ TRUNG BÌNH CỦA KHOẢNG XÁC SUẤT ĐỐI VỚI TỶ LỆ NGHÈO CỦA KHU VỰC NÔNG THÔN NGHỆ AN VỚI GIẢ THIẾT MẪU IID sens=spec=71,25; sens=spec=3,75; =70,32; =77,1 Độ rộng khoảng Cỡ mẫu Độ bao phủ xác suất 0,04 1000 0,6439 0,04 2000 0,6924 0,04 3000 0,6995 0,08 1000 0,9261 0,08 2000 0,9471 0,08 3000 0,9587 Tài liệu tham khảo Baulch, B & N Minot (2002) The Spatial Distribution of Poverty in Vietnam and the Potential for Targeting World Bank working paper 2829 Brown, L D., T Tony Cai & A DasGupta (2001) Interval Estimation for a Binomial Proportion Statistical Science, 16(2), 101-133 Congdon, P (2001) Bayesian Statistical Modelling Wiley ... 300 30 25 20 20 0 15 Density 10 100 -5 0.05 0.1 0.15 0 .2 0 01 02 P Kernel Density Estimate Tiền nghiệm Hậu nghiệm 03 04 300 35 30 25 20 0 Density 20 15 100 10 0 0,05 0,1 0,15 0 ,2 0 01 02 P 03 04... 0,009 0,010 0,005 0,011 0,014 0,016 0,014 0, 025 0, 024 0,045 0, 023 0, 024 0,017 0,080 0,0 42 0,019 0,075 0, 029 0,031 0,019 0,140 0,054 0, 023 0,031 0, 027 0, 020 0,017 0,055 0,051 Giá trị TB Giá Độ Giá... 0,675 0,073 0, 425 0,089 Tổng 0,450 0,133 0 ,20 5 0, 122 Giá trị trung bình hậu nghiệm Độ lệch chuẩn hậu nghiệm Giá trị trung bình hậu nghiệm Dạng đóng 0,499810 0,055138 0, 424 697 0,00 820 3 Winbugs 0,503400

Ngày đăng: 09/04/2021, 10:22

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w