Các mô hình hồi quy ước lượng chi phí khám, chữa bệnh

Một phần của tài liệu Các mô hình toán kinh tế trong ước lượng chi phí khám chữa bệnh do bảo hiểm y tế chi trả ở việt nam (Trang 33 - 36)

CHƯƠNG 1: CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN NGHIÊN CỨU

1.2. Tổng quan các mô hình ước lượng, dự báo chi phí KCB

1.2.2. Các mô hình hồi quy ước lượng chi phí khám, chữa bệnh

Các mô hình hồi quy được sử dụng như công cụ toán học hữu ích trong phân tích, ước lượng và dự báo chi phí KCB khi có những thông tin về biến giải thích.

Mô hình hồi quy tuyến tính đối với biến chi phí KCB (y, ví dụ: $ = %&' + () là mô hình hồi quy đầu tiên được sử dụng trong ước lượng chi phí KCB do tính đơn giản và dễ thực hiện. Các ước lượng bằng phương pháp bình phương nhỏ nhất (OLS – Ordinary Least Squares) có thể tính toán nhanh và dễ dàng bằng các phần mềm thông dụng ngay cả với hàng trăm biến độc lập và hàng triệu quan sát. Tuy nhiên, do đặc trưng của số liệu cấp độ cá nhân nên chi phí KCB có các giá trị tăng đột biến gần không (đối với dữ liệu điều tra hoặc dữ liệu tổng thể), có phân phối không chuẩn, lệch trái và có đuôi dày bên phải (Deb và cộng sự, 2006; Duan, 1983; Duan và cộng sự, 1983; Jones, 2010; Manning, 2012; Manning, 1998; Mihaylova và cộng sự, 2011; Jones, 2017). Do đó, mô hình hồi quy tuyến tính luôn tồn tại hiện tượng phương sai sai số thay đổi và sai số là không phân phối chuẩn và vì thế mà các ước lượng ít tin cậy.

Một trong những phương pháp khắc phục hiện tượng trên là biến đổi biến chi phí về dạng có phân phối đối xứng hơn (Carroll và Ruppert, 1988; Manning, 1998). Phương pháp đổi biến thông dụng nhất là lấy logarit tự nhiên (ví dụ: ln($) = %&' + (). Phương pháp này giúp cho biến chi phí giảm được độ bất đối xứng, làm cho phân phối của biến mới gần với phân phối chuẩn hơn. Các ước lượng thu được từ mô hình đổi biến loga chính xác và vững hơn mô hình với biến gốc (Jones, 2010). Tuy nhiên, một trong những vấn đề phát sinh khi sử dụng phương pháp này là trường hợp biến chi phí có giá trị bằng 0. Bên cạnh đó, giá trị ước từ mô hình là loga chi phí. Để có được giá trị ước lượng với biến gốc (chi phí), cần phải đổi biến ngược lại. Tuy nhiên, việc lấy hàm e mũ một cách đơn giản không phải lúc nào cũng cho ước lượng tốt (tức là ước lượng không chệch, vững) (Neyman và Scott, 1960). Để có được ước lượng tốt hơn cho biến chi phí, Duan (1983) đã đưa ra một phương pháp ước lượng phi tham số (Smearing factor) vì nó giúp

các ước lượng của biến gốc bớt chệch hơn. Phương pháp này cũng đã được Buntin và Zaslavsky (2004) sử dụng cho các mô hình đổi biến khác nhau, trong đó có phương pháp lấy căn bậc hai và phương pháp Box-Cox.

Để phù hợp với số liệu, nhiều biến được biến đổi về dạng có phân phối đối xứng hơn và cho kết quả ước lượng tốt hơn so với hồi quy bằng biến gốc. Tuy nhiên, cách đổi biến này không mang lại hiệu quả cao và gây ra vấn đề đổi biến ngược. Để khắc phục tình trạng này, mô hình trung bình mũ có điều kiện (ECM - Exponential Conditional Mean với dạng hàm +($|%) = - = .exp (%&')) được sử dụng với giả thiết về mối quan hệ phi tuyến của biến chi phí trong mô hình hồi quy. Một trong những ưu điểm của mô hình này là ta có thể ước lượng trực tiếp biến gốc mà không cần đổi biến. Tuy nhiên, cần lưu ý rằng tác động của biến độc lập trong mô hình là tác động theo tỷ lệ chứ không phải tác động có tính chất cộng (Gilleskie và Mroz, 2004). Mô hình ECM có thể được ước lượng theo nhiều cách như bình phương nhỏ nhất phi tuyến (NLS – Nonlinear Least Squares), ước lượng tựa hợp lý tối đa (QML – Quasi Maximum Likelihood) hay phương pháp mô men tổng quát (GMM - Generalised Method of Momments) (Mihaylova và cộng sự, 2011).

Mô hình hồi quy tuyến tính tổng quát (GLM – Generalised Linear Model) (Nelder và Baker, 1972) là lớp mô hình chiếm ưu thế trong ước lượng chi phí KCB (ví dụ, xem Blough và cộng sự, 1999; Buntin và Zaslavsky, 2004; Jones, 2010; Jones, 2017;

Manning, 2012; Manning và cộng sự, 2005; Martins và cộng sự, 2006). Mô hình GLM được xác định bởi hai thành phần: i) thành phần thứ nhất là hàm liên kết biểu diễn mối quan hệ giữa kỳ vọng có điều kiện của biến phụ thuộc và các biến độc lập (2(-) =

%&'); và ii) thành phần thứ hai là giả thiết về phân phối xác suất của biến phụ thuộc, các phân phối này thuộc họ phân phối mũ. Thành phần này giúp xác định mối liên hệ giữa phương sai và kỳ vọng có điều kiện của biến phụ thuộc (3($|%) = 4(-)). Những ưu điểm của mô hình GLM là giá trị ước lượng được tính trên giá trị gốc của biến, không đòi hỏi sự đổi biến ngược lại và cho phép điều chỉnh phương sai sai số thay đổi thông qua sự lựa chọn của họ phân phối. Lớp mô hình này phù hợp với mô hình hóa chi phí (chẳng hạn với lựa chọn phân phối Gamma) cũng như mô hình hóa số lượt KCB với lựa chọn phân phối Poisson hay nhị thức âm (Cameron và Johansson, 2004; Winkelmann, 2004). Mô hình GLM với hàm liên kết loga và phân phối gamma được sử dụng phổ biến trong mô hình hóa chi phí KCB (Blough và cộng sự, 1999; Buntin và Zaslavsky, 2004;

Jones, 2010; Jones, 2017; Manning, 2012; Manning và cộng sự, 2005; Martins và cộng sự, 2006; Moran và cộng sự, 2007). Trong các nghiên cứu có sử dụng mô hình GLM để mô hình hóa chi phí KCB, Manning và cộng sự (2005) tập trung mở rộng họ các phân

phối; Basu và Rathouz (2005) và Blough và cộng sự (1999) lại phân tích sâu về mối liên hệ giữa trung bình và phương sai. Để đưa ra lựa chọn hàm liên kết, Basu and Rathouz (2005) gợi ý sử dụng mở rộng bán tham số của mô hình GLM - mô hình với phương trình ước lượng mở rộng (EEE - Extended Estimating Equation models) thông qua việc sử dụng biến đổi Box-Cox cho hàm liên kết (với dạng mô hình là %&' =5687).

Mô hình cộng tổng quát (GAM - Generalised Additive Model) (Hastie và Tibshirani, 1990) là dạng mở rộng của GLM, trong đó hàm tuyến tính của các biến giải thích được thay thế bởi tổng các hàm phi tuyến của từng biến (với dạng hàm ∑ ' →

∑ ;()). Điều này cho phép xác định ảnh hưởng cụ thể của từng biến giải thích lên biến phụ thuộc. Hơn nữa, các hàm phi tuyến này thường được biểu diễn dưới dạng các hàm số phụ thuộc phi tham số dựa vào phương pháp làm trơn. Phương pháp này giúp tạo sự linh hoạt trong việc nghiên cứu và làm cho mô hình khá phù hợp với dữ liệu.

Có rất nhiều nghiên cứu đã tổng hợp và so sánh chất lượng các mô hình ước lượng chi phí KCB (Basu và Rathouz, 2005; Buntin và Zaslavsky, 2004; Deb và cộng sự, 2006; Duan và cộng sự, 1983; Gilleskie và Mroz, 2004; Hill và Miller, 2010; Jones, 2010; Jones, 2017; Manning và cộng sự, 2005; Manning và Mullahy, 2001; Mihaylova và cộng sự, 2011). Các nghiên cứu này sử dụng phương pháp phân tích Monte Carlo cổ điển với giả thiết chi phí KCB được mô phỏng ngẫu nhiên từ một phân phối tham số nào đó hoặc các phương pháp nghiên cứu dựa trên số liệu mẫu điều tra hoặc mẫu có sử dụng thiết kế tựa Monte Carlo. Kết quả chính phụ thuộc vào các ứng dụng và dữ liệu thực tế (chẳng hạn như phụ thuộc vào việc chi phí của người cao tuổi hay không cao tuổi hoặc chi phí là tổng tất cả các chi phí KCB hay chỉ một loại chi phí nào đó như thuốc hay phẫu thuật).

Cùng với sự phát triển của công nghệ 4.0, có rất nhiều dữ liệu liên quan đến chi phí KCB được quản lý bằng các phần mềm (như dữ liệu KCB của các bệnh viện ở các tuyến, dữ liệu chi trả BHYT của các công ty bảo hiểm, của bảo hiểm xã hội ở cấp quốc gia, cấp tỉnh...). Lượng số liệu được lưu lại một cách tự động theo biểu mẫu ngày càng lớn, chứa nhiều thông tin và cần có phương pháp nghiên cứu phù hợp. Đã có những nghiên cứu sử dụng các mô hình hồi quy nâng cao và các thuật toán học máy (Machine Learning Algorithms) để đưa ra những phân tích và ước lượng cho chi phí KCB (ví dụ, xem (Sushmita và cộng sự, 2015). Các mô hình có thể kể đến là mô hình cây hồi quy và phân loại (CART – Classification And Regression Trees) (Breiman và cộng sự, 1984;

Liaw và Wiener, 2002; Morgan, 2014; Yohannes và Hoddinott, 1999), mô hình rừng ngẫu nhiên (RF - Random Forest) (Breiman, 2001), mô hình GAM (Generalised

Additive Models) (Hastie và Tibshirani, 1990; Leathwick và cộng sự, 2006), mô hình MARS (Multivariate Adaptive Regression Splines) (Hastie và cộng sự, 2002). Ví dụ, nghiên cứu của Sushmita và cộng sự (2015) đã sử dụng các thuật toán học máy, bao gồm RT, mô hình M5 Tree và RF để đưa ra các so sánh về các ước lượng cho chi phí KCB dựa trên bộ số liệu thống kê về yêu cầu bồi thường bảo hiểm của bang Washington (Hoa Kỳ).

Một phần của tài liệu Các mô hình toán kinh tế trong ước lượng chi phí khám chữa bệnh do bảo hiểm y tế chi trả ở việt nam (Trang 33 - 36)

Tải bản đầy đủ (PDF)

(124 trang)