CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU
2.2. Phương pháp ước lượng
Sử dụng dữ liệu lịch sử về tần suất và chi phí KCB có thể đưa ra các ước lượng cho những tham số của các phân phối tương ứng. Mục này trình bày hai phương pháp ước lượng tham số, đó là phương pháp tần suất và phương pháp Bayes. Đối với phương pháp tần suất, tham số cần ước lượng được coi như hằng số cố định. Từ số liệu mẫu sẽ đưa ra được các ước lượng điểm và khoảng tin cậy cho tham số đó. Ngược lại, phương pháp Bayes coi tham số cần ước lượng như một biến ngẫu nhiên. Với việc giả định về phân phối xác suất của tham số, phân phối tiền nghiệm và dữ liệu quan sát được của biến ngẫu nhiên gốc, có thể suy ra được phân phối xác suất hậu nghiệm của tham số. Từ đó suy ra các ước lượng tương ứng.
2.2.1. Phương pháp tần suất
Giả sử cần ước lượng tham số { của biến ngẫu nhiên có hàm mật độ xác suất
;|(%|{). Lập mẫu dữ liệu (%, % , … , %<) từ tổng thể biến ngẫu nhiên gốc . Có nhiều phương pháp ước lượng tham số { từ số liệu mẫu, nhưng phần này chỉ trình bày phương pháp ước lượng hợp lý tối đa.
Hàm hợp lý và logarit tự nhiên của hàm hợp lý có dạng:
}({) = ~ ;|(%|{)
<
; ({) = ln ;|(%|{)
<
Ước lượng hợp lý tối đa của tham số { là một số, ký hiệu { sao cho tại đó hàm hợp lý đạt giá trị cực đại.
{ = arg max }({) = arg max ({)
Bảng 2.3 trình bày các ước lượng hợp lý tối đa của các tham số của một số phân phối xác suất đề cập ở phần trước, trong đó một số tham số không có ước lượng dạng giải tích mà được viết dưới dạng nghiệm của một phương trình và được giải bằng phương pháp xấp xỉ số học.
Bảng 2.3. Ước lượng hợp lý tối đa cho một số phân phối Mô hình
Tên Hàm hợp lý Ước lượng hợp lý tối đa
Nhị thức
(, F) }(F) = ~ DCEFG(1 − F)<7G<
<
G
F̂ = ∑ CG
∑G< G G
Poisson
B(O) }(O) = ~ N78O]
%!
< c
]
O =∑cGCG = %̅
Nhị thức âm
(K, F)
}(K, F) = ~ DC + K − 1C E FS(1
]
− F )G<
ln i1 +%̅
K̂j
− ] c ]
1
K̂ +
G7
= 0;
F̂ =%̅
K̂
Gamma
([, ') }([, ') = ~ 'Y
Γ([) %Y7N7\]
<
' = C
%̅ ; ln C −Γ&(G)
Γ(C) = ln %̅ −1
ln %
<
Weibull
([, ')
}([, ')
= ~[ ' i%
'j
Y7exp gi−% 'j
Yh
<
' = %̅;
∑ %< Yln %
∑ %< Y −1 [ −
1
ln %
<
= 0
Log- normal ℒ(-, q )
}(-, q) =
~ 1
√2pq%exp =−(log % − -)
2q t
<
-̂ = 1
ln %
<
q =1
(ln % − -̂)
<
Pareto
([, ') }([, ') = ~ ['Y (% + ')Yu
<
1
% + ':
'− 1
% + '
<
<
−
∑ ln%< + '− ln ' = 0;
[ =
∑ ln%< + '− ln '
Nguồn: Tác giả tổng hợp theo Tse (2009) 2.2.2. Phương pháp Bayes
Phương pháp Bayes là phương pháp tiếp cận trong việc cập nhật giá trị ước lượng khi có thêm thông tin về dữ liệu mẫu. Phương pháp này được sử dụng rộng rãi trong
lĩnh vực bảo hiểm phi nhân thọ do tính ngắn hạn của sản phẩm và yêu cầu cập nhật thông tin thường xuyên về dữ liệu. Cụ thể, phí đóng hàng năm được tính toán lại dựa trên việc cập nhật dữ liệu về yêu cầu bồi thường của người được bảo hiểm.
Phương pháp Bayes coi tham số { cần ước lượng như một giá trị cụ thể của biến ngẫu nhiên Θ và ước lượng Θ dựa vào phân phối xác suất hậu nghiệm của Θ với điều kiện đã biết mẫu dữ liệu cụ thể = (%, % , … , %<) của mẫu ngẫu nhiên = (, , … , <).
Cụ thể phương pháp ước lượng Bayes, theo Tse (2009) bao gồm các nội dung sau:
i. Giả sử là biến ngẫu nhiên cần nghiên cứu (có thể là số lượt KCB hoặc chi phí KCB theo lượt trong mô hình rủi ro nhóm), có phân phối xác suất phụ thuộc vào tham số {, được coi như một giá trị cụ thể của biến ngẫu nhiên Θ. ii. Θ có phân phối xác suất tiên nghiệm (prior distribution) với hàm mật độ xác suất
; ({).
iii. Hàm mật độ xác suất của với điều kiện {, kí hiệu ;|| (, {), được gọi là hàm hợp lý, được xác định bởi:
;|| (, {) = ~ ;|| (%, {)
<
trong đó = (%, % , … , %<) là mẫu cụ thể của mẫu ngẫu nhiên = (, , … , <) được rút ra từ tổng thể có cùng phân phối xác suất với X.
iv. Dựa vào dữ liệu mẫu cụ thể x, phân phối xác suất của Θ được cập nhật. Phân phối xác suất của Θ với điều kiện x được gọi là phân phối xác suất hậu nghiệm (posterior distribution), với hàm mật độ xác suất ; |¡({|) được xác định bởi:
; |¡({|) = ; |({, )
;|() =
;| (, {); ({)
¢ ; | (, {); ({)b{
v. Ước lượng tham số của X, là hàm của Θ, được xác định dựa vào phân phối hậu nghiệm của Θ, được gọi là ước lượng Bayes.
Như vậy, về mặt lý thuyết, phân phối hậu nghiệm của Θ, ; |¡({|) hoàn toàn được xác định dựa vào phân phối tiên nghiệm của nó ; ({) và hàm hợp lý ;|| (, {). Việc xác định phân phối hậu nghiệm của Θ là đơn giản hay phức tạp phụ thuộc vào việc lựa chọn phân phối tiên nghiệm. Theo Tse (2009), nếu phân phối tiên nghiệm và phân
phối hậu nghiệm có dạng giống nhau, có thể có các tham số khác nhau thì các phân phối này được gọi là phân phối liên hợp với nhau (conjugation) và phân phối tiên nghiệm được gọi là liên hợp với hàm hợp lý của .
Chẳng hạn, giả sử biến ngẫu nhiên phân phối Poisson với tham số {, trong đó { là một giá trị cụ thể của biến ngẫu nhiên Θ phân phối Gamma £([, '). Khi đó, hàm hợp lý của có dạng:
;|| (, {) = ∏ ]¥¦§
!
< , và hàm mật độ xác suất tiên nghiệm có dạng:
; ({) =©(Y)\¨ {Y7N7\ .
Có thể chứng minh phân phối hậu nghiệm của Θ với điều kiện cũng là phân phối Gamma £([∗, '∗) với tham số được tính bởi:
[∗ = [ + ∑ %< ; '∗ = ' + ,
và phân phối Gamma được gọi là phân phối liên hợp với hàm hợp lý của phân phối Poisson.
Bảng 2.4 trình bày một số phân phối liên hợp với hàm hợp lý tương ứng của biến ngẫu nhiên . Luận án sử dụng các phân phối liên hợp này trong ước lượng tham số theo phương pháp Bayes. Chẳng hạn, giả sử số lượt KCB có phân phối nhị thức (, {), trong đó { có phân phối tiên nghiệm là Beta với tham số [, '. Khi đó, với điều kiện dữ liệu về số lượt KCB được cập nhật, phân phối hậu nghiệm của { cũng là Beta với các tham số [∗, '∗ được xác định bởi:
[∗ = [ + ∑ %< ; '∗ = ' + ∑ ( − %< ),
trong đó, %, % , … , %< là mẫu dữ liệu được cập nhật về số lượt KCB. Đối với các phân phối khác của số lượt KCB (Poisson, nhị thức âm) và chi phí KCB theo lượt (Gamma, Weibull, Log-normal, Pareto), các tham số cũng được ước lượng một cách tương tự.
Bảng 2.4. Các phân phối liên hợp và hàm hợp lý tương ứng
Phân phối của
Hàm hợp lý
;| (, {)
Phân phối liên hợp
tiên nghiệm
Tham số của phân phối liên hợp hậu nghiệm
Nhị thức
ℬ(, {) ~ D
%E {](1 − {)7]
<
Beta
[, ' [∗ = [ + %
<
;
'∗ = ' + ( − %)
<
Poisson
({) ;|| (, {) = ~{]N7
%!
<
Gamma
[, ' [∗ = [ + %
<
; '∗
= ' +
Nhị thức âm
ôℬ(K, {)
~ i% + K − 1
% j {S(1 − {)]
<
Beta
[, ' [∗= [ + %
<
; '∗
= ' + K
Gamma
(J, {) ~ {ơ
Γ(J) %ơ7N7 ]
<
Gamma [, '
[∗ = [ + J;
'∗ = ' + %
<
Weibull
(J, {) ~J { D
% { E
ơ7exp gD−% { E
ơh
<
Inverse Gamma
[, '
[∗ = [ + ; '∗ = ' + %\
<
Log- normal ℒ({, q )
~ 1
√2pq%exp =−(log % − {)
2q t
<
Chuẩn
-, q -∗ =-+ ∑ ln %<
1 + q∗ = q
1 + ;
=q
q
Pareto
({, J) ;|| (, {) = ~ {J (% + J) u
<
Gamma [, '
[∗ = [ + ; '∗
= ' + ln%
J
<