2.5.1. Phân phối GEV: Giả sử ta có dữ liệu X X1, 2,... từ một phân phối cơ bản F. Ở đó ta giả sử chúng nằm trong miền hấp dẫn của một phân phối cực trị H,. Nếu dữ liệu thực hành là biến ngẫu nhiên độc lập đồng nhất hoặc biến ngẫu nhiên lấy từ một quá trình với đường chỉ số cực trị như là mô hình GARCH, ý nghĩa của lý thuyết này là phân phối đúng của n- khối cực đại Mncó thể được xấp xỉ với n đủ lớn bởi 3 tham số của phân phối GEV H , , .
Chúng ta sử dụng ý tưởng của hàm phân phối GEV H , , với dữ liệu tối đa n khối. Rõ ràng ta không cần lặp đi lặp lại việc quan sát tối đa n khối mà ta giả định rằng các dữ liệu có thể được chia thành các khối có kích thước m n . Và giả sử rằng X1*,X2*,...,Xm* là cực trị của các khối này (xem hình 2.3). Theo kết quả của Fisher, Tippet và Gnedenko, khi m đủ lớn thì phân phối chuẩn hóa của lợi suất lớn nhất: Mn maxX1*,X2*,...,Xm* sẽ xấp xỉ với một trong các phân phối: Fréchet,
Weibull hay Gumbel. Phương pháp này ít được sử dụng trong thực hành vì nó yêu cầu số quan sát lớn.
Phương pháp này có nguồn gốc từ thủy văn nơi đo lường mực nước hàng ngày có thể chia thành khối năm hoặc khối mùa. Tương tự chúng ta xét trong ứng dụng tài chính, ở đó dữ liệu trả về theo ngày (ghi vào ngày giao dịch) chia theo năm (tháng hoặc quý) và giảm tối đa ngày trong khối được phân tích.
Chúng ta ký hiệu khối cực đại của khối thứ j là Mnj khi đó ta được chuỗi dữ liệu là Mn1,Mn2,..., Mnm. Phân phối GEV có thể được trang bị các phương pháp sử dụng khác nhau bao gồm phương pháp cực đại hợp lý. Thay thế phương pháp xác suất trọng điểm. Trong khi thực hiện phương pháp cực đại hợp lý ta sẽ giả định rằng khối có kích thước n là khá lớn nên không kể đến dữ liệu cơ bản là độc lập hay không? Các quan sát khối cực đại có thể xem là độc lập. Trong trường hợp này viết phân phối h , , là mật độ của phân phối GEV, các log_likehood được tính toán một cách dễ dàng bởi:
1 2 , ,
1
, , ; , ,..., M ln
m
n n nm ni
i
l M M h M
1
1 1
ln 1 1 ln 1 1
m m
ni ni
i i
M M
m
,
Với tham số ràng buộc 0 và 1 Mni 0,
i
.
Trong khi các điều này đại diện cho khả năng bất thường do sự phụ thuộc của các không gian tham số về các giá trị của dữ liệu, tính nhất quán và tiệm cận, tính hiệu quả của MLES có thể được thiết lập trong các trường hợp.
Hình 2.3: Minh họa phương pháp cực đại khối và phương pháp vượt ngưỡng Nguồn: [8]
2.5.2. Mức lợi suất và tổn thất căng thẳng
Mô hình GEV đã được trang bị có thể được sử dụng để phân tích tổn thất stress chúng ta quan tâm tới hai khả năng: Trong phương pháp xấp xỉ thứ nhất chúng ta định nghĩa tần số xuất hiện của các sự kiện stress và ước lượng độ lớn của tổn thất đó bài toán này được gọi là bài toán về dự toán mức lợi nhuận. Trong phương pháp xấp xỉ thứ 2 chúng ta định nghĩa kích thước của các sự kiện stress và ước lượng tần số xuất hiện của nó đây là bài toán về kỳ lợi suất.
Định nghĩa 2.5.1. (mức lợi suất)
Giả sử H là kí hiệu của hàm phân phối cực đại khối đúng. Mức k lợi suất n khối và được xác định bởi công thức: , 1
n k 1 k
r q H
tức là 1
1 k
là điểm phân vị của H.
Mức lợi suất k n khối có thể tạm hiểu là mức vượt ngưỡng trong một số hàng k n khối trung bình. Ví dụ: Các giao dịch trong 10 năm r260,10 là mức độ vượt quá ngưỡng trung bình trong 10 năm trở lại đây. (Ta giả sử rằng mỗi năm có 260 giao dịch mặc dù đây chỉ là mức trung bình và có sự dịch chuyển từ năm này sang năm khác). Sử dụng mô hình được trang bị chúng ta ước lượng được mức lợi suất:
1
, k , ,
1 1
1 ln 1 1 .
rn H
k k
(2.23)
Định nghĩa 2.5.2. (kỳ lợi suất)
Giả sử H là ký hiệu của hàm phân phối cực đại n khối đúng. Kỳ lợi suất của sự kiện Mn u được cho bởi công thức:
,
1 kn u
H u .
Quan sát rằng kỳ lợi suất kn u, được định nghĩa như trên với kn u, n - khối và u là mức lợi suất. Mặt khác trong kn u, n - khối chúng ta mong muốn quan sát một khối duy nhất với u là ngưỡng.
Giả sử rằng H là mật độ của phân phối GEV và sử dụng mô hình đã được trang bị ta ước lượng kỳ lợi suất bởi công thức sau:
,
, ,
1 kn u
H u
.
Chú ý rằng rn k, và
,
kn u là các hàm đơn giản của các ước lượng tham số của phân phối GEV. Cũng như tính toán ước lượng điểm cho các tham số chúng ta sẽ đưa ra một khoảng tin cậy phản ánh sai số trong ước lượng tham số của phân phối GEV. Một phương pháp hay là cơ sở khoảng tin cậy hợp lý về tỷ lệ thống kê.