Tất cả các số liệu thống kê bão trong nghiên cứu này dựa trên số liệu quan trắc bão của Cục Khí tượng Nhật Bản (RMSC - Tokyo, “sau đây gọi là JMA”) và số liệu quan trắc của Trung tâm Cảnh báo bão của Hải quân Hoa Kỳ (JTWC). Hai bộ số liệu này được sử dụng để xác định số lượng bão, thời gian tồn tại của bão/ngày có bão (NCB) và tính toán chỉ số năng lượng bão. Việc sử dụng hai bộ số liệu khác nhau nhằm xác minh chéo trong việc xác nhận mối quan hệ giữa các yếu tố môi trường với hoạt động của bão.
Hiện nay nguồn số liệu bão có thể khai thác từ nhiều cơ sở lưu trữ khác nhau. Tuy nhiên, khó khăn khi khai thác các bộ dữ liệu này là sự không đồng nhất về nhiều mặt của chúng. Vì nhiều lí do khác nhau, như sự phát triển của kỹ thuật quan trắc qua các thời kì, phương pháp xử lý, tích hợp các loại số liệu,... hay sự khác biệt trong thực hành đánh giá vị trí, quỹ đạo và cường độ dẫn đến sự khác biệt đáng kể về chất lượng và độ chính xác của chúng (Phan Văn Tân và ctv, 2010 [21]; Ying và ctv 2011a [144]). Việc xác định gió mạnh sẽ phụ thuộc vào khoảng thời gian tính trung bình, vì khoảng thời gian tính trung bình dài hơn sẽ dẫn đến tốc độ gió thấp hơn (WMO, No.1555). Tốc độ gió mạnh trong bộ số liệu của JMA được tính trung bình trong khoảng thời gian 10 phút, trong khi của JTWC là 1 phút. Để dữ liệu thống nhất tương đối gần đúng giữa các bộ số liệu khác nhau, WMO khuyến nghị sử dụng hệ số 0,93 được áp dụng cho vùng biển nói chung để chuyển đổi tốc độ gió trung bình 1 phút trong bộ dữ liệu JTWC thành tốc độ gió trung bình 10 phút gần đúng như của JMA (WMO, No 1555, 2010 [136]; Lee và ctv, 2012 [94]). Trong hệ số chuyển đổi này luận án giới hạn không xem xét ảnh hưởng của đặc điểm địa phương trên Biển Đông đến bão như địa hình (bão vượt đất liền của Philippines,
đảo Hải Nam, gần bờ biển hay trên đất liền Việt Nam),...
Lưu ý rằng giám sát bão đáng tin cậy hơn sau khi triển khai vệ tinh vào khoảng năm 1970 (Camargo và ctv, 2005 [43]; Emanuel 2007 [63]). Thêm nữa, gió mạnh nhất gần tâm bão trong bộ số liệu quan trắc của JMA chỉ có từ 1977. Mặt khác, trong bộ số liệu dự báo lại thường chỉ có từ năm 1981 hoặc 1982 (ví dụ CFSv2 hay ECMWF). Để đồng bộ xuyên suốt quá trình đánh giá, do đó giai đoạn 1982-2018 sẽ được sử dụng trong nghiên cứu này; Tổng với 37 năm giai cho phân tích bão trên khu vực TBTBD và Biển Đông.
Các chỉ số năng lượng bão nhằm mục tiêu bổ sung thêm thông tin cho hệ thống bão, bão mạnh, do đó nghiên cứu chỉ xem xét những cơn đạt cấp bão nhiệt đới (vượt 17 m/s theo cấp Beaufort). Để so sánh giữa bão và bão mạnh gồm tất cả các cơn bão có tốc độ gió mạnh nhất vượt 32,5 m/s (cấp 12 trở lên theo cấp Beaufort, ký hiệu C12) cũng sẽ được xem xét trong nghiên cứu này.