L Ờ IC ẢM ƠN
2.2. Phương pháp xử lý số liệu
Do toàn bộ việc nghiên cứu của luận văn được thực hiện dựa trên số
liệu quan trắc tại các trạm quan trắc khí tượng bề mặt, trong đó có nhiều nội
dung liên quan đến tính toán thống kê. Nên chất lượng của số liệu quan trắc
được thu thập sẽ ảnh hưởng nhiều tới chất lượng của các sản phẩm được tính
toán ra cũng như các kết quả phân tích. Do đó, việc thực hiện kiểm tra chất
lượng số liệu quan trắc được thu thập là hết sức cần thiết.
Kiểm tra chất lượng dựa trên so sánh giữa giá trị quan trắc với một số
giá trị từ các nguồn thông tin khác như giá trị khí hậu, giá trị trung bình từ các trạm xung quanh, giá trị dự báo từ mô hình… Nếu độ lệch lớn (so sánh với độ
lệch chuẩn sai số tại trạm), quan trắc sẽ được coi nhiều khả năng là sai. Chỉ tiêu xác định một độ lệch bao nhiêu là lớn phụ thuộc vào từng thuật toán kiểm tra, từng trung tâm dự báo khác nhau. Về nguyên tắc, hệ thống kiểm tra chất
lượng thám sát bề mặt sẽ bao gồm bốn công đoạn kiểm tra như sau:
- Kiểm tra mã điện : kiểm tra dạng cấp thấp, mang tính kỹ thuật nhiều
hơn là khoa học trong đó chủ yếu phát hiện các lỗi logic (ví dụ như
- Kiểm tra khí hậu: so sánh quan trắc với giá trị khí hậu. Kiểm tra này
cũng thực hiện phần việc của kiểm tra vật lý do các giá trị ngưỡng
được xác định dựa theo giá trị khí hậu riêng cho từng trạm;
- Kiểm tra phù hợp xác định tương thích về mặt vật lý giữa hai hay nhiều đại lượng.
- Kiểm tra không gian so sánh giá trị quan trắc với giá trị quan trắc từ
các trạm xung quanh.
Kiểm tra khí hậu dựa trên đặc điểm khí hậu tại một khu vực xác định thông tin quan trắc có hợp lý hay không. Ví dụ nếu trong tháng bảy, nhận
được một quan trắc nhiệt độ tối cao 20C tại Hà Nội thì nhiều khả năng đây là
một quan trắc sai bởi vào mùa hè, nhiệt độ tối cao thông thường tại Hà Nội vào khoảng 35C với sai số 4-5C. Kiểm tra này có độ tin cậy cao với các biến sốnhư nhiệt độ hay độẩm nhưng cần thận trọng khi sử dụng cho gió hay
mưa bởi một quan trắc gió lớn hơn rất nhiều giá trị khí hậu rất có thể tương ứng với hoạt động của một cơn bão. Trong luận văn này, chúng tôi sử dụng
phương pháp trung bình và độ lệch chuẩn hai trọng số của Lanzante (1996).
Phương pháp này đã được một số tác giả sử dụng như Gleason (2002), Feng
và nnk (2004). Chi tiết về thuật toán kiểm tra khí hậu này đã được đề cập trong nghiên cứu của Đỗ Lệ Thủy và cộng sự (2009) nên không được nhắc lại
ở đây. Các quan trắc sau khi đã qua được khâu kiểm tra khí hậu như trên sẽ
tiếp tục trải qua khâu kiểm tra phù hợp. Bước kiểm tra này chủ yếu dựa trên
các đặc trưng hoặc quan hệ vật lý để loại bỏ các giá trị quan trắc phi vật lý (ví dụnhư lượng mưa âm).
Kiểm tra không gian so sánh quan trắc tại trạm với quan trắc từ các trạm xung quanh nhằm phát hiện những bất thường có thể với số liệu đang xét. Như vậy, nguồn thông tin kiểm tra không gian dựa vào bao gồm cả các quan trắc xung quanh sẽ không loại trừ trường hợp có những quan trắc sai trong số
trắc bất hợp lý xung quanh, nếu xuất hiện, chỉ chiếm một tỷ lệ nhỏ và quan trắc đang xét phải phù hợp với các quan trắc xung quanh.
Do số liệu tại 9 trạm quan trắc khí tượng bề mặt trên khu vực ĐBBB được thu thập dưới dạng mã điện gốc, nên việc thực hiện các bước kiểm tra
mã điện (hay còn gọi là kiểm tra logic) cần phải được thực hiện. Mặt khác, do phạm vi nghiên cứu của luận văn chỉ giới hạn trong khu vực ĐBBB, nên việc kiểm tra không gian sẽ không được thực hiện do tính đồng nhất về mặt khí hậu trong khu vực này.
Như vậy, các số liệu quan trắc được thu thập tại các trạm sẽ được kiểm tra chất lượng qua 3 bước gồm:
- Kiểm tra mã điện: dựa trên qui định về mã điện của WMO để tìm và loại bỏ các giá trị sai
- Kiểm tra khí hậu: sử dụng phương pháp trung bình và độ lệch chuẩn hai trọng số của Lanzante (1996)
- Kiểm tra phù hợp: các tiêu chí vật lý được sử dụng gồm + Nếu dd = 0 thì ff = 0 + Nếu ff = 0 thì dd = 0 + TN < TX + R24 ≥ 0 + Độ hụt điểm sương T2m - Td < 30C + Nếu T2m > 5C, không thể xảy ra các hiện tượng thời tiết 56 ≤ ww ≤ 57, 66 ≤ ww ≤ 79 hay 83 ≤ ww ≤ 90 + Nếu T2m < -2C, không thể xảy ra các hiện tượng thời tiết 50 ≤ ww ≤ 55, 58 ≤ ww ≤ 65, 68 ≤ ww ≤ 69 hay 80 ≤ ww ≤ 82 + Nếu T2m - Td > 5C, không thể xảy ra các hiện tượng thời tiết 10 ≤ ww ≤ 12 hay 40 ≤ ww ≤ 49
Việc kiểm tra chất lượng số liệu quan trắc được thực hiện cho các yếu tố gồm T2m, TX, TN, ff, dd và R24 của 9 trạm quan trắc khí tượng bề mặt trên khu vực ĐBBB cho cả giai đoạn 1997-2017 và được thực hiện riêng biệt
cho từng phiên quan trắc và trạm quan trắc. Kết quả kiểm tra chất lượng số
liệu cho 9 trạm này trong giai đoạn 1979-2017 theo 3 bước kiểm tra nói trên cho thấy chỉ một số ít số liệu bị loại do mắc phải sai sót trong mã điện (mã hóa sai nhóm hoặc sai giá trị). Tất cả các số liệu vượt qua được bước kiểm tra
mã điện đều không bị loại sau khi kiểm tra khí hậu và kiểm tra phù hợp.
Sau khi việc kiểm tra chất lượng số liệu quan trắc được hoàn tất, việc
tính toán các đại lượng dẫn xuất được thực hiện. Cụ thể, các đại lượng khí
tượng khác được tính toán để phục vụ nghiên cứu gồm:
- Nhiệt độ trung bình ngày: trung bình cộng của giá trị nhiệt độ tại các phiên quan trắc trong ngày;
- Nhiệt độ trung bình tháng: trung bình cộng của giá trị nhiệt độ tại các phiên quan trắc trong ngày và tất cả các ngày trong tháng xem xét;
- Tốc độ gió lớn nhất tháng: là giá trị tốc độ gió lớn nhất được quan trắc trong chuỗi số liệu các giá trị quan trắc gió hàng ngày của tháng xem xét;
- Tốc độ gió lớn nhất trung bình tháng: là trung bình cộng của tất cả các giá trị tốc độ gió lớn nhất trong ngày của tháng xem xét;
- Tốc độ gió lớn nhất tuyệt đối tháng: là giá trị tốc độ gió lớn nhất được quan trắc trong chuỗi số liệu các giá trị quan trắc gió hàng ngày của cùng một tháng xem xét trong cả giai đoạn 1997-2017.
- Tổng lượng mưa tháng: là tổng của tất cả các giá trị lượng mưa ngày
trong tháng xem xét;
- Lượng mưa ngày lớn nhất: Là lượng mưa ngày có giá trị lớn nhất trong chuỗi số liệu lượng mưa ngày được xem xét;
- Nhiệt độ tối thấp ngày thấp nhất tháng (TNn): là giá trị nhỏ nhất trong chuỗi các giá trị TN của các ngày trong tháng;
- Nhiệt độ tối cao ngày cao nhất tháng (TXx): là giá trị lớn nhất trong chuỗi các giá trị TX của các ngày trong tháng;
- Chuẩn sai (độ lệch chuẩn): giá trị chuẩn sai của một biến x đưa ra sẽ được tính theo công thức dưới đây
trong đó là chuẩn sai, xi là giá trị biến x tại ngày thứ i, i = 1, n với n là tổng
dung lượng mẫu, x là giá trị trung bình số học của x trong chuỗi gồm n giá trị.