Vấn đề xử lý số liệu chỉ thực hiện với các số liệu quan trắc. Trong Luận văn này, chuỗi số liệu quan trắc là nguồn thông tin về quá khứ duy nhất để tiến hành tính toán và nhận định. Ngoài độ dài chuỗi, chất lượng số liệu là một trong những
yếu tố quyết định đến kết quả tính toán, phân tích. Do đó, các chuỗi cần phải được tiến hành xử lý để loại bỏ những yếu tố ngoài mong muốn, như sai số quan trắc, tính bất đồng nhất chuỗi,…
Nói chung trong các chuỗi số liệu luôn tiềm ẩn ba loại sai số quan trắc: (1)sai số hệ thống, (2)sai số ngẫu nhiên và (3)sai số thô. Sai số hệ thống là loại sai số rất khó phát hiện nếu không có sự khảo sát tỷ mỷ. Tuy nhiên, khi số liệu được khai thác từ các nguồn chính thống người ta giả thiết rằng các sai số hệ thống đã được kiểm tra và loại bỏ. Sai số ngẫu nhiên luôn luôn tồn tại trong mọi chuỗi số liệu quan trắc. Việc loại bỏ sai số ngẫu nhiên thường là không thực hiện được. Sai số thô sinh ra chủ yếu bởi những thao tác nhầm lẫn, sơ suất trong quá trình đo đạc hoặc lấy mẫu. Trong nhiều trường hợp những giá trị có chứa sai số thô rất khó phát hiện do chúng bị ẩn giấu trên nền chuỗi số liệu. Sai số trong số liệu đo mưa là một ví dụ. Mặc dù vậy việc xác định và loại bỏ sai số thô vẫn có thể thực hiện. Trong khuôn khổ của luận văn này chúng tôi thực hiện việc xử lý số liệu và chuẩn bị bộ số liệu đưa vào tính toán như sau: Số liệu khuyết thiếu của chuỗi được ký hiệu: -99.9; Kiểm soát để phát hiện các lỗi nhập liệu nhầm lẫn. Ví dụ: Số liệu mưa âm, số liệu nhiệt vượt quá 500C, nhiệt độ tối cao thấp hơn nhiệt độ tối thấp.
Sau khi thu thập số liệu quan trắc tại các trạm, số liệu cần được xử lý kiểm nghiệm tính tin cậy thông qua chương trình phần mềm RHtestsV3 của nhóm ET: (http://cccma.seos.uvic.ca/ETCCDMI/software.shtml). (Hình 2-1, 2-2)
Hình 2-1 Mô tả quá trình kiểm tra chất lƣợng số liệu Tx, Tm
Hình 2-2 Mô tả quá trình kiểm tra chất lƣợng số liệu R
Trên sở nguồn số liệu của Trung tâm tư liệu khí tượng thủy văn, Trung tâm Khí tượng Thủy văn Quốc gia chúng tôi khảo sát các chuỗi thông qua các đồ thị được phần mềm xử lý số liệu hiển thị. Việc kiểm tra dữ liệu nhằm 2 mục đích: 1) tránh lỗi nhận diện dữ liệu của phần mềm tính toán dẫn đến việc phần mềm không
tính toán được hoặc tính toán sai. 2) Kiểm tra các chuỗi số liệu để loại bỏ sai số thô. Nhìn chung, việc xử lý số liệu chỉ có thể loại bỏ được một số loại sai số thô do quá nhầm lẫn trong quá trình nhập dữ liệu.Các trạm có số liệu nghi ngờ chúng tôi đã tiến hành hiệu chỉnh hoặc loại bỏ.