SOSÁNHCÁCHÀM PHÂN BỐMẬTĐỘ TẦN SUẤT
DÙNG TRONGTÍNHTOÁNMƯAỞ ĐBSCL
Lê Anh Tuấn
1
et al.
2
1. Thạc sĩ Kỹ thuật, Trưởng Bộ môn Tin học, Khoa Khoa học, Đại học Cần Thơ
2. Các sinh viên ngành Thủy công, 1992 - 1998, cácĐồ án Môn học Thủy văn Công trình
và Luận văn Tốt nghiệp Đại học (Trần Hoàng Huân, Trần Văn Toàn, Đại học Cần Thơ)
ABSTRACT
Every year, the damages, caused by the natural disasters such as heavy rainfalls, floods and
doughts , take lives and destroy properties in many parts of the world. In water resources
engineering, frequency analysis is one of the statistical techniques applied by hydrologists
to try and estimate the probabilities associated with design events.
This report describes a comparison of the use of various continuous probability
distributions for estimating events at return periods larger than those of the recorded events
with the rainfall data in the Mekong River Delta. The results are presented by data and
graphical comparison of frequency curves from various distributions. It is reccommented
that we should calculate with many frequency distribution functions for having the best
fitting design data.
1. ĐẶT VẤN ĐỀ
Mưa lũ là một trong những vấn đề mà con người phải đối phó, phòng chống hoặc lợi dụng.
Trong những năm gần đây, thế giới nói chung và Việt Nam nói riêng đã chứng kiến các
biến động lớn về thiên tai gây nhiều thiệt hại to lớn và lâu dài cho con người, của cải, vật
chất cũng như môi trường sinh thái.
Việc thu thập cácsốliệu khí tượng - thủy văn nhằm theo dõi các diễn biến của thiên nhiên
theo không gian và thời gian. Các phương tiện toán học, thống kê, máy tính cũng được vận
dụng nhằm có một đánh giá, phân tích và dự báo hợp lý cho việc xây dựngcác công trình.
Rất nhiều nghiên cứu trongtoán thống kê đã được nơi này hoặc nơi khác sử dụngtrong
hoàn cảnh địa phương của mình. Một trongcác bài toánđó là cáchàmphân tích mật độ,
phân bốtần suất.
Mỗi quốc gia thường có những qui định hoặc "thói quen" theo một phương pháp tính nào
đó. Ví dụ, Hội đồng Tài nguyên Nước Liên bang của Hoa kỳ (The US. Federal Water
Resources Council, FWRC, 1967) khuyến cáo nên dùnghàm Log-Pearson III. Một số nước
Châu Âu và Đông Nam Á thì đang sử dụng đường LogNormal 3 tham số hoặc các hàm
phân bố Extermal loại I và III. Nga, Trung Quốc và Việt Nam thì dùnghàm Pearson III.
Các nhà phân tích toán thống kê thủy văn đã đề nghị nên xem xét lại các chọn lựa này
(Kite, 1988) qua một loạt các bài đăng trên các tạp chí chuyên ngành như USGS Water
Supply Paper (Benson, M.A., 1962), Earth Sciences, Water Resources Publications (G.W.
Kite, 1973, 1974, 1988).
Một câu hỏi được đặt ra là: hàmsố thống kê nào là phù hợp với điều kiện thời tiết của Việt
nam và đặc biệt là vùng Đồng bằng sông Cửu Long? Các nghiên cứu khác nhau cho thấy
loại đường phânbố này có thể tốt cho vùng này thì chưa hẳn đã thích hợp cho vùng khác vì
1
mỗi quốc gia đều có một đặc điểm địa lý riêng biệt, và thậm chí trong một nước khí hậu
vùng này và vùng khác cũng không giống nhau. Đến nay, vẫn chưa có một khuyến cáo
chung nào cho việc chọn lựa cáchàm thông kê cho việc tínhtoán thời tiết ở Việt Nam.
Nghiên cứu này có nhằm tìm một phần câu trả lời trên.
2. MỤC TIÊU NGHIÊN CỨU
Đề tài nghiên cứu này giới hạn ở mức độ:
• Thu thập cáchàm thống kê dùngtrongphân tích mậtđộtần suất.
• Thu thập các chuỗi sốliệumưaở ĐBSCL.
• Nhập và chạy các chương trình tínhtoán thống kê và dữ liệu trên máy tính.
• Phân tích kết quả và đề xuất các nghiên cứu tiếp.
III. PHƯƠNG PHÁP VÀ PHƯƠNG TIỆN
Các phương pháp và phương tiện sau được sử dụng:
• Tiến trình thực hiện việc nghiên cứu theo sơđồ sau (trang kế).
KHUYẾN CÁO & ĐỀ XUẤT
SO SÁNH & PHÂN TÍCH
KẾT QUẢ
THẢO CHƯƠNG,
NHẬP VÀ CHẠY
MÁY TÍNH
SẮP XẾP DỮ LIỆU
PHƯƠNG PHÁP
ĐÁNH GIÁ ?
SỐ LIỆU
KHÍ TƯỢNG - THỦY VĂN
HÀM PHÂN BỐ
MẬT ĐỘ TẦN SUẤT
ĐẶT VẤN ĐỀ
Hình 1. Các bước thực hiện nghiên cứu
2
• Chọn một sốhàm thống kê thông dụng, gồm:
+ Hàm LogNormal 2 tham số (Two-parameter LogNormal Distribution)
[]
Px
x
e
y
x
y
y
() .
ln
=
−
−
1
2
2
2
2
σπ
µ
σ
trong đó µ
γ
và σ
γ
lần lượt là giá trị trung bình và độ lệch chuẩn của lnx
+ Hàm LogNormal 3 tham số (Three-parameter LogNormal Distribution)
[]
Px
xa
e
y
xa
y
y
()
()
.
ln( )
=
−
−
−−
1
2
2
2
2
σπ
µ
σ
hàm này thay thế trị x trong lognormal 2 tham số bằng (x - a), trongđó a là biên dưới
(lower boundary) của chuỗi.
+ Hàm Extermal loại I (Type I Extermal Distribution)
Đường phânbốtầnsuất lũy tích của hàm extermal loại I có dạng:
Px
e
e
x
()
()
=
−
−−
αβ
Hàm mậtđộtầnsuất có dạng:
{}
Px e
xe
x
() .
()
()
=
−−−
−−
α
αβ
αβ
trong đó α là thông số tập trung và β là sốđo xu thế tập trung. Hai thông số này có thể
đươc xác định bằng phương pháp moment và phương pháp hợp lẽ cực đại.
+ Hàm Pearson loại III (Pearson Type III Distribution)
Px
x
e
x
()
.()
=
−
−
−
−
1
1
αβ
γ
α
β
γ
α
Γ
trong đó α, β, γ lần lượt là 3 thông số để chỉ thang bậc (scale), dạng (shape) và vị trí
(location) của chuỗi số.
α, β, γg được xác định từ các phương pháp nói trên.
Γ(β) là hàm Gamma, có bảng tra sẵn.
3
+ Hàm LogPearson loại III (LogPearson Type III Distribution)
Hàm này rất thông dụng để tínhtoán lũ ở Mỹ từ những năm 1967, trongđócác giá trị đo
đưọc của x được biến đổi thành lnx và trở thành.
Px
x
x
e
x
()
()
.
ln
.
ln
=
−
−
−
−
1
1
αβ
γ
α
β
γ
α
Γ
với 3 thông số α, β, γ như trên. Tuy nhiên, theo Bobee (1975), việc áp dụnghàm này cũng
bị giới hạn trong ứng dụngtínhtoán thủy văn. Hàm này không sử dụng được khi β >1 và
1/α > 0. Reich (1972) cũng đã ghi nhận khi γ < 0 sẽ cho kết quả tínhtoán không phù hợp
(cao hơn nhiều) với các điểm thực nghiệm.
• Tínhtoáncác tham số cho đường phânbốtần suất, gồm:
+ Phương pháp Moments (Method of Moments)
Phương trình tổng quát tính moment thứ r của đường phânbốtầnsuất
µ
'
=
r
r
xpxdx
.()
−∞
∞
∫
với r là bậc moment, p(x) là phương trình đường phânbốtầnsuất
+ Phương pháp Hợp lẽ Cực đại (Method of Maximum Likelihood)
Phương pháp này nhằm xác định các tham số của hàmmậtđộtầnsuất P(x; α, β, ) trong
đó α và β, là các tham số cần xác định.
Xác xuất xuất hiện P của các biến cố x, x
i
, : P (x
i
; α, β, ) và xác xuất tích L của n các
biến cố x
1
, x
2
, x
3
, gọi là hàm Likelihood:
Lp
x
i
i
n
=
=
∏
( ; , , )
αβ
1
Phương pháp hợp lẽ cực đại là tínhtoáncác tham số α, β, sao cho giá trị L đạt giá trị cực
đại bằng cách lấy đạo hàm riêng của l theo α, β, và cho chúng bằng 0.
Thường ta lấy logarit thập phân của L (lnL) thay cho L để đơn giản bài toán.
+ Phân tích tầnsuất (Frequency Analysis)
Đây là công việc tínhtoán xác suất xuất hiện các biến cố trong quá khứ hoặc tương lai với
việc sử dụng hay không sử dụngcác đường phânbốtầnsuất và các tham sốtính toán, để
tính biến cố X
T
tương ứng với thời kỳ quay lại T (Return Period), Van Te Chow (1964) đề
nghị dùng công thức sau:
X
T
=
µ
+ K
σ
với
µ
là trung bình mẫu (mean)
K là hệ sốtầnsuất (frequency factor), có bảng tra sẵn.
σ
là độ lệch chuẩn (standard deviation)
4
+ Sai số tiêu chuẩn S
T
(Standard Error)
Tính sai số tiêu chuẩn nhằm xác định độ biến thiên của kết quả thu được khi sử dụngcác
đường phânbốtần suất, định nghĩa như sau:
S
T
=
xx
n
ii
i
n
−
=
∑
()
'2
1
với x
i
là giá trị thực nghiệm, x
i
' là giá trị tínhtoán
• Nhập cácsốliệumưa vụ Hè Thu (IV - VIII) từ 1987 trở về trước của trạm đo:
+ Cần Thơ (36 năm) + Sóc Trăng (39 năm) + Hà Tiên (10 năm)
+ Mộc Hóa (10 năm) + Rạch Giá (28 năm) + Mỹ Tho (11 năm)
+ Cao Lãnh (17 năm) + Gò Công (11 năm) + Sa Đéc (16 năm)
+ Châu Đốc (11 năm)
• Dùng ngôn ngữ lập trình QBASIC và phần mềm TECHNI CURVE để thể hiện
kết quả phân tích và vẽ đồ thị với các điểm tầnsuất kinh nghiệm.
IV. KẾT QUẢ VÀ THẢO LUẬN
Dựa vào kết quả phân tích và sosánhcácđồ thị, ta tạm có bảng tổng kết sau:
Hàm
Trạm đo
LP . III P.III 2 para LN 3 para LN type I Ext.
Sóc Trăng (39 năm) - + + + + + + + + + +
Cần Thơ (36 năm) - + + + + + + + + + +
Rạch Giá (28 năm) + + + + + + + + + + + + + + +
Cao Lãnh (17 năm) - + + + + + + + + + +
Sa Đéc (16 năm) - + + + + + - +
Mỹ Tho (11 năm) + + + + + + + + + + + + + + +
Châu Đốc (11 năm) - + + + + + - +
Gò Công (11 năm) - + + + + + + + + + +
Hà Tiên (10 năm) - + + + + + + + + + +
Mộc Hóa (10 năm) + + + + + + + + + + + + + + +
Ghi chú:
LP.III: LogPearson III P.III: Pearson III Type I: Type I Extermal
2 para LN: 2-parameter LogNormal 3 para LN: 3-parameter LogNormal
Các hàm có nhiều dấu cộng (+) thì càng thích hợp với các điểm kinh nghiệm.
Các nơi có dấu trừ (-) để chỉ trường hợp không sử dụngcáchàm này.
Nhận xét:
• Hàm Pearson III và Log-Pearson III tỏ ra rất thích hợp với các chuỗi sốliệumưa
dài (với n> 25 năm), trường hợp mưa Mộc Hóa là ngoại lệ ở P.III.
• Hàm LogNormal 3 và 2 tham số cho kết quả tương đương khá tốt ởcác trạm mưa
có chuỗi sốliệu dài ngắn khác nhau (với n < 25), Mỹ Tho là ngoại lệ ở P.III và 2-
para.LN.
• Hàm LogPearson III chỉ sử dụng hạn chế ở một số trường hợp.
• Hàm Extermal loại I tỏ ra không phù hợp với cácsốliệumưaở ĐBSCL.
5
• Các đường cong thường cho giá trị thấp hơn các điểm kinh nghiệp ởcác đoạn tần
suất P < 50% và cao hơn các điểm kinh nghiệm ở đoạn P > 50%. Nghĩa là thiên về
an toàn.
• Riêng các trường hợp các trạm đo có chuỗi sốliệu ngắn, khi gặp trường hợp hệ số
thiên lệch âm (g < 0), thì không sử dụng được hàm LogNormal.
V. ĐỀ XUẤT
Do giới hạn của việc thu thập mẫu, kết quả này chỉ ở mức độ đánh giá ban đầu. Đề xuất các
việc nghiên cứu sắp đến:
1. Việc nghiên cứu cần được tiếp tục với nhiều chuỗi sốliệu dài, trung bình và
ngắn khác nhau để sosánh trên ý nghĩa thống kê.
2. Cần mở rộng việc chọn thời đoạn tínhtoán khác nhau tương ứng với lịch canh
tác để tínhtoán (mưa tháng, mưa vụ, mưa năm).
3. Ngoài sốliệu mưa, cần thu thập thêm cácsốliệu về bốc hơi, nhiệt độ, gió, bức
xạ và cácsốliệu về dòng chảy lũ, dòng chảy kiệt và chất lượng nước.
4. Cần sosánh thêm các thử nghiệm và cachàm thống kê để phong phú thêm
những khẳng định.
5. Về khả năng áp dụng thực tế, đề tài này là một khuyến cáo nên cẩn thận khi sử
dụng một "thói quen" tính toán, cần làm nhiều bài toán khác nhau để sosánh kết
quả khi quyết định chọn thông số thiết kế nhằm đảm bảo 2 yêu cầu là chắc chắn
về mặt kết cấu công trình và hiệu quả về mặt kinh tế.
TÀI LIỆU THAM KHẢO CHÍNH
1. Benson, M.A., 1962, Evolution of Method for Evaluating the Occurrence of
Flood, USGS Water Supply Paper 1580-A.
2. G.W. Kite, 1988, Frequency and Risk Analysis in Hydrology, Water Resources
Pub., USA
3. Mamdouh Shahin, H.J.L. van Oorschot, S.J. de Lange, 1993, Statistical
Analysis in water Resources Engineering, A.A. Balkema, Rotterdam, the
Netherlands.
6
PHỤ LỤC
Dưới đây chỉ là một số trích dẫn minh họa kết quả của nghiên cứu này. Lấy sốliệumưa vụ
Hè Thu ở Cần Thơ và kết quả đồ thị ở trạm cao Lãnh làm ví dụ.
MƯA VỤ HÈ THU Ở CẦN THƠ
TWO PARAMETER LOGNORMAL DISTRIBUTION
METHOD OF MOMENTS
MEAN IS 8.488D+02
VARIANCE IS 3.673D+04
COEFFICIENT OF SKEW IS 6.455D -01
T years 2 5 10 20 50 100
Xt
8.280D+02 9.989D+02 1.102D+03 1.195D+03 1.309D+03 1.391D+03
St
3.086D+01 4.491D+01 5.673D+01 6.829D+01 8.310D+01 9.400D+01
METHOD OF MAXIMUM LIKELIHOOD
MEAN OF LOGS IS 6.719D+00
VARIANCE OF LOGS IS 5.037D -02
COEFFICIENT OF SKEW IS - 9.923D -02
Note: For good use of this distribution the Coeff. of skew of the logs should be close to zero
T years 2 5 10 20 50 100
Xt
8.280D+02 9.989D+02 1.102D+03 1.195D+03 1.309D+03 1.391D+03
St
3.077D+01 4.320D+01 5.526D+01 6.812D+01 8.577D+01 9.952D+01
PEARSON TYPE III DISTRIBUTION
METHOD OF MOMENTS
MEAN IS 8.488D+02
VARIANCE IS 3.673D+04
COEFFICIENT OF SKEW IS 6.690D -01
PARAMETER ALPHA IS 8.328D+01
PARAMETER BETA IS 5.297D+00
PARAMETER GAMMA IS 4.077D+02
T years 2 5 10 20 50 100
Xt
8.216D+02 9.963D+02 1.105D+03 1.203D+03 1.325D+03 1.413D+03
St
1.749D+01 3.261D+01 5.160D+01 7.688D+01 8.162D+01 9.489D+01
TYPE I EXTERMAL DISTRIBUTION
METHOD OF MOMENTS
MEAN IS 8.488D+02
VARIANCE IS 3.673D+04
COEFFICIENT OF SKEW IS 6.455D -01
PARAMETER ALPHA IS 6.692D -03
PARAMETER BETA IS 7.626D+02
Note: For good use of the TIE the Coeff. of skew should be close to 1.13
T years 2 5 10 20 50 100
Xt
8.192D+02 1.011D+02 1.138D+03 1.260D+03 1.418D+03 1.536D+03
St
2.946D+01 5.303D+01 7.307D+01 9.323D+01 1.199D+02 1.401D+01
7
Lượng mưa (mm)
Hình 2. Sosánhcác đường tầnsuất trạm Cần Thơ
Lượng mưa (mm)
Hình 3. Sosánhcác đường tầnsuất trạm Cao Lãnh
8
. SO SÁNH CÁC HÀM PHÂN BỐ MẬT ĐỘ TẦN SUẤT
DÙNG TRONG TÍNH TOÁN MƯA Ở ĐBSCL
Lê Anh Tuấn
1
et al.
2
1. Thạc sĩ Kỹ thuật, Trưởng Bộ môn Tin. giới hạn ở mức độ:
• Thu thập các hàm thống kê dùng trong phân tích mật độ tần suất.
• Thu thập các chuỗi số liệu mưa ở ĐBSCL.
• Nhập và chạy các chương