Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10/2008 1 TÍNH TOÁN TẦN SUẤT THEO PHÂN BỐ GUMBEL Nghiêm Tiến Lam Khoa Kỹ thuật Biển, Đại học Thuỷ lợi 1. Giới thiệu Phân bố xác suất Gumbel (hay còn gọi là phân bố xác suất cực trị loại I (EV1 - Extreme Value type I), phân bố xác suất Fisher-Tippett loại I hoặc phân bố xác suất log-Weibull) thường được dùng để mô hình hoá thống kê các đại lượng cực trị như dòng chảy lũ, dòng chảy kiệt, vận tốc gió lớn nhất và các thiên tai như động đất. Đường tần suấ t theo phân bố Gumbel có thể được vẽ bằng MS Excel hoặc các phần mềm phân tích tần suất như FFC (http://coastal.wru.edu.vn/index.asp?lang=vn&page=ffc2008). 1.1. Hàm mật độ xác suất Hàm mật độ xác suất biểu thị xác suất xuất hiện giá trị của đại lượng ngẫu nhiên X bằng với một giá trị x cụ thể nào đó theo luật phân bố xác suất Gumbel như (1): () 1 exp exp exp xa xa fx bb b ⎧ ⎫ ⎡−⎤ ⎡−⎤ ⎛⎞ ⎛⎞ =− −− ⎨ ⎬ ⎜⎟ ⎜⎟ ⎢⎥ ⎢⎥ ⎝⎠ ⎝⎠ ⎣⎦ ⎣⎦ ⎩⎭ (1) với a là thông số vị trí, b > 0 là thông số tỷ lệ 1.2. Hàm phân bố tần suất luỹ tích Hàm phân bố tần suất luỹ tích biểu thị xác suất xuất hiện các giá trị của đại lượng ngẫu nhiên X nhỏ hơn hoặc bằng một giá trị x cụ thể nào đó: () { } () exp -exp x xa Fx PX x f xdx b −∞ ⎧ ⎫ ⎡ −⎤ ⎛⎞ =≤= = − ⎨ ⎬ ⎜⎟ ⎢ ⎥ ⎝⎠ ⎣ ⎦ ⎩⎭ ∫ (2) Trong thực tế ngành thuỷ lợi thường dùng tần suất vượt P (thường chỉ được gọi tắt là tần suất) là xác suất xuất hiện các giá trị của đại lượng ngẫu nhiên X lớn hơn hoặc bằng một giá trị x cụ thể nào đó. {}() {} () 11 x PPX x fxdx PX x Fx ∞ =≥= =−≤=− ∫ (3) 1.3. Liên hệ với các phân bố thống kê khác Phân bố xác suất Gumbel còn gọi là phân bố xác suất cực trị loại I (EV1), là trường hợp đặc biệt của phân bố cực trị tổng quát (GEV) với thông số hình dạng c = 0. Phân bố Gumbel với thông số vị trí a = 0 và thông số tỷ lệ b =1 được gọi là phân bố cực trị chuẩn. Hàm phân bố xác suất Gumbel còn được gọi là phân bố xác suất log-Weibull và tiệm cận với phân bố Weibull khi c lớn. N ếu X là biến tuân theo phân bố Gumbel G(0,1) và Y là biến tuân theo phân bố Weibull W(b,c) thì X ~ -c·ln(Y/b). Nếu X là biến tuân theo phân bố Gumbel G(a,b) và Y là biến tuân theo phân bố hàm mũ E(b) thì X = a – ln(Y). Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10/2008 2 Nếu X 1 là biến tuân theo phân bố Gumbel G(a 1 ,b), X 2 là biến tuân theo phân bố Gumbel G(a 2 ,b) thì hiệu Y = X 1 - X 2 là biến tuân theo phân bố logistic L(0,b). Biến X tuân theo phân bố Gumbel G(0,1) có liên hệ với biến Y tuân theo phân bố Pareto P(a,c) theo Y ~ a{1-exp[-exp(-X)]} 1/c và có liên hệ với biến Z tuân theo hàm luỹ thừa chuẩn theo Z ~ exp[-exp(-X/c)]. 1.4. Xác định các thông số theo phương pháp moments Quan hệ giữa các thông số của phân bố với các đặc trưng thống kê như sau 0.57721 x ab = +⋅ (4) 6 V b C x π = (5) 1.139547 S C = (6) Do vậy 0.779 V bxC = ⋅⋅ (7) ( ) 10.450 V ax C=− ⋅ (8) 1.5. Giá trị của hàm phân bố lý thuyết Tuyến tính hoá phương trình (2) bằng cách lấy logarith vế của (2) như sau () ln exp x a Fx b ⎡ −⎤ ⎛⎞ =− − ⎜⎟ ⎢ ⎥ ⎝⎠ ⎣ ⎦ (9) Nhân 2 vế của (9) với -1 và logarithm hoá 2 vế lần thứ 2 () ln ln x a Fx b − ⎛⎞ −=− ⎡⎤ ⎜⎟ ⎣⎦ ⎝⎠ (10) Cuối cùng nhận được ( ) ln ln x ab Fx=−⋅ − ⎡ ⎤ ⎣ ⎦ (11) (11) là quan hệ tuyến tính giữa x và ln[-lnF(x)], dựa vào các giá trị quan sát của x và tần suất kinh nghiệm của nó để xác định các hệ số a, b của tương quan tuyến tính này. Nếu biểu thị qua tần suất vượt thì giá trị x p của hàm phân bố lý thuyết ứng với tần suất P ( ) ln ln 1 P x ab P=−⋅ − − ⎡ ⎤ ⎣ ⎦ (12) 2. Tính toán hàm phân bố Gumbel bằng MS Excel Từ quan hệ tuyến tính (12), các thông số của phân bố Gumbell có thể được xác định bằng phương pháp tương quan giữa x và ln[-ln(1-P)], với b là hệ số góc của quan hệ tương quan và a là giao điểm của đường thẳng tương quan cắt trục tung. Việc xác định các hệ số hồi quy của quan hệ tương quan có thể tiến hành bằng MS Excel cho chuỗi số liệu X gồm có N số (x 1 , x 2 , …, x N ) với các bước như sau: Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10/2008 3 Bảng 1. Bảng tần suất kinh nghiệm Thứ hạng Chuỗi số giảm dần x i ↓ Tần suất kinh nghiệm P i = i/(N+1) Giảm biến ln(-ln(1-P i )) (1) (2) (3) (4) 1 x 1 P 1 = 1/(N+1) ln(-ln(1-P 1 )) 2 x 2 P 2 = 2/(N+1) ln(-ln(1-P 2 )) … … … … i x i P i = i/(N+1) ln(-ln(1-P i )) … … … … N x N P N = N/(N+1) ln(-ln(1-P N )) 2.1. Lập bảng phân bố tần suất thực nghiệm (Bảng 1) 1. Sắp xếp chuỗi số liệu x i theo thứ tự giảm dần và điền vào cột 2 của bảng tính toán. Trong Excel, chọn cột số liệu từ hàng 1 đến hàng N, sau đó chọn trên trình đơn Data → Sort. Chọn cột định sắp xếp trong Sort by và hướng sắp xếp là Descending, sau đó bấm nút OK. Cột 1 là thứ hạng i của các giá trị trong chuỗi số liệu x i theo thứ tự nhỏ dần. Để điền cột này tự động trong Excel, nhập số 1 vào hàng đầu tiên và chọn ô đầu tiên đó, sau đó chọn trên trình đơn Edit → Fill → Series. Chọn Series in là hướng điền Columns, chọn loại chuỗi Type là Linear, Step value là 1, Stop value là giá trị của N, sau đó bấm nút OK. 2. Tính tần suất kinh nghiệm P i = i/(N+1) trong cột 3. 3. Tính toán LN(-LN(1-P i )) trong cột 4. 2.2. Tính các đăc trưng thống kê của chuỗi số theo phương pháp moments: 1. Tính toán các đặc trưng thống kê. Giá trị độ dài chuỗi N = COUNT(X) với đối số X là chuỗi số liệu đã nhập vào. 2. Giá trị trung bình của chuỗi số x =AVERAGE(X). 3. Hệ số phân tán C V = STDEV(X)/ x . 4. Hệ số thiên lệch C S = SKEW(X). 2.3. Tính các đăc trưng thống kê của chuỗi số theo phương pháp đồ thị: Có thể xác định các thông số theo phương pháp đồ thị theo 2 cách. Cách 1: Vẽ đường hồi quy 1. Vẽ đồ thị quan hệ giữa cột 4 và cột 2. Chọn cột 2 và cột 4, chọn trên trình đơn Insert → Chart. Chọn loại đồ thị là XY (Scatter), chọn Chart sub-type là chấm điểm theo mặc định. Chú ý sửa lại tên các cột để cột 4 là các giá trị trên trục hoành và cột 2 là các giá trị trên trục tung của đường quan hệ. 2. Xác định các thông số của quan hệ. Chọn các điểm quan hệ trên đồ thị vừa vẽ, chọn trên trình đơn Chart → Add Trendline. Chọn dạng quan hệ trong Trend/Regression Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10/2008 4 type là Linear, Đánh dấu các mục Display equation on chart và Display R-squared value on chart trong Options, cuối cùng bấm phím OK. 3. Thông số tỷ lệ b là đảo dấu của độ dốc đường tương quan so với trục hoành. Giá trị của thông số vị trí a là tung độ của đường thẳng tương quan cắt trục tung. Các thông số và hệ số tương quan có thể xem trên phương trình hồi quy. Cách 2: Sử dụng các hàm của MS Excel (không cần vẽ đường hồi quy): 1. Thông số tỷ lệ b tính theo công thức b = -1*SLOPE(cột_2,cột_4). 2. Thông số vị trí a tính theo công thức a = INTERCEPT(cột_2,cột_4). 3. Hệ số tương quan tính theo công thức R = CORREL(cột_2,cột_4). 2.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) 1. Cột (1): Thứ tự của các giá trị tính toán trong bảng. 2. Cột (2): Cho các tần suất cần tính toán (tần suất vượt) P 3. Cột (3): Thời kỳ lặp lại tính theo năm, xác định theo công thức T = 1/P. 4. Cột (4): Giá trị thiết kế tương ứng với tần suất ở cột (2) tính toán theo phân bố Gumbel như (12). 2.5. Vẽ đường tần suất 1. Vẽ đồ thị các điểm (XY Scatter) quan hệ giữa P và giá trị quan trắc trong cột (4) và (2) của bảng phân bố tần suất thực nghiệm (Bảng 1) dưới dạng các điểm chấm. 2. Bổ sung thêm đồ thị (XY Scatter) quan hệ giữa P và giá trị thiết kế trong cột (3) và (4) của bảng phân bố tần suất lý thuyết (Bảng 2) dưới dạng đường nối liền nét. 3. Ví dụ tính toán Xác định các thông số và vẽ đường tần suất theo phân bố Gumbel cho chuỗi số liệu vận tốc gió lớn nhất hàng năm đã được sắp xếp giảm dần như trong cột (2) Bảng 1, Hình 1. 3.1. Tính các thông số thống kê theo phương pháp moments 1. Ô C7: Độ dài chuỗi số (N) =COUNT(B16:B30). 2. Ô C8: Trị trung bình ( x ) =AVERAGE(B16:B30). 3. Ô C9: Hệ số phân tán tính theo phương pháp moments (C V ) =STDEV(B16:B30)/C8. 4. Ô C10: Hệ số thiên lệch tính theo phương pháp moments (C S ) =SKEW(B16:B30). 5. Ô C11: Thông số tỷ lệ tính theo phương pháp moments (b) =C9*C8*0.7796968. 6. Ô C12: Thông số tỷ lệ tính theo phương pháp moments (a) =C8*(1-C9*0.45). 3.2. Tính bảng tần suất kinh nghiệm 1. Tính tần suất kinh nghiệm P i = i/(N+1) trong cột 3, ví dụ ô C16: =100*A16/($C$7+1). 2. Tính toán LN(-LN(1-P i )) trong cột 4, ví dụ ô D16: =LN(-LN(1-0.01*C16)) Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10/2008 5 Hình 1: Bảng tính tần suất theo phân bố Gumbel 3.3. Tính các thông số thống kê theo phương pháp đồ thị 1. Ô H7: Hệ số tương quan của đường hồi quy (R) =CORREL(D16:D30,B16:B30). 2. Ô H8: Trị số trung bình =C8. 3. Ô H11: Thông số tỷ lệ tính theo phương pháp đồ thị (b) =-SLOPE(B16:B30,D16:D30). 4. Ô H12: Thông số tỷ lệ tính theo phương pháp đồ thị (a) =INTERCEPT(B16:B30,D16:D30). 5. Ô H9: Hệ số phân tán tính theo phương pháp đồ thị (C V ) =H11/(H8*0.7796968). 6. Ô H10: Hệ số thiên lệch của phân bố lý thuyết (C S ) =1.139547. 7. Vẽ đồ thị các điểm (XY Scatter) quan hệ giữa X và Y trong 2 cột (4) và (2) của Bảng 1. Tạo đường hồi quy, hiện phương trình hồi quy và hệ số tương quan của quan hệ. Kiểm tra lại các thông số của phân bố Gumbel theo các công thức (11). Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10/2008 6 Hình 2: Đường thẳng hồi quy 3.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) và đường tần suất 1. Lập bảng tần suất lý thuyết của phân bố Gumbel với ciá trị thiết kế trong cột (4) tính theo như (12), ví dụ ô I16: =$H$12-$H$11*LN(-LN(1-0.01*H16)). 2. Đường tần suất vẽ quan hệ giữa cột (3) và cột (4) của bảng 2 như Hình 3. Hình 3: Đường tần suất phân bố Gumbel vẽ bằng MS Excel Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10/2008 7 Mục lục TÍNH TOÁN TẦN SUẤT THEO PHÂN BỐ GUMBEL 1 1. Giới thiệu 1 1.1. Hàm mật độ xác suất 1 1.2. Hàm phân bố tần suất luỹ tích 1 1.3. Liên hệ với các phân bố thống kê khác 1 1.4. Xác định các thông số theo phương pháp moments 2 1.5. Giá trị của hàm phân bố lý thuyết 2 2. Tính toán hàm phân bố Gumbel bằng MS Excel 2 2.1. Lập bảng phân bố tần suất thực nghiệm (Bảng 1) 3 2.2. Tính các đăc trưng thống kê của chuỗi số theo phương pháp moments: 3 2.3. Tính các đăc trưng thống kê của chuỗ i số theo phương pháp đồ thị: 3 2.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) 4 2.5. Vẽ đường tần suất 4 3. Ví dụ tính toán 4 3.1. Tính các thông số thống kê theo phương pháp moments 4 3.2. Tính bảng tần suất kinh nghiệm 4 3.3. Tính các thông số thống kê theo phương pháp đồ thị 5 3.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) và đường tần suất 6 Mục lục 7 . i/(N+1) Giảm biến ln(-ln(1-P i )) (1) (2) (3) (4) 1 x 1 P 1 = 1/(N+1) ln(-ln(1-P 1 )) 2 x 2 P 2 = 2/ (N+1) ln(-ln(1-P 2 )) … … … … i x i P i = i/(N+1) ln(-ln(1-P i )) … … … … N x N . =100*A16/($C$7+1). 2. Tính toán LN(-LN(1-P i )) trong cột 4, ví dụ ô D16: =LN(-LN( 1-0 .01*C16)) Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10 /20 08 5 Hình. Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel 07/10 /20 08 1 TÍNH TOÁN TẦN SUẤT THEO PHÂN BỐ GUMBEL Nghiêm Tiến Lam Khoa Kỹ thuật Biển, Đại học Thuỷ