Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Weibull 07/10/2008 1 TÍNH TOÁN TẦN SUẤT THEO PHÂN BỐ WEIBULL Nghiêm Tiến Lam Khoa Kỹ thuật Biển, Đại học Thuỷ lợi 1. Giới thiệu Phân bố xác suất Weibull (hay còn gọi là phân bố xác suất Rosin-Rammler) là một dạng thường dùng để mô tả thống kê sự xuất hiện của các đại lượng cực trị trong khí tượng, thuỷ văn và dự báo thời tiết như dòng chảy lũ, sóng, gió lớn nhất. Ngoài ra phân bố này cũng hay được dùng trong phân tích xác suất sống sót hoặc phá huỷ trong lý thuy ết độ tin cậy, dùng trong lý thuyết cực trị; biểu diễn thời gian sản xuất và phân phối trong công nghiệp; sự phân tán tín hiệu radar và sự suy giảm tín hiệu trong liên lạc không dây. Đường tần suất theo phân bố Weibull có thể được vẽ bằng MS Excel hoặc các phần mềm phân tích tần suất như FFC (http://coastal.wru.edu.vn/index.asp?lang=vn&page=ffc2008). 1.1. Hàm mật độ xác suất Hàm mật độ xác suất biểu thị xác suất xuất hiện giá trị của đại lượ ng ngẫu nhiên X bằng với một giá trị x cụ thể nào đó theo luật phân bố xác suất Weibull như (1): () 1 exp cc cxa xa fx bb b − ⎡ ⎤ −− ⎛⎞ ⎛⎞ =− ⎢ ⎥ ⎜⎟ ⎜⎟ ⎝⎠ ⎝⎠ ⎢ ⎥ ⎣ ⎦ (1) với a là thông số vị trí, b > 0 là thông số tỷ lệ, c > 0 là thông số hình dạng. 1.2. Hàm phân bố tần suất luỹ tích Hàm phân bố tần suất luỹ tích biểu thị xác suất xuất hiện các giá trị của đại lượng ngẫu nhiên X nhỏ hơn hoặc bằng một giá trị x cụ thể nào đó: () { } () 1exp c x xa Fx PX x f xdx b −∞ ⎡ ⎤ − ⎛⎞ =≤= =−− ⎢ ⎥ ⎜⎟ ⎝⎠ ⎢ ⎥ ⎣ ⎦ ∫ (2) Trong thực tế ngành thuỷ lợi thường dùng tần suất vượt P (thường chỉ được gọi tắt là tần suất) là xác suất xuất hiện các giá trị của đại lượng ngẫu nhiên X lớn hơn hoặc bằng một giá trị x cụ thể nào đó. {}() {} () 11 x PPX x fxdx PX x Fx ∞ =≥= =−≤=− ∫ (3) 1.3. Liên hệ với các phân bố thống kê khác Hàm phân bố xác suất Weibull là hàm ngược của phân bố xác suất cực trị tổng quát (GEV) với thông số vị trí a – b, thông số tỷ lệ b/c và thông số hình dạng 1/c (Hosking, 1986). Trong trường hợp thông số hình dạng c = 1, phân bố Weibull trở thành phân bố hàm mũ với trị bình quân b. Trong trường hợp thông số hình dạng c = 2, phân bố Weibull trở thành phân bố Rayleigh. Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Weibull 07/10/2008 2 Biến X tuân theo hàm phân bố xác suất Weibull W(b,c) có liên hệ với biến Y tuân theo hàm phân bố cực trị chuẩn G(0,1) (phân bố Gumbel với a = 0 và b = 1) theo Y ~ -c·ln(X/b). 1.4. Xác định các thông số theo phương pháp moments Quan hệ giữa các thông số của phân bố với các đặc trưng thống kê như sau 1 1xab c ⎛⎞ = +Γ+ ⎜⎟ ⎝⎠ i (4) 2 21 11 V b C x cc ⎛⎞⎛⎞ =Γ+−Γ+ ⎜⎟⎜⎟ ⎝⎠⎝⎠ (5) 3 3 2 1123 21 31 1 1 21 11 S cccc C cc ⎛⎞⎛⎞⎛⎞⎛⎞ Γ+−Γ+Γ++Γ+ ⎜⎟⎜⎟⎜⎟⎜⎟ ⎝⎠⎝⎠⎝⎠⎝⎠ = ⎡⎤ ⎛⎞⎛⎞ Γ+ −Γ + ⎜⎟⎜⎟ ⎢⎥ ⎝⎠⎝⎠ ⎣⎦ (6) Để xác định các thông số của phân bố xác suất dựa vào các đặc trưng thống kê theo phương pháp moments, giải phương trình (6) để xác định thông số hình dạng c. Tiếp theo, thông số tỷ lệ b được xác định từ (5). Cuối cùng xác định thông số vị trí a từ (4). 1.5. Giá trị của hàm phân bố lý thuyết Tuyến tính hoá phương trình (2) bằng cách lấy logarith vế của (2) như sau () ln 1 c x a Fx b − ⎛⎞ −=−⎡⎤ ⎜⎟ ⎣⎦ ⎝⎠ (7) Nhân 2 vế của (7) với -1 và logarithm hoá 2 vế lần thứ 2 () {} ln ln 1 ln x a Fx c b − ⎛⎞ −− = ⎡⎤ ⎜⎟ ⎣⎦ ⎝⎠ (8) Cuối cùng nhận được () () {} 1 ln ln ln 1 ln x aFxb c −= − − +⎡⎤ ⎣⎦ (9) (9) là quan hệ tuyến tính giữa ln(x-a) và ln{-ln[1-F(x)]}, dựa vào các giá trị quan sát của x và tần suất kinh nghiệm của nó để xác định các hệ số b, c của tương quan tuyến tính này. Nếu biểu thị qua tần suất vượt () {} 1 ln ln ln ln x aPb c −=−+ (10) Giá trị x ứng với tần suất vượt P được tính dựa vào (10) Nếu biểu thị qua tần suất vượt thì giá trị x p của hàm phân bố lý thuyết ứng với tần suất P [] 1 exp ln ln ln p x aPb c ⎧ ⎫ =+ − + ⎨ ⎬ ⎩⎭ (11) Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Weibull 07/10/2008 3 2. Tính toán hàm phân bố Weibull bằng MS Excel Từ quan hệ tuyến tính (10), các thông số của phân bố Weibull có thể được xác định bằng phương pháp tương quan giữa ln(x - a) và ln(-lnP), với 1/c là hệ số góc của quan hệ tương quan và lnb là giao điểm của đường thẳng tương quan cắt trục tung. Việc xác định các hệ số hồi quy của quan hệ có thể tiến hành bằng MS Excel cho chuỗi số liệu X gồm có N số (x 1 , x 2 , …, x N ) với các bước như sau: Bảng 1. Bảng tần suất kinh nghiệm Thứ hạng Chuỗi số giảm dần x i ↓ Tần suất kinh nghiệm P i = i/(N+1) Giảm biến LN(-LN(P i )) Giảm biến LN(x i – a) (1) (2) (3) (4) (5) 1 x 1 P 1 = 1/(N+1) LN(-LN(P 1 )) LN(x 1 – a) 2 x 2 P 2 = 2/(N+1) LN(-LN(P 2 )) LN(x 2 – a) … … … … … i x i P i = i/(N+1) LN(-LN(P i )) LN(x i – a) … … … … … N x N P N = N/(N+1) LN(-LN(P N )) LN(x N – a) 2.1. Lập bảng phân bố tần suất thực nghiệm (Bảng 1) 1. Sắp xếp chuỗi số liệu x i theo thứ tự giảm dần và điền vào cột (2) của bảng tính toán. Trong Excel, chọn cột số liệu từ hàng 1 đến hàng N, sau đó chọn trên trình đơn Data → Sort. Chọn cột định sắp xếp trong Sort by và hướng sắp xếp là Descending, sau đó bấm nút OK. Cột 1 là thứ hạng i của các giá trị trong chuỗi số liệu x i theo thứ tự nhỏ dần. Để điền cột này tự động trong Excel, nhập số 1 vào hàng đầu tiên và chọn ô đầu tiên đó, sau đó chọn trên trình đơn Edit → Fill → Series. Chọn Series in là hướng điền Columns, chọn loại chuỗi Type là Linear, Step value là 1, Stop value là giá trị của N, sau đó bấm nút OK. 2. Tính tần suất kinh nghiệm P i = i/(N+1) trong cột (3). 3. Giả thiết giá trị của thông số vị trí a = 0. 4. Tính toán LN(-LN(P i )) trong cột (4). 5. Tính toán LN(x i – a) trong cột (5). 2.2. Tính các đăc trưng thống kê của chuỗi số theo phương pháp moments: 1. Tính toán các đặc trưng thống kê. Giá trị độ dài chuỗi N = COUNT(X) với đối số X là chuỗi số liệu đã nhập vào. 2. Giá trị trung bình của chuỗi số x =AVERAGE(X). 3. Hệ số phân tán C V = STDEV(X)/ x . 4. Hệ số thiên lệch C S = SKEW(X). 2.3. Tính các đăc trưng thống kê của chuỗi số theo phương pháp đồ thị: Có thể xác định các thông số theo phương pháp đồ thị theo 2 cách. Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Weibull 07/10/2008 4 Cách 1: Vẽ đường hồi quy 1. Vẽ đồ thị quan hệ giữa cột (4) và cột (5). Chọn cột (4) và cột (5), chọn trên trình đơn Insert → Chart. Chọn loại đồ thị là XY (Scatter), chọn Chart sub-type là chấm điểm theo mặc định. 2. Xác định các thông số của quan hệ. Chọn các điểm quan hệ trên đồ thị vừa vẽ, chọn trên trình đơn Chart → Add Trendline. Chọn dạng quan hệ trong Trend/Regression type là Linear, Đánh dấu các mục Display equation on chart và Display R-squared value on chart trong Options, cuối cùng bấm phím OK. 3. Thông số hình dạng c là nghịch đảo của độ dốc đường tương quan so với trục hoành. Giá trị logarithm của thông số tỷ lệ ln b là tung độ của đường thẳng tương quan cắt trục tung. Các thông số và hệ số tương quan có thể nhận được từ phương trình hồi quy. Cách 2: Sử dụng các hàm của MS Excel (không cần vẽ đường hồi quy): 1. Thông số hình dạng c tính theo công thức c = 1/SLOPE(cột_5,cột_4) 2. Thông số tỷ lệ b tính theo công thức b = EXP(INTERCEPT(cột_5,cột_4)). 3. Hệ số tương quan tính theo công thức R = CORREL(cột_5,cột_4). Cho thông số vị trí a các giá trị khác nhau để nhận được hệ số tương quan R lớn nhất. Cũng có thể xác định thông số a một cách tự động nếu bạn đã cài đặt Solver kèm theo Excel như sau: Chọn trên trình đơn Tools → Solver. Chọn Set Target Cell là ô chứa biểu thức tính R ở trên và By Changing Cells là ô chứa thông số vị trí a. Chọn loại bài toán là Max trong Equal To . Bấm Solve để Excel tự động tìm giá trị của a cho R lớn nhất. Từ các thông số a, b và c vừa tính, có thể tính lại các đặc trưng thống kê theo các công thức (4), (5) và (6). 2.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) 1. Cột (1): Thứ tự của các giá trị tính toán trong bảng. 2. Cột (2): Cho các tần suất cần tính toán (tần suất vượt) P 3. Cột (3): Thời kỳ lặp lại tính theo năm, xác định theo công thức T = 1/P. 4. Cột (4): Giá trị thiết kế tương ứng với tần suất ở cột (2) tính toán theo phân bố Weibull như (11). 2.5. Vẽ đường tần suất 1. Vẽ đồ thị các điểm (XY Scatter) quan hệ giữa P và giá trị quan trắc trong cột (3) và (2) của bảng phân bố tần suất thực nghiệm (Bảng 1) dưới dạng các điểm chấm. 2. Bổ sung thêm đồ thị (XY Scatter) quan hệ giữa P và giá trị thiết kế trong cột (3) và (4) của bảng phân bố tần suất lý thuyết (Bảng 2) dưới dạng đường nối liền nét. 3. Ví dụ tính toán Xác định các thông số và vẽ đường tần suất theo phân bố Weibull cho chuỗi số liệu vận tốc gió lớn nhất hàng năm đã được sắp xếp giảm dần như trong cột (2) Bảng 1, Hình 1. Các bước tính toán thông số và vẽ đường tần suất theo phân bố Weibull như sau 3.1. Tính các thông số thống kê theo phương pháp moments 1. Ô C7: Độ dài chuỗi số (N) =COUNT(B16:B30). 2. Ô C8: Trị trung bình ( x ) =AVERAGE(B16:B30). 3. Ô C9: Hệ số phân tán tính theo phương pháp moments (C V ) =STDEV(B16:B30)/C8. 4. Ô C10: Hệ số thiên lệch tính theo phương pháp moments (C S ) =SKEW(B16:B30). Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Weibull 07/10/2008 5 3.2. Tính bảng tần suất kinh nghiệm 1. Tính tần suất kinh nghiệm P i = i/(N+1) trong cột 3, ví dụ ô C16: =100*A16/($C$7+1). 2. Tính toán LN(-LN(P i )) trong cột 4, ví dụ ô D16: =LN(-LN(0.01*C16)) 3. Tính toán LN(V-a) trong cột 5, ví dụ ô E16: =LN(B16-$I$10) Hình 1: Bảng tính tần suất theo phân bố Weibull 3.3. Tính các thông số thống kê theo phương pháp đồ thị 1. Ô H7: Hệ số tương quan của đường hồi quy (R) =CORREL(D16:D30,E16:E30). 2. Ô H8: Thông số hình dạng (c) =1/SLOPE(E16:E30,D16:D30). 3. Ô H9: Thông số tỷ lệ (b) =EXP(INTERCEPT(E16:E30,D16:D30)). 4. Vẽ đồ thị các điểm (XY Scatter) quan hệ giữa X và Y trong 2 cột (4) và (5) của Bảng 1. Tạo đường hồi quy, hiện phương trình hồi quy và hệ số tương quan của quan hệ. Kiểm tra lại các thông số của phân bố Weibull theo các công thức (10). Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Weibull 07/10/2008 6 3.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) và đường tần suất 1. Lập bảng tần suất lý thuyết của phân bố Weibull với ciá trị thiết kế trong cột (4) tính theo như (11), ví dụ ô J16: =$I$10+EXP(LN(-LN(0.01*I16))/$I$8+LN($I$9)). 2. Đường tần suất vẽ quan hệ giữa cột (3) và cột (4) của bảng 2 như Hình 3. Xác định thông số phân bố Weibull y = 0.2626x + 3.465 R 2 = 0.954 2 2.5 3 3.5 4 4.5 5 -4 -3 -2 -1 0 1 2 Ln(-Ln(P)) Ln(V-a) () { } 1exp c xa Fx PX x b ⎡ ⎤ − ⎛⎞ =≤=−− ⎢ ⎥ ⎜⎟ ⎝⎠ ⎢ ⎥ ⎣ ⎦ Hình 2: Đường thẳng hồi quy ĐƯỜNG TẦN SUẤT WEIBULL CỦA TỐC ĐỘ GIÓ LỚN NHẤT TRẠM ABC 1.00 1.05 1.11 1.18 1.25 1.33 1.43 1.67 2.00 2.50 3.33 4.00 5.00 6.67 10.00 20.00 33.33 50.00 60.00 70.00 80.00 90.00 95.00 99.00 10 15 20 25 30 35 40 45 50 Tần suất vượt, P (%) Vận tốc gió, Vmax (m/s) Hình 3: Đường tần suất phân bố Weibull vẽ bằng MS Excel Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Weibull 07/10/2008 7 Mục lục TÍNH TOÁN TẦN SUẤT THEO PHÂN BỐ WEIBULL 1 1. Giới thiệu 1 1.1. Hàm mật độ xác suất 1 1.2. Hàm phân bố tần suất luỹ tích 1 1.3. Liên hệ với các phân bố thống kê khác 1 1.4. Xác định các thông số theo phương pháp moments 2 1.5. Giá trị của hàm phân bố lý thuyết 2 2. Tính toán hàm phân bố Weibull bằng MS Excel 3 2.1. Lập bảng phân bố tần suất thực nghiệm (Bảng 1) 3 2.2. Tính các đăc trưng thống kê của chuỗi số theo phương pháp moments: 3 2.3. Tính các đăc trưng thống kê của chuỗ i số theo phương pháp đồ thị: 3 2.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) 4 2.5. Vẽ đường tần suất 4 3. Ví dụ tính toán 4 3.1. Tính các thông số thống kê theo phương pháp moments 4 3.2. Tính bảng tần suất kinh nghiệm 5 3.3. Tính các thông số thống kê theo phương pháp đồ thị 5 3.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) và đường tần suất 6 Mục lục 7 . Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Weibull 07/10/2008 1 TÍNH TOÁN TẦN SUẤT THEO PHÂN BỐ WEIBULL Nghiêm Tiến Lam Khoa Kỹ thuật Biển, Đại học. Hình 3. Xác định thông số phân bố Weibull y = 0.2626x + 3 .46 5 R 2 = 0.9 54 2 2.5 3 3.5 4 4.5 5 -4 -3 -2 -1 0 1 2 Ln(-Ln(P)) Ln(V-a) () { } 1exp c xa Fx PX x b ⎡ ⎤ − ⎛⎞ =≤=−− ⎢ ⎥ ⎜⎟ ⎝⎠ ⎢ ⎥ ⎣ ⎦ . bố Weibull trở thành phân bố hàm mũ với trị bình quân b. Trong trường hợp thông số hình dạng c = 2, phân bố Weibull trở thành phân bố Rayleigh. Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán