Bài giảng Thủy văn công trình - Chương 3: Thống kê xác suất ứng dụng trong tính toán thủy văn, trình bày các nội dung: khái niệm xác suất và tần suất, đại lượng ngẫu nhiên và luật phân bố xác suất của đại lượng ngẫu nhiên, khái niệm về mẫu và tổng thể, phương pháp chọn mẫu, hàm tần suất lũy tích và hàm mật độ tần suất,... Đây là tài liệu tham khảo dành cho sinh viên ngành Xây dựng
Trang 1Chương 3: Thống kê xác suất ứng dụng
trong tính toán thủy văn
THUỶ VĂN CÔNG TRÌNH
Khoa Thuỷ văn – Tài nguyên nước
Bộ môn Thuỷ văn – Tài nguyên nước
1
Trang 23.1 Khái niệm về xác suất và tần suất
1 Các khái niệm cơ bản
Phép thử: Thực hiện một thử nghiệm và quan sát kết quả thực hiện đối với một hiện tượng ngẫu nhiên nào đó trong cùng
một điều kiện nhất định
Kết quả của một phép thử ngẫu nhiên gọi là biến cố ngẫu nhiên, hoặc nói ngắn gọn là biến cố / biến cố cơ bản Tập hợp các biến cố có thể xẩy ra trong một phép thử gọi là không gian biến cố
2
Trang 33.1 Khái niệm về xác suất và tần suất
Phân loại biến cố
Biến cố chắc chắn: là biến cố nhất định phải xuất hiện trong một phép thử
Biến cố không thể có: là biến cố không thể xuất hiện trong một phép thử
Biến cố độc lập: là biến cố mà sự xuất hiện của nó không phụ thuộc vào sự xuất hiện của các biến cố khác
Biến cố phụ thuộc: là biến cố mà sự xuất hiện của nó phụ
thuộc vào sự xuất hiện của biến cố khác
3
Trang 43.1 Khái niệm về xác suất và tần suất
Phân loại biến cố
Biến cố tổng: biến cố C được gọi là biến cố tổng của hai biến cố A
và B nếu hoặc A xuất hiện, hoặc B xuất hiện, hoặc cả A và B cùng xuất hiện đều dẫn đến sự xuất hiện của C
Biến cố tích: Biến cố C được gọi là biến cố tích của hai biến cố A
và B khi và chỉ khi cả 2 biến cố A và B đồng thời xuất hiện tạo nên
Trang 53.1 Khái niệm về xác suất và tần suất
Xác suất
Định nghĩa cổ điển: Xác suất xuất hiện của một biến cố
A nào đó bằng tỷ số giữa số biến cố cơ bản thuận lợi cho A xuất hiện trên tổng các biến cố cơ bản của không gian biến cố
Công thức tính xác suất của biến cố A theo định nghĩa cổ điển:
n là tổng số các biến cố cơ bản của không gian biến cố đang xét;
m là số biến cố cơ bản thuận lợi cho biến cố A xuất hiện
5
n
m A
P ( )
Trang 63.1 Khái niệm về xác suất và tần suất
Định nghĩa theo thống kê: Xác suất xuất hiện của một biến cố A nào đó là tần số xuất hiện của biến cố đó khi
số lần thực hiện phép thử tăng lên vô hạn
Công thức tính xác suất theo định nghĩa thông kê:
n là số lần thực hiện phép thử
m là số lần xuất hiện biến cố A
6
n
m A
P
n
lim
)(
Trang 73.2 Đại lượng ngẫu nhiên và luật phân bố xác suất của đại lượng ngẫu nhiên
1 Khái niệm đại lượng ngẫu nhiên
nó nhận một giá trị có thể trong tập giá trị hay trong một khoảng trên trục
số với xác suất tương ứng của nó
Ký hiệu X = {x1, x2, x3, …, xn}
Phân loại:
khoảng xác định của nó
xác định của nó
7
Trang 82 Luật phân bố xác suất của ĐLNN và Hàm phân bố xác suất
8
Giá trị có thể của ĐLNN X 1 X 2 X 3 X… Xn Xác suất (P) P1 P2 P3 P… Pn
x
x x
X x
P x
Trang 92 Luật phân bố xác suất của ĐLNN và Hàm phân bố xác suất
f ( )
Trang 102
exp 2
1 )
f
m x
x
Trang 11x1) Đồ thị luân đi lên
2 F(x) là hàm nghịch biến không tăng trên toàn trục số x2≥ x1 thì F(x2) ≤ F(
x1) Đồ thị luân đi xuống
3 F(x) = P(X≤ x) liên tục trái tại mỗi
o o
x
x
o o
x
x
Trang 124 Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN)
12
1: Kỳ vọng toán của ĐNN là mô men gốc bậc nhất của hàm
i
i p x x
1
) (
n
1
Trang 134 Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN)
13
3 Hệ số thiên lệch
Đồ thị hàm mật độ có thể đối xứng(như phân bố chuẩn) hoặc không đối xứng quanh trục tung có gốc là kỳ vọng tính đối xứng được đánh giá momen bậc ba:
+ Đối với ĐLNN liên tục
+Đối với ĐLNN rời rạc
Hệ số thiên lệch ký hiệu Cs
dx x f m
x s
C
Trang 144 Các đặc trưng biểu thị của đại lựng ngẫu nhiên (ĐLNN)
+ Đối với ĐLNN rời rạc
- Khoảng lệch quân phương
- Hệ số phân tán: là đặc trưng không thứ nguyên biểu thị độ phân tán của
ĐLNN so với kỳ vọng ký hiệu Cv
dx x
f m
1
i c
m
Trang 154 Các đặc trưng biểu thị của đại lựơng ngẫu nhiên (ĐLNN)
15
3 Hệ số thiên lệch
Đồ thị hàm mật độ có thể đối xứng(như phân bố chuẩn) hoặc không đối xứng quanh trục tung có gốc là kỳ vọng tính đối xứng được đánh giá momen bậc ba:
+ Đối với ĐLNN liên tục
+Đối với ĐLNN rời rạc
Hệ số thiên lệch ký hiệu Cs
Trang 163.3 Khái niệm về mẫu và tổng thể,
phương pháp chọn mẫu
thể nhận được là lớn vô cùng Tập hợp tất cả các giá trị mà ĐLNN X có thể nhận được gọi là tổng thể Ký hiệu: N
cả các giá trị của tổng thể mà chỉ NC trên một tập giá trị với số lượng rất nhỏ Tập hợp hữu hạn các
số liệu thu thập được của tổng thể gọi là mẫu
Ký hiệu: n
16
Trang 173.3 Khái niệm về mẫu và tổng thể,
phương pháp chọn mẫu
o Tính đại biểu : mẫu được chọn có những tính chất của tổng thể Muốn vậy, dung lượng mẫu phải đủ lớn đảm bảo sai số lấy mẫu; mẫu phải bao gồm các giá trị số đặc trưng lớn, nhỏ và trung bình
o Tính độc lập: các số liệu của mẫu không phụ thuộc lẫn nhau
o Tính đồng nhất: cùng loại, cùng nguyên nhân hình thành hoặc cùng điều kiện xuất hiện
17
Trang 183.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
Trong thống kê toán thường chỉ thu được hữu hạn các gía
trị của ĐLNN (mẫu có dung lượng n) tức là thu được các giá trị rời rạc từ tổng thể mặc dù ĐLNN có thể là liên tục
Do vậy có thể dùng các công thức định nghĩa của ĐLNN
rời rạc để tính toán Các hiện tượng thủy văn là ĐLNN liên tục, các giá trị thu được rời rạc vì vậy trong thủy văn qui
ước cách gọi riêng: Xác suất gọi là Tần suất và theo đó có Hàm mật độ xác suất-Hàm mật độ tần suất; Hàm PPXS-
Hàm tần suất tích lũy
18
Trang 19
19
dùng trong Thủy văn
Hàm phân bố xác suất F(x) là xác suất để cho đại lượng ngẫu nhiên X nhận các giá trị lớn hơn hoặc bằng một giá trị x, trong đó x là biến số nhận các giá trị có thể trên miền xác định của nó
F(x) = P(X x)
Trang 203.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
Trang 213.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
F x
x
Trang 223.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
X x
P x
f
Hàm mật độ xác suất
Trang 233.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
f(x)
Đồ thị hàm mật độ xác suất dạng quả chuông
Trang 243.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
Đặc điểm của đồ thị hàm mật độ xác suất
Hoàn toàn nằm trên trục hoành
Hình dạng đồ thị hàm mật độ tần suất có dạng hình quả
chuông
Hàm mật độ xác suất nhận trục 0x làm tiệm cận ngang
Có một giá trị cực đại
24
Trang 253.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
Trong thống kê toán học, thường chỉ thu được mẫu có dung lượng n (rời rạc)
Mẫu n đó được coi là đại lượng ngẫu nhiên rời rạc
F(xi) = P(X xi) Được gọi là hàm tần suất luỹ tích
Đồ thị của nó thường được gọi là “đường tần suất”
25
Trang 263.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
Trang 273.4 Hàm tần suất luỹ tích và hàm mật độ tần suất
Hàm phân phối xác suất Hàm tần suất luỹ tích
Trang 28Sự khác nhau giữa tần suất và xác suất?
28
Trang 29
3.5 Ước lượng các tham số thống kê
29
1 Tham số biểu thị xu thế tập trung
- Số đông (Xđ): là trị số có xác suất xuất hiện lớn nhất(tương ứng với giá trị cực đại của hàm mật độ tần suất)
-Trị số trung bình: là ước lượng không chệch của kỳ vọng toán của đại lượng ngẫu nhiên(n là dung lượng mẫu)
x
1
1
Trang 303.5 Ước lượng các tham số thống kê
30
2 Tham số biểu thị xu hướng phân tán
- Khoảng lệch quân phương x:
1
x
x k
k n
Trang 313.5 Ước lượng các tham số thống kê
C n
k
C x n
x x
3 (
) 1 (
) )(
3 (
) (
3 1
3
3 1
3
Trang 323.5 Ước lượng các tham số thống kê
X0 của trạm A???
Trang 333.5 Ước lượng các tham số thống kê
33
n
x x
n
C v x
1
6
v v
1 6 100
s
n C
Trang 343.6 Tần suất kinh nghiệm và đường TSKN
34
lượng ngẫu nhiên X nhận giá trị lớn hơn hoặc bằng x được ước lượng từ mẫu (chuỗi số liệu thực đo)
n
m x
X
P ( i )
Trang 353.6 Tần suất kinh nghiệm và đường TSKN
35
Các công thức kinh nghiệm tính tần xuất thường dùng trong thuỷ văn:
Dạng tổng quát:
Công thức Hazen (a=0,5):
Công thức Chegôđaép (a=0,3):
Công thức Weibull (a=0):
a n
a
m x
X
2 1
5 ,
0 )
(
n
m x
, 0
3 ,
0 )
X
%
100 1
X
Trang 363.6 Tần suất kinh nghiệm và đường TSKN
36
của biến ngẫu nhiên
- Đường tần suất kinh nghiệm: là băng điểm điểm biểu diễn tần suất
xuất hiện của đại lượng ngẫu nhiên nhận giá trị X ≥ xi , Tần xuất được tính theo các công thức kinh nghiệm
- Đường tần suất lý luận:Đường cong trơn phù hợp với đường tần
xuất kinh nghiệm gọi là đường tần suất lý luận Đường tần suất lý
luận là đồ thị hàm phân phối xác suất.
Trang 373.6 Tần suất kinh nghiệm và đường TSKN
37
Cách vẽ đường tần suất kinh nghiệm:
1 Sắp xếp chuỗi số liệu từ lớn đến nhỏ (đánh số thứ tự)
2 Tính tần suất theo 1 trong 3 công thức kinh nghiệm với
m là số thứ tự, n là số số liệu thống kê
3 Chấm các điểm P ~ xi (điểm kinh nghiệm)
Trang 383.6 Tần suất kinh nghiệm và đường TSKN
Trang 393.6 Tần suất kinh nghiệm và đường TSKN
39
Cách vẽ đường tần suất kinh nghiệm:
1000 1200 1400 1600 1800 2000 2200 2400
Trang 403.6 Tần suất kinh nghiệm và đường TSKN
40
Giấy tần suất (Giấy Hazen):
FFC 2008 © Nghiem Tien Lam
© FFC 2008
Trang 413.7 Đường Tần suất lý luận
41
Đường tần suất kinh nghiệm chỉ phản ánh được quy luật phân bố xác suất của hiện tượng thuỷ văn trong phạm vi các giá trị thực nghiệm
Đường tần suất lý luận là đồ thị một hàm phân bố xác suất toán học mô tả phân bố xác suất của đại lượng ngẫu nhiên nhằm ngoại suy các giá trị nằm ngoài các giá trị thực nghiệm
Trang 423.7 Đường Tần suất lý luận
a
e a
x y
C e
)(
)1(
Trang 43
43
• d: bán kính lệch (khoảng cách giữa trị số bình quân và
số đông)
• a: khoảng cách từ vị trí số đông đến giá trị nhỏ nhất
•Đồ thị của hàm phân phối Pearson III được gọi là đường
tần suất lý luận Pearson III (P-III)
d
x C
C a
s
v
Trang 443.7 Đường Tần suất lý luận
•d>0: lệch dương (đỉnh của hàm mật độ nằm bên trái trị số bình quân)
•d<0: lệch âm (đỉnh của hàm mật độ nằm bên phải trị số bình quân)
•d=0: đỉnh của hàm mật độ trùng với vị trí số bình quân
0
k - 1
2Cv Cs
C x
Trang 453.7 Đường Tần suất lý luận
45
Hàm phân bố xác suất Pearson III
Hàm PPXS Pearson III F(X≥ x) được xác định bằng cách lấy tích
phân hàm mật độ Việc tích phân trực tiếp hàm mật độ rất khó
Trong thực hành tiến hành lập bảng tính (Xp ῀ P) theo công thức
Với p tra bảng Fôxtơ – Rưpkin (phụ lục 1) phụ thuộc Cs và P.
x C
Trang 463.7 Đường Tần suất lý luận
Trang 473.7 Đường Tần suất lý luận
Bảng tính đường tần suất lý luận
Trang 483.7 Đường Tần suất lý luận
48
Luật phân bố xác suất Kritxki - Menken
Điều kiện xây dựng:
Lấy dạng hàm P-III với Cs = 2Cv làm cơ sở, xây dựng hàm mật độ Với a, b: hằng số
b a
x
e x
) (
1 x
Trang 493.7 Đường Tần suất lý luận
49
Luật phân bố xác suất Kritxki - Menken
Điều kiện xây dựng:
Lấy dạng hàm P-III với Cs = 2Cv làm cơ sở, xây dựng hàm mật độ Với a, b: hằng số
b a
x
e x
) (
1 x
p
Trang 50Phân biệt P-III với K-M?
50
2 hàm phân bố đều có dạng hình quả chuông có một số
đông và đều dùng 3 đặc trưng thống kê: Xtb, Cv, Cs
Khi Cs = 2Cv đường tần suất trùng nhau
2 hàm đều có tiệm cận với trục hoành khi x +, đầu
kia bị chặn tại x0 Với P-III, x0 có thể âm hoặc dương Với K-M, x0 = 0
Trang 513.7 Ảnh hưởng của tham số thống kê
51
1 Hệ số trung bình Xtb
Trang 523.8 Ảnh hưởng của tham số thống kê
52
2 Hệ số phân tán Cv
Trang 533.8 Ảnh hưởng của tham số thống kê
53
3 Hệ số thiên lệch Cs
Trang 543.9 Phương pháp vẽ đường tần suất lý luận
54
1 Phương pháp đường thích hợp
Trang 553.9 Phương pháp vẽ đường tần suất lý luận
55
2 Phương pháp 3 điểm
2 3
1
3 1
2 3
x x
x S
3 1
3 1
Trang 563.10 Phân tích tương quan tuyến tính
56
1 Khái niệm chung Khi NC các hiện tương thủy văn thường gặp trường hợp tài liệu có được quá ngắn Phân tích các đặc
trưng Thủy văn thấy chúng có mối quan hệ:
1) Quan hệ hàm số: Hai chuỗi X, Y có quan hệ hàm số Y = f(X) Mỗi một giá trị X, xác định được giá trị Y
0 5 10 15 20 25
0 1 2 3 4 5 6 7 8
X Y
Trang 573.10 Phân tích tương quan tuyến tính
57
0 2 4 6 8 10 12 14 16
9400 9450 9500 9550 9600 9650 9700 9750 9800
Qb (m3/s) Q(m3/s)
2) Không có quan hệ: Không tìm
được mối liên hệ nào giữa X và Y
3) Quan hệ tương quan: Tập hợp
nhiều số liệu thì quan hệ giữa X
và Y có tính quy luật và tạo thành
một xu thế nào đó
Trang 583.10 Phân tích tương quan tuyến tính
58
Đường hồi quy:
Giả sử có hai đại lượng X và Y có quan hệ thống kê với nhau, trong đó
Y là biến phụ thuộc còn X là biến độc lập Giả sử tiến hành n lần thí nghiệm hoặc quan trắc, sẽ nhận được n cặp số liệu như sau:
(x1, y1); (x2, y2); ; (xi, yi); ; (xn yn)
Yêu cầu thiết lập quan hệ tương quan tuyến tính giữa biến phụ thuộc Y theo biến độc lập X theo dạng tương quan thẳng (tương quan tuyến
tính)
Trang 593.10 Phân tích tương quan tuyến tính
59
0 1 2 3 4 5 6 7 8 9 10
Trang 603.10 Phân tích tương quan tuyến tính
60
a Xác định phương trình hồi quy tuyến tính bằng giải tích
yi - y = yi – (b0+b1xi) Theo phương pháp bình phương tối thiểu, muốn cho đường thẳng phối hợp tốt nhất thì tổng bình phương của khoảng lệch phải nhỏ nhất, nghĩa là:
1
i y ) (y y i b b x i
Trang 613.10 Phân tích tương quan tuyến tính
61
a Xác định phương trình hồi quy tuyến tính bằng giải tích
Giải hệ trên ta có nghiệm:
(
0
)) (
(
1
2 1
0 0
2 1
0
b
x b b
y
b
x b b
y
i i
i i
i i
) x (x
)]
x (x
) y [(y
1
b
x )
x (x
)] x )(x
y [(y
y b
2 i
i i
Trang 623.10 Phân tích tương quan tuyến tính
62
Thay b0, b1 vào được pt hồi quy tuyến tính Y theo X
Phương trình hồi quy tuyến tính X theo Y
Trang 633.10 Phân tích tương quan tuyến tính
63
a Xác định phương trình hồi quy tuyến tính bằng giải tích
Hệ số tương quan r biểu thị mức độ tương quan chặt chẽ giữa hai
biến X và Y
r được tính theo công thức sau:
Hoặc
Giá trị 0 ≤ r ≤ 1 Đối với hiện tượng thuỷ văn, hai đại lượng X và Y
được coi là có quan hệ chặt chẽ với nhau khi
i i
) x (x
)]
x )(x
y
[(y r
y
y k
x
x k
k
i yi
i xi
i y
1
1 1
2 2
i x
i x i
y
) (k
)]
)(k [(k
r
Trang 643.10 Phân tích tương quan tuyến tính
64
a Xác định phương trình hồi quy tuyến tính bằng giải tích
Phương trình hồi quy viết gọn theo hệ số tương quan:
Với:
1 n
) x (x
σ
n
1 i
2 i
) y (y
σ
n
1 i
2 i
Trang 653.9 Phân tích tương quan tuyến tính
65
b Xác định phương trình hồi quy tuyến tính bằng đồ giải
1 Chấm điểm quan hệ thực nghiệm giữa hai đại lượng X và Y
2 Qua trung tâm nhóm điểm quan hệ kẻ đường thẳng sao cho phù
hợp nhất với các điểm kinh nghiệm và coi đường đó là đường
Trang 663.9 Phân tích tương quan tuyến tính
66
b Xác định phương trình hồi quy tuyến tính bằng đồ giải
Đường hồi quy xác định bằng phương pháp giải tích
Trang 673.10 Phân tích tương quan tuyến tính
67
Bài tập thực hành:
Lưu vực A tiến hành đo đạc Q từ (1990 – 2000) Lưu vực B tương tự liền kề tiến hành đo đạc Q từ (1990 – 2003) Kéo dài dòng chảy năm lưu vực A từ số liệu lưu vực B theo phương pháp tương quan
Trang 68Câu hỏi thảo luận chương 3
68
1 Phân biệt khái niệm xác suất và tần suất
2 Khái niệm về đại lượng ngẫu nhiên, mẫu, tổng thể, nguyên tắc chọn
mẫu
3 Khái niệm phân bố tần suất đại lượng ngẫu nhiên rời rạc, mật độ tần
suất (liên tục), đường tần suất kinh nghiệm, lý luận, các hàm phân bố PIII và K-M
4 Các công thức tính tần suất kinh nghiệm
5 Các tham số thống kê và ảnh hưởng của tham số thống kê đến đường
tần suất, ứng dụng
6 Các phương pháp vẽ đường tần suất
7 Khái niệm về tương quan thống kê, đường hồi quy, cách xác định, hệ số
tương quan