Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 21 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
21
Dung lượng
467,84 KB
Nội dung
1 nguyễn hữu khải phân tích thống kê trong thuỷ văn Nhà xuất bản đại học quốc gia hà nội 2 Mục lục Nội dung Trang Lời nói đầu Chơng 1. mở đầu 1.1. Khái niệm chung 1.2. Cơ sở áp dụng phơng pháp thống kê trong thuỷ văn 1.3. Một số khái niệm thống kê cần biết trong thuỷ văn. 1.4. Lợc sử phát triển của thống kê thuỷ văn 1.5. Câu hỏi và bài tập chong 2. phân tích tần suất 2.1. Đờng tần suất kinh nghiệm 2.2. Giấy xác suất (giấy tần suất). 2.3. Đờng tần suất lý luận 2.4. Phơng pháp xây dựng đờng tần suất 2.5. Tổ hợp tần suất 2.6. Câu hỏi và bài tập chơng 3. Kiểm định các giả thiết thống kê 3.1. Khái niệm 3.2. Kiểm định các giả thiết thống kê 3.3. Ước lợng các thông số thống kê 3.4. Câu hỏi và bài tập chơng 4. Phân tích tơng quan 4.1.Khái niệm 4.2. Tơng quan tuyến tính 2 biến 4.3. Tơng quan tuyến tính nhiều biến 4.4. Các quan hệ tơng quan khác 4.5. Câu hỏi và bài tập chơng 5. Phân tích chuỗi thời gian 5.1. Khái niệm 5.2. Lọc và làm trơn chuỗi thời gian thuỷ văn 5.3. Phân tích chuỗi thời gian 5.4. Mô phỏng chuỗi thời gian 5.5. Câu hỏi và bài tập 4 5 5 6 8 19 20 22 22 25 28 54 58 65 68 68 69 87 96 99 99 100 117 127 135 137 137 141 151 168 172 3 tµi liÖu tham kh¶o phô lôc Phô lôc ch¬ng 2 Phô lôc 2.1 Phô lôc 2.2 Phô lôc 2.3 Phô lôc 2.4 Phô lôc 2.5 Phô lôc 2.6 Phô lôc 2.7A Phô lôc 2.7B Phô lôc 2.8 Phô lôc 2.9 Phô lôc 2.10 Phô lôc ch¬ng 3 Phô lôc 3.1 Phô lôc 3.2A Phô lôc 3.2B Phô lôc 3.3 175 177 178 178 186 188 190 198 199 202 203 204 205 207 209 209 210 211 212 221 4 Lời nói đầu Thống kê toán học đợc ứng dụng trong nhiều lĩnh vực khoa học, trong đó có thuỷ văn. Tuy nhiên, thuỷ văn học vận dụng các nguyên lý toán thống kê theo những phơng pháp riêng và phát triển theo một hớng riêng. Vì vậy một giáo trình về các phơng pháp thống kê trong thuỷ văn là rất cần thiết cho công tác giảng dạy, học tập và nghiên cứu khoa học. Giáo trình này không trình bày lại những phần lý thuyết đã có trong nhiều giáo trình về xác suất và thống kê toán học của ĐHQG Hà Nội, mà chỉ nhắc lại một số phần thực sự cần thiết và tập trung vào vấn đề phân tích các quan hệ thống kê của chuỗi số liệu thuỷ văn. Giáo trình gồm 5 chơng. Đó là: Chơng 1: Mở dầu; Chơng 2: Phân tích tần suất; Chơng 3: Kiểm định các giả thiết thống kê; Chơng 4: Phân tích tơng quan và chơng 5: Phân tích chuỗi thời gian thuỷ văn. Do chơng trình đào tạo sau đại học không có phần thống kê thuỷ văn nên trong giáo trình đề cập thêm những nội dung sâu hơn nh tổ hợp tần suất, tơng quan phi tuyến và hàm trực giao, phân tích hàm cấu trúc, mô phỏng chuỗi thời gian và một số giải thích sâu hơn cho những nội dung đã trình bày. Những phần này đợc in nghiêng với cỡ chữ nhỏ hơn. Chúng không là yêu cầu bắt buộc đối với sinh viên đại học, nhng có thể bổ sung nâng cao cho các sinh viên hệ cử nhân khoa học tài năng và chất lợng cao, cũng nh làm tài liệu tham khảo cho các học viên cao học, nghiên cứu sinh và cán bộ nghiên cứu trong thuỷ văn và các ngành khác có liên quan. Các hình vẽ và công thức trong giáo trình thuộc phần lý thuyết đợc sao chụp từ các tài liệu tham khảo. Tác giả chân thành cảm ơn các bạn đồng nghiệp đã đóng góp ý kiến về kết cấu và nội dung của giáo trình, cảm ơn các sinh viên ngành thuỷ văn trong quá trình thực hiện một số lớn bài tập trong giáo trình, cảm ơn Khoa Khí tợng Thuỷ văn và Hải dơng học, Trờng Đại học Khoa học Tự nhiên và ĐHQG Hà Nội đã tạo điều kiện thuận lợi cho việc xuất bản giáo trình này. Giáo trình đợc biên soạn lần đầu nên không tránh khỏi những thiếu sót, rất mong đợc sự góp ý của bạn đọc. Tác giả 5 Chơng I mở đầu 1. 1. Khái niệm chung Các hiện tợng thuỷ văn chịu tác động của nhiều nhân tố, nhng chúng ta không có khả năng phân tích đầy đủ mức độ ảnh hởng của mỗi nhân tố đến sự hình thành của các hiện tợng này. Mô tả toán học các hiện tợng thuỷ văn và mối quan hệ giữa chúng không thể hoàn toàn bằng con đờng vật lý-toán mà nhiều khi phải thông qua số liệu quan trắc, tức là áp dụng phơng pháp thống kê. Ví dụ dòng chảy hình thành do các nhân tố khí tợng và mặt đệm. Các nhân tố khí tợng bao gồm ma, bốc hơi, nhiệt độ, độ ẩm v.v., các nhân tố này có sự phân bố rất khác nhau theo thời gian, không gian, giữa chúng lại có mối liên hệ chi phối lẫn nhau. Các nhân tố mặt đệm gồm có kích thớc, hình dạng lu vực, mạng lới sông, độ dốc sông và lu vực, điều kiện địa chất và địa chất thuỷ văn, độ ẩm lu vực, hệ thống hồ ao, đầm lầy v.v., giữa chúng cũng có mối liên hệ tơng hỗ. Làm sáng tỏ mối quan hệ này chỉ có thể thực hiện bằng phơng pháp thống kê. Trong phơng pháp thống kê ngời ta tập trung sự chú ý đến bản thân các kết quả quan trắc hơn là đến các quá trình vật lý tạo ra chúng. Thống kê là một khoa học mô tả chứ không phải là khoa học về nhân quả. Số liệu của các đại lợng thuỷ văn thu thập đợc thờng là không liên tục, mà phân bố rời rạc theo từng thời khoảng, tập hợp của chúng theo thời gian tạo thành một chuỗi thuỷ văn. Chuỗi số liệu thuỷ văn thu thập đợc chỉ là một phần nào đó (mẫu) của toàn bộ (tổng thể) quá trình của nó theo thời gian. Sự phân bố của chuỗi thuỷ văn khác nhau tuỳ theo tính chất địa vật lý của từng khu vực cụ thể. Các đặc trng tính toán theo mẫu tại một vị trí cha phản ảnh đầy đủ quy luật dao động của chúng theo không gian và thời gian. Điều này làm ảnh hởng đến các bài toán tiếp theo nh tính toán hay dự báo thuỷ văn phục vụ công trình dân sinh kinh tế. Vì vậy phải xử lý số liệu, xác định các phơng trình toán học mô phỏng quy luật dao động của chúng làm cơ sở cho bài toán ngoại suy. Các phơng pháp thống kê áp dụng vào thuỷ văn có một số đặc điểm cần lu ý do tính chất đặc thù của các hiện tợng thuỷ văn. Thứ nhất, đó là nguồn thông tin về chúng có hạn, và chúng ta không có khả năng tăng đáng kể lợng thông tin này. Do vậy phải chọn mô hình toán học thích hợp thoả mãn tốt nhất số liệu thực nghiệm, ớc lợng các thông số của nó để có thể tăng nhân tạo lợng thông tin từ chuỗi số liệu ngắn sang chuỗi dài hơn. Bằng cách thử lựa một phân bố xác suất cho vừa khớp với số liệu thuỷ văn, rất nhiều thông tin thống kê của mẫu có thể tổng kết một cách cô đọng trong hàm số và trong các thông số của hàm. Các thông số thống kê cho ta những thông tin thiết yếu của một tập số liệu thu gọn một dãy số thành một tập nhỏ hơn. Chúng là các số đặc trng của tổng thể. Đó là các thông số kì vọng m x , phơng sai 2 , hệ số biến đổi C v , hệ số bất đối xứng (hay thiên lệch) C S và đôi khi có cả hệ số nhọn (hay tù) C e . Nhng chúng ta không biết trớc mô hình nào là phù hợp với đại lợng 6 đang xét, hơn nữa cũng không có thêm thông tin nào về dạng hàm toán học mô phỏng ngoài chuỗi số liệu quan trắc, trong khi chuỗi số liệu lại thờng không đủ dài. Vì thế lựa chọn dạng hàm mô phỏng thờng phải dựa vào một số quan điểm chung nào đó, hoặc thử dần dựa trên một số tiêu chuẩn. Mức độ phù hợp giữa hàm mô phỏng và số liệu thực nghiệm sẽ đợc đánh giá bằng cách so sánh chúng với nhau dựa vào các chỉ tiêu thống kê. Khi đã xác đinh đợc hàm toán học phù hợp thì việc đánh giá độ chính xác, độ tin cậy và độ ổn định của các thông số theo tập hợp mẫu thu thập lại rất quan trọng, nó quyết định các kết quả tính toán tiếp theo. Ngoài ra các hiện tợng thuỷ văn có quan hệ với các nhân tố ảnh hởng ở các mức độ khác nhau. Có thể thông qua mối quan hệ này để bổ sung các thông tin về hiện tợng thuỷ văn nghiên cứu và kéo dài chuỗi số liệu, từ đó làm tăng độ chính xác của các thông số thống kê. Cần đánh giá mức độ ảnh hởng và mối quan hệ này bằng các tiêu chuẩn thống kê. Đặc điểm thứ hai là sự đồng nhất của chuỗi số liệu thu thập. Do các nguyên nhân chủ quan hay khách quan, nh thay đổi thiết bị và phơng pháp hay vị trí đo đạc, sự biến động của lu vực khi sử dụng đất hay xây dựng các hồ chứa, đa đến sự không đồng nhất của chuỗi số liệu. Xác định các đặc trng dựa trên chuỗi không đồng nhất sẽ dẫn đến những sai số đáng kể. Do đó trớc khi sử dụng các phơng pháp thống kê phải phân tích kỹ lỡng các thông tin ban đầu trên quan điểm đồng nhất về mặt vật lý và thống kê. Tuy nhiên thờng khó xác định nguyên nhân và mức độ phá vỡ tính đồng nhất của chuỗi nên cần thiết sử dụng các tiêu chuẩn thống kê kết hợp với phân tích vật lý để đánh giá. Đặc điểm thứ ba là tồn tại một mối quan hệ nội tại trong các số hạng của chuỗi thuỷ văn. Chúng làm mất đi tính ngẫu nhiên của mẫu xem xét, làm giảm tính độc lập của các số hạng, thay đổi cấu trúc của chuỗi, dẫn tới làm tăng mức độ không ổn định của các ớc lợng thống kê. Tuy nhiên chuỗi thuỷ văn là một thể hiện của quá trình ngẫu nhiên và tuân theo những quy luật riêng. Các quy luật này đợc xác định thông qua phân tích chuỗi thời gian làm cơ sở cho việc chọn mô hình mô phỏng chúng. Giải quyết các bài toán thống kê liên quan đến việc xử lý một khối lợng tài liệu rất lớn, các tính toán phức tạp và cồng kềnh nên cần sử dụng máy tímh điện tử. Hiện nay nhiều máy tính có bộ nhớ lớn, tốc độ xử lý cao đã góp phần tích cực vào việc áp dụng phơng pháp thống kê trong thuỷ văn, đồng thời cũng cho phép cải tiến và phát triển các phơng pháp thống kê hơn nữa. Có nhiều sách và tài liệu về các phơng pháp thống kê [3,4,17,21,22,23,24,32]áp dụng trong các lĩnh vực toán học, vật lý, hoá học, sinh học, trong các ngành kỹ thuật, kinh tế. Do những đặc thù của hiện tợng thuỷ văn, việc áp dụng các nguyên lý thống kê có sự vận dụng riêng, sử dụng các mô hình toán riêng và đợc phát triển trên cơ sở dữ liệu thuỷ văn quan trắc. 1.2. Cơ sở áp dụng phơng pháp thống kê trong thuỷ văn Phơng pháp thống kê toán học đợc áp dụng trong nhiều lĩnh vực thuỷ văn học, nhng rộng rãi nhất là trong tính toán và dự báo dòng chảy sông ngòi. Cơ sở chính để áp dụng phân tích thống kê trong thuỷ văn là coi các đại lợng thuỷ văn là những đại lợng ngẫu nhiên. Kết quả tính toán cho thấy tỷ số phần trăm của số điểm thực nghiệm nằm trong khoảng từ trị số bình quân đến 32 ; ; xấp xỉ với tỷ số trong phạm vi tơng ứng 7 của phân bố chuẩn (70%; 95% và 100%) (bảng 1.1 [10]). Theo định lý giới hạn trung tâm của xác suất thì điều đó chứng tỏ rằng với dạng phân bố gần chuẩn nh vậy chuỗi có thể coi là ngẫu nhiên và độc lập. Bảng 1.1. Tỷ số phần trăm của số năm có lợng dòng chảy năm ở trong các khoảng 32 ; ; Tỷ số phần trăm TT Sông Trạm Số năm 2 3 1 Đà Hoà Bình 84 72,6 96,4 100 2 Lô Phù Ninh 79 68,6 94,9 100 3 Thao Yên Bái 80 66,3 96,3 100 4 Hồng Sơn Tây 87 67,8 96,6 100 5 Mekong Vientaine 62 72,6 96,8 100 6 TrờngGiang HánKhẩu 88 66,7 91,0 100 7 TùngHoa CápNhĩTân 56 66,1 96,5 100 8 Volga Aroxlap 53 69,8 94,3 100 Bảng 1.2. Hệ số tơng quan giữa các số hạng trong chuỗi dòng chảy Lu lợng lớn nhất năm Lu lợng trung bình năm TT Sông Trạm r 1 r 2 r 3 r 1 r 2 r 3 1 Hồng Sơn Tây -0,008 0,331 0,044 0,028 0,048 0,089 2 Đà Hoà Bình -0,069 0,288 0,040 0,043 0,060 0,081 3 Thao Yên Bái 0,067 0,089 0,158 0,076 0,057 -0,030 4 Lô Phù Ninh -0,068 0,071 0,099 0,117 0,082 0,007 5 Mekong Vientaine -0,033 0,035 0,092 0,245 0,178 0,187 6 TrờngGiang ThốnThan 0,140 0,040 0,120 0,210 0,040 -0,070 7 Tùng Hoa CápNhĩTân -0,030 0,190 0,020 0,360 0,400 0,260 8 TâyGiang Ngô Châu 0,040 0,060 0,020 Lợng dòng chảy các năm hầu nh không có liên hệ. Hệ số tơng quan của dòng chảy giữa các năm kề nhau, cách nhau 2, 3 năm rất nhỏ và sai số tơng quan rất lớn. Ví dụ chuỗi dòng chảy lớn nhất và dòng chảy trung bình của sông ngòi Việt Nam có hệ số tơng quan giữa các năm kề nhau khá nhỏ, xấp xỉ bằng 0, trên sông Mêkông tơng quan tuy có lớn hơn (r =0,2-0,3), nhng cũng không thực sự lớn (bảng 1.2 [10]). Luận điểm về tính ngẫu nhiên của các đại lợng thuỷ văn không thể chứng minh trọn vẹn, nhng các kết quả áp dụng cho dòng chảy sông ngòi đã chứng tỏ giả thiết đề ra là đúng đắn. Các luận điểm lý thuyết dùng làm cơ sở cho khả năng xem xét chuỗi các đại lợng thuỷ văn nh tập hợp các biến cố ngẫu nhiên đợc gọi là các định luật tới hạn của lý thuyết xác suất. Những luận điểm cơ bản đó dẫn tới luật số lớn và định lý giới hạn trung tâm. 8 Trong thực tế, chuỗi quan trắc thủy văn dù có dài bao nhiêu cũng chỉ là một mẫu trong tổng thể. Nếu ta lấy một chuỗi dòng chảy năm có thời gian quan trắc dài và chia thành các mẫu có dung lợng nhỏ, rồi vẽ đờng tần suất thì thấy các đờng tần suất gần giống nhau[10]. Điều đó chứng tỏ mẫu gần với quy luật của tổng thể. Nếu số năm quan trắc tăng đến một mức nào đó thì quy luật thống kê của mẫu bắt đầu thể hiện rõ rệt. Phân tích các chuỗi dòng chảy của nhiều trạm trên nhiều sông thấy có quy luật phân bố xác suất tơng tự. Nh vậy có thể phân tích quy luật phân bố mẫu thay cho tổng thể. Hoạt động kinh tế của con ngời có thể làm thay đổi dòng chảy, nếu chuỗi quá dài sẽ không đồng nhất. Nhng nếu quá ngắn sẽ không đảm bảo tính đại biểu và có trờng hợp không độc lập. Ví dụ[10] tại trạm Sơn Tây giai đoạn ít nớc từ 1954-1965 cho hệ số tơng quan tuyến tính khá lớn, r =- 0,53, chứng tỏ chuỗi không độc lập. Vì vậy chuỗi phải có tính đại biểu, tức là có độ dài thoả mãn, bao gồm đầy dủ những năm nhiều nớc, ít nớc và nớc trung bình. Dù muốn hay không, các hiện tợng thuỷ văn đều mang trong mình nó tính tất nhiên và ngẫu nhiên, đợc thể hiện với những mức độ khác nhau tuỳ nơi tuỳ lúc. Khi ta rút ra một số trị của chuỗi thuỷ văn thì kết quả phép rút số trị đó có thể coi là ngẫu nhiên. Nhng khi ta rút ra một chuỗi số liên tục (theo ý nghĩa thống kê, không phụ thuộc ý muốn con ngời) thì kết quả phép rút đó sẽ cho một chuỗi số trị có tính ngẫu nhiên và tất nhiên trên cả 2 chiều không gian và thời gian. Chúng ta không thể loại trừ đợc tính chu kỳ dòng chảy theo mùa, năm hay nhiều năm, tính phụ thuộc lẫn nhau, tính quán tính cũng nh tính ngẫu nhiên của chúng. Vấn đề đặt ra là phải phân tích lựa chọn để loại bớt hay kết hợp cả 2 thành phần này nhằm giải quyết hợp lý các bài toán cụ thể theo một đối tợng khai thác nguồn nớc tại một vùng lãnh thổ cụ thể. 1.3. Một số khái niệm thống kê cần biết trong thuỷ văn 1.3.1. Tổng thể và mẫu Tổng thể là tập hợp vô hạn tất cả các giá trị có thể nhận đợc của đại lợng ngẫu nhiên, có các đặc trng thống kê không đổi. Còn mẫu là một bộ phận hay một phần rút ra từ tổng thể. Số các giá trị của mẫu gọi là độ lớn hay dung lợng mẫu, ký hiệu là n. Các đặc trng thống kê của mẫu thay đổi tuỳ theo dung lợng mẫu và cách chọn mẫu. Sự sai khác giữa các đặc trng thống kê của mẫu so với tổng thể gọi là sai số lấy mẫu. Để giảm sai số lấy mẫu, trong thuỷ văn việc chọn mẫu phải đảm bảo các yêu cầu sau: - Đảm bảo tính đồng nhất, tức là mẫu đợc rút ra từ một tổng thể, đồng nhất cả về nguyên nhân hình thành và vị trí địa lý. Trong thực tế tính đồng nhất có thể bị vi phạm nếu chọn số liệu trong các thời kỳ quan trắc khác nhau khi có sự thay đổi điều kiện hình thành dòng chảy hay phơng pháp đo đạc. - Đảm bảo tính ngẫu nhiên và độc lập, tức là các số liệu phải là các biến cố ngẫu nhiên và độc lập. Nếu mẫu đợc chọn là dòng chảy lớn nhất năm hay trung bình năm thì đợc coi là ngẫu nhiên và độc lập, nhng nếu là dòng chảy mùa, tháng hay ngắn hơn thì không thể đảm bảo tính chất này. 9 - Đảm bảo tính đại biểu, tức là phải phản ánh quy luật chung của tổng thể. Muốn vậy mẫu phải đủ dài và bao gồm các thời ký nhiều nớc, ít nớc và trung bình nớc. - Phơng pháp chọn mẫu trong thuỷ văn Trong thuỷ văn thờng có các phơng pháp chọn mẫu sau [10,15,17,21]: 1). Mỗi năm chọn một trị số, ví dụ mỗi năm chọn một giá trị dòng chảy lớn nhất, nhỏ nhất hay trung bình. Tập hợp các trị số đợc chọn trong n năm cho ta một mẫu, khi đó dung lợng mẫu bằng số năm quan trắc. Chuỗi nh vậy gọi là chuỗi năm hay cực đại năm (annual maximum series-AM) 2). Chọn mỗi năm một số trị số lớn hơn một trị số định trớc. Tập hợp các trị số nh vậy cũng tạo thành một mẫu nhng có dung lợng lớn hơn số năm quan trắc. Chuỗi đó gọi là chuỗi thời gian riêng phần (Partial Duration series-PD) hay chuỗi vợt ngỡng (Peaks over a threshold-POT). Cách chọn mẫu này nhằm khắc phục trờng hợp mẫu ngắn, tuy nhiên trị số định trớc phải lựa chọn sao cho phù hợp, nếu quá nhỏ thì chuỗi sẽ dài nhng tính độc lập giảm, còn nếu quá lớn dung lợng mẫu sẽ quá nhỏ không đủ cho tính toán thống kê. Một điều quan trọng là chọn mẫu theo cách này khó bảo đảm rằng các số hạng trong chuỗi là độc lập, bởi vì sự xuất hiện của một trận lũ lớn có thể liên quan đến các điều kiện bão hoà ẩm đất đợc tạo ra bởi một con lũ lớn khác xẩy ra trớc đó không lâu. 3). Phơng pháp trạm năm, dựa trên sự tổng hợp số liệu quan trắc của nhiều trạm trên một khu vực đồng nhất về địa vật lý. Phơng pháp này đòi hỏi phải đảm bảo điều kiện đồng nhất và độc lập. Nghĩa là số liệu quan trắc tại các trạm phải độc lập và có đặc điểm địa vật lý đồng nhất. Điều này khó thực hiện vì đã độc lập thì ít khi đồng nhất hay ngợc lại, đã đồng nhất thì ít khi độc lập. Phơng pháp này đợc sử dụng khi chuỗi số liệu ngắn, khi tính lũ có xét đến lũ cực lớn với tần suất nhỏ. 1.3.2. Tần suất và tần suất luỹ tích a. Tần suất: Tỷ số của số lần xuất hiện một trị số nào đó chia cho tổng số lần thí nghiệm hay đo đạc: n m p (1.1) b. Tần suất luỹ tích: Là tỷ số giữa số lần xuất hiện một giá trị lớn hơn hay bằng trị số đã cho chia cho tổng số lần thí nghiệm hay đo đạc: n Sốthứtự n m P , (1.2) trong đó m là số lần xuất hiện những giá trị bằng hoặc lớn hơn trị số đã cho hay là số thứ tự của chuỗi đã sắp xếp từ lớn đến nhỏ. Nói cách khác tần suất luỹ tích là tổng các giá trị liên tiếp của các tần suất tính đến một điểm cho trớc: i j ji xfxFP 1 )()( (1.3) Từ đây khi viết n m P .100% hay viết gọn là tần suất thì ta hiểu là tần suất luỹ tích. 10 Ví dụ 1.1[10]: Cho 84 năm số liệu Q max của trạm Sơn Tây, tính tần suất và tần suất luỹ tích theo các cấp nh bảng 1.3. Bảng 1.3. Tần suất và tần suất luỹ tích Qmax trạm Sơn Tây TT Cấp Q max Tần số Tần suất Tần suất luỹtích 1 39000-36000 1 1,19 1,19 2 36000-33000 0 0,00 1,19 3 33000-30000 1 1,19 2,38 4 30000-27000 1 1,19 3,57 5 27000-24000 3 3,57 7,14 6 24000-21000 5 5,95 13,09 7 21000-18000 10 11,90 24,99 8 18000-15000 24 28,57 53,56 9 15000-12000 34 40,48 94,04 10 12000-9000 5 5,95 100,00 1.3.3. Hàm tần suất và hàm tần suất luỹ tích Quan hệ giữa các trị số x i đã cho và tần suất xuất hiện của nó gọi là hàm tần suất: )( i xfP (1.4) Quan hệ giữa các trị số x i đã cho và tần suất luỹ tích của nó gọi là hàm tần suất luỹ tích: i j ji xfxFP 1 )()( (1.5) Các hàm tơng ứng của tổng thể là giới hạn của các hàm trên khi n , gọi là hàm mật độ f(x) và hàm phân bố F(x): xXPxf )( , và x duufxXPxF )()( , (1.6) trong đó: x là biến ngẫu nhiên và u là biến hình thức. Giữa hàm mật độ và hàm phân bố có quan hệ: dx xdF xf )( )( (1.7) Tuy nhiên trong thuỷ văn thờng sử dụng hàm mức bảo đảm xác suất, còn gọi là xác suất vợt hay tần suất, kí hiệu là P(x). Khi đó có: x xFduufxXPxP )()()()( 1 (1.8) Đờng cong mức bảo đảm, hay đờng tần suất, là đờng biểu thị hàm mức bảo đảm xác suất P(x), có dạng nh hình 1.1.[26] [...]... 28 19 83 720 40 19 95 812 5 19 60 717 17 19 72 746 29 19 84 732 41 1996 905 6 19 61 920 18 19 73 918 30 19 85 735 42 19 97 856 7 19 62 737 19 19 74 6 91 31 1986 9 01 43 19 98 636 8 19 63 654 20 19 75 746 32 19 87 634 44 19 99 826 9 19 64 765 21 1976 689 33 19 88 537 45 2000 742 10 19 65 576 22 19 77 615 34 19 89 609 46 20 01 950 11 19 66 957 23 19 78 930 35 19 90 883 47 2002 788 12 19 67 655 24 19 79 616 36 19 91 682 48 2003 21. .. 9.5429E-05 19 59 18 10 1. 052326 0.052326 0.002738 0.00 014 33 7.4965E-06 19 60 15 90 0.924 419 -0 .07558 0.005 712 5 0.0004 318 3.2633E-05 19 98 19 50 1. 1337 21 0 .13 37 21 0. 017 8 813 0.0023 911 0.000 319 74 19 99 2240 1. 302326 0.302326 0.0 914 008 0.0276328 0.00835 41 2000 18 50 1. 0755 81 0.0755 81 0.005 712 5 0.0004 318 3.2633E-05 20 01 212 0 1. 232558 0.232558 0.0540833 0. 012 5775 0.002925 2002 216 0 1. 255 814 0.255 814 ... 1. 3.6 Các thông số thống kê mẫu Các công thức tính thông số trên viết cho một tổng thể hay mẫu dài có n rất lớn Khi mẫu ngắn người ta thường dùng các công thức tương ứng sau để hiệu chỉnh độ lệch: n ( xi n x )2 i 1 (Ki (1 .33a) i 1 n 1 1) 2 ( n 1) x Với số liệu phân nhóm thì: n fi ( x i x )2 n 1 C v n 1 ( K i 1) 2 n 1 i 1 n (Ki Cs (1 .33b) i 1 n 1 )3 i 1 3 ( n 1 )( n 2 ) C v (1 .3 4) (Ki... Huấn [3] Ví d 1. 3: Tính các đặc trưng thống kê cho dòng chảy trung bình năm trạm Hoà Bình sông Đà (1 95 6-2 00 2) (bảng 1. 7) Bảng 1. 7 Tính các đặc trưng thống kê dòng chảy năm trạm Hoà Bình sông Đà Năm Qnăm Ki=Qi/ Q Ki 1 ( K i 1) 2 ( K i 1) 3 ( K i 1) 4 19 56 18 00 1. 046 512 0.046 512 0.00 216 33 0.00 010 06 4.68E-06 19 57 14 20 0.8255 81 -0 .17 442 0.0304 218 0.00530 61 0.00092549 19 58 15 50 0.9 011 63 -0 .09884 0.0097688... 1) 3 i 1 (1 .35a) 3 ( n 3 )C v Với số liệu phân nhóm, Karl Pearson đưa ra quan hệ kinh nghiệm: Cs x xd (1 .35b) 1 n (xi x ) 4 n i 1 Ce ( n 1 )( n 2 )( n 3 ) 4 1 n ( K i 1) 4 n i 1 4 ( n 3) 2 C v (1 .3 6) 17 Nguyên tắc hiệu chỉnh độ lệch sẽ được trình bày trong chương III Một số thông số thống kê có thể tìm được bằng phần mềm Excel hoặc tham khảo chương trình trên ngôn ngữ Fortran của Phạm Văn. .. hay giảm dần Nếu số số hạng là lẻ (2 m+ 1) thì: xg = xm +1 1 Nếu số hạng là chẵn (2 m) thì: x g ( x m x m 1 ) 2 (1 .13 a) (1 .13 b) Trên đường tần suất số giữa là số ứng với tần suất 50% Nếu phân nhóm thì số giữa tính theo công thức gần đúng sau: xg trong đó: 12 n f )l ( 2 .C , L1 fg (1 .13 c) L1: Giới hạn dưới của cấp chứa số giữa; n: Tổng số số hạng chuỗi, ( f ) l : Tổng tần số tuyệt đối của...x P(x) x F(x) 0 10 20 30 40 50 60 70 80 90 10 0 P( %) Hình 1. 1 Đường tần suất Có thể phân biệt giữa F(x) và P(x) như trên hình 1. 1 Phần giới hạn phía dưới đường cong nhưng ở trên giá trị x là hàm P(x), còn phần nằm ở dưới giá trị x là hàm F(x) Sau này các hàm tần suất của các đường cong lí luận được viết dưới dạng P( x ) 1 F ( x ) Và hàm mật độ được ký hiệu bằng p(x) thay cho f(x) 1. 3.4 Độ lặp... ngẫu nhiên so với kỳ vọng mx của nó k 1 n ( x x )k n i1 (1 .2 7) Khi k=2, ta có mômen trung tâm bậc 2: 2 1 n ( x x )2 n i1 (1 .2 8) Khi k=3, ta có mômen trung tâm bậc 3: 3 1 n ( xi x )3 n i1 (1 .2 9) Khi k=4, ta có mômen trung tâm bậc 4: 4 1 n ( xi x ) 4 n i 1 (1 .3 0) Dĩ nhiên, mômen trung tâm bậc 0, cũng như mômen gốc bậc 0, là bằng 1, còn mômen trung tâm bậc 1 là bằng 0 Hiệu giữa giá trị đại lượng... hơn; C là độ rộng của mỗi cấp Theo ví dụ 1. 1 (bảng 1. 3) ở trên ta có L1 =12 000 m3/s; l =3 4-5 =29; u =3 4-2 4 =10 ; Từ đó ta được: xđ= 12 00 C=3000 29 3000 14 2 31 14 200 m3/s 29 10 Theo Karl Pearson [10 ] 3 số trung bình, số giữa và số đông có quan hệ: x xd 3( x x g ) b Đặc trưng biểu thị sự phân tán - Khoảng lệch: i= x i x (1 .1 5) (1 .1 6) 13 Khoảng lệch biểu thị sự phân tán của từng số hạng so với giá trị... tập: 1 Tính các đặc trưng thống kê của chuỗi dòng chảy trung bình năm trạm Yên Bái trên sông Hồng? Số liệu cho trong bảng 1. 8 Bảng 1. 8 Dòng chảy trung bình năm trạm Yên Bái sông Hồng từ năm 19 5 6-2 003 TT Năm TT Năm Q TT Năm Q TT Năm Q 1 20 Q 877 13 19 68 966 25 19 80 622 37 593 19 56 19 92 2 19 57 768 14 19 69 690 26 19 81 583 38 19 93 506 3 19 58 688 15 19 70 938 27 19 82 666 39 19 94 820 4 19 59 759 16 19 71 1290 . xn K n xx n i i n i i )( )( ) ( 1 1 1 2 1 2 1 (1 .33a) Với số liệu phân nhóm thì: 1 2 1 n xxf n i ii )( (1 .33b) n i iv K n C 1 2 1 1 1 )( (1 .3 4) 3 1 3 3 1 3 3 1 21 1 v n i i v n i i s Cn K Cnn K C )( )( ) )( ( )( . 3 1 3 3 1 3 3 1 21 1 v n i i v n i i s Cn K Cnn K C )( )( ) )( ( )( (1 .35a) Với số liệu phân nhóm, Karl Pearson đa ra quan hệ kinh nghiệm: d s xx C (1 .35b) 4 2 1 4 4 1 4 ) 3( ) 1( 1 )3 )( 2 )( 1 ( )( 1 v n i i n i i e Cn K n nnn xx n C . K i =Q i / Q 1 i K 2 1 )( i K 3 1 )( i K 4 1 )( i K 19 56 18 00 1. 046 512 0.046 512 0.00 216 33 0.00 010 06 4.68E-06 19 57 14 20 0.8255 81 -0 .17 442 0.0304 218 0.00530 61 0.00092549 19 58 15 50 0.9 011 63 -0 .09884