Giáo trình Phương pháp thống kê trong khí hậu: Phần 1

98 1 0
Giáo trình Phương pháp thống kê trong khí hậu: Phần 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Giáo trình Phương pháp thống kê trong khí hậu gồm có 7 chương và được chia thành 2 phần, phần 1 gồm có các chương: Chương 1 Một số kiến thức cơ bản của lý thuyết xác suất và ứng dụng trong khí tượng khí hậu; Chương 2 Các đặc trưng số của phân bố và vấn đề phân tích khảo sát số liệu; Chương 3 Một số phân bố lý thuyết; Chương 4 Kiểm nghiệm giả thiết thống kê trong khí hậu. Mời các bạn cùng tham khảo.

Đại học Quốc gia Hà Nội Trờng Đại học Khoa học Tự nhiên W X Phan Văn Tân Phơng pháp thống kê khí hậu Hà Nội - 1999 Lời nói đầu Khí hậu phận quan trọng điều kiện tự nhiên môi trờng Khí hậu có ý nghĩa định đến nhiều mặt hoạt động sản xuất đời sống Điều kiện khí hậu nhân tố tạo nên hình thành, tồn phát triển giới sinh vật, ảnh hởng quan trọng đến nhiều lĩnh vực kinh tế x hội nhân văn loài ngời Bởi vậy, nói đến miền đất ngời ta không nhắc tới điều kiện khí hậu Trong trình tồn phát triển, ngời phải tìm hiểu, nghiên cứu điều kiện tự nhiên môi trờng để nắm bắt đợc qui luật biến đổi với mục đích cải tạo, chinh phục khai thác Vì khí hậu đối tợng cần đợc tìm hiểu nghiên cứu Một phơng pháp đợc ứng dụng phổ biến nghiên cứu khí hậu phơng pháp xác suất thống kê Đây công cụ toán học đợc áp dụng rộng ri có hiệu nhiều lĩnh vực "Phơng pháp thống kê khÝ hËu" vËn dơng mét sè nguyªn lý cđa lý thuyết xác suất thống kê toán học, tính toán thông kê đặc trng khí tợng, khí hậu, giải số toán nghiên cứu qui luật, chất, đặc tính nh vấn đề liên quan đến cấu trúc trờng khí Nó cầu nối lý thuyết xác suất thống kê toán học khoa học khí quyển, môn học mang tính phơng pháp Hiện có nhiều tài liệu viết lý thuyết xác suất thống kê đợc lu hành Tuy vậy, cách tơng đối phân chia tài liệu làm hai loại Loại thứ thiên toán học, trình bày chặt chẽ lý thuyết xác suất dựa toán học trình độ cao Những tài liệu thờng dùng cho chuyên gia toán nên khó sinh viên nh số chuyên gia ngành khí tợng thuỷ văn Loại thứ hai bao gồm tài liệu thống kê chuyên ngành, chuyên gia thuộc nhiều lĩnh vực chuyên môn khác viết Đối với loại tài liệu này, tuỳ thuộc vào chuyên ngành mà nội dung khai thác kiến thức lý thuyết xác suất thống kê không quán Nói chung tài liệu thờng sâu số khía cạnh coi nhẹ phần khác, đặc biệt trọng trình bày ví dụ mang tính đặc thù chuyên ngành hẹp Điều gây không khó khăn cho việc ứng dụng chúng chuyên ngành khí tợng khí hậu Trớc tình hình đó, sách đợc biên soạn nh việc giải yêu cầu thúc bách thực tế Đúng với tên gọi "Phơng pháp thống kê khí hậu" nội dung sách trọng trình bày khía cạnh ứng dụng công cụ thống kê toán học vào chuyên ngành khí hậu Quyển sách đợc viết sở tập giảng mà tác giả đ dùng để giảng dạy cho sinh viên ngành khí tợng khí hậu trờng Đại học Tổng hợp Hà Nội, Đại học Quốc gia Hà Nội, nhiều năm gần Mục đích viết sách nhằm tạo cho sinh viên có đợc tài liệu thống trình tiếp thu môn học "Phơng pháp thống kê khÝ hËu" ë tr−êng Qun s¸ch cịng cã thĨ dùng làm tài liệu tham khảo bổ ích cho cán bộ, kỹ s thuộc ngành khí tợng khí hậu độc giả thuộc chuyên ngành gần gũi nh thuỷ văn, hải dơng trình làm công tác nghiên cứu ứng dụng nghiệp vụ Ngoài ra, độc giả khác có quan tâm đến lĩnh vực ứng dụng lý thuyết xác suất thống kê đọc khai thác Quyển sách đợc viết cho đối tợng đ đợc trang bị kiến thức toán cao cấp lý thuyết xác suất thống kê toán học dành cho sinh viên ngành khí tợng thuỷ văn Bởi vậy, trình trình bày, số khái niệm, định nghĩa đợc xem đ biết, chúng đợc nêu cách ngắn gọn mà không sâu chi tiết Mặt khác, bám sát mục tiêu chơng trình đào tạo đại học chuyên ngành khí tợng khí hậu, sách đợc viết dới hình thức giáo trình môn học Trừ phần mở đầu phụ lục, sách đợc bố cơc ch−¬ng: Ch−¬ng Mét sè kiÕn thøc lý thuyết xác suất úng dụng khí tợng khí hậu Chơng trình bày khái niệm lý thuyết xác suất phơng thức vận dụng chúng để giải số toán thờng gặp thực tế Chơng Các đặc trng số phân bố vấn đề phân tích khảo sát số liệu đây, trình bày đặc trng số quan trọng thờng đợc ứng dụng phân tích khảo sát nghiên cứu tập số liệu khí tợng khí hậu nh phơng pháp ớc lợng chúng Chơng Một số phân bố lý thuyết Trình bày phân bố xác suất lý thuyết thờng đợc ứng dụng nghiên cứu tợng khí toán kiểm nghiệm giả thiết thống kê khí hậu Chơng Kiểm nghiệm giả thiết thống kê khí hậu Chơng đề cập đến loạt toán liên quan đến vấn đề kiểm nghiệm giả thiết thống kê thờng gặp khí hậu, cách thức nêu toán bớc tiến hành kiểm nghiệm Chơng Phân tích tơng quan hồi qui trình bày phơng pháp xác định mức độ dạng thức liên hệ chuỗi số liệu khí tợng, khí hậu sở phơng pháp phân tích tơng quan hồi qui thống kê toán học, trọng phơng pháp nghiên cứu quan hệ tuyến tính biến đổi mối quan hệ phi tuyến dạng tun tÝnh Ch−¬ng ChØnh lý sè liƯu khÝ hËu Trên sở kiến thức phân tích tơng quan hồi qui, chơng trình bày phơng pháp xử lý ban đầu chuỗi số liệu khí hậu, phơng pháp giải vấn đề tồn chuỗi số liệu khí hậu chuỗi ngắn gián đoạn Ngoài nêu số phơng pháp xác định đặc trng chuỗi ngắn thông qua việc bổ khuyết kéo dài chuỗi Chơng Phân tích chuỗi thời gian Chơng trình bày số phơng pháp thông dụng nghiên cứu hai đặc tính chuỗi số liệu khí hậu tính xu tính chu kỳ, qua nhằm trang bị công cụ hữu hiệu cho việc giải nh÷ng nhiƯm vơ thêi sù cđa khÝ hËu hiƯn đại nghiên cứu biến đổi khí hậu Nhằm giúp cho ng−êi ®äc cã thĨ tiÕp cËn vÊn ®Ị mét cách nhanh chóng, tác giả đ cố gắng tuân thủ nguyên tắc trình bày sau phần lý thuyết có ví dụ minh hoạ gần sát với toán thực tế Tuy vậy, khuôn khổ sách có hạn, hệ thống tập không đợc đa vào mà dành cho sách khác Một số ví dụ không đợc trình bày chi tiết Mặt khác sách cha trọng đến nội dung liên quan với việc phân tích không gian, phân vùng lập đồ khí hậu Ngoài tài liệu đ đợc liệt kê danh mục tài liệu tham khảo, biên soạn sách tác giả tham khảo thêm tập giảng mà GSPTS Nguyễn Trọng Hiệu đ dùng để giảng dạy cho sinh viên ngành khí tợng khí hậu năm thập kỷ bảy mơi Đó nguồn t liệu quí giá giúp cho tác giả định hớng lựa chọn phơng pháp trình bày nội dung nh bố cục sách Trong trình biên soạn sách, tác giả đ nhận đợc ý kiến đóng góp quí báu đồng nghiệp thuộc Đại học Quốc gia Hà Nội; nhận đợc giúp đỡ tận tình, lời động viên chân thành ý kiến bổ sung mặt học thuật thành viên Hội đồng Khoa học khoa Khí tợng Thuỷ văn & Hải dơng học, trờng Đại học Khoa học Tự nhiên Nhân tác giả xin bày tỏ lòng biết ơn sâu sắc Đặc biệt tác giả xin chân thành cám ơn PGSPTS Nguyễn Văn Tuyên PGSPTS Nguyễn Văn Hữu, ngời đ đọc kỹ thảo sách cho nhận xét quí báu Do trình độ kinh nghiệm hạn chế, chắn sách khiếm khuyết định Tác giả hy vọng nhận đợc góp ý đồng nghiệp độc giả Hà Nội, tháng 01 năm 1999 Tác giả mở đầu Khi nghiên cứu tợng xảy khí ta cần phải quan sát nó, trắc lợng Hiện tợng đợc nghiên cứu nói chung luôn liên hệ với tợng khác mối phụ thuộc có tính nguyên nhân, tiến trình phụ thuộc vào vô số nhân tố bên Về nguyên tắc ta theo dõi đợc tất nguyên nhân xác định tiến trình tợng nghiên cứu thiết lập đợc tất mối liên hệ tợng xét với toàn yếu tố bên Ta thiết lập theo dõi đợc số định mối liên hệ tợng nghiên cứu với nhân tố khác, đơng nhiên vô số nhân tố cha đợc tính đến, chúng có tác dụng đến tiến trình tợng khảo sát Chính mà quan sát tợng nhiều lần, bên cạnh đặc điểm chung nhất, ta thấy lần tợng xuất với dáng vẻ khác nhau, mang đặc điểm riêng đặc trng cho lần quan sát Kết lần quan sát khác không hoàn toàn giống Chẳng hạn, trờng hợp lý tởng, đồng thời đo nhiệt độ không khí địa điểm vào thời ®iĨm nhÊt ®Þnh b»ng nhiỊu nhiƯt kÕ gièng nhau, cã thể nhận đợc trị số khác dao động xung quanh giá trị Sự khác phụ thuộc vào nhiều nhân tố khách quan, nh mức độ đồng nhiệt kế độ nhạy, độ xác, tác dụng xạ mặt trời, mặt đệm đến bầu nhiệt kế, Vì lẽ đó, nghiên cứu tợng cho trớc, ngời ta tách tất mối liên hệ thành hai loại: mối liên hệ xác định nét chung tiến trình tợng, mà quan sát chúng đợc lặp lặp lại nhiều lần, mối liên hệ thứ yếu có ảnh hởng khác đến tiến trình lần quan sát Các mối liên hệ xác định gọi tính qui luật tợng Các mối liên hệ thứ yếu làm cho kết quan sát tợng sai lệch khác so với qui luật lần quan sát Những sai lệch đợc gọi tợng ngẫu nhiên Mỗi mèi liªn hƯ thø u riªng biƯt nãi chung chØ ảnh hởng đến tiến trình tợng Tuy nhiên, có vô số mối liên hệ thứ yếu tác động nên ảnh hởng tổng cộng chúng có lại đáng kể, chí chúng xác định tất tiến trình tợng, làm cho tợng không tính qui luật rõ rệt Do tác dụng đồng thời mối liên hệ mèi liªn hƯ thø u nªn tÝnh qui lt tính ngẫu nhiên tợng luôn liên hệ mật thiết với nhau, gắn chặt với Vì tợng ngẫu nhiên đợc sinh vô số mối liên hệ thứ yếu tợng cần khảo sát nên, nguyên tắc, việc nghiên cứu chúng cách theo dõi tất mối liên hệ đợc Chúng ta nghiên cứu tợng ngẫu nhiên cách phát tính qui luật thân chúng Lý thuyết xác xuất ngành toán học nghiên cứu tính quy luật tợng ngẫu nhiên Để xác định đợc tính quy luật cần phải biết đợc đặc trng xác suất tợng ngẫu nhiên Muốn vậy, không cách khác phải trở với thực nghiệm Việc xây dựng đợc phơng pháp hợp lý để xử lý kết quan sát thực nghiệm nội dung lý thuyết thống kê Theo nghĩa đó, Phơng pháp thống kê khí hậu môn học vận dụng số nguyên lý lý thuyết xác suất thống kê toán học, tính toán thống kê đặc trng khí hậu, giải số toán nghiên cứu tợng khí hậu Nó môn học mang tính phơng pháp, cầu nối lý thuyết xác suất thống kê toán học khí hậu học Khí hậu trạng thái trung bình thời tiết Thời tiết trạng thái tức thời khí quyển, đợc qui định trình, đặc trng vật lý khí Nghiên cứu khí hậu xác định đợc qui luật diễn biến khí hậu theo không gian thời gian, thiết lập đợc mối liên hệ bên bên đặc trng yếu tố khí hậu, từ tiến hành đánh giá tài nguyên khí hậu, phán đoán biển đổi khí hậu giải toán dự báo khí hậu Trên sở chuỗi số liệu khí hậu Phơng pháp thống kê khí hậu vào tính hai mặt trình tợng khí hâụ tính quy luật tính ngẫu nhiên để: 1) Thống kê, tính toán ớc lợng trị số khí hậu; 2) Phán đoán kiểm nghiệm luật phân bố số đặc trng yếu tố khí hậu; 3) Phân tích mối liên hệ tơng quan hồi qui đặc trng yếu tố khí hậu; 4) Phân tích qui luật biến đổi chuỗi sè liƯu khÝ hËu; 5) ChØnh lý, bỉ sung c¸c chuỗi số liệu khí hậu Số liệu khí hậu, kết thực nghiệm việc quan sát tợng khí quyển, yếu tố quan trọng, cần thiết thiếu đợc việc sử dụng phơng pháp thống kê nghiên cứu khí hậu Thông thờng số liệu khí hậu đợc thành lập từ số liệu khí tợng Số liệu tợng số liệu thu thập đợc từ quan trắc khí tợng Nghĩa là: Quan trắc khí tợng Số liệu khí tợng Chuỗi số liệu khí hậu Quan trắc khí tợng đợc tiến hành để theo dõi xuất hiện tợng vật lý xảy khí quyển, đo đạc số tính chất vật lý khí cấu thành thời tiết Khi nghiên cứu tợng ngời ta thờng tiến hành khảo sát nhiều lần điều kiện nh nhằm mục đích giảm bớt tác động mối liên hệ thứ yếu, làm bật mối liên hệ để xác định qui luật tợng Chính việc quan trắc khí tợng nói chung đợc tiến hành địa điểm đợc chọn sẵn (là vị trí trạm khí tợng), vào thời điểm qui định (là kỳ quan trắc) theo thể thức bắt buộc (qui trình, qui phạm quan trắc) Các yếu tố đợc quan trắc phải mô tả đầy đủ trạng thái thời tiết Vị trí trạm quan trắc đợc lựa chọn cho bao quát đợc vùng không gian định Các kỳ quan trắc phải đợc ấn dịnh vào thời điểm điển hình, đủ để mô tả đợc biến trình thời gian yếu tố Việc tuân thủ qui trình, qui phạm quan trắc bảo đảm tính quán số liệu thu nhập đợc Kết quan trắc khí tợng cho ta tập số liệu đo đạc thực nghiệm tợng khí tợng, tính chất vật lý khí mô tả điều kiện thời tiết Từ tập số liệu này, phơng pháp chọn mẫu khác ngời ta thành lập chuỗi số liệu khí hậu Chuỗi số liệu khí hậu bé phËn cđa tỉng thĨ khÝ hËu Nã lµ bé phận mà ta có để từ tiến hành thống kê tính toán nhận định phán đoán Tổng thể khí hậu tập hợp thành phần đặc trng yếu tố khí hËu Tỉng thĨ khÝ hËu bao gåm nhãm: 1) Nhóm trị số đ xảy nhng không đợc quan trắc; 2) Nhóm trị số đ xảy đ đợc quan trắc; 3) Nhóm trị số cha xảy Số thành phần tổng thể vô hạn Tổng thể luôn bao quát đầy đủ sắc thái hình thù đặc trng yếu tố khí hậu Trên sở chuỗi số liệu khí hậu ta tiến hành xử lý, tính toán đặc trng tham số khí hậu, phân tích, phán đoán mô tả đặc điểm, tính chất, cấu trúc bên trong, tiến đến dự báo khí hậu Chất lợng tính toán phụ thuộc vào khả chuỗi (dung lợng mẫu độ dài chuỗi) Thông thờng thành phần chuỗi cách năm, nên số lợng năm quan trắc nhiều dung lợng mẫu lớn, kết tính toán đảm bảo độ ổn định thống kê phân tích, phán đoán xác Chơng Một số kiến thức lý thuyết xác suất úng dụng khí tợng khí hậu 1.1 Sự kiện, không gian kiện tần suất kiện 1.1.1 Phép thử kiện Các khái niệm lý thuyết xác suất phép thử kiện Phép thử đợc hiểu việc thực điều kiện xác định nghiên cøu mét hiƯn t−ỵng “PhÐp thư” cịng cã thĨ hiĨu thí nghiệm quan sát hay quan trắc, trắc lợng, xuất tợng Quan trắc khí tợng kiểu mô phép thử nh Kế phép thử kÕt cơc Mét phÐp thư cã thĨ cã nhiỊu kÕt cục Các kết cục đợc gọi kiện Ngời ta chia kiện thành kiện sở kiện phức hợp Trong trờng hợp đơn giản phân biệt đợc rõ ràng kiện sở kiện phức hợp Chẳng hạn kiện xúc xắc nhận mặt ta gieo kiện sở Nhng khí tợng khí hậu, việc phân chia kiện sở kiện phức hợp nhiều cần phải vào cách nhìn nhận vấn đề Chẳng hạn, quan tâm đến việc có giáng thuỷ hay không kiện ngày mai có giáng thuỷ ngày mai giáng thuỷ đợc xem kiện sở Song, xét thêm giáng thuỷ dạng lỏng hay rắn, kiện ngày mai có giáng thuỷ kiện phức hợp, đợc chia thành kiện sở: ngày mai có giáng thuỷ lỏng ma, ngày mai có giáng thuỷ rắn tuyết rơi chẳng hạn ngày mai có giáng thuỷ hỗn hợp lỏng rắn ma tuyết rơi Nếu xét đến lợng giáng thuỷ kiện trở thành kiện phức hợp, ta chia chúng thành kiện nhỏ hơn, chẳng hạn giáng thuỷ 10mm dới 10mm, v.v 1.1.2 Kh«ng gian sù kiƯn Kh«ng gian sù kiƯn, hay kh«ng gian mẫu, tập hợp tất kiện sở có Nh không gian mẫu biĨu diƠn mäi kÕt cơc hay sù kiƯn cã thĨ có Nó tơng đơng với kiện phức hợp lớn 12 Mối quan hệ kiện đợc mô tả hình học Thông thờng ngời ta biểu diễn không gian mẫu hình chữ nhật mà bên hình tròn biểu thị kiện Ví dụ hình 1.1a, không gian mẫu hình chữ nhật S biểu thị kết cục giáng thuỷ ngày mai Bốn kiện sở đợc mô tả phần bên ba hình tròn (đợc đánh số 1, 2, 3, 4) Hình tròn đứng độc lập tơng ứng với kiện giáng thuỷ Phần giao hai hình tròn lại biểu thị có giáng thuỷ hỗn hợp hai dạng (lỏng rắn), phần hình chữ nhật nằm hình tròn tơng ứng với kiện trống rỗng, xuất Tuy nhiên không thiết phải biểu diễn mối quan hệ kiện theo sơ đồ Th«ng th−êng ng−êi ta xem kh«ng gian sù kiƯn lÊp đầy toàn hình chữ nhật S mà kiện sở phủ vừa kín (hình 1.1b) Với cách biểu diễn hình chhữ nhật S đợc xem nh kiện phức hợp lớn nhất, chia thành miền không giao biểu thị kiện xung khắc với Chẳng hạn hình 1.1b, bốn miền không giao tơng ứng với bốn kiện sở đ nói Trong trờng hợp này, thiết bốn kiện phải xảy Mặt khác cần lu ý kiện sở biểu thị có giáng thuỷ ta thêm vào đờng phân chia để biểu diễn kiện nhỏ hơn, chẳng hạn lợng giáng thuỷ 10mm vµ d−íi 10mm S S 2 1 b) a) Hình 1.1 Sơ đồ biểu diễn không gian mẫu 1) Không có giáng thuỷ; 2) Giáng thuỷ lỏng; 3) Giáng thuỷ rắn; 4) Giáng thuỷ hồn hợp 1.1.3 Tần suất kiện Khi tiến hành phÐp thư, hiƯn t−ỵng cã thĨ xt hiƯn cịng cã thể không xuất Để đo độ chắn kiện tợng xuất hay tợng không xuất lần thử ngời ta sử dụng khái niƯm “x¸c st sù kiƯn” X¸c st cđa sù kiƯn A nằm khoảng từ đến 1: ≤P(A)≤1 (1.1.1) 13 Sù kiƯn cã x¸c st xt hiƯn b»ng øng víi sù kiƯn bÊt kh¶ V kiện có xác suất xuất øng víi sù kiƯn ch¾c ch¾n U, tøc P(V) = 0, P(U) = Theo định nghĩa cổ điển, xác suất kiện A tỷ số số kÕt cơc thn lỵi cho A so víi tỉng sè kết cục đồng khả Tuy nhiên, định nghĩa áp dụng đợc số kết cục đồng khả hữu hạn Để tính đợc xác suất sù kiƯn cho mét líp phÐp thư réng lín h¬n, ngời ta đa đa vào định nghĩa xác suất theo quan điểm thống kê Khái niệm đa tới định nghĩa khái niệm tần suất Giả sử tiến hành (trên thực tế) n phép thử loại nghiên cứu tợng Gọi A kiện tợng xuất gọi m số phép thử m đợc gọi tần st xt hiƯn sù kiƯn A quan s¸t thÊy A Khi tỷ số n loạt phép thử đ đợc tiến hành: p= m n (1.1.2) Trị số tần suất nói chung phụ thuộc vào số lợng n phép thử đợc tiến hành Khi n bé, tần suất thay đổi rõ rệt ta chuyển từ loạt n phép thử sang loạt n phép thử khác Tuy nhiên thực nghiệm chứng tỏ phạm vi rộng, tần suất có tính ổn định, nghĩa số phép thử n lớn trị số tần suất biến thiên xung quanh số xác định Ký hiệu xác suất kiện A P(A), theo định luật số lín ta cã: m  P − P(A ) ≤ ε  →  n  n → (1.1.3) số dơng bé tuỳ ý Khái niệm tần suất khái niệm mang tính trực giác, kinh nghiệm nhng có sở lý thuyết vững Nó đợc ứng dụng có hiệu để ớc lợng xác suất khí hậu Nếu gọi A kiện tợng khí hậu xuất hiện, n số lần quan sát tợng, m số lần xuất hiện tợng n lần quan sát p tần suất xuất hiện tợng Đại lợng p đợc dùng để ớc lợng giá trị xác suất xuất hiện tợng Ví dụ, từ số liệu ma ngày lịch sử 50 năm tháng trạm ngời ta quan sát thấy có có 487 ngày có ma Vậy xác suất xuất ma ngày tháng trạm đợc xác định trị số tần suất 487/(31 x 50) = 487/1550 = 0.314 14 f(u) uα u -5 -4 -3 -2 -1 H×nh 4.1 Xác định u Trong tài liệu thống kê toán học ngời ta thờng cung cấp bảng tính sẵn giá trị u ứng với khác (Bảng giá trị hàm Laplas (u)) Ta tra bảng để xác định Tuy nhiên, việc tra bảng nh vừa mang tính thủ công, thời gian lại vừa không thuận tiện Hiện nhờ có phơng tiện tính toán máy tính điện tử, trị số u thờng đợc xác định cách trực tiếp nhờ phần mềm thông dụng chơng trình giải phơng trình (4.3.4) Tóm lại, ta có bớc thực toán nh sau: 1) Từ tập số liệu ban đầu {x1, x2, , xn}, tính đại lợng x , u theo công thức (4.3.1) (4.3.3) 2) Chọn giá trị xác suất phạm sai lầm loại I () thích hợp xác định u cách tra bảng tính sẵn giải phơng trình (4.3.4) 3) So sánh u u để rút kết luận: Nếu u u bác bỏ Ho đa kết luận Nếu u < u chấp nhận Ho, tức chấp nhận giả thiết = Ví dụ 4.3.1 Số liệu nhiệt độ trung bình 100 năm trạm A Ttb100=25oC độ lệch chuẩn s100 = 1oC Vì mục ®Ých sư dơng ng−êi ta mn lÊy nhiƯt ®é trung bình thời kỳ 10 năm gần thay cho trung bình dài năm kể Sau tính toán ngời ta nhận đợc trị số trung bình chuỗi 10 năm Ttb10=24oC, khác biệt đáng kể so với trung bình dài năm Hỏi lấy Ttb10 làm giá trị trung bình nhiệt độ đại diện cho trạm A có đủ tiêu chuẩn không? Giải: Nếu ta coi số liệu nhiệt độ trung bình 100 năm tơng đơng với chuẩn khí hậu, tức ào=25oC =1oC, toán dẫn đến việc kiểm nghiệm giả thiết: Ho: Ttb10=Ttb100 99 Giả thiết nhiệt độ trung bình năm có phân bố chuẩn ta áp dụng kiểm nghiệm U để giải toán Ta u=(Ttb10−Ttb100)/(1/ 10 ) vµ thay sè vµo råi tÝnh ta nhận đợc: u = 24 25 / 10 có: n=10, đặt = 3.162 Nếu chọn =0.05 ta xác định đợc u=1.96 Ta thấy u >u, Ho bị bác bỏ ta kết luận số liệu trung bình 10 năm không đủ tiêu chuẩn đại diện cho trung bình khí hậu trạm A 4.3.2 So sánh hai kỳ vọng Bài toán: Cho hai biến ngẫu nhiên X, Y có phân bố chuẩn với n1 n2 trị số quan sát tơng ứng { x1 , x , , x n } vµ {y1, y2, , y n }, ®ã n1, n2 đủ lớn Biết phơng sai X Y tơng ứng 2x , 2y , 2x = y =2 Hy kiểm nghiệm kỳ vọng àx ày X Y Giải: Đặt giả thiết kiểm nghiệm là: H o: àx = ày Trên thực tế ta giá trị àx ày, nên thay vào ta sử dụng ớc lợng thống kê chúng trung bình số học x y x= Ta cã n1 n2 x t , y = ∑ yt ∑ n1 t =1 n t =1 (4.3.5) Khi giả thiết kiểm nghiệm đợc ®−a vỊ d¹ng: Ho: x = y Ho: x − y = Hay Víi giíi h¹n tin cËy ban đầu d đợc chọn ta có tiêu kiểm nghiệm là: Nếu x y d bác bỏ Ho Ngợc lại, x y < d chấp nhận Ho Tơng tự nh trớc đây, d đợc chọn cho Ho với xác suất phạm sai lầm loại I cho trớc ta cã: P( x − y ≥ d) = α 100 (4.3.6) Đặt u= xy , 1 + n1 n uα = d 1 σ + n1 n (4.3.7) ta cã thĨ ®−a (4.3.6) vỊ hƯ thức tơng đơng: P( u u) = Và tiêu kiểm nghiệm là: Nếu u u bác bỏ Ho Nếu u < u chấp nhận Ho Để xác định u cần phải biết luật phân bố biến u Ngời ta đ chứng minh đợc biến u (4.3.7) có phân bố chuẩn chuẩn hóa uN(0,1) Nh u hoàn toàn đợc xác định tơng tự nh đ xét (công thức 4.3.4) Từ ta có bớc thực to¸n nh− sau: 1) Tõ c¸c tËp mÉu { x1 , x , , x n1 } vµ { y1, y , , y n } tÝnh x , y u theo công thức (4.3.5) (4.3.7) 2) Chọn xác suất phạm sai lầm loại I () thích hợp xác định u cách tra bảng giải phơng trình (4.3.4) 3) So sánh u u để rút kết luận theo tiêu kiểm nghiệm đ nêu Ghi chú: Hai chuỗi quan trắc {x1,x2, x n1 } vµ {y1,y2, , y n } tơng ứng biến ngẫu nhiên X Y hiểu hai thời đoạn chuỗi hai chuỗi khác Ví dụ 4.3.2 Từ chuỗi quan trắc 50 năm trớc dời trạm đến địa điểm ngời ta tính đợc trung bình lợng ma năm trạm A Xtb50=1859.0 mm Sau di chuyển đợc 42 năm trung bình lợng ma năm Xtb42=2031.3mm Sự chênh lệch lớn Phải di chuyển địa điểm mà lợng ma tăng lên? Sự tăng lên có đến mức đáng kể không? Biết rằng, kết kiểm nghiệm đ khẳng định phơng sai hai giai đoạn 179776mm2, hay = 424,0mm Giải: Có thể nêu giả thiết: lợng ma tăng lên không đáng kể đặt giả thiết kiểm nghệm H0: Xtb50= Xtb42 Tõ (4.3.7) ta cã: u= X tb 50 − X tb 42 1859.0 − 2031.3 = ≈ −1.9416 1 1 424 σ + + 50 42 50 42 Hay u = 1.9416 Chän x¸c suÊt phạm sai lầm loại I = 0.05 ta đợc u=1.96 Vậy u t α , tøc giả thiết bị bác bỏ 4.4.2 So sánh hai kỳ vọng Bài toán: Cho hai biến ngẫu nhiên X, Y có phân bố chuẩn với n1 n2 trị số quan sát tơng ứng {x1,x2, x n1 } vµ {y1,y2, , y n }, (nÕu ch−a biết phân bố X Y n1, n2 phải đủ lớn) Các phơng sai tơng ứng 2x , 2y cha đợc biết, nhng kiểm nghiệm F ngời ta đ xác minh đợc 2x = y = Yêu cầu hy kiểm nghiệm cđa hai kú väng µx vµ µy cđa X Y Giải: Giả thiết cần kiểm nghiệm là: Ho: àx = ày Vì àx ày nên ta thay chúng ớc lợng thống kê: 103 µx = x = n1 ∑ xt n1 t =1 µy = y = vµ n2 n2 ∑ yt (4.4.6) t =1 Ho: x = y Tõ ®ã ta cã: Ho: x − y = Hay Chän giới hạn tin cậy ban đầu d cho với xác suất phạm sai lầm loại I () cho trớc ta cã P( x − y ≥ d) = α Khi tiêu kiểm nghiệm là: Nếu x y d bác bỏ Ho Ngợc lại, nÕu x − y < d th× chÊp nhËn Ho t = A( x − y ), tα = d.A Đặt (4.4.7) đó: 1 + n1 n A= ( n1 − 1)s*x + (n − 1)s*y n1 + n − s*x = n1 n1 * ( x x ) − = , s ∑ t ∑ ( y t − y) y n1 − t =1 n − t =1 Khi ®ã nÕu Ho P( t t) = tiêu kiểm nghiệm là: Nếu t t bác bỏ Ho Nếu t < t chấp nhận Ho Để xác định giá trị cha biết t cần phải biết phân bố xác suất t Có thể chứng minh đợc t St(n1+n22) Từ ta dễ dàng xác định đợc t cách tra bảng tính sẵn giải phơng trình: t f ( x, n1 + n − 2)dx = 0.5 Nh vậy, bớc để giải toán là: * * 1) Từ tập số liƯu {x1,x2, , x n1 } vµ {y1,y2, , y n }, tÝnh x , y , s x , s y , råi tÝnh t theo (4.4.7) 2) Chọn thích hợp xác định t với t St(n1+n22) 3) So sánh t t để rút kÕt ln VÝ dơ 4.4.2 H∙y kiĨm nghiƯm sù tổng lợng ma trung bình trạm A thời kỳ 30 năm trớc 20 năm sau, biết r»ng tõ sè liƯu thùc tÕ ng−êi ta ®∙ tÝnh đợc Rtb30=1602.9, Rtb20=1770.7, s30=367.0, s20=293.1 Cho xác suất phạm sai lầm loại I =0.05 104 Giả thiết cần kiểm nghiƯm lµ Ho: Rtb30=Rtb20 Ta cã n1=30, n2=20 VËy: 1602.9 − 1770.7 1 + 30 20 t= (30 − 1)367.0 + ( 20 − 1)293.12 = −1.7113, 30 + 20 − t0.05(30+20−2) = 1.6772 V× t =1.7113 > t=1.6772 ta bác bỏ giả thiết Ho, tức tổng lợng ma trung bình trạm A hai thêi kú kh«ng b»ng 4.5 KiĨm nghiƯm F Bài toán: Cho hai biến ngẫu nhiên có phân bố chuẩn XN(à1,1), YN(ày,y) với n1 n2 trị số quan sát tơng ứng {x1,x2, , x n1 } {y1,y2, , y n1 } Yêu cầu hy kiểm nghiệm 2x 2y Giải: Đặt giả thiết kiểm nghiệm Ho: 2x = y Vì cha biết 2x y nên ta thay chúng ớc lợng tơng ứng: σ2x ≈ s*x = n1 ∑ (x t − x )2 , n1 − t =1 x= ®ã σ 2y ≈ s*y = n1 ∑ xt , y = n t =1 n2 n2 ∑ ( y t − y) n − t =1 (4.5.1) n2 ∑ yt , t =1 *2 *2 đa giả thiết kiểm nghiệm dạng tơng đơng: Ho: sx = s y *2 *2 Gi¶ sư sx > s y , ta lËp biÕn míi *2 *2 f = sx / s y (4.5.2) xây dựng tiêu kiểm nghiệm là: Nếu f f bác bỏ Ho (Hai phơng sai không nhau) Nếu f < f chấp nhận Ho Trong f giới hạn tin cậy f ứng với xác suất phạm sai lầm loại I : P(f f) = 105 Để xác định f ta cần thiết phân bố f Bằng mét sè phÐp biÕn ®ỉi ta cã thĨ chøng minh đợc Ho biến f có phân bố Fisher víi n1−1 bµ n2−1 bËc tù do: f ∈ F(n11,n21) Từ đó, f đợc xác định bởi: f ∫ f ( t , n1 − 1, n − 1)dt = − α , (4.5.3) f(t,n11,n21) mật độ xác suất phân bố Fisher víi (n1−1) vµ (n2−1) bËc tù Nh− vËy, ta có bớc giải toán sau đây: * 1) Tõ c¸c tËp sè liƯu {x1,x2, , x n1 } vµ {y1,y2, , y n }, tÝnh s*x2 vµ s y theo (4.5.1) Sau *2 *2 *2 *2 ®ã lËp tØ sè f = sx / s y nÕu s x > s y Trong tr−êng hợp ngợc lại ta đổi vai trò *2 *2 s x vµ s y cho 2) Chän α thích hợp xác định f cách tra bảng tính sẵn giải phơng trình (4.5.3) 3) So sánh f f để rút kết luận Ví dụ 4.5 Giả sử nhiệt độ tháng trạm A B tuân theo luật phân bố chuẩn Từ số liệu lịch sử 34 năm trạm A 30 năm trạm B ngời ta tính đợc độ lệch chuẩn chúng tơng ứng s *A =1.95, s*B =1.50 Hỏi khác biệt độ lệch chuẩn nhiệt độ tháng hai trạm có đáng kể không? Giải: Bài toán đặt kiểm nghiệm giả thiết H0: s*A2 = s*B2 khác biệt đáng kể độ lệch chuẩn hai trạm Ta cã f = s*A2 s*B2 = 1.68, n1=34, n2= 30, nên biến f F(33,29) Chọn xác suất phạm sai lầm loại I = 0.05 ta tính đợc f=1.84 Vậy fmax{xt,t=1 n} Vì xác suất để X nhận giá trị khoảng (aj,bj) tính theo phân bố thực nghiÖm b»ng P(aj ≤ X < bj) = F(bj) − F(aj) nên tần số thực nghiệm: mj = n[F(bj) F(aj)] = n[F(aj+1) F(aj)] Mặt khác, xác suất tÝnh theo ph©n bè lý thuyÕt b»ng: pj = P(aj≤XV nên để tiến hµnh kiĨm nghiƯm ta sÏ sư dơng V Theo (4.7.4), µ =M[V]= 30.20/2 = 300; σ = 30.20 (30 + 20 + 1) =50.5 Đổi vai trò 12 U (4.7.5) thành V ta tính đợc: u = (Và)/ =(134−300)/50.5 = −3.29 Víi α=0.05 ta cã uα =1.96 VËy, u =3.29 > uα= 1.96 Do ®ã ta kÕt luËn hai chuỗi không đồng 113 ... 12 49.4 12 14.4 15 32 .1 1 719 .7 19 31. 9 17 25.7 212 8.3 15 99.6 18 94.4 211 5 .1 1055.7 15 25.9 18 29.8 16 84.5 18 28.9 13 15.6 12 84.3 17 33.7 17 60.6 14 48.5 15 68.8 12 56.8 16 51. 7 14 88.2 13 90.5 2033.4 15 38 .1 1884.9 15 44.4... 15 44.4 18 62.8 18 06.5 17 58.2 19 35.2 17 26.7 14 05.5 17 58.9 17 38.8 17 44.2 12 74.8 18 39.6 17 66.3 20 61. 8 214 1.2 18 00.0 19 54 .1 1662.5 19 64.5 16 46.7 19 95.0 215 3.9 2528.2 15 61. 5 19 51. 1 15 27.2 2225 .1 114 7.8 16 53.0... 1. 3 1. 8 0.4 0.0 3.6 2.9 3.8 0.4 14 .4 4 .1? ??6 2.5 2.7 1. 1 0.9 3.6 1. 8 3.4 1. 6 17 .5 6 .1? ??8 2.5 3.6 2.2 3 .1 4.7 1. 6 1. 3 0.4 19 .6 8 .1? ? ?10 1. 1 1. 8 2.0 4.9 1. 8 0.2 1. 1 1. 1 14 .2 7.9 11 .5 11 .2 31. 0 17 .1 6.5

Ngày đăng: 25/07/2022, 10:36

Tài liệu cùng người dùng

Tài liệu liên quan