Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 83 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
83
Dung lượng
1,2 MB
Nội dung
1 đại học thái nguyên trờng đại học s phạm khoa toán Các phơng pháp dự báo Các phơng pháp dự báo Các phơng pháp dự báo Các phơng pháp dự báo Chuyên ngành: Toán ứng dụng luận văn tốt nghiệp Đại học Ngời hớng dẫn khoa học: C.n Mã Thế Đông thái nguyên-2006 Mục lục 2 Trang Trang bìa phụ 1 Mục lục 2 Mở đầu 3 Chơng 1. Tổng quan về thống kê toán và các bài toán cơ bản 5 1.1. Tổng quan về thống kê toán 5 1.2. Các bài toán cơ bản 18 Chơng 2. Phân tích hồi quy 45 2.1. Mục đích của phơng pháp phân tích hồi quy 45 2.2. Hàm hồi quy 46 2.3. Mô hình hồi quy tuyến tính đơn 46 Chơng 3. Phân tích chỗi thời gian 54 3.1. Một số khái niệm 54 3.2. Phân tích bằng hàm xu thế 55 3.3. Phân tích biến động mùa vụ 59 3.4. Phân tích biến động chu kỳ 60 Chơng 4. Thống kê Bayes và lý thuyết quyết định thống kê 61 4.1. Thống kê Bayes 61 4.2. Lý thuyết quyết định thống kê 66 Một vài ứng dụng thực tế 76 Kết luận 82 Tài liệu tham khảo 83 3 Mở đầu 1. Lý do chọn đề tài Trong khoa học và đời sống ngời ta cần phải thu thập các số liệu chẳng hạn về số lợng năng suất lúa ở các vùng trong nhiều năm, số liệu điều tra dân số, số liệu về trình độ nhận thức của học sinh Vấn đề đặt ra là: Sau khi thu thập các số liệu, ta phải trình bầy các số liệu đó một cách có hệ thống nh thế nào? Từ các số liệu đó rút ra kết luận gì? Các số liệu đó phản ánh quy luật nào của sự vật đang xét, độ tin cậy của các kết luận? Phán đoán sự phát triển của sự vật? Cần phải có những quyết định gì trong hoạt động thực tiễn. Tất cả các vấn đề trên đợc quy tụ về bộ môn: Thống kê toán. Thống kê toán là bộ môn toán học nghiên cứu quy luật của các hiện tợng ngẫu nhiên có tính chất số lớn trên cơ sở thu thập và xử lý các số liệu thống kê, các kết quả quan sát. Nội dung chủ yếu của thống kê toán là xây dựng các phơng pháp thu thập và xử lý các số liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn. Các phơng pháp thống kê toán là công cụ để giải quyết nhiều vấn đề khoa học và thực tiễn nảy sinh trong các lĩnh vực khác nhau của tự nhiên và kinh tế xã hội. Các phơng pháp dự báo là một trong những phơng pháp thống kê toán. Ta thấy việc lựa chọn quyết định hoạt động ở tơng lại sẽ thuận lợi hơn, mang lại hiệu quả hơn khi đã biết phân bố xác suất của các dữ kiện ngẫu nhiên. Các xác suất này thực chất là đợc đa ra từ các kết quả thống kê của quá khứ dùng làm dự báo cho khả năng xảy ra trong tơng lai. Với mục đích chính của các phơng pháp dự báo là dự báo đại lợng ngẫu nhiên trong tơng lai. Vì vậy các phơng pháp dự báo đợc ứng dụng trong nhiều lĩnh vực khác nhau nh: Kinh tế sản xuất, giao thông vận tải, xây dựng, và kể cả trong 4 giáo dục. Dự báo đợc các kết cục xảy ra trong tơng lai sẽ là điều kiện cơ sở để ta lựa chọn các quyết định một cách đúng đắn. Từ tính thực tiễn và những lý luận chung nêu trên là lý do để em tiến hành nghiên cứu đề tài: Các phơng pháp dự báo. Em xin chân thành cảm ơn Thầy Mã Thế Đông - giảng viên khoa Toán, các thầy cô giáo trong khoa Toán trờng ĐHSP Thái Nguyên đã tận tình giúp đỡ, chỉ bảo em hoàn thành đề tài nghiên cứu khoa học này. 2. Nội dung chính Đề tài Các phơng pháp dự báo bao gồm các nội dung chính sau: Chơng 1:Tổng quan về thống kê toán và các bài toán cơ bản. Chơng 2: Phân tích hồi quy Chơng 3: Phân tích chuỗi thời gian. Chơng 4: Thống kê Bayes và lý thuyết quyết định thống kê. 3. Mục đích yêu cầu Đề tài Các phơng pháp dự báo nghiên cứu nhằm: - Tìm hiểu, hệ thống các vấn đề tổng quan về thống kê toán, các bài toán cơ bản của thống kê toán. - Bớc đầu tìm hiểu kỹ thuật phán đoán, kỹ thuật phân tích hồi quy, kỹ thuật phân tích chuỗi thời gian để từ đó đa ra một số ứng dụng thực tế. 4. Các phơng pháp nghiên cứu Đề tài Các phơng pháp dự báo đợc nghiên cứu dựa trên sự tổng hợp của các phơng pháp: - Thu thập tài liệu, đọc tài liệu. - Phân loại, hệ thống lý thuyết. - Phân tích, tổng hợp lý thuyết. 5 Chơng 1: tổng quan về thống kê toán và các bài toán cơ bản 1.1.tổng quan về thống kê toán. 1.1.1. Tổng thể và mẫu. 1.1.1.1.Tổng thể. Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hoặc định lợng nào đó đợc gọi là tổng thể nghiên cứu hay tổng thể. Để nghiên cứu tổng thể có 2 cách: - Nghiên cứu toàn bộ mọi phần tử của tổng thể. - Nghiên cứu đại diện: Lấy một số phần tử ra để nghiên cứu. Từ những thông tin nhận đợc, ta kết luận cho cả tổng thể. 1.1.1.2. Mẫu. 1.1.1.2.1.Định nghĩa. Tập hợp n phần tử chọn ra đại diện từ tổng thể để nghiên cứu đợc gọi là mẫu. Ta có: n << N N: Số phần tử của tổng thể. n: Số phần tử của mẫu. 1.1.1.2.2. Phơng pháp chọn mẫu. Tuỳ thuộc vào đặc điểm từng lĩnh vực nghiên cứu mà mẫu có thể đợc chọn theo nhiều phơng pháp khác nhau để đảm bảo yêu cầu về tính đại diện của mẫu. Cụ thể: - Mẫu giản đơn ( mẫu hoàn lại, mẫu không hoàn lại). - Mẫu hệ thống. - Mẫu chùm. - Mẫu phân tổ. - Mẫu nhiều cấp. 6 Một mẫu đợc coi là tốt nếu n vừa đủ để nghiên cứu và các phần tử vừa đợc chọn ngẫu nhiên, vừa có tính đại diện cao. 1.1.1.2.3. Phân loại mẫu (2 loại). - Mẫu không lặp: Các phần tử của mẫu là khác nhau. - Mẫu lặp: Một phần tử của tổng thể có thể rơi vào mẫu nhiều lần (đợc nghiên cứu nhiều lần). Nếu n rất bé, N rất lớn, ta có thể coi mẫu lặp và không lặp nh nhau. 1.1.2. Mẫu ngẫu nhiên. Xét biến ngẫu nhiên X, thử X n lần một cách độc lập. Biến ngẫu nhiên X đợc thử ở lần thứ i (ký hiệu X i ), i = n,1 Một bộ sắp thứ tự (X 1 , X 2 , ,X n ) đợc gọi là một mẫu ngẫu nhiên lấy từ X. Ký hiệu: W = (X 1 , X 2 , ,X n ). Việc thực hiện một phép thử đối với mẫu ngẫu nhiên W chính là thực hiện một phép thử đối với mỗi thành phần của mẫu. Giả sử X 1 nhận giá trị x 1 , ,X n nhận giá trị x n . Tập hợp n giá trị x 1 , , x n tạo thành một giá trị của mẫu ngẫu nhiên (mẫu thực nghiệm). Ký hiệu: w = (x 1 , x 2 , ,x n ). 1.1.3. Các phơng pháp mô tả số liệu. 1.1.3.1. Sắp xếp số liệu thực nghiệm. Từ mẫu ngẫu nhiên W = (X 1 , X 2 , ,X n ) thờng có 2 cách sắp xếp tiện lợi cho việc áp dụng các tiêu chuẩn thống kê. 1.1.3.1.1. Sắp xếp theo các giá trị khác nhau. Từ tổng thể với biến ngẫu nhiên gốc X, rút ra 1 mẫu cụ thể có kích thớc n :W = (X 1 , X 2 , ,X n ), ta xác định đợc k giá trị khác nhau k n. Trong đó: Giá trị x 1 xuất hiện với tần số n 1 Giá trị x k xuất hiện với tần số n k 7 a. Sắp xếp các giá trị cụ thể x i theo trình tự tăng dần, ta có bảng phân phối tần số thực nghiệm sau: x i x 1 x 2 x k n i n 1 n 2 n k Trong đó: n 1 + n 2 + + n k = n. b. Nếu ký hiệu f i = n n i (tần suất xuất hiện của giá trị x i trong mẫu). Ta có bảng phân phối tần suất thực nghiệm sau: x i x 1 x 2 x k f i f 1 f 2 f k Trong đó: f 1 + f 2 + + f k = 1 1.1.3.1.2. Sắp xếp dới dạng khoảng. Giả sử n lớn, khi đó ta chọn a min {x i } ; b max {x i }. Chia [a, b] thành k khoảng bởi các điểm chia: a = a 0 < a 1 < < a k - 1 < a k = b. Đếm số lợng các phần tử rơi vào từng khoảng, giả sử khoảng thứ i có n i phần tử. Ta có bảng ghép lớp sau: Khoảng [a 0 , a 1 ) [ a 1 , a 2 ) [ a k - 1 , a k ] n i n 1 n 2 n k 1.1.3.2. Hàm phân phối mẫu (hàm phân phối thực nghiệm). 1.1.3.2.1.Định nghĩa. Cho 1 mẫu ngẫu nhiên W = (X 1 , X 2 , ,X n ) Ký hiệu: i (i = k,1 ) - Tần số tích luỹ của x i , i = < )(x j j n i x F*(x i ) - Tần suất tích luỹ của x i , F*(x i ) = i n = j i j x x n n < F*(x i ) là một hàm của x i , gọi là hàm phân phối mẫu. 8 1.1.3.2.2. Tính chất của hàm phân phối mẫu. +) 0 F*(x i ) 1 +) F*(x i ) là hàm đơn điệu tăng theo x i +) F*(x i ) = 0 nếu x i min (x 1 , ,x n ) +) F*(x i ) = 1 nếu x i > max (x 1 , , x n ) +) F*(x i ) F(x) khi x theo nghĩa xác suất (F(x)- hàm phân phối xác suất của biến ngẫu nhiên gốc X ; F(x) =P(X<x) ) 1.1.3.3.Biểu đồ. Để mô tả số liệu mẫu một cách rõ ràng cho phép đa ra những nhận xét sơ bộ ban đầu về tổng thể, ngời ta còn xây dựng các loại đồ thị khác nhau của phân phối thực nghiệm. 1.1.3.3.1. Đa giác tần số. Đa giác tần số là đờng gy khúc mà các đoạn thẳng của nó nối các điểm (x 1 , n 1 ), (x 2 , n 2 ), , (x k , n k ) trên mặt phẳng. (H.1) 1.1.3.3.2. Đa giác tần suất. Đa giác tần suất là đờng gy khúc mà các đoạn thẳng của nó nối các điểm (x 1 , f 1 ), (x 2 , f 2 ), , (x k , f k ) trên mặt phẳng.(H.2) 1.1.3.3.3. Tổ chức đồ. Khi dấu hiệu nghiên cứu có phân phối liên tục, ta xây dựng biểu đồ tần số (tần suất) gọi là tổ chức đồ tần số (tần suất). (H.3) Ta chia khoảng chứa tất cả các giá trị quan sát của mấu thành 1 số đoạn có chiều dài bằng h, tại mỗi đoạn đa vào tần số (tần suất) tơng ứng. Nh vậy biểu đồ tần số sẽ là 1 hình thang tạo nên bởi nhiều hình chữ nhật, có đáy bằng h, chiều cao bằng h n i . Lúc đó diện tích của hình chữ nhật thứ i bằng: h. h n i = n i . Vậy diện tích của tất cả các hình chữ nhật sẽ bằng kích thớc mẫu n. 9 Tơng tự biểu đồ tần suất là 1 hình bậc thang tạo nên bởi nhiều hình chữ nhật có đáy bằng h, chiều cao bằng h f h i , lúc đó diện tích của hình chữ nhật thứ i bằng: h f h i . = f i . Vậy diện tích của toàn bộ hình bậc thang sẽ bằng 1. 1.1.4. Thống kê. 1.1.4.1. Định nghĩa. Việc tổng hợp mẫu W = (X 1 , X 2 , , X n ) đợc thực hiện dới dạng 1 hàm nào đó của các giá trị X 1 , X 2 , , X n của mẫu đợc gọi là thống kê. Ký hiệu: G =f(X 1 , X 2 , , X n ) 1.1.4.2. Một số thống kê đặc trng của mẫu ngẫu nhiên. 1.1.4.2.1. Các thống kê đặc trng xu hớng trung tâm của phân phối của mẫu. a. Trung bình mẫu ( X ). W (X 1 , X 2 , , X n ) là mẫu ngẫu nhiên kích thức n. Trung bình mẫu là 1 thống kê, là trung bình của các giá trị mẫu: = = n i n X 1 1 X i (1) Khi mẫu ngẫu nhiên nhận giá trị cụ thể w (x 1 , x 2 , , x n ) thì trung bình mẫu nhận giá trị cụ thể = = n i n x 1 1 x i (2) hoặc = = k i n x 1 1 n i x i x 1 x 2 x k x f f 1 f k H. 2 a b x f H. 3 x 1 x 2 x k x n n k n 2 n 1 H. 1 0 0 0 10 Tính chất: Nếu biến ngẫu nhiên gốc có kỳ vọng toán E(X ) = à , Phơng sai V (X ) = 2 thì E ( X ) = à (3); V ( X ) = n 2 (4) Độ lệch chuẩn )(XV = n Độ lệch chuẩn này của X dùng để phản ánh sai số ớc lợng gọi là sai số chuẩn Se của trung bình mẫu ( )X : Se ( )X n (5) b. Trung vị (X d ). Trung vị là giá trị nằm chính giữa, tức là giá trị chia các số liệu mẫu thành 2 phần bằng nhau: - Nếu số liệu mẫu gồm n giá trị rời rạc đợc sắp xếp theo trình tự tăng dần. + n lẻ: trung vị là giá trị thứ 2 1 + n trong dãy số liệu. + n chẵn: trung vị là 2 giá trị nằm chính giữa của dãy số liệu. Nó đợc gọi là khoảng trung vị. - Nếu các số liệu mẫu đợc ghép lớp theo phân phối tần số thì giá trị trung vị có thể tính gần đúng bởi công thức sau: X d L + h n S n d x 2 (6) Trong đó: L - Giới hạn dới của lớp chứa trung vị. n - Kích thớc mẫu. S - Tổng tần số của các lớp đứng trớc lớp chứa trung vị. n d x - Tần số của lớp chứa trung vị. h - Độ dài của lớp chứa trung vị. Ví dụ 1: Giả sử có số liệu mẫu: 240, 220, 210, 225, 235, 225, 270, 250, 280. [...]... một cách gần đúng) giá trị Phơng pháp mẫu cho phép ta giải quyết bài toán này bằng quy nạp thống kê nh sau: Từ tổng thể nghiên cứu rút ra một mẫu ngẫu nhiên kích thớc n và dựa vào đó để xây dựng thống kê dùng để ớc lợng bằng cách này hay cách khác Có hai phơng pháp sử dụng để ớc lợng là phơng pháp ớc lợng điểm và phơng pháp ớc lợng bằng khoảng tin cậy 18 1.2.1.1 Phơng pháp ớc lợng điểm Phơng pháp. .. mẫu ứng ở vị trí cách đơn vị đầu tiên 3/4 số đơn vị của mẫu Nếu các số liệu mẫu đợc ghép lớp thì các tứ phân vị đợc tính: 12 n S Q1 4 L Q1 + hQ1 (8) n Q1 Q1 = Q3 = 3n S Q3 L Q3 + 4 hQ3 (9) nQ3 Trong đó: L Q , L Q - Giới hạn dới của các lớp chứa Q1, Q3 1 3 S Q , S Q - Tổng các tần số của các lớp ứng trớc lớp chứa Q1 và Q3 1 3 n Q , n Q - Tần số của các lớp chứa Q1, Q3 1 3 h Q , h Q - Độ dài của các. .. 1 - , tìm đợc cặp 1, 2: 1 + 2 = và giá trị tới hạn u(1 ) , u tơng ứng 1 2 thoả: P [ u(1 ) < U < u ] = 1 - 1 2 Thay biểu thức của U vào ta có: P[p - p (1 p ) n u1 < f < p+ p (1 p ) n u 2 ] = 1 - (17) Từ đó ta tiến hành các suy đoán đối với f 1.2 các bài toán cơ bản 1.2.1.B i toán 1: Ước lợng các tham số của biến ngẫu nhiên B i toán ớc lợng tham số: cho biến ngẫu nhiên X với quy luật phân phối xác... toán sau: H0: à =150 H1: à >150 Có S =25, X =185 Chọn thống kê G = T T= X à0 n ta có: S 185 150 100 25 Với = 0,05 u = 1,65 ta thấy T>u Vậy bác bỏ H0 ,điều đó nghĩa là công nghệ mới có hiệu quả hơn 1.2.2.2.2 Kiểm định giả thuyết về hai kỳ vọng toán của hai biến ngẫu nhiên phân phối chuẩn Giả sử có 2 tổng thể nghiên cứu trong đó các biến ngẫu nhiên X1 và X2 cùng phân phối chuẩn với các kỳ vọng toán. .. dạng của giả thuyết đối H1, với phơng pháp xây dựng giống nh đã làm ở phần trớc ta thu đợc các miền bác bỏ W tơng ứng: (A) Ho; à1 = à2, H1: à1 à2 Miền bác bỏ 2 phía là:W= { U , U > u/2} (B) Ho: à1 = à2, H1: à1> à2 Miền bác bỏ bên phải là: W = { U, U > u} (C) Ho: à1 = à2, H1 : à1 < à2 Miền bác bỏ bên trái là: W = { U, U . nguyên trờng đại học s phạm khoa toán Các phơng pháp dự báo Các phơng pháp dự báo Các phơng pháp dự báo Các phơng pháp dự báo Chuyên ngành: Toán ứng dụng luận. phơng pháp dự báo là dự báo đại lợng ngẫu nhiên trong tơng lai. Vì vậy các phơng pháp dự báo đợc ứng dụng trong nhiều lĩnh vực khác nhau nh: Kinh tế sản xuất, giao thông vận tải, xây dựng, và. để từ đó đa ra một số ứng dụng thực tế. 4. Các phơng pháp nghiên cứu Đề tài Các phơng pháp dự báo đợc nghiên cứu dựa trên sự tổng hợp của các phơng pháp: - Thu thập tài liệu, đọc tài liệu.