Giáo trình kinh tế chất lượng - ôn lại thống kê - 3 ppt

Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 25 Thục Đoan/Hào Thi Trong phần này chúng ta trình bày hai thủ tục có thể thay thế nhau để ước lượng các thông số chưa biết của phân phối xác suất mà các quan sát x 1 , x 2 , . . . , x n được rút ra từ đó. trong Phụ lục, Phần 2.A.3, ta mô tả thêm một phương pháp nâng cao. trong phần thảo luận tiếp theo, chúng ta sẽ giả sử rằng nhà khảo sát biết được bản chất của phân phối xác suất nhưng chưa biết các giá trò của các thông số. Phương pháp Momen Phương pháp lâu đời nhất để ước lượng các thông số là phương pháp momen. Nếu một phân phối có k thông số chưa biết, thủ tục nhằm tính toán hệ số các momen mẫu k bậc nhất của phân phối và sử dụng chúng như là các ước lượng của các momen tổng thể tương ứng. Trong Phần 2.2, chúng tôi đã có lưu ý rằng trung bình tổng thể của phân phối ( µ) cũng được đề cập đến như là momen bậc nhất của phân phối xung quanh giá trò gốc. Đó là giá trò trung bình có trọng số của tất cả các x có thể có, các trọng số là các xác suất tương ứng. Trung bình mẫu (x _ ) là trò trung bình số học của các quan sát mẫu x 1 , x 2 , . . . , x n . Bằng phương pháp các momen, x _ được tính như là một ước lượng của µ. Phương sai của một biến ngẫu nhiên là σ 2 = E [(X – µ) 2 ] và được biết như là momen bậc hai xung quanh giá trò trung bình. Phương sai mẫu (s 2 ), được đònh nghóa trong Phương trình (2.9), được sử dụng như là một ước lượng của phương sai tổng thể của phân phối. Trong nhiều trường hợp (ví dụ như, phân phối chuẩn), trung bình và phương sai đặc trưng hoàn toàn cho một phân phối, và do đó không có nhu cầu phải sử dụng các momen bậc cao hơn như là giá trò kỳ vọng của (X – µ) 3 . Chúng ta sẽ thấy trong Phần 2.6 rằng trung bình mẫu có một số tính chất mong muốn. Cùng với nguyên lý này có thể được áp dụng để ước lượng hệ số của sự tương quan giữa hai biến ngẫu nhiên X và Y (xem Đònh nghóa 2.5). Gọi x 1 , x 2 , . . . , x n và y 1 , y 2 , . . . , y n là các mẫu quan sát ngẫu nhiên độc lập (với cỡ mẫu n) tương ứng với X và Y. Phương sai tổng thể giữa chúng được cho trong Đònh nghóa 2.4 là E [(X – µ x ) (Y – µ y )], trong đó µ x và µ y là các trung bình tổng thể tương ứng của X và Y. Một trò ước lượng của thông số này được cho bởi phương sai mẫu S xy = Cov(X, Y) = 1 n – 1 ∑ (x i – x _ ) (y i – y _ ) (2.10) Nếu các cặp giá trò của x i và y i được vẽ ra đồ thò, chúng ta có được một đồ thò như Hình 2.7, trong đó X và Y có tương quan thuận với nhau (nghóa là, X và Y nói chung là cùng dòch chuyển theo cùng một hướng). Chúng ta đã có đề cập rằng một đồ thò điểm như vậy được gọi là biểu đồ phân tán. Hình 2.6 cũng tương tự như vậy ngoại trừ việc trung bình vẽ những điểm đề cập đến tổng thể, trong khi ở đây nó lại đề cập đến mẫu. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 26 Thục Đoan/Hào Thi Bằng cách chuyển đổi các trục thành các đường nét đứt xuất phát từ điểm (x _ ,y _ ), chúng ta có thể thấy rằng (x i – x _ ) và (y i – y _ ) là những khoảng cách từ điểm trung bình (x _ ,y _ ). } Hình 2.7 Một Biểu đồ Phân tán đối với Tương quan Thuận } Hình 2.8 Một Biểu đồ Phân tán đối với Mối quan hệ xấp xỉ bậc hai 0 y _ x _ Y X 3 2 1 4 0 y _ x _ Y X 3 2 1 4 Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 27 Thục Đoan/Hào Thi Nếu mối quan hệ là dương, chúng ta sẽ kỳ vọng hầu hết các điểm đều nằm trong các phần tư thứ nhất và thứ ba mà trong đó tích số (x i – x _ ) (y i – y _ ) sẽ dương. Do các tích số âm của các điểm trong phần tư thứ hai và thứ tư hầu như bò lấn át bởi các tích số dương, chúng ta sẽ kỳ vọng đồng phương sai là dương. Bằng lý luận tương tự, chúng ta có thể thấy rằng nếu mối quan hệ là âm, hầu hết các điểm sẽ nằm trong phần tư thứ hai và thứ tư, tạo ra một đồng phương sai âm. Điều này cho thấy rằng nếu X và Y có tương quan thuận, thì đồng phương sai và do đó tương quan giữa chúng cũng sẽ thuận. Một mối quan hệ âm sẽ cho một hệ số tương quan âm. Hệ số tương quan mẫu được cho bởi r xy = s xy s x s y = ∑ (x i – x _ ) (y i – y _ ) [ ∑ (x i – x _ ) 2 ] 1/2 [∑ (y i – y _ ) 2 ] 1/2 (2.11) trong đó s x và s y là các độ lệch chuẩn mẫu (căn bậc hai của các phương sai) tương ứng của X và Y. Trong Phần 2.3 chúng ta đã có đề cập đến vấn đề hệ số tương quan là một đại lượng đo lường mối quan hệ tuyến tính giữa X và Y. Hình 2.8 là một biểu đồ phân tán cho ta thấy trường hợp khi Y là một hàm xấp xỉ bậc hai của X. chúng tôi lưu ý rằng các điểm được phân tán trong cả bốn phần tư của biểu đồ, và do đó tổng ∑ (x i – x _ ) (y i – y _ ) hầu như rất nhỏ, cho một giá trò r xy nhỏ. Vì vậy, một r xy nhỏ không có nghóa là X và Y không có quan hệ chặt chẽ với nhau, mà có nghóa là chúng không có quan hệ tuyến tính chặt chẽ. Bài tập 2.24 minh họa khái niệm sự tương quan được áp dụng cho đường cong Phillips. Đối với những người sử dụng GRETL, Phần Thực hành trên Máy tính 2.3 (xem Phụ lục D, Bảng D.1) chứng tỏ rằng việc tính toán các đồng phương sai và tương quan giữa điểm trung bình ở đại học và điểm trung bình ở trung học theo dữ liệu trong DATA 2-2, được mô tả trong Phụ lục D. Hãy sử dụng chương trình riêng của bạn với DATA 2-2 để xác minh lại các kết quả được trình bày ở đây. } Bảng 2.8 Số liệu Kết quả từ Máy tính được giải thích từng phần minh họa cho các trò thống kê tóm tắt khác nhau. Các chú giải được qui đònh ở dạng riêng khác với dạng được sử dụng cho các kết quả máy tính. x = colgpa = Grade point average in College y = hsgpa = Grade point average in High School Correlation between x and y = 0.406662 Summary Statistics, using the observations 1 – 427 Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 28 Thục Đoan/Hào Thi Variable MEAN MEDIAN MIN MAX x 2.7855 2.79 0.85 3.97 y 3.55785 3.59 2.29 4.5 Variable S.D. C.V. SKEW EXCSKURT x 0.54082 0.194155 -0.203647 -0.0517458 y 0.419577 0.11793 -0.401241 -0.220107 Min và Max là những giá trò nhỏ nhất và lớn nhất trong mẫu. Median là giá trò của x hoặc y tính theo mỗi bên của giá trò này sẽ có 50% các quan sát. C.V. là hệ số biến thiên (MEAN/S.D.) đã được thảo luận trong Phần 2.2. SKEW là một đại lượng đo lường sự phân phối của biến sai lệch bao xa so với điểm đối xứng (trong bài này gọi là độ lệch skewness). Một giá trò bằng không cho biết điểm đối xứng xung quanh giá trò không. Một giá trò dương cho biết độ lệch về bên phải với một nhánh dài theo hướng này. Một giá trò âm cho biết độ lệch đối xứng skewness sang bên trái với một nhánh dài theo hướng này. EXCKURT là độ lệch kurtosis, nghóa là, độ kurtosis –3. Kurtosis là một đại lượng đo lường độ rộng hình chóp của một phân phối. Phân phối chuẩn có kurtosis là 3. Một phân phối dàn trải rộng sẽ có một giá trò kurtosis âm, và một phân phối hẹp sẽ có một giá trò kurtosis dương. Độ lệch skewness và kurtosis không được thảo luận trong bài vì chúng không được sử dụng nhiều trong kinh tế lượng. Nếu muốn biết thêm chi tiết về các đại lượng này, hãy xem sách của Ramanathan (1993, Phần 3.5). Một phiên bản giải thích kết quả được trình bày ở Bảng 2.8. Bảng cũng cung cấp thêm các đại lượng thống kê tóm tắt chưa được thảo luận ở phần trên. Phương Pháp Bình Phương Tối Thiểu (hay Bình Phương Tối Thiểu Thông Thường) Trong kinh tế lượng, phương pháp được sử dụng phổ biến nhất để ước lượng các thông số là phương pháp bình phương tối thiểu (cũng còn được biết đến dưới tên bình phương tối thiểu thông thường hay OLS). Mặc dù nó được sử dụng chủ yếu để ước lượng các thông số của một mô hình hồi qui dạng PRICE = α + β SQFT + u đã gặp phải trong Chương 1, phương pháp này còn rất hữu ích trong trường hợp ước lượng giá trò trung bình của một biến đơn ngẫu nhiên X. Từng quan sát x i có thể được xem như một giá trò ước lượng của mẫu trung bình µ vì E(x i ) = µ . Sai số trong giá trò ước lượng này là e i = x i – µ (tức là, x i = µ + e i ). Xem xét tổng bình phương của sai số này trong tổng thể mẫu. Tức là, đặt ESS ( µ ) = ∑ 2 i e = ∑ (x i – µ ) 2 . Phương pháp bình phương tối thiểu chọn giá trò ước lượng µ mà tổng bình phương sai số mẫu là nhỏ nhất. Việc bình phương các sai số giải quyết được hai vấn đề. Đầu tiên, nó loại bỏ dấu của sai số. Vì vậy, những sai số có giá trò dương và âm được xem xét như nhau. Thứ hai, việc bình phương sẽ loại bỏ những sai số lớn bởi vì những sai số như thế bò phóng đại lên nhiều khi lấy bình phương. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 29 Thục Đoan/Hào Thi Để có được µ ˆ , ước lượng µ bằng cách tối thiểu ESS, viết ESS như sau: ESS ( µ ˆ ) = ∑ (x i – µ ˆ ) 2 = ∑ (x i – x + x – µ ˆ ) 2 = ∑ (x i – x ) 2 + ∑ ( x – µ ˆ ) 2 + 2∑ ( x – µ ˆ )(x i – x ) = ∑ (x i – x ) 2 + ∑ ( x – µ ˆ ) 2 Bởi vì x – µ ˆ trong số hạng thứ ba là một hằng số, nên nó có thể được loại ra (xem Phụ Lục 2.A.1) và, theo Tính Chất 2.A.4, số hạng thứ ba bằng không. Do trong số hạng đầu không có µ ˆ , nên chúng ta thấy rằng ESS được tối thiểu đối với việc lựa chọn µ ˆ nếu và chỉ nếu chúng ta cho µ ˆ = x , điều này nó có thể làm cho số hạng thứ hai bằng không. Do đó, giá trò ước lượng bình phương tối thiểu của µ là giá trò trung bình mẫu x . Trong phần phụ lục của chương, chúng ta sẽ thảo luận một thủ tục khác, hiện đại hơn: giá trò ước lượng thích hợp cực đại (MLE). Những người đọc có quan tâm nên đọc phần này. (Để thấy được việc sử dụng những phương pháp diễn tả trong phần này trong ước lượng các hồi qui như thế nào, xem tiếp Phần 3.1 và 3.2.) } 2.6 Các Tính Chất Của Ước Lượng Trong phần trước chúng ta đã thảo luận hai thủ tục ước lượng mà nó chọn trung bình mẫu là ước lượng của µ . Trong ví dụ chiều cao của người trong Phần 2.5, một ước lượng thay thế đó là lấy các chiều cao của những người cao nhất và những người thấp nhất và lấy trung bình. Ước lượng nào tốt hơn? Để có thể trả lời được những câu hỏi loại như thế này, chúng ta cần một vài tiêu chí trong việc chọn lựa giữa những ước lượng khác nhau. Một vài tiêu chuẩn đã được thiết lập để đánh giá “sự thích hợp” của một ước lượng, nhưng trong những phần sau chúng ta chỉ thảo luận các khái niệm được sử dụng thường xuyên nhất trong kinh tế lượng. Một vài khái niệm trong đó áp dụng được cho những cỡ mẫu nhỏ và những khái niệm khác chỉ thích hợp đối với những cỡ mẫu lớn. Những Tính Chất Của Ước Lượng Cỡ Mẫu Nhỏ Ký hiệu chuẩn cho thông số chưa biết là θ và ký hiệu một giá trò ước lượng là θ ˆ . Nên nhấn mạnh rằng θ ˆ là một hàm số của những quan sát x 1 , x 2 , … , x n và nó không phụ thuộc vào bất kỳ thông số chưa biết nào. Do đó một giá trò ước lượng như vậy là một trò thống kê mẫu. Tuy nhiên, bởi vì x là những biến ngẫu nhiên, nên θ ˆ cũng ngẫu nhiên. K HÔNG THIÊN LỆCH Bởi vì θ ˆ là một biến ngẫu nhiên, nên nó có một phân phối xác suất với giá trò trung bình nào đó, gọi là E( θ ˆ ). Nếu giá trò trung bình này tương đương Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 30 Thục Đoan/Hào Thi với thông số chưa biết θ , chúng ta nói rằng giá trò ước lượng là không thiên lệch. Do vậy, chúng ta có đònh nghóa sau. ĐỊNH NGHĨA 2.7 (Không Thiên Lệch) Một ước lượng θ ˆ được gọi là giá trò ước lượng không thiên lệch của θ nếu E( θ ˆ ) = θ . Nếu sự cân bằng này không được duy trì, thì ước lượng được gọi là bò thiên lệch và độ thiên lệch là E( θ ˆ ) - θ . Mặc dù với một cuộc thử nghiệm cho trước θ ˆ có thể không bằng θ , nếu chúng ta lặp lại một lượng lớn số lần thử và tính toán θ ˆ từng lần một, thì trò trung bình của những giá trò này sẽ là θ nếu giá trò ước lượng là không thiên lệch. Như đã mô tả trong Phần 2.4, nếu chúng ta giữ cố đònh cỡ mẫu ở n, thực hiện nhiều lần thí nghiệm này, tính toán θ ˆ cho từng lần, và hình thành một phân phối tần suất, thì chúng ta thu được phân phối mẫu của θ ˆ . Tính không thiên lệch đòi hỏi trò trung bình của phân phối này là giá trò θ thực. H IỆU QUẢ Trong khi tính thiên lệch rõ ràng là một đặc tính mong muốn của bất kỳ ước lượng nào, chúng ta cũng cần thêm tiêu chuẩn bởi vì có thể xây dựng một số lïng không giới hạn những ước lượng không thiên lệch. Trong ví dụ đo lường chiều cao, chúng ta biết rằng giá trò trung bình mẫu x không thiên lệch bởi vì E( x ) = µ . Nhưng giá trò ước lượng khác, vừa được đưa ra trước đây, tính độ cao trung bình của những người cao nhất (gọi là x max ) và của những người thấp nhất (gọi là x min ) cũng không thiên lệch. Đặt θ ˆ = 2 1 (x max + x min ). Tiếp theo E( θ ˆ ) = 2 1 [E(x max ) + E(x min )] = µ , và do vậy θ ˆ cũng không thiên lệch. Thật dễ dàng chứng minh rằng bất kỳ giá trò trung bình trọng số nào của x là một ước lượng không thiên lệch của µ , miễn là các trọng số không ngẫu nhiên và có tổng bằng 1. Do đó chúng ta cần thêm tiêu chí để phân biệt giữa hai ước lượng không thiên lệch. Chúng ta đã biết rằng phương sai của một biến ngẫu nhiên là một đại lượng đo lường sự phân tán của nó xung quanh giá trò trung bình. Về mặt trung bình, một phương sai nhỏ hơn có nghóa là các giá trò của biến ngẫu nhiên sẽ gần với giá trò trung bình hơn những giá trò của biến ngẫu nhiên khác với cùng giá trò trung bình nhưng có phương sai cao hơn. Điều này gợi ý rằng chúng ta có thể sử dụng phương sai của hai ước lượng không thiên lệch như là giá trò trung bình của việc chọn lựa giữa hai giá trò. Xét về trung bình, giá trò ước lượng với phương sai nhỏ hơn rõ ràng được mong muốn hơn vì nó gần với giá trò trung bình thực θ . Đó chính là khái niệm hiệu quả. ĐỊNH NGHĨA 2.8 (Hiệu Quả) a. Đặt 1 ˆ θ và 2 ˆ θ là hai ước lượng không thiên lệch của thông số θ . Nếu Var ( 1 ˆ θ ) < Var ( 2 ˆ θ ), thì chúng ta nói rằng 1 ˆ θ hiệu quả hơn 2 ˆ θ . Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 31 Thục Đoan/Hào Thi b. Tỉ số [Var ( 1 ˆ θ )]/[Var ( 2 ˆ θ )] được gọi là hiệu quả tương đối. c. Giữa tất cả những giá trò ước lượng không thiên lệch của θ , giá trò với phương sai nhỏ nhất được gọi là ước lượng không thiên lệch có phương sai tối thiểu. Chúng ta hãy ứng dụng đònh nghóa này vào ví dụ chiều cao. Đặt 1 ˆ θ là trung bình mẫu và 2 ˆ θ là trung bình độ cao của những người cao nhất và những người thấp nhất. Từ Tính chất 2.10a, Var ( 1 ˆ θ ) = σ 2 /n và Var ( 2 ˆ θ ) = σ 2 /2. Nếu cỡ mẫu lớn hơn hai, 1 ˆ θ có phương sai nhỏ nhất và dó đó rõ ràng sẽ được ưa thích hơn. Do vậy, 1 ˆ θ hiệu quả hơn 2 ˆ θ . S AI SỐ BÌNH PHƯƠNG TRUNG BÌNH Xem xét hai ước lượng: Một không thiên lệch và giá trò kia mặc dù thiên lệch nhưng lại có phương sai nhỏ hơn nhiều, hàm ý nói rằng, về mặt trung bình, nó có thể gần với giá trò trung bình thực hơn là giá trò ước lượng không thiên lệch. Trong trường hợp này, chúng ta có thể sẵn sàng cho phép một vài sai lệch để có thể có được lợi về phương diện phương sai. Một phương pháp cho phép việc đánh đổi này giữa sự không thiên lệch và phương sai là sai số bình phương trung bình. ĐỊNH NGHĨA 2.9 (Sai Số Bình Phương Trung Bình) a. Sai số bình phương trung bình của một ước lượng θ ˆ được đònh nghóa là MSE ( θ ) = E[( θ ˆ - θ ) 2 ], đó là giá trò kỳ vọng của bình phương độ lệch của θ ˆ từ θ . b. Nếu 1 ˆ θ và 2 ˆ θ là hai ước lượng thay thế của θ và MSE ( 1 ˆ θ ) < MSE ( 2 ˆ θ ), thì 1 ˆ θ được gọi là hiệu quả bình phương trung bình so với 2 ˆ θ . Nếu cả hai giá trò đều không thiên lệch, thì 1 ˆ θ sẽ hiệu quả hơn, như trong Đònh Nghóa 2.8a. c. Giữa tất cả các ước lượng có thể có của θ , giá trò với sai số bình phương trung bình nhỏ nhất được gọi là giá trò ước lượng sai số bình phương trung bình tối thiểu. Dễ dàng chỉ ra được sai số bình phương trung bình tương đương với tổng phương sai và bình phương của những độ thiên lệch. Do vậy, nếu b( θ ) = E( θ ˆ ) - θ là độ thiên lệch trong ước lượng θ ˆ , thì MSE = Var( θ ˆ ) + [b( θ )] 2 . Lưu ý rằng b( θ ) độc lập với các giá trò x và do đó nó cố đònh và không ngẫu nhiên. MSE = E[( θ ˆ - θ ) 2 ] = E[ θ ˆ - E( θ ˆ ) + E( θ ˆ ) – θ ] 2 = E[ θ ˆ - E( θ ˆ ) + b( θ )] 2 = E[ θ ˆ - E( θ ˆ )] 2 + [b( θ )] 2 + 2b( θ ) E[ θ ˆ - E( θ ˆ )] Số hạng đầu tiên là phương sai của θ ˆ và số hạng thứ ba bằng không bởi vì E( θ ˆ ) không ngẫu nhiên và do đó E[ θ ˆ - E( θ ˆ )] = E( θ ˆ ) - E( θ ˆ ) = 0. Kết quả mong muốn xuất hiện ngay theo sau. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 32 Thục Đoan/Hào Thi Khái niệm sai số bình phương trung bình được sử dụng thường xuyên hơn trong việc lựa chọn giữa những dự báo khác nhau của một biến ngẫu nhiên (xem Chương 11). Các dự báo thường bò thiên lệch – tức là, chúng ước lượng quá mức hoặc là ước lượng dưới mức một cách có hệ thống biến quan tâm – nhưng một vài giá trò dự báo có thể có phương sai nhỏ hơn. Do đó sai số bình phương trung bình là một đại lượng hữu ích vì nó có xét đến cả sự thiên lệch và phương sai của giá trò dự báo đó. Những Tính Chất Của Ước Lượng Cỡ Mẫu Lớn Tất cả những tính chất thảo luận trong phần trước thích hợp đối với những cỡ mẫu hữu hạn. Đôi khi một ước lượng có thể không mang một hay nhiều hơn những tính chất mong muốn trong một cỡ mẫu nhỏ, nhưng khi cỡ mẫu trở nên lớn, nhiều tính chất mong muốn có thể được duy trì. Do đó, nên quan tâm nghiên cứu đến những tính chất của các cỡ mẫu lớn này, hoặc tiệm cận. Trong những thảo luận sau đây, chúng ta cho cỡ mẫu n tăng lên không giới hạn. Bởi vì một ước lượng sẽ phụ thuộc vào n, nên chúng ta ký hiệu nó là n θ ˆ . N HẤT QUÁN Tính chất cỡ mẫu lớn thường được sử dụng nhất là tính nhất quán.Theo thuật ngữ trực giác, nhất quán có nghóa là khi n tăng lên, giá trò ước lượng n θ ˆ sẽ tiến đến giá trò θ thực. Hay nói cách khác, chúng ta biểu diễn một mẫu ngẫu nhiên của bất kỳ cỡ mẫu nào từ tổng thể lớn và tính θ ˆ . Tiếp theo chúng ta vẽ thêm một quan sát và tính toán lại θ ˆ với quan sát thêm này. Chúng ta lặp lại quá trình này nhiều lần, và nhận được một chuỗi các ước lượng cho θ . Nếu chuỗi này hội tụ về θ khi n tăng lên vô tận, thì θ ˆ là một giá trò ước lượng nhất quán của θ . Đònh nghóa chính thức của sự nhất quán được cho trong Đònh Nghóa 2.10. ĐỊNH NGHĨA 2.10 (Sự Nhất Quán) Một ước lượng n θ ˆ được gọi là một giá trò ước lượng nhất quán của θ nếu ∞→n lim P( θ − ε ≤ n θ ˆ ≤ θ + ε ) = 1, cho tất cả các ε > 0 . Tính chất này được biểu diễn như plim( n θ ˆ ) = θ . Chúng ta hãy nghiên cứu đònh nghóa này kỹ lưỡng hơn. Xem xét khoảng cố đònh (tức là, không ngẫu nhiên) ( θ − ε , θ + ε ), với ε là một số dương bất kỳ. Bởi vì n θ ˆ là một ước lượng phụ thuộc vào một mẫu các quan sát, nên nó là một biến ngẫu nhiên. Do đó chúng ta có thể tính xác suất mà n θ ˆ nằm trong khoảng xác đònh đó. Nếu xác suất này tăng lên 1 khi n tăng lên vô tận đối với bất kỳ giá trò ε > 0 nào, thì chúng ta nói rằng n θ ˆ là một ước lượng nhất quán của θ . Điểm này được minh họa trong Hình 2.9, nó biểu diễn phân phối mẫu của n θ ˆ = x cho nhiều giá trò khác nhau của cỡ mẫu n. Chúng ta lưu ý rằng phân phối này trở nên Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 33 Thục Đoan/Hào Thi ngày càng “bò nén chặt” khi cỡ mẫu tăng lên. Nói một cách khác, phương sai của n θ ˆ tiến đến 0 khi cỡ mẫu tăng lên. Trong giới hạn, phân phối của n θ ˆ sẽ trở thành điểm đơn θ . } Hình 2.9 Phân Phối Mẫu Của x Khi Cỡ Mẫu Tăng Lên, n 3 > n 2 > n 1 } Hình 2.10 Phân Phối Mẫu Của Một Ước Lượng Thiên Lệch, Nhưng Nhất Quán, n 3 > n 2 > n 1 Cần nhấn mạnh rằng, các khái niệm không thiên lệch và nhất quán tương đối khác nhau về quan điểm. Không thiên lệch có thể được duy trì cho bất kỳ cỡ mẫu nào, nhưng sự nhất quán thì hoàn toàn chỉ áp dụng được đối với khái niệm cỡ mẫu lớn. Hình 2.10 minh họa giá trò ước lượng thiên lệch nhưng nhất quán. Sự thiên lệch có bao hàm luôn sự nhất quán hay không? Hoàn toàn không, như sẽ chỉ ra trong ví dụ phản bác ngay sau đây. Quan sát đầu tiên, x 1 , là một giá trò ước lượng không thiên lệch của trò trung bình θ bởi vì E(x 1 ) = θ . Nhưng khi cho n →∞ thì sẽ không làm cho x 1 tiến đến θ với bất kỳ giá trò trung bình nào. f( x ) x θ n 3 n 2 n 1 f( θ ˆ ) θ ˆ n 3 n 2 n 1 Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 34 Thục Đoan/Hào Thi (Tiếp tục xem trong Phần 3.3 để thấy được những khái niệm này được ứng dụng trong kinh tế lượng như thế nào) K HÔNG THIÊN LỆCH TIỆM CẬN* Sự thiên lệch trong một ước lượng sẽ khác nhau giữa giá trò kỳ vọng của nó và thông số thực θ . Sự thiên lệch này có thể phụ thuộc vào cỡ mẫu, n. Nếu sự thiên lệch đi đến không khi n tăng lên vô cực, chúng ta nói rằng giá trò ước lượng là không thiên lệch tiệm cận. ĐỊNH NGHĨA 2.11 (Không Thiên Lệch Tiệm Cận)* Một ước lượng n θ ˆ được gọi là không thiên lệch tiệm cận nếu như ) ˆ ( n n E θ ∞→ lim = θ , hay nói cách khác, nếu )( θ n n b ∞→ lim = 0, với b n ( θ ) = E( n θ ˆ ) - θ . H IỆU QUẢ TIỆM CẬN* Không có một ước lượng đơn nào có thể hiệu quả nhất (tức là, có phương sai nhỏ nhất) cho tất cả các giá trò θ . Một vài giá trò khá tốt cho một số giá trò θ nào đó và những giá trò khác thì hiệu quả hơn trong những khoảng giá trò khác của θ . Ví dụ, đặt θ ˆ = 1,25, không cần biết giá trò của các quan sát là bao nhiêu. Nếu giá trò θ thực đúng bằng hay gần bằng 1,25, thì đây là ước lượng tương đối tốt; nhưng khi giá trò thực nằm ngoài 1,25, thì ước lượng này kém. Tuy nhiên, khi gặp phải những giá trò ước lượng nhất quán, thì khoảng giá trò của θ mà có một giá trò ước lượng hiệu quả hơn một giá trò ước lượng khác thu hẹp lại khi cỡ mẫu tăng lên. Trong giới hạn khi n → ∞, phân phối của tất cả các giá trò ước lượng nhất quán trở về giá trò thực θ (lưu ý là phương sai bằng không). Do đó ưu tiên thuộc về những giá trò ước lượng mà tiến đến giá trò thực θ theo cách nhanh nhất có thể (tức là, những giá trò mà phương sai của chúng hội tụ về không nhanh nhất). Đó chính là khái niệm hiệu quả tiệm cận được đònh nghóa một cách chính thức trong Đònh Nghóa 2.12. Theo thuật ngữ trực giác, ước lượng nhất quán, áp dụng cho cỡ mẫu lớn, sẽ hiệu quả tiệm cận khi phương sai của nó nhỏ hơn phương sai của bất kỳ ước lượng nhất quán nào khác. ĐỊNH NGHĨA 2.12 (Hiệu Quả Tiệm Cận)* Một ước lượng nhất quán 1 ˆ θ được gọi là hiệu quả tiệm cận nếu đối với tất cả các ước lượng nhất quán khác 2 ˆ θ       ∞→ ) ˆ ) ˆ ( lim 1 2 Var( Var θ θ n < 1 cho tất cả các giá trò θ } 2.7 Phân Phối Chi-Bình Phương, Phân Phối-t và Phân Phối-F [...]...Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 200 3- 2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Trong việc kiểm đònh các giả thuyết của những mô hình kinh tế lượng, có bốn phân phối được sử dụng chủ yếu Đó là phân phối chuẩn, phân phối chi-bình phương, phân phối-t của Student, và phân phối-F của Fisher Chúng ta... “đuôi” dài Một số tính chất của χ2 được tóm tắt trong Tính Chất 2.12 Hình 2.11 Phân Phối Chi-Bình Phương Với Các Bậc Tự Do d.f (n) 1, 5, và 10 f(χ2) n=1 n=5 n = 10 χ2 Ramu Ramanathan 35 Thục Đoan/Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 200 3- 2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Tính chất 2.12 2 a E( χ n )... xác suất xác đònh Một vài tính chất của phân phối-t được đưa ra trong Tính Chất 2. 13 Tính Chất 2. 13 Phân phối-t với n bậc tự do d.f có những tính chất sau a Phân phối-t là đối xứng qua gốc tọa độ và có hình dạng tương tự như trong phân phối chuẩn b Đối với ni lớn, phân phối-t tuân theo một cách gần đúng với phân phối N(0,1) Sự gần đúng là tương đối tốt ngay cả với n = 30 Như trong một ví dụ, với bậc... 2 a E( χ n ) = n, tức là, giá trò kỳ vọng của một biến ngẫu nhiên chi-bình phương chính là bậc tự do d.f của nó 2 2 b Phân phối chi-bình phương có tính chất cộng thêm; gọi là, nếu U ∼ χ m và V ∼ χ n với 2 U và V độc lập, thì tổng của chúng U + V ∼ χ m + n Do đó tổng của nhiều biến ngẫu nhiên chi-bình phương độc lập thì cũng là chi-bình phương với bậc tự do d.f tương đương với tổng của d.f c Nếu x1,... phân phối N(0,1) Sự gần đúng là tương đối tốt ngay cả với n = 30 Như trong một ví dụ, với bậc tự do d.f là 15, diện tích ở nhánh bên phải tại điểm 1,7 53 là 0,05, tức là P(t > 1,7 53) = 0,05 Bởi vì tính chất đối xứng này, P(t < 1,7 53 hoặc t Ramu Ramanathan 36 Thục Đoan/Hào Thi ... phân phối-t của Student, và phân phối-F của Fisher Chúng ta đã xem xét phân phối chuẩn và những tính chất của nó Trong phần này, chúng ta sẽ thảo luận ba phân phối còn lại Phân Phối Chi-Bình Phương Phân phối của tổng bình phương của n biến ngẫu nhiên chuẩn chuẩn hóa độc lập được 2 gọi là phân phối chi-bình phương (χ2) với n bậc tự do và được viết là χ n Chính thức hơn, xem xét n biến ngẫu nhiên Z1,... ∑(xi - µi)2/ σ i2 có phân phối chi-bình phương với n bậc tự do d.f Kết quả này có từ dữ kiện cho rằng Zi = (xi µi)/σi có phân phối chuẩn chuẩn hóa và Z là các biến độc lập, do đó làm cho tổng 2 bình phương của chúng bằng χ n Như trong một trường hợp đặc biệt, nếu µi = µ và 2 σ i2 = σ2 – tức là, nếu các giá trò Z là iid – thì ∑(xi - µi)2/σ2 ∼ χ n Bảng in trong bìa trước của quyển sách và Bảng A .3 của... + + Z n = ∑ Zi2 2 Phân phối của biến ngẫu nhiên U là χ n Bởi vì U không âm, nên phân phối chi2 bình phương chỉ được xác đònh trong khoảng 0 ≤ u ≤ ∞ Hàm mật độ của χ n chỉ phụ 2 thuộc vào một thông số, gọi là bậc tự do (thường viết tắt là d.f.) Trò trung bình của χ n có thể được xem là n Hình 2.11 biểu diễn đồ thò các mật độ chi-bình phương cho một số các giá trò chọn lọc của bậc tự do Chúng ta lưu... giả thuyết minh họa việc sử dụng phân phối chi-bình phương này Phân Phối-t Student 2 Phân phối của tỉ lệ giữa một biến chuẩn với căn bậc hai của χ n độc lập được gọi là 2 phân phối t Student với n bậc tự do (và được viết là tn) Giả sử Z ∼ N(0,1) và U ∼ χ n , với Z và U độc lập Đònh nghóa biến ngẫu nhiên t = Z/ U / n =(Z n )/ U Phân phối của t là phân phối-t với n bậc tự do Bảng nằm ở bìa sau của cuốn . Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 200 3- 2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 33 . Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 200 3- 2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 30 . X 3 2 1 4 0 y _ x _ Y X 3 2 1 4 Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 200 3- 2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại

Định dạng
Số trang	12
Dung lượng	174,18 KB