Giáo trình kinh tế chất lượng - ôn lại thống kê - 2 potx

12 209 0
Giáo trình kinh tế chất lượng - ôn lại thống kê - 2 potx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 13 Thục Đoan/Hào Thi Sự Độc Lập Thống Kê Các biến ngẫu nhiên rời rạc được gọi là sự độc lập thống kê nếu P(X = x và Y = y) = P(X = x) . P(Y = y). Vì vậy trong trường hợp này, xác suất kết hợp là tích của các xác suất riêng lẻ. Đối với trường hợp biến có dạng liên tục, chúng ta sẽ có f XY (x, y) = f X (x). f Y (y). Xác Suất Có Điều Kiện Để biết thêm về xác suất của những biến cố xảy ra kết hợp của hai biến ngẫu nhiên X và Y, chúng ta cũng cần nên biết về xác suất xảy ra của biến ngẫu nhiên cụ thể (Y) nào đó cho trước sự kiện đã xảy ra của một biến (X) ngẫu nhiên khác. Ví dụ, chúng ta có thể muốn biết xác suất để giá mua một căn nhà là 200.000 đô la, nếu cho trước diện tích sinh hoạt phải là 1.500 thước vuông Anh. Yêu cầu này sẽ dẫn chúng ta đến khái niệm xác suất có điều kiện, được đònh nghóa trong trường hợp biến ngẫu nhiên dạng rời rạc như sau: P(Y = y  X = x) = )xX(P )yY,xX(P = == với P(X = x) ≠ 0 Ký hiệu “” có nghóa là cho trước. Hàm mật độ xác suất có điều kiện (cho cả khi biến ngẫu nhiên là rời rạc và liên tục) được đònh nghóa như sau: f YX (x, y) = )x(f )y,x(f X XY với mọi giá trò của x sao cho f X (x) > 0 Trong đó f XY (x, y) là hàm mật độ xác suất kết hợp của X và Y và f X (x) là hàm mật độ xác suất của riêng biến X, thường được đề cập đến như là hàm mật độ cận biên của biến X. Lưu ý rằng xác suất có điều kiện phụ thuộc vào cả giá trò x và y. Khi cả hai biến ngẫu nhiên này phụ thuộc thống kê lẫn nhau thì phân phối xác suất có điều kiện trở thành các phân phối cận biên tương ứng. Để hiểu được điều này, hãy lưu ý rằng sự độc lập thống kê ngầm đònh f XY (x, y) = f X (x) . f Y (y). Rút ra từ kết luận này, chúng ta có: f YX (yx) = f XY (x, y)/f X (x) = f Y (y) và f XY (xy) = f XY (x, y)/f Y (y) = f X (x) } Bảng 2.4 Phân phối xác suất kết hợp đối với số lần xuất hiện các con số 3 (X) và số 5 (Y) khi một cặp súc sắc được thảy. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 14 Thục Đoan/Hào Thi X Y 0 1 2 0 16/36 8/36 1/36 1 8/36 2/36 0 2 1/36 0 0 } VÍ DỤ 2.9 Bảng 2.4 trình bày các giá trò xác suất kết hợp của số lần xuất hiện của số 3 (X) và số 5 (Y) khi một cặp súc sắc được thảy. Chúng ta hãy tính kết quả thứ nhất của mật độ cận biên của biến X và Y. Vì X = 0 có thể xảy ra khi Y = 0 hoặc 1 hoặc 2, P(X = 0) có thể tính toán được bằng P(X = 0, Y = 0) + P(X = 0, Y = 1) + P(X = 0, Y = 2) = 16/36 + 8/36 + 1/36 = 25/36. Tính toán tương tự, chúng ta có P(X = 1) = 10/36 và P(X = 2) = 1/36. Lưu ý rằng tổng của ba giá trò xác suất trên là bằng 1, vì điều này là hiển nhiên. Phân phối cận biên của Y cũng được xác đònh theo trình tự tính toán tương tự. Bảng 2.5 trình bày các giá trò cận biên của X và Y ở các hàng và cột ngoài cùng tương ứng. Lưu ý rằng các giá trò này xuất hiện với các quy luật giống nhau. } Bảng 2.5 Phân Phối Cận Biên Đối Với Số Lần Xuất Hiện Các Con Số 3 (X) Và Số 5 (Y) Khi Một Cặp Súc Sắc Được Thảy. X Y 0 1 2 f Y (y) 0 16/36 8/36 1/36 25/36 1 8/36 2/36 0 10/36 2 1/36 0 0 1/36 f X (x) 25/36 10/36 1/36 1 } Bảng 2.6 Phân Phối Có Điều Kiện Đối Với Số Lần Xuất Hiện Các Con Số 5 (Y) Cho Trước Số Lần Xuất Hiện Của Các Số 3 (X) Khi Một Cặp Súc Sắc Được Thảy. X Y 0 1 2 0 0,64 0,32 0,04 1 0,80 0,20 0,00 2 1,00 0,00 0,00 Xác suất có điều kiện để Y = 0 với X = 0 cho trước được tính toán như sau: P(Y = 0X = 0) = P(X = 0, Y = 0)/ P(X = 0) = 16/36 ÷ 25/36 = 0,64 Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 15 Thục Đoan/Hào Thi Tiến hành tương tự, chúng ta sẽ có được các giá trò phân phối có điều kiện của biến Y với X cho trước trình bày trong bảng 2.6. Giá Trò Kỳ Vọng Toán Học Trong Trường Hợp Hai Biến Khái niệm kỳ vọng toán học có thể mở rộng dễ dàng sang trường hợp các biến ngẫu nhiên gồm hai biến. Cho trước hàm g(X, Y) và hàm xác suất kết hợp f(x, y), giá trò kỳ vọng của g(X, Y) được xác đònh bằng cách nhân g(x, y) với f(x, y) và cộng tổng các giá trò có thể có của x và y. Chúng ta có các đònh nghóa sau đây. ĐỊNH NGHĨA 2.3 (GIÁ TRỊ KỲ VỌNG) Giá trò kỳ vọng của g(X, Y) được xác đònh như sau: E[g(X, Y)] = ∑ ∑ xy )y,x(f)y,x(g Trong đó phép tính tổng hai lần biểu diễn phép tính tổng trên tất cả các giá trò có thể có của x và y. (Vì vậy giá trò kỳ vọng sẽ bằng tổng có trọng số với giá trò xác suất kết hợp được dùng làm trọng số). Gọi µ x là giá trò kỳ vọng của biến ngẫu nhiên X, và µ y là giá trò kỳ vọng của biến ngẫu nhiên Y. Phương sai của chúng được xác đònh tương tự như trường hợp đơn biến: ])X[(E 2 x 2 x µ−=σ và ])Y[(E 2 y 2 y µ−=σ (2.5) } BÀI TẬP THỰC HÀNH 2.5 Từ các giá trò xác suất kết hợp cho trong bảng 2.4, hãy tính trò trung bình µ x = E(X), µ y = E(Y), và phương sai 2 x σ , 2 y σ . Hãy kiểm chứng rằng biến X và Y là không độc lập thống kê với nhau. Giá Trò Kỳ Vọng Có Điều Kiện và Phương Sai Có Điều Kiện Giá trò kỳ vọng của Y với X cho trước được gọi là giá trò kỳ vọng của Y với X cho trước. Một cách cụ thể hơn, đối với một cặp biến ngẫu nhiên rời rạc, thì E(YX =x) = ∑ =yY y f YX (x,y). Hay nói cách khác, đó là giá trò trung bình của Y sử dụng giá trò mật độ có điều kiện của ∑ =yY y f YX (x,y) như một trọng số. Giá trò kỳ vọng của Y với X cho trước Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 16 Thục Đoan/Hào Thi còn được gọi là giá trò hồi quy của Y theo X. Từ bảng 2.6, chúng ta có thể thấy rằng E(YX = 0) = (0,64 × 0) + (0,32 × 1) + (0,04 × 2) = 0,32 + 0,08 = 0,4; E(YX = 1) = 0,2; và E(YX = 2) = 0. Trong mô hình hồi quy đơn giản được trình bày trong ví dụ 1.1, chúng ta có PRICE = α + β SQFT + u. Nếu E(uSQFT) = 0 thì E(PRICESQFT) = α + β SQFT. Vì vậy, phần xác đònh của mô hình là giá trò kỳ vọng có điều kiện của biến PRICE với SQFT cho trước, khi E(uSQFT) = 0. Khái niệm giá trò kỳ vọng có điều kiện đã trình ở trên có thể mở rộng dễ dàng để tính toán phương sai có điều kiện, được xác đònh như sau. Gọi µ*(X) là giá trò kỳ vọng có điều kiện của Y cho trước X, được ký hiệu là E(YX). Phương sai có điều kiện của Y với X cho trước được đònh nghóa như sau Var(YX) = E YX [(Y – µ* ) 2 | X ]. Nói cách khác, cố đònh giá trò của biến X và tính toán giá trò trung bình có điều kiện của Y với X cho trước, và sau đó tính toán phương sai xung quanh giá trò trung bình này với trọng số là mật độ có điều kiện f YX (x,y). Một số tính chất của giá trò kỳ vọng có điều kiện sử dụng trong môn học kinh tế lượng được tóm tắt sau đây. Để hiểu rõ thêm về phần chứng minh, xin tham khảo tác giả Ramanathan (1993, phần 5.2). Tính chất 2.4 Đối với mọi hàm u(x) thì ta luôn có E[u(x)X] = u(x). Tính chất này ngầm đònh rằng khi tiến đến giá trò kỳ vọng có điều kiện cho trước X thì hàm u(X) tiến đến giá trò hằng số. Do đó, một trường hợp đặc biệt được suy ra là nếu c là hằng số thì E(cX) = c. Tính chất 2.5 E([a(x) + b(X)Y]X) = a(X) + b(X) E(YX) Tính chất 2.6 E XY (Y) = E X [E YX (YX)]. Tính chất này có nghóa là giá trò kỳ vọng không điều kiện của Y, sử dụng mật độ chung giữa X và Y, có thể tính toán được bằng cách tính trước tiên giá trò kỳ vọng có điều kiện của Y với X cho trước (là biểu thức trong dấu ngoặc vuông), sau đó tính giá trò kỳ vọng của chúng theo X. Tính chất này được gọi là luật của các giá trò kỳ vọng lặp (law of iterated expectations). Tính chất 2.7 Var(Y) = E X [Var(YX)] + Var X [E(YX)]. Nói cách khác, giá trò phương sai của Y sử dụng hàm mật độ kết hợp f XY (x, y) tính toán được sẽ tương đương với giá trò kỳ vọng của phương sai có điều kiện của biến Y cộng với phương sai của giá trò kỳ vọng có điều kiện của biến Y với X cho trước. Đồng phương sai và tương quan Khi gặp phải hai biến ngẫu nhiên, một trong những vấn đề thường thu hút sự quan tâm là mối quan hệ giữa hai biến này như thế nào? Khái niệm đồng phương sai và tương quan là hai cách để đo lường mức độ quan hệ “chặt” giữa hai biến ngẫu nhiên đó. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 17 Thục Đoan/Hào Thi Hãy xem xét hàm g(X, Y) = (X – µ X )(Y – µ Y ). Giá trò kỳ vọng của hàm số này được gọi là đồng phương sai giữa X và Y và được ký hiệu là σ XY hay Cov(X, Y). ĐỊNH NGHĨA 2.4 (ĐỒNG PHƯƠNG SAI) Giá trò đồng phương sai giữa X và Y được xác đònh như sau σ xy = Cov(X, Y) = E[(X – µ x )(Y – µ y )] = E[XY – Xµ y – µ x Y + µ x µ y ] (2.6) = E(XY) – µ y E(X) – µ x E(Y) + µ x µ y = E(XY) – µ x µ y Dễ dàng suy ra từ kết luận trên rằng Cov(X,X) = Var(X) Các đònh nghóa về phương sai và đồng phương sai đều đúng trong cả hai trường hợp phân phối có dạng rời rạc và liên tục. Vì phương sai chỉ là một đại lượng đo lường mức độ phân tán của biến ngẫu nhiên xung quanh giá trò trung bình, nên đồng phương sai giữa hai biến ngẫu nhiên sẽ là đại lượng đo lường mức độ liên kết chung giữa chúng. Giả sử rằng hai biến ngẫu nhiên rời rạc X và Y quan hệ đồng hướng với nhau, và do đó khi giá trò Y tăng thì giá trò X cũng tăng theo như biểu diễn trên hình 2.6. Các vòng tròn nhỏ biểu thò các cặp giá trò của X và Y tương ứng với các kết quả khả dó giới hạn. Đường gạch chấm biểu diễn giá trò trung bình µ x và µ y . Bằng cách chuyển trục toạ độ đến đường gạch chấm này với gốc toạ độ là (µ x , µ y ), chúng ta có thể thấy rằng X i – µ x và Y i – µ y là độ dài tính từ gốc toạ độ mới, đối với một kết quả nào đó được ký hiệu bằng hậu tố i . Từ hình vẽ, có thể chứng minh rằng các điểm nằm trong phần tư thứ nhất và thứ ba sẽ làm cho tích (X i – µ x )(Y i – µ y ) luôn có giá trò dương, vì từng số hạng trong biểu thức sẽ cùng dương hoặc cùng âm. Khi chúng ta tính toán đại lượng đồng phương sai là tổng có trọng số các tích biểu thức trên, kết quả cuối cùng có khuynh hướng nhận giá trò dương vì có nhiều số hạng dương hơn các số hạng âm. Vì vậy, giá trò đồng phương sai có khuynh hướng dấu dương. Trong trường hợp cả hai biến X và Y di chuyển theo hướng ngược lại, giá trò Cov(X, Y) sẽ có dấu âm. Mặc dù đại lượng đồng phương sai rất có ích trong việc xác đònh tính chất của mối liên kết giữa X và Y nhưng nó tồn tại một vấn đề khá nghiêm trọng là các giá trò tính bằng số rất nhạy đối với giá trò đơn vò dùng để đo biến X và Y. Nếu X là một loại biến tài chính tính bằng đô-la hơn là tính bằng đơn vò ngàn đô-la, đại lượng đồng phương sai sẽ dốc đứng do ảnh hưởng của hệ số 1.000. Để tránh vấn đề này, người ta sẽ sử dụng đại lượng đồng phương sai “được chuẩn hóa”. Đại lượng này còn được gọi là hệ số tương quan giữa biến X và Y và được ký hiệu là ρ xy . ĐỊNH NGHĨA 2.5 (HỆ SỐ TƯƠNG QUAN) Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 18 Thục Đoan/Hào Thi Hệ số tương quan giữa biến X và Y được đònh nghóa như sau: 2/1 yx xy xy )]Y(Var)X(Var[ )Y,X(Cov = σσ σ =ρ (2.7) Nếu biến X và Y có quan hệ dương thì hệ số tương quan sẽ có dấu dương. Nếu biến X và y có quan hệ âm thì chúng sẽ di chuyển theo hướng ngược lại. Trong trường hợp này, giá trò đồng phương sai và hệ số tương quan đều có dấu âm. Hệ số tương quan hoàn toàn có thể bằng zero. Trong trường hợp này, chúng ta có thể kết luận rằng biến x và y không có tương quan. Người ta có thể viết rằng 1 2 xy ≤ρ hay tương đương với ρ xy  ≤ 1. Giá trò ρ xy sẽ bằng 1 khi và chỉ khi có một mối quan hệ tuyến tính chính xác giữa X và Y theo biểu thức Y – µ y = β( X – µ x ). Nếu ρ xy  = 1 thì quan hệ giữa X và Y được gọi là tương quan hoàn hảo. Nêu lưu ý rằng mối tương quan hoàn hảo chỉ xảy ra khi giữa X và Y có mối quan hệ tuyến tính một cách chính xác. Ví dụ, Y có thể xuất hiện trong biểu thức dạng Y = X 2 , rõ ràng là có biểu hiện mối quan hệ nhưng hệ số tương quan giữa X và Y sẽ không thể bằng 1. Vì vậy, hệ số tương quan sẽ đo lường phạm vi của mối liên kết tuyến tính giữa hai biến. Nếu biến X và Y là hai biến độc lập thì f XY (x, y) = f X (x) . f Y (y), có nghóa là xác suất kết hợp chính là tích của các xác suất riêng lẻ. Trong trường hợp này, nên lưu ý từ đònh nghóa của σ xy , chúng ta có )y(f)x(f)y)(x( yxy xy xxy µ−µ−=σ ∑∑ Vì biến x và y bây giờ có thể tách rời nhau nên chúng ta có       µ−       µ−=σ ∑∑ y yy x xxxy )y(f)y()x(f)x( )()( yx YEXE µ µ − −= Nhưng do E(X – µ x ) = E(X) – µ x = 0 (xin xem tính chất 2.1a), nên σ xy = 0 và ρ xy = 0 nếu hai biến ngẫu nhiên này là độc lập. Hay nói cách khác, nếu biến X và Y là hai biến độc lập thì chúng sẽ không tương quan nhau. Kết luận ngược lại có thể không còn chính xác (nghóa là mối tương quan zero sẽ không ngầm đònh tính chất độc lập), và có thể kiểm chứng thông qua các ví dụ sau. Đặt f XY (x, y) tương tự như trong bảng 2.7. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 19 Thục Đoan/Hào Thi Cov(X, Y) = E(XY) – E(X) E(Y) E(X) = (1 × 0,4) + (2 × 0,2) + (3 × 0,4) = 2 E(Y) = (6 × 0,4) + (8 × 0,2) + (10 × 0,4) = 8 E(XY) = (6 × 1 × 0,2) + (6 × 3 × 0,2) + (8 × 2 × 0,2) + (10 × 1 × 0,2) + (10 × 3 × 0,2) = 16 Vì vậy, Cov(X, Y) = 0. Nhưng biến X và Y là không độc lập vì P(X = 2, Y = 6) = 0, P(X = 2) = 0,2, và P(Y = 6) = 0,4. Do đó, xác suất kết hợp sẽ không thể bằng tích của các xác suất riêng lẻ. } BÀI TẬP THỰC HÀNH 2.6 Sử dụng các biến X và Y với xác suất kết hợp cho trong bảng 2.4, hãy tính giá trò Cov(X, Y) và ρ xy (lưu ý rằng bạn đã tính giá trò trung bình và phương sai trong bài tập 2.5) } BÀI TẬP THỰC HÀNH 2.7 + Giả sử biến ngẫu nhiên X chỉ có thể nhận các giá trò 1, 2, 3, 4, và 5, mỗi giá trò ứng với xác suất bằng nhau và bằng 0,2. Cho Y = X 2 . Hãy tính hệ số tương quan giữa X và Y và chứng minh rằng hệ số này không bằng 1, cho dù giữa biến X và Y có mối quan hệ chính xác. } Bảng 2.7 Ví Dụ Cho Thấy Đồng Phương Sai Bằng Không Không Nhất Thiết Phải Là Độc Lập X Y 6 8 10 F X (x) 1 0,2 0 0,2 0,4 2 0 0,2 0 0,2 3 0,2 0 0,2 0,4 F Y (y) 0,4 0,2 0,4 1 Tính chất 2.8 liệt kê một số tính chất liên quan đến hai biến ngẫu nhiên. Tính chất 2.8 a. Nếu a và b là hằng số thì Var(aX + bY) = a 2 Var(X) + b 2 Var(Y) + 2abCov(X,Y). Một trường hợp đặc biệt của tính chất này là Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y). Tương tự, Var(X – Y) = Var(X) + Var(Y) – 2Cov(X, Y). b. Hệ số tương quan ρ xy nằm trong khoảng – 1 đến + 1. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 20 Thục Đoan/Hào Thi c. Nếu X và Y là hai biến độc lập thì σ xy = Cov(X, Y) = 0; có nghóa là, X và Y không tương quan nhau. Trong trường hợp này, kết hợp (a) và hệ quả rút ra từ tính chất này, ta có Var(X + Y) = Var(X) + Var(Y) và Var(X – Y) = Var(X) + Var(Y). d. Giá trò ρ xy  sẽ bằng 1 khi và chỉ khi tồn tại mối quan hệ tuyến tính chính xác giữa X và Y theo biểu thức Y – µ y = β( X – µ x ). e. Giá trò tương quan giữa biến X và chính nó bằng 1. f. Nếu U = a 0 + a 1 X, V = b 0 + b 1 Y, và a 1 b 1 > 0 thì ρ uv = ρ xy ; nghóa là hệ số tương quan sẽ thay đổi trong trường hợp đơn vò đo được điều chỉnh theo tỷ lệ. Nếu a 1 b 1 < 0 thì ρ uv = – ρ xy . Tuy nhiên, nếu U = a 0 + a 1 X + a 2 Y, V = b 0 + b 1 X + b 2 Y thì ρ uv ≠ ρ xy . Điều này có nghóa là giá trò tương quan không thay đổi trong trường hợp có sự biến đổi tuyến tính tổng quát (a i và b i được giả thiết có giá trò khác zero). g. Nếu giá trò a 1 , a 2 , b 1 và b 2 là cố đònh thì Cov(a 1 X + a 2 Y, b 1 X + b 2 Y) = a 1 b 1 Var(X) + (a 1 b 2 + a 2 b 1 )Cov(X, Y) + a 2 b 2 Var(Y). Phân Phối Nhiều Biến * Trong phần này, các khái niệm vừa trình bày ở trên sẽ được mở rộng cho trường hợp có nhiều hơn hai biến ngẫu nhiên. Gọi x 1 , x 2 , …, x n tương ứng với n số biến ngẫu nhiên. Và hàm mật độ xác suất kết hợp của chúng là f X (x 1 , x 2 , …, x n ). Tương tự như trước đây, chúng là độc lập nếu hàm mật độ xác suất PDF chung là tích của mỗi PDF riêng lẻ. Vì vậy, chúng ta có f X (x 1 , x 2 , …, x n ) = f X1 (x 1 ) . f X2 (x 2 ) . . . f Xn (x n ) Trong trường hợp đặc biệt khi mỗi giá trò x được phân phối giống nhau và độc lập lẫn nhau (được ký hiệu là iid – independently and idetically distributed), chúng ta có f X (x 1 , x 2 , …, x n ) = f X (x 1 ) . f X (x 2 ) . . . f X (x n ) Trong đó f X (x) là hàm phân phối chung của mỗi giá trò x. Một số kết quả đáng quan tâm về phân phối đa biến được trình bày trong tính chất 2.9. Tính chất 2.9 a. Nếu a 1 , a 2 , …, a n là hằng số hoặc không ngẫu nhiên thì E[a 1 x 1 + a 2 x 2 + . . . + a n x n ] = a 1 E(x 1 ) + a 2 E(x 2 ) + . . . + a n E(x n ). Vì vậy, giá trò kỳ vọng của một tổ hợp tuyến tính các số hạng bằng tổ hợp tuyến tính của mỗi giá trò kỳ vọng riêng lẻ. Trong ký hiệu phép lấy tổng, ta có E[Σ(a i x i )] = ΣE(a i x i ) = Σa i E(x i ). b. Nếu mỗi x i đều có giá trò trung bình bằng nhau thì E(x i ) = µ, chúng ta có E(Σa i x i ) = µΣa i . Đặc biệt, nếu tất cả hệ số a i đều bằng nhau và bằng 1/n thì chúng ta sẽ có Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 21 Thục Đoan/Hào Thi E(Σx i /n) = E( x ) = µ. Vì vậy, giá trò kỳ vọng của giá trò trung bình của các biến ngẫu nhiên có phân phối giống nhau sẽ bằng giá trò trung bình chung của chúng. c. Var[Σ(a i x i )] = Σ i 2 i a Var(x i ) + ∑ ∑ ≠ ji ji aa Cov(x i , x j ), trong đó các hệ số a i được giả thiết là hằng số hoặc không ngẫu nhiên. d. Nếu tất cả các biến x 1 , x 2 , . . ., x n đều độc lập thì mỗi cặp tương quan (ρ ij ) và đồng phương sai sẽ bằng zero hay Cov(x i , x j ) = 0 = ρ ij với mọi i ≠ j. e. Từ (c) và (d) ta có thể rút ra kết luận rằng khi biến x độc lập thì Var[Σ(a i x i )] = Σ 2 i a Var(x i ), vì số hạng đồng phương sai sẽ không tồn tại nữa. Do đó, phương sai của tổng các biến ngẫu nhiên độc lập sẽ bằng tổng các phương sai. Đặc biệt, nếu tất cả các giá trò phương sai đều bằng nhau, nghóa là Var(x i ) = σ 2 với mỗi i, thì Var[Σ(a i x i )] = σ 2 Σ 2 i a . f. Nếu tất cả các x 1 , x 2 , . . ., x n đều là biến ngẫu nhiên độc lập nghóa là tập biến x i có phân phối chuẩn với giá trò trung bình µ i và phương sai 2 i σ hay được thể hiện bằng ký hiệu x i ∼ N(µ i , 2 i σ ) thì tổ hợp tuyến tính của tập biến x cho trước có dạng a 1 x 1 + a 2 x 2 + . . . + a n x n cũng sẽ có dạng phân phối chuẩn với giá trò trung bình là a 1 µ 1 + a 2 µ 2 + . . . + a n µ n và giá trò phương sai là 2 1 2 1 a σ + 2 2 2 2 a σ + . . . + 2 n 2 n a σ . Trong ký hiệu phép lấy tổng, chúng ta có thể viết như sau U = Σ( a i x i ) ∼ N[(Σa i µ i ), (Σ 2 i 2 i a σ )]. g. Nếu tất cả các x 1 , x 2 , . . ., x n đều độc lập và có phân phối giống nhau (iid) tuân theo phân phối chuẩn N(µ, σ 2 ) thì giá trò trung bình của chúng là x = (1/n)Σx i sẽ có dạng phân phối chuẩn với giá trò trung bình bằng µ và phương sai bằng σ 2 /n, nghóa là x ∼ N(µ, σ 2 /n). Tương tự, chúng ta có z = σµ− /)x(n ∼ N(0, 1). } 2.4 Lấy Mẫu Ngẫu Nhiên và Các Phân Phối Lấy Mẫu Một kiểm đònh bằng thống kê có thể phát sinh thêm ngoài nhu cầu giải quyết một bài toán cụ thể nào đó. Nó có thể là một sự cố gắng nhằm giải thích một cách hợp lý hành vi trong quá khứ của một tác nhân nào đó hay dự báo các hành vi trong tương lai của chúng. Trong việc đònh dạng vấn đề, điều quan trọng là phải xác đònh được một không gian thống kê hợp lý, hay tổng thể mà bao gồm tổng tất cả các phần tử có liên quan đến thông tin yêu cầu. Thuật ngữ tổng thể được dùng theo một nghóa tổng quát và không chỉ giới hạn khi đề cập đến các sinh vật mà thôi. Tất cả các hạt giống trong thùng lưu trữ, mọi công ty trong thành phố, và tất cả các bồn sữa được sản xuất bởi trại bò sữa cũng được gọi là tổng thể. Một nhà phân tích sẽ quan tâm nhiều đến những kết luận rút ra về những tính chất của tổng thể. Điều hiển nhiên là chi phí sẽ rất cao nếu nghiên cứu từng phần tử của tập chính để đưa ra các kết luận. Do đó mà nhà phân tích sẽ chọn ra một mẫu gồm một số phần tử, tiến hành quan sát chúng, và sử dụng những quan sát này để rút các kết luận về đặc điểm của tổng thể mà mẫu phần tử làm đại diện. Quá trình này được gọi là lấy mẫu. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 22 Thục Đoan/Hào Thi Có thể có rất nhiều cách lấy mẫu: lấy mẫu ngẫu nhiên, lấy mẫu phán đoán, lấy mẫu chọn lọc, lấy mẫu có hoặc không có hoàn trả phần tử trở lại tổng thể, lấy mẫu phân tầng, v.v. Trong tài liệu này, chúng tôi chỉ đề cập đến lấy mẫu ngẫu nhiên, là cách lấy mẫu thường dùng nhất. ĐỊNH NGHĨA 2.6 (Lấy mẫu ngẫu nhiên) Một mẫu ngẫu nhiên đơn giản của n yếu tố là một mẫu có tính chất rằng mọi tổ hợp của n yếu tố đều có một cơ hội là mẫu được chọn bằng nhau. Một mẫu ngẫu nhiên của các quan sát đối với một biến ngẫu nhiên X là một tập hợp của các biến ngẫu nhiên độc lập, được phân phối giống nhau (iid) X 1 , X 2 , . . . , X n , mỗi biến có cùng phân phối xác suất như phân phối của X. Các Phân Phối Mẫu Một hàm của các giá trò quan sát của các biến ngẫu nhiên không chứa bất kỳ thông số chưa biết nào được gọi là một trò thống kê mẫu. Hai trò thống kê mẫu được sử dụng một cách thường xuyên nhất là trung bình mẫu (ký hiệu là x _ ) và phương sai mẫu (ký hiệu là s 2 ): Trung bình mẫu: x _ = (x 1 + x 2 + . . . + x n )/n = 1 n ∑x I (2.8) Phương sai mẫu: s 2 = 1 ( n − 1) (x 1 – x _ ) 2 + 1 ( n − 1) (x 2 – x _ ) 2 (2.9) + . . . + 1 ( n − 1) (x n – x _ ) 2 = 1 ( n − 1) ∑ (x i - x _ ) 2 Lý do phải chia cho n – 1 chứ không phải là n được giải thích trong Phần 2.7. Căn bậc hai của phương sai mẫu ( s) được gọi là độ lệch chuẩn mẫu hay sai số chuẩn. Sự khác biệt giữa một trò thống kê mẫu và một thông số tổng thể phải được hiểu một cách rõ ràng. Giả sử biến ngẫu nhiên X có giá trò kỳ vọng µ và phương sai σ 2 . Đây là những thông số tổng thể có giá trò cố đònh và không ngẫu nhiên. Tuy nhiên ngược lại trung bình mẫu x _ và phương sai mẫu s 2 là các biến ngẫu nhiên. Điều này là do những thử nghiệm khác nhau của một thí nghiệm cho các giá trò trung bình mẫu và phương sai khác nhau. Bởi vì các trò thống kê này là các biến ngẫu nhiên, nó có ý nghóa khi nói về các phân phối của chúng. Nếu chúng ta rút ra một mẫu ngẫu nhiên có cỡ mẫu là n và tính trung bình mẫu x _ , chúng ta thu được một giá trò nhất đònh. Lặp lại thí nghiệm này nhiều lần, mỗi lần rút ra một mẫu ngẫu nhiên có cùng cỡ mẫu n. Chúng ta sẽ có được nhiều giá trò của trung bình mẫu. Chúng ta khi đó có thể tính tỷ số những lần mà các giá trò trung bình [...]...Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 20 0 3 -2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê này rơi vào một khoảng xác đònh Tỷ số này cho chúng ta xác suất mà tại đó trung bình mẫu sẽ nằm trong khoảng xác đònh đó (xem khái niệm tần suất trong xác suất đã được giới thiệu trong Phần 2. 1 và trong Ví dụ 2. 1) Bằng cách... chất 2. 11 Ramu Ramanathan 23 Thục Đoan/Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 20 0 3 -2 004 Tính chất 2. 11 a Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê _ Luật số lớn: Gọi Z là trung bình của một mẫu ngẫu nhiên các giá trò Z1, Z2, , _ Zn , được phân phối một cách độc lập và giống nhau Khi đó Z hội tu về E(Z) Nói ngắn gọn... (0,1) Các công thức của phân phối của phương sai mẫu được xác đònh trong Phương trình (2. 9) sẽ được bàn tiếp ở Phần 2. 7 Các phân phối Mẫu Lớn Khi cỡ mẫu lớn, chúng ta có thể thu được từ một số tính chất khá hữu ích trong thực tế Hai trong số này là luật số lớn và lý thuyết giới hạn trung tâm được phát biểu ở Tính chất 2. 11 Ramu Ramanathan 23 Thục Đoan/Hào Thi Chương trình Giảng dạy Kinh tế Fulbright... Tính chất 2. 9g, chúng ta thấy rằng sự kết hợp tuyến tính này cũng có một phân _ _ phối chuẩn Cụ thể là x cũng có trung bình µ và Var(x) = 2 / n Do đó chúng ta có tính chất sau Tính chất 2. 10 a Nếu một mẫu ngẫu nhiên x1, x2, , xn được rút ra từ một tổng thể chuẩn với trung _ bình µ và phương sai 2, trung bình mẫu x được phân phối chuẩn với trung bình µ và _ phương sai 2/ n Vì vậy, x ∼ N (µ, 2/ n)... mối quan tâm đáng kể trong kinh tế lượng và thống kê, đặc biệt là khi tổng thể mà các quan sát được rút ra từ đó có phân phối chuẩn Cho X là một biến ngẫu nhiên có phân phối chuẩn với trung bình µ và phương sai 2 Vì vậy, X ∼ N(µ, 2) Hãy rút ra một mẫu ngẫu nhiên có cỡ n từ tổng thể, _ đo lường biến ngẫu nhiên, và thu được các quan sát x1, x2, , xn Phân phối mẫu của x và s2? Chúng ta lưu ý rằng trung... như chuẩn nhưng chúng ta không biết trò trung bình, µ, của phân phối, hay phương sai của nó, 2 Vấn đề của việc ước lượng đơn giản chỉ là một cách lựa chọn một mẫu các đối tượng, đo đạc chiều cao từng người một, và sau đó dùng các phương pháp đònh lượng để thu được các ước lượng của µ và 2 Thuật ngữ ước lượng được dùng để chỉ công thức cho chúng ta giá trò bằng số của các thông số được quan tâm Mỗi... đến đây chúng ta đã có thảo luận các chủ đề cụ thể về xác suất và thống kê để tự chuẩn bò cho hai mục tiêu cơ bản của bất kỳ một nghiên cứu thực nghiệm nào: việc ước lượng các thông số chưa biết và việc kiểm đònh các giả thuyết Trong phần này chúng ta sẽ thảo luận vấn đề của việc ước lượng Kiểm đònh giả thuyết sẽ được đề cập ở Phần 2. 8 Trong một khảo sát thực nghiệm, nhà phân tích thường vẫn biết,... ra khi Z = x _ _ , trung bình mẫu Bởi vì E(x) = µ, trung bình của tổng thể, x hội tụ về µ Tương tự s2 _ = [∑(xi – x )2] / (n –1) hội tụ về 2 khi n tiến tới vô cực b Lý thuyết giới hạn trung tâm: Gọi x1, x2, , xn là mẫu ngẫu nhiên của các quan sát từ cùng một phân phối và gọi E(xi) = µ và Var(xi) = 2 Khi đó phân phối mẫu _ của biến ngẫu nhiên Zn = √n (x − µ) / σ hội tụ về phân phối chuẩn chuẩn hóa... xuất phát của các quan sát là không chuẩn Điều này có nghóa là nếu chúng ta chắc chắn rằng cỡ mẫu là lớn, thì chúng ta có thể sử dụng biến ngẫu nhiên Zn được xác đònh ở trên để trả lời các câu hỏi về tổng thể của các quan sát mà chúng ta rút ra được, và chúng ta không cần biết phân phối chính xác của tổng thể mà từ đó các quan sát được rút ra 2. 5 Các thủ tục Ước lượng Các Thông số Cho đến đây chúng ta... cách tương tự, chúng ta có thể tính phương sai mẫu cho mỗi lần lặp lại thử nghiệm đó và sử dụng các giá trò khác nhau có được từ cách này để đạt được phân phối của phương sai mẫu Bởi vì trung bình và phương sai mẫu này là dành cho một mẫu có kích cỡ xác đònh là n, chúng ta sẽ kỳ vọng các phân phối mẫu phụ thuộc vào n cũng như vào những thông số của phân phối tổng thể mà mẫu đã được rút ra từ đó Lấy Mẫu . Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 20 0 3 -2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 21 . Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 20 0 3 -2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan 23 . trước Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 20 0 3 -2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 2: Ôn lại xác suất và thống kê Ramu Ramanathan

Ngày đăng: 12/08/2014, 06:22

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan