Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
344,48 KB
Nội dung
CHƯƠNG 1: ƠN TẬP 1.1 Trung bình mẫu – Phương sai mẫu 1.1.1 Trung bình mẫu Trong phân tích liệu, sống hàng ngày, thường nói đến chiều cao trung bình, thu nhập trung bình, vân vân Đó trung bình mẫu Hãy xét ví dụ sau: Ví dụ 1.1: Bảng quan sát nhiệt độ Đà Lạt Thứ Thứ Thứ Thứ (x1) (x2) (x3) (x4) 19o 21o 20o 18o ⇒ x = (19 + 21 + 20 + 18) = 19.5 o Một cách khái quát, trung bình mẫu tính cơng thức sau: x= (x1 + x2 + x3 + + xN ) N N Hay: x = xn N∑ n =1 1.1.2 Phương sai mẫu Phương sai mẫu [ký hiệu s X ] trung bình tổng bình phương độ lệch giá trị quan sát so với giá trị trung bình: sX = ( ) ( ) ( ( ) ) 2 1⎡ x1 − x + x − x + xN − x ⎤ ⎥ ⎣ ⎦ N⎢ Hay: sX = N xn − x N∑ n =1 Chẳng hạn, trung bình mà nói khí hậu sa mạc nóng Hơn nhiệt độ giao động lớn ngày đêm Để thể khắc nghiệt khí hậu sa mạc, khơng sử dụng trung bình (mẫu) nhiệt độ, mà giao động nhiệt độ theo thời điểm so với trung bình Đó khái niệm phương sai mẫu nói 1.2 Hàm mật độ xác suất, hàm phân bố xác suất 1.2.1 Tần suất xác suất Để có hình dung tần suất, xét ví dụ sau: Ví dụ 1.2: Xếp hạng tốc độ gia tăng giá cổ phiếu thị trường chứng khoán Việt Nam Gọi X tỉ lệ phần trăm mức tăng giá cổ phiếu trung bình tháng sau “lên sàn”; gọi P phần trăm công ty có mức tăng giá cổ phiếu tương ứng với giá trị X X 50% 40% 30% 20% (x1) (x2) (x3) (x4) Y 10% 20% 35% 25% Con số P= 10%, X= 50% có nghĩa có 10% tổng số cơng ty có mức tăng giá tháng đầu sau phát hành cổ phiếu công chúng 50% Đó ví dụ tần suất Ví dụ 1.3: Trị chơi tung đồng xu Giả sử bạn tham gia chơi tung đồng xu hội chợ Nếu mặt sấp, bạn $100 Ngược lại, mặt ngửa, bạn $0 Với thể lệ đó, bạn sẵn sàng trả đơla để tham gia trị chơi? Để cho tiện, kí hiệu mặt sấp 1, mặt ngửa Giả sử kết tung xu sau 10 lần sau: X P 3/10 7/10 Con số 3/10 tần suất xuất mặt sấp (X = 1) Nghĩa là, 10 lần tung xu, có lần xuất mặt sấp Và đó, có lần xuất mặt ngửa Số tiền bạn bỏ cho việc tham dự 10 lần tung xu là: $50 x 10 = $500 Số tiền nhận chơi: $100 x + $0 x = $300 Do vậy, chơi không hứng thú bạn ($500 > $300) Tuy nhiên, giả sử bạn tham dự chơi vơ hạn lần Khi đó, số lần xuất mặt sấp mặt ngửa nhau, ½ Khi đó, kỳ vọng đượccuộc là: $100x1/2 + $0x1/2 = $50; số tiền lớn bạn sẵn sàng trả để tham dự chơi Điều cần phân biệt số P = 3/10 ví dụ nêu tần suất xuất mặt sấp 10 lần thử Và số ½ xác suất xuất mặt sấp (hoặc ngửa) Khái niệm tần suất ứng với mẫu thử; xác suất tương ứng với tổng thể 1.2.2 Biến ngẫu nhiên rời rạc liên tục 2.2.1 Biến ngẫu nhiên rời rạc: Một biến ngẫu nhiên rời rạc giá trị có lập nên tập hợp hữu hạn đếm được, nghĩa liệt kê tất giá trị có Cuộc chơi tung xu nêu ví dụ biến ngẫu nhiên rời rạc Một cách hình thức hóa, ta nói sau Giả sử đối tượng quan sát X xuất K kiện khác [trong ví dụ tung xu, K = 2] Ta ký hiệu kiện x1 , x2 , , x K Tần suất xuất biến cố x k N phép thử, ký hiệu p k , tỉ số số lần xuất biến cố cụ thể so với N phép thử thực Với số, k = 1,2,3, , K , ta viết sau: X P x1 p1 x2 p2 x3 p3 … … xK pK p1, p2, p3,… pK > 0, p1 + p2 + p3 + …… + pK = 1, hay vậy, K ∑p k =1 k =1 Nếu số mẫu N đủ lớn (tiến đến vô hạn), khái niệm tần suất xuất biến cố thay khái niệm xác suất xuất biến cố, ký hiệu bởi: f k = f ( x k ), k = 1,2, , K Trong đó, f ( x k ) hàm mật độ xác suất x k , k = 1,2 K Ta có, f1, f2, f3,… fK > 0, K ∑f k =1 k =1 2.2.2 Biến ngẫu nhiên liên tục Một biến ngẫu nhiên liên tục giá trị có lắp đầy khỏang trục số, nghĩa liệt kê đếm tất giá trị có Tương tự với trường hợp phân bố xác suất rời rạc, gọi X biến ngẫu nhiên liên tục; f(x) hàm mật độ xác suất X Khi đó: f ( x) ≥ ∫ +∞ −∞ f ( x)dx = Ta định nghĩa hàm phân bố xác suất X là: F ( x) = ∫ x −∞ f (t )dt Điều có nghĩa là, xác suất biến ngẫu nhiên X nhận giá trị khoảng [a, b] là: b P(a ≤ X ≤ b) = ∫ f ( x)dx = F (b) − F (a) a Ví dụ, phân bố chuẩn, đồ thị ta biểu diễn cơng thức tính xác suất sau: Đồ thị 1.1: Phân bố xác suất Phần tơ đậm xác suất P ( a ≤ X ≤ b) , tính tích phân: ∫ b a f ( x)dx = F (b) − F (a) 1.3 Phân bố xác suất đồng thời Nhiều muốn đưa đánh giá xác suất đồng thời cho số biến lượng ngẫu nhiên Ví dụ, bảng thống kê có ghi lại kiện thất nghiệp (u) lạm phát (п) Cả hai biến lượng biến ngẫu nhiên, nhiều khả phủ muốn hỏi nhà kinh tế câu hỏi sau đây: “Liệu khả lạm phát thấp 8% mức độ thất nghiệp nhỏ 6% vào năm sau bao nhiêu?” Điều có nghĩa là, ta cần phải xác định xác suất đồng thời: P (п < 8, u < 6) = ? Để trả lời câu hỏi vậy, cần phải xác định hàm mật độ xác suất đồng thời [joint probability density function] 1.3.1 Hàm mật độ xác suất đồng thời Định nghĩa: Giả sử X Y biến ngẫu nhiên Hàm mật độ xác suất đồng thời x y là: f ( x, y) = P( X = x, Y = y) Hàm số cần thỏa mãn điều kiện: f ( x, y ) ≥ , ∑ ∑ f ( x, y ) = ∫ ∫ f ( x, y )dy.dx x y x y X, Y rời rạc X, Y liên tục Khi đó, P(a ≤ x ≤ b, c ≤ y ≤ d ) = ∑ ∑ f ( x, y) , X, Y biến ngẫu nhiên rời rạc, a ≤ x ≤b c ≤ y ≤ d P(a ≤ x ≤ b, c ≤ y ≤ d ) = ∫a ⎡ ∫c f ( x, y )dy ⎤ dx , X,Y biến ngẫu nhiên liên ⎢ ⎥ b d ⎣ ⎦ tục 1.3.2 Hàm phân bố xác suất đồng thời F(x,y) Tương tự trường hợp biến ngẫu nhiên biến, ta đưa định nghĩa sau hàm phân bố xác suất đồng thời: Định nghĩa: Gọi F(x,y) hàm phân bố xác suất đồng thời biến ngẫu nhiên x y Khi đó: F ( x, y ) = Pr ob( X ≤ x, Y ≤ y ) = ∑ ∑ f ( x, y ) , X, Y rời rạc X ≤xY ≤ y x y F ( x, y ) = Pr ob( X ≤ x, Y ≤ y ) = ∫−∞ ∫−∞ f (t , s ) ds.dt , X, Y liên tục 1.3.3 Phân phối xác suất cận biên Hãy xét ví dụ sau: Ví dụ 4: Xét tổng thể, gồm có 1000 người [Vì ta nói mật độ xác suất tần suất] Giả sử họ phân loại theo tiêu chuẩn: Theo giới tính: G = người nam G = người nữ Và theo trình độ học vấn: D = học xong trung học D = học xong đại học D = học xong cao học Giả sử kết thống kê tổng thể 1000 người sau: Trung học Nam 200 Nữ 270 Học vị (tổng số) 470 Đại học Cao học Giới tính(tổng số) 300 60 560 100 70 440 400 130 1000 Dựa bảng thống kê này, thấy xác suất cá nhân nữ, học xong đại học: f(0,1)= 100/1000 = 0.1 Một cách khái quát, viết hàm mật độ xác suất đồng thời f (G , D ) sau: G 0.2 0.27 0.3 0.1 0.06 0.07 0.56 0.44 D Tổng Tổng 0.47 0.40 0.13 Bảng phân bố xác suất cho thấy, xác suất cá nhân nam tổng thể người có học là: Prob(G=1) = 0.56 Tương tự, xác suất cá nhân nữ: Prob(G=0) = 440/1000 = 0.44 Như vậy, ta lập biến ngẫu nhiên, thể phân bố mật độ xác suất theo giới tính tổng thể: G f(g) 0.56 0.44 Hàm f(G) gọi hàm mật độ xác suất cận biên Hàm mật độ tính cách cộng dồn theo cột qua tất trình độ học vấn: f ( g ) = ∑ f ( g, d ) , g = 0,1,2 Tức là: d ⎧ f G (1) = ∑ f (1, d ) = 0.56 ⎪ d ⎨ ⎪ f G (0) = ∑ f (0, d ) = 0.44 d ⎩ Tương tự vậy, ta tính hàm mật độ xác suất cận biên theo học vấn: f D (d ) = ∑g f ( g , d ) d = 0,1,2 Hay vậy, ⎧ f D (0) = ∑g f ( g ,0) = 0.47 ⎪ ⎪ ⎨ f D (1) = ∑ g f ( g ,1) = 0.4 ⎪ ⎪ f D (2) = ∑g f ( g ,2) = 0.13 ⎩ Một cách tổng quát, gọi f(x,y) hàm mật độ xác suất đồng thời X Y Khi đó, hàm mật độ xác suất cận biên X xác định sau: f X ( x ) = ∑ y f ( x, y ) X rời rạc f X ( x ) = ∫y f ( x, y )dy X liên tục Tương tự, ta xác định f Y ( y ) 1.3.4 Các biến ngẫu nhiên độc lập Định nghĩa: Hai biến ngẫu nhiên độc lập khi: f ( x, y ) = f X ( x) ⋅ f Y ( y ) ↔ F ( x, y ) = FX ( x) ⋅ FY ( y ) ↔ Pr ob ( X ≤ x, Y ≤ y ) = Pr ob ( X ≤ x) ⋅ Pr ob (Y ≤ y ) 1.4 Kỳ vọng – Phương sai 1.4.1 Khái niệm Kỳ vọng biến ngẫu nhiên: Gọi X biến ngẫu nhiên rời rạc, nhận giá trị có x1, x2, x3,… xK với xác suất tương ứng f1, f2, f3,… fK Giá trị kỳ vọng X định nghĩa sau: E ( X ) = x1 f + x f + x3 f + + xKfK , hay vậy: K E ( X ) = ∑ xkfk k =1 Tương tự, biến ngẫu nhiên liên tục, giá trị kỳ vọng định nghĩa sau: +∞ E ( X ) = ∫−∞ x ⋅ f ( x)dx Các tính chất kỳ vọng: E(a) = a , với a số E (a + bX ) = a + bE( X ) E ( XY ) = E ( X ) E (Y ) Định lý 1.1: Giả sử X biến ngẫu nhiên với hàm mật độ xác suất f(x) g(X) hàm liên tục X Khi đó: E [g ( X )] = ∑ g ( x ) f k k k +∞ E [g ( X )] = ∫−∞ g ( X ) f ( x)dx X rời rạc X liên tục 1.4.2 Phương sai Gọi X biến ngẫu nhiên với kỳ vọng EX Để đo lường tán xạ X so với giá trị trung bình (hay kỳ vọng) nó, ta sử dụng phương sai, ký hiệu Var(X), định nghĩa sau: Var ( X ) = σ x2 = E ( X − E ( X ) )2 Với độ lệch chuẩn: σ x = σ x2 Sử dụng Định lý 1.1, phương sai X tính sau: Var ( X ) = ∑ ( x − EX ) f k k k +∞ Var ( X ) = ∫−∞ ( X − E ( X ) )2 f ( x)dx X rời rạc X liên tục Các tính chất phương sai: VarX = E ( X − E ( X ) )2 = E ( X ) − (E ( X ) )2 Var(a) = , với a số Var (a + bX ) = b ⋅ Var ( X ) Var( X + Y ) = Var( X ) + Var(Y ) Var ( X − Y ) = Var ( X ) + Var (Y ) Var ( X − E ( X ) ) = Var ( X ) 1.5 Hàm phân phối chuẩn Biến ngẫu nhiên liên tục X nhận giá trị khoảng (− ∞,+∞ ) có phân phối chuẩn với tham số có dạng: μ σ , ký hiệu là: X ( ) ~ N μ , σ , hàm mật độ xác suất − f ( x) = ⋅e σ 2Π ( x − μ )2 2σ với μ = E ( X ) σ = Var ( X ) Đồ thị 1.2: Hàm phân phối chuẩn ( ) Định lý 1.2: Giả sử X biến ngẫu nhiên với phân bố chuẩn: X ~ N μ , σ Gọi Z = (a + bx) biến đổi tuyến tính X Khi đó, Z hàm phân bố chuẩn: Z ~ N ( a + bμ , b 2σ ) Hệ quả: Đặt Z = x−μ σ Khi đó, Z ~ N (0,1) Địnhlý 1.3: Cho trước chuỗi biến ngẫu nhiên: ( x1 , x2 , x3 , , xn ) ∼ N Khi đó, tổ hợp tuyến tính chúng, có phân bố chuẩn: c1 x1 + c2 x2 + + cn xn ∼ N (∑ μ n , ∑ cn σ n2 ) 10 (μ ,σ ) n n 1.6 Phân tích Covariance Trong phần trên, nói đến việc tồn hay khơng tính độc lập, hay quan hệ phụ thuộc hai biến ngẫu nhiên X Y Nhưng tồn quan hệ phụ thuộc lẫn nhau, quan hệ mạnh hay yếu Trong phần này, đề cập tới hai thước đo mức độ liên quan hai biến ngẫu nhiên, tương quan (hay covariance), hệ số tương quan (hay correlation, ký hiệu ρ XY ) Để minh họa, giả sử X trọng lượng mẫu nước lấy từ giếng lên, Y khối lượng Hiển nhiên mối quan hệ chặt X Y Nếu ta ký hiệu N {x n , y n }n =1 cặp đo lường với N mẫu thử; vẽ chúng lên đồ thị, quan sát liệu tạo thành đường thẳng tuyến, thể mối quan hệ vật lý chúng Nhưng chúng không rơi vào điểm dọc theo đường tuyến tính thể quy luật liên hệ khối lượng trọng lượng nước Chúng “bám” xung quanh trục tuyến tính đó, có sai số đo lường, tạp chất nước làm quan sát lệch khỏi quy luật vật lý, mô tả mối quan hệ ổn định X Y Đồ thị 1.3: Mối quan hệ trọng lượng nước X khối lượng nước Y o ( yn , xn ) yn o o o o o o o o o o xn Câu hỏi đặt đo lường mức độ tương quan mạnh hay yếu hai biến X Y Làm thể mối quan hệ đồng biến hay nghịch biến? 1.6.1 Covariance Định nghĩa: Covariance hai biến X Y hệ số đo: Cov ( X , Y ) = E [( X − EX )( y − EY )] 11 Nếu giá trị lớn trung bình X quan sát với giá trị lớn trung bình Y; giá trị nhỏ X kèm với giá trị nhỏ Y, Cov( X , Y ) > Nói khác đi, ( X − EX ) > có xu hướng kèm với (Y − EY ) > ; hay ngược lại, ( X − EX ) < , (Y − EY ) < , quan hệ có xu hướng tạo tích ( X − EX ) (Y − EY ) > Điều có nghĩa Cov( X , Y ) > , thể X Y có mối quan hệ đồng biến Ví dụ quan hệ khối lượng trọng lượng mẫu nước vừa nêu Nhiều khi, mối tương quan nghịch biến, không thuận Chẳng hạn quan sát mối quan hệ điều kiện bảo trợ dễ dàng cho cá nhân, hay doanh nghiệp (ký hiệu X); nỗ lực tự vươn lên, tính khởi nghiệp cá nhân, hay doanh nghiệp (ký hiệu Y) Khi đó, mối quan hệ thường nghịch biến Hỗ trợ nhiều làm chết tính tự chủ, tự vươn lên, tự chịu trách nhiệm cá nhân Nói khác đi, giá trị X lớn [được nâng đỡ, bảo trợ nhiều] thường với giá trị Y nhỏ [thiếu nỗ lực thân, hay ỉ lại] Và giá trị X nhỏ [không nâng đỡ] thường với giá trị Y lớn [tính tự lập, tự chủ cao] Do vậy, ( X − EX ) > thường kèm với (Y − EY ) < , ( X − EX ) < thường xẩy với (Y − EY ) > Kết cục lại, chúng thường tạo tích ( X − EX ) (Y − EY ) < Hay vậy, Cov( X , Y ) < , thể mối quan hệ nghịch biến X Y Chúng ta nhận xét rằng, mối quan hệ việc hỗ trợ, bảo trợ, với tính tự chủ, tự chịu trách nhiệm, ký hiệu X Y nghịch biến Nhưng mức độ, không mạnh quan hệ vật lý khối lượng trọng lượng nước Nếu vẽ đồ thị quan sát, mối quan hệ việc hỗ trợ với tính tự vươn lên dốc xuống, thể mối quan hệ nghịch biến Nhưng không thiết nằm xung quanh đường thẳng, trải dọc theo đường cong phi tuyến, thể mối quan hệ yếu so với quan hệ vật lý ví dụ đầu Để đo lường khác biệt ta dùng hệ số tương quan 1.6.2 Hệ số tương quan: Định nghĩa: Hệ số tương quan X Y hệ số đo ρ ( X , Y ) : Cov( X , Y ) (− ≤ ρ ( X , Y ) ≤ 1) ρ ( X ,Y ) = VarX ⋅ VarY Ta nói rằng, covariance cho phép xác định có mối quan hệ hay khơng X Y, quan hệ nghịch biến hay đồng biến Hệ số tương quan lại cho phép đo lường mối quan hệ mạnh tới mức Nếu X Y có quan hệ tuyến tính: X = α ± β Y , quan hệ mạnh Và | ρ ( X , Y ) |= Nếu quan hệ phi tuyến, | ρ ( X , Y ) |< Khi X Y khơng có quan hệ tương quan: Cov( X , Y ) = , đó, hệ số tương quan ρ ( X , Y ) = 12 1.6.3 Hai đẳng thức với tương quan mẫu Hai đẳng thức sau hai đẳng thức thường sử dụng chương ∑ (x ∑ (x 1/ n n 2/ n n − x ) ⋅ c = , với c: const − x ) ⋅ y n = ∑n [( xn − x ) ⋅ ( y n − y )] Chứng minh: 1/ ∑ (x n n − x ) ⋅ c = c ⋅ ∑n ( xn − x ) = c ⋅ (∑n xn − ∑n x ) = c ⋅ (n ⋅ x − n ⋅ x ) = 2/ Vì y số nên theo chứng minh ∑ (x − x ) ⋅ y = ∑ (x − x ) ⋅ y = ∑ [( x − x ) ⋅ y − ( x − x ) ⋅ y ] = ∑ [( x − x ) ⋅ ( y − y )] n n n n n n n n n n n ∑ (x − x ) ⋅ y = , vậy: − ∑ (x − x ) ⋅ y n n n n n n n Chú ý rằng, dòng cuối gọi tương quan mẫu X Y 13 ... kiện thất nghiệp (u) lạm phát (п) Cả hai biến lượng biến ngẫu nhiên, nhiều khả phủ muốn hỏi nhà kinh tế câu hỏi sau đây: “Liệu khả lạm phát thấp 8% mức độ thất nghiệp nhỏ 6% vào năm sau bao nhiêu?”... rời rạc liên tục 2.2.1 Biến ngẫu nhiên rời rạc: Một biến ngẫu nhiên rời rạc giá trị có lập nên tập hợp hữu hạn đếm được, nghĩa liệt kê tất giá trị có Cuộc chơi tung xu nêu ví dụ biến ngẫu nhiên... F (b) − F (a) a Ví dụ, phân bố chuẩn, đồ thị ta biểu diễn cơng thức tính xác suất sau: Đồ thị 1 .1: Phân bố xác suất Phần tơ đậm xác suất P ( a ≤ X ≤ b) , tính tích phân: ∫ b a f ( x)dx = F (b)