Đây là phần lý thuyết mẫu của môn xác suất thông kê. Tài liệu tham khảo là Giáo trình lý thuyết xác xuất thông kê của Đại Học Thương Mại. Đây là bản word rất hữu ích cho rất nhiều mục đích của các bạn. Mong một phần nhiều giúp bạn tiết kiệm được thời gian. Font new time roman cỡ chứ 12. Nếu tài liệu bị lỗi các bạn liên hệ qua kmf.rik@gmail.com để lấy tài liệu không lỗi.
X Chương LÝ THUYẾT MẪU Bài 1: KHÁI NIỆM VỀ ĐÁM ĐÔNG VÀ MẪU 1.1. Đám đông Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên một tập hợp gồm N phần tử , thì tập hợp N phần tử này được gọi là đám đông, N được gọi là kích thước của đám đông. 1.2. Mẫu Từ đám đông ta lấy ra một tập hợp nhỏ hơn gồm n phần tử để nghiên cứu. Tập hợp n phần tử này được gọi là mẫu, n được gọi là kích thước mẫu. 1.3. Mẫu ngẫu nhiên Giả sử ta lấy mẫu kích thước n. Gọi X i là giá trị quan sát của dấu hiệu cần nghiên cứu Xthể hiện trên phần tử thứ I của mẫu i = 1,…,n. Nếu mẫu lấy theo phương pháp ngẫu nhiên đơn giản có hoàn lại thì X i (i = 1,2…,n) là các ĐLNN độc lập có cùng luật phân phối xác xuất với ĐLNN gốc X. Định nghĩa 1.1:Mẫu ngẫu nhiên kích thước n là tập hợp n ĐLNN độc lập X 1, X 2…, X n được rút ra từ ĐLNN gốc X và có cùng luật phân phối xác suất với X. Mẫu ngẫu nhiên kích thước n được kí hiệu là: W = (X 1 ,X 2 ,…,X n ). Trong một lần lấy mẫu, ĐLNN X i nhận giá trị x i (i=1,2…,n). Khi đó tập hợp n giá trị x 1 ,x 2 ,…,x n tạo nên một mẫu cụ thể, kí hiệu là: ), ,,( 21 n xxx = ω 1.4. Một số phương pháp cơ bản mô tả mẫu Giả sử trong một lần lấy mẫu kích thước n ta được một mẫu cụ thể: ), ,,( 21 n xxx = ω Trong đó xi chính là giá trị quan sát của dấu hiệu X thể hiện trên phần tử thứ I của mẫu cụ thể này (i=1,2…,n). a. Bảng phân phối thực nghiệm Các giá trị quan sát x1,x2,…,xn sau khi được sắp xếp và hệ thống lại theo thứ tự tăng dần hoặc giảm dần rồi trình bày dưới dạng bảng, ta có bảng phân phối thực nghiệm (hay còn gọi là bảng phân phối mẫu): xi(hoặc X) x1 x2 … xi … xk ni n1 n2 … ni … nk Bảng 1.1 Trong đó ni, (i=1,2…,n) là tần số của gái trị quan sát xi. Ta có: ∑ = = k i i nn 1 b. Hàm phân phối thực nghiệm Định nghĩa 1.2: Hàm phân phối thực nghiệm kí hiệu là F* (x) được định nghĩa là : n n xF x = )( * Trong đó x là số thực bất kì, nx là số quan sát có giá trị nhở hơn x trong mẫu kích thước n. Hàm phân phối thực nghiệm có các tính chất: 1) 1)(0 * ≤≤ xF 2) F*(x) là hàm không giảm 3) Nếu xi là giá trị quan sát nhỏ nhất và xk là giá trị quan sát lớn nhất của X trên mẫu thì F*(x)=0 với 1 xx ≤ và F*(x)=1 với x > xk. 2. Các đặc trưng mẫu quan trọng 2.1. Trung bình mẫu Định nghĩa 1.3: Trung bình mẫu, kí hiệu là được định nghĩa bằng công thức: 1 1 n i i X X n = = ∑ Ta chú ý rằng trung bình mẫu là trung bình cộng của n ĐLNN nên nó cũng là một ĐLNN. Khi mẫu ngẫu nhiên nhận một giá trị cụ thể : ), ,,( 21 n xxx= ω Thì trung bình mẫu cung nhận một giá trị cụ thể: 1 1 n i i x x n = = ∑ hoặc 1 1 n i i i x x n n = = ∑ nếu có bảng 1.1 Trung bình mẫu có tính chất: ( )E X µ = (1) 2 ar( )V X n σ = (2) 2.2. Phương sai mẫu và phương sai mẫu điều chỉnh Định nghĩa 1.4: Phương sai mẫu, kí hiệu là S2 được đinh nghĩa bằng công thức: 2 2 1 1 ( ) n i i S X X n = = − ∑ Phương sai mẫu có tính chất: 2 2 1 (S ) n E n σ − = Định nghĩa 1.5: Phương sai mẫu điều chỉnh, kí hiệu S’2 và được định nghĩa: '2 2 1 1 ( ) 1 n i i S X X n = = − − ∑ Từ tính chất của phương sai mẫu, ta có: '2 2 ( ) .E S σ = Chú ý 1.1: Ta có thể tính s’2 theo công thức: 2 '2 1 ns s n = − Chú ý 1.2: Để tính giá trị của phương sai mẫu cung như phương sai mẫu điều chỉnh người ta còn dung công thức sau: 2 2 2 1 1 ( ) k i i i s n x n x n = = − ∑ và '2 2 2 1 ( ) 1 i i s n x n x n = − − ∑ Định nghĩa 1.6: Căn bậc hai của phương sai mẫu được gọi là độ lệch tiêu chuẩn mẫu và được kí hiệu là S 2 1 1 ( ) n i i S X X n = = − ∑ Căn bậc hai của phương sai mẫu điều chỉnh được gọi là độ lệch tiêu chuẩn mẫu điều chỉnh và được kí hiệu là S’ ' 2 1 1 ( ) 1 n i i S X X n = = − − ∑ Độ lệch tiêu chuẩn mẫu cũng như độ lệch tiêu chuẩn mẫu điều chỉnh là những ĐLNN. Còn các giá trị của chúng trên một mẫu cụ thể là những số xác định, kí hiệu tương ứng là s và s’. Ta có: 2 1 1 (x ) n i i s x n = = − ∑ và ' 2 1 1 (x ) 1 n i i s x n = = − − ∑ Chú ý 1.3: Trong trương hợp các giá trị của X được chia thành từng lớp, khi đó người ta lấy giá trị trung tâm của mỗi lớp đại diện cho lớp đó để tính các đặc trưng mẫu (cũng như để tìm hàm phân phối thực nghiệm). 3. Quy luật phân phối xác xuất của một số thống kê quan trọng Giả sử dấu hiệu cần nghiên cứu X có E(X)= µ và Var(X)= σ 2 .Từ đám đông ta lấy ra một ngẫu nhiên kích thước n: W = (X 1 ,X 2 ,…,X n ). Định nghĩa 1.7: Một hàm của các ĐLNN thành phần X 1 ,X 2 ,…,X n được gọi là một thống kê và được kí hiệu là: G=f (X 1 ,X 2 ,…,X n ) 3.1. Trường hợp ĐLNN gốc X phân phối theo quy luật chuẩn Vì X có phân phối chuẩn, nên X cũng có phân phối chuẩn. Mặt khác theo (1) và (2), ta có: ( )E X µ = và 2 ar( )V X n σ = 2 ( , )X N n σ µ : Vì vậy: (0,1) X U N n µ σ − = : (3) Ta cũng có: '2 2 2( 1) 2 ( 1) n n S X X σ − − = : (4) ( 1) ' n X T T S n µ − − = : (5) Chú ý 4: Khi n > 30 thống kê T phân phối xấp xỉ chuẩn N(0,1). Khi đó ta có thể lấy ( )n t u α α ≈ 3.2. Trương hợp chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu n khá lớn ( thường đòi hỏi n > 30) Khi n lớn, X có phân phối xấp xỉ chuẩn. Mặt khác ta luôn có ( )E X µ = và 2 ar( )V X n σ = 2 ,X N n σ µ ÷ ; Vì vậy: (0,1) X U N n µ σ − = ; 3.3. Trường hợp có hai ĐLNN gốc cùng phân phối theo quy luật chuẩn Giả sử có hai đám đông, trên đám đông thứ nhất dấu hiệu cần nghiên cứu là X1 có phân phối chuẩn với E(X1)= 1 µ ,Var(X1)= 2 1 σ , còn trên đám đông thứ hai dấu hiệu cần nghiên cứu là X2 cũng có phân phối chuẩn với 2 2 ( )E X µ = , 2 2 2 ar( )V X σ = . Từ hai đám đông trên ta lấy ra hai mẫu độc lập với kích thước tương ứng là n1 và n2: W1=(X11,X12,…,X1n1) Từ mẫu này ta lập được 1 X và S’22 W2=(X21,X22,…,X2n1) Từ mẫu này ta lập được 2 X và S’22 Vì 2 1 1 1 ( , )X N µ σ : và 2 2 2 2 ( , )X N µ σ : nên 2 1 1 1 1 ,X N n σ µ ÷ : và 2 2 2 2 2 ,X N n σ µ ÷ : Do đó ( ) 1 2 1 2 2 2 1 2 1 2 ( ) (0,1) X X U N n n µ µ σ σ − − − = + : (8) Nếu 2 2 2 1 2 σ σ σ = = thì ( ) 1 2 1 2 1 2 ( 2) '2 '2 1 1 2 2 1 2 1 2 ( ) ( 1) ( 1) 1 1 1 n n X X T T n S n S n n n n µ µ + − − − − = − + − + + − : (9) Chú ý 5: Khi n1 và n2 khá lớn (thường đòi hỏi lớn hơn 30), mặc dù không biết quy luật phân phối của X1 cũng như của X2, lập luận tương tự như trên, ta cũng có công thức (7) 3.4. Quy luật phân phối xác xuất của tần suất mẫu Khi n khá lớn,thì , pq f N p n ÷ ; (0,1) f p U N pq n − = ; (10) . trên ta lấy ra hai mẫu độc lập với kích thước tương ứng là n1 và n2: W1=(X11,X12,…,X1n1) Từ mẫu này ta lập được 1 X và S’22 W2=(X21,X22,…,X2n1) Từ mẫu này ta lập được 2 X và S’22 Vì 2 1 1. đông. 1.2. Mẫu Từ đám đông ta lấy ra một tập hợp nhỏ hơn gồm n phần tử để nghiên cứu. Tập hợp n phần tử này được gọi là mẫu, n được gọi là kích thước mẫu. 1.3. Mẫu ngẫu nhiên Giả sử ta lấy mẫu kích. X 1, X 2…, X n được rút ra từ ĐLNN gốc X và có cùng luật phân phối xác suất với X. Mẫu ngẫu nhiên kích thước n được kí hiệu là: W = (X 1 ,X 2 ,…,X n ). Trong một lần lấy mẫu, ĐLNN X i nhận giá trị x i