Bài giảng Lý thuyết xác suất và thống kê toán - Bài 5: Cơ sở lý thuyết mẫu giới thiệu một số khái niệm cơ bản của Thống kê toán học, cụ thể là những vấn đề liên quan đến cặp phạm trù tổng thể và mẫu, đến các khái niệm thống kê, thống kê của đặc trưng mẫu và phân phối xác suất của thống kê đặc trưng mẫu, xem xét cụ thể các khái niệm đó trong một số trường hợp đặc biệt nhưng thường gặp trong thực hành.
Bài 5: Cơ sở lý thuyết mẫu BÀI 5: CƠ SỞ LÝ THUYẾT MẪU Các kiến thức cần có • Khái niệm phương pháp mẫu • Tổng thể nghiên cứu • Định nghĩa • Mô tả tổng thể • Các số đặc trưng tổng thể • Mẫu ngẫu nhiên • Các phương pháp lấy mẫu • Định nghĩa mẫu ngẫu nhiên • Mơ tả mẫu ngẫu nhiên • Thống kê (Statistics) • Định nghĩa • Các thống kê đặc trưng mẫu • Mẫu ngẫu nhiên hai chiều Mục tiêu Giới thiệu số khái niệm Thống kê toán học, cụ thể vấn đề liên quan đến cặp phạm trù tổng thể mẫu, đến khái niệm thống kê, thống kê đặc trưng mẫu phân phối xác suất thống kê đặc trưng mẫu, xem xét cụ thể khái niệm số trường hợp đặc biệt thường gặp thực hành • Khái niệm • Phương pháp mơ tả mẫu • Thống kê đặc trưng mẫu hai chiều • Quy luật phân phối xác suất số thống kê • Trường hợp biến ngẫu nhiên gốc có phân phối 0−1 • Trường hợp hai biến ngẫu nhiên gốc có phân phối 0−1 • Trường hợp biến ngẫu nhiên gốc có phân phối chuẩn • Trường hợp hai biến ngẫu nhiên gốc có phân phối chuẩn Thời lượng • tiết 103 Bài 5: Cơ sở lý thuyết mẫu TÌNH HUỐNG KHỞI ĐỘNG BÀI Tình Điều tra mức thu nhập cá nhân tháng (triệu đồng) huyện Đơng Anh, ta có bảng số liệu mẫu sau: Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7 số người 10 Cần phải tính thu nhập bình quân đầu người độ chênh lệch thu nhập để xác định mức sống người dân mức độ đồng thu nhập vùng Câu hỏi Thu nhập bình quân đầu người bao nhiêu? Độ chênh lệch thu nhập bao nhiêu? Độ chênh lệch bình quân hiệu chỉnh? 104 Bài 5: Cơ sở lý thuyết mẫu 5.1 Khái niệm phương pháp mẫu Bài toán: Chúng ta cần nghiên cứu tính chất định tính định lượng phần tử tập hợp Khi ta có hai phương pháp thực nghiên cứu • Nghiên cứu toàn phần tử tập hợp ghi lại đặc tính cần quan tâm Khi thực nghiên cứu toàn ta gặp phải hạn chế sau: o Phải trả chi phí lớn kinh tế thời gian số lượng phần tử tập tồn q lớn o Có thể dẫn tới phá huỷ toàn tập hợp cần nghiên cứu Ví dụ nghiên cứu thời gian hoạt động thiết bị điện tử Khi áp dụng phương pháp dẫn tới phá huỷ toàn thiết bị điện tử o Có tập hợp mà ta khơng thể nghiên cứu tồn Ví dụ lĩnh vực khảo cổ học Vậy ta thấy đa số trường hợp nghiên cứu toàn tập hợp khơng khả thi • Nghiên cứu phận, từ tập hợp nghiên cứu ta lấy tập nghiên cứu toàn phần tử tập từ đưa kết luận cho phần tử tập hợp nghiên cứu Phương pháp nghiên cứu thứ hai gọi phương pháp nghiên cứu mẫu 5.2 Tổng thể nghiên cứu 5.2.1 Định nghĩa Tổng thể (population) tập hợp phần tử cần nghiên cứu tính chất định tính định lượng, số phần tử tổng thể gọi cỡ tổng thể, ký hiệu N Ví dụ: • Thu nhập tồn dân cư nước • Chất lượng sản phẩm nhà máy • Nhu cầu tiêu dùng điện hộ gia đình Khi nghiên cứu tổng thể phần tử có hai loại tính chất định tính định lượng cần quan tâm, ta có hai loại biến: • Biến định lượng số đo phần tử; Ví dụ: Cân nặng, chiều cao, tuổi, thu nhập,… • Biến định tính tính chất đối tượng nghiên cứu Ví dụ: Giới tính, chất lượng, dân tộc, tơn giáo,… Đối với biến ta có cách mã hố sau: • Kỹ thuật mã hố 105 Bài 5: Cơ sở lý thuyết mẫu o o Mã hoá biến định lượng: Ta lấy giá trị biến định lượng làm mã biến Mã hoá biến định tính: Ta gán tính chất định tính biến ứng với số nguyên Ví dụ: Đối tượng thu nhập hộ gia đình ta có mức: Nghèo, trung bình, giàu Ta mã hố biến sau: Nghèo Ỉ -1; Trung bình Ỉ 0; Giàu Ỉ Vậy nghiên cứu tổng thể ta ln giả sử các phần tử tổng thể có dấu hiệu định lượng 5.2.2 Mơ tả tổng thể Cho tổng thể với phần tử {x1, x2,… xN}, ta thu gọn cách gộp giá trị giống lại biểu diễn dạng xi x1 x2.……………xk Ni N1 N2 ………… Nk Ni (i = 1, ,k) số lần giá trị xi xuất tổng thể, ta có N1 + N2 +…+ Nk = N Đặt f1 = Ni (i = 1,…,k), fi gọi tần suất xi tổng thể ta có bảng tần suất N x1 x2 …………xk xi fi f2 f2………….fk Hiển nhiên ta có: f1+ f2 +… + fk = Bảng tần suất giống bảng phân phối xác suất biến ngẫu nhiên, ta đồng tổng thể nghiên cứu với biến ngẫu nhiên X với hàm phân phối F Vậy, thay nghiên cứu tổng thể ta quy nghiên cứu biến ngẫu nhiên X 5.2.3 Các số đặc trưng tổng thể • Trung bình tổng thể Trung bình tổng thể đại lượng ký hiệu m xác định bởi: m= N N = N x ∑ i i ∑ fi x i N i =1 i =1 Ta thấy m xem kỳ vọng biến ngẫu nhiên X • Phương sai tổng thể Phương sai tổng thể đại lượng ký hiệu s xác định bởi: s= N N − = (x m) ∑ i ∑ fi xi2 − (m)2 N i =1 i =1 Ta thấy s xem phương sai biến ngẫu nhiên X 106 Bài 5: Cơ sở lý thuyết mẫu 5.3 Mẫu ngẫu nhiên Trong phần trước ta biết nghiên cứu cặn kẽ phần tử tổng thể, ta phải nghiên cứu hạn chế nhóm nhỏ rút từ tổng thể gọi mẫu từ rút kết luận cho tổng thể, ta mong muốn mẫu đại diện tốt cho tổng thể Nói chung, để có mẫu đại diện tốt cho tổng thể người ta thường phải tiến hành xây dựng mẫu theo quy trình chọn ngẫu nhiên phần tử mẫu Một mẫu gọi mẫu ngẫu nhiên (random sample) 5.3.1 Các phương pháp lấy mẫu Có nhiều phương pháp chọn mẫu ngẫu nhiên để thoả mãn tính đại diện tốt cho tổng thể phù hợp với mục tiêu nghiên cứu Sau ta nghiên cứu phương pháp chủ yếu • Cách chọn mẫu ngẫu nhiên đơn giản o Chọn mẫu ngẫu nhiên có hồn lại: Từ tổng thể ta rút ngẫu nhiên phần tử ghi lại đặc trưng cần quan tâm, sau trả lại phần tử tổng thể làm tương tự lần ta mẫu cỡ n o Chọn mẫu ngẫu nhiên khơng hồn lại: Làm tương tự trên, khác sau lần rút phần tử ta loại phần tử khỏi tổng thể • Chọn mẫu phân cấp Ở tổng thể lớn có yêu cầu phải chọn mẫu phân cấp chẳng hạn điều tra phân tích mức sống dân cư nước thường có yêu cầu kết luận cho vùng, miền o Mẫu phân cấp đơn giản thành lập sau: Chia tổng thể thành k tổng thể phận ta thực cách lấy mẫu ngẫu nhiên đơn giản tổng thể thành phần tổng hợp lại để có mẫu tồn tổng thể Ta tiến hành lấy mẫu phân cấp theo quy trình phức tạp Chẳng hạn sau chia tổng thể thành k tổng thể phận, ta chọn ngẫu nhiên số k tổng thể phận m tổng thể tiếp tục thực lấy mẫu ngẫu nhiên tổng thể chọn để tổng hợp thành mẫu toàn tổng thể 5.3.2 Định nghĩa mẫu ngẫu nhiên Một mẫu ngẫu nhiên cỡ n biến ngẫu nhiên X n biến ngẫu nhiên X1, X2, ….Xn độc lập có phân phối với biến ngẫu nhiên X , Xk quan sát biến ngẫu nhiên X Ta ký hiệu xk kết quan sát lần thứ k, tức quan sát Xk nhận giá trị xk (k = 1,2,…, n) Khi giá trị (x1, x2, …,xn) gọi giá trị cụ thể mẫu ngẫu nhiên (X1, X2, …,Xn) 107 Bài 5: Cơ sở lý thuyết mẫu Ví dụ 1: Khi gieo xúc xắc lần ta mẫu ngẫu nhiên (X1, X2, X3, X4, X5) lần lấy mẫu đó, chẳng hạn ta giá trị mẫu (3, 5, 2, 3, 1) Ví dụ 2: Nghiên cứu thời gian hoạt động thiết bị điện tử công ty sản xuất, ta lấy ngẫu nhiên n thiết bị, ta mẫu ngẫu nhiên (X1, X2, ….,Xn), theo dõi thời gian hoạt động n thiết bị điện tử ta giá trị mẫu (x1, x2, …,xn) 5.3.3 Mô tả mẫu ngẫu nhiên Cho biến ngẫu nhiên X mẫu ngẫu nhiên (X1, X2, ….,Xn) với giá trị mẫu (x1, x2, …,xn) Để mô tả mẫu ngẫu nhiên ta có hai cách sau: • Biểu đồ tần suất Ta thu gọn cách gộp giá trị giống mẫu biểu diễn dạng bảng sau: xi x1 x2 … xn ni n1 n2 … nk ni số lần giá trị xi xuất mẫu Ta có: n1 + n2 +… + nk = n Ví dụ: Giá trị mẫu quan sát ( 5; 1; 8; 5; 3; 8; 9; 7; 5; 1; 8; 3), cỡ mẫu n = 12, số liệu thu gọn lại có dạng: xi ni 2 3 ni gọi tần suất xi mẫu, ta có bảng biểu diễn n tần suất mẫu Đặt fi = xi x1 x2 … xn ni f1 f2 … fk Ta có: f1 + f + … + fk = (n1+ n2 +… + nk)/n = Trên trục tọa độ 0xy ta biểu diễn điểm Mi(xi, fi) nối điểm Mi với ta biểu đồ tần suất Hình 108 Bài 5: Cơ sở lý thuyết mẫu y Mi fj x1 x2 x3 xk x Hình 1: Trình bày mẫu biểu đố tần suất • Tổ chức đồ (biểu đồ tần số) Chia miền giá trị mẫu thành k khoảng (a0; a1] , (a1; a2] , … , (ak-1; ak] , ký hiệu ni số giá trị mẫu rơi vào khoảng (ai-1; ai], (i=1,2, ,k) Ta biểu diễn mẫu dạng: Khoảng [a0 - a1] ni [a1 - a2] n1 n2 … … [ak-1 - ak] nk n1 + n2 +… + nk = n ni số giá trị mẫu rơi vào khoảng (ai-1; ai] Trong mặt phẳng Oxy, trục Ox biểu diễn khoảng (ai-1; ai], trục Oy biểu diễn giá trị yi = n i /(n.h i ) , hi độ dài khoảng (ai-1; ai] , i =1,2, k Ta dựng hình chữ nhật có chiều cao yi độ dài đáy hi Hình tạo hình chữ nhật gọi tổ chức đồ (biểu đồ tần số) y fj a0 a1 a2 - ak - ak x Hình 2: Tổ chức đồ 109 Bài 5: Cơ sở lý thuyết mẫu 5.4 Thống kê (Statistics) Cho biến ngẫu nhiên X với mẫu ngẫu nhiên (X1, X2, ….,Xn) giá trị mẫu (x1, x2, …,xn) 5.4.1 Định nghĩa Thống kê hàm quan sát mẫu ngẫu nhiên, ký hiệu G(X1, X2, ….,Xn) Khi mẫu nhận giá trị cụ thể (x1, x2, …,xn) thống kê G nhận giá trị g xác định g = G(x1, x2, …,xn) Ví dụ: • Thống kê: X = G(X1 , X , , X n ) = n ∑ Xi , n i =1 gọi trung bình mẫu Giá trị cụ thể X là: x= n ∑ xi n i =1 • Thống kê: n S = ∑ (Xi − X) n i =1 gọi phương sai mẫu Giá trị cụ thể S2 : s2 = 5.4.2 n ∑ (xi − x)2 n i =1 Các thống kê đặc trưng mẫu Ngoài hai thống kê thường gặp kỳ vọng phương sai nêu đây, ta cịn có nhiều thống kê đặc trưng mẫu khác Có thể kể thêm số thống kê khác đây: • Phương sai mẫu hiệu chỉnh Định nghĩa: Thống kê n n S′ = X1 − X ) = S ( ∑ n − i =1 n −1 gọi phương sai mẫu hiệu chỉnh • Độ lệch chuẩn mẫu độ lệch chuẩn mẫu hiệu chỉnh Định nghĩa: Thống kê S = S2 = n (Xi − X) ∑ n i =1 gọi độ lệch chuẩn mẫu 110 Bài 5: Cơ sở lý thuyết mẫu Định nghĩa: Thống kê n (Xi − X)2 ∑ n − i =1 S' = S'2 = gọi độ lệch chuẩn mẫu hiệu chỉnh • Cách tính giá trị thống kê đặc trưng mẫu Cho mẫu ngẫu nhiên thu gọn xi x1 x2 … xn ni n1 n2 … nk Nếu mẫu cho dạng khoảng, ta chọn khoảng điểm đại diện xi = a i −1 + a i , i = 1, 2, , k , ta có mẫu thu gọn Để thuận tiện việc tính tốn giá trị thống kê đặc trưng với mẫu cụ thể, ta lập bảng tính sau: Khoảng giá trị mẫu xi ni n i x i n i x i2 a − a1 x1 n1 n1x1 n1x12 a1 − a x2 n2 n2x2 n x 22 M M M M M a i −1 − a i xi ni ni xi n i x i2 M M M M M a k −1 − a k xk nk nkxk n k x 2k n A B ∑ Ta có: x= k A ni xi = , ∑ n i =1 n s2 = k B n i x i2 − (x) = − (x) , ∑ n i =1 n 111 Bài 5: Cơ sở lý thuyết mẫu s'2 = n s , n −1 s = s s ' = s'2 Ví dụ: Điều tra mức thu nhập cá nhân tháng (triệu đồng), ta có bảng số liệu mẫu sau: Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7 số người 10 Tính giá trị đặc trưng mẫu: x, s ,s'2 , s, s' Ta lập bảng tính: Khoảng thu nhập xi ni n i x i n i x i2 1-2 1,5 10 15 22,5 2-3 2,5 20 50 3-4 3,5 17,5 61,25 4-5 4,5 31,5 141,75 5-6 5,5 16,5 90,75 6-7 6,5 13 84,5 n = 35 113,5 450,75 ∑ Từ đó, x = 113,5/35 = 3,243 s = 450,75/35 – (3,243)2 = 2,363 s = 2,363 = 1,537 s'2 = n 35 s = 2,363 = 2,43 n −1 34 s' = 2, 43 = 1,559 5.5 Mẫu ngẫu nhiên hai chiều Trong phần trước ta xét tổng thể với dấu hiệu định tính định lượng ta đồng tổng thể nghiên cứu biến ngẫu nhiên X Trong phần ta mở rộng xét tổng thể nghiên cứu với hai dấu hiệu định tính 112 Bài 5: Cơ sở lý thuyết mẫu định lượng Ví dụ xét tới tổng thể nghiên cứu xã hội ta xét tới dấu hiệu chiều cao dấu hiệu cân nặng Cả hai dấu hiệu xuất phần tử tổng thể nghiên cứu Tương tự phần trước ta đồng tổng thể nghiên cứu với biến ngẫu nhiên hai chiều (X, Y) 5.5.1 Khái niệm Một mẫu ngẫu nhiên cỡ n véc tơ ngẫu nhiên (X, Y) tập véc tơ ngẫu nhiên (X1,Y1), (X2, Y2) , … , (Xn , Yn) độc lập có phân phốí với biến ngẫu nhiên (X, Y) , véc tơ (Xi , Yi) quan sát thứ i véc tơ ngẫu nhiên (X, Y) Ký hiệu (xi, yi) giá trị mẫu (Xi , Yi) (i = 1,2, ,n) Khi giá trị {(x1, y1), (x2, y2) ,…, (xn, yn)} gọi giá trị cụ thể mẫu ngẫu nhiên (X1,Y1), (X2, Y2) , … , (Xn , Yn) Ví dụ 1: Lấy mẫu điều tra thu nhập tiêu dùng (triệu đồng/tháng) 10 hộ gia đình ta thu giá trị mẫu: ( 2; 1,4), (2; 1,5), (3; 1,8), (4; 1,8), (2; 1,5), (4; 3,5), (7; 5,5), (3; 1,4), (4; 3,5), (5; 3,7) 5.5.2 Phương pháp mô tả mẫu Cho mẫu ngẫu nhiên hai chiều với giá trị mẫu {(x1, y1) , (x2, y2) , … , (xn, yn)} Khi ta biểu diễn mẫu hai dạng sau: Dạng 1: Lập bảng hai dòng theo dạng: xi x1 x2 yi y1 y2 … … xn yn Dạng 2: Thu gọn mẫu biểu diễn dạng bảng chữ nhật: yi y1 y2 … yj … yh a x1 n11 n12 … n1j … n1h a1 x2 n 21 n 22 … n2 j … n 2h a2 M M M M M M xi n i1 n i2 … n ij … n ih M M M M M M xk n k1 n k2 … n kj … n kh ak b b1 b2 … b j bh xi ∑∑ = n 113 Bài 5: Cơ sở lý thuyết mẫu n ij số lần xuất cặp (xi, yj) mẫu, số lần xuất xi mẫu, bj số lần xuất yj mẫu Ta có: k h h k ∑ ∑ nij = n , a i = ∑ nij , b j = ∑ nij i =1j =1 j =1 i=l Ví dụ 2: Ta xét ví dụ Mẫu thu gọn biểu diễn dạng: yj a 1,4 1,5 1,8 3,5 3,7 5,5 2 0 0 3 1 0 0 0 0 0 1 0 0 1 b 2 2 1 ∑ ∑ = 10 xi CHÚ Ý Ta phân khoảng giá trị mẫu thành phần mẫu ngẫu nhiên hai chiều Khi thành phần xử lý tương tự mẫu ngẫu nhiên chiều 5.5.3 Thống kê đặc trưng mẫu hai chiều • Trung bình mẫu Định nghĩa: Véc tơ ngẫu nhiên hai chiều (X, Y) gọi trung bình mẫu véc tơ ngẫu nhiên (X, Y), X Y trung bình mẫu biến ngẫu nhiên thành phần X Y Giá trị thống kê mẫu mẫu ngẫu nhiên hai chiều (x, y) • Hệ số tương quan mẫu Định nghĩa: Hệ số tương quan mẫu mẫu ngẫu nhiên hai chiều ký hiệu R xác định bởi: R= XY − (X)(Y) SXSY XY = 114 n ∑ X k Yk n k =1 Bài 5: Cơ sở lý thuyết mẫu Giá trị hệ số tương quan mẫu mẫu cụ thể { (x , y ), (x2 , y ) ,…, xy − (x)(y) , sXs Y (xn , y n )} là: r= với xy = x= n k h x y = ∑ l l n ∑∑ n ijx i y j n l =1 i =1 j=1 n k n h y y = , = = x a x ∑ l n∑ i i ∑ l n ∑ b jy j n l =1 n l =1 j=1 i =1 sX = n k − = x (x) ∑ l ∑ a i xi2 − (x) , n l =1 n i =1 n h sY = yl − (y) = b j y 2j − (y) ∑ ∑ n l =1 n j=1 Nếu mẫu biểu diễn dạng ta sử dụng dấu thứ Nếu mẫu biểu diễn dạng ta sử dụng dấu thứ hai công thức 5.6 Quy luật phân phối xác suất số thống kê Trong mục ta xác định quy luật phân phối xác suất số thống kê mẫu Phân phối mẫu thống kê phụ thuộc vào phân phối biến ngẫu nhiên gốc, cỡ mẫu phương pháp lựa chọn mẫu Phần giới thiệu phân phối mẫu số thống kê quan có nhiều ứng dụng Định nghĩa: Phân phối xác suất thống kê gọi phân phối mẫu Ví dụ: Phân phối xác suất X gọi phân phối mẫu thống kê trung bình mẫu 5.6.1 Trường hợp biến ngẫu nhiên gốc có phân phối 0−1 Cho biến ngẫu nhiên X có quy luật phân bố 0−1 với tham số p Xét mẫu ngẫu nhiên (X1, X2,…,Xn) rút từ X Dựa sở lý thuyết xác suất (Mục §2, 3), ta có định lý sau: Định lý 0: Thống kê n.X có quy luật phân phối nhị thức B(n, p) Với định lý trên, cỡ mẫu n đủ nhỏ, ta dễ dàng tính tốn để xác định phân phối xác suất kỳ vọng mẫu X cho trường hợp biến ngẫu nhiên -3 -2 -1 Z 115 Bài 5: Cơ sở lý thuyết mẫu gốc có phân phối 0−1 Tuy nhiên, tính tốn đơn giản cỡ mẫu lớn Trong trường hợp vậy, ta dựa vào định lý giới hạn để tính xấp xỉ phân phối xác suất thống kê cần quan tâm Cụ thể, từ Định lý MoivreLaplace (xem Bài 4) ta có: Định lý 1: Thống kê: U = X−p n có quy luật phân phối xấp xỉ phân phối chuẩn tắc p(p − 1) N(0,1) n đủ lớn CHÚ Ý Thống kê U viết lại dạng U= f −p n p(p − 1) f = k / n , với k số lần mẫu nhận giá trị Nếu ta có biến cố A với xác suất p n số lần thực phép thử, k số lần A xuất f tần số xuất biến cố A 5.6.2 Trường hợp hai biến ngẫu nhiên gốc có phân phối 0−1 Cho hai biến ngẫu nhiên độc lập X Y có phân phối 0−1 với hai tham số tương ứng p1 p2 Xét hai mẫu ngẫu nhiên (X1, X2,…,Xn) (Y1, Y2,…,Ym) rút từ X Y Định lý 2: X − Y − (p1 − p ) p1 (1 − p1 ) p (1 − p ) + n m N(0,1) n đủ lớn Thống kê: U = có quy luật xấp xỉ phân phối chuẩn CHÚ Ý Thống kê U viết dạng: U= f1 − f − (p1 − p ) p1 (1 − p1 ) p (1 − p ) + n m f1 = k1 / n, f = k / m, với k1 số lần mẫu ngẫu nhiên X nhận giá trị 1, k số lần mẫu ngẫu nhiên Y nhận giá trị Nếu ta có hai biến cố A B k1 k số lần biến cố A B xuất n phép thử biến cố A m phép thử biến cố B, f1 , f tần suất tương ứng hai biến cố Nếu ta có hai biến cố A B k1 k số lần biến cố A B xuất n phép thử biến cố A m phép thử biến cố B, f1 , f tần suất tương ứng hai biến cố 116 Bài 5: Cơ sở lý thuyết mẫu 5.6.3 Trường hợp biến ngẫu nhiên gốc có phân phối chuẩn Cho mẫu ngẫu nhiên (X1, X2, …Xn) rút từ biến ngẫu nhiên X có quy luật phân phối chuẩn N(μ, σ2 ) Từ tính chất phân phối chuẩn, ta có: Định lý 3: ( ) , đó: Thống kê trung bình mẫu X có phân phối chuẩn N μ X , σ X μX = μ + μ + + μ σ2 + σ2 + + σ2 σ2 = μ ; σX = = n n n2 Từ ta thấy thống kê U = X−μ n có quy luật phân phối chuẩn N(0,1) σ CHÚ Ý Nếu mẫu ngẫu nhiên rút từ biến ngẫu nhiên X chưa biết dạng phân phối xác suất theo Định lý giới hạn trung tâm, phân phối trung bình mẫu xấp xỉ phân phối chuẩn với trung bình μ X phương sai σ2X xác định mà cỡ mẫu n đủ lớn Định lý 4: 5.6.4 • Thống kê T = X −μ n có quy luật phân bố Student với n−1 bậc tự S' • Thống kê χ = (n − 1)S'2 có quy luật phân phối khi−bình phương với n−1 bậc tự σ2 Trường hợp hai biến ngẫu nhiên gốc có phân phối chuẩn Cho hai biến ngẫu nhiên X có phân phối chuẩn N(μ1 , σ12 ) , Y có phân phối chuẩn N(μ , σ22 ) , X độc lập với Y Xét mẫu ngẫu nhiên (X1, X2,…Xn) rút từ X mẫu ngẫu nhiên (Y1, Y2,…Ym) rút từ Y Định lý 5: Thống kê U = X − Y − (μ1 − μ ) Định lý 6: Thống kê T = σ12 σ 22 + n m có quy luật phân phối chuẩn N(0,1) X − Y − (μ1 − μ ) nm(n + m − 2) có quy luật phân phối 2 n m + nS + mS X Y Student với n + m – bậc tự Trong S2X phương sai mẫu biến ngẫu nhiên X, S2Y phương sai mẫu biến ngẫu nhiên Y Các thống kê đề cập đến sử dụng phần ước lượng kiểm định giả thuyết 117 Bài 5: Cơ sở lý thuyết mẫu TÓM LƯỢC CUỐI BÀI Để học tập bạn cần nắm vững vấn đề sau: Khái niệm phương pháp mẫu, thống kê đặc trưng mẫu cách tính giá trị thống kê đặc trưng mẫu, mẫu ngẫu nhiên hai chiều cách tính giá trị thống kê mẫu ngẫu nhiên hai chiều Quy luật phân phối xác suất số thống kê Đặc biệt bạn cần phải nắm vững thống kê đặc trưng mẫu cách tính giá trị thống kê với mẫu cụ thể, cần nắm vững quy luật phân phối xác suất số thống kê mẫu 118 Bài 5: Cơ sở lý thuyết mẫu BÀI TẬP Theo dõi thời gian hoàn thành sản phẩm 50 cơng nhân ta có bảng số liệu sau Thời gian 12-14 14-16 16-18 18-20 20-22 22-24 24-26 26-28 Số công nhân 10 12 14 Xác định trung bình mẫu, phương sai, phương sai hiệu chỉnh, độ lệch chuẩn độ lệch chuẩn hiệu chỉnh mẫu Trong trại chăn nuôi lợn thử nghiệm loại thức ăn mới, sau ba tháng người ta cân thử số lợn thu số liệu sau: Trọng lượng(kg) 65 67 68 69 70 71 73 Số 2 a Tìm tần suất lợn có trọng lượng 68 kg b Hãy tính trung bình mẫu, phương sai, phương sai mẫu hiệu chỉnh Điều tra sản lượng sản xuất thép hàng tháng cơng ty thép (đơn vị: nghìn tấn) ta có bảng số liệu sau: 7,0 6,9 7,8 7,7 7,3 6,8 6,7 8,2 8,4 7,0 6,7 7,5 7,2 7,9 6,7 7,8 7,5 6,6 7,8 7,5 7,2 7,6 a Hãy thu gọn số liệu mẫu b Hãy tính tần suất tháng mà có số sản lượng thép lớn 7,5 c Hãy tính trung bình, phương sai, phương sai mẫu hiệu chỉnh Điều tra mức thu nhập X hàng năm (100$/năm) số tiền Y chi cho nhu cầu xa xỉ phẩm ($/tháng) ta số liệu mẫu: X 23 17 34 56 49 31 26 80 65 40 26 Y 10 50 120 225 90 60 55 340 170 25 80 Hãy tính hệ số tương quan mẫu X Y từ có kết luận mối quan hệ giữ X Y? Ký hiệu f1 tần suất người có mức thu nhập 3400$ tập Hãy tính giá trị thống kê: U= (f1 − 0, 6) n f1 (1 − f1 ) Ký hiệu f2 tần suất người có mức chi dùng cho nhu cầu xa xỉ 60$ 119 Bài 5: Cơ sở lý thuyết mẫu tập Hãy tính giá trị thống kê: U= (f1 − 0, 2) n f (1 − f ) Cho biến cố A, gọi X biến ngẫu nhiên nhận giá trị biến cố A xuất hiện, X nhận giá trị biến cố X không xuất Lấy mẫu ngẫu nhiên cỡ 15 ta thu giá trị mẫu: ( 0; 0; 1; 0; 1; 1; 1; 0; ;1; 1; 0; 0; 0; 1) a Hãy thu gọn số liệu mẫu? số lần thực phép thử biến cố A bao nhiêu? b Tính tần suất xuất biến cố A? Điều tra thu nhập nhóm cơng nhân, ta thu số liệu sau Thu nhập (triệu) số công nhân 15-17 17-19 19-21 21-23 23-25 25-27 12 Hãy tính tần suất cơng nhân mẫu điều tra có mức thu nhập khoảng 19 đến 25 triệu 120 ... cần phải nắm vững thống kê đặc trưng mẫu cách tính giá trị thống kê với mẫu cụ thể, cần nắm vững quy luật phân phối xác suất số thống kê mẫu 118 Bài 5: Cơ sở lý thuyết mẫu BÀI TẬP Theo dõi thời... tính toán để xác định phân phối xác suất kỳ vọng mẫu X cho trường hợp biến ngẫu nhiên -3 -2 -1 Z 115 Bài 5: Cơ sở lý thuyết mẫu gốc có phân phối 0−1 Tuy nhiên, tính tốn khơng phải đơn giản cỡ mẫu. . .Bài 5: Cơ sở lý thuyết mẫu TÌNH HUỐNG KHỞI ĐỘNG BÀI Tình Điều tra mức thu nhập cá nhân tháng (triệu đồng) huyện Đông Anh, ta có bảng số liệu mẫu sau: Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7 số