Lấy mẫu có lặp là lấy mẫu mà phần tử lấy ra, sau khi đã ghi giá trị đặc trưng, được trả trở lại tổng thể trộn đều rồi lấy tiếp phần tử khác.(phân phối nhị thức).. Mẫu không lặp.[r]
(1)Chương 4
MẪU VÀ CÁC THAM SỐ MẪU
4.1. MẪU VÀ CÁC PHƯƠNG PHÁP XÂY DỰNG MẪU
4.1.1. Tổng thể mẫu
Định nghĩa 4.1.24 Tập hợp toàn đối tượng cần nghiên cứu, khảo sát "đặc tính" chúng gọi tổng thể(hay tập hợp tổng quát hay tập sinh) Ký hiệu tập tổng thể làΩ
Số phần tử(lực lượng) củaΩgọi kích thước tổng thểΩ
Định nghĩa 4.1.25 Từ tổng thể, ta chọn ngẫu nhiên(theo cách chọn quy định trước)nphần tử(đối tượng), tậpnphần tử chọn gọi mẫu Khi đó,ngọi kích thước mẫu
4.1.2. Các phương pháp xây dựng mẫu Mẫu lặp
Lấy mẫu có lặp lấy mẫu mà phần tử lấy ra, sau ghi giá trị đặc trưng, trả trở lại tổng thể trộn lấy tiếp phần tử khác.(phân phối nhị thức)
Mẫu không lặp
Lấy mẫu không lặp lấy mẫu mà phần tử lấy ra, sau ghi giá trị đặc trưng, không trả trở lại tổng thể mà lấy tiếp phần tử khác.(phân phối siêu bội)
Ta biết rằng, phân phối siêu bội hội tụ phân phối nhị thức nên số phần tử tổng thể
N lớn so với kích thước mẫun(N > 100n)thì việc lấy mẫu khơng lặp lại xem mẫu có lặp Do đó, lý thuyết, ta thường nghiên cứu mẫu lặp
Xây dựng mẫu theo lối điển hình
Ví dụ 4.1.48 Để ước lượng chiều cao trung bình học sinh lớp4tại địa phươngAcó20000học sinh lớp4 Trong đó, thành phố7000, nông thôn8000và miền núi5000học sinh Lấy mẫu
2000học sinh sau: lấy700học sinh thành phố,800học sinh nơng thơn và500học sinh miền núi Khi mẫu chọn xây dựng theo lối điển hình
Xây dựng mẫu theo lối máy móc
(2)32 Chương MẪU VÀ CÁC THAM SỐ MẪU
4.2 Các phương pháp trình bày số liệu 4.2.1. Mẫu ngẫu nhiên mẫu thực nghiệm
Ta chọn ngẫu nhiên phần tử từ tậpΩ Khi đóΩđược xem khơng gian kiện sơ cấp GọiXlà biến ngẫu nhiên biểu thị đặc trưng nghiên cứu tậpΩ(Xliên kết với phép thử lấy phần tử) Ký hiệuϵlà phép thử lấy phần tử
Lặp lại phép thử ϵ n lần Gọi Xi giá trị đặc trưng phần tử lấy lần thứ i(i = 1, n Khi biếnX1, X2, , Xnđộc lập có quy luật phân phối vớiX,nbiến ngẫu nhiên (X1, X2, , Xn)gọi mẫu ngẫu nhiên củaX
Sau lấy mẫu, ta cóX1 = x1, X2 = x2, , Xn = xn Bộn số(x1, x2, , xn)được gọi
mẫu cụ thể(mẫu thực nghiệm) củaX
Định nghĩa 4.2.26 Ta gọi mẫu ngẫu nhiên kích thứcn biến ngẫu nhiênX bộn thứ tự
(X1, X2, , Xn), đóX1, X2, , Xnlànbiến ngẫu nhiên độc lập có phân phối xác suất
vớiX
Sau lấy mẫu, ta cóX1 =x1, X2 =x2, , Xn =xn Bộnsố(x1, x2, , xn)được gọi
mẫu cụ thể(mẫu thực nghiệm) củaX
4.2.2 Các phương pháp trình bày mẫu Trình bày mẫu có giá trị khác nhau
Giả sử lấy mẫu kích thức n biến ngẫu nhiên X có mẫu cụ thể với số liệu ban đầu
(x1, x2, , xn)nhưng cókgiá trị khác nhau:a1 < a2 < < ak
Gọinilà số lầnai(i= 1, ncó mẫu thực nghiệm nigọi tần số
Gọifi = nin tần suất giá trịai mẫu thực nghiệm
Khi đó, ta có bảng thống kê(Bảng phân phối tần số không chia lớp) sau:
ai a1 a2 ak
ni n1 n2 nk
Ví dụ 4.2.50 Ta lấy mẫu kích thướcn= 20, ta có1,3,2,1,5,3,4,1,4,3,2,5,4,3,12,1,4,3,3
Ta có bảng thống kê
ai
ni
Trình bày mẫu có nhiều giá trị khác nhau
Trong trường hợp lấy mẫu kích thướcncó nhiều giá trị khác ý nghĩa thực tế mà ta chia mẫu thành nhiều lớp
Khơng có quy tắc chia lớp Tuy nhiên, theo số nhà thống kê đề nghị chia lớp sau: 1) Xác định số lượng lớpk {
1 +log2n6k 65lgn 66k 620
2) Bề rộng lớp
b= amax−amin
k
3) Tần sốnicủa lớpai−1−ailà số lần giá trị mẫu màai−1 6x < ai
(3)4.2 Các phương pháp trình bày số liệu 33
4) Giá trị giữa(trung tâm) lớpai−1−ailà:a∗i =
ai−1+ai
2
Ta có bảng thống kê(Bảng phân phối tần số chia lớp) sau:
Lớp[ai, ai) a0 −a1 a1−a2 ak−1−ak
ni n1 n2 . nk
Chú ý, bảng phân phối tần số thực nghiệm ta thay tần sốnibỡi tần suất tương
ứngfita bảng gọi bảng phân phối tần suất(chia lớp không chia lớp) thực nghiệm
Hàm phân phối thực nghiệm
Định nghĩa 4.2.27 ChoX biến ngẫu nhiên lấy mẫu kích thứcncủaX Hàm phân phối thực nghiệm ứng với mẫu chọn, ký hiệuFn(x), xác định sau:
+ Nếu mẫu thực nghiệm cho theo bảng không chia lớp (4.2.2.)
Fn(x) = ∑ ai<x ni n =
0 Nếux6a1 n1
n Nếua1 < x6a1 n1+n2
n Nếua2 < x6a3
Pk−1
i=1ni
n Nếuak−1 < x6ak Nếux > ak
+ Nếu mẫu thực nghiệm cho theo bảng chia lớp (??)
Fn(x) = ∑ ai−1<x
ni n =
0 Nếux6a0 n1
n Nếua0 < x6a1 n1+n2
n Nếua1 < x6a2
Pk−1
i=1ni
n Nếuak−2 < x6ak−1 Nếux > ak−1
Định lý 4.2.19 Giả sửF(x)là hàm phân phối xác suất củaXvàFn(x)là hàm phân phối thực nghiệm
củaX Khi đó, vớinkhá lớnFn(x)≈F(x).
Ví dụ 4.2.51 Tìm hàm phân phối thực nghiệm củaXbiết
a) ai
ni
; b) Lớp[ai, ai) 0−4 4−8 8−12
ni
Giải a) Ta có
F10(x) = 10
∑ ni<x
ni =
0 Nếux61
10 Nếu1< x63
10 Nếu3< x65 Nếux >5
b) Ta có
F9(x) =
0 Nếux60
9 Nếu0< x64
(4)34 Chương MẪU VÀ CÁC THAM SỐ MẪU
4.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA MẪU
Giả sử(X1, X2, , Xn)là mẫu ngẫu nhiên củaX sau lấy mẫu ta có mẫu thực nghiệm (x1, x2, , xn)
4.3.1 Các tham số mẫu ngẫu nhiên
1 Biến ngẫu nhiênX = n1 ∑ni=1Xiđược gọi làtrung bình mẫu ngẫu nhiên
2 Biến ngẫu nhiênδ2 n=
1 n
∑n
i=1(Xi−X)
2 được gọi làphương sai mẫu ngẫu nhiên
δ2 n−1 =
n n−1δ
2 n =
1 n−1
∑n
i=1(Xi−X)2được gọi làphương sai điều chỉnh mẫu ngẫu nhiên
δn= √
δ2
n :Độ lệch chuẩn mẫu ngẫu nhiên
δn−1 = √
δ2
n−1 :Độ lệch chuẩn điều chỉnh mẫu ngẫu nhiên
4.3.2. Các tham số mẫu thực nghiệm
1 Số trung bình mẫu thực nghiệm:
x=
n
n ∑
i=1
xi
2 Số phương sai mẫu thực nghiệm:
δn2 =
n
n ∑
i=1
(xi−x)2
3 Số phương sai điều chỉnh mẫu thực nghiệm:
δn2−1 = n
n−1δ n=
1
n−1 n ∑
i=1
(xi−x)2
δn= √
δ2
n :Độ lệch chuẩn mẫu thực nghiệm
δn−1 = √
δ2
n−1 :Độ lệch chuẩn điều chỉnh mẫu thực nghiệm
Từ công thức trên, ta suy cơng thức tính mẫu thực nghiệm có bảng phân phối không chia lớp chia lớp sau:
+ Nếu mẫu thực nghiệm có bảng phân phối tần số không chia lớp dạng
ai a1 a2 ak
ni n1 n2 nk (
k ∑
i=1
ni =n)
thì
x=
n
k ∑
i=1
niai
δ2n=
n
k ∑
i=1
ni(ai−x)2 =
n
k ∑
i=1
(5)4.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA MẪU 35
+ Nếu mẫu thực nghiệm có bảng phân phối tần số chia lớp Lớp[ai, ai) a0−a1 a1−a2 ak−1−ak
ni n1 n2 . nk (
k ∑
i=1
ni =n)
Đặta∗i = ai−1+ai
2 , ta có bảng
a∗i a∗1 a∗2 a∗k ni n1 n2 nk
Khi
x=
n
k ∑
i=1
nia∗i
δn2 =
n
k ∑
i=1
ni(a∗i −x) =
n
k ∑
i=1
nia∗2i −x
Ví dụ 4.3.52 Tínhx, δn2 mẫu trường hợp sau:
a) ai
ni
; b) [ai, ai) 0−2 2−4 4−6 6−8 8−10 10−12
ni 10 10 10 20
Giải
a) Lập bảng tính
ai ni ai.ni nia2i
1 3
3 15 45
5 10 50
∑
n= 10 28 98
Số trung bình mẫu làx= n1 ∑ki=1niai = 101.28 = 2,8
Số phương sai mẫuδ2n= n1 ∑ki=1nix2i −x2 = 101 98−(2,8)
2 = 1,96
b) Đặtx∗i = xi−1+xi
2 , ta có
x∗i 11
ni 10 10 10 20
Lập bảng tính
x∗i ni x∗i.ni nix∗i2
1 5
3 10 30 90
5 10 50 250
7 35 245
9 10 90 810
11 20 220 2420 ∑
n= 60 430 3820
Số trung bình mẫu làx= n1 ∑ki=1nix∗i =
60.430 = 43
6
Số phương sai mẫuδ2n= n1 ∑ki=1nix∗i 2−
(6)36 Chương MẪU VÀ CÁC THAM SỐ MẪU
Cơng thức tính tốn Khi tính tốn tham số đặc trương mẫu thực nghiệm để tránh việc tính tốn số có giá trị lớn phức tạp, người ta thường sử dụng tính chất sau
∀x0 ∈ R,∀d̸= 0, k ∑
i=1
ni =nta có
x=
n
k ∑
i=1
niai =
d n
k ∑
i=1
ni
ai−x0
d +x0 δn2 =
n
k ∑
i=1
ni(ai−x)2 =
d2
n
k ∑
i=1
ni(
ai−x0
d )−(x−x0)
2
Thơng thường ta chọnx0là gia trị tần số lớn nhất,dlà khoảng cách đều(nếu có)
Ví dụ 4.3.53 Tìmx, δ2
n, δn−1với
xi 3,94 3,97 4,00 4,03 4,06
ni 10
GiảiTa chọnx0 = 4,00 = 4, d= 0,03 Ta có bảng tính:
xi ni xi0,03−4 nixi0,03−4 ni(xi0,03−4)
3,94 −2 −2
3,97 −1 −7
4,00 10 0
4,03 5
4∑,06 2
n= 25 0 24
Số trung bình mẫu
x= d
n
k ∑
i=1
ni
ai−x0
d +x0 =
0,03
25 .0 + =
Số phương sai mẫu phương sai điều chỉnh
δn2 = d
n
k ∑
i=1
ni(
ai−x0
d )−(x−x0)
2 = 0,032
25 .24−(4−4)
2 = 0,000864
δn−1 = √
n n−1δ
2 n=
√ 25
24.0,000864 = 0,03
Ví dụ 4.3.54 Tìmx, δn2, δn−1với
[ai−1, ai) 10500−10550 10550−10600 1060−10650 10650−10700
(7)4.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA MẪU 37
Giải
Đặtx∗i = xi−1+xi
2 , ta có
x∗i 10525 10575 10625 10675
ni 15 55 20 10
Ta chọnx0 = 10575, d= 50 Ta có bảng tính:
x∗i ni
x∗i−10575 50 ni.
x∗i−10575 50 ni(
x∗i−10575 50 )
2
10525 15 −1 −15 15
10575 55 0
10625 20 20 20
10675∑ 10 20 40
n= 100 25 75
Số trung bình mẫu
x= 50
100.25 + 10575 = 10587,5
Số phương sai mẫu phương sai điều chỉnh
δn2 = 50
100.75−(10587,5−10575)
2 = 1618,75
δn−1 = √
n n−1δ
2 n=
√ 100