Khái niệm Nghiên cứu một hiện tượng, xét trong những tập hợp xác định. Mô tả hiện tượng nghiên cứu qua dấu hiệu Mô tả dấu hiệu qua biến ngẫu nhiên X Nghiên cứu X+ Qui luật phân phối xác suất+ Tham số đặc trưng Số liệu để nghiên cứuCó hai phương thức Nghiên cứu toàn bộ tập hợp chứa dấu hiệu nghiên cứu : Tổng thể+ Kết quả chính xác, phản ánh toàn bộ hiện tượng+ Tốn kém, không làm được hoặc tốn kém, tính thông tin giảm dần Nghiên cứu một phần của tổng thể, đủ thông tin đặc trưng : Mẫu
Trang 1Phần hai THỐNG KÊ TOÁN
Chương 7 CƠ SỞ LÝ THUYẾT MẪU
7.1 Khái niệm
- Nghiên cứu một hiện tượng, xét trong những tập hợp xác định
- Mô tả hiện tượng nghiên cứu qua dấu hiệu χ
- Mô tả dấu hiệu χ qua biến ngẫu nhiên X
- Nghiên cứu X + Qui luật phân phối xác suất
+ Tham số đặc trưng
- Số liệu để nghiên cứu
Có hai phương thức
- Nghiên cứu toàn bộ tập hợp chứa dấu hiệu nghiên cứu : Tổng thể
+ Kết quả chính xác, phản ánh toàn bộ hiện tượng + Tốn kém, không làm được hoặc tốn kém, tính thông tin giảm dần
- Nghiên cứu một phần của tổng thể, đủ thông tin đặc trưng : Mẫu
7.2 Tổng thể nghiên cứu
7.2.1 Mô tả tổng thể
Tổng thể là tập hợp tất cả các phần tử chứa đựng dấu hiệu nghiên cứu Phần tử trong tổng thể là rời rạc hoặc có thể rời rạc hóa
Số lượng phần tử: N, có thể N = + ∞→ N ∈ N
X là BNN của dấu hiệu χ , với các phần tử X = {x1,x2, , x N}
Nếu các x i nhận các giá trị có thể có x1,x2, , x k với tần số tương ứng N1,N2, , N k thì có thể
mô tả tổng thể
i 1=
∑
Ni = N
Đặt pi = N
N i
là tần suất tổng thể, thì pi = P(X = xi) trong tổng thể
i 1=
∑
pi = 1
Trang 27.2.2 Tham số đặc trưng của tổng thể
i Trung bình tổng thể
∑
∑
=
=
=
i i i N
i
N
x N
m
1 1
1 1
=
=
= k
i i
i x E X p
m
1
) (
: Trung bình tổng thể = Kì vọng BNN X
ii Phương sai tổng thể
∑= −
i
x
N 1
2
σ
→ σ 2 = V(X) : Phương sai tổng thể = Phương sai BNN X
iii Độ lệch chuẩn
σ = σ2
iv Tần suất tổng thể
Nếu biến cố A xuất hiện trong tổng thể K lần
→ tần suất tổng thể của biến cố A: p = N
M
= P(A)
7.3 Mẫu ngẫu nhiên
7.3.1 Định nghĩa mẫu
Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc lập X1, X2,…, Xn được thành lập từ biến ngẫu nhiên X trong tổng thể nghiên cứu và có cùng qui luật phân phối xác suất với X
Kí hiệu : W = (X1, X2,…, Xn)
→ E(X1) = … = E(Xn) = m
→ V(X1) = … = V(Xn) = σ2
7.3.2 Phương pháp chọn mẫu
7.3.3 Mô tả mẫu
Quan sát đúng n lần (lấy mẫu kích thước n bằng số cụ thể), khi đó X1 = x1, X2 = x2,…, Xn = xn
là số cụ thể, mẫu cụ thể w = (x1, x2,…, xn)
Nếu giá trị có thể có là x1, x2,…, xk với tần số tương ứng n1, n2,…, nk hoặc tần suất tương ứng
f1, f2, …, fk với fi = ni/n thì có thể mô tả mẫu w
- Có thể ghép lớp của giá trị mẫu bằng cách lấy giá trị ở giữa để đại diện cho lớp
7.4 Thống kê
7.4.1 Khái niệm
Với W = (X1, X2,…, X n ), thống kê trên mẫu là một hàm số của các thành phần mẫu Xi
Trang 3Kí hiệu thống kê G = f(X1, X2,…, Xn) Khi đó G cũng là một biến ngẫu nhiên, có phân phối xác suất xác định, có thể không giống biến ngẫu nhiên gốc, nhưng mang thông tin về X.
Với mẫu cụ thể w = (x1, x2,…, xn), thống kê G là một giá trị cụ thể : g = f(x1, x2,…, xn)
7.4.2 Trung bình mẫu
Với mẫu ngẫu nhiên: = ∑=n
i i X n
X
1
1
mẫu cụ thể: = ∑= = ∑=k
i i i n
i
n
x n
x
1 1
1 1
X là biến ngẫu nhiên có các tham số đặc trưng
E( X ) = m V( X ) = n
2
σ
→σ ( X ) = Se( X )= n
σ
7.4.2 Tổng bình phương sai lệch
SS = ∑=n −
i
X
1
2
) (
Độ lệch bình phương trung bình : MS = ∑=n −
i
X
n 1
2
) (
1
Chứng minh được E(MS) =
2
1σ
n
n−
7.4.3 Phương sai mẫu
Nếu không biết m
S2 = ∑
=
−
−
n
i
X
2
) (
1
1
→ E(S2) = σ2
Với mẫu cụ thể w
n
n x
x n n
k
i i i
2 2 1
1 )
( 1
−
=
−
=
Căn bậc hai của phương sai cho độ lệch chuẩn mẫu
S = S (mẫu ngẫu nhiên)2 s = s (mẫu cụ thể)2
7.4.4 Tần suất mẫu
Nếu biến cố A xuất hiện X lần thì tần suất mẫu: f = n
X A
Tham số đặc trưng E(f) = p
V(f) = n
p
p(1− )
→ Se(f) = n
p
p(1− )
Với mẫu cụ thể f = n
mA
Trang 4Tổng kết
Tổng thể Mẫu ngẫu nhiên – W Mẫu cụ thể – w
i i
i x n n
x
1
1
n
) (
−
Tính chất - Là giá trị xác định
- Thường là không biết
- Là biến ngẫu nhiên
- Có qui luật PPXS
- Là số xác định tính toán được
7.5 Qui luật phân phối xác suất của các thống kê
Các thống kê là biến ngẫu nhiên → có qui luật phân phối xác suất
7.5.1 Biến ngẫu nhiên gốc phân phối chuẩn
X ~ N(µ , σ 2), W = (X1, X2,…, Xn)
∑
=
i i X n
X
1
1
2
σ
)
( −
→ U ~ N(0 , 1)
T = S
n
( −µ
→ T ~ T(n – 1)
χ2 = 2
2
) 1 (
σ
S
n−
→ χ2 ~ χ2(n – 1)
7.5.2 Biến ngẫu nhiên gốc phân phối Không-Một
X ~ A(p)
U = (1 )
) (
p p
n p f
−
−
→ U ~ N(0 , 1)
Trang 5Chương 8 ƯỚC LƯỢNG THAM SỐ
Với một tham số θ của tổng thể mà giá trị chưa biết, xác định một cách gần đúng giá trị của θ
thông qua thông tin của mẫu
8.1 Ước lượng điểm
8.1.1 Khái niệm
Ước lượng điểm cho θ bởi một thống kê θˆ của mẫu ngẫu nhiên W kích thước n sao cho thỏa
mãn một số điều kiện
8.1.2 Tiêu chuẩn của ước lượng
i Không chệch : E(θˆ ) = θ
ii Hiệu quả: không chệch và phương sai nhỏ nhất trong số các ước lượng không chệch
iii Vững : θˆ →n→∞ θ
iv Đủ : θˆ chứa toàn bộ thông tin trong mẫu về θ
8.1.3 Ước lượng điểm một số tham số
X → m
S 2→σ 2
f → p
8.2 Ước lượng khoảng
(Ước lượng bằng khoảng tin cậy)
8.2.1 Khái niệm
Khoảng (G1, G2) của thống kê G được gọi là khoảng tin cậy của tham số θ nếu với xác suất 1 –
α cho trước P(G1 < θ < G2) = 1 – α
1 – α gọi là độ tin cậy
I = G2 – G1 là độ dài khoảng tin cậy
W = (X1, X2,…, X n)
8.3 Ước lượng khoảng cho tham số biến ngẫu nhiên phân phối chuẩn
Nếu X ~ N(µ , σ2), với mẫu W kích thước n, ước lượng cho tham số chưa biết
Với W, tính đượcX , S2
8.3.1 Ước lượng trung bình tổng thể (µ )
(Ước lượng kì vọng toán biến ngẫu nhiên phân phối chuẩn)
8.3.1.1 Khi đã biết phương sai tổng thể σ 2 (tham khảo giáo trình – không thi)
8.3.1.2 Khi chưa biết phương sai tổng thể σ 2 , chỉ biết phương sai mẫu S 2
Vì T = S
n
( −µ
U ~ T(n – 1) nên
Trang 6
− ( −1)< < + ( −1)
2 / 2
n
S X n
t n
S X
= 1 – α
Khoảng tin cậy đối xứng
) 1 ( )
1
2
n
s x n
t n
s
Khoảng tin cậy tối đa
) 1 ( − +
n
s
µ
Khoảng tin cậy tối thiểu − tα(n−1)<µ
n
s x
8.3.1.3 Vấn đề kích thước mẫu (chỉ áp dụng với khoảng tin cậy đối xứng)
Xét độ dài khoảng tin cậy đối xứng trong trường hợp biết phương sai tổng thể
I = 2ε = /2
2
α
σ
u
n ε là độ chính xác của ước lượng
Độ tin cậy 1 – α cho trước, để độ dài khoảng tin cậy không vượt quá một đoạn I0 = 2εo : I ≤ I0
thì kích thước mẫu n’ nguyên dương cần thỏa mãn n’ ≥
2 2 / 2 0
2
4
α
σ u
I hoặc n’ ≥
2 2 / 2 0
2 α
ε
σ u
→ Nếu muốn độ dài khoảng tin cậy giảm đi k lần (độ chính xác của ước lượng tăng k lần) thì kích thước mẫu tăng k2 lần
• Trong trường hợp không biết phương sai tổng thể, dùng phương pháp mẫu kép, dựa trên mẫu
kích thước n đã có
n’ ≥
) 1 (
2 / 2 0
2
−
n t I
S
α
hoặc n’ ≥
) 1 (
2 2 / 2 0
2
−
n t
S
α
8.3.2 Ước lượng phương sai tổng thể
(Ước lượng phương sai biến ngẫu nhiên phân phối chuẩn)
8.3.2.1 Khi đã biết trung bình tổng thể µ (tham khảo giáo trình – không thi)
8.3.2.2 Khi chưa biết trung bình tổng thể µ
Với mẫu, tính được phương sai S2,
χ2 =
2 2
(n 1)S
σ
−
~ χ2(n – 1) → khoảng tin cậy 2 phía với mẫu cụ thể
2 2 /2
( 1) ( 1)
n
α
χ
−
− < σ 2 <
2 2
1 /2
( 1) ( 1)
n
α
χ−
−
−
→ khoảng tin cậy tối đa cho phương sai tổng thể với mẫu cụ thể
σ 2 <
2 2 1
( 1) ( 1)
n
α
χ−
−
−
→ khoảng tin cậy tối thiểu cho phương sai tổng thể với mẫu cụ thể
Trang 7
2 2
( 1) ( 1)
n
α
χ
−
− < σ 2
8.4 Ước lượng tần suất tổng thể
(Ước lượng tham số p của biến ngẫu nhiên phân phối Không-Một)
Nếu n ≥ 100 thì (1 )
) (
f f
n p f
−
−
≈ N(0, 1)
) 1 ( )
1 (
α
n
f f f p u
n
f f
f f f
p< + (1− )
f f
f − (1− ) α <
Kích thước mẫu tối thiểu để độ dài khoảng tin cậy đối xứng không vượt quá I0 cho trước
n’ ≥
2 2 / 2
0
) 1 ( 4
α
u I
f
f −
hoặc n’ ≥
2 2 / 2 0
) 1 (
α
f
f −
Trang 8
Chương 9 KIỂM ĐỊNH GIẢ THUYẾT
9.1 Khái niệm chung
9.1.1 Giả thuyết thống kê
Nghiên cứu vấn đề thông qua dấu hiệu χ , kiểm tra xem χ có hay không có một hoặc một số tính chất nào đó Dấu hiệu χ đặc trưng bởi (các) biến ngẫu nhiên, kiểm tra dựa trên BNN là kiểm định giả thuyết thống kê, gồm 3 loại:
+ Kiểm định về dạng phân phối xác suất + Kiểm định về tham số đặc trưng + Kiểm định về tính độc lập của các biến ngẫu nhiên
Giả thuyết đưa ra thường được kí hiệu là H0 và gọi là giả thuyết gốc, mệnh đề ngược lại được gọi
là giả thuyết đối, thường kí hiệu là H1, tạo thành một cặp giả thuyết
Để kiểm tra một giả thuyết là đúng hay không, cần phải kiểm định, dùng phương pháp thống kê, dựa trên một mẫu thực nghiệm để kết luận:
+ Giả sử H 0 đúng + Khi H 0 đúng, với một mẫu, biến cố A sẽ xảy ra với xác suất rất nhỏ + Theo nguyên lí xác suất nhỏ, có thể nói với một phép thử, A sẽ không xảy ra + Với mẫu cụ thể nếu A xảy ra → bác bỏ H0
nếu A không xảy ra → chưa có cơ sở bác bỏ H0
9.1.2 Tiêu chuẩn kiểm định
Với mẫu ngẫu nhiên W = (X1, X2,…, Xn), chọn thống kê G = f(X1, X2,…, Xn, θ 0) với θ 0 là tham
số liên quan đến giả thuyết H0, và nếu H0 đúng thì qui luật phân phối xác suất của G hoàn toàn xác định Thống kê G gọi là tiêu chuẩn kiểm định
9.1.3 Miền bác bỏ giả thuyết
Sau khi chọn tiêu chuẩn kiểm định G, tìm được miền Wα sao cho với α nhỏ (0.05 hoặc 0.01)
P(G ∈ Wα / H0) = α thì α được gọi là mức ý nghĩa của kiểm định và Wα là miền bác bỏ giả thuyết H0 với mức ý nghĩa α
9.1.4 Giá trị quan sát
Thực hiện phép thử với mẫu : mẫu cụ thể, khi đó giá trị cụ thể của tiêu chuẩn kiểm định (thống
kê) là Gqs = f(x1, x2,…, xn,θ 0)
9.1.5 Quy tắc kiểm định
Với một mẫu cụ thể, tính được giá trị quan sát của tiêu chuẩn kiểm định
- Nếu giá trị quan sát thuộc miền bác bỏ → bác bỏ H0
- Nếu giá trị quan sát không thuộc miền bác bỏ → chưa có cơ sở bác bỏ H0
9.1.6 Các loại sai lầm
Sai lầm loại một : bác bỏ một điều đúng Xác suất mắc sai lầm loại một bằng mức ý nghĩa α
Sai lầm loại hai : thừa nhận một điều sai Xác suất mắc sai lầm loại hai bằng β , 1 – β gọi là lực kiểm định
Trang 99.2 Kiểm định tham số của một tổng thể
9.2.1 Kiểm định trung bình tổng thể phân phối chuẩn
(Kiểm định về kì vọng toán biến ngẫu nhiên phân phối chuẩn)
Nếu biến ngẫu nhiên gốc phân phối chuẩn X ~ N(µ , σ2) với µ chưa biết, cần kiểm định
9.2.1.1 Khi đã biết phương sai tổng thể σ2 (tham khảo giáo trình – không thi)
9.2.1.2 Khi chưa biết phương sai tổng thể (với µ0 cho trước từ thông tin đầu bài)
Tiêu chuẩn kiểm định
T =
0
(X ) n S
µ
−
Thống kê quan sát với mẫu cụ thể
Tqs =
0
(x ) n s
µ
−
(thay số)
H :
H :
µ µ
µ µ
=
Wα = {Tqs > tα/2 (n – 1)}
H :
H :
µ µ
µ µ
=
>
Wα = {T qs > tα(n – 1)}
H :
H :
µ µ
µ µ
=
<
Wα = {T qs < – tα(n – 1)}
Nguyên tắc quyết định: T qs∈Wα bác bỏ H
0
W
T qs∉ α chưa có cơ sở bác bỏ H
0 (chấp nhận H0)
9.2.2 Kiểm định phương sai tổng thể phân phối chuẩn
X ~ N(µ , σ 2) với σ 2 chưa biết, cần kiểm định:
(với
2 0
σ cho trước từ thông tin đầu bài)
Tiêu chuẩn kiểm định
χ2 = 02
2
) 1 (
σ
S
n−
Thống kê quan sát với mẫu cụ thể
2
qs
0
2
) 1 (
σ
s
n−
(thay số)
H :
H :
≠
Wα = {
−
<
−
>
) 1 (
2 2 / 1 2
2 2 / 2
n
n qs
qs
α
α
χ χ
χ χ
}
H :
H :
>
Wα = {χqs2 >χα2(n−1)}
H :
H :
<
Wα = {χqs2 <χ12−α(n−1)}
Nguyên tắc quyết định: χ ∈qs2 Wα
bác bỏ H0
W
χ ∉2
chưa có cơ sở bác bỏ H0 (chấp nhận H0)
9.2.3 Kiểm định tần suất tổng thể
(Kiểm định tham số p của biến ngẫu nhiên phân phối A(p) )
(với p cho trước từ thông tin đầu bài)
Trang 10Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0
Tiêu chuẩn kiểm định
) (
0 0
0
p p
n p f
−
−
Thống kê quan sát với mẫu cụ thể
Uqs = (1 )
) (
0 0
0
p p
n p f
−
−
(thay số)
(n ≥ 100)
H :
H :
=
Wα ={U U: >uα2}
H :
H :
=
>
Wα ={U U: >uα}
H :
H :
=
<
Wα ={U U: < −uα}
Nguyên tắc quyết định: U qs ∈Wα bác bỏ H
0
W
U qs ∉ α chưa có cơ sở bác bỏ H
0 (chấp nhận H0)