TRƯỜNG ĐẠI HỌC THƯƠNG MẠIKHOA HỆ THỐNG THÔNG TIN KINH TẾ VÀ TMĐT---oOo---ĐỀ TÀI:KHẢO SÁT VÀ KIỂM TRA MẪU VỀ KẾT QUẢ HỌC TẬP GPA CỦA CÁC BẠNSINH VIÊN NAM VÀ NỮ TRƯỜNG ĐẠI HỌC THƯƠNG MẠI T
Trang 1TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
KHOA HỆ THỐNG THÔNG TIN KINH TẾ VÀ TMĐT
-oOo -ĐỀ TÀI:
KHẢO SÁT VÀ KIỂM TRA MẪU VỀ KẾT QUẢ HỌC TẬP GPA CỦA CÁC BẠN SINH VIÊN NAM VÀ NỮ TRƯỜNG ĐẠI HỌC THƯƠNG MẠI TẠI CƠ SỞ HÀ
NAM
Giảng viên hướng dẫn : Mai Hải An
DANH SÁCH NHÓM 03
Trang 2STT Họ và tên Mã SV Nhiệm vụ Đánh giá Điểm
21 Võ Thị Hà 22D190044 - Vấn đề 1
- Thiết kế slide
22 Đỗ Thị Hảo 22D190045 - Vấn đề 3
- Thuyết trình 3
23 Nguyễn Ngọc
Hiển
22D190049 - Vấn đề 3
- Tổng hợp word
24 Đỗ Trung Hiếu 22D190050 - Vấn đề 3
- Nhận xét và phản biện
25 Trần Trung Hiếu 22D190053 - Vấn đề 1
- Thuyết trình 1
26 Lê Thị Hoài 22D190054 - Vấn đề 2
- Thuyết trình 2
27 Lê Minh Hoàng
(Nhóm trưởng)
22D190055 - Vấn đề 1
- Nhận xét và phản biện
28 Hoàng Thị Hồng 22D190058 - Vấn đề 3
- Nhận xét và phản biện
29 Tạ Thị Thu Huệ 22D190059 - Vấn đề 2
- Thiết kế slide
30 Đoàn Thị Thu
Huyền
22D190060 - Vấn đề 1
- Tổng hợp word
Trang 3MỤC LỤC
LỜI NÓI ĐẦU
NỘI DUNG
PHẦN I: CƠ SỞ LÝ THUYẾT
1 Ước lượng bằng khoảng tin cậy
1.1 Ước lượng kỳ vọng toán của đại lượng ngẫu nhiên
1.1.1 Trường hợp ĐLNN X phân phối theo quy luật chuẩn, σ2 đã biết
1.1.2 Trường hợp ĐLNN X phân phối theo quy luật chuẩn, σ2 chưa biết
2 Kiểm định giả thuyết về các tham số
2.1 Kiểm định tỷ lệ
2.2 So sánh hai kỳ vọng toán của 2 ĐLNN X và Y chưa biết quy luật phân phối xác suất nhưng n >30, n > 301 2
Phần II:THẢO LUẬN ĐỀ TÀI
Phần III: GIẢI QUYẾT BÀI TOÁN
1 Vấn đề 1
2 Vấn đề 2
3 Vấn đề 3
Phần IV Kết luận
Trang 4LỜI NÓI ĐẦU LỜI CAM ĐOAN LỜI CẢM ƠN NỘI DUNG
PHẦN I: CƠ SỞ LÝ THUYẾT
1 Ước lượng bằng khoảng tin cậy
1.1 Ước lượng giá trị trung bình
Giả sử trên một đám đông ĐLNN X có E(X) = μ và Var(X) = σ2 Trong đó μ chưa biết, cần ước lượng Từ đám đông ta lấy ra mẫu kích thước n: W=(X , X1 2, ,Xn) Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh S’ Dựa vào 2
những đặc trưng mẫu này ta sẽ xây dựng thống kê G thích hợp Ta lần lượt xét ba trường hợp sau
1.1.1 Trường hợp ĐLNN X phân phối theo quy luật chuẩn, σ2 đã biết
X N(μ,σ2) với σ2 đã biết hoặc n > 30 Khi đó:
U = X−μ
σ /n N(0,1) (1) + Khoảng tin cậy đối xứng (lấy α1 =α2 = α2 )
Với độ tin cậy 1 – α cho trước ta tìm được các phân vị chuẩn u1−α /2 và uα /2 sao cho P(U > u1−α /2) = 1 - α /2 và P(U > uα /2) = α2
Vì hàm mật độ của phân phối chuẩn hóa là hàm chẵn, nên ta chọn phân vị u1−α /2=
-uα /2
Khi đó ta có
P(−uα /2 < U < uα /2) = 1-α Viết lại biểu thức trên dưới dạng:
P(|U| < uα /2) = 1- α Thay biểu thức của U từ (1) vào công thức trên và biến đổi tương đương ta có:
P(|X−μ| < σ
√n α /2) = 1 – α (2)
Trang 5P(X – √σn α /2 < μ <X + √σn α /2) = 1-α (3) Khoảng tin cậy đọi xứng của µ:
P(X – ε < μ <X + ε) = 1 – α
Ta có sai số ước lượng: : ε= √σn α /2 (4)
Từ (2) ta có:
Độ tin cậy của ước lượng là 1 – α
Khoảng tin cậy đối xứng của μ là (X-ε;X – ε) (5)
Độ dài của khoảng tin cậy là 2ε
Sai số của ước lượng là ε, được tính bằng công thức (4)
Từ đó ta có sai só của ước lượng bằng một nửa độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a,b) thì sai số được tính theo công thức:
ε=b a−
2 (6)
Ở đây ta có bài toán cần giải quyết:
Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy 1 – α, cần tìm sai số hoặc khoảng tin cậy
Nếu biết độ tin cậy 1 – α ta tìm được α/2, tra bảng ta tìm được uα /2 từ đó ta tính được
ε theo công thức (4) và cuối cùng nếu cần, ta có thể tìm được khoảng tin cậy (5) của
μ
Chú ý 1: Khoảng tin cậy (5) là khoảng tin cậy ngẫu nhiên, trong khi μ là một số xác định Đối với mẫu ngẫu nhiên W = (X1, X2, , Xn), vì độ tin cậy 1 – α khá gần 1 nên theo nguyên lý xác suất lớn có thể coi biến cố ¿ – ε < μ <X + ε) sẽ xảy ra trong một lần thực hiện phép thử Nói một cách chính xác, với xác suất 1 – α khoảng tin cậy ngẫu nhiên (5) sẽ chụp đúng E(X) = μ
Trong một lần lấy mẫu ta được mẫu cụ thể w = (x1, x2, , xn) Từ mẫu cụ thể này ta tìm được một giá trị cụ thể x của ĐLNN trung bình mẫu Khi đó với độ tin cậy 1 – α,
ta tìm được một khoảng tin cậy cụ thể của μ là (x– ε, x + ε)
Trang 6Bài toán 2: Biết kích thước mẫu n và sai số ε (nếu biết khoảng tin cậy đối xứng (a,b) thì ta có thể tính được sai số ε theo công thức (6)) cần tìm độ tin cậy Từ (4) ta tìm được uα /2= ε√n
σ , tra bảng tìm được α/2 từ đó tìm được độ tin cậy 1 – α
Bài toán 3: Biết độ tin cậy 1 – α, biết sai số ε cần tìm kích thước mẫu n Nếu biết độ tin cậy 1 – α ta tìm được α, tiếp đến ta tìm được uα /2 Cuối cùng từ (4) ta tìm được
n= σ
2
u2
α / 2
ε2 (7)
Đó chính là kích thước mẫu tối thiểu cần tìm
Chú ý 2: Từ biểu thức (4) cũng như (7) ta thấy: Nếu giữ nguyên kích thước mẫu n và giảm sai số ε thì uα /2 cũng giảm, có nghĩa là giảm độ tin cậy Ngược lại, nếu giữ kích thước mẫu n không đổi và tăng độ tin cậy 1 – α thì sẽ làm giảm uα /2 dẫn đến sai số ε cũng tăng theo
Chú ý 3: Trong trường hợp chưa biết σ, nhưng kích thước mẫu lớn (n>30) mà biết độ lệch tiêu chuẩn mẫu điều chinh s’ thì ta có thể lấy σ≈ s’ ( vì S’ là ước lượng không2
lệch tốt nhất của σ2)
Chú ý 4: Trong trường hợp đã biết μ, cần ước lượng X thì từ công thức (2) ta có
P( μ−σ
√n.uα < X < μ−σ
√n.uα ) = 1 – α Vậy khoảng tin cậy 1 - αcủa X tương ứng là
( μ−σ
√n.uα;μ−σ
√n.uα) + Khoảng tin cậy phải (lấy α1 = 0, α2 = α; dùng để ước lượng giá trị tối thiểu của μ)
Ta vẫn dùng thống kê ở (1) Với độ tin cậy 1 – α cho trước ta tìm được phân vị chuẩn
uα sao cho
P( U < uα)= 1- α Thay biểu thức của U từ (1) vào công thức trên ta có
P(X−μ
σ /√n < uα)= 1 – α
Trang 7Hay P(X - √σn α < μ) = 1 – α
Vậy khoảng tin cậy phải với độ tin cậy 1 – α của μ là
(X – σ√n α;+∞¿
+ Khoảng tin cậy trái ( lấy α1 = α, α2 = 0 dùng để ước lượng giá trị tối đa của μ)
Ta vẫn dùng thống kê ở (1) với độ tin cậy 1 – α cho trước ta tìm được uα sao cho
P(-uα< U) = 1- α Thay biểu thức của U từ (1) vào công thức trên ta có
P(-uα<X−μσ /√n ) = 1- α
Biến đổi tương đương ta được
P(μ< X + σ
√n α ) = 1- α Như vậy khoảng tin cậy trái 1- α của μ là
(−∞; X + σ
√n α¿ 1.1.2 ĐLNN gốc X phân phối theo quy luật chuẩn, phương sai σ chưa biết2
+ Nếu n > 30 ta đưa về trường hợp 1.1.1
+ Nếu n ≤ 30 thì:
Chọn thống kê: T = X−μ
S'
/√n (9)
T là ĐLNN phân phối theo quy luật Student với số bậc tự do là n – 1 + Khoảng tin cậy đối xứng (lấy α1=α2=α / 2)
Với độ tin cậy 1−α ta chọn phân vị t1−α / 2
( n−1 ) = -tα / 2 ( n−1 ) và tα / 2 ( n−1 )sao cho P(T > t1−α / 2
(n−1 )) = 1−α / 2 và P(T>tα / 2
( n−1 ))=α / 2
=>Ta có P(|X - μ| < S'
√ntα / 2 ( n−1 )
) = 1 - α (10)
Trang 8Hay P(X - ε<μ< X+ ε) = 1 - α (11)
Trong đó ε= S'
√ntα / 2
( n−1 ) (12)
Vậy khoảng tin cậy của μlà (X - S'
√ntα ( n−1 )
; X + S'
√ntα ( n−1 )
)
Từ (11) ta có:
Độ tin cậy của ước lượng là 1 - α
Khoảng tin cậy đối xứng của μlà (X- ε;X+ ε)
Độ dài của khoảng tin cậy: 2 ε
Sai số của ước lượng là ε, được tính bằng công thức 7.14
Ta có 3 bài toán cần giải quyết Riêng bài toán 3 (Bài toán xác định kích thước mẫu)
ta sẽ giải quyết bằng phương pháp mẫu kép như sau:
Bước 1: Điều tra một mẫu sơ bộ kích thước k≥2; W = (X , X1 1 2, ,Xk) Từ mẫu này ta tìm được phương sai mẫu điều chỉnh là:
S' 2 = k−11 ∑
i=1
k
(Xi− X)2
, trong đó X = 1k∑
i=1
k
Xi
Bước 2: Giả sử mẫu cần tìm có kích thước n: W = (X , X1 1 2, ,X ).n
Ta có:
1
n∑
i=1
n
Xi−μ
S'/√n ~ T(k−1 ) (13)
Thật vậy, vì U = 1n∑
i=1
n
Xi−μ
σ /√n
~ N(0,1) và χ2 = (k−1 ) S' 2
σ2 = χ2 (k−1 ) nên
T =
1
n∑
i=1
n
Xi−μ
S'
/√n =
1
n∑
i=1
n
Xi−μ
σ /√n : √( k−1 ) S' 2
σ2( k−1 ) =
U
√ χ2
k −1 ~ T(k−1 )
Do T ~ T( k−1 ), ta có thể tìm được phân vị tα / 2❑
( k −1) sao cho P(|T| < tα / 2
(k−1 )
) = 1 - α
Trang 9Thay giá trị của T trong biểu thức (13) vào công thức trên và biến đổi tương đương ta có: P(|1
n∑
i=1
n
Xi−μ| < S'
√ntα / 2
( k−1 )
) = 1 - α
√ntα / 2 ( k−1 )
=> n =( S'
εtα / 2 ( k−1 )
)2 (14) Chú ý 1: Công thức 7.16 cho ta giá trị tối thiểu của kích thước mẫu cần tìm Chú ý 2: Trong thực hành vì có mẫu sơ bộ W = (X , X ,…, X ) ta chỉ cần điều tra1 1 2 k
thêm mẫu kích thước n – k là đủ
Khoảng tin cậy phải (lấy α1 = 0, α2=α; dùng để ước lượng giá trị tối thiểu của μ)
Ta vẫn dùng thống kê 7.11 Với độ tin cậy 1 - α cho trước, ta tìm được phân vị t(n−1 )α
sao cho
P(T < tα ( n−1 )
) = 1 - α Thay biểu thức của T từ 7.11 vào công thức trên ta có:
P(X−μ
S'
/√n < tα(n−1 )) = 1 - α
√ntα ( n−1 ) < μ) = 1−α
Vậy khoảng tin cậy phải của μlà (X - S'
√ntα ( n−1 )
; + ∞) Khoảng tin cậy trái (lấy α1 = α, α2 = 0; dùng để ước lượng giá trị tối đa của μ)
Ta vẫn dùng thống kê 7.11 Với độ tin cậy 1 - α cho trước, ta tìm được phân vị t(n−1 )α
sao cho
P( -tα (n−1 )
< T) = 1−α Thay biểu thức của T từ 7.11 vào công thức trên ta có:
P(-tα(n−1 ) < X−μ
S'
/√n) = 1−α Hay P(μ< X +S'
√ntα ( n−1 )) = 1−α
Trang 10Vậy khoảng tin cậy trái của μlà (−∞; X +S
√ntα ( n−1 )
)
Chú ý 3: Ta đã biết khi n tăng thì phân phối Student sẽ tiệm cận với phân phối chuẩn hóa rất nhanh Do đó khi n > 30 ta có thể dùng phân vị chuẩn uα thay cho phân vị Student tα
( n−1 )
Chú ý 4: Khi n > 30 ta vẫn có thể dùng thống kê ở 7.11, nhưng người ta thường dùng thống kê ở 7.3 và lấy σ≈s'
2 Kiểm định giả thuyết thống kê
2.1 Kiểm định tỷ lệ
Giả sử trên một đám đông có tỷ lệ phần tử mang dấu hiệu A là p (p chính là xác suất
để rút ngẫu nhiên được một phần tử mang dấu hiệu A từ đám đông) Từ một cơ sở nào
đó người ta tìm được p = p nhưng nghi ngờ về điều này Với mức ý nghĩa α cần kiểm0
định giả thuyết H : p = p Chọn từ đám đông một mẫu kích thước n Gọi f là tỷ lệ0 0
phần tử mang dấu hiệu A trên mẫu Như đã biết, khi kích thước mẫu n lớn thì f ≈ N(p, pq
n¿
Xây dựng tiêu chuẩn kiểm định
U =
f −p 0
n , trong đó q = 1 – p 0 0
Nếu H đúng thì U 0 ≈ N(0,1)
Bài toán 1: {H 0 : p=p 0
H 1 : p≠ p0 Với mức ý nghĩa α cho trước ta tìm được phân vị chuẩn uα/2
sao cho P(|U| > u ) = α Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏα/2
Wα = {u : |u | > u }, trong đó u = tn tn α/2 tn
f −p 0
√p 0 q 0 n
Bài toán 2: {H 0 : p=p 0
H 1: p> p 0 Với mức ý nghĩa α cho trước ta tìm được phân vị chuẩn uα
sao cho P(U > u ) = α Lập luận tương tự như trong bài toán 1 ta có miền bác bỏ W =α α
{utn : u > utn α}
Bài toán 3: {H 0 : p=p 0
H 1: p< p 0 Với mức ý nghĩa α cho trước ta tìm được phân vị chuẩn uα
sao cho P(U < -u ) = α Từ đó ta có miền bác bỏ W = {u : u < -u}
Trang 112.2 So sánh hai kỳ vọng toán của 2 ĐLNN X và Y chưa biết quy luật phân phối xác suất nhưng n >30, n > 30 x y
Vì n > 30, n > 30 nên x y X~−¿¿ N(µx, σ /n2 ) và
x X~−¿¿ N(µy, σ /n ).2
y
Ta chọn tiêu chuẩn kiểm định:
U =( X−Y )−(μX−μY)
√σx
nx+
y
ny Các miền bác bỏ Wa có dạng:
Cặp giả thuyết: {H0: μx=μy
H1: μx>μy
+Miền bác bỏ bên phải:
Wa= {U = X−Y
√σX
2
nx+
Y 2
ny
;U>ua } Cặp giả thuyết: {H0: μx=μy
H1: μx<μy
+Miền bác bỏ bên trái:
Wa= {U = X−Y
√σX
2
nx+
Y 2
ny
;U←ua } Cặp giả thuyết: {H0: μx=μy
H1: μx≠μy +Miền bác bỏ hai phía:
Wa= {U = x− y
√σx
nx+
y
ny
;|U|< ua /2 }
Phần II:THẢO LUẬN ĐỀ TÀI
Trang 12Đề tài: Trong môi trường đại học, việc học tập luôn là vấn đề được đề cao lên hàng đầu
đối với sinh viên các trường Đại học Vì thế, nhóm chúng em đã tiến hàng khảo sát điểm GPA của các bạn sinh viên nam và nữ trường Đại học Thương mại để đưa ra và giải các bài toán ước lượng và kiểm định ý nghĩa đối với thực tiễn đề tài
Nhóm chúng em đã lựa chọn mẫu ngẫu nhiên có kích thước là n = 100 và xây dựng một bảng câu hỏi với các câu hỏi như sau:
1 Họ và tên
2 Bạn đang học khoa nào
3 Giới tính
4 Điểm GPA học kì I của bạn thuộc khoảng nào
5 Bạn có hài long với kết quả học tập học kì I của bạn
Với mẫu này, chúng em phân công nhiệm vụ trong nhóm: mỗi thành viên trong nhóm chúng em có nhiệm vụ gửi liên kết mẫu khảo sát đến cho 5-10 sinh viên đang học tại trường Đại học Thương Mại và yêu cầu họ điền khảo sát Trong vòng 24h, nhóm chúng
em đã thu thập được đủ 100 câu trả lời tương ứng với kích thước mẫu đã đề ra với kết quả được thu thập như sau:
Số sinh viên đã khảo sát: 100 sinh viên, trong đó:
- 46 sinh viên là nam, chiếm 46%
- 54 sinh viên là nữ, chiếm 54%
Và đây đều là sinh viên trường Đại học Thương mại thuộc:
- Khoa IS: 61 sinh viên, chiếm 61%
- Khoa U: 20 sinh viên, chiếm 20%
- Khoa E:14 sinh viên, chiếm 14%
- Khoa H: 5 sinh viên, chiếm 5%
Trang 13Sau khảo sát, từ số liệu kết quả thống kê được cho thấy, điểm GPA của sinh viên trường Đại học Thương mại có khoảng từ:
- 3.5-4.0: 5 sinh viên, chiếm 5%
- 3.0-3.5: 20 sinh viên, chiếm 20%
- 2.5-3.0: 50 sinh viên, chiếm 50%
- 2.0-2.5: 20 sinh viên, chiếm 20%
- 0-2.0: 5 sinh viên, chiếm 5%
Với kết quả khảo sát thu được và α = 0,05; γ = 0,95, chúng em đặt ra 1 bài toán ước lượng và 2 bài toán kiểm định như sau:
Bài toán 1: Ước lượng điểm kết quả học tập kì 1 của các bạn sinh viên nam và sinh viên
nữ
Bài toán 2: Liệu tỉ lệ các sinh viên có GPA từ 2.5 trở lên có là 60% hay không
Trang 14Bài toán 3: So sánh điểm trung bình của nhóm sinh viên nam và sinh viên nữ
Từ đây, chúng em xây dựng bảng phân phối xác suất như sau:
GPA 0-2.0 2.0-2.5 2.5-3.0 3.0-3.5 3.5-4.0
Số sinh
Số sinh
viên nữ
Phần III: GIẢI QUYẾT BÀI TOÁN
4 Vấn đề 1
5 Vấn đề 2
6 Vấn đề 3
Phần IV Kết luận