Thống kê toán nói chung hay bài toán ước lượng và kiểm định nói riêng có ứng dụng rất rộng rãi trong thực tế và đời sống. Hiện nay, mạng xã hội Facebook và vấn đề bị cận thị ở sinh viên có xu hướng tăng nhanh. Với mục tiêu để mọi người có cái nhìn chính xác hơn về hai sự việc trên, sau khi thực hiện một cuộc điều tra nhỏ trong phạm vi trường Đại học Thương Mại, bài thảo luận môn lí thuyết xác suất và thống kê sau đây sẽ đưa ra những con số ước lượng cụ thể thời gian sử dụng Facebook và kiểm định giả thiết số lượng sinh viên bị cận thị ở Đại học Thương Mại.
Trang 1MỤC LỤC
Lời mở đầu 2
Phần I: Cơ sở lí thuyết
Chương 5: Ước lượng tham số của các đại lượng ngẫu nhiên
1 Khái niệm ước lượng 3
2 Ước lượng điểm 3
3 Ước lượng bằng khoảng tin cậy 3 Chương 6 : Kiểm định giả thuyết thống kê
1 Khái niệm về kiểm định giả thuyết thống kê 6
2 Kiểm định giả thuyết về các tham số của một ĐLNN 6
Phần II: Giải bài tập
I Chọn và xử lí mẫu: 9
II Giải bài tập
1 Bài tập: Ước lượng thời gian sử dụng facebook trung bình mỗi ngày của sinh viên Đại học Thương Mại với độ tin cậy là 95% 10
2 Bài tập 2: Theo kết quả thu thập được có 70% sinh viên Đại học Thương Mại
bị cận thị Nghi ngờ tỉ lệ trên cao hơn so với thực tế Điều tra ngẫu nhiên 200 người thì có 128 người bị cận.Với mức ý nghĩa 5%, có kết luận gì về nghi ngờ trên ?……… 12
Phần III: Mở rộng đề tài
1 Vấn đề sử dụng facebook hiện nay 13
2 Vấn đề cận thị 14
Kết luận 16
Trang 2Lời mở đầu
Thống kê học có thể được định nghĩa một cách khái quát như là khoa học, kỹ thuật hay nghệ thuật của việc rút ra thông tin từ dữ liệu quan sát, nhằm giải quyết các bài toán từ thực tế cuộc sống Việc rút ra thông tin đó có thể là kiểm định một giả thiết khoa học, ước lượng một đại lượng chưa biết hay dự đoán một sự kiện trong tương lai
Phương pháp ước lượng bằng khoảng tin cậy sẽ giúp chúng ta ước lượng một tham
số θ của một đại lượng ngẫu nhiên gốc X trên một đám đông nào đó, với sai số ε và chỉ ra khả năng mắc sai lầm khi ước lượng là bao nhiêu Kể cả khi nghiên cứu trên mẫu có kích thước nhỏ thì ước lượng khoảng tin cậy cũng sẽ cho kết quả với sai số khá nhỏ
Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thiết thống kê là một bộ phận quan trọng của thống kê toán Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể Ta
có thể đưa ra các giả thuyết thống kê, đó là giả thuyết ta đang nghi ngờ và một giả thuyết trái với giả thuyết gốc Tiến hành công việc theo quy tắc hay thủ tục để từ một mẫu cụ thể cho phép ta đi đến quyết định: chấp nhận hay bác bỏ một giả
thuyết thống kê
Thống kê toán nói chung hay bài toán ước lượng và kiểm định nói riêng có ứng dụng rất rộng rãi trong thực tế và đời sống Hiện nay, mạng xã hội Facebook và vấn đề bị cận thị ở sinh viên có xu hướng tăng nhanh Với mục tiêu để mọi người
có cái nhìn chính xác hơn về hai sự việc trên, sau khi thực hiện một cuộc điều tra nhỏ trong phạm vi trường Đại học Thương Mại, bài thảo luận môn lí thuyết xác suất và thống kê sau đây sẽ đưa ra những con số ước lượng cụ thể thời gian sử
Trang 3dụng Facebook và kiểm định giả thiết số lượng sinh viên bị cận thị ở Đại học Thương Mại
Trang 4Phần I: Cơ sở lí thuyết
Chương 5:Ước lượng tham số của các đại lượng ngẫu nhiên
1 Khái niệm ước lượng:
Xét 1 ĐLNN X thể hiện trên 1 đám đông nào đó Các tham số đặc trưng của X được kí hiệu là θ (µ,σ2,p ) được gọi là tham số lý thuyết hay tham số đám đông
Vì θthương chưa biết nên ta tiến hành ước lượng cho θ
Có 2 phương pháp ước lượng cho θ:
+ Phương pháp ước lượng điểm
+ Phương pháp ước lượng khoảng tin cậy
2 Ước lượng điểm
2.1.Ước lượng điểm
Bước 1: Chọn mẫu ngẫu nhiên W= (X1,X2,…,Xn)
Bước 2: Xây dựng thống kê θ¿= f(X1,X2,…,Xn) phù hợp với θ cần ước lượng
Bước 3: Với n khá lớn với mẫu cụ thể: w = (x1,x2,…,xn) tính được
θ¿
tn = (x1,x2,…,xn) lấy θ ≃θ tn¿
θ¿ được gọi là ước lượng điểm của θ
2.2.Các tiêu chuẩn đánh giá bản chất tốt của ước lượng
Ước lượng không chệch (ƯLKC)
Ước lượng vững
Ước lượng hiệu quả
Ước lượng đủ
3 Ước lượng bằng khoảng tin cậy
3.1.Ước lượng kì vọng toán của ĐLNN
Giả sử ĐLNN X trên đám đông có E(X) = µ và Var(X) = σ2 Xét các trường hợp sau:
Trường hợp 1 : ĐLNN X có phân phối chuẩn, phương sai đã biết
Trang 5Vì X N (μ , σ2
)⇒ ´X N (μ , σ2
n ) Ta xây dựng được thống kê XDTK U = ´X−μ
σ /√n N (0,1)
Với độ tin cậy γ=1−α ta có:
Đối xứng: α1=α2=α
2 P( |U| <u α2 ) = γ (X – ε ;X + ε )
Phải: α1=0 ;α2=α P( U < u ) = γ ( ´X − σ
√n u α ;+∞)
Trái: α1=α ; α2= 0 P( U > -u) = γ (−∞; ´X + σ
√n u α)
Trong đó :ε= σ
√n u α2là sai số của ước lượng
Trường hợp 2 : ĐLNN X có phân phối chuẩn σ2 chưa biết, n<30
Vì X N (μ , σ2)⇒ ´X N (μ , σ2
) Ta xây dựng thống kê : XDTK T =
´
X−μ
S '
√n
T(n−1)
Với độ tin cậy γ=1−α ta có:
Đối xứng: α1=α2=α
2 P( |T| < t α2
n−1
) = γ (X – ε ;X + ε )
Phải: α1=0 ;α2=α P( T<tα n−1
) = γ ( ´X − s '
√n t α
(n−1)
;+∞)
Trái: α1=α ; α2= 0 P( T> -tα n−1
) = γ (−∞; ´X + s '
√n t α
(n−1)
)
Trong đó: ε= s '
√n t α2
n−1
là sai số của ước lượng
Trường hợp 3 : Chưa biết quy luật phân phối xác suất của X, n>30
Bước 1 : Vì n>30thì X´ ≃ N (μ , σ2
n) Do đó ta sử dụng thống kê:
Trang 6XDTK U = ´X−μ
σ /√n N (0,1)
Bước 2, bước 3: Bài toán làm tương tự trường hợp 1, nếu σ chưa biết và n>30 thì thay σ ≈ s '
3.2.Ước lượng tỷ lệ
P = M/N là tỷ lệ các phần tử mang dấu hiệu trên đám đông Từ đám đông lấy mẫu kích thước n và f =n a/n là tần suất mẫu
Khi n khá lớn ta có: (với q = 1 – p)
f≃ N ( p ; pq
n )⟶ U = f – p/√pq /n ≃ N(0;1) Với độ tin cậy γ=1−α ta có:
Đối xứng: α1=α2=α
2 P( |U| < u α /2) = γ ( f – ε ; f + ε ) Phải: α1=0 ;α2=α P( U < u α ) ≈ γ (f −√pq n u α ;1)
Trái: α1=α ; α2= 0 P( U > -u α) ≈ γ (0 ; f +√f (1−f ) n u α)
Trong đó:ε=√pq n u α
2
là sai số của ước lượng
3.3.Ước lượng phương sai của ĐLNN phân phối chuẩn
Vì X N(μ ;σ2), XDTK χ2
= (n−1) S '2
2 (n−1 )
Với độ tin cậy γ=1−α ta có:
Trang 7KTC P Khoảng tin cậy của σ2
Đối xứng: α1=α2=α
2 P(χ 1−α /2 2 (n−1)< χ2< χ α /2 2 (n−1)
) = γ ( (n−1) S ' 2
χ α /2 2 (n−1) ;
(n−1) S ' 2
χ 1−α/ 2 2 (n−1) )
Phải: α1=0 ;α2=α P( χ2
< χ α 2 (n−1) ) ¿ γ ( (n−1 ) S ' 2
χ α2 (n−1) ;+∞)
Trái: α1=α ; α2=0 P( χ2 > χ 1−α 2 (n−1)) ¿ γ (0 ;(n−1) S
' 2
χ 1−α 2 (n−1) )
Chương 6: Kiểm định giả thuyết thống kê
1 Khái niệm về kiểm định giả thuyết thống kê
1.1.Phương pháp kiểm định một giả thuyết thống kê
1.1.1 Xây dựng tiêu chuẩn kiểm định
1.1.2 Tìm miền bác bỏ, quy tắc kiểm định
Quy tắc kiểm định
Nếu g tn ϵ W α thì bác bỏ H0 và chấp nhận H1
Nếu g tn ∉ W αthì chưa có cơ sở bác bỏ H0
1.2.3 Các loại sai lầm:
Sai lầm loại một: sai lầm bác bỏ giả thiết H0 khi H0 đúng
P(G ∈ W α
H0)=α
Sai lầm loại hai: chấp nhận H0 khi chính nó sai
P(G h ∉W α/H0)=β
1.2.4 Thủ tục kiểm định
2 Kiểm định giả thuyết về các tham số của một ĐLNN
2.1.Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN
Giả sử ĐLNN X trên đám đông có E(X) = µ và Var(X) = σ2. Với mức ý nghĩa α ta kiểm định giả thuyết H0: μ=μ0
Trang 8 Trường hợp 1 : ĐLNN X trên đám đông có phân phối chuẩn với σ2 đã biết:
X có phân phối chuẩn nên :X´ ≃ N(μ , σ
2
n )
XDTCKĐ: U = X−μ´ 0
σ /√n Nếu H0 đúng U N(0;1)≃ N(0;1)
(|U|>u α
μ=μ0 μ>μ0 P(U >u α)=α W α={u tn :u tn>u α}
μ<μ0 P(U <−u α)=α W α={u tn :u tn<−u α}
Trong đó u tn=
´
X −μ0
σ /√n
Trường hợp 2 : chưa biết quy luậ phân phối của X và n >30 (n khá lớn)
Vì n>30,X´ ⋍ N(μ; σ2
n) XDTCKĐ: U = X−μ´ 0
σ /√n Nếu H0 đúng U ⋍ N(0;1)
μ ≠ μ0 P(|U|>u α
α={u tn:|u tn|>u α/ 2}
μ=μ0 μ>μ0 P(U >u α)=α W α={u tn :u tn>u α}
μ<μ0 P(U <−u α)=α W α={u tn :u tn←u α}
Trong đó u tn=
´
X −μ0
σ /√n
Trường hợp 3 : X tuân theo quy luật phân phối chuẩn, σ chưa biết và n < 30
X có phân phối chuẩn nên :X´ ≃ N(μ , σ
2
n )
XDTCKĐ: T = X−μ´ 0
S ' /√n Nếu H0 đúng T T n−1
Trang 9μ ≠ μ0 P(|T|>t α/ 2 n−1
)=α W α={t tn:|t tn|>t α /2 n−1}
μ=μ0 μ> μ0 P(T > t α)=α W α={t tn :t tn>t α}
μ<μ0 P(T <−t α)=α W α={t tn :t tn←t α}
Trong đó t tn=´X−μ0
s ' /√n
2.2.Kiểm định giả thuyết về tỷ lệ đám đông
p=M/N là tỷ lệ các phần tử mang dấu hiệu trên đám đông Từ đám đông lấy mẫu kích thước n và f =n a/n là tần suất mẫu
kích thước mẫu lớn thì f ≈ N(p , pq
n )
XDTCKĐ: U =
f − p0
√p0q0 n
Nếu H0 đúng thì U≈ N (0,1)
p ≠ p0 P(|U|>u α/ 2)=α W α={u tn:|u tn|>u α/ 2}
p= p0 p> p0 P(U >u α)=α W α={u tn :u tn>u α}
p< p0 P(U <−u α)=α W α={u tn :u tn←u α}
2.3.Kiểm định giả thuyết về phương sai của ĐLNN tuân theo quy luật phân phối
chuẩn
XĐTCKĐ: χ2= (n−1) S '2
σ n2 Nếu H0 đúng thì χ2 χ 2(n−1)
Trang 10H0 H1 ¿ W α
σ2≠ σ02 P[ (χ2
<χ 1−α/ 22(n−1)
)+(χ2
>χ α /22 (n −1)
)]¿α W α={χ tn2: χ tn2<χ 1−α /22(n−1)
hoặc χ tn2>χ α / 22(n−1)
}
σ2=σ02 σ2>σ02 P( χ2>χ α2(n−1))=α W α={χ tn2: χ tn2>χ 2 (n−1 ) α }
σ2
<σ02
P(χ2
<χ 1−α2 (n−1)
)=α W α={χ tn2: χ tn2
<χ 1−α2(n−1)
}
Phần II: giải bài tập
I Chọn và xử lí mẫu:
Cần nghiên cứu thời gian sử dụng facebook trong ngày và số lượng sinh viên bị cận thị của trường Đại học Thương Mại
Đám đông mà chúng ta cần nghiên cứu là tất cả sinh viên trường Đại học
Thương Mại
Do số sinh viên của trường rất đông nên việc điều tra hết mọi sinh viên trở nên rất khó khăn Vì vậy từ đám đông chúng tôi chọn ra 1 mẫu có kích thước là 200 (bài toán 1 và bài toán 2) sinh viên để nghiên cứu và dựa vào đó mà đưa ra
những kết luận
Cách chọn mẫu: Chọn ngẫu nhiên một vài sinh viên khoá khác nhau, các sinh viên là khác nhau và không trùng lặp
Phương pháp chọn mẫu: Thiết kế một bảng câu hỏi gồm: họ tên, mã sinh viên, các phương án chọn trắc nghiệm
Ưu điểm: + Về chi phí: Do khảo sát ít đơn vị nên chi phí thực hiện cho việc khảo sát thấp Thực hiện khảo sát bằng cách dùng bảng mẫu (thông qua gmail) nên không phát sinh chi phí về giấy in câu hỏi
+ Tiết kiệm thời gian: Việc thu thập số liệu được tiến hành khá nhanh chóng, nhận được ngay kết quả
Trang 11+ Thuận tiện: Người trả lời chỉ cần kích chuột và chọn các phương án trắc nghiệm, có thể trả lời câu hỏi vào thời gian thuận tiện, không mang tính ép buộc và có nhiều thời gian suy nghĩ; người thực hiện thuận tiện không cần trực tiếp đến từng lớp học thu thập số liệu
Nhược điểm: + Mặc dù thực hiện khảo sát bằng phương pháp trực tuyến có thể đạt được kết quả cao hơn so với phương pháp truyền thống, tuy nhiên khi thực hiện có thể gặp phải vấn đề như nhiều sinh viên lầm tưởng đó là tin rác nên thờ
ơ và không hợp tác với nhóm
+ Thành viên trong nhóm ngại việc chia sẻ bài khảo sát chỉ phụ thuộc vào một vài thành viên khác
+ Một vài sinh viên ít có khả năng truy cập internet do vậy không
thể trả lời được bảng câu hỏi trực tuyến
II Giải bài tập
1 Bài tập 1:
Ước lượng thời gian sử dụng facebook trung bình mỗi ngày của sinh viên Đại học Thương Mại với độ tin cậy là 95%
Ta có bảng phân phối thực nghiệm về thời gian sử dụng facebook của sinh viên ĐHTM:
Trung bình
n = 200 ; ´x= 1
n∑
i=1
n
n i x i=3.255 ; s '=√ 1
n−1∑
i=1
n
n i(x i−´x)2 = 1.899; γ=0.95
Giải:
Trang 12Gọi: X là thời gian sử dụng Facebook của sinh viên đại học Thương mại trong 1 ngày
μ là thời gian trung bình sử dụng Facebook của sinh viên đại học Thương mại trong 1 ngày trên đám đông
X´ là thời gian trung bình sử dụng Facebook của sinh viên đại học Thương mại trong 1 ngày trên mẫu
Vì n = 200 > 30, X chưa biết QLPP nên ta có: X´ ≃ N¿; σ2
n)
Đặt U =
´
X−μ
σ
√n
N (0 ;1)
Do σ ch ư a bi ´ê t n ê n tal ´â y σ ≈ s '
Với α=1−γ=0.05 xác định U α
2
=U0.025=1.96
sao cho: P( |U| < U α
2) = 1- α ⟺ P¿ ) = 1 – α
⇔ P( ´X− σ
√n u α2
<μ< ´X + σ
√n u α2 ) = 1 – α
⇔ P¿3.255 – 1.899
√200×1.96<μ<3.255+
1.899
√200×1.96¿=1−α
⇔ P (2.992<U <3.518 )=1−α
Kết luận: Với độ tin cậy 95%, ta có thể nói thời gian trung bình sử dụng Facebook của sinh viên đại học Thương mại trong 1 ngày nằm trong khoảng (2.992 ; 3.518) giờ
Trang 132 Bài tập 2:
Theo kết quả thu thập được có 70% sinh viên thương mại bị cận thị Nghi ngờ tỉ lệ trên caohơn so với thực tế Điều tra ngẫu nhiên 200 người thì có 128 người bị cận.Vớimức ý nghĩa5% ,có kết luận gì về nghi ngờ trên ?
Giải:
Gọi: p là tỉ lệ sinh viên bị cận thị trên đám đông
f là tỉ lệ sinh viên bị cận trên mẫu
Vì n khá lớn nên f có phân phối xấp xỉ chuẩn: f ⋍N(p;pq n )
với mức ý nghĩa = 5% ta cần kiểm định: {H0: p= p0
H1 :p< p0 }
XDTCKĐ :U=
f − p0
√p0q0 n
Trong đóq o=1−po
Nếu Ho đúng thì U⋍N(0;1) Tìm được phân vịu αsao cho:
P(U < -U α) =α
Do khá bé nên theo nguyên lí xác suất nhỏ có miền bác bỏ :
W α={U tn :U tn<−U α}; Trong đóU tn=
f − p0
√p0q0 n
Ta có: = 5% =>U0,05= 1,65; f =128200= 0,64
U tn=
0,64−0,7
√0,7.0,3
200
≈ -1,85
U tn ϵ W α
C ó c ơ sở đ ể b á c bỏ H O, chấp nhậnH1
Kết luận: Vậy với mức ý nghĩa5% ta có thể nói rằng tỉ lệ sinh viên Thương Mại bị cận thị thấp hơn 70%
Trang 15Phần III: Mở rộng đề tài
1 Vấn đề sử dụng facebook hiện nay
a Thực trạng:
Thực trạng chung: Với sự bùng nổ của công nghệ thông tin thì việc kết nối Facebook không còn xa lạ với nhiều người tại Việt Nam Facebook ước tính 36% trên tổng dân số Việt Nam đang lướt Facebook trên điện thoại, và bỏ ra trung bình 2,5 tiếng mỗi ngày để truy cập mạng xã hội
Thực trạng của sinh viên ĐHTM : Qua khảo sát ta thấy rằng tất cả các bạn sinh viên có biết và sử dụng facebook Vì vậy có thể thấy rằng Facebook đang tác động mạnh mẽ đến các bạn sinh viên trường Đại học Thương Mại nói riêng và sinh viên nói chung Nghiên cứu khảo sát ngẫu nhiên 200 sinh viên thuộc các khoa khác nhau, qua đó ta thấy được kết quả trung bình mỗi sinh viên cần hơn 3 giờ để sử dụng mạng xã hội Với khoảng thời gian như vậy cho thấy các bạn sinh viên ngày nay ngày càng lạm dụng và tốn quá nhiều thời gian trong việc sử dụng facebook
b Lợi ích và tác hại của việc sử dụng facebook
Lợi ích: - Facebook là nơi bạn có thể giới thiệu bản than
-Bạn có thể học hỏi được nhiều kiến thức từ Facebook
- Facebook giúp cập nhật thông tin nhanh chóng
- Facebook giúp bạn kết nối bạn bè…
Tác hại: - Giảm tương tác giữa người với người
- Tăng mong muốn gây chú ý
- Xao lãng mục tiêu cá nhân
- Nguy cơ trầm cảm
- Hạn chê sự sáng tạo…
c Phương Pháp giải quyêt để sử dụng facebook có hiệu quả
Trang 16 Cần giáo dục cho sinh viên tính hai mặt của việc sử dụng facebook, đồng thời tuyên truyền nâng cao hiểu biết và cách tránh các tệ nạn trên facebook
Cần phải có định lượng về thời gian sử dụng facebook, đừng để facebook chi phối thời gian của bản than dẫn đến sa sút, bỏ quên bạn bè thực
Khi đăng một vấn đề hoặc bình luận thì cần chú ý đến ngôn từ sử dụng, bởi chỉ cần một sơ suất nhỏ sẽ lan truyền rất nhanh và trở thành chủ đề bàn tán của mọi người, gây ảnh hưởng đến cuộc sống của bản than và học tập
Cần tận dụng những mặt tích cực của facebook, sử dụng đúng mục đích, có hiệu quả
Việckhông sử dụng Facebook hay giảm thiểu thời gian sử dụng là không cần thiết Nhưng thay vào đó chúng ta có thể phân bố thời gian hợp lí cho mỗi mục đích sử dụng: Lập nhóm trao đổi bài vở,theo dõi các trang fanpage các diễn đàn học tập chia sẻ kinh nghiệm, phương pháp học tập, tìm hiểu các thông tin giúp giải quyết các thắc mắc trong học tập
Như vậy Facebook tốt hay xấu nó phụ thuộc rất nhiều vào người dùng, nếu người dùng hướng đến mục đích tốt thì sẽ tốt còn không là ngược lại
2 Vấn đề cận thị :
a Thực trạng: Cận thị học đường ở các cấp học là đề tài đã được đề cập trong nhiều nghiên cứu, đặc biệt ở các nước đang phát triển Tại Việt Nam, theo số liệu điều tra của trong những năm gần đây, tỷ lệ cận thị gia tăng rất nhanh và là nguyên nhân chính gây giảm thị lực ở học sinh – sinh viên Việt Nam Theo nghiên cứu của Viện khoa học Giáo dục Việt Nam (2008), tỷ lệ mắc cận thị học đường trong các trường học rất cao chiếm 26,14% trên tổng số học sinh Con số này ngày càng tăng cao bởi vậy, cận thị được xếp là một trong năm nguyên nhân hàng đầu được ưu tiên trong chương trình phòng chống mù lòa toàn cầu
b Nguyên nhân
Chế độ học tập căng thẳng, học tập và làm việc nơi thiếu sáng