BÀI THẢO LUẬN MÔN: LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN ĐỀ TÀI : “VỚI ĐỘ TIN CẬY 95% , HÃY ƯỚC LƯỢNG SỐ GIỜ TỰ HỌC TRUNG BÌNH CỦA SINH TRƯỜNG VIÊN ĐẠI HỌC THƯƠNG MẠI “ Hà Nội,2020 MỤC LỤC PH
Trang 1
BÀI THẢO LUẬN MÔN: LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN
ĐỀ TÀI :
“VỚI ĐỘ TIN CẬY 95% , HÃY ƯỚC LƯỢNG SỐ GIỜ TỰ HỌC TRUNG BÌNH CỦA SINH TRƯỜNG VIÊN ĐẠI HỌC THƯƠNG MẠI “
Hà Nội,2020
MỤC LỤC
PHẦN 1 : MỞ ĐẦU
Lời mở đầu
1.Tính cấp thiết của đề tài ( tại sao đi nghiên cứu đề tài )
2.Mục tiêu , mục đích nghiên cứu
3.Đối tượng phạm vi nghiên cứu
PHẦN 2 : CƠ SỞ LÍ THUYẾT
I.Ước lượng các tham số của ĐLNN
II.Kiểm định giả thuyết thống kê
III.Khảo sát phân bố thời gian học tập của sinh viên Đại học
Thương mại
PHẦN 3 : GIẢI BÀI TẬP VÀ XỬ LÍ SỐ LIỆU BẰNG EXEL
Trang 21.Đo lường số giờ tự học trung bình một ngày của sinh viên Đại Học
Thương Mại thông qua khảo sát
1.1.Xử lí số liệu bằng exel
1.2.Giải bài toán ước lượng cho mẫu cụ thể của bảng khảo sát (n=100)
2.Kiểm định kết quả số giờ tự học trung bình mỗi ngày của sinh viên Đại Học Thương Mại là 2 giờ/ngày
PHẦN 4 : KẾT LUẬN VÀ GIẢI PHÁP
1.Ý nghĩa nghiên cứu đề tài
2.Kết luận
3.Giải pháp
Trang 3PHẦN 1 : MỞ ĐẦU
Lời Mở Đầu
Trong cuộc sống, việc phân tích thống kê gần như không còn quá xa lạ, ta có thể bắt gặp thống kê ở mọi lúc mọi nơi như: thống kê lượng nước tiêu thụ của thành phố, thống kê tình hình biến động của giá vàng, thống kê số lượng trẻ vị thành niên ở các nước phát triển, Thế nhưng, ít ai thực sự hiểu và nắm bắt rõ: vậy “thống kê” là gì? Nói một cách tổng quan, nó có thể được định nghĩa như là khoa học, kỹ thuật hay nghệ thuật của việc rút ra thông tin từ dữ liệu quan sát nhằm giải quyết các bài toán từ thực tế cuộc sống Việc rút ra thông tin đó có thể là kiểm định một giải thích khoa học, ước lượng một đại lượng chưa biết hai dự đoán một sự kiện trong tương lai
Phương pháp ước lượng bằng khoảng tin cậy sẽ giúp chúng ta ước được một tham số ᶿ số của một đại lượng ngẫu nhiên gốc X trên một đám đông nào đó, với sai số
ɛ và chỉ ra khả năng mắc sai lầm khi ước lượng là bao nhiêu Kể cả khi nghiên cứu trên mẫu có kích thước nhỏ thì ước lượng khoảng tin cậy cũng sẽ cho kết quả với sai
số khá nhỏ Bằng phương pháp ước lượng khoảng tin cậy, ta có thể giải quyết các bài toán thống kê thường gặp trong cuộc sống như: ước lượng độ cận thị của sinh viên, ước lượng mức tăng giá cả của một mặt hàng nào đó, ước lượng độ tuổi lập gia đình của một bộ phận người trẻ hay ước lượng sai số của chi tiết máy,
Cùng với lý thuyết lực lượng, lý thuyết kiểm định các giả thuyết thống kê là một bộ phận quan trọng của thống kế toán Đó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể Bởi
lẽ, không nghiên cứu trên đám đông nên ta không biết rằng phân phối xác suất của dấu hiệu của nguyên tố x trên đám đông, hoặc có thể biết rằng phân phối xác suất của X nhưng chưa biết đặc trưng nào đó của nó Ta có thể đưa ra các giả thuyết thống kê, đó
là giải quyết ta nghi ngờ và là một giả thuyết trái và giải quyết gốc, tiến hành công việc theo quy tắc hay thủ tục để từ một mẫu cụ thể để cho phép ta đi đến quyết định chấp nhận hay bác bỏ giả thuyết thống kê thống kế toán Nói chung, bài toán ước lượng và kiểm định có ứng dụng rất rộng rãi trong thực tế và đời sống, nó không chỉ giúp giải quyết các bài toán thực tế mà còn có thể giải quyết các bài toán trong nghiên cứu khoa học Các phương pháp ước lượng kiểm định có ứng dụng rất lớn trong thực
tế, bởi vì nhiều lĩnh vực nghiên cứu chúng ta không thể có được những con số chính xác, cụ thể do việc nghiên cứu trên đám đông quá lớn và tốn nhiều chi phí Vì vậy, việc ước lượng và kiểm định các phương pháp này cho phép chúng ta đánh giá được
Trang 4các tham số trong trường hợp có nhiều vấn đề về xã hội và kinh tế, như ước lượng chiều cao trung bình của người Việt Nam, ước lượng tỷ lệ đói nghèo ở đồng bào dân tộc thiểu số hay ước lượng mức độ thiệt hại trong đợt lũ lịch sử vừa rồi, Từ đó, đánh giá về chất lượng đời sống của người dân và các vấn đề kinh tế, bao gồm cả kinh tế vi
mô và kinh tế vĩ mô như tỷ lệ thất nghiệp của người lao động, tỉ lệ xuất nhập khẩu hàng hóa qua từng năm, GDP bình quân của một quốc gia,
Tính cấp thiết của đề tài
Bộ môn Lý thuyết xác suất thống kê từ lâu đã được đưa vào giảng dạy rộng rãi
ở hầu hết các trường Đại học Bộ môn chuyên nghiên cứu về quy luật phân phối của xác suất và thống kê toán Trong quá trình học, sau khi được giảng về lý thuyết của bài toán ước lượng các tham số của đại lượng ngẫu nhiên và kiểm định các giả thuyết thống kê, nhóm nhận định rằng có thể đưa bài học này vào ứng dụng giải quyết các vấn đề trong cuộc sống Sống trong môi trường đại học đã hai năm, bản thân mỗi chúng ta đều phải quen dần với việc tự lập trong hầu hết mọi công việc Ngay cả việc học cũng vậy, chúng ta sẽ không có sự sát sao, quan tâm từ bố mẹ, nên để có kết quả tốt, việc tự học là vô cùng quan trọng Nhận thấy tính cần thiết và sát thực của vấn đề này, nhóm đã quyết định tiến hành đề tài: ”Ước lượng số giờ tự học trung bình một ngày của sinh viên đại học Thương Mại với độ tin cậy 95%”, với mục đích tìm hiểu xem sinh viên thường dành ra bao nhiêu giờ để tự học và tự bổ sung kiến thức, cũng như đánh giá chất lượng trong các giờ tự học đó Mặt khác, đề tài này trước đó đã được một số nhóm nghiên cứu tiến hành, kết quả cho thấy số giờ tự học trung bình của sinh viên đại học Thương Mại là 2h, nghi ngờ kết quả điều tra trên, nhóm cũng sẽ đồng thời tiến hành kiểm định lại với mức ý nghĩa 5%
PHẦN 2 CƠ SỞ LÝ THUYẾT
I ƯỚC LƯỢNG CÁC THAM SỐ CỦA ĐLNN
1.1 Ước lượng điểm
Giả sử ta dần ước lượng tham số của ĐLNN trên một đám đông thì ta tiến hành theo các bước sau:
- Bước 1: Lấy mẫu NN, kích thước N: W = (x1, x2, xn) với n khá lớn
Tùy vào tham số ta xác định hàm thống kê * = f(x1, x2,… xn)
- Bước 2: Khi n đủ lớn với mẫu cụ thể : W = ( x1 ,x2… xn),
- tính toán:
tn = f( x1 ,x2… xn)
- Bước 3: Ta lấy tn làm ước lượng cho tham số
Trang 51.2 Ước lượng bằng khoảng tin cậy
1.2.1 Ước lượng về kì vọng toán của ĐLNN
Ước lượng kỳ vọng toán µ=E(X), Var(X)=
TH1: Trường hợp X ~ N(µ;), với đã biết:
Do X ~ N(µ;) ~ N (µ; ) => U = ~ N(0;1)
a Khoảng tin cậy đối xứng của :
Với , ta tìm được thỏa mãn:
P(= 1 -
Thay U, ta được:
P( – < < ) = 1 -
Như vậy, khoảng tin cậy của là ( - ; + ) Với sai số =
Chú ý 1:
Ta thường gặp các bài toán sau:
Biết n và = 1 - , tìm hoặc sai số =
Biết n và , tìm = 1 - , với Biết và = 1 - , tìm đước
Chú ý 2:
Trong trường hợp đã biết, cần ước lượng , thì ta có:
P Như vậy, khoảng tin cậy của là
b Khoảng tin cậy phải (= 0 ;= ước lượng giá trị tối thiểu
Với , ta tìm được thỏa mãn:
)= 1 -
– = 1 -
Như vậy, khoảng tin cậy phải của - ; +) và giá trị tối thiểu của là -
Chú ý:
Từ trên, ta cũng có P ( < = 1 - Như vậy, nếu đã biết thì ươc lượng giá trị tối đa của là
c Khoảng tin cậy trái (= ;= 0) - ước lượng giá trị tối đa
Trang 6Với , ta tìm được thỏa mãn: )= 1 -
+ = 1 -
Như vậy, khoảng tin cậy trái của là và giá trị tối đa của là
Chú ý :
Từ trên ta cũng có P( > = 1 -
Như vậy, nếu đã biết thì ươc lượng giá trị tối thiểu của là.
TH2: Chưa biết quy luật phân phối xác suất của X , nhưng n>30:
Do n>30, nên N (µ; )
XDTK : U = N(0;1)
Với các bài toán 1, 2, các khoảng tin cậy đối xứng, khoảng tin cậy trái, khoảng tin cậy phải là tương tự như TH1
Chú ý:
NẾu chưa biết, nhưng do n>30 nên ta chọn Riêng với bài toán 3 xác định kích thước mẫu, ta phải giả sử có quy luật phân phối chuẩn, rồi làm tương tự mục TH1a.
TH3: X ~ N(), với chưa biết:
Do X ~ N() => N() => T = ~
a Khoảng tin cậy đối xứng của :
Với tìm được thỏa mãn:
P ( < T < ) = 1-
Thay T, ta được:
P ( < ) = 1-
Khoảng tin cậy của là (), với sai số ε
Chú ý:
Với bài toán 3 (tìm n), chúng ta dùng phương pháp lặp kép như sau:
Bước 1: Điều tra 1 mẫu sơ bộ kích thước k2 là ( , , )
Từ mẫu này ta tìm được và.
Bước 2: Giả sử mẫu cần tìm có kích thước n là = ( ,, )
Ta có:
Trang 7T = ~
Ta tìm được sao cho P (|T| < ) = 1- hay
P = 1-.
Do đó, sai số => n=
b Khoảng tin cậy phải (ước lượng giá trị tối thiểu):
Với , tìm được thỏa mãn:
P ( T< ) = 1-
P = 1-
Như vậy, khoảng tin cậy phải của là
c Khoảng tin cậy trái ( ước lượng giá trị tối đa):
Với , tìm được thỏa mãn:
P ( T> ) = 1-
P = 1-
Như vậy, khoảng tin cậy phải của là
Chú ý:
Nếu X~ N(), với chưa biết và
1.2.2 Ư ớc l ư ợng tỉ lệ đám đông
a Khoảng tin cậy đối xứng (1=2=/2) - Ước lượng p, f, M, n, NA Tìm n, , f
Với độ tin cậy =1- Tìm phân vị sao cho :
P( ) =
Với
KTC đối xứng của p là : (f -)
• Chú ý
Trang 81, Nếu q, p chưa biết ,vì n khá lớn nên ta lấy
pf ; q 1-f
⇒
2, Nếu bài toàn cho p , yêu cầu ước lượng f
* ⇔
p(p-3, Nếu bài toán cho N,f ƯL M
* ⇔ p (
f-* ⇔p [ N
(f-4, Nếu bài toán cho M,f , ƯL N
P(
5, Bài tập cho p,n ƯL nA
⇔ p( p
p [
n(p-6,
Bài Toán 1: Cho n, f Tìm
Bài Toán 2: Cho n,
Bài Toán 3: Cho
TH1: p, q đã biết
→ n=
Th2: q ,p chưa biết
1 = p + q
⇔ p.q
b, Khoảng tin cậy phải (2=
Ước lượng pmin fmax Mmin Nmax nA max
P (U
Trang 9⇔ p(p
→ KTC phải p là : (
f-c, Khoảng tin cậy trái (1=2=0)
Ước lượng pmax, Mmax fmin nA min
P (U
⇔P (p
KTC trái q là (0; f+
1.2.3 Ước lượng phương sai của ĐLNN phân phối chuẩn
Bài toán: X ét ĐLNN X phân phối chuẩn có E(X)=µ, Var(X)= trong đó chưa biết cần ước lượng
Vì X ~ N (µ;)
Nên XDTK: =
a Khoảng tin cậy 2 phía của ( = = )
Vì với độ tin cậy = 1 - , ta tìm được phân vị và sao cho :
P ( ) = 1 –
P ( ) = 1 –
Khoảng tin cậy 2 phía của là: (; )
b Khoảng tin cậy phải của ( lấy = 0 ;= ; dùng để ước lượng giá trị tối thiểu của
Với độ tin cậy = 1 - , ta tìm được phân v ị sao cho
P ( ) = 1 –
P ( ) = 1 –
Vậy khoảng tin cậy phải của là: (; )
c Khoảng tin cậy trái của ( lấy = ;= 0; dùng để ước lượng giá trị tối đa của
Với độ tin cậy = 1 - , ta tìm được phân vị sao cho
P ( ) = 1 –
Trang 10 P( ) = 1 –
Vậy khoảng tin cậy trái của là: (; )
VÍ DỤ :
Thời gian cần thiết để sản xuất ra 1 loại sản phẩm là 1 ĐLNN, phân phối chuẩn với kì vọng toán là 12 phút và hương sai là 4(phút)2 với độ tin cậy là bao nhiêu để có thể nói rằng thời gian trung binh để sản xuất ra 25 sản phẩm nằm trong khoảng từ 11 phút đến 13 phút
Bài làm
Gọi X là thời gian cần thiết để sản xuất ra 1 sản phẩm
Gọi là thời gian trung bình cần thiết để sản xuất ra 1 sản phẩm trên mẫu
Gọi là thời gian trung bình cần thết để sản xuất ra 1 sản phẩm trên đám đông
Vì X ~ N(2 ) nên ~ N( )
Xdtk : U = ~ N(0,1)
Với độ tin cậy = 1- , ta tìm được phân vị :
P( -< U < ) =
P( – < < ) =
Có: =
Vì khoảng tin cậy của là (11, 13), nên ta có
= =1
=> = = 2,5
= 0,0062 => = 0,0124 => = 1-0,0124 = 0,9876
Vậy với độ tin cậy là 98,76%, ta có thể nói rằng thời gian trung bình đế sản xuất ra 25 sản phẩm nằm trong khoảng 11 phút đến 13 phút
II KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
2.1 Các khái niệm cơ bản.
• Giả thuyết về quy luật phân phối xác suất ,về các tham số đặc trưng, về
tính độc lập của ĐLNN được gọi là giả thuyết thống kê, kí hiệu H0
Trang 11• Một giả thuyết trái với H0 được gọi là đối thuyết, kí hiệu H1.
• Các giả thuyết H0,H1 có thể đứng, có thể sai nên ta cần kiểm định tính đúng sai của chúng Việc kiểm định này được gọi là kiểm định giả thuyết thống kê
Nguyên tắc chung của việc kiểm định giả thuyết thống kê làn sử dụng nguyên lý xác suất nhỏ: “Nếu một biến cố có xác suất khá bé thì trong thực hành ta có thể coi nó không xảy ra trong một lần thực hiện phép thử”.
1 Tiêu chuẩn kiểm định.
• Từ mẫu W=(X1,X2,X3, Xn) ta xây dựng thống kê G=f(X1,X2,X3, , Xn, 0)
Thống kê G chứa 0 và khi H0 đúng, thống kê G có quy luật phân phối xác suất hoàn toàn xác định
Khi đó, G được gọi là tiêu chuẩn kiểm định
2 Miền bác bỏ.
Với mức ý nghĩa khá bé, ta tìm được miền W gọi là miền bác bỏ, sao cho:
P=[] =
một cặp giả thuyết thống kê ta tiến hành như sau :
• Xác định bài toán kiểm định H0, H1
• Xây dựng tiêu chuẩn kiểm định G
• Tìm miền bác bỏ Wα
• Tìm giá trị gtn và nêu kết luận
Quy tắc kiểm định : Nếu trong một lần lấy mẫu, G nhận giá trị cụ thể gtn sao cho :
° gtn , bác bỏ H0 và chấp nhận H1
° gtn Wα, chưa đủ cơ sở bác bỏ Ho
3 Các loại sai lầm.
Có 2 loại như sau
• Loại 1, bác bỏ H0 khi H0 đúng, xác suất mắc sai lầm loại 1 bằng α
• Loại 2, chấp nhận H0 khi H0 sai
Với cùng một mẫu kích thước n thì không thể cùng 1 lúc giảm xác suất mắc
2 loại sai lầm
2.2 Kiểm định giả thuyết về kỳ vọng toán của ĐLNN
Bài toán : từ một cơ sở nào đó ,ta thu đc giả thuyết H0; Nghi ngờ tính đúng đắn của H0 ,ta đưa ra đối thuyết H1 và kiểm định chúng
1 Trường hợp X ~ N() với đã biết:
Trang 12Do X ~ N() => N()
B1: Xây dựng tiêu chuẩn kiểm định :
Nếu H0 đúng thì UN(0,1)
B2: Tìm miền bác bỏ
• Bài toán 1:
Với α (0,1) ,tìm được uα/2 sao cho P(|U| >uα/2)=α
Ta có, miền bác bỏ Wα={utn : |utn| > uα/2}
Trong đó utn =
• Bài toán 2:
Với α (0,1) ,tìm được uα sao cho P( U > uα ) = α
Ta có miền bác bỏ Wα ={ utn : utn > uα }
• Bài toán 3:
Với α (0,1) ,tìm được uα sao cho P ( U < - uα )= α
Ta có miền bác bỏ Wα = {utn : utn < -uα}
B3: Với mẫu cụ thể, tính ca kết luận theo QTKĐ
2 Trường hợp chưa biết quy luật phân phối của X nhưng n > 30.
Do n >30, nên N()
B1: Xây dựng tiêu chuẩn kiểm định :
Nếu Ho đúng thì UN (0,1)
B2, B3: tương tự trường hợp 1
Chú ý :
Nếu chưa biết vì n > 30 nên lấy s’.
Trang 133 ĐLNN tuân theo phân phối chuẩn, chưa biết
B1 XDCKĐ
Nếu đúng thì T~
B2 Bảng tóm tắt
)
)
B3 Tính và kết luận
2.3 Kiểm định giả thuyết về tỉ lệ đám đông
B1 Chon mẫu kích thước n khá lớn ta có tần suất mẫu vì n khá lớn nên XDTCKĐ nếu Ho đúng thì UN (0,1)
B2.bảng tóm tắt
B3 Tính và kết luận
2.4 Kiểm định phương sai của ĐLNN phân phối chuẩn
Bài toán: Xét ĐLNN phân phối chuẩn với
Từ cơ sở nào đó ta đặt ra giả thuyết
BT1 BT2 BT3
B1 Vì X )
Trang 14XDCTKĐ
B2 Bảng tóm tắt
Hoặc
B3 Tính và kết luận
1 Số liệu
a Phương pháp thu thập số liệu: Phương pháp thu thập sô liệ phi thực
nghiệm (lập bảng khảo sát).
- Mục tiêu nghiên cứu: ước lượng số giờ tự học trung bình một ngày của sinh viên Đại học Thương Mại.
- Đối tượng nghiên cứu: sinh viên của trường Đại học Thương Mại
- Loại hình nghiên cứu: ước lượng
- Nguồn thông tin thu thập: điều tra sinh viên qua bảng khảo sát
b Bảng hỏi
Phiếu câu hỏi khảo sát số giờ tự học trung bình một ngày của sinh viên Đại học Thương Mại.
III.Khảo sát phân bố thời gian học tập của sinh viên Đại
học Thương mại.
*Bắt buộc
Tên của bạn *
Trang 15Câu trả lời của bạn
Theo bạn tự học có quan trọng không? *
o Không quan trọng
o Quan trọng
o Cực kì quan trọng
Bạn có thường tự tìm kiếm tài liệu để tham khảo và tự học không? *
o Thỉnh thoảng
o Thường xuyên
o Luôn luôn
Bạn đang là sinh viên năm thứ mấy? *
o Mục khác:
Bạn là sinh viên khoa nào? (Kí tự viết tắt của khoa, vd: khoa B) *
Bạn tự học bao nhiêu ngày trong một tuần? *
Trung bình bạn dành bao nhiêu thời gian tự học một ngày? *
o <1h/ngày
o 1h-2h/ngày
o 2h-3h/ngày
o Không dành thời gian tự học.
Cụ thể bạn thường tự học như thế nào trong khoảng thời gian kể trên? *
Điểm trung bình học tập của bạn? *