Xác định b ản g phân phối thực nghiệm , sau đó tìm đường gấp khúc phân phối tương ứng.2... Tìm xác suất dể vật liộu đó chịu được áp lực đã biết.. Giải\ T rên thực tế ta phải tìm xác suất
Trang 1Chương IVMẪU THỐNG K Ê V À ư ớ c LƯỢNG THAM s ố
§4.1 M Ẫ U T H Ố N G KÊ VÀ P H Â N PH ÔÌ THỤC N G H IỆ M
4.1.1 T ó m tắt lý thuyết
1 N h i ệ m vụ thống kê toán là phâìì liclì s ấ ìiệii (gồm ihu thập
và xử lý) n h ằ m thu n h ậ n các thông tin c h ân thực về một đại lượng n à o đó và rút ra các kết luận hợp lý c ó giá trị khoa học và thực tiễn G iá o trình sẽ giới hạn tro n g việc giới thiệu một sô phương p h ấ p x ử lý số liệu
Khái niệm c ơ sở c ủ a thống kê toán là t ập m ẫ u, gọi tắt là mẫu;
đó là tập các đối tượng cùng bản chất được c h ọ n một cách ngẫu
nhiên T ậ p lìân được gọi là tập bao g ồ m m ọi đối tượng cùng bản
c h ất nào đó, nơi m à ch ú n g ta tiến h à n h việc c h ọ n ra mẫu DiiiiíỊ
lượng niẫii là số lượng các đối tượng c ó tro n g tập mẫu Mẫu sẽ
được gọi là k h ô n g hoàn lại nếu đối tư ợ ng c h ọ n kh ô n g bị Iiá lai trước khi c h ọ n đối tượng tiếp theo và c ó h o à n lại nếu k h ô n s làm
n h ư thế T h ô n g thường m ẫu được gọi là bé n ế u d u n g lượng của
nó k h ô n g vượt q u á 23 - 30 phần tử
T ậ p m ẫu được xét trong giáo trình sẽ là tập các số - giá tri
c ủ a m ộ l biến n g ẫ u n h iên X nào đó ở n h ữ n g phép thử khác nhau
Sau này để c h o đ ơ n eiản ta giả sử c h ú n g được thu thập mộl cácli
đ ộc lập; và khi đ ó về mặt lý thuyết có thể coi m ẫu như là mộl tập
c ác biến ngẫu n h iên độc lập có cù n g m ột phân phối (điổu này
c h o p h é p c hứ ng m i n h các tính chất t h ố n g kê củ a các đặc írưng
Trang 2m âu để ihấy lính hợp lý cùa việc sử dụng c h ú n g cả về lý ihuyếl
và thực hành) Còn troiiíi các bài tập lính toán, m ẫ u đ ơ n giản là một dãy số thực n h ư ta vẫn thường gặp trong toán nói c hung
2 Khi n g h iê n cứu một inẫii có dung lượng //, k h ố n g loại irừ khả n ãn g m ột giá trị nào xuất hiện nhiều lần trong m ảu Bằng việc g ộ p các giá trị bằng nhau lại ta có thể biểu diễn m ẫ u b ằn g
b ã n s sau đây:
trong đó / / , là s ố lần xuất hiện giá trị .V, ( / = 1, 2, Ả) C á c riị
chính là t t h ỉ vô’ c ủ a các giá trị lương ứng và //j + ỈỈ 2 + + /ỉ^ = /?
Đồ ý rằng nếu tất cả các /í, đều bằng 1, ta sẽ có giá trị m ẫ u k h á c
nhau và trong Irường hợp đó k - ỉỉ (dung lượng mẫu).
Tỷ số giữa tần số và dung lượng mẫu được gọi là tán s uấ t củ a
siá trị tương ứng và được ký hiệu là {i = 1, 2, , k) Có
và cho c h ú n g ta một bức tranh nào đó về há n chất xác suất c ủ a
biến ngẫu nhiên X c ảm sinh ra mẫu; vì vậy bảng s ố n à y h a y được gọi là pliâìỉ p h ố i íỉìực lìịỊlìiệni (hoặc phân p h ố i m ẫ u ) c ủ a biến X
N ó có d ạ n g rất g iố n g bảng phân phối xác suất c ủ a b i ế n n g ẫu nhiên rời rạc ( x c m mục 2.1) Đôi khi irong bảng (1.1) c ác g iá trị
103
Trang 3mẫu được cho k h ô n g phải b ằ n g số, m à b ằn g m ộ t k h o ả n g trê n trục số; sau này khi tính toán, t h ô n g th ư ờ n g ta thay k h o ả n g số bằng giá trị n ằ m giữa kh o ả n g ( n h ư là t r u n g bình c ủ a khoản g ).
Ngoài b ả n g (1.1) người ta còn xâ y d ự n g h à m p h á n p h ố i x á c
suất thực ng h i ệm củ a biến n g ẫu n h iê n c ả m sinh ra mẫu; c á c h tìm
m ột hàm n h ư vậy giống như c á c h l à m tro n g m ụ c 2.2 b ằ n g c á c h coi ( 1.1) n h ư là m ộ t b ả n g phân phối x ác suất và các M’, là các xác suất N h ư vậy việc xác định h à m p h â n p h ố i thực n g h i ệ m sẽ c h í n h
là quá trình tìm tần suất tích luỹ (và k h i đ ó trong b ả n g (1.1) các
số liệu phải được sắp theo thứ tự tă n g d ầ n c ủ a giá trị)
Trang 4Ngoài ra có thể xác định các đặc trưng mâu khác như trung vị
mẫu, m ô - m e n m ẫ u Việc tính theo (1.2) - (1.4) sẽ xét ở m ục 4.3
3 T r o n g thống kê m ỏ tả, để biểu diẻn quy luật phán phối xác suất người ta còn d ùng phương p h áp đổ thị, chẳng hạn:
* Đư ờn g g ấ p k hú c p h â n p h ố i là đường nối các điểm (X|, M’|),
(^2, Wj), (x^., vvj; hoặc các đ i ể m (.V/, «/), //<)
* T ổ chức đ ồ trên hệ toạ đ ộ ( a ', v); trục hoành là toạ độ X j , ^2,
X ị ^ và giả sử c h ú n g c á c h đều h = ~ A', Ta dựng các hình
c h ữ nhật có c h iề u c ao bằng (hoặc M',) và chiều rộng bằng Ìì với
đ iểm giữa đ á y chính là các X ị
4.1.2 C á c bài giải m ẫu
B à i 1 Khi đo độ dài của 30 chi tiết chọn ngẫu nhiên củ a một
loại sản p h ẩ m , người ta thu được s ố liệu sau đây:
39 41 40 43 41 40 44 42 41 43 41 42 39 40 42
43 41 41 42 39 42 42 41 42 40 41 43 41 39 40
X â y dựng; a) Bảng phân phối thực n g h iệ m và h à m phân phối
m ẫ u tương ứng; b) Đ ư ờ n g c o n g g ấ p k h ú c phân phối c ủ a độ dài
chi tiết đã đo
Gi ải : S ố liệu đ ã c h o c ầ n t ậ p h ợ p lại vào bảng s ố sau đây:
Trang 5Từ b ả n g số trên b ằn g c á c h tìm c ác tầ n s u ấ t tíc h luỹ ( x e m c ô n g thức (1.5) )ta có h à m p h â n phối m ẫu :
0
153
10
3 556
301
Hình 4.1
0 ,1 7 0 ,0 2 0,17 0,13 0,05 0,11 0 , 1 7 0,05 0,03 0,11
0 ,0 4 0 ,1 4 0,10 0,11 0,13 0 , 1 4 0 , 1 6 0 ,0 4 0,13 0 0 40,03 0,15 0,11 0,06 0,10 0 ,1 5 0 , 1 6 0,06 0 ,14 0 ,0 6
0 ,0 4 0,08 0,14 0,08 0,08 0 , 1 4 0 ,1 3 0,07 0,16 0,08
Trang 7B à i 3 C h o bộ số liệu g ồ m 79 giá trị n h ư salu:
Giải: Kết q u ả cho bởi b ả n g sau đây: Cột 1 là các n h ó m số
liệu, cột 2 và 3 là tần s ố và tần s ố tích luỹ, cột 4 vẵ 5 là tần suất
Bài 4 Đ o độ dài c ủ a 30 chốt k h o á của m ột loạ' sản p h ẩ m ta đươc:
Trang 83.39 3 ,3 9 3,38 3,41 3,42 3,40 3,41 3,39 3,44 3,433,38 3 ,4 0 3 ,3 7 3,41 3,40 3,41 3,38 3.42 3,43 3,393.40 3,41 3.46 3,39 3,37 3,42 3,41 3,40 3,38 3,41
M ô tá d ã y s ố liệu đó bằng biểu đồ c h ấm , sau đó xác định bảng
p h â n p h ố i thự c n g h iệ m
Giải- Biểu đồ c h ấ m có thể xây dựng n h ư sau đây và tương
ứng với b i ể u đ ồ là b ả n g phân phối thực n g h i ệ m
•
•
• - 1 -
•
•
•1
Đ ể ý rằng ngoài tổ chức đồ và biểu đổ chấm , còn có nhiều cách
m ô tả s ố liệu khác, c hẳng hạn sơ đồ kiểu c ây - lá, kỉểu hình tròn
v v M ụ c đích c h u n g đều là tạo đồ thị để bằng trực giác xác
d in h dê d à n g các tần suất lớn nhó khác nhau ứng với các giá trị tương ứng
Bài 5 C ho m ộ t b ản g phân phối thực n g h i ê m n h ư sau:
Trang 9biểu diễn 1trên hình 4.3
Trang 10Xác định b ản g phân phối thực nghiệm , sau đó tìm đường gấp khúc phân phối tương ứng.
2 Sau đ â y là giá c ủ a m ộ t loại bất đ ộ n g sản ở m ột huyện:
3 T ừ m ộ t bộ s ố liệ u về đ ộ dài, n g ư ờ i ta đã xây dự n g được
Trang 11T rong sơ đồ n à y c ây c h í n h là b ộ s ố trướ c dấu , c ò n lá là các
số c òn lại; để ý lá là c á c p h ầ n c h ữ s ố c ủ a phần t h ậ p p h â n (hàng c h ụ c và h à n g trăm , tức là c h í s ố p h ầ n trăm và p h ầ n vạn của số đo tương ứng; c h ẳ n g h ạ n ứ n g với c â y 2,7 ta c ó c ác sỏ' liệu gốc là 2 ,728; 2 ,7 0 0 và 2 , 7 3 8 ) H ã y x á c định b ả n g p h ân phối thực n g h i ệ m ứng với s ơ đ ổ c â y - lá này
5 Người ta chọn ra 65 lô h à n g c ủ a 2 th á n g liên tiếp c ủ a c ù n g mộl nhà m áy đem đi thử n g h iệ m , s ố lư ợ n g các p h ế p h ẩ m là;
6 Số liệ u sau đ â y là sô' k ỹ s ư đ ế n thự c tập tại m ộ t h ã n g trong v ò n g nử a n ă m tại c á c x í n g h i ệ p k h á c nhau:
Trang 127 Đ i ể m s ố c ủ a sin h viên ở m ộ t lớp là ( đ iể m tối đa là 100);
Trang 131,0 đến 1,5 7
1,5 đ ế n 2 ,0 7
9 T r ọ n g lư ợ n g c ủ a c ác sản p h ẩ m c ủ a m ột lô h à n g là:
99,8 99,3 99,7 99,5 99,5 100,1 100.0 100,5 100.1 99,299.7 99,3 99,8 99,9 99,8 99,9 100.4 100,2 100.2 100,198,5 97,9 98,7 99,2 98,2 100,9 101,1 102,2 9 8 6 97,098.7 99.1 100,5 100,7101.1 99.6 100,2 100.3 9 9 ,8 99.2
X ác định b ả n g p h á n phối thực nghiêm và đường gấp k h ú c phân phối Sau đó tìm h à m phân phối m ẫu và đồ thị cùa nó
Trang 14Phép biên đổi A" - a
ơ
được gọi là phép riìl gọn (hay q u y c h u ẩ n
ih e o nghĩa đưa inột b iế n ngẫu n h iê n vé d ạ n g có kỳ v ọ n g 0 và
2, Flìúiỉ phổi klìi bìỉilì phiíơng, N ếu ta có ìì biến n g ẫu n h iê n .V,
độc lập có cùno phân phối chuẩn ơi (0, 1) thì biến sau:
n
/ 1
(2.2)
sc có phân phôi khi b ì n h p h ư ơ n g vứi n bậc tự do và k ý h iệu
n h ư sau X ~ ỵ~ (n) V iệc lín h l o á n xác suất liên q u a n đ ế n p h â n phoi x~ i u) dược liến h à n h b ằ n g b ả n g sò (xcni phụ lục A ) Có
ihể tổng quát hoá kết q u á (2.2) nhu' sau; N ếu ta c ó ìì b i ê n đ ộ c láp V,, V, _ V,, có p h â n phối c h u ẩ n (t, ~ c ' ( ‘(í/,, ơ ,’ )) thì:
Trang 15G iố n g n h ư phân phối c huẩn 0 - 1, p h ân phối r đối xứng qua gốc 0
(tức là c ó trung bình bằng 0) Khi n bé thì phân phối t có đường
cong m ật độ “m ậ p ” hơn đườ ng m ật độ tyí "(0,1), nhưng khi n k h á
lớn nó rất gần với chuẩn rút gọn, h a y còn gọi là tiệm cận chuẩn
T rong thực t ế nếu n > 30 thì đ ã c ó ihể coi phân phối / và c h u ẩ n rúl g ọ n là n h ư nhau
p h â n p h ố i c h u ẩ n n h ư n g k h ô n g b iế t p h ư ơ n g sa i, th ì:
í
t r o n g đ ó s~ được x ác định t h e o c ò n g thức (1.4)
4 Pliâtì p h ố i Pìii-sơ {phân p h ố i F) N ếu ta có hai biến n g ẫ u
n h iên có p h ân phối : X ~ ( '') ''à Y ~ (m) thì ĩỷ s ố sau
có p h â n phối F với hai bậc tự d o là n và /??:
Trang 16Ằ//; ị .
— - /• \n.m).
Đ ư ờng cong mật độ phân phối F , giống n h ư với phân phối !
k h ô n g đối xứng và chi khác 0 với các giá trị dương C ũng giống
n h ư phân phối và /, việc tính toán với biến ngẫu nhiên có
phân phối F phải n h ờ tới các b ả n g số (xem phụ lục A).
Một kết quả sau này ta hay dùng: N ếu ta có X|, và
Vị, }- 2 , ■■■,}'><, l à c á c b i ế n n g ẫ u n h i ê n đ ộ c l ậ p , c ó p h â n p h ố i c h u ẩ n ( c á c c ó c ù n g p h â n p h ố i c h u ẩ n , c á c V, c ũ n g v ậ y ) ; k h i đ ó n ế u t a
xác định sf và theo cô n g thức giống n h ư (1.4), thì
Giải: Ta tìm c á c h biến đổi b iểu thức X > + 4 về d ạ n g
c ó p h â n phối xác đ ị n h (ở đ ẳ y 2 ’g là biến n g ẫ u n h i ê n có phân
p h ố i ỵ - với 9 bậc tự do) Đ ể làm điều ấy ta b iến đổ i bất đẳng
th ứ c trẽn:
117
Trang 17với T = Z / ^ ỵ l / 9 ~ / (9) D ù n g b ả n g số chi tiết h o ặ c p h ầ n m ề m
m áy tín h tư ơ ng ứng sẽ lìm được p {r > 3 ) = 0,0075
B à i 2 C h o À’ là biến n g ẫ u n h i ê n ~ (9) T ìm xác suất đ ể X
k h ô n g vượt q u á giá trị 2,7
Giải: Ta phải tìm p { x < 2 , 1 ) Theo bảng phân phối
(xem phụ lục A) ở giao điểm củ a h à n g n = 9 với cột a = 0 ,975 ta
có giá trị 2,7; điều đó có n g h ĩa là: P{T >2 ,7 ) = 0 ,9 7 5 T ừ đó xácsuất c ần tìm là 0,025
B à i 3- T ìm x á c suất đ ể b i ế n n g ẫ u n h i ê n T - í ( 1 7 ) c ó giá
trị; a) k h ô n g bé hơn 2,11; b) k h ô n g bé hơn - 2,11
Giài\ a) T a phải tìm P{T > 2 , 1 1) T ra b ản g p h â n p h ố i /, lìm
giao đ i ể m c ủ a h à n g /7 = 17 với cột a = 0 ,0 5 ta có giá trị 2,11;
vậy x á c suất c ầ n tìm là 0 , 5 / 2 = 0,025 ( x e m phụ lục A)
b) Do tínli đối xúiig của phân phối t, P ( í > - 2,11) = 1 - 0,025 = 0,975 (và bằng P{T>-2A 1)) Chú ý rằiig /'{7’| > 2 ,1 1) = 0,05 theo báng Stiu-đơn
(tìm/(17; 0,05)-2,11)
B à i 4 Cường độ chịu lực c ủ a m ột loại vật liệu xây d ự n g tuân Iheo phân phối (22); còn áp lực lên loại vật liệu đó sau khi xây
Trang 18dựníz c ó luật J “ (9) Tìm xác suất dể vật liộu đó chịu được áp lực
đã biết
Giải\ T rên thực tế ta phải tìm xác suất để cirờiig độ chịu lực
cúa vậl liệu phái bé hơn áp lực đã biết, tức là tìm p
1 N ă n g suất lúa của m ột vùng là biến ngẫu nhiên c h u ẩn X
~o ) ( í / , ơ ‘ ) với a = 50 tạlììíi và ơ = 3,5 Tim xác suất để khi gặt
ngầu n h iên m ột thửa ruộng ở \'ùna dó thì n ăn g suất lúa sẽ:
Trang 190 ,9 5 4 xem s ố sản phẩm đạt yêu cầu nằm trong k h o ả n g n à o (chọn
k h o ả n g đối xứng với tâm đối xứng là 9 2 0 sản phẩm )?
3 Tim xác suất để biến ngẫu nhiên X ~ r (15) nhận giá trị: a)
k h ô n g bé hơn 2,6; b) nằm giữa - 2 , 6 và 2,6; c) nằm giữa 0 và 2,6
4 Lần thử n g h iệ m đầu tiên kết quả là m ột đại lượng tuântheo l u ậ t / “ (4), còn lần thứ hai - tuân theo l u ậ t / " ( 6 ) Tìm xácsuất đ ể đại lượng của lần th ử nghiệm th ứ hai ít nhất lớn g ấ p 3 lần đại lượng của lần th ứ nhất
5 Cường độ chịu lực của một loại vật liệu là biến n g ẫ u nhiên
tuân theo luật khi bình phương X ~ / “ (9) (với cường đ ộ trung
bình là 9) Tim xác suất để loại vật liệu đó chịu được áp lực
k h ô n g q u á 19
6 Cho X|, Xị, , X, và F|, ^2, , r , , là các biến n g ẫ u nhiên
độc lập có phân phối ch u ẩn với kỳ vọng 0, n h ư n g các Xị có
phương sai - và các y, có phương sai — Tính
10 Cho phương sai của một biến ngẫu n h iê n bằng 25 G iả sử
c h ọ n m ột m ẫu có d u n g lượng /ỉ = 16 c ủ a biến này hãy tìm P{s >
4), trong đó 5^ là phương sai m ẫu hiệu chính
Trang 20§ 4 3 UỒC LUỢNG ĐIỂM4.3.1 T ó m t á t lý t h u y ế t
1 Cho một mẫu X | , .v,, , ,v„ có liên hệ với một tham số không
biết 6 và bài toán đặt ra là xác định ớ dựa trên thông tin mẫu trên Đây chính là bài toán ước ỉượuị> tham sổ Tất nhiên do 6 không biết và thông tin m ẫu thường là chưa đủ nên việc xác định 6 chỉ là
x ấ p xỉ ( g ầ n đ ú n g ) C ó t h ể c o i m ộ t h à m g i á trị ê { Xị , x„) là
một ước lượng của ô N h ư vậy từ nay về sau ta ký hiệu ước lượng của một tham số 6 nào đó là ò (tham sô' có đội mũ).
Uơc lượng, được xác định bằng một số, sau này sẽ được gọi
là ì(ớc hrợng điểm Phụ thuộc vào những tiêu chuẩn (hay ng u y ê n
lý thống kê) khác nhau m à ta sẽ có các ước lượng khác nhau của
c ùng một tham số
* uiýc lượng X,) được gọi là không chệch, nếu ta có
£'ớ = 0 ( h a y / ? ( ớ - ớ ) = 0 - ước lượng có lệch trung bình bằng 0) Nếu không t h ế ta có ước lượng chệch
* ư&c lượng Ớ ( X | , , ,Y„) được gọi là v ữ n g , nếu n lớn vô hạn
Ô sẽ hội tụ về ỡ theo xác suất (xem mục 2.4).
* ư ớ c lượng ,v„) được gọi là hiệu qitả, nếu nó là ước
lượng k h ô n g c h ệ c h có phương sai bé nhất
* Uơc lượng ớ(.v, x„) được gọi là Ììợp ì ỷ ììiìất, nếu nó làm
cực đại hàm hợp lý (hàm hợp lý chính là tích các hàm mật độ của
V, và các hàm đó có phụ ihuộc vào tham sỏ cần ước l ư ợ n g )
2 Có nhiều tham số lất được quan tâm và chúng ta phải tìm ước lượng c ủ a nó
121
Trang 21* Ucíc lượng của kỳ vọng củ a biến n g ẫu nhiên X cảm sinh ra
m ẫu thường rất được chú ý M ộ t Irong nhũìig ước iượng n h ư vậy
là trung bình m ẫ u (xem công thức (1.2)) c ó n h iều tính chất thống
kê rất đẹp đẽ, c h ẳ n g hạn nó vừa là k h ô n g c h ệ c h , vừa là vững và
đ ồ n g thời c ó thể cũng hiệu q u ả C ông thức (1.2) rất dễ d ù n g , dễ tính và trong nhiều trường hợp nó có thể đ ơ n giản hơn nữa;
c h ẳ n g hạn nếu các .V, cách đều n h au m ột k h o ả n g là li, các tần số
xuất hiện X ị tương ứng là l ì ị , với m ột x„ c h ọ n k h á tuỳ ý, ta c ó thể
c hứ ng minh:
(3.1)
với d: = X : — X N h ư vậy nếu c h ọ n x,| h ợ p lý, thay vì tính tổng
^ r i i X i , t h ư ờ n g g ồ m tổng của các tích thập phân, ta đưa về tính tổng I tĩịdị là tổng của các tích nguyên.
* P h ư ơ n g sai củ a biến X c ũ n g là m ột t h a m s ố rất cần phải ước
lượng, c h ẳ n g hạn có thể d ùng (1.3) hoặc (1.4) G iố n g n h ư trong
(3.2)
T ro n g trường h ợ p các số liệu k h ô n g cách đ ề u hoặc chúng q u á ít,
có thể t iạij trực tiếp theo (1.3) hoặc (1.4) sẽ nhanh hơn Tuy
n h iên c ó thể biến đổi chúng đi chút ít:
Trang 22bởi biến n g ẫu nhiên X có E X = a và vx = ơ ^ (riêng đối với xác
suất: m là số lần xuất hiện sự kiện trong n phép thử).
Không chệch vững
Trang 23B ài 1 Cho m ẫu A'|, A' 2, , A'„ c ả m s in h bởi m ột biến ngẫu nhiên
X ~ ưf H ãy tìm ước lượng h ợ p lý nhất của hai tham số a
và ơ ^
Giải: H à m mật độ chuẩn, ký hiệu l à / ( x a , c r "), đã biết ở
chương II H à m hợp lý, ký hiệu là L ( x ị , , x „ , a , a ^ ) , sẽ có dạng:
2cr -^Ị
n
= 0.
Rút ơ từ phương trình đầu t h ay vào p h ư ơ n g trình thứ hai, ta có
thể tìm được các nghiệm m ột c á c h d ễ d à n g (chú ý là nếu hệ có
Trang 24Bài 2 Đ o độ dài của một loại trục xe, ta có bảng kết quả sau đây (cột 1 và cột 2):
Hãy ước lượng độ dài trung bình và phương sai.
Giải: Ta c h ọ n g iá trị g iữ a các k h o ả n g làm đại diện cho
khoảng đó Bây giờ có thể dùng (3.1) và (3.2) để tìm các ước lượng không chệch cho kỳ vọng và phương sai với x„ chọn = 19,1
và lì = 0,2 Các g iá trị X, xếp v à o cột th ứ 3, còn dị xếp vào cột thứ 4; các tích í/,/7, và dỊriị n ằ m ở cột 5 và cột 6 T ổ n g của cột 2,
c h ín h là d ung lượng m ẫ u n = 100, tổng cột 5 và cột 6 sẽ được
Trang 25B à i 3 Đ ể xác định độ chính xác của một ch iếc cân tạ không
có sai số hệ thống, người ta tiến hành 5 lần cân độc lập (cùng
m ột vật), kết quả như sau:
9 4 ,1 9 4 ,8 9 6 ,0 9 5 ,4 9 5 ,2 (kg)
X ác định ước lượng không ch ệch của phương sai số đo trong hai trường hợp: a) biết khối lượng vật cân là 95; b) không biết khối lượng vật cân.
Giải: a) Khi đã biết trị trung bình lý thuyết a = 95 thì ước lượng không ch ệch của phưofng sai được tính theo côn g thức (bạn đọc c ó thể chứng m inh)
b) N ếu không biết a, ta phải ước lượng theo còng thức (1 2 )
Từ đó ước lư ợng k h ôn g ch ệch của phương sai là;
= Ì Ẻ ( ^ - « 5 5 ) " = 0 , 7
tỉ i /=1 ^ ,=1
B à i 4 Đ o lượng huyết tương của 8 người mạnh khoẻ ta có: 2,7 5 2 ,8 6 3,37 2,76 2,62 3,49 3,05 3,12 Ợít)
X ác địn h cá c đặc trưng mẫu: a) trung bình; b ) trung vị; c) m ốt
Giải: a) ở đây « = 8 và v iệc tìm trung bình mẫu là kh ôn g có
Trang 262 ,6 2 2,75 2 ,7 6 2,86 3,05 3,12 3,37 3 ,4 9
T ừ đó tru n g vị m ẫu sẽ là giá trị nằm ở vỊ trí (8 + l ) / 2 = 4,5; vậy
có thể coi nó bằng trung bình của các g iá trị thứ 4 và th ứ 5 và bằng (2 ,8 6 + 3,05)/2 = 2,96
c) D o c á c giá trị m ẫu k h á c n h a u n ê n k h ô n g c ó ước lư ợ ng
Giải: T a đã b iết rằng tần suất xuất hiện m ộ t sự kiện , ký hiệu
là Ị y , là m ộ t biến n g ẫu nhiên có phân phối gần c h u ẩn (trong thực
t ế n ế u tip v à /7(J - p), \' ớ i p l à x á c s u ấ t x u ấ t h i ệ n s ự k i ệ n t r o n g
m ộ t phép thử, lớn hơn 4 thì có thể coi r ằn g p c ó p h ân phối
c huẩn) T h a m số của phân phối c h u ẩ n này là:
Trang 27trong đó < t { p ) = p Trong côn g thức trên p - p chính là độ sai và nó không thể vượt quá 10% tần suất; tức là không vượt quá: e = 0,1.0,35 = 0 ,0 3 5
B ài 6 Tìm trung bình mẫu và phương sai mẫu của bộ s ố liệu sau đây:
X:
Giải: D ù n g c ô n g thức ( 3 1 ) ta có thể tính được dễ dàng X Tuy
nhiên có thể làm cách khác như sau: chọn nào đó và dê thấy:
Trang 283 X á c định trung bình m ẫu, phương sai m ẫu và đ ộ lệch
c h u ẩn m ẫ u của bộ sô' liệu sau;
.V,
129
Trang 294 Đ o chiều cao 100 sinh viên c ủ a m ột trường đại học thì thu được kết q u ả sau đây:
C h i ề u c ao 152 -
156
156 - 160
160 - 164
164 - 168
168 - 172
172 - 174
T im k ỳ v ọ n g và p hươ ng sai m ẫu
5 Sô liệu đo điện trở c ủ a 2 0 tụ đ i ệ n n h ư sau:
q u â n sự q u á cao của chính phủ Pháp H ã y xác định bằng phương
p h á p h ợ p lý nhất ước lượng c ủ a tỷ lệ người dâ n P háp c hong chi
Đ ộ dài 950-960 960-970 9 7 0 - 9 8 0 980-990 99 0 -1000
Trang 301000-1010 1010-1020 1020-1030 1030-1040 1040-1050
H ãy xác định kỳ v ọng m ẫu và phương sai m ẫu hiệu chỉnh; vẽ
đ ư ờ n g gấp khúc phân phối m ẫu
9 T ìm ước lượng c ủ a trung vị và mốt của hai bộ số liệu sau:
10 Đ ể xác đ ị n h ước lư ợ ng t r o n g t rư ờ n g h ợ p số liệu có
p h â n phối (thực ra là c ó p h ư ơ n g sai) k h á c n h a u , người ta d ù n g
c á c c ô n g Ihức:
với ẹ, = l/o - ỉ (/■ = 1, 2, , n) Á p d ụ n g đ ể t ìm đườ ng k ín h trung
b ì n h c ủ a m ột loại t r ụ c và đ á n h giá đ ộ c h í n h xác c ủ a nó dựa trê n s ố liệu đo đ ư ợ c b ằ n g 4 c á c h k h á c n h a u với các phương sai
Trang 31H ãy x á c đ ị n h ước lượng k h ô n g c h ệ c h c ủ a phư ơ ng sai sai sô' tro n g c ác t rư ờ n g hợp; a) biêì s ố đo thực b ằ n g 375; b) k h ỏ n g biếl
T í n h t r u n g b ì n h m ẫ u và p h ư ơ n g sai m ẫ u h iệu c h ỉn h của h a i bộ
s ố liệ u trê n và b ạ n c ó n h ậ n xét gì về k ết q u ả ấy?
§ 4.4 K H O Ả N G TIN CẬY
4.4.1 Tóm tắt lý thuyết
1 ư ớ c lượng đ i ể m , dù là tốt, có m ột hạn c h ế c ơ bản là chỉ
c h o ta đ ú n g m ột g i á trị trong m ột tập hợp vô hạn ( k h ô n g đ ế m
được) và điều ấ y dễ g â y ra những sai sót khi ra q u y ế t định Hơn
nữa ta k h ô n g th ể hình d u n g ra độ tin cậy của quyết đ ị n h của
Trang 32mình C h o nên trong thực tiễn biết ưcýc lư ợ ng đ i ể m là chư a đủ
Đ ể có thêm t h ô n g tin, người ta khai thác th ê m luật phân phối <ác suất v à đ ư a r a khái niệm ước ÌIÍỴĨIIÍỊ khoảng.
ơ đáy ước lượng khoảng, hay klìoảiìg tin cậv, cho m ộ t th a m
s ố ỡ với một đ ộ tin cậ y cho trước ỵ = \ - a được xác định bởi hai
giá trị cận dưới và trên ớ, và 0, K h o ả n g (ớ|, Ớ2) được gọi là
k h o ả n g tin cậ y \ - a (hoặc f ) n ế u
p ớ e ( ớ | ế?2 ) = ỉ - ữ ■
ơ đây ỵ = ] - a được gọi là cỉộ tin cậ y (hoặc đ ộ c h ắc c hắn, độ tin
t ư ở n g , .) còn hiệu Oị-Ô, được gọi là độ dài k h o ả n g tin c ậy đã
cho
2 T a x e m x é t đ ầ u tiên ư ớ c li ừ / iì g k ì ì o ả ì i g CÌÌO k ỳ v ọ n q :
* N ế u p h ư ơ n g sai đã biết và tập nềii t u â n t h e o luật c h u ẩ n ,
người ta c h ứ n g m i n h được k h o ả n g tin c ậ y ] - a c ủ a ơ = E X c ó
ệ { 0 Ị , ) = - D ễ th ấy độ dài k h o ả n g tin c ậ y lỷ lệ thuậi! - ri
p h ư ơ n g sai và đ ộ tin cậy, n h ư n g lỷ !ệ n g h ị c h \ ó i d u n g ỉu ■ u;
m ẫ u ; và nếu biết hai t ro n g ba đại lượng đ ó ia dẻ d à n g lìiiỊ a đại lượng th ứ ba Đ ể ý ràng;
p X ~ O ị ^ < X + 0
iì
1 - 6 /
3
Trang 33k h ô n g có n g h ĩ a là giá trị thật c ủ a a lúc nào cũ n g n ằ n tro n g
k h o ả n g tin c ậ y \ - a , m à vẫn có thể xảy ra việc a nằm ngoài
k h o ả n g đ ă c h o với xác suất a (xác suất sai lầm khi chọn kho ả n g đó) T h ô n g th ư ờ n g đ ộ tin c ậy I ~ a được c h ọ n theo yêu cấu trước
và k h á lớn: 0.9; 0,95; 0,99; 0 , 9 9 9
* N ế u g i ả th iế t c h u ẩ n v ẫ n c ò n giữ, n h ư n g phương sai
k h ô n g b iế t, thi ta p h ả i t h a y n ó b ằ n g ước lượng k h ô n g c h ệ c h
K h i đ ó k h o ả n g tin c ậ y 1 - a
(4.2)
t ro n g đ ó .y^- p h ư ơ n g sai m ẫ u hiệu c h ín h , còn tra từ bảng Stiu-
đ ơ n ỡị, = / ( « - ! ; « ) '^ o p h â n phối t, c ũ n g như phân phối c h u ẩn ,
ỉà đ đ i xứng, k h o ả n g tin c ậy c ũ n g thường được xây dựng đối xứ n g
q u a ước lượng m ẫu C ó thể tìm k h o ả n g tin cậy k h ô n g đối xứng phụ t h u ộ c vào yêu c ầu c ủ a người dùng N goà i ra khi tra b ản g đ ể
ý rằng: nếu T ~ t{n - 1) thì p { t < / ( / 7 - 1 ,«■)) = ỉ - « hay
p { t > / ( « - 1 , « ) ) = o r Vì vậy dù b ản g x â y dựng kiểu nào, nếubiết c ô n g thứ c tín h là ta c ó thể tìm ra c á c h tra bảng tươr.g ứng
* N ế u d u n g lượng m ẫ u k h á lớn, thì trong mọi trườíig h ợ p có
thế t h a y ơ b ằ n g i' và k h o ả n g tin c ậy 1 - a xấp xỉ có thể được
x ây d ự n g g iố n g n h ư (4.1) (tất n h iên ơ coi « i); tức là n ó có
d ạng:
x + (9.
n
với tra s i ố n g n h ư t r ê n b ằ n g b ả n g L á p - l a - x ơ
Trang 34* N ế u lì k h á lớn và p k h ô n g q u á Iihỏ; có thể tìm ước lư ợ n g
k h o ả n g ! - a c h o xác suất x u ấ t hiện sự k iệ n n à o đ ó ( k iể u Bcc-
trư ờ n g h ợ p k h á c , x e m t h ê m t r o n g c á c tài liệu th a m k h ả o
3 Bây giờ ta tìm ước lượng k h o ả n g c h o phương sai G i ả sử ta
tra từ bảng phân phối X l
* N ế u k h ô n g biế t kỳ vọng, ta th ay t h ế n ó b ằ n g ước lư ợ n g
X và k h o ả n g tin c ậ y 1 - a c ủ a phư ơ ng sai có dạng:
Trang 35tro n g đ ó ớ, = J /? - 1, 1 - a \ Ô 2 = X - H - 1 a
tra từ b ả n g
phân phối ỵ " C h ú ý r ằ a g đôi khi người ta c h ọ n c ậ n d ư ớ i của
k h o ả n g tin c ậ y trê n b ằ n g giá trị 0
4.4.2 Các bài giải mẫu
B à i 1 Đ o sức b ề n c h ịu lực c ủ a m ộ t loại ống c ô n g n g h i ệ p người ta t h u đ ư ợ c b ộ s ố liệu sau
4 5 0 0 6 5 0 0 5 0 0 0 5 2 0 0 4 8 0 0 4 9 0 0 5 125 6 2 0 0 3375
(đo 9 ống) T ừ kinh n ghiệm nghề n g h iệp người ta c ũ n g biết răng
sức bền đó có phân phối c huẩn với độ lệch chuẩn ơ = 300 H ãy
xây dựng k h o ả n g tin cậy 95% cho sức bén trung b ì n h c ủ a loại ống trên
Giải: T rư ớ c hết ta tín h tru n g b ìn h m ẫu c ủ a sức b ề n c h ị u lực
Trang 36B à i 2 T im khoảng tin cậ y 95% cho kỳ vọng của bộ số liệu trên, nhưng g iả sử không b iết phương sai.
G iải: D o phương sai chưa biết, ta sẽ ước lượng nó bằng phương sai mẫu hiệu chỉnh:
8 /=1
N go à i ra cũng do phương sai không biết nên khi tra bảng phải dùng phân phối Stiu-đơn : = /( S ; 0,05) ở đây dóng hàng có giá trị bằng 8 và cột c ó giá trị bằng 0,0 5, ta tìm được
6f, = 2,3 0 6 w 2,31 Từ đó theo (4 2 ) khoảng tin cậy 95% có dạng:
tin c ậ y ở đây có độ dài lớn hơn và trong một chừng mực nào đó
có thể nói rằng nó “xấu” hơn.
B à i 3 Đ ộ d à y c ủ a b ả n k i m loại giả sử là t u ân t h eo luật
c h u ẩ n Đ o 10 bả n k im loại đ ó t a thu được số liệu sau:
4,1 3,9 4,7 4,4 4 , 0 3,8 4,4 4,2 4,4 5,0
H ãy x á c định: a) kho ản g tin c ậy 9 0 % cho độ dày trung b ìn h trên; b) k h o ả n g tin cậy 9 5% cho p hươ ng sai của độ dày đó
G iả i: Trước hết ta phải tính các ước lượng X và cho kỳ
vọng và phương sai của độ dày đang xét;
x = — (4,1 + 3,9 + + 5,0) = 4,29;
10
137
Trang 379 (4,1 - 4,29)^ + (3,9 - 4,29 f + + (5 , 0 - 4,29)-
h o ặ c d ù n g c ô n g thức
» 0,1367 ^ s = 0.37.a) T h e o (4.2) k h o ả n g tin c ậ y 9 0 % c ó d ạ n g (đ ể ý
b) Đ ể tìm k h o ả n g tin c ậy 9 5 % c h o phương sai, ta phải tìm
c h ú n g lần lượt là 2,7 và 19,02 T ừ đó th e o c ô n g thức (4.5) ta c ó
k h o ả n g tin cậy cần tìm là;
' 1,23 1,23 1 9 , 2 ’ 2 , 7 ,
B à i 4 Tại m ột v ùng rừng n g u y ê n sinh, người ta đ e o vòng cho
1000 con chim Sau m ột thời g ian bắt lại 2 0 0 con thì t h ấy c ó 40 con c ó đeo vòng T h ử ước lượng s ố c h im t ro n g v ùng rừng đ ó với
Trang 380,2 - 2 , 5 7 5 < p < 0,2 + 2,575
200
0,1271 < p < 0,2729
0,2.0,8200
T ừ đó t ổ n g s ố c h im c ủ a v ù n g rừng đó sẽ n ằ m tro n g k h o ả n g sau
— —— ; — hay « ( 3 4 4 5 ; 7880)
0,2729 0,1271 J
B ài 5 Trước b ầ u cử tổng thống người ta phỏng vấn ngẫu
n h i ê n 1800 c ử tri thì t h ấ y có 1180 người ủng hộ m ột ứng cử viên
A Với độ tin c ậy 9 5 % hỏi ứng viên đó thu được tối thiểu bao
n h iê u p h ần trăm s ố ph iếu bầu?
Giải: Số phần t ră m phiếu bầu ở đây c h ín h là c ận dưới của
k h o ả n g tin c ậy 9 5 % c ủ a xác suất bầu cho ứng cử viên A Theo
c ô n g thức (4.3) với p = 1 1 8 0 /1 8 0 0 « 0,6556; ^(l,9 6 ) = 0,4 7 5 ; số
p h ần trăm cần tìm là (/; = 1800)
p - 1 , 9 6 J ® 3 Ĩ ~ 63 ,3 5 %
n
B ài 6 Biết tỷ lệ n ả y m ầ m c ủ a m ột loại hạt g i ố n g là 0,9
V ớ i đ ộ tin c ậ y 0 , 9 5 , n ế u ta m u ố n dộ dài k h o ả n g tin c ậ y c ủ a tỷ
Trang 39G iải bất phương trình trên theo n, ta có ngh iệm n > 34 57
B à i 7 N gư ời ta đo một đại lượng không đổi 25 lần bằng dụng cụ đo không c ó sai sô' hệ thống và sai s ố đo trung bình bằng
0 G iả sử sai số tuân 'theo luật phân phối chuẩn và m ô-m en gốc cấp 2 mẫu tính được bằng 0,5.
a) X ác định k h o ản g tin cậ y 95% ch o phương sai củ a sai số đo.
b) T ính xác suất đ ể sai số đo kh ôn g vượt quá 0 ,5
Giải: a) G ọi X là sai số của phép đo và theo đầu bài X
trong đ ó là phương sai sai số K hoảng tin cậy 95% cùa phương sai đó được tính theo cô n g thức (4.4);
; r '( 2 5 ; 0 ,0 2 5 ) ’ (2 5 ;0 ,9 7 5 )
với nĩ 2 là m ô -m en g ố c cấp 2 mẫu = —' ỵ ^ x Ị = 0,5 theo đầu bài.
còn ;ịf^(25; 0 ,0 2 5 ) và ỵ ^ { 2 5 ; 0,975) c ó thể tìm được bằng tra bảng phân ph ối vớ i bậc tự do là 25: đó là cá c g iá trị 4 0 ,6 4 6
và 1 3 ,1 2 0 Từ đ ó k h oản g tin cậy cần tìm là:
2 5.0 ,5 25.0,5 : 4 0 ,6 4 6 ’ 13,120
Trang 40p { x < 0,5) = 0,5 + ệ 0.5
V o l
0,5 + ^ ( 0 , 7 0 7 ) « 0,5 + 0.26 = 0,76
B à i 8 T h e o kết q u ả 5 số liệu do xác đ ị n h được ước lư ợ n g
m ẫ u h i ệ u c h í n h c ủ a phương sai là 9 Tìm xác suất đ ể g i á trị thật c ủ a p h ư ơ n g sai nằm trong k h o ả n g ( 2 ,7 1 1 5 ; 5 0 , 6 3 2 9 )
G iải: T h e o d ạ n g công th ứ c(4 5 ), la có k h o ả n g tin c ậ y với
xác s u ấ t tin c ậ y 1 - a
/ T ^ ( 4 , « i ) ' 2 ^ 4 , « 2) /trong đ ó .V" là phư ơ ng sai mẫu hiệu chính b ằ n g 9, - 1 = 4; c òn
, ị = 1, 2, được tính n h ư sau: nếu X ~ ỵ~{rì) thì
p(x > ^^(/?,«.))= ữị Từ đó xác suất để phương sai rơi vào
k h o ả n g tin c ậy trên bằng \ - a và sẽ bằng
4.4.3 Bài tập
1 Sản lượng ngày của một phân xưởng ià biến ngẫu nhiên tuân theo luật chuẩn Kết quả thống kê của 10 ngày cho ta bộ s ố liệu:
141