1. Trang chủ
  2. » Hoá học lớp 10

Thống Kê Và Ứng Dụng - Đặng Hùng Thắng ( NXB Giáo Dục 1999) - Tài liệu VNU

271 59 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 271
Dung lượng 15,2 MB

Nội dung

Các thõng tin dưới dạng số liệu đang tràn ngập trong cuộc sống hàng ngày của mỗi chúng ta, ờ khắp nơi xung quanh ta. Khoa học Thông kê ra dời nhảm mục đích nghiên cứu các phương pháp [r]

(1)(2)(3)

Đ Ặ N G H Ù N G T H Ắ N G

THỐNG KÊ VÀ

ƯNG DỤNG Giáo trình dùng cho trường Đại học Cao Đẳng

(4)

31

(5)

LỊI NĨI ĐÂU

"Trong tường lai không x a kiến thức thông kê v tư thống kê s ẽ trỏ thành một y ế u tố thiếu học v ấ n c ủ a công dân, giống khả biết đ ọ c , biết viết vậy"

H G W E L L S (1920)

Các thõng tin dạng số liệu tràn ngập cuộc sống hàng ngày chúng ta, khắp nơi xung quanh ta Khoa học Thông kê dời nhảm mục đích nghiên cứu phương pháp thu thập, tổ chức phân tích liệu cách khách quan, đáng tin cậy, đỏ từ phát ra tri thức, thông tin ẩn náu ỏ Thơng kê đã biến những số khô khan, câm lặng thành số biết nói

(6)

Cuộc cách mạng vê công nghệ thông tin phổ cập rộng rãi máy ui tính dã làm cho thống kê trở nên dẻ học dễ sử dụng trước nhiều ỏ hàu trên giới, Xác suất - Thông kê dã đưa vào giáng dạy từ bậc trung học môn sỏ bất buộc nhiều ngành học ỏ bậc dại học Năm 1973 tổng kết công tác cài cách giáo dục, UNESCO khàng dinh ràng Xác suất - Thống kê quan điểm chủ chốt để xây dựng học vấn thời đại ngày

ỏ nước ta, định về đào tạo đại cương theo 7 nhóm ngành Bộ giáo dục uà Đào tạo, tất nhóm ngành đêu có chương trinh Xác suất - Thống kê với thời lượng đơn vị học trình. Nhiều cán cơng tác có nhu vầu phải hỉ học mơn học

Cho đến nay, giáo trình và sách tham khảo lí thuyết Thống kê ứng dụng bàng tiếng Việt cịn rát chưa thật phù hợp với xu đổi cách giảng dạy Thống kê bối cảnh cách mạng Công nghệ thông tin Dề đáp ứng nhu càu giảng dạy, học tập ứng dụng Thống kê, đề góp tiếng nói ván dê dổi mói việc giảng dạy Thống kê, chúng tơi biên soạn sách với hi vọng sách giáo trình có chất lượng phục vụ một dối tượng đông bạn đọc bao gồm :

1) Các bạn sinh viên dại học, cao đảng, học viên đại học lăn dâu tiên làm quen muốn nâng cao hiểu biết Thống kê ứng dụng

(7)

Những tư tường chủ dạo khi viết sách :

1) Chúng tơi có gàng trình bày giảng thật cặn kẽ, dễ hiểu đặc biệt khái niệm Phần lớn

kết luận, khàng định sách dược cơng nhận với sụ mơ tả giải thích thích hợp

Việc chọng minh chặt chẽ những kết luận địi hỏi dộc giả phải có hiểu biết sâu vê Toán học Xác suất lí thuyết Thành thủ với mọt giáo trình mở đàu ve Thống kê dành cho nhiêu đối tượng nhàn mạnh về ọng dụng sách này, chúng tơi định bị qua chọng minh toán học

2) Mỗi khái niệm, phương pháp đầu có kèm theo nhiêu thí dụ minh họa Các thí dụ dược lựa chọn ki thuộc ve nhiêu lỉnh vực khoa học tụ nhiên, khoa học xã hội, nhãn vãn

3) Cuối chương chúng tơi có đưa vào nhiều bài

tập để độc giả dược thử thách rèn luyện tự kiểm tra Tát tập đêu có kèm theo đáp số dân

4) Những ọng dụng Thống kê địi hỏi tính tốn đơi phọc tạp vả công kênh Với sụ phổ biến và tương dối dễ kiếm máy tính bó túi, máy ui tinh các phần mềm Thống kê nay, việc thục tính tốn Thống kê dã trỏ nên dễ dàng Do dó việc học Thống kê dại, điều quan trọng khơng cịn tính tốn nữa, mà biết cần phải thực thuật toán gijbiet cách chuyền từ toán thục tiễn sang mơ hình

(8)

Hiện có nhiêu phàn mềm Thống ké mạnh như SPSS, SAS Minitab Trong sách chọn phần niềm Minitab dề giới thiệu phổ biến và dễ sử dụng

('nôn sách bao gồm chương

Các Chương ì, HI, TV, V, vu, trừ các tiết có đánh dấu *, trình bày kiến thức bản, cốt lõi cỏa Thống kẽ

Chương li "Dại cương lí thuyết xác suất", nhàm giúp độc giả ôn tập lại kiến thức Xác suất, sỏ

Thán học cỏa Thống kê

Vói độc giả muốn có hiếu biết sâu đầy đỏ hơn Lí thuyết Xác suất, chúng tơi xin giới thiệu sách [6J

Chương VI tiết có dấu * dùng lam tư liệu khi dạy giáo trình Thống kê dây dù sâu han (chảng hạn cho chuyên đè cao học)

Trong trinh biên soạn sách tác giả nhận được nhiều ý kiến đóng góp cùa dịng nghiệp mơn Xác suất - Thống kê, Khoa Toán - Cơ - Tin học, Đại học quốc gia Hà Nội Xin chán thành cám ơn đóng góp

ĩầc giả xin bầy tỏ lài cảm on tới PTS Tràn Phương Dung Phó trường ban Biên tập Tốn vè mối quan tâm ỏng hộ cho việc xuất sách, tới GS TS Trần Mạnh

Tuấn, GS TS Nguyễn Duy Tiến, dọc thảo cho những ý kiến phản biện quý giá đặc biệt tói PTS Nguyễn Văn Thường người biên tập công phu cẩn thận f cuốn sách giúp cho sách tránh nhiều sai sót

(9)

Cuối tác giả mong nhận dược góp ý phê bình của dộc giả Xin chân thành cảm ơn trước

Những ý kiến đóng góp xin gùi địa chi Nhà Xuất Giáo dục, 81 Trần Hưng Dạo, Hà Nội, vẽ địa tác giả : Khoa Toán - Ca - Tin hc, Trường Đại hc khoa hc Tự nhiên, Đại hc Quốc gia Hà Nội, 334 Nguyễn Trãi, Hà Nội

(10)

KÍ H I Ệ U V À CÁCH ĐÁNH số T R O N G C U Ố N SÁCH

1) Các định nghĩa, định lí, thí dụ, cơng thức đ n h số t r o n g t n g c h n g Chẳng hạn nói đến t h í dụ 15 m k h n g nói đế n chương ta h i ể u nói vé thí dụ 15 c h n g N ế u chương k h c ta kèm t h ê m số c h n g Thí dụ : định lí 2, c h n g hay t h í dụ l o , c h n g

2) K h i c ầ n r õ k ế t t h ú c m ộ t t h í dụ ta d ù n g d ấ u cuối dòng

3) Các c h n g hay t i ế t d n h cho giáo t r ì n h n â n g cao đ n h d ấ u *

(11)

Chương Ị

T H Ố N G KÊ MƠ T Ả

§ M Ộ T VÀI KHÁI N I Ệ M C B Ẩ N

Trước hết ta xét ví dụ sau

Đ ể đ iề u t r a số n h â n hộ gia đình sống Hà N ộ i , n g i điều tra lập danh sách gốm t ấ t gia đình đ a n g sống t r ê n địa bàn H N ộ i ứ n g với m ỗ i hộ gia đĩnh ta ghi

số n h â n hộ

a) Tập hợp t o n gia đình đ a n g sống H N ộ i gừi m ộ t tập hợp chính. (Có sách gừi là tổrbg thể, hay dân số)

b) M ỗ i gia đình điểu tra gừi m ộ t cá thể tập hợp

c) Số n h â n gia đỉnh gừi biến lượng (hay m ộ t dấu hiệu lượng). Giá t r ị biến lượng thay đ ổ i từ cá t h ể sang cá t h ể khác b i ể u d i ễ n m ộ t số Nói theo ngơn ngữ t o n hừc, biến lượng m ộ t n h xạ t tập hợp lên trục số

d) Vỉ số hộ cư t r ú địa bàn H N ộ i r ấ t lớn, n ê n ta k h ô n g t h ể điều tra hết được, mà chừn m ộ t tập hợp (chẳng h n 150 hộ) đ ể điểu tra Tập hợp chừn gừi m ộ t mẫu, số phẩn tử m ẫ u gừi là kích thước m ẫ u

Đ ị n h n g h í a Ì

a) Một tập hạp £ tập hợp tất đối tượng có chung tính chất dó mà dang quan tâm

(12)

b) Mỗi phàn tử tập hợp dưac gọi cá thể

c) Một biến lượng X (hay gọi dấu hiệu lượng) là ánh xạ từ tập hợp & lên trục số Dó p hép do xác định cá thề của <c

Tập hợp t ấ t số đo X t r ê n t ấ t cá t h ể & Hàm t h n h một tập hợp giá trị cùa X

ủ) Việc chọn từ tập hợp tập hợp gọi là phép láy mẫu. Tập hợp gọi là mẫu

Một nhiệm vụ quan t r ọ n g khoa học Thống kê xây dựng p h n g p h p cho phép ta r ú t

k ế t luận, lập dợ báo về toàn tập hợp chính dựa t r ê n t h n g t i n thu được mẫu. T h n h thử, vấn đè lấy m ẫ u vấn để r ấ t quan t r ọ n g r ấ t phong phú t r o n g Thống kê Tùy thuộc vào đạc đ i ể m tập hợp đ a n g xét m mẫu có t h ể chọn theo nhiễu p h n g p h p khác đ ể đ ả m bảo yêu cẩu vé t í n h đ i diện mẫu

Tầ nói r ằ n g m ộ t mẫu là ngấu nhiên phép lấy m ẫ u đó, m ỗ i phần t t ậ p hợp c h í n h đêu chọn cách độc lập có xác suất chộn n h Ngoài p h n g p h p lấy mẫu ngẫu nhiên, ta có p h n g p h p lấy mẫu khác chọn mẫu với xác suất k h ô n g đều, chọn m ẫ u theo n h ó m t r ộ i , mẫu chùm v.v Trong giáo t r ì n h c h ú n g ta xét mẫu ngẫu n h i ê n

§2 TRÌNH BÀY M Ộ T MAU

CÁC GIÁ T R Ị C Ủ A B I Ế N LƯỢNG

a) B ả n g p h â n b ố t h ự c n g h i ệ m

Thí dụ 1. Đ ể tìm h i ể u sản lượng giống lúa mới, người ta chọn ra 120 ruộng thí nghiệm có diện tích lha

đ ể gạt t h ghi l i sản lượng t n g Sản lượng

(13)

l m t r ò n tới tạ Biến lượng X sản lượng giống lúa t r ê n t h a ruộng Ì ha. Các sản lượng 120 ruộng t h í nghiệm nói t r ê n lập t h n h mẫu giá t r ị của X, hay đáy đủ "một m ẫ u rút từ tập hợp c h í n h giá t r ị của X"

Xem xét m ẫ u số liệu ta n h ậ n thấy

Có 10 đ t n ă n g suất 31 tạ

Có 20

Có 30

Có 15

Có 10

Có 10

Có 20

34 tạ

35 tạ

36 tạ

38 tạ

40 tạ

42 tạ

44 tạ

N h t r o n g mẫu s ố liệu t r ê n giá trị ta gặp 31, 34, 35, 36, 38, 40, 42, 44 Mỗi giá t r ị có số l n lập l i n o g ọ i là tần số giá t r ị ầ t r ì n h bày mẫu t r ê n d n g b ả n g sau gọi là bảng phân bố tần số

X 31 34 35 36 38 40 42 44 T n số 10 20 30 15 10 10 20

Bảng Ì

Đ ị n h n g h ĩ a Giả sử m ộ t mẫu kích thước n giá trị biến lượng X ni giá trị khác nhau xi < x2 < < X

Giả sử g i á t r ị X- có số l n lặp l i là r-. K h i ta gọi Tị tần

số của Xị bảng sau gọi là bảng phán bố tàn số :

X X1 x

2

T ầ n số r2

-Bảng

(14)

Đ ể có t h ể so s n h kết kích thước mẫu thay đ ổ i , ta nên xét t ầ n suất giá trị mẫu

Đ ị n h n g h í a Tần suất f giá trị Xị tỉ số tần số

rị uà kích thước mẫu n :

Bảng sau gọi bảng phân bố thục nghiệm b i ế n

lượng X :

X x \ H xn Tổng

T ầ n số r\ r2 rn 2rj = n

T ầ n suất f\ fl fn 2/-ị =

Bảng

Thí dụ 2. Bảng p h â n bố thực nghiệm biến lượng X (là số điểm môn Tốn kì t h i tú tài vừa qua) 400 t h í sinh cho bảng :

X (điểm thi) T ầ n số T ầ n suất

0 6/400 = 0,015

1 15 0,0375

2 43 0,1075

3 53 0,1325

4 85 0,2125

5 72 0,18

6 55 0,1375

7 33 0,0825

8 18 0,045

9 10 0,025

10 10 0,025

Tổng 400

Bảng

(15)

b) Bàng phàn bố ghép lớp

Trong t r n g hợp phải điều tra với mẫu kích thước lớn, biến lượng lấy nhiều giá trị khác song l i k h gần nhau, người ta thường xác định số khoảng C j , C2, c cho giá trị biến lượng thuộc vào m ộ t khoảng Các khoảng nàý lểp nên một phân hoạch miễn giá trị của X. Việc chia khoảng tùy cách chọn ta, có t h ể có n h i ề u cách chia khoảng Tuy nhiên nói chung k h n g n ê n có q u khoảng

Ngồi ra, độ rộng khoảng không t h i ế t phải mặc d ù t h ô n g thường người ta hay lấy khoảng có độ rộng b n g đ ể dễ so s n h

Thí dụ 3. Chiều cao 400 t r ì n h bày bảng p h â n bố g h é p lớp sau :

Khoảng T ầ n số T ầ n suất Độ rộng khoảng

4,5 - 9,5 18 0,045

9,5-11,5 58 0,145

11,5-13,5 62 0,155

13,5-16,5 72 0,18

16,5-19,5 57 0,1425

19,5-22,5 42 0,105

22,5-26,5 36 0,09

26,5-36,5 10 0,025 10

Tổng 400

Chú ý. Ta quy ước đ ẩ u m ú t bên phải khoảng thuộc khoảng m k h ô n g thuộc khoảng t í n h t ầ n số lớp

(16)

§3. B I Ể U D I Ễ N B Ằ N G B I Ể U Đ , T ổ C H Ứ C Đ

M ộ t câu ngạn ngữ Trung hoa nói :"Một hình ả n h có t c dụng n g h ì n l i nói" Đ ể có m ộ t hình ảnh rõ r n g dễ nhớ mẫu giá trị biến lượng X, n g i ta d ù n g đổ thị b i ể u đổ đ ể t h ể c h ú n g

Giả sậ ta có m ẫ u số l i ệ u (xộ t r ì n h bày t r o n g bảng p h â n bố thực nghiệm (bảng 3)

Xét t ậ p hợp G gồm đ i ể m có tọa độ (Xị, Tị) N ố i đ i ể m có tọa độ (Xị, 0) với đ i ể m có tọa độ ( x , T ị ) (ì = Ì , , m ) , ta có một biểu đồ tàn số hình gậy

N ế u ta n ố i đ i ể m (Xj, rộ với đ i ể m (Xị + Ị , r(- + j) = Ì, 2,

m - 1) b n g đ o n t h ẳ n g , ta có m ộ t biểu đồ da giác tăn số

T n g t ự , xét t ậ p hợp r gốm đ i ể m có tọa độ (Xị, fị). N ố i

đ i ể m có tọa độ (Xị , 0) với đ i ể m co' tọa độ (Xị, fị) (í = Ì, 2, m), ta m ộ t biểu đồ tàn suất hình gậy. N ố i đ i ể m (Xị, f ị ) với

đ i ể m( X ị + J , fị + j) (i = Ì, 2, m - 1) đoạn t h ẳ n g , ta có m ộ t biểu da giác tàn suất

Thí dụ 4. Vẽ b i ể u đổ đ a giác t ầ n suất biểu đổ t ầ n số hình gậy t ậ p số l i ệ u t r o n g thí dụ

Giải. Trước h ế t ta l ậ p bảng p h â n bố thực nghiệm :

X 31 34 35 36 38 40 42 44 T ầ n số 10 20 30 15 10 10 20

T ầ n suất 12

2 12

3 12

1

1 12

1 12

1 24

1

(17)

HO 25 20 15 10

31 34 13536 38 40 42 44 Biểu đồ tần sổ hình gậy

31 3 :Ỉ8 40 42 44 Biêu đò đa giác tần suất

m

Đối với bảng p h â n bố ghép lớp, n g i ta d ù n g t ổ chức đồ

(histogram) đ ể biểu diễn. Ta xét hai t r n g hợp :

1) Độ rộng khoảng bàng nhau. Trên m ỗ i khoảng ta dựng hình chữ nhật có chiều cao bủng t ấ n số (hay t ầ n suất) t n g ứng lớp Khi ta thu m ộ t tổ chức đô tần số (hay

(18)

tổ chức dô tăn suất ) Chú ý r n g tổ chức đổ t ầ n số v t ổ chức đổ t ẩ n suất t r ù n g tổ chức đổ t ầ n suất t r ê n trục t u n g ta chọn đơn vị dài gấp n l ẩ n t ổ chức đổ t ầ n số (n kích thước mẫu)

Thí dụ 5. Doanh thu 51 cửa hàng tổng công ty n ă m 1996 ghi (đơn vị triệu VN) :

120 197 121 129 114 95

88 109 147 118 148 128

71 93 67 62 57 103

135 97 166 83 114 66

156 88 64 49 l o i 79

120 75 113 155 48 104

112 79 87 88 141 55

123 152 60 83 144 84

95 90 27

a) L ậ p p h â n bố ghép lớp, sử dụng 8 khoằng với độ rộng 22

b) Vẽ t ổ chức đồ t ầ n suất

Giải. a) Số l i ệ u bé 27. Ta chia khoằng cho đ ấ u m ú t khoằng đ ầ u tiên 26,5, độ dài m ỗ i khoằng 22. Ta

có p h â n bố ghép lớp sau :

Khoằng T ầ n số Tẩn suất

26,5 - 48,5 0,04

48,5 - 70,5 0,16

70,5 - 92,5 12 0,24

92,5 - 114,5 12 0,24

114,5 - 136,5 0,16

136,5 - 158,5 0,14

158,5 - 180,5 0,02

180,5 - 202,5 0,02

Tổng 51

(19)

b) Tổ chức đổ t ẩ n suất sau

0,25 0,20 0,15 0,10 0,05 0

26,5 202,5

2) Độ r ộ n g khoảng k h ô n g n h ấ t t h i ế t :

Trên khoảng Cj có độ rộng lị ta dựng hình chữ n h ậ t cố

A r< ' "

chiếu cao yị = —ị- (đối với tổ chức đổ t ẩ n số)

Vi

hay yị = -ỳ (đối với t ổ chức đổ t ầ n suất)

ở A h ằ n g số d n g t ù y chọn (Ả chọn cho t ổ chức đồ t r ô n g dụ coi) N ế u ta chọn = Ì diện tích h ì n h chữ n h ậ t c h í n h t ầ n số khoảng

Thí dụ 6. Xét bảng p h â n bố ghép lớp thí dụ H ã y vẽ t ổ chức đổ t ấ n số với = Sử dụng tổ chức đồ n y đ ể ước lượng số có độ cao n ằ m khoảng (12 ; 25)

n

Giải. Từ c ô n g thức y>ị = Ỵ ta t í n h được chiếu cao ý- c c

hình chữ n h ậ t t r o n g t ổ chức đổ n h ư sau 0 ' '

(20)

Khoảng

ri ' i

y- -

4,5 - 9,5 18 5 3,6

9,5 - 11,5 58 2 29

11,5 - 13,5 62 2 31

13,5 - 16,5 72 3 24

16,5 - 19,5 57 3 19

19,5 - 22,5 42 3 14

22,5 - 26,5 36 4 9

26,5 - 36,5 55 10 5,5

Tổng 400

Tổ chức đồ tần số có dạng sau :

4,5 Et5U.5ia5 16.5 19,5 22,5

SỐ nằm khoảng (12 ; 25) diện tích tổ chức đổ giới hạn hai đường thẳng X = 12 và X = 25

(21)

D ễ d n g t í n h d i ệ n t í c h đ ó

(13,5 - 12).31 + 72 + 57 + 42 + (25 - 22,5).9 = 240 V ậ y c ó khoảng 240 c â y c ó chiều cao từ 12 đến 25 (ni)

§ C Á C G I Á T R Ị Đ Ặ C T R Ư N G C Ủ A M Ộ T M A U

Đ ể c ó t h ể c ô đọng v n h a n h c h ó n g n ắ m bắt t h ô n g tin quan t r ọ n g chứa đ ự n g mốu, ta đ a v i s ố gọi c ấ c số đặc trưng (hay giá trị đặc trưng) c ủ a m ố u

Có hai n h ó m lớn c c s ố đ ặ c t r n g

1) C c s ộ đ ặ c t r n g cho c h ú n g ta hỉnh ả n h về vị trí trung tâm mẫu, tức là v ề xu t h ế c c s ố l i ệ u m ố u tụ tập x u n g quanh n h ữ n g s ố n o đ ó Trong g i o t r ì n h n y ta s ẽ định nghĩa ba s ố đ ặ c t r n g thuộc loại n y : Đ ó trung bình

mẫu, trung vị (median) v mode

2) C c s ố đ ặ c t r n g cho c h ú n g ta h ì n h ảnh v é mức đ ộ p h â n t n c ủ a c c s ố l i ệ u , đ ộ biến động c ủ a c c số l i ệ u Trong g i o t r ì n h n y ta s ẽ đ ị n h nghĩa c c s ố đặc t r n g thuộc loại n y gồm : Biên độ, độ lệch trung bình, độ lệch tiêu chuẩn v phương sai

Cho m ố u c c g i trị c ủ a biến lượng X với kích t h c TI :

x2> xrJ

i) T V u n g b ì n h m ố u T r u n g b ì n h m ố u , kí h i ệ u X, t í n h theo c n g thức sau đ â y :

Ì " ; =

N ế u mốu c ó m giá trị k h c Xị < x2 < •••< xm v

g i trị Xị có t ầ n s ố Tị

(22)

N ế u ta có m ộ t bảng p h â n bó ghép lớp v i m khoảng C j , C2 ,

c t ầ n số c ù a khoảng c r, t h ì t r u n g b ì n h mẫu X t í n h theo c n g thức :

m

r i x i

i = Ì X =

m

í = Ì

t r o n g đó Xị t r u n g đ i ể m khoảng Cj

Thí dụ 7. T í n h chiều cao t r u n g bình 400 nêu t h í d ụ

Giải

Ta có

- = 18(7)+58(10,5)+ +55(31,5)

x - 400 ~ '

li) T r u n g v ị (Median). Trung vị m ộ t m ẫ u số l i ệ u , kí h i ệ u b i m, m ộ t số có t í n h c h ấ t sau : Số c c giá t r ị m ẫ u b é h n hay b ằ n g m t h ì b ằ n g số g i t r ị m ẫ u lớn hễn hay b ằ n g m

X é t t r ễ n g hợp c c giá t r ị m ẫ u p h â n biệt G i ả sử giá t r ị m ẫ u s p xếp theo t h ứ tự t ă n g d ầ n

X ị < x2 < < xn

K h i dễ t h ấ y n ế u n l ẻ t h ì m = xn + J N ế u n c h â n ta lấy

TO =

2

Trong t r ễ n g hợp giá t r ị có t ầ n số T ị , gọi à số bé

n

(23)

Thi dụ 8. Cho bảng p h â n bố t ầ n số biến lượng X n h sau :

X 10 l i

ri 15 43 53 85 72 55 33 18 10

(Kích thước mẫu TI = 400)

H ã y tính t r u n g b ì n h mẫu t r u n g vị

Giải. Trung bình m ẫ u

_ _ ^ ^ 0,(6) +1.(15)+••• +11.(3)

x ~ n ~ 400

= 4,645

Ta thấy số giá t r ị mẫu bé + 15 + + 43 + 53 = 114 < 200

và số g trị mẫu bé hay b n g

6 + 15 + 43 + 53 + 85 = 202 > 200

T h t h t h ta co' m =

Trong t r n g hợp m ẫ u cho d i d n g bảng p h â n bố g h é p lớp ta dinh n g h í a k h i n i ệ m t r u n g vị n h sau

G i ả ?ử ta có m khoảng với đ i ể m chia

aữ < O i < < am

C j = (aQ, a,) ; C2 = (a,, a2) Cm = (oOT _ J , am ), dó khoảng Cị có t ầ n số Tị ( r j + r2 + + rm = n)

K h o m g Ck gọi là khoảng trung vị n ế u k là số b é

n h ấ t Seo cho rx + r2 + + rk > —

Số trung vị /n số m t i đường t h ẳ n g X = m chia đôi d i ệ n tích tổ chức đổ t ầ n số Rõ r n g số t r u n g vị luôn n ằ m t r m g khoảng t r u n g vị

(24)

Thí dụ 9. Tìm khoảng trung vị số t r u n g vị bảng phân bố ghép lớp thí dụ

Giải : Ta có 18 + 58 + 62 = 138 < 200 ;

18 + 58 + 62 + 72 = 270 > 200

Vậy khoảng t r u n g vị (13,5 ; 16,5) Đ ể t í n h số t r u n g vị ta 72

nhận thấy : Chiều cao khoảng t r u n g vị n y — = 24 Ta phải chia h ì n h chữ n h ậ t dựng t r ê n khoảng n y t h n h hai phần có diện tích bên t r i 200 - 138 = 62

Ta phải có 24.(AO = 62 => AC = 2,583 Vậy số t r u n g vị

m = 13,5 + 2,583 = 16,083

24 • 62 10

A c B

13,5 16,083 16,5

iii) M o d e N ế u mẫu cho dạng bảng p h â n bố t ẩ n số t h i mode giá trị có t ầ n số cực đ i

Đối với trường hợp m ẫ u cho dạng bảng p h â n bố ghép lớp, người ta định nghĩa khoảng mode khoảng có chiều cao hình chữ nhật dựng t r ê n khoảng lớn đ ó

Mode tiêu t h n g ý t o n

về kinh t ế Chẳng hạn người b n giày muốn có m ộ t số lượng

h n g dự trữ đủ đ p ứng nhu cầu người mua phải ý đến cỡ giày m khách h n g thuồng hay hỏi mua

Thí dụ 10. Người k ế t o n cửa h n g giày ghi l i k ế t việc b n 200 đôi giày bảng sau (đơn vị nghìn đổng)

(25)

Giá bán Tần số ;*j Độ cao

y-30 - 40 12 1,2

40 - 50 37 3,7

50 - 55 22 4,4

55 - 60 35

60 - 65 37 7,4

65 - 70 16 3,2

70 - 80 10

80 - 90 21 2,1

9 - 1 20 0,5

Tổng 200

Hãy t ì m khoảng mode, khoảng t r u n g vị, số t r u n g vị giá t r ị t r u n g b ì n h doanh số

Giải. N h ì n vào bảng ta thấy khoảng (60 ; 65) có t ầ n số cao n h ấ t (37)

Vậy khoảng (60 ; 65) khoảng mode

Ta có :

12 + 37 + 22 < 100 < 12 + 37 + 22 + 35

do khoảng (55 ; 60) khoảng t r u n g vị -

Số t r u n g vị : 55 + — - j = 59,142

Trung bình mẫu X = 60,9. Bi

Bây ta t r ì n h bày giá trị đặc t r n g cho ta h ì n h ảnh

về p h â n t n giá t r ị mẫu

iv) B i ê n đ ộ H i ệ u số giá trị lớn giá trị bé n h ấ t mẫu gọi là biên độ m ẫ u

Các giá t r ị biên nhiễu t r n g hợp cho ta t h ô n g t i n quan trọng, n h n g có n h i ê u t o n giá trị biên "ngoại l ệ " , cho ta r ấ t t h n g t i n

(26)

v) Đ ộ l ệ c h t r u n g b ì n h Độ lệch trung binh, kí h i ệ u l M j đ ợ c đ ị n h n g h ĩ a b i c ô n g t h ứ c :

Ỵịxị -x\rt

ở đ ó X l t r u n g b ì n h m ẫ u , T j l t ẩ n số g i t r ị Xị. T r o n g t r n g h ợ p b ả n g p h â n b ố g h é p l p t h ì Xị t r u n g đ i ể m c ủ a k h o ả n g Cị , c ò n T ị l t ầ n s ố c ủ a k h o ả n g đ ó

Thí dụ l i T í n h đ ộ l ệ c h t r u n g b ì n h s ố l i ệ u cho t r o n g b ả n g p h â n b ố g h é p l p sau đ â y

Đ i ể m t h i T ẩ n số Trung đ i ể m \Xị - x \ ÌXị - x \ r t

0,5 - 30,5 15 82,8 248,4

30,5 - 60,5 45,5 52,8 475,2

60,5 - , 20 75,5 22,8 456

9 , - , 22 105,5 7,2 158,4

120,5-150,5 13 135,5 37,2 483,6

150,5-180,5 165,5 67,2 537,6

T ổ n g 75 2359,2

Giải

T r u n g b ì n h m ẫ u : X = 98,3

3 ( , ) + + ( , )

T đ ó M d = - ' 7 5 i ^ = 31,5 ì

v i ) P h n g s a i v đ ộ l ệ c h t i ê u c h u ẩ n Phương sai c ủ a m ẫ u số l i ệ u , k í h i ệ u l s2

, đ ợ c đ ị n h n g h ĩ a b i c ô n g t h ứ c :

3

= n - l

t r o n g đ ó X l t r u n g b ì n h m ẫ u

(27)

Đ ộ l ệ c h t i ê u c h u ẩ n , kí hiệu là s, định nghĩa can

bậc hai phương sai:

• V I ( * , - ĩ )2/ - , n - Ì

Trong t r n g hợp bảng phân bố g h é p lớp Xị đ i ể m khoảng Cị, /"ị t ẩ n số khoảng

Chú ý. Trong thực hành tính tốn ta thường dùng cơng thức sau :

V -Ì V ọ (2J C/r;')2

L{Xj - xỴĩị = Lxị r,

C ô n g thức cho phép ta t í n h s2 nhanh k h n g cẩn

d ù n g p h é p t í n h (Xị - X)2

Ta chứng minh cơng thức nói t r ê n T h ậ t vậy, ta có :

Z(x, - õcỹrị = Ỵípcị - 2xfc + x2)rị

- Zx? rị - Ĩ YsXfi + X2

= ILxfrj — 2ŨÕP- + nx2

= y 2 - 2 = y 2

' ' ' ' n

Thí dụ 12. Tính p h n g sai độ lệch t i ê u chuẩn độ cao 400 t h í d ụ

Giải Ta có đ i ể m khoảng t n số t n g ứng

Đ i ể m 10,5 12,5 15 18 21 24,5 31,5

T n số 18 58 62 72 57 42 36 55

Ta có Z^r,- = 7112,5

(28)

Lc?r,- = 146336,75

„ (Txr\2 7112 Ố2

x r . _ A L i - = 146336,75 ^ — = 19867,609

' I rỉ 4.(11)

, 19867,609

T h n h thử : s2 = = 49,793

s = V49/793 = 7,056

§5. P H Ầ N M Ề M T H Ố N G KÊ M I N I T A B

H i ệ n t i , nhiều t í n h t o n thống kê thực nhanh chóng dễ d n g nhờ trợ giúp p h ẩ n m é m thống kê chạy t r ê n máy vi t í n h

M ộ t phần m ề m thống kê sử dụng k h rộng rãi Minitab Trong t i ế t c h ú n g tơi t r ì n h bày cách ván t ắ t M i n i t a b Trong suốt s c h đ ố i với mấi nội dung cụ t h ể c h ú n g cho hướng dẫn chi t i ế t

về cách sử dụng M i n i t a b cho n ộ i dung

Cấu t r ú c Minitab k h đơn giản C h ú n g ta nhập số l i ệ u vào theo cột Các cột gọi tên l ẩ n lượt C l , C2, C3 vân vân

Đ ể nhập dãy số l i ệ u t h n h m ộ t cột đ ầ u t i ê n dấu n h c Minitab (MTB > ) ta gõ lệnh

MTB > SET C1

Máy tính dấu nhắe DATA, dấu nhắc ta đ a số l i ệ u vào, hai số l i ệ u có dấu cách Ngồi ta cịn có t h ế đ ặ t t ê n cho cột số liệu n h sau Chẳng hạn đ ặ t t ê n cột C l "age" ta gõ :

(29)

Thỉ dụ 13

M T B > NAME C1 'ARRIVALS' MTB > NAME C2 'DEPARTS' MTB > SET C1

DATA > 81.1 84.1 75.4 86.4 DATA > END

MTB > SET C2

DATA > 81.2 88.9 91.3 86.7 DATA > END

(Lưu ý từ E N D sử dụng ta kết thúc việc

nhập số liệu)

Đ ể tính giá trị trung bình C l ta cần gõ lệnh

MÉAN C1 dấu nhắc MTB >

Tương tổ để tìm độ lệch tiêu chuẩn ta gõ lệch

STDEV C1

Đ ể tìm median (trung vị) ta gõ lệnh

MEDIAN C1

Đ ể tìm tổng, giá trị lớn nhất, giá trị bé C l ta gõ các lệnh tương ứng

SUM C1

MAXIMUN C1 MINIMUM C1 Thí dụ 13

MTB > SET C1

DATA > 136 137 157 144 190 164 147

DATA > 136 163 148 174 211 169 148 184 DATA > 150 163 144 130 181 156 147

DATA > 170 148 182 159 140 137 122 DATA > END

(30)

MTB > NAME C1 'WEIGHT MTB > MEAN C1

MEAN = 156.50 MTB > MEDIAN C1 MEDIAN = 153.00 MTB > SUM C1 SUM = 4695.0

MTB > STDEV C1 STDEV = 19.84

MTB > MINIMUM C1 MINIMUM = 122.00 MTB > MAXIMUM C1 MAXIMUM = 211.00

T a l u l i s ố l i ệ u t r ê n l ệ n h S A V E ' W E I G H T ' v t h o t k h ỏ i Minitab l ệ n h S T O P

MTB > SAVE 'WEIGHT' " MTB > STOP

Ì V ẽ t ổ chức đồ t ầ n s ố cho bảng s ố l i ệ u s a u đ â y cho t a k ế t q u ả thi c ủ a m ộ t lớp :

BÀI T Ậ P

Đ i ể m T ẩ n số

0,5 - 20,5 2 , - 30,5 30,5 - 40,5 40,5 - 45,5 45,5 - 50,5 50,5 - 55,5 55,5 - 60,5 60,5 - 70,5 70,5 - 100,5

14 15 l i 18 14 10 16 24

(31)

S d ụ n g t ổ chức đồ n y ước lượng s ố thí s i n h c ó s ố đ i ể m n ằ m đ o n [43 ; 54]

2 V ẽ t ổ chức đổ t ầ n s ố cho b ả n g s ố l i ệ u sau đ â y (ghi lại c h i ề u cao c ủ a 125 c â y ) :

C h i ề u cao (em) T ẩ n số

49,5 - 79,5 18

79,5 - 109,5 24

109,5 - 129,5 23

129,5 - 149,5 33

149,5 - 179,5 27

3 S ố l i ệ u v ề t u ổ i c ủ a d â n cư v ù n g n o đ ó thống k ê n h s a u :

T u ổ i S ố người

05 - 9,5 440

9,5 - 19,5 480

19,5 - 34,5 630

34,5 - 54,5 440

54,5 - 79,5 150

H ã y v ẽ t ổ chức đồ t ầ n suất

4 S ố liệu v ề t u ổ i c ủ a d â n cư v ù n g n o đ ó cho bởi bảng s a u đ â y :

T u ổ i S ố người

0,5 - 3,5 54

3,5 - 23,5 180

23,5 - 38,5 291

38,5 - 48,5 315

48,5 - 58,5 360

58,5 - 73,5 384

73,5 - 88,5 90

(32)

Vẽ tổ chúc đổ t ẩ n suất So s n h cấu d â n cư v ù n g với cấu d â n cư t r o n g t ậ p

5 Cho bảng số liệu sau đ â y :

Khoảng T ấ n số

0 -

10 - 30 20

20 - 30 15

30 - 50 20

5 - 10

70 - 100

Tim t r u n g bình m ẫ u , khoảng mod số t r u n g vị Cho bảng số l i ệ u sau đ â y :

Khoảng T ầ n số

10 - 14

14 - 16 10

1 - l i

17 - 18 22

18 - 19 22

19 - 20 10

20 - 21 l i

21 - 22 21

22 - 23 44

23 - 24 34

24 - 30 10

i) Vẽ t ố chức đổ t ầ n số

li) Tính t r u n g bình m ẫ u , median khoảng mode

(33)

7 T í n h đ i ể m t h i t r u n g b ì n h 61 sinh viên từ bảng thống ké sau :

Đ i ể m T ấ n số

9,5 - 19,5

19,5 - 29,5

29,5 - 39,5 16

39,5 - 49,5

49,5 - 59,5 13

59,5 - 69,5 l i '

69,5 - 79,5

79,5 - 89,5

ổ i t r u n g bình 228 n g i t bảng

Tuổi T ẩ n số

16 - 19 10

19 - 22 13

22 - 25 22

25 - 28 38

28 - 31 35

31 - 34 37

34 - 37 28

37 - 40 20

40 - 43 18

43 - 46

(34)

9 Tính trung bình mâu độ lệch tiêu chuẩn từ bảng số liệu sau :

X 114 115 116 117 118 119

Tẩn số 21 57 I U 78 45 18

10. Tính t r u n g bình m ẫ u độ lệch tiêu chuẩn số l i ệ u sau: Khoảng l í T ầ n số

0 - 5

10 - 20 45 13

20 - 30 25" 24

30 - 40 35

40 - 50 <k r 40

50 - 60 36,

6 - 22

ÍT

7 - ÍT 16

80 - 90 u

Khoảng T ầ n số

10 - 15

15 - 20 21

20 - 25 38

25 - 30 46

30 - 35 50

35 - 40 54

40 - 45 18

45 - 50

(35)

Khoảng T ầ n số

0,5 - 3,5 24

3,5 - 6,5 22

6,5 - 9,5

9,5 - 12,5

12,5 - 15,5

15,5 - 18,5

18,5 - 21,5

ĐÁP SỐ VÀ C H Ỉ D Ấ N

1 Chiều cao h ì n h chữ n h ậ t t r o n g t ổ chức đồ : 0,67 0,9 1,5 2,2 3,6 2,8 2,0 1,6 0,8

Số t h í sinh : 35,8

2 Chiêu cao c c h ì n h chữ nhật :

0,6 0,8 1,15 1,65 0,9

3 Chiểu cao c c h ì n h chữ nhật :

0,021 0,022 0,02 0,01 0,003

4 Chiểu cao h ì n h chữ nhật l ầ n lượt :

0,008 0,005 0,012 0,019 0,022 0,015 0,004

N h ì n v o t ổ chức đổ d â n cư hai vùng, ta t h ấ y v ù n g t h ứ n h ấ t (bài t ậ p 3) d â n cư chủ y ế u niên, v ù n g t h ứ hai (bài t ậ p 4) có n h i ề u ngưi già

5 X = 35,5

Khoảng mode : (10 - 20) Số t r u n g vị : 29

(36)

6 ĩ = 20,57,

Khoảng mode : (22 - 23)

Số t r u n g vị : 21,4 48,11

8 30,8

9. X = 116,3727 ; s = 1,249

10. a) ĩ = 46,1 ; s = 19,2 b) X = 30,02 ; s = 7,872 c) X = ; s = 3,5365

(37)

Chương l i

ĐẠI CƯƠNG VỀ LÍ THUYẾT X Á C SUẤT

§1 B I Ế N C Ố N G Ấ U N H I Ê N VÀ XÁC S U Ấ T

Trong thực t ế ta luôn gặp tượng, hành động chịu tác động của yếu tố ngẫu nhiên, kết chúng không t h ể dự báo được, khơng thể nói trước cách chờn

Một hành động mà kết khơng thể dự báo trước

được gọi một phép thử ngẫu nhiên

Phép thử ngẫu nhiên thường kí hiệu chữ £ Các kết quả của ẽ không thể nói trước cách chắn, ta liệt kê tờt các kết £

Tập hợp tờt kết của t gọi là khơng gian

mẫu ta thường kí hiệu chữ Q

Chữ Cứ dùng để kí hiệu phần tử Q, ta gọi

phần tử của Q một biến cố sơ cấp

Một tập hợp con A của Q gọi là một biến cố. Mỗi kết quả co G A gọi một kết thuận lợi cho A

Khi kết phần tử của A có nghĩa A

xảy

Thí dụ 1. Phép thử s gieo đồng tiễn liên tiếp 3 lần Đồng

tiền ctí thể sờp (S) ngửa (N). Không gian mẫu Q của s

Q = ịSNN,NSN,SSN,NNN,SNS,NSS,SSS,NNS} Gọi A là biến cố : "Có hai lẩn tiễn mặt ngửa" ;

(38)

B biến cố :"SỐ l ầ n x u ấ t h i ệ n m ặ t ngửa m ộ t số l ẻ " K h i đó A = { SNN, NSN, NNS } ;

B = { SNS, SSN, NSS, NNN }

Biến cố không biến cố k h n g xảy Nó t n g ứ n g với t ậ p con <p của Q

Biến cố chấn b i ế n cố luôn xảy N ó t n g ứng với t o n tập Q

Đ ị n h n g h í a 1. Xác suất m ộ t biến cố số đo lường

k h ả n ă n g x u ấ t b i ế n cố Số đ ó ln ln n ằ m giợa Ì Xác suất b i ế n cố c n g n h ỏ ( c n g gần 0) t h ì biến

cố c n g k h ả n ă n g xảy Xác suất b i ế n cố c n g lớn ( c n g g ầ n 1) biến cố có n h i ễ u k h ả n ă n g xảy Xác suất b i ế n cố A kí h i ệ u l

Đ ị n h n g h ĩ a 2 (định nghĩa x c suất cố đ i ể n )

G i ả sử phép t h £ có m ộ t số hợu h n c c k ế t q u ả có t h ể Ngồi kết có k h ả n ă n g x u ấ t h i ệ n

K h i đó xác suất b i ế n cố A tỉ số giợa số k ế t q u ả t h u ậ n lợi cho A số k ế t có t h ể

N h vạy t r n g hợp n y ta có

™ - W

t r o n g | A | kí hiệu số p h ẩ n tử của A

Thí dụ 2. Trước cổng t r n g đ i học có q u n cơm bình d â n chất lượng ngang Ba sinh viên A, B, c độc lập với chọn ngẫu nhiên m ộ t q u n ă n đ ể ă n t r a T í n h xác suất biến cố sau :

a) Ba sinh viên vào c ù n g m ộ t q u n

b) H a i sinh viên vào c ù n g m ộ t q u n , n g i k i a t h ỉ vào q u n k h c

(39)

Giải Ta đánh số ba q u n cơm Ì, 2, Gọi a, b, c t n g ứng q u n cơm m sinh viên A, B, c chọn

N h k h ô n g gian mẫu Q tập hợp t ấ t ba (a, b, c) Ì « a í , Ì í í) í 3, Ì í c í

Rõ r n g | Q | = 33 = 27 Tầ có t h ể coi r ằ n g k ế t q u ả k h ả n ă n g

a) H i ể n nhiên có trường hợp thuận lợi ( Ì , Ì, 1) , (2, 2, 2) (3, 3, 3)

V ậ y

_ _3_ _ ì p ~ 27 ~ • b) Các t r n g hợp t h u ậ n lợi

( Ì , Ì, 2), ( Ì , 2, 1), (2, Ì, 1) ( Ì , Ì, 3), ( Ì , 3, 1), (3, Ì, 1) (2, 2, 1), (2, Ì, 2), ( Ì , 2, 2) (2, 2, 3), (2, 3, 2), (3, 2, 2)

(3, 3, 1), (3, Ì, 3), ( Ì , 3, 3) (3, 3, 2), (3, 2, 3), (2, 3, 3) Do xác suất cần t ì m

_ 18 _ p ~ 27 ~ '

77Ú đỊí 3. M ộ t công tv cẩn t u y ể n hai n h â n viên Có n g i nộp đơn có n nam Giả t h i ế t r ằ n g k h ả n n g t r ú n g tuyền người n h

a) Tính xác suất đ ể hai người t r ú n g t u y ể n đề u nam b) Tính x c suất đ ể hai n g i t r ú n g t u y ể n đ ể u n c) T í n h x c suất đ ể có n h ấ t Ì n t r ú n g t u y ể n

(40)

Giải. Số t r n g hợp có t h ể

cị =15 Các t r n g hợp k h ả n ă n g

a) Vì có t r n g hợp hai nam t r ú n g t r u y ề n xác suất cần t ì m p = — ~ 0,066

lo

b) Số cách chọn 2 nữ t r ú n g t u y ể n số 4 nữ là c | =

Vậy xác suất cẩn tìm

6

p = 15 = = °>4

-c) Chỉ có t r n g hợp hai nam t r ú n g t u y ể n n ê n t r o n g 14 trường hợp cịn l i ta đề u có Ì n ữ t r ú n g t u y ể n Vậy

p = li = 0,933 •

Đ ị n h n g h í a (Định nghĩa bựng t ầ n suất) N ế u số k ế t

quả có t h ể vơ hạn hữu hạn n h n g k h ô n g k h ả n ă n g , thỉ cách t í n h x c suất bựng định n g h í a k h ô n g d ù n g

Giả sử phép t h ẽ có t h ể thực h i ệ n l ặ p l i r ấ t n h i ễ u l ẩ n điều k i ệ n giống hệt N ế u TI l ấ n thực phép t h £ biến cố A suất hiện k l ầ n t h ì tỉ số

4( A ) =

được gọi là tần suất xuất A trong n p h é p thử Ngưòi ta nhận thấy r ự n g số p h é p t h ử n t ă n g vơ hạn t h ì t ầ n suất

f (A) dần t i m ộ t giới hạn xác định Giới hạn là xác suất A

§2. CÁC QUY T Ắ C TÍNH XÁC S U Ấ T

a) Quy t c c ộ n g

Hai biến cố A B gọi là xung khác với c h ú n g

k h ô n g xảy thời

(41)

Hợp hai biến cố A B biến cố xảy có m ộ t hai b i ế n cố A, B xảy ra. Ta kí hiệu hợp hai biến cố A B A u B

Quy tác cộng p h t b i ể u n h sau : Nếu A B xung khác thi : P(A u B) = P(A) + P(B)

hay d ễ nhớ

P(A hoặc B) = P(A) + P(S)

Trong t r u n g hợp tổng q u t , khi A B không xung khắc với ta có cơng thức sau

P(A hoặc B) = P(A) + P(B) - P(AB) t r o n g đó AB biến cố : B đồng thời xảy ra"

Thí dụ 4. Trong lớp hẫc gồm 100 sinh viên có 60 em t ỉ n h A 12 em tỉnh B. Chẫn ngẫu nhiên m ộ t em Tính xác suất đế em t ỉ n h A tỉnh B

Giải. Kí h i ệ u A biến cố : "Em tỉnh A" ; B biến cố : "Em đổ tỉnh B" Ta có

60

P(A) = ^ = 0,6 ;

P(3) = ^ = 0,12

Rõ r n g A £ xung khắc Vậy P(A u B) = P(A) + P(B) = = 0,6 + 012 = 0,72

Thí dụ 5. Trong lớp gồm 120 hẫc sinh có 60 em tham gia c â u lạc Tbán, 40 em tham gia câu lạc ngoại ngữ, 15 em tham gia hai Chẫn ngẫu nhiên m ộ t em

a) T í n h x c suất đ ể em tham gia câu lạc Tốn ngoại ngữ

b) T í n h x c suất đ ể em k h n g tham gia cầu lạc n o (Toán v ngoại ngữ)

(42)

Giải. a) Kí hiệu A biến cố : "Em tham gia c â u lạc Tốn" ; B biến cố :"Em tham gia câu lạc ngoại ngữ"

K h i đó AB biến cố : "Em tham gia hai câu lạc bộ"

V ậ y

P(A u B) = P(A) + PCB) - PCAB)

60 40 15 85

_ _1_ _ _ _ _ _ _ _ nno

120 120 120 120 '

b) Có 85 em tham gia n h ấ t m ộ t hai câu lạc bộ. V ậ y

có 120 - 85 = 35 em k h ô n g tham gia hai c â u lạc Do xác suất cẩn tìm

35 _

p=ũ = °'292

b) Quy tác chuyển qua biến c ố dối

Biến cố đối biến cố A, kí hiệu A, biến cố :"A

k h ô n g xảy ra"

Ta có cơng thức sau

P(A) = Ì - P(S)

hay P(S) = Ì - P(A)

Ý nghĩa cơng thức t r ê n : Trong n h i ề u t o n việc t í n h xác suất biến cố A k h ó n h i ề u so v i việc t í n h xác suất biến cố đ ố i A. K h i t í n h P(A) r i t t í n h P(A) = Ì - P(A)

Thi dụ 6. Chọn ngẫu n h i ê n n g i X, Y, z. T í n h xác suất

đ ể có hai n g u i có c ù n g ngậy sinh nhật

Giải. Gọi biến cố cần tìm là A. Việc t í n h trực t i ế p P(A) khó Ta chuyển qua t í n h VÍA), A b i ế n cố :

"Cả ba người đ ể u có ngày sinh n h ậ t k h c nhau" Kí hiệu X,

(43)

Không gian m ẫ u Q = {( X, y, z)} :

với Ì =s X, y, z sỉ 365

Ta có I Q I = 3653

D ễ t h ấ y số t r n g hợp t h u ậ n l ợ i (365) (364) (363)

Vậy

(365) (364) (363)

p

3653 (364) (363)

0,99ia

36Õ2 Vậy x c suất cần t ì m

Ì - 0,9918 = 0,0082

Rõ r n g x c suất r ấ t bé nên biến cố :"Có hai n g i n g i t r ù n g ngày sinh nhật" có r ấ t k h ả n ă n g xảy

Mở rộng lí l u ậ n này, t a có t h ể t ì m xác suất đ ể n g i chọn ngẫu n h i ê n có n h ấ t hai người t r ù n g ngày sinh n h ậ t

(365)(364)(363)(362) = 3654

Xác suất l n lên m ộ t c h ú t !

M ộ t cách t ổ n g q u t x c suất đ ể n h ó m k n g i chọn ngẫu n h i ê n có n h ấ t hai n g i t r ù n g ngày sinh

_ (365)(364) (365 -k + )

P k ~ 365*

Với k = 23 t h ì pk ~ 0,5 cịn khi k = 48 thì pk ~

c ) Quy t ắ c n h â n

H a i b i ế n cố A B gọi là độc lập với việc xảy hay k h ô n g xảy b i ế n cố không làm ảnh hưởng t i x c suất x u ấ t biến cố

(44)

Trong t r n g hợp ngược l i ta nói A B hai biến cố phụ thuộc

Quy t c n h â n p h t b i ể u n h sau :

N ế u A B độc lập t h ì

P(AB) = P(A).P(B)

hay

P(A và B) = P(A).P(S)

Thí dụ Ba x t h ủ A, B, c độc l ậ p với c ù n g n ổ s ú n g vào m ộ t mục tiêu Xác suất b ắ n t r ú n g x t h ủ A, B, c t n g ứng 0,4 ; 0,5 0,7

a) T í n h x c suất đ ể x t h ủ đề u bắn t r ú n g b) T í n h x c suất đ ể có n h ấ t Ì x t h ủ b n t r ú n g

Giải. a) Kí hiệu A, B, c b i ế n cố "Xạ t h ủ A bấn t r ú n g " , "Xạ t h ủ B bắn t r ú n g ", "Xạ t h ủ c bấn t r ú n g "

Theo g i ả t h i ế t A, B, c độc l ậ p V ậ y

P(A, B, c b n t r ú n g ) = P(ABC)= P(A) P(B) P(C) =

= (0,4) (0,5) (0,7) = 0,14

b) Ta chuyển qua b i ế n cố đ ố i B i ế n cố đ ố i b i ế n cố cởn t ì m :"Cả ba x t h ủ b n t r ợ t " Vậy

P(A, B, c đề u t r ợ t ) = P(ÃBC) =

P(Ã) P(B) P(C) = (0,6) (0,5) (0,3) = 0,09

T h n h t h x c suất cởn t ì m

p = Ì - 0,09 = 0,91

d) Biến c ố phụ thuộc v xác suất có diều kiện

G i ả sử r n g A B hai b i ế n cố phụ thuộc: Đ i ể u đđ có

nghĩa r ằ n g việc x ả y háy k h ô n g xảy biến cố A có ảnh hưởng t i xác suất xảy của B. Xác suất của B t í n h điều

(45)

k i ệ n b i ế t r ằ n g A đ ã xảy gọi là xác suất B với điêu kiện A kí h i ệ u là PịB/A)

Nói chung Y(BIA) * P(B)

Thỉ dụ 8. Chọn ngẫu n h i ê n m ộ t gia đình có ba T í n h x c suất đ ể gia đình n y có hai t r a i t h ô n g báo r n g :

a) Gia đ ì n h n y có n h ấ t Ì gái

b) Đứa gái

G i ả i Gọi B b i ế n cố :"Gia đ ì n h có t r a i " ;

A biến cố :"Gia đ ì n h đ ã có n h ấ t Ì gái"

Ta cần t í n h P ( / A )

Đ ầ u tiên ta h ã y t h t í n h P(JB) K h ô n g gian m ẫ u

Q = {TTT, TTG, TGT, TGG, GTT, GTG, GGT, GGG }

C c t r n g hợp t h u ậ n l ợ i cho B

B = {TTG, TGT, GTT}

Do đ ó P(B) = I = 0,375

N ế u biết r ằ n g A đ ã x ả y k h n g gian m ẫ u thu hẹp l i

{ TTG, TGT, TGG, GTT, GTG, GGT, GGG }

vỉ k h n g cịn k h ả n ă n g TTT

V ậ y P(B/A) = I = 0,4285

Trong t r n g hợp đ ã b i ế t r ằ n g đ a gia đình g ã i t h ì k h ô n g gian m ẫ u thu hẹp

{GTT, GTG, GGT, GGG }

và r õ r n g x c suất cần t ỉ m

p = \ = 0,25

(46)

Ta có cơng thức sau cho phép ta t í n h xác suất có điểu k i ệ n PlB/A) t h ô n g qua xác suất k h ô n g điêu k i ệ n

P(B/A) = - f ^ -

Thí dụ 9. Gieo thời hai xúc sắc cân đ ố i Tính xác suất đ ể t ổ n g số n ố t t r ê n hai 7, biết r ằ n g có m ặ t

Giải Ta g i ả i hai p h n g p h p

Cách Ì : Xét k h n g gian m ẫ u t h u gọn bao gồm t r n g hợp có n h ấ t m ộ t m ặ t Có l i trường hợp n h vỉy Đó

( Ì , 5), (2, 5), (3, 5), (4, 5), (5, 5), (6, 5) ,

(5, 1), (5, 2), (5, 5), (5, 4), (5, 6) Có hai t r n g hợp m tổng Vỉy

2

Cách : G i ả sử A : "ít n h ấ t có 5", cịn B :"Tổng số nốt t r ê n hai 7"

Ta có P(A) = Ì - P(Ã) = Ì - ( I )2 = ^

Đ ể t í n h P(AB), ta thấy k h ô n g gian mẫu gồm 36 kết có t h ể , t r o n g có k ế t t h u ỉ n lợi cho AB (2,5), (5, 2)

Vỉy p (AB) = ^

_ P(AB) l i

T h n h t h P(A/B) = % f = :3 = n e) Quy tác n h â n tổng quát

(47)

Tổng q u t với biến cố bất kì A, B, c ta có P(ABC) = Ĩ>(A).Ĩ>(B/A).V(C/AB)

Thí dụ 10. M ộ t t h ủ kho có c h ù m chìa khóa gồm bé ngồi giống hệt nhau, có hai mở cửa kho Anh ta t h ngẫu nhiên t n g chìa (chìa n o k h n g t r ú n g bỏ ra) Tính xác suất đ ể mở cửa lần thử t h ứ ba

Giải. Kí hiệu A, B, c biến cố sau :

A : "Không mở l ẩ n t h đầu" ;

B : "Không mở l ẩ n t h t h ứ hai" ; c : "Mở l ầ n t h t h ứ ba"

Ta. phải t ì m P(ABC) Ta có

P(ABC) = P(A).P(B/A).P(C/AB)

Rõ r n g P(A) = ị •

P(B/A) = I ;

và P(C/AB) = ị

Từ

7 P(ABC) = X

8 X

7 =

" f) Công thức xác suất dẩy đủ

Các b i ế n cố Bị, B2 , Bn gọi một hệ đày đủ biến cố c h ú n g đôi xung khắc với luôn xảy m ộ t m ộ t biến cố biến cố B p , Bn

Ta có c n g thức sau : N ế u {Bị, Bn } m ộ t h ệ đ ấ y đủ biến cố t h ì với m ọ i biến cố B ta có

n

P(B) = ỵ PiBỳPiB/Bi) i = ỉ

(48)

Đặc biệt j A , A Ị hệ đủ n ê n ta có P(B) = P(A) P(B/A) + P(Ã) P(B/Ã)

77Ú d ụ l i Trong m ộ t n h máy có ba p h â n xưởng A, B, c t n g ứ n g l m 25%, 35% 40% t ổ n g số sản phẩm n h m y B i ế t r ằ n g x c suất làm m ộ t sản phẩm hỏng p h â n xưởng A, B c t n g ứng 1% ; 2% 2,5% Chọn ngầu n h i ê n m ộ t sản p h ẩ m n h máy T í n h xác suất đ ể sản p h ẩ m hỏng

Giải. Kí h i ệ u A, B, c, D biến cố sau :

A : "Sản phẩm A sản x u ấ t ;

B : "Sản phẩm B sản x u ấ t ; c : "Sản phẩm c sản x u ấ t ;

D : "Sản phẩm sản phẩm hỏng"

Ta có A, B, c l ậ p t h n h m ộ t hệ đầy đủ v ố i P(A) = 0,25 , P(B) = 0,35 P(C) = 0,4

Áp dụng c ô n g thức xác suất đ ẩ y đủ ta có

P(Z» = P(A).P(Z)/A) + P(B).P(B/D) + P(C).P(C/D) =

= (0,25).(0,01) + (0,35).(0,02) + (0,4).(0,025) = 0,019

g) C ô n g t h ứ c Bayes

Cho Bị, B2 , , Bn m ộ t hệ đầy đủ b i ế n cố và A biến cố v i P(A) > K h i

P(Bk)P(A/Bk) ?(Bk/A) = p( ; ;

P(Bk)P(A/Bk)

46 ì PiBộPiAỈBù

(49)

N ó i r i ê n g v i B , B l m ộ t h ệ đ ấ y đ ủ n ê n t a c ó : P(B/A) = - j ™ * < * * )

P ( B ) P ( A / B ) + P ( B ) P ( A / B )

C c x c s u ấ t P ( B j ) , P(-Bn) đ ợ c g ọ i l c c xác suất Hên

nghiệm ; c c x c s u ấ t P ( B j / A ) , P(BJA) đ ợ c g ọ i c c xác suất hậu nghiệm, v ỉ c ô n g t h ứ c Bayes c ị n c ó t ê n gọi cơng

thức tính xác suất hậu nghiêm

Thí dụ 12. M ộ t x é t n g h i ệ m y học T v ề m ộ t b ệ n h A c ó t í n h c h ấ t sau :

i ) N ế u n g i đ ợ c x é t n g h i ệ m c ó b ệ n h A t h ì T cho k ế t q u ả d n g t i n h v i x c s u ấ t 0,92

i i ) N ế u n g i đ ợ c x é t n g h i ệ m k h ô n g c ó b ệ n h A t h ì T v ẫ n c ó t h ể cho k ế t q u ả d n g t í n h v i x c s u ấ t 0,04

G i ả s t ỉ l ệ m ắ c b ệ n h A l , % t r o n g t o n b ộ d â n số N ế u

m ộ t n g ò i c ó x é t n g h i ệ m T d n g t í n h t h ì x c s u ấ t đ ể n g i đ ó m c b ệ n h A l bao n h i ê u ?

Giải Tã C Ộ_ P ( A ) = , 0

P ( A ) = 0,999 ; Ĩ(T/A) = 0,92 v P ( T / Ã ) = 0,04

C h ú n g t a c ậ n t ì m p (A/T). Á p d ụ n g c ô n g t h ứ c Bayes t a c ó P ( A ) P ( T / A )

P(A/T) =

P(A)P(77A) + P ( A ) P ( T / A ) ( 0>0 ) ( 0>Ơ )

= 0,0225 (0,001).(0,92) + ( , 9 ) ( , )

Đ iề u đ ó có n g h ĩ a r ằ n g : T r o n g t ậ p h ợ p t ấ t c ả n h ữ n g n g i c ó p h ả n ứ n g T d n g t í n h , t h ì t ỉ l ệ c ó b ệ n h A l 2,25%

§3 Đ Ạ I LƯỢNG N G Ấ U N H I Ê N RÒI R Ạ C a) C c đ ị n h n g h ĩ a c

M ộ t đ i l ợ n g m g i t r ị n ó l n g ẫ u n h i ê n , k h ô n g d ự

đ o n t r c đ ợ c , đ ợ c g ọ i l m ộ t đại lượng ngẫu nhiệnịĐLNỸỈ)

hay biến ngẫu nhiên

(50)

M ộ t Đ L N N g ọ i l à rời rạc n ế u n ó n h ậ n m ộ t số h ữ u h n h o ặ c đế m đ ợ c c c g i t r ị c ó t h ể

T ậ p h ợ p c c g i t r ị c ó t h ể c ủ a Đ L N N r i r c X đ ợ c k í h i ệ u l à X(Q). N g o i v i ệ c m ô t ả t ậ p h ợ p X(Q), m ộ t t h ô n g t i n r ấ t q u a n t r ọ n g m t a c ấ n n ẫ m b t l c c x c s u ấ t đ ể X n h ậ n c c g i t r ị t r o n g X(Q) Phân bố xác suất c ủ a X l m ộ t b ả n g t r ê n đ ó t a g h i c c g i t r ị c ủ a X(£ì) v k è m t h e o m ỗ i g i t r ị l c c x c s u ấ t đ ể X n h ậ n g i t r ị đ ó N h v ậ y p h â n b ố x c s u ấ t c ủ a X sẽ l m ộ t b ả n g c ó d n g sau

X

x\

x2 xn

P(x) P\ Pl - Pn

trong đ ó Pi = pịx = X , Ị = P ( *f)

77Ú d ụ 23 C h ọ n n g ẫ u n h i ê n b a đ ứ a t r ẻ t m ộ t n h ó m g m b é t r a i v b é g i H ã y l ậ p p h â n b ố x c s u ấ t c ủ a số b é g i t r o n g n h ó m

Giải. G ọ i X l số b é g i Ta c ó X(Q) = { 0, Ì , 2, } N g o i r a

pịx= Ị =

120

C1

720 "

en 15

C1

10 ~

1/6

ĩ>ịx = Ị =

C1

C1

= 9/30 =

J _ 30

10

V ậ y p h â n b ố x c s u ấ t c ủ a s ố c c e m b é g i l

X

P(x) 1

P(x) P(x)

6 10 30

(51)

Cho Đ L N N rời rạc X với bảng p h â n bố xác suất

X

P(*) Pị p2 • Pn

K h i đó giá trị trung binh (hay ki vọng) của X kí hiệu là EX,

được định nghĩa

EX = ụ = X P( X j )

Phương sai J£ kí hiệu D Z , định nghĩa D X = ơ2 = Z(Xj - ^)2P(^i)

= I*?P(*,) - ^2

Cân bậc hai ỡ2 gọi là độ lệch tiêu chuẩn của X kí h i ệ u là

Thí dụ 14. Tìm kì vọng, p h n g sai độ lệch tiêu chuẩn Đ L N N X có bảng p h â n bố x c suất sau ;

X

P(x)

30

15 30

9

30

1 30

Giải Ta có

E Z - " = ° - ( ể) + 1- ( o) + 2' ( l ) + 3- ( ả ) = 1-2'

D*=»2 = ° ( ể ) + l ( ì ) + 2 ( ) + ( ả )

1,22 = - 1,44= 0,56 Độ lệch t i ê u chuẩn

ơ = ÍÕM = 0.74&

(52)

b) P h â n b ố nhị t h ứ c

Xét phép thử ngẫu nhiên s G i ả sử A biến cố liên quan t ố i s, nghĩa tùy theo k ế t q u ả của A có t h ể xảy hay không xảy Xác suất x u ấ t h i ệ n của A p

Bây phép t h £ t i ế n h n h l ặ p l i n l ầ n m ộ t cách độc lập Gọi X số l ầ n xảy biến cố A loạt n p h é p t h ử t này. Ta thấy X m ộ t ĐL N N r i rạc vỊi

X(Q) = {0, Ì, , n}

xác suất đ ể X = k, tức xác suất đ ể b i ế n cố x u ấ t h i ệ n k l ầ n k h ô n g x u ấ t h i ệ n n - k l ẩ n ,

pịx = k Ị = CỊý5k(l - p ) n ~ k

Tầ có định nghĩa sau :

Đ ị n h nghĩa 4. Đ L N N X gọi có p/iâ?i ị ố nhị thức với

tham số (n, p)

X (Q) = { 0,1, 2,

và P(Ã) = ĩịx = Ã Ị = ck/>k(l - p ) n _ k

Bảng sau gọi òảrcg phân bố nhị thức

X Ã

P(0) P ( l ) P(A) Pin)

trong P(A) = c£pk(l -/>)n~k

Giá t r ị trung bình độ lệch tiêu chuẩn của X t í n h theo công thức sau :

EJỈ = ụ — np ;

BX = ơ2 = Tip.(Ì - p )

77n d ụ i Trong t h n h phố 65% gia đình có t i v i m ẩ u Chọn ngẫu nhiên 12 gia đình gọi X số gia đình có t i v i mầu

a) Gọi tên p h â n bố xác suất của X

(53)

b) Tính x c suất đ ể có đ ú n g gia đình có t i v i m u

c) Tính x c suất đ ể có hai gia đỉnh có t i v i mấu d) Tìm giá trị t r u n g b ì n h độ lệch tiêu chuẩn của X

Giải. a) X có p h â n bố nhị thức với tham số re = 12, p — 0,65 b) p | x = Ị = P(5) = cf2(0,65)5(0,35)7 = 0,0591

c) p {X ỉ* 2 } = Ì - P(0) - P(l)

= Ì - (0,35)1 - C|2(0,65)(0,35)n = 0,999 d) = 12 (0,65) = 7,8 ;

ỡ = V12(0,65)(0,35) = 1,6522

Ta có t h ể dung M i n i t a b đ ể lập bảng p h â n bố nhị thức

Ta cần d ù n g lệnh MTB > PDF

SUBC > BIOMIAL n = pi =

Thí dụ 16

MTB > PDF

SUBC > BIOMIAL n = 10 p = 35 BIOMIAL WITH n = 10 p = 0.35

K P(X = K)

0 0.0135

1 0.0725

2 0.1757

3 0.2522

4 0.2377

5 0.1536

6 0.0689

7 0.0212

8 0.0043

9 0.0005

10 0.0000

(54)

c) P h â n b ố s i ê u bội. Xét tập hợp gồm N đối tượng có M đối tượng có t í n h chất A N - M đối tượng khơng có t í n h chất A. Chọn ngẫu nhiên n đ ố i tượng (Chọn k h n g hồn l i ) n í M. Gọi X số đối tượng chọn có tính chất A

Ta thấy X ĐLNN rời rạc với

X(ữ) = {0, Ì, 2, n)

Người ta chứng minh r n g

nk p n - k

(Ã = 0, Ì, 2, n)

K h i ta nói X có phân bố siêu bội với tham số (N, M,n)

Giá trị t r u n g bình độ lệch tiêu chuẩn ĐLNN X có p h â n b siêu bội t í n h n h sau :

M ĩ>x = LI = n-^ĩ

_ JL ị NM(N — M)(N - n)

N V N - l

Thí dụ 17. Trong 500 vé x số bán có 50 vé t r ú n g thưởng M ộ t người mua 20 vé Gọi X số vé t r ú n g thưởng

a) Gọi tên p h â n bố xác suất của X

b) Tính xác suất đ ể có đ ú n g vé t r ú n g

c) Tìm giá trị t r u n g bình độ lệch tiêu chuẩn của X Giải. a) X có p h â n bố siêu bội với

N = 500, M = 50 và n = 20 rĩ c\ĩ

^ ^

b) P{X = 3} = nao " « 0,194 U5 Õ

(55)

_ (20).(50) _

c ) = 500 = ;

(20).(50).(450).(480) s

ỡ " 500 i f 499

d ) P h â n b ố P o i s s o n

Ta n ó i r ằ n g Đ L N N X có phân bố Poisson với tham số Ằ, t r o n g đ ó > l m ộ t số d n g cho t r c , n ế u

X(Q) = { , Ì , 2, } v

ĩ{x = k) =e-l

G i t r ị t r u n g b ì n h v p h n g sai p h n b ố Poisson đề u b ằ n g

Thí dụ 18. M ộ t g a r a ô t ô n h ậ n t h ấ y r ằ n g số n g i đế n t h u ê ô t ô v o n g y t h ứ b ẩ y c u ố i t u ầ n l m ộ t Đ L N N X c ó p h â n b ố Poisson v i t h a m số Ả = G i ả sử g a r a c ó c h i ế c t H ã y t ì m x c s u ấ t đ ể :

a) T ấ t c ả , c h i ế c ô t ô đề u đưc t h u ê ; b) G a r a k h ô n g đ p ứ n g đ c y ê u c ầ u Giải

a) p j X 3= Ị = Ì - P Ị X sỉ Ị

= Ì - e~2Ị — + — + • — + — Ì

1 0! 0! 2! 3! ì

l í 81

= l - U + + + | = 0,143

e í J

b) P { X > } = Ì - P { X =s 4} = Ì - Ỉ>{X sỉ } - ?{X = } =

= 0,143 - e - ^ = 0,143 - ^ = 0,053 I

(56)

§4 ĐẠI LƯỢNG N G Ấ U N H I Ê N L I Ê N T Ụ C a) C c đ ị n h n g h í a b ả n

Một ĐLNN X gọi Đ L N N liên tục :

i) Tập hợp giá trị có t h ể của X lấp đầy m ộ t hay số khoảng t r ụ c số, chí l ấ p đ ẩ y t o n t r ụ c số

li) Xác suất đ ể X nhận m ộ t giá t r ị cụ t h ể n o ln ln 0, nghĩa với mọi số a : P{X = a} =

Như đ ố i với ĐLNN liên tục ta quan t m t i xác suất đ ể nhận giá trị k h o ả n g n o Xác suất

quyết định h m gọi là hàm mật dô xác suất của X

Đ ị n h n g h í a 5. H m số f(x) x c định t r ê n t o n t r ụ c số gọi là hàm mật dô Đ L N N liên tục X :

i) f(x) với mọi X

co

l i ) Ịf(x)dx = Ì ; — oo

ui) Với m ọ i a < b

b

p { a < X < b) = j' f(x)dx a

T h n h t h P { a < X < 6} c h í n h diện tích hỉnh thang cong giới h n đổ t h ị h m số y = fix) hai đường t h ẳ n g X = a, X = b

77777X P ! a <

• H È

X < b

0 a b

(57)

Giá trị trung bình hay ki uọng của X, kí hiệu là EX

định nghĩa sau :

X

•EX = ft = Ị xf(x)dx — oe

Phương sai của X, kí hiệu là ĐX, định nghĩa cồng thức : oe

BX = ỡ 2

= / (X - ụ)2

f(x)dx

— oe

= J x2

f(x)dx - ụ2 co

Căn bậc hai của õ2

, kí hiệu ơ, gọi là độ lệch tiêu chuẩn X Sau m ộ t số p h â n bố xác suất liên tục quan

t r ọ n g t h n g gặp t r o n g thống kê

b) P h â n b ố c h u ẩ n

Đ i lượng ngẫu n h i ê n z gọi là có phân bố chuẩn tắc h m m ậ t độ n ó

Đó đường cong đ ố i x ứ n g qua trục tung, có đ i ể m cực đ i t i X = Các đ i ể m uốn là X = ±

(58)

Hàm phàn bố c ủ a z , k í h i ệ u b i <t>(x), đ ợ c đ ị n h n g h ĩ a n h s a u : <t>(x) = P { Z < x}

N g i t a đ ã l ậ p b ả n g t í n h s ẵ n c c g i t r ị c ủ a h m <t>(x) v i

X > V i X < t a s d ụ n g c ô n g t h ứ c s a u <t>(- x) = Ì - 4>(z) ( X e m b ả n g ì )

C h ẳ n g h n <D(- , ) = Ì - * ( , )

= Ì - , = , C h o t r c s ố d n g a, < a <

Phân vị mức a c ủ a z, k í h i ệ u l z , l m ộ t s ố t h ỏ a m ã n đ ẳ n g t h ứ c p { z > z a ) = a «

* ( zơ) = P { z < z j = Ì - a

( K h i n i ệ m n y đ ợ c d ù n g n h i ễ u t r o n g c c c h n g s a u ) C h ẳ n g h n p h â n v ị m ứ c , % c ủ a z l Z Q = 1,96 v ì <D(1,96) = ,

Đ i l ợ n g n g ẫ u n h i ê n X đ ợ c g ọ i l có phân bố chuẩn với hai tham số n ơ2

n ế u Đ L N N z = —-0^- có p h â n b ố c h u ẩ n t c K í h i ệ u X ^ N i f i , ơ2

). N g i t a đ ã c h ứ n g m i n h r ằ n g (I

c h í n h l g i t r ị t r u n g b ì n h c ủ a X, c ò n c h í n h l đ ộ l ệ c h t i ê u c h u ẩ n c ủ a X

T a c ó t h ể t í n h c c x c s u ấ t l i ê n q u a n t i X b ằ n g c c h đ a n ó v ề m ộ t b i ế n c ố l i ê n q u a n t i z, r i t r a b ả n g C ụ t h ể

tị* <'} -'{^i* <

^}-, ^}-, ị a — ụ X —ụ b li

P Ị a < X < Ị = pỊV Ì

< V i

(59)

„ b — u ,

= p{ V 1 < 2 < i 4>

6 - / / V

a - / /

Thí dụ 19 C h o X l Đ L N N c ó p h n b ố c h u ẩ n v i ỊA = 0

v ỗ = 0 H ã y t í n h a ) V{X > 0 }

b) P U 0 < X < 2 0 }

a ) T ì m p h â n v ị m ứ c % c ủ a X

Giải a ) PịX > 0 } =

, , ^ 0 - 0 x

Ì - p X < 0 = l-<t>

2 0 = Ì - * ( , ) = Ì - , 3 = , 6

ì / 2 0 - 0x b) P Ị 0 < X < 2 0 Ị = *

/ 0 - 0 \ 2 0

2 0

c f ( , ) - * ( - )

= ( , ) - Ì + <t>(2) = , 6

c ) G ọ i a l p h â n v ị m ứ c 3% c ủ a X K h i đ ó

?{X > a} = , < = * P { X < a } = ,

a - 0 \ 2 0

/ a - 0

T đ ó = 1,881

= , = $ ( , 8 )

a = , 2 0

c) P h â n b ố S t u d e n t

Đ L N N T đ ợ c g ọ i l có phân bố Student với ri bậc tự (n l m ộ t s ố n g u y ê n d n g c h o t r d c ) n ế u h m m ậ t đ ộ c ủ a n ó c ó d n g

n+ Ì

t r o n g đ ó c l m ộ t h ằ n g s ố

(60)

Hàm mật độ p h â n bố Student h m đ ố i x ứ n g qua trục tung, có hình chng l ộ n ngược

Phân vị mức a, (0 < a < 1), p h â n bó Student T kí hiệu í , số d n g thỏa m ã n p h n g t r ì n h sau

Trong bảng cho ta giá trị t ứng với a = 0,05 ; 0,025 ; 0,01 0,005 bậc t ự t Ì đế n 30

Vai t r ò phân bố Student t h ể định lí sau :

Nếu z, Zj, Z2 Zn ĐLNN độc lập, có phân bố chuẩn tấc ĐLNN

có phân bố Student với n bậc tự

á) P h â n b ố X2 ( k h i b ì n h p h n g )

ĐLNN X gội có p h â n bố X2 (đổc "khi" bình phương) vối n bậc t ự h m m ậ t độ có dạng

0 X <

fix) = "-ụ -\ • _

Cx z e nếux > c số dương

Đổ thị của f(x) có dạng sau

z T =

0 ĩ:],

(61)

P h n vị mức a (0 < a < 1) phân bố ỵ2, kí hiệu là Ằị, số dương thỏa m ã n phương t r ì n h

pịx > xị Ị = a

Bảng cho ta giá trị với bậc tự từ Ì đế n 30 mức a k h c

Vai trò phân bố "khi binh phương" t h ể định lí sau :

Nếu Z j , Z2, , Zn ĐLNN dộc lập, có phân bổ chuẩn tấc

zỊ+zị + +zị

có phân bố ỵ} vói n bậc tự

e) P h â n b ố F i s h e r

Đ L N N F gọi có p h â n bố Fisher với (n, m) bậc tự

nếu h m m ậ t độ có dng

0 nếu X <

1

nếu X > [n +mx](n +m)/2

ở c là số dương

P h â n vị mức a(0 < a < 1), phân bố Fisher, kí hiệu là f , số d n g thỏa m ã n p h n g t r ì n h

P { F > f a ) =«

Bảng cho ta giá trị / với a = 0,05 a = 0,01 N g i ta chứng minh :

Nếu Xị, X2 , ••; Xn, Y v Y2, ••; Y m DLNN chuẩn tấc dộc lập tỉ số

= + / Y 2 + +Ỵ2t

Ti / m

sẽ có phán bố Fisher với bậc tự (n, m)

(62)

Vì n gọi bậc tự tử số còn ni gọi bậc tự mẫu sơ

§5 MỘT SỐ ĐỊNH LÍ QUAN TRỌNG DÙNG TRONG THONG KÊ

Định Ú 1. Cho XỊ, X-,, ĐLNN dộc lập cij, a-,, an là số thực Khi ta có

n n

e{ 2 a&\ = Ì "/-EX, i = Ì í = Ì

n

li ) D Ị l a ^ Ị = 2> a Y , i = Ì

Đặc biệt Xị, X,, Xn ĐLNN đc lập có

phân bố với giá trị trung bình là fi, phương sai là2 trung bình cng

X,+ +X„ n

1 là ĐLNN có giá trị trung bỉnh EX = Ịi phương sai —

Định lí 2 (Bát dằng thức (Chebyshev)

Cho X ĐLNN với giá trị trung bình ụ phương sai a2 Khi dó vói £ > ta có

P { l * - , l

>*}*Ệ-Đặc biệt : Nếu Xị, X2, ••• , Xn ĐLNN độc lập phần bố với kì vọng /Ù, phương sai ỡ2

p { | 2- „ l >t]t

(63)

Từ đ ó suy

Đ ị n h lí 3 (Luật số lớn)

Khi n —» 00 trung binh cộng n ĐLNN dộc lập

phân bố hội tụ tói f< theo xác suất theo nghía :

Vói £ > 0, ỗ > 0, n dù lớn | x — fi\ < E với xác suất lớn Ì - ỗ

Đ ị n h lí 4 (Luật số lớn)

Tần số f (A) biến cố A hội tụ vê xác suất P(A) theo xác suất n —* 00 theo nghĩa :

Với £ > 0, > 0 n dù lớn, \fn{A) - P(A)Ị < e với xác suất lớn hơn Ì -

Đ ị n h lí 5 (Định lí giới hạn trung tâm)

Giả sử Xị, X2, dãy DLNN độc lập phân bố với giá trị trung bình fi uà độ lẢch tiêu chuẩn õ

xỉ chuẩn ươi giá trị trung bình ỊẢ độ lẢch tiêu chuẩn -Ỵ=

Thí dụ 20. Trọng lượng t r u n g bỉnh nam giới nước 78,5 kg với độ lệch tiêu chuẩn 11,2 kg. Chọn ngẫu n h i ê n 20 n g i Gọi X t r ọ n g lượng t r u n g bỉnh 20 n g i n y T í n h x c suất đ ể X lớn 82 kg

Giải X có p h â n bố xấp xỉ chuẩn với giá trị t r u n g bình

X, + +x Khi trung bình cộng X =

n sẽ có phân bố xáp

78,5 độ lệch tiêu chuẩn 11,2 = 2,504 T :

V2Õ

= Ì - tu '82 - 78,5

(64)

Định lí giới hạn t r u n g t â m có nhiều áp d ụ n g toán thống kê mà ta thấy chương sau

Định lí (Xấp x i p h â n bố nhị thức b n g p h â n bố chuẩn)

Giả sử X ĐLNN rời rạc có phân bố nhị thức vói tham số n, p Khi dó X có phán bố xáp xỉ phân bố chuẩn vái giá trị trung binh ỊẤ ~ ĩtp vã dô lệch tiêu chuẩn õ = inp(l —p) vái diêu kiện

np 3= 5, n(l - p ) ^

Đ ể cho xấp xỉ xác (Vì ta xấp xỉ p h â n bố Đ L N N rời tạc bỊng p h â n bố Đ L N N Hên

tục), ta cần m ộ t hiệu chỉnh liên tục Cụ t h ể :

N ế u k số nguyên d n g

pỊx > k Ị - pịx > k + Ị ;

ĩ>ịkỊ < X < k2 I = Ỹịkx + ị < X < k2 - ;

P{ * * X í k 2 Ị - P | A , - « « S * 2 + | ;

ở X ĐLNN có phân bố chuẩn với giá trị trung bình ịi = np

và độ lệch tiêu chuẩn = \np(l—p)

Thí dụ 21. M ộ t điếu tra cho thấy 63,7% số dân vùng ham thích bóng đá Chọn ngẫu nhiên 300 người vùng ; tỉnh xác suất đ ể có số người ham thích bóng đá lớn hay bỊng 200 nhỏ hay bỊng 215

Giải. Gọi X số người ham thích bóng đá 300 người

X có p h â n bố nhị thức với n = 300, p = 0,637

(65)

Ta. np = 191,1 ^ 5, n(l - p ) = 108,9 2: 5, n ê n t a có t h ể sử d ụ n g đ ị n h lí G i sử X Đ L N N có p h â n b ố c h u ẩ n v i hai t h a m số /ít = np = 300.(0,637) = 191,1 v đ ộ l ệ c h t i ê u c h u ẩ n

ỡ = \lnp(l - p ) = V69,37 = 8,329

Ta có

p | 0 í X ^ 215 Ị = P | 9 , 5 < X < 215,5 Ị , - ,

8,329

— / = ( , ) - ( , )

/199,5 - 191,1 ) 8,329

0,4983 - 0,3438 = 0,1545

B Ả I T Ậ P

1 Gieo đ ổ n g t h i h a i x ú c sắc T í n h x c s u ấ t đ ể : a) T e n g số n ố t x u ấ t h i ệ n t r ê n h a i l

b) T e n g số n ố t x u ấ t h i ệ n t r ê n h a i l

c) Se n ố t x u ấ t h i ệ n t r ê n hai h n k é m n h a u

2 Một k h c h s ọ n c ó p h ị n g đ n Có lo k h c h đế n t h u ê p h ò n g , t r o n g đ ó c ó n a m v n ữ N g i q u ả n lí c h ọ n n g ẫ u n h i ê n n g i T í n h x c s u ấ t đ ể :

a) C ả n g i đề u n a m b) Co n a m v n ữ c) Cc n h ấ t n ữ

3 M ộ t : h i ế c h ộ p đ ự n g q u ả c ấ u t r n g , q u ả c ầ u đ ỏ v q u ả c ầ u đen C h ọ n n g ẫ u n h i ê n q u ả c ầ u T í n h x c s u ấ t đ ể ta c h ọ n đ ợ c q u ả t r ắ n g , q u ả đ ỏ v Ì q u ả đ e n

4 C ó ) t ấ m t h ẻ đ n h số t Ì đế n 30 C h ọ n n g ẫ u n h i ê n lo t ấ m '.hẻ T í n h x c s u ấ t đ ể :

a) T í t c ả 10 t ấ m t h ẻ đ ể u m a n g số c h ẵ n b) Có đ ú n g t ấ m t h ẻ chia h ế t cho

(66)

5 nước có 50 tỉnh, moi tỉnh có hai đ i b i ế t : quốc hội N g i ta chọn ngẫu nhiên 50 đ i b i ể u t r o n g số leo đ i b i ể u đ ể t h n h lập ủy ban Tính x c suất đ ể :

a) Trong ủy ban có Ì đ i b i ể u t h ủ đô

b) M ỗ i tỉnh đểu có đ ú n g Ì đ i b i ể u ủy ban

6 M ộ t đồn t u có toa đỗ s â n ga Có h n h k h c h từ s â n ga lên tàu, m ỗ i n g i độc lập với chọn ngẫu n h i ê n toa T í n h xác suất đ ể Ì toa có n g i , Ì toa có Ì n g i hai toa l i k h ô n g có

7. Trong m ộ t lớp học có b ó n g đ è n , b ó n g có xác suất bị cháy 0,25 Lớp học đủ n h s n g n ế u có n h ấ t b ó n g đèn s n g T í n h xác suất đ ể lớp học k h ô n g đủ n h s n g

8. M ộ t chuứng gà có m i Ì t r ố n g Chuứng gà có Ì mái trống Từ chuứng ta b ắ t ngẫu n h i ê n m ộ t làm t h ị t Các gà l i dứn vào chuứng thứ ba Từ chuứng t h ứ ba ta b ắ t ngẫu n h i ê n gà T í n h xác suất đ ể ta b t gà' trống

9 B i ế t r ằ n g n g i có n h ó m m u AB có t h ể n h ậ n m u m ộ t n g i thuộc n h ó m máu n o N ế u n g i thuộc n h ó m m u cịn l i (A, B 0) t h ể nhận m u n g i c ù n g n h ó m với m ì n h n g i có n h ó m m u o Cho biết tỉ l ệ n g i có n h ó m m u o, A, B v AB t n g ứng 33,7% ; 37,5% ; 20,9% 7,9%

a) Chọn ngẫu nhiên người cẩn t i ế p m u n g i cho m u Tính xác suất đ ể t r u y ề n m u thực h i ệ n b) Chọn ngẫu n h i ê n m ộ t người cần t i ế p m u , hai n g i

hiến m u Tính xác suất đ ể t r u y ề n m u thực h i ệ n

10. M ộ t kì thi gứm 45 câu hỏi, với m ỗ i câu h ỏ i thí sinh cần chọn câu t r ả lời kèm theo, t r o n g có câu t r ả lời đ ú n g M ộ t sinh viên h o n t o n k h ô n g

(67)

học thi chọn ngẫu nhiên câu đ ể trả lời Tính xác suất đ ể :

a) Sinh viên trả lời 16 câu hỏi b) Sinh viên trả lời câu

c) Sô câu trả lời nằm khoảng từ đến 12

ĐÁP SỠ VÀ CHÍ DÂN

1 a) ỉ

5

b) ế 2

o f

2 a) p = 2ĨÕ •

h) p =

c ) p = 42 •

20 3 a) ^

4 a) CĐ/C8 ô 0,0009

b) 0,130

5 a) p = Ì - CịJcỊữ00 = 0,742a

b) p = 25 / cfg0 « 4126.KT1

3

(68)

7. 0,1695

304

8. ~ 0,3619

9. a) 0,5737 b) 0,7777

10. a) 0,0717 ; b) 0,2737 ; c) 0,5681

(69)

Chương

ưỏc LƯỢNG THAM số

§1. c L Ư Ợ N G Đ I Ể M

a) K h i n i ệ m v ề c l ợ n g tham s ố

Xét m ộ t t ậ p hợp c h í n h Q g i ả sử ta quan t â m t i biến lượng X đo lường m ộ t dấu hiệu n o cá t h ể tập hợp

Về m ặ t Toán học, X coi ĐLNN (giá trị thay đ ổ i tạ cá t h ế đế n t h ể khác) P h â n bố x c suất

X t h n g r ấ t khó nắm bắt, t h ô n g thường ta giới hạn việc xác định m ộ t số tham số đặc t r n g của X giá trị t r u n g bình (kì vọng), p h n g sai, t r u n g vị (median), mode, momen, Các tham số n y k h ô n g t h ể xác định xác (nếu k h n g biết p h â n bố của X), m phải ưốc lượng tạ giá trị của X

t r ê n m ộ t m ẫ u chọn ngẫu n h i ê n N h t o n ước lượng tham số p h t b i ể u n h sau :

Giả sử X ĐLNN có tham số đặc t r n g (chưa biết) m ta đ a n g quan t â m V ấ n đề đ ặ t : Căn t r ê n n giá t r ị Xị, x2, ; X của X đo t r ê n mẫu kích thước Ti lấy tạ t ậ p hợp chính, cần tìm giá trị gần đ ú n g 8 của tì'

Đ ị n h n g h ĩ a Một hàm = Tn(xỊ , ,*„) n giá trị

Xị, x2, xn gọi ước lượng điểm cho

(70)

Sau đ ể cho gọn ta gọi tắt ước lượng điểm ước lượng Đ ể khảo s t vé m ặ t Toán học, ta coi (.tị, x2, •• , xn ) giá trị quan s t (hay giá t r ị thực nghiệm) vectơ ngẫu n h i ê n

(Xị , x2, xn), đó xv X2, Xn ĐLNN độc lập

có c ù n g p h â n bố với X

N h m ộ t ước lượng = Tn h m của n Đ L N N xv

X2, X'n Đ L N N Giá t r ị ước lượng

cũng thay đ ổ i t ấ m ẫ u quan s t t i mẫu quan s t k h c Việc lựa chọn m ộ t ước lượng "tốt" t r ê n t i ê u chuẩn

Định nghĩa

1) ước lượng Tn gọi ước lượng không chệch cho nối ETn = T í n h chất k h n g chệch có nghĩa ước lượng Tn k h ô n g có sai số h ệ thống

2) Ước lượng Tn gọi ước lượng vững vái £ > l i m p Ị| Tn - e\ < £Ị = Ì

n - » c o hay

MrãPịe - £ < r n < ỡ + £ | = l n - » ° °

T í n h chất vững đ ả m bảo cho ước lượng gần tùy ý v ố i xác suất cao k h i kích thước m ẫ u đủ lớn

3) Ước lượng Tn gọi hiệu Tn ước lượng không chệch phương sai DTn nhỏ lớp tát ước lượng không chệch

b) Ước lượng giá trị trung bình

Giả sử X Đ L N N với EX = ỊẰ (chưa biết). ịA gọi là giá trị trung bình t ậ p hợp

N ế u ta có m ộ t m ẫ u n giá trị xv x2, xn của X t r u n g bình m ẫ u

_ Xì+x2+ +xn X =

(71)

Đ ị n h lí Trung bình mẫu ước lượng khơng chệch

vững cho trung bình tập hạp

Chứng minh Ta X giá trị quan s t

X

x ì + x 2 + +xn

n

đó xv X2 , X là Đ L N N độc lập c ù n g p h â n bố với X

EXl+ +EXn n Ị l

Vậy EX = = ^ =

n n DX

DXì+ +DXn =

n2

n Theo bất đẳng thức Trêbưsep ta có :

DX DX

£2 ~ ne

Vậy l i m P ị X - fi\ > £

n—»00

0

Chú ý. N g i ta chứng minh r ằ n g t r u n g b ì n h m ẫ u ước lượng hiệu cho

c) Ước l ợ n g p h n g sai ơ2

G i ả sử X Đ L N N với DX = ỡ2

(chưa biết), ó2

gọi

phương sai c ù a tập hợp N ế u ta có m ộ t m ẫ u gồm n giả

trị quan s t của X : Xị, x2, ••; xn m ộ t cách hợp lí p h n g

sai m ẫ u c h a hiệu chỉnh

n

i = Ì

s2

n

T2

được xem x é t đ ể d ù n g làm ước lượng cho õz

. Tuy n h i ê n p h n g sai m ẫ u s2

ước lượng chệch Quả s2

giá t r ị quan s t Đ L N N

(72)

1 (*,-*)2

k = Ì TI Tn =

Đặt = xk - [i Ta

** - x = Yk + M - 2 (Yk + ụ)

k= Ì

Thành thử ỵ, (Xị - X)2 = ^ (yk ~ * )2

k = Ì k = Ì

= - 2nỹ2 + n ỹ2

= 2y£ - raF2

Chú ý : EYị = E(Zk - n)2 = DXị =1

EỸ2 = DỸ2 = -^(DY, + + ĐYn)

Ta có ÉT

k= Ì

= i Ị - nEY2 n - Ì

ơ 2 *

Từ (1) ta thấy xét

" ra - Ì

(73)

T h n h thử ta xét p h n g sai m â u _ - * )

~ n - Ì

t h i s2 ước lượng k h ô n g chệch cho Ớ1. Vậy ta có :

Đ ị n h lí Phương sai mẫu

Chú ý. N g i ta chứng m i n h s2, s2 đề u ước lượng vững cho ơ2

c) Ước l ợ n g g i t r ị c ủ a x c s u ấ t

G i ả sử c h ú n g ta quan t â m t i m ộ t đặc t í n h A m cá t h ể t ậ p hợp có t h ể mang k h n g mang đặc t í n h Gọi p tỉ l ệ cá t h ể có đặc t í n h A t r o n g t o n t ậ p hợp C h ú n g ta muẳn ước lượng p c ă n t r ê n việc khảo s t mẫu gồm n cá t h ể Chẳng h n n g i ta m u ẳ n biết tỉ l ệ cử t r i ủng hộ cho ứng cử viên A trước bầu cử tổng thẳng hay đ ể t h ă m dò t h ị t r n g , n h sản x u ấ t cẩn ước lượng tỉ l ệ khách h n g ưa thích m ặ t h n g A n o

Xét biến lượng X x c định n h sau : 2 = %*'~*)2

là ước lượng không chệch cho ỡ2

chính t ầ n suất x u ấ t h i ệ n đặc t í n h A t r o n g mẫu

(74)

Vì E X = p n ê n t h e o đ ị n h lí Ì , t ấ n s u ấ t l ước l ợ n g k h ô n g c h ệ c h v v ữ n g cho p

§ K H O Ả N G T I N C Ậ Y C H O K Ì V Ọ N G

Bài t o n t ì m khoảng t i n cậy đ ặ t n h sau : C ă n t r ê n m ẫ u quan s t (Xj, x2, * n ) , h ã y x c đ ị n h m ộ t k h o ả n g (a, b) đ ể k h o ả n g đ ó c h ứ a t h a m số 8 v i x c s u ấ t (ỉ cho t r c (/3 t h n g đ ợ c c h ọ n l 0,95 hay 0,99) M ộ t c c h c h í n h x c h n k h o ả n g t i n c ậ y đ ợ c đ ị n h n g h ĩ a n h sau :

Đ ị n h n g h í a K h o ả n g c ó h a i đ u m ú t a = a (Xị, xn) v

6 = (Xj , • ( p h ụ t h u ộ c v o n g i t r ị quan s t X j , xn của X) gọi l m ộ t k h o ả n g t i n c ậ y v i đ ộ t i n c ậ y /3 n ế u v i x c s u ấ t /3

t a c ó a sỉ < b

Chú ý : H a i đ u m ú t a, b c ủ a k h o ả n g l h a i Đ L N N C h ú n g l h m c ủ a x v X2 , ••; Xn v đ ó t h a y đ ổ i t m ẫ u n y s a n g

m ẫ u k h c N ế u k h o ả n g t i n c ậ y cố đ ộ t i n c ậ y /3 t h ì k h i l ặ p đ i l ặ p l i v i c c m ẫ u k h c n h a u c ó x ấ p x ỉ 100 fi% m ẫ u m đ ó k h o ả n g t i n c ậ y [a, b ] s ẽ p h ủ N ó i c h u n g t a k h ô n g c ó c c h g ì đ ể b i ế t đ ợ c m ộ t k h o ả n g cụ t h ể n o đ ó c ó c h ứ a hay k h ô n g

a ) P h n g s a i s d b i ế t

Đ ị n h lí G i ả sử X - N (ụ, á1) t r o n g đ ó á1 đ ã b i ế t V i đ ộ

t i n c ậ y /3 đ ã cho g i ả sử Up l g i t r ị t h ỏ a m ã n 0>o(Uịị) =

ở đ ó

l h m L a p l a c e

(75)

Khi khoảng -7= , X + li —=

là khoảng t i n cậy cho // với độ t i n cậy /ỉ, t r o n g :

- _ * 1 + X + - + X„

ri

x v x2, Xn quan s t độc lập vé X

Chứng minh. Dễ d n g k i ể m tra r ằ n g X có p h â n bố chuẩn với

•7- T Ơ 2

EX = ụ DX = ^

n

T h n h t h

Do

có phân bố chuẩn tắc N (0,1)

•~pịx - Un -Ẹ= < U < X + Uo -ặ= Đó đ iề u phải chứng minh

Chú ý. 1) Số za thỏa m ã n điều k i ệ n p | z > z a } = a

gọi là phân vị mức a phân bố chuẩn tắc z Ta. có t h ể k i ể m Ì - ấ

t r a dễ d n g r ằ n g Uạ phân vị mức —-— p h â n bố chuẩn

tắc Uạ = 2ỵ2> a = Ì - y3

2) Các giá trị t h ô n g dụng của :

N ế u /3 = 90% thỉ Up = 1,64

N ế u = 95% = 1,96

N ế u p = 98% thì Up = 2,33

N ế u /3 = 99% = 2,58

(76)

Ta minh họa định l i t r ê n thí dụ sau

Thỉ dụ Hãy t ì m khoảng t i n cậy cho chiểu cao t r u n g bình sinh viên dựa t r ê n m ộ t m ẫ u kích thước n = 36 với t r u n g bỉnh mẫu X = 66 inches ( Ì inches = 2,54 cm). Giả sử r ằ n g độ lệch tiêu chuẩn ỏ chiều cao n g i lớn inches

Giải Ta có = 3, n = 36, p = 95%, Up = 1,96 Vậy khoảng t i n cậy 95%

õ

x± uR-j= = 66 ± l , - f = r = 66 ± 1,96 (0,5) = 66 ± 0,98

V36 hay [65,02 ; 66,98]

Vậy với độ t i n cậy 95%, chiều cao t r u n g b ì n h n ằ m

65,02 66,98 (inches) I Thí dụ 2. Cũng câu h ỏ i n h t h í dụ t r ê n n h n g cẩn t ì m khoảng

t i n cậy có độ t i n cậy 99%

Giải Ta co' = , n = 36, p = 99%, = 2,58

Từ khoảng tin cậy 99% làx ± lip ự L = 66 ± 2,58(0,5)= 66 ± 1,29

hay 64,71 < fi < 67,29 •

So s n h hai thí dụ n y ta thấy :

Trên c ù n g kích thước m ẫ u , độ t i n cậy c n g lớn độ dài khoảng t i n cậy c n g l n

a) P h n g sai ớ1 c h a b i ế t , ri > 30

Trong nhiều t o n thực t ế , ta k h ô n g biết p h n g sai t ậ p hợp N ế u kích thước m ẫ u n > 30 ta có thê* xấp xỉ bởi s

K h i khoảng t i n cậy § sẽ

(77)

t r o n g t h n g M ộ t m â u ngầu n h i ê n gốm 59 sinh viên chọn k ế t n h sau :

14, 18, 22, 30, 36, 28, 42, 79, 36,

52, 15, 47, 95, 16, 27, n i , 37, 63, 127, 23, 31, 70, 27, l i , 30, 147, 72,

37, 25, 7, 33, 29, 35, , 48, 15,

29, 73, 26, 15, 26, , 57, 40, 18,

85, 28, 32, 22, 37, 60, , 35, 26,

20, 58, 33, 23, 35

H ã y x â y dựng khoảng t i n cậy 95% cho số t i ế n gọi điện thoại t r u n g b ì n h f j h n g t h n g m ộ t sinh viên

Giải. T số l i ệ u t r ê n ta có

n = 59 ; X = 41,05

s = 27,99 ;

s 27,99

do -p= = -i=- = 3,04 V59

TI = 59 > 30 n ê n t a có khoảng t i n cậy 95% cho [I l

X ± 1,96(3,64) = 41,05 ± 7,13

hay

33,92 sỉ ịi tí 48,18

c) P h n g sai õ2 c h a b i ế t , n < 30

Cơ sở cho việc x â y d ự n g khoảng t i n cậy cho trường hợp định lí sau

Đ ị n h lí 4. Giả sử X - N in, ỡ2), x v x2, Xn ĐLNN

độc lập, có phân bố với X Khi ĐLNN

(78)

2 (*,-*)2

i = Ì ờ dó

ra — Ì

sẽ có phản bố Student với n - Ì bậc tự

Dựa t r ê n định lí n y ta xây dựng khoảng t i n cậy p% n h sau : Đ ặ t a = Ì - p. T bảng p h â n bố Student n - Ì bậc tự ta có t h ể t ì m số t 12 thỏa m ã n

ở đó T Đ L N N có p h â n bố Student với n - ì bậc t ự Vì T

có p h â n bố đố i x ứ n g n ê n

(xem hình vẽ ì Bảng phân bố Student cho phụ lục (Bảng 2)

T h n h t h

a/2 ^ T Sỉ t 'all - a = / J

hay

(79)

2

Thí dụ 4. Đ ể x c đ ị n h t r ọ n g l ợ n g t r u n g b ì n h c c bao b ộ t m ì đ ợ c đ ó n g bao b ằ n g m y t ự đ ộ n g , n g i t a c h ọ n n g ẫ u n h i ê n 15 bao v t í n h đ ợ c X = 39,8 kg v s2

= 0,144

T ì m k h o ả n g t i n c ậ y cho t r ọ n g l ợ n g t r u n g b ì n h ,u c ủ a bao b ộ t v i đ ộ t i n c ậ y 9 %

Giải. Ta c ó a = Ì - 0,99 = 0,01 ; I = 0,005 T r a b ả n g p h â n b ố S t u d e n t v i 14 b ậ c t ự t a t ì m đ ợ c t — t 0 = 2,99

V ậ y k h o ả n g t i n c ậ y 99% c ủ a l

/

X ± t

s \ / ,

F= = 39,8 ± , 9 H =

-IV2J U ĩ ỗ

hay , sỉ sỉ , 7 I

Thí dụ 5. Đ ể c l ợ n g c h i ể u cao t r u n g b ì n h fi c ủ a t h a n h n i ê n t r o n g m ộ t v ù n g A n o đ ó , m ộ t m ẫ u n g ẫ u n h i ê n g m 16 t h a n h n i ê n đ ợ c c h ọ n C h i ề u cao c ủ a c c t h a n h n i ê n n y đ o đ ợ c n h sau ( đ n vị em) :

172, 173, 173, 174, 174, 175, 176, 166, 166, 167, 165, 173, , 170, , 170

H ã y t i m k h o ả n g t i n c ậ y cho fi v i đ ộ t i n c ậ y /ổ = 95% Giải. T c c s ô l i ệ u t r ê n t a t í n h đ ợ c

X = 171 ; s = , ;

a = 0,05 ; I = 0,025

T r a b n g p h â n b ố S t u d e n t v i 15 b ậ c t ự t a t ì m đ ợ c

t =

V = 2 ' 1 3 1

(80)

Vậy khoảng t i n cậy 95% chiều cao t r u n g bỉnh ỊẰ

X ± f f- j L Ì = 171 ± 2,131 I ' l ^ = 171 ± 1,885, hay

169, 115 $ ft $ 172,885 B

Chú thích : Phần m é m thống kê Minitab cho t a m ộ t cách nhanh c h ó n g khoảng t i n cậy cho giá t r ị t r u n g bình G i ả sử ta muốn t ì m khoảng t i n cậy 95% cho /Ả. Sau k h i đưa số l i ệ u vào cột C l ta cẩn đ n h lệnh

TINTEVAL 95 C1

_ - s

t r ê n m n h ì n h máy t i n h se ra X , s , - = khoảng t i n cậy

\n

m ta mong muốn

§3 K H O Ả N G T I N CẬY CHO T Ỉ L Ệ

Giả sử tập hợp chính, m ọ i cá t h ể có t h ể mang hay k h ô n g mang m ộ t đặc t í n h A n o Gọi p t ỉ l ệ cá t h ể có đặc t í n h A tồn t ậ p hợp chính (p chưa b i ế t ) N h n g h i ê n cứu muốn ước lượng tham số p t r ê n m ộ t mẫu đ iề u tra G i ả sử mẫu kích thước ri k cá t h ể mang đặc t í n h A

s k

C h ú n g ta thấy t ầ n suất m â u f = — m ộ t ước lượng k h ô n g chệch vững cho p. Bài t o n đ ặ t xây dựng khoảng t i n cậy cho p. Cơ sở t o n học cho việc xây dựng khoảng t i n cậy cho tỉ l ệ p (chưa biết) định lí sau

k

Đ ị n h l i 5. Tăn suất mẫu f = — DLNN có phân bố xáp xỉ chuẩn với kì vọng Ef — p phương sai

(81)

với diêu kiện ị '

Ì n

np >

(ì - p ) >

Vì ta k h n g b i ế t p ( c h ú n g t a đ a n g cố g ắ n g ước l ợ n g n ó !) n ê n t a k h ô n g b i ế t đ ợ c D f Tuy n h i ê n v i m ộ t số đ iề u k i ệ n t a c ó t h ể x ấ p xỉ p b i f N g h ĩ a l t a coi Df ~ — — Đ ể c ó t h ể d ù n g đ ợ c x ấ p xỉ n y t a c ầ n đ iề u k i ệ n sau đ â y :

nf > l o

71(1 - / ) > 10

( f - p ) ự - p ) f n

N h v ậ y Đ L N N Ỉ L ^ = V rỉ

sẽ có p h â n b ố x ấ p x ỉ p h â n b ố c h u ẩ n t ắ c N(0,l). T đ ó

V ậ y t a đ i đế n k ế t l u ậ n :

K h o ả n g t i n c ậ y cho t i l ệ p v i độ t i n cậy p l

TVÚ d ụ ọ T r c n g y b ầ u cử t ọ n g t h ố n g , m ộ t c u ộ c t h ă m d ò d l u ậ n đ ã đ ợ c t i ế n h n h N g i t a c h ọ n n g ẫ u n h i ê n 100 n g i đ ể h ỏ i ý k i ế n t h ì có 60 n g i n ó i r ằ n g h ọ bỏ p h i ế u cho ô n g

A. T ì m k h o ả n g t i n cậy cho t ỉ l ệ cử t r i b ỏ p h i ế u cho ô n g A v i đ ộ t i n c ậ y 90%

Giải. Tia có n = 100 ; k = 60 ;

- r - ế - ° *

(82)

Ta t h ấ y

nf = 100.(0,6) = 60 > 10 ;

ri.(ì - f ) = 100 (0,4) = 40 > 10

N h v ậ y f Bẽ có p h â n bố x ấ p x ỉ c h u ẩ n v i Ef — p v i đ ộ l ệ c h t i ê u c h u ẩ n l

. ^ Ĩ E ủ ^ f f i & m ^ 0 0,049

V i /3 = 90% t h ì Up = 1,64 V ậ y k h o ả n g t i n cậy cho p l

f ± 1,64.(0,049) = 0,60 ± 0,08 hay 0,52 < p < 0,68

N h v ậ y t a k ế t l u ậ n : V i đ ộ t i n c ậ y 90% ô n g A t h u đ ợ c t 52% t i 68% p h i ế u b ầ u N h v ậ y ô n g A s ẽ t h u đ ợ c í t n h ấ t 52% p h i ế u v đ ó t r ú n g cử K h ẳ n g đ ị n h n y c ó đ ộ t i n c ậ y l 90%

Thí dụ 7. T r o n g m ộ t m ẫ u n g ẫ u n h i ê n g ứ m 200 n g i d ù n g xe m y , có 162 n g i d ù n g xe 100 p h â n k h ố i t r l ê n T ì m k h o ả n g t i n cậy v i m ứ c t i n cậy 95% cho t ỉ l ệ n h ữ n g n g i d ù n g xe t r ê n

100 p h â n k h ố i

162

Giải Ta c ó n = 200 ; k = 162 ; k = ^ = 0,81

Ta t h ấ y

nf = 162.(0,81) = 131,22 > 10 ; v /1.(1 - f ) = 162.(0,19) = 30,48 > 10 ;

(83)

f ± Uị^ f^~^ = 0,81 ± (1,96) -ị

= 0,81 ± (1,96).(0,028) = 0,81 ± 0,055

hay 0,755 «: p =s 0,865

N ế u d i ễ n t ả p h ầ n t r ă m t h ì t ỉ l ệ p người d ù n g xe p h â n k h ố i lớn t r o n g khoảng t 75,5% đến 86,5%

Thi dụ 8. K i ể m t r a ngẫu n h i ê n 300 người ta thấy có người mắc bệnh A. Tìm khoảng t i n củy 98% cho tỉ l ệ p người mắc bệnh A t o n d â n số

6

Giải Ta TI = 300, k = , f = 3^0 = 0,02

nf = 300.(0,02) = < lo, n ê n điểu k i ệ n nêu không thỏa m ã n Vủy ta k h ô n g t h ể g i ả t h i ế t r ằ n g p h â n bố của f xấp xỉ chuẩn, cơng thức xây dựng khoảng t i n củy nêu không sử d ụ n g

Với độ t i n củy Ị3 đ ã cho, ta t h ấ y có m ố i quan hệ kích thước m ẫ u n độ dài khoảng t i n củy Kích thước mẫu c n g lớn t h ỉ khoảng t i n củy c n g hẹp, nghĩa độ xác ước lượng ta c n g cao, sai số ta c n g nhỏ Tuy nhiên kích thước m ẫ u c n g lớn địi h ỏ i n h nghiên cứu c n g nhiều

t h i gian, t i ề n c ô n g sức V ủ y toán đ ặ t : Cần chọn kích thước m ẫ u t ố i t h i ể u đ ể đ t độ xác mong muốn

a) Trường hợp ước l ợ n g cho t r u n g b ì n h Ị.I

Giả sử muốn có ước lượng /u với sai số không £ cho trước với độ t i n củy [i Ta biết r ằ n g với xác suất /3

§4 XÁC Đ Ị N H KÍCH THƯỚC MAU

\x-ụ\

PíK •

(84)

Vậy ta cần có bất đảng thức

hay n ^ ( )

Vậy n số nguyên dương nhỏ n h ấ t thỏa m ã n bất đẳng thức t r ê n (nếu biết)

Thí dụ B i ế t r ằ n g độ lệch tiêu chuẩn c h i ề u cao n g i lớn 3 inches, ta muốn xây dựng m ộ t khoảng t i n cậy 90% cho

chiều cao t r u n g bình n với sai số k h ô n g q u 9,5 inches. H ã y x c định kích thước mợu ri t ố i t h i ể u đ ể đ t yêu cầu t r ê n

Giải ỡ = 3, £ = 0,5,

= 90% và Up = 1,64

1 ầ c d : n > [ẨÌ|F]2 = 96>826

-Vậy n = 97. B

Công thức t r ê n áp dụng b i ế t N h n g t h ô n g t h n g Đ ể khắc phục đ iề u này, n g i ta thường lấy sơ mợu kích thước m > 30 đ ể t í n h X s

Sau c h ú n g ta d ù n g s làm ước lượng cho t r o n g cơng thức (1) nói t r ê n N h vậy n số nguyên d n g bé thỏa m ã n

/ í / «! \

£ (2)

n ĩ*

với điều kiện v ế phải không nhỏ 30

Ta minh họa quy t r ì n h t h í dụ sau

(85)

kích thước m ầ u t h i ể u bao n h i ê u đ ể đ t độ xác mức t i n cậy đ ã đ ặ t ?

Giải. Áp dụng công thức (2) cho ta

n [O^ly = (8 82)2 = 77>79

Vậy n = 78 B CTiú thích N ế u v ế p h ả i công thức (2) bé 30 cơng

thức xác định n nói t r ê n k h n g có giá trị

b) T r n g hợp ước l ợ n g cho tỉ l ệ

Theo định lí ta có

T h n h t h muốn cho sai số I f - p I í £ v ố i xác suất k h ô n g nhọ h n y3 ta cần có :

pa - p)

ỉ * uịp(l - p )

r í £

hay TI ỉ* (3)

ZL

N h ta cẩn l ấ y n số nguyên dương nhọ thọa m ã n (3)

Tuy n h i ê n giá t r ị p ta c h a biết nêu v ế phải chưa xác đ ị n h Có hai cách đ ể vượt qua t ì n h t r n g Cách t h ứ ta chọn sơ m ộ t m ầ u đ iều tra Dựa t r ê n mẫu ta t í n h t ẩ n suất f d ù n g f làm ước lượng ban đẩu cho p. Trong t r n g hợp n y bất đảng thức (3) trở t h n h

uỊqi-n

n ĩ* - (4)

e2 , \nf > 10

vối đ iề u k i ệ n p(1 _ n > (5)

Tầ lấy Ti số d n g bé thọa m ã n (4) (5)

(86)

Cách thứ hai dựa t r ê n nhận xét : Theo bất đảng thức Cauchy

p ( l - p) *

\-N h ta chọn n thỏa m ã n điều k i ệ n

n ỉ* -ậ- (6) t ấ t nhiên thỏa m ã n bất đẳng thức (3) Vậy ta lấy n

là số dương nhỏ thỏa m ã n (6)

Số TI tìm theo cách t h ứ hai nói chung lớn so với số n tìm theo cách t h ứ

Thí dụ li. Một n h n ô n g học muốn ước lượng tỉ l ệ nảy m ẩ m loầi hầt giống A với độ t i n cậy 90% với sai số k h ô n g 0,02 Cấn phải lấy m ẫ u với kích thước ?

Giải. Trước h ế t n h n ô n g học l ấ y m ộ t m ẫ u với kích thước

n = 1000 thấy có 640 hầt nẩy m ẩ m Khoảng t i n cậy dựa t r ê n mẫu điều t r a

f ±

UP V "V" = ) 4 ± M V 1000 = 0,64 ± 1,64.(0,0152)

= 0,64 ± 0,0249

Sai số 0,0249 l ổ n 0,02

Vậy ta cần lấy mẫu lớn N ế u theo cách thứ nhất, kích thước mẫu n phải thỏa m ã n (4) tức

^ ( , ) ^ , ) ^ ^ (0,02)2

Vậy n = 1550

(87)

N ế u ta sử dụng cách t h ứ hai, ta phải chọn n cho thỏa m ã n (6) hay n > ( ' ' j „ = 1681

4(0,02)2 Suy n = 1681

Chú ý r ằ n g nếu p k h gần 0,5 k h c cách t h ứ n h ấ t cách t h ứ hai không nhiêu l ắ m Tuy nhiên nếu p

k h g ầ n hay Ì t h ì sãi khác r ấ t lớn T h n h t h ta

cảm thấy tỉ l ệ p r ấ t bé r ấ t lớn thỉ nên sử dụng theo cách t h ứ n h ấ t : Trước h ế t lấy mợt mẫu điều tra đ ể sơ bợ ước lượng p

BÀI TẬP

1 M ợ t p h n g p h p đ i ể u t r ị đ a n g xem xét đ ể đ n h giá t í n h hiệu M ợ t tiêu đ n h giá số ngày t r u n g bình ụ t lúc điều trị cho đế n lúc bệnh n h â n khỏi bệnh M ợ t mẫu ngẫu n h i ê n gồm l i bệnh nhận theo dõi số ngày điều trị cho t i khỏi ghi l i sau : 4, 4, 3, 8, 5, 6,7, 12,5, 3,

Tìm khoảng t i n cậy 95%, cho số ngày t r u n g bỉnh ỊẢ

2 Tìm khoảng t i n cậy 90% , 95% 99% dựa t r ê n mẫu sau

a ) n = 100, X = 250, ÍT = 80

b) li = 64, X = 250 , S = 80

3 Trong mợt cuợc khảo s t 64 khách h n g mợt t i ệ m ăn nhanh, thời gian đợi t r u n g bình p h ú t đợ lệch tiêu chuẩn 1,5 p h ú t Tìm khoảng t i n cậy 98% cho thời gian đợi phục vụ t r u n g bình t i ệ m ăn

(88)

Tìm khoảng t i n cậy 99% cho số điếu thuốc h ú t trung bình t r o n g Ì t u ấ n n g i nghiện thuốc

5 M ộ t nghiên cứu t r ê n 50 em bé tuổi cho thấy số xem ti vi t r u n g bình m ộ t tuấn nhóm 38 với độ lệch tiêu chuẩn 6,4 Tìm khoảng t i n cậy 99% cho thời gian xem t i v i t r u n g bình tuấn em nhỏ t u ổ i

6 M ộ t công t i lớn muốn ước lượng t r u n g bình m ộ t ngày t h kí p h ả i đ n h m y trang giấy M ộ t mẫu gồm 50 t h kí dược chởn ngẫu n h i ê n cho thấy số t r a n g trung bình m hở đ n h m y 32 với độ lệch tiêu chuẩn Tìm khoảng t i n cậy 99% cho số trang t r u n g bình m t h kí cơng t i đ n h m y ngày

7. T ì m khoảng t i n cậy 90%, 95% 99% dựa t r ê n mẫu sau :

a) TI = 9, X = 300, s = 120 ;

b ) TI = 18, ã = 300, s = 120

8 M ộ t n h sưu t ậ p tem khảo giá tem A t r o n g cửa h n g t h ì thấy giá t r u n g bình 17 $ với độ lệch tiêu chuẩn $ T ì m khoảng t i n cậy 90% cho giá t r u n g bình tem n y t r o n g t ấ t cửa h n g b n tem

9. Chởn ngẫu n h i ê n 12 lốp t r u n g hởc t h n h phố A ta t í n h số hởc sinh t r u n g bình m ộ t lớp 28 với độ lệch tiêu chuẩn là 5. T ì m khoảng t i n cậy 99% cho số hởc sinh t r u n g bình t r o n g m ộ t lớp v ù n g

10. Khảo s t 18 g i m đốc công t i M ỹ cho t h ấ y lương t r u n g bình h n g n ă m hở 275 000 USD với độ lệch tiêu chuẩn 62 000 USD T i m khoảng t i n cậy 90% cho mức lương t r u n g b ì n h h n g n ă m giám đốc công M ỹ

(89)

sau : 138, 149, 129, 135, 145, 125, 139, 142 (Đơn vị n g h ì n đổng) Tìm khoảng t i n cậy 90% cho giá đĩa CD 12. Tim khoảng t i n cậy 90% , 957, và 997o cho tỉ l ệ p dựa

t r ê n m ẫ u sau

a) n = 100, k = 25 ;

b) n = 150, k = 50

13. Trong m ộ t t h ă m dò ý k i ế n 100 k h c h h n g , n g i ta thấy 55 n g i thích m ặ t h n g A h n m ặ t h n g B. T i m khoảng t i n cậy 90% cho tỉ l ệ người tiêu d ù n g ưa thích m ặ t h n g A

14. Cơ quan cảnh s t giao t h ô n g k i ể m t r a h ệ thống phanh 40 xe t ả i t r ê n đường quốc l ộ H ọ p h t h i ệ n 14 có phanh c h a đ ả m bảo an t o n

a) Tìm khoảng t i n cậy 95% cho tỉ l ệ xe t ả i có phanh c h a an t o n

b) Tìm khoảng t i n cậy 98% cho tỉ l ệ xe t ả i có phanh t ố t

15. Chọn ngẫu n h i ê n 200 sinh viên ta thấy 37% em k h ô n g nội t r ú

Tìm khoảng t i n cậy 90% cho tỉ l ệ sinh viên ngoại t r ú

16. M ộ t đ i ể u tra cho thấy 2074 gia đình t r í thức có 373 gia đ ì n h có máy vi t í n h n h T ì m khoảng t i n cậy 96% cho t i l ệ gia đình trí thức có m y vi t í n h t i n h

17. Người ta muốn tìm khoảng t i n cậy 90% cho đ i ể m t h i t ố t nghiệp phổ t h ô n g sở với độ c h í n h xác 0,2 M ộ t mẫu đ iều tra sơ cho thấy s = 1,2 Tìm kích thước m ẫ u n

18. N g i ta m u ố n tìm khoảng t i n cậy 95% cho t ỉ l ệ n h ữ n g gia đ ì n h có m y g i ặ t với độ xác 0,04 M ộ t m ẫ u đ iề u t r a sơ cho thấy f = 0,72 Tìm kích thước m ẫ u n

(90)

ĐÁP SỐ VÀ C H Ỉ D Ẫ N

1 [4,095 ; 7,723]

2 a) Mức 90% [236,88 ; 263,12] Mức 95% [234,32 ; 265,68] Mức 99% [229,36 ; 270,64] b) Mức 90% [236,6 366,4] ;

Mức 95% [230,4 269,6] ;

Mức 99% [242,2 275,8],

3 [2,563 ; 3,437],

4 [83,1 ; 110,9], [35,65 ; 40,35]

6 [30,61 ; 33,39],

7 a) Mức 90% [225,6 374,4] ; Mức 95% [207,76 ; 392,24]

Mức 99% [165,8 434,2] b) Mức 90% [250,79, 349,21]

•Mức 95% [240,33 ; 359,67] Mức 99% [218,04 ; 381,96]

8 [15,14 ; 18,86]

9 [23,53 ; 32,47]

10. [242190 ; 307810]

l i [132,4 ; 143,1]

(91)

Mức 95% : [ Ì , Hí ; 24,97,] ; Mức 99% : [13,55% ; 36,45%]

13. [46,8% ; 63,2%]

14. a) [17,5% ; 52,5%] b) [47,5% ; 82,5%]

15. [31,4% ; 42,6%]

16. [16,3% ; 19,7%]

17. 97

(92)

Chương IV

K I Ể M ĐIỂM G I Ả T H I Ế T T H O N G K Ê

§ N G U Y Ê N L Í C H Ư N G

Trong c h n g c h ú n g ta đế cập đế n m ộ t v ấ n để quan t r ọ n g Thống kê : Đó vấn để k i ể m định g i ả t h i ế t thống kê N ộ i dung t o n n y n h sau

C ă n t r ê n số liệu thu được, cho m ộ t k ế t l u ậ n

m ộ t g i ả t h i ế t thống kê m ta đ a n g quan t â m

M ộ t g i ả t h i ế t thống kê giả t h i ế t vẽ p h â n bố t ậ p hợp c h í n h đ a n g xét

N ế u phần bố đặc t r n g tham số (như giá t r ị t r u n g bình, p h n g sai, ), thỉ g i ả t h i ế t thống kê giả t h i ế t v ề tham số p h â n bố Thí g i ả t h i ế t thống kê :

a) Tập hợp cố p h â n bố chuẩn với kì vọng b) P h n g p h p điểu trị A chữa khỏi 90% bệnh n h â n

c) Tuổi t h ọ t r u n g bình hai loại bóng đèn A B n h

T trở giả t h i ế t h i ế u m ộ t giả t h i ế t

thống kê M ộ t quy tắc hay m ộ t t h ủ tữc định dẫn t i việc b c bỏ hay chấp nhận giả t h i ế t đ ã nêu gọi k i ế m định (test) thống kê

(93)

ngờ muốn bác bỏ Ngoài giả t h i ế t H ra, ta phải định rõ giả thiết cạnh tranh với H (còn gọi là dối thiết). Đôi t h i ế t

được kí hiệu là Hy Hị sẽ chấp nhận khi H bị bác bỏ Cáu hòi đặt : C h ú n g ta bác bỏ hay chấp nhận m ộ i giả

t h i ế t b n g cách ? Các n h thống kê trí với nguyên lí sau :

"Nếu biển cố có xác suất nhị phép thủ hay vài phép thủ, biến cố không xảy ra"

Như c h ú n g ta định bác bỏ giả t h i ế t Hc x c

suất xuất kiện quan s t được, t í n h t r o n g đ i ầ u k i ệ n giả t h i ế t H đúng, "nhỏ"

Các thí dụ sau đế minh họa ý

Thí dụ 1. Gieo t i ề n 100 l ầ n ta thấy x u ấ t h i ệ n m ặ t sấp 60 l ầ n ầ nghi ngờ r ằ n g xác suất x u ấ t m ặ t sấp lớn xác suất x u ấ t m ặ t ngửa Gọi p xác suất xuất

Ì

m ặ t sấp N h g i ả t h i ế t H) p = — đ ố i t h i ế t Hị

p > — Ta tính xác suất đ ầ 100 l ẩ n gieo xuất n h ấ t 60 l ấ n sấp Sử dụng định lí giới hạn t r u n g t â m ta t í n h xác suất n y 0,0287 Đó xác suất nhỏ ta bác bỏ Ha chấp nhận Hy

Thí dụ 2. M ọ i nghiên cứu M ỹ cho biết t r ẻ em M ỹ t u ổ i đến t r n g tiêu thu t r u n g bình 19,4 OZ sữa Ì n g y (OZ :

chữ v i ế t t t của ounce đơn vị đo lường Anh : Ì OZ =28,35 g)

Trong m ẫ u ngẫu nhiên gồm 140 t r ẻ em n g i ta t í n h lượng sữa t r u n g bình c h ú n g uống 18,5 OZ với độ lệch tiêu chuẩn 6,8 OZ. Điều có cho phép ta kết l u ậ n lượng sữa tiêu t h ụ 19,4 OZ hay khơng ?

(94)

Giải. Gọi ft lượng sữa tiêu thụ t r u n g bình t r o n g ngày N h g i ả t h i ế t ỈI, : // = 19,4 đ ố i t h i ế t H J là ự < 19,4 Giả sử H đ ú n g Ta. tính xem xác suất đ ể t r u n g binh mẫu X bé hay 18,5 bao n h i ê u ?

X có p h â n bố chuẩn (hoặc xấp xỉ chuẩn) vắi kì vọng 19,4 s 6,8

và đô lếch tiêu chuẩn -== = , = 0,575

- ' , , , - , ,

Vậy v ị x * 18,5 Ị = p j z < ^ Ị

= P{ z < - 1,57 } =

0,0582-Xác suất khơng nhỏ l ắ m (nói chung x c suất phải b é 0,05 mắi coi nhỏ) Vì ta c h a có đủ sở đ ể bác bỏ g i ả t h i ế t H Nói cách k h c số l i ệ u có c h a đủ sức đê*

t h u y ế t phục ta lượng sữa tiêu t h ụ 19,4 OZ

Trong đưa định t ì n h t n g tự n h t r ê n , phải lựa chọn hai g i ả t h i ế t H Hy, ta có t h ể phạm hai loại sai l ầ m :

1 B c bỏ H thực H đ ú n g

2 Chấp nhận H thực H sai

Sai l ầ m t r o n g trường hợp Ì gọi là sai lầm loại 1. Sai l ầ m t r o n g t r n g hợp t h ứ hai gọi là sai lầm loại

k h ả n ă n g t h ể xảy t h ể h i ệ n t r o n g bảng dưắi

^ ^ ^ ^ ^ K ế t luận

Thực t e ^ - - ^ ^ ^ Chấp nhận H Bác bỏ HQ nhận H j

Ha đ ú n g K ế t luận đ ú n g Sai l ầ m loại

Ha sai Sai l ầ m loại K ế t luận đ ú n g

(95)

Sai l ầ m loại Ì t n g tự n h sai l ầ m quan tòa K h i "kết n nham n g i vô t ộ i , cịn sai l ấ m loại t n g t ự n h sai l ầ m "tha bổng kẻ có t ộ i "

Một k i ể m định thống kê lí t n g k i ể m định làm cực t i ể u sai l ấ m loại Ì sai l ầ m loại Tiếc thay k h ô n g t ổ n t i m ộ t k i ể m định lí t n g n h N ế u c h ú n g ta l m giảm sai l ầ m loại Ì l m t ă n g sai l ầ m loại ngược l i

Trong m ộ t xã h ộ i v ã n minh, n g i ta có xu h n g thừa nhận r ằ n g việc kết án n h ầ m n g i vô t ộ i sai l ẩ m n g h i ê m t r ọ n g nhiều so với sai l ầ m tha bống kẻ có t ộ i Trong t o n k i ể m định g i ả t h i ế t Ta coi sai l ầ m loại Ì n g h i ê m t r ọ n g sai l ầ m loại T h n h t h người ta cố định trước x c suất mắc sai l ầ m loại Xác suất việc mắc sai l ầ m l o i Ì cịn gọi là mức ý nghía, kí hiệu là a. X c suất sai l ẩ m loại kí h i ệ u /3 Con số Ì - /3 gọi là lực lượng k i ể m định Lực lượng k i ể m định xác suất bác bỏ H^ k h i

Ha sai T h ô n g t h n g a lấy 0,05 ; 0,02 0,01 Trong tập hợp k i ể m định thống kê có c ù n g mức ý nghĩa a (tức có x c suất mắc sai l ầ m loại Ì n h nhau), k i ể m định mức n o có xác suất sai l ầ m loại nhỏ n h ấ t xem "tốt nhất" Các k i ể m định thống kê t r ì n h bày c h n g n y đề u

đ ã chứng minh cách chặt chẽ Toán học k i ể m định t ố t nhất, t ố i ưu Các chứng minh địi hỏi k i ế n

thức vượt ngồi k h u n khổ giáo t r ì n h mở đ ẩ u n y nên c h ú n g bỏ qua

C n lưu ý r ằ n g k i ể m định thống kê d ẫ n t i việc chấp n h ậ n x c suất sai l ầ m loại bao n h i ê u ta k h ô n g b i ế t

(thuồng k h ó biết) có t h ể lớn ! T h n h t h việc chấp

n h ậ n H m ộ t định dè dặt : K h i chấp nhận H :) ta k h ô n g n ê n h i ể u r ằ n g Ha đ ú n g m chi nên h i ể u r ằ n g cấc chứng số l i ệ u đ ã có c h a đủ sở đ ể h c bỏ H(, cần phải n g h i ê n cứu t i ế p

(96)

C c b c c n t h i ế t t r o n g v i ệ c t i ế n h n h m ộ t k i ể m đ ị n h g i ả t h i ế t t h ố n g k ê g ố m :

1 P h t b i ể u g i ả t h i ế t H v đ ố i t h i ế t Hị

2 Đ ị n h r õ m ứ c ý n g h ĩ a a ( x c s u ấ t m ắ c s a i l ầ m l o i ) C h ọ n t e s t t h ố n g k ê

4 C h ọ n m i ề n b c b ỏ g i ả t h i ế t H a

5 T í n h g i t r ị c ủ a test, t h ố n g k ê t m u q u a n s t đ ợ c K ế t l u ậ n b c b ỏ H a h a y c h ấ p n h ậ n H t ù y t h e o g i t r ị c ủ a t e s t t h ố n g k ê c ó r i v o m i ê n b c b ỏ g i ả t h i ế t h a y k h n g

§2 K I Ể M Đ Ị N H G I Ả T H I Ế T

V Ề GIÁ T R Ị T R U N G B Ì N H

G i ả x X l Đ L N N c ó p h â n b ố c h u n X - N (ụ, ổ2) T ậ p h ợ p c h í n h đ â y l t ậ p h ợ p t ấ t c ả c c g i t r ị c ó t h ể c ó c ủ a X M ộ t m ẫ u k í c h t h c n l m ộ t t ậ p h ợ p g ố m Ti g i t r ị l ị , x2, X

t h u đ ợ c t n q u a n s t đ ộ c l ậ p v é X Ta m u ố n k i ể m đ ị n h g i ả t h i ế t v ế {4

a) P h n g sai ỡ2 đ b i ế t

Bài toán 1. T a m u ố n k i ể m đ ị n h g i ả t h i ế t H o • f = Mo

v i đ ố i t h i ế t Hị : ụ * ụ a ở đ ó /ưa l g i t r ị c h o t r c

T a n ó i đ â y l b i t o n k i ể m đ ị n h h a i p h í a ( t w o - t a i l e d t e s t ) T e s t t h ố n g k ê đ ợ c c h ọ n l

( x - ^ V r â

M ộ t c c h h ợ p l í t a s ẽ b c b ỏ HQ k h i I T I l n m ộ t c c h " c ó ý n g h ĩ a " N h v ậ y m i ề n b c b ỏ H c ó d n g

(97)

v i c l m ộ t h ằ n g số p h ụ t h u ộ c v o m ứ c ý n g h ĩ a a. N g i t a c h ứ n g m i n h đ ợ c r ằ n g n ế u H đ ú n g ( t ứ c l n ế u [Ì = [Ì ) t h ỉ T

l Đ L N N c ó p h â n b ố c h u ẩ n t c M O , 1)- V ậ y v i m ứ c ý n g h í a a đ ã cho, h ằ n g số c đ ợ c t ì m t đ i ê u k i ệ n

P Ị | T | > c Ị = a

« = » p ị | T | =s c Ị = Ì - a

Ì

N ế u g ọ i <i>(x) = •— J e~l 2 dt l h m p h â n b ố c ễ a Đ L N N — oe

c h u ẩ n t c N(0,1) t h ì

ĩ>{\ Tị < c } = * ( c ) - * ( - c ) =

= * ( c ) - Ì = Ì - a => <D(c) = Ì - I

N h v ậ y c t ì m đ ợ c b ằ n g c c h t r a n g ợ c b ả n g h m <t>. N ó i

oe

c c h k h c c l p h â n vị m ứ c — cễa p h â n b ố c h u ẩ n t ắ c

Chú ý : N ế u t a d ù n g b ả n g h m L a p l a c e t h ì d ễ t h ấ y

Ì - a

W = ^

T / i ỉr cíụ T m ộ t t ậ p h ợ p c h í n h c ó p h â n b ố c h u ẩ n v i k ì v ọ n g ( c h a b i ế t ) v đ ộ l ê c h t i ê u c h u ẩ n ổ = 5,2 n g i t a l ấ y r a m ộ t m ẫ u k í c h t h c n = 100 v t í n h đ ợ c X — 27,56 V i m ứ c ý n g h ĩ a a — 0,05 h ã y k i ể m đ ị n h g i ả t h i ế t

H o : p = 2 6 v i đ ố i t h i ế t

H, : jU se 26

Giải Ta c ẩ n c h ọ n c t đ i ể u k i ệ n 0,05

<Ị)(C) = Ì - = 0,975

(98)

Từ bảng h m <t> ta t ì m c = 1,96

Vậy m i ề n b c bỏ H {| Tị > 1,96 }

Tiếp theo ta t í n h giá t r ị test thống kê

(ỹ Vn ( , - 6) V Ĩ Õ Õ _

T - ỡ - 5,2 -

Ta có ị T ị - > 1,96 Giá trị test thống kê r i vào

m i ề n bác bỏ HQ V ậ y ta b c bỏ g i ả t h i ế t : fi = 26 Bài toán Ta m u ố n k i ể m định g i ả t h i ế t

H o : f = Vo

với đ ố i t h i ế t H j : ịi > fẮQ

(Ớ t o n n y ta t ì m m ộ t cách t i ê n rằng /u ^ ụ0 cần p h ả i lệa chọn hai k h ả n â n g = /<Q hay ụ > fiQ)

Ta nói đ ầ y t o n k i ể m định m ộ t p h í a (one-tailed test)

Test thống kê chọn

T = •

M ộ t cách hợp lí ta b c bỏ n ế u T lớn m ộ : cách có ý nghĩa Vậy m i ế n b c bị H0 có dạng

{ T > c }

H ằ n g số c t ì m t đ iề u k i ệ n

P{ T > c } = a

<=> ct>(c) = Ì - a

Nói cách k h c , c phần vị mức a p h â n be chuẩn t c

(Nếu ta d ù n g h m Laplace <PQ t h ì h ằ n g số c tìm t điều

k i ệ n

Ì

(99)

T n g t ự đ ố i t h i ế t Hị : ft < [In test t h n g kê

chọn T = -ỹ

Thí dụ Từ m ộ t t ậ p hợp c h í n h có p h â n bố chuẩn với kỉ vọng /Li (chưa biết.) độ lệch tiêu chuẩn ổ = 40, n g i ta lấy m ộ t m ẫ u gồm 64 quan s t t í n h được X = 136,5

Với mảc ý nghĩa a = 0,01 k i ể m định g i ả t h i ế t Ha : IX = 130

với đ ố i t h i ế t H{ : ụ > 130 ( , - 130)Y64

Giải Ta có T = '-— = 1,3 Ta t ì m h ằ n g số c t đ i ể u k i ệ n

4>(c) = Ì - 0,01 = 0,99 Tra bảng * suy c = 2,33

Vì T = 1,3 < 2,33 n ê n ta c h a có sở bác bỏ H I Thí dụ Từ t ậ p c h í n h có p h â n bố chuẩn với ki vọng

/X ( c h a biết) độ lệch tiêu chuẩn õ = 0,4 n g i ta lấy m ẫ u gồm 100 quan s t t í n h được X = 31,9

Với mảc ý nghĩa a = 0,01 k i ể m định g i ả t h i ế t H o : Ai = 32

với đôi t h i ế t

H : ụ < 32

{ f i 0 - x ) f ỉ í (32-31,9).\TĨÕÕ

Giải Ta có T = = = 2,5 H ằ n g số c ả n g với mảc a = 0,01 2,33

Vỉ T = 2,5 > 2,33 n ê n ta bác bỏ H0 k ế t l u ậ n ụ < 32 b) P h n g s a i ỡ2 c h a b i ế t , mấu lớn (ti > 30)

Trong t r n g hợp ta v ẫ n d ù n g test thống kê t r ê n độ lệch tiêu chuẩn õ thay độ lệch tiêu chuẩn mẫu Chú ý r ằ n g theo định lí giới hạn trung t â m test thống kê T có

(100)

p h â n bố xấp xí chuẩn cho dù tập hợp có p h â n bố n h t h ế n o , k h ô n g n h ấ t t h i ế t p h â n bố chuẩn

Thí dụ 6. M ộ t n h ó m nghiên cứu cõng bố r ằ n g t r u n g bỉnh

m ộ t n g i vào siêu t h ị A tiêu hết 140 n g n Chọn mót m ẫ u ngẫu n h i ê n gốm 50 người mua h n g ta t í n h số t i ế n t r u n g bình họ tiêu 154 n g h ì n với độ lệch t i ê u chuẩn 62 n g h ì n Với mức ý nghĩa 0,02 k i m định xem c ô n g bố n h ó m n g h i ê n cứu có đ ú n g hay k h ô n g ?

Giải Ta cẩn k i m định giả t h i ế t

H0 •• Ị* = 140

với đ ố i t h i ế t

Hì : * 140

m , m (154 - 140).V5Õ

Ta có T = —- = !>59

H ằ n g số c t ì m từ điều k i ệ n *(c) = Ì - § = 0,99 Suy ra c = 2,33

Vì | T | = 1,59 < 2,33 nên ta chưa có sở đ loại bỏ Hơ Ta

t m thời chấp nhận báo cao nhóm nghiên cứu đúng. g

Thí dụ 7. M ộ t cơng t i có h ệ thống m y t í n h có t h xử

lí 1200 hóa đơn t r o n g m ộ t Công t i nhập m ộ t h ệ thống m y t í n h m i H ệ t h ố n g chạy k i m t r a 40 cho t h ấ y số hóa đ n xử lí t r u n g bình t r o n g Ì 1260 với độ lệch tiêu chuẩn 215 Với mức ý nghĩa 5% n h ậ n định xem hệ thống có t ố t h ệ t h ố n g cũ hay k h ô n g ?

Giải Ta c n k i m định g i ả t h i ế t

HQ : n = 1200 (hệ thống tốt hệ thống cũ)

và đ ố i t h i ế t Hị : n > 1200 (hệ thống t ố t h ệ thống cũ) Ta t i n m ộ t cách t i ê n r ằ n g hệ thống k h ô n g t h t i h n hệ thống cũ

(101)

„ ( - 1200) V4Õ

Ta có T = " = 1,76 H ằ n g số c t ì m t

Zi Ì D

điều k i ệ n

0(c) = Ì - 0,05 = 0,95 => c = 1,64

T > 1,64 n ê n ta bác bỏ HQ k ế t l u ậ n : h ệ thống t ố t h ệ thống cũ mức ý nghĩa 0,05 g

Thí dụ 8. M ộ t n h m y sản x u ấ t s ă m lốp ôtô t u y ê n bố r ằ n g t u ổ i t h ọ t r u n g bình m ộ t lốp ôtô họ l 30000 d ể m Cơ quan g i m định chất lượng nghi ngờ l i t u y ê n bố n y đ ã k i ể m tra 100 lốp t ì m t r u n g b ì n h m ẫ u là X = 29000 d ể m với độ lệch tiêu 5000 dểm

a) Với mức ý nghĩa a = 0,05 quan g i m định có b c bỏ l i quảng cáo n h m y nói t r ê n k h ô n g ?

b) Củng câu hỏi t r ê n n h n g với mức ý nghĩa chọn a = 0,02

Giải Ta. cẩn k i ể m định g i ả t h i ế t

H0 : iu = 30000 với đ ố i t h i ế t

: /J < 30000

(30000 - 29000) \[ĨÕÕ

TV? CÓI T = =

i & C - 5000 - z

a) V i mức a = 0,05 số c là 1,64 <p(l,64) = 0,95 = Ì - a

Ta. T > c, ta bác bỏ HQ Ta k ế t l u ậ n quảng cáo n h m y q u t h ậ t Sai l ầ m loại Ì k ế t l u ậ n 5%

b) V i mức a = 0,02 số c cần t ì m 2,06 <t>(2,06) = 0,98

(102)

Do T = < c = 2,06 n ê n ta k h n g có sở đ ể bác bỏ Ha mức 2%

c) P h n g s a i õ2 c h a biết, m ấ u n h ỏ ịn < 30) Bài toán Ta muốn k i ể m định g i ả t h i ế t

Ho • V = A*„

với đ ố i t h i ế t hai phía

Hl : n * f ỉ ư

Test thống kê chọn

( ĩ -ụn) in

T = —

s

Một cách hợp lí ta bác bỏ HQ khi I T ị l n m ộ t cách có ý nghĩa N h m i ề n bác bỏ HQ có dạng

A = { i n > c} "

ở c số phụ thuộc vào mức ý nghía a,

Người ta chứng minh r ằ n g nếu H đ ú n g t h ì Tp h â n bố Student với 1 - 1 bậc tự

Vậy h n g số c t ì m tỗ điều k i ệ n

P { | T I > c) = a

<=>P{T > c } + VÍT < - c} = a

Vì p h â n bố Student đ ố i xứng

P { T > c } = P { T < - c } Suy

<r >'}-!•_

Người ta đ ã l ậ p bảng t í n h sẵn với m ỗ i a giá trị ta Ihỏa m ã n điểu kiện P | T > ta Ị = a

t gọi là phân vị mức a phân bố Student T

(103)

N h c = t a / 2

Sau t ì m c n ế u I T I > ũ ta b c bỏ H Trong t r n g

hợp t r i l i ta chấp n h ậ n HQ

Thí dụ 9. M ộ t công t i sản x u ấ t pin t u y ê n bố r ằ n g pin họ có t u ổ i t h ọ t r u n g bỉnh 21,5 M ộ t quan k i ể m t r a chất lượng k i ể m t r a pin công t i thu số l i ệ u sau t u ổ i t h ọ pin :

19, 18, 22, 20, 16 25

K ế t n y cố xác nhận quảng cáo cơng tí là đ ú n g

hay k h ô n g ? Mức ý nghĩa chọn là a — 0,05

Giải Ta. cừn k i ể m định giả t h i ế t H0:ụ = 21,5 với đ ố i t h i ế t HỊ : ụ * 21,5

Ta có : X = 20 s = VTÕ

( - ^ V

Từ T

TÔ -1,16 ; T = 1,16

Tra bảng p h â n bố Student với bậc t ự do k = n - Ì = 5, ta

t ì m £0.05 = ^0 025 = 2,571 T

Vậy c = 2,571

I T I < c n ê n ta chưa có sở bác bỏ H0. Số l i ệ u này đ ã

xác n h ậ n lời quảng cáo công t i m

(104)

Bài toán Ta muốn k i ể m định g i ả t h i ế t

H0 •• ụ = fi0 với đ ố i t h i ế t phía

H : n > pG

Test thống kê chọn

T = — s

M i ế n bác bỏ HQ có dạng

{T > c }

H ằ n g số c chọn t đ iề u k i ệ n

PịT > c} = a

Suy r c = ta

Tương tự, với t o n k i ể m định g i ả t h i ế t

H° : ụ = ụ° với đ ố i t h i ế t

Hì : (ì < HQ,

Ta chọn test thống kê :

T = — s

với số c t í n h n h t r ê n

Thí dụ 10. M ộ t n g h i ê n cứu t h ô n g b o r ằ n g mức tiêu d ù n g h n g t h n g m ộ t sinh viên 420 n g h ì n Đ ể k i ể m t r a ngưỗi ta chọn ngẫu n h i ê n 16 sinh viên t ỉ m t r u n g bình t h n g họ tiêu 442 n g h ì n v i độ lệch tiêu chuẩn 60 nghìn

Với mức ý nghĩa 5% n h ậ n định xem k ế t l u ậ n t h ô n g báo có thấp t h ậ t hay không

Giải. Giả t h i ế t HQ

HQ : n = 420

với đ ố i t h i ế t

HỊ : li > 420

(105)

Ta có T = :

s

_ (442 - 420) VT6 22 _ 60 15 ~ '

T r a bảng p h â n bố S t u d e n t với 15 bậc tự ta t ì m

c = t( ) ( ) < 5 = 1,753 V ậ y T < c, ta khơng có sở bác bỏ H

B ả n t h ô n g báo đ ó đ ợ c c h ấ p n h ậ n đ ú n g _

Thí dụ l i M ộ t p h n g p h p ă n k i ê n g quảng c o r ằ n g

s ẽ l m g i ả m t r ọ n g l ợ n g í t n h ấ t 45 pound t h n g ( Ì pound - 0,454 kg) M ộ t m ẫ u gồm 28 người theo c h ế độ ân k i ê n g n y giảm t r ọ n g l ợ n g t r u n g b ì n h 35 pound với độ lệch t i ê u c h u ụ n 20 pound V i mức ý nghĩa a = 0,01, h ã y n h ậ n định xem p h n g p h p ă n k i ê n g t r ê n có nói q u k h ô n g

Giải Rõ r n g g i ả t h i ế t HQ v đ ố i t h i ế t 'Hx thí dụ n y

H 0 : ụ =

Hy n < 45

(56 - 35) V28

Tầ c ó T = = 2,646

T r a b ả n g p h â n bố S t u d e n t với re - Ì = 27 bậc tự ta t ì m được c = t{) 1 = 2,473

Vi T > c n ê n ta bác bỏ H 1 Như lời quảng cáo phương pháp ă n k i ê n g "phóng đại" với mức ý nghĩa a = 0,01. m

§3 K I Ể M Đ Ị N H GIÁ T H I Ế T

V Ề GIÁ T R Ị C Ủ A XÁC S U Ấ T

X é t m ộ t p h é p t h ngẫu n h i ê n G m ộ t biến c ố A l i ê n kết với G X c suất x u ấ t h i ệ n c ủ a A p h é p thử thực là p ( c h a biết) T ầ m u ố n k i ể m định giả thiết p = PQ đ ó pa

là m ộ t s ố đ ã cho

(106)

Bài toán Ì. K i ể m định giả t h i ế t

v ố i đ ố i t h i ế t hai phía

Hl : p * P o

T i ế n h n h phép t h ử G n l ẩ n m ộ t cách độc lập ta quan s t thấy biến cố A xuất hiện k l ầ n T ấ n suất x u ấ t của A

k

f = — cho ta hình ảnh xấp x i của p n

Test thống kê chọn

V/ ự l -Po)

M ộ t cách hợp lí ta bác bỏ HQ khi I T I lằn m ộ t cách có ý nghĩa Do m i ễ n bác bỏ H có dạng

A = { i n > c}

ở c hằng s ố phụ thuộc vào mức ý nghĩa -.hạn a

Người ta chứng minh nếu npa > và n (Ì - p0) ^ t h ì f có p h â n bố xấp xỉ chuẩn vằi kì vọng pữ độ lệch tiêu

chuẩn

T h n h t h đó T có p h â n bố chuẩn tắc NịO,l)

Vậy h ằ n g s ố C tìm từ điều k i ệ n P { | T I > c } = a

<=> *(c) = Ì - I

ở đó <t> h m p h â n bố Đ L N N chuẩn tắc Nói cách khác c p h â n vị mức ^ phân bố chuẩn t c

(107)

Thí dụ 12. M ộ t đ ả n g c h í n h t r ị t r o n g m ộ t b ấ u cử t ổ n g t h ố n g M ỹ t u y ê n bố r ằ n g 457/ cử t r i bỏ p h i ế u ' c h o ứ n g c v i ê n A c ủ a h ọ

C h ọ n n g ẫ u n h i ê n 200 cử t r i đ ể t h ă m d ò ý k i ê n cho t h ấ y 80 n g ỉ i t r o n g s ố đ ó t u y ê n bố bỏ p h i ế u cho ô n g A

V i m ứ c a = 5% , h ã y k i ể m đ ị n h x e m d ự đ o n c ủ a đ ả n g t r ê n c ó đ ú n g k h ô n g

Giải. G i ả t h i ế t Ha : p = 0,45 ;

đ ố i t h i ế t HỊ l đ ố i t h i ế t hai p h í a

H} : p * 0,45

( B i t a k h n g c ó sở n o đ ể cho r ằ n g d ự đ o n c ủ a đ ả n g t r ê n l cao h n 0,45 hay t h ấ p h n 0,45)

80

^ c ố f=20Õ = °>40

Vì r ằ n g npQ - 200.(0,45) = 90 ỉí ,

nil - pa) = 200.(0,55) = n o 2= ,

n ê n t a c ó t h ể p d ụ n g đ ợ c test t h ố n g k ê đ ã n ê u Ta có (0,40-0,45)V2ÕÕ

T = K , J==r— = -1,43

V(0,45).(0,55) V i m ứ c a = 0,05 t h ì

0,05

* ( , ) = Ì - = 0,975,

do đ ổ c = 1,96 So s n h \T\ = 1,43 v i c = 1,96, t a t h ấ y I Tị < c. V ậ y k h n g c ó sở b c b ỏ H r D ự đ o n c a đ ả n g t r ê n

c ó t h ể đ ú n g g Bài toán 2. K i ể m đ ị n h g i ả t h i ế t

" o : p = Po v i đ ố i t h i ế t m ộ t p h í a Hi : p > pa

(108)

Test thống kê chọn

T = Ị

V p0( l -Po)

Ta bác bỏ Ha nếu T lớn m ộ t cách có ý n g h í a M i ề n bác bỏ H có dạng

A = { T > c }

H ằ n g số c phụ thuộc vào mức ý nghĩa a thỏa m ã n đẳng thức

P{ T > c} = a

Với điêu kiện np > , n ( Ì - p ) 5, T có p h â n bố xấp xỉ p h â n bố chuẩn tắc t h n h t h ể đ ẳ n g thức t r ê n kéo theo

<t>(c) = Ì - a

T n g t ự đ ố i t h i ế t p h í a Hị : p < pa t h ì test thống kê chọn

_ (Pọ-f) VÍT T ~ V p0( l ~ ) với số c tính t r ê n

Thí dụ 13 M ộ t báo cáo nói r ằ n g 18% gia đ ì n h t h n h phố A có m y t í n h cá n h â n n h Đ ể k i ể m tra, n g i ta chọn ngẫu n h i ê n 80 gia đình t h n h phố có t r ẻ em đ a n g học thấy r ă n g có 22 gia đình có máy t í n h Với mức ý nghĩa a = 0,02 k i ể m định xem l i ệ u gia đ ì n h có t r ẻ em đ a n g học, tỉ l ệ gia đình có máy tỉnh có cao t i l ệ chung hay không*

Giải Ta cần k i ế m định giả t h i ế t

H0:p = 0,18 đ ố i t h i ế t : p > 0,18

(109)

22

(f-Po)^n , - ,

f = 80 = ° '

2,21

ItjT-pJ 0,043

Từ đ iề u k i ệ n <D(c) = Ì - a = 0,98 => c = 2,05

Vậy T > c, ảo ta bác bỏ H k ế t luận :

Trong gia đ ì n h có t r ẻ học, tỉ l ệ gia đình có máy tính

cao t ỉ l ệ chung. g

Thí dụ 14. M ộ t c n g t i A sản x u ấ t b n h kẹo t u y ê n bố r ằ n g ,

7T sô t r ẻ em thích ă n b n h c ô n g t i Trong m â u gồm 100

t r ẻ em h ỏ i , có 55 em tỏ thích b n h công t i A. Vịi mức ý nghĩa 5%, số l i ệ u nói t r ê n có chứng tỏ t u y ê n bố c ô n g t i q u đ n g hay k h ô n g ?

2

Giải. G i ả t h i ế t H p — —, đ ố i t h i ế t H. p < —

à ổ

Đây k i ể m định m ộ t p h í a Các số l i ệ u mẫu cho ta

n = 100, k = 55, 55

f = 100 = ° ' 5 ;

1 0 x „ „ „

npo = - 66,7 > ; 100

71(1 - po) = = 33,4 í ; p h â n bố /• xấp xỉ chuẩn

Giá t r ị test t h ố n g kê

<P„-f)K (ị-0,55).mõ

T = , ' = = = = 2,49

Vpo(l -Po)

(110)

Với a = 0,05 c = 1,64

Tã có T > c t h n h t h dựa t r ê n mẫu quan s t ta k ế t l u ậ n

r ằ n g , c ô n g bố công t i lớn thật I

§4 P H Ư Ơ N G P H Á P p - GIÁ T R Ị

Các kĩ thuật, mà c h ú n g ta t r ì n h bày t i ế t trước gọi p h n g - p h p k i ể m định t r u y ề n thống Trong mục n y c h ú n g ta t r ì n h bày phương p h p k h c n h thống kê sử dụng rộng rãi gọi p h n g p h p p -giá trị

Xét t o n k i ể m định g i ả t h i ế t

Ha •• n = / V

với đ ố i t h i ế t Hị : // < fẨ

Các số l i ệ u m ẫ u cho ta giá trị của n, X = X s. Ta m u ô n k i ể m định xem số l i ệ u cho có cho phép ta bác bấ H hay khơng

lí luận phản chứng Giả sử H Tầ tính xem xác suất đ ể t r u n g bỉnh m ẫ u bé hay giá trị quan sát

xQ bao n h i ê u N ế u x c suất "nhấ" theo nghĩa ta b c bấ Ha theo n g u y ê n lí xác suất nhấ, biến cố r ấ t k h i xảy t r o n g m ộ t p h é p thử N ế u xác suất k h "lớn" ta k h n g có sở đ ể b c bấ HQ

Giá trị x c suất n y p = P|(X) ^ X0Ị (tính điểu

k i ệ n HG đ ú n g ) gọi p - giá trị két hợp với số l i ệ u mẫu quan s t

T n g tự đôi với t o n k i ể m định giả t h i ế t

với đ ố i t h i ế t m ộ t phía

Hl : ụ > /xa t h i p - giá trị xác suất

(111)

p = p f

(tính g i ả t h i ế t H đúng), đ ố i với t o n k i ể m định hai phía H ) : [Ả = ỊẮ

t h ỉ p - giá trị trường hợp k i ể m định hai phía gấp đơi p - giả trị trường hợp phía tức

p - giá t r ị n h thống kê sử d ụ n g theo hai cách M ộ t số n g i đơn t h u ầ n tính p - giá trị, việc định l i ệ u có bác bỏ g i ả t h i ế t H hay k h ô n g đ ể l ẫ i cho độc g i ả tự

quyết định l ấ y

Khi l m n h vậy, n h thống kê có m ộ t số hướng d ẫ n chung sau :

- Nếu p > 0,05, ta k h n g có đủ sở đ ể bác bỏ H

- N ế u 0,01 < p < 0,05, ta có đủ sở đ ể bác bỏ HQ

- Nếu p < 0,01, ta có sở r ấ t mẫnh, h ù n g hổn đ ể bác bỏ HA

Một cách t h ứ hai sử dụng p - giá t r ị k ế t hợp với mức ý nghĩa a đ ã cho ầ t í n h p - giá trị so s n h n ó với « :

Nếu p sỉ a, ta bác bỏ HQ

N ế u p > a, ta chưa có sỏ bác bỏ Hy Nói cách k h c : p -giá trị c h í n h mức ý nghĩa thấp n h ấ t m ta có t h ể bác bỏ H&

C h ú n g ta minh họa cách t h ứ hai qua số ví dụ sau

Thí dụ 15. Từ tập hợp có t r u n g bình fi (chưa biết)

n g i ta lấy mẫu có kích thước n = 36 t í n h

X = 5040 s = 780 Sử dụng p h n g p h p p - giá t r ị k i ể m định g i ả t h i ế t :

H , : ụ Ít o

p = 2P1X < X

với đ ố i t h i ế t

Ha : /u = 4700

H\ : ụ > 4700 Mức ý nghĩa a = 0,02

(112)

Giải Ta tính p - giá trị

p j x ^ 5040 Ị

Dưới giả thiết. H, vì n = 36 > 30 , X Đ L N N có xấp x i phân bố chuẩn với kì vọng 4700 độ lệch tiêu chuẩn

ổ 780 Vrâ" )Í36 130 Vậy vịx ĩ* 5040 Ị = Ì - p Ị* *s 5040 Ị

^5040 - 4700 ^ = í Ì <t>

u 130

= Ì - 0,9956 = 0,0044

- Ì - 0(2,62)

Vậy p - giá trị 0,0044 N ó bé h n mức ý nghĩa a = 0,02 Vậy ta bác bỏ Ha chấp n h ậ n Hị

Thí dụ 16. Từ tập hợp c h í n h có t r u n g b ì n h fẨ (chưa biết), ngưỉi ta lấy mẫu có kích thước n = 140 t í n h

X = 18,5 s = 6,8 Với mức ý nghĩa a = 0,05, k i ể m định g i ả t h i ế t Hữ : ụ = 19,4

với đối t h i ế t HỊ : Ịi < 19,4

Giải. Ta tính p - giá trị p j x í 18,5Ị

Dưới giả t h i ế t H , n > 30 n ê n X có p h â n bố xấp xỉ chuẩn s 6,8

vối k i vong 19,4 đô lêch t i ê u chuẩn là -== = = 0,575

\n V140

Vậy p | x « 18,5 Ị = <u ' , - 19,4 ^ = * (-1,57) = 0,0582 0,575

Thành- thử p - giá trị 0,0582 lớn mức ý nghĩa a = 0,05

Ta khơng có sở bác bỏ HQ. g

(113)

t h ê m n g u y ê n t ố v i l ợ n g A, t a t í n h đ ợ c c h i ế u cao t r u n g b ì n h l 10,3 v i đ ộ l ệ c h t i ê u c h u ẩ n , S d ụ n g p h n g p h p p -g i t r ị , h ã y k ế t l u ậ n x é m n g u y ê n t ố v i l ợ n g A c ó ả n h h n g đế n c h i ế u cao c ủ a c â y h a y k h ô n g M ứ c ý n g h ĩ a a = 5%

Giải G i ả t h i ế t Ha : ft = l i

V ì t a k h ô n g r õ n g u y ê n t ố A có ả n h h n g t ố t ( t ă n g c h i ề u c a o ) h a y ả n h h n g x ấ u ( g i ả m c h i ể u c a o ) , n ê n t a x é t đ ố i t h i ế t h a i p h í a

H j : /í * l i

Đ ố i t h i ế t H j d i ỉ n t ả c ó s ự t h a y đ ổ i b ó n p h â n v i l ợ n g

Ta t í n h p | x sỉ , 3 Ị D i g i ả t h i ế t H0 , X c ó p h â n b ố x ấ p x ỉ c h u ẩ n v i k ì v ọ n g l i v đ ộ l ệ c h t i ê u c h u ẩ n

s 2,3

V ậ y pịx í , 31 = *

/1 , - l i "ị

= 0,332

$ ( - , 1 ) = , 0 , 3

p - g i t r ị l ( , ) = , , n h ỏ h n m ứ c ý n g h ĩ a

a = 0 , V ậ y t a b c b ỏ H( v k ế t l u ậ n : P h â n v i l ợ n g A có

ả n h h n g t i c h i ể u c a o c ủ a c â y

Thí dụ 18 T h i g i a n s ố n g t r u n g b ì n h s a u m ổ c ủ a m ộ t b ệ n h

n h â n m ắ c b ệ n h u n g t h A l n ă m M ộ t l o i t h u ố c m i t ì m t h ấ y k h i d ù n g t h t r ê n b ệ n h n h â n l o i n y c h o t h ấ y t h i g i a n s ố n g t r u n g b ì n h c ủ a h ọ l 5,7 n ă m v i đ ộ l ệ c h t i ê u c h u ẩ n l 1,2 n ă m

S d ụ n g p h n g p h p p - g i t r ị , h ã y k i ể m đ ị n h x e m l o i t h u ố c m i n y c ó k é o d i đ ợ c t h i g i a n s ô n g s a u m ổ c ủ a b ệ n h n h â n h a y k h ô n g M ứ c ý n g h í a a = ,

Giải Ta c ẩ n k i ể m đ ị n h g i ả t h i ế t

H„ : Ị* = v i đ ố i t h i ế t m ộ t p h í a : Hị : [i >

(114)

Ta t í n h pịx Si 5,7 Ị mẫu ta nhỏ (n < 20 ) nên ta phải d ù n g phân bố Student

* 1.2 1,2 n n „

Ta có -p= = - p = = = 0,27

Vn V20 4,47

Ta biết g i ả t h i ế t H ì ĐLNN _ ĩ —

0,27

sẽ có phân bố Student với n - ì = 19 bậc tự T h n h t h ?ịx 5,7 Ị = P Ị T Ỉ* ^ ^ = p{r ỉ* 2,593 Ị

Tra bảng p h â n bố Student với 19 bậc tự ta thấy

/0 i = 2,539 í0 0 = 2,861, tức p j r > 2,539Ị = 0,01

và P | T > 2,861 Ị = 0,005 Vậy ta biết p - giá t r ị n ằ m giụa 0,005 0,01 (bảng n y k h n g cho ta t ì m xác p - giá t r ị ) Vì p - giá trị bé 0,01 nên ta bác bỏ H0 L o i thuốc có tác dụng kéo dài t u ổ i thọ bệnh n h â n sau mổ

mức ý nghĩa 1% I

Thí dụ 19. Cơ quan cảnh s t giao t h ô n g cho r ằ n g 62% số người lái xe t r ê n đường có b n g lái ; k i ể m t r a ngẫu nhiên

130 người lái xe cảnh s t giao t h ô n g thấy chi có 68 người có lái xe Số liệu có chứng tỏ t i l ệ người có lái xe thấp 62% hay k h ô n g ?

D ù n g phương p h p p - giá trị với mức ý nghĩa a = 2%

Giải. Giả t h i ế t H đ ố i t h i ế t Hị t o n n y

H0 : p = 0,82 Hỉ : p < 0,62 Tầ có n = 130

k = 68 68

f = l ế = °'52a

(115)

Vì r ằ n g np ì = 130.(0,62) = 80,6 5* ;

n(\ - pa = 130.(0,38) = 49,4 > ;

n ê n f c ó p h â n b ố x ấ p xỉ c h u ẩ n v i kì v ọ n g l 0,62 v đ ộ lệch , , JPo(l ZẼÃ _ J (0,6).(0,38)

c h u n l à - y 1 3 0 = - ý 30' l p - g i t r ị l

T , r (^0,523 - 0,62 ^ vụ sỉ , = ct> '

t i ê u

T h n h t h p

0,043

0,043

= ct> ( - , ) = 0,0113

p - g i t r ị b é h n m ứ c ý nghĩa a = 0,02 V ậ y t a b c bỏ HQ

T ỉ l ệ n g i có b ằ n g l i xe t h ự c t ế l t h ấ p h n 62% n

Chú thích Ta có t h ả sử d ụ n g p h ầ n m ề m t h ố n g k ê M i n i t a b đ ả g i ả i q u y ế t b i t o n k i ả m đ ị n h g i t r ị t r u n g b ì n h v t ỉ l ệ m ộ t c c h n h a n h c h ó n g Đ ầ u t i ê n t a p h ả i n h ậ p số l i ệ u v o c ộ t C l

T i ế p t h e o t a g õ c c l ệ n h sau

hay hay

TTEST ỊX0 C1 ALTERNATIVE ALTERNATIVE -ALTERNATIVE

( n ế u đ ố i t h i ế t là /À > /Li )

( n ế u đ ố i t h i ế t l à Li < Jwf ))

( n ế u đ ố i t h i ế t l à /LI * ụ0) K h i đ ó M i n i t a b cho h i ệ n r a t r ê n m n h ì n h k í c h t h c m ẫ u n,

t r u n g b ì n h m ẫ u X, đ ộ l ệ c h t i ê u c h u ẩ n m ẫ u s, g i t r ị c ủ a test t h ố n g k ê t n g ứ n g v p - g i t r ị Sau k h i c ó đ ợ c c c t h ô n g t i n n y , c ă n t r ê n m ứ c ý n g h ĩ a a đ ã c h ọ n t a c ó đ ợ c

q u y ế t đ ị n h b c b ò hay c h ấ p n h ậ n HQ

§ K I Ể M Đ Ị N H G I Ả T H I Ế T V Ề G I Á T R Ị C Ủ A N H I Ề U X Á C S U Ấ T

X é t m ộ t p h é p t h n g ẫ u n h i ê n ((ỳ v m ộ t h ệ đ ấ y đ ủ c c b i ế n

cố Bị, B2, •• ,Bk l i ê n k ế t v i ({^ Đ i ê u đ ó c ó nghĩa v i m ỗ i

k ế t q u ả của ((ỉ, d ù l k ế t q u ả n o đ i c h ă n g nữa, l u ô n l u n có

(116)

một m ộ t biến cố biến cố Bị, B2, Bk x ả y Già sử r ằ n g ta quan t â m t i x c suất (chưa biết)

biến cố Bị n y

Giả t h i ế t cẩn k i ể m định

H0 : P ( B j ) = p x , P(S2> = P2' P ( B , ) ' = P ,

trong P j , , pk số d n g đ ã cho, < pt < C h ú ý k

r ằ n g = Ì { B;- } * _ J m ộ t h ệ đ ầ y đủ c c b i ế n cố

i = Ì

T i ế n h n h p h é p t h ử n l ầ n m ộ t cách độc l ậ p G i ả sử r ằ n g k

ĩiị l ầ n xảy biến cổ Bị (i = Ì, 2, k), ^ Hị = n Các số Uị

i = Ì

này đưởc gọi các tân số quan sát

Ta t r ì n h bày c c t ầ n số quan s t n- t h n h bảng sau

Biến cố

B 1 B

2 Tổng

T ầ n số quan s t

n \ ĨI2 n

Các số rij = npị (i = Ì, 2, k) đưởc gọi các tăn số lí thuyết N ế u g i ả t h i ế t H đ ú n g t h ì theo l u ậ t số l n n và Bị xấp xỉ n h

Một cách hởp lí, ta b c hị H^ t ầ n số quan s t "khác xa" t ầ n số lí thuyết theo m ộ t nghĩa n o Khoảng cách t ầ n số quan s t v lí thuyết đưởc đo test thống kê "Khi bình phương" :

* ( n , - í ự

(117)

T s ẽ b c b ỏ H k h i T l n m ộ t c c h c ó ý n g h í a M i ế n b c bỏ H s ẽ c ó d n g

A = | T > c Ị

ở đ ó c l m ộ t h ằ n g số p h ụ t h u ộ c v o m ứ c ý n g h ĩ a a đ ã c h ọ n N g i t a đ ã c h ứ n g m i n h đ ợ c r ằ n g n ế u g i ả t h i ế t Ha đ ú n g v

n ế u c c t ầ n s ố lí t h u y ế t n l n h n hay b ằ n g t h ì T c ó p h â n b ố x ấ p x ị p h â n b ố ỵ2 v i k - Ì b ậ c t ự T r a b ả n g p h â n số Ả2 v i k - Ì b ậ c t ự ( b ả n g 3) t a s ẽ t ì m đ ợ c số t h ỏ a m ã n

p{r >**} = «

N h v ậ y c = X2 l p h â n vị m ứ c a c ủ a p h â n b ố ỵ2

Ta m i n h h ọ a q u y t ắ c k i ể m đ ị n h t r ê n b ằ n g m ộ t s ố ví d ụ Thí dụ 20. Gieo m ộ t x ú c sắc 0 l ẩ n Số l ầ n r a c c m ặ t Ì , 2, 3, 4, 5, đ ợ c cho t r o n g b ả n g sau

1 T ổ n g

106 92 97 105 88 112 600

C ó t h ể coi x ú c sắc đ ó l x ú c sắc đ ợ c c h ế t o c â n đôi ( t ứ c x c s u ấ t x u ấ t h i ê n m ỗ i m t l 77) đ c k h ô n g ? M ứ c ý n g h ĩ a a - 0,05

Giải. G i ả t h i ế t H o : "Con x ú c sắc đ ợ c c h ế t o c â n đ ố i " Ta h ã y t í n h c c t ầ n số lí t h u y ế t C h ú n g đ ợ c cho t r o n g b ả n g sau :

1 TS

100 100 100 100 100 100 600

Tk t i n h t e s t t h ố n g k ê " k h i b ì n h p h n g " : (106 - 0 )2 (92 - 0 )2 ( - 0 )2

T ~ ĩ õ õ + ĩ õ õ + ĩ õ õ +

(105 - 0 )2 (88 - Ị 0 )2 (112 - 0 )2

+ 100 + 100 + 100

= 0,36 + 0,64 + 0,09 + 0,25 + 1,44 + 1,44 = 4,22

(118)

Tra bảng X2 với - = bậc tự (bảng 3), ta t ì m

c ~ *0.05 11,070

T < c n ê n ta k h ô n g có sở bác bỏ H( M Thí dụ 21. Quan s t 250 nghi ốm công n h â n

m ộ t xí nghiệp lớn ta t h u số liệu sau

Ngày T h ứ hai T h ứ ba Thứ tư Thứ năm Thứ sáu Tổng số Số CN

nghỉ 57 39 37 54 63 250

V i mức ý nghĩ 5%, n h ậ n định xem ngày nghỉ ốm c ô n g n h â n t r o n g xí nghiệp có p h â n bố t u ấ n không

Giải. Giả t h i ế t H0 : Các ngày nghỉ ốm p h â n bố đ ằ u (tức k h n g có ngày riào t r o n g t u ầ n công n h â n ưa thích nghỉ hơn)

D i g i ả t h i ế t H0, t ầ n số lí thuyết

Ngày Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáu Tổngsố T ẩ n số LT 50 50 50 50 50 250

Ta t í n h test t h ố n g kê "Khi bình phương"

T = (57 - 50)2 + (39 - 50)2 + (37 - 50)2 +

50 50 50

(54 - 50)2 (63 - 50)2

+ ^ ^ + 50 = '

-Tra b ả n g X2 với - = bậc tự (bảng 3) ta t ì m

c = zỗ,05 = 9 ' 4 8 &

T > c ta bác bỏ Ho đến k ế t luận có n g y (có t h ằ t h ứ hai hay t h ứ sáu) xác suất nghỉ ốm

của công n h â n cao ngày k h c g

(119)

Ta p dụng test thống kê "khi bình phương" đ ể k i ể m t r a giả t h i ế t Đ L N N có t u â n theo quy l u ậ t xác suất nhị thức Poisson hay khơng

Thí dụ 22. Trong d â n gian lưu t r u y ề n m ộ t quan n i ệ m r n g m ộ t loại thức ă n A làm t ă n g k h ả n ă n g sinh t r a i Đ ể k i ể m tra quan n i ệ m người ta cho m ộ t n h ó m phụ nữ d ù n g thức ăn A r i xem xét 80 trường hợp có t h i gian d ù n g loại thức ăn A K ế t cho ủ bảng sau :

Số bé trai Tổng số

Số phụ nữ 14 36 24 80

Với mức ý nghĩa a = 5% k i ể m định xem l i ệ u loại thức ă n A t c dụng đế n việc sinh trai hay gái hay k h ô n g

Giải. G i ả t h i ế t HQ :

"Loại thức ă n A k h n g có t c dụng đế n giới t í n h bào thai" Nếu giả thiết HQ số bé trai gia đình có

là ĐLNN có quy luật nhị thức với tham s ố n = v / j = - ~

ít

G i ả sử Bị, biến cố :"Trong đứa t r ẻ có k đứa trai" K h i nếu H0 đ ú n g :

P(*o>

1

8 '

P(B3)

1^ •

(120)

Các t ầ n số lí thuyết

Số trẻ em trai Tổng số

Số gia đình 10 30 30 10 80

C h ú n g ta t í n h test thống kê "khi bình p h n g "

( - l )2 (36 - )2 (24 - )2 (6 - 10)2

+ 1,3

10 30 30 10

Tra bảng X2 với - Ì = bậc tự ta tìm được c = Xo 05 ~ 7,815 Vì T < c nên ta k h ô n g có sở bác bỏ H Số l i ệ u cho chưa cho phép ta khẳng định loại thức ăn A có ảnh h n g đế n

việc hình t h n h giới tính

Thí dụ 23. Mỗt n h m y sản xuất máy i n nói r ằ n g số l ỗ i i n mỗt sách dày 300 trang m y i n m ỗ t Đ L N N có quy l u ậ t p h â n bố Poisson với tham số = 4,7 K i ế m t r a 300

t r a n g sách in 50 máy i n c ù n g loại ta t h u

Số lỗi ^

Số máy 1 13 10

Với mức ý nghĩa 5%, số l i ệ u t r ê n có x c nhận lời t u y ê n bố n h sản x u ấ t m y in hay k h ô n g ?

Giải. Gọi X số l ỗ i 300 trang i n

Giả thiết Ha : "X có quy luật Poisson với tham số Ả = 4,7"

{X í } ;

B2 = {X = 3 } ; Bi = { X = = 4} ; B4 = {X = 5 } ;

B 5 = {X = 6 }

B* = {X = 8 }

(121)

N ế u Ha đ ú n g t h ì

P ( S2)

P ( B3)

P ( 54)

P ( S5)

• 4.7 (4,7)' (4,7)' , (4,7)2

0! Ì !

\3

2! 0,152 ;

C "4-7 = 0,157

e - 4 - 7 = 0,185

•4.7 ( , )

5 = 0,174 ;

= e - 7 í í 4 '7 ) 6 Ị (4,7)7

6! 7! = 0,228 ;

P ( B6) = 1 - 2 P(^o) = ° > 1 0 4

i = Ì

M u ố n k i ể m đ ị n h H t a k i ể m định h ệ q u ả H' :

H'a : P ( B j ) = 0,152 ; P ( B2) = 0,157 ; P ( B3) = 0,185 ;

P ( B4) = 0,174 ; P ( B5) = 0,228 ; P ( B6) = 0,104

C c t ầ n s ố q u a n s t v t ầ n s ố lí t h u y ế t cho bảng

d i đ â y

* B2 Bi * B 5 B 6 T ầ n sô

T ẩ n số quan s t 10 6 13 10 9 2 50

T ẩ n s ố L T 7,6 7,85 9,25 8,5 11,4 5,2 50

C c t ẩ n số lí t h u y ế t đề u k h ô n g n h ỏ h n , n ê n đ iề u k i ệ n p d ụ n g c ủ a k i ể m đ ị n h thỏa m ã n T í n h t o n cho t a

T « 5,383

T r a bảng X2 với - = bậc tự v mc ý nghĩa a = 0,05

t a t ì m đ ợ c

c = XỈ.05 = n > l

(122)

/

v ì T < c n ê n ta định giữ g i ả t h i ế t H Chính x c ta k h n g có sở đ ể bác bỏ H n ế u dựa t r ê n số l i ệ u nói t r ê n Số l i ệ u đ ã cho ủng hộ lời t u y ê n bố n h sản xuất m y i n

G i ả sử X ĐLNN có p h â n bố chuẩn X - Ni /Lí, G2). T ậ p hớp c h í n h Ịà tập hớp t ấ t giá t r ị có t h ể có của X. Xét m ộ t m ẫ u ngẫu nhiên có kích thước n. N h t r ì n h b y c h n g trước, p h n g sai mẫu s2 m ộ t ước lướng k h ô n g chệch cho p h n g sai õ2 t ậ p hớp c h í n h Việc t ì m khoảng t i n cậy cho õ2 đước dựa t r ê n định lí quan t r ọ n g sau :

Đ ị n h lí 1. Nếu tập hợp có phán bố chuẩn ĐLNN

sẽ có phân bố X với n - Ì bậc tự

G i ả sử ta muốn t ì m khoảng t i n cậy với độ t i n cậy p cho ồ2 Đ ặ t a = Ì - /3 Ta có

*§6 K H O Ả N G T I N C Ậ Y VÀ K I Ể M Đ Ị N H GIẢ T H I Ế T V Ề P H Ư Ơ N G S A I

2 T h n h t h

Suy (xem hình vẽ )

P Í A2_ « ^ T í kị Ì

(123)

rx

s i Ơ2

=s (n - ỉ)s 2

= /3

Vậy khoảng t i n cậy với độ t i n cậy /3 cho p h n g sai2

Ọ - l ) s2

(ra - l ) s2

trong số , X\-aj2 tỉm từ bảng phân bố Ắ2 (bảng 3)

T suy khoảng t i n cậy với độ t i n cậy Ịi cho độ lệch tiêu chuẩn ũ

Thí dụ 24. Kích thước m ộ t chi t i ế t m y m ộ t Đ L N N có p h â n bố chuẩn Trong m ộ t m ẫ u gốm 30 chi t i ế t m y k i ể m t r a ta t í n h được X = 0,47 s = 0,032 Tìm khoảng t i n cậy 95% cho p h n g sai độ lệch tiêu chuẩn kích thước t o n chi t i ế t máy

Ì - an

(124)

Giải Ta có n = 30,

s = 0,032,

do s2 = (0,032)2 = 0,001024

Với p = 0,95 , ta suy

a = 0,05 => I = 0,025

và Ì - I = 0,975

Tra bảng phân bố ỵ2 với 29 bậc tư (bảng 3) t a tìm

4o25 = 45,772 ;

Ầị975 = 16,047

Vậy khoảng tin cậy 95% cho ơ2

"29(0,001024) 29(0,001024)" 45,772 ' 16,047 hay [0,000649 ; 0,001851]

Từ khoảng tin cậy cho õ

[ V 0,000649 ; VÕ,001851 ] hay [0,025 ; 0,043]

Bây chuyển sang toán kiểm định giả thiết

Hơ : ỡ2 = dị với đối thiết phía (õ2 < ơị Ớ2 > ơị) ,

hay đối thiết hai phía (ớ2 ft ơ2) Nhiều vấn đề thực tiễn dẫn

đến toán kiểm định

Chẳng hẩn ta muôn kiểm tra độ biến động dây

chuyển sản xuất (độ biến động đo phương sai tất

cả sản phẩm) Dây chuyển sản xuất phải dừng

lẩi để điểu chỉnh ta phát độ biến động vượt

giá trị Ớị : Trong trường hợp ta phải x é t toán

kiểm định giả thiết

(125)

v i đ ố i t h i ế t H{ : 0- > õ

2

X é t c c t r n g h ợ p s a n : a ) Đ ố i t h i ế t l H , :2

> a]

Ttest t h ố n g k ê đ ợ c c h ọ n đ â y l

(n - l ) s

M ộ t c c h h ợ p l i t a s ẽ b c b ỏ H n ế u T l n m ộ t c c h c ó ý

n g h ĩ a M i ề n b c b ỏ Ha d n g

{T > c)

H ằ n g s ố c đ ợ c c h ọ n t đ i ể u k i ệ n P { T > c) = a

V ì T có p h â n b ố A2

v i n - Ì b ậ c t ự d o n ê n t a s u y r a c = Xị

b ) Đ ố i t h i ế t l à H : Ớ 1

< õị (n - l ) s2 T e s t t h ố n g k ê v ẫ n l à T = ^— •

6

l

T a s ẽ b c b ỏ H ^ k h i T n h ỏ m ộ t c c h c ó ý n g h ĩ a M i ễ n b c b ỏ H0 d n g { T < c)

H ằ n g s ố c đ c c h ọ n t đ iề u k i ệ n P { T < c} =a

=> P { T > c) = ì - a

S u y r a c = Ằ\_a

c ) Đ ố i t h i ế t l f / j : õ2

*

T a s ẽ b c b ỏ H k h i

T = ( n

- Ị ^

l n h o ặ c b é m ộ t c c h c ó ý n g h ĩ a L ậ p l u ậ n t n g t ự n h t r ê n t a t h ấ y HQ b ị b ; b ỏ k h i T > Xịa

h o ặ c T < Ằ\_ari

(126)

Thí dụ 25. Đo đường kính 12 sản phẩm d â y chuyên sản x u ấ t , n g i kĩ sư k i ể m tra chất lượng t í n h được s = 0,3

B i ế t r ằ n g độ biến động sản p h ẩ m l n 0,2 t h ì dây chuyển sản x u ấ t phải dừng l i đ ể diễu chỉnh Với mức ý nghĩa a = 5% n g i kĩ sư có k ế t l u ậ n ?

Giải Ta cẩn k i ể m định giả t h i ế t H0 : ơ2

= (0,2)2

= 0,04 với đ ố i t h i ế t

HỊ : Ớ 1

> 0,04 H ằ n g số c tìm

c = Ằịos = 19,98 (bậc t ự - Ì = - = l i )

Giá t r ị test thống kê (12 - 1)(0,09)

T = 0 ^ = , > > &

V ậ y ta bác bỏ H , chấp nhận Hv Dây chuyền cần đ i ể u chỉnh độ biến động đ ã lớn h n mức cho phép

BÀI TẬP I V

1 M ộ t nghiên cứu cho thấy n g i M ỹ t r n g t h n h m ộ t n ă m đọc t r u n g b ì n h 10 sách Một m ẫ u ngẫu n h i ê n gồm 136 n g i vấn cho thấy t r u n g b ì n h họ đọc 12 sách t r o n g ] n ă m với độ lệch tiêu chuẩn N h ậ n định xem có phải thực người M ỹ t r u n g bình đọc n h i ê u lo sách n ă m hay k h ô n g Mức ý nghĩa a = 5%

2 M ộ t n h sản x u ấ t b n h t u y ê n bố r n g b n h

của họ t r u n g bình có 88 calo M ộ t mẫu ngẫu n h i ê n với 36

(127)

t r o n g b n h 90 calo với độ lệch t i ê u chuẩn calo Với mức ý nghĩa 5%, k i ể m định xem có phải t r ê n thực t ế m ỗ i b n h vé t r u n g bỉnh chứa n h i ề u 88 calo hay không

3 M ộ t n g h i ê n cứu giả t h i ế t r ằ n g đ i ể m t r u n g b ì n h t r o n g kì t h i t ố t nghiệp vừa qua (thang đ i ể m 20) Chọn ngẫu n h i ê n 400 học sinh đ ể k i ể m tra ta t í n h t r u n g bình m ẫ u 9,2 với độ lệch tiêu chuẩn 2,4 V i mức ý nghĩa 5% g i ả t h i ế t nêu có đ ú n g không ?

4 N ă n g suất lúa t r u n g bình giống l ú a A c ô n g bố 43 tạlha M ộ t n h ó m gồm 60 r u ộ n g t h í n g h i ệ m k i ể m tra cho t h ấ y n ă n g suất t r u n g b ì n h n h ó m 46,2 tạlha

với độ lệch t i ê u chuẩn 12 tạlha. V i mức ý nghĩa a = 5%,

nhận định xem có p h ả i công bố t h ấ p h n so với t h ậ t hay không

5 Trong cửa h n g lớn có r ấ t n h i ề u quẩy h n g , m ỗ i n h â n viên b n h n g t r u n g bình ngày b n 780 n g n

Trong n g y khuyến m i 80 n h â n viên b n h n g m ỗ i n g i trung bình bán 920 ngàn với độ lệch tiêu chuẩn 620 ngàn

Với mức ý nghĩa a = 0,1 k i ể m định xem t r o n g n g y khuyến m i lượng h n g t r u n g bình n h â n viên b n có n h i ề u ngày t h n g hay không

6 M ộ t loại dây c p đ n h giá có t h ể trea v ậ t n ặ n g t r u n g bỉnh 1800 kg không đứt N g i ta đ e m t h m ộ t m ẫ u gồm 16 dây c p t r ê n kết cho thấy v ậ t n ặ n g t r u n g bình dây cáp treo ià 1740 kg với độ lệch t i ê u chuẩn 60 kg

Với mức ý n g h í a a = 0,05 nhận định xem đ n h giá có phải q u cao hay không

(128)

7 M ộ t c ô n g t i l n n ó i r ằ n g l n g t r u n g b ì n h m ỗ i kĩ sư c ủ a h ọ l 48 000 VSD/nãm. M ộ t t h a n h n i ê n có ý đ ị n h x i n vào c ô n g t i t h ă m d ò 12 kĩ s c ủ a c n g t i t h ì t h ấ y r ằ n g l n g t r u n g b ì n h h ọ 45 850 U S D v i độ lệch t i ê u c h u ẩ n 300 U S D V i m ứ c ý n g h ĩ a a = 5% k i ể m đ ị n h x e m c ó p h ả i t h ô n g b o c ủ a c ô n g t i l q u t h ậ t hay k h ô n g

8 M ọ i v ậ n đ ộ n g v i ê n n ó i r ằ n g t r u n g b ỉ n h m ộ t l n đ ẩ y t a n h t a d ẩ y đ ợ c 43 mét. H u ấ n l u y ệ n v i ê n k i ể m t r a a n h ta đ ẩ y t

10 l ẩ n t h ì t h ấ y r ằ n g k h o ả n g c c h a n h t a d ẩ y đ ợ c t r a n g b ì n h l 40,6 mét v i đ ộ l ệ c h t i ê u c h u ẩ n 3,8 ni. D ự a t r ê n k ế t

q u ả n y m ứ c 5% có t h ể coi r ằ n g a n h t a n ó i c n g đ i ệ u k h ả n ă n g m ì n h k h n g ?

9 M ộ t q u n ă n n ó i v i n h â n v i ê n t h u t h u ế r ằ n g t r u n g b ì n h m ộ t n g y h ọ c ó 32 k h c h K i ể m t r a n g ẫ u n h i ê n 22 n g y :ho t h ấ y số k h c h t r u n g b ì n h m ộ t n g y l 37,2 v đ ộ l ệ c h t i ê u c h u ẩ n l 7,4 V i m ứ c ý n g h ĩ a 2% k i ể m đ ị n h x e m c h ủ q u n ă n n ó i c ó đ ú n g hay k h ô n g

10 M ộ t tay đ u a xe đ p n ó i r ằ n g m ỗ i n g y t r u n g b ì n h a n h t a đ p xe í t n h ấ t d ặ m ( t r o n g r ấ t n h i ề u n ă m ) C h ọ n ngấu n h i ê n n g y t r o n g sổ t a y a n h t a t h ì t h ấ y c c số l i ệ u ghi q u ã n g đ n g a n h t a đ i n h sau :

5,3 ; 4,5 ; 4,8 ; 5,1 ; 4,3 ; 4,8 ; 4,9 ; 4,7

V i m ứ c a = 5% c ó t h ể cho r ằ n g a n h t a n ó i đ ú n g hay k h ô n g ? 11 M ộ t t i n h b o c o r ằ n g t ỉ l ệ học s i n h đ ỗ t ố t n g h i ệ p c ủ a h ọ

l 88% M ộ t m ẫ u n g ẫ u n h i ê n g m 100 e m đ ợ c c i ọ n cho t h ấ y t r o n g đ ó c ó 82 e m đ ỗ V i m ứ c ý nghĩa a = 5% ,

k i ể m đ ị n h x e m p h ả i c h ă n g b o c o t i n h v é tỉ l ệ đ ỗ 88% l cao h n t h ậ t

(129)

thấy 125 người thích mua sản phẩm cơng t i Với mức ý nghĩa

5% k i ể m định xem có phải cơng t i nói q thật thay không

13. M ộ t nghiên cứu Bộ Y t ế cho r ằ n g 12% dân cư tinh A mắc bệnh đau mắt hột Chọn ngẫu nhiên 200 người đ ể k h m mắt, p h t 21 người bị đau mắt hột K i ể m định xem tỉ l ệ 12% nêu có đ ú n g k h ô n g với mức ý nghĩa a = 0,01 14. M ộ t p h n g p h p đ iều t r ị bệnh quảng cáo r ằ n g chữa

khỏi cho 75% bệnh n h â n m c bệnh A. Trong n h ó m 120 n g i sử dụng p h n g p h p đ i ể u trị có 82 n g i k h ỏ i Với mức ý nghĩa a = 0,05 n h ậ n định xem lời quảng cáo có p h ả i cao thực t ế hay không

15. M ộ t t r u n g t â m cai nghiện ma túy công bố r ằ n g n h i ề u n h ấ t 22% số bệnh n h â n họ m c nghiện trở l i t r o n g v ò n g n ă m M ộ t cuộc nghiên cứu theo dõi 35 bệnh n h â n t t r u n g t â m n y t r vé cho thấy có 10 người mắc nghiện trở l i Với mức ý nghĩa 1% nhận định xem công bố t r u n g t â m có cao so với thực t ế không

16. M ộ t báo cáo r ằ n g số n h â n viên họ có n h ấ t 35% n ữ K i ể m t r a ngẫu n h i ê n danh sách 92 n h â n viên cho thấy có 22 n ữ Sử dụng p - giá t r ị nhận định xem báo cáo n y có đ ú n g k h ô n g với mức ý nghĩa a = 0,025

17. G i ả i t o n Ì p h n g p h p sử dụng p - giá t r ị

18. G i ả i t o n cách sử dụng phương p h p p - giá t r ị

19. Chi n h n h đ i ệ n lực quận A ghi l i vụ báo x i n chữa đ i ệ n t r o n g t u ầ n n h sau

Chủ nhật Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáu Thứ bảy

22 12 15 14 27 35

Căn t r ê n số l i ệ u này, với mức ý nghĩa a = 0,01 nhận định xem cố vé điện có xảy với xác suất n h t r a n g ngày t r o n g t u ấ n hay không

(130)

20 Hai xúc sác n é m 360 l ầ n , m ỗ i n g i ta tính t ổ n g số n ố t ghi t r ê n mặt hai xúc sắc kết cho sau : Tổng 10 l i 12

T ẩ n số 15 26 42 50 65 48 44 32 22

Với mức ý nghĩa a = 5% n h ậ n định xem có p h ả i hai xúc sắc c h ế tạo c â n đ ố i hay k h ô n g

2 D â n cư t r o n g m ể t nước X có p h â n bố n h ó m m u n h sau : 45% n h ó m o ; 40% n h ó m A, 10% n h ó m B 5% n h ó m AB M ể t n h ó m gồm 200 n g i nước Y k i ể m t r a n h ó m m u cho k ế t q u ả sau :

N h ó m m u A B AB

Số người 80 72 24 24

Dựa t r ê n số l i ệ u này, với mức a = 5% ta có t h ể k ế t l u ậ n r ằ n g d â n cư nước Y có p h â n bố n h ó m m u k h c với d â n cư nước X hay k h ô n g

22 Trong mểt nghiên cứu vế thời gian m ể t đứa t r ẻ tuổi học d ù n g đ ể xem t i v i , người ta thấy r ằ n g mểt nhóm 30 đứa t r ẻ thời gian trung bình xem t i v i m ể t tuần 48 giờ với để lệch tiêu chuẩn 12,4 già. Tìm khoảng tin cậy cho để lệch tiêu chuẩn t ấ t đứa t r ẻ với để tin cậy 98%

23 m ể t k h c h sạn n g h i ê n cứu cho thấy t h i gian đợi phục vụ m ể t k h c h h n g m ể t Đ L N N có p h â n bố chuẩn với t r u n g bình 3,4 phút để lệch tiêu chuẩn 2,75 phút

(131)

DẤP SỐ VÀ C H Ỉ D Ẫ N

1 T = 1,33 ; c = 1,64 Chấp n â n Ha

2. T = 2,99 ; c = 1,69 Bác bỏ HQ T = 1,67 ; c = 1,96 Chấp n h ậ n Ha

4 T = 2,07 ; c = 1,64 Bác bỏ Hữ

-5 T = 2,03 ; c = 1,28 Bác bỏ HQ 6 T = ; c = 1,753 B c bỏ HQ

7 T = 1,18 ; c = 2,201 Chấp nhận Ha T = ; c = 1,833 Bác bỏ J /0

9. T = 3,29 ; c = 2,518 Bác bỏ HQ

10. T = 1,82 ; c = 1,895 Chấp n h ậ n Ha

11 T = 1,875 ; c = 1,64 Bác bỏ #G

12. T = 3,65 ; c = 1,64 Bác bỏ HQ

13 | r | = 0,65 ; c = 1,96 Chấp n h ậ n Ha

14. T = 1,75 ; c = 1,64 Bác bỏ HQ

15 T = Ì ; c = 1,64 Chấp n h ậ n i / D

16 i n = 2,2 ; p = 0,0139. Bác bỏ HQ

17. p = 0,0918

18 p = 0,0041

19 T = 28,42 ; c = 16,812 B c bỏ HQ

20 T = 3,91 ; c = 19,675 Chấp n h ậ n Ha

21. T = 22,3 ; c = 7,815 Bác bỏ Ha

22 [2,06 ; 3,85]

23. T = 20,64 ; c = 17,708

T > c , k h ô n g b c bỏ H K ế t l u ậ n : C h a có sở đ ể cho r ằ n g c ả i t i ế n đ ã l m giảm độ lệch tiêu chuẩn m ộ t cách có ý nghĩa với mc ý nghĩa a = 5%

(132)

Chương V

BÀI TOÁN SO SÁNH

Trong chương trước c h ú n g ta đ ã xét t o n k i ể m định g i ả t h i ế t vé tham số của tập hạp chính (trung bình, p h n g sai tỉ l ệ ) Trong c h n g n y c h ú n g ta xét t o n so s n h tham số hai hay nhiều t ậ p hợp Đó t r o n g số vấn đề lí t h ú v ích l ợ i n h ấ t Thống kê T h ậ t vậy, sống h n g n g y n h công t c n g h i ê n cứu c h ú n g ta luôn p h ả i làm p h é p so s n h : So s n h chất lượng hai loại sản phẩm, loại dịch vử, so s n h hai hội đ ầ u tư, so s n h hai p h n g p h p dạy học, v.v

§1 SO SÁNH HAI GIÁ TRỊ TRUNG BÌNH

Giả sử X Y hai ĐLNN có phân bố chuẩn X Ninv dị)

và ^ N(ju2, àị)ị c h ú n g ta muốn so s n h [lị2 dựa t r ê n hai

mẫu quan s t độc l ậ p của X Y

Giả sử {Xj xn } một mẫu ngẫu nhiên kích thước n rút t t ậ p hợp c h í n h , bao gồm t ậ p hợp t ấ t giá trị có t h ể có của X, {yv ym) mẫu ngẫu n h i ê n kích thước m r ú t t t ậ p hợp c h í n h bao gồm t ậ p hợp t ấ t giá t r ị có t h ể cđ của Y. Hai m ẫ u nói t r ê n giả t h i ế t độc lập với

a) Phương sai ớị v dị đá biết

Bài tốn Ì

Ta muốn k i ể m định g i ả t h i ế t

H0V\ = Vi

(133)

với đ ố i t h i ế t

Hy : Vi * n2

Test thống kê chọn

* -ỹ

're ni

T h ố n g kê T cho ta m ộ t hình ảnh vé sai k h c giữa / l ị fi2 -T h n h t h ta bác bỏ HQ khi I Tị lớn m ộ t cách có ý nghĩa

M i ề n b c bỏ HQ có dạng

A = ị\ Tị > c)

N ế u g i ả t h i ế t HQ đ ú n g (tức là /JỊ = ụ2) t h ì Đ L N N T có p h â n

bố chuẩn tắc ÀT(0,1)

V ậ y với mức ý nghĩa a cho hịng số c t ì m từ điều kiện

P { | r | > c } = a ~ CD(C) = Ì - | ,

=> c p h â n vị mức Ij- p h â n bố chuẩn t c

Thí dụ 1. Từ hai tập hợp có p h â n bố chuẩn X Y ta lấy hai m ầ u độc lập với kích thước t n g ứng là n = 40

m = 50 Trung bỉnh m ẫ u t í n h là X = 130, ỹ = 140

B i ế t r n g t ậ p hỢD của X có giá t r ị t r u n g bình /Ắị (chưa

biết) v p h n g sai là dị = 80 ; tập hợp c h í n h của Y có giá t r ị

t r u n g bình ụ2 (chưa biết), với p h n g sai = 100 Với mức ý nghĩa a = 0,01, k i ể m định giả t h i ế t :

H o A«1 = À*

với đ ố i t h i ế t HỊ : / / j * fi2 Giải Ta có

1 -

(134)

H ằ n g số c t n g v i coi mức a = 0,01 c = 2,58 Vì I T i = > 2,58, ta bác bỏ H

Bài toán Ta muốn k i ể m định g i ả t h i ế t :

HQ : M l = n2

với đôi t h i ế t H : ụ ị > /u2

-Test thống kê chọn

X - ỹ

V n m

HG bị b c bỏ n ế u T lớn m ộ t cách có ý nghĩa M i ê n b c bỏ có d n g

{T > c)

H ắ n g số c chạn t đ iề u k i ệ n P { T > c} = a

=> c p h â n mức a p h â n bố chun tắc

T n g t ự với đ ố i t h i ế t Hị : ụ ị < ^2 t h ì test thống kê ỹ - ĩ

chọn là T

ĩ n m m

với h ằ n g số c t í n h n h t r ê n B

Thí dụ 2. Với mức ý nghĩa a = 5% k i ể m định g i ả t h i ế t sau : a) HD : nx =2

H L : MỊ > M2

với số l i ệ u cho n h sau :

n = 50 ; m = 32 ; X = 105 ; ỹ = 98 ; õ\ = 400 ; dị = 256

b) Ho Mị = f*2

với số liệu n h sau

(135)

1,64

T > c ta b c bỏ Ha -

b) T = ; = 2,77 ;

36 64 25 + 35 í

c = 1,64

Do t a bác bỏ HQ g

b) P h n g sai dị v dị chưa biết mấu lớn (n > 30, m > 30)

Trong trường hợp ta d ù n g test thống kê n h a), t r o n g p h n g sai c h a b i ế t õị Ớị t r o n g c ô n g thức của T thay c c phương sai m ẫ u dị v à dị. N h test t h ố n g kê T

được d ù n g

T =

TỈM

Chú ý r ằ n g nếu n, > 30 t h ì theo định lí giới h n t r u n g t â m , T có p h â n bố x ấ p xỉ p h â n bố chuển tắc cho d ù X v à Y

k h n g có p h â n bố chuển

Thí dụ 3. Người t a t i ế n h n h m ộ t n g h i ê n cứu v ề đ i ể m t r u n g bỉnh v ậ n động viên t h ể dục n ă m 1970 v n ă m

1995 M ộ t m ẫ u gồm 35 VĐV n ă m 1970 có số đ i ể m t r u n g bình 267 với độ lệch t i ê u chuển 27 M ộ t m ẫ u gồm 40 VĐV n ă m 1995 có số đ i ể m t r u n g bình 255 với độ lệch tiêu chuển 30 K i ể m định xem có k h c hay k h ô n g

(136)

hai t h ế hệ vận động viên n ă m 1970 1995 Mức ý nghĩa là a = 5%

Giải. Giả t h i ế t HQ khẳng định r ằ n g k h ô n g có sai k h c

H: f il = M2

trong đối t h i ế t

Hị : ft ị *

ụ2-m , m 2 6 7 - 2 5 5

Ta có T = — = 1,82 72 302

~35+~ĨÕ ĩ

Với mức a = 5% c = 1,96

I k có T < c, ta chấp n h ậ n HQ Vậy khơng có sở đ ể

cho có khác hai t h ế hệ vận động viên. m

Thí dụ 4. Ngưồi ta t i ế n h n h n g h i ê n cứu đ ể so

s n h mức lương t r u n g bình phụ n ữ với mức lương t r u n g bình nam giới m ộ t c ô n g t i lớn M ộ t m ẫ u gồm 100 phụ nữ có mức lượng t r u n g bình 7,23 đôla /giồ với độ lệch tiêu chuẩn 1,64 đ ô l a / giồ M ộ t mẫu gồm 75 nam giới có mức lượng t r u n g bình 8,06 đơla/ giồ với độ lệch tiêu chuẩn 1,85 đ ô l a / g i Số l i ệ u cho có chứng minh r ằ n g mức lương t r u n g bỉnh phụ nữ công t i t h ấ p nam giới hay k h ô n g ?

Mức ý nghĩa a = 1%

Giải. Kí hiệu lương t r u n g bình nữ và /u2 lương

t r u n g bình nam Giả t h i ế t H0

Vì c h ú n g ta nghi ngồ r n g l n g phụ nữ thấp lương nam giới nên đ ố i t h i ế t

(137)

Với mức a = 0,05 ta có c = 2,33

T > c đó Ha bị bác bỏ Nghĩa mức lương t r u n g bình

của phụ nữ thấp mức l n g t r u n g bình nam giới

c ô n g t i này. gi

c) M ấ u n h ỏ in < 30 h o ặ c m < 30) n h n g p h n g sai

áị = Ớị ( c h a b i ế t )

G i ả sử X, Sj t r u n g bình m ẫ u độ lệch tiêu chuẩn m ẫ u

của { Xị , xn } ỹ, s2 trung bình mẫu độ lệch tiêu

chuẩn m ẫ u { j j ,2, yn }

G i ả sử õ2 giá trị chung hai p h n g sai

C h ú n g ta ước lượng p h n g sai chung

n m 2 ( x , - i ) + 2 i - ỹ ) 2

, / = Ì í = Ì

s

-n + —

(TI - l)sị + (m

-TI +m —

Tềst thờng kê chọn

ĩ - X - ỹ

V n m li n m

T h n g kê T sẽ cho ta m ộ t h ì n h ả n h sai k h c giữa ụ ị ụ2- N g i ta ta chứng minh r ằ n g HQ đúng, X Y

p h â n bờ chuẩn, thì T có p h â n bờ Student với n + m -

(138)

bậc tự N h lập l u ậ n t n g t ự n h c c mục trước, : với t o n k i ể m định phía

H o : Vi = H

H \ • Vi * y "

m i ề n b c bỏ Hn có dạng

A = {ị Tị > c }

trong c số thỏa m ã n điểu k i ệ n

Ỹ{ \T \ > c } = a

Suy c p h â n vị mức lị- p h â n bố Student với n + m -

bậc tự

Với t o n k i ể m định phía

H o • Vi = f*2

Hl : ụ > f i2

thì m i ê n bác bỏ Ha dạng

A = ị T > c }

trong c h n g số thỏa m ã n điều k i ệ n

P { T > c } = a

Suy c phân vị mức a phân bố Student với n + m - bậc tự

Thí dụ Ca quan k h ô n g gian M ỹ (NASA) đ ã kí hợp đống với hai cơng ty A B sửn x u ấ t t h ứ pin d ù n g cho vệ t i n h viễn t h ô n g

Dựa t r ê n k ế t quử pin t h nghiệm, NASA

định chọn công t i làm n h cung cấp pin cho vệ t i n h viễn t h ô n g Công ty A sửn x u ấ t t h được l o chiếc, có t u ổ i thọ t r u n g bình là 4,8 năm độ lệch tiêu chuẩn là 1,1 năm Công

(139)

t i B sản x u ấ t t h 12 chiếc, với t u ổ i t h ọ t r u n g bình 4,3

năm độ lệch t i ê u chuẩn 0,9 năm

Giả sử r ằ n g t u ổ i t h ọ pin do A B sản xuất có p h â n bố chuẩn p h n g sai n h Với mức ý nghĩa a = 1%, k i ể m định xem có k h c vé t u ổ i t h ọ t r u n g bình hai loại pin hay k h ô n g

Giải. Giả t h i ế t

HQ : ạỊ = ụ2

Đối t h i ế t là Hị : ụl * /u2

Các số l i ệ u đ ã cho n h sau

C ô n g ty A :

n = lo , X = 4,8,Si = 1,1

Công ty B : m = 12, y = 4,3, s2 = 0,9 P h i í n g sai chung ước lượng

( - ) ( , )2

+ ( - ) ( , )2

19,8

s

2 - 10 + - ~ 20 " u , y y

4 , - , 0,5

Vâyvạy , T = = — = Ì 174 1,1/* l ĩ )

V i a = 0,01, t r a bảng p h â n bố Student với 20 bậc tự ta t i m

c = ta = t 0 ữ = 2,845 2

I Tị < c , ta khơng ctí cơ sở bác bỏ HQ. V ề mặt tuổi

t h ọ pin c ô n g ty A công ty B ngang Do NASA cần p h ả i x é t y ế u t ố k h c giá t h n h , độ t i n cậy đ ể

quyết định lựa chọn m ì n h gi

Thí dụ 6. N g i ta ghi l i sản lượng lúa mì, t í n h bằng tạ

t r ê n hécta, m ả n h ruộng bón lót 50 100 đơn vị đ m t r ê n m ộ t h é c t a

(140)

Bón 50 đơn vị : 47,2 43,1 35,7 47,0

45,7 42,6 46,7 42,3

Bón 100 đơn vị : 47,9 48,9 43,5 53,1 50,8

46,1 41,1 43,0 41,0 48,5 47,7

Có t h ể k ế t luận bón lót 100 đơn vị đ m cho n ă n g suất cao bón lót 50 đơn vị đ m hay k h ô n g ?

Mức ý nghĩa a = 5%

Giải. Gọi fẨ sản lượng t r u n g bình bón lót 100 đơn vị

đ m và ự2 sản lượng t r u n g bình k h i bón lót 50 đơn vị đ m Ta thừa nhận r n g p h n g sai hai sản lượng b ằ n g (giả

t h i ế t hợp lí đ ố i với c ù n g m ộ t loại t h ì c h â m sóc khác k h n g làm thay đ ổ i p h n g sai sản lượng) G i ả

t h i ế t H Q : y M j = ^

-Giả t h i ế t đ ố i lập H j : fẲ\ > fi2

-ơ c h ú n g ta t i n cách tiên r ằ n g việc t ả n g từ 50 đơn vị đ m lên 100 đơn vị đ m k h ô n g t h ể làm cho sản lượng

Tính tốn cho ta : X — 40,54 ; ỹ = 43,85 ;

s = 3,84 , - ,

Vậy T = ;

— = 1,49

3,84

Tra bảng p h â n bố Student với + 11 - = bậc tự ta t ì m :

c =

^0,05 ~

T < c nên ta định giữ giả thiết HQ Chưa có sở đ ể cho r ằ n g bón 100 đơn vị đ m t ố t 50 đơn vị đ m •

(141)

í

d ) K h o ả n g t i n c ậ y c h o h i ệ u s ô / / ị - ụ2

K h i b i t o n k i ể m đ ị n h d ẫ n t i b c b ỏ H , m ộ t c â u h ỏ i đ ặ t r a t i ế p t h e o l : H ã y t ỉ m k h o ả n g t i n c ậ y c h o h i ệ u s ố / / ị - fi2

-T r o n g t r n g h ợ p dị v à ỡị đ ã b i ế t c ó t h ể c h ứ n g m i n h đ ợ c r n g đ i l ợ n g n g ẫ u n h i ê n

( x - ỹ ) - Ọ , - f i 7 )

ì n m

p h â n b ố c h u Ị n t ắ c N(0,l). C h o t r c đ ộ t i n c ậ y /3, đ ặ t a = Ì - ịi

K í h i ệ u zaỊ2 l p h â n v ị m ứ c ^ c ủ a p h â n b ố c h u Ị n t c K h i đ ó

p{r > z a a ) = « / ;

P { r < - * « } = f í

d o đ ó PỊ - Z ữ / 2 < r Si zữ / 2 Ị = Ì - a = / ỉ

T đ ó s u y r a k h o ả n g t i n c ậ y v i đ ộ t i n c ậ y Ịi ( 0 %) c h o h i ệ u s ố g i ữ a h a i g i t r ị t r u n g b ì n h / / ] - l

_ ị Ổ\ Ổị ạ-ỳ) ± zaỉ2^uA + ul

» n m

T r o n g t r n g h ợ p õị v à dị c h a b i ế t n h n g m ẫ u l n (n, m > ) , t a c ó t h ể t h a y ƠJ v | b i p h n g s a i m ẫ u sỊ và s | t r o n g c ô n g t h ứ c t r ê n ( t r o n g t r n g h ợ p n y k h ô n g c ầ n g i ả t h i ế t t ậ p h ợ p c h í n h c ó p h â n b ố c h u Ị n )

Thí dụ 7. T m ộ t t ậ p h ợ p c h í n h t h ứ n h ấ t v i g i t r ị t r u n g b ì n h / / j ( c h a b i ế t ) n g i t a l ấ y r a m ộ t m ẫ u k í c h t h c n = 0 v t ì m đ ợ c X = v S j = 2 T t ậ p h ợ p c h í n h t h ứ h a i

(142)

v i g i t r ị t r u n g b ì n h fi2 ( c h a b i ế t ) n g i t a l ấ y r a m ộ t m ẫ u

k í c h t h c m = 800 v t ì m đ ợ c = 523 v s2 = 185 a) K i ể m đ ị n h g i ả t h i ế t Ha : [tị =1*2

v i đ ố i t h i ế t H j : ụ ị ^1^2

ở mức a = 5%

b) N ế u ^ fi2 h ã y t ì m k h o ả n g t i n c ậ y cho ịix - '/u2 v i đ ộ

t i n c ậ y 95%

Giải a) Test t h ố n g k ê l

452 - 523

í 2 22 52 -7,926 + •

1200 800

H ằ n g số c 1,96 Ta có I Tị > c v ì v ậ y Ha bị bác b ỏ b) Áp d ụ n g c ô n g t h ứ c t r ê n , k h o ả n g t i n c ậ y c ủ a /Ầl - n2 l

(523 - 453) ± 1,96 lỊ^-Q + 0

= [53,44 ; 8 , ] H

T r o n g t r n g h ợ p m ẫ u n h ỏ (n, m < ) , p h n g sai

dị v à õị c h a b i ế t n h n g b ằ n g n h a u , c ó t h ể c h ứ n g m i n h đ ợ c r ằ n g đ ệ i l ợ n g n g ẫ u n h i ê n

(ã -ỹ)-(M: -ụ?) 22 52

T =

Y n ni

có p h â n số S t u d e n t v i n + m - b ậ c t ự

Cho t r c đ ộ t i n cậy /3, đ ặ t a = ỉ - (ỉ ; k í h i ệ u ta/2 l p h â n vị m ứ c ^ p h â n b ố S t u d e n t v i + 7 1 - bậc t ự

L ú c đ ó

(143)

VÍT < -t a

l ' "/ 2J " T h n h t h

- t m ^ T < ta / 2 Ị = Ì - a = p

Từ suy khoảng t i n cậy p. 100(%)

cho h i ệ u số / /Ị - ,«2 t r n g hợp :

TVÚ d ụ ổ M ộ t b c sĩ mở hai p h ò n g k h m nằm hai khu phố k h c Ô n g t a m u ố n khảo s t xem có k h c số bệnh n h â n t r u n g b ì n h đế n k h m t r o n g ngày hai p h ị n g k h m hay k h ô n g

ở p h ị n g k h m A, n g ta chớn ngẫu n h i ê n lo ngày thấy r ằ n g số bệnh n h â n t r u n g b ì n h 26 với độ lệch tiêu chuẩn p h ò n g k h m B, ô n g ta chớn ngẫu n h i ê n ngày thấy r ằ n g số bệnh n h â n t r u n g b ì n h 21 với độ lệch tiêu chuẩn

a) K i ể m định xem có k h c hay k h ô n g với mức ý

nghĩa a = 5%

b) N ế u có, h ã y cho m ộ t khoảng t i n cậy 95% cho hiệu số chênh lệch bệnh n h â n hai p h ò n g k h m

Giải. Số l i ệ u m ẫ u cho ta

X = 26 ; S j = ; n = 10 ;

y = 21 ; s2 = ; m Ta có

( - ) + ( - l ) 319

s ~ + - ~ 16 ~ ' ; 4, 465

(144)

2 -

I L £ i — = 2M7 = 2'36

-4,465 V n >

+ a) Ta k i ể m định g i ả t h i ế t hai p h í a

H: n = (12 với đối t h i ế t H j : / í - >

trong đó ụ ị số bệnh n h â n t r u n g b ì n h p h ó n g k h m A, ụ2

là số bệnh n h â n t r u n g bình p h ò n g k h m B

Với a = 0,05, tra bảng phân bố Student với 16 bậc t ự cho ta

c = tan = ^0.05 ~ 212

T i > c ta bác bỏ

o

b) Khoảng t i n cậy 95% cho h i ệ u số giưa số bệnh n h â n t r u n g bình đế n k h m hai p h ò n g k h m t r ê n

(26 - 21) ± (2,12).(4,65)

= ± 4,488 = [0,512 ; 9,488] H

Chú thích. C h ú n g ta có t h ể sử d ụ n g p h â n m ề m thống kê Minitab đ ể t i ế n h n h so s n h Giả sử r ằ n g hai mẫu số l i ệ u nhập vào hai cỉt Cj C2 ta m u ố n k i ể m định g i ả t h i ế t

H : [i = ^2 đ ố i t h i ế t hai p h í a H , : nx #2- K h i ta sề gõ l ệ n h

TWOSAMPLE 95 C1 C2 ALTERNATIVE =

Minitab h i ệ n cho ta t r ê n m n hình với m ỗ i tập số liệu giá t r ị t r u n g bình mẫu, đỉ lệch t i ê u chuẩn mẫu đỉ lệch tiêu chuẩn mẫu giá t r ị t r u n g bỉnh T i ế p cho ta khoảng t i n cậy 95% hiệu số hai giá t r ị t r u n g bình, giá t r ị thống kê T, số bậc t ự

Khi ta cẩn so s n h I Tị v i - h ằ n g số c. H ằ n g số c phụ thuỉc vào mức ý nghĩa a đ ã chọn

(145)

e) P h n g p h p so s n h c ặ p

G i ả s ử (X, Y) l m ộ t c ặ p g m hai đ i l ợ n g n g ẫ u n h i ê n ( n ó i c h u n g p h ụ t h u ộ c n h a u ) , v i KX = [Ã ị , EY = ụ2

-C h ú n g t a m u ố n so s n h /Uị v à ỊU2

-G i ả s ( X j , ỵ^), (x2 , ỵ2) > •••> (xn: yn) l n q u a n s t đ ộ c l ậ p

v ê (X, Ý). K h i đ ó t a c ó h a i m ẫ u c ó c ù n g k í c h t h c

ịx J xn} , { y ì , yn}

Tuy n h i ê n t a k h ô n g t h ể p d ụ n g đ ợ c quy t ắ c k i ể m đ ị n h c ủ a m ụ c t r c v ì h a i m ẫ u n y l p h ụ t h u ộ c

Đ ể g i ả i q u y ế t b i t o n n y t a x é t h i ự u số

D = X - Y

K h i đ ó g i t r ị t r u n g b ì n h c ủ a D l /< = / i ị - , u2 v c c g i t r ị dị — X - y- (í = Ì , 2, Ti) cho t a m ộ t m ẫ u g m n q u a n s t giá t r ị c ủ a D. G i ả t h i ế t t a m u ố n k i ể m đ ị n h

H G : f i l = ụ2

đ ợ c quy v ề b i t o n k i ể m đ ị n h g i ả t h i ế t

Ho Vị - M2 = 0 h a y H o • /"d = °>

ở đ ó = (Mj - j U2 l g i t r ị t r u n g b ì n h í ) N h v ậ y t a đ a b i t o n so s n h v é b i t o n k i ể m đ ị n h g i ả t h i ế t ve g i t r ị t r u n g b ì n h đ ã x é t t r o n g c h n g I V

Thí dụ 9. N g i t a t i ế n h n h m ộ t k h ả o s t v ề g i c ả c ủ a h a i cửa h i ự u t h ự c p h ẩ m l n t r o n g t h n h p h ố , 12 m ặ t h n g t h ô n g d ụ n g n h ấ t đ ợ c c h ọ n n g ẫ u n h i ê n v g i c h ú n g b n hai c a h i ự u đ ợ c g h i l i n h sau :

M ặ t h n g

H i ự u A 0,89 0,59 1,29 1,50 2,49 0,65 0,99 1,99 H i ự u S 0,95 0,55 1,49 1,69 2,39 0,79 0,99 1,79

(146)

Mặt hàng 9 10 l i 12

Hiệu A 2,25 0,50 1,99 1,79

Hiệu B 2,39 0,59 2,19 1,99

Với mức ý nghĩa a = 2% kiểm định xem có kiác

về giá bán hai cửa hiệu hay không

Giải Ta lập bảng giá trị hiệu số dị — Xị - Yị

Mặt hàng D = X-Y

1 -0,06

2 0,4

3 -0,20

4 -0,19

5 0,10

6 -0,14

7 0

8 0,20

9 -0,14

10 -0,09

l i -0,20

12 -0,20

Từ bảng ta tìm d = -0,073 ;

sd = 0,133

Chúng ta có tốn kiểm định

Ho •• ụđ = ;

Hì : M d *

Test thống kê T có giá trị

(-0,073 - ) VT2 _ 0,133

(147)

V i mức ý n g h ĩ a a = 0,02 t r a b ả n g p h â n bố S t u d e n t với

n - Ì = - = l i bậc tự do, ta c ó

c = í0 ( ) = 2,718

Tầ có I r ị = 1,921 < c Vậy ta k h n g c ó sở bác bỏ Ha g

Thí dụ 10 Đ ể khảo s t t c d ụ n g c ủ a v i ệ c b ó n t h ê m loại

phần A ngượi chia ruộng thí nghiệm l m hai m ả n h Một m n h đ ố i c h ứ n g ( k h ô n g b ó n p h â n A), m ả n h k i a c ó b ó n 70 đơn vị phân A S ả n lượng 17 ruộng ghi lại sau :

T h a ruộng M ả n h đối chứng Mảnh b ó n p h â n A H i ệ u s ố

1 55,8 60,4 4,6

2 53,3 58,7 5,4

3 30,1 28,9 - ,

4 51,0 48,0 - ,

5 37,8 39,7 1,9

6 68,6 68,8 0,2

7 57,7 57,5 -0,2

8 59,1 70,4 11,3

9 49,4 56,8 7,4

10 35,4 40,6 5,2

l i 53,4 57,3 3,9

12 42,7 44,3 1,6

13 21,2 32,2 11,0

14 28,3 47,7 19,4

15 57,3 77,0 19,7

16 42,4 55,1 12,7

17 61,4 66,1 4,7

Với mức ý nghĩa 5% h ã y n h ậ n đ ị n h xem v i ệ c b ó n p h â n có t c d ụ n g k h n g ? N ế u c ó h ã y t ì m khoảng tin cậy cho mức t ă n g s ả n lượng

(148)

Giải : C h ú n g t a có b i t o n k i ể m đ ị n h m ộ t p h í a :

H0 : ị.iủ = ( v i ệ c b ó n p h â n k h ô n g c ó t c d ụ n g )

v i đ ố i t h i ế t Hị : ụá > ( b ó n p h â n c ó t c d ụ n g ) T số l i ệ u t r ê n t a t ì m đ ợ c d = 6,15 ;

si = 4 , ; 6,694 Test t h ố n g k ê T c ó g i t r ị l

( , - 0) V _ = 6^694 - >

T r a b ả n g p h â n b ố S t u d e n t v i 17 - Ì = 16 b ậ c t ự v i a = 0,05, t a đ ợ c

c = ^0.05 = 1 ' 7 4 6 '

Ta c ó T > c n ê n t a b c bỏ H0. V i ệ c b ó n p h â n c ó -tác d ụ n g X c s u ấ t s a i l ẩ m l o i Ì ẫ đ â y l à 5%

( N ế u t a c h ọ n a = 1% t h ỉ c = 2,120 v ẫ n b é h n T, đ ó t a

c ũ n g v ẫ n b c b ỏ HD ở m ứ c n y )

T i ế p t h e o t a m u ố n b i ế t v i ệ c t ă n g s ả n l ợ n g c ó " đ n g k ể " k h ô n g ( n ế u t ă n g í t t h ì t a k h n g b ó n t h ê m p h â n A đề đ ỡ p h ả i c h i p h í t h ê m ) V ậ y t a c ầ n t ì m k h o ả n g t i n c ậ y cho m ứ c t â n g s ả n l ợ n g fid v i đ ộ t i n c ậ y 90%

V i a = Ì - 0,90 = 0,10, t r a b ả n g p h â n s ố S t u d e n t 16 bậc t ự cho t a

tan = <0,05 = l > l m -V ậ y k h o ả n g t i n c ậ y cho ụứ l

(6,694)

6,15 ± , 6v ' = 6,15 ± 2,83 V

hay [3,32 ; , ] B

Nhận xét. P h n g p h p so s n h t n g c ặ p c ó u đ i ể m h n p h n g p h p so s n h h a i m ẫ u đ ộ c l ậ p ẫ c h ỗ :

(149)

+ Nó k h n g c n g i ả t h i ế t vé p h n g sai õị ơ|

+ Nó t h n g cho k ế t xác đ ã loại bỏ n h ã n t ố ngoại lai ảnh hưởng đến giá t r ị t r u n g bỉnh Trong t h í d ụ t r ê n sản lượng thu t r ê n hai m ả n h c ù n g m ộ t ruộng rõ r n g t ì m đ iều k i ệ n g ầ n n h đừng nhất, k h c việc có bón p h â n A hay k h ô n g Tuy n h i ê n nhược đ iế m n ó việc bơ t r í t h í nghiệm phức t p h n Chảng hạn t r o n g t h í dụ t r ê n , p h n g p h p so s n h t n g cặp đòi hòi phải t r n g lúa t h í nghiệm t r ê n hai mảnh c ù n g m ộ t ruộng theo hai cách bón p h â n k h c

Chú thích. Đ ể sử d ụ n g Minitab p h n g p h p so s n h t n g cặp, ta t i ế n h n h bước sau : G i ả sử hai tập sô l i ệ u nhập vào cột C5 C6 Đ ầ u tiên ta d ù n g lệnh

LET C8 = C6 - C5

Lệnh n y cho p h é p t í n h hiệu số giá t r ị t n g cặp số l i ệ u lưu k ế t q u ả t r o n g cột C8

T i ế p ta d ù n g l ệ n h

TTEST o C8

Màn h ì n h cho ta giá trị test thống kê T

*§2 T I Ê U C H U Ẩ N P H I T H A M số

Các t i ê u chuẩn thống kê d ù n g đế k i ể m định k h c giá t r ị t r u n g bình hai tập hợp m ta t r ì n h bày t r o n g §1 gọi các kiềm dinh có tham số. C h ú n g phải dựa t r ê n g i ả t h i ế t quan t r ọ n g t ậ p hợp đ a n g xét có p h â n bố chuẩn kích thước mẫu k h lớn Nếu điêu k i ệ n t r ê n bị v i p h m tiêu chuẩn khơng t h ể sử dụng Trong t ì n h ta phải sử dụng các Tiêu chuẩn phi tham số

(150)

C ẩ n nhớ r ằ n g c c k i ể m đ ị n h phi t h a m s ố k h ô n g m n h b ằ n g c c k i ể m đ ị n h c ổ tham s ố T h n h thử n ế u đ iề u k i ệ n cho p h é p d ù n g k i ể m đ ị n h tham s ố đ ợ c t h ỏ a m ã n , ta n ê n d ù n g k i ể m đ ị n h c ó t h a m s ố

S a u đ â y c h ú n g ta s ẽ x é t hai t i ê u c h u ẩ n phi t h a m s ố t h ô n g d ụ n g n h ấ t

a) T i ê u c h u ẩ n h n g (còn gọi t i ê u c h u ẩ n M a n n - Whitney) G i ả sử ta c ó hai m ứ u n g ứ u n h i ê n đ ộ c lập với :

M ứ u thứ n h ấ t { X j , Xj, %n } n q u a n s t đ ộ c lập v ề Đ L N N X,

c ò n m ứ u t h ứ hai { j j , y2 , ••• , ym } l m quan s t đ ộ c lập v ề

Đ L N N Y P h â n bố c ủ a X v c ủ a Y c h a b i ế t v k h ô n g n h ấ t t h i ế t là p h â n bố c h u ẩ n Ta m u ố n k i ể m đ ị n h g i ả thiết

H : X Y c ó c ù n g p h â n s ố với đ ố i thiết Hị : X v Y k h c p h â n bố

T i ê u c h u ẩ n Mann - W n h i t n e y đ ợ c x â y dựng n h s a u :

i) G ộ p hai m ứ u t r ê n t h n h m ộ t m ứ u với cỡ m ứ u n + m

li) S ắ p x ế p n + m g i trị {xy xn, yì ym} theo thứ tự

t ă n g d ầ n G i ả sử sau s p xếp thu d ã y sau đậy C j < c 2 < c 3 < < c n + m

N ế u Xị = ck t h ì ta n ó i h n g c ủ a Xị k T n g tự n ế u

yj = ck t a n ó i hạng c ủ a Jy k

iii) G i ả sử Xị có h n g r (í = Ì , 2, , re) T a t í n h t ổ n g c c h n g c ủ a Xị

Ì?! = r, + r 2 + + rn

G i ả sử y- c ó h n g S | ( ỉ = Ì, , , m ) T ổ n g s ố h n g c ủ a yj

R2 = s , + s2 + + sm

Dĩ n h i ê n R , + fí, = r, + .+ r 1 / 1 n + S + + s „ , i ni =

(n + m + ì)(n + nì)

= + + +(n+ni) =- - ~ -

(151)

N g i ta đa chứng m i n h được r ằ n g nếu H(ì đ ú n g và n, m ^

thì Rị c ó p h â n bố xấp xỉ chuẩn với g i á trị t r u n g bỉnh :

n(n +m + )

=

và p h n g sai

nm(n + m + 1)

/y/ _ i Ì

ỡ« , 12

( T ợ n g t ự i? 2 có p h â n bố x ấ p xỉ chuẩn với giá t r ị t r u n g b ì n h

min + ni + 1)

/ X = ÍT—

J nm(n + m + 1) >

ơị = Ĩ ) •

T h n g t h n g c h ú n g ta chọn số nhỏ n h ấ t Ì? J i? ' G i ả sử /ỈJ < i ?2 K h i test t h ố n g kê ta sử dạng

\

C h ú n g ta bác bỏ H nếu mức ý nghĩa a I T I > c,

đó c p h â n vị mức ^ p h â n bố chuẩn tắc

Chú ý : a) N ế u t r o n g dãy (Cj) có giá t r ị t r ù n g ta quy ước h n g giá trị t r ù n g tính sau :

G i ả sử Ck - < ck = ck + l < ck +

k+k+ Ì K h i h n g của Cị. ck + 1 đ ể u được gán giá trị - —2 • H n g của Cị. + v ẫ n là k + 2. T n g tự có giá trị t r ù n g

Ck - 1 < c k = Ck + = ck + < ck + 3> t h ì hạng cùa ck, ck + > ck + 1 ) + ( Ã + )

đểu g n g i t r ị = k + Ì, Cịn c ^+ v ẩ n có h n g là k +

(152)

Thí dụ l i Một người lái xe t h n g xuyên l i hai địa đ i ể m A B. Có hai đ n g n ố i A B : đ n g X đ ò n g Y Anh ta m u ô n chọn đ n g n o m ấ t t h i gian Chọn ngẫu n h i ê n lo ngày t r ê n đ n g X 10 n g y t r ê n đường Y, anh t a có số liệu sau (thời gian t í n h p h ú t ) :

Đường X : 34 ; 28 ; 46 ; 42 ; 56 ; 85 ; 48 ; 25 ; 37 ; 49

Đường Y : 45 ; 49 ; 41 ; 55 ; 39 ; 45 ; 65 ; 50 ; 47 ;

Với mức ý nghĩa 5%, h ã y nhận định xem có m ộ t k h c thời gian l i sở dụng đường X đường Y hay không

Giải. Đ ầ u tiên ta nhận x é t r ằ n g t h i gian t r u n g b ì n h t r ê n đ n g X 45 p h ú t , t r o n g k h i t h i gian t r u n g bình t r ê n đ n g Y 48,5 p h ú t Tuy n h i ê n ta k h ô n g co' sở đ ể cho r ằ n g t h i gian t r ê n đường X t h i gian t r ê n đ n g Y có p h â n bố chuẩn hay xấp xỉ chuẩn với p h n g sai b ằ n g Do việc p dụng test thống k ê Student đ ã t r ì n h bày phẩn trước k h ô n g "hợp pháp" T h n h t h ta p d ụ n g t i ê u chuẩn hạng Mann - Whitney

Đ ấ u tiên ta lập bảng xếp h n g số l i ệ u

H n g Thời gian Đường

1 25 X

2 28 X

3 34 X

4 37 Y

5 39 Y

6 41 Y

7 42 X

8 43 Y

9 45 X

10 46 X

l i 47 Y

(153)

H n g Thời gian Đường

12 48 X

13 49 X

14 49 Y

15 50 Y

16 51 Y

17 55 Y

18 56 X

19 65 Y

20 85 X

(Ta t h ấ y có hai số l i ệ u t r ù n g đề u 49 C h ú n g vị t r í 13 14 ta g n cho c h ú n g c ù n g hạng 13,5)

T ố n g hạng đ n g X

R = + + + + - + 12 + 13,5 + 18 + 20 = 90,5 Vì n = 10, m = 10 l n h n n ê n R có p h â n bố xấp xỉ chuẩn với kỉ vọngR = ^ ( + 10 + 1) = 105

và p h n g sai :

(10)(10)(10 + 10 + 1)

õị = = 175 Giá trị test t h ố n g kê

R-f*R , -

T =

VT75 = - ,

V i mức a = 5% h n g sô c p h â n vị mức p h â n bố chuẩn t c Vậy c =F 1,96

Ta có ị Tị = 1,1 < 1,96, ta k h ô n g có sở b c bể HQ C h ú n g ta t m t h i k ế t l u ậ n r ằ n g t h i gian hai đường

X Y k h ô n g k h c

b) Tiêu chuẩn dấu tiêu chuẩn hạng có dấu Wilcoxon Ờ § , đ ể so s n h h i ệ u q u ả hai p h n g p h p t c động lên c ù n g m ộ t cá t h ể , c h ú n g t a đ ã sử dụng p h n g p h p so s n h

(154)

t n g cặp P h n g p h p n y đòi hòi giả thiết quan t r ọ n g h i ệ u s ố hai p h é p đo phải c ó p h â n bố c h u ẩ n hay xấp xỉ c h u ẩ n N ế u giả thiết n y k h ô n g thỏa m ã n , c h ú n g ta c ầ n sử d ụ n g đế n c c t i ê u c h u ẩ n phi t h a m số Trong tiết n y c h ú n g t a s ẽ l m quen vứi hai t i ê u c h u ẩ n phi tham s ố t h ô n g d ụ n g :

tiêu chuẩn dấu v tiêu chuẩn hạng có đẩu Wilcoxon

i) Tiêu chuẩn đẩu G i ả sử (X, Y) cặp gồm hai Đ L N N T a c ó t h ể coi t h n h p h ầ n thứ n h ấ t X l h i ệ u c ủ a p h n g p h p thứ n h ấ t , c ò n Y h i ệ u c ủ a p h n g p h p t h ủ hai t c đ ộ n g l ê n c ù n g cá t h ể (đối tượng) 1k muốn k i ể m định giả thiết

HQ : "Hiệu q u ả c ủ a p h n g p h p thứ n h ấ t v c ủ a thứ hai

n h nhau"

G i ả sử ( j C j , yộ (x2, y2) > •••! (*nj v n ) n quan s t độc lập v é

(X, Y) Đ ặ t dị = Xị- J j Ta loại bỏ c c dị c ó giá trị b ằ n g

c h ú n g k h ô n g đ e m l i t h n g tin G ọ i n s ố c c d c ó g i trị

k h c v n+ s ố c c s ố h n g dị m a n g dấu + N ế u giả thiết

H l đ ú n g s ố c c số h n g m a n g dấu + c ó xu hưứng

s ố c c s ố h n g m a n g dấu - T h n h thử H0 đ ú n g t h ì n+ s ẽ c ó p h â n b ố n h ị thức vứi t h a m s ố Ỳ = 0,5 TI Ta biết r ằ n g n ế u

~ „ i n+

n(0,S) > <=*n > lo t h ì t ẩ n s u ấ t f = s ẽ có p h â n bố xấp xỉ

n

c h u ẩ n vứi kì vọng 0,5 v độ lệch t i ê u c h u ẩ n

s ẽ c ó p h â n bố c h u ẩ n t ắ c Do vứi mức ý nghĩa a cho v

đối thiết hai phía :

Hị : "Có k h c nhau"

ta bác bỏ HQ I Tị > za ỉ 2

TI

T h n h thử test t h ố n g kê sau đ â y

T = ự - 0,5)2 = 2n

+ - n

(155)

Còn với đối t h i ế t phía

Hị : "Phương pháp thứ hiệu phương p h p t h ứ hai", ta bác bỏ É khi T > z x (ở đây zx kí hiệu p h â n vị mức a c ù a p h â n bố chuẩn tác)

Thí dụ 12. M ộ t t h ầ y giáo dạy Toán cho r ằ n g việc cho học sinh ơn t ậ p Ì t i ế t cuối kì k i ẫ m tra có tác dụng t ố t đế n k ế t học t ậ p em M ộ t mẫu gồm 21 học sinh chọn đ ẫ theo dõi đ i ẫ m em trước sau ôn t ậ p K ế t q u ả ghi l i n h sau :

Học sinh Điẫm thi trước Đ i ẫ m t h i sau

1 22 21

2 26 29

3 17 15

4 20 20

5 28 26

6 31 32

7 23 25

8 13 14

9 19 19

10 25 27

l i 28 27

12 24 25

13 27 27

14 18 20

15 20 23

16 14 16

17 24 26

18 15 20

19 19 20

20 18 17

21 27 19

(156)

Trên sở khảo s t n y có t h ể k ế t l u ậ n r ằ n g sau ôn tập, kết thi cùa em có t ố t khơng ? Mức ý nghĩa 57r

Giải. Kí hiệu p tỉ l ệ học sinh có đ i ể m t h i sau cao đ i ể m thi trước Tia có t o n k i ể m định giả t h i ế t

Ha : p = 0,5

với đối t h i ế t m ộ t phía

Hị : p > 0,5

K i hiệu hiệu số số đ i ể m t h i sau số đ i ể m t h i trước Tk có bảng sau

Học sinh H i ệ u số d Dấu ca ả

1 -

-2

-3 -2 +

4

-5 -2

6

-7 +

8 +

9 0

10 +

l i -

-12 +

13 0

14 +

15 +

16 +

17 +

18 +

19 +

20 -

-21 +

(157)

Ta có n = 18 ;

n+ = 13 ;

/" = ! ! = ° >7 2 ;

2 n + - n 8

' - ^ - - - ã ã ô * V i m ứ c ý nghĩa a = 0,05 ta c ó

c = z0.05 = 1 > 6 4

T > c, ta b c bỏ Ha. N g h ĩ a việc cho h ọ c s i n h n tập

c ó t c d ụ n g cải t i ế n k ế t q u ả h ọ c tập c ủ a c c em l i ) Tiêu chuẩn hạng có dấu Wilcoxon

Trong t i ê u c h u ẩ n d ấ u quan t â m tới d ấ u c ủ a c c h i ệ u s ố d-, t h ì t i ê u c h u ẩ n h n g c ó dấu Wilcoxon ta c ị n t í n h đế n đ ộ lớn c ủ a I GỈ-1 N h t i ê u c h u ẩ n n y s ẽ h i ệ u q u ả h n t i ê u c h u ẩ n dấu C c bước t i ế n h n h thịc h i ệ n n h sau :

+ X u ấ t p h t từ hai m ẫ u ta t í n h dị = Xị - ỵv

+ B ỏ qua c c g i trị dị = + T í n h h n g c ủ a \d{\ (dị * 0)

G ọ i n số c c g i trị dị

R+ t ổ n g h n g c ủ a |rfị| với d{ >

R~ t ổ n g c c h n g c ủ a \d-\ ứ n g với dị <

K h i đ ó c ó t h ể c h ứ n g m i n h nếu H đ ú n g R+ ÍT n (n + ì)

đề u c ó c ù n g p h â n bố với kỉ v ọ n g v p h n g sai

n(n + l)(2n + Ị)

24

N ế u n ^ t h ì R+, R~ có p h â n bố xấp xỉ c h u ẩ n T h n h thử

test t h ố n g k ê s a u đ â y :

(158)

R -n(n + l ) / T = ~ Z ^ Z Z Z Z Z Z Z Z

, I rc(rt + l ) ( r t + 1)

V

s ẽ c ó p h â n b ố M O , ) , t r o n g đ ó R l R+ h o ặ c R~ ( t h n g t a l ấ y s ố n h ỏ n h ấ t t r o n g h a i s ố đ ó ) G i ả t h i ế t H b ị b c b ỏ m ứ c ý nghĩa a I Tị > z a r

Thí dụ 13 C ó ý k i ế n c h o r ằ n g t r o n g h a i a n h e m t r a i n g i e m l u ô n c a o h n n g i a n h M ộ t m ẫ u n g ẫ u n h i ê n g m c ặ p a n h e m t r a i đ ợ c c h ọ n ; c h i ế u cao c ủ a n g i a n h ( X ) v c ủ a n g i e m ( Y ) đ ợ c g h i l ụ i n h sau ( đ n v ị l em) :

1 6 7 6 * i 6 6 y> 6 6 6

x , 6 6 8

1 7 xi 6 8 9 y\ 7 6 xi 9 6 ý* 6 6 6

V i m ứ c ý n g h í a a = , s d ụ n g t i ê u c h u ẩ n h ụ n g c ó d ấ u W i l c o x o n k i ể m đ ị n h x e m l i ệ u c h i ê u c a o t r u n g b ì n h c ủ a h a i a n h e m t r a i l k h c n h a u h a y g i ố n g n h a u

(159)

yị d ,

H n g H n g với H n g v i

I yị K I d > d <

170 175 - 23 23

169 172 - 17 17

167 167 0

168 166 +2 10 10

166 163 +3 17 17

165 166 -1 3,5 3,5

165 164 +1 3,5 3,5

164 167 - 17 17

164 163 +1 3,5 3,5

165 167 - 10 10

166 168 - 10 10

166 164 +2 10 10

169 170 -1 3,5 3,5

168 172 - 21,5 21,5

168 171 - 17 17

166 170 - 21,5 21,5

168 167 +1 3,5 3,5

168 165 +3 17 17

169 166 +3 17 17

169 171 - 10 10

164 163 +1 3,5 3,5

170 168 +2 10 10

169 166 +3 17 17

169 167 +2 10 10

166 166 0 0

R+ = 122 R" = 154

Chú thích ( v ề c c h t í n h hạng) Ta s p xếp I dị ị theo t h ứ tự t ă n g d ẩ n :

(160)

Ì + + + + +

Số Ì có h n g = 3,5

7 + + + 10 + 1 + + 13

S c ó h n g = lo

„ „ , , 14 + 15 + 16 + 17 + 18 + 19 + 20

Số c ó h n g l ^ =

2 + 2

Số có h n g l = 21,5

Số c ó h n g l

Ta có R = m i n (122, 154) = 122 ;

ũ = 23

R = 122 Test t h ố n g k ê T l

122 - ( + l ) / _ 2 -

23.(23 + 1).(40 + 1)

3 , 8 = - 0,4866 24

V i a = 0,05 t h ì c = z a ữ = 1,96

Vì I Tị = 0,4866 < c n ê n ta k h ô n g c ó sở b c b ỏ Hữ. V ậ y c h i ể u cao t r u n g b ỉ n h h a i a n h em t r a i k h ô n g k h c n h a u

§ SO S Á N H H A I T Ỉ L Ệ

X é t h a i t ậ p h ợ p c h í n h ì v l i v m ộ t đ ặ c t í n h A m m ỗ i c t h ể h a i t ậ p hợp c h í n h đ ó có t h ể c ó hay k h ô n g Ha m u ố n so s n h t ỉ l ệ c t h ể c ó đ ặ c t í n h A t ậ p hợp c h í n h ì v i t ỉ l ệ c t h ể cđ đ ặ c t í n h A t ậ p h ợ p c h í n h H G ọ i P j v à p2 t n g

ứ n g l c c t ỉ l ệ ( c h a b i ế t ) c t h ế có đ ặ c t í n h A t r o n g t ậ p h ợ p c h í n h ì v t ậ p h ợ p c h í n h l i

(161)

G i ả t h i ế t H m ta m u ố n k i ể m đ ị n h

• P\ ~ P2 (hai rá nhau) với đ ố i thiết hai p h í a

H j : p , * p2

hoặc đ ố i thiết m ộ t p h í a

HỊ : pl > p2

hay H : P j < p2

G i ả sử TI J v n2 k í c h t h c c ủ a hai m ẫ u r ú t r a từ c c tập hợp c h í n h t h ứ v t h ứ hai, ky v k j t n g ứng l s ố cá t h ể c ó đ ặ c t í n h A m ẫ u lấy từ tập hợp c h í n h thứ ì v m ẫ u lấy từ tập hợp c h í n h l i

Ta c ó c c t ỏ n s u ấ t f , = —- v A = — c c ước l n g cho 1 L

P j v p2- N ế u g i ả thiết H ì đ ú n gyp j = p2 — p , ta nhập chung hai m ẫ u l i v đ ó ước l ợ n g cho g i trị chung p n y l t ầ n s u ấ t chung

f =

n l + n 2

M ộ t c c h hợp lí ta s ẽ b c bỏ H0 \ f ị - f2 ị lớn c c h c ó ý nghĩa Test t h ố n g k ê chọn

N g i ta đ ã chứng minh nf > 10, ti (Ì - f ) ? l o (ở đ ó TI = riị + n2), t h ì T có p h â n bố xấp xi p h â n bố c h u ỏ n tắc T h n h t h ỏ đ ố i với t o n k i ể m định hai p h í a ta s ẽ bác bò H0 ở m ứ c ý nghĩa a n ế u I Tị > z a f

(162)

Đôi với tốn kiểm định phía Ha •• P\ = Pi ;

Hx : Pị > p2

ta bác bỏ H mức ý nghĩa a

T > za

Thí dụ 14 Trong thâm dị trước ngày bầu cử, 42

trong số 100 cử tri nam hỏi cho biết bỏ phiếu cho ứng cử viên A Trong 92 số 200 cử tri nữ cho biết bỏ phiếu cho ông A

Với mức ý nghía a = 5% kiểm định xem tỉ lệ cử tri nam bầu cho ông A tỉ lệ cử tri nữ bầu cho ơng A có hay không

Giải Gọi p2 tỉ lệ cử tri nam cử tri nữ bỏ phiếu

cho ông A Ta cấn lẩa chọn giả thiết

Ho • Pi = p2

và đối thiết Hị : Pj ^ p2

-Các số liệu mẫu cho ta

42

n{ = 200, k1 = 42 , fx = ~ = 0,42 ;

92

n2 = 200, k2 = 92 , f2 = j ^ = 0,46

Tẩn suất chung

42 +92 134

_ = ZZJL = 447

' 100 + 200 300 '

Ta có : nf = 300.(0,447) = 134,1 > 10 ;

re.(Ì - f ) = 300 (0,553) =165,9 > l o ;

do điêu kiện áp dụng kiểm định thỏa mãn Giáa trị test thống kê :

f\ ~ h , - , _ T = = = - 0,66

r ( i ,JL _Ị_ ^(QẠAT).ạ),b53).(0,Q\^0Q5)

lị \ 72.1 Tlj, Ị

(163)

Với m ứ c a = 0,05 t a c ó c = z0 025 = 1>96

V i | T | = 0,66 < 1,96, t a q u y ế t đ ị n h g i ữ g i ả t h i ế t HQ Sự k h c b i ệ t t ầ n s u ấ t h a i m ẫ u c h a đ ủ "lớn m ộ t c c h c ó ý nghĩa". JỊỊỊ

Thí dụ 15. C ô n g t y n ố c g i ả i k h t C ô c a - Cola đ a n g n g h i ê n c ứ u v i ệ c đ a v o m ộ t c ô n g t h ứ c m i đ ể c ả i t i ế n s ả n p h ẩ m c ủ a m ì n h V i c n g t h ứ c c ũ k h i cho 0 n g i d ù n g t h ọ t h ì co' 120 n g i a t h í c h n ó V i c ô n g t h ứ c m i k h i cho 1000 n g i k h c d ù n g t h ọ t h ỉ c ó 0 t ỏ r a a t h í c h n ó

H ã y k i ể m đ ị n h x e m l i ệ u c ô n g t h ứ c m i đ a v o c ó l m t ă n g tỉ l ệ n h ữ n g n g i a t h í c h C ô c a h a y k h ô n g ?

M ứ c ý n g h ĩ a l %

Giải. G ọ i Pị l t ỉ l ệ n h ữ n g n g i a t h í c h C c a v i c ô n g t h ứ c mới, p2 l t ỉ l ệ n h ữ n g n g i a t h í c h C c a v i c ô n g t h ứ c c ũ Ta

c ầ n k i ể m đ ị n h g i ả t h i ế t

H - P \ = Pi

với đ ố i t h i ế t

C c s ố l i ệ u c h o t a

Hị : pl > p2

300

nl = 0 , kx = 300 ; px = = 0,3 ;

120

n = 0 , k2 = 120 ; p2 = ^ = 0,24

T ẩ n s u ấ t c h u n g l

_ 300 + _ _ ' " 1000 + 500 ~ 1500 ~ '

Ta c ũ n g c ó nf = 1500.(0,28) = 420 3= lo ;

».(1 - f ) = 1500.(0,72) = 1080 ỉ* 10

V ậ y đ iề u k i ệ n p d ụ n g đ ợ c t h ỏ a m ã n

Ta có

/ • ( ! - / ) ( — + — ) = V(0,28).(0,72).(0,003) = V 0,000605 = 0,025 \ TI ĩl-y

(164)

Test thống kê T có giá trị b n g , - ,

T = — - =

0,025

Với mức ý nghĩa a = 2% ta có

c = za = 20,02 = 2 > 0 6

v ì T > c n ê n ta bác bỏ Ha , Tỉ l ệ n h ữ n g người ưa t h í c h Côca

với công thức cao t i l ệ n g i ưa t h í c h Cơca với cơng thức cũ N h cơng t i có t h ể định sử d ụ n g công

thức đ ể t ă n g thị phần m ì n h I

Bài t o n k i ể m định g i ả t h i ế t

với đối t h i ế t

Hị : Pị > p2

-đưởc viết l i đ u ố i dạng

H o - P \ - P 2 > 0

Thay sổ số , ta có b i t o n k i ể m định t ổ n g q u t sau

H o : P\ - Pl = H \ • P\ - P2 >

đó số k h c không

Khi có t h ể chứng minh đưởc r ằ n g hiệu số fx - f2

một ĐLNN có p h â n bố xấp xỉ chuẩn với kì vọng /Jj - p2

phương sai

- P i ) p2( ! ~Pt)

với điêu kiện n\-P\ ^ ; ttj-d ~Pị) ^ ;

(165)

Tuy nhiên ta c h a biết Pj và p2- Do mẫu lớn

( n v riị ỉí 100), ta có t h ể xấp xỉ Pj bởi f ị p2 bởi f2 Vậy t h ỉ

test thống kê sử dụng t o n k i ể m định (/W2)-<5

T

f { \ - f ) f2

(T-V n, n-,

n , ,2

T có p h â n bố xấp xỉ p h â n bố chuẩn tắc

Giả t h i ế t H0 bị b c bỏ mọc ý nghĩa a T > za

Thí dụ 16. Tỉnh A nói r ằ n g tỉ l ệ học sinh t ố t nghiệp phổ

t h n g sở m ì n h cao 10% so với tỉnh B Để k i ể m tra k ế t l u ậ n n y , chọn ngẫu nhiên 198 học sinh tỉnh A có 189 em đỗ PTCS, k h i chọn ngẫu nhiên 210 em tỉnh B thấy có 158 em đỗ PTCS Dựa t r ê n số l i ệ u n y cđ k ế t l u ậ n gí

về lòi t u y ê n bố t ỉ n h A ? Sử dụng mọc ý nghĩa a — 1% Giải Ta có

189

nx = 198, kị = 189, /"ì = 198 = ° > 5 ;

n2 = 210, k2 = 158 f2 = ~ = 0,7524

Test t h ố n g kê có giá trị

0 , 5 - , - ,

T = = 3,07

V (0,9545) (0,0455) (0,7524) (0,24 76)

198 210

Ta có c = z0 = 2,33 < T

Vậy ta k ế t l u ậ n : L i tuyên bố tỉnh A I

BÀI TẬP

1 Với mọc ý nghĩa a = 5%, k i ể m định giả t h i ế t sau dựa t r ê n số l i ệ u m ẫ u k è m theo

(166)

a) Ha •• / " l = /*2 J Hi : Hi * f J 2 ĩ

n = 50 , X = 102 , s, = 20

m = 32 , ỹ = = 97, s2 = 16 b) Ho : i" l = /<2 >

Ho : j" l ^ ^

n = 60 , X = 23, ffj = 24 ;

m = 80, ỹ = 30 , ơ2 = 26

c) Ho : ^1 = A2 ) ff, : /^1 < i" í

n = 25, 3c = 20, ffj = ;

m = 35, ỹ = 25, ỡ2 =

2 M ộ t nghiên cứu t i ế n h n h đ ể so s n h t h i gian n ằ m viện t r u n g binh bệnh n h â n nam! Ểíiều t r ị bệnh A t h i gian nằm v i ệ n t r u n g bình bệnh n h â n n ữ đ iề u t r ị bệnh A M ộ t mẫu ngẫu n h i ê n 50 bệnh n h â n nam khảo s t cho thấy thời gian t r u n g bình 5,3 ngày vậi độ lệch t i ê u chuẩn 2,1 ngày

M ộ t mẫu ngẫu n h i ê n 40 bệnh n h â n nữ cho t h ấ y thòi gian t r u n g bình 6,2 ngày v ố i độ lệch tiêu chuẩn 1,8 ngày

Có nhận định gỉ vê t h i gian t r u n g bình n ằ m v i ệ n bệnh n h â n nam nữ ? Mức ý nghĩa a = 5%

3 M ộ t n h khoa học t i ế n h n h m ộ t n g h i ê n cứu đ ể so s n h t c dụng hai loại p h â n A B đ ố i vậi n ă n g suất cà chua

M ộ t mẫu gồm 60 cà chua bón p h â n A cho ta s n lường t r u n g bỉnh 32,2 q u ả vậi độ lệch t i ê u chuẩn 8,5 Một m ẫ u gồm 72 cà chua bón p h â n B cho ta sản lượng t r u n g bình 28,4 vậi độ lệch tiêu chuẩn 9,3 V ậ i mức

(167)

ý nghĩa a = 5%, so s n h hiệu hai loại p h â n A, B đ ố i với n ă n g suất cà chua

4 Một công t i vận t ả i lớn muốn so s n h số ôtô t ả i gặp t r ụ c trặc kĩ t h u ậ t t r u n g bình ngày m ù a đ ô n g với m ộ t ngày m ù a hè Chọn ngẫu nhiên 35 ngày t r o n g m ù a đông cho ta số t r u n g bình t t ả i gặp t r ụ c t r ặ c 16,6 với độ lệch tiêu chuẩn 7,1 Trong mẫu 32 ngày hè, số t r u n g bình t h u 12,4 với độ lệch tiêu chuẩn 5,8 Với mức ý nghĩa

a = 0,02, h ã y k ế t l u ậ n xem có sở k h c hay không

5 Đ ể so s n h chiều cao t r u n g bình niên nam hai v ù n g d â n cư A B, người ta chọn ngẫu n h i ê n lo n i ê n nam v ù n g A và lo t h n h niên nam v ù n g B. Số đo chiều cao hai n h ó m ngi cho sau (đơn vị em) : Vùng A 165, 167, 174, 172, 165, 167, 168, 172, 170, 173

Vùng B 172, 170, 167, 169, 171, 167, 173, 165, 163, 174

V ố i mức ý nghĩa a = 0,01 hay so s n h chiều cao t r u n g bình

của n i ê n nam v ù n g A v ù n g B

6 M ộ t t p chí y học vừa công bố m ộ t t h ô n g báo r ằ n g đứa t r ẻ ni sữa m ẹ có số t h ô n g minh (IQ) cao n h ữ n g đứa t r ẻ nuôi b n g bú chai M ộ t mẫu lo

đứa t r ẻ n u ô i sữa m ẹ m ẫ u lo đứa t r ẻ nuôi b n g bú chai chọn đ ể so s n h K ế t ghi l i số IQ n h sau :

N h ó m b ú m ẹ : 121, 105, I U , 119, 108, loi, 90, 131, 106, 112 Nhóm bú chai : 102, no, 107, 98, 99, 103, 86, 117, 113, 87 Dởa t r ê n số l i ệ u này, có t h ể k ế t l u ậ n gỉ cơng bố t p chí y hộc nói t r ê n Mức ý nghĩa a = 5%

7. M ộ t h ã n g s ả n x u ấ t ôtô muốn t h nghiệm loại động m i m dở đ o n t i ế t k i ệ m x ă n g động cũ Thí

(168)

nghiệm vé mức tiêu t h ụ x ă n g t r ê n m ộ t dặm động v cũ cho t a số l i ệ u sau :

Động cũ : ; ; 7 ; 8 ; ; ; ; 10 ; ; 8 ị ;

6 ; 10 ; ; ; ; ; 9 ; lo ;

Động : ; ; ; ; ; 1 ; 1 ; ; ; ^ ; ;

9 ; 10 ; ; ; lo ; ; 12 ; l i ; 10 ; ; lo ; 8

đủ chứng đ ể k ế t l u ậ n động m i t i ế t k i ệ m x ă n g động cũ k h ô n g ?

8. Đ ể x c định hiệu q u ả c h ế độ â n k i ê n g t r o n g việc g i ả m trọng lượng, lo người đã chọn để thử nghiệm chế độ ă n kiêng Sau s u t u n k ế t q u ả cho bảng

Người thử nghiệm Trọng lượng trước ă n kiêng

Trọng lượng sau ă n kiêng

1 190 185

2 202 197

3 177 185

4 160 152

5 225 205

6 180 184

7 196 185

8 208 200

9 185 187

10 177 170

K i ể m định xem c h ế độ â n k i ê n g có t c dụng g i ả m trọng lượng hay không Mức ý nghĩa 5%

(169)

9 Trước sau dịp T ế t , người t a ghi l i g i c ủ a m ặ t h n g

A tại cửa h i ệ u k h c :

C a h i ệ u 1 2 3 4 5 6 7 8

Trước T ế t 95 109 99 98 105 99 109 102

Sau T ế t 98 105 99 99 109 105 115 no

Với mức ý nghĩa a = 0,05, k i ể m định xem có phải có khuynh h n g t ă n g g i sau T ế t hay k h ô n g đ ố i với mặt h n g A đ ó 10 N g i t a c h ọ n ngẫu n h i ê n sinh v i ê n c ủ a t r n g đ i

học v t í n h đ i ể m thi trung bỉnh c ủ a h ọ ự n ă m thứ v n ă m thứ hai c ủ a trường đ ó K ế t cho n h sau

Sinh v i ê n 1 2 3 4 5 6 7

N ă m thứ ì 2,5 2,78 3,15 3,62 2,15 2,84 2,61

N ă m T h ứ l i 2,75 2,62 3,34 3,45 2,55 2,58 2,7 Với mức ý nghĩa a = 5%, h ã y k i ể m đ ị n h xem đ i ể m trung b ì n h c ủ a sinh v i ê n ự n ă m thứ ì v n ă m thứ l i c ó thay đ ổ i hay k h ô n g

l i Sử d ụ n g c c s ố l i ệ u sau, t í n h g i trị c ủ a t ổ n g h n g R, t r u n g bỉnh / / n , v độ lệch t i ê u chuẩn ƠR

a) A 15 18 14 22 25 16 12 20

B 23 l i 26 24 17 19 15 21

A 102 114 127 H I 122 108 117 115

B 105 114 120 124 132 118 125 125 123 12 K i ể m t r a s ố b i ê n lai phạt vi cảnh m hai c ả n h s t giao

t h ô n g A v B x u ấ t r a lo n g y c h ọ n ngẫu n h i ê n , ta c ó đ ợ c s ố l i ệ u s a u :

(170)

Cảnh s t A : 32, 14, 26, 37, 45, 58, 28, 32, 36, 25, 30 Cảnh s t B : 44, 37, 24, 33, 27, , 29, 25, 34

Sử dụng tiêu chuẩn hạng Mann - Whitney h ã y so s n h số biên lai t r u n g bình m hai cảnh s t xuất m ỗ i n g y Mức ý nghĩa a = 5%

13. Ngi quản lí m ộ t n h h n g muốn so s n h số k h c h t r u n g bình m hai t i ế p viên A, B n h h n g phục vụ t r o n g m ỗ i ngày Anh ta thu số l i ệ u thống kê sau

T i ế p viên A : 42, 36, 58, 27, 48, 85, 38, 44, 62

Tiếp viên B : 53, 48, 65, , 57, 49, 74, 49, 56

Sử dụng tiêu chuẩn hạng Mann - Whitney h ã y nhận định xem số khách t r u n g bình m hai t i ế p viên A B phục vụ ngày n h hay k h c

14. M ộ t nữ giáo sư bị p h n n n có xu hường t h i ê n vị sinh viên nam chấm t h i Đ ể k i ể m t r a đ i ể u p h n n n này, ông chủ nhiệm khoa chọn m ộ t số t h i sinh viên nam nữ đ ể so s n h ( đ i ể m t ố i đa m ỗ i 100)

sv Nam : 75, 86, 77, 72, 89, 94, 97, 81, 83, 77, 73, 86, 90, 90

s v Nữ : 77, 83, 72, 67, 84, 91, 82, 73, 65, 72, 70, 72, 65, 88 Sử dụng tiêu chuẩn hạng Mann - Whitney, so s n h đ i ể m t r u n g bình của sv nam vời sv nữ Mức ý nghĩa a = 5%

15. M ộ t p h n g p h p d ể đo lường "sức khỏe" k i n h t ế

là theo dõi số công việc quảng cáo t r ê n m ặ t báo Trong

m ộ t nghiên cứu đ ể so s n h t ì n h t r n g kinh t ế M ỹ t r o n g hai n ă m 1996 1997, người ta đế m số t r a n g quảng cáo việc t ỉ m người t r ê n m ặ t báo m ỗ i ngày G i ả sử số l i ệ u thu n h sau (ghi l i ngày t h n g n ă m 1996 t h n g n ă m 1997)

T h n g 7/1996 : 12, 10, 25, 18, 14, 18, 20, 24, 20

(171)

T h n g 7/1997 : 21, 16, 26, 17, 20, 28, 19, 20, 18

Với mức a = 2%, so s n h số trang quảng cáo việc t ỉ m người t r u n g b ì n h m ỗ i ngày hai n m 1996, 1997

16. Có hai n h ó m cơng n h â n , n h ó m t o n nam, n h ó m t o n n ữ đào tạo đ ể làm m ộ t nghề Thời gian đ ể h o n t h n h công việc giao (tính ngày) cơng n h â n ghi l i n h sau:

Công n h â n nam : 48, 42, 55, 62, 60, 74, 53, 34, 40, 66, 72, 65, 48, 52, 73, 79

Công n h â n nữ : 60, 54, 50, 51, 53, 65, 41, 45, 50, 61, 63, 37, 43, 48, 46, 49

Sử d ụ n g số l i ệ u t r ê n tiêu chuẩn hạng M a n - Whitney, với mức ý nghĩa 5%, so s n h n ă n g suất lao động công n h â n n ữ công n h â n nam

17. Sử d ụ n g số l i ệ u sau tiêu chuẩn dấu, với mức ý nghĩa

5%, h ã y so s n h xem có phải hiệu m ộ t p h n g p h p

là t h ấ p hiệu p h n g p h p hay không

Đối t ợ n g

Phương pháp ì 21 24 20 17 28 30 19 23 Phương pháp n 24 25 21 26 25 24 26 20

Đối t ợ n g 10 l i

Phương p h p ì 24 26 25 Phương p h p l i 22 27 18

18. Đ ể so s n h n ă n g suất lao động trước k h i nghỉ sau k h i nghỉ p h é p công n h â n , m ộ t m ẫ u gồm 22 công n h â n lựa chọn đ ể theo dõi n ă n g suất lao động họ trước sau nghi Ì t u ầ n K ế t ghi l i n h sau :

(172)

Số thứ t ự Trước nghỉ Sau nghi

1 83 79

2 85 87

3 75 70

4 91 93

5 80 85

6 75 75

7 90 80

8 65 71

9 78 80

10 85 88

l i 83 82

12 75 71

13 78 75

14 80 85

15 82 86

16 88 85

17 85 82

18 80 87

19 78 78

20 81 84

21 70 85

22 80 81

a) Với mức ý nghĩa a = 0,05, có t h ể coi n â n g suất lao động công n h â n trước sau k h i nghỉ phép có thay đ ổ i hay k h ô n g ? Yêu cầu d ù n g tiêu chuẩn dấu

b) Cũng câu hỏi t r ê n n h n g d ù n g tiêu chuẩn hạng có dấu

Whilcoxon

19. M ộ t công t i dược phẩm tiên h n h k i ể m định loại thuốc mài chống l i r ọ n g tóc người hói đ ầ u Cơng ty chọn ngẫu n h i ê n 150 người đ ể thí nghiệm Trước cho đ ố i

(173)

t ợ n g d ù n g t h u ố c , h ọ đế m sơ t ó c m ọ c t r o n g m ộ t v ù n g đ ầ u Sau k h i d ù n g t h u ố c Ì t h n g , c c đ ổ i t ợ n g quay t r l i v h ọ l i đế m số t ó c t r o n g c ù n g v ù n g đ u t r c đ ó K ế t q u ả cho t h ấ y c ó 116 đ ố i t ợ n g n h i ễ u t ó c h n , 22 c ó í t t ó c h n v 12 đ ố i t ợ n g c ó số t ó c k h ô n g t h a y đ ổ i D ự a t r ê n k ế t q u ả n y , v i m ứ c ý n g h ĩ a 2%, c ô n g t y có t h ể k ế t l u ậ n t h u ố c c h ố n g h ó i đ ầ u đ ó c ó t c d ỉ n g hay k h ô n g ?

2 V i m ứ c ý n g h ĩ a a = 5%, k i ể m đ ị n h c c g i ả t h i ế t sau, d ự a t r ê n c c số l i ệ u k è m t h e o

a) '• P\ = Pi

• P\ * p2 '

/ l ị = 100, ky = •• 55

n2 = 100, Ã, = : 50

b) Ho • Pị = p2 ;

» : Pl * p2 ;

nx = 60 , kị = 22

= SO, k2 = 30

c) Ha • P\ = p2 ;

ô ã Pị < P2 ì

n , = 80, A j = 30 ;

n2 = 80, k2 = 40

2 H a i g i o s A v à B c ù n g d y m ộ t m ô n hai t r n g đ i học l n T r o n g số 400 s i n h v i ê n theo học g i o s ư A có 80 s i n h v i ê n t h i t r ợ t T r o n g số 500 s i n h v i ê n theo học g i o s B c ó

125 s i n h v i ê n t h i t r ợ t V i m ứ c ý n g h í a a = 5% k i ể m đ ị n h x e m c ó k h c n h a u hay k h ô n g v é t ỉ l ệ t r ợ t g i ữ a s i n h v i ê n c ủ a g i o s ư A v s i n h v i ê n g i o s ư B

(174)

22 Trong t h ă m dò trước bầu cử, 40 t r o n g số 100 cử t r i hỏi nói r n g họ bỏ phiếu cho ô n g A. M ộ t t u ầ n sau, t h â m dò k h c cho t h ấ y 68 t r o n g số 150 n g i ủng hộ ông A. H ỏ i r ằ n g tỉ l ệ cử t r i bỏ phiếu cho n g A có thay đ ổ i k h ô n g ? Mức ý nghĩa a = 5%

23 M ộ t nghiên cứu t i ế n h n h n h ằ m so s n h tỉ l ệ học sinh bò học trước k h i t ố t nghiệp Ỉ hai v ù n g d â n cư A B v ù n g A, sô 600 học sinh theo dõi có 90 học sinh bỏ học trước lớp 12 ; Ỉ c ù n g B t r o n g số 400 học sinh theo dõi 48 em bỏ học t r c lớp 12

Với mức ý nghĩa 2%, có t h ể cho r ằ n g hai tỉ l ệ k h c hay k h ô n g ?

ĐÁP SỐ VÀ C H Ỉ D Ẫ N

1 a) \T\ = 1,25 ; c = 1,96 Chấp n h ậ n Ha b) \T\ = 1,65 ; c = 1,96 Chấp n h ậ n Ha c) T = 1,6 ; c = - 1,645 Chấp n h ậ n Ha

2 T = 2,20 ; c = 1,96 Bác bỏ HQ

3 T = 2,45 ; c = 1,96 B c bỏ Ha

4 T = 2,66 ; c = 2,32 Bác bỏ Hữ

5 X = 169,5 ; ỹ = 169,1 ;

T = 0,262 ; c = : 2,88 Chấp n h ậ n HQ

6 X = 110,4, S l = 11,4 ; = 101,2 ; s2 = 11,03 ;

s = 11,21 ; T = : 1,82 Bác bỏ Ha ờ mức 5%

7 T = 1,71 ; p - giá t r ị 0,04 Bác bỏ Ha ờ mức 5%

(175)

8 E = ; sd = 8,01 , T = 1,976 c = i 0 0 5 = 1,833 Bác

bỏ HQ

9 T = 1,897 ; c = 1,895 Bác bỏ Ha

10 T = 0,56 ; c = 2,447 Chấp nhận H0

11 a) / ỉ = 60,5 ; ^ R = 68 ; GR = 9,5

b) R = 55,5 ; fiR = 72 ; <7R = 10,4

12 i? = 100 ; T = 0,38 Chấp nhận HQ

13 R = 71,5 ; T = 1,27 Chấp nhận HQ

14 i ỉ = 253,5 ; T = 2,3 Bác bỏ HQ

15 i? = 74 ; T = 1,05 Chấp nhận HQ '

16 i ỉ = 303,5 Chấp nhận HQ

17 | T | = 0,33 Chấp nhận HQ

18 a) T = 0,894 ; c = 1,96 Chấp nhận Ha

b) fí+

=126,5 ; T = 0,803 Chấp nhận HQ

19 T = Bác bỏ H Q

20 a) T = 0,71 ; c = 1,96 Chấp nhận Ha

b) I T i = 0,0625 ; c = 1,96 Chấp nhận HQ

c) T = 1,27 ; c = 1,64 Chấp nhận Ha

21 T = 1,79 ; c = 1,96 Chấp nhận Ha

22 I r i = 0,83 ; c = 1,96 Chấp nhận HQ

23 T = 1,36 ; c = 2,33 Chấp nhận H 0

(176)

* Chương VI

BÀI T O Á N S O S Á N H M ỏ R Ộ N G

§1 so SÁNH NHIỀU TỈ L Ệ

Trong c h n g trước c h ú n g ta đ ã x é t t o n so s n h tỉ l ệ cá t h ể có đặc t í n h A hai t ậ p hợp Bấy c h ú n g ta

sẽ mở rộng t o n cách xét t o n so s n h thời tỉ l ệ cá t h ể có đặc t í n h A n h i ề u t ậ p hợp c h í n h

Giả sử t a có k tập hợp chính dCị, 3C2, ••• , dC^. M ỗ i cá t h ể c h ú n g có t h ể mang hay k h n g mang đặc t í n h A

Gọi Pị tỉ l ệ có t h ể mang đặc t í n h A t r o n g tập hợp c h í n h aigj (í = Ì , 2, k)

Các tỉ l ệ gọi tì lệ lí thuyết m chưa biết

Ta m u ố n k i ể m định g i ả t h i ế t sau:

H

o •• P\ = P2 = ••• =Pk

( t ấ t tỉ l ệ n y nhau)

Từ m ỗ i tập hợp chính 3Ct ta r ú t m ẫ u ngẫu n h i ê n có

kích thước riị, c h ú n g ta thấy có / M ị cá t h ể mang đặc tính A và lị = Rị - kị cá t h ể k h ô n g mang đặc t í n h A. Các liệu t r ì n h bày bảng sau :

M ẫ u 1 2 k Tổng

A m-ị m

Không A '1 h l

Tổng n , n2 nk N = m + ỉ =2iị

(177)

Nếu giả thiết

Hu •• P\ = p2 =••••= Pk = p

là đ ú n g t h i tỉ l ệ chung p ước lượng t i số số cá t h ể đặc tính A tồn k mẫu gộp l i t r ê n tống số cá t h ể k mẫu gộp l i

~ /n

p = ĩv

-Tỉ l ệ cá t h ế đặc tính A ước lượng

q = Ì - p = -

Khi số cá t h ể có đặc tính A mẫu thứ í (mẫu r ú t tị

tập hợp xấp xỉ

npi m i = ni p =

-77-và số cá t h ể khơng có đặc tính A mẫu t h ứ í xấp xỉ = n f l = ni

Các số m lị gọi tằn số lí thuyết (TSLT), cịn số niị, lị gọi tần số quan sát (TSQS)

Ta định bác bỏ H TSLT cách xa TSQS cách

"bất thường" Khoảng cách TSQS TSLT đo test thống kê sau :

ị K - m , ) ị ( / , - ! >

T=Ì : + 2 - p •

; = m ; / = !|

Người ta chứng minh r ằ n g nếu H đ ú n g t ấ n số lí thuyết khơng nhỏ thua T có p h â n bố xấp xỉ p h â n bố y} với k - Ì bậc tự T h n h thử miền bác bị H dạng

ÍT > c h

ở c tìm tị điều kiện P{T > c } = a Vậy c p h â n vị mức a p h â n bố X2 với k - Ì bậc tự

Chú ý Test thống kê T có t h ể biến đổi sau

(178)

Ta có I ni: 1/(1 - P ) ' 2

= {niị - ĨIỊỌỸ = (niị - i r i j )2

Do

T = Jim ị - l +

m, í

= 2>»/ - m :)7 / 12 Ì \

x »/P n,-q

_ £ K - mi)2 771; 77l,m t n

+

ì-2l • ^ m°

í = 1 »;P q np q

Chú ý r ằ n g z, ~ - Ì z Wly

m

re,-/? q q q

ì "1 = 1 -ý ~ ~ z, n i j

ni

q q q

»iP q

Ì v m '

V ậ y T = —7v Z

—-p q "ì

p q " í

^ —

m/ TI,

/?1

q

q

- ÌV TO

N ế u sử dụng c ô n g thức ta s ẽ k h n g phải t í n h

t ấ n s ố lí thuyết, n ó d ù n g thự h n h

Thí dụ So s n h t c dụng c ủ a m ẫ u thrôc thử n g h i ệ m

t r ê n lô chuột, kết thu sau :

(179)

M ẫ u thuốc Tổng Số sống 79 82 77 83 76 81 478

Số chết 21 18 23 17 24 19 122

T ổ n g 100 100 100 100 100 100 600

Ta m u ố n k i ể m định g i ả t h i ế t

HQ : TỈ l ệ chết mẫu thuốc n h

đ ố i t h i ế t Hị : T ỉ l ệ chết mẫu thuốc khác

Giải

(600).(478) 122 = 2353,24 - 2350,81 = 2,42

Với mức ý nghĩa a = 5% , t r a bảng p h â n bố ỵ2 với bậc tự t a

XỈ.05 = H '

-v ì T < c n ê n t a chấp n h ậ n Ha g

Thí dụ Có 4 t h ầ y giáo A, B, c, D c ù n g dạy mằt giáo t r ì n h t h ố n g kê Ban chủ n h i ệ m khoa muốn t ì m h i ể u chất lượng dạy t h ầ y n y n ê n đ ã l m mằt cuằc khảo s t K ế t n h sau :

K ế t q u a * \ ^ A B c D Tổng

Đ t 60 75 150 125 410

K h ô n g đ t 40 75 50 75 240

T ổ n g 100 150 200 200 650

Với mức ý nghĩa a = 0,01 có t h ể cho r ằ n g tỉ l ệ học sinh đỗ c c học sinh đ ã học c c t h ầ y t r ê n n h hay k h ô n g ?

177

T K Ư D -

Tá có T = 60Ơ (478)(122)

792 822 812

(180)

Giải Ta có

(650)2 T =

(410).(240)

602 52 5Ó2 1252 (650).(410) 240 100 150 200 200

= 1134,07 - 1110,41 = 23,65

Số bậc tự và xổ OI = l l > ă T > c nên t a b c bỏ g i ả t h i ế t HQ. Tỉ l ệ học sinh đỗ thầy A, B, c, D n h

§2 SO SÁNH CÁC PHÂN B ố

Xét bộ A gồm r tính trạng, A = (Áp Áp Ar) , trong1 đtí m ỗ i cá t h ể t ậ p hợp c h í n h d e có v có m ộ t t r o n g t í n h t r n g (hay p h m t r ù ) Aị

Gọi Pị (ỉ = Ì, 2, r ) t ỉ l ệ cá t h ể có t í n h t r n g Aị t r o n g t ậ p hợp c h í n h d e K h i vectơ TI = (Pj, p2'"-> />r) ^ư (? c spi

jD/idn ò ố ^ tập hợp 56

Chụng h n , m ọ i n g i l m có t h ể sử dụng m ộ t t r o n g p h n g t i ệ n sau : bộ, xe đ p; xe máy, xe buýt Trong t h n h phố X có 18% bộ, 32% xe đạp, 40% xe m y 10% xe b u ý t N h vậy K = (0,18 ; 0,32 ; 0,4 ; 0,1) p h â n bố cách làm (Jì) tập hợp dân cư t h n h phố X

T n g t ự m ỗ i n g i có t h ể xếp vào Ì t r o n g phạm t r ù sau : r ấ t h n h p h ú c , đôi lúc h n h p h ú c , bất hạnh, có t h ể

được xếp vào Ì t r o n g lớp sau : d i 25 t u ổ i , t r o n g khoảng từ

25 đế n 45 t u ổ i , t r ê n 45 t u ổ i v.v Có thê* dẫn r ấ t n h i ễ u thí dụ t n g t ự n h

G i ả sử (Pj, p2 pr) p h â n bố của (Aị, A2, Ar) t ậ p hợp c h í n h d e ( <7j , q2, qr) p h â n bố

(181)

có p h â n bố n h t r o n g X Y ( P j , p2, pr) =

= (<7i> q2> •••> rP *=*Pl = l Pr = <7r •

C h ú n g ta m u ố n k i ể m định xem A = CA J, A ) có c ù n g p h â n bố t r o n g X ý hay k h ô n g dựa t r ê n c c m ẫ u n g ẫ u n h i ê n r ú t t ừ X v à Y

Tổng q u t hơn, g i ả sử ta có k tập hợp chính dtv d&2> • ••> •

Gọi ^ = (p'ị ,p'2, ,pj.) p h â n bố của A = ( A j , A2, Ar) t r o n g

tập hợp JSj

I k m u ố n k i ể m định g i ả t h i ế t sau

Ha : JT1 = Jt2 = — (Các p h â n bố n y l à n h t r ê n

các t ậ p hợp c h í n h 5^)

Chú ý r ằ n g Ha t n g đ n g với h ệ đ ộ n g thức sau : p\ = p \ = •=PÌ

PÌ = p ị = •=PÌ PÌ = PỈ=- • = pf Plr = PĨ=- •=pkr

T m ỗ i t ậ p hợp c h í n h c h ú n g ta chọn m ộ t m ẫ u ngẫu n h i ê n M ẫ u ngẫu n h i ê n chọn từ t ậ p hợp c h í n h gọi m ẫ u ngẫu n h i ê n t h ứ í (ị = 1,2, k)

G i ả sử t r o n g m ẫ u ngẫu n h i ê n t h ứ ỉ

nl{ cả t h ể co' t í n h t r n g Aị n2í cá t h ể có t í n h t r n g A2

nr i cá t h ể có t í n h t r n g Ar

Ta. xắp xếp số l i ệ u t h n h b ả n g sau

(182)

t r n g V ^ j k

Tổng số

^ nu

n l ni k " l o A2 n2l

n22 n2 k n20

nn

ni2 * i j ni k n\o

" r i nr2 " r o

Tổng số

no2 n

Kí hiệu nio = /lý = Ì

r

" • = ỉỌ/ n J í = Ì

N h nQj kích thước m ẫ u t h ứ j ; còn nịo t ổ n g số cá t h ể có t í n h t r n g Aị t r o n g t o n bộ k m ẫ u đ a n g xét ;

r k

i=Ì ý = Ì

l ' t ổ n g số t ấ t cá t h ể Ã m ẫ u đ a n g xét

N ế u g i ả t h i ế t Ha đ ú n g nghĩa

p\

p \ = pị =

pị = pf = = plỊ

p2 = P2

p,

plr = p,2 = - = Pr = pr

t h ì t i l ệ chung Pp p2> •••> PT ước lượng

(183)

Đó ước lượng cho x c suất đ ể c t h ể mang t í n h t r n g A-. K h i đ ó số c t h ể có t í n h t r n g Aị m ẫ u t h ứ j

x ấ p x i b ằ n g

ni j = n o j Pi =

Các số (í = Ì , , r ; j = Ì , 2, k)

được g ọ i c c tần số lí thuyết (TSLT), c c số g ọ i tòn s ố gucm sát (TSQS)

Ta q u y ế t định b c bỏ Ha k h i c c TSLT cách xa TSQS m ộ t

c c h b ấ t t h n g K h o ả n g cách TSQS v TSLT đo test t h ố n g k ê sau đ â y

T = V V Ỹ^LmỂ. = v ( T S Q S - T S L T )2

À 1 - n T S L T

/ = / = 1 ni j

N g i t a đ ã chứng m i n h r ằ n g nếu Hữ đ ú n g c c TSLT k h ô n g n h ỏ h n t h ử T có p h â n bố x ấ p xử p h â n bố X2 v i (k - 1) (r - 1) bậc t ự T h n h t h m i ê n b c bỏ có d n g

{T > c} đó c t ì m t đ i ể u k i ệ n P { T > c } = a V ậ y c p h â n v ị mức a p h â n bố X2 v i (A - 1) (r - 1) bậc t ự

Chú ý T có t h ể b i ế n đ ổ i t h n h dạng sau

Ta c ó 7S = -7T- - 2n,Ịj + I ĩ j j

Đ ể ý r ằ n g :

z = z z n j j =

ni

Vậy T = Z- ^ - r a + r a

(184)

= L,— = nL

- nfL "«

- n

' nionoj

(1)

Với công thức ta k h n g phải t í n h TSLT I i j , t h n g sử dụng t r ò n g thực h n h

Thí dụ 3. N g i ta muốn so s n h số b ă n g t r ê n vỏ ba loài ốc s ê n r n g ì, l i I U Số l i ệ u nghiên cứu cho bảng sau :

V Loài Số b ă n g ^ v

t r ê n v ỏ ^ ^ ^

ì li ni Tổng số

0 49 31 126 206

1 33 • 20 56 109

3 52 20 83 155

5 trở lên 35 29 109 173

Tổng số 169 100 374 643

H ỏ i có t h cho r ằ n g số b ă n g t r ê n vỏ có p h â n phối n h t r ê n ba loài ốc sên k h ô n g ? Chọn mức ý nghĩa 5%

Giải Ta t í n h thống kê T theo công thức (1) :

492 12 1262

T = 643 + +

+

(169).(206) (100).(206) (374).(206)

332 02 562

(169).(109) (109).(100) (109).(374)

292 1092

+

+

(185)

T r a b ả n g p h â n bố ỵ2 với bậc tự ( - ) ( - l ) = 6, ta t ì m đ ợ c

#0.05 ~ 12,592

Giá trị n y lớn lớn T V ậ y c h ú n g ta chấp n h ậ n Ha : S ố b ă n g t r ê n

vỏ c ó p h â n bố n h đ ố i với loài ố c s ê n rừng g

Thí dụ Đ i t r u y ề n h ì n h V i ệ t N a m m u ố n t h ă m d ò ý k i ế n k h n giả v é thời lượng p h t s ó n g phim t r u y ệ n V i ệ t N a m h n g t u ầ n P h i ế u t h ă m d ò đ ặ t r a mức

Á Ị : T ă n g thời lượng p h t s ó n g

A2 : G i ữ n h c ũ A3 : G i ả m

A4 : K h n g c ó ý k i ế n

Đ i t i ế n h n h t h ă m dị ba n h ó m x ã h ụ i k h c n h a u : c ô n g n h â n , n n g d â n , trí thức K ế t cuục t h ă m dò n h sau :

^ ^ - ^ T ầ n g lớp

Ý k i ế n \ ^ ^ C ô n g n h â n N ô n g d â n Trí thức T ổ n g

T ă n g 100 300 20 420

N h cũ 200 400 30 630

G i ả m 50 80 5 135

K h ô n g ý k i ế n 30 70 5 105

T ổ n g 380 850 60 1290

V i mức ý n g h í a a = 5% , c ó k h c nhau ý k i ế n c c t ầ n g lớp x ã hụi t r ê n hay k h ô n g ?

G i ả i T n s ố lí thuyết c ủ a ô "trí thức k h ô n g ý kiến" (60).(105)

1290 4 , 8 bé h n đ ó đ iế u k i ệ n cho p h é p p d ụ n g

t i ê u c h u ẩ n "khi b ì n h phương" k h n g t h ỏ a m ã n Đ ể k h ắ c p h ụ c k h ó k h ă n n y c ó hai c c h H o ặ c l g h é p d ò n g c u ố i c ù n g

(186)

với m ộ t d ị n g n o đó, ghép cột cuối c ù n g với m ộ t cột n o

Tuy n h i ê n r ấ t khó ghép d ò n g cuối c ù n g "không ý k i ế n " với m ộ t d ị n g n o cho hợp lí "Không ý kiến" k h c r ấ t n h i ề u với việc "có bày tỏ ý k i ế n mình" Hợp lí ta g h é p cột cuối c ù n g "trí thức" với cột "cơng n h â n " t r í thức có l ẽ gần với c ô n g n h â n n ô n g d â n (đều khu vực t h n h thị) N h ta có bảng sau*

" ^ ^ ^ - ^ T n g lớp

Ý k i ẽ n ^ ^ ^

Cơng n h â n

và trí thức Nơng dân Tổng

T ă n g 120 300 420

Như cũ 230 400 630

Giảm 55 80 135

Không ý kiến 35 70 105

Tổng 440 850 1290

Sử dụng cơng thức tìm

1202

T = 1290 + + •

702

- Ì = 10,059 (440).(220) " (850).(105)

Tra bảng p h â n bó X2 mức 5% với bậc t ự ( - l ) ( - l ) = 3, ta tìm

xịos = 7>815

-Số n y bé hơn T. Vậy ta k ế t l u â n r ằ n g vê thời lượng p h t s ó n g phim V i ệ t Nam có m ộ t k h c vê ý kiến hai t ầ n g lớp xã h ộ i : n ô n g d â n công n h â n viên chức

Chú thích vè sử dụng Minitab

Đ ể sử dụng Minitab thực tiêu chuờn X2 ta cần l m sau Các t ầ n số quan s t nhập vào dạng cột số

(187)

l i ệ u , chẳng h n cột C l , C2 , C3 C4 lệnh READ Sau c h ú n g ta đ n h lệnh

CHISQUARE C1 - C4

Minitab cho ta t r ê n m n hỉnh TSQS , TSLT, giá trị test t h ố n g kê " K h i bình phương" T số bậc t ự Ta cần t r a b ả n g p h â n bố2

đ ể t ì m số c v so s n h n ó với giá t r ị T

Sau ví dụ vé bảng m Minitab cho ta t r ê n m n hình :

MTB > READ C1 - C4 ROWS READ MTB > END

MTB >

MTB > CHISQUARE C1 - C

C1 C2 C3 C Total

1 47 63 182

36.79 42.64 66.42 36.14

2 26 36 57 42 161

32.55 37.73 58.75 31.97

3 53 48 84 31 216

43.66 50.62 78.83 42.89

T o t a l 113 131 204 111 5

ChiSq = 11.299

DF =

MTB >

(188)

§3 P H Â N TÍCH P H Ư Ơ N G S A I M Ộ T N H Â N T ố

Trong c h n g V c h ú n g ta đ ã xét t o n so s n h giá t r ị t r u n g b ì n h hai t ậ p hợp Trong mục n y c h ú n g ta x é t t o n t ổ n g q u t ; so s n h thòi giá t r ị t r u n g b ì n h

n h i ề u t ậ p hợp

G i ả sử ta có k Đ L N N có p h â n bố chuẩn Xị, X2 , Xk , t r o n g đó Xị ~ N(jUị , ỡỊ)

Các giá t r ị t r u n g b ì n h jUị p h n g sai ổ? đề u c h a b i ế t Tuy

n h i ê n c h ú n g ta g i ả t h i ế t r ằ n g p h n g sai b ằ n g :

ơị = ị = = õ ị

C h ú n g ta muốn k i ể m định xem l i ệ u giá t r ị t r u n g b ì n h fiị

n y có n h hay k h ô n g :

ụt = ụ2 = = ụk

Trong Thống kê v ấ n đ ể t r ê n t h n g xem x é t d i góc độ sau

G i ả sử c h ú n g ta quan t â m t i m ộ t n h â n t ố X (factor) n o N h â n t ố X có t h ể xem xét ở k mức k h c Kí h i ệ u Xị

là h i ệ u việc t c động n h â n tố X mức í đối vái cá t h ể N h vậy jUị h i ệ u q u ả t r u n g bình n h â n tố X ở mức í C h ú n g ta muốn b i ế t cho n h â n tố X thay đ ổ i mức k h c t h ì điều có ả n h hưởng hay k h ô n g t i h i ệ u q u ả t r u n g b ì n h

Thí dụ. a) C h ú n g ta muốn nghiên cứu ả n h hưởng giống t i n ă n g suất trổng N h â n t ố giống Các loại giống k h c mức n h â n tố H i ệ u giống lên n ă n g suất t r ổ n g đo sản lượng trổng N h

X c h í n h sản lượng giống ì (lị sản lượng t r u n g bình giống ì

(189)

b) G i ả sử r ằ n g c ó g i o s T o n (A, B, c, D đ a n g d ậ y m ộ t g i o t r ì n h X c s u ấ t cho n ă m t h ứ n h ấ t N h t r n g m u ố n t ỉ m h i ể u x e m đ i ể m t h i t r u n g b ì n h c ủ a c c s i n h v i ê n t h ụ g i o c c g i o s n y có k h c n h a u hay k h ô n g T r o n g b ố i c ả n h n y , n h â n t ố l g i o s M ỗ i g i o s cụ t h ể l m ộ t m ứ c c ủ a n h â n t ố H i ệ u q u ả c ủ a g i o s ư A đ ố i v i c t h ể ( s i n h v i ê n ) đ ợ c đ o b ằ n g đ iế m t h i c ủ a s i n h v i ê n đ ó N h v ậ y X A l đ i ể m t h i c ủ a s i n h v i ê n t h ụ g i o g i o s ư A, v à A l đ iế m t h i t r u n g b ỉ n h c ủ a t ấ t c ả c c s i n h

v i ê n n y N h t r n g m u ố n k i ể m đ ị n h g i ả t h i ế t

PA = !*B - Ve =

Ỉ*D-G i ả s {Xj , x2 , ••• xn ị } m ộ t m ẫ u c ó k í c h t h c / I j r ú t r a

t t ậ p h ợ p c h í n h c c g i t r ị c ủ a Xị ; {xỊ2y x

22' x

n } ^ m

ộ t m ẫ u k í c h t h ứ c n2 r ú t r a t t ậ p hợp c h í n h c c giá t r ị c ủ a X2 ,

x

ìk' x

2k ' ••• ' x

n k Ị l à m

^ m ^ u

k i ° h t h c ttk r ú t r a t t ậ p h ợ p c h í n h c c g i t r ị c ủ a Xk. C c số l i ệ u t h u đ ợ c đ ợ c t r ì n h b y

t h n h b ả n g d n g sau đ â y :

C c m ứ c n h â n t ố

1 k

k n

= 2 n \ i = ì

x

\2

k n

= 2 n \ i = ì x

21 x22

k n

= 2 n \ i = ì

k n

= 2 n \ i = ì

w x

nz2 \ k

k n

= 2 n \ i = ì

T ổ n g số

k

i =

T r u n g b ỉ n h *1 ì *k X =• — T

n

(190)

Ta đưa số kí hiệu sau

*) Trung binh mẫu thứ í (tức mẫu cột thứ í bảng trên) :

ĩ

T 2 xji

- = — = '—

*) Trung bình chung

k n

ì É

T ĨXịị / = ! • = J

X

n TI n

ở đó n = ttj + n2 + + rak ;

T = T j + T2 + + Tk

*) Tổng bình phương chung kí hiệu SST (viết t ắ t chữ Total Sum of Squares) tính theo cơng thức sau :

"1 "2 STT = (xn - ĩ ) 2 + 2 (*i 2 - ĩ )2 + +

i = Ì i = Ì

+ 2 ( * i k - í ) 2 = 2 - ĩ )2

-i = Ì j = i = Ì

Có thể chứng minh dễ dàng

STT = 2 xi + + + 2 4 - V

i = Ì i = Ì i = Ì

* ?

-i , J

(191)

SSF = nx Ợôị - ĩ )

i = Ì

= T\ Tị T\ _ T _

+) T ổ n g b ì n h p h n g sai số, kí h i ệ u SSE ( V i ế t t t chữ Sum of Squares f o r the E r r o r ) t í n h theo c ô n g thức :

n l

= 2 ( -i =

"

- ĩ ) + ( * i

i =

- X2Ỹ + + 2

( * i k - x k ) =

= ì

-i =

"

+ ẳ

-1 í = -1 i =

Tị 2

x'k

)

-T c c c ô n g thức t r ê n ta thấy

SST = SSF + SSE

+ T r u n g b ì n h b ì n h p h n g n h â n t ố , kí hiệu MSF (viết

t ấ t chữ Mean Square f o r Factor) t í n h c ô n g thức :

w n „ SSF

MSF =

k - Ì

+ k - Ì g ọ i là bậc tự nhãn tố

T r u n g b ì n h b ì n h p h n g sai số, kí h i ệ u MSS (viết t ắ t c h ữ Mean Square f o r E r r o r ) t í n h theo c ô n g thức :

SSE MSE =

n —k

n - k g ọ i là bậc tự sai số

+ T ỉ số F t í n h c ô n g thức _ MSF F ~ MSE

(192)

Các k ế t q u ả nói t r ê n t r ì n h bày t r o n g bảng sau gọi bảng ANOVA ( V i ế t t ắ t chữ Analysis of Variance : P h â n tích p h n g sai)

Nguồn Tổng

bình phương

Bậc tự

Trung bình

bình p h n g Tỷ số F

N h â n t ố SSF k - MSF MSF MSE

Sai số SSE n - k MSE

Tổng SST TI -

Bảng ANOVA

N g i ta chứng m i n h r ằ n g g i ả t h i ế t HQ đ ú n g t h ì t ỉ

số F

MSF

F =

MSE

sẽ có p h â n bố Fisher vỏi bậc tự là (k - Ì , n - k)

T h n h t h g i ả t h i ế t Ha bị b c bỏ mức ý nghĩa a

F > c, t r o n g c p h â n vị mức a p h â n bố Fisher vỏi bậc tự là (k - Ì , n - k) Trong bảng IV, Ã - Ì gọi là Bậc tụ do mẫu số

P h n g p h p k i ể m định nói t r ê n gọi là phân tích phương sai nhân tố

Cảm tưởng ban đ ẩ u ta ANOVA q u t r ì n h r ấ t phức t p N h n g thực đơn giản ta có m y t í n h bỏ t ú i Các bưỏc ANOVA t i ế n h n h theo t r ì n h tự sau :

Bưỏc Ì : T í n h SSF

Bưỏc : T í n h SST

Bưỏc : T í n h SSE = SST - SSF

(193)

Bước : T í n h MSF =

Bước : T í n h MSE =

Bước : T í n h F =

SSF

k - Ì

SSE

TI - Ì

MSF MSE

Bước : Tra b ả n g p h â n bố F đ ể t ì m c r ố i so s n h với F v r ú t r a kết l u ậ n

Thí dụ 5. Thực h i ệ n p h â n tích p h n g sai cho bảng số l i ệ u sau đ â y

Các mức n h â n t ố

Tổng số

1

Tổng số

12 12 12

10 16

7 15 16

8 l i 10

9

14

6 = 19

Ti 60 52 40 38 T = 190

6 02 522 02 82 9Ơ2 B ó c I SSF = + ^ + ^ 4- i f - ±=p

= 1957 - 1900 = 57

Bước 2 : SST = 122 + lo2 + 72 + +

19Ơ2

+ 122 + 82 + 82 + lo2 19 = 2048 - 1900 = 148

Bước 3 : SSE = SST - SSF = 148 - 57 =

(194)

Bước 4 : MSF = — = ~ - = 19

K — í Ỏ

SSE 148 148

Bước 5 : MSE = — = - = - ~ — r = = 6,04

n -k 19 — 15

MSF 19 B Ó C

MSE =

6^07 = '

-Ta t r ì n h b y k ế t t í n h t o n t r ê n t r o n g bảng ANOVA

Nguồn Tổng

bình phương

Bậc t ự

Trung bình

bình p h n g Tỷ số F

N h â n t ố 57 19 F = 3,13

Sai số 91 15 6,04

Tổng 148 18

V i mức ý nghĩa 5%, t r a b ả n g p h â n bố Fisher với bậc t ự (3,15) ta : c = 3,29

Ta có F < c ta chấp n h ậ n HQ. g

Thí dụ ổ Đ i ể m t h i 12 sinh viên học giáo sư A , B, c

được cho t r o n g b ả n g sau (thang đ i ể m 100) :

Giáo sư A Giáo sư B Giáo sư c

79 71 82

86 77 68

94 81 70

89 83 76

Với mức ý n g h í a 5%, k i ể m định xem l i ệ u đ i ể m t h i t r u n g bình sinh viên theo học giáo sư A, B, c có giống hay k h ô n g

Giải. K ế t q u ả t í n h t o n cho ta b ả n g ANOVA n h sau :

(195)

N g u n T ổ n g

b ì n h p h n g

B ậ c t ự

T r u n g b ỉ n h

b ì n h p h n g T ỷ số F

N h â n t ố 354,67 177,34 4,96

Sai số 322 35,78

T ổ n g 676,67 l i

V i m ứ c ý n g h ĩ a a = 5% , t r a b ả n g p h â n b ố F i s h e r v i b ậ c t ự ( , ) , t a t ì m đ ợ c c = 4,26

F > c n ê n t a b c b ỏ H , n g h ĩ a l đ i ể m t h i t r u n g b ì n h c ủ a c c s i n h v i ê n t h e o học c c g i o s ư A, B, c l k h c n h a u m ứ c ý n g h ĩ a 5%

Chú ý sử dụng Minitab Để t i ế n h n h p h â n t í c h p h n g sai

t r ê n m y v i t í n h v i p h n m ề m M i n i t a b , đ ầ u t i ê n t a n h ậ p c c số l i ệ u v o d i d n g c c c ộ t c h ẳ n g h n c c c ộ t C l , C2, C3, C4

Sau đ ó c h ỉ c n g õ l ệ n h

A O V O N E W A Y C1 - C

l M i n i t a b s ẽ cho h i ệ n l ê n m n h ì n h b ả n g A N O V A t í n h t r ê n d ữ l i ệ u đ ã đ a v o

Thí dụ 7. T i ế n h n h p h â n t í c h p h n g sai b ằ n g m y t í n h (sử d ụ n g M i n i t a b ) b ả n g số l i ệ u sau :

Đ i ể m c ủ a c c g i o s

A n V â n B a B ì n h

56 58 68

64 66 60 74

67 52 65 59

61 49 54

70 75 66

56 64

(196)

Giải

MTB > Name C1 "An" MTB > Name C2 "Van"

MTB > Name C3 "Ba" MTB > Nam C4 "Binh1' MTB > Set C1

DATA > 56, 64, 67, 61, 70

DATA > End MTB > Set C2

DATA > 61, 66, 52, 48, 47, 56 DATA > End

MTB > Set C3

DATA > 58, 60, 65, 79, 75 DATA > End

MTB > Set C4

DATA > 68, 74, 59, 54, 66, 64 DATA > End

MTB > AOVONEWAY C1 - C4

ANALYSIS OF VARIANCE

SOURCE DF ss MS F p FACTOR 310,6 103,5 1,85 0,174 ERROR 18 1007,2 56,0

TOTAL 21 1317,8

Cơng việc cịn l i t r a b ả n g p h â n bố Fisher với bậc t ự (3,18), mức a = 5% đ ể t ì m được c = 3, 16 số nhỏ F = 1,85 Vậy ta chấp n h ậ n Ha

(197)

G i ả sử v i ệ c p h â n t í c h p h n g s a i d ẫ n tới b c bỏ Ha, nghĩa

là có k h c n h a u c c trung b ì n h N h tổn

một cặp ự.-x , ụ ị cho // ? í / í Đ i ta c ầ n biết c ụ t h c ặ p

/Uị * fiị đ ó c ặ p n o C c n h t h ố n g kê đ ã x â y dựng m ộ t s ố p h n g p h p đ so s n h t n g cặp g i trị trung bỉnh hay so s n h n h ữ n g t ổ hợp phức tạp h n c ủ a c c t r u n g bỉnh n h p h n g p h p D u m c a n , p h n g p h p Tukey, p h n g p h p Scheffe Tuy n h i ê n t r o n g g i o t r ì n h n y t a k h n g c ó đ iề u k i ệ n t r ì n h b y n h ữ n g p h n g p h p đ ó

§4 PHÂN TÍCH PHƯƠNG SAI HAI NHÂN T ố

Trên thực t ế m ộ t biến lượng chịu t c động k h ô n g m ộ t n h â n tố m c ó t h hai (hay n h i ê u n h â n tố) C h ẳ n g h n n ă n g s u ấ t c â y trổng chịu ả n h h n g c ủ a n h â n tố giống v c ủ a n h â n tố đất K ế t

q u ả học tập c ủ a m ộ t sinh v i ê n chịu ả n h hưởng k h ô n g n h ữ n g n h â n t ố giảng v i ê n m c ò n n h â n t ố sĩ s ố lớp học

Trong m ụ c n y t a s ẽ t r ì n h bày m ộ t c c h v ắ n tắt kỹ t h u ậ t p h â n t í c h p h n g s a i hai n h â n tố n h ằ m p h t ả n h h n g c ù a m ỗ i n h â n t ố c ũ n g n h t c đ ộ n g qua l i c ủ a hai n h â n t ố đ ó

đế n b i ế n l ợ n g đ a n g x é t

G i ả s c h ú n g t a q u a n t â m tới hai n h â n tố A v B N h â n t ố

A xem x é t c c mức Aị, A2 , Ar , v n h â n t ố B

xem x é t c c n c Bị, B2, B,

G ọ i Xịk Đ L N N đ o l n g hiệu q u ả v i ệ c t c đ ộ n g c ủ a m ứ c

A v B, l ê n c t h

J K

G i ả sử xl j k , x2 j k ,- - , xnjk

l m ẫ u k í c h t h c i jk r ú t r a từ tập hợp c h í n h c c g i t r ị c ủ a X jk T a gọi đ ó l m ẫ u (J, k) Ta đ a r a s ố kí h i ệ u sau :

X jk : t r u n g b ì n h c ủ a m ẫ u {ị, k)

(198)

J O Z-l J K k =

j =

n = £ n ị ° = 2 n ok

J k

Ẹ * j k * j k Ẹ * i j k

k i k , ,

X;„ = = = trung binh mức A

J O

^ o k _

TI;

J ° J °

2 n j k * j k 2 * i j k ' J

' o k b k

X = trung bình chung =

= trung bình mức Bk

j k

n

Ta có bảng sau ghi kết tính tốn

\ A

B Bx B

2 % Be

Trung bình dòng

A-* 1 * l c *

^ C2

x2

AJ * j c * J °

* r * r c * r o

Trung bình

cột Bk * o l * o

+ Tổng bình phương chung, kí hiệu SST, được tính theo

c ĩ " j k

công thức sau S S T = X ỉ (xi i k ~~ * ) -k = I j = Ì i = Ì

(199)

+ T ổ n g b ì n h p h n g cho n h â n t ố A, kí h i ệ u l S S F A t í n h theo c n g thức s a u :

S S FA = j>j o < ĩ j o- x )

j = Ì

+ T ổ n g b ì n h p h n g n h â n tố B, kí h i ệ u l S S F g , đ ợ c t í n h theo c ô n g thức s a u :

c

S S FB = ỵ no k ( ĩo k - ĩ )

k = Ì

+ T ổ n g b ì n h p h n g s a i s ố , kí h i ệ u l S S E , đ ợ c t í n h theo c ô n g thức

c r ni l t

' \ j k - * j k ) k = Ì j = Ì i = Ì

+ T ố n g b ì n h p h n g t n g t c ( S u m of S q u a r e s for I n t e r a c t i o n ) kí h i ệ u l S S I , đ ợ c t í n h theo c n g t h ứ c

c r

S S I = ỵ ỵ ( ĩj k - xj o - xko + xỷ

k = Ì ị = Ì

+ T r u n g b ì n h b ì n h p h n g c ủ a n h â n t ố A, kí h i ệ u l M S FA, được t í n h c ô n g thức :

S S F A

r - Ì g ọ i l bậc tự A s ố mức c ủ a A t r

+ T r u n g b ì n h b ì n h p h n g c ủ a n h â n tố B, kí h i ệ u l M S FB, được t í n h c ô n g thức

M S F H = F ĩ ^ *

c - Ì g ọ i l bậc tụ B b ằ n g s ố mức c ủ a B t r Ì

(200)

+ Trung bình b ì n h p h n g sai số, kí hiệu MSE, t í n h

w „ „ SSE

MSE = _ _

n — cr n - cr g ọ i bậc t ự sai số

+ Trung bình bình p h n g t n g t c , kí h i ệ u M S I , t í n h

SSI M S I =

(c - l ) ( r - 1) •

(c - 1) (r - 1) g ọ i là bậc tự tương tác

Chú ý r n g :

(r - 1) + (c - 1) + (c - 1) (r - 1) + n - re = n - Ì = bậc t ự t ổ n g cộng

+ T ỉ số F cho n h â n t ố A , kí h i ệ u bởi FA t í n h n h sau M S FA

A MSE •

T n g t ự tí số F cho n h â n t ố B, FB t í n h M S FB

F B = MSE

và tỉ số F cho tương t c giữa A B, kí hiệu F A B tính : _ M S Ĩ

F A B ~ MSE •

V i mức ý nghĩa a đ ã cho ta kí h i ệ u f(u, v) p h â n vị mức

a p h â n bố Fisher với bậc t ự do (u, v)

Ta có quy tắc định n h sau :

+ N ế u FA > f (r - Ì, n - cr) t h ỉ ta bác b g i ả t h i ế t

: "Các mức A j Ar có h i ệ u q u ả t r u n g bình n h nhau"

+ N ế u FB >f{c - ì, - cr) t h ì ta b c b giả t h i ế t :

Ngày đăng: 09/03/2021, 06:40

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Amir. D. Aczel. Statistics, I r w i n , 1996 Khác
[2]. s.p Gordon, Contemporary Statistics, Me Graw - H i l l , Inc. 1994 Khác
[3]. H . Cramer, P h ư ơ n g p h á p t o á n học t r o n g thống kê, N X B Khoa học Kỹ thuật, H à N ộ i 1970 Khác
[4]. Nguyễn Cao Vãn, T r ầ n T h á i N i n h , Lí t h u y ế t x á c suất và thống kê toán, NXB Khoa học Kỹ t h u ậ t , 1996 Khác
[5]. Đào H ữ u H ồ , Xác suất Thống kê, N X B Đ ạ i học quốc gia, 1996 Khác
[6]. Đặng H ù n g Thắng, M ở đ ầ u về lí t h u y ế t xác suất và ứng dụng, NXB Giáo dục, 1997 Khác
[7]. Lý H o à n g Tú, T r ầ n Tuấn Điệp, Lí t h u y ế t x á c suất và thống kê t o á n học, N X B Đ ạ i học và T H O N , 1976 Khác

TỪ KHÓA LIÊN QUAN

w