Giáo trình Lý thuyết xác suất và thống kê toán - NXB Thống kê

244 15 0
Giáo trình Lý thuyết xác suất và thống kê toán - NXB Thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Giả thiết này nói về một tham số (kỳ vọng toán) của đ ạ i lượng ngẫu nhiên X- là số sản phẩm loai l i có trong sán phẩm chọn ngẫu nhiên từ lô hàng... @ltươnạ 8: Xiểm đinh già th[r]

(1)

H O À N G N G Ọ C N H Ậ M

(2)(3)(4)(5)

L i n ó i đ ầ u

Lý thuyết xác suất nghiên cứu quy luật h i ệ n tượng ngẫu nhiên Dựa thành tựu lý thuyết xác suất, thống k ê loàn khoa học định sở thông tin thu thập từ thực t ế Hơn 300 n ă m phát triển, đ ế n nội dung phương p h p xác suất thốn" kê phong phủ p dụng rộng rãi rãi nhiều lĩnh vực Vì việc học tập, nghiên cứu m ô n x c suất ihống kê hở thành nhu cầu khôn!* thể thiếu đ ố i với sinh viên n h i ề u trường đ i học

Đe đáp ứng yêu cầu nân" cao chát lượn" đào lạo, đáp ứng

đòi hỏi kinh l ố thị trương tạo điều k i ệ n thuận l ợ i đ ể sinh viên trường học m ô n x c suất thống k ê Chúng b i ê n soạn cuốn "Lý thuyết xác suất thống kê toán" Qua sách nhỏ n y hy vạn? giúp c c bạn -sinh viên đ t k ế t cao học tập, nghiên cứu m ô n học ứng dụng c c phương p h p x c suất thống kê công v i ệ c sau

Cuốn sách gồm phần chia làm chương xếp theo

(6)

Đ ố i v i nhà kinh t ế nhà quản trị doanh nghiệp, biết thu thập n ắ m vững c c phương p h p x lý thôn g tin kinh t ế xã hộ i y ê u cầu thiếu T o n học nói chung, xác suất thống k ê nói riêng cơng cụ nghiên cứu kinh t ế r ấ t hữu hiệu Đ ố i v i sinh viên, mục tiêu cuối v i ệ c học tốn sử dụng cơng cụ vào o n g công việc tương lai Do sách viết theo quan đ i ể m thực hành, trọng việc p dụng x c suất thống kê toán v o thực t ế việc trình b y vấn đ ề có tính chất túy lý thuyết

Ngoài đối tượng bạn đọc sinh viên trường Đại học Kinh tế

cuốn sách giúp ích cho tất c ô n s việc, tron" nghiên cứu phải xử lý số lượng lớn thông ùn, số l i ệ u

Cuốn sách chỉnh lý, sửa đổi số phần cho phù hợp với

y ê u cầu trình độ t i ế p thu sinh viên Đồng thời sách c n giảng dạy m ô n T o n Kinh t ế Khoa T o n -Thống kê trường đ i học kinh t ế thành p h ố H Chí M i n h g ó p ý song k h ô n g thể tránh khỏi sai sót C h ú n g tơi mong bạn đọc vần xa g ó p ý, bổ sung đ ể sách ngày c n g có chất lượng cao đ p ứng ngày tốt nhu cầu nghiên cứu, học tập sinh viên

Nhân dịp xin chân thành cảm ơn tất

đ ó n g g ó p v o nôi dung tổ chức cho sách mắt ban đọc

Thành phố Hồ Chí Minh ỉ/2003

T* 'É •

(7)

Ọliươtiti 1: c&tír i Ị ít cùa biến eổ oà cúc cô/lự thức tinh xáe ỊUất

P H Ầ N I LÝ THUYẾT XÁC SUẤT

Chương

XÁC SUẤT CỦA BIẾN cố VÀ CÁC CÔNG

T H Ứ C T Í N H X Á C S U Ấ T

ì- Phép thử loại biến cố

Tron? tốn học có khái n i ệ m khơng có định nghĩa mà mơ tả chúng hình ảnh tư trực giác Chẳng hạn tron? hình học, khái n i ệ m đ i ể m , đường thẳng, mặt phang khái niệm khơng có định nghĩa Trong xác suất, khái n i ệ m p h é p thử khái n i ệ m khơng có định nghĩa, ta hiểu p h é p thử m ộ i thí nghiệm hay quan sát P h é p thử gọi ngẫu nhiên la biết trước kết xảy Thường phép thử (thí nghiệm) có nhiều kết

xảy Có kết đơn giản, có kết phức hợp Chẳng hạn, quay xổ số, ta chí quan lâm tới hai số c u ố i m ỗ i xuấi số l 00 OI 98, 99 k ế t quả đơn giản nhất; ương xuất hiên số chẵn l ẻ đ ầ u 5, đuôi k ế t phức hợp (gồm nhiều kết đơn giản nhai hợp thành)

Kết đơn giản gọi biến cố sơ cấp (nó giống

(8)

íỊiáo trình li) tlim/ết nít' DÙ Hiốnq Uè toán

sơ cấp M ỗ i tập không gian hiến c ố sư cấp gọi b i ế n cố

Ta Ihườnsĩ dùng:

(0 đ ổ ký hiệ u b i ế n sơ cáp ;

íì đ ể ký hiệu k h ô n " gian biến c ố sơ c p ;

A B c, A | A2 A„ đ ể ký hiệu h i ế n cố Để minh họa, la XÓI phép thử có số kết đơn giản hữu hạn

hoặc vô hạn đ ế m được: (Oi, 0)2 Theo trên, m ỗ i cou gọi hiên sơ cấp, cịn lập hợp

Q = leo, CO:, } khơng dan Hiơli sơ cáp

Thí dụ:

Ì- Gieo m ộ i xúc xắc thực p h é p lliử K h ô n g aian các biên cô sơ cáp đôi với phép thử là:

Q = í (Oi (Õ2 Ị, 0)4, (0ỹ, 0)(lj

tron" đó: Củi (i = ì, , 6) chí kết xúc xắc xuất mại i chấm

2 Gieo hai xúc xắc Khôns eian biên cố sơ cấp p h é p thử là:

Q = {con, to,: ,,0)fõ, Oif.fi}

trong đó: 0)jj (i j = 1,2 6) kết xúc xắc thứ xuất

hiện mặt i chấm xúc xắc thứ hai xuất h i ệ n mặt j chấm (phép thử có 36 biến cố SƯ cấp)

(9)

VhttơntỊ 1: (ÀMÍC iittĩt tim biến cố va etíe inỊ thứ* titth ,rtíe suất

Như vậy, mội biến cố du LO Me xay mội phép thử gắn liền

với thực TroiiiỊ thực t ế có thơ xảy loai b i ế n c ố sau đ â y :

+ Hiến cố chắn: lù biến cố đinh xảy thực h i ệ n p h é p thử B i ế n cố chán ký hiệu Q

Thi dụ: Tung xức xấc biến cố " xuất m ã i cớ số chấm

nhỏ 7" biến c ố chắn

+ Biếu cố khơng thể có: biến cố định không xảy thực p h é p thử B i ế n c ố không thê dược ký hiệu

Thi dụ: M Ộ I k i ệ n hùng có l o sản phẩm (trong có sản phẩm

l o i í sản phẩm loại l i ) Chọn ngẫu nhiên không h o n l i l k i ệ n sản phẩm B i ế n cố: " có sản phẩm loại ì sản p h ẩ m l ấ y từ k i ệ n " biến cố không i h ể có

+ Biến cố ngẫu nhiên: b i ế n c ố xảy k h ô n g xảy thực p h é p thử người ta thường dùng chữ in hoa đ ể ký h i ệ u biến cố nsẫu nhiên, chẳng hạn: A, B, c, ; A i , À , , A n : B i , B i , , B,J,

Thí dụ: Tung xúc xắc, gọi A2 biến cố: "xuất h i ệ n mặt

c h ấ m " A2 biến c ố ngẫu nhiên li- Mối quan hệ biến cố

Khi g i ả i toán lý thuyết xác suất ta thường phải d i ễ n tả một b i ế n c ố phức hợp theo hiến cố đơn gián Đ e l m điều ta cần nghiên cứu m ố i quan hộ biến c ố thể h i ệ n qua định nshía đây:

Định nghĩa ì: B i ế n c ố A B g ọ i hai biển cố tương đương

(10)

Qiủa trình /ý thuyết xức DÙ t/tơnạ kè tốn

Thí dụ Tung xúc xắc, h i ế n cố " x ú c xắc mặt chẩn**

b i ế n cố "xú c XÍU r;i mặt: 2, 4, 6" hai b i ế n c ố tương đương

Định nghĩa 2: B i ế n cố c g ọ i tổng b i ế n c ố A B (ký

hiệu c = A ù B c = A + B) N ế u c x ả y có mơi hai biến c ố A B xảy

Thí dụ: Xét phép thử quan sát hai xạ thủ bắn vào bia Gọi

A biến cố "xạ thủ thứ bắn trúng bia", B b i ế n c ố "xạ thủ thứ hai bắn trúng bia", c b i ế n cố "bia trúng đ n " R õ ràng c xả> chi có m ộ i hai b i ế n c ố A, B xảy V ậ y :

c = A u B I

Định nghĩa 3: B i ế n cố A g ọ i lổng n b i ế n cố: A j , A2, An A xảy chí có mộ t n b i ế n c ố x ả )

Ký hiệu là:

li • A = A i u A i ụ u An A = M A j A = 2^Ai

i=i i=i

Định nghĩa 4: Biến cố c gọi hiệu biến cố A B (ký

hiệu c = A - B) N ế u c xảy A xảy B khơng xảy

Thí dụ: Một lớp có 50 học sinh, có 15 người giỏi toán, 10

ngươi giỏi văn người giỏi hai môn Gặp ngẫu nhiên học sinh lớp G ọ i A b i ế n cố gặp người g i ỏ i loàn; B b i ế n c ố gặp người giỏ i văn ; c b i ế n c ố gặp ngư i chi giỏi tốn, c = A - B

Định nghĩa 5: Hai biến cố A B gọi xung khắc

(11)

VttiMiHỊ Ị: f.X)ùi' suất cún biếu eìỉ vù cị lít/ thửe tính je suất

Trong thực l í với sơ p h é p thử đủ lớn ta có thổ lấy lần suất làm giá trị iiân li ú li Ỉ: xác suấL Tức la có PíA) * RA) n lớn

* Chủ ý: Khái niệm hội lạ theo xác suấi lần suất cú iBrhĩa với m ọ i Í: ihíóiiu bé tùy ý ta ln có:

Lim vịt' - pị < e) = Ì

n—>oc

Đốn chưtiiii! la chứng minh S("í lý thuyết hội lu Nhờ thành lồn học kỹ ihuậl lính toán đại,

định nghĩa thốn" kê x c suất có l ầ m quan trọng đặc biệt ứng dụng

4- Nguyên lý xác suất nhỏ xác suất lổn

Trong nhiều toán thực l ố , ta thườn" irặp biến c ố có xác suất rái nhị, tức gần b n g Qua nhiều lần quan sái, người ta thấy rà nạ: hiến c ố có xác suất nhỏ gần khôiiỉĩ xảy ihực hiện p h é p thử Trên d í sở đưa "Nguyên lý ihực l ố không thể có c c biến c ố LĨ x c suất nhỏ" sau đ â y :

Nếu mội biến cố có xác suất nhỏ thực lố cho m ộ i p h é p ihử, biến khòm: xảy Việc qui định mức xác suất coi "rất nhỏ" tùy thuộc

v o loàn cụ t h ể C h ẩ n " hạn: N ế u xác suối đ ể loại dù không mà nhảy dù 0,0ỉ xác suất chưa thổ coi nhỏ la khôns: n ê n sử đ ụ n " loại dù đ ó Sm xác suất đổ m ộ i chuyến xe lửa đ ố n ỈM chậ m l o phin 0.01 ta có th ể coi mức x c suất đ ó nhỏ lức có thổ cho rằm? xe lửa đốn ga đúnsi iiiìí

MỘI mức xác suất nhỏ mà với ta có lliể chi) rằn ÍT: biên cố

(12)

Lịìáo trình Ị lị thuyết xát Mất oà thống kẻ toài*

theo toán cụ thể, mức ý nghĩa thường lấy ưong khoảng từ 0,01 đ ế n 0,05

Tương tự ta nêu ra" nguyên lý thực tế chắt chắn xảy b i ế n c ố có xác suất lớn" n h sau: ,

N ê u biến c ố có xác suất gần Ì thực te V > 'hổ cho b i ế n c ố đ ó xả y m ộ i p h é p thử

Cũng ưên, việc qui định mức xác suất dượt L»»I "lớn" tùy

thuộc vào toán cụ t h ể T h ô n g thường người la l ấ y khoảng từ 0,95 đ ế n 0,99

IV- Công thức cộng xác suất

a- Nếu Ả B hai biến cố xung khắc thì:

Chứng minh: Ta chứng minh cho trường hợp p h é p thử phân

tích thành n trường hợp đ ố i xứng, c ó m i trường hợp thuận lợi cho A m2 trường hợp thuận l ợ i cho B K h i đ ó số trường hợp thuận lợi cho b i ế n c ố (A u B) là: mi+nv> (vì A, B hai biến cố xung khắc)

Ta minh họa số trường hợp thuận lợi sau: P ( A u B ) = P ( A ) + P(B)

(13)

QtuMng ì: Ợũảê en biết! tế vù tám tồng, títứe tinh xáe tuất Trường hợp tổng quát, công Ihức phát biểu sau:

Nếu Aj, A2, , An n biến cố xung khắc đơi, thì: P(Aj u A2 u u An) = P(A,) + P(A2) + + P(An)

Bạn đọc chứng minh công thức phương pháp quy nạp

Thí dụ 1: Một hộp có 10 sản phẩm (trong có phế phẩm) Lấy

ngẫu nhiên (khơng hồn l i ) từ hộp sản phẩm T i m x c suất đ ể có khơng q Ì p h ế phẩm sản phẩm l ấ y

Giải: Gọi A biến cố "khơng có phế phẩm sản phẩm

lấy ra"; B b i ế n c ố "có Ì p h ế phẩm sản phẩm lấy ra" c b i ế n c ố " c ó k h n g q u Ì p h ế phẩm sản phẩm l ấ y ra"

Ta thấy: c = A u B •

M A , B hai b i ế n c ố xung khắc (vì khơng thể đồng thời xảy p h é p thử lây ngẫu n h i ê n sản phẩm từ hộp) V ỉ

P(C) = P(A u B ) = P(A) + P(BÌ

- = ± L p( B ) = £ i £ i = ^

c i 105 c „ 105 'lo ^10

V ậ y :

P(C) = i i + ^ = i = ỉ 105 105 105 Từ công thức ta suy số hệ sau:

Hệ 1: Nếu Ai, A2 An hệ biến cố đầy đủ xung khắc đơi thì:

li

(14)

íịiúo Ị'tìnít í lị thuyết -rác suất vù iltổiiq kè toán

Hệ 2: N ế u A A hai biến c ố đ ố i lập với thì:

P ( A ) = Ì - P( A )

Bạn đọc dễ dìm" chứng minh hệ b- N ế u A B hai b i ế n c ố k h n g xung k h ắ c thì:

P(A u l i ) = P(A) + PHỈ) - P(A.B)

Chứng minh: Giả sử phép thử có n trường hợp đ ố i xứnc tron" có

mi trường hợp thuận lợi cho A, 1112 inrìíriỉĩ hợp thuận l ợ i cho B Vì A B khơng xung khắc nên nói chung cớ k irườnu hợp thuận lợi cho A B Khi số trường hợp thuận l ợ i cho b i ế n c ố (A u B)

Ì mi + m-> - k

Ta có th ể minh họa trường hợp nh sau:

Theo mơ lả hình m ỗ i nốt chấm đen trường hợp ihuận lợi thì: rai = 12; m2 = 15; k =

Theo định nghĩa cổ điển xác suất, ta có: n,A D> m , + m , - k m , m , k

P ( A u B ) = - i — ^ = : ^ i + l í ỉ _ _ ± = P ( A ) + P ( B ) - P ( A B )

n n n ũ

B = P ( A ) ; ^ L = P ( B ) ; ằ = P ( A B ) n n n

Thí dụ: M ộ t lớp có 50 sinh viên.trong có 20 sinh viên học giỏi

(15)

Phương í: (Xiáe li lất cùa biến cố vù cịng tinh' tính xác

m n T o n Anh văn Chọn ntrẫu nhiên sinh viên lớp T i m xác suất đ ể chọn sinh viên học giỏi m ô n hai môn T o n Anh văn

Giai: Gọi A biến cố chọn sinh viên học giỏi mơn Tốn; B

b i ế n c ố chọn sinh viê n học giỏ i mô n Anh văn; c b i ế n c ố chọn sinh viên học giỏi hai môn T o n Anh văn Ta thấy c = A w B mà hai biến cố A B hai biến c ố không xung khắc (vì A B xảy đồntĩ Ihời p h é p thử Đ ó trường hợp chọn sinh viên học giỏi hai m ô n T o n Anh văn) Do đ ó :

P(C) = P(A) + P(B) - P(AB) = — + — - — = — =0,8

50 50 50 50

Trường hợp tổng quát công thức phát biểu sau:

Nếu Ai, A2, An n biến cố khơn" xun*: khắc thì: li

P ( A j U A2U u An) = Ị T P ( A i ) - X P ( Ai A )) + £ p( A lA j Ak) i=l " Ki i<j<k

+ ( - l )n- ' P ( A1 A2 An) • Trường hơy li = 3:

P(A, U A2 u A , ) = P ( Al) + P ( A:) + P ( A3) - P ( A1A2) P ( AIA , ) - P ( A , A , ) + P ( AIA3A3) • Trường hợp li = 4:

P(A, ÙA, ÙA, UA4) = P(A,) + P(A,) + P(A,) + P(A4)

- P ( AIA2) - P ( AIA1) - P ( AIA4) - P ( A:A , ) - P ( A , A4) - P ( A3Ã4) + P(A, A , A , ) + P(A IA , A4) + P(A, A , A \ )

(16)

(ịlủo trinh /lị tỉtui/ểt xác Hít thấm/ kê toan

c- N ế u A j , A „ , An n b i ế n c ố k h ô n g xung k h ắ c v độc lập t o n p h ầ n thì:

ỸịầịU A2U u An) = Ì - P ( Ã1) P ( Ã2) P ( Ãn)

V- Cơng thức nhân xác suất Ì- Xác suất có điều kiện

a- Định nghĩa: Xác suất biến cố A tính v i đ i ề u k i ệ n biến

cố B xảy gọi xác suất có đ i ề u k i ệ n A Ký hiệu P(A/B)

b- Thí dụ: t r o n g bình có cầu (trong có ưắng) Lấy

ngẫu nhiên hai (lấy không h o n l i ) T i m x c suất để lần thứ hai lấy trắng biết lần thứ lấy cầu trắng ?

Giải: Gọi A biến cố "lần thứ hai lấy cầu trắng"; B biến cố

"lần thứ lấy cầu trắng" Ta cần tìm P(A/B)

Ta thấy lần thứ lấy cầu t r ấ n " (tức B xảy ra) nên bình cịn l i quả, có Ì cầu trắng

Nên: P(A/B) = -4 c- cơng thức tính:

P(AB) P ( A / B ) =

P(B)

Ta dùng khái niệm xác suất có đ i ề u k i ệ n đ ể định nghĩa cách k h c biến c ố độc lập sau:

Nếu: P(A/B) = P(A) P(B/A) = P(B) A, B độc lập 2- Nếu A, B hai biến cố bất kỳ, thì:

(17)

@/utưnạ 1: Qbáe biển eấ oà uạ thức Hu xịe tuất Chứng minh: Giả sử p h é p thử có n trường hợp đ ố i xứng, có

m i trường hợp thuận l ợ i cho A; IĨ12 trường hợp thuận l ợ i cho B Vì A , B k h ô n g xung khắc n ê n nói chung có k trường hợp thuận l ợ i cho A B Theo định nghĩa cổ điển xác suất ta có:

le m P(AB) = - ; P(A) = ^ ị

n n Ta tính P(B/A)

Với điều kiện A xảy nên số trường hợp đối xứng biến cố B mi ; số trường hợp thuận lợi cho B k Do vậy:

P(B/A) = — m, Ta có:

le m lí

P(AB) =- = ĩ^- — = P(A)P(B/A) u n m ị

Vì vai trị biến cố À B nhau, chứng minh tương tự ta được:

P(AB) = P(B)P(B/A) Ta xét thí dụ để minh hoa cho phần chứng minh nêu trên:

M ộ t lớp có 50 sinh viên, có 20 nữ 30 nam Trong kỳ thi m ô n T o n có 10 sinh viên đ i đ i ể m giỏi (trong có nam nữ) G ọ i tên ngẫu nhiên sinh viên danh sách lớp T i m xác suất g ọ i sinh viên đạt đ i ể m giỏi mơn T o n biết sinh viên n ữ ?

Trong thí dụ này, phép thử gọi ngẫu nhiên tên mội sinh viên

(18)

<ậiáo trình lý tí IU yết xtỉe xuất DÙ thốn*/ kè toán

irườne hợp thuận l ợ i cho A B (k) (đó sơ sinh viên nữ đạt đ i ể m giỏi mơn Tốn) X c suất cần tính P(B/A) Ta có:

P ( B / A ) = — = — = m, 20

Trường hợp tổng quát, công thức phát biểu sau:

Nếu Aj, A2, , An biến cố thì:

P(A1.A2 An) = P(A1).P(A2/A1) P(An/A1.A2 An.j)

3- Nếu A, B hai biến cố độc lập, thì:

P(A.IÌ) = P(A).P(B) Bạn đọc có thổ dễ dàn" chứng minh cơn" thức

Trường hợp tổng quát công thức phái biểu sau:

N ê u A j , A-J, — , An c c b i ế n c ố độc l ậ p t o n p h ầ n , t h ì : P(A!.A2 An) = P(A!).P(A2) P(An)

Thí dụ: Một phân xưởng có máy Xác suất máy bị hỏng

trong n g y tương ứng là: , ; 0,2; 0,15 T í n h x c suất c ó m ộ t m y bị hỏng n g y ?

Giải: (a) Gọi Ai, Ai, Áy tương ứng biến cố máy thứ nhất, thứ

hai, thứ ba bị hỏng ngày Khi A I ; A Ị ; A tương ứng c c b i ế n c ố má y thứ nhất, thứ hai, thứ t ố i ngày

A biến cố có máy hỏng ngày Ta thây:

A = Â | A Ị A J + A i A Ị A i +Ã1.Ã2.A3

(19)

Phương Ị: fẦHÌe suất rùa biến cố fúf cịng tltửe tinh xác

Vì b i ế n c ố lích xung khắc lừng đơi b i ế n c ố m ỗ i tích độc lập tồn phần, đ ó :

P(A) ) = P(A| ).p(Ã2 )p(Ã J ) + p(Ã Ì )P(À , ).p(Ă3Ị+ p(Ă Ì )P(Ã2 )p(A3) = Ọ Ì 0.8.0.85 + 0.9.0.2.0,85 + 0.9.0.8.0,15 = 0,329

VI- Công thức Bernoulli

Trong nhiều toán thực l ố , ta thườn" sập trườn" hợp p h é p thử dược lập lặp l i nhiều lần Trong p h é p ihử xảy hay khơntĩ xảy biến cố A la quan tâm đ ố n lổng số lần xảy biến c ố A d ã y p h é p thử Chẳng hạn, n ế u t i ế n h n h sản xuất hàn g loạ i m ộ i loạ i chi t i ế t n o đ ó ta thường quan t â m đ ế n tổng số chi t i ế i đạt tiêu chuẩn trình sản xuất B i tốn có the giải d ễ dàng c c p h é p thử độc lập với

Các phép thử gọi độc lập với xác suất để xảy

một biến c ố p h é p thử khơng phụ thuộc v p việc b i ế n c ố d ó có xả y p h é p thử c hay không Chẳng hạn: tung n h i ề u lầ n đồng xu lấ y ngẫu nhiê n có hồ n l i n sản ph ẩ m l lô h n " lạo nên p h é p thử độc lập

Giả sử tiến hành n phép thử độc lập Trong phép thử có

thể xảy hai trường hợp: Hoặc biến cố A xảy b i ế n c ố A khôn g xả y X c suất xả y b i ế n c ố A m ỗ i p h é p thử đ ề u p xác suất A khơng xảy Ì - p = q Khi dó xác suất đ ể n p h é p thử độc lập nói biến c ố A x ả y k lần ký hiệu Pk(A)đƯỢc tính theo cơng thức Bernoulli sau đây:

Pk(A)=Cnkpkqn-k (k = 0,1,2 ,n)

Chứng minh: Gọi Ai biến cố "ở phép thử thứ i, A xảy ra" (i = Ì, 2,

(20)

íỊiảo- trĩnh tụ títuụếi xịe thống kê toán

Gọi B biến cố "trong n phép thử, A xảy k lần" B

xảy theo nhiều cách khác Chẳng hạn, k p h é p thử đầu, A xảy ra, n-k p h é p thử sau A khơng xảy Trường hợp ta biểu diễn b i ế n c ố tích:

A | A2 Ak Ak+I Ak+2 An

Hoặc n-k p h é p thử đầu A khơng xảy ra, cịn n-k p h é p thử cuối A xảy Trường hợp ta b i ể u diễn b i ế n c ố tích có dạng: A1Ã2 A„-k.A,,-k+iAn-k+2 A„

Tổng số tích số cách chọn k p h é p thử đ ể biến c ố A xảy ra, tức c\ biến cố B tổng biến cố tích Đ ố i với m ỗ i tích, ta thấy biến c ố A xảy k lần,

A xảy (n-k) lần Do xác suất m ỗ i tích đ ề u

k n—k

p q V ì biến cố tích biến cố xung khắc đơi, nên ta có:

Pk(A) = P(B)= c„yqn-k

Thí dụ: Một lơ hàng có tỷ lệ phế phẩm 5% Lấy ngẫu nhiên từ

lơ hàng sản phẩm đ ể k i ể m tra (lấy có hồn l i ) T i m xác suất đổ có p h ế phẩm sản phẩm lấy k i ể m tra?

Giải: Ta coi việc kiểm tra sản phẩm thực phép

thử Vì k i ể m tra sản phẩm n ê n ta coi thực p h é p thử độc lập Gọi A biến cố "sản phẩm lấy k i ể m tra la p h ế phẩm" Ta thấy m ỗ i p h é p thử xảy hai trường hợp: Hoặc sản phẩm k i ể m tra phố phẩm (tứcA xảy ra), s ả n phẩm k i ể m tra sản phẩm tốt (tức A không xảy ra) X c suất đ ể A xảy m ỗ i p h é p thử 0,05 Vày điều k i ệ n đ ể p dụng công thức Bernoulli đ ề u thoa mãn V I vậy, xác suất đ ể có phế phẩm sản phẩm lấy k i ể m tra là:

(21)

ệỊkựỰaạ ì: Ọbáe Mất biến cố ênụ thức tinh, xịe lất

p2 (A) = c\ (0,05)2 (0,95)3 =s 0,0214

VII- Công thức xác suất đầy đủ

Gia ỉ>ư hiến cố A b i ế n c ố có t h ể x ả y đồng thời v i m ộ t c c biến c ố Hl t H2 , Hn - h ệ b i ế n c ố đ ầ y đủ xung khắc đơi K h i x c suất b i ế n c ố A tính theo c n g limV sau đây:

p(A)=^?aiiAAmi)

i = l

Các xác suất P(Hi); P(H2); P(H„) thường gọi xác

suất giả thiết (hay c c x c suất tiên nghiệm) công thức g ọ i công thức x c suất đ ầ y đủ

Chứng minh: Vì biến cố Hi, H2, , Hn hệ biến cố đầy

đủ xung khắc đôi, n ê n b i ế n c ố A n ế u x ả y x ả y đồng thời v i c c b i ế n c ố V ậ y ta c ó :

A = H|.AuH2.Au uH„.A

Do c c b i ế n c ố H j , Hi, Hn xung khắc đôi n ê n c c b i ế n c ố H [ A ; H2.A ; ; H„.A xung khắc đôi Á p dụng công thức

n

cộng x c suất ta có: P(A) = P ( H , A ) i=i

Theo công thức nhân x c suất, ta l i có: P(Hi.A) = P(Hi).P(A/Hi)

Vậy: P(A)=ịP(Hi)P(A/Hi)

i=l

Thí dụ: Cỗ lơ sản phẩm, tỷ lệ phế phẩm lô tương ứng là:

(22)

(Ịláo trình lý, L'uiụê'1 xác tuất oà tlicútạ kê toán

Giải: G ọ i A b i ế n cố l ấ y p h ế phẩm H i , H2, H3 tương ứng h i ế n c ố sản phẩm l ấ y thuộc lô thứ nhất, thứ hai, thứ ba Các b i ế n c ố H i , H2, H3 m ộ t h ệ b i ế n c ố đ ầ y đủ xung khắc đôi, biến c ố A xảy đồng thời v i m ộ t c c b i ế n cố Áp dụng công thức x c suất đ ầ y đủ ta có:

l \ A ) = P(H|)P(A/H|) + P ( H2) P ( A / H2) + P ( H3) P ( A / H3) Ì

P(H,) = P(H2) = P ( H3) = Ỷ P(A/H,) = 0,06; P(A/H2) = 0,02 ; P(A/H3) = 0,01

Vậy: • P(A)=-(0,06 + 0.0? 0,01) = 0.03

VUI- Công thức Bayes

Giả sử A b i ế n cố xảy đỏng thời với b i ế n cố H i , H2, , Hn - hệ b i ế n cô đ ầ y đủ xung khắc đôi Giả thiết A xảy K h i đó:

pm/ P(H,)P(A/H,)

P(Hị/A) = — (V i = Ì, , n) X p ( H i ) p ( A / H i )

i=l

Chứng minh: Theo cơng thức nhân xác suất ta có:

P(Hi.A) = P(Hi).P(A/Hj) = P(A).P(Hị/A)

^P(Hi/A)=ỈÍMi^ii

P ( A ) Theo công thức xác suất đầy đủ ta c ó :

P ( A ) = £ P ( H , ) P ( A / H , )

34

(23)

ẽhư&iiạ í: (Xjác iu ất biến cố ếe CÁ li thứe tính, xịe Mất

V ậ y :

P ( H | / A ) = J W ^ > ( i = 1, „ ) X P ( H , ) P ( A / H , )

i=l

Các xác suất P(Hị/A) xác định sau biết kết

3hép thử A x ả y n ê n thương gọi xác suất hậu

nghiệm N h v ậ y công thức Bayes cho p h é p ta x c định l i c c xác suất tiên nghiệm P(Hi) biết thcm thông tin A xảy k h i thực

liên m ộ t p h é p thử

Thí dụ: Ta x é t thí dụ phần công thức xác suất đầy đủ cho

b i ế t t h ê m lấ y p h ế ph ẩ m lấ y ngẫu nhiê n mộ t sản p h ẩ m từ lô h n g chọn Tính x c suất chọn lô h n g ?

Giải: V ì A xảy n ê n p dụng cơng thức Bayes, ta có:

Xác suất lơ hàng có tỷ lệ phế phẩm 6% chọn là:

P(H,)P(A/H.) 30'06

P(H[/A) = — =

-P ( À ) 0,03 Xác suất để lơ hàng có tỷ lệ phế phẩm 2% chọn là:

P(H2)P(A/H2) 3'0'02

P(H2/A) = 2: = =

-P ( A ) 0,03 Xác suất để lơ hàng có tỷ lệ phế phẩm 1% chọn là:

P(H3)P(A/H3) 3'0'01 Ì

P(H3/A) = : — — = =

(24)

ẨỆiáữ trình bị thuyết xuê mối tkốuạ kê tốn

C h n g ĐẠI LƯỢNG NGẪU NHIÊN VÀ

Q U I L U Ậ T P H Â N P H Ố I X Á C S U Ấ T

I- Định nghĩa phân loại đại lượng ngẫu nhiên Ì - Định nghĩa

Đại lượng ngẫu nhiên (hay b i ế n ngẫu n h i ê n ) m ộ t qui tắc hay

môi h m đ ể g n giá trị sô cho k ế t qua m ộ t phép thu ngầu nhiên

Như vậy, thực phép thử, đại lượng ngẫu nhiên nhận

một giá trị n o tập hợp c c giá trị mà nhận Việc đ i lượng ngẫu nhiên nhận giá trị cụ t h ể n o m ộ t b i ế n cố

Các đại lượng ngẫu nhiên thường ký hiệu là: X, Y, z, Xi,

X2, , xn ; Y i , Y2, , Ym ; C ò n c c giá trị có ký h i ệ u là: Xi, x2 x„ ; y i , y% ym

Thí dụ ì: Tung xúc xắc, g ọ i X số chấm xuất X

đ i lượng ngẫu nhiên k ế t p h é p thử nhận giá trị: Ì, 2, 3, 4, 5, với x c suất tương ứng đ ề u 1/6

Thí dụ 2: G ọ i Y số p h ế phẩm có 100 sản phẩm l ấ y kiểm

tra Y đ i lượng ngẫu nhiên k ế t p h é p thử Y nhận giá trị: 0, Ì, , , 100

2- Phân loại đại lượng ngẫu nhiên

D i lượng ngẫu nhiên rời rạc liên tục

(25)

@hư&nạ 2: Dại lường, m/ẫti nhiên qui luật phản pltối xòe luốt

Đối với đại lượng ngẫu nhiên rời rạc, ta liệt kê giá trị

Đ i lượng ngẫu nhiên g ọ i liên tục n ế u giá trị mà có t h ể nhận lấp kín khoảng ê n trục số

Đ ố i v i đ i lượng ngẫu nhiên liên tục, ta l i ệ t k ê tất giá trị

Thí dụ: số sinh viên vắng mặt buổi học ; sô máy hỏng

trong ngày p h â n xưởng, đ i lượng ngẫu n h i ê n rời rạc

N ế u g ọ i X trọng lượng mộ t loạ i sản ph ẩ m mộ t nhà m y sản xuất; Y sai số đo lường đ i lượng vật lý; X, Y đ i lượng ngẫu nhiên liên tục

li- Qui luật phân phối xác suất đại lượng n g ẫ u n h i ê n

Để xác định đại lượng ngẫu nhiên ta phải biết đại lượng ngẫu

n h i ê n nhận cạc giá trị n o nhận giá trị với x c suất tương ứng

M ộ t h ệ thức cho p h é p b i ể u d i ễ n m ố i quan hệ giá trị cố thể nhận đ i lượng ngẫu nhiên v i x c suất tương ứng đưck g ọ i qui luật phân phối xác suất đ i lượng ngẫu nhiên

Đ ể thiết lập qui luật p h â n phối xác suất đ i lượng ngẫu nhiên ta dùng: bảng phân phối xác suất hàm phân phối

xác suất hàm mật độ xác suất

Ì- Bảng phân phối xác suất

(26)

CỊÌÚƠ trịnh Ị lị thuyết xóa ỊhấỊỊtạ kè tốn

Giả sử đ i lượng ngẫu nhiên X nhận giá trị: Xli X2, , xn

với xác suất tương ứng là: Pi, P2 Pn

Tức:pi = P(X = Xi)(i=l,2, ,n)

Bảng phân phối xác suất X có dạng:

X Xi x2 Xn

p Pl P2 • • • • Pi,

Đ ố i với bảng phân phối xác suất, ta lu*''li có: ọ = Ị Í=I

Thí dụ: Trong hộp có lo sản phẩm (tronu dị oi phẩm) Lấy

ngẫu nhiên khơng hồn l i từ hộp sản phẩm L ậ p bảng phân phối số phẩm lấy ?

Giải: Gọi X số phẩm lấy từ hộp X đại lượng

ngẫu nhiên rời rạc nhận giá trị: 0, , , v i xác suat tương ứng:

c2

P l= P ( X = 0) = ^ f = - = : cic; c3

Vậy qui luật phân phối xác suất X là:

X

p 2/15 8/15 5/15

(27)

QitơơiHỊ 2: r-ùại ittơttạ (Ị VUI nhiên iịiù luật phân phối xát' xuất

Hàm phân phối xác suàt thiết lập cho đại lượng ngẫu nhiên r i rạc đ i lượng ngầu nhiên liên tục

a- Định nghĩa: H m phân phối xác suất đ i lượng ngẫu nhiên X

[ký h i ệ u F(x)] định nghĩa biểu thức: F(x) = P(X < x) Nếu X đại lượng ngẫu nhiên rời rạc hàm F(x) có dạng: F(x)= £P(X<X,)= XP,

XÉ<X x,<x

b- Tính chất: Ta chứng minh tính chất sau

h m p h â n phối xác suất

* Tính chất ì: Hàm phân phối xác suất luôn nhận giá trị khoảng [0, 1] , tức: < F(x) < Ì

Tính chất suy từ định nghĩa F(x)

* Tính chất 2: H m p h â n phối xác suất h m không giảm Tức là:

n ế u X2 > Xi F(X2> > F ( x i )

Chứng minh: Thật vậy, ta có:

(X < x2) = (X < Xi) + ( X I < X < x2) Do đ ó :

P(X2 < X < Xi) = P(X < x2) - P(X < Xi) = F(x2) - F ( x Vì: P(X| < x < x2) > => F ( x2) - F ( x , ) >

V ậ y : F ( x2) > F ( x i )

T tính chất ta suy số h ệ sau:

Hệ 1: P(a < X < b) = F(b) - F(a)

(28)

ịịiào trình tý thuyết xịe luốt thõng kê tốn

Hệ 2: X c suất đ ể đ i lượng ngẫu n h i ê n liên tục nhận giá trị

xác định cho trước

Thật Từ h ệ Ì, ta đặt: a = X ; b = X + Ax, ta có: P(x < X < X + Ax) = F(x + Ax) - F(x)

Lấy giới hạn hai vế Ax-> ta có:

Lim P(x < X < X + Ax) = Lim F(x + Ax) - F(x)

Vì X đại lượng ngẫu nhiên liên tục nên F(x) liên tục X T ta có:

Lim F(x + Ax) = F(x)

Ax->0 Khi Ax thì: P(x < X < X + Ax) P(X = x)

V ậ y : P(X = X) =

Hệ 3: Nếu X đại lượng ngẫu nhiên liên tục thì:

P(a < X < b) = P(a < X < b) = P(a < X < b) = P(a < X < b) * Tính chất 3: Lim F(x) = Ì ; Lim F(x) =

Tính chất viết dạng:

F(+oo) = Ì ; F(-oo) = c- Ý nghĩa hàm phân phối xác suất:

T định nghĩa h m phân phối xác suất ta thấy h m F(x) phản ánh mức độ tập trung xác suất phía b ê n trái đ i ể m X Giá trị h m F(x) cho biết có phần đơn vị xác suất phân phối khoảng ( - co, x)

(29)

Giường 2: <ĩ)a£ ỈKỌIHỊ ti gau 'thiền oà q luật phàn phối xịe luốt a- Định nghĩa: Hàm mật độ xác suất đại lượng ngẫu nhiên liên

tục X [ký h i ệ u f ( x ) ] đạo h m bại hất h m p h â n phối Tức: f(x) = F'(x)

b- Tính chất: Hàm mật độ xác suất có tinh chác sau lũy:

* Tính chất 1: f(x) > (V x)

Tính chất n y suy từ tính chất h m p h â n phối x c suất D

* Tính chất 2: P(a < X < b) = j f ( x ) d x

Chứng minh: Thật v ậ y , theo công thức Newton Leibnitz ta có:

u

J f ( x ) d x = F(x) = F(b) - F(a)

Trong đó: F(x) n g u y ê n h m cua f ( x ) Theo hệ l(tính chất 2) hàm phân phối xác suất thì:

F(b) - F(a) = P(a < X < b) Do X đ i lượng ngẫu n h i ê n liên tục n ê n :

P ( a < X < b ) = P ( a < X < b ) T suy đ i ề u cần p h ả i chứng minh mặt hình học, tính chất minh họa sau:

Xác suất để đại lượng ngẫu nhiên liên tục X nhận giá trị

(30)

lịiúa trình lý thuyết xúc luốt thống kè tốn

f(x) Ạ

0 a b X

* Tính chất 3: F(x) = J f ( x ) d x

-co I

* Tính chất 4: Jf(x)dx = Ì

-ao

B n đọc tự chứng minh tính chất

c- Ý nghĩa hàm mật độ:

T định nghĩa h m mật độ ta suy h ệ thức xấp xỉ: P(x < X < X+Ax) « f(x)Ax

Tức xác suất để X lấy giá trị thuộc lân cận bé (x, x+ Ax)

gần tỉ l ệ với giá trị hàm f(x) t i đ i ể m X Vì vậy, với độ dài Ax nhau, đ i ể m X mà giá trị h m f(x) lớn lân cận đ i ể m tập trung xác suất lớn Chính mà f ( x ) có t ê n h m mật độ xá c suất

(31)

nhương 2: (Đại lưựitq ttạẫu nhiên DÙ ỊịỊti Ị Ị lội phàn pỉtấì xáo

Khi ta xác định qui luật phân phối xác suất đại lượng

ngẫu nhiên ta n ắ m tồn thơng tin đ i lượng ngẫu nhiên Tuy nhiên thực t ế khó khơng cần thiết phải nắm tồn thơng tin này, mà cần quan t â m đ ế n thông tin quan trọng nhất, phản n h đặc trưng đ i lượng ngẫu n h i ê n n g h i ê n cứu Phần n y n ê u vài tham số đặc trưng quan trọng nhất, phản n h mặt đ i lượng ngẫu nhiên

Ì- Kỳ vọng toán

a- Định nghĩa: Giả sử X đại lượng ngẫu nhiên rời rạc có thổ

nhận giá ưị: X i , X2, , xn v i c c x c suất tương ứng: Pi, P2, , p„ Kỳ vọng toán đ i lượng ngẫu nhiên X [ký h i ệ u E ( X ) ] tổng tích giá trị có đ i lương ngẫu n h i ê n v i x c suất tương ứng

E(X)=5>iPi

1 UI

N ế u X đ i lượng ngẫu nhiê n liên tục có h m mậ t đ ộ x c suất f(x) kỳ vọng tốn xác định b i ể u thức:

+00

E ( X ) = j x f ( x ) d x -00

b- Các tính chất:

* Tính chất ì: Kỳ vọng tốn số số đ ó T ứ c :

E(C) = c ( v i c số)

Chứng minh: Thật vậy, số c xem đại lượng

ngẫu nhiên đặc biệt, nhận giá trị có t h ể có c v i x c xuất tương ứng Ì Do theo định nghĩa:

E(C) = C.l =c

(32)

Kj.iáa trình lý tíuiiịẾÍ xúc Mất lùi Ịhmiụ kè tốn

* Tính chất 2: E(CX) = C.E(X) (với c số)

Chứng minh: Thật vậy, giả sử đại lượng ngẫu nhiên X có luật phân

phối xác suất là:

X Xi X2 xn

p Pl P2 Pn

Khi c x đ i lượng ngẫu nhiên r i rạc mà giá trị có là:

C x i , CX2, , C xn M ặ t khác,

nên:

(X = Xi) = (CX = CXi) ( i = l , , , n )

P(X = Xj) = P(CX = CXj) (i=l,2, ,n)

NHƯ hảng phân phối xác suất đ i lượng ngẫu nhiên c x có dạng:

c x C x i C x2 C xn

p Pl P2 Pn

Theo định nghĩa ta có: E(CX) = ịcxiPi = C5>iPi = CE(X) •

i = l i =

* Tính chất 3: Kỳ vọng toán tổng hai đ i lượng ngẫu nhiên tổng kỳ vọng toán-thành phần Tức là:

E(X+Y) = E(X) + E(Y)

Chứng minh: Giả sử X, Y đại lượng ngẫu nhiên rời rạc có luật

(33)

thường 2: (Đại lượt vạ ngẫu /thiền ứà qui luật phàn, phát xịe, tuảí

X Xi x2 xn p Pi p2 pn

Y y i y2 •• • - ym

p qi • • qm

K h i ta có luật p h â n p h ố i x c suất đ i lượng ngẫu nhiên tổng ( X + Y ) sau:

X + Y ( X i + y i ) ( X i + y2) (Xi+yj) • • (Xn+ym)

p P n P12 Pij • • pnm

Trong đ ó : Pij x c suất đ ể đ i lượng ngẫu nhiên ( X + Y ) nhận giá trị:(Xj + yj) ( i = l , n : i = ì m ì

Theo định nghĩa kỳ vọng tốn ta có:

n m n m n m

E(X + Y ) = Z E ( X i + y j ) p j = S E X i p i j + z z >j.Pij i = l j=l i = l j=l i=l J=l

n m m n = z x i Z Pij + Z y j E pij

1=1 j=l j=l 1=1 m

Ta chứng minh rằng: 2! Pij = Pi ( V i = l , n ) H

Thật vậy: B i ế n c ố ( X = Xi) x ả y tổng ( X + Y ) nhận m ộ t c c giá trị: (Xi + y O ; (Xi + y2) ; ỉ (Xi + ym) ;

Do theo cơng thức cộng x c suất ta có:

(34)

(}iúữ trình bị Uutạết xác vù ihấnq kê tốn

Tương tự ta chứng minh được: X Pij = Qj (Vị = Ì, m )

Từ ta có:

li m

E ( X + Y ) = X Xi p, + z y j qj = E(X) + E(Y) i=l j=l

Bằng phương pháp qui nạp ta chứng minh tính chất trường hợp tổng quát:

Kỳ vọng toán tổng li đại lượng ngẫu nhiên: Xi, x2, , XH bằng tổng kỳ vọng toán thành phần Tức là:

E(Xi + x2 + + x„) = E(Xi) + E(X2) + +E(Xn)

* Tính chất 4: Kỳ vọng tốn tích hai đại lượng ngẫu nhiên độc lập tích kỳ vọng tốn chúng Tức là:

E ( X Y ) = E ( X ) E ( Y ) n ế u X , Y độc lậ p

Chứng minh: Giả sử X Y hai đài lượng ngẫu nhiên rời rạc sử

dụng ký h i ệ u phần chứng minh tính chất 3, ta có: n tu

E ( X Y ) = Z Xi y j Pij i=i j=i

Vì X , Y độc lập nên: Pij = Pi-qj (Vi=l,n ;j = l,m)

Do đó:

n m

E ( X Y ) = S XiP E y j qj = E(X).E(Y) i = l ^ j=l

(35)

ẽhư&tiạ 2ĩ ^Đạì lượng, itạẫii nhiên qui luật phần phố! góc luốt Kỳ vọng tốn tích H đại lượng ngẫu nhiên độc lập vối

tích kỳ vọng tốn chúng Tức là: n ế u X i , X2, , x „ độc

lập, thì:

E ( X j X2 x „ ) = E ( X i ) E ( X2) E ( Xn) * Chú ý: Ì - Hai đại lượng ngẫu nhiên gọi độc lập với

n ế u qui luật phâ n phố i xá c suất đ i lượng ngẫu nhiê n n y k h ô n g phụ thuộc gi v o việc đ i lượng ngẫu nhiên nhận giá trị

2- Tổng hai d i lươn? ngẫu nhiên X Y đ i lượng ngẫu nhiên ( X + Y ) mà iii.i UỊ co thể có tổng m ỗ i giá trị có X m ỗ i giá trị có t h ể có Y N ế u X , Y độc lập v i xác suất tương ứng tích x c suất thành phần N ế u X, Y phụ thuộc xác suất tương ứng tích xác suất thành phần v i x c suất có đ i ề u k i ệ n thành phần

c- Bản chất ý nghĩa kỳ vọng toán

Đ ể thấy chất kỳ vọne toán, ta xét thí dụ sau đ ậ y :

Thí dụ ì: M ộ t lớp có 50 sinh viên, kỳ thi m n tốn có k ế t

cho bảng sau:

Đ i ể m

S ố s/v 15 10

N ế u g ọ i X đ i ể m thi m ô n toá n mộ t sinh v i ệ n chọn nsẫ u nhiên từ lớp X đ i lượng ngẫu nhiên có qui luật p h â n phối x c suất sau:

X

p 0,06 0,14 0,3 0,2 0,1 0,12 0,08

(36)

íịuiữ trình Lị thuyết ạẹtịe tuất MÌ ÚLốnạ kè tữáti

E(X) = 3x0,06+ 4x0,14 + 5x0,3 + 6x0,2 +7x0,1+ 8x0,12 + 9x0,08 Ta v i ế t :

3x + 7x4 + 15x5 + 10x6 + 5x7 + 6x8 + 4x9 E ( X ) =

50

= 5,82

D ễ thấy rằng, E(X) đ i ế m thi trung bình m n tốn sinh viên lớp

Thí dụ 2: Nghiên cứu thu nhập công nhân ngành dệt, giả sử

có sơ l i ệ u cho bảng sau:'

Thu nhập (tr.đ/năm) 10 l i 12 14

Số C N ( Ơ người) 50 70 150 120 55 30 25 Gói Y thu nhập cơng nhân n g n h dệt, từ số l i ệ u bảng s ú bảng phân phối x c suất Y n h sau:

1 Y 10 l i 12 14

1 p 0,1 0,14 0,3 0,24 0,11 0,06 0,05 Vạy ta có:

• =7x0,1+8x0,14+9x0,3+10x0,24+11x0,1 l + 12x 0,06+14x0,05 •50 + 8x70 + 9x150 + 10x120 + 11x55 + 12x30 + 14x25

500 = 9,55

Như vậy, thí dụ này, E(Y) = 9,55 t r i ệ u đ / n ă m thu : ' ũ p trung bình mộ t côn g n h â n n g n h d ệ t

V ày kỳ vọng toán đ i lượng ngẫu n h i ê n giá trị trung hình đ i lượng ngẫu nhiên đ ó Chẳng hạn, N ế u X chiều c a

í l o i (cùpg độ tuổi) E(X) chiều cao trung bình

(37)

Qítitưttạ 2: Dai tường, nạẫu /thiên tìà giũ luật phân phối xòe xuất

Long năm 2001 E(Y) suất lúa ưung bình vùng n ă m

Trong thực t ế người ta thường l ấ y mẫu gồm n quan sát đ ể nghiên cứu v ề tổng thể K h i kỳ vọng toán đ i lượng ngẫu nhiên xấp xỉ v i trung bình số học giá trị quan sát đ i lượng ngẫu nhiên (trung bình mẫu) Kỳ vọng tốn phản ánh giá trị trung tâm phân phối x c suất, có nhiều giá trị đ i lượng ngẫu nhiên nhận giá trị gần v i kỳ vọng toán Chẳng hạn, thí dụ nêu trên, ta có E(Y) = 9,55 có nghĩa có nhiều cơng nhân n g n h dệt có mức thu nhập xấp xỉ mức 9,55 triệu đ/năm Cụ thể có 150 ngàn cơng nhân có mức thu nhập triệu đ/năm 120 ngàn cơng nhân có mức thu nhập 10 triệu đ/năm

2- Phương sai

Trong thực t ế , nhiều n ế u xác định kỳ vọng toán đ i lương ngẫu nhiên chưa đủ Đ ể xác định đ i lượng ngẫu nhiên ta c ò n phải x c định mức độ phân lán giá trị đ i lượng ngẫu n h i ê n xung quanh giá trị trung bình Chẳng hạn, n g h i ê n cứu đ i lượng n g l u nhiên suất lúa vùng n o đ ó , n ă n g suất lúa trung bình (kỳ vọng tốn) phản ánh mặt đ i lượng ngẫu nhiên Mức độ chênh lệch v ề n ă n g suất (so v i n ă n g suất trang bình) ruộng khác v ấ n đ ề c ầ n quan t â m nghiên cứu B i n ế u mức độ chênh lệch n y nhỏ chứng tỏ giống lúa có suất ổ n định T ta có khái n i ệ m v ề phương sai

a- Định nghĩa: Phương sai đại lượng ngẫu nhiên X, ký hiệu V a r ( X ) [hoặc D ( X ) ] , định nghĩa công thức: Var(X) = E{[X-E(X)]2}

Chú ý: Phương sai định nghĩa công thức Nhưhg

(38)

Qiáo trình bị tluiụết xác ấl thống, kè tõúti

Var(X)=£[x, -E(X)]2Pi

UI • Nếu X đại lượng ngẫu nhiên liên tục thì:

+00

V a r ( X ) = j [ x - E ( X ) ]2f ( x ) d x —00

Trong thực tế người ta thường tính phương sai bV Long thức: Var(X) = - LE(X)]2

Thật vậy: Theo định nghĩa phương sai, ta có: Var(X) = Ế(IX- E(X)]2} = E{X2 - 2XE(X) + [EỌQ]2}

= E(X2) - 2E(X).E(X) r LUX)]2 = EfX2) - E(X)]2

Thí dụ: Cho đại lượng ngẫu nhiên X có Ì li phàn phối xác suất

sau:

X

p 0,1 0,5 0,4

Tìm phương sai X ?

Giải: Theo định nghĩa kỳ vọng toán ta có:

E(X) = lx 0,1 + 3x 0,5 + 4x 0,4 = 3,2 E(X2) = 12X 0,1 + 32x 0,5 + 42x 0,4 = li Vậy: VaitX)= li-(3,2)2 = 0,76

b- Cát: tính chất phương sai:

* Tính chất ì: Phương sai số Tức là:

(39)

ểhươttụ 2: Dai lương Itạẫa nhiên oà qui luật phân phối xịe iitãt * Tính chất 2: V a r ( C X ) = c2 V a r ( X ) (với c s ố ) Dựa vào định nghĩa phương sai ban toe tự chứng minh hai tính chất

* Tính chất 3: N ế u X , Y hai d i lượng ngẫu nhiên độc lập thì: Var(X + Y) = Var(X) + Var(Y)

Chứng minh: Theo cơng thức tính phương sai ta có:

Var(X +Y) = E [ ( X + Y )2] - [E(X+Y)]2

= E ( X2 + X Y + Y2) - [E(X) + E(Y)]2 = E ( X2) + 2E(XY) + E ( Y2) - [E(X)]2 - [E(Y)]2 - E ( X ) E ( Y ) Vì X, Y độc lập nên:

E ( X Y ) = E(X).E(Y) V ậ y :

Var(X + Y ) = E ( X2) - [E(X)]2 + E ( Y2) - [E(Y)]2 Hay:

Var(X +Y) = Var(X) + Var(Y)

Trường hợp tổng quát, Xi, x2, , Xn n đại lượng ngẫu nhiên độc lập thì:

Var(Xi + x2 + + xn) = Var(Xị) + Var(X2) + + Var(Xn)

Bằng phương pháp qui nạp bạn đọc chứng minh kết luận T tính chất ta chứng minh hệ sau: * Hệ ì: Var(X - Y) = Var(X) + Var(Y) Nếu X, Y độc lập

Chứng minh: Thật vậy, theo tính chất phương sai ta có:

(40)

(ịiáữ trình bị ưuujjếl xóa im ưiốtiạ kè tơáti

= Var(X) + ( - l )2V a r ( Y ) = Var(X) + Var(Y) * Hệ 2: Var(C + X) = Var(X) (với c số)

c- Bản chất ý nghĩa phương sai:

Ta thấy, kỳ vọng toán đ i lượng ngẫu nhiên giá trị trung bình đ i lượng ngẫu nhiên (trong sản xuất cơng nghiệp, kỳ vọng toán thường giá trị qui định Chẳng hạn : đường kính qui định, trọng lượng qui định, )• C ị n thực t ế sản xuất sản phẩm có đường kính, trọng lượng, sai l*ệch so với qui định Độ sai lệch đặc ưưng đ i lượng ngẫu nhiên: [ X - E(X)] Mà phương sai định nghĩa công thức:

, Var(X) = E { [ X - E ( X ) ]2} Như vậy, thực chất phương sai là:" kỳ vọng tốn bình

pììUitng sai lệch" hay nói cách k h c " Phương sai sai lệch bình phương trung bình", phản n h mức độ p h â n tán

giá trị đ i lượng ngẫu nhiên xung quanh giá trị trung bình Đại lượng có nhiều giá trị sai lệch lớn so v i giá ừị trung bình phương vù lớn; Đ i lượng n o có nhiều giá trị sai lệch so với giá trị trung bình phương sai nhỏ

Trong sản xuất công nghiệp, phương sai thường biểu thị độ

xác sản xuất Trong chăn ni, phương sai b i ể u thị mức độ đồng đ ề u đàn gia súc Trong trồng trọt, phương sai b i ể u thị mức độ ổn định suất trồng

3- Độ lệch chuẩn

Ngồi phương sai ra, người ta cịn sử dụng tham số khác để đặc trưng cho mức độ phân tán đ i lượng ngẫu nhiên độ lệch chuẩn

(41)

(Hiứơỉiq 2: Dại lưựttạ Iiạẫu ttỉtiẻti oà rụii luật phân phết, xòe, luốt

Ơ ( X ) = V V a r ( X )

Ta tha) đơn vị đo phương sai bình phương đơn vị

đo đ i lượng ngẫu nhiên Vì cần phải đánh giá mức độ phân tán giá trị đ i lượng ngẫu nhiên theo đơn vị đo n ó , người ta thường dùng độ lệch tiêu chuẩn, độ lệch tiêu chuẩn có đơn vị đo v i đ i lượng ngẫu nhiên nghiên cứu

4- Giá trị tin

a- Định nghĩa: Giá trị tin đại lượng ngẫu nhiên rời rạc

X [ký hiệu Mod(X)] giá trị X ứng với xác suất lớn bản" phân phối x c suất

N ế u X đ i lượng n^ảu nhiê n liên tục có h m mậ t độ xá c suất f ( x ) Mođ(X) giá trị X ma l ; Tó h m m i độ đạt giá tri cức đai

h- Thí dụ: Đ i lượng ngầu nhiên X có qui luật p h â n phối xác suất

nhu U u

X l i 12 14

p 0,1 0,14 0,3 , 0,24 0,11 0,06 0,05 Ta thấy P(X = 9) = 0,3 lớn Vì Mod(X) = y

T định nghĩa Mod(X) ta thấy Mod(X) giá trị có khả n ă n g xảy nhiều giá trị mà đ i lượng ngẫu nhiên X có thê nhận Chẳng hạn, X chiều cao sinh viên m ộ t trường, M o d ( X ) chiều cao mà nhiều sinh viên đạt nhất-N ế u Y n ă n g suất côn g nhâ n nhà m y M o d ( Y ) n ă n g suất mà số công nhân đạt mức n ă n e suất n y nhà m y nhiều n h ấ t

* Chú ý: Mod(X) nhận nhiêu ÚI lác

(42)

LjJảữ trinh lý thuyết xác oà ttiếng kê toán

Y

p 0,1 0,15 0,3 0.3 0.08 0,05 0,02 Ta thấy xá c suất lớn bảng trê n 0,3 ứng vớ i hai giá trị Y = Ý = V ậ y Mod(Y) = M o d ( X ) =

5- M ộ t s ố t h a m s ố đ ặ c t r n g k h c

5.1 Mô men

Định nghĩa ỉ: Mô men gốc cấp k (ký hiệu Gtịc) định nghĩa

như sau:

ak= E [ ( X )k] I

Định nghĩa 2: Mo men nung tâm cấp k (ký hiệu I^k) định

nghĩa nh sau:

^ = E | x - E ( X ) ] k } Như vậy, kỳ vọng tốn mơ men gốc cấp một: E(X) =

(X|-phương sai mơ men trung tâm cấp hai: Var(X) = f i2 -Giữa mô men gốc mơ men trung tâm có mối liên hệ sau:

= Var(X) = E(X2) - [E(X)f = a2 - (a,)2 H3 = a3- 3ctia2 +2(ct|)3

H4 = a4 - 4a,a3 + 6(a,)2a2 - 3(ct|)4 5.2 Hệ số bất đối xứng

Ta gọi: s3 = -^i

ơ

là h ệ số bất đ ố i xứng đ i lượng ngẫu nhiên X (trong độ lệch chuẩn)

(43)

ẽluứfug 2: rĐại lưựtiạ Ịiạẫa nhiên nà qui luật phân phổi xóa xuất

X é t biểu thức cùa }j-3 ta có:

ịi3 = E|X - E(X)f } = +j[x - E(X)]3 f (x)dx

Bằng phép tịnh liến trục Oy đến dường thằng X = E(X) ta thấy:

(i) N ế u đỏ thị h m mật độ f(x) đ ố i xứng qua đường thẳng X = E(X) ịi3 = (hình v ẽ )

E(X)

(li) N ế u 1^3 > đồ thị hà m mát độ f(x ) khơn g đói xứng qua đường thẳng X = E(X), phàn phối X lệch vé phía phải (hình v ẽ )

E(X)

(iii) ) N ế u H3 < đồ thị hà m mật độ f(x ) không đ ố i xứng qua đường thẳng X = E(X), phân phối X lệch phía b ê n trái (hình v ẽ )

(44)

Ếịiáữ trình, lý thuyết xúc thống, kê tốn

1 M

ơ

5.3 Hệ số nhọn

Ta gọi:

là hệ số nhọn đại lượng ngẫu nhiên X

Nếu N4 mót đại lượng ngẫu nhiên lớn đồ thị cửa hàm !• "•! tua đ i lượng ngẫu nhiên nhọn (hình v ẽ )

À

5.4 trung vị

Trung vị đại lượng ngẫu nhiên X [ký hiệu Međ(X)] gia tri

chia phân phối đ i lượng ngẫu nhiên thành hai phần Nếu X đại lượng ngẫu nhiên rời rạc giá trị Xi giá trị

trung vị nếu:

F (X i) < , < F ( xi + 1) Nếu X đại lượng ngẫu nhiên liên tục trung vị giá trị Me

thỏa m ã n điều k i ệ n :

Me

(45)

@fu/&tiạ 3: Mệt lố ạttì luật phán phổi xóa luốt lítéhtạ dụng

Chương

M Ộ T S Ố Q U I L U Ậ T P H Â N P H Ố I X Á C S U Ấ T T H Ô N G D Ụ N G

I- Qui luật nhị thức

Ì - B i t o n t ổ n g q u t d ẫ n đ ế n q u i l u ậ t n lị t h ứ c

Giả sử tiến h n h n p h é p thử độc lập, gọi A biến c ố n o m ta cần quan tâm Trong m ỗ i p h é p thử xảy hai trường hợp: Hoặc b i ế n c ố A xảy ra, A không x ả y X c suất đ ể cho A xảy m ỗ i p h é p thử đ ề u p G ọ i X số l ầ n b i ế n c ố A x ả y ương n p h é p thử, X đ i lượng ngẫu nhiên r i rạc nhận giá trị: 0, Ì, n, v i x c suất tương ứng tính theo cơng thức Bernoulli:

Px = P(X = x)=C>V'X (3.1)

(Vx = 0, l , , , n ) 2- Định nghĩa: Đại lượng ngẫu nhiên rời rạc X nhận

giá trị: 0, Ì, , n, v i xác suất tương ưng tính theo cơng thức (3.1) g ọ i p h â n phối theo qui luật nhị thức v i tham số n p

Đ i lượng ngẫu nhiên X p h â n phối theo qui luật nhị thức ký hiệu là: X ~ B(n, p)

N ế u X ~ B(n, p) ta cần tính P(X = x) P(X < x) có th ể dùng h m BINOMDIST Excel

(46)

P(X < X) =BIN0MDIST(x,n,p,1)

(Phần đóng khung câu lệnh, sau gõ xong câu lệnh nhấn phím Enter, k ế t xuất hiện)

Thí dụ: X ~ B(50; 0,3) Tính P(X = 16) P(12 < X < 18)

P(X = 16) =BINOMDIST(16,50,0.3,0) = 0,1147 P(12 < X < 18) = P(X < 18) - P(X < li) =

=BINOMDIST(18,50,0.3,1)-BINOMDIST(11,50,0.3,1) = 0,7204 Trong thực tế, nhiều ta cần tính xác suất để đại lượng ngẫu

nhiên X phân phối theo qui luật nhị thức nhận giá trị khoảng (x, x+h) (với h nguyên dương h < n - x) K h i ta ấp dụng công thức sau đây:

P(x < X < x+h) = Px + Px+l + + Px+h (3.2)

Trong đó: Px, Px+1, , Px+h tính theo cơng thức (3.1)

Thí dụ: M ộ t phân xưởng có m y hoạt động độc lập x c suất để

trong ngày m ỗ i m y bị hỏng đ ề u 0,1 T i m x c suất đ ể : (a) Trong ngày có m y hỏng

(b) Trong ngày có khơng q m y hỏng

Giải: Nếu coi việc quan sát hoạt động máy ngày

một p h é p thử ta có p h é p thử độc lập Trong m ỗ i p h é p thử có hai trường hợp xảy ra: m y hỏng m y k h ô n g hỏng Xác suất máy bị hỏng đ ề u 0,1 G ọ i X số m y hỏng ngày X ~ B ( ; 0,1)

(a) Xác suất để có máy hỏng ngày P(X = 2) Theo cơng thức (3.1) ta có:

(47)

(ỉllượt uy 3:Jiù}t íố ÍỊJIÌ luật phán phối xác mối thơng, di í nạ

(b) X c suất đ ể ngày có khơng q m y hỏng P ( X < ) Ta thấy:

P(X < 2) = P(0 < X < 2) Á p dụng công thức (3.2) ta có:

P(0<X<2) = P(X = 0) + P(X= 1) + P(X = 2) = P„+P| + p2 Theo cơng thức (3.1) ta có:

P(X = 0) = p0 = c° (0,1)° (0,9)5 = 0,59049 P(X = 1) = p, = c; (0,1)' (0,9)4 = 0,32805

V ậ y :

P(X < 2) = 0,59049 + 0,32805 + 0,0729 = 0,99144 3- Các tham số đặc trưng:

a- Kỳ vọng toán: Nếu X ~ B(n , p) thì:

E ( X ) = np

Chứng minh: Thật vậy, Gọi X số lần xuất biến cố A

p h é p thử thứ i (i = Ì, 2, , n) Xi đ i lượng ngẫu nhiên độc lập đ ề u có qui luật phân phối xác suất sau:

Xi

p q p

Theo định nghĩa kỳ vọng tốn, ta có: E(Xj) = 0.q+ l.p = p (Vi =1,2, , ạ)

(48)

Xịiáa hình tý thuyết XĨM, vá thống, kê toán b- Phương sai: N ế u X ~ B(n , p) thì:

Var(X) = npq

Chứng minh: Thật vậy, Từ luật phân phối xác suất X ta

tính được:

E ( X ; ) = 02.q + l2 p = p Theo cơng thức tính phương sai, ta có:

Var(Xi) = E(X,2)- [E(X,)f = p -p2 = p(l - p) = pq

Var (X) = Var(Xi + x2 + - + xn) = npq c- Giá trị tin nhất:

Ngoài cách tìm Mod(X) từ bảng phân phối xác suất X Người ta chứng minh rằng: N ế u X ~ B(n , p) ta p dụng cơng thức sau để tìm Mod(X):

np - q Mod(X) < np + p (3.3)

Chứng minh: Gọi Xo Mod(X) Theo định nghĩa mod(X) ta

có:

P(X = X0) > P ( X = X0-|) (3.4)

P(X = Xo) > P(X = x0 +i ) (3.5)

Ấp dụng cơng thức Bernoulli ta có:

P(X=X„) = Cn x opxy -x o ; P ( X = XX 0_ , ) = Cx o -l px o - iq - x w Từ (3.4) ta suy ra:

CX0p.X0qn-.X0

(49)

("hường 3: Mệt qui luật phân phối xịe, tuất thơng íitutg

o^^>-l «(n-x1+l)p>x0q *0.q

ox0(p + q)<(n + l)p =>x0<np + p (3.6)

Tương tự, từ (3.5) ta chứng minh được:

Xo > np - q (3.7) Kết hợp (3.6) (3.7) ta được:

np - q < Xo < np + p

ả- Thí dụ: Một máy sản xuất 200 sản phẩm ngày

X c suất đ ể máy sản xuất p h ế phẩm 0,05 T i m số p h ế phẩm trung bình số p h ế phẩm tin m y n g y

Giải: Gọi X số phế phẩm máy ngày

X~B(200, 0,05) S ố p h ế phẩm trung bình máy ngày E(X) Theo cơng thức tính kỳ vọng toán đ i lượng ngẫu nhiên p h â n ' p h ố i theo qui luật nhị thức ta có:

E(X) = np = 200x 0,05 = 10

Số p h ế phẩm tin máy ngày Mod(X)

Ta có:

• np - q = 200 X 0,05 - 0,95 = 9,05 np + p = 200 X 0,05 + 0,05 = 10,05 Vậy theo công thức (3.3) ta có:

9,05<Mod(X)< 10,05

(50)

ỊẬiáo trình tý thuyết xác Hiếng, kè toán

l i - Q u i l u ậ t P o i s s o n

Ì- Bài tốn tổng qt dẫn đến qui luật Poisson

Giả sử t i ế n hành n phép thử độc lập, m ỗ i p h é p thử xảy hai trường hợp: b i ế n c ố A xảy ra, A không xảy Xác suất đ ể cho b i ế n cố A x ả y m ỗ i phép thử p, xác suất đ ể A không xảy đ ề u q (q = Ì - p) G ọ i X số l ầ n biến cố A xảy n p h é p thử X phàn phối theo qui luật nhị thức Trường hợp n lớn, p nhỏ (p < 0,1) tích np = Ằ khơng đ ổ i ta có cơng thức xấp xỉ sau đây:

pk = P(X = k ) = Cn k p kqn-k* ^ e 'x kỉ

Trong e số n ê p e :

(

e = L i m + -Ì

Chứng minh:

Thây vậy: Do np = X => p = n

e « 2,71828

q = l - p = l - X n n!

k ! ( n - k ) !

Y _ V

\ n-k

n ( n - l ) ( n - k + 1) xk ( _ v n-k

Vì:

V n A

L i m - ì Hy

í

k - k ỉ n J k !

-X

n

1 - Ị \ n-k

(51)

ũíúAtạ 3: Jfíởt íố qui luật phân phối xóa mai tháng, dụnạ

Nên dễ thấy rằng:

L i m Pk = — e_ x

Như vậy, với n lớn, p nhỏ, tích np = X khơng đ ổ i , xác suất pk = P(X = k) cơng thức Bernoulli thay t h ế công thức Poisson sau đây:

Pk=P(X = k)= ụ~ex (k = 0, 1,2, ) (3.8)

k !

2- Định nghĩa: Đại lượng ngẫu nhiên rời rạc X nhận

giá trị: 0, Ì, với c c xác suất tương ứng tính theo cơng thức (3.8) gọi phân phối theo qui luật Poisson với tham số X X có phân phối Poisson v i tham số X ký hiệu X ~ ÍP(X) Nếu X có phân phối Poisson với tham số X, xác suất để X nhận

giá trị khoảng [le, k+h] k vì* h số ngun dương tùy ý, tính theo cơng thức :

P(k < X < k+h) = pk + Pk+1 + + pk+h (3.9)

Trong xác suất pk, pk+|, , pk+h tính theo (3.8) * Chú ý: Nếu X ~ <P{X), để tính P(X = k) P(X < k) ta

dùng h m POISSON Excel P(X = k) =POISSON(k,X,0)

P(X <k) =POISSON(k,Ầ,1)

Thí dụ 1: Cho X ~ £p(l,5), tính P(X = 5) P(X < 3)

Ta có:

P(X = 5) =POISSON(5,1.5,0) = 0.01412

(52)

lịiáa trinh lý thuyết xái' lùi ttiếng, kê toán

P(X < 3) =POISSON(3,1.5,1) = 0,934358

Thídụ2: Một máy dệt có 500 ống sợi Xác suất ống sợi bị đứt

trong khoảng thời gian Ì m y l m việc 0,004 T i m x c suất để có khơng q ống sợi bị đứt ?

Giải: Nếu coi việc quan sát ống sợi xem có bị đứt hay khơng

trong khoảng thời gian một p h é p thử Theo giả thiết, máy dệt có 500 ống sợi nên ta có 500 phép thử độc lập X c suất m ỗ i p h é p thử biến cố A (là biến cố ống sợi bị đứt) x ả y với xác suất p = 0,004

N ế u g ọ i X số ống sợi bị đứt khoảng thời gian Ì gi máy X ~ B(50ồ; 0,004) Vì n = 500 l n , p = 0,004 nhỏ tích np = 500x0,004 = không đ ổ i n ê n ta có t h ể coi X ~ £ p ( )

Xác suất để có khơng q ống sợi bị đứt khoảng thời gian Ì là: P(0 < X < 2) = Po + Pi + p2

p0 = P(X = 0) = ^-e-2 p, = P(X = 1) = ^-e-2 22

P2 = P(X = ) = — e"2 2! P(0 < X < 2) = (Ì + + 2) e ~2 = 5(2,7183)-2 = 0,6767

* Chú ý: Nếu tính xác suất hàm POISSON : P(X < 2) =POISSON(2,2,1) = 0,Ổ76676

Ta tính xác suất mà tốn yêu cầu hàm BINOMDIST

(53)

&utưttạ 3: Jlậl tà' qui luật phân phối xóa luốt tkâitạ Ị lung

CÓ thể chứng minh ng: N ế u X ~ <PọC) thì: • ' E(X) = Var(X) = X (3.10)

X- Ì < Mod(X)<Ầ (3.11)

Chứng minh: Theo định nghĩa kỳ vọng toán đại lượng ngẫu

nhiên r i rạc, ta có :

00 ao 00 i k ao ì k-1 E ( X ) = ỵk.pk = Ỷ k pk = Ỳ k ^ e -x = A ỷ - ^ — - e -x

to Ù t í ( k - l ) !

Đặtk' = k- l.Ta có:

f ọp -\ k' eo ì k 00

k'=0K k=9 Ki k=0 Vậy:

E ( X ) = X

Ta có: E(X2)= jỉ>2Pk = ỹ[k(k-l) + k]ik

k=0 k=0

= ẳk(k-l)£e-+f>.Pk

k=2 K I k=0

V ì : £ k P u = E ( X ) = \ k=0

, k co

co ì k co "S k

Đặt k' = k -2 ('*) viết sau: co ì k' co ì k

(54)

ựiííơ trình tý thuyết XĨA ơà tltếitạ kê tơán

Vậy ta có: E(X2) = X1 + X

Var ( X ) = E ( X2) - [ E ( X ) ]2 = X2 + X - Ả2 = X Thí dụ: Xác suất chai rượu bị bể vận chuyển 0,001 Giả

sử v ậ n chuyển 4000 chai T i m số chai rượu bị b ể trung bình số chai bị b ể tin v ậ n cỉyiyển ?

Giải: Gọi X số chai rượu bị bể vận chuyển 4000 chai X đại

lương n- ' l i nhiên X ~ <P(X) v i X = n.p = 4000 X 0,001 = Số chai rượu bị bể trung bình vận chuyển E(X)

E(X) = x =

Tức có trung bình chai rượu bị bể vận chuyển 4000 chai

Số chai rượu bị b ể tin v ậ n chuyển 4000 chai Mod(X) Theo cơng thức (3.11) ta có:

3 < Mod(X) < V ậ y :

M o d ( X ) = h o ặ c M o d ( X ) = Tức số chai rượu bị bể tin (có khả xảy nhiều

nhất) chai chai

MI - Qui luật siêu bội

Ì- Bài tốn tổng qt dẫn đến qui luật siêu bội

T tập hợp g m N phần tử (trong có M phần tử có tính chất A n o đó) l ấ y ngẫu nhiên khơng hồn lại n phần tử G ọ i X số phần tử có tính chất A có ương n phần tử l ấ y ra, X đ i lượng ngẫu nhiên r i rạc có t h ể nhận c c giá trị: 0, Ì, 2, n với.các x c suất tương ứng:

(55)

Qttương 3: JILệt íà í/lù luật phân phối xác UI'''í tíiâuạ dung

Px = P(X = x ) = M _ N M (3.12)

N

(x = 0, 1,2 n) 2- Định nghĩa: Đại lượng ngẫu nhiên rời rạc X nhận

trong c c giá trị: 0, Ì, 2, n v i xác suất tương ứng tính theo công thức (3.12) g ọ i p h â n phối theo qui luật siêu b ộ i v i c c tham Số: N , -M; n

Đại lượng ngẫu nhiên X phân phối theo qui luật siêu bội ký h i ệ u l : X ~ H ( N , M , n)

* Chú ý: Trường hợp n > M (hoặc n > N - M) Khi X phân phối

theo qui luật siêu b ộ i có số giá trị số giá trị 0, Ì, , , n đ i lượng ngẫu n h i ê n X khơng nhận

Thí dụ: Một hộp có 10 sản phẩm (trong có sản phẩm loại A)

L ấ y ngẫu nhiên (không h o n l i ) từ hộp sản phẩm G ọ i X số sản phẩm loại A có sản phẩm lấy ra, X có p h â n p h ố i siêu b ộ i v i c c giá trị X nhận 0, Ì, 2, cịn giá trị X k h n g thể nhận Vì trường hợp n y : n = > M = Nếu X ~ H (N, M, n), để tính P(X = x) ta dùng hàm

HYPGEOMDIST Excel P(X = x) =HYPGEOMDIST(x,n,M,N)

Thí dụ: Cho X ~ H (20, 14, 8), tính P(X = 5)

Ta có:

P(X = 5) =HYPGEOMDIST(5,8,14,20) = 0,317853 3- Các tham số đặc trứhg

(56)

íậiáa trình /tị'tJuajết xịe Mất túi ittốitạ kê toái!

E ( X ) = np (3.13) M

( v i p = — ) N

N - n

V a r ( X ) = n p q - ^ — ị (3.14) (với q = 1-p)

Trong thực tế, qui luật siêu bội dùng để tính xác suất có X

phần tử mang dấu hiệu A n o lấy ngẫu nhiên n phần tử theo phương thức khơng hồn lại từ tập hợp g m N phần tử Chẳng hạn, đ ể k i ể m tra chất lượng lô sản phẩm, n»ười ta thường

V từ lơ n sản phẩm theo phương thức khơng hồn l i ù xác suâ.t đ ể có X p h ế phẩm (hoặc phẩm)

Ta chứng minh Klng: n bé so với N ta có công thức xấp xỉ sau đây:

11

^ P - « C : P Y - S (3.15)

Chứng minh:

Xét v ế trái (3.15) ta có: ( < M! _ M(M - 1)(M -2) (M-x + 1)

M x ! ( M - x ) ! x!

Cn-X ( N - M ) !

N M ( n - x ) ! ( N - M - n + x ) ! = (N-M)(N-M- 1) (N - M -n + X +1)

( n - x ) !

Cn N! _N(N-1) (N-n + 1)

(57)

@hưưiiỢ 3: Jllật lố qui luật phân phối jráe thơng íiụitụ

Thay biểu thức v o v ế trái (3.15) gắp'xếp l i ta được:

V T = B

Trong đó: VT ký hiệu vế trái (3.15); B biểu thức đây:

M ( M - 1) (M - X + 1)(N - M ) ( N - M - 1) (N - M - n + x + 1) N ( N - l ) ( N - ) ( N - n + 1)

Để ý rằng, tử số mẫu số biểu thức có n thừa số Chia tử số mẫu sộ b i ể u thức cho Nn ta được:

Q R

Trong đó: Q =

R = M

N

M Ì V N N

B =

M x -

N N (Q có X thừa số)

M N

M Ì V, N N

M n - x -

N N

[R có (n - x) thừa số]

s = l - — \

N l N V

Đặt: M

N = p ;

N

< M

Ì N = Ì - p = q

Khi N lớn, n nhỏ so v i N : Q*px; R*qn_x; s^l

Từ ta suy điều cần phải chứng minh

(58)

lị ủi ọ trình Lị thuyết xóa Mất tíiốtiọ kê tơáii

lấy n phần tử từ tập hợp g m N phần tử theo phương thức khơng hồn l i n nhỏ so v i N G ọ i X số phần tử có tính chất A n o có n phần tử lấy ta xem X ~ B(n, p) V i p tỉ l ệ phần tử có tính chất A tập hợp

Thí dụ: ĩảộl lơ hàng gồm 1000 sản phẩm, có 800 sản phẩm

loại A 200 sản phẩm loại B L ấ y ngẫu nhiên (không h o n l i ) từ lơ h n g 10 sản phẩm đ ể k i ể m tra T ì m x c suất đ ể có sản phẩm loại A 10 sản phẩm lấy k i ể m tra ?

Giải:' Gọi X số sản phẩm loại A có lo sản phẩm lấy kiểm

tra Vì lấy khơng hồn l i n ê n X ~ H(1000, 800, 10) Nhưng lấy (10) từ tập hợp có số phần tử lớn (1000) n ê n ta coi X ~ B(n, p), v i n = 10 p = - 0,8

1000 Xác suất cần tìm P(X > 8)

Ta có:

P(X = ) = c ? „ ( , )8( , )2 = 0,30199 P(X = 9) = c?0(0,8)9 (0,2) = 0,268435

P(X = 10) = (0,8)'°= 0,107374 V ậ y :

P(X > 8) = P(X = 8) + P(X = 9) + P(X = 10) = 0,6778 * Chú ý: Ngồi cách tính trên, ta dùng hàm HYPGEOMDIST

đ ể tính sau:

P(X = 8) =HYPGEOMDIST(8,10,800,1000) = 0,30351

P(X = 9) =HYPGEOMDIST(9,10,800,1000) = 0,268431 P(X = 10) =HYPGEOMDIST(10,10,800,1000) = 0,106164

(59)

@hưư4iạ 3: Một lố qjù luật phán phối xán luốt thảng, dunạ

Ta thấy kết hai cách tính xấp xỉ

I V - Q u i l u ậ t p h â n p h ố i c h u ẩ n

Ì- Định nghĩa: Đại lượng ngẫu nhiên liên tục X nhận giá trị

khoảng (-oo,+oo) g ọ i p h â n phối theo qui luật chuẩn n ế u h m mật độ xác suất có dạng:

f(x)=-U*pí <*-*>• Ì

2 a5

N ế u t i ế n h n h khả o sát h m nà y ta thấy: f(x ) > ( V x) Khi x-> ± 00 f(x) - > H m số đạt cực đ i t i đ i ể m X = n và:

f 0 = Ì ơ-v/ĩrĩ H m số có đ i ể m uốn:

M i ụ, —

OyỊĨŨe M'2 | i + ;

Ì V V ĩ ĩ e

(60)

(ị mo trìu li lạ ỊiuuỊct xáe oà tỉiơnụ Ui' toán

2- C c t h a m s ố đ ặ c t r n g

a- Kỳ vọng toán: N ế u đ i lượng ngẫu nhiên X có p h â n phối chuẩn

với h m mật độ t h ì : E(X) = | i

Chứng minh: Theo định nghĩa kỳ vọng toán đại lượng.ngẫu nhiên liên tục, La t ỏ:

4-00* J +00 ị , )^ ì E ( X ) = f x f ( x ) d x = — ^ = f x e x p ] - ( x~ [da

X — LI

Đặt: t = — => X = ỊJ + t ; dx = d t

Đ ể \ đ ổ i sang biên l cận lấy tích p h â n k h ô n g thay đ ổ i V ậ y ta có:

ì +c? í t 2

E(X) = —1= hụ + ot)exp\ - -— \ơdt Ì t

+ < D í Ì **" í t21 = ~p= Jexp ị ~ \ t + -2= ịttxpị - — [át

Theo giải tích ta có:

j e x p | - ị - Ịdt s= V ã n (tích p h â n Poisson) -00 l J

+0° ít2] ít2!

j t e x p Ị - y | d t = (vì h m t e x p ị - — Ị h m số l ẻ )

Do đó:

(61)

&tN&aợ 3: Mệt iấ q luật nhàn phết xảe suất tháng tlụnạ c- Phương sai: Nếu X đại lượng ngẫu nhiên phân phối theo qui

luật chuẩn với h m mật t h ì : Var(X) = ơ2

Chứng minh: Theo định nghĩa phương sai đại lưcim Bgẫu nhiên

liên lục ta c ó :

+00

V a r ( X ) = j [ x F ( X ) ]2f ( x ) d x —co

Vì X có phân phối chuẩn nên: E(X) = ụ Do đó:

Var(X) = —J= J(x - ịi)1 expị - (x~*?)2 tox

lo1

Đặt: Khi đó:

t = X = | i + crt; d x = d t

ì ế z ị +00

V a r ( X ) = - = ( " V e x p i - — d t = - ^ l í t2 expị - — }dt

Á p dung p W n g p h p tích p h â n phần:

Đặt: u = t; dv = texpj- —Ịdt => V = -expj- —Ị Ta có:

Var(X) = - t e x p ,

+ 00 — 00

(62)

(ịìáơ trình lý ậh nụ ất xáe suối ơà ưiốitạ kề toán

texp-Ị - ý + 00 t

• 00

= (vì h m - t e x p < Ị - — \ h m số lẻ)

Ị e x p I - — Ị-dt = V27Ĩ (tích phá n Poissan)

V ậ y ta có:

V a r ( X ) = ơ2

Đại lượng ngẫu nhiên X phân phối theo qui luật chuẩn với kỳ vọng toán ụ phương sai ơ2 ký h i ệ u X ~ N( |J., ơ2) Phân phối chuẩn nhà tốn học Đức Karl Gauss tìm nên cịn gọi phân phối Gauss

3- Phân phối chuẩn tắc

Giả sử đ i lượng ngẫu nhiên X p h â n phối theo qui luật chuẩn với i ơ2

x-ịi

2

kỳ vọng toán ụ phương sai X é t đ i lượng ngầu nhiên z =

Đ i lượng ngẫu nhiên z nhận giá trị khoảng (-00, +00) gọi phân phối theo qui luật chuẩn tắc h m m ậ t độ x c suất z có dạng:

f ( * ) = v f e e x p K

(63)

(ễhươtiạ 3: Mật úi-' qui luật phân phối xóa mút IhòiUỊ dụng

f(z) ' \

>

- l o i z

Các giá ưị hàm f(z) tính sẵn thành bảng (xem phụ lục 2) Có thể chứng minh rằng: Nếu đại lượng ngẫu nhiên z có' p h â n phối chuẩn tắc thì:

E(Z) = Var(Z) = X - n " Ị _ Ì

= - [ E ( X ) - n ]

T h ậ t v ậ y , Ta có : E(Z) = E

DoX ~N(n,ơ2), nê

Var(Z) = Var > ì = [ v a r ( X ) - V a r ( ^ ) ] A )

Vì Var(X) = ơ2 ; Var(n) = => Var(Z) = Ị

Đại lượng ngẫu nhiên z phân phối theo qui luật chuẩn tắc kỷ h i ệ u z ~ N ( , )

* Ta ký hiệu za giá trị của đại lượng ngẫu nhiên z phân phối theo qui luật chuẩn tắc thoa m ã n đ i ề u k i ệ n :

(64)

L}iiío- trùilt Lị tỉ tuyết xác cúi thống, toán

N ế u minh hoa đồ thị ta thấy d i ệ n tích m i ề n hình học giới hạn đường cong h m mật độ trục h o n h Ì đơn vị diện

+00

tích (Vì | f ( z ) d z = 1) za đ i ể m nằm trục hồnh —co

cho diên tích m i ề n gạch c h é o hình v ẽ cc f(z) Ạ

Cho trước oe ta tính giá trị za Bảng tính sẩn giá trị zu cho phụ lục

4- Các cơng thức tính xác suất: N ế u X ~ N í n , CT ) t h ì

P(X! < X < x2) = Ọ

x2- ụ \ í

- ọ

v ; (3.16)

Trong đó:

.2 \

dz ( H m Laplace)

Chứng minh: Thật Vậy, ta có:

P ( x < X < X ) = p í ^ l H < ^ Z £ < Í L Z i i >

(65)

QiuỂđHq 3: Mát Ìấ tịitỉ luật phản phổi xịe, li lất thịng đung = p(z, <z<z2)

Trong

X1 ~ n x 2- ụ

•ỉ

x - ị i

Theo tính chất h m m ậ t độ (tính chất 2) ta có: z, z, z,

P(z, < z < z2) = jf(z)dz = jf (z)dz - |f(z)dz

= 91 - ọ í * , - n ì - ọ í * , - n ì

V J

* N ế u X ~ N ( n , ơ2) t h ì :

P ( | x - d < ) = 2<p

C/ií?Kg mi/í/i Ta có: p ( j x - | i | < e ) = P ( - e < X - ụ < e)

e X - | i £

(3.17)

— < — < V, ơ J

= P - * < Z < *

^ ơ

( é ) í ( «

r o =2cp co = — -<p - - = <p — +<p - =2cp —

* CAÚ J : N ế u X ~ N ( n , ơ2) , đ ể tính P(X < x) ta d ù n g h m NORMDIST Excel

P(X < X) =NORMDIST(x,n,ơ,1)

(66)

íịiá& trình Lị thuụết xác tívấtig kê- tốn

* N ế u z ~ N(0, 1), đ ể tính P(Z < z) ta có t h ể d ù n g h m NORMSDIST Excel

P(Z < z) =NORMSDIST(z) P(a < z < p) =NORMSDIST(P)-NORMSDIST(a)

* Nếu X ~ Nín, ơ2), để tính P( |x - jx| <e ) ta dùng hàm NORMSDIST

P ( | x - \x\ < £ ) = * N O R M S D I S T ( E / < J ) -

Thí dụ 1: Trọng lượng loại sản phẩm đại lượng ngẫu

nhiên p h â n phối theo qui luật chuẩn v i trọng lượng trung bình ụ = kg độ lệch tiêu chuẩn = 0,1 Tính tỷ l ệ sản phẩm có trọng lượng từ 4,9 kg đ ế n 5,2 kg ?

Giải: Gọi X trọng lượng loại sản phẩm theo giả thiết

X ~ N ( n , ơ2) v i ịi = ( k g ) ; = 0,1

Tỷ lệ sản phẩm có trọng lượng từ 4,9 đến 5,2 kg là: P(4,9< x<5,2)

Áp dụng cơng thức (3.18) ta được:

P(4.9 < X < 5,2) = <p(^p) " Ọ(^OF) = 9(2) "

• = 0,4772 - ( - 0,3413) = 0,8185 Tức tỷ lệ sản phẩm có trọng lượng từ 4,9 đến 5,2 kg 82% * Chứ ý: Nếu dùng hàm NORMDIST để tính xác suất thì:

(67)

@hu&tiạ 3: Jtlội Lố ạuỉ luật phân, phối xịe, xi thịng, dung Thí 2? Đường kính l o i trục m y nhà m y sản

suất i lượng ngẫu n h i ê n p h â n p h ố i theo qui luật chuẩn v i đường kính trung binh (theo thiết k ế ) n = 20 mm độ l ệ c h tiêu chuẩn = 0,04 Trục m y coi đạt tiêu chuẩn kỹ thuật đường kính sai lệch so v i đường kính thiết k ế khơng 0,072 mm T i m tỷ l ệ trục m y đạt tiêu chuẩn kỹ thuật nhà m y ?

Giải: Gọi X đường kính trục máy Theo giả thiết X ~ N(|i, ơ2)

với ụ = 20 (ram) ; = 0,04 T ỷ l ệ trục m y đ t tiêu chuẩn kỹ thuật của nhà m y : P(| X < 0,072)

Ấp dụng cơng thức (3.19) ta có:

f 0,072 ì

p ( | x - n | < , ) = ( p = 2(p(l,8) * 93% l 0,04

* Chú ý: Nếu dùng hàm NORMSDIST thì:

p(jx-ụị < 0,072) =2*NORMSDIST(0.072/0.04)-1 =0,928139

5- Phân phối xác suất tổng đại lượng ngẫu nhiên độc l ậ p t u â n t h e o c ù n g m ộ t q u i l u ậ t

Giả sử Xi X2 hai đại lượng ngẫu nhiên độc lập Xi tuân theo

qui luật chuẩn v i kỳ vọng toán ịlị phương sai <j] x2 cũng t u â n theo qui luậ t chuẩn v i kỳ vọn g toá n ịi2 phương sai

l i ^ vị K h i đ i lượng ngẫu nhiên X = ( X i + X2) tuân theo qui l u ậ t chuẩn vớ i kỳ vọn g toá n Hj + n2 v à phương sai G2ị + \

Tính chất mở rộng cho số đại lượng

(68)

tị, , trinh tụ iỉưtụết xác títấnq kè tốn

Ngoài Xi, x2, xn n đại lượng ngẫu nhiên độc lập

man theo qui luật p h â n p h ố i x c suất n o (khơng thiết qui luật chuẩn) v i cá c kỳ vọn g toá n E ( X i ) , E ( X2) , E(X„) phương sai var(Xi), v a r ( X2) , ' , var(Xn) b i ế t đại lượng ngẫu nhiên:

X = ẳ x i i = l p h â n phố i xấ p xỉ chuẩn với :

E(X) = ị E(X,) Var(X) = Ỳ Var(x.)

i=l i=l n lớn (n > 30)

Tính chất thường g ọ i định lý giới hạn trung tâm l.iapunốp

6- Sự hội tụ qui luật nhị thức qui luật Poisson qui l u ậ t c h u ẩ n

Khi sử dụng qui luật nhị thức, n ế u n lớn việc tính tốn theo cơng thức Bernoulli gặp khó khăn lúc n ế u p nhỏ đ ế n mức np « npq dùng qui luật Poisson thay t h ế cho qui luật nhị thức Nhưng nêu p l i khơng nhỏ (p > 0,1) k h n g t h ể d ù n g qui luật Poisson đ ể thay t h ế Khi ta có t h ể d ù n g qui luật chuẩn để thay t h ế cho qui luật nhị thức

Khi n lởn p không q gần khơng q gần Ì đại lượng

ngẫu nhiên X ~ B(n; p) coi như-phân p h ố i xấp xỉ chuẩn với kỳ vọng toán ị! = np phương sai = npq T đ ó ta có c ô n g thức sau:

Px=C;PY"X~-pLrf(z) (3.18)

(69)

Qhươitq 3: Mệt lổ qui luật, phàn phổi xác luốt thơng, dụng

Trong đó: z = p = = i ; f(z) = - p = e x p ( - z2/ )

Vnp q V271

Công thức (3.18) được.gọi công thức địa phương Laplace Các

giá trị h m f(z) tính sẩn thành bảng với giá tri z > (xem phụ lục 2)

Chú ý f(z) h m chẩn, n ê n f ( - z ) = f(z) Vì v ậ y v i z < ta d ù n g bảng nà y đ ể suy giá trị f ( z )

Khi n lớn, xác suất p không gần khơng q gần Ì ta d ù n g công thức xấ p xỉ sau d ể tính tốn:

P(x < X < x+h) « (p(x2) - <p(xi) (3 ỉ 9) Trong :

1 x

ọ ( x ) = -J= f e x p ( - z2 / ) d z ( H m Laplace) V T I ị

x - n p x + h - n p

X l = T = ^ X = r =

Công thức (3 19) gọi công thức tích phân Laplace

C c giá trị h m ọ(x) tính sẩn thành bảng (xem phụ lục 3) Cần lưu ý bảng tính giá trị của-hàm (p(x) v i giá trị X > 0, n ế u cần tính giá trị (p(x) v i X < ta ý cp(x) h m l ẻ , đó: cp(-x) = - (p(x)

Trong bảng tính (p(x) v i X < 5, v i X > h m (p(x) tăng chậm nhận giá trị gần 0,5 Do ta l ấ y (p(x) = 0,5 (Vx > 5)

Thí dụ: Xác suất để máy sản xuất sản phẩm loại A 0,8

(70)

trình tiị tlutỵết xịe lút thống kè tốn

(b) Có từ 304 đến 328 sán phẩm loại A

Giai: Gọi X sơ sản phẩm loại A có 400 sản phẩm máy

sản xuất X - B(4()0, 0,8) Vì n = 400 lớn, p = 0.8 không gan không lĩần Ì, nên ta p dụng cơng thức (3,18)

(a) P ( X = 3 ) « 336 - 400 X 0,8

V400x 0,8x0,2 [ V 0 x 0,8x0,2 J • > Tra bảng la 1(2) = 0,054

V ậ y :

P(X = 3 ) « 0,00675

(b) Ta cần tính P(304 < X < V>J0 Áp dụng cơng thức (3.19) ta có: P(304 < X < 328) * cp (x2) - cp(Xl)

Trong đó:

x = - 0 x 0,8 _ ỉ - 0 x 0,8 V400 X 0,8 X 0,2 ; X | ~ ^ x , x , ~ ~ Tra bảng hà ni cp(x) la được: (p(l) = 0,3413 ; (p(-2) = - 4772

V ậ y :

P(304 < X < 328) * 0,3413 - ( - 0,4772) = 0,8185 * Chú ý: Với thí dự trên, ta dùng Excekđể tính thì:

P(X = 336) =BINOMDIST(336,400,0.8,0) = 0,006573 P(3()4 < X < 328) = P(X < 328) - P(X 5303) =

=BINOMDIST(328,400.0.8,1)-BINOMDIST(303,400I0.8,1)= 0,83505

Ta thấy k ế t hai cách tính có c h ê n h lệch nhau, tất nhiên tính Excel cho kết quà xác la nên tính Exccỉ

(71)

&tưưttạ 3: Mặt Lố quì ỉutịt phân phối xác Mất thòng, {tung * Đối với qui luật Poisson q trình hội tụ qui luật

chuẩn d i ễ n X >«20 Vì lú-li V phân phối theo qui luật Poisson X > 20 có t h ể xem X phan pi, ' i * \ í " xỉ chuẩn v i | i = À = X

7- ứng dụng qui luật chuẩn

Qui luật chuẩn qui luật p h â n phối xác suất p dụng rộng rãi thực tế Trong nhiều lĩnh vực khoa học đ i sống ta thường gặp đ i lượng ngẫu nhiên có p h â n phối chuẩn Chẳng hạn cơng nghiệp, kích th#ớc chi tiết m y sản xuất ra; trọng lượng sản phẩm loại đ i lượng ngẫu nhiên phân phối theo q u i ^ u ậ t chuẩn n ế u trình sản xuất d i ễ n bình thường Trong nông nghiệp, n ă n g suất l o i trồng ruộng k h c nhau; trọng lượng gia súc c ù n g độ tuổi điều k i ệ n c h ă m sóc đ i lượng ngẫu nhiên p h â n phối theo qui luật chuẩn

Lý phổ biến nhà tốn học người Nga

Li-a-pu-nốp g i ả i thích định lý "giới hạn u n g tâm "mà m ộ t h ệ là: N ế u đ i lượng ngẫu nhiên X tổng s ố lớn c c đ i lượng ngẫu nhiên độc lập giá trị m ỗ i đ i lượng đóng vai ị nhỏ tổng X có phân phối x ấ p xỉ v i qui luật chuẩn

V- Qui luật X2 "Chi-bình phướng"

Giả sử Xi (i = Ì, 2, n) đại lượng ngẫu nhiên độc lập,

cùng p h â n p h ố i theo qui luật chuẩn tắc X é t đ i lượng ngẫu nhiên:

x2=ịx

i=l

(72)

íịiáữ trình Lị ílmụết xác thống- kẻ tốn

với n bậc tự

Qui luật "chi bình phương" với n bậc tự ký hiệu là: 3£2(n) Hàm mật độ xác suất đại lượng ngẫu nhiên ỵ2 có dạng:

f n ( x ) =

_ y e / zx2 • 2 7 lr

0

, 2y

Trong đó: r ( x ) = J t *_ Ie_ td t

x >

( hàm gama)

Qui luật "chi bình phương " Helmert Pearson x é t đến

Đồ thị hàm mật độ fn(x): fn(x)

, n = 30

N ế u c c đ i lượng ngẫu nhiên_Xị liên hệ vơi mộ t h ệ thức tuyến tính, chẳng hạn EXị = n X s ố bạc tự n -

Nếu đại lượng ngẫu nhiên X2 phân phối theo qui bát x2(n) [ký hiêu l x ~ x2( n ) ] t h ì :

(73)

VltưưiHi 3: JLệt tố qui luật pìiâii phối xịe xuất tháng dung

E(x2) = n ; Var(x2) = 2n

* Ta ký hiệu %2a giá tri cun đui lượng ngẫu nhiên ỵ2 phân phối

theo qui luật "chi bình phương" với n bậc tự do, thỏa mãn điều kiện: P(x2>x2a) = a

fn(x)

X a giá trị nằm tục hồnh cho diện tích m i ề n gạch

c h é o a

C c giá trị X2CC tính sẩn thành bảng (xem phụ lục 5)

Ta cũng£Ó thể dùng hàm CH11NV để tìm %2a biết a

X* =CHIINV(a,k)

* Cho X2 ~ x2( k ) , đ ể tìm P(x2 > X) ta có the dùng h m CHIDIST P(x2 > X) =CHIDIST(x,k)

Thí dụ: Cho x2 ~ *2(28), tìm P(x2 > 25) xỉ.os 2* _ , »

P(x > 25) =CHIDIST(25,28) = 0,627835 XỒ.05 =CHIINV(0.05,28) = 41,33715

(74)

ựiá» trùih lợ thuyết teáe ơã thống, kè toán

K h i số bậc tự tăng lên, qui luật "chi bình phương u xấp xỉ vôi qui luật chuẩn

Vỉ- Qui luật student

N ế u z đai lưcn e n«ẫ u nhiê n p h â n phố i theo qui lun t huân lác va > la d i lượng ngẫu nhiên độc l ậ p v i z , p h " ,Mwi meo qui luật "chi bình p h n g " với n bậc tự

Khi đai lưrtn? nenn n^iên: T =

V v / n

sẽ ph ẩ n phố i theo qui luật Student v i n bậc t ự

Hàm ^ìật độ xác suất đại lượng ngẫu nhiên T phân phối theo qui luật Student v i n bậc tự có dạng:

n + f n ( t ) =

1 +

n+l

a V ĩ

n

< ! > =

(-00 < t < +00) eo

r ( x ) = | tI _ 1e_ ,d t ( h m gama)

Qui luậ t Studeni v i n bậc tự ký h i ệ u : T(n ) Trong đ ó :

Đ thị h m f„(t):

(75)

&utờtiQ 3: Mật UẾ quỉ luật phân phối xác Mất thăng, dung

MO í

0 t Qui luật Stuđent w s Gosset sử dụng lần đ ầ u tiên

bài toán thống k ê quan trọng viết tác giả lấy bút danh "Student"

* Nếu đại lượng ngẫu nhiên T phân phơi theo qui luật Studenl với n bậc tự [ký hiệu T ~ T(n)] thì:

E(T) = Var(T) = ——

n-2 * Ta ký hiệu ta giá trị đại lượng ngẫu nhiên T ~ T(n) thu.Ì

m ã n đ i ề u k i ệ n : P(| T I > ta) = oe tí

C c giá trị ta tính sẩn thành b ả n g (xem phụ lục 6) * Ta dùng hàm TINV Excel để tìm ta

ta=T!NV(a,k)

v i k bậc tự

* Nếu T ~ T(k), để tìm P(|T| > t) (với t > 0) UI có tì j dùng hàm TDIS'1 P(|T| > t) =TDIST(t,k,2)

(76)

Lị ì lia trình Lị tlutụểt xúc oà thống, kê (ốn

Thí dụ: Cho T ~ T(24), tìm P(|T| > Ì,3); P(T > ì ,5) to.05

Ta có: P(|T| > ì ,5) =TDIST(1.5,24,2) = 0,146656 P(T > 1,5) =TDIST(1.5,24,1) = 0,073328

to.05 =TINV(0.05,24) = 2,063898 * 2,064

Khi số bậc tự tăng lên, qui luật Student tiến nhanh phần

phối chuẩn tắc Vì vậy, n > 30 ta dùng p h â n phối chuẩn tắc thay cho phân phối Student

VII- Qui luật Fisher- Snedecor (phân phôi F) I

Đ i lượng ngẫu nhiên F gọi p h â n phôi theo qui luật Pisher - Snedecor với ni n2 bậc tự hà UI mật độ x c suất có dạng:

* , , , ( * ) =

Trong :

0

(JHZĨÌ

[ ( n2+ n , x )

í n , i n ^

c =

Ị • "2

2 n , » v n

r

\ t J Kí )

x <

x>0

Đ thị h m fni n 2( x ) :

(77)

@hườitg 3: Mội XÁ qui tuột phàn phổi xác Mất tít ải tạ dung

N ế u đ i lượng ngẫu nhiê n F phâ n phố i theo quy luật Fisher -Snedecor với bậc tự ni ĨỈ2 [ký hiệu F ~ F ( m , 112)] thì:

_ n 2nị (AI, +«, - 2)

E ( F ) = — — ; V a r ( F ) = ã

ô2 w) (w2 - ) (»2 ~ )

Ta ký hiệu Fa (nu n2) giá trị đại lượng ngẫu nhiên F phân

phối theo quy luật Fisher - Snedecor v i bậc tự n i , n? thoa m ã n điều k i ệ n :

P f F > F0( n i , n2) ] = a

(78)

(ịiáa trìitk bị tkuụết xịe Mất thống, kê tốn

fni,n2 (x)

0 Fa X

Đ ể tìm Fa ( n i , n2) ta tra bảng p h â n phối F dùng hàm FINV Excel

Fa( n , , n2) = F I N V ( a , n1, n2) * Nếu F~ F(ni, n2), ta cần tính P(F > x) dùng hàm FDIST P(F>x) =FDIST(x,n1, n2)

Thí dụ: Cho F ~ F (2, 14), ta cần tính P(F > 1,6) tìm F0j05 Tá có:

P(F> 1,6) =FDIST(1.6,2, 14) = 0,236699

(79)

@ỉutWtiạ 4/Đại lường, ngẫu nhiên, hai chiều

C h n g ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU

I- Khái niệm đại lượng ngẫu nhiên hai chiều

ở c c chương trước, xét đ i lượng ngẫu n h i ê n m giá trị nhận biểu thị số C c đ i

lượng ngẫu nhiên g ọ i đ i lượng ngẫu nhiên c h i ề u N g o i đ i lượng ngẫu nhiê n mộ t chiều, thực t ế ta

c ò n gặp đ i lượng ngẫu nhiê n mà c c giá trị có th ể nhận b i ể u thị 2, 3, , n số

Những đại lượng ngẫu nhiên mà giá trị nhận v é c tơ chiều g ọ i đại lượng ngẫu nhiên chiều

TổntỊ quát: Những đại lượng ngẫu nhiên mà giá trị

nhận véc tơ n chiều gọi đại lượng ngẫu nhiên n

chiều

Ta ký hiệu đại lượng ngẫu nhiên chiều (X, Y) Trong X

Y g ọ i thành phần đ i lượng ngẫu nhiên chiều, c ả hai đ i lượng ngẫu nhiên X Y xét cách đồng thời tạo n ê n đ i lượng ngẫu nhiên chiều Tương tự n đ i lượng ngẫu nhiên x é t m ộ t cách đồng thời tạo n ê n đ i lượng ngẫu nhiên n chiều

Thí dụ 1: Khi nghiên cứu thể lực học sinh tiểu học có

(80)

Qiáữ trình bị tltttiịết sếe t/iốuạ kè ĩơán

Thí dụ 2: Khi khảo sát siêu thị, ta quan tâm đ ế n doanh số

bán ( X i ) lượng vốn ( X2) ta có đ i lượng ngẫu nhiên hai chiều ( X | , ' X2) Còn ta quan tâm chi phí quảng c o (X3) ta có đ i lượng ngẫu nhiên chiều ( X i , X2, X3)

T r o n " thực t ế người ta p h â n chia đ i lượng ngẫu nhiên nhiều chiều m n h hai loại : rời rạc liên tục

Các đ i lượng ngẫu nhiên nhiều chiều g ọ i rời rạc thành phần cá c đ i lư ợn g n g ẫ u n h i ê n rờ i rạc

C c đ i lượng ngẫu nhiên nhiều chiều g ọ i liên tục thành phần đ i lượng ngẫu nhiê n liên tục

li- Qui luật phân phối xác suất đại lượng n g ẫ u n h i ê n h a i c h i ể u

Đ ố i với đại lượng ngẫu nhiên hai chiều người ta dùng bảng phân phôi xác suất hàm phân phối xác suât h m mật độ xác suất" đ ể thiết lập qui luật phân phối xác suất chúng

Ì- Báng phân phối xác suất đại lượng ngẫu nhiên c h i ề u

Bảng phân phối xác suất đ i lương ngẫu nhiên chiều rời rạc có dạng:

V Y yi yi ym

Xi P ( x , , y , ì P ( x , , y2) P(X|, ym) P(X2.yi) P(X2, y2) P(x2 ym)

Xn PUn.yO PUn yì) P(x„, ym)

(81)

&Ơ41Q 4:<ĩ)ại lừợnạ Itạẫii nhiên hai eiiièít

Xi (Ì = Ì, , , n) giá trị nhận thành phần X

Ỵj (j = Ì, , , m) giá trị nhận thành phần Y

p(Xj, yj) (i = Ì, 2, n; j = Ì, 2, , ro) xác suất đ ể đ i lượng ngẫu nhiên chiều (X, Y ) nhận giá trị (Xi, yj)

li m

z £ p ( x i , y j ) = i i=i j=i

Ký hiệu:

+ P(Xi, yj) = P[(X t xi)(Y =yj)] = Pi> = P(X =Xj).P(Y=yj / x = Xi) = P(Y =yj).P(X =xựY= y j ) m ni

+ P ( X = X Ị ) = 2p(xi » y j ) = Z P i j =P ì j=i j=i

+ P(Y = yj)= ỈP(xi,yj) = ẳPij =Qj

i=l i=l • N ế u pi J = pi qj ( V i , j ) X, Y độc lậ p

>•• ỊỊ m

Ta ln có: Z P i = Z t ỉ j = =

i=i j=i

V i ký hiệu trên, ta biểư diễn bảng phân phối xác suất đ i lượng ngẫu nhiên chiều dạng sau:

V Y X ^ \

y i y2

• y

n, Px

Xi Pn P12 Plm Pl

X2 P21 P22 P2ni P2

*

Xn Pnl Pn2 Pnni Pn

(82)

Cịiúo trình tụ tlutụẨt xòe mối ơă Miếng, kè tơáii

B i ế t phân phối xá c suất đ i lượng ngẫu nhiê n ĩ chiều ta có th ể tìm bảng phâ n phối xá c suất t c thàn h phần

Bảng phân phối xác suất thành phần X có dạng:

X Xi X2 x„

Px p P2 Pn

T bảng phân phôi xác suất X v i cơn£ thức biết chương ĩ ta tính E(X), Var(X), Mod(X),

Tương tự ta có bảng phân phối xác suất thành phần Y có dạng:

Y , y i Y2 y

m

Py q i Q2 Qui

T bảng phân phối xác suất Y ta tính E(Y), Var(Y), M o d ( Y ) ,

Thí dụ: Cho biết bảng phân phối xác suất đại lượng n?ẫu nhiên ĩ

chiều ( X , Y ) , X doanh thu Y chi phí quảng cá o cơng ty tư nhân kinh doa#h mặt hàng sau (đơn vị tính X Y đ ề u i ệ u đồng/tháng):

Y \ v

100 * 150 200 P Y

0 0,1 0,05 0,05» 0 *

1 0,05 0,2 0,15 0,4

2 0,1 0,3 OA

Px 0,15 0,35 0,5

(83)

ẽkươíiự 4/Đại lượng ngẫu nhiên hai chiều

% x 100

150 200

0,15 0,35 0,5

Từ ta d ễ d n g tính được:

E(X) = lOOx 0,15 + 150x 0,35 + 200x 0,5 = 167,5

Tức doanh thu trung bình cơng ty tư nhân 167,5 triệu đ/tháng

E ( X2) = 1002x 0,15 + 1502x 0,35 + 2002x 0,5 = 29375 Var(X) = E(X2) ~[E(X)]2 = 29375 - (167,5)2 = 1318,75

=> Ơ(X) = Vi 318,75 = 36,3146

Tức mức chênh lệch trung bình doanh thu cơng ty vào khoảng 36,3 triệu đồng/tháng

+ Bảng phân phối xác suất Y:

Y 0 ,

PY 0,2 0,4 0,4

E(Y) = Ox 0,2 + l x 0,4 + 2x 0,4 = 1,2

Tức chi phí quảng c o trung bình cơng ty tư nhân 1,2 triệu đ/tháng

Var(Y) = E ( Y2) - [ E ( Y ) ]2 = - (1,2)2 = 0,56 => Ơ(Y)= y[Õj6 =0,74833

(84)

Qiáo trình tý thuyết xác í Ị lất tíiốnợ kè toán

a- Định nghĩa: Hàm phân phối xác suất đ i lượng ngầu nhiên

hai chiều (X, Y) [ký hiệu F(x, y)] định nghĩa sau: F(x, y) = P[(X < X)(Y < y)]

( x y e R ) Như hàm phân phối F(x, y) có miền xác định R2 miền giá trị -là [0, 1]

b- Tính chất:

T định nghĩa, ta chứng minh tính chất sau h m phân phơi:

(ì) < F(x, y) < Ì

(li) F(x y) hàm không giảm theo đối số (iii) F(x, -00) = F(-co, y) = 0; F(+oo +co) = Ì (iv) V Xi < Xi yi < y2 ta có:

P[(x < X < x2)(yi < Y < y2)] = F(x2, y2) - Ftx2 yi)

F ( X | , y2) + F ( X i , y i ) (v) F(x,+oo) = P[(X<x)(Y<oo;] = p(X<x) = Fịíx) '

F(+oo, y) = P[(X < co) (Y < y)] = P( Y < y') = F2( y ì F|(X) F;(y) tưcíng ứng hàm phân phối ru; , X "V

* Hệ quả:

Ì- X Y độc lập khi:-F(x, y) = F|(x).F7 (y)

2- V i véc rư ngẫu nhiên chiều (X, Y) rời rạc, ta có:

(85)

(Hiứưuq 4: (Đại lượng, ngẫu nhiên hai thiều

F ( M ) = ^ p [ ( X = xi) ( Y = yi) ] Xi<XyJ<y

b- p [ ( x , < X < x2) ( y , < Y < y2) ] = > [ ( X = x i ) ( Y = X i ) ] yi<yj<yi

T r ê n R b i ế n c ố [Xi < X < x2) ( y i < Y < y2) ] có thê b i ể u d i ễ n c c đ i ể m hình chữ nhật A B C D (hình v ẽ )

y2

y i

A

0 Xi *2

- >

3- H m m ậ t đ ộ x c s u ấ t c ủ a đ i l ợ n g n g ẫ u n h i ê n h a i c h i ề u

à- Định nghĩa: H m mậ t đ ộ xá c suất đ i lượng ngẫu n h i ê n hai

c h i ề u l i ê n tục (X , Y ) [ký h i ệ u f(x , y) ] định nghĩa n h sau:

f ( x , y ) = -zF(x,y)

ỡxỡy b- Tính chất:

• (i)

(ii)

f ( x , y ) > V ( x , y ) e R2 -KO+CO

(86)

(ịiáo trình tụ thuyết xịe mối tui thững, kê toát

x2yi

' ( i u ) p [ ( x , < x < x2) ( y , < Y < y ) ] = j j f ( x , y ) d x d y *| VI

X y_

y -HO (iv) F ( x y ) = J j f ( u , v ) d u d v

—eo-00

(V) F,(x) = Ỵịf(x,y)ày ; F2(y) = Ị Jf (x,y)dx

(vi) f , ( x ) = ^ ^ = f ( x , y ) d y

f!(y) = ^ = ]f(x,y)dx đó:

f i ( x ) f2( y ) tương ứng h m mật độ xác suất của: X Y (hàm mật độ x c suất biên)

Hệ quả: X, Y độc lập f(x, y) = f|(x).f2(y)

Thí dụ: Cho hàm mật độ xác suất biến ngẫu nhiên hai chiều

( X , Y ) sau:

í C(2x + y) n ế u < X < 6; < y < f(x, y ) = H

L v i cá c giá trị c X y a-Xác định tham sốc

(87)

@ỉuỉƠ4iq 4; (Đai tướng, ngẫu nhiên hai chiều Giải:

a-+C0+00

= J j f ( x , y ) d x d y = J j c ( x + y ) d x d y —co—co

= Jc 2xy + — dx= jc(l0x + 12,5)dx = 210C 2 V )0 ị

c = 1/210 210

4 Ì

P[(3 < X < 4) (Ý > 2)] = Ị ị ~ - ( x + y ) d x d y =

_3_ 20

c- H m mật độ xác suất biên f i(x) v Í2(y) '5

fL( x ) = J f ( x , y ) d y = 5 Y

í—— (2x + y ) d y = Ì Ĩ

4 x + 84

f2( y ) = J f ( x , y ) d x = «Ị Ị 210

f — ( x + y ) d x = y + 16 105

2 < x < X Ể (2,6)

y e (0,5) y Ể (0,5)

I U - C c t h a m s ố đ ặ c t r n g c ủ a đ i l ợ n g n g â u n h i ê n h a i c h i ề u

Ì - C c t h a m s ố đ ặ c t r n g c ủ a đ i l ợ n g n g ẫ u n h i ê n t h n h p h ầ n

Kỳ vọng toan phương sai đ i lượng ngẫu nhiên thành phần xác định c c cơng thức sau đây:

(88)

Lịìủơ trình íặ t/tiiựếi xịe Mất ihốtiq kè tốn

E ( X ) = £ x i p i j ; E ( Y ) = £ > j P i j UI j=l j=l i - l

n m

v a r ( X ) = Z x fP i j - [ E ( X ) ] i=i j=i

var(Y) = |;ẳy>ìj-[E(Y)f

j=i i=i

* Nếu (X, Y) liên tục thì:

-HĐ+O0 +00+00 E ( X > = f J x f ( x , y ) d x d y ; E ( Y ) = Ị J y f ( x , y ) d x d y

— CO —Ó)—CO +00 +00

v a r ( X ) = Ị j x2f ( x , y ) d x d y - [ E ( X ) ]2 —00 —00

+00 +00

v a r ( Y ) = ị j y2f ( x , y ) d x d y - [ E ( Y ) ]2 — 00 —00

2- Các tham số đặc trưng đại lượng ngẫu nhiên hai c h i ề u

ã- Hiệp phương sai:

Hiệp phương sai hai đại lượng ngẫu nhiên X Y [ký hiệu cov(X, Y ) ] định nghĩa sau;

cov(X, Y) = E{[x - E(X)Ị[V - E(Y)]} •= E(XY)-E(X)E(Y)

(89)

CHú(4t(ị 4/Đại lường, ngẫu nhiên hai eitiều

c o v ( X , Y ) = S E W l - E ( X ) E ( Y ) UI j=l

• Nếu (X, Y) đại lượng ngẫu nhiên chiều liên tục thì: +00+00

c o v ( X , Y ) = ị | x y f ( x , y ) d x d y - E ( X ) E ( Y ) -00— co

• Nếu X, Y hai đại lượng ngẫu nhiên độc lập : cov(X, Y ) = Thật vậy, Nếu X, Y độc lập E(XY) = E(X)E(Y)

K h i ta có:

cov(X,Y) = E ( X Y ) - E ( X ) E ( Y ) = • Nếu cov(X, Y) = ta nói X Y không tương quan, ngược

l i , cov(X, Y ) * ta nói X Y có tương quan, X, Y hai b i ế n ngẫu nhiên không độc lập

cov(X, X) = var(X); cov(X, Y) = cov(Y, X)

3 b- Hệ số tương quan

H ệ số tương quan [ký h i ệ u PXY] định nghĩa sau:

' c o v ( X , Y ) Pxv =

ơ x , đ ó :

ơx; ơY tương ứng độ lệch chuẩn X Y

(90)

ịịừío trình Lí thuyết xịe luốt tháng, kê íơáti

• N ế u X , Y hai đ i lượng ngẫu nhiên phụ thuộc thì: o v a r ( X ± Y ) = v a r ( X ) + v a r ( Y ) ± c o v ( X , Y ) © var(aX ± bY) = ũ2 var(X) + b2 var(Y) ± 2abcov(X,Y)

• Nếu X, Y hai đại lượng ngẫu nhiên độc lập vaựx.Y) = [E(Y)]2 var(X) + [E.(X)]Z var(Y) + var(X) var(Y) Thí dụ: Lãi suất hàng năm trái phiếu T cổ phiếu s

cơng ty có bảng phân phối x c suất sau:

-10% 10% 20% P T

6% 0 0,1 0,1 oa

8% ọ , l 0,3 0,2 0,6

10% 0,1 0,1 0 0,2

Ps 0,1 0,2 0,4 0,3

N ế u muố n đ ầ u tư t i ề n v o trái p h i ế u cổ p h i ế u n ê n đ ầ u tư theo tỷ l ệ đ ể :

(a) Lãi suất kỳ vọng thu lớn (b) ' Đ ộ r ủ i ro v ề lãi suất nhỏ

Giải: Từ bảng trên, ta tính được:

E(T) = 6x 0,2 + 8x 0,6 + lOx 0,2 = 8% var(T) = 62x 0,2 + 82x 0,6 + 102x 0,2 - 82 = 1,6

Tương l ự :

=> Ơ T = 1,2649%

(91)

ũhttedtg 4: (Đai tườiiụ Iiạẫn nhiên hai chiều

E(S) = -lOx 0,1 + lOx 0,4 + 20x 0,3 = 9% var(S) = (-10)2X 0,1 + 102x 0,4 + 202x 0,3 - 92 = 89

=> ơs = 9,43398%

cov(T, S) = 0,lx 10x (-10) + 0,lx6x 10 + 0,3x8x 10 + 0,1x6x20 + + 0,2x 8x - x = -

(a) Gọi p tỷ lệ đầu tư cho trái phiếu (0 < p < 1) gọi X lãi suất thu đầu tư cho trái phiếu cổ phiếu thì:

X = pT + (l-p)S T đ ó :

E(X) = pE(T) + (l-p)E(S) = 8p + 9(l-p) = 9- p Ta thấy E(X) đạt cực đại p = 0, tức đầu tư toàn tiền cho cổ phiếu

(b) Độ rủi ro đặc trưng phương sai độ lệch chuẩn X Ta có:

var(X) = p2 var(T) + ( Ì - p )2 var(S) + 2p( 1-p) cov(T, S)

= 106,6 p2- I94p + 89

var(X) đạt cực tiểu p = 0,9099437

c- Ma trận hiệp phương sai:

Ta 2Ọ1 ma trận sau ỉa ma trận hiệp phương Sui hai b i ế n

ngẫu nhiên X , Y:

(92)

(ịiú& trình Lị thuyết xóa mối thống, tốn

N ế u X , Y khơn g tương quan cov(X, Y ) = cov(Y, X ) = 0, k h i đổ ma trận hiệp phương sai ma trận đường c h é o

IV- Phân phối xác suất có diều kiện kỳ vọng t o n c ó đ i ể u k i ệ n

Ì- Xác suất có điều kiện

Khi cho X = Xk Y = yic c ố định, ta tính c c xác suất có điều k i ệ n theo công thức sau:

p[(X = xk)(Y = yj)]_pkj ••' P ( Y =y j / X = xk) =

P ( X = xk)

j = l , m

T ta tìm p h â n phối xác suất có đ i ề u k i ệ n X (hoặc Y )

2- Phân phối xác suất có điều kiện Ta ký hiệu:

P(X= Xj/Ỳ= yk) = P(X= Xi/ yk); P(Y= y/x= xứ = P(Y= y/ xk) Phân phối xác suất có điều kiện X (điều kiện Y = yk)

( X = Xi/Y= yk) Xi x2 Xn

P(X = Xi/yk) P ( X = x , / yk) P ( X = x2/ yk) P(X= x„/yk) Kỳ vọng tốn có điều k i ệ n đ i lượng ngẫu n h i ê n r i rạc X với điều k i ệ n Y = yk [ký hiệu E ( X / yk) ] định nghĩa sau:

(93)

Qhườttq 4/Đạỉ íuẹitg ngẫu nhiên hai chiều

E ( X / yk) = £ Xi P ( X = xi/ yk)

Tương tự, ta có ky vọng tốn có điều kiện Y (điều kiện X = X|c)

E(Y/Xk) = f>.m = yịỉx1t)

Thí dạ: Cho biết bảng phân phôi xác suất đại lượng ngẫu nhiên

c h i ề u ( X , Y ) , đ ó X doanh thu Y chi ph í quảng c o c c cổng ty tư n h â n kinh doanh mặt h n g n h sau (đơn vị tính X Y đ ề u rà triệu đồng/tháng):

Ìfi0 150 200 P Y

0 0,1 0,05 0,05 0,2

1 0,05 0,2 0,15 0,4

2 0,1 0,3 0,4

Px 0,15 0,35 0,5

T bảng ta c ó : <-

P(X = 100/Y ,0) = P[(X = 100)(Y = 0)] =M =0,

P ( Y = 0) 0,2 Tính tương tự ta được:

P ( X = / Y = 0) = — = 0,25; P ( X = 0 / Y = 0) = 0,25

V ậ y p h â n p h ố i có đ i ề u k i ệ n X (điều k i ệ n Y = 0) sau:

( X = Xị/Y= 0) 100 150 200

(94)

{ịiúp trình lý tluuịỂl xác Mất thang kê toán

T bảng p h â n phối x c suất có đ i ề u k i ệ n trên, ta tính kỳ vọng toan có điều k i ệ n :

E(X/Y=0) = lOOx 0,5 + 150x 0,25 + 200x 0,25 = 137,5

Kết cho biết doanh thụ trung bình cơng ty khơng quảng c o (Y = 0) 137,5 triệu đồng/tháng

Tính tương tự ta được:

Phân phối có điều kiện X (điều kiện Y= 2) sau:

(X = Xị/Y= 2) 100 150 200

P(X = Xị/Y= 2) 0,25 0,75

E(X/Y= 2) = 150x 0,25 + 200x 0,75 = 187,5 Kết cho biết doanh thu trung bình cơng ty có chi phí quảng cáo mứcL2 triệu đ/tháng 187,5 triệu đồng/tháng • Hiệp phương sai (X, Y):

cov(X, Y) = ẸẸxiyjPij -E(X).E(Y) =

' j

= 100x Ox 0,1 + 150x Ox 0,05 + + 200* 2x 0,3 - 167,5x 1,2 = 215-201 = 14

• Hệ số^aTơng quan biến X Y:

cov(X,Y) 14

PXY = — — - = — — = 0,5153

™ ƠXƠY 36,3146x0,7483

3- Hàm mật độ có điều kiện

(95)

@hưtừtạ 4/Đổi lưọttạ HQỗỉt nhiên hai chiều

T a g ọ i : fCx / y) = í £ i Z ) f > ( y )

là h m m ậ t đ ộ có đ i ề u k i ệ n X (điều k i ệ n Y = y ) Tương tự,

f ( y / x ) - í £ > f , ( x )

là h m mật đ ộ có đ i ề u k i ệ n Y (điều k i ệ n x = x) Nếu X, Y hai đại lượng ngẫu nhiên liên tục thì:

-no

E ( Y / X = x ) = J y f ( y / x ) d y -00

+00

E ( X / Y = y ) = J x f ( x / y ) d x

4- H m h ổ i q u i

H m h i qui Y đ ố i với X kỳ vọng tốn có đ i ề u k i ệ n Y (điều k i ệ n la X = x)

f ( x ) = E ( Y / X = x )

f(x) cho biết giá trị trung bình Y thay đổi the X nhận c c giá trị k h c

Tương tự, hàm hồi qui X Y kỳ vọng tốn có điều k i ệ n X (điều k i ệ n Y = y)

f(y) = E(X/y = y)

fịy) cho biết giá trị trung bình X thay đổi Y

nhận c c giá trị k h c

(96)

íỳiáty trinh Lị thuyết xúc tuất oà tỊỊúutạ kê toán

C h n g

H À M C Á C Đ Ạ I L Ư Ợ N G N G Ẫ U N H I Ê N V À L U Ậ T S Ố L Ớ N

I- Hàm đại lượng ngẫu nhiên

Trong thực t ế , ta thường gặp trường hợp đ i lượng ngẫu nhiên h m số hay nhiều đ i lượng ngẫu nhiên k h c K h i n ế u biết qui luật phân„phối xác suất đ ố i số ta tìm qui luật phân phối xác suất c c h m số tương ứng Ì- Qui luật phân phối xác suất hàm đại lượng ngẫu

n h i ê n

N ế u v i m ỗ i giá trị có th ể GỊ đ i lượng ngẫu nhiê n X , qua h m f ( X ) , ta xác định giá trị đ i lượng ngẫu n h i ê n Y Y g ọ i h m đ i lượng ngẫu nhiên X :

Y = f(X)

a- Trường, hợp X đại lượng ngẫu nhiên rời rạc ứng với giá trị khác X ía có giá trị khác Y

Trường hợp này, ứng với giá trị nhận X ta có giá trị nhận Y , tức:

(X=xi) = [Y=f(xi) = yi] (Vi)

Suy ra:

' P(X= Xi) = P(Y= yo ( V i )

(97)

ŨhưỞ4UỊ 5: Jốàni ếe đại lượng, ngẫu nhiên luật IJỐ lởn Thí dụ ỉ: Đ i lượng ngẫu n h i ê n X có bang p h â n phối x c suất n h

sau:

X

p 0,3 0,5 0,2

2 T ì m qui luật p h â n p h ố i x c suất Y = X

Giải: Các giá trị mà Y nhận là: yi = 22 = 4; y2 = 32 = 9; y3 = 42 = 16

P(X= 2) = P(Y= 4) = 0,3; P(X= 3) = P(Y= 9) = 0,5; P(X= 4) = P(Ỷ= 16) = 0,2;

Vậy phân phối xác suất Y sau:

Y 16

p 0,3 0,5 0,2

b- Nếu tương ứng với hai (hay nhiều 2) giá trị X ta có giá trị Y

Chẳng hạn ứng với giá trị có t h ể nhận X ta có m ộ t giá trị có t h ể nhận Y, tức:

(Y=yk) = (X=xt)u(X=Xj)

Do biến cố (X= Xt) (X= Xj) xung khắc, áp dụng cơng thức cộng x c suất ta có:

P(Y=yk) = P(X= xt) + P(X=Xj)

Thí dụ 2: Đại lượng ngẫu nhiên X có bảng phân phối xác suất

sau:

(98)

éịiáữ trình bị tluiụẾt xịe, mủi tui thống, kè tốn

X - 2

p 0,1 0,4 0,5

T i m qui luật p h â n phối x c suất Y = X

Giải: Ta có:

khi X = - Y = ( - )2 = 4; x = Ì Y = Ì2 = Ì; K h i X = Y = ;

N h vậy:

( Y = ) = [ ( X = - ) U ( X = ) ] Do đó:

P ( \ = 4) = P(X= - ) + P(X= 2) = 0,6 Và: P(Y= 1) = P(X= ì) = 0,4

V ậ y qui luật p h â n phối x c suất Y sau:

Y

p 0,4 0,6

c- Trường hợp X tò đại lượng ngẫu nhiên liên tục

Giả sử đ i lượng ngẫu n h i ê n X liên tục v i h m mật độ x c suất f(x) biết Y la ham số X : Y = f ( X )

Có thể chứng minh rằng: Nếu Y = f(X) hàm khả vi, đơn

đ i ệ u tăng đơn đ i ệ u g i ả m , có h m ngược X = *F(y) hàm mật độ x c suất (p(y) đ i lượng ngẫu nhiên Y x c định b i ể u thức:

9(y) = f [vĩ ' ( y ) ] | T ' ( y ) |

2- Qui luật phân phối xác suất hàm hai đại lượng ngẫu n h i ê n

(99)

thường 5: Vỗàm cùa đại lưựnạ ngẫu nhiên oà luật iế lán

N ế u ứng v i m ỗ i cặp giá trị c ó th ể nhậ n hai đ i lượng ngẫ u nhiêri X z có giá trị nhận đ i lượng ngẫu n h i ê n Y Y g ọ i h m đ i lượng ngẫu nhiên X z

Y = q>(X, Z)

Nếu biết qui luật phân phối xác suất X z, ta có

t h ể t ì m đ ợ c q u i l u ậ t p h â n p h ố i x c suất Y = (p(X, Z) Để tìm giá trị mà Y nhận tính xác suất tương ứng

của Y n g i ta thường t i ế n h n h lập bảng, Đ ể biết c c h lập bảng n y la x é t m ộ t thí dụ sau đ â y :

Thí dạ: Có máy sản suất loại sản phẩm, tỷ lệ sản phẩm

l o i A m y thứ 0,8; m y thứ hai 0, 7; L ấ y sản p h ẩ m m y thứ sản xuất Ì sản p h ẩ m m y thứ hai sản xuất đ ể k i ể m tra T i m quy luật p h â n phối x c suất số sản p h ẩ m l o i A có sản phẩm l ấ y từ hai m y đ ể k i ể m tra ?

Giải: Gọi X số sản phẩm loại A có sản phẩm lấy từ máy

thứ đ ể k i ể m tra D ễ thấy X ~ B(3; 0,8) N ê n ta d ễ d n g tìm bảng p h â n phối x c suất X sau:

X

p 0,008 0,096 0,384 0,512

G ọ i z số sản phẩm l o i A có Ì sản p h ẩ m l ấ y từ m y t h ứ hai đ ể k i ể m tra z ~ B ( l ; 0,7) Bảng p h â n p h ố i x c suất z n h sau:

z

p 0,3 0,7

G ọ i Y số sán phẩm l o i A có n g sản phẩm l ấ y từ hai m y đ ể k i ể m a thì:

(100)

íịiáo trình, lý thuyết xịe, thống, kẻ tốn ì

tức Y h m hai đ i lượng ngẫu n h i ê n X z Để tìm qui luật phân phối xác suất Y, trước hết ta tìm giá trị mà Y có t h ể nhận M u ố n v ậ y ta lập bảng n h sau:

0

z \

0

1

Trong bảng dòng X ta ghi c c giá trị mà X nhận (trong thí dụ ta đ a n g xét, X nhận c c giá trị 0, Ì, 2, 3)

Cột z ghi cạc giá trị mà z nhận Trong thí dụ này, z'chỉ nhận hai giá trị: 1;

Các ô lại ta ghi giá trị mà Y nhận Để xác định

giá trị n y ta c ă n v o b i ể u thức h m b i ể u đ i ể n m ố i quan hệ Y v i X z , thí dụ ta đ a n g x é t b i ể u thức h m n y có dạng: Y = X + z , đồng thời c ă n v o giá trị X z cột dòng tương ứng

Chẳng hạn: Y nhận giá trị X = đồng thời z = 0;

Y = l x = đồng thời z = Ì X = Ì đồng thời z = (tương ứng v i hai ừường hợp bảng có hai ghi số 1)

Vậy giá trị mà Y nhận là: 0, Ì, 2, 3,

Ta biểu diễn việc phân tích ề Xiên dạng tổng tích b i ế n c ố nh sau:

( Y = 0) = [ ( X = 0)(Z = 0)]

( Y = 1) = [(X = 0)(Z = 1)] u [ ( X = 1)(Z = 0)] ( Y = 2) = [ ( X = 2)(Z = 0)] u [ ( X = 1)(Z = 1)]

(101)

(Phương 5: 7Càm eủa eáe đại /ưựttạ ngẫu nhiên g ã luật tố lởn

( Y = 3) = [(X = 2)(Z = 1)] u Ĩ ( X = 3)(Z = 0)] ( Y = ) = [ ( X = ) ( Z = ) ]

Á p dụn g côn g thức cộng x c suất côn g thức nhân xá c suất, ta tính c c x c suất tương ứng v i giá trị Y sau:

P(Y = 0) = P(X = 0).P(Z = 0) = 0,08 0,3 = 0,0024 • P(Y = 1) = P(X = 0).P(Z = 1) + P(X = 1).P(Z = 0)

= 0,008 0,7 + 0,096 0,3 = 0,0344 P(Y = 2) = P(X = 2).P(Z = 0) + P(X = 1).P(Z = 1)

= 0,384 0,3 + 0,096 0,7 = 0,1824 P(Y = 3) = P(X = 2).P(Z = 1) + P(X = 3).P(Z = 0)

= 0,384 0,7 + 0,512 0,3 = 0,4224

P(Y = 4) = P(X = 3).P(Z = 1) = 0,512 0,7 = 0,3584 V ậ y ta có qui luật p h â n p h ố i x c suất Y sau:

Y '-

p 0,0024 0,0344 0,1824 0,4224 0,3584

• Trường hợp X, z đại lượng ngẫu nhiên liên tục

C ó t h ể chứng (ninh rằng: h m mật độ x c suất (p(y) Y (Y = X + Z) x c định theo công thức:

y ' y

cp(y)= J f1( x ) fỉ( y - x ) d x Hoặc: Ịf, (y - z ) f2 (z)dz

f ị Ỉ2 h m mật độ xác suất X z tương ứng

[với đ i ề u k i ệ n h m n y x c định khoảng (-00, +oo) b i ể u thức]

(102)

íịiá& trịnh dị t/uiụết xác xuất MÌ thống, kê toán

3- C c t h a m s ố đ ặ c t r n g c ủ a h m c c đ i l ợ n g n g ẫ u n h i ê n Giả sử đ i lượng ngẫu nhiên r i rạc X có p h â n phối x c suất sau:

X Xi x2

p P' P2 Pn

Ta cần tìm kỳ vọng tốn phương sai đ i lượng ngẫu nhiên Y [Y = (p(X)] C c tham số đặc trưng xác định c c công thức sau:

E(Y) = E[(p(X)]=ịọ(xi)pi

Var(Y) = Var[<p(X)] = £<p2(x,)Pl -[E(Y)]2 i = l

* Nêu X đại lượng ngẫu nhiên liên tục với hàm mật độ xác suất

f(x) kỳ vọng tốn phương sai đ i lượng ngẫu nhiên Y = (p(X) xác định công thức:

•KO

E(Y) = E [ Ọ ( X ) ] = J(p(x)f(x)dx -co

+00

V a r ( Y ) = Var[(p(X)] = J(p2 ( x ) f ( x ) d x - [ E ( Y ) ]2 -00

li- Luật số lớn

Như ta thấy phần trước, dự đoán trước cách

(103)

thường 5: 7õàtii đại lường Iiạẫii nhiều oà luật tá' lân

xét đồng thời số lớn đại lượng ngẫu nhiên tính "ngẫu

n h i ê n " h i ệ n tượng qui luật tất nhiên thể h i ệ n

Đối với thực tiễn điều quan trọng phải xác định điều

k i ệ n tác động đồng thời nhiều nguyên nhàn niiẫn nhiên dẫ n đ ế n k ế t gầ n khơn g phụ thuộc o cá c y ế u tô ngẫu n h i ê n ta dự đốn tiến ưình h i ệ n tượng C c đ i ề u k i ệ n n y định lý có tên luật số lớn Định lý Chebyshev định lý tổng quát nhấí luật số lớn, c ò n định lý Bernoulli định lý đơn giằn

Để chứng minh' định lý ta sử dụng bất đẳng thức Chebyshev

Ì- Bất đẳng thức Chebyshev

C ó t h ể chứng minh rằng: N ế u X đ i lượng ngẫu nhiên có kỳ vọng tốn phương sai hữu hạn v i m ọ i số dương s bé tùy ý, ta đ ề u có:

V a r ( X ) P ( | X E ( X ) < £ ) >

-E2

B ấ t dẳng thức Chebyshev b i ể u d i ễ n dạng k h c sau:

V a r ( X ) P ( | X - E ( X ) ị > ) <

s2

(104)

íịiấ trình lự thuyết xịe Mất OĂ tkếttạ kẻ tôn

Thí dụ: Thu nhập trung bình c c hộ gia đình vùng 900

U S D / n ă m độ lệch chuẩn 120 USD H ã y x c định khoảng thu nhập xung quanh giá trị trung bình 95% hộ gia đình vùng

Giải: Gọi X thu nhập hơ gia đình vùng X đại

lượng ngẫu nhiên với qui luật p h â n phối chưa biết, E(X) = 900 ax = 120.'Do theo bất đẳng thức Chebyshev, ta có:

p(jx-E(X)|.<e)>l-^^ y

6 ì

= > P ( ị x - 0 | < e ) > l - ^ y - = 0,95 £

Từ ta tìm s = 536,656

Vậy 95% hộ gia đình vùng có thu nhập hàng năm nằm

trong khoảng (900 - 536,656; 90Ọ + 536,656) tức thu nhập hộ gia đình khoảng (363,344;• 1436,656) U S D / n ă m

2- Định lý Chebyshev

Nếu đại lượng ngẫu nhiên X[, X2 , xn độc lập đơi,

có kỳ vọng tốn hữu hạn phương sai đ ề u bị chặn b i số c [Var(Xị) < c ; V i = Ve > b é tùy ý cho trước ta ln có:

Lim P(|-ẳXi-lẳE(Xi)|<6) = l

li t i n t i

Ị n

Chứng minh: X é t đai lương ngẫu nhiên: X = - Y x

n t r Ta có:

(105)

@hưư4iạ 5: Jơàm ốn đại tường, ngẫu nhiều luật- lứt Ị

E ( X ) = E

Ị n \ Ị n

\ n t í ) n t í

Ì X2- T2

-yntỉ ) n i= l

Var( X ) = Var

Áp dụng bất đẳng thức Chebyshev cho đại lượng ngẫu nhiên X ta có:

, , V a r ( X ) , X V a r ( X i ) < £ ) > ! - - ^ ^ = - — Ì ; P ( | X - E ( X ) |

n2 e2

Theo giả thiết: Var(Xị) < c (V i = 1,«) Do đó, b i ể u thức trên, n ế u ta thay m ỗ i Var(Xi ) ( i = 1,«) c bấ t đ ẳ n g thức mạnh t h ê m

P ( | X - E ( X ) | < s ) * l - - ~ - = l - - £ r n e n.e L ấ y g i i hạn hai v ế n - » 00 ta có:

- c

L i m P ( l X - E ( X ) I < e ) > L i m ( l - -—J) = Ì n-»oo n-»« n_g

Ta ý rằng, x c suất b i ế n c ố lớn Do đ ó : L i m P | x - E ( X ) | < e ) = l

Đó điều cầaphải chứng minh

• Trường hợp riêng định lý Chebyshev

N ế u X i , X2, , xn c c đ i lượng ngẫu nhiê n độc lậ p đơi , có c ù n ể kỳ vọng tốn, [E(Xị) = a ( V i = Ị , H ) ] Ve > b é tùy ý ta-ln c ó :

(106)

L i m P n—>00

ì JQ_

ni*' < =

• Bản chất định lý Chebyshev

I •!.!•; r i u In vhcv Jã chứng tỏ ổ n định u n g bình số học số lớn đ i lượng ngẫu nhiên xung quanh trung bình số học kỳ vọng toán đ i lượng ngẫu nhiên

Như vậy, đ i lượng ngẫu nhiên độc lập nhận giá trị sai khác nhiều so với kỳ vọng tốn chúng, trung bình sù học số lớn c c đ i lượng ngẫu nhiên l i nhận giá trị gần trung bình số học kỳ vọng tốn chúng v i xác suất lớn' Đ i ề u cho p h é p dự đ o n giá trị giá trị trung bình số học đ i lượng ngẫu nhiên

Trong thực tế, định lý Chebyshev ứng dụng rộng rãi

n h i ề u lĩnh vực Chẳng hạn, trường hợp r i ê n g n ó sở cho phương p h p đo lường vật lý N h đ ề u b i ế t , đ ể xác định đ i lượng n o đ ó , người ta thường t i ế n h n h đo nhiều lần l ấ y ừung bình số học c c k ế t đo l m giá trị thực đ i lượng cần đo

Thật vậy: ta coi kết n lần đo đại lượng ngẫu

nhiên Xị, X2, , Xn C c đ i lương n y độc l ậ p đôi, có kỳ vọng tốn (kỳ vọng tốn c ác đ i lượng ngẫu nhiên n y giá trị thực đ i lượng cần đo) phương sai chúng đ ề u bị chặn độ x c thiết bị dùng đ ể đo Vì t h ế theo trường hợp riên g định lý Chebyshev trung bìn h số học k ế t đo sai lệeh so với giá trị thực đ i lượng cần đo điều xảy v i x c suất gần

Định lý Chebyshev sở cho phương pháp áp

(107)

(?ilười UI 5: JCtưn cua eáe đai Ixíđ4iạ ngẫu nhiên Lưu lơ lởn

dựa v o mẫu nhỏ ta k ế t luận toàn tập hợp đ ố i tượng cần nghiên cứu

Chẳng hạn để đánh giá suất trồng vùng

người ta k h n g cần phải điều tra tồn diện tích trồng l o i mà cần dựa v o k ế t thu hoa ch cửa mẫu mà v ẫ n đưa k ế t luận đủ x c v ề suất trồng vùng 3- Định lý Bernoulỉi

Nếu Fn tần suất xuất biến cố A n phép thử độc lập

p x c suất xuất h i ệ n b i ế n c ố m ỗ i p h é p thử v i m ọ i e dương b é tùy ý, ta ln ln có:

Lim p(| Fn - p I < E) = Ì

Chứng minh: Gọi X số lần xuất biến cô A n phép thử

độc lập X i (ỉ = ỉ,n) số l ầ n xuất b i ế n cố A p h é p thử thứ I I >0 thú > M ne X j có p h â n phối xác suất sau:

Xi

p q p

Trong dỏ

q = Ì - p , Tri thấy: X li i = l

V i=l

iu \ n

£ x i = £ E ( X , ) = n p ) i=i

E(Xi) = o.q + l.p = p => E(X) = E

Var(Xị) = E( X?) - [E(Xi)]2 = p - p2 = p(l - p) = p.q í n ^ "

=> Var(X) = Var X x = L V a r ( X ) = 'nP(l i=i

(108)

íịiáữ trình tụ thuyết xịe, tháng, kê tơón

X é t đ i lượng ngẫu nhiên Fn = — Ta thấy Fn tần suất n

xuất h i ệ n b i ế n c ố A ương n p h é p thử độc l ậ p '

E Í Fn) = E

X Ì Ì

- = - E ( X ) = - n p = p v n j n n

Var(Fn) = Var V a r ( X ) = ^ U H n n n Á p đụng bất đẳng thức Chebyshcv cho đai lưrtng ngẫu n h i ê n Fn ta có:

P ( | F n- p | < e ) > l - - £ ị n.£^ L ấ y giới hạn v ế n - > 00 ta có:

L i m P ( | Fn- p | < s ) > L i m ( Ì - ^ ) = Ì ne

M ặ t khác, xác suất k h n g thể lớn Ì, đó: Lim P(| fn - p| < e) = Ì

* Ý nghĩa:

(109)

&uứfrtạ ó: Mẫu ngẫu nhiên

P h ầ n

T H Ô N G K Ê T O Á N

Thống kê tốn mơn tốn học nghiên cứu qui luật

tượng ngẫu n h i ê n có tính chất số lớn sở thu thập xử lý c c số l i ệ u thống k ê - k ế t quan sát Như nội dung chủ y ế u thống kê toán x â y dựng phương p h p thu thập xử lý c c số1 l i ệ u thống k ê nhằm rút k ế t luận khoa học C c phương p h p thống k ê tốn cơng cụ đ ể giải nhiều vấn đề khoa học thực t i ễ n nảy sinh c c lĩnh vực khác tự nhiên kinh t ế xã h ộ i

C h n g 5: M Ẫ U N G Ẫ U N H I Ê t y

I- Tổng thể Ì- Kh4i niệm

(110)

QiáA trình bị ưuujẤ't xác uiất nả thấtig kê tốn

hàng theo dấu h i ệ u như: mức độ hài lòng khách h n g v ề sản phẩm hay dịch vụ doanh nghiệp (dấu h i ệ u định tính) nghiên cứu theo dấu hiệu định lượng nhu cầu khách hàng số lượng sản phẩm doanh nghiệp Trong trường hợp tạp hợp gồm tất k h c h h n g doanh nghiệp tổng thể Đối với tổng thể, ta sử dụng số khái niệm ký hiệu sau đây:

• N: Số phần tử tổng thể gọi kích thước tổng thề

Kích thước tổng thể phụ thuộc v o vấ n đ ề phạ m v i nghiên cứu

• X* : Dấu hiệu ta cần khảo sát, nghiên cứu (trong kinh tế thường gọi

là tiêu) Dấu hiệu nghiên cứu định tính định lượng Cần nhấn mạnh rằng, nói nghiên cứu tổng thể có nghĩa ta n g h i ê n cứu dấu hiệ u X* th ể h i ệ n trê n cá c phầ n tử tổng thể • Xi (i = 1,2, k) giá trị dấu hiệu X* đo

phần tử tổng thể Xi thông tin cần thiết đ ể ta nghiên cứu v ề dấu hiệ u x \ cá c phần tử tổng th ể đ ố i tượng mang thơng tin

• Ni (i = Ì, 2, k): Tần số Xi - số phần tử nhận giá trị Xj * Pi Ú = i, k): Tần suất X, - tỷ số tần số Xi

* , N i B / £

kích thước tống thế: pi — Ta ln ln có ^ p ' l

-2- Các phương pháp mô tả tổng thể

(111)

&ƯIUỊ ó: MÂU IUỊỖU nhiều Bảng 6.1

Giá trị X * Xi x2 xk

T ầ n số (Ni) N i N2 Nk

k

H i ể n nhiên: < N i < N ta có: ^ N ; = N i=l

Ta có.thể mơ tả tổng thể bảng phân phối tần suất Dạng tổng q u t bảng n y sau:

Bảng 6.2

Giá trị X* Xi x2 xk

T ầ n suất (Pi) Pl P2 Pk

k

Ta ln ln có: < Pi < Ì ] T p í = i=l

* Chùy: Bảng (6.1) (6.2ì,ró thổ lập dạng cột

Về hình thức, bảng phân phối tần suất tổng thể tương tự

bảng p h â n phối xác suất đ i lượng ngẫu nhiên rời rạc N ó phản n h cấu tổng thể

3- Các số đặc trưhg tổng thể

(112)

cịiáo trình Lị thuyết xác tlÚHtọ kê tữáiL Ì- Trung bình tổng thể

Trung bình tổng thể (ký hiệu ịi), xác định theo công thức:

k

H = > i P i (6.3) i = l

2- Phương sai tổng thể

Phương sai tổng thể (ký hiệu ơ2) xác định theo công thức:

k • i = l

I

3- Độ lệch chuẩn tổng thể

Độ lệch chuẩn tổng thể (ký hiệu ơ) xác định theo công thức:

ơ=Vỡr (ỂL5) 4- Tỷ lệ tổng thể

Tỷ lệ tổng thể (ký hiệu p) định nghĩa sau:

Giả sử tổng thể gồm N phần tử, có M phần tử có tính chất M

Ạ G ọ i p = — tỷ l ệ phần tử có tính chất A tổng thể (hay

gọi tắt tỷ lệ tổng thể), p xác suất lấy phần tử có tính chất A lấy ngẫu nhiên phần tử từ tổng thể

Thí dụ: Ngành cao su có 500.000 cơng nhân Để nghiên cứu mức

sống họ, người tá khảo'sát tiêu X* :" Thu nhập thực tế

(113)

ót lứtfi tạ ó: Mẫu ngẫu nhiên Bảng 6.6

Thu nhập số công nhân T ầ n suất

X* (ngàn/tháng) (Ni) (Pi)

500 50.000 0,10

600 70.000 0,14

700 150.000 0,30

800 120.000 0,24

900 55.000 0,11

1000 30.000 0,06

1100 25.000 0,05

Tống 500.000 1,00

T bảng 6.6 ta tính được:

• Thu nhập trung bình cơng nhân ngành cao su (trung bình tổng thể) là;

l i = 500x 0,1 + 600x 0,14 + 700x 0,3 + 800x 0,24 +

+900x 0,11 + lOOOx 0,06 + Ì lOOx 0,05 = 750 ngàn đồng • Phương sai thu nhập (phương sai tổng thể):

ơ2= (500 - 750)2.0,1 + (600 -750)2.0,14 + (700 - )2 0,3 + + (800 - 750)2.0,24 + (900 - 750)2.0,11 + (K)00 - 750)2 0,06 + (1100-750)2.0,05 =23100

• Độ lệch chuẩn thu nhập (độ lệch chuẩn tổng thể): = V23100 = 151,987

• T ỷ l ệ cơng nhân có thu nhập cao n g n h cao su (tỷ l ệ tổng thể): N ế u ta coi g n h â n có mức thu nhập từ 1000 (ngà n đồng) -trở l ê n người có thu nhập cao tỷ l ệ cơng n h â n có thu

(114)

4ỳiá& bình bị tluiụết xác tuất tliếnạ kê tơÓMi

30000 + 25000 _

n = •— = 0,11 hay 1 %

F 500000

li- Khái niệm mẫu

Đ ể nghiên cứu tổng thể theo m ộ t hay số dấu hiệu n o ta cần nghiên cứu tồn phần tử tổng thể, tức thống kê tồn táp hợp phân tích phần tử theo dấu hiệu nghiên cứu Chẳng hạn đ ể nghiên cứu d â n số nước theo dấu hiệu như: giới tính, độ tuổi, nghề nghiệp, trình độ học v ấ n , nơi cư trú, ta phải t i ế n hành tổng điều tra dân sô p h â n tích người theo dấu hiệu sau tổng hợp cho tồn d â n số nước Tuy nhiên thực t ế cách l m gặp phải khó khăn sau đây:

• N ế u kích thước tổng thể q lớn việc nghiên cứu tồn phải chịu chi phí lớn t i ề n của, thời gian, nhân lực, phương t i ệ n , dễ xảy sai sót q trình thu thập thơng tin ban đầu, hạn c h ế độ xác k ế t p h â n tích

• Nếu phần tử tập hợp lại bị phá hủy trình điều

tra phương phá p nghiê n cứu tồ n trở thàn h vơ nghĩa Chẳng hạn: đ ể k i ể m tra chất lượng hộp sữa h ã n g sản xuất ta khơng thể mở tất hộp sữa hãng sản xuất đ ể k i ể m tra

(115)

CHúttiq ó: Mẫu ngẫu nhiên

Vì vậy, từ t h ế kỷ 17, phương p h p nghiên cứu mẫu đ i , ngày phát triển sử dụng rộng rãi nhiều lĩnh vực T tưởng phương p h p mẫu như'sau:

T tổng-thể ta l ấ y n phần tử đo lường giá trị dấu hiệu X* chúng, n phần tử n y lập n ê n mẫu s ố phần tử mẫu (n) được g ọ i kích thước mẫu thơng thường kích thước mẫu nhỏ nhiều so với kích thước tổng thể Vì ta có khả thực t ế đ ể thu thập, x lý khai thá c thôn g tin mẫ u mộ t h nhanh chóng, tồn d i ệ n Sử dụng phương p h p toán học (đặc b i ệ t lý thuyết xác suất), người ta t i ế n h n h suy rộng k ế t nghiên cứu m ẫ u cho toàn tổng t h ể , mục đích cuối phương p h p mẫu

Để đạt mục đích mẫu phải đại diện cho tổng thể

M u ố n vậy, lấy mẫu phải đ ả m bảo tính ngẫu nhiên, khơng chọn m ẫ u theo tiêu chuẩn chủ quan định trước

Trong thực t ế có nhiều cách lấy mẫu:

Ì- Lấy mẫu ngẫu nhiên:!

Ta đánh số phần tử từ Ì đ ế n N (N số phần tử tổng thể),-Đ ể có mẫu kích thước n, ta- dùng bảng số ngẫu nhiên' dùng cách bốc thăm đ ể lấy cho iu n phần tử vào mẫu

Bằng cách này, m ỗ i phần tử tỏng thể có khả dược chọn vào mẫu

2- Chọn mẫu giới:

(116)

4ịỉá& trình lự thuyết xác Mất tìt éhiạ UẾ IOÚML

Ta chia tổng thể thành số lớp theo tiêu phụ đó,

sao cho phần tử m ỗ i lớp đồng đ ề u Sau lấy ngẫu nhiên từ m ỗ i lớp số phần tử đ ể đưa v o mẫu C c h chọn mẫu thường p dụng phạm vi nghiên cứu rộng, số lượng phần tử tổng thể lớn

Việc lấy mẫu tiến hành chủ yếu theo phương thức:

a- Lấy mẫu có hồn lại (có lặp)

Phương p h p p dụng tập hợp có phần tử Theo phương thức này, m ỗ i lần l ấ y vào mẫu pịiần tử Sau nghiên cứu ta trả l i phần tử đỏ v o tập hợp trước lấy phần tử

Như vậy, v i cách l ấ y n y , phần tử xuất h i ệ n nhiều lần mẫu

b- Lấy mẫu khơng hồn lại (khơng lặp)

Theo cách l ấ y này, phần tử l ấ y nghiên cứu bị l o i hẳn khỏi tạp hợp

Trong thực tế, kích thước tổng thể lổn phương thức

lây mẫu có hồn l i k h n g hồn l i cho ta k ế t sai lệch không đáng k ể Đặc biệt kích thước tổng thể vơ hạn CỊIL-kích thước mẫu hữu hạn khơng có k h c b i ệ t hai phương thức lấy mẫu Lúc chọn mẫu theo phương thức khơng hồn l i mà xem mẫu chọn theo phương thức có hồn l i

Việc lựa chọn phương pháp lấy mẫu phụ thuộc vào mục đích, đối

(117)

&uỉđti(Ị Ĩ: Mẫu ngầu /thiền

H I - M ô h ì n h x c s u ấ t c ủ a t ổ n g t h ể v m ẫ u Ta dùng cơng cụ tốn học để mơ tả khái qt khái

n i ệ m : tổng t h ể , dấu h i ệ u n g h i ê n cứu m ẫ u nêu phần Tức x â y dựng m hình tốn học chúng

Ì- Đại lượng ngẫu nhiên góc qui luật phân phối gốc

Từ bảng 6.1 (hoặc 6.2) ta thấy mơ hình hoa dấu hiệu X* m ộ t đ i lượng ngẫu nhiên

T h ậ t vậy, n ế u lấy ngẫu n h i ê n từ tổng thể phần tử g ọ i X giá trị dấu hiệu X* đo ê n phần tử lấy X đ i lượng ngẫu nhiên có p h â n p h ố i x c suất sau

Bảng 6.7

X Xi Xi Xi Xk

p P I P2 Pi Pk

N h v ậ y dấu h i ệ u mà ta nghiên cứu (X*) mơ hình hóa đ i lượng ngẫu nhiên X Qui luật phân phối x c suất X g ọ i

, , ì

là qui luật p h â n phơi góc

2- Các tham số đại lượng ngẫu nhiên gốc

a- Kỳ vọng toán: Với qui luật phàn phối xác suất (6.7) X

Theo định nghĩa, kỳ vọng toán X là:

E(X) = £xiPi

i = l

So sánh với (6.3) ta thấy trung bình tổng thể kỳ

(118)

(ịiáữ trình bị thuyết xát Mất ó điếng, kê tơáit

V a r ( X ) = Ề [ Xi - E ( X ) ] P ; i = l

Nhưng E(X) = li, Do đ ó :

V a r ( X ) = Ề ( x , - | i ) p? i=I

So s n h vớ i (6.4) ta thấy phương sai tổng thể

phương sai đại lượng ngẫu nhiên gốc X: = V a r ( X )

3- Mầu ngẫu nhiên

Giả sử lấy n phần tử từ tổng t h ể , tạo n ê n m ẫ u có kích thước n theo phương-pháp có h o n l i G ọ i X j giá trị dấu h i ệ u X đo phần tử thứ i ( i = Ì, 2, , n) Vì phần tử lấy theo phương thức có hồrt l i n ê n X i , %2, , x „ đ i lượng ngẫu nhiêiTđộc lập, có qui luật p h â n phối xác suất giống v i qui luật p h â n phối xác suất X

V ậ y n phần tử thuộc mẫu, gạt bỏ c c hình thức cụ t h ể , mô tả n đ i lượng ngẫu nhiên: X i , X2, , xn Do ta khái quát đ ể định nghĩa mẫu ngẫu nhiên sau:

Cho đại lượng ngẫu nhiên X vôi qui luật phân phối xác suất đó Một mẫu ngẫu nhiên kích thước n thành lập từ đại lượng ngẫu nhiên X n đại lượng ngẫu nhiên độc lập, có phân phối xác suất với đại lượng ngẫu nhiên X

Ký h i ệ u mẫu ngẫu nhiên kích thước n xây dựng từ đ i lượng ngẫu nhiên X là: Wx = ( X i , X2, , xn)

Thực p h é p thử đô'i v i m ẫ u ngẫu nhiên Wx, tức thực h i ệ n p h é p thử đ ố i v i m ỗ i thành phần (Xi) mẫu (trong thực t ế thường lấ y n phần tử cụ th ể từ tổng thể) G i ả sử X i nhậ n giá trị Xi ( i = Ì, 2, , n) C c giá trị X i , x2, , xn tạo thành giá

(119)

()li ương ó: Jtlẫu ngẫu nhiên

trị m ẫ u ngẫu nhiên, hay g ọ i m ẫ u cụ t h ể Ký h i ệ u wx = ( x i , x2 xn)

Thí dụ ì: K ế t thi m n tốn lớp g m 50 sinh v i ê n

sáu

Bảng 6.8

* Đ i ể m thi

S ố h/s có đ i ể m tương ứng 15 13 G ọ i X đ i ể m thi m ô n toán sinh viên chọn ngẫu nhiên danh sách lớp X đ i lượng ngẫu nhiên có p h â n phối x c suất sau:

Bảng 6.9

X

p 0,16 0,3 0,26 0,18 0,1

Ta coi 50 sinh viên lớp tổng thể (kích thước tổng t h ể 50) T lớp ta lấy mẫu g m học sinh G ọ i X j ( i = 1,5) đ i ể m thi m ô n ' t o n sinh viên thứ i l ấ y v o mẫu V ậ y la có mẫu ngẫu n h i ê n kích thước n = xây dựng từ đ i lượng ngẫu nhiên X:

W x = ( X , , X2 ) x3, X4, x5) Thực phép thử mẫu ngẫu nhiên này, tức chọn

ngẫu nhiên (có hồn l i ) sinh viên lớp Giả sử đ i ể m thi sinh viên thứ ỉ ; s/v thứ hai ; h/s thứ ba ; h/s thứ tư h/s thứ n ă m 4, ta có mẫu cụ t h ể là:

(120)

cịiáo trình lự thuyết xác Ồ tỉtốttạ kê toái!

w x = (4, 7, 9, 9, 5)

Nếu kích thước mẫu lớn, việc trình bầy cách cụ thể kết

quan sát không thuận tiện Trong trường hợp n y ta sử dụng khái n i ệ m : giá trị cua dấu h i ệ u X (Xi); tần suất Xi (Pi) nêu phần đ ể trình bầy mẫu cụ I h ể dạng bảng

Đ ể phân biệt với ký hiệu tổng thể Đ ố i v i m ẫ u ta dùng ký hiệu sau đây:

ni: Tần số Xj; fi = — : Tần suất Xi

n

Thí dụ 2: T bảng (6.6) ta thấy thu nhập công nhân n g n h cao su

có thể mơ hĩnh hoa đ i lượng ngẫu n h i ê n X với bảng p h â n phối xác suât sau:

Bủng 6.10

X 500 600 700 800 900 1000 1100

p 0,10 0,14 0,30 0,24 0,11 0,06 0,05

Trong thực t ế ta thường chưa b i ế t bảng (vì muốn có bảng ta phải điều tra v ề thu nhập toàn 500.000 cồng nhân ngành cao su) Vì người ta dự định đ i ề u tra v ề thu nhập 500 công nhân chọn sộ' 500.000 công n h â n tồn ngành cách ngẫu nhiên, có hồn l i

Gọi Xi "Thu nhập công nhân thứ i đưa vào mẫu"

( i = 1,500) Như ta có 500 đ i lượng ngẫu nhiên: X i x2 x5()(), độc lập, có p h â n phối xác suất v i X Tức ta có m ẫ u ngẫu nhiên: w x = ( X | , x2 X500) x â y dựng từ đ i lượng ngẫu nhiên gốc X

Thực phép thử mẫu wx, tức điều ưa thu nhập

(121)

Qhươnạ ó: Mầu tiạẫu nhiên Bảng ì ì

Xi 500 600 700 800 900 1000 1100

ni 50 75 105 160 60 40

• i o

N h v ậ y , bảng mẫu cụ thể (kích thước mẫu n = 500) chọn từ tổng t h ể có kích thước N = 500.0ŨU

Nếu điều tra thu nhập 500 cồng nhân khác ta lại có mẫu cụ t h ể k h c (một giá trị khác) mẫu ngẫu nhiên W x Như vậy, mẫu ngẫu nhiên phản ánh kết điều tra

thực nghiệm B i k ế t coi giá trị Tức khái quát thực nghiệm Quan hệ mẫu ngẫu nhiên m ẫ u cụ thể (hay giá trị nó) tươne tự quan hệ đ i lượng ngẫu nhiên giá trị nhận

4- Các phương pháp mơ tả số liệu mẫu

a- Mô tả mẫu bảng phân phối tần số thực nghiệm:

kBảng 6.12

Xi Xi *2 xk

ni ni n2 nk

li

Đ ố i với bảng trên, ta ln có: = n i = l

b- Mơ tả mẫu bảng phân phối tần suất thực nghiệm

Bảng ì

Xi Xi X2 Xk

(122)

ựịiáơ trình lý thuụểt xịe, mạt thống, kê tốn

trong đó: f j = — ; Đ ố i v i bảng trên, ta ln có: / =

n i=i

p

c- Đ ể mô tả số l i ệ u mẫu cách rõ r n g1 Hơn cho p h é p ta đ a * a nhận x é t sơ ban đầu v ề tổng thể người ta x â y dựng l o i đồ thị k h c p h â n phối thực nghiệm

o Đa giác tần số: đường gãy khúc nối điểm (Xi, ni); ( x2, n2) ; ; (Xk, nk)

© Đa giác tần suất: đường gãy khúc nối điểm (Xị, fi); (x2, Í2>; ; (Xk, fk)

I

Thí dụ: V ẽ đa giác tần suất phân phối thực nghiệm sau:

Xi

fi 0,1 0,3 0,4 0,2

0.45 0.4 0.35 -'

0.3 ' 0.25

0.2 0.15

0.1 ; 0.05

0 -0

Đa giác tần suất thường dùng để mô tả số liệu mẫu theo thời gian

© Biểu đố tần số: Khi dấu hiệu nghiên cứu có phân phối liên tục

(123)

&iươtiạ ó: Jtlmi ngẫu nhiên

đó khoảng chứa tất giá trị quan sát m ẫ u chia thành số khoảng có chiều dài h ứng với khoảng ta

tính số quan sát mẫu thuộc khoảng này, tức tính tần số (ni) tương ứng với khoảng Biểu đồ tần số biểu đồ dạng bậc thang tạo nên nhiều hình chữ nhật có đáy h chiều cao — Lúc diên tích hình chữ nhát thứ i h — = ni

h h Vậy diện tích tất hình chữ nhật kích thước mẫu n

"Ểơng tự biểu đồ tần suất biểu đồ dạng bậc thang tạo nên , f

nhiêu hình chữ nhát có đáy h chiều cao — L ú c h

diện tích hình chư nhật thứ i h — = fj diện tích tất h

hình chữ nhật

Thí dụ: Vẽ biểu đồ tần số phân phối thực nghiệm cho bảng

sau:

Bảng ì4

Xi"— Xị+1 ni

h

5 - 0,8

1 - 15 1,2

1 - 16 3,2

• - 36 7,2

2 - 24 4,8

3 - 35 10 2,0

• - 4 0,8

(124)

Lịláo trình ỉ lị thuyết xác mối Miếng, kê tốn

lo 15 20 25 30 35 49

© Biểu đồ hình bánh xe: Đ ố i với dấu hiệu định tính người ta thường m ô tả số liệu mẫu b i ể u đổ hình b n h xe Đ ó hình trịn chia thành phần tương ứng v i tỷ l ệ phận mẫu

Thí dụ: Điều tra ngẫu nhiên 100 khách hàng doanh nghiệp

thì thấy khách hàng p h â n theo tỷ l ệ sau v ề tầng lớp xã hội

Bảng 6.15

Tầng lớp xã hội Số khách hàng tỷ l ệ

Công nhân 35 0,35

Nông dân 40 0,40

Thương nhân 15 0,15

Trí thức 10 0,10

Tổng số 100

(125)

& tươi KỊ ó: Mẫn í/tí li hiền

N ô n g d â n

40%

T r i X

t h ứ c / \ \<ị°ỉ/ T h n g

/ n h â n 15%

C ô n g nhân 35%

Đ ứiị p h â n p h ố i m ẫ u có t h ể v ẽ d ễ dàng n ế u ta sử dùng c c phần m ề m thống k ê n h E x c e l , SPSS, S t a t a ,

IV- Các tham số đặc trưng mẫu

K h i nghiên cứu m ẫ u , người ta thường quan t â m đ ế n c c tham số đặc trưng sau đ â y :

Ì - T r u n g b ì n h m ẫ u

a- Định nghĩa: Cho m ẫ u ngẫu nhiên kích thước n, xây dựng

từ đ i lượng ngẫu nhiên X : W x = ( X | , x2 ) - , xn) Trung bình mẫu ngẫu nhiên (ký hiệu X) định nghĩa:

i n x n?xi

n j_i

(6.10)

Do X ị , X2, , x „ c c đ i lượng ngẫu nhiên , theo định nghĩa t r ê n X h m n đ i lượng ngẫu nhiê n X i , X2, , xn n ê n

(126)

(ịiéuy trinh, lý thuyết xán suất oà thống, kè lơảỉi

N ế u có mẫ u cụ thể : wx = ( X i , x2, , x„) ta tính giá trị X (ký h i ệ u X)

X tính theo cơng thức:

— Ì n

n i=i (6.16)

Như X giá trị X , đồng thời trung bình mẫu cụ thể wx = (X|, X2, , xn)

b- Tính chất: Nếu đại lượng ngẫu nhiên gốc X có kỳ vọng tốn:

E(X) = ịi phương sài:

Var(X) = thì:

E ( X ) = M- V a r ( X ) = / n Thật vậy, theo tính chất kỳ vọng tốn, ta có :

E(X) = Ì V Xj ì = 1Ỳ E(X,) = i nụ = n

n 1=1 n

Đ ể ý đ i lượng ngẫu nhiên Xi độc lập, có p h â n phối xác suất với đ i lượng ngẫu nhiên gốc X

Theo tính chất phương sai thì:

V a r ( X ) = Var - £ x , =-\ỵWaiỌí,) = - L n a2 = —

Vn i ! ) n ,=| n n

Như vậy, ^ui luật phân phối xác suất đại lượng ngẫu

(127)

ẽhưtùtạ ó: jỊỊẫu Iiạẫu nhiên

vọng_của đ i lượng ngẫu' nhiên gốc [E(X) = E ( X ) J Còn phương sai X nhỏ phương sai đ i lượng ngẫu nhiên gốc n lần Nghĩa c c giá trị có th ể có X ổ n định quanh kỳ vọng cá c giá trị có X

Nếu lấy bậc hai Var( X) ta độ lệch chuẩn ơ( X ) Độ

lệch chuẩn X dùng đ ể phẩn ánh sai số ước lượng người ta thường g ọ i sai số chuẩn (ký hiệu se( X ) V ậ y :

se(X) = o(X) = Vvar(X) = -^L

VII ta giả thiết mẫu rút từ tổng thể theo

phương thức có h o n l i N ế u kích thước tổng thể vơ hạn kích thước tổng thể hữu hạn n < 0,1N lấy mẫu khơng h o n l i mà không ảnh hưởng đ ế n k ế t Trường hợp n > 0,1N đ ố i v i công thức phải sử dụng hệ số hiệu chỉnh m ẫ u không lặp K h i ta có:

- _N-n ạ2

i N - n

se(X) = ' N - n < r N - l ' n

c- Qui luật phân phối X

(128)

Lịiáo trình lý thuyết xác tuất tttếnạ Ui toán

2- P h n g sai m ẫ u

a- Định nghĩa: Cho mẫu ngẫu nhiên wx = (Xi, x2, , Xn) Phương sai (ký hiệu s2) định nghĩa:

S2=-ỉ-ấ(X,-X)1 (6.17)

n - i=i Trong X trung bình mẫu ngẫu nhiên

* Chú ý: Theo định nghĩa trên, ta thấy phương sai mẫu ngẫu nhiên

h m n đ i lượng ngẫu nhiên X | , X , , Xn n ê n s đ i lượng ngẫu nhiên

I

N ế u có mẫ u cụ thể : wx = ( X i , X2, , xn) s nhận giá ừỵ

S2=^7ẳ(x,-x)2 (6.18)

n - UI s2 gọi phương sai mẫu cụ thể

2 '

b- Tính chất s

2 - Do s đ i lượng ngầu nhiên n ê n ta có thè inh E(S )

Giả sử: E(X) = ịi; Var(X) = a2 Ta có:

(Xi-X)2=[(x,-^)-(X-n)]2

= (X, - ịi)1 - 2(X - n).(Xi - ụ) + (X - ụ)1'

Dođó: Iị(X,-X)2 =I£(X,-H)2

-n t i -n t r -2(X-^)I^(Xl-^) + (X-M)2

(129)

Qltítiạ ó: Mẫn ngẫu nhiên

Vì: Nên:

Do đó:

n M r í t /

2 ( X - n ) - ị ( X i - ^ ) = ( X -M )2 n i=i

i ị c x ^ x ) = Ì J ( X l - n ) a - ( x - H ) a

E(S ) = E - L Z ( X Í - X ) Ĩ

n-ltí [ n - [ n -

i ẳ ( ^ i - X ) n w

n

n - n w

- L - Ỉ £ E ( X - H ) - E [ ( X - ( I ) Ĩ n-1 nlr

E ( X Ị ) = l i (Vi) n ê n E(X, - ự)2 = Var(Xị) = Var(X) = ơ2 E(X) = H nên E[(X-n)2] = Var(X) = ơ2/n

Do đ ó :

2 n E(S2) =

n -

.2 N n.ơ

-n n

n ( n - ỉ _ A

K n /

n - =

N h vậy, kỳ vọng toán phương sai mẫu phương sai đại lượng ngẫu nhiên gốc X

(130)

íịiá& trình Lị thuyết xóa ồ- thống, kê tốn

Đ ộ lệch chuẩn m ẫ u ngẫu n h i ê n (ký h i ệ u S) c ă n bậc hai phương sai mẫu:

S = V s ĩ (6.19)

Nếu có mẫu cụ thể độ lệch chuẩn mẫu cụ thể giá trị s (ký h i ệ u s ì :

s = N / S7 (6.20)

4- Tỷ lệ mẫu

T tổng t h ể g m N phần tử, có M phần tử có tính chất A Ta lấy ngẫu n h i ê n n phần tử v o m ẫ u (lấy theo phương thức -có h o n l i ) G ọ i X i (i = Ì, 2, n) số phần tử có tính chất A o n g lần l ấ y phần tử thứ i v o mẫu X i ( i = Ì, 2, n) đ i lượng ngẫu nhiên nhận m ộ t hai giá trị: X i nhận giá trị n ế u phần tử thứ i l ấ y v o m ẫ u k h n g c ó tính chất A ; X i nhận giá trị Ì n ế u phần tử thứ i l ấ y v o m ẫ u có tính chất A

Tỷ lệ mẫu ngẫu nhiên (ký hiệu Fn) định nghĩa sau:

n i_i

Vì X i ( i = Ì, 2, n) c c đ i lượng ngẫu n h i ê n , Fn h m đ i lượng ngẫu n h i ê n n ê n Fn m ộ t đ i lượng ngẫu n h i ê n * Chú ý: Nhìn vào biểu thức định nghĩa Fn ta thấy giống với biểu

(131)

@hườitạ ồ: Mẫu ngẫu nhiên

N ế u có m ẫ u cụ thể , ta tính giá trị F„ (ký h i ệ u f ) nA

f = — (6.22) n

Trong đ ó nA tổng số phần tử có tính chất A có m ẫ u cụ t h ể ; n kích Ui ước mẫu

Như f giá trị F„ tỷ lệ phần tử có tính chất A m ẫ u cụ thể

V- Phương pháp tính tham số đặc trưng m ẫ u

Giả sử có mẫu cụ thể w x = ( X i , x2, , xn) , trung bình m ẫ u ( x ) phương sai m ẫ u ( s2 ) hai giá trị đ ố i v i m ẫ u cụ thể n y , s suy từ s2 ; cồn f tính đơn giản Do phần

2

n y c h ú n g ta nêu c n g thức tính X s tương ứng v i trường hợp số l i ệ u h i ệ n có sau

Ì- Trường hợp số liệu mẫu cho dạng khơng có t â n so

Trường hợp này, để tính X ta sử dụng cơng thức định nghĩa: _ Ì n

x = ~ Z x i (6.23)

n i=,

ĩ ' 2

Đ ê tính s ta dùng c ô n g thức: 2_ _L

s = n

-Chứng minh:

(132)

íịiáữ trình lý- thuyết xịe Mất Ồ í/iấnạ kề lồn

Theo côn g thức định nghĩa s ta c ó :

Ta có:

V ậ y :

(xj - x )2 = ( X ị )2 - xix + ( x )2

ẳ(x,-x)2=ỉ[(x,)2-2x.xi+(x)2] 1=1

= ẳx.2 " x È x + n (x )2 = ẳ x * - x n x + n ( x )2 i=! i=l i=l

= ẳx.2"n02 Suy" ra:

s2=

n - Ẻx?-nW i=l đ p c m

Thí dụ 3: Quan sát đ i ể m thi m ô n T o n cao cấp 10 sinh viên

chọn ngẫu nhiên từ lớp ta thu số l i ệ u sau: 5; 6; 7; 4; 6; 9; 4; 5; 5; 7;

Tính X s mẫu

Giải: Ta có:

lo _ co ^ X i =58.; V ậ y : x = ^ = ,

i=i l o 10 I r ,

(133)

phường ổjjtưui Iiạẫít nhiên

=> s = V s7 = y[2Ã = 1,549193 * Chùy: • Để tính X Ị ' dùng hàm AVERAGE Excel

X = AVERAGEÍXỊ}

»

• Đ ế tính s ta dù ne h m VAR Excel S^=VAR{Xjj

• Để tính s ta dùng hàm STDEV Excel s = STDEV{Xi}

Cách thức thực lênh tương tự lịnh AVERAGE (xem phụ lục 1)

Thí dụ 4: Có số liệu doanh số bán (Y) chi phí chào hàng

(X) 12 công ty thương m i tư nhân cho bảng đây: H ã y tính trung bình mẫu độ lệch chuẩn mẫu X Y ?

Bảng 6.25

Doanh số b n Chi phí c h o Doanh số bán Chi phí c h o

ơ i ) h n g (xi) i ) hàng (Xi)

tr.đ/năm (tr đ/năm) tr.đ/năra triệu đ/năm

1270 100 1610 140

1490 106 1280 120

1060 60 1390 116

1626 160 1440 120

1020 70 1590 140

1800 170 1380 150

(134)

íịiá& trình lý tíuiụết xác utấí thốnạ kẻ tốn Giải: Ta l ậ p bảng tính sau:

Bủng 6.26

yi Xi y ,2 X i2

1270 100 1612900 10000

1490 10Ổ 2220100 11236

1060 eo 1123600 3600

1626 160 2643876 25600

102 lồ 1040400 4900

1800 170 3240000 28900

1610 140 2592100' 19600

1280 120 1638400 14400

1390 l ó 1932100 13456

1440 Ì? 2073600 14400

1590 2528100 19600

1380 1904400 22500

16956 la- 24549576 188192

V i k ế t tính bải í.26, ta c ó : - 16956

V =

12 413;

- 1452 X = — — = 121

12

sị = ^ [ > - ( )2] = 53704,36364

sv = /^3704,36364 =231,742

= 1136,363636

(135)

ũítư&tiạ ó: Mẫu Iiạẫii nhiên

2- T r n g h ợ p s ô l i ệ u c ủ a m â u c h o d i d n g c ó

t â n s ị n , ( n ó i c h u n g n i > )

Trường hợp này, đ ể tính X s ta p dụng cơng thức: - Ì k

n i=i

s2 =

n - i=I

(6.27)

(6.28)

* Chú ý: ^ n j X j cơng thức (6.27)

k=i i=i

k

Cồng thức (6.23); Tương tự n i x ? t r o nê c ônẽ t h ứ c (6-2 8) c ũ ns k=l

n

chính ] x ,2 c ô n g thức (6.24) k=l

* V i c c số l i ệ u cho thí dụ 3, ta trình bày số l i ệ u quan s t m ẫ u n y dạng có tần số sau:

Xi

ni 2

Đ ể tính tổng V n j X j ^ n , x ~ ta lập bảng tính

i=i i=i

(136)

íịiáơ trình ít/, thuyết xác suất thống, kê toán Bủng 6.29

Xi ni n.Xị • ni xf

4 32

5 15 75

6 12 72

7 14 98

9 81

Tổng n = 10 58 358

k

Theo k ế t lính bảng trên, ta có Y n ị X ị = 58 (tổng cột thứ ba i=i

k , '

của bảng); ^ n , X ,2 = 358 So sánh v i k ế t tính thí dụ ta có i=i

thể minh chứng cho nhận xét nêu

Thí dụ 5: Tính trung bình phương sai mẫu cho bảng sau: Bdnfỉ6.30

Xi y

ni 10 15 13 12

Giải: Ta lập bảng tính sau: Bủnị>6.3l

Xi ni n;.Xị Ilị.Xi

4 10 40 160

5 15 75 375

7 13 91 637

9 12 108 972

(137)

Qltươuạ 6:JlíẪit tiạẫií nhiên

T k ế t tính tốn bảng trên, ta có: - 314

X =

50 = 6,28

s2= - H 4 - ( , )2] =3,5118

* Chú ý: Khi áp dụng công thức (6.27) ; (6.28) số-liệu

m ẫ u phân chiạ thành Lừng khoảng ( x j ; x ), tính toán ta thay m ỗ i khoảng giá trị trung tâm khoảng (ký h i ệ u Xi)

x; =

x; + X;

( V i = 1,2, , k )

Thí dụ 6: s ố l i ệ u cho cột Ì cột bảng (bảng 6.32)

là số l i ệ u quan sát thu nhập số người làm việc c ô n g ty (đơn vị: ngàn đ/tháng) Hãy tính trung bình mẫu phương sai mẫu" '•

Bảng 6.32

Thu nhập S ố người 0 - 850

851 - 900 12

901 - 950 24

951 - 1000 36

1001 - 1050 25

Thu nhập S ố người

1051 - 1100 20

H O I - 1150 16 1151 - 1200 10 1201 - 1300

(138)

íịiáo í rình tý ựutạểt xóa Ồ ihếtiạ kê tơáềi Bảng 6.33

x ' i — X i+1 Xi ni lầị.Xi nị.Xị2

800 - 850 825 7425 6125625

851 - 900 875,5 12 10506 9198003

901 - 950 925,5 24 22212 20557206

951 - 1000 975,5 36 35118 34257609

1001 - 1050 1025,5 25 25637,5 26291256,25

1051 - 1100 1075,5 20 21510 23134005

1 l o i - 1150 1125,5 16 18008 20268004 1151 - 1200 1175,5 10 11755 13818002,5

1201 - 1300 1250,5 10004 12510002

l ô n g n = 160 162175,5 166159712,75 T k ế t tính tốn bảng ta c ó :

x=162175-5 =1013,596875

160

s2= -^[l66159712,75-160.(1013,125)2]= 11189,51414

VI- Mấu ngẫu nhiên hai chiều Ì - K h i n i ệ m

Giả sử tổng t h ể phải nghiên cứu đồng thời hai dấu hiệu định tính hay định lượng, dấu hiệu thứ có t h ể xem đ i lượng ngẫu nhiên X , dấu h i ệ u thứ hai có t h ể xem đại lượng ngẫu nhiên Y K h i việc nghiên cứu đồng thời hai dấu hiệu xem nghiên cứu đ i lượng ngẫu n h i ê n hai chiều Từ tổng thể lấy mẫu kích thước n, tức thực n phép thử đối

(139)

Qỉuttíttg ó: Mấu ngẫu tdùên

đ i lượng ngẫu nhiên hai chiều độc lập T ta có định nghĩa m ẫ u ngẫu nhiên hai chiều sau:

Mẩu ngẫu nhiên hai chiều kích thước n tập hợp n đại lượng

ngẫu nhiên độc lập: ( X i , Y i ) , ( X2, Y2) ( Xn , Yn) thành lập từ đ i lượng ngẫu nhiên hai chiều (X, Y ) có qui luật p h â n phối x c suất v i ( X , Y )

M ầ u ngẫu nhiên hai chiều ký hiệu là:

WX Y= [ ( X , , Y , ) , ( X2, Y2) , , ( Xn, Yn) ] Thực phép thử mẫu ngẫu nhiên WXY thực

m ộ t p h é p thử đ ố i v i m ỗ i thành phần mẫu Giả sử (Xi, Yi) nhận giá trị (Xi, yi) (i = Ì, n ) ta thu mẫu cụ thể:

wxy =[(x,,y,),(x2,y2), ,(xn,yn)]

2- Phương pháp mô tả mẫu ngẫu nhiên hai chiều

G i ả sử từ tổng thể chọn mẫu ngẫu nhiên hai chiều kích thước n Trong thành phần X nhận giá trị: X|, X2, , Xfc thành phần Y nhận giaHrị: y i , y2, , yh Trong giá trị (Xi, Yj) xuất h i ệ n v i tần số rijj (i = Ì, k ; j = Ì, h ) Sau giá trị Xi y j x ế p theo thứ tự tăng dần mẫu cụ thể wx y mơ tả biểu bảng p h â n phối tần số thực nghiệm sau:

y i Y2 yir ni

Xi n u ni2 nih ni

n2i n22 n2h n2

Xk n u nic2 Pkh nk

(140)

Cịiủo trình lý thuyết xịe tít nợ kê tốt!

h

Trong đó: l i , = n jj - tần số Xi (i =.1 k) j=i

li

mJ =ỴjnIỊ - tần số yj ( j = l.h)

1=1

3- Các tham số đặc trưng mẫu ngẫu nhiên hai chiều Từ hảnrr " iigniẹni cua mau ngài! nhiên hai chiều ta co me Ì UI ra:

a- Bảng phân phối thực nghiệm thành phần X

l x V xk

1 n i

n i ak

T báng ta tính thám số đặc trưng mẫu đ ố i v i X

b- Bảng phân phối thực nghiệm thành phần Y

Y y i y2 Ỵh

Iĩij m i ĨĨ12 mh

T bảng ta tính tham số đặc trưng mẫu đ ố i v i Y

c- Bảng phân phối có điều kiện thực nghiệm Y X = Xi

Y / X = Xi y> yi yh

ny ni i tii2 n,h

(141)

&ntưiiợ ó: Mẫu ngẫu nhiên

T b ả n g n y ta tính trung bình có điều kiện Y (điều k i ệ n X = Xi)

Ì h ni j=r

c- Bảng phân phối có điều kiện thực nghiệm X Y = y>j

X / Y = y j Xi x2 Xk

ny n i j n2j nkj

ư n g đ ó : ^ n n = m ì

i=l

(142)

{ịìáo- trùth bị tluiụết xác íỉtếtiạ kè tốn

C h n g ƯỚC LƯỢNG CÁC SỐ ĐẶC TRƯNG

C Ủ A T Ổ N G T H Ể

Như biết, số đặc trưng tổng thể trung

bình tổng thể, tỷ l ệ tổng thể, phương sai tổng t h ể , đửỢesử-dụng rất.nhiều phân tích kinh t ế - xã h ộ i lĩnh vực kháci Nhưng số đặc trưng thường chưa biết Vì v ậ y đặt vấn'* đề cần ước lượng chúng phương p h p mẫu

ở chương ta biết số đặc trưng tổng thể là'

c c tham số đặc trưng đ i lượng ngẫu nhiê n gốc X , ta nêu vấn đề thực t ế dạng tốn họ.c sau/

Cho đ i lượng ngẫu nhiên X biết chưa biết qui luật phân phối xác suất chưa biết tham số n o Hãy ước lươn? phương pháp mẫu

Bi Ì, la loàn thống kê

ti-vi tì số nên ta có.thể dùng số để ước

lượng e Ước lượng g ọ i ước lượng điểm (nếu đưa c»n số dùng để ước lượng e lên trục số ứns v i điểm) Ngoài ước lượng đ i ể m , người ta dùng ước lượng khoảng Tức khoảng số (9Ị, 02) có thệ chứa

Dưới nghiên cứu phương pháp tìm ước

(143)

@hitờtiạ 7: QỂ&C lưựtiạ eáe lữ đặe trưng, tầng, thể

I - C c p h n g p h p t ì m c l ợ n g đ i ể m Ì - P h n g p h p h m c l ợ n g

a- Mô tả phương pháp: Giả sử cần ước lượng tham sô đ i

lượng ngẫu nhiên X T X ta lập mẫu ngẫu nhiên kích thước ni W x = ( X1, X2, , , Xn) l

Chọn

Ồ = f ( X1, X2, , Xn) ố hàm đại lượng ngẫu nhiên Xi, x2, , xn nên

m ộ t đ i lượng ngẫu nhiên, ê g ọ i h m ước lượng © Trong thựe tế người ta thường chọn hàm ước lượng sau:

— li n

• Chọn ê = x = — V X ị n ế u ước lượng trung bình tổng • n t i

thể

• Chon Ồ = s2 = — — y " ( X ị - X )2 n ế u ước lượng phương sai n - M

của tổng thể

i n

• Chọn Ồ = Fn = — y ^ - ^ i n ê u l c Ư (?nẽ l Jệ lổnỗ thể n t í1

T m ẫ u cụ thể w x = ( xb x2, , Xọ), ta tính giá trị e (ký h i ệ u ê * ) Tức là:

(144)

Cịiáa trình hị thuyết xác xuất tíiốnạ kê tốn

Ta thấy có vơ số cách chọn dạng h m f, lức có vơ số đ i lượng ngẫu nhiên z dùng làm h m ước lượng Vì vậy, cần đưa liêu chuẩn đ ể đánh giá chất lượng ước lượng T lựa chọn h m ước lượng "tốt h n " theo nghĩa n o

Dưới ta xét số tiêu chuẩn đ ó Ì- Ước lượng khơng chệch

* Định nghĩa: gọi ước lượng k h ô n g chệch tham Số0 nếu:

E ( ố ) = (7.1) Ngược lại, E( ố) * gọi ước lượng chệch

* Ý nghĩa: Ta thấy (9 - 6) đại lượng ngẫu nhiên biểu thị sai số ước lượng Theo tính chất kỳ vọng lồn, ta có: E( Ồ - 0) = E( Ồ) - E(0) = e - e = ê ước lượng không

chệch

Như vậy, ước lượng; khôniỉ chệch ước lượng có sai số trung bình Tức giá trị khơng bị lệch v ề phía, dùng đ ể ước lượng khơng mắc phải sai số hộ thống Rõ ràng hai loại ước lượng: chệch khơng chệch ta n ê n chọn ướciượng không chệch

Chú ý rằng, ước lượng khơng chệch khơng có nghĩa

m ọ i giá trị đ ề u trùng khít với mà có nghĩa là: Trung binh c c giá irị , giá trị có th ể sai k h c nhiều so với

* Thí dụ: l- Trung bình mẫu ngẫu nhiên (X) ước lượng không

(145)

& lươn 7: (lức íttựiiạ cát' lả' đặc trư/tạ cửu tổnạ thể

2- Phương sai mâu ngẫu nhiên (S~) ước lượng không chệch

ỉ s 2 _2

phương sai long the ( ) v i : E(S ) =

3- Tỷ l ệ mẫu ngẫu nhiên (Fn) ước lượng không chệch tỷ l ệ tổng the (p) v ì : E(F„) = p

Chứng minh: Thật vậy, theo định nghĩa tỷ lộ mẫu ngẫu nhiên ta

có:

1 J2_ F n = - Ẻ X ,

n UI

Trong X i số phần tử có tính chất A có lần lấy phần tử thứ v o mẫu Xi (ĩ = Ì, 2, n) đ i lượng ngầu nhiên có phân Dhối xác suất sau:

Xi

p q p

với q = Ì - p

Ta có : E(X|) = x q + l x p = p (Vi)

Vậy: E(F„) = -£X, Ì = -ẳE(Xf) = -.np = p

2 - Ước lượng hiệu

Giả sử ẻ ước lượng không chệch Á p dụng bất đẳng hức Chebyshev cho đ i lượng ngẫu nhiên , ta có:

« - , , V a r ( ê ) p(| - E ( ) | < e) > Ì

8

(146)

{Ậiúa trình lý thuyết xác thống, kè toan

p(l Ồ - e I < s) > Ì - V a r ( ẽ )

N h vậy, phương sai V a r ( ) c n g nhỏ x c suất đ ể nhận giá trị gần bao n h i ê u được, lớn Do phương sai tiêu quan trọng phản n h chất lượng hàm ước lượng = f ( X j , X2, xn) T ấ t n h i ê n cách hợp lý cần chọn nhữqg h m ước lượng k h ô n g chệch phương sai nhỏ * Định nghĩa: ố = f(X], X2, , xn) ước lượng không chệch

9 phương sai V a r ( ố ) cận c c phương sai hàm ước lượng "được x â y dựng từ mậu ngẫu nhiên Wx gọi ước lượng h i ệ u

Để tìm cận phương sai hàm ước lượng ta dựa vào bất đẳng thức Crame-Rao nêu định lý

Định lý? Cho mẫu ngẫu nhiên Wx = (Xi, x2 xn) xây dựng

từ đ i lượng ngẫu nhiên X có h m mật độ xác suất (hay b i ể u thức xác suất) f(x, 0) Thỏa m ã n số đ i ề u k i ệ n định (thường thỏa m ã n thực t ế ) ước lượng khơng chệch e :

Ì Var( e ) >

n.E a i n ( x , ) " dô" - Ước lượng vững

Một hàm ước lượng coi hợp lý kkh thước của!

(147)

ẽhưưitợ 7: ơtớe ỉưựitọ lố ttặe trưng cua tổng thể

Định nghĩa: Cho mẫu Wx = ( X i , X2, • , Xn) xây dựng từ đ i lượng ngẫu nhiên X H m ước lượng ê = f ( X ' j , x2, , xn) gọi vững nêu m ọ i e > bé tùy ý cho trước ta có :

:.imP[|f(X1,X2, ,x„)-e |<e] =

Điều kiện đủ ướt iu" i\z vững phát biểu dang định [ý sau:

Định lý: Nếu ước lượng không chệch

Lim Var( ) = ước lương vững n->GO

2 - Phương pháp ước lượng hợp lý tối đa

Giả sử biết qui luật phân phối xác suất dạng tổng quát đại

lượng ngẫu nhiên X, chẳng hạn hàm mật độ í'(x, 0) (cũng cố thể xem f(x, 8) cơng thức tính xác suất X đ i lượng ngẫu nhiên rời rạc) Cần ước lượng tham số

Lập mẫu cụ thể: Wx = (Xi, X?, , xn) Hàm đối số 9:

0 L ( X j , x2, , xn, 9) = f ( x , , ) f ( x2, 6) f(x„, 9) gọi hàm hợp lý tham số

Giá trị hàm hợp lý xác suât (hay mật độ xác suất) đ i ể m Wx = (Xi, x2, , xn)

Giá trị 9* = f(X[, Ấ2, , xn) gọi ước lượng hơp lý tối đa ứng với giá trị h m hợp lý đ t cực đ i

(148)

(ịiáci trình tụ tltuụĩt xúc XI lất vú tliốnạ kẽ tốn Bước Ì : Tìm đạo h m bậc lnL theo

c U n l „

Bước : L ậ p phương trình : =

Phương trình gọi phương trình hợp lý Giả sử có nghiệm 9() = (p(Xj, X i , , xn)

, ế à2 InL

Bước : Tìm đạo h m bậc : — — —

a o2

Nếu điểm 0()= cp(xì, X-2, , xn) đạo hàm bậc hai âm

đ i ể m h m lnL đạt cực đ i Do Go H cp(X|, \->, , xn) ước lượng hợp lý t ố i đa

li- Phương pháp ước lượng khoảng tin cậy

Ngoài cách dùng số để ước lượng tham số 9, ta cịn có

thể d ù n s mộL khoảng số n o đ ể ước lượng Đ ổ tìm khoảng số Vcậy, ta nghiên cứu phương p h p khoảng tin cậy Phương pháp nhà toán học Pháp p.s Laplace nghiên cứu năm 1841 và hoàn thiện nhà t h ố n " ke M ỹ Ị Ncyman n ă m 1937 Ì- Mơ tả phương pháp khoảng tin cậy

ĐỂ ước lương tham số đ i lượng ngẫu nhiên X, l X ta lập mẫu ngẫu nhiên W \ = ( X | , X2, , xn)

Chọn thống kê = f(X|„ x2, , Xn, 9) cho: mặc , ; chưa biếl

giá trị qui luật phâ n phối xá c suất ẽ hồn tồn xác định Do với xác suất Gí bé (trong thực t ố n«ười ta thường lấy oe < 0,05) ta lìm hai số: a b thỏa mãn:

(149)

Qhườttq 7:.(lùt4i LÙỊÌUỊ tóe luấ ttúe ỉnởtạ éủa tổng thế

N ế u từ (7.2) g i ả i dược Tức ta đưa b i ể u thức (7.2) v ề d n g ; P ( ê ! < e < ê2) = 1-cế

thì:

• Khoản g ( Ồ Ì, Ồ 2) đưclc coi ích.VI IV tin câ y e Vì Ì, ế là c c đ i lượng ngẫu n h i ê n n ê n khoảng ịặ ị, 2) khoản g ngẫu nhiên

• (1-ct) g ọ i độ tin cậy (hệ số tin cậy) ước lượng Trong thực t ế ngư i ta thường y ê u cầ u Ì-oe > 95% đ ể có t h ể sử dụng n g u y ê n lý xác suất lớn cho b i ế n cô: ( Ì < < 2)

• Ì = Ố - Ồ Ì g ọ i đ ộ d i khoảng tin cậy ỉ số c ó th ể đ i lượng ngẫ u nhiên

Đ o x c suất Ì - a lớn; n ê n theo nguyên lý x c suất lớn ta có A • Ạ;

thể coi b i ế n c ố ( Ì < < ) chắn x ả y p h é p thử Thực p h é p thử đ ố i v i m ẫ u ngẫu nhiên W x , ta thu mẫ u cụ t h ể : wx = ( X i , X2, , xn) T mẫu cụ t h ể n y ta tính giá trị Ì 2, ký hiệu c c giá trị tương ứng

9 | , 62

N h k ế t luận: V i độ tin cậy Ì - oe, qua mẫu cụ thể wx, e nằm khoảng ( * , 9*2) Tức là: ( ó ; < < 9*2)

Phương p h p ước lượng n y có ưu đ i ể m là: khơng tìm, khồảng í ẻ l , , ) đ ể ước l ợ n g m cho biết độ tin cậy ước lượng Tuy nhiên chứa đựng kha nâng mắc phải sai lầm, xác suất mắc phải sai l ầ m a

(150)

íịlá* ỉrhứi bị thuyết xác Uiấí títấitạ kê tốn

2 - ƯỚC ỉ ự n g t r u n g b ì n h c ủ a t ổ n g t h ê

Giả sử tổng thể đ i lượng ngẫu n h i ê n gốc X p h â n phối theo qui luật chuẩn N ( | i , ơ2) chưa b i ế t ịi, ta cần ước lượng ụ với độ tin cậy Ì - a

T tổng t h ể ta lập m ẫ u ngẫu n h i ê n kích thước n: Wx = ( XI, X2, xn) x é t trường hợp sau:

2.1 Đã biết phương sai đại lượng ngẫu nhiên gốc X

Chọn đ i lượng ngẫu nhiên:

X - z =

ơ / V n

ở chương ta biết z có phân p h ố i N(0, 1)

V i x c xuất oe bé ta tìm số za thỏa m ã n :

P ( | z | < za) = l - a (7.3)

Thay b i ể u thức z v o (7.3), ta được:

x - ị i

hay:

Hay

ơ / V ĩ ĩ = 1-a

ơ / V n = 1-a

V V n V n = 1-a

(151)

Qỉiựơnạ 7: (lẻửe tưựtiạ eáe lố đặn trưng, eủatẩiiạ thề

C u ố i ta được:

\ Vn Vn;

Vậy với độ tin cậy Ì-oe, khoảng tin cậy ụ là:

x-za -^L;X + za-^L

V v n V n y Ký h i ệ u :

(7.4) g ọ i độ x c ước lượng N ó phản n h mức độ sai lệch trung bình m ẫ u so v i trung bình tổng thể v i xác suất (Ì-ót) cho trước

Khi ta viết:

P(X-e<ịi< X + e) = p(| x-ịi\<e)=l-a (7.5)

Ý nghĩa biểu thức (7.5) là: Với xác suất Ì - a , trung bình

mẫu ngẫu nhiên nhận giá trị sai lệch so với ịi lượng (theo giá trị tuyệt đ ố i ) nhỏ

( X - e ; X + s) gọi khoảng tin cậy đối xứng ịi Trong trường hợp này, độ dài khoảng tin cậy là:

ỉ-(X+e)-( X- z) = 2e

Ưng với độ tin cậy 1-cc, khoảng tin cậy đối xứng có độ dài ngắn

nhất Vì cần tìm khoảng tin cậy, thơng thường ta cần tìm khoảng tin cậy đ ố i xứng

Vì độ tin cậy Ì- a lớn, nên theo nguyên lý xác suất lớn ta có

(152)

ị gián ttùik tự ỉkuiịết xát tuất oà thống, ki toán

một phép thử Thực phép thử mẫu ngẫu nhiên wx, ta thu mẫu cụ thể: wx = (X|, X2, , x„)

— Ì "

T m ẫ u cụ t h ể ta tính được: X = -7- V Xj

Với độ tin cậy Ì - a cho trước, tra bảng za (phụ lục 4) [hoặc dùng hàm NORMSINV(l-a/2) Excel] ta tìm giá trị za za giá trị đại lượng ngẫu nhiên z ~ N(0, 1) thỏa mãn điều kiệủ: P(| zl > za) = a

Có thể minh họa giá trị Xa đồ thị nhử sau:

M

N g o i khoảng tin cậy đ ố i xứng ta có t h ể tìm khoảng ù n cậy bên phải khoảng tin cậy bên trái

(153)

Qhiừtnợ 7: CiỂte lượng, cát đát trưng, tủa iểtếQ thể

V i a b é ta tìm số Z2a cho: P(|Z|>z2a) = 2a

Ta c ó :

P(| z ị > z2 o) = 2a o P ( Z > z2 o t) = a

o p ——7= £ z , X - L i / V n

= l - a o p H > X - Z 2o = l - a

V ậ y khoảng tin cậy | i trường hợp là:

( X - z a - i L ; +00) (7.7)

V n

(7.7) d ù n g đ ể ước lượng giá-trị t ố i thiểu ịi

• Khoảng tin cậy bên trái:

Tiến hành tương tự trên, ta tìm khoảng tin cậy bên trái l i là:

( - « > ; X + zĩa-^=)

V n (7.8) d ù n g đ ể ước lươn g giá trị t ố i đa ịi

(7.8)

2.2 Trưởng hợp chưa biết phương sai đại lượng ngẫu nhiên gốc X

X - ị i

Trường hợp n y ta x é t đ i lượng ngẫu nhiên: T =

Người ta chứng minh rằng: đ i lượng ngẫu nhiên T p h â n phối theo qui luật Student v i (n - 1) bậc tự

Với xác suất oe bé, ta tìm số ta cho: P(|T|>ta) = a

(154)

cịiáữ trình lý thuyết xóa thốnạ kê tốn

P(-ta < T < to) = Ì - a ơ-9) Thay b i ể u thức T v o (7.9) ta được:

ỉ V ^

X - L I

- t „ < ỉ- < t = Ì - éc G i ả i p tương tự làm phần 2.1, ta được:

/ - s - S Ì

X - t a - ^ < n < X + ta- ) L

V n V n = Ì - a

V ậ y khoảng tin cậy ịi (với độ tin cậy Ì - oi) là: (X-t A;X + t A)

v n V n Từ mẫu cụ thể wx = (X|, x2, , xn) ta tính X s Từ x c định khoảng tin cậy cụ t h ể ịi theo công thức:

x i t a - = V n

(7.10) Trong ta giá trị đ i lượng ngẫu n h i ê n T p h â n phối theo qui luật Student với n - Ì bậc tự thoa m ã n đ i ề u k i ệ n :

P(|T|>ta) = a

Để tìm ta ta ưa bảng phần phụ lục dùng hàm TINV Excel

Chẳng hạn v i độ tin cậy Ì- a = 95% (tức a = 0,05) kích thước mẫu n = 50 (lức bậc tự n - Ì = 49) Khi đ ó :

ta = TINV(0.05,49) = 2,009574 * 2,1 • Khoảng tin cậy bên phải:

(155)

&tưưuụ 7: (túc Ittẹtttạ các, xổ đọa tnútạeỉia tổ tui thi

( x - t * ; +co) (7.11)

V n

(7.11) dùng đ ể ước lượng giá trị t ố i thiểu ịi • Khoảng tin cậy bên trái:

(-ao; x + t 2 ót (7.12)

(7.8) d ù n g đ ể ước lượng giá trị t ố i đa |J

* Chú ý: Khỉ kích thước mẫu n > 30 phân phối Student xấp xỉ

với phânyhối chuẩn NịO, 1) Vì ta dùng za thay cho ta trong cổng thức (7.10)

Thí đít ĩ: Điều tra suất lúa diện tích 100 héc ta trồng lúa

của vùng, người ta tính được: X = 46 tạ/ha; s = 3,3 Hãy ước lượng suất lúa trung bình toàn vùng với độ tin

cậy 95% b i ế t n ă n g suất lúa vùng đ i lượng ngẫu nhiên p h â n phối theo qui luật chuẩn

Giải: Gọi ụ suất lúa trung bình tồn vùng Ta cần ước

lượng f i v i độ tin cậy 95%

X đại lượng ngẫu nhiên biểu thị suất lúa vùng X phân

phối theo quí luật chuẩn với kỳ vọng toán | i phương sai ơ2 chưa b i ế t

Áp dụng công thức (7.10) ta có khoảng tin cậy ụ là:

V n

Với độ tin cậy Ì - oe = 95% bậc tự (n-L) = 99 tra bảng ta phụ lục (hoặc dùng h m TINV Excel) la được:

(156)

lịiáo trì nít Ị lị thuyết xác tuất gà thối tạ kè toán

t a = to,05 =TINV(0.05,99) = 1,984 Theo số liệu toán ta có: X = 46 ; s = 3,3

nên:

e = , ^ = , Vậy khoảng tin cậy 1-1 là:

(46 - 0,65472 ; 46 + 0,65472) Hay:

(45,345 < ụ < 46,655) tạ/ha

Thí dụ 2: Theo dõi mức ngun liệu hao phí để sản xuất mót đơn vị

sản phẩm người ta thu số l i ệ u cho bảng sau: Mức ng/1 hao phí - Xi (gr) Sơ sản phẩm

19,0 - 19,5

19,6 - 20,0 10

20,1 - 20,5

20,6 - 21,0

Ước lượng mức hao phí n g u y ê n l i ệ u trung bình mức cao để sản xuất đơn vị sản phẩm với độ tin cậy Ì- a = 98% ? Giả thiết

mức hao phí nguyên liệu để sản xuất đơn vị sản phẩm đại lượng ngẫu nhiên phân phối theo qui luật chuẩn

Giải: Gọi X mức nguyên liệu hao phí để sản xuất đơn vị sản

p h m Theo giả thiêt X ~ N(f.i, ) với | i mức n g u y ê n liệu hao phí trung binh đ ể sản xuất đơn vị sản phẩm Ta cần ước lượng giá trị t ố i đa ụ với độ tin cậy 98%

(157)

Qhướtig 7: (lùte Itáđng eáe íố đăă trưng, eàa tơ nợ thể

T số l i ệ u cho, ta tính được: x = 20,116 ; s = 0,461365 Với độ tin cậy Ì- a = 98% , tra bảng phân phối- Student với bậc tự dờ n - Ì = 25 - Ì = 24 ta được: t2 a = to.04 = 2,1715

Giá trị tối đa ịi\ằ:

X + t2 a = = , 1 + 2T1 50 , 4^ Ỉ = 2031637 gr Vrt V25

3- ựởc lượng tỷ lệ tổng thể

Giả sử tổng thể ta nghiên cứu gồm N phần tử Trong có M phần tử có tính chất A p = — tỷ lệ phân tử có tính

chất A tổng thể Thông thường p chưa biết, cần ước lượng p Để

ý p xát suất đ ể lấy phần tử có tính chất A l ấ y ngẫu nhiên từ tổng thể phần tử , n ê n toán toán ước lượng tỷ l ệ tổng thể (hay ước lượng xác suất)

Gọi X số phần tử có tính chất A lấy ngẫu nhiên phần tử

từ tổng thể X đ i lượng ngẫu nhiên có luật phân phối x c suất sau:

X

p q p

E ( X ) = p ; Var(X) = pq Gọi Xi (i = Ì, 2, n) số phần tử có tính chất Ạ có lần

lấy thứ i C c đ i lượng ngẫu nhiên Xi có p h â n phối x c suất giống X

Ị n

Xét đ i lượng ngẫu nhiên: Fn = X X -l lỷ !ệ m^ u ns ẫ u nhiên n i=i

(158)

cịiáo trình tụ thuyết xịe tuất thốn// kẻ tốn

Ta có t h ể chứng minh được: E ( Fn) = p ; V a r ( Fn) = pq

n Theo định lý Lindcberg - Levy, đ i lượng ngẫu nhiên: z= F" p

có phân phối xấp xỉ N(0, 1)

Vì la tìm giá trị za thỏa mãn điều kiện: p(Ịz|<0=l-a

Thay biểu thức z xác định theo (7.13) vào (7.14) ta được:

(7.13

(7.14

(F„ - P ) V ^

= l - a V P ( Ỉ - P )

(7.15) c>p[n(Fn -p)2 <(p-p2)zij=l-ct

o p[(n + z*)p2 -(2nF„ +z^)p + n(Fn)2J= 1-a oP(p, <p<p2) = l-a

Trong đó:

(7.1Í

p =

n Fn + 0,5z> - zaV n F n( l - Fn ) + 0,25z •N n + z

>

Vi =

n Fn + , z ^+zaV n Fn( l - Fn) + 0,25z*

(7.1«

(159)

ggggỊMg 7: (lùừe íưưnợ ếe đặe ÍMúiíị eủm tổng thể

N ế u có m ẫ u cụ th ể ta tính dược giá trị P i P2, ký h i ệ u c c j i trị tương ứng pt pz T ta có khoảng tin cậy đ ố i

xứng p là:

( P t < p < p2) Việe áp đọng công thức (7.16) phức tạp cho phép tìm

khoảng tin cậy đổi xứng p D o n ế u có t h ể đ i ề u a m ộ t m ẫ u có kích thước n lớn (n > ỉ00) thống k ê :

có p h â n phối xấp xỉ N(0, 1)

Vì vậy, với độ tin cậy (Ì- a) cho trước ta tìm giá trị za

thỏa m ã n d i ề u k i ệ n :

Thay b i ể u thức z x c định theo (7.17) vào (7.18) ta được:

z = (7.17)

(7.18)

p [ ( Fn- p ) V ^

<za = l - c t (7.19)

Sau số p h é p b i ế n đ ổ i tương đường v i b i ể u thức ngoặc (7.19), ta được:

vớ i mẫu cụ thể ta có khoảng tin cậy đối xứng p là:

(160)

(ịìáfr trình hị thuyết xịe DÙ thấu kè toán

f ± z a ĩ { - (7.20)

Trong í" ly lệ phần lử có tính chất A mẫu cụ thể (cũng m ộ t giá trị Fn) ;

• Khoảng tin cậy bên phải:

( r - * * , J í Ẹ * : + « ) OM

Khoảng tin cậy (7.21) dùng đ ế ước lượng giá trị thiêu p

• Khoảng tin cậy bên trái

( _ „ ; f + Z a i p E £ > ) (7.22,

Khoảng tin cậy (7.22) dùng để ước lượng giá trị tối đa p

Thí dụ 1: Kiểm tra ngẫu nhiên 400 sản phẩm máy sản xuất

thấy có 20 p h ế phẩm V i độ tin cậy 95% h ã y ước lượng tỷ l ệ phế phẩm t ố i đa m y đ ó

Giải: Gụi p tỷ lệ phế phẩm máy nì V trì cần ước lượng giá trị

t ố i đa p v i độ tin cậy 95% Đ â y bai loan ước lượng lý l ệ lổng thể khoảng tin cậy b ê n trái v i kích thước m ẫ u n = 400 Khoảng tin cậy p đ ợ A c định theo công thức:

( _ „ ; f + í a J Í ( l _ í ) )

V i độ tin cậy Ì - a = 95% thi z2n = Z(,,1 = 1.645;

20

(161)

ẽku&ttợ 7: (lừa lư&ttg đác tố đặe trưng, tẨềtạ títể

V ậ y khoảng tin cậy t ố i đa p là:

í ' n n c 0,05(1^0,05) \

( - 0 ; 0,05 + 1,645 — - )

v V 400 •

Hay:

p < 0,0679

Tức tỷ l ệ p h ế phẩm t ố i đa m y 6,79%

Thí du 2: Nghiên cứu nhu câu tiêu dùng loại hàng

thành phố, người ta t i ế n h n h đ i ề u tra nhu cầu tiêu dùng v ề m ặ t h n g n y 100 gia đình thấy có 60 gia đình có nhu cầu v ề l o i h n g H ã y ước lượng tỷ l ệ gia đình có nhu cầu mặt h n g tồn thành p h ố v i độ tin cậy 95% ?

Giải: Gọi tỷ lệ gia đình có nhu cầu mặt hàng p (p chưa

b i ế t ) Ta cầ n ước lượng p v i đ ộ tin cậy 95%

Đây b i tốn tìm khoảng tin cậy đơi xứng tỷ l ệ tổng thể Theo giả thiết tốn ta có:

Tỷ lệ gia đình có nhu cầu mặt hàng mẫu cụ thể là: 60

Với độ tin cậy Ì - a = 0,95 i> za,= 1,96

A i

lõi

1,96 < p

, ( - , )

1 100 = ,

V ậ y khoảng tin cậy đ ố i xứng p (với đ ộ tin cậy 95%) là: (0,6 - 0,096 ; 0,6 + 0,096)

Hay:

(162)

ẨẬiảv trình lý thuyết x thống, kê tốn

Nếu sử dụng cơng thức (7.16) kết là:

_ , x l 0 + 0,5(l,96)2 - , ^ ^ ( , )2 + , x , x 0

P l ~ 100 + (1,96)2 ~

= 0,502

_ , x i 0 + 0,5(1,96)2 + l , V o , ( l , )2 + , x , x 0 " 0 + (1,96)2

= 0,6906 V ậ y :

(50,2% < p < 69,06%)

Ta thấy k ế t hai c c h ưnh c h ê n h l ệ c h k h ô n g đ n g k ể

4 - ước lượng phương sai tổng thể

Giả sử đ i lượng ngẫu n h i ê n X p h â n phối theo qui luật ehuẩn, chưa b i ế t phương sai cua c ầ n ước lượng V a r ( X ) v i đ ộ tin cậy Ì - a

T X lập m ẫ u ngẫu n h i ê n Wx = ( X i , x2 - Xn) x é t trường hợp sau đ â y :

4.1- Đã biết kỳ vọng toán E(X) = ỊJ

2 » ( X i - l i )2 X é t đ i lượng ngẫu nhiên: X - 2li ĩ

1=1 ơ"

N g i ta chứng minh X p h â n p h ố i theo qui l u ậ t "Chi bình p h n g " v i n bậc tự N ê n v i x c suất a b é ta tìm hai số xì lĩ XỈ-o/2 cho:

(163)

@itương 7: (fỉởe lương eáe Ằố đăe trtếitụ c ủ a téửiỢ- thể

P(X2>X2a/2) = a/2 vàP(xỉ>xL/2) = l-a/2

Để tìm xin XỈ-a/2 ta tra bảng phần phụ lục (bảng xầ) d ù n g h m CHIINV Excel

Chẳng hạn, v i độ tin cậy Ì- (X = 95% (tức a = 0,05) bậc tự 46 thì:

xin = XỈ,025=CHIINV(0.025,46) = 66,616468 xlan = XỈ.97S - CHIINV{0.975,46) = 29,16

Thay biểu thức X v o (7.23) g i ả i ta được: Z ( X , - n ) a

Xã/2

< <

XĨ-o/2

(7.24)

V i m ẫ u cụ t h ể Wx = ( X i , x2, , x„) ta có t h ể tính được: I(Xi - ^I)2

2 từ (7.24) ta tìm khoảng tin cậy

Xa/2

< <

XĨ-a/2

(7.25)

Ta ý r ằ n g khoảng tin cậ y n y k h ô n g đ ố i xứng * Khoảng tin cậy bên phải

V Xa

+ 00 (7.26)

(164)

ịịiáo.tẹẬíth bị thuyết xác Mất thốềiq kê tốn

Xl-a

Í7.27)

4-2 Trường hợp chưa biết E(X)

VUA - « * K - ( n - l ) S2*

Xét đ i lượng ngẫu nhiên: X - ị

Người ta chứng minh rằn?: đ i l.ượng ngẫu n h i ê n n y phân phối theo qui luật "Chi bình phương " v i (n'=- 1) bậc tự

L ậ p l i bước tiên h n h trường hợp 4-1 ta tìm

khoảng tin cậy v i độ tin cậy Ì - oe là: ( n - l ) s2 , ( n - l ) s3

< < - — : Xa/2 x ĩ - a li

(7.28)

Thí dụ: Mứ c hao phí n g u y ê n l i ệ u cho mộ t đơn vị sản p h ẩ m đ i

lượng ngẫu nhiên X p h n phối theo qui luật chuẩn v i E(X) = 20 (gr) Quan sái 25 sản phẩm, ta có số l i ệ u cho bảng sau:

Trọng lượng na/1 hao phí (gr) 19,5 20,0 20,5

Sơ sản phẩm 18

V i độ tin cậy Ì - a = 95%, h ã y ước lượng Var(X)

Giải: Lập bảng tính sau:

X i ni (Xi - 20) (Xi - 20)2 n i C X i - )2

19,5 - , 0,25 1,25

20,0 ' 0

20,5 0,5 0,25 0,5

(165)

&íừớiiạ 7: (it&e Iưưitij ếe SẨ ităe trtiitạ tổng thể

Tra bảng ỵ1 với bậc tự n = 25 ta được:

XỈ-c/2 = XỈ.975 = 13'12 ; xin = XỈ.025 = 40,6465 Vậy khoảng tin cậy ơ2 là:

1,75 _2 1,75

< a <

40,6465 13,12 hay: (0,043054 < ơ2 < 0,133384) • Trong thí dụ trên, chưa biết E(X) = 20 ta tính s2 V i số l i ệ u cho, ta d ễ d n g tính s2 = 0,0692

#

Tra bảng "1 với bậc tự n -*• Ì = 24 ta được: xL/2 =xỉ,975 = 12,401 ; xiu =^Ỉ.M5 = 39,3641 Vậy khoảng tin cậy ơ2 uường hợp là:

hay (0,04219 < ơ2 < 0,133925)

24.(0,0692) 24.(0,0692)

39,3641 12,401

5- X c đ ị n h k í c h t h c m ẫ u

Ta thấy chất lượng ước lượng phản n h qua độ tin cậy (Ì - oe) độ x c E Đ ộ tin cậy độ x c cao ước lượng c n g tốt Nhưng độ x c s l i phụ thuộc v o kích thư^c mẫu (n) độ Ún cậy Ì - a v ấ n đ ề đặt là, ta muốn độ tin cậy Ì - ót đ ộ x c s đạt m ộ t mức đọ cho trước cần kích thước mẫu (n) t ố i thiểu ?

5.1- Xác định kích thước mẫu ước lượng trung bình tổng thể

2

a- N ế u biết Var(X) = , từ cơng thức: = za-ị=

V n

(166)

íịỉán trình iụ thuyết xịe thốuạ kè lồn

2 ơ2

ta suy ti = ( za) - - (7.29)

8

b- Nếu chưa biết ơ2 , ta vào mẫu cho (nếu chưa

có mẫu ta tiến hành lấy mẫu sơ với kích thước n i , Từ mẫu ta tính s ; với bậc tự nI - Ì , tra bảng p h â n phối Student (hoặc dùng hàm TINV) đ ể lìm ta T x c định kích thước mẫu (n) theo công thức:"

s2

n = (ta) (7.30)

8

* Chú ý: N ế u toán thực t ế đòi h ỏ i n phải số n g u y ê n mà tính n theo công thức (7.29) (7.30) ta l i n số khơng ngun ta lấy phần nguyên cộng v i

5.2- Xác định kích thước mẫu ước lượng tỷ lệ tổng thể

T công thức:

£ - za ta suy ra:

!f ( l - f ) n

/ x2 f ( l - f )

n = ( z „ r v (7.31)

£

* Chú ý: Đ e có f thay v o cơng thức (7.31) ta dùng mẫu cho mẫu điều tra sơ lần đ ầ u với kích thước ni > 100 đ ể tính ĩ

6- Xác định độ tin cậy

Khi ước lượng số đặc trưng tổng thể c c số l i ệ u quan sát mẫu có kích thước n, ta muốn độ x c (e) đại mức thi độ tin cậy ( - a ) bao n h i ê u ?

(167)

& Ị ươi Ị Ị/ 7: (Ịtức Ịưựnạ etíe lố đặc trưng càu tổ MỊ

b- N ế u b i ế t Var(X) = , từ g thức:

ơ

£ = za Ị— V n ta suy

Za= ^ (7.32)

ơ

Sau xác định za la suy độ tin cậy Ì - a (tra bảng dùng h m NORMSDIST)

b- Nếu chưa biết ơ2 , la vào rriSu cho (nếu chưa

có m ẫ u ta tiến hành lấy mẫu sơ kích thước ni đ ể tính s T x c định ta theo cơng thức:

e v n

ta = — (7.33) s

R i suy tiếp độ tin cậy Ì - a (tra bảng dùng h m TDIST)

6.2- Xác định độ tin cậy ước lượng tỷ lệ tổng thể

T c ô n g thức:

E = Za

f f ( l - f ) n ta suy ra:

e v n

2 u = r — — (7.34)

Như vậy, tham số: n ; ; za (hay Ì - a) ; ta biết

hai tham số tính tham số cịn l i (cơng thức tính bạn đọc suy từ cơng thức tính e ironiỉ tốn ước lượng B ế t )

(168)

íịỉá& trình bị thuyết xịe íhốểiợ kè tơán

C h n g

KIỂM ĐỊNH GIẢ THIẾT THONG KÊ

I Các khái niệm Ì- Giả thiết thống kê

Giả thiết thốni> kê giả thiết nói tham số, dạng qui

luật p h â n phối; tính độc lập cửa cỉại lượng ngẫu nhiên Việc tìm kết luận bác bỏ hay chấp nhận giả thiết gọi

kiểm định iịiả thiết thốníỊ kè

Kiểm định giả thiết thống k.ê toán thống kê tốn

Thí dự ỉ: Trọng báo cáo nói rằng: suâựúa ưung bình

linh \ năm 2001 6,8 tân/ha ta coi giả thiết thống kê, giả thiết nói tham số (kỳ vọng tốn) cùa đại lượng ngẫu nhiên biểu thị suất lúa tỉnh Dựa vào số liệu mẫu điều ưa suất lúa tỉnh qui lặc kiểm định (sẽ nêu phần sau) đ ể đưa kết luận bác bỏ hay chấp! nhận giả thiết

Thí dụ 2: Người bán cho tỷ lệ sản phẩm loại li lô hàng

10%, ta coi giả thiết thống k ê Giả thiết nói tham số (kỳ vọng tốn) đ i lượng ngẫu nhiên X- số sản phẩm loai l i có sán phẩm chọn ngẫu nhiên từ lơ hàng Bên mua tiến hành lấy mẫu đ ể " k i ể m tra" điều mà bên bán khẳng đinh xem có hay không, t h ế lức b ê n mua hàng l i ế n hanh k i ể m định 2,'ìẪ thiết t h ố nơ k ê

(169)

@ltươnạ 8: Xiểm đinh già thiết thếiiụ kè Cách đặt giả thiết thống kê:

Ta có cách để chứng minh chân lý, nghĩa có cách để thuyết phục ngư i c thấy dược châ n lý Ví dụ: Chân lý Ạ * B -và điều mà người, nghiên cứu

m u ô n chứng minh

Cách thứ nhất: Đưa giả thiết: A * B tìm kiện để chứng

tỏ giả thiết đúng, phù hợp (tức có ý đề nghị người k h c chấp nhận giả thiết đó)

Cách thứ hai: Đưa giả thiết là: A = B tìm kiện để chứng

tỏ giả thiết không phù hợp ta bác bỏ giả thiết (tức ìà có ý đ ề nghị người k h c chấp nhận A 5* B)

Vây chân lý, ta đưa giả thiết Vậy cách hợp lý ?

Thống kê toán sử dụng phương pháp qui nạp, nghĩa tà từ trường

hợp cá biệt (mẫu) đ ể suy trường hợp tổng quát (tổng thể), cách dùng d ữ k i ệ n m ẫ u đ ể chứng minh giả thiết tổng thể Khi kiện phù hợp với giả thiết điều khơng sở để

thuyết phục chấp nhận giả thiết d ữ liệ u phù hợp vớ i gi ả thiết n y , đồng thời phù hợp vớ i giả thiết k h c Cho n ê n k h i hì k i ệ n phù hợp vớ i gi ả thiết ta chưa chứng minh giả thiết

là đún g mộ t h chắn

Còn kiện khơng phù hợp với íĩả thiết điều chắn lạ sở đ ể bác bỏ giả thiết

• Hơn nữa, giả thiết đù lì ti phù hợp

với thực tiễn K h i có chứng rút l thực tiễn thấy không phù hợp ta k ế t luận nia thiết khơng

(170)

éý/áo trình tý thuyết xịe Mất DÙ tltốttụ kê tốn

Trong thống kê toán, việc b c bỏ m ộ t giả thiết dựa v o x c suất xảy b i ế n c ố có liên quan đ ế n giả thiết M ộ i giả thiết có ửể x ả y v i xác suất nhỏ thực t ế già thiết đ ó k h ô n g đ ú n g , nên ta bác bỏ giả thiết

Dư.i vì;• ì !\ 'lịn, dặt giá thiết thống kê ta lưu ý số vàn de sau:

o Giả thiết đát với ý đồ hác bỏ mi, nehĩíi già thiết đặt

li • , uunu, m u ô n thuyết phúc Vì b c bỏ giả thiết có nghĩa ta chứng minh điều ngược l i

© Gia thiết đặt cho chấp nhận bác bỏ có tác dụng trả l i câu h ỏ i mà b i toán thực t ố đ ặ t © Giả thiết đặt ta xác định qui luật

p h â n phối x c suất đ i lượng ngẫu nhiên chọn làm liêu chuẩn k i ể m định

o Khi đặt giả thiết ta thường so sánh chưa biết với biết

" C i đ ã b i ế t " mà ta nói ỏ đ â y thường thôn g tin qu khứ, cấc định mức kinh t ế , kỹ thuật

© Giả thiết đặt thường mang nghĩa :"không khác nhau", " k h c mà khơng có ý nghĩa" "bằng nhau" Chẳng hạn, qua thực tiễn cơng tác ta có nhận xét mức thu nhập

bình quân dân cư thành p h ố cao ưước đây, giả sử ta biết thông tin thu nhập trung bình thành p h ố n ă m 1998 400 ngàn đ/người/tháng Khi đ ó la đặt giả thiết:

Thu nhập bình quân người thành phố 400

(171)

ũliườiHị 8: "Kiểm định già thiết thống kê

Giả thiết ta nêu nói vồ kỳ vọng tốn đ i lượng ngẫu nhiên b i ể u thị thu nhập người dân cư trú địa bàn thành p h ố Mức thu nhập bình quân người thành phố n y ta chưa biết, thu nhập trùn" bình người thành phố n ă m 1998 ihông tin khứ (đã biết) Giả thiết đặt gọi giả thiết cần kiểm định Giả thiết

cần k i ể m định cịn gọi giả thiết khơng (null hvpoihesis) ký hiệu Ho (hoặc H) M ộ t mệnh đề đ ố i lập với Ho gọi giả

thiết đổi ký h i ệ u H | (hoặc H )

Chẳng hạn:

Hụi = Gi.: H i : , * n

(0 hì mơi tham số đại lượng Iiíìẫu nhiên ta đan" nghiên cứu ; Go-JỊà giá-Ịf ị đ ậ i ú ố t )

Nếu kiểm định eiả thiết với ma Lluèi đối có dạng ÌĨỌ1

k i ể m định giả thiết hai phía (.VI miền hác bỏ năm '.* hại phía m i ề n chấp nhận)

Giả thiết đối dang: * 0() thường áp dụng la chưa biết rõ thực t ế tì > «u.hiỊi_n-.<Jo

Nhưng kinh nghiệm qua phân tích la biết

chiều hướng > 0() la có i h ể đ ặ t gi ả thiết đ ố i dạng: > 0(1 Hoặc ta biết được-chiều hướng < Go ta đặt giả thiết đ ố i dạng: < Bo

Thí dụ: Tỷ lệ phế phẩm nhà máy trước 5<7( Sau nhà

(172)

íịíảe trinh Ui thuyết xác íhốitợ, kê tốn

Ta đ ặ t p tỷ l ệ p h ế phẩm nhà m y sau p dụng công nghệ sản xuất (p chưa biết) Ta có tỷ l ệ p h ế phẩm mầu là: f = - Ì — = 04 (tức 4%) N h v â y ta thấy tỷ lê m ẫ u nhỏ hem 5% Mà

400

như ta biết, tỷ l ệ mẫu ước lượng đ i ể m tỷ l ệ tổng thể (p), t h ế p có xu hướng nhỏ hờn 5% M ặ t k h c la đ ề u b i ế t , thực t ế , nhà m y thay đ ổ i cồng nghệ sản xuấ t g nghệ sản xuất thường h i ệ n đ i hơn, t i ề n t i ế n v ề nhiều mặt Vì việc tỷ l ệ p h ế phẩm g i ả m hớn công nghệ cũ xu thố phổ biến thực t ế Do vậ y đ ể tra l i cho câ u h ỏ i bà i tốn , ta t i ế n h n h k i ể m định gi ả t h i ế t :

Ho: p = 0,05; với giả thiết đối Hi: p < 0,05

Khi kiểm định giả thiết này, ta bác bỏ Ho có nghĩa tỷ lệ

p h ế ph ẩ m nhà m y nà y thực đ ã g i ả m Ngược l i , He không bị b c bỏ ta chưa có sở đ ể khẳng định tỷ l ệ p h ế phẩm nhà m y g i ả m

Nếu kiểm định giả thiết với giả thiết đối có dạng: Hi: > Go;

H i : < Go; g ọ i k i ể m định giả thiết phía (vì m i ề n bác bỏ nằm v ề phía m i ề n chấp nhận)

Nếu giả thiết đối có dạng Hi: > Go; gọi kiểm định giả

t h i ế t v ề phiu bên phải ( v í m i ề n b c b ỏ n ằ m v ề p h í a b ê n phả i m i ề n chấp nhận)

Nếu giả thiết đối có dạng Hi: < Go; gọi kiểm định giả

t h i ế t v ề phía bên trái (vì m i ề n b c b ỏ n ằ m v ề phía b ê n trái m i ề n chấp nhận)

Nhiệm vụ lý thuyết kiểm định giả thiết thống kê là: thực

(173)

(Ệhưđnạ 8: 'Xiểm định í/iu thiết Úiổ4iQ.-kỀ 2-Mức ý n g h ĩ a , m i ề n b c b ỏ

C ó thể mô tả phương pháp k i ể m định giả thiết thống kê sau: Xuất phát từ yêu cầu toán thực tế, ta nêu giả thiết

Ho gi ả thiết đ ố i

Giả sử Ho đúng, từ tìm biến cố cổ xác suất đủ bé để

có thể tin biến cố xảy p h é p thử M u ố n vậy, từ mẫu ngẫu nhiên:

WX = (X,,X2, ,xn) ta chọn:

z = f ( X | X2, • • • , x „ , 0o) z chọn cho: Ho ta xác định qui luật

phân phối xác suất z với mẫu cụ thể ta tính giá l z Đ i lượng ngẫu nhiên z gọi liêu chuẩn k i ể m định giả thiết Ho

Do qui luật phâ n phố i xá c suất z b i ế t , n ê n với (X b é tùy ý ta có thệ tìm m i ề n wa cho P(Z e wa) = ót M i ề n wa gọi là miền bác bỗ giả thiết H() Trong thực t ế thường chọn a khoảng ( % ; 5%) a g ọ i mức ý nghĩa k i ể m định

Thực phép thử đ ố i với mẫu ngẫu nhiên wx, ta thu mẫu cụ thể wx = (X|, X i , xn) T mẫu cụ thể ta tính giá trị z (ký hiệu z) gọi giá trị thực nghiệm:

z = f(xi, x2) , x„, e0) •

N ế u ỉ e Wa ta bác bỏ giá thiết Ho thừa nhận Hi N ế u z Ể wa ta chấp nhận H(>

* Cần lưu ý là: nói "chấp nhận Ho" điều khơng có nghĩa giả thiết Ho mà có nghĩa với số l i ệ u mẫu la chưa

(174)

iịiúo trình uy t/tuyết xúc thốnạ Uế tốn

đủ sở (chưa đủ chứng) đ ể b c bỏ H() Trong thực hành tốt hơn n ê n nói rằng: "có thể chấp nhận Ho" "chưa vó sở để

bác bo Ho"

3- Sai lầm loại Ì sai lầm loại

Khi k i ể m định giả thiết thống k ê , có t h ể mắc phải hai loại sai l ầ m sau đây:

ít" Sai lầm loại 1: Là sai l ầ m mắc phải ta b c bỏ giả thiết

Ho thực t ế gi ả t h i ế t Ho

X c suất mắc phải sai l ầ m l o i mức ý nghĩa a Tức là: P(Z € wa) = a (Xác suất đ ể tiêu chuẩn z thuộc m i ề n b c bỏ wn n ế u gi ả thiết H().đúng) N ế u a c n g b é kh ả n ă n g phạ m phả i sai l ầ m loại Ì

b- Sai lầm loại 2: Là sai l ầ m mắc phải ta chấp nhận giả thiết

Ho thực t ế gi ả t h i ế t Ho sai

X c suất mắc phả i sai l m l o i x c suất đ ể z nhận giá trị không thuộc m i ề n bác bỏ w a Ho sai (tức H i đúng) N ế u ký hiệu xác suất mắc phải sai l ầ m loại ị3 thì:

|3 = P(ZẾ Wa/H,) (8.1)

Khi biến cố không mắc sai lầm loại biến cố để z nhận giá

trị thuộc m i ề n bác bỏ ta b c bỏ Ho thực t ế H i Ta ký hiệu biến cố (Z Wa/ H | )

Biến cố đối lập với biến cố (Z £ Wa/H|) nên xác suất là:

(175)

@jrggỊgg Si Xiểm đinh giả thiết tltổnụ kê

1-P gọi lực k i ể m định giả thiết H() Nó xác suất " k h n g mắc sai l ầ m loại 2" p nhỏ lực kiểm.định c n g lớn

C c trường hợp xảy tiến hành k i ể m định giả thiết thống k ê tóm tắt dạng bảng sau:

—^Tình K ế t luận

Ho Ho sai

B c bỏ Sai l ầ m loại (xác suất = a)

K ế t luận đún g (xác suất = 1-P) Chấp nhận K ế t luận

(xác suất = 1-a)

Sai l ầ m loại (xác suất = Ị3) Cả hai loại sai l ầ m đ ề u gây tác hại Chẳng hạn:

+ Chấp nhận lô hàng xấu từ chối lô hàng tốt tai h i

+ Cho đậu thí sinh yếu (mà phải rớt)

cho rớt thí sinh g i ỏ i (mà đáng l ẽ phải đậu) sai l ầ m tai h i

Dĩ nhiên ta cố gắng hạn chế sai lầm, hạ thấp xác suất mắc

phải sai l ầ m Nhưng ta muốn g i ả m xác suất sai l ầ m loại Ì l m l ă n g xá c suất sai l ầ m l o i ngược l i Chẳng hạn n ế u l ấ y a = không bác bỏ giả thiết nào, k ể giả thiết sai, {3 đ t cực đ i

Có cách khống chế khả mắc phải sai lầm:

Cách thứ nhất: Ta ấn định trước mức xác suất sai lầm loại ì sai

lầm loại r i tính tốn tìm mẫu có kích thước nhỏ ứng với

(176)

4ịiáo trúitt tụ thuyết xác Mất lùi tiiíùiQ kè tơá/1

Cách thứ hai: Ta ấn định trước xác suất sai l ầ m loại Ì (lức cho

trước mức ý nghĩa oe) chọn m i ề n bác bỏ w a cho có xác suất sai l ầ m loại nhỏ hay lực k i ể m định lớn tức cần tìm miền b c bỏ w a thỏa m ã n điều k i ệ n sau:

P(Z e Wn/H()) = oe cho trước P(Z e Wa/H|) = Ì - p lớn

Dựa vào định lý Neyman - Pearson trình bày tài

l i ệ u đầy đủ hớn tìm m i ề n b c bỏ "tốt nhất"

Các miền hác bỏ wa giáo trình thỏa mãn điều kiện nêu

trên, tức đ ề u m i ề n b c bỏ "tốt nhất" với mức ý nghĨ£ kích thước mẫu xá c định trước

Việc chọn mức ý nghĩa CC tùy thuộc vào

trường bợp cụ thể hậu mà sai l ầ m Ì lại Ì sai l ầ m loại mang l i

Cần lưu ý rằng: bác bỏ hay chấp nhận giả thiết tùy thuộc vào

giá trị thực nghiệm tiêu chuẩn z mức ý nghĩa a Kiểm định

giả thiết thống kê qui tắc giúp ta kết luận vấn đề của toán thực tế đặt cho kết luận có khả mắc phái sai lầm nhỏ (ở mức đủ) phép chứng minh lồgỉc mệnh đề

li- Kiểm định giả thiết trung bình tổng thể

(177)

Wtưư«ạ 8:DCiểm định giả thiết thống, kê

Ho: ụ = m„ với gia thiết đ ố i H , : ịi * m0 (mo giá trị biết đặt gia thiêt Ho)

Để kiểm định giả thiết ta tiến hành lấy mẫu với kích thức n xét trường hợp sau:

2

ì - T r n g h ợ p G đ ã b i ế t Trường hợp ta chọn thống kê: z =

jj-ơ / V n làm tiêu chuẩn k i ể m địfth

Nếu giả thiết Ho đùng z ~ N(0, 1)

yới mức ý nghĩa a, chọn miền bác bỏ giả thiết Ho: Wot = {z:|z|>z(>}

Trong za giá trị z ~ N(0, 1) thoa mãn: P(|z|>za) = a

Trên đồ thị, miền bác bỏ wa minh họa sau:

/CUI

T«,',.^lw.,'.,-.^'

-<x

M i ề n b c bỏ

0

M i ề n chấp nhận M i ê n b c bỏ - >

(178)

íậiảti trình ít/ thuyết xác suất thống, kè tốn

Ta có:

P ( Z e wa) = P(l z I > za) = P ( z < - za) + P ( z > za) = a/2 + a/2 = a

Như xác suất để giá trị z rơi vào miền bác bỏ a, tức xác

suất đ ể z rơi vào m i ề n chấp nhận ì-OI Vì Gt nhỏ, nên xác suất đ ể z rơi v o m i ề n chấp nhận lớn Nghĩa là: giả thiết Ho coi hầu hết giá trị z rơi v o miền chấp nhận Còn giá trị z rơi v o m i ề n bác bỏ có nghĩa ta tìm "bằng chứng" đ ể chứng tỏ giả thiết Ho khơng t h ế ta b c bỏ giả thiết

Từ ta có quiìắc định tiến hành kiểm định giả thiết Ho trường hợp nà y nh sau:

• Lấy mẫu có kích thước n, từ mẫu cụ thể tính

ơ (Trong X trung bình mẫu) • Với mức ý nghĩa oe cho trước , xác định za

(bằng cách tra bảng phần phụ lục dùng hàm NORMSINV Excel)

• Nếu I z I > za Tức zeWa bác bỏ giả thiết Ho, chấp nhận H ,

• N ế u I z l < za Tức Z Ể W Ơ chấp nhận giả thiết tìị) Từ việc chấp nhận (hay bác bỏ) Ho la suy kết luận cuối

theo yêu cầu tốn thực tế

Thí dụ ỉ: Nếu máy đóng bao làm việc binh thường trọng lượng

(179)

Giường 8: "Kiểm định t/iả thiết thống, kè

luật chuẩn với kỳ vọng toán 100 gr độ lệch chuẩn = Qua thời gian sản xuất, người ta nghi ngờ trọng lượng trung bình l o i sản phẩm thay đ ổ i C â n thử 100 sản phẩm tính

X = 100,3 gr

V i mức ý nghĩa a = 0,05 k ế t luận điều nghi ngờ có hay khơng (giả thiết độ lệch chuẩn không thay đổi)

Giải: Gọi X trọng lượng thực tế loại sản phẩm

khoảng thời gian xét Theo eiả thiết X ~ N(fA, ơ2) ụ trọng lượng trung bình thực t ế loại sản phẩm m y đóng bao sản xuất khoảng thời gian xét (trung bình tổng thể), ụ chưa b i ế l = ] Đ ặ t giả thiết:

Ho: n= 100; Hi: ịi* 100

Đ ể k i ể m định giả thiết ta áp dụng qui tắc k i ể m định nêu [vì X ~ N(n, ơ2) biết]

Ì

V i mức ý nghĩa a = 0,05 tra bảng ta Z(),()5 = 1,96 Vì I z I = > Z().()5 = 1,96 nên ta bác bỏ giả thiết Ho Tức điều nghi

ngờ đúng, trọng lượng trung bình loại sản phẩm khác 100 gr thực

Chùy:

• Nếu k i ể m định giả thiết H( ): ụ = m( ); giả thiết đ ố i H, : ịx > mo với mức ý nghĩa a chọn m i ề n bác bỏ giả thiết Ho là:

Ị x-m0 ì

wa = { z = - — ^ : z > z a } / V n

(180)

iịiủa trình lý (huyết xáe tui t/iấtiạ kè toán

P( I Z | > z2 o t) = 2<x

Trên đồ thị, miền bác bỏ wa trường hợp minh họa sau:

• N ế u k i ể m định giả thiết Ho: ụ = m0; giả thiết đ ố i H i : ụ< nhì với mức ý nghĩa a chọn m i ề n bác bỏ giả thiết Ho là:

wa = ị z = x— : z < -z2a}

ơ i V n

Trên đồ thị, miền bác bỏ wa trường hợp minh họa sau:

(181)

(thương S: TCièm định giũ thiết lliốiu/ Ui

Ta l ỏ m lắt loại giả thi ỐI m i ề n hác bỏ lư.'' :'p : tron" n ường hợp ba na bảne sau:

Giá thiết M i ề n b c hò Ho; ụ = ni,,

H,: Ị-I < nin W a = { = l Z E » : Z < - Z2 ( I} / V n

Hi,: |A = ni,,

H,: (.L > in,, W a = { z = ^ : > Z u } / v n

Hi,: Ị I = m„

H i : ụ * in,, W a = { z = ^ > : | Z | > 2U} / v n

2- T r n g h ợ p c h a b i ế t Trường hợp chọn:

s

làm tiêu chuẩn k i ể m định N ế u Ho T phàn phối theo qui luật Studcnt với n-1 bậc l ự

Miền bác bỏ trường hợp tùy thuộc vào già thiết đối tóm tắt bảng sau:

Giả thiết M i ề n b c bỏ H0: ụ = mo

H|.- ụ< m„ W a = { t = ^ L : t < - t < r > } s / V n

H„: ụ = niu

H,: ịx > mu v v0 = { t = i ^ : t > t < r } s / v n

H„: ụ = mo

(182)

(ảiíw trình Ui thuyết x UI tít ỉ/iốiự/ Ui toán

t,n " giá trị ĐLNN T ~ T(n-l) thỏa mãn điều kiện:

t(n_l)(viết tắt ta) xác định cách tra bảng phân phối

Studcnt với bậc tự n - d ù n g h m TINV Excel

Ta minh họa m i ề n bác bỏ với c c dạng giả thiết đ ố i khác đồ thị sau:

N ế u k i ể m định gi ả t h i ế t hai phía, tức gi ả t h i ế t đ ố i có dạng: H i : IU* mu

thì m i ề n bác bỏ wa minh họa đồ thị sau:

M i ề n -ta ta M i ề n t

b c bỏ M i ề n chấp nhận b c bỏ

< < •>

M i ề n chấp nhận

> ị >

N ế u k i ể m định cui t h i ế t mộ t phía vớ i gi ả t h i ế t đ ố i có dạng: ri,: ịi> mo

(183)

@ittiơittỊ 8: TKiếm điitli ijiả thiết thống, Uè

N ế u k i ể m định nia thiết mộ t phía vớ i £Ìả thiết đ ố i có dạng: H I : Ị.K nin

thì m i ề n b c bỏ wư minh họa đồ thị sau:

M Í C H -t?u bác bỏ

<-M i ề n chấp nhận

>

Thí dụ 2: Trọng lượníĩ bao gạo m y đóng bao sản

xuất đ i lượng Iiiiẫu nhiên phân phối theo qui luật chuẩn với trọng lượng trung bình qui định 50 kg Đ ể xem máy đóng bao làm việc có bình thường khơng (theo niỉhĩa máy sản xuất bao gạo có trọng lượng truníi bình đúníi qui định khơng), người ta cân thử 25 bao tính được:

X = 49,52 kg ; 0,5

V i mức ý 11»hiu a = 0,01, cho k ế t luận tình hình làm việc máy đóng bao ?

Giải: Gọi f.L trọng lượng trung bình thực tế bao gạo

máy sản xuất (|A chưa biết) Đ ặ t giả thiết: Ho: n = 50 ; Hi: 1-1*50

do chưa biết nên ta áp dụng qui tắc kiêm định sau: (49,52-50)

Tính:

0,5 '25 = - ,

(184)

íịiáo trình lự títui/ết xáe í/tốnạ kế tơtúi

Vì í t I > 797 Tức teWa nên ta bác bỏ giả thiết H() Tức máy

đ ó n g bao l m việc khơng bình thường Nói cụ thể hơn, m y sản xuất bao gạo có trọng lượng trung bình t h p trọng lưựns trung bình qui định (vì # = 49,52 < 50)

3- Giá trị xác suất (p-value) kiểm định

Thủ tục k i ể m định trình b y có tính chất u y ề n thống theo cách tiếp cận cổ đ i ể n Trong n ă m gần đ â y nhiều nhà n g h i ê n cứu thường sử dụng mộ t h t i ế p cận k h c Thay kiểm định giả thiết với m ộ i giá trị a định trước họ cho ta nên định rõ giả thiết Hu H i , sau thu thập số l i ệ u mẫu tính giá trị tiêu chuẩn k i ể m định T x c định xác suất mắc phải sai l ầ m l o i Ì n ế u ta bác bo giả thiết Ho X c suất thường ỈĨỌÌ giá trị p (p-value) k i ể m định

(.'hunổ ta minh họa cách tính p-value qua Ihí dụ sau:

Thí dụ: Trong lương sà xuất chuồng đại lượng

ngẫu nhiên phân phối theo qui luật chuẩn với độ lệch chuẩn 0,32 Trước trọng lượng trung bình xuất chuồn? m ộ i gà li l i chăn nuôi 3,4 kg N ă m người người la p dụng thử môi phướng p h p chăn nuôi Sau thời iĩian p dụng thử người ta chọn ngẫu nhiên 50 đ e m cân tính trọng lượn" trùn" bình 3,5 kg Hãy cho biết phương p h p chăn ni có tác dụng làm lăng trone lương gà xuất chuồn" hay khôniỉ? I a) Hãy xác định p-value kiểm định?

(h) p-value thay đ ổ i t h ế n o trung bình mẫu khơng phải 3,5 kg mà 3,6 kg?

Giải: (a) Gọi |i trọng lượng gà xuất chuồne sau áp

(185)

thương 8: Xiểm định ỊỊÌÙ thiết ỊhổỊiạ kê

Đ â y toán k i ể m định giả thiết irung hình tổng thể (giả t h i ế t mộ t phía) b i ế t

Từ giả thiết tốn ta tính giá trị tiêu chuẩn k i ể m định:

( x - m0) V ^ ( , - , ) V Õ z = = —— = Z,11

ơ 0,32

p-value k i ể m định (tức xác suất mắc phải sai l ầ m loại Ì la b c b ỏ gi ả t h i ế t Ho) là: P(Z > 2,21)

Để tính xác suất ta dùng bảng za dùng hàm NORMSDIST

Ta có:

p-value = P(Z > 2,21) =1-NORMSDIST(2.21) = 0,01355

Ta minh họa giá trị p-value đồ thị sau:

/ \ p-value = 0,01355

; •>•'.:.-ri ^

0 2,21 z

Nỉùr với mẫu nêu thí dụ này, ta bác bỏ giả thiết Ho,

tức cho việc p dựng phương pháp chăn ni có tác dụng làm tăng trọng lượng trung bình gà xuất chuồng mắc phai sai lam l o i Ì 0,01355 (hay 1,355%)

(186)

íịiátì trình ti/ thuyết xác DÙ íltốnụ Ui' toán

( x - m0) V ^ _ ( , - , ) V Õ

z = = : = 4,4 l y

à 0,32

Khi la có:

p-value = P(Z > 4,419) =1-NORMSDIST(4.419) = 4.962E-06 4.962E-06 = 4.962X lo-6 = 0,000004962 < 0,00001

Tức p-value tương ứng v i z = 4,419 nhỏ

Như p-value càn? nhỏ mức độ khẳng định mẫu việc

bác bỏ Ho rõ r ệ t hơn, nói cách khác ỉĩiả thiết Ho k é m tin cậy Chẳng hạn p \alue = 0,01 cho thấy mức độ khẳng định để bác bỏ giả thiết Ho rõ r n ? so với giá trị p-value = 0,1 p-value kiêm định phía (phía bên phải)

N ế u k i ể m định gi ả thiết v ề phía b ê n trái k i ể m định gi ả thiết hai phía ta tìm giá trị p-value tương ứng

Cơng thức tính p-value cho kiểm định giả thiết trung bình "tổng thể sau:

a- Trường hợp biết ơ\

• Nếu H,: ụ > m„ thì:

p-value = p ( z > z) (8.4) • Nếu Hi: Í-K m0 thì:

p-value = p ( z < ì) (8.5) • Nếu Hi: ụ.* TĨU) thì:

p-value = P( z > I z I) (8.6)

b- Trưởng hợp chưa biết (ỷ

(187)

@liứưii<j 8: 3Qếiti đỉnh giả thiết tìtống kè

p-value = P(T > t) (8.7)

• N ế u H i : Ị.K m0 thì:

p-value = P(T t) (8.8)

• N ế u H i : ịx * m0 thì:

p-value = p( T > I t I) (8.9) Trong thực tế, việc k i ể m định giả thiết theo p-value thường t i ế n h n h theo n g u y ê n tắc sau:

Nếu p-value > 0,1 thường người ta thừa nhân Ho

N ế u 0,05 < p-value < 0,1 cần càn nhắc cẩn thận trước kh i b c bỏ Ho

N ế u 0,01 < p-value < 0,05 n g h i ê n g hướng bá c bỏ Ho n h i ề u

- N ế u 0,001 < p-value < 0,01 băn khoă n bá c bỏ Ho N ế u p-value < 0,001 có th ể hồ n tồn y ê n tâ m bá c bỏ

* M ặ t khác, quy định trước mức ý nghĩa a dùng p-value đ ể k ế t luận theo a Khi nguyên tắc k i ể m định sau:

N ế u p-value < cc b c bỏ Ho thừa nhận H | N ế u p-value > oe chưa có sở đ ể b c bỏ Ho Theo cách kiểm định việc sử dụng p-value lại kiểm định theo cách tiếp cận truyền thống

Thí dụ: Nếu máy đóng bao làm việc bình thườn2 (hì trọng lượng

bao gạo dồ máy đóng bao sản xuât đ i lương ngẫu nhiên p h â n phối theo qui luật chuẩn với trọng lượng trung bình 50 kg N í h i ngờ bao gạo m y sản xuât không đủ trọng lượng qui định, người ta cân thử 25 bao tính x = 49,68 kg s = u,r lây cho kết luận đ i ề u nghi ngờ trên?

(188)

tụ tát) trình lý thuyết xác lùi thống kê toán Giải: Gọi X trụng lượng bao gạo máy đóng bao sản xuất

X ~ N(f.i, ơ2) Ta cần k i ể m định giả thiết: Ho; ịí = 50; với giả thiết đối Hi: ụ < 50

Đây loàn kiểm định giả thiết trung bình tổng thể, ơ2 chửa b i ế t khô nơ qui định trước mức ý nghĩa oe

Để kiểm định giả thiết trên, trước hết ta tính: (x-m0)V^ _ (49,68-50)725 _

t — : — ~~>*L

s 0,5

Theo côn g thức (8.8) ta có : p-value = P(T < t) = P(T < -3,2)

Ta có:

P(T < -3,2) = P(T > 3,2) =TDIST(3.2, 24,1) = 0,00192 Như 0,001 < p-value < 0,01 nên ta băn khoăn bác bỏ giả

thiết Ho, tức có th ể k ế t luậ n m y đ ó n g bao sản xuâ t cá c bao gạo có trọng lượng trung binh thấp hdn 50 kg

* Chú ý: Nếu thí dụ ta cho trước mức ý nghĩa a (chẳng hạn ta cho a = 0,01) theo k ế t tính p-value ta thấy:

p-valuc = 0,00192 < 0,01

nên ta bác bỏ Ho Như ta đ ế n k ế t luận

4- Tính xác suất sai lầm loại

Ta lính giá trị p xác V- M mắc phải sai l ầ m loại Ti ó lại thi du lương cùa ga xuất Chuồng nêu ỏ phần

(189)

@lntƠ4UỊ S: DCiểnt đinh t/iti thiết thổn lị hè

•H„: H = 3,4;H,: n>3,4

Ta thấy xác suất để thừa nhận giả thiết sai Ho phụ thuộc vào

việc giá trị thực ị.1 sai lệch nhiều hay so với 3,4 Chẳng hạn n ế u giá trị thực ụ 3,6 p nhỏ trường hợp giá trị thực của ụ 3,45 V ậ y tùy thuộc v o giá trị thực JA mà ta có giá trị p k h c Đ i ề u được minh họa hình 8.9 với giá trị thực ỊJ khác là: 3,48; 3,54 3,6

Hình 8.9-a: Trường hợp H , : n = 3,48

(190)

íj'itn/ ti mít ít/ thuyết xác tuất DÙ fliốiifỊ kê toán

Phân phôi X Ho

P h n phối X H | đ ù n ỉ

3,4 3,6 X Hình 8.9-c: Trường hợp HI: ị.1 = 3,6

Giả sử tá Ì lẩm <i\nh giả thiết H0: f.i = 3,4 ; H|I ịi> 3,4 với mức

ý nghĩa cc = 0,01 D i ệ n tích phần gạch c h é o hình 8.9 b i ể u thị giạ Ui p ứng với trường hợp giá trị thực Ị.I 3,48; 3,54 3,6

" ( x - i r i , ) ) p = P ( Z ' < , _B) = P ( Z » < z2 a) = P

se(X)

= p

= p

( x - m p ) ^ (m0 - m , ) = — - ^ = — < z se(X) , s e ( X ) 2ct

( x ~m o ) ^ _ ( m „ - m , ) se(X)

=>(3 = p z <

Z-se(X)

( M ọ - M Ị )

se(X) (8.10)

(191)

Qlutơttg Sỉ DCiểin định giả thiết íỉiơuạ kẽ

p = p z < Z2a - ( • " Ị - m ọ )

se(X) (8.11)

T ta có cơng thức chung đ ể tìm xác suất mắc phải sai l ầ m loại : k bỏ phía (bên phải bên trái) sau:

p = p Z < Z 2 „ - m0 - m ,

se(X) (8.12)

N ế u k i ể m định gi ả thiết hai phía p xá c định g thức sau:

p = p z < z m0 - m ,

se(X) (8.13)

Thí dụ: Ta xét t i ế p thí dụ trọng lượng gà xuất chuồng T i m

xác suất mắc sai l ầ m loại lực k i ể m định trọng lượng xuất chuồng sau áp dựng phương p h p chăn ni 3,52 kg

Giải: Vì giả thiết đối Hi: ịi > 3,4 nên với CC = 0,01; ni,) = 4- m, =

3,52 Theo cơng thức (8.12) ta có:

p = p z < z 0,02 3,4 - 3,52

0,32 / V P ( Z < 2,326 - , 6 ) =

= P(Z < -0,32565) =P(Z > 0,32565) =1-NORMSDIST(0.32565) = 0,372345

(192)

í Ị HU* trinh hi ttutụết x nà thống, kí tốn

U I - K i ể m đ ị n h g i ả t h i ế t v ề t ỷ l ệ t ổ n g t h ể Giả sử tỷ lệ phần tử có tính chất A tổng thổ p (p chưa b i ế t ) Ta cần k i ể m định giả t h i ế t :

Ho: p = Po; giả thiết đối Hi: p 5* Po với mức ý nghĩa a Để kiểm định giả thiết trên, ta lấy mẫu kích thước n lớn Ho đún g đ i lượng lượng ngẫu nhiên :

Z = ^pÉL (8.14)

V P o O - P o ) phân phối xấp xỉ N(0, 1)

Từ ta đưa qui tắc định sau: + ì nẫu cụ thổ lính f tính:

(f - p„)Vn VPoơ-Po)

+ Với oe cho, xác định za (tra bảng dùng hàm

NORMSINV)

+ Núc ị z Ị > za ta bác bỏ Ao; Nếu I z I < za ta chấp

nhận Hu, T việc chấp n h ì n (hay bác bỏ) Ho ta suy k ế t luận cuối cùnu theo yêu cầu t c i p thực t ế

(193)

&tựưnạ 8: DCiẻiu định già thiết thống kê

Giả thiết M i ề n b c b ỏ Ho: p = po

H i : P < Po

V P o O - P o ) H( ): p = Po

H1: p > Po

V P o O - P o ) Ho: p = po

H i : P *P<) W { z = < f - ' > - W " : | z l > z , } V P o - P o )

Thí dụ -ỉ: Tỷ l ệ p h ế phẩm nhà m y 5% Sau t i ế n hành

một cải tiến kỹ thuật, người ta k i ể m tra 400 sản phẩm thây có 16 p h ế ph ẩ m

Với mức ý nghĩa a = 0,01 Hãy kết luận xem việc cải tiến kỹ thuật có làm g i ả m tỷ l ệ p h ế phẩm hay không ?

Giải: Gọi tỷ lệ phế phàm nhà máy sau cải tiên kỹ thuật p

Đặt giả thiết Ho: p = 0,05 ; H | I p < 0,05 Với mức ý nghĩa a = 0,01 z2a = Z() ()2 = 2,326 Tỷ l ệ phố phẩm mẫu là:

; ( , m Vậy:

400

_ ( - , ) V Õ Õ

z = —, = - 0,92 , / , ( - , )

(194)

(Jìtiơ tễ-ỉiih< ỉĩj.Y/t(tụếf xoe oà thống hè toán

I V - K i ể m đ ị n h g i ả t h i ế t v ề s ự b ằ n g n h a u c ủ a h a i t r u n g b ì n h

Giả sử hai ĐLNN X Y độc lập, có phân phối chuẩn với E(X) E(Y) đ ề u chưa biết c ầ n k i ể m định giả thiết: Ho: E(X) = E(Y) giả thiết đối Hi: E(X) * E(Y)

với mức ý nghĩa a Qui tắc định sau:

+ Lấy mẫu kích thước ni (đối với X) n2 (đối với Y) từ tính:

X - y

z = Ị (8.16) v a r ( X ) v a r ( Y )

V n i n2

n ế u b i ế t var(X) var(Y) hoặc:

(8.17]

nếu k h ô n g b i ế t var(X) var(Y)

+ Các cơng việc cịn lại giống qui tắc định kiểm định giả thiết v ề tỷ l ệ tổng t h ể

Thí dụ 5: Trọng lượng sản phẩm hai nhà máy sán xuất đại

lượng ngẫu n h i ê n p h â n p h ố i theo qui luật chuẩn có c ù n g độ lệch tiêu chuẩn = Ì kg

Với mức ý nghĩa a = 0,05, xem trọng lưựnạ trung bình sản

(195)

Ọhưtíiiạ 8: SKiểiu đình ạiá tíiìết tỉiốtiự kẻ

thử 25 sản phẩm nhà m y A ta tính được: X = 50 kg; Cân 20 sản phẩm nhà m y B tính được: y=50,6 kg

Giải: Gói trọng lượng sản phẩm nhà máy A X , nhà máy

B "ì Theo giả thiết ta có X , Y đ i lượng ngẫu nhiên cung p h â n phối theo qui luật chuẩn v i Var(X) = Var(Y) =

Đặt giả thiết Ho: E(X) = E(Y) ; Hi: E(X) * E(Y) Với mức ý nghĩa a = 0,05 za = Ì ,96

( - , ) T í n h

l - U - L 25 20

= -

Ta thấy ỉ z Ị = > za n ê n b c bỏ H() Tức trọng lượng trung bình sản phẩm sản xuất hai nhà m y k h c

V- Kiểm định giả thiết hai tỷ lệ

Giả sử Pi, P2 tương ứng tỷ l ệ phần tử có tính chất A tổng thể thứ nhất, thứ hai ( p i , P2 chưa biết) Ta cần k i ể m định giả thiết:

Ho: Pi = P2 = Po; giả t h i ế t đ ố i H i : Pi * P2 vớ i mức ý nghĩa a Chọn thống k ê :

z= , 12 = (8.18)

P o O - P o )

( ỉ Ì

+ -vn n 2 J làm tiêu chuẩn k i ể m định

(196)

tịiáo trinh Ị tị ư/111/i'ỉ Jí'áe Mất DỜ ttiốitq kè loàn

f*2 tỷ le ph.' ri tử CÓ dấu hiệu A mẫu nsiảu nhiên kích thước n-) x â y dựn» lừ Y (Y số phần tử có dấu hiệu A lấy ngẫu nhiên phẩn UI l tổng thể thứ hai)

Với kích thước mẫu lớn giả thiết Ho ì hì có phân phối xấp xỉ chua li ì

Nếu chưn hir'' Do ta thay Po ước lượng hợp lý tối đa * lìịỉị +n2f2

Khi ta chọn thốnu k ê : z

ĩ i Ị + n2

f - f

p ( - p )

f Ì p

(8.19)

(8.20) +

n , n V Ì 2 )

làm tiêu chuẩn k i ể m định

Qui tắc dị nít sau:

+ L ấ y hai mẫu kích thước n i , n2 Tính f|, f2 tương ứng tỷ-lệ phần tử có lính chất A mẫu có kích thước n i , n? sai! tính:

f - f

z = Ị ' (8.21) P o ( l - P o ) - - + -1 ^

nếu b i ế t p<) iìOãc:

x - y

(8.22) v! p " ( l - p * )

í

Ì ỉ — + i n : khôn g hiõ

(197)

@htểờmj s; DCiẻin định (tia thiết thống, kè

C c bước l i ế p theo tiến h n h tương tự qui tắc n ê u phần IV

Thí dụ 6: Kiểm tra sản phẩm chọn nĩa li nhiên hai nhà

m y sản xuất loại sản phẩm Ta có c c sơ l i ệ u sau: Nhà m y

A B

Số sp k i ể m tra 1000

900

Sô phê phẩm 20

30

V i mức ý nghĩa oe = 0,05, có t h ể coi tỷ l ệ p h ế phẩm hai nhà m y hay không ?

Giải: Gọi Pi, P2 tương ứng tỷ lệ phế phẩm nhà máy A, B

Đặt giả thiết: Ho: Pi =P2 ; Hi: Pi *p2

Với mức ý nghĩa a = 0,05 z<),<)5 = Ì ,96 Từ số liệu cho ta tính được:

20

f I = = 0,02 ; 1000

20 + 30

30

f2 = —— = 0,033 900

ì Ì - * = —

1000 + 900 38 ^ p 38

Vậy:

z = ( , - , 3 )

Ì 37 Ì

38 38 v i 0 900

= - ,

Ta thấv I z I = 1,81 Z(),05 nên / h ấ p nhận giả thiết Ho, tức coi "tỷ lộ phí- ••him h ú nhà máy

VI- Kiểm định giá thiết phương sai tổng thể

(198)

(ậẰáơ trình ít/ thuyết xác Mất ti lị III/ kê tốn

Ho: v a r ( X ) = ƠQ; giả thiết đ ố i H i : v a r ( X ) * ƠQ với mức ý nghĩa a

L ậ p mẫu ngẫu nhiên w x = ( X | , X2, ' , Xn) Chọn thốnii k ê : ( n - l ) s2

Ì = (8.23)

làm tiêu chn:ín kiêm dinh

N ế u H !.ing " r ' ! i i phố i theo qui luật "Chi bình phương " với 1; Ì bậc tư ri

V ƠI mức < nghĩa a, m i ề n b c bỏ giả thiết Ho là:

Wu= {x2 :%2 <xL/2^X2 >X«/J (8-24)

T.I minh họa m i ề n b c bỏ w a n h sau:

fk(x2)

(199)

Qhưởitạ S: Díiểm định giả thiết ti lốn kè

Q u i t ắ c q u y ế t đ ị n h :

+ L ấ y mẫu kích thước n, từ mẫu tinh i» Ì , ( n - ) s2

v.'<i mức ý nghĩa a, tra bảng (bậc tự n-1) đ ể lìm giá

(CĨ Ihc đung hàm CHIINV Excel để tìm ỵ2/2 /2, xem phụ lụi í')

f N ế u x: Ể ( x L / ; X ầ / ) t h ì b c b ỏ Ho thừa nhận Hi + N ế u X2 e ( x ĩ _a / 2; xin.) có th ể chấp nhận Ho Từ việc bác bỏ (hoặc chấp nhận Ho) ta suy kết luận cuối

cho toán thực t ế xét

Ta tóm tắt miền bác bỏ giả thiết ứng với loại giả thiết đ ố i k h c bảng sau :

• Giả thiết M i ề n b c bỏ

Ho: var(X) = ơị

H i : var(X) < ƠQ W u = { x - ^ - X < x L ( n - l ) } dị

Ho: var(X) = dị

H i : var(X) > dị W a = { r = ^ ỉ : X > x ; ( n - l ) } Ho: var(X) = aị

Hi: var(X) * ơổ w « = { X2 - Ì1 < x L / ( n- ! ) ;

(200)

íịìáo trình lạ thuyết xóa thống kẻ tối!

Thí dụ 8; N ế u m y m ó c hoạt động bình thường trọng lượng sản

phẩm đ i lượng ngẫu n h i ê n X p h â n phối theo qui luật chuẩn với Var(X) = 12 Nghi ngờ m y hoạt động khơng bình thường người la cân thử 13 sản phẩm tính s = 14,6

V i mức ý nghĩa a = 0,05 H ã y k ế t luận đ i ề u nghi ngờ có hay khơng ?

Giải; Để g i ả i toán ta cần k i ể m định ei.ì thiết:

H • = ; H i V a r ( X ) * T số l i ệ u tốn ta tính được:

( Ọ -1)14.6 12

V i oe = 0,05 ; Tra bảng x i v i (n - 1) = 12 bậc tự ta được:

Xa/2 = XÕ.025 = 23,3 XĨ-a/2 = XÕ.975 -4,4

Ta thấy 4,4 < X < 23,3 n ê n chấp nhận gi ả t h i ế t Ho, lức điều nghi ngừ khôn g đ ú n g , M y vẫ n làm*việc hình thường

VII- Kiểm định giả thiết hai p h n g s a i

Cho X i ~ N ( n , ; f ) ; x2 ~ N ( f i2 ;ơị) v i ,2v ; chưa biết Ta cần k i ể m ' ! lia thiết H0 : f = ;

Để kiểm định giả thiết từ hai tổng thể rút hai mẫu ngẫu nhiên độc lập kích thước tương ứng ni o>

Ngày đăng: 07/05/2021, 01:51

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan