Phân phối chuẩn

Một phần của tài liệu Bài giảng toán thống kê cho khoa học xã hội đh lâm nghiệp (Trang 30)

a. Định nghĩa phân phối chuẩn

Biến ngẫu nhiên X được gọi là có phân phối chuẩn với hai tham số µ và 2

nếu hàm mật độ của nó có dạng:         2 2 ( ) 2 1 ( ) , 2 x f x e x R Ký hiệu: X N(µ;2) hoặc X ∼ N(µ;2). * Đồ thị của hàm f(x):

- Đồ thị của hàm f(x) là đường cong hình chuông đối xứng qua đường x = µ và đạt giá trị cực đại tại điểm x = µ. Vì vậy giá trị Mod(X) = µ.

- Tiệm cận với trục hoành khi x .

- Diện tích giới hạn bởi đồ thị và trục hoành bằng 1.

* Kỳ vọng và phương sai: Nếu X N(µ;2) thì E(X) = a và D(X) = 2.

DX được gọi là độ lệch chuẩn.

Phân phối chuẩn chiếm vị trí quan trọng trong lý thuyết xác suất, là vị trí trung tâm trong các kết luận thống kê sau này. Trong thực tế có nhiều biến ngẫu nhiên tuân theo quy luật chuẩn hoặc tiệm cận chuẩn chẳng hạn như trọng lượng, chiều cao của một nhóm người nào đó, điểm thi của các thí sinh, lực chịu đựng của một thanh sắt, các sai số đo đạc, độ bền dẻo của máy móc, khối lượng, kích thước của các sản phẩm, năng suất cây giống, mức lãi suất của công ty, nhu cầu tiêu thụ của một mặt hàng nào đó…

b. Phân phối chuẩn tắc

Nếu X N(µ; 2), ta đổi biến  

  X

Khi đó Z có phân phối chuẩn N(0,1) với kỳ vọng bằng 0 và phương sai bằng 1 gọi là có phân phối chuẩn tắc (hay phân phối tiêu chuẩn).

Phép đổi biển 

  X

Z được gọi là phép chuẩn hóa.

Hàm mật độ của biến ngẫu nhiên có phân phối chuẩn tắc là:

    2 2 1 ( ) 2 x x e

Hàm phân phối của N(0,1) là:

       2 2 1 ( ) , 2 x u x e du x R

Đồ thị của hàm mật độ của phân phối chuẩn tắc N(0,1) như sau:

Người ta đã xây dựng sẵn bảng các giá trị của hàm (x) và ( )x . Trong các bài tập cần lưu ý đưa về phân phối chuẩn tắc để tính toán.

Tính xác suất theo phân phối chuẩn:

1.     ( x) 1 ( ),x xR. 2. Nếu Z  N(0;1) thì: ( ) ( ) P Z   ( ) 1 ( ) P Z    ( ) ( ) ( ) P Z      

3. Nếu X N(µ; 2), với µ và 2đã biết. Tìm P ( X ) ta đổi biến 

  X

Z , khi đó Z có phân phối chuẩn dạng N(0,1) nên: ( ) ( X ) PXP                                     

( )                                      X P X P P Z   ( ) 1  1               P X P X

Từ công thức trên, suy ra xác suất của sự sai lệch giữa biến ngẫu nhiên có phân phối chuẩn N(a;2) và kỳ vọng µ của nó được xác định như sau:

| |  2 1. P X              Nếu chọn  =  thì P(|X - µ| <) = 2(1) – 1 = 0,6826. Nếu chọn  = 2 thì P(|X - µ| <) = 2(2) – 1 = 0,9546. Nếu chọn  = 3 thì P(|X - µ| <) = 2(3) – 1 = 0,9974.

Quy tắc 2: Nếu biến ngẫu nhiên X có phân phối chuẩn với hai tham số µ và 2thì có đến 95,46% giá trị của X sẽ nằm trong khoảng (µ - 2 ; µ + 2)

Quy tắc 3: Nếu biến ngẫu nhiên X có phân phối chuẩn với hai tham số µ và 2thì hầu như chắc chắn X nhận các giá trị trong khoảng (µ - 3 ; µ + 3)

Ví dụ 25. Giả sử X có phân phối chuẩn N(2100; 2002). Tính: a) P(X > 2400). b) P(1700 < X < 2200). c) Xác định a để P(X > a) = 0,03. Giải: Từ giả thiết ta có µ = 2100 và  200 a) (X 2400) 1 (2400 2100) 1 (1,5) 1 0,9332 0, 0668 200 P            b) (1700 X 2200) (2200 2100) (1700 2100) (0,5) ( 2) 0, 6688 200 200 P               c) (X ) 1 ( 2100) 0, 03 ( 2100) 0,97 200 200 a a P    a       Tra bảng ta được (1,881) 0,97 2100 1,881 2476, 2 200 a a       

Ví dụ 26. Chiều cao của phụ nữ Việt Nam là biến ngẫu nhiên có phân phối chuẩn N(155, 2,52). Tính tỷ lệ phụ nữ có chiều cao trên 160 cm.

Giải:

Gọi X là chiều cao của phụ nữ Việt Nam.

160 155 ( 160) 1 ( 160) 1 ( ) 0, 228 2,5          P X P X .

BÀI TẬP

Bài 1. Xác suất của biến cố A là 0,7. Hãy cho biết con số đó có ý nghĩa gì?

Bài 2. Tần suất xuất hiện biến cố viên đạn trúng đích của một xạ thủ là 0,85. Tìm số viên đạn trúng đích của xạ thủ đó nếu người này bắn 200 viên đạn?

Bài 3. Một công ty cần tuyển hai nhân viên. Có 6 người nộp đơn trong đó có 4 nữ và 2 nam. Giả sử rằng khả năng trúng tuyển của 6 người là như nhau:

a. Tính xác suất để hai người trúng tuyển đều là nam? b. Tính xác suất để hai người trúng tuyển đều là nữ? c. Tính xác suất để có ít nhất một nữ trúng tuyển?

Bài 4. Có thể xem xác suất sinh được con trai là bao nhiêu nếu theo dõi 88200 trẻ sơ sinh ở một vùng thấy có 45.600 con trai?

Bài 5. Trên một giá sách có 15 quyển sách, trong đó có 5 quyển văn nghệ. Lấy ngẫu nhiên từ đó ba quyển. Tìm xác suất sao cho có ít nhất một quyển văn nghệ?

Bài 6. Số lượng nhân viên của công ty A được phân loại theo lứa tuổi và giới tính như sau:

Giới tính

Độ tuổi Nam Nữ

Dưới 30 tuổi 120 170

Từ 30 - 40 tuổi 260 420

Trên 40 tuổi 400 230

Tìm xác suất để lấy ngẫu nhiên một người của công ty đó thì được: a) Một nhân viên từ 40 tuổi trở xuống.

b) Một nam nhân viên trên 40 tuổi.

c) Một nữ nhân viên từ 40 tuổi trở xuống.

Bài 7. Giả sử xác suất sinh con trai và con gái là như nhau. Một gia đình có 3 con, tính xác suất để gia đình đó có:

a) Hai con gái. b) Ít nhất 2 con gái.

Bài 8. Một lô sản phẩm gồm 100 chiếc ấm sứ trong đó có 20 chiếc vỡ nắp, 15 chiếc sứt vòi, 10 chiếc mẻ miệng, 7 chiếc vừa vỡ nắp vừa sứt vòi, 5 chiếc vừa vỡ

nắp vừa mẻ miệng, 3 chiếc vừa sứt vòi vừa mẻ miệng, 1 chiếc vừa vỡ nắp vừa sứt vòi vừa mẻ miệng. Lấy ngẫu nhiên 1 sản phẩm để kiểm tra, tính xác suất:

a) Sản phẩm đó có khuyết tật. b) Sản phẩm đó chỉ bị sứt vòi.

c) Sản phẩm đó bị sứt vòi biết rằng nó bị vỡ nắp.

Bài 9. Một chi tiết được lấy ngẫu nhiên có thể là chi tiết loại 1 (ký hiệu biến cố này là A) hoặc chi tiết loại 2 (ký hiệu là B) hoặc chi tiết loại 3 (ký hiệu là C). Hãy mô tả các biến cố sau đây:

a) A + B b) AB + C c) AB

d) AC

Bài 10. Gọi A là biến cố sinh con gái và B là biến cố sinh con có trọng lượng trên 3 kg. Hãy mô tả tổng và tích của hai biến cố trên?

Bài 11. Một công ty tham gia đấu thầu 2 dự án. Gọi A và B tương ứng là biến cố công ty thắng thầy dự án thứ nhất và thứ hai. Hãy mô tả tổng và tích của A và B?

Bài 12. Công ty sử dụng hai hình thức quảng cáo là đài phát thanh và vô tuyến truyền hình. Giả sử 25% khách hàng nắm được thông tin này qua vô tuyến truyền hình, 34% khách hàng nắm được thông tin qua đài phát thanh và 10% khách hàng nắm được thông tin này qua cả hai hình thức quảng cáo. Tìm xác suất để chọn ngẫu nhiên 1 khách hàng thì người đó nắm được thông tin về sản phẩm công ty?

Bài 13. Một nhân viên bán hàng mỗi ngày đi chào hàng ở 10 nơi với xác suất bán được hàng mỗi nơi là 0,2.

a) Tìm xác suất để người đó bán được hàng ở 2 nơi?

b) Tìm xác suất để người đó bán được hàng ở ít nhất 1 nơi?

Bài 14. Một siêu thị lắp 5 chiếc chuông báo cháy hoạt động độc lập nhau. Xác suất để khi có cháy mỗi chuông kêu là 0,95. Tìm xác suất để có chuông kêu khi có cháy?

Bài 15. Hai máy cùng sản xuất một loại sản phẩm. Tỷ lệ phế phẩm của máy I là 3%, máy II là 2%. Từ một kho gồm 2/3 sản phẩm của máy I và 1/3 sản phẩm của máy II ta lấy ra một sản phẩm.

b) Giả sử sản phẩm lấy ra là sản phẩm tốt. Khả năng sản phẩm đó do máy nào sản xuất?

Bài 16. Tỷ lệ người dân nghiện thuốc lá ở một vùng là 30%. Biết rằng tỷ lệ người bị viêm họng trong số người nghiện thuốc lá là 60%, tỷ lệ người bị viêm họng trong số người không hút thuốc lá là 40%. Chọn ngẫu nhiên 1 người để kiểm tra.

a) Biết rằng người đó bị viêm họng. Tính xác suất người đó nghiện thuốc lá? b) Nếu người đó không bị viêm họng, tính xác suất để người đó là người nghiện thuốc?

Bài 17. Trong một bệnh viện, tỷ lệ bệnh nhân các tỉnh như sau: Tỉnh A là 25%, tỉnh B là 35%, tỉnh C là 40%. Biết rằng tỷ lệ bệnh nhân là kỹ sư của các tỉnh A, B, C lần lượt là 0,2; 0,4 và 0,3. Chọn ngẫu nhiên 1 bệnh nhân, tính xác suất để bệnh nhân đó là kỹ sư?

Bài 18. Thống kê 2.000 sinh viên một khóa của trường kinh tế theo giới tính và nghành học thu được các số liệu sau:

Nam Nữ

Học kinh tế 400 500

Học quản trị kinh doanh 800 300

Lấy ngẫu nhiên một sinh viên khóa đó. Tìm xác suất để được: a) Nam sinh viên?

b) Sinh viên học kinh tế?

c) Hoặc nam sinh viên hoặc học kinh tế? d) Nam sinh viên và học kinh tế?

Bài 19. Tại một siêu thị, hệ thống phun nước tự động được lắp liên kết với một hệ thống báo động hỏa hoạn. Khả năng hệ thống phun nước bị hỏng là 0,1. Khả năng để hệ thống báo động bị hỏng là 0,2. Khả năng để hai hệ thống này cùng hỏng là 0,04. Hãy tính xác suất:

a) Có ít nhất một hệ thống hoạt động bình thường? b) Cả hai hệ thống hoạt động bình thường?

Bài 20. Một xí nghiệp có hai ô tô vận tải hoạt động. Xác suất trong ngày làm việc các ô tô bị hỏng tương ứng lần lượt là 0,1 và 0,2. Gọi X là số ô tô bị hỏng trong thời gian làm việc.

a) Tìm quy luật phân phối xác suất của X? b) Thiết lập hàm phân bố xác suất của X?

Bài 21. Một thiết bị gồm 3 bộ phận hoạt động độc lập với nhau. Xác suất trong thời gian T các bộ phận bị hỏng tương ứng là 0,4; 0,2 và 0,3.

a) Tìm quy luật phân phối xác suất của số bộ phận bị hỏng X?

b) Tìm xác suất để trong thời gian T có không quá 2 bộ phận bị hỏng?

Bài 22. Tại một cửa hàng bán xe máy Honda người ta thống kê được số xe máy bán ra hàng tuần (X) với bảng phân phối xác suất như sau:

X 0 1 2 3 4 5 6 7 8 9 10 11

P 0,05 0,12 0,17 0,08 0,12 0,20 0,07 0,02 0,07 0,02 0,03 0,05 a) Tìm số xe trung bình bán được mỗi tuần?

b) Tìm phương sai và độ lệch chuẩn cho số xe bán ra mỗi tuần và giải thích ý nghĩa kết quả đạt được?

Bài 23. Thống kê số khách trên một ô tô buýt tại một tuyến giao thông thu được các số liệu sau:

Số khách 20 25 30 35 40

Tần suất 0,2 0,3 0,15 0,1 0,25

Tìm kỳ vọng và phương sai của số khách đi mỗi chuyến?

Bài 24. Cho biến ngẫu nhiên rời rạc X nhận 3 giá trị -1; 0; 1. Tìm xác suất tương ứng để X nhận các giá trị này biết rằng E(X) = 0,1 và E(X2

) = 0,9. Cho biến ngẫu nhiên rời rạc X có quy luật phân phối xác suất như sau:

X 2 3

P P1 0,7

Tìm P1 và tính E(X), D(X)?

Bài 25. Kinh nghiệm cho thấy là số lượng một loại sản phẩm mà một khách hàng có thể mua có bảng phân phối xác suất như sau:

Số lƣợng sản phẩm 0 1 2 3

Xác suất tƣơng ứng 0,5 0,1 0,2 p a) Tính p?

b) Nếu mỗi sản phẩm được bán với giá 110 ngàn đồng thì doanh số thu được trung bình của cửa hàng đó là bao nhiêu?

Bài 26. Gọi X là tỷ lệ khách hàng phản ứng tích cực đối với một chiến dịch quảng cáo. X là biến ngẫu nhiên có bảng phân phối xác suất như sau:

X(%) 0 10 20 30 40 50

P 0,1 0,2 0,35 0,2 0,1 0,05

a) Hãy chứng tỏ các xác suất trên lập thành bảng phân phối xác suất?

b) Tìm tỷ lệ khách hàng trung bình phản ứng tích cực với chiến dịch quảng cáo đó?

c) Tìm xác suất để có trên 20% khách hàng phản ứng tích cực đối với chiến dịch quảng cáo?

Bài 27. Qua theo dõi trong nhiều năm kết hợp với sự đánh giá của các chuyên gia tài chính thì lãi suất đầu tư vào một công ty là biến ngẫu nhiên X có bảng phân phối xác suất như sau:

X(%) 9 10 11 12 13 14 15

P 0,05 0,15 0,3 0,2 0,15 0,1 0,05

a) Tìm xác suất để khi đầu tư vào công ty đó sẽ đạt được lãi suất ít nhất 12%? b) Tìm lãi suất có thể hy vọng khi đầu tư vào công ty đó?

c) Mức độ rủi ro khi đầu tư vào công ty đó có thể đánh giá bằng cách nào?

Bài 28. Cho biến ngẫu nhiên rời rạc X có bảng phân phối xác suất như sau:

X 1 4 8

P 0,3 p 0,6

Tìm p, E(X), D(X)?

Bài 29. Nhu cầu hàng năm về loại hàng A là biến ngẫu nhiên liên tục X có hàm mật độ xác suất như sau (đơn vị: ngàn sản phẩm):

(30 ) (0;30) ( ) 0 (0;30) k x khi x f x khi x        a) Tìm k?

b) Tìm xác suất để nhu cầu về loại hàng đó không vượt quá 12000 sản phẩm trong năm?

c) Tìm nhu cầu trung bình hàng năm về loại hàng đó?

Bài 30. Thời gian xếp hàng chờ mua hàng của khách là biến ngẫu nhiên liên tục với hàm phân bố xác suất như sau (đơn vị: phút):

2 (1 ) (0;1) ( ) 0 (0;1) k x khi x f x khi x        a) Tìm hệ số k?

b) Tìm thời gian xếp hàng trung bình?

Bài 31. Tỷ lệ mắc một loại bệnh trong một vùng dân cư là biến ngẫu nhiên liên tục có hàm mật độ: (5; 25) ( ) 20 0 (5; 25) x k khi x f x khi x         a) Tìm k? b) Tính P(10 < X < 15)? c) Tính E(X)?

Bài 32. Trọng lượng của một con bò là một đại lượng ngẫu nhiên có phân bố chuẩn với kỳ vọng là 250 kg và độ lệch tiêu chuẩn 40 kg. Tìm xác suất để một con bò có trọng lượng:

a) Nặng hơn 300 kg? b) Nhẹ hơn 175 kg?

c) Trong khoảng 260 kg đến 270 kg?

Bài 33. Thời gian hoạt động của một loại ti vi là một biến ngẫu nhiên có phân bố chuẩn với µ = 4.300 giờ và δ = 250 giờ. Giả thiết mỗi ngày người ta dùng trung bình là 10 giờ và thời hạn bảo hành miễn phí là 1 năm (360 ngày):

a) Tìm tỷ lệ sản phẩm phải bảo hành?

b) Tính xác suất để thời gian hoạt động của loại ti vi này không quá 4600 giờ?

Bài 34. Lãi suất đầu tư vào một công ty là biến ngẫu nhiên có phân phối chuẩn với lãi suất trung bình là 10% một năm và độ lệch tiêu chuẩn là 0,002. Tính xác suất khi đầu tư vào công ty đó:

a) Lãi suất không vượt quá 10,8% một năm? b) Lãi suất tối thiểu đạt 9,5% một năm?

Chƣơng 2

MẪU THỐNG KÊ VÀ ƢỚC LƢỢNG THAM SỐ 2.1. Giới thiệu bài toán

Thống kê xã hội thực chất là những kết quả đơn giản của Thống kê ứng dụng (một phần của Thống kê toán học) được dùng trong nghiên cứu xã hội.

Giả sử ta cần nghiên cứu một đặc trưng xã hội nào đó, ta coi đó là một biến

Một phần của tài liệu Bài giảng toán thống kê cho khoa học xã hội đh lâm nghiệp (Trang 30)