1. Trang chủ
  2. » Thể loại khác

bài tập lớn lý thuyết xác suất và thống kê

13 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài tập lớn: phân tích chiều cao sinh viên và phương pháp nghiên cứu mẫu
Tác giả Nguyễn Minh Đức, Nguyễn Đức Quý, Nguyễn Thăng Đạt, Lê Thu Hồng, Trần Công Lực, Nguyễn Hữu Bách, Nguyễn Văn Hoàng, Nguyễn Quốc Bảo, Vũ Hồng Ánh, Mai Trần Tiến
Người hướng dẫn Nguyễn Thị Nga
Trường học Học viện Công nghệ Bưu chính Viễn thông
Chuyên ngành Lý thuyết xác suất và thống kê
Thể loại Bài tập lớn
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 13
Dung lượng 1,22 MB

Nội dung

Giống nhau- Mục đích: thu thập dữ liệu và phân tích dữ liệu để đưa ra kết luận về một vấn đề nghiên cứu - Phương tiện thu thập dữ liệu: bảng câu hỏi, cuộc khảo sát, phỏng vấn, quan sát,

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

BÀI TẬP LỚN MÔN: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ

Nhóm sinh viên thực hiện:

HÀ NỘI - 2024

Trang 2

Câu 1:

Chiều cao

(cm)

ni x ni i x n2i i

143 1 143 20449

149 1 149 22201

150 4 600 90000

151 1 151 22801

152 5 760 115520

153 3 459 70227

154 3 462 71148

155 2 310 48050

156 2 312 48672

157 2 314 49298

158 7 1106 174748

160 10 1600 256000

162 3 486 78732

164 1 164 26896

165 5 825 136125

166 2 332 55112

167 1 167 27889

168 3 504 84672

169 5 845 142805

170 5 850 144500

171 1 171 29241

172 7 1204 207088

173 6 1038 179574

174 1 174 30276

175 6 1050 183750

176 1 176 30976

178 1 178 31684

179 1 179 32041

180 1 180 32400

182 1 182 33124

Trang 3

1507

1 2475999 -Chiều cao trung bình của sinh viên trong lớp là:

= 15071/92 = 163,81x

-Độ lệch tiêu chuẩn của chiều cao sinh viên trong lớp là:

s2 = 1/92[2475999-92(163,81) ] = 792

s = 8,88

-Tỷ lệ sinh viên có chiều cao từ 1,6m đến 1,65m là:

P1 = (10+3+1+5)/92 x 100% = 20,65%

-Tỷ lệ sinh viên có chiều cao 1,6m:

P2 = 10/92 x 100% = 10,87%

-Tỷ lệ sinh viên có chiều cao trên 1,65m:

P3 = 42/92 x 100% = 45,65%

Câu 2: Bằng phương pháp nghiên cứu mẫu, hãy cho biết chiều cao trung bình của sinh viên trong lớp của bạn và nêu phương pháp lấy mẫu mà bạn

sử dụng.

- Quần thể đích: 92 sinh viên (trong lớp)

- Quần thể nghiên cứu: 27 sinh viên (trong lớp)

- Phương pháp lấy mẫu: chọn mẫu ngẫu nhiên đơn

+ Lập danh sách toàn bộ sinh viên lớp học

+ Sử dụng phương pháp “bốc thăm” để chọn đơn vị mẫu

- Cách thực hiện:

+ Lớp đã chia thành 9 nhóm có số lượng người mỗi nhóm khá đồng đều (7 nhóm 10 người, 2 nhóm 11 người) Các thành viên từng nhóm đã được đánh số thứ tự từ 1 đến 10 hoặc 11

+ Bằng phương pháp “bốc thăm” chọn ngẫu nhiên 3 người từ mỗi nhóm, ta được bảng sau:

Nhó Tên sinh viên Chiều cao (m)

Trang 4

1

Hoàng Ngọc Đạt 1,73

2

Dương Tiến Đạt 1,73

Phạm Thanh Tùng 1,6

3

Trần Thị Ngọc Lan 1,43

Trần Thị Minh Thúy 1,6

Nguyễn Ngọc Long 1,7

4

Lê Thị Thanh Lam 1,6

5

Nguyễn Thị Loan 1,65

Dương Ánh Ngọc 1,54

6 Nguyễn Quang ToànPhùng Ngọc Linh 1,531,5

Nguyễn Danh Dương 1,71

7

Nguyễn Thăng Đạt 1,72

Nguyễn Hữu Bách 1,75

8

Nguyễn Hữu Trọng 1,72

Nguyễn Thu Ngà 1,52

Nguyễn Ánh Dương 1,58

9

Nguyễn Thị Linh Chi 1,57

Nguyễn Đăng Quang 1,72

Mai Đoàn Hồng Minh 1,65

Chiều cao trung bình của sinh viên trong lớp bằng:

x = 1

n∑

i=1

k

r i x i = 271 × 44,39= ¿ 1,64 (m)

Câu 3: So sánh giữa phương pháp nghiên cứu lấy mẫu và phương pháp nghiên cứu tổng thể

a Định nghĩa

- Nghiên cứu tổng thể là nghiên cứu tất cả các phần tử của tông thể theo một dấu hiệu nghiên cứu

Trang 5

- Nghiên cứu mẫu là nghiên cứu một tập con được rút ra từ tổng thể theo một dấu hiệu nghiên cứu (tập con này phải đại diện cho tổng thể và được chọn theo phương pháp lấy mẫu)

Trang 6

b Giống nhau

- Mục đích: thu thập dữ liệu và phân tích dữ liệu để đưa ra kết luận về một vấn

đề nghiên cứu

- Phương tiện thu thập dữ liệu: bảng câu hỏi, cuộc khảo sát, phỏng vấn, quan sát,

- Phân tích dữ liệu: đều sử dụng phương pháp phân tích dữ liệu như thống kê,

mô tả thống kê, suy luận, phân tích đa biến,…

- Độ chính xác: đều cần đảm bảo độ chính xác của dữ liệu thu thập, phân tích để đưa ra kết luận chính xác

- Độ đại diện: đều cần đảm bảo độ đại diện của mẫu hoặc tổng thể đưa ra kết luận có tính khái quát

- Ứng dụng: được sử dụng trong nhiều lĩnh vực khác nhau như kinh tế, y tế, giáo dục, khoa học xã hội,…

c Khác nhau

Phương pháp nghiên cứu

tổng thể

Phương pháp nghiên cứu

mẫu

Mục đích Để tìm hiểu toàn bộ tổng thể và

đưa ra kết luận chính xác hơn

Để đại diện cho tổng thể và giảm thiểu thời gian, chi phí

Cách thức

Các tham số đặc trưng của tổng

thể có thể xác định được một

cách trực tiếp

Sử dụng các phương pháp toán học (đặc biệt là lý thuyết xác suất), người ta tiến hành suy rộng kết quả nghiên cứu trên mẫu cho toàn bộ tổng thể

Số phần

tử

Chưa thể xác định được toàn bộ

phần tử của tổng thể

Xác định được số lượng phần tử phải nghiên cứu

Chất

lượng

phần tử

Nếu các phần tử của tập hợp bị

phá hủy trong quá trình nghiên

cứu thì phương pháp nghiên

cứu toàn bộ trở thành vô nghĩa

Không bị ảnh hưởng nếu trường hợp bị phá hủy, ta có thể thay thế bằng phần tử khác

Trường - Khi tổng thể có kích thước - Khi tổng thể quá lơn, khó nắm

Trang 7

hợp sử

dụng

nhỏ hoặc có thể tiếp cận được

- Khi mục tiêu của nghiên cứu

là tìm hiểu đặc điểm của toàn

bộ tổng thể

- Khi độ chính xác của kết quả

là yếu tố quan trọng

- Khi có đủ thời gian và kinh

phí

bắt được hết các phần tử của tổng thể

- Khi không có đủ thời gian và kinh phí để nghiên cứu tổng thể

- Trong một số trường hợp nếu dùng phương pháp nghiên cứu tổng thể sẽ dẫn đến phá hủy tổng thể

Độ chính

xác

- Nếu quy mô của tổng thể quá

lớn, có thể xãy ra trường hợp

trùng hoặc bỏ sót các phần tử,

sai sót trong quá trình thu thập

thông tin ban đầu, hạn chế độ

chính xác của kết quả phân tích

- Việc tiến hành mất nhiều thời

gian nên có thể không đảm bảo

được tính kịp thời của số liệu

thống kê

- Hạn chế được sự trùng lặp và sai số trong quá trình thu thập thông tin

- Vẫn đảm bảo được độ chính xác của kết quả, thu nhập được nhiều chỉ tiêu thống kê

- Có thể thu thập được các dữ liệu phức tạp

- Đảm bảo được tính kịp thời của số liệu thống kê

Chi phí,

thời gian

Tốn nhiều chi phí, thời gian Tiết kiệm chi phí, thời gian

Độ đại

diện

Đảm bảo độ đại diện cao Chỉ đảm bảo độ đại diện cao

khi mẫu được lựa chọn một cách ngẫu nhiên và đại diện cho tổng thể

Câu 4:

LUẬT SỐ LỚN VÀ ĐỊNH LÝ GIỚI HẠN TRUNG TÂM

Lý thuyết xác suất nghiên cứu khả năng xuất hiện của các biến cổ ngẫu nhiên Khi tung một đồng xu ta sẽ không biết mặt sấp hay mặt ngửa xuất hiện nhưng nếu tung nhiều lần thì ta thấy rằng số lần mặt sấp và mặt ngừa xuất hiện là xấp

Trang 8

xi gần bằng nhau Như vậy khi thực hiện nhiều lần phép thử ngẫu nhiên ta sẽ tìm được quy luật xuất hiện của biến cố ngẫu nhiên, đấy là nội dung của luật số lớn Luật số lớn cũng là cơ sở đề định nghĩa xác suất của biến cổ thông qua tần suất xuất hiện của biến cố đó

Luật số lớn nghiên cứu sự hội tụ theo xác suất của dãy các biến ngẫu nhiên Luật số lớn đầu tiên của James Bernoulli được công bố năm 1713

Về sau, kết quả này được Poisson, Trêbusép, Markov, Liapunốp mở rộng Trong mục này ta xét hai định lý về luật số lớn Định lý Trêbusép là dạng tổng quát của luật số lớn và định lý Bernoulli là trường hợp đơn giản nhất của luất số lớn áp dụng cho các biến ngẫu nhiên có phân bố Bernoulli Đề chứng minh định lý Trêbusép ta sử dụng bất đăng thức Trêbusép

4.1 LUẬT SỐ LỚN

4.1.1 Bất đẳng thức Markov và bất đẳng thức Trêbusep

Định lý 1: Cho Y là biến ngẫu nhiên không âm có ký vọng hữu hạn Khi đó với mọi a >0 ta có:

P {Y≥ a }≤ EYa (1) Định lý 2: Giả sử X là biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn, khi

đó với mọi >0 ta có:

P {|X - EX|> }≤DX

❑ 2 (2)

Sử dụng công thức xác suất biến cố ta cũng có:

P {|X - EX|> }≥1−DX

❑ 2 (3) CM: Áp dụng công thức (1) cho biến ngẫu nhiên Y = (X −EX)2 và a=❑ 2 ta có:

P{|X – EX|> }= {Y- P ❑ 2} ≤ EY

❑ 2 = E(X −EX)

2

❑ 2 =DX

❑ 2

BĐT (2), (3) được gọi là bất đẳng thức Trêbusep

Bất đẳng thức Trêbusép có nhiều ứng dụng Trước hết nó cho phép ta đánh giá cận trên hoặc cận dưới xác suất để biến ngẫu nhiên X nhận giá trị sai lệch so với

kỳ vọng BX không quá Bất đẳng thức Trêbusép có ý nghĩa to lớn về mặt lý thuyết, nó được sử dụng để chứng minh các định lý của luật số lớn

Trang 9

4.1.2 Hội tụ theo xác suất

Định nghĩa 1: Dãy các biến ngẫu nhiên trong cùng một phép thử X1, X2,…gọi là hội tụ theo xác suất về biến ngẫu nhiên X (của cùng phép thử)

Ký hiệu X X, nếu:n

>0: lim

n→∞

P{|Xn – X|> }=0

Như vậy dãy các biến ngẫu nhiên X , X ,…hội tụ theo xác suất về biến ngẫu1 2 nhiên X thì với n đủ lớn, thực tế gần như chắc chắn ta có thể coi rằng X khôngn khác mấy so với X

4.1.3 Luật số lớn Trêbusep

Định lý 3: Giả sử X , X ,…là dãy các biến ngẫu nhiên độc lập trong cùng một1 2 phép thử, có các kỳ vọng hữu hạn và phương sai đều bị chặn trên bởi hằng số C (DXk ≤ C; k=1; 2;…) Khi đó với mọi >0:

lim

n→∞ P ¿¿

CM: Xét biến ngẫu nhiên S = n

X 1+… +X n

n Từ giả thiết độc lập của dãy các biến ngẫu nhiên X , X ,…suy ra:1 2

ESn = EX1 +…EXn

n ; DS = n

DX1+…DXn

n ≤ Cn

Áp dụng BĐT Trêbusep ta có:

P¿≤ C

n 2 n→∞

0

Hệ quả 1: Giả sử X1, X2,…là dãy các biến ngẫu nhiên độc lập trong cùng một phép thử có cùng kỳ vọng μ và phương sai đều bị chặn bởi số C (DX ≤ C;k k=1; 2;…) Khi đó:

X1 +…+Xn

n μ

Hệ quả 2: Giả sử X1, X2,…là dãy các biến ngẫu nhiên độc lập trong cùng một phép thử có cùng phân bố, có kỳ vọng μvà phương sai σ2 Khi đó

X1 +…+X n

n μ

P

n⟶∞

p

n →∞

p n⟶∞

Trang 10

Định lý Trêbusep chứng tỏ rằng trung bình số học của các biến ngẫu nhiên độc lập hội tụ theo xác suất về trung bình số học của kỳ vọng tương ứng của nó Nói cách khác nó chứng tỏ sự Ồn định của trung bình số học của một số lớn các biến ngẫu nhiên xung quanh trung bình số học của các kỳ vọng của các biến ngẫu nhiên ấy Như vậy mặc dù từng biến ngẫu nhiên độc lập có thê nhận giá trị khác nhiều so với kỳ vọng của chúng, song trung bình số học của một số lớn các biến ngẫu nhiên lại nhận giá trị gần bằng trung bình số học các kỳ vọng của chúng với xác suất rất lớn

Định lý Trêbusép có ứng dụng rộng rãi trong nhiều lĩnh vực, chẳng hạn nó chính

là cơ sở cho phương pháp đo lường trong vật lý

4.1.4 Luật số lớn Bernouli

Xét phép thử ngẫu nhiên và A là một biến cố liên quan đến phép thử C C

tiến hành n lần dộc lập phép thử và gọi k là tần số xuất hiện biến cố A trong nC n phép thử đó, ƒ =n

kn

n được gọi là tần suất xuất hiện của A trong n phép thử Định lý 4: (Định lý Bernouli) Tần suất ƒ hội tụ theo xác suất về xác suất củan p biến cố A nghĩa là với mọi >0

lim

n→∞

P {∨ƒn− p|≤}=1 CM: Xét các dãy biến ngẫu nhiên X1,X ,…X 2 n xác định như sau:

X =k { 1 nếu A xảyraở phépthử thứ k 0nếuAkhôngxảyraở phépthử thứ k Thì dãy các bién ngẫu nhiên X , X1 2,…,Xn,…độc lập có cùng phân bố Bernouli tham số Có kỳ vọng là EX = và phương sai DX = (1- )< 1 với mọip k p k p p k=1,2,

Ta có: X1 +…+Xn

n = kn

n = ƒn Vậy theo hệ quả 2 của định lý 3 suy ra ƒ hội tụ theo xác suất về n p

Định lý Bernoulli chi ra rằng tần suất xuất hiện của biến cố trong n phép thử độc lập sẽ hội tụ theo xác suất về xác suất của biến cố đó khi số lần thử tăng lên vô hạn Chính vì vậy định lý Bernoulli là cơ sở lý thuyết của định nghĩa thống kê về xác suất

Trang 11

Ở thế kỷ 18, nhà toán học Pháp Buffon gieo một đồng tiền 4040 lần và ghi được

2048 lần xuất hiện mặt ngừa, tần suất là 0,507 Một nhà thống kê người Anh gieo đồng tiền 12000 lần và thu được 6019 lần xuất hiện mặt ngửa, tần suất tương ứng 0,5016 Trong một thí nghiệm khác, ông ta gieo 24000 lần và thu được 12012 lần xuất hiện mặt ngừa, tần suất tương ứng là 0,5005 Như vây ta thấy rằng khi số phép thử tăng lên thì tần suất tương ứng sẽ càng gần 0,5

4.2 Định lý giới hạn trung tâm

Định lý giới hạn trung tâm là một định lý quan trọng trong thống kê, mô tả phân phối của tổng hoặc trung bình của một chuỗi các biến ngẫu nhiên độc lập và cùng phân phối khi kích thước mẫu càng lớn

Giả sử X1, X2,…là dãy các biến ngẫu nhiên độc lập có cùng phân bố, có kỳ vọng μvà phương sai σ 2, ta có:

Sn= X1 +…+Xn−nμ

σ√n = X1 +…+Xn−E [ X1+…+ Xn

√D[ X1+…+X n ] có ES = 0 VÀ DS = 1n n Định lý 5: Giả sử X1, X2,…là dãy các biến ngẫu nhiên độc lập có cùng phân bố,

có kỳ vọng μ và phương sai σ 2 Khi đó dãy biến ngẫu nhiên S = n

X1+…+X n −nμ

σ√n

hội tụ theo phân bố về phân bố chuẩn tắc (0;1), tức là:N

x ∈ R, lim

n→∞ F Sn(x) = (x) (x) là hàm phân bố xác suất của phân bố chuẩn tắc N(0;1)

Áp dụng định lý giới hạn trung tâm cho các dãy các biến ngẫu nhiên độc lập X1, X2…có cùng phân bố tham số Bernouli tham số ta được định lý p Moivre-Laplace là:

x ∈ R, lim

n→∞

P {X1 +…+Xn−np

√npq ≤ x}= (x) Định lý Moivre- Laplace cho phép xấp xỉ phân bố nhị thức B(n;p) với phân bố chuẩn N(np;npq) khi n đủ lớn Người ta cho thấy rằng xấp xỉ là tốt khi np và nq lớn hơn hoặc khi npq lớn hơn 20

4.20

a) Xác suất để có đúng hai máy phế phẩm trong 250 máy tính kiểm tra: Để tính xác suất này, ta sử dụng công thức phân phối nhị thức:

Trang 12

P(X = 2) = C(250, 2) * (0,02)^2 * (1 - 0,02)^(250 - 2)

Trong đó:

• P(X = 2) là xác suất để có đúng 2 máy phế phẩm

• C(250, 2) là số phương thức chọn 2 máy phế phẩm từ 250 máy tính

• 0,02 là xác suất một máy tính là phế phẩm

• (1 - 0,02)^(250 - 2) là xác suất 248 máy tính còn lại không phải phế phẩm Thay các giá trị vào công thức, ta tính được xác suất này là khoảng 0,0842 hoặc 8,42%

b) Xác suất để có không quá hai máy phế phẩm trong 250 máy tính kiểm tra: Xác suất này là tổng xác suất của các trường hợp có 0, 1 hoặc 2 máy phế phẩm, tính bằng công thức phân phối nhị thức:

P(X < 2) = P(X = 0) + P(X = 1) + P(X =2)

Thay các giá trị vào công thức, ta tính được xác suất này là khoảng 0,1247 hoặc 12,47%

Vậy đáp án đúng là: a) Xác suất để có đúng hai máy phế phẩm là 0,0842 hoặc

8,42% b) Xác suất để có không quá hai máy phế phẩm là 0,1247 hoặc 12,47%

Ngày đăng: 26/06/2024, 17:14

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w