Giống nhau- Mục đích: thu thập dữ liệu và phân tích dữ liệu để đưa ra kết luận về một vấn đề nghiên cứu - Phương tiện thu thập dữ liệu: bảng câu hỏi, cuộc khảo sát, phỏng vấn, quan sát,
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
BÀI TẬP LỚN MÔN: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ
Nhóm sinh viên thực hiện:
HÀ NỘI - 2024
Trang 2Câu 1:
Chiều cao
(cm)
ni x ni i x n2i i
143 1 143 20449
149 1 149 22201
150 4 600 90000
151 1 151 22801
152 5 760 115520
153 3 459 70227
154 3 462 71148
155 2 310 48050
156 2 312 48672
157 2 314 49298
158 7 1106 174748
160 10 1600 256000
162 3 486 78732
164 1 164 26896
165 5 825 136125
166 2 332 55112
167 1 167 27889
168 3 504 84672
169 5 845 142805
170 5 850 144500
171 1 171 29241
172 7 1204 207088
173 6 1038 179574
174 1 174 30276
175 6 1050 183750
176 1 176 30976
178 1 178 31684
179 1 179 32041
180 1 180 32400
182 1 182 33124
Trang 31507
1 2475999 -Chiều cao trung bình của sinh viên trong lớp là:
= 15071/92 = 163,81x
-Độ lệch tiêu chuẩn của chiều cao sinh viên trong lớp là:
s2 = 1/92[2475999-92(163,81) ] = 792
s = 8,88
-Tỷ lệ sinh viên có chiều cao từ 1,6m đến 1,65m là:
P1 = (10+3+1+5)/92 x 100% = 20,65%
-Tỷ lệ sinh viên có chiều cao 1,6m:
P2 = 10/92 x 100% = 10,87%
-Tỷ lệ sinh viên có chiều cao trên 1,65m:
P3 = 42/92 x 100% = 45,65%
Câu 2: Bằng phương pháp nghiên cứu mẫu, hãy cho biết chiều cao trung bình của sinh viên trong lớp của bạn và nêu phương pháp lấy mẫu mà bạn
sử dụng.
- Quần thể đích: 92 sinh viên (trong lớp)
- Quần thể nghiên cứu: 27 sinh viên (trong lớp)
- Phương pháp lấy mẫu: chọn mẫu ngẫu nhiên đơn
+ Lập danh sách toàn bộ sinh viên lớp học
+ Sử dụng phương pháp “bốc thăm” để chọn đơn vị mẫu
- Cách thực hiện:
+ Lớp đã chia thành 9 nhóm có số lượng người mỗi nhóm khá đồng đều (7 nhóm 10 người, 2 nhóm 11 người) Các thành viên từng nhóm đã được đánh số thứ tự từ 1 đến 10 hoặc 11
+ Bằng phương pháp “bốc thăm” chọn ngẫu nhiên 3 người từ mỗi nhóm, ta được bảng sau:
Nhó Tên sinh viên Chiều cao (m)
Trang 41
Hoàng Ngọc Đạt 1,73
2
Dương Tiến Đạt 1,73
Phạm Thanh Tùng 1,6
3
Trần Thị Ngọc Lan 1,43
Trần Thị Minh Thúy 1,6
Nguyễn Ngọc Long 1,7
4
Lê Thị Thanh Lam 1,6
5
Nguyễn Thị Loan 1,65
Dương Ánh Ngọc 1,54
6 Nguyễn Quang ToànPhùng Ngọc Linh 1,531,5
Nguyễn Danh Dương 1,71
7
Nguyễn Thăng Đạt 1,72
Nguyễn Hữu Bách 1,75
8
Nguyễn Hữu Trọng 1,72
Nguyễn Thu Ngà 1,52
Nguyễn Ánh Dương 1,58
9
Nguyễn Thị Linh Chi 1,57
Nguyễn Đăng Quang 1,72
Mai Đoàn Hồng Minh 1,65
Chiều cao trung bình của sinh viên trong lớp bằng:
x = 1
n∑
i=1
k
r i x i = 271 × 44,39= ¿ 1,64 (m)
Câu 3: So sánh giữa phương pháp nghiên cứu lấy mẫu và phương pháp nghiên cứu tổng thể
a Định nghĩa
- Nghiên cứu tổng thể là nghiên cứu tất cả các phần tử của tông thể theo một dấu hiệu nghiên cứu
Trang 5- Nghiên cứu mẫu là nghiên cứu một tập con được rút ra từ tổng thể theo một dấu hiệu nghiên cứu (tập con này phải đại diện cho tổng thể và được chọn theo phương pháp lấy mẫu)
Trang 6b Giống nhau
- Mục đích: thu thập dữ liệu và phân tích dữ liệu để đưa ra kết luận về một vấn
đề nghiên cứu
- Phương tiện thu thập dữ liệu: bảng câu hỏi, cuộc khảo sát, phỏng vấn, quan sát,
…
- Phân tích dữ liệu: đều sử dụng phương pháp phân tích dữ liệu như thống kê,
mô tả thống kê, suy luận, phân tích đa biến,…
- Độ chính xác: đều cần đảm bảo độ chính xác của dữ liệu thu thập, phân tích để đưa ra kết luận chính xác
- Độ đại diện: đều cần đảm bảo độ đại diện của mẫu hoặc tổng thể đưa ra kết luận có tính khái quát
- Ứng dụng: được sử dụng trong nhiều lĩnh vực khác nhau như kinh tế, y tế, giáo dục, khoa học xã hội,…
c Khác nhau
Phương pháp nghiên cứu
tổng thể
Phương pháp nghiên cứu
mẫu
Mục đích Để tìm hiểu toàn bộ tổng thể và
đưa ra kết luận chính xác hơn
Để đại diện cho tổng thể và giảm thiểu thời gian, chi phí
Cách thức
Các tham số đặc trưng của tổng
thể có thể xác định được một
cách trực tiếp
Sử dụng các phương pháp toán học (đặc biệt là lý thuyết xác suất), người ta tiến hành suy rộng kết quả nghiên cứu trên mẫu cho toàn bộ tổng thể
Số phần
tử
Chưa thể xác định được toàn bộ
phần tử của tổng thể
Xác định được số lượng phần tử phải nghiên cứu
Chất
lượng
phần tử
Nếu các phần tử của tập hợp bị
phá hủy trong quá trình nghiên
cứu thì phương pháp nghiên
cứu toàn bộ trở thành vô nghĩa
Không bị ảnh hưởng nếu trường hợp bị phá hủy, ta có thể thay thế bằng phần tử khác
Trường - Khi tổng thể có kích thước - Khi tổng thể quá lơn, khó nắm
Trang 7hợp sử
dụng
nhỏ hoặc có thể tiếp cận được
- Khi mục tiêu của nghiên cứu
là tìm hiểu đặc điểm của toàn
bộ tổng thể
- Khi độ chính xác của kết quả
là yếu tố quan trọng
- Khi có đủ thời gian và kinh
phí
bắt được hết các phần tử của tổng thể
- Khi không có đủ thời gian và kinh phí để nghiên cứu tổng thể
- Trong một số trường hợp nếu dùng phương pháp nghiên cứu tổng thể sẽ dẫn đến phá hủy tổng thể
Độ chính
xác
- Nếu quy mô của tổng thể quá
lớn, có thể xãy ra trường hợp
trùng hoặc bỏ sót các phần tử,
sai sót trong quá trình thu thập
thông tin ban đầu, hạn chế độ
chính xác của kết quả phân tích
- Việc tiến hành mất nhiều thời
gian nên có thể không đảm bảo
được tính kịp thời của số liệu
thống kê
- Hạn chế được sự trùng lặp và sai số trong quá trình thu thập thông tin
- Vẫn đảm bảo được độ chính xác của kết quả, thu nhập được nhiều chỉ tiêu thống kê
- Có thể thu thập được các dữ liệu phức tạp
- Đảm bảo được tính kịp thời của số liệu thống kê
Chi phí,
thời gian
Tốn nhiều chi phí, thời gian Tiết kiệm chi phí, thời gian
Độ đại
diện
Đảm bảo độ đại diện cao Chỉ đảm bảo độ đại diện cao
khi mẫu được lựa chọn một cách ngẫu nhiên và đại diện cho tổng thể
Câu 4:
LUẬT SỐ LỚN VÀ ĐỊNH LÝ GIỚI HẠN TRUNG TÂM
Lý thuyết xác suất nghiên cứu khả năng xuất hiện của các biến cổ ngẫu nhiên Khi tung một đồng xu ta sẽ không biết mặt sấp hay mặt ngửa xuất hiện nhưng nếu tung nhiều lần thì ta thấy rằng số lần mặt sấp và mặt ngừa xuất hiện là xấp
Trang 8xi gần bằng nhau Như vậy khi thực hiện nhiều lần phép thử ngẫu nhiên ta sẽ tìm được quy luật xuất hiện của biến cố ngẫu nhiên, đấy là nội dung của luật số lớn Luật số lớn cũng là cơ sở đề định nghĩa xác suất của biến cổ thông qua tần suất xuất hiện của biến cố đó
Luật số lớn nghiên cứu sự hội tụ theo xác suất của dãy các biến ngẫu nhiên Luật số lớn đầu tiên của James Bernoulli được công bố năm 1713
Về sau, kết quả này được Poisson, Trêbusép, Markov, Liapunốp mở rộng Trong mục này ta xét hai định lý về luật số lớn Định lý Trêbusép là dạng tổng quát của luật số lớn và định lý Bernoulli là trường hợp đơn giản nhất của luất số lớn áp dụng cho các biến ngẫu nhiên có phân bố Bernoulli Đề chứng minh định lý Trêbusép ta sử dụng bất đăng thức Trêbusép
4.1 LUẬT SỐ LỚN
4.1.1 Bất đẳng thức Markov và bất đẳng thức Trêbusep
Định lý 1: Cho Y là biến ngẫu nhiên không âm có ký vọng hữu hạn Khi đó với mọi a >0 ta có:
P {Y≥ a }≤ EYa (1) Định lý 2: Giả sử X là biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn, khi
đó với mọi >0 ta có:
P {|X - EX|> }≤DX
❑ 2 (2)
Sử dụng công thức xác suất biến cố ta cũng có:
P {|X - EX|> }≥1−DX
❑ 2 (3) CM: Áp dụng công thức (1) cho biến ngẫu nhiên Y = (X −EX)2 và a=❑ 2 ta có:
P{|X – EX|> }= {Y- P ❑ 2} ≤ EY
❑ 2 = E(X −EX)
2
❑ 2 =DX
❑ 2
BĐT (2), (3) được gọi là bất đẳng thức Trêbusep
Bất đẳng thức Trêbusép có nhiều ứng dụng Trước hết nó cho phép ta đánh giá cận trên hoặc cận dưới xác suất để biến ngẫu nhiên X nhận giá trị sai lệch so với
kỳ vọng BX không quá Bất đẳng thức Trêbusép có ý nghĩa to lớn về mặt lý thuyết, nó được sử dụng để chứng minh các định lý của luật số lớn
Trang 94.1.2 Hội tụ theo xác suất
Định nghĩa 1: Dãy các biến ngẫu nhiên trong cùng một phép thử X1, X2,…gọi là hội tụ theo xác suất về biến ngẫu nhiên X (của cùng phép thử)
Ký hiệu X X, nếu:n
>0: lim
n→∞
P{|Xn – X|> }=0
Như vậy dãy các biến ngẫu nhiên X , X ,…hội tụ theo xác suất về biến ngẫu1 2 nhiên X thì với n đủ lớn, thực tế gần như chắc chắn ta có thể coi rằng X khôngn khác mấy so với X
4.1.3 Luật số lớn Trêbusep
Định lý 3: Giả sử X , X ,…là dãy các biến ngẫu nhiên độc lập trong cùng một1 2 phép thử, có các kỳ vọng hữu hạn và phương sai đều bị chặn trên bởi hằng số C (DXk ≤ C; k=1; 2;…) Khi đó với mọi >0:
lim
n→∞ P ¿¿
CM: Xét biến ngẫu nhiên S = n
X 1+… +X n
n Từ giả thiết độc lập của dãy các biến ngẫu nhiên X , X ,…suy ra:1 2
ESn = EX1 +…EXn
n ; DS = n
DX1+…DXn
n ≤ Cn
Áp dụng BĐT Trêbusep ta có:
P¿≤ C
n 2 n→∞
→
0
Hệ quả 1: Giả sử X1, X2,…là dãy các biến ngẫu nhiên độc lập trong cùng một phép thử có cùng kỳ vọng μ và phương sai đều bị chặn bởi số C (DX ≤ C;k k=1; 2;…) Khi đó:
X1 +…+Xn
n μ
Hệ quả 2: Giả sử X1, X2,…là dãy các biến ngẫu nhiên độc lập trong cùng một phép thử có cùng phân bố, có kỳ vọng μvà phương sai σ2 Khi đó
X1 +…+X n
n μ
P
n⟶∞
p
n →∞
p n⟶∞
Trang 10Định lý Trêbusep chứng tỏ rằng trung bình số học của các biến ngẫu nhiên độc lập hội tụ theo xác suất về trung bình số học của kỳ vọng tương ứng của nó Nói cách khác nó chứng tỏ sự Ồn định của trung bình số học của một số lớn các biến ngẫu nhiên xung quanh trung bình số học của các kỳ vọng của các biến ngẫu nhiên ấy Như vậy mặc dù từng biến ngẫu nhiên độc lập có thê nhận giá trị khác nhiều so với kỳ vọng của chúng, song trung bình số học của một số lớn các biến ngẫu nhiên lại nhận giá trị gần bằng trung bình số học các kỳ vọng của chúng với xác suất rất lớn
Định lý Trêbusép có ứng dụng rộng rãi trong nhiều lĩnh vực, chẳng hạn nó chính
là cơ sở cho phương pháp đo lường trong vật lý
4.1.4 Luật số lớn Bernouli
Xét phép thử ngẫu nhiên và A là một biến cố liên quan đến phép thử C C
tiến hành n lần dộc lập phép thử và gọi k là tần số xuất hiện biến cố A trong nC n phép thử đó, ƒ =n
kn
n được gọi là tần suất xuất hiện của A trong n phép thử Định lý 4: (Định lý Bernouli) Tần suất ƒ hội tụ theo xác suất về xác suất củan p biến cố A nghĩa là với mọi >0
lim
n→∞
P {∨ƒn− p|≤}=1 CM: Xét các dãy biến ngẫu nhiên X1,X ,…X 2 n xác định như sau:
X =k { 1 nếu A xảyraở phépthử thứ k 0nếuAkhôngxảyraở phépthử thứ k Thì dãy các bién ngẫu nhiên X , X1 2,…,Xn,…độc lập có cùng phân bố Bernouli tham số Có kỳ vọng là EX = và phương sai DX = (1- )< 1 với mọip k p k p p k=1,2,
Ta có: X1 +…+Xn
n = kn
n = ƒn Vậy theo hệ quả 2 của định lý 3 suy ra ƒ hội tụ theo xác suất về n p
Định lý Bernoulli chi ra rằng tần suất xuất hiện của biến cố trong n phép thử độc lập sẽ hội tụ theo xác suất về xác suất của biến cố đó khi số lần thử tăng lên vô hạn Chính vì vậy định lý Bernoulli là cơ sở lý thuyết của định nghĩa thống kê về xác suất
Trang 11Ở thế kỷ 18, nhà toán học Pháp Buffon gieo một đồng tiền 4040 lần và ghi được
2048 lần xuất hiện mặt ngừa, tần suất là 0,507 Một nhà thống kê người Anh gieo đồng tiền 12000 lần và thu được 6019 lần xuất hiện mặt ngửa, tần suất tương ứng 0,5016 Trong một thí nghiệm khác, ông ta gieo 24000 lần và thu được 12012 lần xuất hiện mặt ngừa, tần suất tương ứng là 0,5005 Như vây ta thấy rằng khi số phép thử tăng lên thì tần suất tương ứng sẽ càng gần 0,5
4.2 Định lý giới hạn trung tâm
Định lý giới hạn trung tâm là một định lý quan trọng trong thống kê, mô tả phân phối của tổng hoặc trung bình của một chuỗi các biến ngẫu nhiên độc lập và cùng phân phối khi kích thước mẫu càng lớn
Giả sử X1, X2,…là dãy các biến ngẫu nhiên độc lập có cùng phân bố, có kỳ vọng μvà phương sai σ 2, ta có:
Sn= X1 +…+Xn−nμ
σ√n = X1 +…+Xn−E [ X1+…+ Xn
√D[ X1+…+X n ] có ES = 0 VÀ DS = 1n n Định lý 5: Giả sử X1, X2,…là dãy các biến ngẫu nhiên độc lập có cùng phân bố,
có kỳ vọng μ và phương sai σ 2 Khi đó dãy biến ngẫu nhiên S = n
X1+…+X n −nμ
σ√n
hội tụ theo phân bố về phân bố chuẩn tắc (0;1), tức là:N
x ∈ R, lim
n→∞ F Sn(x) = (x) (x) là hàm phân bố xác suất của phân bố chuẩn tắc N(0;1)
Áp dụng định lý giới hạn trung tâm cho các dãy các biến ngẫu nhiên độc lập X1, X2…có cùng phân bố tham số Bernouli tham số ta được định lý p Moivre-Laplace là:
x ∈ R, lim
n→∞
P {X1 +…+Xn−np
√npq ≤ x}= (x) Định lý Moivre- Laplace cho phép xấp xỉ phân bố nhị thức B(n;p) với phân bố chuẩn N(np;npq) khi n đủ lớn Người ta cho thấy rằng xấp xỉ là tốt khi np và nq lớn hơn hoặc khi npq lớn hơn 20
4.20
a) Xác suất để có đúng hai máy phế phẩm trong 250 máy tính kiểm tra: Để tính xác suất này, ta sử dụng công thức phân phối nhị thức:
Trang 12P(X = 2) = C(250, 2) * (0,02)^2 * (1 - 0,02)^(250 - 2)
Trong đó:
• P(X = 2) là xác suất để có đúng 2 máy phế phẩm
• C(250, 2) là số phương thức chọn 2 máy phế phẩm từ 250 máy tính
• 0,02 là xác suất một máy tính là phế phẩm
• (1 - 0,02)^(250 - 2) là xác suất 248 máy tính còn lại không phải phế phẩm Thay các giá trị vào công thức, ta tính được xác suất này là khoảng 0,0842 hoặc 8,42%
b) Xác suất để có không quá hai máy phế phẩm trong 250 máy tính kiểm tra: Xác suất này là tổng xác suất của các trường hợp có 0, 1 hoặc 2 máy phế phẩm, tính bằng công thức phân phối nhị thức:
P(X < 2) = P(X = 0) + P(X = 1) + P(X =2)
Thay các giá trị vào công thức, ta tính được xác suất này là khoảng 0,1247 hoặc 12,47%
Vậy đáp án đúng là: a) Xác suất để có đúng hai máy phế phẩm là 0,0842 hoặc
8,42% b) Xác suất để có không quá hai máy phế phẩm là 0,1247 hoặc 12,47%