Hãy cho một ví dụ về 2 biến cố A, B Ví dụ : A”Số tiền mà nước đó nhập khẩu trong một tháng” B” Số tiền mà nước đó xuất khẩu trong một tháng “ a Tìm C = A + B, D = A.B Nếu tiền thuế xuất
Trang 1ỦY BAN NHÂN DÂN TỈNH TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT
KHOA SƯ PHẠM
-Mã môn học : LING259 Học kỳ 1 năm học 2021 – 2022 Giáo viên hướng dẫn : Huỳnh Văn Hiếu
Họ và Tên : Hồ Nguyễn Minh Hiếu
Mssv : 2021402020338
Lớp : D20GDTH07
[1]
Tiểu Luận Thống kê trong nghiên cứu khoa học
Trang 2Phầần I
1 Hãy cho một ví dụ về 2 biến cố A, B
Ví dụ : A”Số tiền mà nước đó nhập khẩu trong một tháng”
B” Số tiền mà nước đó xuất khẩu trong một tháng “
a) Tìm C = A + B, D = A.B
Nếu tiền thuế xuất nhập khẩu bằng số tiền nhập khẩu cộng với số tiền xuất khẩu và chi phí vận chuyển hàng hóa thì sẽ bằng số tiền xuất khẩu nhân cho số tiền nhập khẩu
b A và B có xung khắc? A và B có đối lập? Vì sao?
A và B có xung khắc với nhau vì đồng thời hai hoạt động đó đều diễn ra cùng một lúc và liên tục
A và B đối lập với nhau vì hai hoạt động đó diễn ra đối lập với nhau , một bên là xuất khẩu và một bên là nhập khẩu
c A, B có hợp lại thành một hệ đầy đủ không? Vì sao?
A và B không hợp lại thành một quan hệ đầy đủ vì đó chỉ là hoạt động xuất nhập khẩu chứ không diễn ra các hoạt động khác như vận chuyển hàng hóa và tiền thuế
2 Hãy cho một ví dụ về xác suất có điều kiện mà bạn gặp trong cuộc sống
và tính xác suất bạn quan tâm
Một đại lý lấy hàng từ tổng kho của công ty SAMSUNG 14 chiếc ti vi Giả sử việc
các ti vi bị hỏng là độc lập với nhau và xác suất bị hỏng của mỗi chiếc ti
vi là 0,04
Tính xác suất để:
Có nhiều nhất một chiếc tivi bị hỏng,
Có nhiều nhất là hai chiếc tivi bị hỏng
Giải:
[2]
Trang 3Gọi A là biến cố “ có nhiều nhất một chiếc tivi bị hỏng “ và A là biến cố “i chiếc tivi thứ i bị hỏng “ với i= 1,… 14 Theo giả thuyết P( A )= 0,04 Ta i
có một lược đồ Bernoulli với n = 14 như sau :
P(A)= P (0) + P (1) = 14C0 (0,04) (0,96) + 14C1 (0,04)14 14 0 14 1(0,96)13
= 2,079
Gọi B là biến cố “ trong 14 chiếc tivi có nhiều nhất hai chiếc tivi bị hỏng
“.Ta có :
P(B)= P14(0)+P (1)+P (2)14 14
= 14C0 (0,04)0 (0,96)14 +14C1 (0,04)1(0,96)13+14C2 (0,04)2 (0,96)12
= 3,0853
Phầần II
Phần phốối siêu b i ộ
Một hộp chứa 6 sản phẩm loại 1 và 4 sản phẩm loại 2 Chọn ngẫu nhiên 4 sản phẩm (không hoàn lại) Gọi X là số sản phẩm loại 1 trong số 4 sản phẩm chọn ra a/ Tìm xác suất có đúng 3 sản phẩm loại 1
b/ Lập bảng phân phối xác suất của X
c/ Tính �(�) và � ��(�)
Giải: Vì đây là chọn không hoàn lại nên X có phân phối siêu bội � ∼ �(� � �; ; ) hay (10; 6; 4) � ∼ �
Dùng Excel ta được: �(� = 3) = � � � � �� � .���� (3, 4, 6, 10, 0) = 6� 3 *10-6
� 4−3 / 10 4 = 0.3810�
Phần phốối nh th c ị ứ
Biết tỉ lệ suy dinh dưỡng ở trẻ em dưới 5 tuổi là 20% Nếu chúng ta khám 10 trẻ dưới 5 tuổi Tính xác suất để có 2 em bị suy dinh dưỡng
Như vậy k=2, n=10 và p=0,20
Xác suất có 2 trẻ bị suy dinh dưỡng
[3]
Trang 4P(k 2;10;0;2)=10!/ 10!(8!) *(0,2) *(0,8) = 0,30
hoặc tính trong R: >dbinom (2,10,0.2)=0,30
Kết quả: Xác suất để có 2 em bị suy dinh dưỡng là 30%
phần phốối Poisson
Một trạm cho thuê xe taxi có 3 xe, hàng ngày phải nộp thuế 80 nghìn/xe Mỗi chiếc
xe cho thuê được với giá 200 nghìn/ngày Giả sử yêu cầu thuê xe của trạm là biến ngẫu nhiên X có phân phối Poisson với tham số λ = 3
a Tính xác suất trong một ngày có 3 khách thuê (lấy e 2,718 ) ≅
b Tính tiền lãi trung bình trạm thu được trong một ngày
a Xác suất để trong một ngày có 3 khách thuê xe là: P ( X = 3) =
b Gọi Y là tiền lãi trạm thu được trong một ngày, ta xét các trường hợp sau
• Không có xe nào được thuê:
P(Y= -240)=P(X=0) =
Có 1 xe được thuê:
P(Y=-40) =P(X=1)=
Có 2 xe được thuê:
P(Y=160) =P(X=2) =
Có 3 xe được thuê:
P(Y=360)=P(X=1-Vậy tiền lãi trung bình của trạm trong một ngày là:
E(Y)=-240*0,0498-40*0,1494+160*0,2241+360*0,5767=225,64 ( nghìn ) Phân bố Poisson (3.8) là phân bố xác suất của một biến ngẫu nhiên rời rạc nhận vô
số giá trị, được hoàn toàn xác định bởi tham số λ , kỳ vọng của nó
Phần phốối chu n ẩ
Thời gian để sản xuất một sản phẩm loại A là một BNN tuân theo luật
phân phối chuẩn với các tham số µ = 10 và σ = 1 (đơn vị là phút)
a) Tính xác suất để một sản phẩm loại A nào đó được sản xuất trong khoảng thời gian từ 9 phút đến 12 phút
b) Tính khoảng thời gian cần thiết để sản xuất một sản phẩm loại A bất kỳ Giải
[4]
Trang 5Gọi X là BNN chỉ thời gian để sản xuất một sản phẩm loại A, X-N (10,1) Xác suất phải tính:
P( ɸ
= (2) -ɸ (-1)=ɸ (2)+ ɸ (1)-1ɸ
= 0,9972+0,8413-1 = 0,88185
Theo qui tắc 3 , hầu như chắc chắn X lấy giá trị trong khoảng :
[ 10-3*1; 10+3*1] = [7;13]
Vậy thời gian để sản xuất một sản phẩm loại A bất kỳ là 7 đến 13 phút ( hầu như chắc chắn )
Phầần III
Nói chung các đặc tính sinh trắc học của người khỏe mạnh (cân nặng, chiều cao, trị
số mạch, huyết áp, đường máu, số lượng hồng cầu), thường tuân theo luật phân phối chuẩn Ví dụ: xét nghiệm đường máu 100 người lớn khỏe mạnh các kết quả thu thập trong bảng 1
Bảng 1 Kết quả đường máu (mg%) 100 người lớn khỏe mạnh
10
10
10
10
10
[5]
Trang 6Biểu đồ 1 Biểu đồ cuống-lá của đường máu
Nhìn vào biểu đồ cuống-lá ta thấy:
2 người có trị đường máu <80mg%: 2%
14 người có trị đường máu 80-89mg%: 14%
33 người có trị đường máu 90-99mg%: 33%
34 người có trị đường máu 100-109mg%: 34%
14 người có trị đường máu 110-119mg%: 13%
3 người có trị đường máu >120 mg%: 3%
Và biểu đồ tần suất (histogram) của phân phối đường máu (biểu đồ 2):
Biểu đồ 2 Phân phối đường máu của 100 người lớn khỏe mạnh
Như vậy ta thấy phân phối lượng đường máu tuân theo luật chuẩn với trị số trung bình µ=100 và độ lệch chuẩn σ=10 với:
[6]
Trang 768% giá trị quan sát nằm trong khoảng σ của µ.
95% giá trị quan sát nằm trong khoảng 2σ của µ
99,7% giá trị quan sát nằm trong khoảng 3σ của µ
(còn gọi là luật 68-95-99,7)
Hàm mật độ phân phối chuẩn (Normal density probability function) có dạng tổng quát như sau:
Trong đó: f(x) = 3,14159
e = 2,71828 (cơ số logarit Neper)
µ: trị số trung bình
: độ lệch chuẩn
Biến ngẫu nhiên X có đơn vị là mg% bây giờ ta muốn chuyển đơn vị đo lường của biến số X theo đơn vị đo lường tổng quát cho mọi phân phối chuẩn nghiã là theo đơn vị độ lệch chuẩn Lúc đó phân phối chuẩn theo X sẽ trở thành phân phối chuẩn tắc (Standadized normal distribution) theo biến số mới là Z
Muốn đổi hàm y=f(x) ra hàm chuẩn tắc y=f(z) ta đặt:
Thế =100 và =10 ta có:
Như vậy khi: x=80 ; z=-2
x=90 ; z=-1
x=100 ; z=0
x=110 ; z=+1
x=120 ; z=+2
[7]
Trang 8Và đường cong chuẩn y=f(z) sẽ là:
Hình 2 Biến đổi phân phối chuẩn (biến X) thành phân phối chuẩn tắc (Z)
Như vậy đường cong chuẩn tắc y= f(z) có trị trung bình=0 và độ lệch chuẩn=1 Tóm lại: Biến X tuân theo luật chuẩn với trung bình =0 và phương sai =2 thường được viết tắt là: X ~ N (0,2), và biến Z tuân theo phân phối chuẩn tắc có
µ=0 và phương sai =1 được viết là Z ~ N(0,1) Như vậy lúc này Z có đơn vị là độ lệch (ví dụ: 1, 2 hoặc 3 độ lệch chuẩn so với trị trung bình) và không tùy thuộc vào đơn vị đo lường theo biến X (ví dụ mg% đường máu)
Phương trình đường cong chuẩn tắc theo Z sẽ là::
[8]
Trang 9Hình 3 Diện tích dưới đường cong chuẩn từ 0-> +1
Lúc này muốn biết xác suất đường máu từ 100-110mg% (theo X) chỉ cần tính xác suất từ 0 đến 1 đơn vị độ lệch chuẩn theo Z hoặc tìm diện tích dưới đường cong từ
0 đến 1 (phần màu đậm-hình 3) Tích phân của hàm f(z) từ 0 -> 1 chính là diện tích dưới đường cong này Trong thống kê gọi f(Z) là hàm xác suất chuẩn tích lũy (cummulative normal probability function)
Công thức tính tích phân hàm F(z) khá rắc rối thường ta dùng bảng Z-score (phần phụ lục) để tính Xem bảng khi z=0 ,z=1: F(z)=0,34
[9]
Trang 10Như vậy xác suất P (0 ≤ Z ≤1) là 0,34 hoặc xác suất những người có trị đường máu
từ X=100mg% (tương đương với Z=0) đến X=110 mg%(tương đương với Z=1) là 34% (biểu đồ )
Các khoảng đặc biệt có thể tính nhẩm xác suất:
Một ví dụ khác: Muốn tính xác suất của z từ - đến 1,2 ta lấy: xác suất khoảng từ - đến 0 là p=0,50 cộng với xác suất khoảng từ 0 đến 1,2 là 0,38 (xem bảng z-score phần phụ lục), tổng cộng 2 xác suất này là 0,88 (tương đương 88% người có đường máu 115mg%) (1 đơn vị z bằng 10mg%)
Trong thống kê có một vị trí rất thông dụng, được nhắc đi nhắc lại nhiều lần đó
là Z=1,96 và giá tri tới hạn (critical value) Zα =0,05 (2 đuôi), vị trí mà thống kê cho rằng các giá trị nào nằm ngoài khoảng này được coi như bất thường (p=0,05) Giá trị tới hạn này cũng được dùng nhiều nhất trong thống kê y học để xác định mức có ý nghĩa thông kê (bác bỏ 1 giả thuyết không) Nếu Z >1,96, p<0,05) bác bỏ giả thuyết không và Z <1,96 chấp nhận giả thuyết không
[10]
Trang 11Hình 4 Giá trị tới hạn (critical value) của phân phối chuẩn Z
Thực hiện ngoại kiểm tra, 5 mẫu đường máu (đều có trị số thực là 100mg%) được gởi cho 1 phòng xét nghiệm A Kết quả 5 mẫu đường máu tại phòng xét nghiệm A như sau: 100; 101; 102; 103; 104 Hỏi chất lượng của phòng xét nghiệm A? Giải:
Giả thuyết không: Ho: m= µ ; Ha: m = µ
với m=100+101+102+103+104/5=102
SD2= (100-100)2+(100-101)2 +(100-102)2 +(100-103)2 +(100-104)2 = 2.5 n-1
SD=1.58
Tra bảng với bậc tự do =4 : t= 2.77 Như vậy T >2,77 bác bỏ giả thuyết không, có
sự khác biệt giữa mẫu máu gởi đến so với kết quả của phòng xét nghiệm A Kết luận: Chất lượng phòng xét nghiệm A chưa đạt
Test T 1 mẫu trong SPSS
Analyze>Compare Means>One-sample T test
[11]
Trang 12Nhắp glucose chuyển qua ô Test variables
Gõ 100 (trị đường máu thực sự) vào ô Test Value
Nhắp OK
Kết quả kiểm định T 1 mẫu :
N: số mẫu máu; Mean: trị trung bình; Std Deviation: Độ lệch chuẩn; Std Error Mean: Sai số chuẩn= SD; t=2.828 (giá trị tới hạn t 2 đuôi); df: bậc tự do (n-1); Sig 2-tailed): ý nghĩa TK ( 2 đuôi) p<0.047; Mean difference: Sai biệt giữa TB mẫu và trị lý thuyết (m-µ)
[12]
Trang 13Kết luận: t=2,828, df=4, p=0,047: sự khác biệt có ý nghĩa thống kê, như vậy kết quả của phòng xét nghiệm A chưa đạt
Cả 2 ví dụ có sự khác nhau về sự bằng nhau của 2 tỉ lệ và sự bằng nhau của tỉ lệ trung bình giữa các dữ liệu đã cho
[13]
Trang 14M c l c ụ ụ
Phần I 2
a) Tìm C = A + B, D = A.B 2
b A và B có xung khắc? A và B có đối lập? Vì sao? 2
c A, B có hợp lại thành một hệ đầy đủ không? Vì sao? 2
2 Hãy cho một ví dụ về xác suất có điều kiện mà bạn gặp trong cuộc sống và tính xác suất bạn quan tâm 2
Phần II 3
Phân phối siêu bội 3
Phân phối nhị thức 3
phân phối Poisson 4
Phân phối chuẩn 4
Phần III 5
[14]