1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận thống kê trong nghiên cứu khoa học

14 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tiểu Luận Thống Kê Trong Nghiên Cứu Khoa Học
Tác giả Hồ Nguyễn Minh Hiếu
Người hướng dẫn Huỳnh Văn Hiếu
Trường học Trường Đại Học Thủ Dầu Một
Chuyên ngành Sư Phạm
Thể loại tiểu luận
Năm xuất bản 2021 – 2022
Thành phố Thủ Dầu Một
Định dạng
Số trang 14
Dung lượng 1,42 MB

Nội dung

Hãy cho một ví dụ về 2 biến cố A, B Ví dụ : A”Số tiền mà nước đó nhập khẩu trong một tháng” B” Số tiền mà nước đó xuất khẩu trong một tháng “ a Tìm C = A + B, D = A.B Nếu tiền thuế xuất

Trang 1

ỦY BAN NHÂN DÂN TỈNH TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT

KHOA SƯ PHẠM

-Mã môn học : LING259 Học kỳ 1 năm học 2021 – 2022 Giáo viên hướng dẫn : Huỳnh Văn Hiếu

Họ và Tên : Hồ Nguyễn Minh Hiếu

Mssv : 2021402020338

Lớp : D20GDTH07

[1]

Tiểu Luận Thống kê trong nghiên cứu khoa học

Trang 2

Phầần I

1 Hãy cho một ví dụ về 2 biến cố A, B

Ví dụ : A”Số tiền mà nước đó nhập khẩu trong một tháng”

B” Số tiền mà nước đó xuất khẩu trong một tháng “

a) Tìm C = A + B, D = A.B

Nếu tiền thuế xuất nhập khẩu bằng số tiền nhập khẩu cộng với số tiền xuất khẩu và chi phí vận chuyển hàng hóa thì sẽ bằng số tiền xuất khẩu nhân cho số tiền nhập khẩu

b A và B có xung khắc? A và B có đối lập? Vì sao?

A và B có xung khắc với nhau vì đồng thời hai hoạt động đó đều diễn ra cùng một lúc và liên tục

A và B đối lập với nhau vì hai hoạt động đó diễn ra đối lập với nhau , một bên là xuất khẩu và một bên là nhập khẩu

c A, B có hợp lại thành một hệ đầy đủ không? Vì sao?

A và B không hợp lại thành một quan hệ đầy đủ vì đó chỉ là hoạt động xuất nhập khẩu chứ không diễn ra các hoạt động khác như vận chuyển hàng hóa và tiền thuế

2 Hãy cho một ví dụ về xác suất có điều kiện mà bạn gặp trong cuộc sống

và tính xác suất bạn quan tâm

Một đại lý lấy hàng từ tổng kho của công ty SAMSUNG 14 chiếc ti vi Giả sử việc

các ti vi bị hỏng là độc lập với nhau và xác suất bị hỏng của mỗi chiếc ti

vi là 0,04

Tính xác suất để:

Có nhiều nhất một chiếc tivi bị hỏng,

Có nhiều nhất là hai chiếc tivi bị hỏng

Giải:

[2]

Trang 3

Gọi A là biến cố “ có nhiều nhất một chiếc tivi bị hỏng “ và A là biến cố “i chiếc tivi thứ i bị hỏng “ với i= 1,… 14 Theo giả thuyết P( A )= 0,04 Ta i

có một lược đồ Bernoulli với n = 14 như sau :

P(A)= P (0) + P (1) = 14C0 (0,04) (0,96) + 14C1 (0,04)14 14 0 14 1(0,96)13

= 2,079

Gọi B là biến cố “ trong 14 chiếc tivi có nhiều nhất hai chiếc tivi bị hỏng

“.Ta có :

P(B)= P14(0)+P (1)+P (2)14 14

= 14C0 (0,04)0 (0,96)14 +14C1 (0,04)1(0,96)13+14C2 (0,04)2 (0,96)12

= 3,0853

Phầần II

Phần phốối siêu b i ộ

Một hộp chứa 6 sản phẩm loại 1 và 4 sản phẩm loại 2 Chọn ngẫu nhiên 4 sản phẩm (không hoàn lại) Gọi X là số sản phẩm loại 1 trong số 4 sản phẩm chọn ra a/ Tìm xác suất có đúng 3 sản phẩm loại 1

b/ Lập bảng phân phối xác suất của X

c/ Tính �(�) và � ��(�)

Giải: Vì đây là chọn không hoàn lại nên X có phân phối siêu bội � ∼ �(� � �; ; ) hay (10; 6; 4) � ∼ �

Dùng Excel ta được: �(� = 3) = � � � � �� � .���� (3, 4, 6, 10, 0) = 6� 3 *10-6

� 4−3 / 10 4 = 0.3810�

Phần phốối nh th c ị ứ

Biết tỉ lệ suy dinh dưỡng ở trẻ em dưới 5 tuổi là 20% Nếu chúng ta khám 10 trẻ dưới 5 tuổi Tính xác suất để có 2 em bị suy dinh dưỡng

Như vậy k=2, n=10 và p=0,20

Xác suất có 2 trẻ bị suy dinh dưỡng

[3]

Trang 4

P(k 2;10;0;2)=10!/ 10!(8!) *(0,2) *(0,8) = 0,30

hoặc tính trong R: >dbinom (2,10,0.2)=0,30

Kết quả: Xác suất để có 2 em bị suy dinh dưỡng là 30%

phần phốối Poisson

Một trạm cho thuê xe taxi có 3 xe, hàng ngày phải nộp thuế 80 nghìn/xe Mỗi chiếc

xe cho thuê được với giá 200 nghìn/ngày Giả sử yêu cầu thuê xe của trạm là biến ngẫu nhiên X có phân phối Poisson với tham số λ = 3

a Tính xác suất trong một ngày có 3 khách thuê (lấy e 2,718 ) ≅

b Tính tiền lãi trung bình trạm thu được trong một ngày

a Xác suất để trong một ngày có 3 khách thuê xe là: P ( X = 3) =

b Gọi Y là tiền lãi trạm thu được trong một ngày, ta xét các trường hợp sau

• Không có xe nào được thuê:

P(Y= -240)=P(X=0) =

Có 1 xe được thuê:

P(Y=-40) =P(X=1)=

Có 2 xe được thuê:

P(Y=160) =P(X=2) =

Có 3 xe được thuê:

P(Y=360)=P(X=1-Vậy tiền lãi trung bình của trạm trong một ngày là:

E(Y)=-240*0,0498-40*0,1494+160*0,2241+360*0,5767=225,64 ( nghìn ) Phân bố Poisson (3.8) là phân bố xác suất của một biến ngẫu nhiên rời rạc nhận vô

số giá trị, được hoàn toàn xác định bởi tham số λ , kỳ vọng của nó

Phần phốối chu n ẩ

Thời gian để sản xuất một sản phẩm loại A là một BNN tuân theo luật

phân phối chuẩn với các tham số µ = 10 và σ = 1 (đơn vị là phút)

a) Tính xác suất để một sản phẩm loại A nào đó được sản xuất trong khoảng thời gian từ 9 phút đến 12 phút

b) Tính khoảng thời gian cần thiết để sản xuất một sản phẩm loại A bất kỳ Giải

[4]

Trang 5

Gọi X là BNN chỉ thời gian để sản xuất một sản phẩm loại A, X-N (10,1) Xác suất phải tính:

P( ɸ

= (2) -ɸ (-1)=ɸ (2)+ ɸ (1)-1ɸ

= 0,9972+0,8413-1 = 0,88185

Theo qui tắc 3 , hầu như chắc chắn X lấy giá trị trong khoảng :

[ 10-3*1; 10+3*1] = [7;13]

Vậy thời gian để sản xuất một sản phẩm loại A bất kỳ là 7 đến 13 phút ( hầu như chắc chắn )

Phầần III

Nói chung các đặc tính sinh trắc học của người khỏe mạnh (cân nặng, chiều cao, trị

số mạch, huyết áp, đường máu, số lượng hồng cầu), thường tuân theo luật phân phối chuẩn Ví dụ: xét nghiệm đường máu 100 người lớn khỏe mạnh các kết quả thu thập trong bảng 1

Bảng 1 Kết quả đường máu (mg%) 100 người lớn khỏe mạnh

10

10

10

10

10

[5]

Trang 6

Biểu đồ 1 Biểu đồ cuống-lá của đường máu

Nhìn vào biểu đồ cuống-lá ta thấy:

2 người có trị đường máu <80mg%: 2%

14 người có trị đường máu 80-89mg%: 14%

33 người có trị đường máu 90-99mg%: 33%

34 người có trị đường máu 100-109mg%: 34%

14 người có trị đường máu 110-119mg%: 13%

3 người có trị đường máu >120 mg%: 3%

Và biểu đồ tần suất (histogram) của phân phối đường máu (biểu đồ 2):

Biểu đồ 2 Phân phối đường máu của 100 người lớn khỏe mạnh

Như vậy ta thấy phân phối lượng đường máu tuân theo luật chuẩn với trị số trung bình µ=100 và độ lệch chuẩn σ=10 với:

[6]

Trang 7

68% giá trị quan sát nằm trong khoảng σ của µ.

95% giá trị quan sát nằm trong khoảng 2σ của µ

99,7% giá trị quan sát nằm trong khoảng 3σ của µ

(còn gọi là luật 68-95-99,7)

Hàm mật độ phân phối chuẩn (Normal density probability function) có dạng tổng quát như sau:

Trong đó: f(x) = 3,14159

e = 2,71828 (cơ số logarit Neper)

µ: trị số trung bình

: độ lệch chuẩn

Biến ngẫu nhiên X có đơn vị là mg% bây giờ ta muốn chuyển đơn vị đo lường của biến số X theo đơn vị đo lường tổng quát cho mọi phân phối chuẩn nghiã là theo đơn vị độ lệch chuẩn Lúc đó phân phối chuẩn theo X sẽ trở thành phân phối chuẩn tắc (Standadized normal distribution) theo biến số mới là Z

Muốn đổi hàm y=f(x) ra hàm chuẩn tắc y=f(z) ta đặt:

Thế =100 và =10 ta có:  

Như vậy khi: x=80 ; z=-2

x=90 ; z=-1

x=100 ; z=0

x=110 ; z=+1

x=120 ; z=+2

[7]

Trang 8

Và đường cong chuẩn y=f(z) sẽ là:

Hình 2 Biến đổi phân phối chuẩn (biến X) thành phân phối chuẩn tắc (Z)

Như vậy đường cong chuẩn tắc y= f(z) có trị trung bình=0 và độ lệch chuẩn=1 Tóm lại: Biến X tuân theo luật chuẩn với trung bình =0 và phương sai =2 thường được viết tắt là: X ~ N (0,2), và biến Z tuân theo phân phối chuẩn tắc có

µ=0 và phương sai =1 được viết là Z ~ N(0,1) Như vậy lúc này Z có đơn vị là độ lệch (ví dụ: 1, 2 hoặc 3 độ lệch chuẩn so với trị trung bình) và không tùy thuộc vào đơn vị đo lường theo biến X (ví dụ mg% đường máu)

Phương trình đường cong chuẩn tắc theo Z sẽ là::

[8]

Trang 9

Hình 3 Diện tích dưới đường cong chuẩn từ 0-> +1

Lúc này muốn biết xác suất đường máu từ 100-110mg% (theo X) chỉ cần tính xác suất từ 0 đến 1 đơn vị độ lệch chuẩn theo Z hoặc tìm diện tích dưới đường cong từ

0 đến 1 (phần màu đậm-hình 3) Tích phân của hàm f(z) từ 0 -> 1 chính là diện tích dưới đường cong này Trong thống kê gọi f(Z) là hàm xác suất chuẩn tích lũy (cummulative normal probability function)

Công thức tính tích phân hàm F(z) khá rắc rối thường ta dùng bảng Z-score (phần phụ lục) để tính Xem bảng khi z=0 ,z=1: F(z)=0,34

[9]

Trang 10

Như vậy xác suất P (0 ≤ Z ≤1) là 0,34 hoặc xác suất những người có trị đường máu

từ X=100mg% (tương đương với Z=0) đến X=110 mg%(tương đương với Z=1) là 34% (biểu đồ )

Các khoảng đặc biệt có thể tính nhẩm xác suất:

Một ví dụ khác: Muốn tính xác suất của z từ - đến 1,2 ta lấy: xác suất khoảng từ  - đến 0 là p=0,50 cộng với xác suất khoảng từ 0 đến 1,2 là 0,38 (xem bảng z-score phần phụ lục), tổng cộng 2 xác suất này là 0,88 (tương đương 88% người có đường máu 115mg%) (1 đơn vị z bằng 10mg%)

Trong thống kê có một vị trí rất thông dụng, được nhắc đi nhắc lại nhiều lần đó

Z=1,96 và giá tri tới hạn (critical value) Zα =0,05 (2 đuôi), vị trí mà thống kê cho rằng các giá trị nào nằm ngoài khoảng này được coi như bất thường (p=0,05) Giá trị tới hạn này cũng được dùng nhiều nhất trong thống kê y học để xác định mức có ý nghĩa thông kê (bác bỏ 1 giả thuyết không) Nếu Z >1,96, p<0,05) bác bỏ giả thuyết không và Z <1,96 chấp nhận giả thuyết không

[10]

Trang 11

Hình 4 Giá trị tới hạn (critical value) của phân phối chuẩn Z

Thực hiện ngoại kiểm tra, 5 mẫu đường máu (đều có trị số thực là 100mg%) được gởi cho 1 phòng xét nghiệm A Kết quả 5 mẫu đường máu tại phòng xét nghiệm A như sau: 100; 101; 102; 103; 104 Hỏi chất lượng của phòng xét nghiệm A? Giải:

Giả thuyết không: Ho: m= µ ; Ha: m = µ

với m=100+101+102+103+104/5=102

SD2= (100-100)2+(100-101)2 +(100-102)2 +(100-103)2 +(100-104)2 = 2.5 n-1

SD=1.58

Tra bảng với bậc tự do =4 : t= 2.77 Như vậy T >2,77 bác bỏ giả thuyết không, có

sự khác biệt giữa mẫu máu gởi đến so với kết quả của phòng xét nghiệm A Kết luận: Chất lượng phòng xét nghiệm A chưa đạt

Test T 1 mẫu trong SPSS

Analyze>Compare Means>One-sample T test

[11]

Trang 12

Nhắp glucose chuyển qua ô Test variables

Gõ 100 (trị đường máu thực sự) vào ô Test Value

Nhắp OK

Kết quả kiểm định T 1 mẫu :

N: số mẫu máu; Mean: trị trung bình; Std Deviation: Độ lệch chuẩn; Std Error Mean: Sai số chuẩn= SD; t=2.828 (giá trị tới hạn t 2 đuôi); df: bậc tự do (n-1); Sig 2-tailed): ý nghĩa TK ( 2 đuôi) p<0.047; Mean difference: Sai biệt giữa TB mẫu và trị lý thuyết (m-µ)

[12]

Trang 13

Kết luận: t=2,828, df=4, p=0,047: sự khác biệt có ý nghĩa thống kê, như vậy kết quả của phòng xét nghiệm A chưa đạt

Cả 2 ví dụ có sự khác nhau về sự bằng nhau của 2 tỉ lệ và sự bằng nhau của tỉ lệ trung bình giữa các dữ liệu đã cho

[13]

Trang 14

M c l c ụ ụ

Phần I 2

a) Tìm C = A + B, D = A.B 2

b A và B có xung khắc? A và B có đối lập? Vì sao? 2

c A, B có hợp lại thành một hệ đầy đủ không? Vì sao? 2

2 Hãy cho một ví dụ về xác suất có điều kiện mà bạn gặp trong cuộc sống và tính xác suất bạn quan tâm 2

Phần II 3

Phân phối siêu bội 3

Phân phối nhị thức 3

phân phối Poisson 4

Phân phối chuẩn 4

Phần III 5

[14]

Ngày đăng: 18/01/2025, 22:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN