MẪU NGẪU NHIÊN VÀ CÁCH CHỌN MẪU

Một phần của tài liệu Tài liệu giảng dạy môn Xác suất thống kê y học (Trang 39 - 43)

Trong phần xác suất, nếu ta biết trước quy luật phân phối của biến ngẫu nhiên thì ta có thể xác định được một số đại lượng liên quan, chẳng hạn: trung bình, phương sai, xác suất,…

Tuy nhiên, trong thực tế khi nghiên cứu về biến ngẫu nhiên ta không thể xác định chính xác quy luật phân phối của nó, chẳng hạn: nghiên cứu về X: là số người đến trạm bưu điện trong một ngày; Y: trọng lượng của người Việt Nam; Z: năng suất của một giống lúa; T là số người khỏi bệnh khi điều trị…Vì các đối tượng quan sát rất lớn nên ta không thể quan sát hết các đối tượng đó. Do đó không thể xác định được các đại lượng trung bình, phương sai, xác suất,…

Và ta có một phương pháp rất hữu hiệu để giải quyết vấn đề trên, gọi là phương pháp thống kê, có thể mô tả như sau: Ta quan sát một số hữu hạn các đối tượng và ghi lại số liệu của chúng. Trên cơ sở các số liệu quan sát được, thông qua các mô hình ước lượng hay kiểm định ta có thể đưa ra kết luận cho luật phân phối, kỳ vọng, phương sai, xác suất,…của biến ngẫu nhiên mà ta khảo sát .

1. Đám đông(tổng thể)

Trong thống kê toán học, ta hiểu đám đông là tập hợp toàn bộ các đối tượng mà ta quan tâm nghiên cứu. Chẳng hạn: các sản phẩm làm ra trong môt ca làm việc; các trái cây trong một vụ thu hoạch ở nông trường; các sinh viên trong một trường đại học nào đó; các cửa hàng trong một thành phố nào đó; …

Kí hiệu đám đông(tổng thể): ; còn , là cá thể (phần tử) của tổng thể .

Với mỗi đám đông  ta có thể xác định một đặc tính định lượng X- là biến ngẫu nhiên. Chẳng hạn: X là độ bền của sản phẩm; X là lượng đường có trong một loại trái cây; X là điểm học tập của sinh viên tại một trường đại học; X là doanh thu của cửa hàng trong một thành phố nào đó;…

Giả sử X là đặc tính cần nghiên cứu của đám đông  . Tiến hành chọn ngẫu nhiên n phần tử từ đám đông  để nghiên cứu về đặc tính X. Ta gọi:

X1 là giá trị của X trên phần tử thứ nhất X2 là giá trị của X trên phần tử thứ hai .

. .

Xn là giá trị của X trên phần tử thứ n

Và ta gọi bộ gồm n đại lượng (X1, X2, …, Xn) là mẫu ngẫu nhiên

Chú ý:

* Các Xi cũng là các biến ngẫu nhiên có luật phân phối xác suất trùng với luật phân phối xác suất của X.

* Với một bộ giá trị quan sát cụ thể (x1, x2, …, xn) của mẫu ngẫu nhiên (X1, X2, …, Xn) gọi là mẫu quan sát(hay là mẫu thực nghiệm)

3. Các phương pháp chọn mẫu ngẫu nhiên

Trong thống kê các kết luận cho tổng thể thường dựa trên mẫu ngẫu nhiên, chính vì vậy cần đảm bảo tính khách quan trong phương pháp lấy mẫu

* Mẫu ngẫu nhiên có hoàn lại : Mỗi phần tử vừa quan sát xong, bỏ trở vào tổng thể trước khi quan sát phần tử tiếp theo.

* Mẫu ngẫu nhiên không hoàn lại: Mỗi phần tử vừa quan sát xong, ta không bỏ trở vào tổng thể trước khi quan sát phần tử tiếp theo.

Chú ý: Nếu số phần tử của tổng thể lớn thì hai phương pháp lấy mẫu trên được xem là như nhau. Và mẫu ngẫu nhiên lấy được gọi là mẫu ngẫu nhiên độc lập.

* Mẫu cơ học: Ta đánh số tất cả các phần tử của đám đông, ấn định kích thước n của mẫu, rồi dùng bảng số ngẫu nhiên(phần mềm) để chọn

* Mẫu ngẫu nhiên đặc trưng: Ta chia đám đông  thành các nhóm( chia theo địa lý; chủng loại; tính chất; …), rồi ấn định tỉ lệ phần trăm cho các nhóm, sau đó chọn ngẫu nhiên các phần tử của nhóm theo tỉ lệ đã định

4. Cách ghi mẫu quan sát(số liệu)

Sau khi tiến hành quan sát đặc tính X trên n phần tử của tổng thể, ta có được số liệu(mẫu quan sát) được ghi lại dưới 3 hình thức:

a) Nếu cỡ mẫu khá nhỏ thì số liệu được ghi: X: x1 x2 … xn

b) Nếu cỡ mẫu khá lớn thì số liệu được ghi dưới dạng bảng tần số:

X x1 x2 xm

Trong đó: + ni : tần số của giá trị xi

+ n1+n2+…+ nm =n.

Ví dụ 3.1: Để ước lượng tổng doanh thu (triệu đồng/tháng) của một công ty gồm 380 cửa hàng trên toàn quốc trong một tháng, người ta lấy ngẫu nhiên 10% số cửa hàng và có được doanh thu trong một tháng là

Biểu đồ tần số

c) Khi kích thước mẫu lớn, các giá trị của mẫu gần nhau, khi đó số liệu mẫu được ghi theo khoảng

X x1 - x2 x2 – x3 xk - xk+1

Số phần tử n1 n2 nk

(n1+n2+…+ nk =n)

Chú ý: + Số khoảng k được xác định là số nhỏ nhất sao cho 2k > n

+ Độ dài mỗi khoảng (d) phải bằng nhau và được xác định: d = xmax xmin

k

Ví dụ 3.2: Quan sát trọng lượng của một nhóm 108 người ở độ tuổi từ 30-50 ta có kết quả:

5. Bảng tần suất + Đặt n n f i i  , i = 1, 2, …, m. Với ni là tần số của xi

+ Ta gọi filà tần suất của giá trị xi

Doanh thu 20 40 60 80

Số cửa hàng 8 16 12 2

Trọng lượng <40 40-45 45-50 50-55 55-60 60-65 65-70 70-75 >75 Số người 4 15 20 23 24 10 6 4 2

+ Ta có bảng tần suất được mô tả như sau: X x1 x2 xm Số phần tử f1 f2 fm Hay X x1 - x2 x2 – x3 xk - xk+1 Số phần tử f1 f2 fk

Ví dụ 3.3: Từ hai bảng tần điều tra về doanh thu của cửa hàng, ta có bảng tần suất Doanh thu 20 40 60 80

Tần suất 0,21 0,42 0,32 0,05

Biểu đồ tần suất

6. Phân phối mẫu tích lũy

Giả sử đặc tính X của  có hàm phân phối F(x) chưa biết . (X1, X2, …, Xn) là mẫu ngẫu nhiên của X, (x1, x2, …, xn) là mẫu quan sát. Ta gọi hàm số sau là hàm phân phối mẫu tích lũy của X: n x M x F*( ) ( )

Trong đó: M(x) là số các xi thỏa xi < x, (i=1, 2, …,n)

Tính chất của F*(x)

* *( )

x

F xác định duy nhất với mỗi mẫu thực nghiệm

* sup *( ) ( ) 0      n R x x F x F

7. Định lý giới hạn trung tâm

Nếu X1, X2, …, Xn là các biến ngẫu nhiên độc lập có cùng phân phối với trung bình i

phương sai i2 hữu hạn thì 1 1 2 1 ~ (0;1) n n i i XX i i n i i X Z N       

II. CÁC ĐẶC TRƯNG MẪU VÀ QUY LUẬT PHÂN PHỐI1. Thống kê mô tả( Các đặc trưng mẫu)

Một phần của tài liệu Tài liệu giảng dạy môn Xác suất thống kê y học (Trang 39 - 43)