Đơ n vị lấy mẫu, khung mẫuĐơn vị lấy mẫu: là đơn vị của quần thể được chọn vào mẫu Khung mẫu: Danh sách các đơn vị mẫu hoặc bản đồ phân bố mẫu.. Chọn mẫu ngẫu nhiên đơnƯu điểm: Cách l
Trang 1MẪU VÀ PHƯƠNG PHÁP
CHỌN MẪU
Ths Lê Minh Hữu
Trang 2Mục tiêu học tập
1 Xác định được quần thể đích, quẩn
thể nghiên cứu, đơn vị mẫu
2 Lựa chọn được phương pháp chọn
mẫu thích hợp
3 Dự kiến được các loại sai số trong
quá trình chọn mẫu và các biện pháp khắc phục
4 Tính được cỡ mẫu cho một nghiên
Trang 4Đơ n vị lấy mẫu, khung mẫu
Đơn vị lấy mẫu: là đơn vị của quần thể
được chọn vào mẫu
Khung mẫu: Danh sách các đơn vị mẫu
hoặc bản đồ phân bố mẫu
Đơn vị nghiên cứu: là một chủ thể mà
sự quan sát hoặc đo lường sẽ được thực hiện trên chủ thể (người hoặc vật thí nghiệm)
Trang 5Nghiên cứu về sử dụng hố xí tại xã X
200 hộ
Chủ hộ Đại diện
Khung
mẫu
Đơn vị NC
Trang 6Không đủ kinh phí
Sai số trong điều tra toàn thể
Mẫu đủ lớn sẽ ngoại suy ra toàn quần thể
Lý do chọn mẫu
Trang 7CÁC PHƯƠNG PHÁP CHỌN MẪU
Trang 8Nhiều giai đoạn
Chọn mẫu không xác suất
Thuận tiện
Chỉ tiêu
Trang 9Chọn mẫu ngẫu nhiên đơn
Trang 10Là mẫu mà tất cả các thể trong quần thể có cùng cơ hội để chọn vào mẫu
Chọn mẫu ngẫu nhiên đơn
Trang 11Chọn mẫu ngẫu nhiên đơn
Ưu điểm:
Cách làm đơn giản, tính đại diện cao
Có thể lòng vào các kỷ thuật chọn mẫu khác
Cần phải có khung mẫu
Các cá thể được chọn vào mẫu có thể phân bố tản mạn.
Trang 12Chọn mẫu ngẫu nghiên hệ
thống
Sampling interval’s width is determined
and individuals selected
Trang 13Chọn mẫu ngẫu nghiên hệ thống
Những cá thể được chọn theo một khoảng cách đều đặn
Trang 14Chọn mẫu phân tầng
Trang 15Chọn mẫu phân tầng
Là việc phân chia các cá thể của quần thể nghiên cứu thành các nhóm riêng lẽ
Lý do phân tầng: Có sự khác biệt về đặc tính nghiên cứu của các cá thể ở các tầng
Tầng có thể phân chia theo: Khu vực địa lý, giới, tuổi, nghề nghiệp…
Ví dụ: Để khảo sát các yếu tố nguy cơ gây bệnh Đái tháo đường tại thành phố CT, nhà nghiên cứu có thể phân chia tầng theo thành thị và nông thôn
Trang 16Cách chọn mẫu tầng
Thành phố CT
Nông thôn Thành thị
Phường Xã
Trang 17Cluster sample
Chọn mẫu chùm (cụm)
Trang 19Chọn mẫu chùm (cụm)
Các cụm thường là những đơn vị địa lý
(xã, ấp/khu vực) hoặc những đơn vị tổchức (các phòng khám, trường học…)
Số lượng cụm, tuỳ vào số cụm Nên chọn 30
Ví dụ: Chọn mẫu cụm trong xác định tỷ
lệ bao phủ tiêm chủng trẻ dưới 5 tuổi của tỉnh X
Trang 20Dân số
chọn mẫu Mẫu cụm bậc 1 Mẫu cụm bậc 2
Chọn mẫu chùm (cụm)
Trang 21Chọn mẫu PPS – Xác suất tỷ lệ với kích
cỡ của quần thể
Sử dụng khi nghiên cứu trên cộng đồng
lớn, kích thước các cộng đồng không đều nhau
Các bước thực hiện
1 Liệt kê các cụm và dân số
2 Xếp các cụm theo một trình tự và cộng dồn
3 Chọn khoảng cách mẫu k = Dscd/số cụm
4 Chọn ngẫu nhiên con số i nào đó, chọn
cụm đầu tiên có dân số cộng dồn lớn hơn hoặc bằng i
5 Các cụm kế tiếp tính bằng cách lấy i + k
Trang 22Ví dụ
Một nghiên cứu về tình trạng sâu răng của học sinh tiểu học tại quận Ninh kiều TPCT
Cỡ mẫu: 300 học
Số lượng trường tiểu học là 10
Số lượng trường tiểu học cần chọn là 4
Trang 23Tên trường và số lượng học sinh
Trang 25Tính khoảng cách k
Tên
Trường Số lượng Cộng dồn
Khoảng cách k
Trang 26Chọn số ngẫu nhiên i <= k
Tên
Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm
Trang 27Chọn các cụm còn lại
Tên
Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm
Trang 28Tính tổng học sinh của các trường được chọn
Tên
Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm Mẫu
Trang 29Tính cỡ mẫu cho các trường n i = (n x N i )/N
Tên
Trường Số lượng Cộng dồn
Khoảng cách
Chọn cụm Mẫu
Trang 30Chọn mẫu nhiều giai đoạn
Trong những quần thể rất lớn và rải khắp mẫu có thể được tiến hành theo hai hoặc nhiều giai đoạn
Thường là những nghiên cứu dựa trên cộng đồng, trong đó người được phỏng vấn thuộc những làng khác nhau, vànhững làng này đã được chọn từ những khu vực khác nhau
Trang 31Ví dụ
Ví dụ: ĐBSCL có 13 tỉnh, mỗi tỉnh có nhiều huyện, mỗi huyện có nhiều xã
Giai đọan 1: Chọn ngẫu nhiên 3 tỉnh;
Giai đọan 2: Chọn ngẫu nhiên 2 huyện từ các tỉnh đã được chọn ở giai đoạn 1
Giai đọan 3: Chọn ngẫu nhiên 2 xã từ các huyện đã được chọn ở giai đoạn 2,
Giai đoạn 4: Chọn ngẫu nhiên 2 ấp từ xã
Giai đoạn 5: Chọn ngẫu nhiên 30 cá thể từ mỗi ấp
Trang 32Chọn mẫu không xác xuất
Chn mu thun tin
Đạt được trên cơ sở các cá thể có sẵn khi thu thập số liệu
Ví dụ: Tất cả các bệnh nhân đến khám tại phòng khám hằng ngày
Đây là cách chọn mẫu hay gặp trong nghiên cứu lâm sàng
Trang 33Chọn mẫu không xác xuất
Chn mu ch tiêu
Là phương pháp đảm bảo rằng một sốnhất định các đơn vị mẫu từ các loại khác nhau của quần thể nghiên cứu với các tính đạc trưng sẽ có mặt trong mẫu
Trang 34Chọn mẫu không xác xuất
Đây là cách hay dùng trong các điều tra
Trang 35Các sai số thường gặp trong chọn mẫu
Sự không đáp ứng
Nghiên cứu với người tình nguyện
Sai số do mùa
Sai số do đường xá
Trang 36Chuẩn hoá phương pháp thu thập số liệu
Giải thích các đối tượng trước khi thu thập số liệu
Nếu vằng mặt thì người điều tra phải quay lại gặp cho bằng được.
Nếu đối tượng không muốn hợp tác thì phải xem xét lại đối tượng này để tìm ra các đặc điểm khác với những đối tượng tham gia.
Trang 37CỠ MẪU
Trang 38Các yếu tố ảnh hưởng đến cỡ
mẫu
Loại thiết kế nghiên cứu
Phương pháp chọn mẫu
Độ lớn của tham số được nghiên cứu
Mức độ sai lệch tham số mẫu và tham
số quần thể
Khả năng thực thi
Trang 39Cỡ mẫu cho việc ước tính tỷ lệ trong
quần thể
2
2
2 / 1
) 1
(
d
p
p Z
= −α
Khoảng sai lệch
Mức ý nghĩa thống kê
Hệ số tin cậy
0,1 0,05
0,05 0,01
Trang 41Ví dụ
Trưởng phòng y tế huyện muốn xác định
tỷ lệ SDD của trẻ dưới 5 tuổi trong huyện hiện tại là bao nhiêu Giả sử rằng bạn sử dụng kỷ thuật chọn mẫu ngẫu nhiên, hãy tính cỡ mẫu cần thiết cho cuộc điều tra này Biết rằng tỷ lệ SDD chung của quốc gia là 30%, độ tin cậy là95%, sai số tuyệt đối là 5%
Trang 42Cách tính cỡ mẫu
2
2
2 / 1
) 1
(
d
p
p Z
= −α
Khoảng sai lệch
Mức ý nghĩa thống kê
Hệ số tin cậy
0,05 0,05
1,96
0,3
323
Trang 43Ước lượng tỷ lệ với sai số tương
)
(
) 1
Trang 44Quần thể hữu hạn
P là kích thước của dân số đích và
Nhc là cỡ mẫu sau khi đã hiệu chỉnh
Với ví dụ trên, dân số trẻ dưới 5 tuổi trong huyện là 1000 thì số trẻ cần cho
P N
Trang 45Cỡ mẫu cho việc kiểm định 1 tỷ lệ
2 0
2 1
0 0
2 / 1
)(
})1
()
1({
p p
p p
Z p
p
Z n
a
a a
−
−+
−
p0 là tỷ lệ cần kiểm định
pa là tỷ lệ thật trong quần thể
α: là xác suất của việc phạm phải sai lầm loại I
β: Là xác suất của việc phạm phải sai lầm loại II
1- β gọi là lực mẫu
Lực mẫu là 80%; Z=0,86
Lực mẫu là 90%; Z=1,28
Lực mẫu là 95%; Z=1,65
Trang 46Giả sử tỷ lệ thành công trong phẫu thuật của một loại tim mạch đã được báo cáo trong y văn là 70% Một phương pháp mới điều trị nội khoa đang được đề nghị có hiệu quả tương đương Một bệnh viện không có phương tiện phẫu thuật nên muốn áp dụng phương pháp điều trị mới Muốn 90% khả năng để chứng minh tác dụng tương đương của phác đồ điều trị nội khoa so với phẫu thuật, với độ chính xác là 10%, ở mức tin cậy
Trang 47Cỡ mẫu cho việc kiểm định 1 tỷ lệ
2 0
2 1
0 0
2 / 1
) (
} ) 1
( )
1 ( {
p p
p p
Z p
p
Z n
a
a a
−
− +
Trang 48Cỡ mẫu cho nghiên cứu bệnh
(
1)
1(
1)
1
2
2 / 1
p p
p p
Z n
εα
)1
1
1 2
p p
OR
p
OR p
−+
×
×
=
Trong đó
Trang 49Cỡ mẫu cho nghiên cứu bệnh
chứng
2 2 1
2 2
2 1
1 1
2 2
2 / 1
) (
} ) 1
( )
1 ( )
1 ( 2
{
p p
p p
p p
Z p
− +
−
Trang 50Cỡ mẫu cho nghiên cứu đoàn hệ
1 2
2
2 /
1 (1 ) (1 )
)1
p p
p
Z n
ε
α
Trang 51Cỡ mẫu cho nghiên cứu đoàn hệ
2 2 1
2 2
2 1
1 1
*
* 2
/ 1
) (
} ) 1
( )
1 ( )
1 ( 2
{
p p
p p
p p
Z p
− +
−
= −α −β
p*= (p1 + p2 )/2
Trang 52Cỡ mẫu trong nghiên cứu đối
với giá trị trung bình
trung bình trong qun th
2
2 2
2 / 1
σ: Độ lệch chuẩn quần thể
Trang 53Cỡ mẫu trong nghiên cứu đối
với giá trị trung bình
C mu cho vic kim đnh mt
2 0
2 1
2 / 1
2
) (
) (
a
Z
Z n
µ µ
−
+
Trang 54Hiệu lực thiết kế (Design Effect): D
Sử dụng trong nhiều trường hợp chọn
mẫu: mẫu cụm, chọn mẫu nhiều giai đoạn
Đễ đảm bảo tính chính xác của mẫu,
nhà nghiên cứu thường nhân cỡ mẫu với một hệ số gọi là hiệu lực thiết kế
(ký hiệu D)
Giá trị của D: 1,5 - 2…Thông thường
Trang 55Tiêu chí đưa vào và loại ra
Tiêu Chí Đưa Vào
Những thuộc tính cu cuảảảả dân s dân s dân sốốốố m m mụụụục tiêu c tiêu
Tiêu Chí Loại Ra
Những thuộc tính không ph không phùùùù hhhhợợợợpppp
Không làààà ph Không l ph phầầầần ph n ph n phụụụụ của tiêu chí đưa vào
Trang 56THỰC TRẠNG BỆNH ĐÁI THÁO ĐƯỜNG VÀ CÁC YẾU TỐ NGUY CƠ Ở LỨA TUỔI 25 – 64
TẠI THÀNH PHỐ CẦN THƠ NĂM 2005
Đề tài
Trang 57MỤC TIÊU NGHIÊN CỨU
1 Xác định tỷ lệ hiện mắc bệnh ĐTĐ của
người dân trong độ tuổi từ 25 – 64 tại thành phố Cần Thơ.
2 Xác định một số yếu tố nguy cơ gây bệnh
ĐTĐ ở người dân trong độ tuổi từ 25 – 64
và đánh giá mức độ liên quan qua lại của các yếu tố nguy cơ này đối với bệnh ĐTĐ.
Trang 58Tiêu chí lựa chọn: Người dân trong độ
tuổi từ 25 – 64 tuổi, có hộ khẩu thường trú tại thành phố Cần Thơ
Các trường hợp loại trừ: Các đối
tượng nằm bệnh viện, bỏ địa bàn, bị
Trang 59Học viên thảo luận
1 Xác định quần thể đích, quần thể
nghiên cứu, khung mẫu (nếu có) cho nghiên cứu của nhóm
2 Tiêu chí chọn mẫu; tiêu chí loại trừ
3 Lựa chọn phương pháp chọn mẫu
thích hợp: Mô tả cụ thể
4 Tính cỡ mẫu