1. CHỌN MẪU VÀ TÍNH TOÁN CỠ MẪU 2. Chọn mẫu? Nếu tất cả các cả thể của một quần thể đều giống nhau, chúng ta có một quần thể thuần nhất (homogenous). Khi đó, đặc tính của mỗi cá thể cũng chính là của quần thể. Không có sự khác nhau/ giao động tính chất giữa các cá thể. 3. Chọn mẫu? Khi các cá thể trong một quần thể khác nhau, chúng ta có một quần thể hỗn tạp/ không thuần nhất (heterogeneous). Khi đó đặc tính của một cá thể bất kỳ không mang tính đại diện cho cả quần thể. Có sự khác nhau/ giao động giữa các cá thể. Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát được tất cả các cá thể, người ta phải chọn một số lượng cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các cá thể của quần thể để quan sát.
Trang 1CHỌN MẪU VÀ
TÍNH TOÁN CỠ MẪU
TS Hà Anh Đức
Trang 2Mục tiêu bài giảng
Hiểu các lý do phải chọn mẫu
Nắm được các phương pháp chọn mẫu
Phân biệt giữa các phương pháp chọn mẫu ngẫu nhiên và không ngẫu nhiên
Nắm được ưu, nhược điểm các phương pháp chọn mẫu
Trang 3Mẫu là gì
Mẫu là tập hợp nhỏ các đối tượng (kỳ vọng
mang tính đại diện) từ quần thể sử dụng để xác định sự thật của một quần thể (Field 2005);
Trang 4Lý do phải chọn mẫu?
Nếu tất cả các cả thể của một quần thể đều
giống nhau, chúng ta có một quần thể thuần
nhất (homogenous) Khi đó, đặc tính của mỗi
cá thể cũng chính là của quần thể Không có sự khác nhau/ giao động tính chất giữa các cá thể
Trang 5Lý do phải chọn mẫu?
Nguồn lực (thời gian, tài chính) và khối lượng công việc
Cung cấp kết quả với độ chính xác có thể tính bằng
phương pháp toán học
Quần thể hỗn tạp/ không thuần nhất (heterogeneous
Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát được tất cả các cá thể, người ta phải chọn một số lượng
cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các
cá thể của quần thể để quan sát.
Trang 6Chọn mẫu
Quần thể quan tâm là gì?
Bạn muốn minh họa kết quả nghiên cứu cho quần thể nào?
Sinh viên,
Bác sỹ;
Phụ nữ 15-59
Có thể chọn cả quần thể không?
Trang 7Minh họa việc chọn mẫu?
Suy ra
Trang 8Yêu cầu việc chọn mẫu?
Mẫu của một quần thể phải suy ra được những thông tin hữu ích về quần thể đó Do vậy, mẫu phải đảm bảo
có được những biến thiên cơ bản giữa các cá thể như
ở quần thể
Một quần thể càng không đồng nhất…
Thì sác xuất một mẫu khó có thể mô tả quần càng lớn
Sẽ là một sai lầm nếu suy đặc tính của mẫu thành đặc tính của quần thể.
Và…
Thì số lượng cá thể của mẫu phải càng lớn để có thể mô
tả quần thể tốt Một mẫu phải có số lượng cá thể đủ lớn
để cho thể suy đặc tính của mẫu thành của quần thể
Trang 9Định nghĩa và phân loại chọn mẫu
Chọn mẫu là một quy trình lựa chọn cá thể từ quần thể cho quan sát, để có thể coi kết quả quan sát mẫu thành kết quả quan sát quần thể, ở một mức độ chấp nhận mà xác định được
Mẫu là đại diện của một quần thể Mức độ đại diện phải
được xác định/ đo lường được
Có hai cách chọn mẫu:
Chọn mẫu không ngẫu nhiên
Chọn mẫu ngẫu nhiên
Trang 10Các khái niệm cơ bản
Toàn thể: Là tập hợp lý thuyết của tất cả các cá thể, không xác
định không gian và thời gian
Quần thể: Là tập hợp lý thuyết của tất cả cá thể theo một đặc
tính, trong một khoảng không gian và thời gian xác định.
Mẫu/ quần thể quan sát được: Là tập hợp một số lượng cá
thể, lựa chọn từ một quần thể trên một đặc tính mẫu quan tâm
Đặc tính mẫu: Là cơ sở để xác định, lựa chọn cá thể của quần
thể vào một mẫu, có số lượng cá thể ít hơn, ví dụ cá thể một quần thể người có thể là cá thể người, hộ gia đình, làng/ xóm
Danh sách/ khung mẫu: Là danh sách các cá thể của một
quần thể, giúp hỗ trợ kỹ thuật cho quá trình chọn mẫu
Cỡ mẫu: Là số lượng cá thể được lựa chọn từ một số lượng
xác định/ không xác định cá thể của quần thể vào một tập hợp mẫu.
Sức mạnh mẫu: Là mức độ suy diễn kết quả thống kê trên mẫu
thành kết quả của quần thể
Trang 12Phân loại phương pháp chọn mẫu
Chọn mẫu
Ngẫu nhiên
Ngẫu nhiên đơn Theo cụm
Hệ thống Phân tầng
Không ngẫu nhiên
Chỉ tiêu Chủ đích
Thuận tiện Ném bóng
tuyết
Trang 13Chọn mẫu ngẫu nhiên
Áp dụng khi quần thể nhỏ, khá thuần nhất
Đảm bảo mỗi cá thể của quần thể được lựa chọn với xác suất như nhau vào mẫu
Ghép cặp mỗi cá thể với một số ngẫu nhiên, các cá thể được lựa chọn theo sự ngẫu
nhiên của con số
Sác xuất lựa chọn = Cỡ mẫu
Tổng số cá thể của quần thể
Trang 14Chọn mẫu ngẫu nhiên đơn
Khoảng cách giữa các cá thể là ngẫu nhiên, không có quy luật nào
Trang 15 Ưu điểm
Không cần nhiều thông tin về quần thể
Tính gía trị cao, xác định được sai số thống kê
Dễ dàng phân tích dữ liệu
Hạn chế
Yêu cầu danh sách cá thể trong quần thể
Không khả thi nếu khung mẫu lớn
Không cần chuyên môn của nghiên cứu viên
Trang 16 Chọn mẫu hệ thống
Cá thể đầu tiên được lựa chọn ngẫu nhiên trong quần thể, các cá thể tiếp theo được lựa chọn theo một khoảng cách xác định (10th) so với cá thể trước đó Khoảng
cách xác định được gọi là khoảng cách
mẫu k = Tổng số cá thể của quần thể/ cỡ mẫu
Trang 17Chọn mẫu hệ thống
Khoảng cách giữa các cá thể bằng nhau
Mang tính quy luật
Trang 18 Ưu điểm
Chi phí hợp lý, hay được sử dụng
Tính gía trị cao, xác định được sai số thống kế
Trang 19 Chọn mẫu phân tầng
Chia quần thể theo một đặc tính cụ thể thành các nhóm/
tầng (strata) (Ví dụ: Chia quần thể lớp cao học thành 3
nhóm/ tầng: Nội tiêu hóa, tim mạch, sản)
Các cá thể trong mỗi tầng đồng nhất, nhưng không đồng
nhất giữa các tầng
Có thể áp dụng chọn mẫu ngẫu nhiên đơn hay chọn mẫu
hệ thống ở mỗi tầng (strata) Số mẫu mỗi tầng tham giavào tổng mẫu có thể bằng nhau (chọn mẫu phân tầng
không cân xứng) hay tỷ lệ với số cá thể của mỗi tầng
(chọn mẫu phân tầng cân xứng)
Trang 20Tầng 1 Tầng 2
Chọn mẫu phân tầng không cân xứng
1000 1000
Trang 21Tầng 1 Tầng 2
Chọn mẫu phân tầng cân xứng
Trang 23 Chọn mẫu theo cụm/ chùm
Là một ví dụ của chọn mẫu 2 bước
Bước 1: Chọn cụm thường là cụm địa lý nơi các các thể sinh sống
Bước 2: chọn cá thể trong cụm
Phương pháp hay được sử dụng khi
không có danh sách cá thể của quần thể
Trang 24 Xác định được đặc điểm của cả cụm và quần thể
Ưu tiên dùng khi quần thể quá lớn, ví dụ như cả một quốc gia.
Thường sử dụng đánh giá chương trình TMCR
Hạn chế
Sai số lớn hơn so với các phương pháp ngẫu nhiên khác
Trang 25 Tốt nhất cho các nghiên cứu khi các cá thể trong cùng 1 tầng thuần nhất
Trang 26Phân loại các phương pháp
chọn mẫu
Chọn mẫu
Ngẫu nhiên
Ngẫu nhiên đơn Theo cụm
Hệ thống Phân tầng
Không ngẫu nhiên
Chỉ tiêu Chủ đích
Thuận tiện Ném bóng
tuyết
Trang 27Chọn mẫu không ngẫu nhiên
Chọn mẫu thuận tiện
Cá thể được lựa chọn vào mẫu một cách
“thuận tiện”, sẵn có và dễ tiếp cận
Lý do lựa chọn: nhanh và chi phí thấp
Phải giải trình và đánh giá giá trị nếu
chọn mẫu thuận tiện.
Trang 28 Độ biến thiên và sai số không đo lường
và kiểm soát được.
Khó giải trình việc suy luận kết quả thống
kê trên mẫu ra của quần thể.
Trang 29 Khó giải trình việc suy luận kết quả thống kê
trên mẫu ra của quần thể
Trang 30 Chọn mẫu theo chỉ tiêu
Mẫu đảm bảo đặc tính của quần thể, đại diện ở một mức độ mà nghiên cứu viên mong muốn
Trang 32 Chọn mẫu “Ném bóng tuyết“
(Snowball sampling)
Chọn mẫu bắt đầu từ một cá thể, được chọn một cách ngẫu nhiên hay không ngẫu nhiên Các cá thể tiếp theo được chọn từ cá thể ban đầu hay trước đó
Trang 33 Khó giải trình việc suy diễn kết quả thống
kê trên mẫu ra của quần thể.
Trang 34Tính toán cỡ mẫu
Thông tin/ dữ liệu cần thiết
Loại nghiên cứu
Các thuật toán thống kê sử dụng
Đặc tính của cá thể - Thể hiện qua biến số (khác biệt cơ bản giữa biến liên tục – biến phân hạng) Kết quả các nghiên cứu trước được đưa vào làm cơ sở tính toán
Độ tin cậy (95%, 90%)
Gía trị p chấp nhận kết quả kiểm định (0,05/ 0,001)
Mức độ biến thiên của kết quả mẫu so với kết quả thực của quần thể (độ chính xác tương đối)
Sức mạnh của mẫu nói lên mức độ kết quả mẫu đại
diện cho kết quả của quần thể
Trang 35Tính toán cỡ mẫu
Tính toán cỡ mẫu đơn giản:
Dựa vào công thức cơ bản,
Không tính đến thiết kế nghiên cứu,
Không tính đến các thuật toán thống kê sử dụng trong thiết kế
Tính toán đơn giản, bằng máy calculator
Trang 36Tiêu chí ước lượng cỡ mẫu dựa trên thiết kế
nghiên cứu
NC Mô tả NC Phân tíc và thử nghiệm
cứu chính
của biến số (trung bình, tỷ lệ)
- B4a: chỉ ra giá trị kỳ vọng của quần
- Khung: power analysis
để chứng minh giả thuyết
- B3: lựa chọn xác định quần thể quan tâm
- B4a: Chỉ ra giá trị kỳ vọng về sự