CÁC PHƯƠNG PHÁP CHỌN MẪU
2.1.3. Các kiểu thiết kế mẫu
ôỔ Chọn mẫu ngấu nhiờn đơn giản (simple random 91
sampling), cén gọi là mẫu xác suất không đều.
Đây là phương pháp chọn mẫu trong đó các thành viên của tổng thể được đánh số sau đó lựa chọn một cách ngẫu nhiên theo danh sách hoặc chọn theo những số ngẫu nhiên do máy tính tạo ra. Các chương trình máy
tính hiện đại như phẩn mềm SPSS có cài sẵn các chương trình này, máy sẽ chọn ra các số ngẫu nhiên sau khi ta định rõ khoảng trong đó có các con số này. Với bất kỳ phương pháp chọn số ngẫu nhiên nào, mỗi số đều có
cơ hội được chọn ngang nhau.
ô Chon mẫu ngẫu nhiờn hệ thống (systematie sampling) còn gọi là phương pháp chọn mẫu theo xác suất đều.
Đây là phương pháp chọn mẫu xác suất, trong đó những thành viên thứ n trên một khung mẫu được lựa
chọn vào mẫu, sau khi đã lựa chọn được một số đầu tiên ngẫu nhiên. Chẳng hạn ta muốn có một mẫu gồm 200 sinh viên được rút ra từ một tổng thể gầm 5.000 sinh viên của một trường đại học, trước hết ta có một khung mẫu gầm tất cả 5.000 sinh viên được đánh số thứ tự từ 1 đến 5000. Sau đó trong khoảng từ 1-25, chọn ngẫu
nhiên một số nào đó, chẳng hạn số 10. Như vậy, những người có số thứ tự 10, 35, 60, 75... (cách một khoảng đều là 25) được chọn cho tới khi đủ 200 người.
Điều kiện để thiết kế mẫu ngẫu nhiên hệ thống là
danh sách các thành viên của khung mẫu được xếp ngẫu
nhiên (eó thể theo thứ tự tén A, B, C...) không theo một
trật tự thiên vị nào.
92
Vớ dụ: Cử tổng thể — 10.000
Khoảng mẫu =Z—————————= = 100 Cỡ mẫu 100
Cỡ mẫu 100
Tỷ lệ mẫu =T——————— = “——— = 1/100 Tổng thể 10.000
* Chon mdéu phan téng (stratified sampling) Kích cõ cla mau va tinh déng nhất của mẫu là hai nhân tố ảnh hưởng trực tiếp đến sai số mẫu. Mẫu càng lớn thì sai số chuẩn càng nhỏ và ngược lại, mẫu càng nhỏ thì sai số mẫu càng lớn. Mẫu không đồng nhất sẽ sinh ra sai sế mẫu lớn và ngược lại mẫu đồng nhất sẽ sinh ra sai số nhỏ.
Mẫu phân tầng là một phương pháp tổ chức tổng thể thành những tầng có tính đồng nhất để chọn mẫu nhằm đạt mức đại điện tốt nhất. Do tổng thể khó có tính đồng nhất nên người ta chia tổng thể thành các nhóm nhỏ (phân tầng) để tăng tính đồng nhất trong các tiểu mẫu và sau đó mới chọn ra những khách thể từ những nhóm đồng nhất này tạo thành mẫu. Thông thường người ta chia khung mẫu thành nhiều tầng, dựa theo giới tính, dân tộc, khu vực, tuổi, trình độ học vấn, điều kiện kinh tế, kinh nghiệm nghề... vì những yếu tế này có khả năng ảnh hưởng đến những câu trả lời.
Mẫu phân tầng thường được thiết kế kết hợp với mẫu ngẫu nhiên đơn giản hoặc mẫu ngẫu nhiên hệ thống.
Trước hết ta phân loại các thành phần của tổng thể vào 93
các nhóm cụ thể dựa trên các biến phân tẳng được sử dụng (các tiểu mẫu). Sau đó trên cơ sở các nhóm với tỷ lệ tưởng đối đại diện cho tổng thể, ta chọn ngẫu nhiên đơn giản hay ngẫu nhiên hệ thống. Ví dụ, để chọn một mẫu sinh viên đại điện cho thành phố hay cả nước nhằm đánh giá lối sống của họ có thể phân tâng thành các nhóm sinh viên sau: công lập/đân lập, nam/nữ, khu vực (Hà NộƯĐà Nẵng(thành phế Hồ Chí Minh), sinh viên
nội trú (sống trong ký túc xá)/ngoại trú... theo một tỷ lệ tương đối cân xứng trong tổng thể sinh viên. Rồi từ những nhóm này lập khung mẫu (danh sách) chọn theo phương pháp ngẫu nhiên đơn giản hay ngẫu nhiên hệ thống.
Trong mẫu phân tầng những tiểu nhóm quyết định thường được chọn mẫu nặng hơn (chọn nhiều hơn) các nhóm khác. Kỹ thuật điều chỉnh hay chọn mẫu không cân xứng này được tiến hành để tạo ra một số lượng đủ lớn ở các nhóm chính trong mẫu đáp ứng mục tiêu
nghiên cứu. ‘
° Mẫu cụm nhiều giai đoạn (multistage cluster sampling)
Mẫu cụm nhiều giai đoạn được thiết kế khi ta không thể thu thập được một danh sách day đủ các thành phần từ tổng thể để thiết kế mẫu. Chẳng hạn sinh viên của tất cả các trường đại học đóng trên địa bàn Hà Nội hoặc tất cả sinh viên các trường đại học trong cả nước.
Mẫu cụm khác với mẫu phân tầng ở chỗ: trong mẫu phân tầng, mỗi tầng là một nhóm đồng nhất (các tầng 94
được tạo ra do mục tiêu của sự chọn mẫu nhằm làm
tăng tính đại diện). Trong khi đó, ở cách chọn mẫu cụm nhiều giai đoạn, các cụm lại liên kết các nhóm không đồng nhất.
Cách chọn mẫu cạm nhiều giai đoạn đòi hỏi trước hết phải tạo ra một danh sách các cụm không đồng nhất, sau đó chọn mẫu. Từ mẫu khởi đầu gồm các cụm đại diện cho tổng thể ta lại tạo ra một danh sách gồm các thành phần của từng cụm, sau đó chọn mẫu gồm các
thành phần đại diện cho từng cụm. Như vậy, mẫu cụm nhiều giai đoạn liên quan đến sự lặp đi lặp lại hai bước cơ bản: lập danh sách và chọn mẫu ngẫu nhiên.
Điều quan trọng nhất trong mẫu cụm là danh sách của tất cả các yếu tố được yêu cầu cho các đơn vị mẫu cuối cùng không cần phải có từ đầu mà chỉ cần có trong danh sách các cụm.
Chọn mẫu cụm thường được thiết kế phối hợp với chọn mẫu phân tầng. Trước hết chọn các cụm sau đó chọn các tiểu nhóm (các tẳng) trong mỗi cụm, rồi đến các đơn vị (cá nhân) trong các tầng. Ví dụ, để chọn dude một mẫu học sinh trung học phổ thông đại diện cho Thành phố Hà Nội ta có thể tiến hành một số bước sau:
1. Lập danh sách tất cả các trường trung học phổ thông. Từ danh sách này ta phân thành hai cụm: trung học phổ thông công lập và trung học phổ thông dân lập.
Từ hai cạm lớn này phân thành các cụm nội thành ngoại thành. Căn cứ theo tỷ lệ các trưởng công lập/dân lập, nội thành/ngoại thành. Sau dé ta lap danh sách các 95
trường cho từng cụm, rồi dùng phương pháp ngẫu nhiên hệ thống hay ngẫu nhiên đơn giản để chọn ra các trường.
2. Từ các danh sách các trường được chọn, ta lập danh sách các lớp trong từng khối (phân tầng) căn cứ theo tỷ lệ các khối lớp, chọn ngẫu nhiên ra các lớp.
3. Lập đanh sách học sinh ở các lớp đã chọn lại phân tầng theo giới tính, tuổi, điểu kiện kinh tế.. Sau đó dùng phương pháp ngẫu nhiên đơn giản hay hệ thống chọn ra một mẫu học sinh.
Một mẫu cụm đại diện tốt nhất cho tổng thể khi có một số lượng lớn các cụm được đưa vào mẫu. Trong mỗi cụm càng có nhiều thành phần càng tăng tính đại diện.
Tuy nhiên, hướng dẫn chung cho thiết kế mẫu cụm là tăng tối đa số lượng cụm (nhóm) được chọn và giảm số lượng thành phân được chọn ở mỗi cụm (những mẫu gồm một số lượng nhỏ các cụm dễ thiết lập hơn và chí phí ít tốn kém hơn).
Khi có quá nhiều giai đoạn lựa chọn, các sai số mẫu có chiều hướng gia tắng, chúng ta.có thể dùng kỹ thuật điều chỉnh: định tỷ lệ các tổng trong các cụm sao cho ở giai đoạn mẫu cuối cùng các đơn vi (cá nhân) đều có cơ hội được chọn ngang nhau. Ví dụ, có 1.000 khu nhà tập thể trong thành phố, ta cần chọn một mẫu gồm 100 khu nhà. Trong một khu cứ ð dãy nhà ta chọn 1 đãy nhà, mỗi dãy nhà cứ 10 hộ ta chọn 1 hộ. Như vậy cơ hội cho mỗi hộ được chọn ở mẫu cuối cùng là:
96
Tuy nhiên số nhà của mỗi khu tập thể rất khác nhau, số hộ ở mỗi nhà cũng rất khác nhau. Như vậy những khu tập thể lớn có đông hộ, sẽ có cơ hội được chọn cao hơn. Nhưng do những hộ trong một nhà có tính đồng nhất và những dãy trong cùng một khu cũng có tính déng nhất, nên không nhất thiết chọn mẫu gồm quá nhiều hộ trong cùng một dãy nhà hoặc quá nhiều dãy
nhà trong cùng một khu tập thể.
3.1.4. Những gợi ý trong thực hành chọn mẫu
Tính khái quát hoá cao chỉ có thể có từ một mẫu được thiết kế có tính đại điện. Do vậy mẫu xác suất có thể đáp ứng yêu cầu này. Những nghiên cứu khảo sát thực trạng thường phải dựa trên cơ sở các mẫu xác suất
còn các nghiên cứu thực nghiệm có thể không cần. Như
vậy, mục tiêu nghiên eứu sẽ quyết định loại mẫu nào là cần thiết, thích hợp. Khi không thể xây dựng được một
mẫu ngẫu nhiên, có một số kỹ thuật phi xác suất có thể sử dụng. Những mẫu kiểu này thường có nhiều hạn chế vì các đối tượng chọn vào mẫu không đại điện cho tổng thể các đối tượng mà chỉ đại diện cho chính nó.
2.2. Chon mẫu phi xác suất
Trong nhiều trường hợp việc chọn mẫu xác suất không thể thực hiện được, nhà nghiên cứu cần thiết phải chọn mẫu không theo các quy tắc chọn mẫu xác
gĩ
suất. Những mẫu như vậy gọi là mẫu phi xác suất (nonprobability sampling). Mặc dù mẫn phi xác suất khó có thể là mẫu khái quát đại điện cho một tổng thể nghiên cứu lớn hơn, nhưng trong nhiều trường hợp nó tỏ xa rất có hiệu quả, đặc biệt là trong các nghiên cứu phát hiện, khám phá, tìm kiếm các ý tưởng mới.
Theo các nhà nghiên cứu những kiểu chọn mẫu phi xác suất thường hay sử dụng là mẫu tiện lợi, mẫu phán đoán, mẫu chỉ tiêu va méu tăng nhanh.
2.2.1. Mẫu tiện lợi (convenienee sampling)
Khó có thể tiến hành một cuộc nghiên cứu về gái mại dâm theo phương pháp chọn mẫu xác suất (vì không thể có được danh sach đẩy đủ những người tham gia hoạt động mãi dâm). Đo vậy có thể tiến hành chọn một mẫu gồm những người có nhiều khả năng đã tham gia hoạt động mãi dâm, họ là những người sẵn sàng trả lời các câu hồi nghiên cứu. Chẳng hạn, một nhóm sinh viên tham gia một câu lạc bộ được yêu cầu trả lời những câu hỏi nghiên cứu, thì mẫu này gọi là mẫu tiện lợi. Mẫu tiện lợi chỉ là một mẫu có khả năng đưa ra những số liệu đại điện cho chính nó và có khả năng làm cho
u nghiên cứu hấp dẫn người nghiên cứu.
Tuy vậy người nghiên cứu không thể “nhắm mắt” chọn
bừa mà cân phải cân nhắc kỹ trước khi chọn mẫu để đáp ứng tốt nhất cho mục đích nghiên cứu (chẳng hạn những người được dự định khảo sát liệu có hiểu biết những vấn để ta muốn khảo sát và liệu có sẵn sàng trả
98
lời hay không...).
9...2. Mẫu phán đoán (udgmental sampling)
Mẫu phán đoán là một hình thức chọn mẫu phi xác suất trong đó các đối tượng được chọn có vé dap ứng những yêu cầu, mục tiêu nghiên cứu. Chẳng hạn để nghiên cứu gái mại đâm, người nghiên cứu có thể đến các trại phục hổi nhân phẩm, hoặc vào các nhà hàng, khách sạn... phống vấn những người có nhiều khả năng nhất là gái mại dâm.
Mẫu phán đoán cũng giống như mẫu tiện lợi khó có
khả năng khái quát để đại diện cho một tổng thể lớn hơn, nhưng nó có thể đáp ứng tốt nhất những yêu cầu đặc biệt của nghiên cứu (chẳng hạn muốn phổng vấn sâu, tìm hiểu rõ nguyên nhân...).