Phương pháp chọn mẫu và xác định cỡ mẫu trong nghiên cứu thống kê. Phương pháp chọn mẫu và xác định cỡ mẫu trong nghiên cứu thống kê.Phương pháp chọn mẫu và xác định cỡ mẫu trong nghiên cứu thống kê.Phương pháp chọn mẫu và xác định cỡ mẫu trong nghiên cứu thống kê.Phương pháp chọn mẫu và xác định cỡ mẫu trong nghiên cứu thống kê.Phương pháp chọn mẫu và xác định cỡ mẫu trong nghiên cứu thống kê.
Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Bài Phương pháp chọn mẫu xác định cỡ mẫu Giới thiệu chương Chương tập trung vào chủ đề chọn mẫu xác định cỡ mẫu cho nghiên cứu Nội dung thảo luận chất việc chọn mẫu lý mà ta phải chọn mẫu trình nghiên cứu tính chất mà mẫu tốt cần có Nội dung trình bày đặc điểm thể tính đắn tính xác để đo lường mức độ hiệu lực mẫu Sau đó, chương hướng dẫn nguyên tắc cần thiết phát triển kế hoạch chọn mẫu, hai nhóm kỹ thuật chọn mẫu phương pháp cụ thể Phần cuối chương tập trung vào hai phương pháp xác định cỡ mẫu xác định theo giá trị trung bình theo giá trị tỷ lệ BẢN CHẤT CỦA VIỆC CHỌN MẪU Chọn mẫu (sampling) việc chọn lấy số phần tử dân số (population), từ đó, rút kết luận dân số Điều có nghĩa nghiên cứu dân số mục tiêu đó, ta không nghiên cứu toàn dân số mà phận dân số, cách thức mà ta chọn phận đó, chọn mẫu Mẫu bao gồm số phần tử dân số Một phần tử dân số (population element) cá thể đối tượng nghiên cứu cá nhân người tham gia nghiên cứu mà nhà nghiên cứu tiến hành đo lường Đây đơn vị nghiên cứu (unit of study) Như vậy, nói ngược lại, dân số bao gồm tất phần tử dân số mà ta muốn nghiên cứu Thông thường ta không thực nghiên cứu toàn phần tử dân số Tuy nhiên, cấp độ quốc gia, nhà nghiên cứu tiến hành điều tra tổng thể Một điều tra tổng thể (census) nghiên cứu thực tất phần tử dân số Khi chọn mẫu, thường ta phải dựa vào khung mẫu Khung mẫu (sample frame) danh sách chưa đựng thông tin tất đơn vị nghiên cứu (phần tử dân số) mà dựa vào rút mẫu Khi chuẩn bị chọn mẫu nghiên cứu ta cần lưu ý tìm khung mẫu hay không 1.1 Tại phải lấy mẫu? Khi thực nghiên cứu, điều tra tổng thể, lý tốn tốn nhiều thời gian, công sức Trong đó, điều tra mẫu, có nhiều lợi Thứ nhất, dĩ nhiên chi phí nghiên cứu thấp Thứ hai, ta đạt tốc độ thu thập liệu nhanh mà đạt mức xác cần có kết Cuối ta dễ dàng có đơn vị nghiên cứu sẵn có cho nghiên cứu Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Chọn mẫu cho phép có chi phí nghiên cứu thấp Rõ ràng điều tra nghiên cứu mẫu dân số có lợi chi phí nhiều điều tra tổng thể Điều hiển nhiên Chọn mẫu cách cho phép ta đạt mức xác cần có kết Thậm chí chất lượng nghiên cứu thực điều tra chọn mẫu nghiên cứu mẫu thường đạt kết tốt so với thực điều tra tổng thể nghiên cứu tổng thể nhà nghiên cứu vấn tốt hơn, điều tra nhiều hơn, sâu thông tin nghi ngờ, sai sót xử lý thông tin tốt Chỉ dân số nghiên cứu nhỏ, dễ tiếp cận, biến động nhiều điều tra tổng thể đạt độ xác cao điều tra mẫu Chọn mẫu cho phép ta đạt tốc độ thu thập liệu cao Tốc độ thực nhanh giúp làm giảm thời gian giai đoạn chuẩn bị thông tin cần thiết giai đoạn thu thập thông tin Tốc độ thu thập liệu cao có nghĩa ta hoàn thành việc nghiên cứu sớm phạm vi giới hạn thời gian cho trước Tính sẵn có phần tử dân số lợi chọn mẫu Thông thường, số phần tử dân số có sẵn, chọn lựa để thực lấy mẫu để điều tra, nghiên cứu Nếu phải so sánh hiệu nghiên cứu chọn mẫu điều tra tổng thể, ta thấy lợi điều tra mẫu so với điều tra tổng thể dân số nhỏ có tính biến động cao Có hai điều kiện làm cho việc nghiên cứu tổng thể phù hợp hơn: (1) có tính khả thi dân số nhỏ (2) cần thiết mà cá thể khác biệt 1.2 Thế mẫu tốt? Nghiên cứu dựa mẫu đòi hỏi cách chọn mẫu phải cẩn trọng để chọn mẫu tốt Một mẫu coi tốt đại diện cho tính chất dân số mà rút Nói theo thuật ngữ đo lường, phải có tính hiệu lực (validity) Tính hiệu lực mẫu tùy thuộc vào hai tính chất: tính đắn (accuracy) tính xác (precision) Tính đắn (accuracy) mẫu mức độ mà mẫu tránh thiên lệch (bias) Khi mẫu rút cách, các tính chất số phần tử dân số thể mức độ thực có chúng Ngược lại, có số phần tử khác thể nhiều mức độ thực có chúng Kết là, biến số phần tử bù trù lẫn nhau, dẫn đến việc giá trị mẫu gần với giá trị dân số Tuy nhiên, để hiệu bù trừ xảy ra, mẫu phải có đủ số lượng phần tử, chúng phải rút từ dân số cách đắn để không gây thiên lệch Một mẫu (không thiên lệch) mẫu mà sai số đánh giá cao hay thấp bù trừ lẫn Và đó, phương sai hệ thống (systematic variance) định Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) nghĩa biến động đo lường ảnh hưởng biết hay gây làm cho điểm số bị thiên lệch phía Tăng cỡ mẫu (sample size) làm giảm phương sai hệ thống nguồn sai số Tuy nhiên, dù có tăng cỡ mẫu phương sai hệ thống xảy khung mẫu mà ta dựa vào để rút mẫu bị thiên lệch Tiêu chuẩn thứ hai để thiết kế mẫu tốt tính xác (precision) ước lượng Các nhà nghiên cứu đồng ý với mẫu đại diện cách đầy đủ dân số phương diện, khía cạnh Tuy nhiên, để diễn giải phát nghiên cứu, cần phải đo lường coi mẫu thể dân số xác tới mức Các biến số mô tả mẫu khác với dân số sai số ngẫu nhiên sinh trình chọn mẫu Sai số gọi sai số chọn mẫu (sampling error) sai số chọn mẫu ngẫu nhiên (random sampling error), phản ảnh ảnh hưởng hội rút thành viên mẫu Tính xác đo lường sai số chuẩn ước lượng Sai số chuẩn nhỏ có nghĩa độ xác cao, ngược lại Một thiết kế chọn mẫu coi lý tưởng tạo sai số chuẩn ước lượng nhỏ Tuy nhiên, tất kiểu thiết kế mẫu tạo ước lượng cho mức độ xác, mẫu có cỡ mẫu sinh mức độ sai số khác 1.3 Các kiểu thiết kế chọn mẫu Khi thiết kế chọn mẫu (hay chọn lựa chọn mẫu - types of sample design), nhà nghiên cứu phải trả lời nhiều vấn đề (Hình 6.1) Quá trình định chọn mẫu phụ thuộc vào nhiều yếu tố Có thể chất câu hỏi quản lý câu hỏi điều tra cụ thể rút từ câu hỏi nghiên cứu Ngoài ra, yếu tố khác ảnh hưởng đến thiết kế mẫu yêu cầu dự án nghiên cứu mục tiêu nó, mức độ rủi ro mà nhà nghiên cứu chấp nhận, ngân sách nghiên cứu, quỹ thời gian, nguồn lực có văn hóa vùng miền, dân tộc Các phần tử mẫu chọn theo hai kiểu chọn mẫu bả: xác suất hay phi xác suất Chọn mẫu phi xác suất (non-probability sampling) có tính chất tùy ý có mục tiêu Khi chọn mẫu có mục tiêu, thường chọn mẫu theo kế hoạch định trước, đơn vị nghiên cứu rút từ dân số hội chọn ngang Sự khác biệt chọn mẫu phi xác suất chọn mẫu xác suất tính chất xác suất Chọn mẫu xác suất (probability sampling) dựa phần tử chọn với hội lựa chọn cho trước khác không Chọn mẫu xác suất cho phép xác định ước lượng mức xác, cho hội để tổng quát hóa phát cho dân số nghiên cứu dựa dân số mẫu Trong nghiên cứu khám phá không đòi hỏi nhiều việc này, nghiên cứu giải thích, mô tả nhân lại Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) đòi hỏi điều Trong đó, với chọn mẫu phi xác suất, ta trước xác suất để chọn phần tử vào mẫu, đơn giản ta không cần quan tâm đến xác suất Chọn phần tử dân số để đưa vào mẫu việc đòi hỏi có chuẩn bị lựa chọn nghiêm túc để bảo đảm tính đắn mẫu Các phần tử mẫu chọn theo cá thể trực tiếp từ dân số Thang bậc câu hỏi quản lý – câu hỏi nghiên cứu Chọn kiểu chọn mẫu Xác suất Phi xác suất Xác định dân số liên quan Chọn kỹ thuật lấy mẫu Xác định khung mẫu có Không chấp nhận Đánh giá khung mẫu Chỉnh sửa xây dựng lại khung mẫu Chấp nhận Chọn khung mẫu Rút mẫu Hình 6.1 Thiết kế chọn mẫu phạm vi trình nghiên cứu Có nhiều kiểu thiết kế chọn mẫu khác nhau, thuộc vào hai nhóm chọn mẫu xác suất chọn mẫu phi xác suất (hình 6.2) Các kiểu chọn mẫu xác suất bao gồm kiểu chọn mẫu ngẫu nhiên đơn giản (simple random sampling), chọn mẫu hệ thống (systematic sampling), chọn mẫu phân tầng (stratified sampling), chọn mẫu phân nhóm (cluster sampling), chọn mẫu nhiều giai đoạn (multistage sampling) Các kiểu chọn mẫu phi xác suất bao gồm chọn mẫu thuận tiện (convienience sampling), chọn mẫu theo phán đoán (judment sampling), chọn mẫu hạn ngạch (quota sampling), chọn mẫu cầu tuyết (snowball) Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Ở hai kiểu chọn mẫu phân tầng hạn ngạch, kiểu lại có hai kiểu phụ chọn mẫu theo tỷ lệ (propotionate sampling) không theo tỷ lệ (dispropotionate sampling) Các kiểu chọn mẫu (Types of sampling design) Chọn mẫu phi xác suất (non-probability sampling) Chọn mẫu xác suất (probability sampling) Chọn mẫu thuận tiện (convienience sampling) Chọn mẫu ngẫu nhiên đơn giản (simple random sampling) Chọn mẫu phán đoán (judment sampling) Chọn mẫu hệ thống (systematic sampling) Chọn mẫu hạn ngạch (quota sampling) Chọn mẫu phân tầng (stratified sampling) Chọn mẫu hạn ngạch theo tỷ lệ (propotionate quota sampling) Chọn mẫu phân tầng theo tỷ lệ (propotionate stratified sampling) Chọn mẫu hạn ngạch không tỷ lệ (dispropotionate quota sampling) Chọn mẫu phân tầng không tỷ lệ (dispropotionate stratified sampling) Chọn mẫu cầu tuyết (snowball sampling) Chọn mẫu phân nhóm (cluster sampling) Chọn mẫu nhiều giai đoạn (multistage sampling) Hình 6.2 Các thiết kế chọn mẫu xác suất phi xác suất CÁC BƯỚC THIẾT KẾ CHỌN MẪU Khi lựa chọn cách chọn mẫu phù hợp cho nghiên cứu, phải trả lời số câu hỏi đặt Các câu hỏi nguyên tắc, bước mà phải theo Các câu hỏi theo trình tự định Tuy nhiên, để trả lời tốt câu hỏi, ta phải xem xét lại câu hỏi câu trả lời trước Dân số mục tiêu gì? Các tiêu (parameters) cần quan tâm gì? Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Khung mẫu ta ? Phương pháp chọn mẫu phù hợp? Cần cỡ mẫu bao nhiêu? 2.1 Dân số mục tiêu gì? Thông thường, xác định vấn đề nghiên cứu đặt câu hỏi nghiên cứu dân số mục tiêu Tuy nhiên, có chưa rõ ràng dân số mục tiêu Nếu rõ mục tiêu khó chọn mẫu phù hợp Trong nghiên cứu kinh tế, đối tượng quan sát chủ yếu người Tuy nhiên, chủ thể bao gồm cá nhân tổ chức người Vì vậy, nhầm lẫn chắn dân số bao gồm cá nhân, hộ gia đình, gia đình kết hợp loại khó quan sát đối tượng Rõ ràng nghiên cứu kinh tế việc xác định phần tử cá nhân hộ gia đình tổ chức dạng khác đưa đến kết hoàn toàn khác Vì vậy, cần ý ta phải xác định rõ khung phân tích, khung hành động để chọn lựa dân số liên quan Ví dụ 6.1 Khi nghiên cứu vấn đề nghèo đói, ta phải hiểu dân số mục tiêu ta Nếu nghiên cứu theo góc độ vùng địa giới hành chính, dân số mục tiêu bao gồm vùng hành tỉnh, quận huyện, xã phường Nếu ta nghiên cứu theo góc độ hộ gia đình dân số nghiên cứu lại bao gồm hộ gia đình Trên thực tế, phần tử dân số mục tiêu hộ gia đình phân bố theo vùng địa giới hành Vì vậy, phần tử mà ta phải chọn lựa bao gồm vùng địa giới hành hộ gia đình Ví dụ 6.2 Ở ví dụ 2.5 (chương 2), ta quan tâm đến vấn đề cải thiện môi trường đầu tư để tăng cường thu hút đầu tư trực tiếp nước (FDI) tỉnh thành Việt Nam Hãy xem dân số mục tiêu ta gì? Thứ nhất, chắn dân số mục tiêu phải bao gồm tất tỉnh thành phố trực thuộc trung ương Việt Nam Tuy nhiên, tỉnh thành phố, ta phải chọn phần tử cho nghiên cứu? Liệu ta nên chọn cá nhân quan chức quản l{ địa phương chọn doanh nghiệp nước hay doanh nghiệp nước đầu tư sản xuất kinh doanh tỉnh? Rõ ràng việc chọn lựa không dễ dàng chút 2.2 Các tiêu cần quan tâm gì? Các số thể cho dân số tiêu mô tả tổng hợp (ví dụ giá trị trung bình, phương sai, v.v.) biến số dân số mà quan tâm Các số thống kê mẫu (sample statistics) tiêu mô tả biến số trên, dân số mà mẫu Các số thống kê mẫu dùng để ước lượng số thống kê dân số Các số thống kê mẫu sở để tham chiếu cho số thống kê dân số Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Tùy thuộc vào cách mà đặt câu hỏi đo lường (xem lại Hình 2.1, Chương 2), câu lại thu thập liệu mức độ khác Mỗi mức độ khác biệt liệu lại sinh khác biệt thống kê mẫu Vì vậy, việc chọn lựa tiêu cần quan sát thực tế định kiểu chọn mẫu cỡ mẫu Khi biến số đo lường với kiểu liệu khoảng hay tỷ số, sử dụng giá trị trung bình mẫu để ước lượng trung bình dân số, độ lệch chuẩn mẫu để ước lượng độ lệch chuẩn dân số Khi biến số đo lường dạng thang đo danh nghĩa thứ bậc, sử dụng tỷ lệ mẫu để ước lượng tỷ lệ dân số, dùng số pq để ước lượng phương sai dân số Trong trường hợp này, tỷ lệ dân số số lượng phần tử có dân số thuộc loại chia cho tổng số phần tử dân số Các đo lường tỷ lệ cần thiết cho liệu danh nghĩa sử dụng rộng rãi cho đo lường khác 2.3 Khung mẫu ta gì? Khung mẫu có liên quan gần với dân số Đó danh sách tất phần tử có dân số mà từ rút mẫu Một khung mẫu lý tưởng danh sách hoàn thiện, đầy đủ tất thành viên dân số Tuy nhiên, thực tế, khung mẫu thường khác biệt với dân số lý thuyết Thường chấp nhận khung mẫu bao gồm người trường hợp mà không quan tâm Nhưng giải vấn đề dễ dàng cách rút mẫu từ dân số lớn hơn, sử dụng quy trình lọc để loại bỏ trường hợp mà không quan tâm, thành viên nhóm mà muốn nghiên cứu Khả tìm kiếm khung mẫu hay không vấn đề phải tính đến chuẩn bị chọn mẫu Có dân số mục tiêu mà khung mẫu sẵn có, ví dụ dân số sinh viên trường đại học, cư dân vùng hành đó, doanh nghiệp vừa nhỏ thành phố Tuy nhiên, có dân số mục tiêu mà phần tử không xác định, ta có khung mẫu Ví dụ dân số người ưa thích sách A không ưa thích sách B, dân số người sử dụng diện thoại di động nhãn hiệu Nokia, dân số người buôn bán nhỏ không đăng ký chẳng hạn Ngoài ra, có dân số mục tiêu xác định nguyên tắc, có tồn khung mẫu, lý đặc biệt mà ta có khung mẫu, ví dụ dân số người nhiễm HIV-AIDS, dân số người sử dụng xe máy thuộc thương hiệu Ta khó có danh sách khung mẫu dân số vấn đề quản lý hành (danh sách người đăng ký xe máy quan quản lý phương tiện giao thông) tính chất nhạy cảm dân số (danh sách người bị nhiễm HIV-AIDS) Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) 2.4 Phương pháp chọn mẫu phù hợp? Nhà nghiên cứu phải đối mặt với lựa chọn bản: chọn mẫu xác xuất hay phi xác suất Với cách chọn mẫu xác suất, nhà nghiên cứu đạt ước lượng cho nhiều tiêu nghiên cứu khác dựa tin cậy xác suất Trong đó, chọn mẫu phi xác suất không cho điều Tuy nhiên, chọn mẫu xác suất có vài hệ Nhà nghiên cứu buộc phải theo quy trình phù hợp mà vấn viên, điều tra viên chỉnh sửa chọn lựa có Khi chọn mẫu, có phần tử chọn từ khung mẫu gốc tính tới Trong trình chọn mẫu để thu thập thông tin, ta thay phần tử phần tử khác ngoại trừ có dẫn cụ thể theo nguyên tắc định trước Ngược lại, chọn mẫu phi xác suất dù tính đại diện cao cho dân số, lại dễ dàng áp dụng thực tế hầu hết trường hợp ta có khung mẫu Đồng thời, nhiều nghiên cứu có mục đích chuyên biệt, không cần thiết phải đại diện cho toàn dân số mục tiêu Ở phần 4, ta hiểu thêm khác biệt hai nhóm thiết kế chọn mẫu 2.5 Cần cỡ mẫu vừa? Cỡ mẫu số đơn vị nghiên cứu mà ta cần có mẫu rút từ dân số mục tiêu Thông thường, nhiều người có nhiều quan niệm không xác cỡ mẫu Họ thường cho rằng, thứ nhất, mẫu phải đủ lớn, không không đại diện cho dân số Thứ hai mẫu phải tương ứng với tỷ lệ so với kích cỡ dân số mà rút Trên thực tế, hai câu chuyện không xác Với mẫu phi xác suất, nhà nghiên cứu khẳng định số lượng nhóm phụ, nguyên tắc lựa chọn hạn chế ngân sách yếu tố định cỡ mẫu Với cách chọn mẫu xác suất, cỡ mẫu phụ thuộc vào biến thiên số thống kê dân số mức độ xác kết mà ta muốn có Một số nguyên tắc ảnh hưởng đến việc xác định cỡ mẫu là: - Dân số biến thiên nhiều cỡ mẫu phải lớn để đạt tính xác - Độ xác mong muốn tăng cỡ mẫu phải lớn - Phạm vi sai số nhỏ cỡ mẫu phải lớn - Mức độ tin cậy ước lượng cao cỡ mẫu phải lớn - Khi dân số có nhiều nhóm phụ, cỡ mẫu phải lớn để cỡ mẫu nhóm phụ phải đạt yêu cầu tối thiểu Các hạn chế ngân sách ảnh hưởng đến cỡ mẫu, cách chọn mẫu phương pháp thu thập liệu Hầu hết nghiên cứu bị giới hạn ngân sách, điều thúc đẩy nhà nghiên cứu áp dụng phương pháp chọn mẫu phi xác suất Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) CHỌN MẪU XÁC SUẤT Một mẫu coi có hiệu phương diện thống kê mẫu mà cho kích cỡ mẫu nhỏ với mức độ xác cho trước (dựa sai số chuẩn trung bình tỷ lệ) Một mẫu coi có hiệu phương diện kinh tế mẫu đạt mức độ xác cho trước với chi phí thấp Ở phần đây, ta thảo luận thiết kế chọn mẫu ngẫu nhiên đơn giản, sau bốn cách thức chọn mẫu xác suất phức tạp (complex probability sampling) có khả thay là: (1) chọn mẫu hệ thống; (2) chọn mẫu phân tầng; (3) chọn mẫu theo nhóm phân tổ; (4) chọn mẫu nhiều giai đoạn 3.1 Chọn mẫu xác suất ngẫu nhiên đơn giản Là phương pháp chọn mẫu không hạn chế, phương pháp chọn mẫu xác suất ngẫu nhiên đơn giản (simple random sampling) hình thức đơn giản nhất, cách chọn mẫu xác suất Khi mà tất mẫu xác suất phải chọn lựa cá thể (đơn vị nghiên cứu) với xác suất khác không cho trước phương pháp chọn mẫu ngẫu nhiên đơn giản coi trường hợp đặc biệt cá thể lựa chọn với xác suât biết trước hoàn toàn ngang Xác suất chọn lựa = cỡ mẫu ÷ kích cỡ dân số (%) Để thực chọn mẫu ngẫu nhiên đơn giản, việc phải có khung mẫu, danh sách tất cá thể (thành viên) dân số mục tiêu Dựa danh sách này, rút mẫu mà bảo đảm xác suất rút mẫu hoàn toàn nhau? Giả sử ta chọn mẫu với cỡ mẫu 200 từ dân số mục tiêu chứa 2.500 cá thể Điều có nghĩa xác suất rút mẫu phải bảo đảm 200/2.500, tức 8% Xác suất rút mẫu lần 1/2.500 Xác suất rút mẫu lần thứ hai 1/2.499, sau đó, xác suất rút mẫu thay đổi tương tự Hiển nhiên cách này, ta không bảo đảm xác suất rút mẫu với xác suất dự định ban đầu Đây hệ cách chọn mẫu thay (sampling without replacement) Nếu thay phần tử chọn phần tử khác dân số, ta giữ cho xác suất rút mẫu không thay đổi (sampling with replacement) Khi rút mẫu, ta đánh số sử dụng bảng ngẫu nhiên để chọn lựa cá thể (rút mẫu) để bảo đảm cá thể có xác suất chọn Ta dùng phần mềm máy tính hỗ trợ để xác định mẫu với xác suất cho trước Với phần mềm Excel, công cụ bảng tính phổ biến, ta sử dụng lệnh Randbetween Ví dụ 6.3 Giả sử ta xác định cỡ mẫu cần có cho nghiên cứu n = 200 Với danh sách khung mẫu cho trước, ta biết dân số có N = 2.500 cá thể Như vậy, xác suất chọn mẫu 8% Dĩ nhiên ta phải lập danh sách khung mẫu, cá thể dân số đánh số thứ tự từ đến 2.500 Với phần mềm Excel, ta dùng lệnh Randbetween(1;2500), ta có giá trị ngẫu nhiên chọn từ danh sách chứa 2.500 cá thể Ta chọn copy Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) công thức cách kéo chuột (drag) ô tính toán để có 200 ô Kết ta có danh sách chứa 250 cá thể chọn cách ngẫu nhiên với xác suất chọn lựa hoàn toàn 8% Ta dùng cách để lập vài danh sách dự phòng Khi bị cá thể quan sát danh sách chuẩn đầu tiên, ta lựa chọn cá thể danh sách dự phòng để thay mà bảo đảm tính chất ngẫu nhiên với xác suất hoàn toàn 3.2 Chọn mẫu hệ thống Vớ thiết kế chọn mẫu hệ thống, ta chọn lấy phần tử thứ k th dân số, bắt đầu với số khởi điểm ngẫu nhiên phạm vi từ đến k Phần tử thứ kth , gọi bước nhảy (skip interval), tính cách chia cỡ mẫu cho kích cỡ dân số k = bước nhảy = dân số ÷ cỡ mẫu Chúng ta phải có khung mẫu xác hoàn thiện Thủ tục để tiến hành chọn mẫu hệ thống theo bước sau: - Xác định, lập danh sách đánh số cá thể dân số - Xác định bước nhảy (k) - Xác định số khởi đầu cách ngẫu nhiên - Rút mẫu cách chọn tất cá thể theo bước nhảy kth Ví dụ 6.4 Ta có dân số bao gồm 2.000 phần tử đánh số thứ tự Với cỡ mẫu 70, bước nhảy k 28,57, làm tròn 29 Giả sử ta chọn điểm khởi đầu phần tử có số thứ tự 12, phần tử chọn 41 (12+29) Tương tự vậy, ta chọn phần tử 70, 99, 128, 157, 186, 215, 244, 273, 302, 331, v.v Phương pháp chọn mẫu hệ thống có ưu điểm đơn giản mềm dẻo Tuy vậy, phương pháp sinh thiên lệch khó thấy Đầu tiên tính chất chu kỳ dân số xảy song song với tỷ lệ mẫu (bước nhảy) Ngoài ra, cá thể dân số xếp theo trật tự đơn chiều Trong nghiên cứu kinh tế, dân số thường xếp theo trật tự sẵn có Ví dụ, ta có danh sách cá nhân, hộ gia đình xếp từ nghèo đến giàu, ngược lại; danh sách hộ nông nghiệp xếp theo quy mô tăng dần diện tích đất canh tác, v.v Chính vậy, chọn cá thể, ta bị thiên lệch phía dãy số liệu Để tránh tình trạng thiên lệch vậy, ta nên: - Sắp xếp ngẫu nhiên dân số trước chọn mẫu - Chọn số khởi điểm cách ngẫu nhiên vài lần bắt đầu chọn mẫu - Lặp lại cách chọn mẫu cho mẫu khác 10 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) nhu cầu (giả sử sinh viên ngành toán cần sử dụng máy tính thường xuyên sinh viên ngành ngữ văn), sinh viên năm cuối phải sử dụng thường xuyên sinh viên năm thứ ta lựa cho hai biến định tính để phân tầng, thay dùng biến giới tính Bước Xác định tỷ lệ nhóm dân số phụ so với dân số chung Để làm việc này, rõ ràng phải có khung mẫu dân số tổng thể, khung mẫu dân số phụ dựa biến danh nghĩa mà dùng để phân chia Bước Ta chọn lựa cách phân tầng theo tỷ lệ không theo tỷ lệ tùy theo nhu cầu thông tin nghiên cứu rủi ro xảy Bước Thiết lập khung mẫu dân số phụ Mỗi khung mẫu (phụ) thể tầng (nhóm dân số phụ) Bước Trộn phần tử khung mẫu Để bảo đảm tốt tính chất ngẫu nhiên, không thiên lệch chọn mẫu, ta nên trộn ngẫu nhiên phần tử (cá thể, đơn vị nghiên cứu) khung mẫu tầng Bước Rút mẫu cho tầng cách rút mẫu ngẫu nhiên hệ thống x x x x x x x x x x x x x x x x x x x x x ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ o o o o o o o o o o o o o o o o o o o o o x x x x x x x x x ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ o o o o o o o o o Hình 6.4 Minh họa cách rút mẫu từ dân số chọn mẫu phân tầng Ví dụ 6.7 Minh họa chọn mẫu phân tầng để có mẫu nghiên cứu nhu cầu sử dụng máy tính xách tay sinh viên Bước Chọn biến ngành để phân tầng Dân số sinh viên chia làm nhiều dân số phụ khác theo ngành học Bước Xác định tỷ lệ sinh viên ngành học so với tổng số sinh viên Ta định áp dụng chọn mẫu theo tỷ lệ để bảo đảm cấu trúc mẫu phản ảnh cấu trúc dân số mục tiêu Bước Thiết lập khung mẫu cho sinh viên ngành học khác Trên thực tế, khung mẫu danh sách sinh viên ngành học Ta nhập liệu danh sách vào file Excel để làm sở rút mẫu Bước Ta trộn danh sách khung mẫu nhiều lần để bảo đảm phá vỡ quy tắc xếp có danh sách 13 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Bước Rút mẫu khung mẫu theo tỷ lệ so với cỡ mẫu định sẵn Dùng lệnh Randbetween Excel để rút mẫu theo cách ngẫu nhiên đơn giản dùng phương pháp hệ thống để rút mẫu theo bước nhảy k Kết ta có mẫu phụ, mẫu phụ tương ứng với dân số phụ Nếu gộp tất mẫu phụ lại với nhau, ta có mẫu nghiên cứu, bao gồm nhiều mẫu phụ, theo tỷ lệ biết trước 3.4 Chọn mẫu theo nhóm Trong mẫu ngẫu nhiên, phần tử dân số chọn lựa theo cá thể Dân số chia thành nhiều nhóm chứa đựng phần tử cá thể mà có thể, số nhóm chọn ngẫu nhiên cho nghiên cứu Đó nguyên tắc phương pháp chọn mẫu theo nhóm Ta hình dung khác biệt chọn mẫu phân tầng chọn mẫu theo nhóm sau Giả sử hai dân số chứa đựng cá thể khác biệt, chia làm ba nhóm chính, thể ký tự x, ∆ o (Hình 6.5) Dựa tính chất khác biệt này, chọn mẫu theo hai cách khác biệt Cách thứ chia dân số thành nhóm dân số phụ theo đặc tính x, ∆ o Điều cho phép có nhóm dân số phụ (còn gọi tầng - stratum) bảo đảm đồng nội nhóm có dị biệt nhóm Ngược lại, chia dân số thành nhóm dân số phụ mà nhóm có phần tử cá thể đa dạng với đặc tính x, ∆ o Kết là, ta có nhóm dân số phụ (clusters) bảo đảm đa dạng hay dị biệt nội nhóm có đồng nhóm Cách thứ chọn mẫu phân tầng Cách thứ hai chọn mẫu theo nhóm x x x x x x x x x x x x x x x x x x x x x ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ ∆ o o o o o o o o o o o o o o o o o o o o o Dân số chia thành nhóm dân số phụ (tầng) dị biệt dựa đặc tính riêng biệt cá thể (chia nhóm x, ∆ o riêng biệt) x ∆ o x ∆ o x x ∆ o x ∆ o x x ∆ o x ∆ o x ∆ x o ∆ x o ∆ ∆ x o ∆ x o ∆ ∆ x o ∆ x o ∆ o x ∆ o x ∆ o o x ∆ o x ∆ o o x ∆ o x ∆ o Dân số chia thành nhóm dân số phụ (nhóm) bao gồm cá thể có tính đa dạng (x, ∆ o có mặt nhóm) Hình 6.5 Minh họa khác biệt chọn mẫu phân tầng theo nhóm 14 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Hiệu thống kê chọn mẫu theo nhóm thường thấp chọn mẫu ngẫu nhiên đơn giản thông thường, nhóm lại khác biệt cần thiết, mà lại có đồng Bảng 6.1 So sánh hai phương pháp chọn mẫu phân tầng theo nhóm Chọn mẫu phân tầng - Stratified Sampling Chọn mẫu theo nhóm - Cluster Sampling Ta chia dân số thành số nhóm phụ Ta chia dân số thành nhiều nhóm phụ - Mỗi nhóm phụ chứa nhiều phần tử - Mỗi nhóm phụ chứa phần tử - Các nhóm phụ chọn lựa theo tiêu chí liên quan đến biến số nghiên cứu - Các nhóm phụ chọn lựa theo tiêu chí đễ dàng có tính sẵn có để thu thập liệu dễ Ta cố gắng bảo đảm tính đồng (homogeneity) nội nhóm phụ Ta cố gắng bảo đảm tính dị biệt (heterogeneity) nội nhóm phụ Ta cố gắng bảo đảm tính dị biệt (heterogeneity) nhóm phụ Ta cố gắng bảo đảm tính đồng (homogeneity) nhóm phụ Ta chọn lựa ngẫu nhiên phần tử nhóm phụ Ta chọn lựa ngẫu nhiên số nhóm phụ để nghiên cứu sâu Hầu hết nghiên cứu kinh tế liên quan đến dân số mà chúng chia theo vùng địa lý Ví dụ nghiên cứu tình trạng nghèo đói, ta thấy quốc gia (trên giới) vùng, miền, tỉnh (trong phạm vi quốc gia) có người nghèo, giàu khác Như vậy, nghiên cứu, ta chọn lựa vài vùng miền thuận tiện cho nghiên cứu, nghiên cứu vùng trên, ta bảo đảm có cá thể giàu, nghèo khác biệt Khi ta chia dân số theo vùng địa lý rõ ràng ta sử dụng phương pháp chọn mẫu theo nhóm Cách thức chọn mẫu gọi chọn mẫu theo vùng (area sampling), áp dụng mức độ quốc gia, vùng miền, chí đơn vị theo địa giới hành quy mô nhỏ Khi áp dụng thiết kế chọn mẫu theo nhóm, kể chọn mẫu theo vùng, cần trả lời câu hỏi sau đây: Các nhóm đồng với nào? Chúng ta tìm nhóm có kích cỡ hay khác nhau? Chúng ta chọn nhóm có kích cỡ bao nhiêu? Chúng ta áp dụng phân nhóm giai đoạn (single-stage cluster) hay nhiều giai đoạn (multi-stage cluster)? Kích cỡ mẫu vừa? 15 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Ví dụ 6.8 Minh họa chọn mẫu theo nhóm Ta muốn nghiên cứu hoạt động doanh nghiệp vừa nhỏ (SMEs) phạm vi nước Vì không đủ nguồn lực để nghiên cứu tỉnh thành, ta chọn mẫu đại diện, định chọn mẫu phân nhóm theo vùng địa l{ Đầu tiên, ta chọn số tỉnh, thành phố đại diện cho bảy vùng kinh tế - xã hội Đồng sông Hồng, Miền núi trung du Bắc bộ, Bắc Trung bộ, Duyên hải Nam Trung , Tây Nguyên, Đông Nam Đồng sông Cửu Long Ta chắn tỉnh, thành phố đại diện có đầy đủ dạng, loại hình SMEs Ta biết ta điều tra toàn SMEs có địa bàn hành tỉnh, thành chọn Vì vậy, ta tiếp tục chọn số đơn vị hành đại diện cho vùng thành thị nông thôn tỉnh thành, ví dụ tỉnh thành chọn huyện (đại diện vùng nông thôn) thành phố/thị xã (đại diện cho vùng thành thị) 3.5 Chọn mẫu nhiều giai đoạn Trong nghiên cứu thực tế, người ta thường áp dụng phương chọn mẫu nhiều giai đoạn (double sampling, sequential sampling, multiphase sampling, multistage sampling) Phương pháp cho phép sử dụng thông tin có từ nghiên cứu ban đầu để làm sở cho việc chọn mẫu bước Trong nghiên cứu kinh tế, tiến hành nghiên cứu theo nhiều giai đoạn Giai đoạn nghiên cứu khám phá, giai đoạn mà ta cần tìm hiểu thông tin dân số mục tiêu thông qua mẫu Dựa thông tin này, ta hiểu cấu trúc dân số, phát dị biệt tương đồng nội dân số thông qua tiêu thống kê ghi nhận Từ đó, tiếp tục rút mẫu phụ từ mẫu mà có để tiếp tục nghiên cứu giai đoạn sau (nghiên cứu sâu) Loại hình chọn mẫu nhiều giai đoạn thường áp dụng nghiên cứu kinh tế - xã hội Ở giai đoạn đầu, người ta thường chọn mẫu có cỡ mẫu lớn, thiết kế nội dung nghiên cứu đơn giản nhằm tìm hiểu thông tin dân số mục tiêu Sau đó, tùy theo mục tiêu nghiên cứu, người ta thiết kế nghiên cứu sâu với nội dung chi tiết, cần số đơn vị nghiên cứu Kết nghiên cứu trước cho phép rút tiêu chí phân nhóm phù hợp bảo đảm khả rút mẫu phụ chứa đựng đơn vị nghiên cứu phù hợp từ mẫu nghiên cứu Thông thường, phương pháp chọn mẫu nhiều giai đoạn kết hợp nhiều phương pháp chọn mẫu khác nhau, ví dụ chọn mẫu phân tầng, chọn mẫu theo nhóm, chọn mẫu hệ thống Ta xem xét ví dụ minh họa chọn mẫu nhiều giai đoạn, áp dụng cho nghiên cứu hoạt động doanh nghiệp vừa nhỏ Việt Nam 16 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Ví dụ 6.9 Minh họa chọn mẫu nhiều giai đoạn Nghiên cứu: Hoạt động doanh nghiệp vừa nhỏ (SMEs) thuộc ngành da giày – dệt may, khí, điện tử Phạm vi nghiên cứu: Việt Nam Nghiên cứu sơ khởi: Áp dụng phương pháp chọn mẫu theo vùng (area sampling, dạng cluster sampling): chọn 1-2 hai thành phố đại diện cho thành phố lớn Việt Nam chọn tỉnh đại diện cho vùng miền kinh tế Việt Nam Ở tỉnh, thành phố, chọn doanh nghiệp SME để vấn sơ khởi Có thể áp dụng kết hợp xác suất chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống dựa danh sách (khung mẫu) quan Sở Công Thương Chi nhánh Phòng Công nghiệp & Thương mại Việt Nam cung cấp Nghiên cứu sâu: Dựa thông tin ghi nhận từ người tiêu dùng vấn sơ khởi sẵn lòng họ, tiến hành nghiên cứu sâu Áp dụng phương pháp chọn mẫu phân tầng (stratified sampling) theo tỷ lệ không theo tỷ lệ dựa đặc điểm khác biệt ngành sản xuất tỉnh, thành phố chọn Rút mẫu từ mẫu nghiên cứu có Với ví dụ trên, ta thấy nhà nghiên cứu lựa chọn áp dụng nhiều phương pháp chọn mẫu khác cho giai đoạn nghiên cứu khác Tất nhiên phương án chọn lựa tùy thuộc nhiều vào mục tiêu nghiên cứu, dân số mục tiêu, tiêu cần thu thập, khả có khung mẫu, dễ dàng, thuận tiện nghiên cứu, khả tài đáp ứng cho nghiên cứu Như vậy, có nhiều phương pháp chọn mẫu xác suất khác nhau, với ưu điểm hạn chế chúng Bảng 6.2 giúp tóm tắt đặc điểm chính, ưu điểm hạn chế phương pháp 17 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Bảng 6.2 So sánh phương pháp chọn mẫu xác suất Kiểu Mô tả Ưu điểm Hạn chế Ngẫu nhiên đơn giản Simple Random Mỗi phần tử dân số có hội lự chọn ngang Dễ áp dụng, với cách vấn quan điện thoại máy quay số ngẫu nhiên Có thể áp dụng hệ thống trả lời tự động Đòi hỏi danh sách khung mẫu Chi phí: Cao Áp dụng: Trung bình Hệ thống Systematic Chi phí: Trung bình Áp dụng: Trung bình Phân tầng Stratified Chi phí: Cao Áp dụng: Trung bình Mẫu rút cách sử dụng bảng số ngẫu nhiên phần mềm tạo bảng số ngẫu nhiên Chọn phần tử dân số khởi đầu cách ngẫu nhiên, dùng bước th nhảy k để chọn phần tử khác Cần cỡ mẫu lớn Tạo nhiều sai số Thiết kế đơn giản Dễ áp dụng chọn mẫu ngẫu nhiên đơn giản Dễ tính toán phân bố mẫu giá trị trung bình tỷ lệ Chia dân số thành dân số phụ (tầng) áp dụng chọn mẫu ngẫu nhiên đơn giản cho tầng Kết tính theo trọng số kết hợp Tốn nhiều thời gian để thực Tính chu kz dân số làm méo, sai lệch mẫu kết Nếu dân số có xu hướng trật tự đơn chiều, sinh kết thiên lệch Nhà nghiên cứu kiểm soát cỡ mẫu tầng Tăng sai số nhóm phụ chọn tỷ lệ khác Tăng hiệu thống kê Đắt đỏ phải tạo nhiều tầng khác Cung cấp liệu đại diện phân tích nhóm phụ Cho phép sử dụng nhiều phương pháp phân tích khác cho tầng Theo nhóm Cluster Chi phí: Trung bình Áp dụng: Cao Dân số chia làm nhiều nhóm phụ dị biệt nội Chọn ngẫu nhiên số nhóm để nghiên cứu sâu Cung cấp ước lượng không thiên lệch thực cách Hiệu kinh tế cao chọn mẫu ngẫu nhiên đơn giản Thường có hiệu thống kê thấp nhóm phụ có xu hướng đồng dị biệt Chi phí thấp nhất, đặc biệt chia nhóm theo vùng địa l{ Dễ làm, không cần danh sách khung mẫu Nhiều giai đoạn (Double, sequential or multiphase) Chi phí: Trung bình Áp dụng: Trung bình Quá trình bao gồm việc thu thập liệu từ mẫu xác định trước Dựa thông tin có được, chọn mẫu phụ cho nghiên cứu tiếp Có thể làm giảm chi phí kết giai đoạn đầu cho đầy đủ liệu để phân tầng chia nhóm dân số Tăng chi phí áp dụng không phân biệt 18 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) CHỌN MẪU PHI XÁC SUẤT Với cách tiếp cận có mục đích chọn mẫu phi xác suất, ta xác suất lựa chọn đơn vị nghiên cứu (phần tử dân số) Có nhiều cách để chọn lựa cá nhân trường hợp quan sát có mẫu Thường hay cho phép vấn viên lựa chọn người cần vấn Khi điều xảy ra, rõ ràng thiên lệch phát sinh làm méo mó kết nghiên cứu Tuy nhiên, có lý thực tiễn mà người ta lựa chọn phương pháp xác Chúng ta sử dụng thủ tục chọn mẫu phi xác suất lý sau: - Chúng thỏa yêu cầu chọn mẫu có mục tiêu - Nếu mong muốn không cần thiết phải tổng quát hóa kết nghiên cứu cho dân số tổng thể ta không quan tâm đến việc liệu mẫu có đại diện đầy đủ cho dân số hay không Điều với nghiên cứu khám phá mà muốn gặp cá nhân, trường hợp không điển hình, không giống - Chọn mẫu phi xác suất tốn chi phí thời gian so với chọn mẫu xác suất - Trong chọn mẫu xác suất lý tưởng tốt lý thuyết, áp dụng vào thực tiễn, lại có nhiều thất bại Ngay áp dụng cẩn thận bước chọn mẫu ngẫu nhiên đơn giản chất lượng nghiên cứu tùy thuộc vào mức độ áp dụng cẩn thận hay không cẩn thận người liên quan Vì vậy, phương pháp chọn mẫu xác suất lý tưởng lại thành công phần lỗi người - Chọn mẫu phi xác suất cách thay Trong nhiều trường hợp trường hợp, ta dân số tổng thể cho nghiên cứu, ta có khung mẫu nhiều lý khác Và vậy, ta có khung mẫu có sở để chọn mẫu xác suất - Theo nghĩa khác, người tham gia nghiên cứu (đối tượng nghiên cứu) tự chọn để tham gia Điều có nghĩa nhà nghiên cứu bảo đảm ngang hội chọn lựa đơn vị nghiên cứu Thông thường, có số kiểu thiết kế chọn mẫu phi xác suất áp dụng rộng rãi, kể cho nghiên cứu định tính lẫn nghiên cứu định lượng Đó chọn mẫu thuận tiện, chọn mẫu theo phán đoán, chọn mẫu hạn ngạch chọn mẫu cầu tuyết Phần trình bày thiết kế chọn mẫu 4.1 Chọn mẫu thuận tiện Chọn mẫu thuận tiện có đặc trưng nhà nghiên cứu đựa thuận tiện cho họ để tiếp cận đến dân số mục tiêu Lý nhà nghiên cứu điều tra viên, có quyền tự chọn lựa họ muốn, gọi “thuận tiện” Đây mẫu có mức tin cậy nhất, thường rẻ dễ tiến hành Phương pháp 19 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) chọn mẫu phổ biến nghiên cứu thị trường Các nghiên cứu thị trường thường sử dụng cách chọn mẫu thuận tiện Các thăm dò ý kiến khách hàng hầu hết thực cách thuận tiện Trong chọn mẫu thuận tiện kiểm soát không bảo đảm tính xác, phương pháp hữu ích Thường ta áp dụng mẫu để kiểm tra ý tưởng để có ý tưởng đối tượng nghiên cứu Ở giai đoạn đầu nghiên cứu khám phá, ta tìm kiếm hướng đi, ta áp dụng cách tiếp cận Các kết rõ ràng đến mức không cần thiết phải áp dụng phương pháp chọn mẫu phức tạp Ví dụ 6.10 Chọn mẫu thuận tiện Ta thường thấy nhóm giới thiệu sản phẩm thực phẩm, bánh kẹo hay thức uống có ga thường tổ chức giới thiệu sản phẩm vấn nhanh { kiến người dùng thử cửa siêu thị lớn Vì sao? Rõ ràng đó, họ dễ dàng tìm gặp nhóm khách hàng tiềm loại sản phẩm Ngoài ra, số lượng lớn khách hàng đến siêu thị hàng ngày giúp cho họ đạt cỡ mẫu nghiên cứu đủ lớn theo { muốn Một yếu tố khác nhóm tốn nhiều chi phí để tổ chức gặp khách hàng, trường hợp này, khách hàng tự đến với họ 4.2 Chọn mẫu theo phán đoán Chọn mẫu có mục đích (purposive sampling) hình thức chọn mẫu phi xác suất mà nhà nghiên cứu muốn theo tiêu chí Có hai phương pháp chọn mẫu có mục đích chọn mẫu theo kinh nghiệm (judgment sampling) chọn mẫu theo hạn ngạch (quota sampling) Chọn mẫu theo phán đoán xảy nhà nghiên cứu chọn đơn vị nghiên cứu theo tiêu chuẩn Thông thường, nhà nghiên cứu chọn mẫu phán đoán họ nên tiếp cận với nhóm người có thông tin tốt để đạt mục tiêu nghiên cứu Nhà nghiên cứu tiếp xúc với người để có thông tin cần thiết Phương pháp phù hợp sử dụng vào giai đoạn đầu nghiên cứu khám phá Khi ta muốn chọn nhóm thiên lệch nhằm mục tiêu lọc liệu chọn mẫu theo kinh nghiệm phương pháp tốt Ví dụ 6.11 Chọn mẫu theo phán đoán Một công ty chọn nhân viên họ để đánh giá sản phẩm trước đưa thị trường Nếu thất bại, sản phẩm khó có triển vọng đưa vào thị trường Một trường hợp khác, ta muốn nghiên cứu thị trường xe ô tô gia đình Việt Nam Dĩ nhiên phải chọn đối tượng nghiên cứu người tầng lớp trung lưu trở lên, phải người có kinh nghiệm sử dụng xe ô tô gia đình Một nhóm nghiên cứu thị trường muốn nghiên cứu việc chọn mua sữa bột dành cho trẻ em tuổi Nhóm nghiên cứu biết thường bà mẹ nuôi trẻ 20 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) người mua sữa thông hiểu l{ mà họ chọn lựa loại sản phẩm loại sản phẩm khác Nhóm định tiếp cận đối tượng nghiên cứu 4.3 Chọn mẫu hạn ngạch Chọn mẫu hạn ngạch1 (quota sampling) kiểu chọn mẫu có mục đích Chúng ta áp dụng để cải thiện tính đại diện Lý chủ yếu dân số có vài chiều kích chọn mẫu theo hạn ngạch mô tả chiều kích Trong chọn mẫu hạn ngạch, nhà nghiên cứu phải nhiều hướng kiểm soát Mỗi hướng phải thỏa mãn hai điều kiện: (1) có phân phối dân số để ước lượng (2) thích hợp với chủ đề nghiên cứu Để minh họa, ta quan sát trường hợp sau: Giới tính: hai nhóm thuộc tính – nam, nữ Trình độ học vấn: hai nhóm thuộc tính: đại học – trung học Khoa ngành trường đại học Tôn giáo: bốn nhóm thuộc tính – Phật giáo, Thiên chúa giáo, Tin lành, khác Thành viên hiệp hội: hai nhóm thuộc tính – thành viên, thành viên Tấng lớp kinh tế - xã hội: ba nhóm thuộc tính: giàu, trung bình, nghèo Tương tự chọn mẫu phân tầng, chọn mẫu hạn ngạch theo tỷ lệ không theo tỷ lệ Chọn mẫu hạn ngạch có vài hạn chế Thứ nhất, bảo đảm mẫu đại diện cho biến cần nghiên cứu Thứ hai, việc chọn lựa đơn vị nghiên cứu tùy thuộc vào điều tra viên, tùy thuộc vào kinh nghiệm họ Vì vậy, họ chọn người thân thiết, ban bè quen thuộc để dễ thực công việc Tuy vậy, nhìn chung chọn mẫu hạn ngạch có rủi ro thiên lệch hệ thống, thường thỏa mãn yêu cầu dự đoán nói chung Ví dụ 6.12 Chọn mẫu hạn ngạch Một công ty nghiên cứu thị trường muốn tìm hiểu hành vi lựa chọn xe gắn máy người tiêu dùng thành phố Hồ Chí Minh Với nguồn thống kê thương mại, họ biết thị phần trung bình xe Honda 50%, Yamaha 30%, SYM 15% nhãn hiệu khác 5% Với cỡ mẫu nghiên cứu dự tính 200 cá nhân người tiêu dùng, công ty định phân bố mẫu theo tỷ lệ thị phần Như vậy, mẫu bao gồm 100 người dùng xe Honda, 60 người dùng xe Yamaha, 30 người dùng xe SYM 10 người dùng xe nhãn hiệu khác Một số tài liệu khác dùng thuật ngữ “Chọn mẫu định mức” để phương pháp 21 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) 4.4 Chọn mẫu cầu tuyết Kiểu chọn mẫu cầu tuyết (snowball sampling) gọi chọn mẫu mở rộng Phương pháp áp dụng ta khó xác định người trả lời khó tiếp cận họ Cách phù hợp cho nghiên cứu định tính nhóm người đặc thù, có tính chất mà ta khó tiếp cận Nguyên tắc là, giai đoạn đầu tiên, ta cần phải phát vài cá nhân cần tìm hiểu thu thập thông tin từ họ Rồi sau ta yêu cầu cá nhân cho ta người khác có đặc điểm tương tự họ thành viên khác Ta tiếp tục tiếp cận, thu thập thông tin lại hỏi thành viên khác Cứ tiếp tục thế, nhà nghiên cứu người trả lời cho người khác mở rộng mẫu nghiên cứu lúc đạt cỡ mẫu cần thiết Phương pháp phù hợp cho nghiên cứu mà đối tượng nhóm người đặc thù, ví dụ cộng đồng doanh nhân ngành đó, cộng đồng nghệ sĩ tiếng, đối tượng nhóm người thuộc cộng đồng xã hội có tính nhạy cảm đó, cộng đồng người nghiện ma túy chẳng hạn XÁC ĐỊNH CỠ MẪU 5.1 Các khái niện liên quan đến chọn mẫu xác định cỡ mẫu Giá trị trung bình ( ) mẫu rút từ dân số cho trước giá trị ước lượng điểm thông số tốt dùng để ước lượng giá trị trung bình chưa biết dân số, µ Chúng ta coi trung bình mẫu trung bình dân số Tuy nhiên, ước lượng khoảng tin cậy mà trung bình dân số µ rơi vào Ta áp dụng công thức tính sai số chuẩn (standard error of the mean) - σ se X n với σ = sai số chuẩn giá trị trung bình độ lệch chuẩn tất giá trị trung bình s có σ = độ lệch chuẩn dân số n = cỡ mẫu Độ lệch chuẩn mẫu sử dụng ước lượng không chệch cho độ lệch chuẩn dân số x s n với 22 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) s = độ lệch chuẩn mẫu n Giả sử ta có: n1 = 10, = 3,0 s1 = 1,15 x s n = 1.15 10 = 0,36 Giá trị trung bình dân số, µ, ước lượng theo công thức sau: µ= σ Bởi không điều tra tổng thể nên ta chưa biết giá trị µ σ Tuy nhiên, ta áp dụng công thức µ = σ Theo ví dụ trên, µ = ± σ = 3,0 ± 0,36 Tuy nhiên, sai số chuẩn có tính chất thông số thống kê khác, ta có mức tin cậy 68% giá trị ước lượng Điều có nghĩa sai số chuẩn chứa đựng ± 1Z 68% diện tích đường phân phối chuẩn Ta sử dụng số thống kê khoảng tin cậy (confidence interval) Để tăng độ tin cậy lên 95%, ta phải nhân sai số chuẩn với ± 1,96 (Z), 1,96 (Z) bao phủ 95% diện tích đường phân phối chuẩn Tương tự vậy, để nâng độ tin cậy lên 99%, ta phải nhân sai số chuẩn với ± 3,0 (Z), 3,0 (Z) bao phủ 99% diện tích đường phân phối chuẩn Do đó, khoảng tin cậy giá trị trung bình dân số, µ là: Ở mức tin cậy 68%: 2,64 – 3,36 (µ = 3,0 ± 0,36) Ở mức tin cậy 95%: 2,29 – 3,71 (µ = 3,0 ± 0,71) Ở mức tin cậy 99%: 1,92 – 4,08 (µ = 3,0 ± 1,08) 5.2 Xác định cỡ mẫu theo giá trị trung bình Trước tính cỡ mẫu mong muốn, coi lại thông tin cần thiết: Mức xác mong muốn làm để lượng hóa nó: a Mức tin cậy (confidence level) mà ta muốn đạt b Độ lớn khoảng tin cậy (size of the interval estimate), hay nói cách khác độ lớn sai số mà ta muốn đạt Độ biến thiên kỳ vọng dân số Ta phải xác định rõ mức xác mong muốn Thường mức tin cậy 95% áp dụng rộng rãi, nhiên tăng hay giảm mức tin cậy mong muốn tùy theo nghiên cứu cụ thể Khi xác định mức tin cậy có nghĩa ta xác định hệ số Z cần tính mức tương ứng 23 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Tương tự vậy, ta cần xác định độ lớn sai số mà ta muốn có nhằm tiên đoán số dân số dựa liệu rút từ mẫu Yếu tố ảnh hưởng đến cỡ mẫu với mức tin cậy cho trước mức độ biến thiên dân số Mức độ biến thiên nhỏ cỡ mẫu ta cần nhỏ Ngược lại, mức độ biến thiên lớn cỡ mẫu phải lớn Tuy nhiên, lúc ta có số thể mức độ biến thiên dân số phương sai hay độ lệch chuẩn Tuy nhiên, ta biết mức độ biến thiên dân số nhờ vào: - Sử dụng kết tính phương sai hay độ lệch chuẩn từ nghiên cứu trước chủ đề - Tính phương sai độ lệch chuẩn dựa kết khảo sát thử nghiệm (pilot survey) mẫu nhỏ rút từ dân số - Trong trường hợp không áp dụng hai cách trên, ta áp dụng đoán sau: giả sử quan sát tuân theo quy luật phân phối chuẩn, độ lêch chuẩn khoảng 1/6 khoảng dao động liệu (tối thiểu - tối đa) với độ tin cậy 99.73% Sau có ba thông số cần thiết (mức tin cậy, độ lớn sai số, phương sai hay độ lệch chuẩn), ta tính cỡ mẫu theo công thức (6.3) đây: s n x (6.1) s x (6.2) s2 n x (6.3) n Ví dụ 6.13 Tính cỡ mẫu cho nghiên cứu thu nhập sinh viên (đơn vị tính: triệu đồng/tháng) Bước Chọn mức độ xác mong muốn: - Mức tin cậy (confidence level): 95% (Z=1,96) - Độ lớn khoảng tin cậy, mức sai số giá trị thu nhập mà ta muốn đạt qua nghiên cứu: ± 0,25 (tr.đồng/tháng) = Z*se, suy s.e = 0,25/Z Bước Xác định độ biến thiên kz vọng dân số (expected dispersion in the population): dựa kết nghiên cứu gần thu nhập sinh viên, ta có giá trị độ lệch chuẩn tham khảo = 0,7 (tr.đồng/tháng) Bước Phỏng định sai số chuẩn: se = 0,25/Z = 0,25/1,96 = 0,127 Bước Xác định cỡ mẫu n = s2/ x = 0,72/0,1272 = 30,38 = 30 24 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Nếu ta muốn nâng mức độ xác mong muốn từ 95% lên 99%, Z thay đổi từ 1,96 đến 3,0 Áp dụng vào công thức tính ta có: - Phỏng định sai số chuẩn: se = 0,25/3,0 = 0.083 - Cỡ mẫu n = 0,72/0,0832 = 71,02 = 71 Như vậy, tăng mức tin cậy từ 95% lên 99%, trường hợp này, phải tăng cỡ mẫu lên 2,4 lần Nếu ta muốn giảm độ lớn khoảng tin cậy (tăng mức xác nghiên cứu) xuống 0,1 triệu đồng/tháng thay 0,25 triệu đồng/tháng, giữ mức tin cậy 95% Áp dụng vào công thức tính, ta có: o Phỏng định sai số chuẩn: se = 0,1/1,96 = 0.051 o Cỡ mẫu n = 0,72/0,0512 = 188,38 = 188 Như vậy, giảm độ lớn khoảng tin cậy xuống 2,5 lần, cỡ mẫu phải tăng 6,3 lần trường hợp 5.3 Xác định cỡ mẫu theo tỷ lệ Đối với số trường hợp nghiên cứu, ta mong muốn biết tỷ lệ xác dân số phụ dân số có thuộc tính cho trước thay xác định giá trị trung bình dân số Giả sử ta muốn nghiên cứu xem tỷ lệ sinh viên trường đại học sở hữu máy tính xách tay phần trăm; tỷ lệ doanh nghiệp vừa nhỏ làm ăn thua lỗ năm tài vừa qua Với trường hợp này, dĩ nhiên mục tiêu ta tìm giá trị trung bình sở hữu máy tính xách tay sinh viên giá trị trung bình doanh nghiệp bị thua lỗ Ngoài ra, khái niệm trung bình không tồn biến ta cần đo lường biến định tính, với thang liệu thang đo danh nghĩa Với cách xác định cỡ mẫu theo tỷ lệ, ta phải xác định tỷ lệ dân số mà chúng có thuộc tính cho trước, tỷ lệ gọi p Và thay sử dụng độ lệch chuẩn, độ biến thiên dân trường hợp xác định p x q, q tỷ lệ dân số thuộc tính đó, tức q = (1 – p) Tương tự vậy, sai số chuẩn trung bình thay sai số chuẩn tỷ lệ, σp Ta có công thức sau: p n pq n pq (6.4) (6.5) p Với pq thị độ biến thiên mẫu, dùng ước lượng độ biến thiên dân số; σp sai số chuẩn tỷ lệ; n cỡ mẫu; 25 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Áp dụng công thức (6.5) ta tính cỡ mẫu cần thiết Sau ví dụ minh họa: Ví dụ 6.14 Ta cần nghiên cứu nhu cầu sử dụng máy tính xách tay sinh viên trường đại học Giả sử, qua khảo sát sơ lớp bất kz, ta biết tỷ lệ sinh viên sở hữu máy tính xách tay p = 30% Ta định ước lượng tỷ lệ thực dân số phạm vi sai số 10% (p = 0.30 ± 0.10), với mức tin cậy nghiên cứu 95% Cách tính thực sau: Khoảng tin cậy mong muốn mà ta kz vọng tỷ lệ dân số đạt (quyết định mục tiêu) = ± 0.10 Mức tin cậy để ước lượng khoảng tin cậy mà ta kz vọng tỷ lệ dân số đạt 95% Vì vậy, Z 1,96, ta có 0.10 1.96 x σp Suy ra, σp sai số chuẩn tỷ lệ có giá trị 0.051 (0,10/1,96) Áp dụng công thức (6.5) với giá trị trên, ta có: n 0.3x0.7 = 81 (0.051) Bảng 6.3 Tóm lược bước xác định cỡ mẫu với ví dụ Ví dụ Các bước xác định cỡ mẫu Theo trung bình Theo tỷ lệ 95% (Z=1.96) 95% (Z=1.96) ± 0.25 ± 0.10 (10 %) Độ xác mong muốn để lượng hóa nó: a Mức tin cậy mong muốn b Độ lớn khoảng tin cậy cần có Đo lường độ biến thiên Độ lệch chuẩn Độ biến thiên dân số 0,7 pq = 0.30 x 0.70 = 0.21 Ước lượng sai số chuẩn dân số Sai số chuẩn trung bình Sai số chuẩn tỷ lệ Cỡ mẫu 0,25/1,96 = 0,127 10/1.96 = 0.051 n = 30 n = 81 26 Bài giảng Phương Pháp Nghiên Cứu – Chương trình Cao học Kinh Tế (2010-2011) Thuật ngữ Chọn mẫu Sampling Phần tử dân số Population element Đơn vị nghiên cứu Unit of study Điều tra tổng thể Census Khung mẫu Sample frame Chọn mẫu phi xác suất Nonprobability sampling Chọn mẫu xác suất Probability sampling Chọn mẫu ngẫu nhiên đơn giản Simple random sampling Chọn mẫu ngẫu nhiên phức tạp Complex random sampling Chọn mẫu hệ thống Systematic sampling Chọn mẫu theo nhóm Clustering sampling Chọn mẫu phân tầng Stratified sampling Chọn mẫu nhiều giai đoạn Double, sequential, multiphase sampling Chọn mẫu thuận tiện Convenience sampling Chọn mẫu có mục đích Purposive sampling Chọn mẫu theo phán đoán Judgment sampling Chọn mẫu hạn ngạch Quota sampling Chọn mẫu cầu tuyết, mở rộng Snowball sampling Câu hỏi ôn tập Hãy cho biết khác biệt phương pháp chọn mẫu xác suất chọn mẫu phi xác suất Cho ví dụ minh họa khác biệt Phương pháp chọn mẫu phân tầng có đặc trưng nào? Cho ví dụ diễn giải minh họa Khi ta nên dùng phương pháp chọn mẫu phi xác suất? Cho ví dụ minh họa Khác biệt phương pháp chọn mẫu phân tầng (stratified sampling) chọn mẫu phân nhóm (cluster sampling) gì? Cho ví dụ minh họa Một nhóm sinh viên muốn nghiên cứu nhu cầu sử dụng máy tính xách tay sinh viên khoa Kinh tế phát triển Nhóm cho nhu cầu sử dụng máy khác biệt sinh viên thuộc niên khóa khác Nhóm muốn áp dụng phương pháp chọn mẫu phân tầng Hãy bước chọn mẫu theo nội dung 27