Phương pháp Chọn mẫu và tính toán có mẫu thường được áp dụng trong bài nghiên cứu khoa học
CHỌN MẪU VÀ TÍNH TOÁN CỠ MẪU Chọn mẫu? Nếu tất cả các cả thể của một quần thể đều giống nhau, chúng ta có một quần thể thuần nhất (homogenous). Khi đó, đặc tính của mỗi cá thể cũng chính là của quần thể. Không có sự khác nhau/ giao động tính chất giữa các cá thể. Chọn mẫu? Khi các cá thể trong một quần thể khác nhau, chúng ta có một quần thể hỗn tạp/ không thuần nhất (heterogeneous). Khi đó đặc tính của một cá thể bất kỳ không mang tính đại diện cho cả quần thể. Có sự khác nhau/ giao động giữa các cá thể. Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát được tất cả các cá thể, người ta phải chọn một số lượng cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các cá thể của quần thể để quan sát. Chọn mẫu? Quần thể Mẫu Sử dụng dữ liệu/ thông tin của một số ít tiếp cận được để nói về số đông mà không thể tiếp cận hết Chọn mẫu Là cái chúng ta muốn biết Là cái mà chúng ta quan sát Suy ra Chọn mẫu? Mẫu của một quần thể phải suy ra được những thông tin hữu ích về quần thể đó. Do vậy, mẫu phải đảm bảo có được những biến thiên cơ bản giữa các cá thể như ở quần thể. Một quần thể càng không đồng nhất… Thì sác xuất một mẫu khó có thể mô tả quần càng lớn Sẽ là một sai lầm nếu suy đặc tính của mẫu thành đặc tính của quần thể. Và… Thì số lượng cá thể của mẫu phải càng lớn để có thể mô tả quần thể tốt Một mẫu phải có số lượng cá thể đủ lớn để cho thể suy đặc tính của mẫu thành của quần thể Chọn mẫu? Chọn mẫu là một quy trình lựa chọn cá thể từ quần thể cho quan sát, để có thể coi kết quả quan sát mẫu thành kết quả quan sát quần thể, ở một mức độ chấp nhận mà xác định được. Mẫu là đại diện của một quần thể. Mức độ đại diện phải được xác định/ đo lường được. Có hai cách chọn mẫu: Chọn mẫu không ngẫu nhiên Chọn mẫu ngẫu nhiên Các khái niệm cơ bản Toàn thể: Là tập hợp lý thuyết của tất cả các cá thể, không xác định không gian và thời gian Quần thể: Là tập hợp lý thuyết của tất cả cá thể theo một đặc tính, trong một khoảng không gian và thời gian xác định. Mẫu/ quần thể quan sát được: Là tập hợp một số lượng cá thể, lựa chọn từ một quần thể trên một đặc tính mẫu quan tâm. Đặc tính mẫu: Là cơ sở để xác định, lựa chọn cá thể của quần thể vào một mẫu, có số lượng cá thể ít hơn, ví dụ cá thể một quần thể người có thể là cá thể người, hộ gia đình, làng/ xóm Danh sách/ khung mẫu: Là danh sách các cá thể của một quần thể, giúp hỗ trợ kỹ thuật cho quá trình chọn mẫu Cỡ mẫu: Là số lượng cá thể được lựa chọn từ một số lượng xác định/ không xác định cá thể của quần thể vào một tập hợp mẫu. Sức mạnh mẫu: Là mức độ suy diễn kết quả thống kê trên mẫu thành kết quả của quần thể Phân loại các phương pháp chọn mẫu Chọn mẫu Ngẫu nhiên Ngẫu nhiên đơn Theo cụm Hệ thống Phân tầng Không ngẫu nhiên Chỉ tiêu Chủ đích Thuận tiện Ném bóng tuyết Chọn mẫu ngẫu nhiên Chọn mẫu ngẫu nhiên ñơn Đảm bảo mỗi cá thể của quần thể ñược lựa chọn với xác suất như nhau vào mẫu Ghép cặp mỗi cá thể với một số ngẫu nhiên, các cá thể ñược lựa chọn theo sự ngẫu nhiên của con số. Sác xuất lựa chọn = Cỡ mẫu Tổng số cá thể của quần thể Chọn mẫu ngẫu nhiên đơn Khoảng cách giữa các cá thể là ngẫu nhiên, không có quy luật nào Ưu ñiểm Không cần nhiều thông tin về quần thể Tính gía trị cao, xác ñịnh ñược sai số thống kê Dễ dàng phân tích dữ liệu Hạn chế Tốn kém Yêu cầu danh sách cá thể trong quần thể Không cần chuyên môn của nghiên cứu viên Nguy cơ sai số ngẫu nhiên Chọn mẫu hệ thống Cá thể ñầu tiên ñược lựa chọn ngẫu nhiên trong quần thể, các cá thể tiếp theo ñược lựa chọn theo một khoảng cách xác ñịnh so với cá thể trước ñó. Khoảng cách xác ñịnh ñược gọi là khoảng cách mẫu = Tổng số cá thể của quần thể/ cỡ mẫu Chọn mẫu hệ thống Khoảng cách giữa các cá thể bằng nhau Mang tính quy luật Ưu ñiểm Chi phí hợp lý, hay ñược sử dụng Tính gía trị cao, xác ñịnh ñược sai số thống kế Các cá thể dễ tiếp cận Hạn chế Sai số chu kỳ do bản thân danh sách cá thể cũng có thể có tính chu kỳ Yêu cầu danh sách cá thể của quần thể Chọn mẫu phân tầng Chia quần thể theo một đặc tính cụ thể thành các nhóm/ tầng (strata) (Ví dụ: Chia quần thể sinh viên trường ĐHY Hà Nội thành 3 nhóm/ tầng: học viên tiến sĩ, học viên thạc sĩ và học viên đại học). Các cá thể trong mỗi tầng đồng nhất, nhưng không đồng nhất giữa các tầng. Có thể áp dụng chọn mẫu ngẫu nhiên đơn hay chọn mẫu hệ thống ở mỗi tầng (strata). Số mẫu mỗi tầng tham gia vào tổng mẫu có thể bằng nhau (chọn mẫu phân tầng không cân xứng) hay tỷ lệ với số cá thể của mỗi tầng (chọn mẫu phân tầng cân xứng) Tầng 1 Tầng 2 N= 2000 N = 6000 Chọn mẫu phân tầng không cân xứng 1000 1000 Tầng 1 Tầng 2 N= 2000 N = 6000 Chọn mẫu phân tầng cân xứng 1000 3000 Ưu ñiểm Đảm bảo mỗi nhóm ñều có tính ñại diện trong tổng mẫu Mỗi nhóm ñều ñược thống kê và so sánh Giảm sai số hệ thống Hạn chế Yêu cầu thông tin chính xác về tỷ lệ giữa các tầng Chi phí ñể có ñược danh sách mỗi tầng Chọn mẫu theo cụm/ chùm Cụm ñây là cụm ñịa lý nơi các các thể sinh sống. Đầu tiên là chọn cụm, sau ñó mới chọn cá thể trong cụm. Phương pháp hay ñược sử dụng khi không có danh sách cá thể của quần thể Các loại chọn mẫu theo cụm/ chùm Chọn mẫu theo cụm 2 bước: Chọn cụm – chọn cá thể trong cụm Chọn mẫu theo cụm nhiều bước: Ví dụ: chọn 7 vùng sinh thái ở Việt Nam, chọn 1 tỉnh ở mỗi vùng sinh thái, chọn 1 huyện ở 1 tỉnh, chọn 1 xã ở 1 huyện, 1 thôn/ bản ở 1 xã, chọn 200 hộ gia ñình ở 1 thôn/ bản theo cỡ mẫu. [...]... a qu n th Tính toán c m u Tính toán c m u đơn gi n: D a vào công th c cơ b n, Không tính đ n thi t k nghiên c u, Không tính đ n các thu t toán th ng kê s d ng trong thi t k Tính toán đơn gi n, b ng máy calculator thông thư ng Thư ng không chính xác, ch có tính ch t gi i trình đ đ m c ch n m u và tính c m u trong đ cương hay báo cáo nghiên c u Tính toán c m u Tính toán c m u nâng cao: D a vào m t s... thể Chọn mẫu có chủ ñích (Judgment or Purposive Sampling) Chọn cá thể có một số ñặc tính mong muốn vào mẫu với chủ ñích của nghiên cứu viên Ưu ñiểm Chi phí vừa phải Hay ñược sử dụng Mẫu lựa chọn ñảm bảo ñược mục tiêu Hạn chế Sai số! Khó giải trình việc suy luận kết quả thống kê trên mẫu ra của quần thể Chọn mẫu theo chỉ tiêu Mẫu ñảm bảo ñặc tính của quần thể, ñại diện ở một mức ñộ mà nghiên cứu viên... viên Nghiên c u viên nh p thi t k nghiên c u, thu t toán th ng kê s d ng và các d li u liên quan đ n bi n s vào ph n m m đ tính ra c m u Nghiên c u viên có th phân tích đ nh y m i liên quan gi a S c m nh m u và c m u Nghiên c u viên ph i có ki n th c chuyên sâu v thi t k nghiên c u và các thu t toán th ng kê đ có th s d ng đư c ph n m m cũng như phiên gi i k t qu 4 bư c s d ng ph n m n nquery tính toán. .. p(1-p)/ E2 = Z2 Np(1-p)/ E2 (N-1)+ Z2 pq - T phân v n = pc(100-pc) Z2/ E2 - Z cho m c đ tin c y 95% = 1.96, 99% = 2.58 - Công th c trên có th m r ng ra Qu n th có s lư ng m u xác đ nh và không xác đ nh b ng cách nhân ho c không v i h s N*(N-1), - T l d báo xác đ nh và không xác đ nh b ng cách nhân và không v i h s p*(1-p) - Qu n th xác bi n thiên hay không bi n thiên b ng cách nhân và không nhân v i... trong ph n m n tính c m u nâng cao Giao di n tính toán c m u Nh p giá tr mong mu n cho m u Ô tính ra c m u Công th c máy tính tính c m u cho thi t k Tính toán c m u chuyên nghi p D a vào ph n m m tính toán c m u chuyên nghi p, trong gói SAS, ho c chuyên nghi p v i n-query Ph n m m r t đ t (c 1 tri u USD cho SAS, 1050 USD cho nquery) H c viên có nhu c u h c thêm ng d ng c a ph n m m nquery có th liên h... nhiên Chọn mẫu thuận tiện Cá thể ñược lựa chọn vào mẫu một cách “thuận tiện”, sẵn có và dễ tiếp cận Tại sao dùng: nhanh và chi phí thấp Phải giải trình và ñánh giá giá trị nếu chọn mẫu thuận tiện Ưu ñiểm Chi phí rất thấp Hay ñược sử dụng Không cần danh sách cá thể trong quần thể Hạn chế Độ biến thiên và sai số không ño lường và kiểm soát ñược Khó giải trình việc suy luận kết quả thống kê trên mẫu ra của... t k nghiên c u, tác đ ng và thu t toán th ng kê phân tích C th hóa nh p li u thu t toán th ng kê Lo i thi t k Lo i d li u đ u ra S nhóm m u Lo i phân tích th ng kê 4 bư c s d ng ph n m n nquery tính toán c m u chuyên nghi p Bư c 2: Xác đ nh giá tr c th c a bi n s và mong mu n đ c tính m u Các ô tính ra c m u Nh p giá tr c th c a bi n s và mong mu n đ c tính m u 4 bư c s d ng ph n m n nquery tính toán. .. cá thể trong quần thể Có phần nào tính chất của chọn mẫu phân tầng Hạn chế Không ño lường và giải trình ñược biến thiên và sai số Chọn mẫu “Ném bóng tuyết“ (Snowball sampling) Chọn mẫu bắt ñầu từ một cá thể, ñược chọn một cách ngẫu nhiên hay không ngẫu nhiên Các cá thể tiếp theo ñược chọn từ cá thể ban ñầu hay trước ñó, giống như trò chơi ném bóng tuyết, ai trúng thì ñược lựa chọn Ưu ñiểm Chi phí thấp... c m u và ngư c l i Các ô k t qu Nh p giá tr c th c a bi n s và mong mu n đ c tính m u 4 bư c s d ng ph n m n nquery tính toán c m u chuyên nghi p Bư c 4: Phân tích đ nh y c a m i quan h S c m nh m u –C m u Bi u đ c a phân tích đ nh y Tính toán c m u cơ b n 3 công th c cơ b n (ph n in đ m là công th c g c): - T trung bình n = (ZS/E) 2= (Z(d-c)/E) 2 = N(ZS/E) 2/(N-1) =(ZS/E) 2 - T t l n = Z2 p(1-p)/ E2... Hạn chế Sai số do cá thể lựa chọn không hoàn toàn ñộc lập Khó giải trình việc suy diễn kết quả thống kê trên mẫu ra của quần thể Tính toán c m u Thông tin/ d li u c n thi t Lo i nghiên c u Các thu t toán th ng kê s d ng Đ c tính c a cá th - Th hi n qua bi n s (khác bi t cơ b n gi a bi n liên t c – bi n phân h ng) K t qu các nghiên c u trư c đư c đưa vào làm cơ s tính toán Đ tin c y (95%, 90%) Gía . chỉ có tính chất giải trình đủ đề mục chọn mẫu và tính cỡ mẫu trong đề cương hay báo cáo nghiên cứu. Tính toán cỡ mẫu Tính toán cỡ mẫu nâng cao: Dựa vào một số phần mềm tính toán cỡ mẫu. hơn tính toán cỡ mẫu đơn giản Chưa toàn diện so với tính toán cỡ mẫu chuyên nghiệp Giao diện chọn các thiết kế nghiên cứu trong phần mền tính cỡ mẫu nâng cao Giao diện tính toán cỡ mẫu Ô tính. số vào phần mềm để tính ra cỡ mẫu. Nghiên cứu viên có thể phân tích độ nhạy mối liên quan giữa Sức mạnh mẫu và cỡ mẫu. Nghiên cứu viên phải có kiển thức chuyên sâu về thiết kế nghiên cứu và