Dữ liệu: + Định tính: tính chất + Định lượng: mức độ Nguồn dữ liệu: + Sơ cấp: thu thập trực tiếp từ đơn vị điều tra + Thứ cấp: thu thập từ nguồn có sẵn Các loại điều tra thống kê như
Trang 1NỘI DUNG PHẦN A: TỔNG QUAN
I.TẦM QUAN TRỌNG CỦA VIỆC THU THẬP THÔNG TIN ĐỊNH LƯỢNG
Nghiên cứu định lượng là phương pháp thu thập dữ liệu bằng số và giải quyết
cứu thông tin là một công việc quan trọng cần thiết cho bất kỳ hoạt động nghiên cứu khoa học Vì vậy, dữ liệu dùng cho phân tích định lượng có thể thu thập và nghiên cứu tài liệu nhằm mục đích:
Giúp cho người nghiên cứu nắm được phương pháp nghiên cứu
Làm rõ hơn đề tài nghiên cứu của mình
Giúp người nghiên cứu có phương pháp luân chặt chẽ hơn
Có thêm kiến thức sâu, rộng về lĩnh vực đang nghiên cứu
Tránh trùng lặp với các nghiên cứu trước đây Vì vậy đỡ mất thời gian, công sức và tài chính
Thông tin sử dụng cho quá trình nghiên cứu định lượng phải đảm bảo các yêu cầu cơ bản sau: Thích đáng, chính xác, kịp thời, khách quan
II.PHƯƠNG PHÁP PHÂN TÍCH THÔNG TIN ĐỊNH LƯỢNG
1.Phương pháp thống kê mô tả
a Khái niệm.
Thống kê mô tả (Descriptive statistics) là nghiên cứu việc tổng hợp, số hóa, biểu diễn
bằng đồ thị các số liệu thu thập được Sau đó tính toán các tham số đặc trưng cho tập hợp dữ liệu như: trung bình, phương sai, tần suất, tỷ lệ
b Nội dung thông kê mô tả.
- Mô tả xu hướng trung tâm
Mô tả định lượng cho các mẫu và các tổng thể thường cho ta ấn tượng chung về các giá trị phổ biến, như giá trị giữa hay trung bình, được gọi là các số đo xu hướng trung tâm và được thảo luận hầu như trong mọi giáo trình thống kê Ba cách đo lường xu hướng trung tâm được sử dụng nhiều nhất trong nghiên cứu kinh doanh là :
+ Giá trị xuất hiện thường xuyên nhất (mode) : Đối với dữ liệu mô tả số mode là số đo duy nhất của xu hướng trung tâm có thể được diễn giải hợp lý nhất
Trang 2+ Giá trị nằm giữa hoặc điểm nằm giữa sau khi dữ liệu đã được xếp hạng ( số trung vị -median), để thể hiện giá trị chính giữa Nếu chúng ta có dữ liệu định lượng, ta có thể tính giá trị giữa hay giá trị trung vị bằng cách sắp xếp tất cả các giá trị theo trật tự tăng dần rồi tìm điểm chính giữa Số trung vị có lợi thế không chịu ảnh hưởng bởi các giá trị cực trong phân bổ
+ Giá trị thường được gọi là trung bình bao gồm mọi giá trị khi tinh toán( Số bình quân)
+ Số đo xu hướng trung tâm phổ biến nhất là số bình quân hay số trung bình, bao gồm mọi giá trị dữ liệu trong phép tính Tuy nhiên, thường chỉ có thể tính được giá trị bình quân
có ý nghĩa khi sử dụng dữ liệu định lượng
- Mô tả sự phân tán
+ Giống mô tả xu hướng trung tâm của một biến, cũng sẽ quan trọng khi mô tả các giá trị dữ liệu phân tán như thế nào xung quanh xu hướng trung tâm
+ Mô tả sự phân tán để thể hiện sự khác biệt giữa các giá trị đồng thời mô tả và so sánh sự khác biệt giữa các giá trị so với số trung bình
+ Trong nghiên cứu, điều quan trọng về mặt khái niệm và thống kê là việc xem xét mức độ mà các giữ liệu của một biến phân tán xung quanh giá trị trung bình
+ Để mô tả mức phân tán của dữ liệu định lượng, chúng ta sử dụng độ lệch chuẩn
c Các loại thang đo thống kê
- Khái niệm thang đo: Cách sắp xếp thông tin nghiên cứu trong công tác xã hội theo hệ thống các con số hoặc chữ mà tỷ lệ giữa chúng đồng đẳng với trật tự các sự kiện được đo lường
- Thang đo định danh : Là thang đo dùng các mẫu số để phân loại các đối tượng Thang
đo định danh không mang ý nghĩa nào cả mà chỉ để lượng hóa các số liệu cần cho nghiên cứu Nó thường được sử dụng cho các tiêu thức thuộc tính Người ta thường dùng các số tự nhiên như 1,2,3,4 để làm mã số Hay còn gọi là thang danh nghĩa, nó xác định những biến thể của dấu hiệu Thang danh nghĩa chỉ xác định rằng A khác B Người ta gọi là thang giả vì bản thân nó không đo lường gì cả, tuy vậy nó làm cho tất cả mọi thủ tục khác về thang đo Đặc điểm của thang này cần loại trừ nhau không trùng lặp ( Tuy vậy nhiều vấn đề không thể loại trừ nhau)
Trang 3- Thang đo thứ bậc : Là thang đo sự chênh lệch giữa các biểu hiện của tiêu thức có quan
hệ thứ bậc hơn hoặc kém Sự chênh lệch này không nhất thiết phải bằng nhau Nó được dùng cho cả tiêu thức thuộc tính và tiêu thức số lượng
- Thang đo khoảng: Là thang đo thứ bậc có khoảng cách đều nhau Nó được dùng cho
cả tiêu thức thuộc tính và tiêu thức số lượng Thang đo khoảng cho phép chúng ta đo lường một cách chính xác sự khác nhau giữa hai giá trị
- Thang đo tỷ lệ: Là loại thang đo cao nhất trong thống kê Nó sử dụng các số tự nhiên như từ 1 đến 9 và 0 để lượng hóa các dữ liệu Nó được sử dụng chủ yếu cho các tiêu thức số
và lượng
Thí dụ : Doanh thu của một của hàng bán thuốc là 300 triệu đồng, nhiệt độ ngày
25/5/2012 là 34oC Thang đo tỷ lệ chứa đựng thông tin cho biết khoảng cách giữa hai hạng chia lớn hơn hay nhỏ hơn khoảng cách giữa hai hạng chia khác của thang đo bao nhiêu lần Thang này đòi hỏi phải có số không tuyệt đối làm điểm xuất phát cho độ dài được đo của thang
Chỉ với thang đo tỷ lệ, người ta mới có thể đo lường các hiện tượng như các đơn vị
đo lường vật lý thông thường (kg, mét ) Trong nghiên cứu trong công tác xã hội, thang này gần như không sử dụng được ( vì cách xây dựng thang rất khó trong xã hội, không đo lường
cụ thể chính xác như trong tự nhiên hay kinh tế)
d.Quy trình nghiên cứu thống kê
Xác định mục đích đối tượng, nội dung nghiên cứu
Xây dựng hệ thống chỉ tiêu thống kê
Điều tra thống kê
Tổng hợp thống kê
Phân tích thống kê
Dự đoán thống kê
Xác định mục đích, đối tượng, nội dung nghiên cứu Đây là khâu đầu tiên của quá trình nghiên cứu thống kê
Căn cứ để xác định đúng mục đích:
+ Căn cứ vào tình hình thực tiễn
+ Căn cứ vào yêu cầu cung cấp thông tin
+ Căn cứ vào khả năng về tài chính, nhân lực, thời gian
Trang 4Điều tra thống kê là tổ chức một cách khoa học và theo kế hoạch thống nhất để thu thập
dữ liệu về các hiện tượng và quá trình kinh tế xã hội
Dữ liệu: + Định tính: tính chất
+ Định lượng: mức độ
Nguồn dữ liệu: + Sơ cấp: thu thập trực tiếp từ đơn vị điều tra
+ Thứ cấp: thu thập từ nguồn có sẵn
Các loại điều tra thống kê như: điều tra thường xuyên, điều tra không thường xuyên, điều tra toàn bộ, điều tra không toàn bộ, điều tra trọng điểm, điều tra chuyên đề, điều tra chọn mẫu Các phương pháp thu thập dữ liệu thống kê Thu thập trực tiếp(quan sát, phỏng vấn trực tiếp), thu thập gián tiếp (thu thập thông tin qua trung gian hay khai thác tài liệu từ các văn bản sẵn có)
Phương án điều tra: + Xác định mục đích, yêu cầu
+ Xác định đối tượng, đơn vị điều tra
+ Xác định nội dung, phương pháp điều tra
+ Xác định thời gian và địa điểm điều tra
+ Xây dựng bảng biểu điều tra
+ Xác định cơ quan và lực lượng tiến hànhđiều tra
+ Xây dựng chương trình xử lý tổng hợp và phân tích số liệu + Tổng hợp, phân tích, công bố kết quả điều tra
Sai số trong điều tra thống kê: Là chênh lệch giữa các trị số của tiêu thức điều tra
mà ta thu thập được so với trị số thức tế của hiện tượng nghiên cứu
Tổng hợp thống kê là tiến hành tập trung, chỉnh lý và hệ thống hoá một cách khoa học các thông tin thu thập được nhằm bước đầu chuyển một số đặc điểm riêng của các đơn vị điều tra thành đặc điểm chung của tổng thể nghiên cứu
Phân tích thống kê là việc nghiên cứu nêu lên một cách tổng hợp bản chất và tính qui luật của hiện tượng trong điều kiện lịch sử nhất định qua biểu hiện bằng số lượng là chủ yếu
Dự đoán thống kê là việc căn cứ vào tài liệu thống kê về hiện tượng nghiên cứu trong thời gian đã qua, dùng các phương pháp thích hợp để tính toán các mức
độ tương lai để báo cáo, giải thích và truyền đạt kết quả nghiên cứu
2.Phương pháp Hồi quy tương quan
Trang 5a Khái niệm
Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập(biến
thuyết minh)quy định các biến phụ thuộc (biến được thuyết minh) như thế nào
Đây là một phương pháp thống kê mà giá trị kỳ vọng của một hay nhiều biến ngẫu nhiên được dự đoán dựa vào điều kiện của các biến ngẫu nhiên khác
Ví dụ: thường dùng là sự phụ thuộc của huyết áp Y theo tuổi tác X của một người,
hay sự phụ thuộc của trọng lượng Y của một con thú nào đó theo khẩu phần thức ăn hằng ngày X Sự phụ thuộc này được gọi là hồi qui của Y lên X
Hồi qui thường được xếp vào loại bài toán tối ưu vì chúng ta nỗ lực để tìm kiếm một giải pháp để cho sai số và phần dư là tốt nhất
b Các phương pháp phân tích hồi quy
Phân tích hồi qui logistic
Hồi qui logistic là một kỹ thuật phân tích hồi qui trong đó biến số phụ thuộc (Y) là một biến số nhị phân (dichotomous – binary variable), theo đó Y thường được mã hoá là 1 và
0 (Y = 1, thành công; Y = 0, thất bại) Biến số độc lập trong hồi qui logistic có thể là biến số rời hoặc liên tục, biến số đơn hoặc đa biến số
Mục tiêu của hồi qui Logistic là nghiên cứu các đối tượng thường được thể hiện qua các biến số nhị phân (binary) như xảy ra/ không xảy ra, còn các yếu tố nguy cơ có thể được thể hiện qua các biến số liên tục hoặc các biến nhị phân hay các biến thứ bậc Vấn đề đặt ra cho nghiên cứu dạng này là là sao để ước tính độ tương quan của các yếu tố nguy cơ và đối tượng phân tích Các phương pháp phân tích như hồi qui tuyến tích không áp dụng được vì biến phụ thuộc không phải là biến liên tục mà là biến nhị phân
Ví dụ : B ng d li u d ảng dữ liệu dưới đây thu thập để nghiên cứ mối tương quan giữa ữ liệu dưới đây thu thập để nghiên cứ mối tương quan giữa ệu dưới đây thu thập để nghiên cứ mối tương quan giữa ưới đây thu thập để nghiên cứ mối tương quan giữa đây thu thập để nghiên cứ mối tương quan giữa i ây thu th p ập để nghiên cứ mối tương quan giữa đây thu thập để nghiên cứ mối tương quan giữaể nghiên cứ mối tương quan giữa nghiên c m i t ứ mối tương quan giữa ối tương quan giữa ương quan giữa ng quan gi a ữ liệu dưới đây thu thập để nghiên cứ mối tương quan giữa tình tr ng ph i nhi m ch t ơng quan giữa ễm chất độc gia cam (Agent Orange – AO) và ung thư tuyến ất độc gia cam (Agent Orange – AO) và ung thư tuyến đây thu thập để nghiên cứ mối tương quan giữaộc gia cam (Agent Orange – AO) và ung thư tuyến c gia cam (Agent Orange – AO) v ung th tuy n à ung thư tuyến ư ến
ti n li t ền liệt ệu dưới đây thu thập để nghiên cứ mối tương quan giữa
Ung thư (47) Đối chứng (144)
Trang 6Số liệu bảng trên cho thấy 23.4% (11/36) người bị ung thư tuyến tiền liệt từng bị phơi nhiễm
AO Tỷ lệ này trong nhóm đối chứng là 11.8% (17/144) Vấn đề đặt ra là có sự tương quan nào giữa tình trạng phơi nhiễm AO và ung thư tuyến tiền liệt hay không ? Nghiên cứu cần trả lời 2 vấn đề sau :
- Nguy cơ mắc bệnh ung thư tuyến tiền liệt của những người từng bị phơi nhiễm AO
so với nguy cơ ở những người không từng bị phơi nhiễm là bao nhiêu ?
- Sự khác biệt về nguy cơ ung thư tuyến tiền liệt giữa 2 nhóm phơi nhiễm và không phơi nhiễm AO có ý nghĩa thống kê
Hồi qui tuyến tính
Phân tích hồi qui tuyến tính cung cấp cho chúng ta một mô hình để tiên lượng một biến số lâm sàng từ một yếu tố khác Vì là “mô hình” (model) cho nên phải có tham số (parameter) Do đó, trong phân tích hồi qui tuyến tính, chúng ta còn phải ước tính các tham
số của mô hình tiên lượng
Hồi quy tuyến tính đơn
Hồi quy tuyến tính bội
Hồi quy tuyến tính không biến
Phân tích hồi quy tuyến tính là một phương pháp phân tích quan hệ giữa biến phụ
thuộc Y với một hay nhiều biến độc lập X Mô hình hóa sử dụng hàm tuyến tính (bậc 1) Các tham số của mô hình được ước lượng từ dữ liệu
Hồi quy tuyến tính được sử dụng rộng rãi trong thực tế do tính chất đơn giản hóa của hồi quy Nó cũng dễ ước lượng
Hồi qui Poisson
Mô hình hồi qui để tìm hiểu mối liên hệ giữa biến tiên lượng và biến phụ thuộc tuân theo luật phân bố Poisson được đặt tên là Poisson Regression (hay hồi qui Poisson)
Mô hình hồi qui Poisson thì ứng dụng cho trường hợp biến phụ thuộc là biến mang tính đếm hoặc tỉ suất, và cũng như các mô hình khác, biến tiên lượng có thể là biến liên tục hay không liên tục
Trang 7c Liên hệ hàm số và liên hệ tương quan.
Trong lý thuyết xác suất và thống kê, hệ số tương quan cho biết độ mạnh của mối tương quan tuyến tính giữa hai biến số ngẫu nhiên
Giữa các sự vật hiện tượng tự nhiên cũng như trong cuộc sống luôn tồn tại mối liên
hệ, mối liên hệ đó rất phong phú, nhiều vẻ đó là quan điểm của các nhà triết học, lí luận của chủ nghĩa duy vật biện chứng, do đó các sự vật hiện tượng đó luôn tác động qua lại lẫn nhau, không hiện tượng nào phát sinh, phát triển một cách độc lập, tách rời các hiện tượng khác Trong mối liên hệ phổ biến đó, nếu xét theo mức độ chặt chẽ của mối liên hệ có thể phân ra thành hai loại bao gồm:
+ Thứ nhất là liên hệ hàm số: là mối liên hệ hoàn toàn chặt chẽ giữa tiêu thức nguyên nhân hay còn gọi là biến độc lập, kí hiệu là x và tiêu thức kết quả còn gọi là biến phụ thuộc,
kí hiệu là y Quan hệ này có thể biểu diến dưới dạng tổng quát là hàm số : y = f(x), nến khi x thay đổi, có thể xác định được giá trị của y qua mối liên hệ này
+ Thứ hai là mối liên hệ tương quan: là mối liên hệ không hoàn toàn chặt chẽ giữa tiêu thức nguyên nhân x và tiêu thức kết quả y Sự không chặt chẽ đó được thể hiện ở chỗ khi tiêu thức nguyên nhân x thay đổi thì tiêu thức kết quả y thay đổi nhưng nó không ảnh hưởng hoàn toàn, quyết định đến sự biến đổi này
d Phân tích hồi quy và tương quan
Nhiệm vụ của phân tích hồi quy và tương quan
Các hiện tượng tồn tại trong mối liên hệ phụ thuộc lẫn nhau Tuỳ theo mức độ chặt chẽ của mối liên hệ phụ thuộc lẫn nhau đó mà phân các mối liên hệ này thành liên hệ hàm số hay liên hệ tương quan Phương pháp phân tích hồi quy và tương quan thường được sử dụng trong nghiên cứu các mối liên hệ phụ thuộc và do vậy, phương pháp này cũng được sử dụng khá phổ biến trong nghiên cứu thống kê với những nhiệm vụ cụ thể sau:
+ Xác định mô hình hồi quy phản ánh mối liên hệ để làm căn cứ vào nhiệm vụ nghiên cứu cụ thể để chọn ra một, hai hay ba… tiêu thức nguyên nhân và một tiêu thức kết quả Các tiêu thức nguyên nhân được chọn là các tiêu thức có ảnh hưởng lớn đến tiêu thức kết quả + Để giải quyết vấn đề này đòi hỏi phải có sự phân tích một cách sâu sắc bản chất của mối liên hệ trong điều kiện lịch sử cụ thể Đây là vấn đề trước tiên quyết định sự thành công
Trang 8của nghiên cứu hồi quy Từ đó có thể xây dựng mô hình hồi quy giữa một tiêu thức nguyên nhân và một tiêu thức kết quả và được gọi là mô hình hồi quy đơn
Đánh giá mức độ chặt chẽ của mối liên hệ tương quan
Việc đánh giá mức độ chặt chẽ của mối liên hệ tương quan được thực hiện thông qua việc tính toán hệ số tương quan, tỷ số tương quan, hệ số tương quan bội, hệ số tương quan riêng phần
Hệ số tương quan được sử dụng để đánh giá mức độ chặt chẽ của mối liên hệ tương quan tuyến tính giữa hai tiêu thức số lượng, tỷ số tương quan được sử dụng để đánh giá mức
độ chặt chẽ mối liên hệ tương quan phi tuyến tính và tuyến tính giữa hai tiêu thức số lượng
Hệ số tương quan bội được sử dụng để đánh giá mức độ chặt chẽ mối liên hệ tương quan tuyến tính giữa tất cả các tiêu thức nguyên nhân và tiêu thức kết quả
Hệ số tương quan riêng phần được sử dụng để đánh giá mức độ chặt chẽ giữa một tiêu thức nguyên nhân nào đó với tiêu thức kết quả trong khi các tiêu thức nguyên nhân khác không đổi Dựa vào kết quả tính toán các hệ số này có thể kết luận về mức độ chặt chẽ của mối liên hệ, giúp cho việc nhận thức hiện tượng được sâu sắc, từ đó đề ra những giải pháp cụ thể
e Phạm vi áp dụng phân tích hồi quy và tương quan
Phương pháp phân tích hồi quy và tương quan là phương pháp thường được sử dụng trong thống kê để nghiên cứu mối liên hệ giữa các hiện tượng, như mối liên hệ giữa các yếu
tố đầu vào của quá trình sản xuất với kết quả sản xuất, mối liên hệ giữa thu nhập và tiêu dựng, mối liên hệ giữa phát triển kinh tế và phát triển xã hội
Phương pháp phân tích hồi quy và tương quan cũng được vận dụng trong một số phương pháp nghiên cứu thống kê khác như phân tích dãy số thời gian, dự đoán thống kê
PHẦN B: PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU ĐỊNH LƯỢNG I.QUY TRÌNH CHỌN MẪU
Trong các nghiên cứu định lượng, mẫu đại diện là mô hình thu nhỏ của tổng thể Cấu trúc của mẫu cần phải phù hợp tối đa với cấu trúc của tổng thể về các đặc điểm định tính căn bản và các đặc điểm kiểm soát Tính đại diện và độ tin cậy của thông tin thu thập phụ thuộc nhiều vào sự đúng đắn của việc thực hiện lấy mẫu
Trang 91 Xác định tổng thể nghiên cứu
Vấn đề nghiên cứu và đối tượng nghiên cứu là các nhân tố nhất định khi xác định tổng thể Đối tượng nghiên cứu phải là vật mang thông tin hữu ích, cần phải tính đến các đặc điểm
về cấu trúc, không gian và thời gian của đối tượng nghiên cứu Đặc điểm cấu trúc cho phép nhà nghiên cứu tập trung chú ý các đặc tính quan trọng nhất của đối tượng nghiên cứu
2 Quyết định nghiên cứu toàn bộ hay nghiên cứu mẫu
Nghiên cứu toàn bộ thường gắn liền với chi phí, thời gian và nỗ lực rất nhiều, trong nhiều trường hợp nghiên cứu toàn bộ là không thể Trong khi đó, kết quả nghiên cứu
khi thực hiện đúng, không khác nhiều so với bức tranh tổng thể Điều này cho thấy ưu điểm của chọn mẫu Trong trường hợp này, chúng ta có thể thiết kế nghiên cứu để đạt được độ chính xác cần thiết với xác suất nhất định
3 Mô tả tổng thể
Mô tả tổng thể là cần thiết để chọn lựa đáp viên đưa vào mẫu, ra quyết định về lựa chọn phương pháp xây dựng mẫu cụ thể Mô tả tổng thể bao gồm miêu tả cấu trúc (kể cả địa bàn nghiên cứu) chúng ta đang quan tâm đến và đánh giá định lượng các yếu tố của cấu trúc Để có được thông tin về tổng thể có thể sử dụng số liệu thống kê, phân tích tài liệu, ý kiến chuyên gia
4 Xác định phương pháp lấy mẫu
Dựa vào mục đích nghiên cứu, tầm quan trọng của công trình nghiên cứu, thời gian tiến hành nghiên cứu, kinh phí dành cho nghiên cứu, kỹ năng của nhóm nghiên cứu, để quyết định chọn phương pháp chọn mẫu xác suất hay phi xác suất, sau đó tiếp tục chọn ra hình thức cụ thể của phương pháp này Trong các nghiên cứu định lượng, thường sử dụng phương pháp lấy mẫu xác suất
5 Xác định kích thước mẫu
Bước tiếp theo là xác định kích thước mẫu Khi xác định kích thước mẫu nên tính đến năng lực tài chính, khả năng tổ chức nghiên cứu, độ chính xác và độ tin cậy cần thiết Một mặt, đại lượng mẫu cần phải “có ý nghĩa thống kê”, tức là cỡ mẫu đủ lớn để có được thông tin đáng tin cậy Mặt khác tiết kiệm và tối ưu
Các khái niệm :
Mức độ chính xác do việc chọn mẫu mang lại :
Trang 10Mức độ chính xác do việc chọn mẫu mang lại tỷ lệ thuận với bình phương của quy mô mẫu Khi tăng quy mô mẫu lên k lần thì mức độ chính xác sẽ tăng lên k lần
Ví dụ: Khi tăng quy mô mẫu từ 500 người lên 1000 người, tức tăng gấp 2 lần thì mức
độ chính xác tăng lên gấp 2 lần, tức là tăng 40% Còn muốn tăng độ chính xác lên gấp 2 lần thì phải tăng quy mô mẫu lên gấp 4 lần
Sai số do chọn mẫu.
Sai số do chọn mẫu là chênh lệch giữa giá trị tham số thu được trên mẫu và giá trị tham
số đó trên tổng thể chung
Khoảng tin cậy.
Khoảng tin cậy là khoảng giá trị mà dựa vào giá trị tham số trên mẫu, ta ước lượng giá trị tham số của tổng thể sẽ rơi vào đó
Độ tin cậy.
Là khả năng đúng khi ta ước lượng giá trị tham số tổng thể nằm trong khoảng tin cậy
6 Tiến hành lấy mẫu
Khi có được kết quả thực hiện các bước như trên trước, chúng ta có thể thực hiện thủ tục lấy mẫu để chọn các đáp viên cụ thể Trong quá trình lấy mẫu có thể khó tiếp cận đến những đáp viên đã chọn Trong trường hợp này, có thể xem lại chiến lược lấy mẫu đã chọn
II.PHƯƠNG PHÁP CHỌN MẪU
Điều tra chọn mẫu có nghĩa là không tiến hành điều tra hết toàn bộ các đơn vị
của tổng thể, mà chỉ điều tra trên 1 số đơn vị nhằm để tiết kiệm thời gian, công sức và chi phí Từ những đặc điểm và tính chất của mẫu ta có thể suy ra được đặc điểm và tính chất của
cả tổng thể đó Vấn đề quan trọng nhất là đảm bảo cho tổng thể mẫu phải có khả năng đại diện được cho tổng thể chung
1.Phương pháp chọn mẫu ngẫu nhiên
Chọn mẫu ngẫu nhiên (hay chọn mẫu xác suất) là phương pháp chọn mẫu mà khả năng được chọn vào tổng thể mẫu của tất cả các đơn vị của tổng thể đều như nhau Đây là phương pháp tốt nhất để ta có thể chọn ra một mẫu có khả năng đại biểu cho tổng thể Vì có thể tính được sai số do chọn mẫu, nhờ đó ta có thể áp dụng được các phương pháp ước lượng thống kê, kiểm định giả thuyết thống kê trong xử lý dữ liệu để suy rộng kết quả trên mẫu cho tổng thể chung