Bài giảng và sự tận tâm của Thầy đã giúp chúng tôi hiểu sâu hơn về các khái niệm quan trọng trong lĩnh vực thống kê và phương pháp chọn mẫu.Chúng em rất biết ơn sự tạo điều kiện và không
Trang 1ĐẠI HỌC UEH TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ
DỰ ÁN THI CUỐI KÌ MÔN PHƯƠNG PHÁP CHỌN MẪU
Trang 2BẢNG ĐÁNH GIÁ TỶ LỆ THAM GIA ĐÓNG GÓP DỰ ÁN CUỐI KÌ
Nguyễn Đình Văn(CT) 31211024607 Tỉ lệ đóng góp 100%
Trang 3Lời cảm ơn
Chúng em xin gửi lời cảm ơn chân thành đến quý Thầy về sự hướng dẫn và sự
hỗ trợ quý báu trong suốt quá trình thực hiện đề tài môn Phương Pháp Chọn Mẫu Bài giảng và sự tận tâm của Thầy đã giúp chúng tôi hiểu sâu hơn về các khái niệm quan trọng trong lĩnh vực thống kê và phương pháp chọn mẫu
Chúng em rất biết ơn sự tạo điều kiện và không gian để thảo luận, học hỏi và phát triển trong môn học này Thầy Sơn đã giúp chúng tôi hiểu rõ hơn về tầm quan trọng của phân tích mẫu và đưa ra quyết định dựa trên dữ liệu thống kê
Cuối cùng, chúng em muốn bày tỏ lòng biết ơn và sự tôn trọng đối với Thầy Sơn với hy vọng rằng chúng em sẽ tiếp tục áp dụng những kiến thức quý báu mà Thầy
đã truyền đạt trong cuộc sống và sự nghiệp tương lai
Xin chân thành cảm ơn!
Trang 4Mục lục
Phần I: Biến quan sát và bối cảnh đề tài 5
I Giới thiệu 5
1 Giới thiệu dự án 5
2 Giới thiệu đề tài 6
II Tổng thể 6
1 Phân tích mô tả tổng thể nghiên cứu 6
Phần II: Các phương pháp chọn mẫu 7
I Chọn mẫu ngẫu nhiên đơn giản 7
1 Định nghĩa 7
2 Kết quả từ phần mềm SPSS 7
3 Ước lượng trung bình và phạm vi sai số 7
II Chọn mẫu ngẫu nhiên phân tầng 10
1 Định nghĩa 10
2 Kết quả từ phần mềm SPSS 11
3 Ước lượng trung bình và phạm vi sai số 12
III Lấy mẫu từng cụm 15
1 Định nghĩa 15
2 Kết quả từ phần mềm SPSS 15
3 Ước lượng trung bình và phạm vi sai số 16
IV Tổng kết 20
V Kết luận 21
1 So sánh ước lượng trung bình các phương pháp chọn mẫu so với tổng thể … 21
2 So sánh phạm vi sai số giữa các phương pháp chọn mẫu 21
3 Đề xuất phương pháp 21
4 Ưu điểm và hạn chế của dự án 22
Trang 5Phần I: Biến quan sát và bối cảnh đề tài
I Giới thiệu
1 Giới thiệu dự án
Thống Kê là một trong những môn cơ bản và quan trọng trong lĩnh vực khoa học
và kỹ thuật, nhằm cung cấp cho học sinh, sinh viên và các nhà nghiên cứu những kiếnthức và kỹ năng cơ bản về việc thu thập, phân tích, và hiểu các dữ liệu số học Thống
kê đóng vai trò quan trọng trong nhiều lĩnh vực, bao gồm khoa học xã hội, kinh tế, yhọc, và nhiều lĩnh vực khác Thống Kê giúp học sinh hiểu cách thu thập dữ liệu, biểu
đồ hóa, và phân tích chúng để tạo ra thông tin hữu ích và có ý nghĩa, cung cấp công cụ
để đưa ra dự đoán và quyết định dựa trên thông tin số học, giúp các cá nhân và tổ chứcđưa ra quyết định hiệu quả, giúp kiểm tra các giả thuyết, xác định sự khác biệt, vàđánh giá tính đáng tin cậy của kết quả
Thống kê sẽ bao gồm thống kê mô tả và thống kê suy diễn Thống kê mô tả sinhviên học cách tạo biểu đồ và mô tả dữ liệu bằng cách sử dụng các độ đo như trungbình, phương sai, và phân vị Thống kê suy diễn giúp sinh viên nắm vững các phươngpháp như kiểm định giả thuyết, tạo khoảng tin cậy, và kiểm tra ước tính tham số thống
kê Trong đó thống kê suy diễn là một lĩnh vực quan trọng trong thống kê, tập trungvào việc đưa ra kết luận hoặc suy luận về tổng thể dựa trên một mẫu con (sample) từtổng thể đó Thống kê suy diễn giúp chúng ta rút ra các thông tin và dự đoán có ýnghĩa từ dữ liệu mẫu một cách khoa học và đáng tin cậy
Từ đó, dự này nghiên cứu này sử dụng thực hiện Thống kê suy diễn với ba phươngpháp chọn mẫu thích hợp Dự án Phương Pháp Chọn Mẫu với 45839 Mẫu Tổng Thể làmột nghiên cứu hoặc dự án thống kê nhằm mục tiêu tạo ra một phương pháp hiệu quả
để lựa chọn mẫu từ một tổng thể lớn gồm 45839 cá thể hoặc thành phần Mục tiêu của
dự án này là tạo ra một mẫu con đại diện cho tổng thể mà có thể giúp nghiên cứu, kiểmtra, hoặc đưa ra dự đoán về tổng thể một cách chính xác và đáng tin cậy, được thựchiện vì nhu cầu trong nghiên cứu và phân tích dữ liệu thường yêu cầu việc lựa chọnmẫu từ tổng thể lớn Sự hiệu quả của phương pháp chọn mẫu ảnh hưởng đến tính đángtin cậy và độ chính xác của kết quả nghiên cứu Đồng thời, dự án này cũng có thể giúpgiảm bớt khối lượng công việc và tài nguyên cần thiết để thu thập dữ liệu từ toàn bộ
Trang 6tổng thể, đề xuất một kích thước mẫu thích hợp dựa trên các yếu tố thống kê và khoahọc và so sánh kết quả với tổng thể thực tế Điều này giúp đánh giá hiệu suất củaphương pháp và kiểm tra tính chính xác của mẫu con lựa chọn rồi đề xuất phươngpháp phù hợp với tổng thể nhất.
2 Giới thiệu đề tài
Mức thu nhập và chi tiêu của các hộ dân là một đề tài nghiên cứu quan trọng trongnhiều lĩnh vực như kinh tế, khoa học xã hội, chính trị, và quản lý Đề tài này là mộtnguồn tài liệu quý báu cho nghiên cứu về xã hội học, nhân khẩu học, và khoa học xãhội Nó giúp hiểu rõ về mối quan hệ giữa thu nhập và các yếu tố như giới tính, tuổi tác,giáo dục, và địa lý, tập trung vào việc thu thập, phân tích, và hiểu rõ các thông tin liênquan đến thu nhập và cách hộ dân sử dụng nguồn tài chính của họ Tính quan trọngcủa đề tài này không chỉ nằm ở việc cung cấp thông tin về tình hình kinh tế của cánhân và gia đình, mà còn có những tác động sâu rộng đến nhiều khía cạnh của cuộcsống và quản lý tài chính
Việc nghiên cứu mức thu nhập và chi tiêu cung cấp dữ liệu hữu ích để theo dõi sự pháttriển kinh tế và xã hội của một quốc gia Thông qua việc so sánh dữ liệu theo thời gian,chúng ta có thể đánh giá hiệu suất kinh tế và xác định các xu hướng xã hội quan trọng.Thông qua việc đánh giá mức sống này, nghiên cứu có thể đưa ra khuyến nghị vàchính sách cải thiện chất lượng cuộc sống của người dân
Trang 7Phần II: Các phương pháp chọn mẫu
I Chọn mẫu ngẫu nhiên đơn giản
Trong bài dự án này, nhóm nghiên cứu chọn ra 450 mẫu ngẫu nhiên từ tổng thể
45839 của toàn bộ bao gồm tỉnh, huyện, xã, địa bàn và hộ số thuộc 63 tỉnh thành trên
Trang 8Ước lượng tỷ lệ
Giả sử chúng ta quan tâm đến các hộ có thu nhập dưới 150 triệu
Với n=450 chúng ta có 215 hộ có thu nhập dưới 150 triệu
Trang 9B = 2√V^(^P TN) = 0.049Với khoảng tin cậy 95% tỷ lệ các hộ có thu nhập dưới 150 triệu nằm trongkhoảng: (0.428; 0.527).
Cỡ mẫu cho ước lượng
Vì chưa biết tổng thể, nên chúng ta sẽ sử dụng s để ước lượng cho , chọnphạm vi sai số B= 50.000
Trang 10Ước lượng tỷ lệ
Giả sử chúng ta quan tâm đến số hộ có chi tiêu dưới 100 triệu
Với n=450 chúng ta có 325 hộ có thu nhập dưới 100 triệu
Cỡ mẫu cho ước lượng
Vì chưa biết tổng thể, nên chúng ta sẽ sử dụng s để ước lượng cho , chọnphạm vi sai số B= 40.000
Trang 11Vì có sự khác nhau về tốc độ phát triển kinh tế, cơ sở hạ tầng, dịch vụ và tiện
ích, giáo dục và y tế, … giữa thành thị và nông thôn, nên trong dự án này nhóm sẽ tiến
hành chia 450 dữ liệu thành hai tầng khác nhau: thành thị và nông thôn
Trang 123 Ước lượng trung bình và phạm vi sai số
Giả sử không có đủ kinh phí dể thực hiện phỏng vấn với 450 hộ, nên nhóm sẽ
lấy cỡ mẫu nhỏ để phỏng vấn và nghiên cứu với n1 = 35 (thành thị) và n2 = 45 (nông
Trang 13Với khoảng tin cậy 95% thu nhập trung bình của tất cả các hộ nằm trongkhoảng: (870872.739; 562044.739).
Ước lượng tỷ lệ cho biến thu nhập:
Giả sử chúng ta quan tấm đến mức thu nhập của các hộ gia đình thấp hơn 300 triệu
Khu vực Số hộ có thu nhập nhỏ hơn 300 triệu p i
Cỡ mẫu cho ước lượng:
Vì chưa biết tổng thể, nên ta sẽ sử dụng s để ước lượng cho 𝝈, với a1 = 0.54 vàa2 = 0.46, B = 50000
Trang 14Ước lượng tỷ lệ cho biến chi tiêu
Giả sử nhóm muốn nghiên cứu đến mức chi tiêu của các hộ gia đình dưới 40triệu
Khu vực Số hộ có chi tiêu dưới 40 triệu p i
Trang 15B = 2√V^(^P ct) =0.104Với khoảng tin cậy 95% tỷ lệ các hộ có chi tiêu dưới 40 triệu nằm trongkhoảng: (0.39; 0.598)
Cỡ mẫu cho ước lượng:
Vì chưa biết tổng thể, nên ta sẽ sử dụng s để ước lượng cho 𝝈, với a1 = 0.54 vàa2 = 0.46, B=50.000
Khi danh sách đầy đủ các phần tử trong tổng thể nghiên cứu hoặc là không
có sẵn hoặc rất tốn kém để có được nhưng lại dễ dàng để có một danhsách cụm
Các chi phí cho các quan sát sẽ tăng lên khi khoảng cách giữa các phần tửgia tăng
Nhóm chọn vùng Đông Nam Bộ để nghiên cứu phương pháp này Vì nhómthấy được rằng Đông Nam Bộ khu vực trọng điểm kinh tế và đầy đủ các đặc điểm cácloại dân cư, nên mẫu sẽ cho kết quả phù hợp dùng để ước lượng Mẫu phân bố đều sốlượng hộ gia đình giữa các tỉnh và đồng đều giữa khu vực thành thị và nông thôn, từ
đó có cái nhìn bao quát nhất về tổng khu vực Đông Nam Bộ
Trang 16Giả sử mỗi xã ở Đông Nam Bộ được tính là 1 cụm Vậy từ tổng thể Đông Nam
Bộ có 374 xã tương đương 374 cụm được đánh số trình tự từng tỉnh
2 Kết quả từ phần mềm SPSS
3 Ước lượng trung bình và phạm vi sai số
Giả sử không đủ chi phí cho cuộc nghiên cứu nên nhóm quyết định phỏng vấn
mỗi tỉnh 2 xã để nghiên cứu phương pháp này Vậy sẽ có 12 cụm được lấy từ tổng thể
Trang 17Ước lượng phương sai
Ước lượng tỷ lệ biến thu nhập
Trang 18Với khoảng tin cậy 95% tỷ lệ các hộ có thu nhập dưới 200 triệu nằm trongkhoảng: (0.272; 0.58)
Cỡ mẫu cho ước lượng
Để ước lượng trung bình tổng thể ta cho phạm vi sai số B = 50000
Trang 19Ước lượng tỷ lệ biến chi tiêu
Trang 20Với khoảng tin cậy 95% tỷ lệ các hộ có chi tiêu dưới 100 triệu nằm trongkhoảng: (0.589; 0.811).
Cỡ mẫu cho ước lượng
Để ước lượng trung bình tổng thể ta cho phạm vi sai số B = 50000
quả ước lượng cho Thu nhập
Mẫu ngẫu nhiên Mẫu phân tầng Mẫu cụm
quả ước lượng cho Chi tiêu
Mẫu ngẫu nhiên Mẫu phân tầng Mẫu cụm
Trang 21Mẫu phân tầng Mẫu cụm Tổng thể
Ước lượng trung
Mẫu phân tầng Mẫu cụm Phạm vi sai số
Sau khi tính toán và so sánh, chúng em quyết định đề xuất phương pháp
CHỌN MẪU NGẪU NHIÊN ĐƠN GIẢN, đây là phương pháp tối ưu và chính
xác nhất để đo lường thu nhập và chi tiêu
4 Ưu điểm và hạn chế của dự án
Trang 22Trong bài nghiên cứu này nhóm chúng em có được một lợi thế rằng đãgiảng viên được cung cấp tổng thể với quy mô 45839 quan sát Nếu nhóm tự thựchiện lấy mẫu với quy mô lớn như thế này thì có thể sẽ tốn tận vài tháng, thậm chívài năm, và kinh phí để lấy mẫu cũng rất cao
Ưu điểm thứ hai là nhóm chúng em được sử dụng giáo án của giảng viên
mà trong đó đã có đầy đủ và chi tiết những kiến thức trang bị cần thiết nên nhóm ít
đỡ tốn thời gian phải dùng những tài liệu khác
Hạn chế duy nhất là lần đầu tiên nhóm thực hiện dự án với môn học nàynên sẽ không ít lỗi, cụ thể đó là việc trình bày sao cho ngắn gọn và dễ hiểu nhất để
có thể cho người xem tiếp thu và đánh giá khách quan nhất