1. Trang chủ
  2. » Luận Văn - Báo Cáo

bài tiểu luận môn học cuối khóa phương pháp chọn mẫu

25 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài tiểu luận môn học cuối khóa
Tác giả Hoàng Đức Hòa, Đỗ Anh Quân, Phạm Thu Thủy
Người hướng dẫn PTS. Hà Văn Sơn
Trường học ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
Chuyên ngành Phương pháp chọn mẫu
Thể loại Bài tiểu luận
Năm xuất bản 2023
Thành phố TP Hồ Chí Minh
Định dạng
Số trang 25
Dung lượng 1,49 MB

Nội dung

Đối với hộ gia đình, nó thu thập dữ liệu liên quan đến đặc điểm nhân khẩu học của các thành viên trong hộ gia đình, trình độ học vấn, trình độ chuyên môn / kỹ thuật của từng thành viên,

Trang 1

ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH

TRƯỜNG KINH DOANH KHOA TOÁN – THỐNG KÊ

Bài tiểu luận môn học cuối khóa Học phần : Phương pháp chọn mẫu

TP Hồ Chí Minh, ngày 18 tháng 10 năm 2023

Trang 2

STT Họ và tên Mã số sinh viên Mức độ hoàn thành

Lời cảm ơn

Trước khi bước vào bài nghiên cứu, nhóm 7 chúng em muốn được gửi lời cảm ơn tới thầy

Hà Văn Sơn vì trong học phần vừa qua, đã dạy cho chúng em những bài học khá là chi tiết trong học phần Phương pháp chọn mẫu này Là những sinh viên của ngành thống kê, chúng em có một cảm xúc cực kì to bự đối với chuyên ngành mà chúng em đang theo học vì có nhiều bộ môn giúpchúng em phát triển khả năng tính toán, sự nhạy bén đối với dữ liệu số và đặc biệt khả năng đối phó với tình huống không chắc chằn – ra quyết định dựa trên những thông tin trong đời sống thường ngày ạ Bên cạnh đó thì trong quá trình học những môn sâu về chuyên ngành thống kê, chúng em luôn phải tìm tòi, lọc dữ liệu, lựa chọn cách phân tích mẫu phù hợp, cũng như mục đích phân tích mẫu, những giá trị cần ước lượng,… vô vàn khó khăn và vấn đề chúng em phải giải quyết Và thông qua bộ môn Phương Pháp Chọn Mẫu của Khoa Toán - Thống kê được dạy bởi thầy Sơn, tuy không giải quyết được hết tất cả các vấn đề có thể phải đối mặt trong thống kê nhưng một phần nào đó đã giúp chúng em giải quyết những vấn đề trên Cám ơn thầy Hà Văn Sơn, giảng viên hướng dẫn chúng em rất tâm huyết với bộ môn Phương Pháp Chọn Mẫu này, luôn có phương pháp giảng dạy công tâm và thầy đã dày công soạn giáo án rất chi tiết và bài bản

để chúng em nắm rõ bài học một cách tốt nhất, thầy luôn nhắc nhở lớp học tập và phải hoàn thành dự án một cách tốt nhất Trong quá trình thực hiện dự án thì nhóm 7 chúng em đã gặp nhiều sợ cố, cả về mặt dữ liệu, cả về mặt quy trình chọn mẫu khi mà không thống nhất, mỗi người mỗi phương pháp khác mẫu dẫn tới việc tụi em không thể hoàn thành cũng như nộp dự án cuối kì một cách đúng hạn Do vậy, nhóm 7 xin lỗi thầy vì chậm trễ trong việc nộp dự án mong thầy sẽ bỏ qua và sẽ luôn tận tình trong sự nghiệp giảng dạy những sinh viên ngành thống kê sau này của thầy ạ

Nhóm 7 chúng em cảm ơn thầy rất nhiều Chúc thầy có một ngày tốt lành và một ngày nhà giáo sắp tới vui vẻ ạ

Trang 3

Mục lục

Phần A: Bối cảnh, tổng thể và khung chọn mẫu 1

Phần A1: Bối cảnh và biến sử dụng 1

1 Bối cảnh: 1

2 Biến sử dụng: 1

Phần A2: Tổng thể và khung chọn mẫu 1

1 Tổng thể: 1

2 Khung chọn mẫu tổng thể: 2

Phần B: Quy trình thực hiện các phương pháp chọn mẫu ngẫu nhiên: 2

Phần B1: Chọn mẫu ngẫu nhiên đơn giản 2

1 Chọn đơn vị mẫu: 2

2 Những thông số của các biến nghiên cứu: 3

Phần B2: chọn mẫu ngẫu nhiên theo cụm 7

1 Tạo danh sách mẫu theo cụm 7

2 Tính toán 8

Phần B3: chọn mẫu ngẫu nhiên phân tầng: 15

1/Tạo danh sách mẫu ngẫu nhiên phân tầng 15

2/ Thực hiện phân tầng tỷ lệ 16

3/Lấy mẫu ngẫu nhiên phân tầng và tính toán các ước lượng 17

Phần C: Tổng kết: 21

Phần C1: Bảng tóm tắt các thiết kế chọn mẫu (thu nhập theo năm và chi tiêu theo tháng) 21

Phần C2: Kết luận: 22

Phần C3: Hạn chế của bài nghiên cứu: 22

Tài liệu tham khảo: 23

Trang 4

Phần A: Bối cảnh, tổng thể và khung chọn mẫu

Phần A1: Bối cảnh và biến sử dụng

1 Bối cảnh:

- Thực hiện chính sách Đổi mới của Đảng và Nhà nước, Tổng cục Thống kê đã tiến hành nhiều đợt điều tra mức sống hộ gia đình nhằm thu thập thông tin về mức sống của các tầng lớp xã hội phục vụ hoạch định chính sách và phát triển kinh tế - xã hội Từ năm 2002 đến năm 2010, VHLSS - Vietnam Household Living StandardSurvey đã được thực hiện (hai năm một lần) để theo dõi một cách có hệ thống mức sống của các xã hội Việt Nam VHLSS năm 2002 bao gồm tất cả các nội dung chính phản ánh mức sống của người dân và điều kiện kinh tế - xã hội cơ bản của các xã / phường có thể ảnh hưởng đến mức sống của người dân địa phương Để phục vụ nhu cầu của người sử dụng thông tin thống kê về mức sống dân cư Việt Nam năm 2018, Tổng cục Thống kê biên soạn số liệu chi tiết và phát hành ấn phẩm “Kết quả Khảo sát mức sống dân cư Việt Nam năm 2018” Đối với hộ gia đình, nó thu thập dữ liệu liên quan đến đặc điểm nhân khẩu học của các thành viên trong hộ gia đình, trình độ học vấn, trình độ chuyên môn / kỹ thuật của từng thành viên, thu nhập, chi tiêu, sử dụng các loại cơ sở y tế, việc làm, nhà ở và tiện nghi như sở hữu, cá nhân hiệu quả, tiện ích (cung cấp điện và nước), vệ sinh và tham gia vào chương trình xóa đói giảm nghèo

- Ở đây nhóm 7 chọn tổng thể của dự án giới hạn trong tỉnh Bình Dương

- Bình Dương là một tỉnh thuộc vùng Đông Nam Bộ, Việt Nam Tỉnh lỵ của Bình Dương là thành phố Thủ Dầu Một, cách trung tâm của Thành phố Hồ Chí Minh 30 km theo đường Quốc lộ 13 Đây là tỉnh

có dân số đông thứ 6 trong tổng số 63 tỉnh thành và cũng là tỉnh có tỷ lệ gia tăng dân số cơ học rất cao

do có nhiều người nhập cư, hơn 50% dân số của tỉnh Bình Dương là dân nhập cư Năm 2020 là đơn vị hành chính đông thứ sáu về dân số và là tỉnh có dân số đông thứ tư cả nước, xếp thứ ba về Tổng sản phẩm trên địa bàn (GRDP), xếp thứ ba về GRDP bình quân đầu người, đứng thứ 8 về tốc độ tăng

trưởng GRDP Với 2.465.000 người dân, GRDP đạt 389.500 tỉ Đồng (tương ứng với 16,81 tỉ USD), GRDP bình quân đầu người đạt 158,1 triệu đồng (tương ứng với 6907 USD, cao nhất Việt Nam), tốc

1

Trang 5

độ tăng trưởng GRDP dự kiến đạt 9,5% Bình Dương là vùng đất chiến trường năm xưa với những địa danh đã đi vào lịch sử như Phú Lợi, Bàu Bàng, Bến Súc, Lai Khê, Nhà Đỏ và đặc biệt là chiến khu Đ với trung tâm là huyện Tân Uyên (nay là huyện Bắc Tân Uyên và thành phố Tân Uyên), vùng Tam giácsắt trong đó có ba làng An Ngoài ra còn có khu du lịch Đại Nam là khu du lịch lớn nhất Đông Nam Á.

2 Khung chọn mẫu tổng thể:

- Quy mô của tổng thể nghiên cứu mục tiêu: 885 mẫu

- Để mà có một khung chọn mẫu phù hợp đối với bài nghiên cứu, thì nhóm 7 lấy dữ liệu từ file sav

‘Muc 4A tong’ và file sav ‘Muc 5A2_Chi tieu dung an uong TX’ ; chọn If condition is satisfied, bấm any(tinh,70,72,74) chọn Continue, trong khung lệnh Output chọn Delete unselected cases Sau đó, nhóm 7 lưu lại khung chọn mẫu của nhóm và đặt tên thành Nhom7_KhungThuNhap và

Trang 6

mẫu với xác suất mẫu được lấy giống nhau, không cần thiết phải thực hiện phân cụm hay phân tầng thêm sau qui trinh lấy mẫu)

2 Những thông số của các biến nghiên cứu:

2.1 Các thông số thống kê mô tả của tổng thể:

Descriptive Statistics

Minimum

Maximu

Std

Deviation VarianceStatistic Statistic Statistic Statistic Statistic Statistic

3389,046

Trang 7

Statistic Statistic Statistic Statistic Statistic Std Error Statistic Statistic

Valid N

(listwise)

885

- Theo như kì vọng thì sẽ có một số hộ gia đình có nguồn thu nhập từ nhiều nguồn khác nhau chứ

không nhất thiết là tiền lương, tiền công từ công việc Chính vì vậy việc biến thu nhập có giá trị nhỏ nhất

là 0 là một điều chấp nhận Đồng thời, ta cũng có thể thấy được ở bảng về thống kê mô tả của biến chi tiêu, giá trị trong tập dữ liệu dao động rất lớn khi mà điểm chi tiêu nhỏ nhất là 568 (nghìn đồng) và điểm chi tiêu lớn nhất lại lên tới 109271 (đồng); ta có thể rút ra được nhận xét rằng số hộ gia đình ở Bình

Dương không quá đông người (chỉ từ 1-2 người) trong khi cũng có những hộ cực kì đông người (5-9

người) Từ đó, phần nào đó lí giải cho việc chi tiêu của những hộ gia đình trong tập dữ liệu dao động cực

kì lớn Và không thể tồn tại giá trị 0 trong biến chi tiêu được vì chi tiêu những yếu tố như thực phẩm, thứcuống, quần áo để sống là một điều cần thiết

2.2 Các giá trị uớc lượng của biến thu nhập và biến chi tiêu:

- Với những hộ có ghi nhận tiền lương, và chi tiêu thì ước tính cho thu nhập, chi tiêu trung bình là cần thiết

Cỡ mẫu Mean Max Min Median Phương sai Độ lệch chuẩnThu nhập

1/ Ước lượng trung bình thu nhập của số hộ gia đình mẫu:

- Ước lượng phương sai của :

- Xác định cỡ mẫu xấp xỉ yêu cầu để ước lượng với phạm vi sai số ước lượng B cho trước:

Nhóm lựa chọn sai số ước lượng B = 5000 (đồng) và từ đó ta có được cỡ mẫu cần tìm là:

4

Trang 8

Với

2/ Ước lượng tỷ lệ hộ gia đình không có thu nhập:

- Ước lượng tỷ lệ các hộ không có tiền lương, công từ mẫu của phần lấy mẫu ngẫu nhiên đơn giản:

Ta đặt = 0 nếu quan sát thứ i lấy mẫu không có đặc tính quan tâm và =1 đối với những hộ gia đìnhkhông có thu nhập tiền lương, công, hưu và trợ cấp cao

= (với ở đây là số hộ không có thu nhập trong mẫu ngẫu nhiên đơn)

- Ước lượng phương sai của

- Phạm vi sai số của ước lượng tỷ lệ:

3/ So sánh giữa thu nhập của mẫu so với tổng thể:

Cỡ mẫu Trung bình Min Max Trung vị Phương sai Độ lệch chuẩnThu nhập mẫu 450 111750 6720 607700 111750 11188461635 105775,5247Thu nhập tổng

5

Trang 9

đều có giá trị gần bằng hoặc xấp xỉ so với những thông số của tổng thể, vì vậy có thể nói mẫu thu nhậpthu được từ việc chọn mẫu ngẫu nhiên đơn giản này có khả năng đại diện tốt cho thu nhập của tổng thểtỉnh Bình Dương.

Biến chi tiêu: (vì giá trị chi tiêu ở đây không có hộ nào trong tổng thể là không có chi tiêu nên không cần thiết phải ước lượng tỷ lệ hộ không có chi tiêu)

4/ Ước lượng trung bình chi tiêu của số hộ gia đình mẫu:

- Ước lượng phương sai của :

- Xác định cỡ mẫu xấp xỉ yêu cầu để ước lượng với phạm vi sai số ước lượng B cho trước:

Nhóm lựa chọn sai số ước lượng B = 500 (nghìn đồng) và từ đó ta có được cỡ mẫu cần tìm là: Với

5/ So sánh chi tiêu của mẫu so với tổng thể:

Cỡ mẫu Trung bình Min Max Trung vị Phương sai Độ lệch chuẩnChi tiêu mẫu 450 7409,891111 568 109271 6425,5 43968877,1

6

Trang 10

Phần B2: chọn mẫu ngẫu nhiên theo cụm

1 Tạo danh sách mẫu theo cụm

1.1 Đề xuất và xác định

- Từ biến thu nhập (m4atn - thu nhập từ tiền lương, công, hưu và trợ cấp của mỗi hộ), nhóm phát triển thành biến m4atn là tổng thu nhập từ tiền lương, công, hưu và trợ cấp của mỗi phường/xã/thị trấn.Biến chi tiêu (tongchitieudungvamuadoi- tổng chi tiêu cho ăn uống tiêu dùng thông qua mua hoặc đổi được của mỗi hộ) cũng được biến đổi để trở thành biến tongchitieudungvamuadoi_sum là tổng chi tiêu trung bình trong 30 ngày thông qua mua hoặc đổi được của mỗi phường/xã/thị trấn Hai biến được quan tâm là m4atn và tongchitieudungvamuadoi_sum Nhóm phân cụm các nhóm theo phường/xã/thị trấn, phường/xã/thị trấnlà một cụm Sau khi phân cụm, tổng thể có tổng cộng 91 phường/xã/thị trấn (cụm) Để thực hiện lấy mẫu cụm, nhóm đánh số các cụm từ 1-91 Chọn ngẫu nhiên 30 phường/xã/thị trấn từ 91 phường/xã/thị trấn

1.2 Ký hiệu

- Các ký hiệu được sử dụng bao gồm:

+ N: số cụm (phường/xã/thị trấn) trong tỉnh Bình Dương

+ n: số lượng cụm (phường/xã/thị trấn) được chọn trong mẫu ngẫu nhiên đơn giản

+ mi: số lượng các hộ trong cụm (phường/xã/thị trấn) i, i=1;2;3 N

+ = : Kích thước (số hộ) trung bình của một cụm (phường/xã/thị trấn) trong mẫu

+ M= = : Số lượng các hộ trong tỉnh Bình Dương

+ = : Kích thước (số hộ) trung bình của một phường/xã/thị trấn trong tỉnh Bình Dương

7

Trang 11

2 Tính toán

2.1 Biến m4atn – tổng thu nhập từ tiền lương, tiền công của mỗi phường/xã

2.1.1 Ước lượng trung bình thu nhập từ tiền lương, tiền công của mỗi hộ

- Với biến m4atn – tổng thu nhập từ tiền lương, tiền công của mỗi phường/ xã/ thị trấn , dùng chức năng filter trong Excel để gom nhóm nhằm tính tổng thu nhập theo 30 phường/ xã/ thị trấn đã rút ngẫu nhiên:

STT

Cụm (theo mã xã/phường/ thị trấn)

Số hộ (mi)

Tổng thu nhập/phường,xã, thị trấn (yi) (m4atn)

Trang 12

Ước lượng trung bình thu nhập từ tiền

lương, tiền công của mỗi hộ:

=

Trang 13

- Vậy với độ tin cậy 95%, khoảng trung bình thu nhập tiền lương, tiền công của mỗi hộ tại tỉnh Bình Dương dao động từ 9.366.000đ đến 197.019.000đ

Xác định cỡ mẫu xấp xỉ yêu cầu để ước lượng với phạm vi sai số ước lượng B cho trước:

Nhóm lựa chọn sai số ước lượng B = 5.000 ( đơn vị: nghìn đồng) Cỡ mẫu cần tìm:

Các hộ không có thu nhập ()

Trang 15

- Do đó, với độ tin cậy là 95%, tỷ lệ các hộ gia đình không thu nhập từ tiền lương công hưu tại khu vực tỉnh Bình Dương dao động từ 0,168

2.2 Biến tổng chi tiêu

2.2.1 Ước lượng trung bình chi tiêu trong 30 ngày qua của của mỗi phường/ xã/ thị trấn tại tỉnh Bình Dương

STT

Cụm (theo mã xã/phường/ thị trấn)

Số hộ (mi)

Tổng chi tiêu /phường,xã, thị trấn(yi)

Trang 17

- Vậy với độ tin cậy 95%, khoảng chi tiêu trung bình của mỗi

hộ tại tỉnh Bình Dương dao động từ 1.406.000đ đến

13.245.000đ

-Xác định cỡ mẫu xấp xỉ yêu cầu để ước lượng với phạm

vi sai số ước lượng B cho trước:

Sai số ước lượng B = 500 (nghìn đồng) Cỡ mẫu cần

tìm tính được là:

D = = 5.911.311

n = = 89,699 90

- Vậy để ước lượng trung bình chi tiêu trong 30 ngày

của hộ gia đình.tại khu vực tỉnh Bình Dương với phạm vi

sai số 500.000đ , cần thu thập ít nhất 90 mẫu

Phần B3: chọn mẫu ngẫu nhiên phân tầng:

1/Tạo danh sách mẫu ngẫu nhiên phân tầng

- Sử dụng khung chọn mẫu ban đầu file Nhom7_Khung Vì tổng thể có 885 quan sát trong khi mẫu cần chọn là 450 quán sát nên nhóm tiến hành chọn phân tầng theo loại huyện lớn và huyện nhỏ, tức cáchuyện lớn gom lại 1 cụm (gồm các mã 718,724,725) và các huyện nhỏ (gồm các mã huyện 719,720,721,722,723,726)

=

Trang 18

Hình :Bảng Frequencies sự góp mặt của các huyện có trong mẫu

2/ Thực hiện phân tầng tỷ lệ

- Tính cỡ mẫu và đưa dữ liệu vào các tầng

- Dựa vào tỷ lệ 9 huyện được phân bổ ở 2 tầng từ xác định cỡ mẫu từng tầng Dựa vào bảng trên ta thấy tỷ lệ các huyện theo mã từ 718 đến 726 có tỷ lệ là 16.9, 5.1,…, 5.1 Từ đây, nhận thấy các huyện lớn gồm 405 hộ (chiếm 45.7 %), các huyện nhỏ gồm 480 hộ (chiếm 54,3%)

Tiến hành tương tự với tầng huyện nhỏ và Save tạm lại

15

Trang 19

Hinh :Ví dụ về chọn mẫu theo tỷ lệ ở tầng huyện lớn và huyện nhỏ

Để có được mẫu khảo sát phân tầng gồm 450 hộ gia đình thuộc 2 tầng huyện lớn và huyện nhỏ, nhóm thực hiện lệnh: Data > Merge Files > Add cases để gộp dòng của 2 file vừa Save tạm Sau đó ghép 2 file ở trên lại với nhau thành 1 file duy nhất Hai biến được lựa chọn trên phần A là ‘tiền lương, tiền công kể cả trị giá hiện vật từ công việc’(m4ATN1) và ‘chi tiêu dùng hàng ăn uống thường xuyên’(m5a2c2b)

+ Dữ liệu dành cho việc ước lượng biến thu nhập được lưu trữ trong file “bienthunhap”

+ Đối với chi tiêu : dữ liệu dành cho việc ước lượng biến chi tiêu được lưu trữ trong file

“bienchitieu”

Lưu ý: Trước khi đưa dữ liệu thu nhập và chi tiêu vào mẫu khảo sát, nhóm đã thực hiện việc loại bỏtrên biến quan tâm các hộ gia đình có thu nhập và chi tiêu bằng 0 bằng cách đưa chúng sang missing

16

Trang 20

qua lệnh Transform > Recode into Same variables Trong mục Old and new Values nhóm nhập 0 vào ô value > chọn System-missing.

3/Lấy mẫu ngẫu nhiên phân tầng và tính toán các ước lượng

- Mẫu phân tầng khi phân bố tỷ lệ:

Biến thu nhập

Huyện lớn Huyện nhỏMẫu Tổng thể Mẫu Tổng thể

Từ đó ta có ước lượng cho tỷ lệ tổng thể như sau:

• Uớc lượng tỷ lệ hộ gia đình có tổng thu nhập ở thành thị:

• Uớc lượng tỷ lệ hộ gia đình có tổng thu nhập ở nông thôn:

• Ước lượng tỷ lệ hộ gia đình có tổng thu nhập ở cả hai khu vực:

• Ước lượng phương sai :

Ước lượng khoảng cho tỷ lệ hộ gia đình có tổng thu nhập ở cả hai khu vực với độ tin cậy 95%:

Trung bình 185497,21 178356,09 133335,70 138317,87Phương sai 9738824588,522 8309878392,117 4850487888,690 6346559100,957

a Ước lượng thu nhập trung bình ở huyện lớn:

• Uớc lượng hộ gia đình có tổng thu nhập trung bình ở huyện lớn :

Ước lượng phương sai :

17

Ngày đăng: 12/08/2024, 13:39

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w