Chọn mẫu ngẫu nhiên đơn giản Chọn mẫu ngẫu nhiên đơn giản simple random sampling: Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự nào đó : lập theo vần của tên, h
Trang 1TRƯỜNG CAO ĐẲNG PHƯƠNG ĐÔNG
KHOA Y DƯỢC
BÀI BÁO CÁO TIỂU LUẬN XÁC SUẤT THỐNG KÊ
Giáo viên bộ môn : Lương Phương Thảo
Thành viên báo cáo: Trương Thị Kiều Tiên
Lớp: DSCD-K2
Chuyên đề: CHỌN MẪU NGẪU NHIÊN ĐƠN GIẢN - MẪU NGẪU NHIÊN
Trang 2CHỌN MẪU NGẪU NHIÊN ĐƠN
GIẢN - MẪU NGẪU NHIÊN
1 Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu ngẫu nhiên đơn giản (simple random sampling):
Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự nào đó : lập theo vần của tên, hoặc theo quy mô, hoặc theo địa chỉ…, sau đó đánh số thứ tự các đơn
vị trong danh sách; rồi rút thăm, quay số, dùng bảng số ngẫu nhiên, hoặc dùng máy tính để chọn ra từng đơn vị trong tổng thể chung vào mẫu
Thường vận dụng khi các đơn vị của tổng thể chung không phân bố quá rộng về mặt địa lý, các đơn vị khá đồng đều nhau về đặc điểm đang nghiên cứu Thường áp dụng trong kiểm tra chất lượng sản phẩm trong các dây chuyền sản xuất hàng loạt
a Nguyên tắc:
Cơ hội lựa chọn/xác suất được lựa chọn của các đơn vị là ngang nhau
b Quy trình:
Xác định tổng thể mẫu
Cần danh sách của tất cả các đơn vị mẫu (khung lấy mẫu)
Số lượng các đơn vị (cỡ mẫu)
Chọn ngẫu nhiên các đơn vị trong khung lấy mẫu
c Ưu điểm và nhược điểm
Ưu điểm: Đơn giản Sai số chọn mẫu dễ dàng đo được.
Trang 3Hạn chế: Cần danh sách đầy đủ tất cả các đơn vị Không phải luôn luôn có được
tính đại diện tốt nhất Các đơn vị có thể bị phân tán và khó tiếp cận
d Ví dụ:
Khảo sát thực trạng hiểu biết về luật giao thông đường bộ trong 1000 học sinh phổng thông trung học
Dánh sách 1000 học sinh tại trường phổ thông trung học
Học sinh được sắp xếp từ 1 đến 1000
Cỡ mẫu là 100 học sinh
Chọn ngẫu nhiên ra 100 học sinh từ học sinh thứ 1 đến thứ 1000
2 Chọn mẫu ngẫu nhiên
a Nguyên tắc:
Mẫu được lựa chọn theo bước nhảy dựa trên tỷ lệ mẫu
b.Ưu điểm và hạn chế:
Ưu điểm: Đơn giản; Dễ dàng đo được sai số.
Hạn chế: Cần danh sách đầy đủ tất cả các đơn vị của tổng thể Theo chu trình.
Phương pháp chọn mẫu ngẫu nhiên trong đối tượng kiểm toán cụ thể:
Chọn mẫu ngẫu nhiên
Là một phương pháp lựa chọn các phần tử vào mẫu mà nguyên tắc của chọn mẫu ngẫu nhiên là mỗi phần tử trong tổng thể đều có cơ hội như nhau để được chọn vào mẫu
Các kỹ thuật thường dùng để sử dụng chọn mẫu bao gồm: Bảng số ngẫu nhiên, chọn mẫu theo chương trình máy tính, và chọn mẫu hệ thống
-Phương pháp chọn mẫu ngẫu nhiên (probability sampling methods):
Chọn mẫu ngẫu nhiên (hay chọn mẫu xác suất) là phương pháp chọn mẫu mà khả năng được chọn vào tổng thể mẫu của tất cả các đơn vị của tổng thể đều như nhau Đây là phương pháp tốt nhất để ta có thể chọn ra một mẫu có khả năng đại biểu cho tổng thể
Vì có thể tính được sai số do chọn mẫu, nhờ đó ta có thể áp dụng được các phương pháp ước lượng thống kê, kiểm định giả thuyết thống kê trong xử lý dữ liệu để suy rộng kết quả trên mẫu cho tổng thể chung
Trang 4Tuy nhiên ta khó áp dụng phương pháp này khi không xác định được danh sách cụ thể của tổng thể chung (ví dụ nghiên cứu trên tổng thể tiềm ẩn); tốn kém nhiều thời gian, chi phí, nhân lực cho việc thu thập dữ liệu khi đối tượng phân tán trên nhiều địa bàn cách xa nhau,
Chọn mẫu dựa trên Bảng số ngẫu nhiên
- Bước 1: Định lượng đối tượng kiểm toán bằng hệ thống con số duy nhất Thông thường đối tượng kiểm toán (các chứng từ, tài sản ) đã được mã hoá (đánh số) trước bằng con số duy nhất Chẳng hạn, có 5.000 các khoản phải thu từkhách hàng và được đánh số từ 0001 đến 5.000 Khi đó bản thân các con số thứ tự trên là các đối tượng chọn mẫu Tuy nhiên, trong một số trường hợp, KTV có thể cần thiết phải đánh số lại cho tổng thể để có được hệ thống các con số duy nhất tương thích với Bảng số ngẫu nhiên
Chẳng hạn, nếu các nghiệp vụ đã được đánh sốtừA-001, B-001 thì KTV có thể dùng các con số để thay thế các ký tự chữ cái và khi đó có thể dãy số mới là 1-001, 2-001, Nói chung, trong trường hợp đánh số lại cho đối tượng kiểm toán thì nên tận dụng các con số đã có một cách tối đa để đơn giản hoá việc đánh số Ví dụ trong một quyển sổ chứa các khoản mục tài sản kiểm toán gồm 90 trang, mỗi trang 30 dòng Để
có số duy nhất có thể kết hợp số thứ tực ủa trang với số thứ tự của dòng trên mỗi trang
để có số thứ tự từ 0101 đến 9030
- Bước 2: Thiết lập mối quan hệ giữa Bảng số ngẫu nhiên với đối tượng kiểm toán đã định lượng
Do đối tượng kiểm toán đã được định lượng bằng con số cụ thể nên vấn đề đặt ra là cần
phải xây dựng được mối quan hệ giữa các số cụ thể đã xác định với các số ngẫu nhiên trong Bảng số ngẫu nhiên Có thể có ba trường hợp xảy ra:
+ Các con số định lượng của đối tượng kiểm toán cũng gồm 5 chữ số như các con số ngẫu nhiên trong Bảng Khi đó tương quan là 1-1 giữa định lượng đối tượng kiểm toán với các số ngẫu nhiên trong Bảng tự nó đã được xác lập
+ Các con số định lượng của đối tượng kiểm toán gồm sốlượng chữ số ít hơn 5 chữ số Chẳng hạn, trong ví dụ nêu bước 1, kiểm toán viên cần chọn ra 110 khoản phải thu trong số 5.000 khoản phải thu từ các khách hàng có đánh số từ 0001 đến 5.000 Các số này là số gồm 4 chữ số Do vậy, KTV có thể xây dựng mối quan hệ với Bảng số ngẫu nhiên trong Bảng Nếu trường hợp số định lượng còn có ít chữsốhơn nữa thì có thể lấy chữ số giữa trong số ngẫu nhiên
+ Các số định lượng của đối tượng kiểm toán có sốcác chữsốlớn hơn 5 Khi đó đòi hỏi
Trang 5KTV phải xác định lấy cột nào trong Bảng làm cột chủ và chọn thêm những hàng số
ở cột phụ của Bảng Chẳng hạn, với số có 7 chữ số ta có thể ghép một cột chính với 2 chữ số của một cột phụ nào đó để được số có 7 chữ số
- Bước 3: Lập hành trình sử dụng Bảng Đây là việc xác định hướng đi của việc chọn các
số ngẫu nhiên Hướng đó có thểdọc (theo cột) hoặc ngang (theo hàng), có thể xuôi (từ trên xuống) hoặc ngược (từ dưới lên) Việc xác định này thuộc quyền phán quyết của KTV xong cần được đặt ra từ trước và thống nhất trong toàn bộ quá trình chọn mẫu Một vấn đềcần đặc biệt quan tâm là lộ trình chọn mẫu phải được ghi chép lại trong hồ
sơ kiểm toán để khi một KTV khác có kiểm tra lại việc chọn mẫu thì họ cũng chọn được mẫu tương tự
- Bước 4: Chọn điểm xuất phát: Bảng số ngẫu nhiên gồm rất nhiều trang Để chọn điểm xuất phát, Bảng số ngẫu nhiên nên được mở ra một cách ngẫu nhiên và ngẫu nhiên chọn ra một số trong Bảng để làm điểm xuất phát
Ví dụ: Với 5.000 khoản phải thu khách hàng đánh số thứ tự từ 0001 đến 5.000 chọn ra
110 khoản để kiểm toán ở đây, bước 1 có thể bỏ qua vì đối tượng kiểm toán đã được
mã hoá trước
Chú ý rằng, đối tượng kiểm toán bao gồm các sốcó 4 chữ số do vậy bước thứ hai ta phải xác định lấy bốn chữ số nào trong 5 chữ số của các số ngẫu nhiên Giả sử lấy 4 chữ số đầu của các số ngẫu nhiên để có được mối quan hệ giữa đối tượng kiểm toán với các số ngẫu nhiên trong Bảng
Bước tiếp theo là xác lộ trình chọn mẫu
Ví dụ này giả định lộ trình chọn là xuôi theo cột Điểm xuất phát trong bước 4 được chọn ngẫu nhiên là dòng 3 cột 1 Theo cách đó KTV sẽ chọn được khoản mục đầu tiên
là 2413 (Xem bảng bốn số đầu của số ngẫu nhiên dòng 3- cột 1), sau đó các khoản mục tiếp tục được lựa chọn bao gồm 4216, 3757 Đến số ngẫu nhiên thứ4, 5, ) cho đến số ngẫu nhiên thứ 8, các số này đều lớn hơn 5.000 (vượt quá phạm vi của đối tượng kiểm toán – các số chọn được phải nằm trong khoảng từ 0001 đến 5.000) do đó
bị loại bỏ và tiếp tục chọn ta được các số tiếp theo 2891, 0942,
Khi sử dụng Bảng số ngẫu nhiên để chọn mẫu, có thể có những phần tử xuất hiện nhiều hơn một lần Nếu KTV không chấp nhận lần xuất hiện thứ hai trở đi thì cách chọn đó được gọi là chọn mẫu không lặp lại (chọn mẫu không thay thế) Ngược lại, chọn mẫu lặp lại (chọn mẫu thay thế) là cách chọn mà một phần tử trong tổng thể có thể được chọn vào mẫu nhiều hơn một lần
Trang 6Chọn mẫu ngẫu nhiên theo chương trình máy tính
Hiện nay phần lớn các hãng kiểm toán đã thuê hoặc tựxây dựng các chương trình chọn mẫu ngẫu nhiên qua máy tính nhằm tiết kiệm thời gian và giảm sai sót trong mẫu Các chương trình chuyên dụng này rất đa dạng, tuy nhiên nói chung vẫn tôn trọng hai bước đầu tiên của chọn mẫu ngẫu nhiên theo Bảng số ngẫu nhiên là lượng hoá đối tượng kiểm toán bằng hệ thống con số duy nhất và xác lập mối quan hệ giữa đối tượng
kiểm toán đã định lượng với các số ngẫu nhiên
Tuy nhiên, số ngẫu nhiên lại do máy tính tạo ra
Chọn mẫu hệ thống:
Là cách chọn để sao cho chọn được các phần tử trong tổng thểcó khoảng cách đều nhau (khoảng cách mẫu) Khoảng cách mẫu này được tính bằng cách lấy tổng số đơn
vị tổng thể chia cho kích cỡ mẫu
Ví dụ: Nếu tổng thểcó kích thước N là 1052 đơn vị và cỡ mẫu cần chọn n là 100 thì khoảng cách mẫu k sẽ được tính như sau:
k = N/n = 1052/100 = 10.52 làm tròn thành 10 - thông thường phải làm tròn xuống đểcó thể chọn đủ mẫu theo yêu cầu
Từ đó, chọn một đơn vịmẫu đầu tiên m1 trong khoảng từ phần tử nhỏ nhất x1 đến phần tử đó cộng với khoảng cách mẫu k (x1 + k)
X1 < m1 < x1 + k (1 < m1 < 1+10)
Sau đó xác định các đơn vịmẫu kế tiếp theo công thức:
M(i) = M(i-1) + k
Giả sử trong ví dụ trên chúng ta chọn ngẫu nhiên được điểm xuất phát m1=5 thì các đơn vị mẫu tiếp theo sẽ là m2=15, m3=25, m4=35 cho đến khi chọn đủ 100 đơn vịmẫu và m100= 995
Đơn vị mẫu đầu tiên được chọn ngẫu nhiên nên mỗi đơn vịtổng thể ban đầu có cơ hội được chọn ngang nhau Tuy nhiên, sau khi đơn vị mẫu đầu tiên được chọn, mỗi đơn vị
về sau lại không có cơ hội như nhau để được chọn vào mẫu
Ưu điểm chủ yếu của chọn mẫu hệ thống là đơn giản, dễ làm và dễ sử dụng Tuy
Trang 7nhiên, KTV cần tránh thiên vị trong lựa chọn Để tăng tính đại diện của mẫu, KTV sắp xếp tổng thể theo một thứ tự ngẫu nhiên Dùng nhiều điểm xuất phát cũng là một cách tốt để hạn chế nhược điểm của cách chọn này
Kinh nghiệm chỉra rằng khi ứng dụng phương pháp chọn mẫu hệ thống thì cần phải sử dụng ít nhất 5 điểm xuất phát Khi sử dụng nhiều điểm xuất phát thì khoảng cách mẫu phải được điều chỉnh bằng cách lấy khoảng cách mẫu hiện tại nhân với số điểm xuất phát ngẫu nhiên cần thiết
Ví dụ nếu ở ví dụ trên khoảng cách mẫu hiện tại là 10 và với điểm xuất phát ngẫu nhiên cần thiết là 5 thì ta có khoảng cách mẫu điều chỉnh là 50 (5 x 10) Năm điểm xuất phát được lựa chọn ngẫu nhiên trong khoảng từ1 đến 51 Sau đó tất cả các khoảng mục cách nhau một khoảng cách k = 50 sẽ được chọn ra kể từ các điểm xuất phát ban đầu
c Ví dụ1:
N= 1200 n= 60
Tỷ lệ lấy mẫu: N/n = 1200/60 = 20
Lấy danh sách của 1200 đơn vị
Lựa chọn ngẫu nhiên bất kỳ một số trong 20 số đầu
Cách 20 người nữa lại chọn người tiếp theo
Người thứ 1: đứng thứ 5
Người thứ 2: đứng thứ 25
Người thứ 3: đứng thứ 45
…
Ví dụ 2 : Dựa vào danh sách bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần của tên chủ hộ, bao gồm 240.000 hộ Ta muốn chọn ra một mẫu có 2000 hộ Vậy khoảng cách chọn là : k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu
- Nếu tỷ lệ chọn mẫu không giống nhau ở mỗi phân tầng
Trang 8- Thỉnh thoảng làm tăng lên độ chính xác những thình thoảng lại giảm độ chính xác
- Cần sử dụng trọng số để đạt được sự ước lượng không bị thiên lệch
Chú ý sự khác biệt giữa phân tầng các biến và các tầng:
- Phân tầng các biến: giới tính, địa vị kinh tế- xã hội, tỉnh, vùng…
- Các tầng: Sự kết hợp giữa nhiều biến
e Ví dụ 3:
- Nam + địa vị kinh tế cao + ở miền Bắc là một tầng
- Nam + địa vị kinh tế cao + ở miền Nam là một tầng
Ví dụ về chọn mẫu các tỉnh để điều tra trong nghiên cứu kỳ gốc của dự án TAMP- GDT với 2 biến:
1 Vùng: Bắc/trung/nam
2 Đóng góp thuế và NSNN: cao/trung bình/thấp -> bao nhiêu phân tầng?
Trang 9Tầng Vùng Mức đóng thuế