Chẳng hạn như sau khi chia tổng thể ra thành k tổng thể bộ phận, ta chọn ngẫu nhiên trong số k tổng thể bộ phận đó ra m tổng thể rồi tiếp tục thực hiện lấy mẫu ngẫu nhiên trên từng tổ[r]
(1)103
BÀI 5: CƠ SỞ LÝ THUYẾT MẪU Các kiến thức cần có
Mục tiêu
Giới thiệu số khái niệm Thống kê toán học, cụ thể vấn đề liên quan đến cặp phạm trù tổng thể mẫu, đến khái niệm thống kê, thống kê đặc trưng mẫu phân phối xác suất thống kê đặc trưng mẫu, xem xét cụ thể khái niệm số trường hợp đặc biệt thường gặp thực hành.
Thời lượng • tiết
• Khái niệm phương pháp mẫu • Tổng thể nghiên cứu
• Định nghĩa • Mơ tả tổng thể
• Các số đặc trưng tổng thể • Mẫu ngẫu nhiên
• Các phương pháp lấy mẫu
• Định nghĩa mẫu ngẫu nhiên
• Mơ tả mẫu ngẫu nhiên • Thống kê (Statistics) • Định nghĩa
• Các thống kê đặc trưng mẫu • Mẫu ngẫu nhiên hai chiều • Khái niệm
• Phương pháp mơ tả mẫu
• Thống kê đặc trưng mẫu hai chiều
(2)TÌNH HUỐNG KHỞI ĐỘNG BÀI
Tình
Điều tra mức thu nhập cá nhân tháng (triệu đồng) huyện Đông Anh, ta có bảng số liệu mẫu sau:
Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7 số người 10
Cần phải tính thu nhập bình qn đầu người độ chênh lệch thu nhập để xác định mức sống người dân mức độ đồng thu nhập vùng
Câu hỏi
1 Thu nhập bình quân đầu người bao nhiêu?
2. Độ chênh lệch thu nhập bao nhiêu?
(3)105 5.1. Khái niệm phương pháp mẫu
Bài tốn:
Chúng ta cần nghiên cứu tính chất định tính định lượng phần tử tập hợp Khi ta có hai phương pháp thực nghiên cứu • Nghiên cứu tồn phần tử tập hợp
ghi lại đặc tính cần quan tâm Khi thực nghiên cứu toàn ta gặp phải hạn chế sau:
o Phải trả chi phí lớn kinh tế thời gian số lượng phần tử tập tồn q lớn
o Có thể dẫn tới phá huỷ toàn tập hợp cần nghiên cứu Ví dụ nghiên cứu thời gian hoạt động thiết bị điện tử Khi áp dụng phương pháp dẫn tới phá huỷ toàn thiết bị điện tử
o Có tập hợp mà ta khơng thể nghiên cứu tồn Ví dụ lĩnh vực khảo cổ học
Vậy ta thấy đa số trường hợp nghiên cứu toàn tập hợp khơng khả thi • Nghiên cứu phận, từ tập hợp nghiên cứu ta lấy tập nghiên cứu
toàn phần tử tập từ đưa kết luận cho phần tử tập hợp nghiên cứu
Phương pháp nghiên cứu thứ hai gọi phương pháp nghiên cứu mẫu
5.2. Tổng thể nghiên cứu 5.2.1. Định nghĩa
Tổng thể (population) tập hợp phần tử cần nghiên cứu tính chất định tính định lượng, số phần tử tổng thể gọi cỡ tổng thể, ký hiệu N
Ví dụ:
• Thu nhập toàn dân cư nước • Chất lượng sản phẩm nhà máy • Nhu cầu tiêu dùng điện hộ gia đình
Khi nghiên cứu tổng thể phần tử có hai loại tính chất định tính định lượng cần quan tâm, ta có hai loại biến:
• Biến định lượng số đo phần tử;
Ví dụ: Cân nặng, chiều cao, tuổi, thu nhập,…
• Biến định tính tính chất đối tượng nghiên cứu
(4)o Mã hoá biến định lượng: Ta lấy giá trị biến định lượng làm mã biến o Mã hố biến định tính: Ta gán tính chất định tính biến ứng với
số nguyên
Ví dụ:
Đối tượng thu nhập hộ gia đình ta có mức: Nghèo, trung bình, giàu Ta mã hố biến sau:
Nghèo Ỉ -1; Trung bình Ỉ 0; Giàu Ỉ
Vậy nghiên cứu tổng thể ta ln giả sử các phần tử tổng thể có dấu hiệu định lượng
5.2.2. Mơ tả tổng thể
Cho tổng thể với phần tử {x1, x2,… xN}, ta thu gọn cách gộp giá trị giống lại biểu diễn dạng
xi x1 x2.………xk Ni N1 N2 ………… Nk
trong Ni(i = 1, ,k) số lần giá trị xi xuất tổng thể, ta có
N1 + N2 +…+ Nk = N
Đặt i
1
N f
N
= (i = 1,…,k), fi gọi tần suất xi tổng thể ta có bảng tần suất xi x1 x2 …………xk
fi f2 f2………….fk Hiển nhiên ta có: f1+ f2 +… + fk = 1
Bảng tần suất giống bảng phân phối xác suất biến ngẫu nhiên, ta có
thể đồng tổng thể nghiên cứu với biến ngẫu nhiên X với hàm phân
phối F Vậy, thay nghiên cứu tổng thể ta quy nghiên cứu biến ngẫu nhiên X
5.2.3. Các sốđặc trưng tổng thể
• Trung bình tổng thể
Trung bình tổng thể đại lượng ký hiệu mđược xác định bởi:
N N i i i i i i
1
m N x f x
N = =
= ∑ =∑
Ta thấy m xem kỳ vọng biến ngẫu nhiên X
• Phương sai tổng thể
Phương sai tổng thể đại lượng ký hiệu s xác định bởi:
N N
2 2 i i i
i i
1
s (x m) f x (m)
N = =
= ∑ − =∑ −
(5)107 5.3. Mẫu ngẫu nhiên
Trong phần trước ta biết nghiên cứu cặn kẽ phần tử tổng thể, ta phải nghiên cứu hạn chế nhóm nhỏ rút từ tổng thể gọi mẫu từ rút kết luận cho tổng thể, ta mong muốn mẫu đại diện tốt cho tổng thể Nói chung, để có mẫu đại diện tốt cho tổng thể người ta thường phải tiến hành xây dựng mẫu theo quy trình chọn ngẫu nhiên phần tử mẫu Một mẫu gọi mẫu ngẫu nhiên (random sample)
5.3.1. Các phương pháp lấy mẫu
Có nhiều phương pháp chọn mẫu ngẫu nhiên để thoả mãn tính đại diện tốt cho tổng thể phù hợp với mục tiêu nghiên cứu Sau ta nghiên cứu phương pháp chủ yếu
• Cách chọn mẫu ngẫu nhiên đơn giản
o Chọn mẫu ngẫu nhiên có hồn lại: Từ tổng thể ta rút ngẫu nhiên phần tử ghi lại đặc trưng cần quan tâm, sau trả lại phần tử tổng thể làm tương tự lần ta mẫu cỡ n o Chọn mẫu ngẫu nhiên khơng hồn lại: Làm
tương tự trên, khác sau lần rút phần tử ta loại phần tử khỏi tổng thể • Chọn mẫu phân cấp
Ở tổng thể lớn có yêu cầu phải chọn mẫu phân cấp chẳng hạn điều tra phân tích mức sống dân cư nước thường có yêu cầu kết luận cho vùng, miền
o Mẫu phân cấp đơn giản thành lập sau: Chia tổng thể thành k tổng thể phận ta thực cách lấy mẫu ngẫu nhiên đơn giản tổng thể thành phần tổng hợp lại để có mẫu toàn tổng thể
Ta tiến hành lấy mẫu phân cấp theo quy trình phức tạp Chẳng hạn sau chia tổng thể thành k tổng thể phận, ta chọn ngẫu nhiên số k tổng thể phận m tổng thể tiếp tục thực lấy mẫu ngẫu nhiên tổng thể chọn để tổng hợp thành mẫu toàn tổng thể
5.3.2. Định nghĩa mẫu ngẫu nhiên
Một mẫu ngẫu nhiên cỡ ncủa biến ngẫu nhiên Xlà bộn biến ngẫu nhiên X1, X2, ….Xn độc lập có phân phối với biến ngẫu nhiên X ,
trong Xk một quan sát về biến ngẫu nhiênX
Ta ký hiệu xk kết quan sát lần thứ k,
(6)Ví dụ 1:
Khi gieo xúc xắc lần ta mẫu ngẫu nhiên (X1, X2, X3, X4, X5) lần lấy mẫu đó, chẳng hạn ta giá trị mẫu (3, 5, 2, 3, 1)
Ví dụ 2:
Nghiên cứu thời gian hoạt động thiết bị điện tử công ty sản xuất, ta lấy ngẫu nhiên n thiết bị, ta mẫu ngẫu nhiên (X1, X2, ….,Xn), theo dõi thời gian hoạt động n thiết bị điện tử ta giá trị mẫu (x1, x2, …,xn)
5.3.3. Mô tả mẫu ngẫu nhiên
Cho biến ngẫu nhiên X mẫu ngẫu nhiên (X1, X2, ….,Xn) với giá trị mẫu (x1, x2, …,xn) Để mô tả mẫu ngẫu nhiên ta có hai cách sau:
• Biểu đồ tần suất
Ta thu gọn cách gộp giá trị giống mẫu biểu diễn dạng bảng sau:
xi x1 x2 … xn ni n1 n2 … nk ni số lần giá trị xi xuất mẫu Ta có:
n1 + n2 +… + nk = n
Ví dụ:
Giá trị mẫu quan sát ( 5; 1; 8; 5; 3; 8; 9; 7; 5; 1; 8; 3), cỡ mẫu n = 12, số liệu thu gọn lại có dạng:
xi ni
Đặt i
i
n f
n
= gọi tần suất xi mẫu, ta có bảng biểu diễn tần suất mẫu
xi x1 x2 … xn ni f1 f2 … fk Ta có:
f1 + f + … + fk = (n1+ n2 +… + nk)/n =
(7)109
• Tổ chức đồ (biểu đồ tần số)
Chia miền giá trị mẫu thành k khoảng (a0; a1] , (a1; a2] , … ,(ak-1; ak] , ký hiệu ni số giá trị mẫu rơi vào khoảng (ai-1; ai], (i=1,2, ,k) Ta biểu diễn mẫu dạng:
Khoảng [a0 - a1] [a1 - a2] … [ak-1 - ak] ni n1 n2 … nk
n1 + n2 +… + nk = n
ni số giá trị mẫu rơi vào khoảng (ai-1; ai] Trong mặt phẳng Oxy, trục Ox biểu diễn khoảng (ai-1; ai], trục Oy biểu diễn giá trị yi =n /(n.h )i i , hi độ dài khoảng (ai-1; ai] , i =1,2, k Ta dựng hình chữ nhật có chiều cao yi độ dài đáy hi Hình tạo hình chữ nhật gọi tổ chức đồ (biểu đồ tần số)
x y
fj Mi
0 x1 x2 x3 xk
Hình 1: Trình bày mẫu biểu đố tần suất
x y
fj