Giáo trình Nguyên lý thống kê bao gồm những vấn đề lý luận và phương pháp thống kê cơ bản nhất, được trình bày dễ hiểu, kết hợp với những ví dụ minh họa cụ thể để phù hợp với đối tượng là sinh viên kinh tế ngoài ngành Thống kê. Giáo trình được kết cấu thành 8 chương và chia làm 2 phần, phần 2 trình bày những nội dung về: hồi quy và tương quan; dãy số thời gian; chỉ số; điều tra chọn mẫu;... Mời các bạn cùng tham khảo!
Chương HỒI QUY VÀ TƯƠNG QUAN Theo quan điểm vật biện chứng tượng tồn mối liên hệ phổ biến, đa dạng phong phú, chúng có mối quan hệ mật thiết với nhau, tác động qua lại lẫn Khơng có tượng phát sinh, phát triển cách tách rời lập với tượng khác Vì vậy, việc nghiên cứu mối liên hệ tượng nhiệm vụ quan trọng thống kê Phương pháp hồi quy phương pháp tương quan hai phương pháp thống kê toán sử dụng phân tích mối liên hệ tương quan tượng kinh tế - xã hội Nội dung chương trình bày việc vận dụng phương pháp hồi quy tương quan để phân tích mối liên hệ tiêu thức nguyên nhân ảnh hưởng tới tiêu thức kết Cụ thể trường hợp: Mối liên hệ tương quan tuyến tính (giữa hai tiêu thức, nhiều tiêu thức) mối liên hệ tương quan phi tuyến tính 5.1 Mối liên hệ tượng, nhiệm vụ phương pháp hồi quy tương quan 5.1.1 Mối liên hệ tượng Trong trình tồn phát triển, vật tượng có mối liên hệ với theo quy luật phụ thuộc nhân Vì vậy, để hiểu cách sâu sắc chất, quy luật phát triển tượng địi hỏi thống kê phải phân tích mối liên hệ tác động tương quan chúng Thực tế mối liên hệ tượng kinh tế - xã hội đa dạng phong phú, tính chất hình thức khác Có mối liên hệ hai tượng, nhiều tượng phận cấu thành tượng phức tạp; Mức độ liên hệ phụ thuộc tượng khác Chính vậy, hình thành nhiều loại mối liên hệ tượng kinh tế - xã hội: 121 Mối liên hệ tượng kinh tế - xã hội diễn khơng gian thời gian Liên hệ không gian tác động qua lại, phụ thuộc vào chúng thời gian Liên hệ thời gian tác động qua lại, phụ thuộc vào chúng giai đoạn phát triển khác Do đó, phân tích mối liên hệ tượng phải đặt chúng điều kiện thời gian không gian định Nếu xét theo mức độ liên hệ phụ thuộc tượng, phân biệt liên hệ hàm số liên hệ tương quan Liên hệ hàm số mối liên hệ hoàn toàn chặt chẽ hai tượng nghiên cứu: Có nghĩa tượng thay đổi hồn tồn định đến thay đổi tượng có liên quan theo tỷ lệ tương ứng Liên hệ hàm số viết dạng khái quát Y= f(x) Mối liên hệ thấy khơng tồn tổng thể mà đơn vị cá biệt Các mối liên hệ hàm số thường biểu nghiên cứu tượng tự nhiên toán học, vật lý… gặp tượng kinh tế - xã hội Liên hệ tương quan mối liên hệ khơng hồn tồn chặt chẽ tượng nghiên cứu: Khi tượng thay đổi làm cho tượng có liên quan thay đổi theo, khơng có ảnh hưởng hồn tồn định thay đổi Các mối liên hệ khơng hồn tồn chặt chẽ, khơng biểu rõ đơn vị cá biệt mà phải thông qua quan sát số lớn đơn vị Ví dụ: Mối liên hệ chi phí cho quảng cáo với doanh thu tiêu thụ sản phẩm, mối liên hệ suất lao động với giá thành đơn vị sản phẩm doanh nghiệp… Khi chi phí quảng cáo sản phẩm tăng lên làm cho doanh thu tiêu thụ sản phẩm doanh nghiệp tăng ngược lại, tăng giảm không theo tỷ lệ định không giống đơn vị Đó doanh thu doanh nghiệp tăng hay giảm phụ thuộc vào nhiều nguyên nhân khác khơng phải hồn tồn chi phí quảng cáo định Hay suất lao động tăng lên làm cho giá thành đơn vị sản phẩm giảm xuống ngược lại, suất lao động yếu tố hoàn toàn định tới thay đổi giá thành Như vậy, nói 122 chi phí quảng cáo doanh thu, suất lao động giá thành đơn vị sản phẩm có mối liên hệ tương quan Mối liên hệ tương quan thường gặp nghiên cứu tượng kinh tế - xã hội Nếu xét theo chiều hướng mối liên hệ, phân biệt liên hệ thuận liên hệ nghịch Liên hệ thuận biểu trị số tiêu thức nguyên nhân trị số tiêu thức kết phát triển theo hướng (cùng tăng giảm) Ngược lại, liên hệ nghịch biểu trị số tiêu thức nguyên nhân trị số tiêu thức kết phát triển ngược chiều Ở ví dụ mối liên hệ chi phí cho quảng cáo doanh thu tiêu thụ sản phẩm mối liên hệ thuận, suất lao động giá thành mối liên hệ nghịch 5.1.2 Nhiệm vụ phương pháp hồi quy tương quan Hồi quy tương quan hai phương pháp toán học, vận dụng thống kê để nghiên cứu mối liên hệ tương quan tượng kinh tế - xã hội Hai phương pháp có liên quan chặt chẽ với xuất phát từ mục đích nghiên cứu, nên gọi ngắn gọn phương pháp tương quan Trong phạm vi chương thống kê vận dụng phương pháp hồi quy tương quan để phân tích mối liên hệ khơng hồn tồn chặt chẽ tượng, thể thông qua mối liên hệ tiêu thức Các tiêu thức cần nghiên cứu, chia thành tiêu thức nguyên nhân tiêu thức kết Khi tiêu thức kết biến thiên ảnh hưởng hàng loạt tiêu thức nguyên nhân với mức độ ảnh hưởng khác Song, tùy theo mục đích nghiên cứu, ta lựa chọn tiêu thức nguyên nhân bản, có ý nghĩa để xác định mối liên hệ chúng với giả định tiêu thức khác không thay đổi Những tiêu thức chọn để nghiên cứu có tiêu thức kết cịn lại tiêu thức nguyên nhân Ví dụ, giá thành đơn vị sản phẩm ảnh hưởng nhiều nguyên nhân khác như: Năng suất lao động, giá nguyên, nhiên, vật liệu, tiền lương khoản chi phí khác Trong doanh nghiệp sản xuất ta nhận thấy suất lao động có ảnh hưởng đáng kể tới giá thành đơn vị sản phẩm Do đó, chọn riêng hai tiêu thức suất lao động (tiêu 123 thức nguyên nhân) giá thành (tiêu thức kết quả) để nghiên cứu mối liên hệ chúng, tiêu thức khác giả định không thay đổi Phương pháp hồi quy tương quan nhằm giải hai nhiệm vụ bản: - Xác định mơ hình hồi quy biểu mối liên hệ, nghĩa xét xem mối liên hệ tiêu thức nghiên cứu biểu dạng mơ hình nào: Liên hệ tuyến tính (mơ hình đường thẳng) hay phi tuyến tính (mơ hình đường cong), liên hệ thuận hay liên hệ nghịch Để giải nhiệm vụ cần phải tiến hành bước chủ yếu sau: + Dựa sở phân tích lý luận để giải thích tồn thực tế chất mối liên hệ tượng nghiên cứu + Kết hợp phân tích lý luận với việc thăm dị mối liên hệ phương pháp thống kê như: Phương pháp đồ thị, phương pháp phân tổ, phương pháp số bình quân…, dựa sở kết nghiên cứu có từ trước tượng + Lựa chọn phương trình hồi quy để biểu mối liên hệ Muốn xác định phương trình phải vào số tiêu thức chọn, hình thức chiều hướng mối liên hệ + Tính tốn nêu ý nghĩa tham số phương trình hồi quy - Đánh giá trình độ chặt chẽ mối liên hệ tiêu hệ số tương quan, tỉ số tương quan… Từ kết tính tiêu xác định vai trò ảnh hưởng nguyên nhân, giải thích tồn hay khơng tồn mối liên hệ tương quan kiểm định lại giả thiết phù hợp mơ hình hồi quy chọn Trong phân tích tương quan, số tiêu thức chọn nghiên cứu nhiều q trình tính tốn phức tạp Dưới trình bày cách vận dụng cụ thể phương pháp hồi quy tương quan số trường hợp tiêu biểu 124 5.2 Liên hệ tương quan tuyến tính hai tiêu thức số lượng 5.2.1 Phương trình hồi quy tuyến tính Mối liên hệ tương quan tượng kinh tế - xã hội biểu dạng phương trình tuyến tính phi tuyến tính Song, nhiều trường hợp phân tích thơng thường để đơn giản q trình tính tốn, với sai số cho phép người ta sử dụng dạng phương trình tuyến tính để mô tả cách gần mối liên hệ mà q trình tính tốn lại đơn giản Xét ví dụ mối liên hệ thâm niên công tác tiền lương năm qua tài liệu điều tra khảo sát ngẫu nhiên 10 công nhân doanh nghiệp sau: Bảng 5.1: Thâm niên công tác tiền lương công nhân STT Thâm niên công tác (năm) Tiền lương (Tr.đ) 1 40 55 45 60 60 75 10 72 12 85 14 80 10 15 98 Qua tài liệu ta nhận thấy: Theo xu chung thâm niên công tác tăng lên, tiền lương cơng nhân có xu hướng tăng lên, nghĩa tiêu thức thâm niên cơng tác tiền lương có mối liên hệ với 125 nhau, mối liên hệ khơng hồn tồn chặt chẽ, hay mối liên hệ tương quan quan sát đồ thị (hình vẽ) Đồ thị 5.1: Mối liên hệ thâm niên công tác tiền lương công nhân Đường gấp khúc biểu diễn mối liên hệ thâm niên công tác (x) tiền lương (y) gọi đường hồi quy thực nghiệm, hình thành từ tài liệu điều tra thực tế Đường chưa phản ánh rõ nét mối quan hệ hai tiêu thức có xu hướng lên từ trái qua phải, điều cho phép ta tìm đường thẳng hướng, gần với thay cho đường hồi quy thực nghiệm biểu rõ mối liên hệ Đường thẳng gọi đường hồi quy lý thuyết, đồ thị vị trí đường hồi quy lý thuyết xác định phương trình có dạng: Ŷx = a + bx (5.1) Trong đó: x : Trị số tiêu thức nguyên nhân (thâm niên công tác) Ŷx : Trị số lý thuyết tiêu thức kết (tiền lương) a, b: Các tham số phương trình Phương trình (5.1) gọi phương trình hồi quy tuyến tính, tham số a, b quy định vị trí đường hồi quy lý thuyết Các tham số phải xác định cho đường hồi quy lý thuyết mô tả 126 cách sát mối liên hệ tương quan Thông thường, ta áp dụng phương pháp bình phương nhỏ nghĩa cho tổng bình phương chênh lệch trị số thực tế trị số lý thuyết cực tiểu: ( y yˆ ) x Từ suy hệ phương trình chuẩn: na b. x y (5.2) a. x b. x x y Giải hệ phương trình (5.2) tính a, b biến đổi ta có: b x y x y (5.3) 2x a y b.x Để giải hệ phương trình (5.2) ta lập bảng tính tốn: Bảng 5.2: Các đại lượng tính tham số phương trình Thâm niên công tác Tiền lương (x) (y) x.y x2 y2 40 40 1.600 55 165 3.025 45 180 16 2.025 60 60 360 420 36 49 3.600 3.600 75 600 64 5.625 10 72 720 100 5.184 12 85 1.020 144 7.225 14 15 80 98 1.120 1.470 196 225 6.400 9.604 127 80 670 6.095 840 47.888 Thay số liệu bảng tính tốn vào hệ phương trình (5.2): 10a + 80b = 670 80a + 840b = 6.095 Giải hệ phương trình: a = 37,6 b = 3,675 Tính tốn a, b theo cơng thức (5.3) ta có: x xy x 80 y 670 67 8 ; y n 10 n 10 xy 6095 n 10 b x y x y x 609 ; x2 x x 840 20 10 609,5 67 3,675 20 a y b.x 67 3,675 37,6 Phương trình hồi quy có dạng: x= 37,6 + 3,675x Trong phương trình này: Tham số a = 37,6 điểm xuất phát đường hồi quy lý thuyết, tham số tự không phụ thuộc vào x, nói lên mức độ ảnh hưởng nguyên nhân khác tiền lương công nhân; Tham số b = 3,675 gọi hệ số hồi quy, quy định độ dốc đường hồi quy lý thuyết, nói lên ảnh hưởng tiêu thức nguyên nhân x tới tiêu thức kết y Cụ thể thâm niên cơng tác tăng năm tiền lương cơng nhân tăng trung bình 3,675 triệu đồng 5.2.2 Hệ số tương quan Một yêu cầu quan trọng phân tích hồi quy tương quan xác định cụ thể trình độ chặt chẽ mối liên hệ Hệ số 128 tương quan tiêu tương đối (số lần) để đánh giá trình độ chặt chẽ chiều hướng mối liên hệ tương quan tuyến tính Hệ số tương quan giúp ta xác định cường độ mối liên hệ, xem xét mức độ ảnh hưởng tiêu thức nguyên nhân đến tiêu thức kết Trong điều kiện thời gian không gian khác nhau, mối liên hệ tương quan số tượng có trình độ chặt chẽ khác Qua việc đánh giá tìm ngun nhân chủ yếu tác động đến tượng nghiên cứu Hệ số tương quan giúp ta xác định chiều hướng mối liên hệ (mối liên hệ thuận hay nghịch) Hệ số tương quan cho phép kiểm định giả thuyết tồn hay không tồn mối liên hệ tương quan tuyến tính Hệ số tương quan cịn sử dụng dự báo thống kê tính sai số dự báo Trong tốn học có nhiều phương pháp nhiều cơng thức tính hệ số tương quan Thống kê học vận dụng số công thức đơn giản thích hợp Sau số cơng thức tính hệ số tương quan thường dùng: ( x i x )( y i y) r ( x i x ) ( y i y) (5.4) Từ công thức (5.4) biến đổi số cơng thức tính sau: r x y x y x y (5.5) x y (5.6) r b Có thể tính hệ số tương quan từ ví dụ cơng thức (5.4), (5.5), (5.6) Giả sử theo công thức (5.6): 129 47888 67 299,8 10 20 r 3,675 0,949 299,8 y2 y y Như vậy, hệ số tương quan tính nhiều cơng thức khác nhau, tùy theo nguồn tài liệu cụ thể ta sử dụng cơng thức tính tốn phù hợp Hệ số tương quan có tính chất sau: - Hệ số tương quan nhận giá trị khoảng: -1≤ r ≤ +1 r: Mang dấu (+) mối liên hệ tương quan thuận r: Mang dấu (-) mối liên hệ tương quan nghịch - r = ± 1: Giữa x y có liên hệ hàm số - r = 0: Giữa x, y khơng có liên hệ tương quan tuyến tính - r gần ±1, mối liên hệ chặt chẽ gần mối liên hệ lỏng lẻo Mức độ chặt chẽ hay lỏng lẻo hệ số tương quan xác định sau: Bảng 5.3: Mức độ chặt chẽ (lỏng lẻo) hệ số tương quan |r| Giá trị tuyệt đối hệ số tương quan Mức độ phụ thuộc < 0,3 0,3 - 0,7 > 0,7 Lỏng lẻo Trung bình Chặt chẽ Theo ví dụ r = 0,949, đánh giá: Mối liên hệ thâm niên công tác tiền lương mối liên hệ tương quan thuận tương đối chặt chẽ Chú ý: Ở mục ta nghiên cứu mối liên hệ tương quan thuận thâm niên công tác tiền lương qua tài liệu điều tra 10 công nhân Nhưng thực tế, nghiên cứu mối quan hệ tương quan tiêu thức cần tuân theo quy luật số lớn nghĩa phải thu thập tài liệu số đủ lớn đơn vị Các tài liệu phân tổ kết hợp theo tiêu thức nguyên nhân (x) tiêu thức kết (y) Nếu gọi: 130 Có thể dùng tỷ lệ làm hệ số điều chỉnh lại kết điều tra toàn Như vậy, tồn tỉnh số người bị bỏ sót lên tới: 0,0005 x 1.765.200 = 883 người Vậy, số dân thực tế tỉnh vào thời điểm 1/4/2009 là: 1.765.200 + 883 = 1.766.083 người 8.2.2 Các phương pháp tổ chức chọn mẫu ngẫu nhiên thường dùng thống kê Chọn đơn vị mẫu từ tổng thể chung tiến hành theo nhiều cách khác Hệ thống tổ chức chọn đơn vị mẫu từ tổng thể chung gọi phương pháp tổ chức chọn mẫu Thống kê thường sử dụng phương pháp tổ chức chọn mẫu sau: - Chọn ngẫu nhiên đơn - Chọn máy móc - Chọn phân loại - Chọn khối - Chọn phân tầng Mỗi phương pháp tổ chức chọn mẫu có đặc điểm riêng cách tính sai số chọn mẫu riêng 8.2.2.1 Phương pháp chọn ngẫu nhiên đơn Phương pháp chọn ngẫu nhiên đơn phương pháp tổ chức chọn đơn vị mẫu tổng thể chung cách ngẫu nhiên không qua xếp Người ta chọn đơn vị cách rút thăm, quay số chọn theo bảng số ngẫu nhiên Mỗi đơn vị tổng thể chung chọn lần (không lặp lại) chọn nhiều lần (lặp lại) Khi tính sai số bình qn chọn mẫu dùng cơng thức trình bày phần Phương pháp chọn ngẫu nhiên đơn phương pháp đơn giản cho ta kết tốt tổng thể nghiên cứu tương đối 240 đồng Nếu tổng thể nghiên cứu có kết cấu phức tạp khơng nên dùng phương pháp chọn số đơn vị tổng thể mẫu không phân phối tổng thể chung, tính chất đại biểu tổng thể mẫu khơng cao Mặt khác tổng thể chung có quy mơ lớn việc đặt số hiệu thăm cho tất đơn vị gặp khó khăn Chính nhược điểm mà phương pháp chọn ngẫu nhiên đơn áp dụng để điều tra tượng kinh tế - xã hội 8.2.2.2 Phương pháp chọn máy móc (chọn hệ thống) Phương pháp chọn máy móc phương pháp tổ chức chọn mẫu đơn vị chọn vào khoảng cách định Trước hết, người ta xếp đơn vị tổng thể chung theo thứ tự xếp theo vần A, B, C tên gọi, theo thứ tự địa danh, theo quy mô từ nhỏ đến lớn v.v Sau đó, chọn đơn vị theo thứ tự cách máy móc, tức sau khoảng cách định lại chọn đơn vị Khoảng cách xác định cách lấy số đơn vị tổng thể chung chia cho số đơn vị tổng thể mẫu d= N n Giả sử cần chọn 100 công nhân số 2000 công nhân doanh nghiệp để điều tra suất lao động Có thể xếp 2000 công nhân thành danh sách theo vần tên gọi (A, B, C ) Khoảng cách để chọn người 2000 : 100 = 20 Nghĩa cách 20 người danh sách lại chọn người Người công nhân chọn số 20 người đầu danh sách cách chọn ngẫu nhiên đơn Giả sử 20 người rút thăm người thứ 12, người chọn tiếp sau người thứ 32, 52, 72 Trong thực tế có tượng mà đơn vị xếp sẵn thời gian điều tra không thay đổi vị trí Với tượng lợi dụng bố trí sẵn có để chọn theo khoảng cách tính Ví dụ: Khi điều tra chọn mẫu dân số, theo thứ tự số nhà đường phố mà chọn theo khoảng cách, điều tra suất lúa, sau 241 xác định khoảng cách chọn, tiến hành cắm điểm cánh đồng theo ô vuông Điểm gặt cách điểm gặt khoảng cách tính Chọn máy móc, đơn vị tổng thể chung xếp theo tiêu thức không liên quan trực tiếp đến tiêu thức nghiên cứu có sai số ngẫu nhiên Ngược lại, đơn vị tổng thể chung xếp theo tiêu thức nghiên cứu lại xuất sai số có hệ thống Sai số có hệ thống lớn hay nhỏ phụ thuộc vào việc chọn đơn vị Nếu đơn vị chọn gần khoảng cách đầu sai số hệ thống nhỏ Vì lý trên, người ta thường xếp đơn vị theo tiêu thức khơng có liên quan đến nội dung nghiên cứu Sai số bình qn chọn mẫu chọn máy móc tính chọn ngẫu nhiên đơn Vì chọn máy móc chọn lần nên dùng cơng thức chọn lần để tính Phương pháp chọn máy móc có thủ tục tiến hành đơn giản chọn ngẫu nhiên đơn Do việc chọn theo khoảng cách định nên số đơn vị mẫu phân phối tổng thể chung, tính chất đại biểu tổng thể mẫu nâng cao Trong nhiều trường hợp cụ thể người ta thấy sai số chọn mẫu chọn máy móc thường nhỏ so với sai số chọn ngẫu nhiên đơn 8.2.2.3 Phương pháp chọn phân loại (chọn phân tổ) Chọn phân loại tiến hành chọn đơn vị mẫu tổng thể chung phân chia thành tổ theo tiêu thức liên quan trực tiếp đến mục đích nghiên cứu Việc chọn đơn vị từ tổ tiến hành theo phương pháp chọn ngẫu nhiên Chẳng hạn, điều tra đời sống cán công nhân viên chức, trước hết phân chia cán công nhân viên theo ngành nghề khác nhau, sau từ ngành chọn hộ để điều tra Khi phân tổ, tổ thường có quy mơ khác (rất trường hợp quy mô tổ nhau) Nếu chọn số đơn vị tổng thể mẫu tổ tương ứng với tỷ trọng chiếm tổng thể gọi chọn phân loại theo tỷ lệ Ngược lại, chọn số đơn vị mẫu tổ 242 gọi chọn khơng theo tỷ lệ Trong chọn tỷ lệ, số đơn vị chọn tổ tính theo cơng thức: ni = n Ni N Trong thực tế, người ta thường dùng phương pháp chọn phân loại theo tỷ lệ chọn tổng thể mẫu có kết cấu gần giống với kết cấu tổng thể chung Sai số bình quân chọn mẫu chọn phân loại tỷ lệ không phụ thuộc vào phương sai chung mà phụ thuộc vào bình quân phương sai tổ Vì vậy, trường hợp chọn phân loại theo tỷ lệ ta có cơng thức tính sau: Nhiệm vụ suy rộng Chọn nhiều lần 12 Suy rộng số trung bình: x = Suy rộng tỷ lệ: p = n p(1 p) n Chọn lần x = p = 12 n (1 n ) N p(1 p) n (1 ) n N Trong công thức trên: 2 = i2 N i N i p(1 p) p(1 p) Ni p(1 p) n Ni Thống kê tốn chứng minh số bình qn phương sai tổ nhỏ phương sai chung Nghĩa i2 2 p (1 p) p (1 p) Vì vậy, sai số bình quân chọn mẫu chọn phân loại nhỏ chọn ngẫu nhiên đơn máy móc Trong trường hợp chọn phân loại không theo tỷ lệ, sai số bình qn chọn mẫu tính theo cơng thức: = i2 N i N Trong đó: i - Sai số bình quân chọn mẫu tổ Ni - Số đơn vị tổ tổng thể chung 243 Muốn cho tổng thể mẫu có tính chất đại biểu cao nữa, dùng phương pháp rút mẫu tối ưu Nây-man Theo phương pháp rút mẫu tối ưu này, số đơn vị chọn tổ tương ứng với tỷ lệ chiếm tổng thể mà cịn tương ứng với độ biến thiên tiêu thức tổ Nghĩa số đơn vị mẫu tổ tính theo cơng thức ni = n i Ni i N i Trong chọn tối ưu, sai số bình qn chọn mẫu tính theo cơng thức: Chọn nhiều lần Chọn lần i N i n 1 N n N Suy rộng số trung bình x = i N i N n Suy rộng tỷ lệ p = p(1 p) N i p(1 p) n p = 1 N N n n N x = 8.2.2.4 Phương pháp chọn khối (mẫu chùm) Trong phương pháp tổ chức chọn mẫu trên, lần chọn rút đơn vị Trong chọn khối lần chọn, số mẫu rút lẻ tẻ đơn vị mà nhóm (khối) đơn vị Mỗi nhóm đơn vị chọn điều tra hết khơng bỏ sót đơn vị Có thể nói điều tra tồn khối chọn Muốn chọn theo phương pháp này, trước hết tổng thể chung phải chia thành khối có quy mơ khác Để tiện cho việc tính tốn người ta thường chia thành khối có quy mơ Việc chọn khối tiến hành theo phương pháp chọn ngẫu nhiên đơn chọn máy móc Trong chọn khối, sai số bình qn chọn mẫu khơng phụ thuộc vào phương sai chung mà phụ thuộc vào chênh lệch số trung bình khối hay cịn gọi phương sai số trung bình khối Vì vậy, sai số trung bình chọn mẫu chọn khối tính sau: 244 - Khi suy rộng số trung bình: x2 R r x = ( R 1 ) Trong đó: R: Số khối tổng thể chung r: Số khối chọn để điều tra Phương sai số trung bình khối chọn, tính cơng thức: x2 ( xi x) ni ni Nếu số đơn vị khối thì: x2 ( xi x) r Trong đó: xi: Là số trung bình khối chọn, x số trung bình tất khối chọn - Khi suy rộng tỷ lệ: wr (1 wr ) R r ( ) r R 1 p = Trong đó: wr : Tỷ lệ trung bình khối chọn, tính cơng thức: Wr = Wi n i ni Nếu số đơn vị khối thì: wr = wi r Trong đó: Wi: Là tỷ lệ khối chọn 245 Thống kê toán chứng minh phương sai số trung bình khối ln nhỏ phương sai chung, cụ thể là: x2 Wr (1 - Wr) W (1 - W) Vì vậy, sai số trung bình chọn mẫu chọn khối nhỏ chọn ngẫu nhiên đơn 8.2.2.5 Phương pháp chọn mẫu phân tầng (chọn mẫu nhiều cấp hay chọn mẫu nhiều bậc) Chọn mẫu phân tầng phương pháp tổ chức chọn mẫu phải thơng qua hai cấp chọn trung gian Đầu tiên cần xác định đơn vị mẫu cấp I (có quy mơ lớn), sau từ tổ có quy mơ lớn lại phân chia thành đơn vị chọn mẫu cấp II (có quy mơ nhỏ hơn) cấp cuối Về chất, phương pháp biến thể phương pháp chọn mẫu khối Ví dụ: Trong điều tra đời sống nhân dân, người ta thường tiến hành chọn theo ba bậc: Đầu tiên chọn 50% số tỉnh tồn quốc Sau đó, tỉnh chọn lấy 10% số huyện Từ huyện chọn, lấy 20% gia đình để điều tra Như vậy, tỷ lệ chọn gia đình toàn quốc là: p = p1 x p2 x p3 = 0,5 x 0,1 x 0,2 = 0,01 hay 1% Chọn phân tầng khác chọn phân loại chỗ, chọn phân loại người ta chọn đơn vị điều tra từ tất tổ, chọn phân tầng chọn đơn vị tổ chọn Sai số chọn mẫu trường hợp chọn từ ba bậc trở lên tính theo cơng thức: 2 22 n1 32 n1 n2 42 n1 n2 n3 Trong đó: 1, 2, 3: Là sai số bình quân chọn mẫu bậc n1, n2, n3: Là số đơn vị mẫu bậc 246 Ưu điểm chọn phân tầng giảm bớt khối lượng công việc việc lập danh sách đơn vị Các đơn vị bậc đầu thường có quy mơ lớn (tỉnh, huyện ) nên số đơn vị Hơn nữa, bậc tiếp sau cần lập danh sách đơn vị chọn bậc trước nên khối lượng công việc giảm Trong phương pháp chọn mẫu ngẫu nhiên trình bày phương pháp chọn mẫu phân loại, đặc biệt phương pháp chọn tối ưu thường cho sai số nhỏ nhất, song lại phương pháp tổ chức chọn mẫu phức tạp 8.3 Quy trình điều tra chọn mẫu ngẫu nhiên Một điều tra chọn mẫu ngẫu nhiên thường tiến hành qua giai đoạn sau đây: 8.3.1 Xác định mục đích nghiên cứu Xác định mục đích nghiên cứu tức phải xác định cách rõ ràng điều tra nhằm tìm hiểu vấn đề gì, phục vụ cho yêu cầu cụ thể nào? Xác định mục đích nghiên cứu bước khởi đầu quan trọng, tiền đề cho giai đoạn sau 8.3.2 Xác định tổng thể nghiên cứu Tổng thể nghiên cứu tổng thể chung bao gồm đơn vị tượng nghiên cứu - tức xác định N Để xác định tổng thể nghiên cứu phải dựa vào mục đích nghiên cứu khác tổng thể nghiên cứu khác Thực chất việc xác định tổng thể nghiên cứu xác định đơn vị Muốn vậy, ngồi việc dựa vào mục đích nghiên cứu phải dựa vào lý luận kinh tế - xã hội, tình hình thực tế để đưa định nghĩa, tiêu chuẩn làm để xem xét cách cụ thể 8.3.3 Xác định nội dung điều tra Xác định nội dung điều tra xác định danh mục tiêu thức cần điều tra đơn vị tổng thể mẫu cụ thể hóa phiếu (biểu) điều tra Để xác định nội dung điều tra phải dựa vào mục đích 247 nghiên cứu Mục đích nghiên cứu địi hỏi phải giải nhiều vấn đề nội dung điều tra phải bao gồm nhiều tiêu thức 8.3.4 Xác định số lượng đơn vị tổng thể mẫu phương pháp tổ chức chọn mẫu Xác định số lượng đơn vị tổng thể mẫu tức xác định n (còn gọi kích thước mẫu, quy mơ mẫu) Để xác định số lượng đơn vị tổng thể mẫu cần phải cho trước phạm vi sai số chọn mẫu xác suất suy rộng tài liệu (khi nghiên cứu tượng kinh tế - xã hội, thường lấy xác suất 0,9544 hay 95,44%) Các cơng thức tính số lượng đơn vị tổng thể mẫu trình bày Sau xác định số lượng đơn vị tổng thể mẫu, dựa vào đặc điểm tượng nghiên cứu khả tổ chức điều tra để áp dụng phương pháp tổ chức chọn mẫu đề cập đến phần III nhằm xác định đơn vị cụ thể tổng thể mẫu (còn gọi dàn chọn mẫu) 8.3.5 Tiến hành thu thập tài liệu đơn vị tổng thể mẫu Dựa vào phiếu điều tra để tiến hành thu thập tài liệu đơn vị tổng thể mẫu Có nhiều phương pháp thu thập tài liệu như: Phương pháp đăng ký trực tiếp, phương pháp vấn trực tiếp,… Tùy thuộc vào điều kiện tính chất điều tra để áp dụng phương pháp thu thập tài liệu cho phù hợp 8.3.6 Suy rộng kết điều tra chọn mẫu Sau thu thập đầy đủ tài liệu đơn vị tổng thể mẫu, vào để tiến hành tính tốn suy rộng (cịn gọi ước lượng) đặc điểm tổng thể chung Có hai phương pháp suy rộng là: Suy rộng trực tiếp suy rộng khoảng Suy rộng trực tiếp coi mức độ tổng thể mẫu mức độ tổng thể chung Ví dụ: Coi bình qn mẫu, tỷ lệ tổng thể mẫu bình quân, tỷ lệ tổng thể chung Suy rộng khoảng mức độ tổng thể chung xác định nhận giá trị khoảng với xác suất cho trước 248 8.3.7 Đưa kết luận tổng thể chung Đây giai đoạn cuối thể kết trình nghiên cứu Câu hỏi đặt là: “Có thể có kết luận tổng thể chung?”, “Các kết luận có đáp ứng mục đích nghiên cứu đặt hay khơng? Có phản ánh đặc điểm, chất tượng hay khơng?” Từ cần đưa giải pháp, kiến nghị cụ thể để thúc đẩy phát triển tượng Các kết nghiên cứu đạt cần trình bày thơng qua bảng thống kê, đồ thị thống kê báo cáo phân tích 8.4 Điều tra chọn mẫu phi ngẫu nhiên Điều tra chọn mẫu phi ngẫu nhiên điều tra chọn mẫu mà đơn vị tổng thể mẫu chọn sở phân tích đặc điểm tượng kinh nghiệm thực tế Do đó, để đảm bảo chất lượng tài liệu điều tra, cần phải giải tốt vấn đề sau đây: 8.4.1 Phân tổ xác tượng nghiên cứu Hiện tượng nghiên cứu thường có kết cấu phức tạp, gồm nhiều tổ, nhiều phận có đặc điểm tính chất khác Trên sở phân tổ xác tượng nghiên cứu, đơn vị có đặc điểm tính chất giống (hoặc gần giống nhau) đưa vào tổ Từ tổ chọn đơn vị đại diện (cịn gọi điển hình) cho tổ Tập hợp đơn vị đại diện tổ tạo thành tổng thể mẫu Giả sử điều tra mức sống địa phương, phân mức sống thành ba tổ nghèo, trung bình, giả Từ tổ chọn số hộ đại diện cho tổ để tiến hành điều tra 8.4.2 Xác định số lượng đơn vị cần điều tra Việc xác định số lượng đơn vị cần điều tra phải vào tính chất phức tạp tượng nghiên cứu, lực lượng cán bộ, kinh phí cho điều tra,… Từ đó, định điều tra đơn vị số lượng đơn vị chọn để điều tra phải đủ lớn, đại diện cho tồn tượng 249 8.4.3 Lựa chọn đơn vị điều tra Các đơn vị lựa chọn để điều tra thực tế thường đơn vị có mức độ xấp xỉ với mức độ bình quân tổ Khi lựa chọn đơn vị để điều tra thực tế cần phải thơng qua việc phân tích, bàn bạc tập thể người có kinh nghiệm, am hiểu tình hình thực tế 8.4.4 Suy rộng kết điều tra Sau thu thập tài liệu đơn vị điều tra tiến hành tính tốn suy rộng trực tiếp cho tồn tượng Vì đơn vị điều tra lựa chọn đại diện cho tổ nên suy rộng phải ý đến tỷ trọng tổ chiếm toàn tượng TÓM TẮT CHƯƠNG Điều tra chọn mẫu loại điều tra khơng tồn bộ, người ta chọn số đơn vị toàn đơn vị đối tượng nghiên cứu để điều tra thực tế Có phương pháp điều tra chọn mẫu: điều tra chọn mẫu ngẫu nhiên điều tra chọn mẫu phi ngẫu nhiên Điều tra chọn mẫu cho phép tiết kiệm chi phí, đảm bảo tính kịp thời tài liệu điều tra Ta sử dụng cơng thức tốn học để xác định sai số trung bình chọn mẫu, phạm vi sai số chọn mẫu, số đơn vị tổng thể mẫu Có hai phương pháp suy rộng tài liệu: Phương pháp tính đổi trực tiếp phương pháp hệ số điều chỉnh Tùy thuộc vào đặc điểm tổng thể chung khả tổ chức điều tra, sử dụng phương pháp để lựa chọn đơn vị tổng thể mẫu sau đây: Chọn ngẫu nhiên, chọn đơn thuần, chọn máy móc, chọn phân loại, chọn khối Phạm vi sai số chọn mẫu phương pháp có khác Một điều tra chọn mẫu thường tiến hành theo quy trình gồm giai đoạn sau: Xác định mục đích điều tra chọn mẫu, xác định tổng thể nghiên cứu, xác định nội dung điều tra, xác định số lượng, đơn vị tổng thể mẫu phương pháp tổ chức chọn mẫu tiến hành thu thập tài liệu mẫu, suy rộng kết điều tra chọn mẫu đưa kết luận tổng thể chung 250 CÂU HỎI ÔN TẬP CHƯƠNG Trình bày khái niệm, ý nghĩa trường hợp vận dụng điều tra chọn mẫu? Trình bày khái niệm, nhân tố ảnh hưởng đến sai số chọn mẫu, cơng thức xác định sai số trung bình chọn mẫu? Trình bày phương pháp xác định phạm vi sai số chọn mẫu, quy mô tổng thể mẫu phương pháp suy rộng kết điều tra chọn mẫu? Trình bày phương pháp tổ chức chọn mẫu thường dùng, trường hợp vận dụng hình thức tổ chức đó? Trình bày quy trình tổ chức điều tra chọn mẫu Cho ví dụ minh họa? BÀI TẬP CHƯƠNG Bài 1: Trong doanh nghiệp có 1000 cơng nhân, người ta chọn 50 cơng nhân để điều tra suất lao động theo phương pháp chọn lần Kết điều tra cho thấy: Thời gian hao phí trung bình để sản xuất sản phẩm công nhân 32 phút, độ lệch tiêu chuẩn phút Hãy tính: Phạm vi sai số chọn mẫu suy rộng kết điều tra, với trình độ tin cậy 0,954? Thời gian hao phí trung bình để sản xuất sản phẩm công nhân doanh nghiệp? Với số liệu trên, điều tra 100 cơng nhân kết suy rộng Hãy so sánh kết tính được? Bài 2: Một doanh nghiệp có 2000 công nhân, người ta chọn 100 công nhân để điều tra suất lao động theo phương pháp chọn ngẫu nhiên đơn (khơng hồn lại) Kết điều tra sau: 251 NSLĐ (Tấn) Số công nhân (Người) 40 - 50 15 50 - 60 60 60 - 70 25 Hãy tính: a Năng suất lao động trung bình số cơng nhân điều tra? b Phương sai mẫu suất lao động? c Phạm vi sai số chọn mẫu suy rộng NSLĐ trung bình cơng nhân tồn doanh nghiệp với độ tin cậy 0,954? d Nếu số công nhân chọn theo phương pháp chọn ngẫu nhiên đơn (có hồn lại) sai số trung bình chọn mẫu bao nhiêu? Bài 3: Theo kết điều tra 10% nhân thành phố A vào tháng năm N phương pháp chọn ngẫu nhiên đơn (không hồn lại) thấy có 8% số nhân 80 tuổi; 14% tuổi 18% công nhân Biết tổng số nhân thành phố A thời điểm điều tra 300.000 người Với xác suất tin cậy 0,954 tính: Phạm vi sai số chọn mẫu tỷ trọng loại nhân nói trên? Tỷ trọng loại nhân nói thành phố? Bài 4: Một doanh nghiệp sản xuất bóng đèn điện, người ta tiến hành chọn mẫu 200 bóng đèn để xác định thời gian thắp sáng trung bình bóng đèn, đợt sản xuất gồm 100.000 bóng theo phương pháp chọn khơng hồn lại Với xác suất 0,997, tính: Phạm vi sai số chọn mẫu thời gian thắp sáng trung bình bóng đèn? Biết độ chênh lệch tiêu chuẩn số bóng đèn điều tra 100 Thời gian thắp sáng trung bình số bóng đèn sản xuất? Nếu thời gian thắp sáng trung bình số bóng đèn điều tra 980 252 TÀI LIỆU THAM KHẢO Nguyễn Hữu Hịe Giáo trình Lý thuyết Thống kê Nhà xuất Thống kê - 1984 Kim Ngọc Huynh Bài giảng tập Lý thuyết Thống kê Nhà xuất Đại học Giáo dục chuyên nghiệp - 1992 Tô Thị Phượng Lý thuyết Thống kê Nhà xuất Thống kê - 1998 Trần Thị Kim Thu Lý thuyết Thống kê Nhà xuất Thống kê - 2006 Viện Khoa học Thống kê Một số vấn đề phương pháp luận thống kê Nhà xuất Thống kê - 2005 Tăng Văn Khiên Lý thuyết ứng dụng Nhà xuất Thống kê 2015 Luật Thống kê văn hướng dẫn thi hành Nhà xuất Thống kê - 2004 Trần Thị Kim Thu Giáo trình Lý thyết Thống kê Nhà xuất Đại học Kinh tế quốc dân - 2012 P A Smoilova Lý thuyết thống kê Nhà xuất Thống kê Matxcova - 2008 10 B.E Glinxki Phân tích Thống kê Nhà xuất “Flin” - 1998 253 GIÁO TRÌNH NGUYÊN LÝ THỐNG KÊ Chịu trách nhiệm xuất bản: GIÁM ĐỐC - TỔNG BIÊN TẬP ThS ĐỖ VĂN CHIẾN Biên tập: VƯƠNG NGỌC LAM Trình bày: TRẦN MẠNH HÀ - BÙI DŨNG THẮNG In 1.000 cuốn, khổ 16 24cm, Nhà xuất Thống kê - Công ty Cổ phần In Khoa học công nghệ mới, Địa chỉ: 181 Lạc Long Quân, Nghĩa Đô, Cầu Giấy, TP Hà Nội Số xác nhận ĐKXB: 1149-2016/CXBIPH/06-10/TK Cục Xuất - In phát hành cấp ngày 22/4/2016 QĐXB số 56/QĐ-NXBTK ngày 27/5/2016 Giám đốc - Tổng biên tập NXB Thống kê In xong, nộp lưu chiểu: tháng năm 2016 254 ... đại lượng để tính tham số Phần tính tốn Năm Doanh thu (y) t t.y t2 20 11 20 0 20 0 20 7 ,2 20 12 240 480 23 7 ,2 2013 27 6 828 26 7 ,2 2014 300 120 0 16 29 7 ,2 2015 320 1600 25 327 ,2 Tổng 1336 15 4308 55 Thay... Sản lượng (tấn) (yi) Số trung bình di động ( i) 20 08 20 0 - 20 09 21 2 20 7 20 10 20 9 21 9 20 11 23 6 22 1 20 12 218 23 3 20 13 24 5 23 4 20 14 23 9 23 8 20 15 23 0 - Có thể biểu biến động hai dãy số đồ thị so... (gi) 20 11 20 0 - - - - - - - 20 12 240 40 40 120 120 20 20 20 13 27 6 36 76 115 138 15 38 2, 4 20 14 300 24 100 108,7 150 8,7 50 2, 76 20 15 320 20 120 106,67 160 6,67 60 3,0 TB 26 7 ,2 30 1 12, 47 12, 47