VTKT I. ĐẶT VẤN ĐỀ Việc áp dụng phương pháp phân tích tương quan trong phân tích kinh tế đã được đề cập đến trong nhiều tài liệu, giáo trình. Tuy nhiên, vấn đề xác định kích thước mẫu số liệu cần thu thập là bao nhiêu để đảm bảo tính đúng đắn, đáng tin cậy của các nghiên cứu và mặt khác tiết kiệm được các chi phí thu thập tính toán. II. NỘI DUNG Một xu hướng quan trọng khi hoàn thiện phương pháp phân tích tương quan trong phân tích kinh tế đó là việc hoàn thiện cơ sở số liệu ban đầu. Theo [1] đã đưa ra phương pháp lựa chọn mẫu số liệu trên cơ sở đảm bảo tính đồng nhất của mẫu số liệu thống kê. Phương pháp này chủ yếu đảm bảo về mặt “chất” của mẫu số liệu thông qua việc phân tích lựa chọn xử lý thô đối với tập hợp số liệu ban đầu. Vấn đề đặt ra là với một mức độ tin cậy nhất định và một độ chính xác cho trước, kích thước của mẫu số liệu bằng bao nhiêu để đạt được độ chính xác đó. Vì trong thực tế việc tăng kích thước mẫu số liệu sẽ rất khó khăn đòi hỏi nhiều thời gian, công sức và kinh phí. Theo [2] việc xác định kích thước mẫu số liệu cho trung bình mẫu được xác định như sau: Từ biểu thức u n để độ chính xác không vượt quá 0 cho trước ta cần có 0 u. n (1) 2 (2) là khoảng ước lượng; là phương sai; u tính theo bảng Laplat; là độ tin cậy; n là kích thước mẫu số liệu. XÁC ĐỊNH KÍCH THƯỚC MẪU SỐ LIỆU TS. ĐẶNG THỊ XUÂN MAI Bộ môn Kinh tế xây dựng Khoa Vận tải - Kinh tế Trường Đại học Giao thông Vận tải Tóm tắt: Bài báo nêu lên phương pháp ứng dụng toán xác suất thống kê trong việc xác định kích thước mẫu số liệu trong các nghiên cứu phân tích kinh tế. Summary: The aim of this paper is to provide a method that applying statistics and probability theories to determine the sample size of the data in economic analysis research. VTKT Từ đó suy ra: 2 0 un (3) Trong công thức trên nếu phương sai 0 chưa biết ta thay bằng độ lệch mẫu S ' 2 0 u S n (4) Tuy nhiên do S ' lại phụ thuộc n, để khắc phục điều này ta thực hiện lấy một mẫu (x 1 , x 2 …x m ) với kích thước m 30 nào đó và tính trị số trung bình và độ lệch mẫu S ' theo mẫu đó m 1i i X m 1 X (5) n 1i 2 i Xx 1m 1 S (6) Sau đó kết hợp với bảng tính sẵn [2] giá trị hàm Laplat dte 2 )x( x 2 t 2 ta tính ra được kích cỡ mẫu n theo công thức (2). Ví dụ ta có mẫu số liệu ban đầu như sau: Số liệu ban đầu TT Tên công ty Số lao động Giá trị vốn sản xuất (tỷ) Giá trị sản lượng (tỷ) 1 XN xử lý nền móng XD 214 21,600 17,931 2 CT XD chuyên ngành BXD 225 20,435 26,643 3 CT xây lắp số 5 230 12,844 15,477 4 CTXD & PT nhà 238 25,000 17,009 5 CT sửa chữa đ.bộ 710 238 26,056 33,990 6 CTXD & PT nhà Q.Tân Bình 249 21,521 26,244 7 CTXD bưu điện 250 30,931 32,279 8 CT cầu đường10 298 13,981 21,880 9 CTXD công trình 124 300 22,648 23,505 10 CTXD Hồng Hà 303 29,787 17,998 11 CTXD công trình Tiến Phát 305 12,299 15,647 12 CTXD cg.tr.Hùng Vương 305 12,299 41,086 13 CTXD &sửa chữa nhà 312 31,511 25,310 14 CTXLắp GTCC 324 15,483 13,447 15 CTXD&PT nhà Q.H.B.Trưng 330 18,709 16,360 16 CT cg.tr.GT 68 346 11,536 33,816 17 CT cg.tr.GT 4 361 15,892 13,103 18 CT đầu tư XD số 2 382 19,704 18,598 19 CT Cầu 13 Thăng Long 392 24,179 19,361 20 CT Cầu 11 Thăng Long 395 14,233 14,600 VTKT 21 CT XD số 3 400 17,446 24,208 22 CTXD Sài Gòn 412 17,126 25,268 23 CT đầu tư PT hạ tầng đô thị 436 23,576 20,241 24 CT quản lý nhà Q.3 443 14,641 42,363 25 CTXD cg.tr.120 450 21,699 30,240 26 CT chiếu sáng &th.bị đô thị 459 20,337 24,840 27 CTXD thuỷ lợi 44 463 17,092 40,639 28 CTXLắp số 1 Bộ Thương mại 467 24,840 22,010 29 CTXD thuỷ lợi 46 488 12,282 25,663 30 CT cung ứng vật tư thiết bị 491 18,394 37,900 ( Tổng cục thống kê 1996) Việc tính toán xác định kích cỡ mẫu sẽ được xác định theo từng tiêu chí: 1. Số lao động 2. Giá trị vốn sản xuất 3. Giá trị sản lượng Tiêu chí 1: Số lao động (số người) Với sai số 0 = 25, ta chia khoảng và lập bảng phân bố tần số sau: Khoảng chia Tần số Từ 214 đến 238 - 239 - 263 - 264 - 288 - 289 - 313 - 214 - 338 - 339 - 363 - 364 - 388 - 389 - 413 - 414 - 438 - 439 - 463 - 464 - 491 5 2 0* 6 2* 2* 1 4 1 4 3 * Bỏ khoảng có tần số bằng 0 và gộp 2 khoảng có tần số bằng nhau ta có: Từ đó tính: Kỳ vọng mẫu (trung bình mẫu): X = 348 Phương sai mẫu (độ lệch tiêu chuẩn): S ' = 85 Với độ tin cậy 90% thì kích thước mẫu tối thiểu là 31 Khoảng chia Tần số Từ 214 đến 238 - 239 - 263 - 289 - 313 - 314 - 363 - 364 - 388 - 389 - 413 - 414 - 438 - 439 - 463 - 464 - 491 5 2 6 4 1 4 1 4 3 VTKT Tiêu chí 2: Giá trị vốn sản xuất (tỷ đồng) Số liệu xếp theo thứ tự tăng dần là: 11,536 17,092 21,699 12,282 17,126 22,648 12,299 17,446 23,576 12,299 18,394 24,179 12,844 18,709 24,840 13,981 19,704 25,000 14,233 20,337 26,056 14,641 20,435 29,787 15,483 21,521 30,931 15,892 21,600 31,511 Với sai số 0 = 1,5 ta chia khoảng và lập bảng phân bố tần số sau: Khoảng cách Tần số Từ 11,536 đến 13,035 - 13,036 - 14,535 - 14,536 - 17,535 - 17,536 - 19,035 - 19,036 - 22,035 5 2 6 2 6 - 22,036 - 23,535 - 23,536 - 25,035 - 25,036 - 26,535 - 29,536 - 31,511 1 4 1 3 Từ đó tính: Kỳ vọng (trung bình) mẫu: X = 19,410 Phương sai (độ lệch tiêu chuẩn) S’ = 5, 518 Với độ tin cậy 90% thì kích thước mẫu tối thiểu là: 37 Tiêu chí 3: Giá trị sản lượng ( tỷ đồng) Số liệu xếp theo thứ tự tăng dần là: 13,103 19,361 26,244 13,447 20,241 26,643 14.600 21,880 30,240 15,477 22,010 32,279 15,647 23,505 33,816 16,360 24,208 33,990 17,009 24,840 37,900 17,931 25,268 40,639 17,998 25,310 41,086 18,598 25,663 42,363 Với sai số 0 = 2,0 ta chia khoảng và lập bảng phân bố tần số như sau: VTKT Khoảng chia Tần số Từ 13,103 đến 15,102 15,103 - 17,102 17,103 - 19,102 19,103 - 23,102 23,103 - 25,102 25,103 - 27,102 29,103 - 33,102 33,103 - 35,102 37,103 - 39,102 39,103 - 41,102 41,103 - 42,363 3 4 3 4 3 5 2 2 1 2 1 Từ đó tính: Kỳ vọng (trung bình) mẫu X = 24, 624 Phương sai (độ lệch tiêu chuẩn) S’ = 8,223 Với độ tin cậy 90% kích thước mẫu tối thiểu là 45. Ta thấy rằng với các tiêu chí nghiên cứu khác nhau (với các nội dung nghiên cứu khác nhau), đủ để đảm bảo một độ tin cậy nhất định kích thước của mẫu số liệu là hoàn toàn khác nhau. Do đó khi nghiên cứu hiện tượng kinh tế dưới tác động của một chỉ tiêu sẽ tiết kiệm được thời gian, công sức và chi phí tính toán. Vì khi tăng kích thước mẫu n thì độ chính xác 0 của các ước lượng càng nhỏ và do đó độ chính xác của các ước lượng càng tăng lên. Khi nghiên cứu hiện tượng kinh tế dưới tác động đồng thời của nhiều chỉ tiêu nghiên cứu ta có thể phân ra làm hai trường hợp sau: - Nếu coi xét mức độ quan trọng của các tiêu chí là như nhau (hoặc không tính đến mức độ quan trọng của các chỉ tiêu) thì kích thước của mẫu số liệu nên chọn theo giá trị lớn nhất của các kích thước mẫu đã xác định [tức là max(n 1 , n 2 , n 3 …)] - Nếu có xem xét đến mức độ quan trọng của các chỉ tiêu thì kích thước của mẫu số liệu có thể chọn theo kích thước của tiêu chí quan trọng nhất trong các tiêu chí nghiên cứu III. KẾT LUẬN Việc xác định kích thước mẫu số liệu trong các nghiên cứu kinh tế rất quan trọng, nó đảm bảo cả về mặt “chất” và mặt “lượng” của mẫu số liệu. Phương pháp xác định kích thước mẫu số liệu này còn có thể áp dụng trong nhiều lĩnh vực khoa học công nghệ khác như: xác định số lần tiến hành thí nghiệm, số lượng đối tượng nghiên cứu, số lần quan sát ghi chép sự kiện… Ưu điểm nổi bật của phương pháp này là vừa đảm bảo độ tin cậy của các nghiên cứu vừa tiết kiệm được thời gian, công sức và chi phí tính toán. Tài liệu tham khảo [1]. TS. Đặng Thị Xuân Mai, Tính đồng nhất của số liệu khi áp dụng phương pháp phân tích tương quan trong phân tích kinh tế, tạp chí Khoa học Giao thông vận tải số 21 tháng 3/2008 [2]. Trần Văn Minh (chủ biên), Xác suất thống kê và các tính toán trên Excel, NXB Giao thông vận tải, Hà Nội 2001. [3]. Luận án tiến sỹ Đặng Thị Xuân Mai, Nghiên cứu hoàn thiện một số vấn đề về phân tích hoạt động kinh doanh của doanh nghiệp xây dựng, 2001 [4]. Danh mục các doanh nghiệp xây lắp có đến 31-12-1995, Tổng cục Thống kê, Vụ giao thông - Xây dựng,1996 . thực tế việc tăng kích thước mẫu số liệu sẽ rất khó khăn đòi hỏi nhiều thời gian, công sức và kinh phí. Theo [2] việc xác định kích thước mẫu số liệu cho trung bình mẫu được xác định như sau: Từ. n là kích thước mẫu số liệu. XÁC ĐỊNH KÍCH THƯỚC MẪU SỐ LIỆU TS. ĐẶNG THỊ XUÂN MAI Bộ môn Kinh tế xây dựng Khoa Vận tải - Kinh tế Trường Đại học Giao thông Vận tải Tóm tắt: Bài báo. “lượng” của mẫu số liệu. Phương pháp xác định kích thước mẫu số liệu này còn có thể áp dụng trong nhiều lĩnh vực khoa học công nghệ khác như: xác định số lần tiến hành thí nghiệm, số lượng đối