Điều tra trên mẫu có chủ đích

Một phần của tài liệu dữ liệu thống kê trong dạy học toán phổ thông (Trang 27)

Phân tích ở trên cho thấy, điều tra trên mẫu đã được thừa nhận nhưng chúng thiếu nền tảng khoa học đúng đắn. Anders Kiaer (1838 – 1919), người sáng lập và giám đốc đầu tiên của Cơ quan thống kê Na Uy. Ông cũng là người đầu tiên sử dụng điều tra mẫu cho cuộc điều tra dân số. Đó là một cuộc điều tra được thực hiện trên khắp Na Uy về tuổi về hưu đề xuất và chương trình bảo hiểm bệnh tật. Trong cuộc điều tra này, ông đã sử dụng quan niệm về tính đại diện của mẫu. Quan niệm này của ông là điểm khởi đầu cho một quá trình mà cuối cùng đã mang đến những phát triển trong phương pháp và lý thuyết chọn mẫu điều tra hiện đại.

Quan điểm này được ông nêu ra tại hội thảo khoa học do viện thống kê quốc tế tổ chức năm 1895, ông không đưa ra bất kỳ mô tả lý thuyết nào cho phương pháp của mình nhưng ông đã xác định hậu nghiệm thông qua việc so sánh cấu trúc mẫu với cấu trúc tổng thể. Ông cho rằng, để đảm bảo kết quả nghiên cứu thì trong việc chọn mẫu, cần phải đảm bảo tính đại diện của mẫu. Ông mở đầu phát biểu của mình bằng cách đặt ra câu hỏi:

“…Một thống kê với tư cách là một đại diện phải được thực hiện như thế nào để nó là hình ảnh thu nhỏ chính xác đến mức có thể được của toàn thể xã hội?” [2, trang 14]

Tuy nhiên, một số khác lại không tán thành quan điểm trên. Ông đã bị sự phản đối kịch liệt của những người tham dự hội nghị. Điển hình là Francai Emile Levasseur, ông cho rằng các kết quả nghiên cứu từ mẫu không thể được sử dụng cho tổng thể:

“… Những nghiên cứu thống kê dựa vào thống kê bộ phận không thể được áp dụng cho tổng thể mà chỉ là một số xác định và hẹp…”, [2, trang 14]

Vẫn bảo vệ quan điểm trên của mình, tại hội nghị Budapet (1901), Kiaer đã nêu ý kiến riêng của mình. Ông cho rằng, để mẫu có tính đại diện đòi hỏi mẫu phải có những biến thiên cơ bản và cấu trúc tương tự như của tổng thể. Đồng thời, số lượng phần tử được chọn vào mẫu phải tương đối lớn.

“… Phương pháp đại diện đòi hỏi một số lượng lớn những đơn vị quan sát. Các đơn vị này được phân bố sao cho các đặc trưng khác nhau phải có mặt theo những tỉ lệ gần nhất có thể được với tỉ lệ tồn tại trong tổng thể…”, [2, trang 14]

Phương pháp điều tra của Kiaer có thể được mô tả một cách tóm tắt như sau: Ông tiến hành điều tra trên 120 nghìn mẫu về dân số trưởng thành ở Na Uy theo những quy tắc mà Kiaer đặt ra. Khoảng 80 nghìn mẫu được thu thập theo Phương pháp đại diện và 40 nghìn mẫu được thu thập theo một phương pháp đặc biệt (nhưng tương tự) trong những khu vực dân cư thuộc tầng lớp lao động chân tay sinh sống.

Đối với nhóm 80 nghìn mẫu, các hộ gia đình ở Na Uy được chia thành hai tầng lớp dựa trên điều tra dân số năm 1891. Xấp xỉ 20 nghìn mẫu được chọn từ các thành phố và phần còn lại từ các khu vực nông thôn. Các mẫu thực tế được chọn trong các thành phố và các vùng nông thôn được tiến hành theo những phương pháp khác nhau.

Từ 61 thành phố ở Na Uy, ông chọn 13 thành phố đại diện trong đó có 5 thành phố có dân số trên 20 nghìn người, 5 thành phố này đại diện cho những thành phố lớn, và 8 thành phố còn lại đại diện cho các thị trấn nhỏ và trung bình (ví dụ như Lillehammer). Tỉ lệ số người được điều tra trong các thành phố thì khác nhau: Trong các thành phố nhỏ và trung bình thì tỉ lệ này lớn hơn trong các thành phố lớn. Kiaer đã đưa ra sự lựa chọn như vậy với lập luận rằng: Việc chọn từ các thành phố nhỏ và trung bình không chỉ đảm bảo tính đại diện cho chính chúng mà còn cho một số lớn các thành phố tương tự. Ở Kristiania (ngày nay là Oslo, thành phố thủ đô đông dân nhất Na Uy) tỉ lệ người được điều tra là 1/16, trong các thành phố kích cỡ trung bình thì tỉ lệ biến đổi từ 1/12 đến 1/9, và trong các thành phố nhỏ là 1/4 đến 1/3 dân số.

Dựa trên cuộc điều tra, người ta có thể biết được số lượng người sống trong mỗi con đường trong số 400 con đường của Kristiania. Các con đường được chia thành bốn loại theo dân số. Sau đó, một phương án chọn lựa được chỉ định cho mỗi

loại: tổng dân số trưởng thành được liệt kê là 1 trong 20 người đối với các con đường nhỏ. Trong loại thứ hai: dân số trưởng thành được liệt kê thuộc một nửa số nhà được chọn ra từ 1 trong mỗi 10 ngôi nhà. Trong loại thứ ba, việc liệt kê được thực hiện ở 1/4 con đường, và cứ mỗi 5 nhà thì có 1 nhà được liệt kê. Và trong loại cuối cùng gồm các con đường lớn nhất, dân số trưởng thành được liệt kê ở một nửa con đường, cứ mỗi 10 nhà thì liệt kê 1 nhà.

Trong việc chọn lựa các con đường, sự phân bố dân cư trên các thành phố được quan tâm nhằm đảm bảo độ phân tán và “tính đại diện” của các khu vực được liệt kê.

Trong các thị trấn có kích cỡ trung bình, mẫu được chọn theo cùng nguyên lý, nhưng theo cách đơn giản hơn một chút. Trong những thị trấn nhỏ nhất, tất cả dân số trong ba hoặc bốn nhà được liệt kê.

Trong khu vực nông thôn, số lượng người cung cấp thông tin ở mỗi tỉnh trong số 18 tỉnh của Na Uy cũng được chọn trên cơ sở dữ liệu điều tra dân số trước đó (1891). Để thu được tính đại diện, các đô thị tự trị của mỗi tỉnh được phân loại theo các ngành nghề chính như: Nông nghiệp, lâm nghiệp, công nghiệp, nghề biển, hoặc nghề cá. Các đô thị tự trị đại diện trong mỗi loại và số người cung cấp thông tin cũng được xác định sao cho mỗi ngành nghề đạt được tỉ lệ thích hợp so với dân số tổng thể. Thêm vào đó, sự phân bố địa lý cũng được chú ý.

Tổng số đô thị tự trị đại diện được chọn lên đến 109 trên tổng số 498 đô thị tự trị trên toàn Na Uy.

Việc chọn lựa người cung cấp thông tin từ các đô thị tự trị cũng được lựa chọn một cách cẩn thận. Kiaer không chỉ điều tra trên các gia đình khá giả mà còn trên các gia đình trung lưu, gia đình nghèo và cả những người vô gia cư.

Còn về vấn đề ước lượng tổng thể, Kiaer đã không đưa ra bất kỳ giải thích nào trong các báo cáo của ông. Nguyên nhân chính có lẽ là do phương pháp đại diện đã được xây dựng như là một thu gọn của tổng thể. Vì vậy, việc tính toán các ước lượng là không quan trọng: Trung bình của mẫu là ước lượng của trung bình tổng

thể, và các ước lượng về tổng thể có thể thu được một cách đơn giản bằng việc nhân kết quả của mẫu với nghịch đảo tỉ số lấy mẫu.

Nhận xét: Thông qua những những mô tả về phương pháp điều tra đại diện và

các báo cáo của Kiaer trước hội nghị cho thấy nó hoàn toàn tương tự với những phương pháp của lý thuyết chọn mẫu hiện đại. Khác nhau chủ yếu ở chỗ, không sử dụng chọn mẫu ngẫu nhiên mà là chọn mẫu có chủ đích dựa trên cơ sở của tính đại diện. So sánh với các nghiên cứu chuyên khảo thì sự cách tân của phương pháp Kiaer là: Sự biến đổi trong tổng thể được xem là một đặc tính bản chất và các mẫu được lựa chọn theo cách sao cho sự biến đổi có thể được bao hàm trong những tỉ lệ thích hợp. Qua những mô tả về phương pháp đại diện của Kiaer chứng tỏ ông đã nhận thấy yếu tố quan trọng tác động dẫn đến sự thay đổi kết quả khi nghiên cứu trên mẫu đó là: Yếu tố ngẫu nhiên. Đồng thời có thể hạn chế sự tác động của yếu tố ngẫu nhiên thông qua cơ chế chọn mẫu và kích thước mẫu thích hợp cho cuộc điều tra. Từ đó, việc chọn mẫu dựa trên tính đại diện được ông xem như một sự hiển nhiên nhằm đảm bảo kết quả nghiên cứu. Tuy nhiên, điều đó không hiển nhiên với nhiều nhà khoa học khác.

Một phần của tài liệu dữ liệu thống kê trong dạy học toán phổ thông (Trang 27)