Điều tra trên mẫu ngẫu nhiên

Một phần của tài liệu dữ liệu thống kê trong dạy học toán phổ thông (Trang 30)

Mặc dù vấp phải nhiều ý kiến trái chiều, phương pháp của kiaer cũng nhận được nhiều sự ủng hộ. Điển hình là Arthur Bowley, giáo sư của đại học Luân Đôn. Ông đã ứng dụng phương pháp này cho những cuộc điều tra trên phạm vi lớn. Bowley cũng có vai trò quyết định trong việc thuyết phục ISI chấp thuận những ý tưởng của Kiaer trong nghị quyết năm 1901.

Một nhược điểm trong phương pháp đại diện là nó không có cách thiết lập độ chính xác của các ước lượng. Phương pháp thiếu cơ sở lý thuyết cho việc ước lượng tổng thể và Bowley là người đã tạo ra những bước tiến đầu tiên theo hướng này. Ngay từ lúc đầu, ông đã nhấn mạnh tầm quan trọng của việc ứng dụng các mẫu ngẫu nhiên. Bowley đã chỉ ra rằng, đối với những mẫu cỡ lớn được chọn lựa ngẫu nhiên từ tổng thể, các ước lượng có một phân bố xấp xỉ chuẩn tắc. Trong đó ông giả

định rằng, các phần tử từ tổng thể phải có khả năng được chọn như nhau. Điểm đáng chú ý trong công trình của Bowley là ông đã đưa ra khái niệm về khoảng tin cậy.

Sau đóng góp của Bowley trong cuộc họp của ISI vào năm 1924, hình thành hai trường phái chọn mẫu khác nhau. Thứ nhất, là chọn mẫu dựa trên tính đại diện của Kiaer, phương pháp này thiếu cơ sở lý thuyết cho việc ước lượng. Thứ hai là phương pháp tiếp cận của Bowley, dựa trên mẫu ngẫu nhiên (các đơn vị có cơ hội được chọn như nhau), và độ chính xác của các ước lượng có thể ước tính được. Cả hai phương pháp đã tồn tại song song trong nhiều năm.

Năm 1924, ISI đã bổ nhiệm một ủy ban nhằm mục đích nghiên cứu ứng dụng của phương pháp nghiên cứu đại diện trong thống kê với các thành viên như: Jensen, Bowley, Gini, March, Verrijn Stuart, và Zizek. Trong báo cáo của mình, Jensen đề cao phương pháp đại diện của kiaer. Còn quan điểm của Verrijn Stuart (bấy giờ là giám đốc của Cơ quan thống kê Hà Lan) về vấn đề chọn mẫu, ông tán thành việc lựa chọn ngẫu nhiên. Theo quan điểm của ông, việc chọn mẫu có chủ đích luôn phản ánh các quyết định chủ quan. Điều này có thể tránh được bằng cách sử dụng các mẫu ngẫu nhiên. Ngoài ra, ông cũng đề cập đến việc ứng dụng luật số lớn vào vấn đề chọn mẫu.

Cả hai phương pháp lựa chọn (lựa chọn có chủ đích và ngẫu nhiên) cùng tồn tại mãi đến năm 1934, năm mà nhà khoa học người Ba Lan Jerzy Neyman đọc bài báo nổi tiếng của mình trước Hội thống kê hoàng gia. Ông đã phát triển một lý thuyết ước lượng mới dựa trên khái niệm về khoảng tin cậy. Trong đó, ông đặc biệt đề cao việc chọn mẫu ngẫu nhiên. Không chỉ dừng lại ở đó, ông cũng đã chứng minh rằng phương pháp đại diện dựa trên việc lựa chọn mẫu có chủ đích có thể đem lại các ước lượng về tổng thể không chính xác.

Quan niệm về chọn mẫu ngẫu nhiên không chỉ nổi lên ở Tây Âu. Cùng thời kì này, ở Nga người ta cũng nghiên cứu về việc chọn mẫu ngẫu nhiên. Năm 1925, Kovalevskiy công bố công trình nghiên cứu toán học của ông về lý thuyết chọn mẫu

phân tầng (9 năm trước bài báo nổi tiếng của Jerzy Neyman). Công trình của Kovalevskiy thực chất là một sự tổng hợp các kinh nghiệm trong thực tiễn và công trình lý thuyết của các nhà thống kê thuộc đại học Nga trước 1917.

Nhận xét: Từ sau những đóng góp của Arthur Bowley, ta thấy có sự chuyển

biến trong nhận thức của các nhà thống kê về các yếu tố tác động khi nghiên cứu mẫu. Việc không tán thành phương pháp chọn mẫu theo chủ đích cho thấy sự ý thức của họ về sự tác động của các yếu tố ngẫu nhiên khi nghiên cứu mẫu. Từ đó, mẫu ngẫu nhiên ra đời như một phương pháp nhằm hạn chế sự tác động của yếu tố ngẫu nhiên đồng thời có thể vận dụng xác suất vào để xây dựng một ước lượng không chệch cho tổng thể.

Một phần của tài liệu dữ liệu thống kê trong dạy học toán phổ thông (Trang 30)