180, 190, 190, 200, 210, 210, 220 (1) còn của 7 công nhân ở tổ 2 là
2.2.4. Biện pháp 4: Rèn luyện cho học sinh kĩ năng rút ra được các kết luận từ các tham số đặc trưng.
luận từ các tham số đặc trưng.
Nhìn lại nội dung Thống kê trong sách giáo khoa Toán lớp 7 và lớp 10 hiện hành ở trường phổ thông, ta thấy các yêu cầu đối với học sinh trong tất cả các bài toán có đặc điểm như sau:
- Các bài toán đều có nội dung thực tiễn, dữ liệu đã cho biết, vấn đề đã được phát biểu bằng ngôn ngữ toán học trong đó nhiệm vụ toán học cũng đã được xác định rõ ràng như lập bảng tần số (hay tần suất) ghép lớp, vẽ biểu đồ tần số (tần suất) hình cột, tính số trung bình, tìm trung vị, tính phương sai, tính độ lệch chuẩn.
- Ít có câu hỏi nào yêu cầu học sinh rút ra các kết luận từ các kết quả được tính. Chức năng của các bài toán chủ yếu để “củng cố” công thức qua luyện tập, tính toán trên các bảng dữ liệu khác nhau. Các bài toán đó ít giúp cho học sinh hiểu được ý nghĩa của tri thức thống kê, không rèn luyện được kĩ năng suy luận thống kê cho học sinh. Vì vậy, trong chừng mực nhất định, sau khi học sinh tổ chức, biểu diễn số liệu thống kê, giáo viên có thể rèn cho học sinh kĩ năng phân tích mẫu dữ liệu, từ đó rút ra được các kết luận thống kê, qua một vài ví dụ điển hình. Lúc này, ta phải để ý đến các giá trị điển hình có thể cho biết đặc trưng của mẫu dữ liệu. Khi nói “giá trị điển hình” là người ta đã nghĩ đến việc lựa chọn một (hay một số) tham số có thể thâu tóm được thông tin chứa đựng trong dãy số liệu quan sát được.
Các tham số đặc trưng của mẫu được chia thành ba loại:
- Đặc trưng về vị trí: Gồm các tham số trung bình (kì vọng), mốt,
trung vị. Khi các giá trị thống kê của mẫu không có sự chênh lệch quá lớn thì trung bình và trung vị sẽ xấp xỉ nhau. Nhóm tham số này phản ánh mức độ tập trung của dãy số liệu nên được gọi là nhóm tham số định tâm.
- Đặc trưng về sự phân tán: Gồm các tham số biên độ (độ rộng của dãy giá trị thu được trên mẫu), phương sai, độ lệch chuẩn, độ lệch trung bình, khoảng tứ phân vị. Nhóm tham số này dùng để đo độ phân tán của dãy dữ liệu nên được gọi là nhóm tham số định độ phân tán.
- Đặc trưng về hình dáng của phân phối (của hàm mật độ): Gồm các tham số hệ số đối xứng, hệ số nhọn. Những khái niệm này liên quan đến
hàm phân phối và hàm mật độ xác suất của một biến ngẫu nhiên. Căn cứ vào các tham số hệ số đối xứng, hệ số nhọn, người ta sẽ biết hình dáng của đồ thị hàm phân phối.
Loại tham số thứ ba không có mặt trong chương trình môn toán ở trường phổ thông (theo [1, trang 54]).
Ví dụ 18: Giáo viên nêu tình huống giả định sau đây để học sinh thực hành.
Tình huống: Hai loại bút bi của hai hãng M và N có giá như nhau. Vấn đề đặt ra: Nên chọn loại bút nào để viết cho được nhiều?
Với tình huống này, học sinh sẽ thấy rằng mình không thể mua hết toàn bộ bút của hai hãng và viết hết mực rồi so sánh. Từ đó, giáo viên có thể gợi ý cách kiểm tra: Lớp cử hai nhóm đi mua một số bút bi của hai hãng M và N và thử xem sử dụng một bút sau bao nhiêu giờ thì hết mực. Nhóm 1 mua 6 bút của hãng M còn nhóm 2 mua 5 bút của hãng N. Kết quả như sau:
Loại bút của hãng M: 23 25 27 28 30 35. Loại bút của hãng N: 16 22 28 33 46.
Dựa vào kết quả khảo sát của hai nhóm nêu trên, giáo viên yêu cầu học sinh quyết định nên mua loại bút nào để viết.
Rõ ràng, để đưa ra quyết định, học sinh cần tính các tham số đặc trưng để so sánh. Nhờ công thức đã học, học sinh tính được kết quả sau:
Loại bút của hãng M: Số trung bình là 23 25 27 28 30 35
6
+ + + + +
= 28 giờ, độ
lệch chuẩn là 3,83 giờ.
Như vậy, loại bút của hãng M có thời gian sử dụng trung bình lâu hơn của hãng N với thời gian 1 tiếng. Tuy nhiên, do độ lệch chuẩn của loại bút M lớn hơn nhiều so với loại bút N nên chất lượng của loại bút M không đồng đều như loại bút N. Điều đó có nghĩa là, nếu không may mắn thì học sinh sẽ mua phải chiếc bút có thời gian sử dụng rất thấp, hay nói cách khác, khả năng mua được bút loại M có thời gian sử dụng lâu không bằng khả năng mua loại bút N có thời gian sử dụng lâu. Vì thế, học sinh có thể nên mua bút của công ti N để viết.
Ví dụ 19: Giáo viên đưa ra tình huống giả định cho học sinh và đặt câu hỏi
để học sinh trả lời.
Tình huống: Giả sử lớp ta muốn tổ chức đi tham quan một di tích lịch sử X. Từ chỗ tập trung đến vị trí của di tích đó có hai con đường để đi là A và B. Vì lí do an toàn cho lớp nên lớp trưởng phải chọn con đường nào là phù hợp nhất. Lớp trưởng cử hai nhóm đến trạm kiểm soát của hai con đường trên và hỏi tốc độ của các xe ô tô chạy trên hai con đường này. Trên hai con đường A và B, trạm kiểm soát đã ghi lại được tốc độ (km/h) của 30 ô tô trên mỗi con đường như sau:
Con đường A: 60 65 70 68 62 75 80 83 82 69 73 75 85 72 67 88 90 85 72 63 75 76 85 84 70 61 60 65 73 76 Con đường B: 76 64 58 82 72 70 68 75 63 67 74 70 79 80 73 75 71 68 72 73 79 80 63 62 71 70 74 69 60 63.
Theo em thì lớp trưởng nên chọn con đường nào để tổ chức cho lớp đi an toàn hơn?
- Trên con đường A: Vận tốc trung bình x ≈ 73,63 km/h, phương sai s2 ≈ 74,77, độ lệch chuẩn s ≈ 8,65 km/h.
- Trên con đường B: Vận tốc trung bình x ≈ 70,7 km/h, phương sai s2 ≈ 38,21, độ lệch chuẩn s≈ 6,18 km/h.
Từ đó rút ra nhận định: Nói chung, lái xe trên con đường B an toàn hơn trên con đường A vì vận tốc trung bình của ô tô trên con đường B nhỏ hơn trên con đường A và độ lệch chuẩn của ô tô trên con đường B cũng nhỏ hơn trên con đường A. Vậy lớp trưởng nên chọn con đường B để đi.
Ví dụ 20 (phỏng theo [1, trang 117]):
Tình huống: Lớp được phân công kiểm tra tiêu chuẩn về trọng lượng của các hộp sữa chua do nhà máy X sản xuất. Hình dung là có một nhóm về công tác ở nhà máy. Nhóm sẽ phân thành từng cặp hai người, một người cân rồi dọc cho người kia ghi chép số liệu. Nhà máy X muốn tận dụng cơ hội có nhóm điều tra, nhờ nhóm đánh giá xem giữa ba dây chuyền đóng gói
A, B, C mà họ đang cho chạy thử nghiệm trước khi quyết định đưa vào thử nghiệm, dây chuyền nào tốt hơn. Nhóm điều tra chia làm ba, mỗi nhóm nhỏ lấy số liệu thống kê trên một dây chuyền, sau đó tập hợp số liệu thu được trong một bảng dưới đây:
Bảng 2.26
Trọng lượng xi (g) Dây chuyền A
Dây chuyền B Dây chuyền C
[45,5 ; 47,5) [47,5 ; 49,5) [49,5 ; 51,5) [51,5 ; 53,5) [53,5 ; 55,5) 12 19 50 46 21 5 39 58 54 5 19 36 24 12 31 N 148 161 122
Nhiệm vụ của lớp: Phân tích bảng số liệu điều tra trên 3 dây chuyền A, B,
C. Lưu ý rằng tiêu chuẩn trọng lượng đăng kí trên hộp là 50g. Những hộp nặng từ 49,5 đến 50,5 được xem là đạt yêu cầu tốt về trọng lượng. Những hộp có trọng lượng sai khác không quá 2,5g so với tiêu chuẩn (50g) được xem là chấp nhận được. Nếu sai khác so với tiêu chuẩn trên 2,5g thì không chấp nhận được.
Tổ chức: Lớp được chia thành nhiều nhóm, mỗi nhóm gồm 4 - 5 học sinh và được giao phân tích chỉ một cột số liệu. Mỗi cột số liệu sẽ được phân tích bởi ít nhất là hai nhóm, sau đó thảo luận tập thể.
Với 3 dãy số liệu trên, tính số trung bình được:
A
x ≈ 50,43; xB ≈ 50,01; xC ≈ 50,05.
Mốt, trung vị của dãy số liệu B và C xấp xỉ nhau, nhưng có độ phân tán của dãy B nhỏ hơn độ phân tán của dãy C.
Học sinh có thể đưa ra cách giải quyết: Tính trọng lượng trung bình của các hộp sữa chua do từng dây chuyền cung cấp. Kết quả cho phép đưa ra ý kiến “nên loại dây chuyền A vì trọng lượng trung bình lớn hơn tiêu chuẩn nhiều quá, ảnh hưởng đến lợi nhuận của nhà máy”.
Như vậy, học sinh mới giải quyết được rằng: “Nếu lấy lợi nhuận làm tiêu chí thì căn cứ vào số trung bình sẽ thấy không nên dùng dây chuyền A. Tuy nhiên, số trung bình không cho phép chỉ ra một sự khác biệt quan trọng nào về chất lượng đóng gói giữa các dây chuyền B, C.”
Tiếp tục yêu cầu học sinh phân tích dãy dữ liệu về hai dây chuyền B,
C: xB ≈ xC ≈ 50, nhưng liệu tỉ lệ họp đạt tiêu chuẩn tốt có bằng nhau? Tỉ lệ số lượng hộp không chấp nhận được của các dây chuyền có như nhau? Khái niệm tần suất và tần suất ghép lớp được hình thành từ việc tìm câu trả lời cho câu hỏi trên. Hơn nữa yêu cầu mới này còn cho phép làm nảy sinh các khái niệm số trung vị, mốt và các tham số đo độ phân tán của dãy số
liệu. Do đặc trưng của dãy số liệu đã được cố tình lấy sao cho các tham số đo độ tập trung của dãy B và C xấp xỉ nhau nên “mô hình mốt” và “mô hình trung vị” cũng không mang lại cơ sở cho sự lựa chọn.
Quy trình mô hình hoá lại được lặp lại. Thông tin cần để ý đến lúc này là độ phân tán của dãy dữ liệu. Cuối cùng, “mô hình phương sai” sẽ là mô hình cho phép đưa ra một kết luận thoả đáng cho sự lựa chọn giữa B và
C. Cụ thể, dây chuyền được kết luận nên dùng là B. Niềm tin vào sự lựa chọn này càng được củng cố với nhận xét: dù căn cứ vào phương sai hay tần suất của lớp ghép [49,5 ; 51,5) (đạt chất lượng tốt), thì dây chuyền B
đều có ưu thế hơn dây chuyền C.
Cuối cùng, yêu cầu học sinh chuẩn bị báo cáo để thuyết phục giám đốc nhà máy X chọn dây chuyền B.
Kết luận chương 2
Trong chương này chúng tôi đã đề xuất được 4 biện pháp góp phần rèn luyện kĩ năng suy luận cho học sinh, đó là:
Biện pháp 1: Xây dựng hệ thống bài tập thống kê phù hợp với chương trình và đáp ứng yêu cầu rèn luyện kĩ năng suy luận thống kê.
Biện pháp 2: Rèn luyện cho học sinh kĩ năng suy luận thống kê từ thu thập và mô tả dữ liệu.
Biện pháp 3: Rèn luyện cho học sinh kĩ năng suy luận thống kê từ tổ chức và biểu diễn số liệu.
Biện pháp 4: Rèn luyện cho học sinh kĩ năng rút ra được các kết luận từ các tham số đặc trưng.