4. Tổ chức luận văn
3.2.2. Phân tích thực nghiệm 1
a) Phân tích tiên nghiệm Câu hỏi 1
Cho một bảng số liệu như sau. Hãy xác định số trung vị của mẫu số liệu bằng cách đánh dấu vào vị trí ô trong bảng (đánh dấu chéo 1 ô hoặc nhiều ô hoặc giữa hai, ba… ô liền nhau chứa số trung vị). Cho biết tại sao.
-5 -3 -7 -10 -5 1 0 -7 -10 -3
1 1 0 -3 -7 -10 -7 -5 -3 -5
-7 -10 0 -5 -3 -7 0 1 -10
Biến didactic và biến tình huống
V1:Đặc điểm các giá trị của mẫu dữ liệu Các giá trị có thể có của biến:
− Các giá trị chưa được sắp xếp thứ tự / các giá trị đã được sắp xếp theo thứ tự tăng dần (giảm dần).
− Các giá trị đôi một khác nhau / một số giá trị được lặp lại nhiều lần.
− Các giá trị được cung cấp đầy đủ / một số giá trị bị khuyết.
V2:Số giá trị của mẫu dữ liệu Các giá trị có thể có của biến:
− Số giá trị là số chẵn.
− Số giá trị là số lẻ.
− Số giá trị lớn, gây ảnh hưởng đến việc đếm.
− Số giá trị nhỏ, không mất thời gian cho việc đếm.
V3:Yêu cầu của bài toán Các giá trị có thể có của biến:
− Chỉ ra số trung vị là bao nhiêu.
− Đánh dấu vào giá trị có thể là số trung vị.
Trong câu hỏi 1, dữ liệu được cho dưới dạng bảng các giá trị rời rạc, chưa được sắp xếp theo trật tự tăng dần hoặc giảm dần, một số giá trị được lặp lại nhiều lần, số giá trị nhỏ và là số lẻ. Cách lựa chọn này giúp cho học sinh thuận tiện trong việc đếm số giá trị và sắp xếp lại theo thứ tự tăng dần (giảm dần).
Chúng tôi chọn cách xác định số trung vị bằng cách đánh dấu chéo vào vị trí ô chứa số trung vị trong bảng dữ liệu. Đây là tình huống không quen thuộc với HS, vì theo như phân tích trong chương 2, HS chỉ luyện tập với kiểu nhiệm vụ xác định số trung vị bằng cách đưa ra kết quả là con số có được từ công thức trong thuật toán. Kiểu nhiệm vụ này có thể sẽ khiến cho học sinh gắn liền số trung vị với vị trí chính
giữa11.Tức là nếu sau khi sắp xếp dãy dữ liệu theo thứ tự tăng (hoặc giảm) dần, nếu giá trị tại vị trí chính giữa và các vị trí liền trước, liền sau bằng nhau, thì trung vị vẫn được xem là giá trị ở vị trí chính giữa.
Trong câu hỏi này, chúng tôi muốn làm sáng tỏ nghi ngờ đó của mình, nên thay đổi yêu cầu bài toán, đưa học sinh vào tình huống phá vỡ hợp đồng: Hãy xác định số trung vị của mẫu số liệu bằng cách đánh dấu vào vị trí ô trong bảng (đánh dấu chéo 1 ô hoặc nhiều ô hoặc giữa hai, ba… ô liền nhau chứa số trung vị). Với yêu cầu này, học sinh cần hiểu rằng số trung vị không nhất thiết phải là giá trị tại vị trí chính giữa, mà chỉ là giá trị chia dữ liệu thành hai phần với số phần tử bằng nhau và thỏa điều kiện các giá trị trong mỗi phần hoặc cùng lớn hơn (có thể bằng), hoặc cùng nhỏ hơn (có thể bằng) số trung vị. Như vậy, khái niệm số trung vị và giá trị tại vị trí chính giữa là hai khái niệm khác nhau. Chúng chỉ trùng nhau khi giá trị tại vị trí chính giữa chỉ xuất hiện một lần trong mẫu dữ liệu.
Các chiến lược
Xét về mặt vị trí, chúng tôi chia nhóm chiến lược “vị trí chính giữa” thành hai chiến lược Svt_chưa_sx và Svt _sx .
Trong nhóm chiến lược này, số trung vị của mẫu dữ liệu gồm N giá trị là giá trị thứ N 1
2
+
(nếu N là số chẵn thì số trung vị là trung bình cộng của hai giá trị thứ N
2 và N
1
2 + ), tức là đồng nhất số trung vị là giá trị tại vị trí chính giữa. Hơn nữa, đối với chiến lược Svt_chưa_sx, HS không quan tâm đến tính thứ tự của các giá trị trong mẫu dữ liệu, và đối với chiến lược Svt _sx , HS sẽ sắp xếp các giá trị theo thứ tự tăng dần hoặc giảm dần trước khi xác định số trung vị.
Xét về mặt số lượng, chúng tôi có nhóm chiến lược số lượng Ssl
Trong nhóm chiến lược này, HS có thể cho rằng một mẫu số liệu chỉ có một số trung vị là “số ở chính giữa dãy”, hoặc cho rằng số trung vị của một mẫu dữ liệu không phải luôn luôn là “số ở chính giữa dãy”.
11Chúng tôi tạm gọi vị trí chính giữacủa dãy dữ liệu gồm n giá trị là vị trí thứ n 1
2 + nếu n lẻ, vị trí n 2 và n 1 2+ nếu n chẵn.
Xét về cách biểu diễn số liệu, chúng tôi có nhóm chiến lược biểu diễn dữ liệu Sbd
Trong nhóm chiến lược này, HS có thể biểu diễn dữ liệu dưới dạng “thô” (biểu diễn tường minh tất cả các giá trị) hoặc biểu diễn dưới dạng bảng tần số (hoặc bảng tần số ghép lớp) hoặc biểu diễn số liệu dưới dạng đồ thị.
Để giải quyết kiểu nhiệm vụ được đặt ra trong câu hỏi 1, HS không những chỉ sử dụng chiến lược thuộc một nhóm, mà còn có thể kết hợp các nhóm lại với nhau. Do đó, trong phân tích tiên nghiệm của mình, chúng tôi chỉ ra các chiến lược sau:
Bảng 3.2: Bảng các chiến lược có thể được HS sử dụng trong câu hỏi 1
CHIẾN
LƯỢC MÔ TẢ CHIẾN LƯỢC NHỮNG CÁI CÓ THỂ QUAN SÁT
Svt_chưa_sx − HS giữ nguyên bảng số liệu chưa sắp xếp thứ tự, xác định số trung vị là giá trị ở vị trí chính giữa mẫu số liệu.
Ochưa_sx1
N = 29 là số lẻ nên số trung vị là số liệu đứng thứ N 1 15
2
+ =
. Vậy số trung vị của mẫu số liệu là -7.
(HS đánh dấu số -7 ở ô thứ 15) Ochưa_sx2
HS xác định số trung vị như trên, nhưng đánh dấu số -7 ở tất cả các ô chứa số -7
Ochưa_sx3
Bảng số liệu đã cho gồm 3 hàng ngang. Tìm giá trị chính giữa của mỗi hàng và kết luận số trung vị của mỗi hàng riêng biệt.
-5 -3 -7 -10 -5 1 0 -7 -10 -3 1 1 0 -3 -7 -10 -7 -5 -3 -5 -7 -10 0 -5 -3 -7 0 1 -10 Svt _sx − HS sắp xếp các giá trị
theo thứ thự tăng dần (hoặc giảm dần), xác định số
Ovt_sx1
-10 -10 -10 -10 -10 -7 -7 -7 -7 -7 -7 -5 -5 -5 -5 -5 -3 -3
trung vị là giá trị ở chính giữa mẫu số liệu (theo thuật toán)
− Cách biểu diễn: Biểu diễn các giá trị ở dạng “thô” hoặc lập bảng tần số
-3 -3 -3 0 0 0 0 1 1 1 1
N = 29 là số lẻ nên số trung vị là số liệu đứng thứ N 1 15
2
+ =
. Vậy số trung vị của mẫu số liệu là -5.
(HS đánh dấu vào 1 ô chứa số -5, hoặc khoanh tròn số -5 đứng ở vị trí thứ 15 trên bảng giá trị vừa sắp xếp)
Ovt_sx2
HS trình bày như trên, nhưng đánh dấu vào tất cả các ô chứa số -5 trong bảng số liệu ban đầu.
Ovt_sx3 Lập bảng phân bố tần số Giá trị Tần số -10 5 -7 6 -5 5 -3 5 0 4 1 4 Tổng cộng 29 Vị trí số trung vị là N 1 15 2 + = Số trung vị là: -5 Ovt_sx4 HS cũng lập bảng phân bố tần số, xác định vị trí số trung vị như trên, nhưng dựa vào bảng số liệu ban đầu và chỉ ra số trung vị là -7 (số ở vị trí thứ 15)
Sgtkn − Xác định các giá trị khác nhau của mẫu số liệu. Số trung vị của mẫu số liệu đã cho là số trung vị của mẫu số liệu gồm các giá trị khác nhau đó.
Ogtkn1
Sắp xếp các giá trị khác nhau trong bảng theo thứ tự từ bé đến lớn:
-10; -7; -5; -3; 0; 1
Số các giá trị trong dãy trên là 6. Vậy số trung vị nằm ở vị trí 3 và 4, tức là giá trị -5 và -3.
(HS đánh dấu tất cả các ô chứa số -5 và -3 trong bảng số liệu)
Ogtkn2:
Sắp xếp các giá trị khác nhau trong bảng theo thứ tự từ bé đến lớn: -10; -7; -5; -3; 0; 1 Số trung vị: ( ) e 5 3 M 4 2 − + − = = − Hàng 1: e1 5 1 M 2 2 − + = = − Hàng 2: e2 7 10 M 8 5 2 , − − = = − Hàng 3: Me3 = −3 Ogtkn3: Sử dụng bảng tần số -10 -7 -5 -3 0 1 Số lần xuất hiện 5 6 5 5 4 4 Số trung vị là số -5 và -3
Câu hỏi 2
Có 20 học sinh tham gia cuộc thi bơi lội cấp thành phố. Người ta chọn 10 học sinh (theo điểm từ cao xuống thấp) để trao giải. Bảng điểm của các học sinh như sau:
18 12 19 10 17 20 15 18 9 15 17 12
16 10 …(còn tiếp)
Số trung vị của mẫu dữ liệu là 17. Em Nam có số điểm là 16 thì có thể đạt giải không? Vì sao?
Biến didactic và biến tình huống
Câu hỏi này không yêu cầu tính số trung vị mà mục đích hướng vào việc hiểu ý nghĩa số trung vị. Chúng tôi muốn tìm hiểu xem khái niệm số trung vị tồn tại như thế nào trong quan niệm của học sinh? Phải chăng nó chỉ đơn thuần là một số thực có được từ thuật toán? Nó có mối liên hệ như thế nào với các giá trị còn lại của mẫu?
Với mục đích này, chúng tôi chọn một mẫu dữ liệu bị khuyết giá trị mặc dù biết trước số trung vị và số giá trị của mẫu. Đây là môi trường thuận lợi để số trung vị thể hiện vai trò định tâm của mình, bởi vì việc tính trung bình và mốt là không thể.
Số giá trị của mẫu được chọn là số chẵn, “nhỏ” (20 giá trị), không gây khó khăn cho việc đếm số lần xuất hiện của các giá trị. Yêu cầu của bài toán là trao giải cho 10 HS theo điểm từ cao xuống thấp buộc HS phải chú ý đến thứ tự của các giá trị trong mẫu. Điều này nhằm mục đích loại bỏ chiến lược Svt_chưa_sx ở câu 1 (hoặc các chiến lược liên quan đến việc HS không quan tâm đến tính thứ tự của các giá trị trong mẫu).
Ngoài các biến V1, V2, V3 như trong câu hỏi 1, trong câu 2 còn có thêm các biến sau:
V4: Sự “đầy đủ” của mẫu số liệu: Có thể biết được tất cả các giá trị khác nhau của dữ liệu hay không.
V5: Sự phân bố của dữ liệu bị khuyết Các giá trị có thể có của biến:
− Phân bố “bên trên” số trung vị (lớn hơn số trung vị)
− Phân bố “hai bên” số trung vị (một số giá trị nhỏ hơn số trung vị, một số giá trị lớn hơn số trung vị).
V6:Số trung vị
Các giá trị có thể có của biến:
− Số trung vị là một giá trị xuất hiện hay không xuất hiện trong mẫu dữ liệu cho trước.
− Số trung vị của mẫu dữ liệu lớn hơn (hay nhỏ hơn) số điểm của em Nam. Ở đây, chúng tôi chọn số trung vị là giá trị xuất hiện trong mẫu dữ liệu cho trước, và các dữ liệu khuyết phân bố “hai bên” số trung vị.
Đối với biến V5, nếu dữ liệu bị khuyết phân bố “bên dưới” hoặc “bên trên” số trung vị thì học sinh dễ dàng thực hiện phép đếm để đưa ra câu trả lời.
Ví dụ: 18 12 19 19 17 20 18 18 19 15 17
19 19 10 …(còn tiếp)
Trong ví dụ này thì dữ liệu bị khuyết chủ yếu là các giá trị nhỏ hơn số trung vị, nên HS có thể dễ dàng thực hiện phép đếm và xác định HS có điểm 16 không thuộc nhóm 10 HS có điểm cao nhất. Như vậy, vai trò của số trung vị hoàn toàn mờ nhạt.
Đối với biến V6, số trung vị được chọn là một giá trị xuất hiện trong mẫu số liệu (17) và lớn hơn số điểm của em Nam (16). Một trong vấn đề chúng tôi phân vân khi chọn giá trị cho biến V6 là mối quan hệ giữa “số HS được chọn để trao giải” (10 HS) và số trung vị. HS có quan tâm đến việc chọn 10 HS để trao giải chính là 50% số lượng HS của mẫu, và số trung vị là giá trị mà 50% số giá trị của mẫu số liệu lớn hơn hoặc bằng nó? Hay HS chỉ quan tâm đến việc so sánh số trung vị và điểm của em Nam để kết luận.
Với những băn khoăn trên, chúng tôi đã tiến hành một thực nghiệm nhỏ trên 43 HS lớp 10 thuộc trường THPT chuyên Trần Đại Nghĩa, Quận 1, TP. Hồ Chí Minh với câu hỏi như sau:
Có 25 học sinh tham gia cuộc thi bơi lội cấp thành phố. Người ta chọn 10 HS (theo điểm từ cao xuống thấp) để trao giải. Bảng điểm của các học sinh như sau:
18 12 19 10 17 20 15 18 17 15 17 17
17 10 …(còn tiếp)
Số trung vị của mẫu dữ liệu là 17. Em Nhân có số điểm là 16 thì có thể đạt giải không? Vì sao?
Trong thực nghiệm này (tạm gọi là thực nghiệm A), chúng tôi chọn số giá trị của mẫu là số lẻ (25 HS), số trung vị lớn hơn số điểm của HS cần xét (em Nhân), số HS được chọn để trao giải thuộc 50% số HS có điểm lớn hơn số trung vị (10HS, điểm khác biệt so với câu hỏi 2 là số HS được chọn để trao giải ở câu hỏi 2 chiếm 50% số HS tham gia). Đối với biến V5, chúng tôi chọn giá trị bị khuyết “hai bên” số trung vị (1 giá trị “bên trên” và 11 giá trị “bên dưới” số trung vị)12
.
Hình thức thực nghiệm đối với thực nghiệm A: Sau khi HS học xong lý thuyết phần “Số trung vị”, HS sẽ làm bài cá nhân trên giấy trong thời gian 7 phút. Trong quá trình giảng dạy lý thuyết số trung vị, chúng tôi đã nhấn mạnh đến tính thứ tự của các giá trị của mẫu khi thực hiện thuật toán tìm số trung vị và đã cung cấp cho HS ý nghĩa YN1 của số trung vị.
Kết quả thu nhận được sau khi phân tích sản phẩm của HS như sau:
Chiến lược được HS ưu tiên sử dụng: Xác định vị trí số trung vị trong
mẫu số liệu là 13. Sau đó, dùng YN1 của số trung vị xác định HS đạt 16 điểm không thuộc nhóm 10 HS có điểm cao nhất.
(Xem thêm sản phẩm của HS ở phần phụ lục_Phụ lục 3)
100% HS có đáp án: “Nhân không đạt giải”. Mặc dù những lời giải thích
có thể khác nhau (khoảng 05/43 HS có lời giải thích chưa rõ ràng), nhưng các HS đều vận dụng YN1 để xác định 10 HS đạt giải phải có điểm cao hơn hoặc bằng số trung vị (17 điểm). Như vậy, về cơ bản thì HS đã lĩnh hội được YN1 của số trung vị. Từ đây, chúng tôi tin rằng nếu HS được tiếp cận với YN1 của số trung vị thì họ có thể đưa ra câu trả lời đúng cho thực nghiệm 2.
12Khi thực hiện thực nghiệm này, chúng tôi chưa chú ý đến việc cân bằng số lượng các giá trị bị khuyết đều cả “hai bên” số trung vị, nên trong câu hỏi 2 của thực nghiệm 1, chúng tôi đã có sự điều chỉnh vấn đề này.
Sau khi phân tích các sản phẩm của HS đối với thực nghiệm A, chúng tôi điều chỉnh các giá trị của biến V2, V5 nhằm hoàn thiện hơn câu hỏi thực nghiệm, đồng thời tạo sự phong phú hơn cho kết quả thực nghiệm.
Các chiến lược
Đối với câu hỏi 2, chúng tôi phân chia các chiến lược như sau:
o Chiến lược sử dụng định nghĩa Sđn: Số trung vị của mẫu dữ liệu là 17, tức là có 50% số HS (10 HS) có số điểm lớn hơn hoặc bằng 17. Em Nam có điểm số là 16 nên không thuộc nhóm 10 HS có điểm cao nhất. Do đó, em Nam không đạt giải.
o Chiến lược “số trung vị là chuẩn” Schuẩn: HS đạt giải phải có điểm số từ 17 trở lên, do đó em Nam không đạt giải.