I. Phân tích sách giáo khoa đại số 10 nâng cao[SGKNC] [SGKNC]
A. Phần lý thuyết
Nội dung của chương thống kê được đề cập trong SGKNC gồm có 3 bài:
• Bài 1: Một vài khái niệm mở đầu
• Bài 2: Trình bày một mẫu số liệu.
• Bài 3: Các số đặc trưng của mẫu số liệu
1. Một vài khái niệm mở đầu 1.1Thống kê là gì?
Trước hết, SGKNC nêu lên sự phổ biến của các thông tin dưới dạng số liệu trong thực tiễn:
“Khi đọc một tờ báo, nghe một bản tin trên truyền hình,… chúng ta thường bắt gặp những con số thống kê.”
(SGKNC, tr.159)
Tiếp theo, SGKNC đưa ra một khái niệm cho phép hình dung các giai đoạn của quá trình nghiên cứu thống kê:
“Thống kê là khoa học về các phương pháp thu thập, tổ chức, trình bày, phân tích và xử lý số liệu.”
(SGKNC, tr.159)
Ngay sau đó, SGKNC còn nói thêm về tầm quan trọng của thống kê nói chung và của việc phân tích số liệu nói riêng:
“Thống kê giúp ta phân tích các số liệu một cách khách quan và rút ra các tri thức, thông tin chứa đựng trong các số liệu đó. Trên cơ sở này, chúng ta mới có thể đưa ra được những dự báo và quyết định đúng đắn.”
(SGKNC, tr.159)
1.2Mẫu số liệu
SGKNC nhắc lại một số khái niệm thống kê cơ bản mà học sinh đã học ở lớp 7 như dấu hiệu, đơn vị điều tra và giá trị của dấu hiệu thông qua một ví dụ.
Ví dụ: “Để điều tra về số học sinh trong mỗi lớp học ở cấp Trung học phổ thông (THPT) của Hà Nội, người điều tra đến một số lớp học và ghi lại sĩ số của mỗi lớp đó. Sau đây là một đoạn trích từ sổ công tác của người điều tra:
STT Lớp Số học sinh 1 2 3 4 5 6 7 8 9 10 10A 10B 10C 10D 10E 11A 11B 11C 11D 11E 47 55 48 50 50 45 53 48 54 55
Trong ví dụ trên, dấu hiệu X là số học sinh của mỗi lớp, đơn vị điều tra là một lớp học cấp THPT của Hà Nội, giá trị của dấu hiệu X (ký hiệu x) ở lớp 10A là 47, ở lớp 10B là 55,…”
(SGKNC, tr.159)
Về dấu hiệu, SGVNC có bổ sung:
“Trong chương trình THPT, chúng ta chỉ xét các dấu hiệu định lượng. Tuy nhiên, trên thực tế có nhiều cuộc điều tra mà dấu hiệu chỉ mang tính chất định tính (tức là không cân, đong, đo, đếm được).
Đối với dấu hiệu định tính, người ta không định nghĩa các số đặc trưng của mẫu số liệu như số trung bình, số trung vị, mốt, phương sai, độ lệch chuẩn. Để tiến hành phân tích thống kê các dấu hiệu định tính, ta cần phát triển một phương pháp khác với phương pháp dùng cho định lượng.”
(SGVNC, tr.218)
Mặc dù, chương trình không cho các mẫu số liệu có dấu hiệu định tính nhưng SGVNC cũng đã giải thích rõ trường hợp này thông qua hai ví dụ.
“Ví dụ 1:
Một cuộc thăm dò ý kiến về quy định bắt buộc đội mũ bảo hiểm được tiến hành.
Ở đây, đơn vị điều tra là những người sử dụng xe máy, dấu hiệu (ý kiến của người được hỏi) là dấu hiệu định tính. Các ý kiến trả lời có thể có bốn mức: hoàn toàn tán thành, tán thành, phản đối, cực lực phản đối.
Ví dụ 2:
Trước ngày bầu cử Quốc hội, người ta có thể thăm dò xem cử tri bỏ phiếu cho ba người nào trong số năm ứng cử viên A, B, C, D, E. Ở đây, đơn vị điều tra là cử tri, dấu hiệu (tên ba ứng cử viên mà người được hỏi sẽ bầu) cũng là dấu hiệu định tính.”
(SGVNC, tr.218)
Sau đó, SGKNC giới thiệu các khái niệm như mẫu, kích thước mẫu, mẫu số liệu, điều tra toàn bộ và điều tra mẫu.
“Một tập hợp con hữu hạn các đơn vị điều tra được gọi là một mẫu. Số phần
tử của một mẫu được gọi là kích thước mẫu. Các giá trị của dấu hiệu thu được trên
mẫu được gọi là một mẫu số liệu (mỗi giá trị như thế còn gọi là một số liệu của
mẫu).”
“Nếu thực hiện điều tra trên mọi đơn vị điều tra thì đó là điều tra toàn bộ.
Nếu chỉ điều tra trên một mẫu thì đó là điều tra mẫu.” (SGKNC, tr.160)
Về thuật ngữ “điều tra mẫu”, SGVNC có lưu ý: “Điều tra mẫu đôi khi còn gọi là điều tra đại diện.” (SGVNC, tr.217)
Tiếp sau đó, SGKNC đưa ra hoạt động 1 giúp học sinh nhận thấy một trong những lý do mà người ta không thể tiến hành điều tra toàn bộ, nói cách khác, phải điều tra mẫu.
H1: “Người điều tra phải kiểm định chất lượng của các hộp sữa của một nhà máy chế biến sữa bằng cách mở hộp sữa để kiểm tra. Có thể điều tra toàn bộ hay không?”
(SGKNC, tr.160)
Giải: “Không thể được, vì đơn vị điều tra bị phá hủy.” (SGVNC, tr.217)
Về vấn đề này, SGVNC có đề nghị giáo viên lấy thêm các ví dụ khác hoặc yêu cầu học sinh cho thêm ví dụ minh họa. SGVNC cũng đã gợi ý như: “kiểm tra chất lượng sản phẩm, kiểm tra hải quan,…” (SGVNC, tr.217)
Sau hoạt động 1, SGKNC giải thích cho việc tại sao người ta thường điều tra mẫu:
“Điều tra toàn bộ đôi khi không khả thi vì số lượng các đơn vị điều tra quá lớn hoặc vì khi muốn điều tra thì phải phá hủy đơn vị điều tra. Chúng ta thường chỉ điều tra mẫu và phân tích xử lý mẫu số liệu thu được.”
(SGKNC, tr.160)
Chúng tôi nhận thấy SGKNC chỉ đề cập đến khái niệm mẫu số liệu mà không đưa ra khái niệm mẫu ngẫu nhiên trong khi bản chất của tất cả các mẫu số liệu được giới thiệu trong SGKNC là các mẫu ngẫu nhiên. Tuy thế, SGVNC cũng đã đưa ra khái niệm này kèm theo những lời giải thích có liên quan:
“Như ta đã thấy trong đa số tình huống, việc điều tra toàn bộ là không khả thi mà cần điều tra mẫu. Trong thống kê, vấn đề chọn mẫu như thế nào là một vấn
đề rất quan trọng và cũng rất phong phú. Tùy thuộc vào tập hợp các đơn vị điều tra, đặc thù của dấu hiệu mà mẫu có thể được chọn theo nhiều phương pháp khác nhau nhằm đảm bảo tính đại diện của mẫu, tức là mẫu phải phản ánh tốt nhất, trung thực nhất toàn bộ tập hợp đơn vị điều tra.
Một cách chọn mẫu khá phổ biến là chọn mẫu ngẫu nhiên. Một cách chọn
mẫu gọi là ngẫu nhiên nếu mỗi đơn vị điều tra được chọn một cách độc lập và khả
năng được chọn như nhau. Một mẫu được chọn theo cách ngẫu nhiên như vậy gọi
là mẫu ngẫu nhiên.
Hiện nay, ở nhiều nước, việc lấy mẫu trong điều tra xã hội học rất phổ biến. Căn cứ trên việc phân tích các thông tin thu được trên mẫu người ta có thể suy
đoán ra một bức tranh cho toàn bộ tập hợp các đơn vị điều tra với độ chính xác
khá cao. Chẳng hạn, ngay trước một cuộc bầu cử tổng thống, người ta thăm dò ý kiến trên một mẫu 1000 người được chọn ngẫu nhiên. Khi đó, tỉ lệ cử tri bầu cho
ứng cử viên A trong mẫu này sẽ khá sát với tỉ lệ cử tri bầu cho ứng cử viên A khi cuộc bầu cử thực sự diễn ra.”
(SGVNC, tr.218)
Liên quan đến vấn đề điều tra mẫu, SGVNC còn nói thêm:
“Nói chung, việc điều tra toàn bộ là không khả thi nên thường phải điều tra
mẫu. Một trong những nhiệm vụ quan trọng nhất của khoa học thống kê là xây
dựng các phương pháp cho phép ta rút ra kết luận, lập các dự báo về toàn bộ các đơn vị điều tra dựa trên các thông tin thu được trên mẫu. Để có được các kết luận, dự báo chính xác thì việc chọn mẫu là rất quan trọng. Tuy nhiên SGKNC không
đề cập đến vấn đề này.” (SGVNC, tr.217)
Tuy SGKNC không đưa ra bất kỳ một hoạt động hay ví dụ nào về việc tiến hành điều tra thống kê nhưng trong phần gợi ý dạy học trên lớp, SGVNC đã nêu:
“Có thể phân công một số em tiến hành một cuộc điều tra bỏ túi (nhỏ) về
một vấn đề nào đó và lập bảng số liệu thống kê. Chẳng hạn như thống kê điểm của một bài kiểm tra của lớp, số giờ tự học của mỗi học sinh, chiều cao và cân nặng của các học sinh trong lớp,…”
(SGVNC, tr.217)
Ấy thế nhưng trong việc chọn mẫu để có thể kiểm tra chất lượng sản phẩm mà không phải làm hỏng nó đã không được đề cập đến.
Với những nội dung trình bày trong bài 1, ta thấy là học sinh đã được biết về sự cần thiết phải điều tra trên mẫu khi muốn nghiên cứu một tổng thể gồm nhiều đối tượng. Nhưng chọn mẫu như thế nào và ảnh hưởng của việc chọn đó lên kết quả ra sao là những câu hỏi không được trả lời.
2. Trình bày một mẫu số liệu
Nội dung gồm có:
- Bảng phân bố tần số-tần suất.
- Bảng phân bố tần số-tần suất ghép lớp. - Biểu đồ.
SGKNC bắt đầu bằng một ví dụ:
Ví dụ 1: “Khi điều tra về năng suất của một giống lúa mới, điều tra viên ghi lại năng suất (tạ/ha) của giống lúa đó trên 120 thửa ruộng có cùng diện tích 1ha. Xem xét mẫu số liệu này, điều tra viên nhận thấy:
10 thửa ruộng cùng có năng suất 30; 20 thửa ruộng cùng có năng suất 32; 30 thửa ruộng cùng có năng suất 34; 15 thửa ruộng cùng có năng suất 36; 10 thửa ruộng cùng có năng suất 38; 10 thửa ruộng cùng có năng suất 40; 5 thửa ruộng cùng có năng suất 42; 20 thửa ruộng cùng có năng suất 44.” (SGKNC, tr.161)
Sau đó, SGKNC ghi:
“Trong mẫu số liệu trên chỉ có tám giá trị khác nhau là: 30; 32; 34; 36; 38; 40; 42; 44. Mỗi giá trị này xuất hiện một số lần trong mẫu số liệu.”
(SGKNC, tr.162)
Như vậy, trong một mẫu số liệu cần phải xác định được các giá trị và số lần xuất hiện tương ứng.
Từ đó, SGKNC nhắc lại khái niệmtần số và bảng phân bố tần số (gọi tắt là
bảng tần số).
Đối với khái niệm tần số, SGKNC nêu:
“Số lần xuất hiện của mỗi giá trị trong mẫu số liệu được gọi là tần số của
giá trị đó.”
Còn đối với bảng tần số, SGKNC cho biết lý do cần phải đưa vào là để có thể trình bày gọn gàng mẫu số liệu.
Vì vậy, với mẫu số liệu của ví dụ 1 thì SGKNC đưa ra bảng sau:
Giá trị (x) 30 32 34 36 38 40 42 44
Tần số (n) 10 20 30 15 10 10 5 20 N = 120
Bảng 1
(SGKNC, tr.162)
Kế tiếp, SGKNC chỉ nêu “muốn biết trong 120 thửa ruộng, có bao nhiêu
phần trăm thửa ruộng có năng suất 30, 32,… ta sẽ phải tính thêm tần suất của mỗi
giá trị”, rồi giới thiệu khái niệm tần suất và bảng phân bố tần số-tần suất (gọi tắt là bảng tần số-tần suất).
Về khái niệm tần suất, SGKNC định nghĩa một cách tường minh rằng: “Tần suất fi của giá trị xi là tỉ số giữa tần số nivà kích thước mẫu N
fi = 𝑛𝑖
𝑁 .”
(SGKNC, tr.162)
SGKNC cũng lưu ý rằng “người ta thường viết tần suất dưới dạng phần trăm”.
Ở đây, SGKNC hoàn toàn không đề cập đến ý nghĩa của tần suất trong thống kê, cũng không đưa ra bất kỳ hoạt động hay ví dụ nào cho thấy điều đó.
Để có được bảng phân bố tần số-tần suất, SGKNC cho biết cần phải bổ sung thêm một hàng tần suất vào bảng 1. Cụ thể:
Giá trị 30 32 34 36 38 40 42 44
Tần số 10 20 30 15 10 10 5 20 N = 120
Tần suất % 8,3 16,7 25,0 12,5 8,3 8,3 4,2 16,7 Bảng 2
(SGKNC, tr.162)
Về bảng tần số-tần suất, SGKNC nêu lên hai chú ý:
“Trên hàng tần số, người ta thường dành một ô để ghi kích thước mẫu N. Kích thước mẫu N bằng tổng các tần số.
Có thể viết bảng tần số-tần suất dạng “ngang” (như bảng 2) thành bảng “dọc” (chuyển hàng thành cột như bảng 3).”
(SGKNC, tr.162)
SGVNC cũng có hai lưu ý:
“Trong bảng phân bố tần số-tần suất, các giá trị được sắp xếp theo thứ tự tăng dần.
Tổng số các giá trị ở hàng (cột) tần suất bằng 100%.” (SGVNC, tr.219)
Bảng 3 nói trên nằm trong hoạt động 1:
H1: “Thống kê điểm thi môn Toán trong kì thi vừa qua của 400 em học sinh cho ta bảng sau:
Điểm bài thi Tần số Tần suất %
0 1 2 3 4 5 6 7 8 9 10 … 15 43 53 85 … 55 33 18 10 10 1,50 3,75 10,75 13,25 21,25 18,00 … … … … … N = 400 Bảng 3
Điền tiếp các số vào các chỗ trống (…) ở cột tần số và tần suất trong bảng 3.”
Như vậy, SGKNC đưa vào hoạt động này ngoài mục đích minh họa cho chú ý thứ hai nêu trên còn để giúp học sinh rèn luyện việc sử dụng công thức tính tần suất.
2.2Bảng phân bố tần số-tần suất ghép lớp
SGKNC xuất phát từ ví dụ 2 để trình bày về việc phân lớp và đưa đến bảng tần số ghép lớp và bảng tần số-tần suất ghép lớp.
Ví dụ 2: “Chọn 36 học sinh nam của một trường THPT và đo chiều cao của họ, ta thu được mẫu số liệu sau (đơn vị: cm).
160 161 161 162 162 162 163 163 163 164 164 164 164 165 165 165 165 165 166 166 166 166 167 167 168 168 168 168 169 169 170 171 171 172 172 174.
Ở đây, ta ghép các số liệu trên thành năm lớp theo các đoạn có độ dài bằng nhau. Lớp thứ nhất gồm các học sinh có chiều cao nằm trong đoạn [160;162], lớp thứ hai gồm các học sinh có chiều cao nằm trong đoạn [163;165], … . Khi đó, ta sẽ có một bảng như sau: Lớp Tần số [160;162] [163;165] [166;168] [169;171] [172;174] 6 12 10 5 3 N = 36 Bảng 4
Bảng 4 được gọi là bảng phân bố tần số ghép lớp (gọi tắt là bảng tần số
ghép lớp).”
(SGKNC, tr.163) Tiếp theo, SGKNC ghi:
Lớp Tần số Tần suất(%) [160;162] [163;165] [166;168] [169;171] [172;174] 6 12 10 5 3 16,7 33,3 … … … N = 36 Bảng 5
Bảng 5 được gọi là bảng phân bố tần số-tần suất ghép lớp (gọi tắt là bảng
tần số-tần suất ghép lớp).” (SGKNC, tr.164)
Theo SGKNC, lý do thực hiện việc ghép số liệu thành các lớp là để trình bày mẫu số liệu (theo một tiêu chí nào đó) được gọn gàng, súc tích, nhất là khi có nhiều số liệu. Thế nhưng, kĩ thuật phân lớp mẫu số liệu không được nói đến, các lớp cần phân chia không những đều nhau mà còn được cho sẵn.
Đối với vấn đề này, SGVNC có ghi chú:
“Thông thường, trong bảng phân bố tần số ghép lớp, các khoảng (đoạn hoặc nửa khoảng) có độ dài bằng nhau (nhưng không bắt buộc như vậy).”
(SGVNC, tr.219)
Các khái niệm tần số, tần suất của mỗi lớp thì hoàn toàn không được định nghĩa một cách tường minh. SGKNC chỉ nói trong bảng 4, tần số của mỗi lớp là số học sinh trong lớp đó và cho kết quả tần suất của hai lớp đầu tiên trong bảng 5 rồi đề nghị thực hiện hoạt động 2 để hoàn tất bảng này.
Sau đó, SGKNC giới thiệu một cách phân lớp khác có sự liên tục giữa các lớp.
“Trong nhiều trường hợp, ta ghép lớp theo các nửa khoảng sao cho mút bên phải của một nửa khoảng cũng là mút bên trái của nửa khoảng tiếp theo. Chẳng hạn, trong ví dụ 2, ta có thể ghép các số liệu thành năm lớp với các nửa khoảng [159,5;162,5), [162,5;165,5),… . Ta có bảng sau
Lớp Tần số Tần suất(%) [159,5;162,5) [162,5;165,5) [165,5;168,5) [168,5;171,5) [171,5;174,5) 6 12 10 5 3 16,7 33,3 27,8 … … N = 36 Bảng 6” (SGKNC, tr.164)
Như vậy, SGKNC đã đưa ra hai cách phân lớp nhưng ưu nhược điểm của chúng thì không thấy quan tâm đến.
2.3Biểu đồ
Người ta cần sử dụng biểu đồ để trình bày mẫu số liệu một cách trực quan sinh động, dễ nhớ và gây ấn tượng. Về nội dung này, SGKNC đã đề cập đến một số biểu đồ thông dụng nhất như biểu đồ tần số, tần suất hình cột; đường gấp khúc tần số; tần suất và biểu đồ tần suất hình quạt.
2.3.1 Biểu đồ tần số, tần suất hình cột