MỘT SỐ CÔNG THỨC THỐNG KÊ CHỦ ĐỀ 1: XẾP ĐẶT DỮ KIỆN 1. Làm quen với các khái niệm a. Bảng phân bố tần số đơn i. Theo chiều dọc Điểm số Tần số 34 3 35 2 34 5 37 6 38 5 ii. Theo chiều ngang Điểm số 34 35 34 37 38 Tần số 3 2 5 6 5 b. Bảng phân bố tần số đẳng loại Đẳng loại Tần số 80 84 3 85 89 5 90 94 8 95 99 16 100 104 12 N = 44 Để lập bảng đẳng loại ta tiến hành theo các bước sau đây: Bước 1: Xác định Min, Max của các điểm số Bước 2: Tính hàng số = Max – Min Bước 3: Xác định cỡ đẳng loại (đề bài thường cho sẵn) Bước 4: Xác định số đẳng loại: Hàng số cỡ đẳng loại Bước 5: Ghi ra các đẳng loại, cần xác định ra đẳng loại đầu tiên (dựa vào Min và cỡ đẳng loại) Bước 6: Ghi tần số cho các đẳng loại vừa tìm được. c. Biên giới rời và biên giới liên tục Điểm số đó là một khoảng liên tục từ biên giới liên tục dưới đến biên giới liên tục trên của điểm số. Thí dụ đối với điểm số: Đối với điểm số 7 ta xem đó là một khoảng từ 6.5 đến 7.5. Ta thấy 6.5 là biên giới liên tục (BGLT) dưới của 7 và 7.5 là BGLT trên của 7. Thí dụ đối với đẳng loại: 20 – 24 ta coi đó là khoảng điểm số từ 19.5 đến 24.5. + 20 là biên giới rời dưới của đẳng loại + 24 là biên giới rời trên của đẳng loại + 19.5 là BGLT dưới của đẳng loại + 24.5 là BGLT trên của đẳng loại d. Tần số tích lũy (Cmf): gồm có tần số tích lũy kém và tần số tích lũy hơn. Tần số tích lũy kém được tính bằng cách cộng dồn các tần số từ trên xuống. Tần số tích lũy hơn được tính bằng cách ngược lại.
MỘT SỐ CÔNG THỨC THỐNG KÊ CHỦ ĐỀ 1: XẾP ĐẶT DỮ KIỆN 1. Làm quen với các khái niệm a. Bảng phân bố tần số đơn i. Theo chiều dọc Điểm số Tần số 34 3 35 2 34 5 37 6 38 5 ii. Theo chiều ngang Điểm số 34 35 34 37 38 Tần số 3 2 5 6 5 b. Bảng phân bố tần số đẳng loại Đẳng loại Tần số 80 - 84 3 85 - 89 5 90 - 94 8 95 - 99 16 100 - 104 12 N = 44 Để lập bảng đẳng loại ta tiến hành theo các bước sau đây: Bước 1: Xác định Min, Max của các điểm số Bước 2: Tính hàng số = Max – Min 1 Bước 3: Xác định cỡ đẳng loại (đề bài thường cho sẵn) Bước 4: Xác định số đẳng loại: Hàng số / cỡ đẳng loại Bước 5: Ghi ra các đẳng loại, cần xác định ra đẳng loại đầu tiên (dựa vào Min và cỡ đẳng loại) Bước 6: Ghi tần số cho các đẳng loại vừa tìm được. c. Biên giới rời và biên giới liên tục Điểm số đó là một khoảng liên tục từ biên giới liên tục dưới đến biên giới liên tục trên của điểm số. - Thí dụ đối với điểm số: Đối với điểm số 7 ta xem đó là một khoảng từ 6.5 đến 7.5. Ta thấy 6.5 là biên giới liên tục (BGLT) dưới của 7 và 7.5 là BGLT trên của 7. - Thí dụ đối với đẳng loại: 20 – 24 ta coi đó là khoảng điểm số từ 19.5 đến 24.5. + 20 là biên giới rời dưới của đẳng loại + 24 là biên giới rời trên của đẳng loại + 19.5 là BGLT dưới của đẳng loại + 24.5 là BGLT trên của đẳng loại d. Tần số tích lũy (Cmf): gồm có tần số tích lũy kém và tần số tích lũy hơn. Tần số tích lũy kém được tính bằng cách cộng dồn các tần số từ trên xuống. Tần số tích lũy hơn được tính bằng cách ngược lại. 2 Điểm số Tần số Cmf kém Cmf hơn 1 3 3 20 2 4 7 17 3 5 12 13 4 7 19 8 5 1 20 1 e. Tần số tương đối Ký hiệu là p còn gọi là tỉ lệ %. Tỉ lệ % tại một điểm số = f/N. Ví dụ: Ta có tổng N = 40. Điểm số 7 có 10 học sinh tần số tương đối của điểm số 7 là: 10/40 = 25%. f. Tần số tích lũy (kí hiệu là Cmp) Ta cần lập thêm cột p = , cột p%, Cmp kém và Cmp hơn. Cách tính Cmp kém và Cmp hơn tương tự như Cmf kém và hơn. CHỦ ĐỀ 2:CÁC SỐ ĐỊNH TÂM a. Số yếu vị (Mo: Mode) - Số yếu vị là số có tần số lớn nhất, kí hiệu là Mo - Số yếu vị cho ta biết đỉnh cao của phân bố. Nó là biểu hiện của số đông, của phong trào. Do đó, yếu vị cho biết khuynh hướng, điểm nhạy cảm của dữ kiện. * Để tính số yếu vị ta cần phải sắp xếp các điểm số thành bảng phân bố tần số đơn hay đẳng loại. Ghi chú các trường hợp sau: 1) Nếu hai số liền kề nhau mà có tần số bằng nhau và cao nhất thì Mo sẽ là trung bình cộng của hai số đó. 3 2) Nếu trong một phân bố có hai điểm số không liền kề nhau mà có tần số bằng nhau và cao nhất thì cả hai số đó đều là số yếu vị và ta gọi phân bố ấy có yếu vị đôi. 3) Đối với phân bố đẳng loại, ta xác định đẳng loại có tần số lớn nhất, Mo sẽ là trung điểm đẳng loại đó. b. Số trung vị Me (Median) Số trung vị, kí hiệu là Me trong một phân bố chia phân bố ấy ra thành hai nửa, mỗi nửa có số dữ kiện bằng nhau. Công dụng của số trung vị: Cần tính trị số trung điểm chính xác của phân số - điểm 50% - lúc ấy ta có thể chia phân bố làm hai phần: trên trung vị và dưới trung vị. Khi có những điểm số quá “cực đoan” (giá trị quá bé so với phần lớn các điểm số khác) làm ảnh hưởng tới số trung bình. * Để tính số trung vị ta có các trường hợp sau: i) Với dữ kiện rời có N điểm số sắp xếp thành một dãy là X 1 , X 2 , X 3 ,… X n ta làm như sau: 1) Sắp xếp các số này theo dãy tăng hay giảm dần 2) Tính 3) Trung vị nằm ở vị trí thứ của dãy số. Ta có hai trường hợp N là số lẻ, ví dụ có 5 điểm số (N=5) đã xếp theo thứ tự tăng: 3 4 5 6 7 , ta có vị trí của trung vị là (N + 1) : 2 = 3, suy ra vị trí thứ 3 của dãy là số 5, vậy Me=5 N là số chẵn, ví dụ ta có dãy gồm 4 điểm số (N=4) sắp xếp theo thứ tự tăng 2 3 4 5, vị trí của trung vị là (N + 1) : 2 = 2.5. Trung vị bây giờ sẽ là trung bình cộng của số ở vị trí thứ 2 và 3 → Me = (3 + 4) : 2 = 3.5 ii) Đối với phân bố tần số (đơn hay đẳng loại): 4 Với phân bố tần số đơn, chẳng hạn: X 16 18 22 25 26 29 30 34 38 41 F 3 5 9 11 15 20 18 14 11 6 Ta làm theo các bước sau: 1) Tính N bằng cách tính tích lũy kém hay hơn 2) Tính 3) Dò theo cột tần số tích lũy cho tới vị trí . Lấy ra số tại vị trí này Đáp số là: 29 (Vị trí (N + 1) : 2 là số 29 có tần số tích lũy là 63) Với bảng phân bố đẳng loại ví dụ: ∆ Bước 1: Định các biên giới liên tục. Tính tần số tích lũy kém hay hơn → ta biết được N Điểm số Tần số Biên giới liên tục dưới/trên Tần số tích lũy kém (Cmf “kém”) 19.5 20 - 24 2 2 24.5 25 - 29 8 10 29.5 30 - 34 12 22 34.5 35 - 39 21 43 39.5 40 - 44 29 72 44.5 45 - 49 32 104 5 49.5 50 - 54 30 134 54.5 55 - 59 27 161 59.5 ∆ Bước 2: Tính = ∆ Bước 3: Dựa theo Cmf kém ta xác định được vị trí N/2 là đẳng loại 45 – 49 ∆ Bước 4: Áp dụng công thức: Me = L+g Với L: là biên giới liên tục dưới của đẳng loại chứa trung vị g: cỡ đẳng loại F: Tần số tích lũy kém cho đến biên giới liên tục dưới (L) f m : tần số ở đẳng loại chứa trung vị Suy ra Me = =45.828 2. Số trung bình cộng - Khái niệm: Số trung bình cộng của một nhóm N điểm số là kết quả có được bằng cách cộng tất cả các giá trị của N điểm số rồi lấy tổng số chia cho N (N gọi là số phần tử của nhóm) - Công dụng: 6 + Giúp ta tìm một số định tâm ổn định và tiêu biểu cho khối dữ kiện. + Muốn so sánh đặc điểm của hai hay nhiều phân bố điểm số. + Số trung bình cộng được sử dụng khá phổ biến trong nghiên cứu giáo dục. Nó giúp ta mô tả khá tốt khối dữ kiện và đặc biệt thuận lợi khi cần so sánh khả năng, tính chất hay các biểu hiện tâm lý giữa các nhóm người. - Cách tính trung bình cộng: * i. Với N điểm số rời có giá trị X 1 , X 2, X 3 ,…X N * ii. Với N điểm số đã xếp thành phân bố tần số * Đối với bảng phân bố đẳng loại muốn tính trung bình cộng, trước tiên ta tính trung điểm của đẳng loại trước đặt là X, sau đó áp dụng công thức ii. CHỦ ĐỀ 3: CÁC SỐ ĐO ĐỘ PHÂN TÁN 3.1. Khái niệm hàng số và cách tính Hàng số là số đo khoảng cách giữa điểm số cao nhất và điểm số thấp nhất. Ví dụ cho dãy số 2, 3, 5, 6 thì hàng số bằng 6 – 2 = 4. 7 3.2. Các công thức tính độ lệch chuẩn cho dân số và mẫu a. Cho dân số i. Không có tần số ii. Có tần số b. Cho mẫu i. Không có tần số ii. Có tần số 2. Áp dụng giải bài tập Tính điểm trung bình và độ lệch chuẩn của một học sinh với các điểm số rời Toán: 9, Hóa: 10, Văn: 7, Sử: 9, Địa: 8, Anh văn: 9 X 9 8 10 7 9 8 9 X 2 81 64 100 49 81 64 81 8 Ta có: Mean = SD = = 0.976 CHỦ ĐỀ 4: TƯƠNG QUAN a. Mức độ tương quan có thể là: - Quan hệ 1 – 1, R=1 (tương quan hàm số, giá trị của hệ số tương quan = 1) - Không tương quan (giá trị tương quan = 0 hay xấp xỉ 0) - Hoặc thường thấy hơn: giá trị của hệ số tương quan ở mức giữa 0 và 1 (0<R<1) * Tương quan nghịch thì R < 0, tương quan thuận thì R > 0. Độ lớn của hệ số tương quan là một số thực nằm trong khoảng -1 đến 1. b. Hệ số tương quan tuyến tính, ký hiệu r - Công thức để tính r thường dùng: - Kiểm nghiệm hệ số tương quan * Giả thuyết: H 0 : R xy = 0 9 H 1 : R xy ≠ 0 α = 5% (giả sử) * Tra bảng giá trị tới hạn của R: Với df = N – 2 và α = 5% tra bảng trang 86 ta đọc được R α =? * Lưu ý các quy tắc quyết định: Nếu > : bác bỏ H 0 và chấp nhận H 1 Nếu ≤ : chấp nhận H 0 * Kết luận: Dựa vào các quy tắc quyết định đó ta khẳng định có tương quan hay không với mức xác suất là bao nhiêu. Hệ số tương quan là bao nhiêu chứng tỏ mức độ tương quan là như thế nào? Hệ số tương quan có các giới hạn sau: ♥ 0.9 trở lên là rất cao ♥ 0.8 - 0.9 cao ♥ 0.6 - 0.8 có tương quan vừa phải đến mức rõ rệt ♥ 0.7 – 0.8: khá cao ♥ 0.6 – 0.7: có tương quan vừa phải c. i. Hệ số tương quan thứ hạng (còn gọi là tương quan Spearman) Ký hiệu là ρ (đọc là rho) 10 [...]... Thậm chí trong một số trường hợp ta cần phải phối hợp tất cả các cách trên CHỦ ĐỀ 7: PHỎNG ĐỊNH TRỊ SỐ DÂN SỐ a Khái niệm Khoảng phỏng định là một khoảng mà người ta đưa ra với một mức độ tin tưởng định trước và hy vọng rằng trị số dân số rẽ rơi vào trong khoảng này b Công thức chung của khoảng phủ định Điểm phỏng định - ε < Trị số dân số < Điểm phỏng định + ε c Phỏng định số trung bình dân số i Trường... kiểm nghiệm một đuôi - Kiểm nghiệm hai đuôi là kiểm nghiệm đặt giả thuyết H 1 hai chiều (xem có khác biệt không) Ví dụ 1: H0: μ1 = μ2 H1: μ1 ≠ μ2 - Kiểm nghiệm một đuôi là kiểm nghiệm trong đó giả thuyết H 1 chỉ có một chiều Kiểm nghiệm một đuôi gồm đuôi dưới và đuôi trên Đuôi dưới: khi muốn chứng minh dân số bé hơn một trị số nào đó Đuôi trên khi muốn chứng minh trị số lớn hơn một trị số nào đó Ví... rằng mỗi phần tử trong dân số đều có cơ hội đồng đều nhau (khả năng được chọn là như nhau) b) Vấn đề sai số khi chọn mẫu: - Sai số chọn mẫu là loại sai lầm xảy ra do ta chỉ chọn 1 mẫu để nghiên cứu mà không tiến hành trên toàn dân số - “Sai số chọn mẫu” và “sai số không do chọn mẫu” hợp thành sai số toàn thể Mối liên hệ giữa chúng là ba cạnh của một tam giác vuông, trong đó sai số toàn thể là cạnh huyền... Khảo sát nhiều lần trên đối tượng hơn là một lần ♣ Tăng số phỏng vấn viên ♣ Cải tiến các bảng điều tra, dụng cụ đo lường, cách xử lý dữ kiện,… c) Một số phương pháp chọn mẫu thông dụng 15 i) Chọn mẫu ngẫu nhiên đơn giản (Áp dụng cho số phần tử trong dân số không lớn quá), có thể rút thăm, dùng bảng số ngẫu nhiên, dùng hàm số ngẫu nhiên ii) Chọn mẫu theo hệ thống Theo cách này, trước hết các phần tử... dân số là 150.43 < µ < 159.57 với độ tin cậy là 95% ii Trường hợp mẫu nhỏ (n < 30) Áp dụng công thức sau: 19 µ= t Trong đó: : trung bình mẫu; n: cỡ mẫu; s: độ lệch tiêu chuẩn của mẫu; t: trị số đọc ở bảng t ứng với độ tự do df = n -1 và mức ý nghĩa α = 1 - γ ( bằng cách tra bảng trang 85) Bài tập áp dụng: Một mẫu 16 người được chọn từ một dân số lớn được phân bố bình thường Điểm trung bình của họ về một. .. cho trung bình của dân số Giải Các dữ kiện của đề phù hợp với công thức tính khoảng phỏng định trung bình, trường hợp mẫu nhỏ Thay các trị số = 101.3; s = 18.8, n = 16 Trị số t được đọc trong bảng t với α = 0.02, df = 15 là 2.602 - Áp dụng công thức tính giới hạn trên = 101.3+2.602 113.529 - Giới hạn dưới = 101.3 - 2.602 = = 89.071 - Vậy khoảng phỏng định cho trung bình của dân số là: 89.1 < μ < 113.5... hay trung học, số học sinh mỗi lớp thường không bằng nhau nhưng số lượng này không chênh 17 nhau nhiều lắm ví dụ có lớp thường có số học sinh là 40, 39, 41, … do đó có thể áp dụng nhóm đồng cỡ, đơn vị chọn là lớp học Thí dụ: Ta cần có một mẫu 500 người lấy từ một dân số 10,000 người Ta chia dân số này thành 200 nhóm mỗi nhóm có 50 người Dùng lối chọn mẫu ngẫu nhiên lấy 10 nhóm trong số 200 nhóm Ta... dưới Đuôi trên H0: μ ≥ 120 H0: μ ≤ 120 H1: μ < 120 H1: μ >120 Áp dụng để giải một số bài tập: 24 1 Có hai ứng cử viên được đề cử ra để bầu một người vào chức Chủ tịch Hội đồng Quản trị của một công ty thương mại Để dự đoán xem người nào sẽ trúng cử, ban tổ chức đã chọn ngẫu nhiên một mẫu 80 nhân viên của công ty, sau đó phát một phiếu thăm dò với câu hỏi họ định bầu ai Ban tổ chức sau khi thu được phiếu... theo bậc lương, hay theo một thứ tự hợp lý nào đó xác định trước Giả sử trong dân số có N phần tử và ta muốn chọn 1 mẫu n Tỉ lệ chọn mẫu là f = , ta tìm số nguyên dương K sao cho ≈ sau đó bắt đầu từ một phần tử bất kỳ trong danh sách, cứ K phần tử thì chọn một để đưa vào mẫu Tiếp tục chọn cho đến hết danh sách Ví dụ áp dụng: Dân số N = 3849 cần mẫu có n = 300? Trước tiên, tính tỉ số 300/3849 = 1/12.83... bình dân số i Trường hợp chọn mẫu lớn (n ≥ 30) Công thức tính khoảng phỏng định: µ= Trong đó: : trung bình mẫu; n: cỡ mẫu; s: độ lệch tiêu chuẩn của mẫu; 18 Z: trị số đọc ở bảng Z với độ tin cậy cho trước Lưu ý: khoảng phỏng định trên chỉ áp dụng trong điều kiện: Dân số n rất lớn và mẫu n lớn (n ≥ 30) Bài tập áp dụng: Một mẫu 144 người được chọn từ một dân số rất lớn và thấy rằng chiều cao của nhóm này . tính Cmp kém và Cmp hơn tương tự như Cmf kém và hơn. CHỦ ĐỀ 2:CÁC SỐ ĐỊNH TÂM a. Số yếu vị (Mo: Mode) - Số yếu vị là số có tần số lớn nhất, kí hiệu là Mo - Số yếu vị cho ta biết đỉnh cao của phân