1. Trang chủ
  2. » Giáo Dục - Đào Tạo

MỘT SỐ CÔNG THỨC THỐNG KÊ

28 12,5K 6
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 28
Dung lượng 297 KB

Nội dung

MỘT SỐ CÔNG THỨC THỐNG KÊ CHỦ ĐỀ 1: XẾP ĐẶT DỮ KIỆN 1. Làm quen với các khái niệm a. Bảng phân bố tần số đơn i. Theo chiều dọc Điểm số Tần số 34 3 35 2 34 5 37 6 38 5 ii. Theo chiều ngang Điểm số 34 35 34 37 38 Tần số 3 2 5 6 5 b. Bảng phân bố tần số đẳng loại Đẳng loại Tần số 80 84 3 85 89 5 90 94 8 95 99 16 100 104 12 N = 44 Để lập bảng đẳng loại ta tiến hành theo các bước sau đây: Bước 1: Xác định Min, Max của các điểm số Bước 2: Tính hàng số = Max – Min Bước 3: Xác định cỡ đẳng loại (đề bài thường cho sẵn) Bước 4: Xác định số đẳng loại: Hàng số cỡ đẳng loại Bước 5: Ghi ra các đẳng loại, cần xác định ra đẳng loại đầu tiên (dựa vào Min và cỡ đẳng loại) Bước 6: Ghi tần số cho các đẳng loại vừa tìm được. c. Biên giới rời và biên giới liên tục Điểm số đó là một khoảng liên tục từ biên giới liên tục dưới đến biên giới liên tục trên của điểm số. Thí dụ đối với điểm số: Đối với điểm số 7 ta xem đó là một khoảng từ 6.5 đến 7.5. Ta thấy 6.5 là biên giới liên tục (BGLT) dưới của 7 và 7.5 là BGLT trên của 7. Thí dụ đối với đẳng loại: 20 – 24 ta coi đó là khoảng điểm số từ 19.5 đến 24.5. + 20 là biên giới rời dưới của đẳng loại + 24 là biên giới rời trên của đẳng loại + 19.5 là BGLT dưới của đẳng loại + 24.5 là BGLT trên của đẳng loại d. Tần số tích lũy (Cmf): gồm có tần số tích lũy kém và tần số tích lũy hơn. Tần số tích lũy kém được tính bằng cách cộng dồn các tần số từ trên xuống. Tần số tích lũy hơn được tính bằng cách ngược lại.

Trang 1

Để lập bảng đẳng loại ta tiến hành theo các bước sau đây:

Bước 1: Xác định Min, Max của các điểm số

Bước 2: Tính hàng số = Max – Min

Trang 2

Bước 3: Xác định cỡ đẳng loại (đề bài thường cho sẵn)

Bước 4: Xác định số đẳng loại: Hàng số / cỡ đẳng loại

Bước 5: Ghi ra các đẳng loại, cần xác định ra đẳng loại đầu tiên (dựa vào Min và cỡ đẳng loại)

Bước 6: Ghi tần số cho các đẳng loại vừa tìm được

c Biên giới rời và biên giới liên tục

Điểm số đó là một khoảng liên tục từ biên giới liên tục dưới đến biên giới liên tục trên của điểm số

- Thí dụ đối với điểm số: Đối với điểm số 7 ta xem đó là một khoảng từ 6.5 đến 7.5 Ta thấy 6.5 là biên giới liên tục (BGLT) dưới của 7 và 7.5 là BGLT trên của 7

- Thí dụ đối với đẳng loại: 20 – 24 ta coi đó là khoảng điểm số

từ 19.5 đến 24.5

+ 20 là biên giới rời dưới của đẳng loại

+ 24 là biên giới rời trên của đẳng loại

+ 19.5 là BGLT dưới của đẳng loại

+ 24.5 là BGLT trên của đẳng loại

d Tần số tích lũy (Cmf): gồm có tần số tích lũy kém và tần số tích lũy hơn Tần số tích lũy kém được tính bằng cách cộng dồn các tần số từ trên xuống Tần số tích lũy hơn được tính bằng cách ngược lại

Trang 3

Ký hiệu là p còn gọi là tỉ lệ % Tỉ lệ % tại một điểm số = f/N.

Ví dụ: Ta có tổng N = 40 Điểm số 7 có 10 học sinh tần số tương đối của điểm số 7 là: 10/40 = 25%

f Tần số tích lũy (kí hiệu là Cmp)

Ta cần lập thêm cột p = , cột p%, Cmp kém và Cmp hơn Cách tính Cmp kém và Cmp hơn tương tự như Cmf kém và hơn

CHỦ ĐỀ 2:CÁC SỐ ĐỊNH TÂM

a Số yếu vị (Mo: Mode)

- Số yếu vị là số có tần số lớn nhất, kí hiệu là Mo

- Số yếu vị cho ta biết đỉnh cao của phân bố Nó là biểu hiện của

số đông, của phong trào Do đó, yếu vị cho biết khuynh hướng, điểm nhạy cảm của dữ kiện

* Để tính số yếu vị ta cần phải sắp xếp các điểm số thành bảng

phân bố tần số đơn hay đẳng loại Ghi chú các trường hợp sau:

1) Nếu hai số liền kề nhau mà có tần số bằng nhau và cao nhất thì

Mo sẽ là trung bình cộng của hai số đó.

Trang 4

2) Nếu trong một phân bố có hai điểm số không liền kề nhau mà

có tần số bằng nhau và cao nhất thì cả hai số đó đều là số yếu

vị và ta gọi phân bố ấy có yếu vị đôi

3) Đối với phân bố đẳng loại, ta xác định đẳng loại có tần số lớn nhất, Mo sẽ là trung điểm đẳng loại đó.

b Số trung vị Me (Median)

Số trung vị, kí hiệu là Me trong một phân bố chia phân bố ấy ra thành hai nửa, mỗi nửa có số dữ kiện bằng nhau

Công dụng của số trung vị:

Cần tính trị số trung điểm chính xác của phân số - điểm 50% - lúc ấy ta có thể chia phân bố làm hai phần: trên trung vị và dưới trung vị

Khi có những điểm số quá “cực đoan” (giá trị quá bé so với phần lớn các điểm số khác) làm ảnh hưởng tới số trung bình

* Để tính số trung vị ta có các trường hợp sau:

i) Với dữ kiện rời có N điểm số sắp xếp thành một dãy là X1, X2, X3,… Xn ta làm như sau:

1) Sắp xếp các số này theo dãy tăng hay giảm dần

2) Tính

3) Trung vị nằm ở vị trí thứ của dãy số Ta có hai trường hợp

 N là số lẻ, ví dụ có 5 điểm số (N=5) đã xếp theo thứ tự tăng: 3 4

5 6 7 , ta có vị trí của trung vị là (N + 1) : 2 = 3, suy ra vị trí thứ

3 của dãy là số 5, vậy Me=5

 N là số chẵn, ví dụ ta có dãy gồm 4 điểm số (N=4) sắp xếp theo thứ tự tăng 2 3 4 5, vị trí của trung vị là (N + 1) : 2 = 2.5 Trung

vị bây giờ sẽ là trung bình cộng của số ở vị trí thứ 2 và 3 → Me

= (3 + 4) : 2 = 3.5

ii) Đối với phân bố tần số (đơn hay đẳng loại):

Trang 5

 Với phân bố tần số đơn, chẳng hạn:

Ta làm theo các bước sau:

1) Tính N bằng cách tính tích lũy kém hay hơn

2) Tính

3) Dò theo cột tần số tích lũy cho tới vị trí Lấy ra số tại vị trí này

Đáp số là: 29 (Vị trí (N + 1) : 2 là số 29 có tần số tích lũy là 63)

 Với bảng phân bố đẳng loại ví dụ:

∆ Bước 1: Định các biên giới liên tục Tính tần số tích lũy kém hay hơn → ta biết được N

Điểm số Tần số Biên giới liên

tục dưới/trên

Tần số tích lũy kém (Cmf “kém”)

Trang 6

F: Tần số tích lũy kém cho đến biên giới liên tục dưới (L)

f m : tần số ở đẳng loại chứa trung vị

2 Số trung bình cộng

- Khái niệm: Số trung bình cộng của một nhóm N điểm số là kết quả có được bằng cách cộng tất cả các giá trị của N điểm số rồi lấy tổng số chia cho N (N gọi là số phần tử của nhóm)

- Công dụng:

Trang 7

+ Giúp ta tìm một số định tâm ổn định và tiêu biểu cho khối dữ kiện.

+ Muốn so sánh đặc điểm của hai hay nhiều phân bố điểm số.+ Số trung bình cộng được sử dụng khá phổ biến trong nghiên cứu giáo dục Nó giúp ta mô tả khá tốt khối dữ kiện và đặc biệt thuận lợi khi cần so sánh khả năng, tính chất hay các biểu hiện tâm lý giữa các nhóm người

- Cách tính trung bình cộng:

* i Với N điểm số rời có giá trị X1, X2, X3,…XN

* ii Với N điểm số đã xếp thành phân bố tần số

* Đối với bảng phân bố đẳng loại muốn tính trung bình cộng, trước tiên ta tính trung điểm của đẳng loại trước đặt là X, sau đó

Trang 8

3.2 Các công thức tính độ lệch chuẩn cho dân số và mẫu

Trang 9

- Không tương quan (giá trị tương quan = 0 hay xấp xỉ 0)

- Hoặc thường thấy hơn: giá trị của hệ số tương quan ở mức giữa

0 và 1 (0<R<1)

* Tương quan nghịch thì R < 0, tương quan thuận thì R > 0 Độ lớn của hệ số tương quan là một số thực nằm trong khoảng -1 đến 1

b Hệ số tương quan tuyến tính, ký hiệu r

- Công thức để tính r thường dùng:

- Kiểm nghiệm hệ số tương quan

* Giả thuyết:

H0: Rxy = 0

Trang 10

H1: Rxy ≠ 0

α = 5% (giả sử)

* Tra bảng giá trị tới hạn của R:

Với df = N – 2 và α = 5% tra bảng trang 86 ta đọc được Rα=?

* Lưu ý các quy tắc quyết định:

Nếu > : bác bỏ H0 và chấp nhận H1

Nếu ≤ : chấp nhận H0

* Kết luận: Dựa vào các quy tắc quyết định đó ta khẳng định có tương quan hay không với mức xác suất là bao nhiêu Hệ số tương quan là bao nhiêu chứng tỏ mức độ tương quan là như thế nào?

Hệ số tương quan có các giới hạn sau:

Trang 11

α = 5% (ví dụ)

Trang 12

Tra bảng giá trị tới hạn của ρ (trang số 88): Với N = 10 và α = 5% ta đọc được ρα = 0.649

Lưu ý các quy tắc quyết định:

ρ > ρα: bác bỏ H0 chấp nhận H1

ρ ≤ ρα: bác bỏ H1 chấp nhận HQuyết định vì ρ = 0.76 > ρα = 0.649 nên ta bác bỏ H0 nhận H1 Kết luận: Có tương quan ở mức xác suất ý nghĩa 5% giữa điểm

số môn 1 và môn 2 Hệ số tương quan 0.76 cho thấy mức độ tương quan là khá cao

Chú ý: Đối với các trường hợp đồng điểm giữa các học sinh, ta sắp xếp hạng A bình thường, hạng B bình thường (không được xếp đồng hạng) lập cột RA, RB (nếu đồng hạng lấy trung bình cộng các thứ hạng bình thường của thứ hạng đó, còn không giữ nguyên), sau đó làm bình thường

Trang 13

MSSV Test

A

Test B

Hạng

A BT

Hạng

B BT

Trang 14

2 Vùng dưới tuyến bình thường – phân bố bình thường tiêu chuẩn

Công thức

Trong đó: μ: điểm trung bình

σ : độ lệch chuẩnBài tập ví dụ:

a Tính diện tích (Z = 0.76 → Z = 1.96)

(Chú ý xem bảng trang 84)

Ta có diện tích này bằng: DT (Z=0 → Z=1.96) – DT (Z=0 → Z=0.76) = 0.4750 – 0.2764 = 0.1986

CHỦ ĐỀ 6: CHỌN MẪU

a) Nguyên tắc chung của việc chọn mẫu:

Trang 15

- Tính khách quan: những chủ thể đưa vào mẫu hoàn toàn theo lối vô tư, không theo ý muốn chủ quan của người nghiên cứu.

- Phải bảo đảm rằng mỗi phần tử trong dân số đều có cơ hội đồng đều nhau (khả năng được chọn là như nhau)

b) Vấn đề sai số khi chọn mẫu:

- Sai số chọn mẫu là loại sai lầm xảy ra do ta chỉ chọn 1 mẫu để nghiên cứu mà không tiến hành trên toàn dân số

- “Sai số chọn mẫu” và “sai số không do chọn mẫu” hợp thành sai số toàn thể Mối liên hệ giữa chúng là ba cạnh của một tam giác vuông, trong đó sai số toàn thể là cạnh huyền Ta không thể triệt tiêu một sai số nào nhưng có thể làm giảm tối đa tùy theo các điều kiện, khả năng cho phép của một cuộc nghiên cứu

- Giảm sai số chọn mẫu bằng cách:

♣ Tăng thêm đơn vị chọn mẫu (tức là tăng số n nhưng không thể tăng lên vô hạn)

♣ Thay đổi phương pháp chọn mẫu hoặc phối hợp nhiều phương pháp nhằm tăng hiệu quả chọn mẫu

- Giảm sai số không do chọn mẫu bằng cách:

♣ Khảo sát nhiều lần trên đối tượng hơn là một lần

Trang 16

i) Chọn mẫu ngẫu nhiên đơn giản

(Áp dụng cho số phần tử trong dân số không lớn quá), có thể rút thăm, dùng bảng số ngẫu nhiên, dùng hàm số ngẫu nhiên.

ii) Chọn mẫu theo hệ thống

Theo cách này, trước hết các phần tử được sắp xếp theo danh sách có thứ tự theo vần A, B, C, D,… hoặc xếp theo bậc lương, hay theo một thứ tự hợp lý nào đó xác định trước

Giả sử trong dân số có N phần tử và ta muốn chọn 1 mẫu n Tỉ lệ chọn mẫu là f = , ta tìm số nguyên dương K sao cho ≈

sau đó bắt đầu từ một phần tử bất kỳ trong danh sách, cứ K phần

tử thì chọn một để đưa vào mẫu Tiếp tục chọn cho đến hết danh sách

Ví dụ áp dụng: Dân số N = 3849 cần mẫu có n = 300?

Trước tiên, tính tỉ số 300/3849 = 1/12.83 ⇒ k = 12 (lấy phần nguyên)

iii) Chọn mẫu tỉ lệ theo tầng lớp

Dân số N được chia ra nhiều tầng lớp,… mỗi tầng lớp, mỗi tầng lớp có Nk phần tử Tỉ lệ = Nk/N

Cỡ của mẫu bằng n và ta muốn trong mẫu cũng cóa đủ các tầng lớp nêu trên với tỉ lệ giống như trong dân số thì:

n k = n *

Trang 17

Ví dụ áp dụng: Trường A có số học sinh là 3356 học sinh có các

khoa là Công nghệ thông tin, Vật lý, Hóa học với số học sinh lần lượt là 981, 1266, 1109 Cần lấy 300 sinh viên tham dự Hội

thảo Hỏi phải làm thế nào

GiảiTóm tắt: N = 3356, N1 = 981, N2 = 1266, N3 = 1109

Lập tỉ lệ Nk/N ta có tỉ lệ số học sinh từng khoa như sau:

- Khoa Công nghệ thông tin = 981/3356 = 29,2%

d) Bổ sung về phương pháp chọn mẫu

Với lối chọn mẫu ngẫu nhiên, ta sẽ gặp trở ngại khi dân số khá lớn, ta sẽ mất nhiều thời gian Dựa vào tính chất “nhóm” vốn có trong tổ chức hành chính, trường học Để đơn giản, ta chỉ xét trường hợp nhóm đồng cỡ hoặc có thể xem là đồng cỡ

Chẳng hạn: ở các lớp tiểu học hay trung học, số học sinh mỗi lớp thường không bằng nhau nhưng số lượng này không chênh

Trang 18

nhau nhiều lắm ví dụ có lớp thường có số học sinh là 40, 39, 41,

… do đó có thể áp dụng nhóm đồng cỡ, đơn vị chọn là lớp học

Thí dụ: Ta cần có một mẫu 500 người lấy từ một dân số 10,000 người Ta chia dân số này thành 200 nhóm mỗi nhóm có 50 người Dùng lối chọn mẫu ngẫu nhiên lấy 10 nhóm trong số 200 nhóm Ta có 10 nhóm* 50 người = 500 người

→ Thậm chí trong một số trường hợp ta cần phải phối hợp tất cả các cách trên

CHỦ ĐỀ 7: PHỎNG ĐỊNH TRỊ SỐ DÂN SỐ

a Khái niệm

Khoảng phỏng định là một khoảng mà người ta đưa ra với một mức độ tin tưởng định trước và hy vọng rằng trị số dân số rẽ rơi vào trong khoảng này

b Công thức chung của khoảng phủ định

Điểm phỏng định - ε < Trị số dân số < Điểm phỏng định + ε

Trang 19

Z: trị số đọc ở bảng Z với độ tin cậy cho trước

Lưu ý: khoảng phỏng định trên chỉ áp dụng trong điều kiện: Dân

- Tính biên giới liên tục trên = 155 + 1.96 = 159.573

- Biên giới liên tục dưới = 155 – 1.96

Kết luận: Khoảng phỏng định cho trung bình chiều cao dân số là 150.43 < µ < 159.57 với độ tin cậy là 95%

ii Trường hợp mẫu nhỏ (n < 30)

Áp dụng công thức sau:

Trang 20

- Vậy khoảng phỏng định cho trung bình của dân số là:

89.1 < μ < 113.5 với độ tin cậy là 98%

Trang 21

Áp dụng công thức sau đây:

p = ± Z.

Trang 22

Với

n: cỡ mẫu

X/n: là tỉ lệ trên mẫu

Z: là trị số trong bảng Z với độ tin cậy γ

Ví dụ áp dụng: Trước kỳ thi tốt nghiệp THCS, phòng giáo dục quận Y chọn ngẫu nhiên 500 học sinh lớp 9 từ dân số học sinh trong quận để tham gia thi cử môn Văn, đề thi gần giống với những đề tốt nghiệp các năm trước Kết quả có 435 học sinh đạt yêu cầu Hãy lập khoảng phỏng định tỉ lệ dân số học sinh quận

Y đạt yêu cầu ký thi nói trên với độ tin cậy là 95%

Độ tin cậy = 95% ⇒ Z = 1.96 (tra bảng trang số 84)

Biên giới trên = 0.87 + 1.96 = 0.899

Biên giới dưới = 0.87 – 1.96

Trang 23

Vậy khoảng tin tưởng cho p:

84% < p < 90% với độ tin cậy 95%

CHUYÊN ĐỀ: KIỂM NGHIỆM GIẢ THUYẾT THỐNG KÊ

1 Giả thuyết thống kê: Ký hiệu là H0 (còn gọi là giả thuyết bất

dị, giả thuyết vô hiệu = null hypothesis) Đây là giả thuyết mà thường là người nghiên cứu hy vọng bác bỏ được để chứng minh thuyết của mình là đúng

2 Giả thuyết khả hoán: ký hiệu là H1 còn gọi là giả thuyết thay thế Đây là giả thuyết đối nghịch lại với H0

Ví dụ: H0: µ1 = µ2 thì H1: µ1 ≠ μ2

3 Mức xác suất ý nghĩa: Là một trị số xác suất mà người nghiên cứu đưa ra trước khi kiểm nghiệm để bác bỏ hay chấp nhận H0.Giả sử chọn mức ý nghĩa 5% Điều đó có ý nghĩa là người nghiên cứu sẽ bác bỏ giả thuyết H0 nếu trị số mẫu kiếm được với xác suất may rủi là 5% (xảy ra 5 lần hay ít hơn trong 100 lần).Xác suất này rất bé, không đủ tin rằng giả thuyết H0 là đúng Nếu trị số mẫu kiếm được xảy ra với xác suất lớn hơn 5% thì người nghiên cứu chấp nhận H0

Giả thuyết H0:

Chấp nhận Quyết định đúng Sai lầm loại II

Bác bỏ Sai lầm loại I Quyết định đúng

Trang 24

- Sai lầm loại 1: Là khi H0 là đúng, mà sau khi kiểm nghiệm dẫn tới H0 và chấp nhận H1 (Trường hợp này H1 là sai).

- Sai lầm loại 2: Là khi H0 thực sự là sai, nhưng cuộc kiểm nghiệm không đủ sức bỏ nó, do đó ta chấp nhận nó

4 Vùng bác bỏ

i Kiểm nghiệm hai đuôi và kiểm nghiệm một đuôi

- Kiểm nghiệm hai đuôi là kiểm nghiệm đặt giả thuyết H1 hai chiều (xem có khác biệt không)

Trang 25

1 Có hai ứng cử viên được đề cử ra để bầu một người vào chức Chủ tịch Hội đồng Quản trị của một công ty thương mại Để dự đoán xem người nào sẽ trúng cử, ban tổ chức đã chọn ngẫu nhiên một mẫu 80 nhân viên của công ty, sau đó phát một phiếu thăm dò với câu hỏi họ định bầu ai Ban tổ chức sau khi thu được phiếu về đã so sánh các tỉ lệ nhân viên bầu cho mỗi ứng cử viên nói trên Hãy lập giả thuyết H0 và H1.

2 mẫu ngẫu nhiên (mỗi mẫu đại diện cho một trường), sau đó cho làm cùng một bài thi rồi so sánh điểm trung bình của hai mẫu về bài thi nói trên Hãy cho biết các giả thuyết H0 và H1 nào được đưa ra, nếu nhà quản lý cho rằng thành tích học tập của học sinh hai trường là:

a Không giống nhau?

b Trường A học tốt hơn?

Giải

Gọi µ1, µ2 lần lượt là điểm trung bình về bài thi của DÂN SỐ học sinh của hai trường A và B

Trang 26

a Giả thuyết đối với trường hợp đầu tiên

= 6.99 Người giáo viên này đã chọn một mẫu gồm 300 học sinh đại diện cho các loại học sinh Giỏi, Khá, Trung bình, Kém trong khu vực và cũng khảo sát bằng một bài thi B tương tự như trên

Hãy viết giả thuyết H0 và H1, biết rằng người giáo viên không tin tưởng thành tích học tập của học sinh trong khu vực là cao như tuyên bố của nhà quản lý

Trang 27

các tháng và thi học kỳ I ông Hiệu trưởng cảm thấy e ngại, không chắc tỉ lệ tốt nghiệp như các năm trước Ông tiến hành một cuộc thăm dò, quyết định cuối tháng 4 chọn ra một mẫu 250 học sinh (khoảng 5% dân số lớp 12) và cho làm bài thi tương tự như các bài thi tốt nghiệp Kết quả có 187 học sinh đạt yêu cầu Hỏi ông Hiệu trưởng trường Lê Văn Tám sẽ phải lập giả thuyết H0 và H1 ra sao để kiểm chứng lại nhận định của mình.

Ngày đăng: 15/07/2015, 09:30

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w