2 Nếu trong một phân bố có hai điểm số không liền kề nhau màcó tần số bằng nhau và cao nhất thì cả hai số đó đều là số yếu vị và ta gọi phân bố ấy có yếu vị đôi.. 3 Đối với phân bố đẳng
Trang 1Để lập bảng đẳng loại ta tiến hành theo các bước sau đây:
Bước 1: Xác định Min, Max của các điểm số
Trang 2Bước 2: Tính hàng số = Max – Min
Bước 3: Xác định cỡ đẳng loại (đề bài thường cho sẵn)
Bước 4: Xác định số đẳng loại: Hàng số / cỡ đẳng loại
Bước 5: Ghi ra các đẳng loại, cần xác định ra đẳng loại đầu tiên(dựa vào Min và cỡ đẳng loại)
Bước 6: Ghi tần số cho các đẳng loại vừa tìm được
c Biên giới rời và biên giới liên tục
Điểm số đó là một khoảng liên tục từ biên giới liên tục dưới đếnbiên giới liên tục trên của điểm số
- Thí dụ đối với điểm số: Đối với điểm số 7 ta xem đó là mộtkhoảng từ 6.5 đến 7.5 Ta thấy 6.5 là biên giới liên tục (BGLT)dưới của 7 và 7.5 là BGLT trên của 7
- Thí dụ đối với đẳng loại: 20 – 24 ta coi đó là khoảng điểm số
từ 19.5 đến 24.5
+ 20 là biên giới rời dưới của đẳng loại
+ 24 là biên giới rời trên của đẳng loại
+ 19.5 là BGLT dưới của đẳng loại
+ 24.5 là BGLT trên của đẳng loại
d Tần số tích lũy (Cmf): gồm có tần số tích lũy kém và tần sốtích lũy hơn Tần số tích lũy kém được tính bằng cách cộng dồncác tần số từ trên xuống Tần số tích lũy hơn được tính bằngcách ngược lại
Trang 3Ký hiệu là p còn gọi là tỉ lệ % Tỉ lệ % tại một điểm số = f/N.
Ví dụ: Ta có tổng N = 40 Điểm số 7 có 10 học sinh tần số tươngđối của điểm số 7 là: 10/40 = 25%
f Tần số tích lũy (kí hiệu là Cmp)
Ta cần lập thêm cột p = N f , cột p%, Cmp kém và Cmp hơn Cáchtính Cmp kém và Cmp hơn tương tự như Cmf kém và hơn
CHỦ ĐỀ 2:CÁC SỐ ĐỊNH TÂM
a Số yếu vị (Mo: Mode)
- Số yếu vị là số có tần số lớn nhất, kí hiệu là Mo
- Số yếu vị cho ta biết đỉnh cao của phân bố Nó là biểu hiện của
số đông, của phong trào Do đó, yếu vị cho biết khuynh hướng,điểm nhạy cảm của dữ kiện
* Để tính số yếu vị ta cần phải sắp xếp các điểm số thành bảng
phân bố tần số đơn hay đẳng loại Ghi chú các trường hợp sau:
1) Nếu hai số liền kề nhau mà có tần số bằng nhau và cao nhất thì
Mo sẽ là trung bình cộng của hai số đó.
Trang 42) Nếu trong một phân bố có hai điểm số không liền kề nhau mà
có tần số bằng nhau và cao nhất thì cả hai số đó đều là số yếu
vị và ta gọi phân bố ấy có yếu vị đôi
3) Đối với phân bố đẳng loại, ta xác định đẳng loại có tần số lớn nhất, Mo sẽ là trung điểm đẳng loại đó.
b Số trung vị Me (Median)
Số trung vị, kí hiệu là Me trong một phân bố chia phân bố ấy rathành hai nửa, mỗi nửa có số dữ kiện bằng nhau
Công dụng của số trung vị:
Cần tính trị số trung điểm chính xác của phân số điểm 50% lúc ấy ta có thể chia phân bố làm hai phần: trên trung vị và dướitrung vị
-Khi có những điểm số quá “cực đoan” (giá trị quá bé so vớiphần lớn các điểm số khác) làm ảnh hưởng tới số trung bình
* Để tính số trung vị ta có các trường hợp sau:
i) Với dữ kiện rời có N điểm số sắp xếp thành một dãy là X1, X2,
X3,… Xn ta làm như sau:
1) Sắp xếp các số này theo dãy tăng hay giảm dần
2) Tính N +12
3) Trung vị nằm ở vị trí thứ N +12 của dãy số Ta có hai trường hợp
N là số lẻ, ví dụ có 5 điểm số (N=5) đã xếp theo thứ tự tăng: 3 4
5 6 7 , ta có vị trí của trung vị là (N + 1) : 2 = 3, suy ra vị trí thứ
3 của dãy là số 5, vậy Me=5
N là số chẵn, ví dụ ta có dãy gồm 4 điểm số (N=4) sắp xếp theothứ tự tăng 2 3 4 5, vị trí của trung vị là (N + 1) : 2 = 2.5 Trung
vị bây giờ sẽ là trung bình cộng của số ở vị trí thứ 2 và 3 → Me
= (3 + 4) : 2 = 3.5
ii) Đối với phân bố tần số (đơn hay đẳng loại):
Với phân bố tần số đơn, chẳng hạn:
Trang 5X 16 18 22 25 26 29 30 34 38 41
Ta làm theo các bước sau:
1) Tính N bằng cách tính tích lũy kém hay hơn
2) Tính N +12
3) Dò theo cột tần số tích lũy cho tới vị trí N +12 Lấy ra số tại vị trínày
Đáp số là: 29 (Vị trí (N + 1) : 2 là số 29 có tần số tích lũy là 63)
Với bảng phân bố đẳng loại ví dụ:
∆ Bước 1: Định các biên giới liên tục Tính tần số tích lũy kémhay hơn → ta biết được N
Điểm số Tần số Biên giới liên
tục dưới/trên
Tần số tích lũy kém(Cmf “kém”)
Trang 6F: Tần số tích lũy kém cho đến biên giới liên tục dưới (L)
f m : tần số ở đẳng loại chứa trung vị
- Công dụng:
Trang 7+ Giúp ta tìm một số định tâm ổn định và tiêu biểu cho khối dữkiện.
+ Muốn so sánh đặc điểm của hai hay nhiều phân bố điểm số.+ Số trung bình cộng được sử dụng khá phổ biến trong nghiêncứu giáo dục Nó giúp ta mô tả khá tốt khối dữ kiện và đặc biệtthuận lợi khi cần so sánh khả năng, tính chất hay các biểu hiệntâm lý giữa các nhóm người
Trang 83.2 Các công thức tính độ lệch chuẩn cho dân số và mẫu
Trang 9a Mức độ tương quan có thể là:
- Quan hệ 1 – 1, R=1 (tương quan hàm số, giá trị của hệ sốtương quan = 1)
- Không tương quan (giá trị tương quan = 0 hay xấp xỉ 0)
- Hoặc thường thấy hơn: giá trị của hệ số tương quan ở mứcgiữa 0 và 1 (0<R<1)
* Tương quan nghịch thì R < 0, tương quan thuận thì R > 0 Độlớn của hệ số tương quan là một số thực nằm trong khoảng -1đến 1
b Hệ số tương quan tuyến tính, ký hiệu r
* Tra bảng giá trị tới hạn của R:
Với df = N – 2 và α = 5% tra bảng trang 86 ta đọc được Rα=?
* Lưu ý các quy tắc quyết định:
Nếu |R XY| > R α: bác bỏ H0 và chấp nhận H1
Trang 10Nếu |R XY| ≤ R α: chấp nhận H0
* Kết luận: Dựa vào các quy tắc quyết định đó ta khẳng định cótương quan hay không với mức xác suất là bao nhiêu Hệ sốtương quan là bao nhiêu chứng tỏ mức độ tương quan là như thếnào?
Hệ số tương quan có các giới hạn sau:
Trang 11α = 5% (ví dụ)Tra bảng giá trị tới hạn của (trang số 88): Với N = 10 và α =5% ta đọc được α = 0.649
Lưu ý các quy tắc quyết định:
> α: bác bỏ H0 chấp nhận H1
≤ α: bác bỏ H1 chấp nhận HQuyết định vì = 0.76 > α = 0.649 nên ta bác bỏ H0 nhận H1
Kết luận: Có tương quan ở mức xác suất ý nghĩa 5% giữa điểm
số môn 1 và môn 2 Hệ số tương quan 0.76 cho thấy mức độtương quan là khá cao
Trang 12Chú ý: Đối với các trường hợp đồng điểm giữa các học sinh, tasắp xếp hạng A bình thường, hạng B bình thường (không đượcxếp đồng hạng) lập cột RA, RB (nếu đồng hạng lấy trung bìnhcộng các thứ hạng bình thường của thứ hạng đó, còn không giữnguyên), sau đó làm bình thường.
Trang 13MSSV Test
A
TestB
Hạn
g ABT
Hạn
g BBT
Trang 141 Phương trình tuyến bình thường:
a Tính diện tích (Z = 0.76 → Z = 1.96)
(Chú ý xem bảng trang 84)
Ta có diện tích này bằng: DT (Z=0 → Z=1.96) – DT (Z=0 →Z=0.76) = 0.4750 – 0.2764 = 0.1986
CHỦ ĐỀ 6: CHỌN MẪU
a) Nguyên tắc chung của việc chọn mẫu:
Trang 15- Tính khách quan: những chủ thể đưa vào mẫu hoàn toàn theolối vô tư, không theo ý muốn chủ quan của người nghiên cứu.
- Phải bảo đảm rằng mỗi phần tử trong dân số đều có cơ hộiđồng đều nhau (khả năng được chọn là như nhau)
b) Vấn đề sai số khi chọn mẫu:
- Sai số chọn mẫu là loại sai lầm xảy ra do ta chỉ chọn 1 mẫu đểnghiên cứu mà không tiến hành trên toàn dân số
- “Sai số chọn mẫu” và “sai số không do chọn mẫu” hợp thànhsai số toàn thể Mối liên hệ giữa chúng là ba cạnh của một tamgiác vuông, trong đó sai số toàn thể là cạnh huyền Ta không thểtriệt tiêu một sai số nào nhưng có thể làm giảm tối đa tùy theocác điều kiện, khả năng cho phép của một cuộc nghiên cứu
- Giảm sai số chọn mẫu bằng cách:
Tăng thêm đơn vị chọn mẫu (tức là tăng số n nhưng khôngthể tăng lên vô hạn)
Thay đổi phương pháp chọn mẫu hoặc phối hợp nhiềuphương pháp nhằm tăng hiệu quả chọn mẫu
- Giảm sai số không do chọn mẫu bằng cách:
Khảo sát nhiều lần trên đối tượng hơn là một lần
Tăng số phỏng vấn viên
Cải tiến các bảng điều tra, dụng cụ đo lường, cách xử lý dữkiện,…
c) Một số phương pháp chọn mẫu thông dụng
i) Chọn mẫu ngẫu nhiên đơn giản
Trang 16(Áp dụng cho số phần tử trong dân số không lớn quá), có thể rút thăm, dùng bảng số ngẫu nhiên, dùng hàm số ngẫu nhiên.
ii) Chọn mẫu theo hệ thống
Theo cách này, trước hết các phần tử được sắp xếp theo danhsách có thứ tự theo vần A, B, C, D,… hoặc xếp theo bậc lương,hay theo một thứ tự hợp lý nào đó xác định trước
Giả sử trong dân số có N phần tử và ta muốn chọn 1 mẫu n Tỉ lệchọn mẫu là f = N n, ta tìm số nguyên dương K sao cho N n K1 sau
đó bắt đầu từ một phần tử bất kỳ trong danh sách, cứ K phần tửthì chọn một để đưa vào mẫu Tiếp tục chọn cho đến hết danhsách
Ví dụ áp dụng: Dân số N = 3849 cần mẫu có n = 300?
Trước tiên, tính tỉ số 300/3849 = 1/12.83 k = 12 (lấy phầnnguyên)
iii) Chọn mẫu tỉ lệ theo tầng lớp
Dân số N được chia ra nhiều tầng lớp,… mỗi tầng lớp, mỗi tầnglớp có Nk phần tử Tỉ lệ = Nk/N
Cỡ của mẫu bằng n và ta muốn trong mẫu cũng cóa đủ các tầnglớp nêu trên với tỉ lệ giống như trong dân số thì:
n k = n * N K
N
Ví dụ áp dụng: Trường A có số học sinh là 3356 học sinh có các
khoa là Công nghệ thông tin, Vật lý, Hóa học với số học sinh lần
Trang 17lượt là 981, 1266, 1109 Cần lấy 300 sinh viên tham dự Hội
thảo Hỏi phải làm thế nào
GiảiTóm tắt: N = 3356, N1 = 981, N2 = 1266, N3 = 1109
Lập tỉ lệ Nk/N ta có tỉ lệ số học sinh từng khoa như sau:
- Khoa Công nghệ thông tin = 981/3356 = 29,2%
d) Bổ sung về phương pháp chọn mẫu
Với lối chọn mẫu ngẫu nhiên, ta sẽ gặp trở ngại khi dân số khálớn, ta sẽ mất nhiều thời gian Dựa vào tính chất “nhóm” vốn cótrong tổ chức hành chính, trường học Để đơn giản, ta chỉ xéttrường hợp nhóm đồng cỡ hoặc có thể xem là đồng cỡ
Chẳng hạn: ở các lớp tiểu học hay trung học, số học sinh mỗilớp thường không bằng nhau nhưng số lượng này không chênhnhau nhiều lắm ví dụ có lớp thường có số học sinh là 40, 39, 41,
… do đó có thể áp dụng nhóm đồng cỡ, đơn vị chọn là lớp học
Trang 18Thí dụ: Ta cần có một mẫu 500 người lấy từ một dân số 10,000người Ta chia dân số này thành 200 nhóm mỗi nhóm có 50người Dùng lối chọn mẫu ngẫu nhiên lấy 10 nhóm trong số 200nhóm Ta có 10 nhóm* 50 người = 500 người.
→ Thậm chí trong một số trường hợp ta cần phải phối hợp tất cảcác cách trên
CHỦ ĐỀ 7: PHỎNG ĐỊNH TRỊ SỐ DÂN SỐ
a Khái niệm
Khoảng phỏng định là một khoảng mà người ta đưa ra với mộtmức độ tin tưởng định trước và hy vọng rằng trị số dân số rẽ rơivào trong khoảng này
b Công thức chung của khoảng phủ định
Điểm phỏng định - < Trị số dân số < Điểm phỏng định +
s: độ lệch tiêu chuẩn của mẫu;
Z: trị số đọc ở bảng Z với độ tin cậy cho trước
Trang 19Lưu ý: khoảng phỏng định trên chỉ áp dụng trong điều kiện: Dân
- Tính biên giới liên tục trên = 155 + 1.96.√28144 = 159.573
- Biên giới liên tục dưới = 155 – 1.96.√28144=150.427
Kết luận: Khoảng phỏng định cho trung bình chiều cao dân số là150.43 < 159.57 với độ tin cậy là 95%
ii Trường hợp mẫu nhỏ (n < 30) )
Áp dụng công thức sau:
= X´ t √s n
Trong đó:
Trang 20- Vậy khoảng phỏng định cho trung bình của dân số là:
89.1 < μ < 113.5 với độ tin cậy là 98%
Trang 21Với
n: cỡ mẫu
X/n: là tỉ lệ trên mẫu
Z: là trị số trong bảng Z với độ tin cậy
Ví dụ áp dụng: Trước kỳ thi tốt nghiệp THCS, phòng giáo dục quận Y chọn ngẫu nhiên 500 học sinh lớp 9 từ dân số học sinh trong quận để tham gia thi cử môn Văn, đề thi gần giống với những đề tốt nghiệp các năm trước Kết quả có 435 học sinh đạt yêu cầu Hãy lập khoảng phỏng định tỉ lệ dân số học sinh quận
Y đạt yêu cầu ký thi nói trên với độ tin cậy là 95%
Độ tin cậy = 95% Z = 1.96 (tra bảng trang số 84)
Biên giới trên = 0.87 + 1.96.√0.87∗0.13500 = 0.899
Biên giới dưới = 0.87 – 1.96 √0.87∗0.13500 =0.841
Vậy khoảng tin tưởng cho p:
Trang 2284% < p < 90% với độ tin cậy 95%.
CHUYÊN ĐỀ: KIỂM NGHIỆM GIẢ THUYẾT THỐNG KÊ
1 Giả thuyết thống kê: Ký hiệu là H0 (còn gọi là giả thuyết bất
dị, giả thuyết vô hiệu = null hypothesis) Đây là giả thuyết màthường là người nghiên cứu hy vọng bác bỏ được để chứngminh thuyết của mình là đúng
2 Giả thuyết khả hoán: ký hiệu là H1 còn gọi là giả thuyết thaythế Đây là giả thuyết đối nghịch lại với H0
Giả thuyết H0:
Chấp nhận Quyết định đúng Sai lầm loại II
Bác bỏ Sai lầm loại I Quyết định đúng
- Sai lầm loại 1: Là khi H0 là đúng, mà sau khi kiểm nghiệm dẫntới H0 và chấp nhận H1 (Trường hợp này H1 là sai)
Trang 23- Sai lầm loại 2: Là khi H0 thực sự là sai, nhưng cuộc kiểmnghiệm không đủ sức bỏ nó, do đó ta chấp nhận nó.
4 Vùng bác bỏ
i Kiểm nghiệm hai đuôi và kiểm nghiệm một đuôi
- Kiểm nghiệm hai đuôi là kiểm nghiệm đặt giả thuyết H1 haichiều (xem có khác biệt không)
Ví dụ 1:
H0: μ1 = μ2
H1: μ1 ≠ μ2
- Kiểm nghiệm một đuôi là kiểm nghiệm trong đó giả thuyết H1
chỉ có một chiều Kiểm nghiệm một đuôi gồm đuôi dưới và đuôitrên Đuôi dưới: khi muốn chứng minh dân số bé hơn một trị sốnào đó Đuôi trên khi muốn chứng minh trị số lớn hơn một trị sốnào đó
Trang 24nhiên một mẫu 80 nhân viên của công ty, sau đó phát một phiếuthăm dò với câu hỏi họ định bầu ai Ban tổ chức sau khi thuđược phiếu về đã so sánh các tỉ lệ nhân viên bầu cho mỗi ứng cửviên nói trên Hãy lập giả thuyết H0 và H1.
2 mẫu ngẫu nhiên (mỗi mẫu đại diện cho một trường), sau đócho làm cùng một bài thi rồi so sánh điểm trung bình của haimẫu về bài thi nói trên Hãy cho biết các giả thuyết H0 và H1nào được đưa ra, nếu nhà quản lý cho rằng thành tích học tậpcủa học sinh hai trường là:
a Không giống nhau?
Trang 25b Giả thuyết với trường hợp thứ hai
H0: 1 2
H1: 1 > 2
3 Một giáo viên Anh văn thường dạy lớp 12 muốn kiểm chứnglại kết quả mà nhà quản lý giáo dục công bố rằng điểm trungbình của dân số học sinh lớp 12 tại khu vực M làm 100 câu test(trình độ B) qua một đợt khảo sát là 72.8 với độ lệch tiêu chuẩn
= 6.99 Người giáo viên này đã chọn một mẫu gồm 300 học sinhđại diện cho các loại học sinh Giỏi, Khá, Trung bình, Kém trongkhu vực và cũng khảo sát bằng một bài thi B tương tự như trên
Hãy viết giả thuyết H0 và H1, biết rằng người giáo viên không tintưởng thành tích học tập của học sinh trong khu vực là cao nhưtuyên bố của nhà quản lý
4 Kết quả thi tốt nghiệp vài năm gần đây của học sinh trường
Lê Văn Tám vào khoảng 85% Năm nay, qua theo dõi học tậpcác tháng và thi học kỳ I ông Hiệu trưởng cảm thấy e ngại,không chắc tỉ lệ tốt nghiệp như các năm trước Ông tiến hànhmột cuộc thăm dò, quyết định cuối tháng 4 chọn ra một mẫu 250học sinh (khoảng 5% dân số lớp 12) và cho làm bài thi tương tự
Trang 26như các bài thi tốt nghiệp Kết quả có 187 học sinh đạt yêu cầu.Hỏi ông Hiệu trưởng trường Lê Văn Tám sẽ phải lập giả thuyết
H0 và H1 ra sao để kiểm chứng lại nhận định của mình