1. Trang chủ
  2. » Giáo Dục - Đào Tạo

đề cương thống kê trong khoa học xã hội

27 3,2K 19

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 52,65 KB

Nội dung

2 Nếu trong một phân bố có hai điểm số không liền kề nhau màcó tần số bằng nhau và cao nhất thì cả hai số đó đều là số yếu vị và ta gọi phân bố ấy có yếu vị đôi.. 3 Đối với phân bố đẳng

Trang 1

Để lập bảng đẳng loại ta tiến hành theo các bước sau đây:

Bước 1: Xác định Min, Max của các điểm số

Trang 2

Bước 2: Tính hàng số = Max – Min

Bước 3: Xác định cỡ đẳng loại (đề bài thường cho sẵn)

Bước 4: Xác định số đẳng loại: Hàng số / cỡ đẳng loại

Bước 5: Ghi ra các đẳng loại, cần xác định ra đẳng loại đầu tiên(dựa vào Min và cỡ đẳng loại)

Bước 6: Ghi tần số cho các đẳng loại vừa tìm được

c Biên giới rời và biên giới liên tục

Điểm số đó là một khoảng liên tục từ biên giới liên tục dưới đếnbiên giới liên tục trên của điểm số

- Thí dụ đối với điểm số: Đối với điểm số 7 ta xem đó là mộtkhoảng từ 6.5 đến 7.5 Ta thấy 6.5 là biên giới liên tục (BGLT)dưới của 7 và 7.5 là BGLT trên của 7

- Thí dụ đối với đẳng loại: 20 – 24 ta coi đó là khoảng điểm số

từ 19.5 đến 24.5

+ 20 là biên giới rời dưới của đẳng loại

+ 24 là biên giới rời trên của đẳng loại

+ 19.5 là BGLT dưới của đẳng loại

+ 24.5 là BGLT trên của đẳng loại

d Tần số tích lũy (Cmf): gồm có tần số tích lũy kém và tần sốtích lũy hơn Tần số tích lũy kém được tính bằng cách cộng dồncác tần số từ trên xuống Tần số tích lũy hơn được tính bằngcách ngược lại

Trang 3

Ký hiệu là p còn gọi là tỉ lệ % Tỉ lệ % tại một điểm số = f/N.

Ví dụ: Ta có tổng N = 40 Điểm số 7 có 10 học sinh tần số tươngđối của điểm số 7 là: 10/40 = 25%

f Tần số tích lũy (kí hiệu là Cmp)

Ta cần lập thêm cột p = N f , cột p%, Cmp kém và Cmp hơn Cáchtính Cmp kém và Cmp hơn tương tự như Cmf kém và hơn

CHỦ ĐỀ 2:CÁC SỐ ĐỊNH TÂM

a Số yếu vị (Mo: Mode)

- Số yếu vị là số có tần số lớn nhất, kí hiệu là Mo

- Số yếu vị cho ta biết đỉnh cao của phân bố Nó là biểu hiện của

số đông, của phong trào Do đó, yếu vị cho biết khuynh hướng,điểm nhạy cảm của dữ kiện

* Để tính số yếu vị ta cần phải sắp xếp các điểm số thành bảng

phân bố tần số đơn hay đẳng loại Ghi chú các trường hợp sau:

1) Nếu hai số liền kề nhau mà có tần số bằng nhau và cao nhất thì

Mo sẽ là trung bình cộng của hai số đó.

Trang 4

2) Nếu trong một phân bố có hai điểm số không liền kề nhau mà

có tần số bằng nhau và cao nhất thì cả hai số đó đều là số yếu

vị và ta gọi phân bố ấy có yếu vị đôi

3) Đối với phân bố đẳng loại, ta xác định đẳng loại có tần số lớn nhất, Mo sẽ là trung điểm đẳng loại đó.

b Số trung vị Me (Median)

Số trung vị, kí hiệu là Me trong một phân bố chia phân bố ấy rathành hai nửa, mỗi nửa có số dữ kiện bằng nhau

Công dụng của số trung vị:

Cần tính trị số trung điểm chính xác của phân số điểm 50% lúc ấy ta có thể chia phân bố làm hai phần: trên trung vị và dướitrung vị

-Khi có những điểm số quá “cực đoan” (giá trị quá bé so vớiphần lớn các điểm số khác) làm ảnh hưởng tới số trung bình

* Để tính số trung vị ta có các trường hợp sau:

i) Với dữ kiện rời có N điểm số sắp xếp thành một dãy là X1, X2,

X3,… Xn ta làm như sau:

1) Sắp xếp các số này theo dãy tăng hay giảm dần

2) Tính N +12

3) Trung vị nằm ở vị trí thứ N +12 của dãy số Ta có hai trường hợp

 N là số lẻ, ví dụ có 5 điểm số (N=5) đã xếp theo thứ tự tăng: 3 4

5 6 7 , ta có vị trí của trung vị là (N + 1) : 2 = 3, suy ra vị trí thứ

3 của dãy là số 5, vậy Me=5

 N là số chẵn, ví dụ ta có dãy gồm 4 điểm số (N=4) sắp xếp theothứ tự tăng 2 3 4 5, vị trí của trung vị là (N + 1) : 2 = 2.5 Trung

vị bây giờ sẽ là trung bình cộng của số ở vị trí thứ 2 và 3 → Me

= (3 + 4) : 2 = 3.5

ii) Đối với phân bố tần số (đơn hay đẳng loại):

 Với phân bố tần số đơn, chẳng hạn:

Trang 5

X 16 18 22 25 26 29 30 34 38 41

Ta làm theo các bước sau:

1) Tính N bằng cách tính tích lũy kém hay hơn

2) Tính N +12

3) Dò theo cột tần số tích lũy cho tới vị trí N +12 Lấy ra số tại vị trínày

Đáp số là: 29 (Vị trí (N + 1) : 2 là số 29 có tần số tích lũy là 63)

 Với bảng phân bố đẳng loại ví dụ:

∆ Bước 1: Định các biên giới liên tục Tính tần số tích lũy kémhay hơn → ta biết được N

Điểm số Tần số Biên giới liên

tục dưới/trên

Tần số tích lũy kém(Cmf “kém”)

Trang 6

F: Tần số tích lũy kém cho đến biên giới liên tục dưới (L)

f m : tần số ở đẳng loại chứa trung vị

- Công dụng:

Trang 7

+ Giúp ta tìm một số định tâm ổn định và tiêu biểu cho khối dữkiện.

+ Muốn so sánh đặc điểm của hai hay nhiều phân bố điểm số.+ Số trung bình cộng được sử dụng khá phổ biến trong nghiêncứu giáo dục Nó giúp ta mô tả khá tốt khối dữ kiện và đặc biệtthuận lợi khi cần so sánh khả năng, tính chất hay các biểu hiệntâm lý giữa các nhóm người

Trang 8

3.2 Các công thức tính độ lệch chuẩn cho dân số và mẫu

Trang 9

a Mức độ tương quan có thể là:

- Quan hệ 1 – 1, R=1 (tương quan hàm số, giá trị của hệ sốtương quan = 1)

- Không tương quan (giá trị tương quan = 0 hay xấp xỉ 0)

- Hoặc thường thấy hơn: giá trị của hệ số tương quan ở mứcgiữa 0 và 1 (0<R<1)

* Tương quan nghịch thì R < 0, tương quan thuận thì R > 0 Độlớn của hệ số tương quan là một số thực nằm trong khoảng -1đến 1

b Hệ số tương quan tuyến tính, ký hiệu r

* Tra bảng giá trị tới hạn của R:

Với df = N – 2 và α = 5% tra bảng trang 86 ta đọc được Rα=?

* Lưu ý các quy tắc quyết định:

Nếu |R XY| > R α: bác bỏ H0 và chấp nhận H1

Trang 10

Nếu |R XY| ≤ R α: chấp nhận H0

* Kết luận: Dựa vào các quy tắc quyết định đó ta khẳng định cótương quan hay không với mức xác suất là bao nhiêu Hệ sốtương quan là bao nhiêu chứng tỏ mức độ tương quan là như thếnào?

Hệ số tương quan có các giới hạn sau:

Trang 11

α = 5% (ví dụ)Tra bảng giá trị tới hạn của  (trang số 88): Với N = 10 và α =5% ta đọc được α = 0.649

Lưu ý các quy tắc quyết định:

 > α: bác bỏ H0 chấp nhận H1

 ≤ α: bác bỏ H1 chấp nhận HQuyết định vì  = 0.76 > α = 0.649 nên ta bác bỏ H0 nhận H1

Kết luận: Có tương quan ở mức xác suất ý nghĩa 5% giữa điểm

số môn 1 và môn 2 Hệ số tương quan 0.76 cho thấy mức độtương quan là khá cao

Trang 12

Chú ý: Đối với các trường hợp đồng điểm giữa các học sinh, tasắp xếp hạng A bình thường, hạng B bình thường (không đượcxếp đồng hạng) lập cột RA, RB (nếu đồng hạng lấy trung bìnhcộng các thứ hạng bình thường của thứ hạng đó, còn không giữnguyên), sau đó làm bình thường.

Trang 13

MSSV Test

A

TestB

Hạn

g ABT

Hạn

g BBT

Trang 14

1 Phương trình tuyến bình thường:

a Tính diện tích (Z = 0.76 → Z = 1.96)

(Chú ý xem bảng trang 84)

Ta có diện tích này bằng: DT (Z=0 → Z=1.96) – DT (Z=0 →Z=0.76) = 0.4750 – 0.2764 = 0.1986

CHỦ ĐỀ 6: CHỌN MẪU

a) Nguyên tắc chung của việc chọn mẫu:

Trang 15

- Tính khách quan: những chủ thể đưa vào mẫu hoàn toàn theolối vô tư, không theo ý muốn chủ quan của người nghiên cứu.

- Phải bảo đảm rằng mỗi phần tử trong dân số đều có cơ hộiđồng đều nhau (khả năng được chọn là như nhau)

b) Vấn đề sai số khi chọn mẫu:

- Sai số chọn mẫu là loại sai lầm xảy ra do ta chỉ chọn 1 mẫu đểnghiên cứu mà không tiến hành trên toàn dân số

- “Sai số chọn mẫu” và “sai số không do chọn mẫu” hợp thànhsai số toàn thể Mối liên hệ giữa chúng là ba cạnh của một tamgiác vuông, trong đó sai số toàn thể là cạnh huyền Ta không thểtriệt tiêu một sai số nào nhưng có thể làm giảm tối đa tùy theocác điều kiện, khả năng cho phép của một cuộc nghiên cứu

- Giảm sai số chọn mẫu bằng cách:

 Tăng thêm đơn vị chọn mẫu (tức là tăng số n nhưng khôngthể tăng lên vô hạn)

 Thay đổi phương pháp chọn mẫu hoặc phối hợp nhiềuphương pháp nhằm tăng hiệu quả chọn mẫu

- Giảm sai số không do chọn mẫu bằng cách:

 Khảo sát nhiều lần trên đối tượng hơn là một lần

 Tăng số phỏng vấn viên

 Cải tiến các bảng điều tra, dụng cụ đo lường, cách xử lý dữkiện,…

c) Một số phương pháp chọn mẫu thông dụng

i) Chọn mẫu ngẫu nhiên đơn giản

Trang 16

(Áp dụng cho số phần tử trong dân số không lớn quá), có thể rút thăm, dùng bảng số ngẫu nhiên, dùng hàm số ngẫu nhiên.

ii) Chọn mẫu theo hệ thống

Theo cách này, trước hết các phần tử được sắp xếp theo danhsách có thứ tự theo vần A, B, C, D,… hoặc xếp theo bậc lương,hay theo một thứ tự hợp lý nào đó xác định trước

Giả sử trong dân số có N phần tử và ta muốn chọn 1 mẫu n Tỉ lệchọn mẫu là f = N n, ta tìm số nguyên dương K sao cho N nK1 sau

đó bắt đầu từ một phần tử bất kỳ trong danh sách, cứ K phần tửthì chọn một để đưa vào mẫu Tiếp tục chọn cho đến hết danhsách

Ví dụ áp dụng: Dân số N = 3849 cần mẫu có n = 300?

Trước tiên, tính tỉ số 300/3849 = 1/12.83  k = 12 (lấy phầnnguyên)

iii) Chọn mẫu tỉ lệ theo tầng lớp

Dân số N được chia ra nhiều tầng lớp,… mỗi tầng lớp, mỗi tầnglớp có Nk phần tử Tỉ lệ = Nk/N

Cỡ của mẫu bằng n và ta muốn trong mẫu cũng cóa đủ các tầnglớp nêu trên với tỉ lệ giống như trong dân số thì:

n k = n * N K

N

Ví dụ áp dụng: Trường A có số học sinh là 3356 học sinh có các

khoa là Công nghệ thông tin, Vật lý, Hóa học với số học sinh lần

Trang 17

lượt là 981, 1266, 1109 Cần lấy 300 sinh viên tham dự Hội

thảo Hỏi phải làm thế nào

GiảiTóm tắt: N = 3356, N1 = 981, N2 = 1266, N3 = 1109

Lập tỉ lệ Nk/N ta có tỉ lệ số học sinh từng khoa như sau:

- Khoa Công nghệ thông tin = 981/3356 = 29,2%

d) Bổ sung về phương pháp chọn mẫu

Với lối chọn mẫu ngẫu nhiên, ta sẽ gặp trở ngại khi dân số khálớn, ta sẽ mất nhiều thời gian Dựa vào tính chất “nhóm” vốn cótrong tổ chức hành chính, trường học Để đơn giản, ta chỉ xéttrường hợp nhóm đồng cỡ hoặc có thể xem là đồng cỡ

Chẳng hạn: ở các lớp tiểu học hay trung học, số học sinh mỗilớp thường không bằng nhau nhưng số lượng này không chênhnhau nhiều lắm ví dụ có lớp thường có số học sinh là 40, 39, 41,

… do đó có thể áp dụng nhóm đồng cỡ, đơn vị chọn là lớp học

Trang 18

Thí dụ: Ta cần có một mẫu 500 người lấy từ một dân số 10,000người Ta chia dân số này thành 200 nhóm mỗi nhóm có 50người Dùng lối chọn mẫu ngẫu nhiên lấy 10 nhóm trong số 200nhóm Ta có 10 nhóm* 50 người = 500 người.

→ Thậm chí trong một số trường hợp ta cần phải phối hợp tất cảcác cách trên

CHỦ ĐỀ 7: PHỎNG ĐỊNH TRỊ SỐ DÂN SỐ

a Khái niệm

Khoảng phỏng định là một khoảng mà người ta đưa ra với mộtmức độ tin tưởng định trước và hy vọng rằng trị số dân số rẽ rơivào trong khoảng này

b Công thức chung của khoảng phủ định

Điểm phỏng định -  < Trị số dân số < Điểm phỏng định + 

s: độ lệch tiêu chuẩn của mẫu;

Z: trị số đọc ở bảng Z với độ tin cậy cho trước

Trang 19

Lưu ý: khoảng phỏng định trên chỉ áp dụng trong điều kiện: Dân

- Tính biên giới liên tục trên = 155 + 1.96.√28144 = 159.573

- Biên giới liên tục dưới = 155 – 1.96.√28144=150.427

Kết luận: Khoảng phỏng định cho trung bình chiều cao dân số là150.43   < 159.57 với độ tin cậy là 95%

ii Trường hợp mẫu nhỏ (n < 30) )

Áp dụng công thức sau:

 = X´ t √s n

Trong đó:

Trang 20

- Vậy khoảng phỏng định cho trung bình của dân số là:

89.1 < μ < 113.5 với độ tin cậy là 98%

Trang 21

Với

n: cỡ mẫu

X/n: là tỉ lệ trên mẫu

Z: là trị số trong bảng Z với độ tin cậy 

Ví dụ áp dụng: Trước kỳ thi tốt nghiệp THCS, phòng giáo dục quận Y chọn ngẫu nhiên 500 học sinh lớp 9 từ dân số học sinh trong quận để tham gia thi cử môn Văn, đề thi gần giống với những đề tốt nghiệp các năm trước Kết quả có 435 học sinh đạt yêu cầu Hãy lập khoảng phỏng định tỉ lệ dân số học sinh quận

Y đạt yêu cầu ký thi nói trên với độ tin cậy là 95%

Độ tin cậy = 95%  Z = 1.96 (tra bảng trang số 84)

Biên giới trên = 0.87 + 1.96.√0.87∗0.13500 = 0.899

Biên giới dưới = 0.87 – 1.96 √0.87∗0.13500 =0.841

Vậy khoảng tin tưởng cho p:

Trang 22

84% < p < 90% với độ tin cậy 95%.

CHUYÊN ĐỀ: KIỂM NGHIỆM GIẢ THUYẾT THỐNG KÊ

1 Giả thuyết thống kê: Ký hiệu là H0 (còn gọi là giả thuyết bất

dị, giả thuyết vô hiệu = null hypothesis) Đây là giả thuyết màthường là người nghiên cứu hy vọng bác bỏ được để chứngminh thuyết của mình là đúng

2 Giả thuyết khả hoán: ký hiệu là H1 còn gọi là giả thuyết thaythế Đây là giả thuyết đối nghịch lại với H0

Giả thuyết H0:

Chấp nhận Quyết định đúng Sai lầm loại II

Bác bỏ Sai lầm loại I Quyết định đúng

- Sai lầm loại 1: Là khi H0 là đúng, mà sau khi kiểm nghiệm dẫntới H0 và chấp nhận H1 (Trường hợp này H1 là sai)

Trang 23

- Sai lầm loại 2: Là khi H0 thực sự là sai, nhưng cuộc kiểmnghiệm không đủ sức bỏ nó, do đó ta chấp nhận nó.

4 Vùng bác bỏ

i Kiểm nghiệm hai đuôi và kiểm nghiệm một đuôi

- Kiểm nghiệm hai đuôi là kiểm nghiệm đặt giả thuyết H1 haichiều (xem có khác biệt không)

Ví dụ 1:

H0: μ1 = μ2

H1: μ1 ≠ μ2

- Kiểm nghiệm một đuôi là kiểm nghiệm trong đó giả thuyết H1

chỉ có một chiều Kiểm nghiệm một đuôi gồm đuôi dưới và đuôitrên Đuôi dưới: khi muốn chứng minh dân số bé hơn một trị sốnào đó Đuôi trên khi muốn chứng minh trị số lớn hơn một trị sốnào đó

Trang 24

nhiên một mẫu 80 nhân viên của công ty, sau đó phát một phiếuthăm dò với câu hỏi họ định bầu ai Ban tổ chức sau khi thuđược phiếu về đã so sánh các tỉ lệ nhân viên bầu cho mỗi ứng cửviên nói trên Hãy lập giả thuyết H0 và H1.

2 mẫu ngẫu nhiên (mỗi mẫu đại diện cho một trường), sau đócho làm cùng một bài thi rồi so sánh điểm trung bình của haimẫu về bài thi nói trên Hãy cho biết các giả thuyết H0 và H1nào được đưa ra, nếu nhà quản lý cho rằng thành tích học tậpcủa học sinh hai trường là:

a Không giống nhau?

Trang 25

b Giả thuyết với trường hợp thứ hai

H0: 1  2

H1: 1 > 2

3 Một giáo viên Anh văn thường dạy lớp 12 muốn kiểm chứnglại kết quả mà nhà quản lý giáo dục công bố rằng điểm trungbình của dân số học sinh lớp 12 tại khu vực M làm 100 câu test(trình độ B) qua một đợt khảo sát là 72.8 với độ lệch tiêu chuẩn

= 6.99 Người giáo viên này đã chọn một mẫu gồm 300 học sinhđại diện cho các loại học sinh Giỏi, Khá, Trung bình, Kém trongkhu vực và cũng khảo sát bằng một bài thi B tương tự như trên

Hãy viết giả thuyết H0 và H1, biết rằng người giáo viên không tintưởng thành tích học tập của học sinh trong khu vực là cao nhưtuyên bố của nhà quản lý

4 Kết quả thi tốt nghiệp vài năm gần đây của học sinh trường

Lê Văn Tám vào khoảng 85% Năm nay, qua theo dõi học tậpcác tháng và thi học kỳ I ông Hiệu trưởng cảm thấy e ngại,không chắc tỉ lệ tốt nghiệp như các năm trước Ông tiến hànhmột cuộc thăm dò, quyết định cuối tháng 4 chọn ra một mẫu 250học sinh (khoảng 5% dân số lớp 12) và cho làm bài thi tương tự

Trang 26

như các bài thi tốt nghiệp Kết quả có 187 học sinh đạt yêu cầu.Hỏi ông Hiệu trưởng trường Lê Văn Tám sẽ phải lập giả thuyết

H0 và H1 ra sao để kiểm chứng lại nhận định của mình

Ngày đăng: 25/07/2015, 00:41

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w