1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Đề cương thong ke cho khoa hoc xa hoi thang 2 2017

56 13 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 56
Dung lượng 2,77 MB

Nội dung

Trang 1

1 Tên môn học: Thống kê cho khoa học xã hội Mã môn học: DA1005

2 Số tín chỉ: 02

3 Trình độ: sinh viên năm 1 va 2

4 Phân bỗ thời gian: 30 tiết lý thuyết 5 Điều kiện tiên quyết

Sinh viên đã được học môn phương pháp nghiên cứu khoa học 6 Mục tiêu của học phần

Cung cấp cho sinh viên những khái niệm và kiến thức cơ bản về thông kê, về khả năng nhận định và kiêm tra những giả thuyết thông kê trong nghiên cứu khoa học nói chung,

khoa học xã hội nói riêng

7 Mô tả văn tắt nội dung môn học

Môn học, bao gồm phần bài giảng, thảo luận, và bài tập, cung cấp những khái niệm và kỹ thuật cơ bản về thống kê giúp cho sinh viên trong việc xử lý những kết quả thu được

từ những cuộc nghiên cứu điều tra thực tế trong nhiều lĩnh vực khác nhau như: xã hội học, nhân hoc, công tác xã hội, báo chí, địa lý

8 Nhiệm vụ của sinh viên

- Sinh viên có nhiệm vụ tham dự đầy đủ các buỗi học trên lớp (6 buổi), những sinh viên

văng mặt quá 20% tông thời gian học trên lớp sẽ không đủ điêu kiện thi kết thúc môn

học

- Trén cơ sở những tài Hiệu được giao đọc ở nhà, sinh viên có nhiệm vụ đọc kỹ lưỡng và

tom tat nội dung phân đọc, và trình bày những hiểu biệt của mình qua phân thảo luận

tại lớp vào buôi học kê tiệp

- Bài tập: trong các buổi học, sinh viên có nhiệm vụ phải làm các bài tập trên lớp Đây là loại bài tập nhanh, sinh viên sẽ có cơ hội ghi 01 dau (+) [04 dâu “+” tương đương 1 diém thưởng được cộng điêm vào bài kiêm tra giữa kỳ

9 Tài liệu học tập

Sách và giáo trình chính:

- Thống kê trong nghiên cứu xã hội Tác gia: Alan Agresti và Barbara Finlay, Nhà xuất bản Prentice Hall, Năm 1997

- Thống kê ứng dụng trong kinh tế xã hội Tác giả: Hoàng Trọng và Chu Nguyễn Mộng Ngọc Nhà xuất bản thống kê Năm 2007

Sách tham khảo:

- Giáo trình SPSS Tác giả: Nguyễn Văn Thắng và Phan Thành Huấn Nhà xuất bản

Trang 2

10 Tiêu chuẩn đánh giá sinh viên:

- Kiểm tra giữa kỳ 30% ‹

Điểm thưởng (nếu có): 10% (Bài tập nhanh / chuyên cắn)

- Thi cuối kỳ 10%

Tổng cộng 100%

11 Thang điểm: Thang điểm 10

12 Nội dung chỉ tiết môn học

Bài 1: Giới thiệu

Thống kê trong các nghiên cứu xã hội

Ý nghĩa của phương pháp thống kê trong các nghiên cứu khoa học xã hội Mục đích của việc sử đụng phương pháp thống kê xã hội

- Vai trd của máy tính trong thống kê Bai 2: Cac khái niệm cơ bản

Tổng thể (population) Mẫu (sample)

Bién (variable)

Dinh dé (proposition)

Biến độc lập (independent variable) Biến phụ thuộc (dependent variable) Thao tac hoa (operationalization) Do luong (measurement)

Bài 3 Chọn mẫu và Các loại thang do

Chon mau (sampling) Cac

loai thang do (scale)

Thang do danh nghia (nominal) Thang do thir bac (ordinal) Thang do khoang cach (interval) Thang do ti 1é (ratio)

Bài 4 Thẳng kê mô tả

Trình bày dưới đạng bảng (tables) Mô tả dữ liệu thô (raw data)

Phân bé tan sé (frequency distributions): biéu diễn dưới dạng tỉ lệ (proportion) va phan tram (percent)

Trang 3

~ test cho mẫu độc lập (independent-sample t-test)

Bai 6:

[ Thiết lập giả thuyét (hypothesis)

HH Công thức (formula) [ Giải thich (interpretation)

Kiểm định giả thuyết (tiếp theo)

- _ Cho mỗi quan hệ giữa hai biến định đanh (Chi-square test) [ Thiết lập giả thuyết (hypothesis)

[ Cơng thức (formula) đ Giải thích (interpretation)

13 Kế hoạch giảng dạy và học tập cụ thể * Đối với lớp học 05 tiết/tuần

Thời Nội dung môn học Số | Nộidunghociậpcủa | Số

gian tiệt sinh viên tiệt

Giới thiệu môn học - Các khái niệm cơ -Ý nghĩa của phương pháp

bản thông kê trong các nghiên

cứu khoa học xã hội

Đọc tài liệu: „ - Mục đích của việc sử dụng

KHI Thống kê ứng dụng trong kinh tê xã hội phương pháp thống kê xã

Tuần | Hoàng Trọng và Chu Nguyễn Mộng Ngọc hội

01 Chương I, tr 01-10 - Vai trò của máy tính trong 05

Ú5 | thống kê

- Các khái niệm cơ bản Các loại thang đo

l , - Thang đo đanh nghĩ

Thông kê ứng dụng trong kinh tê xã hội Hy pene

5 : © nga - Thang do thir bac

Hoàng Trọng và Chu Nguyên Mộng Ngọc , „

Chương L tr 11-14 -_ Thang đo khoảng cách

- Thang do ti lệ

Chon mau - Chon mau xdc suat

Doc tai ligu: „

(O Thông kê ứng dụng trong kinh tế xã hội

Tuân | Hoàng Trọng và Chu Nguyễn Mộng Ngọc oo -

02 Chương II, tr.16-34 0517 Trình bày dưới dạng bảng 05

Thống kê mô tá: Báng phân bỗ tần suất

Thống kê ứng dụng trong kinh tế xã hội Hoàng Trọng và Chu Nguyễn Mộng Ngọc

Chương HT, tr 38-40 -_ Mô tả đữ liệu thô

-_ Phân bỗ tần số: biểu điễn

đưới dạng tỉ lệ và phần

trăm

- Phan bé tan số lũy tiến

Trang 4

Thống kê mô tả : Mô tả độ phân tán biến g4 |- Cách độ 05

- Phương sai

Đọc tài liệu: , -_ Độ lệch chuẩn

ĐI Thông kê ứng dụng trong kinh tê xã hội T

Hoàng Trọng và Chu Nguyễn Mộng Ngọc

Chương IV, tr 66-89 Bai tap

ue Thi giữa kỳ

Thống kê suy luận : Kiểm định giả

à thuyết về trung binh (T/Z) -

™ 5 T-test cho mau déc lap

Đọc tài liệu: „ 05 | (independent-sample t-test) 05

Thông kê ứng dụng trong kinh lê xã hội

Hoàng Trọng và Chu Nguyễn Mộng Ngọc Bài tập

Chương VHI, tr 208 - 228

Thống kê suy luận : Kiểm định giá thuyết

Tuần về môi quan hệ (Chi-Square (esÐ) -_ Mỗi quan hệ giữa hai biến

06 Doc tai ligu: II Thắng kê ứng dụng trong kinh tế xã hội 05 định danh (Chi-square test) 05

Hoàng Trọng và Chu Nguyễn Mộng Ngọc

Chương VHI, tr 228-246 Bài tập

Tp.HCM tháng 02 năm 2017 GV Phụ trách môn học;

1hS Võ Bình Nguyên

Trang 5

THONG KE CHO

KHOA HOC XA HOI

(36 tiếp

Th§ Võ Bình Nguyên Trường Đại học Khoa học Xã hội và Nhân văn

Mobile; 090.909.5,903

Email: vonguyen@hemussh.edu.vn

Bồ cục chương trình

Giới thiệu mơn học Các khái niệm cơ bản

m Biến và thang đo ø Thống kê mô tả

œ Thống kê suy diễn

đữãne#8aứữnứm

Về mơn học

Tên học phần: Thống kê cho Khoa học Xã hội

Số đơn vị học trình:2 TC

Trình độ: sinh viên nămthứ l và 2

Phân bỗ thời gian: 30 tiết

Mục tiêu của học phần: Cung cấp cho sinh viên những khái niệm và kiên thức cơ bản về thông kê, về khả năng nhận định và kiêm tra những giả thuyết

thông kê trong nghiên cứu khoa học

Mô tả vắn tắt nội dung

Môn học, bao gồm phần bài giảng, thảo luận, và

bài tập,

Cung cấp những khái niệm và kỹ thuật cơ bản về thống kê giúp cho sinh viên trong việc xử lý những kết quả thu được từ những cuộc nghiên cứu điều tra thực tế trong nhiều lĩnh vực khác nhau như:xã hội học, nhân học, báo chí, địa lý, v.v

Nhiệm vụ của sinh viên - Dự lớp: 30 tiết

- Làm bài tập tại lớp hoặc bài tập ở nhà

- Chuẩn bị các câu hỏi, bài tháo luận ~ Dụng cụ học tập: máy tính bỏ túi

Nội dung chỉ tiết học phần

«Bài 1: Giới thiệu (1 tiế)

«Bài 2: Các khái niệm cơ bản (3 tiếu

«Bài 3: Các loại thang đo (2 tiế) «Bài 4: Thống kê mô tả (12 tiếp

œBài 5: Thống kê suy diễn (9 tiếp)

œBài 6: Kiểm định giả thuyết (3 tiét)

Trang 6

Nội dung chỉ tiết học phần

n Bài |; Giới thiêu (1 tiếp

ø Thống kê trong các nghiên cứu xã hội

= Ý nghĩa của phương pháp thống kê trong các nghiên cứu khoa học xã hội

m Mục đích của việc sử dụng phương pháp thống

kê xã hội

w Vai trò của máy tính trong thống kê

Bài 2: Các khái niệm cơ bản (3 tiết)

m Tổng thể (population) = Mẫu (sample) a Bién (variable) a Dinh dé (proposition)

Bai 2: Cac khai niém co ban (t.t) a Bién déc lap (independent variable) a Bién phu thudc (dependent variable)

Thao tac hoa (operationalization) Do ludng (measurement)

Bài 3: Các loại thang đo (2 tiết)

Thang đo danh nghĩa (norminal) 8 Thang đo thứ bậc (ordinal)

m Thang đo khoảng cách (interval) m Thang đo tỉ lệ đatio)

Bài 4: Thống kê mô tả (12 tiết) Trinh bay đưới dạng bắng (tables) Mô tả dữ liệu thô (raw đata)

Phân bổ tần số (frequency distributions):

biểu dién dudi dang tf 1€ (proportion) va phan tram (percent)

Phân bổ tan số lũy tiến (cummulative)

Bài 4: Thống kê mô tả (1)

= Mô tả độ tập trung của biến (central

tendency): yéu vị (mode), trung vi (median),

và trung bình (mean)

ø Mơ tả độ phân tán của biến (dispersed

tendency): cách độ (range), phương sai (variance), độ lệch chuân (standard deviation)

Trang 7

Bài 5: Thống kê suy diễn (9 tiếp)

Kiểm định giả thuyết

> Ztest

z Thiết lập giả thuyết (hypothesis) ø Công thức (formula)

a Giai thich (interpretation)

Bài 5: Thdng ké suy dién (t.t)

> T-Test cho m4u phụ thudc (dependent sample t-test)

a Thiét lap gia thuyét (hypothesis)

œ Công thức formula) m Giải thích (nterpretation)

Bài 5: Thống kê suy dién (t.t)

> T-Test cho mẫu độc lập (independent sample t-test)

a Thiét lap gid thuyét (hypothesis) a Céng thitc (formula)

m Giai thich (interpretation)

Bai 6: Kiém dinh gia thuyét (3 tiét)

> Cho mối quan hệ giữa haibién dinhtinh (Chi-

square fest)

m Thidt lap gid thuyét (hypothesis)

a Cong thitc (formula) # Giai thich (interpretation)

Muc Dich của Thơng Kê

đ Tập hợp và mô tả dữ liệu đ Phân tích đữ liệu

m1 Đưa ra những kết luận từ đữ liệu

Thống kê cung cấp phương pháp: n Thiết kế: lập kế hoạch và tiến hành nghiên

cứu

n Mô tả: tập hợp và khai thác dữ liệu

G Suy diễn: đưa ra những dự báo hay khái quát hóa hiện tượng từ việc phân tích dữ liệu

Trang 8

Thiết kế

q Giúp xác định phương cách tốt nhất để thụ thập dữ liệu nghiên cứu

Œ Ví dụ, những yếu tố trong việc thiết kế 1 cuộc

nghiên cứu là xem xét làm thể nào để tiến

hành một cuộc điều tra, bao gồm xây dựng bảng câu hỏi và chọn mẫu

Rete

Mô tả

œ Mô tâ và khai thác dữ liệu ~ bao gồm những cách thức tổng hợp và khai thác các đặc trưng của dữ liệu đã được đo lường

a Muc đích chính là xác định những số liệu rời

rạc, không có ý nghĩa và trình bày chúng trong một cách có ý nghĩa và có thể hiểu

được 1 Suy diễn

Œ Bao gồm những cách để đưa ra các dự báo

dựa trên dữ liệu thu thập được

Hñ Những sự dự báo này được gọi là những suy luận thông kê

Vai trị của máy tính trong thông kê

SPSS: Statistical Package for the Social Sciences

Một công cụ hữu hiệu để phân tích dữ liêu

Tương đối dễ sử dụng

Đồi hỏi sự thành thao một vài kiến thứcvề phương pháp nghiên cứu

a

œ Được dùng phổ biển bởi các nhà khoa học xã hội

ao a

Hoc cai gi?

O Cac khai niém co ban (basic concepts) © Bién va Thang do (variable & measurement)

Một vài thống kê mô ta (descriptive statistics) œ Kiểm định giả thuyết (hypothesis testing)

Tài liệu học tập

_thong keer

© Giáotrinh chính Tà

1 Thống kê ứng dụng trong linh Ỷ tế xã hội Tác giả Hoàng Trọng

va Chu Nguyễn Mộng Ngọc, Nhà xuất bản thống kề, năm

2007

2 Thống kê trong nghiên cứu xã

hội Tác gia: Alan Agresti va *

Barbara Finlay Nha xudt ban s—

Prentice Hai, năm 1997 Sanne

Trang 9

Tài liệu học tập

ä Sách tham khảo

1, Giáo trìnhSP§§ Tác giả Đỗ Văn Thắng và_

Phan Thành Huân Nhà xuất bản Đại học Quốc gia TPHCM, năm 2003

2 Phân tích đữ liện nghiên cứu với SPSS Tác giả Hoàng Trọng và Chủ Nguyễn Mộng Ngọc Nhà xuất bản thông kê, năm 2005

Đánh giá ra sao?

œ Thang điểm: 10 đ Trong đó:

@ 30% kiểm tra giữa kỳ

+ Điện thưởng: 109% (nếu có)

+> Bài tập nhanh : Chuyên cân a 70% kiểm tra cuối kỳ

œ Đưới 50% ~> điều gì xây ra?

% Hoc lai® Kháo sát lớp học 1 Giới tính 1, Nam 2.Nữ

2 Tổng số anh chị em trong gia đình (kể cả bản thân):

3 Thích ăn loại fast food nào?

1 KFC

2 Lotteria 3 McDonald's 4, Loại khác

4 Điểm trung bình chung học kỳ gần nhất: / 10,0

5 Bạn ở nông thôn hay thành thị (trước khi vào DH)

1 Nông thôn 2 Thành thị 6 Có phải là người thức đậy sớm?

1 Có

2 Không

7 Thời gian dành cho việc tự học trung bình mỗi

ngẦY: giờ?

8 Anh chị thường tìm tài liệu học tập ở đâu (Có

thé chon nhiêu đáp án) 1 Tù thầy/ cô cũng cấp

2 Từ bạn bè/ sinh viên khóatrước

3 Tự tra cứu trên internet 4 Khác

Trang 10

9 Tâm trạng khi học môn Thống kê xã hội

1 Rất lo lắng @ 4 Thích

2 Lo lắng vừa phải 5 Rất thích © 3 Bình thường ©

10 Khoảng cách từ chỗ ở đến lớp học: .km./

CøNhững mong muốn đạt được của bạn khi học

môn Thống kê cho khoa học xã hội? t2

THỐNG KÊ LÀ GÌ? Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con

số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong những điều kiện

thời gian và địa điểm cụ thể

Thống kê chía thành 02 lĩnh vực:

+ Thống kê mô tả:B ao gồm các phương pháp

thu thập, mô ta và trình bày số liệu;

Thống kê suy diễn: Bao gồm các phương

pháp như ước lượng, kiểm định, phân tích

mối liên hệ, dự đoán, ị

QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ

XÁC ĐỊNH MỤC ĐÍCLL NỘI DỰNG, DỐI TƯỜNG VẤN ĐỀ NGHIÊN CÚU

XÂY ĐỰNG HỆ THỐNG GÁC KHÁI MỆM, CHE TIEU THONG KE

DIEU TRA THONG KE

XỬ LÝ SỐ LIỆU: —_

“TẬP HỢP, SẮP XẾP SỐ LIỆU CHON CAC PHAN MEM XU LY 96 LIRU

PHAN TICH THONG KỆ SƠ BỘ

THÂN TÍCH VÀ GIẢI THÍCH KẾT QUA

DỰ ĐỐN XU HƯỚNG PHÁT TRIEN CỦA HIỆN TUGNG

VIỆT BẢO CÁO VÀ TRUYỂN ĐẠT KẾT QUÁ NGHIÊN COU

Các khái niệm cơ bản

_ Tổng thể (population): là tập hợp các phần tử được quan tâm trong một nghiên cứu Nó

có thê hầu như là mọi thứ

Vị dụ: dân số Việt Nam, tổng thể sinh viên của

trường ĐH KHXH&NV hay tông số sinh viên của một Khoa

Trang 11

Các khái niệm cơ bản (t.t)

ñ_ Mẫu (sample): là tập hợp con của téng thé Vị dụ: Một công ty nghiên cứu thị trường tiễn được chon ra để tiền hành thu thập dữ liệu hành khảo sát 650 người tiêu dùng để thu thập

nghiên cứu thông tin về thị hiểu dùng sữa của người dan

Khi mẫu duoc chon đảm bảo tính đại diện, sẽ thành phơ HCM

có thể sử dụng đề suy rộng ra các đặc Trưng của tổng thể

Các khái niệm cơ bản (1.0 Các khái niệm co ban (t.t)

Hi Biến (variable): là tập hợp các đặc trưng và n Định đề (proposition): là một phát biêu về giá trị được dùng đề chỉ một khái niệm môi liên hệ giữa các khái niệm

biến Giới tính: có hai giá trị nam và nữ; Xí du:

biến Tơn giáo: bao gồm Phật giáo, Thiên chúagiáo, Hút thuốc lá dẫn đến bệnh ung thư phổi, hay

Tin lành, Hòa Hảo, khác và không tôn giáo Quan hệ tình dục khơng an toàn đẫn đến nguy

cơ nhiễm HIV/AIDS

Các khái niệm cơ bản (tt)

ci Biến độc lập Gndependent variable): là biến œ Vídụu, hút thuốc lá => biến độc lập

được dùng để giải thích cho nguyên nhân của ung thư phổi = biến phụ thuộc

một hiện tượng

œ_ Biến phụ thuộc (dependent variable): duoc giới tính => biến độc lập

coi là biển kết quả, nó chịu sự chỉ phối của lựa chọn ngành học ©Ð biến phụ thuộc biên độc lập

Trang 12

Các khái niệm cơ bản (.t)

G Thao tac héa (operationalization):

Là một phương pháp để quan sát và ghỉ nhận

những khía cạnh của một cá nhân, khách thé,

hay một sự kiện có liên quan để tiến hành

kiêm định giả thuyết

Vi du: khai niém vé kinh té bén vũng, bao

gồm các chỉ báo cập 1: - Giáo dục

- Tỉ lệ xuất khâu

- Nhập khẩu

- hay T lệ tăng trưởng kinh tế

Các khái niệm cơ bản (t.t)

Q Bo iwong (measurement): 1a cach thie gan những con sô hay giá trị cho các quan sát theo một quy tắc nhật định

Ví du:

Thu nhập: (1 triệu, 2 triệu, 3 triệu, 4triệu, .);

Trình độ học vấn (cấp 1, 2, 3, ĐH, .)

Biến (Variable)

œ Hai loại biến:

+ Biến định tính + Biến định lượng

* Đối với biến đỉnh tính, những đặc trưng phân biệt

dựa trên sự khác biệt về đặc tính, chứ không phái vệ số lượng hoặc độ lớn

“+ Các biến được gọi là đình lương khí mà các giá trị của biến cho thấy sự khác biệt về độ lớn hay số lượng giữa chúng,

Các loại thang đo

co Tương ứng với 02 loại biến định tính và định

lượng, có 02 loại thang đo chính:

> Thang đo biến số chữ:

+ Thang do danhnghia/dinh danh(Nominal scale) + Thang do thirbac (Ordinal scale)

>> Thang đo biến số số:

+ Thang đo khoảng (ntervabcale)

+ Thang đo tỉ lệ(Ratio scale)

Thang đo danh nghĩa (Nominal scale)

@ Thang đo danh nghĩa là loại thang đo định tính và thường được dùng tật rộng rãi với các tiêu thức thuộc tính mã các biểu hiện của nó là một hệ thống các loại khác nhau, như: Giới tính, khu vực địa lý, nghê nghiệp, tôn giáo,

Các con số trên thang đo không biển thị quan hệ hơn kém, cao thấp, nhưng khi chuyển từ số _ bay sang số khác thì dấu hiệu “do đã có sự thay đổi về chất

Trang 13

Thang đo danh nghĩa (Nominal scale)

ti Một biến đượcxác định bởi thang đo danhnghia bao

gôm hệ thông các chỉ báo khác nhau biểu thị thuộc

tính hay tính chất của biến đó

Œì Các chỉ báo này có tính chấtngang nhau và không theo một thứ tư nào

0 Mét thang do danhnghia phải có 2 chỉ báo trở lên

Vi du n Giới tính 1.Nam 2.Nữ f1 Tình trạng hơn nhân !, Độc thân Có gia đình Ly thân Ly di Goa we YN Vi du

q Công ty ông/ bà đang hoạt động chính trong lĩnh vực nào? Sản xuất Mở Xây dựng Dịch vụ Thương mại Khác wR we

Thang do thir bac (ordinal scale)

o La thang do danh nghĩa nhưng các chỉ báo hay các phương án trả lời được sắp xếp theo một trật tự

nhất định

Nói một cách khác, giữa các chỉ báo này có quan hệ thứ bậc hơn kém, nhưng thường thì mức độ hơn kém giữa chúng không xác định được

Thang đo thứ bậc (ordinal scale)

HThanh đo thứ bậc thường được sử dụng cho các đặc điểm thuộc tính, và đơi khi cũng được áp

dụng cho các đặc điểm số lượng

oThuéc đo độ tập trung là mode hay trung vị,

trung vị cung cấp nhiều thông tin hơn là mode

Ch úng ta cũng hay gặp loại thang đo này trong các câu hỏi dạng so sánh

Ví dụ

a) Anh/chi/éng/bahay xếp hạng các chủ đề sau trên

báo Sài Gòn Tiếp Thị tùy theo mức độ quan tâm

(Chủ đề nào quan tâm nhất thì ghỉ số 1, quan lâm

thứ nhủ thì ghỉ số 2, quan tâm thứ ba thì ghỉ số 3)

- Thơng tin thitrường -Muasim aaa -Giađình —

Trang 14

Vị dụ

Œ_ Thu nhậptrung bình hàng tháng

Dưới 500 ngàn Bi

Từ 500 ngản đến dưới 1 triệu 2

Từ 1 triệu đến dưới 2 triệu na

Từ 2 triệu đến dưới 3 triệu Há Từ 3 triệu trở lên Qs

fi Thu nhap cia anh/chi/éng/ba hangthang:

1.<3 triệu đồng 2.Từ3-5 triệu đồng 3 > 5 triệu đồng

Ví du (t.t)

O Kinh té gia đình so với 5 năm trước

Khá hơn rất nhiều HI

Kha hon chút đỉnh 2 Cũng vậy Hà Té hon chit dinh B4

'Tệ hơn nhiều os

Thang do khoang (interval scale)

tLà thang đo có đầy đủ tính chất của một thang đo danh nghĩa và thứ bậc, nhưng khoảng cách giữa các chí số được xác định một cách cụ thể và đều nhau

Đối với loại thang đo này ta có thể sử đụng một sơ các phép tính tốn học như tính trung bình hay tính tốn tỉ lệ chênh lệch giữa các chỉ số

Thang do khoang (interval scale)

lai Dữ liệu thu thập từ thang đo khoảng có thể là mode,

trung vị và trưng bình cộng, trong đồ trung bình cộng chứa nhiêu thơng tín nhất

n Điểm “không” củathang đo này là tùy ý

XD: Thang do nhiệt độ hôm nay là 12°C (53,6 °F) và hôm qua là 6° (42,8°F), Nhiệt độ hôm nay âm áp gấp đôi hôm qua ? Nêu chuyên từ ®C sang °F thì tỷ lệ không con 14 2/1 (53,6/42,8)

Hơn nữa, nêu nhiệt độ là 0%C, khơng có nghĩa là khơng có nhiệt độ 0°C tương đương với 32°F đương nhiên là âm hơn 10°E

Thang do khoang (interval scale)

=> Nhu vay thang đo khoảng cho phép chúng ta đo lường chính xác sự khác nhau giữa hai giá trị bất kỳ (trong thang đo thứ bậc thì khơng thê)

Œ Ta hay gặp loại thang đo này trong các câu hỏi phòng vân dạng đánh giá

Bạn có đồng ý hay khơng với nhận định: “Những người có học vẫn cao sẽ có thu nhập cao ”

1 2 3 4 $ 6 7 tả thông sit ding y

ding $

Thang do ti Ié (ratio scale)

gThang đo tỉ lệ là thang đo dùng cho đặc tính số

lượng

nMột thang đo tỉ lệ có tất cả những phẩm chất của

những loại thang đo trước Ngoài ra thang đo này

có một giá trị 0 “thực”, cho phép lấy tỷ lệ so sánh

giữa hai giá trị thu thập

Trang 15

Thang đo tỉ lệ (ratio scale)

D Tương tự như thang đo khoảng, khuynh hướng trung tâm của dữ liệu thu thập từ thang đo tỷ lệ có thể là mode, trung vj và trung bình cộng, trong đó trung bình cộng chứa nhiều thông tỉn nhất

f1 Sự khác nhau giữa thang do khoảng và thang đo ti thường bị lẫn lộn vì hai điêm sau:

+ Điểm “0° trongthang đo tỷ lệ là một trị số thật

+ Trong thang đo khoảng, sự so sánh về mặt tỷ lệ giữa các giá trị thu thập khơng có ý nghĩa

a

Vidu:

n Thu nhập trung bình hàng tháng:

œ 5.000.000đ

ư Tuổi:

Ngồi ra cịn có các loại thang đo tỷ lệ khác như: mét, kg, tân, tạ,

Vi du

oNéu ban có 5 triệu đồng, anh của bạn có 10 triệu

động => Sô tiên của anh ban gap đôi số tiên của bạn (kế cả quy đôi sang $, £, X, )

Nếu số tiền của bạn bị mất hay bị đánh cắp thì

bạn có 0 đồng Số 0 ở đây là giá trị that

=> Tiền tệ có trị số 0 là thật và loại thang đo ở

đây chính là thang đo tỷ lệ

Biên [Định lượng Thang do Thang do định tính định lượng

Thang do Thang do Thang do Thang do danh nghia thứ bậc khoảng tỉ lệ

Các chỉ báo được Khoảng cách giữacác Gia te

sắp xếp theo 1 chí số được xác định “thực” { trật tự nhất định một cách cự thể

CAP BAC BO LUONG VA THANG ĐO

+ Trong thực tế, vận đề thang đo phứctạp và trở nên quan trọng hơn nhiêu vì:

> Chúng ta có thể áp dụng thang đo địnhtính đối với đặc điểm sô lượng (thu nhập, chỉ tiêu)

> Ngược lại, có thể áp dụng thang đo định lượng đối

với các đặc điểm thuộc tính(đồng ý, khơng đồng ý)

=> Trong các trường hợp này, loại dữ liệu ta thu thập được là tủy thuộc vào thang đo, chứ không phải tùy thuộc vào tiêu thức thông kê đề thu thập đữ liệu

Chọn mẫu

Mục tiêu chọn mẫu

Mẫu được chọn phải phản ánh một cách chính xác về những đặc điểm của tơng thể

— Chỉ có như vậy thì tổng thể mẫu mới có khả năng đại diện cho tổng thể chung nghiên cứu,

Trang 16

Mục tiêu chọn mẫu

Tổng thể: Bao gồm toàn bộ cáccá thể mà chúng ta đang quan tâm

Mã à một phần của tổng thể, bao gồm những cá thể mà chúng ta sẽ nghiên cứu Lý đo chọn mẫu

œ Tiết kiệm thời gian và chỉ phí

d Các nghiên cứu căn cứ trên dữ liệu mẫu thực sự có tính đại diện thường tốt hơn nghiên cứu toàn bộ tổng,

thể,

a Kha nang sai sót khi điều tra nghiên cứu trên mẫu sẽ

thấp hơn so với khi nghiên cứu trên tổng thể, đồng

thời có thể tập trung các chuyên gia có trình độ vào nghiên cứu

Khung mẫu (Sampling frame)

{_ Khung mẫu là danh sách các đơn vị của tổng thể cần

nghiên cứu, cân thu thập dữ liệu

Đanh sách này còn được gọi là khung lấy mẫu hay

đàn chọn mẫu

q_ Các đơn vị tổng thể trong danh sách này có thể được sắp xếp theo một trật tự nào đó, ví đụ như vẫn ABC,

theo quy mô, theo địa chỉ, và được gán cho một số

thứ tự từ đơn vị thứ 1 đến đơn vị cuối cùng

Các phương pháp chọn mẫu

1 Phương pháp chọn mẫu ngẫu nhiên:

> Chon mau ngẫu nhiên đơn giản;

+ Chọn mẫu ngẫu nhiên hệ thống;

+ Lấy mẫu cả khối/ cụm và lấy mẫu nhiều giai đoạn;

“> Lấy mẫu phân tầng 2 Lấy mẫu phí xác suất

Phương pháp chọn mẫu ngẫu nhiên đơn giấn

(Simple random sampling)

a La phuong phap chon mau trong dé méi đơn vị của tổng thé được chọn với sự ngẫu nhiên như nhau, hay nói cách khác là các đơn vị tổng thể được chọn vào mẫu với cơ hội bằng nhau

+ Từ khung mẫu và số thứ tự từng đơn vị, thực hiện

việc lấy đơn vị mẫu ra bing nhiều cách như bốc

thăm, quay sô, hay dùng số ngẫu nhiên

+ Hỗ trợ từ phần mềm máy tính Exeel, SPSS Hoặc,

dùng cách lấy mẫu hệ thống

Phương pháp chọn mẫu ngẫu nhiên đơn giản

(Simple random sampling)

Papulation me

Trang 17

Phương pháp chọn mẫu ngẫu nhiên hệ thống

(Systematic sampling)

Trong mẫu ngẫu nhiên hệ thống, chỉ cần

chọn ra một con số ngẫu nhiên là có thể xác

định được tất cả các đơn vị mẫu cần lấy ra từ danh sách chọn mẫu (thay vì phải chọn ra n số

ngẫu nhiên ứng với n đơn vị mẫu cần lấy ra)

Phương pháp chọn mẫu ngẫu nhiên hệ thống (Systematic sampling)

œ_ Quy trình lấy mẫu hệ thống bao gồm các bước:

* Khung mu đã được đánh số thứ tự cho các đơn vị trong

danh sách, tổng số đơn vị trong danh sách là N

vˆ Xác định cỡ mẫu muốn lay, ví dụ n quan sat

Y Chia N đơn vị tống thể thành k nhóm theo cơng thức:

k= Nya, k duge goi 14 khoảng cách chọn mẫu

v Trong k đơn vị đầu tiên, ta chọn ngẫu nhiên ra một đơn vị, đây là đơn vị mẫu đầu tiên, các đơn vị mẫu tiếp theo được

lây cách đơn vị này 1 khoảng 14 k, 2k, 3k,

*

Phương pháp chọn mẫu ngẫu nhiên hệ thống

(Systematic sampling)

a Nhu vay có thể nói chọn mẫu hệ thống là phương pháp chọn mẫu trong đó các đơn vị mẫu được chọn ra cách nhau một khoảng là k đơn vị

‘Sample every #°)

Phương pháp chọn mẫu ngẫu nhiên hệ thông

(Systematic sampling) a Có hai trường hợp chọn mẫu hệ thông:

# Trường hợp 1; Lấy mẫu hệ thống đường thẳng

(Linear systematic sampling) khi k 1a s6 nguyén

(N chia chan cho n)

Truong hop 2: Lay mau hé théng quay vòng {Circular systematic sampling) khi k là sô thập

phân (N không chia chan cho n)

THỊ: Lây mẫu hệ thống đường thắng

a VDLN =64,n= 10;

k=64/10=6,42 lấyk=6

Chọn 1 số ngẫu nhiên từ 1 đến 6:

+ Nếu số ngẫu nhiên được chọn là 1, thì các đơn vị

lấy ra sẽ là: 1, 7, 13, 19, 25, 31, 37, 43, 49, 55, 6]

(chọn được tới 11)

z Nếu số ngẫu nhiên được chọn là 6, thì các đơn vị

lấy ra sẽ là: 6, 12, 18, 24, 30, 36, 42, 48, 54, 60

{chọn được 10)

TH: Lấy mẫu hệ thống đường thẳng

a VD2: N= 66,n= 10;

k= 66/10=6,6 9 yk=7

Chon | sé ngẫu nhiên từ 1 đến 7:

> Néu số ngẫu nhiên được chọn là 2, thì các đơn vị lấy ra sẽ là: 2, 9, 16, 23, 30, 37, 44, 51, 58, 65

(n=10)

z Nếu số ngẫu nhiên được chọn là 4, thì các đơn vị lấy ra sẽ là: 4, 11, 18, 25, 32, 39, 46, 53, 60 (n = 9)

"

Trang 18

TH2: LẤy mẫu hệ thống quay vòng

a Khi tổng thể N không chia chẵn cho n mẫu thì các

đơn vị khơng có cùng Ì xác suất chọn ra như nhau và khí dùng kết quả trung bình mẫu để ước lượng

trung bình tơng thể thì rất có khả năng bị lệch

» Chọn mẫu hệ thống quay vòng

TH2: Lấy mẫu hệ thống quay vòng

Giá sử cần chọn ra n đơn vị mẫu từ tổng thể N, thứ tự các bước như sau:

» Tinh khoảng cách chọn mẫu:k =N/n

> Chon 1 số ngẫu nhiên trong khoảng từ | dén N, don vi

mẫu đầu tiên có số thứ tự với số đã được chọn ra, > Các đơn vị tiếp theo cách đơn vị mẫu đầu tiên I khoảng

Ik, 2k, 3k,

>_ Nếu hết danh sách N đơn vị chưa đủ n đơn vị mẫu, ta quay

trở lại từ đầu danh sách với quy ước: N + l tương đương

với đơn vị thứ nhật; N + 2 tương đương với đơn vị thứ hai trong danh sách

TH2: Lấy mẫu hệ thống quay vòng

a VDIN=13,n=4

Tính khoảng cách chọn mẫu:k = 13/4 = 3,25 = chọn k=3

Lay 1 số ngẫu nhiên trong khoảng từ 1 đến 13,

ví dụ chọn được số 6, các đơn vị mẫu tương ứng sẽ là:

6,9, 12, và [(12+ 3)— 13]=2

Cách tính:Khí số thứ tự lớn hơn N thị

Số thứ tự chọn mẫu = Số thứ tự - N

Lấy mẫu cã khối/ cum (Cluster sampling) va lay mau nhiéu giai doan (Multi-stage sampling)

a Chon miu cả khối/cụm hay chọn mẫu nhiều giai

đoạn giúp chúng ta vượt qua điều kiện đầu tiên của chọn mẫu ngẫu nhiên là phải có danh sách

các đơn vị chọn mẫu/ khung chọn mẫu ngay từ đầu

Đầu tiên, tổng thể được chia thành nhiều cum, mỗi cụm xem như lä một tổng thể con, lấy ngẫu

nhiên đơn giản m cụm, sau đó khảo sát hết các đối tượng trong các cụm mẫu đã được lấy ra

Lấy mẫu câ khối/ cụm (Cluster sampling)

va lay mau nhiéu giai doan (Multi-stage sampling)

{2 clusters) Clustered Population

_ Lay mau ca khdi/ cum (Cluster sampling)

va lây mẫu nhiêu giai doan (Multi-stage sampling)

a Do cụm mẫu thường được chọn các yếu tế như: vị

trí địa lý, các tơ chức, đơn vị xã hội, các cụm dân cư, Sau khi có danh sách các cụm, tiến hành chọn ngẫu nhiên để xác định các cụm đại diện, sau đó chọn ngẫu thiên các phan tk trong mdi cum để lập danh sách mẫu nghiên cứu Cứ tiếp tục như vậy chúng ta có chọn mẫu nhiều giai đoạn

VD: Nội thành HCM > Quận > Phường > Khu phố/ Tổ dân phố > Khối nhà

Trang 19

Lấy miu phan tang (Stratified sampling)

a Chon mau phân tầng được sử dung khi chúng ta đã biết thông tin về tổng thể dân số trước khi chọn mẫu a Để bất đầu, tất cả những phần tử của tổng thể sẽ được phân biệt theo những đặc tính của chúng, và

được xếp vào từng tầng khác nhau Tiếp theo, các

phân tử sẽ được chọn ngẫu nhiên theo các phân tầng đó

Lấy mẫu phân tầng (Stratified sampling)

Ví dụ: Một trường ĐH có 1⁄4 nữ và 1⁄4 nam, vậy mẫu được chọn cũng sẽ có tỷ lệ tương tự

Lấy mẫu phân tầng

n VD Tại một trường ĐH có 20.000 SV ở 5 hệ dao

tạo và cấp đào tạo khác nhau, để khảo sát về chất

lượng và mức độ hải lòng của sinh viên.Mỗi hệ đào tạo cử nhân và cấp đào tạo cao học được coi 1a 1

tang

ao Số lượng dự định lây là 1000 (5% của tông thổ),

_ nếu phân bê mẫu vào từng tầng theo tỷ lệ thì kết quả như trong băng sau:

Lấy mẫu phân tầng

HỆĐT/Cấp ĐT SốlượngSV %S§V SLSV lấy ra từng tổng Cử nhân hệ CQ 10.000 50% s00 Cử nhân hệ liên thông 2.000 10% 100 Cử nhân VB2 2.000 10% 100 Cử nhân VLVH 5.000 25% 250 Cao học 1.000 3% 30 20.000 100% 1.009

ä Trong bang nay, SLSV Chinh quy chiém 50% tông thé vi vay mau lay ra cũng chiếm 50% toàn bo: mẫu Điều này cho thấy tý lệ lây mẫu bằng nhau gÌữa các tảng Tiêu cơ câu của mẫu giống hệt như cơ cầu tông của tổng thể thao các tầng

a

Lấy mẫu phí xác suất (Non-probability sampling) Trong thực tế, nhiều khi chúng ta khơng có thời gian, thơng tin và chỉ phí để thực biện lấy mẫu ngẫu nhiên —» Lấy mẫu phí xác suất (hay mẫu phi ngẫu nhiên)

MẪU phí xác suất khơng đại diện để ước lượng

cho tồn bộ tơng thể, nhưng được chấp nhận

trong nghiên cứu khám phá và trong kiểm định

giả thuyết

Lấy mẫu phi xác suất (Non-probabiliy sampling) Oo Lấy mẫu thuận tiện (convenient sampling)

- Mẫu thuận tiện được dùng khi bạn muốn có một

ước lượng sơ bộ về kết quả bảng câu hỏi bạn quan tâm mã không muốn mất nhiều thời gian và chỉ phí, - Cần suy nghĩ kỹ về thời gian, địa điểm hay hoàn

cảnh mà ta sẽ gặp đối tượng và thu thập dữ liệu ở đó

(khơng tùy tiện, ngẫu hứng)

Ví dụ: Vấn đề sv quan tâm trong trường ĐH hiện nay; Hay vấn đề du lịch, giải trí của phụ nữ ở tầng

lớp trung lưu ở đô thị lớn

Trang 20

Lay mau phí xác suất (Non-probability sampling)

o Lay mau định mire (quota sampling)

-LÁ y mẫu định mức tương tự như lấy mẫu xác suất

phân tang (phan chia tổng thê thành các tầng — tổng thể con) Điểm khác biệt cơ bản là trong từng tổng thể con người phỏng vấn được chọn mẫu tại hiện trường theo cách thuận tiện hay phán đoán, trong khi mẫu phân tang chọn ra theo kiểu xác suất

Vị du: Lấy mẫu 400 người lớn tại Tp, người NC có thể quyết định 50% nam ~ nữ; trong đó 1⁄2 trên 40

tuổi;⁄2 là lao động tự đo,

Lấy mẫu phi xác suất (Non-probability sampling) o Lay mau phan don (Judgement sampling)

Bạn chính là người quyết định sự thích hợp các đối tượng để mời họ tham gia vào mẫu khảo sát, do đó tính đại diện của mẫu khảo sát thực tế sẽ phụ thuộc nhiều vào kiến thức và kinh nghiệm của người nghiên cứu điều tra mà còn phụ thuộc vào những người thu thập đữ liệu trực tiếp

Chọn bao nhiêu là đủ?

Œ Quy mô mẫu:

_ N

1+ N(ey

Trong dé:

N: Quy mé téngthé

e: mức sai số mong muốn (tính bingty 1é %

từ công thức [1- độ tin cậy giả định])

Nếu không biết quy mô tổng thế?

3 Trong nhiều trường hợp, éu ta không biết trước được một cách cụ thê quy mơ của tong thé © rat kho chon được

mẫu xác suất,

_ Trong tình huỗng này, người ta thường ước lượng kích cỡ mẫu, sau đó tùy theo mà chọn tỷ lệ phù hợp (1%, 2%,

54 hay 10% của tông thể)

œ_ Để đảm bao cho phép thực hiện các tính tốn thống kê thì

dung lượng mẫu tôi thiểu phải là 30 đơn vị,

Q Néu khong biết được quy mô tổng thể, đương nhiên sẽ khơng kiểm sốt được mức sai số mẫu

BẰNG QUY MÔ MAU VOI CAC MUC SAI SO MONG MUON 42% | S% | 10% 33 oa sẽ 43? | X93 | at sẽ oF 98 ps sp 9060 | * | 1957] 999 | ssa i 383 j 99

Đầu * cho thầy là giã định về phân bố bình thường thấp,

đo đó không thể áp dụng công thức tính trong các trường hợp trên

Thực hành

œ Nhận biết thang đo của những câu hỏi sau đây:

Câu L: So với 5 năm trước, đời sống gia đình ta có tốt hơn khơng?

Khá hơn BI Khó trả lời 4 Cũng vẫn nhưthế 2 Không trả lời 99 Kém hơn trước v13

Trang 21

Câu 2: Xin Ông (Bà) vui lòng cho biết để dùng sinh hoạt hiện có

tong gia dinh (kém theo quan sát, nếu thấy nhường gì hiển nhiên

khơng có, khơng nêu hải)

Loai dé ding Loại đồ dùng

+ Giưỡng Ị - Cátxét (cd radio) On

- Giường bằng sạp tre [22 -Danmaynghenhac [12

~Tú f3 -Xeđạp OB - Bộ bàn ghế D4 -Xegắn máy DịỊ4

~ Bộ xa lông Gs -Máy may 1š

~ Tỉ vi đen trắng [6 -Tủ lạnh E16 - Tỉ ví màu C7 - May giat 117 - Đầu máy video [l8 - Điện thoại D1

- Radio 9 - Khác (ghí cụ thể, P19

- Chiêng, công,

dụng c âm nhạc DT [10 120

Câu 3: Ông (Bà, bạn) hãy cho biết mức độ thưởng thức các phương tiện truyền thông đại chúng, và các phương tiện giải trí

khác của mình

(Gợi ý bằng cách giới thiệu các phương tiện bên dưới rồi hỗi trong loại đó thường chọn loại hình nào?)

Đồng | Tuần | Tháng | Rấthiếm | lhơngbwsgi Lagi bình reày | vài lần | vài lần | trí Giám thường thất

vai

1 Đao Gey Oy {OS Be gn ctu 2 3 Nghermdo a) mT os hs Bqaduls

3 Zetdnuyn tình, ø | 0 a œ jđ BêqnduM

4 Eon sich a) mim Gt JÍS BồggdiuÐ5 $, XemAMiee a} Rm) ow oo ip $ Ngentasfrpới | OL | oe | 03 Ot | Banus *

Câu 4: Trong các phương tiện TTĐC trên, Ơng (Bà) thích loại

nào nhất ? (không tính: đến việc có thường xun xem lay

không, chỉ chọn một ý)

Boa tio” | Nano wadio | kam musta | Xe video | Bee akon T Nghe aia Bink Spine ain) 5 a œ Be BE G6

Câu 5: Trong các tờ báo đã đọc, Ông (Bà) thường đọc những mục

gì nhấU (Chỉ chọn tối đa 3 mục tường đạc nhất) Các mục í

Câu 6: (Chỉ hồi những người có nghe radio) Ơng (Bà) thường

nghe radio như thế nào?

© Thường nghe hấu hết tất cỉ các chương trình 8L © *nghe, nên lúc eink gip cdi gì nghe cái đấy œ

© Ln nghe chương trình quan tím nhất Ø Câu.7: Trong các chương trình truyễn hình, Ơng (Bà) thường coi chương trình nào nhiều nhất ? (Cñl chọn tối đa 3 mục thường xem nhấU

Các chượng tình văn nghệ

‘Tia afc wong awe an o

C4u 8: Trong các loại hình nghệ thuật nói chung, Ơng (Bà)

thích loại não?%(bao hàm cễ trên các PTTTĐC và sân khẩu)

Chọn tối đa 3 loại hình thích niưất rồi chọn thứ tự ta

tền:[Mã số: thích nhất:1; thích ở mức độ thứ nhì:2; thích È miức độ thứ:3] ta nhac ce Dene o7 fring 8 - Toằng, hết Đội ce + Kịch mãi Cpe

+ Lael tila krếo (ghi cụ th mu

Câu.9: Trong các loại nhạc sau, Ơng (Bà) thích loại nhạc nào? (Chỉ chọn tất đu 3 loại)

-Đâng oO Rigetige chiến 9 Nhạc hổi ngàn: oy - Ca khúc hiện đại Ủ -LajiMiếc

Câu 16: Và theo Ông (Bà), người Raglay ta cẩn phải học đến lớp mấy thì mới được?

Lớp: được đến đâu hay đến đấy 19

Câu 11: Nhưng trên thực tế gia đình ta có thể cho con cái học

Trang 22

Câu 12: Theo ông bà, có cần dạy chữ viết của người Raglai cho người Raglai hay không?

1c en

3 Không Ge

3, Khó trả lời 3 9 chuydn qua câu 24 Vì sao? (Ghi cụ thể,

Câu 13: Nếu trong gia đình khơng có điều kiện cho tất cả

các con đi học ,, theo ông bà nên ưu tiên cho con trai hay

con gái? 1.Con trai Ø1 2.Congái H2

14: Theo ông bà, khi rong nhà có người bị bệnh có

cần mời thây cúng đến cóng để được khỏi bệnh không?

(PVV không gợi ý, nếu người được phông vấn khó trẻ lời

thì nêu các phương pháp có thổ)

1 Nhất thiết phải mới ĐI 3 Mời cũng được, không mới cũng dược — f2

3 Không cần thiết phái mồi os

4 Không biết ti 5 Khó (Khơng trả l8) B5 Vì sa? (Giả cụ th)

Câu 15: Có nên lấy người khác với đân tộc mình khơng?

Loe Œ

3, Khơng Œœ 3 Khỏ trả lời ga

Câu 16: Có nên lấy người cùng họ với mình không?

108 8: 2 Không a 3 Khe trễ tới 8 Vi sao? (Ghi cy thé):

Câu 17: Trong gia đình ta, quyên quyết định cho con cái

kết hôn là ai?

1 Trưởng tộc (người đứng dẫu dang fo? Hi

2 Ong R

3.Ba 8

4 Cha O4

5 Me t5 ó Tự những người kết hôn quyết định 86

Câu 18: Trước khi kết hơn có cần xem tuổi cô dâu, chủ rể

khơng? 1.Có on 2 Khơng œ 3 Khó trả lời œ

Câu 19: Khi phụ nữ mang thai, họ có cần kiêng cữ điều gì

khơng? (rong sinh hoạt, ăn uống) 1,Có on

3, Khơng, m 3 Khả trổ li t5

Câu 230: Trước khi lập gia đình, người con trai, con gái có được ai

đồ giải thích, hướng đẫn những điều cần thiết khí lập gia đình

khơng? (Có thể chọn nhiều ý, PVV không đọc các phương án trả lời)

Lơng ot 6.Có, dì 8ó

2.Ba fa 1.Chủ, bắc a

3h os §Agưới có trích nhiệm trong lãng — Ơ

AM tH 9.Mót tổ chức nảo đó 88

5.Anh, chị ts 10.Khơng cố 010

Câu 2: Trong gia đình Ơng (Bà) ai là người quyết định những việc sau xác định mức quyết định của mỗi thành viên bằng những con số rôi viết vào cắc cột tưởng ông sao cho tổng mức qugết định = 10 phẫu )

Loại việc Mức để quyết | Mdcdé Ì Thành định của quyếi -Í viêo khúe

chứng đình của j (nhi rổ] IS? aa

3 hay aa nd etfs

5, Những quyết định có liển quaa đếu sức

, Mua các 46 ding dit rida (TY, xe a cửa con ea)

Trang 23

Câu 22: Ông (Bã) hãy cho biết đánh giá của mình về những nhận định dưới đây (khoanh vào ô tương ứng sao cho hàng nào cũng có mã số được khoanh và không trùng nhau)

StF Niững nhận định Đơng Ì heap | hở ý | đởngg | trả lì i i z Ậ

3 ‡ i $

3 cing vide cba dens neat ghey we t 2 5 + ig duit ohn oc sự vs sẽ cây ngyời chong † 2 3 3 L 2 3

& + 2 3

7 i + 3

8` | Phụ nữ không nôn Đam gia vàocông việc của thôn sốma,đe| 1 là Việc của đàn ông

Câu 23: Ông (Bà) hãy cho biết mức độ tiếp xúc với những người thân, bạn bè xung quanh như thế nào?

Những người mà người trổ | Thường Trinh | Khơng j Khơng (khó

lợi nói vặt trẻ Of là OF nó

CAu 24: Bay giờ tôi sẽ đọc tên các mối quan hệ mã chúng ta

thường có Ơng (Bà) hãy lắng nghe và cho chúng tôi biết mức độ quan trọng của từng mối quan hệ đối với Ông (Bà)

(Hãy gại ý để người trề lài xác định mỗi quan hệ quan trọng nhất rồi nói: cầu trong những quan kệ còn lại, cái nào quan trọng nhất? Khi có câu trễ tòi, khoanh tròn th tự theo tăng hằng)

Tàn kòn không đất quan

quan trọng Trọng,

1 Quan bệ trong ga định 123456789 0 3 Quan hệ vội bà con bọ làng 1 2 3 4 5 6 7 6 9 10 3 Chữa bệ với bạu bờ 123456789 0

4 Quan hệ với đồng nghiệp 1 3 3 4 5 060 7 8 9 10

5, Quan hệ với làng xòm, 123456789 10

6 Quan hệ v6iedlp ken 12343 67 8910

Câu.25: Bà con trong cộng đồng có thường đến thăm nhà Ơng (Ba) hay khơng?

106 8!

2 Không G2 *> chuyển qua cầu 26

Câu 26: Nếu có hãy cho biết mức độ họ đến thăm của họ

1, Vài Tấn một tuân OL 1 2 Vải lấn một thắng ta t6 3 Vài lấn trong nấm) 03 6 Không biết 06

Câu 27: Ơng(Bà) có thể mô tả người láng giêng ở sát

bên nhà mình như thế nào?

3/Cơi như người trong gia định 1 4 3Nhữ những ngỪii xalg 04 nhờ bạn bà: na 5 háng trả lối as luơ là những agưới quen ĐiếC D3 6 Kháng biết né

Câu 28: Khi trong nhà có người bị bệnh, thơng thường gia đình

Ơng (Bà) thường làm thế nào để họ khối bệnh? (chọn một

phương án thường xuyên nhất)

sit Điện gháp

1 Ra mamxd kha byob ue 2, Ra bdi bieu inte a 3 Tehva bbag drut cam oF 4 MỡHhầy đến cúng cà 5 Khối không trẻ le) 05

Câu 29: Ông (Bà) có biết các loại lễ hội từ trước tới nay do

cộng đồng mình tổ chức hay không? (kể câ những lỄ hội, ngày nay khơng cịn tổ chúc nữa)

Trang 24

Phan 1

Thong ké m6 ta (Descriptive statistics)

Théng kê mô tả là phương pháp liên quan

đến việc tổ chức, tổng hợp và trình bày số liệu thu thập được từ mẫu nghiên cứu hoặc tổng thê

1 Dữ liêu thô: Thích loại nước ngọt

3333333233313333313 23313333331

đ Một trong những lý do chính sử dụng phương

pháp thống kê là để tổng hợp và mô tả dữ liệu,

làm cho thông tin được trình bày rõ ràng hơn

PP thống kê mô tả dudi dang bang

© Phan phối tần suất: 1 bảng trình bày số lần

xuất hiện của một hay nhiêu giá trị được quan sát trong mẫu hoặc tông thê

PP thống kê mô tả dudi dang bang

cl Các kiểu phân phối tần suất mœ Thô (raw)

a Lién hệ (relative): tỉ lệ (proportion) va phan trim (percent)

a Lily tién (cumulative)

Phân phối tần suất

Ø Một số ky higu str dung trong tính tốn phân phơi tân suất

v n= téng sé mẫu quan sat v x= bién

¥ i gid trị (thành phần) của biến X

v ,# = tân suất quan sát của giá trị thứ ¡

Phân phối tần suất (t.t) œ Các thành phần (giá trị) của biến phải:

a Loại trừ lẫn nhau

= Bao phủ hết các trả lời

Trang 25

Phân phối tần suất (t.9 = Bảng phân phối tần suất nên bao gồm:

ø_ Tiêu đề môtả nội đụng của bảng

a Tên biến

Nhân giá trị cho các thành phần biến

œ_ Tổng các quan sát của mẫu

ø Khai báo nguồn đỡ liệu

a

1 Bảng phân phối tần suất thô

Bang 1, Loại nước ngọt ưa thích của sinh viên lớp TKXH

Loại nước ngọt thích Số đếm được "Tần suất

(Tally) (Frequency) 1.Coca - Cola 4 4 2.Pepsi 2 2 i.Khac 24 24 ‘Téng (n) 30 30 Ngudn: Khéo sát lớp học TKXH, tháng 11, 2007 “

2 Bảng phân phối tần suất liên hệ

Bang 2 Loại nước ngọt ưa thích của sinh viên lớp TKXH

Loại nước ngọtthích Tầnsuất-fí Tilệ-pi Phan tram-%i (frequency) (proportion) (percent)

1,Coca - Cola 4 0,133 13,3 2.Pepsi 2 0,067 6,7 3.Khác 24 0,80 80,0 Tông 30 1,0 100,0 Nguôn: Khảo sát lớp học TRCCH, tháng 11, 2007 “

2 Bảng phân phối tần suất liên hệ

ä Công thức: ~ Tần suất tỉ lệ: pat n 3;p,=1 - Tần suất phần trăm: %ï = ÖLx100 R S 3ö =100

3 Bảng phân phối tần suất lũy tiến

Bảng 3 Loại nước ngọt ưa thích của sinh viên lớp TKXH

Loại nước ngọtthích — Tân suất Phần trăm % lũy tiến

(frequency) (percent) 1.Coca ~ Cola 4 13,3 13,3 2.Pepsi 2 67 200 3.Khác 24 80,0 100,0 Téng 30 100,0

Nguôn: Khảo sải lớp học TKXH, théing 11, 2007

Thử tài

ø Tâm trạng khi học Thống kê xã hội

Data:

3 3 4 3232242 3 3 3 4 3 43 134414 3 2 3

Lập bảng phân phối tần suất thể hi (fi), ti 18 (pd), phần trăm, và % lũy tiến

Trang 26

Dap án thử tài

Bảng phân phối tần suất thế hiện tâm trạng khi học TKXH:

Tâm THE trăm trăm i Œ, 4%) tiên 1 2 3 4 a

4, Bang phân phối tần suất cho biến có

thang đo thứ bậc hacluc4 Ho lúc

Tan sai | Phạn tam | % bự tien Valid |1 Trưng bình 9 30.0 30.0

2 Trưng binh kha, 1 367 66.7 3 Kha 9 30.0 967 4 Giá ‡ 3.2 180.0

Tolat 3a 100.0

Nguôu: Khảo sái lớp học TKXH, tháng 11, 2007 vat

5 Bang phân phối tần suất cho biến có thang đo khoảng - tỉ lệ

Bảng 5.:Danh sách sinh viên lớp TK04 với điểm trung bình chung năm học

Bang 5.2: Phân bố tần suất điểm trung bình chung năm học của

SV lop TK04

SV _ ĐiểmTR sv Diém TE sv Điểm TR 1 68 + 68 + %4 2 71 12 68 22 68 3 80 13 78 23 60 4 69 14 65 24 72 5 ” 18 63 28 72 6 S6 16 62 26 70 7 sĩ v 66 + 70 8 & 18 68 28 69 9 63 19 92 29 70 10 S6 20 Sẽ 30 73

Diém TB chung “Tân suất Phan trim

(s6 sinh vién) (%) 50-55 1 33 56 ~- 60 2 6,7 61~65 8 267 66 ~ 70 12 400 71-75 5 16,6 76 ~ 80 2 67 Téng 30 100,0

Nguôn: Khảo sát lớp hẹc T04, thang 11, 2007 Nguân: Khảo sắt lớp hoc TKO, tháng 11, 2007

18

© Kiéu phan bé tan sudt trong vi du tir bang 5.2 là kiêu phân tổ theo kinh nghiệm

Ø Trong thực tế, khi gặp đạng dữ liệu nhiều biéu

biện người ta có quy tắc đề tiền hành phân tổ

=> Phương pháp phân tổ dữ liệu

Phương pháp phân (ỗ dữ liệu

1 Khi phân tổ dữ liệu, tùy theo mục đích thể biện đữ liệu cũng như phân bố đều đặn hay không đều dan

của dữ liệu mà có thể tiến hành phân tổ đều hoặc

phân tổ không đều

œ Khái niệm đều hoặckhông đều liên quan đến khái

niệm khoảng cách của tô

Chênh lệch giữa giới hạn dưới và giới hạntrên là trị số khoảng cáchtô

Trang 27

Các bước của thủ tục phân tổ

n Xác định số tổ cần chia:

Không có một con số quy định chính xác con

sơ cân chia là bao nhiêu, nhưng theo kinh nghiệm người ta thây nên chia trong khoảng

từ trên 5 đến dưới 15 tổ

Với n là số quan sát của tập dữ liệu:

Số tô cần chia k = (2*n)!2

Các bước của thử tục phân tổ

n Xác định trị số khoảng cách tổ:

Căn cứ trên số tổ định chia, người ta xác định

trị sô khoảng cách tô theo công thức như sau:

Với: Xu„„„ X„„ là giá trị lớn nhất và nhỏ nhất

của tập đữ liệu; k là số tổ định chia

Các bước của thủ tục phân tổ O Xác định giới hạn dưới và giới hạn trên của

các tô:

Tổ thứ nhất: Q„ÿ Xuuyth)

Tổ thứ hai: (X„u£h; Xu jsth th) = Q irth; Xuu„t2h) Té ther ba: (Nyigth, Xpict2h +h) = (Xpigt 2h; Xpit 3h)

"

Phân tổ cho báng đữ liệu 5.1

DIEMTB TAN SUAT PHAN TRAM (%)

55-61 3 10,00 61-67 40 33,33 67-73 1+8 43,34 Trên 73 4 1833 TÔNG 30 100 Vi du:

Dữ liệu của miột mẫu điều tra nhỏ vềđộ tuổi của30 sinh viên hệ VLVHnăm Ï như sau:

28 23 30 24 19 21 39 22 22 31 37 33 20 30 35 21 26 27 25 29 27 21 25 28 26 29 29 22 32 27 Hãy lập bang tầng số cho các dữ liệu trên

Phân tê dữ liệu

6 Dé bang tin số dam bao tinh khoa học, chúng ta tiến hanh phan tich tô đữ liệu rôi mới lập bangtan so

BỊ Xác định số tả cần chia: k=(2xn)!2 với n = 30 —+ (2 x 30)!⁄2= 3,9 = 4 tổ B2 Xác đình trị số khoảng cách tổ hị với X39; với Xu 19 và k=4 x, x,

hyo Sos nie

Trang 28

Phân tổ dữ liệu

B3 Xác định giới hạn dưới và trên của các tô:

Với h = 5, ta xác định cận trên và đưới các tổ lần

lượt như sau:

Tổ 1: 19— 19 +5 =19~24 Tổ 2: 24— 24 + 5 = 24 ~ 29 Tổ 3: 29 - 29 + 5 = 29 — 34 Tổ 4: 34— 34 + 5 = 34 ~39 Phân tổ đữ liệu Độ tuôi (tuôi)Số SV 19~24 9 24~29 10 29~34 § 34 trở lên 3 Tơng 30 Bang tan số

Độ tuổi (tudiy The vá Phân trầm

19~24 9 30,00 24-29 10 33,33 29~34 § 26,67 34 trở lên 3 10,00 Tổng 30 100,00

Một số điều kiện phải tuân thủ khi

tiên hành phân tô

œ Các tổ không được trùng nhau, để cho một quansát bắt kỳ chỉ thuộc về một tổ

œ1 Tất cả các tổ được phân chia phải bảo đảm bao quát

hết tất cả các giá trị hiện cócủa tập đữ liệu

œ_ Tránh không để tả rỗng do không có quan sát nào

thuộc về tổ đó Bài tập vận dung

VDI Khảo sát mức độ thường xuyên đọc tài liệu chuyên ngành, kết quả ghỉ nhận như sau: (Nguồn: Thông kê lớp 02)

Mức độ Tân suất % % tñy tiễn

1 Hằng ngày 106

2 Tuân vải lần 150 3 Tuấn 1 lận 15 4 Íthơn 1 lân 15 5 Không bao giờ 100

Tổng

Hãy lập bảng phân phối tuần suất?

DAP AN VDI:

Bang phan phối tuần suất

Mức độ “Tần suất % 3% lũy tiến

1, Hỗng ngày 100 15.38 15.38 2 Tuần vài lân 150 23.08 38.46 3, Tuân 1 lần 175 26,93 65.39 4 Ít han Liền 125 19.23 84.62 5 Không bao giờ 100 15.38 100

Tổng 650 108

Trang 29

Bài tập vận dụng DAP AN V2:

VD2 Phân bố điểm kết quả học tập môn thống kê cũa sinh Đăng phân phối tuần suất

TT ¬¬ Số lượng SV| % | %laytién Nhóm điểm TB or m [ore % | %Múy tiến

0-30 50 0-30 50 l5 | 750 | 176 | 1176 31-49 75 3i~49 18 40 | 3000 |1765 | 2941 S0 ~ 60 100 50 ~ 60 100 | 55- | $500 |23s3] 52,94 61-79 120 61-79 120 70 | 8400 Ì2824] 8118 30 ~ 100 80 80 ~ 100 30 90 | 7200 Ì1g82 Ì - 100 ‘Ting Tông Hãy lập bảng phân phối tuần suất?

we ‘a

vipwu 3: DAP AN VD3:

Bang phan phéi tudn sudt

Thống kế về vẫn đề sử dụng thư viện của sinh viên, -

kết quả cho thấy: Quý es) Tan sult % lũy tiến

Quý 1 có 3500 lượt, 1 3500 29.05 29.05

Quy 2 có 1550 lượt ? 1550 12.86 4L91

Quý 3 có 2000 lượt; 3 2000 16.60 58.51 Quý 4 có 5.000 » Sa ; 4 5000 41.49 400.00

Hãy lập bảng phânphôi tân suất, phân trăm và lũy tiên Tổng 12050 100

“ “

vipu 4: DAP AN VD4:

Bang phân phối tuẦn suất

Cuộc tổng điền tra xã hội năm 1994 của Hoa

Kỹ có câu hỏi “Ơng/bà có đọc báo thường xuyên Mức độ Tan (suất) % % lũy tiến không?”, với các phương an các trả lời (hàng ngày, 1 Hằng ngây 969 2s 7959

tuân vài lần, tuần một lần, ít hơn tuần một lân, - ~

không bao giờ), số đếm được của các trả lời trên x " welts Bài 35 en

tương ứng như sau:969 , 452, 261, 196, 76 * Tee ! i - 361 1336 86.08

Hãy lập bảng phân phốt tần suất, phần trăm và 4 ithon | lần/mẫn 196 10.03 98.11 Hy tiến, 5 Không bao giờ 16 3.89 100.00

Trang 30

Mô tả độ tập trung biến

(central tendency)

Đề mô tả sâu hơn một tập dữ liệu định lượng, ngoài việc tính tốn phân phối tần số là một công

cụ hữu ích để chuyển hóa đữ liệu định lượng

thành thông tín, thì chúng ta cẦn bổ sung vào bộ công cụ thống kê của mình các đại lượng số (đại

lượng thống kê mô tả) để đo độ tập trung và độ

phân tán,

Các đại lượng này sẽ cho chúng ta hiểu rõ

rang các chỉ tiết về tập dữ liệu nghiên cứu

Mô tá độ tập trung biến

1 Yếu vị (Còn được gọi là số Mode)- MO:

Giá trị xuất hiện nhiều lần nhất trong tập mot dé

liệu

*Mode có thể được sử dụng cho tất cả các loại

thang đo

'>Mode không chịu ảnh hường của những giá trí

ngoai lê (giá trị đầu cuối của day phân phôi),

Yéu vi (Mode) a VDI: 2 3 3 3 2223323322 3.23323344234322 3 > Mode=3 = (2:12; 3:15; 4:3) Yéu vi (Mode)

ä Mode có thể khơng tồn tại trong một dãy

phân phối, đôi khi có thể khơng tìm ra được

số mode hoặc có thể có nhiều số mode

Ví dụ:

+ Tập dữ liệu khơng có Mode: 1, 2, 3, 4, 5, 6 + Tập dữ liệu có 2 Mode: 1, 2, 3, 3, 3, 4, 5,6, 6, 6, 7 Cách xác định moác:

TH Dữ liệu khơng phân nhóm = Mode là giá trị có tần suất lớn nhất

+

Nguôn: Khảo sải lốp học TKOI, tháng 11, 2007

vD2: GPñ ĐiỂm trung bình sấm học vile que đưa” Fercent aig Recta

sỉ ay fy 82 o 5 2 28 ae » sa E7]

Xem thêm:- TH Dữ liệu phân nhóm có khoảng cách đều nhau

"

- TH, Dữ liệu phân nhóm có khoảng cách khơng đều nhau

Mô tá độ tập trung biến

{central tendency)

2 Trung vi (Median) - Me: là giá trị đúng giữa trong tập một dữ liệu

Ø Giá trị này chia tập quan sát làm hai phần đều

nhau, 50% số quan sát của tập đữ liệu có giá

trị bé hơn giá trị trung vị và 50% lớn hơn giá trị trung vị

Trang 31

Trung vi (Median)

Chú ý:

w Muốn xác định giá trị trung vị của một tập đữ

liệu, các quan sắt trong tập đữ liệu này Trước tiên phải được sắp xếp theo trật tự (từ nhỏ đến lớn hay ngược lại)

s Khơng tính tốn giá trị trung vị cho biến có thang đo danh nghĩa

i

Trung vi (Median)

Công thức xác định vị trí của trung vị: Median x : (n+1)/2

- Nếu n là số lẻ, thì số trung vị là quan sắt ở vị tri thir (n+1)/2 trong tập đữ liệu

Trung vị (Median)

Trong trường hơp n là số chẵn: số trung vị là giá trị trung bình cộng của 02 quan sát nằm ở vị trí chính giữa tập đữ liệu

Tức là một quan sắt ở vị trí thứ n ⁄2 và một quan sát ở vị trí thứ {(n+2)⁄2]

Xi du:

(8+1)/2 = 4,5 — gia trị trung vị rơi vào giữa giá trị quan sát thứ 4 và quan sát thứ 5 trong

tập dữ liệu 60 Trung vi (Median) o VD: 63 68 70 78 70 67 57 60 69 74 59 65 55 70 72 69 70 65 65 74 69 65 63 59 75 68 68 65 65 72 bà Trung vị (Median) H Bước 1: sắp xếp thứ tự tập đữ liệu 55 5759 59 60 63 63 65 65 65 65 65 65 67 68 68 68 69 69 69 70 70 70 70 72 72 74 74 75 78 t Trung vị (Median) ö Bước 2: xác định vị trí trung vị Median x: (30+1)/2 = 15,5 - Giá trị trung vị nằm ở vị trí thứ 15 (68) và_

thir 16 (68) trong tap dé liệu đã được sắp xếp

Giá trị trung vị = (68+68)/2 = 68

Trang 32

Trung vị (Median)

n Chú ý:

Khi xác định trung vị, nhiều người hay lẫn lộn

giữa vị trí của trung vị và giá trị của trung vị,

Nhớ là ta xác định vị trí trung vị trước để biết

trung vị là quan sát nào, sau đó xem quan sát đó có giá trị bao nhiêu thì đó là giá trị của

trung VỊ

Trung vi (Median)

0 Déi véi biến có thang đo thứ bậc: sử dụng bảng phân phôi tân suất lũy tiên để xác định

giá trị trung vị

5 Giá trị trung vị chính là giá trị có phần tram

lũy tiến lớn hơn và gần kề tị lệ 50%

* Xem: Các xác định trung vị cho đữ liệu phân nhóm (1ơ) có khoảng cách

Trung vị (Median)

VD2: hocTKXH Tâm trạng khí học Thống kê xã hói

Đgướm | Nđ Peosnt Ệ 67 67 T ; Ậ 2 tả 2 z L ‡ BS aS 160.0 # 10060 1008

Nguén: Khéo stit lop hoc TKO4, thing 1, 2007

~> Median x= Binh thudng (3)

Mô tả độ tập trung biến

(centraltendency)

3.Trung bình cộng (san):

© Trung bình cộng là một đại lượng số mô tả độ tập

trung của đữ liệu được sử dụng phổ biến

œ Trung bình cộng đơn giản được tính bằng cách cộng tất cả các giá trị của mỗi quan sát () trong tập dữ liệu rồi chia cho tổng số quan sát (n)

Fe eS ” oO Công thức: Trung bình cộng (Mean) ä Ký hiệu:

ak: giá trị trung bình

øn : tổng số mẫu quan sắt

ø X;: giá trị quansát thứ ¡

Trung bình cộng (Mean)

Trang 33

Bảng 5.2: Phân bê tần suất điểm trung bình chung năm học của

SV lớp TKXH Điểm TB chung H m fm %c S1~55 1 33 53 3,3 56 ~60 2 58 116 10,0 61-65 8 63 504 36,7 66 —70 12 68 816 76,7 1-75 5 73 365 93,3 76 — 80 2 7B 156 100,0 Tổng 30 Nguồn: Khảo sắt lớp học 7K04, tháng 11, 2007 3 =[(G3* 1}: (58*2)+(63*8)2(68*12)+(73*5)+(7892)J/30= 67

Tinh giá trị trung bình cho biến có thang đo thứ bậc:

#12 Bido độ nghe radio

Combine ereont — | VU Bưưnh

B86 Woo

"Nguồn: Số liệu điều tra của Khoa Xã hội học tháng 03/2062

xf K = [(161* 1)+ (93*2)+(66*3)+49*4)+(31795))/686 = (161 + 186 + 198 + 196 + 1585)/686 = 3.40 =3 “ Bài tập

Bảng tần suất và đo lường độ tập trung biến

Mộtnhà nghiên cứu tại quan tâm đến việc tông kết độ đài của mỗi lần làm tra của những bệnh nhân lần đầu, đã chọn ngấu nhiên 10 hỗ sơ của những cá nhân được đưa vào trung tâm trong vòng 02 năm qua

Độ dài mỗi lần hưu trú (theo ngày) tại trung tâm như

sau:11, 6, 20, 9, 13, 4, 39, 13, 44 và 7

Hãy xác định giá trị trung bình (mean} trung vị (median)

m

Vn dé 1 (tt):

Một nghiên cứu tương tự cách đây 25 năm cũng tại trung tâm này, với d6 dai của mỗi lần lưu trú của 1Ô bệnh nhân như sau: 32, 18, 55, 17, 24, 31, 20, 40, 24, và 15 ngày

„ Hãy so sánh kết quả này với cuộc điều tra mới

vê giá trị trung bình và giá trị trung vị Giải thích những sự khác biệt về kết quả giữa 2 cuộc điều

tra

Vấn đề 2

Cuộc tổng điều tra xã hội năm 1994 của Hoa

Kỳ có câu hỏi “Ơng/bà có đọc báo thường xun không?”, với các phương án các trả lời (hàng ngày, trần vài lần, tuần một lần, ít hơn

tuần một lần, không bao giờ), số đếm được

của các trả lời trên như sau: 969, 452, 261, 196, 76

Vấn đề 2

a Lập bảng tần suất liên hệ và lũy tiến

b Xác định giá trị trả lời trung vị

c Xác định yếu vị

d Nếu biến Y= mức độ thường xuyên đọc báo

như được mô tâ ở trên Chúng ta có thê tìm giá trị trung bình của Y hay không? Tại sao?

Trang 34

Vân đề 3 x 3 Bang 3

Cuộc tông điệu tra xã hội năm 1290 của Hoa Kỳ có z — + câu hỏi “Trong vịng 12 tháng qua, Ơng/bà biết, một Số nạn nhân Tân suất

cách cá nhân, bao nhiêu người là nạn nhân của tội 0 1244 phạm giết người?” Bảng 3 trình bảy kết quả phân tích 1 81 của 1.370 trả lời 2 27

_a Trinh bay bang phan phéi tan suất liên hệ và lũy 3 "1

tiên? 4 4 b Tính giá trị trung bình,trung vị và yếu vị Giải 3 2

thích những giá trị này? 6 1

Vân đề 4 Bảng 4

O10 hộ gia đình được chọn ngẫu nhiên tại tiểu Tiểu bang Nông thôn Thành thị bang Florida, Hoa Ky va 10 hé gia đình khác

được chọn ngẫu nhiên ở tiểu bang Alabama Bảng 4 trình bày thông tin tổng hợp về thu nhập

trung bình hộ gia đình

“Thu nhập trung bình tại Alabama thì cao hơn Florida ở cả hai khu vực nông thôn và thành thị,

Florida $26.000 (n=3) — $39.000 (n=7) Alabama $27.000(n=8) 340.000 (n=2)

Hãy so sánh thu nhập trung bình chung (ở ca nông thôn và thành thị) của hộ gia đình tại 02 tiêu bang

Mô tả độ phân tán biến

(dispersed tendency)

1 Giá trị lớn nhất (Max), giá trị nhỏ nhất (Min)

œ Giá trị lớn nhấtà giá trị có điểm số cao nhất

trong tập dữ liệu

=- GIÁ trị nhỏ nhấHâ giá trị có điểm số thấp nhất

trong tập dữ liệu

2 Cách độ (Range) -R

- Cách độ là một trong những cách dễ

nhật đê mô tả mức độ biên thiên

- Cách độ là sự cách biệt hay khoảng cách giữa giá trị quan sát lớn nhất và giá trị quan sát nhỏ nhất

Trang 35

2 Cách độ (Range) -R

q Công thức:

R= Xem — Xmin

Đại lượng cách độ (R) bị ảnh hưởng rất nhiều

bởi các giá trị ngoại lệ => đại lượng đo lường độ phân tán yếu nhất và ít được sử dụng

Bảng 4 Khoảng cách đi từ nhà đến trường của sinh viên

Sinh viên Khoảngcách Sinh viên Khoảng cách

(km) (km) 1 2 9 H 2 4 10 13 3 4 UW 13 4 4 12 14 5 5 13 15 6 7 14 19 7 9 15 20 8 10 R=20-2=18km

3 Phwong sai (Variance)

tì Một phương pháp khác để đo lường độ biến

thiên của một tập đữ liệu là sử dụng giá trị trung bình cộng như là một điểm để so sánh với từng

giá trị quan sát

3 Phwong sai (Variance)

q Cách đơn giản nhất để tính đại lượng này là

lấy giá trị của từng quan sát trừ đi giá trị trung bình cộng của tất cả các quan sát này, sau đó

cộng tất cả các kết quả lại thành độ lệch

trung binh (mean deviations) d(x- 2) = mean deviations 3 Phương sai (t0) ¥ =10 S{x-# )= (210) + (4-10) + (4-10) + (4-10) + (5-10) + (7-10) + (910) + (10-10) + (11-10) + (13-10) + (13-10) + (14-10) +(15-10) + (19-10) + (20-10) =0 3 Phương sai (t.t.)

= Vấn đề đặt ra đối với phương pháp này là

tổng các độ lệch của đữ liệu luôn bằng 0

Ø Trong khi a6, gid tri Othi khơng có ý nghĩa trong việc đo lường độ phân tán

Trang 36

3 Phương sai (tt)

œ Để khắc phục vấn để này — các giá trị lệch

giữa giá trị quan sát và giá trị trung bình sẽ được bình phương (làm cách này, những giá trị âm sẽ khơng cịn nữa)

®% Sau đó cộng tất cả các giá trị bình phương

này lại

t

3 Phương sai (Variance)

©) Phuong sai là giá trị đo lường độ biến thiên xung quanh giá trị trung bình

t1 Phương sai được tính bằng cách lầy tổng các biến thiên giữa từng quan sắt với giả trị trung

bình đã được bình phương chia cho (tổng số

quan sát ~ 1)

3 Phương sai (Variance)

Công thức:

Phương sai mẫu (sample variance)

St=S(K- EY An- 1) 3 Phuong sai (t.t.) (x- =) @&- x3 Oz) (x: 2-10=8 64 11-10 +1 1 4-10 =-6 36 9 36 9 36 16 -10 = 25 25 7-10 =-3 9 19-10=49 81 9-10 =1 1 20-10=410 100 10-10 =0 0 Z=0 X=448 n=15 St 448 /14 = 32,0 3 Phuong sai (tt)

ñ Mặc dù phương sai được xem như là một trong những phép tính thống kê để đo lường độ phân tán, tuy nhiên nó khơng có ý nghĩa

nhiều

Ø Giá trị này chỉ thực sự có ý nghĩa khi nó được chuyên hóa thành một giá trị khác gọi là độ

lệch chuẩn (Standard Deviation)

4 Độ lệch chuẩn (Standard Deviation) - s

© Độ lệch chuẩn chính là giá trị căn bậc hai của

phương sai SD được dùng để đo lường độ

phân tán của các quan sát xung quanh giá trị trung bình

s= ݧ? = 432 = 5,660

ä Độ lệch chuẩn tương ứng với các giá trị quan sát trong tập dữ liệu càng lớn thì độ biến thiên của tập đữ liệu càng lớn

Trang 37

4 Độ lệch chuẩn (Standard Deviation) - s

m Giải thích SD:

$% Ứng với khoảng cách trung bình từ nhà đến

trường của các sinh viên là 10 km, các giá trị

quan sát có độ lệch chuẩn là 5,66 km

wo

5 IQV Gindex of Qualitative Variation) n Sử dụng dé đo lường độ phân tán của đữ liệu

định tính

a k =số cácgiá trị củabiễn a N =s6 trudng hopnghién cứu

m Sf =tông của bình phương tấn suất

œi Đại lượng IQV nhận các giá trị từ 0 đến 1

=0 ® cho thấy khơng có sự biến thiên trong mẫu w 1® cósự phân bố đều nhau giữa các giá trị

(không tôn tại yêuvị mode}

Đo lường Đo lường Thang đo độ tập trung dé phan tan Danh nghia Yếu vị JQV

Thứ bậc Trung vị TOV Khoang/ Ti lệ Trung bình Độ lệchchuẩn(s)

Bài tập

Đo lường độ phân tán của biên Vấn đề 6 Một công ty tiến hành nghiên cứu về thói

quen sử dụng các phương tiện giao thông công cộng thông qua xác định quãng đường đi của nhân viên mình trong một ngày cụ thể Mười người được chọn ngẫu nhiên để xác định quãng

đường đi này có số liệu như sau (đặm) 0,0,4, 0, 0, 0, 10, 0, 6, 0

Vấn để 6

a Tính và giải thích các giá trị sau: trung bình, trung vị, yêu vị, cách độ, phương sai và độ lệch chuẩn

b Một người nữa sống tại một thành phố khác được chọn để nghiên cứu, di 90 dim một ngày

băng phương tiện giao thơng cơng cộng Tính tốn lại các giá trị trung bình, trung vị và độ lệch chuẩn Cho biết tác động của quan sát ngoại lệ này

Trang 38

Vấn đề 7

ñ Một giáo sư dạy thống kê nhận thấy rằng sinh viên của ông ta thường phần nàn về cảm giác lọ lắng về tài liệu trong khóa học VỊ giáo su quyết định tiền hành đánh giá sự trải nghiệm lo lắng trong lớp học của mình và sinh viên một lớp Ngữ văn Anh Dữ liệu thu thập được như sau: Vấn đề 7 Lớp Thống kê 23 22 18 26 29 27 30 25 10 11 lã 17 19 18 19 20 21 18 14 20 13 22 Lớp NV Anh 1 6 Il 20 39 1 13 lố 19 35 29 24 5 20 29 34 31 39 27 1 9 21 Vấn đề 7

a Tim gia tri trung bình, trung vị và yếu vị của mỗi lớp

b Tìm khoảng biến thiên (range), phương sai và

độ lệch chuẩn của mỗi lớp

Vấn đề 7

c, So sánh kết quả của 02 lớp, chúng ta có thể kết luận điều gì về sự trải nghiệm lo lắng giữa sinh viên 02 lớp này

d Nhóm nào biểu hiện một sự đồng nhất hơn

- Phan 2

Thong ké suy dién (Statistical Inference)

oKiém định giả thuyết là một công cụ của thống kê

suy diễn

aM uc dich chính của hầu hết các nghiên cứu là để kiểm tra có hay khơng việc những dữ liệu thu thập từ các cuộc điều tra phù hợp với những dự báo về

một vấn để cụ thể Những dự báo này chính là các

giả thuyết (hypothesis) về tham số được đo lường

trong nghiên cứu

Thống kê suy diễn

a Giả thuyết là một phát biểu về những đặc trưng

của một tham số (biên) hay tập hợp của nhiêu tham sô

Trang 39

Những yếu tổ của một kiểm định ý nghĩa

a Kiểu dữ liêu: tương tự như các phương pháp thống kê mô tả, mỗi kiểm định đều chứa trong nó hoặc là

dữ liệu đính tính hoặc là dữ liệu định lượng

b Phương pháp chon mẫu: các kiểm định thường đòi hỏi các phương pháp chọn mẫu xác suất

c Dung lượng mẫu: Tính giá trị của các kiểm định càng

cao khi dung hrợng mẫu càng lớn,

d, Giả thuyết một kiểm định ý nghĩa xem xét hai

loại giả thuyết về giá trị của một tham số:

~ Giả thuyết Hạ (null hypothesis): là giả thuyết được kiểm định trực tiếp Giảthuyết này là một phát biểu “không” vệmôi liên hệ giữa hai biển

Nói cụ thể, một biến này khơng có quan hệ với biến kia - Giả thuyết đối H, (alternativehypothesis):là giả thuyết đối của giả thuyếtH,,

Giả thuyết này phát biểu rằng có tồn tại một mỗi quan hệ giữa hai biến

Những yếu tố của một kiểm định ý nghĩa

e Mức độ tìn cây: thông thường mức độ tin cậy của một kiêm định sẽ ở mức 95% (œ=0,05) hoặc 99%,

(œ=0,01)

ri Yêu cầu của một kiêm định ý nghĩa cho giá trị trung bình:

w Mẫu xác suất (ngẫu nhiên)

w Biến định lượng

Kiểm định ý nghĩa cho giá trị trung bình n Giả thuyết:

Hạ : Không có sự khác biệt ý nghĩa về trung

bình giữa hai biên

x, =%, _ hay =# (ụ: giá trị trung bình của tơng thể)

H,: Có sự khác biệt giữa hai giá trị trung bình

X.“X, hap ee

Kiểm định ý nghĩa cho giá trị trung bình

O Vi du, gid si rang chúng ta muốn so sánh và đưa ra

kết luận về số lượng các vụ tai nạn giao thơng xây ra

trung bình một ngày ở hai thành phố lớn: Hà Nội và TPHCM

Hoặc so sánh và đưa ra kết luận về số lượng các

vụ tai nạn giao thông xảy ra trung bình một ngày tại

TPHCM với số lượng trung bình của cả nước

Kiểm định ý nghĩa cho giá trị trung bình

Oo Hạ: =k

uw: 86 long cdc vy tai nan giao théng xây ra trung bình một ngày của cả nước

% : số lượng các vụ tai nạn giao thông xảy ra trung bình một ngày tại TPHCM

o H¿hH#%

10

Trang 40

Kiểm định ý nghĩa cho giá trị trung bình

oO Trong kiểm định nay, chúng ta cố gắng tim xem liện có hay khơng sự khác biệt có ý nghĩa thống kê giữa hai giá trị trung bình này

n Để kết luận điều này, kết quả kiểm định sẽ

dựa trên cơ sở việc “bác bỏ” hay “chấp nhận” giả thuyết Hạ

mm

Kiểm định ý nghĩa cho giá trị trung bình

Mira bic x Ỉ Mite tir

tứ

Kiểm định ý nghĩa cho giá trị trung bình

Trong kiểm định này, chúng ta cố gắng tìm xem liệu có hay khơng sự khác biệt có ý nghĩa thống kê giữa hai giá trị trung bình này

ri Để kết luận điều này, kết quả kiểm định sẽ

dựa trên cơ sở việc “bác bỏ” hay “chấp nhận”

giả thuyết Hạ

Kiểm định ý nghĩa cho giá trị trung bình

GINéu giả thuyết Hạ bị bác bỏ, tức là chúng ta có

bằng chứng thống kê để cho rằng H, đúng — có sự khác biệt ý nghĩa giữa hai giá trị trung bình Nếu giả thuyết Hạ được chấp nhận, tức là chúng

ta chưa có đủ băng chứng thơng kê để cho rằng

H, đúng

Kiểm định ý nghĩa cho giá trị trung bình Ø Chú ý: Chấp nhận Hạ khơng có nghĩa là

chúng ta đã chứng minh được Hạ đúng và vội

vàng kết luận rằng: Khơng có sự khác biệt

giữa bai giá trị trung bình

Chấp nhận Hạ chỉ có nghĩa là chúng ta không

đủ bằng chứng thống kê để bác bỏ nó mà thôi

Hs

Kiém dinh ¥ nghia cho giá trị trung bình

Vi dy vé tai nan giao thông, giả sử rằng chúng ta

có số vụ tai nạn giao thơng xảy ra trung bình mỗi ngày của TPHCM là L0 và của cả nước là 7

Kết quả chỉ ra rằng số vụ tai nạn giao thơng

xây ra trung bình mỗi ngày của TPHCM cao hơn của cả nước

Do vậy, chúng ta suy ra rằng Tp.HCM xây ra tai nạn giao thông cao hơn cả nước nói chung

Ngày đăng: 02/11/2023, 20:20

w