1 Tên môn học: Thống kê cho khoa học xã hội Mã môn học: DA1005
2 Số tín chỉ: 02
3 Trình độ: sinh viên năm 1 va 2
4 Phân bỗ thời gian: 30 tiết lý thuyết 5 Điều kiện tiên quyết
Sinh viên đã được học môn phương pháp nghiên cứu khoa học 6 Mục tiêu của học phần
Cung cấp cho sinh viên những khái niệm và kiến thức cơ bản về thông kê, về khả năng nhận định và kiêm tra những giả thuyết thông kê trong nghiên cứu khoa học nói chung,
khoa học xã hội nói riêng
7 Mô tả văn tắt nội dung môn học
Môn học, bao gồm phần bài giảng, thảo luận, và bài tập, cung cấp những khái niệm và kỹ thuật cơ bản về thống kê giúp cho sinh viên trong việc xử lý những kết quả thu được
từ những cuộc nghiên cứu điều tra thực tế trong nhiều lĩnh vực khác nhau như: xã hội học, nhân hoc, công tác xã hội, báo chí, địa lý
8 Nhiệm vụ của sinh viên
- Sinh viên có nhiệm vụ tham dự đầy đủ các buỗi học trên lớp (6 buổi), những sinh viên
văng mặt quá 20% tông thời gian học trên lớp sẽ không đủ điêu kiện thi kết thúc môn
học
- Trén cơ sở những tài Hiệu được giao đọc ở nhà, sinh viên có nhiệm vụ đọc kỹ lưỡng và
tom tat nội dung phân đọc, và trình bày những hiểu biệt của mình qua phân thảo luận
tại lớp vào buôi học kê tiệp
- Bài tập: trong các buổi học, sinh viên có nhiệm vụ phải làm các bài tập trên lớp Đây là loại bài tập nhanh, sinh viên sẽ có cơ hội ghi 01 dau (+) [04 dâu “+” tương đương 1 diém thưởng được cộng điêm vào bài kiêm tra giữa kỳ
9 Tài liệu học tập
Sách và giáo trình chính:
- Thống kê trong nghiên cứu xã hội Tác gia: Alan Agresti và Barbara Finlay, Nhà xuất bản Prentice Hall, Năm 1997
- Thống kê ứng dụng trong kinh tế xã hội Tác giả: Hoàng Trọng và Chu Nguyễn Mộng Ngọc Nhà xuất bản thống kê Năm 2007
Sách tham khảo:
- Giáo trình SPSS Tác giả: Nguyễn Văn Thắng và Phan Thành Huấn Nhà xuất bản
Trang 210 Tiêu chuẩn đánh giá sinh viên:
- Kiểm tra giữa kỳ 30% ‹
Điểm thưởng (nếu có): 10% (Bài tập nhanh / chuyên cắn)
- Thi cuối kỳ 10%
Tổng cộng 100%
11 Thang điểm: Thang điểm 10
12 Nội dung chỉ tiết môn học
Bài 1: Giới thiệu
Thống kê trong các nghiên cứu xã hội
Ý nghĩa của phương pháp thống kê trong các nghiên cứu khoa học xã hội Mục đích của việc sử đụng phương pháp thống kê xã hội
- Vai trd của máy tính trong thống kê Bai 2: Cac khái niệm cơ bản
Tổng thể (population) Mẫu (sample)
Bién (variable)
Dinh dé (proposition)
Biến độc lập (independent variable) Biến phụ thuộc (dependent variable) Thao tac hoa (operationalization) Do luong (measurement)
Bài 3 Chọn mẫu và Các loại thang do
Chon mau (sampling) Cac
loai thang do (scale)
Thang do danh nghia (nominal) Thang do thir bac (ordinal) Thang do khoang cach (interval) Thang do ti 1é (ratio)
Bài 4 Thẳng kê mô tả
Trình bày dưới đạng bảng (tables) Mô tả dữ liệu thô (raw data)
Phân bé tan sé (frequency distributions): biéu diễn dưới dạng tỉ lệ (proportion) va phan tram (percent)
Trang 3~ test cho mẫu độc lập (independent-sample t-test)
Bai 6:
[ Thiết lập giả thuyét (hypothesis)
HH Công thức (formula) [ Giải thich (interpretation)
Kiểm định giả thuyết (tiếp theo)
- _ Cho mỗi quan hệ giữa hai biến định đanh (Chi-square test) [ Thiết lập giả thuyết (hypothesis)
[ Cơng thức (formula) đ Giải thích (interpretation)
13 Kế hoạch giảng dạy và học tập cụ thể * Đối với lớp học 05 tiết/tuần
Thời Nội dung môn học Số | Nộidunghociậpcủa | Số
gian tiệt sinh viên tiệt
Giới thiệu môn học - Các khái niệm cơ -Ý nghĩa của phương pháp
bản thông kê trong các nghiên
cứu khoa học xã hội
Đọc tài liệu: „ - Mục đích của việc sử dụng
KHI Thống kê ứng dụng trong kinh tê xã hội phương pháp thống kê xã
Tuần | Hoàng Trọng và Chu Nguyễn Mộng Ngọc hội
01 Chương I, tr 01-10 - Vai trò của máy tính trong 05
Ú5 | thống kê
- Các khái niệm cơ bản Các loại thang đo
l , - Thang đo đanh nghĩ
Thông kê ứng dụng trong kinh tê xã hội Hy pene
5 : © nga - Thang do thir bac
Hoàng Trọng và Chu Nguyên Mộng Ngọc , „
Chương L tr 11-14 -_ Thang đo khoảng cách
- Thang do ti lệ
Chon mau - Chon mau xdc suat
Doc tai ligu: „
(O Thông kê ứng dụng trong kinh tế xã hội
Tuân | Hoàng Trọng và Chu Nguyễn Mộng Ngọc oo -
02 Chương II, tr.16-34 0517 Trình bày dưới dạng bảng 05
Thống kê mô tá: Báng phân bỗ tần suất
Thống kê ứng dụng trong kinh tế xã hội Hoàng Trọng và Chu Nguyễn Mộng Ngọc
Chương HT, tr 38-40 -_ Mô tả đữ liệu thô
-_ Phân bỗ tần số: biểu điễn
đưới dạng tỉ lệ và phần
trăm
- Phan bé tan số lũy tiến
Trang 4
Thống kê mô tả : Mô tả độ phân tán biến g4 |- Cách độ 05
- Phương sai
Đọc tài liệu: , -_ Độ lệch chuẩn
ĐI Thông kê ứng dụng trong kinh tê xã hội T
Hoàng Trọng và Chu Nguyễn Mộng Ngọc
Chương IV, tr 66-89 Bai tap
ue Thi giữa kỳ
Thống kê suy luận : Kiểm định giả
à thuyết về trung binh (T/Z) -
™ 5 T-test cho mau déc lap
Đọc tài liệu: „ 05 | (independent-sample t-test) 05
Thông kê ứng dụng trong kinh lê xã hội
Hoàng Trọng và Chu Nguyễn Mộng Ngọc Bài tập
Chương VHI, tr 208 - 228
Thống kê suy luận : Kiểm định giá thuyết
Tuần về môi quan hệ (Chi-Square (esÐ) -_ Mỗi quan hệ giữa hai biến
06 Doc tai ligu: II Thắng kê ứng dụng trong kinh tế xã hội 05 định danh (Chi-square test) 05
Hoàng Trọng và Chu Nguyễn Mộng Ngọc
Chương VHI, tr 228-246 Bài tập
Tp.HCM tháng 02 năm 2017 GV Phụ trách môn học;
1hS Võ Bình Nguyên
Trang 5
THONG KE CHO
KHOA HOC XA HOI
(36 tiếp
Th§ Võ Bình Nguyên Trường Đại học Khoa học Xã hội và Nhân văn
Mobile; 090.909.5,903
Email: vonguyen@hemussh.edu.vn
Bồ cục chương trình
Giới thiệu mơn học Các khái niệm cơ bản
m Biến và thang đo ø Thống kê mô tả
œ Thống kê suy diễn
đữãne#8aứữnứm
Về mơn học
Tên học phần: Thống kê cho Khoa học Xã hội
Số đơn vị học trình:2 TC
Trình độ: sinh viên nămthứ l và 2
Phân bỗ thời gian: 30 tiết
Mục tiêu của học phần: Cung cấp cho sinh viên những khái niệm và kiên thức cơ bản về thông kê, về khả năng nhận định và kiêm tra những giả thuyết
thông kê trong nghiên cứu khoa học
Mô tả vắn tắt nội dung
Môn học, bao gồm phần bài giảng, thảo luận, và
bài tập,
Cung cấp những khái niệm và kỹ thuật cơ bản về thống kê giúp cho sinh viên trong việc xử lý những kết quả thu được từ những cuộc nghiên cứu điều tra thực tế trong nhiều lĩnh vực khác nhau như:xã hội học, nhân học, báo chí, địa lý, v.v
Nhiệm vụ của sinh viên - Dự lớp: 30 tiết
- Làm bài tập tại lớp hoặc bài tập ở nhà
- Chuẩn bị các câu hỏi, bài tháo luận ~ Dụng cụ học tập: máy tính bỏ túi
Nội dung chỉ tiết học phần
«Bài 1: Giới thiệu (1 tiế)
«Bài 2: Các khái niệm cơ bản (3 tiếu
«Bài 3: Các loại thang đo (2 tiế) «Bài 4: Thống kê mô tả (12 tiếp
œBài 5: Thống kê suy diễn (9 tiếp)
œBài 6: Kiểm định giả thuyết (3 tiét)
Trang 6
Nội dung chỉ tiết học phần
n Bài |; Giới thiêu (1 tiếp
ø Thống kê trong các nghiên cứu xã hội
= Ý nghĩa của phương pháp thống kê trong các nghiên cứu khoa học xã hội
m Mục đích của việc sử dụng phương pháp thống
kê xã hội
w Vai trò của máy tính trong thống kê
Bài 2: Các khái niệm cơ bản (3 tiết)
m Tổng thể (population) = Mẫu (sample) a Bién (variable) a Dinh dé (proposition)
Bai 2: Cac khai niém co ban (t.t) a Bién déc lap (independent variable) a Bién phu thudc (dependent variable)
Thao tac hoa (operationalization) Do ludng (measurement)
Bài 3: Các loại thang đo (2 tiết)
Thang đo danh nghĩa (norminal) 8 Thang đo thứ bậc (ordinal)
m Thang đo khoảng cách (interval) m Thang đo tỉ lệ đatio)
Bài 4: Thống kê mô tả (12 tiết) Trinh bay đưới dạng bắng (tables) Mô tả dữ liệu thô (raw đata)
Phân bổ tần số (frequency distributions):
biểu dién dudi dang tf 1€ (proportion) va phan tram (percent)
Phân bổ tan số lũy tiến (cummulative)
Bài 4: Thống kê mô tả (1)
= Mô tả độ tập trung của biến (central
tendency): yéu vị (mode), trung vi (median),
và trung bình (mean)
ø Mơ tả độ phân tán của biến (dispersed
tendency): cách độ (range), phương sai (variance), độ lệch chuân (standard deviation)
Trang 7
Bài 5: Thống kê suy diễn (9 tiếp)
Kiểm định giả thuyết
> Ztest
z Thiết lập giả thuyết (hypothesis) ø Công thức (formula)
a Giai thich (interpretation)
Bài 5: Thdng ké suy dién (t.t)
> T-Test cho m4u phụ thudc (dependent sample t-test)
a Thiét lap gia thuyét (hypothesis)
œ Công thức formula) m Giải thích (nterpretation)
Bài 5: Thống kê suy dién (t.t)
> T-Test cho mẫu độc lập (independent sample t-test)
a Thiét lap gid thuyét (hypothesis) a Céng thitc (formula)
m Giai thich (interpretation)
Bai 6: Kiém dinh gia thuyét (3 tiét)
> Cho mối quan hệ giữa haibién dinhtinh (Chi-
square fest)
m Thidt lap gid thuyét (hypothesis)
a Cong thitc (formula) # Giai thich (interpretation)
Muc Dich của Thơng Kê
đ Tập hợp và mô tả dữ liệu đ Phân tích đữ liệu
m1 Đưa ra những kết luận từ đữ liệu
Thống kê cung cấp phương pháp: n Thiết kế: lập kế hoạch và tiến hành nghiên
cứu
n Mô tả: tập hợp và khai thác dữ liệu
G Suy diễn: đưa ra những dự báo hay khái quát hóa hiện tượng từ việc phân tích dữ liệu
Trang 8
Thiết kế
q Giúp xác định phương cách tốt nhất để thụ thập dữ liệu nghiên cứu
Œ Ví dụ, những yếu tố trong việc thiết kế 1 cuộc
nghiên cứu là xem xét làm thể nào để tiến
hành một cuộc điều tra, bao gồm xây dựng bảng câu hỏi và chọn mẫu
Rete
Mô tả
œ Mô tâ và khai thác dữ liệu ~ bao gồm những cách thức tổng hợp và khai thác các đặc trưng của dữ liệu đã được đo lường
a Muc đích chính là xác định những số liệu rời
rạc, không có ý nghĩa và trình bày chúng trong một cách có ý nghĩa và có thể hiểu
được 1 Suy diễn
Œ Bao gồm những cách để đưa ra các dự báo
dựa trên dữ liệu thu thập được
Hñ Những sự dự báo này được gọi là những suy luận thông kê
Vai trị của máy tính trong thông kê
SPSS: Statistical Package for the Social Sciences
Một công cụ hữu hiệu để phân tích dữ liêu
Tương đối dễ sử dụng
Đồi hỏi sự thành thao một vài kiến thứcvề phương pháp nghiên cứu
a
œ Được dùng phổ biển bởi các nhà khoa học xã hội
ao a
Hoc cai gi?
O Cac khai niém co ban (basic concepts) © Bién va Thang do (variable & measurement)
Một vài thống kê mô ta (descriptive statistics) œ Kiểm định giả thuyết (hypothesis testing)
Tài liệu học tập
_thong keer
© Giáotrinh chính Tà
1 Thống kê ứng dụng trong linh Ỷ tế xã hội Tác giả Hoàng Trọng
va Chu Nguyễn Mộng Ngọc, Nhà xuất bản thống kề, năm
2007
2 Thống kê trong nghiên cứu xã
hội Tác gia: Alan Agresti va *
Barbara Finlay Nha xudt ban s—
Prentice Hai, năm 1997 Sanne
Trang 9
Tài liệu học tập
ä Sách tham khảo
1, Giáo trìnhSP§§ Tác giả Đỗ Văn Thắng và_
Phan Thành Huân Nhà xuất bản Đại học Quốc gia TPHCM, năm 2003
2 Phân tích đữ liện nghiên cứu với SPSS Tác giả Hoàng Trọng và Chủ Nguyễn Mộng Ngọc Nhà xuất bản thông kê, năm 2005
Đánh giá ra sao?
œ Thang điểm: 10 đ Trong đó:
@ 30% kiểm tra giữa kỳ
+ Điện thưởng: 109% (nếu có)
+> Bài tập nhanh : Chuyên cân a 70% kiểm tra cuối kỳ
œ Đưới 50% ~> điều gì xây ra?
% Hoc lai® Kháo sát lớp học 1 Giới tính 1, Nam 2.Nữ
2 Tổng số anh chị em trong gia đình (kể cả bản thân):
3 Thích ăn loại fast food nào?
1 KFC
2 Lotteria 3 McDonald's 4, Loại khác
4 Điểm trung bình chung học kỳ gần nhất: / 10,0
5 Bạn ở nông thôn hay thành thị (trước khi vào DH)
1 Nông thôn 2 Thành thị 6 Có phải là người thức đậy sớm?
1 Có
2 Không
7 Thời gian dành cho việc tự học trung bình mỗi
ngẦY: giờ?
8 Anh chị thường tìm tài liệu học tập ở đâu (Có
thé chon nhiêu đáp án) 1 Tù thầy/ cô cũng cấp
2 Từ bạn bè/ sinh viên khóatrước
3 Tự tra cứu trên internet 4 Khác
Trang 10
9 Tâm trạng khi học môn Thống kê xã hội
1 Rất lo lắng @ 4 Thích
2 Lo lắng vừa phải 5 Rất thích © 3 Bình thường ©
10 Khoảng cách từ chỗ ở đến lớp học: .km./
CøNhững mong muốn đạt được của bạn khi học
môn Thống kê cho khoa học xã hội? t2
THỐNG KÊ LÀ GÌ? Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con
số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong những điều kiện
thời gian và địa điểm cụ thể
Thống kê chía thành 02 lĩnh vực:
+ Thống kê mô tả:B ao gồm các phương pháp
thu thập, mô ta và trình bày số liệu;
Thống kê suy diễn: Bao gồm các phương
pháp như ước lượng, kiểm định, phân tích
mối liên hệ, dự đoán, ị
QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ
XÁC ĐỊNH MỤC ĐÍCLL NỘI DỰNG, DỐI TƯỜNG VẤN ĐỀ NGHIÊN CÚU
XÂY ĐỰNG HỆ THỐNG GÁC KHÁI MỆM, CHE TIEU THONG KE
DIEU TRA THONG KE
XỬ LÝ SỐ LIỆU: —_
“TẬP HỢP, SẮP XẾP SỐ LIỆU CHON CAC PHAN MEM XU LY 96 LIRU
PHAN TICH THONG KỆ SƠ BỘ
THÂN TÍCH VÀ GIẢI THÍCH KẾT QUA
DỰ ĐỐN XU HƯỚNG PHÁT TRIEN CỦA HIỆN TUGNG
VIỆT BẢO CÁO VÀ TRUYỂN ĐẠT KẾT QUÁ NGHIÊN COU
Các khái niệm cơ bản
_ Tổng thể (population): là tập hợp các phần tử được quan tâm trong một nghiên cứu Nó
có thê hầu như là mọi thứ
Vị dụ: dân số Việt Nam, tổng thể sinh viên của
trường ĐH KHXH&NV hay tông số sinh viên của một Khoa
Trang 11
Các khái niệm cơ bản (t.t)
ñ_ Mẫu (sample): là tập hợp con của téng thé Vị dụ: Một công ty nghiên cứu thị trường tiễn được chon ra để tiền hành thu thập dữ liệu hành khảo sát 650 người tiêu dùng để thu thập
nghiên cứu thông tin về thị hiểu dùng sữa của người dan
Khi mẫu duoc chon đảm bảo tính đại diện, sẽ thành phơ HCM
có thể sử dụng đề suy rộng ra các đặc Trưng của tổng thể
Các khái niệm cơ bản (1.0 Các khái niệm co ban (t.t)
Hi Biến (variable): là tập hợp các đặc trưng và n Định đề (proposition): là một phát biêu về giá trị được dùng đề chỉ một khái niệm môi liên hệ giữa các khái niệm
biến Giới tính: có hai giá trị nam và nữ; Xí du:
biến Tơn giáo: bao gồm Phật giáo, Thiên chúagiáo, Hút thuốc lá dẫn đến bệnh ung thư phổi, hay
Tin lành, Hòa Hảo, khác và không tôn giáo Quan hệ tình dục khơng an toàn đẫn đến nguy
cơ nhiễm HIV/AIDS
Các khái niệm cơ bản (tt)
ci Biến độc lập Gndependent variable): là biến œ Vídụu, hút thuốc lá => biến độc lập
được dùng để giải thích cho nguyên nhân của ung thư phổi = biến phụ thuộc
một hiện tượng
œ_ Biến phụ thuộc (dependent variable): duoc giới tính => biến độc lập
coi là biển kết quả, nó chịu sự chỉ phối của lựa chọn ngành học ©Ð biến phụ thuộc biên độc lập
Trang 12
Các khái niệm cơ bản (.t)
G Thao tac héa (operationalization):
Là một phương pháp để quan sát và ghỉ nhận
những khía cạnh của một cá nhân, khách thé,
hay một sự kiện có liên quan để tiến hành
kiêm định giả thuyết
Vi du: khai niém vé kinh té bén vũng, bao
gồm các chỉ báo cập 1: - Giáo dục
- Tỉ lệ xuất khâu
- Nhập khẩu
- hay T lệ tăng trưởng kinh tế
Các khái niệm cơ bản (t.t)
Q Bo iwong (measurement): 1a cach thie gan những con sô hay giá trị cho các quan sát theo một quy tắc nhật định
Ví du:
Thu nhập: (1 triệu, 2 triệu, 3 triệu, 4triệu, .);
Trình độ học vấn (cấp 1, 2, 3, ĐH, .)
Biến (Variable)
œ Hai loại biến:
+ Biến định tính + Biến định lượng
* Đối với biến đỉnh tính, những đặc trưng phân biệt
dựa trên sự khác biệt về đặc tính, chứ không phái vệ số lượng hoặc độ lớn
“+ Các biến được gọi là đình lương khí mà các giá trị của biến cho thấy sự khác biệt về độ lớn hay số lượng giữa chúng,
Các loại thang đo
co Tương ứng với 02 loại biến định tính và định
lượng, có 02 loại thang đo chính:
> Thang đo biến số chữ:
+ Thang do danhnghia/dinh danh(Nominal scale) + Thang do thirbac (Ordinal scale)
>> Thang đo biến số số:
+ Thang đo khoảng (ntervabcale)
+ Thang đo tỉ lệ(Ratio scale)
Thang đo danh nghĩa (Nominal scale)
@ Thang đo danh nghĩa là loại thang đo định tính và thường được dùng tật rộng rãi với các tiêu thức thuộc tính mã các biểu hiện của nó là một hệ thống các loại khác nhau, như: Giới tính, khu vực địa lý, nghê nghiệp, tôn giáo,
Các con số trên thang đo không biển thị quan hệ hơn kém, cao thấp, nhưng khi chuyển từ số _ bay sang số khác thì dấu hiệu “do đã có sự thay đổi về chất
Trang 13
Thang đo danh nghĩa (Nominal scale)
ti Một biến đượcxác định bởi thang đo danhnghia bao
gôm hệ thông các chỉ báo khác nhau biểu thị thuộc
tính hay tính chất của biến đó
Œì Các chỉ báo này có tính chấtngang nhau và không theo một thứ tư nào
0 Mét thang do danhnghia phải có 2 chỉ báo trở lên
Vi du n Giới tính 1.Nam 2.Nữ f1 Tình trạng hơn nhân !, Độc thân Có gia đình Ly thân Ly di Goa we YN Vi du
q Công ty ông/ bà đang hoạt động chính trong lĩnh vực nào? Sản xuất Mở Xây dựng Dịch vụ Thương mại Khác wR we
Thang do thir bac (ordinal scale)
o La thang do danh nghĩa nhưng các chỉ báo hay các phương án trả lời được sắp xếp theo một trật tự
nhất định
Nói một cách khác, giữa các chỉ báo này có quan hệ thứ bậc hơn kém, nhưng thường thì mức độ hơn kém giữa chúng không xác định được
Thang đo thứ bậc (ordinal scale)
HThanh đo thứ bậc thường được sử dụng cho các đặc điểm thuộc tính, và đơi khi cũng được áp
dụng cho các đặc điểm số lượng
oThuéc đo độ tập trung là mode hay trung vị,
trung vị cung cấp nhiều thông tin hơn là mode
Ch úng ta cũng hay gặp loại thang đo này trong các câu hỏi dạng so sánh
“
Ví dụ
a) Anh/chi/éng/bahay xếp hạng các chủ đề sau trên
báo Sài Gòn Tiếp Thị tùy theo mức độ quan tâm
(Chủ đề nào quan tâm nhất thì ghỉ số 1, quan lâm
thứ nhủ thì ghỉ số 2, quan tâm thứ ba thì ghỉ số 3)
- Thơng tin thitrường -Muasim aaa -Giađình —
Trang 14
Vị dụ
Œ_ Thu nhậptrung bình hàng tháng
Dưới 500 ngàn Bi
Từ 500 ngản đến dưới 1 triệu 2
Từ 1 triệu đến dưới 2 triệu na
Từ 2 triệu đến dưới 3 triệu Há Từ 3 triệu trở lên Qs
fi Thu nhap cia anh/chi/éng/ba hangthang:
1.<3 triệu đồng 2.Từ3-5 triệu đồng 3 > 5 triệu đồng
Ví du (t.t)
O Kinh té gia đình so với 5 năm trước
Khá hơn rất nhiều HI
Kha hon chút đỉnh 2 Cũng vậy Hà Té hon chit dinh B4
'Tệ hơn nhiều os
Thang do khoang (interval scale)
tLà thang đo có đầy đủ tính chất của một thang đo danh nghĩa và thứ bậc, nhưng khoảng cách giữa các chí số được xác định một cách cụ thể và đều nhau
Đối với loại thang đo này ta có thể sử đụng một sơ các phép tính tốn học như tính trung bình hay tính tốn tỉ lệ chênh lệch giữa các chỉ số
Thang do khoang (interval scale)
lai Dữ liệu thu thập từ thang đo khoảng có thể là mode,
trung vị và trưng bình cộng, trong đồ trung bình cộng chứa nhiêu thơng tín nhất
n Điểm “không” củathang đo này là tùy ý
XD: Thang do nhiệt độ hôm nay là 12°C (53,6 °F) và hôm qua là 6° (42,8°F), Nhiệt độ hôm nay âm áp gấp đôi hôm qua ? Nêu chuyên từ ®C sang °F thì tỷ lệ không con 14 2/1 (53,6/42,8)
Hơn nữa, nêu nhiệt độ là 0%C, khơng có nghĩa là khơng có nhiệt độ 0°C tương đương với 32°F đương nhiên là âm hơn 10°E
“
Thang do khoang (interval scale)
=> Nhu vay thang đo khoảng cho phép chúng ta đo lường chính xác sự khác nhau giữa hai giá trị bất kỳ (trong thang đo thứ bậc thì khơng thê)
Œ Ta hay gặp loại thang đo này trong các câu hỏi phòng vân dạng đánh giá
Bạn có đồng ý hay khơng với nhận định: “Những người có học vẫn cao sẽ có thu nhập cao ”
1 2 3 4 $ 6 7 tả thông sit ding y
ding $
Thang do ti Ié (ratio scale)
gThang đo tỉ lệ là thang đo dùng cho đặc tính số
lượng
nMột thang đo tỉ lệ có tất cả những phẩm chất của
những loại thang đo trước Ngoài ra thang đo này
có một giá trị 0 “thực”, cho phép lấy tỷ lệ so sánh
giữa hai giá trị thu thập
Trang 15
Thang đo tỉ lệ (ratio scale)
D Tương tự như thang đo khoảng, khuynh hướng trung tâm của dữ liệu thu thập từ thang đo tỷ lệ có thể là mode, trung vj và trung bình cộng, trong đó trung bình cộng chứa nhiều thông tỉn nhất
f1 Sự khác nhau giữa thang do khoảng và thang đo ti thường bị lẫn lộn vì hai điêm sau:
+ Điểm “0° trongthang đo tỷ lệ là một trị số thật
+ Trong thang đo khoảng, sự so sánh về mặt tỷ lệ giữa các giá trị thu thập khơng có ý nghĩa
a
Vidu:
n Thu nhập trung bình hàng tháng:
œ 5.000.000đ
ư Tuổi:
Ngồi ra cịn có các loại thang đo tỷ lệ khác như: mét, kg, tân, tạ,
Vi du
oNéu ban có 5 triệu đồng, anh của bạn có 10 triệu
động => Sô tiên của anh ban gap đôi số tiên của bạn (kế cả quy đôi sang $, £, X, )
Nếu số tiền của bạn bị mất hay bị đánh cắp thì
bạn có 0 đồng Số 0 ở đây là giá trị that
=> Tiền tệ có trị số 0 là thật và loại thang đo ở
đây chính là thang đo tỷ lệ
Biên [Định lượng Thang do Thang do định tính định lượng
Thang do Thang do Thang do Thang do danh nghia thứ bậc khoảng tỉ lệ
Các chỉ báo được Khoảng cách giữacác Gia te
sắp xếp theo 1 chí số được xác định “thực” { trật tự nhất định một cách cự thể
CAP BAC BO LUONG VA THANG ĐO
+ Trong thực tế, vận đề thang đo phứctạp và trở nên quan trọng hơn nhiêu vì:
> Chúng ta có thể áp dụng thang đo địnhtính đối với đặc điểm sô lượng (thu nhập, chỉ tiêu)
> Ngược lại, có thể áp dụng thang đo định lượng đối
với các đặc điểm thuộc tính(đồng ý, khơng đồng ý)
=> Trong các trường hợp này, loại dữ liệu ta thu thập được là tủy thuộc vào thang đo, chứ không phải tùy thuộc vào tiêu thức thông kê đề thu thập đữ liệu
Chọn mẫu
Mục tiêu chọn mẫu
Mẫu được chọn phải phản ánh một cách chính xác về những đặc điểm của tơng thể
— Chỉ có như vậy thì tổng thể mẫu mới có khả năng đại diện cho tổng thể chung nghiên cứu,
Trang 16
Mục tiêu chọn mẫu
Tổng thể: Bao gồm toàn bộ cáccá thể mà chúng ta đang quan tâm
Mã à một phần của tổng thể, bao gồm những cá thể mà chúng ta sẽ nghiên cứu Lý đo chọn mẫu
œ Tiết kiệm thời gian và chỉ phí
d Các nghiên cứu căn cứ trên dữ liệu mẫu thực sự có tính đại diện thường tốt hơn nghiên cứu toàn bộ tổng,
thể,
a Kha nang sai sót khi điều tra nghiên cứu trên mẫu sẽ
thấp hơn so với khi nghiên cứu trên tổng thể, đồng
thời có thể tập trung các chuyên gia có trình độ vào nghiên cứu
Khung mẫu (Sampling frame)
{_ Khung mẫu là danh sách các đơn vị của tổng thể cần
nghiên cứu, cân thu thập dữ liệu
Đanh sách này còn được gọi là khung lấy mẫu hay
đàn chọn mẫu
q_ Các đơn vị tổng thể trong danh sách này có thể được sắp xếp theo một trật tự nào đó, ví đụ như vẫn ABC,
theo quy mô, theo địa chỉ, và được gán cho một số
thứ tự từ đơn vị thứ 1 đến đơn vị cuối cùng
Các phương pháp chọn mẫu
1 Phương pháp chọn mẫu ngẫu nhiên:
> Chon mau ngẫu nhiên đơn giản;
+ Chọn mẫu ngẫu nhiên hệ thống;
+ Lấy mẫu cả khối/ cụm và lấy mẫu nhiều giai đoạn;
“> Lấy mẫu phân tầng 2 Lấy mẫu phí xác suất
Phương pháp chọn mẫu ngẫu nhiên đơn giấn
(Simple random sampling)
a La phuong phap chon mau trong dé méi đơn vị của tổng thé được chọn với sự ngẫu nhiên như nhau, hay nói cách khác là các đơn vị tổng thể được chọn vào mẫu với cơ hội bằng nhau
+ Từ khung mẫu và số thứ tự từng đơn vị, thực hiện
việc lấy đơn vị mẫu ra bing nhiều cách như bốc
thăm, quay sô, hay dùng số ngẫu nhiên
+ Hỗ trợ từ phần mềm máy tính Exeel, SPSS Hoặc,
dùng cách lấy mẫu hệ thống
Phương pháp chọn mẫu ngẫu nhiên đơn giản
(Simple random sampling)
Papulation me
Trang 17
Phương pháp chọn mẫu ngẫu nhiên hệ thống
(Systematic sampling)
Trong mẫu ngẫu nhiên hệ thống, chỉ cần
chọn ra một con số ngẫu nhiên là có thể xác
định được tất cả các đơn vị mẫu cần lấy ra từ danh sách chọn mẫu (thay vì phải chọn ra n số
ngẫu nhiên ứng với n đơn vị mẫu cần lấy ra)
Phương pháp chọn mẫu ngẫu nhiên hệ thống (Systematic sampling)
œ_ Quy trình lấy mẫu hệ thống bao gồm các bước:
* Khung mu đã được đánh số thứ tự cho các đơn vị trong
danh sách, tổng số đơn vị trong danh sách là N
vˆ Xác định cỡ mẫu muốn lay, ví dụ n quan sat
Y Chia N đơn vị tống thể thành k nhóm theo cơng thức:
k= Nya, k duge goi 14 khoảng cách chọn mẫu
v Trong k đơn vị đầu tiên, ta chọn ngẫu nhiên ra một đơn vị, đây là đơn vị mẫu đầu tiên, các đơn vị mẫu tiếp theo được
lây cách đơn vị này 1 khoảng 14 k, 2k, 3k,
*
Phương pháp chọn mẫu ngẫu nhiên hệ thống
(Systematic sampling)
a Nhu vay có thể nói chọn mẫu hệ thống là phương pháp chọn mẫu trong đó các đơn vị mẫu được chọn ra cách nhau một khoảng là k đơn vị
‘Sample every #°)
Phương pháp chọn mẫu ngẫu nhiên hệ thông
(Systematic sampling) a Có hai trường hợp chọn mẫu hệ thông:
# Trường hợp 1; Lấy mẫu hệ thống đường thẳng
(Linear systematic sampling) khi k 1a s6 nguyén
(N chia chan cho n)
Truong hop 2: Lay mau hé théng quay vòng {Circular systematic sampling) khi k là sô thập
phân (N không chia chan cho n)
THỊ: Lây mẫu hệ thống đường thắng
a VDLN =64,n= 10;
k=64/10=6,42 lấyk=6
Chọn 1 số ngẫu nhiên từ 1 đến 6:
+ Nếu số ngẫu nhiên được chọn là 1, thì các đơn vị
lấy ra sẽ là: 1, 7, 13, 19, 25, 31, 37, 43, 49, 55, 6]
(chọn được tới 11)
z Nếu số ngẫu nhiên được chọn là 6, thì các đơn vị
lấy ra sẽ là: 6, 12, 18, 24, 30, 36, 42, 48, 54, 60
{chọn được 10)
TH: Lấy mẫu hệ thống đường thẳng
a VD2: N= 66,n= 10;
k= 66/10=6,6 9 yk=7
Chon | sé ngẫu nhiên từ 1 đến 7:
> Néu số ngẫu nhiên được chọn là 2, thì các đơn vị lấy ra sẽ là: 2, 9, 16, 23, 30, 37, 44, 51, 58, 65
(n=10)
z Nếu số ngẫu nhiên được chọn là 4, thì các đơn vị lấy ra sẽ là: 4, 11, 18, 25, 32, 39, 46, 53, 60 (n = 9)
"
Trang 18
TH2: LẤy mẫu hệ thống quay vòng
a Khi tổng thể N không chia chẵn cho n mẫu thì các
đơn vị khơng có cùng Ì xác suất chọn ra như nhau và khí dùng kết quả trung bình mẫu để ước lượng
trung bình tơng thể thì rất có khả năng bị lệch
» Chọn mẫu hệ thống quay vòng
TH2: Lấy mẫu hệ thống quay vòng
Giá sử cần chọn ra n đơn vị mẫu từ tổng thể N, thứ tự các bước như sau:
» Tinh khoảng cách chọn mẫu:k =N/n
> Chon 1 số ngẫu nhiên trong khoảng từ | dén N, don vi
mẫu đầu tiên có số thứ tự với số đã được chọn ra, > Các đơn vị tiếp theo cách đơn vị mẫu đầu tiên I khoảng
Ik, 2k, 3k,
>_ Nếu hết danh sách N đơn vị chưa đủ n đơn vị mẫu, ta quay
trở lại từ đầu danh sách với quy ước: N + l tương đương
với đơn vị thứ nhật; N + 2 tương đương với đơn vị thứ hai trong danh sách
TH2: Lấy mẫu hệ thống quay vòng
a VDIN=13,n=4
Tính khoảng cách chọn mẫu:k = 13/4 = 3,25 = chọn k=3
Lay 1 số ngẫu nhiên trong khoảng từ 1 đến 13,
ví dụ chọn được số 6, các đơn vị mẫu tương ứng sẽ là:
6,9, 12, và [(12+ 3)— 13]=2
Cách tính:Khí số thứ tự lớn hơn N thị
Số thứ tự chọn mẫu = Số thứ tự - N
Lấy mẫu cã khối/ cum (Cluster sampling) va lay mau nhiéu giai doan (Multi-stage sampling)
a Chon miu cả khối/cụm hay chọn mẫu nhiều giai
đoạn giúp chúng ta vượt qua điều kiện đầu tiên của chọn mẫu ngẫu nhiên là phải có danh sách
các đơn vị chọn mẫu/ khung chọn mẫu ngay từ đầu
Đầu tiên, tổng thể được chia thành nhiều cum, mỗi cụm xem như lä một tổng thể con, lấy ngẫu
nhiên đơn giản m cụm, sau đó khảo sát hết các đối tượng trong các cụm mẫu đã được lấy ra
Lấy mẫu câ khối/ cụm (Cluster sampling)
va lay mau nhiéu giai doan (Multi-stage sampling)
{2 clusters) Clustered Population
_ Lay mau ca khdi/ cum (Cluster sampling)
va lây mẫu nhiêu giai doan (Multi-stage sampling)
a Do cụm mẫu thường được chọn các yếu tế như: vị
trí địa lý, các tơ chức, đơn vị xã hội, các cụm dân cư, Sau khi có danh sách các cụm, tiến hành chọn ngẫu nhiên để xác định các cụm đại diện, sau đó chọn ngẫu thiên các phan tk trong mdi cum để lập danh sách mẫu nghiên cứu Cứ tiếp tục như vậy chúng ta có chọn mẫu nhiều giai đoạn
VD: Nội thành HCM > Quận > Phường > Khu phố/ Tổ dân phố > Khối nhà
Trang 19
Lấy miu phan tang (Stratified sampling)
a Chon mau phân tầng được sử dung khi chúng ta đã biết thông tin về tổng thể dân số trước khi chọn mẫu a Để bất đầu, tất cả những phần tử của tổng thể sẽ được phân biệt theo những đặc tính của chúng, và
được xếp vào từng tầng khác nhau Tiếp theo, các
phân tử sẽ được chọn ngẫu nhiên theo các phân tầng đó
Lấy mẫu phân tầng (Stratified sampling)
Ví dụ: Một trường ĐH có 1⁄4 nữ và 1⁄4 nam, vậy mẫu được chọn cũng sẽ có tỷ lệ tương tự
Lấy mẫu phân tầng
n VD Tại một trường ĐH có 20.000 SV ở 5 hệ dao
tạo và cấp đào tạo khác nhau, để khảo sát về chất
lượng và mức độ hải lòng của sinh viên.Mỗi hệ đào tạo cử nhân và cấp đào tạo cao học được coi 1a 1
tang
ao Số lượng dự định lây là 1000 (5% của tông thổ),
_ nếu phân bê mẫu vào từng tầng theo tỷ lệ thì kết quả như trong băng sau:
Lấy mẫu phân tầng
HỆĐT/Cấp ĐT SốlượngSV %S§V SLSV lấy ra từng tổng Cử nhân hệ CQ 10.000 50% s00 Cử nhân hệ liên thông 2.000 10% 100 Cử nhân VB2 2.000 10% 100 Cử nhân VLVH 5.000 25% 250 Cao học 1.000 3% 30 20.000 100% 1.009
ä Trong bang nay, SLSV Chinh quy chiém 50% tông thé vi vay mau lay ra cũng chiếm 50% toàn bo: mẫu Điều này cho thấy tý lệ lây mẫu bằng nhau gÌữa các tảng Tiêu cơ câu của mẫu giống hệt như cơ cầu tông của tổng thể thao các tầng
a
Lấy mẫu phí xác suất (Non-probability sampling) Trong thực tế, nhiều khi chúng ta khơng có thời gian, thơng tin và chỉ phí để thực biện lấy mẫu ngẫu nhiên —» Lấy mẫu phí xác suất (hay mẫu phi ngẫu nhiên)
MẪU phí xác suất khơng đại diện để ước lượng
cho tồn bộ tơng thể, nhưng được chấp nhận
trong nghiên cứu khám phá và trong kiểm định
giả thuyết
Lấy mẫu phi xác suất (Non-probabiliy sampling) Oo Lấy mẫu thuận tiện (convenient sampling)
- Mẫu thuận tiện được dùng khi bạn muốn có một
ước lượng sơ bộ về kết quả bảng câu hỏi bạn quan tâm mã không muốn mất nhiều thời gian và chỉ phí, - Cần suy nghĩ kỹ về thời gian, địa điểm hay hoàn
cảnh mà ta sẽ gặp đối tượng và thu thập dữ liệu ở đó
(khơng tùy tiện, ngẫu hứng)
Ví dụ: Vấn đề sv quan tâm trong trường ĐH hiện nay; Hay vấn đề du lịch, giải trí của phụ nữ ở tầng
lớp trung lưu ở đô thị lớn
Trang 20
Lay mau phí xác suất (Non-probability sampling)
o Lay mau định mire (quota sampling)
-LÁ y mẫu định mức tương tự như lấy mẫu xác suất
phân tang (phan chia tổng thê thành các tầng — tổng thể con) Điểm khác biệt cơ bản là trong từng tổng thể con người phỏng vấn được chọn mẫu tại hiện trường theo cách thuận tiện hay phán đoán, trong khi mẫu phân tang chọn ra theo kiểu xác suất
Vị du: Lấy mẫu 400 người lớn tại Tp, người NC có thể quyết định 50% nam ~ nữ; trong đó 1⁄2 trên 40
tuổi;⁄2 là lao động tự đo,
Lấy mẫu phi xác suất (Non-probability sampling) o Lay mau phan don (Judgement sampling)
Bạn chính là người quyết định sự thích hợp các đối tượng để mời họ tham gia vào mẫu khảo sát, do đó tính đại diện của mẫu khảo sát thực tế sẽ phụ thuộc nhiều vào kiến thức và kinh nghiệm của người nghiên cứu điều tra mà còn phụ thuộc vào những người thu thập đữ liệu trực tiếp
Chọn bao nhiêu là đủ?
Œ Quy mô mẫu:
_ N
1+ N(ey
Trong dé:
N: Quy mé téngthé
e: mức sai số mong muốn (tính bingty 1é %
từ công thức [1- độ tin cậy giả định])
Nếu không biết quy mô tổng thế?
3 Trong nhiều trường hợp, éu ta không biết trước được một cách cụ thê quy mơ của tong thé © rat kho chon được
mẫu xác suất,
_ Trong tình huỗng này, người ta thường ước lượng kích cỡ mẫu, sau đó tùy theo mà chọn tỷ lệ phù hợp (1%, 2%,
54 hay 10% của tông thể)
œ_ Để đảm bao cho phép thực hiện các tính tốn thống kê thì
dung lượng mẫu tôi thiểu phải là 30 đơn vị,
Q Néu khong biết được quy mô tổng thể, đương nhiên sẽ khơng kiểm sốt được mức sai số mẫu
BẰNG QUY MÔ MAU VOI CAC MUC SAI SO MONG MUON 42% | S% | 10% 33 oa sẽ 43? | X93 | at sẽ oF 98 ps sp 9060 | * | 1957] 999 | ssa i 383 j 99
Đầu * cho thầy là giã định về phân bố bình thường thấp,
đo đó không thể áp dụng công thức tính trong các trường hợp trên
Thực hành
œ Nhận biết thang đo của những câu hỏi sau đây:
Câu L: So với 5 năm trước, đời sống gia đình ta có tốt hơn khơng?
Khá hơn BI Khó trả lời 4 Cũng vẫn nhưthế 2 Không trả lời 99 Kém hơn trước v13
Trang 21
Câu 2: Xin Ông (Bà) vui lòng cho biết để dùng sinh hoạt hiện có
tong gia dinh (kém theo quan sát, nếu thấy nhường gì hiển nhiên
khơng có, khơng nêu hải)
Loai dé ding Loại đồ dùng
+ Giưỡng Ị - Cátxét (cd radio) On
- Giường bằng sạp tre [22 -Danmaynghenhac [12
~Tú f3 -Xeđạp OB - Bộ bàn ghế D4 -Xegắn máy DịỊ4
~ Bộ xa lông Gs -Máy may 1š
~ Tỉ vi đen trắng [6 -Tủ lạnh E16 - Tỉ ví màu C7 - May giat 117 - Đầu máy video [l8 - Điện thoại D1
- Radio 9 - Khác (ghí cụ thể, P19
- Chiêng, công,
dụng c âm nhạc DT [10 120
”
Câu 3: Ông (Bà, bạn) hãy cho biết mức độ thưởng thức các phương tiện truyền thông đại chúng, và các phương tiện giải trí
khác của mình
(Gợi ý bằng cách giới thiệu các phương tiện bên dưới rồi hỗi trong loại đó thường chọn loại hình nào?)
Đồng | Tuần | Tháng | Rấthiếm | lhơngbwsgi Lagi bình reày | vài lần | vài lần | trí Giám thường thất
vai
1 Đao Gey Oy {OS Be gn ctu 2 3 Nghermdo a) mT os hs Bqaduls
3 Zetdnuyn tình, ø | 0 a œ jđ BêqnduM
4 Eon sich a) mim Gt JÍS BồggdiuÐ5 $, XemAMiee a} Rm) ow oo ip $ Ngentasfrpới | OL | oe | 03 Ot | Banus *
Câu 4: Trong các phương tiện TTĐC trên, Ơng (Bà) thích loại
nào nhất ? (không tính: đến việc có thường xun xem lay
không, chỉ chọn một ý)
Boa tio” | Nano wadio | kam musta | Xe video | Bee akon T Nghe aia Bink Spine ain) 5 a œ Be BE G6
Câu 5: Trong các tờ báo đã đọc, Ông (Bà) thường đọc những mục
gì nhấU (Chỉ chọn tối đa 3 mục tường đạc nhất) Các mục í
Câu 6: (Chỉ hồi những người có nghe radio) Ơng (Bà) thường
nghe radio như thế nào?
© Thường nghe hấu hết tất cỉ các chương trình 8L © *nghe, nên lúc eink gip cdi gì nghe cái đấy œ
© Ln nghe chương trình quan tím nhất Ø Câu.7: Trong các chương trình truyễn hình, Ơng (Bà) thường coi chương trình nào nhiều nhất ? (Cñl chọn tối đa 3 mục thường xem nhấU
Các chượng tình văn nghệ
‘Tia afc wong awe an o
C4u 8: Trong các loại hình nghệ thuật nói chung, Ơng (Bà)
thích loại não?%(bao hàm cễ trên các PTTTĐC và sân khẩu)
Chọn tối đa 3 loại hình thích niưất rồi chọn thứ tự ta
tền:[Mã số: thích nhất:1; thích ở mức độ thứ nhì:2; thích È miức độ thứ:3] ta nhac ce Dene o7 fring 8 - Toằng, hết Đội ce + Kịch mãi Cpe
+ Lael tila krếo (ghi cụ th mu
Câu.9: Trong các loại nhạc sau, Ơng (Bà) thích loại nhạc nào? (Chỉ chọn tất đu 3 loại)
-Đâng oO Rigetige chiến 9 Nhạc hổi ngàn: oy - Ca khúc hiện đại Ủ -LajiMiếc
Câu 16: Và theo Ông (Bà), người Raglay ta cẩn phải học đến lớp mấy thì mới được?
Lớp: được đến đâu hay đến đấy 19
Câu 11: Nhưng trên thực tế gia đình ta có thể cho con cái học
Trang 22
Câu 12: Theo ông bà, có cần dạy chữ viết của người Raglai cho người Raglai hay không?
1c en
3 Không Ge
3, Khó trả lời 3 9 chuydn qua câu 24 Vì sao? (Ghi cụ thể,
Câu 13: Nếu trong gia đình khơng có điều kiện cho tất cả
các con đi học ,, theo ông bà nên ưu tiên cho con trai hay
con gái? 1.Con trai Ø1 2.Congái H2
14: Theo ông bà, khi rong nhà có người bị bệnh có
cần mời thây cúng đến cóng để được khỏi bệnh không?
(PVV không gợi ý, nếu người được phông vấn khó trẻ lời
thì nêu các phương pháp có thổ)
1 Nhất thiết phải mới ĐI 3 Mời cũng được, không mới cũng dược — f2
3 Không cần thiết phái mồi os
4 Không biết ti 5 Khó (Khơng trả l8) B5 Vì sa? (Giả cụ th)
Câu 15: Có nên lấy người khác với đân tộc mình khơng?
Loe Œ
3, Khơng Œœ 3 Khỏ trả lời ga
Câu 16: Có nên lấy người cùng họ với mình không?
108 8: 2 Không a 3 Khe trễ tới 8 Vi sao? (Ghi cy thé):
Câu 17: Trong gia đình ta, quyên quyết định cho con cái
kết hôn là ai?
1 Trưởng tộc (người đứng dẫu dang fo? Hi
2 Ong R
3.Ba 8
4 Cha O4
5 Me t5 ó Tự những người kết hôn quyết định 86
Câu 18: Trước khi kết hơn có cần xem tuổi cô dâu, chủ rể
khơng? 1.Có on 2 Khơng œ 3 Khó trả lời œ
Câu 19: Khi phụ nữ mang thai, họ có cần kiêng cữ điều gì
khơng? (rong sinh hoạt, ăn uống) 1,Có on
3, Khơng, m 3 Khả trổ li t5
Câu 230: Trước khi lập gia đình, người con trai, con gái có được ai
đồ giải thích, hướng đẫn những điều cần thiết khí lập gia đình
khơng? (Có thể chọn nhiều ý, PVV không đọc các phương án trả lời)
Lơng ot 6.Có, dì 8ó
2.Ba fa 1.Chủ, bắc a
3h os §Agưới có trích nhiệm trong lãng — Ơ
AM tH 9.Mót tổ chức nảo đó 88
5.Anh, chị ts 10.Khơng cố 010
Câu 2: Trong gia đình Ơng (Bà) ai là người quyết định những việc sau xác định mức quyết định của mỗi thành viên bằng những con số rôi viết vào cắc cột tưởng ông sao cho tổng mức qugết định = 10 phẫu )
Loại việc Mức để quyết | Mdcdé Ì Thành định của quyếi -Í viêo khúe
chứng đình của j (nhi rổ] IS? aa
3 hay aa nd etfs
5, Những quyết định có liển quaa đếu sức
, Mua các 46 ding dit rida (TY, xe a cửa con ea)
Trang 23Câu 22: Ông (Bã) hãy cho biết đánh giá của mình về những nhận định dưới đây (khoanh vào ô tương ứng sao cho hàng nào cũng có mã số được khoanh và không trùng nhau)
StF Niững nhận định Đơng Ì heap | hở ý | đởngg | trả lì i i z Ậ
3 ‡ i $
3 cing vide cba dens neat ghey we t 2 5 + ig duit ohn oc sự vs sẽ cây ngyời chong † 2 3 3 L 2 3
& + 2 3
7 i + 3
8` | Phụ nữ không nôn Đam gia vàocông việc của thôn sốma,đe| 1 là Việc của đàn ông
Câu 23: Ông (Bà) hãy cho biết mức độ tiếp xúc với những người thân, bạn bè xung quanh như thế nào?
Những người mà người trổ | Thường Trinh | Khơng j Khơng (khó
lợi nói vặt trẻ Of là OF nó
CAu 24: Bay giờ tôi sẽ đọc tên các mối quan hệ mã chúng ta
thường có Ơng (Bà) hãy lắng nghe và cho chúng tôi biết mức độ quan trọng của từng mối quan hệ đối với Ông (Bà)
(Hãy gại ý để người trề lài xác định mỗi quan hệ quan trọng nhất rồi nói: cầu trong những quan kệ còn lại, cái nào quan trọng nhất? Khi có câu trễ tòi, khoanh tròn th tự theo tăng hằng)
Tàn kòn không đất quan
quan trọng Trọng,
1 Quan bệ trong ga định 123456789 0 3 Quan hệ vội bà con bọ làng 1 2 3 4 5 6 7 6 9 10 3 Chữa bệ với bạu bờ 123456789 0
4 Quan hệ với đồng nghiệp 1 3 3 4 5 060 7 8 9 10
5, Quan hệ với làng xòm, 123456789 10
6 Quan hệ v6iedlp ken 12343 67 8910
Câu.25: Bà con trong cộng đồng có thường đến thăm nhà Ơng (Ba) hay khơng?
106 8!
2 Không G2 *> chuyển qua cầu 26
Câu 26: Nếu có hãy cho biết mức độ họ đến thăm của họ
1, Vài Tấn một tuân OL 1 2 Vải lấn một thắng ta t6 3 Vài lấn trong nấm) 03 6 Không biết 06
“
Câu 27: Ơng(Bà) có thể mô tả người láng giêng ở sát
bên nhà mình như thế nào?
3/Cơi như người trong gia định 1 4 3Nhữ những ngỪii xalg 04 nhờ bạn bà: na 5 háng trả lối as luơ là những agưới quen ĐiếC D3 6 Kháng biết né
Câu 28: Khi trong nhà có người bị bệnh, thơng thường gia đình
Ơng (Bà) thường làm thế nào để họ khối bệnh? (chọn một
phương án thường xuyên nhất)
sit Điện gháp
1 Ra mamxd kha byob ue 2, Ra bdi bieu inte a 3 Tehva bbag drut cam oF 4 MỡHhầy đến cúng cà 5 Khối không trẻ le) 05
Câu 29: Ông (Bà) có biết các loại lễ hội từ trước tới nay do
cộng đồng mình tổ chức hay không? (kể câ những lỄ hội, ngày nay khơng cịn tổ chúc nữa)
Trang 24
Phan 1
Thong ké m6 ta (Descriptive statistics)
Théng kê mô tả là phương pháp liên quan
đến việc tổ chức, tổng hợp và trình bày số liệu thu thập được từ mẫu nghiên cứu hoặc tổng thê
1 Dữ liêu thô: Thích loại nước ngọt
3333333233313333313 23313333331
đ Một trong những lý do chính sử dụng phương
pháp thống kê là để tổng hợp và mô tả dữ liệu,
làm cho thông tin được trình bày rõ ràng hơn
PP thống kê mô tả dudi dang bang
© Phan phối tần suất: 1 bảng trình bày số lần
xuất hiện của một hay nhiêu giá trị được quan sát trong mẫu hoặc tông thê
PP thống kê mô tả dudi dang bang
cl Các kiểu phân phối tần suất mœ Thô (raw)
a Lién hệ (relative): tỉ lệ (proportion) va phan trim (percent)
a Lily tién (cumulative)
Phân phối tần suất
Ø Một số ky higu str dung trong tính tốn phân phơi tân suất
v n= téng sé mẫu quan sat v x= bién
¥ i gid trị (thành phần) của biến X
v ,# = tân suất quan sát của giá trị thứ ¡
Phân phối tần suất (t.t) œ Các thành phần (giá trị) của biến phải:
a Loại trừ lẫn nhau
= Bao phủ hết các trả lời
Trang 25
Phân phối tần suất (t.9 = Bảng phân phối tần suất nên bao gồm:
ø_ Tiêu đề môtả nội đụng của bảng
a Tên biến
Nhân giá trị cho các thành phần biến
œ_ Tổng các quan sát của mẫu
ø Khai báo nguồn đỡ liệu
a
1 Bảng phân phối tần suất thô
Bang 1, Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọt thích Số đếm được "Tần suất
(Tally) (Frequency) 1.Coca - Cola 4 4 2.Pepsi 2 2 i.Khac 24 24 ‘Téng (n) 30 30 Ngudn: Khéo sát lớp học TKXH, tháng 11, 2007 “
2 Bảng phân phối tần suất liên hệ
Bang 2 Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọtthích Tầnsuất-fí Tilệ-pi Phan tram-%i (frequency) (proportion) (percent)
1,Coca - Cola 4 0,133 13,3 2.Pepsi 2 0,067 6,7 3.Khác 24 0,80 80,0 Tông 30 1,0 100,0 Nguôn: Khảo sát lớp học TRCCH, tháng 11, 2007 “
2 Bảng phân phối tần suất liên hệ
ä Công thức: ~ Tần suất tỉ lệ: pat n 3;p,=1 - Tần suất phần trăm: %ï = ÖLx100 R S 3ö =100
3 Bảng phân phối tần suất lũy tiến
Bảng 3 Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọtthích — Tân suất Phần trăm % lũy tiến
(frequency) (percent) 1.Coca ~ Cola 4 13,3 13,3 2.Pepsi 2 67 200 3.Khác 24 80,0 100,0 Téng 30 100,0
Nguôn: Khảo sải lớp học TKXH, théing 11, 2007
Thử tài
ø Tâm trạng khi học Thống kê xã hội
Data:
3 3 4 3232242 3 3 3 4 3 43 134414 3 2 3
Lập bảng phân phối tần suất thể hi (fi), ti 18 (pd), phần trăm, và % lũy tiến
Trang 26
Dap án thử tài
Bảng phân phối tần suất thế hiện tâm trạng khi học TKXH:
Tâm THE trăm trăm i Œ, 4%) tiên 1 2 3 4 a
4, Bang phân phối tần suất cho biến có
thang đo thứ bậc hacluc4 Ho lúc
Tan sai | Phạn tam | % bự tien Valid |1 Trưng bình 9 30.0 30.0
2 Trưng binh kha, 1 367 66.7 3 Kha 9 30.0 967 4 Giá ‡ 3.2 180.0
Tolat 3a 100.0
Nguôu: Khảo sái lớp học TKXH, tháng 11, 2007 vat
5 Bang phân phối tần suất cho biến có thang đo khoảng - tỉ lệ
Bảng 5.:Danh sách sinh viên lớp TK04 với điểm trung bình chung năm học
Bang 5.2: Phân bố tần suất điểm trung bình chung năm học của
SV lop TK04
SV _ ĐiểmTR sv Diém TE sv Điểm TR 1 68 + 68 + %4 2 71 12 68 22 68 3 80 13 78 23 60 4 69 14 65 24 72 5 ” 18 63 28 72 6 S6 16 62 26 70 7 sĩ v 66 + 70 8 & 18 68 28 69 9 63 19 92 29 70 10 S6 20 Sẽ 30 73
Diém TB chung “Tân suất Phan trim
(s6 sinh vién) (%) 50-55 1 33 56 ~- 60 2 6,7 61~65 8 267 66 ~ 70 12 400 71-75 5 16,6 76 ~ 80 2 67 Téng 30 100,0
Nguôn: Khảo sát lớp hẹc T04, thang 11, 2007 Nguân: Khảo sắt lớp hoc TKO, tháng 11, 2007
18
© Kiéu phan bé tan sudt trong vi du tir bang 5.2 là kiêu phân tổ theo kinh nghiệm
Ø Trong thực tế, khi gặp đạng dữ liệu nhiều biéu
biện người ta có quy tắc đề tiền hành phân tổ
=> Phương pháp phân tổ dữ liệu
Phương pháp phân (ỗ dữ liệu
1 Khi phân tổ dữ liệu, tùy theo mục đích thể biện đữ liệu cũng như phân bố đều đặn hay không đều dan
của dữ liệu mà có thể tiến hành phân tổ đều hoặc
phân tổ không đều
œ Khái niệm đều hoặckhông đều liên quan đến khái
niệm khoảng cách của tô
Chênh lệch giữa giới hạn dưới và giới hạntrên là trị số khoảng cáchtô
Trang 27
Các bước của thủ tục phân tổ
n Xác định số tổ cần chia:
Không có một con số quy định chính xác con
sơ cân chia là bao nhiêu, nhưng theo kinh nghiệm người ta thây nên chia trong khoảng
từ trên 5 đến dưới 15 tổ
Với n là số quan sát của tập dữ liệu:
Số tô cần chia k = (2*n)!2
Các bước của thử tục phân tổ
n Xác định trị số khoảng cách tổ:
Căn cứ trên số tổ định chia, người ta xác định
trị sô khoảng cách tô theo công thức như sau:
Với: Xu„„„ X„„ là giá trị lớn nhất và nhỏ nhất
của tập đữ liệu; k là số tổ định chia
Các bước của thủ tục phân tổ O Xác định giới hạn dưới và giới hạn trên của
các tô:
Tổ thứ nhất: Q„ÿ Xuuyth)
Tổ thứ hai: (X„u£h; Xu jsth th) = Q irth; Xuu„t2h) Té ther ba: (Nyigth, Xpict2h +h) = (Xpigt 2h; Xpit 3h)
"
Phân tổ cho báng đữ liệu 5.1
DIEMTB TAN SUAT PHAN TRAM (%)
55-61 3 10,00 61-67 40 33,33 67-73 1+8 43,34 Trên 73 4 1833 TÔNG 30 100 Vi du:
Dữ liệu của miột mẫu điều tra nhỏ vềđộ tuổi của30 sinh viên hệ VLVHnăm Ï như sau:
28 23 30 24 19 21 39 22 22 31 37 33 20 30 35 21 26 27 25 29 27 21 25 28 26 29 29 22 32 27 Hãy lập bang tầng số cho các dữ liệu trên
Phân tê dữ liệu
6 Dé bang tin số dam bao tinh khoa học, chúng ta tiến hanh phan tich tô đữ liệu rôi mới lập bangtan so
BỊ Xác định số tả cần chia: k=(2xn)!2 với n = 30 —+ (2 x 30)!⁄2= 3,9 = 4 tổ B2 Xác đình trị số khoảng cách tổ hị với X39; với Xu 19 và k=4 x, x,
hyo Sos nie
Trang 28
Phân tổ dữ liệu
B3 Xác định giới hạn dưới và trên của các tô:
Với h = 5, ta xác định cận trên và đưới các tổ lần
lượt như sau:
Tổ 1: 19— 19 +5 =19~24 Tổ 2: 24— 24 + 5 = 24 ~ 29 Tổ 3: 29 - 29 + 5 = 29 — 34 Tổ 4: 34— 34 + 5 = 34 ~39 Phân tổ đữ liệu Độ tuôi (tuôi)Số SV 19~24 9 24~29 10 29~34 § 34 trở lên 3 Tơng 30 Bang tan số
Độ tuổi (tudiy The vá Phân trầm
19~24 9 30,00 24-29 10 33,33 29~34 § 26,67 34 trở lên 3 10,00 Tổng 30 100,00
Một số điều kiện phải tuân thủ khi
tiên hành phân tô
œ Các tổ không được trùng nhau, để cho một quansát bắt kỳ chỉ thuộc về một tổ
œ1 Tất cả các tổ được phân chia phải bảo đảm bao quát
hết tất cả các giá trị hiện cócủa tập đữ liệu
œ_ Tránh không để tả rỗng do không có quan sát nào
thuộc về tổ đó Bài tập vận dung
VDI Khảo sát mức độ thường xuyên đọc tài liệu chuyên ngành, kết quả ghỉ nhận như sau: (Nguồn: Thông kê lớp 02)
Mức độ Tân suất % % tñy tiễn
1 Hằng ngày 106
2 Tuân vải lần 150 3 Tuấn 1 lận 15 4 Íthơn 1 lân 15 5 Không bao giờ 100
Tổng
Hãy lập bảng phân phối tuần suất?
DAP AN VDI:
Bang phan phối tuần suất
Mức độ “Tần suất % 3% lũy tiến
1, Hỗng ngày 100 15.38 15.38 2 Tuần vài lân 150 23.08 38.46 3, Tuân 1 lần 175 26,93 65.39 4 Ít han Liền 125 19.23 84.62 5 Không bao giờ 100 15.38 100
Tổng 650 108
Trang 29
Bài tập vận dụng DAP AN V2:
VD2 Phân bố điểm kết quả học tập môn thống kê cũa sinh Đăng phân phối tuần suất
TT ¬¬ Số lượng SV| % | %laytién Nhóm điểm TB or m [ore % | %Múy tiến
0-30 50 0-30 50 l5 | 750 | 176 | 1176 31-49 75 3i~49 18 40 | 3000 |1765 | 2941 S0 ~ 60 100 50 ~ 60 100 | 55- | $500 |23s3] 52,94 61-79 120 61-79 120 70 | 8400 Ì2824] 8118 30 ~ 100 80 80 ~ 100 30 90 | 7200 Ì1g82 Ì - 100 ‘Ting Tông Hãy lập bảng phân phối tuần suất?
we ‘a
vipwu 3: DAP AN VD3:
Bang phan phéi tudn sudt
Thống kế về vẫn đề sử dụng thư viện của sinh viên, -
kết quả cho thấy: Quý es) Tan sult % lũy tiến
Quý 1 có 3500 lượt, 1 3500 29.05 29.05
Quy 2 có 1550 lượt ? 1550 12.86 4L91
Quý 3 có 2000 lượt; 3 2000 16.60 58.51 Quý 4 có 5.000 » Sa ; 4 5000 41.49 400.00
Hãy lập bảng phânphôi tân suất, phân trăm và lũy tiên Tổng 12050 100
“ “
vipu 4: DAP AN VD4:
Bang phân phối tuẦn suất
Cuộc tổng điền tra xã hội năm 1994 của Hoa
Kỹ có câu hỏi “Ơng/bà có đọc báo thường xuyên Mức độ Tan (suất) % % lũy tiến không?”, với các phương an các trả lời (hàng ngày, 1 Hằng ngây 969 2s 7959
tuân vài lần, tuần một lần, ít hơn tuần một lân, - ~
không bao giờ), số đếm được của các trả lời trên x " welts Bài 35 en
tương ứng như sau:969 , 452, 261, 196, 76 * Tee ! i - 361 1336 86.08
Hãy lập bảng phân phốt tần suất, phần trăm và 4 ithon | lần/mẫn 196 10.03 98.11 Hy tiến, 5 Không bao giờ 16 3.89 100.00
Trang 30
Mô tả độ tập trung biến
(central tendency)
Đề mô tả sâu hơn một tập dữ liệu định lượng, ngoài việc tính tốn phân phối tần số là một công
cụ hữu ích để chuyển hóa đữ liệu định lượng
thành thông tín, thì chúng ta cẦn bổ sung vào bộ công cụ thống kê của mình các đại lượng số (đại
lượng thống kê mô tả) để đo độ tập trung và độ
phân tán,
Các đại lượng này sẽ cho chúng ta hiểu rõ
rang các chỉ tiết về tập dữ liệu nghiên cứu
Mô tá độ tập trung biến
1 Yếu vị (Còn được gọi là số Mode)- MO:
Giá trị xuất hiện nhiều lần nhất trong tập mot dé
liệu
*Mode có thể được sử dụng cho tất cả các loại
thang đo
'>Mode không chịu ảnh hường của những giá trí
ngoai lê (giá trị đầu cuối của day phân phôi),
Yéu vi (Mode) a VDI: 2 3 3 3 2223323322 3.23323344234322 3 > Mode=3 = (2:12; 3:15; 4:3) Yéu vi (Mode)
ä Mode có thể khơng tồn tại trong một dãy
phân phối, đôi khi có thể khơng tìm ra được
số mode hoặc có thể có nhiều số mode
Ví dụ:
+ Tập dữ liệu khơng có Mode: 1, 2, 3, 4, 5, 6 + Tập dữ liệu có 2 Mode: 1, 2, 3, 3, 3, 4, 5,6, 6, 6, 7 Cách xác định moác:
TH Dữ liệu khơng phân nhóm = Mode là giá trị có tần suất lớn nhất
+
Nguôn: Khảo sải lốp học TKOI, tháng 11, 2007
vD2: GPñ ĐiỂm trung bình sấm học vile que đưa” Fercent aig Recta
sỉ ay fy 82 o 5 2 28 ae » sa E7]
Xem thêm:- TH Dữ liệu phân nhóm có khoảng cách đều nhau
"
- TH, Dữ liệu phân nhóm có khoảng cách khơng đều nhau
Mô tá độ tập trung biến
{central tendency)
2 Trung vi (Median) - Me: là giá trị đúng giữa trong tập một dữ liệu
Ø Giá trị này chia tập quan sát làm hai phần đều
nhau, 50% số quan sát của tập đữ liệu có giá
trị bé hơn giá trị trung vị và 50% lớn hơn giá trị trung vị
Trang 31
Trung vi (Median)
Chú ý:
w Muốn xác định giá trị trung vị của một tập đữ
liệu, các quan sắt trong tập đữ liệu này Trước tiên phải được sắp xếp theo trật tự (từ nhỏ đến lớn hay ngược lại)
s Khơng tính tốn giá trị trung vị cho biến có thang đo danh nghĩa
i
Trung vi (Median)
Công thức xác định vị trí của trung vị: Median x : (n+1)/2
- Nếu n là số lẻ, thì số trung vị là quan sắt ở vị tri thir (n+1)/2 trong tập đữ liệu
Trung vị (Median)
Trong trường hơp n là số chẵn: số trung vị là giá trị trung bình cộng của 02 quan sát nằm ở vị trí chính giữa tập đữ liệu
Tức là một quan sắt ở vị trí thứ n ⁄2 và một quan sát ở vị trí thứ {(n+2)⁄2]
Xi du:
(8+1)/2 = 4,5 — gia trị trung vị rơi vào giữa giá trị quan sát thứ 4 và quan sát thứ 5 trong
tập dữ liệu 60 Trung vi (Median) o VD: 63 68 70 78 70 67 57 60 69 74 59 65 55 70 72 69 70 65 65 74 69 65 63 59 75 68 68 65 65 72 bà Trung vị (Median) H Bước 1: sắp xếp thứ tự tập đữ liệu 55 5759 59 60 63 63 65 65 65 65 65 65 67 68 68 68 69 69 69 70 70 70 70 72 72 74 74 75 78 t Trung vị (Median) ö Bước 2: xác định vị trí trung vị Median x: (30+1)/2 = 15,5 - Giá trị trung vị nằm ở vị trí thứ 15 (68) và_
thir 16 (68) trong tap dé liệu đã được sắp xếp
Giá trị trung vị = (68+68)/2 = 68
Trang 32
Trung vị (Median)
n Chú ý:
Khi xác định trung vị, nhiều người hay lẫn lộn
giữa vị trí của trung vị và giá trị của trung vị,
Nhớ là ta xác định vị trí trung vị trước để biết
trung vị là quan sát nào, sau đó xem quan sát đó có giá trị bao nhiêu thì đó là giá trị của
trung VỊ
Trung vi (Median)
0 Déi véi biến có thang đo thứ bậc: sử dụng bảng phân phôi tân suất lũy tiên để xác định
giá trị trung vị
5 Giá trị trung vị chính là giá trị có phần tram
lũy tiến lớn hơn và gần kề tị lệ 50%
* Xem: Các xác định trung vị cho đữ liệu phân nhóm (1ơ) có khoảng cách
Trung vị (Median)
VD2: hocTKXH Tâm trạng khí học Thống kê xã hói
Đgướm | Nđ Peosnt Ệ 67 67 T ; Ậ 2 tả 2 z L ‡ BS aS 160.0 # 10060 1008
Nguén: Khéo stit lop hoc TKO4, thing 1, 2007
~> Median x= Binh thudng (3)
Mô tả độ tập trung biến
(centraltendency)
3.Trung bình cộng (san):
© Trung bình cộng là một đại lượng số mô tả độ tập
trung của đữ liệu được sử dụng phổ biến
œ Trung bình cộng đơn giản được tính bằng cách cộng tất cả các giá trị của mỗi quan sát () trong tập dữ liệu rồi chia cho tổng số quan sát (n)
Fe eS ” oO Công thức: Trung bình cộng (Mean) ä Ký hiệu:
ak: giá trị trung bình
øn : tổng số mẫu quan sắt
ø X;: giá trị quansát thứ ¡
Trung bình cộng (Mean)
Trang 33
Bảng 5.2: Phân bê tần suất điểm trung bình chung năm học của
SV lớp TKXH Điểm TB chung H m fm %c S1~55 1 33 53 3,3 56 ~60 2 58 116 10,0 61-65 8 63 504 36,7 66 —70 12 68 816 76,7 1-75 5 73 365 93,3 76 — 80 2 7B 156 100,0 Tổng 30 Nguồn: Khảo sắt lớp học 7K04, tháng 11, 2007 3 =[(G3* 1}: (58*2)+(63*8)2(68*12)+(73*5)+(7892)J/30= 67
Tinh giá trị trung bình cho biến có thang đo thứ bậc:
#12 Bido độ nghe radio
Combine ereont — | VU Bưưnh
B86 Woo
"Nguồn: Số liệu điều tra của Khoa Xã hội học tháng 03/2062
xf K = [(161* 1)+ (93*2)+(66*3)+49*4)+(31795))/686 = (161 + 186 + 198 + 196 + 1585)/686 = 3.40 =3 “ Bài tập
Bảng tần suất và đo lường độ tập trung biến
Mộtnhà nghiên cứu tại quan tâm đến việc tông kết độ đài của mỗi lần làm tra của những bệnh nhân lần đầu, đã chọn ngấu nhiên 10 hỗ sơ của những cá nhân được đưa vào trung tâm trong vòng 02 năm qua
Độ dài mỗi lần hưu trú (theo ngày) tại trung tâm như
sau:11, 6, 20, 9, 13, 4, 39, 13, 44 và 7
Hãy xác định giá trị trung bình (mean} trung vị (median)
m
Vn dé 1 (tt):
Một nghiên cứu tương tự cách đây 25 năm cũng tại trung tâm này, với d6 dai của mỗi lần lưu trú của 1Ô bệnh nhân như sau: 32, 18, 55, 17, 24, 31, 20, 40, 24, và 15 ngày
„ Hãy so sánh kết quả này với cuộc điều tra mới
vê giá trị trung bình và giá trị trung vị Giải thích những sự khác biệt về kết quả giữa 2 cuộc điều
tra
Vấn đề 2
Cuộc tổng điều tra xã hội năm 1994 của Hoa
Kỳ có câu hỏi “Ơng/bà có đọc báo thường xun không?”, với các phương án các trả lời (hàng ngày, trần vài lần, tuần một lần, ít hơn
tuần một lần, không bao giờ), số đếm được
của các trả lời trên như sau: 969, 452, 261, 196, 76
Vấn đề 2
a Lập bảng tần suất liên hệ và lũy tiến
b Xác định giá trị trả lời trung vị
c Xác định yếu vị
d Nếu biến Y= mức độ thường xuyên đọc báo
như được mô tâ ở trên Chúng ta có thê tìm giá trị trung bình của Y hay không? Tại sao?
Trang 34
Vân đề 3 x 3 Bang 3
Cuộc tông điệu tra xã hội năm 1290 của Hoa Kỳ có z — + câu hỏi “Trong vịng 12 tháng qua, Ơng/bà biết, một Số nạn nhân Tân suất
cách cá nhân, bao nhiêu người là nạn nhân của tội 0 1244 phạm giết người?” Bảng 3 trình bảy kết quả phân tích 1 81 của 1.370 trả lời 2 27
_a Trinh bay bang phan phéi tan suất liên hệ và lũy 3 "1
tiên? 4 4 b Tính giá trị trung bình,trung vị và yếu vị Giải 3 2
thích những giá trị này? 6 1
Vân đề 4 Bảng 4
O10 hộ gia đình được chọn ngẫu nhiên tại tiểu Tiểu bang Nông thôn Thành thị bang Florida, Hoa Ky va 10 hé gia đình khác
được chọn ngẫu nhiên ở tiểu bang Alabama Bảng 4 trình bày thông tin tổng hợp về thu nhập
trung bình hộ gia đình
“Thu nhập trung bình tại Alabama thì cao hơn Florida ở cả hai khu vực nông thôn và thành thị,
Florida $26.000 (n=3) — $39.000 (n=7) Alabama $27.000(n=8) 340.000 (n=2)
Hãy so sánh thu nhập trung bình chung (ở ca nông thôn và thành thị) của hộ gia đình tại 02 tiêu bang
Mô tả độ phân tán biến
(dispersed tendency)
1 Giá trị lớn nhất (Max), giá trị nhỏ nhất (Min)
œ Giá trị lớn nhấtà giá trị có điểm số cao nhất
trong tập dữ liệu
=- GIÁ trị nhỏ nhấHâ giá trị có điểm số thấp nhất
trong tập dữ liệu
2 Cách độ (Range) -R
- Cách độ là một trong những cách dễ
nhật đê mô tả mức độ biên thiên
- Cách độ là sự cách biệt hay khoảng cách giữa giá trị quan sát lớn nhất và giá trị quan sát nhỏ nhất
Trang 35
2 Cách độ (Range) -R
q Công thức:
R= Xem — Xmin
Đại lượng cách độ (R) bị ảnh hưởng rất nhiều
bởi các giá trị ngoại lệ => đại lượng đo lường độ phân tán yếu nhất và ít được sử dụng
Bảng 4 Khoảng cách đi từ nhà đến trường của sinh viên
Sinh viên Khoảngcách Sinh viên Khoảng cách
(km) (km) 1 2 9 H 2 4 10 13 3 4 UW 13 4 4 12 14 5 5 13 15 6 7 14 19 7 9 15 20 8 10 R=20-2=18km
3 Phwong sai (Variance)
tì Một phương pháp khác để đo lường độ biến
thiên của một tập đữ liệu là sử dụng giá trị trung bình cộng như là một điểm để so sánh với từng
giá trị quan sát
3 Phwong sai (Variance)
q Cách đơn giản nhất để tính đại lượng này là
lấy giá trị của từng quan sát trừ đi giá trị trung bình cộng của tất cả các quan sát này, sau đó
cộng tất cả các kết quả lại thành độ lệch
trung binh (mean deviations) d(x- 2) = mean deviations 3 Phương sai (t0) ¥ =10 S{x-# )= (210) + (4-10) + (4-10) + (4-10) + (5-10) + (7-10) + (910) + (10-10) + (11-10) + (13-10) + (13-10) + (14-10) +(15-10) + (19-10) + (20-10) =0 3 Phương sai (t.t.)
= Vấn đề đặt ra đối với phương pháp này là
tổng các độ lệch của đữ liệu luôn bằng 0
Ø Trong khi a6, gid tri Othi khơng có ý nghĩa trong việc đo lường độ phân tán
Trang 36
3 Phương sai (tt)
œ Để khắc phục vấn để này — các giá trị lệch
giữa giá trị quan sát và giá trị trung bình sẽ được bình phương (làm cách này, những giá trị âm sẽ khơng cịn nữa)
®% Sau đó cộng tất cả các giá trị bình phương
này lại
t
3 Phương sai (Variance)
©) Phuong sai là giá trị đo lường độ biến thiên xung quanh giá trị trung bình
t1 Phương sai được tính bằng cách lầy tổng các biến thiên giữa từng quan sắt với giả trị trung
bình đã được bình phương chia cho (tổng số
quan sát ~ 1)
3 Phương sai (Variance)
Công thức:
Phương sai mẫu (sample variance)
St=S(K- EY An- 1) 3 Phuong sai (t.t.) (x- =) @&- x3 Oz) (x: 2-10=8 64 11-10 +1 1 4-10 =-6 36 9 36 9 36 16 -10 = 25 25 7-10 =-3 9 19-10=49 81 9-10 =1 1 20-10=410 100 10-10 =0 0 Z=0 X=448 n=15 St 448 /14 = 32,0 3 Phuong sai (tt)
ñ Mặc dù phương sai được xem như là một trong những phép tính thống kê để đo lường độ phân tán, tuy nhiên nó khơng có ý nghĩa
nhiều
Ø Giá trị này chỉ thực sự có ý nghĩa khi nó được chuyên hóa thành một giá trị khác gọi là độ
lệch chuẩn (Standard Deviation)
4 Độ lệch chuẩn (Standard Deviation) - s
© Độ lệch chuẩn chính là giá trị căn bậc hai của
phương sai SD được dùng để đo lường độ
phân tán của các quan sát xung quanh giá trị trung bình
s= ݧ? = 432 = 5,660
ä Độ lệch chuẩn tương ứng với các giá trị quan sát trong tập dữ liệu càng lớn thì độ biến thiên của tập đữ liệu càng lớn
Trang 37
4 Độ lệch chuẩn (Standard Deviation) - s
m Giải thích SD:
$% Ứng với khoảng cách trung bình từ nhà đến
trường của các sinh viên là 10 km, các giá trị
quan sát có độ lệch chuẩn là 5,66 km
wo
5 IQV Gindex of Qualitative Variation) n Sử dụng dé đo lường độ phân tán của đữ liệu
định tính
a k =số cácgiá trị củabiễn a N =s6 trudng hopnghién cứu
m Sf =tông của bình phương tấn suất
œi Đại lượng IQV nhận các giá trị từ 0 đến 1
=0 ® cho thấy khơng có sự biến thiên trong mẫu w 1® cósự phân bố đều nhau giữa các giá trị
(không tôn tại yêuvị mode}
Đo lường Đo lường Thang đo độ tập trung dé phan tan Danh nghia Yếu vị JQV
Thứ bậc Trung vị TOV Khoang/ Ti lệ Trung bình Độ lệchchuẩn(s)
Bài tập
Đo lường độ phân tán của biên Vấn đề 6 Một công ty tiến hành nghiên cứu về thói
quen sử dụng các phương tiện giao thông công cộng thông qua xác định quãng đường đi của nhân viên mình trong một ngày cụ thể Mười người được chọn ngẫu nhiên để xác định quãng
đường đi này có số liệu như sau (đặm) 0,0,4, 0, 0, 0, 10, 0, 6, 0
Vấn để 6
a Tính và giải thích các giá trị sau: trung bình, trung vị, yêu vị, cách độ, phương sai và độ lệch chuẩn
b Một người nữa sống tại một thành phố khác được chọn để nghiên cứu, di 90 dim một ngày
băng phương tiện giao thơng cơng cộng Tính tốn lại các giá trị trung bình, trung vị và độ lệch chuẩn Cho biết tác động của quan sát ngoại lệ này
Trang 38
Vấn đề 7
ñ Một giáo sư dạy thống kê nhận thấy rằng sinh viên của ông ta thường phần nàn về cảm giác lọ lắng về tài liệu trong khóa học VỊ giáo su quyết định tiền hành đánh giá sự trải nghiệm lo lắng trong lớp học của mình và sinh viên một lớp Ngữ văn Anh Dữ liệu thu thập được như sau: Vấn đề 7 Lớp Thống kê 23 22 18 26 29 27 30 25 10 11 lã 17 19 18 19 20 21 18 14 20 13 22 Lớp NV Anh 1 6 Il 20 39 1 13 lố 19 35 29 24 5 20 29 34 31 39 27 1 9 21 Vấn đề 7
a Tim gia tri trung bình, trung vị và yếu vị của mỗi lớp
b Tìm khoảng biến thiên (range), phương sai và
độ lệch chuẩn của mỗi lớp
Vấn đề 7
c, So sánh kết quả của 02 lớp, chúng ta có thể kết luận điều gì về sự trải nghiệm lo lắng giữa sinh viên 02 lớp này
d Nhóm nào biểu hiện một sự đồng nhất hơn
- Phan 2
Thong ké suy dién (Statistical Inference)
oKiém định giả thuyết là một công cụ của thống kê
suy diễn
aM uc dich chính của hầu hết các nghiên cứu là để kiểm tra có hay khơng việc những dữ liệu thu thập từ các cuộc điều tra phù hợp với những dự báo về
một vấn để cụ thể Những dự báo này chính là các
giả thuyết (hypothesis) về tham số được đo lường
trong nghiên cứu
Thống kê suy diễn
a Giả thuyết là một phát biểu về những đặc trưng
của một tham số (biên) hay tập hợp của nhiêu tham sô
Trang 39
Những yếu tổ của một kiểm định ý nghĩa
a Kiểu dữ liêu: tương tự như các phương pháp thống kê mô tả, mỗi kiểm định đều chứa trong nó hoặc là
dữ liệu đính tính hoặc là dữ liệu định lượng
b Phương pháp chon mẫu: các kiểm định thường đòi hỏi các phương pháp chọn mẫu xác suất
c Dung lượng mẫu: Tính giá trị của các kiểm định càng
cao khi dung hrợng mẫu càng lớn,
d, Giả thuyết một kiểm định ý nghĩa xem xét hai
loại giả thuyết về giá trị của một tham số:
~ Giả thuyết Hạ (null hypothesis): là giả thuyết được kiểm định trực tiếp Giảthuyết này là một phát biểu “không” vệmôi liên hệ giữa hai biển
Nói cụ thể, một biến này khơng có quan hệ với biến kia - Giả thuyết đối H, (alternativehypothesis):là giả thuyết đối của giả thuyếtH,,
Giả thuyết này phát biểu rằng có tồn tại một mỗi quan hệ giữa hai biến
Những yếu tố của một kiểm định ý nghĩa
e Mức độ tìn cây: thông thường mức độ tin cậy của một kiêm định sẽ ở mức 95% (œ=0,05) hoặc 99%,
(œ=0,01)
ri Yêu cầu của một kiêm định ý nghĩa cho giá trị trung bình:
w Mẫu xác suất (ngẫu nhiên)
w Biến định lượng
Kiểm định ý nghĩa cho giá trị trung bình n Giả thuyết:
Hạ : Không có sự khác biệt ý nghĩa về trung
bình giữa hai biên
x, =%, _ hay =# (ụ: giá trị trung bình của tơng thể)
H,: Có sự khác biệt giữa hai giá trị trung bình
X.“X, hap ee
Kiểm định ý nghĩa cho giá trị trung bình
O Vi du, gid si rang chúng ta muốn so sánh và đưa ra
kết luận về số lượng các vụ tai nạn giao thơng xây ra
trung bình một ngày ở hai thành phố lớn: Hà Nội và TPHCM
Hoặc so sánh và đưa ra kết luận về số lượng các
vụ tai nạn giao thông xảy ra trung bình một ngày tại
TPHCM với số lượng trung bình của cả nước
Kiểm định ý nghĩa cho giá trị trung bình
Oo Hạ: =k
uw: 86 long cdc vy tai nan giao théng xây ra trung bình một ngày của cả nước
% : số lượng các vụ tai nạn giao thông xảy ra trung bình một ngày tại TPHCM
o H¿hH#%
10
Trang 40
Kiểm định ý nghĩa cho giá trị trung bình
oO Trong kiểm định nay, chúng ta cố gắng tim xem liện có hay khơng sự khác biệt có ý nghĩa thống kê giữa hai giá trị trung bình này
n Để kết luận điều này, kết quả kiểm định sẽ
dựa trên cơ sở việc “bác bỏ” hay “chấp nhận” giả thuyết Hạ
mm
Kiểm định ý nghĩa cho giá trị trung bình
Mira bic x Ỉ Mite tir
tứ
Kiểm định ý nghĩa cho giá trị trung bình
Trong kiểm định này, chúng ta cố gắng tìm xem liệu có hay khơng sự khác biệt có ý nghĩa thống kê giữa hai giá trị trung bình này
ri Để kết luận điều này, kết quả kiểm định sẽ
dựa trên cơ sở việc “bác bỏ” hay “chấp nhận”
giả thuyết Hạ
Kiểm định ý nghĩa cho giá trị trung bình
GINéu giả thuyết Hạ bị bác bỏ, tức là chúng ta có
bằng chứng thống kê để cho rằng H, đúng — có sự khác biệt ý nghĩa giữa hai giá trị trung bình Nếu giả thuyết Hạ được chấp nhận, tức là chúng
ta chưa có đủ băng chứng thơng kê để cho rằng
H, đúng
Kiểm định ý nghĩa cho giá trị trung bình Ø Chú ý: Chấp nhận Hạ khơng có nghĩa là
chúng ta đã chứng minh được Hạ đúng và vội
vàng kết luận rằng: Khơng có sự khác biệt
giữa bai giá trị trung bình
Chấp nhận Hạ chỉ có nghĩa là chúng ta không
đủ bằng chứng thống kê để bác bỏ nó mà thôi
Hs
Kiém dinh ¥ nghia cho giá trị trung bình
Vi dy vé tai nan giao thông, giả sử rằng chúng ta
có số vụ tai nạn giao thơng xảy ra trung bình mỗi ngày của TPHCM là L0 và của cả nước là 7
Kết quả chỉ ra rằng số vụ tai nạn giao thơng
xây ra trung bình mỗi ngày của TPHCM cao hơn của cả nước
Do vậy, chúng ta suy ra rằng Tp.HCM xây ra tai nạn giao thông cao hơn cả nước nói chung