LỰA CHỌN TIÊU THỨC PHÂN TỔ: ĐỂ LỰA CHỌN TIÊU THỨC PHÂN TỔ MỘT CÁCH CHÍNH XÁC, CẦN PHẢI DỰA TRÊN 2 NGUYÊN TẮC CƠ BẢN SAU: - PHÂN TÍCH LÝ LUẬN ĐỂ CHỌN RA TIÊU THỨC BẢN CHẤT NHẤT, PHÙ HỢP
Trang 1CHƯƠNG 3 TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU
DỮ LIỆU SƠ CẤP (DỮ LIỆU THÔ) THU THẬP CÓ TÍNH CHẤT RỜI RẠC, HỖN ĐỘN, NÊN RẤT KHÓ QUAN SÁT ĐỂ RÚT RA NHẬN XÉT, KẾT LUẬN, CŨNG KHÔNG THỂ PHÂN TÍCH, DỰ ĐOÁN, SUY RỘNG … NÓI CHUNG, DỮ LIỆU THÔ CHƯA THỂ SỬ DỤNG TRỰC TIẾP CHO QUÁ TRÌNH NGHIÊN CỨU
VÌ THẾ CẦN PHẢI XỬ LÝ, PHÂN LOẠI VÀ TỔNG HỢP DỮ LIỆU
NẾU SỐ LƯỢNG DỮ LIỆU ÍT, TA CÓ THỂ SẮP XẾP DỮ LIỆU THEO MỘT TRẬT TỰ NÀO ĐÓ : TĂNG DẦN HOẶC GIẢM DẦN, HOẶC THEO TRẬT TỰ QUI ĐỊNH NÀO ĐÓ (ĐỐI VỚI DỮ LIỆU ĐỊNH TÍNH)
NẾU SỐ LƯỢNG DỮ LIỆU NHIỀU THÌ PHƯƠNG PHÁP TRÊN CŨNG KHÔNG GIÚP HỆ THỐNG ĐƯỢC DỮ LIỆU TRƯỜNG HỢP NÀY TA CÓ THỂ SỬ DỤNG CÁC PHƯƠNG PHÁP : PHÂN TỔ THỐNG KÊ, BẢNG PHÂN PHỐI TẦN SỐ,BẢNG KẾT HỢP, PHƯƠNG
Trang 2PHÁP NHÁNH VÀ LÁ, CÁC DẠNG BIỂU ĐỒ,
… ĐỂ TÓM TẮT (TỔNG HỢP) VÀ TRÌNH BÀY DỮ LIỆU
1 PHÂN TỔ THỐNG KÊ :
1.1 KHÁI NIỆM :
PHÂN TỔ THỐNG KÊ LÀ CĂN CỨ VÀO MỘT (HAY MỘT SỐ) TIÊU THỨC NÀO ĐÓ, TIẾN HÀNH SẮP XẾP CÁC ĐƠN VỊ QUAN SÁT CỦA HIỆN TƯỢNG NGHIÊN CỨU VÀO CÁC TỔ CÓ TÍNH CHẤT KHÁC NHAU
1.2 CÁC BƯỚC TIẾN HÀNH PHÂN TỔ TK:
ĐỂ TIẾN HÀNH PHÂN TỔ TA THƯỜNG THEO CÁC BƯỚC SAU:
- LỰA CHỌN TIÊU THỨC PHÂN TỔ
- XÁC ĐỊNH SỐ TỔ CẦN THIẾT
1.2.1 LỰA CHỌN TIÊU THỨC PHÂN TỔ:
ĐỂ LỰA CHỌN TIÊU THỨC PHÂN TỔ MỘT CÁCH CHÍNH XÁC, CẦN PHẢI DỰA TRÊN 2 NGUYÊN TẮC CƠ BẢN SAU:
- PHÂN TÍCH LÝ LUẬN ĐỂ CHỌN RA
TIÊU THỨC BẢN CHẤT NHẤT, PHÙ HỢP VỚI MỤC ĐÍCH NGHIÊN CỨU
Trang 3- PHẢI DỰA VÀO ĐIỀU KIỆN LỊCH SỬ CỤ THỂ CỦA HIỆN TƯỢNG NGHIÊN CỨU
ĐỂ CHỌN RA TIÊU THỨC PHÂN TỔ THÍCH HỢP
1.2.2 XÁC ĐỊNH SỐ TỔ CẦN THIẾT:
a PHÂN TỔ THEO TIÊU THỨC THUỘC
TÍNH (DỮ LIỆU ĐỊNH TÍNH)
- TRƯỜNG HỢP ĐƠN GIẢN: NẾU SỐ
BIỂU HIỆN HOẶC LOẠI HÌNH ÍT VÀ ĐÃ ĐƯỢC HÌNH THÀNH SẴN THÌ MỖI BIỂU HIỆN HOẶC LOẠI HÌNH TA XẾP THÀNH 1 TỔ
- TRƯỜNG HỢP PHỨC TẠP:
NẾU TIÊU THỨC THUỘC TÍNH CÓ RẤT NHIỀU BIỂU HIỆN, NGƯỜI TA GIẢI QUYẾT BẰNG CÁCH GHÉP NHIỀU TỔ NHỎ LẠI VỚI NHAU THEO NGUYÊN TẮC: CÁC TỔ GHÉP LẠI VỚI NHAU PHẢI GIỐNG NHAU HOẶC GẦN GIỐNG NHAU VỀ TÍNH CHẤT, GIÁ TRỊ SỬ DỤNG
Trang 4b PHÂN TỔ THEO TIÊU THỨC SỐ LƯỢNG (DỮ LIỆU ĐỊNH LƯỢNG)
- TRƯỜNG HỢP ĐƠN GIẢN: NẾU LƯỢNG
BIẾN CỦA TIÊU THỨC THAY ĐỔI ÍT, THÌ THƯỜNG LÀ MỖI LƯỢNG BIẾN HÌNH THÀNH 1 TỔ
- TRƯỜNG HỢP PHỨC TẠP: KHI LƯỢNG
BIẾN CỦA TIÊU THỨC THAY ĐỔI RẤT NHIỀU, TA XÉT XEM LƯỢNG BIẾN TÍCH LŨY ĐẾN MỨC ĐỘ NÀO THÌ CHẤT CỦA LƯỢNG BIẾN MỚI THAY ĐỔI LÀM NẢY SINH TỔ KHÁC
TRƯỜNG HỢP NÀY TA PHÂN TỔ CÓ KHOẢNG CÁCH TỔ VÀ MỖI TỔ CÓ HAI GIỚI HẠN LÀ GIỚI HẠN DƯỚI VÀ GIỚI HẠN TRÊN
CHÊNH LỆCH GIỮA GIỚI HẠN TRÊN VÀ GIỚI HẠN DƯỚI CỦA TỔ GỌI LÀ TRỊ SỐ
KHOẢNG CÁCH TỔ KÝ HIỆU LÀ h.
TÙY THEO ĐẶC ĐIỂM CỦA HIỆN TƯỢNG NGHIÊN CỨU ĐỂ QUYẾT ĐỊNH XEM PHÂN TỔ CÓ KHOẢNG CÁCH TỔ ĐỀU HAY KHÔNG ĐỀU CÁC HIỆN TƯỢNG NGHIÊN CỨU CÓ LƯỢNG BIẾN TRÊN CÁC
Trang 5ĐƠN VỊ THAY ĐỔI MỘT CÁC ĐỀU ĐẶN CÓ THỂ PHÂN TỔ VỚI KHOẢNG CÁCH TỔ ĐỀU NHAU
KHI PHÂN TỔ CÓ KHOẢNG CÁCH TỔ ĐỀU NHAU, SỐ TỔ VÀ TRỊ SỐ KHOẢNG CÁCH TỔ CÓ THỂ ĐƯỢC XÁC ĐỊNH NHƯ SAU :
* SỐ TỔ
k = ( 2 × n ) 1 / 3= 3 2 n
* KHOẢNG CÁCH TỔ :
- LƯỢNG BIẾN LIÊN TỤC :
k
x x
h= max− min
- LƯỢNG BIẾN RỜI RẠC : k
) 1 k ( ) x x
(
h= max− min − −
k : số tổ
n : số đơn vị quan sát
h : trị số khoảng cách tổ (khi tính h người
ta thường làm tròn số, ví dụ : 4,4 => 5 )
Xmax : trị số lớn nhất của biến
Xmin : trị số nhỏ nhất của biến
Ví dụ : có dữ liệu về năng suất lúa của 50 hộ
nông dân :
Trang 635 41 32 44 33 41 38 44 43 42
30 35 35 43 48 46 48 49 39 49
46 42 41 51 36 42 44 34 46 34
36 47 42 41 37 47 49 38 41 39
40 44 48 42 46 52 43 41 52 43
Xác định số tổ : k = ( 2 × n ) 1 / 3= 3 2n= 3 2x50 = 4,64 ≈
5 tổ
Xác định khoảng cách tổ :
5) thành tròn (làm 4 , 4 5
30 52 k
x
x
Xếp thành 5 tổ như sau :
Năng suất (tạ/ha) Số hộ gia đình
30 – 35 5
50 – 55 3
Trang 7TRONG THỰC TẾ SỐ TỔ k VÀ KHOẢNG
CÁCH TỔ h ĐƯỢC XÁC ĐỊNH CHỦ YẾU DỰA VÀO KINH NGHIỆM VÀ TÙY THEO ĐẶÏC ĐIỂM CỦA HIỆN TƯỢNG NGHIÊN CỨU
c PHÂN TỔ MỞ
PHÂN TỔ MỞ LÀ PHÂN TỔ MÀ TỔ ĐẦU TIÊN KHÔNG CÓ GIỚI HẠN DƯỚI, TỔ CUỐI CÙNG KHÔNG CÓ GIỚI HẠN TRÊN, CÁC TỔ CÒN LẠI CÓ THỂ CÓ KHOẢNG CÁCH TỔ ĐỀU HOẶC KHÔNG ĐỀU MỤC ĐÍCH CỦA PHÂN TỔ MỞ LÀ ĐỂ TỔ ĐẦU TIÊN VÀ TỔ CUỐI CÙNG CHỨA ĐƯỢC CÁC TRỊ SỐ ĐỘT BIẾN, NHỎ BẤT THƯỜNG HOẶC LỚN BẤT THƯỜNG VÀ TRÁNH VIỆC HÌNH THÀNH QUÁ NHIỀU TỔ
KHI TÍNH TOÁN ĐỐI VỚI PHÂN TỔ MỞ
TA QUI ƯỚC LẤY KHOẢNG CÁCH TỔ CỦA TỔ MỞ BẰNG VỚI KHOẢNG CÁCH TỔ CỦA TỔ NÀO ĐỨNG GẦN NÓ NHẤT
TRƯỜNG HỢP PHÂN TỔ THEO BIẾN ĐỊNH LƯỢNG VỚI TRỊ SỐ LIÊN TỤC THÌ
Trang 8GIỚI HẠN TRÊN VÀ GIỚI HẠN DƯỚI CỦA HAI TỔ KẾ TIẾP NHAU PHẢI TRÙNG NHAU
TA CŨNG QUI ƯỚC KHI CÓ MỘT TRỊ SỐ BẰNG VỚI GIỚI HẠN TRÊN CỦA MỘT TỔ THÌ TRỊ SỐ ĐÓ ĐƯỢC XẾP VÀO TỔ KẾ TIẾP
Ví dụ :
Năng suất (tạ/ha) Số hộ gia đình
< 35 5
35 – 40 10
40 – 45 20
45 – 50 12
≥ 50 3
2 BẢNG PHÂN PHỐI TẦN SỐ : (BẢNG TẦN SỐ)
KHI PHÂN TỔ DỮ LIỆU LÀ CHÚNG TA ĐÃ HÌNH THÀNH BẢNG PHÂN PHỐI TẦN SỐ Ở DẠNG CƠ BẢN
BẢNG TẦN SỐ THƯỜNG BAO GỒM HAI CỘT TÍNH TOÁN LÀ TẦN SỐ VÀ TẦN SUẤT
Trang 9% TẦN SUẤT CÒN ĐƯỢC GỌI LÀ TẦN SỐ TƯƠNG ĐỐI
TẦN SỐ CỦA MỖI TỔ ĐƯỢC XÁC ĐỊNH BẰNG CÁCH ĐẾM SỐ QUAN SÁT RƠI VÀO GIỚI HẠN CỦA TỔ ĐÓ
DẠNG CHUNG CỦA BẢNG TẦN SỐ :
Ví dụ 1 : ta có bảng phân phối về tuổi của sv trong một lớp :
TUỔI TẦN
SỐ SUẤTTẦN TÍCH LŨYTẦN SỐ TẦN SUẤTTÍCH LŨY
BIẾN
(x i )
TẦN SỐ
(f i )
TẦN SUẤT
(f i /Σf i )
TẦN SỐ TÍCH LŨY
x 1
x 2
…
x k
f 1
f 2
…
f k
f 1 / n
f 2 /n
…
f k / n
f 1
f 1 + f 2
…
f 1 + f 2 + … + f k
CỘNG k f n
1
i∑ i =
Trang 1019
20
21
22
3 15 40 17 5
0,0375 0,1875 0,5000 0,2125 0,0625
3 18 58 75 80
0,0375 0,2250 0,7250 0,9375 1,0000
CÁC BIỂU ĐỒ HÌNH CỘT DỰA TRÊN BẢNG PHÂN PHỐI TẦN SỐ ĐƯỢC GỌI LÀ BIỂU ĐỒ PHÂN PHỐI TẦN SỐ (histogram)
3 BẢNG KẾT HỢP :
CÓ THỂ TRÌNH BÀY VÀ PHÂN TỔ DỮ LIỆU THEO HAI HAY NHIỀU TIÊU THỨC CÙNG MỘT LÚC, KẾT QUẢ ĐƯỢC TRÌNH BÀY TRONG BẢNG KẾT HỢP BẢNG KẾT HỢP GIÚP CHÚNG TA CÓ CÁI NHÌN CHI TIẾT VÀ SÂU HƠN VỀ ĐỐI TƯỢNG ĐANG NGHIÊN CỨU
NGHỀ
NGHIỆP&
SỐ
ĐẲNG
ĐẠI HỌC
THAC SĨ
TIẾN SĨ
Trang 111/G/ VIÊN
-NAM
-NỮ
2/ CNV
-NAM
-NỮ
400 244 156 200 90 110
0 0 0 10 3 7
60 32 28 70 24 46
180 100 80 73 36 37
160 112 48 47 27 20
4 PHƯƠNG PHÁP NHÁNH (CÀNH) VÀ LÁ.
PHƯƠNG PHÁP NHÁNH VÀ LÁ ĐƯỢC SỬ DỤNG ĐỂ TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG
DỮ LIỆU THU THẬP ĐƯỢC TÁCH THÀNH 2 PHẦN : PHẦN NHÁNH VÀ PHẦN LÁ CÁC CHỮ SỐ BÊN PHẢI CỦA DỮ LIỆU LÀ LÁ (có thể là 1 hay 2 chữ số ở hàng đơn vị hay hàng chục), CÁC CHỮ SỐ CÒN LẠI BÊN TRÁI LÀ NHÁNH (có thể là 1 hay 2 chữ số ở hàng chục hay hàng trăm)
Ví dụ : tuổi của 30 sv ngành ktkt:
28, 23, 30, 24, 19 , 21, 39 , 22, 22, 31, 37, 33, 20, 30,
35, 21, 26, 27, 25, 29, 27, 21, 25, 28, 26, 29, 29, 22,
32, 27.
Trang 12BIỂU ĐỒ NHÁNH VÀ LÁ :
1 9
2 8 3 4 1 2 2 0 1 6 7 5 9 7 1 5
8 6 9 9 2 7
3 0 9 1 7 3 0 5 2
SẮP XẾP LẠI THỨ TỰ CÁC CHỮ SỐ TRONG PHẦN LÁ THEO THỨ TỰ TĂNG DẦN TỪ TRÁI QUA PHẢI :
1 9
2 0 1 1 1 2 2 2 3 4 5 5 6 6 7
7 7 8 8 9 9 9
3 0 0 1 2 3 5 7 9
KHI CÁC NHÁNH CÓ PHẦN LÁ QUÁ DÀI,
TA TÁCH MỖI NHÁNH THÀNH HAI NHÁNH NHỎ
BIỂU ĐỒ NHÁNH VÀ LÁ TUỔI CỦA SV NGÀNH KTKT XỬ LÝ BẰNG SPSS :
Ktkt stem-and-leaf plot FREQUENCY STEM & LEAF
Trang 139 12 5 3
2.
2.
3.
3.
011122234 556677788999 00123
579
Stem width: 10
Each leaf: 1 case(s)
5 TRÌNH BÀY KẾT QỦA TÓM TẮT DỮ LIỆU BẰNG BIỂU ĐỒ:
5.1 Ý NGHĨA CỦA BIỂU ĐỒ:
BIỂU ĐỒ VÀ ĐỒ THỊ LÀ CÁC HÌNH VẼ, ĐƯỜNG NÉT HÌNH HỌC DÙNG ĐỂ MÔ TẢ CÓ TÍNH QUI ƯỚC CÁC SỐ LIỆU THỐNG KÊ
5 2 CÁC LOẠI ĐỒ THỊ THỐNG KÊ:
* BIỂU ĐỒ HÌNH TRÒN:
CƠ CẤU CỦA GDP TP.HCM NĂM 2002:
Trang 14(Nguồn: Cục Thống Kê TP Hồ Chí Minh)
*BIỂU ĐỒ HÌNH CỘT:
Trang 1575
90
120
0 20 40 60 80 100 120
GIÁ TRỊ SẢN
LƯỢNG
QD LD HTX XNTN
THÀNH PHẦN KINH TẾ
Trang 16* BIỂU ĐỒ ĐƯỜNG GẤP KHÚC:
Lượng dầu thô xuất khẩu
4.0
5.5 6.3
7.1 7.6
8.8
10.1
12.5
15.2 16.3
0
2
4
6
8
10
12
14
16
18
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 triệu tấn
1991 1992 1993
1994 1995 1996
1997 1998 1999
2000
S1
4.0
12.5
0.0
5.0
10.0
15.0
20.0
triệu tấn
Lượng dầu thô xuất khẩu