2.1.1.2 Phân tổ thống kê Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ hoặc các tiểu tổ có tính
Trang 1Chương V
XỬ LÝ DỮ LIỆU
VÀ PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU
Trang 5Kiểm tra dữ liệu
Mục đích: xác định dữ liệu đã thu thập được có thể chấp
nhận được hay không? "dữ liệu đó có thực sự chính xác hay không?"
Nội dung: Kiểm tra: con số và logic
Trang 6Kiểm tra dữ liệu
Trang 7Hiệu chỉnh dữ liệu
Một số thiếu sót phổ biến cần hiệu chỉnh
Những câu trả lời không
Trang 9Mã hoá dữ liệu
Các nguyên tắc thiết lập mã hóa
Số lượng "kiểu mã hóa" thích hợp
Tính tương đương của thông tin trả lời trong cùng “loại mã"
Sự khác biệt của các thông tin trả lời giữa các "loại mã"
Nguyên tắc loại trừ giữa các loại mã hóa
Nguyên tắc toàn diện
Trang 10Mã hoá dữ liệu
Lập danh bạ mã hóa
Danh bạ mã hóa: là bảng gồm nhiều cột, chứa đựng những lời
giải thích về mã hiệu đã được sử dụng trong những trường dữ liệu
Chức năng của danh bạ mã hóa:
Giúp người làm mã hóa thực hiện việc làm biến đổi từ một câu trả lời ra một ký hiệu (mã hiệu) thích hợp mà máy tính có thể đọc được.
Giúp nhà nghiên cứu nhận diện được các biến số sử dụng trong các quá trình phân tích
Trang 13Thiết kế form nhập dữ liệu
Trang 14Nhập trực tiếp vào phần mềm xử lý
Trang 15Công nghệ scanning
Trang 172 Phương pháp mô tả và
phân tích dữ liệu
2.1 Mô tả dữ liệu 2.2 Phân tích dữ liệu
Trang 18Phương pháp xử lý dữ liệu
Xử lý bằng máy tính
Đây là phương pháp thích hợp nhất và mang lại hiệu quả cao về kinh tế cũng như kỹ thuật xử lý, phân tích Hiện nay có nhiều phần mềm hữu hiệu cho việc nhập, xử lý và phân tích các dữ liệu phân tích kinh tế xã hội (SPSS, STATA, SAS, Minitab, Eviews, Excel, )
Trang 202.1.1.1 Sắp xếp dữ liệu
2.1.1.2 Phân tổ thống kê
2.1.1 Sắp xếp dữ liệu và phân tổ
thống kê
Trang 212.1.1.1 Sắp xếp dữ liệu
Sắp xếp số liệu theo thứ tự
Biểu hiện bằng sơ đồ thân lá (Stem and leaf)
S¾p xÕp???
TUOI Stem-and-Leaf Plot
Frequency Stem & Leaf
Trang 222.1.1.2 Phân tổ thống kê
Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ (hoặc các tiểu tổ)
có tính chất khác nhau.
Trang 23Phân tổ liên hệ
Phân tổ theo
1 tiêu thức
Phân tổ theo nhiều tiêu thức
Phân tổ kết hợp
Phân tổ nhiều chiều
Trang 262.1.2.1 Bảng thống kê
2.1.2.2 Đồ thị thống kê
2.1.2 Bảng thống kê và đồ thị thống kê
Trang 272.1.3.1 Bảng thống kê
Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ
thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng nghiên cứu
Trang 28Nguyên tắc trình bày bảng
- Quy mô của bảng thống kê không nên quá lớn.
- Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và
dễ hiểu
- Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số
- Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý.
- Cách ghi các số liệu vào bảng thống kê.
- Phần ghi chú ở cuối bảng thống kê
Trang 29Cách ghi số liệu vào bảng thống kê
+ Nếu hiện tượng không có số liệu đó, thì trong ô sẽ ghi một dấu gạch ngang (-).
+ Nếu số liệu còn thiếu, sau này có thể bổ sung, thì trong ô có
ký hiệu 3 chấm ( ).
+ Trong một ô nào đó: hiện tượng không có liên quan đến chỉ tiêu đó, nếu viết số liệu vào ô đó sẽ vô nghĩa, thì trong ô có ký hiệu gạch chéo (x).
+ Các số liệu trong cùng một cột, có đơn vị tính toán giống nhau, phải ghi theo trình độ chính xác như nhau (số lẻ đến 0,1 hay 0,01, ) đơn vị tính phải ghi thống nhất theo quy định.
Trang 30Nguyên tắc trình bày bảng
- Quy mô của bảng thống kê không nên quá lớn.
- Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và
dễ hiểu
- Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số
- Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý
- Cách ghi các số liệu vào bảng thống kê.
- Phần ghi chú ở cuối bảng thống kê
Trang 312.1.3.2 Đồ thị thống kê
Là các hình vẽ hoặc đường nét hình học dùng để miêu tả
có tính chất quy ước các tài liệu thống kê
Có tính quần chúng, có sức hấp dẫn và sinh động, làm cho người hiểu biết ít về thống kê vẫn lĩnh hội được vấn đề chủ yếu một các dễ dàng, đồng thời giữ được ấn tượng sâu đối với người đọc
Trang 33Đồ thị hình cột
Trang 34Đồ thị so sánh hình cột
Trang 35Đồ thị cơ cấu
Trang 36Đồ thị so sánh cơ cấu
Trang 37Đồ thị tượng hình
Trang 38Đồ thị diện tích
Trang 40Đồ thị hình “mạng nhện”
Trang 42Bản đồ thống kê
Trang 442.1.3.1 Các mức độ điển hình
2.1.3.2 Các tham số biến thiên (phân tán)
2.1.3 Tóm tắt dữ liệu bằng các tham số đặc trưng
Trang 452.1.3.1 Các mức độ trung tâm
Trung vị
Số bình quân
Mốt
Trang 46Số bình quân
Số bình quân trong thống kê là mức độ biểu hiện trị số
đại biểu theo một tiêu thức nào đó của một tổng thể bao gồm nhiều đơn vị cùng loại.
Trang 47Số bình quân
-Số bình quân cộng:
+ Giản đơn:
+ Gia quyền:
+ Điều hoà gia quyền
+ Điều hoà giản đơn
i
i i n
n n
f
f
x f
f f
f x f
x f
x x
2 1
2 2 1
1
n
x n
x x
.
_
i
i
i i
i i i
i
x M
M x
f x
f
x f
f x x
i
x
n x
1
_
Trang 48f f
x x
x x
x
1 2
11. 2
Trang 49Số bình quân
Đặc điểm
• Nêu lên mức độ chung nhất, phổ biến nhất, có tính chất đại biểu nhất của tiêu thức nghiên cứu, không kể đến chênh lệch thực tế giữa các đơn vị tổng thể
• San bằng mọi chênh lệch giữa các đơn vị về trị số của tiêu thức nghiên cứu
• Chịu ảnh hưởng của các lượng biến đột xuất
Trang 50Số bình quân
Điều kiện vận dụng:
- Số bình quân chỉ được tính ra từ tổng thể đồng chất (bao gồm nhiều đơn vị, phần tử hoặc hiện tượng có cùng chung một tính chất, thuộc cùng một loại hình kinh tế xã hội, xét theo một tiêu thức nào đó)
- Số bình quân chung cần được vận dụng kết hợp với các số bình quân tổ hoặc dãy số phân phối
Trang 51Ví dụ:
Vụ lúa
Hợp tác xã A Hợp tác xã B
Diện tích (ha)
Sản lượng (tạ)
Năng suất (tạ/ha)
Diện tích (ha)
Sản lượng (tạ)
Năng suất (tạ/ha)
Trang 522.1.3.1 Các mức độ trung tâm
Trung vị
Số bình quân
Mốt
Trang 53Mốt (Mo)
Là biểu hiện của một tiêu thức được gặp nhiều nhất trong một tổng thể hay trong một dãy số phân phối
(Được sử dụng đối với cả biến định tính và định lượng)
- Đối với một dãy số lượng biến, mốt là lượng biến có tần số lớn nhất
- Đối với một dãy số lượng biến có khoảng cách tổ, muốn tìm mốt trước hết cần xác định tổ có mốt, tức là tổ có tần số lớn nhất Sau đó, trị số gần đúng của mốt tính theo công thức:
) (
) (
.
1 1
o o
o o
M M
M M
M
M M
M
f f
f f
f
f h
x M
Trang 54Mốt (Mo)
Tác dụng
• Là mức độ đại biểu, nên có thể dùng Mo để thay thế cho số trung bình trong những trường hợp tính số trung bình gặp khó khăn
• Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến đột xuất
• Là một trong những tham số nêu lên đặc trưng phân phối
• Phục vụ nhu cầu hợp lý
Trang 55Mốt (Mo)
Hạn chế
• Kém nhạy bén với sự biến thiên của tiêu thức
• Không xác định được trong trường hợp dãy số phân phối không bình thường
Trang 562.1.3.1 Các mức độ trung tâm
Trung vị
Số bình quân
Mốt
Trang 57M
M i
M M
e
f
S
f h
Trang 58• Là một trong những tham số nêu lên đặc trưng phân phối.
• Tác dụng trong kỹ thuật và phục vụ công cộng
Trang 60Đặc trưng phân phối
Hệ số bất đối xứng
K<0 dãy số phân phối chuẩn lệch trái
K>0 dãy số phân phối chuẩn lệch phải
K=0 dãy số phân phối chuẩn đối xứng
K càng lớn thì dãy số càng không đối xứng
Trang 612.1.3.1 Các mức độ điển hình
2.1.3.2 Các tham số biến thiên (phân tán)
2.1.3 Tóm tắt dữ liệu bằng các tham số đặc trưng
Trang 622.1.3.2 Các tham số biến thiên (phân tán)
Khoả
ng biến th
Ý nghĩa nghiên cứu:
- Xét trình độ đại biểu của số bình quân
- Thấy rõ nhiều đặc trưng của dãy số, như đặc trưng về phân phối, về kết cấu, tính chất đồng đều của tổng thể nghiên cứu
- Sử dụng trong nhiều trường hợp nghiên cứu thống kê khác như: phân tích biến động, phân tích mối liên hệ, dự đoán thống kê
Trang 64Khoảng biến thiên (R)
Là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu, biểu hiện bằng công thức:
R = Xmax - XminKhông phụ thuộc vào sự phân bố của dữ liệu:
7 8 9 10 11
12
R = 12 - 7 = 5
7 8 9 10 11 12
R = 12 - 7 = 5
Trang 65R = 78-72 = 4 (inches) R = 84-67 = 17 (inches)
Trang 66Độ lệch tuyệt đối bình quân
Là số bình quân cộng của các độ lệch tuyệt đối giữa các lượng biến với số bình quân cộng của các lượng biến đó
f
f x x
d
Trang 67f x
2 2
Trang 68Độ lệch tiêu chuẩn
Là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với
số bình quân cộng của các lượng biến đó
Là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong nghiên cứu thống kê để đánh giá độ biến thiên của tiêu thức
2 2
Trang 69Hệ số biến thiên
Là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tiêu chuẩn (hoặc độ lệch tuyệt đối bình quân) với số bình quân cộng
Là thước đo độ biến thiên tương đối, có thể dùng để so sánh giữa các chỉ tiêu khác loại hoặc cùng loại và có số trung bình không bằng nhau
100
.
x
V
Trang 702 Phương pháp mô tả
và phân tích dữ liệu
2.1 Mô tả dữ liệu 2.2 Phân tích dữ liệu
Trang 712.2 Phân tích dữ liệu
Phương pháp hồi quy tương quan
Phương pháp dãy số thời gian
Một số phương pháp dự đoán thống kê
Trang 73II TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU
Vai trò của báo cáo
Trang 741 Vai trò của báo cáo
- Là phương tiện mà qua đó các dữ liệu, các phân tích và các kết quả được sắp xếp có hệ thống
- Phản ánh chất lượng của công trình nghiên cứu
- Hiệu quả của bản báo cáo có thể xác định những hoạt động
sẽ được tiến hành (kết luận, đề xuất, kiến nghị giải pháp,…)
Trang 752 Các loại báo cáo
1
Báo cáo gốc
Trang 772 Các loại báo cáo
Trang 78Báo cáo được phổ biến
Được soạn ra từ những kết quả nghiên cứu để đăng tải trong những tạp chí chuyên ngành hoặc trong các chuyên khảo, các tạp chí phổ thông, các tập san,
Trang 792 Các loại báo cáo
Trang 80Báo cáo kỹ thuật
Loại này thường dành cho các chuyên gia khoa học, quan tâm chủ yếu đến các mô tả chi tiết về toàn bộ quá trình nghiên cứu Các loại báo cáo này cũng có thể kèm theo những phụ lục kỹ thuật phức tạp về phương pháp luận và thư mục đầy đủ để cung cấp cho độc giả các nguồn tài liệu tham khảo đầy đủ hơn
Trang 812 Các loại báo cáo
Trang 82Báo cáo cho lãnh đạo
Loại này phục vụ cho những người ra quyết định Gồm những nội dung chủ yếu phần cốt lõi của công trình nghiên cứu, những kết luận chính cùng những
đề xuất và kiến nghị
Trang 832 Các loại báo cáo
Trang 843 Nguyên tắc soạn thảo báo cáo
Trang 854 Cách thuyết trình
a) Lựa chọn kỹ thuật thuyết trình:
- Đọc một bài soạn trước
Trang 86NỘI DUNG THỰC HÀNH
• Khai biến
• Nhập số liệu vào chương trình xử lý
• Thao tác đổi/tính toán với biến số
• Thao tác một số thống kê mô tả
• Thao tác lập bảng (biến 1 trả lời, nhiều trả lời)
• Thao tác vẽ một số đồ thị thông dụng
• Thao tác hồi quy tương quan