Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
727,05 KB
Nội dung
Phân tích số liệu sử dụng R:
Thống kê mô tả
Nguyễn Bá Thanh
1
Tổng quan
• Đo lường
• Tập hợp và mẫu
• Tóm tắt dạng số liệu: trung bình, phương sai,
độ lệch chuẩn, sai số chuẩn
• Phân tích đồ thị
• Chuyển đổi dữ liệu
2
Thang đo lường
• Thông thường, hầu hết các
hành vi quan sát được có
thể đo lường bằng thang
ratio
• Các biến tâm lý thường đo
bằng thang interval
• Có hai loại biến: Biến phân
loại (nominal) và biến liên
tục (ordinal, interval, ratio)
Biến
Phân loại
Liên tục
ordinal
interval
ratio
3
1
Thang đo lường
• Nominal—Định danh, Biến phân loại không có thứ tự. Ví dụ như giới
tính, màu tóc, có mặt, vắng mặt
• Ordinal—Có thứ tự nhưng không có khoảng cách giữa các điểm khác
nhau trong thang. Ví dụ như giai cấp xã hội, cấp bậc, giáo dục (tiểu học,
trung học, đại học…)
• Interval— Có khoảng cách bằng nhau giữa các vị trí kế tiếp nhau trong
thang, nhưng vị trí 0 có sự thay đổi. Ví dụ về đo nhiệt độ ở các thang
khác nhau.
• Ratio—Thang đo lường cao nhất, có thể điều tra mức độ liên hệ của
các điểm như sự khác biệt giữa chúng. Vị trí 0 là cố định. Ví dụ đo nhiệt
độ, tuổi, cân nặng, chiều cao.
4
Thang Ordinal
• Ordinal: Biến thứ bậc, thứ hạng
– Không chắc chắn khoảng cách giữa các số là như nhau.
– Vị trí hoàn thành trên đường đua (vị trí thứ 1, vị trí thứ 2)
1st place
1 hour
2nd place
2 hours
3 hours
3rd place
4 hours
4th place
5 hours
6 hours
7 hours
8 hours
5
Thang Interval và Ratio
• Interval: Sắp xếp theo khoảng cách có trật tự
• Khoảng cách giữa số 1-2 bằng khoảng cách 3-4
– Ví dụ: Chỉ số IQ thông thường sử dụng thang interal
• Ratio: designates an equal-interval ordering with
a true zero point (i.e., the zero implies an absence
of the thing being measured)
– Ví dụ: số mối quan hệ thân thiết một người có
• Số “0” có ý nghĩa là không có
• Một người có 4 mối quan hệ,gấp 2 lần nguời có 2 mối quan
hệ
6
2
Thống kê: Enquiry to the unknown
Tập hợp
Mẫu
Tham số
Ước lượng
7
Ước lượng giá trị trung bình của tập hợp
Chiều cao trung bình của dân số Việt Nam = 160 cm
Độ lệch chuẩn (standard deviation) = 5.0 cm
ht [...]... correction data: females out of total X-squared = 6.2646, df = 3, p-value = 0.09942 alternative hypothesis: two.sided sample estimates: prop 1 prop 2 prop 3 prop 4 0.5000000 0.7166667 0. 733 333 3 0.0000000 Warning message: Chi-squared approximation may be incorrect in: prop.test(females, total) 38 Kết luận • Xem xét phân bố của số liệu – Giá trị trung bình, phương sai: sự khác biệt có hệ thống? – Phân. .. 95 percent confidence interval: 0.4190584 0.6609416 sample estimates: prop 1 prop 2 0.90 0 .36 36 12 So sánh hơn 2 tỉ lệ – Phân tích Chi square table(sex, ethnicity) ethnicity sex African Asian Caucasian Others Female 4 43 22 0 Male 4 17 8 2 females ... 0.04 831 alternative hypothesis: true difference in means is not equal to 95 percent confidence interval: 0.051 632 16 13. 20 239 0 83 sample estimates: mean of x mean of y 14 .31 034 5 7.6 833 33 30 10... = 3, p-value = 0.09942 alternative hypothesis: two.sided sample estimates: prop prop prop prop 0.5000000 0.7166667 0. 733 333 3 0.0000000 Warning message: Chi-squared approximation may be incorrect... gastric juice of 29 patients with peptic ulcer and of 30 normal controls It was interested to know whether lysozyme levels were different between two groups Group 1: 0.2 0 .3 0.4 1.1 2.0 2.1 3. 3 3. 8