1. Trang chủ
  2. » Thể loại khác

Thống kê mô tả cho biến định lượng trong Stata

101 70 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 101
Dung lượng 12,62 MB
File đính kèm 111. THONG KE MO TA BIEN DINH LUONG.rar (12 MB)

Nội dung

01 BIẾN ĐỊNH LƯỢNG Tóm tắt số liệu bằng phân nhóm gen csiq = iq recode csiq (80/84=1) (85/89=2) (90/94=3) (95/99=4) (100/max=5) (csiq: 110 changes made) label define csiq 1 " 80-84" 2 "85-89" 3 "90-94" 4 "95-99" 5 "100-106" label value csiq csiq tab csiq csiq | Freq Percent Cum + 80-84 | 5 4.55 4.55 85-89 | 27 24.55 29.09 90-94 | 50 45.45 74.55 95-99 | 23 20.91 95.45 100-106 | 5 4.55 100.00 + Total | 110 100.00 Tóm tắt số liệu bằng trung bình sum iq, detail chisoIQ Percentiles Smallest 1% 82 82 5% 85 82 10% 86 83 25% 89 84 50% 92 Largest Obs Sum of Wgt 110 110 Mean 91.79091 Std Dev 4.527379 75% 95 102 90% 98 103 Variance 20.49716 95% 99 103 Skewness 3682066 99% 103 106 Kurtosis 3.394434 Lệnh sum tóm tắt biến liên tục iq Trung bình của iq là 91.7 còn trung vị là 92 Như vậy biến iq hơi bị lệch dương summarize wwwhr, detail www hours per week Percentiles Smallest 1% 0 0 5% 0 0 10% 0 0 Obs 1,574 25% 1 0 Sum of Wgt 1,574 50% 3 Largest Mean 5.907878 Std Dev 8.866734 75% 7 60 90% 15 64 Variance 78.61897 95% 21 100 Skewness 3.997908 99% 40 112 Kurtosis 30.39248 Skewness = 4.00 chứng tỏ biến wwhr bị lệch dương (> 0) Kurtosis = 30.4 chứng tỏ phân phối của wwhr bị lệch quá nhiều so với phân phối bình thường Cần nhớ nếu kurtosis > 10 là có vấn đề còn nếu > 20 thì cực kỳ có vấn đề Điều này cho thấy có một nhóm các quan sát tập trung tại một phần nào đó của phân phối Tóm tắt số liệu bằng tổ chức đồ hist sbp,normal frequency (bin=34, start=98, width=3.8823529) Tổ chức đồ giúp tóm tắt phân phối của biến định lượng Theo nguyên tắc, số cột của tổ chức đồ nên 1 + 3.3 log10(n) trong đó n là cỡ mẫu Tổ chức đồ cũng cho thấy số liệu sbp bị lệch dương Option ytick(1(2)12): đánh dấu (tick marks) trên trục y bắt đầu từ 1 cách 2 giá trị và kết thúc bằng 13 Có thêm option addlabel: thêm giá trị vào từng cột Tóm tắt bằng đồ thị hộp Hours Spent on the World Wide Web By Gender male female 0 5 10 15 www hours per week 20 25 descriptive_gss.dta Đường giữa hộp chính là trung vị Đường dưới là phân vị 25% và đường trên là phân vị 75% Hộp xanh đại diện cho 50% đối tượng nghiên cứu Hộp dài hơn chứng tỏ các giá trị trong nhóm phân tán nhiều hơn Các đường kéo dài bên trái là giá trị nhỏ nhất, đường kéo dài bên phải là giá trị lớn nhất Các chấm là các giá trị ngoại lai Nếu trung vị lệch về đường tứ phân vị 25% thì số liệu bị lệch dương Tương tự nếu whisker trên dài hơn whisker dưới thì dữ liệu cũng lệch dương Hoặc nếu có nhiều số ngoại lai ở khoảng trên thì dữ liệu cũng lệch dương Hình này cho thấy dữ liệu www bị lệch dương cho cả hai giới nam và nữ Tóm tắt bằng đồ thị Q-Q bình thường Đồ thị Q-Q normal của sp cho thấy sbp không có phân phối bình thường vì đường dữ liệu có hình chữ U Vì hình dạng chữ U của sbp ngửa lên nên sbp bị lệch dương (nếu ngửa xuống là lệch âm) Đồ thị Q-Q có hình chữ S đuôi nặng Đồ thị này chứng tỏ có nhiều quan sát ở giữa phân phối và ít số liệu ở phần đuôi Đồ thị dạng này nguy hiểm hơn đồ thị chữ S đuôi nhẹ vì nó có thể bao gồm cả số ngoại lai vào đấy Đồ thị Q-Q có hình chữ S đuôi nhẹ Đồ thị này chứng tỏ số liệu ít số liệu ở giữa mà nhiều số liệu ở đuôi Kiểm tra tính bình thường bằng phép kiểm skewness và kurtosis sktest lived Skewness/Kurtosis tests for Normality - joint -Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -+ lived | 0.000 0.028 24.79 0.0000 p(skewness)< 0,001: dựa vào skewness thì xác suất để biến lived có phân phối bình thường < 0.001 Do đó biến lived có phân phối không bình thường p(kurtosis)=0,02: nếu dựa vào kurtosis thì xác suất biến lived có phân phối bình thường = 0.02 Do đó biến lived có phân phối không bình thường p< 0,001: p phối hợp của skewness và kurtosis cũng < 0,05 chứng tỏ phân phối không bình thường Phép kiểm này thường ít được sử dụng vì nó sẽ rất nhạy khi có bất kỳ một sự lệch khỏi phân phối bình thường nào khi mẫu lớn nhưng lại ít nhạy khi có sự lệch lớn khỏi phân phối bình thường khi mẫu nhỏ Bên cạnh đó vấn đề phân phối bình thường chỉ đáng quan tâm khi mẫu nhỏ, còn khi mẫu lớn thì không cần quan tâm đến vấn đề phân phối bình thường swilk lived Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z -+ lived | 153 0.87354 14.966 6.140 0.00000 sfrancia lived Shapiro-Francia W' test for normal data Variable | Obs W' V' z Prob>z -+ lived | 153 0.88801 14.385 5.273 0.00001 Nếu biến số định lượng có phân phối không bình thường, phải chuyển đổi phân phối của biến đó thành dạng bình thường bằng một số câu lệnh Bỏ tên trục hoành Xác định các tick mark trên trục hoành và trục tung Vẽ line plot cho 3 biến liên tục Vẽ connected-line plot Exp if dùng để vẽ số liệu cho khoảng thời gian từ năm 1977 đến năm 1999 mà thôi Vẽ area plot Graph twoway cod canada year, ytitle(“”) Sử dụng ma trận tương quan correlate sbp age weight height (obs=3,154) | sbp age weight height -+ -sbp | 1.0000 age | 0.1657 1.0000 weight | 0.2532 -0.0344 1.0000 height | 0.0184 -0.0954 0.5329 1.0000 Ma trận tương quan cho thấy biến sbp có tương quan yếu so với các biến age, weight và height 02 BIẾN ĐỊNH LƯỢNG-01 BIẾN PHÂN LOẠI Sử dụng bar chart Thay vì vẽ tổ chức đồ theo phân nhóm chúng ta dùng bar chart với chart là trung bình của các nhóm Sử dụng biểu đồ cột chồng Biểu đồ chồng với hai biến định lượng là phần trăm của một biến tổng Sử dụng box plot Vẽ bp tại hai thời điểm before và after can thiệp theo giới tính Sử dụng line plot Option ycommon sẽ điều chỉnh thang đo như nhau cho cả hai đồ thị NHIỀU BIẾN ĐỊNH LƯỢNG Vẽ ma trận scatter plot Khi số quan sát tăng lên chúng ta có thể sử dụng option ms(Oh) sẽ quy định các point tròn rỗng Nếu dữ liệu có quá nhiều nên trình bày dưới dạng chấm với option là ms(p) Thêm lưới và tên cho ma trận Vẽ ma trận scatter plot theo biến phân loại Vẽ contour plot ... 14.385 5.273 0.00001 Nếu biến số định lượng có phân phối khơng bình thường, phải chuyển đổi phân phối biến thành dạng bình thường số câu lệnh 01 BIẾN KẾT CỤC ĐỊNH LƯỢNG-01 BIẾN TIÊN ĐOÁN LIÊN TỤC... independent Prob > |t| = 0.0000 Tương quan Spearman xếp rank cho giá trị biến gốc gọi số đo phi tham số 01 BIẾN KẾT CỤC ĐỊNH LƯỢNG-01 BIẾN TIÊN ĐOÁN PHÂN LOẠI Sử dụng bảng tab meetings, sum(lived)... Scatterplot Smoother) Kỹ thuật vẽ đường thường smooth đại diện cho giá trị trung bình biến trục y hàm số biến trục x Bw(0.25): xác định để ước lượng chiều cao đường cong điểm, sử dụng 25% liệu gần điểm

Ngày đăng: 02/09/2021, 19:25

HÌNH ẢNH LIÊN QUAN

Hình này cho thấy dữ liệu www bị lệch dương cho cả hai giới nam và nữ. - Thống kê mô tả cho biến định lượng trong Stata
Hình n ày cho thấy dữ liệu www bị lệch dương cho cả hai giới nam và nữ (Trang 7)
Vì hình dạng chữ U của sbp ngửa lên nên sbp bị lệch dương (nếu ngửa xuống là lệch âm). - Thống kê mô tả cho biến định lượng trong Stata
h ình dạng chữ U của sbp ngửa lên nên sbp bị lệch dương (nếu ngửa xuống là lệch âm) (Trang 8)
Đồ thị Q-Q có hình chữ S đuôi nhẹ. Đồ thị này chứng tỏ số liệu ít số liệu ở giữa mà nhiều số liệu ở đuôi - Thống kê mô tả cho biến định lượng trong Stata
th ị Q-Q có hình chữ S đuôi nhẹ. Đồ thị này chứng tỏ số liệu ít số liệu ở giữa mà nhiều số liệu ở đuôi (Trang 9)
Đồ thị Q-Q có hình chữ S đuôi nặng. Đồ thị này chứng tỏ có nhiều quan sát ở giữa phân phối và ít số liệu ở phần đuôi - Thống kê mô tả cho biến định lượng trong Stata
th ị Q-Q có hình chữ S đuôi nặng. Đồ thị này chứng tỏ có nhiều quan sát ở giữa phân phối và ít số liệu ở phần đuôi (Trang 9)

TỪ KHÓA LIÊN QUAN

w