Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
452,94 KB
Nội dung
Học phần: Phương Pháp phân tích liệu ngành dệt may NỘI DUNG TIỂU LUẬN: Xử lý phân tích liệu đặc điểm nhân trắc thể nữ sinh ĐHCNHN Yêu cầu 1: Mô tả biến với đặc trưng thống kê biến Vdau, Vc, Vn, Ve, Vm: số trung bình, trung vị, độ lệch chuẩn, phương sai, độ biến thiên, khoảng tin cậy 95% (2,5 điểm) *Đọc liệu us-vn.csv gọi object usvn > NT= read.csv("D:/CAO HOC/PHAN TICH DU LIEU NGANH MAY/excel CSV/ly-kich thuoc ns-CH2020.csv", header=T) > attach(NT) > names(NT) [1] "X" "Cd" "Ccs" "Cct" "Cdvn" "Cn" "Ce" "Cm" "Cdc" "Kg" [11] "Dccn" "Det" "Des" "Dccm" "Dt" "Dkt" "Dc" "Dg" "Vdau" "Vc" [21] "Vngn" "Vn" "Vcn" "Ve" "Vb" "Vm" "Vbt" "Vct" "Vdui" "Vg" [31] "Vcch" "Rc" "Rv" "Rvc" "Kdn" "Vet" "Vbtr" "Vmt" "Vcct" Tìm hiểu biến liệu X: Biến thứ tự Cd: Biến Cao đứng Cn: Biến cao ngồi Vn: Biến vòng ngực Ve: Biến vòng eo Vb: Biến vịng bụng Vm: Biến vịng mơng Rv: Biến rộng vai Vc: Biến vòng cổ Vg: Biến vòng gấu Vdui: Biến vòng đùi Vdau: Biến vòng đầu Dg: Biến dài gối Des: Biến dài eo sau Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Det Biến dài eo trước Vct: Biến vòng cổ tay Vbt: Biến vòng bắp tay Dt: Biến dài tay - Kết kiểm tra biến liệu: tất 31 biến biến liên tục *Mô tả biến Vdau > min(Vdau) [1] 50 > max(Vdau) [1] 57 > mean(Vdau) [1] 54.21364 > var(Vdau) [1] 1.113976 > sd(Vdau) [1] 1.05545 > cv=sd(Vdau)*100/mean(Vdau) > se=sd(Vdau)/sqrt(length(Vdau)) > cv [1] 1.946836 > se [1] 0.07500759 > mean(Vdau) - sd(Vdau) [1] 53.15819 > mean(Vdau) + sd(Vdau) [1] 55.26909 describe(Vdau) > hist(Vdau, prob=T) > lines(density(Vdau)) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Vc >min(Vc) [1] 34 > max(Vc) [1] 38 > mean(Vc) [1] 36.15606 > var(Vc) [1] 0.6143539 Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may > sd(Vc) [1] 0.7838073 > cv=sd(Vc)*100/mean(Vc) > se=sd(Vc)/sqrt(length(Vc)) > cv [1] 2.167845 > se [1] 0.05570276 > mean(Vc) - sd(Vc) [1] 35.37225 > mean(Vc) + sd(Vc) [1] 36.93987 > hist(Vc, prob=T) > lines(density(Vc)) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Vn > min(Vn) [1] 72 > max(Vn) [1] 90 Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may > mean(Vn) [1] 80.04293 > var(Vn) [1] 11.1314 > sd(Vn) [1] 3.336375 > cv=sd(Vn)*100/mean(Vn) > se=sd(Vn)/sqrt(length(Vn)) > cv [1] 4.168232 > se [1] 0.2371058 > mean(Vn) - sd(Vn) [1] 76.70655 > mean(Vn) + sd(Vn) [1] 83.3793 > hist(Vn, prob=T) > lines(density(Vn)) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Ve > min(Ve) [1] 59 > max(Ve) [1] 72 > mean(Ve) [1] 65.34596 > var(Ve) [1] 8.818435 > sd(Ve) [1] 2.969585 > cv=sd(Ve)*100/mean(Ve) > se=sd(Ve)/sqrt(length(Ve)) > cv [1] 4.544405 > se [1] 0.2110392 > mean(Ve) - sd(Ve) [1] 62.37637 > mean(Ve) + sd(Ve) [1] 68.31554 > hist(Ve, prob=T) > lines(density(Ve)) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Vm > min(Vm) [1] 77.8 > max(Vm) [1] 92.5 > mean(Vm) [1] 86.01566 > var(Vm) [1] 10.78011 > sd(Vm) [1] 3.283308 > cv=sd(Vm)*100/mean(Vm) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may > se=sd(Vm)/sqrt(length(Vm)) > cv [1] 3.817105 > se [1] 0.2333345 > mean(Vm) - sd(Vm) [1] 82.73235 > mean(Vm) + sd(Vm) [1] 89.29896 > hist(Vm, prob=T) > lines(density(Vm)) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may To see confidence intervals of the correlations, print with the short=FALSE option Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may u cầu 4: Xác định mơ hình tuyến tính đa biến tối ưu thể mối quan hệ Vn với biến Ve, Vm, Cct, Vdau, Vc đối tượng đo (2,5 điểm) > library(BMA) > install.packages(c("ggplot2")) > library(ggplot2) > newdata =data.frame(Ve, Vm, Cct, Vdau, Vc) > newdata=na.omit(newdata) > yvar = newdata[,1] > xvars = newdata[,-1] > bma = bicreg(xvars, yvar, strict=FALSE, OR=20) > summary(bma) > reg = lm (Vn~., data = newdata) > step (reg, direction = "both") summary(reg) Call: lm(formula = Vn ~ , data = newdata) Residuals: Min 1Q Median 3Q Max -8.112 -1.285 0.027 1.248 4.951 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) -28.23850 9.22213 -3.062 0.00251 ** Ve 0.46890 0.06864 6.832 1.08e-10 *** Vm 0.14036 0.06301 2.227 0.02708 * Cct Vdau Vc -0.01014 0.03822 -0.265 0.79109 0.95003 0.18786 5.057 9.91e-07 *** 0.42459 0.25385 1.673 0.09604 Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 2.199 on 192 degrees of freedom Multiple R-squared: 0.5764, Adjusted R-squared: 0.5654 F-statistic: 52.26 on and 192 DF, p-value: < 2.2e-16 Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may dd = cbind(vn,Ve, Vm, Cct, Vdau, Vc) > pairs.panels(dd) > model1=lm(Vn~Ve+Vm+Vct+Vc) > install.packages ("relaimpo") > library(relaimpo) > metrics=calc.relimp(model1, type=c("lmg")) > metrics Response variable: Vn Total response variance: 11.1314 Analysis based on 198 observations Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Regressors: Ve Vm Vct Vc Proportion of variance explained by model: 53.15% Metrics are not normalized (rela=FALSE) Relative importance metrics: lmg Ve 0.25125421 Vm 0.11230039 Vct 0.05240486 Vc 0.11555732 Average coefficients for different model sizes: 1X 2Xs 3Xs 4Xs Ve 0.748495 0.6362271 0.5625785 0.5099900 Vm 0.537000 0.3611497 0.2370178 0.1460219 Vct 1.834956 1.0422331 0.7220385 0.5798899 Vc 2.156312 1.4944567 1.1321708 0.9176773 Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Mức độ quan trọng biến > boot = boot.relimp(model1, b=1000, type=c("lmg"), fixed=F) > booteval.relimp(boot, typesel=c("lmg"), level=0.9, bty="perc", nodiff=T) Response variable: Vn Total response variance: 11.1314 Analysis based on 198 observations Regressors: Ve Vm Vct Vc Proportion of variance explained by model: 53.15% Metrics are not normalized (rela=FALSE) Relative importance metrics: lmg Ve 0.25125421 Vm 0.11230039 Vct 0.05240486 Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Vc 0.11555732 Average coefficients for different model sizes: 1X 2Xs 3Xs 4Xs Ve 0.748495 0.6362271 0.5625785 0.5099900 Vm 0.537000 0.3611497 0.2370178 0.1460219 Vct 1.834956 1.0422331 0.7220385 0.5798899 Vc 2.156312 1.4944567 1.1321708 0.9176773 Confidence interval information ( 1000 bootstrap replicates, bty= perc ): Relative Contributions with confidence intervals: Lower Upper percentage 0.9 0.9 Ve.lmg 0.2513 0.9 A _ 0.1855 0.3158 Vm.lmg 0.1123 _BC_ 0.0739 0.1569 Vct.lmg 0.0524 CD 0.0235 0.0914 Vc.lmg 0.1156 _BCD 0.0678 0.1708 Letters indicate the ranks covered by bootstrap CIs (Rank bootstrap confidence intervals always obtained by percentile method) CAUTION: Bootstrap confidence intervals can be somewhat liberal > Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Mối liên quan chữa Vn Ve > plot(Vn~Ve,pch=16) > abline(lm(Vn~Ve)) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Nhận xét Vòng eo tăng vòng ngực tăng > m1=lm(Vn~Ve) > m1=lm(Vn~Vm) > m2=lm(Vn~Vm) > m3=lm(Vn~Cct) > m4=lm(Vn~Vdau) > m5=lm(Vn~Vc) > m6=lm(Vn~Ve+Vm+Cct+Vdau+Vc) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may > summary(m1) Call: lm(formula = Vn ~ Vm) Residuals: Min 1Q Median 3Q Max -7.4975 -1.9071 0.0812 1.8080 7.8175 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) 33.85252 Vm 0.53700 5.30413 6.382 1.23e-09 *** 0.06162 8.715 1.23e-15 *** Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 2.84 on 196 degrees of freedom Multiple R-squared: 0.2793, Adjusted R-squared: 0.2756 F-statistic: 75.95 on and 196 DF, p-value: 1.226e-15 > summary(m2) Call: lm(formula = Vn ~ Vm) Residuals: Min 1Q Median 3Q Max -7.4975 -1.9071 0.0812 1.8080 7.8175 Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) 33.85252 Vm 0.53700 5.30413 6.382 1.23e-09 *** 0.06162 8.715 1.23e-15 *** Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 2.84 on 196 degrees of freedom Multiple R-squared: 0.2793, Adjusted R-squared: 0.2756 F-statistic: 75.95 on and 196 DF, p-value: 1.226e-15 > summary(m3) Call: lm(formula = Vn ~ Cct) Residuals: Min 1Q Median 3Q Max -8.103 -2.363 -0.004 1.899 8.931 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) 68.00089 Cct 0.09470 6.81777 9.974 summary(m4) Call: lm(formula = Vn ~ Vdau) Residuals: Min 1Q Median 3Q Max -10.7888 -1.6462 0.3538 1.6397 7.7820 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) -20.6341 Vdau 1.8570 9.9079 -2.083 0.0386 * 0.1827 10.163 summary(m5) Call: lm(formula = Vn ~ Vc) Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Residuals: Min 1Q Median 3Q Max -10.519 -1.914 -0.172 2.149 8.569 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) 2.0792 Vc 2.1563 9.4804 0.219 0.827 0.2621 8.226 2.65e-14 *** Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 2.884 on 196 degrees of freedom Multiple R-squared: 0.2566, Adjusted R-squared: 0.2528 F-statistic: 67.66 on and 196 DF, p-value: 2.649e-14 > summary(m6) Call: lm(formula = Vn ~ Ve + Vm + Cct + Vdau + Vc) Residuals: Min 1Q Median 3Q Max -8.112 -1.285 0.027 1.248 4.951 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) -28.23850 9.22213 -3.062 0.00251 ** Học viên: Nguyễn Khánh Ly Học phần: Phương Pháp phân tích liệu ngành dệt may Ve 0.46890 Vm 0.14036 Cct -0.01014 Vdau Vc 0.95003 0.42459 0.06864 6.832 1.08e-10 *** 0.06301 2.227 0.02708 * 0.03822 -0.265 0.79109 0.18786 5.057 9.91e-07 *** 0.25385 1.673 0.09604 Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 2.199 on 192 degrees of freedom Multiple R-squared: 0.5764, Adjusted R-squared: 0.5654 F-statistic: 52.26 on and 192 DF, p-value: < 2.2e-16 Nhận xét kẻ bảng Học viên: Nguyễn Khánh Ly