Kho sát chính t hc và sàn cd l iu

Một phần của tài liệu Đánh giá sự ảnh hưởng của lãng phí trong thi công xây dựng nhà cao tầng dựa trên phân tích nhân tố và các thuật toán trí tuệ nhân tạo (Trang 45)

thu n ti n cho vi c TTDL trong b i c nh d ch Covid-19 t i Tp.HCM đang

di n bi n ph c t p, BCH b ng bi u m u google đư đ c s d ng đ t o BCH KS chính th c. ng d n c a ń đ c g i đ n kho ng 244 TKS thông qua các kênh nh email, viber, zalo, telegram, facebook. Sau m t tháng thu th p d li u, h c viên thu v đ c 168 phi u ph n h i. Sau đ́, h c viên ti n hành sàng l c d li u đ lo i b nh ng phi u ph n h i không h p l , nh ng phi u mà ng i đ c h i tr l i ch a

ć kinh nghi m trong TCXD, ho c ch n m t m c đ duy nh t. K t qu cu i cùng là 150 phi u h p l đ c d̀ng đ phân tích th ng kê, chi ti t đ c th hi n trong B ng

bên d i.

Cách th c sàng l c và ki m duy t d li u, thông tin t các BCH KS thu v c n

đ c th c hi n nghiêm túc, v̀ không ph i t t c các BCH thu v đ u ć th s d ng

đ c. t ng đ tin c y t BCH KS, s lo i b các câu tr l i khi ć các d u hi u sau:

- Các câu tr l i đ c ch n theo 1 m c đ nh t đ nh (ch 1 đáp án), đi u này ch ng t ng i tham gia KS tr l i không rõ ràng, qua loa, không

đ c k câu h i KS.

- Trong BCH KS, h c viên s d ng m t câu h i mang t́nh sàng l c đ

lo i b các TKS không ph̀ h p. C th là TKS ch n “Ki m soát lưng ph́ trong TCXD ć c n thi t hay không?”

B ng 3.3: Th ng kê s l ng d li u thu th p STT N i dung S l ng T l STT N i dung S l ng T l 1 B ng câu h i g i đi 244 100% 2 Nh n ph n h i 168 69% 3 Tr l i không h p l 18 7% 4 K t qu 150 61% 3.3. Phân tích d li u

3.3.1. Ki măđ nhăđ tin c yăthangăđo

Trong nghiên c u này, ph ng pháp nh t quán n i t i thông qua h s

Cronbach’s Alpha s đ c s d ng đ đánh giá đ tin c y c a thang đo nh m đánh

giá s t ng quan gi a các nhân t v i nhau. Cơng th c tốn h c [35]:

v i là h s t ng quan trung b̀nh gi a các nhân t và N là s nhân t trong nghiên c u.

Theo quy c, h s   0.8 th̀ thang đo l ng đ c đánh giá là t t. Sau đây

là các m c giá tr c a h s Cronbach’sAlpha đ c đánh giá là ch p nh n đ c [35]:

❖ T 0.8  1: thang đo r t t t.

❖ T 0.7 < 0.8: thang đo t t.

3.3.2. Ph ngăph́păx p h ng

T d li u thu đ c thông qua BCH KS, ph ng pháp x p h ng th t c a các nhân t d a vào giá tr trung b̀nh (Mean) đ c s d ng trong lu n v n nh m m c

đ́ch xác đnh các nhân t quan tr ng nh h ng lãng phí trong thi cơng xây d ng.

3.3.3. Ki măđnh bài toán m t m u

Ki m đnh bài toán m t m u đ c dùng đ so sánh giá tr trung bình c a m u v i m t giá tr c th . i v i nghiên c u hi n t i, giá tr đ c d̀ng đ so sánh là 3. B i vì 3 là giá tr trung l p, ng n cách gi a hai bên không đ ng Ủ và đ ng ý. Vì v y, h c viên mu n ki m tra xem TKS có s đ ng ý cao h n m c trung l p hay không. Phép ki m đ nh cho bài toán m t m u đ c thành l p nh sau:

trong đ́  là giá tr trung bình c a m t m u. tin c y đ c s d ng trong

ki m đnh bài toán m t m u là 95%.

3.3.4. Ki măđnh bài toán hai m u

Ki m đnh bài toán hai m u nh m m c đ́ch ki m tra xem li u có s khác

bi t ć Ủ ngh a th ng kê v giá tr trung bình c a hai nhóm hay khơng. Ki m đnh

gi thuy t d a trên c p gi thuy t đ i ng u, t đ́ đ a ra k t lu n v giá tr trung bình c a hai nh́m đ c l p đ c l y ra t m u này. Phép ki m đnh cho bài toán hai m u đ c thành l p nh sau:

trong đ́ 1 và 2 là giá tr trung bình c a hai nh́m đ c l p. tin c y đ c s d ng trong ki m đnh bài tốn hai m u là 95%. Trình t th c hi n bài tốn ki m

Hình 3.4 - Quy trình th c hi n ki m đnh bài toán hai m u

3.3.5. Ki m đ nhăbƠiătónăđaăm u

Phân t́ch ph ng sai m t chi u (ANOVA) nh m m c đ́ch ki m tra xem li u

li u có s khác bi t ć Ủ ngh a th ng kê v giá tr trung bình c a nhi u nh́m đ c l p hay không. Phép ki m đ nh cho bài toán đa m u đ c thành l p nh sau:

H0: µ1 = µ2 = µ3 = … = µi

H1: ít nh t m t µi khác v i nh ng cái còn l i

trong đ́ 1, 2, …, µi là giá tr trung bình c a các nh́m đ c l p. tin c y

đ c s d ng trong ki m đ nh bài toán đa m u là 95%. Trình t th c hi n bài tốn

Hình 3.5: Quy trình phân tích ANOVA

3.3.6. Phân tích d li u

3.3.6.1. Phân tích nhân t - EFA

Sau khi ki m tra đ tin c y c a thang đo, v i s l ng bi n hi n t i ki m tra xem các bi n có m i liên h hay khác bi t v i nhau so v i ban đ u hay không, lu n

v n ti p t c s d ng cơng c ti p theo là phân tích nhân t .

Phân tích nhân t ph ng pháp các th thu t đ thu g n và tóm t t d li u. K thu t phân tích thành t chính (Principal Component Analysis) dùng đ : - Nh n ra t p h p các bi n n i tr i đ s d ng trong các phân t́ch đa bi n.

Theo Tr ng và Ng c (2008), m t s tiêu chu n đánh giá bi n đo l ng trong PCA:

- H s KMO (Kaiser –Meyer-Olkin): d̀ng đ ki m tra s thích h p c a phân tích nhân t . Phân tích thành t thích h p khi tr s KMO ≥ 0.5.

N u:

• KMO = 0.5: h u nh không ch p nh n, nhân t không phù h p d li u

• KMO t 0.7 - 0.8: ch p nh n đ c

- Ki m đ nh Barlett: đ ki m tra gi thuy t các bi n ć t ng quan trong t ng th không, là đi u ki n đ phân tích thành t PCA. N u k t qu Barlett’stest ć sig.

< 5% thì bác b gi i thuy t, t c là các bi n ć t ng quan v i nhau.

- Ki m tra giá tr riêng (H s Eigenvalue là h s đ i di n cho l ng bi n thiên

đ c gi i thích b i nhân t ) l n h n 1 thì y u t trích ra có giá tr tóm t t th hi n thông tin t t.

- T ng ph ng sai tŕch Variance extracted > 50%: gi i thích m c Ủ ngh a c a

nhân t lên v n đ nghiên c u.

- H s t i nhân t (Factor Loading): là h s t ng quan gi a các bi n và các nhân t .

Theo Hair và các tác gi (2006) , Multivariate Data Analysis, 6th Edition [36] thì: - Factor Loading (FL) m c ± 0.3: bi n quan sát đ c gi l i.

- FL m c ± 0.5: ć Ủ ngh a th ng kê t t. - FL m c ± 0.7: ć Ủ ngh a th ng kê r t t t.

Theo các nhà nghiên c u, n u chênh l ch h s t i nh h n 0.3, chúng ta c n lo i b bi n quan sát đ́. Tuy nhiên, chúng ta c ng c n xem xét đ́ng ǵp c a bi n vào giá tr n i dung c a nhân t tr c khi quy t đnh lo i b hay gi l i bi n quan sát (Th , 2011) [37]. Tr ng h p 2, hai h s t i chênh nhau t 0.3 tr lên, khi đ́ bi n quan sát s đ c gi l i và nó s n m nhóm nhân t có h s t i cao h n.

3.3.6.2. Ph n m m h tr phân tích d li u

th c hi n các phân tích trên, lu n v n s d ng các ph n m m IBM SPSS

Statistics V23 và Microsoft Office Excel 2016. Trong đ́, các ph n m m trên đ c

s d ng đ t ng h p d li u thu th p đ c t b ng câu h i kh o sát, xác đnh t n s xu t hi n, tr trung b̀nh, đ l ch chu n, h s Cronbach’s Alpha, phân t́ch nhân t

EFA. Microsoft Office Excel 2013 đ c d̀ng đ th ng kê mơ t và trình bày k t qu phân tích t SPSS.

3.3.1. Các thu t tốn trí tu nhân t o 3.3.1.1. M ng th n kinh nhân t o (ANN) 3.3.1.1. M ng th n kinh nhân t o (ANN)

M ng ANN (Artificial Neural Network) s d ng quá trình x lý c a não làm

bài tốn d đốn. Mơ hình ANN là cơng c m nh m có th gi i quy t các bài toán phi tuy n nh d đoán m c đ nh h ng, d đốn , v.v... [38]. Mơ hình m ng n - ron nh n th c nhi u l p là m t mơ h̀nh ANN đi n hình, có ba l p chính bao g m m t l p đ u vào, m t t p h p các l p n và m t l p đ u ra. Hình 3.6 minh h a m t

mơ h̀nh ANN đi n hình.

Hình 3.6 - C u trúc mơ hình ANN đi n hình

3.3.1.2. Mơ hình h iăquyăvect ăh tr (SVR)

Mơ h̀nh SVR đ c Vapnik đ xu t vào n m 1995 [39] đ gi i quy t các bài

toán h i quy phi tuy n. Các hàm Kernel c a mơ hình SVR bao g m các hàm tuy n tính (linear), c s xuyên tâm (radial basic), đa th c (polynomial) ho c hàm sigmoid. Hai tham s ch́nh đ c s d ng đ xây d ng mô h̀nh SVR, đ́ là h ng s chính quy (C) và tham s hàm c s bán kính Gaussian (g), đ c t i u h́a cho SVR.

H ng s C xác đ nh m c ph t khi SVR đ a ra d đốn khơng ch́nh xác. C l n ch ra m t hình ph t nghiêm kh c đ i v i nh ng sai l m và ng c l i. Hình ph t n ng khi n SVR khó h i t và d n đ n m t n đnh, trong khi hình ph t nh c n th i gian đào t o l n đ mơ hình h i t . Tham s g là ngh ch đ o c a ph ng sai đ i v i hàm Gauss. M t giá tr g l n d n đ n các d đoán n đ nh v i đ ch ch cao. Ng c l i, m t giá tr g nh làm gi m b t s sai l ch nh ng làm cho các d đốn khơng n đ nh. Trong nghiên c u này, C = 10 và g = 0.1 s đ c l a ch n đ xây d ng mơ hình SVR [40- 42].

3.3.1.3. Mơ hình h i quy tuy n tính

H i quy tuy n tính c g ng mơ hình hóa m i quan h gi a hai bi n b ng cách

đi u ch nh m t ph ng tr̀nh tuy n tính v i d li u quan sát [43]. M t bi n đ c coi là bi n gi i thích và bi n kia đ c coi là bi n ph thu c.

H i quy tuy n tính là m t lo i phân tích d báo c b n và đ c s d ng ph

bi n. Các c l ng h i quy này đ c s d ng đ gi i thích m i quan h gi a m t

bi n ph thu c và m t ho c nhi u bi n đ c l p. D ng đ n gi n nh t c a ph ng tr̀nh

h i quy v i m t bi n ph thu c và m t bi n đ c l p đ c xác đ nh b ng công th c y

= c + b * x, trong đ́ y = đi m bi n ph thu c c tính, c = h ng s , b = h s h i quy

và x = đi m trên bi n đ c l p. [44]

Phân tích h i quy tuy n t́nh th ng s d ng b ng ba cách sau: - Xác đnh s c m nh c a các y u t d báo

- D báo hi u ng

- D báo xu h ng.

ng h i quy tuy n t́nh ć ph ng tr̀nh d ng Y = a + bX, trong đ́ X là bi n gi i thích và Y là bi n ph thu c. H s góc c a đ ng th ng là b và a là giao đi m (giá tr c a y khi x = 0).

3.4. ́nhăgíăHSD ăc a mơ hình

Trong lu n v n này, HSD c a các mơ hình TNNT đ c đo l ng b ng cách xem xét ba ch s đánh giá đ chính xác c a d đoán th ng đ c s d ng, đ́ là: R2,

RMSE và MAPE. c̀ng đánh giá HSD , m t ch s đánh giá t ng h p đ c g i

là ch s hi u su t (PI), k t h p R2, RMSE và MAPE thành m t th c đo duy nh t,

đư đ c t o và s d ng đ so sánh HSD c a các mơ hình khác bi t [45].

R2 đo m c đ phù h p c a m t mơ hình d đốn. Giá tr R2 cao cho bi t các

giá tr d đốn hồn tồn ph̀ h p v i các giá tr quan sát đ c. R2 đ c tính tốn

nh sau: 2 2 1 2 1 ( ) 1 ( ) n t t t n t t y x R y y = = − = − −   (2)

trong đ́: n là ḱch th c m u;xt là giá tr d đoán;yt là giá tr quan sát; và y là giá tr trung bình c ayt.

RMSE đ i di n cho đ l ch chu n m u c a ph n d gi a các giá tr d đoán và

quan sát. Th c đo này đ c s d ng đ xác đnh các sai s l n và đánh giá s thay

đ i c a ph n ng mô h̀nh đ i v i ph ng sai. RMSE x lý các l i l n vì nó khu ch

đ i l i v m t hình h c. Cơng th c tốn h c cho RMSE là:

2 1 1 ( ) n t t t RMSE x y n = =  − (3)

MAPE là m t ch s th ng kê gi i th́ch đ chính xác c a d đoán b ng cách so sánh các ph n d v i các giá tr quan sát đ c. i u này th ng đ c bi u th d i d ng ph n tr m đ chính xác và r t h u ́ch đ đánh giá HSD c a các mơ hình b ng

cách đ a ra khái ni m giá tr tuy t đ i. Cơng th c tốn h c cho MAPE là:

1 1 100% n t t t t x y MAPE n = y − =   (4)

Ch s hi u su t (Performance Index - PI) d̀ng đ đo l ng HSD c a m t mơ hình m t cách tồn di n b ng cách xem xét nhi u ch s đánh giá. Thay v̀ đánh

giá s khác bi t gi a giá tr th c t và giá tr d đoán, PI đ c s d ng đ so sánh

HSD c a các mơ hình d đốn khác nhau. Cơng th c toán h c cho PI là:

2 min 2 max max 1 1 1 3 3 3 a a a a RMSE MAPE R PI R RMSE MAPE =  +  +  (5)

trong đ́ PIa, R2a, RMSEa, và MAPEa là PI, R2, RMSE, và MAPE c a mơ hình d

đốn a; R2min là R2 t i thi u trong so sánh, và RMSEmax và MAPEmax là RMSE và

MAPE t i đa trong so sánh. Ć th th y t ph ng tr̀nh r ng PI lo i b s khác bi t v đ l n gi a ba ch s đánh giá b ng cách tiêu chu n hóa, so sánh các giá tr ch s c a m i d đoán v i hi u su t ch s kém nh t trong s các so sánh. Không gi ng

nh t ng ch s , PI xem xét t t c các ch s có s n và đo l ng hi u su t c a mơ hình m t cách toàn di n h n. Trong nghiên c u này, R2, RMSE và MAPE đ c coi là quan

cùng tr ng s trong ph ng tr̀nh PI. Giá tr PI nh h n cho th y HSD t t h n và ng c l i.

3.5. Ph n m m h tr nghiên c u

hoàn thành lu n v n, h c viên đư s d ng m t s ph n m m sau: B ng 3.4: Các ph n m m h tr nghiên c u

STT Ph n m m Áp d ng

1 IBM SPSS Statistics V26 Th ng kê suy lu n

Một phần của tài liệu Đánh giá sự ảnh hưởng của lãng phí trong thi công xây dựng nhà cao tầng dựa trên phân tích nhân tố và các thuật toán trí tuệ nhân tạo (Trang 45)

Tải bản đầy đủ (PDF)

(141 trang)