Phõn tớch PCA

Một phần của tài liệu Nghiên cứu các yếu tố ảnh hưởng đến hiệu quả quản lý chi phí trong các dự án đầu tư công trình dân dụng và công nghiệp sử dụng vốn ngân sách trên địa bàn thành phố hồ chí minh (Trang 73 - 79)

Trong phõn tớch nhõn tố cần chỳ ý đến hệ số KMO (Kaiser-Meyer-Olkin) là chỉ số dựng để xem xột sự thớch hợp của phõn tớch nhõn tố. Hệ số KMO phải cú giỏ trị trong khoảng từ 0.5 đến 1 thỡ phõn tớch này mới thớch hợp, cũn nếu như trị số này nhỏ hơn 0.5 thỡ phõn tớch nhõn tố cú khả năng khụng thớch hợp với dữ liệu. Một phần quan trọng trong bảng phõn tớch nhõn tố là ma trận nhõn tố (component matrix) hay ma trận nhõn tố khi cỏc nhõn tố được xoay (rolated component matrix). Những hệ số tải nhõn tố (factor loading) biểu diễn tương quan giữa cỏc biến và cỏc nhõn tố. Hệ số này cho biết nhõn tố và biến cú liờn quan chặt chẽ với nhau. Nghiờn cứu sử dụng phương phỏp trớch nhõn tố Principal Component nờn cỏc hệ số tải nhõn tố phải cú trọng số lớn hơn 0.5 thỡ mới đạt yờu cầu.

Khỏi niệm phương phỏp phõn tớch nhõn tố

Phõn tớch nhõn tố là một kỹ thuật phụ thuộc lẫn nhau trong đú toàn bộ cỏc mối liờn hệ phụ thuộc lẫn nhau sẽ được nghiờn cứu. Phương phỏp này được sử dụng chủ yếu để thu nhỏ và túm tắt dữ liệu dưới dạng một số ớt cỏc nhõn tố cơ bản.

Mụ hỡnh phõn tớch nhõn tố được thể hiện bằng phương phỏp như sau, nếu cỏc biến được chuẩn húa:

X1=Ai1F1 +Ai2F2+…+Aỡmm+Vi Ui

Cụng thức 3.2

Xi : Biến thứ i chuẩn húa.

Aij: Hệ số quy bội chuẩn húa của nhõn tố đặc trưng j đối với biến i. Fi: Cỏc nhõn tố chung

Vi : Hệ số quy chuẩn húa của nhõn tố đặc trưng i đối với biến i Ui : Nhõn tố đặc trưng biến i.

M : Số nhõn tố chung

Cỏc nhõn tố đặc trưng cú tương quan với nhau và cả nhõn tố chung. Bản thõn cỏc nhõn tố chung cũng cú thể được diễn ta như những kết hợp tuyến tớnh của biến quan sỏt. F1=Wi1X1 +Wi2X2+…+WỡkVk Cụng thức 3.3 Trong đú: Fi : Ước lượng trị số nhõn tố thứ i Wi : Trọng số của nhõn tố k : Số biến

Ta cú thể chọn cỏc trọng số của nhõn tố sao cho nhõn tố thứ nhất giải thớch được phần lớn biến thiờn nhiều nhất trong toàn bộ biến thiờn. Sau đú ta chọn một tập hợp cỏc trọng số thứ hai sao cho nhõn tố thứ hai cú thể giải thớch được phần lớn biến thiờn cũn lại và khụng cú tương quan với nhõn tố thứ nhất. Nguyờn tắc này được ỏp dụng như vậy để tiếp tục chọn trọng số cho cỏc nhõn tố tiếp theo. Do vậy, cỏc nhõn tố được ước lượng sao cho cỏc trọng số của chỳng khụng giống như cỏc giỏ trị của biến gốc là khụng cú tương quan với nhau. Hơn nữa, cỏc nhõn tố thứ nhất giải thớch được nhiều nhất biến thiờn của dữ liệu, nhõn tố thứ hai giải thớch được nhiều thứ nhỡ…

Một số tham số quan trọng trong phõn tớch nhõn tố

Bartlett’s test of sphericity là đại lượng thống kờ dựng để xem xột giả thiết cỏc biến khụng cú tương quan trong tổng thể.

Communality là lượng biến thiờn mà biến gốc chia sẻ với tất cỏ cỏc biến khỏc được đưa vào phõn tớch.

Component analysis (phõn tớch thành phần) là một mụ hỡnh nhõn tố trong đú cỏc nhõn tố được sắp đặt nhờ vào phương sai tổng thể.

Correlation matrix cho biết hệ số tương quan giữa cỏc cặp biến trong phõn tớch. Eigenvalue đại diện cho phần biến thiờn được giải thớch bởi mỗi nhõn tố.

Factor một nhõn tố được tổ hợp từ cỏc biến gốc. Nhõn tố cũng thể hiện/mụ tả thứ nguyờn cơ bản cú thể khỏi quỏt được một tập hợp cỏc biến quan sỏt.

Factor loadings là hệ số tương quan đơn giữa cỏc biến và cỏc nhõn tố.

Factor matrix chứa cỏc factor loadings của tất cả cỏc biến đối với cỏc nhõn tố được rỳt ra.

Factor scores là cỏc điểm số nhõn tố tổng hợp được ước lượng cho từng quan sỏt trờn cỏc nhõn tố được rỳt ra.

Kaiser-Meyer-Olkin (KMO) measure of sampling adequacy là một chỉ số dựng để xem xột sự thớch hợp của phõn tớch nhõn tố. Trị số KMO lớn (từ 0.5 đến 1) cú nghĩa phõn tớch nhõn tố là thớch hợp.

Percentage of variance là phần trăm phương sai toàn bộ được giải thớch bởi từng nhõn tố.

Residuals là cỏc chờnh lệch giữa cỏc hệ số tương quan trong ma trận tương quan đầu vào (input correlation matrix) và cỏc hệ số tương quan sau khi phõn tớch (reproduced correlation) được ước lượng từ ma trận nhõn tố.

Mục đớch của phõn tớch nhõn tố

Phõn tớch nhõn tố được tiến hành nhằm bốn mục đớch như sau:

+ Tỡm ra một nhúm nhõn tố tiềm ẩn dưới nhiều biến. Với mục đớch này người ta dựng phõn tớch nhõn tố kiểu R (R factor analysis).

+ Kết hợp số lượng mẫu lớn ban đầu thành một tập hợp mẫu đại diện nhỏ hơn. Với mục đớch này người ta dựng phõn tớch nhõn tố kiểu Q (Q factor analysis).

+ Chọn ra cỏc biến phự hợp cho cỏc phõn tớch tiếp theo như hồi qui hay tương quan.

+ Tạo ra một tập hợp cỏc biến mới thay thế một phần hay toàn bộ cỏc biến cũ để tham gia vào cỏc phõn tớch tiếp theo như hồi qui hay tương quan.

Mụ hỡnh nhõn tố

Cú rất nhiều mụ hỡnh nhõn tố, nhưng hai mụ hỡnh nhõn tố thụng dụng nhất là phõn tớch nhõn tố thụng thường (Common factor analysis) và phõn tớch nhõn tố thành phần (Component analysis). Để hiểu sự khỏc nhau giữa hai phương phỏp này

cần xem xột đến bản chất của phương sai. Toàn bộ phương sai bao gồm ba phần là phương sai chung, phương sai riờng và phương sai do sai lầm. Phương sai chung là phương sai mà tất cả cỏc biến đều cú. Phương sai riờng là phương sai chỉ gắn liền với một biến nào đú. Phương sai do sai lầm là phương sai xảy ra do cỏc điểm khụng phự hợp trong việc thu thập dữ liệu, lập thang đo, lấy mẫu. Phõn tớch nhõn tố thành phần quan tõm đến toàn bộ phương sai (Phương sai chung, phương sai riờng, phương sai do sai lầm) trong khi phõn tớch nhõn tố thụng thường chỉ quan tõm đến phương sai chung.

Lựa chọn phương phỏp nào để ỏp dụng do hai yếu tố là mục đớch của nhà phõn tớch và mức độ hiểu biết của nhà phõn tớch đối với phương sai của cỏc biến. Khi mục đớch của nhà nghiờn cứu là túm tắt cỏc biến thành một nhúm ớt nhất cỏc nhõn tố phục vụ cho mục đớch dự đoỏn và nhà nghiờn cứu biết trước rằng phương sai riờng và phương sai do sai lầm chiếm một phần khụng đỏng kể trong tổng phương sai thỡ cú thể ỏp dụng phõn tớch nhõn tố thành phần. Ngược lại khi mục đớch của nhà nghiờn cứu khụng biết rừ phương sai riờng và phương sai do sai lầm chiếm tỷ trọng bao nhiờu trong tổng phương sai do đú nhà nghiờn cứu muốn loại bỏ hai loại phương sai này thỡ cú thể ỏp dụng phõn tớch nhõn tố thụng thường.

Cỏch rỳt trớch nhõn tố

Ngoài việc lựa chọn mụ hỡnh phõn tớch nhõn tố, nhà nghiờn cứ cũn phải chọn lựa cỏch rỳt trớch nhõn tố giữa rỳt trớch nhõn tố trực giao và rỳt trớch xiờn gúc. Theo cỏch rỳt trớch nhõn tố trực giao thỡ cỏc nhõn tố được rỳt trớch sao cho cỏc nhõn tố này là độc lập với cỏc nhõn tố khỏc, tương quan giữa cỏc nhõn tố trong trường hợp này là 0. Rỳt trớch nhõn tố trực giao được sử dụng trong trường hợp mục đớch của phõn tớch nhõn tố là giảm số lượng biến quan sỏt xuống thành một nhúm nhõn tố khụng tương quan với nhau nhằm phục vụ cho phõn tớch hồi qui hay cỏc kỹ thuật phõn tớch khỏc. Rỳt trớch nhõn tố xiờn gúc thỡ phức tạp hơn trực giao rất nhiều. Theo cỏch này cỏc nhõn tố được rỳt trớch vẫn tương quan với nhau. Rỳt trớch nhõn tố xiờn gúc được sử dụng trong trường hợp mục đớch của phõn tớch nhõn tố cú quan tõm đến ý nghĩa của cỏc nhõn tố được rỳt trớch.

Xoay cỏc nhõn tố

(Component Matrix). Ma trận nhõn tố chứa cỏc hệ số biểu diễn cỏc biến chuẩn húa bằng cỏc nhõn tố (mỗi biến là một đa thức của cỏc nhõn tố). Những hệ số này (factor loading) biểu diễn tương quan giữa cỏc nhõn tố và cỏc biến. Hệ số này lớn cho biết nhõn tố và biến cú liờn hệ chặt chẽ với nhau. Cỏc hệ số này được dựng để giải thớch cỏc nhõn tố. Mặc dự ma trận nhõn tố ban đầu hay ma trận nhõn tố chưa xoay cho thấy được mối quan hệ giữa cỏc nhõn tố và từng biến một, nhưng nú ớt khi tạo ra những nhõn tố cú thể giải thớch được một cỏch dễ dàng bởi vỡ cỏc nhõn tố cú tương quan với nhiều biến. Vỡ thế xoay nhõn tố được thực hiện nhằm mục đớch để ma trận nhõn tố sẽ trở nờn đơn giản hơn và dễ giải thớch hơn. Cú nhiều phương phỏp xoay nhõn tố:

Orthogonal rotation: xoay cỏc nhõn tố trong đú vẫn giữ nguyờn gúc ban đầu giữa cỏc nhõn tố.

Varimax procedure: xoay nguyờn gúc cỏc nhõn tố để tối thiểu húa số lượng biến cú hệ số lớn tại cựng một nhõn tố, vỡ vậy sẽ tăng cường khả năng giải thớch cỏc nhõn tố.

Quartimax: xoay nguyờn gúc cỏc nhõn tố để tối thiểu húa số nhõn tố cú hệ số lớn tại cựng một biến, vỡ vậy sẽ tăng cường khả năng giải thớch cỏc biến.

Equamax: xoay cỏc nhõn tố để đơn giản húa việc giải thớch cả biến lẫn nhõn tố

Oblique (direct oblimin): xoay cỏc nhõn tố mà khụng giữ nguyờn gúc ban đầu giữa cỏc nhõn tố (tức là cú tương quan giữa cỏc nhõn tố với nhau).

Đặt tờn và giải thớch cỏc nhõn tố

Từ ma trận xoay cỏc nhõn tố, ta tiến hành đặt tờn và giải thớch cỏc nhõn tố. Việc giải thớch cỏc nhõn tố được thực hiện dựa trờn cơ sở nhõn ra cỏc biến cú hệ số ( factor loading) lớn ở cựng một nhõn tố hay núi cỏch khỏc, nhõn tố này được giải thớch bởi cỏc biến cú hệ số cao đối với bản thõn nú và tờn của nhõn tố giải thớch được ý nghĩa cỏc biến chứa nú.

Tiờu chớ để xỏc định số lượng nhõn tố rỳt được trớch

Một số tiờu chớ được đưa ra để đỏnh giỏ số lượng nhõn tố được rỳt trớch trong một phõn tớch như sau:

Eigenvalue: Đõy là một tiờu chớ đơn giản và phổ biến nhất để đỏnh giỏ số lượng nhõn tố được rỳt trớch. Trong phõn tớch nhõn tố thành phần chỉ những nhõn tố cú eigenvalue lớn hơn 1 mới được xem là cú ý nghĩa. Những nhõn tố cú eigenvalue nhỏ hơn 1 được xem là khụng cú ý nghĩa và khụng đỏng quan tõm. Trong phõn tớch nhõn tố chung thỡ giỏ trị eigenvalue phải được điều chỉnh giảm nhẹ.

Tiờu chớ mụ hỡnh nghiờn cứu: Tiờu chớ này rất đơn giản, tuy nhiờn rất hợp lý trong một số tỡnh huống nhất định. Khi tiến hành nghiờn cứu, căn cứ vào mụ hỡnh nghiờn cứu, nhà nghiờn cứu đó biết trước là cú bao nhiờu nhõn tố cần rỳt trớch. Nhà nghiờn cứu sẽ điều chỉnh mụ hỡnh phõn tớch nhõn tố và thực hiện phõn tớch nhõn tố đến khi số lượng nhõn tố được rỳt trớch đỳng như mong muốn.

Tiờu chớ tỷ lệ giải thớch được cỏc phương sai: Trong khoa học chớnh xỏc, phõn tớch nhõn tố ngừng lại khi cỏc nhõn tố giải thớch được 95% phương sai. Tuy nhiờn trong khoa học xó hội với mức độ chớnh xỏc kộm hơn phần trăm thỏa món với việc cỏc nhõn tố giải thớch được 60% phương sai.

Tiờu chớ để đỏnh giỏ ý nghĩa của factor loadings

Cỏc hệ số tương quan giữa cỏc biến và cỏc nhõn tố rỳt trớch (sau đõy gọi tắt là factor loadings).

Cỏc factor loadings lớn hơn +0.3 được xem như là cú ý nghĩa, lớn hơn +0.4 là rất quan trọng và lớn hơn +0.5 là rất cú ý nghĩa. Giỏ trị tuyệt đối của factor loadings càng lớn thỡ ý nghĩa của factor loadings trong giải thớch ma trận nhõn tố càng cao.

Căn cứ vào mức ý nghĩa việc diễn dịch factor loadings, cú thể chia ra một số trường hợp như sau:

- Khi cỡ mẫu là 100, với mức ý nghĩa là 5% và 1% thỡ giỏ trị factor loadings thấp nhất là +0.19 và +0.26.

- Khi cỡ mẫu là 200, với mức ý nghĩa là 5% và 1% thỡ giỏ trị factor loadings thấp nhất là +0.14 và +0.18.

- Khi cỡ mẫu là 300, với mức ý nghĩa là 5% và 1% thỡ giỏ trị factor loadings thấp nhất là +0.11 và +0.15. (Nguồn: Multivariate Data Analysis – Third edition (1992)).

Tiờu chớ a và b chưa quan tõm đến biến số. Khi số lượng biến tăng thỡ giỏ trị chấp nhận được của factor loadings với một mức ý nghĩa nào đú giảm.

Túm tắt việc đỏnh giỏ mức ý nghĩa của factor loadings như sau:

Cỡ mẫu càng lớn thỡ giỏ trị được xem là cú ý nghĩa của factor loadings càng nhỏ.

Số lượng biến càng lớn thỡ giỏ trị được xem là cú ý nghĩa của factor loadings càng nhỏ.

Số lượng nhõn tố càng lớn thỡ giỏ trị được xem là cú ý nghĩa của factor loadings càng lớn.

Một phần của tài liệu Nghiên cứu các yếu tố ảnh hưởng đến hiệu quả quản lý chi phí trong các dự án đầu tư công trình dân dụng và công nghiệp sử dụng vốn ngân sách trên địa bàn thành phố hồ chí minh (Trang 73 - 79)

Tải bản đầy đủ (PDF)

(131 trang)