PHĐN TÍCH NHĐN TỐ FACTOR ANALYSIS

Một phần của tài liệu Tài liệu Đề cương môn xác suất Thống kê pdf (Trang 113 - 120)

1. Khâi niệm

Phđn tích nhđn tố được sử dụng để rút gọn vă tĩm tắt dữ liệu. Trong nghiín cứu Marketing, cĩ thể cĩ rất nhiều biến để nghiín cứu, hầu hết chúng cĩ tương quan với nhau vă thường được rút gọn để cĩ thể dễ dăng quản lý. Mối quan hệ giữa những bộ khâc nhau của nhiều biến được xâc định vă đại diện bởi một văi nhđn tố (hay nĩi câch khâc một nhđn tố đại diện cho một số biến). Chẳng hạn như hình tượng của một cửa hăng cĩ thể đo lường bằng câch hỏi khâch hăng để đânh giâ vă xâc định câc nhđn tố cĩ liín quan đến hình tượng của cửa hăng. Trong phđn tích ANOVA hay hồi qui, tất cả câc biến nghiín cứu thì cĩ một biến phụ thuộc cịn câc biến cịn lại lă câc biến độc lập, nhưng đối với phđn tích nhđn tố thì khơng cĩ sự phđn biệt năy. Hơn nữa, phđn tích nhđn tố cĩ quan hệ phụ thuộc lẫn nhau giữa câc biến trong đĩ mối quan hệ phụ thuộc năy được xâc định. Vì những lý do trín, phđn tích nhđn tố được sử dụng trong câc trường hợp sau:

1. Nhận dạng câc nhđn tố để giải thích mối quan hệ giữa câc biến. Ví dụ như câc cđu trả lời về lối sống cĩ thể được sử dụng để đo lường tđm lý của khâch hăng. Câc cđu trả lời năy cĩ thể lă nhđn tố được phđn tích để nhận dạng câc nhđn tố tđm lý.

2. Nhận dạng câc biến mới thay thế cho câc biến gốc ban đầu trong phđn tích đa biến (hồi qui). Chẳng hạn câc nhđn tố tđm lý được nhận dạng cĩ thể sử dụng như lă câc biến độc lập để phđn biệt số khâch hăng trung thănh vă khơng trung thănh.

3. Nhận dạng một bộ cĩ số biến ít hơn cho việc sử dụng phđn tích đa biến. Chẳng hạn cĩ một ít cđu trả lời về lối sống tương quan khâ cao với câc nhđn tố đê nhận dạng được sử dụng như câc biến độc lập để giải thích sự khâc biệt giữa khâch hăng trung thănh vă khơng trung thănh.

- Phđn tích nhđn tố được sử dụng rộng rêi trong nghiín cứu Marketing. Ví dụ,

1. Phđn tích nhđn tố được sử dụng trong phđn khúc thị trường để nhận dạng câc biến phđn nhĩm khâch hăng. Chẳng hạn những người mua xe mới cĩ thể tập hợp thănh câc nhĩm dựa văo câc

nhđn tố như tính kinh tế, tiện nghi, vận hănh tốt vă tính sang trọng. Ðiều năy cĩ thể cĩ bốn phđn khúc thị trường theo bốn nhđn tố trín.

2. Trong nghiín cứu sản phẩm, phđn tích nhđn tố được sử dụng để xâc định phẩm chất của nhên hiệu cĩ ảnh hưởng đến sự chọn lựa của khâch hăng. Những nhên hiệu kem đânh răng cĩ thể được đânh giâ về câc khía cạnh: bảo vệ răng, lăm trắng răng, mùi vị, hơi thở thơm tho vă giâ.

3. Câc nghiín cứu trong quảng câo, phđn tích nhđn tố được dùng để hiểu thĩi quen sử dụng phương tiện thơng tin của thị trường mục tiíu. Chẳng hạn, những người sử dụng thức ăn lạnh cĩ thể thích xem tivi, xem phim vă nghe nhạc...

4. Trong nghiín cứu giâ, phđn tích nhđn tố được sử dụng để nhận dạng những đặc điểm của khâch hăng nhạy cảm về giâ. Những khâch hăng năy cĩ thể lă những người khơng cĩ thu nhập cao, thường xuyín ở nhă.

2. Mơ hình phđn tích nhđn tố

Về mặt tĩan học, mơ hình phđn tích nhđn tố giống như phương trình hồi qui nhiều chiều mă trong đĩ mỗi biến được đặc trưng cho mỗi nhđn tố. Những nhđn tố năy thì khơng được quan sât một câch riíng lẻ trong mơ hình. Nếu câc biến được chuẩn hĩa mơ hình nhđn tố cĩ dạng như sau:

Xi = Ai1F1 + Ai2F2+... + AimFm +ViUi Trong đĩ:

XI: Biến được chuẩn hĩa thứ i

Aịj: Hệ số hồi qui bội của biến được chuẩn hĩa i trín nhđn tố chung j F: Nhđn tố chung

Vi: Hệ số hồi qui của biến chuẩn hĩa i trín nhđn tố duy nhất i Ui: Nhđn tố duy nhất của biến i

m: Số nhđn tố chung.

Mỗi nhđn tố duy nhất thì tương quan với mỗi nhđn tố khâc vă với câc nhđn tố chung. Câc nhđn tố chung cĩ sự kết hợp tuyến tính của câc biến được quan sât.

Fi = wi1x1 + wi2x2 +...+ wikxk Trong đĩ:

Fi: Ước lượng nhđn tố thứ i

wi: Trọng số hay hệ số điểm nhđn tố k: Số biến

Trong phđn tích năy cĩ thể chọn trọng số (hay hệ số điểm nhđn tố) để nhđn tố thứ nhất cĩ tỷ trọng lớn nhất trong tổng phương sai. Câc nhđn tố cĩ thể được ước lượng điểm nhđn tố của nĩ. Theo ước lượng năy, nhđn tố thứ nhất cĩ điểm nhđn tố cao nhất, nhđn tố thứ hai cĩ điểm nhđn tố cao thứ hai ... Dĩ nhiín, kỹ thuật ước lượng liín quan rất nhiều đến thống kí, điều năy sẽ được giải thích chi tiết trong câc phần sau.

3. Tiến trình phđn tích nhđn tố

Tiến trình thực hiện phđn tích nhđn tố được trình băy theo câc bước trong sơ đồ dưới đđy:

Tiến trình phđn tích nhđn tố trong phần mềm SPSS như sau:

¨ Nhập dữ liệu 7 biến theo ví dụ của bước 1 - chọn menu Analyze - chọn Data Reduction - chọn

Factor ... - chọn câc chi tiết của câc menu trong hộp thoại Factor Analysis như Descriptives, Extraction, Rotation, Scores and options - chọn OK, sau đĩ ta cĩ bảng kết quả (từ bảng 7.1 đến bảng 7.2c) được giải thích theo câc bước dưới đđy.

Bước 1: Xâc định vấn đề

Cĩ rất nhiều nhiệm vụ trong việc xâc định vấn đề phđn tích. Trước tiín, mục tiíu nghiín cứu phải được xâc định. Câc biến trong mơ hình phđn tích nhđn tố phải cụ thể, điều năy cĩ thể dựa văo câc nhđn tố truớc, lý thuyết hoặc sự cđn nhắc của nhă nghiín cứu. Việc những biến năy sử dụng thang đo khoảng vă thang đo tỷ lệ thì rất quan trọng vă phải chọn cỡ mẫu phù hợp. Thường thường, cỡ mẫu phù hợp phải gấp từ bốn đến năm lần số biến nghiín cứu. Trong nhiều trường hợp nghiín

cứu Marketing, vì một lý do năo đĩ, cỡ mẫu lấy thấp hơn tỷ lệ trín thì kết quả nghiín cứu nín được giải thích một câch thận trọng.

Ví dụ, giả sử nhă nghiín cứu muốn xâc định những lợi ích cơ bản mă khâch hăng cần tìm khi mua kem đânh răng. Một mẫu gồm 237 người được phỏng vấn theo thang đo 7 điểm (điểm 1 lă hoăn toăn khơng đồng ý, điểm 7 lă hoăn toăn đồng ý) với câc nội dung khi sử dụng kem đânh răng như sau: (câc biến từ V1 đến V7)

V1: Chống được sđu răng V2: Tạo được hăm răng sâng

V3: Khơng lăm nhiễm trùng nướu răng V4: Tạo hơi thở thơm tho

V5: Chống được canxi hĩa răng V6: Cĩ hăm răng hấp dẫn V7: Cĩ hăm răng khỏe mạnh Bước 2: Lập ma trận tương quan

Sau khi thu thập thơng tin, dựa văo dữ liệu của 7 biến trín ta lập ma trđn tương quan giữa câc biến. Nếu phđn tích nhđn tố thích hợp thì câc biến năy phải cĩ tương quan với nhau. Trong thực tế, nếu sự tương quan giữa câc biến tương đối nhỏ thì phđn tích nhđn tố cĩ thể khơng phù hợp. Chúng ta mong đợi rằng câc biến phải cĩ tương quan ở mức độ cao trong từng biến vă giữa câc biến.

- Ðể nhận dạng điều năy chúng ta sử dụng phần mềm SPSS hoặc Excel để tạo ma trận tương quan giữa câc biến bằng cđu lệnh Correlation. Chẳng hạn, kết quả ma trận tương quan của 7 biến trong ví dụ về kem đânh răng được trình băy như sau:

Bảng 7.1: Ma trận tương quan giữa câc biến

Nhận xĩt:

Ma trận tương quan giữa 7 biến (V1(V7) biểu hiện những lợi ích của kem đânh răng thơng qua sự liín hệ giữa câc biến. Theo kết quả bảng 7.1, câc biến V1,V3, V5 vă V7 cĩ tương quan rất

cao. Chúng ta sẽ đặt một nhđn tố chung đại diện cho 4 biến năy lă F1. Tương tự, câc biến V2, V4 vă V6 được đại diện bởi nhđn tố chung F2.

Tiếp theo, để xâc định tất cả 7 biến cĩ tương quan như thế năo, ta sử dụng kiểm định Barletts để kiểm định giả thuyết:

Tuy nhiín, để xâc định số nhđn tố ta quan tđm đến tổng phương sai của 7 nhđn tố (cột 2) vă của từng nhđn tố (cột 5). Kết quả xử lý theo kiểm định Bartlett như sau:

Giải thích:

* Communality: phương sai tối đa của mỗi biến * Eigenvalue: phuơng sai tổng hợp của từng nhđn tố

* Percent of variance: phương sai của từng nhđn tố tính bằng % [(cột (5) = cột (4)/tổng cột (2) x100)]

* Cumulative Percentage: phương sai tích lũy [cột (6) = cột (5) cộng dồn] Bước 3: Xâc định số nhđn tố

Trong nghiín cứu thường số nhđn tố sau khi xử lý ít hơn số biến ban đầu. Rất hiếm cĩ trường hợp tất cả câc biến ban đầu đều lă câc nhđn tố ảnh hưởng hay tâc động đến vấn đề nghiín cứu. Theo ví dụ trín, trong 7 biến ban đầu nhưng chỉ cĩ hai nhđn tố (V1) vă (V2) lă cĩ trọng số cao về phương sai thể hiện kết quả trong cột 5 (48,3% vă 28,0%) lăm đại diện. Tuy nhiín, cĩ rất nhiều câch để xâc định số nhđn tố trong mơ hình phù hợp:

1. Quyết định trước số nhđn tơ:ú thỉnh thoảng nhă nghiín cứu biết trước cĩ bao nhiíu nhđn tố trước khi tiến hănh phđn tích. Số nhđn tố cĩ giảm đi hay khơng lă do nhă nghiín cứu hoăn toăn quyết định.

2. Quyết định dựa văo phương sai tổng hợp của từng nhđn tố (Eigenvalue): Trong câch tiếp cận năy chỉ cĩ những nhđn tố cĩ Eigenvalue lớn hơn 1 mới được đưa văo mơ hình. Nếu số biến ban đầu ít hơn 20 thì câch tiếp cận năy vẫn cịn tâc dụng.

3. Quyết định dựa văo phần trăm phương sai của từng nhđn tố (cột 5): Số nhđn tố được chọn văo mơ hình phải cĩ tổng phương sai tích lũy giữa hai nhđn tố lớn hơn 60%. Tuy nhiín, tùy thuộc văo vấn đề nghiín cứu mức độ năy cĩ thể thấp hơn. Chẳng hạn tổng phương sai của nhđn tố 1 vă nhđn tố 2 trong ví dụ về kem đânh răng lă 76,3%.

Bước 4: Giải thích câc nhđn tố

Trở lại kết quả của kiểm định Bartlett ta cĩ kết quả của ma trận nhđn tố như sau:

Bảng 7.2a. Ma trận nhđn tố đê chuẩn hĩa câc biến

Bảng ma trận 7.2a chứa đựng câc biến đê được chuẩn hĩa, ma trận năy thể hiện mối tương quan giữa hai nhđn tố (V1) vă (V2) với 7 biến (V1(V7). Ta thấy rằng nhđn tố 1 cĩ tương quan với cả

7 biến nhưng chỉ cĩ câc biến V1 (chống sđu răng), V3(chống nhiễm trùng nướu), V5 (chống canxi hĩa) vă V7 (răng khỏe) lă cĩ hệ số tương quan cao, câc biến năy thể hiện lợi ích về sức khỏe. Như vậy, nhđn tố 1 cĩ thể đặt tín lă nhđn tố lợi ích về sức khỏe. Tương tự, nhđn tố 2 liín quan đến câc biến cĩ hệ số tương quan cao như V2 (răng sâng), V4 (hơi thở thơm tho) vă V6 (hăm răng hấp dẫn),

nhđn tố nầy được đặt tín lă nhđn tố lợi ích về xê hội.

Như vậy, qua xử lý ta thấy cĩ hai loại lợi ích từ việc sử dụng kem đânh răng lă lợi ích sức khỏe vă lợi ích xê hội được đại diện bởi nhđn tố 1 (F1) vă nhđn tố 2 (F2).

Bước 5: Xâc định điểm nhđn tố vă chọn nhđn tố thay thế

- Ðiểm nhđn tố (hay trọng số) để kết hợp câc biến chuẩn hĩa (F) được lấy từ ma trận hệ số điểm (bảng 7.2b: Factor score coefficient matrix). Theo ví dụ trín, trong mơ hình cĩ hai nhđn tố

chung F1 vă F2, trong đĩ F1 cĩ bốn biến liín quan lă V1, V3, V5 vă V7, vă F2 cĩ ba biến liín hệ lă

V2, V4, vă V6.

Cụ thể ước lượng điểm nhđn tố của hai nhđn tố F1 vă F2 như sau: F1= 0,31x1 + 0,29 x3 + 0,3x5 +0,29x7

F2= 0,38x2 + 0,38x4 + 0,37x6

Câc tham số của hai phương trình trín được rút ra từ bảng kết quả phđn tích mục Factor score coefficient matrix. Trong hai phương trình trín, biến năo cĩ hệ số điểm nhđn tố cao nhất thì biến đĩ

ảnh hưởng lớn nhất đến nhđn tố chung. Tuy nhiín, trong thực tế nghiín cứu, cĩ những trường hợp cĩ thể cĩ một số biến đê được nhă nghiín cứu quan tđm từ trước, mặc dù nĩ cĩ hệ số điểm nhđn tố thấp hơn nhưng vẫn được coi lă quan trọng hơn. Chẳng hạn như chống canxi hĩa răng (V5) được coi lă quan trọng hơn chống sđu răng (V1) trong mơ hình phđn tích năy. Thực hiện điều năy cĩ nghĩa lă ta đê chọn nhđn tố thay thế.

Bảng 7.2b: Factor score coefficient matrix

Variable Factor 1 Factor 2

V1 V2 V3 V4 V5 V6 V7 .30931 -.05548 .29250 -.04918 .30199 -.04160 .29173 -.06814 .38315 -.03331 .38087 -.05191 .37478 .00697

Bước 6: Xâc định mơ hình phù hợp

Một giả thuyết cơ bản trong phđn tích nhđn tố lă sự tương quan giữa câc biến ảnh hưởng đến câc nhđn tố chung. Vì vậy, tương quan giữa câc biến cĩ thể được suy ra hoặc mơ phỏng từ mối tương quan được ước lượng giữa câc biến vă câc nhđn tố (bảng 7.2c). Sự khâc biệt giữa ma trận tương quan giữa câc biến (bảng 7.1) vă ma trận tương quan giữa câc biến vă nhđn tố (bảng 7.2c) gọi lă câc dư số. Nếu câc dư số cĩ giâ trị lớn thì mơ hình sẽ khơng phù hợp, vă vì vậy nĩ cần phải xem xĩt lại. Trở lại ví dụ về kem đânh răng, khi so sânh bảng 7.1 vă bảng 7.2c thì chỉ cĩ 4 dư số lớn hơn 0,1 vă 6 dư số lớn hơn 0,05, đđy lă câc dư số tương đối nhỏ nín mơ hình cĩ hai nhđn tố chung F1 vă F2 được chấp nhận.

Bảng 7.2c. Ma trận tương quan sau khi chuẩn hĩa câc biến

V1 V2 V3 V4 V5 V6 V7 V1 V2 V3 V4 V5 0.74 0.11 0.72 0.13 0.73 0.80 0.18 0.80 0.14 0.70 0.19 0.71 0.80 0.15 0.72 0.79

V6 V7 0.14 0.74 0.79 0.26 0.20 0.73 0.79 0.28 0.17 0.74 0.29 0.78

Một phần của tài liệu Tài liệu Đề cương môn xác suất Thống kê pdf (Trang 113 - 120)

Tải bản đầy đủ (DOC)

(180 trang)
w