Bài viết tập trung vào các ứng dụng của một vấn đề nghiên cứu rất phổ biến trong marketing: phân tích sự khác biệt giữa các nhóm cấu trúc quan hệ.. PLS path modeling có một số ưu điểm so
Trang 1ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA Khoa Khoa Học và Kỹ Thuật Máy Tính
Ứng dụng Partial Least Squares (PLS) vào
phân tích đa nhóm
GVHD: TS Nguyễn Văn Minh Mẫn SVTH: Nguyễn Thiện Khánh – 7140241
Đỗ Duy Quốc – 7140255 Hoàng Quốc Nam – 7140247
TP.HỒ CHÍ MINH, THÁNG 5/2015
Trang 2I Tóm tắt nội dung.
I. Bài viết tập trung vào các ứng dụng của một vấn đề nghiên cứu rất phổ biến trong marketing: phân tích sự khác biệt giữa các nhóm cấu trúc quan hệ PLS path modeling có một số ưu điểm so với covariance-based structural equation modeling (CBSEM) liên quan đến loại vấn đề nghiên cứu - đặc biệt là trong sự hiện diện của các chỉ số hình thành, vài sự công bố sử dụng phương pháp này Do đó báo này trình bày một mô hình điển hình để kiểm tra hiệu quả của các hoạt động corporate-level marketing trên danh tiếng doanh nghiệp như là một xây dựng trung gian và cuối cùng,
về lòng trung thành của khách hàng Được dùng để kiểm tra thực nghiệm sự khác biệt giữa các bên liên quan trong một mẫu từ ngành công nghiệp truyền thông di động của Đức
I Động cơ nghiên cứu
II. Sự cạnh tranh tăng cao trên thị trường toàn cầu đã buộc các công ty trên khắp tất cả các ngành công nghiệp phân tích (tiềm năng) cơ sở khách hàng của họ Việc áp dụng các chiến lược khác biệt đã xuất hiện như một khả năng đem lại thành công tại các thị trường bão hòa (Markwick và Fill 1997) Phương pháp tiếp cận phân khúc khách hàng đã lấy cảm hứng từ nghiên cứu thị trường để phát triển các phương pháp định lượng để xác định phân khúc khách hàng Đồng thời, một luồng phát triển của nghiên cứu đã nhằm mở rộng sự hiểu biết về các yếu tố thành công của tổ chức theo sản phẩm và định hướng khách hàng (Hall 1992; Markwick và Fill 1997; Wilson 1985; Weigelt và Camerer 1988) Danh tiếng của công ty là một trong những tài sản
vô hình thú vị nhất Mục đích của bài viết này là để cho thấy rằng mô hình con đường PLS có thể là một công cụ hữu ích khi câu hỏi là liệu người ta cũng nên phân khúc các bên liên quan có liên quan trong lĩnh vực quản lý uy tín
II Tổng quan về danh tiếng
1 Khái niệm danh tiếng
III. Danh tiếng là sự tin cậy của một doanh nghiệp, là một trong những tài sản vô hình và vô cùng khó khăn để bắt chước Các công ty phải mất nhiều năm để xây dựng danh tiếng, nhưng có thể hủy hoại nó chỉ trong chốc lát Công ty Enron,
Trang 3ngành công nghiệp kế toán kiểm toán sau vụ Andersen, Wall Street… là những ví dụ nổi bật Chỉ sau khi quỵ ngã từ đỉnh cao danh vọng, những tổ chức này mới kinh ngạc nhận ra rằng không gì quý giá hơn một danh tiếng tốt, và không gì phù du hơn một danh tiếng tốt
2 Ảnh hưởng danh tiếng
IV. Mục tiêu dài hạn của một doanh nghiệp thường không hoàn toàn theo định hướng tài chính, do đó ảnh hưởng đến một tập hợp các bên liên quan Uy tín của công ty là một trong những tài sản vô hình điều đó là vô cùng khó khăn để bắt chước (Hunt và Morgan 1995) Các tài liệu quy cho nhiều lợi ích tiềm năng của công ty để danh tiếng "tốt" : Đối với người tiêu dùng (Shapiro 1983; Zeithaml 1988), thì các hàm danh tiếng như là một cơ chế làm giảm nguy cơ, dẫn đến sự hài lòng của sản phẩm cao hơn (Aaker 1991 (Kotha et al 2001) ), và cuối cùng là làm tăng lòng trung thành (Rogerson 1983)
3 Các bên liên quan Quản lý danh tiếng
V. Việc phân tích các hệ số trong mô hình dự kiến cho phép một ưu tiên chi tiết về các hoạt động tiếp thị “đòn bẩy trên bốn cấu trúc điều khiển” cấp độ tổng thể cũng như mức độ chi tiết hơn về các chỉ số hình thành được sử dụng để thực thi các cấu trúc Vì nó là bản chất của các bên liên quan để có các lợi ích khác nhau đối với một công ty, có thể là một số bên liên quan sẽ có xu hướng để cân nhắc các khía cạnh khác nhau của một công ty (có danh tiếng tốt) và hành vi khác nhau Hơn nữa, nó có thể là bằng cách đánh giá các công ty chuyên nghiệp, và do đó trên cơ sở nhận thức nhiều hơn, các thành phần nhận thức của khía cạnh danh tiếng sẽ có một ảnh hưởng sự thống trị tương đối về sự hài lòng của khách hàng và lòng trung thành Tầm quan trọng tương đối ảnh hưởng của chiều hướng nhận thức danh tiếng so với chiều tác động của
nó là chìa khóa giải thích của mô hình Điều này là do tầm quan trọng của ảnh hưởng, gây ra một sự lựa chọn của một số đòn bẩy tiếp thị hơn những cái khác Nếu các nhóm liên quan phản ứng khác nhau đối với hoạt động của công ty, điều này hàm ý rằng một công ty có thể hành động một cách khác biệt và phân khúc cụ thể Do đó, nhóm các bên liên quan nên được hiểu như một biến điều hành rời rạc Điều hành này có thể giải
Trang 4thích cho sự khác biệt về sức mạnh danh tiếng đòn bẩy ' Việc phân tích sự khác biệt nhóm thực hiện trong nghiên cứu này tìm cách trả lời hai câu hỏi có tính chất thăm dò:
VI. (1) Trình điều khiển của danh tiếng và sự hài lòng khác nhau tùy thuộc vào các bên liên quan?
VII. (2) Đây có phải là một vấn đề đối với tất cả các bên liên quan và tất cả các đường trong các mô hình giả thuyết, hoặc là có một số đòn bẩy để quản lý danh tiếng mà nên được sử dụng chỉ trong các phân nhóm?
4 Sự vận hành và các biện pháp.
VIII Sự vận hành của bốn yếu tố ngoại sinh dẫn tới danh tiếng (“chất lượng” ,
“hiệu suất”, “sự hấp dẫn”, và “trách nhiệm cộng đồng”) dựa trên nghiên cứu trước đây của Schwaiger (2004) cũng như Eberl và Schwaiger (2005), trong đó một thủ tục tương tự như phương pháp tiếp cận của Rossiter C-OAR-SE đã được áp dụng (Rossiter 2002) Trong các bài phỏng vấn với các chuyên gia đến từ nhiều lĩnh vực, danh tiếng của công ty đã được định nghĩa một cách ngắn gọn và thảo luận, đảm bảo một sự hiểu biết chung về danh tiếng và các cấu trúc chất lượng, hiệu suất, sự hấp dẫn
và trách nhiệm cộng đồng Các chuyên gia sau đó được yêu cầu phải có một tầm nhìn rộng về tổ chức môi trường và nghĩ về những khía cạnh có thể đưa danh tiếng công ty của họ đạt được bốn yếu tố về chất lượng tổ chức, khía cạnh hiệu suất, sự hấp dẫn của công ty, và hành vi trách nhiệm của mình Sau khi tìm thấy 21 mục trong 4 mục tiêu cần xây dựng, người ta thấy rằng 21 chỉ số phải được chỉ rõ yếu tố cấu thành Không
có gì đáng ngạc nhiên, vì mục tiêu của bài phỏng vấn chuyên gia là để xác định hướng
đi Điều này cũng là phù hợp với mục tiêu mô hình chất lượng, hiệu suất, sức hấp dẫn
và trách nhiệm xã hội hướng tới xây dựng danh tiếng cho đoàn thể và cuối cùng là để xác định ra đòn bẩy quan trọng (tức là các chỉ số) Do đó các biện pháp nắm bắt đánh giá của các bên liên quan của 21 đòn bẩy cho các hoạt động tiếp thị của công ty và có thể được sử dụng như các biến đầu vào đối với quản lý danh tiếng và kiểm soát
IX. Một cách trực giác, một công ty có thể thẳng thắn trong việc công khai thông tin cho công chúng, đồng thời không nhất thiết phải hành xử một cách có ý thức
xã hội (trong mắt các bên liên quan) Vì vậy những chỉ số cần không nhất thiết phải tương quan từ một quan điểm lý thuyết Lập luận tương tự áp dụng cho phần còn lại của các chỉ số
Trang 5X. Tất cả các mục trong nghiên cứu được đánh giá trong thang điểm 7 Tuy nhiên, đánh giá lại các đặc điểm kỹ thuật của các cấu trúc sự yêu mến, năng lực, sự hài lòng của khách hàng, và lòng trung thành thông qua các cuộc phỏng vấn chuyên gia không thể xác minh rằng các biện pháp phải được quy định trong một mô hình cấu tạo
III Tổng quan về Partial Least Squares (PLS)
1 Khái niệm partial least squares
XI. Partial Least Squares là một kỹ thuật được sử dụng rộng rãi trong lĩnh vực hóa học, đặc biệt là trong trường hợp mà số lượng các biến độc lập lớn hơn nhiều
so với số lượng dữ liệu PLS được phát triển vào năm 1960 bởi Herman Wold là một
kỹ thuật kinh tế lượng PLS đã được áp dụng để giám sát và kiểm soát quá trình công nghiệp
XII Là một phương pháp tối ưu hóa để lựa chọn một đường khớp nhất cho
một dải dữ liệu ứng với cực trị của tổng các sai số thống kê (error) giữa đường khớp và
dữ liệu
XIII Phương pháp này giả định các sai số (error) của phép đo đạc dữ liệu
phân phối ngẫu nhiên Định lý Gauss-Markov chứng minh rằng kết quả thu được từ phương pháp bình phương tối thiểu không thiên vị và sai số của việc đo đạc dữ liệu không nhất thiết phải tuân theo
5 Các ký hiệu và thuật ngữ
XIV Định nghĩa 1: Cho X = [x1 … xm] là ma trận n x m Ta có
XV. B:=[x1− ´x1… x m− ´x m]
XVI Với x´ilà giá trị trung bình của xi
XVII Định nghĩa 2: Cho X là một ma trận trung bình n x m và Y là một ma
trận trung bình n x p Ma trận hiệp phương sai được xác đinh như sau:
XVIII. cov ( X , Y )≔ 1
n−1 X
XIX Giá trị phương sai X được xác định như sau
XX. var( X ,Y ) ≔cov( X , X)
XXI Sự tương quan giữa hai ma trận X và Y được định nghĩa bởi công thức
sau
Trang 6XXII.corr ( X , Y ) ≔√var( X )cov ( X ,Y )√var(Y ) (1)
6 Vấn đề với Ordinary Least Squares (OLS)
XXIII. Để hiểu rõ động lực vì sao PLS được sử dụng trên dữ liệu nhiều chiều trong lĩnh vực nghiên cứu hóa học, điều quan trọng là phải hiểu được bằng cách nào và tại sao phương pháp bình phương tối thiểu (Ordinary Least Squares - OLS) thất bại trong trường hợp chúng ta có một số lượng lớn các biến độc lập và chúng có mối tương quan cao Sau đây ta sẽ tìm hiều chi tiết về phương pháp OLS
XXIV. Cho ma trận X và vector kết quả y, giá trị ước lượng bình phương
tối thiểu cho bộ thông số β trong mô hình tuyến tính
XXV. y= Xβ+ ϵ
XXVI. được cho bởi phương trình tiêu chuẩn sau
XXVII. ^β=(X T X )−1X T y (2)
XXVIII. Cho 2 vector u và v được gọi là trực giao nếu <u,v> = 0 Một tập hợp các vector được gọi là trực giao nếu tất cả các cặp vector trong tập đó là trực giao Một ma trận được gọi là trực giao nếu tập hợp các cột vector của nó là trực giao
XXIX. Cho ma trận trực giao X, ta có X−1=X T
XXX Trực giao hóa một ma trận X = [x1 x2 … xm] có thể được thực hiện bằng cách sử dụng quá trình Gram-Schmidt
XXXI. proj u (V ):=⟨u , v⟩
XXXII Thủ tục biến đổi X vào trong ma trận trực giao U = [u1 u2 … um ] bằng
các bước sau
XXXIII. u1≔ x1
XXXIV. u2≔ x2−proj u1(x2)
XXXV. u3≔ x3−proj u1(x3)−proj u2(x3)
XXXVI …
XXXVII.u m ≔ x m−∑
j=1
n −1
proj u j(x m)
Trang 7XXXVIII. Quá trình Gram-Schmidt cũng cho chúng ta thừa số QR của ma trận X, với Q được tạo thành từ các vector trực giao ui được chuẩn hóa từ các vector
đơn vị, và ma trận tam giác trên R có được từ hệ số proj ui (x j ).
XXXIX. Nếu các cột vector của ma trận X = [x1 x2 … xm] dưới dạng tập trực giao, và nó tuân theo công thức (2)
XL. β=[ ⟨x1, y⟩
⟨x1, x1⟩
⟨x2, y⟩
⟨x2, x2⟩
⟨x m , y⟩
XLI Vì X T X=diag(⟨x1, x1⟩, … ,⟨x m , x m⟩) Nói cách khác ^β được tạo thành từ các ước lượng đơn biến Các giá trị trung bình này khi được đưa vào các biến đã trực giao, chúng sẽ không có hiệu lực trên ước lượng tham số của nhau trong mô hình
XLII Một cách để thực hiện hồi quy được gọi là thủ tục Gram-Schmidt cho đa
hồi quy là đầu tiên phân hoạch ma trận X thành X = U Γ , với U = [u1 u2 … um] là ma trận trực giao có được từ thủ tục Gram-Schmidt, and Γ là ma trận tam giác trên được định nghĩa bởi
XLIII. Γ l , l=1và Γ l , j=⟨u l , x j⟩
⟨u l , x l⟩
XLIV.Với l < j, và sau đó giải quyết các vấn đề hồi quy liên quan U α=y bằng công thức (3) Dưới đây cho thấy mối quan hệ giữa α và β trong Xβ = y:
XLV. X β= y ⇒U Γ β= y ⇒ Γ β=U T y =α
XLVI.vìΓ m ,m=1, ta có
XLVII. β (m)=α (m)=⟨u m , y⟩
XLVIII. Vì bất kỳ xj nào cũng có thể được chuyển vào vị trí cuối trong ma trận X, đẳng thức (4) cho ta vài thông tin hữu ích: hệ số hồi quy β(j) của xj là ước lượng đơn biến của hồi quy y trên phần còn lại của hồi quy xj trên x1, x2, …, xj - 1, xj + 1,
…, xn. Bằng trực quan, β(j) đại diện cho sự đóng góp thêm của xj trên y, sau khi xj đã được hiệu chỉnh cho x1, x2, …, xj - 1, xj + 1, …, xn. Từ những điều trên, chúng ta có thể thấy bằng cách nào đa hồi quy tuyến tính có thể bị thất bại trong thực tế Nếu xn có mối tương quan cao với một vài xk khác, các vector un còn lại sẽ tiến về 0 và từ công thức (4), hệ số hồi quy β(m) sẽ không ổn định Thật vậy, điều này là đúng đối với tất
cả các biến trong tập tương quan
Trang 87 Partial Least Squares
XLIX.Với ma trận X là ma trận đầu vào mà ma trận Y là ma trận kết quả, phân
hoạch ma trận X và Y ta được như sau
L. X =T P T Y =U Q T
LI. Và sau đó tiến hành hồi quy giữa T và U Nếu chúng ta làm các phép phân tách trên X và Y một cách độc lập sử dụng NIPALS, chúng ta nhận được hai bộ quy tắc cập nhật sau:
LII t := xj for some j
LIII loop LIV. p := XTt/|XTt|
LVI Until t stop changing
LVII u := yj for some j
LVIII. loop
LIX. q := YTu/|YTu|
LXI Until u stop
changing
LXII Ý tưởng của PLS là muốn sự phân tách trên X và Y được hoàn thành
bằng cách lấy thông tin lẫn nhau trong khi tính toán Một cách trực quan để đạt được điều đó là hoán đổi t và u trong lúc cập nhật cho p và q ở trên và kết hợp 2 luật cập nhật vào trong một vòng lặp, ta được kết quả như sau
LXIII. u := yj for some j
LXV. p := XTu/|XTu|
LXVII. q := YTt/|YTt|
LXIX. Until t stop changing
LXX Trong trường hợp khi khối Y chỉ có một biến, chúng ta có thể gán q = 1
và 2 bước cuối cùng của vòng lặp có thể được bỏ qua
Trang 9LXXI. Đối với các thành phần tiếp theo và các vector, đặt
LXXII. X := X - tpT
LXXIII. Y := Y - uqT
LXXIV. Và sau đó lặp lại tương tự các bước Sau khi thực hiên l bước, chúng ta
có được hai ma trận T và U kích thước n x l và ma trận P và Q liên hệ với công thức (5) Để có được một mô hình hồi quy quan hệ giữa X và Y, chúng ta tìm β thích hợp sao cho
LXXVI. Thay thế kết quả của mô hình vào công thức (5) chúng ta có
LXXVII. Y = UQT = TβQT = XPβQT
LXXVIII. Cho bất kỳ giá trị x, chúng ta có thể sử dung P, Q và β để tính toán giá trị y tương ứng một cách dễ dàng
LXXIX. Tiếp theo ta có
LXXX. cov(Y T XP , Y T XP)= 1
k−1(Y
T
XP)T Y T XP
LXXXI. ¿ 1
k−1 P
T
X T Y Y T XP
LXXXII. ¿ 1
k−1 P
T
(Y¿¿T X) T(Y¿¿T X ) P¿ ¿
LXXXIII.¿P T UDU T P
LXXXIV. Với k−11 (Y T X)T Y T X là ma trận hiệp phương sai của YTX, và U là
các vector riêng của nó, và D = diag(λ1 … λm) là các giá trị riêng của nó như sau λ1 > λ2 > … > λm Chúng ta thấy rằng ma trận P trong công thức (5) được chọn sao cho
LXXXV. cov(YTXP, YTXP) = D
LXXXVI. Chúng ta có thể thấy rằng q là một vector riêng của (XTY)T XTY
và tất cả ma trận Q trong công thức 11 được chọn sao cho
LXXXVII cov(XTYQ, XTYQ) = D’,
Trang 10LXXXVIII. với D’ = diag(λ1’ … λk’), λ1’ > λ2’ > … > λk’ là các giá trị riêng của ma
trận hiệp phương sai của XTY
8 PLS Path Modeling
LXXXIX. PLS Path Modeling là một quy trình ước lượng dựa trên phương pháp tiếp cận từng phần để mô hình hóa phương trình cấu trúc
XC. PLS Path Modeling bao gồm hai mô hình con: mô hình đo lường và mô hình cấu trúc Mô hình đo lường biểu diễn cho mối quan hệ giữa các dữ liệu quan sát
và các biến tiềm ẩn Mô hình cấu trúc biểu diễn cho mối quan hệ giữa các biến tiềm ẩn
XCI. Một thuật toán lặp giải quyết các mô hình phương trình cấu trúc bằng các ước lượng các biến ẩn bằng cách sử dụng các phép đo và mô hình cấu trúc trong các bước xen kẽ, đo dó thủ tục này có tên gọi là “Từng phần” Các mô hình đo lường ước tính các biến ẩn như một tổng trọng số của các biến thể hiện của nó Các mô hình cầu trúc ước tính các biến ẩn bằng ý nghĩa của mô hình hồi quy tuyến tính đơn hay đa chiều giữa các biến ẩn đươch ước tính bởi mô hình đo lường Thuật toán này được lặp đi lặp lại đạt được giá trị hội tụ
9 PLS Path Regression
XCII Mô hình hồi quy bình phương tối thiểu từng phần là một phương pháp
thông kê mà có một số mối quan hệ với hồi quy thành phần chính Thay vì tìm siêu phăng phương sai tối thiểu giữa các kết quả và các biến độc lập, nó tìm một mô hình hồi quy tuyến tính bằng cách chiếu các biện dự báo và các biến quan sát vào một không gian mới Bởi vì cả dữ liệu X và Y đều được chiếu vào không gian mới, các phương pháp PLS được gọi là mô hình nhân tố bilinear PLS hồi quy đặc biệt phù hợp khi ma trận của các yếu tố dự báo có nhiều biến hơn so với quan sát, và khi có đa cộng tuyến giữa các giá trị X