PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU :

Một phần của tài liệu Khám phá các nhân tố ảnh hưởng đến xu hướng tiêu dùng trong thị trường nước giải khát tại TP nha trang (Trang 49 - 126)

3.3.1. Phương pháp thông kê mô tả

Đầu tiên để tìm hiểu và khái quát đặc trưng của 1 bảng số liệu thô:

Lập bảng phân phối tần số với 1 số hàm để làm rõ đặc trưng của mẫu phân tích Sử sụng đồ thị thống kê để mô tả trực diện và sinh động các tính chất của mẫu.

3.3.2. Phương pháp đánh giá độ tin cậy thang đo bằng Cronbach’s Alpha

Những mục hỏi đo lường cùng một khái niệm tiềm ẩn thì phải có mối liên quan với những cái còn lại trong nhóm đó. Hệ số của Cronbach là một phép kiểm định thống kê về mức độ chặt chẽ mà các mục hỏi trong thang đo tương quan với nhau.

Công thức của hệ số Cronbach là: 

N[1+( N - 1)]

Trong đó là hệ số tương quan trung bình giữa các mục hỏi. Ký tự hy lạp

(đọc là prô) trong công thức tượng trưng cho tương quan trung bình giữa tất cả các cặp mục hỏi được kiểm tra.

43

Vì hệ số Cronbach chỉ là giới hạn dưới của độ tin cậy của thang đo (Theo GS.TS Nguyễn Đình Thọ), và còn nhiều đại lượng tin cậy, độ hiệu lực của thang đo nên ở giai đoạn đầu khi xây dựng bảng câu hỏi, hệ số này nằm trong phạm vi từ 0,6 đến 0,8 là chấp nhận được.

Muốn đạt được hệ số  0,8 cho một danh mục ít các mục hỏi, mà các mục hỏi này đi liền với nhau một cách mạch lạc và đo lường cùng một vấn đề. Hệ số

của Cronbach sẽ cho biết các đo lường có liên kết với nhau hay không. Nhưng nó sẽ không cho biết mục hỏi nào cần phải bỏ đi và mục hỏi nào cần giữ lại. Để làm được điều này cần phải xác định mục hỏi nào không phân biệt giữa những người cho điểm số lớn và những người cho điểm số nhỏ trong toàn bộ các mục hỏi.

3.3.3. Phương pháp phân tích nhân tố

Khái niệm và ứng dụng:

Phân tích nhân tố là tên chung của một nhóm các thủ tục được sử dụng chủ yếu để thu nhỏ và tóm tắt các dữ liệu. Trong nghiên cứu, chúng ta có thể thu thập được một số lượng biến khá lớn và hầu hết các biến này có liên hệ với nhau và số lượng của chúng phải được giảm bớt xuống đến một lượng mà chúng ta có thể sử dụng được. Liên hệ giữa các nhóm biến có liên quan qua lại lẫn nhau được xem xét và trình bày dưới dạng một số ít các nhân tố cơ bản.

Mô hình phân tích nhân tố:

Lượng biến thiên của một biến được giải thích bởi những nhân tố chung trong phân tích được gọi là communality. Biến thiên chung của các biến được mô tả bằng một số ít các nhân tố chung (common factor) cộng với một nhân tố đặc trưng (unique factor) cho mỗi biến. Những nhân tố này không bộc lộ rõ ràng. Nếu các biến được chuẩn hoá thì mô hình nhân tố được thể hiện bằng phương trình sau:

Xi = Ai1F1 + Ai2F2 + Ai3F3 +…+ AimFm + ViUi

Trong đó:

Xi: biến thứ i chuẩn hoá

Aij: hệ số hồi qui bội chuẩn hoá F: các nhân tố chung

44

Vi: hệ số hồi qui chuẩn hoá của nhân tố đặc trưng I đối với biến i Ui: nhân tố đặc trưng của biến i

m: số nhân tố chung

Các nhân tố đặc trưng có liên quan với nhau và với các nhân tố chung. Bản thân các nhân tố chung cũng có thể được diễn tả như những kết hợp tuyến tính của các biến quan sát.

Fi = Wi1X1 + Wi2X2 + Wi3X3 +…+ WikXk

Trong đó:

Fi: ước lượng trị số của nhân tố i Wt: quyền số hay trọng số nhân tố k: số biến

Chúng ta có thể chọn quyền số hay trọng số nhân tố sao cho nhân tố thứ nhất giải thích được phần biến thiên nhiều nhất trong toàn bộ biến thiên. Sau đó ta chọn ra một tập hợp các quyền số thứ hai sao cho nhân tố thứ hai giải thích được phần lớn biến thiên còn lại và không có tương quan với nhân tố thứ nhất. Nguyên tắc này được tiếp tục áp dụng như vậy để tiếp tục chọn ra các quyền số của nhân tố tiếp theo. Do vậy các nhân tố được ước lượng sao cho các quyền số của chúng, không giống như các giá trị của các biến gốc, là không có tương quan với nhau. Hơn nữa, nhân tố thứ nhất giải thích được nhiều nhất biến thiên của dữ liệu, nhân tố thứ hai giải thích được nhiều thứ nhì…

3.3.4. Phương pháp hồi quy bội

Nếu kết luận được hai biến có liên hệ chặt chẽ với nhau, đồng thời giả định rằng đã cân nhắc kỹ bản chất của mối liên hệ tiềm ẩn giữa hai biến, và xem như đã xác định đúng hướng của mối quan hệ nhân quả có thật giữa chúng thì ta có thể mô hình hoá mối quan hệ nhân quả của chúng bằng mô hình hồi quy tuyến tính trong đó một biến được gọi là biến phụ thuộc (hay biến được giải thích- Y) và biến kia là biến độc lập (hay biến giải thích- X). Mô hình này sẽ mô tả hình thức của mối liên hệ và qua đó giúp ta dự đoán được mức độ của biến phụ thuộc (với độ chính xác trong phạn vi giới hạn) khi biết trước giá trị của biến độc lập.

45

Mô hình hồi quy tuyến tính bội

Mô hình hồi quy bội mở rộng mô hình hồi quy tuyến tính hai biến bằng cách thêm vào một số biến độc lập để giải thích tốt hơn cho biến phụ thuộc.

Mô hình có dạng như sau:

Yi = 0 + 1X1i + 2X2i + …+ pXpi + ei

Trong đó:

Xpi: biểu hiện giá trị của biến độc lập thứ p tại quan sát thứ i

k: hệ số hồi quy riêng phần

ei: là một biến độc lập ngẫu nhiên có phân phối chuẩn với trung bình là 0 và phương sai không đổi 2

Mô hình hồi quy tuyến tính bội giả định rằng biến phụ thuộc có phân phối chuẩn đối với bất kỳ kết hợp nào của các biến độc lập trong mô hình.

Đánhgiá độ phù hợp của mô hình hồi quy tuyến tính bội:

Hệ số xác định R2 được chứng minh là hàm không giảm theo số biến độc lập được đưa vào mô hình, càng đưa thêm nhiều biến độc lập vào mô hình thì R2 càng tăng, tuy nhiên điều này cũng không được chứng minh rằng không phải phương trình càng có nhiều biến sẽ càng phù hợp hơn với dữ liệu (tức là tốt hơn).

Kiểm định độ phù hợp của mô hình:

Kiểm định F sử dụng trong bảng phâm tích phương sai vẫn là một phép kiểm định giả thuyết về độ phù hợp của mô hình hồi quy tuyến tính tổng thể. Ở đây biến phụ thuộc có liên hệ tuyến tính với toàn bộ tập hợp các biến độc lập hay không?. Giả thuyết H0 là 1 = 2 =3=4

Nếu giả thuyết H0 bị bác bỏ thì ta kết luận rằng: kết hợp các biến hiện có trong mô hình có thể giải thích được những thay đổi của Y, điều này có nghĩa là mô hình ta xây dựng là phù hợp với tập dữ liệu.

Xác định tầm quan trọng của các biến trong mô hình:

Trong hồi qui bội có nhiều biến độc lập, ta có thể muốn xác địnhvới các biến được đưa vào mô hình. Biến nào có vai trò quan trọng hơn trong việc dự đoán giá trị lý thuyết của Y hay chúng quan trọng như nhau.

46

3.3.5. Phân tích phương sai (ANOVA)

Nếu muốn so sánh hai giá trị trung bình của hai nhóm tổng thể riêng biệt, ta thực hiện phép kiểm định giả thuyết về sự bằng nhau của hai trung bình tổng thể dựa trên hai mẫu độc lập rút ra từ hai tổng thể này (kiểm định t). Trong trường hợp biến phân loại gồm nhiều nhóm, chúng ta vẫn có thể sử dụng được kiểm định t. Tuy nhiên, mỗi lần tiến hành kiểm định giả thuyết về trung bình bằng nhau cho từng cặp như vậy ta chấp nhận một khả năng phạm sai lầm là 5% (hoặc nhiều hơn hay ít hơn tùy độ tin cậy ta mong muốn), như vậy khi làm kiểm định nhiều lần khả năng sai lầm sẽ tăng lên theo số lần làm kiểm định. Trong trường hợp này, phân tích phương sai (Analysis of variance – ANOVA) được sử dụng để tiến hành kiểm định cho tất cả các nhóm mẫu cùng một lúc với khả năng phạm sai lầm chỉ 5%.

Phân tích phương sai (ANOVA) cũng được sử dụng trong trường hợp sự so sánh cho trị trung bình của nhiều nhóm tổng thể độc lập.

Phân tích phương sai (ANOVA) bao gồm phân tích phương sai một yếu tố và phân tích phương sai nhiều yếu tố. Tuy nhiên, ta chỉ xem xét phân tích phương sai một yếu tố (One-Way ANOVA).

Có một số giả định sau đối với phân tích phương sai một yếu tố:

 Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên

 Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn

 Phương sai của các nhóm so sánh phải đồng nhất

Một cách tổng quát, giả sử từ một biến phân loại ta chia tổng thể mẫu thành k nhóm độc lập gồm n1, n2,….,nk quan sát tương ứng trong từng nhóm, n là số quan sát của tổng thể mẫu.

Giả thuyết H0 cần kiểm định là trung bình thực (trung bình tổng thể) – ký hiệu là - của k nhóm này phải bằng nhau:

k

H0 :1 2 ...

(Nghĩa là không có sự khác biệt giữa các trung bình của các nhóm được phân loại theo biến định tính)

47 Bác bỏ H0 nếu : Fk 1,n k, MSW MSG    Trong đó:

MSG: phương sai giữa các nhóm MSW: phương sai trong nội bộ nhóm

, , 1n k k

F   là giá trị sao cho P(Fk1,nkFk1,nk,)

Fk-1,n-k có phân phối F với bậc tự do của tử số là (k-1) và bậc tự do của mẫu

số là (n-k).

Nếu kết quả kiểm định dẫn đến việc bác bỏ H0 thì ta phải làm tiếp phân tích sâu (thủ tục Post Hoc) để xác định trung bình của nhóm nào khách với nhóm nào, tức là tìm xem sự khác biệt xảy ra ở đâu, và xác định hướng cũng như độ lớn của khác biệt.

48

CHƯƠNG 4:

PHÂN TÍCH D LIU

49

4.1. XÂY DỰNG VÀ LÀM SẠCH DỮ LIỆU :

Dữ liệu sau khi được thu thập được thiết kế, mã hoá và nhập liệu qua công cụ phần mềm SPPS 16, sau đó tiến hành làm sạch. Vì dữ liệu sau khi điều tra thường có những mẫu điều tra bị sai lệch, thiếu sót hoặc là không nhất quán. Do vậy cần phải tiến hành làm sạch dữ liệu để đảm bảo số liệu đưa vào phân tích phải đầy đủ và thống nhất. Theo đó việc phân tích số liệu sẽ giúp ta đưa ra được những thông tin chính xác với độ tin cậy cao hơn.

Phương pháp thực hiện:

Sử dụng bảng tần số để rà soát lại tất cả các biến quan sát nhằm tìm ra các biến thông tin sai lệch hay thiếu sót bằng công cụ phần mềm SPSS.

Lệnh : Analyze – Statistics – Frequencies

4.2. THỐNG KÊ, MÔ TẢ MẪU:

Nghiên cứu này chọn mẫu ngẫu nhiên với 5 thuộc tính kiểm soát: Giới tính; Tuổi; Trình độ học vấn; Nghề nghiệp và Mức thu nhập bình quân tháng. Ta tiến hành mô tả các thuộc tính này để có những nhận định khái quát về các tính chất của mẫu thu thập được.

Vgii tính

Bảng 4.1: Bảng phân bố mẫu theo giới tính

GIỚI TÍNH

Frequency Percent Valid

Percent Cumulative Percent Nam 111 42.70% 42.70% 42.70% Nữ 149 57.30% 57.30% 100% Valid Total 260 100% 100%

Kết quả cho thấy: có 111 nam và 149 nữ tham gia trả lời bảng câu hỏi. Số lượng nữ giới nhiều hơn nam giới (nam: 42.7%, nữ: 57.3%). Nhưng nhìn chung việc thu thập mẫu không có sự chênh lệch lớn về giới tính, và phù hợp vì nhìn chung vấn đề quan tâm tiêu dùng nước giải khát thì nữ có sự so sánh và nhiệt tình cho ý kiến hơn nam giới.

50  V Tui Bảng 4.2: Bảng phân bố mẫu theo tuổi TUỔI Frequency Percent Valid Percent Cumulative Percent Dưới 18t 41 15.80% 15.80% 15.80% Từ 18 - 23t 95 36.50% 36.50% 52.30% Từ 24 - 30t 54 20.80% 20.80% 73.10% Từ 31 - 40t 37 14.20% 14.20% 87.30% Trên 40t 33 12.70% 12.70% 100% Valid Total 260 100% 100% Độ tuổi của mẫu nghiên cứu qua phân tích thông tin ta thấy:

Đáp viên trong mẫu được phân bổ khá đều ở mọi lứa tuổi. Trong đó trội hơn là độ tuổi từ 18 – 23 tuổi (chiếm 36.5%) và độ tuổi từ 24 – 30 tuổi (chiếm 20.8%), điều này là hợp lý vì ở tuổi này khá năng động và quan tâm tiêu dùng với các sản phẩm nước giải khát. Độ tuổi từ 31 – 40 tuổi chiếm 14.2%; Độ tuổi dưới 18 tuổi chiếm 15.8% và ít nhất là trên 40 chiếm 12.7%. Điều này một phần là do sự tiếp cận đáp viên thuận tiện ở những nơi công cộng được dàn trải.

V Trình độ hc vn Bảng 4.3: Bảng phân bố mẫu theo Trình độ học vấn HỌC VẤN Frequency Percent Valid Percent Cumulative Percent Cấp phổ thông 69 26.50% 26.50% 26.50% Trung cấp, cao đẳng 78 30% 30% 56.50% Đại học 96 36.90% 36.90% 93.50% Sau đại học 17 6.50% 6.50% 100% Valid Total 260 100% 100%

Ta thấy mẫu được phân bố khá đều ở các đối tượng, ngoại trừ thành phần sau đại học thấp nhất 6.5% , lý do là vì điều kiện khách quan về đại điểm nghiên cứu để tiếp cận thành phần này khá khó. Nhưng nhìn chung là hợp lý vì thành phần có học vấn sau đại học chiếm tỉ lệ rất ít trong xã hội.

51

V Ngh nghip

Bảng 4.4: Bảng phân bố mẫu theo Nghề nghiệp

THU NHẬP Frequency Percent Valid Percent Cumulative Percent Dưới 1 triệu 69 26.50% 26.50% 26.50% 1 triêu - 3 triệu 125 48.10% 48.10% 74.60% 3 triệu - 5 triệu 43 16.50% 16.50% 91.20% Trên 5 triệu 23 8.80% 8.80% 100%

Valid

Total 260 100% 100% Qua bảng phân tích trên ta thấy:

Học sinh, sinh viên là cao nhất trong mẫu với 35.4%, kế đến là những đối tượng làm việc trong văn phòng với 30.8% và thấp nhất là nội trợ với 11.5%. Phù hợp với nhóm khách hàng có nhu cầu cao đối với mặt hàng nước giải khát.

V Mc thu nhp bình quân

Bảng 4.5: Bảng phân bố mẫu theo Mức thu nhập bình quân

NGHỀ NGHIỆP Frequency Percent Valid Percent Cumulative Percent

Công nhân, buôn bán nhỏ 24 9.20% 9.20% 9.20% Cán bộ, nhân viên

văn phòng, kỹ sư 80 30.80% 30.80% 40%

Học sinh, sinh viên 92 35.40% 35.40% 75.40% Nội trợ 30 11.50% 11.50% 86.90% Khác 34 13.10% 13.10% 100%

Valid

Total 260 100% 100%

Mẫu khảo sát dàn trải ở các đối tượng có mức thu nhập khác nhau. Nhiều nhất là lớp có thu nhập từ 1-3 triệu với 48.1% và ít nhất là lớp đối tượng có thu nhập trên 5 triệu. Mặt hàng nước giải khát là mặt hàng tiêu dùng, do đó các đối tượng có nhu cầu sử dụng là không giới hạn và dàn trải ở mọi đối tượng. Mẫu lựa chọn cũng khá phù hợp vì tương đồng với các phân bổ thu nhập ở địa bàn TP Nha Trang.

53

Hình 4.1: Thống kê các biến kiểm soát

4.3. KIỂM ĐỊNH THANG ĐO BẰNG HỆ SỐ TIN CẬY CRONBACH ALPHA

- Mục tiêu và phương pháp thực hin:

 Mục tiêu: Một thang đo được coi là có giá trị khi nó đo lường được cái cần đo, thang đo áp dụng phải đạt được độ tin cậy. Ta tiến hành xác định mức độ ảnh hưởng của các biến quan sát tới các biến tiềm ẩn để loại bỏ những biến không đạt yêu cầu, để thang đo có độ tin cậy thỏa mãn điều kiện cho phép.

54

 Phương pháp: sử dụng công cụ phân tích độ tin cậy cronbach Alpha để loại các biến không phù hợp. Độ tin cậy của thang đo được đánh giá thông qua hệ số Cronbach’s Alpha và hệ số tương quan biến tổng (Item-total correlation)

 Hệ số tương quan biến tổng là hệ số tương quan của một biến với điểm trung bình của các biến khác trong cùng một thang đo, do đó hệ số này càng cao, sự tương quan của biến với các biến khác trong nhóm càng cao. Các biến có hệ số tương quan biến tổng nhỏ hơn 0,3 sẽ bị loại và tiêu chuẩn chọn thang đo khi nó có độ tin cậy Alpha từ 0,6 trở lên là có thể sử dụng được trong

Một phần của tài liệu Khám phá các nhân tố ảnh hưởng đến xu hướng tiêu dùng trong thị trường nước giải khát tại TP nha trang (Trang 49 - 126)

Tải bản đầy đủ (PDF)

(126 trang)