Thang đo LIKERT.
Thành lập bảng câu hỏi Questionair. Kiểm nghiệm T – Test.
Kiểm định χ2.
Phương pháp xếp hạng Spearman. Kiểm định thang đo Cronbach’s Alpha Phương pháp phân tích thành tố chính PCA. Phương pháp phân tích hồi qui đa bội MR.
Sử dụng phần mềm SPSS V16 để phân tích dữ liệu.
2.4.1 Lý thuyết thống kê 2.4.1.1 Tập hợp chính và mẫu
Tập hợp chính là tập hợp tất cả các đối tượng mà ta quan tâm nghiên cứu trong một vấn đề nào đó. Số phần tử của tập hợp chính được ký hiệu là N.
a. Mẫu
Mẫu là tập hợp con của tập hợp chính. Mẫu gồm một số hữu hạn n phần tử. Số n được gọi là cỡ mẫu:
Tập hợp chính = {x1,x2…xN}. Mẫu = {x1,x2…xn}.
b. Cách chọn mẫu
Có nhiều cách chọn mẫu khác nhau, nhưng nguyên tắc quan trọng nhất là làm sao mẫu phải phản ảnh trung thực tập hợp chính.
Các cách chọn mẫu thường dùng:
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH
- Chọn mẫu ngẫu nhiên: đó là cách chọn n phần tử từ tập hợp chính N phần tử sao cho mỗi tổ hợp trong n
N
C tổ hợp đều có cùng khả năng được chọn như nhau. - Cách chọn máy móc. - Cách chọn phân lớp. - Cách chọn hàng loạt. - Cách chọn kết hợp (nhiều bậc). 2.4.1.2 Kích thước mẫu
Ta có thể tăng độ chính xác (giảm độ rộng của khoảng tin cậy) bằng cách đơn giản là tăng kích thước mẫu, tuy nhiên độ chính xác chỉ tăng lên theo tỉ lệ với căn bậc hai của kích thước mẫu. Nói cách khác, chi phí lấy mẫu tăng lên với tốc độ nhanh gấp nhiều lần so với tốc độ tăng của độ chính xác.
Ta có thể dùng công thức tính toán kích thước mẫu như sau:
Ta có: N S S X X = ; N S Z S Z E X X . . = = ⇒ 2 2 ) . ( E S Z N = X
Trong đó: N : kích thước mẫu.
X
S : độ lệch chuẩn của trị trung bình của mẫu.
SX : độ lệch chuẩn của mẫu.
E : sai số cho phép, khoảng tin cậy.
Z : giá trị của phân phối chuẩn được xác định theo hệ số tin cậy.
Kích thước mẫu là hàm số phụ thuộc vào mức độ chấp nhận rủi ro (biểu thị bằng giá trị Z), độ biến thiên của đám đông (ước lượng bằng độ lệch chuẩn) và khoảng tin cậy (sai số cho phép).
Trên thực tế, việc tính toán kích thước mẫu phức tạp hơn nhiều so với công thức. Trước hết, ta thường không biết độ lệch chuẩn khi chưa thực sự bắt tay vào lấy mẫu.
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH
Nhưng lại cần biết độ lệch chuẩn đó để quyết định kích thước mẫu trước khi tiến hành khảo sát. Thông thường, giá trị độ lệch chuẩn được sử dụng trong công thức trên chỉ là một con số phỏng đoán, đôi khi sử dụng từ các nghiên cứu trước đó, hoặc từ nghiên cứu thí điểm, hay từ việc phỏng vấn thử nghiệm bảng câu hỏi. Hoặc có khi ta bắt đầu bằng một kích thước mẫu thử nghiệm, sau khi thu được một số dữ liệu, ta tính độ lệch chuẩn của mẫu ấy, thế giá trị này vào công thức tính ra kích thước mẫu.
Nhìn chung, còn khá nhiều vướng mắc trong công thức tính kích thước mẫu, cho nên người ta ít sử dụng chúng nếu như mục tiêu dự án không đòi hỏi quá cao về độ chính xác cho các thông số dự đoán.
Quy luật phỏng đoán cho thấy bằng kinh nghiệm rằng cần ít nhất 30 phần tử trong một mẫu để giá trị thống kê có ý nghĩa.
- Theo Hoelter (1983), số lượng mẫu tới hạn là 200 mẫu.
- Theo Bollen (1989), số lượng mẫu tối thiểu phải là 5 mẫu cho một tham số cần ước lượng (tỷ lệ 5:1).
- Thông thường, ta có thể xác đinh kích thước mẫu theo kiểu định tính. Độ lớn của mẫu tối đa là 1000, hoặc đơn giản hơn lấy 10% của đám đông, kích thước tối thiểu của mẫu là 30, và tùy thuộc vào độ biến thiên của đám đông mà điều chỉnh cho phù hợp. Trong khoảng kích thước tối đa và tối thiểu đó, quyết định thường được suy xét dựa vào ngân quỹ và thời gian.
2.4.1.3 Bảng kê và biểu đồ
Để mô tả các dữ liệu một cách cụ thể ta dùng bảng kê và các biểu đồ.
a. Bảng kê
Xếp đặt các dữ liệu vào một bảng theo một qui tắc nào đó ta được một bảng kê.
Bảng kê thường bắt đầu bằng tiêu đề và chấm dứt bằng một xuất xứ. + Tiêu đề: mô tả đơn giản nội dung của bảng kê.
+ Xuất xứ: ghi nguồn gốc các dữ liệu trong bảng kê.
Ví dụ: Số liệu xuất khẩu Tp Đà Nẵng ra nước ngoài trong năm 2008.
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH Tên nước % Nhật 31.87 Hoa Kì 39.42 Đài Loan 8.66 Đức 9.63 Khác 10.42 b. Biểu đồ
Để có ấn tượng rõ và mạnh hơn về dữ liệu người ta trình bày dữ liệu bằng các biểu đồ:
- Biểu đồ hình thanh (Bar chart)
Hình 3.3: Biểu đồ hình thanh.
- Biểu đồ hình gẫy khúc (Line Chart).
Biểu đồ này thích hợp với việc biểu diễn một sự liên hệ giữa hai đại lượng với nhau: Hình 3.4: Nhiệt độ trung bình tại Đà Lạt năm 1969.
Hoc viên : Nguyễn Trường Giang MSHV : 10080275 Trang 31
18.5 19 19.5 20 20.5 21 21.5 22 22.5 23 23.5 1 2 3 4 5 6 7 8 9 10 11 12
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH
- Biểu đồ hình tròn (Pie Chart)
Hình 3.5: Hình biểu diễn biểu đồ hình tròn.
Biểu đồ hình tròn là một vòng tròn chia thành nhiều hình quạt. Cả hình tròn tượng trưng toàn thể đại lượng, mỗi hình quạt tương trưng một thành phần mà góc ở tâm tỷ lệ với số dữ kiện thuộc thành phần đó.
2.4.1.4 Tần số
Nếu mỗi biến cố sơ đẳng A thuộc tập hợp biến cố ω nào đấy có thể đặt tương ứng với một đại lượng xác định X = X(A), thì X được gọi là một biến ngẫu nhiên. Biến ngẫu nhiên X có thể xem như hàm của biến cố A với miền xác định là ω.
Các biến ngẫu nhiên được ký hiệu bằng các chữ lớn X, Y, Z … còn các giá trị của chúng được ký hiệu bằng các chữ nhỏ x, y, z…
Biến ngẫu nhiên được chia ra là biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục.
a. Tần số (Frequency)
Gọi xi là các giá trị quan sát được của biến ngẫu nhiên X (i = 1,2,…l).
Số lần xuất hiện của giá trị xi trong tập dữ liệu được gọi là tần số của xi và được ký hiệu là fi. 1 l i i f n = = ∑ với n là cỡ mẫu.
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH - Tần số tương đối
Tỉ số giữa tần số fi và cỡ mẫu n gọi là tần số tương đối
n fi . i i f W n = 1 1 l i Wi = = ∑ - Tần số tích lũy
Tần số tích lũy của một giá trị xi là tổng số tần số của giá trị này với tần số của các giá trị nhỏ hơn xi.
b. Bảng phân phối tần số
Bảng phân phối tần số là bảng thiết lập sự tương quan giữa các giá trị xi của biến ngẫu nhiên X và các tần số của xi. Tùy thuộc vào loại tần số ta có:
- Bảng phân phối tần số.
- Bảng phân phối tần số tương đối (Bảng phân phối thống kê). - Bảng phân phối tần số tích lũy.
Ví dụ: Bảng phân phối tần số tương đối của biến ngẫu nhiên rời rạc. X x1 x2 x3 … xl
W
i
w1 w2 w3… wl
2.4.1.5 Số định tâm
Số định tâm của tập dữ liệu là số đại diện cho tất cả các dữ liệu đó, nó thể hiện vai trò trung tâm của tập dữ liệu. Có các loại số định tâm sau: số trung bình (Mean), trung bình trọng số (Weighted mean), số trung vị (Median) và số yếu vị (Mode).
a. Số trung bình (Mean, kỳ vọng)
- Số trung bình của tập hợp chính (Population Mean): 1
N i i x N µ =∑=
- Số trung bình của mẫu (Sample Mean): 1
n i i x x n = = ∑
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH
- Số trung bình trọng số (Weighted Mean): 1 1 . N i i i N i i w x w µ = = = ∑ ∑ wi : trọng số. - Số trung vị (Median).
Số trung vị của tập dữ liệu là số mà phân nửa giá trị quan sát được của tập dữ liệu nhỏ hơn nó và phân nửa giá trị quan sát lớn hơn nó.
Gọi n là số giá trị quan sát được (đối với biến ngẫu nhiên rời rạc).
- Nếu n là số lẻ thì số trung vị là số có thứ tự {(n+1)/2}, nó chính là số có vị trí ở giữa tập dữ liệu.
- Nếu n là số chẵn thì số trung vị là trung bình cộng của hai số có thứ tự {(n/2)} và {(n/2)+1}
Số yếu vị (Mode).
Số yếu vị của tập dữ liệu là số có tần số lớn nhất. Ví dụ: Cho tập dữ liệu
0 1 0 2 5 2 5 2 3 3 5 6 4 Tìm số trung bình, số trung vị và số yếu vị của tập dữ liệu.
Giải : Ta có bảng phân phối tần số:
X 0 1 2 3 4 5 6 Tần số fi 2 1 3 2 1 3 1 Số trung bình (Mean)
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH X= ∑ ∑ = = 7 1 7 1 i i i i i f x f = 2,923 13 6 1 5 3 4 1 3 2 2 3 1 1 0 2 = × + × + × + × + × + × + ×
Số trung vị (Median): Cỡ mẫu n = 13 lẻ ⇒ (n+1)/2 = 7 0 0 1 2 2 2 3 3 4 5 5 5 6
⇒ Số trung vị là số có thứ tự 7, nghĩa là số trung vị là 3. Số yếu vị là 2 và 5 có tần số lớn nhất là 3.
2.4.2 Kiểm định thang đo
Khi thực hiện các nghiên cứu định lượng, người nghiên cứu phải sử dụng các thang đo lường khác nhau. Hiện tượng kinh tế - xã hội diễn ra rất phức tạp nên việc lượng hóa các khái niệm nghiên cứu đòi hỏi phải có những thang đo lường được xây dựng phù hợp và được kiểm tra độ tin cậy trước khi sử dụng. Việc xây dựng và kiểm định thang đo có ý nghĩa rất quan trọng đến độ tin cậy của các câu hỏi cũng như các kết quả phân tích sau này của nghiên cứu. Kiểm định thang đo là chúng ta kiểm tra xem các mục hỏi nào đã đóng góp vào việc đo lường một khái niệm lý thuyết mà ta đang nghiên cứu, và những mục hỏi nào không. Điều này liên quan đến hai phép tính toán: tương quan giữa bản thân các mục hỏi và tương quan giữa các điểm số của từng mục hỏi với điểm số toàn bộ các mục hỏi cho mỗi bảng câu hỏi.
Hệ số Cronbach Alpha là một phép kiểm định thống kê về mức độ chặt chẽ mà các mục hỏi trong thang đo tương quan với nhau, một trong những phương pháp kiểm tra tính đơn khía cạnh của thang đo được gọi là kiểm định độ tin cậy chia đôi.
Công thức tính hệ số Cronbach Alpha:
2 2) 1 ( * ) 1 ( t i S S n n −∑ − = α Trong đó:
n : số biến trong mẫu.
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH Si2 : phương sai của biến thứ i.
St2 : phương sai của tổng các biến.
α : có giá trị 0<α<1; α càng lớn thì độ tin cậy càng cao.
Theo qui ước, một tập hợp các mục hỏi dùng để đo lường được đánh giá tốt phải có hệ số α >= 0.80 nhưng có giá trị nhỏ nhất chấp nhận được là 0.70.
2.4.3 Các kiểm nghiệm được dùng trong nghiên cứu này:
2.4.3.1 Kiểm nghiệm one sample T-test:
(Nguồn TS. Nguyễn Duy Long) [22]. - Các giả định và điều kiện:
+ Giả định tính độc lập:
. Điều kiện ngẫu nhiên hóa
. Điều kiện 10%: kích thước mẫu nhỏ hơn 10% quần thể. + Điều kiện quần thể chuẩn:
Điều kiện gần chuẩn “Nearly Normal”. Dữ liệu từ phân phối một mốt và đối xứng (kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất). - Quá trình kiểm nghiệm một mẫu (one sample T-test) cho trị trung bình như sau:
+ Kiểm nghiệm giả thiết HO: µ = µ0
Dùng trị thống kê kiểm nghiệm:
Với sai số chuẩn của tri trung bình của mẫu:
Trong đó
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH s: là độ lệch chuẩn của mẫu
n: là kích thước mẫu
Khi các điều kiện thỏa và giả thiết rỗng đúng, trị thống kê theo mô hình t của Student với (n-1) bậc tự do. Kí hiệu: df = n-1.
2.4.2 Phân tích One-Way ANOVA:
(Nguồn Hoàng Trọng, Chu Nguyễn Mộng Ngọc – Phân tích dữ liệu nghiên cứu với SPSS) [17].
Mục đích: Xem xét có sự khác biệt hay không về mức độ đánh giá tầm quan trọng của các nhân tố nào đó giữa các nhóm tham gia khảo sát trong nghiên cứu.
Một số giả thiết vơi phân tích phuong sai một yếu tố (one-way ANOVA): + Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
+ Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn.
+ Phương sai của các nhóm so sánh phải đồng nhất.
2.4.3 Lý thuyết về phân tích nhân tố chính Principal Component Analysis)
(Nguồn: Bài giảng “Phương pháp phân tích định lượng”
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH - PGS.TS Nguyễn Thống) [18].
Hình thành vấn đề:
Khảo sát các yếu tố trong không gian p chiều ( biến số p > 2 ). - Ta không thể phân tích số liệu một cách trực quan.
- Vấn đề càng khó tưởng tượng khi p càng lớn.
- Nhu cầu phân tích số liệu trong các mặt phẳng ( không gian 2D ).
Phương pháp phân tích nhân tố chính (PCA)
- Chọn mặt phẳng chiếu sao cho ít mất thông tin nhất do thực hiện phép chiếu → Đó chính là các mặt phẳng chính trong phương pháp PCA.
- Phương pháp PCA chỉ chọn một số trục ít nhất có thể để biểu diễn số liệu (thông thường từ 2 đến 4 trục)
→ Đó chính là trục nhân tố chính (Principal Component Axis).
- Phân tích nhân tố là việc giảm số biến ban đầu xuống còn ít biến hơn. Mỗi biến sẽ đại biểu của một tập hợp biến cũ gọi là nhân tố (item).
Trong phân tích nhân tố chính, các biến được chuẩn hóa và trung tâm hóa.
Trục nhân tố được xác định theo phương pháp phương sai của các hình chiếu biến ban đầu xuống trục nhân tố chính là cực đại. Các trục chính tại thành một hệ tọa độ trực giao, đó là điều kiện cần và đử để làm hệ qui chiếu.
Ý nghĩa của trục nhân tố chính:
- Trong không gian p chiều, trục nhân tố chính số 1 chỉ xu thế chính của đám mây dữ liệu.
- Các trục nhân tố chính kế tiếp (2,3,4,…,p) chỉ các xu thế có khuynh hướng yếu dần của đám mây dữ liệu.
- Hình chiếu của đám mây số liệu xuống trục chính số 1 sẽ mất thông tin về dữ liệu ít nhất.
Thông thường ta không thể nghiên cứu trong không gian p (p>2) chiều. Ta chỉ có thể nghiên cứu số liệu trong các mặt phẳng (không gian 2D). Chiếu các số
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH
liệu xuống các mặt phẳng, chọn các mặt phẳng ít mất thông tin nhất thì đó là các mặt phẳng chính.
2.4.4 Lý thuyết về phân tích Hồi qui đa bội
(Nguồn: Bài giảng “Phương pháp phân tích định lượng”
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
Luận văn Thạc sĩ GVHD: TS. ĐINH CÔNG TỊNH