SỬ DỤNG PHẦN MỀM SPSS TRONG PHÂN TÍCH SỐ LIỆU

74 10 0
SỬ DỤNG PHẦN MỀM SPSS TRONG PHÂN TÍCH SỐ LIỆU

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Mục lục Trang Bài 1.1 1.2 1.3 1.4 1.5 1.6 Bài 2.1 2.2 2.3 Bài Xử lí liệu SPSS Giới thiệu cài đặt phần mềm SPSS 1.1.1 Giới thiệu phần mềm SPSS 1.1.2 Cài đặt SPSS 1.1.3 Khởi động SPSS Nhập liệu SPSS Đọc liệu từ file có sẵn SPSS 1.3.1 Đọc liệu từ file sav 1.3.2 Đọc liệu từ file xls 1.3.3 Đọc liệu từ file.txt Lọc liệu Mã hóa liệu 1.5.1 Mã hóa liệu nội biến 1.5.2 Mã hóa liệu vào biến Làm liệu 1.6.1 Dùng bảng tần số 1.6.2 Dùng lệnh Sort case để tìm liệu sai cửa sổ Data View 1.6.3 Dùng bảng phối hợp hai biến hay ba biến Lập bảng tần số tính đại lượng thống kê mơ tả Tóm tắt liệu bảng tần số 2.1.1 Bảng tần số cho liệu định tính liệu định lượng có biểu 2.1.2 Phân tổ liệu Lập bảng tổng hợp nhiều biến 2.2.1 Bảng kết hợp hai biến định tính 2.2.2 Bảng kết hợp ba biến định tính 2.2.3 Bảng kết hợp biến định tính biến định lượng Tính đại lượng thống kê mô tả 2.3.1 Bài tập ôn luyện Biểu đồ 1 1 9 10 11 14 20 20 23 26 27 28 28 30 30 30 31 32 32 34 35 36 40 41 i Mục lục 3.1 3.2 Một số loại biểu đồ Biểu đồ 3.2.1 Cách vẽ biểu đồ 3.2.2 Ví dụ: vẽ biểu đồ biểu diễn biến 3.2.3 Ví dụ: vẽ biểu đồ biểu diễn biến phân tách biến khác Biểu đồ tròn 3.3.1 Cách vẽ biểu đồ tròn Biểu đồ gấp khúc, diện tích (Line, Area Chart) 3.4.1 Ví dụ 3.4.2 Ví dụ Biểu đồ tần số (Histogram) 3.5.1 Cách vẽ biểu đồ tần số (Histogram) Biểu đồ hộp râu (Boxplot) 3.6.1 Cách vẽ biểu đồ hộp râu (Boxplot) Biểu đồ tán xạ (Scatter plot) 3.7.1 Cách vẽ biểu đồ tán xạ (Scatter plot) 41 41 41 43 Bài Kiểm định mối quan hệ hai biến 4.0.2 Ví dụ: kiểm định mối liên hệ hai biến định danh, hay định danh-thứ bậc 4.0.3 Kiểm định mối liên hệ hai biến thứ bậc 56 56 59 Bài 5.1 5.2 5.3 Kiểm định trung bình Kiểm định trung bình tổng thể Kiểm định khác hai trung bình hai tổng thể mẫu độc lập Kiểm định khác hai trung bình hai tổng thể mẫu cặp 61 61 62 64 Bài Phân tích phương sai (ANOVA) 6.0.1 Ví dụ 6.0.2 Phân tích sâu ANOVA 67 67 69 3.3 3.4 3.5 3.6 3.7 Tài liệu tham khảo ii 43 45 45 46 46 47 48 49 51 51 54 54 71 P.T.Hồng-N.T.Nhung Bài Xử lí liệu SPSS 1.1 Giới thiệu cài đặt phần mềm SPSS Giới thiệu phần mềm SPSS SPSS (viết tắt Statistical Package for the Social Sciences) chương trình máy tính phục vụ công tác thống kê SPSS sử dụng rộng rãi công tác thống kê xã hội Thế hệ SPSS đưa từ năm 1968 Thế hệ hệ 18 giới thiệu từ tháng năm 2008, có phiên cho hệ điều hành Microsoft Windows, Mac, Linux / UNIX SPSS hệ thống phần mềm thống kê toàn diện thiết kế để thực tất bước phân tích thống kê từ tính tốn thống kê mơ tả (liệt kê liệu, lập bảng tần số, lập biểu đồ, tính đại lượng thống kê mơ tả, ) đến thực toán thống kê suy diễn (kiểm định, tương quan, hồi qui, ) Cài đặt SPSS Cho đến nay, SPSS có nhiều phiên khác nhau, phiên (5/2010) phiên 18.0 Với tính tốn thống kê phổ biến ta cài SPSS với phiên 13.0, 14.0 hay 16.0, Tất phân tích tài liệu thực phiên SPSS 13.0 Khởi động SPSS Để khởi động SPSS ta thực theo cách sau: • Kích đúp vào biểu tượng SPSS hình; • Vào Start Ñ Program Ñ SPSS for Windows Ñ SPSS 13.0 for Windows Sau khởi động, ta giao diện sau: Bài Xử lí liệu SPSS 1.2 Nhập liệu SPSS Để nhập tập liệu vào SPSS, ta thực sau: Bước 1: Tại cửa sổ SPSS DaTa Editor, ta ấn vào nút Variable View để khai báo thơng tin thuộc tính biến file liệu Trong bảng Variable View • Các hàng biến; • Các cột thuộc tính biến Các thuộc tính biến bao gồm: • Tên biến (Name) • Loại liệu (Type) • Số lượng số chữ (Width) • Số lượng chữ số thập phân (Decimals) • Mô tả biến/nhãn biến (Lable) nhãn trị số biến (Values) P.T.Hồng-N.T.Nhung 1.2 Nhập liệu SPSS • Các giá trị khuyết thiếu người sử dụng thiết lập (Missing) • Độ rộng cột (Columns) • Căn lề (Align) • Thang đo biến (Measure) Khi khai báo chỉnh sửa thuộc tính biến cửa sổ Variable View cần ý số điểm sau: • Tên biến phải bắt đầu chữ không kết thúc dấu chấm Tên biến nhất, không đặt trùng tên biến tên biến không phân biệt chữ hoa, chữ thường • Loại biến: Variable Type xác định loại liệu biến Theo mặc định, biến giả sử dạng số Phụ thuộc vào loại liệu thu thập, ta khai báo kiểu sau: liệu dạng số (numeric), dấu phảy (comma), dấu chấm (dot), ghi khoa học (Scientific notation), ngày tháng (Date), đô-la (Dollar), đơn vị tiền riêng (custom currency) chuỗi (string) • Nhãn biến dùng để mô tả rõ tên biến tên biến có độ dài tối đa Nhãn biến có độ dài đến 256 kí tự • Ta gán nhãn cho giá trị biến Tính đặc biệt tiện lợi ta dùng số để mã hóa biến định tính Ví dụ Biến mã hóa dùng cho nhiều phân tích khác Hơn nữa, với nhãn giá trị, kết tính trình bày rõ ràng • Các giá trị khuyết thiếu người sử dụng thiết lập (Missing) Những giá trị khơng thích ứng với kiểu khai báo biến coi giá trị khuyết thiếu Đối với biến kiểu số, ô trống hiểu giá trị khuyết đánh dấu dấu phân cách thập phân Nhiều thủ tục SPSS loại giá trị khuyết khỏi bước tính tốn kết phân tích dựa phần số liệu khơng khuyết – Ta nhập đến trị số khuyết riêng biệt, phạm vi khoảng cách trị số khuyết phạm vi cộng với trị số khuyết riêng biệt; – Các phạm vi định cho biến dạng số; – Các trị số khuyết cho biến dạng chuỗi phải có độ dài khơng vượt q kí tự • Số đo biến thang đo định danh (Nominal), thang đo thứ bậc (Ordinal) thang đo khoảng, tỉ lệ (gọi chung Scale): – Thang đo định danh: Thang đo định danh dùng cho biến định tính Số đo biến mã số để phân loại đối tượng Giữa mã số khơng có quan hệ kém, dùng để đếm tần số xuất biểu Một số ví dụ thang đo là: biến giới tính với số đo là: Nam Nữ; biến màu sắc với số đo là: xanh, đỏ, tím, vàng, ; biến khu vực sống với số đo: Thành phố, Thị xã, Nông thôn, Miền núi, P.T.Hồng-N.T.Nhung Bài Xử lí liệu SPSS – Thang đo thứ bậc: Thang đo thứ bậc thường dùng cho biến định tính, đơi dùng cho biến định lượng Trong thang đo số đo biến có quan hệ thứ bậc Tuy nhiên, chênh lệch số đo khơng thiết Ví dụ biến đánh giá thái độ chất lượng dịch vụ mạng Internet nhà có số đo là: Khơng hài lịng, hài lòng, hài lòng – Thang đo khoảng: Thang đo thứ bậc thường dùng cho biến định lượng Thang đo khoảng thang đo thứ bậc có khoảng cách Các phép tính cộng trừ có nghĩa khơng có giá trị khơng xác định cách xác khơng thể lấy tỉ lệ số đo Ví dụ số đo nhiệt độ, số đo số IQ, số EQ, – Thang đo tỉ lệ: Thang đo tỉ lệ dùng cho biến định lượng Thang đo tỉ lệ thang đo khoảng, thang đo có giá trị khơng xác định cách xác lấy tỉ lệ số đo Ví dụ thang đo đơn vị đo tiền tệ (VND, dollar, pound, yen, ); đơn vị đo chiều dài (cm, m, km, ); đơn vị đo khối lượng (kg, tấn, tạ, yến, ) Bước 2: Tại cửa sổ Data Editor, nhấn vào nút Data View để nhập liệu ô Trong bảng Data View • Mỗi cột biến Variable; • Mỗi hàng đối tượng cases Để chèn đối tượng (hàng) đối tượng có sẵn: • Trong bảng Data View, chọn đối tượng nằm vị trí cần chèn đối tượng mới; • Từ menu chọn Data Ñ Insert Cases Để chèn biến (cột) vào biến có sẵn: • Trong bảng Data View, chọn biến nằm bên phải biến cần chèn biến mới; • Từ menu chọn Data Ñ Insert Variable Giả sử ta muốn nhập tập liệu điều tra thị trường thức ăn nhanh FastFood cho bảng vào SPSS: P.T.Hồng-N.T.Nhung 1.2 Nhập liệu SPSS Đối với tập liệu ta có biến là: Tuoi (tuổi), GioiTinh (giới tính), NgheNghiep (nghề nghiệp), ThuNhap (thu nhập), Gia (giá mua FastFood), ChonDoQC, ChonDoTL, ChonDoSP, ChonDoGC (yếu tố ảnh hưởng đến định dùng FastFood tương ứng quảng cáo, tiện lợi, sản phẩm, giá cả) thu thập 100 đối tượng Để nhập tập liệu vào SPSS, ta vào bảng Variable View để khai báo thuộc tính biến Chẳng hạn, với biến Tuoi ta khai báo thuộc tính sau: • Name: Tuoi • Type: Numeric (dạng số) • Width: (độ dài giá trị tuổi 2) • Decimals: (khơng có chữ số thập phân) • Lable: (khơng thích thêm biến) • Values: None (khơng cần giải thích kiểu giá trị biến) • Missing: None (khơng có giá trị khuyết) • Columns: (độ rộng cột biến 8) • Align: Right (căn lề bên phải) • Measure: Scale (giá trị biến tuổi thang đo tỉ lệ nên khai báo thang đo định lượng) P.T.Hồng-N.T.Nhung Bài Xử lí liệu SPSS Với biến NgheNghiep ta khai báo thuộc tính sau: • Name: NgheNghiep • Type: String (dạng chuỗi) • Width: (độ dài giá trị nghề nghiệp 4) • Decimals: (khơng có chữ số thập phân) • Lable: Nghe nghiep (chú thích thêm tên biến) • Values: HSSV = "hoc sinh + sinh vien", CNVC = "cong nhan vien chuc", NVVP = "nhan vien van phong", Khac = "nghe khac" (chú thích thêm giá trị biến) • Missing: None (khơng có giá trị khuyết) • Columns: (độ rộng cột biến 8) • Align: Left (căn lề bên trái) • Measure: Nominal (giá trị biến nghề nghiệp thang đo định danh nên khai báo thang đo định danh) Với biến Gia ta khai báo thuộc tính sau: • Name: Gia • Type: Numeric (dạng số) • Width: (độ dài giá trị nghề nghiệp 4) • Decimals: (khơng có chữ số thập phân) • Lable: Gia mua FastFood (chú thích thêm tên biến) • Values: = "12-20 (nghin)", = "20-30 (nghin)", = "30-40 (nghin)", = "> 40 (nghin)" (chú thích giá trị biến) P.T.Hồng-N.T.Nhung 1.2 Nhập liệu SPSS • Missing: None (khơng có giá trị khuyết) • Columns: (độ rộng cột biến 8) • Align: Left (căn lề bên trái) • Measure: Ordinal (giá trị biến giá thang đo thứ bậc nên khai báo thang đo thứ bậc) Hoàn toàn tương tự cho biến khác ta có bảng Variable View cho biến sau: Sau khai báo thuộc tính biến cửa sổ Variable View, ta vào cửa sổ Data View nhập giá trị cho biến điều tra P.T.Hồng-N.T.Nhung Bước 1: Chọn Analyze ÝÑ Descriptive ÝÑ Crosstab để mở sổ Crosstab Bước 2: Tại cửa sổ Crosstab, đưa biến thứ vào khung Row(s), biến thứ hai vào khung Column(s) Ấn Statistics , xuất cửa sổ P.T.Hồng-N.T.Nhung 57 Bài Kiểm định mối quan hệ hai biến Bước 3: Chọn Chi-square Ấn Continue Quay lại sổ Crosstab, chọn Cell , cửa sổ Cross tab: Cell Display mở Tại cửa sổ này, khung Count, chọn Observed muốn hiển thị tần số quan sát bảng chéo, chọn Expected nếu muốn hiển thị tần số lý thuyết bảng chéo Ấn Continue Quay lại sổ Crosstab OK Kết cho ba bảng sau 58 P.T.Hồng-N.T.Nhung Kiểm định tiến hành kiểm tra xem liệu thu mẫu có đủ mạnh để ủng hộ giả thuyết hay không Kết luận cuối chấp nhận H0 tức bác bỏ H1 bác bỏ H0 tức chấp nhận H1 Chúng ta so sánh mức ý nghĩa toán α (thường 0.01, 0.05 hay 0.1) p-giá trị (Sig.) theo quy tắc • Nếu α ¡ p-giá tr thỡ bỏc b H0 ã Nu Ô p-giỏ trị chấp nhận H0 Trong bảng Chi-Square Tests, dòng Pearson Chi-Square ta thấy p-giá trị = 0.582 Nếu sử dụng mức ý nghĩa α = 0.05 ta có α   0.582, ta chấp nhận giả thuyết H0 khơng có mối liên hệ giới tính lựa chọn giá sản phẩm thức ăn nhanh Kiểm định có ý nghĩa có khơng q 20% số tần số kỳ vọng nhỏ Dòng chữ nhỏ phía cuối bảng cho biết số tần số kỳ vọng có chiếm 12.5% Kiểm định mối liên hệ hai biến thứ bậc Trong trường hợp hai biến thứ bậc ta đo độ mạnh mối liên hệ tuyến tính hai biến Trong bước 3, cửa sổ Crosstab: Statistics, khung Ordinal ta chọn số số : Gamma, Somers'd, Kendall's tau b Ấn OK Quay hộp thoại trước, ấn OK P.T.Hồng-N.T.Nhung 59 Bài Kiểm định mối quan hệ hai biến 60 P.T.Hồng-N.T.Nhung Bài Kiểm định trung bình 5.1 Kiểm định trung bình tổng thể Có thể cho độ tuổi trung bình khách hàng sử dụng sản phẩm thức ăn nhanh (ký hiệu µ) 20 hay khơng Cặp giả thuyết đặt sau H0 : µ = 20, H1 : µ  20 Ta sử dụng biến Tuoi file DuLieuThucHanh.sav để kiểm định giả thuyết Bước 1: Vào Analyze ÝÑ Compare Means ÝÑOne-Sample T Test để mở cửa sổ One-Sample T Test Bước 2: Tại cửa sổ One-Sample T Test, đưa biến định lượng cần phân tích (Tuoi) vào khung Test Variable(s) Khai báo giá trị cần so sánh trung bình tổng thể vào ô Test Value 61 Bài Kiểm định trung bình Ấn Options để chọn độ tin cậy cho khoảng ước lượng Ấn Continue trở hộp thoại trước, ấn OK Kết cho hai bảng sau Theo kết quả, giá trị trung bình mẫu 25.13 tuổi, giá trị kiểm định t 3.922, p-giá trị 0.000 nhỏ Vậy ta bác bỏ giả thuyết H0 vào chênh lệch dương trung bình mẫu giá trị Test Value=20, ta cho độ tuổi trung bình khách hàng 20 Hai số cuối cho biết ước lượng khoảng với độ tin cậy 95% cho độ tuổi trung bình khách hàng (22.53, 27.73) Qua thấy khách hàng tập trung độ tuổi trẻ 5.2 Kiểm định khác hai trung bình hai tổng thể mẫu độc lập Sử dụng tập liệu SoSanh2Mang.sav để so sánh hài lòng khách hàng mẫu gồm 97 người chất lượng dich vụ hai mạng di động khác Thang điểm đánh giá tăng từ tới theo tăng mức hài lòng 62 P.T.Hồng-N.T.Nhung 5.2 Kiểm định khác hai trung bình hai tổng thể mẫu độc lập Gọi µ1 , µ2 điểm đánh giá trung bình hai nhóm khách hàng mạng di động thứ nhất, thứ hai Giả thuyết H0 : µ1 = µ2 H1 : µ1  µ2 Dữ liệu gồm biến định lượng (Diem) biến định tính phân loại (MangDD) Bước 1: Vào Analyze ÝÑ Compare Means ÝÑIndependent-Sample T Test Bước 2: Tại cửa sổ Independent-Sample T Test, đưa biến Diem vào khung Test Value, biến MangDD vào khung Grouping Variable Ấn Define Groups P.T.Hồng-N.T.Nhung 63 Bài Kiểm định trung bình Bước 3: Nhập mã nhóm nhóm vào sổ Define Groups Ấn Continue Trở hộp thoại trước ấn OK Kết kiểm định F cho thấy hai phương sai tổng thể nên sử dụng kiểm định t ứng với dòng Equal Variance Assumed P-giá trị =0.000 nên ta bác bỏ H0 Chênh lệch mẫu nhóm Vie nhỏ so với nhóm Mob nên cho hài lòng khách hàng với dịch vụ di dộng mạng Mob cao so với mạng Vie 5.3 Kiểm định khác hai trung bình hai tổng thể mẫu cặp Khi cần so sánh trung bình hai tổng thể trường hợp lấy mẫu đôi (khi hai tổng thể có liên hệ với nhau) Dữ liệu hai biến định lượng nhận giá trị cặp liệu Trong ví dụ sau ta điều tra hài lịng khách hàng thơng qua việc so sánh điểm kỳ vọng trước sử dụng dịch vụ điểm đánh giá sau trải nghiệm dịch vụ (về chất lượng gọi dịp lễ Tết) Nếu gọi Gọi µ1 , µ2 điểm đánh giá trung bình trước sau dùng dịch vụ Ta kiểm định cặp giả thuyết: H0 : µ1 = µ2 H1 : µ1  µ2 Bước 1: Vào Analyze ÝĐ Compare Means ÝĐPaired-Sample T Test 64 P.T.Hồng-N.T.Nhung 5.3 Kiểm định khác hai trung bình hai tổng thể mẫu cặp Bước 2: Tại cửa sổ Paired-Sample T Test, dùng phím Ctrl để chọn hai biến TruocSuDung, SauSuDung đưa vào khung Paired Variable Bước 3: Ấn OK P.T.Hồng-N.T.Nhung 65 Bài Kiểm định trung bình p-giá trị = 0.002 nhỏ mức ý nghĩa 0.05 nên bác bỏ giả thuyết H0 cho điểm đánh giá kỳ vọng trước sử dụng điểm đánh giá sau sử dụng Ngoài giá trị kiểm định t dương nên ta cho khách hàng chất lượng gọi mạng di động chưa đáp ứng mong đợi khách hàng 66 P.T.Hồng-N.T.Nhung Bài Phân tích phương sai (ANOVA) Phương pháp phân tích phương sai dùng nghiên cứu ảnh hưởng biến nguyên nhân định tính lên biến kết định lượng, phương pháp so sánh trung bình nhiều nhóm (3 nhóm trở lên) Giả thuyết H0 sau: H0 : µ1 = µ2 =    = µk có nghĩa là: H0 : biến định tính khơng có ảnh hưởng tới biến định lượng Giả thuyết đối H1 : biến định tính có ảnh hưởng tới biến định lượng Dữ liệu đầu vào: gồm biến định lượng biến phân loại Các bước tiến hành sau Ví dụ Giả sử ta cần so sánh mức hài lòng khách hàng sử dụng dịch vụ ba mạng di động Vie, Mob, Vin chất lượng dịch vụ Dữ liệu thu thập lưu file SoSanh3Mang.sav Các bước tiến hành sau: Bước 1: Vào Analyze ÝÑ Compare Means ÝÑOne-Way ANOVA để mở cửa sổ One-Way ANOVA 67 Bài Phân tích phương sai (ANOVA) Bước 2: Tại cửa sổ One-Way ANOVA, đưa biến định lượng vào khung Dependent List, biến phân loại vào khung Factor Ấn Options mở hộp thoại sau Bước 3: Chọn Descriptive để tính đại lượng thống kê mơ tả cho nhóm; chọn Homogeneityof-variance để tiến hành thủ tục kiểm định phương sai tổng thể Sau ấn Continue trở hộp thoại trước ấn OK Kết cho bảng sau 68 P.T.Hồng-N.T.Nhung Bảng đưa kết tính số đại lượng thống kê mơ tả cho nhóm Bảng thứ hai kết thủ tục kiểm định phương sai Với giá trị Sig 0.388 ta chấp nhận giả thuyết phương sai Bảng thứ ba, cho biết p-giá trị Sig=0.002 nên ta bác bỏ giả thuyết H0 với mức ý nghĩa 0.05 Như cho hài lịng khách hàng mạng di động có khác biệt Phân tích kỹ khác biệt tiến hành mục sau Phân tích sâu ANOVA Các bước phân tích sâu ANOVA thực tương tự phân tích phương sai ANOVA bước ta làm thêm thao tác sau: Tại cửa sổ One-Way ANOVA, ấn Post Hoc, mở cửa sổ sau Bảng liệt kê số phương pháp so sánh cặp trung bình khác Trong ví dụ ta chọn phương pháp Tukey nên chọnTukey P.T.Hồng-N.T.Nhung 69 Bài Phân tích phương sai (ANOVA) Kết so sánh cặp dựa cột Sig ta thấy hài lòng khách hàng hai mạng Mob Vin tốt so với mạng di động lại 70 P.T.Hồng-N.T.Nhung Tài liệu tham khảo [1] Hồng Trọng, Chu Nguyễn Mộng Ngọc, Phân Tích Dữ Liệu Nghiên Cứu với SPSS, Tập 1, 2, Nhà xuất Hồng Đức, năm 2008 [2] Hồ Đăng Phúc, Sử Dụng Phần Mềm SPSS Trong Phân Tích Số Liệu, Nhà xuất Khoa học Kĩ thuật

Ngày đăng: 02/11/2023, 20:19

Tài liệu cùng người dùng

Tài liệu liên quan