Giới thiệu thang đo trong SPSS: nominal, scale; ordinal; Giao diện của SPSS; Cách khai báo biến và nhập dư liệu trong SPSS; Bài tập thực hành nhập liệu trong SPSS. Hướng dẫn cụ thể trên phần mềm SPSS.
Trang 1Bài 2: GIỚI THIỆU GIAO DIỆN - KHAI BÁO VÀ NHẬP DỮ LIỆU
1 Giới thiệu phần mềm SPSS
2 Cài đặt SPSS 26 trên windows
3 Quản lý dữ liệu trong SPSS
4 Làm sạch dữ liệu
Trang 21 Giới thiệu phần mềm SPSS
o SPSS (Statistical Package for Social Sciences) là một phần mềm máy tính
phục vụ công tác phân tích thống kê
o Là phần mềm thống kê được sử dụng phổ biến cho các nghiên cứu trong các lĩnh vực: Tâm lý học, Y học, sinh học, điều tra xã hội học, kinh doanh,…
o Có giao diện thân thiện với người dùng, dễ sử dụng bởi sử dụng chủ yếu các thao tác click chuột dựa trên các công cụ mà rất ít dùng lệnh
o SPSS rất mạnh cho các phân tích như: Kiểm định phi tham số, thống kê mô
tả, kiểm định sự tin cậy của thang đo bằng Cronbach Alpha, phân tích tương quan, hồi quy tuyến tính đơn và bội, kiểm định trung bình T-Test, Kiểm định sự khác nhau giữa các biến phân loại (định danh) bằng phân tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing) hay sử dụng biến giá (hồi quy với biến phân loại), hội quy nhị thức (logistic)
Trang 31 Giới thiệu phần mềm SPSS
Màn hình quản lý dữ liệu (Data View)
Màn hình quản lý biến (Variable View)
Màn hình quản lý kết quả (Output)
Màn hình quản lý cú pháp (Syntax)
Các loại màn hình trong SPSS
Trang 51 Giới thiệu phần mềm SPSS
o Nơi khai báo các biến nghiên cứu, quản lý biến, các thông tin liên
quan đến biến nghiên cứu
Trang 61 Giới thiệu phần mềm SPSS
Cửa sổ hiển thị các kết quả phân tích thống kê khi người dùng thực hiện các lệnh xuất dữ liệu
Trang 71 Giới thiệu phần mềm SPSS
File: Tạo file mới, mở file sẵn có, lưu file, đổi tên file, in, thoát,…
Edit: Copy, cut, paste, undo, redo, find, replace, options,
View: Hiển thị các thanh công cụ, dòng trạng thái, đổi fonts chữ,…
Data: Các lệnh liên quan đến dữ liệu (định nghĩa tính chất các biến, sắp xếp
các biến và dữ liệu, lựa chọn dữ liệu thỏa mãn tính chất nào đó…)
Transform: Chuyển đổi dữ liệu, tính toán trên các biến, mã hóa lại các biến… Analyze: Các phân tích thống kê mô tả và thống kê suy luận.
Graphs: Vẽ biểu đồ, đồ thị
Utilities: Thông tin về các biến, file…
Windows: Sắp xếp và chuyển đổi các cửa sổ làm việc
Trang 82 Cài đặt phần mềm SPSS
1 Tải file cài đặt SPSS (link đã gửi)
2 Chọn file cài đặt cho window 64bit (IBM SPSS 26 64bit)Sau đó cài đặt bình thường (chạy file setup – Application)
3 Sau khi cài đặt xong → Không chạy phần mềm ngay (tắt đi)
4 Copy file License vào thư mục cài đặt của SPSS 26:
C:\Program Files\IBM\SPSS\Statistics\26
Ghi đè lên nếu window hỏi (yes)
→ Khởi động phần mềm
Trang 9Edit → Options…
2 Cài đặt phần mềm SPSS
Trang 10General → Display names → Apply → Ok
Data → Display format for new numeric variables
o With: 8
o Decimal Place: 0
2 Cài đặt phần mềm SPSS
Trang 113 Quản lý dữ liệu trong SPSS
3.1 Tạo cơ sở dữ liệu
o Cơ sở dữ liệu: là tập hợp các dữ liệu có cấu trúc và liên quan với nhau
được lưu trữ trên máy tính, được nhiều người sử dụng và được tổ chức theo một mô hình
o Thành phần của cơ sở dữ liệu trong SPSS:
➢ Quan sát (Observation/Case): Chứa thông tin về một đối tượng điều
tra/thời gian nghiên cứu
➢ + Biến (Variable): Thể hiện các thuộc tính quan của quan sát
o Trong cửa sổ Data View của SPSS: Mỗi quan sát tương ứng với 1 hàng,
môi biến tương ứng với 1 cột
Trang 123 Quản lý dữ liệu trong SPSS
o Phân loại biến trong SPSS
Biến định tính:
- Thang đo định danh (Nominal Scale)
- Thang đo thứ bậc (Ordinal Scale)
Biến định lượng:
- Thang đo khoảng (Interval Scale)
- Thang đo tỉ lệ (Ratio Scale)
3.1 Tạo cơ sở dữ liệu
Trang 133 Quản lý dữ liệu trong SPSS
o Phân loại thang đo
3.1 Tạo cơ sở dữ liệu
Thang đo định danh
• Có sự so sánh hơn kém.
• Không thực hiện được các phép tính đại số.
• Ví dụ: Xếp loại học lực của học sinh, phân loại
GV trong trường, trình độ học
vấn,…
Thang đo khoảng
(Interval Scale)
• Dùng cho các dữ liệu định lượng.
• Là loại thang đo
có khoảng cách bằng nhau.
• Có thể thực hiện được các phép tính đại số (trừa phép chia không
có ý nghĩa).
• Ví dụ điểm môn học của sinh viên.
• Thông thường sử dụng thang đo likert
Thang đo tỷ lệ
(Ratio Scale)
• Dùng cho các dữ liệu định lượng.
• Thang đo tỷ lệ có đầy đủ đặc tính của thang đo khoảng cách.
• Có gốc 0 tuyệt đối.
• Có thể thực hiện được các phép tính đại số.
• Ví dụ: Chiều cao, cân nặng, thu nhập trung bình trong 1 tháng,…
Trang 143 Quản lý dữ liệu trong SPSS
A/ Biến một lựa chọn:
Số biến: Một câu hỏi tương ứng với 1 biến.
Giá trị (Values): Mỗi lựa chọn trong đáp áp tương ứng với một giá trị Thang đo (Measure): Thường là Nominal.
Ví dụ: Hãy cho biết thu nhập bình quân trong 1 tháng của bạn là?
Từ 5 đến dưới 10 triệu 2
Từ 10 triệu đến dưới 15 triệu 3
Từ 15 triệu đến dưới 20 triệu 4
3.1 Tạo cơ sở dữ liệu
Trang 153 Quản lý dữ liệu trong SPSS
B/ Biến nhiều lựa chọn: Là câu hỏi mà đáp viên có thể trả lời nhiều đáp án
Ví dụ: Anh chị đã và đang dùng điện thoại thương hiệu gì?
Trang 163 Quản lý dữ liệu trong SPSS
B/ Biến nhiều lựa chọn:
- Cách mã hóa 1: Câu hỏi có bao nhiêu đáp án thì tạo bấy nhiêu biến
o Name: Đặt tên biến theo cú pháp Tên biến gốc + Hậu tố số thứ
Trang 173 Quản lý dữ liệu trong SPSS
- Cách mã hóa 1: Câu hỏi có bao nhiêu đáp án thì tạo bấy nhiêu biến
Ví dụ: có 5 người tương ứng chọn như sau:
Người 1: Iphone, Samsung, Huawei - giá trị: 1, 2, 5;
Người 2: Iphone, Samsung - Giá trị: 1, 2 Người 3: Samsung, Vsmart, Oppo, Huawei - Giá trị: 2, 3, 4, 5 Người 4: cả 6 hãng điện thoại - Giá trị: 1, 2, 3, 4, 5, 6
Người 5: Iphone - Giá trị: 1
B/ Biến nhiều lựa chọn:
3.1 Tạo cơ sở dữ liệu
Trang 183 Quản lý dữ liệu trong SPSS
- Cách mã hóa 2: Mỗi biến sẽ đóng vai trò là một câu hỏi của từng đáp án
B/ Biến nhiều lựa chọn:
3.1 Tạo cơ sở dữ liệu
Trang 193 Quản lý dữ liệu trong SPSS
- Cách mã hóa 2: Mỗi biến sẽ đóng vai trò là một câu hỏi của từng đáp án
o Name: Đặt tên biến theo cú pháp Tên biến gốc + Hậu tố số thứ
tự (Câu 1 có 6 đáp án → Q1.1, Q1.2, Q1.3,…)
o Type: numeric
o Label: mỗi lable của 1 biến sẽ nhập 1 đáp án trả lời.
o Measure: Nominal
o Values: dùng hệ nhị phân, gán 0 là "Không", gán 1 là "Có".
B/ Biến nhiều lựa chọn:
3.1 Tạo cơ sở dữ liệu
Trang 203 Quản lý dữ liệu trong SPSS
- Cách mã hóa 2: Mỗi biến sẽ đóng vai trò là một câu hỏi của từng đáp án
Ví dụ:
Người 1: Iphone, Samsung, Huawei; Người 2: Iphone, Samsung Người 3: Samsung, Vsmart, Oppo, Huawei; Người 4: cả 6 hãng điện thoại Người 5; Iphone.
B/ Biến nhiều lựa chọn:
3.1 Tạo cơ sở dữ liệu
Trang 213 Quản lý dữ liệu trong SPSS
o B/Biến nhiều lựa chọn:
3.1 Tạo cơ sở dữ liệu
Sau khi hoàn thành mã hóa và
nhập liệu → Tạo biến nhiều trả
lời tổng hợp.
Analyze → Multiple Respone
→ Define Variable Sets…
Trang 223 Quản lý dữ liệu trong SPSS
B/ Biến nhiều lựa chọn:
3.1 Tạo cơ sở dữ liệu
Tại mục Define Multiple
Response sets → đưa các biến
đơn của câu hỏi nhiều trả lời
vào mục Variables in Set.
Trang 233 Quản lý dữ liệu trong SPSS
B/ Biến nhiều lựa chọn:
3.1 Tạo cơ sở dữ liệu
Name: Khai báo tên biến
tổng hợp
Lable: Khai báo nhãn của
biến tổng hợp
Trang 243 Quản lý dữ liệu trong SPSS
B/ Biến nhiều lựa chọn:
3.1 Tạo cơ sở dữ liệu
Trang 253 Quản lý dữ liệu trong SPSS
C/ Biến là câu hỏi định tính mở
Liệt kê câu trả lời thành các ý
nhỏ
Đặt tên chung cho các ý nhỏ
Gán tên nhóm thành giá
trị
Mỗi nhóm này chính
là một giá trị trong
"Values"
Quy trình mã hóa cho câu hỏi mở:
Là dạng câu hỏi không có các đáp án lựa chọn có sẵn mà người được khảo sát tự điền đáp án theo ý kiến của bản thân
3.1 Tạo cơ sở dữ liệu
Trang 263 Quản lý dữ liệu trong SPSS
Ví dụ: Anh/Chị có đóng góp gì để công ty cải thiện sự hài lòng của nhân viên trong công việc:
………
Người 1: Công ty cần cải thiện hệ thống máy lạnh do máy hay hỏng; mở thêm nhiều chương
trình đào tạo để nâng cao trình độ nhân viên.
Người 2: Công ty cần đổi ghế cứng sang ghế dựa xoay để nhân viên làm việc thoải mái hơn;
hỗ trợ cho nhân viên đi học các khóa học chuyên môn; đẩy mạnh hoạt động ngoại khóa team building để tăng tính gắn kết giữa các nhân viên; thưởng cuối năm của công ty rất thấp, có người không có thưởng.
Người 3: Cấp quản lý đang có vấn đề, cách quản lý và giám sát nhân viên quá khắt khe chi li
tới mức không cần thiết, làm cho nhân viên bị tâm lý, không có được sự thoải mái khi làm việc; chính sách phúc lợi công ty chưa tốt so với mặt bằng các công ty hiện tại.
C/ Biến là câu hỏi định tính mở
3.1 Tạo cơ sở dữ liệu
Trang 273 Quản lý dữ liệu trong SPSS
Bước 1: liệt kê câu trả lời thành các ý nhỏ
Người 1: cải thiện máy lạnh; đào tạo nhân viên.
Người 2: cải thiện ghế làm việc; hỗ trợ nhân viên học tập; tăng cường teambuilding; thưởng cuối năm thấp.
Người 3: xem xét lại cách giám sát của quản lý; cải thiện chính sách phúc lợi.
C/ Biến là câu hỏi định tính mở
3.1 Tạo cơ sở dữ liệu
Trang 283 Quản lý dữ liệu trong SPSS
D/ Biến là câu hỏi thứ tự xếp hạng
Câu hỏi thu thập thông tin xếp hạng các tiêu chí có sẵn từ đánh giá của người được khảo sát.
o Số biến: Bao nhiêu đáp án cần xếp hạng sẽ cần bấy nhiêu biến.
o Giá trị (Values): Bằng với số biến, có bao nhiêu thứ tự cần xếp hạng sẽ có
tương ứng bấy nhiêu giá trị.
o Thang đo (Measure): Thường là Ordinal.
Ví dụ: Anh/Chị vui lòng xếp hạng thứ tự mức độ yêu thích của mình đối với 3 loại nước giải khát sau đây Yêu thích nhất ghi số 1, yêu thích nhì ghi số 2, yêu thích ba ghi số 3:
Coca Cola: …………; Pepsi: …………; Sting: …………
> Tạo 3 biến: Q1.1 > Q1.3; Type: Numeric; Lable: Mỗi lable tương ứng với 1 thành phần cần xếp hạng; Measure: Ordinal; Values: Gán giá trị các mức xếp hạng Tất cả 3 biến đều gán giống nhau.
3.1 Tạo cơ sở dữ liệu
Trang 293 Quản lý dữ liệu trong SPSS
D/ Biến là câu hỏi thứ tự xếp hạng
3.1 Tạo cơ sở dữ liệu
Trang 303 Quản lý dữ liệu trong SPSS
E/ Biến là câu hỏi định lượng một trả lời
là câu hỏi mà đáp án trả lời sẽ là một con số duy nhất.
o Số biến: Mỗi câu hỏi tương ứng với một biến.
o Giá trị (Values): Không nhập giá trị vào mục Values vì giá trị là các con số tự do
không kiểm soát.
o Thang đo (Measure): Thường là Scale.
Ví dụ: chiều cao, cân nặng, khách hàng đã mua SP,…hoặc các câu hỏi sử dụng thang đo Likert.
3.1 Tạo cơ sở dữ liệu
Trang 31o Các quy tắc đặt tên biến (Variable name)
• Tên phải bắt đầu bằng một chữ
• Độ dài của tên biến không vượt quá 8 ký tự.
• Tên biến không được kết thúc bằng dấu chấm.
• Dấu cách và các ký tự đặc biệt (!, ?, ‘ và *) không được sử dụng
• Tên biến phải duy nhất (không được trùng lặp), phân biệt chữ
trong tên biến Các tên NEWVAR, NewVar và newvar được xem
Trang 32PHIẾU ĐIỀU TRA
Họ và tên: Nguyễn Văn Minh
Giới tính:
Năm sinh
Trình độ:
Thu nhập bình quân 1 tháng: 30 triệu VNĐ
Câu 1: Ông/bà vui lòng cho biết nguyên nhân nào ông bà lựa chọn cho con học tại trường?
Chất lượng đào tạo của nhà trường Đội ngũ giảng viên của Nhà trường giỏi chuyên môn và nhiệt huyết Các ngành nghề đào tạo trong trường phù hợp với năng lực và sở thích của con
Cơ sở vật chất của nhà trường khang trang, trang thiết bị dạy học hiện đại.
Câu 2: Ông/bà đánh giá như thế nào về chất lượng phục vụ của đội ngũ cán bộ nhân viên nhà trường:
1 Sơ cấp 2 Cao đẳng 3 Đại học 4 Thạc sĩ 5 Tiến sĩ
Tiêu chí Rất không hài lòng (1) Không hài lòng (2) Bình thường (3) Hài lòng (4) Rất hài lòng (5)
Trang 33THỰC HÀNH KHAI BÁO BIẾN TRÊN SPSS
Trang 343 Quản lý dữ liệu trong SPSS 3.3 Tạo cơ sở dữ liệu từ file Excel
Trang 353 Quản lý dữ liệu trong SPSS 3.3 Tạo cơ sở dữ liệu từ file Excel
Trang 363 Quản lý dữ liệu trong SPSS 3.3 Tạo cơ sở dữ liệu từ file Excel
Trang 373 Quản lý dữ liệu trong SPSS 3.4 Tạo lập font tiếng việt trong SPSS
Chỉnh sang font tiếng Việt ở cửa sổ Data View và cửa sổ kết quả Output
Màn hình Data View
- Chọn Menu: View > Fonts
- Chọn font Time New Roman trong vùng Font
- Thay đổi kiểu chữ (Font Stype) và cỡ chữ (Size) > Ok
Màn hình Output
- Chọn Menu: Edit > Options > Pivot Tables
Trong phần TableLook, tìm và chọn Time New Roman
- Nhấn Set TableLook Directory, nhấn Apply > OK
Trang 383 Quản lý dữ liệu trong SPSS 3.5 Tạo biến mới
Trong nhiều trường hợp cần phải tính toán những biến mới dựa trên các biến đã có để đạt được mục đích xử lý dữ liệu > Dùng lệnh Transform > Compute variable
Tạo biến mới bằng biểu thức
(Numeric Experesion - Phép tính, hàm)
Tạo biến mới thỏa mãn điều kiện
(if)
Trang 393 Quản lý dữ liệu trong SPSS 3.5 Tạo biến mới
Các phép toán và hàm sử dụng phổ biến trong SPSS
Trang 403 Quản lý dữ liệu trong SPSS 3.5 Tạo biến mới
HƯỚNG DẪN THỰC HÀNH TẠO BIẾN MỚI
Trang 413 Quản lý dữ liệu trong SPSS 3.6 Mã hóa lại biến
o Có quá nhiều giá trị gây khó khăn cho các phép
thống kê.
o Muốn giảm số biểu hiện của một biến định tính
xuống còn 2, 3 loại biểu hiện cơ bản.
o Chuyển biến định lượng thành một biến định
tính.
Trang 423 Quản lý dữ liệu trong SPSS 3.6 Mã hóa lại biến
o Transform > Recode into Different Variables…
Trang 433 Quản lý dữ liệu trong SPSS 3.6 Mã hóa lại biến
o Đưa biến cần mã hóa từ khung bên trái vào hộp Input Variable >
Output Variable
Trang 443 Quản lý dữ liệu trong SPSS 3.6 Mã hóa lại biến
o Nhập tên biến mới vào ô Name; nhãn cho biến mới vào Lablel >
Change > Old and new values
Trang 453 Quản lý dữ liệu trong SPSS 3.6 Mã hóa lại biến
o Cửa sổ Old and new values cho phép chuyển đổi giá trị cũ sang giá trị mới
Trang 463 Quản lý dữ liệu trong SPSS 3.6 Mã hóa lại biến
Trang 473 Quản lý dữ liệu trong SPSS 3.6 Mã hóa lại biến
Khai báo Value cho biến DoTuoi
Trang 483 Quản lý dữ liệu trong SPSS 3.7 Làm sạch dữ liệu
o Dữ liệu sau khi nhập xong chưa thể đưa ngay vào để xử lý và
thực hiện các phân tích thống kê vì có thể còn nhiều lỗi do:
▪ Chất lượng của phỏng vấn: PV viên hiểu sai, thu thập sai, ghi
nhầm,
▪ Nhập số liệu bị sai sót, thiếu, thừa,
▪ Đáp viên trả lời qua loa, không hoàn thành phiếu khảo sát,…
o Ngăn ngừa:
▪ Thiết kế bảng hỏi rõ ràng, logic, dễ hiểu, dễ trả lời.
▪ Chọn lọc và huấn luyện PVV kỹ, điều tra phỏng vấn thử trước
khi phỏng vấn thật để thống nhất tránh sai sót.
▪ Các bảng hỏi sau khi PV phải được đọc soát lỗi, chỉnh sửa trước
khi nhập.
Trang 493 Quản lý dữ liệu trong SPSS 3.7 Làm sạch dữ liệu
Phương pháp làm
sạch dữ liệu
Dùng bảng tần số Dùng bảng phối hợp hai hay ba biến
Trang 503 Quản lý dữ liệu trong SPSS 3.7 Làm sạch dữ liệu
o Làm sạch dữ liệu bằng bảng tần số:
▪ Kết xuất bảng tần số cho tất cả các biến, đọc soát để tìm các giá
trị lạ ở các biến Sau đó, tại các biến dùng lệnh Find để tìm ra lỗi
ở từng trường hợp cụ thể và chỉnh sửa.
▪ Ưu điểm: Đơn giản, dễ thực hiện.
▪ Nhược điểm: thủ công, phát hiện ít lỗi, chỉ phù hợp với các
bảng hỏi đơn giản.
Trang 513 Quản lý dữ liệu trong SPSS 3.7 Làm sạch dữ liệu
Hướng dẫn trên phần mềm SPSS
Trang 523 Quản lý dữ liệu trong SPSS 3.7 Làm sạch dữ liệu
o Data > Select Cases… >If condition
is satisfied > If…
o Gõ hàm GioiTinh=3 (Gioitinh là tên
biến)
Trang 533 Quản lý dữ liệu trong SPSS 3.7 Làm sạch dữ liệu
o Quay lại Data View > xuất hiện biến mới Filter$ > nhấn chuột phải > Sort Descending.
Trang 543 Quản lý dữ liệu trong SPSS 3.7 Làm sạch dữ liệu
o Làm sạch dữ liệu dung bảng phối hợp hai hay ba biến:
▪ Kế xuất bảng kết hợp hai biến (sử dụng Crosstabs hoặc Custom
Tables) dựa vào các quan hệ hợp lý (logic) để phát hiện lỗi.
➢ Dùng lệnh Data > Select cases để lọc ra các trường hợp có lỗi.
➢ Kết xuất bảng tần số đối với biến STT (số thứ tự của phiếu
nhập) để tìm ra các trường hợp bị lỗi.
▪ Ưu điểm: Phát hiện được nhiều lỗi hơn, phù hợp với các bảng
câu hỏi phức tạp.
▪ Nhược điểm: Phức tạp, cần nhiều thời gian, người thực hiện
cần nhiều kinh nghiệm.
Hướng dẫn trên phần mềm SPSS