Bài giảng xử lí số liệu thống kê bằng phần mềm SPSS giúp bạn đọc có khả năng hiểu rõ và cụ thể những vấn đề cơ bản của xử lí số liệu thống kê bằng SPSS.Cách lưu dữ liệu, lập bảng tần số, tần suất, cách vẽ biểu đồ trong SPSS, cách lập bảng hỏi, sử dụng các thang đo trong SPSS
Trang 1BÀI GIẢNG XỬ LÍ SỐ LIỆU THỐNG KÊ BẰNG PHẦN MỀM
SPSS
Trang 2I Tổng quan về SPSS
II Cách mã hóa, nhập và chỉnh sửa dữ liệu
III Một số câu lệnh biến đổi dữ liệu
IV Một số phép phân tích cơ bản và cách đọc kết quả
V Vẽ biểu đồ
Bố cục bài trình bày
Trang 3SPSS là gì?
Ứng dụng của SPSS
Cách mở, tạo và lưu file SPSS
Cửa sổ Variable View, Data View
I Tổng quan về SPSS
Trang 4 SPSS là tên viết tắt của “Statistical Product and Service Solutions”
Năm 1968, Norman H Nie, C Hadlai (Tex) Hull và Dale H Bent đã phát triển SPSS
Hiện nay, SPSS là một trong những phần mềm phân tích số liệu phổ biến và mạnh nhất với trên 250.000 khách hàng trên toàn thế giới
SPSS là gì?
Trang 5- SPSS giúp lưu trữ và quản lý dữ liệu
- SPSS là công cụ hữu hiệu để thực hiện phân tích các số liệu trong khoa học xã hội, khoa học tự nhiên và kinh tế
- SPSS có thể đọc được các file dữ liệu dạng xls, txt, dat, …
1.2 Ứng dụng của SPSS
Trang 6File Save as…
1.3 Cách mở, tạo và lưu file trong
SPSS
Trang 7 Cửa sổ Variable View:
Sử dụng cửa sổ Variable View: Chọn Variable View tab
Biểu diễn các thông tin về biến như tên biến, dạng biến, các giá trị, thang đo
Dùng để mã hóa biến
Các dòng là các biến số
Các cột là các thuộc tính của biến số: ví dụ: tên biến, nhãn biến, kiểu dữ liệu
Có thể chỉnh sửa trực tiếp vào cửa sổ này
1.4 Cửa sổ Data View, Variable View
Trang 8 Cửa sổ Data View:
Sử dụng cửa sổ Data View: Chọn Data View tab
Biểu diễn dữ liệu
Có thể chỉnh sửa trực tiếp vào cửa sổ này
1.4 Cửa sổ Data View,
Variable View
Trang 9 File: thực hiện các chức năng với file như mở, đọc, lưu file,…
Edit: thực hiện các chức năng chỉnh sửa file: copy, paste, tìm kiếm và thay thế
View: có thể thay đổi hình thức hiển thị của dữ liệu Chức năng phố biến nhất là Value Labels
Data: các chức năng định dạng, nhập dữ liệu: sắp xếp, trộn, đặt điều kiện
Transform: thay đổi dạng dữ liệu có sẵn bằng lệnh mã hóa lại biến, tính toán,…
Analyze: thực hiện tất cả các phép phân tích đối với các biến số
Graphs: vẽ biểu đồ
Help: Trợ giúp
1.5 Thanh Menu, Bar
Trang 10II CÁCH MÃ HÓA, NHẬP
VÀ CHỈNH SỬA DỮ LIỆU
Trang 11 Có nhiều tiêu chí phân chia các loại câu hỏi
Một số dạng câu hỏi cần chú ý khi sử dụng SPSS:
Câu hỏi đóng: câu hỏi đã được cho sẵn phương án
Trang 12 Đối với câu hỏi lựa chọn: mã hóa thành một
biến với nhiều phương án trả lời (giá trị)
Đối với câu hỏi tùy chọn: mã hóa mỗi lựa chọn
thành từng biến (từng câu hỏi nhỏ) với các giá trị cho sẵn
Đối với câu hỏi mở: mã hóa thành biến trong đó
phương án trả lời do người nhập ghi theo bảng hỏi
Cách mã hóa một số loại câu hỏi
Trang 13 Bảng hỏi được mã hóa vào cửa sổ Variable View
Khi mã hóa bảng hỏi cần chú ý các yếu tố sau:
Đặt tên biến (Name)
Kiểu dữ liệu (Type)
Độ dài (Width)
Phần thập phân (Decimals)
Nhãn biến (Label)
Giá trị (Values)
Giá trị khuyết thiếu (Missing)
Thang đo (Measure)
2.2 Mã hóa bảng hỏi
Trang 14 Tên biến được nhập trực tiếp vào ô “Name” ở cửa sổ Variable View
Các yêu cầu của tên biến:
Không quá 64 ký tự
Tên biến phải bắt đầu bằng một chữ cái, các ký tự sau đó
có thể là bất kỳ chữ số tự nhiên, số La Mã, dấu chấm, hoặc các ký tự đặc biệt như @, $, _ , #
Không được để dấu cách hoặc các ký tự đặc biệt (? ! ‘ và
*) trong tên biến
Đặt tên biến
Trang 15• Tên biến không được phép trùng lặp
• Tên biến không được kết thúc bằng dấu chấm câu
• Tên biến không nên kết thúc bằng dấu gạch dưới
• Tên biến có thể dùng chữ hoa hoặc chữ thường hoặc cả hai tùy theo mục đích của người sử dụng
• Tên biến thường được đặt theo số câu trong bảng hỏi
Các yêu cầu của tên biến
Trang 16 Các kiểu dữ liệu cơ bản:
Dữ liệu kiểu số (numeric):
Các kiểu dữ liệu khác: số thập phân, ngày tháng,…
Tất cả các biến đều được giả định là dữ liệu kiểu số Người sử dụng có thể vào Type để thay đổi kiểu dữ liệu
Các kiểu dữ liệu
Trang 17 Độ dài của biến (Width):
Quy định độ dài của các biến số được phép nhập vào file SPSS
Tùy thuộc vào độ dài của biến số mà đặt width cho phù hợp
Trang 18 Cụ thể hóa thông tin về biến số
Được nhập trực tiếp vào cửa sổ Variable View
Có thể gõ không dấu hoặc gõ tiếng Việt
Độ dài: tối đa là 256 ký tự
Nhãn biến có thể sử dụng dấu cách và một số ký tự đặc biệt không được sử dụng ở tên biến
Các quy tắc đặt nhãn biến:
Tóm tắt ngắn gọn, đầy đủ nội dung câu hỏi
Lựa chọn những từ khóa quan trọng
Nhãn biến
Trang 19 Dùng để mô tả các giá trị của biến số (các phương
án trả lời của câu hỏi)
Độ dài tên giá trị không quá 60 ký tự
Không thể đặt giá trị cho những biến kiểu chữ dài hơn 8 ký tự
Giá trị
Trang 20 Missing là các giá trị khuyết thiếu trong bảng hỏi
Các loại missing: 2 loại
Missing system:
Là missing do các bước nhảy trong bảng hỏi hoặc do người được hỏi không trả lời
Khi nhập số liệu, missing hệ thống thường được bỏ trống
Missing user – define:
Là missing người điều tra tự đặt do phương án trả lời của người trả lời không phù hợp với thông tin
mà người điều tra mong muốn
Được gán cho một giá trị nào đó
Giá trị khuyết thiếu
Trang 21 Missing có thể là bất kỳ giá trị nào do người sử dụng tự đặt
Đối với các biến liên tục, missing thường được gán giá trị âm hoặc bỏ trống Ví dụ: tuổi, thu nhập,…
Không thể gán giá trị missing cho dữ liệu kiểu chữ dài hơn 8 ký tự
Có thể quy định tối đa 3 giá trị missing độc lập cho một biến số
Trang 22 Đối với các dữ liệu kiểu số: có thể quy định giá trị missing trong một khoảng giá trị nào đó
Đối với dữ liệu kiểu chữ không quá 8 ký tự, tất cả các chữ hoặc các ô trống đều được coi là có giá trị nếu không định nghĩa đó là giá trị missing Để định nghĩa đó là giá trị missing, gõ một dấu cách (a single pace) trong bất kỳ ô nào ở Discrete missing values
Giá trị khuyết thiếu
Trang 23 Có 4 loại thang đo cơ bản: thang định danh, thang khoảng, thang thứ bậc, thang tỷ lệ
Trong SPSS: có 3 loại thang đo: thang định danh, thang thứ bậc, thang tỷ lệ (thang khoảng + thang tỷ lệ)
Thang đo trong SPSS
Trang 24 Thang tỷ lệ:
Các giá trị được sắp xếp theo một trật tự thứ bậc
Các giá trị phải là các chữ số theo dạng khoảng hoặc dạng tỷ lệ
Trang 26 Dữ liệu kiểu chữ được xếp vào thang định danh
Dữ liệu kiểu chữ hoặc kiểu số được gán sẵn cho giá trị được xếp vào thang thứ bậc
Biến liên tục có ít hơn 24 số hạng được xếp vào thang thứ bậc
Biến liên tục có nhiều hơn 24 số hạng được xếp vào thang tỷ lệ
(24 số hạng này là mặc định nhưng vẫn có thể thay đổi tùy theo chủ ý của người sử dụng: Edit Option
Interative)
Một số nguyên tắc lựa chọn thang đo
trong SPSS
Trang 27 Cách nhập dữ liệu:
Chọn cửa sổ Data View
Dữ liệu được nhập trực tiếp vào cửa sổ Data View
Sử dụng Value Labels: xem giá trị khi nhập
Chỉnh sửa dữ liệu nhập sai:
Sửa trực tiếp vào ô chứa giá trị nhập sai tại cửa
sổ Data View
3 Cách nhập và chỉnh sửa dữ liệu
Trang 28 Chèn biến mới: chọn Insert Variable
Data Insert Variable
Chèn thêm trường: chọn Insert Cases
Data Insert Cases
Chèn thêm biến, trường
Trang 29III MỘT SỐ PHÉP BIẾN
ĐỔI DỮ LIỆU
Trang 30 Tác dụng: dùng để sắp xếp các giá trị của một biến theo trật tự tăng hoặc giảm
Câu lệnh:
Data Sort Cases
3.1 Sort Cases
Trang 33 Tác dụng: nối các file SPSS thành một file tổng hợp
Có 2 cách: nối thêm trường (cases) hoặc nối thêm biến (variables).
Yêu cầu:
Nối thêm biến, giữa các file cần có một biến chung và biến này phải được sort theo cùng một trật tự
Nối thêm trường: các file phải chung bảng mã hóa
Câu lệnh: Data Merge Files
Merge File
Trang 35Một số phép phân tích cơ bản
và cách đọc dữ liệu
Trang 36 Mô tả dữ liệu
Tính tương quan giữa các dữ liệu
Mục đích
Trang 37 Tác dụng: khi thực hiện các phép phân tích trong SPSS, cửa sổ output sẽ được sinh ra để lưu kết quả phân tích.
Cửa sổ output có 2 phần: phần bên phải là các lệnh phân tích đã thực hiện, phần bên trái là các bảng, biểu
Lưu file output:
File Save as
Cửa sổ Output
Trang 39 Tác dụng: tính tần suất xuất hiện của từng biến số
Đối tượng: áp dụng cho tất cả các loại biến trừ biến liên tục
Câu lệnh thực hiện:
Analyze Descriptive Statistics Frequency
Cách đọc bảng số liệu
1 Tính tần số
Trang 42 Tác dụng: tính giá trị trung bình của các biến số
Đối tượng : các biến liên tục hoặc thang Likert từ 5 giá trị trở lên.
Câu lệnh: Analyze Descriptive Statistic
Descriptives
Cách đọc số liệu
2 Tính các biến số
Trang 46 Tác dụng: xem xét mối quan hệ giữa các biến (thường là hai biến)
Đối tượng : tất cả các loại biến trừ biến liên tục
Câu lệnh:
Analyze Descriptive Statistics Crosstabs
Cách đọc bảng số liệu
3 Tính tương quan
Trang 50 Tác dụng: tính và so sánh giá trị trung bình của các phương án của một biến
Đối tượng áp dụng: các biến liên tục
Trang 54 Tác dụng: tính tần suất hoặc tương quan cho
nhiều biến số Thường áp dụng cho các câu hỏi tùy chọn.
Có thể tính dạng Tables of Frequency hoặc dạng Multiple Respone Tables
5 Tables
Trang 55 Tác dụng: tính tần suất hoặc tương quan của biến trong các câu hỏi tùy chọn dưới dạng một bảng liệt kê
Câu lệnh:
Analyze Tables Tables of Frequency
Cách đọc bảng số liệu
5.1 Tables of Frequency
Trang 59 Tác dụng: tính tần suất hoặc tương quan của câu hỏi tùy chọn thành một bảng chung Có hai cách tính:
◦ Cộng tất cả các giá trị của các phương án trả lời trong các câu (Catagories)
◦ Tính một giá trị (value) của các phương án trả lời (Dichotomies)
Câu lệnh:
Analyze Tables Multiple Respone Tables
5.2 Multiple Respone Tables
Trang 66 Tác dụng: tính tần suất hoặc tương quan của câu hỏi tùy chọn thành một bảng chung, tương tự như Multiple Respone Tables Tuy nhiên, Multiple Respone cho phép chọn nhiều phương án ở mục Categories.
Đối tượng: các câu hỏi tùy chọn
Câu lệnh: Analyze Multiple Respone
Multiple Respone
Trang 73 Tính các giá trị trung bình
So sánh các giá trị trung bình
Bài tập 4
Trang 74MỘT SỐ PHÉP BIẾN ĐỔI
DỮ LIỆU
Trang 75 Tác dụng: đặt điều kiện để lựa chọn dữ liệu theo nhu cầu của người sử dụng
Câu lệnh:
Data Select Cases If condition
Select Cases
Trang 79 Tác dụng: chia file dữ liệu thành các nhóm nhỏ (theo các giá trị của một biến nào đó) để thực hiện các phép phân tích cho từng nhóm
Câu lệnh: Data Split file
4 Splite file
Trang 82Có hai cách tạo biến mới trên cơ sở biến đã có:
+ Mã hóa lại dữ liệu (recode)
+ Tính toán các dữ liệu (compute
TẠO BIẾN MỚI
Trang 83 Tác dụng: phân chia lại các giá trị của biến đã có theo mục đích mới của người sử dụng
Gồm hai dạng:
◦ Chuyển dữ liệu từ biến liên tục sang biến rời rạc
◦ Chuyển dữ liệu biến rời rạc ở các cấp đo lường khác nhau
Câu lệnh:
Transform Recode Into differrent Variables
Sau khi mã hóa, cần đặt giá trị của biến (Values) trong cửa
sổ Variable View
Có thể đặt thêm điều kiện khi mã hóa lại biến
Recode
Trang 87 Tác dụng: thực hiện các phép tính theo mục đích của người sử dụng
Đối tượng áp dụng: chủ yếu là các biến liên tục hoặc biến được đo bằng thang Likert
Câu lệnh:Transform Compute
Chú ý: có thể tự gõ các phép tính nhưng khi có các giá trị missing, để tránh bị bỏ sót nên sử dụng các hàm function để tính toán
Compute
Trang 90 Tác dụng: tính tần suất xuất hiện của các biến, không quan tâm đến các giá trị của biến.
Đối tượng áp dụng: dùng để tổng hợp ý kiến cho câu hỏi tùy chọn
Câu lệnh: Transform Count…
6 Tần số (Count)
Trang 94 Có 2 cách thay đổi các giá trị của biến:
◦ Sửa trực tiếp:
Sửa trực tiếp trong cửa sổ Variable View
Dùng khi mã hóa sai giá trị hoặc có thêm giá trị mới
◦ Dùng lệnh mã hóa lại biến:
Dùng khi muốn thay đổi các giá trị cũ của biến: chuyển từ biến liên tục sang biến rời rạc, nhóm các giá trị
Câu lệnh: Transform Recode into same variables
Sau khi mã hóa lại biến phải đặt lại giá trị trong cửa sổ Variable View
THAY ĐỔI GIÁ TRỊ CỦA BIẾN
Trang 95 Mã hóa lại biến
Tính toán các giá trị
Thay đổi các giá trị của biến
BÀI TẬP 2
Trang 96 Cách vẽ và chỉnh sửa biểu đồ
Các ứng dụng khác
MỤC ĐÍCH CỦA VẼ BIỂU ĐỒ
Trang 97VẼ BIỂU ĐỒ
Trang 98 Các dạng biểu đồ phổ biến:
- Biểu đồ tròn: biểu thị tỷ lệ, cơ cấu
- Biểu đồ cột: biểu thị tần xuất, tương quan, cơ cấu
- Biểu đồ đường: biểu thị tần xuất, tương quan
- Biểu đồ điểm: biểu thị mối quan hệ giữa hai biến số
- Biểu đồ histogram: mô tả sự phân bố của các biến liên tục
MỘT SỐ DẠNG BIỂU ĐỒ
Trang 99 Vẽ biểu đồ trong Frequency
Vẽ biểu đồ trực tiếp từ số liệu
Vẽ biểu đồ bằng Graphs
Trang 102 Câu lệnh: Nháy đúp vào bảng số liệu Xuất hiện đường viền Bôi đen phần số liệu định vẽ biểu đồ
Chuột phải Create graph
Chỉnh sửa biểu đồ: Nháy đúp vào biểu đồ
Xuất hiện đường viền Chart Manager
Trang 105 Biểu diễn được tần suất, tương quan,…
Vẽ được tất cả các dạng biểu đồ
Câu lệnh: Graphs chọn loại biểu đồ
Chỉnh sửa biểu đồ: Nháy đúp vào biểu đồ
xuất hiện đường viền Chart Editor
Trang 109 Đối với biểu đồ dạng thanh (bar graph): có thể vẽ
3 loại:
◦ Biểu đồ thanh dạng simple
◦ Biểu đồ thanh dạng clustered
◦ Biểu đồ thanh dạng stacked
Trang 110 Tác dụng:
thường dùng
để biểu diễn các giá trị của một biến số
Câu lệnh:
graph bar
simple
Trang 111 Tác dụng: dùng
để biểu diễn các giá trị của các
biến số khác nhau dưới dạng thanh xếp cạnh nhau
Câu lệnh: graph
bar
clustered
Trang 112 Tác dụng: dùng
để biểu diễn các giá trị khác
nhau của các
biến khác nhau dưới dạng cột chồng
Câu lệnh: graph
bar
stacked
Trang 114 Kết quả tính toán trong SPSS có thể chuyển sang một số dạng file khác: word, excel,
html, powerpoint.
Câu lệnh: Bôi đen phần định chuyển rồi
chọn Export.
Trang 117 Tác dụng:
◦ Lưu tiến trình làm việc
◦ Tiết kiệm thời gian khi thực hiện các phép phân tích tương tự nhau
◦ Thực hiện được tất cả các ứng dụng trong SPSS
Mở file syntax: File Open Syntax
Lưu file syntax: File Save as
Thực hiện các lệnh trong syntax với Paste