Một số phần mềm có chức năng thống kê khác như Microsoft Office Excel, STATA, SAS, Eviews… Các chức năng cơ bản: * Thống kê mô tả Descriptive statistics: tần số Frequencies, các loại bả
Trang 1HƯỚNG DẪN SỬ DỤNG SPSS CHO NGƯỜI MỚI BẮT ĐẦU I/ Giới thiệu về SPSS
SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình
máy tính phục vụ công tác phân tích thống kê SPSS được sử dụng rộng rãi trong công tác thống kê kinh tế - xã hội
Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968 và mới nhất là thế hệ 18 được giới thiệu từ tháng 8 năm 2009, có cả phiên bản cho các hệ điều hành Windows, Mac, vàLinux / Unix
SPSS được sử dụng bởi các nhà nghiên cứu thị trường, nghiên cứu y khoa, công ty điều tra, chính phủ, các nhà nghiên cứu giáo dục và những lĩnh vực khác Một số phần mềm có chức năng thống kê khác như Microsoft Office Excel, STATA, SAS, Eviews…
Các chức năng cơ bản:
* Thống kê mô tả (Descriptive statistics): tần số (Frequencies), các loại bảng số liệu tổng hợp (Cross tabulation, Explore, Descriptive Ratio Statistics)
* Thống kê 2 biến số (Bivariate statistics): trung bình (Means), T-test, ANOVA,
tương quan (bivariate, partial, distances), kiểm định phi tham số (Nonparametric tests)
* Dự báo (Prediction): hồi quy (regression), phân tích nhân tố (Factor analysis),
cluster analysis (two-step, K-means, hierarchical), biệt thức (Discriminant)
Ưu điểm: dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng
biểu, báo cáo được trình bày đẹp, linh hoạt
Tập tin nhập liệu SPSS có đuôi mở rộng sav, tập tin bảng biểu chứa kết quả có đuôi
Trang 23) Enter no serial number and install
4) In the end uncheck "Register with spss.com"
Trang 35) Close License Authorization Wizard
6) Copy content of EQX to install dir
Trang 4Choose “Yes” to replace files
Trang 5Dữ liệu định tính: loại dữ liệu này phản ánh tính chất, sự hơn kém, ta không tính được trị trung bình của dữ liệu dạng định tính
Dữ liệu định lượng: loại dữ liệu này phản ánh mức độ, mức độ hơn kém, tính được trị trung bình
Cần chú ý rằng các phép toán thống kê dùng cho dữ liệu định tính có những đặc điểm khác với phép toán dùng cho dữ liệu định lượng
i) Thang đo danh nghĩa (còn gọi là thang đo định danh hoặc thang đo phân
loại) – nominal scale: trong thang đo này các con số chỉ dùng để phân loại các đối tượng, không mang ý nghĩa nào khác Những phép toán thống kê bạn có thể sử dụng được cho dạng thang đo danh nghĩa là: đếm, tính tần suất của một biểu hiện nào đó, xác định giá trị mode, thực hiện một số phép kiểm định
ii) Thang đo thứ bậc – ordinal scale: lúc này các con số ở thang đo danh nghĩa
được sắp xếp theo một quy ước nào đó về thứ bậc hay sự hơn kém, nhưng
ta không biết được khoảng cách giữa chúng Điều này có nghĩa là bất cứ thang đo thứ bậc nào cũng là thang đo danh nghĩa nhưng rõ ràng bạn không thể suy ngược lại được
iii) Thang đo khoảng – interval scale: là một dạng đặc biệt của thang đo thứ
bậc vì nó cho biết được khoảng cách giữa các thứ bậc Thông thường thang đo khoảng có dạng là một dãy các chữ số liên tục và đều đặn từ 1 đến 5, hay từ 1 đến 10…
Những phép toán thống kê có thể sử dụng thêm cho loại thang đo này so với 2 loại thang đo trước là: tính khoảng biến thiên, số trung bình, độ lệch chuẩn… Cần chú ý là thang đo khoảng tự nó không có điểm 0 được xác định trước, do đó bạn chỉ có thể thực hiện được phép tính cộng trừ chứ phép chia không có ý nghĩa
iv) Thang đo tỉ lệ - ratio scale: thang đo tỉ lệ có tất cả các đặc tính khoảng
cách và thứ tự của thang đo khoảng, ngoài ra điểm 0 trong thang đo khoảng là một trị số “thật” nên ta có thể thực hiện được phép toán chia để tính tỉ lệ nhằm mục đich so sánh
Nói chung với các biến thu thập bằng thang đo khoảng và thang đo tỉ lệ ta có thể
đo lường xu hướng trung tâm bằng trung bình số học Còn xu hướng phân tán đo bằng độ lệch chuẩn, phương sai (khoảng và tứ trung vị ít được sử dụng đến do
Dữ liệu
Thang đo danh nghĩa Thang đo thứ bậc Thang đo khoảng cách Thang đo tỉ lệ
Trang 6kém hữu ích hơn) Vì vậy, SPSS gộp chung hai loại thang đo này thành một gọi là Scale Measures
2 Thu thập dữ liệu
* Các phương pháp thu thập số liệu
a Phỏng vấn trực tiếp (Face to face interview)
- Phỏng vấn tại nhà (Door to door interview)
- Phỏng vấn tại một địa điểm cụ thể (Central location interview)
- Phỏng vấn chặng (Mall – Intercept interview)
b Phỏng vấn qua điện thoại
- Câu hỏi phân đôi (Dichotomous)
Anh/chị có sử dụng điện thoại di động không?
- Câu hỏi liệt kê một lựa chọn (Single response)
Trong số các nhãn hiệu nước ngọt có gaz dưới đây bạn sử dụng thường xuyên nhất nhãn hiệu nào?
- Câu hỏi liệt kê nhiều lựa chọn (Multiple responses)
Bạn đã từng viếng thăm địa điểm nào trong các thành phố dưới đây ở nước Lào?
- Câu hỏi sắp hạng (Ranking)
Trong các yếu tố sau đây anh/chị hãy cho biết mức độ quan trọng nhất, nhì, ba trong việc lựa chọn mua một máy điện thoại?
- Câu hỏi phân mức (Scale)
Theo ý bạn, trong những câu nói sau đây câu nào mô tả đúng nhất về màu sắc của bao bì sản phẩm này?
Trang 7Hãy cho điểm các sản phẩm sau từ 1 đến 10 điểm theo mức độ ưa thích của bạn
- Bước 1: kiểm tra, hiệu chỉnh bảng câu hỏi
- Bước 2: mã hóa dữ liệu trên bảng câu hỏi
Trang 8- Bước 3: nhập dữ liệu vào máy tính
- Bước 4: làm sạch dữ liệu trên máy tính
III/ Khai báo biến và nhập liệu trong SPSS
1 Giao diện
1- Thanh menu chức năng
2- Biểu tượng một số chức năng thông dụng
3- Cột hiển thị tên các biến
2 M ức độ hài lòng chung của bạn khi sử dụng loại điện thoại trên?
Rất không hài lòng 1 2 3 4 5 Rất hài lòng
3 Chi tiêu trung bình m ột tháng cho việc gọi điện thoại di động ……….ngàn đ
4 B ạn theo dõi thông tin về các loại điện thoại mới như thế nào?
Không bao giờ Ít khi Thỉnh thoảng Thường xuyên
5 B ạn thường sử dụng tính năng nào
Trang 9Nghe - gọi Tin nhắn Nghe nhạc Quay phim, chụp hình Games Khác
6 Gi ới tính: Nam Nữ
Khai báo bi ến
i) Name: tên biến, ký tự liên tục, không có khoảng trắng
ii) Type: kiểu dữ liệu, số (numeric), chữ (string)…
iii) Width: độ rộng kiểu dữ liệu, nếu type là string thì width là số ký tự
tối đa iv) Decimals: lượng số thập phân
v) Label: nhãn biến (chú thích cho tên biến)
vi) Values: giá trị mã hóa dữ liệu
vii) Missing: khai báo giá trị khuyết
viii) Columns: độ rộng cột tên biến
ix) Align: vị trí dữ liệu nhập trong cột
x) Measure: loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc),
Nominal (thang đo danh nghĩa), Scale (gồm cả Interval và Ratio)
xi) Role: vai trò của biến
Nh ập liệu
Trang 10* Lưu ý: có thể dùng chức năng Copy/Paste để sao chép dữ liệu từ chương trình Excel
sang SPSS Ngoài ra, SPSS cũng có thể import dữ liệu từ file xls có sẵn bằng cách
vào File > Open > Data…> Chọn tập tin đuôi *.xls
3 Một số xử lý trên biến
Mã hóa l ại biến (Recode)
Vào Transform > Recode into Same Variables… hoặc Recode into Different
Variables…
Trang 111- Chọn biến cần mã hóa và đưa sang vùng lựa chọn
2- Chuyển giá trị cũ sang giá trị mới
3- Điều kiện lọc giá trị (nếu có)
Công c ụ tính toán giữa các biến (Compute)
Transform > Compute Variable… được sử dụng để tính toán các giá trị mới từ các
biến đã có sẵn trong tập dữ liệu, kết quả tính toán thường chứa trong một biến mới hoặc chồng lên một biến khác sẵn có tùy vào thao tác của bạn
Trang 121- Đặt tên biến mới
2- Vùng tính toán
IV/ Phân tích dữ liệu
1 Thống kê mô tả
a Th ống kê mô tả (Descriptive Statistics): sử dụng bảng biểu, biểu đồ - đồ thị để
tóm tắt, diễn đạt dữ liệu nghiên cứu
T ạo bảng tần số
Từ thanh Menu chọn
Analyze Descriptive Statistics Frequencies
Hộp thoại Frequencies xuất hiện, Chọn các biến cần tính và đưa vào khung Variable(s)
Trang 13* Có thể copy bảng tần số sang word hoặc xuất kết quả sang file word/excel
T ạo bảng thống kê mô tả
Cách 1
Descriptive Statistics
N Minimum Maximum Mean Std Deviation chi tieu trung binh mot
thang cho viec goi dien
thoai (ngan dong)
Từ thanh Menu chọn
Analyze Descriptive Statistics Descriptives
Hộp thoại Descriptive xuất hiện, Chọn các biến cần tính và đưa vào khung Variable(s)
Nhấp nút Option nếu muốn tính
thêm các thống kê khác
Trang 14Cách 2
Bạn cũng có thể tính thống kê mô tả bằng cách Chọn Analyze\ Descriptive
Statistics\ Frequencies
- Đưa biến định lượng cần tính thống kê mô tả vào khung Variable(s)
- Nhấp Statistics và đánh dấu chọn các chỉ tiêu cần tính
Đổ bảng chéo (phân tích hai biến): bảng Crosstabs
Trang 15loai dien thoai di dong ma ban su dung chinh * gioi tinh Crosstabulation
Count
gioi tinh
Nu Nam Total Nokia 0 25 25 Samsung 22 6 28 Motorola 27 0 27
loai dien thoai di dong ma
ban su dung chinh
khac 6 6 12
loai dien thoai di dong ma ban su dung chinh * gioi tinh Crosstabulation
% within loai dien thoai di dong ma ban su dung chinh
gioi tinh
Nu Nam Total Nokia 100.0% 100.0%
Samsung 78.6% 21.4% 100.0%
Motorola 100.0% 100.0%
loai dien thoai di dong ma
ban su dung chinh
khac 50.0% 50.0% 100.0%
Total 59.8% 40.2% 100.0%
Từ thanh Menu chọn
Analyze Descriptive Statistics Crosstabs
Hộp thoại Crosstabs xuất hiện, Chọn các biến cần tính đưa vào khung Row(s) và Column(s)
Nhấp nút Cells nếu muốn tính
theo đơn vị phần trăm Lựa chọn
Display clustered bar charts
nếu muốn có thêm đồ thị dạng cột
Trang 16* Lưu ý: biến có nhiều thuộc tính nên đưa vào khung Column(s)
Tính giá tr ị trung bình của 1 biến định lượng phân theo 1 biến định tính
Từ thanh Menu chọn
Analyze Compare Means Means
Đưa biến định lượng vào Dependent list
Đưa biến định tính vào Independent List
Trang 17Report
muc do hai long
loai dien thoai di dong ma
ban su dung chinh Mean N Std Deviation
B ảng tần số cho câu hỏi nhiều lựa chọn
Đối với biến nhiều trả lời: trước khi đổ bảng ta phải tiến hành nhóm các biến chứa
đựng các giá trị trả lời có được (multiple responses)
Bước 1 Khai báo cho biến nhiều lựa chọn
Từ thanh Menu chọn
Analyze Multiple Response Define Variable Sets
Đưa các biến mô tả các thuộc tính của biến định tính vào
Variables in Set
Chọn Dichotomies nếu câu hỏi nhiều lựa chọn được nhập theo cách này, nhập giá trị 1 vào
ô Counted value (nếu 1
là có chọn)
Khai báo Name cho biến, bấm Add
Trang 18Bước 2 Tạo bảng tần số cho biến nhiều lựa chọn
Case Summary
Cases Valid Missing Total
N Percent N Percent N Percent
a Dichotomy group tabulated at value 1
Đổ bảng chéo đối với biến nhiều câu trả lời
Từ thanh Menu chọn
Analyze Multiple Response Frequencies
Chọn biến đã được khai báo và đưa
vào khung Table(s) for
Trang 19$tinhnang*gioi Crosstabulation
gioi tinh
Nu Nam Total nghe _ goi Count 34 25 59 tin nhan Count 37 19 56 nghe nhac Count 43 21 64 quay phim, chup hinh Count 25 18 43 games Count 1 36 37 tinh nang thuong su dunga
Percentages and totals are based on respondents
a Dichotomy group tabulated at value 1
* Lưu ý: SPSS còn hỗ trợ xử lý đối với biến có nhiều câu trả lời trong menu Analyze
> Tables > Multiple Response Sets Thủ tục khởi tạo tương tự như ở trên Mặc dù
bạn đã khởi tạo biến có nhiều câu trả lời bằng cách này thì chức năng Multiple
Response Frequencies và Crosstabs ở trên không thể sử dụng được, thay vào đó
Analyze > Tables > Custom Tables sẽ hỗ trợ và nó được xem như một variable
b Mô t ả dữ liệu bằng đồ thị
Đồ thị Bar dùng để thể hiện thông tin như trung bình, trung vị, tần số tích lũy, tần suất
tích lũy, số quan sát… của biến Nó được sử dụng cho các dữ liệu thu thập bằng các
thước đo định danh, thứ tự, khoảng cách hoặc tỉ lệ với ít giá trị rời rạc
Từ thanh Menu chọn
Analyze Multiple Response Crosstabs
Chọn biến nhiều câu trả lời đưa vào khung Row(s), biến phân loại đưa vào khung Column(s), chú ý khai báo
Define Ranges cho biến phân loại
Trang 20Để tạo đồ thị bạn vào menu Graphs > Legacy Dialogs > Bar Ngoài ra còn nhiều dạng đồ thị khác mà bạn có thể lựa chọn, khám phá
Trang 21Để hiệu chỉnh đồ thị và các bảng biểu chúng ta có thể nhấp đúp chuột trên vùng đồ thị, một cửa sổ Editor sẽ mở ra cho phép bạn thao tác chỉnh sửa, lựa chọn màu sắc, kích thước…
Nếu bạn muốn tự mình xây dựng dạng đồ thị từ mẫu có sẵn thì có thể sử dụng chức
năng Graphs > Chart Builder
* Lưu ý: bạn có thể vẽ đồ thị trong phần tạo bảng tần số (Frequencies) với nút
Charts
2 Thống kê suy diễn
* Thống kê suy diễn (Statistical Inference): sử dụng các thông số của mẫu để ước lượng và kiểm nghiệm các giả thuyết về tổng thể
Phương pháp: dùng các phương pháp kiểm định thống kê để kiểm nghiệm các giả thuyết về tổng thể
- Kiểm định các mối quan hệ - tương quan có ý nghĩa giữa các biến khảo sát
- Kiểm nghiệm sự khác biệt có ý nghĩa giữa các giá trị trung bình
Trang 22Giạ thieẫt sai
B2: Tìm möùc yù nghóa cụa toơng theơ maêu (.sig)
B3: tìm mieăn baùc boû H
0
(α)
B4: Ra quyeât ñònh H
0
neâu sig > α vaø ngöôïc lái
Hệ số ý nghĩa (P-value hay Significant level)
Một số video trực tuyến về SPSS tại youtube.com
1) Introduction to SPSS (part I - http://www.youtube.com/watch?v=msI7xf0tInE, part
4) Xử lý data với SPSS, Nguyễn Duy Tđm
Vă câc tăi nguyín trực tuyến khâc