Tin học ứng dụng - SPSS 19CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS 1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến 4- Số thứ tự các
Trang 1Tin học ứng dụng - SPSS 1 CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
Trang 2Tin học ứng dụng - SPSS 3
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
1- Giới thiệu về SPSS
Viết tắt S tatistical P ackage for the S ocial S ciences.
SPSS cung cấp một hệ thống quản lý dữ liệu và phân tích thống
kê trong một môi trường đồ họa
Dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng biểu, báo cáo được trình bày đẹp, linh hoạt
Thông thường một qui trình nghiên cứu bao gồm 8 bước, SPSS phục vụ cho bước thứ 7 (Xử lý, phân tích và diễn giải các dữ liệu
đã được xữ lý)
Trang 3Tin học ứng dụng - SPSS 5
1- Giới thiệu về SPSS (tt)
Hướng dẫn cài đặt -> xem chi tiết tại đây
Tài liệu học tập: Slide bài giảng
Tài liệu tham khảo:
Phân tích dữ liệu nghiên cứu với SPSS – Hoàng Trọng &
Chu Nguyễn Mộng Ngọc (ĐHKT TPHCM-2008)
1- Giới thiệu về SPSS (tt)
Trang 4Tin học ứng dụng - SPSS 7
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: u:
Trước khi nhập liệu và xử lý dữ liệu → cần hiểu rõ các loại dữliệu và tính chất của từng loại dữ liệu
Dữ liệu nghiên cứu có thể chia thành 2 loại chính là địịịịnh tđnh tnh tíííínhnh
vàđđịịịịnh lưnh lưnh lượợợngng, được thu thập bằng 4 thang đo cơ bản:
Dữ liệu
Dữ liệu
Thang đo danh nghĩa Thang đothứ bậc khoảng cáchThang đo Thang đotỷ lệ
Trang 5Tin học ứng dụng - SPSS 9
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)
Các phép toán thống kê dùng cho dữ liệu định tính cónhững đặc điểm khác với phép toán dùng cho dữ liệu định lượng
• Phản ánh mức độ, mức độ hơn kém, tính được trị trung bình Nó thể hiện bằng con số.
• Ví dụ: Độ tuổi, thu nhập, …
• Phản ánh tính chất, sự hơn kém, không tính được trị trung bình.
CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
Thang đo là công cụ dùng để quy ước (mã hóa) các tình trạng hay mức độ của các đơn vị khảo sát theo các đặc trưng được xem xét Ví dụ: tình trạng hôn nhân, mức hộ hài lòng về một vấn đề nào đó
Trang 6Tin học ứng dụng - SPSS 11
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)
CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
• Thang đo danh nghĩa (Nominal scale): trong thang đo này
các con số chỉ dùng để phân loại các đối tượng, nó không mang ý nghĩa nào khác
Ví dụ: “Vui lòng cho biết tình trạng hôn nhân của bạn hiện nay?”
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)
CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
• Thang đo thứ bậc (Ordinal scale): các con số ở thang đo danh nghĩa được sắp xếp theo một quy ước nào đó về thứ bậc hay sự hơn kém, nhưng không biết khoảng cách giữa chúng Bất cứ thang đo thứ bậc nào cũng là thang đo danh nghĩa, nhưng không thể suy ngược lại
Ví dụ: “Bạn hài lòng như thế nào về mùi của sản phẩm Snack Khoai tây chiên mà bạn vừa dùng thử?”
Hài lòng Bình thường Không hài lòng
3 2 1
Số 3 có mức độ hài lòng cao hơn số 2 hoặc số 1 nhưng không biết cao hơn gấp mấy lần, cao hơn nhiều hay ít
Trang 7Tin học ứng dụng - SPSS 13
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)
CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
• Thang đo khoảng (Interval scale): là một dạng đặc biệt của thang đo thứ bậc vì nó cho biết được khoảng cách giữa các thứ bậc, nó có dạng một dãy các chữ số liên tục và đều đặn, 2 đầu của dãy số thể hiện 2 trạng thái đối nghịch nhau.
Ví dụ: Theo bạn tầm quan trọng của các yếu tố sau đây như thế nào đối với cuộc sống của một người?(1=không quan trọng, 5=rất quan trọng)
Không quan trọng Rất quan trọng
Phép toán thống kê có thể sử dụng thêm cho loại thang đo này so với 2 loại thang đo trước là: tính khoảng biến thiên, số trung bình, độ lệch chuẩn.
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)
CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
• Thang đo tỷ lệ (Ratio scale): có tất cả các đặc tính khoảng cách và thứ tự của thang đo khoảng, ngoài ra có thể thực hiện được phép toán
chia để tính tỷ lệ nhằm mục đích so sánh.
Ví dụ: “Bạn bao nhiêu tuổi?” hay “Thu nhập trung bình mỗi tháng của bạn là bao nhiêu?”
Trang 8Tin học ứng dụng - SPSS 15
2.2- Mã hóa dữ liệu
Khi nhập dữ liệu mà dữ liệu không phải là ký số như
“nữ” hay “sinh viên” thì cần phải được tạo ra một con
số mã hóa cho dữ liệu đó.
Lưu ý: chỉ mã hóa thông tin thu thập thuộc dữ liệu định
tính, còn các thông tin thu nhập thuộc dữ liệu định lượng đã ở dưới dạng số và có ý nghĩa nên không cần
mã hóa.
2.2- Mã hóa dữ liệu (tt)
Nữ: 2 Nam: 1
10 3 11
… 14
Trang 92 Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại trên?
Rất không hài lòng 1 2 3 4 5 Rất hài lòng
3 Chi tiêu trung bình một tháng cho việc gọi điện thoại di động ……….ngàn đồng
2.2- Mã hóa dữ liệu (tt)
Mã hóa trực tiếp trên bảng phỏng vấn.
Trang 10Tin học ứng dụng - SPSS 19
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến
4- Số thứ tự các dòng 5- Data View (cửa sổ nhập liệu và thể hiện dữ liệu), Variable View (cửa sổ khai báo biến)
3.1- Khai báo biến
Trang 11Tin học ứng dụng - SPSS 21
Name: tên biến, ký tự liên tục, không có khoảng trắng, cần đặt tên biến có độ dài không quá 8 ký tự hay ký số, không có
ký tự đặt biệt và không được bắt đầu bằng một ký số Thông thường tên biến được đặt gần với câu hỏi mà biến đó
mô tả, VD: câu hỏi 1 → c1.
Type: kiểu biến, mặc định là kiểu định lượng (Numeric), muốn thay đổi kiểu biến thì nhấn chuột vào nút … trong ô Type để mở hợp thoại Type.
Trang 13Tin học ứng dụng - SPSS 25
Label: nhãn biến (là tên đầy đủ của biến, sẽ hiển thị trong báo cáo thống kê và biểu đồ)
Values: giá trị mã hóa dữ liệu, đây là thuộc tính quan trọng nhất Nhấp chuột vào nút … để nhập giá trị mã hóa.
Trang 14Khi gặp câu hỏi mà những người được điều tra vì lý do tế nhị họ đã từ chối trả lời (VD: thu nhập, trình độ học vấn, …) thì trong Value label ta quy ước giá trị 99 có nhãn là “không trả lời”.
Sau đó sang Missing ta phải khai báo 99 là giá trị khuyết để khi tính toán các lệnh thống kê, máy sẽ loại giá trị khuyết này ra.
Lu ý:Cách đặt số đại diện cho Missing value là tùy vào câu hỏi thực tế, VD đặt số 99 cho Missing value là biến độ tuổi sẽ gây nhầm lẫn nếu cuộc điều tra có những người đạt 99 tuổi.
Trang 15Tin học ứng dụng - SPSS 29
Columns: khai báo độ rộng của cột biến khi ta nhập liệu, thường chọn
là 8
Align: vị trí dữ liệu được nhập trong cột, thường chọn là Right
Trang 16Tin học ứng dụng - SPSS 31
Measure: loại thang đo của dữ liệu, Ordinal (thang đo thứ bậc), Nominal (thang đo danh nghĩa) và Scale (gồm
cả Interval-khoảng và Ratio-tỷ lệ).
Lưu ý:
- Nhập mỗi cột là một biến
- Mỗi dòng là dữ liệu thu thập được từ một mẩu phỏng vấn
- Có thể dùng chức năng Copy/Paste để sao chép dữ liệu từ
chương trình Excel sang SPSS Ngoài ra, SPSS cũng cho phép import dữ liệu từ file xls có sẵn bằng cách vào File >
Open > Data…> Chọn tập tin đuôi *.xls.
3.2- Nhập liệu
Trang 17Tin học ứng dụng - SPSS 33
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
4- Một số xử lý trên biến4.1- Mã hóa lại biến (Recode)
Bin đã đc mã hóa ri ti sao phi mã hóa li ?
Khi chúng ta muốn giảm số biểu hiện của một biến định tính xuống còn 2 hay 3 biểu hiện cơ bản
Ví dụ: với biến về trình độ chuyên môn
1.Tiến sĩ, 2.Thạc sĩ, 3.Đại học, 4.Cao đẳng, 5.Trung cấp, 6.Sơ cấp
Trang 18Tin học ứng dụng - SPSS 35
4.1- Mã hóa lại biến (Recode) (tt)
Bin đã đc mã hóa ri ti sao phi mã hóa li ? (tt)
Khi chúng ta muốn chuyển 1 biến định lượng có quá nhiều giá trịthành 1 biến định tính
Ví dụ: với biến định lượng là tuổi, điều tra 1000 người cho biết họ có tuổi từ 20 đến 60 Như vậy chúng ta sẽ có 40 độ tuổi.
Nếu liệt kê ra thì bảng tần số của biến tuổi sẽ dài đến 40 hàng nên ít có ý nghĩa trong việc tóm tắt và trình bày Do đó biến này cần được mã hóa lại thành một số nhóm giá trị giúp việc trình bày ngắn gọn và dễ dàng hơn
Chúng ta có thể mã hóa biến này lại thành những nhóm tuổi như sau: (20-30), (31-40), (41-50), (51-60)
Quy trình thực hiện việc mã hóa lại biến
1 Vào menu Transform>Recode into Different Variables mở hộp thoại
Recode into Different Variables, lệnh Recode tạo 1 biến mới với các giátrị mã hóa do bạn khai báo trên cở sở biến gốc, còn biến cũ vẫn được giữ lại
Nếu chọn Recode into Same Variables thì lệnh Recode sẽ làm mất
đi biến cũ và tạo ra 1 biến mới với các biểu hiện vừa được mã hóa
4.1- Mã hóa lại biến (Recode) (tt)
Trang 19Tin học ứng dụng - SPSS 37
Quy trình thực hiện việc mã hóa lại biến (tt)
2 Trong hộp thoại Recode into Different Variables → chọn biến muốn recode đưa sang khung Input Variable -> Output Variable
4.1- Mã hóa lại biến (Recode) (tt)
Quy trình thực hiện việc mã hóa lại biến (tt)
3 Trong Output Variable cần đặt tên và nhãn cho biến mới, ví dụ Name:
tuoiMHL và Label: Tuổi đã được mã hóa lại Sau đó nhấp nút change
để mã hóa biến tuoi->tuoiMHL Lu ý không đc quên nhp nút change.
4.1- Mã hóa lại biến (Recode) (tt)
Trang 20Tin học ứng dụng - SPSS 39
Quy trình thực hiện việc mã hóa lại biến (tt)
4 Nhấp nút Old and New Values… để mở hộp thoại xác định sự chuyển đổi giữa giá trị cũ và giá trị mới tương ứng
Lần lược khai báo giá trị cũ (Old Value bên tay trái) tương ứng với từng giá trị mới (New Value bên tay phải)
4.1- Mã hóa lại biến (Recode) (tt)
Giá trị khuyết của hệ thống
Giá trị khuyết của hệ thống hoặc do người dùng định nghĩa
Một khoảng giá trị cũ ứng với 1 giá trị mới
Khoảng từ giá trị nhỏ nhất đến 1 giá trị xác định được nhập vào
Khoảng từ 1 giá trị xác định được nhập vào đến giá trị lớn nhất
Từng giá trị cũ rời rạc ứng với 1 giá trị mới
Quy trình thực hiện việc mã hóa lại biến (tt)
5 Xác định xong các giá trị nút Continue để trở về hộp thoại trước đó
Chọn OK để thực hiện lệnh mã hóa lại, lúc đó sẽ xuất hiện 1 biến mới
là tuoiMHL .
4.1- Mã hóa lại biến (Recode) (tt)
Biến mới vừa được tạo do
Recode lại biến tuoi
Trang 21Tin học ứng dụng - SPSS 41
Quy trình thực hiện việc mã hóa lại biến (tt)
6 Vào thuộc tính Values để gán các nhãn giá trị cho biến vừa tạo, nếu không khai báo các nhãn giá trị thì khi lập bảng tần số cho biến
tuoiMHL, SPSS sẽ truy xuất ra các con số 1, 2, 3, 4 chứ không truy xuất ra các biểu hiện (20-30), (31-40), … của biến tuoiMHL
4.1- Mã hóa lại biến (Recode) (tt)
4- Một số xử lý trên biến (tt)4.2- Chuyển một biến dạng Category thành dạng Dichotomy
Category là biến phân loại có thể có nhiều trị số mã hóa tượng trưng cho nhiều trạng thái, biểu hiện khác nhau
Ví dụ: Đạo Phật, đạo Thiên chúa, đạo Tin lành, đạo Hòa hảo, …
Dichotomy là biến phân loại chỉ có 2 trị số mã hóa tượng trưng cho 2 trạng thái hay 2 biểu hiện khác nhau
Trang 22Tin học ứng dụng - SPSS 43
4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)
Đối với câu hỏi nhiều trả lời (MA) có thể mã hóa và nhập liệu theo cả
2 kiểu biến này Mã hóa và nhập liệu theo kiểu category dễ thực hiện hơn, tuy nhiên khi phân tích sâu thì kiểu biến dichotomy có nhiều lợi thế hơn
Do vậy người ta thường nhập liệu theo kiểu category, sau đó khi cần phân tích sâu thì chuyển sang dạng dichotomy
Ví dụ: với câu hỏi về các loại báo mà CBCC AG thường đọc, người được hỏi có thể nhắc đến nhiều loại báo khác nhau như: Tuổi Trẻ, Thanh Niên, An Giang, Pháp Luật, Công An, SGGP, An Ninh, …Giả sử thông tin về các loại báo thường đọc được thể hiện trong 5 biến (1-5) Nhà nghiên cứu muốn biết báo AG được đọc thường xuyên đến đâu dựa trên số liệu điều tra được, nhưng lựa chọn đọc báo AG nằm rải rác trong các biến từ 1-5 làm sao đếm được?
4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)
Ví dụ: (tt)
Khi đó chúng ta sẽ tạo 1 biến mới với 2 biểu hiện (biến Dichotomy): biểu hiện 1 là người có đọc báo AG, biểu hiện 0 là người không đọc báo AG
Sau đó đếm tần số xuất hiện số 1 sẽ biết được số người có đọc báo AG và số người không đọc báo AG
Cách thực hiện:
1
Trang 23Tin học ứng dụng - SPSS 45
4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)
Cách thực hiện: (tt)
2 Khai báo tên biến Dichotomy muốn tạo trong khung Target Variable
và nhãn biến trong khung Target Label
4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)
Cách thực hiện: (tt)
3 Đưa các biến từ c1a1 đến c1a5 vào khung Varibles.
Trang 25Tin học ứng dụng - SPSS 49
4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)
Cách thực hiện: (tt)
6 Bấm Continue trở lại hộp thoại chính và OK
4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)
Cách thực hiện: (tt)
7 Cửa sổ Variable View có thêm 1 biến mới tên là docBAG, biến này
nhận giá trị 1 (có đọc báo AG) và 0 (không đọc báo AG)
Trang 26Tin học ứng dụng - SPSS 51
4.3- Thủ tục Compute
Sử dụng để tính toán giá trị biến mới từ các biến có sẵn
Transform > Compute Variable…
4- Một số xử lý trên biến (tt)
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
Trang 27Tin học ứng dụng - SPSS 53
Click to add Title
1 1 Bảng tần số đơn giản
Click to add Title
2 2 Các đại lượng thống kê mô tả
Click to add Title
1 3 Lập bảng tần số, tính toán các ĐLTK mô tả
N Ộ I DUNG
Click to add Title
1 4 Lập bảng tổng hợp nhiều biến
Click to add Title
5- Tóm t ắ t và trình bày d ữ li ệ u
Trang 285.2- Các đại lượng thống kê mô tả
Chỉ được tính đối với các biến định lượng, nếu tính các đại lượng này đối với các biến định tính thì kết quả sẽ không có ý nghĩa
VD: - Tính trung bình giới tính → vô nghĩa
- Tính trung bình chi tiêu → có ý nghĩa Cách thực hiện:
1.Từ thanh Menu chọn
Analyze Descriptive Statistics Descriptives…
5- Tóm t ắ t và trình bày d ữ li ệ u (tt)
Trang 30Tin học ứng dụng - SPSS 59
5.2- Các đại lượng thống kê mô tả (tt)
1 Nhấp đôi chuột vào bảng kết quả
2 Vào menu Pivot chọn Transpose Rows and Columns
5- Tóm t ắ t và trình bày d ữ li ệ u (tt)
5.3- Lập bảng tần số đồng thời tính toán các đại lượng thống
kê mô tả
Trong thực tế ít khi dùng lệnh tính toán các đại lượng thống kê riêng lẻ
mà thường kết hợp vừa lập bảng tần số vừa tính toán các đại lượng thống kê mô tả(chỉ áp dụng đối với biến định lượng)
5- Tóm t ắ t và trình bày d ữ li ệ u (tt)
Trang 31Bar: biểu đồ dạng thanh (dùng cho biến
có các giá trị rời rạc, biến của dữ liệu định tính)
5- Tóm t ắ t và trình bày d ữ li ệ u (tt)
Trang 335.4.2- Bảng kết hợp biến định tính với biến định lượng
Bảng kết hợp 1 biến định tính & 1 biến định lượng
VD: Muốn biết thu nhập trung bình của Hà Nội và TPHCM
Cách thực hiện:
5.4- Lập bảng tổng hợp nhiều biến
Trang 34Tin học ứng dụng - SPSS 67
5.4.2- Bảng kết hợp biến định tính với biến định lượng (tt)
Bảng kết hợp 2 biến định tính & 1 biến định lượng
VD: Muốn biết thu nhập trung bình của Hà Nội và TPHCM theo từng nhóm tuổi
Cách thực hiện:
5.4- Lập bảng tổng hợp nhiều biến
5.4.3- Đổ bảng chéo (phân tích hai biến)
VD: Giới tính có ảnh hưởng đến việc lựa chọn loại ĐTDĐ ?
Cách thực hiện:
5.4- Lập bảng tổng hợp nhiều biến
Mối quan hệ trong mẫu, tổng thể?