Tin học ứng dụng - SPSS 19CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS 1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến 4- Số thứ tự các
Trang 11
6
Một số xử lý trên biếnLàm sạch dữ liệu
Tóm tắt và trình bày dữ liệu
5 CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
Trang 2Tin học ứng dụng - SPSS 3
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
1- Giới thiệu về SPSS
Viết tắt Statistical P ackage for the S ocial S ciences.
SPSS cung cấp một hệ thống quản lý dữ liệu và phân tích thống
kê trong một môi trường đồ họa
Dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng biểu, báo cáo được trình bày đẹp, linh hoạt
Thông thường một qui trình nghiên cứu bao gồm 8 bước, SPSS phục vụ cho bước thứ 7 (Xử lý, phân tích và diễn giải các dữ liệu
đã được xữ lý)
Thông qua SPSS: Dữ liệu thô → Thông tin → Sự kiện → Tri thức
Trang 3Làm quen với SPSS 3
Tài liệu học tập: Slide bài giảng
Tài liệu tham khảo:
Phân tích dữ liệu nghiên cứu với SPSS – Hoàng Trọng &
Chu Nguyễn Mộng Ngọc (ĐHKT TPHCM-2008)
1- Giới thiệu về SPSS (tt)
Trang 4Tin học ứng dụng - SPSS 7
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: u:
Trước khi nhập liệu và xử lý dữ liệu → cần hiểu rõ các loại dữliệu và tính chất của từng loại dữ liệu
Dữ liệu nghiên cứu có thể chia thành 2 loại chính là địịịịnh tđnh tnh tíííínhnh
vàđđịịịịnh lưnh lưnh lượợợngng, được thu thập bằng 4 thang đo cơ bản:
Dữ liệu
Dữ liệu
Thang đo danh nghĩa Thang đothứ bậc khoảng cáchThang đo Thang đotỷ lệ
Trang 5Làm quen với SPSS 5
Các phép toán thống kê dùng cho dữ liệu định tính cónhững đặc điểm khác với phép toán dùng cho dữ liệu định lượng
• Phản ánh mức độ, mức độ hơn kém, tính được trị trung bình Nó thể hiện bằng con số.
• Ví dụ: Độ tuổi, thu nhập, …
• Phản ánh tính chất, sự hơn kém, không tính được trị trung bình.
CCÁÁC LO C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
Thang đo là công cụ dùng để quy ước (mã hóa) các tình trạng hay mức độ của các đơn vị khảo sát theo các đặc trưng được xem xét Ví dụ: tình trạng hôn nhân, mức hộ hài lòng về một vấn đề nào đó
Để dễ dàng thực hiện xử lý trên máy tính thì việc mã hóa thường được thực hiện bằng ký số thay vì ký tự
Có 4 loại thang đo cơ bản
Trang 6Tin học ứng dụng - SPSS 11
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)
CCÁÁC LO C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
• Thang đo danh nghĩa (Nominal scale): trong thang đo này
các con số chỉ dùng để phân loại các đối tượng, nó không mang ý nghĩa nào khác
Ví dụ: “Vui lòng cho biết tình trạng hôn nhân của bạn hiện nay?”
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)
CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
• Thang đo thứ bậc (Ordinal scale): các con số ở thang đo danh nghĩa được sắp xếp theo một quy ước nào đó về thứ bậc hay sự hơn kém, nhưng không biết khoảng cách giữa chúng Bất cứ thang đo thứ bậc nào cũng là thang đo danh nghĩa, nhưng không thể suy ngược lại
Ví dụ: “Bạn hài lòng như thế nào về mùi của sản phẩm Snack Khoai tây chiên mà bạn vừa dùng thử?”
Hài lòng Bình thường Không hài lòng
3 2 1
Số 3 có mức độ hài lòng cao hơn số 2 hoặc số 1 nhưng không biết cao hơn gấp mấy lần, cao hơn nhiều hay ít
Trang 7Làm quen với SPSS 7
• Thang đo khoảng (Interval scale): là một dạng đặc biệt của thang đo thứ bậc vì nó cho biết được khoảng cách giữa các thứ bậc, nó có dạng một dãy các chữ số liên tục và đều đặn, 2 đầu của dãy số thể hiện 2 trạng thái đối nghịch nhau.
Ví dụ: Theo bạn tầm quan trọng của các yếu tố sau đây như thế nào đối với cuộc sống của một người?(1=không quan trọng, 5=rất quan trọng)
Không quan trọng Rất quan trọng
Phép toán thống kê có thể sử dụng thêm cho loại thang đo này so với 2 loại thang đo trước là: tính khoảng biến thiên, số trung bình, độ lệch chuẩn.
2- Phân loại và mã hóa dữ liệu
2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)
CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:
• Thang đo tỷ lệ (Ratio scale): có tất cả các đặc tính khoảng cách và thứ tự của thang đo khoảng, ngoài ra có thể thực hiện được phép toán
Tuy nhiên SPSS gộp chung 2 loại thang đo khoảng và tỷ lệ thành một gọi
là Scale Measures (thang đo mức độ).
Trang 8Tin học ứng dụng - SPSS 15
2.2- Mã hóa dữ liệu
Khi nhập dữ liệu mà dữ liệu không phải là ký số như
“nữ” hay “sinh viên” thì cần phải được tạo ra một con
số mã hóa cho dữ liệu đó.
Lưu ý: chỉ mã hóa thông tin thu thập thuộc dữ liệu định tính, còn các thông tin thu nhập thuộc dữ liệu định lượng đã ở dưới dạng số và có ý nghĩa nên không cần
mã hóa.
2.2- Mã hóa dữ liệu (tt)
Nữ: 2 Nam: 1
10 3 11
… 14
Trang 92 Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại trên?
Rất không hài lòng 1 2 3 4 5 Rất hài lòng
3 Chi tiêu trung bình một tháng cho việc gọi điện thoại di động ……….ngàn đồng
4 Bạn theo dõi thông tin về các loại điện thoại mới như thế nào?
Không bao giờ (1) Ít khi (2)
Thỉnh thoảng (3) Thườ ng xuyên (4)
5 Bạn thường sử dụng tính năng nào
Nghe - gọi Tin nhắn Nghe nhạc
Quay phim, chụp hình Games Khác
Câu hỏi nhiều trả lời (MA)
mã hóa như thế nào ???
Trang 10Tin học ứng dụng - SPSS 19
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến
4- Số thứ tự các dòng 5- Data View (cửa sổ nhập liệu và thể hiện dữ liệu), Variable View (cửa sổ khai báo biến)
3.1- Khai báo biến
Trang 11Làm quen với SPSS 11
Name: tên biến, ký tự liên tục, không có khoảng trắng, cần đặt tên biến có độ dài không quá 8 ký tự hay ký số, không có
ký tự đặt biệt và không được bắt đầu bằng một ký số Thông thường tên biến được đặt gần với câu hỏi mà biến đó
mô tả, VD: câu hỏi 1 → c1.
Type: kiểu biến, mặc định là kiểu định lượng (Numeric), muốn thay đổi kiểu biến thì nhấn chuột vào nút … trong ô Type để mở hợp thoại Type.
Trang 13Làm quen với SPSS 13
Label: nhãn biến (là tên đầy đủ của biến, sẽ hiển thị trong báo cáo thống kê và biểu đồ)
Values: giá trị mã hóa dữ liệu, đây là thuộc tính quan trọng nhất Nhấp chuột vào nút … để nhập giá trị mã hóa.
Trang 14Khi gặp câu hỏi mà những người được điều tra vì lý do tế nhị họ đã từ chối trả lời (VD: thu nhập, trình độ học vấn, …) thì trong Value label ta quy ước giá trị 99 có nhãn là “không trả lời”.
Sau đó sang Missing ta phải khai báo 99 là giá trị khuyết để khi tính toán các lệnh thống kê, máy sẽ loại giá trị khuyết này ra.
Lu ý:Cách đặt số đại diện cho Missing value là tùy vào câu hỏi thực tế, VD đặt số 99 cho Missing value là biến độ tuổi sẽ gây nhầm lẫn nếu cuộc điều tra có những người
Trang 15Làm quen với SPSS 15
Columns: khai báo độ rộng của cột biến khi ta nhập liệu, thường chọn
là 8
Align: vị trí dữ liệu được nhập trong cột, thường chọn là Right
Trang 16Tin học ứng dụng - SPSS 31
Measure: loại thang đo của dữ liệu, Ordinal (thang đo thứ bậc), Nominal (thang đo danh nghĩa) và Scale (gồm
cả Interval-khoảng và Ratio-tỷ lệ).
Lưu ý:
- Nhập mỗi cột là một biến
- Mỗi dòng là dữ liệu thu thập được từ một mẩu phỏng vấn
- Có thể dùng chức năng Copy/Paste để sao chép dữ liệu từ
chương trình Excel sang SPSS Ngoài ra, SPSS cũng cho phép import dữ liệu từ file xls có sẵn bằng cách vào File >
Open > Data…> Chọn tập tin đuôi *.xls.
3.2- Nhập liệu
Trang 174.1- Mã hóa lại biến (Recode)
Bin đã đc mã hóa ri ti sao phi mã hóa li ?
Khi chúng ta muốn giảm số biểu hiện của một biến định tính xuống còn 2 hay 3 biểu hiện cơ bản
Ví dụ: với biến về trình độ chuyên môn
1.Tiến sĩ, 2.Thạc sĩ, 3.Đại học, 4.Cao đẳng, 5.Trung cấp, 6.Sơ cấp
Bạn có thể mã hóa lại biến này bằng cách gom chung biểu hiện 1
và 2 thành một nhóm chung là “Trên đại học”, gom biểu hiện 4,5
và 6 thành nhóm “Dưới đại học”
Trang 18Tin học ứng dụng - SPSS 35
4.1- Mã hóa lại biến (Recode) (tt)
Bin đã đc mã hóa ri ti sao phi mã hóa li ? (tt)
Khi chúng ta muốn chuyển 1 biến định lượng có quá nhiều giá trịthành 1 biến định tính
Ví dụ: với biến định lượng là tuổi, điều tra 1000 người cho biết họ có tuổi từ 20 đến 60 Như vậy chúng ta sẽ có 40 độ tuổi.
Nếu liệt kê ra thì bảng tần số của biến tuổi sẽ dài đến 40 hàng nên ít có ý nghĩa trong việc tóm tắt và trình bày Do đó biến này cần được mã hóa lại thành một số nhóm giá trị giúp việc trình bày ngắn gọn và dễ dàng hơn
Chúng ta có thể mã hóa biến này lại thành những nhóm tuổi như sau: (20-30), (31-40), (41-50), (51-60)
Quy trình thực hiện việc mã hóa lại biến
1 Vào menu Transform>Recode into Different Variables mở hộp thoại
Recode into Different Variables, lệnh Recode tạo 1 biến mới với các giátrị mã hóa do bạn khai báo trên cở sở biến gốc, còn biến cũ vẫn được giữ lại
Nếu chọn Recode into Same Variables thì lệnh Recode sẽ làm mất
đi biến cũ và tạo ra 1 biến mới với các biểu hiện vừa được mã hóa
4.1- Mã hóa lại biến (Recode) (tt)
Trang 19Quy trình thực hiện việc mã hóa lại biến (tt)
3 Trong Output Variable cần đặt tên và nhãn cho biến mới, ví dụ Name:
tuoiMHL và Label: Tuổi đã được mã hóa lại Sau đó nhấp nút change
để mã hóa biến tuoi->tuoiMHL Lu ý không đc quên nhp nút change.
4.1- Mã hóa lại biến (Recode) (tt)
Trang 20Tin học ứng dụng - SPSS 39
Quy trình thực hiện việc mã hóa lại biến (tt)
4 Nhấp nút Old and New Values… để mở hộp thoại xác định sự chuyển đổi giữa giá trị cũ và giá trị mới tương ứng
Lần lược khai báo giá trị cũ (Old Value bên tay trái) tương ứng với từng giá trị mới (New Value bên tay phải)
4.1- Mã hóa lại biến (Recode) (tt)
Giá trị khuyết của hệ thống
Giá trị khuyết của hệ thống hoặc do người dùng định nghĩa
Một khoảng giá trị cũ ứng với 1 giá trị mới
Khoảng từ giá trị nhỏ nhất đến 1 giá trị xác định được nhập vào
Khoảng từ 1 giá trị xác định được nhập vào đến giá trị lớn nhất
Từng giá trị cũ rời rạc ứng với 1 giá trị mới
Quy trình thực hiện việc mã hóa lại biến (tt)
5 Xác định xong các giá trị nút Continue để trở về hộp thoại trước đó
Chọn OK để thực hiện lệnh mã hóa lại, lúc đó sẽ xuất hiện 1 biến mới
là tuoiMHL .
4.1- Mã hóa lại biến (Recode) (tt)
Biến mới vừa được tạo do
Recode lại biến tuoi
Trang 21Làm quen với SPSS 21
không khai báo các nhãn giá trị thì khi lập bảng tần số cho biến
tuoiMHL, SPSS sẽ truy xuất ra các con số 1, 2, 3, 4 chứ không truy
xuất ra các biểu hiện (20-30), (31-40), … của biến tuoiMHL
4- Một số xử lý trên biến (tt)
4.2- Chuyển một biến dạng Category thành dạng Dichotomy
Category là biến phân loại có thể có nhiều trị số mã hóa tượng trưng cho nhiều trạng thái, biểu hiện khác nhau
Ví dụ: Đạo Phật, đạo Thiên chúa, đạo Tin lành, đạo Hòa hảo, …
Dichotomy là biến phân loại chỉ có 2 trị số mã hóa tượng trưng cho 2 trạng thái hay 2 biểu hiện khác nhau
Ví dụ: Nam hay nữ, đồng ý hay không đồng ý, có đọc báo An Giang hay không đọc báo An Giang,
Vì sao cần phải chuyển 1 biến dạng Category→Dichotomy ?
Trang 22Tin học ứng dụng - SPSS 43
4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)
Đối với câu hỏi nhiều trả lời (MA) có thể mã hóa và nhập liệu theo cả
2 kiểu biến này Mã hóa và nhập liệu theo kiểu category dễ thực hiện hơn, tuy nhiên khi phân tích sâu thì kiểu biến dichotomy có nhiều lợi thế hơn
Do vậy người ta thường nhập liệu theo kiểu category, sau đó khi cần phân tích sâu thì chuyển sang dạng dichotomy
Ví dụ: với câu hỏi về các loại báo mà CBCC AG thường đọc, người được hỏi có thể nhắc đến nhiều loại báo khác nhau như: Tuổi Trẻ, Thanh Niên, An Giang, Pháp Luật, Công An, SGGP, An Ninh, …Giả sử thông tin về các loại báo thường đọc được thể hiện trong 5 biến (1-5) Nhà nghiên cứu muốn biết báo AG được đọc thường xuyên đến đâu dựa trên số liệu điều tra được, nhưng lựa chọn đọc báo AG nằm rải rác trong các biến từ 1-5 làm sao đếm được?
4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)
Ví dụ: (tt)
Khi đó chúng ta sẽ tạo 1 biến mới với 2 biểu hiện (biến Dichotomy): biểu hiện 1 là người có đọc báo AG, biểu hiện 0 là người không đọc báo AG
Sau đó đếm tần số xuất hiện số 1 sẽ biết được số người có đọc báo AG và số người không đọc báo AG
Cách thực hiện:
1
Trang 23Làm quen với SPSS 23
2 Khai báo tên biến Dichotomy muốn tạo trong khung Target Variable
và nhãn biến trong khung Target Label
Trang 245 Nhập số 3 (là số được mã hóa cho báo AG trong các biến từ
c1a1-c1a5) vào khung Value rồi bấm nút Add để đưa nó sang khung
Trang 257 Cửa sổ Variable View có thêm 1 biến mới tên là docBAG, biến này
nhận giá trị 1 (có đọc báo AG) và 0 (không đọc báo AG)
Trang 26Tin học ứng dụng - SPSS 51
4.3- Thủ tục Compute
Sử dụng để tính toán giá trị biến mới từ các biến có sẵn
Transform > Compute Variable…
4- Một số xử lý trên biến (tt)
(Xem tài liệu tham khảo Page 35-41)
CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS
Trang 27Click to add Title
Click to add Title
3
N Ộ I DUNG
Click to add Title
Click to add Title
1 5 Xử lý câu hỏi có thể chọn nhiều trả lời - MA
Click to add Title
Trang 28Hộp thoại Frequencies xuất hiện, Chọn các biến cần tính và đưa vào khung Variable(s)
Trang 29Làm quen với SPSS 29
Chỉ được tính đối với các biến định lượng, nếu tính các đại lượng này đối với các biến định tính thì kết quả sẽ không có ý nghĩa
VD: - Tính trung bình giới tính → vô nghĩa
- Tính trung bình chi tiêu → có ý nghĩa Cách thực hiện:
1.Từ thanh Menu chọn
Analyze Descriptive Statistics Descriptives…
Trang 306.2- Các đại lượng thống kê mô tả (tt)
1 Nhấp đôi chuột vào bảng kết quả
2 Vào menu Pivot chọn Transpose Rows and Columns
Trang 31Làm quen với SPSS 31
Trong thực tế ít khi dùng lệnh tính toán các đại lượng thống kê riêng lẻ
mà thường kết hợp vừa lập bảng tần số vừa tính toán các đại lượng thống kê mô tả(chỉ áp dụng đối với biến định lượng)
Trang 32Bar: biểu đồ dạng thanh (dùng cho biến
có các giá trị rời rạc, biến của dữ liệu định tính)
Pie: biểu đồ hình tròn (hay dùng cho việc
mô tả cấu trúc hiện tượng)
Histograms: biểu đồ phân phối tần sốdùng cho biến của dữ liệu liên tục
Sau khi chọn loại biểu đồ → Continue
Trang 34Tin học ứng dụng - SPSS 67
6.4.2- Bảng kết hợp biến định tính với biến định lượng
Bảng kết hợp 1 biến định tính & 1 biến định lượng
VD: Muốn biết thu nhập trung bình của Hà Nội và TPHCM
Cách thực hiện:
6.4- Lập bảng tổng hợp nhiều biến
6.4.2- Bảng kết hợp biến định tính với biến định lượng (tt)
Bảng kết hợp 2 biến định tính & 1 biến định lượng
VD: Muốn biết thu nhập trung bình của Hà Nội và TPHCM theo từng nhóm tuổi
Cách thực hiện:
6.4- Lập bảng tổng hợp nhiều biến
Trang 36Tin học ứng dụng - SPSS 71
6.5- Xử lý câu hỏi có thể chọn nhiều trả lời (Multiple Answer-MA)
Đối với câu hỏi MA chúng ta ghép các biến lại với nhau để tổng hợp thông tin về câu hỏi
Cách thực hiện:
Chọn các biến cần ghép đưa vào đây
Chọn vào đây vì biến
có nhiều biểu hiện
Đặt tên và nhãn cho biến ghép
Biến ghép đã được định nghĩa
Trang 37Làm quen với SPSS 37
Thực hiện kết hợp biến với biến ghép mới được định nghĩa
6.6- Trình bày kết quả bằng đồ thị
6.6.1- Các loại đồ thị cơ bản của SPSS
Biểu đồ thanh Bar: được sử dụng biểu diễn dữ liệu dưới dạng tần sốhay tần suất%
Biểu đồ hình tròn Pie: thường sử dụng biểu diễn dữ liệu định tính dạng tần số hay % khi chỉ có ít nhóm
Đồ thị đường gấp khúc (Line) và diện tích (Area): áp dụng tốt cho dữliệu định lượng
Cách to dng và hiu ch nh các loi đ th trên trong SPSS khá
ging nhau → ch cn nghiên cu 1 loi đ th → các đ th còn li tơng t.