1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng phân tích dữ liệu nghiên cứu với SPSS

55 466 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 55
Dung lượng 3,35 MB

Nội dung

Tin học ứng dụng - SPSS 19CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS 1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến 4- Số thứ tự các

Trang 1

Tin học ứng dụng - SPSS 1 CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

Trang 2

Tin học ứng dụng - SPSS 3

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

1- Giới thiệu về SPSS

 Viết tắt S tatistical P ackage for the S ocial S ciences.

 SPSS cung cấp một hệ thống quản lý dữ liệu và phân tích thống

kê trong một môi trường đồ họa

 Dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng biểu, báo cáo được trình bày đẹp, linh hoạt

 Thông thường một qui trình nghiên cứu bao gồm 8 bước, SPSS phục vụ cho bước thứ 7 (Xử lý, phân tích và diễn giải các dữ liệu

đã được xữ lý)

Trang 3

Tin học ứng dụng - SPSS 5

1- Giới thiệu về SPSS (tt)

 Hướng dẫn cài đặt -> xem chi tiết tại đây

 Tài liệu học tập: Slide bài giảng

 Tài liệu tham khảo:

Phân tích dữ liệu nghiên cứu với SPSS – Hoàng Trọng &

Chu Nguyễn Mộng Ngọc (ĐHKT TPHCM-2008)

1- Giới thiệu về SPSS (tt)

Trang 4

Tin học ứng dụng - SPSS 7

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: u:

 Trước khi nhập liệu và xử lý dữ liệu → cần hiểu rõ các loại dữliệu và tính chất của từng loại dữ liệu

 Dữ liệu nghiên cứu có thể chia thành 2 loại chính là địịịịnh tđnh tnh tíííínhnh

vàđđịịịịnh lưnh lưnh lượợợngng, được thu thập bằng 4 thang đo cơ bản:

Dữ liệu

Dữ liệu

Thang đo danh nghĩa Thang đothứ bậc khoảng cáchThang đo Thang đotỷ lệ

Trang 5

Tin học ứng dụng - SPSS 9

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)

Các phép toán thống kê dùng cho dữ liệu định tính cónhững đặc điểm khác với phép toán dùng cho dữ liệu định lượng

• Phản ánh mức độ, mức độ hơn kém, tính được trị trung bình Nó thể hiện bằng con số.

• Ví dụ: Độ tuổi, thu nhập, …

• Phản ánh tính chất, sự hơn kém, không tính được trị trung bình.

 CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

 Thang đo là công cụ dùng để quy ước (mã hóa) các tình trạng hay mức độ của các đơn vị khảo sát theo các đặc trưng được xem xét Ví dụ: tình trạng hôn nhân, mức hộ hài lòng về một vấn đề nào đó

Trang 6

Tin học ứng dụng - SPSS 11

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)

 CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

Thang đo danh nghĩa (Nominal scale): trong thang đo này

các con số chỉ dùng để phân loại các đối tượng, nó không mang ý nghĩa nào khác

Ví dụ: “Vui lòng cho biết tình trạng hôn nhân của bạn hiện nay?”

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)

 CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

Thang đo thứ bậc (Ordinal scale): các con số ở thang đo danh nghĩa được sắp xếp theo một quy ước nào đó về thứ bậc hay sự hơn kém, nhưng không biết khoảng cách giữa chúng  Bất cứ thang đo thứ bậc nào cũng là thang đo danh nghĩa, nhưng không thể suy ngược lại

Ví dụ: “Bạn hài lòng như thế nào về mùi của sản phẩm Snack Khoai tây chiên mà bạn vừa dùng thử?”

Hài lòng Bình thường Không hài lòng

3 2 1

 Số 3 có mức độ hài lòng cao hơn số 2 hoặc số 1 nhưng không biết cao hơn gấp mấy lần, cao hơn nhiều hay ít

Trang 7

Tin học ứng dụng - SPSS 13

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)

 CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

Thang đo khoảng (Interval scale): là một dạng đặc biệt của thang đo thứ bậc vì nó cho biết được khoảng cách giữa các thứ bậc, nó có dạng một dãy các chữ số liên tục và đều đặn, 2 đầu của dãy số thể hiện 2 trạng thái đối nghịch nhau.

Ví dụ: Theo bạn tầm quan trọng của các yếu tố sau đây như thế nào đối với cuộc sống của một người?(1=không quan trọng, 5=rất quan trọng)

Không quan trọng Rất quan trọng

 Phép toán thống kê có thể sử dụng thêm cho loại thang đo này so với 2 loại thang đo trước là: tính khoảng biến thiên, số trung bình, độ lệch chuẩn.

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)

 CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

Thang đo tỷ lệ (Ratio scale): có tất cả các đặc tính khoảng cách và thứ tự của thang đo khoảng, ngoài ra có thể thực hiện được phép toán

chia để tính tỷ lệ nhằm mục đích so sánh.

Ví dụ: “Bạn bao nhiêu tuổi?” hay “Thu nhập trung bình mỗi tháng của bạn là bao nhiêu?”

Trang 8

Tin học ứng dụng - SPSS 15

2.2- Mã hóa dữ liệu

 Khi nhập dữ liệu mà dữ liệu không phải là ký số như

“nữ” hay “sinh viên” thì cần phải được tạo ra một con

số mã hóa cho dữ liệu đó.

 Lưu ý: chỉ mã hóa thông tin thu thập thuộc dữ liệu định

tính, còn các thông tin thu nhập thuộc dữ liệu định lượng đã ở dưới dạng số và có ý nghĩa nên không cần

mã hóa.

2.2- Mã hóa dữ liệu (tt)

Nữ: 2 Nam: 1

10 3 11

… 14

Trang 9

2 Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại trên?

Rất không hài lòng 1 2 3 4 5 Rất hài lòng

3 Chi tiêu trung bình một tháng cho việc gọi điện thoại di động ……….ngàn đồng

2.2- Mã hóa dữ liệu (tt)

Mã hóa trực tiếp trên bảng phỏng vấn.

Trang 10

Tin học ứng dụng - SPSS 19

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến

4- Số thứ tự các dòng 5- Data View (cửa sổ nhập liệu và thể hiện dữ liệu), Variable View (cửa sổ khai báo biến)

3.1- Khai báo biến

Trang 11

Tin học ứng dụng - SPSS 21

Name: tên biến, ký tự liên tục, không có khoảng trắng, cần đặt tên biến có độ dài không quá 8 ký tự hay ký số, không có

ký tự đặt biệt và không được bắt đầu bằng một ký số Thông thường tên biến được đặt gần với câu hỏi mà biến đó

mô tả, VD: câu hỏi 1 → c1.

Type: kiểu biến, mặc định là kiểu định lượng (Numeric), muốn thay đổi kiểu biến thì nhấn chuột vào nút … trong ô Type để mở hợp thoại Type.

Trang 13

Tin học ứng dụng - SPSS 25

Label: nhãn biến (là tên đầy đủ của biến, sẽ hiển thị trong báo cáo thống kê và biểu đồ)

Values: giá trị mã hóa dữ liệu, đây là thuộc tính quan trọng nhất Nhấp chuột vào nút … để nhập giá trị mã hóa.

Trang 14

 Khi gặp câu hỏi mà những người được điều tra vì lý do tế nhị họ đã từ chối trả lời (VD: thu nhập, trình độ học vấn, …) thì trong Value label ta quy ước giá trị 99 có nhãn là “không trả lời”.

 Sau đó sang Missing ta phải khai báo 99 là giá trị khuyết để khi tính toán các lệnh thống kê, máy sẽ loại giá trị khuyết này ra.

Lu ý:Cách đặt số đại diện cho Missing value là tùy vào câu hỏi thực tế, VD đặt số 99 cho Missing value là biến độ tuổi sẽ gây nhầm lẫn nếu cuộc điều tra có những người đạt 99 tuổi.

Trang 15

Tin học ứng dụng - SPSS 29

Columns: khai báo độ rộng của cột biến khi ta nhập liệu, thường chọn

là 8

Align: vị trí dữ liệu được nhập trong cột, thường chọn là Right

Trang 16

Tin học ứng dụng - SPSS 31

Measure: loại thang đo của dữ liệu, Ordinal (thang đo thứ bậc), Nominal (thang đo danh nghĩa) và Scale (gồm

cả Interval-khoảng và Ratio-tỷ lệ).

Lưu ý:

- Nhập mỗi cột là một biến

- Mỗi dòng là dữ liệu thu thập được từ một mẩu phỏng vấn

- Có thể dùng chức năng Copy/Paste để sao chép dữ liệu từ

chương trình Excel sang SPSS Ngoài ra, SPSS cũng cho phép import dữ liệu từ file xls có sẵn bằng cách vào File >

Open > Data…> Chọn tập tin đuôi *.xls.

3.2- Nhập liệu

Trang 17

Tin học ứng dụng - SPSS 33

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

4- Một số xử lý trên biến4.1- Mã hóa lại biến (Recode)

 Bin đã đc mã hóa ri ti sao phi mã hóa li ?

 Khi chúng ta muốn giảm số biểu hiện của một biến định tính xuống còn 2 hay 3 biểu hiện cơ bản

Ví dụ: với biến về trình độ chuyên môn

1.Tiến sĩ, 2.Thạc sĩ, 3.Đại học, 4.Cao đẳng, 5.Trung cấp, 6.Sơ cấp

Trang 18

Tin học ứng dụng - SPSS 35

4.1- Mã hóa lại biến (Recode) (tt)

 Bin đã đc mã hóa ri ti sao phi mã hóa li ? (tt)

 Khi chúng ta muốn chuyển 1 biến định lượng có quá nhiều giá trịthành 1 biến định tính

Ví dụ: với biến định lượng là tuổi, điều tra 1000 người cho biết họ có tuổi từ 20 đến 60 Như vậy chúng ta sẽ có 40 độ tuổi.

 Nếu liệt kê ra thì bảng tần số của biến tuổi sẽ dài đến 40 hàng nên ít có ý nghĩa trong việc tóm tắt và trình bày Do đó biến này cần được mã hóa lại thành một số nhóm giá trị giúp việc trình bày ngắn gọn và dễ dàng hơn

 Chúng ta có thể mã hóa biến này lại thành những nhóm tuổi như sau: (20-30), (31-40), (41-50), (51-60)

Quy trình thực hiện việc mã hóa lại biến

1 Vào menu Transform>Recode into Different Variables mở hộp thoại

Recode into Different Variables, lệnh Recode tạo 1 biến mới với các giátrị mã hóa do bạn khai báo trên cở sở biến gốc, còn biến cũ vẫn được giữ lại

 Nếu chọn Recode into Same Variables thì lệnh Recode sẽ làm mất

đi biến cũ và tạo ra 1 biến mới với các biểu hiện vừa được mã hóa

4.1- Mã hóa lại biến (Recode) (tt)

Trang 19

Tin học ứng dụng - SPSS 37

Quy trình thực hiện việc mã hóa lại biến (tt)

2 Trong hộp thoại Recode into Different Variables → chọn biến muốn recode đưa sang khung Input Variable -> Output Variable

4.1- Mã hóa lại biến (Recode) (tt)

Quy trình thực hiện việc mã hóa lại biến (tt)

3 Trong Output Variable cần đặt tên và nhãn cho biến mới, ví dụ Name:

tuoiMHL và Label: Tuổi đã được mã hóa lại Sau đó nhấp nút change

để mã hóa biến tuoi->tuoiMHL Lu ý không đc quên nhp nút change.

4.1- Mã hóa lại biến (Recode) (tt)

Trang 20

Tin học ứng dụng - SPSS 39

Quy trình thực hiện việc mã hóa lại biến (tt)

4 Nhấp nút Old and New Values… để mở hộp thoại xác định sự chuyển đổi giữa giá trị cũ và giá trị mới tương ứng

Lần lược khai báo giá trị cũ (Old Value bên tay trái) tương ứng với từng giá trị mới (New Value bên tay phải)

4.1- Mã hóa lại biến (Recode) (tt)

Giá trị khuyết của hệ thống

Giá trị khuyết của hệ thống hoặc do người dùng định nghĩa

Một khoảng giá trị cũ ứng với 1 giá trị mới

Khoảng từ giá trị nhỏ nhất đến 1 giá trị xác định được nhập vào

Khoảng từ 1 giá trị xác định được nhập vào đến giá trị lớn nhất

Từng giá trị cũ rời rạc ứng với 1 giá trị mới

Quy trình thực hiện việc mã hóa lại biến (tt)

5 Xác định xong các giá trị  nút Continue để trở về hộp thoại trước đó

Chọn OK để thực hiện lệnh mã hóa lại, lúc đó sẽ xuất hiện 1 biến mới

là tuoiMHL .

4.1- Mã hóa lại biến (Recode) (tt)

Biến mới vừa được tạo do

Recode lại biến tuoi

Trang 21

Tin học ứng dụng - SPSS 41

Quy trình thực hiện việc mã hóa lại biến (tt)

6 Vào thuộc tính Values để gán các nhãn giá trị cho biến vừa tạo, nếu không khai báo các nhãn giá trị thì khi lập bảng tần số cho biến

tuoiMHL, SPSS sẽ truy xuất ra các con số 1, 2, 3, 4 chứ không truy xuất ra các biểu hiện (20-30), (31-40), … của biến tuoiMHL

4.1- Mã hóa lại biến (Recode) (tt)

4- Một số xử lý trên biến (tt)4.2- Chuyển một biến dạng Category thành dạng Dichotomy

 Category là biến phân loại có thể có nhiều trị số mã hóa tượng trưng cho nhiều trạng thái, biểu hiện khác nhau

Ví dụ: Đạo Phật, đạo Thiên chúa, đạo Tin lành, đạo Hòa hảo, …

 Dichotomy là biến phân loại chỉ có 2 trị số mã hóa tượng trưng cho 2 trạng thái hay 2 biểu hiện khác nhau

Trang 22

Tin học ứng dụng - SPSS 43

4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)

 Đối với câu hỏi nhiều trả lời (MA) có thể mã hóa và nhập liệu theo cả

2 kiểu biến này Mã hóa và nhập liệu theo kiểu category dễ thực hiện hơn, tuy nhiên khi phân tích sâu thì kiểu biến dichotomy có nhiều lợi thế hơn

 Do vậy người ta thường nhập liệu theo kiểu category, sau đó khi cần phân tích sâu thì chuyển sang dạng dichotomy

Ví dụ: với câu hỏi về các loại báo mà CBCC AG thường đọc, người được hỏi có thể nhắc đến nhiều loại báo khác nhau như: Tuổi Trẻ, Thanh Niên, An Giang, Pháp Luật, Công An, SGGP, An Ninh, …Giả sử thông tin về các loại báo thường đọc được thể hiện trong 5 biến (1-5) Nhà nghiên cứu muốn biết báo AG được đọc thường xuyên đến đâu dựa trên số liệu điều tra được, nhưng lựa chọn đọc báo AG nằm rải rác trong các biến từ 1-5 làm sao đếm được?

4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)

Ví dụ: (tt)

Khi đó chúng ta sẽ tạo 1 biến mới với 2 biểu hiện (biến Dichotomy): biểu hiện 1 là người có đọc báo AG, biểu hiện 0 là người không đọc báo AG

Sau đó đếm tần số xuất hiện số 1 sẽ biết được số người có đọc báo AG và số người không đọc báo AG

Cách thực hiện:

1

Trang 23

Tin học ứng dụng - SPSS 45

4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)

Cách thực hiện: (tt)

2 Khai báo tên biến Dichotomy muốn tạo trong khung Target Variable

và nhãn biến trong khung Target Label

4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)

Cách thực hiện: (tt)

3 Đưa các biến từ c1a1 đến c1a5 vào khung Varibles.

Trang 25

Tin học ứng dụng - SPSS 49

4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)

Cách thực hiện: (tt)

6 Bấm Continue trở lại hộp thoại chính và OK

4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)

Cách thực hiện: (tt)

7 Cửa sổ Variable View có thêm 1 biến mới tên là docBAG, biến này

nhận giá trị 1 (có đọc báo AG) và 0 (không đọc báo AG)

Trang 26

Tin học ứng dụng - SPSS 51

4.3- Thủ tục Compute

Sử dụng để tính toán giá trị biến mới từ các biến có sẵn

Transform > Compute Variable…

4- Một số xử lý trên biến (tt)

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

Trang 27

Tin học ứng dụng - SPSS 53

Click to add Title

1 1 Bảng tần số đơn giản

Click to add Title

2 2 Các đại lượng thống kê mô tả

Click to add Title

1 3 Lập bảng tần số, tính toán các ĐLTK mô tả

NI DUNG

Click to add Title

1 4 Lập bảng tổng hợp nhiều biến

Click to add Title

5- Tóm tt và trình bày dliu

Trang 28

5.2- Các đại lượng thống kê mô tả

Chỉ được tính đối với các biến định lượng, nếu tính các đại lượng này đối với các biến định tính thì kết quả sẽ không có ý nghĩa

VD: - Tính trung bình giới tính → vô nghĩa

- Tính trung bình chi tiêu → có ý nghĩa Cách thực hiện:

1.Từ thanh Menu chọn

Analyze Descriptive Statistics Descriptives…

5- Tóm tt và trình bày dliu (tt)

Trang 30

Tin học ứng dụng - SPSS 59

5.2- Các đại lượng thống kê mô tả (tt)

1 Nhấp đôi chuột vào bảng kết quả

2 Vào menu Pivot chọn Transpose Rows and Columns

5- Tóm tt và trình bày dliu (tt)

5.3- Lập bảng tần số đồng thời tính toán các đại lượng thống

kê mô tả

Trong thực tế ít khi dùng lệnh tính toán các đại lượng thống kê riêng lẻ

mà thường kết hợp vừa lập bảng tần số vừa tính toán các đại lượng thống kê mô tả(chỉ áp dụng đối với biến định lượng)

5- Tóm tt và trình bày dliu (tt)

Trang 31

 Bar: biểu đồ dạng thanh (dùng cho biến

có các giá trị rời rạc, biến của dữ liệu định tính)

5- Tóm tt và trình bày dliu (tt)

Trang 33

5.4.2- Bảng kết hợp biến định tính với biến định lượng

Bảng kết hợp 1 biến định tính & 1 biến định lượng

VD: Muốn biết thu nhập trung bình của Hà Nội và TPHCM

Cách thực hiện:

5.4- Lập bảng tổng hợp nhiều biến

Trang 34

Tin học ứng dụng - SPSS 67

5.4.2- Bảng kết hợp biến định tính với biến định lượng (tt)

Bảng kết hợp 2 biến định tính & 1 biến định lượng

VD: Muốn biết thu nhập trung bình của Hà Nội và TPHCM theo từng nhóm tuổi

Cách thực hiện:

5.4- Lập bảng tổng hợp nhiều biến

5.4.3- Đổ bảng chéo (phân tích hai biến)

 VD: Giới tính có ảnh hưởng đến việc lựa chọn loại ĐTDĐ ?

 Cách thực hiện:

5.4- Lập bảng tổng hợp nhiều biến

Mối quan hệ trong mẫu, tổng thể?

Ngày đăng: 04/12/2015, 07:42

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w