1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng tin học ứng dụng chương 1 phân tích dữ liệu nghiên cứu với SPSS

42 713 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 42
Dung lượng 3 MB

Nội dung

Tin học ứng dụng - SPSS 19CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS 1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến 4- Số thứ tự các

Trang 1

1

6

Một số xử lý trên biếnLàm sạch dữ liệu

Tóm tắt và trình bày dữ liệu

5 CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

Trang 2

Tin học ứng dụng - SPSS 3

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

1- Giới thiệu về SPSS

 Viết tắt Statistical P ackage for the S ocial S ciences.

 SPSS cung cấp một hệ thống quản lý dữ liệu và phân tích thống

kê trong một môi trường đồ họa

 Dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng biểu, báo cáo được trình bày đẹp, linh hoạt

 Thông thường một qui trình nghiên cứu bao gồm 8 bước, SPSS phục vụ cho bước thứ 7 (Xử lý, phân tích và diễn giải các dữ liệu

đã được xữ lý)

 Thông qua SPSS: Dữ liệu thô → Thông tin → Sự kiện → Tri thức

Trang 3

Làm quen với SPSS 3

 Tài liệu học tập: Slide bài giảng

 Tài liệu tham khảo:

Phân tích dữ liệu nghiên cứu với SPSS – Hoàng Trọng &

Chu Nguyễn Mộng Ngọc (ĐHKT TPHCM-2008)

1- Giới thiệu về SPSS (tt)

Trang 4

Tin học ứng dụng - SPSS 7

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: u:

 Trước khi nhập liệu và xử lý dữ liệu → cần hiểu rõ các loại dữliệu và tính chất của từng loại dữ liệu

 Dữ liệu nghiên cứu có thể chia thành 2 loại chính là địịịịnh tđnh tnh tíííínhnh

vàđđịịịịnh lưnh lưnh lượợợngng, được thu thập bằng 4 thang đo cơ bản:

Dữ liệu

Dữ liệu

Thang đo danh nghĩa Thang đothứ bậc khoảng cáchThang đo Thang đotỷ lệ

Trang 5

Làm quen với SPSS 5

Các phép toán thống kê dùng cho dữ liệu định tính cónhững đặc điểm khác với phép toán dùng cho dữ liệu định lượng

• Phản ánh mức độ, mức độ hơn kém, tính được trị trung bình Nó thể hiện bằng con số.

• Ví dụ: Độ tuổi, thu nhập, …

• Phản ánh tính chất, sự hơn kém, không tính được trị trung bình.

 CCÁÁC LO C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

 Thang đo là công cụ dùng để quy ước (mã hóa) các tình trạng hay mức độ của các đơn vị khảo sát theo các đặc trưng được xem xét Ví dụ: tình trạng hôn nhân, mức hộ hài lòng về một vấn đề nào đó

 Để dễ dàng thực hiện xử lý trên máy tính thì việc mã hóa thường được thực hiện bằng ký số thay vì ký tự

 Có 4 loại thang đo cơ bản

Trang 6

Tin học ứng dụng - SPSS 11

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)

 CCÁÁC LO C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

Thang đo danh nghĩa (Nominal scale): trong thang đo này

các con số chỉ dùng để phân loại các đối tượng, nó không mang ý nghĩa nào khác

Ví dụ: “Vui lòng cho biết tình trạng hôn nhân của bạn hiện nay?”

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)

 CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

Thang đo thứ bậc (Ordinal scale): các con số ở thang đo danh nghĩa được sắp xếp theo một quy ước nào đó về thứ bậc hay sự hơn kém, nhưng không biết khoảng cách giữa chúng  Bất cứ thang đo thứ bậc nào cũng là thang đo danh nghĩa, nhưng không thể suy ngược lại

Ví dụ: “Bạn hài lòng như thế nào về mùi của sản phẩm Snack Khoai tây chiên mà bạn vừa dùng thử?”

Hài lòng Bình thường Không hài lòng

3 2 1

 Số 3 có mức độ hài lòng cao hơn số 2 hoặc số 1 nhưng không biết cao hơn gấp mấy lần, cao hơn nhiều hay ít

Trang 7

Làm quen với SPSS 7

Thang đo khoảng (Interval scale): là một dạng đặc biệt của thang đo thứ bậc vì nó cho biết được khoảng cách giữa các thứ bậc, nó có dạng một dãy các chữ số liên tục và đều đặn, 2 đầu của dãy số thể hiện 2 trạng thái đối nghịch nhau.

Ví dụ: Theo bạn tầm quan trọng của các yếu tố sau đây như thế nào đối với cuộc sống của một người?(1=không quan trọng, 5=rất quan trọng)

Không quan trọng Rất quan trọng

 Phép toán thống kê có thể sử dụng thêm cho loại thang đo này so với 2 loại thang đo trước là: tính khoảng biến thiên, số trung bình, độ lệch chuẩn.

2- Phân loại và mã hóa dữ liệu

2.1 2.1 Phân lo Phân lo Phân loạ ạ ại d i d i dữ ữ ữ li li liệ ệ ệu: (tt) u: (tt)

 CCÁC LO Á C LO C LOẠ Ạ ẠI THANG ĐO I THANG ĐO:

Thang đo tỷ lệ (Ratio scale): có tất cả các đặc tính khoảng cách và thứ tự của thang đo khoảng, ngoài ra có thể thực hiện được phép toán

 Tuy nhiên SPSS gộp chung 2 loại thang đo khoảng và tỷ lệ thành một gọi

là Scale Measures (thang đo mức độ).

Trang 8

Tin học ứng dụng - SPSS 15

2.2- Mã hóa dữ liệu

 Khi nhập dữ liệu mà dữ liệu không phải là ký số như

“nữ” hay “sinh viên” thì cần phải được tạo ra một con

số mã hóa cho dữ liệu đó.

 Lưu ý: chỉ mã hóa thông tin thu thập thuộc dữ liệu định tính, còn các thông tin thu nhập thuộc dữ liệu định lượng đã ở dưới dạng số và có ý nghĩa nên không cần

mã hóa.

2.2- Mã hóa dữ liệu (tt)

Nữ: 2 Nam: 1

10 3 11

… 14

Trang 9

2 Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại trên?

Rất không hài lòng 1 2 3 4 5 Rất hài lòng

3 Chi tiêu trung bình một tháng cho việc gọi điện thoại di động ……….ngàn đồng

4 Bạn theo dõi thông tin về các loại điện thoại mới như thế nào?

Không bao giờ (1) Ít khi (2)

Thỉnh thoảng (3)  Thườ  ng xuyên (4)

5 Bạn thường sử dụng tính năng nào

Nghe - gọi Tin nhắn Nghe nhạc

Quay phim, chụp hình Games Khác

Câu hỏi nhiều trả lời (MA)

mã hóa như thế nào ???

Trang 10

Tin học ứng dụng - SPSS 19

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

1- Thanh menu chức năng 2- Biểu tượng một số chức năng thông dụng 3- Cột hiển thị tên các biến

4- Số thứ tự các dòng 5- Data View (cửa sổ nhập liệu và thể hiện dữ liệu), Variable View (cửa sổ khai báo biến)

3.1- Khai báo biến

Trang 11

Làm quen với SPSS 11

Name: tên biến, ký tự liên tục, không có khoảng trắng, cần đặt tên biến có độ dài không quá 8 ký tự hay ký số, không có

ký tự đặt biệt và không được bắt đầu bằng một ký số Thông thường tên biến được đặt gần với câu hỏi mà biến đó

mô tả, VD: câu hỏi 1 → c1.

Type: kiểu biến, mặc định là kiểu định lượng (Numeric), muốn thay đổi kiểu biến thì nhấn chuột vào nút … trong ô Type để mở hợp thoại Type.

Trang 13

Làm quen với SPSS 13

Label: nhãn biến (là tên đầy đủ của biến, sẽ hiển thị trong báo cáo thống kê và biểu đồ)

Values: giá trị mã hóa dữ liệu, đây là thuộc tính quan trọng nhất Nhấp chuột vào nút … để nhập giá trị mã hóa.

Trang 14

 Khi gặp câu hỏi mà những người được điều tra vì lý do tế nhị họ đã từ chối trả lời (VD: thu nhập, trình độ học vấn, …) thì trong Value label ta quy ước giá trị 99 có nhãn là “không trả lời”.

 Sau đó sang Missing ta phải khai báo 99 là giá trị khuyết để khi tính toán các lệnh thống kê, máy sẽ loại giá trị khuyết này ra.

Lu ý:Cách đặt số đại diện cho Missing value là tùy vào câu hỏi thực tế, VD đặt số 99 cho Missing value là biến độ tuổi sẽ gây nhầm lẫn nếu cuộc điều tra có những người

Trang 15

Làm quen với SPSS 15

Columns: khai báo độ rộng của cột biến khi ta nhập liệu, thường chọn

là 8

Align: vị trí dữ liệu được nhập trong cột, thường chọn là Right

Trang 16

Tin học ứng dụng - SPSS 31

Measure: loại thang đo của dữ liệu, Ordinal (thang đo thứ bậc), Nominal (thang đo danh nghĩa) và Scale (gồm

cả Interval-khoảng và Ratio-tỷ lệ).

Lưu ý:

- Nhập mỗi cột là một biến

- Mỗi dòng là dữ liệu thu thập được từ một mẩu phỏng vấn

- Có thể dùng chức năng Copy/Paste để sao chép dữ liệu từ

chương trình Excel sang SPSS Ngoài ra, SPSS cũng cho phép import dữ liệu từ file xls có sẵn bằng cách vào File >

Open > Data…> Chọn tập tin đuôi *.xls.

3.2- Nhập liệu

Trang 17

4.1- Mã hóa lại biến (Recode)

 Bin đã đc mã hóa ri ti sao phi mã hóa li ?

 Khi chúng ta muốn giảm số biểu hiện của một biến định tính xuống còn 2 hay 3 biểu hiện cơ bản

Ví dụ: với biến về trình độ chuyên môn

1.Tiến sĩ, 2.Thạc sĩ, 3.Đại học, 4.Cao đẳng, 5.Trung cấp, 6.Sơ cấp

 Bạn có thể mã hóa lại biến này bằng cách gom chung biểu hiện 1

và 2 thành một nhóm chung là “Trên đại học”, gom biểu hiện 4,5

và 6 thành nhóm “Dưới đại học”

Trang 18

Tin học ứng dụng - SPSS 35

4.1- Mã hóa lại biến (Recode) (tt)

 Bin đã đc mã hóa ri ti sao phi mã hóa li ? (tt)

 Khi chúng ta muốn chuyển 1 biến định lượng có quá nhiều giá trịthành 1 biến định tính

Ví dụ: với biến định lượng là tuổi, điều tra 1000 người cho biết họ có tuổi từ 20 đến 60 Như vậy chúng ta sẽ có 40 độ tuổi.

 Nếu liệt kê ra thì bảng tần số của biến tuổi sẽ dài đến 40 hàng nên ít có ý nghĩa trong việc tóm tắt và trình bày Do đó biến này cần được mã hóa lại thành một số nhóm giá trị giúp việc trình bày ngắn gọn và dễ dàng hơn

 Chúng ta có thể mã hóa biến này lại thành những nhóm tuổi như sau: (20-30), (31-40), (41-50), (51-60)

Quy trình thực hiện việc mã hóa lại biến

1 Vào menu Transform>Recode into Different Variables mở hộp thoại

Recode into Different Variables, lệnh Recode tạo 1 biến mới với các giátrị mã hóa do bạn khai báo trên cở sở biến gốc, còn biến cũ vẫn được giữ lại

 Nếu chọn Recode into Same Variables thì lệnh Recode sẽ làm mất

đi biến cũ và tạo ra 1 biến mới với các biểu hiện vừa được mã hóa

4.1- Mã hóa lại biến (Recode) (tt)

Trang 19

Quy trình thực hiện việc mã hóa lại biến (tt)

3 Trong Output Variable cần đặt tên và nhãn cho biến mới, ví dụ Name:

tuoiMHL và Label: Tuổi đã được mã hóa lại Sau đó nhấp nút change

để mã hóa biến tuoi->tuoiMHL Lu ý không đc quên nhp nút change.

4.1- Mã hóa lại biến (Recode) (tt)

Trang 20

Tin học ứng dụng - SPSS 39

Quy trình thực hiện việc mã hóa lại biến (tt)

4 Nhấp nút Old and New Values… để mở hộp thoại xác định sự chuyển đổi giữa giá trị cũ và giá trị mới tương ứng

Lần lược khai báo giá trị cũ (Old Value bên tay trái) tương ứng với từng giá trị mới (New Value bên tay phải)

4.1- Mã hóa lại biến (Recode) (tt)

Giá trị khuyết của hệ thống

Giá trị khuyết của hệ thống hoặc do người dùng định nghĩa

Một khoảng giá trị cũ ứng với 1 giá trị mới

Khoảng từ giá trị nhỏ nhất đến 1 giá trị xác định được nhập vào

Khoảng từ 1 giá trị xác định được nhập vào đến giá trị lớn nhất

Từng giá trị cũ rời rạc ứng với 1 giá trị mới

Quy trình thực hiện việc mã hóa lại biến (tt)

5 Xác định xong các giá trị  nút Continue để trở về hộp thoại trước đó

Chọn OK để thực hiện lệnh mã hóa lại, lúc đó sẽ xuất hiện 1 biến mới

là tuoiMHL .

4.1- Mã hóa lại biến (Recode) (tt)

Biến mới vừa được tạo do

Recode lại biến tuoi

Trang 21

Làm quen với SPSS 21

không khai báo các nhãn giá trị thì khi lập bảng tần số cho biến

tuoiMHL, SPSS sẽ truy xuất ra các con số 1, 2, 3, 4 chứ không truy

xuất ra các biểu hiện (20-30), (31-40), … của biến tuoiMHL

4- Một số xử lý trên biến (tt)

4.2- Chuyển một biến dạng Category thành dạng Dichotomy

 Category là biến phân loại có thể có nhiều trị số mã hóa tượng trưng cho nhiều trạng thái, biểu hiện khác nhau

Ví dụ: Đạo Phật, đạo Thiên chúa, đạo Tin lành, đạo Hòa hảo, …

 Dichotomy là biến phân loại chỉ có 2 trị số mã hóa tượng trưng cho 2 trạng thái hay 2 biểu hiện khác nhau

Ví dụ: Nam hay nữ, đồng ý hay không đồng ý, có đọc báo An Giang hay không đọc báo An Giang,

Vì sao cần phải chuyển 1 biến dạng Category→Dichotomy ?

Trang 22

Tin học ứng dụng - SPSS 43

4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)

 Đối với câu hỏi nhiều trả lời (MA) có thể mã hóa và nhập liệu theo cả

2 kiểu biến này Mã hóa và nhập liệu theo kiểu category dễ thực hiện hơn, tuy nhiên khi phân tích sâu thì kiểu biến dichotomy có nhiều lợi thế hơn

 Do vậy người ta thường nhập liệu theo kiểu category, sau đó khi cần phân tích sâu thì chuyển sang dạng dichotomy

Ví dụ: với câu hỏi về các loại báo mà CBCC AG thường đọc, người được hỏi có thể nhắc đến nhiều loại báo khác nhau như: Tuổi Trẻ, Thanh Niên, An Giang, Pháp Luật, Công An, SGGP, An Ninh, …Giả sử thông tin về các loại báo thường đọc được thể hiện trong 5 biến (1-5) Nhà nghiên cứu muốn biết báo AG được đọc thường xuyên đến đâu dựa trên số liệu điều tra được, nhưng lựa chọn đọc báo AG nằm rải rác trong các biến từ 1-5 làm sao đếm được?

4.2- Chuyển một biến dạng Category thành dạng Dichotomy (tt)

Ví dụ: (tt)

Khi đó chúng ta sẽ tạo 1 biến mới với 2 biểu hiện (biến Dichotomy): biểu hiện 1 là người có đọc báo AG, biểu hiện 0 là người không đọc báo AG

Sau đó đếm tần số xuất hiện số 1 sẽ biết được số người có đọc báo AG và số người không đọc báo AG

Cách thực hiện:

1

Trang 23

Làm quen với SPSS 23

2 Khai báo tên biến Dichotomy muốn tạo trong khung Target Variable

và nhãn biến trong khung Target Label

Trang 24

5 Nhập số 3 (là số được mã hóa cho báo AG trong các biến từ

c1a1-c1a5) vào khung Value rồi bấm nút Add để đưa nó sang khung

Trang 25

7 Cửa sổ Variable View có thêm 1 biến mới tên là docBAG, biến này

nhận giá trị 1 (có đọc báo AG) và 0 (không đọc báo AG)

Trang 26

Tin học ứng dụng - SPSS 51

4.3- Thủ tục Compute

Sử dụng để tính toán giá trị biến mới từ các biến có sẵn

Transform > Compute Variable…

4- Một số xử lý trên biến (tt)

(Xem tài liu tham kho Page 35-41)

CHƯƠNG 1: PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS

Trang 27

Click to add Title

Click to add Title

3

NI DUNG

Click to add Title

Click to add Title

1 5 Xử lý câu hỏi có thể chọn nhiều trả lời - MA

Click to add Title

Trang 28

Hộp thoại Frequencies xuất hiện, Chọn các biến cần tính và đưa vào khung Variable(s)

Trang 29

Làm quen với SPSS 29

Chỉ được tính đối với các biến định lượng, nếu tính các đại lượng này đối với các biến định tính thì kết quả sẽ không có ý nghĩa

VD: - Tính trung bình giới tính → vô nghĩa

- Tính trung bình chi tiêu → có ý nghĩa Cách thực hiện:

1.Từ thanh Menu chọn

Analyze Descriptive Statistics Descriptives…

Trang 30

6.2- Các đại lượng thống kê mô tả (tt)

1 Nhấp đôi chuột vào bảng kết quả

2 Vào menu Pivot chọn Transpose Rows and Columns

Trang 31

Làm quen với SPSS 31

Trong thực tế ít khi dùng lệnh tính toán các đại lượng thống kê riêng lẻ

mà thường kết hợp vừa lập bảng tần số vừa tính toán các đại lượng thống kê mô tả(chỉ áp dụng đối với biến định lượng)

Trang 32

 Bar: biểu đồ dạng thanh (dùng cho biến

có các giá trị rời rạc, biến của dữ liệu định tính)

 Pie: biểu đồ hình tròn (hay dùng cho việc

mô tả cấu trúc hiện tượng)

 Histograms: biểu đồ phân phối tần sốdùng cho biến của dữ liệu liên tục

 Sau khi chọn loại biểu đồ → Continue

Trang 34

Tin học ứng dụng - SPSS 67

6.4.2- Bảng kết hợp biến định tính với biến định lượng

Bảng kết hợp 1 biến định tính & 1 biến định lượng

VD: Muốn biết thu nhập trung bình của Hà Nội và TPHCM

Cách thực hiện:

6.4- Lập bảng tổng hợp nhiều biến

6.4.2- Bảng kết hợp biến định tính với biến định lượng (tt)

Bảng kết hợp 2 biến định tính & 1 biến định lượng

VD: Muốn biết thu nhập trung bình của Hà Nội và TPHCM theo từng nhóm tuổi

Cách thực hiện:

6.4- Lập bảng tổng hợp nhiều biến

Trang 36

Tin học ứng dụng - SPSS 71

6.5- Xử lý câu hỏi có thể chọn nhiều trả lời (Multiple Answer-MA)

 Đối với câu hỏi MA chúng ta ghép các biến lại với nhau để tổng hợp thông tin về câu hỏi

 Cách thực hiện:

Chọn các biến cần ghép đưa vào đây

Chọn vào đây vì biến

có nhiều biểu hiện

Đặt tên và nhãn cho biến ghép

Biến ghép đã được định nghĩa

Trang 37

Làm quen với SPSS 37

Thực hiện kết hợp biến với biến ghép mới được định nghĩa

6.6- Trình bày kết quả bằng đồ thị

6.6.1- Các loại đồ thị cơ bản của SPSS

 Biểu đồ thanh Bar: được sử dụng biểu diễn dữ liệu dưới dạng tần sốhay tần suất%

 Biểu đồ hình tròn Pie: thường sử dụng biểu diễn dữ liệu định tính dạng tần số hay % khi chỉ có ít nhóm

 Đồ thị đường gấp khúc (Line) và diện tích (Area): áp dụng tốt cho dữliệu định lượng

 Cách to dng và hi u ch nh các loi đ th trên trong SPSS khá

ging nhau → ch cn nghiên cu 1 loi đ th → các đ th còn li tơng t.

Ngày đăng: 04/12/2015, 03:53

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w