1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng môn xử lý số liệu thống kê SPSS

134 3,5K 30
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 134
Dung lượng 2,63 MB

Nội dung

Đây là tài liệu hữu ích về cách sử dụng phần mềm xử lý số liệu thống kê thường dùng trong xử lý kết quả phỏng vấn bằng bảng hỏi trong nghiên cứu khoa học nói riêng và thống kê số liệu nói chung.

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN

BÀI GIẢNG

THỰC HÀNH SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU TRONG NGHIÊN CỨU TÂM LÝ HỌC

TS.PHẠM MẠNH HÀ

HÀ NỘI 2012

Trang 2

Mục lục Số trang CHƯƠNG 1: NHỮN G VẤN ĐỀ CHUNG CỦA THỐNG KÊ ỨNG

DỤNG TRONG NGHIÊN CỨU TÂM LÝ HỌC

3

1 Một số vấn đề chung của thống kê ứng dụng trong tâm lý học 3

2 Một số khái niệm cơ bản trong thống kê 7

4 Một số khái niệm trong đo lường thống kê 16

CHƯƠNG 2: MÃ HÓA VÀ TẠO ĐỊNH NGHĨA BIẾN CHO DỮ

LIỆU

24

2 Làm việc với phần mềm SPSS trên windows

26

3 Mã hóa và tạo định nghĩa cho biến dữ liệu trong spss 32

CHƯƠNG 3: NHẬP DỮ LIỆU VÀ HIỆU ĐÍNH DỮ LIỆU CHO

PHÂN TÍCH

44

2 Kiểm tra và hiệu đính dữ liệu trong bảng Data View 46

3 Lựa chọn và sắp xếp mẫu theo mục đích sử dụng 78

CHƯƠNG 5 PHÂN TÍCH SỐ LIỆU

1 Lập bảng phân bố tần suất cho một biến trả lời 84

Trang 3

CHƯƠNG 1: MỘT SỐ KHÁI NIỆM THỐNG KÊ CƠ BẢN ỨNG DỤNG TRONG NGHIÊN CỨU TÂM LÝ HỌC

1 Một số vấn đề chung của thống kê ứng dụng trong tâm lý học

1.1 Khái niệm thống kê

Trong cuộc sống chúng ta thường gặp thuật ngữ thống kê, thuậtngữ này được hiểu theo hai nghĩa:

Thứ nhất, thống kê là số liệu thu thập để phản ánh các hiện tượngkinh tế, chính trị, xã hội, tự nhiên, kỹ thuật… Ví dụ: Số lượng trẻ nam và

số lượng trẻ gái được sinh ra trong các gia đình nông thôn Việt Nam từnăm 2011 – 2012; điểm trung bình chung các môn học của sinh viên sau

4 năm học…

Thứ hai, thống kê được hiểu là phương pháp được sử dụng đểnghiên cứu các hiện tượng kinh tế, xã hội, kỹ thuật, tâm lý… Công việcđược các nhà thống kê gồm rất nhiều hoạt động trên một phạm vi rộng cóthể tóm tắt thành những mục lớn sau:

Thu thập và xứ lý số liệu

Điều tra thống kê chọn mẫu

Nghiên cứu mối liên hệ giữa các hiện tượng

Dự báo

Nghiên cứu các hiện tượng trong hoàn cảnh không chắc chắn

Một các tổng quát, thông kế được định nghĩa như sau:

Thống kê là một hệ thống các phương pháp để thu thập, xử lý vàphân tích các con số (mặt lượng) của hiện tượng số lớn nhằm để tìm hiểubản chất và tính quy luật vốn có của chúng (mặt chất) trong điều kiện thờigian và không gian cụ thể

Thống kê thường được phân chia thành 2 lĩnh vực:

Trang 4

Thống kê mô tả: là các phương pháp có liên quan đến việc thu thập

số liệu, tóm tắt, trình bày, tính toán và mô tả các đặc trưng khác nhau đểphản ánh một cách tổng quát đối tượng nghiên cứu

Thống kê suy luận: là bao gồm các phương pháp ước lượng các đặctrưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu,

dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quansát mẫu

1.2 Đối tượng nghiên cứu của thống kê

Các nhà thống kê học nổi tiếng trên thế giới đều thống nhất đưa ranhận định sau đây về đối tượng nghiên cứu của thống kê

Thống kê học là môn khoa học xã hội, nghiên cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chất của các hiện tượng kinh tế- xã hội số lớn, trong điều kiện thời gian và địa điểm cụ thể.

Từ nhận định này, chúng ta cần hiểu đúng đối tượng nghiên cứu củathống kê ở các điểm chính sau

1.2.1 Thống kê học là một môn khoa học xã hội

Thống kê học là một môn khoa học xã hội, bởi vì thống kê nghiêncứu các hiện tượng kinh tế - xã hội hay quá trình kinh tế xã hội Các hiệntượng và quá trình đó thường là:

* Các hiện tượng về quá trình tái sản xuất mở rộng như cung cấpnguyên liệu, quy trình công nghệ, chế biến sản phẩm

* Các hiện tượng về phân phối, trao đổi, tiêu dùng sản phẩm(marketing) như giá cả, lượng hàng xuất, nhập hàng hoá, nguyên liệu

* Các hiện tượng dân số, lao động như tỷ lệ sinh, tử, nguồn laođộng, sự phân bố dân cư, lao động

* Các hiện tượng về văn hoá, sức khoẻ như trình độ văn hoá, sốngười mắc bệnh, các loại bệnh, phòng chống bệnh

Trang 5

* Ngoài ra thống kê còn nghiên cứu ảnh hưởng của các hiện tượng

tự nhiên đến sự phát triển của các hiện tượng kinh tế xã hội, như ảnhhưởng của khí hậu, thời tiết, của các biện pháp kỹ thuật tới quá trình sảnxuất nông nghiệp, kết quả sản xuất nông nghiệp và đời sống nhân dân

1.2.2 Thống kê nghiên cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chất của số lớn hiện tượng và quá trình kinh tế xã hội

a) Mặt lượng (những biểu hiện cụ thể, đo lường được)

* Quy mô của hiện tượng: Các mức độ to nhỏ, lớn bé, rộng hẹp

Ví dụ: Diện tích canh tác của 1 doanh nghiệp nông nghiệp A năm

2005 là 500 ha, dân số trung bình của Việt Nam 2003 là 80,90 triệu người(Niên giám thống kê 2003), tổng số sinh viên của 1 lớp năm học 2005 -

Ví dụ: Tỷ lệ tai nạn giao thông xe máy năm 2004 là 2%, có nghĩa là

cứ 100 người đi xe máy thì có 2 người tai nạn

* Mối quan hệ tỷ lệ giữa các hiện tượng hoặc giữa các tiêu thức củacùng một hiện tượng

b) Liên hệ chặt chẽ với mặt chất của số lớn hiện tượng

* Thông qua các mặt lượng của hiện tượng để đánh giá bản chất

Trang 6

của hiện tượng như quy mô to nhỏ, bộ phận nào nhiều hay ít, xu hướngtiến lên hay giảm đi, mức độ phổ biến của hiện tượng thế nào nhưng

để đánh giá một cách khách quan bản chất của hiện tượng thì mặt lượngcủa hiện tượng phải được thể hiện ở số lớn đơn vị chứ không phải ở từngđơn vị cá biệt

Ví dụ, đánh giá kết quả học tập 2 sinh viên A, B cần dựa vào kết quảhọc tập nhiều học kỳ, nhiều môn; dựa vào ý thức phấn đấu, sự tham giacác phong trào đoàn, quan hệ bạn bè Việc làm như vậy người ta gọi lànghiên cứu mặt lượng ở số lớn

Nhưng để hiểu sâu sắc hơn bản chất của hiện tượng, người ta cũngnghiên cứu những đơn vị tiên tiến, hoặc lạc hậu là những biểu hiện cábiệt

* Thống kê không nghiên cứu bản chất và quy luật của hiện tượng,

mà thông qua mặt lượng có thể đánh giá được bản chất và tính quy luậtcủa hiện tượng

1.2.3 Thống kê nghiên cứu các hiện tượng và quá trình kinh tế

xã hội trong điều kiện địa điểm và thời gian cụ thể

Mỗi hiện tượng, hay quá trình kinh tế xã hội ở thời gian, địa điểmkhác nhau thì mặt lượng cũng khác nhau Do đó, đối tượng nghiên cứucủa thống kê học cũng cần cụ thể hoá ở thời gian nào, địa điểm nào haytrả lời câu hỏi bao giờ ? và ở đâu ?

1.3 Mối quan hệ giữa thống kê và nghiên cứu tâm lý học

Tâm lý học là khoa học nghiên cứu về các hiện tượng tâm lý người,

có có đối tượng nghiên cứu là các hiện tượng, quy luật vận hành, nảysinh, phát triển của hoạt động tâm lý và mối quan hệ giữa các hiện tượngtâm lý với hành vi của con người

Là một khoa học độc lập, Tâm lý học có hệ thống phương pháp

Trang 7

pháp nghiên cứu chính của mình Tâm lý học sử dụng phương pháp thống

kê nhằm tìm hiểu các hiện tượng tâm lý như quan điểm, thái độ, nhu cầuđộng cơ của cá nhân và nhóm xã hội, cũng như nghiên cứu những đặctrưng thống kê về tính cách, năng lực, phẩm chất trí tuệ của cá nhân haynhững nhóm người cụ thể Trên cơ sở kết quả do phương pháp thống kêmang lại, các nhà tâm lý học sử dụng hệ thống lý thuyết, quan điểm tiếpcận tâm lý học của mình để lý giải các hiện tượng tâm lý đã nêu một cáchkhách quan và tường mình

2 Một số khái niệm cơ bản trong thống kê

2.1 Tổng thể thống kê

Tổng thể thống kê là một tập hợp các đơn vị cá biệt về sự vật, hiệntượng trên cơ sở một đặc điểm chung nào đó cần được quan sát, phân tíchmặt lượng của chúng Các đơn vị, phần tử tạo nên hiện tượng gọi là cácđơn vị tổng thể

Ví dụ: Tổng thể dân số Việt Nam, Tổng số sinh viên của trường ĐHKHXH&NV

2.2 Mẫu

Mẫu là một bộ phận của tổng thể, đảm bảo được tính đại diện vàđược chọn ra để quan sát và dùng để suy diễn cho toàn bộ tổng thể Việcchọn mẫu đại diện cho tổng thể không phải dễ dàng, trên thực tế chỉ cốgắng giảm sự sai biệt giữa mẫu và tổng thể chứ không thể khắc phục hoàntoàn Khi mẫu được chọn đảm bảo tính đại diện, sẽ có thể sử dụng để suyrộng ra các đặc trưng của tổng thể

Ví dụ: Nghiên cứu 100 sinh viên Khoa Tâm lý học trong tổng số

450 sinh viên nhằm tìm hiểu nhu cầu, động cơ lựa chọn học ngành Tâm

lý học

Trang 8

2.3 Tiêu thức thống kê

Các đơn vị tổng thể thường có nhiều đặc điểm khác nhau, song trong thống kê người ta chỉ chọn một số đặc điểm để nghiên cứu, các đặc điểm này người ta gọi là tiêu thức thống kê Như vậy, tiêu thức thống kê

là các đặc điểm của đơn vị tổng thể Mỗi tiêu thức thống kê đều có giá trị biểu hiện của nó

Phân loại tiêu thức thông kê dựa vào sự biểu hiện :

+ Tiêu thức thuộc tính : là tiêu thức phản ánh loại hoặc tính chất của đơn vị

+ Tiêu thức số lượng : là đặc trưng của đơn vị tổng thể được biểu hiện bằng con số Gồm 2 loại:

Loại rời rạc: là loại các giá trị có thể của nó là hữu hạn hay vô hạn

2.6 Số đo và thang đo

Số đo là việc gán những dữ kiện lượng hoá hay những ký hiệu chonhững hiện tượng quan sát

Thang đo là tạo ra một thang điểm để đánh giá đặc điểm của đốitượng được nghiên cứu thể hiện qua sự đánh giá, nhận xét

2.6.1 Các loại thang đo

Thang đo danh nghĩa – thang đo định danh:

Trang 9

Đây là loại thang đo có mức độ đo lường yếu nhất Thực chất của

nó là nhau Như vậy, để xây dựng được thang đo này, ta chỉ cần thiết lậpđược mối quan hệ bằng nhau hoặc không bằng nhau giữa các đơn vị củahiện tượng nghiên cứu theo dấu hiệu được đo để phân chia chúng thànhcác lớp không cắt nhau mà không cần theo một trật tự gán cho các biểuhiện cùng loại của tiêu thức nghiên cứu một con số xác định nào Ví dụ:Với tiêu thức giới tính chỉ có hai loại nam và nữ và không có trật tự nàogiữa hai loại này; vì vậy có thể gán cho nữ nhận giá trị là số 2 và namnhận một con số bất kỳ khác số 2 hoặc ngược lại

Thang đo định danh là loại thang đo định tính và thường được dùngrất rộng rãi với các tiêu thức thuộc tính mà các biểu hiện của nó là một hệthống các loại khác nhau, như: Giới tính, khu vực địa lý, nghề nghiệp, tôngiáo Các con số trên thang đo không biểu thị quan hệ hơn kém, caothấp, nhưng khi chuyển từ số này sang số khác thì dấu hiệu đo đã có sựthay đổi về chất Như khi đo lường về giới tính và tôn giáo, ta có thể xâydựng thang đo định danh sau:

Ví dụ:

Câu 1: Anh chị cho biết giới tính

1 Nam

2 Nữ

Câu 2: Tôn giáo anh chị đang theo

1 Thiên chúa giáo

Trang 10

Thang đo thứ bậc:

Đây là thang đo định danh nhưng giữa các biểu hiện của tiêu thức

có quan hệ hơn kém, cao thấp Giả sử có các điểm A, B, C, D theo thứ tự lần lượt trên thang đo thứ bậc, nếu đã có A lớn hơn B, thì A lớn hơn C và

C cũng lớn hơn D

Loại thang đo này cũng được dùng rất nhiều trong các nghiên cứu tâm lý xã hội, để đo các tiêu thức mà các biểu hiện có quan hệ thứ tự như

đo thái độ, quan điểm của con người đối với một hiện tượng xã hội nào

đó hoặc thứ tự chất lượng sản phẩm, huân chương, bậc thợ Với câu hỏi: Có haì lòng với quy định sinh viên nộp học phí chậm 1 tuần sẽ bị đuổi học không? Ta có thể triển khai một thang đo thứ bậc có 3 nấc:

1- Hài lòng

2- Lưỡng lự

3- Không hàì lòng

Như vậy, loại thang đo này là cơ sở quan trọng để phân tổ toàn bộ

số đơn vị được điều tra thành các nhóm có thứ bậc khác nhau đối với tiêuthức nghiên cứu Tuy nhiên, do chưa có tiêu chuẩn đo lường cụ thể (thểhiện bằng đơn vị đo), nên chưa thể xác định khoảng cách cụ thể hay mức

độ hơn kém giữa các nhóm Trong ví dụ trên, nếu xét về mức độ hài lòngđối với quy định mới này, thì nhóm (1) cao hơn nhóm (2), nhóm (2) hàilòng hơn nhóm (3) Nhưng không thể xác định được mức độ cao thấpgiữa các nhóm, mặt khác sự chênh lệch giữa các nhóm cũng không nhấtthiết phải bằng nhau Các con số 1, 2, 3… được gán cho các nhóm không

có giá trị số học thuần túy, nên không thực hiện được các phép tính sốhọc đối với chúng Trong thực tế cần phải hết sức tránh sai lầm này

Trang 11

Thang đo thứ bậc được dùng nhiều trong điều tra tâm lý xã hội.Những câu hỏi về mức độ hài lòng, khó khăn, sự đồng tình, phản đối, cáccâu hỏi cần xếp theo thứ tự ưu tiên… đều sử dụng thang đo thứ bậc

Thang đo khoảng:

Là thang đo thứ bậc có các khoảng cách đều nhau nhưng không cóđiểm gốc là 0 Nếu có các điểm A, B, C, D xếp lần lượt trên thang đokhoảng, và thoả mãn A > B, B > C thì cũng sẽ có A - B = B - C Hiệu sốgiữa hai điểm đứng liền nhau được gọi là tiêu chuẩn đo (hay đơn vị đo).Trong thang đo độ bách phân () khoảng cách giữa hai vạch đứng liềnnhau là 1oC chính là tiêu chuẩn đo Nhờ có tiêu chuẩn đo này, nên có thểthực hiện được các phép tính cộng, trừ, tính được các tham số đặc trưngnhư trung bình, phương sai, tỷ lệ và gọi nó là thang đo định lượng

Đặc điểm cơ bản của thang đo khoảng là chưa có giá trị “0 tuyệtđối”, mà đó chỉ là số 0 quy ước Ví dụ, trong thang đo độ bách phân,điểm 0 (0oC) chỉ là điểm được quy ước, tại đó nước chuyển sang thể rắn,còn nhiệt độ lại có thể xuống đến các điểm dưới 0 Đặc điểm này dẫn đếnviệc so sánh tỷ lệ giữa các trị số đo không có ý nghĩa Ví dụ: Nhiệt độtrung bình của thành phố A là 30oC, thành phố B là 10oC, ta không thểnói thành phố A nóng gấp 3 lần thành phố B

Trong thực tế nghiên cứu xã hội, nhiều thang đo thứ bậc được dùngnhư thang đo khoảng, tức là đã có những cải tiến thang đo thứ bậc theohướng thang đo khoảng nhằm định lượng sự hơn, kém theo một dấu hiệu

Trang 12

nào đó Cũng với ví dụ đã đề cập ở phần trên, ta có thể chuyển thành câuhỏi khác: “Xin cho biết mức độ hàì lòng của Anh (Chị) về quy định sinhviên không nộp học phí đúng hạn sẽ bị đuổi học bằng cách cho điểm trênthang đo sau” (Nếu hoàn toàn không hài lòng, thì cho 0 điểm, nếu hoàntoàn hài lòng, xin cho 10 điểm).

Mặc dù ở đây đã lượng hoá được phần nào mức độ hài lòng củangười được hỏi về quy định mới này Nhưng chưa có tiêu chuẩn cụ thểcho mỗi bậc của thang đo Việc cho mấy điểm hoàn toàn do cảm tính củangười được hỏi, mà chưa có chuẩn chính thức buộc mọi người phải tuântheo Nó chưa phải là một thang đo khoảng thực sự Thang điểm trongnhà trường hiện nay cũng được xây dựng theo cách thức này

Thang đo tỷ lệ:

Là thang đo khoảng với một điểm 0 tuyệt đối (điểm gốc) trên thang

đo Nhờ điểm gốc và một tiêu chuẩn đo cụ thể, ta có thể sử dụng đượcmọi công cụ toán - thống kê để phân tích dữ liệu, so sánh được tỷ lệ giữacác trị số đo Chẳng hạn, thu nhập bình quân mỗi tháng của ông N là 2triệu đồng, của bà B là 1 triệu đồng, có thể nói thu nhập của ông N gấpđôi bà B Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường các hiệntượng kinh tế - xã hội, như: thu nhập, chi tiêu, thời gian lao động, tuổi, sốcon Các đơn vị đo lường vật lý thông thường (kg, mét, lít ) cũng làcác thang đo loại này

Theo tuần tự, thang đo sau có chất lượng đo lường cao hơn thang

đo trước, đồng thời việc xây dựng thang đo cũng phức tạp hơn Songkhông phải cứ sử dụng thang tỷ lệ là tốt nhất, mà phải tuỳ thuộc vào đặcđiểm của hiện tượng và tiêu thức nghiên cứu mà chọn thang đo thích hợp

Trang 13

Hai loại đầu chưa có tiêu chuẩn đo (đơn vị đo), thuộc loại thangđịnh tính Đó là loại thang đo mà khi thay đổi từ giá trị này sang giá trịkhác thì đối tượng đo đã có sự thay đổi về chất, chúng phù hợp với việc

đo lường các tiêu thức thuộc tính Hai loại sau đã có tiêu chuẩn đo, khichuyển từ một điểm này sang điểm khác trên thang thì có sự thay đổi vềlượng, nhưng chưa chắc đã có sự thay đổi về chất Đây là loại thang đođịnh lượng, phù hợp để đo lường các tiêu thức số lượng

Như trên đã chỉ rõ, không phải mọi loại thang đo đều sử dụng đượccác công cụ phân tích như nhau Vì vậy, việc phân tích, hiểu rõ các loạithang đo còn cho phép sử dụng có hiệu quả hơn các công cụ thống kê -toán trong phân tích thông tin Theo tuần tự của 4 loại thang đo đã nêu,việc đo mức độ tập trung, phân tán và mối liên hệ của hiện tượng nghiêncứu cũng tăng dần Với thang định danh, ta chỉ có thể tính được tỷ lệ (%)phân bố của tổng thể cho từng biểu hiện và tính Mode (Mo) Sử dụngthang thứ bậc, ta có thêm được trung vị (Me), hệ số tương quan cặp vàriêng phần Muốn thực hiện được các phép tính cộng, trừ, tính được trungbình, phương sai, tỷ lệ, các hệ số và tỷ số tương quan thì phải sử dụng cácthang đo khoảng Và với thang đo tỷ lệ, ta có thể sử dụng mọi độ đothống kê Như vậy, ở mức độ đo lường càng cao, khả năng áp dụng cáccông cụ thống kê - toán càng nhiều hơn Tuy nhiên, việc lựa chọn và sửdụng thang đo nào cho từng trường hợp nghiên cứu để có hiệu quả cao làhết sức cần thiết Chẳng hạn như khi dùng tỷ lệ % phân bố của tổng thểcho từng biểu hiện đối với thang định lượng có quá nhiều lượng biến cóthể làm cho việc phân tích bị rối, gặp nhiều khó khăn, khó tìm ra thựcchất của vấn đề

3 Biến số và các kiểu biến số

3.1 Biến số (variable):

Trang 14

Biến số là một đơn vị thông tin mà nhà nghiên cứu cần tìm hiểu, khai thác Một biến là những đại lượng có thể mang các giá trị khác nhau, ví dụ giới tính (nam, nữ); tôn giáo; trình độ học vấn; thái độ đối vớihọc tập…

Trong bảng điều tra, biến số là một đơn vị thông tin được thu thập

từ một câu hỏi cụ thể Tuy nhiên, tùy nghiên cứu mà nhà nghiên cứu cóthể thiết kế loại câu hỏi đơn biến (cho biết 1 loại thông tin) và câu hỏi đabiến (cho biết cùng lúc nhiều thông tin)

Ví dụ: Câu hỏi đơn biến (người trả lời chỉ được lựa chọn 1 thông tin phù hợp nhất)

Câu 1: Nghề nghiệp chính của ông bà/anh chị:

- Chế biến sản phẩm nông nghiệp - Công nhân/lao động tự do   Với câu hỏi này, người trả lời chỉ có thể chọn 1 phương án đúng với bản thân mình nhất.

Câu hỏi đa biến: Cùng 1 lúc người được hỏi có quyền lựa chọn ít nhất từ 1 trở lên các phương án trả lời

Câu 10 Anh chị cho biết gia đình mình có những tài sản nào dưới đây?

- Ti vi:  - Tủ lạnh:  - Máy móc nông cụ: 

- Điều hoà nhiệt độ - Máy vi tính kết nối internet:  

Với câu hỏi này, người trả lời có thể chọn 2 hay nhiều phương án.

Trang 15

3.2 Các loại biến số

Trong thống kê,người ta phân biệt hai loại biến đó là biến định tính

và biến định lượng:

Biến định tính (quatitative variables)

Là những biến mà người ta gán cho các giá trị để phân biệt hayphân loại các quan sát Đây là biến lập nhóm (categorical variables), trị

số của chúng được xác định bằng các thang đo định danh hoặc thang đothứ bậc dưới dạng mã số hoặc chuỗi ngắn

Với biến định tính ta không thể sử dụng các phép toán (cộng, trừ,nhân, chia) để tính toán các giá trị trên biến đó, ngược lại biến định lượngcho phép ta thao tác các phép toán trên các giá trị mà nó đại diện Việcxác định dạng biến theo cách này cho phép ta lựa chọn được tham sốthống kê tương thích để phân tích

Ví dụ: Giới tính (nam, nữ); Trình độ học vấn (Mù chữ, tiểu học, trung học, cao đẳng, đại học, trên đại học)…; Thu nhập (thấp, trung bình, khá, cao…)

Biến định lượng (quantitative variables)

Là những biến mà các giá trị của chúng được xác định bằng cácthang đo khoảng nên trị số của chúng luôn để dưới dạng số Biến địnhlượng cho phép ta thao tác các phép toán trên các giá trị mà nó đại diện

Ví dụ: Thu nhập ( 200.000đ; 220.000đ; 211.000đ…), tuổi (15; 17; 19; 18; 16…), số lượng tài sản có trong gia đình: Tivi; tủ lạnh, xe máy…

Trong khi phân tích, người ta cũng cần phân biệt hai loại biến, biếnđộc lập và biến phụ thuộc và tìm hiểu mối quan hệ giữa chúng

Biến độc lập (independent variable)

Trang 16

Biến độc lập là một đặc tính được lựa chọn để nghiên cứu Biếnđộc lập được giả thuyết là một biến mà sự biến đổi của nó có ảnh hưởngchi phối hoặc gây ra những biến đổi kéo theo ở một biến khác.

Biến phụ thuộc (dependent variable)

Biến phụ thuộc là một biến mà sự biến đổi của nó chịu sự chi phối(đáp ứng) của 1 biến khác Một biến được gọi là biến phụ thuộc khi giá trịcủa nó tuỳ thuộc vào giá trị của biến độc lập Nó chính là hiệu quả giảđịnh của biến độc lập

Lưu ý: Việc xác định một biến là độc lập và phụ thuộc thường có tính chất tương đối Một biến có thể được xem là phụ thuộc trong phạm

vi phân tích này lại là độc lập trong phạm vi phân tích khác.

Trong nghiên cứu còn có những yếu tố ảnh hưởng không đượckiểm soát (hay không được quan sát một cách có hệ thống) được gọi làcác biến bổ trợ

4 Một số khái niệm trong đo lường thống kê

4.1 Yếu vị (mode)

Yếu vị là tên gọi của loại đo lường có tần số lớn nhất Dạng nàythường được dùng đối với dạng dữ liệu thang đo định danh Giống nhưtrung vị, mode không bị ảnh hưởng bởi giá trị đầu mút của dãy phân phối

Ví dụ: Trong kết quả thông kế về giới tính của người lao động trong một công ty có kết quả sau:

Nam giới chiếm 65%

Nữ giới chiếm 45%

Như vậy yếu vị (mode) của kết quả thống kê này là 65% Nói cách khác là: Giá trị Mode của kết quả thông kê là 65%.

4.2 Trung vị (median)

Trang 17

Là số nằm giữa (nếu lượng quan sát là số lẻ) hoặc là giá trị trungbình của hai quan sát nằm giữa (nếu số lượng quan sát là số chẵn) củamột dãy quan sát được xắp xếp theo thứ tự từ nhỏ đến lớn Đây là dạngcông cụ thống kê thường được dùng để đo lường mức độ tập trung củadạng dữ liệu thang đo thứ tự, nó có đặc điểm là không bị ảnh hưởng củacác giá trị đầu mút của dãy phân phối, do đó rất thích hợp để phân tíchđối với dữ liệu có sự chênh lệch lớn về giá trị ở hay đầu mút của dãy phânphối.

Trung vị của một tập hợp đo lường là trị số rơi vào chính giữa khicác số đo lường ấy được xếp đặt theo thứ tự độ lớn của chúng

Trang 18

Trung bình cộng của một tập hợp các số đo lượng là tổng số cộngcác đo lường chia cho N (tổng số) của đo lường ấy.

* Điểm trung vị chỉ số IQ nhóm B là 108,5

4.4 Phương sai (varian)

Dùng để đo lường mức độ phân tán của một tập các giá trị quan sátxung quanh giá trị trung bình của tập quan sát đó Phương sai bằng trungbình các bình phương sai lệch giữa các giá trị quan sát đối với giá trịtrung bình của các quan sát đó Người ta dùng phương sai để đo lườngtính đại diện của giá trị trung bình tương ứng, các tham số trung bình cóphương sai tương ứng càng lớn thì giá trị thông tin hay tính đại diện củagiá trị trung bình đó càng nhỏ

Phương sai cũng là một phép đo đánh giá mức độ phân tán hoặcthay đổi của một phân bố điểm Phương sai chính là bình phương độ lệchchuẩn

4.5 Độ lệch chuẩn (Standard deviation), độ biến thiên, sai số chuẩn:

Một công cụ khác dùng để đo lường độ phân tán của dữ liệu xungquanh giá trị trung bình của nó Độ lệch chuẩn chính bằng căn bậc hai củaphương sai Vì phương sai là trung bình của các bình phương sai lệch của

Trang 19

cho các giá trị rất lớn, do đó sử dụng phương sai sẽ gặp khó khăn trongviệc diễn giải kết quả Sử dụng độ lệch chuẩn sẽ giúp dễ dàng cho việcdiễn giải do các kết quả sai biệt đưa ra sát với dữ liệu gốc hơn.

Hệ số biến thiên (coefficient of variation): Một cách để định lượnghóa độ lệch chuẩn tương quan với số trung bình là lấy độ lệch chuẩn chiacho số trung bình và nhân với 100

Sai số chuẩn (Standard erro): Lấy độ lệch chuẩn chia cho căn bậchai của số cỡ mẫu

4.6 Tương quan

Tương quan (correlation) là một số đo lường về mối liên hệ độclập hay phụ thuộc giữa hai biến số Nếu hệ số R (tương quan) càng lớn thìmức độ phụ thuộc thuộc tuyến tính giữa hai biến càng chặt Còn nếu Rcàng nhỏ thì mức độ phụ thuộc giữa hai biến càng yếu Trong trường hợp

R = 0 thì hai biến không có sự phụ thuộc Khi đó người ta nói hai biến đókhông tương quan

Hệ số tương quan có thể là dương (+) hoặc (-) hay = 0 Nếu Rdương, điều đó có nghĩa là khi giá trị một biến tăng lên thì giá trị của biếnkia cũng tăng lên theo một chiều hướng Ngược lại nếu r âm thì giá trị củabiến kia thay đổi theo chiều hướng ngược lại Trị tuyệt đối của r nói lên

độ mạnh của sự tương quan theo chiều thuận hoặc nghịch Trị tuyệt đốitối đa của r là 1.00 Khi không có tương quan nào giữa hai biến, trị số r =0

Đánh giá mức độ tương quan theo các mức sau đây:

Từ 0,80 đến 1: tương quan cao, đáng tin cậy

Từ 0,60 đến 0,79: tương quan vừa phải và đáng kể

Từ 0,40 đến 0,59: tạm được

Từ 0,20 đến 0,39: tương quan ít

Trang 20

Từ 0,00 đến 0,19: tương quan không đáng kể hay tương quan domay rủi.

4.7 Kiểm nghiệm giả thuyết (Hypothesis testing)

Bên cạnh việc ước lượng các đặc trưng của tổng thể, các dữ liệumẫu thu thập được còn được dùng để đánh giá xem một giả thuyết nào đó

về tổng thể là đúng hay sai Ta gọi đó là kiểm nghiệm giả thuyết Nóicách khác kiểm nghiệm giả thuyết là dựa vào các thông tin mẫu để đưa rakết luận bác bỏ hay chấp nhận về giả thuyết của tổng thể

Ví dụ: công ty muốn tìm hiểu xem sở thích của người tiêu dùng về kiểu dáng, màu sắc, mùi vị khác nhau về sản phẩm cuả công ty Họ thích đặc biệt một kiểu dáng nào đó, một màu sắc nào đó, hay các kiểu dáng, màu sắc khác nhau đều được ưa thích như nhau.

Phương pháp kiểm nghiệm giả thuyết sẽ giúp giải quyết nhưng yêu cầu này

Để kiểm nghiệm giả thuyết ta phải xây dựng giả thuyết Giả thuyết

đã hình thành được gọi là giả thuyết H0 được xem như đúng cho đến khi

ta có đủ căn cứ để kết luận khác hơn Nếu giả thuyết H0 không đúng thìphải có một giả thuyết nào đó khác H0 gọi là H1 là đúng

Câu hỏi thực hành

Câu 1: Dùng các loại thang đo để phân loại các biến số trong bảng hỏi dưới đây thành các kiểu biến định danh, thứ bậc, khoảng và tỷ lệ

BẢNG TRƯNG CẦU Ý KIẾN

Với mục đích tìm hiểu những khó khăn mà các em học sinh gặp phải trong quá trình lựa chọn nghề nghiệp, chúng tôi mong nhận được những đóng góp của thầy cô bằng cách đánh dấu (x) vào các phương án trả lời mà thầy cô cho là phù hợp ở từng câu hỏi dưới đây.

Trang 21

Kết quả nghiên cứu được đảm bảo bí mật và chỉ được dùng vào công tác nghiên cứu khoa học.

Cảm ơn sự tham gia của thầy cô.

Câu 1 Thầy cô bắt đầu hướng dẫn học sinh lựa chọn nghề nghiệp từ thời điểm nào?

3 Cơ sở đào tạo nghề

4 Tại các cơ sở sản xuất

Câu 3 Thầy cô vui lòng cho biết sự chỉ dẫn của thầy cô tới học sinh

về những nội dung dưới đây hiện ở mức độ nào ?,

đầy đủ

Tương đối đủ

Sơ qua

1. Những công việc cụ thể của người làm nghề

2 Giá trị kinh tế - xã hội của nghề

3 Tiền lương, thu nhập, cơ hội thăng tiến

trong nghề

4 Năng khiếu, thiên hướng của học sinh

5 Năng lực hiện có của học sinh đảm bảo

giúp các em thành công với nghề đã chọn

sau này

6 Những phẩm chất tính cách hiện có giúp

học sinh

7 Những đặc điểm thể chất, sức khỏe giúp

học sinh thành công với nghề sau này

Câu 4 Giá trị nào dưới đây của nghề nghiệp được thầy cô đặc biệt quan tâm và giáo dục học sinh lựa chọn theo? (Đánh giá theo thang

Trang 22

điểm 10, trong đó 1 điểm ra không quan trọng và 10 điểm là rất quan trọng)

9 Được làm việc gần gia đình

10 Cống hiến được nhiều cho cộng đồng, xã hội

Câu 5 Thầy cô vui lòng cho biết nhà trường và thầy cô đã thực hiện những hoạt động nào trong số những hoạt động được liệt kê dưới

đây?

Stt Hình thức hoạt động hướng nghiệp Thường

xuyên

Thỉnh thoản

g

Khôn

g bao giờ

1 Lập hồ sơ hướng nghiệp cho từng học sinh

2 Đo các chỉ số tâm lý (IQ, Tính cách, năng

lực…) cho học sinh nhằm phục vụ cho việc

tư vấn nghề

3 Tổ chức các buổi tư vấn hướng nghiệp, chọn

nghề cho học sinh

4 Cung cấp thông tin về thị trường lao động,

cơ hội việc làm của các ngành nghề có trong

xã hội cho học sinh tham khảo thông qua

môn GDHN

5 Mời các chuyên gia, thợ lành nghề tham gia

các buổi sinh hoạt GDHN theo chương trình

của Bộ GD-ĐT

Trang 23

sản xuất, kinh doanh để định hướng cho sự

lựa chọn nghề của học sinh

Câu 6 Theo thầy cô, yếu tố nào dưới đây có ảnh hưởng nhiều nhất

quyết định chọn nghề của học sinh.?

toàn đúng

Đúng 1 phần

Không đúng

1. Chương trình GDHN trong nhà trường

2 Các thầy cô giáo thông qua các buổi học trên

Trang 24

CHƯƠNG 2: MÃ HÓA VÀ TẠO ĐỊNH NGHĨA BIẾN TRONG

Sản phẩm SPSS được viết tắt từ Statistical Products for the Social

Services, có nghĩa là Các sản phẩm Thống kê cho các dịch vụ xã hội.

Phiên bản mới nhất là SPSS 17.0

SPSS là một hệ thống phần mềm thống kê toàn diện được thiết kế

xử lý thông tin sơ cấp (thông tin được thu thập trực tiếp từ đối tượngnghiên cứu (người trả lời bảng câu hỏi) thông qua một bảng câu hỏi đượcthiết kế sẳn

1.2 Các bộ phận của hệ thống SPSS

SPSS Professional Statistisc: Cung cấp các kỹ thuật để phân tích

dữ liệu dạng không thích hợp với mô hình tuyến tính truyền thống

SPSS Addvance Statistisc: Tập trung vào các kỹ thuật được dùngtrong các thí nghiệm sinh học và phức tạp

SPSS Tables: Xây dựng một loạt các báo cáo dạng bảng biểu cóchất lượng trình bày cao, và phức tạp

SPSS Trends: Thực hiện các phép dự đoán và phân tích dãy số thờigian phức tạp bao gồm xây dựng các mô hình cho dữ liệu đa biến phituyến tính, các mô hình san bằng, và các phương pháp để ước lưọng cáchàm tự hồi quy

1.3 Các dạng màn hình SPSS

1.3.1 Màn hình quản lý dữ liệu (data view):

Trang 25

Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồmcột, hàng và các ô giao nhau giữa cột và hàng

- Cột (Column): Đại diện cho biến quan sát Mỗi cột sẽ chứađựng tất cả các câu trả lời trong một câu hỏi được thiết kế trong bảngcâu hỏi

- Hàng (Row): Đại diện cho một trường hợp quan sát (người trảlời), Ta phỏng vấn bao nhiêu người (tùy thuộc vào kích thước mẫu) thì

ta sẽ có bấy nhiêu hàng Mỗi hàng chứa đựng tất cả những câu trả lời(thông tin) của một đối tượng nghiên cứu

- Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trảlời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời

cụ thể (trường hợp quan sát)

1.3.2 Màn hình quản lý biến (variables view):

Là nơi quản lý các biến cùng với các thông số liên quan đến biến.Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cộtthể hiện các thông số liên quan đến biến đó

- Tên biến (name): Là tên đại diện cho biến, tên biến này sẽ đượchiễn thị trên đầu mỗi cột trong màn hình dữ liệu

- Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến.Dạng số, và dạng chuỗi

- Số lượng con số hiễn thị cho giá trị (Width): Giá trị dạng sốđược phép hiễn thị bao nhiêu con số

- Số lượng con số sau dấu phẩy được hiễn thị (Decimals)

- Nhãn của biến (label): Tên biến chỉ được thể hiện tóm tắc bằng

ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến

Trang 26

- Giá trị trong biến (Values): Cho phép khai báo các giá trị trongbiến với ý nghĩa cụ thể (nhãn giá trị)

- Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giátrị chỉ mang tính chất quản lý, không có ý nghĩa phân tích, để loại bỏcác biến này ta cần khai báo nó như là giá trị khuyết (user missing).SPSS mặc định giá trị khuyến (system missing) là một dấu chấm và tựđộng loại bỏ các giá trị này ra khỏi các phân tích thống kê

- Kích thướt cột (columns): Cho phép khai báo độ rộng của cột

- Ví trí (align): Vị trí hiễn thị các giá trị trong cột (phải, trái, giữa)

- Dạng thang đo (measures): Hiễn thị dạng thang đo của giá trịtrong biến

1.3.3 Màn hình hiễn thị kết quả (output):

Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu,đồi thị và các kết quả kiểm nghiệm, các kết quả này sẽ được truy xuất ramột màn hình, và được lưu giữ dưới một tập tin khác (có đuôi là SPO).Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích

1.3.4 Màn hình cú pháp (syntax):

Màn hình này cho phép ta xem và lưu trữ những cú pháp của mộtlệnh phân tích Các cú pháp được lưu trữ sẽ được sử dụng lại mà khôngcần thao tác các lệnh phân tích lại

Hình 2.a Màn hình cú pháp

Trang 27

2 Làm việc với phần mềm SPSS trên windows

2.1 Khởi động chương trình SPSS trên máy tính

Trên màn hình desktop của Windows nhắp vào biểu tượng

Hoặc mở phím Start, All programs, SPSS for Windows, SPSS12.0.1 for Windows (hoặc tùy phiên bản cài đặt)

Trang 28

Hình 2.1 Khởi động SPSS

Trang 29

Sẽ xuất hiện cửa sổ SPSS Data Editor và một hộp thoại như sau:

Run the tutorial: Chạy chương trình trợ giúp

Type in data: Nhập dữ liệu mới

Run an existing query: Chạy một truy vấn dữ liệu đã có sẵn

Create new query using Database Wizard: Lập một truy vấn

dữ liệu sử dụng Database Wizard

 Open an existing data source: Mở file dữ liệu đã có sẵn

(Chú ý: Hộp thoại này chỉ xuất hiện một lần khi bạn khởi độngSPSS)

Bảng chọn {Menu}

Rất nhiều nhiệm vụ bạn muốn tiến hành với SPSS bắt đầu với việc lựa chọn các menu {trình đơn} Từng cửa sổ trong SPSS có các menu

riêng của nó với các lựa chọn menu thích hợp cho loại cửa sổ đó

Hai menu Analysis và Graphs là có sẵn đối với mọi loại cửa sổ,làm cho việc tạo các kết xuất mới rất nhanh chóng mà không phải chuyểnđổi giữa các cửa sổ

Thanh công cụ {Toolbars}

Từng cửa sổ SPSS có các thanh công cụ riêng của nó cho phép truycập nhanh đến các nhiệm vụ thông dụng Có một số cửa sổ có hơn mộtthanh công cụ

Hình 2.2: Thanh công cụ với trợ giúp chỉ dẫn công cụ {ToolTip Help}

Có thể điều khiển thanh công cụ theo nhiều cách:

Hiện hoặc ẩn các biểu tượng

Trình bày thanh công cụ theo phương nằm ngang hay thẳng đứng,gắn bên trên, dưới, trái hoặc phải

Để ẩn hiện một thanh công cụ

Trang 30

Thực hiện theo cú pháp sau: Từ thanh Menu/View/Toolbar

Trong hộp thoại Show Toolbar, chọn thanh công cụ mà bạn muốn

mở (hoặc ẩn)

2.2 Làm quen với màn hình SPSS

Phần mềm SPSS có tất cả 4 dạng màn hình:

2.2.1 Màn hình quản lý dữ liệu (data view):

Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệubao gồm cột, hàng và các ô giao nhau giữa cột và hàng

+ Cột (Column): Đại diện cho biến quan sát Mỗi cột sẽ chứa đựngtất cả các câu trả lời trong một câu hỏi được thiết kế trong bảng câu hỏi

+ Hàng (Row): Đại diện cho một trường hợp quan sát (người trảlời), Ta phỏng vấn bao nhiêu người (tùy thuộc vào kích thước mẫu) thì ta

sẽ có bấy nhiêu hàng Mỗi hàng chứa đựng tất cả những câu trả lời (thôngtin) của một đối tượng nghiên cứu

+ Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trảlời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụthể (trường hợp quan sát)

Hình 2.3 Màn hình quả lý dữ liệu (Data view)

Trang 31

2.2.2 Màn hình quản lý biến (variables view):

Là nơi quản lý các biến cùng với các thông số liên quan đến biến.Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cộtthể hiện các thông số liên quan đến biến đó

 Tên biến (name): Là tên đại diện cho biến, tên biến này sẽ đượchiển thị trên đầu mỗi cột trong màn hình dữ liệu

 Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến.Dạng số, và dạng chuỗi

 Số lượng con số hiển thị cho giá trị (Width): Giá trị dạng sốđược phép hiển thị bao nhiêu con số

 Số lượng con số sau dấu phẩy được hiển thị (Decimals)

 Nhãn của biến (label): Tên biến chỉ được thể hiện tóm tắc bằng

ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến

 Giá trị trong biến (Values): Cho phép khai báo các giá trị trongbiến với ý nghĩa cụ thể (nhãn giá trị)

Cột (column)

Hàng (Row)

Ô giao (Cell)

Trang 32

 Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giátrị chỉ mang tính chất quản lý, không có ý nghĩa phân tích, đểloại bỏ các biến này ta cần khai báo nó như là giá trị khuyết(user missing) SPSS mặc định giá trị khuyến (system missing)

là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi cácphân tích thống kê

 Kích thướt cột (columns): Cho phép khai báo độ rộng của cột

 Ví trí (align): Vị trí hiển thị các giá trị trong cột (phải, trái, giữa)

 Dạng thang đo (measures): Hiển thị dạng thang đo của giá trịtrong biến

Hình 2.4 Màn hình quản lý biến (Variable view)

2.2.3 Màn hình hiển thị kết quả (output):

Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồithị và các kết quả kiểm nghiệm, các kết quả này sẽ được truy xuất ra mộtmàn hình, và được lưu giữ dưới một tập tin khác (có đuôi là SPO) Mànhình này cho phép ta xem và lưu giữ các kết quả phân tích

Hình 2.5 Màn hình hiển thị kết quả (Output)

Trang 33

2.2.4 Màn hình cú pháp (syntax):

Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnhphân tích Các cú pháp được lưu trữ sẽ được sử dụng lại mà không cầnthao tác các lệnh phân tích lại

3 Mã hóa và tạo định nghĩa cho biến dữ liệu trong spss

3.1 Mã hóa dữ liệu

3.1.1 Kiểm tra và hiệu đính dữ liệu

Đây là bước kiểm tra chất lượng thông tin trong bảng câu hỏi nhằmbảo đảm không có bảng câu hỏi nào thiếu hoặc chứa đựng những thôngtin sai sót theo yêu cầu thiết kế ban đầu, bước này cần thiết được thựchiện trước khi tiến hành mã hóa và nhập dữ liệu vào máy tính Ngườikiểm tra phải bảo đảm tính toàn vẹn và tính chính xác của từng bảng câuhỏi & từng câu trả lời trong bảng câu hỏi Thông thường bước này nhànnghiên cứu sẽ tiến hành kiểm tra những đặc tính sau của bảng câu hỏi:

Tính logic của các câu trả lời: Đôi khi trong bảng câu hỏi, do yêu

cầu nghiên cứu sẽ có những đường dẫn, những điều kiện đễ người trả lờihoặc có thể trả lời tất cả các câu hỏi hoặc có thể bỏ qua một vài câu hỏinào đó Kiểm tra tính logic của bảng câu hỏi cho phép nhà nghiên cứuloại bỏ những câu trả lời thừa, cũng như kịp thời bổ sung những phần

Trang 34

thiếu trong bảng câu hỏi Tính logic của câu trả lời còn phụ thuộc vào sựkết dính và liên hệ lẫn nhau giữa các câu hỏi trong một bảng câu hỏi (đôikhi một câu trả lời là có ý nghĩa nếu đứng riêng một mình nó những lại

vô nghĩa nếu kết hợp so sánh với các câu trả lời trước hoặc sau nó)

Tính đầy đủ của một câu trả lời và của một bảng câu hỏi: Một

bảng câu hỏi chỉ có giá trị nếu như tất cả những câu hỏi theo yêu cầu đềuđược trả lời đầy đủ Mỗi câu hỏi trong bảng câu hỏi đều có một ý nghĩa,một giá trị nghiên cứu nhất định, do đó thiếu một câu trả lời nào đó chomột câu hỏi cụ thể nào đó sẽ làm mất đi giá trị của bảng câu hỏi đó

Tính hợp lý và xác thực của các câu trả lời: Một câu trả lời đầy

đủ chưa hẳn là câu trả lời có giá trị, do đó tính chân thực và hợp lý củacâu trả lời cũng quyết định đến giá trị của câu trả lời và của bảng câu hỏi,đặc biệt là các câu hỏi chấm điểm, câu hỏi mở và các câu hỏi mang tínhlogic

Quá trình kiểm tra, rà soát lại bản câu hỏi là nhằm mục đích kiểmtra, phát hiện, sửa chửa và thông báo kịp thời cho người thu thập dữ liệutránh những sai sót tiếp theo

Để xử lý các lỗi trong kiểm tra và hiệu đính, ta có thể lựa chọncách xử lý như sau tùy thuộc vào mức độ sai sót cụ thể:

- Trả về cho bộ phận thu thập dữ liệu để làm sáng tỏ vấn đề

- Suy luận từ các câu trả lời khác

- Loại bỏ toàn bộ bảng câu hỏi

3.1.2 Mã hoá dữ liệu

Mã hóa dữ liệu giúp cho việc lưu trữ, quản lý và phân tích số liệuđược thuận tiện đồng thời giảm bớt sai sót trong quá trình nhập liệu Vềthực chất mã hóa là quá trình chuyển dịch câu trả lời thực của người trảlời vào từng nhóm, từng mẫu đại diện với các giá trị đại diện tương ứngnhằm làm cho quá trình tóm tắt, phân tích và nhập liệu được dễ dàng và

Trang 35

hiệu quả hơn Thông thường, chúng ta mã hóa những phương án trả lờicủa khách thể từ dạng chuỗi (ký tự) thành dạng số.

Có hai dạng mã hóa:

Tiền mã hóa: Là việc mã hóa cho các câu hỏi đóng Do đặc điểm

của các loại câu hỏi này là nhà nghiên cứu đã có sẵn các câu trả lời từtrước, người trả lời chỉ việc lựa chọn câu trả lời nào phù hợp nhất với ýkiến của mình, do đó việc mã hóa cho các câu hỏi này thường được tiếnhành từ trước, ở giai đoạn thiết kế bảng câu hỏi

Mã hoá: Trong bảng câu hỏi ngoài những câu hỏi đóng nêu ở trên,

còn những câu hỏi mở, là những câu hỏi mà người trả lời tự do đưa ra câutrả lời theo suy nghĩ và diễn giải của chính họ Các bảng câu hỏi nhận vềthường có những câu trả lời rất khác nhau và rất đa dạng Do đó côngviệc mã hóa những câu trả lời này thì cần thiết cho quá trình kiểm tra,nhập liệu, tóm tắt và phân tích sau này

Mục đích của mã hóa là tạo nhãn cho các câu trả lời, thường làbằng các con số Mã hóa còn giúp giảm thiểu số lượng các câu trả lờibằng cách nhóm các câu trả lời vào những nhóm có cùng ý nghĩa Tiềntrình mã hóa có thể được tiến hành như sau:

Trang 36

Đầu tiên, xác định loại câu trả lời cho những câu hỏi tương ứng.Những câu trả lời này có thể thu thập từ một mẫu các bảng câu hỏi đãhoàn tất, thường là 25% trên tổng số bảng câu hỏi

Bước tiếp theo là xây dựng một danh sách liệt kê các câu trả lời,các câu trả lời được liệt kê và tiến hành nhóm các câu trả lời theo nhữngnhóm đặc trưng (có cùng ý nghĩa)

Cuối cùng, những nhóm câu trả lời này được gán cho một nhãnhiệu, một giá trị, thường là một con số cụ thể

Ví dụ: Tạo mã code cho câu 1, câu 2, phiếu điều tra tâm lý chọn nghề của học sinh (Phiếu BT1)

Câu 1: Theo em, việc chọn nghề được xem là? (chọn 1 phương án trả lời)

1 Là một công việc quan trọng, cần có những suy nghĩ, Mã code = 1

cân nhắc chín chắn.:

2 Là một công việc quan trọng như nhiều việc quan trọng khác Mã code = 2

như học tập, giao tiếp

3 Là một công việc buộc phải nghĩ tới khi sắp phải ra trường. Mã code = 3

4 Là một công việc bình thường như bao công việc bình thường khác Mã code = 4

Câu 2: Theo em, học sinh nên tính tới việc lựa chọn nghề nghiệp từ thời điểm nào là thích hợp? (chọn 1 phương án trả lời)

Nguyên tắc cần thực hiện khi tạo mã code

- Cần thống nhất cách đặt mã code theo nguyên tắc: Từ nhỏ đến lớn;

Từ trái qua phải; Từ trên xuống dưới

Trang 37

- Nhiều người nhập dữ liệu nhưng phải thống nhất trước bảng mãcode trước khi làm.

- Với câu hỏi mở, người nhập dữ liệu cần đọc trước các câu trả lời,tim ra các câu trả lời có cùng 1 ý (có thể khác nhau về diễn đạt),sau đó đưa chúng vào cùng 1 nhóm Khi nhập sẽ nhập ý kiến chungcủa nhóm này

- Với câu hỏi định lượng, không cần phải mã hóa, khi nhập dữ liệu

sẽ nhập nguyên giá trị số liệu mà khách thể cung cấp Trong một sốtrường hợp cụ thể, nếu giá trị định lượng mà khách thể cung cấpkhác nhau về đơn vị tính, nhà nghiên cứu cần quy đổi chúng ra mộtđơn vị tính duy nhất để nhập vào cơ sở dữ liệu trong SPSS

Ví dụ: Câu 1 Anh chị vui lòng cho biết 1 ngày, anh chị dành ra bao

……….

Trong trường hợp này, người trả lời có thể điền thông tin là phút, hoặc giờ…; do đó khi nhập liệu cần quy đổi những câu trả lời theo đơn vị tình “giờ” ra đơn vị tính là “phút” hoặc ngược lại.

3.2 Tạo định nghĩa cho biến

Tạo biến trong màn hình quản lý biến (variables view) Công việcđịnh biến này có thể được thực hiện trước khi tiến hành nhập dữ liệu vàotrong máy

Mục đích của việc tạo biến là gán nhãn và các thông số cho cácbiến và gán ý nghĩa cho các giá trị trong biến Sau khi được mã hóa các

dữ liệu sẽ được đại diện bằng những con số và các con số này có ý nghĩakhác nhau tùy theo câu trả lời thu thập được Để các con số này có thểnhập vào máy tính và có thể quản lý cũng như có ý nghĩa trong SPSS, taphải tiến hành định biến cho dữ liệu Qui trình định biến này bao gồm cácbước sau:

Trang 38

Bước 1: Mở cửa số Variable view

Để tạo/định nghĩa biến, trước hết => mở cửa sổ Variable view.Trong cửa sổ variable view, có những cột sau:

1 Tên biến {Name}

2 Loại dữ liệu {Type}

3 Số lượng con số hoặc chữ {With}

4 Số lượng chữ số thập phân {Decimals}

5 Mô tả biến/nhãn biến {Lable} và nhãn trị số biến {Values}

6 Các trị số khuyết thiếu do người sử dụng thiết lập {Missing}

7 Độ rộng của cột {Width}

8 Căn lề {Align}

9 Thang đo {Measure}

Hình 2.6 Cửa sổ Variable view dùng để tạo định nghĩa biến

Trang 39

Bước 2: Đăt tên biến

Ta gõ tên biến cần khai báo vào cột đầu tiên trong màn hìnhVariables view (Nếu ta không gõ tên biến vào thì SPSS sẽ mặc định tênbiến này là Var000001) Tên biến được khai báo này sẽ hiển thị trên đầu

các cột trong màn hình Data view Tên biến bị hạn chế về số ký tự hiểnthị, do đó cần thiết phải khai báo ngắn gọn và dễ gợi nhớ, thông thườngnên đặt theo thứ tự câu hỏi trong bảng câu hỏi như cau1, cau2, cau3, …

Có một số qui ước sau đây phải tuân theo khi khai báo tên biến:

Các qui tắc dưới đây được áp dụng cho tên biến:

- Tên phải bắt đầu bằng một chữ Các ký tự còn lại có thể là bất kỳchữ nào, bất kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $

- Tên biến không được kết thúc bằng một dấu chấm

- Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần (đểtránh xung đột với các biến được tự động lập bởi một vài thủ tục)

- Độ dài của tên biến không vượt quá 8 ký tự

- Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được

sử dụng

- Từng tên biến phải đơn chiếc/duy nhất; không được phép trùng lặp.Không được dùng chữ hoa để đặt tên biến Các tên NEWVAR,NewVar, và newvar được xem là giống nhau

-  Các từ khóa sau đây không được dùng làm tên biến: ALL, NE,

EQ, TO, LE, LT, BY OR, GT, AND, NOT, GE, WITH

Hình 2.7 Cách thức đặt tên cho biến

Trang 40

Bước 3: Xác định kiểu biến (Type)

Định ra kiểu biến (Type): Có các dạng biến sau có thể định dạng.Dạng con số (numeric); Dạng tiền tệ; dạng ngày (Date) hoặc dạng chuỗi(String) Ngoài ra phần này cũng cho phép ta định dạng các dạng số được

hiễn thị khác nhau (Xem hình 3.2)

Tùy thuộc vào yêu cầu của dữ liệu, mà ta sẽ định loại biến chobiến, SPSS mặc định loại biến là kiểu số (numeric); ngoài ra còn có thểkhai báo các kiểu hiển thị số khác nhau như kiểu số có dấu phẩy(Comma) hay dấu chấm (Dot) ngăn cách giữa các khoảng cách hàng ngàncủa con số; cách hiễn thị theo các ký hiệu khoa học (Scientific notation);Hiễn thị ngày, dollar và các kiểu tiền tệ khác; cuối cùng là cách hiễn thịdạng chuỗi

Xác định số lượng con số hiển thị cho giá trị (Width) và số lượngcon số sau dấu phẩy hiển thị (Decimals): Khai báo bề rộng của con số(hàng đơn vị, hàng trăm, hàng triệu, …) trong ô Width, Và khai báo sốcon số thập phân sau dầu phẩy trong ô Decimal

Hình 2.8: Hộp thoại Variable Type

Ngày đăng: 09/09/2013, 23:12

HÌNH ẢNH LIÊN QUAN

Stt Hình thức hoạt động hướng nghiệp Thường xuyên - Bài giảng môn xử lý số liệu thống kê SPSS
tt Hình thức hoạt động hướng nghiệp Thường xuyên (Trang 22)
Hình 2.1. Khởi động SPSS - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 2.1. Khởi động SPSS (Trang 28)
Hình 2.1. Khởi động SPSS - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 2.1. Khởi động SPSS (Trang 28)
2.2.4. Màn hình cú pháp (syntax): - Bài giảng môn xử lý số liệu thống kê SPSS
2.2.4. Màn hình cú pháp (syntax): (Trang 33)
Hình 2.10. Tạo một nhãn mới - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 2.10. Tạo một nhãn mới (Trang 42)
Hình 3.1: File dữ liệu làm việc trong DataView - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.1 File dữ liệu làm việc trong DataView (Trang 47)
Hình 3.1: File dữ liệu làm việc trong Data View - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.1 File dữ liệu làm việc trong Data View (Trang 47)
Hình 3.2: Kiểm tra dữ liệu bằng Explore - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.2 Kiểm tra dữ liệu bằng Explore (Trang 51)
Hình 3.2: Kiểm tra dữ liệu bằng Explore - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.2 Kiểm tra dữ liệu bằng Explore (Trang 51)
Hình 3.3. Hộp thoại Expore - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.3. Hộp thoại Expore (Trang 52)
Hình 3.4. Biểu đồ cành lá hiển thị các giá trị ngoại lai - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.4. Biểu đồ cành lá hiển thị các giá trị ngoại lai (Trang 53)
Hình 3.4.  Biểu đồ cành lá hiển thị các giá trị ngoại lai - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.4. Biểu đồ cành lá hiển thị các giá trị ngoại lai (Trang 53)
Hình 3.5. Hộp thoại Frequencies - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.5. Hộp thoại Frequencies (Trang 57)
Hình 3.7. Hộp thoại Crosstabs - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.7. Hộp thoại Crosstabs (Trang 60)
Hình 3.7. Hộp thoại Crosstabs - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.7. Hộp thoại Crosstabs (Trang 60)
Bước 3. Đọc bảng kết quả - Bài giảng môn xử lý số liệu thống kê SPSS
c 3. Đọc bảng kết quả (Trang 61)
Hình 3.9: Các đối tượng được lọc trong Data Editor - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.9 Các đối tượng được lọc trong Data Editor (Trang 66)
Hình 3.9: Các đối tượng được lọc trong Data Editor - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 3.9 Các đối tượng được lọc trong Data Editor (Trang 66)
Hình 4.1. Hộp thoại Compute Variable - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.1. Hộp thoại Compute Variable (Trang 68)
Hình 4.3. Hộp thoại compute dùng để tính toán lại các giá trị của biến - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.3. Hộp thoại compute dùng để tính toán lại các giá trị của biến (Trang 70)
Hình 4.4. Hộp thoại lựa chọn trường hợp - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.4. Hộp thoại lựa chọn trường hợp (Trang 72)
Hình 4.5. Hộp thoại lựa chọn trường hợp if - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.5. Hộp thoại lựa chọn trường hợp if (Trang 73)
Hình 4.7: Hộp thoại các trị số cần đếm - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.7 Hộp thoại các trị số cần đếm (Trang 75)
Hình 4.7: Hộp thoại các trị số cần đếm - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.7 Hộp thoại các trị số cần đếm (Trang 75)
Hình 4.8. Màn hình mã hóa lại biến recode - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.8. Màn hình mã hóa lại biến recode (Trang 78)
Hình 4.10. Hộp thoại chuyển từ biến cũ sang biến mới - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.10. Hộp thoại chuyển từ biến cũ sang biến mới (Trang 79)
Hình 4.13: Hộp thoại Select Cases - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 4.13 Hộp thoại Select Cases (Trang 83)
1. Lập bảng phân bố tần suất cho một biến trả lời - Bài giảng môn xử lý số liệu thống kê SPSS
1. Lập bảng phân bố tần suất cho một biến trả lời (Trang 87)
Hình 6.1: Hộp thoại Frequencies - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.1 Hộp thoại Frequencies (Trang 87)
Hình 6.3: Hộp thoại Frequencies: Output – spss viewer - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.3 Hộp thoại Frequencies: Output – spss viewer (Trang 88)
Hình 6.4: Hộp thoại Descriptives - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.4 Hộp thoại Descriptives (Trang 90)
Hình 6.5.  Hộp thoại Descriptives : options - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.5. Hộp thoại Descriptives : options (Trang 91)
Hình 6.8: Hộp thoại Crosstabs: Statistic - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.8 Hộp thoại Crosstabs: Statistic (Trang 94)
Hình 6.10. Hộp thoại Crosstabs - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.10. Hộp thoại Crosstabs (Trang 96)
Hình 6.11. Hộp thoại Crosstabs: Cell Display - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.11. Hộp thoại Crosstabs: Cell Display (Trang 96)
Hình 6.11. Hộp thoại Crosstabs: Cell Display - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.11. Hộp thoại Crosstabs: Cell Display (Trang 96)
Hình 6.10. Hộp thoại Crosstabs - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.10. Hộp thoại Crosstabs (Trang 96)
Hình 6.11. Màn hình Output - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.11. Màn hình Output (Trang 97)
Hình 6-14. Hộp thoại Mean - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6 14. Hộp thoại Mean (Trang 106)
Hình 6-14. Hộp thoại Mean - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6 14. Hộp thoại Mean (Trang 106)
Hình 6.15. Hộp thoại Means: Options - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.15. Hộp thoại Means: Options (Trang 107)
Hình 6.16: Thao tác với Compare Means - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.16 Thao tác với Compare Means (Trang 108)
Hình 6.17. Hộp thoại Means - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.17. Hộp thoại Means (Trang 108)
Bước 4: Đọc kết quả trên màn hình Output - Bài giảng môn xử lý số liệu thống kê SPSS
c 4: Đọc kết quả trên màn hình Output (Trang 109)
Hình 6.18. Hộp thoại Means: Options - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.18. Hộp thoại Means: Options (Trang 109)
Hình 6.20: Hộp thoại One – sample T-Test - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.20 Hộp thoại One – sample T-Test (Trang 111)
Hình 6.22. Thao tác kiểm định One – sample T-Test - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.22. Thao tác kiểm định One – sample T-Test (Trang 112)
Hình 6.24: Kiểm định t.test 2 mẫu độc lập - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.24 Kiểm định t.test 2 mẫu độc lập (Trang 115)
Hình 6.24: Kiểm định t.test 2 mẫu độc lập - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.24 Kiểm định t.test 2 mẫu độc lập (Trang 115)
Hình 6.26(1;2,3): Các bước so sán ht test - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.26 (1;2,3): Các bước so sán ht test (Trang 118)
Hình 6.26(1;2,3): Các bước so sánh t test - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.26 (1;2,3): Các bước so sánh t test (Trang 118)
Hình 6.27. So sánh từng cặp mẫu - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.27. So sánh từng cặp mẫu (Trang 121)
Hình 6.27. So sánh từng cặp mẫu - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 6.27. So sánh từng cặp mẫu (Trang 121)
Hình 8.6 - Bài giảng môn xử lý số liệu thống kê SPSS
Hình 8.6 (Trang 129)
PHIẾU TRƯNG CẦU Ý KIẾN (Nguyễn Thuỳ Dung, Khoá K52 Tâm lý học) - Bài giảng môn xử lý số liệu thống kê SPSS
guy ễn Thuỳ Dung, Khoá K52 Tâm lý học) (Trang 130)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w