Đây là tài liệu hữu ích về cách sử dụng phần mềm xử lý số liệu thống kê thường dùng trong xử lý kết quả phỏng vấn bằng bảng hỏi trong nghiên cứu khoa học nói riêng và thống kê số liệu nói chung.
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
BÀI GIẢNG
THỰC HÀNH SỬ DỤNG PHẦN MỀM XỬ LÝ SỐ LIỆU TRONG NGHIÊN CỨU TÂM LÝ HỌC
TS.PHẠM MẠNH HÀ
HÀ NỘI 2012
Trang 2Mục lục Số trang CHƯƠNG 1: NHỮN G VẤN ĐỀ CHUNG CỦA THỐNG KÊ ỨNG
DỤNG TRONG NGHIÊN CỨU TÂM LÝ HỌC
3
1 Một số vấn đề chung của thống kê ứng dụng trong tâm lý học 3
2 Một số khái niệm cơ bản trong thống kê 7
4 Một số khái niệm trong đo lường thống kê 16
CHƯƠNG 2: MÃ HÓA VÀ TẠO ĐỊNH NGHĨA BIẾN CHO DỮ
LIỆU
24
2 Làm việc với phần mềm SPSS trên windows
26
3 Mã hóa và tạo định nghĩa cho biến dữ liệu trong spss 32
CHƯƠNG 3: NHẬP DỮ LIỆU VÀ HIỆU ĐÍNH DỮ LIỆU CHO
PHÂN TÍCH
44
2 Kiểm tra và hiệu đính dữ liệu trong bảng Data View 46
3 Lựa chọn và sắp xếp mẫu theo mục đích sử dụng 78
CHƯƠNG 5 PHÂN TÍCH SỐ LIỆU
1 Lập bảng phân bố tần suất cho một biến trả lời 84
Trang 3CHƯƠNG 1: MỘT SỐ KHÁI NIỆM THỐNG KÊ CƠ BẢN ỨNG DỤNG TRONG NGHIÊN CỨU TÂM LÝ HỌC
1 Một số vấn đề chung của thống kê ứng dụng trong tâm lý học
1.1 Khái niệm thống kê
Trong cuộc sống chúng ta thường gặp thuật ngữ thống kê, thuậtngữ này được hiểu theo hai nghĩa:
Thứ nhất, thống kê là số liệu thu thập để phản ánh các hiện tượngkinh tế, chính trị, xã hội, tự nhiên, kỹ thuật… Ví dụ: Số lượng trẻ nam và
số lượng trẻ gái được sinh ra trong các gia đình nông thôn Việt Nam từnăm 2011 – 2012; điểm trung bình chung các môn học của sinh viên sau
4 năm học…
Thứ hai, thống kê được hiểu là phương pháp được sử dụng đểnghiên cứu các hiện tượng kinh tế, xã hội, kỹ thuật, tâm lý… Công việcđược các nhà thống kê gồm rất nhiều hoạt động trên một phạm vi rộng cóthể tóm tắt thành những mục lớn sau:
Thu thập và xứ lý số liệu
Điều tra thống kê chọn mẫu
Nghiên cứu mối liên hệ giữa các hiện tượng
Dự báo
Nghiên cứu các hiện tượng trong hoàn cảnh không chắc chắn
Một các tổng quát, thông kế được định nghĩa như sau:
Thống kê là một hệ thống các phương pháp để thu thập, xử lý vàphân tích các con số (mặt lượng) của hiện tượng số lớn nhằm để tìm hiểubản chất và tính quy luật vốn có của chúng (mặt chất) trong điều kiện thờigian và không gian cụ thể
Thống kê thường được phân chia thành 2 lĩnh vực:
Trang 4Thống kê mô tả: là các phương pháp có liên quan đến việc thu thập
số liệu, tóm tắt, trình bày, tính toán và mô tả các đặc trưng khác nhau đểphản ánh một cách tổng quát đối tượng nghiên cứu
Thống kê suy luận: là bao gồm các phương pháp ước lượng các đặctrưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu,
dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quansát mẫu
1.2 Đối tượng nghiên cứu của thống kê
Các nhà thống kê học nổi tiếng trên thế giới đều thống nhất đưa ranhận định sau đây về đối tượng nghiên cứu của thống kê
Thống kê học là môn khoa học xã hội, nghiên cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chất của các hiện tượng kinh tế- xã hội số lớn, trong điều kiện thời gian và địa điểm cụ thể.
Từ nhận định này, chúng ta cần hiểu đúng đối tượng nghiên cứu củathống kê ở các điểm chính sau
1.2.1 Thống kê học là một môn khoa học xã hội
Thống kê học là một môn khoa học xã hội, bởi vì thống kê nghiêncứu các hiện tượng kinh tế - xã hội hay quá trình kinh tế xã hội Các hiệntượng và quá trình đó thường là:
* Các hiện tượng về quá trình tái sản xuất mở rộng như cung cấpnguyên liệu, quy trình công nghệ, chế biến sản phẩm
* Các hiện tượng về phân phối, trao đổi, tiêu dùng sản phẩm(marketing) như giá cả, lượng hàng xuất, nhập hàng hoá, nguyên liệu
* Các hiện tượng dân số, lao động như tỷ lệ sinh, tử, nguồn laođộng, sự phân bố dân cư, lao động
* Các hiện tượng về văn hoá, sức khoẻ như trình độ văn hoá, sốngười mắc bệnh, các loại bệnh, phòng chống bệnh
Trang 5* Ngoài ra thống kê còn nghiên cứu ảnh hưởng của các hiện tượng
tự nhiên đến sự phát triển của các hiện tượng kinh tế xã hội, như ảnhhưởng của khí hậu, thời tiết, của các biện pháp kỹ thuật tới quá trình sảnxuất nông nghiệp, kết quả sản xuất nông nghiệp và đời sống nhân dân
1.2.2 Thống kê nghiên cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chất của số lớn hiện tượng và quá trình kinh tế xã hội
a) Mặt lượng (những biểu hiện cụ thể, đo lường được)
* Quy mô của hiện tượng: Các mức độ to nhỏ, lớn bé, rộng hẹp
Ví dụ: Diện tích canh tác của 1 doanh nghiệp nông nghiệp A năm
2005 là 500 ha, dân số trung bình của Việt Nam 2003 là 80,90 triệu người(Niên giám thống kê 2003), tổng số sinh viên của 1 lớp năm học 2005 -
Ví dụ: Tỷ lệ tai nạn giao thông xe máy năm 2004 là 2%, có nghĩa là
cứ 100 người đi xe máy thì có 2 người tai nạn
* Mối quan hệ tỷ lệ giữa các hiện tượng hoặc giữa các tiêu thức củacùng một hiện tượng
b) Liên hệ chặt chẽ với mặt chất của số lớn hiện tượng
* Thông qua các mặt lượng của hiện tượng để đánh giá bản chất
Trang 6của hiện tượng như quy mô to nhỏ, bộ phận nào nhiều hay ít, xu hướngtiến lên hay giảm đi, mức độ phổ biến của hiện tượng thế nào nhưng
để đánh giá một cách khách quan bản chất của hiện tượng thì mặt lượngcủa hiện tượng phải được thể hiện ở số lớn đơn vị chứ không phải ở từngđơn vị cá biệt
Ví dụ, đánh giá kết quả học tập 2 sinh viên A, B cần dựa vào kết quảhọc tập nhiều học kỳ, nhiều môn; dựa vào ý thức phấn đấu, sự tham giacác phong trào đoàn, quan hệ bạn bè Việc làm như vậy người ta gọi lànghiên cứu mặt lượng ở số lớn
Nhưng để hiểu sâu sắc hơn bản chất của hiện tượng, người ta cũngnghiên cứu những đơn vị tiên tiến, hoặc lạc hậu là những biểu hiện cábiệt
* Thống kê không nghiên cứu bản chất và quy luật của hiện tượng,
mà thông qua mặt lượng có thể đánh giá được bản chất và tính quy luậtcủa hiện tượng
1.2.3 Thống kê nghiên cứu các hiện tượng và quá trình kinh tế
xã hội trong điều kiện địa điểm và thời gian cụ thể
Mỗi hiện tượng, hay quá trình kinh tế xã hội ở thời gian, địa điểmkhác nhau thì mặt lượng cũng khác nhau Do đó, đối tượng nghiên cứucủa thống kê học cũng cần cụ thể hoá ở thời gian nào, địa điểm nào haytrả lời câu hỏi bao giờ ? và ở đâu ?
1.3 Mối quan hệ giữa thống kê và nghiên cứu tâm lý học
Tâm lý học là khoa học nghiên cứu về các hiện tượng tâm lý người,
có có đối tượng nghiên cứu là các hiện tượng, quy luật vận hành, nảysinh, phát triển của hoạt động tâm lý và mối quan hệ giữa các hiện tượngtâm lý với hành vi của con người
Là một khoa học độc lập, Tâm lý học có hệ thống phương pháp
Trang 7pháp nghiên cứu chính của mình Tâm lý học sử dụng phương pháp thống
kê nhằm tìm hiểu các hiện tượng tâm lý như quan điểm, thái độ, nhu cầuđộng cơ của cá nhân và nhóm xã hội, cũng như nghiên cứu những đặctrưng thống kê về tính cách, năng lực, phẩm chất trí tuệ của cá nhân haynhững nhóm người cụ thể Trên cơ sở kết quả do phương pháp thống kêmang lại, các nhà tâm lý học sử dụng hệ thống lý thuyết, quan điểm tiếpcận tâm lý học của mình để lý giải các hiện tượng tâm lý đã nêu một cáchkhách quan và tường mình
2 Một số khái niệm cơ bản trong thống kê
2.1 Tổng thể thống kê
Tổng thể thống kê là một tập hợp các đơn vị cá biệt về sự vật, hiệntượng trên cơ sở một đặc điểm chung nào đó cần được quan sát, phân tíchmặt lượng của chúng Các đơn vị, phần tử tạo nên hiện tượng gọi là cácđơn vị tổng thể
Ví dụ: Tổng thể dân số Việt Nam, Tổng số sinh viên của trường ĐHKHXH&NV
2.2 Mẫu
Mẫu là một bộ phận của tổng thể, đảm bảo được tính đại diện vàđược chọn ra để quan sát và dùng để suy diễn cho toàn bộ tổng thể Việcchọn mẫu đại diện cho tổng thể không phải dễ dàng, trên thực tế chỉ cốgắng giảm sự sai biệt giữa mẫu và tổng thể chứ không thể khắc phục hoàntoàn Khi mẫu được chọn đảm bảo tính đại diện, sẽ có thể sử dụng để suyrộng ra các đặc trưng của tổng thể
Ví dụ: Nghiên cứu 100 sinh viên Khoa Tâm lý học trong tổng số
450 sinh viên nhằm tìm hiểu nhu cầu, động cơ lựa chọn học ngành Tâm
lý học
Trang 82.3 Tiêu thức thống kê
Các đơn vị tổng thể thường có nhiều đặc điểm khác nhau, song trong thống kê người ta chỉ chọn một số đặc điểm để nghiên cứu, các đặc điểm này người ta gọi là tiêu thức thống kê Như vậy, tiêu thức thống kê
là các đặc điểm của đơn vị tổng thể Mỗi tiêu thức thống kê đều có giá trị biểu hiện của nó
Phân loại tiêu thức thông kê dựa vào sự biểu hiện :
+ Tiêu thức thuộc tính : là tiêu thức phản ánh loại hoặc tính chất của đơn vị
+ Tiêu thức số lượng : là đặc trưng của đơn vị tổng thể được biểu hiện bằng con số Gồm 2 loại:
Loại rời rạc: là loại các giá trị có thể của nó là hữu hạn hay vô hạn
2.6 Số đo và thang đo
Số đo là việc gán những dữ kiện lượng hoá hay những ký hiệu chonhững hiện tượng quan sát
Thang đo là tạo ra một thang điểm để đánh giá đặc điểm của đốitượng được nghiên cứu thể hiện qua sự đánh giá, nhận xét
2.6.1 Các loại thang đo
Thang đo danh nghĩa – thang đo định danh:
Trang 9Đây là loại thang đo có mức độ đo lường yếu nhất Thực chất của
nó là nhau Như vậy, để xây dựng được thang đo này, ta chỉ cần thiết lậpđược mối quan hệ bằng nhau hoặc không bằng nhau giữa các đơn vị củahiện tượng nghiên cứu theo dấu hiệu được đo để phân chia chúng thànhcác lớp không cắt nhau mà không cần theo một trật tự gán cho các biểuhiện cùng loại của tiêu thức nghiên cứu một con số xác định nào Ví dụ:Với tiêu thức giới tính chỉ có hai loại nam và nữ và không có trật tự nàogiữa hai loại này; vì vậy có thể gán cho nữ nhận giá trị là số 2 và namnhận một con số bất kỳ khác số 2 hoặc ngược lại
Thang đo định danh là loại thang đo định tính và thường được dùngrất rộng rãi với các tiêu thức thuộc tính mà các biểu hiện của nó là một hệthống các loại khác nhau, như: Giới tính, khu vực địa lý, nghề nghiệp, tôngiáo Các con số trên thang đo không biểu thị quan hệ hơn kém, caothấp, nhưng khi chuyển từ số này sang số khác thì dấu hiệu đo đã có sựthay đổi về chất Như khi đo lường về giới tính và tôn giáo, ta có thể xâydựng thang đo định danh sau:
Ví dụ:
Câu 1: Anh chị cho biết giới tính
1 Nam
2 Nữ
Câu 2: Tôn giáo anh chị đang theo
1 Thiên chúa giáo
Trang 10Thang đo thứ bậc:
Đây là thang đo định danh nhưng giữa các biểu hiện của tiêu thức
có quan hệ hơn kém, cao thấp Giả sử có các điểm A, B, C, D theo thứ tự lần lượt trên thang đo thứ bậc, nếu đã có A lớn hơn B, thì A lớn hơn C và
C cũng lớn hơn D
Loại thang đo này cũng được dùng rất nhiều trong các nghiên cứu tâm lý xã hội, để đo các tiêu thức mà các biểu hiện có quan hệ thứ tự như
đo thái độ, quan điểm của con người đối với một hiện tượng xã hội nào
đó hoặc thứ tự chất lượng sản phẩm, huân chương, bậc thợ Với câu hỏi: Có haì lòng với quy định sinh viên nộp học phí chậm 1 tuần sẽ bị đuổi học không? Ta có thể triển khai một thang đo thứ bậc có 3 nấc:
1- Hài lòng
2- Lưỡng lự
3- Không hàì lòng
Như vậy, loại thang đo này là cơ sở quan trọng để phân tổ toàn bộ
số đơn vị được điều tra thành các nhóm có thứ bậc khác nhau đối với tiêuthức nghiên cứu Tuy nhiên, do chưa có tiêu chuẩn đo lường cụ thể (thểhiện bằng đơn vị đo), nên chưa thể xác định khoảng cách cụ thể hay mức
độ hơn kém giữa các nhóm Trong ví dụ trên, nếu xét về mức độ hài lòngđối với quy định mới này, thì nhóm (1) cao hơn nhóm (2), nhóm (2) hàilòng hơn nhóm (3) Nhưng không thể xác định được mức độ cao thấpgiữa các nhóm, mặt khác sự chênh lệch giữa các nhóm cũng không nhấtthiết phải bằng nhau Các con số 1, 2, 3… được gán cho các nhóm không
có giá trị số học thuần túy, nên không thực hiện được các phép tính sốhọc đối với chúng Trong thực tế cần phải hết sức tránh sai lầm này
Trang 11Thang đo thứ bậc được dùng nhiều trong điều tra tâm lý xã hội.Những câu hỏi về mức độ hài lòng, khó khăn, sự đồng tình, phản đối, cáccâu hỏi cần xếp theo thứ tự ưu tiên… đều sử dụng thang đo thứ bậc
Thang đo khoảng:
Là thang đo thứ bậc có các khoảng cách đều nhau nhưng không cóđiểm gốc là 0 Nếu có các điểm A, B, C, D xếp lần lượt trên thang đokhoảng, và thoả mãn A > B, B > C thì cũng sẽ có A - B = B - C Hiệu sốgiữa hai điểm đứng liền nhau được gọi là tiêu chuẩn đo (hay đơn vị đo).Trong thang đo độ bách phân () khoảng cách giữa hai vạch đứng liềnnhau là 1oC chính là tiêu chuẩn đo Nhờ có tiêu chuẩn đo này, nên có thểthực hiện được các phép tính cộng, trừ, tính được các tham số đặc trưngnhư trung bình, phương sai, tỷ lệ và gọi nó là thang đo định lượng
Đặc điểm cơ bản của thang đo khoảng là chưa có giá trị “0 tuyệtđối”, mà đó chỉ là số 0 quy ước Ví dụ, trong thang đo độ bách phân,điểm 0 (0oC) chỉ là điểm được quy ước, tại đó nước chuyển sang thể rắn,còn nhiệt độ lại có thể xuống đến các điểm dưới 0 Đặc điểm này dẫn đếnviệc so sánh tỷ lệ giữa các trị số đo không có ý nghĩa Ví dụ: Nhiệt độtrung bình của thành phố A là 30oC, thành phố B là 10oC, ta không thểnói thành phố A nóng gấp 3 lần thành phố B
Trong thực tế nghiên cứu xã hội, nhiều thang đo thứ bậc được dùngnhư thang đo khoảng, tức là đã có những cải tiến thang đo thứ bậc theohướng thang đo khoảng nhằm định lượng sự hơn, kém theo một dấu hiệu
Trang 12nào đó Cũng với ví dụ đã đề cập ở phần trên, ta có thể chuyển thành câuhỏi khác: “Xin cho biết mức độ hàì lòng của Anh (Chị) về quy định sinhviên không nộp học phí đúng hạn sẽ bị đuổi học bằng cách cho điểm trênthang đo sau” (Nếu hoàn toàn không hài lòng, thì cho 0 điểm, nếu hoàntoàn hài lòng, xin cho 10 điểm).
Mặc dù ở đây đã lượng hoá được phần nào mức độ hài lòng củangười được hỏi về quy định mới này Nhưng chưa có tiêu chuẩn cụ thểcho mỗi bậc của thang đo Việc cho mấy điểm hoàn toàn do cảm tính củangười được hỏi, mà chưa có chuẩn chính thức buộc mọi người phải tuântheo Nó chưa phải là một thang đo khoảng thực sự Thang điểm trongnhà trường hiện nay cũng được xây dựng theo cách thức này
Thang đo tỷ lệ:
Là thang đo khoảng với một điểm 0 tuyệt đối (điểm gốc) trên thang
đo Nhờ điểm gốc và một tiêu chuẩn đo cụ thể, ta có thể sử dụng đượcmọi công cụ toán - thống kê để phân tích dữ liệu, so sánh được tỷ lệ giữacác trị số đo Chẳng hạn, thu nhập bình quân mỗi tháng của ông N là 2triệu đồng, của bà B là 1 triệu đồng, có thể nói thu nhập của ông N gấpđôi bà B Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường các hiệntượng kinh tế - xã hội, như: thu nhập, chi tiêu, thời gian lao động, tuổi, sốcon Các đơn vị đo lường vật lý thông thường (kg, mét, lít ) cũng làcác thang đo loại này
Theo tuần tự, thang đo sau có chất lượng đo lường cao hơn thang
đo trước, đồng thời việc xây dựng thang đo cũng phức tạp hơn Songkhông phải cứ sử dụng thang tỷ lệ là tốt nhất, mà phải tuỳ thuộc vào đặcđiểm của hiện tượng và tiêu thức nghiên cứu mà chọn thang đo thích hợp
Trang 13Hai loại đầu chưa có tiêu chuẩn đo (đơn vị đo), thuộc loại thangđịnh tính Đó là loại thang đo mà khi thay đổi từ giá trị này sang giá trịkhác thì đối tượng đo đã có sự thay đổi về chất, chúng phù hợp với việc
đo lường các tiêu thức thuộc tính Hai loại sau đã có tiêu chuẩn đo, khichuyển từ một điểm này sang điểm khác trên thang thì có sự thay đổi vềlượng, nhưng chưa chắc đã có sự thay đổi về chất Đây là loại thang đođịnh lượng, phù hợp để đo lường các tiêu thức số lượng
Như trên đã chỉ rõ, không phải mọi loại thang đo đều sử dụng đượccác công cụ phân tích như nhau Vì vậy, việc phân tích, hiểu rõ các loạithang đo còn cho phép sử dụng có hiệu quả hơn các công cụ thống kê -toán trong phân tích thông tin Theo tuần tự của 4 loại thang đo đã nêu,việc đo mức độ tập trung, phân tán và mối liên hệ của hiện tượng nghiêncứu cũng tăng dần Với thang định danh, ta chỉ có thể tính được tỷ lệ (%)phân bố của tổng thể cho từng biểu hiện và tính Mode (Mo) Sử dụngthang thứ bậc, ta có thêm được trung vị (Me), hệ số tương quan cặp vàriêng phần Muốn thực hiện được các phép tính cộng, trừ, tính được trungbình, phương sai, tỷ lệ, các hệ số và tỷ số tương quan thì phải sử dụng cácthang đo khoảng Và với thang đo tỷ lệ, ta có thể sử dụng mọi độ đothống kê Như vậy, ở mức độ đo lường càng cao, khả năng áp dụng cáccông cụ thống kê - toán càng nhiều hơn Tuy nhiên, việc lựa chọn và sửdụng thang đo nào cho từng trường hợp nghiên cứu để có hiệu quả cao làhết sức cần thiết Chẳng hạn như khi dùng tỷ lệ % phân bố của tổng thểcho từng biểu hiện đối với thang định lượng có quá nhiều lượng biến cóthể làm cho việc phân tích bị rối, gặp nhiều khó khăn, khó tìm ra thựcchất của vấn đề
3 Biến số và các kiểu biến số
3.1 Biến số (variable):
Trang 14Biến số là một đơn vị thông tin mà nhà nghiên cứu cần tìm hiểu, khai thác Một biến là những đại lượng có thể mang các giá trị khác nhau, ví dụ giới tính (nam, nữ); tôn giáo; trình độ học vấn; thái độ đối vớihọc tập…
Trong bảng điều tra, biến số là một đơn vị thông tin được thu thập
từ một câu hỏi cụ thể Tuy nhiên, tùy nghiên cứu mà nhà nghiên cứu cóthể thiết kế loại câu hỏi đơn biến (cho biết 1 loại thông tin) và câu hỏi đabiến (cho biết cùng lúc nhiều thông tin)
Ví dụ: Câu hỏi đơn biến (người trả lời chỉ được lựa chọn 1 thông tin phù hợp nhất)
Câu 1: Nghề nghiệp chính của ông bà/anh chị:
- Chế biến sản phẩm nông nghiệp - Công nhân/lao động tự do Với câu hỏi này, người trả lời chỉ có thể chọn 1 phương án đúng với bản thân mình nhất.
Câu hỏi đa biến: Cùng 1 lúc người được hỏi có quyền lựa chọn ít nhất từ 1 trở lên các phương án trả lời
Câu 10 Anh chị cho biết gia đình mình có những tài sản nào dưới đây?
- Ti vi: - Tủ lạnh: - Máy móc nông cụ:
- Điều hoà nhiệt độ - Máy vi tính kết nối internet:
Với câu hỏi này, người trả lời có thể chọn 2 hay nhiều phương án.
Trang 153.2 Các loại biến số
Trong thống kê,người ta phân biệt hai loại biến đó là biến định tính
và biến định lượng:
Biến định tính (quatitative variables)
Là những biến mà người ta gán cho các giá trị để phân biệt hayphân loại các quan sát Đây là biến lập nhóm (categorical variables), trị
số của chúng được xác định bằng các thang đo định danh hoặc thang đothứ bậc dưới dạng mã số hoặc chuỗi ngắn
Với biến định tính ta không thể sử dụng các phép toán (cộng, trừ,nhân, chia) để tính toán các giá trị trên biến đó, ngược lại biến định lượngcho phép ta thao tác các phép toán trên các giá trị mà nó đại diện Việcxác định dạng biến theo cách này cho phép ta lựa chọn được tham sốthống kê tương thích để phân tích
Ví dụ: Giới tính (nam, nữ); Trình độ học vấn (Mù chữ, tiểu học, trung học, cao đẳng, đại học, trên đại học)…; Thu nhập (thấp, trung bình, khá, cao…)
Biến định lượng (quantitative variables)
Là những biến mà các giá trị của chúng được xác định bằng cácthang đo khoảng nên trị số của chúng luôn để dưới dạng số Biến địnhlượng cho phép ta thao tác các phép toán trên các giá trị mà nó đại diện
Ví dụ: Thu nhập ( 200.000đ; 220.000đ; 211.000đ…), tuổi (15; 17; 19; 18; 16…), số lượng tài sản có trong gia đình: Tivi; tủ lạnh, xe máy…
Trong khi phân tích, người ta cũng cần phân biệt hai loại biến, biếnđộc lập và biến phụ thuộc và tìm hiểu mối quan hệ giữa chúng
Biến độc lập (independent variable)
Trang 16Biến độc lập là một đặc tính được lựa chọn để nghiên cứu Biếnđộc lập được giả thuyết là một biến mà sự biến đổi của nó có ảnh hưởngchi phối hoặc gây ra những biến đổi kéo theo ở một biến khác.
Biến phụ thuộc (dependent variable)
Biến phụ thuộc là một biến mà sự biến đổi của nó chịu sự chi phối(đáp ứng) của 1 biến khác Một biến được gọi là biến phụ thuộc khi giá trịcủa nó tuỳ thuộc vào giá trị của biến độc lập Nó chính là hiệu quả giảđịnh của biến độc lập
Lưu ý: Việc xác định một biến là độc lập và phụ thuộc thường có tính chất tương đối Một biến có thể được xem là phụ thuộc trong phạm
vi phân tích này lại là độc lập trong phạm vi phân tích khác.
Trong nghiên cứu còn có những yếu tố ảnh hưởng không đượckiểm soát (hay không được quan sát một cách có hệ thống) được gọi làcác biến bổ trợ
4 Một số khái niệm trong đo lường thống kê
4.1 Yếu vị (mode)
Yếu vị là tên gọi của loại đo lường có tần số lớn nhất Dạng nàythường được dùng đối với dạng dữ liệu thang đo định danh Giống nhưtrung vị, mode không bị ảnh hưởng bởi giá trị đầu mút của dãy phân phối
Ví dụ: Trong kết quả thông kế về giới tính của người lao động trong một công ty có kết quả sau:
Nam giới chiếm 65%
Nữ giới chiếm 45%
Như vậy yếu vị (mode) của kết quả thống kê này là 65% Nói cách khác là: Giá trị Mode của kết quả thông kê là 65%.
4.2 Trung vị (median)
Trang 17Là số nằm giữa (nếu lượng quan sát là số lẻ) hoặc là giá trị trungbình của hai quan sát nằm giữa (nếu số lượng quan sát là số chẵn) củamột dãy quan sát được xắp xếp theo thứ tự từ nhỏ đến lớn Đây là dạngcông cụ thống kê thường được dùng để đo lường mức độ tập trung củadạng dữ liệu thang đo thứ tự, nó có đặc điểm là không bị ảnh hưởng củacác giá trị đầu mút của dãy phân phối, do đó rất thích hợp để phân tíchđối với dữ liệu có sự chênh lệch lớn về giá trị ở hay đầu mút của dãy phânphối.
Trung vị của một tập hợp đo lường là trị số rơi vào chính giữa khicác số đo lường ấy được xếp đặt theo thứ tự độ lớn của chúng
Trang 18Trung bình cộng của một tập hợp các số đo lượng là tổng số cộngcác đo lường chia cho N (tổng số) của đo lường ấy.
* Điểm trung vị chỉ số IQ nhóm B là 108,5
4.4 Phương sai (varian)
Dùng để đo lường mức độ phân tán của một tập các giá trị quan sátxung quanh giá trị trung bình của tập quan sát đó Phương sai bằng trungbình các bình phương sai lệch giữa các giá trị quan sát đối với giá trịtrung bình của các quan sát đó Người ta dùng phương sai để đo lườngtính đại diện của giá trị trung bình tương ứng, các tham số trung bình cóphương sai tương ứng càng lớn thì giá trị thông tin hay tính đại diện củagiá trị trung bình đó càng nhỏ
Phương sai cũng là một phép đo đánh giá mức độ phân tán hoặcthay đổi của một phân bố điểm Phương sai chính là bình phương độ lệchchuẩn
4.5 Độ lệch chuẩn (Standard deviation), độ biến thiên, sai số chuẩn:
Một công cụ khác dùng để đo lường độ phân tán của dữ liệu xungquanh giá trị trung bình của nó Độ lệch chuẩn chính bằng căn bậc hai củaphương sai Vì phương sai là trung bình của các bình phương sai lệch của
Trang 19cho các giá trị rất lớn, do đó sử dụng phương sai sẽ gặp khó khăn trongviệc diễn giải kết quả Sử dụng độ lệch chuẩn sẽ giúp dễ dàng cho việcdiễn giải do các kết quả sai biệt đưa ra sát với dữ liệu gốc hơn.
Hệ số biến thiên (coefficient of variation): Một cách để định lượnghóa độ lệch chuẩn tương quan với số trung bình là lấy độ lệch chuẩn chiacho số trung bình và nhân với 100
Sai số chuẩn (Standard erro): Lấy độ lệch chuẩn chia cho căn bậchai của số cỡ mẫu
4.6 Tương quan
Tương quan (correlation) là một số đo lường về mối liên hệ độclập hay phụ thuộc giữa hai biến số Nếu hệ số R (tương quan) càng lớn thìmức độ phụ thuộc thuộc tuyến tính giữa hai biến càng chặt Còn nếu Rcàng nhỏ thì mức độ phụ thuộc giữa hai biến càng yếu Trong trường hợp
R = 0 thì hai biến không có sự phụ thuộc Khi đó người ta nói hai biến đókhông tương quan
Hệ số tương quan có thể là dương (+) hoặc (-) hay = 0 Nếu Rdương, điều đó có nghĩa là khi giá trị một biến tăng lên thì giá trị của biếnkia cũng tăng lên theo một chiều hướng Ngược lại nếu r âm thì giá trị củabiến kia thay đổi theo chiều hướng ngược lại Trị tuyệt đối của r nói lên
độ mạnh của sự tương quan theo chiều thuận hoặc nghịch Trị tuyệt đốitối đa của r là 1.00 Khi không có tương quan nào giữa hai biến, trị số r =0
Đánh giá mức độ tương quan theo các mức sau đây:
Từ 0,80 đến 1: tương quan cao, đáng tin cậy
Từ 0,60 đến 0,79: tương quan vừa phải và đáng kể
Từ 0,40 đến 0,59: tạm được
Từ 0,20 đến 0,39: tương quan ít
Trang 20Từ 0,00 đến 0,19: tương quan không đáng kể hay tương quan domay rủi.
4.7 Kiểm nghiệm giả thuyết (Hypothesis testing)
Bên cạnh việc ước lượng các đặc trưng của tổng thể, các dữ liệumẫu thu thập được còn được dùng để đánh giá xem một giả thuyết nào đó
về tổng thể là đúng hay sai Ta gọi đó là kiểm nghiệm giả thuyết Nóicách khác kiểm nghiệm giả thuyết là dựa vào các thông tin mẫu để đưa rakết luận bác bỏ hay chấp nhận về giả thuyết của tổng thể
Ví dụ: công ty muốn tìm hiểu xem sở thích của người tiêu dùng về kiểu dáng, màu sắc, mùi vị khác nhau về sản phẩm cuả công ty Họ thích đặc biệt một kiểu dáng nào đó, một màu sắc nào đó, hay các kiểu dáng, màu sắc khác nhau đều được ưa thích như nhau.
Phương pháp kiểm nghiệm giả thuyết sẽ giúp giải quyết nhưng yêu cầu này
Để kiểm nghiệm giả thuyết ta phải xây dựng giả thuyết Giả thuyết
đã hình thành được gọi là giả thuyết H0 được xem như đúng cho đến khi
ta có đủ căn cứ để kết luận khác hơn Nếu giả thuyết H0 không đúng thìphải có một giả thuyết nào đó khác H0 gọi là H1 là đúng
Câu hỏi thực hành
Câu 1: Dùng các loại thang đo để phân loại các biến số trong bảng hỏi dưới đây thành các kiểu biến định danh, thứ bậc, khoảng và tỷ lệ
BẢNG TRƯNG CẦU Ý KIẾN
Với mục đích tìm hiểu những khó khăn mà các em học sinh gặp phải trong quá trình lựa chọn nghề nghiệp, chúng tôi mong nhận được những đóng góp của thầy cô bằng cách đánh dấu (x) vào các phương án trả lời mà thầy cô cho là phù hợp ở từng câu hỏi dưới đây.
Trang 21Kết quả nghiên cứu được đảm bảo bí mật và chỉ được dùng vào công tác nghiên cứu khoa học.
Cảm ơn sự tham gia của thầy cô.
Câu 1 Thầy cô bắt đầu hướng dẫn học sinh lựa chọn nghề nghiệp từ thời điểm nào?
3 Cơ sở đào tạo nghề
4 Tại các cơ sở sản xuất
Câu 3 Thầy cô vui lòng cho biết sự chỉ dẫn của thầy cô tới học sinh
về những nội dung dưới đây hiện ở mức độ nào ?,
đầy đủ
Tương đối đủ
Sơ qua
1. Những công việc cụ thể của người làm nghề
2 Giá trị kinh tế - xã hội của nghề
3 Tiền lương, thu nhập, cơ hội thăng tiến
trong nghề
4 Năng khiếu, thiên hướng của học sinh
5 Năng lực hiện có của học sinh đảm bảo
giúp các em thành công với nghề đã chọn
sau này
6 Những phẩm chất tính cách hiện có giúp
học sinh
7 Những đặc điểm thể chất, sức khỏe giúp
học sinh thành công với nghề sau này
Câu 4 Giá trị nào dưới đây của nghề nghiệp được thầy cô đặc biệt quan tâm và giáo dục học sinh lựa chọn theo? (Đánh giá theo thang
Trang 22điểm 10, trong đó 1 điểm ra không quan trọng và 10 điểm là rất quan trọng)
9 Được làm việc gần gia đình
10 Cống hiến được nhiều cho cộng đồng, xã hội
Câu 5 Thầy cô vui lòng cho biết nhà trường và thầy cô đã thực hiện những hoạt động nào trong số những hoạt động được liệt kê dưới
đây?
Stt Hình thức hoạt động hướng nghiệp Thường
xuyên
Thỉnh thoản
g
Khôn
g bao giờ
1 Lập hồ sơ hướng nghiệp cho từng học sinh
2 Đo các chỉ số tâm lý (IQ, Tính cách, năng
lực…) cho học sinh nhằm phục vụ cho việc
tư vấn nghề
3 Tổ chức các buổi tư vấn hướng nghiệp, chọn
nghề cho học sinh
4 Cung cấp thông tin về thị trường lao động,
cơ hội việc làm của các ngành nghề có trong
xã hội cho học sinh tham khảo thông qua
môn GDHN
5 Mời các chuyên gia, thợ lành nghề tham gia
các buổi sinh hoạt GDHN theo chương trình
của Bộ GD-ĐT
Trang 23sản xuất, kinh doanh để định hướng cho sự
lựa chọn nghề của học sinh
Câu 6 Theo thầy cô, yếu tố nào dưới đây có ảnh hưởng nhiều nhất
quyết định chọn nghề của học sinh.?
toàn đúng
Đúng 1 phần
Không đúng
1. Chương trình GDHN trong nhà trường
2 Các thầy cô giáo thông qua các buổi học trên
Trang 24CHƯƠNG 2: MÃ HÓA VÀ TẠO ĐỊNH NGHĨA BIẾN TRONG
Sản phẩm SPSS được viết tắt từ Statistical Products for the Social
Services, có nghĩa là Các sản phẩm Thống kê cho các dịch vụ xã hội.
Phiên bản mới nhất là SPSS 17.0
SPSS là một hệ thống phần mềm thống kê toàn diện được thiết kế
xử lý thông tin sơ cấp (thông tin được thu thập trực tiếp từ đối tượngnghiên cứu (người trả lời bảng câu hỏi) thông qua một bảng câu hỏi đượcthiết kế sẳn
1.2 Các bộ phận của hệ thống SPSS
SPSS Professional Statistisc: Cung cấp các kỹ thuật để phân tích
dữ liệu dạng không thích hợp với mô hình tuyến tính truyền thống
SPSS Addvance Statistisc: Tập trung vào các kỹ thuật được dùngtrong các thí nghiệm sinh học và phức tạp
SPSS Tables: Xây dựng một loạt các báo cáo dạng bảng biểu cóchất lượng trình bày cao, và phức tạp
SPSS Trends: Thực hiện các phép dự đoán và phân tích dãy số thờigian phức tạp bao gồm xây dựng các mô hình cho dữ liệu đa biến phituyến tính, các mô hình san bằng, và các phương pháp để ước lưọng cáchàm tự hồi quy
1.3 Các dạng màn hình SPSS
1.3.1 Màn hình quản lý dữ liệu (data view):
Trang 25Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồmcột, hàng và các ô giao nhau giữa cột và hàng
- Cột (Column): Đại diện cho biến quan sát Mỗi cột sẽ chứađựng tất cả các câu trả lời trong một câu hỏi được thiết kế trong bảngcâu hỏi
- Hàng (Row): Đại diện cho một trường hợp quan sát (người trảlời), Ta phỏng vấn bao nhiêu người (tùy thuộc vào kích thước mẫu) thì
ta sẽ có bấy nhiêu hàng Mỗi hàng chứa đựng tất cả những câu trả lời(thông tin) của một đối tượng nghiên cứu
- Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trảlời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời
cụ thể (trường hợp quan sát)
1.3.2 Màn hình quản lý biến (variables view):
Là nơi quản lý các biến cùng với các thông số liên quan đến biến.Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cộtthể hiện các thông số liên quan đến biến đó
- Tên biến (name): Là tên đại diện cho biến, tên biến này sẽ đượchiễn thị trên đầu mỗi cột trong màn hình dữ liệu
- Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến.Dạng số, và dạng chuỗi
- Số lượng con số hiễn thị cho giá trị (Width): Giá trị dạng sốđược phép hiễn thị bao nhiêu con số
- Số lượng con số sau dấu phẩy được hiễn thị (Decimals)
- Nhãn của biến (label): Tên biến chỉ được thể hiện tóm tắc bằng
ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến
Trang 26- Giá trị trong biến (Values): Cho phép khai báo các giá trị trongbiến với ý nghĩa cụ thể (nhãn giá trị)
- Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giátrị chỉ mang tính chất quản lý, không có ý nghĩa phân tích, để loại bỏcác biến này ta cần khai báo nó như là giá trị khuyết (user missing).SPSS mặc định giá trị khuyến (system missing) là một dấu chấm và tựđộng loại bỏ các giá trị này ra khỏi các phân tích thống kê
- Kích thướt cột (columns): Cho phép khai báo độ rộng của cột
- Ví trí (align): Vị trí hiễn thị các giá trị trong cột (phải, trái, giữa)
- Dạng thang đo (measures): Hiễn thị dạng thang đo của giá trịtrong biến
1.3.3 Màn hình hiễn thị kết quả (output):
Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu,đồi thị và các kết quả kiểm nghiệm, các kết quả này sẽ được truy xuất ramột màn hình, và được lưu giữ dưới một tập tin khác (có đuôi là SPO).Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích
1.3.4 Màn hình cú pháp (syntax):
Màn hình này cho phép ta xem và lưu trữ những cú pháp của mộtlệnh phân tích Các cú pháp được lưu trữ sẽ được sử dụng lại mà khôngcần thao tác các lệnh phân tích lại
Hình 2.a Màn hình cú pháp
Trang 272 Làm việc với phần mềm SPSS trên windows
2.1 Khởi động chương trình SPSS trên máy tính
Trên màn hình desktop của Windows nhắp vào biểu tượng
Hoặc mở phím Start, All programs, SPSS for Windows, SPSS12.0.1 for Windows (hoặc tùy phiên bản cài đặt)
Trang 28Hình 2.1 Khởi động SPSS
Trang 29Sẽ xuất hiện cửa sổ SPSS Data Editor và một hộp thoại như sau:
Run the tutorial: Chạy chương trình trợ giúp
Type in data: Nhập dữ liệu mới
Run an existing query: Chạy một truy vấn dữ liệu đã có sẵn
Create new query using Database Wizard: Lập một truy vấn
dữ liệu sử dụng Database Wizard
Open an existing data source: Mở file dữ liệu đã có sẵn
(Chú ý: Hộp thoại này chỉ xuất hiện một lần khi bạn khởi độngSPSS)
Bảng chọn {Menu}
Rất nhiều nhiệm vụ bạn muốn tiến hành với SPSS bắt đầu với việc lựa chọn các menu {trình đơn} Từng cửa sổ trong SPSS có các menu
riêng của nó với các lựa chọn menu thích hợp cho loại cửa sổ đó
Hai menu Analysis và Graphs là có sẵn đối với mọi loại cửa sổ,làm cho việc tạo các kết xuất mới rất nhanh chóng mà không phải chuyểnđổi giữa các cửa sổ
Thanh công cụ {Toolbars}
Từng cửa sổ SPSS có các thanh công cụ riêng của nó cho phép truycập nhanh đến các nhiệm vụ thông dụng Có một số cửa sổ có hơn mộtthanh công cụ
Hình 2.2: Thanh công cụ với trợ giúp chỉ dẫn công cụ {ToolTip Help}
Có thể điều khiển thanh công cụ theo nhiều cách:
Hiện hoặc ẩn các biểu tượng
Trình bày thanh công cụ theo phương nằm ngang hay thẳng đứng,gắn bên trên, dưới, trái hoặc phải
Để ẩn hiện một thanh công cụ
Trang 30Thực hiện theo cú pháp sau: Từ thanh Menu/View/Toolbar
Trong hộp thoại Show Toolbar, chọn thanh công cụ mà bạn muốn
mở (hoặc ẩn)
2.2 Làm quen với màn hình SPSS
Phần mềm SPSS có tất cả 4 dạng màn hình:
2.2.1 Màn hình quản lý dữ liệu (data view):
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệubao gồm cột, hàng và các ô giao nhau giữa cột và hàng
+ Cột (Column): Đại diện cho biến quan sát Mỗi cột sẽ chứa đựngtất cả các câu trả lời trong một câu hỏi được thiết kế trong bảng câu hỏi
+ Hàng (Row): Đại diện cho một trường hợp quan sát (người trảlời), Ta phỏng vấn bao nhiêu người (tùy thuộc vào kích thước mẫu) thì ta
sẽ có bấy nhiêu hàng Mỗi hàng chứa đựng tất cả những câu trả lời (thôngtin) của một đối tượng nghiên cứu
+ Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trảlời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụthể (trường hợp quan sát)
Hình 2.3 Màn hình quả lý dữ liệu (Data view)
Trang 312.2.2 Màn hình quản lý biến (variables view):
Là nơi quản lý các biến cùng với các thông số liên quan đến biến.Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cộtthể hiện các thông số liên quan đến biến đó
Tên biến (name): Là tên đại diện cho biến, tên biến này sẽ đượchiển thị trên đầu mỗi cột trong màn hình dữ liệu
Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến.Dạng số, và dạng chuỗi
Số lượng con số hiển thị cho giá trị (Width): Giá trị dạng sốđược phép hiển thị bao nhiêu con số
Số lượng con số sau dấu phẩy được hiển thị (Decimals)
Nhãn của biến (label): Tên biến chỉ được thể hiện tóm tắc bằng
ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến
Giá trị trong biến (Values): Cho phép khai báo các giá trị trongbiến với ý nghĩa cụ thể (nhãn giá trị)
Cột (column)
Hàng (Row)
Ô giao (Cell)
Trang 32 Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giátrị chỉ mang tính chất quản lý, không có ý nghĩa phân tích, đểloại bỏ các biến này ta cần khai báo nó như là giá trị khuyết(user missing) SPSS mặc định giá trị khuyến (system missing)
là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi cácphân tích thống kê
Kích thướt cột (columns): Cho phép khai báo độ rộng của cột
Ví trí (align): Vị trí hiển thị các giá trị trong cột (phải, trái, giữa)
Dạng thang đo (measures): Hiển thị dạng thang đo của giá trịtrong biến
Hình 2.4 Màn hình quản lý biến (Variable view)
2.2.3 Màn hình hiển thị kết quả (output):
Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồithị và các kết quả kiểm nghiệm, các kết quả này sẽ được truy xuất ra mộtmàn hình, và được lưu giữ dưới một tập tin khác (có đuôi là SPO) Mànhình này cho phép ta xem và lưu giữ các kết quả phân tích
Hình 2.5 Màn hình hiển thị kết quả (Output)
Trang 332.2.4 Màn hình cú pháp (syntax):
Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnhphân tích Các cú pháp được lưu trữ sẽ được sử dụng lại mà không cầnthao tác các lệnh phân tích lại
3 Mã hóa và tạo định nghĩa cho biến dữ liệu trong spss
3.1 Mã hóa dữ liệu
3.1.1 Kiểm tra và hiệu đính dữ liệu
Đây là bước kiểm tra chất lượng thông tin trong bảng câu hỏi nhằmbảo đảm không có bảng câu hỏi nào thiếu hoặc chứa đựng những thôngtin sai sót theo yêu cầu thiết kế ban đầu, bước này cần thiết được thựchiện trước khi tiến hành mã hóa và nhập dữ liệu vào máy tính Ngườikiểm tra phải bảo đảm tính toàn vẹn và tính chính xác của từng bảng câuhỏi & từng câu trả lời trong bảng câu hỏi Thông thường bước này nhànnghiên cứu sẽ tiến hành kiểm tra những đặc tính sau của bảng câu hỏi:
Tính logic của các câu trả lời: Đôi khi trong bảng câu hỏi, do yêu
cầu nghiên cứu sẽ có những đường dẫn, những điều kiện đễ người trả lờihoặc có thể trả lời tất cả các câu hỏi hoặc có thể bỏ qua một vài câu hỏinào đó Kiểm tra tính logic của bảng câu hỏi cho phép nhà nghiên cứuloại bỏ những câu trả lời thừa, cũng như kịp thời bổ sung những phần
Trang 34thiếu trong bảng câu hỏi Tính logic của câu trả lời còn phụ thuộc vào sựkết dính và liên hệ lẫn nhau giữa các câu hỏi trong một bảng câu hỏi (đôikhi một câu trả lời là có ý nghĩa nếu đứng riêng một mình nó những lại
vô nghĩa nếu kết hợp so sánh với các câu trả lời trước hoặc sau nó)
Tính đầy đủ của một câu trả lời và của một bảng câu hỏi: Một
bảng câu hỏi chỉ có giá trị nếu như tất cả những câu hỏi theo yêu cầu đềuđược trả lời đầy đủ Mỗi câu hỏi trong bảng câu hỏi đều có một ý nghĩa,một giá trị nghiên cứu nhất định, do đó thiếu một câu trả lời nào đó chomột câu hỏi cụ thể nào đó sẽ làm mất đi giá trị của bảng câu hỏi đó
Tính hợp lý và xác thực của các câu trả lời: Một câu trả lời đầy
đủ chưa hẳn là câu trả lời có giá trị, do đó tính chân thực và hợp lý củacâu trả lời cũng quyết định đến giá trị của câu trả lời và của bảng câu hỏi,đặc biệt là các câu hỏi chấm điểm, câu hỏi mở và các câu hỏi mang tínhlogic
Quá trình kiểm tra, rà soát lại bản câu hỏi là nhằm mục đích kiểmtra, phát hiện, sửa chửa và thông báo kịp thời cho người thu thập dữ liệutránh những sai sót tiếp theo
Để xử lý các lỗi trong kiểm tra và hiệu đính, ta có thể lựa chọncách xử lý như sau tùy thuộc vào mức độ sai sót cụ thể:
- Trả về cho bộ phận thu thập dữ liệu để làm sáng tỏ vấn đề
- Suy luận từ các câu trả lời khác
- Loại bỏ toàn bộ bảng câu hỏi
3.1.2 Mã hoá dữ liệu
Mã hóa dữ liệu giúp cho việc lưu trữ, quản lý và phân tích số liệuđược thuận tiện đồng thời giảm bớt sai sót trong quá trình nhập liệu Vềthực chất mã hóa là quá trình chuyển dịch câu trả lời thực của người trảlời vào từng nhóm, từng mẫu đại diện với các giá trị đại diện tương ứngnhằm làm cho quá trình tóm tắt, phân tích và nhập liệu được dễ dàng và
Trang 35hiệu quả hơn Thông thường, chúng ta mã hóa những phương án trả lờicủa khách thể từ dạng chuỗi (ký tự) thành dạng số.
…
Có hai dạng mã hóa:
Tiền mã hóa: Là việc mã hóa cho các câu hỏi đóng Do đặc điểm
của các loại câu hỏi này là nhà nghiên cứu đã có sẵn các câu trả lời từtrước, người trả lời chỉ việc lựa chọn câu trả lời nào phù hợp nhất với ýkiến của mình, do đó việc mã hóa cho các câu hỏi này thường được tiếnhành từ trước, ở giai đoạn thiết kế bảng câu hỏi
Mã hoá: Trong bảng câu hỏi ngoài những câu hỏi đóng nêu ở trên,
còn những câu hỏi mở, là những câu hỏi mà người trả lời tự do đưa ra câutrả lời theo suy nghĩ và diễn giải của chính họ Các bảng câu hỏi nhận vềthường có những câu trả lời rất khác nhau và rất đa dạng Do đó côngviệc mã hóa những câu trả lời này thì cần thiết cho quá trình kiểm tra,nhập liệu, tóm tắt và phân tích sau này
Mục đích của mã hóa là tạo nhãn cho các câu trả lời, thường làbằng các con số Mã hóa còn giúp giảm thiểu số lượng các câu trả lờibằng cách nhóm các câu trả lời vào những nhóm có cùng ý nghĩa Tiềntrình mã hóa có thể được tiến hành như sau:
Trang 36Đầu tiên, xác định loại câu trả lời cho những câu hỏi tương ứng.Những câu trả lời này có thể thu thập từ một mẫu các bảng câu hỏi đãhoàn tất, thường là 25% trên tổng số bảng câu hỏi
Bước tiếp theo là xây dựng một danh sách liệt kê các câu trả lời,các câu trả lời được liệt kê và tiến hành nhóm các câu trả lời theo nhữngnhóm đặc trưng (có cùng ý nghĩa)
Cuối cùng, những nhóm câu trả lời này được gán cho một nhãnhiệu, một giá trị, thường là một con số cụ thể
Ví dụ: Tạo mã code cho câu 1, câu 2, phiếu điều tra tâm lý chọn nghề của học sinh (Phiếu BT1)
Câu 1: Theo em, việc chọn nghề được xem là? (chọn 1 phương án trả lời)
1 Là một công việc quan trọng, cần có những suy nghĩ, Mã code = 1
cân nhắc chín chắn.:
2 Là một công việc quan trọng như nhiều việc quan trọng khác Mã code = 2
như học tập, giao tiếp
3 Là một công việc buộc phải nghĩ tới khi sắp phải ra trường. Mã code = 3
4 Là một công việc bình thường như bao công việc bình thường khác Mã code = 4
Câu 2: Theo em, học sinh nên tính tới việc lựa chọn nghề nghiệp từ thời điểm nào là thích hợp? (chọn 1 phương án trả lời)
Nguyên tắc cần thực hiện khi tạo mã code
- Cần thống nhất cách đặt mã code theo nguyên tắc: Từ nhỏ đến lớn;
Từ trái qua phải; Từ trên xuống dưới
Trang 37- Nhiều người nhập dữ liệu nhưng phải thống nhất trước bảng mãcode trước khi làm.
- Với câu hỏi mở, người nhập dữ liệu cần đọc trước các câu trả lời,tim ra các câu trả lời có cùng 1 ý (có thể khác nhau về diễn đạt),sau đó đưa chúng vào cùng 1 nhóm Khi nhập sẽ nhập ý kiến chungcủa nhóm này
- Với câu hỏi định lượng, không cần phải mã hóa, khi nhập dữ liệu
sẽ nhập nguyên giá trị số liệu mà khách thể cung cấp Trong một sốtrường hợp cụ thể, nếu giá trị định lượng mà khách thể cung cấpkhác nhau về đơn vị tính, nhà nghiên cứu cần quy đổi chúng ra mộtđơn vị tính duy nhất để nhập vào cơ sở dữ liệu trong SPSS
Ví dụ: Câu 1 Anh chị vui lòng cho biết 1 ngày, anh chị dành ra bao
……….
Trong trường hợp này, người trả lời có thể điền thông tin là phút, hoặc giờ…; do đó khi nhập liệu cần quy đổi những câu trả lời theo đơn vị tình “giờ” ra đơn vị tính là “phút” hoặc ngược lại.
3.2 Tạo định nghĩa cho biến
Tạo biến trong màn hình quản lý biến (variables view) Công việcđịnh biến này có thể được thực hiện trước khi tiến hành nhập dữ liệu vàotrong máy
Mục đích của việc tạo biến là gán nhãn và các thông số cho cácbiến và gán ý nghĩa cho các giá trị trong biến Sau khi được mã hóa các
dữ liệu sẽ được đại diện bằng những con số và các con số này có ý nghĩakhác nhau tùy theo câu trả lời thu thập được Để các con số này có thểnhập vào máy tính và có thể quản lý cũng như có ý nghĩa trong SPSS, taphải tiến hành định biến cho dữ liệu Qui trình định biến này bao gồm cácbước sau:
Trang 38Bước 1: Mở cửa số Variable view
Để tạo/định nghĩa biến, trước hết => mở cửa sổ Variable view.Trong cửa sổ variable view, có những cột sau:
1 Tên biến {Name}
2 Loại dữ liệu {Type}
3 Số lượng con số hoặc chữ {With}
4 Số lượng chữ số thập phân {Decimals}
5 Mô tả biến/nhãn biến {Lable} và nhãn trị số biến {Values}
6 Các trị số khuyết thiếu do người sử dụng thiết lập {Missing}
7 Độ rộng của cột {Width}
8 Căn lề {Align}
9 Thang đo {Measure}
Hình 2.6 Cửa sổ Variable view dùng để tạo định nghĩa biến
Trang 39Bước 2: Đăt tên biến
Ta gõ tên biến cần khai báo vào cột đầu tiên trong màn hìnhVariables view (Nếu ta không gõ tên biến vào thì SPSS sẽ mặc định tênbiến này là Var000001) Tên biến được khai báo này sẽ hiển thị trên đầu
các cột trong màn hình Data view Tên biến bị hạn chế về số ký tự hiểnthị, do đó cần thiết phải khai báo ngắn gọn và dễ gợi nhớ, thông thườngnên đặt theo thứ tự câu hỏi trong bảng câu hỏi như cau1, cau2, cau3, …
Có một số qui ước sau đây phải tuân theo khi khai báo tên biến:
Các qui tắc dưới đây được áp dụng cho tên biến:
- Tên phải bắt đầu bằng một chữ Các ký tự còn lại có thể là bất kỳchữ nào, bất kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $
- Tên biến không được kết thúc bằng một dấu chấm
- Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần (đểtránh xung đột với các biến được tự động lập bởi một vài thủ tục)
- Độ dài của tên biến không vượt quá 8 ký tự
- Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được
sử dụng
- Từng tên biến phải đơn chiếc/duy nhất; không được phép trùng lặp.Không được dùng chữ hoa để đặt tên biến Các tên NEWVAR,NewVar, và newvar được xem là giống nhau
- Các từ khóa sau đây không được dùng làm tên biến: ALL, NE,
EQ, TO, LE, LT, BY OR, GT, AND, NOT, GE, WITH
Hình 2.7 Cách thức đặt tên cho biến
Trang 40Bước 3: Xác định kiểu biến (Type)
Định ra kiểu biến (Type): Có các dạng biến sau có thể định dạng.Dạng con số (numeric); Dạng tiền tệ; dạng ngày (Date) hoặc dạng chuỗi(String) Ngoài ra phần này cũng cho phép ta định dạng các dạng số được
hiễn thị khác nhau (Xem hình 3.2)
Tùy thuộc vào yêu cầu của dữ liệu, mà ta sẽ định loại biến chobiến, SPSS mặc định loại biến là kiểu số (numeric); ngoài ra còn có thểkhai báo các kiểu hiển thị số khác nhau như kiểu số có dấu phẩy(Comma) hay dấu chấm (Dot) ngăn cách giữa các khoảng cách hàng ngàncủa con số; cách hiễn thị theo các ký hiệu khoa học (Scientific notation);Hiễn thị ngày, dollar và các kiểu tiền tệ khác; cuối cùng là cách hiễn thịdạng chuỗi
Xác định số lượng con số hiển thị cho giá trị (Width) và số lượngcon số sau dấu phẩy hiển thị (Decimals): Khai báo bề rộng của con số(hàng đơn vị, hàng trăm, hàng triệu, …) trong ô Width, Và khai báo sốcon số thập phân sau dầu phẩy trong ô Decimal
Hình 2.8: Hộp thoại Variable Type