Moät thöïc teá luoân luoân gaëp phaûi ñoái vôùi nhöõng ngöôøi laøm coâng taùc phaân tích vaø xöû lyù soá lieäu laø haàu nhö khoâng luùc naøo maø khoâng gaëp nhöõng vaán ñeà ñoái vôùi dö[r]
(1)CHƯƠNG 1: KHÁI QUÁT VỀ QUI TRÌNH NGHIÊN CỨU – XỮ LÝ THƠNG TIN VÀ MỘT SỐ LÝ THUYẾT THỐNG KÊ CƠ BẢN SỬ DỤNG TRONG
PHÂN TÍCH THƠNG TIN 1 Qui trình nghiên cứu
Thông thường qui trình nghiên cứu bao gồm bước:
- Bước 1: Xác định vấn đề cần nghiên cứu
- Bước 2: Xác định loại thông tin cần thu thập nguồn cung cấp thông tin
- Bước 3: Chọn mẫu nghiên cứu
- Bước 4: Thiết kế nghiên cứu xác định phương pháp thu thập thông tin - Bước 5: Thiết kế bảng câu hỏi
- Bước 6: Thu thập liệu
- Bước 7: Xử lý, phân tích diễn giải liệu xữ lý - Bước 8: Trình bày báo cáo kết
2 Xữ lý thông tin nghiên cứu thực địa
Có hai dạng thông tin nghiên cứu cần thu thập, loại thứ thông tin thứ cấp và loại thứ hai thông tin sơ cấp
- Thông tin thứ cấp thông tin hữu nguồn tài liệu
đăng tải, thông tin tổ chức thành bảng biểu, đồ thị Loại thông tin người nghiên cứu việc sử dụng diễn giải theo nhu cầu nghiên cứu mà khơng cần phải trãi qua q trình xữ lý phức tạp đòi hỏi hỗ trợ phần mềm phân tích xữ lý thơng tin chuyên dụng
- Thông tin sơ cấp thông tin chưa hữu, muốn có thơng tin địi hỏi
nhà nghiên cứu phải thực qui trình nghiên cứu với nhiều bước trình bày Trong nghiên cứu thu thập thông tin sơ cấp tồn hai dạng nghiên cứu yếu nghiên cứu định tính nghiên cứu định lượng Thơng tin nghiên cứu định tính khơng có ý nghĩa mặt thống kê, q trình phân tích xữ lý dừng chổ tập hợp, phân nhóm ý kiến quan điểm khác biệt khơng địi hỏi nhiều hỗ trợ công cụ kiến thức thống kê Ngược lại với thông tin nghiên cứu định lượng lại đòi hỏi nhiều kỷ kiến thức phân tích thống kê để tổ chức phân tích Phần mềm SPSS công cụ hữu hiệu cho việc xữ lý phân tích thơng tin nghiên cứu định lượng
(2)kiểm tra, hiệu đính, nhập liệu đến tạo bảng biểu cho liệu thực phân tích thống kê tương thích
Nhiệm vụ tổng quát việc xữ lý – phân tích liệu chuyển mẫu liệu quan sát thô mà ta tiến hành mã hóa kiểm tra thành số thống kê có ý nghĩa cho việc diễn giải kết nghiên cứu Tồn cơng việc xữ lý – phân tích phức tạp địi hỏi cần phải có máy tính phần mềm chuyên dụng hỗ trợ 3 Qui trình xữ lý số liệu
Trong qui trình nghiên cứu định lượng Việc xữ lý liệu ta nhận bảng câu hỏi vấn Qui trình xữ lý số liệu bao gồm bước sau:
- Bước 1: Kiểm tra, hiệu chỉnh trả lời bảng câu hỏi - Bước 2: Mã hóa câu trả lời bảng câu hỏi
- Bước 3: Nhập liệu mã hóa vào máy tính
- Bước 4: Xác định lỗi sở liệu làm liệu - Bước 5: Tạo bảng cho liệu tiến hành phân tích thống kê
Hai giai đoạn bước chuẩn bị cho việc phân tích máy tính sau Giai đoạn nhập liệu mã hóa vào máy tính Q trình nhập liệu dẫn đến sai xót bước phải thực trước tiến hành phân tích liệu phải làm liệu nhập vào máy
4. Một số lý thuyết thống kê
4.1. Các tham số thống kê đo lường độ tập trung hay hội tụ liệu (central tendency measurement)
- Giá trị trung bình (Mean): Là giá trị trung bình số học biến, tính
bằng tổng giá trị quan sát chia cho số quan sát Đây dạng công cụ thường dùng cho dạng đo khoảng cách tỷ lệ Giá trị trung bình có đặc điểm chịu tác động giá trị quan sát, thang đo nhạy cảm thay đổi giá trị quan sát Giá trị trung bình tính cơng thức sau:
- Trung vị (Median): Là số nằm (nếu lượng quan sát số lẽ) giá trị
trung bình hai quan sát nằm (nếu số lượng quan sát số chẳn) dãy quan sát xắp xếp theo thứ tự từ nhỏ đến lớn Đây dạng công cụ thống kê thường dùng để đo lường mức độ tập trung dạng liệu thang đo thứ
n X
n
i i
x ∑
=
(3)tự, có đặc điểm khơng bị ảnh hưởng giá trị đầu mút dãy phân phối, thích hợp để phân tích liệu có chênh lệch lớn giá trị hay đầu mút dãy phân phối
- Mode: Là giá trị có tần suất xuất lớn tập hợp số đo, dạng
này thường dùng dạng liệu thang biểu danh Giống trung vị, mode không bị ảnh hưởng giá trị đầu mút dãy phân phối
4.2. Các tham số thống kê đo lường mức độ phân tán liệu (Dispersion), Khảo sát hai nhóm số sau::
Nhóm 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 Nhoùm 2: 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7,
Ta thấy số kích thướt mẫu hai nhóm nhau, giá trị đo lường mức độ tập trung liệu mean, media, mode Tuy nhiên hai liệu hoàn toàn khác Nhóm liệu biến đổi nhiều nhóm 2, điều có nghĩa giá trị nhóm phân tán hơn, giá trị quan sát nằm xa giá trị trung bình mẫu nhóm Đo lường độ phân tán cho biết khác biệt hai nhóm liệu Có số công cụ đo lường độ phân tán liệu như:
- Phương sai (Variance): Dùng để đo lường mức độ phân tán tập giá
trị quan sát xung quanh giá trị trung bình tập quan sát Phương sai trung bình bình phương sai lệch giá trị quan sát giá trị trung bình quan sát Người ta dùng phương sai để đo lường tính đại diện giá trị trung bình tương ứng, tham số trung bình có phương sai tương ứng lớn giá trị thơng tin hay tính đại diện giá trị trung bình nhỏ
Phương sai mẫu tính cơng thức sau:
- Độ lệch chuẩn (Standard deviation): Một công cụ khác dùng để đo lường độ
phân tán liệu xung quanh giá trị trung bình Độ lệch chuẩn bật hai phương sai Vì phương sai trung bình bình phương sai lệch giá trị quan sát từ giá trị trung bình, việc khảo sát phương sai thường cho giá trị lớn, sử dụng phương sai gặp khó khăn việc diễn giải kết Sử dụng độ lệch chuẩn giúp dễ dàng cho việc diễn giải kết sai biệt đưa sát với liệu gốc
(4)- Khoảng biến thiên (Range): Là khoảng cách giá trị quan sát nhỏ đến
giá trị quan sát lớn
- Sai số trung bình mẫu (Standard Error of Mean) Được dùng để đo lường
khác biệt giá trị trung bình mẫu nghiên cứu so với mẫu nghiên cứu khác điều kiện có phân phối Nó dùng để so sánh giá trị trung bình quan sát với giá trị ban đầu (giả thuyết) Và ta kết luận hai giá trị khác tỷ số khác biệt standard error of mean nằm ngồi khoảng (-2,+2) Cơng thức tính sai số trung bình mẫu:
n S Sx =
4.3. Khoảng ước lượng (Confident interval)
Là ước lượng xác định khoảng giá trị đặc trưng tổng thể rơi vào Dựa vào liệu mẫu, với độ tin cậy cho trước ta xác định giá trị đại diện cho đám đơng nằm khoảng ước lượng
Ví dụ gọi x mức thu nhập trung bình đám đơng cần ước lượng Với độ tin cậy khoảng sát nghiên cứu 95% (nghĩa ước lượng ln có lượng sai số chấp nhận 5%) Dựa vào mẫu quan sát ta xác định hai giá trị thu nhập a b cho xác suất để thu nhập trung bình đám đơng x rơi vào khoảng a b (a, b) 95% Lúc ta diễn giải với độ xác 95% (hay chấp nhận 5% sai số) ta biết thu nhập trung bình đám đơng nghiên cứu nằm khoảng (a, b)
Công thức tính khoảng ước lượng:
n S t
X
E = ± α,n−1 X
Hoặc: E= p ± tα,n-1 Sp
Với p tỷ lệ % tần suất xuất giá trị quan sát
4.4. Kiểm nghiệm giả thuyết (Hypothesis testing)
(5)vào thông tin mẫu để đưa kết luận bác bỏ hay chấp nhận giả thuyết tổng thể
Ví dụ: Sau thời gian thực chương trình, biện pháp marketing (quảng cáo, khuyến mãi,…) công ty muốn đánh giá xem thị phần, doanh số có thay đổi so với trước khơng, hay có đạt mục tiêu đề khơng
Hoặc cơng ty muốn tìm hiểu xem sở thích người tiêu dùng kiểu dáng, màu sắc, mùi vị khác sản phẩm cuả cơng ty Họ thích đặc biệt kiểu dáng đó, màu sắc đó, hay kiểu dáng, màu sắc khác ưa thích
Phương pháp kiểm nghiệm giả thuyết giúp giải yêu cầu
Để kiểm nghiệm giả thuyết ta phải xây dựng giả thuyết Giả thuyết hình thành gọi giả thuyết H0 xem ta có đủ để kết luận khác Nếu giả thuyết H0 không phải có giả thuyết khác H0 gọi H1 Một số giả thuyết thường gặp phân tích:
(6)CHƯƠNG 2: GIỚI THIỆU VỀ PHẦN MỂM SPSS
Là phần mềm chuyên dụng xữ lý thông tin sơ cấp (thông tin thu thập trực tiếp từ đối tượng nghiên cứu (người trả lời bảng câu hỏi) thông qua bảng câu hỏi thiết kế sẳn
Thông tin xữ lý thơng tin định lượng (có ý nghĩa mặt thống kê) Phần mềm SPSS có tất dạng hình:
1. Màn hình quản lý liệu (data view):
Là nơi lưu trữ liệu nghiên cứu với cấu trúc sở liệu bao gồm cột, hàng ô giao cột hàng
- Cột (Column): Đại diện cho biến quan sát Mỗi cột chứa đựng tất câu trả lời câu hỏi thiết kế bảng câu hỏi
- Hàng (Row): Đại diện cho trường hợp quan sát (người trả lời), Ta vấn người (tùy thuộc vào kích thước mẫu) ta có nhiêu hàng Mỗi hàng chứa đựng tất câu trả lời (thông tin) đối tượng nghiên cứu
- Ô giao cột hàng (cell): Chứa đựng kết trả lời tương ứng
với câu hỏi cần khảo sát (biến) đối tượng trả lời cụ thể (trường hợp quan sát)
2. Màn hình quản lý biến (variables view):
Là nơi quản lý biến với thông số liên quan đến biến Trong hình hàng hình quản lý biến, cột thể thông số liên quan đến biến
- Tên biến (name): Là tên đại diện cho biến, tên biến hiễn thị đầu cột hình liệu
- Loại biến (type): Thể dạng liệu thể biến Dạng số, dạng
chuoãi
- Số lượng số hiễn thị cho giá trị (Width): Giá trị dạng số phép hiễn thị
bao nhiêu số
- Số lượng số sau dấu phẩy hiễn thị (Decimals)
- Nhãn biến (label): Tên biến thể tóm tắc ký hiệu, nhãn biến cho phép nêu rõ ý nghĩa biến
- Giá trị biến (Values): Cho phép khai báo giá trị biến với ý nghĩa cụ thể (nhãn giá trị)
- Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có số giá trị mang
(7)báo giá trị khuyết (user missing) SPSS mặc định giá trị khuyến (system missing) dấu chấm tự động loại bỏ giá trị khỏi phân tích thống kê
- Kích thướt cột (columns): Cho phép khai báo độ rộng cột - Ví trí (align): Vị trí hiễn thị giá trị cột (phải, trái, giữa)
- Dạng thang đo (measures): Hiễn thị dạng thang đo giá trị biến Màn hình hiễn thị kết (output):
Các phép phân tích thống kê cho kết bảng biểu, đồi thị kết kiểm nghiệm, kết truy xuất hình, lưu giữ tập tin khác (có SPO) Màn hình cho phép ta xem lưu giữ kết phân tích
4 Màn hình cú pháp (syntax):
Màn hình cho phép ta xem lưu trữ cú pháp lệnh phân tích Các cú pháp lưu trữ sử dụng lại mà không cần thao tác lệnh phân tích lại
5. Khái quát phân tích liệu
5.1. Kiểm tra liệu (Data Screening)
Một thực tế luôn gặp phải người làm cơng tác phân tích xử lý số liệu không lúc mà không gặp vấn đề liệu tay họ, số xuất lỗi nhập máy, lỗi mã hóa, lỗi chọn mẫu chất lượng vấn, tất lỗi thường dẫn đến khác thường tính đại diện liệu thu thập
Trong nghiên cứu qui mô lớn, công việc kiểm tra liệu đơi cịn tốn nhiều cơng sức thời gian việc phân tích tóm tắc liệu Do gần nhiệm vụ người phân tích liệu phải tiến hành kiểm tra liệu nhằm xác định lỗi liệu đồng thời kiểm tra xem tính tương thích liệu so với giả thuyết yêu cầu cho phân tích thống kê sau
Xác định giá trị vượt trội (Outliers) giá trị lỗi (Roque values)
Có nhiều cách để xác định giá trị vợt trội giá trị lỗi Tuy nhiên điều quan trọng xác định xem giá trị vượt trội có phải giá trị lỗi hay không hay bất thường mẫu nghiên cứu:
- Sử dụng công cụ bảng phân bổ tần xuất việc để đếm số lần xuất
(8)mã hóa tương ứng với giới tính nam nữ khảo sát ta phát giá trị khác với giá trị mã hóa 2) Ngồi cơng cụ cịn cho phép ta nhận giá trị khuyết (Missing values) lại xuất giá trị hợp lệ (Valid value)
- Đôi việc xác định giá trị vượt trội xác định cách tốt
hơn ta khảo sát hai hay nhiều biến lúc Đối với biến dạng biểu danh (nominal) thứ tự (ordinal) sử dụng công cụ bảng chéo ta xác định kết hợp phi lý hai nhiều biến, ví dụ người chưa tiêu dùng sản phẩm A lại tham gia đưa ý kiến mức độ thỏa mãn tiêu dùng sản phẩm A
5.2. Thống kê mô tả (Descriptive Statistics)
Đây xem phần cốt lõi thường gặp việc phân tích xử lý số liệu Tuy nhiên trước bắt tay vào việc mô tả liệu (đo lường độ tập trung hay phân tán, tỷ lệ %, mối quan hệ biến …), cần thiết phải nắm loại biến khảo sát (loại thang đo biến) hay nói cách khác ta phải nắm ý nghĩa giá trị biến
Đối với biến định danh thứ tự (nominal ordinal) phép tính tốn số học giá trị trung bình khơng có ý nghĩa thống kê, đặc biệt biến định danh so sánh giá trị biến vô nghĩa Ngược lại biến định lượng thang đo khoảng cách thang đo tỷ lệ (Interval Ratio) so sánh hay tính tốn số học đề có ý nghĩa phân tích thống kê
5.3. Kiểm nghiệm so sánh trung bình mẫu (Tests for Comparing Means)
Trong phân tích thống kê người ta thường sử dụng phép kiểm nghiệm kiểm nghiệm giả thuyết giá trị trung bình biến định lượng, thống kê cung cấp cho ta công cụ kiểm nghiệm t (T-Test) hay kiểm nghiệm Z (Z-test)
Kiểm nghiệm t cho mẫu, cặp mẫu hai mẫu ngẫu nhiên độc lập
Ta có ba dạng kiểm nghiệm t cho việc so sánh giá trị trung bình mẫu Việc sử dụng dạng tùy thuộc vào vấn đề ta tiến hành so sánh
- Sử dụng kiểm nghiệm t cho hai mẫu ngẫu nhiên độc lập (Independent
(9)- Công cụ kiểm nghiệm t cho cặp mẫu (Paired-Samples T Test) sử dụng
để kiểm nghiệm có hay khơng giá trị trung bình khác biệt cặp quan sát khác giá trị Với giả thuyết ban đầu H0 cho giá trị trung bình khác biệt Ví dụ kiểm nghiệm khác biệt điểm thi mơn học hai nhóm sinh viên có tham gia khơng có tham gia chương trình phụ đạo ngồi
- Công cụ kiểm nghiệm t mẫu (One-Sample T Test) để kiểm nghiệm có
hay khơng giá trị trung bình biến khác biệt với giá trị giả định từ trước Với giả thuyết ban đầu H0 cho giá trị trung bình kiểm nghiệm với giá trị giả thuyết đưa
Phân tích phương sai chiều (One-Way ANOVA)
Phân tích phương sai dạng mở rộng phương pháp kiểm nghiệm t hai mẫu ngẫu nhiên độc lập (Independent-Samples T Test), sử dụng để kiểm nghiệm cho nhiều hai nhóm Phương pháp phân tích khảo sát biến thiên trung bình mẫu mối liên hệ với phân táng quan sát nhóm Với giả thuyết ban đầu H0 cho giá trị trung bình
5.4. Kiểm nghiệm mối quan hệ (Testing Relationships)
Kiểm nghiệm mối quan hệ hai biến kiểm nghiệm mối tương quan với cường độ tương quan chiều tương quan biến sờ liệu
- Trong kiểm nghiệm mối quan hệ hai biến, ta sử dụng kiểm nghiệm
Chi-bình phương để kiểm nghiệm giả thuyết ban đầu cho hai biến thể bảng chéo (biến cột biến hàng) khơng có mối quan hệ với (độc lập với nhau)
- Trong kiểm nghiệm tương quan biến ta sử dụng kiểm nghiệm F kiểm nghiệm giả thuyết ban đầu cho biến khảo sát khơng có tương quan với (hệ số tương quan R = 0)
(10)CHƯƠNG 3: CHUẨN BỊ DỮ LIỆU 1. Kiểm tra hiệu đính liệu
Đây bước kiểm tra chất lượng thông tin bảng câu hỏi nhằm bảo đảm khơng có bảng câu hỏi thiếu chứa đựng thơng tin sai sót theo u cầu thiết kế ban đầu, bước cần thiết thực trước tiến hành mã hóa nhập liệu vào máy tính Người kiểm tra phải bảo đảm tính tồn vẹn tính xác bảng câu hỏi & câu trả lời bảng câu hỏi Thông thường bước nhàn nghiên cứu tiến hành kiểm tra đặc tính sau bảng câu hỏi:
- Tính logic câu trả lời: Đôi bảng câu hỏi, yêu cầu nghiên cứu có đường dẫn, điều kiện đễ người trả lời trả lời tất câu hỏi bỏ qua vài câu hỏi Kiểm tra tính logic bảng câu hỏi cho phép nhà nghiên cứu loại bỏ câu trả lời thừa, kịp thời bổ xung phần thiếu bảng câu hỏi Tính logic câu trả lời phụ thuộc vào kết dính liên hệ lẫn câu hỏi bảng câu hỏi (đôi câu trả lời có ý nghĩa đứng riêng lại vơ nghĩa kết hợp so sánh với câu trả lời trước sau nó)
- Tính đầy đủ câu trả lời bảng câu hỏi: Một bảng câu hỏi có giá trị tất câu hỏi theo yêu cầu trả lời đầy đủ Mỗi câu hỏi bảng câu hỏi có ý nghĩa, giá trị nghiên cứu định, thiếu câu trả lời cho câu hỏi cụ thể làm giá trị bảng câu hỏi
- Tính hợp lý xác thực câu trả lời: Một câu trả lời đầy đủ chưa
câu trả lời có giá trị, tính chân thực hợp lý câu trả lời định đến giá trị câu trả lời bảng câu hỏi, đặc biệt câu hỏi chấm điểm, câu hỏi mở câu hỏi mang tính logic
Q trình kiểm tra, rà sốt lại câu hỏi nhằm mục đích kiểm tra, phát hiện, sửa chửa thông báo kịp thời cho người thu thập liệu tránh sai sót
Để xử lý lỗi kiểm tra hiệu đính, ta lựa chọn cách xữ lý sau tùy thuộc vào mức độ sai sót cụ thể:
- Trả cho phận thu thập liệu để làm sáng tỏ vấn đề - Suy luận từ câu trả lời khác
(11)2. Mã hoá liệu
Là trình chuyển dịch câu trả lời thực người trả lời vào nhóm, mẫu đại diện với giá trị đại diện tương ứng nhằm làm cho q trình tóm tắc, phân tích nhập liệu dễ dàng hiệu Có hai dạng mã hóa:
- Tiền mã hóa: Là việc mã hóa cho câu hỏi đóng Do đặc điểm loại câu hỏi nhà nghiên cứu có sẵn câu trả lời từ trước, người trả lời việc lựa chọn câu trả lời phù hợp với ý kiến mình, việc mã hóa cho câu hỏi thường tiến hành từ trước, giai đoạn thiết kế bảng câu hỏi
- Mã hoá: Trong bảng câu hỏi ngồi câu hỏi đóng nêu trên, cịn câu
hỏi mở, câu hỏi mà người trả lời tự đưa câu trả lời theo suy nghĩ diễn giãi họ Các bảng câu hỏi nhận thường có câu trả lời khác đa dạng Do cơng việc mã hóa câu trả lời cần thiết cho q trình kiểm tra, nhập liệu, tóm tắc phân tích sau
Mục đích mã hóa tạo nhãn cho câu trả lời, thừơng số Mã hóa cịn giúp giảm thiểu số lượng câu trả lời cách nhóm câu trả lời vào nhóm có ý nghĩa Tiền trình mã hóa tiến hành sau:
- Đầu tiên, xác định loại câu trả lời cho câu hỏi tương ứng Những câu trả lời thu thập từ mẫu bảng câu hỏi hoàn tất, thường 25% tổng số bảng câu hỏi
- Bước xây dựng danh sách liệt kê câu trả lời, câu trả lời
được liệt kê tiến hành nhóm câu trả lời theo nhóm đặc trưng (có ý nghĩa)
- Cuối cùng, nhóm câu trả lời gán cho nhãn hiệu, giá trị,
thường số cụ thể
(12)CHƯƠNG 4: ĐỊNH BIẾN VAØ NHẬP DỮ LIỆU 1. Khái niệm biến giá trị biến
Biến tập hợp trả lời cho câu hỏi Có hai loại biến sau:
Phân loại biến theo số lượng câu trả lời:
- Biến trả lời: Biến dành cho câu hỏi có trả lời
- Biến nhiều trả lời: Các biến dành cho nhiều câu trả lời có câu hỏi nhiều trả lời
Ví dụ bảng câu hỏi có hai câu hỏi sau:
- Câu hỏi 1: Hãy cho biết bạn nhóm tuổi số nhóm tuổi sau:
Nhóm tuổi code
Dưới 18
19 đến 30
31 đến 40
41 đến 50
Treân 50
- Câu hỏi 2: Nói đến điện thoại di động, bạn biết nhãn hiệu danh sách liệt kê
Nhãn hiệu code
Ericson
Motorola
Nokia
Siemens
Panasonic
….V.V
Có thể thấy câu hỏi 1, người trả lời đưa câu trả lời tuổi mình, biến chứa đựng câu trả lời câu hỏi biến trả lời Trong xem xét câu hỏi 2, người trả lời nêu nhiều nhãn hiệu mà họ có biết qua, phải có nhiều biến chứa đựng trả lời có, ta gọi biến biến nhiều trả lời
Phân loại biến theo kiểu liệu:
(13)trên biến đó, ngược lại biến định lượng cho phép ta thao tác phép tốn giá trị mà đại diện Việc xác định dạng biến theo cách cho phép ta lựa chọn tham số thống kê tương thích để phân tích
Để xác định biến định lượng hay định tính đói hỏi phải xác định giá trị biến thuộc dạng thang đo bốn dạng thang sau:
- Thang đo định danh (Nominal Scale): Trong dạng thang đo soá
được sử dụng đơn giá trị xác định khác biệt cho câu trả lời, giá trị quan sát có ý nghĩa khác biệt Đối với loại thang biểu danh giá trị số sử dụng ký số nhận dạng khơng có giá trị thứ tự cao thấp và độ lớn số
- Thang đo thứ tự (Ordinal Scale): Trong dạng thang đo liệu xắp
xếp giá trị quan sát theo thứ tự cao thấp định, không diễn tả độ lớn vị trí cao thấp số Tóm lại thang thứ tự bao gồm thơng tin biểu danh đồng thời cung cấp mối quan hệ theo thứ tự giá trị khơng đo khoảng cách giá trị
- Thang khoảng cách (Internal Scale): Giống đặc tính thang đo
thứ tự, nhiên thang khoảng cách cho phép ta đo khoảng cách giá trị Tuy nhiên thang đo khoảng cách không xác định điểm chung (giống thang đo nhiệt độ) ta nói giá trị lớn giá trị đơn vị kết luận giá trị lớn giá trị lần
- Thang đo tỷ lệ (ratio): Đây thang đo có đủ đặc tính thứ tự khoảng
cách Ngoài việc xác định tỷ số chênh lệch giá trị thức thang đo điểm xác định cách có ý nghĩa
(14)2. Phương pháp định biến SPSS (Define Variable)
Định biến hình quản lý biến (variables view) Cơng việc định biến thực trước tiến hành nhập liệu vào máy
Mục đích việc đình biến gán nhãn thơng số cho biến gán ý nghĩa cho giá trị biến Sau mã hóa liệu đại diện số số có ý nghĩa khác tùy theo câu trả lời thu thập Để số nhập vào máy tính quản lý có ý nghĩa SPSS, ta phải tiến hành định biến cho liệu Qui trình định biến bao gồm bước sau:
- Gán tên cho biến (Name): Ta gõ tên biến cần khai báo vào cột
màn hình Variables view (Nếu ta khơng gõ tên biến vào SPSS mặc định tên biến Var000001) Tên biến khai báo hiển thị đầu cột hình Data view Tên biến bị hạn chế số ký tự hiển thị, cần thiết phải khai báo ngắn gọn dễ gợi nhớ, thông thường nên đặt theo thứ tự câu hỏi bảng câu hỏi q1, q3, q4a, …Có số qui ước sau phải tuân theo khai báo tên biến:
Bắt đầu chử không bắt đầu dấu chấm(.) Tên biến không qua ký tự
Không chứa khoảng trắng ký tự đặc biệt (!), (?), (*)
Các từ khóa sau khơng dùng làm tên biến: ALL, NE, EQ, TO, LE, LT, BY OR, GT, AND, NOT, GE, WITH
- Định kiểu biến (Type): Có dạng biến sau định dạng Dạng số (numeric); Dạng tiền tệ; dạng ngày (Date) dạng chuổi (String) Ngoài phần cho phép ta định dạng dạng số hiễn thị khác (Xem hình 4-1)
(15)Tùy thuộc vào yêu cầu liệu, mà ta định loại biến cho biến, SPSS mặc định loại biến kiểu số (numeric); ngồi cịn khai báo kiểu hiễn thị số khác kiểu số có dấu phẩy (Comma) hay dấu chấm (Dot) ngăn cách khoảng cách hàng ngàn số; cách hiễn thị theo ký hiệu khoa học (Scientific notation); Hiễn thị ngày, dollar kiểu tiền tệ khác; cuối cách hiễn thị dạng chuổi
- Xác định số lượng số hiễn thị cho giá trị (Width) số lượng số sau
dấu phẩy hiển thị (Decimals): Khai báo bề rộng số (hàng đơn vị, hàng trăm, hàng triệu, …) ô Width, Và khai báo số số thập phân sau dầu phẩy ô Decimal
- Gán nhãn cho biến (Variable Label): Đặt tên nhãn cho biến cách đầy đủ
hơn, tên biến hiễn thị ý nghĩa biến kết phân tích hình kết (output), công cụ giúp ta hiểu ý nghĩa biến khảo sát dễ dàng trình phân tích
- Định tên cho giá trị biến (Value lables): Trong q trình mã hóa
liệu ta gán giá trị biến thành số đại diện, Nhưng q trình đọc phân tích kết nghiên cứu dễ dàng ta phải gán số ý nghĩa mà đại diện, công cụ định lại nhãn cho giá trị cho phép ta thực điều (Xem hình 4-2):
Hình 4-2
Gán nhãn giá trị (value lables) có ba thao tác: o Gán nhãn mới:
• Nhập giá trị vào hộp thoại Value
• Nhập nhãn giá trị vào hộp thoại Value Label • Aán nút Add để xác định nhãn
(16)• Di vệt sáng đến nhãn cần sửa đổi
• Nhập tên nhãn mới, ấn nút Change để thay đổi o Loại bỏ nhãn:
• Di vệt sáng đến nhãn cần loại bỏ • Aán nút Remove để loại bỏ
- Định nghĩa giá trị khuyết (Missing Values): Được dùng để định giá
trị cụ thể cho giá trị mà ta muốn loại bỏ khỏi phân tích xử lý thống kê sau hay cịn gọi giá trị khuyết Ví dụ câu hỏi thu nhập, có số trường hợp từ chối trả lời tương ứng với giá trị mã hóa 99 Trong q trình phân tích để loại bỏ tất trường hợp khỏi xữ lý thống ke, ta phải tiến hành khai báo giá trị 99 giá trị khuyết phần giá trị khuyết (Missing values) (Xem hình 4-3)
Hình 4-3
SPSS mặc định khơng có khai báo giá trị khuyết Có ba cách để khai báo giá trị khuyết
(1)hai báo giá trị rời rạc (Discrete missing values)
(2)Khai báo chuổi liên tục giá trị (Range of missing values)
(3)Khai báo chuổi giá trị khuyết giá trị khuyết riêng biệt (Rang plus one discrete missing value)
Đối với liệu dạng chuổi Tồn giá trị vơ dụng trống xem có nghĩa Để định nghĩa giá trị vô nghĩa giá trị trống giá trị khuyết ta phải nhập vào khoảng trống vào trông ô định giá trị khuyết riêng biệt
(17)- Định vị trí hiễn thị giá trị (align): Vị trí hiễn thị giá trị cột
(phải, trái, giữa)
- Định dạng thang đo mà biến thể (measurement): Tùy thuộc vào dạng
thang đo sử dụng biến mà ta khai báo công cụ measurement, ý khai báo scale dùng chung cho dạng thang đo khoảng cách thang đo tỷ lệ Việc khái báo mang tính chất quản lý không ảnh hưởng đến kết phân tích
3. Nhập liệu
Dữ liệu cần nhập nhập vào hình Data views Màn hình thể ma trận thông tin bao gồm: cột hàng, ô giao cột hàng (Xem hình 2-1)
Dữ liệu nhập theo trình tự sau:
- Khai báo tên biến chứa đựng thông tin cần nhập vào bên cột
(tên mặc định cột SPSS var00001, …, var0000x) Phần đề cập chi tiết phần định biến
- Chọn ô cần nhập liệu, phần giao cột hàng Ô cần nhập có khung viền chung quanh báo cho người nhập biết hoạt động, tên biến số hiệu hàng góc trái cửa sổ
- Gõ giá trị cần nhập vào khung chọn, giá trị sữa
đổi (cell editor) nằm cửa sổ Chú ý nhập liệu phải bảo đảm với kiểu biến định nghĩa Thông thường kiểu biến khai báo dạng chuổi (ngắn tối đa ký tự) dạng số, nhằm bảo đảm tính tương thích cho việc phân tích sau
Ta nhập liệu từ phần mềm khác Excel, Fox, … sau chuyển vào SPSS