Chương 5 xử lý dữ liệu

41 479 0
Chương 5 xử lý dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệuChương 5 xử lý dữ liệu

CHƯƠNG XỬ LÝ DỮ LIỆU Xử lý liệu 5.1 Hiệu chỉnh liệu 5.2 Mã hóa liệu 5.3 Nhập liệu 5.4 Làm liệu 5.1 Hiệu chỉnh liệu  Đây bước kiểm tra chất lượng bảng câu hỏi nhằm đảm bảo bảng hỏi thiếu thông tin cần thiết theo yêu cầu thiết kế ban đầu - Tính logic câu trả lời slide\1.ppt - Tính đầy đủ câu trả lời bảng hỏi slide\2.ppt - Tính hợp lý xác thực câu trả lời 5.1 Hiệu chỉnh liệu  Các phương pháp xử lý, hiệu chỉnh liệu: - Suy luận từ câu trả lời khác - Trả cho phận thu thập liệu để làm sáng tỏ lại vấn đề - Loại bỏ toàn bảng câu hỏi 5.2 Mã hóa liệu   Khái niệm: Mã hóa liệu chuyển đổi thông tin nghiên cứu thu thập thành dạng ký hiệu thích hợp cho việc phân tích máy tính Nguyên tắc mã hóa liệu: Phù hợp với vấn đề nghiên cứu mục tiêu nghiên cứu  Thống  Toàn diện  Không trùng lắp  5.2 Mã hóa liệu  Giới  thiệu cửa sổ làm việc SPSS: Cửa sổ liệu: có loại kiểu nhìn (view) - Data View: kiểu nhìn dùng để nhập liệu thể liệu nhập - Variable View: kiểu nhìn dùng để khai báo biến  Cửa sổ Output: hiển thị kết thực lệnh xử lý chuyển Hiện dòng Gồm trạngcác thái, thị Tạolệnh biểu đồ vàđổi đồ thị… Giúp khởi tạo file mới, biến, toán giá trị biến, công cụ,liệu chọn font Gồm lựa chọn undo, Gồm lựa chọn vềtính chèn mở filesao có chép, sẵn, lưu mãnhập hóa lạibiến, chữ, giá trị vào haybiến… cắtcác dán, tìmtìm kiếm, thêm biến, theo giá trị sẵp file, in ấn,xác thoát… nhãn giá trị nhập vào … thay thế, lập mặc định xếp thứ tự quan sát, định dạng Thực thủ phân tích thống biếnhiện có nhiều lựatục chọn… kê tóm tắt liệu, lập bảng tổng hợp, tiến hành kiểm định so sánh giá trị trung bình, kiểm định tham số phi tham số, phân tích tương quan hồi quy, phân tích nhân tố… 5.2 Mã hóa liệu  Mã hóa tên biến (name): Tên biến cần đặt ký tự đặc biệt không bắt đầu ký số Thông thường, ta hay đặt tên biến gần với câu hỏi hay theo số thứ tự câu hỏi mà biến mô tả Ví dụ, câu hỏi thứ ba khai báo tên biến q3 c3  Cách mã SPSS: nhập trực tiếp tên biến dự kiến vào ô cột (Name) bảng tính Variable View  5.3 Nhập liệu  Cấu trúc bảng liệu (Data View) Cột: nơi quản lý biến (các câu hỏi bảng hỏi)  Dòng: nơi quản lý tất thông tin bảng hỏi (số lượng dòng tương đương với kích cỡ mẫu)  Ô giao cột dòng: nơi chưa đựng giá trị trả lời câu hỏi bảng hỏi cụ thể  5.3 Nhập liệu  Nhập  trực tiếp từ bàn phím: Nguyên tắc: - Mỗi bảng hỏi nhập dòng - Chỉ nhập giá trị nhãn (Values): số biến số chữ biến ký tự  Cách nhập SPSS: 5.3 Nhập liệu  Các kỹ thuật nhập liệu:  Nhập toàn số liệu hai lần hai người riêng biệt  Nhập toàn số liệu hai lần người thực  Nhập toàn số liệu lần, sau chọn ngẫu nhiên đơn khoảng 20% số liệu nhập lại lần  Nhập toàn số liệu, chọn ngẫu nhiên đơn khoảng 20% số liệu kiểm tra lại mắt  Nhập toàn số liệu lần, không kiểm tra lần hai 5.4 Làm liệu  Sự cần thiết: Dữ liệu sau nhập xong chưa thể đưa vào xử lý thường gặp lỗi sau: Chất lượng vấn đọc soát  Quá trình nhập liệu: sai, sót, thừa  5.4 Làm liệu Ví dụ: Bạn quy ước mã hóa đại diện cho nam đại diện cho nữ, ta thực lệnh đếm tần số giới tính lại cho kết bảng dưới, điều chứng tỏ bạn nhập nhầm 5.4 Làm liệu  Các biện pháp ngăn ngừa:  Thiết kế bảng câu hỏi rõ ràng, dễ hỏi, dễ trả lời  Chọn lọc huấn luyện vấn viên kỹ lưỡng, tiến hành điều tra vấn thử trước vấn thật để hiểu thống nhất, tránh sai sót  Các bảng câu hỏi sau vấn xong phải đọc soát kiểm lỗi, chỉnh sửa trước nhập  Việc mã hóa phải tiến hành tập trung với số cá nhân phụ trách việc nhập liệu, không nên phân tán để tránh bị rối loạn thiếu thống 5.4 Làm liệu  Các phương pháp làm liệu:  Dùng bảng tần số  Dùng bảng phối hợp hai biến hay ba biến  Cách tìm lỗi đơn giản cửa sổ liệu (Data View) Bảng tần số Quy trình thực - Trên cửa số Data View chọn toàn cột biến có giá trị bị lỗi - Trên Menu, chọn Edit > Find - Nhập giá trị lỗi vào ô Find what nhấp nút Find next để tìm vị trí ô chứa giá trị lỗi - Truy ngược lại số thứ tự hàng để xác định bảng hỏi tương ứng Dùng bảng phối hợp hai hay ba biến Quy trình thực - Lập bảng kết hợp biến dựa vào quan hệ logic để phát lỗi - Trên Menu, chọn Data > Select Cases Trong hộp thoại này, lựa chọn mục If condition is satisfied để định lọc trường hợp thỏa quan hệ logic cần xác định - Nhấp chọn tiếp nút If… để xây dựng biểu thức hàm If khung bên cạnh - Nhấp Continue trở hộp thoại trước chọn OK Một số xử lý biến Mã hóa lại biến (recode) - Giảm số biểu biến định tính - Chuyển biến định lượng thành biến định tính Quy trình thực - Trên Menu, chọn Transform > Recode > Into Different Variables - Trong hộp thoại Recode Into Different Variables, chọn biến muốn mã hóa lại đưa sang khung Numeric Variable > Output Variable Một số xử lý biến - - Sang phần Output Variable để đặt tên nhãn cho biến Nhấp vào nút Old and new value để mở hộp thoại xác định chuyển đổi giá trị cũ giá trị tương ứng Xác định xong nhấp nút Continue để trở hộp thoại trước đó, nhấp chọn OK để thực mã hóa lại => xuất biến mã hóa lại Chuyển sang Variable View, vào khai báo thuộc tính cho biến vừa mã hóa lại Một số xử lý biến Chuyển biến dạng Category thành biến dạng Dichtomy - Biến dạng category biến phân loại có nhiều trị số mã hóa tượng trưng cho nhiều biểu khác biến - Biến dạng dichtomy biến phân loại có trị số mã hóa tượng trưng cho biểu biến (ví dụ: nam hay nữ, có dùng điện thoại hay không, có theo tôn giáo hay không) Một số xử lý biến Quy trình thực - Trên Menu, chọn Transform > Count - Khai báo tên biến Dichtomy muốn tạo khung Target Variable nhãn biến khung Target Lable - Đưa biến Category cần chuyển đổi vào khung Numeric Variable - Nhấp nút Define Values để mở hộp thoại - Nhập giá trị mã hóa tương ứng với biểu cần chuyển đổi vào khung Value nhấp Add để đưa sang khung Values to Count - Nhấp Continue trở hộp thoại trước chọn OK [...]... nhập dữ liệu sau này  Ví dụ: slide\3.ppt  5. 2 Mã hóa dữ liệu  Bảng mã dữ liệu: Đây là danh mục chi tiết các mã số/ký tự đã được quy định cho các thông tin phân tích  Chức năng: - Giảm khả năng sai sót trong khâu nhập dữ liệu - Giúp xác định được vị trí của các biến trong quá trình phân tích  Cấu trúc của bảng mã dữ liệu 5. 3 Nhập dữ liệu  Cấu trúc bảng dữ liệu (Data View) Cột: là nơi quản lý các... một dòng  5. 2 Mã hóa dữ liệu  Mã hóa các giá trị (Values): Là giai đoạn quan trọng nhất trong việc mã hóa dữ liệu bằng cách gán cho các dữ liệu thu thập được bởi những con số thích hợp  Đối với câu hỏi đóng: Nhập các con số tương ứng với các câu trả lời đã được liệt kê sẵn  5. 2 Mã hóa dữ liệu  Cách mã trong SPSS: Mở hộp thoại Value Label và nhập nội dung cần khai báo Ví dụ: 5. 2 Mã hóa dữ liệu  Mã... Cách nhập trong SPSS: 5. 3 Nhập dữ liệu  Các kỹ thuật nhập dữ liệu:  Nhập toàn bộ số liệu hai lần bởi hai người riêng biệt  Nhập toàn bộ số liệu hai lần do một người thực hiện  Nhập toàn bộ số liệu một lần, sau đó chọn ngẫu nhiên đơn khoảng 20% bộ số liệu và nhập lại lần 2  Nhập toàn bộ số liệu, chọn ngẫu nhiên đơn khoảng 20% bộ số liệu và kiểm tra lại bằng mắt  Nhập toàn bộ số liệu một lần, không... bộ số liệu và kiểm tra lại bằng mắt  Nhập toàn bộ số liệu một lần, không kiểm tra lần hai 5. 4 Làm sạch dữ liệu  Sự cần thiết: Dữ liệu sau khi nhập xong chưa thể đưa vào xử lý ngay vì thường gặp những lỗi cơ bản sau: Chất lượng của phỏng vấn và đọc soát  Quá trình nhập dữ liệu: sai, sót, thừa  5. 4 Làm sạch dữ liệu Ví dụ: Bạn quy ước mã hóa 1 đại diện cho nam và 2 đại diện cho nữ, nhưng khi ta thực... độ rộng của cột biến khi ta nhập dữ liệu Mặc định của chương trình là 8 Align: xác định vị trí dữ liệu được nhập trong cột Mặc định của chương trình là Right Measure: chọn loại thang đo thể hiện dữ liệu với 3 loại chính là Nominal (thang đo định danh), Ordinal (thang đo thứ bậc) và Scale (bao gồm cả thang đo khoảng và thang đo tỷ lệ) 5. 2 Mã hóa dữ liệu  Lưu ý: Đối với những câu hỏi đa lựa chọn (multiple... biến đang xử lý Regression ước lượng các giá trị khuyết bằng thuật toán hồi quy EM ước lượng các giá trị khuyết bằng quá trình lặp Trong đó, ở mỗi bước lặp có một bước E tính giá trị trung bình của các tham số và một bước M tính các ước lượng hợp lý nhất - Điền các giá trị khuyết bằng phương pháp regression hoặc EM 5. 2 Mã hóa dữ liệu    Columns: Khai báo độ rộng của cột biến khi ta nhập dữ liệu Mặc...  Việc mã hóa phải được tiến hành tập trung với một số ít cá nhân phụ trách việc nhập liệu, không nên phân tán để tránh bị rối loạn do thiếu thống nhất 5. 4 Làm sạch dữ liệu  Các phương pháp làm sạch dữ liệu:  Dùng bảng tần số  Dùng bảng phối hợp hai biến hay ba biến  Cách tìm lỗi đơn giản ngay trên cửa sổ dữ liệu (Data View) Bảng tần số Quy trình thực hiện - Trên cửa số Data View chọn toàn bộ cột... 5. 2 Mã hóa dữ liệu  Mã hóa kiểu biến (Type): Có nhiều kiểu hiện thị khác nhau của biến để lựa chọn (đồng thời với độ rộng và phần thập phân của biến) 5. 2 Mã hóa dữ liệu  Nhãn biến (Label): Là lời giải thích cho tên biến Đặt nhãn biến phải ngắn gọn nhưng có tính giải thích cao Nhãn... 5. 2 Mã hóa dữ liệu  Có hai cách mã đối với câu hỏi mở: - Mã hóa trước: dự kiến được các tình huống mà người trả lời sẽ đưa ra dựa vào lý thuyết và kinh nghiệm của các lần nghiên cứu trước để nhóm các câu trả lời thành các nhóm tương đồng - Mã hóa sau: sau khi điều tra toàn bộ mẫu, đọc trước khoảng 30% các bảng hỏi để tính toán các tình huống và tìm cách nhóm các câu trả lời có ý nghĩa tương đồng 5. 2... giá trị khuyết hệ thống và được chương trình tự động đặt dấu chấm (.) ở những vị trí không được nhập giá trị  5. 2 Mã hóa dữ liệu  Mã hóa các giá trị khuyết (Missing): - Là công cụ mô tả quy luật của các giá trị khuyết: các giá trị khuyết nằm ở đâu, có nhiều giá trị khuyết không, các dữ liệu quá lớn hay quá nhỏ hay các giá trị bị thiếu một cách ngẫu nhiên - Ước lượng trung bình, phương sai và độ lệch .. .Xử lý liệu 5. 1 Hiệu chỉnh liệu 5. 2 Mã hóa liệu 5. 3 Nhập liệu 5. 4 Làm liệu 5. 1 Hiệu chỉnh liệu  Đây bước kiểm tra chất lượng bảng câu hỏi nhằm... ngẫu nhiên đơn khoảng 20% số liệu kiểm tra lại mắt  Nhập toàn số liệu lần, không kiểm tra lần hai 5. 4 Làm liệu  Sự cần thiết: Dữ liệu sau nhập xong chưa thể đưa vào xử lý thường gặp lỗi sau: Chất... EM 5. 2 Mã hóa liệu    Columns: Khai báo độ rộng cột biến ta nhập liệu Mặc định chương trình Align: xác định vị trí liệu nhập cột Mặc định chương trình Right Measure: chọn loại thang đo thể liệu

Ngày đăng: 22/03/2016, 17:38

Mục lục

    CHƯƠNG 5 XỬ LÝ DỮ LIỆU

    Xử lý dữ liệu

    5.1. Hiệu chỉnh dữ liệu

    5.2. Mã hóa dữ liệu

    Cấu trúc của bảng mã dữ liệu

    5.4. Làm sạch dữ liệu

    Dùng bảng phối hợp hai hay ba biến

    Một số xử lý trên biến