Bài giảng cung cấp cho người học các kiến thức: Nhập và mở các tệp dữ liệu. Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu.
Bài 2 NHẬP VÀ MỞ CÁC TỆP DỮ LIỆU 1. Khái niệm về biến và các giá trị trong biến 2. Phương pháp định biến trong SPSS 3. Nhập dữ liệu 4. Mở các tệp dữ liệu 5. Hợp nhất các tập dữ liệu (Merge files) 6. Hiệu đính dữ liệu trong bảng Data View 7. Mã hố lại dữ liệu Khái niệm về biến và các giá trị trong biến • Biến là tập hợp những trả lời cho một câu hỏi Phân loại biến theo số lượng câu trả lời Biến một trả lời Biến nhiều trả lời Biến một trả lời • Câu hỏi 1: Hãy cho biết bạn ở nhóm tuổi nào trong số những nhóm tuổi sau: Nhóm tuổi code Dưới 18 1 18 đến 30 31 đến 40 41 đến 50 Trên 50 2 3 4 5 Biến nhiều trả lời • Câu hỏi 2: Nói đến điện thoại di động, bạn biết được những nhãn hiệu nào trong danh sách liệt kê dưới đây: Nhãn hiệu code Ericson LG 2 Motorola Nokia Samsung 5 Siemens Panasonic ….V.V Phân loại biến theo kiểu dữ liệu Biến định tính • Thang đo định danh (nominal scale) • Thanh đo thứ bậc (ordinal scale) Biến định lượng • Thang đo khoảng cách (internal scale) • Thang đo tỷ lệ (ratio) 2. Phương pháp định biến trong SPSS (Define Variable) • Gán tên (nhãn) cho biến (Name) • Định dạng kiểu biến (Type) • Xác định số lượng con số hiễn thị cho giá trị (Width) và số lượng con số sau dấu phẩy hiển thị (Decimals) • Gán nhãn cho biến (Variable Label) • Định tên cho các giá trị trong biến (Value lables) • Định nghĩa các giá trị khuyết (Missing Values) • Định kích cở cho cột (Column format) • Định ra vị trí hiển thị các giá trị (align) • Định ra dạng thang đo mà biến thể hiện (measurement) Gán nhãn cho biến (Variable Label Định dạng kiểu biến (Type) 3. Nhập dữ liệu Bạn có thể nhập dữ liệu theo đối tượng hoặc theo biến, hoặc theo khu vực được chọn, hoặc theo từng ơ Một số chú ý • Ơ hoạt động (ơ con trỏ) ln được làm sáng • Tên biến và số của hàng của ơ hoạt động được thể hiện ở góc cao bên trái của cửa sổ Data Editor. • Khi chọn một ơ và nhập một trị số thì nó sẽ được thể hiện ở khoang hiệu đính dữ liệu nằm ở trên của Data Editor • Các trị số khơng được ghi cho đến khi bạn nhấn Enter hoặc chọn ơ khác • Để nhập bất kỳ gì khác một dữ liệu dạng số, trước hết phải định nghĩa loại dữ liệu • Nếu nhập một trị số vào một cột rỗng, Data Editor tự động tạo ra một biến mới và chỉ định một tên biến • Nếu gõ một ký tự khơng được chấp nhận bởi loại biến, Data Editor sẽ phát ra tiếng kêu bíp và khơng nhập ký tự • Với các biến dạng chuỗi, các ký tự nằm ngồi độ rộng được định nghĩa sẽ khơng được chấp nhận • Với các biến dạng số, các trị số ngun vượt q độ rộng vẫn có thể được nhập vào, nhưng Data Editor thể hiện hoặc là chú giải khoa học hoặc là các dấu hoa thị trong ô để chỉ ra rằng trị số này rộng hơn độ rộng được định nghĩa. Để thể hiện trị số trong ô, thay đổi độ rộng của biến 5. Hợp nhất các tập dữ liệu (Merge files) • SPSS cho phép hợp nhất các dữ liệu từ trong một tập dữ liệu bên ngồi vào tập dữ liệu đang sử dụng. Hoặc hợp các biến mới trong tập dữ liệu bên ngồi vào tập dữ liệu đang hoạt động. Cả hai đều tạo ra một tập dữ liệu mới có thể chứa tất cả các quan sát được hợp lại hoặc tất cả các biến đưọc hợp tùy theo ta chọn Add Cases hay Add Variables 5.1 Thêm vào các quan sát (Add Cases) • Chọn Data/Merge Files/Adds Cases Hộp thoại Read File cho phép ta lựa chọn tập dữ liệu sẽ được hợp với tập dữ liệu đang hoạt động (working file). Nhấn Open để xác nhận việc lựa chọn này Add Cases Sau khi lựa chọn xong tập dữ sẽ được kết hợp, ta sẽ có một hộp thoại Những biến được liệt kê trong hộp thoại Unpaired Variables là những biến có những đặc điểm như sau: Hai biến có tên biến được khai báo khác nhau Những biến có dạng dữ liệu khác nhau Cả hai biến biến cùng là dạng chuổi nhưng lai khơng bằng nhau về số ký tự trong chuổi Unpaired Variables: liệt kê các biến không giống nhau giữa hai tập dữ liệu đang được tiến hành hợp nhất lại, các biến không giống nhau này sẽ bị loại ra và khơng có trong tập dữ liệu mới được tạo ra từ việc hợp nhất hai tập dữ liệu ban đầu. Các biến này được ký hiệu khác nhau với ký hiệu (*) đại diện cho các biến trong tập dữ liệu đang hoạt động và (+) đại diện cho các biến trong tập dữ liệu được truy xuất từ bên ngoài. Hộp thoại Variables in New Working Data File liệt kê các biến sẽ có trong tập tin mới được tạo ra từ việc hợp nhất hai tập dữ liệu ban đầu. Toàn bộ các biến trong hai tập tin ban đầu thỏa mãn các điều kiện giống nhau về tên và loại dữ liệu (số hoặc chuổi) sẽ được liệt kê vào hộp thoại này • 5.2. Thêm vào các biến (Add Variables) Data/Merge Files/Adds Variables từ menu Excluded Variables liệt kê các biến sẽ bị loại trừ ra khỏi biến mới hợp thành. Những biến này là những biến có tên biến giống nhau. Biến trong tập tin đang hoạt động được ký hiệu là (*), và những biến trong tập tin bên ngoài là (+). Nếu muốn các biến giống tên nhau này có trong tập dữ liệu mới ta phải tiến hành rename nó lại và chuyển nó sang hộp thoại chứa các biến sẽ có trong tập tin mới Key Variables. Biến khóa dựa vào đó các quan sát giống nhau được xác định. Biến khóa này phải cùng tên ở các hai tập tin cần hợp nhất. Các trường hợp khơng thỏa mãn với biến khóa thì vẫn bao hàm trong tập dữ liệu mới nhưng sẽ khơng được hợp với các trường hợp trong tập tin khác. Những trường hợp này chỉ chứa đựng giá trị riêng biệt của tập dữ liệu mà nó bao hàm từ trước (trước khi tiến hành hợp nhất) và các trường hợp này sẽ có giá trị khuyết trong các biến chứa đựng trong tập tin thứ hai mà ta sẽ hợp nhất 6. Hiệu đính dữ liệu trong bảng Data View Với Data Editor, có thể hiệu đính trị số của dữ liệu trong bảng Data View theo nhiều cách. Bạn có thể: • Thay đổi trị số của dữ liệu • Cắt, sao chép, và dán các trị số của dữ liệu • Thêm vào hoặc xố các đối tượng • Thêm vào hoặc xố các biến • Thay đổi trật tự của các biến 6.1 Để thay thế hoặc hiệu đính một trị số của dữ liệu Để xoá trị số cũ và nhập một trị số mới: • • Trong bảng Data View, nhắp đúp vào ơ. Trị số được thể hiện trong khoang hiệu đính dữ liệu • • Hiệu đính trị số trực tiếp từ ơ hoặc • trong khoang hiệu đính dữ liệu • Nhấn Enter (hoặc chuyển sang ơ khác) để ghi trị số mới • • • Cắt, sao chép và dán các trị số của dữ liệu Có thể cắt, sao chép và dán các trị số của từng ô hoặc một nhóm các trị số trong Data Editor. Có thể: Chuyển hoặc sao chép trị số của một ô sang một ô khác Chuyển hoặc sao chép trị số của một ơ sang một nhóm các ơ Chuyển hoặc sao chép trị số của một đối tượng sang cho một nhóm các đối tượng Chuyển hoặc sao chép trị số của một biến sang cho một nhóm các biến Chuyển hoặc sao chép trị số của một nhóm các ơ sang cho một nhóm các ơ khác 6.2 Chèn thêm các đối tượng mới Để chèn một đối tượng mới giữa các đối tượng đã có sẵn • Trong Data View, chọn bất kỳ ô nào trong đối tượng (hàng) nằm dưới vị trí nơi mà bạn muốn chèn đối tượng mới • Từ thanh menu chọn: Data/Insert Case Một hàng mới được chèn vào và mọi biến của đối tượng mới này đều nhận được trị số khuyết thiếu hệ thống 6.3 Chèn một biến mới Để chèn một biến mới giữa các biến đã có sẵn • Chọn bất kỳ ô nào trong biến bên phải của (bảng Data View) hoặc dưới (của bảng Variable View) vị trí mà bạn muốn chèn biến mới vào • Từ thanh menu chọn: Data / Insert Variable Một hàng mới được chèn vào với trị số khuyết thiếu hệ thống cho mọi đối tượng 6.4 Để chuyển một biến trong Data Editor Nếu muốn đặt vị trí biến giữa hai biến đã có sẵn, hãy chèn một biến vào vị trí nơi bạn muốn di chuyển biến đến đó • Đối với biến bạn muốn chuyển, nhắp tên biến ở đỉnh của cột trong bảng Data View hoặc số hàng trong bảng Variable View. Tồn bộ biến sẽ được làm nổi bật/tơ sáng • Từ thanh menu chọn : Edit/Cut • Nhắp vào tên biến (trong bảng Data View) hoặc số hàng (trong bảng Variable View) nơi bạn muốn di chuyển biến đến. Tồn bộ biến này sẽ được mà nổi bật • Từ thanh menu chọn : Edit/Paste 6.5 Thay đổi loại dữ liệu Có thể thay đổi loại dữ liệu cho một biến bất kể lúc nào có sử dụng hộp thoại Variable Type trong bảng Variable View, và Data Editor sẽ chuyển đổi các trị số hiện có sang loại mới. Nếu khơng thể chuyển đổi được thì trị số khuyết thiếu hệ thống sẽ được chỉ định 6.6 Tình trạng lọc đối tượng trong Data Editor Các đối tượng bị lọc (bị loại trừ) 7. Mã hố lại dữ liệu 7.1 Mã hố lại dữ liệu ngay trong biến có sẵn (khơng tạo thành biến mới) Từ thanh menu chọn: Transform / Recode / Into Same Variables… •Chọn các biến mà bạn muốn mã hố, Nếu bạn chọn nhiều biến, chúng phải có cùng dạng (chuỗi hoặc số) •Nhắp vào Old and New Values và định rõ cách mã hố lại trị số •Một cách tuỳ chọn, bạn có thể chọn một nhóm các đối tượng để mã hố •Hộp thoại If Cases để xác định một nhóm các đối tượng cũng giống như đã được mơ tả trong mục tính tốn biến {Compute Variable} Hộp thoại Recode into Same Values: Old and NewValues Old Value. Trị số (hoặc các trị số) bị mã hố. Có thể mã hố các trị số đơn, một phạm vi các trị số và các trị số khuyết thiếu. Các phạm vi bao gồm các điểm cuối của chúng và mọi trị số khuyết thiếu của người sử dụng nằm trong phạm vi này New Value. Trị số đơn mà trong nó từng trị số cũ hoặc phạm vi của các trị số được mã hố. Bạn có thể nhập một trị số hoặc chỉ Old>New. Danh sách các trị số sẽ định trị số khuyết thiếu hệ thống được sử dụng để mã hố biến (hoặc các biến). Có thể bổ sung, thay đổi hoặc loại bỏ các trị số này ra khỏi danh sách. Danh sách được tự động sắp xếp, dựa trên các trị số cũ, sử dụng trật tự sau: các trị số đơn, các trị số khuyết thiếu, các phạm vi và mọi trị số khác. Nếu bạn thay đổi một trị số trong danh sách, thủ tục sẽ tự động sắp xếp lại danh sách, nếu cần thiết, để duy trì trật tự này 7.2 Mã hố thành biến khác Từ thanh menu chọn •Transform / Recode / Into Different Variables… •Chọn các biến mà bạn muốn mã hố, Nếu bạn chọn nhiều biến, chúng phải có cùng dạng (chuỗi hoặc số) •Nhập một tên biến mới cho từng biến và nhắp Change •Nhắp Old and New Values và định rõ cách mã hố lại trị số •Một cách tuỳ chọn, bạn có thể chọn một nhóm các đối tượng để mã hố Hộp thoại Recode into Same Values: Old and NewValues Old>New. Danh sách các trị số sẽ được sử dụng để mã hố biến (hoặc các biến). Có thể bổ sung, thay đổi hoặc loại bỏ các trị số này ra khỏi danh sách. Danh sách được tự động sắp xếp, dựa trên các trị số cũ, sử dụng trật tự: các trị số đơn, các trị số khuyết thiếu, các phạm vi và mọi trị số khác. Nếu thay đổi một trị số trong danh sách, thủ tục sẽ tự động sắp xếp lại danh sách, nếu cần thiết, để duy trì trật tự này Old Value. Trị số (hoặc các trị số) bị mã hố. Bạn có thể mã hố các trị số đơn, một phạm vi các trị số và các trị số khuyết thiếu. Các trị số khuyết thiếu hệ thống và các phạm vi khơng thể được chọn đối với các biến dạng chuỗi bởi vì khơng có khái niệm nào áp dụng cho các biến dạng chuỗi. Các phạm vi bao gồm các điểm cuối của chúng và mọi trị số khuyết thiếu của người sử dụng nằm trong phạm vi này New Value. Trị số đơn mà trong nó từng trị số cũ hoặc phạm vi của các trị số được mã hố. Bạn có thể nhập một trị số hoặc chỉ định trị số khuyết thiếu hệ thống ... Chọn một nhãn trị số từ danh sách mở xuống • Trị số được nhập vào và nhãn trị số được thể hiện trong ơ Chú ý: Điều này chỉ làm việc nếu bạn đã định nghĩa nhãn trị số của biến 4. Mở các tệp dữ liệu Các file dữ liệu có các định dạng khác nhau, có thể ... (Files of type) và sau đó chọn tên file (File name) 5. Hợp nhất các tập dữ liệu (Merge files) • SPSS cho phép hợp nhất các dữ liệu từ trong một tập dữ liệu bên ngồi vào tập dữ liệu đang sử dụng. Hoặc hợp các biến mới trong tập dữ ... Với Data Editor, có thể hiệu đính trị số của dữ liệu trong bảng Data View theo nhiều cách. Bạn có thể: • Thay đổi trị số của dữ liệu • Cắt, sao chép, và dán các trị số của dữ liệu • Thêm vào hoặc xố các đối tượng • Thêm vào hoặc xố các biến