Công việc ban đầu của dự án phần mềm SPSS đã được thực hiện tại Đại học Stanford với ý định phần mềm này sẽ chỉ được sử dụng trong các trường đại học.. Các phiên bản mới của phần mềm SPS
Trang 1Bài 1:
Khai báo và nhập liệu trên SPSS
Cách hiển thị giá trị trên đồ thị
trong SPSS
1 GIỚI THIỆU PHẦN MỀM SPSS
Năm 1968 tại Đại học Stanford nhà nghiên cứu xã hội học Norman H Nie và hai nghiên cứu sinh tiến sĩ C Hadlai (Tex) Hull, Dale H Ben phát triển một hệ thống phần mềm dựa trên ý tưởng của việc sử dụng số liệu thống kê để chuyển dữ liệu thô thành thông tin cần thiết cho việc ra quyết định dành cho nhà quản lý Hệ thốngphần mềm này được gọi là phần mềm SPSS viết tắc của Statistical Package for the Social Sciences
Nie, Hull và Bent phát triển phần mềm SPSS vì họ cần phải nhanh chóng phân tíchmột khối lượng dữ liệu khoa học xã hội thu thập được thông qua các phương pháp khác nhau trong các nghiên cứu của mình Như vậy dự án phần mềm SPSS được thực hiện khi đó Nie đóng vai trò trường nhóm đưa ra mục tiêu và thiết lập các yêucầu phân tích, còn Bent có chuyên môn phân tích và thiết kế cấu trúc hệ thống tập tin trong SPSS và Hull đã viết các chương trình máy tính Công việc ban đầu của
dự án phần mềm SPSS đã được thực hiện tại Đại học Stanford với ý định phần mềm này sẽ chỉ được sử dụng trong các trường đại học Trong những năm 1970 với các tiện ích trong phân tích thống kê nhu cầu sử dụng phần mềm SPSS được
mở rộng, và khi đó phần mềm SPSS được xem như là “cuốn sách có ảnh hưởng nhất ngành xã hội học” Do nhu cầu và phát triển phổ biến của nó, Công ty SPSS Inc được thành lập vào năm 1975 nhằm thương mại hoá phần mềm này Giữa những năm 1980 SPSS chạy trên những máy tính lớn
Trang 2Với những tiến bộ của máy tính cá nhân vào đầu năm 1980, SPSS/PC được giới thiệu vào năm 1984 nó như là các phần mềm thống kê đầu tiên cho máy tính mà làm việc trên nền tảng MS-DOS Tương tự như vậy, SPSS là sản phẩm thống kê đầu tiên cho hệ điều hành Microsoft Windows (phiên bản 3.1) đưa ra vào năm 1992.
Kể từ đó SPSS đã được cập nhật thường xuyên để phù hợp và khai thác các tính năng tiên tiến của hệ điều hành mới, và để đáp ứng nhu cầu ngày càng tăng giữa người sử dụng Tháng 07 năm 2009 phần mềm SPSS do SPSS Inc sở hữu được
IBM mua lại, do vậy các phiên bản sau này của SPSS có tên là IBM SPSS
Statistics
Người dùng phần mềm SPSS
Ban đầu, hầu hết người dùng của phần mềm SPSS là các nhà nghiên cứu, những người làm việc tại các trường đại học lớn với các máy tính máy tính lớn Vì giá rất cao, và việc làm của hệ thống an ninh cảm ứng và giao diện người dùng khó khăn của nó, không có nhiều người hay tổ chức sử dụng SPSS Phần mềm này không phổ biến trong các nhà nghiên cứu cho đến khi phiên bản SPSS trên máy tính cá nhân được đưa vào sử dụng rộng rãi
Sau khi phiên bản Windows đã được đưa ra thị trường, người dùng phần mềm SPSS tăng lên nhanh chóng bởi vì tính hữu ích của nó trong việc lưu trữ và xử lý
dữ liệu Các phiên bản mới của phần mềm SPSS sau này có thể xử lý nhiều bộ dữ liệu với một số lượng gần như không giới hạn cỡ mẫu và số biến Nó cho phép đọc
dữ liệu từ nhiều định dạng như Portable(*.por), Excel(*.xls, *.xlsx, *.xlsm)
Lotus(*.w) Sylk(*.slk) dBase(*.dbf) SAS(*.sas7bdat, *.sd7, *.sd2, *.ssd01,
*.ssd04, *.xpt) Sata(*.dat) Text(*.txt, *.dat, *.csv), và xuất các kết quả phân tích sang Microsoft Excel và các định dạng văn bản khác nhau
Trang 3SPSS là một chương trình được sử dụng rộng rãi trong ngành khoa học xã hội, quản trị kinh doanh Nó cũng được sử dụng bởi các nhà nghiên cứu thị trường, các nhà nghiên cứu y tế, công ty khảo sát, chính phủ, các nhà nghiên cứu giáo dục, các
tổ chức tiếp thị vv Các tính năng chính của phần mềm SPSS như sau:
Nhập dữ liệu xuất kết quả: Ngoài việc nhập dữ liệu và xuất kết quả trực tiếp trên
phần mềm, SPSS cho phép nhập dữ liệu và xuất kết quả phân tích sang các định dạng tập tin khác, chẳng hạn như Portable, Excel, dBase, SQL, TXT, Lotus, SAS, Sylk, truy cập và cho phép lấy mẫu, phân loại, xếp hạng, thiết lập, sáp nhập, và tập hợp dữ liệu
Thống kê và tổng kết cơ bản: Tần số, tần suất, thống kê mô tả, lập bảng thống kê,
thống kê tỷ lệ, vẽ đồ thị
Kiểm tra ý nghĩa: Mean, T-Test, ANOVA, Tương quan, các kiểm định phi tham
số
Thống kê suy diễn: Hồi quy tuyến tính và phi tuyến tính, phân tích nhân tố khám
phá EFA, phân tích phân biệt số
2 CÀI ĐẶT SPSS
Chắc hẳn tất cả các bạn ở đây đều dùng máy tính và việc cài đặt một phần mềm ứng dụng nào đó vào máy tính là một việc hết sức bình thường, phần mềm SPSS cũng vậy nên phần này mình không nói nhiều xin tóm tắt vài ý như sau:
Trường hợp cài đặt bằng đãi CD:
Đầu tiên bạn cho đĩa vào ổ đĩa, có đĩa cài auto seting thì tự động hiển thị cửa sổ hỏibạn cài đặt và như vậy bạn làm theo hướng dẫn Nếu không bạn mở my computer vào thư mục ổ đĩa và chạy file setup.exe và làm theo hướng dẫn trên màn hình đến khi kết thúc
Trang 4Trường hợp cài đặt bằng file có sẵn:
Trường hợp này thì bạn vào file lưu và chạy file setup.exe và làm theo hướng dẫn trên màn hình đến khi kết thúc
Ở đây bạn cần lưu ý file lưu phải đầy đủ các file cài đặt, rất nhiều bạn hỏi mình cài SPSS bằng file và bị lỗi cài đặt thì cách xử lý lỗi này như thế nào Thú thật mình cũng không rành máy tính nên những trường hợp như vậy các bạn chịu khó mua đĩa về cài
3 CÁCH NHẬP LIỆU VÀO SPSS
Trước khi thực hiện bất kỳ phân tích thống kê hoặc đồ thị bằng SPSS, chúng ta cầnphải có dữ liệu ở dạng mà SPSS có thể hiểu để xử lí Có một số cách để để đưa dữ liệu vào SPSS như sau:
Mở một tập tin dữ liệu đã được lưu bằng định dạng SPSS
Nhập số liệu bằng tay vào trình soạn thảo dữ liệu của SPSS
Đọc tập tin dữ liệu vào SPSS từ nguồn khác như database, text data file, Excel, SAS hoặc STATA
Mở một tâp tin được lưu bằng định dạng SPSS là đơn giản, giả sử chúng ta cần thống kê độ tuổi của người trả lời trong một nghiên cứu Dữ liệu này được lưu dướidạng SPSS với tên data_tonghop, chúng ta mở tập tin này bằng SPSS như sau:
Mở chương trình SPSS vào FILE/OPEN/DATA tại “Files of Type” chọn “SPSS (*.sav)” và đi đến nơi lưu file data_tonghop và click open
1.1 Nhập số liệu trực tiếp trên SPSS
Trang 5Ví dụ 1: Chúng ta có số liệu về độ tuổi và trình độ học vấn của 10 người tham gia khảo sát như Bảng 1, và muốn nhập vào SPSS
Tiến sĩ
Thạc sĩ
Thạc sĩ
Đại học
Cao đẳng
Đại học
Tiến sĩ
Đại học
Thạc
sĩĐầu tiên chúng ta phải thực hiện việc mã hoá dữ liệu, bao gồm tên biến và các lựa chọn cho biến trước khi thực hiện thao tác trên SPSS Việc mã hoá này không theo quy định tuy nhiên chúng ta mã hoá sao cho khi phân tích dễ nhận biết tên biến cũng như những lựa chọn của biến
Ở Ví dụ 1 này chúng ta mã như sau:
Lưu ý độ tuổi người trả lời là một giá trị cụ thể (biến định lượng) nên chúng ta
không cần mã mà nhập trực tiếp vào SPSS
Để tiến hành nhập số liệu này vào SPSS chúng ta phải thực hiện hai bước khai báo
biến và nhập số liệu, chi tiết như sau:
Trang 6Bước 1: Khai báo biến chúng ta phải khai báo để SPSS xác định tên biến và các
đặc điểm của biến Đây là bước đầu tiên chúng ta phải thực hiện nếu muốn nhập liệu trực tiếp trên SPSS
Chương trình SPSS sau khi được mở có 2 Sheet giống như trong excel có tên
là Data View vàVariable View Bước 1 khai báo biến trong SPSS được thực hiện
ở Sheet Variable View bạn có thể xem ở Hình 1, tất cả các định nghĩa về biến
được đặt trên cùng của cửa sổ, chúng ta phải vào tất cả các cột để khai báo cho biến
Ở cửa sổ Variable View chúng ta chỉ khai báo biến, việc nhập liệu sẽ được thực hiện ở cửa sổ Data View sẽ hướng dẫn ở bước 2
Hinh 1 Giao dien SPSS
Mỗi cột trong cửa sổ Variable View có một mặc định thông dụng, nếu chúng ta
không định nghĩa lại tương ứng với biến thì SPSS sẽ sử dụng lựa chọn mặc định
Trang 7Tuy nhiên khi nhập liệu và phân tích chúng ta sẽ không thực hiện được những gì
mình muốn, vì vậy hãy xem qua tất cả các cột trong cửa sổ Variable View này,
các cột được giới thiệu chi tiết bên dưới
1 Name
Cột đầu tiên của Sheet Variable View là Name ở cột này chúng ta đặt mã cho tên
biến chỉ cần click vào ô và đặt tên, ở ví dụ này chúng ta có 2 biến độ tuổi và trình
độ học vấn, theo bảng mã ở Bảng 2 trên trong SPSS chúng ta có 2 biến TUOI và
HOCVAN Một mô tả dài hơn của biến được thực hiện ở cột Label, chúng ta sẽ
bàn ở bên dưới cột này Ở cột Name chúng ta có thể gõ tên mã dài hơn để dễ hình dung nhất về biến, nhưng không quá dài cố gắng trong khoản 8 ký tự bởi vì tên này
sẽ được sử dụng trong các phân tích cũng như biểu đồ Tên quá dài thì đầu ra phân tích sẽ bị cắt ngắn
Nếu chúng ta đặt tên biến quá dài hoặc sai chính tả, chúng ta có thể mở cửa sổ Variable View để chỉnh sửa lại Một trong những tiện ích của SPSS là chúng ta chỉnh sửa lại những sai lầm một cách nhanh chóng
Dưới đây là một số gợi ý hữu ích khi chúng ta đặt tên biến:
Trong SPSS chúng ta có thể sử dụng các ký tự đặt biệt để đặt tên như @, #,
$, gạch chân (_) và chữ số
Trang 8Nếu muốn sử dụng một ký tự đặt biệt nào đó trong tên của biến hỏi thì hãy chủ động đặt thử trong SPSS
Tên nên bắt đầu bằng một ký tự, hoa hoặc thường
Không thể có khoản trắng trong một tên
Nếu chúng ta cần xuất dữ liệu vào một ứng dụng khác cần phải đảm bảo rằng tên chúng ta đang sử dụng được chấp nhận sử dụng trong ứng dụng đó Đề phòng cho những ký tự đặt biệt
2 Type
Dữ liệu của chúng ta có nhiều kiểu như số, văn bản, tiền tệ, mũ… Nếu chúng ta không xác định chính xác kiểu dữ liệu khi khai báo biến thì sau này khi nhập liệu hoặc phân tích sẽ gặp nhiều rắc rối không đáng có
Đưa chuột vào cột Type, mặc định của SPSS là Numeric, nút có dấu ba chấm xuất
hiện bên phải của nó Click vào nút đó hộp thoại Variable Type như Hình 2 sẽ
xuất hiện
Trang 9Hinh 2 Cua so Variable Type
Chúng ta có thể chọn các kiểu cho biến khi mã trong SPSS như sau:
Numeric: Kiểu số Các giá trị được nhập vào và hiển thị ở dạng chữ số, có
hoặc không có dẫu ngăn cách hàng thập phân Giá trị được định dạng theo tiêu chuẩn khoa học, với E được gắn vào để đại diện cho số mũ Giá trị ở
ô Width là tổng số của tất cả các ký tự trong một số, bao gồm tất cả ký tự
ngăn cách hàng thập phân cũng như chỉ số mũ Số lượng chữ số hàng thập
phân được xác định ở ô Decimal Places, không bao gồm số mũ.
Comma: Kiểu này chỉ rõ những giá trị số với những dấu phẩy (,) được chèn
vào giữa những nhóm ba chữ số để thuận tiện phân biệt chữ số hàng chục, trăm, nghìn…Chúng ta có thể nhập dữ liệu mà không cần chèn dấu phẩy
Trang 10nhưng SPSS sẽ chèn vào khi hiển thị giá trị Ở hàng thập phân, cho dù có hơn ba chữ số nhưng vẫn không có dấu phẩy ngăn cách Ví dụ
1000000,555555 = 1,000,000.555555
Dot: Giống như kiểu Comma, nhưng ở đâu dấu ngăn cách giữa những nhóm
ba chữ số là dấu chấm (.) và dấu phẩy được dùng cho chữ số hàng thập phân
Ví dụ 1000000,555555 = 1.000.000,555555
Scientific Notation: Biến số mà dùng ký tự E để hiển thị chữ số mũ Cơ số
được viết biên trái chữ E, có hoặc không có hàng thập phân Số mũ được viết bên phải chữ E, có hoặc không có hàng thập phân, cho biết mười mũ bao nhiêu sau đó nhân với cơ số Bạn có thể nhập D hoặc E để đánh dấu số
mũ nhưng SPSS luôn luôn sử dụng E Ví dụ số 2,014 được viết như
2.014E3, chẳng hạn số 0.0005 được việt như 5E-4
Date: Một biến có thể bao gồm năm, tháng, ngày, giờ, phút, giây Khi chúng
ta chọn Date các định dạng có sẵn xuất hiện bên trái hộp thoại như Hình 3 Chọn định dạng phù hợp nhất với kiểu dữ liệu nhập vào Lựa chọn của chúng ta sẽ quyết định cách hiển thị dữ liệu trong SPSS Định dạng này cũngxác định phạm vi và hình thức để chúng ta nhập liệu vào Chúng ta có thể nhập liệu sử dụng dấu gạch ngang (-) dấu gạch chéo (/) dấu chấm (.) dấu cách hoặc ký tự khác để phân biệt ngày tháng năm, giờ phút giây Ví dụ, nếuchọn định dạng mà năm chỉ có 2 chữ số, khi nhập vào SPSS sẽ chấp nhận
Trang 11hiển thị năm theo cách đó, tuy nhiên nó sẽ sử dụng bốn chữ số để tính toán Hai chữ số đầu tiên của năm nó sẽ lấy theo cấu hình mà chúng ta phải thiết lập bằng cách vào Edit ➪Options sau đó vào thẻ Data để thực hiện
Hinh 3 Lua chon dinh dang Date
Dollar: Khi chọn Dollar các lựa chọn định dạng có sẵn xuất hiện trong danh
sách bên phải của hộp thoại Giá trị của số liệu luôn được hiển thị với một dấu dollar ($) đằng trước, dấu chấm ngăn cách hàng thập phân và dấu phẩy cho các giá trị lớn ngăn cách nhóm ba chữ số với nhau Chọn định dạng, độ rộng và số chữ số hàng thập phân như Hình 4 Các lựa chọn định dạng là tương tự nhau, quan trọng là chúng ta chọn một trong các định dạng đó tương thích với định nghĩa biến của mình để thuận tiện trong việc in ấn cũng
Trang 12như hiển thị giá trị tiền tiện trong các bảng đầu ra của phần mềm SPSS Nhưvậy khi nhập số liệu chúng ta không cần phải nhập ký tự dollar ($) và dấu chấm, phẩy, SPSS sẽ tự động chèn các ký tự này vào dữ liệu
Custom Currency: Năm định dạng tùy chỉnh cho tiền tệ được đặt tên CCA,
CCB, CCC, CCD, và CCE, như thể hiện trong Hình 5 Chúng ta có thể xem
và tuỳ chỉnh định dạng này bằng cách vào Edit➪Options sau đó chọn thẻ Currency Chúng ta có thể sửa định dạng tuỳ chỉnh bất kỳ khi nào mà không
sợ làm thay đổi số liệu khi nhập vào SPSS Cũng như định dạng Dollar thiết lập width và Decimal Places để thuận tiện việc in ấn cũng như xuất kết quả SPSS
String: Định dạng kiểu ký tự không phải số Bởi vì định dạng này là chuỗi
ký tự nên nó không dùng để tính toán Kiểu định dạng này không giới hạn số
ký tự nhập vào, chúng ta sử dụng định dạng kiểu này cho biến mô tả hoặc định danh của một trường hợp cụ thể
Restricted Numeric (integer with leading zeros): Giống định dạng kiểu
Numeric tuy nhiên số chữ số được hiển thị trên SPSS là bằng nhau, số chữ
số hiển thị được khai báo ở ô width Những số liệu nhập vào mà ít hơn số ký
tự được hiển thị nhập vào thì SPSS mặc định thêm vào chữ số 0 đằng trước đến khi đủ số ký tự như khai báo
3 Width
Trang 13Thiết lập độ rộng trong định nghĩa của biến xác định số lượng ký tự được sử dụng
để hiển thị giá trị Nếu giá trị được hiển thị không đủ lớn để lấp đầy không gian thì SPSS sẽ mặc định thành những khoản trắng Nếu giá trị được hiển thị lớn hơn chúng ta chỉ định SPSS sẽ tự động điều chỉnh hoặc xuất hiện dấu sao (*) để chung
ta điều chỉnh lại cho phù hợp
Một số định dạng kiểu biến cho phép chúng ta xác định độ rộng cho biến Độ rộng của biến mà chúng ta khai báo ở đây cũng giống như khai báo lúc định dạng kiểu biến Nếu chúng ta thay đổi thông số này ở đây thì tự động SPSS sẽ cập nhật giá trị
độ rộng trong hộp thoại định dạng kiểu biến Giá trị này ở hai chỗ là như nhau
Lúc này chúng ta có thể thực hiện một trong ba điều sau:
Bỏ qua lựa chọn này và chấp nhận mặc định sẵn có của SPSS (hoặc số mà
chúng ta đã khai trước đó trong mục Type)
Nhập một giá trị nào đó cho độ rộng của biến
Sử dụng dấu mũi tên hướng lên hoặc xuống để lựa chọn một giá trị cho độ rộng của biến
4 Decimals
Số chữ số thập phân là số chữ số hiển thị ở hàng thập phân trên mành hình Giá trị
chúng ta khai báo ở đây cũng giống như khi chúng ta khai báo ở ô Decimal
Trang 14Places trong lúc khai báo định dạng biếnType Nếu chúng ta điều chỉnh thì giá trị
khai báo ở đây là mặc định cho biến và giá trị khai báo trong Type sẽ tự động thay đổi theo Giá trị này ở hai chỗ giống nhau
Lúc này chúng ta có thể thực hiện một trong ba điều sau:
Bỏ qua lựa chọn này và chấp nhận mặc định sẵn có của SPSS (hoặc số mà
chúng ta đã khai trước đó trong mục Type)
Nhập một giá trị nào đó cho độ rộng của biến
Sử dụng dấu mũi tên hướng lên hoặc xuống để lựa chọn một giá trị cho độ rộng của biến
5 Label
Name và Label cơ bản có cùng chung mục đích dùng để mô tả biến Khác biệt là Name là ngắn còn Label dài hơn, mô tả chi tiết tên biến Trong quá trình xử lý dữ liệu nhiều lúc chúng ta cần hiển thị biến ở một tên ngắn hơn dưới dạng Name hoặc trường hợp cần hiển thị tên biến với mô tả một cách chi tiết biến ở dạng Label
Chúng ta có thể sử dụng bất kỳ ký tự nào cho Label Tất nhiên phải phù hợp với tên biến cũng như mục địch xử lý dữ liệu Ví dụ trong Ví dụ 1 ở trên với biến trình
độ học vấn thì Name có thể là HOCVAN còn Label có thể là học vấn hoặc đơn giản là trình độ học vấn