Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 22 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
22
Dung lượng
623,9 KB
Nội dung
Chương 9: Sử dụng phần mềm thống kê SPSS CHƯƠNG 9: SỬ DỤNG PHẦN MỀM THỐNG KÊ SPSS Sau học xong chương này, sinh viên có thể: − Hiểu chức phần mềm SPSS; − Sử dụng số tính phần mềm để thống kê hoạt động doanh nghiệp 9.1 Giới thiệu phần mềm SPSS SPSS (Statistical Product and Services Solutions) chất phần mềm thống kê, thông thường dùng nghiên cứu xã hội đặc biệt tâm lý học, tiếp thị xã hội học Ngồi SPSS cịn sử dụng nghiên cứu thị trường SPSS cung cấp hệ thống quản lý liệu khả phân tích thống kê với giao diện thân thiện cho người dùng môi trường đồ hoạ, sử dụng trình đơn mơ tả hộp thoại đơn giản Chức SPSS: - Nhập làm liệu; - Xử lý biến đổi quản lý liệu; - Tóm tắt, tổng hợp liệu trình bày dạng biểu bảng, đồ thị, đồ; - Phân tích liệu, tính tốn tham số thống kê diễn giải kết 9.2 Nội dung chủ yếu SPSS: Nội dung SPSS phong phú đa dạng bao gồm từ việc thiết kế bảng biểu sơ đồ thống kê, tính tốn đặc trưng mẫu thống kê mô tả, đến hệ thống đầy đủ phương pháp thống kê phân tích như: - So sánh mẫu nhiều tiêu chuNn tham số phi tham số (Nonparametric Test), mơ hình phân tích phương sai theo dạng tuyến tính Giáo trình Thống kê Trang 176 Chương 9: Sử dụng phần mềm thống kê SPSS tổng quát (General Linear Models), mô hình hồi quy đơn biến nhiều biến, hồi quy phi tuyến tính (Nonlinear), hồi quy Logistic; - Phân tích theo nhóm (Cluster Analysis); - Phân tích tách biệt (Discriminatory Analysis); - Và nhiều chuyên sâu khác (Advanced Statistics) Một số ứng dụng SPSS: Những nội dung nói trên, SPSS đủ để giúp nhà khoa học thực việc xử lý số liệu nghiên cứu nói chung nghiên cứu mảng chuyên ngành khác mình, chẳng hạn: - Ứng dụng SPSS nghiên cứu tâm lý học: tâm lý tội phạm, tâm lý học sinh-sinh viên…; - Ứng dụng SPSS nghiên cứu xã hội học: ý kiến người dân việc xây dựng lại khu chung cư, thống kê y tế…; - Ứng dụng SPSS nghiên cứu thị trường: nghiên cứu định hướng phát triển sản phNm, mở rộng thị trường; hài lòng khách hàng ; - Ứng dụng SPSS nghiên cứu đa dạng sinh học, phát triển nông lâm nghiệp… Với SPSS, người sử dụng phân tích thực trạng, tìm nhân tố ảnh hưởng, dự đốn xu hướng xảy tiếp theo, giúp bạn đưa định cách xác, giải vấn đề cách nhanh chóng cải thiện kết tốt 9.3 Hướng dẫn sử dụng phần mềm ví dụ minh họa Đây phần mềm chuyên dụng, mà việc sử dụng đòi hỏi chuyên nghiệp Phải mua cài đặt chương trình, khai báo biến Thích hợp cho xử lý biến định tính (1) Khởi động SPSS tương tự chương trình windows, Programs\SPSS for Windows\ SPSS for Windows Giáo trình Thống kê Trang 177 Chương 9: Sử dụng phần mềm thống kê SPSS Sau khởi động thấy hình nhập liệu tương tự Excel có sheet (data view variable view) (2) Trước tiến hành phân tích cần nhập liệu, có cách: − Mở data file có (*.sav) − Đọc từ bảng tính (*.xls), từ CSDL(*.mdb), từ Text file (*.txt) − Nhập trực tiếp Trước nhập cần xác định trường liệu CSDL, vào variable view để khai báo, có sẵn trường (name, type, width, decimals, label, values, missing, columns, align(left, right, center), measure (scaler- số đếm- thang đo định lượng, ordinal- thang đo thứ bậc, nominal-thang đo danh nghĩa, vùng, khu vực)) tùy yêu cầu khai báo cho phù hợp Sau khai báo, nhập tương tự Excel (3) Tutorial: Chứa Help, hướng dẫn đầy đủ bước sử dụng SPSS với liệu demo Để biết nội dung chi tiết tham số tùy chọn, nhấn help (4) Một số phân tích thống kê thông dụng SPSS: Analyze\ Descriptive Statistics\ Frequencies (tần suất): Đây công cụ thường dùng tóm lược thơng tin phạm vi cấp độ biến thời điểm; dùng tóm lược thơng tin chuNn hóa phạm vi biến Dùng Frequencies lựa chọn để tóm tắt phạm vi biến; cung cấp thống kê để tóm tắt cấp độ biến Descriptives: tập trung vào phạm vi biến cung cấp việc lưu giữ giá trị chuNn hóa (z scores) biến Crosstabs: cho phép có thơng tin tóm tắt mối liên hệ biến Means: cung cấp thống kê mô tả bảng ANOVA để nghiên cứu mối liên hệ phạm vi cấp độ biến Giáo trình Thống kê Trang 178 Chương 9: Sử dụng phần mềm thống kê SPSS Summarize: cung cấp thống kê mô tả thơng tin tóm tắt kiện để nghiên cứu mối liên hệ phạm vi cấp độ biến OLAP cubes: cung cấp thống kê mô tả để nghiên cứu mối liên hệ phạm vi cấp độ biến Correlations: cung cấp mô tả tóm tắt mối liên hệ phạm vi biến Khi thực phân tích, liệu chưa mở, SPSS u cầu mở, chọn CSDLcần phân tích Hình 9.1 Phân tích tần xuất: chọn biến cần phân tích chuyển vào Variable Hình 9.2 Giáo trình Thống kê Trang 179 Chương 9: Sử dụng phần mềm thống kê SPSS Statistics Hình 9.3 Hình 9.4 Chọn tham số thống kê tùy yêu cầu, cách đánh dấu vào chọn Gồm nhóm: − Giá trị phân vị (điểm tứ phân vị, điểm cắt chia khoảng, phân vị ); − Độ phân tán (độ lệch chuNn, phương sai, khoảng biến thiên, max, min); − Xu hướng trung tâm (kỳ vọng, trung vị, mod, tổng); − Sự phân bố (độ nghiêng (hệ số bất đối xứng), độ nhọn) Continue Giáo trình Thống kê Chart\ Trang 180 Chương 9: Sử dụng phần mềm thống kê SPSS Chọn đồ thị thể (dạng, giá trị thể hiện) Continue Format\ Định dạng báo cáo (sắp xếp liệu, nhiều biến) Continue, OK Descriptives (thống kê mơ tả) Hình 9.5 Hình 9.6 Chọn biến tham số option tương tự phần Explore (khảo sát, thăm dò): thường dùng ước lượng khoảng tin cậy kỳ vọng, nhận biết liệu ngồi nhóm; kiểm tra giả thuyết; đặc điểm khác biệt nhóm biến cố Chọn biến vào danh sách phù hợp (bảng phụ thuộc, bảng nhân tố, nhãn trường hợp), Giáo trình Thống kê Trang 181 Chương 9: Sử dụng phần mềm thống kê SPSS Hình 9.7 Trong thống kê chọn (khoảng tin cậy (%), ước lượng Mean, giá trị ngoại lệ, phân vị) Hình 9.8 Hình 9.9 Giáo trình Thống kê Trang 182 Chương 9: Sử dụng phần mềm thống kê SPSS Trong biểu đồ chọn (biểu đồ khối, mô tả, biểu đồ kiểm định) Tuỳ chọn báo cáo Crosstabs (bảng tra chéo): kỹ thuật để nghiên cứu mối liên hệ hai cấp độ biến Thường dùng để kiểm tra độc lập đo lường liên hệ chấp thuận liệu Chọn dịng, cột Hình 9.10 Exact: Kiểm định (tiệm cận, mức tin cậy Monte Carlo (99%), thời gian kiểm định) Thống kê gồm nhiều tham số thơng thường dùng - Ratio: tỷ lệ Chọn tử số mẫu số từ biến Thường dùng Analyze\ Compare Means\ -Mean\ chọn biến phụ thuộc độc lập Hình 9.11 Giáo trình Thống kê Trang 183 Chương 9: Sử dụng phần mềm thống kê SPSS Trong option chọn tham số thống kê theo yêu cầu, continue\OK dạng t-Test Hình 9.12 Hình 9.13 Giáo trình Thống kê Trang 184 Chương 9: Sử dụng phần mềm thống kê SPSS Hình 9.14 Hình 9.15 Tùy yêu cầu chọn biến thích hợp chuyển vào test variable, chọn option OK Phân tích phương sai (ANOVA) Hình 9.16 Giáo trình Thống kê Trang 185 Chương 9: Sử dụng phần mềm thống kê SPSS Chọn contrast (đối chiếu), dạng đa thức, hệ số tương quan, continue Post hoc: chọn với giả thiết (hoặc khác) phương sai, continue Hình 9.17 - LSD (Least Significant Difference): dùng kiểm định t để thực tất so sánh cặp trung bình nhóm, tương đương với việc thực tất kiểm định bội t cặp nhóm Khơng có điều chỉnh tỷ lệ sai số so sánh bội - Bonferroni: loại kiểm định LSD cải tiến, có kiểm tra tất tỷ lệ sai số cách cho trước sai số tỷ lệ cho kiểm định Giáo trình Thống kê Trang 186 Chương 9: Sử dụng phần mềm thống kê SPSS - Sidak: kiểm định so sánh nhiều cặp, sử dụng t statistic, giới hạn chặt so với Bonferroni - Scheffe: so sánh cặp lúc cho tất kết hợp theo cặp có trị trung bình Dùng thống kê mẫu F nhạy so sánh trung bình cặp biến - R-E-G-W F (Ryan-Einot-Gabriel-Welsch): thủ tục giảm áp dùng F test - R-E-G-W Q (Ryan-Einot-Gabriel-Welsch) thủ tục giảm áp dùng Studentized range - S-N-K (Student-Newman-Keuls): thực tất so sánh cặp trung bình Nếu cỡ mẫu trung bình nhóm chọn so sánh cặp trung bình nội nhóm loại Trị trung bình xếp giảm dần, sai khác lớn kiểm định trước -Tukey( Tukey's honestly Significant Difference): dùng Studentized range statistic để tiến hành so sánh cặp nhóm Thiết lập tỷ lệ sai số thử nghiệm cho việc tập hợp so sánh cặp - Tukey's b: thủ tục thay Tukey, giá trị tối ưu trung bình giá trị thích hợp cho kiểm định Tukey kiểm định S-N-K - Duncan: tạo so sánh cặp tương tự S-N-K, thiết lập mức bảo vệ cho tỷ lệ sai số kiểm định lựa chọn Dùng Studentized range statistic - Hochberg's GT2: sa sánh bội tương tự - Gabriel: kiểm định so sánh cặp dùng Studentized modulus tổng quát Hochberg's GT2 kích thước mẫu khác - Waller-Duncan: kiểm định so sánh bội dùng t statistic; sử dụng ước lượng Bayes - Dunnett: kiểm định t so sánh nhiều cặp - Tamhane's T2: kiểm định so sánh cặp thận trọng dùng t test - Dunnett's T3: kiểm định so sánh cặp dùng Studentized modulus Giáo trình Thống kê Trang 187 Chương 9: Sử dụng phần mềm thống kê SPSS - Games-Howell: kiểm định so sánh cặp đầy đủ - Dunnett's C: kiểm định so sánh cặp dùng Studentized range Option: chọn tham số thống kê, continue Hình 9.18 Analyze\ nonparametric tests\ Các kiểm định phi tham số ChiSquare Hình 9.19 Giáo trình Thống kê Trang 188 Chương 9: Sử dụng phần mềm thống kê SPSS Hình 9.20 Hình 9.21 Kiểm định pháp tuyến (binominal test) tương tự Chi-Square 9.4 Thiết kế bảng câu hỏi cho SPSS 9.4.1 Số đo thang đo Đánh dấu số hay ký hiệu để mô tả đặc điểm đối tượng nghiên cứu (sự chấp nhận, thái độ, thị hiếu) theo qui luật cụ thể Mơ tả số cho phép phân tích liệu phương pháp thống kê truyền đạt kết cách dễ dàng Có loại thang đo sử dụng nghiên cứu Marketing: thang đo biểu danh, thang đo tỷ lệ, thang đo thứ tự thang đo khoảng Thang đo biểu danh (danh nghĩa) (Nominal scale) Là thang đo sử dụng số đánh dấu (mã số) để phân loại đối tượng Giáo trình Thống kê Trang 189 Chương 9: Sử dụng phần mềm thống kê SPSS sử dụng ký hiệu để phân biệt nhận dạng đối tượng Thang đo biểu danh hay thang đo danh nghĩa khơng có ý nghĩa mặt lượng ký hiệu số Trong nghiên cứu Marketing, thang đo biểu danh dùng để nhận dạng, xếp loại đối tượng vấn (giới tính, nghề nghiệp, tơn giáo,…), tên sản phNm, phNm chất, đối tượng khác Ví dụ: Vui lịng cho biết gia đình anh (chị) sử dụng loại chất đốt nào? (1) Củi (2) Than đá (3) Dầu (4) Gas Thang đo thứ tự (Ordinal scale) Là thang đo thể xếp hạng, thể mối quan hệ so sánh thứ tự loại đối tượng để phạm vi liên hệ đến đặc tính Thang đo khơng có ý nghĩa mặt lượng (khơng cho biết nhiều hay bao nhiêu, cho biết cấp độ chênh lệch) Ví dụ: Vui lịng xếp thứ tự loại chất đốt mà anh (chị) ưa thích? ( ) Củi ( ) Than đá ( ) Dầu ( ) Gas Thang đo khoảng (Interval scale) Là thang đo dùng để xếp hạng đối tượng nghiên cứu khoảng cách thang đo đại diện cho khoảng cách đặc điểm đối tượng Một thang đo khoảng chứa đựng tất thơng tin thang đo thứ tự cho phép so sánh khác biệt đối tượng Ví dụ: khác biệt “3” “4” khác biệt “1” “2”, khác biệt “2” “4” gấp đôi khác biệt “1” “2” Thang đo tỷ lệ (Ratio scale) Giáo trình Thống kê Trang 190 Chương 9: Sử dụng phần mềm thống kê SPSS Là loại thang đo cao nhất, chứa đựng tất nội dung thang đo biểu danh, thang đo thứ tự thang đo khoảng Trong thang đo tỷ lệ, ta nhận dạng phân loại đối tượng, xếp hạng đối tượng so sánh khác biệt Thang đo tỷ lệ không cho biết khác biệt khác biệt giữa 14 17 mà cịn cho biết thêm 14 gấp lấn 9.4.2 Tiến trình thiết kế bảng câu hỏi Thiết kế bảng câu hỏi kỹ địi hỏi thơng qua kinh nghiệm, cịn nghệ thuật Thiết kế bảng câu hỏi trình bao gồm 10 bước: Bước 1: Xác định thông tin cần thiết Bước 2: Xác định hình thức vấn, thu liệu Bước 3: Xác định nội dung câu hỏi cần thiết Bước 4: Thiết kế câu hỏi để khắc phục trường hợp đáp viên khơng sẵn lịng trả lời Bước 5: Quyết định cấu trúc câu hỏi (đóng, mở) Bước 6: Quyết định từ ngữ sử dụng câu hỏi Bước 7: Sắp xếp câu hỏi theo thứ tự hợp lý Bước 8: Xác định hình thức bảng câu hỏi Bước 9: Hoàn chỉnh bảng câu hỏi Bước 10: Điều tra thử bảng câu hỏi 9.4.3 Cách thức mã hố nhập liệu Mã hóa liệu Tiến hành mã hóa liệu giao diện Variable View Bước mã hóa liệu nên hồn thành trước tiến hành nhập liệu Giao diện Variable View thể hiện: - Các hàng biến - Các cột thuộc tính biến Giáo trình Thống kê Trang 191 Chương 9: Sử dụng phần mềm thống kê SPSS Các thuộc tính biến bao gồm: - Tên biến (Name): ngắn gọn cho biết đề cập đến câu hỏi bảng câu hỏi Độ dài tối đa ký tự, không sử dụng dấu cách ký hiệu đặc biệt (như !, ?, *, ‘) Tên biến không trùng lặp - Loại liệu (Type): mặc định dạng số, thay đổi định dạng biến phần Variable Type - Số lượng số chữ (With) tối đa nhập vào, thay đổi hộp Variable Type - Số lượng chữ số thập phân (Decimals), thay đổi hộp Variable Type - Nhãn biến (Lable): mô tả chi tiết cho tên biến, dài đến 256 ký tự, dùng ký hiệu đặc biệt Nhãn trị số biến (Value): dùng để mô tả cho trị số biến (ví dụ mã số đại diện cho nhóm nam đại diện cho nữ) - Trị số khuyết thiếu (Missing): định nghĩa trị số khuyết thiếu người sử dụng để giúp phân biệt trị số khuyết thiếu đáp viên từ chối trả lời hay câu hỏi khơng áp dụng người Các trị số định khuyết thiếu người sử dụng đánh dấu để SPSS nhận phép tính tốn Giáo trình Thống kê Trang 192 Chương 9: Sử dụng phần mềm thống kê SPSS - Canh lề (Align) - Thang đo (Measure) Nhập liệu Sau mã hóa, giao diện Data View xuất form nhập liệu Tiến hành nhập liệu giao diện Data View Nhập bảng câu hỏi Nhập trị số hay chuỗi theo bảng câu hỏi 9.4.4 Một số xử lý biến Mã hóa lại biến Trong trình phân tích liệu người làm nghiên cứu đơi phải mã hoá lại biến để sử dụng cho nhiều mục đích khác nhau, trường hợp đơn cử là: Khi nhà nghiên cứu muốn chuyển biến định lượng (thang đo tỷ lệ) sang biến định tính (thang đo biểu danh hay thứ tự) Ví dụ: Khi thu thập thông tin độ tuổi bệnh nhân, sử dụng thang đo tỷ lệ (dùng xác số tuổi bệnh nhân: 52, 67, hay 81 tuổi…) Đến xử lý số liệu, nhà nghiên cứu lại muốn sử dụng nhóm tuổi để phân tích viết báo cáo: < 30 tuổi 30 – 39 tuổi 40 – 49 tuổi 50 – 59 tuổi ≥ 60 tuổi Giáo trình Thống kê Trang 193 Chương 9: Sử dụng phần mềm thống kê SPSS Quy trình mã hố lại biến sau: Vào menu Transform Recode into Different Variables… Nếu chọn Recode into Same Variables… biến cũ (số tuổi xác) thay biến với biểu (là nhóm tuổi) Thơng thường ta chọn Recode into Different Variables… để tạo biến mà giữ lại biến cũ Xuất hộp thoại sau: Đưa biến cần mã hoá lại từ khung chứa biến sang khung Numeric Variable -> Output Variable Tại khung Output Variable, khai báo tên nhãn cho biến mới, Click chọn Giáo trình Thống kê Trang 194 Chương 9: Sử dụng phần mềm thống kê SPSS Change để thực thay biến Tiếp tục thay đổi giá trị biến cách click chọn Old and New Values…, mở hộp thoại sau: Ta khai báo giá trị cũ bên tay trái (Old Value) thành giá trị bên tay phải (New Value), Click chọn Add sau lần khai báo Với giá trị cũ có dạng sau đây: - Value: giá trị cũ rời rạc - System-missing: giá trị khuyết hệ thống - System or user missing: giá trị khuyết hệ thống người sử dụng định nghĩa - Range: khoảng giá trị (từ … đến … / range: … through: …) - Range, LOWEST through value: khoảng giá trị từ giá trị nhỏ đến giá trị nhập vào - Range, value through HIGHEST: khoảng giá trị từ giá trị nhập vào đến giá trị lớn Chọn Continue trở hộp thoại trước, chọn OK để hoàn tất kệnh Khai báo value cho biến vừa tạo ô Value cửa sổ Variable View hình sau: Giáo trình Thống kê Trang 195 Chương 9: Sử dụng phần mềm thống kê SPSS Tiếp tục thực phép thống kê mô tả hay kiểm định dựa biến vừa tạo nhằm phục vụ cho mục tiêu nghiên cứu 9.4.5 Làm liệu Dữ liệu sau nhập xong có sai sót trình nhập liệu, nên việc làm liệu cần thiết Có nhiều phương thức để làm liệu như: tìm cửa sổ Data View, dùng bảng tần số đơn giản, hay bảng phối hợp hay biến… Trong cách trên, việc lập bảng tần số để phát lỗi trình nhập liệu đơn giản hiệu cao Khi tiến hành lập bảng tần số (bằng lệnh Frequency – xem them phần tính tần số), có bảng kết sau: Gioi tinh Valid Nam Frequency 38 Percent Valid Percent Cumulative Percent 76.0 76.0 76.0 Nu 11 22.0 22.0 98.0 12 2.0 2.0 100.0 50 100.0 100.0 Total Nhìn vào bảng thấy có giá trị “12” xuất bảng giới tính Nam Nữ Lỗi q trình nhập liệu bị sai sót Cách khắc phục tìm chỗ nhập sai để chỉnh sửa lại cho hợp lý Chúng ta dùng thủ tục Find để tìm lỗi Trên cửa sổ Data View, chọn toàn cột tương ứng với biến có giá trị bị lỗi Vào menu Edit Giáo trình Thống kê Trang 196 Chương 9: Sử dụng phần mềm thống kê SPSS Find để mở hộp thoại: Nhập giá trị 12 vào ô Find click chọn Find next vị trí chứa giá trị lỗi 12 xuất hình Truy ngược lại số thứ tự bảng câu hỏi để chỉnh sửa lại cho Tính tốn giá trị biến từ biến có sẵn Có thể sử dụng SPSS để cộng, trừ, nhân chia biến có sẵn để trở thành biến (thủ tục TransformCompute) Tuy nhiên biến tính tốn không tự động thay đổi ta thay đổi biến thành phần cơng cụ tính tốn Excel Vì vậy, thủ tục tính tốn thường tiến hành sau chỉnh lý liệu Thủ tục tính tốn sử dụng nhiều phân tích số liệu Đặc biệt đề tài có sử dụng phân tích nhân tố để gom nhóm CÂU HỎI ÔN TẬP Câu 1: Phần mềm SPSS gì? Cho biết chức ứng dụng phần mềm SPSS Câu 2: Trình bày tóm tắt bước sử dụng phần mềm SPSS Câu 3: Trình bày tóm tắt bước phân tích liệu SPSS Giáo trình Thống kê Trang 197 ... Hình 9. 19 Giáo trình Thống kê Trang 188 Chương 9: Sử dụng phần mềm thống kê SPSS Hình 9. 20 Hình 9. 21 Kiểm định pháp tuyến (binominal test) tương tự Chi-Square 9. 4 Thiết kế bảng câu hỏi cho SPSS 9. 4.1... Chương 9: Sử dụng phần mềm thống kê SPSS Hình 9. 7 Trong thống kê chọn (khoảng tin cậy (%), ước lượng Mean, giá trị ngoại lệ, phân vị) Hình 9. 8 Hình 9. 9 Giáo trình Thống kê Trang 182 Chương 9: Sử... mở, SPSS yêu cầu mở, chọn CSDLcần phân tích Hình 9. 1 Phân tích tần xuất: chọn biến cần phân tích chuyển vào Variable Hình 9. 2 Giáo trình Thống kê Trang 1 79 Chương 9: Sử dụng phần mềm thống kê SPSS