Bài giảng cung cấp cho người học các kiến thức: Giới thiệu chung về SPSS. Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu.
THỐNG KÊ KINH DOANH VÀ SPSS Trương Minh Chiến Sưu tập và biên soạn Bài 1 GIỚI THIỆU CHUNG VỀ SPSS I II III Giới thiệu chung SPSS Các Màn hình quản lý dữ liệu Khái quát về phân tich dữ liệu 1. Giới thiệu chung về SPSS Là phần mềm chuyên dụng xử lý thông tin sơ cấp (thông tin được thu thập trực tiếp từ đối tượng nghiên cứu (người trả lời bảng câu hỏi) thơng qua một bảng câu hỏi được thiết kế sẵn 1.1 Cài đặc SPSS 19 • Trước tiên, các bạn có thể tải SPSS 19 (cịn gọi là IBM SPSS PASW v19) tại website chính ( http://www.spss.com/downloads/) rồi download crack riêng hoặc download trọn bộ SPSS 19+crack tại http://www.mediafire.com/?1j5bcyb3asc8n hay mua đỉa CD trực tuyến tại http://chodientu.vn/nko/ • Kế đến, các bạn có thể download Python plugin và R integrated plugin tại http://www.spss.com/devcentral/index.cfm?pg=plugins hay http://www.mediafire.com/?1j5bcyb3asc8n 1.1 Cài đặc SPSS 19 (tt) Sau khi download và giãi nén SPSS 19 thì nhấp đúp chuột vào tệp tin Setup.exe để tiến hành cài đặc 1.1 Cài đặc SPSS 19 (tt) 1.1 Cài đặc SPSS 19 (tt) Nhấp chuột và chọn nút [Next >] để tiếp tục Bạn phải chú ý chọn lựa các mục tùy chọn sao cho khéo léo và hợp lý để chuyển tiếp đến bước kế tiếp 1.1 Cài đặc SPSS 19 (tt) Theo tơi nên cài SPSS 19 vào một thư mục độc lập và cịn nhiều chổ trống trên ổ cứng vì sau đó chúng ta cịn có thể cài đặc thêm các plugin 1.1 Cài đặc SPSS 19 (tt) Sau khi cài đặc xong thì phải nhập mã số đăng ký bảng quyền 1.1 Cài đặc SPSS 19 (tt) Mở file “lservrc” bằng Notepad hay Editplus rồi copy trực tiếp mã số đăng ký vào ơ “Enter code” Màn hình quản lý biến (variables view) Kích thướt cột (columns): Cho phép khai báo độ rộng của cột Là nơi quản lý các biến cùng với các thơng số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thơng số liên quan đến biến đó Màn hình quản lý biến (variables view) Ví trí (align): Vị trí hiễn thị các giá trị trong cột (phải, trái, giữa) Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó Màn hình quản lý biến (variables view) Dạng thang đo (measures): Hiễn thị dạng thang đo của giá trị trong biến Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó Màn hình hiện thị kết quả (output) Nhắp đúp biểu tượng kiểu sách để làm ẩn chi tiết Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồ thị và các kết quả kiểm định…., các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (có đi là SPO). Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích Nhắp để mở rộng thu hẹp cấp độ xem Nhắp chi tiết để chọn thẳng đến Panơ phân cấp xem Panơ nội dung Nhắp đúp bảng để xoay hiệu đính Màn hình cú pháp (syntax) Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnh phân tích. Các cú pháp được lưu trữ sẽ được sử dụng lại mà không cần thao tác các lệnh phân tích lại 3. Khái qt về phân tích dữ liệu • • • • • • Kiểm tra dữ liệu Thống kê mơ tả Kiểm định thống kê Kiểm sốt q trình sản xuất Phân tích hồi quy Dãy số thời gian 3.1. Kiểm tra dữ liệu (Data Screening) Xác định những giá trị vượt trội (Outliers) và các giá trị lỗi (Roque values) • Sử dụng cơng cụ bảng phân bổ tần xuất ngồi việc để đếm số lần xuất hiện của từng giá trị riêng biệt, nó cịn giúp ta tìm ra các giá trị lỗi hoặc các giá trị mã hóa sai sót hoặc khơng mong đợi • Khảo sát hai hay nhiều biến cùng một lúc. Đối với các biến dạng định danh (nominal) hoặc thứ bậc (ordinal) sử dụng cơng cụ bảng chéo ta có thế xác định được những sự kết hợp phi lý giữa hai hoặc nhiều biến 3.2 Thống kê mơ tả (Descriptive Statistics) • Mơ tả dữ liệu (đo lường độ tập trung hay phân tán, tỷ lệ %, mối quan hệ giữa các biến, …). • Cần phải nắm được loại biến (loại thang đo của biến) 3.3 Kiểm định các so sánh trung bình mẫu (Tests for Comparing Means) Kiểm định t cho một mẫu, cặp mẫu và hai mẫu ngẫu nhiên độc lập • Sử dụng kiểm định t cho hai mẫu ngẫu nhiên độc lập (Independent Samples T Test) so sánh giá trị trung bình của một biến riêng biệt theo một nhóm có khác biệt hay khơng đối với giá trị trung bình của biến riêng biệt đó theo một nhóm khác. • Cơng cụ kiểm định t cho cặp mẫu (PairedSamples T Test) kiểm định có hay khơng giá trị trung bình của các khác biệt giữa các cặp quan sát là khác giá trị 0 • Cơng cụ kiểm định t một mẫu (OneSample T Test) kiểm định có hay khơng giá trị trung bình của một biến là khác biệt với một giá trị giả định từ trước 3.3 Kiểm định các so sánh trung bình mẫu (Tests for Comparing Means) Phân tích phương sai một chiều (OneWay ANOVA) • Là một dạng mở rộng của phương pháp kiểm định t hai mẫu ngẫu nhiên độc lập được sử dụng để kiểm định cho nhiều hơn hai nhóm. Phương pháp phân tích này khảo sát sự biến thiên giữa các trung bình mẫu trong mối liên hệ với sự phân táng của các quan sát trong từng mỗi nhóm. 3.4 Kiểm định các mối quan hệ (Testing Relationships) • Trong kiểm định mối quan hệ giữa hai biến, ta sử dụng kiểm định Chibình phương để kiểm định giả thuyết ban đầu cho rằng hai biến thể hiện trong bảng chéo (biến cột và biến hàng) là khơng có mối quan hệ với nhau (độc lập với nhau) • Trong kiểm định tương quan giữa các biến ta sử dụng kiểm định F kiểm định giả thuyết ban đầu cho rằng giữa các biến đang khảo sát khơng có tương quan với nhau (hệ số tương quan R = 0) 3.4 Kiểm định các mối quan hệ (Testing Relationships) • Trong kiểm định mối quan hệ giữa hai biến, ta sử dụng kiểm định Chibình phương để kiểm định giả thuyết ban đầu cho rằng hai biến thể hiện trong bảng chéo (biến cột và biến hàng) là khơng có mối quan hệ với nhau (độc lập với nhau) • Trong kiểm định tương quan giữa các biến ta sử dụng kiểm định F kiểm định giả thuyết ban đầu cho rằng giữa các biến đang khảo sát khơng có tương quan với nhau (hệ số tương quan R = 0) 3.5 Kiểm sốt q trình sản xuất bằng thống kê Ghi nhận sự thay đổi của q trình dựa trên cơ sở mối quan hệ giữa các tham số đo xu hướng trung tâm và độ biến thiên của q trình 3.6 Phân tích hồi quy tương quan (Regression) • Phân tích sự phụ thuộc của biến nghiên cứu với 1 hoặc nhiều biến độc lập 3.7 Phân tích dãy số thời gian (Time series) • Phân tích xu hướng (quy luật) biến động của hiện tượng qua thời gian .. .Bài? ?1 GIỚI THIỆU? ?CHUNG? ?VỀ? ?SPSS? ? I II III Giới thiệu chung SPSS Các Màn hình quản lý dữ liệu Khái qt? ?về? ? phân tich dữ liệu 1.? ?Giới? ?thiệu? ?chung? ?về? ?SPSS Là phần mềm chun dụng xử lý thơng tin ... khảo là chính • Bộ tài liệu? ?và? ?bài? ?giảng? ?này được tổng hợp từ giáo trình? ?và? ?bài? ? giảng? ?của các thầy cơ trường ĐH? ?Kinh? ?Tế TP HCM? ?và? ?ĐH Quốc Gia TP HCM. Tơi chỉ bổ sung? ?và? ?điều chỉnh một số ít các ... Kế đến, các bạn có thể download Python plugin? ?và? ?R integrated plugin tại http://www .spss. com/devcentral/index.cfm?pg=plugins hay http://www.mediafire.com/?1j5bcyb3asc8n 1.1 Cài đặc? ?SPSS? ?19 (tt) Sau khi download? ?và? ?giãi nén? ?SPSS? ?19 thì nhấp