Đề tài khoa học: Nghiên cứu khai thác sử dụng một số phương pháp phân tích số liệu thống kê dựa trên phần mềm SPSS

17 131 0
Đề tài khoa học: Nghiên cứu khai thác sử dụng một số phương pháp phân tích số liệu thống kê dựa trên phần mềm SPSS

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nội dung chính của đề tài trình bày việc nghiên cứu khai thác sử dụng một số phương pháp phân tích số liệu thống kê dựa trên phần mềm SPSS. Mời các bạn tham khảo!

ĐỀ TÀI KHOA HỌC SỐ: 2.2.17-CS06 NGHIÊN CỨU KHAI THÁC SỬ DỤNG MỘT SỐ PHƢƠNG PHÁP PHÂN TÍCH SỐ LIỆU THỐNG KÊ DỰA TRÊN PHẦN MỀM SPSS Cấp đề tài : Cơ sở Thời gian nghiên cứu : 2006 Đơn vị chủ trì : Viện Khoa học Thống kê Đơn vị quản lý : Viện Khoa học Thống kê Chủ nhiệm đề tài : KS Lê Đỗ Mạch Điểm đánh giá nghiệm thu đề tài: 9,05 / Xếp loại: Giỏi 272 I MỘT SỐ VẤN ĐỀ CƠ BẢN VỀ SỬ DỤNG VÀ QUẢN LÝ DỮ LIỆU TRONG SPSS SPSS cho Windows phần mềm phân tích thống kê mạnh hệ thống quản lý liệu môi trƣờng đồ họa, sử dụng menu mô tả hộp đối thoại đơn giản để vận hành hệ thống Ngƣời sử dụng thực công việc quản lý, biến đổi liệu, phân tích liệu vẽ đồ thị đơn giản trỏ kích chuột, khơng phải lập trình Quy trình thực phân tích liệu SPSS gồm bƣớc bản: Bƣớc Đƣa liệu vào SPSS Để phân tích, trƣớc hết cần phải đƣa liệu vào SPSS qua cửa sổ Data Editor Lƣu ý thời điểm, tồn file liệu SPSS (thƣờng gọi file làm việc hay file hoạt động) Bƣớc Chọn thủ tục Chọn thủ tục từ menu để tính tốn thống kê tạo đồ thị Bƣớc Chọn biến để phân tích Các biến file liệu đƣợc hộp đối thoại thủ tục (phần danh sách nguồn) Chúng ta chọn biến cần phân tích từ danh sách Lƣu ý có biến thích hợp với thủ tục phân tích đƣợc danh sách nguồn Bƣớc Thực thủ tục xem kết Khi chọn biến phân tích chọn lựa cần thiết hộp đối thoại, lệnh cho thủ tục thực (bấm OK) Kết thực thủ tục đƣợc đƣa cửa sổ Viewer Từ xem kết phân tích, kiểm tra tính đắn, kết đạt yêu cầu dùng tính soạn thảo Viewer để trình bày kết cho đẹp trƣớc in ghi lại để dùng sau, chuyển sang phần mềm khác để tiếp tục sử dụng Nếu kết chƣa đạt yêu cầu tiến hành hiệu chỉnh liệu thực lại Trong phần nghiên cứu đối tƣợng mà quy trình bƣớc cần phải sử dụng để hồn tất cơng việc phân tích Đó là: Hệ thống cửa sổ SPSS Cửa sổ giao diện giúp ta trao đổi thơng tin ngƣời máy q trình phân tích liệu Bao gồm Cửa sổ soạn thảo liệu Data Editor, cửa sổ xem kết Viewer, cửa sổ xem kết văn Draft Viewer, cửa sổ hiệu chỉnh bảng xoay Pivot Table Editor, cửa sổ hiệu chỉnh đồ thị Chart Editor, cửa sổ hiệu đính văn kết quả, cửa sổ hiệu chỉnh cú pháp Text Output Editor Syntax, cửa sổ hiệu chỉnh trình nhỏ Editor Script Editor 273 Hệ thống Menu Mỗi cửa sổ SPSS có chức riêng, có hệ thống menu riêng thích hợp cho loại cửa sổ Riêng menu Analyze Graph sẵn có tất cửa sổ để dễ dàng thực thủ tục phân tích vẽ đồ thị mà chuyển cửa sổ Hệ thống công cụ Trong cửa sổ có cơng cụ bao gồm số thủ tục thƣờng sử dụng, công cụ giúp ta chọn truy nhập thủ tục nhanh Hộp đối thoại Đa số lựa chọn menu mở hộp đối thoại Ta sử dụng hộp đối thoại để chọn biến tùy chọn cho phân tích Mỗi hộp đối thoại thƣờng có số thành phần nhƣ sau: Danh sách biến nguồn, danh sách biến đích nút điều khiển Cửa sổ soạn thảo liệu Data Editor Đó nơi mà đƣa liệu vào SPSS Ta đọc loại file liệu khác vào SPSS: file liệu SPSS, file liệu Excel, file liệu Dbase, file liệu văn bản, file csdl, đƣa liệu trực tiếp tay Kết nối file liệu Vì thời điểm SPSS có file liệu làm việc (hoạt động), trƣớc lúc phân tích số liệu cần dùng nằm nhiều file khác phải kết nối chúng file để làm việc Cửa sổ kết tính tốn đồ thị (Viewer) Kết thực thủ tục vẽ đồ thị đƣợc đƣa cửa sổ Viewer Ta sử dụng cửa sổ Viewer để: xem hiệu đính kết quả, giấu bảng sơ đồ/đồ thị, thay đổi trình tự xuất kết quả, trao đổi kết SPSS ứng dụng khác II PHÂN TÍCH SỐ LIỆU - THỐNG KÊ MƠ TẢ Các thống kê mơ tả Trong phần trình bày thủ tục tạo lập bảng thống kê mơ tả Đó thống kê thƣờng xuyên đƣợc sử dụng phân tích thống kê Những thống kê mơ tả tóm tắt tập liệu biến về: - Quy mô, độ lớn nhƣ tổng số quan sát (N), tổng số giá trị (Sum), phần trăm (%) giá trị đƣợc tính nhiều góc độ khác - Sự tập trung phân tán liệu: Trung bình (Mean), trung vị (Median), Mod, phƣơng sai (Variance), độ lệch chuẩn (std deviation), sai số chuẩn trung bình (std error of mean), khoảng biến thiên (Range), giá trị nhỏ (Minimum), giá trị lớn (Maximum)… 274 - Về hình dạng phân phối: độ lệch phân phối (Skewness), độ nhọn phân phối (Kurtosis), phân vị (Percentile)… Kiểm tra nhận dạng giá trị ngoại biên hình dạng phân phối Trƣớc tiến hành phân tích nào, bƣớc cần phải kiểm tra liệu Việc kiểm tra đƣợc tiến hành hai phƣơng diện: nhận dạng giá trị ngoại biên giá trị xấu làm sai lệch kết phân tích; dạng phân phối liệu có phù hợp với thủ tục phân tích hay khơng, thí dụ nhƣ phân tích phƣơng sai đòi hỏi tổng thể phải có phân phối chuẩn phƣơng sai Qua kiểm tra ta cân nhắc để loại giá trị xấu biến đổi liệu để phân phối đỡ lệch Các thủ tục thống kê mô tả có chức làm việc Thủ tục lập phân tích tần số đơn biến (Frequencies) Thủ tục Frequencies cho mô tả chi tiết liệu, cung cấp thống kê đồ thị có ích cho việc mơ tả liệu nhiều loại biến Đây nhìn liệu qua đếm tần số giá trị dễ dàng phát số liệu ngoại lai xử lý trƣớc bắt đầu phân tích số liệu Thủ tục lập bảng thống kê biến (Descriptives) Thủ tục tạo lập thống kê mô tả cho biến bảng riêng tính giá trị chuẩn hóa (tỉ số z) Thủ tục khám phá số liệu (Explore) nhóm Thủ tục Explore sản xuất thống kê mô tả đồ thị cho tất quan sát riêng cho nhóm quan sát Mục đích sử dụng thủ tục khám phá liệu để phát ẩn dấu đằng sau số liệu, nhận dạng giá trị ngoại biên, mô tả số liệu, kiểm tra giả thiết phân biệt khác nhóm Thủ tục lập bảng phân tích tần số song biến (Crosstabs) Thủ tục Crosstabs tạo lập bảng tần số hai chiều hay nhiều chiều mô tả chi tiết số liệu, cung cấp nhiều kiểm định khác độ đo quan hệ hai biến Các thống kê độ đo mối quan hệ đƣợc tính cho bảng hai chiều Thí dụ: - Kiểm định tính độc lập hai biến thống kê Pearson - χ2 275 - Đo lƣờng cƣờng độ mối quan hệ hai biến thống kê: hệ số Phi, hệ số C ngẫu nhiên, hệ số V - Đo lƣờng giảm bớt sai lầm dự đoán thống kê Lambda τ - Cảnh báo nguy tƣợng Tỷ số Odd hệ số Cohort 2*2 - Đo lƣờng thống ý kiến hệ số Kppa -… III VẼ BIỂU ĐỒ VÀ ĐỒ THỊ Các kết thống kê quan trọng điều tra thƣờng đƣợc trình bày thơng qua biểu đồ đồ thị hấp dẫn Các biểu đồ đƣợc chuẩn bị kỹ lƣỡng có sức hấp dẫn nhiều so với bảng biểu ngƣời đọc dễ dàng hiểu đƣợc vấn đề Tuy nhiên phải thấy biểu đồ trình bày đƣợc số lƣợng nhỏ kiện, dựa vào nhiều kiện biểu đồ trở nên tính hiệu Mặt khác thấy biểu đồ đƣa cách tƣơng đối độ lớn kiện Các bảng biểu đƣa số chi tiết xác đến dấu phẩy Hơn nữa, đồ thị phƣơng pháp mô tả liệu quan trọng q trình xử lý phân tích số liệu thống kê Trong SPSS có nhiều loại đồ thị khác nhau, chất lƣợng đồ thị cao chất lƣợng xuất cao Một số đồ thị dùng vào việc mô tả kiểm tra phân bố liệu, kiểm tra giá trị ngoại biên phục vụ cho q trình xử lý phân tích nhƣ: đồ thị cành lá, đồ thị hộp, đồ thị histogram, đồ thị phân tán Scatter, ma trận đồ thị phân tán, đồ thị P-P, Q-Q khơng đƣợc trình bày phần Chúng đƣợc giới thiệu thủ tục mơ tả phân tích liệu Trong phần giới thiệu số biểu đồ thông dụng thƣờng dùng để trình bày kết thống kê: Biểu đồ (Bar), biểu đồ bánh xe (Pie), đồ thị dây (Line) IV PHÂN TÍCH SỐ LIỆU - LẬP BẢNG TỔNG HỢP Lập bảng tổng hợp số liệu lập báo cáo thống kê việc làm thƣờng xuyên cán nghiệp vụ thống kê Khả lập bảng số liệu tổng hợp, báo cáo thống kê SPSS đa dạng linh hoạt với nhiều chiều phân tổ khác dễ dàng thực khơng phải lập trình Các bảng 276 tổng hợp, báo cáo thống kê đƣợc trình bày đẹp có chất lƣợng xuất cao, tiếp tục đƣợc hiệu chỉnh, in chuyển sang tài liệu khác Đây ƣu điểm bật SPSS, biết để lập trình tạo biểu bảng nhƣ ý cơng việc tỉ mẩn nặng nhọc Có thể nói kỹ thuật lập bảng tổng hợp số liệu SPSS đáp ứng đƣợc hầu nhƣ tất yêu cầu lập bảng tổng hợp số liệu thƣờng gặp thực tế, có nội dung kết cấu khác Tính linh hoạt lập bảng biểu cao, thêm bớt nội dung tổng hợp theo chiều biểu, chuyển đổi chiều dòng thành chiều cột ngƣợc lại, tạo tổng nhóm tổng tồn bố cục bảng cho sáng sủa đẹp Tại chiều bảng xếp khơng tiêu thức mà vài tiêu thức nối tiếp phân tổ vừa nối tiếp vừa phân tổ Lúc mặt tin học, ngƣời ta gọi tiêu thức đứng độc lập so với tiêu thức trƣớc (các biến) xếp chồng (stacked) Còn tiêu thức dùng làm phân tổ cho tiêu thức đứng trƣớc đƣợc gọi tiêu thức xếp lồng (nested) Do có kỹ thuật mà ta mở rộng thêm chiều biểu, chiều cột và/hoặc chiều dòng, giúp ta tổng hợp bảng biểu có cấu trúc phức tạp nội dung thơng tin phong phú, đa dạng Trong SPSS bảng thƣờng có chiều, chiều dòng, chiều cột lớp Trong phần giới thiệu số kỹ thuật lập bảng thƣờng dùng để phân tích liệu thống kê, chúng đáp ứng hầu nhƣ nhu cầu lập bảng tổng hợp số liệu lập báo cáo thống kê ngƣời sử dụng Mỗi kỹ thuật có kèm theo thí dụ minh họa để nắm bắt phƣơng pháp dễ áp dụng - Bảng tổng hợp - Bảng tổng hợp tổng quát - Báo cáo tổng kết - Báo cáo thống kê theo hàng - Báo cáo thống kê theo cột V MỘT SỐ KIỂM ĐỊNH THƢỜNG DÙNG TRONG PHÂN TÍCH THỐNG KÊ Trong phân tích thống kê mối quan hệ tƣợng kinh tế xã hội, ngƣời ta thƣờng sử dụng kỹ thuật kiểm định số liệu để đƣa định Một số kiểm định giá trị trung bình hay đƣợc sử dụng đƣợc giới thiệu 277 Phƣơng pháp chung để kiểm định số liệu thống kê bao gồm bƣớc sau: - Lập giả thuyết H0 vào yêu cầu thực tế lập giả thuyết đối H1; - Chọn mức ý nghĩa α; - Lấy mẫu số liệu kích thƣớc N từ tổng thể nghiên cứu; - Chọn tiêu chuẩn kiểm định G xác định quy luật phân bố xác suất với điều kiện giả thuyết H0 đúng; - Xác định giá trị lý thuyết thống kê G: Gcrit; - Căn vào mẫu số liệu thu thập, tính tốn giá trị quan sát tiêu chuẩn kiểm định G: Gqs; - So sánh giá trị Gqs với Gcrit để rút kết luận Kiểm định số trung bình tổng thể Ngƣời ta dùng phƣơng pháp kiểm định số trung bình tổng thể nhằm so sánh giá trị trung bình tổng thể với giá trị cụ thể Tổng thể đƣợc giả thiết có phân phối chuẩn N ( , ) Thí dụ: Ta cho làm luận án tiến sỹ thƣờng năm Dựa số liệu điều tra tiến sỹ năm 2000, kiểm định xem có phải nhƣ không Kết kiểm định (T = - 5.681, P-value =.000), ta bác bỏ giả thuyết không cho thời gian làm luận án tiến sỹ năm Đây kiểm định trái cho biết thời gian làm luận án thực năm Kiểm định khác hai số trung bình: Trƣờng hợp hai mẫu độc lập Mục đích kiểm định khác hai số trung bình nhằm so sánh giá trị trung bình tổng thể Giả sử hai tổng thể có phân phối chuẩn N ( , 12 ) N ( , 22 ) Thí dụ: Điều kiện để làm luận án tiến sỹ nƣớc thƣờng khó khăn nhiều mặt so với nƣớc ngồi Vì thời gian để làm luận án khác Dùng số liệu điều tra tiến sỹ năm 2000 kiểm định Kết (T = 3.915, P-value =.000), ta bác bỏ giả thuyết không cho thời gian làm luận án tiến sỹ nƣớc nƣớc Đây kiểm định phải cho biết thời gian làm nƣớc lâu nƣớc 278 Kiểm định khác hai số trung bình: Trƣờng hợp hai mẫu cặp Ta phải so sánh hai số trung bình, nhƣng trƣờng hợp hai mẫu rút từ hai tổng thể lại phụ thuộc cặp giá trị có kích thƣớc N Hai tổng thể có phân phối chuẩn N ( , 12 ) N ( , 22 ) Thí dụ: Nhiều tiến sỹ cho họ bận với công tác quản lý, thời gian dành cho nghiên cứu không đƣợc nhiều Vậy thời gian sử dụng cho nghiên cứu có thực cho quản lý hay không? Thống kê T từ kiểm định (T = 8.420, P-value =.000) bác bỏ giả thuyết không hai thời gian Đây kiểm định phải thời gian quản lý thực nhiều thời gian nghiên cứu VI PHÂN TÍCH PHƢƠNG SAI Phân tích phƣơng sai phƣơng pháp nghiên cứu biến động tổng thể Sự biến động tổng thể (total) bao gồm biến động nhóm (between) nhóm (within) Trung bình tổng thể trung bình nhóm thống kê dùng để nghiên cứu biến động tổng thể Tác động nhân tố thể so sánh biến động nhóm nhân tố gây với biến động nhóm Mục đích so sánh để thấy đƣợc biến động tổng thể chủ yếu khác biệt nhóm gây (đây phân loại tốt), xảy nhóm (đó sai số ngẫu nhiên) Với giả thiết không cho trung bình nhóm nhau, biến động thực tế nhóm vƣợt trội biến động nhóm nghi ngờ giả thiết khơng dẫn đến bác bỏ giả thiết Tỷ số F thống kê giúp ta làm việc Phân tích phƣơng sai nhân tố 1.1 Mơ hình phân tích Ở Phần V, ta so sánh khác hai số trung bình Trong phần thực so sánh nhiều số trung bình Giả sử tổng thể nghiên cứu X đƣợc phân thành p tổng thể khác (Xi, i 1, p ) biến phân loại F, tổng thể có phân phối chuẩn có phƣơng sai N(μ i, σ2), i 1, p , P ngẫu nhiên độc lập đƣợc lấy từ p tổng thể này, kích thƣớc mẫu Ni, i 1, p Để kiểm định giải thuyết không giá trị trung bình tổng thể (các giá trị trung bình nhau), tiêu chuẩn kiểm định là: 279 F = Biến động nhóm Biến động nhóm Phần tử số tiêu chuẩn kiểm định đo lƣờng mức độ ảnh hƣởng nhân tố F tổng thể Phần mẫu số đo lƣờng sai số gây yếu tố chƣa kiểm soát đƣợc tổng thể Với mức ý nghĩa α, ta bác bỏ giả thuyết H0 F > Fα(p - 1, N – p) (giá trị F lý thuyết) 1.2 Thí dụ: Ta muốn biết thời gian trung bình để làm luận án tốt nghiệp tiến sỹ (biến tg_hoc) thời kỳ khác (biến thoi_ky) nƣớc ta có khác khau hay khơng Sử dụng số liệu năm 2000 ta có kết (F = 4.008, P-value =.003) bác bỏ giả thuyết không cho thời gian làm luận án thời kỳ khác Vậy thời kỳ khác số trung bình có tạo thành dãy tuyến tính khơng Hai vấn đề đƣợc đề tài Phân tích phƣơng sai hai nhân tố 2.1 Mơ hình phân tích Giả sử ta có biến X (tổng thể) phân phối chuẩn hai nhân tố F G (các biến độc lập) tác động lên tổng thể X (biến phụ thuộc) F G biến phân loại, F có p mức, G có q mức Mọi kết hợp hai biến F G phân tổng thể X thành pq nhóm hay pq tổng thể, tổng thể có phân phối chuẩn phƣơng sai Pq mẫu độc lập đƣợc lấy từ tổng thể này, mẫu đƣợc lấy từ tổng thể Kích thƣớc mẫu đƣợc qui định m (mẫu cân bằng) Ba giả thuyết cần kiểm định mơ hình phân tích phương sai hai nhân tố: - Khơng có ảnh hƣởng nhân tố F; - Khơng có ảnh hƣởng nhân tố G; - Khơng có ảnh hƣởng tƣơng tác hai nhân tố F G Ba thống kê kiểm định giả thuyết: Biến động dòng (nhân tố F) Frow = Fcolumn = 280 Biến động nhóm Biến động cột (nhân tố G) Biến động nhóm Finteration = Tƣơng tác Biến động nhóm So sánh thống kê F tính đƣợc mẫu (F quan sát) với F lý thuyết, F quan sát > F lý thuyết, ta bác bỏ giả thuyết tƣơng ứng, trƣờng hợp ngƣợc lại chấp nhận giả thuyết khơng Thí dụ: Chủ hộ vùng địa lý có ảnh hƣởng đến chi tiêu trung bình đầu ngƣời hộ gia đình hay khơng Nguồn số liệu để phân tích lấy từ điều tra mức sống năm 1998 Các biến mơ hình gồm: biến phụ thuộc, rlpcex1 chi tiêu trung bình đầu ngƣời hộ, nhân tố: reg7 vùng địa lý, hhcat 10 chủ hộ Mơ hình có ý nghĩa thống kê (F = 21.766, P-value =.000) giải thích đƣợc 20% (R2 =.202) biến động chi tiêu bình quân đầu ngƣời nƣớc Các tác động reg7 hhcat tƣơng tác reg7*hhcat có ý nghĩa thống kê giúp ta kết luận: chủ hộ vùng địa lý tƣơng tác hai nhân tố có ảnh hƣởng đến chi tiêu bình quân đầu ngƣời hộ Thủ tục phân tích phƣơng sai SPSS đa dạng khơng cho mẫu cân mà cho mẫu không cân bằng, khơng có hai nhân tố tác động mà cho phép nhiều nhân tố tác động, khơng nhân tố tác động biến phân loại mà có biến liên tục tƣơng tác với biến phân loại Một số thí dụ đề tài minh họa cho vấn đề VII PHÂN TÍCH TƢƠNG QUAN VÀ HỒI QUY A Phân tích tƣơng quan Hệ số tương quan Pearson Hệ số tƣơng quan Pearson ký hiệu r đo lƣờng cƣờng độ mối quan hệ tuyến tính hai biến định lƣợng Hệ số tƣơng quan khơng có tính nhân Giá trị hệ số tƣơng quan nằm khoảng - ≤ r ≤ + Nếu: - r > 0: hai biến cố có mối quan hệ tƣơng quan chiều; - r < 0: hai biến cố có mối quan hệ tƣơng quan ngƣợc chiều; - r = 0: hai biến khơng có mối quan hệ nào, r gần mối quan hệ hai biến yếu; - r = ±1: hai biến cố có mối quan hệ hàm số Nói chung r gần -1 mối quan hệ hai biến mạnh 281 Thí dụ: Tính ma trận hệ số tƣơng quan Pearson biến tuổi thọ chủ hộ age, số năm học chủ hộ educyr98, chi tiêu bình quân đầu ngƣời hộ rlpcex1, số ngƣời hộ hhsize Mối tƣơng quan rlpcex1 với age educyr98, hhsize educyr98 chiều Trong mối quan hệ rlpcex1 educyr98 mạnh (.293) cho biết số năm giáo dục chủ hộ tăng lên chi tiêu bình quân hộ gia đình tăng theo Mối tƣơng quan rlpcex1 hhsize, hhsize age, age educyr98 ngƣợc chiều Trong mối quan hệ educyr98 age mạnh (-.352) cho biết chủ hộ trẻ có học vấn cao ngƣợc lại chủ hộ tuổi cao có học vấn thấp Hệ số tương quan Spearman Hệ số tƣơng quan Spearman ký hiệu rho đo lƣờng cƣờng độ mối quan hệ tuyến tính hai biến sở hạng giá trị chúng Hai biến biến định lƣợng biến thứ tự tƣơng ứng Hạng theo giá trị tăng dần x Ví dụ: Tính hệ số tƣơng quan Spearman chi tiêu phi lƣơng thực thực phẩm bình quân đầu ngƣời hộ nonfood trình độ học vấn chủ hộ compled98 Thủ tục tính tƣơng tự nhƣ trên, nhƣng thay đánh dấu vào ô Pearson ta đánh dấu vào ô Spearman Mối tƣơng quan hai biến dƣơng có nghĩa là: trình độ học vấn chủ hộ tăng lên chi tiêu phi lƣơng thực thực phẩm bình quân đầu ngƣời hộ tăng lên Hệ số tương quan cục Hệ số tƣơng quan cục (hệ số tƣơng quan riêng) đo lƣờng mối quan hệ tuyến tính hai biến kiểm sốt ảnh hƣởng hay nhiều biến khác (loại bỏ ảnh hƣởng biến này) Phƣơng pháp tính tốn hệ số tƣơng quan cục nhƣ sau: Giả sử cần tính hệ số tƣơng quan cục y x, z biến kiểm soát - Loại bỏ ảnh hƣởng z y cách: hồi quy biến y theo biến z, tính phần dƣ - Loại bỏ ảnh hƣởng biến z x cách: hồi quy biến z theo biến z tính phần dƣ 282 - Tính hệ số tƣơng quan hai dãy số dƣ, ta đƣợc hệ số tƣơng quan cục y x ảnh hƣởng z hai biến bị loại bỏ Ví dụ: Khi tính hệ số tƣơng quan Pearson trên, ta thấy mối tƣơng quan chiều chi tiêu bình quân đầu ngƣời hộ số năm giáo dục chủ hộ bị chi phối tuổi chủ hộ cỡ hộ Vì ta muốn tính tƣơng quan cục chi tiêu bình quân đầu ngƣời hộ số năm giáo dục chủ hộ loại trừ ảnh hƣởng (kiểm soát) hai yếu tố tuổi chủ hộ cỡ hộ Ta thấy kiểm soát hai yếu tố age hhsize, hệ số tƣơng quan chi tiêu bình quân đầu ngƣời hộ số năm giáo dục chủ hộ tăng từ.293 lên.335 B Phân tích hồi quy tuyến tính Mơ hình hồi quy tuyến tính Hồi quy tuyến tính kỹ thuật nghiên cứu kinh tế lƣợng Mơ hình hồi quy tuyến tính (đơn bội) phƣơng trình tốn học mơ tả mối quan hệ tuyến tính biến phụ thuộc với biến độc lập tổng thể nghiên cứu Y = β0 + β1x1 + β2x2 + … + βkxk + u Trong đó: y biến phụ thuộc, biến đƣợc giải thích; x1, x2, …, xk: biến độc lập (các biến giải thích, biến dự báo, biến hồi quy); k số biến thiên; β0, β1, β2, …, βk: tham số chƣa biết cần phải ƣớc lƣợng; u: sai số ngẫu nhiên Có thể giải thích hệ số nhƣ ƣớc lƣợng ảnh hƣởng riêng biến giải thích biến phụ thuộc yˆ xk ˆ Ƣớc lƣợng ˆ cho biết yˆ thay đổi ˆ k k k đơn vị xk thay đổi đơn vị, biến giải thích khác khơng thay đổi Quy trình phân tích hồi quy tuyến tính Trong phân tích hồi quy thƣờng trải qua số bƣớc sau đây: 2.1 Nêu giả thiết mối quan hệ yếu tố kinh tế 283 2.2 Thiết lập mơ hình tốn (phƣơng trình) mơ tả mối quan hệ tuyến tính 2.3 Thu thập số liệu (hay dựa nguồn số liệu có nhƣ số liệu điều tra, sổ sách hành …) để ƣớc lƣợng hệ số mơ hình 2.4 Tiến hành ƣớc lƣợng hệ số mơ hình dựa mẫu số liệu thu thập Kết ƣớc lƣợng đánh giá thực nghiệm cho giả thiết mối quan hệ yếu tố kinh tế mẫu 2.5 Phân tích đánh giá kết nhận đƣợc Xét xem kết ƣớc lƣợng có phù hợp với giả thuyết mối quan hệ nêu không Đồng thời kiểm định giả thiết thống kê mơ hình hồi quy tuyến tính để phƣơng pháp ƣớc lƣợng bình phƣơng nhỏ đạt hiệu 2.6 Dự báo: Nếu nhƣ mơ hình phù hợp với lý thuyết mối quan hệ mơ tả sử dụng mơ hình để dự báo 2.7 Dựa mơ hình ƣớc lƣợng đƣa kiến nghị sách Thực hành phân tích hồi quy tuyến tính SPSS Diện tích đất bình qn đầu ngƣời phụ thuộc vào nhiều yếu tố, chẳng hạn nhƣ tổng diện tích, mật độ dân số, đất nông nghiệp, mức sống (chi tiêu), đặc điểm kinh tế xã hội khác… tỉnh Chúng ta phát triển mơ hình hồi quy bội để nghiên cứu vấn đề dựa số liệu số tình hình kinh tế xã hội chủ yếu tỉnh, thành nƣớc năm 2000 * Với phƣơng pháp Backward, SPSS đƣa loạt mơ hình, bƣớc loại biến khơng có ý nghĩa thống kê cuối cùng, ta đƣợc mơ hình có ý nghĩa thống kê giải thích đƣợc 59,2% biến động (biến thiên) biến phụ thuộc “diện tích đất bình qn đầu ngƣời tỉnh” Dtdatobq = 47.311 +.002dtdato +.284ptdatnn + -.009matdods + -.102chitieub + 2.224ptcnkt + 14.287vung2 + 35.849vung5 14.724vung6 DTDATOBQ DTDATO PTDATNN MATDODS CHITIEUB PTCNKT VUNG2 VUNG5 Diện tích đất bình qn người (m2/người) Diện tích đất (ha) Phần trăm đất nông nghiệp (%) Mật độ dân số (người/km2) Chi tiêu bình qn đầu người (1000đ) Phần trăm cơng nhân kỹ thuật (%) Vùng (1 : vùng 2, : vùng khác) Vùng (1 : vùng 5, : vùng khác) VUNG6 Vùng (1 284 : vùng 6, : vùng khác) + Mơ hình trải qua kiểm tra giả thiết tuyến tính, đa cộng tuyến, tính chuẩn sai số, phƣơng sai sai số, phát quan sát gây phần dƣ lớn quan sát đối trọng C Phân tích hồi quy Logistic Hồi quy logistic sử dụng thích hợp cho tình muốn dự đốn xuất hay khơng xuất đặc trƣng kết dựa giá trị số biến dự đoán Nó tƣơng tự nhƣ hồi quy tuyến tính, nhƣng thích hợp cho mơ hình mà biến phụ biến phân nhóm (biến nhị phân), có hai giá trị phân biệt Các hệ số hồi quy logistic đƣợc dùng để ƣớc lƣợng tỉ số chênh lệch odd cho biến độc lập mơ hình Xác suất để xuất kiện y = hàm logistic có dạng: P(yi =1| xs, bs) = f(x1, x2, …, xk) = Exp(b0 + b1x1i + b2x2i + … + bkxki) + exp(b0 + b1x1i + b2x2i + … + bkxki) Trong đó, y biến phụ thuộc có hai giá trị 1: xuất kiện nghiên cứu, 0: không xuất kiện; x1, x2, …, xk biến dự đoán, i quan sát i 1, N ; b1, b2, …, bk hệ số mà ta cần phải ƣớc lƣợng phƣơng trình hồi quy Chúng ta xuất phát từ hàm tích lũy xác suất logistic để xây dựng mơ hình hồi quy logistic Đặt logit(P) = log(odds) = b0 + b1x1i + b2x2i + … + bkxki Giải thích tỷ số chênh lệch odds Tỷ số chênh lệch odds hồi quy logistic đƣợc giải thích nhƣ tác động thay đổi đơn vị biến x nên tỷ số chênh lệch đƣợc dự đoán với điều kiện biến khác khơng thay đổi Đây cách giải thích thơng dụng (đặc biệt thích hợp với biến dummy) Thí dụ: Mục đích thí dụ ƣớc lƣợng mơ hình logistic để định yếu tố lý giải hộ lại nghèo lƣợng hóa mức ảnh hƣởng yếu tố đến kiện nghèo Số liệu đƣợc dùng thí dụ điều tra mức sống hộ gia đình năm 1997-1998 Chia số hộ thành nhóm theo chi tiêu bình quân đầu ngƣời Tạo biến poor chứa hai kiện: nghèo poor=1 (nhóm có chi tiêu thấp nhất) khơng nghèo poor=0 (các nhóm khác) sau tiến hành hồi quy logistic theo số biến độc lập 285 Ta kỳ vọng khả nghèo (poor=1) hộ giảm kinh nghiệm chủ hộ tăng lên (tuổi age), trình độ học vấn chủ hộ cao (số năm học educyr98), hộ sống khu vực thành thị nguy hộ nghèo hộ sống nghề nơng nghiệp, hộ có nhiều nhân Ngoài yếu tố vùng địa lý có tác động định đến kiện nghèo Kết hồi quy Logistic: Thống kê kiểm định mơ hình (chi-square = 1424.303, P-value =.000) cho biết mơ hình có ý nghĩa thống kê Hệ số xác định R2 giả =.334 Các hệ số ƣớc lƣợng nhƣ mà ta dự đốn Mơ hình lý giải rằng, hộ nghèo hộ có đông ngƣời, chủ yếu làm nghề nông nghiệp, chủ hộ có kinh nghiệm, học vấn thấp, hộ sống khu vực nông thôn, vùng cách biệt địa lý nhƣ vùng núi phía Bắc vùng khí hậu khắc nghiệt hay bị bão lụt nhƣ Bắc Trung Bộ Duyên hải miền Trung Kết hồi quy logistic (từ SPSS) B Step 1(a) S.E Wald Df Sig Exp(B) -.038 -.196 003 012 144.706 269.542 1 000 000 963 822 356 314 098 020 13.302 247.363 1 000 000 1.428 1.368 -1.355 1.349 149 125 82.487 116.359 1 000 000 258 3.854 VUNG2 635 133 22.898 000 1.886 VUNG3 VUNG4 1.123 411 133 132 71.635 9.634 1 000 002 3.073 1.508 VUNG5 VUNG6 368 -1.457 150 192 6.042 57.427 1 014 000 1.445 233 Constant -.440 227 3.763 052 644 AGE EDUCYR98 FARM HHSIZE URBAN98 VUNG1 a Variable(s) entered on step 1: AGE, EDUCYR98, FARM, HHSIZE, URBAN98, VUNG1, VUNG2, VUNG3, VUNG4, VUNG5, VUNG6 Biến sex bị loại khỏi mô hình khơng có ý nghĩa thống kê Vùng bị loại khỏi mơ hình để làm vùng tham khảo Đồng sông Cửu long, vùng khác so sánh với KẾT LUẬN Báo cáo tổng hợp trình bày vấn đề đề tài nghiên cứu bao gồm công cụ thông dụng phân tích số liệu thống kê dựa phần mềm SPSS Phần thứ thiếu đƣợc giới thiệu chung phƣơng pháp sử dụng quản lý liệu SPSS, nơi mà chúng 286 ta triển khai phƣơng pháp phân tích số liệu thống kê Phần giúp ngƣời dùng sử dụng SPSS chuẩn bị sở liệu phục vụ trình phân tích, biên tập kết nhận đƣợc từ thủ tục Từ Phần trở phƣơng pháp phân tích số liệu thống kê (cả mơ tả quan hệ) bao gồm: phân tích mơ tả, vẽ biểu đồ đồ thị, lập bảng tổng hợp báo cáo thống kê, kiểm định giả thuyết thống kê, phân tích phƣơng sai, cuối phân tích tƣơng quan hồi quy bao gồm hồi quy Logistic Việc triển khai nghiên cứu phƣơng pháp theo lộ trình thống tóm tắt sở lý luận, làm rõ ý nghĩa ứng dụng, thiết kế thí dụ phù hợp, mơ tả thủ tục thực SPSS, đến phân tích đánh giá kết nhận đƣợc đƣa kết luận Đặc biệt liệu thí dụ số liệu thống kê thực đơn vị Tổng cục thu thập xuất bản, điều thể tính ứng dụng đề tài tạo điều kiện cho ngƣời sử dụng dễ dàng áp dụng vào phân tích Hơn nữa, tính ứng dụng thể chỗ SPSS chƣơng trình dễ tiếp cận cán nghiệp vụ thống kê quản lý kinh tế dễ sử dụng SPSS có hệ thống giao diện thân thiện ngƣời máy cho phép sử dụng menu thả xuống để thực công việc phân tích liệu nhƣ chuẩn bị liệu, biến đổi liệu, phân tích số liệu, vẽ đồ thị, hiệu đính biên tập kết đơn giản trỏ kích chuột, khơng phải lập trình Chúng tơi hy vọng báo cáo kết đề tài có tác dụng nhƣ tài liệu hƣớng dẫn thực hành phân tích liệu phần mềm SPSS Ngƣời dùng dựa vào để tiến hành phân tích riêng Đây đích hƣớng tới đề tài TÀI LIỆU THAM KHẢO Statistics Fiffith Edition Robert S Witt - John S Witte 1997 Applied Statistics for business and economics Alen Webster Boston 1992 Econometries: Theory and Applications Ghosh, Sukesh K Printice Hall, Englewood cliff, 1991 Lý thuyết xác xuất thống kê toán Đại học Kinh tế quốc dân Nhà xuất Khoa học kỹ thuật 1999 Kinh tế lƣợng Đại học Kinh tế quốc dân Nhà xuất Khoa học kỹ thuật 1996 Mức sống thời kỳ kinh tế bùng nổ Nhà xuất Thống kê 2001 Hộ gia đình Việt Nam nhìn qua phân tích định lƣợng Nhà xuất Chính trị quốc gia, 1999 287 Tập giảng giáo sƣ Jonathan Haughton Dominique Haughton phân tích điều tra mức sống năm 1997-19997 Hà Nội 1999 Tập giảng kinh tế lƣợng giáo sƣ M Daniel Webstbrook Hà Nội, năm 2004 10 SPSS Applications Guide SPSS Inc 11 Một số tài liệu hƣớng dẫn lập trình SPSS hƣớng dẫn sử dụng SPSS 12 Nghiên cứu ứng dụng phần mềm Stata xử lý phân tích số liệu thống kê Đề tài cấp sở, năm 2004 Lê Đỗ Mạch 13 Nghiên cứu xây dựng quy trình phƣơng pháp thực hành hồi quy tuyến tính dựa phần mềm Stata Đề tài cấp sở, năm 2005 Lê Đỗ Mạch 14 Số liệu điều tra mức sống năm 1997-1998 15 Số liệu điều tra tiến sỹ năm 2000 16 Số liệu kinh tế xã hội tỉnh, thành phố năm 1999-2000 trang Web Tổng cục Thống kê 288 ... phân tích số liệu thống kê dựa phần mềm SPSS Phần thứ thiếu đƣợc giới thiệu chung phƣơng pháp sử dụng quản lý liệu SPSS, nơi mà chúng 286 ta triển khai phƣơng pháp phân tích số liệu thống kê Phần. .. 2004 10 SPSS Applications Guide SPSS Inc 11 Một số tài liệu hƣớng dẫn lập trình SPSS hƣớng dẫn sử dụng SPSS 12 Nghiên cứu ứng dụng phần mềm Stata xử lý phân tích số liệu thống kê Đề tài cấp sở,... vọng báo cáo kết đề tài có tác dụng nhƣ tài liệu hƣớng dẫn thực hành phân tích liệu phần mềm SPSS Ngƣời dùng dựa vào để tiến hành phân tích riêng Đây đích hƣớng tới đề tài TÀI LIỆU THAM KHẢO Statistics

Ngày đăng: 02/02/2020, 21:55

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan