Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 57 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
57
Dung lượng
2,2 MB
Nội dung
CHƯƠNG XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU NGUYỄN THỊ MINH THU NỘI DUNG 4.1 Xử lý liệu 4.2 Một số phương pháp phân tích liệu 4.3 Trình bày kết xử lý phân tích 4.1 Xử lý liệu 4.1.1 Hiệu chỉnh mã hóa liệu 4.1.2 Đánh giá chất lượng liệu 4.1.3 Xác định mối liên hệ 3 4.1.1 Hiệu chỉnh mã hóa liệu a) Khái niệm lợi ích hiệu chỉnh mã hóa liệu • Hiệu chỉnh kiểm tra liệu thông tin theo u cầu • Mã hóa thay đổi số liệu ‘nguyên thủy’ dạng ngắn gọn để lưu máy tính xử lý dễ dàng mã số ký hiệu thích hợp (Xây dựng mã hóa) • Các lợi ích mã hóa liệu - Giảm cơng suất, khơng gian lưu trữ - Nếu mã hóa số lượng vừa phải giúp nâng cao giá trị số liệu - Giúp cho phương pháp phân tích định lượng b) Kỹ thuật mã hóa liệu Lựa chọn mã hóa, thang đo gắn cho liệu • Các loại thang đo: • • • • Định danh/danh nghĩa (Norminal Scale) Thứ bậc (Ordinal Scale) Khoảng (Interval Scale) Tỷ lệ (Ratio Scale) • Các mã số: Đánh dấu, ký hiệu, cho điểm • Lựa chọn số lượng giới hạn hành vi thông tin • Gắn thang đo, mã số cho hành vi thông tin c) Những ý mã hóa liệu • Người sử dụng cần phải biết mã liệu • Nếu người sử dụng khơng biết mã số liệu khơng thể phân tích • Thí dụ Mã hóa thơng tin giới: nam; nữ • Mức độ xác liệu mã hóa • Ví dụ: Mã hóa thơng tin mức độ kinh tế Hộ giàu: thu nhập/1 người > 2,5 triệu/tháng; Hộ nghèo: < 0,5 triệu/tháng • Mã hóa thường thể số • Ví dụ: Nghèo 1, Cận nghèo 2, Khá 3, Giàu 4.1.2 Đánh giá chất lượng liệu a) Thế đánh giá chất lượng số liệu • Tại số liệu phải ĐÁNG TIN CẬY số liệu phải THỰC? • Có thể biết thơng qua kiểm định số liệu • Đánh giá chất lượng số liệu giúp người sử dụng nhà quản lý chắn số liệu “tốt” sử dụng cho NC • Tiêu chí đánh giá chất lượng số liệu - Tính xác - Hợp lí - Thời gian (trước, sau, mới?) - Đầy đủ - Mức diện (có sẵn) - Mức độ chi tiết Phương pháp đánh giá chất lượng số liệu D÷ liƯu thứ cấp có trả lời đ-ợc vấn đề nghiên cứu không Không Dừng Có Các liệu thứ cấp có phù hợp với thời gian nghiên cứu không Không Có Các liệu thứ cấp có áp dụng với tổng thể nghiên cứu không Không Có Các đơn vị đo l-ờng có phù hợp với thiết kế nghiên cứu không Không Có thể xử lý lại thông tin cho phù hợp không Không Dừng Có Các thông tin có xác không Có Sử dụng Không Dừng ỏnh giỏ chất lượng thơng tin thứ cấp 10 c) Phân tích tương quan 43 Quan hệ tương quan • Là quan hệ tuyến tính biến độc lập • Có thể dự báo giá trị biến biết giá trị biến • Hệ số tương quan nằm khoảng -1 đến • Giá trị -1 tương quan hồn hảo, chặt, tuyến tính biến • Giá trị khơng có tương quan, khơng có mối quan hệ 44 Tương quan – mức độ xu hướng 45 Phân tích tương quan Xóm Giói tính Trình độTổng diện Xóm Giói tính 0.391 1.000 Trình độ -0.253 -0.218 1.000 Tổng diện -0.372 -0.377 0.087 1.000 Tuæi 0.511 0.359 -0.312 -0.420 Sè khÈu 0.209 0.069 -0.389 -0.331 Sè lao ®éng 0.444 0.215 -0.343 -0.423 tæng vèn -0.097 -0.309 0.261 0.347 thu nhËp năm0.120 0.001 0.064 -0.110 Tuổi Số lao động tổng vốnthu nhập năm 1.000 0.370 0.435 -0.328 -0.183 1.000 0.797 1.000 -0.010 0.048 1.000 0.208 0.481 0.749 Ưu nhược điểm tương quan • Có thể đo mối quan hệ biến mà khó làm thực nghiệm (chỉ số IQ tình trạng việc làm/nghề nghiệp) • Khơng xác định mối quan hệ nhân – • Có thể biến thứ có ảnh hưởng • Hướng chưa rõ ràng • R mang tính định tính 47 d) Phân tích hồi qui y = 15,843Ln(x) - 6,8698 R2 = 0,771 y Log (y) san luong 40 30 20 10 0 10 15 Dien tich 48 Regression Statistics Multiple R 0.871779 R Square 0.759998 Adjusted R Square 0.729998 Standard Error10.03797 Observations 19 ANOVA df Regression SS MS F Significance F 5105.162 2552.581 25.33305 Residual 16 1612.175 100.7609 Total 18 6717.337 Coefficients Standard Error t Stat 1.1E-05 P-value Lower 95%Upper 95% Intercept -14.32992 6.906661 -2.074798 0.054496 -28.97139 0.311542 Sè lao ®éng 7.218543 1.982913 3.640373 0.002203 3.014955 11.42213 tỉng vèn 0.512103 0.086259 5.936809 2.09E-05 0.329242 0.694964 Các phương pháp phân tích định lượng khác Mơ hình hóa (kết hợp KTL + Tốn + mơn khác) Mơ hình tối ưu Phân tích ngành hàng, Phân tích ma trận sách (PAM) Phân tích lợi so sánh Phân tích tài Xem lại môn học liên quan vận dụng chương sau 50 4.2.3 Phân tích thơng tin thứ cấp • Sử dụng thông tin thứ cấp cho nghiên cứu? Số liệu thứ cấp • Số liệu thu thập khơng phải cho mục đích NC • Phân tích số liệu/ thơng tin có • Số liệu thu thập cho sử dụng chung • Nhà NC có ảnh hưởng nhỏ đến dạng số liệu (làm điều tra, ) • Khơng nên nhầm với : Phân tích “thứ cấp” – phân tích phân tích khác – kiểm tra tính xác 52 Số liệu thứ cấp • Lợi ích • Chi phí thời gian • Sự sẵn có • Đỡ tốn • Khơng địi hỏi thời gian nhiều 53 Số liệu thứ cấp • Bất lợi: Có thể khơng đáp ứng nhu cầu NC • Đơn vị tính • Các khái niệm, định nghĩa khác • Thời gian • Hạn chế: Tính xác • Ai thu thập? • Tại lại thu thập? • Thu thập nào? 54 4.3 Trình bày kết xử lý & phân tích thơng tin • (Xem lại Bài giảng Nguyên lý thống kê kinh tế) 55 Trình bày số liệu, thơng tin kiểu trình bày kết xử lý phân tích • Sớ liệu độc lập • Bảng sớ liệu • Sơ đờ, hình • Đờ thị Mục đích • Tất kiểu trình bày nhằm mục đích giúp người đọc dễ hiểu kết phân tích • Đây cách khác – mục đích 56 u cầu trình bày kết xử lý phân tích thơng tin Mỗi hình thức trình bày có: • Bao gồm tiêu đề mơ tả • Tên tất biến đơn vị đo • Các biến độc lập trục hồnh • Biến phụ thuộc trục tung • Nguồn số liệu ghi • Chỉ rõ kiểm định thống kê cuối bảng • Ln có số quan sát, số mẫu • Chỉ rõ dùng phần trăm 57