Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 30 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
30
Dung lượng
274,5 KB
Nội dung
Chương trình mơn học Phương pháp thí nghiệm (điều tra, survey) Tổng số tiết: - Theo đơn vị học trình (15 tiết LT) - Theo tín (1 tín = 15 tiết LT) Nội dung: Chương 1: Giới thiệu môn học Chương 2: Phương pháp điều tra Chương 3: Xử lý- Phân tích–Đánh giá kết ( LT) (6 LT ) (6 LT ) Tài liệu tham khảo: Phương pháp bố trí thí nghiệm xử lý số liệu thực nghiệm”, Phan hiếu Hiền, 1996 Phương pháp luận nghiên cứu khoa học, Khải Minh, Thanh Mai, Hoàng Phúc, Nhà xuất Lao động Xã hội, 2007 Phương pháp ứng dụng phương pháp thí nghiệm”, Bùi việt Hải, 2007 Research design and methods, a process approach, 7th edition, Kenneth S Bordens and Bruce B Abbott, 2008 Chương trình chi tiết mơn học PPTN (điều tra-survey) Chương 1: Giới thiệu môn học (3 LT) I Mục tiêu môn học II Các yêu cầu điều tra/thu thập liệu III Tính chất/đặc tính điều tra IV Các mơn học kỹ cần thiết V Các phương pháp thống kê nghiên cứu VI Các khái niệm thống kê VII Trình tự thực điều tra nghiên cứu Chương 2: Phương pháp điều tra (6 LT) I Giới thiệu chung II Trình tự thực điều tra nghiên cứu II.1 Chọn đề tài, xác định mục tiêu/vấn đề/đối tượng cần nghiên cứu II.2 Các phương pháp điều tra II.3 Thiết kế mẫu điều tra II.4 Số lượng mẫu điều tra III Các yếu tố kỹ IV Tổ chức thực Ghi chú: Sinh viên thực hành cách tự thiết kế mẫu điều tra (theo nhóm) với chủ đề chọn lọc nhóm đưa ( có tính điểm ) Sau chỉnh sửa, sinh viên nộp mẫu điều tra cho giảng viên tự điều tra thu thập số liệu (thực hành trực tiếp đồng ruộng) dựa mẫu điều tra thiết kế (nếu không điều tra số liệu bị điểm 0) Chương 3: Xử lý-Phân tích-Đánh giá kết (6 LT) I Tiến trình xử lý liệu II Hiệu chỉnh liệu III Mã hố liệu IV Phân tích trình bày liệu IV.1 Định lượng (bảng biểu, đồ thị) IV.2 Thống kê (tương quan/hồi quy, so sánh trung bình/T-test, trắc nghiệm giả thiết/Chi square) V Vai trò tin học xử lý/phân tích/trình bày liệu Ghi chú: Sinh viên xếp, tổ chức phân tích liệu thu thập phần Nếu sinh viên khơng thực điều tra khơng có kết => phần sinh viên bị điểm Chương 1: Giới thiệu môn học (3 LT) Nội dung: I Mục tiêu môn học II Các phương pháp thống kê nghiên cứu III Các khái niệm thống kê IV Trình tự thực điều tra nghiên cứu Các từ khoá: Nghiên cứu, điều tra, quan sát, thiết kế thí nghiệm, liệu (số liệu), dân số, mẫu Các vấn đề cần nắm vững: - Thế nghiên cứu khoa học - Điều tra gì? Các yêu cầu tiến hành điều tra - Trình tự thực điều tra nghiên cứu - Các khái niệm cách tính tốn thông số thống kê I.Mục tiêu môn học: Điều tra khảo sát (survey) hay quan sát (observation) ghi nhận tượng xảy thiên nhiên cách đắn, xác trung thực Điều tra nhằm mục đích thu thập số liệu (mẫu điều tra thay tổng thể) phân tích số liệu thực thực (bởi thành phần chủ thể điều tra) (đây khác biệt điều tra thiết kế thí nghiệm quan sát) để trả lời vấn đề đặt nghiên cứu (tổng thể) Ghi chú: - Trong môn học không đề cập đến lãnh vực nghiên cứu xã hội, trị, v.v mà trọng đến điều nghiên cứu lãnh vực thuộc khoa học tự nhiên II Các yêu cầu điều tra Đầy đủ thơng tin thật cần thiết Trung thực/ xác Ngẫu nhiên/khach quan III Các tính chất/đặc tính điều tra Dữ liệu thường có sẳn Dữ liệu thuộc sở hữu người khác Diện rộng (vùng ảnh hưởng rộng lớn, cấp xã, huyện v.v…) Đa biến IV giao tiếp Các môn học kỹ cần thiết Các môn học : Toán, Xác suất thống kê, Tin học, Kỹ V Các phương pháp thống kê nghiên cứu: Các kỹ : Quan sát, Phân tích – tổng hợp Mơn học không đề cập đến phương pháp quan sát thiết kế thí nghiệm Tuy nhiên để hiểu rõ hơn, chúng tơi xin trình bày phương pháp áp dụng nghiên cứu Thu thập liệu Xác định mục tiêu/vấn đề/đối tượng cần nghiên cứu Thiết kế thí nghiệm Số liệu Xem xét liệu Tiếp cận nghiên cứu trước Điều tra, Quan sát Thông tin ban đầu Đo đạc, Ghi chép Phát sai sót, xếp tinh gọn, làm Xem xét số liệu ban đầu Lựa chọn kiểu phân tích Phân tích liệu Ước tính, dự đóan Trắc nghiệm giả thiết Đưa định, kết luận Khuyến cáo cho nghiên cứu Hình 1: Những phương pháp thống kê nghiên cứu nguồn: Experimental design, lecture notes, Emeterio S Solivas, Statistic 162 Như vậy, Điều tra công cụ nghiên cứu khoa học (nghiên cứu khoa học tìm giải thích tượng mới, nghĩa xác lập liên hệ tương phát biểu thành quy luật chung Chúng từ chung đến riêng – suy luận diễn dịch- chúng từ riêng sang chung – suy luận quy nạp) VI Các khái niệm thống kê: (nguồn: Phương pháp bố trí thí nghiệm Xử lý số liệu, T.S Phan hiếu Hiền) III.1 Dân số mẫu: III.1.1 Dân số (population): gọi quàn thể, tập hợp tất trị số đặc tính vật Ví dụ: Sự vật Sinh viên Nơng Lâm Đặc tính Chiều cao (m) Tuổi Trọng lượng (kg) Trị số 1,5; 1,52; 1,55; 1,6; 1,7 18; 19; 20; 21; … 30; 35; 40; 45; …….60; 70 Nông dân Cây trồng Diện tích sở hữu (ha) Phương pháp canh tác Giống Tuổi 0,4; 0,8; 1; 2; 5……20 Độc canh lúa, đa canh… A; B; C; ……….; E; H 1; 3; 5; ………… 15 Ghi chú: - Dân số theo nghĩa thống kê khác với dân số theo nghĩa thông thường - Một vật có nhiều dân số - Dân số vơ tận có giới hạn III.1.2 Mẫu (sample): Vì dân số mang giá trị lớn, có công sức, thời gian nguồn lực để đo đếm cho hết Vì vậy, chọn phần dân số (theo cách thức đó) để đo đếm (gọi mẫu) Có loại mẫu: Mẫu chủ quan mẫu ngẫu nhiên - Mẫu chủ quan: mẫu chọn theo ý đồ định trước người nghiên cứu Ví dụ: Chọn 12 người nam sinh viên Nơng lâm có chiều cao 1,8m để thành lập đội bong chuyền Mẫu giá trị, dụng thống kê - Mẫu ngẫu nhiên: mẫu chọn cho mẫu điều kiện có hội chọn (một cách ngẫu nhiên) Từ đó, thí nghiệm ngẫu nhiên xảy sau: + Có thể cho nhiều kết khác thực điều kiện biết trước (ví dụ: thảy đồng xu => sấp ngữa) + Có thể lập lại khơng thể lập lại Ví dụ: a Thảy đồng xu => lập lại (nếu đồng xu khơng bị mịn) b Hỏi anh A có muốn cưới chị B khơng? => khơng thể lập lại (vì hỏi lần thứ hai bị ám thị từ lần hỏi thứ nhất) III.1.3 Mối liên hệ dân số mẫu: - Từ dân số xác định cách phân bố mẫu (lý thuyết xác suất) - Từ mẫu suy đốn kết luận dân số (lý thuyết thống kê) Vì mẫu phải mẫu ngẫu nhiên III.1.4 Các thông số mẫu: thông số phổ biến là: Số trung bình (Mean, average, Xtb): số trung bình Xtb tính sau: Xtb = (f1X1 + f2X2 + … fnXn) / (f1+f2+…+fn) Nếu f1=f2=…=fn => Xtb = Σni=1Xi / n = (X1 + X2 + …+Xn)/n Ví dụ : Kết điều tra diện tích đất nơng nghiệp mà người nông dân sở hữu sau: Diện tích (ha) Số lượng Tổng 0,5 0,6 0,8 1,0 4 1,5 2,0 3,0 4,0 5,0 10,0 Tổng 10 2 40 15 10 10 20 78 Diện tích trung bình mà người nơng dân sở hữu khu vực điều tra là: Xtb = (4*0,5 + 5*0,6 + 5*0,8 +….+ 2*10) / (1+2+… +2) = 78/40 = 1,95 Phương sai (Variance, S2): biểu thị mức độ biến động tuyệt đối biến số định lượng Phương sai tính sau: S2 = SS/df SS (tổng bình phương, sum of square), df: độ tự SS = Σ( xi – xtb)2 = Σxi2 – ( Σxi)2/n df = n-1 2 Từ đó: S = 1/(n-1) * [Σxi – ( Σxi) /n] S2 = 1/(n-1) * [Σ(fxi)2 – ( Σfxi)2/n] Ghi chú: n lớn => xem (n – 1) = n Với ví dụ đây, S2 = 1/(n-1)*[922 – 152,1] = 769,9/(40-1) = 19,76 Độ lệch chuẩn (standard deviation, Sd): Sd = (S2)1/2 Nếu Sd lớn có nghĩa biến động biến X cao, nói cách khác giá trị đo đạc phân tán xa giá trị trung bình (và ngược lại) Trong ví dụ => Sd = 4,44 Hệ số biến động (Coefficient of variation, Cv): mức độ biến động bình quân tương đối tiêu nghiên cứu Cv tính đơn vị % Cv(%) = 100 * (Sd/xtb) = 100*(4,44/1,95) # 230% Biên độ biến động (range, R): hay gọi phạm vi biến động, khoảng chênh lệch trị số quan sát lớn trị số quan sát nhỏ biến nghiên cứu R = x max – x Trong ví dụ => R = 10 – 0,5 = 9,5 Nguồn: Thống kê ứng dụng phương pháp thí nghiệm, T.S Bùi việt Hải… Ghi chú: Các thơng số chưa có ví dụ tính tốn, sinh viên tự áp dụng cơng thức để tính tốn - Các thơng số tính tốn dựa vào phần mềm EXCEL theo bước sau (sẽ hướng dẫn lớp học) Tools => Data analysis => descriptive statistics => Input data => output data => summary VII Trình tự thực điều tra nghiên cứu: Để thực trình điều tra nghiên cứu, thường tiến hành theo bước sau: Thiết lập toán nghiên cứu (hình thành đề tài nghiên cứu) Quan niệm hố thiết kế nghiên cứu (hình thành giả thiết, mối quan hệ) Thiết kế mẫu điều tra (mẫu điều tra số lượng mẫu) Xây dựng phương tiện phương pháp thu thập liệu Thu thập liệu Xử lý phân tích liệu Đánh giá - Viết/trình bày báo cáo Ghi chú: Nội dung chi tiết bước trình bày chương Chương 2: Phương pháp điều tra (6 LT) Nội dung: I Giới thiệu chung II Phương pháp điều tra nghiên cứu II.1 Chọn đề tài, xác định mục tiêu/vấn đề/đối tượng cần nghiên cứu II.2 Thiết kế mẫu điều tra II.3 Số lượng mẫu điều tra II.4 Kỹ thuật lấy mẫu điều tra III Các yếu tố kỹ IV Tổ chức thực Từ khoá: Thu thập liệu, mẫu điều tra, độ tin cậy, vấn, kỹ thuật lấy mẫu Các vấn đề cần lưu ý: - Trình tự thực điều tra nghiên cứu - Lựa chọn kỹ thuật lấy mẫu điều tra - Cách thiết kế mẫu điều tra - Cách xác định số lượng mẫu điều tra - Tổ chức thực công tác điều tra I Giới thiệu chung: Như trình bày chương một, điều tra nghiên cứu phương pháp thống kê nghiên cứu, nhằm mục đích thu thập số liệu (từ thành phần chủ thể điều tra), sau xử lý phân tích số liệu để phục vụ cho mục đích nghiên cứu Như vậy, điều nghiên cứu đòi hỏi phải tổ chức nghiêm túc cẩn thận tỉ mỉ để việc thu thập số liệu xác, đầy đủ (đây yêu cầu hàng đầu quan trọng điều tra nghiên cứu) II Phương pháp điều tra nghiên cứu Quá trình điều tra nghiên cứu thường thực thơng qua bước tóm tắt sơ đồ sau: Lưu ý bước Chức Phương pháp công cụ Lý thuyết thiết kế Phương pháp, máy tính, thống kê Nguyên lý Xem xét tài liệu Thiết kế Tính xác thực tin cậy Kiểm tra trường Hiệu chỉnh liệu Nội dung Mã hoá Phát triển sách mã Biến giả thiết Định nghĩa phân loại Cái Như Triển khai nghiên cứu Ghi chú: + Ơ vng, chử nhật: lý thuyết cần nắm vững + Ơ trịn, oval: bước trung gian Như cần lấy 455 mẫu thay 589 Cơng thức 2: n = t2 * S2/L2 đó: t: tra từ bảng student ứng với mức 0,05 0,01 Trong trường hợp gần ta chọn: t2 = mức 0,05 t2 = mức 0,01 S2: phương sai L: mức độ xác ước lượng Ví dụ: Một quy trình sản xuất sơn có suất trung bình 20 tấn/ngày Độ lệch chuẩn S = tấn/ngày (qua theo dõi, suất thay đổi ngày) Nay thay đổi quy trình sản xuất Hỏi cần theo dõi ngày (n) để ước lượng số trung bình thực quy trình khoảng ± 1,5 tấn/ngày (L), ứng với xác suất 95% 99% - Ứng với 95% => n = * 32/1,52 = 4*9/2,25 = 16 ngày - Ứng với 99% => n = * 32/1,52 = 7*9/2,25 = 32 ngày Dung lượng mẫu (n) theo cơng thức hồn tồn mang tính ước lượng Thông thường thực tế, số lượng mẫu (n) thích hợp cho thống kê phải lớn 30 mẫu đương nhiên nhiều tốt (tăng độ xác) II.4 Kỹ thuật lấy mẫu điều tra II.4.1 Lấy mẫu ngẫu nhiên (random sampling): Lấy mẫu ngẫu nhiên trình lựa chọn cho đơn vị lấy mẫu đêu có khả diện mẫu Lấy mẫu ngẫu nhiên lấy ngẫu nhiên có lập lại khơng lập lại Trong thực tế, việc lấy mẫu ngẫu nhiên thường không lập lại (rút thăm, dung bảng số ngẫu nhiên v.v ) Ưu điểm: Việc lấy mẫu ngẫu nhiên => khách quan Cách rút mẫu đơn giản, dễ tiến hành, dễ tính tốn Khuyết điểm: Việc lấy mẫu ngẫu nhiên xác biến thiên dân số rời rạc không theo quy tắc, đơn vị lấy mẫu phân bố diện rộng II.4.2 Lấy mẫu ngẫu nhiên phân tầng (lớp) (stratified random sampling) Trong nghiên cứu, có trường hợp tổng thể nghiên cứu (dân số) cấu tạo nhiều tập hợp khác (khơng đồn nhất) có lien quan đến tiêu muốn nghiên cứu Trong trường hợp này, tổng thể nghiên cứu phải phân thành nhóm (tầng hay lớp) có đặc đểm tương đồng trước tiến hành lấy mẫu Lấy mẫu ngẫu nhiên phân tầng nghĩa chọn mẫu ngẫu nhiên từ nhóm (tầng, lớp) tổng thể nghiên cứu Số lượng mẫu cho tầng (lớp, nhóm) xác định sau: - tầng thứ i: ni = n * pi pi: tỉ trọng cho lớp thứ I n: số lượng mẫu cho toàn thể Ưu điểm: Hiệu lấy mẫu ngẫu nhiên đánh giá riêng cho lớp Từ việc tính tốn số liệu vừa cho nhóm vừa cho tổng thể Khuyết điểm: Phương pháp có ý nghĩa có trước thơng tin cần thiết tổng thể nhóm phải có cấu trúc riêng II.4.3 Lấy mẫu hệ thống (systematic sampling): Lấy mẫu có hệ thống phương pháp chọn mẫu theo trật tự từ tổng thể nghiên cứu Ví dụ: Một lơ cao su có 48 hàng cây, muốn lấy mẫu hàng để xác định đường kính than chẳng hạn Ta tiến hành sau: gọi r trật tự cần xác lập => r = 48/8 = Như cách hàng ta lấy hàng lấy mẫu hàng chọn ngẫu nhiên từ => (hàng thứ thứ thứ thứ v.v…) Ưu điểm: Sự lựa chọn mẫu thực dễ dàng, nhanh chóng trải khắp tổng thể mẫu nghiên cứu Khuyết điểm: Phải xác định số lượng thứ tự đơn vị lấy mẫu Điều khơng phải lúc có tự nhiên II.4.4 Lấy mẫu theo nhiều giai đoạn (multi- stage sampling): Trong phương pháp này, việc chọn mẫu tiến hành qua nhiều giai đoạn (khác với phương pháp chọn mẫu theo nhóm nhiều bước chọn mẫu thay lúc phân nhiều đặc diểm khác nhau).Ví dụ: Chọn vùng địa lý lớn (ví dụ: tỉnh, huyện), sau chọn mẫu vùng địa lý nhỏ (ví dụ: huyện, xã), sau chọn số nơng hộ huyện xã Như việc tiến hành chọn mẫu theo giai đoạn: tỉnh (huyện) => huyện (xã) => nông hộ Khuyết điểm phương pháp chọn mẫu theo nhiều giai đoạn (hay theo nhóm) cần có nhiều cá thể mẫu (mẫu phải lớn) III Các yếu tố kỹ bản: Như trình bày, mục đích việc điều tra nghiên cứu thu thập liệu từ đối tượng khác cách đầy đủ, xác, hữu hiệu Để đạt yêu cầu đây, yếu tố kỹ sau cần phải xem xét nâng cao hoàn thiện (kể việc phải tổ chức tập huấn) trước tiến hành điều tra nghiên cứu Các yếu tố: (1) Tạo thuận tiện cho người vấn, điều tra (Ví dụ: số câu hỏi vừa phải, có hệ thống, dễ hiểu, chuẩn bị sẳn phương tiện để phản hồi cho chuẩn bị sẳn phong bì, tem thư, địa ….) (2) Tận dụng không lệ thuộc vào cán có uy tín công tác địa phương để nắm rõ thong tin tạo ấn tượng tốt lúc ban đầu (3) Nếu tiến hành điều tra theo nhiều nhóm tất thành viên phải nắm rõ mục tiêu, có kỹ gần (nếu cần phải tập huấn) để việc thu thập thông tin đồng đều, xác (4) Thơng tin thu thập phải khẳng định giữ bí mật để khơng gây hoang mang cho người vấn (không thu thập thơng tin bí mật riêng (họ tên, địa người vấn, tạo ấn tượng thu thập thơng tin cho mục đích khơng rõ ràng thu thuế v.v => cần phải khẳng định rõ cho người vấn) Tuy nhiên, số trường hợp, thông tin riêng người vấn phép thu thập để rà soát lại sau - Các kỹ năng: (1) Kỹ giao tiếp (ngôn ngữ, cử chỉ, giọng điệu nói, tập qn v.v…) để việc trao đổi thơng tin rõ ràng, thuận lợi (2) Kỹ tổ chức: Nhóm thực điều tra cần phải biết tổ chức hợp lý khoa học để giảm chi phí, thời gian, công sức v.v (3) Kỹ quan sát: việc chuẩn bị từ trước Tuy nhiên q trình thực cịn nhiều điều lạ mà không đủ khả để lường trước Vì vậy, trình thực cần có kỹ quan sát để khám phá khác lạ xảy nhằm nâng cao, bổ sung khắc phục thiếu sót q trình chuẩn bị IV Tổ chức thực hiện: Quy mô điều tra nghiên cứu mang tầm vóc rộng lớn đa dạng, cần tiến hành thực tương đối lâu dài, nhiều thành phần Vì cần phải tổ chức thực có quy cách để mang lại hiệu cao Những vấn đề sau cần phải quan tâm trình tổ chức thực hiện: - Mọi thành viên phải hiểu rõ mục tiêu điều tra nghiên cứu cách đồng (nếu có hiểu khác => thực khác nhau, lệch lạc => số liệu khơng đồng đều, sai lệch => xác) - Có phối hợp tốt (nhưng phải chủ động, tránh thiên lệch thành viên địa phương bênh vực khen chê địa phương mình)với số thành viên địa phương địa bàn điều tra để thuận tiện việc nắm đầy đủ thông tin - Chuẩn bị tốt phương tiện thu thập liệu (tài liệu, biểu mẫu, thiết bị máy móc (nếu có), ….) - Phân nhóm hợp lý (tránh tải nhẹ cơng việc để thành viên hỗ trợ hợp tác bổ sung cho nhau) - Phân bổ mẫu điều tra hợp lý để thuận tiện lại (cuốn chiếu, tránh tới lui gây tốn thời gian tiền bạc) - Điều kiện ăn ở, phương tiện lại (tạo thuận lợi cho nhóm thực hiện) - Thời điểm tiến hành điều tra phải thích hợp (người trả lời có thời gian thoải mái việc trao đổi, trả lời thông tin) Ghi chú:(đính kèm theo số ví dụ mẫu điều tra) (mẫu điều tra đính kèm mang tính tham khảo) CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc -*** PHIẾU ĐIỀU TRA VỀ SẢN XUẤT VÀ THU MUA CACAO (dành cho nơng dân) (mục đích…… ) I Thông tin chung: Họ tên chủ hộ:…………………….Phái tính: …… Địa chỉ:………………………………………………… Điện thoại:…………………………………………… Diện tích đất nơng nghiệp II Thơng tin chi tiết: A Thơng tin kỹ thuật: Diện tích trồng cacao (ha):………Tên giống……… Nguồn giống mua từ đâu:………………………… Thời gian bắt đầu trồng cacao:……………………… Phương thức trồng cacao: trồng xen [ ] trồng [ ] Nếu trồng xen, trồng xen với gì? Năng suất cacao (kg/ha): …………………………… Ông/bà (hay Anh/chị) có nhận xét suất trồng xen sau trồng cacao không? Tình hình sâu bệnh:……………………………… Ơng/bà (hay Anh/Chị) có sử dụng tan dư thực vật cacao (vỏ,trái,lá) làm phân xanh khơng? 10 Ơng/bà (hay Anh/Chị) có sử dụng tan dư thực vật cacao (vỏ,trái,lá) làm thức ăn gia súc khơng? 11 Ơng/bà (hay Anh/chị) có khó khăn việc trồng cacao khơng? B Thông tin kinh tế: Ông/bà (hay Anh/Chị) đánh giá thu nhập trước trồng cacao: ……………………………………… Ông/bà (hay Anh/Chị) đánh giá thu nhập sau trồng cacao: ……………………………………… Ông/bà (hay Anh/chị) đánh giá thị trường tiêu thụ cacao nay? Ông/bà (hay Anh/chị) bán cacao cho ai? Ông/bà (hay Anh/chị) đánh giá giá cả? Ơng/bà (hay Anh/chị) có gặp khó khăn mua bán cacao khơng? Nếu có, vấn đề quan trọng nhất? C Thông tin hỗ trợ: Ơng/bà (hay Anh/chị) có nhận hỗ trợ không? từ nguồn nào? Ông/bà (hay Anh/chị) cần hỗ trợ cho việc phát triển cacao? ………………………………………………………………………………… III Ý kiến đóng góp thêm: ………………… …………………………………………………………… ………………………………… …………………………………………… ………………………………………………………………………………… ………………………………………………………………………… ………… Ngày tháng năm Người vấn (hoặc người điều tra) PHIẾU ĐIỀU TRA (mẫu chung dành cho đào tạo sinh viên học môn PPTN1) A Thông tin chung (tổng quát) Họ tên người vấn (điều tra)(nơng hộ) (có trường hợp khơng nên sử dụng)……………… Địa (người vấn) Tình trạng gia đình (số nhân khẩu, lao động chính, nam, nữ) Tình trạng học vấn (nếu cần thiết) Tình trạng sản xuất (diện tích canh tác, số mùa vụ, công cụ lao động) B Thông tin chi tiết Kỹ thuật canh tác mùa vụ (diện tích, giống, lịch canh tác, phân bón, nước tưới, suất, nguồn cung cấp giống, tình hình sâu bệnh….) Chi phí sản xuất mùa vụ (giống, phân, thuốc, nước tưới, công lao động, v.v ) Thu nhập (giá bán loại, thời điểm, phương thức toán…) Các vấn đề khác (khuyến nơng, tín dụng, thu mua, ….) C Góp ý chung Ngày tháng năm Người vấn Chương 3: Xử lý phân tích liệu Nội dung: I Tiến trình xử lý liệu II Hiệu chỉnh liệu III Mã hóa liệu IV Phân tích trình bày liệu IV.1 Định lượng (mơ tả) IV.2 Thống kê V Vai trị tin học xử lý/phân tích trình bày liệu Từ khóa: liệu, xử lý liệu, hiệu chỉnh liệu, mã hố liệu, phân tích lịệu, trình bày liệu Các vấn đề cần ý Nắm rõ tiến trình xử lý liệu Hiệu chỉnh tổ chức liệu cho phù hợp với mục tiêu cần phân tích Vấn đề mã hố liệu Làm để trình bày liệu hiệu quà Ứng dụng tin học xử lý phân tích/trình bày liệu I Tiến trình xử lý liệu: Câu hỏi đặt sau việc thu thập thơng tin hồn tất, bước thông tin gì? Làm tìm câu trả lời cho vấn đề nghiên cứu? Làm để đánh giá ý nghĩa thông tin thu thập được? Làm để công nhận hay phủ nhận giả thiết đặt ra? Và nhiều câu hỏi khác Như vậy, để trả lời câu hỏi đây, cần phải tiến hành bước sau (xem hình 1) Dữ liệu thơ Hiệu chỉnh - Phỏng vấn - Bảng câu hỏi - Các nguồn số liệu khác Mã hóa Phát triển sách mã hóa Mã hóa liệu Kiểm chứng liệu mã hóa Phân tích Phát triển khung phân tích Phân tích - Máy tính (tin học) - Thủ cơng Hình 1: Tiến trình xử lý liệu II Hiệu chỉnh liệu: Mục đích việc hiệu chỉnh liệu để giảm thiểu lỗi, thiếu sót, phân loại sai hay thiếu hụt thông tin (do không ghi ghi thiếu vấn, viết sai, viết không rõ ràng, v.v ) Có cách hiệu chỉnh liệu: Xem xét câu trả lời cho câu hỏi (một câu hỏi xem xét nhiều người, nhiều câu trả lời) Xem xét câu trả lời cho câu hỏi người (với bảng trả lời người trả lời, ta xem xét tất câu trả lời người đó) III Mã hóa liệu: Sau làm liệu (hiệu chỉnh liệu), bước mã hóa liệu Thơng thường, việc phân tích liệu cần đến việc áp dụng cơng nghệ thơng tin Do đó, dù liệu định tính hay định lượng cần xây dựng việc mã hóa thơng tin Việc mã hóa liệu thô liên quan đến bước Xây dựng sách mã hóa Tìm kiếm thử sách mã Mã hóa liệu Kiểm chứng liệu mã hóa Xây dựng sách mã hóa Sách mã hóa cung cấp quy tắc để gán giá trị số cho câu trả lời Điều phụ thuộc vào việc trả lời câu hỏi Công việc hữu ích cho người bắt đầu cơng việc (xem ví dụ) Số hiệu Số hiệu câu Tên biến Câu trả lời (4) Giá trị mã (5) cột (1) hỏi (2) (a) (3) AGE 20-24 25-29 30-34 35-39 40-44 45-49 > 50 Không trả lời (c) EDU THPT Đại học Thạc sỹ Tiến sỹ Không trả lời STUDY Kinh tế/thương mại Giáo dục Nghệ thuật Khoa học tự nhiên Ngoại ngữ Quản lý Không trả lời Ghi chú: Số lượng mã tùy thuộc vào kiểu trả lời mức độ nghiên cứu (chi tiết hay tổng quát) Tìm kiếm thử sách mã Mục đích để kiểm tra trở ngại, trục trặc có q trình mã hóa để điều chỉnh cho phù hợp Mã hóa liệu Chuyển trả lời vấn thơ (định tính định lượng) sang dạng mã số thiết lập Kiểm chứng liệu mã hóa Khi liệu thơ mã hóa xong, kiểm tra lại lần để chắn khơng cịn sai sót IV Phân tích trình bày liệu: Dữ liệu sau mã hóa phân tích tay (thủ cơng) máy tính Tuy nhiên việc phân tích thủ cơng nhiều thời gian (chỉ hữu ích khối lượng cơng việc ít, khơng có nhiều biến số để phân tích, số lượng mẫu nhỏ, việc phân tích tương đối đơn giản…) Tóm lại, việc phân tích liệu nên thực máy tính với chương trình phù hợp Dữ liệu sau phân tích thơng thường trình bày dạng sau: Định lượng (hay mô tả) thống kê IV.1 Định lượng: Có nhiều kiểu phụ việc trình bày liệu dạng miêu tả sau: Bảng biểu: kiểu phổ biến liệu qua phân tích Bảng biểu cách trình bày lượng lớn thơng tin chi tiết với khơng gian u cầu (theo The Chicago Manual of Style – 1992) Có nhiều kiểu dạng bảng biểu để trình bày (xem ví dụ 1) Tuy nhiên, kiểu trình bày dạng bảng biểu có số hạn chế khơng sinh động (chưa cho nhận biết biến động cách dễ dàng) Vì vậy, người ta dùng kiểu trình bày khác sinh động dạng biểu đồ (đồ thị) Ví dụ 1: Các kiểu bảng biểu Kiểu 1: Bảng xxxx: Sự phân bố độ tuổi người trả lời (số liệu mang tính giả định) Độ tuổi Số người trả lời < 20 tuổi ( 2.0) 20 – 24 12 (12.0) 25 – 29 22 (22.0) 30 – 34 14 (14.0) 35 – 39 17 (17.0) 40 – 44 10 (10.0) 45 – 49 11 (11.0) 50 – 54 ( 9.0) ≥ 55 (3.0) Tổng cộng 100 (100.0) Ghi chú: số ngoặc đơn tỉ lệ phần trăm Kiểu 2: (Bảng đối chiếu chéo) Bảng xxxx: Những người trả lời theo thái độ việc khai thác mỏ Uranium tuổi (số liệu mang tính giả định) Thái độ việc Tuổi khai thác mỏ < 25 25 - 34 35 - 44 45 – 54 ≥ 55 Tổng Uranium cộng Tán thành mạnh (0.0)* (5.5) (14.8) (35.0) (100.0) mẽ 16 (0.0) (12.5) (25.0) (43.6) (18.6) (100.0) Tán thành (0.0) (8.3) (18.5) (20.0) (0.0) 12 (0.0) (25.0) (41.7) (33.3) (0.0) (100.0) Không (0.0) (0.0) (7.4) (20.0) (0.0) chắn 0 (0.0) (0.0) (33.3) (66.7) (0.0) (100.0) Không tán (14.3) (19.4) (3.7) (0.0) (0.0) thành 0 10 (20.0) (70.0) (10.0) (0.0) (0.0) (100.0) Phản đối mạnh mẽ (85.7) (66.7) 12 24 (21.4) (42.9) Tổng cộng (100.0) (100.0) 14 36 Ghi chú: *: phần trăm theo cột (55.6) (25.0) (0.0) 15 56 (26.8) (8.9) (0.0) (100.0) (100.0) (100.0) (100.0) (100.0) 27 20 100 @: phần trăm theo hàng Bảng xxxx: Thái độ việc khai thác Uranium theo tuổi giới tính (số liệu mang tính giả định) Tổng Thái độ Số người trả lời cộng việc < 25 25 - 34 35 - 44 45 - 54 ≥ 55 Tổng khai thác Uranium Tán thành mạnh mẽ Tán thành Không chắn Không tán thành Phản đối mạnh mẽ Tổng cộng F M F M F M F M F M F M 0 1 - 12 16 0 0 3 2 0 0 12 1 0 0 10 17 0 31 25 56 23 13 16 11 12 59 41 100 Biểu đồ: Dữ liệu thống kê u cầu phân tích cẩn thận mà cịn u cầu trình bày phải có sức hút để dễ hiểu dễ truyền đạt Một kiểu trình bày thỏa mãn yêu cầu dạng biểu đồ Tuy nhiên dạng biểu đồ có nhiều cách để trình bày sau: dạng hình chử nhật, dạng thanh, dạng xếp chồng lên nhau, dạng diện tích, dạng điểm., dạng đường v.v (xem ví dụ 2) Ghi chú: 1: Tán thành mạnh mẽ 2: Tán thành 3: không chắn 4: không tán thành 5: phản đối mạnh mẽ 6: Tổng số người trả lời IV.2 Thống kê Dữ liệu điều tra sau xử lý, hiệu chỉnh, phân tích theo hướng thống kê sau: IV.2.1 Kiểm tra giả thiết thống kê: Có cách kiểm tra giả thiết thống kê (a) Kiểm tra tính độc lập (b) So sánh trung bình Tuy nhiên, này, chúng tơi trình bày việc kiểm tra tính độc lập (test for independence) hay gọi Chi square (Χ2) Các bước tiến hành sau: - Đặt giả thiết Ho: xem xét hai (2) dấu hiệu độc lập với - Tính tổng cùa hàng (R), tổng cột (C), tổng chung (G) - Tính tần số lý thuyết (fe) tương ứng với tần số quan sát (fo) cho ô bảng Fe (ij) = (Ri * Cj)/G với I = …r, j = 1… c - Tính giá trị Χ2 theo cơng thức sau: Χ2 = ΣΣ(fo-fe)2/fe - So sánh giá trị Χ2 tính với Χ2 tra bảng (xem phụ lục ) ứng với mức ý nghĩa α độ tự df - Chấp nhận giả thiết Ho Χ2 tính < Χ2 tra bảng - Bác bỏ giả thiết Χ2 tính > Χ2 tra bảng Trên bước lý thuyết việc kiểm tra giả thiết tính độc lập dấu hiệu (để tham khảo) Trong thực tế, việc tính tốn dựa vào phần mềm thống kê (statistical software) Sau vài ví dụ minh họa (dùng phần mềm thống kê MSTATC) Ví dụ 1: Để đánh giá chất lượng sinh trưởng trồng có phụ thuộc vào địa hình hay không? Người ta tiến hành điều tra dạng địa hình khác Kết tu bảng sau: Bảng …: Kết điều tra tình hình sinh trưởng trồng Chất lượng Tốt Loại địa hình - Sườn núi dốc 90 - Bằng phẳng 120 - Ven biển 80 Tổng (C) 290 Tổng (G) Trung bình 170 180 150 500 Xấu 40 50 60 150 Tổng (R) 300 350 290 940 Giả thiết Ho đặt chất lượng sinh trưởng không phụ thuộc vào loại địa hình (hay dạng địa hình khơng ảnh hưởng đến chất lượng trồng) Kết tính tốn cho thấy Χ2 tính = 9,65 (sinh viên tự xem cơng thức để tính tốn) Giá trị lớn Χ2 bảng (ứng với độ tự df = mức α = 0,05 => Χ2 bảng = 9,49)(xem phụ lục đính kèm) Như vậy, Χ2 tính > Χ2 bảng => bác bỏ giả thiết Ho Nói cách khác địa hình có ảnh hưởng đến chất lượng trồng IV.2.2 So sánh trung bình: dùng để so sánh trung bình biến động nghiệm thức Để so sánh, người ta thường áp dụng F-test (khi số lượng mẫu nghiệm thức tương đồng, nhau, cịn gọi so sánh bắt cặp) thông dụng kiểu T-test (khi số lượng mẫu nghiệm thức khơng nhau, khơng tương đồng) Trình tự tiến hành cụ thể diễn giảng phần thực hành phần mềm MSTATC IV.2.3 Tương quan: Trình tự tiến hành cụ thể diễn giảng phần thực hành phần mềm MSTATC EXCEL IV.2.4 Trình bày kết thống kê V Vai trị tin học phân tích liệu: Như trình bày, việc phân tích trình bày liệu thực theo hai hướng: thủ cơng máy tính Tuy nhiên, rõ ràng rằng, việc phân tích theo hướng thủ cơng tốn nhiều thời gian, bất tiện trình chỉnh sửa, thay đổi kiểu trình bày, lưu trữ liệu v.v Tóm lại, việc phân tích trình bày thường thực máy tính Điều cho thấy, vai trò tin học việc nhập, xử lý, phân tích trình bày liệu điều tra lớn Chúng ta cần phải nâng cao kỹ ứng dụng tin học công tác cách thường xuyên