Bài giảng Thống kê học ứng dụng trong quản lý xây dựng: Phần 4 - TS. Nguyễn Duy Long

23 101 0
Bài giảng Thống kê học ứng dụng trong quản lý xây dựng: Phần 4 - TS. Nguyễn Duy Long

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Phần 4 trang bị cho người học những kiến thức về giai đoạn thu thập dữ liệu trong thống kê. Chương này trình bày hai nội dung chính, đó là: Khảo sát mẫu, thí nghiệm và nghiên cứu quan sát. Mời các bạn cùng tham khảo.

9/8/2010 Phần 04 Nguyễn Duy Long, Tiến Sỹ Bộ môn Thi Cơng QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ   Khảo sát mẫu Thí nghiệm nghiên cứu quan sát ©2010, Nguyễn Duy Long, Tiến Sỹ 9/8/2010 Gathering Data ©2010, Nguyễn Duy Long, Tiến Sỹ    Xem xét sở việc thu thập liệu Vượt liệu có tay để đến với giới rộng lớn (quần thể) Tìm hiểu ba ý tưởng cho phép “vượt rào” ©2010, Nguyễn Duy Long, Tiến Sỹ 9/8/2010  Ý tưởng rút mẫu ◦ Xem xét nhóm nhỏ hơn, gọi mẫu (sample), lựa chọn từ quần ầ thể ể ◦ Lấy mẫu (sampling) việc làm tự nhiên  Thăm dị ý kiến (opinion poll) ví dụ khảo sát mẫu (sample surveys), thiết kế để hỏi nhóm nhỏ với hy vọng hiểu vấn đề tồn quần thể ◦ Người thăm dị ý kiến (pollster) chuyên nghiệp phải đảm bảo việc lấy mẫu có tính đại diện (representative ) cho quần thể ◦ Nếu khơng, có… ©2010, Nguyễn Duy Long, Tiến Sỹ  Mẫu không đại diện cho thành viên quần thể gọi bị chệch (biased) ◦ Sự chệch “bả thuốc” việc lấy mẫu ◦ Thường khơng có cách để chỉnh sửa mẫu bị chệch hay để có thơng tin hữu ích từ  Cách tốt để tránh chệch chọn cá thể cho mẫu cách ngẫu nhiên (at random) ◦ Giá trị việc giới thiệu ngẫu nhiên (randomness) quan niệm tuyệt vời thống kê học ©2010, Nguyễn Duy Long, Tiến Sỹ 9/8/2010 Nguồn: VNExpress.net, 8/11/2009 ©2010, Nguyễn Duy Long, Tiến Sỹ    Ngẫu nhiên hóa (randomization) kháng lại yếu tố mà bạn biết (và khơng biết) liệu Ngẫu nhiên hóa bảo vệ từ tác động đặc điểm quần thể Ngẫu nhiên hóa giúp có suy luận quần thể thấy mẫu ◦ Sự suy luận số thứ hữu hiệu mà thực với thống kê học ©2010, Nguyễn Duy Long, Tiến Sỹ 9/8/2010    Mẫu ngẫu nhiên cần lớn để mẫu đại diện cho quần thể? Kích phải Kí h thước hướ ủ mẫu, ẫ không khơ hải kích kí h thước hướ quần thể tạo khác biệt lấy mẫu Tỷ phần quần thể mà lấy mẫu vấn đề ©2010, Nguyễn Duy Long, Tiến Sỹ   Tại phải lo xác định kích thước mẫu? Sẽ tốt bao gồm người “lấy mẫu” cho h toàn quần ầ thể? hể? ◦ Mẫu đặc biệt gọi tổng điều tra (census)  Các vấn đề tổng điều tra: ◦ Khó để hồn thành tổng điều tra ◦ Các quần thể khó đứng yên ◦ Tổng điều tra phức tạp tốn lấy mẫu ©2010, Nguyễn Duy Long, Tiến Sỹ 10 9/8/2010  Mơ hình dùng tốn học để miêu tả thực tế ◦ Các thống số số mơ hình  Dùng liệu để ước lượng tham số quần thể ◦ Mỗi tổng kết từ liệu trị số thống kê (statistic) ◦ Trị số thống kê để ước lượng tham số quần thể gọi trị số thống kê mẫu (sample statistics) Tên Trị số thống kê Tham số Trị trung bình y µ Độ lệch chuẩn s σ Sự tương quan r ρ Hệ số hồi qui b β Phần pˆ p ©2010, Nguyễn Duy Long, Tiến Sỹ   11 Cần bảo đảm trị số thống kê từ mẫu phản ánh tham số tương ứng cách xác Mọi mẫu kích thước mẫu định lấy có hội lựa chọn giống ◦ Mỗi thành viên có hội lựa chọn ◦ Mỗi tổ hợp thành viên có hội chọn lựa ◦ Một mẫu lấy gọi mẫu ngẫu nhiên đơn giản (Simple Random Sample (SRS)) ©2010, Nguyễn Duy Long, Tiến Sỹ 12 9/8/2010   SRS tiêu chuẩn để đo phương pháp lấy mẫu khác, phương pháp lấy mẫu dựa lý thuyết làm việc với ệ từ mẫu liệu Để chọn mẫu ngẫu nhiên, trước tiên cần xác định mẫu đến từ đâu ◦ Khung mẫu (sampling frame) tập hợp cá thể mà mẫu rút   Một có khung mẫu, cách dễ để chọn SRS với số ngẫu nhiên Các mẫu rút ngẫu nhiên thường khác ◦ Mỗi số ngẫu g nhiên rút chọn ọ cá thể khác cho mẫu ◦ Các khác dẫn đến giá trị khác cho biến đo lường ◦ Các khác giữ mẫu gọi biến đổi lấy mẫu (sampling variability) ©2010, Nguyễn Duy Long, Tiến Sỹ     13 Lấy mẫu ngẫu nhiên đơn giản cách hợp lý để lấy mẫu Các thiết kế phức tạp tiết kiệm thời gian hay tiền bạc hay giúp tránh vấn đề liên quan đến lấy mẫu Các thiết kế dùng để lấy mẫu từ quần thể thường phúc tạp mẫu ngẫu nhiên đơn giản Có loại khác nhau: Lấy Lấy Lấy Lấy mẫu mẫu mẫu mẫu phân tầng g (Stratified Sampling) g cụm (Cluster Sampling) nhiều giai đoạn (Multistage Sampling) có hệ thống (Systematic Sampling) ©2010, Nguyễn Duy Long, Tiến Sỹ 14 9/8/2010     Thỉnh thoảng quần thể chia trước thành nhóm đồng nhất, gọi tầng (strata), (strata) trước chọn mẫu SRS dùng tần (stratum) trước kết hợp kết Thiết kế mẫu thông dụng gọi lấy mẫu ngẫu nhiên phân tầng (stratified random sampling) Việc phân tầng giảm biến đổi kết ©2010, Nguyễn Duy Long, Tiến Sỹ  15 Một nhà thầu có kế hoạch tái cấu trúc thay đổi thị trường dự án xây dựng họ Họ muốn biết ế thói quen chọn thầu ầ chủ đầu ầ tư, quần thể chủ đầu tư Việt Nam ◦ Các chủ đầu tư cơng có tiêu chí khác chủ đầu tư tư nhân (và chủ đầu tư nước ngồi có tiêu chí khác hai loại chủ đầu tư trên) Có thể hữu ích phân tầng quần thể, lấy mẫu cho nhóm riêng biệt biệt ◦ Chúng ta làm điều sao? ◦ Sự xem xét cuối gì, sau thu thập tất mẫu này? ©2010, Nguyễn Duy Long, Tiến Sỹ 16 9/8/2010   Thỉnh thoảng việc phân tầng không thực tế SRS khó,, Chia quần thể thành phần tương tự hay cụm (clusters) làm việc lấy mẫu thực tế ◦ Có thể chọn hay vài cụm ngẫu nhiên thực tổng điều tra (hay lấy mẫu lớn) Thiế kế lấy lấ mẫu ẫ gọii lấy lấ mẫu ẫ cụm (cluster ( l ◦ Thiết sampling) ◦ Nếu cụm đại diện cho quần thể hợp lý, lấy mẫu cụm cho mẫu khơng bị chệch ©2010, Nguyễn Duy Long, Tiến Sỹ  17 Lấy mẫu cụm khác với lấy mẫu phân tầng g để đảm bảo mẫu có ự đại diện ệ ◦ Phân tầng nhóm quần thể, lấy mẫu ngẫu nhiên tầng ◦ Các cụm giống nhau, cụm không đồng (heterogeneous) tương tự quần thể ©2010, Nguyễn Duy Long, Tiến Sỹ 18 9/8/2010    Thỉnh thoảng dùng nhiều phương pháp lấy mẫu Kế hoạch lấy mẫu kết hợp nhiều phương pháp gọi mẫu nhiều giai đoạn (multistage samples) Hầu hết khảo sát thực tổ chức khảo sát chuyên nghiệp kết hợp lấy mẫu phân tầng cụm lấy mẫu ngẫu nhiên đơn giản ©2010, Nguyễn Duy Long, Tiến Sỹ     19 Thỉng thoảng lấy mẫu việc chọn cá thể có hệ thống Để tạo tính ngẫu nhiên, bắt đầu với chọn lựa có hệ thống từ cá thể lựa chọn ngẫu nhiên Khi khơng có lý để tin thứ tự danh sách liên hợp với phản hồi, lấy mẫu có hệ thống (systematic sampling) cho mẫu có tính đại diện Lấy mẫu có hệ thống rẻ lấy mẫu ngẫu nhiên ©2010, Nguyễn Duy Long, Tiến Sỹ 20 9/8/2010  “Ai” khảo sát từ nhóm khác nhau, nhập nhằng từ nói lên nhiều điều ề ề thành công nghiên cứu Nghĩ quần thể quan tâm (population of interest) Xác định khung mẫu (sampling frame) Có mẫu mục tiêu (target sample) lấ mẫu, ẫ đối tượng tư điề tra t … để lấy điều (respondents) thực Sự chệch nảy sinh điểm nào! ©2010, Nguyễn Duy Long, Tiến Sỹ    21 SRS từ khung mẫu sai (flawed sampling frame) nảy sinh chệch Lấy mẫu thuận tiện (convenience sampling), lấy từ cá thể thuận tiện Lấy mẫu thuận tiện không vấn đề người lấy mẫu khởi ©2010, Nguyễn Duy Long, Tiến Sỹ 22 9/8/2010   “Phủ sóng kém” (Under-coverage) Vấn đề phổ biến chệch không trả lời (nonresponse bias) b ) ©2010, Nguyễn Duy Long, Tiến Sỹ  23 Trong mẫu trả lời tự nguyện (voluntary response sample), nhóm lớn mời trả lời tất trả lời tính ◦ Các mẫu trả lời tự nguyện gần bị chệch, kết luận rút từ hầu hết sai   Các mẫu trả lời tự nguyện thường bị chệch theo người có ý kiến mạnh hay người khuyến khích mạnh ẫ khơng khơ ó tính tí h đại đ i diện, diệ chệch hệ h d trả t ả Vi mẫu có lời tự nguyện (voluntary response bias) làm giá trị khảo sát ©2010, Nguyễn Duy Long, Tiến Sỹ 24 9/8/2010  Tránh trả lời có tác động (influencing responses) ◦ Sự chệch trả lời (Response bias) liên hệ đến thứ thiết kế khảo sát mà gây ảnh hưởng đến trả lời ◦ Câu chữ câu hỏi ảnh hưởng đến trả lời ◦ Vấn đề “neo chặt” (anchoring) ©2010, Nguyễn Duy Long, Tiến Sỹ 25 Experiments and observational studies ©2010, Nguyễn Duy Long, Tiến Sỹ 26 9/8/2010  Trong nghiên cứu quan sát (observational study), nhà nghiên cứu không ấn định lựa chọn, họ quan sát chúng hú ◦ Ví dụ: Năm 2009, trường ĐHBK nghiên cứu so sánh thành công thị trường việc làm sinh viên học lớp kỹ sư tài kỹ sư học lớp thơng thường khóa 2004 ◦ Vì nhà khảo sát khơng ấn định sinh viên học lớp hay lớp mà quan sát sinh viên khóa học ©2010, Nguyễn Duy Long, Tiến Sỹ     27 Vì nhà khảo sát xác định đối tượng theo học thu thập số liệu công việc họ sau trường, gọi nghiên cứu “xem lại khứ” (retrospective study) Nếu nhà khảo sát xác định đối tượng trước thu thập số liệu kiện chưa bộc lộ, gọi nghiên cứu sau (prospective study) Nghiên cứu quan sát có giá trị cho việc khám phá khuynh hướng liên hệ Tuy nhiên, nghiên cứu quan sát mối quan hệ nhân ©2010, Nguyễn Duy Long, Tiến Sỹ 28 9/8/2010    Thí nghiệm (experiment) thiết kế nghiên cứu cho phép chứng minh mối quan hệ nhân Thí nghiệm: hiệ ◦ Thao tác (manipulate) mức yếu tố (factor levels) để tạo liệu pháp (treatments) ◦ Ấn định (assign) ngẫu nhiên đối tượng với mức liệu pháp ◦ So sánh (compares) phản hồi nhóm đối tượ tượng pháp đố g với mức ức liệu ệu p áp ày Thí nghiệm phải xác định biến khám phá, gọi yếu tố (factor) để thao tác biến phản hồi để đo lường ©2010, Nguyễn Duy Long, Tiến Sỹ    29 Người thí nghiệm thao tác yếu tố để kiểm soát chi tiết liệu pháp, ấn định đối tượng với liệu pháp ngẫu nhiên nhiên Người thí nghiệm quan sát biến phản hồi so sánh phản hồi cho nhóm đối tượng khác Cá thể mà thí nghiệm gọi đơn vị thí nghiệm (experimental units)/ ◦ Khi cá thể người, gọi đối tượng (subjects) hay người tham gia (participants)   Các giá trị cụ thể mà người thí nghiệm chọn cho yếu tố gọi mức yếu tố Một liệu pháp kết hợp mức cụ thể từ tất yếu tố mà đơn vị thí nghiệm tiếp nhận ©2010, Nguyễn Duy Long, Tiến Sỹ 30 9/8/2010 Kiểm soát (Control): ◦ Kiểm soát nguồn biến đổi yếu tố thử cách tạo điều kiện cho nhóm liệu pháp tương tự tốt Ngẫu nhiên hóa (Randomize): ◦ Sự ngẫu nhiên hóa cho phép cân ảnh hưởng nguồn biến đổi khơng biết hay khơng thể kiểm sốt ◦ Khơng có ngẫu nhiên hóa, chệch nảy sinh ©2010, Nguyễn Duy Long, Tiến Sỹ 31 Lặp lại (Replicate): ◦ Làm lại thí nghiệm, áp dụng liệu pháp vào nhiều hiề đối tượng tư Tạo khối (Block) (tùy chọn): ◦ Thỉnh thoảng số thuộc tính đơn vị thí nghiệm khơng nghiên cứu hay khơng thể kiểm sốt ảnh hưởng kết thí nghiệm chúng tương ◦ Nếu ếu c ú g ta nhóm ó cá tthể ể tươ g tự ngẫu nhiên hóa khối (block) này, loại bỏ nhiều biến đổi khác khối ©2010, Nguyễn Duy Long, Tiến Sỹ 32 9/8/2010   Giản đồ giúp thể thủ tục thí nghiệm Giản đồ sau biểu thị bố trí ngẫu nhiên đối tượng với nhóm liệu pháp, liệu pháp riêng biệt cho nhóm so sánh kết qua sau cùng: Nguồn: De Veaux, 2006 ©2010, Nguyễn Duy Long, Tiến Sỹ    33 Sự khác biệt cần có để nói có khác biệt liệu pháp? Các khác biệt lớn từ ngẫu nhiên hóa gọi “đáng kể mặt thống kê” (statistically significant) Sự đáng kể mặt thống kê (statistical significance) nói phần sau Đến đây, khác biệt đáng kể mặt thống kê chúng ể xảy ngẫu ẫ nhiên ta tin khơng thể ©2010, Nguyễn Duy Long, Tiến Sỹ 34 9/8/2010   Thí nghiệm khảo sát mẫu dùng ngẫu nhiên hóa để thu thập liệu không bị chệch (unbiased data) ( b dd ) Nhưng chúng làm với cách mục đích khác nhau: ◦ Khảo sát mẫu cố gắng ước lượng tham số quần thể, mẫu có tính đại diện cho quần thể tốt ◦ Thí nghiệm cố gắng đánh giá ảnh hưởng liệu pháp đơn vị thí nghiệm khơng phải ln lấy ngẫu pháp, nhiên từ quần thể ©2010, Nguyễn Duy Long, Tiến Sỹ   35 Thơng thường muốn so sánh tình từ liệu pháp cụ thể với tình nguyên trạng (status quo) Sự đo lường sở (baseline measurement) gọi liệu pháp kiểm soát (control treatment), đơn vị thí nghiệm dùng liệu pháp gọi nhóm kiểm sốt (control group) ©2010, Nguyễn Duy Long, Tiến Sỹ 36 9/8/2010    Khi biết liệu pháp dùng, khó để khơng để kiến thức tác động đánh giá phản hồi hồi Để tránh chệch biết liệu pháp áp dụng, dùng “giấu kín” (blinding) Hai nhóm ảnh hưởng đến kết thí nghiệm: Người ảnh hưởng đến kết Người đánh giá kết   Khi cá nhân trong hai nhóm đ đ dấ kín, kí thí hí nghiệm h ấ kín kí đơn đ được dấu gọi giấu (single-blind) Khi cá nhân hai nhóm giấu kín, thí nghiệm gọi giấu kín kép (double-blind) ©2010, Nguyễn Duy Long, Tiến Sỹ     37 Thường đơn giản dùng liệu pháp có cải thiện Để tách tác động liệu pháp quan tâm, dùng liệu pháp kiểm sốt để nhại (giả) liệu pháp Liệu pháp giả (“fake” treatment) trông liệu pháp thử nghiệm gọi “giả dược” (placebo) Ảnh hưởng giả dược (placebo effect) xảy gg dùng liệu pháp giả tạo thay đổi biến phản hồi ©2010, Nguyễn Duy Long, Tiến Sỹ 38 9/8/2010  … thường là: ◦ ngẫu nhiên hóa (randomized) ◦ so sánh (comparative) ◦ giấu kín kép (double-blind) ◦ giả dược kiểm sốt (placebo-controlled) ©2010, Nguyễn Duy Long, Tiến Sỹ    39 Khi nhóm đơn vị thí nghiệm tương tự, tập hợp chúng lại với thành khối (blocks) (bl k ) Tạo khối tách biến đổi khác biệt khối để thấy khác biệt liệu pháo rõ Khi ngẫu nhiên hóa xảy khối, ta gọi thiết kế tạo khối ngẫu nhiên hóa (randomized block design) ©2010, Nguyễn Duy Long, Tiến Sỹ 40 9/8/2010  Giản đồ thí nghiệm tạo khối: Nguồn: De Veaux, 2006 ©2010, Nguyễn Duy Long, Tiến Sỹ   41 Tạo khối thí nghiệm tương tự phân tầng khảo sát Trong nghiên lại T hiê cứu ứ “xem “ l i khứ” hay h nghiên hiê cứu “về sau”, đối tượng thường sóng đơi chúng tương tự theo cách khơng nghiên cứu ©2010, Nguyễn Duy Long, Tiến Sỹ 42 9/8/2010  Thường bao gồm nhiều yếu tố thí nghiệm để đánh giá điều xảy mức yếu ế tố ố ấn ấ định với kết ế hợp khác ©2010, Nguyễn Duy Long, Tiến Sỹ   43 Khi mức yếu tố có liên hợp với mức yếu tố khác, ta gọi hai yếu tố trùng hợp (confounded) ( f d d) Với yếu tố trùng hợp, tách ảnh hưởng yếu với ảnh hưởng yếu tố khác ©2010, Nguyễn Duy Long, Tiến Sỹ 44 9/8/2010  Biến ẩn tạo liên hợp với hai biến khác làm nghĩ biến gây biến y gp g ◦ Xảy phân tích hồi q qui nghiên cứu q quan sát ◦ Biến ẩn thường nguyên nhân hai biến y x làm x gây y  Biến trùng hợp liên hợp theo cách không nhân với yếu tố ảnh hưởng đến phản hồi ◦ Vì phản hồi, cho biết ảnh hưởng ta thấy gây yếu tố hay yếu tố trùng hợp (hay hai)  Cả hai loại ảnh hưởng điều làm sai lệch – cần đề phịng hai! ©2010, Nguyễn Duy Long, Tiến Sỹ 45 ©2010, Nguyễn Duy Long, Tiến Sỹ 46 ... ngẫu nhiên (randomness) quan niệm tuyệt vời thống kê học ©2010, Nguyễn Duy Long, Tiến Sỹ 9/8/2010 Nguồn: VNExpress.net, 8/11/2009 ©2010, Nguyễn Duy Long, Tiến Sỹ    Ngẫu nhiên hóa (randomization)... Sự đáng kể mặt thống kê (statistical significance) nói phần sau Đến đây, khác biệt đáng kể mặt thống kê chúng ể xảy ngẫu ẫ nhiên ta tin khơng thể ©2010, Nguyễn Duy Long, Tiến Sỹ 34 9/8/2010  ... ©2010, Nguyễn Duy Long, Tiến Sỹ 40 9/8/2010  Giản đồ thí nghiệm tạo khối: Nguồn: De Veaux, 2006 ©2010, Nguyễn Duy Long, Tiến Sỹ   41 Tạo khối thí nghiệm tương tự phân tầng khảo sát Trong nghiên

Ngày đăng: 10/02/2020, 06:02

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan