Data Analysis Using R Introduction to the R language Data Analysis Using R 4 Design of experiments Tuan V Nguyen Garvan Institute of Medical Research, Sydney, Australia Overview • Terminology • Princi[.]
Data Analysis Using R: Design of experiments Tuan V Nguyen Garvan Institute of Medical Research, Sydney, Australia Overview • • • • • Terminology Principles of experimental design Single-factor design Two-factor design Randomization Terminology • Đơn vị nghiên cứu (experimental unit) – Đối tượng nghiên cứu • • • • Yếu tố can thiệp (factors) Mức độ can thiệp (treatment levels) Nhóm (block) Tiêu chí (response variable) Một ví dụ thí nghiệm cảm quan • • • • 30 khách hàng: nam nữ, tuổi 20-50 Thử loại cà phê: A, B, C Nhóm I, II, III – Nhóm I: 10 người thử A B – Nhóm II: 10 người thử B C – Nhóm III: 10 người thử A C Vị đắng đo likert scale • • • • Đơn vị nghiên cứu: Yếu tố can thiệp: Nhóm: Tiêu chí: Ba ngun tắc thí nghiệm • Ngẫu nhiên hóa (randomization) – Đảm bảo tính hợp lí nghiên cứu phân tích thống kê, qn bình hóa yếu tố can thiệp • Lặp lại nhiều lần (replication) – Đảm bảo khoa học tính • Phân nhóm (blocking) – Giảm độ dao động nhóm Những yếu tố cần quan tâm • Hiệu ứng placebo – 35% thuốc có hiệu hiệu ứng placebo • Hiệu ứng Hawthorne – Quen thuộc với sản phẩm • Bảo mật – Giữ kín danh tính tình nguyện viên – Khách quan đánh giá (blinding) Nguyên lí thí nghiệm: ví dụ • Nghiên cứu: – Sinh tố C cho điều trị cảm cúm – 50 đối tượng tình nguyện – Nên thiết kế ? • Phương án – Cho 50 người uống sinh tố C vòng tháng – Ghi nhận số lần cảm cúm – Kết quả: tần số cảm cúm trung bình 1.4 lần / đối tượng • Phương án – Chia 50 người thành nhóm nam nữ – Cả hai nhóm điều trị sinh tố C vòng tháng – Tần số cảm cúm trung bình nhóm nam 1.4 lần / đối tượng, cịn nhóm nữ tần số 1.9 lần / đối tượng Nguyên lí thí nghiệm: ví dụ • Phương án – Ngẫu nhiên chia thành nhóm điều trịi tháng: • 25 người nhóm sinh tố C • 25 người nhóm placebo – Kết quả: tần số cảm cúm trung bình nhóm 1.4 lần / đối tượng, cịn nhóm placebo 1.9 lần / đối tượng Nhóm Sinh tố C Nhóm Giả dược 50 người Nguyên lí thí nghiệm: ví dụ • Phương án – Sản xuất 50 hộp thuốc sinh tố C, 50 hộp giả dược sinh tố C – Ngẫu nhiên chia thành nhóm 50 người thành nhóm • 25 người nhóm sinh tố C • 25 người nhóm placebo – Tần số cảm cúm trung bình nhóm 1.4 lần / đối tượng, cịn nhóm đối chứng 1.4 lần / đối tượng Sinh tố C So sánh tần số cảm cúm Nam Giả dýợc 50 người Sinh tố C So sánh tần số cảm cúm Nữ Giả dýợc Thí nghiệm với yếu tố (single-factor designs) • Nghiên cứu ảnh hưởng phân bón đến tăng trưởng lúa • Ba liều lượng urê sử dụng (thấp, trung bình, cao) • Chọn địa điểm (A, B, C, D, E, F) • Mỗi địa điểm có mảnh đất để thí nghiệm (1, 2, 3) Completely randomized design Địa điểm Mảnh đất Mảnh đất Mảnh đất A Low High Low B Medium Medium High C High Medium Low D Medium Low High E Medium Low Medium F Low High High Randomized block design Địa điểm Mảnh đất Mảnh đất Mảnh đất A Low High Medium B Medium Low High C High Medium Low D Medium Low High E High Low Medium F Low High Medium Incomplete block design Địa điểm Mảnh đất Mảnh đất A Low High B Medium Low C High Medium D Medium Low E High Low F Low High Two-factor designs: CRD Ảnh hưởng nhiệt độ (thấp cao), vật liệu (A B), phương pháp sản xuất (cơ khí hóa chất) đến độ mạnh giấy Nhóm can thiệp Nhiệt độ Vật liệu Phương pháp Thấp A Cơ khí Cao A Cơ khí Thấp B Cơ khí Thấp A Hóa chất Two-factor designs: Factorial design Ảnh hưởng nhiệt độ (thấp cao), vật liệu (A B), phương pháp sản xuất (cơ khí hóa chất) đến độ mạnh giấy Nhóm can thiệp Nhiệt độ Vật liệu Phương pháp Thấp A Cơ khí Cao A Cơ khí Thấp B Cơ khí Thấp B Cơ khí Thấp A Hóa chất Cao A Hóa chất Thấp B Hóa chất Thấp B Hóa chất Latin square design So sánh hiệu suất (đo số - km - lít) loại dầu (A, B, C D) Cơng ti có tài xế loại xe Tài xế Loại xe Ford Toyota Honda Nissan D B C A B C A D C A D B A D B C Phương pháp ngẫu nhiên hóa T1 T2 T3 n=3 n=2 n=3 • Trước hết, lập danh sách đối tượng: T1 T1 T1 T2 T2 T3 T3 T3 • Dùng hàm sample để chọn ngẫu nhiên (sample(1:8) có chức tạo dãy số ngẫu nhiên từ đến 8): > sample(1:8) [1] • Nhập hai dãy số với nhau, có: T1 T1 T1 T2 T2 T3 T3 T3 ...Overview • • • • • Terminology Principles of experimental design Single-factor design Two-factor design Randomization Terminology • Đơn vị nghiên cứu (experimental unit)... randomized design Địa điểm Mảnh đất Mảnh đất Mảnh đất A Low High Low B Medium Medium High C High Medium Low D Medium Low High E Medium Low Medium F Low High High Randomized block design Địa điểm... Medium F Low High Medium Incomplete block design Địa điểm Mảnh đất Mảnh đất A Low High B Medium Low C High Medium D Medium Low E High Low F Low High Two-factor designs: CRD Ảnh hưởng nhiệt độ (thấp