bài giảng về ứng dụng tin học trong thiết kế thí nghiệm và xử lý số liệu

48 1.8K 2
bài giảng về ứng dụng tin học trong thiết kế thí nghiệm và xử lý số liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC NÔNG LÂM HUẾ DỰ ÁN HỢP TÁC VIỆT NAM – HÀ LAN BÀI GIẢNG NGHIÊN CỨU CHUYÊN SÂU Người biên soạn: PGS.TS Nguyễn Minh Hiếu Huế, 08/2009 TRƯỜNG ĐẠI HỌC NÔNG LÂM DỰ ÁN GIÁO DỤC VIỆT NAM HÀ LAN BÀI GIẢNG ỨNG DỤNG TIN HỌC TRONG THIẾT KẾ THÍ NGHIỆM VÀ XỬ LÝ SỐ LIỆU (Phương pháp nghiên cứu nâng cao) LÊ ĐÌNH PHÙNG NGUYỄN MINH HIẾU HUẾ, 2008 2 MỤC LỤC MỞ ĐẦU 2 BÀI I: NHẬP SỐ LIỆU 4 1.1. Nguyên tắc của nhập số liệu 4 1.2. Nhập số liệu trong trường hợp số liệu không phân nhóm/tổ 4 1.3. Nhập số liệu trong trường hợp số liệu phân tổ bởi một nhân tố 5 1.4. Nhập số liệu trong trường hợp số liệu phân tổ bởi hai nhân tố 6 1.5. Nhập số liệu trong các kiểu thiết kế thí nghiệm có sự khống chế sự sai khác ban đầu 7 BÀI 2. KIỂM TRA SỐ LIỆU VÀ ĐỊNH HƯỚNG PHÂN TÍCH 10 2.1. Kiểm tra số liệu bằng trình ứng dụng filter trong EXCEL 11 2.2. Kiểm tra số liệu bằng trình ứng dụng Box-plot hoặc Scatter Plot trong SPSS 14 BÀI 3. PHÂN TÍCH THỐNG KÊ MÔ TẢ 19 3.1. Phân tích thống kê mô tả trong trường hợp tập hợp số liệu không phân nhóm 20 3.2. Phân tích thống kê mô tả trong trường hợp tập hợp số liệu phân nhóm 21 BÀI 4. PHÂN TÍCH PHƯƠNG SAI 23 BÀI 5. PHÂN TÍCH PHƯƠNG SAI CHO CÁC KIỂU THIẾT KẾ THÍ NGHIỆM KHÁC NHAU 28 5.1. Nguyên tắc của phân tích số liệu của thiết kế thí nghiệm RCB và LSD 28 5.2. Phân tích số liệu từ thí nghiệm kiểu RCB 29 5.3. Phân tích số liệu từ thí nghiệm kiểu LSD 34 BÀI 6. ÁP DỤNG QUY TẮC NGẪU NHIÊN TRONG THIẾT KẾ THÍ NGHIỆM VỚI MỘT NHÂN TỐ 39 6.1. Ngẫu nhiên hóa trong thiết kế thí nghiệm kiểu CRD và RCB 39 6.2. Ngẫu nhiên hóa trong thiết kế thí nghiệm kiểu LSD 41 BÀI 7. PHÂN TÍCH HỒI QUY 42 3 MỞ ĐẦU Hai giai đoạn thú vị nhất trong nghiên cứu là thiết kế thí nghiệm và xử lý số liệu. Tuy nhiên, đây là hai giai đoạn tiêu tốn thời gian nhất. Trong một thí nghiệm, quá trình thiết kế thí nghiệm và xử lý số liệu không phải chỉ tiến hành một lần mà thường được lặp đi lặp lại nhiều lần, đặc biệt là giai đoạn xử lý số liệu. Nhận định này càng đúng khi làm việc với một tập hợp số liệu lớn, ví dụ số liệu điều tra. Hiểu bản chất của thiết kế thí nghiệm và xử lý số liệu là đặc biệt quan trọng. Quá trình thiết kế thí nghiệm và xử lý số liệu sẽ nhanh hơn, chính xác hơn và thú vị hơn nếu chúng ta có thể ứng dụng tin học vào phân tích số liệu thay vì tính toán đơn thuần. Hiện nay có rất nhiều phần mềm giúp cho quá trình xử lý số liệu. Nếu chúng ta sử dụng các phần mềm để phân tích kết quả thì luôn luôn có kết quả. Vấn đề cơ bản là kết quả đó đúng hay sai, kết quả đó nói lên điều gì. Quả là không thừa khi nhấn mạnh rằng chúng ta phải hiểu được bản chất của thiết kế thí nghiệm và xử lý số liệu trước khi ứng dụng công nghệ thông tin. Tất cả các kiến thức về bản chất của thiết kế thí nghiệm và xử lý số liệu được đề cập trong học phần phương pháp thí nghiệm. Trong phạm vi của học phần này chúng tôi đề cập đến việc vận dụng phầm mềm SPSS trong xử lý số liệu. Phầm mềm SPSS là một phần mềm rất thông dụng. Chúng ta có thể có được phầm mềm này bất kỳ ở đâu. Việc xử dụng phần mềm này rất đơn giản, nhưng lại rất có hiệu quả. Có thể nói rằng phần mềm SPSS giải quyết được gần như toàn bộ các yêu cầu của xử lý số liệu trong các nghiên cứu trong nông nghiệp. Mặt khác phần mềm SPSS cũng có ưu thế xử lý các tập hợp số liệu khá lớn như số liệu điều tra. Do vậy, chúng ta có thể hoàn toàn sử dụng phần mềm SPSS cho xử lý số liệu thí nghiệm và số liệu điều tra. Một ưu điểm khác nữa là kết quả đầu ra của xử lý số liệu bằng phần mềm SPSS có thể được thao tác và chế bản một cách dễ dàng trên các phần mềm khác như Microsoft Offices. Điều này rất thuận lợi khi chúng ta sử dụng kết quả xử lý số liệu cho việc hoàn thành bài báo hay luận văn. Hơn thế nữa cách sử dụng phầm mềm SPSS cũng tương tự như một số phầm mềm thông dụng khác như GENSTAT, MINITAB, vv. Do vậy, quả là khiêm tốn để nói rằng nếu chúng ta có thể sử dụng được phần mềm SPSS thì chúng ta có thể sử dụng các phần mềm tin học thống kê khác. Với mục đích giúp cho đối tượng học bậc đại học có thể sử dụng phần mềm SPSS trong xử lý số liệu nghiên cứu, chúng tôi biên soạn nội dung học phần này và khi kết thúc chương này, hy vọng người đọc có thể thực hiện một số nội dung sau bằng phần mềm SPSS:  Nhập số liệu cho các loại thiết kế thí nghiệm khác nhau  Kiểm tra được số liệu và định hướng phân tích  Phân tích thống kê mô tả  Phân tích phương sai  Xử lý số liệu thí nghiệm một nhân tố 4  Áp dụng quy tắc ngẫu nhiên trong thiết kế thí nghiệm  Phân tích tương quan hồi quy BÀI I: NHẬP SỐ LIỆU Mấu chốt của xử lý số liệu bằng các phầm mềm tin học là nhập số liệu theo cách máy có thể hiểu được. Máy tính sẽ xử lý đúng nếu ta nhập số liệu đúng. Nhập và quản lý số liệu là một công đoạn quan trọng trong quá trình nghiên cứu. Cách thức nhập và quản lý số liệu đòi hỏi phải dễ hiễu đối với các thành viên trong và ngoài nhóm nghiên cứu. Hơn thể nữa, nhập và quản lý số liệu phải thuận lợi cho quá trình xử lý số liệu sau này. Để nhập số liệu chúng ta có thể có hai lựa chọn. Nhập số liệu trong phần mềm EXCEL sau đó mỗi khi xử lý số liệu thì nạp (import) số liệu vào phần mềm SPSS. Lựa chọn thứ 2 là nhập số liệu trực tiếp vào phần mềm SPSS. Mỗi cách nhập có những ưu điểm và nhược điểm của nó. Trong phạm vi của chương này chúng tôi giới thiệu sự lựa chọn thứ nhất, nhập và quản lý số liệu từ EXCEL. 1.1. Nguyên tắc của nhập số liệu Để có thể nhập số liệu chúng ta cần xác định rõ:  Đơn vị thí nghiệm của nghiên cứu  Số biến độc lập của nghiên cứu  Số biến phụ thuộc của nghiên cứu Để nhập số liệu đúng, cần tuyệt đối tuân theo các nguyên tắc sau đây:  Mỗi đơn vị thí nghiệm được nhập vào trong một hàng của worksheet excel. Tất cả các thông tin của mỗi đơn vị thí nghiệm phải đều được nằm cùng trong một hàng.  Hàng thứ nhất của worksheet excel là hàng tên biến (độc lập và phụ thuộc).  Mỗi biến độc lập hay biến phụ thuộc nằm trong một cột. Tất cả các thông tin về một biến phải được nằm trong một cột. Ngoài ra để mọi người đều có thể hiểu được tập hợp số liệu, nên dùng các chức năng phụ trợ khác trong excel để giải thích thêm về tập hợp số liệu. Ví dụ ta có thể dùng chức năng insert comment để chú thích các tên biến, đơn vị của biến cũng như chú thích các số liệu cần thiết. 1.2. Nhập số liệu trong trường hợp số liệu không phân nhóm/tổ Ví dụ 1. Một nhóm nghiên cứu đã tiến hành xác định năng suất lúa (kg/ha) tại 10 ô ruộng, kết quả thu được ở bảng 1. Hãy nhập số liệu để phân tích thống kê mô tả năng suất lúa. 5 Bảng 1. Năng suất lúa (kg/ha) ở 10 ô ruộng khác nhau STT Năng suất (kg/ha) STT Năng suất (kg/ha) 1 3.853 6 2.606 2 4.788 7 4.936 3 4.576 8 4.454 4 6.034 9 5.276 5 5.874 10 5.916 Chúng ta có thể nhập số liệu như sau: Hình 1: Nhập số liệu trong trường hợp số liệu không phân tổ 1.3. Nhập số liệu trong trường hợp số liệu phân tổ bởi một nhân tố Ví dụ 2. Một nhóm nghiên cứu đã tiến hành nghiên cứu ảnh hưởng của các mức phân bón đến năng suất lúa (kg/ha) trong một thí nghiệm được thiết kế theo kiểu CRD, kết quả thu được ở bảng 2. Hảy nhập số liệu để phân tích ảnh hưởng của các mức phân bón đến năng suất lúa. 6 Bảng 2. Số liệu từ thí nghiệm ảnh hưởng của mức phân bón đến năng suất lúa (kg/ha) Công thức phân bón Lặp lần 1 Lặp lần 2 Lặp lần 3 Lặp lần 4 N 0 3.853 2.606 3.144 2.894 N 1 4.788 4.936 4.562 4.608 N 2 4.576 4.454 4.884 3.924 N 3 6.034 5.276 5.906 5.652 N 4 5.874 5.916 5.984 5.518 Chúng ta có thể nhập số liệu như sau: Hình 2: Nhập số liệu trong trường hợp số liệu phân tổ bởi một nhân tố 1.4. Nhập số liệu trong trường hợp số liệu phân tổ bởi hai nhân tố Ví dụ 3. Một nhóm nghiên cứu đã tiến hành nghiên cứu ảnh hưởng của các mức đạm bón và giống lúa đến năng suất lúa (kg/ha) trong một thí nghiệm được thiết kế theo kiểu CRD, kết quả thu được ở bảng 3. Hảy nhập số liệu để phân tích ảnh hưởng của các mức phân bón và giống lúa đến năng suất lúa. 7 Bảng 3. Số liệu thu được từ thí nghiệm ảnh hưởng của mức đạm bón và giống lúa đến năng suất lúa (kg/ha) trong thí nghiệm thiết kế theo kiểu CRD Giống Phân bón Giống 1 (V1) Giống 2 (V2) Giống 3 (V3) Giống 4 (V4) N 0 3.853 2.606 3.144 2.894 N 1 4.788 4.936 4.562 4.608 N 2 4.576 4.454 4.884 3.924 N 3 6.034 5.276 5.906 5.652 N 4 5.874 5.916 5.984 5.518 Có thể nhập số liệu như sau: Hình 3: Nhập số liệu trong trường hợp số liệu phân tổ bởi hai nhân tố 1.5. Nhập số liệu trong các kiểu thiết kế thí nghiệ m có sự khống chế sự sai khác ban đầu Ví dụ 4. Một nhóm nghiên cứu đã tiến hành nghiên cứu ảnh hưởng của các mức đạm bón và giống lúa đến năng suất lúa (kg/ha) trong một thí nghiệm được thiết kế theo kiểu RCB, kết quả thu được ở bảng 4. Hãy nhập số liệu để phân tích ảnh hưởng của các mức đạm bón và giống đến năng suất lúa. 8 Bảng 4. Số liệu từ thí nghiệm ảnh hưởng của mức phân bón và giống lúa đến năng suất lúa (kg/ha) trong thí nghiệm thiết kế theo kiểu RCB Phân bón Giống V1 N 0 3,853 2,606 3,144 2,894 N 1 4,788 4,936 4,562 4,608 N 2 4,576 4,454 4,884 3,924 N 3 6,034 5,276 5,906 5,652 N 4 5,874 5,916 5,984 5,518 Giống V 2 N 0 2,846 3,794 4,108 3,444 N 1 4,956 5,128 4,150 4,991 N 2 5,928 5,698 5,810 4,308 N 3 5,664 5,362 6,458 5,474 N 4 5,458 5,546 5,786 5,932 Giống V 3, N 0 4,192 3,754 3,738 3,428 N 1 5,251 4,582 4,896 4,286 N 2 5,822 4,848 5,678 4,932 N 3 5,888 5,524 6,042 4,756 N 4 5,864 6,264 6,056 5,362 Đây là một thí nghiệm hai nhân tố: giống và mức phân bón. Thí nghiệm này được thiết kế theo kiểu RCB. Như vậy, xuất hiện thêm một yếu tố thứ 3, đó là yếu tố khối, dùng để khống chế sự sai khác ban đầu của các đơn vị thí nghiệm. Nếu có thể nhập số liệu của kiểu thiết kế thí nghiệm này, thì chúng ta sẽ có thể nhập được số liệu trong các kiểu thiết kế thí nghiệm khác như LS, SPLIT-PLOT và STRIP-PLOT. Trong phạm vi của chương trình đào tạo bậc đại học chúng tôi chỉ giới thiệu cách nhập số liệu của hai kiểu thiết kế thí nghiệm RCB và LS. Nguyên tắc cơ bản nhập số liệu trong các kiểu thiết kế thí nghiệm có sự khống chế sự sai khác ban đầu (RCB, LS, SPLIT-PLOT và STRIP-PLOT) là xem xét yếu tố khống chế như là một yếu tố thí nghiệm. Có nghĩa là mỗi một yếu tố khống chế sự sai khác cần một cột trong worksheet của excel. Chúng ta có thể nhập số liệu cho ví dụ 4 ở hình 4. Hình 4 trình bày cách nhập số liệu của 14 đơn vị thí nghiệm đầu. [...]... một số tiêu chí nào đó do chúng ta định ra 12 Hình 7 Kiể m tra số liệu bằng chức năng Filter Hình 8 Kiể m tra số liệu bằng chức năng Filter 13 2.2 Kiể m tra số liệ u bằng trình ứng dụng Box-plot hoặc Scatter Plot trong SPSS 3.2.1 Nạp số liệu từ EXCEL vào SPSS Sau khi đã nhập xong số liệu thì chúng ta có thể nạp số liệu vào SPSS để kiểm tra số liệu cũng như phân tích và xử lý số liệu Việc nạp số liệu vào... đại học chúng tôi đề cập đến cách phân tích số liệ u của 3 kiểu thiết kế thí nghiệ m cơ bản: Thiết kế thí nghiệ m ngẫu nhiên hoàn toàn (CRD), thiết kế thí nghiệm theo khối ngẫu nhiê n đầy đủ (RCB) và thiết kế thí nghiệ m hình vuông la tinh (LS hay LSD) Chúng tôi cũng chỉ giới thiệu phân tích số liệu của thí nghiệ m có một nhân tố Bản chất của ví dụ 14 là một thiết kế thí nghiệ m kiểu CRD Do vậy, trong. .. m khác như GENSTAT và MINITAB là “mỗi đơn vị thí nghiệm nằm trong một hàng, mỗi biến nằm trong một cột” BÀI 2 KIỂM TRA SỐ LIỆU VÀ ĐỊNH HƯỚNG PHÂN TÍCH Phân tích số liệu là việc là m rất đơn giản và nhanh chóng, do vậy chúng ta không cần thiết vội vàng phân tích số liệu Với các yêu cầu của một thí nghiệ m thông 10 thường trong nông nghiệp, phân tích số liệu có thể hoàn thành trong vài phút Tuy nhiê n,... file EXCEL chứa số liệu Ví dụ 9 Hãy nạp (input) số liệ u ở ví dụ 2 từ EXCEL vào SPSS Sau khi nạp số liệu chúng ta sẽ có kết quả như ở hình 10 14 Hình 10 Nạp số liệu vào SPSS và kết quả nạp số liệu 2.2.2 Kiểm tra số liệu bằng trình ứng dụng Box -plot hoặc Scatter- Plot trong SPSS Thực chất của kiểm tra số liệ u bằng trình ứng dụng Box-plot hoặc Scatter- Plot trong SPSS là vẽ đồ thị Box-Plot hoặc vẽ đồ thị... không kiểm tra số liệu một cách cẩn thận thì việc xử lý số liệ u có thể phải là m đi là m lại nhiều lầ n do sau khi hoàn thành xử lý số liệu, nhà nghiê n cứu có thể phát hiện một số số liệu chưa được nhập chính xác Tập hợp số liệu càng lớn bao nhiê u thì việc kiể m tra số liệ u càng quan trọng bấy nhiêu Mục đích cơ bản của việc kiể m tra số liệu là phát hiệ n ra các sai sót trong nhập số liệu và phát hiệ... Nhập số liệu trong trường hợp số liệ u phân tổ bởi ha i nhâ n tố theo kiểu thiết kế RCB Ví dụ 5 Một nhó m nghiê n cứu đã tiến hành nghiên cứu năng suất (tấn/ha) của 3 giống ngô la i A, B, D và giống đối chứng C, trong một thiết kế thí nghiệm kiểu LS, kết quả thu được ở bảng 5 Hãy nhập số liệ u để so sánh năng suất của các giống ngô Bảng 5 Năng suất (tấn/ha) của các giống ngô A, B, D và C trong thí nghiệm. .. Nạp số liệu vào SPSS  Bước 2: Vào trình ứng dụng General Linear Model (hình 16)  Bước 3 : Khai báo biến phụ thuộc (dependent variables) và biến độc lập (fixed factors)(hình 16)  Bước 4 : Vào trình ứng dụng thống kê mô tả trong option (hình 16) Trình ứng dụng thống kê mô tả trong option không cho phép chúng ta lựa chọn các tham số thống kê mô tả cần tính toán mà luôn luô n cho kết quả mặc định Kết... sai số chuẩn của số trung bình (sai số của số trung bình) Trong nội dung của chương này chúng tôi sẽ đề cập đến cách phân tích các tha m số đó bằng trình ứng dụng descriptive statistics Trong SPSS có rất nhiều trình ứng dụng có 19 thể tính toán được các tha m số thống kê mô tả hay nó i cách khác trình ứng dụng descriptive statistics có thể được thực hiệ n từ các trình ứng dụng khác, ví dụ từ trình ứng. .. tích số liệu từ thí nghiệ m kiể u LSD Ví dụ 16 Một nhó m nghiên cứu quan tâm đến ảnh hưởng của các giống ngô đến năng suất Thí nghiệm được thiết kế theo kiể u LSD và kết quả thí nghiệ m được trình bày ở bảng 16 Hãy phân tích kết quả và chứng minh giả thuyết H0 về không có ảnh hưởng của giố ng ngô đến năng suất ngô Trước khi phân tích chúng ta phả i xác định mô hình phân tíc h Với kiểu thiết kế thí nghiệ... tích số liệ u của thiết kế thí nghiệm RCB và LSD Chúng tôi cũng chỉ giới thiệu kỹ thuật phân tích để kiể m tra giả thuyết H0 , những nội dung đi kèm của phân tích số liệ u của các kiểu thiết kế thí nghiệ m như phân tích thống kê mô tả và phân tích post hoc, hoàn toàn tương tự như nội dung trong phần 4, như đã trình bày ở trên 5.1 Nguyên tắc của phân tích số liệ u của thiế t kế thí nghiệ m RCB và LSD . bản chất của thiết kế thí nghiệm và xử lý số liệu trước khi ứng dụng công nghệ thông tin. Tất cả các kiến thức về bản chất của thiết kế thí nghiệm và xử lý số liệu được đề cập trong học phần phương. KIỂU THIẾT KẾ THÍ NGHIỆM KHÁC NHAU 28 5.1. Nguyên tắc của phân tích số liệu của thiết kế thí nghiệm RCB và LSD 28 5.2. Phân tích số liệu từ thí nghiệm kiểu RCB 29 5.3. Phân tích số liệu từ thí. BÀI I: NHẬP SỐ LIỆU Mấu chốt của xử lý số liệu bằng các phầm mềm tin học là nhập số liệu theo cách máy có thể hiểu được. Máy tính sẽ xử lý đúng nếu ta nhập số liệu đúng. Nhập và quản lý số

Ngày đăng: 05/07/2014, 23:40

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan