1. Trang chủ
  2. » Nông - Lâm - Ngư

tin học ứng dụng trong ngành nông nghiệp

506 519 1
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 506
Dung lượng 19,1 MB

Nội dung

Tài liệu " Tin học ứng dụng trong ngành nông nghiệp " được biên soạn để hướng tới trước hết là cán bộ giảng dạy, sinh viên các trường đại học và cao đằng nông nghiệp những năm cuối, học viên cao học và tiến sỹ, những người có thể tìm tháy ở đây các phương pháp, công cụ cho việc thực hiện các đề tài nghiên cứu khoa học, hay các đề tài luận văn tốt nghiệp cho mình

Trang 1

PGS TS NGUYEN HAI THANH (Chủ biên)

Trang 2

PGS.TS NGUYỄN HẢI THANH

(CHU BIEN)

TIN HOC UNG DUNG TRONG NGANH NONG NGHIEP

Trang 3

CHU BIEN

PGS.TS NGUYEN HAI THANH Ngành toán-tin ứng dụng

Trưởng khoa, Khoa Sư phạm Kỹ thuật Trường Đại học Nông nghiệp I Hà Nội

TAP THE TAC GIA

TS, NGUYEN QUỐC CHỈNH THS NGO TRÍ DƯƠNG

THS LE THI GIANG KS DANG XUAN HA

THS PHAM VAN HUNG THS MAN QUANG HUY

THs DO THI MG

Trang 4

LOI NOI DAU

Vấn đê đào tạo, nghiên cứu và ứng dụng tin học có một tâm quan trọng đặc biệt cho việc phát triển nhân lực, khoa học — kĩ thuật và kinh tế~— xã hội Việt nam là một nước có trên 72% dân số làm nông nghiệp, vì vậy ứng dụng tin học và công nghệ thông tin có một vai trò to lớn trong công cuộc cơng nghiệp hố - hiện đại hố nơng nghiệp và nông thôn Các lĩnh vực wu tién phát triển trong giai đoạn hiện nay bao gâm nông nghiệp, công nghệ sinh hoc, tự động hoá và tin học - công nghệ thông tin Tất cả các lĩnh vực này liên quan với nhau rất chặt chế trong sự phát triển của đất nước ta và đặc biệt là trong sự nghiệp xây dựng một nên nông nghiệp phái triển bên vững, một nông thôn Việt nam giầu có và tươi đẹp Chỉ thị 58-CT/TW của Ban chấp hành Trung tương về đẩy mạnh và phát triển công nghệ thông tin phục vụ sự nghiệp cơng nghiệp hố, hiện đại hoá đất nước khẳng định: "Cần khẩn trương xây dựng các chương trình ứng dụng và phát triển công nghệ thông tin, kết hợp công nghệ thông tin với công nghệ sinh học để phục vụ cơng nghiệp hố, hiện đại hố nơng nghiệp và nơng thôn, đặc biệt góp phần xoá đói giảm nghèo và thúc đẩy phát triển vùng sâu, vùng xa”, tiếp tục “đẩy mạnh việc đào tạo và sử dụng nguồn nhân lực cho ứng dụng và phát triển công nghệ thông tin” `

Với vai trò một trường đại học được thành lập sớm nhất trong các trường đại học khối nông - lâm - ngư nghiệp, với sự nhận thức những tiêm năng to lớn mà tin học và công nghệ thong tin có thể mang lại, Trường Đại học Nông nghiệp I Hà Nội đang phấn đấu dạt chất lượng đào tạo tin học đại cương và tín học chuyên ngành ngày càng cao hơn, tăng cường ứng dụng tin học và công nghệ thông tin trong giảng dạy, triển khai các dé tài nghiên cứu khoa học ứng dụng toán — tin và công nghệ thông tìn trong lĩnh vực nông nghiệp Khi điểm lại một số nết về ứng dụng tin hoc trong đào tạo và nghiên cứu khoa học nông nghiệp tại Trường Đại học Nông nghiệp I Hà Nội, có thể ghỉ nhận một sự kiện đặc biệt: đây chính là nơi tiếp nhận chiếc máy tính thứ ba trên miễn Bắc (do Cuba trao tặng năm 1981), là một trong các địa điểm được trang bị trung tâm máy tính hiện dại sớm nhất trên miễn Bắc (tháng 8 năm 1982)

Trang 5

các viện nghiên cứu khoa học trong lĩnh vực nông — lam — ng nghiệp, Trường Đại học Nông nghiệp | Ha Noi đang triển khai nhiễu ứng dụng của tin học trong đào tạo và nghiên cứu khoa học như:

- Ứng dụng các phần mêm thống kê sẵn có, từ những phân mém thong dụng như Excel đến chương trình tính toán thống kê lớn và ứng dụng chuyên sân, vào thống kê sinh học — nông nghiệp như SPSS, Minitab, Genstat, Irristat, Statgraf

- Sử dung cde phan mém Frontier, Limdep, Lingo phục vụ phân tích các số liệu kinh tế nông nghiệp và khuyến nông và nhiều phần mềm chuyên dụng khác cho các lĩnh vực chọn tạo giống, sinh thái môi trường

- Thiết lập mô hình, xây dựng quy trình tính toán, thiết kế và cài đặt hệ chương trình máy tính cho các mô hình tối ưu trợ giúp quyết định, các mô hình điều khiển nhằm giải quyết các vấn đề phát sinh trong quy hoạch sử dụng đất, quy hoạch vùng kinh tế nông nghiệp và kinh tế nơng hộ tự động hố và thiết kế máy nông nghiệp

- Ung dung công nghé GIS (Geographical Information System), mét công nghệ kết hợp giữa công nghệ thông tít và công nghệ viễn thám, trong xây dựng hệ cơ sở dữ liệu và quản lý tài nguyên nông nghiệp

- Bước đâu nghiên cứu áp dụng công nghệ tìn sinh học trong chọn tạo giống, di truyền học vào lĩnh vực trồng trọt, chăn nuôi

- Khai thắc mạng thông tìn nội bộ, thư viện điện tử và lmernet nhằm xây dựng và quản lý hệ thống cơ sở đữ liệu về thông tin khoa học nông nghiệp phục vụ đào tạo và nghiên cứu, Ir' jển khai các đề tài nghiên cứu và ứng dụng tin học trong đổi mới phương pháp dạy và học

- Đẩy mạnh chất lượng đào tạo sinh viên ngành Tin học thông qua việc từng bước xây dựng hệ giáo trình chuẩn chuyên ngành định hướng vào các để tài ứng dung tin hoc trong nông nghiệp, xây dựng các giáo trình tim học chuyên ngành cho các chuyên ngành nông nghiệp ở tất cả các bậc học

Cuốn sách này được viết ra với những mục đích cụ thể Cuốn sách bao gồm một số công trình và đề tài nghiên cửa khoa học ở nhiêu mức độ khác nhan được tiến hành trong thời gian gân đây trong việc giảng dạy và ứng dụng tin học trong lĩnh vực nông nghiệp Tuy chưa thể nào bao quát hết các vấn đề ứng dụng tin học trong nông nghiệp, nhưng đây có thể là một số hướng nghiên cứu cân được tiếp tục được đẩy mạnh trong thời gian tới trong

Trang 6

các trường đại học, cao đẳng, các viện nghiên cứu khoa học và ứng dụng trong các lĩnh vực nông nghiệp

Cuốn sách này trước hết hướng tới đối tượng là cần bộ giảng dạy, sinh viên các trường dại học và cao đẳng nông nghiệp ở những năm cuối, học viên cao học và tiến sỹ, những người có thể tìm thấy ở đây các phương pháp, công cụ cho việc thực hiện các đê tải nghiên cứu khoa học hay các để tài luận văn tốt nghiệp của mình Một số chương trong cuốn sách có thé dua vào giảng dạy trong các môn về tin học ứng dụng cho các chuyên ngành nông nghiệp khác nhau Sinh viên ngành Tin học của các trường dại học và cao đẳng nông nghiệp trong cá nước cũng có thể tìm được trong cuốn sách những kiến thức cơ bản, những gợi ý quan trọng, một mặt có tính chất định hướng, mặt khác lại rất cụ thể cho công việc học tập và thực tập nghiên cứu khoa học của mình Tuy nhiên, đối tượng bạn đọc này hoàn toàn có thể nhận thấy rằng cần phải hết sức cố gắng mới có thể trả lời được câu hỏi “tại sao ” (đấy chính là một trong những mục tiêu ngành học của các bạn) cũng nh phải hết sức kiên trì để biết cách “làm thế nào ”,

Tập thể tác giả cuốn sách này được phân công bién soan nhu sau: - Chương I Xử lý số liện trong thống kê sinh học và nông nghiệp, gầm ba phan Phan I va II do ThS Dé Thi Mo va PGS TS Nguyễn Hải Thanh biên soạn TS Nguyễn Quốc Chỉnh va ThS Phạm Văn Hùng viết phdn Il

- Chương ÏI Một số mô hình và phần mêm tối wu ứng dụng trong nông nghiệp, do PGS.TS Nguyễn Hải Thanh biên soạn,

- Chương HI Hệ thống thong tin dia lý trong quản lý và đánh giá tài nguyên dat nông nghiệp, được viết bởi ThS Mẫn Quang Huy

- Chương IV Viễn thám trong nông nghiệp, do ThS Trần Quốc Vinh và Thế Lê Thị Giang cùng chung viết

- Chương V, Ứng dung tin hoc trong tự động hoá một quá trình nông nghiệp, do ThŠ Ngô Trí Dương đảm nhiệm

Chương VI, Tìn sinh học cải thiện di truyền nông nghiệp, do TS Nguyễn Hồng Nguyên viết

- Chuong VII Internet va cde dich vu thông tin nông nghiệp, do KS Đặng Xuân Hà biên soạn

Trang 7

thành nhiệm vụ của mình và đạt được mục dich chung của cuốn sách, cế gắng viết một cách dễ hiểu, ngắn gọn những vấn đê mình đã từng làm trong công tác nghiên cứu khoa học và dạy học của mình Với quan niệm “công việc đào tạo và nghiên cứu khoa học là công việc của cả một đột ngũ ” và với mong muốn “phát triển các ứng dụng của tín học trong nông nghiệp”, tập thể tác giả luôn coi trọng việc trao đổi ý kiến với người đọc trực tiếp hoặc qua e-mail va chia sé nhiing tai liệu chuyên ngành Những vấn dé dat ra trong cuốn sách mới chỉ là phần nổi lên của một ting bang và chắc ai cũng muốn nhìn rõ nó hơn

Tuy nhiên, lần đâu tiên các vấn dé img dung tin học trong nông nghiệp được viết một cách tổng hợp, chắc cuốn sách còn có khiếm khuyết Chúng tôi rất mong nhận được sự đóng góp Ý kiến của bạn đọc, của các đông nghiệp, các nhà nghiên cứu, các thày cô giáo và các sinh viên để nâng cao hơn nữa chất lượng của cuốn sách này

Trang 8

MUC LUC

LOI NOI DAU MUC LUC

CHƯƠNG L XU LY SO LIEU TRONG THONG KE

SINH HOC VA NONG NGHIEP

L XULY 86 LIEU THONG KE SINH HOC TRONG EXCEL 1 Thống kê mô ta 2 Tổ chức đồ 2.1 Tạo miễn phân tổ 2.2 Vẽ tổ chức đỗ 3 Tính hệ số tương quan và tìm phương trình hồi qui 3.1 Tính hệ số tương quan

3.2 Tìm phương trình hôi q4wy 4 Phân tích phương sai

4.1 Phân tích phương sai một nhân tố

4.2 Phân tích phương sai hai nhân tố không tương tác 4.3 Phân tích phương sai hai nhân tố tương tác 5 So sánh hai mẫu

5.1 So sánh hai mẫu độc lập khi biết phương sai ơi và

ki

5.2 So sánh hai mẫu kiểu cặp đôi

5.3 So sánh hai mẫu độc lập với giả thuyết hai phương sai bằng nhau

5.4, So sánh hai mẫu độc lập với giả thuyết hai phương sai khác nhau

1L THIẾT KẾ THÍ NGHIỆM VÀ PHÂN TÍCH THỐNG KÊ NHIỀU CHIỀU TRONG MINITAB

1 Giới thiệu phần mềm Minitab

1.1 Các cửa sổ của Minitab

Trang 9

2.1 M6 hinh hoan todn ngdéu nhién 2.2 Mô hình khối hoàn toàn ngẫu nhiên 2.3 Thiết kế nhân tố 3 Phân tích thống kê nhiều chiều 3.1 Phân tích thành phần chính 3.2 Phân tích nhân tố 3.3 Phân loại 3.4 Phan cum dữ liệu 3.5 Phân cụm các biến 3.6 Phân cụm K-tring bình

Ul UNG DUNG PHAN MEM FRONTIER 4.1 VÀ LIMDEP

TRONG PHAN TICH DULIBU KINH TE NONG NGHIEP

1 Hàm cực biên và ứng dụng trong phân tích kinh tế 1.1 Sơ lược về hàm cực biên

1⁄2 Phân tích hiệu quả kinh tế và đường cực biên 1.3 Các loại hàm cực biên

2 Các mô hình hàm sản xuất cực biên 2.1 Mô hình hàm cực biên xác định 2.2 Mô hình hàm cực biên ngẫu nhiên

2.3 Mô hình hàm cực biên dựa trên số liệu kết hợp 2.4 Một số dạng hàm sản xuất cơ bản

3 Một số phần mềm chạy hàm cực biên 3.1 Phdn mém Frontier 4.1

3.2 Chuong trinh Limdep

TÀI LIỆU THAM KHẢO CHUONG I

CHƯƠNG II MỘT SỐ MƠ HÌNH VÀ PHẦN MỀM

TOI UU UNG DUNG TRONG NONG NGHIEP

I MO HINH QUY HOACH DON MUC TIEU

1 Mô hình tối ưu một mục tiêu (tuyến tính và phi tuyến)

2 Các ví dụ minh hoạ bài toán tối ưu một mục tiêu 2.1 Bài toán quy hoạch sử dụng đất

2.2 Bài toán tối ưu hod gid tri sdn xuất 2.3 Bài toán tối ưu thông số sàng phân loại

Trang 10

2 Các khái niệm cơ bản của bài toán tối ưu đa mục tiêu 123 3 Mô hình quy hoạch đa mục tiêu trong môi trường 124 mờ/ngẫu nhiên

4 Các ví dụ minh hoạ bài toán quy hoạch đa mục tiêu 126 4.1 Bài toán xác định cơ cấu cây trồng 126 4.2 Bài toán đánh giá hiệu quả sử dụng đất và lao 137 động

4.3 Bài toán thiết kế Trục máy 139

4.4 Tối tì hoá kết quả và hiệu quả kinh tế chân nuôi 141 cá

II HƯỚNG DẪN SỬ DỤNG MỘT S6 PHAN MEM TOI UU 145 1 Giải bài toán quy hoạch tuyến tính đơn mục tiêu trong 145 Excel 2 Giải bài toán quy hoạch tuyến tính và phi tuyến đơn mục 149 tiêu bằng phần mém Lingo 3 Giải,bài toán quy hoạch phi tuyến đơn mục tiêu bằng 151 phần mềm RST2NAU 3.1, Giới thiệu phân mêm RST2ANU 15! 3.2 Thuật giải 152 3.3 Xây dựng phần mêm 155 3.4 Hướng dẫn sử dụng 158 4 Giải bài toán quy hoạch tính tuyến đa mục tiêu bằng 162 phần mềm MULTIOPT

4.1 Giới thiệu phương pháp giải bài toán tối uu da 162

muc tiêu tuyên tỉnh 4.2 Thuật giải 163 4.3 Xây dựng phần mềm MULTIOPT 164 4.4 Hướng dẫn sử dụng 164 5 Giải bài toán quy hoạch phi tuyến da mục tiêu bằng phần 169 mềm PRELIME 5.1 Giới thiệu phương pháp giải quyết bài toán quy 169 hoạch da mục tiêu

5.2 Thuật giải tương tác lặp 181

5.3 Xây dung phdn mém PRELIME 183

5.4 Hướng dẫn sử dụng 184

Trang 11

1 Áp dụng các mô hình tối ưu trong nông nghiệp

2 Nghiên cứu áp dụng và đề xuất các phương pháp tối ưu 3 Xây dựng các phần mềm tối tru

4 Xây dựng hệ hỗ trợ ra quyết định cài đặt trên mạng máy tính

TÀI LIỆU THAM KHẢO CHƯƠNG II

CHƯƠNG IIL HE THONG THONG TIN BIA LY VA UNG DUNG TRONG DANH GIA TAI NGUYEN DAT

NONG NGHIEP

1 HE THONG THONG TIN DIA LY

1 Khái niệm về hệ thống thông tin địa ly

2 Hệ thống thông tin địa lý và các hệ thống tương tự 2.1 Hệ về bản đô tự động AMS

2.2 Hệ quản trị cơ sở đữ liệu

3 Sự phát triển của hệ thống thông tin địa lý

3.1 Ảnh hưởng của các công nghệ đến sự phát triển của GIS 3.2 Các giai đoạn phái triển của hệ thống thông tin địa lý 3.3 Xu hướng phát triển của hệ thống thông tin địa lý hiện nay II CƠ SỞ DỮ LIỆU TRONG CÁC HỆ THỐNG THÔNG TIN ĐỊA LÝ

1 Vai trò của cơ sở dữ liệu trong hệ thống thông tin địa lý 2 Đặc trưng của cơ sở dữ liệu không gian và cấu trúc dữ liệu trong GIS

2.1 Đặc trưng của dữ liệu không gian 2.2 Cấu trúc dữ liệu trong GIS

2.3 Mô hình chông ghép bản đồ trong GIS

2.4 Cấn trúc dữ liệu và đặc tinh cla ban dé trong GIS 3 Mô hình cơ sở dữ liệu của hệ thống thông tin tài nguyên đất

3.1 Thông tin đâu vào 3.2 Xử lý dữ liệu 3.3 Thông tin đầu ra

Trang 12

4.1 Trên thế giới và trong khu vực

4.2 Nghiên cứu ứng dụng GIS trong danh giá tài nguyên đất ở Việt Nam

4.3 Ứng dụng GIS và khả năng tiếp cận II GIỚI THIỆU MỘT SỐ PHẦN MỀM GIS

1, MicroStation GeoGraphics 2 Phân mềm ArcInfo/Maplnf

3 Phần mềm Arcview

Iv XAY DUNG QUY TRINH CONG NGHE UNG DUNG GIS QUANLY DU LIEU TAI NGUYEN DAT

1, Xây dựng hệ thông tin quan ly tài nguyên đất

2 Mô hình áp dụng xây dựng bản đồ đơn vị đất dai huyện Yên Chau

3 Xây dựng cơ sở dữ liệu thông tin bảng đồ chuyên để 3.1 Cơ sở đữ liệu thông tin bản đô đất

3.2 Cơ sở dữ liệu thông tin bản đô độ đốc

3.3 Cơ sở đữ liệu thông tin bản đồ độ dày tầng đất 3.4 Cơ sở đữ liệu thông tin bản dé thành phân cơ giới 3.5 Cơ sở dữ liệu thông tin bản dé chế độ tưới

4 Mô hình chồng xếp cơ sở dữ liệu bản đồ đơn tính trên GIS

3 Đánh giá nhận xét quy trình ứng dụng GIS quản lý tài nguyên đất

TÀI LIỆU THAM KHẢO CHƯƠNG III CHƯƠNG IV VIỄN THÁM TRONG NÔNG NGHIỆP

Trang 13

3 Các vệ tinh viễn thám thông dụng trong nông nghiệp ở Việt Nam 3.1 Vệ tỉnh Landsat 3.2 Vệ tỉnh Spot 3.3 Vé tinh Terra 4 Đặc điểm phản xạ phổ các đối tượng tự nhiên 4.1 Bức xạ điện từ 4.2 Sự biến đổi năng lượng mặt trời trong môi Irường khí quyển

4.3 Đặc điểm phản xạ phổ của các đối tượng tự nhiên 5, Giải đoán ảnh viễn thám

5.1 Hiệu chỉnh ảnh

5.2 Tăng cường chất lượng ảnh và chiết tách đặc tính 5.3 Giải đoán ảnh viễn thám

5.4 Đánh giá độ chính xác bản đồ sau giải doán

II MỘT SỐ MƠ HÌNH VIỄN THÁM ỨNG DỰNG

1, Viễn thám trong nghiên cứu sử dụng đất và lớp phủ bể

mặt

2 Viễn thám trong điều tra và thành lập bản đồ đất 3, Nghiên cứu viễn thám trong khí tượng thuỷ văn 4 Viễn thám trong quản lý cây trồng

5 Viễn thám trong nghiên cứu môi trường 6 Viễn thám trong nghiên cứu cảnh quan

Ill UNG DUNG CÔNG NGHỆ VIỄN THÁM TRONG VIỆC TÌM HIỂU SỰ THAY ĐỔI SỬ DỤNG ĐẤT

1 Dùng phương pháp giải đoán ảnh số tìm hiểu sự thay đổi

sử dụng đất

1.1, Phương pháp nghiên cứu 1.2 Kết quả nghiên cứu 1.3 Kết luận

2 Dùng phương pháp giải đoán ảnh bằng mắt thường để tìm

Trang 14

CHUONG V UNG DUNG TIN HOC TRONG TU DONG

HOA MOT QUA TRINH SAN XUẤT NÔNG NGHIỆP

1 VAL TRÒ CỦA TỰ ĐỘNG HOÁ TRONG SẢN XUẤT NÔNG NGHIỆP

1 Mối quan hệ giữa tin học và tự động hoá 2 Vai trò của tự động hoá trong sản xuất và đời sống

3 Ứng dụng tự động hoá trong một số lĩnh vực sản xuất

nông nghiệp

IL XÂY DỰNG CẤU TRÚC HỆ THỐNG TƯỚI TỰ ĐỘNG

1 Chế độ tưới nước cho cây rau sạch

1.1, Đất, nước và cây trồng

12 Điều kiện để sản xuất cây rat sạch

1.3 Xác định nhu cdu HƯỚC tưới 1.4 Xác định thời gian tưới nước

2 Phương pháp và kỹ thuật tưới nước cho cây rau sạch 2.1 Khái niệm chung

2.2 Kỹ thuật tưới phún mua

HL XÂY DỰNG THUẬT TOÁN TƯỚI TỰ ĐỘNG MƠ HÌNH MỜ MAMDANI 1 Mơ hình mờ Mamdani 2 Thuật toán điều khiển tưới tự động trên cơ sở mô hình mờ Mamdani 3 Mô phỏng hệ thống tưới bằng phần mêm MATLAB 4, Đánh giá kết quả

Iv THIẾT KẾ HỆ THỐNG ĐIỂU KHIỂN TƯỚI TỰ ĐỘNG

QUÁ TRÌNH SẢN XUẤT RAU SẠCH

1 Lựa chọn thiết bị cho hệ thống tưới tự động 1.1 Chọn các loại thiết bị đo

1.2 Chọn thiết bị cho hệ thống tưới phun mua 1.3 Chọn thiết bị điều khiển

14 Sơ đô tổng thể của hệ thống tưới phun mua 2 Cấu trúc chương trình điêu khiển hệ thống tưới tự động

Trang 15

3 Lập trình có cấu trúc chương trình điều khiển hệ thống tưới tự động,

3.1 Sơ đồ cấu trúc

3.2 Viết chương trình điều khiển chế độ tới tự động

TÀI LIỆU THAM KHẢO CHƯƠNG V

CHUONG VI TIN SINH HỌC CẢI THIỆN DI TRUYỀN NÔNG NGHIỆP

I VAI TRÒ CỦA TIN SINH HỌC TRONG NGHIÊN CỨU

GENE VÀ CẤU TRÚC PROTEIN

1 Giới thiệu về công nghệ tin sinh học và sinh học phân tử 1.1 Một số vấn để của công nghệ tin sinh học

1.2 Sơ lược về sinh học phân tử 2 Sự sắp xép so sanh gene

2.1 Sắp xếp trình tự từng cắp gene 2.2 Sắp xếp so sánh các hé gene 2.3 Sắp xếp trình tự Ẳa gene 3 Nối kết và phân tich gene

3.1 Nối kết đoạn DNA 3.2 Thiết kế DNA môi

3.3 Sự đa dạng nucleotide đơn 3.4 Phát hiện sự lặp lại trình tự đơn 3.5 Phân tích biểu hiện gene

IL KHÁI THÁC CƠ SỞ DỮ LIỆU GENE VÀ ỨNG DỤNG TRONG NÔNG NGHIỆP

1 Một số nguyên tắc xây đựng và khai thác cơ sở đữ liệu gene

1.1 Nguyên tắc xây dưng

1.2 Khai thác dữ liệu từ các nguồn khác nhau 2 Một số hệ thống dữ liệu gene ứng dụng trong nông

nghiệp

2.1 Hệ thống đữ liệu gene các cây trồng chính 2.2 Các hệ thống cơ sở dữ liệu hệ gene động vật II TIN SINH HỌC TRONG DI TRUYỀN NÔNG NGHIỆP

Trang 16

1.1 Gene đánh đấu di truyền 1.2 Phả hệ

1.3 Khoảng cách đi truyền 1.4 Phát hiện liên kết 1.5 Phân tích marker

2 Các phương pháp tin sinh học tìm kiếm gene 2.1 Phương pháp so sánh giải mã gene 2.2 Phân tích mất cân bằng liên kết 2.3 Mô hình thành phần phương sai

2.4 Kết hợp phân tích liên kết và mất cân bằng liên kết (LDLA)

2.5 Thiết kế thí nghiệm LDLA

3 Xây dựng các hệ thống đánh giá di truyền 3.1 Giới thiệu

3.2 Tóm lược di truyền số lượng 3.3 Ước tính các thông số di truyền

3.4 Ước tính giá trị giống (giá trị di truyền)

IV KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU

TÀI LIỆU THAM KHẢO CHƯƠNG VI

CHƯƠNG VỊI INTERNET VÀ CÁC DỊCH VỤ

THÔNG TIN NÔNG NGHIỆP

1.INTERNET VÀ CÁC DỊCH VỤ INTERNET 1 Internet

2 World Wide Web va thu dién tir 2.1 World Wide Web

2.2 Thư điện tử

3 Dịch vụ thông tin trên Internet

Il THÔNG TIN, DẠNG THỨC VÀ NGUỒN THÔNG TIN

1 Thông tin và tri thức 2 Sự bùng nổ thông tin

3 Các dạng thức và nguồn thông tin 4 Báo chí định kỳ

5: Các nguồn tham khảo

Trang 17

Ill KHAI THAC DỊCH VỤ CUNG CAP THONG TIN 463 1 Cơ sở đữ liệu tham khảo 463

2 Danh mục tra cứu thư viện trực tuyến 466

3 Chỉ mục báo chí tóm tắt 469

4 Các kỹ năng tìm kiếm nâng cao 472

3 Mô-tơ tìm kiếm và danh bạ Web 424

3.1 Mô-tơ tìm kiếm 474

5.2 Danh bạ Web 478

6 Đánh giá nguồn tài liệu trên Internet 478

6.1 Đánh giá bên ngoài 479

6.2 Đánh giá bên trong 480

IV MOT SO DICH VU THONG TIN NONG NGHIEP 481

1 Cơ sở dữ liệu AGRICOLA 482

2 Một số dịch vụ thông tin của tổ chức FAO 485

3 Các cơ sở đữ liệu khác 490

V XÂY DỰNG DỊCH VỤ THÔNG TIN NƠNG NGHIỆP 494

1 Ngơn ngữ HTML 494

2 Cơ sở đữ liệu 496

3 Sơ lược về thiết kế và lập trình Web 498 4 Triển khai dịch vụ thông tin nông nghiệp 500

TAI LIEU THAM KHẢO CHUGNG VII 502

Trang 18

CHUONG I

XỬ LÝ SỐ LIỆU TRONG THỐNG KÊ SINH HỌC

VÀ NÔNG NGHIỆP

1 XỦ LÝ SỐ LIÊU THỐNG KÊ SINH HỌC TRONG EXCEL

Phân mềm Excel cho phép phân tích dữ liệu nói chung, dữ liệu sinh học và nông nghiệp nói riêng, một cách khá hiệu quả thông qua việc sử dụng menu Tools> Data Analysis (nếu không có mục này thì chon Tools> Add-in > Analysis ToolPak dé cài đặt thêm) Sau đây là một số công cụ xử lý số liệu thống kê mà Excel cung cấp

1 Thống kê mô tả

Thống kê mô tả cho phép tính các số đặc trưng mẫu/ các giá trị thống kê mẫu như trung bình, độ lệch chuẩn, sai số chuẩn, trung vị, mode Số liệu tính toán được bố trí theo cột hoặc theo dòng

4 Các bước thực hiện trong Excel

Chọn Tools>Data Analysis>Descriptive Statistics, va khai báo các mục sau trong hộp thoại:

- Input range: mién dit liéu kể cả nhãn - Grouped by: Column (sé6 ligu theo cét)

- Labels in first row ; Đánh đấu Ý vào ô này nếu có nhãn ở dòng đầu - Confidence level for mean: 95% (d6 tin cay 95%)

- K-th largest: 1 (1 Số lớn nhất, 2 số lớn nhì ) - K-th smallest: 1 (1 Số nhỏ nhất, 2 số nhỏ nhì ) - Output range: mién ra

Trang 19

Ví dụ 1 Khảo sát về các đặc tính của lúa ta thu được bốn cột số liệu: dài bông (cm), P1000 (trọng lượng 1000 hạt), số bông, năng suất Số liệu được bố trí như trong hình I.I

Chon Tools>Data Analysis>Descriptive Statistics, sau dé khai béo hộp thoại (xem hình I.1) 18

Hình I.1 Bảng số liệu khảo sát về lúa và khai báo hộp thoại

Kết quả thu được cho trong hình 1.2

Dài bóng PHÔ0— bóng —— Năngất

‘Mean (rung binh) 264 Mean 244Mean l6l6Man 41 šanarl Eror (gi số chu) 0.25 Standan 0.49 Standard 2.571 Sandard 0.094 123 | Median (rung ¥) 26Medin 25Medan 165 Medan 4 {Mode (mode) 2% Mode 25Mode «16S Mode 4 ‘Standard Deviation (do lic chun) 0.99 Standan 1.88 Standard 9.956 Standard 0.364 Sampb Varance (phương sai miu) 0.97 Sample 3.54 Semple V 99.11 Sample 0.133 mosis (49 nhon) 081Kurosit -1Kmods 0.569 Kunosis 1.307

[52!Sum (og) 96S %6§m 2514Sum 6l9

Coun (65 quan st) SCom | Com | Com 15

0.06 Skewne -0.3 Skewness 1.346 Skewnes 1042 3Range 6 Range 3lRang 14 25 21Minimur 157 Minimn 36 28 Maxim 27 Maximun I88Maximu 5

WBlagest 2 Lages(l 188 largest 5

25 Smalls 21§maleg( 157 Smalest 36 055 ConBde 104 ConEden_ 5 513 ConBdet 0202

Trang 20

b Phân tích các kết quả thu được

Một số nhận xét sơ bộ trên các thống kê thu được như sau: ~ Mean cho ta giá trị trung bình của dãy số

~ Median cho giá trị điểm giữa của đãy số

Nếu 2 giá trị Mean và Median xấp xỉ nhau ta thì số liệu là cân đối Trong ví dụ 1 các cột số liệu là cân đối trừ cột “số bông” hơi bị lệch

- Phương sai mẫu hay độ lệch chuẩn mẫu cho ta biết độ phân tần của số liệu quanh giá trị trung bình, nếu các giá trị này càng nhỏ chứng tỏ số liệu càng tập trung

- Kurtosis đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay tù hơn đường mật độ chuẩn Nếu trong khoảng từ -2 đến 2 thì có thể coi số liệu xấp xỉ chuẩn

- Skewness đánh giá đường phân phối lệch trái hay lệch phải Nếu trong khoảng từ -2 đến 2 thì có thể coi số liệu cân đối gần như số liệu trong

phân phối chuẩn

- Confidence level được hiểu là nửa độ dài khoảng tin cậy Giả sử Confidence level là m thì khoảng tin cậy của trung bình tổng thể là: (mean- m , mean+m) Trong ví dụ 1, hình L2, ta có khoảng tin cậy 95% của “dài bông” là: (26.4- 0.55 , 26.4 +0.55), tức là (25.85, 26.95)

2 Tổ chức đồ

Tần số xuất hiện của số liệu trong các khoảng cách đều nhau cho phép phác hoạ biểu đỏ tân số, còn gọi là tổ chức đồ Để vẽ tổ chức đồ cần phải tiến hành phân tổ / nhóm số liệu

2.1 Tạo miên phân tổ

Để tiến hành phân tổ số liệu (tạo Bin), cần thực hiện các bước sau: - Dùng các hàm Min, Max để xác định giá trị nhỏ nhất và giá trị lớn nhất

- Định ra giá trị cận đưới và giá trị cận trên của miền phân tổ

- Ghi giá trị cận dưới vào 6 đầu của miền phân tổ và bơi đen tồn miền này

Trang 21

- Chon Edit > Fill > Series để khai báo các mục:

+ Trong muc Series in chon Columns (dit liéu theo cột)

+ Trong muc Type chon Linear (dit liéu tang theo cap s6 céng) + Trong Step value: nhap giá trị bước tăng

+ Trong Sfop value: nhập giá trị cận trên +OK

Vi du 2 Dựa trên 30 số liệu về chiều đài cá ta tạo miền phân tổ (Bin) như trên hình I.3 với miễn phân tổ từ ô D2 tới ô D12 (kể cả nhãn), giá trị cận dưới là 10, cận trên là 55, giá trị bước tăng 5 lcm -Tổ chức đẻ Hình I.3 Tạo miền Bin cho các số liệu về chiều dài cá 2.2 Vẽ tổ chức đô a Các bước thực hiện

Chọn 7ools> Dara Analysis> Histogram để khai báo các mục: - Input range: mién dit liéu

- Input Bin: mien phân tổ

~ Labels : nhãn ở dòng đầu nếu có - Output range: mién két qua

- Pareto: tin s6 sap xép giảm dân

Trang 22

- Chart output: biéu d6 - OK

Trang 23

c Phân tích kết quả

, ~ Tân số số liệu rơi vào từng khoảng được ghỉ ở cận trên của khoảng (Chẳng hạn, có 2 số liệu thuộc vào khoảng (10,15], vì vậy số 2 được ghi tương ứng với số 15 là cận trên)

- ~ Nhìn vào hình L5 ta có thể thấy trong khoảng nào số liệu xuất hiện nhiều nhất Ngoài ra, hình dạng của tổ chức đồ còn cho biết: dãy số liệu khảo sát được về chiều dài của cá có thể coi là tuân theo luật chuẩn

3 Tính hệ số tương quan và tìm phương trình hồi qui 3.1 Tính hệ số tương quan

Excel cho phép tính hệ số tương quan đơn giữa các biến sắp xếp thành một bảng gồm n hàng, n cột (mỗi cột là 1 biến)

a Các bước thực hiện

Chon Tools>Data Analysis>Correlation va khai báo các mục: - Input range: mién dữ liệu kể cả nhãn

- Grouped by: Column (số liệu theo cột)

- Labels in first row : Đánh dấu vào ô này nếu có nhãn ở đồng đầu - Output range: mién ra

- OK

Ví dụ 3 Để nghiên cứu mối tương quan giữa các đặc tính dài bông, số hạt, số bông với năng suất lúa, cần thực hiện các bước sau:

- Chon Tools>Data Analysis>Correlation - Khai báo các mục (xem hình I.6)

ST Tui thie civ in AT đế ÔN, C [epee bE Pel eo we ee 1

Trang 24

- Kết quả thu được trên bảng II

Bảng I.1 Kết quả tính hệ số tương quan Dài bông P1000 Số bông Năng suất Dai bong 1 P1000 0.29262 1 Số bông -0.06988 0.340772 1 Nang suat 0.37777 0.66632 0.661379 1 b Phân tích kết quả

- Hệ số tương quan của dòng và cột ghi ở ô giao giữa dòng và cột - Hệ số tương quan âm (< 0) thể hiện mối tương quan nghịch biến (chẳng hạn tương quan giữa “đài bông” và “số bông” là nghịch biến)

- Các hệ số tương quan có giá trị tuyệt đối xấp xỉ 0.75 trở lên thể hiện mối tương quan tuyến tính mạnh giữa hai biến (tương quan giữa “năng suất” và “P1000” có thể tạm coi là tương quan tuyến tính mạnh)

3.2 Tìm phương trình hồi quy

Excel cho phép tìm phương trình hồi quy tuyến tính đơn y= a+ bx và hổi quy tuyén tinh boi y= a, + a,x, + ä;X; + + a,x„ Các biến độc lập chứa trong n cột, biến phụ thuộc y để trong một cột, các giá trị tương ứng giữa biến độc lập và biến phụ thuộc được xếp trên cùng một hàng

a Các bước thực hiện

Chọn Tools>Data Analysis>Regression và khai báo các mục: - Input y range: miễn đữ liệu biến y

- Input x range: miễn đữ liệu các biến x

- Label: Đánh dấu Ý vào 6 nay nếu có nhãn ở dong dau - Conftdence leve:: 95% (độ tin cậy 95%)

- Constant in zero: Đánh dấu Ý nếu hệ số tự do a, = 0 - Output range: mién xuất kết quả

- Residuats: Đánh dau ¥ vao 6 nay dé hién phén du hay sai léch gitta y thực nghiệm va y theo hồi quy

- Standardized residuals: Đánh dấu + để hiện phần dư đã chuẩn hoá ~ Residuals plor: Đánh dấu 3 để hiện đồ thị phần dư

Trang 25

- Line fit plots: Danh dấu A để hiện đồ thị các đường dự báo

- Normal probability plot: Panh dau V dé hién d6 thị phan du da chuẩn hoá

-OK

Ví dụ 4 Tìm phương trình hồi quy y= a + aX + 2X2 + a,x, cha năng suất lúa y phụ thuộc tuyến tính vào độ dai bông (x,), trong lượng 1000 hat (x,) va số bông (x;) với các số liệu cho trong hình L7

QRREBRYRRRRS

Hình I.7 Khai báo để tìm phương trình hổi quy

Chon Tools>Data Analysis>Regression và khai báo các mục như trên

Trang 26

b Phân tích kết quả

- Nếu hệ số tương quan bội (Muluple R) xấp xÏ 0.75 hoặc lớn hơn thì mô hình hồi quy tuyến tính là thích hợp (ngược lại nên tìm mô hình khác) Trong ví dụ 4 hệ số tương quan bội là 0.8589 nên mô hình tuyến tính được coi là thích hợp

~ Hệ số tương quan bình phương (R square) trong ví dụ 4 là 0.7377 cho biết 73.77% sự biến động của y là do các yếu tố X., X;, X gây nên

- Hệ số tương quan hiệu chỉnh bình phương (Adjusted R square) là 66.62% không sát gần với R square chứng tỏ không phải tất cả các biến đưa vào là thực sự cần thiết

- F thực nghiệm là 10.3128! ứng với xác suất 0.00158 nhỏ hơn mức xác suất ý nghĩa 0.05 nên phương trình hồi quy tuyến tính được chấp nhận

~ Nhìn vào các hệ số của các biến ta viết được đường hồi quy dự báo Trong ví dụ 4 phương trình hồi quy là: y = - 4.06364 + 0.111608x, + 0.075684x; + 0.02011x, Tuy nhiên căn cứ vào các xác suất cho ở cột P- value thì hệ số của x, là không đáng tin cậy, vì xác suất tương ứng > 0.05 (mức ý nghĩa đã chọn) Trong trường hợp này, cần tiến hành lọc bớt biến x, để được đường hồi quy với các hệ số đều có ý nghĩa

4 Phân tích phương sai

Phân tích phương sai là công cụ chủ yếu để phân tích các số liệu khi théo dõi ảnh hưởng của các nhân tố (factor) và ảnh hưởng tương tác của chúng Để thu thập số liệu, thí nghiệm cần được thiết kế phù hợp với mục đích nghiên cứu và điều kiện cụ thể nơi tiến hành thí nghiệm Để phân tích một nhân tố, thí nghiệm thường được thiết kế theo kiểu hoàn toàn ngẫu nhiên, kiểu khối hoàn toàn ngẫu nhiên, hay ô vuông La tỉnh Để phân tích hai nhân tố, thí nghiệm được bố trí theo kiểu trực giao, kiểu chia ô lớn, ô vừa, ô nhỏ, hoặc kết hợp vừa chia băng vừa chia ô Từ ba nhân tố trở lên thì cần bố trí thí nghiệm sao cho mỗi nhân tố có hai mức hay mỗi nhân tố có ba mức

4.1 Phân tích phương sai một nhân tố

Trang 27

khi theo doi ảnh hưởng của các mức của nhân tố tới kết quả, như ảnh hưởng của các công thức cho ăn đến năng suất thịt lợn, ảnh hưởng của các công thức phun thuốc sâu đến tỷ lệ sâu bệnh

Để phân tích phương sai một nhân tố cần thiết kế thí nghiệm kiểu hoàn toàn ngẫu nhiên, mỗi mức lặp lại một số lần, số lần lặp của các mức của nhân tố không cẩn phải bằng nhau Số liệu được điển theo cột hoặc theo hàng (nếu vào theo hàng thì mỗi hàng ứng với một mức của nhân tố), ô đầu tiên ghi tên mức, các ô tiếp theo ghi số liệu

a, Các bước thực hiện

Chon Tools> Data Analysis > Anova: Single Factor và khai báo: - Input range: Khai báo miễn đữ liệu vào {một chữ nhật bao trùm toàn bộ các ô chứa tên mức và toàn bộ các số liệu)

- Gronped by: Column (số liệu theo cột) hoặc row (số liệu theo hàng) - kabel im frst column : nhãn dòng đầu

- Aipha: 0.05 (mức ý nghĩa œ) - Output range: mién ra b Phân tích kết quả

- Kết quả in ra gồm các thống kê cơ bản cho từng mức (trung bình, độ lệch chuẩn ) và bảng phân tích phương sai

- Nếu giá trị xác suất P-value < alpha (hoặc F thực nghiệm > F lý thuyết) thì các công thức có tác động khác nhau tới kết quả, ngược lại các công thức không có khác biệt đáng kể

- Nếu kết luận các công thức có tác động khác nhau tới kết quả thì phải tiến hành bước tiếp theo là so sánh các công thức để rút ra công thức nào tốt nhất

Ví dụ 5 Thí nghiệm ảnh hưởng của các loại thuốc đến năng suất lúa (11 loại thuốc là T1 đến T11, 4 cột số liệu là năng suất thu được), số liệu thu được cho trong bảng L2, các lệnh thực hiện trong Excel được minh hoạ trong hình 1.9, còn kết quả cho trong bảng 1.3

Trang 29

Bang 1.3 Két quả phân tích phương sai Groups Count Sum Average Variance TÍ 4 14.576 3.644 9.443686 T2 3 9.04 3.013333 9.108908 T3 4 14.793 2.94825 0.174874 T4 4 11.838 2.9095 0.253934 T5 3 7.703 2.567667 0.084065 TẾ 3 7.694 2.564667 0.122321 T7 4 9.934 2.4835 0.296198 T8 3 66 2.2 0.044469 T9 4 8.164 2.041 0.037706 T 10 4 14.192 2.798 0.184963 T11 4 4.949 1.23725 0.081114 ANOVA

Source of Variation ss of MS F P-value F crit Between Groups 15.1039 10 1.51039 8.54171 2.66E-06 2.1768 Within Groups 5.1279 29 0.17682

Total 20,2319 39

Từ bảng L3 ta kết luận các công thức có tác động khác nhau tới năng

suất lúa Ngoài rä có thể nhận xét rằng công thức T1 cho năng suất cao nhất

Trang 30

Phần mềm Excel không cho phép so sánh các trung bình của các nhóm ứng với các mức của nhân tố (các công thức) Tuy nhiên, nếu cần so sánh trung bình m, (với r, lần lặp) với trung bình m, (r, lần lặp) người dùng có thể tự tinh thém LSD (Least Significance Difference) theo cong thitc LSD = tạ; x SQRT((1/r, + U/r)), trong đó s” là phương sai chung được ước lượng bởi trung bình sai số bình phương trong nội bộ nhóm (MS within groups), œ = 1- p và tạ.,là giá trị t của bảng Student ứng với mức ý nghĩa œ và f bậc tự do tạ có thể tìm được bằng cách tra bảng số hay bang ham TINV trong Excel Trong ví dụ 5, để so sánh ảnh hưởng của thuốc T1, T2 đến năng suất lúa, trước hết cần tính trị tuyệt đối của hiệu các năng suất trung bình m,, m; | m,- my! khi str dung 2 loại thuốc trên (chính bằng 0.6307, xem bảng 1.4) Ứng véi t= (0.05 , 29) =2.045 (tra tir bang Student), s*= 0.17682, LSD được tính cho các trường hợp r,, r, bằng 3 hoặc 4 như sau:

LSD= 2.045 * SQRT(0.17682*(1/3+1/4) = 0.656739049; LSD= 2.045 * SQRT(0,17682*(1/4+1/4) = 0.608022212; LSD= 2.045 * SQRT(0.17682%(1/3+1/3) = 0.702083575

Trong trường hợp so sánh ảnh hưởng của thuốc T1, T2 tới năng suất trung bình của lúa ta có: Ì m,- m,! = 0.6307 <LSD = 0.656739049 nén cong

thức T1, T2 không khác nhau rõ rệt

Các kết quả tính toán tương tự được ghi trong bang 1.3 cho thay cong thức T1 và T2 là không khác nhau rõ rệt, công thức T1 khác các công thức từ T3 đến T11 Tương tự có thể so sánh công thức T2 với các công thức từ T3 đến T11 Công thức TI cho năng suất cao nhất là tốt nhất, công thức TII cho năng suất nhẻ nhất là kém nhất

4.2 Phân tích phương sai hai nhân tố không tương tác

Trang 31

mức của nhân tố thứ hai (trong trường hợp cần phân tích phương sai một nhân tố bố trí kiểu khối ngẫu nhiên thì hàng là các mức của nhân tố, cột là các khối ngẫu nhiên)

a Các bước thực hiện

Chon Tools >Data Analysis >Anova: Two Factor Without Replication sau đó khai báo tiếp các thông tin trong hình I.10 và kích OK

Hình I.10 Hộp thoại khai báo để phân tích phương sai không tương tác

Trang 32

Kết qua thu được khi phân tích phương sai cho ở bảng 1.6 b Phân tích kết quả - Các mức của nhân tố 1 có ảnh hưởng khác nhau đến kết quả (F thực nghiệm > F lý thuyết) - Các mức của nhân tố 2 có ảnh hưởng khác nhau đến kết quả (F thực nghiệm > F lý thuyết) Chú ý: F lý thuyết có thể tìm bằng hàm FINV(0.05, 3, 9) =3.86254, va giá trị t cũng có thể tìm được bằng hàmTINV(0.05, 9) =2.262

Bảng 1.6 Két qua phân tích phương sai hai nhân tố không tương tác lAnova: Two-Factor Without Replication Phân tích nhân tố 1(hàng) SUMMARY Count Sum Average | Variance Mức 1 4 212 53 40.6667 Mức 2 4 228 57 52.6667 Mức 3 4 246 59 48 IMức 4 l4 252 63 74 Phân tích nhãn tố 2 (cột) Khối 1 4 208 52 19.3333 Khối 2 4 224 56 46.6667 Khối 3 4 272 68 24.6667 Khối 4 4 224 56 12 ANOVA Source of Variation |SS of IMS IF P-value F crit Rows 208 3 169.3333 |8.91429 {0.00465 3.86254 Columns 576 l3 192 24.6857 |0.00011 3.86254 Error 70 9 7.77778

4.3 Phân tích phương sai hai nhân tố tương tác

Trong trường hợp này khi phân tích phương sai ta phải tính đến sự tác động đồng thời của nhân tố 1 và nhân tố 2 Số liệu sắp xếp như sau:

- Nhân tố I đánh theo hàng với các mức khác nhau, nhân tố 2 đánh theo cột với các mức khác nhau

Trang 33

(cho k lần lap) con méi mức của nhân tố 2 (thường gọi là nhãn tố B) là 1

cột

- Tên mỗi mức của nhân tố A chỉ viết một lần trong k 6 ở cột đầu, còn tên các mức của nhân tố B thì ghi đầu ở mỗi cột trên dòng đầu, kể từ cột thứ 2 Các ô từ hàng 2 cột 2 trở đi ghi kết quả của các lần lặp của các tổ hợp mức

- Bảng phân tích phương sai có 5 hàng: Hàng cho nhân tố A, hàng dành cho nhân tố B, hàng cho tương tác Ax B, hàng cho sai số và hàng Total Giá trị F lý thuyết được tính ở cột cuối, ta có thể kiểm tra qua hàm FINV(trong Excel) Cot P ~ value là xác suất tương ứng với giá trị E thực nghiệm, nếu giá trị này nhỏ hơn alpha thì ta kết luận nhân tố (hoặc tương tác) tương ứng có ảnh hưởng đến kết quả thí nghiệm

Muốn so sánh các trung bình ta làm như phân tích I nhân tố sau khi tìm giá trị t bằng hàm TINV với số bậc tự do của sai số và căn cứ vào số lần lập của các trung bình mà ta muốn so sánh

a Các bước thực hiện

Chon Tools >Data Analysis >Anova: Two Factor With Replication, sau đó khai báo các thông tin nhu trong hinh I.11 va kích OK

Trang 34

Thực hiện các lệnh phân tích phương sai hai nhân tố tương tác như minh hoạ trên hình L.11 2 19 i 23{Anova; Two-Factor With Replication 21) : 19 20 25(SUMMARY M?c1 M?c2 M?c3 Toli

Hình I.11 Hộp thoại khai báo khi phân tích phương sai hai nhân tố tương tác

Kết quả phân tích phương sai cho ở bảng L8

Trang 35

Variance 1.666667 0.916667 3 1.901515 Công thức 4 Count 4 4 4 12 Sum 83 82 93 258 Average 20.75 20.5 23.25 21.5 Variance 2.916667 1.666667 2.916667 3.727273 Total ‘Count 16 16 16 Sum 312 313 333 Average 19.5 19.5625 20.8125 Variance 6.8 4.395833 5.095833 ANOVA Source of Variation |SS df = |MS F P-value F crit ‘Sample 1224167 l3 40.80556 |14.9898 171E-06 {2.866265 Columns 17.54167 |2 8.770833 |3.221939 |0.051615 |3.259444 Interaction 23.95833 |6 3.993056 11.466837 |0.21725 2.363748 Within o8 36: |2.722222 Totat 261.9167 |47

b Phân tích kết quả: Theo kết quả xử lý, ta rút ra kết luận:

- Fa=l4.9898 > F¿„u= 2.86627, do đó các công thức phân bón ảnh hưởng rõ rệt đến năng suất bông

- F,= 3.22194 < Fạ¿ụ = 3.25944, nên tăng mật độ cây không hy vọng làm tăng năng suất bông

~ Fxg = 1.46684 < Fysqy = 2.36375, nên ảnh hưởng đồng thời của cả hai nhân tố không tác động đáng kể tới năng suất bông

- Bang SUMMARY cho két qua tính toán từng cấp của nhân tố A (viết theo dòng) và chung cho toàn bộ mẫu, bao gồm: số quan sát (count), tổng giá trị quan sát (sum), trị số trung bình (average) va phuong sai (variance)

- Bảng phân tích phương sai ANOVA: Cột đầu tiên là các nguồn gây ra biến động (source of variation) gồm có: mẫu (sample) là các biến động do -nhân tố viết theo hàng gây ra, biến động của nhân tố B - viết theo cột (columns), biến động do tác động tương tác của các nhân tố A và B

Trang 36

(interaction), bién động ngẫu nhiên (within) và của tất cả các yếu tố trên (total) Các cột khác gồm: tổng sai số bình phương (SS), sé bac tr do (df), tổng sai số bình phương trung binh (MS =ss/df), gid tri F thuc nghiém (F), giá trị xác suất P và giá trị F lý thuyết tương ứng với các yếu tố trong cột thứ nhất

5 So sénh hai mau

Bài toán ở đây là cần so sánh hai mẫu thông qua việc kiểm định giả thuyết Hạ : m; = m; (kỳ vọng của biến X bằng kỳ vọng của biến Y) với đối thuyết H,: m, # m, ở mức ý nghĩa œ trong trường hợp kiểm định hai phía Nếu kiểm định một phía thì đối thuyết H, là m, > m; (khi x > y) hoặc m, < m; (khi x < y)

3.1 So sánh hai mẫu độc lập khi biết phương sai a} va ơ

Rút mẫu độc lập từ hai tổng thể phân phối chuẩn, trong một số tình huống nào đó chúng ta có thể ước lượng được phương sai (thường xảy ra khi điều tra lại một tổng thể sau một thời gian chưa lâu, nên phương sai chưa thay đổi, do đó lấy phương sai của lần điều tra trước làm ơj và ơ?, chẳng hạn khi xem Äét các kết quả phân tích của hai phòng thí nghiệm mà độ chính xác đã ồn định, từ đó có các ước lượng về phương sai)

a Các bước thực hiện

Chọn Tools >DatalAnalysis > z-Test: Two Sample for Means, sau đó lần lượt trả lời:

- lnpMl variable Ì range: miền vào của biến 1 tức là miễn chứa số liệu,

kể cả tên đồng đầu của mẫu quan sắt

- Input variable 2 range: miễn vào của mẫu quan sát thứ hai kể cả tên đồng đầu của mẫu quan sát

~ Labels: nếu cân thêm dòng đâu vẻ tên biến thì chọn mục này

- Hypothesized means difference: giả thuyết về hiệu hai trung bình của hai tổng thể Nếu lấy giả thuyết Hụ: m,=m, thì ghi 0 Nếu lấy giả thuyết H;: m,=m;+d (d là ! số nào đó) thì ghi d

- Variable 1 variance: phuong sai cha biến 1(nhập gỉ) - Variable 2 variance: phuong sai của biến 2 (nhập g )

Trang 37

- Output range: Chon miễn trống để đưa ra kết quả

Ví dụ 8 Thực hiện thí nghiệm với mẫu 1 có 10 quan sát, mấu 2 có 12 quan sát ta có bằng số liệu sau, biết phương sai của biến 1 là 007, của biến 2 là 006 x |34 | 44 | 35 | 35 | 36 | 37 | 37 | 37 | 37 | 39 y | 32] 32 | 34 | 34 | 36) 36 | 36 | 36 | 36 | 36 | 36 | 36

Kết quả so sánh hai mẫu cho ở bang 1.9

Bảng 1.9 Kết quả so sánh hai mẫu độc lập 1z-Test: Two Sample for Means Mau 1 Mau 2 Mean 3.6 3.5 Known Variance 0,007 0.006 Observations 10 12 Hypothesized Mean Difference 0 jz 2.88675, P(Z<=z) one-tail 10,00195 z Critical one-tail 1.64485 P(Z<=z) two-tail 0.00390 z Critical two-tail 1.95996 b Phân tích kết quả

Bảng kết quả I.9 có hai cột, một cột cho mẫu quan sát 1, cột kia cho mẫu 2 (tính tới hàng thứ ba) Bảng này gồm có:

- Trung bình của mẫu â;Và a) - Phương sai đã cho (đ†, Ø2) - Số quan sat n,và n;

~ Giá trị z thực nghiêm

- Giá trị P một phía và giá trị P hai phía

- Giá trị z lý thuyết (tới hạn) một phía và tai phía - Giá trị z thực nghiệm tính theo công thức sau;

„-a; |/Sqrt(ø} /n+ 2 ín)

Trang 38

Chú ý rằng, có thể dùng một số hàm trong Excel để tính một số kết quả:

- Giá trị P một phía tính bằng hàm 1-Normsdist(z) - Giá trị P hai phía tính bằng hàm (1-Normsdist(z))*2

- Giá trị tới hạn của hàm phân phối chuẩn tắc z một phía tính bằng

hàm Normsinv(0.95)

- Giá trị z tới hạn hai phía tính bằng hàm Normsinv(0.975)

Trong ví dụ 8 ta thấy: giá trị z thực nghiệm 2.88675 lớn hơn z lý thuyết (tới hạn) một phía I.64485 cũng như z lý thuyết hai phía 1.95996 (gid trị P một phía và hai phía đều nhỏ hơn mức ý nghĩa œ = 0.05) Kết luận: kỳ vọng của hai biến khác nhau

5.2 So sánh hai mẫu kiểu cặp đôi

Ta xét thí dụ: lấy một ổ chim và cân trọng lượng chim cái, trọng lượng chim đực ta được hai mẫu quan sát của hai tổng thể chim cái và chim đực Nếu lấy một số chim đực ngẫu nhiên trong nhiều chim đực và lấy một số chim cái ngẫu nhiên trong nhiều chim cái thì có hai mẫu quan sá: độc lập

Trường hợp khác, nếu ta đem 10 mẫu đất, mỗi mẫu chia đôi, một nửa giao cho phòng phân tích A thực hiện, nửa kia giao cho phòng phân tích B thì thu được số liệu cặp đôi để so sánh kết quả của hai phòng phân tích; hoặc nếu ta đem hai giống lúa cấy trên một số ruộng, mỗi ruộng chia đôi, một nửa cấy giống A, một nửa cấy giống B thì có hai mẫu cặp đôi để so sánh; hay nếu đo một chỉ số sinh lý hoặc sinh hoá của một bệnh nhân khi mới nhập viện và đo lại chỉ số đó sau một thời gian điều trị thì có hai mẫu quan sát cặp đôi để đánh giá hiệu quả điều trị

Chú ý rằng, khi rút hai mẫu cặp đôi ta có hai mẫu cùng số quan sát n, các số liệu sắp xếp thành cặp đứng ở hai cột cạnh nhau

a Các bước thực hiện

Chon Tools >Data Analysis > t-Test: Paired Two Sample for Means, sau đó lần lượt trả lời:

- Input variable Ï range: miễn vào của biến 1 tức là miễn chứa số liệu của biến 1, kể cả tên dòng đầu của mẫu quan sắt

Trang 39

- Input variable 2 range: Mién vao cha m4u quan sat thit hai ké cả tên dong dau cha mau quan sat

- Labels: Nếu cần thêm dòng đầu vẻ tên biến thì chọn mục này

- Hypothesized means difference: Gia thiét vé hiéu hai trung bình của hai tổng thể Nếu lấy giả thuyết Hạ: m,=m; thì ghi 0 Nếu lấy gia thuyết Hạ: m,=m;+d (d là một số nào đó) thì ghi d

- Output range: Chon mién tréng dé dat ra két quả

Ví dụ 9 Có 8 cặp số liệu của hai mẫu x và y cho trong bang sau x 39.6 32.4 33.1 27 36 32 25.9 32.4 y 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2

Thuc hién phan tich trong Excel ta được bảng kết quả (bảng I.10) Bảng 1.10 Kết quả so sánh hai mẫu cặp đôi x y Giải thích

Mean 32.3 30.725 [Trung bình mẫu

Variance 19.54 | 23.451 |Phương sai mẫu

Observations 8 8 Số quan sát

Pearson Correlation 0.96187 Hệ số tương quan R

Hypothesized Mean 0 Giả thuyết về hiệu số trung bình

Difference

af 7 Bậc tự do

It Stat 3.31055 Giá trị t thực nghiệm P(T<=t) one-tail 0.00647 Gia tri P mat phia

It Critical one-tail 1.89458 Gia tri t lý thuyết khi kiểm định một phía P(T<=t) two-tait 0.01293 Giá trị P hai phía

† Critical two-tail 2.36462 Giá trị t lý thuyết khi kiểm định hai phía

b Phân tích kết quả

Bảng kết quả có hai cột cho hai mẫu quan sát Bảng này có các hàng: - Trung binh miu a,, a,

- Phương sai mẫu s;, sĩ

- Số quan sát n, và n; (bằng nhau và bằng số cặp số liệu n) - Hệ số tương quan r của 2 mẫu (coi như 2 biến)

Trang 40

~ Bac ty do f dé kiém dinh gia thuyet H,, f bang số cap (n-1) - Giá trị t thực nghiệm (giá trị tuyệt đối) : 3.31055,

- Giá trị P một phía: 0.0647 - Giá trị t một phía: 1.894577508

- Giá trị P hai phía: 0.01293 - Giá trị t hai phía: 2.36462256

Do t thực nghiệm lớn hơn t lý thuyết một phía cũng như hai phía (giá trị P một phía và hai phía đều nhỏ hơn mức ý nghĩa œ = 0.05), nên trong ví đụ trên ta chấp nhận giả thuyết Hị

3.3 So sánh hai mẫu độc lập với giả thuyết hai phương sai bằng nhau Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể được tiến hành một cách độc lập thì chúng ta có hai mẫu độc lập Nếu dung lượng của cả hai mẫu đều lớn (thường quy ước là n, > 30, n; > 30) ta có thé tiến hành z-test nhưng thay hai phương sai của tổng thể co? va ø? bằng phương sai mẫu s? va s? Trường hợp mẫu bé (n,,n; nhỏ hon 30) thi ta gặp bài toán khó, gọi tên là bài toán Berens — Fisher, Trong trường hợp này, nếu coi hai phương sai của hai tổng thể bằng nhau (cần kiểm định giả thuyết phụ về sự bằng nhau của hai phương sai) thì có thể tiếp tục tính toán như Sau:

a Các bước thực hiện:

Chon Tools >Data Analysis > t-Test: Two-Sample Assuming Equal Yariances, sau đó lần lượt trả lời:

- Input variable J range: mién vao của biến 1 tức là miền chứa số liệu, kể cả tên dòng đầu của mẫu quan sát

~ Input variable 2 range: miễn vào của mẫu quan sát thứ hai kể cả tên dòng đầu của mẫu quan sat

~ Labels: Nếu đưa thêm dong đầu về tên biến thì chọn mục này

Ngày đăng: 28/11/2013, 10:56

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w