1. Trang chủ
  2. » Giáo án - Bài giảng

Tin học ứng dụng trong ngành nông nghiệp nguyễn hải thanh (chủ biên) và những tác giả khác pdf

505 3K 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 505
Dung lượng 11,03 MB

Nội dung

Trang 2

PGS.TS NGUYEN HAI THANH (CHU BIEN)

TIN HOC UNG DUNG

TRONG NGANH NONG NGHIEP

Trang 3

CHU BIEN

PGS.TS NGUYEN HAI THANH

Ngành toán-tin ứng dụng

Trưởng khoa, Khoa Sư phạm Kỹ thuật Trường Đại học Nông nghiệp I Hà Nội

TAP THE TAC GIA

TS NGUYEN QUOC CHỈNH

THS NGO TRÍ DƯƠNG THS LE THI GIANG KS BANG XUAN HA

THS PHAM VAN HUNG

THS MAN QUANG HUY THS DO THI MO

TS NGUYEN HONG NGUYEN

THS TRAN QUOC VINH

Trang 4

LOI NOI DAU

Vấn đê đào tạo, nghiên cứu và ứng dụng tin học có một tâm quan trọng đặc biệt cho việc phát triển nhân lực, khoa học — kĩ thuật và kinh tế — xã hội Việt nam là một nước có trên 72% dân số làm nông nghiệp, vì vậy ứng dụng tin học và công nghệ thông tin có một vai trò to lớn trong công cuộc công nghiệp hoá - hiện đại hố nơng nghiệp và nơng thôn Các lĩnh vực iu tién phát triển trong giai đoạn hiện nay bao gâm nông nghiệp, công nghệ sinh hoc, tự động hoá và tin học - công nghệ thông tin Tất cả các lĩnh vực này liên quan với nhan rất chặt chế trong sự phát triển của đất nước ta và đặc biệt là trong sự nghiệp xây dựng một nên nông nghiệp phát triển bên vững, một nông thôn Việt nam giàu có và tươi đẹp Chỉ thị 58-CTITW của

Ban chấp hành Trung ương về đẩy mạnh và phát triển công nghệ thông tin

phục vụ sự nghiệp cơng nghiệp hố, hiện đại hoá đất nước khẳng định: "Cân

khẩn trương xây dựng các chương trình ứng dụng và phát triển công nghệ

thông tin, kết hợp công nghệ thông tin với công nghệ sinh học để phục vụ công nghiệp hoá, hiện đại hoá nông nghiệp và nông thôn, đặc biệt góp phần

xoá đói giảm nghèo và thúc đẩy phát triển vùng sâu, vàng xa”, tiếp tục “đẩy

mạnh việc đào tạo và sử dụng nguồn nhân lực cho ứng dung và phát triển

công nghệ thông tin" -

Với vai trò một trường đại học được thành lập sớm nhất trong các trường đại học khối nông - lâm - ngư nghiệp, với sự nhận thức những tiêm năng to lớn mà tin học và công nghệ thông tin có thể mang lại, Trường Đại học Nông nghiệp I Hà Nội đang phẩn đấu dat chất lượng đào tạo tin hoc dai cương và tín học chuyên ngành ngày càng cao hơn, tăng cường ứng dung tin học và công nghệ thông tin trong giảng dạy, triển khai các để tài nghiên cứu khoa học ứng dụng tốn — tin và cơng nghệ thông tin trong lĩnh vực nông nghiệp Khi điểm lại một số nét về ứng dụng tin học trong đào tạo và nghiên cứu khoa học nông nghiệp tại Trường Đại học Nơng nghiệp Ì Hà Nội, có thể ghỉ nhận một sự kiện đặc biệt: đây chính là nơi tiếp nhận chiếc máy tính thứ ba trên miễn Bắc (do Cuba trao tặng năm 1981), là một trong các địa điểm được trang bị trung tâm máy tính hiện đại sớm nhất trên miên Bắc (tháng 8

năm 1982)

Trang 5

các viện nghiên cứu khoa học trong lĩnh vực nông — lảm — ngư nghiệp, Trường Đại học Nông nghiệp I Hà Nội đang triển khai nhiều ứng dụng của

tin học trong đào tạo và nghiên cứu khoa học nh:

- Ứng dụng các phần mêm thống kê sẵn có, từ những phân môm thông

dụng nhữr Excel đến chương trình tính toán thống kê lớn và ứng dụng chuyên

sâu, vào thống kê sinh học - noéng nghiép nhit SPSS, Minitab, Genstat, Irristat, Statgraf

- Sit dung cdc phan mém Frontier, Limdep, Lingo phuc vu phan tich

các số liệu kinh tế nông nghiệp và khuyến nông và nhiều phần mềm chuyên

dụng khác cho các lĩnh vực chọn tạo giống, sinh thái môi trường,

- Thiết lập mô hình, xây dựng quy trình tính toán, thiết kế và cài đặt hệ chương trình máy tính cho các mô hình tối im trợ giúp quyết định, các mô hình điên khiển nhằm giải quyết các vấn đề phải sinh trong quy hoạch sử đụng đất, quy hoạch vùng kinh tế nông nghiệp và kinh tế nơng hộ, tự động hố và thiết kế máy nông nghiệp

- Ung dung céng nghé GIS (Geographical Information System), mét

công nghệ kết hợp giữa công nghệ thông tin và công nghệ viễn thám, trong

xây dựng hệ cơ sở dữ liệu và quản lý tài nguyên nông nghiệp

- Bước đầu nghiên cứu ấp dụng công nghệ tin sink hoc trong chon tao

giống, di truyền học vào lĩnh vực trồng trọt, chăn nuôi

- Khai thác mạng thông tín nội bộ, thư viện điện tử và Internet nhằm xây dựng và quản lý hệ thống cơ sở dữ liệu về thông tin khoa học nông nghiệp phục vụ đào tạo và nghiên cứu, triển khai các để tài nghiên cứu và ting dung tin học trong đổi mới phương pháp dạy và học

- Đẩy mạnh chất lượng đào tạo sinh viên ngành Tin hoc thông qua việc từng bước xây dựng hệ giáo trình chuẩn chuyên ngành định hướng vào cdc dé tai ứng dụng tin học trong nông nghiệp, xây dựng các giáo trình tin

học chuyên ngành cho các chuyên ngành nông nghiệp ở tất cả các bậc học

Cuốn sách này được viết ra với những mục đích cụ thể Cuốn sách bao gồm một số công trình và dé tai nghiên cứa khoa học ở nhiều mức độ khác nhau được tiến hành trong thời gian gần đây trong việc giảng dạy và ứng dụng tin học trong lĩnh vực nông nghiệp Tuy chưa thể nào bao quát hết các vấn đề ứng dụng tin học trong nông nghiệp, nhưng đây có thể là một số hướng nghiên cứu cân được tiếp tục được đẩy mạnh trong thời gian tới trong

Trang 6

các trường dại học, cao đẳng, các viện nghiên cứu khoa học và ứng dụng trong các lĩnh vực nông nghiệp

Cuốn sách này trước hết hướng tới đối tượng là cán bộ giảng dạy, sinh

viên các trường đại học và cao đẳng nông nghiệp ở những năm cuối, học

viên cao học và tiến sỹ, những người có thể tìm thấy ở đây các phương pháp,

công cụ cho việc thực hiện các để têi nghiên cứu khoa học hay các đề tài

luận văn tốt nghiệp của mình Một số chương trong cuốn sách có thể dưa

vào giảng dạy trong các môn về tin học ứng dụng cho các chuyên ngành nông nghiệp khác nhau Sinh viên ngành Tìm học của các trường đại học và

cao đẳng nông nghiệp trong cả nước cũng có thể tìm được trong cuốn sách những kiến thức cơ bản, những gợi ý quan trọng, một mặt có tính chất định

hướng, mặt khác lai rất cụ thể cho công việc học tập và thực tập nghiên cứu khoa học của mình Tuy nhiên, đối tượng bạn đọc này hoàn toàn có thể nhận

e cẩn phải hết sức cố gắng mới có thể trả lời được câu hỏi "tại

sao” (đấy chính là một trong những muịc tiên ngành học của các bạn) cũng

như phải hết sức kiên trì để biết cách “làm thế nào”,

Tập thể tác giả cuốn sách này được phân công biên soạn nh sai: - Chương L Xử lý số liệu trong thống kê xinh học và nông nghiệp, gồm ba phần Phân | va I do TRS D6 Thi Mo va PGS TS Nguyén Hai Thanh biên soạn TS Nguyễn Quốc Chỉnh và Thể, Phạm Văn Hing viéi phan Ill

- Chương II Một số mô hình và phần mm tối tt ứng dụng trong nông

nghiệp, do PGS.TS Nguyễn Hải Thanh biên soạn

- Chương HI Hệ thống thông tin địa lý trong quản lệ và đánh giá tài nguyên đất nông nghiệp, được viết bởi ThS Mẫn Quang Huy

- Chương IV Viễn thám trong nông nghiệp, do Thể Trần Quốc Vừnh

và Thể Lê Thị Giang cùng chung viết

- Chương V Ứng dụng tin học trong tự động hoá một q trÌnh nơng nghiệp, do Ths Ngô Trí Dương đảm nhiệm

- Chương VI Tin sinh học cải thiện đi truyền nông nghiệp, do TS Nguyễn Hồng Nguyên viết

- Chuong VI Internet va các dịch vụ thông tin nông nghiệp, do KS Đặng Xuân Hà biên soạn

Trang 7

thành nhiệm vụ của mình và đạt được mục dích chung của cuốn sách, cố gắng viết một cách dễ hiểu, ngắn gọn những vấn đề mình đã từng làm trong

công tác nghiên cứu khoa học và dạy học của mình Với quan niệm “công việc đào tạo và nghiên cứu khoa học là công việc của cả một đội ngũ ” và với mong muốn “phát triển các ứng dụng của tin học Irong nông nghiệp”,

tập thể tác giả luôn coi trọng việc trao đối ý kiến với người đọc trực tiếp hoặc qua e-mail và chia sẻ những tài liệu chuyên ngành Những vấn đề đặt ra trong cuốn sách mới chỉ là phân nổi lên của một tảng băng và chắc ai cũng muốn nhìn rõ nó hơn

Tuy nhiên, lần đâu tiên các vấn dé ứng dụng tin học trong nông nghiệp được viết một cách tổng hợp, chắc cuốn sách còn có khiếm khuyết Chúng tôi rất mong nhận được sự đóng góp ý kiển của bạn đọc, của các đồng nghiệp, các nhà nghiên cứu, các thày cô giáo và các sinh viên để nâng cao hơn nữa chất lượng của cuốn sách này

Trang 8

MUC LUC

LOI NOI DAU MUC LUC

CHUONG L XU LY SO LIEU TRONG THONG KE SINH HỌC VÀ NÔNG NGHIỆP

I XỬLÝ SỐ LIỆU THỐNG KÊ SINH HỌC TRONG EXCEL 1 Thống kê mô tả 2 Tổ chức đồ 2.1 Tạo miền phân tổ 2.2 Vẽ tổ chức đồ 3 Tính hệ số tương quan và tìm phương trình hồi qui 3.1 Tính hệ số tương qHan

3.2 Tìm phương trình hồi quy 4 Phân tích phương sai

4.1 Phân tích phương sai mội nhân tố

4.2 Phân tích phương sai hai nhân tố không tương tác 4.3 Phân tích phương sai hai nhân tố tương tác 5 So sánh hai mẫu

5.1 So sánh hai mẫn độc lập khi biết phương sai } và

5.2 So sánh hai mẫu kiểu cặp đôi

5.3 So sánh hai mẫu độc lập với giả thuyết hai phương sai bằng nhau

5.4 So sánh hai mẫu độc lập với giả thuyết hai phương sai khác nhau

II THIẾT KẾ THÍ NGHIỆM VÀ PHÂN TÍCH THỐNG KÊ

NHIÊU CHIỀU TRONG MINITAB

1 Giới thiệu phần mẻm Minitab 1.1 Các cửa sổ của Miutab

Trang 9

2.1 Mơ hình hồn tồn ngẫu nhiên 2.2 Mơ hình khối hồn toàn ngẫu nhiên 2.3 Thiết kế nhân tố 3 Phân tích thống kê nhiều chiều 3.1 Phân tích thành phần chính 3.2 Phân tích nhân tố 3.3 Phản loại 3.4 Phân cụm dữ liệu 3.5 Phân cụm các biến 3.6 Phân cụm K-trung bình

IM UNG DUNG PHAN MEM FRONTIER 4.LVÀ LIMDEP

TRONG PHÂN TÍCH DỮLIỆU KINH TẾ NÔNG NGHIỆP 1 Hàm cực biên và ứng dụng trong phân tích kinh tế

1.1 Sơ lược về hàm cực biên

1.2 Phân tích hiệu quả kinh tế và đường c cực biên 1.3 Các loại hàm cực biên

2 Các mô bình hàm sản xuất cực biên

2.1 Mô hình hàm cực biên xác định

2.2 Mô hình hàm cực biên ngẫu nhiên

2.3 Mô hình hàm cực biên dựa trên số liệu Kết hợp 2.4, Một số dạng hàm sản xuất cơ bản

3 Một số phần mềm chạy hàm cực biên 3.1 Phdn mém Frontier 4.1

3.2 Chương trình Limdep

TAI LIEU THAM KHAO CHUONG I CHƯƠNG II MỘT SỐ MƠ HÌNH VÀ PHẦN MEM

TỔI ƯU ỨNG DỤNG TRONG NÔNG NGHIỆP

1 MO HINH QUY HOẠCH ĐƠN MỤC TIÊU

1 Mô hình tối ưu một mực tiêu (tuyến tính và phi tuyến) 2 Các ví dụ minh hoạ bài toán tối ưu một mục tiêu

2.1, Bài toán quy hoạch sử dụng đất

2.2 Bài toán tối wi hod giá trị sản xuất 2.3 Bài toán tối wu thông số sàng phân loại

Trang 10

2 Các khái niệm cơ bản của bài toán tối ưu đa mục tiêu 123 3 Mô hình quy hoạch đa mục tiêu trong môi trường 124 mờ/ngẫu nhiên

4 Các ví dụ minh hoạ bài toán quy hoạch đa mục tiêu 126

4.1 Bài toán xác định cơ cấu cây trồng 126

4.2 Bài toán đánh giá hiệu quả sử dụng đất và lao 137

động -

4.3 Bài toán thiết kế trục máy 139

4.4 Tối tụ hoá kết quả và hiệu quả kinh tế chẩn miôi ~*~ 141

II HƯỚNG DẪN SỬ DỰNG MỘT SỐ PHẦN MỀM TỐI ƯU 145 1 Giải bài toán quy hoạch tuyến tính đơn mục tiêu trong 145 Excel 2 Giải bài toán quy hoạch tuyến tính va phi tuyến đơn mục 149 tiêu bằng phần mềm Lingo 3 Giải,bài toán quy hoạch phi tuyến đơn mục tiêu bằng ': ” 151 phần mềm RST2NAU 3.1 Giới thiệu phần mêm RST2ANU 151 3.2 Thuật giải 152 3.3 Xây dựng phần mềm 155 3.4 Hướng dẫn sử dụng 158 4, Giải bài toán quy hoạch tính tuyến đa mục tiêu bằng 162 phần mém MULTIOPT 4.1 Giới thiệu phương pháp giải bài toán tối wu da 162 mục tiêu tuyến tính , 4.2 Thuật giải : 163 4.3 Xây dựng phần mềm MULTIOPT tủ 164 4.4 Hướng dẫn sử dụng 164 ` 8, Giải bài toán quy hoạch phi tuyến đa mục tiêu bằng phân 169 mém PRELIME

31, Giới thiệu phương pháp giải quyết bài toắn quy 169

hoạch đa mục tiêu /

5.2 Thuật giải tương lác lặp 181

5.3 Xây dung j phần mềm PRELIME_ Viên 183

5.4 Hướng dẫn sử dụng a 184

Trang 11

1 Áp dụng các mô hình tối ưu trong nông nghiệp

2 Nghiên cứu áp đụng và đề xuất các phương pháp tối ưu 3 Xây dựng các phần mềm tối ưu

4 Xây dựng hệ hỗ trợ ra quyết định cài đặt trên mạng máy

tính `

TÀI LIỆU THAM KHẢO CHƯƠNG II

CHƯƠNG II HỆ THONG THONG TIN DIA LY VA UNG

DUNG TRONG DANH GIA TAI NGUYEN DAT

NONG NGHIEP 1 HỆ THỐNG THONG TIN DIA LY

1 Khái niệm về hệ thống thông tin địa lý

2 Hệ thống thông tin địa lý và các hệ thống tương tự 2.1 Hệ vẽ bản độ tự động AMS

2.2 Hệ quản trị cơ sở dữ liệu

3 Sự phát triển của hệ thống thông tin địa lý

3.1 Ảnh hướng của các công nghệ đến sự phái triển của GIS 3.2 Các giai đoạn phát triển của hệ thống thông tin địa lý 3.3 Xu hướng phát triển của hệ thống thông tin địa lộ hiện nay II CƠ SỞ DỮLIỆU TRONG CÁC HỆ THỐNG THONG TIN ĐỊA LÝ

1 Vai trò của cơ sở dữ liệu trong hệ thống thông tin dia ly 2 Đặc trưng của cơ sở đữ liệu không gian và cấu trúc dữ liệu trong GIS

2.1 Đặc trưng của dữ liệu không gian 2.2 Cấu trúc dữ liệu trong GIS

2.3 Mô hình chông ghép bản đồ trong GIS ` 2.4 Cấu trúc dữ liệu và đặc tính của bản đồ trong GIS 3 Mô hình cơ sở dữ liệu của hệ thống thông tin tài nguyên

đất

3.1 Thông tin đâu vào

3.2 Xử lý dữ liệu

3.3 Thông tin đâu ra

Trang 12

4.1 Trên thế giới và trong khu vực

4.2 Nghiên cứu ứng dụng GIS trong đánh giá tài nguyên đất ở Việt Nam

4.3 Ứng dụng GIS va kha nding tiép can

II GIGI THIEU MOT SỐ PHẦN MEM GIS

1 MicroStation GeoGraphics

2 Phan mém ArcInfo/MapInf

3 Phần mềm Arcview

IV XÂY DỤNG QUY ` TRÌNH CƠNG NGHỆ UNG DUNG GIS QUAN LY DULIEU TÀI NGUYÊN ĐẤT

1 Xây dựng hệ thông tin quản lý tài nguyên đất

2 Mô hình áp dụng xây dựng bản đồ đơn vị đất đai huyện Yén Chau

3 Xay dựng cơ sở dữ liệu thông tin bảng đồ chuyên đề

3.1, Cơ sở dữ liệu thông tin bản dé đất 3.2 Cơ sở dữ liệu thông tin bản đồ độ dốc

3.3 Cơ sở dữ liệu thông tin bản đô độ dày tầng đất 3.4 Cơ sở dữ liệu thông tin bản đồ thành phần cơ giới 3.5 Cơ sở dữ liệu thông tin bản đồ chế độ tưới

4 Mô hình chồng xếp cơ sở dữ liệu bản đồ don tinh trên GIS

5 Đánh giá nhận xét quy trình ứng dụng GIS quản lý tài nguyên đất

TÀI LIỆU THAM KHẢO CHƯƠNG III CHƯƠNG IV VIỄN THÁM TRONG NÔNG NGHIỆP

1 TỔNG QUAN TÀI LIỆU VÀ PHƯƠNG PHÁP NGHIÊN NCứU

Trang 13

3 Các vệ tỉnh viễn thám thông dụng trong nông nghiệp ở Việt Nam 3.1 Vé tinh Landsat 3.2 Vé tinh Spot 3.3 Vé tinh Terra 4 Đặc điểm phân xạ phổ các đối tượng tự nhiên 4.1 Bức xạ điện từ 4.2 Sự biến đổi năng lượng mặt trời trong môi trường khí quyển

4.3 Đặc điểm phản xạ phổ của các đối tượng tự nhiên

5 Giải đoán ảnh viễn thám 5.1 Hiệu chỉnh ảnh

5.2 Tăng cường chất lượng ảnh và chiết tách đặc tính 5.3, Giải đoán ảnh viễn thắm

5.4 Đánh giá độ chính xác bản đồ sau giải đoán II MỘT SỐ MƠ HÌNH VIỄN THÁM ỨNG DỰNG

1 Viễn thám trong nghiên cứu sử dụng đất và lớp phủ bể

mặt

2 Viễn thám trong điều tra và thành lập bản đồ đất 3 Nghiên cứu viễn thầm trong khí tượng thuỷ văn 4 Viễn thám trong quản lý cây trồng

5 Viễn thám trong nghiên cứu môi trường 6 Viễn thám trong nghiên cứu cảnh quàn

Ul GNG DUNG CONG NGHE VIEN THAM TRONG VIEC TIM HIỂU SUTHAY ĐỔI SUDUNG DAT

1 Dùng phương pháp giải đoán ảnh số tìm hiểu sự thay đổi sử dụng đất

1.1, Phương pháp nghiên cứu

1,2 Kết quả nghiên cứu

1.3 Kết luận ‘

2 Ding phuong pháp giải đoán ảnh bằng mắt thường để tìm

Trang 14

CHUONG V, UNG DUNG TIN HỌC TRONG TỰ ĐỘNG

HỐ MỘT Q TRÌNH SẢN XUẤT NÔNG NGHIỆP

I VAI TRO CUA TUDONG HOA TRONG SAN XUAT NONG

NGHIEP

1 Mối quan hệ giữa tin học và tự động hoá

2 Vai trò của tự động hoá trong sản xuất và đời sống 3 Ứng dụng tự động hoá trong một số lĩnh vực sản xuất

nông nghiệp

II XÂY DỰNG CẤU TRÚC HỆ THỐNG TUOI TUDONG

1 Chế độ tưới nước cho cây rau sạch 1,1 Đất, nước và cây trông

1.2 Điều kiện để sản xuất cây rau sạch 1.3 Xác định nhụ cầu nước tưới

1.4 Xác định thời gian tưới nước

2 Phương pháp và kỹ thuật tưới nước cho cây rau sạch 2.1 Khdi niém chung

2.2 Kỹ thuật tuoi phun mua

II XÂY DỰNG THUẬT TOÁN TƯỚI TỰ ĐỘNG MƠ HÌNH MỜ MAMDANI 1 Mô hình mờ Mamdani 2 Thuật toán điều khiển tưới tự động trên cơ sở mô hình mờ Mamdani 3 Mô phỏng hệ thống tưới bằng phần mềm MATLAB 4 Đánh giá kết quả

IV THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN TƯỚI TỰĐỘNG

QUA TRINH SAN XUAT RAU SACH

1 Lựa chọn thiết bị cho hệ thống tưới tự động 1.1 Chọn các loại thiết bị đo

1.2 Chọn thiết bị cho hệ thống tưới phun mưa 1.3 Chọn thiết bị điển khiển

1.4 Sơ đồ tổng thể của hệ thống tưới phun mưa 2 Cấu trúc chương trình điều khiển hệ thống tưới tự động

Trang 15

3 Lập trình có cấu trúc chương trình điều khiển hệ thống

tưới tự động

3.1 Sơ đồ cấu trúc

3.2 Viết chương trình điệu khiển chế độ tưới tự động TÀI LIỆU THAM KHẢO CHƯƠNG V

CHƯƠNG VI TIN SINH HỌC CẢI THIỆN

DI TRUYỂN NÔNG NGHIỆP

1 VAI TRÒ CỦA TIN SINH HỌC TRONG NGHIÊN CỨU

GENE VÀ CẤU TRÚC PROTEIN

1 Giới thiệu về công nghệ tin sinh học và sinh học phân tử 1.1 Một số vấn đê của công nghệ tin sinh học

1⁄2 Sơ lược về sinh học phân tử

2 Sự sắp xếp so sánh gene

2.1 Sắp xếp trình tị từng CẶP gene 2.2 Sắp xếp so sánh các hệ gene 2.3 Sắp xếp trình tự Äa gene

3 Nối kết và phân tích gene

3.1 Nối kết đoạn DNA 3.2 Thiết kế DNA môi

3.3 Sự đa dạng nhcÌleotide đơn 3.4 Phát hiện sự lặp lại trình tự đơn 3.5 Phân tích biểu hiện gene

II KHAI THÁC CƠ SỞ DỮLIỆU GENE VA UNG DỰNG

TRONG NÔNG NGHIỆP

1 Một số nguyên tắc xây dựng và khai thác cơ sở dữ liệu

gene ` :

1.1 Nguyên tắc xây dung

1.2 Khai thác dữ liệu từ các nguồn khác nhau 2 Một số hệ thống dữ liệu genc ứng dụng trong nông nghiệp

2.1 Hệ thống dữ liệu gene các cây trông chính

2.2: Các hệ thống cơ sở dữ liệu hệ gene động vật

TL TIN SINH HỌC TRONG DI TRUYỀN NÔNG NGHIỆP

Trang 16

1.1 Gene đánh đấu di truyền

1.2 Phả hệ

1.3 Khoảng cách di truyén

1.4 Phát hiện liên kết

1.5 Phân tích marker

2 Các phương pháp tin sinh học tìm kiếm gene 2.1 Phương pháp so sánh giải mã gene 2.2 Phân tích mất cân bằng liên kết 2.3 Mô hình thành phần phương sai

2.4 Kết hợp phân tích liên kết và mất cân bằng liên kết

(LDLA)

2.5 Thiết kế thí nghiệm LDLA

3 Xây dựng các hệ thống đánh giá di truyền 3.1 Giới thiệu

3.2 Tóm lược di truyền số lượng

3.3 Ước tính các thông số di truyền

3.4 Ước tính giá trị giống (giá trị di truyền)

IV KẾT LUẬN VÀ HƯỚNG NGHIÊN CÚU

TÀI LIỆU THAM KHẢO CHƯƠNG VI CHƯƠNG VII INTERNET VÀ CÁC DỊCH VỤ

THÔNG TIN NÔNG NGHIỆP I INTERNET VA CÁC DỊCH VỤ INTERNET

1 Internet

2 World Wide Web và thư điện tử

2.1 World Wide Web 2.2 Thư diện tử

3 Dịch vụ thông tin trên Internet

IL THONG TIN, DẠNG THUC VA NGUON THONG TIN

1 Thông tin và trị thức

2 Sự bùng nổ thông tin

3 Các dạng thức và nguồn thông tin

4 Báo chí định kỳ

5 Các nguồn tham khảo

Trang 17

Ill KHAI THAC DICH VU CUNG CAP THONG TIN

1 Cơ sở đữ liệu tham khảo

2 Danh mục tra cứu thư viện trực tuyến 3 Chỉ mục báo chí tóm tắt

4 Các kỹ năng tìm kiếm nâng cao 5 Mô-tơ tìm kiếm và đánh bạ Web

5.1 Mô-tơ tìm kiếm 5.2 Danh bạ Web

6 Đánh giá nguồn tài liệu trên Internet 6.1 Đánh giá bên ngoài

6.2 Đánh giá bên trong

IV MỘT SỐ DỊCH VỤ THONG TIN NONG NGHIEP

1 Co sé dit ligu AGRICOLA

2 Một số dịch vụ thông tin của tổ chức FAO 3 Các cơ sở dữ liện khác

v XAY DUNG DICH VU THONG TIN NONG NGHIỆP 1 Ngôn ngữ HTML

2 Cơ sở dữ liệu

3 Sơ lược vẻ thiết kế và lập trình Web

4 Triển khai dịch vụ thông tin nông nghiệp

Trang 18

CHUONG I

XU LY SO LIU TRONG THONG KE SINH HỌC

VA NONG NGHIEP

1 XỨ LÝ SỐ LIỆU THỐNG KÊ SINH HỌC TRONG EXCEL

Phần mềm Excel cho phép phân tích dữ liệu nói chung, dữ liệu sinh học và nông nghiệp nói riêng, một cách khá hiệu quả thông qua việc sử dụng menu Tools> Data Analysis (nếu không có mục này thì chọn Tools> Add-in > Analysis ToolPak để cài đặt thêm) Sau đây là một số công cụ xử lý số liệu thống kê mà Excel cung cấp

1 Thống kê mô tả

Thống kê mô tả cho phép tính các số đặc trưng mẫu/ các giá trị thống kê mẫu như trung bình, độ lệch chuẩn, sai số chuẩn, trung vị, mode Số liệu tính toán được bố trí theo cột hoặc theo dòng

a Các bước thực hiện trong Excel

Chọn Tools>Data Analysis>Descriptive Statistics, và khai báo các

mục sau trong hộp thoại:

~ Input range: miễn dữ liệu kể cả nhãn - Grouped by: Column (số liệu theo cột)

- Labels in Rrst row : Đánh dấu Ý vao 6 nay nếu có nhãn ở dòng đầu - Confidence level for mean: 95% (độ tin cậy 95%)

- K-th largest: 1 (1 Số lớn nhất, 2 số lớn nhì ) - K-th smallest: 1 (1 Số nhỏ nhất, 2 số nhỏ nhì )

- Output range: mién ra

Trang 19

Ví dụ 1 Khảo sát về các đặc tính của lúa ta thu được bốn cột số liệu: đài bông (cm), P1000 (trọng lượng 1000 hạt), số bông, năng suất Số liệu được bố trí như trong hình I.1

Chọn Tools>ÖDaia Analysis>Descriptive Statistics, sau đó khai báo

hộp thoại (xem hinh 1.1) CTRL So boug |Néag suai 184 4 iss] as 138) 5 166] 33 16s 4 ló4 43) Wed} 37 Iss 4 166 42 6| 39| Ít senaygasea wal a2 165 4s 158) 36 159) 33 1g 4

Hinh 1.1 Bang số liệu khảo sát về lúa và khai báo hộp thoại

Kết quả thu được cho trong hình I.2 9 Dai beng P1000 —_ %bòng,— Nâng sất 1

[21 Mean ( tung bình) 164 Mem 244Mem l616Mmn 41 29 |Sandrd Enor (gi số chuẩn) 0.25 Sandan 0.49 Sandard 2.571 Standard 0.094 123 Median (tring vi) 26 Median 25 Medan 165 Medan 4 24 Mode (aoe) 26 Mode 25Mode lGMak 4 125 Standard Devation (d6 éch chuain) 089 Sandạp 1.88 Strdard 9.956 Standand 0.364 26 Sampk Variasee (thương sỉ mẫu) 081 §mpk 354§ampkEV 911 §ampk ` 0133 21 Kumosi (độ aes 0.81 Kuntosh -1 Kumosis 0569 Kurtosis 1.507 006 Skewne -0.3 Skewnes: 1.346 Skewnes 1,042 3Range 6 Range 3lRang — 14

3; IMrimum ( gi trị nhỏ nhất) 35Miim: ?iMimimu !3?Mimmu 36 31 Maximum (gif wi on nba) 28 Maxim =27Maximun 188 Maximu 5

32 ‘Sum (ng) 396 Sum 366 Sum 2514Sun 615 33 Count (66 quan sit) Coun — 15 Count 15 Count 1§

| 34: Largese(1) (gá trị lớn nhấ) 28 Lagen 27 Layges(t 188 Langen( §

3ð Smalks(1) ( gi trị nhỏ nhất) 25 Smales ?lãmales{ ]ð?§malbi 36 36 Confidence Level(95.0%) (nin khodng tin chy) 0.55 Confide }04Confiden 5513 Confider 0202

21

Hinh 1.2, Két quả thống kê mô tả về các đặc tính của lúa

Trang 20

b Phân tích các kết quả thụ được

Một số nhận xét sơ bộ trên các thống kê thu được như sau: - Mean cho ta giá trị trung bình của dãy số

- Median cho giá trị điểm giữa của dãy số

Nếu 2 giá trị Mean và Median xấp xỉ nhau ta thì số liệu là cân đối Trong ví dụ ! các cột số liệu là cân đối trừ cột “số bông” hơi bị lệch

- Phương sai mẫu hay độ lệch chuẩn mẫu cho ta biết độ phân tán của số liệu quanh giá trị trung bình, nếu các giá trị này càng nhỏ chứng tỏ số liệu càng tập trung

- Kurtosis đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay tù hơn đường mật độ chuẩn Nếu trong khoảng từ -2 đến 2 thì có thể

coi số liệu xấp xỉ chuẩn

- Skewness đánh giá đường phân phối lệch trái hay lệch phải Nếu trong khoảng từ -2 đến 2 thì có thể coi số liệu cân đối gần như số liệu trong

phân phối chuẩn

- Confidence level được hiểu là nửa độ dài khoảng tin cậy Giả sử Confidence level là m thì khoảng tin cậy của trung bình tổng thể là: (mean- m, mean+m) Trong ví dụ 1, hình I.2, ta có khoảng tin cậy 95% của “dài

bông” la: (26.4- 0.55 , 26.4 +0.55), tức là (25.85 , 26.95) 2 Tổ chức đỏ

“Tần số xuất hiện của số liệu trong các khoảng cách đều nhau cho phép phác hoạ biểu đồ tần số, còn gọi là tổ chức đỏ Để vẽ tổ chức đồ cần phải tiến hành phân tổ / nhóm số liệu

3.1 Tạo miễn phân tổ

Để tiến hành phân tổ số liệu (tạo Bin), cần thực hiện các bước sau: - Dùng các hàm Min, Max để xác định giá trị nhỏ nhất và giá trị lớn nhất

- Định ra giá trị cận dưới và giá trị cận trên của miền phân tổ

- Ghi giá trị cận dưới vào ô đầu của miễn phân tổ và bơi đen tồn miễn này

Trang 21

-Chon Edit > Fill > Series để khai báo các mục:

+ Trong muc Series in chon Columns (dit liéu theo cột)

+ Trong muc Type chon Linear (dit ligu tang theo cap s6 cOng) + Trong Step value: nhap gid trị bước tăng

+ Trong Stop value: nhap giá trị cận trên + OK

Vi du 2 Dua trên 30 số liệu về chiều đài cá ta tạo miễn phân tổ (Bin) như trên hinh 1.3 với miễn phân tổ từ ô D2 t6i 6 D12 (kể cả nhãn), giá trị cận

dưới là L0, cận trên là 55, giá trị bước tăng 5 BSI=lelelszl¬le fear] fea Js [oe Hinh 1.3 Tao mién Bin cho cac sé liéu vé chiéu dai cá 2.2 Vẽ tổ chức đồ a Các bước thực hiện

Chọn Tools> Data Analysis> Histogram để khai báo các mục: - Input range: mién dit liéu

- Input Bin: mién phân tổ

- Labels : nhan 6 dong đầu nếu có - Output range: mién két qua

- Pareto: tân số sắp xếp giảm dần

Trang 22

- Chart output: biéu đồ

- OK

Trong vi du 2 chon Tools> Data Analysis> Histogram va khai báo

nhu trong hinh [.4

Histogram

Ki

| Input Range: Baga SCHIZ =] Lio]

Bin Range: $D$3:‡D$12 =] carcel_|

Output Range: ‡E$2 Xi

Trang 23

c Phan tich két qua

- Tan sé sé liéu rơi vào từng khoảng được ghi ở cận trên của khoảng (Chẳng hạn, có 2 số liệu thuộc vào khoảng (10,15], vì vậy số 2 được ghi tương ứng với số 15 là cận trên)

- Nhìn vào hình L5 ta có thể thấy trong khoảng nào số liệu xuất hiện nhiều nhất Ngoài ra, hình dạng của tổ chức đổ còn cho biết: dãy số liệu khảo sát được về chiều dài của cá có thể coi là tuân theo luật chuẩn

3 Tính hệ số tương quan và tìm phương trình hồi qui 3.1 Tính hệ số tương quan

Excel cho phép tính hệ số tương quan đơn giữa các biến sắp xếp thành một bảng gồm n hàng, n cột (mỗi cột là I biến)

a Các bước thực hiện

Chọn Toois>Data Analysis>Correlation và khai báo các mục: ~ Input range: mién dé liéu ké cả nhãn

- Grouped by: Column (sé liéu theo cét)

- Labels in first row : Dinh dau V vao 6 này nếu có nhãn ở dòng đầu

- Output range: mién ra

- OK

Ví dụ 3 Để nghiên cứu mối tương quan giữa các đặc tính dài bông, số hạt, số bông với năng suất lúa, cần thực hiện các bước sau:

- Chon Toots>Data Analysis>Correlation

- Khai báo các mục (xem hình [.6)

^ L5! €6 | DLE FS) #4 T

2 Ba L:Nghin cite Jia

Trang 24

- Kết quả thu duoc trén bang I.1

Bảng I.1 Kết quả tính hệ số tương quan Dài bông P1000 Số bông Năng suất Dài bông 1 P1000 0.29262 1 Số bông -0.06988 0,340772 1 Nang suat 0.37777 0.66632 0.661379 1 b Phân tích kết quả

- Hệ số tương quan của dòng và cột ghi ở ô giao giữa dòng và cột - Hệ số tương quan âm (< 0) thể hiện mối tương quan nghịch biến (chẳng hạn tương quan giữa “dài bông” và “số bông” là nghịch biến)

- Các hệ số tương quan có giá trị tuyệt đối xấp xỉ 0.75 trở lên thể hiện mối tương quan tuyến tính mạnh giữa hai biến (tương quan giữa “năng suất”

và “P1000” có thể tạm coi là tương quan tuyến tính mạnh)

3.2 Tìm phương trình hồi quy

Excel cho phép tìm phương trình hồi quy tuyén tinh don y= at bx và hồi quy tuyến tinh bOI y= ay + A,X, + aX) + + ALK, Các biến độc lập chứa trong n cột, biến phụ thuộc y để trong một cột, các giá trị tương ứng giữa biến độc lập và biến phụ thuộc được xếp trên cùng một hàng

a Các bước thực hiện

Chọn Tools>Data Analysis>Regression và khai báo các mục:

- Input y range: mién dit ligu bién y - Input x range: mién dữ liệu các biến x

- Label: Đánh dấu Ý vào ô này nếu có nhãn ở dòng đầu

- Confidence leve:: 95% (độ tin cậy 95%)

- Constanl in zero: Đánh đấu Ý nếu hệ số tự do a, = 0 - Ouiput range: miễn xuất kết quả

- Residuals: Đánh đấu 4| vào 6 nay dé hiện phần dư hay sai lệch giữa y

thực nghiệm và y theo hồi quy

- Standardized residuals: Danh dau 3 đề hiện phân dư đã chuẩn hoá

~ Residuals plot: Đánh dấu +| để hiện đồ thị phân dư

Trang 25

- Line fit plots; Danh dau V dé hien dé thị các đường dự báo

- Normal probability plot: Danh dau V dé hiện đồ thị phần dư đã

chuẩn hoá

- OK

Vi du 4 Tim phuong trình hồi quy y= a + 4,X, + @X,+ a;X; của nang suất lúa y phụ thuộc tuyến tính vào độ dài bông (x,), trọng lượng 1000 hạt (x;) và số bông (x;) với các số liệu cho trong hình L7 2 NO RSS WS SN Bị N N30? g8 N bị Đi Bì

Hình 1.7 Khai báo để tìm phương trình hồi quy

Trang 26

b Phân tích kết quả

- Nếu hệ số tương quan bội (Multiple R) xấp xỉ 0.75 hoac lớn hơn thì

mô hình hồi quy tuyến tính là thích hợp (ngược lại nên tìm mô hình khác)

Trong ví du 4 hệ số tương quan bội là 0.8589 nên mô hình tuyến tính được

coi là thích hợp

- Hệ số tương quan bình phương (R square) trong ví dụ 4 là 0.7377 cho

biết 73.77% sự biến động của y là do các yếu tỐ xị, X;, X; gây nên

- Hệ số tương quan hiệu chỉnh bình phương (Adjusted R square) là 66.62% không sát gần với R square chứng tỏ không phải tất cả các biến đưa vào là thực sự cần thiết

- F thực nghiệm là 10.31281 ứng với xác suất 0.00158 nhỏ hơn mức xác suất ý nghĩa 0.05 nên phương trình hồi quy tuyến tính được chấp nhận

- Nhìn vào các hệ số của các biến ta viết được đường hồi quy dự báo Trong ví dụ 4 phương trình hồi quy là: y = — 4.06364 + 0.111608x, + 0.075684x, + 0.02011x; Tuy nhiên căn cứ vào các xác suất cho ở cột P- value thì hệ số của x, là không đáng tin cay, vì xác suất tương ứng > 0.05 (mức ý nghĩa đã chọn) Trong trường hợp này, cần tiến hành lọc bớt bién x,

để được đường hồi quy với các hệ số đều có ý nghĩa

4 Phân tích phương sai

Phân tích phương sai là công cụ chủ yếu để phân tích các số liệu khi

théo đõi ảnh hưởng của các nhân té (factor) va ảnh hưởng tương tác của

chúng Để thu thập số liệu, thí nghiệm cần được thiết kế phù hợp với mục đích nghiên cứu và điều kiện cụ thể nơi tiến hành thí nghiệm Để phân tích

một nhân tố, thí nghiệm thường được thiết kế theo kiểu hoàn toàn ngẫu nhiên, kiểu khối hoàn toàn ngẫu nhiên, hay ô vuông La tính Để phân tích hai nhân tố, thí nghiệm được bố trí theo kiểu trực giao, kiểu chia ư lớn, ơ

vừa, ô nhỏ, hoặc kết hợp vừa chia băng vừa chia 6 Tir ba nhân tố trở lên thì cần bố trí thí nghiệm sao cho mỗi nhân tố có hai mức hay mỗi nhân tố có ba mitic

4.1 Phan tich phuong sai một nhân tố

Trang 27

khi theo đối ảnh hưởng của các mức của nhân tố tới kết quả, như ảnh hưởng của các công thức cho ăn đến năng suất thịt lợn, ảnh hưởng của các công thức phun thuốc sâu đến tỷ lệ sâu bệnh

Để phân tích phương sai một nhân tố cần thiết kế thí nghiệm kiểu hoàn toàn ngẫu nhiên, mỗi mức lập lại một số lần, số lần lặp của các mức của nhân tố không cần phải bằng nhau Số liệu được điển theo cột hoặc theo hàng (nếu vào theo hàng thì mỗi hàng ứng với một mức của nhân tố), ô đầu tiên ghi tên mức, các ô tiếp theo ghi số liệu

a Các bước thực hiện

Chon Tools> Data Analysis > Anova: Single Factor và khai báo: - Input range: Khai bdo miền dữ liệu vào (một chữ nhật bao trùm toàn bộ các ô chứa tên mức và toàn bộ các số liệu)

- Grouped by: Column (số liệu theo cột) hoặc row (số liệu theo hàng)

- Label in first column : nhan dong đầu

- Alpha: 0.05 (mức ý nghĩa œ) - Output range: mién ra

b Phân tích kết quả

- Kết quả in ra gồm các thống kê cơ bản cho từng mức (trung bình, độ lệch chuẩn ) và bảng phân tích phương sai

- Nếu giá trị xác suất P-value < alpha (hoặc F thực nghiệm > F lý thuyết) thì các công thức có tác động khác nhau tới kết quả, ngược lại các

công thức không có khác biệt đáng kể

- Nếu kết luận các công thức có tác động khác nhau tới kết quả thì phải tiến hành bước tiếp theo là so sánh các công thức để rút ra công thức nào tốt nhất

Vi du 5, Thí nghiệm ảnh hưởng của các loại thuốc đến năng suất lúa (11 loại thuốc là T1 đến TII, 4 cột số liệu là năng suất thu được), số liệu thu được cho trong bảng I2, các lệnh thực hiện trong Excel được minh hoạ trong hình L9, còn kết quả cho trong bang 1.3

Trang 28

Bảng I.2 Ảnh hưởng của các loại thuốc đến năng suất (ns) lúa Loại thuốc NSô1 NS 62 NS 63 NS 64 TI 3.187 4.61 3.562 3.217 T2 3.39 2.875 2.775 T3 2.797 3.001 2.505 3.49 T4 2.832 3.103 3.448 2.255 TS 2.233 2.743 2.727 T6 2.952 2.272 2.47 17 2.858 2.895 2.458 1.723 TR 2.308 2.335 1.957 19 2.013 1.788 2248 2.115 T10 3.202 3.06 2.24 2.69 TH 1.192 1,652 1.075 1.03

;ÄÑMlCFošóoft Ekcel> Book†

Trang 29

Bảng I.3 Kết quả phân tích phương sai Groups Count | Sum Average Variance T1 4 14.576 3.644 0.443686 T2 3 9.04 3.013333 0.108908 T3 4 11.793 294825 0,171874 T4 4 11.638 2.9095 0.253934 T5 3 7.703 2.567667 0.084065 T6 3 7,694 2.564667 0.122321 T7 4 9.934 2.4835 0.296198 T8 3 6.6 2.2 0.044469 T8 4 8.164 2.041 0.037706 T10 4 11,192 2.798 0.184963 T11 4 4.949 1.23725 0.081114 ANOVA

Source of Variation ss af MS F P-value F crit

Between Groups 15.1039 10 1.51039 8.54171 2.66E-06 2.1768

Within Groups 5.1279 29 0.47682

Total 20.2319 39

Trang 30

Phần mềm Excel không cho phép so sánh các trung bình của các nhóm ứng với các mức của nhân tố (các công thức) Tuy nhiên, nếu cần so sánh trung bình m, (với r, lần lặp) với trung bình mị (r, lần lặp) người dùng có thể

tự tính them LSD (Least Significance Difference) theo céng thttc LSD = ta;

x SQRT(Ÿ(1/, + l/r)), trong đó s° là phương sai chung được ước lượng bởi

trung bình sai số bình phương trong nội bộ nhóm (MS within groups), a = }-

p, và tụ,;là giá trị t của bảng Student ứng với mức ý nghĩa œ và f bậc tự do tạ, có thể tìm được bằng cách tra bảng số hay bang ham TINV trong Excel Trong ví dụ 5, để so sánh ảnh hưởng của thuốc T1, T2 đến năng suất lúa, trước hết cần tính trị tuyệt đối của hiệu các năng suất trung bình m,, m; Im,- mại khi sử dụng 2 loại thuốc trên (chính bằng 0.6307, xem bảng 1.4)

Ứng với t = t(0.05, 29) =2.045 (tra từ bằng Student); s’= 0.17682, LSD duge

tính cho các trường hợp r,, r; bằng 3 hoặc 4 như sau:

LSD= 2.045 * SQRT(0.17682*(1/3+1/4) = 0.656739049; LSD= 2.045 * SQRT(0.17682*(1/4+1/4) = 0.608022212; LSD= 2.045 * SQRT(0.17682*(1/3+1/3) = 0.702083575

Trong trường hợp so sánh ảnh hưởng của thuốc TI, T2 tới năng suất trung bình của lúa ta có: | m,- my! = 0.6307 <LSD = 0.656739049 nén cong thức T1, T2 không khác nhau rõ rệt

Các kết quả tính toán tương tự được ghi trong bang 1.3 cho thấy công

thức T1 và T2 là không khác nhau rõ rệt, công thức T1 khác các công thức từ T3 đến TI1 Tương tự có thể so sánh công thức T2 với các công thức từ T3

đến TI1 Công thức T1 cho năng suất cao nhất là tốt nhất, công thức TI1 cho năng suất nhỏ nhất là kém nhất

42 Phân tích phương sai hai nhân tố không tương lác

Khi phân tích phương sai hai nhân tố A và B thì có thể xảy ra các hai trường hợp: trường hợp A và B không tương tác (biến động gây nên bởi tác động đồng thời của A và B gần sát 0) và trường hợp A và B tương tác (nếu trái lại) Phân tích phương sai một nhân tố bố trí kiểu khối hoàn toàn ngẫu nhiên được coi là trường hợp riêng của phân tích phương sai hai nhân tố không tương tác (nhân tố khối là nhân tố thứ hai không tương tác với nhân tố thứ nhất) Khi phân tích phương sai hai nhân tố không tương tác, số liệu cần được sắp xếp theo cách sau: hàng là các mức của nhân tố thứ nhất, cột là các

Trang 31

mức của nhân tố thứ hai (trong trường hợp cần phân tích phương sai một nhân tố bố trí kiểu khối ngẫu nhiên thì hàng là các mức của nhân tố, cột là các khối ngẫu nhiên)

a Các bước thực hiện

Chon Tools >Data Analysis >Anova: Two Factor Without Replication

sau đó khai báo tiếp các thông tin trong hình I.!0 và kích OK #7? 01w sl = geo, Oa) : LS DE EO OP TG fH J7 KT Khii “KH Khiủ3 KHẢ + 4 52 a En 50 5 g 5n Z 53 7 |Anova: Two-Factor Without Replication §

3,BUMWARY_ oun — Sum Average _Vanance H10 |Mức 1 4 212 53 40.66867 “ H1 ]Mức 2 478 Sĩ 6288687 L12 |Mức 3 428 L1#|Mớc 4 m2 L4 | Tố |Khii 1 4 28 HBjkhỏi2 4224 H7 |mỗi 3 4.72 |8 |Khái 4 4 _ 24 1i

Hình I.10 Hộp thoại khai báo để phân tích phương sai không tương tác

Trang 32

Kết quả thu được khi phân tích phương sai cho ở bảng L6 b, Phân tích kết quả - Các mức của nhân tố 1 có ảnh hưởng khác nhau đến kết quả (F thực nghiệm > F lý thuyết) ~- Các mức của nhân tố 2 có ảnh hưởng khác nhau đến kết quả (F thực nghiệm > F lý thuyết)

Chú ý: E lý thuyết có thể tìm bang ham FINV(0.05, 3, 9) =3.86254, va giá trị t cũng có thể tìm được bằng hàmTINV(0.05, 9) =2.262

Bảng I.6 Kết quả phân tích phương sai hai nhân tố không tương tác lAnova: Two-Factor Without Replication Phân tích nhân tổ †(hàng) SUMMARY Count Sum Average |Variance Mức † 4 212 53 40.6667 Mitc 2 4 228 57 52.6667 Mức 3 4 236 58 48 Mức 4 4 252 63 74 Phân tích nhân tố 2 (cột) Khối 1 4 208 52 19.3333 Khối 2 4 224 56 36.6667 Khối 3 4 272 68 24.6667 Khối 4 4 224 56 12 ANOVA Source of Variation |SS of MS F P-value F crit Rows 208 3 69.3333 |8.91429 |0.00465 3.86254 Columns 576 3 192 24,6857 [0.00011 3.86254 Error 70 9 7.77778

4.3 Phan tich phuong sai hai nhân tố tương tác

Trong trường hợp này khi phân tích phương sai ta phải tính đến sự tác động đồng thời của nhân tố 1 và nhân tố 2 Số liệu sắp xếp như sau:

- Nhân tố 1 đánh theo hàng với các mức khác nhau, nhân tố 2 đánh

theo cột với các mức khác nhau

- Mỗi mức của nhân tố 1 (thường gọi là nhân tố A) được dành k hàng

Trang 33

(cho k lần lặp) còn mỗi mức của nhân tố 2 (thường gọi là nhân tố B) là 1

cột

- Tên mỗi mức của nhân tố A chỉ viết một lần trong k ô ở cột đầu, còn

tên các mức của nhân tố B thì ghỉ đầu ở mỗi cột trên dòng đầu, kể từ cột thứ

2 Các ô từ hàng 2 cột 2 trở đi ghi kết quả của các lần lặp của các tổ hợp

mic

- Bảng phân tích phương sai có 5 hàng: Hàng cho nhân tố A, hàng đành cho nhân tố B, hàng cho tương tác Ax B, hàng cho sai số và hàng Total Giá trị F lý thuyết được tính ở cột cuối, ta có thể kiểm tra qua hàm FINV(trong Excel) Cét P — value là xác suất tương ứng với giá trị E thực nghiệm, nếu giá trị này nhỏ hơn alpha thì ta kết luận nhân tố (hoặc tương tác) tương ứng có ảnh hưởng đến kết quả thí nghiệm

Muốn so sánh các trung bình ta làm như phân tích 1 nhân tố sau khi tìm giá trị t bằng hàm TINV với số bậc tự do của sai số và căn cứ vào số lần lặp của các trung bình mà ta muốn so sánh

a Các bước thực hiện

Chon Tools >Data Analysis >Anova: Two Factor With Replication,

sau đó khai báo các thông tin như trong hình Ï.!1 và kích OK

Ví dụ 7: Nghiên cứu ảnh hưởng của việc bón phân khoáng (nhân tố A) theo bốn công thức và mật độ trồng (nhân tố B) gồm ba mức tới sản lượng bông ta có bảng số liệu (bảng I.7),

Bảng 1.7, Năng suất bông (tạ/ha) € thức †

Trang 34

Thực hiện các lệnh phân tích phương sai hai nhân tổ tương tác như minh hoa trén hinh Lt 1

23|Anova Two-Factor With Replication

Z4|SUMMARY M?c1 M?c2 M?c3 - Tolal

Hình 1.11 Hộp thoại khai báo khi phân tích phương sai hai nhâp tố tương tác

Kết quả phân tích phương sai cho 6 bang 1.8

Trang 35

Variance 1.666667 0.916667 3 1.901515 Công thức 4 Count 4 4 4 12 Sum 83 82 93 258 Average 20.75 20.5 23.25 21.5 Variance 2.916667 1.666667 2.916667 3.727273 Total Count 16 16 16 Sum 312 313 333 Average 19.5 19.5625 20.8125 Variance 6.8 4.395833 5.095833 ANOVA Source of Variation |SS df = |MS F P-value F crit Sample 122.4167 l3 40.80556 |14.9898 1.71E-06 |2.866285 Columns 17.54167 |2 8.770833 {3.221939 0.051615 3.259444 interaction 23,95833 l6 3.993056 |1.466837 [0.21725 2.363748 Within 98 36 2.722222 Total 261.9167 |47 b Phân tích kết quả: Theo kết quả xử lý, ta rút ra kết luận: - F,=14.9898 > F,s,= 2.86627, do đó các công thức phân bón ảnh hưởng rõ rệt đến năng suất bông

- Fạ= 3.22194 < Fysy = 3.25944, nén tang mat do cay khong hy vong lầm tăng năng suất bông

- Ea, = 1.46684 < Fạsap = 2.36375, nên ảnh hưởng đồng thời của cả hai

nhân tố không tác động đáng kể tới năng suất bông

- Bảng SUMMARY cho kết quả tính toán từng cấp của nhân tố A (viết theo dòng) và chung cho toàn bộ mẫu, bao gồm: số quan sát (count), tổng

giá trị quan sát (sum), trị số trung bình (average) và phuong sai (variance)

- Bảng phân tích phương sai ANOVA: Cột đầu tiên là các nguồn gây Ta biến động (source of variation) gồm có: mẫu (sample) là các biến động do “nhân tố viết theo hàng gây ra, biến động của nhân tố B - viết theo cột

(columns), biến động do tác động tương tác của các nhân tố A và B

Trang 36

(nteraction), biến động ngẫu nhiên (within) và của tất cả các yếu tố trên (total) Các cột khác gồm: tổng sai số bình phương (SS), số bac tu do (df), tổng sai số bình phương trung bình (MS =ss/d0, giá trị F thực nghiệm (F), giá trị xác suất P và giá trị F lý thuyết tương ứng với các yếu tố trong cột thứ nhất

5 So sánh hai mẫu

Bài toán ở đây là cần so sánh hai mẫu thông qua việc kiểm định giả thuyết Hụ : m, = mạ (kỳ vọng của biến X bằng kỳ vọng của biến Y) với đối thuyết H,: m, # m; ở mức ý nghĩa œ trong trường hợp kiểm định hai phía

Nếu kiểm định một phía thì đối thuyết H, là m, > m; (khi x > y) hoặc m, <

m, (khi x < y)

5.1 So sánh hai mẫu độc lập khi biết phương sai oj va 0}

Rút mẫu độc lập từ hai tổng thể phân phối chuẩn, trong một số tình

huống nào đó chúng ta có thể ước lượng được phương sai (thường xảy ra khi

điều tra lại một tổng thể sau một thời gian chưa lâu, nên phương sai chưa

thay đổi, đo đó lấy phương sai của lần điều tra trước làm ø; và ơ, chẳng

hạn khi xem %ét các kết quả phân tích của hai phòng thí nghiệm mà độ chính

xác đã ổn định, từ đó có các ước lượng về phương sai) a Các bước thực hiện

Chọn Toois >DatalAnalysis > z-Test: Two Sample Jor Means, sau đó lần lượt trả lời:

- Input variable I range: miễn vào của biến 1 tức là miền chứa số liệu,

kể cả tên dòng đầu của mẫu quan sắt

- Input variable 2 range: miễn vào của mẫu quan sát thứ hai kể cả tên đồng đầu của mẫu quan sát

- Labels: nếu cần thêm dòng đầu về tên biến thì chọn mục này

- Hypothesized means difference: gia thuyét vé hiéu hai trung bình của hai tổng thể Nếu lấy giả thuyết Hụ: m,=m; thì ghỉ 0 Nếu lấy giả thuyết H,;: m,=m,+d (d là 1 số nào đó) thì ghi d

- Variable 1 variance: phuong sai của biến 1(nhập 63) - Variable 2 variance: phuong sai của biến 2 (nhập 63)

Trang 37

- Output range: Chon mién trong dé dua ra kết qua

Vi du 8 Thuc hién thi nghiém véi mau 1 cé 10 quan sat, mau 2 cé 12 quan sắt ta có bảng số liệu sau, biết phương sai của biến 1 là 007, của biến 2 là 006 x 34 | 34 | 35 | 35 |35 | 37 | 37 | 37 | 37 | 3.9 y 3.2 | 3.2 | 34 | 34 | 36 | 36 | 36 | 36 | 36 | 36 | 36 | 36

Kết quả so sánh hai mẫu cho ở bảng 1.9,

Bảng 1.9 Kết quả so sánh hai mẫu độc lập z-Test: Two Sample for Means Mau 1 Mau 2 Mean 3.6 3.5 Known Variance 0.007 0.006 Observations 10 42 Hypothesized Mean Difference 0 Z 2.88675 P{Z<=z) one-tail 0.00195 'z Critical one-tail 1.64485 P(Z<=z) two-tail 0.00390 z Critical two-tail 1.95996 b Phân tích kết quả

Bảng kết quả I.9 có hai cột, một cột cho mẫu quan sát Ì, cột kia cho

mẫu 2 (tính tới hàng thứ ba) Bảng này gồm có: - Trung bình của mẫu a,và a;

- Phương sai da cho (07, 03) - Số quan sát n,và nạ

- Giá trị z thực nghiệm

- Giá trị P một phía và giá trị P hai phía

- Giá trị z lý thuyết (tới hạn) một phía và hai phía

- Giá trị z thực nghiệm tính theo công thức sau;

z= | ay-a, | /Sqrt( oF fn, + 03 /n,)

Trang 38

Chú ý rằng, có thể dùng một số hàm trong Excel để tính một số kết quả:

- Giá trị P một phía tính bằng hàm 1-Normsdist(z) - Giá trị P hai phía tinh bang ham (1-Normsdist(z))*2

- Giá trị tới hạn của hàm phân phối chuẩn tác z một phía tính bằng

hàm Normsinv(0.95)

- Giá trị z tới hạn hai phía tính bằng hàm Normsinv(0.975)

Trong ví dụ 8 ta thấy: giá trị z thực nghiệm 2.88675 lớn hơn z lý thuyết (tới hạn) một phía 1.64485 cũng như z lý thuyết hai phía 1.95996 (gid trị P một phía và hai phía đều nhỏ hơn mức ý nghĩa œ = 0.05) Kết luận: kỳ vọng của hai biến khác nhau

5.2 So sánh hai mẫu kiểu cặp đôi

Ta xét thí dụ: lấy một ổ chim và cân trọng lượng chim cái, trọng lượng chim duc ta được hai mẫu quan sát của hai tổng thể chim cái và chim đực Nếu lấy một số chim đực ngẫu nhiên trong nhiều chỉm đực và lấy một số chim cái ngẫu nhiên trong nhiều chim cái thì có hai mẫu quan sát: độc lập

Trường hợp khác, nếu ta đem 10 mẫu đất, mỗi mẫu chia đôi, một nửa

giao cho phòng phân tích A thực hiện, nửa kia giao cho phòng phân tích B

thì thu được số liệu cặp đôi để so sánh kết quả của hai phòng phân tích; hoặc nếu ta đem hai giống lúa cấy trên một số ruộng, mỗi ruộng chia đôi, một nửa cấy giống A, một nửa cấy giống B thì có hai mẫu cập đôi để so sánh, hay nếu đo một chỉ số sinh lý hoặc sinh hoá của một bệnh nhân khi mới nhập viện và đo lại chỉ số đó sau một thời gian điều trị thì có hai mẫu quan sát cặp đôi để đánh giá hiệu quả điều trí

Chú ý rằng, khi rút hai mẫu cặp đôi ta có hai mẫu cùng số quan sát n, các số liệu sắp xếp thành cặp đứng ở hai cột cạnh nhau

a Các bước thực hiện

Chon Tools >Data Analysis > LTest: Paired Two Sample for Means, sau đó lần lượt trả lời:

- Input variable | range: mién vao cia bién | tic 1a miền chứa số liệu

của biến 1, kể cả tên dòng đầu của mẫu quan sắt

Trang 39

- Input variable 2 range: Mién vao cha mau quan sét thứ hai kể cả tên đồng đầu của mẫu quan sát

- Labels: Néu can thém dong dau về tên biến thì chọn mục này

- Hypothesized means difference: Gia thiét về hiệu hai trung bình của

bai tổng thể Nếu lấy giả thuyết Hạ: m,=m; thì ghi 0 Nếu lấy giả thuyết H,:

m,=m;+d (d là một số nào đó) thì ghi d

- Output range: Chon mién trống để đặt ra kết quả

Ví dụ 9 Có 8 cặp số liệu của hai mẫu x và y cho trong bảng sau x 396 32.4 33.1 27 36 32 25.9 32.4 y 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2

Thực hiện phân tích trong Excel ta được bảng kết qua (bang I-10)

Bảng I.10 Kết quả so sánh hai mẫu cặp đôi

x y Giải thích

Mean 32.3 30.725 |Trung binh mau

Variance 19.54 † 23.451 |Phương sai mẫu

Observations 8 8 'Số quan sát

Pearson Correlation 0.96187 Hệ số tương quan R

Hypothesized Mean a Giả thuyết về hiệu số trung bình

Difference

df 7 Bậc tự do

t Stat 3.31065 Gia trị t thuc nghiém P(T<=t) one-tail 0,00647 Gia tri P mét phia

t Critica! one-tail 1,89458 Gia tri tty thuyết khi kiểm định một phía

P(T<=t) two-tail 0.01293 Giá trị P hai phía

t Critical two-tail 2.36462 Gia tri tly thuyết khi kiểm định hai phía

b Phân tích kết quả

Bảng kết quả có hai cột cho hai mẫu quan sát Bảng này có các hàng: - Trung bình mẫu a,, a)

- Phương sai mẫu s7, s?

- Số quan sát n, và n, (bằng nhau và bằng số cặp số liệu n) - Hệ số tương quan r của 2 mẫu (coi như 2 biến)

Trang 40

- Bac tu do f dé kiểm định giả thuyết H,, f bing s6 cap (n-1) - Giá trị t thực nghiệm (giá trị tuyệt đối) : 3.31055

- Giá trị P một phía: 0.00647 - Giá trị t một phía: 1.894577508

- Giá trị P hai phía: 0.01293

~ Giá trị t hai phía: 2.36462256

Do t thực nghiệm lớn hơn t lý thuyết một phía cũng như hai phía (giá trị P một phía và hai phía đều nhỏ hơn mức ý nghĩa œ = 0.05), nên trong ví dụ trên ta chấp nhận giả thuyết H;

5.3 Sơ sánh hai mẫu độc lập với giả thuyết hai phương sai bằng nhau Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể được tiến hành một cách độc lập thì chúng ta có hai mẫu độc lập Nếu dung lượng của cả hai mẫu đều lớn (thường quy ước là n, > 30, n, > 30) ta có thể tiến hành z-test nhưng thay bai phương sai của tổng thé oj va o} bang

phương sai mẫu s7 và s; Trường hợp mẫu bé (n,n; nhỏ hơn 30) thì ta gặp

bài toán khó, gọi tên là bài toán Berens — Fisher Trong trường hợp này, nếu coi hai phương sai của hai tổng thể bằng nhau (cân kiểm định giả thuyết

phụ về sự bằng nhau của hai phương sai) thì có thể tiếp tục tính toán như sau:

a Các bước thực hiện:

Chon Tools >Data Analysis > t-Test: Two-Sample Assuming Equal

Variances, sau đó lần lượt trả lời:

- Inpit variable ] rang: miễn vào của biến L tức là miền chứa số liệu,

kể cả tên dòng đầu của mẫu quan sắt

- Input variable 2 range: mién vao cia mẫu quan sắt thứ hai kể cả tên dong dau cha mau quan sắt

- Labels: Néu đưa thêm dong đầu về tên biến thì chọn mục này

Ngày đăng: 20/07/2016, 10:01

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN