1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Khai thác và sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp - Chương 1 pps

19 1,5K 21

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 19
Dung lượng 310,14 KB

Nội dung

Trong lâm nghiệp, thống kê toán học là công cụ giúp các nhà khoa học có cơ sở phân tích, đánh giá kết quả nghiên cứu trong các lĩnh vực chuyên môn, như lâm sinh, môi trường, sâu bệnh, th

Trang 1

Khai thác vμ sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp

GS.TS Nguyễn Hải Tuất

TS Nguyễn Trọng Bình

Trang 2

Lời giới thiệu

hống kê toán học ngày càng được ứng dụng rộng rãi trong các lĩnh vực, đặc biệt là trong nghiên cứu khoa học Trong lâm nghiệp, thống kê toán học là công cụ giúp các nhà khoa học có cơ sở phân tích, đánh giá kết quả nghiên cứu trong các lĩnh vực chuyên môn, như lâm sinh, môi trường, sâu bệnh, thổ nhưỡng,

điều tra rừng, chế biến lâm sản…

Hiện nay, các phương pháp thống kê cụ thể được giới thiệu trong các tài liệu chuyên môn mà người đọc đều có thể tra cứu tiện lợi Tuy nhiên, vấn đề mà những người làm công tác nghiên cứu khoa học quan tâm là, làm thế nào để việc xử lý số liệu cũng như tính toán các chỉ tiêu thống kê cần thiết cho mỗi nghiên cứu sao cho đơn giản

và tiện lợi, mà không làm giảm độ chính xác cũng như độ tin cậy Để giải quyết vấn đề

này, các giảng viên của Trường Đại học Lâm nghiệp đã biên soạn cuốn “Khai thác và

sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp”

Trong cuốn sách, các tác giả giới thiệu những phương pháp thống kê thường được vận dụng trong lâm nghiệp Với mỗi phương pháp, phần lý thuyết đều được hệ thống

và nâng cao so với chương trình bậc đại học, đồng thời còn gợi ý hướng vận dụng vào các lĩnh vực chuyên môn sâu khác nhau Phần ứng dụng được giới thiệu tương đối cụ thể, từ các bước nhập số liệu cũng như các thao tác thực hành trên máy cho đến phân tích kết quả cuối cùng

Từ những vấn đề được giới thiệu, người đọc dễ nhận thấy, cuốn sách là tài liệu

được biên soạn công phu và nghiêm túc bởi nhóm tác giả Đây là tài liệu hướng dẫn thực hành tốt cho những người làm công tác nghiên cứu đã có kiến thức thống kê toán học ở bậc đại học và kiến thức tin học ứng dụng chuyên ngành Cũng vì thế, cuốn sách còn là tài liệu dùng cho học viên cao học lâm nghiệp khi nghiên cứu môn thống kê toán học Chúng tôi rất vui mừng và trân trọng giới thiệu cuốn sách với bạn đọc

Hà Tây, ngày 31 tháng 5 năm 2005

GS TS Vũ Tiến Hinh

T

Trang 3

Lời nói đầu

SPSS ra đời từ những năm 60 của thế kỷ trước và không ngừng được nâng cấp và hoàn thiện Cho đến nay thế hệ mới nhất mà ta biết được là 12.5 với nhiều nội dung tân tiến được đưa vào Tuy nhiên, những vấn đề cốt lõi có ứng dụng nhiều trong Lâm nghiệp mà ta đã quen thuộc thì vẫn không thay đổi mặc dù phiên bản đang được các nhà khoa học trường ta ứng dụng là 10.0 hoặc 11.5 Nội dung của SPSS rất rộng bao gồm những vấn đề cơ bản và nâng cao, rất thích hợp cho nhiều đối tượng chuyên môn khác nhau Để phục vụ cho các nhà nghiên cứu Lâm nghiệp không chuyên về thống kê, tài liệu học tập chủ yếu là giới thiệu những vấn đề thống kê thường được vận dụng trong Lâm nghiệp, trong đó có một số vấn đề được nâng cao hơn so với thống kê cơ bản Ngoài ra, nhóm tác giả cũng hết sức chú ý khai thác những vấn đề có liên quan

đến đặc thù nghiên cứu trong Lâm nghiệp như việc chỉnh lý số liệu theo 2 biến, vấn đề kiểm tra luật phân bố, sự tương thích của mô hình hồi quy, hồi quy phi tuyến tính…

Xử lý thống kê bằng SPSS 10.0/11.5 for Windows là tài liệu phục vụ thực hành tốt cho học viên cao học Lâm nghiệp sau khi đã học xong phần Tin học chuyên ngành Ngoài ra, tài liệu cũng có thể phục vụ tốt cho những cán bộ và sinh viên làm nghiên cứu khoa học, nếu đã qua trình độ thống kê cơ bản Tuy nhiên, để giúp cho người đọc tiện tra cứu về mặt thống kê, ở một số mục nhóm tác giả có trình bày sâu thêm một số vấn đề lý luận và công thức vận dụng ngoài nội dung chính là các quy trình ứng dụng SPSS để xử lý số liệu Trong lần đọc đầu tiên, độc giả có thể lướt qua những vấn đề đó

mà cũng không ảnh hưởng đến mục tiêu chính của tài liệu Do học viên cao học đã nghiên cứu kỹ phần tin học có liên quan đến phần mềm SPSS, nên trong tài liệu này những vấn đề đó cũng không trình bày lại một cách đầy đủ Tuy nhiên, tài liệu có thêm một chương khái quát về SPSS nhất là cách nhập số liệu vào máy Độc giả có thể đọc thêm những tài liệu (2), (4), (8)

Biên soạn: chương 1, 3 và 8 do TS Nguyễn Trọng Bình, các chương còn lại do GS.TS Nguyễn Hải Tuất đảm nhiệm Xin chân thành cảm ơn một số bạn bè và đồng nghiệp kể cả những học viên cao học, đặc biệt là GS.TS Vũ Tiến Hinh và Thạc sỹ Nguyễn Thị Thanh An đã góp phần sửa chữa về nội dung và hình thức trong quá trình nhóm tác giả biên soạn tập tài liệu này Mặc dù đã có nhiều cố gắng biên soạn, nhưng

đây là một phần mềm rất phong phú và phức tạp, thời gian nghiên cứu chưa nhiều nên chắc không tránh khỏi những khiếm khuyết; rất mong được bạn đọc lượng thứ và cho nhiều ý kiến quý báu để nhóm tác giả tiếp tục sửa chữa và hoàn thiện

Trang 4

Mục lục

Lời nói đầu

Chương 1: Khái quát về SPSS 1

1.8 Một số thủ tục quan trọng thường dùng có liên quan đến các biến trong SPSS 10

Chương 2: Thống kê mô tả 15

Chương 3 : Xây dựng các bảng biểu và sơ đồ thống kê 27

Chương 4 : So sánh các mẫu thí nghiệm và quan sát 53

Chương 5 : Phân tích phương sai 76

Trang 5

Chương 6 : Phân tích hồi quy một lớp và nhiều lớp 108

Chương 7: Các dạng đường cong và hàm phi tuyến 144

7.4 Kết hợp phân tích hồi quy với phân tích phương sai để chọn bậc của đa thức 157

Chương 8 : Kiểm tra dạng phân bố lý thuyết 175

Tài liệu tham khảo Bảng tra tìm các quy trình đã vận dụng SPSS

Trang 6

Chương 1

Khái quát về spss

1.1 Nội dung cơ bản SPSS

SPSS là tên viết tắt của tên đầy đủ Statistical Products for social Services Như

vậy, đối tượng phục vụ của SPSS là cho nhiều ngành kinh tế xã hội và khoa học khác

nhau Nội dung của SPSS rất phong phú và đa dạng bao gồm từ việc thiết lập các bảng biểu và sơ đồ thống kê, tính toán các đặc trưng mẫu trong thống kê mô tả, đến một hệ thống đầy đủ các phương pháp thống kê phân tích như so sánh các mẫu bằng nhiều tiêu

chuẩn tham số và phi tham số (Nonparametric Tests), các mô hình phân tích Phương sai theo dạng tuyến tính tổng quát ( General Linear Models) , các mô hình hồi quy

đơn và nhiều biến, các hồi qui phi tuyến tính (Nonlinear), các hồi quy Logistic; Phân tích theo nhóm (Cluster Analysis) Phân tích tách biệt (Discriminatory Analysis ) và nhiều chuyên sâu khác (Advanced Statistics) Những nội dung nói trên có thể nói là

đủ để giúp cho các nhà khoa học thực hiện việc xử lý số liệu nghiên cứu nói chung và trong nghiên cứu Lâm nghiệp nói riêng Danh sách các chủ đề thống kê mà SPSS đề

cập đến có trong menu Analyze ở cửa sổ chính SPSS Data Editor được giới thiệu ở

mục sau

1.2 Cửa sổ làm việc của SPSS

Sau khi chương trình SPSS được mở thì cửa sổ đầu tiên của SPSS là SPSS Data

Editor xuất hiện gọi là cửa sổ hiệu đính số liệu Với cửa sổ này giúp ta các thao tác mở

các chuyên đề thống kê để phân tích, xem xét các số liệu, cắt xoá copy thay đổi trật tự

và hình thức các biến

Hình 1.1 Cửa sổ SPSS Data Editor

Nội dung chủ yếu của các Menus trong SPSS 10.0 /11.5 for Windows

- File : Khởi tạo file mới đóng mở, lưu, in ấn thoát

Trang 7

- Edit : undo, cắt dán, tìm kiếm, thay thế, xác lập các mặc định

- View: Cho hiện dòng trạng thái, thanh công cụ, chọn phông chữ, cho hiện giá

trị nhập vào hay nhãn, ý nghĩa của các giá trị nhập vào

- Data : Định nghĩa biến thêm biến đi đến các quan sát xếp thứ hạng ghép file chia file , lựa chọn các chủ thể (Select cases)

- Transforrm: Tính toán mã hoá lại các biến …

- Analyze: Liệt kê các chuyên đề thống kê Đây là menu chủ yếu của cửa sổ

này

- Graphs : Tạo các biểu đồ

- Utilities : Tìm hiểu các thông tin về biến ,File

- Windows: Sắp xếp và di chuyển giữa các cửa sổ làm việc

Cửa sổ thứ 2 cũng rất quan trọng là SPSS Viewer

Với cửa sổ này ta có thể lựa chọn và đọc các kết quả (Outputs ) theo dạng cấu trúc

cây Tại đây ta cũng có thể hiệu đính sửa chữa các kết quả và lưu lại để dùng sau này (Xem hình 1.2)

Hình 1.2 Cửa sổ SPSS Viewer

Cần chú ý rằng trong loại cửa sổ này nếu ta kích đúp bảng kết quả như bảng của

hình 1.2 thì xuất hiện menu Pivot rất tiện ích cho việc thay đổi cột và hàng của bảng

mà ta gọi là hiệu đính bảng trụ Nháy chuột vào Pivot và chọn Pivoting trays ta có

một công cụ như hình 1.3 Với công cụ này ta có thể thay đổi cách trình bày một bảng kết quả tính toán theo ý muốn bằng cách chỉ cần dùng phương pháp kéo thả các biểu

Trang 8

tượng từ cột sang hàng hoặc ngược lại Như hình 1.3 ta có thể chuyển các chỉ tiêu

thống kê (Statistics ) đang biểu thị theo hàng sang cách biểu thị theo cột

Hình1.3

Cửa số thứ 3 cũng rất quan trọng là cửa sổ Chart Editor dùng để hiệu đính và sửa

chữa các biểu đồ thống kê (Xem hình 1.4)

Hình1.4 Cửa sổ SPSS Chart Editor

Tất nhiên muốn mở được cửa sổ này ta cần kích hoạt biểu đồ và từ menu Edit ta chọn SPSS Chart Object \Open Ngoài ra còn có một số cửa sổ khác như cửa sổ hiệu

đính cú pháp (Syntax Editor) hiệu đính văn bản đầu ra (Text output Editor )…

1.3 Các hộp thoại trong SPSS (Dialogue Boxs)

Làm việc trong môi trường Window các hộp thoại có các đặc tính chung như

các nút bấm (Pushpottons) các hộp danh sách, hộp lựa chọn (Option Boxs) và các hộp kiểm tra (check Boxes)

Statistic

s

Trang 9

Hộp lựa chọn

Nút bấm lựa chọn Hộp kiểm tra Hộp để khai báo biến

Hình 1.5 Một dạng hộp thoại trong SPSS

Thường các hộp thoại đầu tiên dùng để khai báo biến và lựa chọn các hướng phân tích cơ bản Tiếp theo là các hộp thoại được hình thành từ các nút bấm theo yêu cầu của chuyên gia phân tích Như hộp thoại trên hình 1.5 nếu không khai báo gì thêm thì ta có ngay một biểu đồ tần số dạng cột chỉ số người tương ứng với trình độ học vấn Nếu muốn thay đổi một mặc định nào đó thì ta

chọn Options và nếu muốn ghi tên biểu đồ thì chọn Tiles Cần chú ý là sau khi khai báo xong các hộp thoại từ các nút bấm phải click vào Continue để trở về hộp

thoại ban đầu và sau đó kết thúc bằng OK

1.4 Phân loại các biến trong SPSS

Trong SPSS các biến quan sát thường được chia làm 2 loại : biến định tính và biến định lượng hay còn gọi là đại lượng Trong Lâm nghiệp, biến định tính như chất lượng cây trồng được phân ra thành cây tốt, cây xấu hoặc cây sống, cây chết …, dấu hiệu định lượng như các số đo về đường kính về chiều cao của cây, số cây chứa trong các ô quan sát, và các đại lượng khác có thể cân đong đo đếm được Tuy nhiên, trong thời đại kỹ thuật số người ta có thể chuyển đổi các biến định tính về biến định lượng bằng cách mã hoá như cho điểm học tập của học sinh là một ví dụ Đối với các biến

định lượng trong SPSS người ta chia thành các thang đo khoảng (interval scale) và các thang đo tỷ lệ (ratio scale) Còn đối với biến định tính được số hoá người ta chia

làm thang đo định danh (nominal scale) không mang tính chất thứ bậc và thang đo

Trang 10

mang tính chất thứ bậc (ordinal scale) Trong lâm nghiệp, các thang đo định danh

không thứ bậc như giới tính trong điều tra Lâm nghiệp xã hội (nam=1, nữ = 0) Trong ví dụ này, các con số 0 và 1 chỉ mang ý nghĩa định danh không mang ý nghĩa thứ bậc Việc tính toán các đặc trưng mẫu như trung bình và phương sai là không có

ý nghĩa Trái lại, địa hình chân sườn đỉnh (Chân=1, sườn =2, đỉnh =3) là một thang

đo thứ bậc Vì rằng hàm lượng các chất dinh dưỡng ở 3 địa hình trên là khác nhau Dấu hiệu quan sát

Biến định lượng Biến định tính

Thang đo khoảng Thang đo tỷ lệ Thang đo thứ bậc TĐ không thứ bậc

Hình 1.6 Sơ đồ các thang đo của số liệu quan sát

1.5 Tổ chức các biến trong SPSS

Trong chương trình SPSS, các biến (variables) có một vị trí quan trọng nhưng

vai trò của chúng rất khác nhau Có những biến là những đại lượng quan sát như chiều cao, đường kính, đường kính tán của cây chẳng hạn là những biến dùng để phân tích

đánh giá, so sánh và ước lượng Nhưng cũng có những biến đóng vai trò là những nhân tố ảnh hưởng đến sinh trưởng của cây như địa hình, mật độ, loại phân bón hoặc

có những biến làm nhiệm vụ phân nhóm (grouping variables) để có thể phân chia các

biến định lượng thành các nhóm khác nhau như so sánh sinh trưởng chiều cao của cây giữa các địa hình, giữa các dạng lập địa Việc tổ chức các biến một cách thích hợp cho một bài toán phân tích thống kê trên SPSS là một thành công bước đầu rất quan trọng, góp phần thực hiện thắng lợi các bước tiếp theo Sau đây là những loại biến có thể thường gặp trong nghiên cứu lâm nghiệp theo từng chủ đề phân tích thống kê

1.5.1 So sánh các mẫu quan sát và thí nghiệm

Trong phương pháp thống kê này thì đường kính, chiều cao, đường kính tán, thể tích cây (trên 1 ô) là những biến quan sát Các biến phân nhóm có thể là địa hình (chân, sườn, đỉnh ), loài cây, xuất sứ, mật độ trồng Khi đưa vào màn hình SPSS, các biến quan sát được cho thành từng cột, mỗi biến một cột riêng lẻ, và biến phân nhóm

(Grouping Variables ) cho vào một cột theo các mã 1, 2, 3 Với SPSS, ta có thể so

sánh chiều cao trung bình (hoặc các đại lượng quan sát khác) của địa hình 1 với địa hình 2 (hoặc dạng lập địa 1 và 2) cả cho trường hợp phương pháp tham số và phi tham số

1.5.2 Phân tích phương sai

Khi phân tích phương sai 1 nhân tố, việc tổ chức các biến cũng giống như khi so sánh các mẫu độc lập Các nhân tố cần nghiên cứu có thể là địa hình, mật độ trồng, hoặc là phương pháp tạo giống Trong phân tích phương sai 2, 3 nhân tố thì các đại lượng quan sát như chiều cao, đường kính là những biến cần được phân tích; các biến như mật độ, địa hình, phân bón là những biến nhân tố để hai hoặc 3 cột khác nhau

Trang 11

1.5.3 Kiểm tra tính độc lập

Đây là một trường hợp đặc biệt thường gây khó khăn cho người làm phân tích thống kê Khác với phân tích phương sai, đường kính, chiều cao cây là những đại lượng quan sát cần phân tích thì trong kiểm tra tính độc lập tần số là yếu tố cần phân tích; còn các nhân tố làm ảnh hưởng đến sự phân bố tần số nói trên đóng vai trò là các biến định tính Các nhân tố làm ảnh hưởng đến sự phân bố tần số nói trên như các loài cây chịu

ảnh hưởng của yếu tố sinh thái làm thay đổi sự xuất hiện số cây của từng loài trong các

ô quan sát ở đây các nhân tố (biến định tính ) đóng vai trò là những biến được mã hoá

thành các số 1, 2, 3 sau đó dùng lệnh Crosstabs để có bảng tần số theo hai chiều ứng

với các biến định tính

1.5.4 Về tương quan và hồi quy

So với các phương pháp trên, thì trong tương quan và hồi quy việc tổ chức các biến là khá đơn giản Thông thường có bao nhiêu đại lượng quan sát cần xác lập tương quan thì cần bấy nhiêu biến Tuy nhiên, nếu cần lập tương quan riêng cho từng chủ thể nào đó thì ta nên lập thêm một cột biến phụ Chẳng hạn, khi lập tương quan giữa H và

D1.3 cho nhiều loài cây thì cần có một biến phụ là loài cây theo mã hoá 1, 2, 3 Khi

đưa biến này vào thì kết quả sẽ cho tương quan giữa H và D1.3 theo từng loài cây (dùng

mục lệnh Select cases)

1.6 Cách ghi biến trong SPSS 10.0/11.5/12.5

1.6.1 Trường hợp ghi số liệu vào 1 file có sẵn

Sau khi SPSS được mở ta nhận được hộp thoại sau

Hình 1.7 Hộp thoại SPSS for windows

Từ hộp thoại này, ta chọn một trong những file có sẵn trong tuỳ chọn open an

existing data source (hoặc chọn từ Open trong menu file ở cữa sổ SPSS data Editor)

Nhấp chuột vào File này ta có màn hình với trạng thái data view với các số liệu đã đưa

Ngày đăng: 05/08/2014, 19:21

HÌNH ẢNH LIÊN QUAN

Hình 1.5  Một dạng hộp thoại trong SPSS  Thường các hộp thoại đầu tiên dùng để khai báo biến và lựa chọn các  h−ớng phân tích cơ bản - Khai thác và sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp - Chương 1 pps
Hình 1.5 Một dạng hộp thoại trong SPSS Thường các hộp thoại đầu tiên dùng để khai báo biến và lựa chọn các h−ớng phân tích cơ bản (Trang 9)
Hình 1.6   Sơ đồ các thang đo của số liệu quan sát - Khai thác và sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp - Chương 1 pps
Hình 1.6 Sơ đồ các thang đo của số liệu quan sát (Trang 10)
Hình variable view vừa thực hiện ở trên (Xem hình 1.10) .Sau khi ghi xong nhớ làm các  thủ tục ghi file vào một file có sẵn hoặc một file mới - Khai thác và sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp - Chương 1 pps
Hình variable view vừa thực hiện ở trên (Xem hình 1.10) .Sau khi ghi xong nhớ làm các thủ tục ghi file vào một file có sẵn hoặc một file mới (Trang 13)
Bảng dưới để xác định những chủ thể cần lựa chọn.  Chẳng hạn ta cần nghiên  cứu các đặc tr−ng thống kê của những cây có chất l−ợng trung bình và tốt ta  ghi clu ≤ 2 hoăc clu=1⏐clu=2 (tức các cây có có mã chất l−ợng 1và 2) - Khai thác và sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp - Chương 1 pps
Bảng d ưới để xác định những chủ thể cần lựa chọn. Chẳng hạn ta cần nghiên cứu các đặc tr−ng thống kê của những cây có chất l−ợng trung bình và tốt ta ghi clu ≤ 2 hoăc clu=1⏐clu=2 (tức các cây có có mã chất l−ợng 1và 2) (Trang 16)
Hình 1.12 .  Hộp thoại Compute Variable - Khai thác và sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp - Chương 1 pps
Hình 1.12 Hộp thoại Compute Variable (Trang 19)
Hình 1.13  Hộp thoại Weight cases - Khai thác và sử dụng SPSS để xử lý số liệu nghiên cứu trong lâm nghiệp - Chương 1 pps
Hình 1.13 Hộp thoại Weight cases (Trang 19)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w