Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 78 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
78
Dung lượng
6,08 MB
Nội dung
Mục lục 1 TỔNG QUÁT VỀ CHỨC NĂNG XỬ LÝ THỐNG KÊ CỦA MS.EXCEL 2007 VÀ STATGRAPHICS CENTURION XV 1.1 1.2 Tổng quát phần xử lý thống kê MS Excel Tổng quát phần mềm xử lý thống kê Statgraphics Centurion THỐNG KÊ MÔ TẢ 10 SẮP XẾP VÀ VẼ BIỂU ĐỒ PHÂN BỐ TẦN SỐ XUẤT HIỆN THEO CẤP, CỠ, HẠNG 12 SO SÁNH – MẪU QUAN SÁT BẰNG TIÊU CHUẨN T 14 4.1 4.2 So sánh mẫu với giá trị cho trước – Kiểm tra T mẫu 14 So sánh sai khác trung bình mẫu – Kiểm tra T mẫu 16 PHÂN TÍCH PHƯƠNG SAI 19 5.1 5.2 Phân tích phương sai nhân tố với thí nghiệm ngẫu nhiên hồn tồn 19 Phân tích phương sai nhân tố 22 5.1.1 Phân tích phương sai nhân tố với lần lặp lại: (Bố trí thí nghiệm theo khối ngẫu nhiên đầy đủ (Randomized Complete Blocks) (RCB): 22 5.1.2 Phân tích phương sai nhân tố m lần lặp 28 PHÂN TÍCH TƯƠNG QUAN - HỒI QUY 32 6.1 6.2 6.2.1 6.2.2 6.3 6.4 6.5 Hồi quy tuyến tính lớp 32 Dạng phi tuyến đưa tuyến tính lớp 34 Lập mơ hình hàm mũ Excel: .34 Lập mơ hình hàm mũ lớp Statgraphics: .36 Ước lượng dạng hồi quy lớp tuyến tính phi tuyến tính đồ thị 40 Hồi quy tuyến tính nhiều lớp 45 Hồi quy phi tuyến tính nhiều lớp, tổ hợp biến 47 MÔ HÌNH HỐ QUY LUẬT PHÂN BỐ 57 7.1 7.2 7.3 Mơ hình hố phân bố giảm theo hàm Meyer 57 Mô phân bố thực nghiệm theo phân bố khoảng cách-hình học: 60 Mô phân bố thực nghiệm theo phân bố Weibull: 62 LỜI NÓI ĐẦU Trong quản lý tài nguyên thiên nhiên, ứng dụng công nghệ tin học đóng vai trị quan trọng phân tích, quản lý sở liệu; ứng dụng tin học xử lý thống kê áp dụng ngày rộng rải Thông qua xử lý thống kê phần mềm, giúp hệ thống hóa sở liệu, đánh giá thí nghiệm, phân tích mối quan hệ phức tạp tự nhiên với nhân tố xã hội để tìm quy luật nhằm quản lý bền vững Xử lý thống kê thông qua công nghệ tin học ngày phát triển bước dài, giúp cho người rút ngắn thời gian tính tốn, xử lý lượng lớn thơng tin có hiểu biết cách khách quan quy luật tự nhiên xã hội Do thành tựu cơng nghệ xử lý thống kê tin học cần ứng dụng cách rộng rải quan lý tài nguyên thiên nhiên Có nhiều phần mềm ứng dụng để xử lý thống kê SPSS, Statgraphics, Excel Microsoft Excel người biết đến nói đến cơng cụ bảng tính, tính tóan , chức chuyên sâu ứng dụng thống kê sinh học, quản lý tài ngun thiên nhiên, mơi trường lại đề cập đến Trong chức xử lý thống kê phần mềm Excel phong phú mạnh để ứng dụng thí nghiệm, phân tích, đánh giá kết nghiên cứu, điều tra khảo sát lâm nghiệp, quản lý tài nguyên thiên nhiên Trong bao gồm xử lý thống kế phổ biến như: Phân tích đặc trưng mẫu, so sánh mẫu thí nghiệm, phân tích phương sai, tương quan hồi quy, dự báo… phần mềm Excel chọn lựa để giới thiệu Các phần mềm thống kê chuyên dụng phổ biến giới Statgrahics, SPSS, … Đây phần mềm thống kê ứng dụng rộng hầu hết lĩnh vực nghiên cứu, phân tích liệu nhiều ngành khác xã hội, tự nhiên Ứng dụng mạnh phần mềm phân tích mơ hình hồi quy đa biến dạng tuyến tính hay phi tuyến tính với cách phân tích đa dạng hồi quy lọc, hồi quy bước, tổ hợp biến, mã hóa tự động biến định tính, … Do phần mềm Statgraphics Centurion XV giới thiệu để người đọc tiếp cận với cơng cụ phân tích thống kê Tài liệu không sâu vào lý thuyết xác suất thống kê, mà thiên hướng ứng dụng đơn giản, dễ hiểu, kèm theo ví dụ để người đọc thực hành chức xử lý, phân tích liệu Excel, Statgraphics Centurion XV cách nhanh chóng, thuận tiện hoạt động quản lý nghiên cứu lâm nghiệp, quản lý tài nguyên thiên nhiên, môi trường TỔNG QUÁT VỀ CHỨC NĂNG XỬ LÝ THỐNG KÊ CỦA MS.EXCEL 2007 VÀ STATGRAPHICS CENTURION XV 1.1 Tổng quát phần xử lý thống kê MS Excel Excel thiết kế sẵn số chương trình để xử lý số liệu phân tích thống kê ứng dụng nhiều lĩnh vực: - Chức xử lý số liệu, tạo bảng tổng hợp liệu: Sắp xếp, tính tốn nhanh bảng tổng hợp từ số liệu thô, - Chức hàm: Cung cấp hàng loạt hàm kỹ thuật, thống kê, kinh tế tài chính, hàm tra tiêu thống kê t, F, - Chức Data Analysis: Dùng để phân tích thống kê phân tích đặc trưng mẫu, tiêu chuNn t để so sánh sai khác, phân tích phương sai, ước lượng tương quan hồi quy - Phân tích mơ hình tưong quan hồi quy để dự báo thay đổi theo thời gian đề thị Lưu ý: Về việc cài đặt chương trinh phân tích liệu (Data Analysis) Excel: - Khi cài đặt phần mềm Excel phải thực chế độ chọn lựa cài đặt, sau phải chọn mục: Add-Ins Analysis Toolpak - Khi chạy Excel lần đầu cần mở chế độ phân tích liệu cách: Menu Tools/Add-Ins chọn Analysis ToolpakOK (Đối với MS Office 2003) Đối với MS Office 2007, tiến hành mở chế độ phân tích thống kê sau: Kích vào Microsoft Office Button sau chọn excel options, kích vào Add-ins, chọn Analysis ToolPak hộp thoại OK Như thực tế quản lý liệu nơng lâm nghiệp nói riêng, việc khai thác hết tiềm ứng dụng Excel mang lại hiệu tốt mà khơng thiết phải tìm kiếm thêm phần mềm chuyên dụng khác Vấn đề đặt xác định chiến lược ứng dụng khai thác sâu công cụ chức sẵn có phần mềm phổ biến vi tính cá nhân Một số hàm thơng dụng thống kê: o Tính tổng: =Sum(dãy đs) o Tổng bình phương: =Sumq(dãy đs) o Trung bình: =Average(dãy đs) o Lấy giá trị tuyệt đối: =Abs(đs) o Trị lớn nhất, nhỏ nhất: =Max(dãy đs), Min(dãy đs) o Các hàm lượng giác: =Cos(đs), =Sin(đs), =tan(đs) o Hàm mũ, log: =Exp(đs), =Ln(đs), =Log(đs) o Căn bậc 2: =Sqrt(đs) o Sai tiêu chuNn mẫu chưa hiệu đính: =Stdevp(dãy đs); hiệu đính =Stdev(dãy đs) o Phương sai mẫu chưa hiệu đính: =Varp(dãy đs); hiệu đính =Var(dãy đs) o Giai thừa: =Fact(n) o Số Pi: =Pi() Tra giá trị T, F, 2: Chọn ô lấy giá trị tra Kích nút fx cơng cụ chuNn Trong hộp thoại Function Category, chọn Statistical Trong mục Function name, chọn hàm: Hàm Tinv: để tra T Hàm Chiinv: để tra Hàm Finv: để tra F Bấm Next Trong hộp thoại tiếp theo: Function Wizard chọn: o Probability (fx): Gõ vào mức ý nghĩa =0.05 ; 0.01 hay 0.001 o Degrees Freedom (fx): Gõ vào bậc tự Đối với tiêu chuNn F cần đua vào độ tự o Finish 1.2 Tổng quát phần mềm xử lý thống kê Statgraphics Centurion Đây phần mềm chuyên dụng xử lý thống kê, bao gồm chức năng: - Tạo lập sở liệu dạng bảng tính - Tính tốn đặc trưng mẫu, vẽ sơ đồ, đồ thị quan hệ - So sánh hai hay nhiều mẫu tiêu chuNn thống kê t, U, F nhiều tiêu chuNn phi tham số khác - Phân tích phương sai ANOVA - Kiểm tra tính chuNn liệu đổi biến số - Thiết lập mô hình hồi quy tuyến tính hay phi tuyến tính từ nhiều lớp, tổ hợp biến Với cách xử lý đa dạng để chọn lựa biến ảnh hưởng đến hậu qủa (biến phụ thuộc) Giao tiếp Statgraphics Centurion, số liệu đầu vào nhập trực tiếp file bảng tính sở liệu; song với làm không thuận tiện bước xử lý số liệu thơ đổi biến số, tính biến trung gian, mã hóa biến số Do thơng thường nên tạo lập sở liệu bảng tính Excel để sử dụng chức bảng tính mạnh xử lý liệu thơ, tạo lập sở liệu; sau nhập vào Statgraphics Centurion để tính tốn, thiết lập mơ hình, Cơ sở liệu lập Excel cần lưu dạng phiên Excel 97 – 2003, chưa nhận file Excel version 2007 Sau nhập liệu Excel 97-2003, đóng file Excel mở Statgrahics Centurion sau: File/Open/Open Data Source; chọn External Data File – OK Trong hộp thoại mở file, chọn kiểu file Excel chọn file cần mở tạo trước THỐNG KÊ MƠ TẢ Để có hiểu biết rõ ràng đối tượng quan sát sinh trưởng rừng lơ rừng, đa dạng lồi của lơ rừng, biến động mật độ tái sinh, tỷ lệ sống trồng rừng, cần áp dụng thống kê mô tả, bao gồm tiến hành thu thập liệu mẫu từ tính tốn đặc trưng mẫu để ước lượng tiêu thống kê tổng thể Đây thơng tin đối tượng quan sát, theo tiêu, nhân tố quan tâm Các đặc trưng mẫu mơ tả bao gồm tính tiêu bản: Số trung bình, phương sai, sai tiêu chuNn, độ lệch, độ nhọn dãy số liệu quan sát phạm vi biến động theo độ tin cậy cho trước Ví dụ: Khảo sát đặc trưng sinh trưởng rừng trồng tếch Số liệu đo D1,3 rừng trồng Tếch 14 tuổi ô tiêu chuNn 500m Các đặc trưng mẫu tính đồng thời Excel theo bước: Nhập số liệu theo cột hàng Menu Tools/Data Analyisis/Descriptive Statistics/OK (Hoặc Data/Data Analysis MS Ofice 2007) Có hộp thoại, cần xác định: o Input range: Khai báo khối liệu o Grouped by: Chọn liệu nhập theo cột (Columns) hàng (Rows) o Label in first row: Nếu đưa vào hàng tiêu đề đánh dấu o Output range: Đánh vào địa ô trái nơi đưa kết o Summary Statistics: Thông tin tóm lược đặc trưng thống kê (đánh dấu) o Confidence Level for Mean: Chọn độ tịnh cậy: 90% 95% 99% tùy theo yêu cầu đánh giá, phân tích ướng lượng o Kích nút OK Bảng nhập liệu đường kính D1.3 Tếch Bảng khai báo tính đặc trưng mẫu Kết tính đặc trưng mẫu D1,3 (cm) Mean 18,98 Standard Error 0,442 Median Mode Standard Deviation 19,1 19,42 3,16 Sample Variance 9,986 Kurtosis 0,852 Skewness -0,227 Range 17,19 Minimum 9,868 Maximum 27,06 Sum Count Confidence Level (95,0%) 968 51 0,889 Giải thích kết quả: o Mean (Xbq): Số trung bình o Standard Error: Sai số số trung bình mẫu o Median: Trung vị mẫu o Mode: Trị số ứng với tần số phân bố tập trung o Standard deviation (S): Sai tiêu chuNn mẫu o Sample variance: Phương sai mẫu o Kurtosis (Ku): Độ nhọn phân bố o Skewness (Sk): Độ lệch phân bố o Minimum: Trị số quan sát bé o Maximum: Trị số quan sát lớn o Sum: Tổng trị số quan sát o Count: Dung lượng mẫu o Cofidence level (95%): Sai số tuyệt đối ước lượng với độ tin cậy 95% Với kết phân tích đặc trưng mẫu, rút số thông kê quan trọng sau: - Giá trị trung bình biến động sai tiêu chuNn, phương sai, max, - Mẫu quan sát chuNn hay chưa thông qua Ku Sk Mẫu tiệm cận chuNn bảo đảm số liệu quan sát đủ giá trị ước lượng tin cậy theo độ tin cậy cho trước; khơng giá trị sai lệch thực tế Với mẫu quan sát đạt phân bố chuNn Ku Sk xấp xỉ o Kurtosis: Độ nhọn phân bố Ku = phân bố thực nghiệm tiệm cận chuNn Ku > đường cong có dạng bẹt so với phân bố chuNn Ku < đường cong có đỉnh nhọn so với phân bố chuNn Ví dụ Ku = Kurt(A2:A52) = 0.852 Đỉnh đường cong thấp so với phân bố chuNn o Skewness: Độ lệch phân bố Sk = phân bố đối xứng Sk > đỉnh đường cong lệch trái so với số trung bình Sk < đỉnh đường cong lệch phải so với số trung bình Ví dụ Sk = Skew(A2:A52) = -0.227 Đường cong lệch phải o Minimum: Trị số quan sát bé Nếu mẫu phân bố chưa chuNn cần bổ sung mẫu theo công thức mẫu cần thiết nct: ≥ % /∆% Trong V% hệ số biến động: % = ௌௌ ௌ ௌ 100 Δ% sai số tương đối cho trước - Ước lượng phạm vi biến động giá trị trung bình, ví dụ với độ tin cậy 95% đường kính trung bình khu rừng tếch 14 tuổi biến động phạm vi: 18.98 ± 0.89 cm Hay P(Xbq - Cofidence level (95%) ≤µ≤ Xbq + Cofidence level (95%) = 0.95 SẮP XẾP VÀ VẼ BIỂU ĐỒ PHÂN BỐ TẦN SỐ XUẤT HIỆN THEO CẤP, CỠ, HẠNG Đây chức xếp bảng phân bố tần số theo nhân tố theo cấp, hạng, vẽ đồ thị phân bố Trong nghiên cứu xã hội, người ta cần nghiên cứu tần số phân bố số người theo cấp tuổi để biết phân bổ người theo hệ để có chiến lược quản lý nguồn nhân lực Trong quản lý tài nguyên thiên nhiên, thường cần nghiên cứu phân bố số lượng cá thể lồi theo cấp tuổi, cấp kích thước để biết quy luật biến đổi cá thể theo hệ, theo kích thước, chất lượng, sở quản lý, bảo tồn định hướng khai thác sử dụng bền vững Trong lâm nghiệp thường cần xếp phân bố số theo cỡ kính (N/D), số theo cỡ chiều cao (N/H), số theo cấp thể tích (N/V), số theo lồi theo tầng rừng, hệ để tổ chức quản lý điều chế rừng Ví dụ từ số liệu quan sát rừng trồng Tếch 10 tuổi, tiến hành xếp phân bố thực nghiệm N/H vẽ biểu đồ (cấp H 2m): Nạp số liệu chiều cao vào bảng tính theo cột Lập cột giới hạn cỡ kính Vd: cỡ 2m Bảng tóm tắt liệu đầu vào Menu Tools/Data Analysis/Histogram/OK (Data/Data Analysis MS Office 20907) Xuất hộp thoại, xác định: + Input range: Khai báo khối liệu + Bin range: Khai báo khối chứa cự ly tổ + Output range: Khai địa ô trái nơi đưa kết + Cumulative percentage: Tính phần trăm tần số tích lũy.(Đánh dấu) + Chart output: Vẽ biểu đồ (Đánh dấu chọn) + OK Kết qủa xếp phân bố tần số Kết xếp tần số cho dãy liệu theo cấp biểu đồ phân bố Nó phản ảnh cụ thể đặc trưng mẫu cho thấy hình ảnh kiểu dạng phân bố theo cấp, hệ; từ giúp cho việc phân tích quần thể đưa định quản lý, sử dụng bền vững Ví dụ biểu đồ trên, số phân hóa mạnh theo cấp chiều cao, số sinh trưởng cấp chiều cao nhỏ – 12m, số vượt tán có cấp H 22m; giải pháp đề nghị tỉa thưa loại bỏ bớt sinh trưởng có H < 12m tỉa thưa số lớn với H>22m để lợi dụng trung gian, lúc cá thể có kích thước tập trung phạm vi 14 – 22m có đủ khơng gian dinh dưỡng để phát triển SO SÁNH – MẪU QUAN SÁT BẰNG TIÊU CHUẨN T Kiểm tra mẫu tiêu chuNn t dựa vào giả thiết phân phối chuNn mẫu quan sát Có hai loại kiểm tra t: kiểm tra t mẫu (one-sample t-test), t cho hai mẫu (two-sample ttest) Kiểm tra t mẫu để đánh giá số trung bình mẫu có phải thật gía trị hay khơng? Kiểm tra t hai mẫu để so sánh hai mẫu có luật phân phối, hay cụ thể hai mẫu có thật có trị số trung bình hay khơng? Hay nói khác có sai khác hai mẫu quan sát hay không? 4.1 So sánh mẫu với giá trị cho trước – Kiểm tra T mẫu Trong mô tả quan sát mẫu, người ta có yêu cầu đánh giá giá trị trung bình mẫu với giá trị cho trước, ví dụ từ đo đếm chiều cao tái sinh rừng khộp, so sánh với giá trị cho trước chiều cao mong đợi để rừng vượt qua lửa rừng, xem thật chiều cao tái sinh lô rừng đạt u cầu hay chưa? Kết mơ phân bố N/D theo phân bố hình học A B Cỡ D1,3 (cm) C D E F G N (c/ha) Nixi Px Nlt (c/ha) X2 x 15 125 0,38521 134 0,66 25 89 89 0,236823 83 0,49 35 56 112 0,145597 51 0,53 45 31 93 0,089511 31 0,00 55 19 76 0,055031 19 0,00 65 40 0,033832 12 1,23 75 10 60 0,0208 1,03 85 35 0,012788 0,12 10 95 24 0,007862 11 105 18 0,004833 12 10 115 10 0,002971 13 Tổng 349 557 0,995258 347 xbq= Alpha= 1,595989 0,61479 X2 bảng= 4,06 12,59 K=8-1-1=6 7.3 Mô phân bố thực nghiệm theo phân bố Weibull: Phân bố Weibull phân bố xác suất biến ngẫu nhiên liên tục với miền giá trị x(0,+) Hàm mật độ: -1 f(x) = .(x - xmin) exp(-(x - xmin) Hàm phân bố: F(x) = - exp(-(x - xmin) Với xmin: trị số quan sát nhỏ x: giá trị quan sát, xếp theo tổ x giá trị tổ Khi: