Bài giảng cung cấp cho người học các kiến thức: Nhật đồ và thống kê, sắp xếp số liệu, khảo sát đồ thị, xử lý trong SPSS,... Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.
BÀI 1- NHẬT ĐỒ VÀ THỐNG KÊ I- NỘI DUNG Việc xử lý liệu khảo sát tính thống kê cho biến Trong sinh học có loại biến : biến định tính biến định lượng Mỗi loại biến lại bao gồm nhiều loại như: biến định tính gồm biến nhị nguyên (Binary) lấy giá trị (1 hay có khơng), biến phân loại (hay định danh Nominal) gồm số loại không xếp thứ tự biến thứ hạng (Ordinal) Biến định lượng gồm biến có thang đo khoảng cách (Interval scale) biến hiệu số giá trị có ý nghĩa cịn tỷ số khơng có ý nghĩa, giá trị mang tính quy ước, biến có thang đo tỷ số (Ratio scale) có gốc có đơn vị đo tỷ số lấn hiệu số có ý nghĩa Sau có liệu cần làm số việc: a- SẮP XẾP SỐ LIỆU Trường hợp số liệu để nguyên dãy số liệu xếp lại theo thứ tự (Sort), trường hợp nhiều số liệu dùng dãy: dãy số liệu khác dãy số lần gặp (tần số) Trường hợp có nhiều số liệu chia khoảng đếm số điểm rơi vào khoảng (tần số) Khi xử lý lấy điểm làm đại diện cho khoảng Giá trị Giá trị Tần số x1 x1 m1 x2 x2 xn Khoảng cách Điểm Tần số [x0 - x0 + h] x1 m1 m2 [xo + h - x0 + 2h] x2 m2 xk mk [xo + (k-1)h - xo + xk mk kh] b- ĐỒ THỊ Có nhiều kiểu đồ thị để khảo sát sơ dãy số liệu N D Hien Kiểu cành Vẽ đồ thị thể tần số việc chia khoảng dãy số liệu (160161), (162- 163), (164- 165), (166-167), (168-169) ) Cành (Stem) viết tắt trị nguyên 160, 170, (Leaf) số lẻ 0, 1, 2, Chieucao Stem-and-Leaf Plot Frequency 1.00 5.00 10.00 22.00 8.00 17.00 18.00 11.00 5.00 2.00 1.00 Stem width: Each leaf: Stem & 16 16 16 16 16 17 17 17 17 17 18 Leaf 22233 4444444555 6666666666777777777777 88888899 00000000111111111 222222222222233333 44444455555 66667 89 10 case(s) Kiểu hộp với đường trung vị Me giữa, đáy hộp đường tứ phân vị, hai ria kéo dài đến số to nhỏ số cách Me không 1,5 lần khoảng cách giưa tứ phân vị (chiều dài hộp) Các điểm cách xa vẽ riêng điểm 185.0 180.0 175.0 170.0 165.0 160.0 Chieucao Kiểu nhật đồ (Histogram) có thêm đường cong chuẩn Mục đích nhật đồ:Chia lớp có nhiều số liệu để thấy rõ nét đặc trưng dãy số liệu sau kiểm tra tính chuẩn N D Hien Cách làm: Gọi khoảng cách từ trị nhỏ nhất(Min) đến trị lớn nhất(Max) khoảng biến động Chia khoảng biến động thành số khoảng nhỏ đếm số số liệu nằm khoảng (tần số) Vẽ nhật đồ thể tần số Sơ đánh giá số liệu có phân phối chuẩn hay khơng (các đỉnh chữ nhật thể tần số có nằm gần đường cong mật độ chuẩn hay khơng) Các phần mềm thống kê lớn có phần kiểm tra tính chuẩn theo kiểm định Kolgomorov-Smirnov, Shapiro-Wilk, Ryan-Joiner, Anderson-Darling Các kiểm định thường so sánh hàm phân phối thực nghiêm hàm phân phối chuẩn từ đưa thống kê thể sai khác kèm theo xác suất (P-value) để làm có chấp nhận giả thiết dãy số liệu phân phối chuẩn hay không? Nếu P-value mức ý nghĩa α chấp nhận tính chuẩn Tính chuẩn cịn kiểm tra qua đường cong mật độ chuẩn, qua đồ thị hàm phân phối thực nghiệm vẽ giấy xác suất (thường gọi đường Q – Q quartiles – quartiles), v.v II- XỬ LÝ TRONG SPSS Vào SPSS Mở Worksheet Baitap1 Chọn menu Analyse Descriptive Statistics sau chọn cách Frequencies, Descriptives hay Explore a- Frequencies chọn Dobeo đưa vào Variables sau vào Statistics (Thống kê) Charts (Đồ thị), mục có options để chọn lựa N D Hien b- Descriptives Làm tương tự frequencies N D Hien c- Explore Chọn Dobeo vào Dependent List, Statistics chọn Descriptives Trong Plots chọn Histogram Normality plots with Tests để vừa vẽ nhật đồ vừa kiểm định tính chuẩn N D Hien Các kết Các thống kê bản: Tùy việc chọn Descriptives, frequencies hay explore tùy theo options nên toàn phần thống kê Mean, Stdandard deviation, Median, Mode, Variance, Thí dụ Explore N D Hien Căn vào mức Significant (0,200 0,317) hai tiêu chuẩn kiểm định kết luận: Chấp nhận tính chuẩn Đồ thị Q – Q để kiểm tra tính chuẩn Các điểm gần với đường thẳng nên chấp nhận tính chuẩn Trong Frequencies vẽ nhật đồ đường cong chuẩn để đối chiếu N D Hien Để đưa biến không chuẩn biến chuẩn thực phép đổi biến, hay dùng phép bình phương, lấy bậc hai, lấy Lơgarit, biến đổi Arcsin Thí dụ biến oocysts không chuẩn Vào Transform Compute dặt tên biến oocysts1, chọn biểu thức thí du Sqrt (oocysts) biến oocysyts1 (biến đổi bậc hai) Vào Transform Compute dặt tên biến oocysts2, chọn biểu thức thí du oocysts *oocysts biến oocysyts2 (Biến đổi bình phương) Nếu chọn biến oocysts3 sau chọn phép biến đổi log (oocysts) phép biến oocysts3(Biến đổi logarit) Biến oocysts1 oocyst2 khơng chuẩn Thí dụ oocysts1 N D Hien 10 Biến oocysts3 phân phối chuẩn Normal Q-Q Plot of oocysts3 Expected Normal -2 -4 3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 Observed Value N D Hien 11 ... II- XỬ LÝ TRONG SPSS Vào SPSS Mở Worksheet Baitap1 Chọn menu Analyse Descriptive Statistics sau chọn cách Frequencies, Descriptives hay Explore a- Frequencies chọn Dobeo đưa vào Variables sau vào... (tần số) Vẽ nhật đồ thể tần số Sơ đánh giá số liệu có phân phối chuẩn hay không (các đỉnh chữ nhật thể tần số có nằm gần đường cong mật độ chuẩn hay không) Các phần mềm thống kê lớn có phần kiểm... Kolgomorov-Smirnov, Shapiro-Wilk, Ryan-Joiner, Anderson-Darling Các kiểm định thường so sánh hàm phân phối thực nghiêm hàm phân phối chuẩn từ đưa thống kê thể sai khác kèm theo xác suất (P-value)