Tham khảo tài liệu ''giáo trình hình thành quy trình ứng dụng nguyên lý nhận thức hiện tại các tác nhân p5'', công nghệ thông tin, cơ sở dữ liệu phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả
y o c u -tr a c k c Neáu Tools không hành sẵn Data Analysis, ta dùng leänh: Tools / Add – Ins / Analysis ToolPak / OK Giải thích thông số tính cụ thể cột chi phí: Mean (giá trị trung bình): bình quân số học (Average) tất giá trị quan sát Được tính cách lấy tổng giá trị quan sát (Sum) chia cho số quan sát (Count) n X= Xi ∑ i =1 n = 2.267 = 377,83 Standard Error (sai số chuẩn): dùng để đo độ tin cậy giá trị trung bình mẫu Được tính cách lấy độ lệch chuẩn (Standard Deviation) chia cho bậc số quan sát SX = σ n = 36,26 = 14,80 Ta coù thể nói: có khả 95% giá trị trung bình nằm khoảng cộng trừ (+/-) lần sai số chuẩn so với giá trị trung bình Theo ví dụ trên, khoảng: 377,83 − ( × 14,8 ) ;377,83 + ( × 14,8 ) tức khoảng: [348,23 ; 407,43] Dựa vào công thức ta thấy rằng: với độ lệch chuẩn σ không đổi, n lớn S nhỏ Tức khoảng dao động hẹp độ xác cao Người ta dựa vào công thức để tính số quan sát cần thiết n Median (trung vị): giá trị nằm vị trí trung tâm (khác với giá trị trung bình Mean) Được tính cách: • Nếu số quan sát n số lẽ: xếp giá trị quan sát từ nhỏ đến lớn, giá trị đứng vị trí số trung vị 22 d o m o w w w d o C lic k to bu y bu to k lic C w w w N O W ! h a n g e Vi e N PD ! XC er O W F- w m h a n g e Vi e w PD XC er F- c u -tr a c k c y o c u -tr a c k c • Nếu số quan sát n số chẵn: xếp giá trị quan sát từ nhỏ đến lớn, trung bình cộng giá trị đứng vị trí số trung vị Theo ví dụ trên, ta xếp quan sát có giá trị từ nhỏ đến lớn: 323, 354, 365, 403, 410, 412 Median = 365 + 403 = 384 Mode (yếu vị): giá trị xuất nhiều lần Theo ví dụ trên, ta yếu vị (#N/A) Standard Deviation (độ lệch chuẩn): xem độ lệch trung bình, đại diện cho độ lệch (hiệu số) giá trị quan sát thực giá trị trung bình (Mean) Độ lệch chuẩn đại lượng dùng để đo mức độ phân tán (xa hay gần) giá trị quan sát xung quanh giá trị trung bình Được tính cách lấy bậc phương sai σ (trung bình bình phương độ lệch: độ lệch âm – negative deviation độ lệch dương – positive deviation) σ = σ = 1.314,97 = 36,26 ( σ : đọc sigma ) Sample Variance (phương sai mẫu): trung bình bình phương độ lệch Giống độ lệch chuẩn, dùng để xem mức độ phân tán giá trị quan sát thực xung quanh giá trị trung bình Được tính cách lấy tổng bình phương độ lệch (tổng hiệu số giá trị quan sát thực giá trị trung bình) chia cho số quan sát trừ (n – 1) Theo ví dụ ta coù: n σ2 = ( Xi − X )2 ∑ i =1 n −1 = 1.314,97 ( σ : đọc sigma bình phương) 23 d o m o w w w d o C lic k to bu y bu to k lic C w w w N O W ! h a n g e Vi e N PD ! XC er O W F- w m h a n g e Vi e w PD XC er F- c u -tr a c k c y o c u -tr a c k c Kurtosis (độ chóp): hệ số đặc trưng thống kê dùng để đo mức độ “đồng nhất” giá trị quan sát • Đường cong chóp (very peaked): nhọn đứng, kurtosis > Nếu đường biểu diễn mô tả phân phối giá trị doanh thu, ta nói đa số giá trị doanh thu gần với (the same revenue) dù có số mang giá trị nhỏ lớn • Đường cong bẹt (very flat): phẳng nằm, kurtosis < Nếu đường biểu diễn mô tả phân phối giá trị doanh thu, ta nói đa số giá trị doanh thu trải từ nhỏ đến lớn khoảng rộng Theo ví dụ trên, độ chóp bằng: - 1,30 Skewness (độ nghiêng): hệ số dùng để đo “độ nghiêng” phân phối xác suất không cân xứng theo hình chuông 24 d o m o w w w d o C lic k to bu y bu to k lic C w w w N O W ! h a n g e Vi e N PD ! XC er O W F- w m h a n g e Vi e w PD XC er F- c u -tr a c k c y o c u -tr a c k c • Nghiêng trái ta gọi “nghiêng âm” (Skewned to the left), skewness < -1: nghiêng nhiều, > 0,5: nghiêng Nếu đường biểu diễn mô tả phân phối giá trị doanh thu, ta nói đa số giá trị doanh thu gần với doanh thu lớn dù có số mang giá trị nhỏ nhỏ (ở bên trái) • Nghiêng phải ta gọi “nghiêng dương” (Skewned to the right), skewness > 1: nghiêng nhiều, < 0,5: nghiêng Nếu đường biểu diễn mô tả phân phối giá trị doanh thu, ta nói đa số giá trị doanh thu gần với doanh thu nhỏ dù có số mang giá trị lớn lớn (ở bên phải) Theo ví dụ trên, độ nghiêng bằng: -0,58 Range (khoảng) also range width (hay bề rộng khoảng): độ dài khoảng quan sát (khoảng biến thiên), tính lấy giá trị quan sát cực đại Max trừ giá trị quan sát cực tiểu Min Range = Max – Min = 412 – 323 = 89 Minimum (giá trị quan sát cực tiểu): giá trị nhỏ caùc quan saùt 25 d o m o w w w d o C lic k to bu y bu to k lic C w w w N O W ! h a n g e Vi e N PD ! XC er O W F- w m h a n g e Vi e w PD XC er F- c u -tr a c k c y o c u -tr a c k c Min = 323 Maximum (giá trị quan sát cực đại): giá trị lớn quan sát Max = 412 Sum (tổng cộng giá trị quan sát): tổng cộng tất giá trị tất quan sát tập liệu Theo ví dụ trên, ta coù: n Sum = ∑ Xi = 2.267 i =1 Count (số quan sát): số đếm số lần quan sát (n) Theo tập liệu ví dụ trên, ta có: n=6 Phương pháp thống kê hồi quy: Còn gọi thống kê hồi quy đơn giản (simple regression statistical) dùng phương pháp thống kê toán để tính hệ số a, b phương trình hồi quy dựa toàn quan sát tập liệu Đây phương pháp đáng tin cậy đòi hỏi công phu Vẫn dùng số liệu ví dụ trên, lập bảng tính trị số sở vào công thức để tính thông số phương trình Ta có công thức thống kê toán: n ( X − X )(Y − Y ) ∑ i =1 i b= n i ( Xi − X ) ∑ i =1 a = Y − bX (1.3) (1.4) Chứng minh công thức: 26 d o m o w w w d o C lic k to bu y bu to k lic C w w w N O W ! h a n g e Vi e N PD ! XC er O W F- w m h a n g e Vi e w PD XC er F- c u -tr a c k c ... trị số sở vào công thức để tính thông số phương trình Ta có công thức thống kê toán: n ( X − X )(Y − Y ) ∑ i =1 i b= n i ( Xi − X ) ∑ i =1 a = Y − bX (1.3) (1.4) Chứng minh công thức: 26 d o m o... n=6 Phương pháp thống kê hồi quy: Còn gọi thống kê hồi quy đơn giản (simple regression statistical) dùng phương pháp thống kê toán để tính hệ số a, b phương trình hồi quy dựa toàn quan sát tập liệu... bằng: - 1,30 Skewness (độ nghiêng): hệ số dùng để đo “độ nghiêng” phân phối xác suất không cân xứng theo hình chuông 24 d o m o w w w d o C lic k to bu y bu to k lic C w w w N O W ! h a n g e Vi e