MỘT SỐ HÀM THỐNG KÊ THÔNG DỤNG TRONG EXCEL I. Cách chọn một hàm trong Excel Để chọn một hàm trong EXCEL ta có thể tiến hành một trong hai cách sau: Cách 1: Đưa con trỏ tới nơi cần đặt giá trị của hàm Gõ trực tiếp tên hàm cùng với các tham số cần thiết Nhấn phím Enter. Cách 2: Đưa con trỏ tới nơi cần đặt giá trị của hàm Thực hiện lệnh InsertFunction hoặc nháy trỏ chuột vào Function Wizard (fx)
Trang 1một Số hàm thống kê thông dụng trong excel
I Cách chọn một hàm trong Excel
Để chọn một hàm trong EXCEL ta có thể tiến hành một trong hai cách sau:
Cách 1:
- Đa con trỏ tới nơi cần đặt giá trị của hàm
- Gõ trực tiếp tên hàm cùng với các tham số cần thiết
- Nhấn phím Enter
Cách 2:
- Đa con trỏ tới nơi cần đặt giá trị của hàm
- Thực hiện lệnh Insert/Function hoặc nháy trỏ chuột vào Function Wizard (fx)
- trên Standard Toolbar, hộp thoại Paste Function xuất hiện
- Chọn nhóm hàm trong mục Function category
- Chọn tên hàm trong mục Function Name
- Chọn OK, rồi nhập thông số (nếu cần)
- Cuối cùng chọn Finish ( OK)
II Một số hàm thống kê thông thờng:
1 Hàm SUM():
Hàm này dùng để tính tổng các giá trị có trong danh sách đối số
- Cú pháp: =SUM(DATA)↵
Trang 2Ví Dụ: Có bảng lơng tháng 01 năm 2001của một Công
ty A nh sau
Đơn vị ( 1000 đ VN)
1 Họ đệm Tên Đơn vị Mức lơng
2 Nguyễn
văn
5)
2 Hàm AVERAGE():
Hàm này dùng để tính giá trị trung bình (Mean) các
dãy số
+ Cú pháp: =AVERAGE(Data) ↵
Ví dụ: Có số liệu về diện tích, năng suất cây Cà fê
của một số hộ nh sau
hộ
Diện tích(ha)
Năng suất(tạ/ha)
)
3 Hàm MEDIAN() (Giá trị trung vị):
- Cú pháp = MEDIAN(DATA) ↵
VD: Trở lại ví dụ trên tại một ô nào đó chúng ta gõ nhập
= MEDIAN(B2:B5) ↵
4 Hàm MAX():
Trang 3Hàm MAX cho ta các cực đại của tập hợp giữ liệu Trong EXCEL hàm Max cho ra giá trị cực đại
- Cú pháp: = MAX(DATA) ↵
Các đối số chỉ cho biết khối ô chứa giữ liệu
VD: Tại một ô nào đó chúng ta gõ ngõ nhập = MAX(B2:B5) ↵ chúng ta sẽ đợc diện tích lớn nhất của các hộ trên là bao nhiêu
5 Hàm MIN():
Hàm MIN cho ta giá trị cực tiểu trong một dãy số
- Cú pháp: = MIN(DATA) ↵
VD: Tại một ô nào đó gõ nhập = MIN(B2:B5) ↵ chúng ta
sẽ đợc diện tích nhỏ nhất của các hộ trên là bao nhiêu
* khoản biến thiên R
R = XMAX - XMIN
Trong đó
R: Khoảng biến thiên
Xmax: Lợng biến lớn nhất
Xmin: Lợng biến nhỏ nhất
6 Hàm MODE():( Mốt)
Để tính MODE trong EXCEL chúng ta dùng cú pháp nh sau
- Cú pháp: = MODE(Data) ↵
- VD: Trở lại ví dụ trên, tại một ô nào đó chúng ta gõ nhập =MODE(B2:B5) ↵
Chú ý: Nếu hàm MODE cho báo lỗi #N/A ( Not Available
“ Giá trị bất khả thi ” ) nghĩa là tập hợp dữ liệu không có mốt
7 Hàm VAR() và VARP():
Tính phơng sai của mẫu và tổng thể
+ Cú pháp =VAR(Data) ↵
Vi dụ: Có số liệu về Doanh thu, chi phí quảng cáo của một công ty nh sau ( Đơn vị tính tr.đồng)
Doanh thu Chi phí
Trang 41 quảng cáo
9 =VAR(A2:A8
) 1
0
Để tính phơng sai của chỉ tiêu doanh thu, thì tại ô A9 chúng ta gõ nhập công thức sau: = VAR(A2:A8) ↵
8 Hàm STDEV() và STDEVP():
Để tính độ lệch tiêu chuẩn của mẫu và của tổng thể + Cú pháp = STDEV(DATA) ↵
+ VD: Tại ô A12 gõ = STDEV(A2:A8) ↵
9 Hàm COVAR():
Hiệp phơng sai của hai dãy số X và Y Sử dụng hiệp
ph-ơng sai để xác định quan hệ giữa hai tập hợp dữ liệu Công thức tính hiệp phơng sai nh sau
n
y y x x Y
X
) , (
Để tính hiệp phơng sai trên EXCEL chúng ta sử dụng hàm COVAR() cú pháp nh sau
- Cú pháp = COVAR(dãy số Y, dãy số X) ↵
- VD: Tại ô A10 gõ nhập công thức
=COVAR(A2:A8,B2:B8) ↵
10 Hàm COUNT():
Cho kết quả là một số biểu thị số các ô chứa các giá trị là số trong các ô (dung lợng mẫu n)
- Cú pháp: = COUNT(Data) ↵
- VD: Tại ô A11 gõ = COUNT(A2:A8) ↵
Trang 511 Hệ số biến động CV%( hệ số biến thiên) công thức tính nh sau:
100
*
%
X
CV = σ
12 Hàm INTERCEPT()
Tính hệ số chặn của (tung độ gốc) đờng hồi quy
- Cú pháp = INTECEPT(Data của biến Y, Data của biến X) ↵
VD: + giả sử tại B1 nhập B2, B3,B4, B5 có các số lần lợt
1500, 13000, 20000, 10000
+ Ô chính C1 ta nhập phụ cấp các ô C2, C3, C4, C5 ta nhập 5000, 4000, 7000, 3000
Thì tại ô b7 ta gõ = INTERCEPT(C2:C5, B2:B5) ↵
13 Hàm SLOPE()
Tính hệ số ảnh hởng (độ dốc) của đờng hồi quy
- Cú pháp = SLOPE(dãy số biến Y, dãy số biến X) ↵
VD: tại B7 gõ =SLOPE(C2:C5, B2:B5)
14 Hàm CORREL():
- Cho ra hệ số tơng quan cặp của các dãy ô hai dãy số
Sử dụng hệ số tơng quan để xác định mối quan hệ
t-ơng quan giữa hai dãy số của hai biến nào đó
- Cú pháp = CORREL(dãy số X,dãy sốY) ↵
- VD: Tại ô B8 gõ = CORREL(C2:C5, B2:B5) ↵
15 Hàm SUMPRODUCT():
Hàm này cho phép nhân các thành phần tơng ứng trong một mảng đợc cho, rồi cho ra tổng của các tích này
Cú pháp = SUM PRODUCT(dãy số 1, dãy số 2) ↵
16 Hàm AVEDEV(): Tính độ lệch tuyệt đối bình quân của một tập hợp
Một số chức năng THốNG KÊ KHáC
1 Nhập dữ liệu cần thiết vào bảng tính
2 Chọn thực đơn Tools trên Menu bar
3 Chọn Data Analysis
Trang 6Xuất hiện hộp hội thoại:
I PHâN TíCH THốNG Kê Mô Tả :
Chọn Descriptive Statistics Hộp thoại xuất hiện nh sau
Phần đối thoại gồm:
- Imput Range: Nhập vùng dữ liệu cần sử lý
- Grouped By:
+ Columns: xử lý theo cột
+ Rows: xử lý theo dòng
- Label in first row: Dòng đầu tiên vùng dữ liệu vào hàm
- Kth Largest: Trị quan sát lớn thứ K
- Kth Smallest: Trị quan sát nhỏ thứ K
- Output Range: Khai báo vùng kết xuất kết quả
5 Chọn OK hoặc ↵
Ví dụ: Có hai mẫu số liệu nh sau:
Mẫu 1: 152, 132, 123, 126, 136, 142, 136, 154
Tuần tự theo các bớc nh trên chúng ta sẽ đợc kêt quả
Trang 7Standard Error (Sai soỏ tieõu chuaồn) 3.964
Standard Deviation (ẹoọ leọch tieõu chuaồn) 11.211 Sample Variance (Phửụng sai maóu) 125.696 Kurtosis (ẹoọ Nhoùn cuỷa phaõn phoỏi) -0.994 Skewness (ẹoọ leọch cuỷa phaõn phoỏi) 0.346 Range (Khoaỷng bieỏn thieõn) 31.000 Minimum (Giaự trũ nhoỷ nhaỏt) 123.000 Maximum (Giaự trũ lụựn nhaỏt) 154.000
Largest(2) (Giaự trũ lụựn nhaỏt thửự K-2) 152.000 Smallest(2) (Giaự trũ beự nhaỏt thửự K-2) 126.000
II Tính bảng hệ số tơng quan cặp:
Chọn Correlation Hộp thoại xuất hiện nh sau
Phần đối thoại gồm:
- Imput Range: Nhập vùng dữ liệu cần sử lý
- Grouped By:
+ Columns: xử lý theo cột
+ Rows: xử lý theo dòng
- Label in first row: Dòng đầu tiên vùng dữ liệu làm nhãn
- Output Range: Khai báo vùng kết xuất kết quả
Chọn OK hoặc ↵
Trang 8Ví dụ: Từ bốn dãy số sau:
Column 1
Column 2
Column 3
Column 4
Tuần tự theo các bớc nh trên chúng ta sẽ đợc kêt quả sau
Column
1 Column 2 Column 3 Column 4
Column
Column
Column
Column
III Tính bảng Hiệp phơng sai
Chọn Covariance hộp thoại xuất hiện nh sau
Phần đối thoại gồm:
- Imput Range: Nhập vùng dữ liệu cần sử lý
- Grouped By:
+ Columns: xử lý theo cột
+ Rows: xử lý theo dòng
- Label in first row: Dòng đầu tiên vùng dữ liệu làm nhãn
Trang 9- Output Range: Khai báo vùng kết xuất kết quả.
Chọn OK hoặc ↵
Ví dụ: Từ bốn dãy số trên, tuần tự theo các bớc nh trên chúng ta sẽ đợc kêt quả sau
Column 1
Column 2
Column 3
Column 4
Column 1
367,472
2 Column
Column
Column
IV.Tạo một dãy số phân phối
Chọn Histogram, hộp thoại xuất hiện nh sau
Phần đối thoại gồm:
- Imput Range: Nhập vùng dữ liệu cần sử lý
- Bin Gange: Nhập vùng Bin
- Output Range: Khai báo vùng kết xuất kết quả
- Pareto (sorted Histogram): Bảng phân phối sắp xếp theo tần số giảm dần
Trang 10- Cumulative Perceentage: Tần suất tích luỹ
- Chart Output: Kết xuất đồ thị
Chọn OK hoặc ↵
V Chọn một mẫu từ một tập hợp
Chọn Sampling, hộp thoại xuất hiện nh sau
Phần đối thoại gồm:
- Imput Range: Nhập vùng dữ liệu cần sử lý
- Periodic: chọn mẫu máy móc (chọn theo từng khoảng cách)- period: độ dài khoảng cách chọn
- Random: Chọn mẫu ngẫu nhiên- Number of samples: dung lợng mẫu
- Output Range: Khai báo vùng kết xuất kết quả Chọn OK hoặc ↵
VI TạO DãY Số BìNH QUÂN DI Động
Chọn Moving Average xuất hiện hộp thoại
Trang 11Phần đối thoại gồm:
- Imput Range: Nhập vùng dữ liệu cần sử lý
- Interval: Nhập số số bình quân di động
- Output Range: Khai báo vùng kết xuất kết quả Chọn OK hoặc ↵
• TạO BảNG Và Đồ THị BáO CáO TổNG HợP Dữ
LIệU
Trong quản lý dữ liệu cần thiết phải có những báo cáo tổng hợp dữ liệu Từ một bảng dữ liệu, với chức năng tổng hợp có thể tạo ra các bảng tổng hợp dữ liệu nhanh bao gồm nhiều nhân tố với các giá trị tổng hợp đa dạng
nh số trung bình, tổng, tích,
Trớc hết lập một bảng dữ liệu gồm nhiều biến (trờng), sau đó sử dụng chức năng Pivot Table hoặc Pivot Chart Report để làm các bảng tổng hợp dữ liệu, báo cáo tóm tắt Tiến trình nh sau:
- Nhập dữ liệu vào bảng tính
- Vào menu: Data/Pivot table and Pivot Chart report
Trang 12- Tiếp tục chọn lựa Pivot table để tạo bảng tổng hợp hoặc chọn Pivot chart để tào đồ thị tổng hợp
- Sau đó chọn các biến số cần tổng hợp và loại dữ liệu tổng hợp trong bảng hội thoại
- Kết quả sẽ có đợc bảng tổng hợp dữ liệu, hoặc đồ thị tổng hợp
Vẽ đồ thị trong Excel
Trang 13ớc 1:
Thực hiện lệnh Insert/Chart xuất hiện hộp thoại Step 1 of 4- chart Type
+ Chọn kiểu đồ thị ở hộp Chart type và hộp Chart sub-type
+ Chọn Next để sang bớc 2
Trang 14ớc 2:
Khi chọn next xuất hiện xuất hiện bảng Step 2 of 4-chart Source Data
+ trong Data Range: đa địa chỉ của dữ liệu cần vẽ
đồ thị
+ Chọn mục Data Series In:
Chọn Rows: Nếu muốn phân tích dữ liệu theo hàng
Trang 15Chọn mục Columns: Nếu muốn phân tích dữ liệu theo cột
+ Chọn Next để sang bớc tiếp theo
B
ớc 3:
Khi chọn next xuất hiện xuất hiện bảng Step 3 of 4-chart Option
+ Chart Title: Đặt tiêu đề cho đồ thị
+ Category(X): Vào tiêu đề trục X
+ Value(Y): Vào tiêu đề trục Y
+ Sau đó chọn Next
B
ớc 4:
Khi chọn next xuất hiện xuất hiện bảng Step 4 of 4-chart Location
Trang 16+ Chọn As New sheet: Nếu muốn tạo đồ thị trong một bảng tính mới
+ Chọn On this sheet: Nếu muốn tạo đồ thị trong cùng bảng tính
+ Chọn Finish: hoàn tất công việc vẽ đồ thị
Phân tích hồi quy
Để giải bài toán hồi quy tuyến tính đơn trong EXCEL
ta lần lợt theo các bớc sau:
1 Nhập số liệu
2.Chọn thực đơn Tools trên Menu bar
3 Chọn Data Analysis
4 Chọn Regression, rồi chọn OK hộp hội thoại Regression sẽ hiện ra
Trang 17Phần đối thoại trong hộp hội thoại Regression có những nội dung sau:
Imput:
- Imput Y Range: Khai báo vùng dữ liệu cho biến Y
- Imput X Range: Khai báo vùng dữ liệu cho biến X
Output options:
- Output Range: Khai báo vùng kết xuất kết quả
5 Chọn OK xuất hiện một số kết quả dới đây:
SUMMARY OUTPUT Regression Statistics Multiple R
0.64552
23
R Square 0.4166991 Adjusted R
Square 0.4136128
Standard Error 8.3537851 Observations 191
ANOVA
Trang 18df SS MS F
Significance
F
Regressio
9422.3
3
9422.32
9
135.0
Residual 189 13189.5 69.78572
Total 190 22611.8
Coefficie nts
Standa rd Error t Stat value P- Lower 95% Upper 95%
Intercept 49.942260 1.513643 32.99473 0.0000 46.956457 52.92806407
X Variable 1 0.300955 0.025900 11.61972 0.0000 0.249864 0.35204575
Observati
Predicted
Y Residual s (e i ) Residuals Standard Y Bình quaân
1
40.8 2
51.74798
965
-10.9275
02
-1.3115458
69
66.0670 97
2
61.1 1
51.94661
983
9.16264
84
1.0997237
94
342.30 52.47028126
-10.1736
96
-1.2210722
62 4
57.7 6
53.33101
242
4.43288
83
0.5320462
59
541.83 54.01117052
-12.1858
04
-1.4625703
82
6
53.8 4
54.52279
377
-0.68718
43
-0.0824775
69
753.84 54.97422581
-12.0361
76
-1.4446117
72
8 42.9 55.01034 3.14087 0.3769759
Trang 194 065 78 43
9
58.1 5
55.19693
236
-10.9857
13
-1.3185324
85
1044.21 55.3775054
-4.49506
67
-0.5395090
66 11
50.8 8
55.54604
055
15.2100
55
1.8255485
86
giải thích ý nghỹa của các tham số
* Regression Statistics:
- Heọ soỏ tửụng quan boọi R (Multiple R)=
∑
∑
−
− 2
2
) (
) (
Avt i
Avt Est
Y Y
Y Y
- Heọ soỏ hoài qui boọi bỡnh phửụng R2 (R.Square )
=RSS/TSS
- R2 Hieọu chổnh (Adjusted R square )=(1-S2/Sy2) Duứng ủeồ so sanh ủaựnh giaự moõ hỡnh hoài qui coự thớch hụùp hay khoõng thớch hụùp khi caực moõ hỡnh coự cuứng chung moọt bieỏn phuù thuoọc
+ S2 : Phửụng sai maóu cuỷa phaàn dử =
1
2
−
∑
n
e i
; (ei=Yi-Yest)
+ S2y: Phửụng sai maóu cuỷa Y
- Sai soỏ chuaồn cuỷa hoài qui (s) (Standard error):
) 2 (
2
−
n
e
- Observation: Dung lợng mẫu ( n)
* ANOVA( Analysis of Variance ) Phân tích phơng sai hồi quy:
- Toồng bỡnh phửụng hoài qui (RSS) (Sum of squares):
∑ −
= (Y Est Y Avt) 2
RSS
- Toồng bỡnh phửụng sai soỏ (ESS) : ESS =∑(Y i −Y Est) 2
- Toồng bỡnh phửụng toaứn phaàn: (TSS):
∑ −
= (Y i Y Avt) 2
TSS
- MS( Mean of Squares): Bình quân của tổng các bình phơng của các độ biến động
- F: Thông kê F
Trang 20- Giá trị “1.513643” là sai số chuẩn của tung độ gốc (a):
∑
∑
2 2
i
i a
x n
X S s
- Giá trị “0.025900” là sai số chuẩn của độ dốc (b):
∑
i
b
x
S
s ;(xi =Xi-XAV)
- Cột trị thống kê t (t Stat) = cột sai số chuẩn / cột hệ số
- P-value: Mức ý nghĩa của kiệm định
- Cột Lower 95%: cận dưới của khoản tin cậy = Giá trị cột hệ số (a hay b)-tc* s của a hay b
- Cột Upper 95% : cận trên của khoảng tin
cậy= Giá trị cột hệ số (a hay b)+tc* s của a hay b
+ tc: Giá trị thống kê t tra ở bảng thống kê Student với mức ý nghía 5% , số bậc tự do
n-2 Chúng ta có thể sử dụng hàm =TINV(Mức
ý nghía; só bậc tự do) Trở lại ví dụ trên ta có: =TINV(0.05;189)=1.972593
Phần dư được chuẩn hoá =Phần dư của hồi qui (ei)/Độ lệch chuẩn mẫu của phần dư (S)