1. Trang chủ
  2. » Công Nghệ Thông Tin

tổng hợp một số hàm thống kê trong excel

20 306 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 329 KB

Nội dung

MỘT SỐ HÀM THỐNG KÊ THÔNG DỤNG TRONG EXCEL I. Cách chọn một hàm trong Excel Để chọn một hàm trong EXCEL ta có thể tiến hành một trong hai cách sau: Cách 1: Đưa con trỏ tới nơi cần đặt giá trị của hàm Gõ trực tiếp tên hàm cùng với các tham số cần thiết Nhấn phím Enter. Cách 2: Đưa con trỏ tới nơi cần đặt giá trị của hàm Thực hiện lệnh InsertFunction hoặc nháy trỏ chuột vào Function Wizard (fx)

Trang 1

một Số hàm thống kê thông dụng trong excel

I Cách chọn một hàm trong Excel

Để chọn một hàm trong EXCEL ta có thể tiến hành một trong hai cách sau:

Cách 1:

- Đa con trỏ tới nơi cần đặt giá trị của hàm

- Gõ trực tiếp tên hàm cùng với các tham số cần thiết

- Nhấn phím Enter

Cách 2:

- Đa con trỏ tới nơi cần đặt giá trị của hàm

- Thực hiện lệnh Insert/Function hoặc nháy trỏ chuột vào Function Wizard (fx)

- trên Standard Toolbar, hộp thoại Paste Function xuất hiện

- Chọn nhóm hàm trong mục Function category

- Chọn tên hàm trong mục Function Name

- Chọn OK, rồi nhập thông số (nếu cần)

- Cuối cùng chọn Finish ( OK)

II Một số hàm thống kê thông thờng:

1 Hàm SUM():

Hàm này dùng để tính tổng các giá trị có trong danh sách đối số

- Cú pháp: =SUM(DATA)↵

Trang 2

Ví Dụ: Có bảng lơng tháng 01 năm 2001của một Công

ty A nh sau

Đơn vị ( 1000 đ VN)

1 Họ đệm Tên Đơn vị Mức lơng

2 Nguyễn

văn

5)

2 Hàm AVERAGE():

Hàm này dùng để tính giá trị trung bình (Mean) các

dãy số

+ Cú pháp: =AVERAGE(Data) ↵

Ví dụ: Có số liệu về diện tích, năng suất cây Cà fê

của một số hộ nh sau

hộ

Diện tích(ha)

Năng suất(tạ/ha)

)

3 Hàm MEDIAN() (Giá trị trung vị):

- Cú pháp = MEDIAN(DATA) ↵

VD: Trở lại ví dụ trên tại một ô nào đó chúng ta gõ nhập

= MEDIAN(B2:B5) ↵

4 Hàm MAX():

Trang 3

Hàm MAX cho ta các cực đại của tập hợp giữ liệu Trong EXCEL hàm Max cho ra giá trị cực đại

- Cú pháp: = MAX(DATA) ↵

Các đối số chỉ cho biết khối ô chứa giữ liệu

VD: Tại một ô nào đó chúng ta gõ ngõ nhập = MAX(B2:B5) ↵ chúng ta sẽ đợc diện tích lớn nhất của các hộ trên là bao nhiêu

5 Hàm MIN():

Hàm MIN cho ta giá trị cực tiểu trong một dãy số

- Cú pháp: = MIN(DATA) ↵

VD: Tại một ô nào đó gõ nhập = MIN(B2:B5) ↵ chúng ta

sẽ đợc diện tích nhỏ nhất của các hộ trên là bao nhiêu

* khoản biến thiên R

R = XMAX - XMIN

Trong đó

R: Khoảng biến thiên

Xmax: Lợng biến lớn nhất

Xmin: Lợng biến nhỏ nhất

6 Hàm MODE():( Mốt)

Để tính MODE trong EXCEL chúng ta dùng cú pháp nh sau

- Cú pháp: = MODE(Data) ↵

- VD: Trở lại ví dụ trên, tại một ô nào đó chúng ta gõ nhập =MODE(B2:B5) ↵

Chú ý: Nếu hàm MODE cho báo lỗi #N/A ( Not Available

“ Giá trị bất khả thi ” ) nghĩa là tập hợp dữ liệu không có mốt

7 Hàm VAR() và VARP():

Tính phơng sai của mẫu và tổng thể

+ Cú pháp =VAR(Data) ↵

Vi dụ: Có số liệu về Doanh thu, chi phí quảng cáo của một công ty nh sau ( Đơn vị tính tr.đồng)

Doanh thu Chi phí

Trang 4

1 quảng cáo

9 =VAR(A2:A8

) 1

0

Để tính phơng sai của chỉ tiêu doanh thu, thì tại ô A9 chúng ta gõ nhập công thức sau: = VAR(A2:A8) ↵

8 Hàm STDEV() và STDEVP():

Để tính độ lệch tiêu chuẩn của mẫu và của tổng thể + Cú pháp = STDEV(DATA) ↵

+ VD: Tại ô A12 gõ = STDEV(A2:A8) ↵

9 Hàm COVAR():

Hiệp phơng sai của hai dãy số X và Y Sử dụng hiệp

ph-ơng sai để xác định quan hệ giữa hai tập hợp dữ liệu Công thức tính hiệp phơng sai nh sau

n

y y x x Y

X

) , (

Để tính hiệp phơng sai trên EXCEL chúng ta sử dụng hàm COVAR() cú pháp nh sau

- Cú pháp = COVAR(dãy số Y, dãy số X) ↵

- VD: Tại ô A10 gõ nhập công thức

=COVAR(A2:A8,B2:B8) ↵

10 Hàm COUNT():

Cho kết quả là một số biểu thị số các ô chứa các giá trị là số trong các ô (dung lợng mẫu n)

- Cú pháp: = COUNT(Data) ↵

- VD: Tại ô A11 gõ = COUNT(A2:A8) ↵

Trang 5

11 Hệ số biến động CV%( hệ số biến thiên) công thức tính nh sau:

100

*

%

X

CV = σ

12 Hàm INTERCEPT()

Tính hệ số chặn của (tung độ gốc) đờng hồi quy

- Cú pháp = INTECEPT(Data của biến Y, Data của biến X) ↵

VD: + giả sử tại B1 nhập B2, B3,B4, B5 có các số lần lợt

1500, 13000, 20000, 10000

+ Ô chính C1 ta nhập phụ cấp các ô C2, C3, C4, C5 ta nhập 5000, 4000, 7000, 3000

Thì tại ô b7 ta gõ = INTERCEPT(C2:C5, B2:B5) ↵

13 Hàm SLOPE()

Tính hệ số ảnh hởng (độ dốc) của đờng hồi quy

- Cú pháp = SLOPE(dãy số biến Y, dãy số biến X) ↵

VD: tại B7 gõ =SLOPE(C2:C5, B2:B5)

14 Hàm CORREL():

- Cho ra hệ số tơng quan cặp của các dãy ô hai dãy số

Sử dụng hệ số tơng quan để xác định mối quan hệ

t-ơng quan giữa hai dãy số của hai biến nào đó

- Cú pháp = CORREL(dãy số X,dãy sốY) ↵

- VD: Tại ô B8 gõ = CORREL(C2:C5, B2:B5) ↵

15 Hàm SUMPRODUCT():

Hàm này cho phép nhân các thành phần tơng ứng trong một mảng đợc cho, rồi cho ra tổng của các tích này

Cú pháp = SUM PRODUCT(dãy số 1, dãy số 2) ↵

16 Hàm AVEDEV(): Tính độ lệch tuyệt đối bình quân của một tập hợp

Một số chức năng THốNG KÊ KHáC

1 Nhập dữ liệu cần thiết vào bảng tính

2 Chọn thực đơn Tools trên Menu bar

3 Chọn Data Analysis

Trang 6

Xuất hiện hộp hội thoại:

I PHâN TíCH THốNG Kê Mô Tả :

Chọn Descriptive Statistics Hộp thoại xuất hiện nh sau

Phần đối thoại gồm:

- Imput Range: Nhập vùng dữ liệu cần sử lý

- Grouped By:

+ Columns: xử lý theo cột

+ Rows: xử lý theo dòng

- Label in first row: Dòng đầu tiên vùng dữ liệu vào hàm

- Kth Largest: Trị quan sát lớn thứ K

- Kth Smallest: Trị quan sát nhỏ thứ K

- Output Range: Khai báo vùng kết xuất kết quả

5 Chọn OK hoặc ↵

Ví dụ: Có hai mẫu số liệu nh sau:

Mẫu 1: 152, 132, 123, 126, 136, 142, 136, 154

Tuần tự theo các bớc nh trên chúng ta sẽ đợc kêt quả

Trang 7

Standard Error (Sai soỏ tieõu chuaồn) 3.964

Standard Deviation (ẹoọ leọch tieõu chuaồn) 11.211 Sample Variance (Phửụng sai maóu) 125.696 Kurtosis (ẹoọ Nhoùn cuỷa phaõn phoỏi) -0.994 Skewness (ẹoọ leọch cuỷa phaõn phoỏi) 0.346 Range (Khoaỷng bieỏn thieõn) 31.000 Minimum (Giaự trũ nhoỷ nhaỏt) 123.000 Maximum (Giaự trũ lụựn nhaỏt) 154.000

Largest(2) (Giaự trũ lụựn nhaỏt thửự K-2) 152.000 Smallest(2) (Giaự trũ beự nhaỏt thửự K-2) 126.000

II Tính bảng hệ số tơng quan cặp:

Chọn Correlation Hộp thoại xuất hiện nh sau

Phần đối thoại gồm:

- Imput Range: Nhập vùng dữ liệu cần sử lý

- Grouped By:

+ Columns: xử lý theo cột

+ Rows: xử lý theo dòng

- Label in first row: Dòng đầu tiên vùng dữ liệu làm nhãn

- Output Range: Khai báo vùng kết xuất kết quả

Chọn OK hoặc ↵

Trang 8

Ví dụ: Từ bốn dãy số sau:

Column 1

Column 2

Column 3

Column 4

Tuần tự theo các bớc nh trên chúng ta sẽ đợc kêt quả sau

Column

1 Column 2 Column 3 Column 4

Column

Column

Column

Column

III Tính bảng Hiệp phơng sai

Chọn Covariance hộp thoại xuất hiện nh sau

Phần đối thoại gồm:

- Imput Range: Nhập vùng dữ liệu cần sử lý

- Grouped By:

+ Columns: xử lý theo cột

+ Rows: xử lý theo dòng

- Label in first row: Dòng đầu tiên vùng dữ liệu làm nhãn

Trang 9

- Output Range: Khai báo vùng kết xuất kết quả.

Chọn OK hoặc ↵

Ví dụ: Từ bốn dãy số trên, tuần tự theo các bớc nh trên chúng ta sẽ đợc kêt quả sau

Column 1

Column 2

Column 3

Column 4

Column 1

367,472

2 Column

Column

Column

IV.Tạo một dãy số phân phối

Chọn Histogram, hộp thoại xuất hiện nh sau

Phần đối thoại gồm:

- Imput Range: Nhập vùng dữ liệu cần sử lý

- Bin Gange: Nhập vùng Bin

- Output Range: Khai báo vùng kết xuất kết quả

- Pareto (sorted Histogram): Bảng phân phối sắp xếp theo tần số giảm dần

Trang 10

- Cumulative Perceentage: Tần suất tích luỹ

- Chart Output: Kết xuất đồ thị

Chọn OK hoặc ↵

V Chọn một mẫu từ một tập hợp

Chọn Sampling, hộp thoại xuất hiện nh sau

Phần đối thoại gồm:

- Imput Range: Nhập vùng dữ liệu cần sử lý

- Periodic: chọn mẫu máy móc (chọn theo từng khoảng cách)- period: độ dài khoảng cách chọn

- Random: Chọn mẫu ngẫu nhiên- Number of samples: dung lợng mẫu

- Output Range: Khai báo vùng kết xuất kết quả Chọn OK hoặc ↵

VI TạO DãY Số BìNH QUÂN DI Động

Chọn Moving Average xuất hiện hộp thoại

Trang 11

Phần đối thoại gồm:

- Imput Range: Nhập vùng dữ liệu cần sử lý

- Interval: Nhập số số bình quân di động

- Output Range: Khai báo vùng kết xuất kết quả Chọn OK hoặc ↵

TạO BảNG Và Đồ THị BáO CáO TổNG HợP Dữ

LIệU

Trong quản lý dữ liệu cần thiết phải có những báo cáo tổng hợp dữ liệu Từ một bảng dữ liệu, với chức năng tổng hợp có thể tạo ra các bảng tổng hợp dữ liệu nhanh bao gồm nhiều nhân tố với các giá trị tổng hợp đa dạng

nh số trung bình, tổng, tích,

Trớc hết lập một bảng dữ liệu gồm nhiều biến (trờng), sau đó sử dụng chức năng Pivot Table hoặc Pivot Chart Report để làm các bảng tổng hợp dữ liệu, báo cáo tóm tắt Tiến trình nh sau:

- Nhập dữ liệu vào bảng tính

- Vào menu: Data/Pivot table and Pivot Chart report

Trang 12

- Tiếp tục chọn lựa Pivot table để tạo bảng tổng hợp hoặc chọn Pivot chart để tào đồ thị tổng hợp

- Sau đó chọn các biến số cần tổng hợp và loại dữ liệu tổng hợp trong bảng hội thoại

- Kết quả sẽ có đợc bảng tổng hợp dữ liệu, hoặc đồ thị tổng hợp

Vẽ đồ thị trong Excel

Trang 13

ớc 1:

Thực hiện lệnh Insert/Chart  xuất hiện hộp thoại Step 1 of 4- chart Type

+ Chọn kiểu đồ thị ở hộp Chart type và hộp Chart sub-type

+ Chọn Next để sang bớc 2

Trang 14

ớc 2:

Khi chọn next  xuất hiện xuất hiện bảng Step 2 of 4-chart Source Data

+ trong Data Range: đa địa chỉ của dữ liệu cần vẽ

đồ thị

+ Chọn mục Data Series In:

Chọn Rows: Nếu muốn phân tích dữ liệu theo hàng

Trang 15

Chọn mục Columns: Nếu muốn phân tích dữ liệu theo cột

+ Chọn Next để sang bớc tiếp theo

B

ớc 3:

Khi chọn next  xuất hiện xuất hiện bảng Step 3 of 4-chart Option

+ Chart Title: Đặt tiêu đề cho đồ thị

+ Category(X): Vào tiêu đề trục X

+ Value(Y): Vào tiêu đề trục Y

+ Sau đó chọn Next

B

ớc 4:

Khi chọn next  xuất hiện xuất hiện bảng Step 4 of 4-chart Location

Trang 16

+ Chọn As New sheet: Nếu muốn tạo đồ thị trong một bảng tính mới

+ Chọn On this sheet: Nếu muốn tạo đồ thị trong cùng bảng tính

+ Chọn Finish: hoàn tất công việc vẽ đồ thị

Phân tích hồi quy

Để giải bài toán hồi quy tuyến tính đơn trong EXCEL

ta lần lợt theo các bớc sau:

1 Nhập số liệu

2.Chọn thực đơn Tools trên Menu bar

3 Chọn Data Analysis

4 Chọn Regression, rồi chọn OK hộp hội thoại Regression sẽ hiện ra

Trang 17

Phần đối thoại trong hộp hội thoại Regression có những nội dung sau:

Imput:

- Imput Y Range: Khai báo vùng dữ liệu cho biến Y

- Imput X Range: Khai báo vùng dữ liệu cho biến X

Output options:

- Output Range: Khai báo vùng kết xuất kết quả

5 Chọn OK  xuất hiện một số kết quả dới đây:

SUMMARY OUTPUT Regression Statistics Multiple R

0.64552

23

R Square 0.4166991 Adjusted R

Square 0.4136128

Standard Error 8.3537851 Observations 191

ANOVA

Trang 18

df SS MS F

Significance

F

Regressio

9422.3

3

9422.32

9

135.0

Residual 189 13189.5 69.78572

Total 190 22611.8

Coefficie nts

Standa rd Error t Stat value P- Lower 95% Upper 95%

Intercept 49.942260 1.513643 32.99473 0.0000 46.956457 52.92806407

X Variable 1 0.300955 0.025900 11.61972 0.0000 0.249864 0.35204575

Observati

Predicted

Y Residual s (e i ) Residuals Standard Y Bình quaân

1

40.8 2

51.74798

965

-10.9275

02

-1.3115458

69

66.0670 97

2

61.1 1

51.94661

983

9.16264

84

1.0997237

94

342.30 52.47028126

-10.1736

96

-1.2210722

62 4

57.7 6

53.33101

242

4.43288

83

0.5320462

59

541.83 54.01117052

-12.1858

04

-1.4625703

82

6

53.8 4

54.52279

377

-0.68718

43

-0.0824775

69

753.84 54.97422581

-12.0361

76

-1.4446117

72

8 42.9 55.01034 3.14087 0.3769759

Trang 19

4 065 78 43

9

58.1 5

55.19693

236

-10.9857

13

-1.3185324

85

1044.21 55.3775054

-4.49506

67

-0.5395090

66 11

50.8 8

55.54604

055

15.2100

55

1.8255485

86

giải thích ý nghỹa của các tham số

* Regression Statistics:

- Heọ soỏ tửụng quan boọi R (Multiple R)=

− 2

2

) (

) (

Avt i

Avt Est

Y Y

Y Y

- Heọ soỏ hoài qui boọi bỡnh phửụng R2 (R.Square )

=RSS/TSS

- R2 Hieọu chổnh (Adjusted R square )=(1-S2/Sy2) Duứng ủeồ so sanh ủaựnh giaự moõ hỡnh hoài qui coự thớch hụùp hay khoõng thớch hụùp khi caực moõ hỡnh coự cuứng chung moọt bieỏn phuù thuoọc

+ S2 : Phửụng sai maóu cuỷa phaàn dử =

1

2

n

e i

; (ei=Yi-Yest)

+ S2y: Phửụng sai maóu cuỷa Y

- Sai soỏ chuaồn cuỷa hoài qui (s) (Standard error):

) 2 (

2

n

e

- Observation: Dung lợng mẫu ( n)

* ANOVA( Analysis of Variance ) Phân tích phơng sai hồi quy:

- Toồng bỡnh phửụng hoài qui (RSS) (Sum of squares):

∑ −

= (Y Est Y Avt) 2

RSS

- Toồng bỡnh phửụng sai soỏ (ESS) : ESS =∑(Y iY Est) 2

- Toồng bỡnh phửụng toaứn phaàn: (TSS):

∑ −

= (Y i Y Avt) 2

TSS

- MS( Mean of Squares): Bình quân của tổng các bình phơng của các độ biến động

- F: Thông kê F

Trang 20

- Giá trị “1.513643” là sai số chuẩn của tung độ gốc (a):

2 2

i

i a

x n

X S s

- Giá trị “0.025900” là sai số chuẩn của độ dốc (b):

i

b

x

S

s ;(xi =Xi-XAV)

- Cột trị thống kê t (t Stat) = cột sai số chuẩn / cột hệ số

- P-value: Mức ý nghĩa của kiệm định

- Cột Lower 95%: cận dưới của khoản tin cậy = Giá trị cột hệ số (a hay b)-tc* s của a hay b

- Cột Upper 95% : cận trên của khoảng tin

cậy= Giá trị cột hệ số (a hay b)+tc* s của a hay b

+ tc: Giá trị thống kê t tra ở bảng thống kê Student với mức ý nghía 5% , số bậc tự do

n-2 Chúng ta có thể sử dụng hàm =TINV(Mức

ý nghía; só bậc tự do) Trở lại ví dụ trên ta có: =TINV(0.05;189)=1.972593

Phần dư được chuẩn hoá =Phần dư của hồi qui (ei)/Độ lệch chuẩn mẫu của phần dư (S)

Ngày đăng: 27/04/2018, 13:55

TỪ KHÓA LIÊN QUAN

w