Excel’s statistical functions calculate all the standard statistical measures, such as average, maximum, minimum, and standard deviation. For most of the statistical functions, you supply a list of values (which could be an entire population or just a sample from a population). You can enter individual values or cells, or you can specify a range. Excel has dozens of statistical functions, many of which are rarely, if ever, used in business. Những hàm thống kê của Excel tính toán tất cả những các số đo thống kê chuẩn như trung bình, lớn nhất, nhỏ nhất, và độ lệch chuẩn. Đối với hầu hết các hàm thống kê, bạn cung cấp cho nó một danh sách các giá trị (có thể là toàn bộ tập hợp hay chỉ là một mẫu của tập hợp). Bạn có thể nhập những giá trị hoặc những ô riêng lẻ, hay là xác định một mảng. Excel có hàng chục hàm thống kê, có nhiều hàm trong số đó hiếm khi được sử dụng trong công việc kinh doanh.
Hàm thống kê trong excel HARNESSING THE POWER OF FUNCTIONS Tận dụng sức mạnh của các hàm Excel’s statistical functions calculate all the standard statistical measures, such as average, maximum, minimum, and standard deviation. For most of the statistical functions, you supply a list of values (which could be an entire population or just a sample from a population). You can enter individual values or cells, or you can specify a range. Excel has dozens of statistical functions, many of which are rarely, if ever, used in business. Những hàm thống kê của Excel tính toán tất cả những các số đo thống kê chuẩn như trung bình, lớn nhất, nhỏ nhất, và độ lệch chuẩn. Đối với hầu hết các hàm thống kê, bạn cung cấp cho nó một danh sách các giá trị (có thể là toàn bộ tập hợp hay chỉ là một mẫu của tập hợp). Bạn có thể nhập những giá trị hoặc những ô riêng lẻ, hay là xác định một mảng. Excel có hàng chục hàm thống kê, có nhiều hàm trong số đó hiếm khi được sử dụng trong công việc kinh doanh. 12.1. Understanding Descriptive Statistics Tìm hiểu về thống kê mô tả One of the goals of this book is to show you how to use formulas and functions to turn a jumble of numbers and values into results and summaries that give you useful information about the data. Excel’s statistical functions are particularly useful for extracting analytical sense out of data nonsense. Many of these functions might seem strange and obscure, but they reward a bit of patience and effort with striking new views of your data. Một trong những mục đích của cuốn sách này là trình bày cho bạn cách sử dụng các công thức và các hàm để biến một mớ hỗn độn những con số và những giá trị thành những kết quả và bảng tổng kết, nhằm cho bạn thông tin hữu dụng về dữ liệu. Các hàm thống kê của Excel đặc biệt hữu dụng cho việc trích xuất ra những phân tích có nghĩa khỏi những dữ liệu vô nghĩa. Nhiều hàm trong số này có vẻ lạ lẫm và khó hiểu, nhưng chúng sẽ đền đáp cho sự kiên nhẫn và nỗ lực của bạn bằng những cái nhìn mới đáng ngạc nhiên cho dữ liệu. This is particularly true of the branch of statistics known casually as descriptive statistics (or summary statistics). As the name implies, descriptive statistics are used to describe various aspects of a data set, to give you a better overall picture of the phenomenon underlying the numbers. In Excel’s statistical repertoire, 16 measures make up its descriptive statistics package: sum, count, mean, median, mode, maximum, minimum, rank, kth largest, kth smallest, standard deviation, variance, standard error of the mean, confidence level, kurtosis, and skewness. Điều này đặc biệt đúng với nhóm thống kê được biết với tên là thống kê mô tả (hay thống kê tổng hợp). Như tên gọi của nó, thống kê mô tả được sử dụng để mô tả những khía cạnh khác nhau của một tập hợp dữ liệu, nhằm mang lại cho bạn một cái nhìn rõ ràng hơn về sự thật ở bên dưới các con số. Trong kho thống kê của Excel, có 16 số đo thống kê tạo nên một gói thống kê mô tả: sum (tính tổng), count (đếm), mean (giá trị trung bình), median (trung bình vị), mode (số lần xuất hiện), maximum (giá trị lớn nhất), minimum (giá trị nhỏ nhất), rank (thứ hạng), kth largest (giá trị lớn thứ k), kth smallest (giá trị nhỏ thứ k), standard deviation (độ lệch chuẩn), variance (phương sai), và những lỗi thông thường của giá trị trung bình, mức tin cậy, độ nhọn, hệ số lệch In this chapter, you’ll learn how to wield all of these statistical measures (except sum, which you’ve already seen earlier in this book). Trong chương này, bạn sẽ học cách nắm vững tất cả các số đo thống kê (ngoại trừ sum(tính tổng) bạn đã học trong phần trước). You can download the workbook that contains this chapter’s examples here: Bạn có thể tải về bảng tính với những ví dụ trong chương này tại đây: www.mcfedries.com/Excel2007Formulas/ Trong chương này, do hầu hết các hàm tôi đã trình bày chi tiết ở topic: Các hàm Thống kê (http://www.giaiphapexcel.com/forum/showthread.php? t=7979), nên tôi sẽ không trình bày lại danh sách các hàm, cú pháp và chú giải các đối số của mỗi hàm nữa (không theo như nguyên bản cuốn sách này). Trong các bài dịch sau đây, khi nói đến một hàm nào, tôi sẽ tạo liên kết (link) đến bài viết về hàm đó. Nếu muốn tìm hiểu kỹ hơn về cú pháp và cách sử dụng các đối số (argument), các bạn theo những liên kết này để xem. BNTT 01-07-08, 11:01 PM 12.2. Counting Items with the COUNT() Function Đếm các phần tử với Hàm COUNT The simplest of the descriptive statistics is the total number of values, which is given by the COUNT() function: Thống kê đơn giản nhất trong số các thống kê mô tả là tổng số các giá trị được cho bởi hàm COUNT(): COUNT (http://www.giaiphapexcel.com/forum/showpost.php? p=54786&postcount=2) (value1 [,value2, ]) The COUNT() function counts only the numeric values that appear in the list of arguments. Text values, dates, logical values, and errors are ignored. In the worksheet shown in Figure 12.1, the following formula is used to count the number of defect values in the database: Hàm COUNT() chỉ đếm các giá trị số ở trong danh sách các đối số. Các giá trị text, giá trị ngày tháng, giá trị logic, và các lỗi sẽ được bỏ qua. Trong bảng tính minh họa ở hình 12.1, công thức sau đây được dùng để đếm số sản phẩm bị lỗi trong cơ sở dữ liệu: =COUNT(D3:D22) http://i216.photobucket.com/albums/cc49/BNTT_photos/Ch apter%2012/Figure121.jpg Figure 12.1 - Statistics.xlsx (http://www.mcfedries.com/Excel2007Formulas/Chapter12/ Statistics.xlsx) TIP: To get a quick look at the count, select the range or, if you’re working with data in a table, select a single column in the table. Excel displays the Count in the status bar. Để xem nhanh kết quả của việc đếm, bạn chọn dãy muốn đếm, hoặc nếu bạn đang làm việc với dữ liệu dạng bảng, thì chọn một cột đơn trong bảng. Excel sẽ hiển thị tất cả những gì nó đếm được ở mục Count dưới thanh trạng thái (Status bar). http://i216.photobucket.com/albums/cc49/BNTT_photos/HA M%20THONG%20KE/COUNT1.png If you want to know how many numeric values are in the selection, right-click the status bar and then click the Numerical Count value. Nếu bạn chỉ muốn biết có bao nhiêu giá trị số (numeric value) trong vùng đang chọn, bạn nhấn nút chuột phải vào thanh trạng thái và chọn giá trị Numerical Count. http://i216.photobucket.com/albums/cc49/BNTT_photos/HA M%20THONG%20KE/COUNT2.png BNTT 02-07-08, 12:00 AM 12.3. Calculating Averages Tính trung bình The most basic statistical analysis worthy of the name is probably the average, although you always need to ask yourself which average you need. There are three: mean, median, and mode. The next few sections show you the worksheet functions that calculate them. Sự phân tích thống kê cơ bản đáng chú ý nhất có lẽ là giá trị trung bình, mặc dù bạn luôn cần phải biết bạn muốn có loại trung bình nào. Có ba loại: trung bình cộng (mean), trung bình vị (median), và trung bình trọng số (mode). Vài phần tiếp theo đây sẽ trình bày cho bạn những hàm để tính các giá trị trung bình này. 12.3.1. The AVERAGE Function — Hàm AVERAGE The mean is what you probably think of when someone uses the term average. That is, it’s the arithmetic mean of a set of numbers. In Excel, you calculate the mean using the AVERAGE() function: Mean nghĩa là những gì bạn có thể nghĩ đến khi người ta sử dụng thuật ngữ average. Nghĩa là, nó là trung bình cộng của một tập hợp các con số. Trong Excel, bạn tính trung bình cộng bằng hàm AVERAGE(): AVERAGE (http://www.giaiphapexcel.com/forum/showpost.php? p=54788&postcount=3) (number1 [, number2, ]) For example, to calculate the mean of the values in the defects database, you use the following formula: Ví dụ, để tính trung bình cộng của những giá trị trong cơ sở dữ liệu các sản phẩm lỗi (xem lại ví dụ của bài trước, hình 12.1), bạn dùng công thức sau: =AVERAGE(D3:D22) TIP: If you need just a quick glance at the mean value, select the range. Excel displays the Average in the status bar. Nếu bạn chỉ cần xem lướt qua giá trị trung bình cộng của môt dãy, bạn chọn nó, Excel hiển thị giá trị này ở mục Average dưới thanh trạng thái. http://i216.photobucket.com/albums/cc49/BNTT_photos/HA M%20THONG%20KE/AVERAGE2.png CAUTION: The AVERAGE() function (as well as the MEDIAN() and MODE() functions discussed in the next two sections) ignores text and logical values. It also ignores blank cells, but it does not ignore cells that contain the value 0. Hàm AVERAGE() (cũng như hàm MEDIAN() và hàm MODE() sẽ nói đến trong hai phần tiếp theo đây) bỏ qua các giá trị text và các giá trị logic. Nó cũng bỏ qua các ô rỗng, nhưng nó không bỏ qua những ô có giá trị là 0. 12.3.2. The MEDIAN Function — Hàm MEDIAN The median is the value in a data set that falls in the middle when all the values are sorted in numeric order. That is, 50% of the values fall below the median, and 50% fall above it. The median is useful in data sets that have one or two extreme values that can throw off the mean result because the median is not affected by extremes. You calculate the median using the MEDIAN() function: Median — trung bình vị — là một giá trị nằm ở giữa một tập hợp các dữ liệu, khi tất cả các giá trị được sắp xếp theo thứ tự. Nghĩa là, có 50% giá trị xếp dưới median và 50% giá trị xếp trên median. Trung bình vị hữu dụng trong một tập hợp dữ liệu có một hoặc hai giá trị cực trị có thể đưa đến kết quả trung bình, bởi vì trung bình vị không phụ thuộc vào các cực trị. Bạn sử dụng hàm MEDIAN() để tính trung bình vị: MEDIAN (http://www.giaiphapexcel.com/forum/showpost.php? p=54815&postcount=5) (number1 [, number2, ]) For example, to calculate the median of the values in the defects database, you use the following formula: Ví dụ, để tính trung bình vị của những giá trị trong cơ sở dữ liệu các sản phẩm lỗi, bạn dùng công thức sau: =MEDIAN(D3:D22) 12.3.3. The MODE Function — Hàm MODE The mode is the value in a data set that occurs most frequently. The mode is most useful when you’re dealing with data that doesn’t lend itself to being either added (necessary for calculating the mean) or sorted (necessary for calculating the median). For example, you might be tabulating the result of a poll that included a question about the respondent’s favorite color. The mean and median don’t make sense with such a question, but the mode will tell you which color was chosen the most. Mode là một giá trị xuất hiện nhiều lần nhất trong một tập hợp các dữ liệu. Mode rất hữu dụng khi bạn làm việc với những dữ liệu không thích hợp với việc cộng (việc cần thiết để tính trung bình cộng) hoặc sắp xếp theo thứ tự (cần thiết cho việc tính trung bình vị). Ví dụ, bạn có thể lập một bảng kết quả của một thăm dò có bao gồm một câu hỏi về màu da ưa thích nhất. Trung bình cộng (mean) và trung bình vị (median) không thích hợp với một câu hỏi như vậy, nhưng mode sẽ cho bạn biết màu nào được chọn nhiều nhất. You calculate the mode using the MODE() function: Bạn tính mode (số lần xuất hiện nhiều nhất) bằng hàm MODE(): MODE (http://www.giaiphapexcel.com/forum/showpost.php? p=54820&postcount=6) (number1 [, number2, ]) For example, to calculate the mode of the values in the defects database, you use the following formula: Ví dụ, để tính giá trị xuất hiện nhiều nhất trong cơ sở dữ liệu các sản phẩm lỗi, bạn dùng công thức sau: =MODE(D3:D22) BNTT 02-07-08, 07:35 PM 12.3.4. Calculating the Weighted Mean Tính trung bình gia trọng In some data sets, one value might be more important than another. For example, suppose that your company has several divisions, the biggest of which generates $100 million in annual sales and the smallest of which generates only $1 million in sales. If you want to calculate the average profit margin for the divisions, it doesn’t make sense to treat the divisions equally because the largest is two orders of magnitude bigger than the smallest. You need some way of factoring the size of each division into your average profit margin calculation. Trong một số tập hợp dữ liệu, có thể có một giá trị thì quan trọng hơn những giá trị khác. Ví dụ, giả sử rằng công ty của bạn có vài bộ phận, bộ phận lớn nhất đem lại $100 triệu trong tổng doanh thu hằng năm, còn bộ phận nhỏ nhất chỉ mang lại doanh thu có $1 triệu. Nếu bạn muốn tính mức lợi nhuận trung bình cho các bộ phận, việc xem các bộ phận đều như nhau thì không hợp lý bởi vì bộ phận lớn nhất hơn bộ phận nhỏ nhất đến hai bậc. Bạn cần có cách khác để đưa quy mô của mỗi bộ phận vào trong phép tính trung bình lợi nhuận. You can do this by calculating the weighted mean. This is an arithmetic mean in which each value is weighted according to its importance in the data set. Here’s the procedure to follow to calculate the weighted mean: Bạn có thể làm điều đó bằng cách tính trung bình gia trọng. Đây là một trung bình cộng mà trong đó mỗi giá trị có trọng số tùy theo mức quan trọng của nó trong một tập hợp dữ liệu. Đây là những bước để tính mức trung bình gia trọng: For each value, multiply the value by its weight. Với mỗi giá trị, nhân giá trị với trọng số của nó. Sum the results from step 1. Tính tổng của các kết quả ở bước 1. Sum the weights. Tính tổng các trọng số. Divide the sum from step 2 by the sum from step 3. Chia tổng ở bước 2 cho tổng ở bước 3 Let’s make this more concrete by tying this into our database of product defects. Suppose you want to know the average percentage of product defects (the values in column F). Simply applying the AVERAGE() function to the range F3:F22 doesn’t give an accurate answer because the number of units produced by each division is different (the maximum is 1,625 in division C, and the minimum is 690 in division R). To get an accurate result, you must give more weight to those divisions that produced more units. In other words, you need to calculate the weighted mean for the percentage of defective products. Hãy làm cho điều này cụ thể hơn bằng cách đưa nó vào trong cơ sở dữ liệu của các sản phẩm lỗi của chúng ta. Giả sử bạn muốn biết số phần trăm trung bình các sản phẩm bị lỗi (những giá trị trong cột F). Việc đơn giản áp dụng hàm AVERAGE() vào dãy F3:F22 không đem lại một kết quả chính xác bởi vì số sản phẩm mà mỗi đơn vị sản xuất được thì khác nhau (bộ phận C làm ra nhiều nhất, 1,625 sản phẩm; còn bộ phận R làm được ít nhất, 690 sản phẩm). Để có được kết quả chính xác, bạn phải tăng thêm trọng số (gia trọng) cho những bộ phận làm được nhiều sản phẩm hơn. Nói cách khác, bạn cẩn phải tính mức trung bình gia trọng cho số phần trăm các sản phẩm lỗi. http://i216.photobucket.com/albums/cc49/BNTT_photos/Ch apter%2012/Figure122.jpg Figure 12.2 - Statistics.xlsx (http://www.mcfedries.com/Excel2007Formulas/Chapter12/ Statistics.xlsx) In this case, the weights are the units produced by each division, so the weighted mean is calculated as follows: Trong trường hợp này, trọng số là số sản phẩm của mỗi bộ phận làm được, do đó trung bình gia trọng được tính như sau: Multiply the percentage defective values by the units. (The sharp-eyed reader will note that this just gives the number of defects. I’ll ignore this for now for illustration purposes.) Nhân giá trị phần trăm sản phẩm bị lỗi với số sản phẩm. (Nếu bạn tinh mắt bạn sẽ thấy điều này cho ra con số các sản phẩm lỗi. Tôi sẽ bỏ qua điều này, bởi vì đây chỉ là minh họa). Sum the results from step 1. Tính tổng các kết quả ở bước 1. Sum the units. Tính tổng các sản phẩm. [...]... trong phần tiếp theo đây, phương sai được sử dụng chủ yếu là để có được độ lệch chuẩn In any case, variance is usually a standard part of a descriptive statistics package, so that’s why I’m covering it Excel calculates the variance using the VARP() and VAR() functions: Trong bất kỳ trường hợp nào, phương sai thường là một chuẩn của một thống kê mô tả, do đó đây là lý do tại sao nó được đề cập đến Excel. .. http://i216.photobucket.com/albums/cc49/BNTT_photos/Ch apter%2012/Figure127.jpg Figure 12.7 - Statistics.xlsx (http://www.mcfedries.com /Excel2 007Formulas/Chapter12/ Statistics.xlsx) In Excel, you calculate the skewness of a data set by using the SKEW() function: Trong Excel, bạn tính độ lệch của một tập hợp dữ liệu bằng cách sử dụng hàm SKEW(): SKEW (http://www.giaiphapexcel.com/forum/showpost.php? p=59707&postcount=79) (number1 [, number2, ]) For example,... http://i216.photobucket.com/albums/cc49/BNTT_photos/Ch apter%2012/Figure128.jpg Figure 12.8 - Statistics.xlsx (http://www.mcfedries.com /Excel2 007Formulas/Chapter12/ Statistics.xlsx) In Excel, you calculate the kurtosis of a data set by using the KURT() function: Trong Excel, bạn tính độ nhọn của một tập hợp dữ liệu bằng cách sử dụng hàm KURT(): KURT (http://www.giaiphapexcel.com/forum/showpost.php? p=59322&postcount=67) (number1 [, number2, ]) For example,... một phía, trong đó phương sai của hai tập hợp không đáng kể Phép thử này cũng có sẵn (trong Excel) với hàm sau: FTEST (http://www.giaiphapexcel.com/forum/showpost.php? p=59057&postcount=47) (array1, array2) Fourier Analysis — Performs a Fast Fourier Transform You use Fourier Analysis to solve problems in linear systems and to analyze periodic data Thực hiện phép biển đổi nhanh Fourier Bạn sử dụng Fourier... không có hàm để tính độ biến thiên trong dãy cách trực tiếp, nhưng thay vào đó, đầu tiên bạn áp dụng hàm MAX() và MIN() vào tập hợp dữ liệu này, rồi khi bạn đã có những cực trị, bạn tính độ biến thiên trong dãy bằng cách lấy giá trị cực đại trừ đi giá trị cực tiểu For example, here’s a formula that calculates the range for the defects database: Ví dụ, đây là công thức để tính độ biến thiên trong dãy... FREQUENCY Function — Hàm FREQUENCY To help you construct a frequency distribution, Excel offers the FREQUENCY() function: Để giúp bạn xây dựng một sự phân bổ tần số, Excel có hàm FREQUENCY(): FREQUENCY (http://www.giaiphapexcel.com/forum/showpost.php? p=55174&postcount=18) (data_array, bins_array) Here are some things you need to know about this function: Đây là một số điều bạn cần biết về hàm này: For the... giữa hai tập hợp dữ liệu, và nó cũng có sẵn (trong Excel) thông qua hàm sau đây: COVAR (http://www.giaiphapexcel.com/forum/showpost.php? p=58915&postcount=38) (array1, array2) Descriptive Statistics — Generates a report showing various statistics (such as median, mode, and standard deviation) for a set of data Tạo một báo cáo trình bày những số liệu thống kê mô tả (chẳng hạn như giá trị trung bình (median),... (http://www.mcfedries.com /Excel2 007Formulas/Chapter12/ Statistics.xlsx) To generate this normal distribution, I used Excel s NORMDIST() function, which returns the probability that a given value exists within a population: Để tạo một phân bố chuẩn, tôi dùng hàm NORMDIST() của Excel, là hàm trả về xác suát của một giá trị nào đó hiện hữu trong một tập hợp: NORMDIST (http://www.giaiphapexcel.com/forum/showpost.php? p=55278&postcount=17) (x, mean, standard_dev,... nhất là gì? Hai phần tiếp theo đây trình bày cho bạn những hàm trả về các cực trị của một mẫu hoặc một tập hợp 12.4.1 The MAX and MIN Function — Hàm MAX và Hàm MIN If you want to know the largest value in a data set, use the MAX() function: Khi bạn muốn biết giá trị lớn nhất của một tập hợp dữ liệu, bạn cùng hàm MAX(): MAX (http://www.giaiphapexcel.com/forum/showpost.php? p=54851&postcount=7) (number1... FALSE) Nếu bạn muốn những giá trị cực đại hay cực tiểu trong một dãy hoặc một mảng bao gồm cả những giá trị text và các giá trị logic, bạn dùng hàm MAXA() hoặc MINA(), những hàm này sẽ bỏ qua các giá trị text, và xem những giá trị logic hoặc là 1 (TRUE) hoặc là 0 (FALSE) BNTT 02-07-08, 11:44 PM 12.4.2 The LARGE and SMALL Function — Hàm LARGE và Hàm SMALL Instead of knowing just the largest value, you . Hàm thống kê trong excel HARNESSING THE POWER OF FUNCTIONS Tận dụng sức mạnh của các hàm Excel s statistical functions calculate all the standard. một mảng. Excel có hàng chục hàm thống kê, có nhiều hàm trong số đó hiếm khi được sử dụng trong công việc kinh doanh. 12.1. Understanding Descriptive Statistics Tìm hiểu về thống kê mô tả One. skewness. Điều này đặc biệt đúng với nhóm thống kê được biết với tên là thống kê mô tả (hay thống kê tổng hợp). Như tên gọi của nó, thống kê mô tả được sử dụng để mô tả những khía cạnh khác nhau