Bài giảng Phương pháp thống kê trong kinh tế và quản trị trình bày về tổng quan về phân tích thống kê; suy diễn thống kê; từ mẫu đến tổng thể; thu thập dữ liệu, kỹ thuật lấy mẫu, phân tích tương quan, đồ thị hàm số, đồ thị tương quan.
Trang 1Vấn đề 2 Thống kê cơ bản
Trang 2Phân phối xác suất
Dữ liệu liên tục
Phân phối chuẩn (X, Z)
Phân phối hàm mũ
-Chú ý: Phân phối của mẫu
Z, t, F và Phân phối Khi bình phương (Tests)
Dữ liệu rời rạc*
Phân phối nhị thức
Phân phối Poisson
Phân phối Hình họcvà Nhị thức
Trang 3Công cụ thống kê
Thông tin đầy đủ về Phân phối của một bộ dữ liệu có thể thành lập và tham khảo hình dạng của Phân phối Thường người ta sử dụng
Phân phối chuẩn là phân phối phổ biến,
Trang 4 Sử dụng hai tham số (trung bình & độ lệch chuẩn)
Chú ý:
Giả sử ta biết giá trị của 2 tham số trung bình và
độ lệch chuẩn Như thế ta sẽ biết về tổng thể
(Không phải của mẫu)
Trang 5Phân phối chuẩn
Hình 1 Đường cong chuẩn
f(x) = chiều cao đường cong
x = biến
trung bình của x = a m
Trang 6 Một phân phối chuẩn có thể được mô tả một cách đầy đủ bởi hai giá trị: trung bình m và độ lệch chuẩn sigma (hoặc phương sai của nó là sigma2.)
Biến phân phối chuẩn có nhiều đặc điểm làm
cơ sở cho các tính toán và suy diễn
Trang 7 A Đặc điểm
1 đối xứng quanh đường thẳng có x = m
2 diện tích nằm bên phải của trung bình bằng
khoảng 1/2 diện tích chung, diện tích nằm bên trái của trung bình bằng khoảng 1/2 diện tích chung (nhìn slide tiếp)
3 giá trị khác µ (mean) & sigma 2 (variance) xác định đường cong khác; µ trung tâm của đường
cung & sigma2 xác định độ phân tán
Trang 8xđối xưng qua đường thẳng đứng với x = m
a
Trang 9x
diện tích bên phải là bằng 1/2 của tổng diện tích;
diện tích bên phải là bằng 1/2 của tổng diện tích
µ
1/2 của tổng diện tích 1/2 của tổng diện tích
Trang 104 khoảng 68% trường hợp sẽ nằm trong vùng
phân bố chuẩn có khoảng trung bình và một độ
lệch chuẩn
5 khoảng 95% trường hợp sẽ nằm trong vùng
phân bố chuẩn có khoảng trung bình và hai độ lệch chuẩn
6 khoảng 99.7% trường hợp sẽ nằm trong vùng phân bố chuẩn có khoảng trung bình và ba độ lệch chuẩn
CHÚ Ý: độ lệch chuẩn ký hiệu bởi “s” hoặc s
Trang 1168% của phân phối’ nằm trong vùng trung bình cộng với 1 độ
Trang 1295% của phân phối’ nằm trong vùng trung bình cộng với 2 độ
Trang 1399.7% của phân phối’ nằm trong vùng trung bình cộng với 3
Trang 14Example (see note page)
Cho X là đại lượng ngẫu nhiên biểu thị kết quả đạt được qua kỳ thi quốc gia MBA Giả sử X tuân theo quy luật phân bố chuẩn với trung bình
là 600 và độ lệch chuẩn (sigma) là 65 Vậy xác xuất để X nằm trong khoảng 2 sigma = 2(65) =
95% của kết quả sẽ nằm trong khoảng 470 và
730 Tương tự,
99.7% của kết quả sẽ nằm trong khoảng 405 và 795.
Trang 1599.7%
600
600 -2(65)
600 + 2(65)
600
-3(65)
600 + 3(65)
Trang 1699.7%
600
600 -2(65)
600 + 2(65)
600
-3(65)
600 + 3(65)
Trang 1799.7%
600
600 -2(65)
600 + 2(65)
600
-3(65)
600 + 3(65)
Trang 18Think for a moment!!
Heaven or on the Earth?
How about skewness và kurtosis?
The analysis using the Phân phối chuẩn is based on the
assumptions of
(i) No skewness (skewness = 0) (ii) No kurtosis (kurtosis = 3, excess kurtosis = 0)
Note: But, using the Phân phối chuẩn is still valid in
the sampling Phân phối
From Lectures 3 và onward
“Regardless of the Phân phối in the population, the sampling Phân phối of the sample thống kê is NORMAL” (Central Limit Theorem)
Trang 19Phân phối chuẩn tắc
1 biến ngẫu nhiên có phân phối chuẩn tắc là một biến chuẩn với:
trung bình = 0 và
độ lệch chuẩn (sigma) = 1
xem Hình trên slide tiếp
biến này thường được ký hiệu là Z Thường một biến chuẩn được ký hiệu là X Việc biến đổi thành
Z có thể trả lời được nhiều câu hỏi trong kinh tế và quản trị
Trang 21Hình 2 Đường cong chuẩn tắc: trung bình = 0 và độ lệch chuẩn (sigma) = 1
Phần trăm của tỷ số nằm ngoài khoảng -2 & +2?
Chú ý “Z” khác “X”
Trang 22diện tích nằm dưới đường cong chuẩn tắc giữa z =
0 & z = z0 ở đây z0 => 0
Also see the table in a few slides
Trang 23See the next slide
At the intersection of the row for 2.5 và the column under 0.04, meaning Z = 2.54, you find a value of 0.4945
This means that the area under the standard normal curve between z = 0 & z = 2.54 is 0.4945 (49.45%
of total area under curve)
Trang 24Table (in text)
.4938 4953 4965 4974 4981
.4778 .4783 .4788 4793 4826 .4830 .4834 4838 4864 .4868 .4871 4875 4896 .4898 .4901 4904 4920 .4922 .4925 4927
.4940 .4941 .4943 4945
.4955 .4956 .4957 4959 4966 .4967 .4968 4969 4975 .4976 .4977 4977 4982 .4982 .4983 4984
for row value of 2.5 & column under 0.04, meaning Z = 2.54,
value = 0.4945
Trang 25Table (in text)
.4938 4953 4965 4974 4981
.4778 .4783 .4788 4793 4826 .4830 .4834 4838 4864 .4868 .4871 4875 4896 .4898 .4901 4904 4920 .4922 .4925 4927
.4940 .4941 .4943 4945
.4955 .4956 .4957 4959 4966 .4967 .4968 4969 4975 .4976 .4977 4977 4982 .4982 .4983 4984
giá trị hàng của 2.5 & và cột 0.04, có nghĩa là Z = 2.54,
giá trị = 0.4945
49.45 là diện tích nằm giữa z=0 và z=2.54 và trục hoành
Trang 273 Vùng nằm giữa
z = 0 & z = -2.54 (chú ý - 2.54) cũng là 0.4945 (49.45% của diện tích)
P(0 < Z < 2.54) = P(-2.54 < Z < 0) = 4945
Trang 28 Biến đổi thành phân phối chuẩn tắc Z
1 Chuyển mọi phân phối chuẩn thành chuẩn tắc theo công thức:
Z = (X - xtb) / độ lệch chuẩn of X
Ví dụ: mean=600, sigma=65
để Z = 1
(665 - 600) / 65 = 1
Trang 29 Suppose that you have an X variable with a trung bình
of 125 & độ lệch chuẩn of 12 If one of X's values is
125 (its mean), then the corresponding value for a Z
variable is computed as follows:
Trang 30Suppose you have data on an variable (call
it X) that is normally distributed with a
trung bình µ = 4 & a độ lệch chuẩn = 2
Your assignment is to find how likely it is that X can be a value between 0 và 6.
This can be stated as "find the probability that X can be between 0 và 6."
This can also be stated as "find P(0 < X < 6)."
Trang 316 4
Trang 326 4
Z = (X - m) / s
Chú ý: P(0 < X < 6) = P(-2 < Z < 1)
Trang 336 4
NOTE: 81.85% tất cả giá trị
Z = (X - m) / s
Trang 34Here’s how to use the table of Z values to
find the hai areas I showed you earlier.
Repeating:
it is true that P(0 < X < 6) = P(-2 < Z < 1)
P(-2 < Z < 1) is area between z = -2 và z = 1; this area is sum of area between
z = -2 & z =0 (area A1)
& area between
z = 0 & z = 1 (area A2)
Trang 356 4
Trang 36.4938 4953 4965 4974 4981
.4778 .4783 .4788 4793 4826 .4830 .4834 4838 4864 .4868 .4871 4875 4896 .4898 .4901 4904 4920 .4922 .4925 4927
.4940 .4941 .4943 4945
.4955 .4956 .4957 4959 4966 .4967 .4968 4969 4975 .4976 .4977 4977 4982 .4982 .4983 4984
for row value of 2.0 & column under 0.00, meaning Z = 2.00,
value = 0.4772 For Z = -2.00, value also = 0.4772.
Tìm diện tích nằm giữa z = -2 & z =0 (area A1)
Dấu âm
Trang 37.1915 2258 2580 2881 3159
.3413
.0040 .0080 .0120 0160 0438 .0478 .0517 0557 0832 .0871 .0910 0948 1217 .1255 .1293 1331 1591 .1628 .1664 1700
.1950 .1985 .2019 2054 2291 .2324 .2357 2389 2612 .2642 .2673 2704 2910 .2939 .2967 2996 3186 .3212 .3238 3264 3438 .3461 .3485 3508
for row value of 1.0 & column under 0.00, meaning Z = 1.00,
value = 0.3413.
area between z = 0 & z = 1 (area A2)
Trang 386 4
Trang 39• P(-2 < Z < 1) = DTich A1 + DTich A2 = 0.4772 + 0.3413 = 0.8185;
• có nghĩa là xác suất để X nằm giữa 0 và 6 là 81.85%