Bài giảng Thống kê ứng dụng trong kinh doanh và kinh tế cung cấp cho người học các kiến thức tổng quan về thống kê, thu thập dữ liệu thống kê, tóm tắt và trình bày dữ liệu bằng bảng biểu đồ, mô tả dữ liệu bảng với các đặc trưng đo lường, ước lượng thống kê,... Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế(Applied Statistics for Business & Economics)
• Thống kê là hệ thống các phương pháp dùng để thu thập,
xử lý và phân tích các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể.
2
Trang 2Hai lĩnh vực thống kê
• Thống kê mô tả:
– Thu thập số liệu– Tính toán các đặc trưng đo lường– Mô tả, trình bày dữ liệu
• Thống kê suy diễn
– Ước lượng, kiểm định thống kê– Phân tích mối liên hệ
– Dự đoán …
3
Ứng dụng của thống kê
4
Trang 3– Đo lường kết quả kinh doanh, tiếp thị– Dự báo kinh doanh…
6
Trang 4Một số KN thường dùng trong thống kê
• Tổng thể (population): tập hợp các đơn vị/phần tử cần phântích/nghiên cứu
• Đơn vị tổng thể (unit): phần tử nhỏ nhất tạo thành tổng thể
• Mẫu: một phần của tổng thể được chọn ra để thu thập thông tin
• Tiêu thức, tiêu chí, biến: đặc điểm của đơn vị tổng thể dùng đểquan sát hay thu thập dữ liệu
– Tiêu thức/tiêu chí định tính: đặc điểm biểu hiện không phải là số– Tiêu thức/tiêu chí định lượng: đặc điểm biểu hiện là các trị số, cóthể rời rạc hay liên tục
• Chỉ tiêu: trị số phản ảnh đặc điểm/tính chất trong điều kiện thờigian và không gián xác định
– Chỉ tiêu khối lượng: biểu hiện quy mô khối lượng– Chỉ tiêu chất lượng: biểu hiện tính chất, mức độ phổ biến
7
Quy trình nghiên cứu thống kê
Xác định vấn đề nghiên cứu, mục đích, nội dung, đối tượng nghiên cứu.
Xây dựng hệ thống các khái niệm, chỉ tiêu thống kê Điều tra thống kê
Xử lý số liệu:
Tập hợp, sắp xếp số liệu.
Chọn các phần mềm xử lý số liệu.
Phân tích thống kê sơ bộ.
Lựa chọn các phương phápphân tích thống kê
thích hợp.
Phân tích và giải thích kết quả.
Dự đoán xu hướng phát triển.
Báo cáo và truyền đạt kết quả nghiên cứu
8
Trang 5Các loại thang đo
thang đodanh nghĩa
thang đo
tỉ lệ
thang đothứ bậc khoảng cáchthang đo
• Thang danh nghĩa: dùng để phân loại
• Được sử dụng nhiều trong quản trị, kinh doanh, tiếp thị
• Tương thích với nhiều cơ sở dữ liệu có sẵn
• http://www-01.ibm.com/software/analytics/spss/
• Tài liệu tiếng Việt:
Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008) Phân tích dữ liệu nghiên cứu với SPSS, NXB Hồng Đức
10
Trang 6Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế(Applied Statistics for Business & Economics)
Chương 2
THU THẬP DỮ LIỆU THỐNG KÊ
Hoàng Trọng
Xác định dữ liệu cần thu thập
• Tập trung vào dữ liệu cần thiết và hữu ích
• Tiết kiệm thời gian, công sức và chi phí
• Phải xuất phát từ vấn đề nghiên cứu và mục tiêu nghiên cứu TK
Hiểu ngành học Kết quả học tập
Sức khỏe Điểm đầu vào
Thích ngành học
Đi làm thêm
12
Trang 7Dữ liệu định tính và dữ liệu định lượng
Dữ liệu
Dữ liệu định lượng
Dữ liệu định tính
thang đo danh nghĩa
thang đo
tỉ lệ
thang đo thứ bậc
thang đo khoảng cách
• Dữ liệu định tính: thu thập từ thang đo danh nghĩa và thứ bậc-> khơng tính được trị trung bình
• Dữ liệu định lượng: thu thập từ thang đo khoảng cách và tỉ lệ-> tính được trị trung bình
Dữ liệu định tính và dữ liệu định lượng
Thời gian làm thêm Kết quả học tập Loại kiểm định Định tính
Phân tích phương sai
1 yếu tố
Định lượng Số giờ làm thêm:
_giờ/tuần
Định lượng
Điểm trung bình học tập
Hồi quy và kiểm định F
14
Trang 8Dữ liệu thứ cấp và dữ liệu sơ cấp
• Dữ liệu thứ cấp: nguồn cósẵn, đã được tổng hợp, xửlý
• Điểm mạnh: có sẵn, nhanh,
ít tốn kém
• Điểm yếu: ít chi tiết, ít đápứng đúng nhu cầu nghiêncứu thống kê
• Dữ liệu sơ cấp: thu thậptrực tiếp, ban đầu, từ đốitượng nghiên cứu
• Điểm mạnh: phong phú, đápứng đúng nhu cầu nghiêncứu
• Điểm yếu: cần thời gian, tốnkém
• Các tổ chức, hiệp hội, viện nghiên cứu
• Các công ty nghiên cứu và cung cấp thông tin
16
Trang 9Nguồn dữ liệu thứ cấp
• Nhiều dữ liệu thứ cấp đã được nhiều cơ quan chính phủ, các tổchức, các đơn vị nghiên cứu, các doanh nghiệp, trường học … đưa lên mạng internet và người nghiên cứu có thể tìm thấy tạicác trang web của các đơn vị này hay tại các cơ sở dữ liệu trênmạng internet
• Dùng các máy tìm kiếm (search engine) như google, yahoo …
và các từ khóa (keywords) phù hợp dò tìm và chọn lọc cácnguồn tài liệu trên mạng internet
• Để định vị nguồn dữ liệu thứ cấp hiệu quả, cần xác định rõ vấn
đềvà mục tiêu của cuộc nghiên cứu để quyết định từ khóa phù
hợp Từ khóa cần chi tiết và phản ảnh chính xác điều ngườinghiên cứu cần tìm kiếm
17
Nguồn dữ liệu thứ cấp
Thực hành nhóm:
1 mỗi nhóm chọn 1 vấn đề cần nghiên cứu thống kê
2 Xác định nội dung cần thống kê
3 Xác định từ khóa tìm kiếm
4 Thực hiện việc tìm kiếm dữ liệu thứ cấp
5 Báo cáo kết quả thực hiện tìm kiếm dữ liệu thứ cấp
18
Trang 10Nguồn dữ liệu thứ cấp
Chính Phủ http://www.chinhphu.vn
Bộ Công Thương http://www.moi.gov.vn
Bộ Giáo Dục và Đào Tạo http://www.moet.gov.vn
Bộ Lao động - Thương binh – Xã hội http://www.molisa.gov.vn
Sở Kế Hoạch Đầu Tư TPHCM http://www.dpi.hochiminhcity.gov.vn/
Sở Công Thương TPHCM http://www.congthuong.hochiminhcity.gov.vn/
Cục Hải Quan TPHCM http://www.haiquan.hochiminhcity.gov.vn/
Sở giao dịch chứng khoán TPHCM http://www.vse.org.vn
Đại hội Bất Động Sản Du Lịch http://www.vntpa.vn/
Hiệp hội Bất Động Sản TPHCM http://www.horea.org.vn
Liên đoàn Lao Động TPHCM http://www.ldld.hochiminhcity.gov.vn/web/tint
uc/
Tập đoàn Điện Lực VN http://www.evn.com.vn/
Tập đoàn Than – Khoáng Sản VN http://www.vinacomin.vn/
Tập đoàn Bưu Chính Viễn Thông http://www.vnpt.com.vn/
Tập đoàn Dệt May Việt Nam http://www.vinatex.com.vn
20
Trang 11Nguồn dữ liệu thứ cấp
Trang web về thống kê của Ủy Ban Kinh Tế Xã Hội Châu Á-Thái Bình Dương thuộc Liên Hiệp Quốc http://www.unescap.org/stat/
Trang web của ủy ban Thống Kê của Liên Hợp Quốc http://unstats.un.org/unsd/default.htm
Trang web data của Liên Hợp Quốc http://data.un.org/
Trang web của IMF http://www.imf.org/external/index.htm
Trang web của World Bank http://www.worldbank.org/
Trang web của Ngân hàng phát triển Châu Á http://www.adb.org/
Trang web của Hiệp hội Bất Động Sản Canada http://www.crea.ca/
Trang web hội các nhà phát triển BDS Singapore http://www.redas.com/
Trang web Trung tâm thương mại quốc tế ITC (www.intracen.org) là trang web chứa một cơ sở dữ liệu chuyên sâu phục vụ cho công tác nghiên cứu thị trường, đặc biệt là công tác XTTM, thông tin thu thập
từ trên 180 quốc gia và vùng lãnh thổ.
http://www.macmap.org/
http://www.investmentmap.org/
http://www.p-maps.org/
Trang web của Business Monitor International http://www.businessmonitor.com
Trang web của EuroMonitor International http://www.euromonitor.com
Trang web của RNCOS Industry Rerearch
Solutions
http://www.rncos.com
21
Dữ liệu sơ cấp
• Dữ liệu sơ cấp được thu thập qua các cuộc điều tra khảo sát
• Điều tra thường xuyên, điều tra không thường xuyên
• Điều tra toàn bộ, điều tra không toàn bộ
22
Trang 12Dữ liệu sơ cấp
23
Dữ liệu sơ cấp
24
Trang 13Dữ liệu sơ cấp
25
Dữ liệu sơ cấp
26
Trang 15Kế hoạch điều tra thống kê
• Mục đích điều tra thống kê
• Xác định đối tượng điều tra và đơn vị điều tra
• Nội dung điều tra
• Thời điểm, thời kỳ, thời hạn điều tra
• Biểu điều tra, bản giải thích cách ghi biểu
• Đọc thêm:
– VHLSS 2010 (Điều tra mức sống hộ gia đình VN 2010) – Viet Pay (Khảo sát thanh toán điện tử)
29
Sai số trong điều tra thống kê
Sai số trong điều tra thống kê là chênh lệch giữa trị số thu thập được trong điều tra với trị số thực tế của đơn vị điều tra.
• Sai số do đăng ký (sai số thô, không do chọn mẫu)
• Sai số do tính chất đại biểu (sai số do chọn mẫu)Hạn chế sai số:
• Sai số do đăng ký: làm tốt công tác chuẩn bị, giám sát kiểm tra
kỹ lưỡng
• Sai số do tính chất đại biểu: thiết kế chọn mẫu và kiểm tra thựchiện việc chọn mẫu
30
Trang 16Thực hành điều tra thống kê
Bài tập nhóm :
Tiếp theo bài tập tìm dữ liệu thứ cấp, mỗi nhóm dựa trên các dữliệu thứ cấp đã thu thập, xác định rõ hơn vấn đề cần nghiên cứuthống kê của nhóm, cụ thể
– Mục đích nghiên cứu điều tra thống kê– Xác định đối tượng điều tra và đơn vị điều tra– Nội dung điều tra
– Thời điểm, thời kỳ, thời hạn điều tra– Biểu điều tra, bản giải thích cách ghi biểu– Tiến hành thu thập dữ liệu
Trang 17Lý thuyết phân tổKhái niệm
Các bước tiến hành phân tổ:
– Lựa chọn tiêu thức/biến– Xác định số tổ
• Tiêu thức/biến định tính: không ghép & ghép
• Tiêu thức/biến định lượng: không ghép & ghép– Kết quả là bảng phân tổ
33
Lý thuyết phân tổ
Số người có thu nhập trong hộ gia đình
Số người Tần số Tần suất% tích lũy %Tần suất
34
Trang 18Lý thuyết phân tổPhương pháp nhánh và lá
Các dữ liệu thu thập được sẽ được tách thành hai phần: phần nhánh và phần lá Việc phân chia này có thể linh hoạt
Tuổi của 30 sinh viên ngành KTKT
Biểu đồ nhánh láhoàn chỉnh
36
Trang 19Bảng kết hợp
Công việc của chủ hộ
QTân Bình Q6 Q11 Tần
số cột% Tần số Tần số Tần số Tầnsố
Có hoạt động kinh tế Làm việc trong nhà máy 18 14,3 91 10,5 5 11,6
Làm nghề tự do 39 31,0 187 21,5 11 25,6 Làm việc trong các CQNN 2 1,6 30 3,5 2 4,7 làm việc trong các CH 3 2,4 22 2,5 1 2,3
Buôn bán nhỏ 4 3,2 39 4,5 1 2,3 Bán hàng rong 5 4,0 45 5,2 1 2,3 Làm việc tại nhà 10 7,9 88 10,1 7 16,3
Tự kinh doanh 8 6,3 37 4,3
Tổng 89 70,6 541 62,3 28 65,1 Không hoạt
động kinh tế Thu nhập từ nguồn khác 6 4,8 41 4,7
Không việc làm 31 24,6 286 32,9 15 34,9
Tổng 37 29,4 327 37,7 Tổng 126 100,0 868 100,0 43 100,0
37
Biểu đồ thống kêDùng số kết hợp với hình vẽ, đường nét và màu sắc để trình bàyTheo nội dung phản ánh của đồ thị thống kê, có các loại:
• Biểu đồ diện tích (hình tròn, hình vuông, hình chữ nhật)
• Đồ thị đường gấp khúc (đường động thái)
• Bản đồ thống kê
38
Trang 20Bản đồ mật độ dân số của các tỉnh/thành phố
40
Trang 21Thực hành
• Tiến hành thu thập dữ liệu của đề tài nhóm
• Dùng phần mềm thống kê, nhập liệu vào
• Chạy ra bảng và vẽ biểu đồ thống kê
• Trình bày kết quả (mỗi nhóm tối đa 10 phút)
Hoàng Trọng
Trang 22Số tuyệt đối
• Số tuyệt đối là chỉ tiêu biểu hiện qui mô, khối lượng của hiện tượng kinh tế - xã hội trong điều kiện thời gian và địa điểm cụ thể.
• Ví dụ: Theo kết quả sơ bộ của cuộc Tổng điều tra dân số thì
Tổng số dân của nước ta có lúc 0 giờ 1/4/2009 là 85.789.573,
tăng 9,47 triệu người so với năm 1999 là 76.324.753 người
• Đơn vị tính số tuyệt đối:
– Đơn vị hiện vật: cái, chiếc, con, trái, củ, người, căn …– Đơn vị hiện vật quy đổi: lương thực quy ra lúa
– Đơn vị hiện vật quy ước: mét, mét vuông, mét khối, lít , kg,
…– Đơn vị tiền tệ: đồng, USD …– Đo vị thời gian lao động: giờ công, ngày công, …
44
Trang 23Số tương đối
• chỉ tiêu biểu hiện quan hệ so sánh (tỷ số) giữa hai mức độ của hiện tượng nghiên cứu.
• Các loại số tương đối:
– Động thái: phản ảnh thay đổi qua thời gian– Kế hoạch:
• Nhiệm vụ kế hoạch: so mức kế hoạch (nhiệm vụ) với mức đạt
ở lần trước
• Thực hiện kế hoạch: so mức thực hiện được với mức kế hoạch
đềra– Kết cấu: mức độ bộ phận so với toàn bộ, phản ảnh tỷ trọng– Cường độ: so giữa hai mức độ của 2 hiện tượng (chỉ tiêu) khácnhau
– Không gian: so sánh giữa các không gian khác nhau
45
Đo lường khuynh hướng tập trung
Tìm ra mức độ đại diện theo một tiêu thức/biến.
Cha p 3-46
Center and LocationMean
MedianMode
Other Measures of Location
Geometric mean
Describing Data Numerically
Variation
VarianceStandard DeviationCoefficient of Variation
RangePercentiles
Interquartile RangeQuartiles
Trang 24Đo lường khuynh hướng tập trung
Tìm ra mức độ đại diện theo một tiêu thức/biến.
Khuynh hướng tập trung
Trung bình hình học
1
1
n i i
N i i
X X
n X N
1x x x x
k
1 i
i i
f
fxx
k
1 i
i i
f
fmx
n
1 i
Trang 25Đo lường khuynh hướng tập trung
1 Trung bình cộng
• Trung bình tổng thể
N
fx
k
1 i
i i
∑
=
=µ
N
fm
k
1 i
i i
∑
=
=µ
∑
=
= µ
Trang 26Đo lường khuynh hướng tập trung
M
1 2
n 2
n e
(min) Me e
f
S 2
n h x
M
−
− +
Trang 27Đo lường khuynh hướng tập trung
3 Mốt (mode)
• Đo lường khuynh hướng tập trung
• Mode là giá trị có tần số lớn nhất
• Mode không chịu ảnh hưởng bởi các giá trị đột biến
• Một dãy số có thể có nhiều Mode
• Một dãy số có thể không có Mode
• Mode có thể xác định cho dữ liệu định tính
f f h
x Mode
1 M M 1
M M
1 M M M
(min) Mo
0 0 0
0
0 0 0
+
−
−
− +
−
− +
=
54
Trang 28Đo lường khuynh hướng tập trung
4 Trung bình nhân/ trung bình hình học (geometric mean)
1 x x x x
x =
55
Các thước đo vị trí khác
Other Measures of Location
PercentilesPhân vị
The pthpercentile in a data array:
• p% are less than or equal to this value
• (100 – p)% are greater than or equal to this value
(where 0 ≤ p ≤ 100)
56
Trang 29i = +
121)(19100
601)(n100
Vì vậy sử dụng trị số ở giữa vị trí 2 và vị trí 3: Q1 = 12.5
25100
58
Trang 30Minimum 1st Median 3rd Maximum Quartile Quartile
Các thước đo vị trí khác
Biểu đồ hộp và râu (Box and whisker plot)
Là công cụ đồ học thể hiện 5 số trị số tóm tắt :Minimum Q1 Median Q3 Maximum
Hình hộp và đường trung tâm ở ngay vị trí chính giữa cho thấy
dữ liệu đối xứng quanh trung vị
Minimum 1st Median 3rd Maximum Quartile Quartile
25% 25% 25% 25%
59
Đo lường độ phân tán/biến thiên
Same center, different variation
60
Trang 31Đo lường độ phân tán/biến thiên
Variation
VariationPopulation
Variance
Sample Variance
PopulationStandardDeviationSample Standard Deviation
Range
Interquartile Range
Độlệch chuẫntổng thể
Độlệch chuẩnmẫu
Khoảngbiến thiên
Độtrải giữa
62
Trang 32Đo lường độ phân tán/biến thiên
1 Khoảng biến thiên:
2
1 2
1
) (
1
2 2
n
i i
n
i i
%100
64
Trang 33Đo lường độ phân tán/biến thiên
Quy tắc thực nghiệm
• Đối với những tổng thể lớn, phân phối của các giá trị có dạng gần giống hình chuông cân đối (có thể dùng đồ thị Histogram để xem xét), phân phối chuẩn được sử dụng để mô tả hình dáng của phân phối
65
Đo lường độ phân tán/biến thiên
Quy tắc Tchebychev
• Bất kỳ một tổng thể nào với trung bình là µ và độ lệch tiêu chuẩn là
σ, thì có ít nhất 100(1-1/m2)% giá trị rơi vào khoảng µ ± mσ, với m >
1
66
Trang 34Hình dáng phân phối của tập dữ liệu
Cha p 3-67
Mean =Median =Mode
Mean <Median <Mode Mode<Median <Mean
Right-Skewed
(Longer tail extends to left) (Longer tail extends to right)
Diễn tả dữ liệu được phân phối như thế nào Đối xứng hay lệch
Lệch phải
Hình dáng phân phối của tập dữ liệu
Diễn tả dữ liệu được phân phối như thế nào Đối xứng hay lệch
Right-Skewed
Q1 Q2Q3 Q1Q2Q3 Q1 Q2 Q3
68
Trang 35Chuẩn hóa dữ liệuChuyển các dữ liệu với đo vị đo lường thực tế về đơn vị đo lường
là độ lệch chuẩn
Khi có nhiều biến số có đơn vị tính khác nhau, chuẩn hóa dữ liệugiúp so sánh được biến thiên của chúng
Với dữ liệu của tổng thể:
Với dữ liệu của mẫu quan sát:
σ
µ x
s
x x
Trang 36Ước lượng điểm & ước lượng khoảng
71
• Ước lượng điểm: ước lượng bằng 1 trị số
• Ước lượng khoảng: ước lượng bằng 1 khoảng trị số, gọi làkhoảng tin cậy, có thêm thông tin về khả năng biến thiên
Point Estimate
Lower Confidence Limit
UpperConfidence Limit
Width of confidence interval
Ước lượng điểm
Chúng ta có thể ước lượng tham số tổng thể với 1 trị số của mẫu (UL điểm)
Trung bình
x μ
Trang 37Ước lượng khoảng
• Ước lượng khoảng có tính tới biến thiên của tham số mẫu từmẫu này so với mẫu khác
• Chỉ dựa vào một mẫu quan sát
• Cho biết thông tin về tham số tổng thể có thể có trị số trongkhoảng ước lượng, và không bao giờ chắc chắn được 100%
Ước lượng khoảng
• Công thức chung của ước lượng khoảng
• Hệ số tin cậy suy từ độ tin cậy mong muốn
• Ví dụ với độ tin cậy 95% (1 – α) =0,95, từ bảng phân phốichuẩn hệ số tin cậy là 1,96
Point Estimate ± (Critical Value) x (Standard Error)
UL điểm ± ± (hệ số tin cậy) x (Sai số chuẩn)
Trang 38Ước lượng khoảng
• Ước lượng khoảng tham số của 1 tổng thể
Population Mean
ConfidenceIntervals
PopulationProportion
n
s t
x ± α/2n
σ z
n
) p ( p z
Ước lượng khoảng
• Ước lượng khoảng khác biệt tham số giữa 2 tổng thể
Meandifference
pairedsamples
Difference
Proportiondifference
independentsamples
Trang 39Ước lượng khoảng
• Ước lượng khoảng khác biệt tham số giữa 2 tổng thể
y
2 y x
2 x 2 / y
x y
2 y x
2 x 2 /
n n z ) y x ( n
n z ) y x
+
σ +
−
≤ µ
− µ
≤
σ +
d -
n
s t
Meandifference
pairedsamples
Difference
Proportiondifference
independentsamples
Ước lượng khoảng
• Ước lượng khoảng khác biệt tham số giữa 2 tổng thể
Meandifference
pairedsamples
Difference
Proportiondifference
independentsamples
y
y y x
x x z y x y P x P y
y y x
x x z y x
) ˆ 1 ( ˆ ) ˆ 1 ( ˆ 2 / ) ˆ ˆ )
ˆ 1 ( ˆ ) ˆ 1 ( ˆ 2 / ) ˆ
+
− +
−
−
−
α α
Trang 40Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế(Applied Statistics for Business & Economics)
Lower tail test
Upper tail test
Two tailed test
Rejection region is shaded
Điều chúng ta muốn chứng minh là đúng được đặt làm giả thuyết đối