Hai lĩnh vực thống kê • Thống kê mô tả: – Thu thập số liệu – Tính toán các đặc trưng đo lường – Mô tả, trình bày dữ liệu • Thống kê suy diễn – Ước lượng, kiểm định thống kê – Phân tích
Trang 1Thống kê Kinh Doanh
(Statistics for Business)
• TK mô tả và TK suy diễn tạo thành thống kê ứng dụng Còn thống kê toán là lĩnh vực nghiên cứu cơ sở lý thuyết của khoa học thống kê
Trang 2Hai lĩnh vực thống kê
• Thống kê mô tả:
– Thu thập số liệu – Tính toán các đặc trưng đo lường – Mô tả, trình bày dữ liệu
• Thống kê suy diễn
– Ước lượng, kiểm định thống kê – Phân tích mối liên hệ
– Dự đoán …
3
Các phương pháp nghiên cứu thống kê
• Nghiên cứu thử nghiệm: Nghiên cứu thử nghiệm thực hiện việc
đo lường đối tượng nghiên cứu, thay đổi điều kiện của đối tượng, và đo lường lại đối tượng với cùng một cách đo để xác định xem sự thay đổi được kiểm soát chủ động này có làm thay đổi các giá trị đo đạc hay không
• Nghiên cứu quan sát: không thực hiện điều khiển biến nguyên nhân có kiểm soát, mà chỉ thu thập các dữ liệu cần nghiên cứu
và khảo sát tương quan giữa biến nguyên nhân và biến kết quả
Trang 3Ứng dụng của thống kê
• Thống kê bảo hiểm
• Thống kê trong kỹ thuật
• Thống kê trong sinh học
• Kinh tế lượng
• Thống kê trong kinh doanh
• Thống kê dân số
• Thống kê trong tâm lý học
• Thống kê trong giáo dục học
• Thống kê xã hội (cho tất cả các ngành khoa học xã hội)
• Phân tích xử lí và chemometric (phân tích dữ liệu từ phân tích hóa học)
• Thống kê độ tin cậy của công nghệ
• Địa lí và hệ thống thông tin địa lí, đặc biệt trong phân tích không gian
• Thống kê trong xử lí hình ảnh
• Thống kê trong thể thao …
5
Ứng dụng của thống kê
Trang 4– Đo lường kết quả kinh doanh, tiếp thị – Dự báo kinh doanh…
Trang 5Một số KN thường dùng trong thống kê
• Tổng thể (population): tập hợp các đơn vị/phần tử cần phân tích/nghiên cứu
• Đơn vị tổng thể (unit): phần tử nhỏ nhất tạo thành tổng thể
• Mẫu: một phần của tổng thể được chọn ra để thu thập thông tin
• Đặc điểm thống kê/ tiêu thức/tiêu chí: đặc điểm của đơn vị tổng thể dùng để quan sát hay thu thập dữ liệu
– Đâc điểm định tính: đặc điểm biểu hiện không phải là số – Đặc điểm định lượng: đặc điểm biểu hiện là các trị số, có thể rời rạc hay liên tục
• Chỉ tiêu thống kê: trị số phản ảnh đặc điểm/tính chất trong điều kiện thời gian và không gian xác định
– Chỉ tiêu khối lượng: biểu hiện quy mô khối lượng – Chỉ tiêu chất lượng: biểu hiện tính chất, mức độ phổ biến
9
Quy trình nghiên cứu thống kê
Xác định vấn đề nghiên cứu, mục đích, nội dung, đối tượng nghiên cứu
Xây dựng hệ thống các khái niệm, chỉ tiêu thống kê Thua thập dữ liệu thống kê
Xử lý số liệu:
Tập hợp, Kiểm tra , biên tập số liệu
Phân tích thống kê sơ bộ
Lựa chọn các phương phápphân tích thống kê
thích hợp
Phân tích và giải thích kết quả
Dự đoán xu hướng phát triển
Báo cáo và truyền đạt kết quả nghiên cứu
10
Trang 6Các loại thang đo
thang đo danh nghĩa
thang đo
tỉ lệ
thang đo thứ bậc
thang đo khoảng cách
• Thang danh nghĩa: dùng để phân loại
• Được sử dụng nhiều trong quản trị, kinh doanh, tiếp thị
• Tương thích với nhiều cơ sở dữ liệu có sẵn
• Trang w eb tham khảo: w ww.spss.com hay
• Tài liệu tiếng Việt:
Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008) Phân tích dữ liệu nghiên cứu với SPSS, NXB Hồng Đức
Trang 7Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 2
THU THẬP DỮ LIỆU THỐNG KÊ
Hoàng Trọng
Xác định dữ liệu cần thu thập
• Tập trung vào dữ liệu cần thiết và hữu ích
• Tiết kiệm thời gian, công sức và chi phí
• Phải xuất phát từ vấn đề nghiên cứu và mục tiêu nghiên cứu TK
Sức khỏe Điểm đầu vào
Thích ngành học
Đi làm thêm
Trang 8Dữ liệu định tính và dữ liệu định lượng
Dữ liệu
Dữ liệu định lượng
Dữ liệu định tính
thang đo danh nghĩa
thang đo
tỉ lệ
thang đo thứ bậc
thang đo khoảng cách
• Dữ liệu định tính: thu thập từ thang đo danh nghĩa và thứ bậc -> khơng tính được trị trung bình
• Dữ liệu định lượng: thu thập từ thang đo khoảng cách và tỉ lệ -> tính được trị trung bình
Dữ liệu định tính và dữ liệu định lượng Thời gian làm thêm Kết quả học tập Loại kiểm định Định tính
Phân tích phương sai
1 yếu tố
Định lượng Số giờ làm thêm:
_giờ/tuần
Định lượng
Điểm trung bình học tập
Hồi quy và kiểm định
F
Trang 9Dữ liệu thứ cấp và dữ liệu sơ cấp
• Dữ liệu thứ cấp: nguồn có sẵn, đã được tổng hợp, xử
• Dữ liệu sơ cấp: thu thập trực tiếp, ban đầu, từ đối tượng nghiên cứu
• Điểm mạnh: phong phú, đáp ứng đúng nhu cầu nghiên cứu
• Điểm yếu: cần thời gian, tốn kém
• Các tổ chức, hiệp hội, viện nghiên cứu
• Các công ty nghiên cứu và cung cấp thông tin
Trang 10Nguồn dữ liệu thứ cấp
• Nhiều dữ liệu thứ cấp đã được nhiều cơ quan chính phủ, các tổ chức, các đơn vị nghiên cứu, các doanh nghiệp, trường học … đưa lên mạng internet và người nghiên cứu có thể tìm thấy tại các trang w eb của các đơn vị này hay tại các cơ sở dữ liệu trên mạng internet
• Dùng các máy tìm kiếm (search engine) như google, yahoo …
và các từ khóa (keyw ords) phù hợp dò tìm và chọn lọc các nguồn tài liệu trên mạng internet
• Để định vị nguồn dữ liệu thứ cấp hiệu quả, cần xác định rõ vấn
đề và mục tiêu của cuộc nghiên cứu để quyết định từ khóa phù hợp Từ khóa cần chi tiết và phản ảnh chính xác điều người nghiên cứu cần tìm kiếm
19
Nguồn dữ liệu thứ cấp
Thực hành nhóm:
1 mỗi nhóm chọn 1 vấn đề cần nghiên cứu thống kê
2 Xác định nội dung cần thống kê
3 Xác định từ khóa tìm kiếm
4 Thực hiện việc tìm kiếm dữ liệu thứ cấp
5 Báo cáo kết quả thực hiện tìm kiếm dữ liệu thứ cấp
Trang 11Nguồn dữ liệu thứ cấp Chính Phủ http://www.chinhphu.vn
Bộ Công Thương http://www.moi.gov.vn
Bộ Giáo Dục và Đào Tạo http://www.moet.gov.vn
Bộ Lao động - Thương binh – Xã hội http://www.molisa.gov.vn
Bộ Tư Pháp http://www.moj.gov.vn
Bộ Xây Dựng http://www.moc gov.vn Tổng Cục Thống Kê http://www.gso.gov.vn
Tổng Cục Thuế http://www.gdt.gov.vn Ngân Hàng Nhà Nước http://www.sbv.gov.vn
TP Hà Nội http://www.hanoi.gov.vn
TP Hải Phòng http://www.haiphong.gov.vn
TP Đà Nẵng http://www.danang.gov.vn Tỉnh Đồng Nai http://www.dongnai.gov.vn Tỉnh Bình Dương http://www.binhduong.gov.vn Tỉnh Bà Rịa-Vũng Tàu http://www.baria- vungtau.gov.vn
TP Cần Thơ http://www.cantho.gov.vn
TP Hồ Chí Minh http://www.hochi minhcity.gov.vn 21
Nguồn dữ liệu thứ cấp Cục Thống Kê TPHCM http://www.pso.hoc himinhcity.gov.vn/
Cục Thuế TPHCM http://www.hcmtax.gov.vn/
Sở Kế Hoạch Đầu Tư TPHCM http://www.dpi.hochi minhcity.gov.vn/
Sở Công Thương TPHCM http://www.congthuong.hochi minhcity.gov.vn/
Cục Hải Quan TPHCM http://www.haiquan.hochi minhcity.gov.vn/
Sở giao dịch chứng khoán TPHCM http://www.vs e.org.vn Đại hội Bất Động Sản Du Lịch http://www.vntpa.vn/
Hiệp hội Bất Động Sản TPHCM http://www.horea.org.vn Liên đoàn Lao Động TPHCM http://www.ldld.hochi minhcity.gov.vn/web/tint
uc/
Tập đoàn Điện Lực VN http://www.evn.c om.vn/
Tập đoàn Than – Khoáng Sản VN http://www.vinacomin.vn/
Tập đoàn Bưu Chính Viễn Thông http://www.vnpt.com.vn/
Tập đoàn Dệt May Việt Nam http://www.vinatex.com.vn
Trang 12Trang web của IMF http://www.imf.org/external/index.htm
Trang web của World Bank http://www.worldbank.org/
Trang web của Ngân hàng phát triển Châu Á http://www.adb.org/
Trang web của Hiệp hội Bất Động Sản Canada http://www.crea.ca/
Trang web hội các nhà phát triển BDS Singapore http://www.redas.c om/
Trang web Trung tâm thương mại quốc tế ITC (www.intracen.org) là trang web chứa một cơ sở dữ liệu chuyên sâu phục vụ cho công tác nghiên cứu thị trường, đặc biệt là công tác XTTM, thông tin thu thập
từ trên 180 quốc gia và vùng lãnh thổ
http://www.mac map.org/
http://www.investmentmap.org/
http://www.p-maps.org/
Trang web của Business Monitor International http://www.businessmonitor.com
Trang web của EuroMonitor International http://www.euromonitor.com
Trang web của RNCOS Industry Rerearch
Dữ liệu sơ cấp
• Dữ liệu sơ cấp được thu thập qua các cuộc điều tra khảo sát
• Điều tra thường xuyên, điều tra không thường xuyên
• Điều tra toàn bộ, điều tra không toàn bộ
Trang 13Dữ liệu sơ cấp
25
Dữ liệu sơ cấp
Trang 14Dữ liệu sơ cấp
27
Dữ liệu sơ cấp
Trang 15Dữ liệu sơ cấp
29
Thu thập dữ liệu ban đầu
• Trực tiếp: quan sát, thực nghiệm,
• Gián tiếp: phỏng vấn cá nhân, khảo sát qua điện thoại, email, khảo sát online
Trang 1631
• Điều tra chọn mẫu là một loại điều tra không toàn bộ, trong
đó chỉ chọn ra một số đơn vị từ tổng thể chung để điều tra thực tế, rồi sau đó tính toán suy rộng cho toàn bộ tổng thể
• Ưu điểm: tiết kiệm chi phí, thời gian, hạn chế sai số thô
• Hạn chế:
– có sai số chọn mẫu (sai số do tính đại diện) – Không thay thế được ĐT toàn bộ khi cần số liệu chi tiết của từng đơn vị
Chọn mẫu
• sai số phi chọn mẫu
• sai số chọn mẫu (margin of error):
– Khi ước lượng trung bình tổng thể, sai số chọn mẫu trung bình
(statndard error) là:
– Khi ước lượng tỷ lệ sai số chọn mẫu trung bình là:
– Trường hợp chọn mẫu không hoàn lại, sai số trung bình sẽ nhân
thêm với hệ số điều chỉnh tổng thể hữu hạn:
Chọn mẫu
n n
n
) p - 1 ( p
pˆ = σ
N
n - 1 FPC =
Trang 1733
• Phạm vi sai số chọn mẫu với độ tin cậy xác định:
• Khi ước lượng trung bình tổng thể, sai số chọn mẫu là:
• Khi ước lượng tỷ lệ sai số trung bình là
Chọn mẫu
n z
x
σ
= σ
=
n
) p - 1 ( p z
z /2 Pˆ /2
ε
Chọn mẫu
Trang 18Chọn mẫu
Kích thước mẫu n phụ thuộc vào các yếu tố sau:
• Phương pháp chọn mẫu sẽ được tiến hành theo phương pháp nào
• xác định phạm vi sai số có thể chấp nhận được (εεεε)
• Quy định độ tin cậy muốn có trong ước lượng
• Xác định hệ số tin cậy z từ độ tin cậy mong muốn
• Ước tính độ lệch chuẩn của tổng thể
Chọn mẫu Khi nghiên cứu để ước lượng trung bình:
Khi nghiên cứu để ước lượng tỷ lệ:
2 x
2 2 2 /
z n
ε
σ
2 2 2 / 2
x
2 2 2 /
z N
N z
n
σ + ε
σ
=
α α
2 p
2 2 / αε
pq z
n =
pq z N ε
pqN z
2 / α
2 p
2 2 / α
+
=
Trang 19– tiến hành điều tra thí điểm để tính độ lệch tiêu chuẩn
– nếu hiện tượng nghiên cứu có phân phối chuẩn thì có thể ước tính
độ lệch tiêu chuẩn theo khoảng biến thiên r có thể xảy ra:
6
x - x 6
R m ax m in
=
= σ
Chọn mẫu ngẫu nhiên đơn giản
• Mỗi đơn vị của tổng thể được chọn với sự ngẫu nhiên như nhau (được chọn vào mẫu với cơ hội/ xác suất bằng nhau)
• Phải có danh sách các đơn vị của tổng thể cần nghiên cứu và khảo sát (khung mẫu hay dàn chọn mẫu, sampling frame) Các đơn vị này có thể được sắp xếp theo một trật tự nào đó, ví dụ như theo vần ABC, theo quy mô, theo địa chỉ … và được gán cho một số thứ tự từ đơn vị thứ 1 đến đơn vị cuối cùng
• Có thể thực hiện việc lấy đơn vị mẫu ra bằng nhiều cách như bốc thăm, quay số, hay dùng số ngẫu nhiên, hàm ngẫu nhiên trong Excel nếu số lượng đơn vị tổng thể ít, khung lấy mẫu ngắn Khi có quá nhiều đơn vị, cần có dưới dạng file và dùng phần mềm thống kê để chọn
• Cho kết quả tốt nếu giữa các đơn vị của tổng thể không có khác biệt nhiều Nếu tổng thể có kết cấu phức tạp thì chọn theo phương pháp này sẽ khó đảm bảo tính đại biểu
• Ước lượng theo công thức cơ bản như Chương ước lượng
Trang 20Chọn mẫu ngẫu nhiên hệ thống
• Chỉ cần chọn ra một/hai con số ngẫu nhiên là có thể xác định được tất cả các đơn vị mẫu cần lấy ra từ danh sách chọn mẫu (thay vì phải chọn ra n số ngẫu nhiên ứng với n đơn vị mẫu cần lấy ra)
• Quy trình thực hiện:
– Chuẩn bị danh sách chọn mẫu, xếp thứ tự theo một quy ước nào
đó, đánh số thứ tự cho các đơn vị trong danh sách Tổng số đơn vị trong danh sách là N
– Xác định cỡ mẫu muốn lấy, ví dụ gồm n quan sát – Chia N đơn vị tổng thể thành k nhóm theo công thức k=N/n, k được gọi là khoảng cách chọn mẫu
– Trong k đơn vị đầu tiên ta chọn ngẫu nhiên ra 1 đơn vị (bốc thăm hay sử dụng bảng số ngẫu nhiên hay hàm ngẫu nhiên), đây là đơn
vị mẫu đầu tiên, các đơn vị mẫu tiếp theo được lấy cách đơn vị này
1 khoảng là k, 2k, 3k
Chọn mẫu phân tầng
• Sử dụng khi các đơn vị quá khác nhau về tính chất liên quan đến vấn đề cần nghiên cứu và khảo sát
• Tổng thể nghiên cứu được chia thành các tầng lớp, mục tiêu là
để các giá trị của các đối tượng tổng thể ta quan tâm thuộc cùng một tầng càng ít khác nhau càng tốt Sau đó các đơn vị mẫu được chọn từ các tầng này theo các phương pháp lấy mẫu xác suất thông thường như lấy mẫu ngẫu nhiên đơn giản hay lấy mẫu hệ thống
• Đặc điểm dùng để phân tầng phải có liên quan đến nội dung bạn cần nghiên cứu khảo sát
• Số đơn vị mẫu trong từng tầng lớp có thể: bằng nhau, theo tỉ lệ của từng class hay phân bổ tối ưu (vừa theo quy mô của tầng lớp và theo mức độ đồng đều của các đơn vị trong cùng một tầng lớp)
Trang 21Chọn mẫu phân tầng
• Khi quy mô toàn bộ mẫu không lớn lắm, lúc đó có thể phân bổ mẫu cho các tầng lớp đều nhau (mục đích chính là xem kết quả của từng tầng lớp và so sánh giữa các tầng lớp với nhau, mục đích khác là xem xét kết quả của toàn bộ tổng thể), và khi cần có kết quả chung thì sẽ gia trọng (nhân với hệ số) các tầng lớp theo hệ số phản ảnh qui mô của từng tầng lớp trong toàn bộ tổng thể
• Giả sử chúng ta cần lấy n đơn vị mẫu từ N đơn vị tổng thể, các đơn vị tổng thể được phân tầng thành k lớp
• Nếu dùng phân bổ mẫu đều thì công thức tính số lượng đơn vị mẫu lấy
ra trong từng tầng lớp đơn giản là:
• Nếu phân bổ mẫu theo tỉ lệ, thì công thức tính số lượng đơn vị mẫu lấy
ra trong từng tầng lớp sẽ theo tỉ lệ tức là cụ thể từ tầng lớp thứ i là:
k k
1 = 2 =K= =
N
n N
n N
n N n
Trang 22Chọn mẫu phi ngẫu nhiên
• Khi không có điều kiện về thời gian, thông tin (số lượng đơn vị tổng thể, cơ cấu tổng thể và khung lấy mẫu) và chi phí để thực hiện lấy mẫu ngẫu nhiên
• Các cách chọn mẫu thông dụng: lấy mẫu thuận tiện, lấy mẫu
định mức,
• Nhược điểm: giá trị suy rộng thấp Thực tế cố gắng sử dụng chọn mẫu phi ngẫu nhiên một cách khách quan, mô phỏng chọn mẫu ngẫu nhiên càng giống càng tốt
• Cỡ mẫu được xác định bằng công thức tính cỡ mẫu trong trường hợp chọn ngẫu nhiên và nhân thêm hệ số tăng để bù đắp cho khả năng sai số chọn mẫu lớn hơn vì tính đại diện kém hơn
Chọn mẫu phi ngẫu nhiên
• Lấy mẫu thuận tiện: đến những nơi mà có nhiều khả năng gặp được đối tượng muốn khai thác thông tin mà bạn cảm thấy tiện lợi, cần suy nghĩ kỹ về thời gian, địa điểm hay hoàn cảnh sẽ gặp đối tượng và thu thập dữ liệu ở đó sao cho mẫu lấy ra càng giống với đối tượng mục tiêu mong muốn
• Lấy mẫu định mức: tương tự lấy mẫu xác suất phân tầng ở chỗ đầu tiên người nghiên cứu phải phân chia tổng thể nghiên cứu thành các tầng (tổng thể con) Nhưng điểm khác biệt cơ bản là trong từng tổng thể con những người phỏng vấn được chọn mẫu
tại hiện trường theo cách thuận tiện hay phán đoán, trong khi
trong mỗi tầng của chọn mẫu phân tầng thì các đơn vị mẫu được chọn ra theo kiểu xác suất từ dàn chọn mẫu
Trang 23Kế hoạch điều tra thống kê
• Mục đích điều tra thống kê
• Xác định đối tượng điều tra và đơn vị điều tra
• Nội dung điều tra
• Thời điểm, thời kỳ, thời hạn điều tra
• Biểu điều tra, bản giải thích cách ghi biểu
• Sai số do đăng ký (sai số thô, không do chọn mẫu)
• Sai số do tính chất đại biểu (sai số do chọn mẫu) Hạn chế sai số:
• Sai số do đăng ký: làm tốt công tác chuẩn bị, giám sát kiểm tra
kỹ lưỡng
• Sai số do tính chất đại biểu: thiết kế chọn mẫu và kiểm tra thực hiện việc chọn mẫu
Trang 24Thực hành điều tra thống kê
Bài tập nhóm :
Tiếp theo bài tập tìm dữ liệu thứ cấp, mỗi nhóm dựa trên các dữ liệu thứ cấp đã thu thập, xác định rõ hơn vấn đề cần nghiên cứu thống kê của nhóm, cụ thể
– Mục đích nghiên cứu điều tra thống kê – Xác định đối tượng điều tra và đơn vị điều tra – Nội dung điều tra
– Thời điểm, thời kỳ, thời hạn điều tra – Biểu điều tra, bản giải thích cách ghi biểu – Các nhóm trình bày, GV góp ý và sau đó tiến hành thu thập
dữ liệu Tính điểm 5%
47
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 3
TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU
BẰNG BẢNG & BIỂU ĐỒ
Hoàng Trọng
Trang 25Lý thuyết phân tổ
Khái niệm Các bước tiến hành phân tổ:
– Lựa chọn tiêu thức/biến – Xác định số tổ
• Tiêu thức/biến định tính: không ghép & ghép
• Tiêu thức/biến định lượng: không ghép & ghép – Kết quả là bảng phân tổ
49
Lý thuyết phân tổ
Số người có thu nhập trong hộ gia đình
Số người Tần số Tần suất % tích lũy % Tần suất
Trang 26Lý thuyết phân tổ
Phương pháp nhánh và lá Các dữ liệu thu thập được sẽ được tách thành hai phần: phần nhánh và phần lá Việc phân chia này có thể linh hoạt
Tuổi của 30 sinh viên ngành KTKT
22 32 27 Tuổi của 30 sinh viên ngành QTKD
Biểu đồ nhánh lá hoàn chỉnh
Trang 27Bảng kết hợp
số cột % Tần số Tần số Tần số Tần số
Có hoạt động kinh tế Làm v iệc trong nhà máy 18 14,3 91 10,5 5 11,6
Làm nghề tự do 39 31,0 187 21,5 11 25,6 Làm v iệc trong các CQNN 2 1,6 30 3,5 2 4,7 làm v iệc trong các CH 3 2,4 22 2,5 1 2,3
động kinh tế Thu nhập từ nguồn khác 6 4,8 41 4,7
• Biểu đồ diện tích (hình tròn, hình vuông, hình chữ nhật)
• Đồ thị đường gấp khúc (đường động thái)
• Bản đồ thống kê
Trang 28Biểu đồ thống kê
55
Biểu đồ thống kê
Trang 29Bản đồ mật độ dân số của các tỉnh/thành phố
57
Thực hành
• Tiến hành thu thập dữ liệu của đề tài nhóm
• Dùng phần mềm thống kê, nhập liệu vào
• Chạy ra bảng và vẽ biểu đồ thống kê
• Trình bày kết quả (mỗi nhóm tối đa 8 phút) Tính điểm 10%
Trang 30Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 4
MÔ TẢ DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ
Hoàng Trọng
Số tuyệt đối
• Số tuyệt đối là chỉ tiêu biểu hiện qui mô, khối lượng của hiện tượng kinh tế - xã hội trong điều kiện thời gian và địa điểm cụ thể
• Ví dụ: Theo kết quả sơ bộ của cuộc Tổng điều tra dân số thì
Tổng số dân của nước ta có lúc 0 giờ 1/4/2009 là 85.789.573,
tăng 9,47 triệu người so với năm 1999 là 76.324.753 người
Trang 31• Đơn vị tính số tuyệt đối:
– Đơn vị hiện vật: cái, chiếc, con, trái, củ, người, căn … – Đơn vị hiện vật quy đổi: lương thực quy ra lúa
– Đơn vị hiện vật quy ước: mét, mét vuông, mét khối, lít , kg,
… – Đơn vị tiền tệ: đồng, USD … – Đo vị thời gian lao động: giờ công, ngày công, …
61
Số tương đối
• chỉ tiêu biểu hiện quan hệ so sánh (tỷ số) giữa hai mức độ của hiện tượng nghiên cứu
• Các loại số tương đối:
– Số tương đối động thái: phản ảnh thay đổi qua thời gian Lấy mức độ ở một thời gian (y1) chia cho mức độ ở 1 thời gian khác (thường là liền kề trước đó được lấy làm gốc so sánh (yo)
y1/ yo– Số tương đối kế hoạch:
• Nhiệm vụ kế hoạch: so mức kế hoạch (nhiệm vụ) với mức đạt
ở lần trước: yk/ yo
• Thực hiện kế hoạch: so mức thực hiện được với mức kế hoạch
đề ra: y1/ yk
• Mối quan hệ: yk/ yo × y1/ yk =y1/ yo
Trang 32Số tương đối
• Các loại số tương đối:
– Kết cấu: mức độ bộ phận so với toàn bộ, phản ảnh tỷ trọng Ví dụ
số lượng sinh viên nam chia cho tổng số sv của trường sẽ được tỷ
lệ % sinh viên là nam – Cường độ: so giữa hai mức độ của 2 hiện tượng (chỉ tiêu) khác nhau Ví dụ chia dân số trung bình cho diện tích đất tự nhiên sẽ được mật độ dân số Có thể tính mật độ giao thông, mật độ cửa hàng tiện lợi trong nội thành TPHCM so sánh với mật độ của hàng tiện lợi trong khu vực nội thành TP Hà Nội…
– Không gian: so sánh giữa các không gian khác nhau Ví dụ như so sánh giá cùng 1 mặt hàng như nhau qua 2 siêu thị, 2 chợ, 2 thành phố …
Other Measures of Location
Geometric mean
Describing Data Numerically
Variation
Variance Standard Deviation Coefficient of Variation
Range Percentiles
Interquartile Range Quartiles
Trang 33Đo lường khuynh hướng tập trung Tìm ra mức độ đại diện theo một tiêu thức/biến
Khuynh hướng tập trung
Trung bình Trung vị Mode
Trung bình hình học
1
1
n i i
N i i
X X
n X N
1x x x x
k
i i i
f
f x x
1 1
k 1 i
i i
f
fmx
n
1 i i
=
=
Trang 34Đo lường khuynh hướng tập trung
1 Trung bình cộng
• Trung bình tổng thể
N
fx
k 1 i
i i
=
=µ
N
fm
k 1 i
i i
=
=µ
=
= µ
Trang 35Đo lường khuynh hướng tập trung
=
n n
e
x x
M
Me = X(n+1)/2
Me
Me i
Me Me
e
f
S f h
x M
Trang 36Đo lường khuynh hướng tập trung
3 Mốt (mode)
• Đo lường khuynh hướng tập trung
• Mode là giá trị có tần số lớn nhất
• Mode không chịu ảnh hưởng bởi các giá trị đột biến
• Một dãy số có thể có nhiều Mode
• Một dãy số có thể không có Mode
• Mode có thể xác định cho dữ liệu định tính
f f h
x Mode
1 M M 1
M M
1 M M M
(min) Mo
0 0 0
0
0 0 0
+
−
−
− +
−
− +
=
Trang 37Đo lường khuynh hướng tập trung
4 Trung bình nhân/ trung bình hình học (geometric mean)
Percentiles Phân vị
The pth percentile in a data array:
• p% are less than or equal to this value
• (100 – p)% are greater than or equal to this value
(where 0 ≤ p ≤ 100)
Trang 38121)(19100
601)(n100
Vì vậy sử dụng trị số ở giữa vị trí 2 và vị trí 3: Q1 = 12.5
25
100
Trang 39Minimum 1st Median 3rd Maximum Quartile Quartile
Các thước đo vị trí khác Biểu đồ hộp và râu (Box and whisker plot)
Là công cụ đồ họa thể hiện 5 số trị số tóm tắt : Minimum Q1 Median Q3 Maximum
Hình hộp và đường trung tâm ở ngay vị trí chính giữa cho thấy
dữ liệu đối xứng quanh trung vị
Minimum 1st Median 3rd Maximum Quartile Quartile
25% 25% 25% 25%
77
Đo lường độ phân tán/biến thiên
Same center, different variation
Trang 40Đo lường độ phân tán/biến thiên
Variation
Variance Standard Deviation Coefficient of
Variation Population
Variance
Sample Variance
Population Standard Deviation Sample Standard Deviation
Range
Interquartile Range
Độ lệch chuẫn tổng thể
Độ lệch chuẩn mẫu
Khoảng biến thiên
Độ trải giữa