Con người –Tầm nhìn mớiNhập số liệu vào Excel Sử dụng file Excel: Business Statistics/ Resources/Learning-by-Doing/ Affair.xls OBS = Số thứ tự của người được phỏng vấn Y-PT = Số lần quan
Trang 1Thống kê trong
kinh doanh
Thực hành
Excel
Trang 2NGUYỄN DUY TÂM
Nguyễn Duy Tâm _ IDR 1
Con người –Tầm nhìn mới
NỘI DUNG
1. Nhập dữ liệu vào excel
2. Thống kê dữ liệu dạng bảng
3. Thống kê dữ liệu dạng đồ thị
4. Thống kê dữ liệu bằng các đại lượng thống kê mô tả
5. Ước lượng và kiểm định giả thiết
6. Phân tích phương sai ANOVA
7. Hồi quy tương quan
8. Kiểm định phi tham số
9. Lý thuyết quyết định
2
Trang 3Con người –Tầm nhìn mới
Nhập số liệu vào Excel
Sử dụng file Excel: Business Statistics/ Resources/Learning-by-Doing/ Affair.xls
OBS = Số thứ tự của người được phỏng vấn
Y-PT = Số lần quan hệ tình dục ngoài hôn nhân trong năm
Z1_MALE = 1 nếu là nam, 0 nếu là nữ
Z2_AGE = Tuổi
Z3_NOYM = Số năm kết hôn
Z4_CHILD = 1 nếu có con, 0 nếu chưa có con
Z8_SATISFACTION = Mức độ thỏa mãn về hôn nhân, thang Likert 1-5
Ghi chú : Biến số theo cột, quan sát ghi theo hàng
Con người –Tầm nhìn mới
4
Tạo biểu nhập liệu (Form)
Trên một trang bảng tính mới (New worksheet)
Tạo dòng tiêu đề (biến số) ở dòng 1.
Quét khối dòng tiêu đề, rồi vào
Data/ Form
Trang 4Con người –Tầm nhìn mới
Tạo biểu nhập liệu (Form)
Vì chúng ta không định nghĩa chính xác số dòng của
bảng tính, nên Excel có hỏi như bảng giao diện ở
trên Đơn giản là chọn OK.
Con người –Tầm nhìn mới
Trang 5Con người –Tầm nhìn mới
Bản ghi cho người thứ nhất
Con người –Tầm nhìn mới
8
Bản ghi cho người thứ hai
Từ Form nhập liệu, click New để nhập một bản ghi (record)
hay quan sát (observation) mới
Bảng số liệu điều tra của người thứ hai như sau
Z4_CHILD = 0 Chưa có con
Z8_SATISFACTION = 5 Rất hài lòng về cuộc hôn
nhân của mình
Trang 6Con người –Tầm nhìn mới
Bản ghi cho người thứ hai
Làm tương tự cho đến người thứ 10 ở slide 3.
Con người –Tầm nhìn mới
Trang 7Con người –Tầm nhìn mới
Giao diện Sort
Chọn Sort by: Z2_AGE
Chọn Asending: Sắp xếp theo thứ tự tăng dần
Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ
Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin)
Công cụ trên excel:
Dùng lệnh =FREQUENCY[ (data_array, bins_array) ]
12
Trang 8Con người –Tầm nhìn mới
1 THỐNG KÊ DỮ LiỆU DẠNG BẢNG
Quy trình dùng lệnh FREQUENCY
Đối với biến có ít biểu hiện
B1: Lập cột các biểu hiện (cột BIN): là giá trị các biểu hiện
B2: Chọn vùng dữ liệu bảng thống kê, lập lệnh Frequency
Cú pháp: = FREQUENCY(data_array, bins_array)
Data_array: Dữ liệu cần lập bảng
Bins_array: các biểu hiện
Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần
ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím
[ctrl+shift+enter]
Ví dụ: lập bảng thống kê cho tình trạng hôn nhân [Marital]
Con người –Tầm nhìn mới
1 THỐNG KÊ DỮ LiỆU DẠNG BẢNG
Quy trình dùng lệnh FREQUENCY
Đối với biến có nhiều biểu hiện:
B1: Cần lập các [giới hạn dưới] và [giới hạn trên] của mỗi
Trang 9Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data Analysis
Dùng thủ tục Data Analysis trong thư viện hàm Add-Ins của Excel
Kiểm tra xem có thủ tục Data Analysis trong Tools hay chưa?
Tools/ Add-Ins/ Check vào Analysis ToolPak/
OK
Con người –Tầm nhìn mới
16
Biểu đồ tần số-Thủ tục Data Analysis
Tools/ Data Analysis/ Histogram
Trang 10Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data Analysis
Input Range: Quét khối số liệu, nhớ có cả tên biến
Bin Range: Quét biên khối biên trên của biểu đồ tần số, nhớ có cả tên
Labels: Khai báo có dòng đầu tiên là tên biến
Chọn Output range: ô đầu tiên chứa kết quả
Khai báo các kết quả cần nhận: Pareto, Cumulative Percentage, Chart
Output
Con người –Tầm nhìn mới
18
Biểu đồ tần số-Thủ tục Data Analysis
Bảng tần số, tần suất tích lũy và phân phối Pareto
Trang 11Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data Analysis
Con người –Tầm nhìn mới
Trang 12Con người –Tầm nhìn mới
Đồ thị hình tròn thường dùng tần suất (%) để hiển thị
Con người –Tầm nhìn mới
2 THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ
ĐỒ THỊ HÌNH THANH
[COLUMN]
ĐỒ THỊ HÌNH THANH [BAR]
22
Tên thuộc tính dài
Tên thuộc tính ngắn
Trang 14Con người –Tầm nhìn mới
Bảng tóm tắt-Pivot Table
Quét khối dữ liệu cần tính toán, kể cả tên biến, sẽ
được xem là tên trường(Field)
Con người –Tầm nhìn mới
26
Bảng tóm tắt-Pivot Table
Nên chọn trang bảng tính mới
Trang 15Con người –Tầm nhìn mới
Bảng tóm tắt-Pivot Table
Kéo và nhả (Drag and Drop) Z8_SATISFACTION vào Row
Fields và Data Items
Con người –Tầm nhìn mới
Trang 16Con người –Tầm nhìn mới
Pivot Table với 2 biến phân loại
Count of
Grand Total
Pivot Table với 2 biến phân loại
Click vào A3, kéo và thả trường Z1_MALE vào Column
Fields
Ưu điểm: lập bảng tần số chéo cho
nhiều biến.
Trang 17Con người –Tầm nhìn mới
Pivot Table với 3 biến phân loại
Kéo và thả Z4_Child vào Page Fields
Con người –Tầm nhìn mới
Một số yêu cầu
Dùng công cụ Pivot table:
1. Lập bảng tổng số con của các hộ gia đình có 1,2,…,n con cụ thể.
2 Lập bảng tổng số anh,chị em trong nhà ứng với từng loại gia đình cụ thể.
3 Lập bảng tần số cho biến Marital, vẽ biểu đồ và cho biết loại tình trạng
hôn nhân nào chiếm đa số
4 Lập bảng tần số cho biến marita (column) và biến sex (row) Vẽ biểu đồ
và cho biết giới tính nào ứng với tình trạng hôn nhân nào chiếm đa số Vẽ
biểu đồ tương ứng.
5 Lập bảng tần số giữa hai biến marital (column) và wrkstat (row).
6 Lập bảng tần số giữa hai biến marital (column) và wrkstat (row) <chỉ
thống kê cho giới tính nữ> và <chỉ thống kê cho giới tính nam>.
32
Trang 18Con người –Tầm nhìn mới
Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
Con người –Tầm nhìn mới
Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
Tính tổng thỏa điều kiện nâng cao
=sumifs(vùng tính tổng, vùng ĐK1, ĐK1, vùng ĐK2, ĐK2)
Đếm thỏa điều kiện nâng cao
=countifs(vùng ĐK1, ĐK1,vùng ĐK2, ĐK2,…)
Nguyễn Duy Tâm _ IDR
34
Trang 19Con người –Tầm nhìn mới
Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
độ lệch chuẩn cho các biến:
Z2_age, Z4_child, Z6_edu Nêu
ý nghĩa của các số trên.
2 Tính tổng số con của những người có độ tuổi dưới 30 hoặc của những người hài lòng về tình trạng hôn nhân.
3 Đếm những người có 1 con
Con người –Tầm nhìn mới
Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
BÀI TẬP (THUC HANH
gia đình, chưa lập gia đình
BÀI TẬP (THUC HANH EXCEL)
1. Tính tổng số anh/chị/em của những người lý dị, ly thân
2. Tính tổng số con của những người là nữ giới
36
Trang 20Con người –Tầm nhìn mới
Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics
Nhập số liệu và các tùy chọn vào giao diện
Con người –Tầm nhìn mới
38
Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics
Kết quả sau khi đã hiệu chỉnh.
Bài tập: Tính các chỉ tiêu thống kê mô tả bằng công
cụ DATA ANALYSIS cho các biến: agewed sibs
childs age educ trong bài tập thực hành excel
Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION Z5_RELIGIOUS Z6_EDU Z7_OCCUPATION
Trang 21Con người –Tầm nhìn mới
HỆ SỐ TƯƠNG QUAN
Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến
thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng
(interval)
Chú ý: Đối với thang đo định danh (norminal): những chỉ số
tính toán không có ý nghĩa thống kê
Công thức lệnh: tính rxy=correl(data_X, data_Y)
Ý nghĩa:
Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y
-1 < = rxy< 0 : X và Y nghịch biến0< rxy <=1 : X và Y đồng biến
Con người –Tầm nhìn mới
Trang 22Con người –Tầm nhìn mới
Dùng thủ tục Data Analysis để tính ma trận
tương quan
Kết quả.
BT thực hành excel: Tính matrận hệ số tương quan
cho các biến agewed sibs childs age educ và nhận
xét về mối quan hệ giữa các biến
Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION Z5_RELIGIOUS Z6_EDU Z7_OCCUPATION
Trang 23Con người –Tầm nhìn mới
Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn
Trang 24Con người –Tầm nhìn mới
Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn
Xuất ra trang riêng
Con người –Tầm nhìn mới
46
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Chọn loại đồ thị là Scatter
Trang 25Con người –Tầm nhìn mới
Trang 26Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Xuất ra trang riêng
Con người –Tầm nhìn mới
50
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
Số thứ tự trong tổng thể: Hàm Randbetween
Trang 27Con người –Tầm nhìn mới
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
Điền kết quả lấy mẫu: Hàm Vlookup
Con người –Tầm nhìn mới
Trang 28Con người –Tầm nhìn mới
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
KẾT QUẢ MÔ PHỎNG BẰNG THỦ TỤC SAMPLING 10 MẪU
LƯU Ý: KẾT QUẢ NHẬN ĐƯỢC LÀ NGẪU NHIÊN
STT MẪU MẪU 1 MẪU 2 MẪU 3 MẪU 4 MẪU 5 MẪU 6 MẪU 7 MẪU 8 MẪU 9 MẪU 10
Tạo 10 mẫu theo bảng trên (dùng công cụ Sample, số quan sát mỗi mẫu là 9)
Con người –Tầm nhìn mới
LƯU Ý: THEO LÝ THUYẾT THÌ VÀ
CÓ THỂ ĐẠT ĐƯỢC ĐiỀU NÀY VỚI VÔ SỐ LẦN LẤY MẪU
Trang 29Con người –Tầm nhìn mới
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO
Chọn a= 0.05 =>P(1-a/2)= 0.975
Tra ta/2 = 1.964
Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29
Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23)
Trang 30Con người –Tầm nhìn mới
ƯỚC LƯỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG
Tools/ Data Analysis/ Descriptive Statistics
Chọn Summary Statistics và Confidence Level for Mean
Con người –Tầm nhìn mới
58
ƯỚC LƯỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG
Cận dưới = Mean – Confidence Level (95%)
Cận trên = Mean + Confidence Level (95%)
Trang 31Con người –Tầm nhìn mới
Bài tập ước lượng
BÀI TẬP AFFAIR
1. Ước lượng độ tuổi bình
quân (age) của những
người được khảo sát
BÀI TẬP “THUC HANH EXCEL
1. Ước lượng độ tuổi bình quân (age) của những người được khảo sát
2. Ước lượng độ tuổi bình quân kết hôn (agewed)
3. Ước lượng trình độ học vấn (educ) bình quân của những người được khảo sát
Con người –Tầm nhìn mới
60
Kiểm định 1 đuôi (Biết s)
Ho: Số năm học trung bình của người Mỹ tối đa là 15 năm
Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average…
Trang 32Con người –Tầm nhìn mới
61
Kiểm định 1 đuôi (Biết s)
Ho: Số năm học trung bình của người Mỹ tối đa là 15 năm
Giá trị Z = 11.44 nằm ở miền bác bỏ
=>Có bằng chứng thống kê cho thấy số năm học trung bình của
người Mỹ lớn hơn 15 năm
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mới
62
Kiểm định 1 đuôi (Không biết s)
Ho: Số năm học trung bình của người Mỹ tối đa là 16 năm
Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra
ứng với 2a
Trang 33Con người –Tầm nhìn mới
63
Kiểm định 1 đuôi (Không biết s)
Ho: Số năm học trung bình của người Mỹ tối đa là 16 năm
Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho
Vậy số năm học trung bình của người Mỹ cao hơn 16
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mới
64
Kiểm định 2 đuôi (Biết s)
Ho: Số năm học trung bình của người Mỹ là 16 năm
Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải
nhập tham số là (1-a/2)
Trang 34Con người –Tầm nhìn mới
65
Kiểm định 2 đuôi (Biết s)
Ho: Số năm học trung bình của người Mỹ là 16 năm
Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải
nhập tham số là (1-a/2)
Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể
bác bỏ Ho
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mới
66
Kiểm định 2 đuôi (Chưa biết s)
Ho: Số năm học trung bình của người Mỹ là 16 năm
Hàm TINV(a, n-1)
Trang 35Con người –Tầm nhìn mới
67
Kiểm định 2 đuôi (Chưa biết s)
Ho: Số năm học trung bình của người Mỹ là 16 năm
Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mới
Bài tập kiểm định
BÀI TẬP AFFAIR
1 Có giả thiết cho rằng,
độ tuổi (age) bình quân
của những người được
khảo sát là dưới 30
Bạn hãy kiểm định giả
thiết này với mức ý
nghĩa α=5%.
2 Có giả thiết cho rằng,
độ tuổi (age) bình quân
của những người được
2 Có giả thiết cho rằng, độ tuổi (age) bình quân của những người được khảo sát là
46 Theo bạn, đúng hay sai α=3%?
3 Có giả thiết cho rằng, độ tuổi (agewed) bình quân của những người được khảo sát là dưới 40 Bạn hãy kiểm định giả thiết này α=4%.
68
Trang 36Con người –Tầm nhìn mới
69
Ho: Số năm học trung bình của người Mỹ là 16 năm
ZTEST(Array, x, sigma) với Array: Số liệu cần kiểm định
x: Giá trị của phát biểu Ho, Sigma: Nhập nếu biết hoặc để trống
nếu không biết
Nguyễn Duy Tâm _ IDR
Con người –Tầm nhìn mới
70
Ho: Số năm học trung bình của người Mỹ là 16 năm
P_Value = 2*Min(ZTEST, 1-ZTEST)
P_Value = 0.09> a= 0.05 => Không thể bác bỏ Ho
Trang 37Con người –Tầm nhìn mới
Kiểm định sự khác biệt về trung bình của hai tổng
thể-Biết độ lệch chuẩn Affair.xls trang Edu
Ho: Không có sự khác biệt về học vấn trung bình của
hai giới
Kết quả khảo sát cho thấy học vấn trung bình của
nam nhỉnh hơn của nữ nhưng độ lệch chuẩn cao hơn.
Kiểm định Ho bằng thủ tục
Tools | Data Analysis | z-test: Two Sample for Means
OBS MALE EDU(FEMALE) OBS MALE EDU(MALE) EDU(FEMALE) EDU(MALE)
Trang 38Con người –Tầm nhìn mới
Kiểm định sự khác biệt về trung bình của hai tổng
thể-Biết độ lệch chuẩn
Kết quả kiểm định: Bác bỏ Ho
Con người –Tầm nhìn mới
74
Kiểm định sự khác biệt về trung bình của hai tổng
thể-Chƣa biết độ lệch chuẩn
Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
Trang 39Con người –Tầm nhìn mới
Kiểm định sự khác biệt về trung bình của hai tổng
thể-Chưa biết độ lệch chuẩn
Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
Kết quả: Bác bỏ Ho
Con người –Tầm nhìn mới
Bài tập kiểm định mức lương trung bình theo giới tính
1. Có ý kiến cho rằng mức lương trung bình theo giới tính giữa
nam và nữ là như nhau Với số liệu của bài tập Tien luong
thiết trên
2. Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện
tại không có hiệu quả Bằng dữ liệu bài tập hieu qua
và cũ
76
Trang 40Con người –Tầm nhìn mới
Kiểm định F cho sự khác biệt về phương sai của
hai tổng thể
Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Tools | Data Analysis | F-Test: Two-Sample for Variances
Con người –Tầm nhìn mới
Trang 41Con người –Tầm nhìn mới
Kiểm định mẫu cặp: Vợ và chồng có cảm nhận khác biệt
về hạnh phúc không? Affair.xls/ Satisfaction
Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau
Tools | Data Analysis… | t-test: Paired Two Sample for Means
Con người –Tầm nhìn mới
Trang 42Con người –Tầm nhìn mới
Bài tập kiểm định cặp
Có giả định cho rằng, hiệu quả của một phương pháp quảng
cáo được tiến hành cho nhiều công ty khác nhau hiện tại
không có hiệu quả Bằng số liệu của bài tập truoc - sau quang
Con người –Tầm nhìn mới
82
HÀM TTEST-Kiểm định sự khác biệt
fx/ Statistical/ TTEST
Type: 1 cho mẫu cặp, 2 cho phương sai bằng nhau, 3 cho
phương sai khác nhau
Trang 43Con người –Tầm nhìn mới
ANOVA: Vợ và chồng có có mức độ hài lòng về hôn
nhân trung bình khác nhau không?
Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau
Tools/ Data Analysis/ ANOVA-Single Factor
Con người –Tầm nhìn mới
84
ANOVA: Nam và nữ có có mức độ hài
lòng về hôn nhân khác nhau không?
Ho: Hai giới thỏa mãn về hôn nhân trung bình như nhau
Trang 44Con người –Tầm nhìn mới
ANOVA một nhân tố-Ví dụ chương 8 Worksheet in
Chapter8(V)
So sánh năng suất của 3 máy
Ho: Năng suất của 3 máy là như nhau
Con người –Tầm nhìn mới
86
ANOVA một nhân tố-Ví dụ chương 8
Ho: Năng suất của 3 máy là như nhau
Trang 45Con người –Tầm nhìn mới
Thủ tục Tukey-Kramer
Tools/ Lumenaut Statistics/ Tukey-Kramer Test
Lumenaut là một phần mềm Add-Ins miễn phí, chạy trên nền Excel
Con người –Tầm nhìn mới
88
Thủ tục Tukey-Kramer
Tools/ Lumenaut Statistics/ Tukey-Kramer Test