thống kê trong kinh doanh thực hành excel tài liệu, giáo án, bài giảng , luận văn, luận án, đồ án, bài tập lớn về tất cả...
Trang 2NỘI DUNG
1. Nhập dữ liệu vào excel
2. Thống kê dữ liệu dạng bảng
3. Thống kê dữ liệu dạng đồ thị
4. Thống kê dữ liệu bằng các đại lượng thống kê mô tả
5. Ước lượng và kiểm định giả thiết
6. Phân tích phương sai ANOVA
7. Hồi quy tương quan
8. Kiểm định phi tham số
9. Lý thuyết quyết định
Trang 3Con người –Tầm nhìn mới
Nhập số liệu vào Excel
OBS Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION
Y-PT = Số lần quan hệ tình dục ngoài hôn nhân trong năm
Z1_MALE = 1 nếu là nam, 0 nếu là nữ
Z3_NOYM = Số năm kết hôn
= 1 nếu có con, 0 nếu chưa có con
Trang 4Tạo biểu nhập liệu (Form)
Trên một trang bảng tính mới (New worksheet)
Tạo dòng tiêu đề (biến số) ở dòng 1.
Quét khối dòng tiêu đề, rồi vào
Data/ Form
Trang 5Tạo biểu nhập liệu (Form)
Vì chúng ta không định nghĩa chính xác số dòng của bảng tính, nên Excel có hỏi như bảng giao diện ở
trên Đơn giản là chọn OK.
Trang 6Bản ghi cho người thứ nhất
Trang 7Con người –Tầm nhìn mới
Bản ghi cho người thứ nhất
Trang 8Bản ghi cho người thứ hai
Từ Form nhập liệu, click New để nhập một bản ghi (record)
hay quan sát (observation) mới
Bảng số liệu điều tra của người thứ hai như sau
Z4_CHILD = 0 Chưa có con
Z8_SATISFACTION = 5 Rất hài lòng về cuộc hôn
nhân của mình
Trang 9Bản ghi cho người thứ hai
Làm tương tự cho đến người thứ 10 ở slide 3.
Trang 11Con người –Tầm nhìn mới
Giao diện Sort
Chọn Sort by: Z2_AGE
Chọn Asending: Sắp xếp theo thứ tự tăng dần
Trang 121 THỐNG KÊ DỮ LiỆU DẠNG BẢNG
Yêu cầu của nội dung: Lập bảng thống kê cho các biến thuộc tính và thuộc lượng
Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ
Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin)
Công cụ trên excel:
Dùng lệnh =FREQUENCY[ (data_array, bins_array) ]
Trang 131 THỐNG KÊ DỮ LiỆU DẠNG BẢNG
Quy trình dùng lệnh FREQUENCY
Đối với biến có ít biểu hiện
B1: Lập cột các biểu hiện (cột BIN): là giá trị các biểu hiện
B2: Chọn vùng dữ liệu bảng thống kê, lập lệnh Frequency
Cú pháp: = FREQUENCY(data_array, bins_array)
Data_array: Dữ liệu cần lập bảng
Bins_array: các biểu hiện
Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím [ctrl+shift+enter]
Trang 141 THỐNG KÊ DỮ LiỆU DẠNG BẢNG
Quy trình dùng lệnh FREQUENCY
Đối với biến có nhiều biểu hiện:
B1: Cần lập các [giới hạn dưới] và [giới hạn trên] của mỗi
Trang 15Biểu đồ tần số-Thủ tục Data Analysis
Dùng thủ tục Data Analysis trong thư viện hàm Add-Ins của Excel
Kiểm tra xem có thủ tục Data Analysis trong
Tools hay chưa?
Tools/ Add-Ins/ Check vào Analysis ToolPak/ OK
Trang 16Biểu đồ tần số-Thủ tục Data Analysis
Tools/ Data Analysis/ Histogram
Trang 17Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data Analysis
Input Range: Quét khối số liệu, nhớ có cả tên biến
Bin Range: Quét biên khối biên trên của biểu đồ tần số, nhớ có cả tên
Labels: Khai báo có dòng đầu tiên là tên biến
Chọn Output range: ô đầu tiên chứa kết quả
Khai báo các kết quả cần nhận: Pareto, Cumulative Percentage, Chart
Trang 18Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data Analysis
Bảng tần số, tần suất tích lũy và phân phối Pareto
Trang 19Con người –Tầm nhìn mới
Biểu đồ tần số-Thủ tục Data Analysis
Histogram
0 1 2 3 4 5 6 7
Trang 21Không hài lòng Bình thường Hài lòng
Rất hài lòng
Trang 222 THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ
ĐỒ THỊ HÌNH THANH
[COLUMN]
ĐỒ THỊ HÌNH THANH [BAR]
Tên thuộc tính dài
Tên thuộc tính ngắn
Trang 23- - -
-chỉ số CPI
Trang 24Bảng tóm tắt-Pivot Table
Data/ Pivot Table
Trang 25Bảng tóm tắt-Pivot Table
Quét khối dữ liệu cần tính toán, kể cả tên biến, sẽ
được xem là tên trường(Field)
Trang 26Bảng tóm tắt-Pivot Table
Nên chọn trang bảng tính mới
Trang 27Bảng tóm tắt-Pivot Table
Kéo và nhả (Drag and Drop) Z8_SATISFACTION vào Row
Trang 29Pivot Table với 2 biến phân loại
Count of
Z8_SATISFACTION Z1_MALE
Grand Total
Trang 30Pivot Table với 2 biến phân loại
Click vào A3, kéo và thả trường Z1_MALE vào Column
Fields
Ưu điểm: lập bảng tần số chéo cho
nhiều biến.
Trang 31Pivot Table với 3 biến phân loại
Kéo và thả Z4_Child vào Page Fields
Trang 32Một số yêu cầu
Dùng công cụ Pivot table:
1. Lập bảng tổng số con của các hộ gia đình có 1,2,…,n con cụ thể.
2 Lập bảng tổng số anh,chị em trong nhà ứng với từng loại gia đình cụ thể.
3 Lập bảng tần số cho biến Marital, vẽ biểu đồ và cho biết loại tình trạng
hôn nhân nào chiếm đa số
4 Lập bảng tần số cho biến marita (column) và biến sex (row) Vẽ biểu đồ
và cho biết giới tính nào ứng với tình trạng hôn nhân nào chiếm đa số Vẽ biểu đồ tương ứng.
5 Lập bảng tần số giữa hai biến marital (column) và wrkstat (row).
6 Lập bảng tần số giữa hai biến marital (column) và wrkstat (row) <chỉ
thống kê cho giới tính nữ> và <chỉ thống kê cho giới tính nam>.
Trang 33Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
Trang 34Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
Tính tổng thỏa điều kiện nâng cao
=sumifs(vùng tính tổng, vùng ĐK1, ĐK1, vùng ĐK2, ĐK2)
Đếm thỏa điều kiện nâng cao
=countifs(vùng ĐK1, ĐK1,vùng ĐK2, ĐK2,…)
Nguyễn Duy Tâm _ IDR
Trang 35Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
1 Tính giá trị trung bình, trung vị,
mode, tứ phân vị, phương sai,
độ lệch chuẩn cho các biến:
Z2_age, Z4_child, Z6_edu Nêu
ý nghĩa của các số trên.
2 Tính tổng số con của những
người có độ tuổi dưới 30 hoặc của những người hài lòng về tình trạng hôn nhân.
3 Đếm những người có 1 con
Trang 36Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả
BÀI TẬP (THUC HANH
gia đình, chưa lập gia đình
BÀI TẬP (THUC HANH EXCEL)
1. Tính tổng số anh/chị/em
của những người lý dị, ly thân
2. Tính tổng số con của
những người là nữ giới
Trang 37Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics
Nhập số liệu và các tùy chọn vào giao diện
Trang 38Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics
Kết quả sau khi đã hiệu chỉnh.
Bài tập: Tính các chỉ tiêu thống kê mô tả bằng công
Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION Z5_RELIGIOUS Z6_EDU Z7_OCCUPATION
Trang 39HỆ SỐ TƯƠNG QUAN
Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến
thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng (interval)
Chú ý: Đối với thang đo định danh (norminal): những chỉ số
tính toán không có ý nghĩa thống kê
Công thức lệnh: tính rxy =correl(data_X, data_Y)
Ý nghĩa:
Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y
-1 < = rxy < 0 : X và Y nghịch biến0< rxy <=1 : X và Y đồng biến
Trang 40Con người –Tầm nhìn mới
Dùng thủ tục Data Analysis để tính ma trận tương quan
Tools/ Data Analysis/ Correlation
Trang 41Dùng thủ tục Data Analysis để tính ma trận
tương quan
Kết quả.
BT thực hành excel: Tính matrận hệ số tương quan
cho các biến agewed sibs childs age educ và nhận xét về mối quan hệ giữa các biến
Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION Z5_RELIGIOUS Z6_EDU Z7_OCCUPATION
Trang 42Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn
Chọn loại đồ thị là Scatter
Trang 43Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn
Trang 44Đồ thị phân tán:Hài lòng phụ thuộc vào học vấn
Các tùy chọn
Trang 45Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn
Trang 46Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Chọn loại đồ thị là Scatter
Trang 47Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Trang 48Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Các tùy chọn
Trang 49Con người –Tầm nhìn mới
Đồ thị phân tán:
Hài lòng phụ thuộc vào học vấn
Trang 50Con người –Tầm nhìn mới
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
Số thứ tự trong tổng thể: Hàm Randbetween
Trang 51Con người –Tầm nhìn mới
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
Trang 52Con người –Tầm nhìn mới
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
MÔ PHỎNG BẰNG THỦ TỤC SAMPLING
Tools/ Data Analysis/ Sampling
Trang 53Con người –Tầm nhìn mới
MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
KẾT QUẢ MÔ PHỎNG BẰNG THỦ TỤC SAMPLING 10 MẪU
LƯU Ý: KẾT QUẢ NHẬN ĐƯỢC LÀ NGẪU NHIÊN
Trang 54MÔ PHỎNG LẤY MẪU LẶP LẠI
CHỌN CỠ MẪU n = 9 TỪ Z2_AGE
TRUNG BÌNH: HÀM AVERAGE
ĐỘ LỆCH CHUẨN: HÀM STDEV
LƯU Ý: THEO LÝ THUYẾT THÌ VÀ
CÓ THỂ ĐẠT ĐƯỢC ĐiỀU NÀY VỚI VÔ SỐ LẦN LẤY MẪU
Trang 55ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG BÌNH (BiẾT )
Trang 56Con người –Tầm nhìn mới
ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO
Chọn a = 0.05 =>P(1-a/2)= 0.975
Tra ta/2 = 1.964
Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29
Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23)
Trang 57ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS
Trang 58Con người –Tầm nhìn mới
ƯỚC LƯỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG
BÌNH (CHƯA BiẾT )_THỦ TỤC DATA ANALYSIS
Cận dưới = Mean – Confidence Level (95%)
Cận trên = Mean + Confidence Level (95%)
Trang 59Bài tập ƣớc lƣợng
BÀI TẬP AFFAIR
1. Ước lượng độ tuổi bình
quân (age) của những
người được khảo sát
BÀI TẬP “THUC HANH EXCEL
1. Ước lượng độ tuổi bình
quân (age) của những người được khảo sát
2. Ước lượng độ tuổi bình
quân kết hôn (agewed)
3. Ước lượng trình độ học
vấn (educ) bình quân của những người được khảo sát
Trang 60Con người –Tầm nhìn mới
Kiểm định 1 đuôi (Biết s)
Ho: Số năm học trung bình của người Mỹ tối đa là 15 năm
Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average…
Trang 61Con người –Tầm nhìn mới
Kiểm định 1 đuôi (Biết s)
Ho: Số năm học trung bình của người Mỹ tối đa là 15 năm
Giá trị Z = 11.44 nằm ở miền bác bỏ
=>Có bằng chứng thống kê cho thấy số năm học trung bình của
Trang 62Con người –Tầm nhìn mới
Kiểm định 1 đuôi (Không biết s)
Ho: Số năm học trung bình của người Mỹ tối đa là 16 năm
Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra
ứng với 2a
Trang 63Con người –Tầm nhìn mới
Kiểm định 1 đuôi (Không biết s)
Ho: Số năm học trung bình của người Mỹ tối đa là 16 năm
Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho Vậy số năm học trung bình của người Mỹ cao hơn 16
Trang 64Con người –Tầm nhìn mới
Kiểm định 2 đuôi (Biết s)
Ho: Số năm học trung bình của người Mỹ là 16 năm
Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải nhập tham số là (1-a/2)
Trang 65Con người –Tầm nhìn mới
Kiểm định 2 đuôi (Biết s)
Ho: Số năm học trung bình của người Mỹ là 16 năm
Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải nhập tham số là (1-a/2)
Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể
Trang 66Con người –Tầm nhìn mới
Kiểm định 2 đuôi (Chưa biết s)
Ho: Số năm học trung bình của người Mỹ là 16 năm
Hàm TINV(a, n-1)
Trang 67Kiểm định 2 đuôi (Chưa biết s)
Ho: Số năm học trung bình của người Mỹ là 16 năm
Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể
Trang 68Bài tập kiểm định
BÀI TẬP AFFAIR
1 Có giả thiết cho rằng,
độ tuổi (age) bình quân
của những người được
khảo sát là dưới 30
Bạn hãy kiểm định giả
thiết này với mức ý
nghĩa α=5%.
2 Có giả thiết cho rằng,
độ tuổi (age) bình quân
của những người được
khảo sát là 33 Theo
bạn, giả thiết này đúng
hay sai? (α=10%)
BTẬP THỰC HÀNH EXCEL
1 Có giả thiết cho rằng, độ tuổi (age) bình
quân của những người được khảo sát là dưới 40 Bạn hãy kiểm định giả thiết nàyα=5%.
2 Có giả thiết cho rằng, độ tuổi (age) bình
quân của những người được khảo sát là
46 Theo bạn, đúng hay sai α=3%?
3 Có giả thiết cho rằng, độ tuổi (agewed)
bình quân của những người được khảo sát là dưới 40 Bạn hãy kiểm định giả thiết này α=4%.
Trang 69Con người –Tầm nhìn mới
Ho: Số năm học trung bình của người Mỹ là 16 năm
ZTEST(Array, x, sigma) với Array: Số liệu cần kiểm định
x: Giá trị của phát biểu Ho, Sigma: Nhập nếu biết hoặc để trống
Trang 70Kiểm định 2 đuôi (Biết và Chưa biết )-Giá trị p
Ho: Số năm học trung bình của người Mỹ là 16 năm
P_Value = 2*Min(ZTEST, 1-ZTEST)
P_Value = 0.09> a = 0.05 => Không thể bác bỏ Ho
Trang 71Kiểm định sự khác biệt về trung bình của hai tổng
thể-Biết độ lệch chuẩn Affair.xls trang Edu
Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Kết quả khảo sát cho thấy học vấn trung bình của
nam nhỉnh hơn của nữ nhưng độ lệch chuẩn cao hơn.
Kiểm định Ho bằng thủ tục
Tools | Data Analysis | z-test: Two Sample for Means
OBS MALE EDU(FEMALE) OBS MALE EDU(MALE) EDU(FEMALE) EDU(MALE)
Trang 72Con người –Tầm nhìn mới
Kiểm định sự khác biệt về trung bình của hai tổng thể-Biết độ lệch chuẩn
Tools | Data Analysis | z-test: Two Sample for Means
Trang 73Con người –Tầm nhìn mới
Kiểm định sự khác biệt về trung bình của hai tổng thể-Biết độ lệch chuẩn
Trang 74Con người –Tầm nhìn mới
Kiểm định sự khác biệt về trung bình của hai tổng thể-Chƣa biết độ lệch chuẩn
Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
Trang 75Con người –Tầm nhìn mới
Kiểm định sự khác biệt về trung bình của hai tổng thể-Chƣa biết độ lệch chuẩn
Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
Trang 76Bài tập kiểm định mức lương trung bình theo giới tính
1. Có ý kiến cho rằng mức lương trung bình theo giới tính giữa
nam và nữ là như nhau Với số liệu của bài tập Tien luong
khoi diem theo gioi tinh nam - nu.xls, bạn hãy kiểm định giả thiết trên
2. Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện
tại không có hiệu quả Bằng dữ liệu bài tập hieu qua
software.xls, bạn hãy kiểm định hiệu quả của phần mềm mới
và cũ
Trang 77Con người –Tầm nhìn mới
Kiểm định F cho sự khác biệt về phương sai của hai tổng thể
Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Tools | Data Analysis | F-Test: Two-Sample for Variances
Trang 78Con người –Tầm nhìn mới
Kiểm định F cho sự khác biệt về phương sai của hai tổng thể
Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Kết quả: Bác bỏ Ho
Trang 79Kiểm định mẫu cặp: Vợ và chồng có cảm nhận khác biệt
về hạnh phúc không? Affair.xls/ Satisfaction
Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau
Trang 80Con người –Tầm nhìn mới
Kiểm định mẫu cặp: Vợ và chồng có cảm nhận
khác biệt về hạnh phúc không?
Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau
Kết quả: Chấp nhận Ho
Trang 81Bài tập kiểm định cặp
Có giả định cho rằng, hiệu quả của một phương pháp quảng
cáo được tiến hành cho nhiều công ty khác nhau hiện tại
không có hiệu quả Bằng số liệu của bài tập truoc - sau quang cao ve doanh thu.xls, anh chị hãy kiểm định giả thiết trên
Trang 82Con người –Tầm nhìn mới
HÀM TTEST-Kiểm định sự khác biệt
fx/ Statistical/ TTEST
Type: 1 cho mẫu cặp, 2 cho phương sai bằng nhau, 3 cho
phương sai khác nhau
Trang 83Con người –Tầm nhìn mới
ANOVA: Vợ và chồng có có mức độ hài lòng về hôn nhân trung bình khác nhau không?
Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau
Trang 84ANOVA: Nam và nữ có có mức độ hài
lòng về hôn nhân khác nhau không?
Ho: Hai giới thỏa mãn về hôn nhân trung bình như nhau
Trang 85Con người –Tầm nhìn mới
ANOVA một nhân tố-Ví dụ chương 8 Worksheet in
Chapter8(V)
So sánh năng suất của 3 máy
Ho: Năng suất của 3 máy là như nhau
Trang 86Con người –Tầm nhìn mới
ANOVA một nhân tố-Ví dụ chương 8
Ho: Năng suất của 3 máy là như nhau
Trang 87Thủ tục Tukey-Kramer
Tools/ Lumenaut Statistics/ Tukey-Kramer Test
Lumenaut là một phần mềm Add-Ins miễn phí, chạy trên nền Excel
Trang 88Thủ tục Tukey-Kramer
Tools/ Lumenaut Statistics/ Tukey-Kramer Test
Trang 89Con người –Tầm nhìn mới
Thủ tục Tukey-Kramer
Tukey-Kramer Test
Critical Value Q MS within
MSD Values Stack Machine 1 Machine 2 Machine 3
Trang 90Con người –Tầm nhìn mới
Tìm hệ số chặn và độ dốc
Hệ số chặn: fx/ Statistical/ INTERCEPT
Độ dốc: fx/ Statistical/ SLOPE
Trang 91Con người –Tầm nhìn mới
Tìm hệ số chặn và độ dốc
Hệ số chặn: fx/ Statistical/ INTERCEPT
Độ dốc: fx/ Statistical/ SLOPE