Ví dụ 2: Nhập dữ liệu điều tra về bậc thợ, tuổi nghề năm, lương bình quân tháng nghìn đ của mẫu 30 công nhân... 9 1.5.4-Dùng chức năng CHART WIZARD để vẽ biểu đồ thống kê: Các dạng biể
Trang 1TÀI LIỆU LƯU HÀNH NỘI BỘ
Người viết: Võ Hải Thuỷ
1.NHẬP DỮ LIỆU, SẮP XẾP VÀ TRÌNH BÀY DỮ LIỆU :
1.1 Nhập dữ liệu vào bảng tính Excel:
1.1.1-Cấu trúc của một bảng tính Excel:
Khởi động Microsoft Excel, sẽ mở ra một cửa sổ, đó là tập bảng tính có tên mặc định là Book1 (viết tắt của WorkBook), trong đó có 3 bảng tính mặc định là Sheet 1, Sheet 2, Sheet 3 (viết tắt của
WorkSheet) như hình 1 Một tập bảng tính có tối đa 255 bảng tính
Nếu muốn mở thêm các bảng tính, ngoài 3 bảng mặc định, bạn dùng lệnh: Insert > Worksheet Mỗi bảng tính (worksheet) gồm có :
*Cột (column) : có tối đa 256 cột, được đánh thứ tự từ A,B,…,Z,AA, AB,…,AZ, …, IA,IB,…,IV
*Hàng (row) : có tối đa 65536 hàng, được đánh thứ tự từ 1,2,…,65536
*Ô (cell) : gồm 256X65536 ô, được đánh dấu dựa vào <địa chỉ cột của ô > <địa chỉ hàng của ô >
*Khối ô / Vùng (range): là tập hợp các ô gần nhau tạo thành hình chữ nhật Địa chỉ khối ô được đánh dấu dựa vào <địa chỉ ô đầu tiên bên trái><địa chỉ ô cuối cùng bên phải>, ở giữa là dấu “: ”
1.1.2-Nhập dữ liệu vào bảng tính Excel:
Ví dụ 1: Nhập dữ liệu điều tra về năng
suất lao động và giới tính của mẫu 24
công nhân
Ví dụ 2: Nhập dữ liệu điều tra về bậc thợ, tuổi nghề (năm),
lương bình quân tháng (nghìn đ) của mẫu 30 công nhân
Trang 2Sample > nhập địa chỉ ô đầu tiên Output Range > OK
Ví dụ: Cho dữ liệu về giới tính và điểm thi của tổng thể chung 30 sinh viên
Yêu cầu: Dùng Excel để chọn 1 mẫu ngẫu nhiên có cỡ mẫu là 10 từ tổng thể?
Trang 33
1.3 Lọc dữ liệu:
1.3.1-Lọc dữ liệu với 1 điều kiện
Yêu cầu 1: Với dữ liệu ví dụ 1, hãy lọc danh sách công nhân có giới tính “nữ” ?
Thao tác: Chọn khối dữ liệu > Data > Filter > Auto Filter > chọn mũi tên ▼tương ứng với điều
kiện >danh sách dữ liệu được lọc sẽ hiện ra
1.3.2-Lọc dữ liệu với 2 điều kiện :
Yêu cầu 2: Hãy lọc danh sách công nhân thỏa mãn 2 điều kiện: giới tính “nữ” và “năng suất<190” ?
Thao tác: Xây dựng vùng điều kiện (tại 1 ô bất kỳ trên bảng tính hiện hành), có dạng:
Chọn khối dữ liệu > Data > Filter > Advanced Filter > Filter
the list, in-place > nhập địa chỉ khối dữ liệu vào List range > nhập
địa chỉ vùng điều kiện vào Criteria Range > OK
Yêu cầu 3: Hãy lọc danh sách công nhân thỏa mãn 2 điều kiện: giới tính “nam” và “năng suất
“>=190 và <220” ?
Thao tác: Xây dựng vùng điều kiện như sau:
Các lệnh tiếp theo giống như trên
Chú ý: Nếu điều kiện “và” thì viết cùng dòng,
“hoặc” thì viết xuống dòng
Trang 44
1.5.Trình bày dữ liệu dưới dạng bảng thống kê và biểu đồ thống kê:
1.5.1-Dùng hàm để lập bảng tần số :
Đối với dữ liệu định tính: Ta dùng hàm COUNTIF
Yêu cầu: Từ dữ liệu của ví dụ 1 hãy lập bảng tính tần số và tần suất về giới tính công nhân ?
Trang 5Ta thao tác để nhập công thức hàm như sau:
-Chọn các ô dùng để biểu thị tần số, địa chỉ của khối ô là E2:E5 -Gõ vào công thức =FREQUENCY(B2:B25,{189,219,249,280}) -Ấn tổ hợp phím: CTRL+SHIFT+ENTER Khi đó tần số sẽ xuất hiện trong từng ô
1.5.2.Dùng chức năng HISTOGRAM để lập bảng tần số và vẽ biểu đồ phân phối:
Thao tác: Bước 1: Cài đặt chức năng Data Analysis của Excel: Tools > Add-Ins > Chọn Analysis
Toolpak và Analysis Toolpak VBA > OK
Bước 2: Lập vùng Bin để ghi giới hạn dưới của mỗi tổ Nếu lượng biến rời rạc thì ghi giới hạn dưới;
nếu lượng biến liên tục thì ghi số nhỏ hơn giới hạn dưới 1 đơn vị
Bước 3: Tools > Data Analysis > Histogram > OK > Kê khai vào hộp thoại : Vào Input Range
để nhập địa chỉ vùng dữ liệu (Chỉ chọn phần số> Bin Range để nhập địa chỉ > Output Range để nhập
địa chỉ 1 ô bất kỳ > Cumulative percentage (tần suất tích luỹ) > chọn Chart Output (vẽ biểu đồ) > OK
Ví dụ: Yêu cầu: Từ dữ liệu của ví dụ 1 hãy lập bảng tần số về năng suất lao động của công nhân ?
Phân tổ công nhân theo năng suất lao động thành 4 tổ: 160-190, 190-220, 220-250, 250-280
Trang 66
▼ Hiệu chỉnh biểu đồ phân phối :
-Làm cho các khoảng cách tổ sát nhau: Đặt dấu nhắc lên trên 1 cột bất kỳ > Format Data Series > Option > nhập giá trị 0 vào Gap Width > OK
-Thay tiếng Anh bằng tiếng Việt : Nhấp trái chuột vào tên cần hiệu chỉnh > dấu nhắc > xoá tiếng
Anh, gõ tiếng Việt
1.5.3-Dùng chức năng PIVOT TABLE để lập bảng tần số và vẽ biểu đồ phân phối :
1.5.3.1 Lập bảng tần số giản đơn:
Yêu cầu : Từ dữ liệu của ví dụ 1,lập bảng phân tổ công nhân theo giới tính ?
Thao tác: Chọn khối dữ liệu > Data > Pivot Table and Pivot Chart Report > Step 1 > Next >
Step 2 > Next > Step 3 > Existing Worksheet > chọn 1 ô bất kỳ để đặt bảng > Layout > nhấp “giới
tính” đưa vào ô Row > chọn tên hàm Count cho vào ô Data > OK > Step 3 > Finish
Trang 77
1.5.3.2 Lập bảng tần số kết hợp 2 tiêu thức:
Yêu cầu : Từ dữ liệu của ví dụ 1 hãy lập bảng tần số kết hợp 2 tiêu thức: năng suất và giới tính,
trong đó giới tính đặt ở cột, năng suất đặt ở hàng ? Trong đó, năng suất lao động được phân thành 4 tổ:
=IF(B2<190,“160-190”,IF(B2<220,“190-220”,IF(B2<250,“220-250”,“250-280”))) Sau đó copy cú
pháp này cho tất cả các ô còn lại
Bước 2: Chọn khối dữ liệu > Data > Pivot Table and
Pivot Chart Report > Step 1 > Next > Step 2 > Next > Step 3 > Existing Worksheet > chọn 1 ô bất kỳ
để đặt bảng > Layout > nhấp “năng suất” đưa vào ô Row > nhấp “giới tính” đưa vào ô Column > chọn tên hàm Count cho vào ô Data > OK > Step 3 > Finish
Bước 3: Nếu muốn vẽ đồ thị thì nhấp vào biểu tượng đồ thị trên Pivot Chart
Bước 4: Nếu muốn thiết kế lại bảng thì vào Data > Pivot Table and Pivot Chart Report > Step 3
> Layout để lập lại bảng theo yêu cầu mới
Trang 88
1.5.3.3 Lập bảng tần số kết hợp 3 tiêu thức:
Yêu cầu : Từ dữ liệu của ví dụ 2, lập bảng tần số kết hợp 3 tiêu thức: bậc thợ, tuổi nghề, lương
tháng, trong đó lương tháng và bậc thợ đặt ở hàng, tuổi nghề đặt ở cột ? Trong đó, lương tháng (nghìn đ)
được phân thành 4 tổ: dưới 1000, 1000-3000, 3000-5000, 5000 trở lên; tuổi nghề (năm) được phân thành 4 tổ: 1 đến 3, 4 đến 6, 7 đến 9, 10 đến 12
Thao tác: Trình tự giống như 3.3.2, chỉ khác phần thiết kế bảng Layout
Trang 99
1.5.4-Dùng chức năng CHART WIZARD để vẽ biểu đồ thống kê:
Các dạng biểu đồ trong Excel được chia thành 2 nhóm:
* Standard Type (dạng chuẩn): bao gồm:
Column (dạng cột), Bar (dạng thanh), Line(dạng đường), Pie (dạng tròn, dạng bánh), Scatter (dạng
phân tán), Area (dạng vùng, dạng diện tích), Doughnut (dạng vành khăn), Radar (dạng mạng nhện),
Surface (dạng bề mặt), Bubble (dạng bong bóng), Stock (dạng cổ phần), Cylinder (dạng hình trụ), Cone
(dạng hình nón), Pyramid (dạng hình tháp)
* Custom Type (dạng hiệu ứng đặc biệt): bao gồm:
Area Blocks (dạng các khối vùng), B&W Area (dạng vùng đen và trắng), B&W Column (dạng cột
đen và trắng), B&W Line – Timescale (dạng đường đen và trắng – nhân tỷ lệ), B&W Pie – (dạng bánh
đen và trắng), Blue Pie (dạng bánh màu xanh), Colored Lines (dạng các đường có màu), Colume-Area
(dạng cột – vùng), Columns with Depth (các cột có độ sâu), Cones (dạng chóp nón), Floating Bars (dạng
các thanh trôi nổi), Line – Column (dạng đường – cột), Line – Column on 2 Axes (dạng đường – cột trên
2 trục), Lines on 2 Axes (dạng đường trên 2 trục), Logarithmic (dạng trục logarit), Outdoor Bars ( dạng
các thanh được tô bên ngoài), Pie Explosion (dạng hình bánh cắt phần), Smooth Lines (dạng các đường
trơn), Stack of Colors (dạng xếp chồng màu), Tubes (dạng ống)
Thao tác chung: Chọn vùng dữ liệu muốn vẽ biểu đồ > Chart Wizard > Chart Type > Step 1 >
Chọn dạng đồ thị > Next > Step 2 > Chọn cách trình bày đồ thị > Next > Step 3 > Thực hiện các thao tác
để hoàn chỉnh đồ thị
Trang 1010
Một số dạng biểu đồ thường dùng để trình bày dữ liệu thống kê:
1.5.4.1-Dạng biểu đồ hình cột:
Trang 11
11
1.5.4.2-Dạng biểu đồ hình tròn:
Trang 1212
1.5.4.3-Dạng biểu đồ đường gấp khúc:
Trang 1313
1.5.4.4-Dạng biểu đồ kết hợp hình cột và đường gấp khúc:
Trang 1414
2-PHÂN TÍCH DỮ LIỆU THỐNG KÊ :
2.1.Tính các tham số phản ánh đặc trưng của mẫu bằng chức năng Descriptive Statistics :
Chỉ áp dụng đối với trường hợp dữ liệu không phân tổ
*Thao tác :
Nhập dữ liệu vào bảng > Tools > Data Analysis > Descriptive Statistics > OK Kê khai trong hộp
thoại: Input Range : nhập địa chỉ khối dữ liệu > Output Range : nhập địa chỉ 1 ô bất kỳ để đặt bảng kết quả > Chọn Summary Statistics (tất cả tham số thống kê) > 0K
Đọc bảng kết quả:
Mean (số trung bình), Standard Error (sai số chuẩn – độ lệch chuẩn của trung bình mẫu), Median
(số trung vị), Mode (số yếu vị), Standard Deviation (độ lệch tiêu chuẩn), Sample Variance (phương sai mẫu hiệu chỉnh), Range (khoảng biến thiên), Minimum (lượng biến nhỏ nhất), Maximum (lượng biến lớn nhất), Sum (tổng các lượng biến), Count (số đơn vị của mẫu)
Kurtosis (độ nhọn của phân phối): Nếu phân phối tập trung ở mức bình thường thì Kurtosis=3; nếu
phân phối nhọn hơn mức bình thường với 2 đuôi ngắn thì Kurtosis >3; nếu phân phối bẹt hơn mức bình thường với 2 đuôi dài thì Kurtosis<3
Skewness (độ lệch của phân phối): Nếu phân phối đối xứng thì Skewness = 0; nếu phân phối lệch
phải thì Skewness > 0, nếu phân phối lệch trái thì Skewness < 0
Ví dụ: Phân tích dữ liệu ví dụ 2 bằng các tham số trên mẫu ?
Trang 1515
2.2.Tính các tham số phản ánh đặc trưng của mẫu bằng chức năng Function:
Chỉ áp dụng đối với trường hợp dữ liệu không phân tổ
*Thao tác : Nhập dữ liệu vào bảng tính theo 1 cột dọc > Data > Sort để sắp xếp dữ liệu theo thứ tự
tăng dần > nhập công thức hàm thích hợp để tính từng tham số
Ví dụ: Phân tích dữ liệu về lương tháng ở ví dụ 2 bằng các tham số trên mẫu
1 STT Lương tháng Số trung bình =AVERAGE(B2:B31)
Trang 162.3.Tính các tham số phản ánh đặc trưng của mẫu bằng công thức :
Có thể áp dụng đối với trường hợp dữ liệu không phân tổ và dữ liệu có phân tổ:
Ví dụ: Phân tích dữ liệu lương tháng (nghìn đ/người) của mẫu 50 công nhân bằng các tham số trên
Chú ý: Chỉ nhập công thức vào ô F2 hay ô G2, ở các ô tiếp theo chỉ cần copy công thức
3- QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA BIẾN NGẪU NHIÊN
3.1 Quy luật phân phối nhị thức
Quy luật phân phối nhị thức được áp dụng khi biến ngẫu nhiên rời rạc là số lần thành công (hay thất bại) trong n phép thử độc lập Trong mỗi phép thử, xác suất thành công là p
Ký hiệu biến X có phân phối nhị thức là : X~B(n;p)
Xác suất để biến X nhận giá trị x với x = 0,1,2,…,n được tính trên bảng tính Excel theo cú pháp hàm
như sau: =BINOMDIST(x,n,p,false/true)
Ví dụ: Một nhân viên tiếp thị đi chào hàng với 4 khách hàng Theo kinh nghiệm, xác suất mua hàng
của mỗi khách hàng là 40% Gọi biến ngẫu nhiên X là số khách mua hàng trong 4 lần chào hàng X có
Trang 1717
Quy luật phân phối Poisson được áp dụng khi biến ngẫu nhiên rời rạc là “số lần xảy ra một biến
cố nào đó trong một khoảng thời gian hoặc một khoảng không gian xác định”
Ký hiệu biến ngẫu nhiên X có phân phối Poisson là : X ~P()
Xác suất để biến X nhận giá trị x với x = 0,1,2,…,n,… được tính trên bảng tính Excel theo cú pháp
hàm như sau: =POISSON(x,,false/true)
Ví dụ: Tại một cửa hàng bán điện thoại vào ngày chủ nhật, trung bình mỗi giờ có 12 khách hàng
bước vào cửa hàng Yêu cầu: Tính trên bảng tính Excel xác suất để trong vòng 30 phút vào ngày chủ nhật
có số khách hàng bước vào cửa hàng là: a-0,1,2,3,4,5 người ? b-nhiều nhất là 5 người ?
3.3.Quy luật phân phối chuẩn:
Ký hiệu của biến ngẫu nhiên liên tục X có phân phối chuẩn là : X ~ N(,2)
Giả sử ta đã biết x, để tính P(X≤x), dùng cú pháp hàm : =NORMDIST(x,, ,true)
Giả sử ta đã biết P(X≤x), để tìm giá trị x, ta dùng cú pháp hàm: =NORMINV(P(X≤x),, )
Ví dụ : Tiền lương của 1 công nhân tại 1 nhà máy có phân phối chuẩn với trung bình 2500 nghìn đ
và độ lệch chuẩn là 1200 nghìn đ Gọi biến ngẫu nhiên X là tiền lương của 1 công nhân
3.4.Quy luật phân phối chuẩn chuẩn hoá:
Ký hiệu của biến ngẫu nhiên liên tục Z có phân phối chuẩn chuẩn hóa là : Z ~ N(0,1)
Giả sử ta đã biết z, để tính P(Z≤z), dùng cú pháp hàm : =NORMSDIST(z)
Giả sử ta đã biết P(Z≤z), để tìm giá trị z, ta dùng cú pháp hàm: =NORMSINV(P(Z<z))
Ví dụ :
Trang 184.ƯỚC LƯỢNG THỐNG KÊ
4.1 Ước lượng khoảng tin cậy cho trung bình tổng thể:
Công thức khoảng tin cậy cho trung bình tổng thể :
s z
x n
s t
2 / ,
Nhập dữ liệu mẫu vào bảng tính > Tools > Data Analysis > Descriptive Statistics > OK > Bảng
phân tích các tham số trên mẫu > Lập bảng tính khoảng tin cậy cho trung bình tổng thể
Ví dụ: Cho dữ liệu về lương tháng của mẫu 30 công nhân được chọn ngẫu nhiên từ một nhà máy
Yêu cầu: Với độ tin cậy 95% hãy ước lượng lương tháng trung bình của 1 công nhân nhà máy (Dùng
bảng tính Excel để thực hiện các tính toán) ?
Skewness Range Minimum Maximum Sum Count
19 2200 Độ lệch chuẩn mẫu Standard Deviation 1275,853
26 3000 ƯỚC LƯỢNG KHOẢNG
Trang 19Ví dụ: Cho dữ liệu về lương tháng của 1 mẫu 20 giáo viên có thâm niên dưới 5 năm của các trường
mầm non tư thục trên địa bàn thành phố X Yêu cầu: Với độ tin cậy 95% hãy ước lượng lương tháng
trung bình của 1 giáo viên (Dùng bảng tính Excel để thực hiện các tính toán) ?
Skewness Range Minimum Maximum Sum Count
Nhận xét: Với độ tin cậy 95% ta có thể ước lượng lương tháng trung bình của 1 giáo viên có thâm niên dưới 5 năm của các trường mầm non tư thục trên địa bàn thành phố X nằm trong khoảng từ 1419.968 nghìn đ đến 1880.032 nghìn đ
4.2 Ước lượng khoảng tin cậy cho tỷ lệ tổng thể:
Công thức khoảng tin cậy cho tỷ lệ tổng thể :
n
p p z p p n
p p z
ˆ)
ˆ1(ˆ
ˆ /2 /2
p : tỷ lệ các đơn vị có tính chất A trong tổng thể (tỷ lệ tổng thể)
pˆ : tỷ lệ các đơn vị có tính chất A trong mẫu (tỷ lệ mẫu)
Ví dụ: Cho dữ liệu về lương tháng (triệu đ/người) của mẫu 80 công nhân được chọn ngẫu nhiên từ
2 đến dưới 4
4 đến dưới 6
2 đến dưới 4
dưới 2 dưới 2 4 đến
dưới 6
4 đến dưới 6
Trang 2020
dưới 2 2 đến
dưới 4
2 đến dưới 4
2 đến dưới 4
2 đến dưới 4
dưới 2 dưới 2 dưới 2 2 đến
dưới 4
4 đến dưới 6
2 đến dưới 4
2 đến dưới 4 dưới 2 dưới 2 dưới 2 dưới 2 2 đến
dưới 4
4 đến dưới 6
dưới 2 dưới 2 dưới 2 2 đến
dưới 4 dưới 2 2 đến
dưới 4 dưới 2 dưới 2 dưới 2 2 đến dưới 4 dưới 2 2 đến dưới 4 dưới 2 2 đến dưới 4
dưới 2 dưới 2 dưới 2 dưới 2 dưới 2 dưới 2 2 đến
dưới 4
từ 6 trở lên
4 đến dưới 6
Yêu cầu: Với độ tin cậy 95% hãy ước lượng tỷ lệ công nhân có lương tháng dưới 2 triệu đ tại nhà
máy (Dùng bảng tính Excel để thực hiện các tính toán) ?
10 9 2 đến dưới 4
15 14 2 đến dưới 4
(Chú ý: Trên bảng tính này chỉ để minh họa, chưa thể hiện đủ lương 80 công nhân)
Nhận xét: Với độ tin cậy 95% hãy ước lượng tỷ lệ công nhân có lương tháng dưới 2 triệu đ tại nhà máy nằm trong khoảng từ 36,56% đến 58,44%
5 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
5.1 Kiểm định giả thuyết về trung bình tổng thể:
Các dạng giả thuyết:
Kiểm định 2 bên Kiểm định bên trái Kiểm định bên phải
0 1
0 0
0 0
0 0
:
::
0 1
0 0
0 0
:
::
5.1.1-Phương pháp kiểm định bằng mức ý nghĩa :
Đối với mẫu lớn (n≥30): Giá trị cần kiểm định:
n
x z
x z
Kiểm định bên trái: Khi z < - z thì bác bỏ H0, kiểm định bên phải: Khi z > z thì bác bỏ H 0
Đối với mẫu nhỏ (n < 30): Giá trị cần kiểm định:
n s
x t