Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 12 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
12
Dung lượng
107 KB
File đính kèm
CHUONG4.rar
(19 KB)
Nội dung
CHƯƠNG 4: MƠ TẢ DỮ LIỆU BẰNG SỐ TRUNG BÌNH TRUNG BÌNH ĐỐI VỚI DỮ LIỆU ĐỊNH LƯỢNG 4.1 YẾU VỊ 4.2 TRUNG VỊ 4.3 TRUNG BÌNH 4.4 CHỌN SỐ TRUNG BÌNH NÀO? 4.5 DẠNG ĐẶC BIỆT CỦA TRUNG BÌNH 4.6 SỐ TRUNG BÌNH ĐỐI VỚI BIẾN ĐỊNH TÍNH 4.7 CÁCH SỬ DỤNG THUẬT NGỮ “SỐ TRUNG BÌNH” Tóm tắt/thuật ngữ quan trọng/bài tập ôn Tổng quan Bảng đồ thị bước đầu quan trọng mô tả liệu Các số toán học chẳng hạn số trung bình cung cấp nhiều thơng tin giá trị Lấy ví dụ, nhà đầu tư chứng khống phớt lờ dao động lên xuống cổ phiếu cần theo sát tốc độ tăng trưởng chứng khoáng nhận thấy gia tăng đáng kể so với loại đầu tư khác Chương tập trung giới thiệu số đo mật độ tập trung hay gọi số trung bình Tất số trung bình có áp dụng khác trung bình số đo quan trọng thống kê mơ tả thống kê phân tích Chương đề cập phần đến thống kê phân tích qua việc phân biệt trung bình mẫu trung bình dân số Chúng ta bỏ thói quen xấu chẳng hạn hút thuốc nghe trung bình người nghiện hút thuốc có tuổi thọ thấp người khơng hút thuốc Chúng ta mua loại xe nghe rằng, trung bình loại xe chạy tốn xăng Chúng ta tâm tốt nghiệp đại học nghe trung bình cử nhân đại học có thời gian kiếm tiền cao dân số chung Hay phút “yếu lòng”, định thay đổi màu tóc nghe trung bình người thay đổi màu tóc thường vui vẻ Từ “trung bình” xuất thường ngày sống chúng công cụ quan trọng thống kê Một số trung bình tốt phải thể điểm yếu hay điểm cốt lõi liệu mô tả Đối với liệu, có nhiều số trung bình, chúng gọi số đo mật độ tập trung Chương giới thiệu cách tính diễn giải số đo mật độ tập trung sử dụng phổ biến SỐ TRUNG BÌNH ĐỐI VỚI DỮ LIỆU ĐỊNH LƯỢNG 4.1 YẾU VỊ Yếu vị phản ánh giá trị quan sát xuất nhiều Bảng 4.1 trình bày số năm vị 20 tổng thống Mỹ thời gian gần đây, bắt đầu B.Harrison (bốn năm) kết thúc B.Clinton (tám năm) Bốn năm yếu vị có đến tổng thống có thời gian vị năm Cần lưu ý, yếu vị giá trị quan sát xuất nhiều khơng phải tần suất quan sát Bảng 4.1 Số năm vị 20 tổng thống Mỹ gần (B.Harrison) 4 8 12 8 8 (B.Clinton) Nguồn: niên giám thời báo New York Yếu vị xác định dễ dàng Nếu liệu xếp theo thứ tự, cần tìm giá trị xuất nhiều Nếu liệu chưa xếp, phải đếm giá trị xem giá trị xuất nhiều Đa yếu vị Nhiều phân phối có nhiều yếu vị khơng có yếu vị Phân phối có hai đỉnh, có độ cao khác nhau, gọi nhị yếu vị Phân phối có hai đỉnh gọi đa yếu vị Sự tồn nhiều yếu vị phân phối, đặc biệt số liệu lớn, cho thấy khác biệt quan trọng nhóm liệu Lấy ví dụ, phân phối trọng lượng nam nữ sinh viên lớp thống kê phân phối nhị yếu vị, phản ánh kết hợp hai phân phối trọng lượng khác biệt-một sinh viên nam sinh viên nữ Cần lưu ý phân phối bảng 4.1 phân phối nhị yếu vị đỉnh 04 năm đỉnh phụ 08 năm Bài tập 4.1 Xác định yếu vị phân phối liệu tuổi nghỉ hưu đây: 60, 63, 45, 63, 65, 70, 55, 63, 60, 65, 63 Bài tập 4.2 Một chủ xe tiến hành loạt thử nghiệm mức độ hao tốn xăng thu kết sau (đơn vị tính dặm/gallon xăng): 20.3, 22.7, 21.4, 20.6, 21.4, 20.9, Xác định yếu vị liệu Đáp án trang 4.2 TRUNG VỊ Trung vị phản ánh giá trị tập hợp quan sát xếp thứ tự từ thấp đến cao hay ngược lại Trung vị chia tập hợp quan sát xếp theo thứ tự thành hai phần nhau, phần phần Hay nói cách khác, trung vị thứ hạng phần trăm thứ 50, quan sát có giá trị nhỏ trung vị chiếm 50% tổng số quan sát Xác định trung vị Bảng 4.2 trình bày cách xác định trung vị với hai tập hợp quan sát khác biệt Các số tơ đậm bảng số bước cần thực để xác định trung vị Nên đọc bảng 4.2 trước đọc tiếp Bảng 4.2 Cách xác định trung vị A Hướng dẫn Xếp quan sát từ thấp đến cao Tìm vị trí cách lấy tổng quan sát cộng chia Nếu vị trí số tròn, cột bên trái phần B, sử dụng số để đếm tập Hợp quan sát Giá trị trung vị với giá trị quan sát vị trí Nếu vị trí số thập phân, cột bên phải phần B, sử dụng hai số tròn Nằm kế để đếm tập hợp quan sát Giá trị trung vị tính cách lấy tổng giá trị quan sát hai vị trí kề chia cho B Ví dụ Tập hợp quan sát Tập hợp quan sát 2,8,2,7,6 3,8,9,3,1,8 2,2,6,7,8 1, 3, 3, 8, 8, (5+1)/2=3 (6+1)/2 = 3.5 2, 2, 6, 7, 1, 2, trung vị = 1, 3,3, 8, 8, 1, 2,3, trung vị = (3+8)/2 = 5.5 Để xác định trung vị, quan sát phải xếp theo thứ tự từ nhỏ đến lớn hay ngược lại Điều dễ tập hợp liệu nhỏ khó khăn liệu lớn, đặc biệt phải xử lý số liệu chưa xếp Khi tổng số quan sát số lẻ, cột trái phần B bảng 4.2, có quan sát vị trí giữa; trung vị giá trị quan sát Khi tổng số quan sát số chẵn, trung vị cộng giá trị hai quan sát vị trí hai trường hợp trên, giá trị trung vị với giá trị quan sát giữa, khơng vị trí quan sát tập hợp liệu Bảng 4.3 Số năm vị 20 tổng thống mỹ gần Số Độ lệch so Tổng độ năm với trung lệch vị bình 12 6.40 2.40 2.40 2.40 2.40 21.6 2.40 2.40 0.40 0.40 (trung bình = 5.6) -0.60 -1.60 -1.60 -1.60 -1.60 -1.60 -21.6 -1.60 -1.60 -2.60 -3.60 -3.60 Trong bảng 4.3, trung vị xác định dễ dàng Đầu tiên thời gian vị xếp theo thứ tự từ cao (F.Roosevelt) thấp (Harding Kenedy) cột thứ Dựa theo bảng hướng dẫn 4.2, ta tính trung vị 4.5 4.5 trung bình cộng hai giá trị (vị trí thứ 10 thứ 11) Bài tập 4.3 tìm trung vị phân phối tuổi hưu sau đây: 60, 63, 45, 63, 65, 70, 55, 63, 60, 65, 63 Bài tập 4.4 tìm trung vị cho thử nghiệm mức độ tiêu hao xăng xe đây: 30.2, 22.7, 21.4, 20.6, 21.4, 20.9 Đáp án trang 4.3 TRUNG BÌNH Trung bình số trung bình sử dụng nhiều Trong số trung bình, trung bình số có ích Trung bình tính cách cộng tất quan sát chia cho số quan sát Nghĩa lả Tổng quan sát Trung bình = Số quan sát Để tính trung bình thời gian vị 20 tổng thống gần đây, cộng 20 giá trị quan sát bảng 4.1 (4+4+…+4+8) 112 năm chia cho số tổng thống 20 5.60 năm Cần lưu ý trước tính trung bình nên xếp thứ tự quan sát từ giá trị thấp giá trị lớn Tuy nhiên, với số liệu lớn chưa xếp, tính trung bình dễ dàng, đặc biệt sử dụng máy tính Mẫu hay dân số? Các nhà thống kê phân biệt hai loại trung bình-trung bình mẫu trung bình dân số- dựa liệu xem dân số, nghĩa toàn tập hợp quan sát, hay mẫu, nghĩa phần tập hợp dân số Lấy ví dụ, thời gian vị 20 tổng thống mỹ xem dân số 5.60 năm trung bình dân số Cịn xem thời gian vị 20 tổng thống mẫu tồn tổng thống mỹ 5.60 trung bình mẫu việc phân biệt hai loại trung bình khơng vấn đề nhìn nhận mà cịn giúp tính xác trung bình cho mẫu hay dân số Việc phân biệt có ý nghĩa quan trọng chương Tuy nhiên, từ chương tiếp theo, giả sử tất trung bình đề cập trung bình mẫu Cơng thức tính trung bình mẫu Chúng ta thường sử dụng kí hiệu để quy định cho giá trị cần tính cơng thức tốn học Trung bình quy định X Khi cơng thức tính trung bình X X n (4.1) Trong X : tổng biến X n: cỡ mẫu Cơng thức tính trung bình dân số Trung bình dân số ký hiệu Khi cơng thức tính trung bình dân số là: X N (4.2) N: kích thước dân số Trung bình điểm cân Trung bình xem điểm cân phân phối tần suất Hãy tưởng tượng đặt tổ chức đồ hình 4.1 mặt phẳng cứng ví dụ gỗ chẳng hạn Sau dịch chuyển tổ chức đồ không làm thay đổi vị trí cách đặt ngón tay vào giá trị 5.60, trung bình phân phối Nếu kéo giá trị 5.60 phía trái, đồ thị sụp xuống phía phải, cịn kéo giá trị 5.60 phía phải đồ thị sụp xuống phía trái Trung bình xem điểm cân phân phối tính chất sau đây: tổng sai lệch quan sát, dương âm, so với trung bình cộng lại Lấy ví dụ, bảng 4.3 cột hai sai lệch giá trị quan sát so với trung bình Đối với giá trị quan sát nhỏ trung bình sai lệch âm (ví dụ 25.60=-3.60), cịn giá trị quan sát lớn trung bình sai lệch dương (ví dụ 12-5.60=6.40) cộng tổng sai lệch dương (21.6) tổng sai lệch âm (-21.6) ta Với vai trò điểm cân bằng, trung bình mơ tả điểm cân đối mà giá trị lớn trung bình cân giá trị nhỏ trung bình Vì thay đổi giá trị dẫn đến thay đổi trung bình Hay nói cách khác, trung bình chịu ảnh hưởng tất giá trị phân phối (trung vị chịu ảnh hưởng giá trị giữa, yếu vị chịu ảnh hưởng giá trị xuất nhiều nhất) Bài tập 4.5 tìm trung bình độ tuổi hưu cho dãy số sau: 60, 63, 45, 63, 65, 70, 55, 63, 60, 65, 63 Bài tập 4.6 tìm trung bình lượng xăng hao hụt cho dãy số sau: 21.4, 20.6, 21.4, 20.9 Đáp án trang 549 4.4 CHỌN LOẠI TRUNG BÌNH NÀO Nếu phân phối không bị lệch Khi phân phối khơng bị lệch q nhiều, trung bình, trung vị, yếu vị có giá trị gần sử dụng ba giá trị để mơ tả độ tập trung phân phối Hình 4.1 thuộc trường hợp mà yếu vị, trung vị trung bình 4, 4.5, 5.6 Nếu phân phối bị lệch Tuy nhiên phân phối có chứa cực trị (cực lớn cực nhỏ), phân phối bị lệch giống phân phối tỷ suất tử vong sơ sinh bảng 4.4 Bảng 4.4 Tỷ suất tử vong sơ sinh theo quốc gia Quốc gia Tỷ suất tử vong sơ sinh * Sierra Leone 168 Campuchia 100 Ấn Độ 71 Thổ Nhĩ Kỳ 36 Brazin 32 Trung Quốc 30 Mêxicô 29 Syria 26 Ba Lan Hungary Hoa Kỳ Úc Canada Đan mạch Pháp Đức Tây Ban Nha Nhật Thụy Điển * : tỷ suất tính 1000 trẻ sinh sống Nguồn: 2001 World Development Indicators Trong bảng 4.4 yếu vị có quốc gia có tỷ suất tử vong sơ sinh trung vị hoa kỳ nằm vị trí có giá trị trung bình 26.90 cách lấy tổng giá trị 565 chia cho 21 Như trung vị yếu vị không phụ thuộc vào cực trị Yếu vị phản ánh giá trị xuất nhiều phân phối trung vị phản ánh quan sát có vị trí phân phối Trung bình phụ thuộc nhiều vào quan sát cực trị Bất cực trị thay đổi giá trị trung bình chẳng hạn tỷ suất tử vong sơ sinh Sierra Leone 168 kéo trung bình hướng giá trị cực trị Diễn giải khác biệt trung bình trung vị Nếu trường hợp lý tưởng phân phối đều, báo cáo trung bình trung vị Tuy nhiên, giá trị trung vị trung bình khác hồn tồn chứng tỏ phân phối bị lệch Nếu trung bình lớn trung vị, ví dụ thời gian vị tổng thống Mỹ tỷ suất tử vong sơ sinh nêu trên, phân phối khảo sát bị lệch dương nhiều giá trị cực lớn: ví dụ thời gian vị tổng thống Mỹ thời gian vị F.Roosevelt cực trị (12), ví dụ tỷ suất tử vong sơ sinh tỷ suất Serra Leone cực trị (168) Ngược lại, trung bình nhỏ trung vị phân phối lệch âm nhiều giá trị cực nhỏ Hình 4.2 mơ tả mối liên hệ số trung bình hai loại phân phối bị lệch Bài tập 4.7 Hãy xác định trung bình lớn hay nhỏ trung vị trường hợp sau: (a) phân phối lệch dương điểm thi kiểm tra dễ đa số sinh viên đạt điểm cao có số đạt điểm thấp (b) phân phối lệch dương tuổi sinh viên đại học đa số nằm độ tuổi từ 18-20 số có độ tuổi từ 15-16 (c) phân phối lệch dương tiền tiêu vặt học sinh đa số mang 1$ số mang khoản 4$ (d) phân phối lệch dương số lượng khán giả rạp chiếu phim, hầu hết đạt công suất rạp chiếu phim Đáp án trang 4.5 VỊ TRÍ ĐẶC BIỆT CỦA TRUNG BÌNH Như viết, trung bình đơi khơng thể mơ tả số liệu mà phải dùng số tập trung khác ví dụ trung vị để mơ tả Tuy nhiên hầu hết trường hợp, trung bình ln sử dụng số đo tập trung biến định lượng Có nhiều lý để người ta sử dụng trung bình Trong sách trung bình sử dụng nhiều ( với trung vị yếu vị) từ chương trở sau Nó sử dụng phép kiểm phức tạp, dùng để suy luận tham số cho dân số 4.6 SỐ ĐO TRUNG BÌNH CHO BIẾN ĐỊNH TÍNH Yếu vị ln sử dụng nhiều Như biết, để mô tả độ tập trung cho biến định lượng, sử dụng trung bình, trung vị, yếu vị Tuy nhiên, biến định tính ln sử dụng yếu vị Ví dụ, số liệu câu trả lời sinh viên hỏi có hút marijuana hay khơng, ta có trả lời “có” yếu vị số lượng sinh viên trả lời có nhiều số lượng trả lời không Tương tự, tập 2.9 nhóm máu O yếu vị số liệu tập 3.4 da trắng yếu vị số người mỹ da trắng nhiều thành phần cịn lại Đơi sử dụng trung vị Trung vị sử dụng với số liệu gồm nhiều nhóm xếp theo thứ tự giảm dần tăng dần Chúng ta xác định trung vị dễ dàng nhờ vào tần suất tương đối Trong bảng tần suất tương đối, có cột phần trăm tích lũy, cộng phần trăm tích lũy nhóm từ thấp lên ta phần trăm tích lũy lớn 50% Khi nhóm chứa phần trăm tích lũy giá trị trung vị Ví dụ, bảng 4.5 trình bày số liệu số lượng quân hàm quân đội Mỹ năm 2002 Các nhóm xếp từ thấp (chuẩn úy) cao (đại tướng) Cộng phần trăm tích lũy chuẩn úy, trung úy, đại úy ta có giá trị 64.8 (lớn 50%) Như đại úy trung vị số liệu Bảng 4.5 Số lượng quân hàm quân đội Mỹ năm 2002 Quân hàm % % tích lũy Đại tướng 0.4 Đại tá 16.1 Thiếu tá 18.7 Đại úy 29.9 + 34.9 = 64.8 Trung úy 19.7 + 15.2 = 34.9 Chuẩn úy 15.2 15.2 100.0 Nguồn: www.defenselink.mil Khi tìm trung vị, cần tránh lỗi sau: xác định trung vị nhóm hay trung bình hai nhóm mà khơng tính phần trăm tích lũy vị trí nhóm chứa phần trăm tích lũy 50% Sử dụng số trung bình khơng phù hợp Chúng ta khơng thể sử dụng trung vị cho biến định tính trường hợp liệu chưa xếp theo thứ tự ví dụ nhóm máu người địa Châu Mỹ Chúng ta sử dụng trung bình cho biến định tính ví dụ số lượng quân hàm quân đội Mỹ giá trị chữ biến định tính khơng thể tính tốn cơng thức tính trung bình Bài tập 4.8 Các sinh viên khảo sát kỳ nghỉ mùa xuân chọn khu vực để nghỉ mát: Daytona Beach (DB), San Diego (SD), South Padre Island (SP), Lake Havasu (LH), hay nơi khác (O) Sau bảng kết khảo sát: DB SD O DB DB SP SP SD SD LH SD DB LH DB DB O DB O LH DB Tìm yếu vị có trung vị Đáp án trang 4.7 CÁC SỬ DỤNG TỪ “ SỐ TRUNG BÌNH” Danh từ số trung bình thường dùng để trung bình, trung vị, hay yếu vị chí trung bình nhân trung bình hàm điều hịa Tuy nhiên, theo cách sử dụng phổ biến nay, số trung bình thường dùng để trung bình Lấy ví dụ, số trung bình điểm xếp hạng hiểu điểm thi trung bình khơng phải điểm thi trung vị hay điểm thi yếu vị Tuy nhiên, tùy thuộc vào hoàn cảnh cách sử dụng, số trung bình tượng trưng cho trung vị hay yếu vị hay số đo khác thay trung bình Đặc biệt đề tài gây tranh cãi cần xác định rõ chất danh từ số trung bình 10 Tóm tắt Yếu vị giá trị xuất nhiều tập hợp quan sát Trung vị giá trị quan sát có thứ hạng giữa, có thứ hạng phần trăm 50 chia đôi tập hợp số liệu thành hai Giá trị trung bình, trung bình mẫu hay dân số, tính cách cộng tất giá trị quan sát chia cho số quan sát mẫu hay dân số Trung bình dùng cho biến định lượng điểm cân phân phối liệu Khi phân phối tần suất cân đối, giá trị ba số đo tược trưng cho độ tập trung phân phối Nếu phân phối tần suất bị lệch, giá trị ba loại số đo khác nhau, trung bình bị lệch phía cực trị Nhìn chung trường hợp này, nên báo cáo trung bình trung vị Yếu vị sử dụng cho biến định tính Nếu biến định tính xếp theo thứ tự từ thấp đến cao, trung vị sử dụng Thơng thường, danh từ “số trung bình” thường dùng để trung bình Tuy nhiên trường hợp nghi ngờ nên xác định rõ chất danh từ Thuật ngữ quan trọng Số đo lường tập trung Yếu vị Nhị yếu vị Trung vị Dân số Mẫu Trung bình mẫu ( X ) Cỡ mẫu (n) Trung bình dân số ( ) Kích thước dân số (N) BÀI TẬP ƠN Lưu ý tính tốn: cần, làm trịn số hai số thập phân, sử dụng cách làm trịn trình bày mục phụ lục A 4.9 Đối với câu hỏi “trong đời, bạn chuyển nhà lần?”, 18 sinh viên đại học trả lời sau: 1, 3, 4, 1, 0, 2, 5, 8, 0, 2, 3, 4, 7, 11, 0, 2, 3, Hãy tìm trung vị, trung bình, yếu vị 4.10 Trong trình bơi mê cung nước, 15 chuột thí nghiệm mắc số lỗi (đi nhầm vào đường cụt) sau đây: 2, 17, 5, 3, 28, 7, 5, 6, 2, 12, 10, 4, (a) tìm trung vị, trung bình yếu vị liệu (b) không lập phân phối tần suất hay vẽ đồ thị, có xác định phân phối cân đối, lệch dương hay lệch âm hay không? 4.11 Trong số đua, người trượt tuyết đổ dốc nhận thời gian trung bình ba lần trượt thử Thời gian trung bình ám trung bình hay trung vị có: (a) lần trung bình hai lần đạt thời gian trung bình (b) lần vượt trung bình hai lần đạt thời gian trung bình 11 (c) hai lần vượt trung bình lần đạt trung bình (d) ba lần đạt thời gian khác cách 4.12 Trong đình công phi công hãng Northwest Airline năm trước, ban quản lý cơng bố lương trung bình phi cơng 133.000$/năm, cịn cơng đồn phi cơng nói họ nhận trung bình 120,000$/năm Sử dụng kiến thức chương này, giải thích lại có khác biệt này? 4.13 Garrison Keillor, giám đốc đài Public Minesota chương trình “A Prairie Home Companion” kết thúc câu chuyện thị trấn quê hương ông câu “ tin tức từ Lake Wobegon, nơi tất phụ nữ mạnh mẽ, tất đàn ông đạp trai tất trẻ em trung bình” Như vậy, trường hợp sau thuộc loại phân phối nào: (a) Trên trẻ em trung bình? (b) Trên nửa trẻ em trung bình? (c) Một nửa trẻ em nửa trẻ em trung bình? (d) Tất trẻ em trung bình? 4.14 Trung bình điểm cân phân phối tổng quan sát, biểu diễn dạng hiệu số âm dương so với trung bình, ln ln (a) Hãy chứng tỏ tính chất liệu đây: 3, 6, 2, 0, (b) Trung bình ln lng có tính chất Để chứng minh lấy số trung bình khác, tính tổng hiệu số số liệu câu a với trung bình Chúng ta thấy tổng hiệu số khác 4.15 Trong học khảo sát, da trắng yếu vị tập hợp số liệu chủng tộc Mỹ, tìm thấy trung vị tập hợp liệu tập 3.4 hay khơng? 4.16 Tìm yếu vị trung vị, có tập hợp số liệu tập 2.8 4.17 Phân phối nam nữ tập 2.15 có khác biệt yếu vị hay khơng? 4.18 Hãy xác định loại số trung bình đề cập trường hợp đây: (a) Số đo không sử dụng với biến định tính (b) Số đo đơi sử dụng với biến định tính (c) Số đo ln sử dụng với biến định tính 12 ... 4.3 TRUNG BÌNH Trung bình số trung bình sử dụng nhiều Trong số trung bình, trung bình số có ích Trung bình tính cách cộng tất quan sát chia cho số quan sát Nghĩa lả Tổng quan sát Trung bình = Số. .. lõi liệu mô tả Đối với liệu, có nhiều số trung bình, chúng gọi số đo mật độ tập trung Chương giới thiệu cách tính diễn giải số đo mật độ tập trung sử dụng phổ biến SỐ TRUNG BÌNH ĐỐI VỚI DỮ LIỆU... với số liệu lớn chưa xếp, tính trung bình dễ dàng, đặc biệt sử dụng máy tính Mẫu hay dân số? Các nhà thống kê phân biệt hai loại trung bình -trung bình mẫu trung bình dân số- dựa liệu xem dân số,