1. Trang chủ
  2. » Thể loại khác

Tổ chức và tóm tắt dữ liệu

21 18 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 187 KB
File đính kèm CHUONG2.rar (27 KB)

Nội dung

PHẦN 1: THỐNG KÊ MÔ TẢ TỔ CHỨC VÀ TÓM TẮT DỮ LIỆU Mô tả liệu bảng Mô tả liệu đồ thị Mô tả liệu số trung bình Mô tả tính biến thiên Phân phối bình thường (I): Phân phối bình thường (II): ứng dụng Bàn luận thêm số z Mô tả mối liên hệ: tương quan Hồi quy 10 Bàn luận thêm tương quan hồi quy Tổng Quan Chúng ta thường bắt đầu phân tích thống kê với số liệu, hay nói cách khác tập hợp quan sát Thống kê mô tả, trình bày mười chương, cung cấp cho công cụ bảng, đồ thị, tóm tắt dạng số hệ số tương quan nhằm giúp ta hiểu liệu Đây bước trước báo cáo kết cho đối tượng khác với hỗ trợ thống kê suy luận đề cập phần 2, giúp đưa suy luận từ quan sát thực tế CHƯƠNG MÔ TẢ DỮ LIỆU BẰNG BẢNG Phân phối tần suất biến định lượng 2.1 Dữ liệu chưa nhóm 2.2 Dữ liệu nhóm 2.3 Hướng dẫn chia nhóm 2.4 Chia làm lớp 2.5 Khoảng cách lớp 2.6 Tự chia nhóm 2.7 Số ngoại lai Những loại phân tần suất khác phối 2.8 Phân phối tần suất liên quan 2.9 Phần trăm hay tỷ lệ 2.10 Phân phối tần suất tích lũy 2.11 Thứ hạng phần trăm 2.12 Phân phối tần suất cho biến định tính 2.13 Diễn giải phân phối người khác lập Tóm tắt/thuật ngữ quan trọng/bài tập ôn Tổng quan Thống kê thường bắt đầu với tập hợp số liệu Một thành phần thống kê, phân phối tần suất giúp xếp liệu Nó giúp phát nên kiểu liệu-ví dụ kiểu đường cong chuông quen thuộc- nhằm làm rõ thêm liệu Phân phối tần suất liên quan giúp so sánh hai hay nhiều phân phối lúc Phân phối phần trăm tích lũy giúp mô tả vị trí cá nhân nhóm Sau chương này, phân phối tần suất không nhắc lại trình bày phần cuối Đối với số liệu, bảng 1.1, làm để bạn hiểu nó- bạn người khác Đằng sau quan sát bảng 1.1, có thông điệp quan trọng mà bạn Vì vậy, gặp liệu hoàn toàn bạn thật quan tâm, thống kê bạn vừa thú vị đầy thách thức Công việc bạn phải mô tả số liệu cách rõ ràng, hoàn chỉnh xác tốt Thống kê cung cấp cho bạn công cụ hướng dẫn để làm cho liệu bạn mang tính cấu trúc Phân phối tần suất cho biến định lượng 2.1 Dữ liệu chưa nhóm Bảng 2.1 Phân phối tần suất (dữ liệu chưa nhóm) Trọng lượng Tần suất 245 0 * * * * Toång 53 Bảng 2.1 trình bày dạng xếp liệu bảng 1.1 Đầu tiên lập cột bao gồm trọng lượng nam sinh viên lớp thống kê trọng lượng nhỏ (133) cuối cột trọng lượng nặng ( 245) đầu cột (trong bảng 2.1 số giá trị bị lược bỏ thay dấu hoa thị để tránh làm cho bảng dài Chúng ta không phép làm thực tế) Sau đếm số lần xuất giá trị trọng lượng ghi vào cột kế bên, cột gọi cột tần suất Bảng 2.1 gọi phân phối tần suất Như vậy, phân phối tần suất tập hợp quan sát tạo nên cách xếp quan sát vào lớp ghi lại tần số xuất lớp Bảng 2.1 gọi phân phối tần suất với liệu chưa nhóm quan sát xếp vào lớp có giá trị Không phải lúc phù hợp Phân phối tần suất bảng 2.1 không đầy đủ, số giá trị liệt kê đầy đủ lớn 100 Phân phối tần suất với liệu chưa nhóm hiệu số giá trị nhỏ 20 Tuy nhiên, số số giá trị lớn 20 cần sử dụng phân phối tần suất với liệu nhóm, trình bày phần Bài tập 2.1 Các sinh viên rạp hát đánh giá nghệ thuật cho phim Titanic dựa thang điểm 10 tệ tăng dần lên 10 tuyệt vời Sau điểm sinh viên đưa ra: 3 7 7 10 3 8 Bởi số giá trị nhỏ, có 10 giá trị nên sử dụng phân phối PHỐI tần suất liệu chưa HƯỚNG DẪN VỀ PHÂN TẦN SUẤT Các điểm nhóm Hãy làm tập Mỗi quan phép nằm nhóm Đáp ánsát trang 544 Ví dụ: chia trọng lượng thành 130-139 140-149 không chia 130-140 140-149 giá trị 140 nằm hai nhóm khác Liệt kê tất nhóm cho dù có tầnnếu suất Nhưcó đãnhóm nói sốbằng giá trị 2.2 nhóm 210-219 có tần suất Chúng ta Ví dụ: Bảng Bảng 2.2 có biến lớn 20, ta sử dụng bảng 2.1 Phân phối tần suất lập bảng sai bỏ nhóm số liệu dài dòng giống (số liệu nhóm) 3.Trọng Tấtlượng nhóm phải bằng1.1 Tầncó suấtđộ rộng bảng Khi đó, cần sử 240-249 Ví dụ: chia thành 130-139 140-149 thể dụng bảng 2.2 để tóm tắtkhông số liệu chia230-239 thành 130-139 140-159 Bảng 2.2 gọi bảng phân 220-229 210-219 phối tần suất liệu nhóm, 200-209 Các điểm lưu ý khác giá trị biến 190-199 4 Các nhóm nên có giá trị giá trị phân thành nhóm, nhóm 180-189 ≥ 240 Ví dụ: không nên chia 240-249 thành nhiên, 170-179 nhóm có tần suất tươngTuy ứng cột đối 160-169 12 trường hợp phải lập nhiều bảng phân chia diện Từ bảng có 150-159 17 phối khác thể đưa số đặc điểm phân 140-149 Chọn số thuận tiệnsau: nhưđỉnh 1, 2, Con 130-139 độ rộng nhóm bốcon trọng lượng phân Tổng 53 số thường sử dụng 5, 10, hay cấp số nhân 10 bố trọng lượng nằm nhóm 150-159 Ví dụ: không nên chia thành (độ rộngdần nhóm 13) mà sau130-142 giảm hai bên, nên chia thành 130-139 (độ rộng cột 10) nhóm có trọng lượng lớn chiếm tần số cao Giá trị nhóm nên cấp số nhân độ rộng nhóm Ví dụ: nhóm 130-139, giá trị 130 cấp số nhân 10 ( độ rộng nhóm) Khung “Hướng VềtaPhân Phối Tần liệt kêkhoảng dẫn để lập nên Nhìn chung, Dẫn chúng thường chia dữSuất” liệu thành 10 nhóm phân phối tần suất Ba dẫn đầu điều không thiếu Ví dụ: bảng 2.2 có tất 12 nhóm Bảng tốt bảng 2.3 ( 24thể nhóm) muốn lập phân phối tần suất Bốn dẫn cuối có bảng 2.4 (3 nhóm) không tuỳ vào trường hợp 2.2 Dữ liệu nhóm 2.3 HƯỚNG DẪN VỀ PHÂN PHỐI TẦN SUẤT 2.4 NÊN CHIA BAO NHIÊU NHÓM? 2.4 Chia nhóm? Bảng 2.2 Phân phối tần suất với nhiều nhóm Trọng lượng Tần suất 245-249 240-244 235-239 * * 205-209 200-204 * Bảng 2.2 Phân phối tần suất 145-149 với nhóm 140-144 135-139 Trọng lượng Tần 130-134 suất Tổng 53 200-249 150-199 43 100-149 Tổng 53 Nếu chia nhiều 10 nhóm cách không cần thiết làm cho việc mô tả số liệu trở nên rối rắm Tuy nhiên, trường hợp tập hợp số liệu lớn nên chia nhiều nhóm có lợi mô tả kỹ số liệu so với chia nhóm Chẳng hạn khảo sát 5300 sinh viên thay 53 sinh viên nam lớp thống kê, việc chia thành 24 nhóm bảng 2.3 hợp lý cho thấy đỉnh phân bố tần suất Trong nhiều trường hợp, chia nhỏ 10 dẫn tới việc che số liệu quan trọng chẳng hạn mật độ tập trung cao trọng lượng nhóm 150-154…Tuy nhiên nhiều trường hợp lại cần thiết Ví dụ khảo sát 12 sinh viên thay 53 sinh viên việc chia nhỏ thành nhóm bảng 2.3 lại hợp lý làm rõ đỉnh trọng lượng chia thành 10 nhóm 2.5 KHOẢNG NHÓM CÁCH GIỮA CÁC Khoảng cách nhóm đơn vị đo lường, nghóa với khác biệt nhỏ hai giá trị tập hợp số liệu Lấy ví dụ hai khoảng 130-139 140-149, đơn vị đo lường (140-139 =1) khoảng cách nhóm Điều tránh việc giá trị bị lọt nhóm Khoảng cách nhóm nói lên giá trị lẻ (ví dụ 130.1, 130.2…) 53 sinh viên khảo sát (tuy nhiên thực tế trọng lượng người có số lẻ) Độ rộng khoảng cách nhóm tương đương với khoảng cách từ biên trừ 0.5 biên cộng 0.5 Lấy ví dụ nhóm 130-139 có độ rộng khoảng cách nhóm 129.5 139.5 2.6 LẬP BẢNG PHÂN PHỐI TẦN SUẤT Sau bảng hướng dẫn lập phân phối tần suất cho biến định lượng XÂY DỰNG BẢNG PHÂN PHỐI TẦN SUẤT Tìm phạm vi số liệu: khoảng cách giá trị lớn nhỏ Ví dụ: trọng lượng lớn sinh viên bảng 1.1 245 nhỏ 133, phạm vi số liệu 245-133 = 112 Tìm độ rộng nhóm: sử dụng công thức sau Độ rộng nhóm = Phạm vi số liệu/ Số nhóm mong muốn Ví dụ: Trong ví dụ trọng lượng sinh viên ta có độ rộng nhóm = 112/10 =11.2 Làm tròn độ rộng nhóm (ví dụ 1, 2, 5, 10 cấp số nhân 10) Ví dụ: Độ rộng nhóm 11.2 làm tròn thành 10 Xác định biên nhóm thấp nhất: biên nhóm thấp phải cấp số nhân độ rộng cột nhỏ giá trị nhỏ tập hợp số liệu Ví dụ: Giá trị nhỏ tập hợp số liệu 133 nên biên nhóm thấp 130 (cấp số nhân độ rộng cột 10) Xác định biên nhóm thấp : Lấy biên cộng với độ rộng nhóm trừ đơn vị đo lường Ví dụ: ta lấy biên 130 cộng 10 độ rộng cột trừ đơn vị đo lường biên 139 Làm tương tự nhóm cao chứa giá trị lớn Ví dụ: ta nhóm thấp 130-139, từ làm tương tự ta nhóm 140-149, 150-159….240-249 nhóm lớn chứa giá trị 245 Xác định quan sát thuộc nhóm nào: Ví dụ: ta có quan sát có giá trị 193 quan sát thuộc nhóm 190-199 Lập bảng phân phối tần suất cách đếm số quan sát nhóm Ví dụ: nhóm 130-139 có quan sát với giá trị 133, 135, 135 tần suất nhóm 130-139 Bài tập 2.2 Chỉ số IQ nhóm 35 học sinh trung học liệt kê sau 91 87 95 123 98 110 112 85 96 71 80 69 109 90 84 75 105 100 99 94 90 79 86 90 93 95 100 98 80 104 77 108 90 103 89 Hãy lập phân phối tần suất cho tập hợp biến số Bài tập 2.3 Phân phối tần suất sau có nhược điểm nào? Ước lượng thời lượng xem tivi 250 học sinh Thời lượng Tần suất >=35 30.34 25.30 20.22 15.19 10.14 5.9 0-4 29 60 60 34 31 29 Đáp án trang 545 2.7 GIÁ TRỊ NGOẠI LAI Khi gặp giá trị ngoại lai trình mô tả số liệu, trước hết phải xác định xem giá trị có xác không Nếu số xác, cần chấp nhận giá trị Tuy nhiên, lập bảng phân phối, không nên lập thêm nhóm để chứa giá trị mà nên dùng ghi giá trị Hay sử dụng phương pháp mô tả khác sử dụng số trung bình chẳng hạn trung vị hay khoảng tứ vị Một xác định giá trị ngoại lai số xác, cung cấp cho nhiều kiến thức Chẳng hạn khảo sát tỷ lệ phạm tội thành phố khác nhau, thấy giá trị thấp số thành phố có tình hình an ninh trật tự ổn định Bài tập 2.4 Nhận diện số ngoại lai tập hợp số liệu gồm sinh viên sau Đầu tiên, tìm số ngoại lai thu nhập vào mùa hè 09 sinh viên, sau làm tương tự cho biến tuổi, số thành viên gia đình GPA Thu nhập mùa hè $6450 $4820 $5650 $1720 $600 $0 $3482 $25,700 $8548 Tuoåi 20 19 61 32 19 22 23 27 21 Thành viên gđ 18 CÁC LOẠI PHÂN TẦN SUẤT KHÁC GPA 2.3 4.00 3.56 2.89 2.15 3.01 3.09 3.50 3.20 PHOÁI 2.8 PHÂN PHỐI TẦN SUẤT TƯƠNG ĐỐI Một dạng quan trọng khác phân phối tần suất phân phối tần suất tương đối Phân phối tần suất tương đối biểu diễn tần suất nhóm dạng phần tổng tần suất toàn phân phối Phân phối cho phép xác định mật độ tập trung quan sát lớp khác phân phối Nó cho phép so sánh hai hay nhiều phân phối với tổng số quan sát khác Ví dụ, tập 2.14 yêu cầu bạn so sánh phân phối tuổi 500 cư dân thị trấn nhỏ so với 250 triệu dân toàn nước Mỹ Việc chuyển từ dạng tần suất tuyệt đối sang dạng tần suất tương đối cho phép so sánh hai phân phối mà không cần quan tâm đến khác biệt lớn tổng số quan sát Lập phân phối tần suất tương đối Để tính tần suất tương đối nhóm, lấy tần suất nhóm chia cho tổng tần suất phân phối Bảng 2.5 Trình bày bảng phân phối tần suất tương đối Bảng 2.5 Phân phối tần suất tương đối Tần suất tương đối Trọng lượng Tần suất Tỷ Phần trăm lệ 240-249 02 230-239 00 220-229 06 210-219 00 200-209 04 190-199 08 180-189 06 170-179 13 13 160-169 12 23 23 150-159 17 32 32 140-149 02 130-139 06 Tổng 53 1.02* 102* * Tổng 100 làm tròn số 2.9 PHẦN TRĂM HAY TỶ LỆ? Người ta sử dụng phần trăm nhiều tỷ lệ phần trăm dấu thập phân Để chuyển đổi từ tỷ lệ sang phần trăm, ta nhân tỷ lệ với 100 Trong thực tế, người ta dùng tỷ lệ phần trăm không sử dụng hai lúc Bài tập 2.5 Điểm GRE nhóm thí sinh lập nhö sau: GRE 725.749 700.724 675.699 650.674 625-649 600.624 575.599 550.574 525.549 500.524 475.499 Tổng Tần suất 14 30 34 42 30 27 13 200 Chuyển thành phân phối tần suất tương đối tỷ lệ, sau phần trăm Khi chuyển sang phân phối tần suất tương đối tỷ lệ, cần làm tròn hai chữ số 2.10 PHÂN PHỐI TẦN SUẤT TÍCH LŨY Phân phối tần suất tích lũy biểu diễn tổng số quan sát nhóm tất nhóm có thứ hạng thấp Phân phối sử dụng hiệu cho tập hợp số liệu chẳng hạn số điểm kiểm tra hay điểm kỹ trí tuệ hay học tập, vị trí bảng phân phối gợi lên tầm quan trọng định Trong trường hợp này, tần suất tích lũy thường chuyển sang dạng tỷ lệ tích luỹ hay phần trăm tích lũy Phần trăm tích lũy gọi thứ hạng phần trăm trình bày phần sau Lập phân phối tần suất tích luỹ Để chuyển đổi từ phân phối tần suất sang phân phối tần suất tích lũy, cộng tần suất nhóm với tổng tần suất nhóm nhỏ nhóm Chúng ta cộng dồn từ nhóm thấp nhóm cao Ví dụ, tần suất nhóm 130-139 140-149 1, tần suất tích lũy nhóm 140-149 Để chuyển tần suất tích lũy thành tỷ lệ tích lũy, chia tần suất tích lũy nhóm cho tổng tần suất nhóm Nếu muốn chuyển từ tỷ lệ tích lũy thành phần trăm tích lũy, nhân tỷ lệ tích lũy với 100 Ví dụ, tỷ lệ tích lũy nhóm 140-149 4, ta chia cho tổng tần suất nhóm 53 tỷ lệ 0.08 Nhân 0.08 cho 100 ta phần trăm tích lũy Sau bảng phân phối tần suất tích luỹ 53 sinh viên lớp thống kê Trọng lượng Bảng 2.6 Phân phối tần suất tích lũy Tần Tần suất Tỷ Phần trăm suất tích luỹ tích luỹ lệ tích luỹ 240-249 230-239 220-229 210-219 200-209 190-199 180-189 170-179 160-169 150-159 140-149 130-139 Toång 12 17 53 53 52 52 49 49 47 43 40 33 21 1.00 98 98 92 92 89 81 75 62 40 08 06 100 98 98 92 92 89 81 75 62 40 Bài tập 2.6 a Chuyển phân phối điểm GRE tập 2.5 thành phân phối tần suất tích luỹ b Chuyển phân phối điểm GRE tập 2.5 thành phân phối tần suất tích luỹ, sử dụng tỷ lệ phần trăm 2.11 Thứ hạng phần trăm Khi sử dụng để mô tả vị trí tương đối quan sát tập hợp liệu, phần trăm tích luỹ gọi thứ hạng phần trăm Thứ hạng phần trăm quan sát số phần trăm quan sát tập hợp nhỏ giá trị quan sát Vì vậy, trọng lượng có thứ hạng phần trăm 80 số quan sát có trọng lượng nhẹ chiếm 80% tổng số quan sát Thứ hạng phần trăm xác (đối với liệu chưa nhóm) Khi tính phần trăm tích lũy cho liệu chưa nhóm, phần trăm gọi phần trăm tích luỹ xác Bảng 2.7 trình bày thứ hạng phần trăm tích luỹ xác số lần tham dự buổi tiệc lãng mạn 20 sinh viện đại học Bảng 2.7 Số lần tham dự buổi tiệc lãng mạn thời gian trung học 20 sinh viên đại học Số lần Tần suất tích Phần trăm tích luỹ Tần tham dự suất lũy (thứ hạng phần trăm) 20 100 19 95 19 95 18 90 16 80 15 75 13 65 45 5 25 Tổng 20 Như vậy, ta nói số lần tham dự có thứ hạng phần trăm 90 có nghóa có 90% tổng số sinh viên có số lần tham dự nhỏ lần Thứ hạng phần trăm tương đối (đối với liệu nhóm) Thứ hạng phần trăm tương đối phần trăm tích luỹ phân phối tần suất liệu nhóm Ví dụ bảng 2.6 cân nặng khoảng 170-179 có thứ hạng phần trăm tương đối 75 75 phần trăm tích lũy cho nhóm Bài tập 2.7 a Trong bảng 2.7, tìm thứ hạng phần trăm xác sinh viên lần tham dự tệc lãng mạn b Trong bảng 2.6 tìm thứ hạng phần trăm tương đương trọng lượng khoảng 200-209 pound Đáp án trang 546 2.12 Phân phối tần suất cho biến định tính Việc lập phân phối tần suất cho biến định tính dễ dàng biến định lượng Bảng 2.8 trình bày phân phối tần suất nghiên cứu việc hút marijuana Bảng 2.8 Nghiên cứu hút thuốc marijuana Trả lời Tần suất Có Không Tổng 56 27 83 Đối với liệu định tính có thứ tự hay gọi biến thứ tự, thứ tự trước sau quan sát phải nguyên lập phân phối tần suất Nếu đảo trật tự, thứ hạng phần trăm bảng giá trị Ví dụ bảng 2.9 trình bày phân phối tần suất cấp bậc sỹ quan quân đội Mỹ từ thấp đến cao Bảng 2.9 Thứ hạng só quan quân đội Mỹ (2002) Cấp bậc Tần suất Tỷ lệ Phần trăm lũy Đại tướng 301 0.004* 100.0 Đại tá 12.197 161 99.6 Thiếu tá 14.248 187 83.5 Đại uý 22.768 299 64.8 Trung uý 14.988 197 34.9 Chuẩn uý 11.565 152 15.2 * Để tránh ghi giá trị 00 cho cấp đại tướng, sử dụng số lẻ tích Bài tập 2.8 Xếp hạng mức độ nhạy cảm phim ảnh xếp theo thứ tự sau: NC-17, R, PG-13, G Sau bảng xếp hạng số phim San Francisco: PG PG PG PG-13 G G PG-13 R PG PG R PG R PG R NC-17 NC-17 PG G PG-13 a Lập phân phối tần suất b Lập phân phối tần suất tương đối dạng phần trăm c Lập phân phối tần suất tích luỹ d Tìm thứ hạng phần trăm phim theo bảng xếp hạng PG Bài taäp 2.9 O A A A O B O O A O O O A O A A A A A A B O O O AB O A O A O a Lập phân phối tần suất nhóm máu cho nhóm người hiến máu sau b Chuyển thành phân phối tần suất tương đối dạng phần trăm tỷ lệ c Sắp xếp phù hợp cho lập phân phối tần suất tích luỹ Đáp án trang 546 2.13 Diễn giải phân phối tần suất người khác Khi kiểm tra phân phối lần đầu tiên, cố gắng nhìn tổng quát toàn bảng phân phối Hãy đọc tiêu đề bảng, tiêu đề cột, ghi Dữ liệu từ đâu ra? Nguồn có tin cậy hay không? Kế tiếp tập trung vào định dạng phân phối tần suất Bảng có cấu trúc tốt hay không? Đối với biến định lượng nhóm, việc chia nhóm có nhiều hay hay không? Sau thực hai điều trên, ý đến nội dung phân phối tần suất Phạm vi tương đối phân phối gì? Có hợp lý hay không? (Nếu không, bạn diễn giải sai phân phối hay phân phối chứa nhiều số ngoại lai đòi hỏi phải quan tâm đặc biệt) Tốt bạn đừng quan tâm đến bất thường hiển nhiên thường kèm với phân phối tần suất tập trung vào hình dạng chung Các tần suất có nằm xung quanh đỉnh hay nhiều đỉnh? (nếu có đỉnh chứng tỏ có nhiều loại quan sát- ví dụ thu nhập năm công nhân nam nữ- tồn phân phối) Phân phối có cân đối xung quan đỉnh hay không? (một phân phối không cân đối cho thấy diện biên số, ví dụ số điểm 100 kiểm tra dễ, đạt điểm vượt 100 Khi diễn giải phân phối, kể phân phối người khác, bạn cần có tư tưởng rộng lớn Nghóa là, theo dẫn bạn đừng quên câu hỏi nảy sinh trình bạn đọc toàn bảng Hãy làm tập phần diễn giải phân phối tần suất phần “bài tập ôn” Chỉ thực hành nhiều tập bạn xây dựng kỹ diễn giải phân phối dạng bảng hay đồ thị học phần Tóm tắt Phân phối tần suất trình bày tần suất xuất quan sát Phân phối tần suất cho liệu chưa nhóm sử dụng quan sát phân vào nhóm có giá trị Nó hiệu số giá trị nhỏ 20 khoảng từ quan sát nhỏ quan sát lớn Phân phối tần suất cho liệu nhóm tạo giá trị phân vào nhóm có giá trị Phân phối phải thực theo bước hướng dẫn Một phân phối xây dựng tốt điều quan trọng phải chuỗi không chồng lên nhau, khoảng cách phải từ quan sát nhỏ quan sát lớn Tránh tóm tắt ngắn gọn (bằng cách chia nhóm) hay dài dòng (bằng cách chia nhiều nhóm) Nhìn chung, nên nhóm thành 10 nhóm số ban đầu số nhóm tùy thuộc vào số giá trị số liệu Cần ý đặc biệt đến số ngoại lai Chúng làm lệch phân phối cần phải ghi chú, hay bạn tập trung vào số ngoại lai giúp làm rõ thêm phân phối Khi muốn so sánh hai hay nhiều phân phối có số quan sát khác nhau, ta nên trình bày phân phối dạng tần suất tương đối Chúng ta dùng tỷ lệ hay phần trăm tương đối Trong phân phối vị trí tương đối quan sát quan trọng, nên chuyển phân phối tương đối thành phân phối tần suất tích luỹ dạng phần trăm hay tỷ lệ tích luỹ Trong phân phối tần suất tích luỹ, phần trăm tích luỹ gọi thứ hạng phần trăm Phần trăm thứ hạng quan sát số phần trăm quan sát toàn phân phối nhỏ giá trị quan sát Chúng ta tính thứ hạng phần trăm xác sử dụng liệu chưa nhóm thứ hạng phần trăm tương đối sử dụng liệu nhóm Chúng ta lập phân phối tần suất cho biến định tính Phân phối chuyển thành phân phối tần suất tương đối dạng tỷ lệ hay phần trăm liệu xếp theo thứ tự phân phối tần suất tích luỹ gồm tần suất, tỷ lệ hay phần trăm thứ hạng phần trăm Thuật ngữ quan trọng Frequency distribution Frequency distribution Frequency distribution Unit of measurement Class interval width Relative frequency distribution for ungrouped data Cumulative frequency distribution for grouped data Percentile rank of an observation Bài tập ôn 2.10 Trung tâm sửa chữa phương tiện giao thông công cộng ghi lại số dặm trung bình 50 xe bus hạn sử dụng Sau bảng số liệu: 654 789 961 893 763 421 562 923 759 677 a b c d 429 1708 1644 1798 423 821 756 543 1789 777 1630 1825 752 847 743 926 233 378 1754 555 1970 1723 880 576 889 593 431 776 679 660 1800 1701 1788 1903 567 998 741 632 771 638 Đơn vị đo lường liệu gì? Lập phân phối tần suất cho liệu nhóm Mô tả tất đặc điểm phân phối Thêm số ngoại lai 9750 vào số liệu Theo ý bạn, có nên thêm số ngoại lai vào số liệu hay không? Chỉ dẫn: ý đến tác động số ngoại lai lên phân phối tần suất số liệu gốc gồm 50 quan sát phần b 2.11 Giả sử sinh viên tình nguyện phân chia ngẫu nhiên thành hai nhóm nhóm có tham gia luyện thi nhóm không tham gia Người ta xác định điểm trung bình thứ hạng suốt năm học sinh viên để kiểm tra giả thuyết liệu việc tham gia luyện thi (biến độc lập) điểm trung bình thứ hạng (biến phụ thuộc ) có liên quan đến hay không? Sau điểm trung bình thứ hạng sinh viên theo hai nhóm có tham dự luyện thi Có động não 2.25 3.33 2.45 3.30 3.78 3.00 2.75 2.95 3.43 3.25 3.56 3.57 2.95 3.56 3.45 3.10 2.58 3.30 2.75 2.25 3.75 3.56 3.75 3.35 3.09 3.56 3.47 Khoâng động não 3.67 3.79 2.50 2.75 3.50 2.67 2.80 2.65 2.83 3.10 3.25 2.76 2.90 2.10 2.34 3.20 3.59 3.00 a Đơn vị đo lường liệu gì? 3.00 1.90 2.90 2.58 3.37 2.86 2.66 2.67 3.08 b Lập phân phối tần suất cho hai nhóm (đầu tiên lập phân phối tần suất cho nhóm có phạm vi lớn sau dùng số nhóm tương tự cho phân phối lại để tiện việc so sánh) c Hai nhóm có khác biệt hay không? 2.12 Cho phân phối tần suất sau đây: Số thành viên gia đình Mỹ, 2000 Số thành Tần suất viên >=7 1,400,000 * 2,400,000 7,000,000 15,300,000 17,200,000 34,700.000 26,700,000 Toång 104,700,000 * Làm tròn đến 100,000 Nguồn: thống kê Mỹ năm 2001 Lưu ý: nhóm (>=7) biên Đây tiết kiệm trang giấy trường hợp có nhiều bảng chẳng hạn thống kê năm 2001 Mỹ Bài tập 2.13 2.14 sử dụng cách a Chuyển sang phân phối tần suất tương đối dạng phần trăm (khi chuyển bạn bỏ số bên phải) b Chuyển sang phân phối tần suất tích luỹ c Chuyển sang phân phối tần suất tương đối tích lũy dạng phần trăm d Tìm thứ hạng phần trăm gia đình có người 2.13 Phân phối tần suất tập 2.12 phân phối số thành viên gia đình 104.7 triệu hộ gia đình Mỹ vào năm 2000 Trong tập này, trình bày phân phối tần suất số thành viên gia đình 43.4 triệu hộ gia đình nước Mỹ năm 1950 với số nhóm để tiện so sánh Sau bảng phân phối tần suất năm 1950 2000 Số thành viên gia đình Mỹ, 1950 2000 (triệu) Số thành Tần suất viên 1950 2000 >=7 2.1 1.4 2.2 2.4 4.4 7.0 7.7 15.3 9.8 17.2 12.5 34.7 4.7 26.7 Tổng 43.4 104.7 a Trong phân phối tần suất năm 1950, có gia đình có con? b Chuyển phân phối thành phân phối tần suất tương đối (phần trăm) Nếu bạn làm tập 2.12 cần chuyển phân phối năm 1950 c So sánh hai phân phối, ý khác biệt 2.14 Có khác biệt hay không hai phân phối bảng sau (một phân phối số tuổi dân cư thị trấn nhỏ phân phối số tuổi dân cự toàn nước Mỹ)? Hai phân phối tuổi Tần suất Dân số Mỹ (2000) Tuổi thị trấn Tần suất tương đối (%) nhỏ >=65 105 12 60-64 53 55-59 45 50-54 40 45-49 44 40-44 38 35-39 31 30-34 27 25-29 25 15-19 20 10-14 19 5-9 17 0-4 16 Toång 500 99% a Để tiện so sánh, chuyển phân phối tuổi thị trấn nhỏ thành phân phối tần suất tương đối dạng phần trăm b Mô tả khác biệt hai phân phối Đáp án trang 547 2.15 Bảng trình bày phân phối số cử nhân năm 1998 ngành học khác Bảng gồm phân phối tần suất dành cho hai đối tượng nam nữ cử nhân Số cử nhân năm 1998 theo ngành học giới tính (đơn vị ngàn) Ngành học Nam Nữ Kinh doanh 120.1 113.1 Khoa học xã hội 63.5 61.5 Giáo dục 26.3 79.7 Khoa học sức khoẻ 15.1 69.3 Tâm lý học 18.9 55.0 Kỹ thuật 61.4 12.5 Khoa học 29.6 30.6 sống Nghệ thuật 21.5 30.1 Truyền thông 20.0 30.1 Tổng 376.4 484.1 a Có nữ ngành tâm lý tốt nghiệp năm 1998 b Bởi tổng số nam nữ khác biệt với (376.4 484.1), nên trước so sánh nên chuyển sang dạng phân phối tần suất tương đối Sau so sánh khác biệt phân phối tần suất tương đối nam nữ c Có cần phải tính tần suất tích luỹ cho hai phân phối hay không? 2.16 Bảng trình bày phân phối tần suất nhóm chủng tộc Mỹ vào năm 1980 2000 bảng trình bày tần suất chênh lệch phần trăm chênh lệch nhóm chủng tộc dân số năm 2000 1980 Nguồn gốc chủng tộc dân số Mỹ (tính triệu) 2000 1980 1980-2000 Nguồn Tần Phần Tần Phần Chênh Phần trăm gốc suất trăm suất trăm lệch chênh lệch Mỹ gốc 33.9 12% 26.7 12% 7.2 27% Châu Phi Mỹ gốc 13.0 5% 5.2 2% 7.8 150% Châu * Gốc Tây Ban Nha Da trắng Tổng 35.3 13% 14.6 6% 20.7 142% 194.6 276.8 70% 100% 180.1 226.6 80% 100% 14.5 50.2 8% 22% * Hầu hết người châu có chủng tộc khác, ví dụ ấn gốc Mỹ eskimos Lưu ý: cột cuối trình bày chênh lệch năm 2000-1980 dạng phần trăm tính dân số năm 1980 a Nhóm thay đổi nhiều tính số dân thực? b Tính theo dân số năm 1980, nhóm tăng nhiều nhất? c Tính theo dân số năm 1980, nhóm giảm cách nhanh chóng so với dân số chung? d Xu hướng bật liệu gì? Đáp án trang 547

Ngày đăng: 30/09/2021, 08:21

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w