Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 12 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
12
Dung lượng
5,52 MB
File đính kèm
CHUONG3.rar
(5 MB)
Nội dung
CHƯƠNG 3: MÔ TẢ DỮ LIỆU BẰNG ĐỒ THỊ Đồ 3.1 3.2 3.3 3.4 thị lượng biến định Tổ chức đồ Đa giác tần suất Sơ đồ cành Hình dạng đặc trưng Đồ thị biến định tính 3.5 Biểu đồ Sự hiểu lầm đồ thị 3.6 Một số mánh lới 3.7 Tự vẽ đồ thị Tóm tắt/Thuật ngữ quan trọng/Bài tập ôn Tổng quan Đồ thị hỗ trợ thêm cho việc phát kiểu liệu-ví dụ phân phối có cân đối hay không, phân phối số IQ dân số, hay bị lệch phân phối giàu có người Mỹ Bởi đồ thị tóm tắt thông tin cách hiệu để truyền đạt cho người khác, đồ thị trở thành kết cuối phân tích thông kê đơn giản Đồ thị, trình bày rõ phần tiếp theo, không mô tả tập hợp quan sát thực mà trình bày phân phối lý thuyết quan trọng thống kê Dữ liệu mô tả cách rõ ràng, xác, hoàn chỉnh phân phối tần suất xây dựng tốt Và liệu mô tả cụ thể hơn, đặc biệt bạn trình bày kết với đối tượng ngành, cách chuyển phân phối tần suất thành đồ thị Chương trình bày số loại đồ thị phổ biến dành cho biến định lượng định tính Đồ thị lượng cho biến định 3.1 Tổ chức đồ Phân phối tần suất mô tả bảng 2.2 trang 23 trình bày dạng tổ chức đồ hình 3.1 Khi quan sát, nhận thấy mật độ tập trung trọng lượng nhóm 150-159, 160-169, 170-179 có xu hướng trải dài phía trọng lượng nặng Chúng ta xem xét số đặc điểm quan trọng tổ chức đồ Các đơn vị trục hoành thể nhóm phân phối tần suất Các đơn vị trục tung thể tần suất tăng dần phân phối tần suất (các đơn vị trục tung trục hoành không kích cỡ) Giao hai trục quan sát có trọng lượng tần suất không Các số tăng dần từ trái qua phải trục hoành từ thấp đến cao trục tung Hai gạch chéo trục hoành dùng để ngăn cách giá trị nhóm nhỏ phân phối (130-139) Phần đồ thị bao gồm nhiều cột có độ cao tần suất nhóm Các cột liên tục có chung đường biên muốn nói lên biến liên tục Sẽ có đồ thị có khoảng cách cột Các loại đồ thị dùng để mô tả cho biến định lượng rời rạc hay biến định tính Tập hợp số trục hoành hình 3.1 thay vài số thuận tiện, khung A hình 3.2 Sự thay nhằm tránh làm rối mắt đọc thông tin trục hoành 3.2 Đa giác tần suất Một dạng quan trọng khác tổ chức đồ đa giác tần suất, hay gọi đồ thị đường thẳng Đa giác tần suất lập trực tiếp từ tổ chức đồ Tuy nhiên, lập đa giác tần suất theo bước khung hình hình 3.2 A Khung A biểu diễn tổ chức đồ cho phân phối trọng lượng B Chấm điểm cột (nếu nhóm có tần suất lấy điểm nhóm trục hoành), sau nối lại với C Tạo nên đa giác tần suất cách nối vào trục hoành Đối với đuôi trên, nối điểm cột tần suất nhóm 240-249 với điểm trục hoành thuộc nhóm (250-259) Tương tự, đuôi nối điểm cột tần suất nhóm cuối (130-139) phân phối với nhóm nhỏ (120-129) D Cuối xoá tất tổ chức đồ, để lại đa giác tần suất So sánh hai phân phối tần suất Đa giác tần suất hiệu hai hay nhiều phân phối tần suất vẽ đồ thị Hình 3.3 trang 49 miêu tả hai phân phối điểm GPA nhóm sinh viên có động não tập 2.11 trang 39 Có biến thiên đáng kể hai phân phối Điểm khác biệt đáng nghi ngờ mật độ đỉnh nhóm có động não cao đơn vị so với nhóm lại Chúng ta nên quan tâm hay bỏ qua khác biệt này? Các kỹ thuật thống kê phân tích giúp giải vấn đề Bài tập 3.1: Phân phối tần suất sau mô tả thu nhập hàng năm nhóm sinh viên trường Thu nhập Tần suất 130,0001 139,999 120,0000 129,000 110,0001 119,999 100,0003 109,999 90,000-99.999 80,000-89,999 70,000-79,999 60,000-69,999 10 50,000-59,999 14 40,000-49,999 23 30,000-39,999 17 20,000-29,999 10 10,000-19,999 0-9,999 Tổng 103 a Lập bảng phân phối tần suất (Chú ý cần thiết chuỗi nhóm nêu lên phân phối Muốn biết hướng dẫn bước xin xem bảng “ Xây dựng đồ thị” trang 58) b Lập đa giác tần suất c Hình dạng phân phối cân đối hay bị lệch? 3.3 Sơ đồ cành Có phương pháp khác để tóm tắt liệu định lượng sơ đồ cành Về bản, sơ đồ giao phân phối tần suất tổ chức đồ Sơ đồ tạo nhằm tóm tắt cho phân phối liệu liệu trọng lượng, mà không phá hỏng đặc tính quan sát Lập sơ đồ Phần khung bên trái bảng 3.1 cân nặng 53 sinh viên lớp thống kê bảng 1.1 Tiếp theo cột số từ 13 đến 24 tượng trưng cho giá trị cân nặng theo hàng chục Cột gọi cành Vẽ đường thẳng chia cành với giá trị nằm hàng chục Ví dụ, bội số 13 có 133, 135, 135 Đối chiếu với tổ chức đồ Trong hình 3.4, nhận thấy quay ngược chiều kim đồng hồ phần tư vòng tròn sơ đồ cành, ta hình dạng tương tự tổ chức đồ (cần ý việc đối chiếu có giá trị giá trị cành phải xếp theo thứ tự từ thấp lên cao ) Lựa chọn cành Các giá trị cành không giới hạn hàng chục Phụ thuộc vào số liệu, tạo nên cành hàng trăm, hàng nghìn, hay chí số thập phân Ví dụ, thu nhập năm 23,784$ tạo nên cành 23 (hàng nghìn) 784 điểm kiểm tra miệng SAT 684 tạo nên cành (hàng trăm) 84 GPA 3.25 biểu diễn cành (hàng đơn vị) 25… Sơ đồ cành thường sử dụng báo cáo thức hay ấn bản, lại bác só sử dụng nhiều Bài tập 3.2 xây dựng sơ đồ cành cho nhóm trẻ tuổi sau 120 98 118 117 99 111 126 85 88 124 104 113 108 141 123 137 78 96 102 132 109 106 143 Đáp án trang 548 3.4 Các dạng đồ thị đặc trưng Cho dù trình bày dạng tổ chức đồ, đa giác tần suất hay cành lá, đặc tính quan trọng phân phối tần suất hình dạng Hình 3.6 trình bày số hình dạng đặc trưng đa giác tần suất Dạng bình thường Bất phân phối có hình dạng tương tự khung A hình 3.5 phân tích, trình bày chương chương 7, với hỗ trợ đường cong bình thường biết kỹ Hình dạng đường cong bình thường áp dụng cho nhiều phân phối chẳng hạn phân phối tần suất ví dụ điểm thi test chuẩn, giai đoạn thai nghén liên tục bào thai người… Nhị yếu vị Bất phân phối có hình dạng giống khung B hình 3.5 cho thấy có đồng tồn hai loại quan sát khác phân phối Ví dụ, phân phối độ tuổi cư dân khu vực bao gồm phần lớn gia đình gồm cặp vợ chồng đứa có dạng nhị yếu vị Phân phối làm rõ phần 4.1 Dạng lệch dương Hai dạng lại khung C D dạng bị lệch Những phân phối bị lệch phân phối có số quan sát với giá trị tương đối lớn, khung hình C gọi lệch dương phân phối có số quan sát có giá trị lớn nằm phía chiều dương (nằm bên phải phần lớn quan sát) Phân phối thu nhập gia đình Mỹ phân phối có hình dạng lệch dương đa phần gia đình có mức thu nhập 100.000 $ có số gia đình có số thu nhập lớn nhiều 100.000 $ Phân phối trọng lượng hình 3.1, 3.2, 3.3 lệch dương Dạng lệch âm Những phân phối bị lệch có số quan sát có giá trị nhỏ, khung hình D hình 3.5, gọi lệch âm quan sát cực nằm phía chiều âm (nằm phía trái phần lại phân phối) Phân phối tuổi hưu Mỹ phân phối lệch âm đa phần hưu độ tuổi 60 hay lớn có số hưu độ tuổi 60 mà Lệch dương hay lệch âm? Một số người gặp khó khăn xác định tên gọi cho phân phối lệch dương hay lệch âm việc gọi tên phân phối dựa vào vị trí tương đối giá trị cực dựa vị trí tương đối đa số quan sát Vì vậy, để tránh lầm lẫn nên tập trung vào vị trí quan sát cực Nếu lầm lẫn sử dụng khung C D hình 3.6 để làm mẫu Bài tập 3.3 Hãy mô tả hình dạng phân phối sau a) Điểm thi vẻ đẹp phụ nữ kiểm tra tính đàn ông, điểm cao nghóa mức đàn ông tính cao b) Điểm test IQ chuẩn nhóm người chọn từ dân số chung c) Điểm kiểm tra nhóm học sinh trung học làm kiểm trình độ đại học khó d) Điểm đọc đạt lớp 04 có số học sinh bình thường khuyết tật e) Điểm sinh viên trường nhạc Eastman test khiếu âm nhạc Đáp án trang 548 Đồ thị cho biến định tính 3.5 Đồ thị Phân phối bảng 2.8 (trả lời câu hỏi “bạn có hút thuốc marijuana chưa?” trình bày dạng đồ thị hình 3.6 Nhìn vào đồ thị ta thấy câu trả lời Yes gần gấp đôi so với trả lời No Tương tự tổ chức đồ, trục hoành bao gồm chữ hay lớp khác sử dụng liệu định tính, trục tung trình bày gia tăng tần suất Các cột đồ thị tượng trưng cho tần suất chữ hay lớp liệu định tính Một câu trả lời người việc bạn có hút thuốc marijuana chưa yes no 60% yes 40% no Khoảng cách phản ánh chất gián đoạn biến định tính Vì dùng tổ chức đồ đa giác tần suất để mô tả biến định tính Tuy nhiên, lại dùng đồ thị để mô tả biến định lượng nhằm nhấn mạnh đến tính không liên tục biến rời rạc, ví dụ số gia đình Bài tập 3.4 dựa khung “xây dựng đồ thị” trang 58 để lập đồ thị cho bảng số liệu Nguồn gốc Tây Ban Nha dân số Mỹ (tính theo triệu) Nguồn gốc Tần suất Mỹ gốc Châu Phi 33.9 Mỹ gốc Châu 13 Tây ban nha 35.3 Da trắng 194.6 Tổng 276.8 Nguồn: Trích từ thống kê Mỹ 2001 Đáp án trang 548 Hiểu sai đồ thị 3.6 Một số bẫy Đồ thị lập sai lệch để phục vụ số mục đích Ví dụ đồ thị hình 3.7 có số sai lầm Thứ độ rộng cột giá trị yes lớn so với cột giá trị no, điều vi phạm quy tắc cột tần số phải có độ rộng cột Thứ hai, giới hạn thang đo tần suất đồ thị, điều vi phạm quy tắc phải liệt kê tất giá trị thang đo phải bắt đầu số thứ ba chiều dài trục tung lại lớn độ dài trục hoành, điều vi phạm quy tắc độ dài trục tung trục hoành phải gần Vì vậy, đọc đồ thị cần cẩn thận để không bị đánh lừa 3.7 Các bước để lập đồ thị Sau bảng hướng dẫn bước để lập đồ thị Bảng hướng dẫn Quyết định loại đồ thị, cần nhớ tổ chức đồ đa giác tần suất sử dụng cho biến định lượng đồ thị sử dụng cho biến định tính sử dụng với biến định lượng rời rạc Dùng thước vẽ trục tung trục hoành, cần nhớ trục tung phải độ dài với trục hoành Xác định nhóm vẽ lên trục hoành Đối với liệu định tính hay liệu chưa nhóm, điều điều dễ dàng-chỉ cần sử dụng lớp liệu Đối với biến định lượng nhóm, làm tương tự tạo nhóm cho bảng phân phối tần suất Gắn nhóm (với khoảng cách đồ thị thanh) dọc theo chiều dài trục hoành Đối với tổ chức đồ đa giác tần suất, có sai lầm cần sử dụng bút chì Không sử dụng nhóm trống để nối nhóm với giá trị gốc đồ thị Thay vậy, sử dụng đường cắt ngang để đánh dấu khoảng gián đoạn đó, sau điền nhóm nhỏ Đối với trục tung áp dụng tương tự Điền giá trị lên trục tung, giá trị kết thúc số > = giá trị quan sát lớn Nếu có khoảng cách đáng kể gốc đồ thị giá trị quan sát nhỏ nhất, cần gạch chéo khoảng cách Sử dụng trục đo lường, lập (hay điểm đường thẳng) để phản nh tần suất quan sát nhóm Đối với đa giác tần suất, chấm điểm điểm khoảng, hai đuôi đồ thị nên cố định trục hoàng, mô tả mục 3.2 Dán nhãn cho trục tung trục hoành (hay câu ghi chú) cho đồ thị Bài tập 3.6 Sau kết chương trình Minitab trình bày tổ chức đồ số điểm GPA sinh viên trung học 2.11 (a) Tần suất quan sát nhóm có điểm 3.30? 10 (b) Tổ chức đồ có hình dạng gì? Đáp án trang Tóm tắt Phân phối tần suất chuyển thành đồ thị Nếu liệu định lượng, sử dụng tổ chức đồ, đa giác tần suất, sơ đồ cành Tổ chức đồ chuyển thành đa giác tần suất cách nối điểm tổ chức đồ sau xóa bỏ phần lại Đa giác tần suất có ích trường hợp trình bày hai hay nhiều phân phối tần suất đồ thị Sơ đồ cành sử dụng bước đầu trình tóm tắt dùng thiết bị đời cũ Hình dạng đặc trưng quan trọng tổ chức đồ đa giác tần suất Các đa giác tần suất không gấp khúc sử dụng để mô tả bốn loại hình dạng đặc trưng: dạng cân đối, nhị yếu vị, lệch dương lệch âm Đồ thị thường sử dụng cho biến định tính biến định lượng rời rạc Đồ thị tương tự tổ chức đồ có khoảng cách Khi diễn giải đồ thị, cần lưu ý cách vẽ sai lầm ví dụ tỷ lệ hai trục tung hoành chênh lệch lớn với mục đích phóng đại kết Khi muốn lập đồ thị, nên xem lại bước hướng dẫn lập đồ thị Các thuật ngữ quan trọng Tổ chức đồ Nhị yếu vị Đa giác tần suất Phân phối lệch dương Phân phối lệch âm Sơ đồ cành Dạng bình thường Đồ thị 11 BÀI TẬP ÔN 3.7 (a) Vẽ tổ chức đồ, đa giác tần suất, sơ đồ cành liệu tập 2.2 (b) Mơ tả hình dạng phân phối 3.8 (a) Vẽ tổ chức đồ phân phối tần suất tập 2.12 Lưu ý, vẽ nhóm >= phân phối tương tự nhóm cịn lại (b) Mơ tả hình dạng tổ chức đồ 3.9 (a) Vẽ đa giác tần suất sơ đồ cành cho liệu tập 2.10 (b) Mơ tả hình dạng đồ thị 3.10 (a) Vẽ đa giác tần suất cho phân phối tần suất tương đối tập 2.5 (b) Mơ tả hình dạng đồ thị 3.11 Chỉ sử dụng đồ thị, vẽ đa giác tần suất cho hai phân phối tần suất tương đối tập 2.14 3.12 Chỉ sử dụng đồ thị, vẽ đồ thị cho phân phối lĩnh vực nghiên cứu sinh viên nam tốt nghiệp sinh viên nữ tốt nghiệp năm 1998 tập 2.15 lưu ý: sử dụng trắng cho nam tô màu cho nữ 12 ... phân phối tần suất thành đồ thị Chương trình bày số loại đồ thị phổ biến dành cho biến định lượng định tính Đồ thị lượng cho biến định 3.1 Tổ chức đồ Phân phối tần suất mô tả bảng 2.2 trang 23 trình... cách phản ánh chất gián đoạn biến định tính Vì dùng tổ chức đồ đa giác tần suất để mô tả biến định tính Tuy nhiên, lại dùng đồ thị để mô tả biến định lượng nhằm nhấn mạnh đến tính không liên tục... tần suất sơ đồ cành cho liệu tập 2.10 (b) Mơ tả hình dạng đồ thị 3.10 (a) Vẽ đa giác tần suất cho phân phối tần suất tương đối tập 2.5 (b) Mơ tả hình dạng đồ thị 3.11 Chỉ sử dụng đồ thị, vẽ đa