1. Trang chủ
  2. » Giáo án - Bài giảng

To chuc du lieu

24 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 799,9 KB

Nội dung

Thống kê xã hội học Khoa CTXH & PTCð Chương TỔ CHỨC DỮ LIỆU Tổ chức liệu Dữ liệu thô Tổ chức lập biểu đồ liệu định tính Tổ chức lập biểu đồ liệu định lượng Hình dáng biểu đồ tần suất Phân phối tần suất tích lũy Hiển thị thân 1 Dữ liệu thơ • Ví dụ Thu thập thơng tin tuổi 50 sinh viên ñược chọn từ trường ñại học Các giá trị liệu ñược ghi bảng theo thứ tự thu thập (tuổi SV thứ 21, tuổi SV thứ hai 19, …) 21 18 25 22 25 19 20 19 28 23 24 19 31 21 18 25 22 19 20 37 29 19 23 22 27 34 19 18 22 23 26 25 23 21 21 27 22 19 20 25 37 25 23 19 21 33 23 26 21 24 • Dữ liệu thô Dữ liệu thô liệu ñược ghi nhận theo thứ tự mà chúng ñược thu thập trước xử lý phân loại • Dữ liệu thơ cịn gọi liệu chưa nhóm lại • Tập liệu chưa nhóm lại chứa thông tin phần tử thuộc mẫu hay tổng thể Tổ chức liệu Dữ liệu thô Tổ chức lập biểu đồ liệu định tính Tổ chức lập biểu đồ liệu định lượng Hình dáng biểu ñồ tần suất Phân phối tần số tích lũy Hiển thị thân Tổ chức & biểu đồ liệu định tính • Ví dụ - Một mẫu gồm 100 sinh viên năm cuối ñược hỏi ý ñịnh họ làm việc ñâu sau tốt nghiệp Nơi làm việc Số sinh viên Cơ quan nhà nước 44 Cơ quan tư nhân 16 Cơ quan nước ngồi 23 Cơng ty 17 Tần suất • Nhận xét - Nơi làm việc sau tốt nghiệp biến định tính Các nơi làm việc phân loại loại trừ lẫn - Mỗi ý kiến sinh viên thuộc loại nơi làm việc Số SV có ý kiến thuộc loại gọi tần suất loại - Phân phối tần suất cho thấy tần suất ñược phân bố loại khác - Thu thập liệu thô Tổ chức thành bảng • Phân phối tần suất liệu định tính Phân phối tần suất liệu định tính liệt kê tất loại số phần tử thuộc vào loại • Tần suất tương đối loại TSTð loại = TS loại / Tổng TS • Phần trăm tần suất tương ñối loại Phần trăm TS = TSTð loại x 100 • Ví dụ - Một mẫu gồm 30 công nhân công ty lớn ñược hỏi mức ñộ căng thẳng công việc - Mức ñộ căng thẳng ñược phân loại căng thẳng, căng thẳng, không căng thẳng - Ta có phân phối tần suất tương đối phần trăm tần suất tương ñối bảng sau Phân phối tần suất tương ñối phần trăm Mức ñộ căng thẳng Tần suất Tần suất tương ñối Phần trăm Rất căng thẳng 10 10/30 = 0,333 33,3 Hơi căng thẳng 14 14/30 = 0,467 46,7 Không căng thẳng 6/30 = 0,200 20,0 S = 30 S = 1,000 S = 100 Tổng S Bảng phân phối tần suất bảng tần suất • Biểu đồ liệu định tính - Ta dùng biểu ñồ hình (bar graph) ñể biểu diễn phân phối tần suất loại - Ta dùng biểu đồ hình bánh (pie chart) để biểu diễn phân phối tần suất tương ñối phân phối phần trăm tần suất tương ñối loại 16 Biểu ñồ hình 14 Frequency 12 10 Very Somewhat None Strees on Job 10 None, 20% Very, 33.30% Biểu đồ hình bánh Somewhat, 46.70% Tính góc: 360 x Tần suất tương đối Ví dụ: 360 x 0,333 = 119,88 ñộ (loại căng thẳng) 11 Tổ chức liệu Dữ liệu thơ Tổ chức lập biểu đồ liệu định tính Tổ chức lập biểu đồ liệu định lượng Hình dáng biểu đồ tần suất Phân phối tần suất tích lũy Hiển thị thân 12 Tổ chức, biểu ñồ liệu ñịnh lượng • Ví dụ - Một mẫu gồm 100 cơng nhân cơng ty lớn khảo sát mức thu nhập tuần - Mức thu nhập tuần chia thành lớp nhóm Mỗi lớp khoảng bao gồm tất giá trị rơi vào hai số giới hạn giới hạn - Các lớp không chồng lắp lên Mức thu nhập tuần công nhân thuộc vào lớp mà - Số giá trị thuộc vào lớp gọi tần suất lớp Ta có phân phối tần suất lớp 13 Mức thu nhập tuần (trăm ngàn) Số công nhân 401 – 600 601 – 800 22 801 – 1000 39 1001 – 1200 15 1201 – 1400 1401 – 1600 Giới hạn Giới hạn Bảng phân phối tần suất Tần suất lớp Dữ liệu nhóm lại Lớp 14 • Phân phối tần suất liệu ñịnh lượng Phân phối tần suất liệu ñịnh lượng liệt kê tất lớp số giá trị thuộc vào lớp Dữ liệu biểu diễn dạng phân phối tần suất gọi liệu nhóm lại • Biên lớp Biên lớp xác định trung ñiểm giới hạn lớp giới hạn lớp 15 • Ví dụ Trung ñiểm = (600 + 601)/2 = 600,5 600,5 ñược gọi biên lớp thứ nhất, ñồng thời biên lớp thứ hai ðối với lớp thứ hai ta có biên 600,5 biên 800,5 • ðộ rộng lớp ðộ rộng lớp = Biên – Biên • Ví dụ ðộ rộng lớp thứ hai = 800,5 – 600,5 = 200 ðộ rộng lớp thứ ba = 1000,5 – 800,5 = 200 16 • Trung điểm lớp Tð lớp = (Giới hạn + Giới hạn trên) / • Ví dụ Trung điểm lớp thứ = (401 + 600)/2 = 500,5 Trung ñiểm lớp thứ hai = (601 + 800)/2 = 700,5 • Bằng việc tính biên lớp, ta chuyển đổi giới hạn lớp thành biên lớp trình bày liệu dạng nhóm lại 17 Giới hạn lớp Biên lớp ðộ rộng lớp Trung ñiểm lớp 401 – 600 400,5 đến 600,5 200 500,5 601 – 800 600,5 đến 800,5 200 700,5 801 – 1000 800,5 đến 1000,5 200 900,5 1001 – 1200 1000,5 đến 1200,5 200 1100,5 1201 – 1400 1200,5 đến 1400,5 200 1300,5 1401 - 1600 1400,5 đến 1600,5 200 1500,5 18 • ðể lập bảng phân phối tần suất, ta cần định ba thứ Số lớp: Tính số lớp tùy theo số lượng quan sát tập liệu, thơng thường thay đổi từ đến 20 ðộ rộng lớp: Các lớp có độ rộng khác nhau, thường người ta thích lớp có độ rộng Giới hạn lớp ñầu tiên: Số nhỏ giá trị nhỏ tập liệu làm giới hạn lớp 19 • Nếu muốn lớp có độ rộng nhau, độ rộng lớp tính cơng thức sau: ðộ rộng lớp xấp xỉ = (Giá trị lớn – Giá trị nhỏ nhất) / Số lớp Sau làm trịn độ rộng lớp xấp xỉ đến số thuận tiện để có độ rộng lớp • ðể tính số lớp dùng công thức Sturge: c = + 3,3 log n c số lớp, n số quan sát tập liệu 20 10 • Ví dụ Team Anaheim Arizona Atlanta Baltimore Boston Chicago Cubs Chicago White Sox Cincinnati Cleveland Colorado Detroit Florida Houston Kansas City Los Angeles Home Runs 152 165 164 165 177 200 217 169 192 152 124 146 167 140 155 Team Milwaukee Minnesota Montreal New York Mets New York Yankees Oakland Philadelphia Pittsburgh St Louis San Diego San Francisco Seattle Tampa Bay Texas Toronto Home Runs 139 167 162 160 223 205 165 142 175 136 198 152 133 230 187 21 • Ví dụ bảng cho thấy tổng số điểm ghi bàn mùa bóng 2002 30 đội bóng chày quốc gia Lập bảng phân phối tần số - Giả sử ta muốn nhóm liệu vào lớp có độ rộng - Tính độ rộng lớp xấp xỉ = (230 - 124) / = 21,2 Làm tròn thành số 22 cho tiện ðộ rộng lớp 22 - Giới hạn lớp ñầu tiên số 124 số nhỏ 124 Giả sử ta chọn 124 - Khi lớp 124 - 145, 146 - 167, 168 - 189, 190 - 211 212 - 233 22 11 • Bảng phân phối tần suất sau: Total Home Runs 124 – 145 146 – 167 168 – 189 190 – 211 212 - 233 Tally f |||| | |||| |||| ||| |||| |||| ||| 13 4 ∑f = 30 23 • Tần suất tương đối lớp TSTð lớp = Tần suất lớp / Tổng tần suất • Phần trăm Phần trăm = Tần suất tương ñối x 100 Total Home Runs Class Boundaries Relative Frequency Percentage 124 – 145 146 – 167 168 – 189 190 – 211 212 - 233 123,5 to less than 145,5 145,5 to less than 167,5 167,5 to less than 189,5 189,5 to less than 211,5 211,5 to less than 233,5 0,200 0,433 0,133 0,133 0,100 20,0 43,3 13,3 13,3 10,0 Sum = 0,999 Sum = 99,9% 24 12 • Biểu đồ liệu định lượng - Ta dùng biểu đồ tần suất (histogram) ña giác ñồ (polygon) ñể biểu diễn liệu định lượng nhóm lại - Biểu đồ tần suất có trục hồnh đánh dấu lớp, trục tung ñược ñánh dấu tần suất, tần suất tương ñối phần trăm lớp Chiều cao thẳng ñứng biểu diễn giá trị tần suất, tần suất tương ñối phần trăm lớp - ða giác đồ có trục hồnh trục tung biểu ñồ tần suất, biểu ñồ ñược hình thành cách nối trung ñiểm cạnh thẳng ñứng liên tiếp biểu ñồ tần suất 25 Biểu ñồ tần suất Tần suất 15 12 124 - 146 145 167 168 189 190 211 212 233 Tổng số ñiểm ghi bàn 26 13 Biểu ñồ tần suất tương ñối Tần suất tương ñối 50 40 30 20 10 124 145 146 167 168 189 190 211 212 233 Tổng số ñiểm ghi bàn 27 ða giác ñồ 15 Tần suất 12 124 145 146 167 168 189 190 211 212 233 28 14 Tần suất • Khi tập liệu trở nên lớn số lớp tăng lên nhiều Khi đường đa giác tần suất trở thành đường cong trơn mịn ðường cong ñược gọi ñường cong phân phối tần suất ñơn giản ñường cong tần suất x 29 Tổ chức liệu Dữ liệu thô Tổ chức lập biểu đồ liệu định tính Tổ chức lập biểu đồ liệu định lượng Hình dáng biểu đồ tần suất Phân phối tần suất tích lũy Hiển thị thân 30 15 Hình dáng biểu đồ tần suất • Biểu đồ tần suất có nhiều hình dáng khác Các hình dáng thông dụng bao gồm: ðối xứng Lệch phải, lệch trái ðều hình chữ nhật 31 Biểu đồ tần suất ñối xứng BðTS lệch phải (a) (a) BðTS lệch trái (b) (b) 32 16 BðTS với phân phối ñều 33 (a) (b) ðường cong tần suất ñối xứng (c) ðường cong tần suất lệch phải (d) ðường cong tần suất lệch trái 34 17 Tổ chức liệu Dữ liệu thô Tổ chức lập biểu đồ DL định tính Tổ chức lập biểu đồ DL định lượng Hình dáng biểu ñồ tần suất Phân phối tần suất tích lũy Hiển thị thân 35 Phân phối tần suất tích lũy • Trở lại ví dụ tổng số ñiểm ghi bàn mùa bóng 2002 30 ñội bóng chày quốc gia • Giả sử muốn biết có đội bóng có tổng số điểm ghi bàn 189 mùa bóng 2002 • Có thể trả lời câu hỏi cách dùng phân phối tần suất tích lũy 36 18 • Phân phối tần suất tích lũy Phân phối tần suất tích lũy cho biết tổng số giá trị nhỏ biên lớp Class Limits Class Boundaries 124 – 145 124 – 167 124 – 189 124 – 211 124 – 233 123,5 to less than 145,5 123,5 to less than 167,5 123,5 to less than 189,5 123,5 to less than 211,5 123,5 to less than 233,5 Cumulative Frequency 6 + 13 = 19 + 13 + = 23 + 13 + + = 27 + 13 + + + = 30 37 • Tần suất tương ñối tích lũy TSTð tích lũy = TS tích lũy lớp / Tổng số quan sát tập liệu • Phần trăm tích lũy Phần trăm tích lũy = TSTð tích lũy x 100 Class Limits Cumulative Relative Frequency Cumulative Percentage 124 – 145 124 – 167 124 – 189 124 – 211 124 - 233 6/30 = 0,200 19/30 = 0,633 23/30 = 0,767 27/30 = 0,900 30/30 = 1,000 20,0 63,3 76,7 90,0 100,0 38 19 • ðường cong phân phối tần suất tích lũy - ðường cong phân phối tần suất tích lũy biểu diễn phân phối tần suất tích lũy - ðường cong vẽ cách nối điểm có hồnh ñộ biên lớp tung ñộ tần số tích lũy tương ứng với lớp • Chú ý phân phối tần suất tích lũy áp dụng cho liệu ñịnh lượng 39 ðường cong phân phối tần suất tích lũy Tần suất tích lũy 30 25 20 15 10 123,5 145,5 167,5 189,5 211,5 233,5 Tổng số ñiểm ghi bàn 40 20 Tổ chức liệu Dữ liệu thơ Tổ chức lập biểu đồ DL định tính Tổ chức lập biểu đồ DL định lượng Hình dáng biểu đồ tần suất Phân phối tần suất tích lũy Hiển thị thân 41 Hiển thị thân • Một kỹ thuật khác dùng ñể biểu diễn liệu ñịnh lượng ñược gọi thân • Hiển thị theo kiểu thân lá, giá trị ñược chia thành hai phần thân • Ví dụ sau tập liệu ñiểm kiểm tra thống kê 30 sinh viên cao ñẳng 75 52 80 96 65 79 71 87 93 95 69 72 81 61 76 86 79 68 50 92 83 84 77 64 71 87 72 92 57 98 42 21 • Biểu diễn theo kiểu thân ñiểm kiểm tra Thân 5 9 7 1 Lá giá trị 96 7 Lá giá trị 98 43 • Biểu diễn theo kiểu thân ñiểm kiểm tra sau ñược xếp lại 1 2 1 3 9 7 44 22 • Sau biểu diễn thân số làm việc máy tính tháng vừa qua 25 sinh viên • Biểu diễn thân cách nhóm thân lại thành lớp thân 2 6 9 45 • Biểu diễn thân nhóm thân lại 0–2 3–5 6–8 * * * 9 * 4 * * Dấu * dùng để tách nhóm ứng với thân nằm lớp thân Trường hợp khơng có ứng với thân nằm lớp thân ta vẽ hai dấu * liên tiếp 46 23 Tóm lại, tìm hiểu … Dữ liệu thô Tổ chức lập biểu đồ DL định tính Tổ chức lập biểu đồ DL định lượng Hình dáng biểu ñồ tần suất Phân phối tần suất tích lũy Hiển thị thân 47 Cám ơn ! 48 24 ... 124 – 167 124 – 189 124 – 211 124 – 233 123,5 to less than 145,5 123,5 to less than 167,5 123,5 to less than 189,5 123,5 to less than 211,5 123,5 to less than 233,5 Cumulative Frequency 6 + 13... tương ñối x 100 Total Home Runs Class Boundaries Relative Frequency Percentage 124 – 145 146 – 167 168 – 189 190 – 211 212 - 233 123,5 to less than 145,5 145,5 to less than 167,5 167,5 to less than... 189,5 to less than 211,5 211,5 to less than 233,5 0,200 0,433 0,133 0,133 0,100 20,0 43,3 13,3 13,3 10,0 Sum = 0,999 Sum = 99,9% 24 12 • Biểu đồ liệu ñịnh lượng - Ta dùng biểu ñồ tần suất (histogram)

Ngày đăng: 06/04/2021, 22:33

w