TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN – ĐẠI HỌC QUỐC GIA TPHCM KHOA BÁO CHÍ VÀ TRUYỀN THÔNG THỐNG KÊ CHO KHOA HỌC XÃ HỘI Chủ đề Thống kê mô tả Giảng viên hướng dẫn ThS Trịnh Thị Nhài Nhóm thực hi[.]
TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN – ĐẠI HỌC QUỐC GIA TPHCM KHOA BÁO CHÍ VÀ TRUYỀN THÔNG THỐNG KÊ CHO KHOA HỌC XÃ HỘI Chủ đề: Thống kê mô tả Giảng viên hướng dẫn: ThS Trịnh Thị Nhài Nhóm thực hiện: Lelet Girls Thống kê mơ tả (Descriptive statistics) I Tìm hiểu chung Khái niệm Thống kê mô tả phương pháp liên quan đến việc tổ chức, tổng hợp trình bày số liệu thu thập từ mẫu nghiên cứu tổng thể Mục đích Một lý sử dụng phương pháp thống kê để tổng hợp mô tả liệu, làm cho thông tin trình bày rõ ràng Giải thích rõ hơn: Tổng thể: Ta hiểu tổng thể toàn đối tượng mà ta nghiên cứu, đối tượng gọi phần tử tổng thể số phần tử gọi kích thước tổng thể Khi nghiên cứu tổng thể ta không nghiên cứu trực tiếp tổng thể mà thơng qua hay nhiều dấu hiệu đặc trưng tổng thể II Phương pháp thống kê mô tả dạng bảng Phân phối tần suất a Khái niệm Phân phối tần suất: bảng trình bày số lần xuất hay nhiều giá trị quan sát mẫu tổng thể b Các kiểu phân phối tần suất - Mô tả liệu thô (raw) - Phân bổ tần số: biểu diễn dạng tỉ lệ (proportion) phần trăm (percent) - Phân bổ tần số lũy tiến (cumulative) Ví dụ: Giả sử muốn điều tra lượng khách công ty du lịch A năm 2020, nhân viên thu thập bảng số liệu (BSL) sau: Tháng Số Khách 43 55 43 52 55 51 55 11 52 10 43 11 55 12 88 - Phần hàng ngang thứ thể 12 tháng năm - Phần hàng ngang thứ thể cho số khách đón tháng => Nhìn vào BSL ta thấy thông tin ban đầu Tuy nhiên BSL thô, từ BSL này, ta phải phân tích, tổng hợp tính giá trị đặc trưng khác, từ có kết luận xác, cách nhìn tồn diện dấu hiệu đó, kết mà điều tra - Giá trị dấu hiệu: số liệu bảng: ký hiệu i - Tần số: giá trị số xuất giá trị BSL - Lưu ý: Trong BSL có số liệu tổng tần số phải số => Tổng tần số số số liệu,ký hiệu n - Tần suất giá trị kí hiệu fi tỉ số tần số tổng tần số Đơn vị % Ký hiệu fi - Tổng tần suất 100% c Một số ký hiệu sử dụng tính tốn phân phối tần suất n = tổng số mẫu quan sát X = biến i = giá trị (thành phần) biến X fi = tần suất quan sát giá trị i d Bảng phân phối tần suất nên bao gồm: - Tiêu đề mô tả nội dung bảng - Tên biến - Nhãn giá trị cho thành phần biến - Tổng quan sát mẫu - Khai báo nguồn liệu Các dạng bảng phân phối tần suất a Bảng phân phối tần suất thô Bảng phân phối tần suất thô bảng phân phối với liệu chưa qua xử lý, tính tốn Chưa thể nhiều lượng thơng tin Bảng phân phối tần suất thô ví dụ Các số liệu chưa qua bước tính tốn mà dừng lại thao tác đếm đơn Bảng Loại nước ưa thích sinh viên lớp 12A2 Loại nước Số đếm Tần suất thích (Tally) (Frequency) Coca - Cola 4 Pepsi 2 Khác 24 24 Tổng (n) 30 30 Nguồn: Khảo sát lớp học 12A2, tháng 12, năm 2019 b Bảng phân phối tần suất liên hệ Đối với bảng phân phối tần suất liên hệ, lập bảng với thông tin sau: - Cột thứ liệt kê tất biểu có đối tượng theo đặc điểm ta muốn lập bảng tần số để tóm tắt liệu - Cột thứ hai cột tần suất điền số liệu cách đếm xem quan sát có biểu Tổng cột tần số phải số quan sát tập liệu - Cột thứ ba cột %tỉ lệ Các % tỉ lệ tính cách lấy tần số chia cho tổng số quan sát tập liệu - Cột thứ tư cột %tần suất % tần suất tính cách lấy tần số chia cho tổng số quan sát tập liệu, đem kết nhân cho 100%, ghi vào cột tần suất vị trí tương ứng hàng, nhằm so sánh xem so với tổng số quan sát số đơn vị có biểu chiếm % Bảng Loại nước ưa thích sinh viên lớp 12A2 Nguồn: Khảo sát lớp học 12A2, tháng 12, năm 2019 Công thức: Tần suất phần trăm: %i = fi/n * 100 Tần suất tỉ lệ: pi = fi/n c Bảng phân phối tần suất lũy tiến Ngoài liệu định lượng định tính dạng thứ bậc, thiết lập bảng tần số xây dựng thêm cột tần số tích lũy cột cột tần suất tích lũy để cung cấp thêm thơng tin cho người đọc - Tần số tích lũy số liệu tổng cộng thể số quan sát có giá trị bé (hoặc bằng) giới hạn tổ mà nằm hàng tiêu thức thống kê quan tâm xếp theo trật tự tăng dần giá trị) Dữ liệu cột tần số tích lũy tính cách cộng dồn tần số từ xuống vị trí tương ứng với biểu mà ta muốn tính tần số tích lũy - Tần suất tích lũy số liệu tổng cộng thể tỷ lệ % số quan sát có giá trị bé (hoặc bằng) giới hạn tổ mà nằm hàng (khi tiêu thức thống kê quan tâm xếp theo trật tự tăng dần giá trị) Dữ liệu cột tần suất tích lũy tính cách cộng dồn tần suất từ xuống vị trí tương ứng với biểu mà ta muốn tính tần suất tích lũy Để cảm nhận giá trị thơng tin mà cột tần số tích lũy tần suất tích lũy cung cấp nghiên cứu ví dụ sau Ví dụ: Người ta khảo sát 30 gia đình số người hộ gia đình họ, số liệu thu liệu định lượng dạng biểu hiện, bảng tần số lập với cột thơng tin tần số tích lũy tần suất tích lũy Bảng 3: Số người hộ gia đình Nguồn: Khảo sát thơn 1, tháng 12, năm 2018 Nếu muốn biết có phần trăm số hộ điều tra có 10 thành viên, tìm hàng mang giá trị 10 cột thứ nhất, tham chiếu sang cột tần suất tích lũy ta giá trị 89,99 Như gần 90% hộ gia đình hỏi có 10 thành viên, tương ứng với số tuyệt đối 27 hộ gia đình Cột tần số tần suất cho biết 30 hộ điều tra, tình trạng phổ biến có từ đến thành viên gia đình, gặp hộ có người hay gặp hộ có 10 người Ngồi ta tham khảo thêm số kiểu bảng thống kê sau: d Bảng phân phối tần suất cho biến có thang đo thứ bậc Bảng 4: Học lực học sinh lớp 11A7 Nguồn: Khảo sát lớp học 11A7, tháng 11, 2020 e Bảng phân phối tần suất cho biến có thang đo khoảng cách – tỉ lệ Bảng 5: Danh sách sinh viên lớp TK04 với điểm trung bình chung năm học Một số câu hỏi thêm: Dữ liệu thơ gì? Dữ liệu thơ (raw data) hay liệu sơ cấp bảng liệu thu thập từ nguồn Bạn tưởng tượng, liệu thô thu thập từ nguồn đó, bảng tính với: Hàng: Tên đối tượng Cột: Chứa biến, mô tả thuộc tính đối tượng Đây liệu chưa qua xử lý Điều có nghĩa liệu thô chưa “làm sạch”, bỏ qua giá trị ngoại biên, loại bỏ lỗi đọc nhập liệu Nói chung, chưa thực phân tích nào, khơng bị can thiệp thao tác khác từ phần mềm hay người Ta sử dụng bảng phân phối tần suất nào? Trong nhiều trường hợp, giá trị biến có lặp lại Mặt khác điều ta quan tâm không phần tử có giá trị mà ta cịn muốn tìm hiểu có phần tử có giá trị cho (phân phối biến) Trong trường hợp bảng phân phối tần số và/hay tần suất sử dụng III - Mơ tả độ tập trung biến (Central tendency) Yếu vị (Mode): Là Giá trị xuất nhiều lần tập liệu Mode sử dụng cho tất loại thang đo Mode không chịu ảnh hưởng giá trị ngoại lệ (giá trị đầu cuối dãy phân phối) VD: 6 9 9 9 mode = (số 3: lần, số 6: lần, số 9: lần) - Mode khơng tồn dãy phân phối, đơi khơng tìm số mode có nhiều số mode VD: Tập liệu khơng có mode: Tập liệu có mode: 2 3 Cách xác định mode: Trường hợp liệu khơng phân nhóm =>> Mode giá trị có tần số lớn Trung vị (Median) – Me: giá trị đứng tập liệu - Giá trị chia tập quan sát thành phần nhau, 50% số quan sát tập liệu có giá trị bé giá trị trung vị 50% lớn giá trị trung vị - Chú ý: Muốn xác định trung vị, quan sát tập liệu trước tiên phải xếp theo trật tự (từ nhỏ đến lớn hay ngược lại) => khơng tính tốn giá trị trung vị cho biến có thang đo danh nghĩa Cơng thức xác định vị trí trung vị: Median x: (n + 1)/2 - Nếu n số lẻ, số trung vị quan sát vị trí thứ (n + 1)/2 tập liệu - Trong trường hợp n số chẵn: số trung vị giá trị trung bình cộng quan sát nằm vị trí tập liệu (Tức quan sát vị trí thứ n/2 quan sát pử vị trí thứ [(n + 2)/2].) Ví dụ 1: [(6 + 1)/2]= 3.5 => Giá trị trung vị rơi vào giá trị quan sát thứ thứ tập liệu Ví dụ 2: 63 68 70 78 70 67 57 60 69 74 59 65 55 70 72 69 70 65 65 74 69 65 63 59 75 68 68 65 65 72 Bước 1: xếp thứ tự tập liệu 55 57 59 59 60 63 63 65 65 65 65 65 65 67 68 68 68 69 69 69 70 70 70 70 72 72 74 74 75 78 Bước 2: xác định vị trí trung vị Median x: (30+1)/2 = 15,5 - Giá trị trung vị nằm vị trí thứ 15 (68) thứ 16 (68) tập liệu xếp Giá trị trung vị = (68+68)/2 = 68 Chú ý: - Khi xác định trung vị, nhiều người hay lẫn lộn vị trí trung vị giá trị trung vị Hãy nhớ rằng, ta xác định vị trí trung vị trước để biết trung vị quan sát nào, sau xem quan sát có giá trị giá trị trung vị - Đối với biến có thang đo thứ bậc: sử dụng bảng phân phối tần suất lũy tiến để xác định giá trị trung vị - Giá trị trung vị giá trị có phần trăm lũy tiến lớn gần kể tỷ lệ 50 % Trung bình cộng (Mean): tính cách cộng tất giá trị quan sát tập liệu chia cho tổng số quan sát Trung bình cộng đại lượng số mơ tả độ tập trung liệu sử dụng phổ biến Có hai loại số trung bình cộng là: + Trung bình cộng đơn giản (mean) + Trung bình cộng có trọng số (weight mean) a Trung bình cộng đơn giản x= ∑ xi n Trong đó: x trung bình cộng đơn giản n số quan sát hay cỡ mẫu xi giá trị quan sát thứ i Ví dụ: Điểm thi Anh văn 10 em học sinh là: 3, 4, 2, 6, 7, 8, 9, 5, 6, Ta có trung bình cộng ( điểm thi trung bình 10 học sinh này) là: x= (3++ 4+ 2+ 6+7+ 8+9+5+6+ 8) =5.8 10 b Trung bình cộng có trọng số Khi ta áp dụng cơng thức tính trung bình cộng đơn giản giả định quan sát tập liệu có tầm quan trọng ngang nhau, nhiên có tình giá trị quan sát có tầm quan trọng khác nhau, lúc phải dùng trọng số thể mức độ quan trọng áp dụng cơng thức tính trung bình cộng có trọng số x w= ∑w i x i Σw i Trong đó: xi giá trị quan sát thứ i wi trọng số tương ứng xw trung bình cộng có trọng số Ví dụ: Điểm số trung bình sinh viên năm khoa Báo chí sau học kỳ với mơn đại cương có tín khác Để tính điểm trung bình học tập ta nhân điểm kết thúc mơn học với số tín tương ứng, cộng kết lại đem chia cho tổng số tín đưa Mơn học Pháp luật đại cương Xã hội học Tâm lý học Triết học Mác-Lênin Môi trường phát triển xw = Số tín (wi) 2 Điểm (xi) 7.5 8.5 8.0 7.0 8.0 ( 2∗7.5 ) + ( 2∗8.5 ) + ( 2∗8 ) + ( 3∗7 ) +(2∗8) 85 = =7.73 2+2+2+3+2 11 c Tác động giá trị ngoại lệ lên số trung bình cộng: Trung bình cộng tồn nhược điểm lớn nhảy cảm với giá trị ngoại lệ (đột biến) – giá trị lớn hay nhỏ Do đó, liệu chúng có xuất giá trị ngoại lệ làm cho giá trị trung bình tính khác so với chất nó, làm sai lệch cảm nhận mức độ tập trung tập liệu Chẳng hạn ví dụ sau: Trong tình có giá trị ngoại lệ làm ảnh hưởng đến cảm nhận mức độ tập trung vậy, đại lượng thứ hai mô tả độ tập trung tập liệu số trung vị Để giúp “điều chỉnh” sai lệch chúng sử dụng đồng thời với số trung bình cộng d Khơng tính đại lượng trung bình cho liệu định danh: Một nhầm lẫn thường gặp phải tính tốn đại lượng cho liệu đo lường thang định danh Chứng minh sau: Một nhà may điều tra nhóm khách hàng để xác định người ta yêu thích màu vải đen, trắng màu khác Dữ liệu định danh sau mã hóa thành: = đen = trắng = màu khác Thông tin phản hồi khách hàng là: 1, 2, 3, 2, 3, 3, x= Σ x 1+2+3+ 2+ 3+3+1 15 = = 2.14 = n Từ kết cho thấy khách hàng thích màu kết hợp màu trắng màu khác màu đen phần trắng chiếm nhiều Kết không với thực tế khơng tính điểm trung bình cho liệu thang định danh Do đó, ta cần nhận thức rõ cấp bậc liệu làm trước tính tốn đại lượng thống kê mơ tả e Có nên cân nhắc việc tính trung bình cho liệu định lượng đo thang đo khoảng? Hiện có nhiều điểm bất đồng nhà thống kê có nên tính trung bình cho liệu định lượng đo thang đo khoảng hay khơng Ví dụ: Ta dùng thang đo điểm để đánh giá quan điểm khách hàng chương trình truyền hình u thích, nội dung thang đo gồm: Rất thích Thích Bình thường Khơng thích Ghét Điểm đánh giá trung bình tính cần phải so sánh ghi thơng tin hai nhóm tính tốn trung bình cho biến đo thang đo khoảng, để so sánh phải có hai giả định: + Xem khoảng cách đánh giá với khoảng cách 3, bên tình nhóm hai có khoảng cách tương tự nhóm Xét mặt số học đúng, xét vấn đề mà thang đo đánh giá điểm cách biệt thích thích có với thích bình thường khơng? Nếu thật khơng bằng, việc so sánh hai trị trung bình đo lường thang đo khoảng có thật phù hợp? Trên thực tế, thấy tình giá trị trung bình tính tốn phục cho việc đưa định nhiều bất cập, hạn chế Để điều chỉnh nó, ta dùng trung vị làm số đo lường cho mức độ tập trung tập liệu Bài tập Câu 1: Xạ thủ A B thi bắn súng, người bắn 10 phát, kết điểm sau: A B 6 10 10 10 10 10 Tính điểm trung bình xạ thủ xem bắn tốt hơn? Giải: Áp dụng cơng thức tính trung bình cộng, ta có: 6+5+10+ 8+ 7+9+7 +10+6+5 =7.3 10 3+6+9+ 10+10+8+10+ 9+7+8 =8 Điểm trung bình xạ thủ B là: 10 Điểm trung bình xạ thủ A là: Qua hai kết ta xác định xạ thủ B bắn tốt xạ thủ A Câu 2: Cho bảng phân bố tần số: Mức thu nhập năm 30 hộ gia đình mơn vùng núi cao Mức thu nhập (triệu đồng) Tần số 5.5 6.5 7.5 12 Cộng 30 Tính số trung bình, số trung vị số mode số liệu thống kê cho Giải: Áp dụng cơng thức tính trung bình cộng, ta có: x= ( 4∗1 ) + ( 5∗1 ) + ( 5.5∗3 )+ ( 6∗4 )+ ( 6.5∗5 ) + ( 7∗8 ) + ( 7.5∗6 ) +(12∗2) =6.9 30 Số trung bình mức thu nhập năm 30 hộ gia đình môn vùng núi cao là: 6,9 triệu đồng Mode: triệu (8 lần) Trung vị: xác định vị trí trung vị: Median x: (8+1)/2= 4,5 Giá trị trung vị nằm vị trí thứ (6 triệu) thứ (6,5 triệu) Giá trị trxung vị = (6+6,5)/2 = 6,25 IV Mô tả độ phân tán biến - Khi nghiên cứu dựa vào đại lượng đo lường mức độ tập trung biến chưa đủ mà cần kết hợp với đại lượng đo lường mức độ phân tán biến - Ví dụ trường hợp nghiên cứu ảnh hưởng việc làm thêm đến kết học tập sinh viên, khảo sát hai nhóm sinh viên Nhóm khơng làm thêm 150 người, nhóm làm thêm 100 người Nếu muốn biết điểm trung bình nhóm cao hơn, ta tính trung bình cộng nhóm so sánh với Ở sử dụng độ tập trung biến Nếu muốn biết nhóm sinh viên có điểm đồng khơng thể sử dụng phương pháp mà phải sử dụng phương pháp mô tả độ phân tán biến Khoảng biến thiên – Cách độ (Range) a Min/Max - Giá trị lớn (max) giá trị có điểm số cao tập liệu - Giá trị nhỏ (min) giá trị có điểm số thấp tập liệu b Khái niệm - Cách độ đại lượng đo lường mức độ phân tán cách đơn giản dễ hiểu - Cách độ hiểu khoảng cách giá trị quan sát nhỏ (xmin) giá trị quan sát lớn (xmax) - Cơng thức tính cách độ: R = xmax– xmin Ưu điểm Tính tốn đơn giản, cho nhận xét nhanh độ biến thiên tổng thể Nhược điểm - Cách độ phụ thuộc vào hai giá trị lớn bé tập liệu nên phụ thuộc nhiều vào giá trị ngoại lệ Ví dụ: Dãy số: 111112222333344456 R= 6-1=5 Dãy số 1111122223333444 200 R= 200-1=199 - Cách độ tính theo hai giá trị max nên bỏ qua thông tin cách phân bố nội tập liệu Vì lý này, cách độ xem đại lượng đo lường độ phân tán yếu sử dụng Lưu ý: Chỉ nên sử dụng cách độ phân bố khơng có q nhiều điểm trống số (trừ tần số 0) số không bị trải dài Phương sai (Variance) a Định nghĩa Phương sai trung bình cộng bình phương độ lệch lượng biến với số trung bình cộng lượng biến b Cách tính đơn giản Lấy giá trị quan sát trừ giá trị trung bình cộng tất quan sát này, sau cộng tất kết lại thành độ lệch trung bình (mean deviations) ∑ ( x−x )=meandeviations c Nhược điểm Vấn đề đặt phương pháp tổng độ lệch liệu 0, ý nghĩa việc đo lường độ phân tán (Ví dụ) Bảng: thống kê số trang sách đọc ngày sinh viên Sinh viên Trang 25 10 11 12 Tổng 35 40 42 43 44 48 51 55 57 59 65 564 ∑ ( x−x )=( 25−47 )+ ( 35−47 ) + ( 40−47 ) + ( 42−47 ) + ( 43−47 ) + ( 44−47 ) + ( 48−47 ) + ( 51−47 ) + ( 55−47 ) + ( 57 d Công thức - Phương sai tính cách lấy tổng biến thiên quan sát với giá trị trung bình bình phương chia cho tổng số quan sát Ta có cơng thức tính sau: - Phương sai tổng thể (population variance) ∑ ( x−x ) s= (1) n Tuy nhiên lúc có, cần tồn số liệu; ta có phần số liệu (Ví dụ phân tích số bánh bán ngày cửa hàng, bạn lấy mẫu sáu ngày ngẫu nhiên có kết sau: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9 Đây mẫu, khơng phải tổng thể, bạn khơng có liệu cho tất ngày cửa hàng mở cửa) Phương sai mẫu (sample variance) s2= ∑ ( x−x )2 (2) n−1 Trong đó: s phương sai x biến quan sát x giá trị trung bình giá trị quan sát n tổng số quan sát Ví dụ (Lấy lại ví dụ trên) Bảng: thống kê số trang sách đọc ngày sinh viên Sinh viên 10 11 12 Tổng 564 Ta có: x= 12 =47 Trang 25 35 40 42 43 44 48 51 55 57 59 65 564 Ta lập bảng tính phương sai số lỗi sai: x-x (x - x ¿2 25-47=-22 484 35-47=-12 144 40-47=-7 49 42-47=-5 25 43-47=-4 16 44-47=-3 48-47=1 51-47=4 16 55-47=8 64 57-47=10 100 59-47=12 144 65-47=18 324 Tổng 1376 Áp dụng công thức (2) s= Lưu ý: ∑ ( x−x )2 =125.1 ( n−1 ) - Mặc dù phương sai xem phép tính thống kê để đo lường độ phân tán, nhiên khơng có ý nghĩa nhiều đơn vị tính bình phương lên khơng phải đơn vị gốc - Giá trị thực có ý nghĩa chuyển hóa thành giá trị khác gọi độ lệch chuẩn (Standard Deviation) Độ lệch chuẩn a Định nghĩa Để khắc phục nhược điểm phương sai biểu thị kết bình phương, ta có khái niệm độ lệch chuẩn Độ lệch chuẩn giá trị bậc hai phương sai Độ lệch chuẩn dùng để đo mức độ phân tán tập liệu b Công thức s= √ s = √ ∑ ( x−x ) n−1 c Công dụng Độ lệch chuẩn đo tính biến động tập liệu Nó cho thấy chênh lệch giá trị thời điểm đánh giá so với giá trị trung bình Độ lệch chuẩn tương ứng với giá trị quan sát tập liệu lớn độ biến thiên tập liệu lớn Ví dụ: Sử dụng “Bảng thống kê số trang sách đọc ngày sinh viên” với phương sai: S2=125,1 Ta có: Độ lệch chuẩn: s= √ s2 =√125,1=11.18 d Ứng dụng Độ lệch chuẩn áp dụng hoạt động đầu tư Độ lệch chuẩn đo lường mức độ biến động thị trường chứng khốn, từ dự đốn hiệu đầu tư Ngồi ra, độ lệch chuẩn cịn biện pháp đo lường rủi ro đầu tư mà nhà phân tích, quản lý danh mục đầu tư, cố vấn tài chính sử dụng Độ chênh lệch lớn mức độ rủi ro nhiều Ví dụ cổ phiếu bất ởn có độ lệch chuẩn cao, độ lệch chuẩn cổ phiếu blue-chip ổn định thường thấp Các nhà đầu tư dựa vào độ lệch chuẩn, đồng thời xem xét yếu tố khác (ví dụ khả chịu đựng biến động, mục tiêu đầu tư) để định có đầu tư hay khơng IQV (Index of Qualitative Variation) a Định nghĩa IQV (chỉ số biến đổi định tính) thước đo thay đổi biến danh nghĩa (ví dụ: chủng tộc, dân tộc, giới tính) Những loại biến số phân chia người theo hạng mục, không giống số đo biến đổi thu nhập học vấn, đo lường từ cao đến thấp IQV dựa tỷ lệ tổng số khác biệt phân phối xem xét với số khác biệt tối đa có b Cơng thức k ( N 2−∑ f ) IQV = N ( k−1 ) Trong đó: k = số giá trị biến (số hạng mục) N = số trường hợp nghiên cứu Σ f 2= tổng bình phương tần suất Ví dụ: Bảng thống kê số lượng nam nữ lớp học A Giới tính Tần suất Nam 10 Nữ Tổng cộng 10 2 k ( N −∑ f ) 2(100−102 +0 2) 2(100−100−0) = = =0 IQV= N ( k −1 ) 100(2−1) 100 Bảng thống kê số lượng nam nữ lớp học B Giới tính Tần suất Nam Nữ Tổng cộng 10 2 2 k ( N −∑ f ) 2(100−5 −5 ) 2(100−25−25) =¿ = =1 IQV = N ( k −1 ) 100 (2−1) 100 c Đặc điểm Đại lượng IQV nhận giá trị từ đến 1: + Giá trị cho thấy khơng có biến thiên mẫu + Giá trị cho thấy có phân bổ giá trị d Ứng dụng Nếu xem xét đa dạng chủng tộc, dân tộc thành phố theo thời gian, kiểm tra IQV hàng năm để xem đa dạng phát triển Làm điều cho phép biết đa dạng mức cao mức thấp + Có 100 người, gồm 25 người gốc Tây Ban Nha, 25 người da trắng, 25 người da đen 25 người châu Á, phân bố hoàn toàn đa dạng IQV 1,00 + Sự phân bố chủng tộc Arizona có IQV 0,85, điều có nghĩa số lượng khác biệt chủng tộc cao Bài tập: Sau học kỳ, giáo viên chủ nhiệm lớp ABC thu thập điểm môn học sinh viên lớp để đánh giá tổng quan tình hình học tập em Dữ liệu thu thập sau: Môn Triết học Mác – Lê-nin 8 10 10 7 Môn Thống kê cho Khoa học Xã hội 9 10 4 a Tìm giá trị trung bình, trung vị yếu vị mơn b Tìm khoảng biến thiên (range), phương sai độ lệch chuẩn môn c So sánh kết mơn, kết luận kết học tập môn? d Môn sinh viên có điểm số đồng hơn? Giải a Tìm giá trị trung bình, trung vị yếu vị mơn * Áp dụng cơng thức tính trung bình cộng, ta có Điểm trung bình Triết học Mác-Lênin là: 8+5+7+ 6+8+6+ 9+10+6+ 5+10+8+9+ 7+6+5+ 7+6+8+ =7 20 Điểm trung bình Thống Kê cho Khoa học xã hội là: 2+ 4+ 9+1+5+9+ 10+ 9+ 4+1+8+5+ 1+ 4+ 4+ 3+5+3+6+7 =5 20 Trung vị Triết học Mác-Lênin là: .. .Chủ đề: Thống kê mô tả Giảng viên hướng dẫn: ThS Trịnh Thị Nhài Nhóm thực hiện: Lelet Girls Thống kê mơ tả (Descriptive statistics) I Tìm hiểu chung Khái niệm Thống kê mô tả phương... sinh viên lớp để đánh giá tổng quan tình hình học tập em Dữ liệu thu thập sau: Môn Triết học Mác – Lê-nin 8 10 10 7 Môn Thống kê cho Khoa học Xã hội 9 10 4 a Tìm giá trị trung bình, trung vị... học Mác-Lênin là: 8+5+7+ 6+8+6+ 9+10+6+ 5+10+8+9+ 7+6+5+ 7+6+8+ =7 20 Điểm trung bình Thống Kê cho Khoa học xã hội là: 2+ 4+ 9+1+5+9+ 10+ 9+ 4+1+8+5+ 1+ 4+ 4+ 3+5+3+6+7 =5 20 Trung vị Triết học