Pdfcoffee com how to lie with statistics tieng viet pdf free Pdfcoffee com how to lie with statistics tieng viet pdf free Pdfcoffee com how to lie with statistics tieng viet pdf free Pdfcoffee com how to lie with statistics tieng viet pdf free Pdfcoffee com how to lie with statistics tieng viet pdf free Pdfcoffee com how to lie with statistics tieng viet pdf free Pdfcoffee com how to lie with statistics tieng viet pdf free
HOW TO LIE WITH STATISTICS How To Lie With Statistics (Darrel Huff) Darrell Huff Bịp Bằng Thống Kê Như Thế Nào (Darrel Huff) GIỚI THIỆU Nhằm rộng đường dư luận trước tiến đến việc chấm dứt sử dụng hệ thống đo lường phiền toái Anh với đơn vị rối rắm inch feet cân Anh, viện thăm dò Gallup muốn biết hệ mét (hệ đo lường Âu châu mà nước ta sử dụng) thay có nhiều người biết đến hay khơng Họ thăm dị theo cách thơng thường thấy số người vấn qua trường đại học có 33 phần trăm chưa nghe nói đến hệ mét Sau tuần báo Chủ nhật tiến hành thăm dò riêng – loan báo có đến 98 % độc giả có biết mét hệ Thế tờ báo khoe khoang độc giả có trình độ văn hóa cao phần lớn dân chúng Làm hai thăm dị khác lại có kết khác biệt đến Các vấn viên Gallup chọn, nói chuyện với nhóm cơng luận có chọn lọc Cịn tuần báo cách đơn giản tiết kiệm vào phiếu tham dự in sẵn mặt báo độc giả việc điền ý kiến cắt phiếu gởi tịa soạn Ta khơng khó đốn hầu hết độc giả khơng nghe nói đến hệ mét khơng quan tâm đến phiếu thăm dị; đương nhiên t ự loại khỏi thăm dị khơng điền gởi phiếu tịa soạn Sự tự chọn lọc sinh ra, nói theo thuật ngữ thống kê, mẫu thống kê thiên lệch không đại diện, tác nhân vô số kết luận lạc hướng tồn nhiều năm qua Cách vài mùa đơng chục nhà thăm dị đ ộc lập công bố số liệu loại thuốc kháng histamine Mỗi người cố chứng tỏ số phần trăm đáng kể cảm lạnh kh ỏi hẳn sau điều trị loại thuốc Thế dư luận sơi lên, quảng cáo, khởi phát vụ sản xuất thuốc bùng nổ Sự kiện dựa vào tâm lý muôn đ ời hy vọng vào thuốc người bệnh người ta nực cười không chịu nhìn qua thống kê chút để đưa mắt đến kiện biết từ lâu Nói theo nhà khơi hài khơng có chun mơn y khoa, Henry G Felsen, phát bi ểu How To Lie With Statistics (Darrel Huff) cách không lâu, điều trị cách cảm cúm khỏi vòng bảy ngày, để mặc cảm cúm kéo dài vịng tuân Như bạn đ ọc nghe nhiều Các số trung bình, hệ số tương quan khuynh hướng đồ thị lúc chúng Chúng chứa nhiều chuyện khác ta thấy bên ngồi, có nhiều Thuật ngữ bí hiểm thống kê học, ấn tượng người số, đư ợc sử dụng để gây chống, để thổi phịng, để làm hoang mang, để giản lược đáng Những phương pháp thuật ngữ thống kê cần thiết thông tin khối lượng liệu lớn khuynh hướng xã hội kinh tế, dự đoán kinh doanh, ý kiến công luận, điều tra dân số Nhưng khơng có tác giả sử dụng từ ngữ cách lương thiện hiểu biết độc giả am tường họ muốn nói, kết thống kê điều vơ nghĩa từ ngữ Trong trang báo cáo khoa học, lạm dụng thống kê hầu tràn ngập hình ảnh nhân vật vận áo blu trắng miệt mài phịng thí nghiệm lờ mờ Một kiện thống kê đóng gói đàng hồng cịn hiệu ‘lời dối trá ghê gớm’ Hitler; đánh lạc hướng dư luận, khơng mặt bạn Quyễn sách quyễn sách vỡ lòng cho bạn cách sử dụng thống kê để gian dối Nó cẩm nang dành cho tên bịp bợm Nhưng tơi bào chữa cho quyễn sách không khác hồi ký tên trộm hồi hưu Nó trở thành giáo trình chun nghiệp cách bẻ khóa rình mị mà tác giả ln tin tên lưu manh biết tỏng mánh khóe này; cịn người lương thiện cần đọc để trau giồi khả tự vệ Bịp Bằng Thống Kê Như Thế Nào (Darrel Huff) Mẫu thống kê thiên lệch từ đầu Nếu bạn có thùng đậu, có đậu đỏ đậu trắng, có cách để biết xác có đậu thuộc loại trút đếm Có cách dễ để tìm có khoảng đậu đỏ Bốc nắm đậu đếm số đậu đỏ đó, giả đinh tỷ lệ bảo toàn thùng Nếu mẫu lấy đủ lớn lựa chọn thích đáng, k ết đại diện cho tồn thể hầu hết mục đích khảo sát Tuy nhiên, chúng thiếu điều kiện nêu kết có xác ước đốn thơng minh khơng đáng xu nhỏ khốc dáng vẻ giả mạo tính xác khoa học Một thật đáng buồn kết luận rút từ mẫu thống kê thiên lệch phương pháp chọn mẫu mẫu nhỏ, hai, có nhiều qua ta đọc cho biết Cách thức mà mẫu lấy bị thiên lệch thấy rõ cách nhìn vào ví dụ cực đoan sau Giả sử bạn muốn gởi đến nhóm cơng dân bảng câu hỏi có câu: “Bạn có thích trả lời bảng câu hỏi khơng?” Tổng kết phản hồi, bạn tự tin thông báo đa số áp đảo- kết đáng tin cậy hơn, kết bạn trình bày dạng số có vài chữ số thập phân - mẫu dân số tiêu biểu điển hình xác nhận đồng thuận Dĩ nhiên k ết điều dễ hiểu người nói khơng với câu hỏi t ự loại khỏi thăm dị cách ném bảng câu hỏi vào sọt rác Dù cho số người bỏ rác chiếm đến phần 10 mẫu thống kê ban đầu bạn không nhiều phớt lờ họ báo cáo Liệu mẫu thống kê thiên lệch có xảy thực hay khơng? Chắc chắn có Những nhật báo tạp chí cách không lâu cho ta biết khoảng bốn triệu người Thiên Chúa giáo Mỹ c ải theo đạo Tin Lành vịng mư ời năm qua Nguồn thơng tin từ thăm dò Đức Cha Daniel A Poling, chủ biên tờ Christian Herald, thực hiện, tóm tắt kết sau: Tạp chí Herald tìm đư ợc số từ thăm dò mẫu dân số mục sư Tin Lành Trong số 2.219 giáo sĩ tr ả lời bảng câu hỏi (trong tổng số 25.000 thăm dò) báo cáo họ đón nh ận vào nhà thờ họ tổng số 51.361 giáo hữu trước tín đồ Thiên Chúa La Mã vòng mư ời năm qua Dựa vào mẫu này, Poling ớc tính 4,144,366 người c ải đạo từ Thiên Chúa sang Tin Lành thập kỹ Nhưng tạp chí Time xứng đáng ta ngả mũ chào ti ết lộ 90 phần trăm mục sư thăm dị khơng trả lời phiếu thăm dị Đ ể đánh đỗ hồn tồn kết thăm dị bạn cần lưu ý khả hợp lý hầu hết 90 phần trăm quẳng phiếu thăm dị vào sọt rác họ khơng có chiên c ải đạo để báo cáo Sử dụng giả định dùng số - 181.000 – tổng số mục sư Tin lành mà tiến sĩ Poling cho biết, ta qui chiếu theo cách Vì ơng ta đến 25.000 người How To Lie With Statistics (Darrel Huff) tổng số 181.000 người thấy có 51.361 người cải đạo, biết số cải đạo tổng cộng khoảng 370,000 Phương pháp thô sơ ta đưa m ột số đáng ngờ, đáng tin cậy số báo cáo công khai – số lớn gấp mười lần số ước tính ấn tượng nhiều Với sở này, ta tiếp tục làm việc với báo cáo khác – cách vài năm đồng tiền có giá trị - thống kê cho sinh viên trung bình tốt nghiệp đại học Yale, trường năm 1924, kiếm $25.111 năm vào thời điểm thăm dò (khoảng năm 1950) Xin chúc mừng! Nhưng khoan Con số ấn tượng có nghĩa gì? H iển nhiên có nghĩa n ếu bạn gởi đến Yale, bạn khơng phải nai lưng làm lụng già bạn Có hai kiện đáng ngờ nhìn vào số Nó tốt lành cách không chắn Khả mà lợi tức trung bình nhóm người tính đến đồng la ỏi Khơng thể bạn biết rõ lợi tức năm ngối cách xác trừ tất từ lương mà Và lợi tức $25.000 thường từ lương bổng; người thuộc tầng lớp cao chắn có nhiều khoản đầu tư Hơn nữa, số trung bình đáng u khơng nghi ngờ tính từ số tiền mà người tốt nghiệp Đại học Yale khai số lợi tức họ Mặc dù ta biết người trí thức tốt nghiệp từ năm 1924 có tiếng trọng danh dự, ta tin sau phần tư kỷ lời khai họ có cịn trung thực hay khơng Một số người hỏi lợi tức thường nói q đáng số lợi tức muốn khoe khoang hay lạc Bịp Bằng Thống Kê Như Thế Nào (Darrel Huff) quan Một số khác nói thực lỡ khai tờ khai thuế, sợ sở thuế ngó mắt vào Bạn cho hai khuynh hướng cực đoan bù trừ nhau, điều chưa Khuynh hướng mạnh khuynh hướng kia; khơng biết xác khuynh hướng Như ta bắt đầu giải thích lương tri thơng thường mách bảo số khó lịng biểu thị thật Tiếp theo nguyên nhân tạo sai lầm lớn nhất, nguyên nhân sản sinh số 25.111 $ ‘lợi tức trung bình’ nhóm người mà thực lợi tức trung bình thực họ nửa số mà thơi Báo cáo nhóm cựu sinh viên Yale rút từ mẫu dân số Lý trí cho ta tin khơng biết tất thành viên khóa 24 cịn sống Sau hai mươi lăm năm có nhiều địa bị thất lạc Với số địa liên lạc được, có nhiều người khơng trả lời bảng câu hỏi đưa đến, là bảng câu hỏi tế nhị có tính cá nhân Với số loại câu hỏi trả lời thư, năm hay mười phần trăm thư trả lời cao Bảng trả lời trường hợp cao hơn, trăm phần trăm ều khơng tưởng Như số lợi tức trung bình dựa mẫu dân số gồm thành viên mà địa biết rõ chịu trả lời bảng câu hỏi Đây có phải mẫu đại diện tốt hay khơng? Nghĩa cho nhóm trả lời có lợi tức với nhóm cịn lại, nhóm người không hỏi hay không thèm trả lời hay không? Loại người danh sách mà ta không liên lạc khơng biết địa ? Có phải người kiếm bộn tiền – chẳng hạn dân Wall Street, giám đốc tập đoàn, nhà điều hành sản xuất dịch vụ? Không, địa người giàu có khơng khó tìm Phần đơng thành viên thành đạt khóa học có tên Who’s Who in America sách tham khảo khác họ có chễng mãng việc liên lạc với văn phòng đ ại học Như khơng khó đốn người thất lạc người, sau hai mươi lăm tốt nghiệp Yale, khơng có đư ợc tương lại hứa hẹn Họ thư ký, th ợ máy, kẻ lang thang, bọn nghiện ngập vô công nghề, tay viết lách hay nghệ sỹ sống dở chết dở tóm lại người mà gom lại tá lợi tức chưa đến 25.111 $ Những người không lui tới buổi họp lớp, khơng có tiền đóng phí tham dự Cịn người ném bảng câu hỏi vào sọt rác? Ta khơng thể biết chắc, đốn phần lớn người mà mức lợi tức khơng có đáng khoe khoang Họ giống người nhận bao thư tiền lương tháng có kèm lời ghi số lương riêng tư không nên trao đổi với nhân viên khác, liền trả lời ‘Ông chủ đừng lo, tơi xấu hổ tiền lương ngài vậy.’ Và mẫu thống kê lo ại hai nhóm làm giảm số trung bình cách thê thảm Con số 25.111$ bắt đầu tự nói lên Đó trung bình nhóm người cá biệt nhóm tốt nghiệp Yale khóa 1924 mà địa biết rõ muốn chứng tỏ ta kiếm Chưa kể ta giả định họ nói lên thật How To Lie With Statistics (Darrel Huff) Giả định coi thường Kinh nghiệm từ dòng nghiên cứu theo mẫu, gọi nghiên cứu thị trường, cho ta biết việc khó kiểm tra Một thăm dị đến nhà có mục đích tìm xem tạp chí gia đình ưa đ ọc Khi tính tốn phân tích liệu, kết đa số thích đọc Harper ( tạp chí dành cho dân trí thức), tờ báo khơng nói cao cấp cao, khơng có nhiều gia đình đọc tờ True Story, tạp chí cải giật gân Nhưng thực tế phát hành cho thấy số ấn tờ True Story nhiều Harper đến vài triệu Như ta vấn lầm đối tượng chăng, nhà thiết kế thăm dò tự hỏi Nhưng không, câu hỏi đư ợc gởi đến nhóm đối tượng khắp đất nước Hóa kết luận hợp lý đa số người trả lời khơng nói thật Và mà thăm dị tìm hợm hĩnh Thế muốn biết thật bạn buộc phải đếm số tạp chí Yale Reviews Love Romances (Chuyện Tình) mà hộ gia đình đặt mua Nhưng chưa ch ắc, ều khơng cho bạn biết hộ gia đình tìm đ ọc, mà họ mua mà thơi Tương tự thế, lần sau bạn đọc thống kê cho biết người trung bình đánh 1.02 lần ngày-đây số tưởng tượng, chưa tệ số khác- tự hỏi câu hỏi sau Làm người ta tìm điều được? Nếu phụ nữ đọc vô số quảng cáo, hảng làm kem đánh răng, bi bô người khơng đánh thiếu văn hố, họ dám thổ lộ khơng đánh đặn với người lạ hay không? Thống kê có nghĩa người muốn biết ngư ời ta nói việc đánh không cho biết nhiều tần số bàn chải chà sát vào lợi Ta nghe nói dịng sơng khơng thể dâng nước cao nguồn cội Nhưng điều xảy có trạm bơm dấu Cũng khơng sai cho r ằng kết thăm dị mẫu dân số khơng thể tốt mẫu dựa Đến liệu đư ợc lọc qua tầng lớp thao tác thống kê cuối số với vài chữ số thập phân chìa ra, kết bắt đầu mang dáng dấp ánh hào quang tin cậy mà nhìn kỹ làm ta thất vọng Bịp Bằng Thống Kê Như Thế Nào (Darrel Huff) Để có giá trị cao, báo cáo phải dựa mẫu đại diện, mẫu bị loại bỏ nguồn gốc thiên lệch Đây nh ững nguồn gốc khiến số liệu bạn đọc thấy báo thiếu hẳn ý nghĩa Có lần nhà phân tâm học báo cáo phần đông người mắc bịnh tâm thần Ngồi kiện phát biểu vơ tình phủ định ý nghĩa từ ‘tâm thần’, nhìn kỹ vào mẫu thống kê tay bác sỹ Nhà phân tâm học quan sát ai? Hóa ơng ta đến kết luận ‘mở rộng tầm mắt’ từ hồ sơ bệnh nhân ơng ta, mẫu thống kê cách xa trời vực với mẫu dân số bình thường Nếu người bình thường, bác sỹ khơng có dịp tiếp xúc với Hãy nhìn lại hai lần bạn đọc để bạn tránh tiếp thu nhiều thông tin sai lầm Cần nhớ độ tin cậy mẫu dễ dàng bị sụp đỗ nguồn vơ h ữu hình Nghĩa là, dù bạn khơng tìm thấy ngun nhân gây thiên lệch chứng minh được, tự cho phép mức độ hồi nghi kết chừng cịn có khả thiên lệch Ln ln xảy điều Cuộc bầu cử tổng thống Mỹ năm 1948 1952 ch ứng tỏ việc chút nghi ngờ Để tìm chứng cớ xa trở lại năm 1936 thất bại tai tiếng tờ Literary Digest Mười triệu độc giả có điện thoại tờ Literary tuyên b ố với chủ bút tạp chí bị ma ám Landon 370 Roosevelt 161 đến từ danh sách tiên đốn xác k ết bầu cử 1932 Làm có thiên lệch danh sách qua kiểm nghiệm thế? Sở dĩ có thiên lệch, sau người ta khám phá ra, người có điện thoại có đăng ký mua dài h ạn tờ Literary năm 1936 mẫu cắt ngang dân số người bầu Về kinh tế hạng người đặc biệt, mẫu thiên lệch chứa phần lớn người bầu cho Đảng Cộng Hòa Mẫu bầu cho Landon, dân chúng lại nghĩ khác Mẫu mẫu gọi ‘ngẫu nhiên’ Nó lựa chọn cách may rủi từ ‘không gian mẫu’, thuật ngữ mà nhà thống kê dùng để tồn thể đối tượng từ mẫu lấy Mỗi tên thứ 10 lấy từ tệp thẻ số Năm chục phiếu rút từ lô phiếu đựng thùng phiều Mỗi người thứ hai mươi gặp How To Lie With Statistics (Darrel Huff) Công viên Piccadilly chọn để vấn (Nhưng nhớ mẫu cuối mẫu dân số giới, nước Anh, thành phố San Francisco, mẫu dân số Piccadilly vào thời điểm Một người vấn nhằm thăm dị ý kiến cơng luận cho biết bà ta tìm người vấn nhà ga xe lửa theo bà hạng người tìm thấy Nhưng bà ta khơng biết bà mẹ có nhỏ, chẳng hạn, đến đó.) Muốn kiểm tra mẫu ngẫu nhiên, cần trả lời câu hỏi này: Có phải tên người vật toàn thể có hội xuất mẫu? Mẫu ngẫu nhiên túy loại nghiên cứu cách tin cậy lý thuyết thống kê, có điều khơng hay với Đó việc tìm mẫu khó tốn tiền nên khơng muốn chọn Một cách thay tiết kiệm dùng hầu hết lãnh vực thăm dò ý kiến nghiên cứu thị trường, gọi cách lấy mẫu ngẫu nhiên phân tầng Để loại mẫu phân tầng bạn chia không gian mẫu bạn thành nhiều nhóm tỷ lệ với mức độ phổ biến biết trước Và đến r ắc rối bắt đầu: Thông tin bạn tỷ lệ khơng Bạn dẫn cho nhân viên vấn nhớ đến tỷ lệ người da màu, hay bách phân người có số lợi tức lớp đó, hay đến số đặc biệt nơng dân, vân vân Cùng lúc nhóm phải chia người bốn mươi tuổi Nghe ổn thỏa - điều xảy ra? Về vấn đề màu da người vấn định xác lúc Về lợi tức y phạm nhiều sai sót Về phần nơng dân – bạn xếp loại người nơng dân làm công việc nông bán phần thời gian lại làm thành phố? Ngay chuyện tuổi tác đặt nhiều vấn đề Nếu muốn an tâm ta chọn người thật nhỏ bốn mươi hay thật nhiều bốn mươi Như mẫu bị thiên lệch bỏ sót người qua bốn mươi hay gần mức bốn mươi Bạn thắng 10