Bài giảng Thống kê Xã hội học là tài liệu của Trường Đại học Sư phạm Hà Nội được biên soạn với nội dung cung cấp cho các em sinh viên một số kiến thức về xác suất cơ sở, mẫu ngẫu nhiên, khoảng ước lượng, kiểm định giả thuyết thống kê,... Mời các bạn cùng tham khảo chi tiết bài giảng tại đây nhé.
lOMoARcPSD|16911414 Bài giảng Thống kê Xã hội học Khoa Toán Tin Trường Đại học Sư phạm Hà Nội 2020 Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) lOMoARcPSD|16911414 Mục lục MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ 1.1 Định nghĩa xác suất 1.1.1 Phép thử ngẫu nhiên 1.1.2 Không gian mẫu Biến cố sơ cấp 1.1.3 Biến cố 1.1.4 Phép toán biến cố 1.1.5 Mối quan hệ biến cố 1.1.6 Định nghĩa xác suất cổ điển 1.1.7 Tính chất xác suất 1.1.8 Định nghĩa xác suất theo thống kê 1.2 Sự độc lập 1.2.1 Hai biến cố độc lập 1.2.2 Dãy biến cố độc lập 1.2.3 Dãy phép thử Bernoulli 1.2.4 Công thức xác suất nhị thức 1.3 Biến ngẫu nhiên rời rạc 1.3.1 Định nghĩa 1.3.2 Phân phối biến ngẫu nhiên 1.3.3 Các số đặc trưng 1.3.4 Ý nghĩa kỳ vọng phương sai 1.3.5 Phân phối nhị thức 1.3.6 Tính chất kỳ vọng phương sai 1.4 Biến ngẫu nhiên liên tục Phân phối chuẩn 1.4.1 Biến ngẫu nhiên liên tục 1.4.2 Hàm mật độ 1.4.3 Các số đặc trưng 1.4.4 Phân phối chuẩn 1.4.5 Tính chất phân phối chuẩn 1.4.6 Xấp xỉ phân phối nhị thức phân phối chuẩn MẪU NGẪU NHIÊN 2.1 Giới thiệu Thống kê 2.1.1 Mẫu quần thể 2.1.2 Quy trình nghiên cứu thống kê 2.1.3 Các tốn thống kê học: 2.2 Thu thập liệu 2.2.1 Xác định liệu cần thu thập Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) 7 9 10 10 10 11 11 11 11 12 13 13 14 14 14 15 15 15 15 15 16 16 17 18 20 21 21 21 21 22 22 lOMoARcPSD|16911414 MỤC LỤC 2.2.2 Dữ liệu sơ cấp thứ cấp 2.2.3 Lấy mẫu hồn lại khơng hồn lại 2.2.4 Quy tắc lấy mẫu 2.2.5 Phương pháp lấy mẫu giản đơn 2.2.6 Các phương pháp lấy mẫu khác 2.3 Trình bày liệu bảng biểu đồ 2.3.1 Biểu đồ thân-lá (stem-and-leaf diagram) 2.3.2 Tần số 2.3.3 Bảng tần số 2.4 Biểu đồ tần số 2.4.1 Biểu đồ tần suất 2.5 Số liệu số đặc trưng 2.5.1 Biến số 2.5.2 Phân loại biến số 2.5.3 Các số đo giá trị trung tâm 2.5.4 Các số đo độ phân tán 2.5.5 Thống kê 22 23 23 23 23 24 24 25 26 26 27 28 28 28 28 29 30 KHOẢNG ƯỚC LƯỢNG 3.1 Khoảng ước lượng cho trung bình 3.1.1 Đặt vấn đề 3.1.2 Khoảng ước lượng 3.1.3 Khoảng ước lượng cho trung bình µ σ biết 3.1.4 Khoảng ước lượng cho trung bình µ mẫu cỡ lớn 3.1.5 Khoảng ước lượng cho mẫu nhỏ có phân phối chuẩn với σ chưa biết 3.1.6 Vấn đề xác định cỡ mẫu 3.2 Khoảng ước lượng cho tỷ lệ 3.2.1 Đặt vấn đề 3.2.2 Công thức khoảng ước lượng cho tỷ lệ 3.2.3 Vấn đề xác định cỡ mẫu 31 31 31 32 32 34 36 37 37 37 37 38 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 4.1 Tình thực tế 4.2 Bài toán kiểm định giả thuyết tổng quát 4.2.1 Miền tiêu chuẩn 4.2.2 Các loại sai lầm 4.3 Bài toán kiểm định giả thuyết cho giá trị trung bình mẫu 4.3.1 Bài tốn 1: So sánh trung bình mẫu có phân phối chuẩn với phương sai σ biết 4.3.2 Bài toán 2: So sánh giá trị trung bình mẫu cỡ lớn với phương sai chưa biết 4.3.3 Bài toán 3: So sánh giá trị trung bình mẫu có phân phối chuẩn với phương sai chưa biết 4.4 Bài toán kiểm định giả thuyết tỉ lệ 4.4.1 Tình thực tế 4.4.2 Bài toán kiểm định giả thuyết cho tỉ lệ 4.4.3 Tiêu chuẩn kiểm định 4.5 Bài toán so sánh hai giá trị trung bình 4.5.1 Tình thực tế Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) 40 41 41 42 42 43 43 44 45 48 48 49 49 51 51 lOMoARcPSD|16911414 MỤC LỤC 4.5.2 4.5.3 So sánh hai giá trị trung bình Bài toán 1: So sánh giá trị trung bình hai mẫu có phân phối chuẩn với phương sai biết 4.5.4 Bài toán 2: So sánh hai giá trị trung bình hai mẫu có phân phối chuẩn với phương sai σX = σY = σ chưa biết 4.6 Bài toán so sánh hai tỉ lệ 4.6.1 Tình thực tế 4.6.2 So sánh hai tỉ lệ Hồi quy tuyến tính đơn 5.1 Tình thực tế 5.2 Mơ hình hồi quy tuyến tính đơn 5.2.1 Khoảng tin cậy cho σ 5.2.2 Khoảng tin cậy cho β1 5.2.3 Khoảng tin cậy cho β0 5.2.4 Khoảng dự báo Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) 51 52 53 54 54 54 58 58 59 60 60 60 61 lOMoARcPSD|16911414 Giới thiệu học phần Thống kê Xã hội học Một số vấn đề thực tế • Làm để biết cân nặng trung bình trẻ sơ sinh địa phương? – Một nhà điều tra thử tính cân nặng trung bình 50 trẻ sơ sinh địa phương kết 3,1kg Có thể nói cân nặng trẻ sơ sinh tồn địa phương đó? – Một nhà quản lý cho cân nặng trung bình tất trẻ sơ sinh địa phương 3,3kg Tuyên bố nhà quản lý có khơng? • Làm để so sánh hiệu hai phác đồ điều trị cho bệnh đó? – Có hai phác đồ điều trị cho bệnh Trong 200 bệnh nhân điều trị theo phác đồ có 150 khỏi bệnh Trong 50 người điều trị theo phác đồ có 40 người khỏi bệnh Hỏi phác đồ có thực tốt phác đồ hay khơng? • Con bạn cao cm? – Chiều cao bị ảnh hưởng chiều cao bố hay chiều cao mẹ? – Chiều cao bố/mẹ liên quan đến nhau? – Biết chiều cao bố/mẹ dự đốn chiều cao khơng? Thống kê gì? Thống kê khoa học việc thu thập, xử lý, biểu diễn, phân tích mẫu số liệu thu thập từ quần thể để rút kết luận có độ tin cậy cho tồn quần thể Cơ sở khoa học Thống kê Lý thuyết xác suất Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) lOMoARcPSD|16911414 MỤC LỤC Nội dung học phần Chương 1: Một số kiến thức xác suất sở Chương 2: Mẫu ngẫu nhiên Chương 3: Khoảng ước lượng Chương 4: Kiểm định giả thuyết thống kê Chương 5: Hồi quy Mục tiêu học phần Hiểu ý nghĩa tính xác suất, kì vọng, phương sai số trường hợp đơn giản Vận dụng phân phối nhị thức phân phối chuẩn giải số toán thực tế Hiểu phương pháp lấy mẫu ngẫu nhiên Biết phân loại số liệu tính tốn đặc trưng mẫu số liệu Trình bày số liệu dạng biểu đồ cột, biểu đồ quạt Hiểu ý nghĩa tính khoảng ước lượng cho trung bình tỉ lệ Hiểu ý nghĩa toán kiểm định giả thuyết Vận dụng để so sánh tỉ lệ trung bình Hiểu ý nghĩa giải tốn hồi quy tuyến tính đơn Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) lOMoARcPSD|16911414 Chương MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ Nội dung chương: Định nghĩa xác suất cổ điển định nghĩa xác suất theo thống kê Sự độc lập Biến ngẫu nhiên rời rạc Biến ngẫu nhiên liên tục Phân phối nhị thức Phân phối chuẩn Các số đặc trưng biến ngẫu nhiên Mục tiêu chương Hiểu khái niệm xác suất: phép thử ngẫu nhiên, không gian mẫu, biến cố, mối quan hệ biến cố Hiểu ý nghĩa khái niệm độc lập Hiểu ý nghĩa tính xác suất, kì vọng, phương sai số trường hợp đơn giản Vận dụng phân phối nhị thức phân phối chuẩn giải số toán thực tế Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) lOMoARcPSD|16911414 CHƯƠNG MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ 1.1 Định nghĩa xác suất 1.1.1 Phép thử ngẫu nhiên • Phép thử: việc thực tổ hợp hành động • Phép thử ngẫu nhiên: phép thử mà ta khơng biết trước kết 1.1.2 Khơng gian mẫu Biến cố sơ cấp • Khơng gian mẫu tập hợp tất kết xảy phép thử Ta thường kí hiệu khơng gian mẫu Ω • Biến cố sơ cấp phần tử khơng gian mẫu Ví dụ 1.1.1 Trong hộp có bi xanh, bi đỏ bi vàng Hãy xác định không gian mẫu số biến cố sơ cấp phép thử sau: a) Lấy ngẫu nhiên bi từ hộp b) Lấy ngẫu nhiên đồng thời bi từ hộp c) Lấy bi từ hộp d) Lấy ngẫu nhiên bi từ hộp, xem màu, trả lại hộp lại lấy ngẫu nhiên bi Lời giải a) Lấy ngẫu nhiên bi từ hộp n o Ω = X, Đ, V b) Lấy ngẫu nhiên đồng thời bi từ hộp n o Ω = {X, Đ}, {X, V }, {Đ, V } c) Lấy bi từ hộp n o Ω = XĐ, XV, ĐX, ĐV, V X, V Đ n = (X, Đ), (X, V ), (Đ, X), o (Đ, V ), (V, X), (V, Đ) Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) lOMoARcPSD|16911414 CHƯƠNG MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ d) Lấy ngẫu nhiên bi từ hộp, xem màu, trả lại hộp lại lấy ngẫu nhiên bi n o Ω = XX, XĐ, XV, ĐX, ĐV, ĐĐ, V X, V Đ, V V n = (X, X), (X, Đ), (X, V ), (Đ, X), o (Đ, Đ), (Đ, V ), (V, X), (V, Đ), (V, V ) 1.1.3 Biến cố • Biến cố kiện liên quan đến phép thử Một biến cố xảy không xảy sau phép thử thực Mỗi biến cố tập không gian mẫu • Biến cố chắn biến cố ln xảy • Biến cố rỗng (trống) biến cố ln khơng xảy Ví dụ 1.1.2 Xét phép thử gieo hai xúc xắc cân đối Hãy xác định không gian mẫu biểu diễn biến cố sau dạng tập hợp • A b/c xuất hai mặt chấm • B b/c xuất hai mặt chấm • C b/c xuất hai mặt chấm • D b/c tổng số chấm • E b/c tích số chấm xuất số lẻ Lời giải Ω = {(1, 1), (1, 2), , (6, 6)} = {(i, j) : ≤ i, j ≤ 6} • A = {(1, 1)} • B = {(4, 4)} Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) lOMoARcPSD|16911414 CHƯƠNG MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ • C b/c xuất hai mặt chấm C = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} • D b/c tổng số chấm D = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)} • E b/c tích số chấm xuất số lẻ E = {(1, 1), (1, 3), (1, 5), (3, 1), (3, 3), (3, 5), (5, 1), (5, 3), (5, 5)} 1.1.4 Phép toán biến cố • A ∪ B: Hợp hai biến cố A B • A ∩ B = AB: Giao hai biến cố A B • A \ B: Hiệu hai biến cố A cho B Ví dụ 1.1.3 Trong phép thử gieo hai xúc xắc, xác định biến cố hợp, giao hiệu biến cố C D 1.1.5 Mối quan hệ biến cố • Biến cố A gọi thuận lợi cho biến cố B A xảy B xảy Kí hiệu A ⊂ B • Biến cố A gọi xung khắc với biến cố B A xảy B khơng xảy ngược lại Hai biến cố xung khắc đồng thời xảy Kí hiệu A ∩ B = ∅ Ví dụ 1.1.4 Trong biến cố A, B, C, D, E phép thử gieo hai xúc xắc • biến cố thuận lợi cho biến cố nào; • cặp biến cố xung khắc Downloaded by Nguynhavy Ha Vy (Ntkphuong205@gmail.com) ... cao khơng? Thống kê gì? Thống kê khoa học việc thu thập, xử lý, biểu diễn, phân tích mẫu số liệu thu thập từ quần thể để rút kết luận có độ tin cậy cho tồn quần thể Cơ sở khoa học Thống kê Lý thuyết... 60 61 lOMoARcPSD|16911414 Giới thiệu học phần Thống kê Xã hội học Một số vấn đề thực tế • Làm để biết cân nặng trung bình trẻ sơ sinh địa phương? – Một nhà điều tra thử tính cân nặng trung bình... phân phối chuẩn MẪU NGẪU NHIÊN 2.1 Giới thiệu Thống kê 2.1.1 Mẫu quần thể 2.1.2 Quy trình nghiên cứu thống kê 2.1.3 Các toán thống kê học: 2.2 Thu thập liệu 2.2.1