XÁC SUT THNG KÊ XÁC SUẤT THỐNG KÊ KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KHOA HỌC CƠ BẢN GV Lê Thị Mai Thanh Ngày 20 tháng 7 năm 2021 Đặt vấn đề Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng) 1 ở.
XÁC SUẤT THỐNG KÊ KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KHOA HỌC CƠ BẢN GV Lê Thị Mai Thanh Ngày 20 tháng năm 2021 Đặt vấn đề Điều tra mức thu nhập cá nhân tháng (triệu đồng) huyện, ta có bảng số liệu mẫu sau: Thu nhập số người 1−2 2−3 3−4 4−5 5−6 6−7 10 Cần phải tính thu nhập bình quân đầu người độ chênh lệch thu nhập để xác định mức sống người dân mức độ đồng thu nhập vùng Câu hỏi Thu nhập bình quân đầu người bao nhiêu? Độ chênh lệch thu nhập bao nhiêu? Độ chênh lệch bình quân hiệu chỉnh? ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 / 22 Chương 3: Lý thuyết mẫu 3.1 Tổng thể mẫu 3.1.1 Khái niệm tổng thể mẫu Định nghĩa tổng thể Tổng thể (population) tập hợp phần tử cần nghiên cứu tính chất định tính định lượng Ví dụ Một doanh nghiệp muốn nghiên cứu khách hàng dấu hiệu định tính mức độ hài lòng khách hàng sản phẩm/dịch vụ doanh nghiệp, cịn dấu hiệu định lượng số lượng sản phẩm doanh nghiệp tiêu thụ tháng/quý ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 / 22 3.1.1 Khái niệm tổng thể mẫu Định nghĩa mẫu Mẫu (sample) tập hợp số phần tử rút từ tổng thể Mẫu tạo cách chọn lựa ngẫu nhiên phần tử tổng thể, hay theo phương thức Số phần tử n mẫu cịn gọi kích thước mẫu hay cỡ mẫu Trong trường hợp xử lý đơn giản, mẫu xem lớn n ≥ 30 Ví dụ Khảo sát tình hình việc làm sinh viên thành phố Hồ Chí Minh sau trường tổng thể Vì số lượng sinh viên nhiều điều tra hết nên ta lấy 300 sinh viên đại diện để khảo sát 300 sinh viên mẫu cỡ mẫu n = 300 ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 / 22 3.1 Tổng thể mẫu 3.1.2 Mẫu ngẫu nhiên, mẫu cụ thể Định nghĩa Một mẫu mẫu ngẫu nhiên phép lấy mẫu cá thể tổng thể chọn cách độc lập có khả chọn Mẫu ngẫu nhiên kích thước n dãy gồm n biến ngẫu nhiên X1 , X2 , , Xn độc lập phân phối với X Kí hiệu X = (X1 , X2 , , Xn ) Khi mẫu ngẫu nhiên nhận n giá trị cụ thể X1 = x1 , X2 = x2 , , Xn = xn Khi gồm n giá trị wn = (x1 , x2 , , xn ) gọi mẫu cụ thể ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 / 22 3.1 Tổng thể mẫu 3.1.2 Mẫu ngẫu nhiên, mẫu cụ thể Ví dụ Thu nhập hàng tháng gia đình tỉnh A (triệu đồng) {30, 45, 70, 90, 110, } Một mẫu ngẫu nhiên: 50 hộ gia đình tỉnh A {X1 , X2 , X50 } Một mẫu cụ thể: {19, 20, 92, 120} gồm 50 giá trị thu nhập 50 hộ gia đình ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 / 22 3.1 Tổng thể mẫu 3.1.3 Các phương pháp chọn mẫu Chọn mẫu ngẫu nhiên đơn giản đơn giản: Là phương pháp chọn mẫu thoả mãn điều kiện: • Mỗi lần chọn phần tử vào mẫu Mỗi phần tử tổng thể chọn vào mẫu với khả • Các mẫu kích thước có xác suất chọn Có hai phương thức chọn: chọn hồn lại, chọn khơng hồn lại Khi số phần tử N tổng thể lớn so với kích thước mẫu n ta coi hai phương thức chọn mẫu ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 / 22 3.1 Tổng thể mẫu 3.1.3 Các phương pháp chọn mẫu Chọn mẫu phân nhóm: Là phương pháp chọn mẫu chia tổng thể thành nhóm tương đối nhất, từ nhóm lấy mẫu ngẫu nhiên Tập hợp mẫu lập thành mẫu ngẫu nhiên phân nhóm Chọn mẫu chùm: Là phương pháp chọn mẫu ngẫu nhiên từ tập tổng thể, gọi chùm Chọn mẫu có suy luận: Phương pháp chọn mẫu dựa ý kiến chuyên gia đối tợng nghiên cứu Nhợc điểm phương pháp khó đảm bảo tính khách quan ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 / 22 3.2 Trình bày mẫu cụ thể 3.2.1 Bảng phân phối tần số thực nghiệm Mẫu cụ thể wn = (x1 , x2 , , xn ), x1 < x2 < < xk n1 + n2 + + nk = n Bảng phân phối tần số thực nghiệm mẫu cụ thể X x1 x2 xk ni n1 n2 nk Trình bày mẫu theo bảng phân phối tần suất thực nghiệm Giá trị X ni Tần suất fi = n x1 x2 xk f1 f2 fk k Điều kiện: ≤ fi ≤ 1; fi = i=1 ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 / 22 3.2 Trình bày mẫu cụ thể 3.2.1 Bảng phân phối tần số thực nghiệm Ví dụ Kiểm tra ngẫu nhiên 50 sinh viên Ta xếp điểm số thu theo thứ tự tăng dần số sinh viên có điểm tương ứng vào bảng sau Bảng phân phối tần số thực nghiệm xi ni 2 4 12 17 10 Bảng phân phối tần suất thực nghiệm xi fi 2/50 ĐH NTT 4/50 7/50 12/50 XSTK-YH 17/50 5/50 2/50 10 1/50 Ngày 20 tháng năm 2021 10 / 22 3.2 Trình bày mẫu cụ thể 3.2.2 Bảng phân phối tần số thực nghiệm ghép lớp Khi kích thước mẫu lớn, giá trị mẫu gần người ta gom giá trị mẫu thành lớp, giá trị gần xếp vào lớp lập bảng phân phối thực nghiệm ghép lớp Giá trị mẫu cụ thể dạng ghép lớp X ni a1 − b1 n1 a2 − b2 n2 ak − bk nk Trong trường hợp ta sử dụng giá trị trung bình khoảng X ni xi = ĐH NTT x1 n1 x2 n2 xk nk + bi XSTK-YH Ngày 20 tháng năm 2021 11 / 22 Ví dụ Đo chiều cao X (cm) n = 100 niên Vì chiều cao khác nên để tiện việc xếp, người ta chia chiều cao thành nhiều khoảng Các niên có chiều cao khoảng xem cao nh Khi đó, ta có bảng số liệu dạng khoảng sau: X n 148-152 152-156 20 156-160 35 160-164 25 164-168 15 Khi cần tính tốn, người ta chọn số trung bình khoảng để đa số liệu dạng bảng X n ĐH NTT 150 154 20 158 35 XSTK-YH 162 25 166 15 Ngày 20 tháng năm 2021 12 / 22 3.3 Các đặc trưng mẫu ngẫu nhiên 3.3.1 Trung bình mẫu Định nghĩa Mẫu ngẫu nhiên W = (X1 , X2 , , XN ) trung bình mẫu ngẫu nhiên ¯ xác định thống kê X ¯ = (X1 + + Xn ) X n Tính chất i ¯ =µ E(X) ii ¯ = Var(X) iii ¯ ∼N Nếu X ∼ N µ, σ X ĐH NTT σ2 n µ, XSTK-YH σ2 n ¯ − µ)√n (X ∼ N (0; 1) σ Ngày 20 tháng năm 2021 13 / 22 3.3 Các đặc trưng mẫu ngẫu nhiên 3.3.2 Phương sai mẫu Phương sai mẫu Sˆ2 = n n ¯ (Xi − X) i=1 Phương sai mẫu hiệu chỉnh S2 = n−1 n ¯ (Xi − X) i=1 Độ lệch chuẩn Sˆ = Sˆ2 √ Độ lệch chuẩn mẫu hiệu chỉnh: S = S ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 14 / 22 3.3 Các đặc trưng mẫu ngẫu nhiên 3.3.2 Phương sai mẫu Ý nghĩa kỳ vọng mẫu phương sai mẫu Kỳ vọng mẫu hay trung bình mẫu số đặc trưng vị trí trung tâm mẫu (xu số liệu mẫu tập trung quanh số đó), dùng để thay cho toàn số liệu mẫu Phương sai mẫu đặc trưng cho độ phân tán số liệu mẫu so với kỳ vọng mẫu X ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 15 / 22 3.3 Các đặc trưng mẫu ngẫu nhiên 3.3.3 Tỉ lệ mẫu Mô tả tổng thể biến ngẫu nhiên X nhận hai giá trị: X = phần tử có thuộc tính A đó, X = phần tử khơng có thuộc tính A X có bảng phân phối xác suất X P 1−p p - Tỉ lệ mẫu: F = n n Xi = i=1 m(A) n đó: m(A) số phần tử có tính chất A mẫu Tính chất • E(F ) = p • V ar(F ) = ĐH NTT p(1 − p) pq = n n XSTK-YH Ngày 20 tháng năm 2021 16 / 22 3.4 Các đặc trưng mẫu cụ thể 3.4.1 Với mẫu cho bảng phân phối thực nghiệm khơng ghép lớp X ni Trung bình mẫu: x ¯= x1 n1 n x2 n2 k ni xi i=1 Phương sai mẫu: k 1 sˆ = ni (xi − x ¯)2 = x2 − (¯ x)2 = n n i=1 ĐH NTT xk nk XSTK-YH k ni x2i − (¯ x)2 i=1 Ngày 20 tháng năm 2021 17 / 22 3.4 Các đặc trưng mẫu cụ thể 3.4.1 Với mẫu cho bảng phân phối thực nghiệm không ghép lớp Phương sai mẫu hiệu chỉnh: k n n s2 = ni (xi − x ¯)2 = sˆ = x2 − (¯ x)2 n−1 n−1 n−1 i=1 √ Độ lệch mẫu: sˆ = sˆ2 √ Độ lệch mẫu hiệu chỉnh: s = s2 m Tỉ lệ mẫu f = n m số phần tử có tính chất A số n phần tử khảo sát ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 18 / 22 Ví dụ Tính trung bình, phương sai hiệu chỉnh, độ lệch hiệu chỉnh mẫu cho bảng phân phối thực nghiệm sau xi n x ¯= x2 n = ni xi = ni x2i -20 10 20 30 40 50 2.(−20) + 1.10 + 2.20 + 2.30 + 2.30 + 1.50 = 20 10 n 2.(−20)2 + 1102 + 2.202 + 2.302 + 2.402 + 1.502 = = 920 10 n 10 s2 = x)2 = 920 − (20)2 ≈ 577, 78 x2 − (¯ n − √ s = s2 = 24, 037 ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 19 / 22 3.4 Các đặc trưng mẫu cụ thể 3.4.2 Với mẫu cho bảng phân phối thực nghiệm ghép lớp X ni a1 − b1 n1 a2 − b2 n2 Ta lấy đại diện cho lớp − bi xi = ak − bk nk + bi tính tốn bảng không ghép lớp ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 20 / 22 3.4 Các đặc trưng mẫu cụ thể 3.4.2 Với mẫu cho bảng phân phối thực nghiệm ghép lớp Ví dụ Doanh thu bán hàng (triệu đồng/ngày) công ty dược khảo sát theo ngày, kết nh sau: [200;220] (220;240] 17 (240;260] 32 (260;280] 68 (280;300] 40 (300;320] 24 (320;340] Tính doanh thu trung bình, độ lệch chuẩn hiệu chỉnh doanh thu, tỉ lệ số ngày cho doanh thu 300 triệu đồng ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 21 / 22 3.4 Các đặc trưng mẫu cụ thể 3.4.2 Với mẫu cho bảng phân phối thực nghiệm ghép lớp Giải - Kích thước mẫu: n = + 17 + 32 + 68 + 40 + 24 + = 194 - Tỉ lệ ngày có doanh thu 300 triệu đồng từ mẫu trên: f= m 24 + 33 = = n 194 194 Ta lập bảng tần số cho giá trị đại diện nhóm sau: xi ni 210 230 17 250 32 270 68 290 40 310 24 330 - Trung bình mẫu : x ¯ = 273.8144 - Độ lệch chuẩn mẫu: s = 26.7765 ĐH NTT XSTK-YH Ngày 20 tháng năm 2021 22 / 22 ... đồng từ mẫu trên: f= m 24 + 33 = = n 194 194 Ta lập bảng tần số cho giá trị đại diện nhóm sau: xi ni 210 230 17 250 32 270 68 290 40 31 0 24 33 0 - Trung bình mẫu : x ¯ = 2 73. 8144 - Độ lệch chuẩn mẫu:... [200;220] (220;240] 17 (240;260] 32 (260;280] 68 (280 ;30 0] 40 (30 0 ;32 0] 24 (32 0 ;34 0] Tính doanh thu trung bình, độ lệch chuẩn hiệu chỉnh doanh thu, tỉ lệ số ngày cho doanh thu 30 0 triệu đồng ĐH NTT XSTK-YH... 3. 3 Các đặc trưng mẫu ngẫu nhiên 3. 3 .3 Tỉ lệ mẫu Mô tả tổng thể biến ngẫu nhiên X nhận hai giá trị: X = phần tử có thuộc tính A đó, X = phần tử khơng có thuộc tính A X có bảng phân phối xác suất