Sau khi học xong bài giảng này, bạn sẽ nắm được nhu cầu về thống kê; nắm được các khái niệm cơ bản của phương thức dùng để nhận biết đặc điểm dữ liệu và nắm được cách tính xác suất và các thống kê cơ bản sử dụng phần mềm thống kê minitab. Mời các bạn tham khảo!
Thố ng kê cơ ban ̉ Phân tích thống kê cơ ban ̉ Phân bố xác xuất rời rac ̣ Phân bố xác xuất liên tuc̣ Muc tiêu hoc tâp ̣ ̣ ̣ Nắm được nhu cầu về thống kê Nắm được các khái niệm cơ bản của phương thức dùng để nhận biết đặc điểm dữ liệu Nắm được khái niệm cơ bản của phân bố xác suất Nắm được cách tính xác suất và các thống kê cơ bản sử dụng phần mềm thống kê minitab Thớ ng kê cơ ban? ̉ Đinh nghi ̣ ̃ a về thớ ng kê Q trình tính tốn số lần, tần suất hoặc tỉ lệ… thể hiện các đặc điểm của dữ liệu bằng cách phân tích, tổng hợp dữ liệu cụ thể hoặc thơng tin hay là các giá trị tính được bằng số Sử dung thô ̣ ́ ng kê – trong 6 Sigma Được sử dung đê phân ti ̣ ̉ ́ch dữ liêu (vd. nh ̣ ững giá tri đăc tr ̣ ̣ ưng) được thu thâp ̣ từ giai đoan đo l ̣ ường Định lượng dữ liệu biểu thị đặc tính q trình X’s và Y’s Dùng để ước tính tương lai với dữ liệu đã có trong q trình hoạt động Dùng như là một cơ sở để giải quyết các vấn đề phức tạp về thống kê Phân loai vê ̣ ̀ thớ ng kê Thớ ng kê mơ ta ̉ Các thống kê liên quan đến những đặc điểm cơ bản của dữ liệu. Chúng cung cấp những phần tóm tắt đơn giản về dữ liệu thống kê (với các thống kê mơ tả đơn giản bạn chỉ mơ tả những gì dữ liệu thể hiện) Mục đích chính của thống kê mơ tả là mơ tả thuộc tính /đặc điểm của nhóm thống kê đã quan sát Thớ ng kê suy ln ̣ Thống kê cố gắng xác định các đặc trưng bằng cách phân tích mẫu thu được từ một tập hợp Khá i quá t về thố ng kê cơ ban ̉ Cầ n thiế t cho thố ng kê Khái niệm thống kê – thứ ngơn ngữ dựa trên thực tế chứ khơng phải trực giác. Thống kê hỗ trợ việc đưa ra quyết định trong những tình huống chưa chắc chắn bằng cách thu thập, phân tích và biên dịch dữ liệu Đây là lầ n đầ u tiên trong 19 năm qua, nhiêt đơ v ̣ ̣ ượt quá ngưỡ ng 38℃ Vây thi ̣ ̀ ,đây là lầ n nó ng nhấ t cho chú ng ta… Thố ng kê cung cấ p nhữ ng thông tin cơ ban câ ̉ ̀ n thiế t cho viêc quyê ̣ ́ t đinh ̣ Điên năng tiêu thu ti ̣ ̣ ́ nh trên đầ u ngườ i đã tăng 3 lầ n kê t ̉ ừ năm 1980 Thố ng kê? Biế n đôi th ̉ ực tế thà nh nhữ ng con số ! Thât không? ̣ Chú ng ta phai đâ ̉ ̀ u tư xây dựng nhiề u nhà má y năng lượng hơn nữ a… Thố ng kê cơ ban ̉ Thống kê nhận biết các đặc trưng của tập hợp cho trước từ một mẫu Tâp h ̣ ợp > 50 Phân bô Phân bố́ th thươ ườ̀ng ng Mean≥5 Phân bơ Phân bớ́ Poisson Poisson Phân bớ xá c ś t liên tuc̣ Phân bớ bình thường Như nghĩa của từ “bình thường” chỉ ra, đó là sư phân bố dữ liêu ̣ tự nhiên nhất. Nếu như dữ liêu khơng tn theo s ̣ ự phân bố bình thường, thì chắc chắn để khẳng định rằng quy trình liên quan cần được cải tiến Tính toán xác śt sử dung cơng ̣ thức thât khơng ̣ dễ chút nào !!! 68.26 % Phân bớ bình thường là : 1) Đới xứng, 2) Hình qua chng, ̉ 3) Cũng được goi la ̣ ̀ đường cong Gauss 95.45 % 99.73% m m+1s m+2s m+3s m3s m2s m1s Phân bớ bình thường được trình bày bởi 2 thơng sớ là trung bình và biến thiên (hoăc đơ lêch chn). ̣ ̣ ̣ ̉ Nếu như X là biến số xác suất bình thường với trung bình là μ và biến thiên 2, chức năng mật độ xác suất như sau: X ~ N(μ ,σ ) f ( x) e (x )2 , x Phân bớ bình thường tiêu chuẩn (Phân bớ chuẩn) Phân bố bình thường với trung bình là 0 và độ lệch tiêu chuẩn là 1 thì được gọi là phân bố chuẩn Chn hóa Z ̉ Phân bớ bình thường (Mean μ, Variance σ 2) Xác śt biến thiên X ~ N(μ, σ2) Phân bố bình thường X ~ N( , ) Độ lệch chuẩn X1 Trung bình Tiêu chuân phân bô ̉ ́ chuẩn (Trung bì nh 0, Đô lêch chuân 1) ̣ ̣ ̉ Xác suất biến thiên Z ~ N(0,1) ? Z Z chuyên đôi ̉ ̉ Tiêu chuẩn phân bố chuẩn Z ~ N (0,12 ) Zi xi Z Phân bớ bình thường tiêu chuẩn (Phân bớ chuẩn) Ví du ) Ai gioi h ̣ ̉ ơn, Chanho Park or Ronaldo? ① Chanho Park– 15 wins 68.26 % -4 -3 -2 -1 95.45 % 99.73 % ( MLB Pitcher Mean: 9 wins, Standard Deviation: 3 wins) ② Ronaldo – 10 goals (Real Madrid striker Mean: 6 goals, Std. Deviation: 3 Chúng ta không thê so sa ̉ ́nh những điều khác goals) nhau bằng cách tạo ra nền tảng so sánh giống nhau? (Tiêu chuân ho ̉ ́a) X - Mean Phân bố chuẩn cho phép so sánh khách quan các dữ liêu khác nhau ! ̣ Z= Z= Standard Deviation x- 15 - =2 Chanho Park Z = 10 - Ronaldo Z = =1.33 Chanho Park chơi giỏi hơn Ronaldo!! Tí nh toá n xá c ś t sử dung Minitab ̣ Ví du)̣ Tính xác suất sau đây cho sự phân bố bình thường với trung bình là 20 và đơ ̣ lêch chu ̣ ẩn 5 ( a ) Xác suất cua X ≤15 ̉ P [1 X ≤ 15 ] = P[ Z ≤ 155 20 ] Calc > Probability Distribution > Normal 15 20 X ? = -1 Z Vẽ biêu đô ̉ ̀ đê giu ̉ ́p dễ hiêu h ̉ ơn! Xa ̣ ̣ ́ t qua Xá c nhân kê ́ c nhân kê ́ t quả ̉ 0.1587 = 15.87% 0.1587 = 15.87% Trong Minitab, luôn tính bắt đầu từ bên trái Phân bố xá c suấ t liên tuc̣ Tí nh toá n giá tri xa ̣ ́ c suấ t sử dung phân bô ̣ ́ xá c suấ t cua ̉ Minitab • Mât đô xa ̣ ̣ ́ c suấ t (Hàm mât đô xa ̣ ̣ ́ c suấ t) Nhâp x ̣ Tính toán hàm mât đô xa ̣ ̣ ́c suất f (x) f (x) x • Xá c suấ t tí ch lũ y Nhâp ̣ x F (x) Tính toán xác suất tích lũy F (x) x • Đao ng ̉ ược xá c suấ t tí ch lũ y Nhâp xa ̣ ́c suất tích lũy F (x) Tính toán giá tri x t ̣ ương ứng F (x) x Tí nh toá n xá c ś t sử dung Minitab ̣ Ví du)̣ Tính xác suất sau đây cho sự phân bố bình thường với trung bình là 20 và đơ lêch chu ̣ ̣ ẩn là 5 ( a ) Xác suất cua X ≥ 30 ̉ P 1[ X 30 ] = - P[ X ≤ 30] Calc > Probability Distribution > Normal 20 30 x Vẽ biêu đô ̉ ̀ đê giu ̉ ́p dễ hiêu h ̉ ơn! Xa ̣ ̣ ́ t qua Xá c nhân kê ́ c nhân kê ́ t quả ̉ = 10.977250 = 10.977250 = 0.022750 = 0.022750 Đo Đó la ́ là , 2.2750% ̀ , 2.2750% Vùng nào tương ứng với xác suất? Trong Minitab, ln tính bắt đầu từ bên trái 20 30 x Tính toán xác suất sử dụng Minitab Ex) Tính xác suất sau cho phân bố bình thường với trung bình 20 đợ lệch chuẩn là ( a ) Xác suất của X là : 10 ≤ X ≤ 25 P [1 10 ≤ X ≤ 25 ] = P[ X ≤ 25 ] – P[ X ≤ 10 ] 10 20 25 x Tra l ̉ ờ i ??? Tó m tắ t Thống kê là cách thực hành đê tính ̉ số lần, tần suất hoặc tỷ lệ thức… mà hiên thi ̉ ̣ các đặc tính dữ liêu b ̣ ằng việc phân tích – tóm tắt thơng số hoặc thơng tin cụ thể, hoặc số được tính. Thống kê đưa ra ngơn ngữ mà dựa trên số liệu, khơng phải trực giác, và các hỗ trợ để ra quyết định trong các tình huống khơng chắc chắn. Phân bố xác suất cho bạn biết xác suất biến thiên ngẫu nhiên đưa ra các giá trị cụ thể chắc chắn hoặc giá trị trong pham vi xác đ ̣ ịnh Phân loaị Phân bố xá c suấ t rờ i rac̣ Loaị Phân bố nhi th ̣ ứ c Đăc ti ̣ ́nh Đai diên s ̣ ̣ ố dữ liêu v ̣ ề sai hỏng Sử dung ̣ Phân bố Poisson Phân bố xá c ś t liên tuc̣ Phân bớ bình thườ ng Đai diên d ̣ ̣ ữ liêu v ̣ ề Đai diên d ̣ ̣ ữ liêu liên ̣ l ỗi tuc̣ Phân bớ chn ̉ Phân bớ thường với Trung bình = 0 và Đo lêch chn = 1 ̣ ̣ ̉ Tính xác suất mà các Tính xác suất của thơng hàm đều nhau sẽ sảy số có 2 tác động có thể So sánh khách quan hai ra trong các đơn vị cụ Tính toán xác śt loại trừ lẫn nhau như nhóm khác nhau của thể (khu vực, thời cua d ̉ ữ liêu liên tuc ̣ ̣ tốt/xấu hoặc thành dữ liêu liên t ̣ ục gian, khoẳng trống, công/thất bại hoặc nghành Bà i tâp th ̣ ực hà nh 1. % các phần bị lỗi trong quy trình đã cho là 5%. Tính xác suất mà mẫu 15 đơn vị được đưa ra từ quy trình có 3 hoặc ít hơn bị lỗi 2. Trong kiêm tra nhâp ha ̉ ̣ ̀ng, % cua linh kiên lô ̉ ̣ ̃i khi kiêm nghiêm la ̉ ̣ ̀ 10%. Khi kiêm tra 100 linh kiên, tra l ̉ ̣ ̉ ời những câu hoi sau. ̉ (a) Xác suất số lần linh kiên bi lô ̣ ̣ ̃i khi kiêm tra la ̉ ̀ 15 hay nho h ̉ ơn ? (b) Xác suất số lần linh kiên bi lô ̣ ̣ ̃i khi kiêm tra nê ̉ ́u là 20 hay nhiều hơn? 3. Trong một cơng ty phát hành thẻ tín dụng, Phịng thanh tốn hóa đơn muốn kiểm sốt các lỗi viết hóa đơn. Khi số lần lỗi mỗi hóa đơn dùng dạng phân bố Poisson có trung bình là 0,05, Xác suất là bao nhiêu mà có một hoặc ít lỗi hơn trong các hóa đơn được chọn ngẫu nhiên?? 4. Trung bình trọng lượng sản phẩm sản suất trong quy trình đóng gói là 5 kg, và đơ l ̣ ệch chuẩn là 0,5 kg. Khi chọn sản phẩm tách ra khỏi chúng, thì xác suất là bao nhiêu mà trọng lượng tương đương hoặc lớn hơn 5kg và ít hơn 5.5 kg? Answers 1. 0.9945 2. (a) 0.9601 (b) 0.0020 3. 0.9953 4. 0.3413 ... Dùng để ước tính tương lai với dữ liệu đã có trong q trình hoạt động Dùng như là một? ?cơ? ?sở để giải quyết các vấn đề phức tạp về? ?thống? ?kê Phân loai vê ̣ ̀ thớ ng? ?kê? ? Thớ ng? ?kê? ?mơ ta ̉ Các? ?thống? ?kê? ?liên quan đến những đặc điểm? ?cơ? ?bản? ?của dữ liệu. Chúng ... cung cấp những phần tóm tắt đơn giản về dữ liệu? ?thống? ?kê? ?(với các thống? ?kê? ?mơ tả đơn giản bạn chỉ mơ tả những gì dữ liệu thể hiện) Mục đích chính của? ?thống? ?kê? ?mơ tả là mơ tả thuộc tính /đặc điểm của nhóm? ?thống? ?kê? ?đã quan sát... ng? ?kê? ?suy ln ̣ Thống? ?kê? ?cố gắng xác định các đặc trưng bằng cách phân tích mẫu thu được từ một tập hợp Khá i quá t về thố ng? ?kê? ?cơ? ? ban ̉ Cầ n thiế t cho thớ ng? ?kê? ? Khái niệm? ?thống? ?kê? ?– thứ ngơn ngữ dựa trên thực tế chứ khơng phải trực