Môn: Thực hành quản trị trên máy Add–ins của Microsoft Excel BÀI 3 Add–ins – là những chương trình bổ sung (add) các chức năng tùy chọn cho Excel nhằm giải quyết các bài toán thuộc các lãnh vực đặc thù trong quản lý và kỹ thuật … Cài đặt Add—ins How To? Các Add–ins trong Microsoft Excel ② Load ① Install 1 Môn: Thực hành quản trị trên máy Install Add—In How To? Thống kê ?? “The science of collecting and analyzing data for the purpose of drawing conclusions and making decisions.” Tamhane, AjitC., andDorothy D. Dunlop. Statistics and Data Analysis from Elementary to Intermediate. Prentice Hall, 2000, pp. 1. “Statistics are no substitute for...
Môn: Thực hành quản trị máy Add–ins Microsoft Excel Add–ins – chương trình bổ sung (add) chức tùy chọn cho Excel nhằm giải toán thuộc lãnh vực đặc thù quản lý kỹ thuật … BÀI Cài đặt Add—ins How To? ② Load Các Add–ins Microsoft Excel ① Install Môn: Thực hành quản trị máy Install Add—In How To? Thống kê ?? “The science of collecting and analyzing data for the purpose of drawing conclusions and making decisions.” Tamhane, AjitC., andDorothy D Dunlop Statistics and Data Analysis from Elementary to Intermediate Prentice Hall, 2000, pp “Statistics are no substitute for judgment.” Henry Clay Quá trình thống kê Thống kê mơ tả Descriptive Statistics Chọn mẫu Thu thập Tổ chức Thống kê suy diễn Inferential Statistics Tổng hợp Kiểm định Dự báo Quyết định Quy trình điều tra Mơn: Thực hành quản trị máy Số phần tử Số lượng phần tử tổng thể hữu hạn vơ hạn I Chọn mẫu A sample population and an entire population Số phần tử mẫu gọi cỡ hay kích thước mẫu Tổng số : 59 hs 29 hs nam Các khái niệm liên quan a Tổng thể mẫu A sample population and an entire population h Tín n”? ệ i id “ đạ Tổng thể (population) – tập hợp đầy đủ đối tượng chứa kiện liên quan tới lĩnh vực mà ta quan tâm tìm hiểu Mẫu (sample) – tập tổng thể mà dựa vào ta thu thông tin cần thiết 30 hs nữ Câu hỏi Với yêu cầu điều tra thống kê sau, xác định tổng thể mẫu Điều tra thời gian tự học sinh viên trường CĐKT Tp HCM Điều tra chiều cao sinh viên nam trường CĐKT Tp HCM Điều tra nhu cầu tiêu thụ bánh trung thu năm 2010 Tp HCM … Môn: Thực hành quản trị máy Thống kê / xác xuất Vấn đề thống kê: Cái thùng với bạn nắm tay ? Một số luật phân phối xác xuất Luật phân phối – mối quan hệ giá trị đại lượng ngẫu nhiên với xác xuất chúng “Qui luật đối tượng không theo qui luật” Vấn đề xác suất: Lấy biết thùng ? Đại lượng ngẫu nhiên Ngẫu nhiên: “không biết trước” Đại lượng ngẫu nhiên đại lượng nhận giá trị khác lần thử khác mà người ta khẳng định trước thực phép thử Phân phối đồng xác xuất (discrete uniform distribution) P(x1) = P(x2) = … = P(xi) = … = P(xn) = 1/n Trường hợp nguyên n = a – b + 1 – Đại lượng ngẫu nhiên rời rạc : nhận số lượng hữu hạn (đếm được) giá trị “cách quãng” – Đại lượng ngẫu nhiên liên tục : có giá trị lấp kín đoạn Ví dụ: Gieo xúc xắc mặt • kiện: xuất mặt 1, 2, 3, 4, 5, • Khả xuất mặt P1 = P2 = P3 = P4 = P5 = P6 = 1/6 Môn: Thực hành quản trị máy b Các phương pháp chọn mẫu Lý chọn mẫu nhược điểm điều tra toàn tổng thể: bất tiện, tốn kém, không khả thi ện? i d đại h Tín Một mẫu ngẫu nhiên mẫu phần tử tổng thể có may rủi đồng chọn làm phần tử mẫu Các phương pháp chọn mẫu ngẫu nhiên M Ngẫu nhiên L E TP Ngẫu nhiên đơn giản O B S KT C J I G A Q DL R M O B S H P E F N C Q H P E F N O BS O BS G A Q Ngẫu nhiên phân tầng Ngẫu nhiên theo nhóm Ngẫu nhiên giai đoạn Các phương pháp chọn mẫu có chủ định đơn giản phân tầng theo cụm giai đoạn L M O B R S K P E C T A I G Hệ thống Thuận tiện Theo mục đích S J K E P Thuận lợi L M D H Q F N Dễ tiếp cận Có chủ định KT C J I G A Q DL R M G A Q Các phương pháp chọn mẫu NN NN NN NN L AI O S E R J G B T Q C K H P M D F N T C J I R G B A O Q S K H P E F N D O B R S K P E C T A I G D J H Q F N Đánh giá đặc biệt T G S K Mục đích A B C D E F J G H I K L M N O P Q R S T Thứ tự B G L Q Hệ thống Môn: Thực hành quản trị máy c Xác định quy mô mẫu a Chon mẫu bảng số ngẫu nhiên Số thống kê lấy từ mẫu “tin cậy hơn”: mẫu 30, mẫu 60, mẫu 500, hay mẫu 1000 phần tử ? Bảng số ngẫu nhiên – danh sách số xếp không theo thứ tự hay theo khuôn mẫu Khả đại diên mẫu phụ thuộc vào tính ngẫu nhiên (khách quan) qui mô mẫu Để tạo bảng số ngẫu nhiên: • Sử dụng bảng số sách thống kê – Qui mơ nhỏ có khả đại diện • Dùng Calculator có chức Random – Qui mơ lớn tốn nhiều chi phí • Sử dụng Excel Qui mô mẫu cần lớn đến mức đạt chi phí hợp lý Cơng cụ chọn mẫu ngẫu nhiên • Cơng cụ Random Number Generation • Cơng cụ Sampling – Hàm RAND() RANDBETWEEN(bottom,top) dùng lấy giá trị ngẫu nhiên – Công cụ Random Number Generation – tạo bảng số ngẫu nhiên Công cụ Random Number Generation Tạo bảng số ngẫu nhiên theo luật phân bố xác xuất xác định Luật phân phối Đặc trưng Uniform Range (min max) Normal Mean Standard Deviation 68,2% 13,6% 2,1% –3 –2 – + 13,6% 2,1% +2 +3 Môn: Thực hành quản trị máy Trình tự Ra lịnh Tools Data Analysis Random Number Generation Trình tự ② ③ ④ ⑤ Nhập kích thước bảng số (cột x hàng) Chọn luật phân phối khai báo thông số Khai báo “Random Seed” (nếu cần) Ví dụ (Excel 2003) Chọn Output options ⓐ Tổ chức liệu • Nhập danh sách tổng thể • Đánh số thứ tự danh sách ⓑ ⓒ Tạo mẫu Tools Data Analysis Sampling a Chọn Input Range (vùng chứa số thứ tự) b Chọn phương án mẫu c Chọn Output options Ví dụ (Excel 2003) b Chọn mẫu ngẫu nhiên công cụ Sampling Công cụ chọn mẫu từ tổng thể theo phương pháp chọn mẫu ngẫu nhiên chọn mẫu hệ thống II Phân loại tổng hợp liệu Phân tổ & bảng phân phối tần số Lưu ý • Excel sử dụng phép chọn có hồn lại nên có giá trị chọn trùng lặp nhiều lần • Đối tượng lấy mẫu cần mã hóa cách đánh số thứ tự … để sử dụng lấy mẫu Môn: Thực hành quản trị máy Các khái niệm liên quan Câu hỏi Phân tổ – phân đối tượng “tương tự” vào chung tổ Tiêu thức phân tổ – thuộc tính dùng để phân tổ Căn theo tính chất biểu hiện: • Tiêu thức số lượng (lượng biến) • Tiêu thức thuộc tính (chất lượng) Phân tổ Các khảo sát sau nên phân điểm hay khoảng Chi tiêu dùng để photo tài liệu sinh viên Xếp loại cuối học kỳ Chiều cao học sinh Số tự học Câu hỏi • Phân điểm: khảo sát có giá trị vào tổ • Phân khoảng: khảo sát nằm phạm vi giá trị đưa vào tổ Trong điều tra thu nhập, xác định đáp án dành cho câu hỏi đóng “Thu nhập tháng bạn bao nhiêu” a b c Số giá trị đo Số khoảng thang đo d < 50 5–7 e 50 – 100 – 10 100 – 250 – 12 Giải thích sao? 250 10 – 20 Môn: Thực hành quản trị máy Phân khoảng – kích thước Ví dụ: phân tổ tập hợp N = 80 giá trị đo • Kích thước không 7.7 20.5 19.4 21.4 17.2 14.6 19.8 13.2 14.3 16.4 • Kích thước 20.8 28.6 24.4 31.9 20.0 23.0 15.6 17.7 19.4 18.2 12.9 21.0 9.1 27.6 20.1 17.5 15.1 22.6 17.9 18.8 Kích thước khoảng tính sau max( X ) min( X ) h n 13.2 23.2 12.6 15.3 11.8 19.7 24.7 20.6 14.4 15.6 16.8 16.5 14.6 13.4 23.7 18.3 14.6 15.0 20.3 20.5 16.5 18.9 25.8 18.9 19.1 7.7 17.8 26.5 14.2 20.8 11.4 23.6 18.1 15.2 12.6 22.2 18.3 20.4 17.5 16.1 21.2 16.9 5.0 16.6 28.8 20.3 12.7 12.0 16.3 23.2 Ví dụ Trình tự phân tổ Kích thước: ROUNDUP(($F$13-$F$12)/A16;0) Min: ROUNDDOWN($F$12;0) … đến 10 =$C16+$B16*E$15-0,1 … đến 10 =$C16+$B16*E$15 Công cụ Histogram Tìm giá trị đo nhỏ lớn Công cụ tạo Chọn số khoảng n (theo bảng) • Bảng phân phối tần số, tần số tích lũy Tính kích thước khoảng h = (xmax – xmin) / n • Biểu đồ tần suất Làm trịn h tới số “thuận tiện” • Đồ thị pareto Chọn x’ (nên giá trị đo nhỏ nhất) Tính khoảng sau phủ giá trị lớn xmin khoảng xmax khoảng cuối x’ x’+h khoảng x’+2h x’+3h khoảng khoảng …… x’+n.h khoảng cuối Môn: Thực hành quản trị máy Bảng phân phối tần số biểu đồ tần suất Bảng phân phối tần số chứa kết tổng hợp liệu phân tổ ① Biểu đồ tần suất (histogram) ② Công cụ cụ Excel • Tools/Data Analysis/ Histogram • Hàm FREQUENCY(data_array,bins_array) a Trình tự Chuẩn bị – Tổ chức liệu gốc vào vùng “input range” – Phân tổ xác định bin range Ra lịnh Tools Data Analysis Histogram b Tùy chọn Pareto Tập trung nỗ lực cải tiến nơi mà chúng có tác dụng lớn /20 c h hàng Quy tắc 80 o 20% d ả u q t ế k ng số bán 20% cô a ủ 80% doan h c ả u q t kế hẩm hỏng t 80% sản p ình sản xuấ tr u q g n o Ví dụ (Excel 2003) đoạn tr Câu hỏi Phát biểu quy tắc Pareto cho trường hợp sau Những phàn nàn khách hàng Sự bảo hành hay chi phí Các khuyết tật chất lượng Thời gian dừng máy Hoạt động bảo trì hư hỏng 0/2 c y tắ u Q Sự tận dụng nguyên vật liệu Các loại hỏng hóc nguyên nhân – Khai báo thông số Input Output Options Các chi phí tồn kho – Chọn biểu đồ (nếu cần) Doanh số bán hàng Ví dụ (Excel 2003) 10 Mơn: Thực hành quản trị máy Đặc trưng kết thống kê: Vị trí – nơi tập trung lớn kết đầu Độ phân tán – mức độ “biến động” hầu hết giá trị kết III Đặc trưng số liệu Hình dạng Tổng quan a Số thống kê thơng số Vị trí Độ phân tán Trung bình (mean) Khoảng biến thiên (range) Trung vị (median) Phương sai (variance) Mode Độ lệch chuẩn (Std Deviation) b Phân phối chuẩn – (Standard distribution) Khi kiện lấy từ mẫu, số đo lường mà người ta tính tốn để mơ tả mẫu gọi “số thống kê” (statistics) Ví dụ: ? hình dạng biểu đồ tần suất đối tượng thống kê sau Khi lấy từ tổng thể chúng gọi “thơng số” (parameters) • Độ tuổi người Việt Nam • Chiều cao sinh viên trường CĐKT • Mức chi tiêu hàng ngày dân cư Tp HCM Thông số cố định, số thống kê biến số Chỉ tiêu Số thống kê Thông số Trung bình X Độ lệch chuẩn S Phương sai S2 2 68,2% 13,6% 13,6% 2,1% 2,1% –3 –2 – + +2 +3 11 Môn: Thực hành quản trị máy Phân phối chuẩn – (Standard distribution) Đặc trưng: đại lượng ngẫu nhiên liên tục có đồ thị phân phối xác xuất hình chng Mean = Median = Mode 68,2% 13,6% 2,1% –3 –2 Phân phối Poisson 13,6% – + +2 2,1% +3 Phân phối đại lượng ngẫu nhiên rời rạc xác xuất số kiện xảy khoảng thời gian cố định kiện diễn với tốc độ trung bình biết trước độc lập với thời gian kể từ lần xuất kiện cuối trước Hầu hết giá trị phân phối tập trung quanh giá trị trung bình – Khoảng 68% giá trị ∈ khoảng – Khoảng 96% giá trị ∈ khoảng 2 – Khoảng 99.73% giá trị ∈ khoảng 3 Phân phối nhị thức – binomial distribution Phân phối xác xuất số lần thành công chuỗi n phép thử đúng/sai, giá trị có xác xuất p Ví dụ: Thả xúc xắc 10 lần đếm số lần xuất mặt phân phối nhị thức với n = 10 p = 1/6 Giả sử 5% sinh viên Tp HCM xe gắn máy Chọn ngẫu nhiên 500 sinh viên Số xe gắn máy chọn biến ngẫu nhiên tuân theo phân phối nhị thức với n = 500 p = 0,05 Ví dụ: Số gọi đến tổng đài điện thoại phút c Đo lường vị trí Trung bình số học (mean) Trung bình số học xác định vị trí tập trung số liệu • Giá trị đại diện cho tập số liệu “san cách biệt” • Dùng so sánh đánh giá tập số liệu với 12 Môn: Thực hành quản trị máy Ví dụ: dãy ?? Lần Giá trị (Xi) Mức lương tháng cửa hàng sau X = Xi / n = 33 / = 6,6 A NV 10,500 B NV 20,000 C NV 22,500 NV 24,000 D E NV 26,000 F NV 43,000 Xi 33 G Chủ 470,000 Lập bả bảng để để tính trung bì bình số số học Cộng Câu hỏi Lương trung bình cửa hàng : 616,000 / = ?? 616,000 Trung vị (median) Xác định trường hợp sử dụng công thức tính trung bình số học sau Trung vị giá trị vị trí tất số liệu thứ tự Mẫu có giá trị khác biệt Lưu ý: Nếu N chẵn, trung vị trung bình giá trị nằm Mẫu phân điểm (nhiều giá trị giống nhau) Mẫu phân khoảng x x ⓐn x xi f i ⓑ x n x i i N ⓒ 13 Môn: Thực hành quản trị máy Ví dụ: Mode dãy Lần Giá trị (Xi) Xi thứ tự 5 9 Giá trị xuất nhiều lần Mode dùng thay cho trung bình sử dụng tiêu thức chất lượng số trường hợp thực tiễn mà giá trị trung bình khơng có ý nghĩa Sắp thứ thứ tự để để tính trung vị vị Ví dụ Số liệu thống kê giới tính nhóm khảo sát cho kết nam (mã 1) nữ (mã 0) Chỉ tiêu trung bình theo giới tính nhóm là: (1 + 0) / = ½ ??? dãy Lần Giá trị (Xi) Tần số 2 Đếm tầ tần số số để để tính mode 14 Mơn: Thực hành quản trị máy Bình quân nửa gà Vấn đề Vừa qua, đợt thị sát đời sống xã hội tỉnh Trà Vinh, vị lãnh đạo có gặp gỡ người dân ơng nói lên niềm vui thấy số thu nhập bình quân đầu người tỉnh đạt 800 USD/năm Xét tập số 200, 202, 200, 203, 205, Nói xong, vị lãnh đạo muốn nghe ý kiến người dân Một nông dân nói: “Một người ăn nguyên gà, người đứng nhìn, tính bình qn người ăn nửa gà Nghe 800 USD tui ham lắm, chừng tui gia đình tui có Tuổi Trẻ - Thứ Tư, 21/11/2007 được!” Range = 205 – 200 = b Đo lường độ phân tán Khoảng biến thiên (range) Range = 205 – = 203 Giá trị có hợp lý khơng? Nếu bỏ qua giá trị cá biệt Hạn chế khoảng biến thiên: cần giá trị cá biệt đủ làm sai lệch kết Phương sai (variance) Miền giá trị giá trị thu thập Tập liệu có phương sai nhỏ bao gồm giá trị gần giống 6, 7, 6, 6, R = Xmax – Xmin Ví dụ dãy số 5, 8, 9, 5, ta có • Xmax = • Xmin = Range = – = Variance measures how different the individual values of the data are from one another Phương sai lớn, giá trị sai biệt lớn 598, 1, 134, 5, 92 15 Môn: Thực hành quản trị máy Phương sai (variance) độ lệch chuẩn (Standard Deviation) Hệ số biến thiên (Coefficient of Variation) • Xi – X sai số mức độ sai lệch so giá trị trung bình • Phương sai = trung bình tổng bình phương sai số x x S i n 1 n xi xi 2 2 V nn 1 S 100 x Hệ số biến thiên gọi sai số tương đối (relative deviation) dùng để so sánh phương sai với Sử dụng tập giá trị khác đơn vị hay khác giá trị trung bình • Độ lệch chuẩn = bậc phương sai SX S x x Ví dụ: S i n 1 n xi xi 2 Bài tập nn 1 Lần Giá trị (Xi) Xi – X (Xi – X)2 Xi2 –1,6 2,56 25 Cho tập gồm giá trị nguyên thỏa điều kiện sau 1,4 1,96 64 • Mean = 2,4 5,76 81 • Mode = –1,6 2,56 25 • Median = 5 –0,6 0,36 36 33 13,20 231 S2 = 13,2 /4 = 3,3 S = SQRT(3,3) = 1,8166 S2 = 5.(231) – (33)2 / x Hãy tìm tập giá trị đó? = (1155 – 1089) /20 = 66 / 20 = 3,3 S = SQRT(3,3) = 1,8166 16 Môn: Thực hành quản trị máy b Cơng cụ Descriptive Statistics Trình tự Công cụ xác định số thống kê Excel cho phép xác định số thống kê mẫu liệu nhiều cách: Tổ chức liệu – Nhập liệu gốc vào vùng (input range) – Đặt tên vùng liệu gốc Ra lịnh Tools Data Analysis Descriptive Statistics ② Hàm thố thống kê ① Công thứ thức thố thống kê – Khai báo thông số Input – Lựa chọn thông số Output Options ③ Công cụ cụ Descriptive Statistics a Hàm thống kê Ví dụ (Excel 2003) Sai số chuẩn (standard error) a) AVERAGE() Trung bình số học ① Trung vị ② Mode ③ Phương sai ④ Độ lệch chuẩn ⑤ Hệ số biến thiên ⑥ b) CORREL() c) COVAR() d) KURT() e) MEAN() SE trung bình mẫu giá trị ước lượng độ lệch chuẩn trình xác định đại lượng f) MEDIAN() g) MODE() h) SKEW() i) STDEV() j) VAR() k) VARP() 17 Môn: Thực hành quản trị máy Ngày Gà (con) Bò (kg) 46 39 55 41 43 25 48 30 54 46 65 36 36 37 40 23 51 30 10 53 33 11 64 50 12 32 44 13 41 41 14 46 28 15 53 35 Ví 16dụ (Excel 47 2003) 37 Bài tập: Phân tích lượng tiêu thụ thịt gà bị siêu thị X b Độ đối xứng Skewness Skewness dùng đo lường mức độ “đối xứng” phân phối xác suất biến ngẫu nhiên số thực ch? ệ l ộ đ ? Mức _? ố Đa s Đặc trưng dạng liệu a Độ nhọn – Kurtosis Ví dụ: Thống kê kết thi Kurtosis dùng đo “độ nhọn” đỉnh đồ thị phân phối xác suất biến ngẫu nhiên số thực Kurtosis cao có nhiều sai lệch biến động bất thường ? lệch h n độ c u?? c ứ M đề ồng đ ự S 18 Môn: Thực hành quản trị máy c Tính thời vụ chuỗi thời gian Thời vụ thời gian liệu “lặp lại” Ví dụ: Tuần thời vụ có giai đoạn, năm thời vụ có giai đoạn The End Hệ số thời vụ Gán trọng số cn cho kỳ hạn (N kỳ) 19 ... thang đo d < 50 5–7 e 50 – 100 – 10 100 – 250 – 12 Giải thích sao? 250 10 – 20 Môn: Thực hành quản trị máy Phân khoảng – kích thước Ví dụ: phân tổ tập hợp N = 80 giá trị đo • Kích thước... chuẩn S Phương sai S2 2 68,2% 13,6% 13,6% 2,1% 2,1% –3 –2 –? ?? + +2 +3 11 Môn: Thực hành quản trị máy Phân phối chuẩn – (Standard distribution) Đặc trưng: đại lượng ngẫu nhiên... hết giá trị phân phối tập trung quanh giá trị trung bình – Khoảng 68% giá trị ∈ khoảng – Khoảng 96% giá trị ∈ khoảng 2 – Khoảng 99.73% giá trị ∈ khoảng 3 Phân phối nhị thức – binomial