Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 1

55 53 0
Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng Ứng dụng công cụ phân tích dữ liệu: Phần 1 cung cấp cho học viên những kiến thức về dữ liệu và thống kê, thống kê học trong kinh doanh, vai trò của phân tích định lượng trong kinh doanh; phân tích dữ liệu mô tả với các công cụ phân tích dữ liệu, tổ chức và trình bày dữ liệu, các kỹ thuật khai phá dữ liệu;... Mời các bạn cùng tham khảo!

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG  KHOA MARKETING BÀI GIẢNG ỨNG DỤNG CƠNG CỤ PHÂN TÍCH DỮ LIỆU NGUYỄN NGỌC ANH HàNội 2017 Lời nói đầu Chương 1: Dữ liệu thống kê 1.1 Thống kê học kinh doanh 1.1.1 Khái niệm 1.1.2 Vai trò 1.2 4 Cơng cụ phân tích liệu 1.2.1 Tổng quan 1.2.2 Những công cụ chủ yếu 1.3 12 Vai trị phân tích định lượng kinh doanh 15 Chương 2: Phân tích liệu mơ tả với cơng cụ phân tích liệu 2.1 Định nghĩa thu thập liệu 2.1.1 Xác lập loại kiểu biến 2.1.2 Chia độ đánh giá biến 2.1.3 Thu thập liệu 29 2.1.4 Các phương pháp lấy mẫu 2.1.5 Các lỗi khảo sát 33 2.2 18 18 23 31 Tổ chức trình bày liệu 34 2.2.1 Tổ chức liệu phân loại liệu số 2.2.2 Trình bày liệu phân loại liệu số 2.2.3 Tổ chức trình bày nhiều biến 41 2.2.4 Pivot table phân tích kinh doanh 43 34 37 2.3 45 Các kỹ thuật khai phá liệu Chương 3: Kiểm định giả thuyết thống kê với cơng cụ phân tích liệu 3.1 Ước lượng khoảng tin cậy 3.1.1 Điểm ước lượng 51 3.1.2 Khoảng tin cậy cho số trung bình 3.1.3 Khoảng tin cậy cho tỷ lệ 55 3.2 Kiểm định giả thuyết 51 52 57 3.2.1 Tổng thể đơn 67 3.2.2 Tổng thể kép 69 3.2.3 Chi bình phương Phi tham số 3.2.4 Phân tích phương sai 85 76 Chương 4: Các cơng cụ phân tích liệu cho mơ hình thơng kê, dự báo 4.1 Phân tích hồi quy tương quan 4.1.1 Phân tích hồi quy tuyến tính đơn 4.1.2 Phân tích hồi quy đa biến 99 4.1.3 Phân tích tương quan 103 4.2 92 92 Mơ hình dự báo 108 4.2.1 Danh mục số để đánh giá hoạt động kinh doanh 4.2.2 Phương pháp chuỗi thời gian cho dự báo 112 108 1|Page 4.2.3 Ứng dụng kinh doanh 125 2|Page Lời nói đầu Như bạn biết, thập kỷ gần đây, tiến "xử lý liệu" dẫn tới hội kinh doanh sau máy tính để bàn tăng lên Rồi Information Age đời Khoa học máy tính trở thành thứ không ứng dụng vào chương trình giảng dạy tốn học lĩnh vực nghiên cứu mới, hệ thống thơng tin máy tính xuất Gần đây, tiến công nghệ thông tin kết hợp với kỹ thuật phân tích liệu để tạo hội khoa học liệu xử lý liệu khoa học máy tính Thế giới thống kê kinh doanh phát triển lớn hơn, va chạm vào lĩnh vực khác Thời gian làm thay đổi dạy thống kê kinh doanh giảng dạy quan trọng Chúng quen với việc suy nghĩ thay đổi, tìm cách để liên tục cải tiến việc giảng dạy thống kê kinh doanh dẫn tới nỗ lực Chúng cập nhập textbook, course giới để cập nhật thông tin kỹ thuật, phương pháp thống kê học kinh doanh thời kỳ liệu lớn – big data Do chúng tơi cố gắng phát triển giảng giáo khoa thống kê kinh doanh sách tập thảo luận sử dụng phần mềm thống kê kết hợp "máy tính" Nền tảng giảng với phần lý thuyết thống kê liên đến ngành cách phân tích, tiếp sách tập với nhiều ví dụ thực tế để đáp ứng thay đổi công nghệ liệu kinh doanh hôm Bài giảng nhằm mục đích cho sinh viên, người cần phải có đánh giá cao vai trò thống kê việc định quản lý kinh doanh Việc xử lý liệu thống kê kinh doanh có liên quan đến tất lĩnh vực hoạt động kinh doanh tất chức quản lý (marketing, tài chính, nhân sự, điều hành logistics, kế tốn, hệ thống thông tin công nghệ) Thống kê cung cấp thơng tin dựa chứng làm cho trở thành công cụ hỗ trợ định quan trọng quản lý Các bạn hướng dẫn nguyên tắc học tập quan trọng này:  Giúp bạn thấy liên quan thống kê với nghiệp bạn cách cung cấp ví dụ rút từ lĩnh vực hẹp mà bạn chun mơn  Nhấn mạnh việc giải thích kết thống kê qua tính tốn tốn học  Cung cấp cho bạn nhiều kinh nghiệm việc hiểu cách áp dụng thống kê vào kinh doanh  Làm quen với thông kế cách sử dụng phần mềm thống kê để hỗ trợ việc định kinh doanh  Cung cấp hướng dẫn rõ ràng cho học sinh sử dụng ứng dụng thống kê Quyển giảng kết hợp với tài liệu cập nhập để giúp cho trình học thực hành bạn tốt Vì bạn sống thời kỳ thay đổi diễn 3|Page Chương 1: Dữ liệu thống kê Mỗi ngày gặp nhiều liệu yêu cầu phải xử lý Việc phân tích liệu dự báo thực từ liệu, phần thống kê Hầu giai đoạn hoạt động người kết hợp thống kê, hầu hết người khơng biết họ sử dụng Chúng tơi giới thiệu số thuật ngữ quan trọng giúp mơ tả khía cạnh khác thống kê tầm quan trọng thực tiễn chúng Chúng sử dụng thuật ngữ thường xun suốt phần cịn lại giảng Có lẽ bạn quen thuộc với số thuật ngữ này, từ việc đọc nghe thăm dò ý kiến, khảo sát quảng cáo sản phẩm tràn lan Mục tiêu phần giải thích bạn biết cách sử dụng thống kê khuôn khổ thuật ngữ mơ tả sau sử dụng để giải thích nơi chúng đến từ chúng có ý nghĩa thực Sự hiểu biết đắn ý tưởng khái niệm thống kê giúp bạn hiểu trị gia nhà quảng cáo nói gì, khơng nói Nhưng giúp bạn hiểu rõ giới thực xung quanh chúng ta, bao gồm kinh doanh, tài chính, y tế, xã hội – lĩnh vực hoạt động người đại 1.1 Thống kê học kinh doanh Khi nhà quản lý thông báo rõ hoạt động nội cơng ty (ví dụ bán hàng, sản xuất, mức tồn kho, thời gian đưa thị trường, tuyên bố bảo hành) cạnh tranh (ví dụ thị phần, hài lòng khách hàng, bán hàng lặp lại) họ hành động thích hợp để cải thiện kinh doanh Người quản lý cần thông tin tin cậy, kịp thời để họ phân tích xu hướng thị trường điều chỉnh theo điều kiện thị trường thay đổi Dữ liệu tốt giúp công ty định loại thông tin chiến lược họ nên chia sẻ với đối tác kinh doanh đáng tin cậy để cải thiện chuỗi cung ứng họ Thống kê phân tích thống kê cho phép đưa định dựa liệu giảm gánh nặng cho nhà quản lý quản lý dự đoán Thống kê phần quan trọng lĩnh vực kinh doanh thông minh, bao gồm tất công nghệ để thu thập, lưu trữ, truy cập phân tích liệu hoạt động công ty để đưa định kinh doanh tốt Thống kê giúp chuyển đổi liệu "thơ" khơng có cấu trúc (ví dụ: liệu điểm bán hàng, mẫu chi tiêu khách hàng) thành thơng tin hữu ích thơng qua xử lý phân tích trực tuyến (OLAP) data mining, thuật ngữ mà bạn gặp phải lớp kinh doanh khác bạn Trong phần mềm sở liệu mạnh mẽ hệ thống truy vấn chìa khố để quản lý kho liệu công ty, SPSS Excel dùng phổ cập Việt Nam lý SPSS Excel bật giảng Nói tóm lại, cơng ty ngày sử dụng phân tích kinh doanh để hỗ trợ định, nhận bất thường cần có hành động chiến thuật để đạt nhìn sâu sắc chiến lược, để xếp quy trình kinh doanh với mục tiêu kinh doanh Trả lời với câu hỏi "Sự kiện có khả nào?" xu hướng tiếp tục? "sẽ dẫn đến hành động thích hợp Các doanh nghiệp kết hợp đánh giá quản lý với phân tích thống kê thành công 1.1.1 Khái niệm : Cách không lâu, sinh viên kinh doanh không quen thuộc với liệu từ có kinh nghiệm xử lý liệu Hôm nay, bạn truy cập trang web cơng cụ tìm kiếm "hỏi" thiết bị di động bạn câu hỏi, bạn xử lý liệu Và bạn "check in" vào 4|Page nơi đó, biểu thị bạn "thích" đó, khơng chia sẻ sở thích ý kiến bạn, bạn tạo liệu Bạn hầu hết đồng ý sở phim ảnh, phim truyền hình tiểu thuyết, nhân vật thu thập "rất nhiều liệu" để khám phá âm mưu tình báo, báo trước thiên tai bắt người phạm tội Bạn nghe thấy lo ngại cách phủ doanh nghiệp "theo dõi" bạn cách làm công ty truyền thông xã hội lớn khai thác liệu cá nhân bạn lợi nhuận Bạn nghe từ « liệu » nơi chí mua "gói liệu" cho điện thoại thông minh bạn Theo cách tổng quát, liệu thật giới hầu hết liệu dường : số mà 49% học sinh bỏ phiếu cho thấy hữu ích khóa học thống kê kinh doanh 50% dân số bỏ phiếu đồng tình quốc gia hướng, tỷ lệ thất nghiệp giảm 3%, tài khoản mạng xã hội người bạn thân bạn có 835 bạn bè 202 viết gần mà bạn chưa đọc Bạn khơng thể khỏi liệu giới số Vậy, bạn nên làm gì? Bạn cố gắng lờ liệu tiến hành kinh doanh cách dựa vào linh cảm cảm giác dựa vào kinh nghiệm bạn Nhưng đơi dựa vào linh tính phải trả giá, q trình khác so với quy trình logic mà khóa học thơng kê học kinh doanh cố dạy cho bạn để bạn trở thành nhà quản lý định tốt Nếu bạn muốn sử dụng cảm xúc hay linh tính, có lẽ bạn khơng nên thời gian học làm nhà quản lý tốt Bạn để ý thấy có nhiều liệu giới - phần nhỏ bé liệu giới, mà bạn xử lý hết Bạn né tránh hiểu liệu sử dụng tóm tắt người khác thay phải hiểu Ví dụ, bạn đầu tư tiền bạn cho quỹ đầu tư quan tâm đến mức "lợi nhuận" mà tiền bạn tạo năm Có thể bạn thực số thống kê khứ Bạn tạo biểu đồ để tóm tắt liệu giá trị trung bình tổng Ngay bạn hồn thành tồn khóa học thống kê khứ gần đây, bạn có chuẩn bị kỹ lưỡng cho tương lai khơng? bạn có biết tiến liên tục cơng nghệ thơng tin định hình thống kê thời đại? Bạn có quen thuộc với cách hiển thị liệu cách hiển thị khơng tồn trước đây, khó để phân tích, chưa biết đến rộng rãi gần đây? bạn có hiểu thống kê ngày sử dụng để "lắng nghe" mà liệu nói cho bạn khơng cách để chứng minh điều bạn muốn liệu muốn nói? Và, có lẽ quan trọng nhất, bạn có kinh nghiệm làm việc với kỹ thuật kết hợp số liệu thống kê ngành kinh doanh khác để tăng cường độ xác cho định? Cụ thể, bạn có am hiểu phân tích kinh doanh? lĩnh vực lên "việc sử dụng liệu rộng rãi, phân tích thống kê định lượng, mơ hình giải thích dự báo, quản lý thực tế để đưa định hành động" Vậy theo nghĩa rộng nhất, định nghĩa nghiên cứu thống kê phương pháp chiết xuất thông tin hữu ích từ liệu Ba bước điều cần thiết để làm thống kê tốt Trước tiên, phải tìm liệu, hai hồn chỉnh khơng có trình bày sai hay xuyên tạc Thứ hai, phải sử dụng cơng cụ thống kê thích hợp, tùy thuộc vào liệu bạn có Cuối cùng, thành phần quan trọng phân tích thống kê thực tốt truyền đạt rõ ràng thông tin vào ngôn ngữ viết Hoặc thống kê khoa học thu thập, tổ chức, phân tích, diễn giải trình bày liệu Một số chuyên gia thích gọi thống kê khoa học liệu, ba nhiệm vụ liên quan đến mơ hình hóa liệu, phân tích định Do thống kê định nghĩa 5|Page tập hợp cơng cụ kỹ thuật dựa tốn học để biến đổi liệu thô (chưa qua xử lý) thành số tóm tắt đại diện cho thơng tin hữu ích hữu dụng để hỗ trợ định hiệu Các biện pháp tóm tắt sử dụng để mô tả mô hình liệu, kiểm tra mối quan hệ liệu xác định xu hướng liệu theo thời gian Dưới số định nghĩa khác 1.1.2 Vai Trò : Đối tượng thống kê bao gồm việc nghiên cứu cách thu thập, phân tích diễn giải liệu Dữ liệu kiện số liệu để từ có đưa kết luận Những kết luận quan trọng việc định nhiều ngành nghề nghề nghiệp Ví dụ, nhà kinh tế sử dụng kết luận từ liệu thất nghiệp lạm phát để giúp phủ đưa định sách Các nhà hoạch định tài sử dụng xu hướng gần giá thị trường chứng khoán điều kiện kinh tế để đưa định đầu tư Các kế toán sử dụng liệu mẫu liên quan đến doanh thu bán hàng thực tế công ty để đánh giá liệu doanh thu bán hàng tuyên bố công ty hợp lệ hay không Các chuyên gia marketing giúp doanh nghiệp định sản phẩm thị trường để phát triển cách sử dụng liệu cho thấy sở thích người tiêu dùng Người giám sát sản xuất sử dụng liệu sản xuất để đánh giá, kiểm soát nâng cao chất lượng sản phẩm Các trị gia dựa vào liệu từ thăm dị ý kiến cơng chúng để xây dựng luật lập chiến lược chiến dịch tranh cử Các bác sĩ bệnh viện sử dụng liệu hiệu thuốc phẫu thuật để cung cấp cho bệnh nhân cách điều trị tốt Thường nhà thông kê học phân chia nghiên cứu thống kê thành hai ngành: thống kê mô tả (descriptive statistics) thống kê suy luận (inferential statistics) Thống kê mơ tả đề cập tóm tắt đến khía cạnh quan trọng liệu Điều bao gồm thu thập liệu, tổ chức liệu, sau trình bày liệu biểu mẫu biểu đồ bảng biểu Ngoài ra, thường tính phép tốn đo số để tóm tắt, ví dụ, giá trị điển hình liệu biến thiên liệu Ngày nay, kỹ thuật gặp phải số liệu thống kê mô tả cho việc áp dụng thống kê rõ - phong phú thông tin định lượng thu thập xuất ngày xã hội Tỷ lệ thất nghiệp, tỷ lệ ủng hộ Tổng thống, số công nghiệp Dow Jones, mức trung bình tỷ lệ tội phạm, tỷ lệ ly vài số "số liệu thống kê" tìm thấy tờ báo có uy tín số thường xuyên Tuy nhiên, thống kê mô tả quen thuộc, phương pháp đại diện cho phần nhỏ ứng dụng thống kê học Sự tăng trưởng phi thường thống kê học chủ yếu lĩnh vực gọi thống kê suy luận Nói chung, số liệu thống kê giả định đề cập đến kết luận rút từ tập hợp liệu lớn gọi dân số/mật độ dân số dựa liệu mẫu nhỏ Dân số xác định tất thành viên nhóm cụ thể (khơng thiết người), mẫu nhóm nhỏ dân số cụ thể Trong hầu hết ứng dụng thống kê phải dựa vào liệu mẫu để đưa suy luận đặc điểm khác dân cư Ví dụ, khảo sát năm 2010 1.208 cử tri đăng ký thăm dị ngày hơm Mỹ Gallup Poll cho thấy hiệu công việc Tổng thống Obama 41% số người hỏi đánh giá, mức thấp ông thăm dị Gallup từ ơng lên đại sứ tháng năm 2009 Các nhà nghiên cứu sử dụng kết mẫu này, gọi mẫu thống kê, nhằm ước tính tham số dân số tương ứng chưa biết Trong trường hợp này, tham số quan tâm tỷ lệ phần trăm tất cử tri đăng ký xem hiệu suất công việc Tổng thống làm cho nhân dân đất nước Thơng thường khơng khả thi để có liệu dân số tính trực tiếp thơng số có liên quan chi phí cao / tính thực tiễn khơng khả thi 6|Page Hình 1.1.2A Thơng kê học quản lý : Khi số lượng lớn giá trị liệu thu thập, tóm tắt, phân tích trình bày theo cách thức dễ đọc thơng tin hữu ích sử dụng cho việc hỗ trợ định quản lý Đây vai trò Thống kê quản lý Phân tích thơng kê việc hỗ trợ định quản lý Hình 1.1.2B Thơng tin: Để đưa định kinh doanh lành mạnh, người quản lý cần thơng tin có chất lượng cao Thơng tin phải kịp thời, xác, có liên quan, đầy đủ dễ tiếp cận Tuy nhiên, thông tin để hỗ trợ q trình định sẵn có định dạng đó, có chất lượng số lượng mà người định yêu cầu Thường xuyên cần phải tạo thơng tin từ liệu Dữ liệu: thứ dễ dàng có từ nhiều nguồn khác chất lượng, số lượng tùy thuộc nguồn Dữ liệu bao gồm giá trị riêng lẻ mà thơng tin chuyển tải thơng tin hữu ích, hữu dụng để sử dụng cho quản lý Vài ví dụ liệu là: giá trị mua hàng giao dịch đơn lẻ siêu thị; thời gian cần thiết để nhân viên tới công ty sáng; thương hiệu cafe mà người tiêu dùng cụ thể thích… Việc định trọng tâm công việc người quản lý Người quản lý phải định, ví dụ: phương tiện quảng cáo hiệu nhất; khách hàng có giá trị cao cơng ty ai; máy móc để mua; lơ hàng chất lượng có chấp nhận khơng; xác định vị trí đắc địa đặt cửa hàng cho lợi nhuận tối đa; liệu phụ nữ mua nhiều sản phẩm thể thao nam giới 7|Page Các phương pháp thống kê áp dụng lĩnh vực quản lý có liệu tồn (ví dụ nguồn nhân lực, marketing, tài điều hành) vai trị hỗ trợ định Thống kê hỗ trợ trình định cách củng cố sở định lượng hóa từ đưa định dựa thông tin tốt Thông tin định lượng cho phép người định biện minh cho hành động lựa chọn dễ dàng với tin tưởng Có thêm lý thực tế khiến nhà quản lý nói chung nên phát triển kỹ tốt đánh giá phương pháp thống kê kỹ tư Nó cho phép người quản lý: o Nhận tình mà thống kê áp dụng để tăng cường trình định o Thực phân tích thống kê đơn giản thực tế (ví dụ Excel) để trích xuất thơng tin bổ sung từ liệu kinh doanh o Giải thích, diễn đạt làm báo cáo quản lý thể dạng số o Đánh giá cách nghiêm túc tính hợp lệ kết thống kê trước sử dụng chúng trình định o Khởi đầu nghiên cứu với hiểu biết phương pháp thống kê có liên quan o Giao tiếp dễ dàng hiệu với nhà phân tích thống kê Thống kê cách tư giúp bạn đưa định tốt thống kê giúp bạn giải vấn đề liên quan đến định dựa liệu thu thập Để áp dụng thống kê cách, bạn cần phải làm theo khuôn mẫu, kế hoạch, để giảm thiểu sai sót có tư phân tích Khuôn khổ DCOVA (Define, Collect, Organize, Visualize and Analyze) khuôn mẫu Khuôn mẫu DCOVA bao gồm nhiệm vụ sau:  Xác định liệu mà bạn muốn nghiên cứu để giải vấn đề đạt mục tiêu  Thu thập liệu từ nguồn phù hợp  Tổ chức liệu thu thập cách phát triển bảng  Hiển thị liệu thu thập cách phát triển biểu đồ  Phân tích liệu thu thập để đạt kết luận trình bày kết Khn mẫu DCOVA sử dụng năm nhiệm vụ Xác định, Thu thập, Tổ chức, Hiển thị liệu Phân tích để giúp áp dụng thống kê cho việc định kinh doanh Thông thường, bạn thực tác vụ theo thứ tự liệt kê Bạn phải làm hai nhiệm vụ để đạt kết có ý nghĩa thực tiễn, thứ tự ba nhiệm vụ thay đổi xuất Một vài cách hiển thị liệu định giúp bạn xếp liệu thực phân tích sơ Trong trường hợp nào, bạn áp dụng phân tích thống kê cho việc định, bạn thực tất năm nhiệm vụ bạn phải xác minh bạn thực hai nhiệm vụ trước ba nhiệm vụ Sử dụng khn mẫu DCOVA giúp bạn áp dụng thống kê cho bốn loại hoạt động kinh doanh rộng lớn này:     Tóm tắt hiển thị liệu kinh doanh Tiếp cận kết luận từ liệu Thực dự báo đáng tin cậy hoạt động kinh doanh Cải tiến quy trình kinh doanh 8|Page Ngồi thơng kê học cịn sử dụng rộng rãi nhiều ngành ví dụ : Kiểm tốn : Một cơng ty lớn trả 12.000 hoá đơn cho nhà cung cấp hàng tháng Cơng ty học số hố đơn tốn khơng xác, họ khơng biết làm để giải vấn đề Kiểm toán viên thiếu nguồn lực để kiểm tra tất hóa đơn, họ định lấy mẫu để ước tính tỷ lệ hóa đơn tốn khơng xác Nên lấy mẫu lớn kiểm tốn viên có tự tin ước tính gần đủ với tỷ lệ đúng? Chăm sóc sức khoẻ : Một phịng khám đánh giá tư nhận thức cho nạn nhân ngoại trú bị thương tích đầu, đánh giá dựa 100 bệnh nhân sử dụng bảng câu hỏi đánh giá thể chất tinh thần với 42 mục Mỗi bệnh nhân đánh giá độc lập hai nhà trị liệu có kinh nghiệm Từ đánh giá họ, kết luận nhà trị liệu đồng ý tình trạng chức bệnh nhân? Một số câu hỏi đánh giá có thừa khơng? Các điểm đánh giá ban đầu có dự báo xác thời gian bệnh nhân chương trình điều trị khơng? Cải thiện chất lượng : Một nhà sản xuất ống đồng cuộn cho tản nhiệt mong muốn nâng cao chất lượng sản phẩm Và bắt đầu với chương trình kiểm tra ba lần, phạt người lao động sản xuất sản phẩm chất lượng kém, đăng hiệu "không lỗi" Cách tiếp cận thất bại Tại sao? Mua Hàng : Một nhà bán lẻ thấy với 200 đầu DVD cho thấy có khiếm khuyết Tỷ lệ lỗi lịch sử nhà cung cấp 0,005 Tỷ lệ lỗi có thực gia tăng, đơn giản lô "xấu"? Y học : Một loại thuốc thực nghiệm để điều trị bệnh suyễn cấp cho 75 bệnh nhân, có 24 bệnh nhân có tiến triển tốt Một nhóm dùng giả dược trao cho nhóm kiểm sốt gồm 75 tình nguyện viên, có 12 người cải thiện Là thuốc tốt so với giả dược, khác biệt rủi ro gặp phải? Quản lý hoạt động điều hành : Noah Corp có 50.000 sản phẩm khác Để quản lý khoảng tồn kho rộng lớn này, công ty cần hệ thống dự báo hàng tuần phản ứng với mơ hình phát triển nhu cầu người tiêu dùng Có cách để dự đốn nhu cầu đặt hàng hàng tuần từ nhà cung cấp cho mặt hàng? Bảo hành sản phẩm : Một nhà sản xuất tơ lớn muốn biết chi phí trung bình cho yêu cầu bảo hành động động hybrid Họ thu thập liệu chi phí bảo hành 4.300 yêu cầu bảo hành tháng sau động giới thiệu bán thị trường Sử dụng tuyên bố bảo hành ước tính chi phí tương lai, biên độ sai số liên quan đến ước tính gì? Marketing: Một nhà tư vấn marketing yêu cầu xác định khách hàng mua lặp lại cho Tiki.vn, đề xuất hội co-marketing dựa sở liệu có chứa triệu lần mua sách đồ dùng học tập Làm khai thác sở liệu lớn để xây dựng mơ hình hữu ích hướng dẫn chiến lược marketing? Nghiên cứu thị trường sử dụng phương pháp thống kê để lấy mẫu phân tích loạt hành vi tiêu dùng mơ hình mua hàng Nghiên cứu phân khúc thị trường sử dụng kỹ thuật thống kê để xác định phân khúc thị trường khả thi nghiên cứu quảng cáo sử dụng số liệu thống kê để xác định hiệu phương tiện truyền thơng… Ngồi ra, biết thống kê làm cho bạn người tiêu dùng thông thái Bạn biết đủ để xử lý vấn đề liệu hàng ngày, để cảm thấy tự tin người khác lừa bạn lập luận giả mạo để biết bạn đạt đến giới hạn chuyên môn Kiến thức thống kê mang lại cho cơng ty bạn lợi cạnh tranh chống lại tổ chức không hiểu liệu nội thị trường bên họ Và làm chủ thống 9|Page Hình 2.2.1H Phân phối tỷ lệ phần trăm tích lũy cung cấp cách trình bày thơng tin phần trăm giá trị nhỏ lượng cụ thể Bạn sử dụng phần trăm phân phối làm sở để xây dựng phân phối phần trăm tích lũy Ví dụ : Hình 2.2.1K Để hiểu rõ cách tổ chức trình bày, giảng viên làm tập mẫu sách tập lớp cho sinh viên thực hành Sinh viên xem hướng dẫn sách tập với liệu để biết cách tổ chức loại liệu 2.2.2 Trình bày liệu phân loại liệu số Biểu đồ bạn chọn để trình bày liệu cho biến phân loại phụ thuộc vào việc bạn muốn nhấn mạnh cách loại so sánh trực tiếp với (biểu đồ thanh) cách loại thành phần tồn (biểu đồ trịn) liệu tập trung vào vài danh mục bạn (biểu đồ Pareto) Để hình dung liệu cho hai biến phân loại, bạn sử dụng biểu đồ cạnh Biểu đồ minh họa (Hình 2.2.2A) biến phân loại loạt thanh, với tượng trưng cho đỉnh cho thể loại Trong biểu đồ thanh, độ dài tượng trưng cho tần suất tỷ lệ phần trăm giá trị cho loại phân cách không gian, gọi khoảng cách Ví dụ : 40 | P a g e Hình 2.2.2A Biểu đồ hình trịn (Hình 2.2.2B) sử dụng phần vòng tròn để thể nhãn loại Kích thước phần, phần bánh, thay đổi theo tỷ lệ phần trăm loại Ví dụ : Hình 2.2.2B Trong biểu đồ Pareto, số liệu cho loại vẽ dạng dọc theo thứ tự giảm dần, hay theo tần suất chúng kết hợp với tỷ lệ phần trăm tích lũy biểu đồ Biểu đồ Pareto lấy tên từ nguyên tắc Pareto, quan sát thấy nhiều liệu, vài loại biến phân loại đại diện cho phần lớn liệu, nhiều loại khác đại diện cho lượng liệu tương đối nhỏ hay nhỏ Biểu đồ Pareto giúp bạn xác định 41 | P a g e trực quan danh mục "ít quan trọng" từ danh mục "bình thường" để bạn tập trung vào danh mục quan trọng Biểu đồ Pareto công cụ mạnh mẽ để ưu tiên cho cải tiến, chẳng hạn liệu thu thập xác định mục bị lỗi không phù hợp Ví dụ : Hình 2.2.2C Biểu đồ ngang song song sử dụng để hiển thị phản hồi chung từ hai biến phân loại Ví dụ, Biểu đồ song song với hình cho thấy liệu mức độ rủi ro cho tăng trưởng giá trị quỹ Hình 2.2.2D Bạn trình bày liệu cho biến số thơng qua loạt kỹ thuật cho thấy phân bố giá trị Các kỹ thuật bao gồm hiển thị biểu đồ lịch sử, đa giác phần trăm đa giác tỷ lệ phần trăm tích lũy… 42 | P a g e Biểu đồ lịch sử hiển thị liệu dạng biểu đồ dọc tượng trưng cho khoảng lớp từ tần suất phân bố phần trăm Trong biểu đồ, bạn hiển thị biến số dọc theo trục ngang (X) sử dụng trục dọc (Y) để biểu diễn tần suất tỷ lệ phần trăm giá trị cho khoảng lớp Khơng có khoảng trống liền kề biểu đồ Hình 2.2.2E Khi sử dụng biến phân loại để phân chia liệu biến số thành hai nhiều nhóm, bạn hình dung liệu cách xây dựng đa giác phần trăm Biểu đồ sử dụng điểm khoảng lớp để biểu diễn liệu lớp sau vẽ điểm giữa, theo tỷ lệ phần trăm tương ứng, điểm đường dọc theo trục X Trong bạn xây dựng hai nhiều biểu đồ, thực hình dưới, đa giác phần trăm cho phép bạn thực phép so sánh trực tiếp dễ hiểu Hình 2.2.2F 43 | P a g e Đa giác tỷ lệ phần trăm tích lũy, hình ảnh minh hoạ, sử dụng phân phối phần trăm tích lũy để vẽ tỷ lệ tích lũy dọc theo trục Y Khơng giống đa giác phần trăm, giới hạn khoảng lớp cho biến số vẽ theo hướng phát triển, với tỷ lệ phần trăm tương ứng, điểm đường dọc theo trục X Hình 2.2.2H 2.2.3 Tổ chức trình bày nhiều biến Hình dung hai biến số tiết lộ mối liên hệ hai biến làm sở cho việc áp dụng phương pháp thảo luận phân tích Để hình dung hai biến số, bạn phải xây dựng biểu đồ phân tán Đối với trường hợp đặc biệt, trong hai biến tượng trưng cho trôi qua thời gian, bạn xây dựng chuỗi thời gian Một biểu đồ phân tán tìm hiểu mối quan hệ có hai biến số cách vẽ giá trị biến số trục ngang, X, giá trị biến số thứ hai trục dọc, Y Ví dụ: nhà phân tích thị trường nghiên cứu tính hiệu quảng cáo cách so sánh chi phí quảng cáo doanh thu 50 cửa hàng cách sử dụng trục X để đại diện cho chi phí quảng cáo trục Y đại diện cho doanh thu bán hàng 44 | P a g e Hình 2.2.3A Biểu đồ chuỗi thời gian giá trị biến số trục Y vẽ khoảng thời gian liên quan đến giá trị số trục X Một chuỗi thời gian giúp bạn hình dung xu hướng liệu diễn theo thời gian Hình 2.2.3B Trình bày « liệu thuyết phục », nhiều người thêm vào yếu tố hình ảnh khác với liệu để cố gắng nâng cao khả hiển thị Mặc dù việc sử dụng hợp lý yếu tố 45 | P a g e thị giác tạo hình ảnh dễ nhớ chuyển tải nhanh điểm quan trọng liệu, nhiều yếu tố bổ sung thêm vào làm yếu tố không truyền đạt thông tin hữu ích che khuất điểm quan trọng liệu Các yếu tố mà sau gọi chartjunk Hình 2.2.3C Một bảng đa chiều ngẫu nhiên đáp ứng câu trả lời ba biến phân loại nhiều Trong trường hợp đơn giản ba biến phân loại, ô bảng chứa số liệu biến, tổ chức nhóm đại diện biến hàng cột Hình 2.2.3D 2.2.4 Pivot table phân tích kinh doanh Các tính Excel sử dụng với PivotTables minh hoạ số nguyên tắc phân tích kinh doanh, tính khơng phải phần mềm phân tích nghiệp vụ theo nghĩa chặt chẽ Việc phân tích nghiệp vụ cho phép bạn khám phá liệu mối quan hệ khơng lường trước Trong ví dụ khác Mục 2.7, số mối quan hệ không lường trước mẫu 318 quỹ hưu trí khám phá cách bổ sung biến thứ ba thứ tư vào bảng dự phịng nhiều chiều Một số quy trình phân tích hoạt động theo cách đó: Bạn thêm biến xem mối quan hệ không lường trước khám phá Nhưng quy trình phân tích khác bắt đầu với nhiều biến 46 | P a g e cho phép bạn lọc liệu cách khám phá kết hợp cụ thể giá trị phân loại dãy số Trong excel, sử dụng slicers cách để bắt chước hoạt động lọc Hình 2.2.4A Hình 2.2.4B 47 | P a g e Hình 2.2.4C Các phân tích doanh nghiệp có khác biệt đáng kể ví dụ việc phân tích kinh doanh thực tế Phân tích nghiệp vụ giới thực sử dụng liệu lớn (big data) lấy liệu từ sở liệu cơng ty Việc học PivotTables giúp bạn chuẩn bị cho công cụ phân tích kinh doanh "thực sự" Một cơng cụ PowerPivot add-in cho Excel 2010 & 2013 mà Microsoft cung cấp tải miễn phí Như tên add-in ngụ ý, phần bổ sung mở rộng chức PivotTable theo cách để loại bỏ khác biệt ghi nhận Mặc dù PowerPivot địi hỏi sở liệu cơng ty nguồn liệu nó, vượt phạm vi giảng này, chúng tơi có gắng cho bạn làm quen với cách dùng PivotTables Tất kiến thức trình bày, tổ chức liệu phân loại liệu số làm thực hành lớp với case cụ thể sách tập với liệu 2.3 Các kỹ thuật khai phá liệu Dưới số kỹ thuật khai phá liệu mơ tả : Hình 2.3 48 | P a g e Số học trung bình biện pháp phổ biến xu hướng trung tâm Giá trị trung bình gợi ý giá trị điển hình trung tâm đóng vai trò "điểm cân bằng" liệu Tổng giá trị tất biến/tổng số biến : Trung vị (giá trị giữa) giá trị mảng liệu xếp xếp hạng từ nhỏ đến lớn Một nửa giá trị nhỏ trung vị, nửa giá trị lớn với trung vị Trung vị không bị ảnh hưởng giá trị cực trị: lớn nhỏ nhất, bạn sử dụng trung vị có giá trị cực trị Ví dụ sau làm bạn hiểu rõ : Hoặc Mode giá trị liệu xuất thường xuyên Giống trung bình khơng giống trung vị Đối với liệu, có nhiều mode khơng có mode khơng có giá trị xuất thường xuyên Ví dụ, mẫu 10 lần để thời gian ăn vào buổi sáng, ta có hai mode 39 44: 29 31 35 39 39 40 43 44 44 52 Phạm vi -range khác biệt giá trị lớn nhỏ thước đo mô tả số liệu đơn giản biến thiên tập hợp liệu Ví dụ, mẫu 10 lần để thời gian ăn vào buổi sáng, ta có phạm vi 52-29=23 23 phút khác lớn thời gian ăn sáng : 29 31 35 39 39 40 43 44 44 52 49 | P a g e Phương sai phép đo độ lệch bình phương trung bình từ giá trị trung tâm Thực theo bước sau để tính tốn phương sai mẫu:  Tính trung bình mẫu  Tính độ lệch giá trị liệu từ trung bình  Bình phương độ lệch (để tránh sai lệch tích cực tiêu cực loại bỏ chúng tổng hợp)  Tổng sai lệch bình phương  Cuối cùng, trung bình độ lệch bình phương cách chia cho (n - 1) Độ lệch chuẩn - standard deviation bậc hai phương sai Hệ phương sai đo sức mạnh mối quan hệ tuyến tính hai biến số (X Y) Phương trình định nghĩa hệ phương sai mẫu, Ví dụ minh họa việc sử dụng 50 | P a g e Trong Hình 2.3A, ta có sơ đồ cho thấy mối quan hệ giá trị doanh thu hàng năm 30 đội bóng rổ chuyên nghiệp NBA (lưu trữ Values) Bây giờ, bạn muốn đo mối liên hệ doanh thu hàng năm giá trị đội cách xác định hiệp phương sai mẫu Hình 2.3A Vậy ta có hệ số phương sai : Hệ số biến thiên - coefficient of variation (CV) số thay đổi tương đối Nó tính sau: 51 | P a g e Đánh điểm Z giá trị khác biệt giá trị giá trị trung bình, chia cho độ lệch chuẩn: Quartiles - Tứ phân vị đại lượng mô tả phân bố phân tán tập liệu Tứ phân vị có giá trị, tứ phân vị thứ (Q1), thứ nhì (Q2), thứ ba (Q3) Ba giá trị chia tập hợp liệu (đã xếp liệu theo trật từ từ bé đến lớn) thành phần có số lượng quan sát Ví dụ : Ranked values: 29 Ranks: Ta có Q1 : 31 35 39 39 40 43 44 44 52 10 Q3 : Và ta có thước đo phân tán số liệu mẫu cho ví dụ : Thước đo phân tán - Interquartile range = Q3 – Q1 = 8.25 – 2.75 = 5.5 Đồ thị hộp tóm lược năm số, từ giúp xác định hình dạng phân phối gắn với tóm tắt năm số Hình chứa vng cho mẫu 10 lần thời gian chuẩn bị công việc vào buổi sáng Đường dọc vẽ hộp biểu thị trung vị Đường thẳng đứng phía bên trái hộp biểu thị vị trí Q1 Và đường thẳng đứng phía bên phải hộp biểu thị vị trí Q3 Như vậy, hộp chứa 50% giá trị 25% liệu thấp biểu diễn đường nối phía bên trái hộp đến vị trí giá trị nhỏ nhất, X nhỏ Tương tự, 25% liệu đại diện đường nối phía bên phải hộp với X lớn 52 | P a g e Trung bình quần thể tổng giá trị quần thể chia cho quy mơ quần thể, N μ = trung bình quần thể Xi = giá trị thứ i biến X = tổng tất giá trị Xi quần thể N = số giá trị quần thể Ví dụ : Ta có bảng sau quỹ đầy tư Noah Để tính tốn lợi tức trung bình năm cho quỹ "Noah" hình trên, sử dụng phương trình cho lợi nhuận trung bình năm cổ phiếu cho "Noah" 7,657 Phương sai quần thể tổng bình phương khác biệt quanh trung bình quần thể chia cho kích thước quần thể, N: μ = trung bình quần thể Xi = giá trị thứ i biến X = tổng kết tất bình phương khác biệt giá trị Xi μ 53 | P a g e Độ lệch chuẩn quần thể là: Với ví dụ quỹ đầu tư Noah, ta có Phương sai Độ lệch chuẩn quần thể sau Do đó, tỷ lệ phần trăm chi trả khác với trung bình 7,657 xấp xỉ 9,21 Số lượng lớn biến thể cho thấy cổ phiếu "Noah" đầu sinh lợi kết khác nhiều Những kỹ thuật khác học môn chuyên sâu nghiên cứu marketing trình bày lớp làm tập thực hành SPSS Excel Cũng cách tính phương trình dẫn từ tập lớp, ví dụ Excel có hàm tính Mean, Median, Mode sau : AVERAGE(variable cell range) MEDIAN(variable cell range) MODE(variable cell range) 54 | P a g e ... đầu Chương 1: Dữ liệu thống kê 1. 1 Thống kê học kinh doanh 1. 1 .1 Khái niệm 1. 1.2 Vai trị 1. 2 4 Cơng cụ phân tích liệu 1. 2 .1 Tổng quan 1. 2.2 Những cơng cụ chủ yếu 1. 3 12 Vai trị phân tích định... cơng cụ phân tích liệu cho mơ hình thơng kê, dự báo 4 .1 Phân tích hồi quy tương quan 4 .1. 1 Phân tích hồi quy tuyến tính đơn 4 .1. 2 Phân tích hồi quy đa biến 99 4 .1. 3 Phân tích tương quan 10 3 4.2... kinh doanh 15 Chương 2: Phân tích liệu mơ tả với cơng cụ phân tích liệu 2 .1 Định nghĩa thu thập liệu 2 .1. 1 Xác lập loại kiểu biến 2 .1. 2 Chia độ đánh giá biến 2 .1. 3 Thu thập liệu 29 2 .1. 4 Các phương

Ngày đăng: 01/03/2022, 09:51

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan