TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN TIN BÁO CÁO CUỐI KÌ HỆ HỖ TRỢ QUYẾT ĐỊNH Giảng viên hướng dẫn LÊ CHÍ NGỌC MỤC LỤC INFORMATION TECNOLOGY FOR MANAGEMENT 3 CHƯƠNG III Quản lý dữ liệu, Phân tích[.]
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN TIN BÁO CÁO CUỐI KÌ HỆ HỖ TRỢ QUYẾT ĐỊNH Giảng viên hướng dẫn : LÊ CHÍ NGỌC MỤC LỤCC LỤC LỤCC INFORMATION TECNOLOGY FOR MANAGEMENT··································3 CHƯƠNG III: Quản lý liệu, Phân tích liệu lớn Quản lý hồ sơ·····3 3.1 Hệ thống quản lý sở liệu:··························································4 3.2 Kho liệu phân tích liệu lớn·················································21 3.3 Khai thác liệu văn bản·····························································36 3.4 Kinh doanh thông minh····································································38 3.5 Quản lý hồ sơ điện tử:······································································44 INFORMATION TECNOLOGY FOR MANAGEMENT CHƯƠNG III: Quản lý liệu, NG III: Quản lý liệu, n lý liệu, liệu, u, Phân tích liệu, liệu, u lớn Quản n Quản lý liệu, n lý hồ sơ sơ 3.1 Hệu, thống quản lý sở liệu:ng quản lý liệu, n lý sở liệu: liệu, liệu, u: Coca-Cola Quản lý điểm tạo nên khác biệt, Công ty Coca-Cola công ty với doanh thu 48 tỷ đô ladoanh thu tỷ la lợi nhuận (Hình 3.2) Người dẫn đầu thị trường quản lý vàphân tích vài petabyte (Pb) liệu tạo thu thập từ 500 thương hiệu người tiêu dùng 206 quốc gia Các đối tác đóng chai cung cấp bán hàng vàdữ liệu vận chuyển, khách hàng bán lẻ truyền liệu giao dịch bán hàng Các nguồn liệu khác liệt kê Bảng 3.1 Từ 2003 đến xuân 2013, nhà phân tích liệutại Coca-Cola biết có hội BI hàng núi liệu người đóng chaiđang lưu trữ, việc tìm truy cập tất liệu để phân tích chứng minh làgần Các nguồn liệu khác gây chậm trễ lâu việc nhận phân tíchbáo cáo từ IT cho nhóm bán hàng Cơng ty định thay phần mềm cũtại sở đóng chai tiêu chuẩn hóa chúng hệ thống BI mới, kết hợp củaCác sản phẩm MicroStrargety Microsoft BI.Quản lý liệu doanh nghiệp Giống hầu hết cơng ty tồn cầu, Coca-Cola dựa vào quản lý liệu doanh nghiệp tinh vi, BI cơng nghệ phân tích để phát triển trì hiệu suất thị trường cạnh tranh khốc liệt (Hình 3.3) Dữ liệu quản lý sở liệu tập trung, minh họa Hình 3.4 Kho liệu, liệu lớn,phân tích, mơ hình liệu phương tiện truyền thông xã hội sử dụng để đáp ứng với hoạt động đối thủ cạnh tranh-ity, thay đổi thị trường, sở thích người tiêu dùng.Để hỗ trợ chiến lược kinh doanh hoạt động mình, Coca-Cola thay đổi từ mộtcách tiếp cận sở liệu phi tập trung đến cách tiếp cận sở liệu tập trung Bây liệu nóđược kết hợp tập trung truy cập thơng qua tảng chia sẻ tồn tổ chức (Hình 3.5) Mục tiêu chiến lược quản lý liệu giúp bán lẻ khách hàng Walmart, nơi bán tỷ đô la sản phẩm Coca-Cola hàng năm KINH DOANH BỀN VỮNG HIỆU SUẤT Tất liệu chuẩn hóa thơng qua loạt quản lý liệu chủ (MDM) quy trình, thảo luận Chương Một kho liệu doanh nghiệp (EDW) có nhìn tất liệu bán lẻ đa kênh EDW tạo nhìn đáng tin cậy khách hàng, bán hàng giao dịch, cho phép Coca-Cola phản hồi nhanh chóng xác để thay đổi điều kiện thị trường Trên khắp phận phòng ban Coca-Cola, khối lượng liệu khổng lồ phân tích để đưa định quan trọng hơn, nhạy cảm thời gian sản phẩm, tiếp thị người mua sắm, chuỗi cung ứng sản xuất Điểm bán hàng Dữ liệu (POS) thu thập từ kênh bán lẻ sử dụng để tạo sản phẩm khách hàngcác tập tin Những hồ sơ truyền thông qua hệ thống báo cáo iPad tập trung Dữ liệu POS phân tích để hỗ trợ lập kế hoạch hợp tác, dự báo trình bổ sung chuỗi cung ứng (Quản lý chuỗi cung ứng, lập kế hoạch hợp tác, dự báo bổ sung bao phủ nhiều chi tiết Chương 10.) Phương pháp tiếp cận liệu lớn mơ hình định Coca-Cola Dữ liệu lớn coi tài sản chiến lược Giám đốc chuyên sâu liệu lớn Esat Sezer tuyên bố Coca-Cola có cách tiếp cận chiến lược thay cách tiếp cận chiến thuật lớn liệu Công ty tiến nhiều việc sử dụng liệu lớn để quản lý sản phẩm mình, doanh thu bán hàng, trải nghiệm khách hàng thời gian gần để giảm chi phí Dành cho ví dụ, cắt giảm chi phí làm thêm gần nửa cách phân tích liệu trung tâm dịch vụ Dữ liệu lớn giúp Coca-Cola liên quan đến 70 triệu người theo dõi Facebook họ Nhiều người số họ củng cố thương hiệu Coke Dữ liệu lớn đóng vai trị quan trọng việc đảm bảo nước cam có vị năm-trịn có sẵn đâu giới Cam Coca-Cola sử dụng có mùa tăng trưởng cao điểm ba tháng Sản xuất nước cam với hương vị quán quanh năm chất lượng cung cấp không quán phức tạp Để đối phó với phức tạp, mơ hình định nước cam phát triển- oped, mơ hình Sách Đen Một mơ hình định định lượng mối quan hệ biến, làm giảm không chắn Sách đen kết hợp liệu chi tiết 600 hương vị tạo nên màu cam, thời tiết, sở thích khách hàng, dự kiến suất trồng, áp lực chi phí, sở thích người tiêu dùng khu vực, độ chua tỷ lệ ness Mơ hình định cách pha chế nước cam để tạo đồng nếm thử Mơ hình nước ép Sách Đen Coke coi phức tạp ứng dụng phân tích kinh doanh Nó địi hỏi phải phân tích định lên tới triệu (10E18) biến để liên tục cung cấp pha trộn tối ưu Với sức mạnh liệu lớn mơ hình định, Coca-Cola sẵn sàng cho gián đoạn nguồn cung trước xa Theo Doug Bippert, phó Coca-Cola Chủ tịch tăng tốc kinh doanh, có bão đóng băng, nhanh chóng lên kế hoạch lại cho doanh nghiệp năm 10 phút chúng tơi tốn học mơ hình hóa (BusinessIntellect.com, 2013b Câu hỏi: Tại Cơng ty Coca-Cola có petabyte liệu? Tại điều quan trọng Coca-Cola xử lý liệu POS gần thời gian thực? Coca-Cola cố gắng tạo khách hàng thuận lợi Kinh nghiệm? Tầm quan trọng việc có nhìn đáng tin cậy liệu gì? Lợi ích mơ hình định gì? Mơ hình Sách Đen gì? Giải thích lợi ích chiến lược mơ hình Sách Đen 3.1 Hệ thống quản lý sở liệu: Dữ liệu động lực đằng sau doanh nghiệp thành công Hoạt động, kế hoạch, kiểm soát tất chức quản lý khác chủ yếu dựa vào xử lý thông tin, liệu thô Và, không muốn chờ đợi cho kinh doanh quan trọng báo cáo câu trả lời cụ thể cho câu hỏi họ Công nghệ quản lý liệu giúp người dùng thông báo hỗ trợ nhu cầu kinh doanh khác Cơ sở liệu lưu trữ liệu tạo ứng dụng kinh doanh, cảm biến, hoạt động hệ thống xử lý giao dịch (TPS) Dữ liệu sở liệu vô Các doanh nghiệp vừa lớn thường có nhiều sở liệu khác loại Kho liệu tích hợp liệu từ nhiều sở liệu silo liệu tổ chức chúng để phân tích phức tạp, khám phá kiến thức hỗ trợ định Ví dụ: liệu trích xuất từ sở liệu, xử lý để chuẩn hóa định dạng chúng sau tải vào kho liệu cụ thể thời gian, chẳng hạn hàng tuần Như vậy, liệu kho liệu không dễ biến đổi sẵn sàng để phân tích Kỹ thuật xử lý liệu, sức mạnh xử lý hiệu suất doanh nghiệp khả quản lý trải qua tiến mang tính cách mạng năm gần lý mà bạn quen thuộc với liệu lớn, tính di động điện tốn đám mây Tuy nhiên, thập kỷ vừa qua chứng kiến xuất phương pháp mới, lưu trữ liệu gần để xử lý giao dịch, bạn đọc phần Hệ thống quản lý sở liệu (DBMS) tích hợp với hệ thống thu thập liệu chẳng hạn TPS ứng dụng kinh doanh; lưu trữ liệu cách có tổ chức; cung cấp phương tiện để truy cập quản lý liệu Trong 25 năm qua, sở liệu quan hệ mơ hình sở liệu tiêu chuẩn hầu hết nhập vào prise Cơ sở liệu quan hệ lưu trữ liệu bảng bao gồm cột hàng, tương tự định dạng bảng tính, Hình 3.6 Các hệ thống quản lý quan hệ (RDBMS) cung cấp quyền truy cập vào liệu cách sử dụng ngôn ngữ khai báo Ngơn ngữ truy vấn có cấu trúc (SQL) Ngơn ngữ khai báo đơn giản hóa việc truy cập liệu cách yêu cầu người dùng xác định liệu họ muốn truy cập mà không xác định cách truy cập đạt Chức DBMS Một nhìn xác qn liệu tồn doanh nghiệp cần thiết vậyngười ta đưa định sáng suốt, hành động hỗ trợ cho chiến lược kinh doanh Các chức thực DBMS để giúp tạo khung nhìn là: • Lọc định hình liệu: Xử lý lưu trữ liệu hiệu Quan sát liệu cho lỗi, không quán, dư thừa không đầy đủ thơng tin • Tồn vẹn bảo trì liệu: Chính xác, chuẩn hóa xác minh điều khoản độ xác tính tồn vẹn liệu • Đồng hóa liệu: Tích hợp, khớp liên kết liệu từ nguồn khác • Bảo mật liệu: Kiểm tra kiểm sốt tính tồn vẹn liệu theo thời gian • Truy cập liệu: Cung cấp quyền truy cập ủy quyền vào liệu theo kế hoạch đặc biệt cách thời gian chấp nhận Phần cứng máy tính ngày có khả vượt qua liệu khổng lồ điều để quản lý vài năm trước làm cho chúng có sẵn mạng khơng dây Độ trễ liệu Độ trễ thời gian trôi qua (hoặc độ trễ) liệu tạo chúng có sẵn cho truy vấn báo cáo Các ứng dụng có dung sai khác Ances cho độ trễ Hệ thống sở liệu có xu hướng có độ trễ ngắn kho liệu- nhà cửa Độ trễ ngắn áp đặt nhiều hạn chế hệ thống Khả xử lý biến động liệu Cơ sở liệu có sức mạnh xử lý để xử lý biến động liệu Tốc độ mà liệu thêm, cập nhật xóa xác định khối lượng cơng việc mà sở liệu phải có khả kiểm soát để ngăn chặn vấn đề với tỷ lệ phản hồi cho truy vấn Thời gian trả lời truy vấn Khối lượng liệu tác động đến thời gian phản hồi cho truy vấn khám phá liệu Nhiều sở liệu liệu tiền giai đoạn trước là, tóm tắt tiền mã hóa kết muộn truy vấn có tốc độ phản hồi nhanh Thống liệu Tính qn có nghĩa liệu cập nhật, phản hồi cho truy vấn trả giá trị cập nhật Với tính qn cuối cùng, khơng phải tất câu trả lời truy vấn thay đổi liệu thay đổi thống Kết truy vấn khơng qn gây vấn đề nghiêm trọng cho phân tích phụ thuộc vào liệu xác Dự đốn truy vấn Số lượng truy vấn ad hoc khơng thể đốn trước nhiều, sở liệu cần thiết Quản lý hiệu suất sở liệu truy vấnkhó khăn khối lượng cơng việc khơng thể đốn trước đến mức chuẩn bị trước Khả xử lý khối lượng cơng việc quan trọng tiêu chí lựa chọn sở liệu Xử lý giao dịch trực tuyến trực tuyến Xử lý phân tích Ví dụ, hầu hết giao dịch kinh doanh xảy ra, mặt hàng bán trả lại, đơn đặt hàng gửi hủy, khoản toán tiền gửi thực thay đổi Haiti đến sở liệu Những thay đổi trực tuyến bổ sung, cập nhật xóa DBMS ghi lại xử lý giao dịch sở liệu hỗ trợ truy vấn báo cáo Với chức chúng, DBMS gọi trực tuyến hệ thống xử lý giao dịch (OLTP) OLTP thiết kế sở liệu phá vỡ đưa thông tin phức tạp vào bảng liệu đơn giản để cân hiệu xử lý giao dịch hiệu truy vấn Quá trình sở liệu OLTP hàng triệu giao dịch giây Tuy nhiên, sở liệu khơng thể tối ưu hóa cho khai thác liệu, hệ thống xử lý phân tích trực tuyến phức tạp (OLAP) địnhủng hộ Những hạn chế dẫn đến đời công nghệ kho liệu Kho liệu liệu tối ưu hóa cho OLAP, khai thác liệu, BI hỗ trợ định OLAP thuật ngữ sử dụng để mơ tả phân tích liệu phức tạp từ kho liệu Tóm lại, sở liệu tối ưu hóa nhanh xử lý giao dịch xử lý truy vấn Kho liệu tối ưu hóa cho phân tích Một động lực thay đổi thị trường quản lý liệu tăng lượng liệu cần quản lý Doanh nghiệp cần DBMS mạnh mẽ ... MANAGEMENT CHƯƠNG III: Quản lý liệu, NG III: Quản lý liệu, n lý liệu, liệu, u, Phân tích liệu, liệu, u lớn Quản n Quản lý liệu, n lý hồ sơ sơ 3.1 Hệu, thống quản lý sở liệu: ng quản lý liệu, n lý sở liệu: ... MANAGEMENT··································3 CHƯƠNG III: Quản lý liệu, Phân tích liệu lớn Quản lý hồ sơ? ?····3 3.1 Hệ thống quản lý sở liệu: ··························································4 3.2 Kho liệu phân tích liệu lớn? ?················································21... dịch xử lý truy vấn Kho liệu tối ưu hóa cho phân tích Một động lực thay đổi thị trường quản lý liệu tăng lượng liệu cần quản lý Doanh nghiệp cần DBMS mạnh mẽ giải pháp lưu trữ liệu, phân tích báo