1. Trang chủ
  2. » Tất cả

Bài giảng nhập môn khai phá dữ liệu chương 2 pgs ts hà quang thụy

20 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU CHƯƠNG 2 CÔNG NGHỆ TRI THỨC PGS TS HÀ QUANG THỤY HÀ NỘI 09 2018 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI 1 July 12, 2021 2 Nội dung ◼ Nghịch lý năng suất củ[.]

BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU CHƯƠNG CÔNG NGHỆ TRI THỨC PGS TS HÀ QUANG THỤY HÀ NỘI 09-2018 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI Nội dung ◼ Nghịch lý suất Cơng nghệ Thơng tin ◼ Các mơ hình khai phá liệu ◼ Sơ khoa học liệu ◼ Công nghệ tri thức kinh tế tri thức July 12, 2021 Công nghệ tri thức CNTT: Hạ tầng hay thượng tầng? ◼ Công nghệ thông tin hạ tầng hạ tầng ? “xác định CNTT giữ vai trò hạ tầng hạ tầng quốc gia” http://vnmedia.vn/VN/cong-nghe/tintuc/35_280229/cong_nghe_thong_tin_la_ha_tang_cua_ha_ tang.htm Nhầm lẫn tai hại: “hạ tầng CNTT” với thân “CNTT” ◼ Vai trò CNTT kinh tế ◼ Nghịch lý tính hiệu CNTT ◼ Luận điểm CARR ◼ Bản chất vai trò CNTT kinh tế ◼ Kinh tế thông tin kinh tế tri thức July 12, 2021 Cơng nghệ Tri thức Vai trị CNTT ◼ Nghịch lý suất CNTT ◼ Robert Solow, nhà kinh tế giải thưởng Nobel, có nhận định “chúng ta nhìn thấy máy tính nơi ngoại trừ thống kê suất“ (1987) ◼ ◼ ◼ Căn cứ: Thống kê suất kinh tế (theo lý thuyết kinh tế cổ điển) đầu tư CNTT Luận điểm CARR ◼ “CNTT không quan trọng”: IT does not matter ! ◼ Nhận đinh luận điểm CARR Vai trò chất CNTT kinh tế ◼ Hệ thống tác nghiệp, điều hành ◼ Hệ thống phát tri thức July 12, 2021 Công nghệ tri thức Nghịch lý suất CNTT ◼ “Nghịch lý suất “: Một xung đột kỳ vọng với thống kê ◼ Mối quan hệ IT suất: nhiều tranh luận song hiểu biết hạn chế ◼ ◼ ◼ Năng lực máy tính đưa vào kinh tế Mỹ tăng bậc hai độ lớn từ năm 1970 Năng suất, đặc biệt khu vực dịch vụ đình trệ Cho hứa hẹn khổng lồ IT tới mở “cuộc cách mạng cơng nghệ lớn mà lồi người có" (Snow, 1966), ◼ Sự vỡ mộng, thâm chí làm thất vọng với cơng nghệ gia tăng cách hiển nhiên: “Khơng, máy tính khơng làm tăng hiệu quả, khơng hầu hết thời gian" (Economist, 1990) Erik Brynjolfsson The Productivity Paradox of Information Technology: Review and Assessment Communications of the ACM, Volume 36 Issue 12, Dec 1993 Pages 66-77 Erik Brynjolfsson, Daniel Rock, Chad Syverson Artificial Intelligence and the Modern Productivity Paradox: A Clash of Expectations and Statistics Working Paper 24001, 2017 Nghịch lý suất: Nền kinh tế Mỹ Sự không tương quan tăng GNP Giai đoạn Chi phí cho máy Tăng GNP hàng năm tính (%GNP) 1960s 0.003 4.50% 1970s 0.05 2.95% 1980s 0.3 2.75% 1990s 3.1 2.20% Nghịch lý suất: mức cơng ty ◼ ◼ ◼ Trái: Khơng có quan hệ đầu tư CNTT/nhân viên (trục hoành) với thu hồi vốn (trục tung): tỷ lệ đầu tư nhiều ! Phải: Có 90,6 % số cơng ty giá thành CNTT lớn giá thu hồi vốn: đầu tư CNTT lãng phí ? Thu hồi vốn chậm ? http://www.strassmann.com/pubs/cf/cf970603.html Nghịch lý suất: mức công ty tài ◼ Quan hệ “tỷ lệ thuận” đầu tư CNTT/nhân viên (trục hoành) với thu hồi vốn (trục tung) cơng ty tài Luận điểm G Carr: IT does'n matter ! ◼ Nicholas G Carr IT does'n matter! HBR at Large, May 2003: 41-49 CNTT xuất khắp nơi tầm quan trọng chiến lược giảm Cách tiếp cận đầu tư quản lý CNTT cần phải thay đổi đáng kể ! ◼ Khi tài nguyên trở thành chất để cạnh tranh không quan trọng cho chiến lược, rủi ro mà tạo trở thành quan trọng lợi mà cung cấp ◼ Với hội đạt lợi chiến lược từ CNTT nhanh chóng biến mất, nhiều cơng ty cần có nhìn nghiêm khắc đầu tư vào CNTT quản lý hệ thống họ Carr đưa ba quy tắc hướng dẫn cho tương lai: phủ nhận vai trò chiến lược CNTT ! ◼ ◼ ◼ Nicholas G Carr The end of corporate computing, MIT Sloan Management Review, Spring 2005: 67-73 Thuộc 100 người có tên nhắc đến nhiều ! Định hướng quản lý đầu tư CNTT Paul A Strassmann [Strass07]: chi tiêu CNTT so với doanh nghiệp đồng hạng: ➢ ➢ Hơn hay so với mức thông thường có hiệu đo lường được, Hơn mức thơng thường mà hiệu thông tin doanh nghiệp mức thông thường, Hơn mức thông thường mà tri thức nhân viên mức thông thường [Strass07] Paul A Strassmann (2007), Measuring and Communicating I.T Value, http://www.strassmann.com/talks/one-talk.php?talk=123 ➢ Phân tích nghịch lý suất ◼ E Brynjolfsson [Bryn93]: không nghịch lý suất ◼ Lỗi đo lường từ cơng thức tính suất kinh tế cổ điển: Biến đầu vào, biến đầu đo lường biến ◼ ◼ ◼ ◼ Đầu tư CNTT có độ trễ phát huy suất 2-3 năm Tính phân phối lại tài ngun thơng tin “sản phẩm công cộng”: Cty đầu tư – công ty khác hưởng lợi Sai lầm quản lý đầu tư CNTT: Ph/pháp phân tích lỗi thời Cơng thức tính suất kinh tế 11 Dữ liệu, thông tin, tri thức Biết quan hệ Biết xử lý 12 Dữ liệu → Thông tin dựa tri thức 13 Dữ liệu, thông tin, tri thức, trí tuệ 14 Dữ liệu, thơng tin, tri thức, trí tuệ 15 Các đặc trưng thơng tin có giá trị ◼ Thơng tin có giá trị ▪ Cho người quản lý người định (“quản lý” “lãnh đạo”) Nhìn chung “chính xác, người, thời điểm” ▪ Đặc trưng: truy nhập được, xác, đầy đủ, kinh tế, linh hoạt, có liên quan, tin cậy, an toàn, đơn giản, kịp thời, kiểm chứng ◼ Truy nhập ▪ Người sử dụng có thẩm quyền dễ dàng nhận được, dạng phù hợp, thời điểm theo yêu cầu ◼ Chính xác ▪ Chính xác khơng bị lỗi Trong nhiều trường hợp, thơng tin khơng xác liệu khơng xác q trình chuyển đổi (được gọi “nhập rác, xuất rác”: garbage in, garbage out: GIGO) ◼ Đầy đủ ▪ Thông tin cần bao gồm yếu tố quan trọng Phản ví dụ: Một báo cáo đầu tư khơng nói chi phí quan trọng 16 Thơng tin có giá trị (tiếp) ◼ Kinh tế ▪ Tính kinh tế liên quan tới chi phí tạo thơng tin Người định cần cân giá trị thơng tin với chi phí tạo ◼ Linh hoạt ▪ Thông tin sử dụng linh hoạt cho nhiều mục đích Ví dụ, thơng tin lượng hàng tồn kho cho người bán hàng, cho người quản lý tài chính… ◼ Có liên quan ▪ Có liên quan quan trọng cho người định ◼ Tin cậy ▪ Theo tín nhiệm người dùng Tính tin cậy phụ thuộc vào tính tin cậy phương pháp thu thập thơng tin / tính tin cậy nguồn thơng tin ◼ An tồn ▪ Tránh truy nhập trái phép 17 Thơng tin có giá trị (tiếp) ◼ Đơn giản ▪ Cần đơn giản, không phức tạp Thơng tin phức tạp chi tiết không cần thiết ◼ Kịp thời ▪ Được cung cấp cần đến nó: “Biết thời tiết cuối tuần trước khơng giúp cho chọn áo khốc mặc thứ Năm” ◼ Kiểm chứng ▪ Thông tin cần kiểm chứng được: kiểm tra tính đắn nhiều nguồn khác ◼ Lưu ý ▪ Độ quan trọng đặc trưng tùy thuộc vào kiểu liệu cần đến: (i) Với liệu thông minh thị trường: tính kịp thời > tính xác / tính đầy đủ (chẳng hạn, đối thủ cạnh tranh tạo giảm giá lớn…); (ii) tính xác, đầy đủ kiểm chứng quan trọng 18 Dữ liệu kỷ 21Dầu mỏ kỷ 20 ◼ Một vài đối sánh Đều động lực tăng trưởng trao đổi Dầu mỏ liệu: “nhồi vào ống dẫn” Nhà máy lọc dầu: dầu thô (nhiệt→) xăng, nhớt, thành phần khác Trung tâm liệu: liệu thô (hàng nghìn máy tính mát →) mẫu có giá trị, dự báo, hiểu biết sâu sắc ▪ Đều tạo nguyên liệu thô quan trọng → kinh tế giới ▪ Hệ thống thực ảo cho sản xuất ▪ Dữ liệu lớn biết nhiều người, thứ, v.v ▪ ▪ ▪ ▪ https://www.economist.com/news/briefing/21721634-how-it-shaping-up-datagiving-rise-new-economy: Fuel of the future - Data is giving rise to a new economy Tăng trưởng liệu ◼ Dự báo IDC ▪ 2020: Vũ trụ liệu 35 zettabytes (“35” 21 chữ số “0”, dự báo 2011) → 44 zettabytes (dự báo 2014); 2025: 180 zettabytes ▪ Bơm qua Internet băng thơng rộng 450 triệu năm! ▪ Amazon: mục đích tính tốn đám mây, dùng thùng chứa 100 petabytes ▪ 2016: Amazon, Alphabet Microsoft đạt gần 32 tỷ US$ chi tiêu hợp đồng ... Cơng thức tính suất kinh tế 11 Dữ liệu, thông tin, tri thức Biết quan hệ Biết xử lý 12 Dữ liệu → Thông tin dựa tri thức 13 Dữ liệu, thơng tin, tri thức, trí tuệ 14 Dữ liệu, thơng tin, tri thức, trí... giving rise to a new economy Tăng trưởng liệu ◼ Dự báo IDC ▪ 20 20: Vũ trụ liệu 35 zettabytes (“35” 21 chữ số “0”, dự báo 20 11) → 44 zettabytes (dự báo 20 14); 20 25: 180 zettabytes ▪ Bơm qua Internet... kỷ 21 Dầu mỏ kỷ 20 ◼ Một vài đối sánh Đều động lực tăng trưởng trao đổi Dầu mỏ liệu: “nhồi vào ống dẫn” Nhà máy lọc dầu: dầu thô (nhiệt→) xăng, nhớt, thành phần khác Trung tâm liệu: liệu thơ (hàng

Ngày đăng: 27/02/2023, 07:58