1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tiểu luận môn kho dữ liệu hệ hỗ trợ ra quyết định chủ đề tình huống kho dữ liệu 1 education

15 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tình Huống Kho Dữ Liệu 1: Education
Tác giả Trần Hiệp Phát, Hồ Văn Bảo Lộc, Nguyễn Phước Luân, Trần Nguyễn Thành Trung
Người hướng dẫn Nguyễn Hoàng Ân
Trường học Trường Đại Học Ngân Hàng Tp. Hồ Chí Minh
Chuyên ngành Hệ Thống Thông Tin Quản Lý
Thể loại tiểu luận
Năm xuất bản 2024
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 15
Dung lượng 2,5 MB

Nội dung

NGÂN HÀNG NHÀ NƯỚC VIỆT NAM BỘ GIÁO DỤC & ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP HỒ CHÍ MINH KHOA: HỆ THỐNG THƠNG TIN QUẢN LÝ - - TIỂU LUẬN MÔN: KHO DỮ LIỆU & HỆ HỖ TRỢ RA QUYẾT ĐỊNH CHỦ ĐỀ: TÌNH HUỐNG KHO DỮ LIỆU 1: EDUCATION Giảng viên hướng dẫn: Nguyễn Hoàng Ân Nhóm thực hiện: Nhóm 08 Lớp: D01 Tp Hồ Chí Minh tháng 01 năm 2024 Bảng đánh giá mức độ tham gia Tên MSSV Đóng góp Trần Hiệp Phát 030237210147 25% Hồ Văn Bảo Lộc 030237210104 25% Nguyễn Phước Luân 030237210105 25% Trần Nguyễn Thành Trung 030237210200 25% Lời nói đầu 1.DataWarehouse 3.Tại doang nghiệp cần phải có Data warehouse 4.Tiềm ứng dụng doanh nghiệp 4.1.Hợp tất liệu nơi .4 4.2.Khả kiểm soát quyền truy cập loại quyền truy cập đối tượng 4.3.Thích hợp cho Fast reporting (báo cáo nhanh) 5.Các Data platform hỗ trợ data warehousing workloads 6.Data warehouse vs Data lake 7.Kho liệu đại nâng cao hiệu suất hệ thống công nghệ giáo dục đại học nào? Lời nói đầu Data warehouse chặng đường dài 40 năm qua Nó bắt đầu máy vật lý thực tế với chi phí khổng lồ đến hệ thống có sẵn cho ai, đâu với chi phí phải Nó có khả tập trung tất liệu doanh nghiệp bạn, cho phép thực hoạt động phân tích nhanh hơn, KPI tiêu chuẩn hóa nguồn thơng tin đáng tin cậy Tất doanh nghiệp cần kho liệu để hoạt động nhanh chóng hiệu với liệu mà họ dựa vào Câu hỏi khơng phải bạn có cần data warehouse hay không mà bạn nên chọn loại data warehouse 1.DataWarehouse Data Warehouse (Kho liệu) hệ thống quản lý liệu sử dụng để lưu trữ tính tốn liệu, cho phép thực hoạt động phân tích chuyển đổi (transforming) chia sẻ (sharing) liệu Nó giúp doanh nghiệp nắm bắt lưu trữ liệu từ nguồn bên ngồi Các kỹ sư phân tích nhà phân tích liệu sử dụng để truy vấn tập liệu SQL, biến chúng thành mơ hình (models) báo cáo liệu mạnh mẽ Data warehouse nguồn trung tâm cho ngăn xếp liệu đại Dữ liệu nhập, chuyển đổi chia sẻ (imported, transformed, and shared) với cơng cụ khác từ kho Hiện tại, có loại data warehouse chính: On-prem (tại chỗ) Cloud (nền tảng đám mây) On-prem warehouse vị trí thực tế nơi cơng ty cần trì phần cứng phần mềm để lưu trữ liệu Trong đó, cloud warehouse có sẵn nơi khơng bao gồm vị trí thực tế bạn cần truy cập, nhiên, bạn phải trả tiền để sử dụng khơng gian lưu trữ sức mạnh tính tốn công ty thứ khác cung cấp trì Có thể kể đến AWS (Amazon Web Services), GCP (Google Cloud Platform), … 2.Nguồn gốc DataWarehouse Mặc dù liệu lưu trữ suốt lịch sử phải đến năm 1980, công nghệ bắt đầu tăng tốc Data warehouse thức tạo Đó on-prem warehouse bao gồm nhiều storage towers (tháp lưu trữ) vi xử lý máy tính, chiếm nhiều khơng gian Và bạn tưởng tượng, điều gây nhiều vấn đề Nó khơng chiếm nhiều khơng gian vật lý mà nhân viên cịn phải bảo trì phần cứng phần mềm thiết bị cấu hình warehouse Điều nhanh chóng trở nên tốn không thực tế công ty nhỏ khơng có ngân sách khơng gian Khi Amazon bắt đầu mở rộng quy mô kho liệu chỗ để hỗ trợ hoạt động kinh doanh mình, họ nhận thấy hội bán lực tính tốn cho doanh nghiệp khác để tiết kiệm chi phí Đây lúc Redshift, sản phẩm cloud data warehouse củaAmazon đời Ngay sau đó, gã khổng lồ công nghệ khác Google Microsoft xây dựng sở hạ tầng liệu làm theo Giờ đây, bạn tiếp cận sử dụng sức mạnh cloud warehouse đâu Bạn khơng cần phải tự trì sở hạ tầng mà trả tiền cho công ty để làm việc cho bạn Điều rẻ so với on-prem phải trả để trì hệ thống cho phép khả liệu nhanh 3.Tại doang nghiệp cần phải có Data warehouse Data warehouse cho không thực tế chi phí liên quan đến chúng Giờ đây, kho lưu trữ đám mây cung cấp chúng cho gần tất người, chúng mang lại nhiều lợi ích cho doanh nghiệp Kho đám mây cho phép khả mở rộng, tính sẵn có, tiết kiệm chi phí tăng cường bảo mật - tất nhà cung cấp xử lý Các tiện ích liệt kê: Scalability (Khả mở rộng): Data warehouse cho phép bạn mở rộng quy mơ tính tốn lên xuống tùy thuộc vào tốc độ bạn cần chạy phép biến đổi số tiền bạn sẵn sàng chi tiêu Bạn bật tắt tài ngun máy tính để tiết kiệm chi phí Availability (Sẵn có): Data warehouse ln có sẵn Mặc dù độ trễ thay đổi tùy theo vị trí nguồn đích liệu bạn truy cập nơi, lúc, tiện lợi Điều trở nên lý tưởng xã hội đại, nơi người làm việc từ đâu Cost savings (Tiết kiệm chi phí): So với on-prem warehouse, cloud warehouse tiết kiệm nhiều bạn khơng cịn cần phải bảo trì tất sở hạ tầng nên bạn tiết kiệm chi phí liên quan đến bảo trì Các cơng ty kho Document continues below Discover more fDraotma :mining DM1001 Trường Đại học Ngâ… documents Go to course khai phá liệu_ random forest 23 None 2023KPDL Kiem Tra - Bài tập tự luận Khai… None 50 BÀI TẬP TỪ ĐỒNG NGHĨA Mức độ 14 Vat ly dai 94% (17) cuong Scarselli 2009 - mô hình neural network 20 Cơ sở 100% (1) liệu Correctional Administration Criminology 96% (114) English - huhu 10 Led hiển thị 100% (3) liệu quản lý nhiều liệu nên họ tiết kiệm chi phí mà bạn khơng thể làm Security (Tính bảo mật): Data warehouse cung cấp tính bảo mật nâng cao để đảm bảo liệu bạn ln bảo mật Nó thường trực tiếp xử lý chiến lược tuân thủ định cần thiết loại liệu khác , giúp bạn khơng cần phải tự thực việc Nó có tính vai trị người dùng giúp bạn kiểm sốt có quyền truy cập vào liệu Nhưng sâu vào vấn đề sau 4.Tiềm ứng dụng doanh nghiệp Các doanh nghiệp tận dụng kho liệu nhiều lý khác Hầu hết lý giúp tiết kiệm thời gian tiền bạc cho doanh nghiệp, dù trực tiếp hay gián tiếp 4.1.Hợp tất liệu nơi Thay để tất liệu bạn trải rộng tảng khác nhau, liệu có sẵn cho bạn nơi Điều cho phép bạn chuẩn hóa tất metrics (chỉ số cốt lõi) definitions (định nghĩa liệu) mình, thay phụ thuộc vào số tính tốn tảng Google Facebook Nếu bạn thấy số liệu khác không phù hợp tảng data warehouse đóng vai trị nguồn đáng tin cậy cho số liệu phù hợp Thay dựa vào tảng bên ngồi, bạn có tảng tập trung tất liệu Chưa kể, bạn khiến kỹ sư (DE) nhà phân tích liệu (DA) phải đau đầu Nếu khơng, họ phải lấy liệu cần thiết từ nhiều nguồn khác theo cách thủ cơng Việc khơng có nguồn thơng tin xác làm giảm chất lượng liệu bạn, lãng phí thời gian nhóm liệu gây khó khăn cho việc kết hợp liệu từ nguồn khác 4.2.Khả kiểm soát quyền truy cập loại quyền truy cập đối tượng Data warehouse có tính bảo mật mở rộng cho phép bạn kiểm sốt có quyền truy cập vào nội dung Bạn có khả cấp cho quyền nhiều tùy theo ý muốn bạn Nó cung cấp cho bạn khả tạo người dùng gán vai trị cho họ Mỗi vai trị có quyền riêng sở liệu bảng mà xem Sau đó, bạn chọn người phép thực query (truy vấn) bảng chí update (cập nhật) delete (xóa) chúng Khi tổ chức bạn dễ dàng truy cập vào liệu bạn, điều tồi tệ xảy Nguy liệu quan trọng bị xóa, chỉnh sửa sai truy cập khơng thích hợp Người dùng, vai trị, sách biện pháp bảo mật kho liệu giúp đảm bảo liệu nằm tay người 4.3.Thích hợp cho Fast reporting (báo cáo nhanh) Vì tất liệu bạn nằm nơi nên cho phép báo cáo nhanh so với việc lấy liệu từ nhiều nguồn khác Vị trí trung tâm cho phép bạn truy cập truy vấn nhanh chóng hàng triệu hàng liệu, cho phép thực chuyển đổi báo cáo nhanh nhiều 5.Các Data platform hỗ trợ data warehousing workloads Hiện có nhiều tảng cung cấp, hỗ trợ Data warehouse dạng dịch vụ, kể đến như: Snowflake tảng quản lý hoàn toàn để lưu trữ liệu, hồ liệu (data lake), kỹ thuật liệu, khoa học liệu phát triển ứng dụng liệu Databricks tảng phân tích liệu, kỹ thuật liệu khoa học liệu cộng tác dựa đám mây, kết hợp tốt data warehouse data lake vào kiến trúc lakehouse Google BigQuery serverless (không máy chủ) warehouse, có khả mở rộng cao, kèm với cơng cụ truy vấn tích hợp Amazon Redshift data warehouse dựa đám mây có quy mơ petabyte quản lý hoàn toàn, thiết kế để lưu trữ phân tích tập liệu quy mơ lớn (biggg data) PostgreSQL sở liệu quan hệ mã nguồn mở cấp doanh nghiệp nâng cao hỗ trợ truy vấn SQL (quan hệ) JSON (không quan hệ) 6.Data warehouse vs Data lake Data lake (hồ liệu) hệ thống nơi bạn lưu trữ, xử lý truy vấn liệu phi cấu trúc, bán cấu trúc có cấu trúc hầu hết quy mô Sự khác biệt data warehouse data lake loại cách lưu trữ liệu Data warehouse chứa liệu có cấu trúc nhằm tổ chức liệu để sử dụng phân tích, hi Data lake chứa nhiều loại liệu—có cấu trúc không cấu trúc—và liệu thường giữ nguyên định dạng thô sẵn sàng sử dụng Hiểu đơn giản data lake chứa đủ loại kiểu liệu tùm lum, phần liệu có cấu trúc data lake load vào data warehouse trình ETL ELT Các ứng dụng thường sử dụng nhóm cơng nghệ giáo dục đại học: Các tổ chức sử dụng mạng lưới công nghệ phức tạp, buộc phải theo dõi hoạt động hàng ngày khác Chúng ta xem xét vài ứng dụng phổ biến Ngày làm việc (nhân sự) : Workday Sinh viên giúp tổ chức giáo dục chuẩn bị cho thay đổi chuẩn bị phục vụ sinh viên giáo viên cách hiệu Nó giúp kết nối sinh viên lúc nơi thiết kế linh hoạt để đáp ứng lượng sinh viên rộng lớn đa dạng Hệ thống sinh viên kết nối liền mạch với tài chính, nhân lập kế hoạch, mang lại cho ban quản lý hiểu biết sâu sắc theo thời gian thực hoạt động diễn khuôn viên trường Giải pháp Peoplesoft Campus sử dụng sở trường đại học lớn cho hoạt động nhân khác Đám mây giáo dục Salesforce: (CRM) Salesforce Education Cloud công nghệ cung cấp giải pháp cho người học tổ chức Nó giúp tổ chức giáo dục hoạt động theo khuôn khổ từ đầu đến cuối bao gồm mô-đun tuyển sinh, tuyển dụng nhân viên, thăng tiến kinh nghiệm sinh viên hoạt động tổng thể tổ chức Đây tảng tận dụng cho CRM CX Biểu ngữ: (ERP) Banner hệ thống ERP (Lập kế hoạch nguồn lực doanh nghiệp) thương mại , thiết kế dành riêng cho giáo dục đại học bao gồm số mơ-đun tích hợp chặt chẽ chia sẻ sở liệu Nó bao gồm tùy chọn tự phục vụ dành cho sinh viên, nhân viên quản trị viên để giúp họ truy cập tính cần thiết di chuyển Đây kiến trúc tham chiếu nhiều tầng chứa tài nguyên sở hạ tầng cần thiết để triển khai phiên sẵn có ứng dụng Banner Cơ sở hạ tầng đám mây Oracle Bảng đen (Lớp học học tập) : Ứng dụng Blackboard miễn phí giúp học sinh sử dụng thiết bị di động để trì kết nối với Blackboard Learn; có sẵn cho thiết bị iOS, Android Windows Người học ưu tiên cơng việc cách sử dụng luồng hoạt động ưu tiên kiện hành động để theo kịp tập thời hạn tới Nó thiết lập thơng báo đẩy điểm mới, kiểm tra tới ngày hết hạn trước đây, đồng thời giúp xem thông báo, thảo luận, v.v Tableau : (Phân tích Ed cao hơn) - Tableau phân tích tỷ lệ đăng ký, thành tích nhân học sinh viên, đồng thời giúp trường cao đẳng đại học phát triển mối quan hệ cựu sinh viên tốt hợp lý hóa báo cáo giáo dục Cả lớp học phịng thí nghiệm, ứng dụng nâng cao trải nghiệm học tập cách cung cấp phân tích dễ hiểu Nó giúp sinh viên đạt kỹ hiểu biết liệu có giá trị nhà giáo dục tinh chỉnh kế hoạch học họ Đồng thời, người quản lý thời gian khám phá hội tốt để khám phá Tableau tận dụng tối đa liệu sẵn có miễn phí cho sinh viên người hướng dẫn động - Tuy nhiên, liệu riêng biệt từ ứng dụng đề cập có định dạng khác bên liên quan gặp khó khăn việc có nhìn 360 độ liệu Chúng ta nhớ mục tiêu công nghệ bậc cao cho phép cộng tác tồn diện nhằm thúc đẩy tính tồn diện, cảm giác cộng đồng cho phép tiếp cận, hỗ trợ tạo động lực Giờ đây, điều thực liệu có tất ứng dụng khác tích hợp với thành phần khác nhóm cơng nghệ Tại sao? Chỉ cần xem xét chồng chéo đơn giản liệu Giả sử học sinh nhận vào lớp cao thơng tin chi tiết học sinh nhập vào hệ thống thông tin học sinh Bây giờ, liệu cần chép tự động hệ thống học tập dành cho giáo viên ERP Tương tự vậy, vắng mặt cần phải đưa vào ứng dụng học tập để giáo viên hiểu vị trí với việc học 7.Kho liệu đại nâng cao hiệu suất hệ thống công nghệ giáo dục đại học nào? Các tổ chức giáo dục đại học thu thập lượng lớn liệu liên quan đến sinh viên, chương trình sở vật chất khuôn viên trường Việc sử dụng liệu người học, học thuật tổ chức để cải thiện nguồn lực, quy trình quy trình cơng việc hiệu Hãy xem xét điều sau: - Được trang bị phân tích cập nhật, tổ chức chọn phương pháp tiếp cận sáng tạo để tăng cường tham gia sinh viên - Nó giúp cải thiện tỷ lệ giữ chân tốt nghiệp, từ tác động đến doanh thu cách nhận thông báo tham gia sinh viên - Bằng cách triển khai chatbot để cung cấp nội dung cá nhân hóa cho sinh viên - Bảng điều khiển, cảnh báo liên lạc giảng viên sinh viên giúp đưa lời khuyên học tập - Theo dõi quyên góp cựu sinh viên Việc quản lý hợp lý nguồn lực sẵn có để giáo dục đại học mang lại giá trị điều bắt buộc trường đại học ngày Quản lý liệu có sẵn ngăn xếp cơng nghệ cách sử dụng kho liệu đại tùy chỉnh điểm khởi đầu More from: Data mining DM1001 Trường Đại học Ngâ… documents Go to course khai phá liệu_ random forest None 23 Data mining 2023KPDL Kiem Tra - Bài tập tự luận Khai… Data mining None 317 qd nhno hsx - Agribank None Data mining Witten et al 2016 appendix None 128 Data mining Recommended for you 50 BÀI TẬP TỪ ĐỒNG NGHĨA Mức độ 14 Vat ly dai 94% (17) cSucoanrgselli 2009 - mơ hình neural network 20 Cơ sở 100% (1) liệu Correctional Administration Criminology 96% (114) English - huhu 10 Led hiển thị 100% (3)

Ngày đăng: 03/03/2024, 09:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w