ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN DỮ LIỆU LỚN - BIG DATA Số tín chỉ: 03 Trình độ đào tạo: Đại học Ngành đào tạo: Công nghệ thông tin

10 30 0
ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN DỮ LIỆU LỚN - BIG DATA Số tín chỉ: 03 Trình độ đào tạo: Đại học Ngành đào tạo: Công nghệ thông tin

Đang tải... (xem toàn văn)

Thông tin tài liệu

BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC SAO ĐỎ ***** ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN DỮ LIỆU LỚN - BIG DATA Số tín chỉ: 03 Trình độ đào tạo: Đại học Ngành đào tạo: Công nghệ thông tin Năm 2020 TRƯỜNG ĐẠI HỌC SAO ĐỎ KHOA: ĐIỆN TỬ-TIN HỌC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập-Tự do-Hạnh phúc ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN Trình độ đào tạo: Đại học Ngành đào tạo: Công nghệ thông tin Tên học phần: Dữ liệu lớn - Big data Mã học phần: CNTT 209 Số tín chỉ: (2, 1) Trình độ cho sinh viên: Năm thứ tư Phân bổ thời gian - Lên lớp: 30 tiết lý thuyết, 30 tiết thực hành - Tự học: 90 Điều kiện tiên quyết: Không Giảng viên STT Học hàm, học vị, họ tên Số điện thoại Email ThS Phạm Thị Hường 0972.306.806 PTHuong@saodo.edu.vn ThS Nguyễn Thị Ánh Tuyết 0972.384.332 NTATuyet@saodo.edu.vn Mô tả nội dung học phần Học phần Dữ liệu lớn - Big data giới thiệu tổng quan khái niệm, đặc trưng thách thức Big data: Khả phân tích, dự đốn nhằm trích xuất giá trị lớn từ liệu Giới thiệu số phương pháp công cụ phổ biến để khai thác quản lý Big data: Hadoop, MapReduce Spark Mục tiêu chuẩn đầu học phần 9.1 Mục tiêu Mục tiêu học phần thỏa mãn mục tiêu chương trình đào tạo: Mục tiêu Mơ tả MT1 Kiến thức - Trình bày phương pháp phân tích, xử MT1.1 lý vấn đề cụ thể liên quan đến Big data Trình bày cách sử dụng cơng cụ Hadoop-HDFS để lưu trữ, mơ hình MT1.2 MapReduce Spark để phân tích liệu lớn Minh họa cách triển khai ứng dụng MT1.3 Big data thực tế Mức độ theo thang đo Bloom Phân bổ mục tiêu học phần CTĐT [1.2.1.2b] [1.2.1.2b] [1.2.1.2b] Mục tiêu Mức độ theo thang đo Bloom Mô tả Phân bổ mục tiêu học phần CTĐT Kỹ Áp dụng công cụ Hbase, HadoopHDFS để lưu trữ, mô hình MT2.2 [1.2.2.2] MapReduce Spark để phân tích liệu lớn Phân tích, tổng hợp, đánh giá MT2.3 cơng cụ phân tích lĩnh vực xử [1.2.2.2] lý liệu lớn MT3 Mức tự chủ trách nhiệm Nghiêm túc, tự giác, tích cực, khoa MT3.1 học, độc lập, cẩn thận tuân thủ [1.2.3.1] cơng việc Có lực giải vấn đề MT3.2 [1.2.3.2] lĩnh vực Big data 9.2 Chuẩn đầu Sự phù hợp chuẩn đầu học phần với chuẩn đầu chương trình đào tạo: Phân bổ CĐR Thang CĐR học học Mô tả đo phần phần Bloom CTĐT CĐR1 Kiến thức Giải thích khái niệm, đặc trưng CĐR1.1 [2.1.4] liên quan đến Big data - Phân tích bước lưu trữ liệu lớn CĐR1.2 [2.1.4] cơng cụ Hbase, Hadoop-HDFS Phân tích bước phân tích liệu lớn CĐR1.3 [2.1.4] mơ hình MapReduce Spark CĐR2 Kỹ Áp dụng cơng cụ, mơ hình để lưu trữ, phân tích CĐR2.1 [2.2.3] triển khai liệu lớn Đánh giá, cải tiến phương pháp để đáp ứng tình CĐR2.2 [2.2.4] thực tế lĩnh vực xử lý liệu lớn CĐR3 Mức tự chủ trách nhiệm Nghiêm túc, tự giác, tích cực, khoa học, độc lập, cẩn CĐR3.1 [2.3.1] thận, tuân thủ lập trình thực tế công việc Định hướng, hướng dẫn đưa kết luận liên CĐR3.2 [2.3.2] quan đến cơng việc phân tích xử lý liệu lớn MT2 10 Ma trận liên kết nội dung với chuẩn đầu học phần Chuẩn đầu học phần CĐR1 CĐR2 Chương Nội dung học phần CĐR 1.1 Chương Giới thiệu Big data 1.1 Khái niệm Big data 1.2 Các kiểu Big data 1.3 Các đặc trưng Big data Chương Hbase cho hệ thống Big data 2.1 Giới thiệu Hbase 2.2 Các tính Hbase 2.3 Mơ hình Hbase 2.4 Kiến trúc Hbase 2.5 Cách thức lưu trữ tìm kiếm Hbase Chương Apache Hadoop cho hệ thống Big data 3.1 Giới thiệu mơ hình GFS 3.2 Lịch sử Hadoop 3.3 Giải pháp Hadoop cho việc quản lý khai thác Big data 3.4 Hệ thống file lưu trữ quản lý Hadoop: HDFS (Hadoop Distributed FileSystem) 3.5 Yarn 3.6 Hadoop I/O Chương Mơ hình lập trình Mapreduce CĐR 1.2 CĐR 1.3 x CĐR 2.1 CĐR 2.2 CĐR3 CĐR CĐR 3.1 3.2 x x x x x x x x x x x Chương Nội dung học phần Chuẩn đầu học phần CĐR1 CĐR2 CĐR 1.1 CĐR 1.2 CĐR 1.3 CĐR 2.1 CĐR 2.2 CĐR3 CĐR CĐR 3.1 3.2 4.1 Giới thiệu mơ hình Mapreduce-MR 4.2 Các hàm MapReduce 4.3 Hoạt động MapReduce 4.4 Cách thức phát triển ứng dụng MR 4.5 Xây dựng ứng dụng phân tích Big data tập liệu mẫu có sẵn x x x x Chương Apache Spark cho hệ thống Big Data 5.1 Tổng quan Apache Spark 5.2 Các thành phần Apache Spark 5.3 Quản lý nhớ Apache Spark 5.4 Lập trình với RDD 5.5 Phát triển ứng dụng lưu trữ phân tích liệu lớn 11 Đánh giá học phần 11.1 Kiểm tra đánh giá trình độ Chuẩn đầu Mức độ thành thạo đánh giá Kiểm tra thường xuyên, tập thực hành, kiểm tra thực CĐR1 nhiệm vụ nhà, kiểm tra học phần Bài tập thực hành, thực nhiệm vụ nhà, kiểm tra học CĐR2 phần, thi kết thúc học phần Kiểm tra thường xuyên, kết thực nhiệm vụ cá nhân CĐR3 theo nhóm, thi kết thúc học phần 11.2 Cách tính điểm học phần: Tính theo thang điểm 10 sau chuyển thành thang điểm chữ thang điểm 4 STT Điểm thành phần Quy định Trọng số Ghi Điểm kiểm tra thường xuyên; điểm đánh giá nhận thức thái độ tham gia thảo luận; điểm đánh giá phần tập; điểm chuyên cần 01 điểm 20% Điểm trung bình lần đánh giá Điểm kiểm tra học phần 01 điểm 30% Điểm thi kết thúc học phần 01 điểm 50% 11.3 Phương pháp đánh giá Học phần sử dụng phương pháp đánh giá điểm thành phần sau: - Kiểm tra thường xuyên; đánh giá nhận thức thái độ tham gia thảo luận; đánh giá nhiệm vụ tự học; chuyên cần: Vấn đáp - Kiểm tra học phần: Thực hành (01 kiểm tra, thời gian làm bài: 90 phút) - Thi kết thúc học phần: Bảo vệ tập lớn (20 phút/chủ đề) 12 Yêu cầu học phần - Tham gia tối thiểu 80% số tiết học lớp hướng dẫn giảng viên - Đọc nghiên cứu tài liệu phục vụ học phần, hoàn thành tập cá nhân tập nhóm - Chủ động làm tập lớn theo hướng dẫn giảng viên - Tham gia kiểm tra học phần, thi kết thúc học phần - Dụng cụ học tập: Máy tính, ghi, bút, 13 Tài liệu phục vụ học phần - Tài liệu bắt buộc: [1] - Trường Đại học Sao Đỏ (2020), Giáo trình Dữ liệu lớn - Big data -Tài liệu tham khảo: [2] - By Krishna Rungta (2019), Learn Hadoop in Day [3] - Apache HBase ™ Reference Guide, Introduction to Basic Schema Design by Amandeep Khurana, Version 1.4.11 [4] - Tom White (2015), Hadoop The Definitive Guide Published by O’ Reilly Media, Inc., Gravenstein Highway North, Sebastopol, CA 95472 [5] - Holden Karau Andy Konwinski Matei Zaharia Patrick Wendell (2015), Learning Spark Published by O’ Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA 95472 14 Nội dung chi tiết học phần phương pháp dạy-học TT Nội dung giảng dạy Chương Giới thiệu Big data Mục tiêu chương: Sau học xong chương này, sinh viên đạt yêu cầu sau: - Giải thích khái niệm Big data, kiểu Big data đặc trưng Big data - Minh họa kiểu liệu, đặc trưng Big data Nội dung cụ thể: 1.1 Khái niệm Big data 1.1.1 Data 1.1.2 Big data 1.2 Các kiểu Big data 1.2.1 Có cấu trúc 1.2.2 Khơng có cấu trúc 1.2.3 Bán cấu trúc 1.3 Các đặc trưng Big data 1.3.1 Dung lượng liệu 1.3.2 Tốc độ liệu 1.3.3 Đa dạng liệu Bài thực hành số Chương Hbase cho hệ thống Big data Mục tiêu chương: Sau học xong chương này, sinh viên đạt yêu cầu sau: - Phân tích tính Apache Hbase, mơ hình Hbase, kiến trúc cách lưu trữ liệu Hbase - Áp dụng Hbase lưu trữ liệu Big data Nội dung cụ thể: Số tiết Phương pháp dạy-học CĐR học phần Thuyết trình; Tổ chức học CĐR1.1; (2LT, theo nhóm; Thực hành CĐR2.1; 2TH) máy tính CĐR3.1 - Giảng viên: + Giải thích khái niệm, kiểu liệu đặc trưng Big data + Giao tập, nội dung thực hành cho cá nhân, nhóm + Hướng dẫn sinh viên thực hành, đánh giá, nhận xét - Sinh viên: + Đọc trước tài liệu: [1]: Chương 1; [2]: Chương 1; [3]: Chương + Lắng nghe, ghi chép, quan sát + Làm tập cá nhân, theo nhóm [1]: Chương + Thực hành thực hành số 12 Thuyết trình; Tổ chức học CĐR1.2; (6LT, theo nhóm; Thực hành CĐR2.1; 6TH) máy tính CĐR3.1 - Giảng viên: + Giải thích tính sử dụng Hbase + Nêu nội dung vấn đề cần giải + Giao tập, nội dung thực hành cho cá nhân nhóm + Hướng dẫn sinh viên thực hành, đánh giá, nhận xét TT Nội dung giảng dạy 2.1 Giới thiệu Hbase 2.2 Các tính Hbase 2.3 Mơ hình Hbase 2.4 Kiến trúc Hbase 2.5 Cách thức lưu trữ tìm kiếm Hbase 2.6 Ví dụ áp dụng Bài thực hành số 2-4 Chương Apache Hadoop cho hệ thống Big data Mục tiêu chương: Sau học xong chương này, sinh viên đạt yêu cầu sau: - Phân tích tính Apache Hadoop, mơ hình Hbase, quản lý khai thác big data Hbase - Đánh giá, lựa chọn giải pháp quản lý khái thác liệu big data Nội dung cụ thể: 3.1 Giới thiệu mơ hình GFS (Google File System) 3.2 Lịch sử Hadoop 3.3 Giải pháp Hadoop cho việc quản lý khai thác Big data 3.4 Hệ thống file lưu trữ quản lý Hadoop: HDFS (Hadoop Distributed FileSystem) 3.5 Yarn 3.6 Hadoop I/O Bài thực hành số - Số tiết Phương pháp dạy-học CĐR học phần - Sinh viên: + Đọc trước tài liệu: [1]: Chương 2; [3]: Các chương + Lắng nghe, ghi chép, quan sát, thảo luận + Làm tập theo nhóm [1]: Chương + + Thực hành thực hành số 2-4 12 Thuyết trình; Dạy học CĐR1.2; (6LT, dựa vấn đề; Tổ chức CĐR2.1; 6TH) cho sinh viên tranh luận; CĐR3.1 Tổ chức học theo nhóm; Thực hành máy tính - Giảng viên: + Giải thích tính năng, cách sử dụng Hadoop + Nêu vấn đề, hướng dẫn sinh viên giải vấn đề + Nêu nội dung tranh luận + Giao tập, nội dung thực hành cho cá nhân, nhóm + Hướng dẫn sinh viên thực hành, đánh giá, nhận xét - Sinh viên: + Đọc trước tài liệu: [1]: Chương 3; [4]: Các chương + Lắng nghe, ghi chép, quan sát, tranh luận, phản biện giải vấn đề + Làm tập cá nhân, theo nhóm [1]: Chương + + Thực hành thực hành số - 7 TT Nội dung giảng dạy Chương Mơ hình lập trình Mapreduce Mục tiêu chương: Sau học xong chương này, sinh viên đạt yêu cầu sau: - Phân tích mơ hình Mapreduce, hàm Mapreduce, hoạt động Mapreduce, cách thức phát triển Mapreduce - Đánh giá, lựa chọn cách sử dụng Mapreduce xử lý Big data Nội dung cụ thể: 4.1 Giới thiệu mơ hình Mapreduce-MR 4.2 Các hàm MapReduce 4.3 Hoạt động MapReduce 4.4 Cách thức phát triển ứng dụng MR 4.5 Xây dựng ứng dụng phân tích Big data tập liệu mẫu có sẵn 4.6 Ví dụ áp dụng Số tiết Phương pháp dạy-học CĐR học phần 12 Thuyết trình; Dạy học CĐR1.3; (6LT, dựa vấn đề; Tổ chức CĐR2.2; 4TH, học theo nhóm; Thực CĐR3.2 2KT) hành máy tính - Giảng viên: + Giải thích tính cách sử dụng mơ hình Mapreduce + Nêu vấn đề, hướng dẫn sinh viên giải vấn đề + Giao tập, nội dung thực hành cho cá nhân, nhóm + Hướng dẫn sinh viên thực hành, đánh giá, nhận xét - Sinh viên: + Đọc trước tài liệu: [1]: Chương 4; + Lắng nghe, ghi chép, quan sát giải vấn đề + Làm tập cá nhân, theo nhóm [1]: Chương + Làm kiểm tra + Thực hành thực hành số - Kiểm tra học phần Bài thực hành số - 20 Thuyết trình; Dạy học Chương Apache Spark (10LT, dựa vấn đề; Tổ chức cho hệ thống Big data 10TH) học theo nhóm; Thực Mục tiêu chương: hành máy tính Sau học xong chương - Giảng viên: này, sinh viên đạt + Giải thích tính yêu cầu sau: cách sử dụng mơ hình Spark - Phân tích thành phần Apache Spark, + Nêu vấn đề, hướng dẫn thành phần Apache sinh viên giải vấn đề CĐR1.3; CĐR2.2; CĐR3.1; CĐR3.2 TT Nội dung giảng dạy Số tiết Phương pháp dạy-học CĐR học phần + Giao tập, nội dung thực hành cho cá nhân, nhóm + Hướng dẫn sinh viên thực hành, đánh giá, nhận xét - Sinh viên: + Đọc trước tài liệu: [1]: Chương 5; [5]: Các chương + Lắng nghe, ghi chép, quan sát giải vấn đề + Làm tập cá nhân, theo nhóm [1]: Chương + Thực hành thực hành số 10 - 14 Spark, quản lý nhớ lập trình với RDD - Đánh giá, lựa chọn cơng cụ vào phân tích xử lý liệu lớn thực tế Nội dung cụ thể: 5.1 Tổng quan Apache Spark 5.2 Các thành phần Apache Spark 5.3 Quản lý nhớ Apache Spark 5.4 Lập trình với RDD 5.4.1 Tổng quan 5.4.2 Tạo RDD 5.4.3 Hoạt động RDD 5.5 Phát triển ứng dụng lưu trữ phân tích liệu lớn 5.6 Ứng dụng Big Data Bài thực hành số 10 - 14 Hải Dương, ngày 24 tháng 09 năm 2020 KT.TRƯỞNG KHOA PHÓ TRƯỞNG KHOA TRƯỞNG BỘ MÔN Phạm Văn Kiên Phạm Văn Kiên

Ngày đăng: 04/01/2023, 12:28

Tài liệu cùng người dùng

Tài liệu liên quan