1. Trang chủ
  2. » Luận Văn - Báo Cáo

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN: DỮ LIỆU LỚN

6 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công nghệ thông tin 1 TRƯỜNG ĐH NGOẠI NGỮ - TIN HỌC TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Khoa CÔNG NGHỆ THÔNG TIN Độc Lập - Tự Do - Hạnh Phúc CHƯƠNG TRÌNH GIÁO DỤC ĐẠI HỌC Trình độ đào tạo: Đại học Ngành: Công nghệ thông tin Mã số: 7480201 ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN 1. Thông tin chung về HP 1.1 Mã học phần: 1230493 1.2 Tên học phần: Dữ liệu lớn 1.3 Ký hiệu học phần: 1230493 1.4 Tên tiếng Anh: Big Data 1.5 Số tín chỉ: 4 (3 + 1) 1.6 Phân bố thời gian: - Lý thuyết: 45 tiết - Thực hành: 30 tiết - Tự học: 90 tiết 1.7 Các giảng viên phụ trách học phần: - Giảng viên phụ trách chính: - Danh sách giảng viên cùng giảng dạy: 1.8 Điều kiện tham gia học phần: - Học phần tiên quyết: Không có - Học phần học trước: Cơ sở dữ liệu - Học phần song hành: Không yêu cầu 2. Mục tiêu HP 2.1. Mục tiêu chung Học phần giới thiệu định nghĩa và các vấn đề cơ bản của dữ liệu lớn trong 3 chương đầu tiên. Sau đó các công cụ cung cấp các chức năng khác nhau để quản lý dữ liệu lớn, kết nối cơ sở dữ liệu lớn, lập trình và phát triển ứng dụng cũng như triển khai các ứng dụng dữ liệu lớn trong nhiều môi trường khác nhau được giới thiệu ở chương thứ 4. Chương 5 giới thiệu các chủ đề chuyên sâu về việc phân tích dữ liệu lớn, cung cấp những gợi ý thích hợp để sinh viên phát triển và tiến hành các đề tài nghiên cứu về dữ liệu lớn. 2.2. Mục tiêu HP cụ thể 2.2.1. Về kiến thức: - Kiến thức nền tảng: Các khái niệm về dữ liệu lớn và các vấn đề liên quan. Biết và giải thích được các thuật ngữ tiếng Anh thuộc lĩnh vực dữ liệu lớn - Hiểu được ý nghĩa và ứng dụng của các bài toán trong khai thác dữ liệu lớn đối với các vấn đề thực tế. 2.2.2. Về kỹ năng: - Sử dụng được một số công cụ trong việc triển khai và lập trình trên dữ liệu lớn. - Kỹ năng nghề nghiệp: Phân tích dữ liệu văn bản và dữ liệu thời gian thông qua các công cụ hỗ trợ. - Kỹ năng cá nhân: Làm việc ở mức độ cá nhân và cộng tác nhóm để trình bày một số báo cáo khoa học theo mẫu và thuyết trình các nội dung liên quan đến môn học. 2.2.3. Về thái độ - Có thái độ làm việc khoa học, trung thực, rõ ràng. - Chuẩn bị bài trước khi đến lớp. Đi học đầy đủ. Tham gia tích cực trong giờ học. - Làm tất cả các bài tập lý thuyết và thực hành. 2 3. Chuẩn đầu ra của HP “Dữ liệu lớn” Bảng 3.1. Chuẩn đầu ra (CĐR) của HP Sau khi học xong học phần, SV có khả năng: Ký hiệu CĐR HP Nội dung CĐR HP (CLO) CLO1 Hiểu được các khái niệm về dữ liệu lớn và ý nghĩa, ứng dụng của các bài toán trong khai thác dữ liệu lớn trong thực tế. CLO2 Có trách nhiệm trong học tập, trung thực và sử dụng phần mềm hợp pháp. CLO3 Sử dụng được các công cụ trong việc triển khai và lập trình trên dữ liệu lớn CLO4 Có khả năng đọc tài liệu và tự nghiên cứu những giải thuật khai thác dữ liệu lớn tiêu biểu. CLO5 Sử dụng công cụ hỗ trợ trong việc phân tích dữ liệu văn bản và dữ liệu thời gian trong các bài toán thực tế 4. Mối liên hệ giữa CĐR HP (CLO) với CĐR CTĐT (PLO) Mức độ đóng góp của CLO vào PLO được xác định cụ thể: 1 – CLO có đóng góp vừa vào PLO 2 – CLO có đóng góp nhiều vào PLO Chú thích: 2 - Cao, 1 - Thấp - phụ thuộc vào mức hỗ trợ của CLO đối với PLO ở mức bắt đầu (1) hoặc mức nâng cao hơn mức bắt đầu, có nhiều cơ hội được thực hành, thí nghiệm, thực tế,…(mức 2) Bảng 4.1. Mối liên hệ của CĐR HP (CLO) đến CĐR của CTĐT (PLO) PLO (1) (2) (3) (4) (5) (6) (7a,b,c,d) (8b, c,d) (9) (10) (11) CLO 1 2 CLO 2 1 CLO 3 2 2 CLO4 2 2 CLO5 2 2 2 Tổng hợp học phần 1 1 2 2 2 2 2 2 5. Đánh giá HP a. Phương pháp, hình thức kiểm tra - đánh giá của HP Bảng 5.1. Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV ở HP Thphần đánh giá Trọng số Bài đánh giá Trọng số con Rubric Lquan đến CĐR nào ở bảng 3.1 HD PP đánh giá (1) (2) (3) (4) (5) (6) (7) A1. Kiểm tra thường xuyên (KTTX) 20 A1.1. Từng buổi học 10 R1 CLO 1 - Điểm danh - Đánh giá hoạt động trên lớp A1.2. Tuần 4: Làm bài tập Chương 2, 3 30 R3 CLO 3 CLO 4 - Đánh giá khả năng đọc và nghiên cứu tài liệu A2. Đánh giá phần thực hành 30 Sinh viên hoàn thành bài thực hành trong buổi thực hành R3 CLO 3 CLO 4 - GV giao bài thực hành vào đầu mỗi buổi thực hành - GV chấm kết quả vào cuối buổi thực hành A3. Đánh giá cuối kỳ 50 Thuyết trình cuối kỳ. R4 CLO 2 CLO 3 CLO 4 - Vấn đáp b. Chính sách đối với HP - 3 6. Kế hoạch và nội dung giảng dạy HP Bảng 6.1. Kế hoạch và nội dung giảng dạy của HP theo tuần Tuần Buổi (3 tiếtb) Các nội dung cơ bản của bài học (chương) (đến 3 số) Số tiết (LTTH TT) CĐR của bài học (chương) chủ đề Lquan đến CĐR nào ở bảng 3.1 PP giảng dạy đạt CĐR Hoạt động học của SV() Tên bài đánh giá (ở cột 3 bảng 6.1 (1) (2) (3) (4) (5) (6) (7) (8) 1 Chương 1. Cơ bản về Dữ liệu lớn 1.1. Dữ liệu lớn là gì? 1.2. Phân tích với BigSheets 1.3. Phân tích dữ liệu tĩnh 1.4. Dữ liệu khi phân tích động, thời gian thực 3 1.1. Thuyết giảng 1.2. Đặt câu hỏi gợi mở để sinh viên trả lời 1.3. Liên hệ với những kiến thức đã học trước đó và kinh nghiệm đã có CLO1 CLO2 - GV sử dụng tài liệu 1 và projector để thuyết giảng - Phần chuẩn bị ở nhà: Đọc trước Cuốn 1: Phần 2; Cuốn 2: Phần 1, 2 - Ghi chú, tham gia các hoạt động trên lớp 2 Chương 2. Hadoop cơ bản 2.1. Giới thiệu Hadoop 2.2. Kiến trúc Hadoop 2.3. Quản trị Hadoop 2.4. Các thành phần của Hadoop 3 2.1. Thuyết giảng 2.2. Đặt câu hỏi gợi mở để sinh viên trả lời 2.3. Cách đánh giá giải thuật CLO1 CLO2 CLO3 - GV sử dụng tài liệu 1 và projector để thuyết giảng - Phần chuẩn bị ở nhà: Đọc trước Cuốn 1: Phần 2; Cuốn 3 - Ghi chú, tham gia các hoạt động trên ...

Trang 1

TRƯỜNG ĐH NGOẠI NGỮ -

CHƯƠNG TRÌNH GIÁO DỤC ĐẠI HỌC

Trình độ đào tạo: Đại học Ngành: Công nghệ thông tin Mã số: 7480201 ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN

1 Thông tin chung về HP

1.1 Mã học phần: 1230493 1.2 Tên học phần: Dữ liệu lớn 1.3 Ký hiệu học phần: 1230493 1.4 Tên tiếng Anh: Big Data

- Danh sách giảng viên cùng giảng dạy:

1.8 Điều kiện tham gia học phần:

2 Mục tiêu HP 2.1 Mục tiêu chung

Học phần giới thiệu định nghĩa và các vấn đề cơ bản của dữ liệu lớn trong 3 chương đầu tiên Sau đó các công cụ cung cấp các chức năng khác nhau để quản lý dữ liệu lớn, kết nối cơ sở dữ liệu lớn, lập trình và phát triển ứng dụng cũng như triển khai các ứng dụng dữ liệu lớn trong nhiều môi trường khác nhau được giới thiệu ở chương thứ 4

Chương 5 giới thiệu các chủ đề chuyên sâu về việc phân tích dữ liệu lớn, cung cấp những gợi ý thích hợp để sinh viên phát triển và tiến hành các đề tài nghiên cứu về dữ liệu lớn

2.2 Mục tiêu HP cụ thể 2.2.1 Về kiến thức:

- Kiến thức nền tảng: Các khái niệm về dữ liệu lớn và các vấn đề liên quan Biết và giải thích được các thuật ngữ tiếng Anh thuộc lĩnh vực dữ liệu lớn

- Hiểu được ý nghĩa và ứng dụng của các bài toán trong khai thác dữ liệu lớn đối với các vấn đề thực tế

2.2.2 Về kỹ năng:

- Sử dụng được một số công cụ trong việc triển khai và lập trình trên dữ liệu lớn

- Kỹ năng nghề nghiệp: Phân tích dữ liệu văn bản và dữ liệu thời gian thông qua các công cụ hỗ trợ - Kỹ năng cá nhân: Làm việc ở mức độ cá nhân và cộng tác nhóm để trình bày một số báo cáo khoa học theo mẫu và thuyết trình các nội dung liên quan đến môn học

2.2.3 Về thái độ

- Có thái độ làm việc khoa học, trung thực, rõ ràng

- Chuẩn bị bài trước khi đến lớp Đi học đầy đủ Tham gia tích cực trong giờ học - Làm tất cả các bài tập lý thuyết và thực hành

Trang 2

3 Chuẩn đầu ra của HP “Dữ liệu lớn”

Bảng 3.1 Chuẩn đầu ra (CĐR) của HP

Sau khi học xong học phần, SV có khả năng:

CLO1 Hiểu được các khái niệm về dữ liệu lớn và ý nghĩa, ứng dụng của các bài toán trong khai thác dữ liệu lớn trong thực tế

CLO2 Có trách nhiệm trong học tập, trung thực và sử dụng phần mềm hợp pháp CLO3 Sử dụng được các công cụ trong việc triển khai và lập trình trên dữ liệu

4 Mối liên hệ giữa CĐR HP (CLO) với CĐR CTĐT (PLO)

Mức độ đóng góp của CLO vào PLO được xác định cụ thể:

1 – CLO có đóng góp vừa vào PLO 2 – CLO có đóng góp nhiều vào PLO

Chú thích: 2 - Cao, 1 - Thấp - phụ thuộc vào mức hỗ trợ của CLO đối với PLO ở mức bắt đầu (1) hoặc mức nâng cao hơn mức bắt đầu, có nhiều cơ hội được thực hành, thí nghiệm, thực tế,…(mức 2)

Bảng 4.1 Mối liên hệ của CĐR HP (CLO) đến CĐR của CTĐT (PLO) PLO (1) (2) (3) (4) (5) (6) (7a,b,c,d) (8b, c,d) (9) (10) (11) CLO 1 2

a Phương pháp, hình thức kiểm tra - đánh giá của HP

Bảng 5.1 Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV ở HP Th/phần

đánh giá Trọng số Bài đánh giá Trọng số con

Rubric Lquan đến CĐR nào ở bảng 3.1

HD PP đánh giá

A1 Kiểm tra thường xuyên (KTTX)

20%

A1.1 Từng buổi học

10%

R1 CLO 1 - Điểm danh

- Đánh giá hoạt động trên lớp

A1.2 Tuần 4: Làm bài

30%

Sinh viên hoàn thành bài thực hành trong buổi thực hành

- Vấn đáp

b Chính sách đối với HP

-

Trang 3

6 Kế hoạch và nội dung giảng dạy HP

Bảng 6.1 Kế hoạch và nội dung giảng dạy của HP theo tuần Tuần/

TT)

CĐR của bài học (chương)/

chủ đề

Lquan đến CĐR nào ở bảng 3.1

PP giảng dạy đạt

CĐR

Hoạt động học của

SV(*)

Tên bài đánh

giá

(ở cột 3

bảng 6.1

(1) (2) (3) (4) (5) (6) (7) (8) 1 Chương 1 Cơ bản về

Dữ liệu lớn

1.1 Dữ liệu lớn là gì? 1.2 Phân tích với BigSheets

1.3 Phân tích dữ liệu tĩnh

1.4 Dữ liệu khi phân tích động, thời gian thực

giảng

1.2 Đặt câu hỏi gợi mở để sinh viên trả lời 1.3 Liên hệ với những kiến thức đã học trước đó và kinh nghiệm đã có

CLO1 CLO2

- GV sử dụng tài liệu [1] và projector để thuyết giảng

- Phần chuẩn bị ở nhà:

Đọc trước Cuốn [1]: Phần 2; Cuốn [2]: Phần 1, 2

- Ghi chú, tham gia các hoạt động trên lớp 2 Chương 2 Hadoop cơ

bản

2.1 Giới thiệu Hadoop 2.2 Kiến trúc

Hadoop

2.3 Quản trị Hadoop 2.4 Các thành phần

của Hadoop

giảng

2.2 Đặt câu hỏi gợi mở để sinh viên trả lời 2.3 Cách đánh giá giải thuật

CLO1 CLO2 CLO3

- GV sử dụng tài liệu [1] và projector để thuyết giảng

- Phần chuẩn bị ở nhà:

Đọc trước Cuốn [1]: Phần 2; Cuốn [3]

- Ghi chú, tham gia các hoạt động trên lớp 3 Chương 3 Lập trình

MapReduce 3.1 Giới thiệu

MapReduce 3.2 Lập trình

MapReduce 3.3 Lập trình

MapReduce dùng BigInsights

giảng

3.2 Đặt câu hỏi gợi mở để sinh viên trả lời 3.3 Cách nghiên cứu và đánh giá giải thuật

CLO1 CLO2 CLO3

- GV sử dụng tài liệu [1] và projector để thuyết giảng

- Phần chuẩn bị ở nhà:

Đọc trước Cuốn [1]: Phần 2; Cuốn [3]

- Ghi chú, tham gia các hoạt động trên lớp 4 Bài tập Chương 2, 3 3 4.1 Giao bài

tập

4.2 Mô tả các yêu cầu thực hiện

4.3 Đánh giá, hướng dẫn thực hiện và sửa bài tập

CLO3 CLO4

A1.2

5 Chương 4 Các công cụ phát triển ứng dụng dữ liệu lớn

4.1 Pig

- Pig Cơ bản - Các phép toán

quan hệ Pig

giảng

5.2 Đặt câu hỏi gợi mở để sinh viên trả lời 5.3 Cách nghiên cứu và

CLO1 CLO2 CLO3 CLO5

- GV sử dụng tài liệu [1] và projector để thuyết giảng

- Phần chuẩn bị ở nhà:

Đọc trước Cuốn [1]: Phần 3; Cuốn [2]:

A1.2

Trang 4

4Các phép toán đánh

giá và các hàm khác

đánh giá giải

- Ghi chú, tham gia các hoạt động trên lớp 6 Chương 4 Các công

cụ phát triển ứng dụng dữ liệu lớn (tt)

4.2 Jaql

- Tổng quan Jaql - Ngôn ngữ Jaql Cơ

bản

- Các phép toán cơ sở

- Hỗ trợ SQL Jaql - Jaql và

MapReduce - Input và Output 4.3 Chuyển dữ liệu vào Hadoop với Flume

- Các kịch bản nạp dữ liệu

- Sử dụng Sqoop - Tổng quan về

CLO1 CLO2 CLO3 CLO5

- GV sử dụng tài liệu [1] và projector để thuyết giảng

- Phần chuẩn bị ở nhà:

Đọc trước Cuốn [1]: Phần 3; Cuốn [2]: Phần 5

- Ghi chú, tham gia các hoạt động trên lớp

7 Chương 4 Các công cụ phát triển ứng dụng dữ liệu lớn

4.4 Sử dụng Hbase để Truy xuất thời gian thực đến Dữ liệu lớn

- Giới thiệu Hbase - HBase Client API

– Cơ bản - Client API: Các

tính năng Quản trị và Nâng cao - Các client HBase

hiện có

- Tích hợp HBase và MapReduce - Cấu hình và Quản

trị HBase

giảng

7.2 Đặt câu hỏi gợi mở để sinh viên trả lời 7.3 Trình bày ví dụ và bài tập áp dụng

CLO1 CLO2 CLO3 CLO5

- GV sử dụng tài liệu [1] và projector để thuyết giảng

- Phần chuẩn bị ở nhà:

Đọc trước Cuốn [1]: Phần 3; Cuốn [2]: Phần 5

- Ghi chú, tham gia các hoạt động trên lớp

8 Chương 5 Phân tích Dữ liệu Lớn 5.1 Phân tích dữ liệu

bảng tính với BigSheets - BigSheets là gì? - Chức năng của

BigSheets

- BigSheets chuyên sâu

giảng

8.2 Đặt câu hỏi gợi mở để sinh viên trả lời 8.3 Trình bày ví dụ và bài tập áp dụng

CLO1 CLO2 CLO3 CLO5

- GV sử dụng tài liệu [1] và projector để thuyết giảng

- Phần chuẩn bị ở nhà:

Đọc trước Cuốn [1]: Phần 5, 6; Cuốn [3]

- Ghi chú, tham gia các hoạt động trên lớp

Trang 5

5- Một ví dụ tình

huống sử dụng BigSheets đầy đủ 5.2 Phân tích Văn

bản Cơ bản 5.3 Báo cáo và phân

tích với Hadoop

9 Chương 5 Phân tích Dữ liệu Lớn 5.4 Ngôn ngữ R

- Phân tích dữ liệu với ngôn ngữ R - Sử dụng R với Cơ

sở dữ liệu

5.5 Phân tích tích dữ liệu thời gian thực - Tính toán dòng Tính toán dòng với môi trường

3 9.1 Giao bài tập

9.2 Mô tả các yêu cầu thực hiện

9.3 Đánh giá, hướng dẫn thực hiện và sửa bài tập

CLO1 CLO2 CLO3 CLO5

- GV sử dụng tài liệu [1] và projector để thuyết giảng

- Phần chuẩn bị ở nhà:

Đọc trước Cuốn [1]: Phần 5, 6; Cuốn [3]

- Ghi chú, tham gia các hoạt động trên lớp

10 Ôn tập 3 10.1 Ôn tập kiến thức 10.2 Rút tỉa bài học kinh nghiệm từ các bài tập 10.3 Hướng dẫn thực hiện đồ án môn học

- Ôn tập nội dung lý thuyết - Thảo luận và ghi chú

- Các học phần thực hành: được tổ chức thực hiện vào tuần thứ 4 của học kỳ, có nội dung thuyết giảng và chuẩn đầu ra tương quan với nội dung bài giảng lý thuyết

Buổi/

Số tiết (TH)

Hoạt động của giảng viên

Lquan đến CĐR nào ở bảng 3.1

Hoạt động học của

Tên bài đánh giá

1 Bài 1: đặt cấu hình Hadoop 3 TH - Thuyết giảng - Hướng dẫn sinh

viên thực hiện

CLO1 CLO3

- Nghe giảng, ghi chú - Trả lời câu

hỏi

- Thực hành trên máy

2, 3 Bài 2: Cài đặt thuật toán khai thác dữ liệu cơ bản trên Hadoop - Mapreduce

6 TH - Thuyết giảng - Hướng dẫn sinh

viên thực hiện

CLO1 CLO3

- Nghe giảng, ghi chú - Trả lời câu

hỏi

- Thực hành trên máy

4,5,6,7

Bài 3: Các công cụ phát triển ứng dụng dữ liệu lớn

12 TH - Thuyết giảng - Hướng dẫn sinh

viên thực hiện

CLO1 CLO3 CLO5

- Trả lời câu hỏi

- Thực hành trên máy

8,9 Bài 4: Phân tích dữ liệu với ngôn ngữ R

6 TH - Thuyết giảng - Hướng dẫn sinh

viên thực hiện

CLO1 CLO3 CLO5

- Trả lời câu hỏi

- Thực hành trên máy

10 Bài 5: Thi thực hành 3 TH - Giao bài thi CLO3 - Thực hiện A2

Trang 6

CLO4 trên máy

7 Học liệu:

Bảng 7.1 Sách, giáo trình, tài liệu tham khảo

XB

Tên sách, giáo trình, tên bài báo, văn bản

NXB, tên tạp chí/ nơi ban hành VB Giáo trình chính

1 Nhóm tác giả 2012 Big Data Now: 2012 Edition

(https://www.kdnuggets.com/2015/09/free-data-science-books.html)

O’Reilly Media, Inc

Sách, giáo trình tham khảo

2 Jeffrey Needham 2013 Disruptive Possibilities: How Big Data Changes Everything

https://www.kdnuggets.com/2015/09/free-data-science-books.html)

8.Cơ sở vật chất phục vụ giảng dạy:

Bảng 8.1 Cơ sở vật chất giảng dạy của HP

mềm,…

Số lượng

1 Phòng máy Khoa CNTT Giảng viên sẽ hướng dẫn sinh viên tải và cài đặt theo yêu cầu từng buổi thực hành

Ngày đăng: 29/05/2024, 14:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN