Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công nghệ thông tin 1 TRƯỜNG ĐH NGOẠI NGỮ - TIN HỌC TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Khoa CÔNG NGHỆ THÔNG TIN Độc Lập - Tự Do - Hạnh Phúc CHƯƠNG TRÌNH GIÁO DỤC ĐẠI HỌC Trình độ đào tạo: Đại học Ngành: Công nghệ thông tin Mã số: 7480201 ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN 1. Thông tin chung về HP 1.1 Mã học phần: 1230493 1.2 Tên học phần: Dữ liệu lớn 1.3 Ký hiệu học phần: 1230493 1.4 Tên tiếng Anh: Big Data 1.5 Số tín chỉ: 4 (3 + 1) 1.6 Phân bố thời gian: - Lý thuyết: 45 tiết - Thực hành: 30 tiết - Tự học: 90 tiết 1.7 Các giảng viên phụ trách học phần: - Giảng viên phụ trách chính: - Danh sách giảng viên cùng giảng dạy: 1.8 Điều kiện tham gia học phần: - Học phần tiên quyết: Không có - Học phần học trước: Cơ sở dữ liệu - Học phần song hành: Không yêu cầu 2. Mục tiêu HP 2.1. Mục tiêu chung Học phần giới thiệu định nghĩa và các vấn đề cơ bản của dữ liệu lớn trong 3 chương đầu tiên. Sau đó các công cụ cung cấp các chức năng khác nhau để quản lý dữ liệu lớn, kết nối cơ sở dữ liệu lớn, lập trình và phát triển ứng dụng cũng như triển khai các ứng dụng dữ liệu lớn trong nhiều môi trường khác nhau được giới thiệu ở chương thứ 4. Chương 5 giới thiệu các chủ đề chuyên sâu về việc phân tích dữ liệu lớn, cung cấp những gợi ý thích hợp để sinh viên phát triển và tiến hành các đề tài nghiên cứu về dữ liệu lớn. 2.2. Mục tiêu HP cụ thể 2.2.1. Về kiến thức: - Kiến thức nền tảng: Các khái niệm về dữ liệu lớn và các vấn đề liên quan. Biết và giải thích được các thuật ngữ tiếng Anh thuộc lĩnh vực dữ liệu lớn - Hiểu được ý nghĩa và ứng dụng của các bài toán trong khai thác dữ liệu lớn đối với các vấn đề thực tế. 2.2.2. Về kỹ năng: - Sử dụng được một số công cụ trong việc triển khai và lập trình trên dữ liệu lớn. - Kỹ năng nghề nghiệp: Phân tích dữ liệu văn bản và dữ liệu thời gian thông qua các công cụ hỗ trợ. - Kỹ năng cá nhân: Làm việc ở mức độ cá nhân và cộng tác nhóm để trình bày một số báo cáo khoa học theo mẫu và thuyết trình các nội dung liên quan đến môn học. 2.2.3. Về thái độ - Có thái độ làm việc khoa học, trung thực, rõ ràng. - Chuẩn bị bài trước khi đến lớp. Đi học đầy đủ. Tham gia tích cực trong giờ học. - Làm tất cả các bài tập lý thuyết và thực hành. 2 3. Chuẩn đầu ra của HP “Dữ liệu lớn” Bảng 3.1. Chuẩn đầu ra (CĐR) của HP Sau khi học xong học phần, SV có khả năng: Ký hiệu CĐR HP Nội dung CĐR HP (CLO) CLO1 Hiểu được các khái niệm về dữ liệu lớn và ý nghĩa, ứng dụng của các bài toán trong khai thác dữ liệu lớn trong thực tế. CLO2 Có trách nhiệm trong học tập, trung thực và sử dụng phần mềm hợp pháp. CLO3 Sử dụng được các công cụ trong việc triển khai và lập trình trên dữ liệu lớn CLO4 Có khả năng đọc tài liệu và tự nghiên cứu những giải thuật khai thác dữ liệu lớn tiêu biểu. CLO5 Sử dụng công cụ hỗ trợ trong việc phân tích dữ liệu văn bản và dữ liệu thời gian trong các bài toán thực tế 4. Mối liên hệ giữa CĐR HP (CLO) với CĐR CTĐT (PLO) Mức độ đóng góp của CLO vào PLO được xác định cụ thể: 1 – CLO có đóng góp vừa vào PLO 2 – CLO có đóng góp nhiều vào PLO Chú thích: 2 - Cao, 1 - Thấp - phụ thuộc vào mức hỗ trợ của CLO đối với PLO ở mức bắt đầu (1) hoặc mức nâng cao hơn mức bắt đầu, có nhiều cơ hội được thực hành, thí nghiệm, thực tế,…(mức 2) Bảng 4.1. Mối liên hệ của CĐR HP (CLO) đến CĐR của CTĐT (PLO) PLO (1) (2) (3) (4) (5) (6) (7a,b,c,d) (8b, c,d) (9) (10) (11) CLO 1 2 CLO 2 1 CLO 3 2 2 CLO4 2 2 CLO5 2 2 2 Tổng hợp học phần 1 1 2 2 2 2 2 2 5. Đánh giá HP a. Phương pháp, hình thức kiểm tra - đánh giá của HP Bảng 5.1. Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV ở HP Thphần đánh giá Trọng số Bài đánh giá Trọng số con Rubric Lquan đến CĐR nào ở bảng 3.1 HD PP đánh giá (1) (2) (3) (4) (5) (6) (7) A1. Kiểm tra thường xuyên (KTTX) 20 A1.1. Từng buổi học 10 R1 CLO 1 - Điểm danh - Đánh giá hoạt động trên lớp A1.2. Tuần 4: Làm bài tập Chương 2, 3 30 R3 CLO 3 CLO 4 - Đánh giá khả năng đọc và nghiên cứu tài liệu A2. Đánh giá phần thực hành 30 Sinh viên hoàn thành bài thực hành trong buổi thực hành R3 CLO 3 CLO 4 - GV giao bài thực hành vào đầu mỗi buổi thực hành - GV chấm kết quả vào cuối buổi thực hành A3. Đánh giá cuối kỳ 50 Thuyết trình cuối kỳ. R4 CLO 2 CLO 3 CLO 4 - Vấn đáp b. Chính sách đối với HP - 3 6. Kế hoạch và nội dung giảng dạy HP Bảng 6.1. Kế hoạch và nội dung giảng dạy của HP theo tuần Tuần Buổi (3 tiếtb) Các nội dung cơ bản của bài học (chương) (đến 3 số) Số tiết (LTTH TT) CĐR của bài học (chương) chủ đề Lquan đến CĐR nào ở bảng 3.1 PP giảng dạy đạt CĐR Hoạt động học của SV() Tên bài đánh giá (ở cột 3 bảng 6.1 (1) (2) (3) (4) (5) (6) (7) (8) 1 Chương 1. Cơ bản về Dữ liệu lớn 1.1. Dữ liệu lớn là gì? 1.2. Phân tích với BigSheets 1.3. Phân tích dữ liệu tĩnh 1.4. Dữ liệu khi phân tích động, thời gian thực 3 1.1. Thuyết giảng 1.2. Đặt câu hỏi gợi mở để sinh viên trả lời 1.3. Liên hệ với những kiến thức đã học trước đó và kinh nghiệm đã có CLO1 CLO2 - GV sử dụng tài liệu 1 và projector để thuyết giảng - Phần chuẩn bị ở nhà: Đọc trước Cuốn 1: Phần 2; Cuốn 2: Phần 1, 2 - Ghi chú, tham gia các hoạt động trên lớp 2 Chương 2. Hadoop cơ bản 2.1. Giới thiệu Hadoop 2.2. Kiến trúc Hadoop 2.3. Quản trị Hadoop 2.4. Các thành phần của Hadoop 3 2.1. Thuyết giảng 2.2. Đặt câu hỏi gợi mở để sinh viên trả lời 2.3. Cách đánh giá giải thuật CLO1 CLO2 CLO3 - GV sử dụng tài liệu 1 và projector để thuyết giảng - Phần chuẩn bị ở nhà: Đọc trước Cuốn 1: Phần 2; Cuốn 3 - Ghi chú, tham gia các hoạt động trên ...
Trang 1TRƯỜNG ĐH NGOẠI NGỮ -
CHƯƠNG TRÌNH GIÁO DỤC ĐẠI HỌC
Trình độ đào tạo: Đại học Ngành: Công nghệ thông tin Mã số: 7480201 ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN
1 Thông tin chung về HP
1.1 Mã học phần: 1230493 1.2 Tên học phần: Dữ liệu lớn 1.3 Ký hiệu học phần: 1230493 1.4 Tên tiếng Anh: Big Data
- Danh sách giảng viên cùng giảng dạy:
1.8 Điều kiện tham gia học phần:
2 Mục tiêu HP 2.1 Mục tiêu chung
Học phần giới thiệu định nghĩa và các vấn đề cơ bản của dữ liệu lớn trong 3 chương đầu tiên Sau đó các công cụ cung cấp các chức năng khác nhau để quản lý dữ liệu lớn, kết nối cơ sở dữ liệu lớn, lập trình và phát triển ứng dụng cũng như triển khai các ứng dụng dữ liệu lớn trong nhiều môi trường khác nhau được giới thiệu ở chương thứ 4
Chương 5 giới thiệu các chủ đề chuyên sâu về việc phân tích dữ liệu lớn, cung cấp những gợi ý thích hợp để sinh viên phát triển và tiến hành các đề tài nghiên cứu về dữ liệu lớn
2.2 Mục tiêu HP cụ thể 2.2.1 Về kiến thức:
- Kiến thức nền tảng: Các khái niệm về dữ liệu lớn và các vấn đề liên quan Biết và giải thích được các thuật ngữ tiếng Anh thuộc lĩnh vực dữ liệu lớn
- Hiểu được ý nghĩa và ứng dụng của các bài toán trong khai thác dữ liệu lớn đối với các vấn đề thực tế
2.2.2 Về kỹ năng:
- Sử dụng được một số công cụ trong việc triển khai và lập trình trên dữ liệu lớn
- Kỹ năng nghề nghiệp: Phân tích dữ liệu văn bản và dữ liệu thời gian thông qua các công cụ hỗ trợ - Kỹ năng cá nhân: Làm việc ở mức độ cá nhân và cộng tác nhóm để trình bày một số báo cáo khoa học theo mẫu và thuyết trình các nội dung liên quan đến môn học
2.2.3 Về thái độ
- Có thái độ làm việc khoa học, trung thực, rõ ràng
- Chuẩn bị bài trước khi đến lớp Đi học đầy đủ Tham gia tích cực trong giờ học - Làm tất cả các bài tập lý thuyết và thực hành
Trang 23 Chuẩn đầu ra của HP “Dữ liệu lớn”
Bảng 3.1 Chuẩn đầu ra (CĐR) của HP
Sau khi học xong học phần, SV có khả năng:
CLO1 Hiểu được các khái niệm về dữ liệu lớn và ý nghĩa, ứng dụng của các bài toán trong khai thác dữ liệu lớn trong thực tế
CLO2 Có trách nhiệm trong học tập, trung thực và sử dụng phần mềm hợp pháp CLO3 Sử dụng được các công cụ trong việc triển khai và lập trình trên dữ liệu
4 Mối liên hệ giữa CĐR HP (CLO) với CĐR CTĐT (PLO)
Mức độ đóng góp của CLO vào PLO được xác định cụ thể:
1 – CLO có đóng góp vừa vào PLO 2 – CLO có đóng góp nhiều vào PLO
Chú thích: 2 - Cao, 1 - Thấp - phụ thuộc vào mức hỗ trợ của CLO đối với PLO ở mức bắt đầu (1) hoặc mức nâng cao hơn mức bắt đầu, có nhiều cơ hội được thực hành, thí nghiệm, thực tế,…(mức 2)
Bảng 4.1 Mối liên hệ của CĐR HP (CLO) đến CĐR của CTĐT (PLO) PLO (1) (2) (3) (4) (5) (6) (7a,b,c,d) (8b, c,d) (9) (10) (11) CLO 1 2
a Phương pháp, hình thức kiểm tra - đánh giá của HP
Bảng 5.1 Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV ở HP Th/phần
đánh giá Trọng số Bài đánh giá Trọng số con
Rubric Lquan đến CĐR nào ở bảng 3.1
HD PP đánh giá
A1 Kiểm tra thường xuyên (KTTX)
20%
A1.1 Từng buổi học
10%
R1 CLO 1 - Điểm danh
- Đánh giá hoạt động trên lớp
A1.2 Tuần 4: Làm bài
30%
Sinh viên hoàn thành bài thực hành trong buổi thực hành
- Vấn đáp
b Chính sách đối với HP
-
Trang 36 Kế hoạch và nội dung giảng dạy HP
Bảng 6.1 Kế hoạch và nội dung giảng dạy của HP theo tuần Tuần/
TT)
CĐR của bài học (chương)/
chủ đề
Lquan đến CĐR nào ở bảng 3.1
PP giảng dạy đạt
CĐR
Hoạt động học của
SV(*)
Tên bài đánh
giá
(ở cột 3
bảng 6.1
(1) (2) (3) (4) (5) (6) (7) (8) 1 Chương 1 Cơ bản về
Dữ liệu lớn
1.1 Dữ liệu lớn là gì? 1.2 Phân tích với BigSheets
1.3 Phân tích dữ liệu tĩnh
1.4 Dữ liệu khi phân tích động, thời gian thực
giảng
1.2 Đặt câu hỏi gợi mở để sinh viên trả lời 1.3 Liên hệ với những kiến thức đã học trước đó và kinh nghiệm đã có
CLO1 CLO2
- GV sử dụng tài liệu [1] và projector để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]: Phần 2; Cuốn [2]: Phần 1, 2
- Ghi chú, tham gia các hoạt động trên lớp 2 Chương 2 Hadoop cơ
bản
2.1 Giới thiệu Hadoop 2.2 Kiến trúc
Hadoop
2.3 Quản trị Hadoop 2.4 Các thành phần
của Hadoop
giảng
2.2 Đặt câu hỏi gợi mở để sinh viên trả lời 2.3 Cách đánh giá giải thuật
CLO1 CLO2 CLO3
- GV sử dụng tài liệu [1] và projector để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]: Phần 2; Cuốn [3]
- Ghi chú, tham gia các hoạt động trên lớp 3 Chương 3 Lập trình
MapReduce 3.1 Giới thiệu
MapReduce 3.2 Lập trình
MapReduce 3.3 Lập trình
MapReduce dùng BigInsights
giảng
3.2 Đặt câu hỏi gợi mở để sinh viên trả lời 3.3 Cách nghiên cứu và đánh giá giải thuật
CLO1 CLO2 CLO3
- GV sử dụng tài liệu [1] và projector để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]: Phần 2; Cuốn [3]
- Ghi chú, tham gia các hoạt động trên lớp 4 Bài tập Chương 2, 3 3 4.1 Giao bài
tập
4.2 Mô tả các yêu cầu thực hiện
4.3 Đánh giá, hướng dẫn thực hiện và sửa bài tập
CLO3 CLO4
A1.2
5 Chương 4 Các công cụ phát triển ứng dụng dữ liệu lớn
4.1 Pig
- Pig Cơ bản - Các phép toán
quan hệ Pig
giảng
5.2 Đặt câu hỏi gợi mở để sinh viên trả lời 5.3 Cách nghiên cứu và
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]: Phần 3; Cuốn [2]:
A1.2
Trang 44Các phép toán đánh
giá và các hàm khác
đánh giá giải
- Ghi chú, tham gia các hoạt động trên lớp 6 Chương 4 Các công
cụ phát triển ứng dụng dữ liệu lớn (tt)
4.2 Jaql
- Tổng quan Jaql - Ngôn ngữ Jaql Cơ
bản
- Các phép toán cơ sở
- Hỗ trợ SQL Jaql - Jaql và
MapReduce - Input và Output 4.3 Chuyển dữ liệu vào Hadoop với Flume
- Các kịch bản nạp dữ liệu
- Sử dụng Sqoop - Tổng quan về
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]: Phần 3; Cuốn [2]: Phần 5
- Ghi chú, tham gia các hoạt động trên lớp
7 Chương 4 Các công cụ phát triển ứng dụng dữ liệu lớn
4.4 Sử dụng Hbase để Truy xuất thời gian thực đến Dữ liệu lớn
- Giới thiệu Hbase - HBase Client API
– Cơ bản - Client API: Các
tính năng Quản trị và Nâng cao - Các client HBase
hiện có
- Tích hợp HBase và MapReduce - Cấu hình và Quản
trị HBase
giảng
7.2 Đặt câu hỏi gợi mở để sinh viên trả lời 7.3 Trình bày ví dụ và bài tập áp dụng
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]: Phần 3; Cuốn [2]: Phần 5
- Ghi chú, tham gia các hoạt động trên lớp
8 Chương 5 Phân tích Dữ liệu Lớn 5.1 Phân tích dữ liệu
bảng tính với BigSheets - BigSheets là gì? - Chức năng của
BigSheets
- BigSheets chuyên sâu
giảng
8.2 Đặt câu hỏi gợi mở để sinh viên trả lời 8.3 Trình bày ví dụ và bài tập áp dụng
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]: Phần 5, 6; Cuốn [3]
- Ghi chú, tham gia các hoạt động trên lớp
Trang 55- Một ví dụ tình
huống sử dụng BigSheets đầy đủ 5.2 Phân tích Văn
bản Cơ bản 5.3 Báo cáo và phân
tích với Hadoop
9 Chương 5 Phân tích Dữ liệu Lớn 5.4 Ngôn ngữ R
- Phân tích dữ liệu với ngôn ngữ R - Sử dụng R với Cơ
sở dữ liệu
5.5 Phân tích tích dữ liệu thời gian thực - Tính toán dòng Tính toán dòng với môi trường
3 9.1 Giao bài tập
9.2 Mô tả các yêu cầu thực hiện
9.3 Đánh giá, hướng dẫn thực hiện và sửa bài tập
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]: Phần 5, 6; Cuốn [3]
- Ghi chú, tham gia các hoạt động trên lớp
10 Ôn tập 3 10.1 Ôn tập kiến thức 10.2 Rút tỉa bài học kinh nghiệm từ các bài tập 10.3 Hướng dẫn thực hiện đồ án môn học
- Ôn tập nội dung lý thuyết - Thảo luận và ghi chú
- Các học phần thực hành: được tổ chức thực hiện vào tuần thứ 4 của học kỳ, có nội dung thuyết giảng và chuẩn đầu ra tương quan với nội dung bài giảng lý thuyết
Buổi/
Số tiết (TH)
Hoạt động của giảng viên
Lquan đến CĐR nào ở bảng 3.1
Hoạt động học của
Tên bài đánh giá
1 Bài 1: đặt cấu hình Hadoop 3 TH - Thuyết giảng - Hướng dẫn sinh
viên thực hiện
CLO1 CLO3
- Nghe giảng, ghi chú - Trả lời câu
hỏi
- Thực hành trên máy
2, 3 Bài 2: Cài đặt thuật toán khai thác dữ liệu cơ bản trên Hadoop - Mapreduce
6 TH - Thuyết giảng - Hướng dẫn sinh
viên thực hiện
CLO1 CLO3
- Nghe giảng, ghi chú - Trả lời câu
hỏi
- Thực hành trên máy
4,5,6,7
Bài 3: Các công cụ phát triển ứng dụng dữ liệu lớn
12 TH - Thuyết giảng - Hướng dẫn sinh
viên thực hiện
CLO1 CLO3 CLO5
- Trả lời câu hỏi
- Thực hành trên máy
8,9 Bài 4: Phân tích dữ liệu với ngôn ngữ R
6 TH - Thuyết giảng - Hướng dẫn sinh
viên thực hiện
CLO1 CLO3 CLO5
- Trả lời câu hỏi
- Thực hành trên máy
10 Bài 5: Thi thực hành 3 TH - Giao bài thi CLO3 - Thực hiện A2
Trang 6CLO4 trên máy
7 Học liệu:
Bảng 7.1 Sách, giáo trình, tài liệu tham khảo
XB
Tên sách, giáo trình, tên bài báo, văn bản
NXB, tên tạp chí/ nơi ban hành VB Giáo trình chính
1 Nhóm tác giả 2012 Big Data Now: 2012 Edition
(https://www.kdnuggets.com/2015/09/free-data-science-books.html)
O’Reilly Media, Inc
Sách, giáo trình tham khảo
2 Jeffrey Needham 2013 Disruptive Possibilities: How Big Data Changes Everything
https://www.kdnuggets.com/2015/09/free-data-science-books.html)
8.Cơ sở vật chất phục vụ giảng dạy:
Bảng 8.1 Cơ sở vật chất giảng dạy của HP
mềm,…
Số lượng
1 Phòng máy Khoa CNTT Giảng viên sẽ hướng dẫn sinh viên tải và cài đặt theo yêu cầu từng buổi thực hành