Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công nghệ thông tin 1 TRƯỜNG ĐH NGOẠI NGỮ - TIN HỌC TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Khoa CÔNG NGHỆ THÔNG TIN Độc Lập - Tự Do - Hạnh Phúc CHƯƠNG TRÌNH GIÁO DỤC ĐẠI HỌC Trình độ đào tạo: Đại học Ngành: Công nghệ thông tin Mã số: 7480201 ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN 1. Thông tin chung về HP 1.1 Mã học phần: 1230493 1.2 Tên học phần: Dữ liệu lớn 1.3 Ký hiệu học phần: 1230493 1.4 Tên tiếng Anh: Big Data 1.5 Số tín chỉ: 4 (3 + 1) 1.6 Phân bố thời gian: - Lý thuyết: 45 tiết - Thực hành: 30 tiết - Tự học: 90 tiết 1.7 Các giảng viên phụ trách học phần: - Giảng viên phụ trách chính: - Danh sách giảng viên cùng giảng dạy: 1.8 Điều kiện tham gia học phần: - Học phần tiên quyết: Không có - Học phần học trước: Cơ sở dữ liệu - Học phần song hành: Không yêu cầu 2. Mục tiêu HP 2.1. Mục tiêu chung Học phần giới thiệu định nghĩa và các vấn đề cơ bản của dữ liệu lớn trong 3 chương đầu tiên. Sau đó các công cụ cung cấp các chức năng khác nhau để quản lý dữ liệu lớn, kết nối cơ sở dữ liệu lớn, lập trình và phát triển ứng dụng cũng như triển khai các ứng dụng dữ liệu lớn trong nhiều môi trường khác nhau được giới thiệu ở chương thứ 4. Chương 5 giới thiệu các chủ đề chuyên sâu về việc phân tích dữ liệu lớn, cung cấp những gợi ý thích hợp để sinh viên phát triển và tiến hành các đề tài nghiên cứu về dữ liệu lớn. 2.2. Mục tiêu HP cụ thể 2.2.1. Về kiến thức: - Kiến thức nền tảng: Các khái niệm về dữ liệu lớn và các vấn đề liên quan. Biết và giải thích được các thuật ngữ tiếng Anh thuộc lĩnh vực dữ liệu lớn - Hiểu được ý nghĩa và ứng dụng của các bài toán trong khai thác dữ liệu lớn đối với các vấn đề thực tế. 2.2.2. Về kỹ năng: - Sử dụng được một số công cụ trong việc triển khai và lập trình trên dữ liệu lớn. - Kỹ năng nghề nghiệp: Phân tích dữ liệu văn bản và dữ liệu thời gian thông qua các công cụ hỗ trợ. - Kỹ năng cá nhân: Làm việc ở mức độ cá nhân và cộng tác nhóm để trình bày một số báo cáo khoa học theo mẫu và thuyết trình các nội dung liên quan đến môn học. 2.2.3. Về thái độ - Có thái độ làm việc khoa học, trung thực, rõ ràng. - Chuẩn bị bài trước khi đến lớp. Đi học đầy đủ. Tham gia tích cực trong giờ học. - Làm tất cả các bài tập lý thuyết và thực hành. 2 3. Chuẩn đầu ra của HP “Dữ liệu lớn” Bảng 3.1. Chuẩn đầu ra (CĐR) của HP Sau khi học xong học phần, SV có khả năng: Ký hiệu CĐR HP Nội dung CĐR HP (CLO) CLO1 Hiểu được các khái niệm về dữ liệu lớn và ý nghĩa, ứng dụng của các bài toán trong khai thác dữ liệu lớn trong thực tế. CLO2 Có trách nhiệm trong học tập, trung thực và sử dụng phần mềm hợp pháp. CLO3 Sử dụng được các công cụ trong việc triển khai và lập trình trên dữ liệu lớn CLO4 Có khả năng đọc tài liệu và tự nghiên cứu những giải thuật khai thác dữ liệu lớn tiêu biểu. CLO5 Sử dụng công cụ hỗ trợ trong việc phân tích dữ liệu văn bản và dữ liệu thời gian trong các bài toán thực tế 4. Mối liên hệ giữa CĐR HP (CLO) với CĐR CTĐT (PLO) Mức độ đóng góp của CLO vào PLO được xác định cụ thể: 1 – CLO có đóng góp vừa vào PLO 2 – CLO có đóng góp nhiều vào PLO Chú thích: 2 - Cao, 1 - Thấp - phụ thuộc vào mức hỗ trợ của CLO đối với PLO ở mức bắt đầu (1) hoặc mức nâng cao hơn mức bắt đầu, có nhiều cơ hội được thực hành, thí nghiệm, thực tế,…(mức 2) Bảng 4.1. Mối liên hệ của CĐR HP (CLO) đến CĐR của CTĐT (PLO) PLO (1) (2) (3) (4) (5) (6) (7a,b,c,d) (8b, c,d) (9) (10) (11) CLO 1 2 CLO 2 1 CLO 3 2 2 CLO4 2 2 CLO5 2 2 2 Tổng hợp học phần 1 1 2 2 2 2 2 2 5. Đánh giá HP a. Phương pháp, hình thức kiểm tra - đánh giá của HP Bảng 5.1. Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV ở HP Thphần đánh giá Trọng số Bài đánh giá Trọng số con Rubric Lquan đến CĐR nào ở bảng 3.1 HD PP đánh giá (1) (2) (3) (4) (5) (6) (7) A1. Kiểm tra thường xuyên (KTTX) 20 A1.1. Từng buổi học 10 R1 CLO 1 - Điểm danh - Đánh giá hoạt động trên lớp A1.2. Tuần 4: Làm bài tập Chương 2, 3 30 R3 CLO 3 CLO 4 - Đánh giá khả năng đọc và nghiên cứu tài liệu A2. Đánh giá phần thực hành 30 Sinh viên hoàn thành bài thực hành trong buổi thực hành R3 CLO 3 CLO 4 - GV giao bài thực hành vào đầu mỗi buổi thực hành - GV chấm kết quả vào cuối buổi thực hành A3. Đánh giá cuối kỳ 50 Thuyết trình cuối kỳ. R4 CLO 2 CLO 3 CLO 4 - Vấn đáp b. Chính sách đối với HP - 3 6. Kế hoạch và nội dung giảng dạy HP Bảng 6.1. Kế hoạch và nội dung giảng dạy của HP theo tuần Tuần Buổi (3 tiếtb) Các nội dung cơ bản của bài học (chương) (đến 3 số) Số tiết (LTTH TT) CĐR của bài học (chương) chủ đề Lquan đến CĐR nào ở bảng 3.1 PP giảng dạy đạt CĐR Hoạt động học của SV() Tên bài đánh giá (ở cột 3 bảng 6.1 (1) (2) (3) (4) (5) (6) (7) (8) 1 Chương 1. Cơ bản về Dữ liệu lớn 1.1. Dữ liệu lớn là gì? 1.2. Phân tích với BigSheets 1.3. Phân tích dữ liệu tĩnh 1.4. Dữ liệu khi phân tích động, thời gian thực 3 1.1. Thuyết giảng 1.2. Đặt câu hỏi gợi mở để sinh viên trả lời 1.3. Liên hệ với những kiến thức đã học trước đó và kinh nghiệm đã có CLO1 CLO2 - GV sử dụng tài liệu 1 và projector để thuyết giảng - Phần chuẩn bị ở nhà: Đọc trước Cuốn 1: Phần 2; Cuốn 2: Phần 1, 2 - Ghi chú, tham gia các hoạt động trên lớp 2 Chương 2. Hadoop cơ bản 2.1. Giới thiệu Hadoop 2.2. Kiến trúc Hadoop 2.3. Quản trị Hadoop 2.4. Các thành phần của Hadoop 3 2.1. Thuyết giảng 2.2. Đặt câu hỏi gợi mở để sinh viên trả lời 2.3. Cách đánh giá giải thuật CLO1 CLO2 CLO3 - GV sử dụng tài liệu 1 và projector để thuyết giảng - Phần chuẩn bị ở nhà: Đọc trước Cuốn 1: Phần 2; Cuốn 3 - Ghi chú, tham gia các hoạt động trên ...
Trang 1TRƯỜNG ĐH NGOẠI NGỮ -
CHƯƠNG TRÌNH GIÁO DỤC ĐẠI HỌC Trình độ đào tạo: Đại học Ngành: Công nghệ thông tin Mã số: 7480201
ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN
1 Thông tin chung về HP
1.1 Mã học phần: 1230493 1.2 Tên học phần: Dữ liệu lớn
1.3 Ký hiệu học phần: 1230493 1.4 Tên tiếng Anh: Big Data
1.6 Phân bố thời gian:
1.7 Các giảng viên phụ trách học phần:
- Giảng viên phụ trách chính:
- Danh sách giảng viên cùng giảng dạy:
1.8 Điều kiện tham gia học phần:
2 Mục tiêu HP
2.1 Mục tiêu chung
Học phần giới thiệu định nghĩa và các vấn đề cơ bản của dữ liệu lớn trong 3 chương đầu tiên Sau
đó các công cụ cung cấp các chức năng khác nhau để quản lý dữ liệu lớn, kết nối cơ sở dữ liệu lớn, lập trình
và phát triển ứng dụng cũng như triển khai các ứng dụng dữ liệu lớn trong nhiều môi trường khác nhau được giới thiệu ở chương thứ 4
Chương 5 giới thiệu các chủ đề chuyên sâu về việc phân tích dữ liệu lớn, cung cấp những gợi ý thích hợp để sinh viên phát triển và tiến hành các đề tài nghiên cứu về dữ liệu lớn
2.2 Mục tiêu HP cụ thể
2.2.1 Về kiến thức:
- Kiến thức nền tảng: Các khái niệm về dữ liệu lớn và các vấn đề liên quan Biết và giải thích được các thuật ngữ tiếng Anh thuộc lĩnh vực dữ liệu lớn
- Hiểu được ý nghĩa và ứng dụng của các bài toán trong khai thác dữ liệu lớn đối với các vấn đề thực tế
2.2.2 Về kỹ năng:
- Sử dụng được một số công cụ trong việc triển khai và lập trình trên dữ liệu lớn
- Kỹ năng nghề nghiệp: Phân tích dữ liệu văn bản và dữ liệu thời gian thông qua các công cụ hỗ trợ
- Kỹ năng cá nhân: Làm việc ở mức độ cá nhân và cộng tác nhóm để trình bày một số báo cáo khoa học theo mẫu và thuyết trình các nội dung liên quan đến môn học
2.2.3 Về thái độ
- Có thái độ làm việc khoa học, trung thực, rõ ràng
- Chuẩn bị bài trước khi đến lớp Đi học đầy đủ Tham gia tích cực trong giờ học
- Làm tất cả các bài tập lý thuyết và thực hành
Trang 23 Chuẩn đầu ra của HP “Dữ liệu lớn”
Bảng 3.1 Chuẩn đầu ra (CĐR) của HP
Sau khi học xong học phần, SV có khả năng:
CLO1 Hiểu được các khái niệm về dữ liệu lớn và ý nghĩa, ứng dụng của các bài
toán trong khai thác dữ liệu lớn trong thực tế
CLO2 Có trách nhiệm trong học tập, trung thực và sử dụng phần mềm hợp pháp CLO3 Sử dụng được các công cụ trong việc triển khai và lập trình trên dữ liệu
lớn CLO4 Có khả năng đọc tài liệu và tự nghiên cứu những giải thuật khai thác dữ
liệu lớn tiêu biểu
CLO5 Sử dụng công cụ hỗ trợ trong việc phân tích dữ liệu văn bản và dữ liệu
thời gian trong các bài toán thực tế
4 Mối liên hệ giữa CĐR HP (CLO) với CĐR CTĐT (PLO)
Mức độ đóng góp của CLO vào PLO được xác định cụ thể:
1 – CLO có đóng góp vừa vào PLO
2 – CLO có đóng góp nhiều vào PLO
Chú thích: 2 - Cao, 1 - Thấp - phụ thuộc vào mức hỗ trợ của CLO đối với PLO ở mức bắt đầu (1) hoặc mức nâng cao hơn mức bắt đầu, có nhiều cơ hội được thực hành, thí nghiệm, thực tế,…(mức 2)
Bảng 4.1 Mối liên hệ của CĐR HP (CLO) đến CĐR của CTĐT (PLO) PLO (1) (2) (3) (4) (5) (6) (7a,b,c,d) (8b, c,d) (9) (10) (11)
CLO 1 2
CLO 2 1
Tổng hợp
học phần 1 1 2 2 2 2 2 2
5 Đánh giá HP
a Phương pháp, hình thức kiểm tra - đánh giá của HP
Bảng 5.1 Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV ở HP
Th/phần
đánh giá Trọng số Bài đánh giá Trọng số con
Rubric Lquan đến
CĐR nào ở bảng 3.1
HD PP đánh giá
A1 Kiểm
tra thường
xuyên
(KTTX)
20%
A1.1 Từng buổi học
10%
R1 CLO 1 - Điểm danh
- Đánh giá hoạt động trên lớp
A1.2 Tuần 4: Làm bài tập Chương 2, 3 30%
CLO 4
- Đánh giá khả năng đọc và nghiên cứu tài liệu
A2 Đánh
giá phần
thực hành
30%
Sinh viên hoàn thành bài thực hành trong buổi thực hành
CLO 4
- GV giao bài thực hành vào đầu mỗi buổi thực hành
- GV chấm kết quả vào cuối buổi thực hành A3 Đánh
giá cuối kỳ 50% Thuyết trình cuối kỳ
CLO 3 CLO 4
- Vấn đáp
b Chính sách đối với HP
-
Trang 36 Kế hoạch và nội dung giảng dạy HP
Bảng 6.1 Kế hoạch và nội dung giảng dạy của HP theo tuần Tuần/
Buổi
(3
tiết/b)
Các nội dung cơ bản
của bài học (chương)
(đến 3 số)
Số tiết (LT/TH/
TT)
CĐR của bài học (chương)/
chủ đề
Lquan đến CĐR nào ở bảng 3.1
PP giảng dạy đạt CĐR
Hoạt động học của SV(*)
Tên bài đánh giá
(ở cột 3
bảng 6.1
(1) (2) (3) (4) (5) (6) (7) (8)
1 Chương 1 Cơ bản về
Dữ liệu lớn
1.1 Dữ liệu lớn là gì?
1.2 Phân tích với
BigSheets
1.3 Phân tích dữ liệu
tĩnh
1.4 Dữ liệu khi phân
tích động, thời gian
thực
giảng
1.2 Đặt câu hỏi gợi mở để sinh viên trả lời 1.3 Liên hệ với những kiến thức
đã học trước đó
và kinh nghiệm
đã có
CLO1 CLO2
- GV sử dụng tài liệu [1] và projector
để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]:
Phần 2;
Cuốn [2]:
Phần 1, 2
- Ghi chú, tham gia các hoạt động trên lớp
2 Chương 2 Hadoop cơ
bản
2.1 Giới thiệu
Hadoop 2.2 Kiến trúc
Hadoop 2.3 Quản trị Hadoop
2.4 Các thành phần
của Hadoop
giảng
2.2 Đặt câu hỏi gợi mở để sinh viên trả lời 2.3 Cách đánh giá giải thuật
CLO1 CLO2 CLO3
- GV sử dụng tài liệu [1] và projector
để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]:
Phần 2;
Cuốn [3]
- Ghi chú, tham gia các hoạt động trên lớp
3 Chương 3 Lập trình
MapReduce
3.1 Giới thiệu
MapReduce 3.2 Lập trình
MapReduce 3.3 Lập trình
MapReduce dùng BigInsights
giảng
3.2 Đặt câu hỏi gợi mở để sinh viên trả lời 3.3 Cách nghiên cứu và đánh giá giải thuật
CLO1 CLO2 CLO3
- GV sử dụng tài liệu [1] và projector
để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]:
Phần 2;
Cuốn [3]
- Ghi chú, tham gia các hoạt động trên lớp
4 Bài tập Chương 2, 3 3 4.1 Giao bài
tập 4.2 Mô tả các yêu cầu thực hiện
4.3 Đánh giá, hướng dẫn thực hiện và sửa bài tập
CLO3 CLO4
A1.2
5 Chương 4 Các công
cụ phát triển ứng dụng
dữ liệu lớn
4.1 Pig
- Pig Cơ bản
- Các phép toán
quan hệ Pig
giảng
5.2 Đặt câu hỏi gợi mở để sinh viên trả lời 5.3 Cách nghiên cứu và
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector
để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]:
Phần 3;
Cuốn [2]:
A1.2
Trang 4Các phép toán đánh
giá và các hàm khác
đánh giá giải
- Ghi chú, tham gia các hoạt động trên lớp
6 Chương 4 Các công
cụ phát triển ứng dụng
dữ liệu lớn (tt)
4.2 Jaql
- Tổng quan Jaql
- Ngôn ngữ Jaql Cơ
bản
- Các phép toán cơ
sở
- Hỗ trợ SQL Jaql
- Jaql và
MapReduce
- Input và Output
4.3 Chuyển dữ liệu
vào Hadoop với Flume
- Các kịch bản nạp
dữ liệu
- Sử dụng Sqoop
- Tổng quan về
Flume
- Sử dụng Flume
giảng
6.2 Đặt câu hỏi gợi mở để sinh viên trả lời
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector
để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]:
Phần 3;
Cuốn [2]:
Phần 5
- Ghi chú, tham gia các hoạt động trên lớp
7 Chương 4 Các công
cụ phát triển ứng dụng
dữ liệu lớn
4.4 Sử dụng Hbase để
Truy xuất thời gian thực đến Dữ liệu lớn
- Giới thiệu Hbase
- HBase Client API
– Cơ bản
- Client API: Các
tính năng Quản trị
và Nâng cao
- Các client HBase
hiện có
- Tích hợp HBase
và MapReduce
- Cấu hình và Quản
trị HBase
giảng
7.2 Đặt câu hỏi gợi mở để sinh viên trả lời 7.3 Trình bày
ví dụ và bài tập
áp dụng
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector
để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]:
Phần 3;
Cuốn [2]:
Phần 5
- Ghi chú, tham gia các hoạt động trên lớp
8 Chương 5 Phân tích
Dữ liệu Lớn
5.1 Phân tích dữ liệu
bảng tính với BigSheets
- BigSheets là gì?
- Chức năng của
BigSheets
- BigSheets chuyên
sâu
giảng
8.2 Đặt câu hỏi gợi mở để sinh viên trả lời 8.3 Trình bày
ví dụ và bài tập
áp dụng
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector
để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]:
Phần 5, 6;
Cuốn [3]
- Ghi chú, tham gia các hoạt động trên lớp
Trang 5- Một ví dụ tình
huống sử dụng BigSheets đầy đủ 5.2 Phân tích Văn
bản Cơ bản 5.3 Báo cáo và phân
tích với Hadoop
9 Chương 5 Phân tích
Dữ liệu Lớn 5.4 Ngôn ngữ R
- Phân tích dữ liệu
với ngôn ngữ R
- Sử dụng R với Cơ
sở dữ liệu 5.5 Phân tích tích dữ
liệu thời gian thực
- Tính toán dòng
Tính toán dòng với
môi trường
SmartCloud
3 9.1 Giao bài
tập 9.2 Mô tả các yêu cầu thực hiện
9.3 Đánh giá, hướng dẫn thực hiện và sửa bài tập
CLO1 CLO2 CLO3 CLO5
- GV sử dụng tài liệu [1] và projector
để thuyết giảng
- Phần chuẩn bị ở nhà:
Đọc trước Cuốn [1]:
Phần 5, 6;
Cuốn [3]
- Ghi chú, tham gia các hoạt động trên lớp
10 Ôn tập 3 10.1 Ôn tập
kiến thức 10.2 Rút tỉa bài học kinh nghiệm từ các bài tập 10.3 Hướng dẫn thực hiện
đồ án môn học
- Ôn tập nội dung lý thuyết
- Thảo luận
và ghi chú
- Các học phần thực hành: được tổ chức thực hiện vào tuần thứ 4 của học kỳ, có nội dung thuyết giảng và chuẩn đầu ra tương quan với nội dung bài giảng lý thuyết
Buổi/
Số tiết (TH)
Hoạt động của giảng viên
Lquan đến CĐR nào ở bảng 3.1
Hoạt động học của SV
Tên bài đánh giá
1 Bài 1: đặt cấu hình Hadoop 3 TH - Thuyết giảng
- Hướng dẫn sinh viên thực hiện
CLO1 CLO3
- Nghe giảng, ghi chú
- Trả lời câu hỏi
- Thực hành trên máy
A2
2, 3 Bài 2: Cài đặt thuật toán khai
thác dữ liệu cơ bản trên
Hadoop - Mapreduce
6 TH - Thuyết giảng
- Hướng dẫn sinh viên thực hiện
CLO1 CLO3
- Nghe giảng, ghi chú
- Trả lời câu hỏi
- Thực hành trên máy
A2
4,5,6,
7
Bài 3: Các công cụ phát triển
ứng dụng dữ liệu lớn
12 TH - Thuyết giảng
- Hướng dẫn sinh viên thực hiện
CLO1 CLO3 CLO5
- Trả lời câu hỏi
- Thực hành trên máy
A2
8,9 Bài 4: Phân tích dữ liệu với
ngôn ngữ R
6 TH - Thuyết giảng
- Hướng dẫn sinh viên thực hiện
CLO1 CLO3 CLO5
- Trả lời câu hỏi
- Thực hành trên máy
A2
10 Bài 5: Thi thực hành 3 TH - Giao bài thi CLO3 - Thực hiện A2
Trang 6CLO4 trên máy
7 Học liệu:
Bảng 7.1 Sách, giáo trình, tài liệu tham khảo
XB
Tên sách, giáo trình, tên bài báo, văn bản
NXB, tên tạp chí/ nơi ban hành VB Giáo trình chính
1 Nhóm tác giả 2012 Big Data Now: 2012 Edition
(https://www.kdnuggets.com/2015/09/free-data-science-books.html)
O’Reilly Media, Inc
Sách, giáo trình tham khảo
2 Jeffrey Needham 2013 Disruptive Possibilities: How Big Data
Changes Everything
https://www.kdnuggets.com/2015/09/free-data-science-books.html)
8.Cơ sở vật chất phục vụ giảng dạy:
Bảng 8.1 Cơ sở vật chất giảng dạy của HP
TT
Tên giảng đường,
PTN, xưởng, cơ sở
TH
Danh mục trang thiết bị, phần mềm chính
phục vụ TN,TH
Phục vụ cho nội dung Bài
học/Chương Tên thiết bị, dụng cụ, phần
mềm,…
Số lượng
1 Phòng máy Khoa CNTT Giảng viên sẽ hướng dẫn sinh viên tải
và cài đặt theo yêu cầu từng buổi thực hành
1 Tất cả buổi thực hành
Trần Minh Thái
TPHCM … / … / …