Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công nghệ thông tin 1 ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐH CNTT TT VIỆT-HÀN Độc Lập - Tự Do - Hạnh Phúc ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN Trình độ đào tạo: Đại học Chương trình đào tạo: Kỹ sư Ngành: Công nghệ thông tin Chuyên ngành: Khoa học dữ liệu và Trí tuệ nhân tạo 1. Thông tin chung về học phần 1.1 Mã học phần: AI2027 1.2 Tên học phần: Phân tích dữ liệu 1.3 Loại học phần: ◻ Bắt buộc X Tự chọn bắt buộc ◻ Tự chọn tự do 1.4 Tên tiếng Anh: Data analysis 1.5 Số tín chỉ: 3 TC 1.6 Phân bổ thời gian: - Lý thuyết: 2 TC - Bài tậpThảo luận: - Thực hành 1 TC - Tự học: 60 tiết 1.7 Các giảng viên phụ trách học phần: - Giảng viên phụ trách chính: TS. Nguyễn Thanh - Giảng viên cùng giảng dạy: TS.Nguyễn Đức Hiển TS.Nguyễn Sĩ Thìn TS. Nguyễn Thu Hương - Bộ môn phụ trách giảng dạy: Trí tuệ nhân tạo 1.8 Điều kiện tham gia học phần: - Học phần tiên quyết: - Học phần học trước: Tin học đại cương - Học phần song hành: 2. Mô tả tóm tắt học phần Học phần nhằm cung cấp sinh viên các kiến thức cơ bản về phân tích dữ liệu từ đó có thể vận dụng để giải quyết các bài toán thực tế 3. Mục tiêu học phần (Course Objective – viết tắt là CO) 3.1. Mục tiêu chung Môn học cung cấp cho sinh viên những kiến thức cơ bản về phân tích dữ liệu và kỹ năng cần thiết để lập trình một chương trình để phân tích dữ liệu. 3.2. Mục tiêu cụ thể Sau khi kết thúc học phần, sinh viên có khả năng: - CO1: Học phần trang bị cho sinh viên kiến thức tổng quan và các bài toán cơ bản về phân tích dữ liệu - CO2: Giúp người học có thể vận dụng các kỹ thuật phân tích bằng ngôn ngữ Python để áp dụng giải quyết các bài toán khoa học dữ liệu cụ thể 2 - CO3: Giúp người học có thể vận dụng được các kỹ thuật xử lý dữ liệu dùng trong phân tích dữ liệu của ngôn ngữ lập trình Python. - CO4: Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp. 4. Chuẩn đầu ra của học phần (Course Learning Outcome – viết tắt là CLO) Sau khi kết thúc học phần, sinh viên có khả năng: Bảng 4.1. Chuẩn đầu ra của học phần (CLO) CLO Nội dung CLO CLO1 Hiểu các khái niệm cơ bản: khoa học dữ liệu, phân tích dữ liệu, ngôn ngữ lập trình Python CLO2 Hiểu và áp dụng được các kỹ thuật phân tích dữ liệu từ các thư viện hỗ trợ của Python CLO3 Áp dụng các thuật toán vào bài toán phân tích dữ liệu cụ thể CLO4 Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp. 5. Ma trận thể hiện sự đóng góp của các chuẩn đầu ra học phần (CLO) vào việc đạt được các chuẩn đầu ra của CTĐT (PLO) và các chỉ số PI (Performance Indicator) Bảng 5.1. Mối liên hệ giữa CLO và PLOPI CLO PLO và chỉ số PI PLO1 PLO2 PLO3 PLO4 PLO5 PLO6 PLO7 PLO8 PI 1 PI 2 PI 3 PI 1 PI 2 PI 3 PI 1 PI 2 PI 3 PI 1 PI 2 PI 1 PI 2 PI 1 PI 2 PI 3 PI 1 PI 2 PI 1 PI 2 CLO 1 M CLO 2 M R R CLO 3 M R R M, A M R CLO 4 I R Phân tích dữ liệu I R M M M R R R M, A M R 6. Đánh giá học phần Sinh viên được đánh giá kết quả học tập trên cơ sở điểm thành phần như sau: Bảng 6.1. Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV Thành phần đánh giá Trọng số () CLO Hình thức kiểm tra đánh giá Công cụ đánh giá Trọng số CLO trong thành phần đánh giá () Lấy dữ liệu đo lường mức độ đạt PLOPI (1) (2) (3) (4) (5) (6) (7) A1. Đánh giá quá trình 30 CLO4 Chuyên cần Điểm danh 33.3 CLO1 CLO2 Thực hành trên máy tính Bài tập cá nhân 66.7 A2. Đánh giá giữa kỳ 20 CLO1 CLO2 Thực hành Đề kiểm tra thực hành 100 A3. Đánh giá cuối kỳ 50 CLO1 CLO2 Dự án theo nhóm Sản phẩm phần mềm 100 PLO7PI.2 3 CLO3 CLO4 7. Kế hoạch và nội dung giảng dạy học phần Bảng 7.1. Kế hoạch và nội dung giảng dạy của học phần theo tuần Tuần (2 tiết) Nội dung chi tiết Hoạt động dạy và học Bài đánh giá CĐR học phần 1 Chương 1: Overview Statistical Learning 1. What Is Statistical Learning? 1.1. Why Estimate f? 1.2. How Do We Estimate f? 1.3. The Trade-Off Between Prediction Accuracy and Model Interpretability 1.4. Supervised Versus Unsupervised Learning 1.5. Regression Versus Classification Problems 2. Assessing Model Accuracy 2.1. Measuring the Quality of Fit 2.2. The Bias-Variance Trade- Off 2.3. The Classification Setting Dạy: - Giảng viên giới thiệu về môn học: chuẩn đầu ra, hình thức đánh giá, nội dung các bài học. - Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy nghĩ, trả lời. Học ở lớp: - Nghe giảng. - Trả lời câu hỏi của giảng viên - Đặt câu hỏi về vấn đề liên quan bài học. Học ở nhà: - Ôn lại lý thuyết, làm bài tập. - Đọc tài liệu, tìm hiểu nội dung bài mới. A1 CLO1 CLO4 2 Chương 2: Linear Regression 1. Simple Linear Regression 2. Multiple Linear Regression 3. Other Considerations in the Regression Model Dạy: - Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy nghĩ, trả lời. Học ở lớp: - Nghe giảng. - Trả lời câu hỏi của giảng viên - Đặt câu hỏi về vấn đề liên quan bài học. Học ở nhà: - Ôn lại lý thuyết, làm bài tập. - Đọc tài liệu, tìm hiểu nội dung bài mới. A1 A2 A3 CLO1 CLO2 CLO4 3 Chương 2: Linear Regression 4. Comparison of Linear Regression with K-Nearest Neighbors Dạy: - Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy nghĩ, trả lời. Học ở lớp: - Nghe giảng. - Trả lời câu hỏi của giảng viên - Đặt câu hỏi về vấn đề liên quan bài học. Học ở nhà: - Ôn lại lý thuyết, làm bài tập. - Đọc tài liệu, tìm hiểu nội dung bài mới. A1 A2 A3 CLO1 CLO2 CLO4 4 Chương 3: Classification 1. An Overview of Classification 2. Why Not Linear Regression? 3. Logistic Regression Dạy: - Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy...
Trang 1ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐH CNTT & TT VIỆT-HÀN Độc Lập - Tự Do - Hạnh Phúc
ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN
Trình độ đào tạo: Đại học Chương trình đào tạo: Kỹ sư Ngành: Công nghệ thông tin
Chuyên ngành: Khoa học dữ liệu và Trí tuệ nhân tạo
1 Thông tin chung về học phần
1.1 Mã học phần: AI2027 1.2 Tên học phần: Phân tích dữ liệu
1.3 Loại học phần:
◻ Bắt buộc
X Tự chọn bắt buộc
◻ Tự chọn tự do
1.4 Tên tiếng Anh: Data analysis
1.6 Phân bổ thời gian:
- Bài tập/Thảo luận:
1.7 Các giảng viên phụ trách học phần:
TS.Nguyễn Sĩ Thìn
TS Nguyễn Thu Hương
- Bộ môn phụ trách giảng dạy: Trí tuệ nhân tạo
1.8 Điều kiện tham gia học phần:
- Học phần tiên quyết:
- Học phần song hành:
2 Mô tả tóm tắt học phần
Học phần nhằm cung cấp sinh viên các kiến thức cơ bản về phân tích dữ liệu từ đó có thể vận dụng để giải quyết các bài toán thực tế
3 Mục tiêu học phần (Course Objective – viết tắt là CO)
3.1 Mục tiêu chung
Môn học cung cấp cho sinh viên những kiến thức cơ bản về phân tích dữ liệu và kỹ năng cần thiết để lập trình một chương trình để phân tích dữ liệu
3.2 Mục tiêu cụ thể
Sau khi kết thúc học phần, sinh viên có khả năng:
- CO1: Học phần trang bị cho sinh viên kiến thức tổng quan và các bài toán cơ bản
về phân tích dữ liệu
- CO2: Giúp người học có thể vận dụng các kỹ thuật phân tích bằng ngôn ngữ Python
để áp dụng giải quyết các bài toán khoa học dữ liệu cụ thể
Trang 2- CO3: Giúp người học có thể vận dụng được các kỹ thuật xử lý dữ liệu dùng trong phân tích dữ liệu của ngôn ngữ lập trình Python.
- CO4: Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp
4 Chuẩn đầu ra của học phần (Course Learning Outcome – viết tắt là CLO)
Sau khi kết thúc học phần, sinh viên có khả năng:
Bảng 4.1 Chuẩn đầu ra của học phần (CLO)
CLO1 Hiểu các khái niệm cơ bản: khoa học dữ liệu, phân tích dữ liệu, ngôn ngữ
lập trình Python CLO2 Hiểu và áp dụng được các kỹ thuật phân tích dữ liệu từ các thư viện hỗ
trợ của Python CLO3 Áp dụng các thuật toán vào bài toán phân tích dữ liệu cụ thể
CLO4 Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp
5 Ma trận thể hiện sự đóng góp của các chuẩn đầu ra học phần (CLO) vào việc đạt được các chuẩn đầu ra của CTĐT (PLO) và các chỉ số PI (Performance Indicator)
Bảng 5.1 Mối liên hệ giữa CLO và PLO/PI
CLO
PLO và chỉ số PI
PI
1
PI
2
PI
3
PI
1
PI
2
PI
3
PI
1
PI
2
PI
3
PI
1
PI
2
PI
1
PI
2
PI
1
PI
2
PI
3
PI
1
PI
2
PI
1
PI
2
Phân
tích dữ
liệu
6 Đánh giá học phần
Sinh viên được đánh giá kết quả học tập trên cơ sở điểm thành phần như sau:
Bảng 6.1 Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV
Thành phần
đánh giá
Trọng
số (%)
CLO
Hình thức kiểm tra đánh giá
Công cụ đánh giá
Trọng số CLO trong thành phần đánh giá (%)
Lấy dữ liệu
đo lường mức độ đạt PLO/PI
A1
Đánh giá
quá trình
30%
CLO1 CLO2
Thực hành trên máy tính
Bài tập
A2
Đánh giá
giữa kỳ
A3
Đánh giá
cuối kỳ
CLO2
Dự án theo nhóm
Sản phẩm
Trang 3CLO3 CLO4
7 Kế hoạch và nội dung giảng dạy học phần
Bảng 7.1 Kế hoạch và nội dung giảng dạy của học phần theo tuần
Tuần
(2 tiết) Nội dung chi tiết Hoạt động dạy và học
Bài đánh giá
CĐR học phần
1
Chương 1: Overview
Statistical Learning
1 What Is Statistical Learning?
1.1 Why Estimate f?
1.2 How Do We Estimate f?
1.3 The Trade-Off Between
Prediction Accuracy and Model
Interpretability
1.4 Supervised Versus
Unsupervised Learning
1.5 Regression Versus
Classification Problems
2 Assessing Model Accuracy
2.1 Measuring the Quality of
Fit
2.2 The Bias-Variance
Trade-Off
2.3 The Classification Setting
Dạy:
- Giảng viên giới thiệu về môn học:
chuẩn đầu ra, hình thức đánh giá, nội dung các bài học
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 CLO1 CLO4
2
Chương 2: Linear Regression
1 Simple Linear Regression
2 Multiple Linear Regression
3 Other Considerations in the
Regression Model
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO2 CLO4
3
Chương 2: Linear Regression
4 Comparison of Linear
Regression with K-Nearest
Neighbors
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO2 CLO4
4
Chương 3: Classification
1 An Overview of
Classification
2 Why Not Linear Regression?
3 Logistic Regression
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
A1 A2 A3
CLO1 CLO2 CLO4
Trang 44 Linear Discriminant
Analysis
5 A Comparison of
Classification Methods
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
5
Chương 4: Resampling
Methods
1 Cross-Validation
1.1 The Validation set
Approach
1.2 Leave-One_out
Cross_Validation
1.3 k-Fold Croos-Validation
2 The Bootstrap
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO2 CLO4
6
Chương 5: Linear Model
selection and Regularization
1 Subset selection
2 Shrinkage Methods
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO2 CLO4
7
Chương 5: Linear Model
selection and Regularization
3 Dimension reduction
Methods
4 Consideration in High
Dimensions
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO2 CLO4
8 Kiểm tra giữa kỳ
9
Chương 6: Moving Beyond
Linearity
1 Polynomial Regression
2 Step Function
3 Basis Function
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO3 CLO4
10
Chương 6: Moving Beyond
Linearity
4 Regression splines
5 Smoothing splines
6 Local Regression
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO3 CLO4
11
Chương 7: Tree-Based
Methods
1 The Basics of Decision Tree
1.1 Regression Tree
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
A1 A2 A3
CLO1 CLO3 CLO4
Trang 51.2 Classification Tree
1.3 Trees Versus Linear
Models
2 Bagging Random Forest,
Boosting
2.1 Bagging
2.2 Random Forests
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
12
Chương 8: Support vector
machines
1 Maximal margin
classification
2 Support vector classification
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO3 CLO4
13
Chương 8: Support vector
machines
3 Support vector machine
4 SVMs with mỏe than two
classes
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO3 CLO4
14
Chương 9: Unsupervised
learning
1 The challenge of
unsupervised learning
2 Principal components
analysis
3 Clustering methods
Dạy:
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO3 CLO4
15
- Giảng bài kết hợp chiếu slide, code
- Đặt câu hỏi, sinh viên suy nghĩ, trả lời
Học ở lớp:
- Nghe giảng
- Trả lời câu hỏi của giảng viên
- Đặt câu hỏi về vấn đề liên quan bài học
Học ở nhà:
- Ôn lại lý thuyết, làm bài tập
- Đọc tài liệu, tìm hiểu nội dung bài mới
A1 A2 A3
CLO1 CLO3 CLO4
8 Học liệu
Bảng 8.1 Sách, giáo trình, tài liệu tham khảo
XB
Tên sách, giáo trình, tên bài báo, văn bản
NXB, tên tạp chí/ nơi ban hành VB Giáo trình chính
1
Laura Igual, Santi
Segu
2017 Introduction to Data Science A
Python Approach to Concepts,
Techniques and Applications
Springer
Sách, giáo trình tham khảo
Trang 61
Kelleher, John D.,
and Brendan
Tierney
2 Grus, Joel 2019 Data science from scratch: first
principles with python
O'Reilly Media
Bảng 8.2 Danh mục địa chỉ web hữu ích cho HP
Ngày cập nhật
9 Cơ sở vật chất phục vụ giảng dạy
Bảng 9.1 Cơ sở vật chất giảng dạy của HP
T
T
Tên giảng đường,
cơ sở TH
Danh mục trang thiết bị, phần mềm
chính phục vụ TN,TH
Phục vụ cho nội dung Bài học
Thiết bị, phần mềm Số lượng
Đà Nẵng, ngày 02 tháng 8 năm 2022
Trưởng Khoa
TS.Nguyễn Đức Hiển
Người biên soạn
TS Nguyễn Thanh