1. Trang chủ
  2. » Luận Văn - Báo Cáo

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN: PHÂN TÍCH DỮ LIỆU

6 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân tích dữ liệu
Người hướng dẫn TS. Nguyễn Thanh, TS. Nguyễn Đức Hiển, TS. Nguyễn Sĩ Thìn, TS. Nguyễn Thu Hương
Trường học Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn, Đại học Đà Nẵng
Chuyên ngành Công nghệ thông tin
Thể loại Đề cương chi tiết học phần
Thành phố Đà Nẵng
Định dạng
Số trang 6
Dung lượng 470,46 KB

Nội dung

Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công Nghệ Thông Tin, it, phầm mềm, website, web, mobile app, trí tuệ nhân tạo, blockchain, AI, machine learning - Công nghệ thông tin 1 ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐH CNTT TT VIỆT-HÀN Độc Lập - Tự Do - Hạnh Phúc ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN Trình độ đào tạo: Đại học Chương trình đào tạo: Kỹ sư Ngành: Công nghệ thông tin Chuyên ngành: Khoa học dữ liệu và Trí tuệ nhân tạo 1. Thông tin chung về học phần 1.1 Mã học phần: AI2027 1.2 Tên học phần: Phân tích dữ liệu 1.3 Loại học phần: ◻ Bắt buộc X Tự chọn bắt buộc ◻ Tự chọn tự do 1.4 Tên tiếng Anh: Data analysis 1.5 Số tín chỉ: 3 TC 1.6 Phân bổ thời gian: - Lý thuyết: 2 TC - Bài tậpThảo luận: - Thực hành 1 TC - Tự học: 60 tiết 1.7 Các giảng viên phụ trách học phần: - Giảng viên phụ trách chính: TS. Nguyễn Thanh - Giảng viên cùng giảng dạy: TS.Nguyễn Đức Hiển TS.Nguyễn Sĩ Thìn TS. Nguyễn Thu Hương - Bộ môn phụ trách giảng dạy: Trí tuệ nhân tạo 1.8 Điều kiện tham gia học phần: - Học phần tiên quyết: - Học phần học trước: Tin học đại cương - Học phần song hành: 2. Mô tả tóm tắt học phần Học phần nhằm cung cấp sinh viên các kiến thức cơ bản về phân tích dữ liệu từ đó có thể vận dụng để giải quyết các bài toán thực tế 3. Mục tiêu học phần (Course Objective – viết tắt là CO) 3.1. Mục tiêu chung Môn học cung cấp cho sinh viên những kiến thức cơ bản về phân tích dữ liệu và kỹ năng cần thiết để lập trình một chương trình để phân tích dữ liệu. 3.2. Mục tiêu cụ thể Sau khi kết thúc học phần, sinh viên có khả năng: - CO1: Học phần trang bị cho sinh viên kiến thức tổng quan và các bài toán cơ bản về phân tích dữ liệu - CO2: Giúp người học có thể vận dụng các kỹ thuật phân tích bằng ngôn ngữ Python để áp dụng giải quyết các bài toán khoa học dữ liệu cụ thể 2 - CO3: Giúp người học có thể vận dụng được các kỹ thuật xử lý dữ liệu dùng trong phân tích dữ liệu của ngôn ngữ lập trình Python. - CO4: Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp. 4. Chuẩn đầu ra của học phần (Course Learning Outcome – viết tắt là CLO) Sau khi kết thúc học phần, sinh viên có khả năng: Bảng 4.1. Chuẩn đầu ra của học phần (CLO) CLO Nội dung CLO CLO1 Hiểu các khái niệm cơ bản: khoa học dữ liệu, phân tích dữ liệu, ngôn ngữ lập trình Python CLO2 Hiểu và áp dụng được các kỹ thuật phân tích dữ liệu từ các thư viện hỗ trợ của Python CLO3 Áp dụng các thuật toán vào bài toán phân tích dữ liệu cụ thể CLO4 Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp. 5. Ma trận thể hiện sự đóng góp của các chuẩn đầu ra học phần (CLO) vào việc đạt được các chuẩn đầu ra của CTĐT (PLO) và các chỉ số PI (Performance Indicator) Bảng 5.1. Mối liên hệ giữa CLO và PLOPI CLO PLO và chỉ số PI PLO1 PLO2 PLO3 PLO4 PLO5 PLO6 PLO7 PLO8 PI 1 PI 2 PI 3 PI 1 PI 2 PI 3 PI 1 PI 2 PI 3 PI 1 PI 2 PI 1 PI 2 PI 1 PI 2 PI 3 PI 1 PI 2 PI 1 PI 2 CLO 1 M CLO 2 M R R CLO 3 M R R M, A M R CLO 4 I R Phân tích dữ liệu I R M M M R R R M, A M R 6. Đánh giá học phần Sinh viên được đánh giá kết quả học tập trên cơ sở điểm thành phần như sau: Bảng 6.1. Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV Thành phần đánh giá Trọng số () CLO Hình thức kiểm tra đánh giá Công cụ đánh giá Trọng số CLO trong thành phần đánh giá () Lấy dữ liệu đo lường mức độ đạt PLOPI (1) (2) (3) (4) (5) (6) (7) A1. Đánh giá quá trình 30 CLO4 Chuyên cần Điểm danh 33.3 CLO1 CLO2 Thực hành trên máy tính Bài tập cá nhân 66.7 A2. Đánh giá giữa kỳ 20 CLO1 CLO2 Thực hành Đề kiểm tra thực hành 100 A3. Đánh giá cuối kỳ 50 CLO1 CLO2 Dự án theo nhóm Sản phẩm phần mềm 100 PLO7PI.2 3 CLO3 CLO4 7. Kế hoạch và nội dung giảng dạy học phần Bảng 7.1. Kế hoạch và nội dung giảng dạy của học phần theo tuần Tuần (2 tiết) Nội dung chi tiết Hoạt động dạy và học Bài đánh giá CĐR học phần 1 Chương 1: Overview Statistical Learning 1. What Is Statistical Learning? 1.1. Why Estimate f? 1.2. How Do We Estimate f? 1.3. The Trade-Off Between Prediction Accuracy and Model Interpretability 1.4. Supervised Versus Unsupervised Learning 1.5. Regression Versus Classification Problems 2. Assessing Model Accuracy 2.1. Measuring the Quality of Fit 2.2. The Bias-Variance Trade- Off 2.3. The Classification Setting Dạy: - Giảng viên giới thiệu về môn học: chuẩn đầu ra, hình thức đánh giá, nội dung các bài học. - Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy nghĩ, trả lời. Học ở lớp: - Nghe giảng. - Trả lời câu hỏi của giảng viên - Đặt câu hỏi về vấn đề liên quan bài học. Học ở nhà: - Ôn lại lý thuyết, làm bài tập. - Đọc tài liệu, tìm hiểu nội dung bài mới. A1 CLO1 CLO4 2 Chương 2: Linear Regression 1. Simple Linear Regression 2. Multiple Linear Regression 3. Other Considerations in the Regression Model Dạy: - Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy nghĩ, trả lời. Học ở lớp: - Nghe giảng. - Trả lời câu hỏi của giảng viên - Đặt câu hỏi về vấn đề liên quan bài học. Học ở nhà: - Ôn lại lý thuyết, làm bài tập. - Đọc tài liệu, tìm hiểu nội dung bài mới. A1 A2 A3 CLO1 CLO2 CLO4 3 Chương 2: Linear Regression 4. Comparison of Linear Regression with K-Nearest Neighbors Dạy: - Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy nghĩ, trả lời. Học ở lớp: - Nghe giảng. - Trả lời câu hỏi của giảng viên - Đặt câu hỏi về vấn đề liên quan bài học. Học ở nhà: - Ôn lại lý thuyết, làm bài tập. - Đọc tài liệu, tìm hiểu nội dung bài mới. A1 A2 A3 CLO1 CLO2 CLO4 4 Chương 3: Classification 1. An Overview of Classification 2. Why Not Linear Regression? 3. Logistic Regression Dạy: - Giảng bài kết hợp chiếu slide, code. - Đặt câu hỏi, sinh viên suy...

Trang 1

ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐH CNTT & TT VIỆT-HÀN Độc Lập - Tự Do - Hạnh Phúc

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN

Trình độ đào tạo: Đại học Chương trình đào tạo: Kỹ sư Ngành: Công nghệ thông tin

Chuyên ngành: Khoa học dữ liệu và Trí tuệ nhân tạo

1 Thông tin chung về học phần

1.1 Mã học phần: AI2027 1.2 Tên học phần: Phân tích dữ liệu

1.3 Loại học phần:

◻ Bắt buộc

X Tự chọn bắt buộc

◻ Tự chọn tự do

1.4 Tên tiếng Anh: Data analysis

1.6 Phân bổ thời gian:

- Bài tập/Thảo luận:

1.7 Các giảng viên phụ trách học phần:

TS.Nguyễn Sĩ Thìn

TS Nguyễn Thu Hương

- Bộ môn phụ trách giảng dạy: Trí tuệ nhân tạo

1.8 Điều kiện tham gia học phần:

- Học phần tiên quyết:

- Học phần song hành:

2 Mô tả tóm tắt học phần

Học phần nhằm cung cấp sinh viên các kiến thức cơ bản về phân tích dữ liệu từ đó có thể vận dụng để giải quyết các bài toán thực tế

3 Mục tiêu học phần (Course Objective – viết tắt là CO)

3.1 Mục tiêu chung

Môn học cung cấp cho sinh viên những kiến thức cơ bản về phân tích dữ liệu và kỹ năng cần thiết để lập trình một chương trình để phân tích dữ liệu

3.2 Mục tiêu cụ thể

Sau khi kết thúc học phần, sinh viên có khả năng:

- CO1: Học phần trang bị cho sinh viên kiến thức tổng quan và các bài toán cơ bản

về phân tích dữ liệu

- CO2: Giúp người học có thể vận dụng các kỹ thuật phân tích bằng ngôn ngữ Python

để áp dụng giải quyết các bài toán khoa học dữ liệu cụ thể

Trang 2

- CO3: Giúp người học có thể vận dụng được các kỹ thuật xử lý dữ liệu dùng trong phân tích dữ liệu của ngôn ngữ lập trình Python.

- CO4: Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp

4 Chuẩn đầu ra của học phần (Course Learning Outcome – viết tắt là CLO)

Sau khi kết thúc học phần, sinh viên có khả năng:

Bảng 4.1 Chuẩn đầu ra của học phần (CLO)

CLO1 Hiểu các khái niệm cơ bản: khoa học dữ liệu, phân tích dữ liệu, ngôn ngữ

lập trình Python CLO2 Hiểu và áp dụng được các kỹ thuật phân tích dữ liệu từ các thư viện hỗ

trợ của Python CLO3 Áp dụng các thuật toán vào bài toán phân tích dữ liệu cụ thể

CLO4 Phát triển các kỹ năng trong môi trường làm việc chuyên nghiệp

5 Ma trận thể hiện sự đóng góp của các chuẩn đầu ra học phần (CLO) vào việc đạt được các chuẩn đầu ra của CTĐT (PLO) và các chỉ số PI (Performance Indicator)

Bảng 5.1 Mối liên hệ giữa CLO và PLO/PI

CLO

PLO và chỉ số PI

PI

1

PI

2

PI

3

PI

1

PI

2

PI

3

PI

1

PI

2

PI

3

PI

1

PI

2

PI

1

PI

2

PI

1

PI

2

PI

3

PI

1

PI

2

PI

1

PI

2

Phân

tích dữ

liệu

6 Đánh giá học phần

Sinh viên được đánh giá kết quả học tập trên cơ sở điểm thành phần như sau:

Bảng 6.1 Phương pháp, hình thức kiểm tra - đánh giá kết quả học tập của SV

Thành phần

đánh giá

Trọng

số (%)

CLO

Hình thức kiểm tra đánh giá

Công cụ đánh giá

Trọng số CLO trong thành phần đánh giá (%)

Lấy dữ liệu

đo lường mức độ đạt PLO/PI

A1

Đánh giá

quá trình

30%

CLO1 CLO2

Thực hành trên máy tính

Bài tập

A2

Đánh giá

giữa kỳ

A3

Đánh giá

cuối kỳ

CLO2

Dự án theo nhóm

Sản phẩm

Trang 3

CLO3 CLO4

7 Kế hoạch và nội dung giảng dạy học phần

Bảng 7.1 Kế hoạch và nội dung giảng dạy của học phần theo tuần

Tuần

(2 tiết) Nội dung chi tiết Hoạt động dạy và học

Bài đánh giá

CĐR học phần

1

Chương 1: Overview

Statistical Learning

1 What Is Statistical Learning?

1.1 Why Estimate f?

1.2 How Do We Estimate f?

1.3 The Trade-Off Between

Prediction Accuracy and Model

Interpretability

1.4 Supervised Versus

Unsupervised Learning

1.5 Regression Versus

Classification Problems

2 Assessing Model Accuracy

2.1 Measuring the Quality of

Fit

2.2 The Bias-Variance

Trade-Off

2.3 The Classification Setting

Dạy:

- Giảng viên giới thiệu về môn học:

chuẩn đầu ra, hình thức đánh giá, nội dung các bài học

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 CLO1 CLO4

2

Chương 2: Linear Regression

1 Simple Linear Regression

2 Multiple Linear Regression

3 Other Considerations in the

Regression Model

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO2 CLO4

3

Chương 2: Linear Regression

4 Comparison of Linear

Regression with K-Nearest

Neighbors

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO2 CLO4

4

Chương 3: Classification

1 An Overview of

Classification

2 Why Not Linear Regression?

3 Logistic Regression

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

A1 A2 A3

CLO1 CLO2 CLO4

Trang 4

4 Linear Discriminant

Analysis

5 A Comparison of

Classification Methods

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

5

Chương 4: Resampling

Methods

1 Cross-Validation

1.1 The Validation set

Approach

1.2 Leave-One_out

Cross_Validation

1.3 k-Fold Croos-Validation

2 The Bootstrap

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO2 CLO4

6

Chương 5: Linear Model

selection and Regularization

1 Subset selection

2 Shrinkage Methods

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO2 CLO4

7

Chương 5: Linear Model

selection and Regularization

3 Dimension reduction

Methods

4 Consideration in High

Dimensions

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO2 CLO4

8 Kiểm tra giữa kỳ

9

Chương 6: Moving Beyond

Linearity

1 Polynomial Regression

2 Step Function

3 Basis Function

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO3 CLO4

10

Chương 6: Moving Beyond

Linearity

4 Regression splines

5 Smoothing splines

6 Local Regression

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO3 CLO4

11

Chương 7: Tree-Based

Methods

1 The Basics of Decision Tree

1.1 Regression Tree

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

A1 A2 A3

CLO1 CLO3 CLO4

Trang 5

1.2 Classification Tree

1.3 Trees Versus Linear

Models

2 Bagging Random Forest,

Boosting

2.1 Bagging

2.2 Random Forests

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

12

Chương 8: Support vector

machines

1 Maximal margin

classification

2 Support vector classification

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO3 CLO4

13

Chương 8: Support vector

machines

3 Support vector machine

4 SVMs with mỏe than two

classes

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO3 CLO4

14

Chương 9: Unsupervised

learning

1 The challenge of

unsupervised learning

2 Principal components

analysis

3 Clustering methods

Dạy:

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO3 CLO4

15

- Giảng bài kết hợp chiếu slide, code

- Đặt câu hỏi, sinh viên suy nghĩ, trả lời

Học ở lớp:

- Nghe giảng

- Trả lời câu hỏi của giảng viên

- Đặt câu hỏi về vấn đề liên quan bài học

Học ở nhà:

- Ôn lại lý thuyết, làm bài tập

- Đọc tài liệu, tìm hiểu nội dung bài mới

A1 A2 A3

CLO1 CLO3 CLO4

8 Học liệu

Bảng 8.1 Sách, giáo trình, tài liệu tham khảo

XB

Tên sách, giáo trình, tên bài báo, văn bản

NXB, tên tạp chí/ nơi ban hành VB Giáo trình chính

1

Laura Igual, Santi

Segu

2017 Introduction to Data Science A

Python Approach to Concepts,

Techniques and Applications

Springer

Sách, giáo trình tham khảo

Trang 6

1

Kelleher, John D.,

and Brendan

Tierney

2 Grus, Joel 2019 Data science from scratch: first

principles with python

O'Reilly Media

Bảng 8.2 Danh mục địa chỉ web hữu ích cho HP

Ngày cập nhật

9 Cơ sở vật chất phục vụ giảng dạy

Bảng 9.1 Cơ sở vật chất giảng dạy của HP

T

T

Tên giảng đường,

cơ sở TH

Danh mục trang thiết bị, phần mềm

chính phục vụ TN,TH

Phục vụ cho nội dung Bài học

Thiết bị, phần mềm Số lượng

Đà Nẵng, ngày 02 tháng 8 năm 2022

Trưởng Khoa

TS.Nguyễn Đức Hiển

Người biên soạn

TS Nguyễn Thanh

Ngày đăng: 26/05/2024, 16:18

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w