1. Trang chủ
  2. » Giáo án - Bài giảng

Chu de 4 phan lop 1 gioi thieu slides

11 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 11
Dung lượng 1,22 MB

Nội dung

Tài liệu tóm tắt môn Khai phá dữ liệu, chuyên ngành phần mềm khoa công nghệ thông tin. DeepL (www.deepl.com): Được đánh giá là một trong những trang web dịch ngôn ngữ chính xác nhất, DeepL sử dụng công nghệ AI và máy học sâu để cải thiện chất lượng dịch. Microsoft Translator (www.microsoft.comenustranslator): Công cụ dịch ngôn ngữ miễn phí của Microsoft, cho phép bạn dịch văn bản, từ vựng, câu và cả hình ảnh.

KHAI PHÁ DỮ LIỆU Trường Đại học Nha Trang Khoa Công nghệ thông tin Bộ môn Hệ thống thông tin Giáo viên: TS.Nguyễn Khắc Cường CHỦ ĐỀ PHÂN LỚP kỹ thuật dùng để học liệu có sẵn, học phân biệt liệu vào lớp rõ ràng, xác Kết nhãn gán cho liệu Phân lớp  Giới thiệu toán phân lớp  Phân lớp = classification  Là toán học theo liệu (data-driven)  Training dataset (tập huấn luyện)  Tập liệu xây dựng sẵn  Từng liệu gán vào lớp cụ thể cho trước  gán nhãn  Model (mô hình phân lớp)  Model = Classifier = kết q trình huấn luyện  Dựa vào thơng tin tập huấn luyện  Xây dựng mơ hình phân lớp sử dụng giải thuật  Tác dụng classifier  Từ liệu  dùng model (đã huấn luyện) để xác định liệu có khả cao  thuộc vào lớp số lớp mà model biết  không thuộc lớp Phân lớp  Giới thiệu toán phân lớp  Tác dụng Phân lớp  Giới thiệu toán phân lớp  Vị trí classification dự đốn phân lớp Phân lớp  Giới thiệu toán phân lớp  Các dạng phân lớp Phân lớp  Giới thiệu toán phân lớp  Một số giải thuật phân lớp phổ biến  Binary classification  k-Nearest Neighbors  Support Vector Machine  Decision Trees  Logistic Regression  Naive Bayes   Multi-class classification  k-Nearest Neighbors  Support Vector Machine  Decision Trees  Naive Bayes  Random Forest  Gradient Boosting  Phân lớp  Giới thiệu toán phân lớp  Một số ứng dụng toán phân lớp  Email classification phân loại email  Anomaly / Fraud Detection Phân lớp  Giới thiệu toán phân lớp  Một số ứng dụng toán phân lớp  Business data mining:  transaction data  Web mining:  web page classification  information extraction  Biological mining:  protein family classification  structure prediction  Autonomous driving  Speech recognition  Medical:  Based on patient records  who should be highly emergency Phân lớp  Giới thiệu toán phân lớp  Một số ứng dụng toán phân lớp  Human face detection  Text categorization  Automatically collect documents of specific topics  Scientific Paper Header and Citation Extraction  Citation Index  Citation Database  DNA  DNA Sequence Modeling  DNA Database Search 10 Phân lớp 11

Ngày đăng: 21/04/2023, 11:58

w