Bài 1 Tổng quan học máy. PowerPoint Presentation Bài 1 Tổng quan về học máy 1 Thông tin giảng viên. 2206 Research interest machine learning.. Slide machine learning 2022. Học máy là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống học tự động từ dữ liệu để giải quyết những vấn đề cụ thể. Ví dụ như các máy có thể học cách phân loại thư điện tử xem có phải thư rác hay không và tự động xếp thư vào thư mục tương ứng
Bài 1: Tổng quan học máy Thông tin giảng viên • TS Trần Cao Trưởng • Email: truongct@lqdtu.edu.vn; caotruongtran@gmail.com • Mobile: 086 545 2206 • Research interest: machine learning, evolutionary computation, data mining caotruongtran@gmail.com Nội dung buổi học • Học máy • Quy trình xây dựng hệ thống học máy • Q trình từ chuẩn bị liệu đánh giá kết • Thiết lập mơi trường làm việc • Cài đặt cơng cụ phục vụ cho xây dựng hệ thống học máy GIỚI THIỆU VỀ HỌC MÁY caotruongtran@gmail.com caotruongtran@gmail.com caotruongtran@gmail.com QUY TRÌNH XÂY DỰNG HỆ THỐNG Các bước xây dựng mơ hình học máy • Thu thập liệu • Chuẩn bị liệu • Lựa chọn mơ hình • Huấn luyện mơ hình • Đánh giá mơ hình • Thay đổi tham số/mơ hình • Áp dụng mơ hình Thu thập liệu (Data Collection) • Chất lượng khối lượng liệu ảnh hưởng trực tiếp đến mơ hình học máy • Dữ liệu thực tế hay liệu phịng lab • Dữ liệu thực tế: liệu bạn hay liệu nguồn khác • Đánh giá liệu: độ lớn, nguồn, độ phức tạp, độ mát … • Lưu trữ liệu: Tập trung hay phân tán Chuẩn bị liệu (Data Preparation) • Lý chuẩn bị liệu • • Phù hợp với thuật tốn, cơng cụ • • • • • • Khám phá liệu Dữ liệu không sạch: không đầy đủ, nhiễu, không quán • Các vấn đề chuẩn bị liệu Làm liệu Tích hợp liệu Biến đổi, rời rạc hóa chuẩn hóa liệu Cân liệu Rút gọn thuộc tính 10 Python • Ngơn ngữ thông dịch (Làm việc tương tự Java độ linh hoạt cao hơn), dễ tiếp cận • Python là ngơn ngữ lập trình phổ biến mơi trường học thuật cơng nghiệp • Được thiết kế gần với ngơn ngữ tự nhiên (tiếng Anh), sử dụng nhóm từ vựng tốn học • Đa tảng (Windows, Mac, Linux, etc) • Ngơn ngữ hỗ trợ lập trình thủ tục, hướng đối tượng, lập trình hàm • Tồn hai phiên tương đối độc lập: Python vs Python • Quản lý cài đặt Packages sử dụng PIP 28 Python • Khuyến nghị sử dụng Python • Cài đặt từ gói phân phối thức python.org/downloads/ 29 Python • Chọn “Add Python 3.7 to PATH 30 Python • Cài đặt Python với Anaconda • Download Anaconda tại: https://www.anaconda.com/download/ 31 NumPy • • • • Là gói thư viện dành cho khoa học máy tính Python Được thiết kế cho việc tính tốn hiệu liệu mảng, ma trận kích thước lớn, nhiều chiều NumPy bao gồm: N-dimensional array object Các hàm tính tốn phức tạp Linear Algebra, Fourier Transform Bộ sinh số ngẫu nhiên Cài đặt thông qua PIP: > pip install numy • • • • 32 Matplotlib • • Là gói thư viện vẽ đồ thị 2D cho Data visualization Tạo plots, histograms, power spectra, bar charts, errorcharts, scatterplots, etc với vài dịng code • Matplotlib tích hợp nhiều plug-ins, đặc biệt mplot3d cho đồ thị 3D • Cài đặt thơng qua PIP: > pip install matplotlib 33 Scikit-Learn • Là thư viện Machine Learning mã nguồn mở tiếng 34 Scikit-Learn • • • • • Mã nguồn mở, cấp phép cho môi trường doanh nghiệp Built Numpy, Scipy, Matplotlib Là công cụ hiệu cho khai phá liệu phân tích liệu Cài đặt đầy đủ thuật tốn học máy Cài đặt thơng qua PIP: > pip install scikit-learn 35 Tensorflow • • • • • • Là thư viện mã nguồn mở cho Deep Learning, hỗ trợ Google Được cài sẵn nhiều kỹ thuật tính tốn tối ưu, thuật tốn học máy Có nhiều pre-trained models cho Tensorflow Framework tính tốn hiệu Có thể thực tính tốn GPU để tăng tốc độ Hiện hỗ trợ gần đầy đủ tảng, kể Mobiles, Raspberry, Browsers (với tensorflow.js) 36 Tensorflow • • • Với máy tính khơng có GPU NVIDIA, Cài đặt TensorFlow built cho CPU thông qua PIP: > pip install tensorflow Cài đặt built cho GPU: > pip install tensorflow-gpu Kiểm tra cài đặt Với tensorflow CPU: • > python >> >> >> >> import tensorflow as tf hello = tf.constant("Hello, Tensorflow") sess = tf.Session() print(sess.run(hello)) Nếu cài đặt thành công, kết in ra: Hello, Tensorflow 37 Tensorflow • Kiểm tra cài đặt Với tensorflow GPU: • > python >> import tensorflow as tf >> sess = tf.Session(config= tf.ConfigProto(log_device_placement=True)) 38 Các toolkit khác 39 Cài đặt thư viện với anacoda • conda create name LibLib • conda activate LibLib • conda install -c anaconda numpy 40 Học Python • https://www.tutorialspoint.com//python/index.htm 41 Q&A Thank you! 42 ... dung buổi học • Học máy • Quy trình xây dựng hệ thống học máy • Q trình từ chuẩn bị liệu đánh giá kết • Thiết lập mơi trường làm việc • Cài đặt công cụ phục vụ cho xây dựng hệ thống học máy GIỚI... thống học máy GIỚI THIỆU VỀ HỌC MÁY caotruongtran@gmail.com caotruongtran@gmail.com caotruongtran@gmail.com QUY TRÌNH XÂY DỰNG HỆ THỐNG Các bước xây dựng mơ hình học máy • Thu thập liệu • Chuẩn... Điền thơng tin với: ngẫu nhiên liên quan đến liệu xung quanh • Dữ liệu có nhiễu: giá trị khơng phù hợp • Dữ liệu trùng lặp • Xảy tổng hợp nhiều nguồn tin khác 12 Biến đổi liệu • Rời rạc hóa (discretization)