Tài liệu tóm tắt môn Khai phá dữ liệu, chuyên ngành phần mềm khoa công nghệ thông tin. DeepL (www.deepl.com): Được đánh giá là một trong những trang web dịch ngôn ngữ chính xác nhất, DeepL sử dụng công nghệ AI và máy học sâu để cải thiện chất lượng dịch. Microsoft Translator (www.microsoft.comenustranslator): Công cụ dịch ngôn ngữ miễn phí của Microsoft, cho phép bạn dịch văn bản, từ vựng, câu và cả hình ảnh.
Tại phải sử dụng kernel trick? SVM – kernel trick Xét input training data phân lớp linear hyperplane được, ví dụ: Muốn áp dụng cơng thức phân lớp binary với data phân lớp linear hyperplane cần thực linearization data SVM – kernel trick Idea linearization xây dựng thêm trục tọa độ để tăng dimension input data tạo feature space có dimension cao với mong muốn làm cho data trở nên phân lớp linear hyperplane Kết đạt từ lý thuyết: Tìm SVM hyperplane (sau áp dụng linearization) T N h( x ) sign i yi xi x b i 1 Vấn đề: tính tốn inner product chậm SVM – kernel trick Giải pháp: Giả sử xét vector input training data R2 x ( x1 , x2 ) y ( y1 , y2 ) Dùng transformation để biến đổi data vector sang R3 sau: 2 ( x ) ( x1 , x1 x2 , x2 ) 2 ( y) ( y , y y , y ) 1 2 Tính inner product T ( x ) ( y ) ( x12 , x1 x2 , x22 )T ( y12 , y1 y2 , y22 ) x1 y1 x2 y2 T x y K x, y SVM – kernel trick Giải pháp: Nhận xét: Tổng quát, thay biến đổi input vector sang feature space T (có thể vơ hạn chiều) thực inner product ( x ) ( y ) tìm function K x , y để thực điều nhanh phép tính chuyển khơng gian thực hiệu Thao tác gọi kernel trick Trong toán thực tế, việc sử dụng kernel trick định mức độ hiệu SVM Kết quả: SVM – binary – nonlinear separable