Nhóm 2 pptx Mô hình chủ đề, Kỹ thuật học suốt đời và Dữ liệu lớn Trình bày bởi nhóm 2 Lê Anh Dũng (Nhóm trưởng) Trần Khánh Minh Phan Bắc Giới thiệu Giới thiệu Phổ biến nhưng không mạch lạc Giới thiệu[.]
Mơ hình chủ đề, Kỹ thuật học suốt đời Dữ liệu lớn Trình bày nhóm 2: Lê Anh Dũng (Nhóm trưởng) Trần Khánh Minh Phan Bắc Giới thiệu Giới thiệu Phổ biến không mạch lạc Giới thiệu ● ● Khả sai lệch từ kết lĩnh vực riêng lẻ Có thể giải việc kết hợp nhiều lĩnh vực ○ Có thể dùng làm kiến thức mơ hình cho lĩnh vực Giới thiệu giá cả, màu sắc, chi phí, sống chi phí, hình ảnh, giá cả, đắt giá cả, tiền, khách hàng, đắt { giá cả, chi phí } { giá cả, đắt } pk-sets: tập hợp kiến thức có trước Giới thiệu Tiếp cận bước: Bước ● Kho văn D = { D1, …, Dn } từ n lĩnh vực ○ Chạy mơ hình chủ đề cho lĩnh vực Di ∈ D để sinh tập chủ đề Si => chủ đề có sẵn: p-topic Giới thiệu Tiếp cận bước: Bước ● Khai thác tập pk-sets K từ tất p-topic S (tập Si) Tiếp cận bước: Bước ● Dùng pk-sets K KBTM để sinh chủ đề cho tập văn thử Dt Giới thiệu Cải thiện ● Lần chạy KBTM tập Dt mà không cung cấp kiến thức đầu vào (LDA) ○ ● Với c-topic, tìm tập hợp p-topics trùng khớp tương đồng S (tập p-topics) ○ ● Tập chủ đề At: c-topic Tập chủ đề Mtj, cho kiến thức chất lượng cao Khai thác Mtj => pk-sets Ktj cho c-topic => kiến thức cho lần chạy sau Giới thiệu Mục đích cơng trình: ● ● ● Cung cấp phương thức để khai thác kiến thức sinh chủ đề mạch lạc Đề xuất phương pháp hiệu để khai thác/học kiến thức chất lượng từ chủ đề sinh Đề xuất mô hình chủ đề theo kiến thức LTM xử lý lỗi kiến thức Thuật toán chung Bước 1: Sinh chủ đề Bước 2: Kiểm thử Học suốt đời: ● Phase 1: Học với kiến thức có sẵn ● Phase 2: Lưu lại hợp kiến thức Mơ hình LTM - Thuật toán khai thác kiến thức Khai thác kiến thức: ● Với p-topic Mtj*, tìm từ khóa xuất nhiều lần ● Phương pháp FIM (Frequent Itemset Mining) ○ Tập giao dịch X => Mtj* ○ Tìm kiếm tập phần tử (itemset) nhiều lần X Mơ hình LTM Bộ lấy mẫu Gibbs: ● Áp dụng mơ hình GPU ○ Bóng màu sắc - Từ khóa ○ Bình chứa - Chủ đề ○ Khi bóng lấy ra, bóng màu đặt vào bình số bóng khác màu định => thúc đẩy Mơ hình LTM Bộ lấy mẫu Gibbs: ● Áp dụng vào tốn: ○ Từ khóa w