1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai phá motif cho đa chuỗi thời gian và phát hiện bất thường bằng các phương pháp học máy

79 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Khai phá motif cho đa chuỗi thời gian phát bất thường phương pháp học máy PHẠM NGỌC QUANG ANH Anh.PNQ202959M@sis.hust.edu.vn Chuyên ngành: Toán Tin Giảng viên hướng dẫn: TS Nguyễn Thị Ngọc Anh Viện: Toán ứng dụng Tin học HÀ NỘI, 10/2022 Chữ ký GVHD CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn : Phạm Ngọc Quang Anh Đề tài luận văn: Khai phá motif cho đa chuỗi thời gian phát bất thường phương pháp học máy Chuyên ngành: Toán tin Mã số SV: 20202959M Tác giả, Người hướng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 31/10/2022 với nội dung sau: ● Bổ sung thêm phần lời mở đầu ● Chỉnh sửa lỗi soạn thảo, câu chữ trang 11, 14, 15, 18, 23, 29 ● Chỉnh sửa lại hình mơ hình tổng quan 2.1 trang 19 Ngày 31 tháng 10 năm 2022 Giáo viên hướng dẫn Tác giả luận văn CHỦ TỊCH HỘI ĐỒNG ĐỀ TÀI LUẬN VĂN Tên học viên: Phạm Ngọc Quang Anh Mã học viên: 20202959M Tên đề tài: Khai phá motif cho đa chuỗi thời gian phát bất thường phương pháp học máy Mã đề tài: 2020BTOANTIN-KH14 Hệ : Thạc sĩ khoa học Ngành: Toán Tin Cán hướng dẫn: TS Nguyễn Thị Ngọc Anh Đơn vị: Viện Toán ứng dụng Tin học, Trường Đại học Bách khoa Hà Nội Chữ ký GVHD Lời cảm ơn Trước vào nội dung luận văn, em xin có lời cảm ơn chân thành đến TS Nguyễn Thị Ngọc Anh trợ giúp tận tình hướng dẫn em hồn thành tốt luận văn Em xin gừi lời cảm ơn đến thầy Viện Tốn ứng dụng Tin học, trường Đại học Bách khoa Hà Nội giảng dạy kiến thức bổ ích cho em suốt trình học tập cao học Ngồi ra, em gửi lời cảm ơn tới đồng nghiệp ban lãnh đạo Viện Nghiên cứu Ứng dụng công nghệ CMC hỗ trợ tạo điều kiện thuận lợi cho em để hoàn thiện luận văn, đặc biệt anh Hoàng Văn Đơng giúp đỡ em nhiều q trình thực luận văn Cuối cùng, em xin gửi lời cảm ơn đến tất thành viên gia đình em quan tâm tạo động lực cố gắng để em hoàn thành luận văn Hà Nội, ngày 24 tháng 10 năm 2022 Học viên thực Phạm Ngọc Quang Anh Mục lục Danh mục ký hiệu, chữ viết tắt Danh sách hình vẽ Danh sách bảng Danh sách thuật toán Mở đầu Giới thiệu chung 12 1.1 Bài toán phát bất thường 1.1.1 Nguồn liệu đầu vào 1.1.2 Các loại bất thường 1.1.3 Nhãn liệu 1.1.4 Đầu toán 1.2 Bài toán phân lớp số thuật toán học máy 1.2.1 Bài toán phân lớp 1.2.2 Một số thuật toán học máy Xây dựng mơ hình khai phá motif cho chuỗi thời gian phát 12 12 13 14 14 14 14 15 bất thường 2.1 Mơ hình tổng quan 2.2 Mơ hình hóa liệu thành chuỗi thời gian 2.3 Khai phá motif 2.3.1 Xây dựng chuỗi ký hiệu 2.3.2 Tìm kiếm motif bất thường 2.4 Xây dựng thuộc tính bất thường phân lớp 2.5 Đánh giá kết phân lớp 2.5.1 Ma trận nghi ngờ 17 17 19 22 22 25 28 31 31 LUẬN VĂN THẠC SĨ PHẠM NGỌC QUANG ANH 2.5.2 Precision Recall 2.5.3 Độ đo F1 Ứng dụng mơ hình phát bất thường vào liệu hoạt động mua hàng 3.1 Mô tả liệu 3.2 Mô hình hóa 3.3 Kết 31 32 33 33 34 38 Tài liệu tham khảo Phụ lục 46 50 A Công bố khoa học liên quan 51 Danh mục ký hiệu, chữ viết tắt T tập mốc thời gian O tập đối tượng D tập liệu giao dịch đối tượng TS tập chuỗi thời gian Z phép trừ chuỗi thời gian SB tập chuỗi ký hiệu S tập chuỗi chuỗi ký hiệu A tập chuỗi ký hiệu giao dịch đối tượng gian lận R ngưỡng tương đồng P tập motif hành vi F tập thuộc tính KNN K-nearest neighbor (K láng giềng gần nhất) SAX Symbolic Aggregate approXimation DT W Dynamic Time Warping score Chỉ số chọn mẫu TP True Positive FP False Positive TN True Negative LUẬN VĂN THẠC SĨ FN False Negative P re Precision Rec Recall F1 độ đo F1 PHẠM NGỌC QUANG ANH Danh sách hình vẽ 2.1 Sơ đồ tổng quan mơ hình phân tích hành vi chuỗi thời gian 2.2 Mô tả chuỗi thời gian đơn giản: (a) Chuỗi thời gian (b) Phép trừ chuỗi chuỗi thời gian 21 2.3 Các hành vi đối tượng mô tả dựa chuỗi thời gian đơn giản 2.4 Quy trình khai phá motif 19 22 23 2.5 Chuyển đổi phép trừ chuỗi chuỗi thời gian đơn giản thành chuỗi ký hiệu 24 2.6 Tính tốn giá trị thuộc tính 29 2.7 Minh họa ma trận nghi ngờ 31 3.1 Dữ liệu hoạt động mua hàng 34 3.2 Chuỗi thời gian thể hành vi thay đổi địa điểm mua hàng khách hàng năm 36 3.3 Chuyển đổi chuỗi thời gian hành vi khách hàng thành chuỗi ký hiệu 37 3.4 Biểu đồ hộp đánh giá kết phân lớp từ hành vi thay đổi địa điểm theo thuật toán 40 3.5 Biểu đồ hộp đánh giá kết phân lớp từ hành vi thay đổi hàng hóa mua theo thuật toán 41 3.6 Biểu đồ hộp đánh giá kết phân lớp từ hành vi thay đổi địa điểm hàng hóa mua theo thuật tốn 42 Danh sách bảng 2.1 2.2 2.3 3.1 Minh họa ma trận khoảng cách với chuỗi ký hiệu Ma trận khoảng cách Tìm kiếm chuỗi trung tâm motif Mô tả liệu hoạt động mua hàng 26 27 27 33 3.2 motif hành vi đáng nghi với R = 0.75 3.3 Kết phát bất thường dựa hành vi thay đổi địa điểm 3.4 Kết phát bất thường dựa hành vi thay đổi hàng hóa mua 3.5 Kết phát bất thường dựa hành vi thay đổi địa điểm hàng hóa mua 3.6 Thời gian chạy trung bình thuật toán 3.7 Kịch 4: Kết phát bất thường dựa việc tổng hợp điểm đánh giá từ thuật toán Random Forest 3.8 Kịch 5: Kết phát bất thường dựa việc tổng hợp điểm đánh giá từ thuật toán học máy 3.9 Thời gian chạy trung bình kịch 38 39 40 41 42 43 43 43

Ngày đăng: 04/06/2023, 13:08

w