1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng hệ thống nhận dạng bất thường về môi trường bên trong kho văn thư lưu trữ: luận văn thạc sĩ

79 30 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 79
Dung lượng 2,14 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG TRẦN THỊ HỒNG NGA XÂY DỰNG HỆ THỐNG NHẬN DẠNG BẤT THƯỜNG VỀ MÔI TRƯỜNG BÊN TRONG KHO VĂN THƯ LƯU TRỮ LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Đồng Nai, Năm 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG XÂY DỰNG HỆ THỐNG NHẬN DẠNG BẤT THƯỜNG VỀ MÔI TRƯỜNG BÊN TRONG KHO VĂN THƯ LƯU TRỮ Chuyên ngành: Công nghệ thông tin Mã số : 8480201 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS TRẦN VĂN HOÀI Đồng Nai, Năm 2018 i LỜI CAM ĐOAN Để hoàn thiện nội dung nghiên cứu trình viết đề tài này, tác giả xin cam đoan kết nghiên cứu nghiêm túc thân tác giả Trong q trình hồn thiện tác giả có tham khảo ý kiến số chuyên gia tài liệu, sách báo liên quan Phần bố cục trình bày theo quy định Trường Đại học Lạc Hồng ban hành hướng dẫn giảng viên; Đối với số liệu, kết nêu luận văn trung thực chưa công bố luận văn trước Đồng Nai, ngày 30 tháng 11 năm 2018 HỌC VIÊN Trần Thị Hồng Nga ii LỜI CẢM ƠN Sau thời gian học tập, nghiên cứu chương trình cao học ngành Công nghệ thông tin, tiếp cận với nhiều môn học, nhiều lĩnh vực mẻ với dạy đầy tâm huyết quý thầy, cô giảng viên có uy tín kinh nghiệm giúp tác giả thực có góc nhìn nhận thức rõ nét lĩnh vực công nghệ thông tin… Kết sau thời gian học tập thể tương đối đầy đủ đề tài luận văn thạc sỹ với nội dung nghiên cứu "Xây dựng hệ thống nhận dạng bất thường môi trường bên kho lưu trữ liệu" Để có kết này, trước tiên tác giả xin trân trọng gửi lời tri ân, kính trọng biết ơn tới q Thầy, Cơ tham gia giảng dạy, truyền đạt, hướng dẫn giúp đỡ tận tình giúp cho học viên hình thành ý tưởng, nắm nội dung cần nghiên cứu từ sở lý luận tới thực tiễn; quý Thầy, Cô Khoa Sau đại học Trường Đại học Lạc Hồng; cảm ơn Ban Lãnh đạo cán bộ, nhân viên phịng chức Sở Khoa học Cơng nghệ tạo điều kiện để tác giả tiếp cận số liệu phục phụ việc hình thành ý tưởng để xây dựng nội dung đề tài Tác giả xin gửi lời cảm ơn tới thành viên lớp cao học Cơng nghệ thơng tin khóa 8, thành viên nhóm có phối hợp, trao đổi, giúp đỡ tơi hồn thành đề tài suốt q trình học tập Đặc biệt, để có kết đề tài này, tác giả xin bày tỏ tri ân, lòng biết ơn sâu sắc tới PGS-TS Trần Văn Hoài, giảng viên hướng dẫn; Thầy ân cần bảo, thẳng thắn góp ý để tác giả hoàn chỉnh luận văn Trân trọng / Đồng Nai, ngày 30 tháng 11 năm 2018 HỌC VIÊN Trần Thị Hồng Nga iii TÓM TẮT LUẬN VĂN Đề tài: XÂY DỰNG HỆ THỐNG NHẬN DẠNG BẤT THƯỜNG VỀ MÔI TRƯỜNG BÊN TRONG KHO VĂN THƯ LƯU TRỮ Ngành: Công nghệ thông tin Mã số: 8480201 Học viên: TRẦN THỊ HỒNG NGA Người hướng dẫn: PGS TS TRẦN VĂN HỒI NỘI DUNG TĨM TẮT Nội dung giao kết mong đợi người hướng dẫn - Khảo sát trạng yêu cầu môi trường bên kho lưu trữ liệu Sở Khoa học Công nghệ Đồng Nai - Xây dựng kết nối đến thiết bị theo dõi môi trường độ ẩm, nhiệt độ, ánh sáng, cường độ gió, … - Nghiên cứu mơ hình phương pháp nhận dạng bất thường theo chuỗi thời gian - Nghiên cứu, phát triển thuật toán sử dụng nhiều độ đo để phát xác định bất thường - Phân tích thiết kế phần mềm “giám sát mơi trường bên kho lưu trữ liệu” - Thực nghiệm đánh giá chương trình Cách thức giải vấn đề Giải pháp đưa để giải vấn đề tốn “nhận dạng bất thường mơi trường bên kho lưu trữ liệu” thực theo bước sau: - Bước 1: Hệ thống nhận liệu thông tin nhiệt độ, độ ẩm liên tục từ thiết bị cảm biến người dùng cung cấp Người dùng cấu hình thơng tin khoản thời gian n nhận liệu để xử lý (khung thời gian) iv - Buớc 2: liệu đến hệ thống đủ chiều dài khung thời gian n, hệ thống ghi nhận thêm chuỗi thời gian vào hệ thống cập nhật khoản cách a (tính độ đo khác DiffStD, Strend, SAXBAG) đến láng giềng gần - Bước 3: kiểm tra giá trị a nhỏ ngưỡng cho phép xem chuỗi liệu bình thường, ngược lại tính giá trị bất thường chuỗi liệu - Bước 4: Dựa vào kết nhận dạng phần mềm hiển thị thông tin điểm liệu bất thường nhiệt độ, độ ẩm kho lưu trữ biểu đồ cảnh báo người sử dụng Kết hợp bước triển khai xây dựng thành phần mềm có giao diện tương tác với người dùng Windows Form Luận văn sử dụng hệ quản trị sở liệu SQL Server 2010 sử dụng công nghệ Visual Studio 2015, Matlab 2018a để viết chương trình luận văn ngơn ngữ C# Ngày 30 tháng 11 năm 2018 NGƯỜI HƯỚNG DẪN HỌC VIÊN PGS TS TRẦN VĂN HOÀI TRẦN THỊ HỒNG NGA v MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii TÓM TẮT LUẬN VĂN iii MỤC LỤC v DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT vii DANH SÁCH HÌNH viii DANH SÁCH BIỂU ĐỒ ix MỞ ĐẦU .1 Lý chọn đề tài Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu .2 Phương pháp nghiên cứu .2 Ý nghĩa khoa học thực tiễn đề tài Bố cục luận văn CHƯƠNG : TỔNG QUAN VỀ KHO VĂN THƯ LƯU TRỮ VÀ CÁC QUI ĐỊNH TRONG QUẢN LÝ MÔI TRƯỜNG BÊN TRONG KHO VĂN THƯ LƯU TRỮ CỦA NHÀ NƯỚC 1.1 Tổng quan kho lưu trữ liệu 1.1.1 Khái niệm kho lưu trữ liệu 1.1.2 Vấn đề theo dõi môi trường kho văn thư lưu trữ 1.1.3 Các qui định nhà nước quản lý môi trường kho lưu trữ 10 1.2 Hiện trạng kho lưu trữ Sở Khoa học Công nghệ tỉnh Đồng Nai 11 1.3 Đánh giá định hướng nghiên cứu đề tài .13 CHƯƠNG : CÁC PHƯƠNG PHÁP NHẬN DẠNG SỰ BẤT THƯỜNG VÀ VẤN ĐỀ NHẬN DẠNG BẤT THƯỜNG THEO CHUỖI THỜI GIAN 14 2.1 Định nghĩa tổng quát bất thường 14 2.2 Nhận dạng bất thường .17 2.2.1 Bất thường liệu chiều 20 2.2.2 Bất thường liệu đa chiều 24 2.3 Phương pháp phát bất thường 26 2.4 Tiêu chí để đánh giá 28 2.5 Bài toán chuỗi liệu theo thời gian 28 vi 2.5.1 Định nghĩa vấn đề chuỗi liệu theo thời gian .29 2.5.2 Nhận dạng bất thường theo chuỗi thời gian 33 2.5.3 Các thuật toán nhận dạng bất thường theo chuỗi thời gian 40 CHƯƠNG : PHƯƠNG PHÁP NHẬN DẠNG BẤT THƯỜNG VỀ MÔI TRƯỜNG BÊN TRONG KHO VĂN THƯ LƯU TRỮ DỰA TRÊN NHIỀU ĐỘ ĐO 48 3.1 Lựa chọn độ đo sử dụng 48 3.2 Nhận dạng bất thường trực tuyến cho liệu theo chuỗi thời gian 50 3.2.1 Cách tiếp cận phát bất thường chuỗi dựa nhiều phép đo MUASD 52 3.2.2 Thuật toán phát bất thường dựa nhiều phép đo MUASD 54 CHƯƠNG : CÀI ĐẶT, THỰC NGHIỆM VÀ ĐÁNH GIÁ 56 4.1 Phân tích kết sử dụng tập liệu đo nhịp tim 57 4.1.1 Mẫu ECG1 57 4.1.2 Mẫu ECG2 59 4.2 Phân tích kết sử dụng tập liệu đo nhiệt độ, độ ẩm thực tế kho lưu trữ 61 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 64 vii DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT Viết tắt Tiếng Anh Tiếng Việt DIFFSTD Standard Deviation of Differences Độ lệch chuẩn khác biệt hai chuỗi thời gian EUC Cross Euclidean distance Khoản cách Euclidean chéo STREND SameTrend Độ đo khác biệt SAX Symbolic Aggregate approximation xấp xỉ gộp ký hiệu hóa viii DANH SÁCH HÌNH Hình 1.1 Kho lưu trữ thị xã Long Khánh, tỉnh Đồng Nai Hình 1.2 Tác động độ ẩm đến chất lượng giấy Hình 2.1 Sự bất thường liệu .14 Hình 2.2 Các kỹ thuật nhận dạng bất thường 16 Hình 2.3 Phân loại bất thường 16 Hình 2.4 Mơ tả phân loại bất thường 17 Hình 2.5 Cách tính Precision Recall 18 Hình 2.6 Phân phối chuẩn 21 Hình 2.7 Phân phối bất đối xứng 22 Hình 2.8 Phân phối đa phương thức 22 Hình 2.9 Định danh cụm dựa mật độ 23 Hình 2.10 Định danh cụm dựa mật độ intra-group inter-group 24 Hình 2.11 Phương pháp phát bất thường Rank-based 27 Hình 2.12 hiển thị biến động giá cổ phiếu số công ty giai đoạn 2010-2012 30 Hình 2.13 Tính tốn khoảng cách vng góc thuộc tính liệu đoạn đường kết nối đến predecessor successor 35 Hình 2.14 khoảng cách điểm liệu đoạn nối hai điểm liệu gần 36 Hình 2.15 Sự biến đổi liệu hai chuỗi thời gian 37 Hình 2.16 Độ trễ chuỗi thời gian .39 Hình 2.17 Mơ tả thuật tốn tiếp cận chuyển đổi, liệu 41 Hình 2.18 Mơ tả độ đo DIFFSTD hai chuỗi thời gian .43 Hình 2.19 Mơ tả độ đo SAX SAXFreg chuỗi thời gian 45 Hình 2.20 bảng giá trị SAX lookup 45 Hình 3.1 Chuỗi đại diện cho mức tiêu thụ điện .53 54 Chùng ta tính mức độ khác biệt đáng kể 𝑋𝑖,𝑤 với chuỗi khác băng cách đánh giá khoảng cách trung bình đến k láng giềng gần có lớn nhiều so với khoảng cách trung bình với chuỗi khác Như vậy, ta tổng quát sau: Cho chuỗi thời gian X, tập chuỗi trích xuất là: 𝑋𝑤 = {𝑋𝑝,𝑤 ; (1 ≤ 𝑝 ≤ 𝑛 − 𝑤 + 1} b1: tìm láng giềng gần chuỗi 𝑋𝑤 , cách sử dụng khoảng cách Euclide b2: Thay vì, tìm nhiều láng giềng gần nhất, sử dụng 01 láng giềng gần nhất, tức k = 1; b3: tần suất xuất từ SAX chuỗi 𝑋𝑝,𝑤 so sánh với toàn tần suất xuất toàn chuỗi thời gian nhằm xác định chuỗi bất thường Ví dụ: có chuỗi bất thường SAX abc, aac, abd từ xuất số lần 2,3,2 toàn chuỗi thời gian vậy, tỉ lệ xuất là: 1/2; 1/3; 1/2 giá trị trung bình tần xuất 0.44 Trong khi, chuỗi khác có SAX xuất 10 lần tồn chuỗi giá trị trung bình 0.1 nhỏ đồng nghĩa chuỗi bình thường Ngồi ra, nhằm tăng tốc độ xử lý sử dụng thuật tốn tìm kiếm láng giềng gần kỹ thuật loại bỏ sớm [18] 3.2.2 Thuật toán phát bất thường dựa nhiều phép đo MUASD Mơ tả tḥt tốn b1: cho chuỗi thời gian X, chiều dài chuỗi w, ta có tập 𝑋𝑤 tập chuỗi X cách sử dụng kỹ thuật cửa sổ trượt b2: tính khoảng cách 𝑑𝑖𝑠𝑡𝑠 khoảng cách SAX 𝑠𝑖 láng giềng gần b3: tính tần suất xuất (FregAll) tất SAX toàn chuỗi thời gian b4: với chuỗi 𝑋𝑝,𝑤 ∈ 𝑋𝑤 tính tần suất xuất Freg 𝑖 cho 𝑋𝑖,𝑤 xem độ đo khoảng cách 𝑑𝑖𝑠𝑡𝑠 b5 tính khoảng cách 𝑑𝑖𝑠𝑡𝑡 khoảng cách STREND 𝑠𝑖 láng giềng gần 55 b6: tính khoảng cách 𝑑𝑖𝑠𝑡𝑓 khoảng cách DiffSTD 𝑠𝑖 láng giềng gần b7: sử dụng kỹ thuật chuẩn hóa Z-normalization với 03 độ đo vừa tính 𝑑𝑖𝑠𝑡𝑡 , 𝑑𝑖𝑠𝑡𝑓 , 𝑑𝑖𝑠𝑡𝑠 b8 Kết hợp độ đo để tính giá trị bất thường chuỗi 𝑠𝑖 Tính số bất thường 𝐴(𝑋𝑖 ) tính sau: 𝑂(𝑋𝑖 ) = √∑ℓ∈𝑠,𝑡,𝑓(𝑑𝑖𝑠𝑡𝑙 (𝑖))2 b9: Sắp xếp 𝑂(𝑋𝑖 ) theo thứ tự giảm dần tính giá trị trung bình tốn độ lệch chuẩn 80% liệu (loại 10% giá trị thấp cao nhất) Chuỗi có 𝑂(𝑋𝑖 ) lớn giá trị trung bình + x Độ lệch chuẩn xem bất thường 56 CHƯƠNG : CÀI ĐẶT, THỰC NGHIỆM VÀ ĐÁNH GIÁ Chương trình bày cách cài đặt chạy thực nghiệm phần mềm Sau phân tích đánh giá kết đạt Dữ liệu thử nghiệm: Để mang tính khách quan, việc thử nghiệm thực hai tập liệu lớn - Tập liệu mẫu có sẵn xác định vị trí bất thường chuỗi thời gian đo nhịp tim ECG1, ECG2 [22] - Tập liệu thu thập từ nhiệt độ kho lưu trữ phân thành hai trường hợp có điểm bất thường đoạn bất thường Việc phân tích liệu mẫu có sẵn ECG1, ECG2 [22] xác định vị trí bất thường chuỗi thời gian cần thiết nhằm kiểm tra tính xác độ đo thuật tốn q trình thực nghiệm Phần mềm thực nghiệm Thuật toán cài đặt thực nghiệm phần mềm Mathlab phiên 2018a Dữ liệu nhiệt độ độ ẩm thu thập từ cảm biến lắp đặt kho văn thư lưu trữ băng cách sử dụng Nodejs server phía client sử dụng c# Visual Studio 2015 để lấy liệu 57 4.1 Phân tích kết sử dụng tập liệu đo nhịp tim 4.1.1 Mẫu ECG1 Biểu đồ 4.1 Vị trí bất thường đánh dấu vịng trịn tập liệu mẫu ECG1 Biểu đồ 4.2 Biểu diễn khoản cách 03 độ đo 𝑑𝑖𝑠𝑡𝑡 , 𝑑𝑖𝑠𝑡𝑓 , 𝑑𝑖𝑠𝑡𝑠 58 Biểu đồ 4.3 Biểu diễn điểm bất thường theo cơng thức tính theo MUDIM Biểu đồ 4.4 Biểu diễn điểm bất thường 03 độ đo dùng cơng thức tính 59 4.1.2 Mẫu ECG2 Biểu đồ 4.5 Vị trí bất thường đánh dấu vòng tròn tập liệu mẫu ECG2 Biểu đồ 4.6 Biểu diễn khoảng cách 03 độ đo 𝑑𝑖𝑠𝑡𝑡 , 𝑑𝑖𝑠𝑡𝑓 , 𝑑𝑖𝑠𝑡𝑠 60 Biểu đồ 4.7 Biểu diễn điểm bất thường theo cơng thức tính theo MUDIM Biểu đồ 4.8 Biểu diễn điểm bất thường 03 độ đo dùng cơng thức tính 61 Đánh giá: - Chuỗi liệu đo nhịp tim với khoảng bất thường cho trước thông qua biểu đồ kết độ đo thấy độ đo SAXFreg cho kết tương đối theo liệu mẫu - Chuỗi giá trị bất thường theo cơng thức tính theo MUDIM cho kết bị nhiễu nhiều cách tính sử dụng 𝑂(𝑋𝑖 ) = √∑ℓ∈𝑡,𝑓(𝑑𝑖𝑠𝑡𝑙 (𝑖)) + (𝑑𝑖𝑠𝑡𝑠 (𝑖)) Thay cho công thức 𝑂(𝑋𝑖 ) = √∑ℓ∈𝑠,𝑡,𝑓(𝑑𝑖𝑠𝑡𝑙 (𝑖)) - Kết sử dụng độ lệch trung bình tuyệt đối (median absolute deviations MAD) cho mảng 03 chiều chứa giá trị tương ứng độ đo cho số lượng điểm bất thường gần giống cách sử dụng công thức 4.2 Phân tích kết sử dụng tập liệu đo nhiệt độ, độ ẩm thực tế kho lưu trữ Biểu đồ 4.9 Biểu diễn liệu nhiệt độ khoảng ngày 62 Biểu đồ 4.10 Biểu diễn điểm bất thường 03 độ đo theo cách tính Biểu đồ 4.11 Biểu diễn liệu độ ẩm khoảng ngày 63 ` Biểu đồ 4.12 Biểu diễn điểm bất thường độ ẩm 03 độ đo theo cách tính Đánh giá: - Theo biểu đồ phân tích cho thấy có thay đổi đột ngột nhiệt độ độ ẩm khoảng thời gian t ≈ 300 phân biểu đồ thành nửa khác nhau, nhiên giá trị biểu diễn chuỗi liệu bất thường lân cận khoảng liệu này, phần cịn lại tương đối bình thường Như vậy, cách tính việc kết hợp độ đo theo cách cập nhật xu hướng theo giá trị chuỗi - Có tương quan thay đổi nhiệt độ độ ẩm, điều thể rõ biểu đồ, thơng thường nhiệt độ tăng độ ẩm giảm ngược lại Do đó, việc phát bất thường kho lưu trữ phát dựa mối quan hệ 64 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN KẾT QUẢ ĐẠT ĐƯỢC - Đề tài tìm hiểu tổng quan kho lưu trữ liệu qui định quản lý môi trường kho lưu trữ nhà nước Trong đó, phân tích trạng kho văn thư lưu trữ sở Khoa học Công nghệ tỉnh Đồng Nai trang thiết bị chưa đáp ứng tiêu chuẩn kỹ thuật kho lưu trữ thiếu nhân để theo dõi hàng ngày Đây hạn chế chung kho văn thư lưu trữ Sở, ngành - Đề tài nghiên cứu phương pháp nhận dạng bất thường vấn đề nhận dạng bất thường theo chuỗi thời gian - Đề tài sử dụng độ đo khác để nhận dạng bất thường theo chuỗi thời gian, sử dụng tiếp cận nhận dạng trực tuyến - Để đánh giá mức độ xác thuật tốn, đề tài sử dụng liệu mẫu có sẵn xác định vị trí bất thường chuỗi thời gian đo nhịp tim ECG1, ECG2 [22] Kết biểu đồ phân tích cho thấy việc nhận dạng tương đối xác - Trong trình thực nghiệm, đề tài đề điều chỉnh phương pháp nhận nhận dạng bất thường theo chuỗi thời gian dựa nhiều độ đo Kishan G Mehrotra, Chilukuri K Mohan, HuaMing Huang đề xuất [21] - Theo biểu đồ phân tích cho thấy có thay đổi đột ngột nhiệt độ độ ẩm khoảng thời gian ngắn, nhiên giá trị biểu diễn chuỗi liệu bất thường lân cận khoảng liệu này, phần cịn lại tương đối bình thường Như vậy, cách tính việc kết hợp độ đo theo cách cập nhật xu hướng theo giá trị chuỗi - Kết đề tài ứng dụng cho nhiều lĩnh vực khác kho nơng sản, kho hàng hóa, … hệ thống sử dụng chế học không giám sát tự động cập nhật theo khoảng thời gian HƯỚNG PHÁT TRIỂN TIẾP THEO - Triển khai nhiều thực tế để điều chỉnh tham số đầu vào thuật toán cho phù hợp với trường hợp cụ thể 65 - Bổ sung thêm thuật toán thể tính ràng buộc thơng qua độ đo để phát bất thường nhiệt độ độ ẩm không tăng hay giảm tương quan với theo qui luật - Thêm chức phân tích liệu với khoảng thời gian theo mùa, tháng, năm để nhận dạng khác biệt khoảng thời gian - Tích hợp vào thiết bị phần cứng nhúm để dễ dàng triển khai thực tế kho lưu trữ, tích hợp cảnh báo qua điện thoại hay chuông TÀI LIỆU THAM KHẢO [1] A.J Fox, “Outliers in time series.” J R Stat Soc Ser B (Methodological) 34(3), 350–363 (1972) [2] A.J Smola, B Schölkopf, “A tutorial on support vector regression.” Stat Comput 14(3), 199–222 (2004) [3] B Pincombe, “Anomaly detection in time series of graphs using arma processes.” Asor Bull 24(4), p (2005) [4] Báo cáo Đoàn kiểm tra Cục Văn thư Lưu trữ nhà nước tiến hành kiểm tra công tác văn thư, lưu trữ số quan, đơn vị địa bàn tỉnh Đồng Nai từ ngày 19/4/2016 đến ngày 22/4/2016 [5] C Faloutsos, M Ranganathan, Y Manolopoulos., “Fast subsequence matching in timeseries databases,” in Proceedings of the 1994 ACM SIGMOD International Conference on Management of Data, New York, NY, USA, pp 419– 429, 1994 [6] D Cheboli, “Anomaly detection of time series,” Ph.D dissertation, University of Minnesota, 2010 [7] E Keogh, J Lin, A Fu, “Hot sax: Efficiently finding the most unusual time series subsequence,” in Fifth IEEE International Conference on Data Mining (IEEE, Washington, DC, 2005), pp 8–pp [8] E Keogh, J Lin, S.-H Lee, H.V Herle, “Finding the most unusual time series subsequence: algorithms and applications.” Knowl Inform Syst 11(1), 1–27 (2007) [9] E Keogh, K Chakrabarti, M Pazzani, S Mehrotra, “Dimensionality reduction for fast similarity search in large time series databases.” J Knowl Inform Syst., 263–283 (2000) [10] G Bonanno, F Lillo, R.N Mantegna, “High-frequency crosscorrelation in a set of stocks.” Quant Finan 1, 96–104 (2001) [11] G Salton, Automated Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer (Addison-Wesley Longman Publishing, Boston, 1998) [12] H Cao, G Si, Y Zhang, L Jia, “Enhancing effectiveness of densitybased outlier mining scheme with density-similarity-neighbor-based outlier factor.” Expert Syst Appl Intl J.37(12), (2010) [13] H.Z Moayedi, M Masnadi-Shirazi, , “Arima model for network traffic prediction and anomaly detection,” in International Symposium on Information Technology, 2008 ITSim 2008, vol (IEEE, Washington, DC, 2008), pp 1–6 [14] H Ding, G Trajcevski, P Scheuermann, X Wang, E Keogh, “Querying and mining of time series data: experimental comparison of representations and distance measures.” Proc VLDB Endowment, 1542–1552 (2008) [15] H Huang, K Mehrotra, C Mohan, “Detection of anomalous time series based on multiple distance measures,” in 28th International Conference on Computers and Their Applications (CATA-2013), Honolulu, Hawaii, USA, 2013 [16] J Tang, Z Chen, A.W Fu, D.W Cheung, “Capabilities of outlier detection schemes in large datasets, framework and methodologies.” Knowl Inform Syst 11(1), 45–84 (2006) [17] J Ma, J Theiler, S Perkins, “Accurate on-line support vector regression.” Neural Comput 15(11), 2683–2703 (2003) [18] J Lin, E Keogh, L Wei, S Lonardi, “Experiencing sax: a novel symbolic representation of time series.” Data Mining and Knowledge Discovery, pp 107–144, 2007 [19] J Lin, E Keogh, L Wei, S Lonardi, “Experiencing sax: a novel symbolic representation of time series.” Data Mining and Knowledge Discovery, pp 107–144, 2007 [20] J Lin, R Khade, Y Li, “Rotation-invariant similarity in time series using bag-of-patterns representation.” J Intell Inform Syst (1 April 2012), 1–29 (2012) [21] Kishan G Mehrotra • Chilukuri K Mohan HuaMing Huang (2017), “Anomaly Detection Principles and Algorithms” Terrorism, Security, and Computation ISBN 978-3-319-67524-4 [22] L Wei, N Kumar, V Lolla, E Keogh, S Lonardi, C.A Ratanamahatana, “Assumption-free anomaly detection in time series,” Website, 2005 http://alumni.cs.ucr.edu/~wli/SSDBM05/ [23] M Gupta, J Gao, C.C Aggarwal, J Han, “Outlier detection for temporal data: A survey.” IEEE Trans Knowledge Data Eng 26(9), 2250–2267 (2014) [24] P.J Rousseeuw, A.M Leroy, Robust Regression and Outlier Detection (Wiley, New York, 1987) [25] R Baeza-Yates, B Ribeiro-Neto, Modern Information Retrieval (Addison-Wesley Longman Publishing, Boston, 1999) [26] R Fujimaki, T Yairi, K Machida, “An anomaly detection method for spacecraft using relevance vector,” in Learning, The Ninth Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD) (Springer, New York, 2005), pp 785–790 [27] V Chandola, D Cheboli, V Kumar, “Detecting anomalies in a time series database,” Department of Computer Science and Engineering, University of Minnesota, Tech Rep TRpp 09–004, 2009 [28] X Meng, Z Chen, “On user-oriented measurements of effectiveness of web information retrieval systems,” in Proceeding of the 2004 International Conference on Internet Computing., pp 527–533, 2004 ... ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG XÂY DỰNG HỆ THỐNG NHẬN DẠNG BẤT THƯỜNG VỀ MÔI TRƯỜNG BÊN TRONG KHO VĂN THƯ LƯU TRỮ Chuyên ngành: Công nghệ thông tin Mã số : 8480201 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG... động nhận dạng biến đổi bất thư? ??ng nhu cầu cần thiết Mục tiêu nghiên cứu - Xây dựng hệ thống nhận dạng bất thư? ??ng môi trường bên kho lưu trữ liệu - Tích hợp vào hệ thống giám sát kho lưu trữ Sở Khoa... cầu kỹ thuật kho lưu trữ 1.3 Đánh giá định hướng nghiên cứu đề tài - Cần thiết xây dựng hệ thống giám sát, nhận dạng bất thư? ??ng môi trường bên kho văn thư lưu trữ môi trường bên kho lưu trữ liệu

Ngày đăng: 16/08/2020, 10:11

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] A.J. Fox, “Outliers in time series.” J. R. Stat. Soc. Ser. B (Methodological) 34(3), 350–363 (1972) Sách, tạp chí
Tiêu đề: Outliers in time series
[2] A.J. Smola, B. Schửlkopf, “A tutorial on support vector regression.” Stat. Comput. 14(3), 199–222 (2004) Sách, tạp chí
Tiêu đề: A tutorial on support vector regression
[3] B. Pincombe, “Anomaly detection in time series of graphs using arma processes.” Asor Bull. 24(4), p. 2 (2005) Sách, tạp chí
Tiêu đề: Anomaly detection in time series of graphs using arma processes
[5] C. Faloutsos, M. Ranganathan, Y. Manolopoulos., “Fast subsequence matching in timeseries databases,” in Proceedings of the 1994 ACM SIGMOD International Conference on Management of Data, New York, NY, USA, pp. 419–429, 1994 Sách, tạp chí
Tiêu đề: Fast subsequence matching in timeseries databases
[6] D. Cheboli, “Anomaly detection of time series,” Ph.D. dissertation, University of Minnesota, 2010 Sách, tạp chí
Tiêu đề: Anomaly detection of time series
[7] E. Keogh, J. Lin, A. Fu, “Hot sax: Efficiently finding the most unusual time series subsequence,” in Fifth IEEE International Conference on Data Mining (IEEE, Washington, DC, 2005), pp. 8–pp Sách, tạp chí
Tiêu đề: Hot sax: Efficiently finding the most unusual time series subsequence
[8] E. Keogh, J. Lin, S.-H. Lee, H.V. Herle, “Finding the most unusual time series subsequence: algorithms and applications.” Knowl. Inform. Syst. 11(1), 1–27 (2007) Sách, tạp chí
Tiêu đề: Finding the most unusual time series subsequence: algorithms and applications
[9] E. Keogh, K. Chakrabarti, M. Pazzani, S. Mehrotra, “Dimensionality reduction for fast similarity search in large time series databases.” J. Knowl. Inform.Syst., 263–283 (2000) Sách, tạp chí
Tiêu đề: Dimensionality reduction for fast similarity search in large time series databases
[10] G. Bonanno, F. Lillo, R.N. Mantegna, “High-frequency cross- correlation in a set of stocks.” Quant. Finan. 1, 96–104 (2001) Sách, tạp chí
Tiêu đề: High-frequency cross-correlation in a set of stocks
[12] H. Cao, G. Si, Y. Zhang, L. Jia, “Enhancing effectiveness of density- based outlier mining scheme with density-similarity-neighbor-based outlier factor.”Expert Syst. Appl. Intl. J.37(12), (2010) Sách, tạp chí
Tiêu đề: Enhancing effectiveness of density-based outlier mining scheme with density-similarity-neighbor-based outlier factor
[13] H.Z. Moayedi, M. Masnadi-Shirazi, , “Arima model for network traffic prediction and anomaly detection,” in International Symposium on Information Technology, 2008. ITSim 2008, vol. 4 (IEEE, Washington, DC, 2008), pp. 1–6 Sách, tạp chí
Tiêu đề: Arima model for network traffic prediction and anomaly detection
[15] H. Huang, K. Mehrotra, C. Mohan, “Detection of anomalous time series based on multiple distance measures,” in 28th International Conference on Computers and Their Applications (CATA-2013), Honolulu, Hawaii, USA, 2013 Sách, tạp chí
Tiêu đề: Detection of anomalous time series based on multiple distance measures
[16] J. Tang, Z. Chen, A.W. Fu, D.W. Cheung, “Capabilities of outlier detection schemes in large datasets, framework and methodologies.” Knowl.Inform. Syst. 11(1), 45–84 (2006) Sách, tạp chí
Tiêu đề: Capabilities of outlier detection schemes in large datasets, framework and methodologies
[17] J. Ma, J. Theiler, S. Perkins, “Accurate on-line support vector regression.” Neural Comput. 15(11), 2683–2703 (2003) Sách, tạp chí
Tiêu đề: Accurate on-line support vector regression
[18] J. Lin, E. Keogh, L. Wei, S. Lonardi, “Experiencing sax: a novel symbolic representation of time series.” Data Mining and Knowledge Discovery, pp. 107–144, 2007 Sách, tạp chí
Tiêu đề: Experiencing sax: a novel symbolic representation of time series
[19] J. Lin, E. Keogh, L. Wei, S. Lonardi, “Experiencing sax: a novel symbolic representation of time series.” Data Mining and Knowledge Discovery, pp. 107–144, 2007 Sách, tạp chí
Tiêu đề: Experiencing sax: a novel symbolic representation of time series
[20] J. Lin, R. Khade, Y. Li, “Rotation-invariant similarity in time series using bag-of-patterns representation.” J. Intell. Inform. Syst. (1 April 2012), 1–29 (2012) Sách, tạp chí
Tiêu đề: Rotation-invariant similarity in time series using bag-of-patterns representation
[21] Kishan G. Mehrotra • Chilukuri K. Mohan HuaMing Huang (2017), “Anomaly Detection Principles and Algorithms” Terrorism, Security, and Computation ISBN 978-3-319-67524-4 Sách, tạp chí
Tiêu đề: Anomaly Detection Principles and Algorithms” T
Tác giả: Kishan G. Mehrotra • Chilukuri K. Mohan HuaMing Huang
Năm: 2017
[22] L. Wei, N. Kumar, V. Lolla, E. Keogh, S. Lonardi, C.A. Ratanamahatana, “Assumption-free anomaly detection in time series,” Website, 2005. http://alumni.cs.ucr.edu/~wli/SSDBM05/ Sách, tạp chí
Tiêu đề: Assumption-free anomaly detection in time series
[23] M. Gupta, J. Gao, C.C. Aggarwal, J. Han, “Outlier detection for temporal data: A survey.” IEEE Trans. Knowledge Data Eng. 26(9), 2250–2267 (2014) Sách, tạp chí
Tiêu đề: Outlier detection for temporal data: A survey

TỪ KHÓA LIÊN QUAN

w