1. Trang chủ
  2. » Giáo Dục - Đào Tạo

việc áp dụng thuật toán rừng ngẫu nhiên vào việc hỗ trợ xác định lỗi mạng và dự báo sự cố dựa trên việc học có giám sát

68 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • 1.1.1. Khái ni ệ m v ề phân l ớ p d ữ li ệ u và bài toán phân l ớ p d ữ li ệ u (13)
  • 1.2. Táng quan về học máy (17)
  • 1.3. ThuÁt toán Cây quyÁt định (21)
  • 1.4. Bug Tracking System (27)
  • 1.6. Cỏc cụng trỡnh nghiờn c āu trong n°ò c (29)
    • 1.6.1. Two-Phase Defect Detection Using Clustering and Classification Methods (29)
    • 1.6.2. An automated fault detection system for communication networks and distributed systems networks and distributed systems (30)
    • 1.6.3. Áp d ụ ng thu ậ t toán phân lo ại Random Forest để xây d ự ng b ả n đồ s ử d ụng đấ t/th ả m ph ủ t ỉnh Đắ k L ắ k d ự a vào ả nh v ệ tinh Landsat 8 OLI đồ sử dụng đất/thảm phủ tỉnh Đắk Lắk dựa vào ảnh vệ tinh Landsat 8 OLI (30)
    • 1.6.4. Nghiên c ứ u m ộ t s ố thu ậ t toán h ọc máy để phân l ớ p d ữ li ệ u và th ử nghi ệ m (31)
  • 1.7. Cỏc cụng trỡnh nghiờn c āu ngoài n°ò c (31)
    • 1.7.1. VAX/VMS Event monitoring and analysis (31)
    • 1.7.2. Using Secondary Knowledge to Support Decision Tree Classification of Retrospective Clinical Data Classification of Retrospective Clinical Data (31)
    • 1.7.3. Designing a hierarchical neural network based on fuzzy clustering for fault diagnosis of the Tennessee – Eastman process clustering for fault diagnosis of the Tennessee–Eastman process (32)
    • 1.7.4 Fault Detection and Diagnosis for Solar-Powered Wireless Mesh Networks Using Machine Learning Mesh Networks Using Machine Learning (32)
    • 1.7.5 Fault Detection for Cloud Computing Systems with Correlation Analysis Analysis (33)
  • 2.2. Mô hình d ā li á u l ã i (35)
  • 2.3. S ÿ d āng ph°¢ng pháp tf x idf để l ọ c n ộ i dung quan tr ọ ng t ừ n ộ i dung mô t Á l ã i (38)
  • 2.4. S ÿ d ā ng thu Á t toỏn phõn l ò p R ừ ng ng ¿ u nhiờn thụng qua b ộ th° viá n Scikit-learn (39)
  • 2.5. S ÿ d ā ng tf x idf trong th° viá n Scikit-learn (42)
  • Ch°Âng 3 - XÂY D Ă NG Mễ HèNH PHÂN LO ắ I L õ I M ắ NG (43)
    • 3.1. T Á p d ā li á u l ã i thu th Á p t ừ các BTS (44)
    • 3.2. Trích xu ¿ t thu ộ c tính quan tr ọ ng c ÿ a l ã i (45)
    • 3.3. Xây d ă ng r ừ ng ng ¿ u nhiên (48)
      • 3.3.1. Chu ẩ n hóa d ữ li ệ u sang d ạ ng s ố (48)
      • 3.3.2. L ấ y m ẫ u d ữ li ệ u cho vi ệ c xây d ự ng cây quy ết đị nh (50)
      • 3.3.3 Xây d ự ng cây quy ết đị nh (52)
      • 1.3.4. Xây d ự ng r ừ ng ng ẫ u nhiên (54)
  • Ch°¢ng 4 – PHÂN TÍCH VÀ ĐÁNH GIÁ (56)
    • 4.1. Phân tích độ chính xác c ÿ a mô hình (56)
    • 4.2. Xác đị nh m āc độ quan tr ọ ng c ÿ a các thu ộ c tính (59)
      • 5.1.1. V ề m ặ t lý thuy Á t (62)
    • 5.3. H°ò ng phỏt tri ể n (63)
  • DANH M Ā C TÀI LI à U THAM KH À O (65)

Nội dung

Hệ thống sử dụng một mô hình dữ liệu lỗi để thu thập các báo cáo lỗi, xây dựng một tính năng và phương pháp lọc ngữ nghĩa để tương quan các sự kiện và phương pháp học máy để đánh giá māc

Khái ni ệ m v ề phân l ớ p d ữ li ệ u và bài toán phân l ớ p d ữ li ệ u

Khai phá dā liáu: Khai phá dữ liệu nói chung có nghĩa là khai thác hoặc đào sâu vào dữ liệu á các dạng khác nhau để có được các mẫu và để có được kiến thāc v mẫu đó Trong quá trình khai thác dữ liệu, các tập dữ liệu lớn trước tiên được sắp xếp, sau đó các mẫu được xác định và các mối quan hệ được thiết lập để thực hiện phân tích dữ liệu và giải quyết vấn đ [28]

Phõn lòp dā liỏu: Đõy là một nhiệm vụ phõn tớch dữ liệu, tāc là quỏ trỡnh tìm kiếm một mô hình mô tả và phân biệt các lớp và khái niệm dữ liệu Phân loại là vấn đ xác định một tập hợp các danh mục (quần thể con), một dữ liệu mới thuộc v loại nào, trên cơ sá một tập dữ liệu huấn luyện chāa các dữ liệu và các lớp cÿa chúng đ愃̀được biết đến [28]

Phân lớp dữ liệu có thể chia làm các bước sau:

Quá trình học tập của mô hình phân loại bao gồm xây dựng mô hình Các thuật toán khác nhau được sử dụng để xây dựng mô hình này bằng cách đào tạo mô hình sử dụng tập dữ liệu đào tạo Mô hình sau đó được đào tạo để đưa ra các dự đoán chính xác Dữ liệu kiểm tra được sử dụng để đánh giá độ chính xác của mô hình phân loại.

B°òc phõn lo¿i: Mụ hỡnh được sử dụng để dự đoỏn và thử nghiệm mụ hỡnh đ愃̀ xây dựng trên dữ liệu thử nghiệm và sau đó ước tính độ chính xác cÿa các quy tắc phân loại Dữ liệu kiểm tra được sử dụng để ước tính độ chính xác cÿa quy tắc phân loại

Ta có thể phát biểu bài toán phân lớp dữ liệu như sau: ĐÁu vào cÿa bài toỏn phõn lòp dā liỏu: Cho tập dữ liệu ban đầu D = {(xi, yi) | i = 1, 2, …, n}, trong đó, xi = (xi1, xi2, , xik)  R k là dữ liệu gồm k thuộc tính āng với tập thuộc tính A = {A1, A2, …, Ak} và yi  C = {c1, c2, …, cm} là tập nhãn cÿacác lớp dữ liệu ban đầu ĐÁu ra cÿa bài toỏn phõn lòp dā liỏu: Một mô hình phân lớp F: R k → C, tương āng mỗi phần tử x  R k là một nh愃̀n lớp F(x)  C, sao cho đối với tập mẫu đầu vào D là phù hợp nhất theo nghĩa sau đây:

||F(xi) – yi||  0, với mọi (xi, yi)  D và || || là một độ đo nào đó

1.1.2 Các bước giải quyết bài toán phân lớp dữ liệu Để giải quyết bài toán phân lớp dữ liệu ta tiến hành hai gian đoạn: giai đoạn đầu tiên ta xây dựng mô hình phân lớp (còn hay được gọi là giai đoạn Huấn luyện) và giai đoạnthā hai làkiểm tra đánh giá mô hình phân lớp(còn được gọi là giai đoạn

Quá trình này nhằm mục đích xây dựng ra một mô hình phân lớp dữ liệu dựa trên việc mô tả tập các lớp dữ liệu hoặc các khái niệm đ愃̀ được xác định trước Trong giai đoạn này, thuật toán phân lớp được sử dụng để xây dựng mô hình phân lớp bằng cách phân tích hay

Ngày đăng: 20/09/2024, 09:40

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w