Kỹ thuật xác nhận chéo để huấn luyện cho mạng neur- 123docz.net

Tính tổng quát là một trong những yếu tố quan trọng nhất khi đánh giá hoạt động của mạng neural network. Xét về hiệu suất phân loại, tính tổng quát của mạng có nghĩa là sau được huấn luyện, mạng có thể phân loại dữ liệu từ một tập dữ liệu mà mạng chưa từng thấy trước đây. Lý tưởng nhất là mạng được huấn luyện cho đến khi đạt được mục tiêu mong muốn về hàm chi phí (cost function) đạt được. Tuy nhiên, quá trình này có thể dẫn đến một sai sót nổi bật là việc huấn luyện mạng quá mức (thời gian huấn luyện quá dài, hàm chi phí huấn luyện buộc phải là giá trị rất nhỏ). Trong trường hợp này, hiệu suất của mạng neural network trên dữ liệu huấn luyện vẫn liên tục được cải thiện trong khi hiệu suất trên các tập dữ liệu khác trở nên kém hơn, dẫn đến việc tính tổng quát của mạng là kém (như trong Hình 3.5).

Để hạn chế sự huấn luyện quá mức của mạng và nâng cao tính tính tổng quát của mạng, trong đồ án này, kỹ thuật xác nhận chéo được áp dụng. Để làm điều này, dữ liệu có sẵn được chia thành ba tập con riêng biệt: tập huấn luyện, tập xác nhận và tập thử nghiệm. Tập huấn luyện được sử dụng để huấn luyện mạng bằng cách cập nhật dữ liệu của mạng và độ dốc thông qua việc giảm thiểu hàm chi phí (hàm lỗi). Trong quá trình huấn luyện, chức năng hàm lỗi trên tập xác nhận cũng được tính toán song song cùng với tập huấn luyện. Lỗi trên tập xác thực bình thường giảm trong giai đoạn đầu của quá trình huấn luyện, cũng như lỗi trên tập huấn luyện. Tuy nhiên, khi mạng bắt đầu trạng thái huấn luyện quá mức, lỗi trên tập xác thực thường bắt đầu tăng trong khi lỗi huấn luyện vẫn giảm (Hình 3.5). Khi mà lỗi trên tập xác thực tăng lên đối với một số lần lặp lại cụ thể, quá trình huấn luyện bị dừng, trọng số và độ lệch ở mức tối thiểu của lỗi xác thực được trả về là giá trị cuối cùng thông số mạng. Tập hợp thử nghiệm được tách biệt với hai tập hợp con khác và chỉ được sử dụng để kiểm tra hiệu suất của mạng cuối cùng như một tập dữ liệu hoàn toàn không bị ảnh hưởng của quá trình huấn luyện.

CHƯƠNG 4. SỬ DỤNG MẠNG NEURAL NETWORK KẾT HỢP VỚI PHƯƠNG PHÁP PHÂN TÍCH KHÍ HÒA TAN ĐỂ CHẨN ĐOÁN LỖI

CHO MÁY BIẾN ÁP ĐIỆN LỰC 4.1 Xây dựng mô hình thuật toán

Theo như lý thuyết đã được trình bày ở chương 3, nhằm mục đích phát hiện lỗi cho máy biến áp điện lực, mạng neural network sẽ bao gồm 3 lớp. Cấu trúc mạng sẽ được thiết kế như sau:

 Lớp đầu vào chứa 5 nút đầu vào tương ứng với 5 loại chất khí được xét (H2, CH4, C2H2, C2H4, C2H6)

 Lớp ẩn bao gồm N nút ẩn. Ứng với 5 nút đầu vào và 5 nút đầu ra thì thay đổi N từ 5-30. Trong quá trình thay đổi thì N = 20 nút ẩn thì kết quả đạt hiệu suất cao nhất. Vậy nên ta sẽ chọn N = 20 để thiết lập thông số cho mạng

 Lớp đầu ra bao gồm 5 nút. Cho biết trạng thái đầu ra mỗi nút tương ứng với một lỗi đầu ra của máy biến áp. Bao gồm:

 Nút 1: Phóng điện cục bộ (PD)

 Nút 2: Phóng điện năng lượng thấp (D1)

 Nút 3: Phóng điện năng lượng cao (D2)

 Nút 4: Lỗi nhiệt <700oC (T1 và T2)

 Nút 5: Lỗi nhiệt >700oC (T3)).

4.2 Xây dựng mạng neural network

Dựa trên những dữ liệu cơ bản trên, dưới đây là các bước để thiết lập cũng như tạo một mạng neural network hoàn chỉnh nhằm mục đích phát hiện lỗi cho MBA điện lực:

Cấu hình của mạng:

 Đầu vào (input): Gồm 5 nút tương ứng với thông số của 5 chất khí (H2, C2H4, CH4, C2H2, C2H6)

 Lớp ẩn (hidden): Mạng gồm 1 lớp ẩn, mỗi lớp bao gồm 20 nút.

 Đầu ra (output): Bài toán phân loại với 5 lỗi thường gặp nên sẽ tương ứng 5 nút đầu ra.

Lựa chọn hàm kích hoạt

Tansig là hàm truyền sigmoid tiếp tuyến hypebol của lớp ẩn.

Lựa chọn tham số để huấn luyện

 Số lượng Epoch: 1000

 Số lượng Batch: 100

Mô hình mạng neural network thu được:

Kết quả huấn luyện thu được:

Hiệu suất phân loại

Sau khi được huấn luyện bởi thuật toán Levenberg – Marquardt và kỹ thuật xác thực chéo, cấu trúc và thông số cuối cùng của mạng neural network phát triển được xác định. Hiệu suất phân loại của mạng sẽ được tính bằng cách đánh giá hai thông số: Sensitivity và Specificity của mạng neural network trên mỗi tập dữ liệu.

(4-1) (4-2)

Trong đó:

 TP (True Positive): là số điểm dữ liệu có lỗi được phân loại chính xác là có lỗi.

 TN (True Negative): là số điểm dữ liệu có trạng thái bình thường được phân loại chính xác là trạng thái bình thường.

 FP (False Positive): là số điểm dữ liệu có lỗi được phân loại chính xác là không có lỗi.

 FN (False Negative): là số điểm dữ liệu có trạng thái bình thường được phân loại chính xác là có lỗi.

4.3 Kết quả thu được

Để huấn luyện mạng neural network bằng cách sử dụng thuật toán Levenberg – Marquardt, tập dữ liệu tổng thể được tách thành tập huấn luyện và tập thử

nghiệm. Tập huấn luyện được sử dụng để phát triển các tham số của mạng, trong khi tập thử nghiệm được sử dụng để xác minh hiệu suất của mạng neural network đã được huấn luyện. Số điểm dữ liệu của mỗi tập được trình bày trong bảng 4.1 và bảng 4.2. Trong đó tập huấn luyện bao gồm 465 điểm dữ liệu và tập thử nghiệm có 135 điểm dữ liệu.

Sau khi huấn luyện mạng theo thuật toán Lenvenberg – Marquardt thì thu được kết quả như sau:

Hiệu suất phân loại của tập huấn luyện:

Bảng 4.15 Kết quả phân loại của tập huấn luyện

TP TN FP FN Tổng Sensitivit

Specificit y

67 364 24 10 465 0.870 0.938

Hiệu suất phân loại của tập thử nghiệm:

Bảng 4.16 Kết quả phân loại của tập thử nghiệm

TP TN FP FN Tổng Sensitivit

Specificit y

19 106 8 2 135 0.905 0.929

Với kết quả phân loại của tập thử nghiệm như trên, Sensitivity = 0.905 và Specificity = 0.929, ta thấy rằng kết quả của việc chấn đoán lỗi MBA sử dụng mạng neural đạt được độ chính xác cao, đủ khả năng phát hiện được lỗi tiềm ẩn cho MBA.

4.4 Kết luận chương

Qua chương này ta có thể nắm được những vấn đề sau:

 Nắm được các bước để có thể xây dựng được một mạng neural network hoàn chỉnh khi sử dụng toolbox Matlab

 Biết thêm về các thông số cần hiệu chỉnh cho mạng

 Kết quả thu được với tập huấn luyện là Sensitivity = 0.870 và Specificity = 0.929 và với tập thử nghiệm là Sensitivity = 0.905 và Specificity = 0.929 điều này cho thấy độ chính xác khi sử dụng mạng neural network là phù hợp cho việc chẩn đoán lỗi máy biến áp

CHƯƠNG 5. KẾT LUẬN

Qua quá trình nghiên cứu, được sử hướng dẫn nhiệt tình của TS. Nguyễn Bích Liên, đồ án tốt nghiệp đã làm rõ được một số vấn đề sau:

 Tổng quan lỗi của MBA điện lực

 Giới thiệu về phương pháp phân tích khí hòa tan DGA

 Giới thiệu về mạng neural network nhân tạo

 Xây dựng một mạng neural network sử dụng toolbox Matlab để ứng dụng vào việc chẩn đoán lỗi cho máy biến áp

Đồ án cũng đạt được kết quả rất tốt qua việc từ mạng đã xây dựng tính được hiệu suất phân loại với tập huấn luyện là Sensitivity = 0.870 và Specificity = 0.929 và với tập thử nghiệm là Sensitivity = 0.905 và Specificity = 0.929. Điều này cho thấy được tính chính xác của phương án này là rất cao và hoàn toàn có thể áp dụng trong thực tế.

Một trong những hạn chế của đồ án cũng như phương pháp này là sự thiếu hụt dữ liệu và còn phụ thuộc nhiều vào kinh nghiệm của người tiến hành kiểm tra lỗi. Và với kết quả như trên thì các thuật toán nâng cao hơn sẽ được nghiên cứu trong tương lai để cải thiện được hiệu suất tốt hơn nữa.

TÀI LIỆU THAM KHẢO

[1] Trần Bách, Lưới điện và hệ thống điện, Nhà xuất bản Khoa học Kỹ thuật, 2004.

[3] N. A. Bakar, "A Review of Dissolved Gas Analysis Measurement and Interpretation Techniques," Feature Article, 2014.

Kỹ thuật xác nhận chéo để huấn luyện cho mạng neural network

Xây dựng mạng neural network