1.4 Các công nghệ hiện hành
1.4.2 Các công nghệ nhận diện đường dây truyền tải điện
Sau khi tham khảo những công nghệ có thể nhận diện đường dây truyền tải điện trên thế giới chúng tôi đã tìm được hai công nghệ khả thi nhất để thực hiện nhiệm vụ này. Công nghệ xử lý ảnh và công nghệ trí tuệ nhân tạo hiện nay rất phát triển.
15
Chúng ta có thể kế thừa những công nghệ đã được nghiên cứu trước đây để xây dựng lại một công nghệ phù hợp với hệ thống. Sau khi nghiên cứu chúng tôi sẽ đi so sánh ưu nhược điểm của hai công nghệ và lựa chọn một công nghệ phù hợp nhất.
1.4.2.1 Công nghệ xử lý ảnh
Để nhận điện đường dây truyền tải điện ta có thể sử phương pháp xử lý hình ảnh để trích xuất các đặc trưng bằng các hàm xử lý ảnh cơ bản. Sau khi nghiên cứu các hàm xử lý ảnh chúng tôi đã xây dựng được các bước để có thể nhận diện được đường dây điện. Các bước xử lý cơ bản để nhận diện được đối tượng là đường dây điện được trình bày trong các hình bên dưới.
- Image smoothing
Hình 1.12 Hình ảnh trước và sau khi được áp dụng bộ lọc làm trơn - Sobel Edge Detection
Hình 1.13 Hình ảnh trước và sau khi áp dụng bộ tìm biên
16 - Laplace Edge Detection
Hình 1.14 Hình ảnh khi được áp dụng bộ lọc laplacian - Line Detection
Hình 1.15 Đường dây sau khi đã được xử lý và phát hiện
Hình 1.12 là hình ảnh được đưa vào lọc nhiễu xung quanh bằng bộ lọc Gaussian Flier, sau khi đi qua bộ lọc, các nhiễu môi trường được giảm bớt. Tiếp theo ta sử dụng thuật toán xác định ngưỡng bằng phép tích chập 3x3m, ta thu được Hình 1.15. Vì cần xác định đường dây điện theo trục dọc và trục ngang nên ta cần lọc cạnh theo 2 trục.
Ta sử dụng thuật toán xác định ngưỡng Laplace bậc 2, ta thu được các kết quả như Hình 1.16. Cuối cùng ta áp dụng thuật toán xác định cạnh với cá hệ số phù hợp để xác định được đường dây điện như Hình 1.17.
Sau khi áp dụng các thuật toán cơ bản trong xử lý ảnh để trích xuất các đặc trưng ta có thể dễ dàng xác định được các đối tượng. Ưu điểm của phương pháp này là nhanh và tương đối đơn giản, có thể áp dụng trên hầu hết các thiết bị phần cứng.
Tuy nhiên thì nhược điểm của phương pháp này là khó có thể nhận ra một đối dượng mới mà đặc trưng của nó bị thay đổi so với dữ liệu ban đầu. Bên cạnh đó thì độ chính xác của các thuật toán xử lý để trích xuất đặc trưng cũng bị phụ thuộc rất nhiều vào
17
phông nền của đối tượng. Một trong những ví dụ điển hình nhất là xác định sai đường dây điện khi có hiện tượng đổ bóng.
1.4.2.2 Công nghệ trí tuệ nhân tạo (AI)
Lấy cảm hứng từ bộ não con người, mạng nơ-ron nhân tạo bao gồm nhiều tế bào thần kinh nhân tạo truyền thông tin. Mang nơ-ron có thể học các quan hệ rất phức tạp trong một tập dữ liệu, thay vì mã hóa hàng trăm đặc chưng của một đối tượng. Lợi thế thực sự của mạng nơ-ron so với các quy tắc xử lý hình ảnh mã hóa cứng là chỉ cần cấp dữ liệu phù hợp với mô hình mạng nơ-ron với dữ liệu đầu vào và không cần phải hiểu đầy đủ tất các đặc trưng để phân loại đối tượng một cách chính xác. Mạng nơ- ron sẽ học trên một tập hợp nhiều dữ liệu đầu vào, tổng quát hóa và phát hiện ngay cả các đối tượng chưa từng được nhìn thấy trước đó. Điều quan trọng là phải hiểu vấn đề cụ thể mà mạng nơ-ron đang giải quyết khi cố gắng tìm các tham số phù hợp với mô hình. Điều này sẽ giúp mạng nơ-ron tự học các đặc trưng của của một đối tượng trong quá quá trình học. Việc sử dụng mạng nơ-ron sẽ hiệu quả hơn việc lập trình một ứng dụng để kiểm tra tất cả các đặc trưng so với những trường hợp đã biết trước. Mặc dù không phải lúc nào lập trình viên và mạng nơ-ron cũng có thể phát hiện tất cả các trường hợp, nhưng vẫn có nhiều khả năng mạng nơ-ron sẽ có khả năng phát hiện chính xác cao hơn. Mạng CNN có nguồn gốc từ lớp mạng nơ-ron chung. Sử dụng nhiều lần các thuật toán để xác định và phát hiện đối tượng.
Hiện nay công nghệ thị giác máy tính rất phát triển. Có rất nhiều những mã nguồn mở được nghiên cứu bởi những phòng nghiên cứu uy tín trên thế giới. Điển hình trong số đó là các phiên bản của YOLO và YOLACT.
a) YOLO là mô hình mạng nơ-ron tích chập dùng cho việc phát hiện, nhận dạng và phân loại đối tượng được mô tả lần đầu tiên trong thời gian thực. Yolo được tạo ra từ việc kết hợp giữa các lớp tích chập cho phép trích xuất ra các đặc tính của ảnh và các lớp kết hợp dự đoán ra xác suất xuất hiện và tọa độ của đối tượng trong thời gian thực [33]. YOLO được sử dụng chủ yếu trong bài toán xác định đối tượng (object detection). Xác định đối tượng (Object detection) là bài toán sẽ nhận dạng được vật thể và tọa độ vật thể nằm trong một khung, thể hiện ở Hình 1.24.
b) YOLACT cũng được một nhóm nghiên cứu công bố. YOLACT tập trung vào bài toán nhận dạng và phân loại đối tượng. Vì sử dụng kiến trúc đơn luồng thay cho mạng nơ-ron mask R-CNN nên YOLACT có thể nhận diện được các đối tượng với độ chính xác đến từng điểm ảnh. Nhận biết được điểm ảnh nào là của đối tượng nào là bài toán phân đoạn hình ảnh (image segmentation). Hai bài toán xác định đối tượng (object detection) và phân đoạn hình ảnh (image segmentation) được trình bày cụ thể ở mục 2.3 và 2.4 ở phần sau. Ta có dễ dàng hình dung về ưu điểm của YOLACT so với YOLO ở Hình 1.16.
18
Hình 1.16 YOLO với bài toán xác định đối tượng (Object detection) [34]
Hình 1.17 YOLACT với bài toán xác định đối tượng (object detection) và phân đoạn hình ảnh (image segmentation)
Kết luận: Vì đặc thù của các đối tượng trong đường dây truyền tải điện năng, bài toán xác định đối tượng (object detection) không phù hợp. Nó chỉ đóng khung các vật thể và gán nhãn. Trên một đường dây truyền tải điện năng có rất nhiều đường dây điện. Đường dây điện là một đối tượng có đặc tính nhỏ và dài, thường nằm chéo trên các ảnh thu được, nếu đóng khung thì dễ gây rối và khó xác định đối tượng do khung đối tượng gần như bao hết tấm ảnh. Mô hình YOLACT có tạo ra một mặt nạ để để dự đoán đối tượng, nó không dự đoán những điểm ảnh không thực sự thuộc đối tượng.
Cho nên YOLACT thực sự phù hợp trong với hệ thống mà đồ án đề xuất.
19