Lƣu đồ giải thuật

Một phần của tài liệu Ứng dụng camera 3D trong việc phân loại sản phẩm theo hình dạng và kích thước (Trang 53 - 59)

CHƢƠNG 4 : THI CÔNG HỆ THỐNG

4.4.1 Lƣu đồ giải thuật

BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 39 Hình 4.3: Lƣu đồ giải thuật chính

BỘ MƠN ĐIỆN TỬ CƠNG NGHIỆP – Y SINH 40

Lƣu đồ giải thuật chính gồm: Thu thập ảnh RGB từ camera 3D, tiền xử lý ảnh, nhận dạng màu sắc, tách biên, xác định các thông số 3D của môi trƣờng và giai đoạn quan trọng nhất là nhận dạng và tính kích thƣớc sản phẩm, cuối cùng là xuất kết quả. Trong đó:

Thu thập ảnh RGB từ camera 3D

Khi có một đối tƣợng di chuyển qua camera, đối tƣợng sẽ đƣợc chụp lại dƣới dạng ảnh RGB với khung và độ phân giải là 720x640, 30fps.

RGB là từ viết tắt tiếng Anh của cơ chế hệ màu cộng, thƣờng đƣợc sử dụng để hiển thị màu trên các màn hình TV, monitor máy tính và những thiết bị điện tử khác (chẳng hạn nhƣ camera kỹ thuật số). Với ba màu cơ bản gồm: đỏ, xanh lá và xanh dƣơng.

OpenCV xử lý ảnh và video ở định dạng 8 bit, số ngun khơng dấu, định dạng BGR. Nói cách khác, hình ảnh đƣợc chụp có thể đƣợc coi là 3 ma trận: xanh dƣơng, xanh lá và đỏ (BGR) với các giá trị nguyên nằm trong khoảng từ 0 đến 255. Hình ảnh sau đây cho thấy hình ảnh màu đƣợc biểu diễn bằng 3 ma trận.

Hình 4.4: Ma trận không gian màu BGR Tiền xử lý ảnh

Bao gồm các bƣớc lọc nhiễu, nâng cao chất lƣợng ảnh để thuận tiện cho quá trình nhận dạng ảnh.

BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 41

Ở bƣớc này, ảnh RGB đầu vào đƣợc sau khi đƣợc lọc nhiễu ta tiến hành chuyển đổi sang ảnh HSV. Trong không gian màu HSV ta so sánh từng pixel với ngƣỡng trên và ngƣỡng dƣới của màu đỏ. Mục đích là để bộ xử lý sẽ dễ dàng nhận biết hơn đó là đối tƣợng cần nhận dạng, hạn chế nhiễu.

Không gian màu HSV gồm ba ma trận: HUE, SATURATION and VALUE. Trong Opencv thì HUE có phạm vi từ 0-179 mang thông tin màu sắc, SATURATION từ 0-255 cho thông tin về độ thuần khiết của màu và VALUE từ 0-255 cho biết độ sang của điểm ảnh.

Thƣ viện OpenCV là một thƣ viện chuyên xử lý hình ảnh vì vậy nó hổ trợ rất nhiều hệ màu nhƣ RGB, ARGB, BRGA, YUV, HSV… và nó cũng có cung cấp cho chúng ta hàm cv.cvtColor (CV_BGR2HSV) để thực hiển chuyển đổi BGR sang HSV.

Tách biên và lấp đầy biên

Là q trình xác định đƣờng biên sau đó loại bỏ những dữ liệu khơng cần thiết, sau khi có đƣợc đƣờng biên ta lấp đầy biên để có đƣợc hình dạng của sản phẩm để đi nhận dạng.

Hình 4.5: Sơ đồ khối chƣơng trình con tách biên và lấp đầy biên

Sau khi có đƣợc ảnh ta tiếp tục xử lý chất lƣợng hình ảnh đầu vào để cho quá trình nhận dạng ảnh đƣợc tốt bao gồm việc chuyển đổi ảnh xám cũng nhƣ giãm nhiễu để có chất lƣợng ảnh tốt hơn.

Giảm nhiễu:Q trình giảm nhiễu ở đây ta giải nhiễu thêm một lần nữa giúp ảnh chất lƣợng hơn. Vì phát hiện cạnh, đƣờng biên dễ bị nhiễu trong ảnh, bƣớc đầu tiên là loại bỏ nhiễu trong ảnh bằng bộ lọc Gaussian.

BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 42

Chuyển đổi ảnh xám là quá trình chuyển đổi hình ảnh dƣới dạng RGB (Red- Green-Blue) sang ảnh xám. Điều này có nghĩa là có ba ma trận xám tƣơng ứng cho màu Red, Green, Blue, vơng việc là tìm cách tổng hợp ba ma trận này về thành một ma trận duy nhất đó là ma trận xám.

Xác định đƣờng biên: Ảnh đƣợc lọc mịn đƣợc đem đi xác định biên tạo ra các đƣờng biên có giá trị là là một trong giá trị nhị phân của hình. Ở bƣớc này ta xác đinh đƣờng biên bằng các tìm điểm A ở giữa hai điểm lân cận C và B ta xác định đó có phải giái trị cực đại không tức là giá trị rất lớn so với các điểm lân cận. nếu nó đúng thì ta có thể có thể xác định tạm thời đó là một phần của đƣờng biên.

Tách biên: Là quá trình lọai bỏ các dữ liệu khơng phải là biên đƣợc xác định từ trƣớc, chỉ dữ lại những đƣờng biên.

Lấp đầy biên: Là quá trình lấp đầy các đƣờng biên kín, khơng bị gián đoạn hay đứt khúc, để tạo ra đƣợc ảnh nhị phân có giá trị 0 và 1. Mức 1 là giá trị của hình dạng lấp đầy biên, và bên ngoài biên đƣợc coi là giá trị 0.

Nhận dạng và tính kích thƣớc sản phẩm

Ở đây bao gồm giai đoạn gán nhãn cho từng hình dạng rồi phân tích nhận dạng. Gán nhãn nói một cách tóm tắt là ta đi ghi chú cho từng hình để biết đó là hình gì, chu vi và độ dài các cạnh là bao nhiêu.

Muốn phân loại đƣợc thì ta cần đi nhận dạng các đặc điểm của từng hình. Trong đó có 3 đặc điểm chính để ta nhận dạng: Ta tìm đỉnh của hình dạng số đỉnh hình vng và chữ nhật có 4 đỉnh, hình tam giác có 3 đỉnh. Trong đó 2 cạnh bên của hình vng bằng nhau và hình chữ nhật khơng bằng nhau. Nhƣ vậy, ta đã phân loại đƣợc 3 loại sản phẩm.

Tính kích thƣớc là q trình tìm ra độ dài thực tế của các cạnh của sản phẩm để tìm ra chu vi thực tế của sản phẩm.

Xuất kết quả là việc hiển thị kết quả từ bƣớc nhận dạng và tính kích thƣớc, độ

BỘ MƠN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 43 Hình 4.6: Lƣu đồ con nhận dạng sản phẩm

BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 44

Một phần của tài liệu Ứng dụng camera 3D trong việc phân loại sản phẩm theo hình dạng và kích thước (Trang 53 - 59)

Tải bản đầy đủ (PDF)

(83 trang)