Phân bổ số lượng các đối tượng trong ảnh

Một phần của tài liệu Nhận diện và phân loại các thành phần giao diện của ứng dụng từ ảnh chụp màn hình (Trang 63 - 65)

2 Nền tảng và các cơng trình liên quan

4.2 Phân bổ số lượng các đối tượng trong ảnh

Đối với bài toán nhận diện và phân loại vật thể từ ảnh, việc trong ảnh có ít hay nhiều vật thể sẽ ảnh hưởng tới độ chính xác của kết quả. Càng nhiều đối tượng xuất hiện trong ảnh càng dễ nhận diện và phân loại sai, ví dụ như các bounding box của các đối tượng có thể chồng lấp lên nhau. Đối với tập dữ liệu này, có thể thấy qua biểu đồ hộp là số lượng đối tượng có trong ảnh cao hơn rất nhiều so với tập dữ liệu MS COCO được phát hành bới Microsoft 2015 cho cuộc thi nhận diện và phân loại vật thể. Từ đó có thể thấy việc nhận diện và phân loại các GUI element trong ảnh để đạt được độ chính xác cao là một cơng việc không hề dễ dàng.

được chia thành 3 tập với tỉ trọng 8:1:1 là:

• Training set: Tập chứa dữ liệu đầu vào cho việc huấn luyện mơ hình. • Cross-validation set: Tập để kiểm tra các hyperparameter được thiết

lập trong q trình train có giúp mơ hình đạt được sự tối ưu hay khơng. • Test set: Tập kiểm thử, kiểm tra độ chính xác cũng như các sai số sau

q trình training.

Vì với mỗi ứng dụng sẽ có nhiều ảnh GUI tương ứng cho nên nếu chia các ảnh GUI thuộc cùng 1 ứng dụng ra đều cho các tập sẽ khiến cho mơ hình bị overfit cho nên các GUI thuộc cùng 1 ứng dụng sẽ được chia chỉ trong 1 tập(hình 4.3).

Đối với tập cross-validation, vì dữ liệu thu thập được khơng nhiều nên để tăng tính đa dạng cho tập này, ta sẽ sử dụng kĩ thuật K fold. Kĩ thuật này chia tập train thành k phần, tại mỗi lần lặp của giải thuật huấn luyện, một phần trong k phần đã chia ở tập train sẽ được dùng để làm tập cross-validation, k - 1 phần còn lại được dùng để xây dựng mơ hình train. Mơ hình cuối được xác định dựa trên trung bình của các train error và validation error. Ở đây ta sẽ chọn k = 5 cho việc tách dữ liệu giữa tập train và cross-validation.

4.2 Hiện thực

4.2.1 Giai đoạn 1. Nhận biết GUI-components

Cơng việc đầu tiên của quy trình là nhận biết được các GUI-components tồn tại trong một bản vẽ thiết kế. Mục tiêu chính của giai đoạn này là đề xuất chính xác các khung bao quanh (bounding boxes) của các phần tử GUI-component (nghĩa là, 4 tọa độ pixel vẽ thành hình chữ nhật bao lại các đối tượng) từ một bản thiết kế cho trước. Những GUI-components này sẽ được trích xuất ra từng dữ liệu ảnh riêng biệt để sử dụng cho các giai đoạn

Một phần của tài liệu Nhận diện và phân loại các thành phần giao diện của ứng dụng từ ảnh chụp màn hình (Trang 63 - 65)

Tải bản đầy đủ (PDF)

(101 trang)