7. Bố cục của luận văn
3.4.1 Tiền xử lý dữ liệu
Nhiệm vụ chính của tác vụ này là xử lý các dữ liệu ảnh đầu vào để tạo ra các loại dữ liệu mới phù hợp cho các quá trình xử lý ở các phần tiếp theo. Trong Tiền xử lý dữ liệu có 3 mục chính:
• Nạp dữ liệu
• Gán nhãn dữ liệu
38
Phần 1: Nạp dữ liệu
Chọn Tiền xử lý dữ liệu > Nạp dữ liệu. Giao diện ban đầu của phần nạp dữ liệu:
Hình 3.5. Giao diện của tác vụ Nạp dữ liệu
Các thành phần chính:
- Kích thước cửa sổ: Kích thước cạnh ô vuông của mỗi hình ảnh sau khi thực hiện tách nhỏ từ hình ảnh gốc. (Đơn vị: pixel)
- Chọn thư mục: Thư mục chứa hình ảnh cần phân tách.
- Trạng thái: Đưa ra trạng thái của chương trình khi thực hiện một nhiệm vụ nào đó.
- Hiển thị lưới: Khi nhấn vào nút này, màn hình sẽ hiện ra các ô lưới với kích thước bằng với kích thước mà người dùng nhập tại mục Kích thước cửa sổ. - Phân tách hình ảnh: Khi nhấn vào nút này, chương trình sẽ thực hiện tách
hình ảnh ban đầu thành các hình ảnh nhỏ hơn với kích thước cạnh ô vuông bằng với kích thước mà người dùng nhập tại mục Kích thước cửa sổ.
- Số thứ tự: Hiển thị số thứ tự của hình ảnh đang hiện trên màn hình so với các hình ảnh khác trong thư mục hình ảnh mà người dùng chọn tại mục Chọn thư mục.
39
- Ảnh trước: Khi nhấn vào nút này, màn hình sẽ hiển thị lên hình ảnh có số thứ tự nhỏ hơn một đơn vị so với số thứ tự của hình ảnh đang hiện trên màn hình hiện tại.
- Ảnh sau: Khi nhấn vào nút này, màn hình sẽ hiển thị lên hình ảnh có số thứ tự lớn hơn một đơn vị so với số thứ tự của hình ảnh đang hiện trên màn hình hiện tại.
- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính sẽ hiện ra.
Trên màn hình hiện ra, người dùng nhập các thông tin cần thiết: - Nhập kích thước cửa sổ mong muốn tại ô Kích thước cửa sổ
- Nhập đường dẫn chứa hình ảnh bằng cách nhấn vào nút và chọn đường dẫn mong muốn.
Sau khi hoàn thành 2 bước trên, người dùng ấn nút Hiển thị lưới, màn hình sẽ hiển thị như sau:
40
Người dùng có thể xem các hình ảnh phía trước hoặc phía sau dưới dạng lưới bằng cách nhấn nút Ảnh trước, Ảnh sau.
Sau khi đã chọn được độ dài cạnh ô vuông hợp lý, người dùng ấn vào nút Phân tách hình ảnh, lúc này một thư mục mới được sinh ra chứa toàn bộ hình ảnh sau khi đã phân tách. Tên thư mục được đặt theo cấu trúc <tên thư mục ảnh được chọn>_<kích thước cửa sổ>. Ví dụ, người dùng chọn thư mục có tên “train”, hình ảnh sau khi phân tách sẽ được lưu tại thư mục “train_80”
Phần 2: Gán nhãn dữ liệu
Chọn Tiền xử lý dữ liệu > Gán nhãn dữ liệu
Giao diện ban đầu của tác vụ gán nhãn dữ liệu:
Hình 3.7. Giao diện của tác vụ Gán nhãn dữ liệu
Các thành phần chính:
- Chọn thư mục: Người dùng lựa chọn thư mục hình ảnh được phân tách thực hiện từ bước Nạp dữ liệu.
- Nhãn: Nhãn dữ liệu hình ảnh, người dùng nhập 1 nếu hình ảnh chứa tàu - thuyền, người dùng nhập 0 nếu hình ảnh không có tàu - thuyền.
- ID: Số thứ tự của hình ảnh đang hiển thị trên màn hình so với các hình ảnh khác trong thư mục mà người dùng chọn tại mục Chọn thư mục.
41
- Lưu: Lưu nhãn mà người dùng vừa nhập tại mục Nhãn vào tệp txt.
- Cửa sổ trước: Màn hình sẽ hiển thị hình ảnh có ID nhỏ hơn một đơn vị so với hình ảnh đang hiển thị trên màn hình hiện tại.
- Cửa sổ sau: Màn hình sẽ hiển thị hình ảnh có ID lớn hơn một đơn vị so với hình ảnh đang hiển thị trên màn hình hiện tại.
- Tìm kiếm: Chức năng tìm kiếm hình ảnh theo ID, người dùng nhập giá trị ID
và nhấn nút Tìm kiếm, màn hình sẽ hiển thị hình ảnh và thông tin nhãn của hình ảnh tương ứng với ID mà người dùng vừa nhập.
- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính sẽ hiện ra.
Trên màn hình hiện ra, thực hiện chọn thư mục chứa hình ảnh đã được phân tách ở Phần 1. Nhập đường dẫn chứa hình ảnh bằng cách nhấn vào nút và chọn đường dẫn mong muốn. Màn hình sẽ hiển thị như sau:
Hình 3.8. Gán nhãn cho từng ô lưới
Hình ảnh gốc ban đầu sẽ được hiển thị dưới dạng lưới (các đường kẻ màu trắng), ô vuông màu đỏ thể hiện việc hình ảnh đã được phân tách tương ứng với vị trí ô vuông đỏ cần được người dùng gán nhãn.
42
Người dùng thực hiện nhập dữ liệu vào ô Nhãn với 1 nếu hình ảnh trong ô vuông màu đỏ chứa tàu - thuyền hoặc 0 nếu trong ô vuông màu đỏ không chứa tàu - thuyền. Sau khi nhập nhãn xong, người dùng cần ấn nút Lưu để lưu lại thông tin vừa nhập. Thực hiện việc gán nhãn cho các hình ảnh còn lại bằng cách nhấn vào nút Cửa sổ trước và
Cửa sổ sau để chuyển tới ảnh trước đó và ảnh sau đó.
Người dùng có thể tìm kiếm nhanh hình ảnh với ID của hình ảnh. Nhập số ID của hình ảnh cần tìm kiếm, sau đó nhấn nút Tìm kiếm, trên màn hình sẽ hiện ra hình ảnh và thông tin tương ứng với ID mà người dùng vừa nhập.
Phần 3: Chuyển đổi thành dư liệu thuộc tính Chọn Tiền xử lý dữ liệu > Hiển thị thuộc tính
Giao diện ban đầu của tác vụ Hiển thị thuộc tính.
Hình 3.9. Giao diện của tác vụ Hiển thị thuộc tính
Các thành phần chính:
- Chọn thư mục: Người dùng chọn thư mục chứa hình ảnh và tệp txt chứa nhãn của hình ảnh tương ứng.
- Hiển thị thuộc tính: Màn hình sẽ hiện ra một bảng dữ liệu chứa thông tin của hình ảnh. Bảng dữ liệu gồm n hàng và m cột. Trong đó: n là số lượng hình ảnh có trong thư mục mà người dùng chọn, m là số lượng thuộc tính ứng với mỗi hình ảnh.
43
- Lưu: Lưu bảng giá trị thuộc tính vừa hiển thị trên màn hình dưới dạng csv. - Trạng thái: Đưa ra trạng thái của chương trình khi thực hiện một nhiệm vụ nào
đó.
- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính (mục 3.2) sẽ hiện ra.
Trên màn hình hiện ra, thực hiện chọn thư mục chứa hình ảnh và nhãn đã được hoàn thành ở phần Gán nhãn dữ liệu. Nhập đường dẫn bằng cách nhấn vào nút
và chọn đường dẫn mong muốn. Sau khi nhập đường dẫn xong, người dùng nhấn nút
Hiển thị thuộc tính, trên màn hình sẽ hiển thị như sau:
Hình 3.10. Bảng thuộc tính của dữ liệu hình ảnh
Sau khi trích xuất thuộc tính xong, bảng hiển thị thuộc tính sẽ hiện ra. Người dùng thực hiện lưu giá trị các thuộc tính trong bảng vào tệp csv bằng cách nhấn nút Lưu. Tên của tệp csv được lưu theo định dạng list_features_<tên thư mục chứa ảnh đã
phân tách>.csv Ví dụ, người dùng chọn thư mục chứa ảnh đã phân tách có tên là
44