Tiền xử lý dữ liệu

Một phần của tài liệu Luận văn Thạc sĩ Nghiên cứu thuật toán filterwrapper tìm tập rút gọn của bảng quyết định không đầy đủ và ứng dụng phát hiện tàu thuyền từ ảnh vệ tinh (Trang 45 - 52)

7. Bố cục của luận văn

3.4.1Tiền xử lý dữ liệu

Nhiệm vụ chính của tác vụ này là xử lý các dữ liệu ảnh đầu vào để tạo ra các loại dữ liệu mới phù hợp cho các quá trình xử lý ở các phần tiếp theo. Trong Tiền xử lý dữ liệucó 3 mục chính:

• Nạp dữ liệu

• Gán nhãn dữ liệu

Phần 1: Nạp dữ liệu

Chọn Tiền xử lý dữ liệu > Nạp dữ liệu. Giao diện ban đầu của phần nạp dữ liệu:

Hình 3.5. Giao diện của tác vụ Nạp dữ liệu

Các thành phần chính:

- Kích thước cửa sổ: Kích thước cạnh ô vuông của mỗi hình ảnh sau khi thực hiện tách nhỏ từ hình ảnh gốc. (Đơn vị: pixel)

- Chọn thư mục: Thư mục chứa hình ảnh cần phân tách.

- Trạng thái: Đưa ra trạng thái của chương trình khi thực hiện một nhiệm vụ nào đó.

- Hiển thị lưới: Khi nhấn vào nút này, màn hình sẽ hiện ra các ô lưới với kích thước bằng với kích thước mà người dùng nhập tại mục Kích thước cửa sổ. - Phân tách hình ảnh: Khi nhấn vào nút này, chương trình sẽ thực hiện tách

hình ảnh ban đầu thành các hình ảnh nhỏ hơn với kích thước cạnh ô vuông bằng với kích thước mà người dùng nhập tại mục Kích thước cửa sổ.

- Số thứ tự: Hiển thị số thứ tự của hình ảnh đang hiện trên màn hình so với các hình ảnh khác trong thư mục hình ảnh mà người dùng chọn tại mục Chọn thư mục.

- Ảnh trước: Khi nhấn vào nút này, màn hình sẽ hiển thị lên hình ảnh có số thứ tự nhỏ hơn một đơn vị so với số thứ tự của hình ảnh đang hiện trên màn hình hiện tại.

- Ảnh sau: Khi nhấn vào nút này, màn hình sẽ hiển thị lên hình ảnh có số thứ tự lớn hơn một đơn vị so với số thứ tự của hình ảnh đang hiện trên màn hình hiện tại.

- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính sẽ hiện ra.

Trên màn hình hiện ra, người dùng nhập các thông tin cần thiết: - Nhập kích thước cửa sổ mong muốn tại ô Kích thước cửa sổ

- Nhập đường dẫn chứa hình ảnh bằng cách nhấn vào nút và chọn đường dẫn mong muốn.

Sau khi hoàn thành 2 bước trên, người dùng ấn nút Hiển thị lưới, màn hình sẽ hiển thị như sau:

Người dùng có thể xem các hình ảnh phía trước hoặc phía sau dưới dạng lưới bằng cách nhấn nút Ảnh trước, Ảnh sau.

Sau khi đã chọn được độ dài cạnh ô vuông hợp lý, người dùng ấn vào nút Phân

tách hình ảnh, lúc này một thư mục mới được sinh ra chứa toàn bộ hình ảnh sau khi đã phân tách. Tên thư mục được đặt theo cấu trúc <tên thư mục ảnh được chọn>_<kích thước cửa sổ>. Ví dụ, người dùng chọn thư mục có tên “train”, hình ảnh sau khi phân tách sẽ được lưu tại thư mục “train_80

Phần 2: Gán nhãn dữ liệu

Chọn Tiền xử lý dữ liệu > Gán nhãn dữ liệu

Giao diện ban đầu của tác vụ gán nhãn dữ liệu:

Hình 3.7.Giao diện của tác vụ Gán nhãn dữ liệu

Các thành phần chính:

- Chọn thư mục: Người dùng lựa chọn thư mục hình ảnh được phân tách thực hiện từ bước Nạp dữ liệu.

- Nhãn: Nhãn dữ liệu hình ảnh, người dùng nhập 1 nếu hình ảnh chứa tàu - thuyền, người dùng nhập 0nếu hình ảnh không có tàu - thuyền.

- Lưu: Lưu nhãn mà người dùng vừa nhập tại mục Nhãn vào tệp txt.

- Cửa sổ trước: Màn hình sẽ hiển thị hình ảnh có ID nhỏ hơn một đơn vị so với hình ảnh đang hiển thị trên màn hình hiện tại.

- Cửa sổ sau: Màn hình sẽ hiển thị hình ảnh có ID lớn hơn một đơn vị so với hình ảnh đang hiển thị trên màn hình hiện tại.

- Tìm kiếm: Chức năng tìm kiếm hình ảnh theo ID, người dùng nhập giá trị ID

và nhấn nút Tìm kiếm, màn hình sẽ hiển thị hình ảnh và thông tin nhãn của hình ảnh tương ứng với ID mà người dùng vừa nhập.

- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính sẽ hiện ra.

Trên màn hình hiện ra, thực hiện chọn thư mục chứa hình ảnh đã được phân tách ở Phần 1. Nhập đường dẫn chứa hình ảnh bằng cách nhấn vào nút và chọn đường dẫn mong muốn. Màn hình sẽ hiển thị như sau:

Hình 3.8.Gán nhãn cho từng ô lưới

Hình ảnh gốc ban đầu sẽ được hiển thị dưới dạng lưới (các đường kẻ màu trắng), ô vuông màu đỏ thể hiện việc hình ảnh đã được phân tách tương ứng với vị trí ô vuông đỏ cần được người dùng gán nhãn.

Người dùng thực hiện nhập dữ liệu vào ô Nhãn với 1 nếu hình ảnh trong ô vuông màu đỏ chứa tàu - thuyền hoặc 0 nếu trong ô vuông màu đỏ không chứa tàu - thuyền. Sau khi nhập nhãn xong, người dùng cần ấn nút Lưu để lưu lại thông tin vừa nhập. Thực hiện việc gán nhãn cho các hình ảnh còn lại bằng cách nhấn vào nút Cửa sổ trước

Cửa sổ sauđể chuyển tới ảnh trước đó và ảnh sau đó.

Người dùng có thể tìm kiếm nhanh hình ảnh với ID của hình ảnh. Nhập số ID của hình ảnh cần tìm kiếm, sau đó nhấn nút Tìm kiếm, trên màn hình sẽ hiện ra hình ảnh và thông tin tương ứng với ID mà người dùng vừa nhập.

Phần 3: Chuyển đổi thành dư liệu thuộc tính Chọn Tiền xử lý dữ liệu > Hiển thị thuộc tính

Giao diện ban đầu của tác vụ Hiển thị thuộc tính.

Hình 3.9.Giao diện của tác vụ Hiển thị thuộc tính

Các thành phần chính:

- Chọn thư mục: Người dùng chọn thư mục chứa hình ảnh và tệp txt chứa nhãn của hình ảnh tương ứng.

- Hiển thị thuộc tính: Màn hình sẽ hiện ra một bảng dữ liệu chứa thông tin của hình ảnh. Bảng dữ liệu gồm n hàng và m cột. Trong đó: n là số lượng hình ảnh có trong thư mục mà người dùng chọn, m là số lượng thuộc tính ứng với mỗi hình ảnh.

- Lưu: Lưu bảng giá trị thuộc tính vừa hiển thị trên màn hình dưới dạng csv. - Trạng thái: Đưa ra trạng thái của chương trình khi thực hiện một nhiệm vụ nào

đó.

- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính (mục 3.2) sẽ hiện ra.

Trên màn hình hiện ra, thực hiện chọn thư mục chứa hình ảnh và nhãn đã được hoàn thành ở phần Gán nhãn dữ liệu. Nhập đường dẫn bằng cách nhấn vào nút

và chọn đường dẫn mong muốn. Sau khi nhập đường dẫn xong, người dùng nhấn nút

Hiển thị thuộc tính, trên màn hình sẽ hiển thị như sau:

Hình 3.10.Bảng thuộc tính của dữ liệu hình ảnh

Sau khi trích xuất thuộc tính xong, bảng hiển thị thuộc tính sẽ hiện ra. Người dùng thực hiện lưu giá trị các thuộc tính trong bảng vào tệp csv bằng cách nhấn nút Lưu. Tên của tệp csv được lưu theo định dạng list_features_<tên thư mục chứa ảnh đã phân tách>.csv Ví dụ, người dùng chọn thư mục chứa ảnh đã phân tách có tên là “train_80” thì tên tệp csv chứa giá trị thuộc tính sẽ là list_features_train_80.csv

Một phần của tài liệu Luận văn Thạc sĩ Nghiên cứu thuật toán filterwrapper tìm tập rút gọn của bảng quyết định không đầy đủ và ứng dụng phát hiện tàu thuyền từ ảnh vệ tinh (Trang 45 - 52)