Huấn luyện mô hình

Một phần của tài liệu Luận văn Thạc sĩ Nghiên cứu thuật toán filterwrapper tìm tập rút gọn của bảng quyết định không đầy đủ và ứng dụng phát hiện tàu thuyền từ ảnh vệ tinh (Trang 52 - 58)

7. Bố cục của luận văn

3.4.2Huấn luyện mô hình

Nhiệm vụ chính của tác vụ này là sử dụng các dữ liệu vừa được tạo ra từ tác vụ

Tiền xử lý dữ liệu để thực hiện huấn luyện mô hình. Trong Huấn luyện mô hình có 3 mục chính:

+ Rút gọn thuộc tính + Huấn luyện mô hình + Kiểm thử mô hình

Hình 3.11.Các thành phần trong Huấn luyện mô hình

Phần 1: Rút gọn thuộc tính

Chọn Huấn luyện mô hình > Rút gọn thuộc tính

Hình 3.12.Giao diện của tác vụ Rút gọn thuộc tính

Các thành phần chính:

- Chọn tệp csv: Người dùng chọn tệp csv chứa thông tin thuộc tính được sinh ra tại phần Hiển thị thuộc tính.

- Hiển thị thuộc tính: Hiển thị thông tin trong tệp csv mà người dùng chọn - Rút gọn thuộc tính: Thực hiện thuật toán rút gọn số lượng thuộc tính so với

ban đầu. Mục đích: giảm khối lượng tính toán, giảm thời gian xử lý các thuật toán và đảm bảo vẫn giữ được các giá trị thuộc tính quan trọng.

- Lưu: Lưu các giá trị thuộc tính sau khi đã thực hiện rút gọn thuộc tính dưới dạng tệp csv và lưu giá trị vị trí quan trọng dưới dạng tệp csv.

- Trạng thái: Đưa ra trạng thái của chương trình khi thực hiện một nhiệm vụ nào đó.

- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính sẽ hiện ra.

Trên màn hình hiện ra, người dùng thực hiện chọn tệp csv chứa các giá trị thuộc tính đã được lưu trong bước Tiền xử lý dữ liệu. Nhập đường dẫn bằng cách nhấn vào

nút và chọn đường dẫn mong muốn. Sau khi nhập đường dẫn xong, trên màn hình hiện lên 2 nút để người dùng chọn:

+ Hiển thị thuộc tính: Hiển thị các giá trị thuộc tính trước khi áp dụng thuật toán rút gọn thuộc tính.

+ Rút gọn thuộc tính: Hiển thị các giá trị thuộc tính sau khi áp dụng thuật toán rút gọn thuộc tính, số lượng các thuộc tính sẽ giảm đi so với số lượng thuộc tính ban đầu. Trên màn hình sẽ hiển thị các giá trị thuộc tính theo dạng bảng tương tự như phầnHiển thị thuộc tính trong Bước 1.

Lưu ý: Chương trình sẽ cần một lượng thời gian (tùy thuộc vào độ lớn của lượng dữ liệu thuộc tính cần rút gọn) để thực thi thuật toán rút gọn thuộc tính, người dùng sau khi nhấn nút “Rút gọn thuộc tính” cần chờ đợi để thuật toán thực hiện, tránh việc nhấn nút nhiều lần có thể dẫn đến cách hiện tượng đơ máy, treo máy, …

Sau khi rút gọn thuộc tính xong, người dùng nhấn nút Lưu để thực hiện lưu các giá trị thuộc tính đã được rút gọn vào tệp csv. Tên của tệp csv được lưu theo định dạng

<tên tệp csv ban đầu>_new.csv; Ví dụ người dùng chọn tệp csv ban đầu có tên

list_features_train_80.csv thì tệp csv lưu các thuộc tính đã được rút gọn sẽ có tên

list_features_train_80_new.csv; Một tệp csv khác cũng được tạo ra để lưu vị trí các thuộc tính có tính quan trọng cao nhất với định dạng tên <tên tệp csv ban đầu>_new_index.csv

Phần 2: Huấn luyện mô hình

Chọn Huấn luyện mô hình > Huấn luyện mô hình

Hình 3.13.Giao diện của tác vụ Huấn luyện mô hình

Các thành phần chính:

- Chọn tệp csv: Người dùng chọn tệp csv chứa dữ liệu các giá trị thuộc tính sau khi đã thực hiện rút gọn thuộc tính tại phần Rút gọn thuộc tính.

- Huấn luyện mô hình: Chương trình sẽ sử dụng dữ liệu trong tệp csv để huấn luyện mô hình phân lớp SVM.

- Lưu mô hình: Lưu mô hình SVM đã được huấn luyện dưới dạng tệp .sav

- Trạng thái: Đưa ra trạng thái của chương trình khi thực hiện một nhiệm vụ nào đó. (adsbygoogle = window.adsbygoogle || []).push({});

- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính sẽ hiện ra.

Trên màn hình hiện ra, người dùng thực hiện chọn tệp csv chứa các giá trị thuộc tính đã được rút gọn. Nhập đường dẫn bằng cách nhấn vào nút và chọn đường dẫn mong muốn. Người dùng nhấn nút Huấn luyện mô hình để thực hiện huấn luyện mô hình phân lớp SVM với tập thuộc tính vừa chọn ở phần trên, màn hình giao diện sẽ hiển thị như sau:

Hình 3.14.Huấn luyện mô hình phân lớp

Sau khi huấn luyện mô hình xong, thông báo sẽ được hiển thị tại mục Trạng thái

Đồ thị biểu diễn sự phân bố của các giá trị thuộc tính trong không gian. Trong đó chấm màu xanh tương ứng với nhãn 1 (có tàu thuyền) và chấm màu đỏ tương ứng với nhãn 0 (không có tàu thuyền).

Người dùng thực hiện lưu mô hình SVM vừa huấn luyện được bằng cách nhấn vào nút

Lưu mô hình. Tên của tệp lưu mô hình SVM vừa huấn luyện có định dạng <tên tệp csv chứa thuộc tính đã rút gọn>.sav; Ví dụ người dùng chọn tệp chứa dữ liệu đầu vào cho mô hình SVM có tên là list_features_train_80_new.csvthì tên mô hình được lưu sẽ có tên list_features_train_80_new.sav

Phần 3: Kiểm thử mô hình

Chọn Huấn luyện mô hình > Kiểm thử mô hình

Hình 3.15.Giao diện của tác vụ Kiểm thử mô hình

Các thành phần chính:

- Chọn thư mục ảnh: Người dùng chọn thư mục chứa hình ảnh với nhiệm vụ kiểm tra độ chính xác của mô hình SVM

- Chọn tệp csv vị trí: Người dùng chọn tệp csv chứa giá trị các vị trí quan trọng của chuỗi các thuộc tính

- Chọn mô hình SVM: Người dùng chọn mô hình SVM được lưu tại phần Huấn luyện mô hình.

- Chạy mô hình: Thực hiện kiểm thử độ chính xác của mô hình SVM trên tập dữ liệu được lựa chọn tại mục Chọn thư mục hình ảnh

- Trạng thái: Đưa ra trạng thái của chương trình khi thực hiện một nhiệm vụ nào đó.

- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính sẽ hiện ra.

Trên màn hình hiện ra, người dùng thực hiện chọn các mục sau:

- Chọn thư mục ảnh: Người dùng chọn thư mục chứa hình ảnh kiểm thử (đã được phân tách) và tệp txt chứa nhãn ứng với hình ảnh đó. Để tạo ra thư mục

kiểm thử này, người dùng cần thực hiện các bước tương tự trong mục Tiền xử lý dữ liệu > Nạp dữ liệuTiền xử lý dữ liệu > Gán nhãn dữ liệu.

- Chọn tệp csv vị trí: Người dùng thực hiện chọn tệp csv chứa thông tin vị trí của các thuộc tính quan trọng được tạo ra tại mục Rút gọn thuộc tính.

- Chọn mô hình SVM: Người dùng chọn tệp lưu mô hình SVM được lưu ở phần

Huấn luyện mô hình. Người dùng nhấn nút Chạy mô hình để thực hiện kiểm thử độ chính xác của mô hình phân lớp SVM với tập thuộc tính mới được tạo ra từ mục Chọn thư mục ảnh, màn hình giao diện sẽ hiển thị như sau:

Hình 3.16.Giao diện Kiểm thử mô hình phân lớp

Sau khi quá trình kiểm thử thực hiện xong, tại phần Trạng tháisẽ hiển thị độ chính xác của mô hình SVM với tệp dữ liệu mới. Đồ thị biểu diễn sự phân bố của các giá trị thuộc tính trong không gian. Trong đó chấm màu xanh tương ứng với nhãn 1(có tàu thuyền) và chấm màu đỏ tương ứng với nhãn 0 (không có tàu thuyền).

Một phần của tài liệu Luận văn Thạc sĩ Nghiên cứu thuật toán filterwrapper tìm tập rút gọn của bảng quyết định không đầy đủ và ứng dụng phát hiện tàu thuyền từ ảnh vệ tinh (Trang 52 - 58)